Dictionaries

   Overview
   Arabic
   Chinese
   Japanese
   Korean
   Mobile

Other

   Articles/papers
   KDPS
   Jack Halpern

Company

   About
   Data Licensing
   Jobs
   Location
   Contact
   Map










Persian Phonetic Corpus

Our Persian Phonetic Corpus includes phonetic annotation, making it ideal for text-to-speech applications. The annotation can be on either a sentence level, on a word level, or on both. Because the annotation is in IPA, it an accurate representation of the phonetic realization of the Persian text, rather than a phonemic representation. The goal is to make it as comprehensive as possible, and to cover as many genres as possible.

Data sample

Persian Phonetic Corpus - Sentence Level Annotation
ID PERSIAN IPA
00001
اغلب ما فکر می‌کنیم که عصر روبات‌ها موضوع داستان‌های علمی-تخیلی است و بحث اخلاق روباتی موضوعی مربوط به آینده دور.
æɢlæb e mɑː fekr miːkoniːm ke æsr e robɑːthɑː mowzuːʔ e dɑːstɑnhɑː je elmiː tæχæjjoliː æst væ bæhs e æχlɑːɢ e robɑːtiː mowzuːʔiː mærbuːt be ɑːjænde je duːr
00002
اما زمانی که واقعا با این مسائل روبرو باشیم به سرعت فرا می‌رسد؛
æmmɑː zæmɑːniː ke vɑːɢeʔæn bɑː in mæsɑːʔel ruːberuː bɑːʃiːm be sorʔæt færɑː miːresæd
00003
.زمانی که تصمیم‌ها را روبات‌ها می‌گیرند
zæmɑːniː ke tæsmiːmhɑː rɑː robɑːthɑː miːgiːrænd
00004
سوال این است که روبات‌ها باید این تصمیم‌ها را بر مبنای اخلاقیات بگیرند و اینکه آیا می‌توانیم اخلاق را به روبات‌ها آموزش دهیم؟
soʔɑːl in æst ke robɑːthɑː bɑːjæd in tæsmiːmhɑː rɑː bær mæbnɑː je æχlɑːɢiɑːt begiːrænd væ inke ɑːjɑː miːtævɑːniːm æχlɑːɢ rɑː be robɑːthɑː ɑːmuːzeʃ dæhiːm
00005
ماشین طبق برنامه سر ساعت هشت صبح جلوی در خانه می‌رسد تا شما را به سر کار ببرد.
mɑːʃin tebɢ e bærnɑːme sær e sɑːʔæt e hæʃt e sobh d͡ʒelow je dær e χɑːne miːresæd tɑː ʃomɑː rɑː be sær e kɑːr bebæræd
00006
شما سوار می‌شوید و در صندلی عقب می‌نشینید و ابزار الکترونیک خود را از کیف درمی‌آورید تا نگاهی به اخبار بیندازید.
ʃomɑː sævɑːr miːʃæviːd væ dær sændæliː e æɢæb miːneʃiːniːd væ æbzɑːr e elekteroniːk e χod rɑː æz kiːf dær miːɑːværiːd tɑː negɑːhiː be æχbɑːr biːændɑːziːd
00007
تا به حال مشکلی در مسیر خانه تا محل کار پیش نیامده و معمولا ترافیک سبک است.
tɑː be hɑːl moʃkeliː dær mæsiːr e χɑːne tɑː mæhæll e kɑːr piːʃ næjɑːmæde væ mæʔmuːlæn terɑːfiːk sæbok æst
00008
.اما امروز اتفاقی غیرعادی و وحشتناک می‌افتد
æmmɑː emruːz ettefɑːɢiː ɢejreʔɑːdiː væ væhʃætnɑːk mioftæd
00009
دو بچه که با هم گلاویز شده‌اند درست جلوی ماشین شما ناگهان وارد خیابان می‌شوند.
do bæt͡ʃt͡ʃe ke bɑː hæm gælɑːviːz ʃodeʔænd dorost d͡ʒelow je mɑːʃiːn e ʃomɑː nɑːgæhɑn vɑːred e χiːɑːbɑn miːʃævænd
00010
.فرصت ترمز کردن نیست
forsæt e tormoz kærdæn niːst
00011
یا باید به دو بچه بزنید یا بسرعت فرمان را به راست بچرخانید تا از کنار آنها رد شوید.
jɑː bɑːjæd be do bæt͡ʃt͡ʃe bezæniːd jɑː be sorʔæt færmɑn rɑː be rɑːst bet͡ʃærχɑːniːd tɑː æz kenɑːr e ɑnhɑː ræd ʃæviːd
00012
اما در این صورت به دوچرخه‌ای که از روبرو می‌آید برخورد می‌کنید.
æmmɑː dær in suːræt bɑː dot͡ʃærχeʔiː ke æz ruːberuː miːɑːjæd bærχord miːkoniːd

Persian Phonetic Corpus - Word Level Annotation
ID PERSIAN IPA
00001-1
سوال
soʔɑːl
00001-2
این
in
00001-3
است
æst
00001-4
که
ke
00001-5
روبات‌ها
robɑːthɑː
00001-6
باید
bɑːjæd
00001-7
این
in
00001-8
تصمیم‌ها
tæsmiːmhɑː
00001-9
را
rɑː
00001-10
بر
bær
00001-11
مبنای
mæbnɑː je
00001-12
اخلاقیات
æχlɑːɢiɑːt
00001-13
بگیرند
begiːrænd
00001-14
و
00001-15
اینکه
inke
00001-16
آیا
ɑːjɑː
00001-17
می‌توانیم
miːtævɑːniːm
00001-18
اخلاق
æχlɑːɢ
00001-19
را
rɑː
00001-20
به
be
00001-21
روبات‌ها
robɑːthɑː
00001-22
آموزش
ɑːmuːzeʃ
00001-23
دهیم؟
dæhiːm