日本語音韻データベース
日中韓辭典研究所は日中韓各語(CJK)の音声学及び音韻論の研究や音声・音韻データベースの開発に力を注いでおり、日本語音韻データベース(JPD)はその開発活動の一環である。JPDの音声表記は日本語の固有名詞や語句が実際の発話でどの様に発音されるかを示すもので、仮名表記はもとより詳細な音素表記でも表し得ない正確な情報を提供する。
JPDの開発には日本語方言学の専門家を含む経験豊富な日本語編集者が当たっており、下記を含む様々な方面での活用が期待できる:
- 音声合成システム(テキスト音声生成、TTS
- 外国語としての日本語の習得の手引きとなる教授法の研究
- 日本語音声技術の研究開発全般
特徴
各見出し語に、次のような詳細情報が収録されている。
編集方針
日本語音韻データベースは、自然言語処理を初めとする音声技術への貢献を目指し、専門知識を持つ経験豊かな編集者によって構築される音韻・音声データベースである。データにはIPA(国際音声記号)を初め、音素表記・音声表記等様々な情報が収録されている。内容の詳細については、下のデータサンプルと併せて日本語音声技術への挑戦をお読み戴きたい。
フィールド解説
フィールド | フィールド解説 |
---|---|
日本語 | 仮名・漢字を含む日本語表記 |
品詞 | 品詞コードその他の文法情報 |
分類 | 地名・人名、更に姓・男性名・女性名等、固有名詞の性質を特定するための分類情報 |
アクセント | 経験豊富な日本人編集者によって付与された、東京地域に於ける標準的な高低アクセント情報。名前のアクセントは地域や話者個人によって異なるため、厳密な意味での「正しいアクセント」は存在せず、一つの名前が複数の違ったアクセントで使われることもある。 数字はアクセントが置かれるモーラ(拍)を示し、次の拍から下がることを意味する。例えば は、最初の拍が高く(アクセントがあり)番めの拍からは低い頭高型を意味する。または、後続助詞も含めて下がる箇所のない平板型を意味する。(詳細については「日本語音声技術への挑戦5。高低アクセント」参照のこと) |
読み | 片仮名による読み |
片仮名 音素表記 |
読みだけでは判断出来ない発音を示す。これによって鼻音化や無声化等の顕著な特徴は把握出来るが、更に語全体の正確な発音は音声表記情報によって明らかになる。
|
音素表記 | ローマ字による音素表記。読みや片仮名音素表記では分かり難い音韻情報がかなり明確に示されるが、音声表記で明らかになる異音変異等の詳細情報は含まない。 |
音声表記 | 音素表記のみでは正確で自然な日本語の発音を知るには不十分である。そのために必要なのが、この国際音声記号による音声表記であり、本データベースに於ける最も重要なフィールドである。は一般的に使われている従来の発音記号よりも精度が高く、異音変異を伴う実際の発音にかなり近い。(更に厳密な精密表記の付与も可能だが、内容が煩雑過ぎてあまり勧められない) |
備考 | 異音変異等の情報 |
ランク | 日本語コーパスその他の語彙情報に基く頻度情報(本サンプルには未掲載) |
データ見本
以下が日本語音韻データベース(JPD)の見本である。最大の特徴は、IPA(国際音声記号)による音素表記とアクセント情報であり、これによって無声化・鼻音化を含む様々な異音変異の詳細やアクセントパターンをかなり高い精度で知ることが出来る。異音変異は、母語話者にとって日常特に意識されることはないが、自然な音声合成には大きな影響を与えるものである。
日本語 | 品詞 | 属性 | アクセント | 読み | 片仮名 音素表記 |
音素表記 | 音声表記 | 備考 |
---|---|---|---|---|---|---|---|---|
鏡 | NC | - | 3 | カガミ | カガ&ミ | kagami | kaŋami | voiced velar nasal |
鏡 | NC | - | 3 | カガミ | カガミ | kagami | kaɡami | voiced velar stop |
鏡 | NC | - | 3 | カガミ | カガ&ミ | kagami | kaɣami | voiced velar fricative |
危ない | AJ | - | 0 | アブナイ | アブナイ | abunai | abɯnai | voiced bilabial plosive |
危ない | AJ | - | 0 | アブナイ | アブナイ | abunai | aβɯ̥nai | voiced bilabial fricative |
飾り | NC | - | 0 | カザリ | カザリ | kazari | kazaɾi | voiced alveolopalatal fricative |
ザリガニ | NC | - | 0 | ザリガニ | ザリガ&ニ | zarigani | dzaɾiɡaɲi | alveolopalatal affricate, palatal nasal |
新聞 | NC | - | 0 | シンブン | シンブン | siNbuN | ɕimbɯɴ | |
自分 | NC | - | 0 | ジブン | ジブン | zibuN | dʑibɯɴ | weakening of voiced alveolopalatal plosive (fricativized) |
比較 | VN | - | 0 | ヒカク | ヒ^カク | hikaku | hi̥kakɯ | devoicing of [hi] |
比較 | VN | - | 0 | ヒカク | ヒカク | hikaku | hikakɯ | no devoiced vowel |
続く | V5 | - | 0 | ツヅク | ツ^ヅク | tuzuku | tsɯ̥zɯkɯ | devoicing of [tsɯ] |
続く | V5 | - | 0 | ツヅク | ツヅク | tuzuku | tsɯzɯkɯ | no devoiced vowel |
恥 | NC | - | 2 | ハジ | ハジ | hazi | haʑi | voiced alveolopalatal fricative |
恥 | NC | - | 2 | ハジ | ハジ | hazi | hadʑi | voiced alveolopalatal affricate |
蜂 | NC | - | 0 | ハチ | ハチ | hati | hatɕi | |
八 | NC | - | 2 | ハチ | ハチ | hati | hatɕi | |
鵜 | NC | - | 1 | ウ | ウ | u | ʔɯʔ | glottal stop |
アッ | I | - | 1 | アッ | アッ | aQ | aʔ | glottal stop |
運動 | VN | - | 0 | ウンドウ | ウンドウ~ | uNdoo | ɯndoː | |
病院 | NC | - | 0 | ビョウイン | ビョウ~イン | bjooiN | bʲoːiɴ | voiced palatal |
美容院 | NC | - | 2 | ビヨウイン | ビヨ'ウ~イン | bijooiN | bijoːiɴ | |
宴会 | NC | - | 0 | エンカイ | エンカイ | eNkai | eŋkai | |
蒟蒻 | NC | - | 0 | コンニャク | コンニャク | koNnjaku | koɲɲakɯ | alveolar nasal, voiced palatal nasal |
本 | NC | - | 1 | ホン | ホ'ン | hoN | hoɴ | uvular nasalized consonant |
本 | NC | - | 1 | ホン | ホ'ン | hoN | hõ | close front nasalized vowel |
本案 | NC | - | 1 | ホンアン | ホ'ンアン | hoNaN | hoãɴ | close back nasalized vowel (slight nasalization before /N/) |
本意 | NC | - | 1 | ホンイ | ホ'ンイ | hoNi | hõĩ | close front nasalized vowel |
本会議 | NC | - | 3 | ホンカイギ | ホンカイギ | hoNkaigi | hoŋkaiŋi | velar nasal |
本棚 | NC | - | 1 | ホンダナ | ホ'ンダナ | hoNdana | hondana | alveolar nasal |
本箱 | NC | - | 1 | ホンバコ | ホ'ンバコ | hoNbako | hombako | bilabial nasal |
電話 | NC | - | 0 | デンワ | デンワ | deNwa | deẽwa | |
案外 | D | - | 1 | アンガイ | ア'ンガ&イ | aNgai | aŋŋai | voiced velar nasal |
案外 | D | - | 1 | アンガイ | ア'ンガイ | aNgai | aŋɡai | voiced velar stop |
谷 | NC | - | 2 | タニ | タニ | tani | taɲi | voiced palatal nasal |
単位 | NC | - | 1 | タンイ | タ'ンイ | taNi | taĩ | |
錨 | NC | - | 0 | イカリ | イカリ | ikari | ikaɾi | |
怒り | NC | - | 3 | イカリ | イカリ | ikari | ikaɾi | |
休み | NC | - | 3 | ヤスミ | ヤスミ | jasumi | jasɯmi | |
これから | NC | - | 4 | コレカラ | コレカラ | korekara | koɾekaɾa | |
無銭飲食 | NC | - | 4 | ムセンインショク | ムセンインショク^ | museNiNsjoku | mɯseĩɕ̃oku̥ | [ku]の無声化 |
井口 | NP | S | 1 | イグチ | イ'グ&チ | iguti | iŋɯtɕi | |
磯貝 | NP | S | 2 | イソガイ | イソ'ガ&イ | isogai | isoŋai | |
伊藤 | NP | S | 0 | イトウ | イトウ~ | itoo | itoː | |
稲垣 | NP | S | 2 | イナガキ | イナ'ガ&キ | inagaki | inaŋaki | |
稲田 | NP | S | 0 | イナダ | イナダ | inada | inada | |
井上 | NP | S | 0 | イノウエ | イノウエ | inoue | inoɯe | "ノウ" is pronounced to [oɯ], not long vowel |
栄次郎 | NP | M | 1 | エイジロウ | エ'イ~ジロウ~ | eiziroo | eːʑiɾoː | voiced alveolopalatal fricative |
岸和田 | NP | PS | 0 | キシワダ | キ^シワダ | kisiwada | ki̥ɕiwada | devoicing of [ki] |
銀座 | NP | P | 0 | ギンザ | ギンザ | giNza | ɡindza | voiced alveolopalatal affricate |
慎一 | NP | M | 0 | シンイチ | シンイチ | siNiti | ɕiĩtɕi | vowel nasalization of /N/ |
純子 | NP | F | 1 | ジュンコ | ジュ'ンコ | zjuNko | dʑɯŋko | weakening of voiced alveolopalatal plosive(fricativized) |
関口 | NP | S | 2 | セキグチ | セキ'グ&チ | sekiguti | sekiŋɯtɕi | |
大地 | NP | M | 1 | ダイチ | ダ'イチ | daiti | daitɕi̥ | devoicing of [tɕi] |
東京 | NP | P | 0 | トウキョウ | トウ~キョウ~ | tookjoo | toːkʲoː | devoiced palatal |
福生 | NP | P | 0 | フッサ | フッサ | huQsa | ɸɯ̥s̚sa | first [s] is unreleased, devoicing of [ɸɯ] |
一本 | NC | - | 1 | イッポン | イッポン | iQpoN | ip̚poɴ | first [p] is unreleased |
丸井 | NP | S | 0 | マルイ | マルイ | marui | maɾɯi |