The CJK Dictionary Institute


English





Dictionaries

   データ資源
   アラビア語
   中国語
   日本語
   韓国語
   辞書アプリ

Other

   文献・論文
   漢英字典刊行会
   春遍雀來

会社案内

   日中韓辭典研究所
   注文方法
   採用情報
   所在地
   連絡先
   地図










日本語音韻データベース

日中韓辭典研究所は日中韓各語(CJK)の音声学及び音韻論の研究や音声・音韻データベースの開発に力を注いでおり、日本語音韻データベース(JPD)はその開発活動の一環である。JPDの音声表記は日本語の固有名詞や語句が実際の発話でどの様に発音されるかを示すもので、仮名表記はもとより詳細な音素表記でも表し得ない正確な情報を提供する。

JPDの開発には日本語方言学の専門家を含む経験豊富な日本語編集者が当たっており、下記を含む様々な方面での活用が期待できる:

  • 音声合成システム(テキスト音声生成、TTS
  • 外国語としての日本語の習得の手引きとなる教授法の研究
  • 日本語音声技術の研究開発全般

特徴

各見出し語に、次のような詳細情報が収録されている。

  • 音素表記、音声表記、アクセントを初めとする詳細な音韻情報
  • 品詞その他の文法情報
  • 固有名詞に於ける分類コード等の属性情報

編集方針

日本語音韻データベースは、自然言語処理を初めとする音声技術への貢献を目指し、専門知識を持つ経験豊かな編集者によって構築される音韻・音声データベースである。データにはIPA(国際音声記号)を初め、音素表記・音声表記等様々な情報が収録されている。内容の詳細については、下のデータサンプルと併せて日本語音声技術への挑戦をお読み戴きたい。

フィールド解説

フィールド フィールド解説
日本語 仮名・漢字を含む日本語表記
品詞 品詞コードその他の文法情報
分類 地名・人名、更に姓・男性名・女性名等、固有名詞の性質を特定するための分類情報
アクセント 経験豊富な日本人編集者によって付与された、東京地域に於ける標準的な高低アクセント情報。名前のアクセントは地域や話者個人によって異なるため、厳密な意味での「正しいアクセント」は存在せず、一つの名前が複数の違ったアクセントで使われることもある。

数字はアクセントが置かれるモーラ(拍)を示し、次の拍から下がることを意味する。例えば は、最初の拍が高く(アクセントがあり)番めの拍からは低い頭高型を意味する。または、後続助詞も含めて下がる箇所のない平板型を意味する。(詳細については「日本語音声技術への挑戦5。高低アクセント」参照のこと)
読み 片仮名による読み
片仮名
音素表記
読みだけでは判断出来ない発音を示す。これによって鼻音化や無声化等の顕著な特徴は把握出来るが、更に語全体の正確な発音は音声表記情報によって明らかになる。
  • [‘] 直前のモーラ(拍)にアクセントが置かれる。次の拍からピッチが低くなる。
  • [&]
  • 直前のガ行の音が鼻音化する、いわゆる鼻濁音。アオカゲはではなくとなる。
  • [^] 直前の母音が無声化する。主に無声化子音に挟まれたイ段またはウ段の音で発生する。アイノスケのスは[sɯ]ではなく[sɯ̥]となる。
  • [~] 直前の母音が長音。読みが「イノウエ」の場合、音素表記が「イノウエ」なら /inoue/ [inoɯe]、音素表記が「イノウ~エ」なら/inooe/ [inoːe]となる。
音素表記 ローマ字による音素表記。読みや片仮名音素表記では分かり難い音韻情報がかなり明確に示されるが、音声表記で明らかになる異音変異等の詳細情報は含まない。
音声表記 音素表記のみでは正確で自然な日本語の発音を知るには不十分である。そのために必要なのが、この国際音声記号による音声表記であり、本データベースに於ける最も重要なフィールドである。は一般的に使われている従来の発音記号よりも精度が高く、異音変異を伴う実際の発音にかなり近い。(更に厳密な精密表記の付与も可能だが、内容が煩雑過ぎてあまり勧められない)
備考 異音変異等の情報
ランク 日本語コーパスその他の語彙情報に基く頻度情報(本サンプルには未掲載)

データ見本

以下が日本語音韻データベース(JPD)の見本である。最大の特徴は、IPA(国際音声記号)による音素表記とアクセント情報であり、これによって無声化・鼻音化を含む様々な異音変異の詳細やアクセントパターンをかなり高い精度で知ることが出来る。異音変異は、母語話者にとって日常特に意識されることはないが、自然な音声合成には大きな影響を与えるものである。

日本語 品詞 属性 アクセント 読み 片仮名
音素表記
音素表記 音声表記 備考
鏡 NC - 3 カガミ カガ&ミ kagami kaŋami voiced velar nasal
鏡 NC - 3 カガミ カガミ kagami kaɡami voiced velar stop
鏡 NC - 3 カガミ カガ&ミ kagami kaɣami voiced velar fricative
危ない AJ - 0 アブナイ アブナイ abunai abɯnai voiced bilabial plosive
危ない AJ - 0 アブナイ アブナイ abunai aβɯ̥nai voiced bilabial fricative
飾り NC - 0 カザリ カザリ kazari kazaɾi voiced alveolopalatal fricative
ザリガニ NC - 0 ザリガニ ザリガ&ニ zarigani dzaɾiɡaɲi alveolopalatal affricate, palatal nasal
新聞 NC - 0 シンブン シンブン siNbuN ɕimbɯɴ  
自分 NC - 0 ジブン ジブン zibuN dʑibɯɴ weakening of voiced alveolopalatal plosive (fricativized)
比較 VN - 0 ヒカク ヒ^カク hikaku hi̥kakɯ devoicing of [hi]
比較 VN - 0 ヒカク ヒカク hikaku hikakɯ no devoiced vowel
続く V5 - 0 ツヅク ツ^ヅク tuzuku tsɯ̥zɯkɯ devoicing of [tsɯ]
続く V5 - 0 ツヅク ツヅク tuzuku tsɯzɯkɯ no devoiced vowel
恥 NC - 2 ハジ ハジ hazi haʑi voiced alveolopalatal fricative
恥 NC - 2 ハジ ハジ hazi hadʑi voiced alveolopalatal affricate
蜂 NC - 0 ハチ ハチ hati hatɕi  
八 NC - 2 ハチ ハチ hati hatɕi  
鵜 NC - 1 ウ ウ u ʔɯʔ glottal stop
アッ I - 1 アッ アッ aQ aʔ glottal stop
運動 VN - 0 ウンドウ ウンドウ~ uNdoo ɯndoː  
病院 NC - 0 ビョウイン ビョウ~イン bjooiN bʲoːiɴ voiced palatal
美容院 NC - 2 ビヨウイン ビヨ'ウ~イン bijooiN bijoːiɴ  
宴会 NC - 0 エンカイ エンカイ eNkai eŋkai  
蒟蒻 NC - 0 コンニャク コンニャク koNnjaku koɲɲakɯ alveolar nasal, voiced palatal nasal
本 NC - 1 ホン ホ'ン hoN hoɴ uvular nasalized consonant
本 NC - 1 ホン ホ'ン hoN hõ close front nasalized vowel
本案 NC - 1 ホンアン ホ'ンアン hoNaN hoãɴ close back nasalized vowel (slight nasalization before /N/)
本意 NC - 1 ホンイ ホ'ンイ hoNi hõĩ close front nasalized vowel
本会議 NC - 3 ホンカイギ ホンカイギ hoNkaigi hoŋkaiŋi velar nasal
本棚 NC - 1 ホンダナ ホ'ンダナ hoNdana hondana alveolar nasal
本箱 NC - 1 ホンバコ ホ'ンバコ hoNbako hombako bilabial nasal
電話 NC - 0 デンワ デンワ deNwa deẽwa  
案外 D - 1 アンガイ ア'ンガ&イ aNgai aŋŋai voiced velar nasal
案外 D - 1 アンガイ ア'ンガイ aNgai aŋɡai voiced velar stop
谷 NC - 2 タニ タニ tani taɲi voiced palatal nasal
単位 NC - 1 タンイ タ'ンイ taNi taĩ  
錨 NC - 0 イカリ イカリ ikari ikaɾi  
怒り NC - 3 イカリ イカリ ikari ikaɾi  
休み NC - 3 ヤスミ ヤスミ jasumi jasɯmi  
これから NC - 4 コレカラ コレカラ korekara koɾekaɾa  
無銭飲食 NC - 4 ムセンインショク ムセンインショク^ museNiNsjoku mɯseĩɕ̃oku̥ [ku]の無声化
井口 NP S 1 イグチ イ'グ&チ iguti iŋɯtɕi  
磯貝 NP S 2 イソガイ イソ'ガ&イ isogai isoŋai  
伊藤 NP S 0 イトウ イトウ~ itoo itoː  
稲垣 NP S 2 イナガキ イナ'ガ&キ inagaki inaŋaki  
稲田 NP S 0 イナダ イナダ inada inada  
井上 NP S 0 イノウエ イノウエ inoue inoɯe "ノウ" is pronounced to [oɯ], not long vowel
栄次郎 NP M 1 エイジロウ エ'イ~ジロウ~ eiziroo eːʑiɾoː voiced alveolopalatal fricative
岸和田 NP PS 0 キシワダ キ^シワダ kisiwada ki̥ɕiwada devoicing of [ki]
銀座 NP P 0 ギンザ ギンザ giNza ɡindza voiced alveolopalatal affricate
慎一 NP M 0 シンイチ シンイチ siNiti ɕiĩtɕi vowel nasalization of /N/
純子 NP F 1 ジュンコ ジュ'ンコ zjuNko dʑɯŋko weakening of voiced alveolopalatal plosive(fricativized)
関口 NP S 2 セキグチ セキ'グ&チ sekiguti sekiŋɯtɕi  
大地 NP M 1 ダイチ ダ'イチ daiti daitɕi̥ devoicing of [tɕi]
東京 NP P 0 トウキョウ トウ~キョウ~ tookjoo toːkʲoː devoiced palatal
福生 NP P 0 フッサ フッサ huQsa ɸɯ̥s̚sa first [s] is unreleased, devoicing of [ɸɯ]
一本 NC - 1 イッポン イッポン iQpoN ip̚poɴ first [p] is unreleased
丸井 NP S 0 マルイ マルイ marui maɾɯi  

Copyright © 2020 CJKI. All Rights Reserved.