Japanese Resources

Japanese NLP Lexicons

Japanese Lexical Database

Japanese Lexical Database

Covers approximately 290,000 entries

Optimized for NLP applications

Various grammatical and phonological attributes

Overview

CJKI’s Japanese Lexical Database (JLD) is a comprehensive monolingual lexical database that includes a rich set of grammatical attributes. JLD contains about 290,000 entries covering general vocabulary, both free forms and bound forms, and includes a significant number of affixes, particles, auxiliaries and conjugation patterns to account for all the inflectional, derivational and lexical morphology in Japanese. This enables NLP software to easily recognize inflected, conjugated and derived forms even though they are not explicitly listed in the lexicon.

Developed by CJKI’s team of experienced Japanese editors and linguists over more than a decade, JLD is a significant contribution to the field of Japanese natural language processing and information processing.

Main Features

Phonological information

Such as hiragana and romanized readings

Grammatical information

Such as part-of-speech codes

Morphological information

Such as derivational affixes and conjugation patterns

Japanese Lexical Database

Japanese	Kana	POS	Sub	Conj.	Type
買いあおる	かいあおる	V5		R
買い煽る	かいあおる	V5		R	t
買煽る	かいあおる	V5		R
改悪	かいあく	VN			t
買いあげ	かいあげ	NC
買い上げ	かいあげ	NC
買上	かいあげ	NC
買上げ	かいあげ	NC
買いあげる	かいあげる	V1
買い上げる	かいあげる	V1		S	t
買い上げる	かいあげる	V2
買上げる	かいあげる	V1
買いあさる	かいあさる	V5		R
買い漁る	かいあさる	V5		R	t
買い漁る	かいあさる	V4
買漁る	かいあさる	V5		R
貝合	かいあわせ	NC
貝合せ	かいあわせ	NC
貝合わせ	かいあわせ	NC
介意	かいい	VN			t
会意	かいい	NC
解頤	かいい	NC
怪異	かいい	AN	2
怪異	かいい	NC
魁偉	かいい	AN	0
魁偉	かいい	AN	2
海尉	かいい	NC
痒い	かいい	AJ
海域	かいいき	NC
海域礁	かいいきしょう	NC
海域制御	かいいきせいぎょ	NC
海域利用	かいいきりよう	NC
魁偉さ	かいいさ	NC
買い急ぐ	かいいそぐ	V5		G	t
飼い犬	かいいぬ	NC
飼犬	かいいぬ	NC
飼い犬に手を噛まれる	かいいぬにてをかまれる	V1
飼犬に手を噛まれる	かいいぬにてをかまれる	EJ
買いいれる	かいいれる	V1
買い入れる	かいいれる	V1		S	t
買い入れる	かいいれる	V2
買入れる	かいいれる	V1
会員	かいいん	NC
拐引	かいいん	VN			t
改印	かいいん	VN			i
海員	かいいん	NC
開院	かいいん	VN			r
誨淫	かいいん	NC
会員会社	かいいんがいしゃ	NC
海員組合	かいいんくみあい	NC
会員券	かいいんけん	NC
会員権	かいいんけん	NC
会員権商法	かいいんけんしょうほう	NC
会員証	かいいんしょう	NC
会員数	かいいんすう	NC
会員制	かいいんせい	NC
会員組織	かいいんそしき	NC
海芋	かいう	NC
買いうける	かいうける	V1
買い受ける	かいうける	V1		S	t
買い受ける	かいうける	V2
買受ける	かいうける	V1
買い埋める	かいうめる	V1
買埋める	かいうめる	V1
海運	かいうん	NC
開運	かいうん	NC
海運局	かいうんきょく	NC
海運業	かいうんぎょう	NC
海運同盟	かいうんどうめい	NC
カイエ	かいえ	NC
快泳	かいえい	NC
開映	かいえい	VN
改易	かいえき	VN			t
快演	かいえん	VN
海塩	かいえん	NC
海淵	かいえん	NC
開園	かいえん	VN			r
開宴	かいえん	VN
開演	かいえん	VN			i
海王星	かいおうせい	NC
貝覆	かいおおい	NC
貝覆い	かいおおい	NC
買い置き	かいおき	VN
買置	かいおき	VN
買置き	かいおき	VN
壊屋	かいおく	NC
買い置く	かいおく	V5		K
買置く	かいおく	V5		K
飼い桶	かいおけ	NC
飼桶	かいおけ	NC
買いオペ	かいおぺ	NC
買オペ	かいおぺ	NC
買いオペレーション	かいおぺれーしょん	NC
買オペレーション	かいおぺれーしょん	NC
介音	かいおん	NC
快音	かいおん	NC
怪音	かいおん	NC
海温	かいおん	NC
開音	かいおん	NC
開音節	かいおんせつ	NC
会歌	かいか	NC
怪火	かいか	NC
開化	かいか	VN			i
開架	かいか	VN
開花	かいか	VN			i
階下	かいか	NC
諧和	かいか	VN			i
怪々	かいかい	AN	0
怪怪	かいかい	AN	0
恢々	かいかい	AN	1
恢恢	かいかい	AN	1
恢恢	かいかい	AN	2
開会	かいかい	VN			r
開会式	かいかいしき	NC
買いかえす	かいかえす	V5		S
買い返す	かいかえす	V5		S	t
買い返す	かいかえす	V4
買返す	かいかえす	V5		S
買い換える	かいかえる	V1
買い替える	かいかえる	V1
買換える	かいかえる	V1
買替える	かいかえる	V1
買替る	かいかえる	V1
開花期	かいかき	NC
改革	かいかく	VN			t
海角	かいかく	NC
買い掛け	かいかけ	NC
買掛	かいかけ	NC
買掛け	かいかけ	NC
買い掛け金	かいかけきん	NC
買掛け金	かいかけきん	NC
買掛金	かいかけきん	NC
開花前線	かいかぜんせん	NC
買い方	かいかた	NC
買方	かいかた	NC
快活	かいかつ	AN	0
快活	かいかつ	AN	2
快豁	かいかつ	AN	0
快豁	かいかつ	AN	2
快闊	かいかつ	AN	0
快闊	かいかつ	AN	2
開豁	かいかつ	AN	0
開豁	かいかつ	AN	2
快活さ	かいかつさ	NC
開化どんぶり	かいかどんぶり	NC
開化丼	かいかどんぶり	NC
買いかぶり	かいかぶり	VN
買い被り	かいかぶり	VN
買被	かいかぶり	VN
買被り	かいかぶり	VN
買いかぶる	かいかぶる	V5		R
買い被る	かいかぶる	V5		R	t
買い被る	かいかぶる	V4
買被る	かいかぶる	V5		R
開花ホルモン	かいかほるもん	NC
買い為替	かいかわせ	NC
買為替	かいかわせ	NC
会館	かいかん	NC
会舘	かいかん	NC
快感	かいかん	NC
快漢	かいかん	NC
怪漢	かいかん	NC
海関	かいかん	NC
開巻	かいかん	VN
開館	かいかん	VN			r

Practical Applications

JLD is being used by major IT companies to enhance their Japanese morphological analysis technology, and is especially suitable for natural language processing (NLP) applications for:

Segmentation and tokenization

Input method editors

Information retrieval

Morphological analysis

Part-of-speech tagging

Reference Documents

To make JLD robust for information retrieval and morphological analysis, it is highly recommended to supplement it with our JOD (Japanese Orthographic Database), described in detail in the papers below.

The Challenges of Intelligent Japanese Searching

Linguistic issues that need to be addressed by advanced information retrieval technologies

Morphological Attributes in Japanese

Describes derivational affixes and binding valency

The Role of Lexical Resources in CJK Natural Language Processing

Academic paper

JLD Related Resources