主な中国語辞書データ資源
当研究所の中国語辞書データ資源は簡体中文(SC)と繁体中文(TC)の両方に対応している。一般語彙、専門用語、固有名詞、企業名等を網羅したデータ資源は現在約300万項目を数え、機械翻訳(MT)、知的情報検索(IR)、入力システム(IME)といった幅広い用途に活用されている。中国語辞書データ資源の統計情報はここ を参照。
- 中英専門用語辞書
科学・科学技術・金融等約70分野に亘る凡そ500万語を収録。 - 中英辞典簡体版
80万語を超える一般語彙・専門用語・重要固有名詞を収録する、類を見ない辞書。 - 中日専門用語辞書
大幅に拡張し、科学・科学技術等20分野の専門用語を約82万語収録。 - 中国字・ピンイン音訳システム
数百万項目の大規模なデータベースを漢字からピンイン・注音・広東語等へ正確に音訳するシステムであり、約15種のローマ字方式に変換される。 - 中国語固有名詞異表記データベース。
数百万の固有名詞・異表記固有名詞に大幅拡張し、夥しい数の異表記を8種のローマ字方式で収録。 - 包括的中国語語彙データベース
簡体字と繁体字それぞれ約50万項目に迫る一般語彙及び人名を収録。形態素解析、情報検索、固有名抽出等の自然言語処理アプリケーションは特に推奨。 このデータベースは中国語情報処理の分野で多大な貢献をしている。 - 中国語固有名詞データベース
包括的中英データベースであり、人名・地名・企業名等を簡体字・繁体字併せて約200万項目を収録。 中国語語彙データベースと組み合わせることにより、中国語の言語技術アプリケーションにおいて他の追随を許さない効果を発揮する。 - 多言語固有名詞辞書
従来の簡体中文・繁体中文・日本語・英語・韓国語に、新たにアラビア語を加えて、収録範囲をより世界的なものへ拡張した。 - 英中辞典簡体版
10万語を超す一般語彙及び重要な固有名詞を収録した英中辞典。10万語に拡張可能。 - 英中・中英コンピュータ用語辞典
簡体字・繁体字のコンピュータ用語を収録。 絶えず最新用語を取り込んで更新中であり、現在10万項目を突破。 - 日中英コンピュータ用語データベース
簡体字と繁体字の両方を収録した多言語データベース。 - 中英新語辞典
当研究所の中国語編纂者による、最新の包括的中国語新語データベース。 - 中国語形態素データベース
当研究所の中国語派生接辞データベースの活用により、未知の複合語の認識や表現抽出が可能となる。機械翻訳(MT)・NLP及びIRアプリケーションに最適である。 - 中国語の頻度統計
巨大なコーパスに基づいた中国語の包括的語彙統計データベース。単語や文字の出現頻度等の情報を含み、NLPアプリケーションや携帯電話の入力システム等に活用できる。 - 台湾と中国大陸のピンイン差異
約260万のピンイン読みから成る大型データベース。 台湾発音と中国発音の違いは、特に注目に価すると言える。 - 英中辞典繁体版
8万語程の一般語彙及び重要な固有名詞を収録した英中辞典。 - 簡繁対応表
中国語表記の高度な簡繁間変換を支援する、表記及び語彙素対応表。数万の固有名詞を網羅している。 - 繁簡語彙対応表
繁簡対応表の中から語彙対応部分のみ抜粋したもの。この対応表は全て双方向、つまり簡繁、繁簡のどちらでも同じ様に有効である。 - 日中固有名詞辞書
日本語の固有名詞約10万6千語を簡体字で表記。一般的な人名や地名だけに留まらず、珍しいものも収録してある。