Dictionaries

   Overview
   Arabic
   Chinese
   Japanese
   Korean
   Mobile

Other

   Articles/papers
   KDPS
   Jack Halpern

Company

   About
   Data Licensing
   Jobs
   Location
   Contact
   Map










Comprehensive Database of Japanese Place Name Variants

包括的な日本地名異表記データベース


Basic Specifications

Identifying names and their variants is a difficult computational linguistic task. Named Entity Recognition (NER) is a hot topic in computational linguistics and plays an important role in many IT applications.

To enhance this technology, CJKI maintains the world's largest Japanese-English bilingual bidirectional database of proper nouns, especially of Japanese personal names and place names. This document describes some issues of Japanese place name variation and provides a sample of our extensive Japanese name variant resources.

The number of Japan place names and their variants is quite large, owing to the existence of several well-established systems for romanizing Japanese, as well as various popular ones and even hybrid ones where the same word is written in a mixture of different systems. (Please see this page for a discussion of the various Japanese romanization systems.)

For reference, see also the following papers:

Identifying, processing and normalizing place names and their numerous variants is useful in a variety of applications, including:

  1. Named entity recognition and disambiguation.
  2. Entity and information extraction.
  3. Query processing by search engines.
  4. Improving the accuracy of machine translation.
  5. Segmentation and morphological analysis of CJK languages.
  6. Database cleansing and normalization.

This database is very comprehensive, and goes beyond place names to include streets and neighborhoods, railway stations, government offices, and more.

Each entry includes various attributes such as web frequency rankings, readings in kanji and hiragana and the romanization system of the variant.

View Larger Sample
Description of Fields
Field Number Field Name Description
1
FREQ

Number of web hits for the Roma as a string. Not 100% reliable because it might be a word in some other language by coincidence, especially if very short.

2
ID

A unique ID for each Japanese name in Japanese script.

3
JAPANESE

Japanese name in UTF-8.

4
YOMI

Reading in hiragana.

5
ROMA

Romanization

6
R_TYPE

Romanization system:

      [E] English
      [H] Hepburn
      [K] Kunrei
      [N] Nippon
      [L] Latin
      [G] German
      [V] Variant
      [h] Hybrid
      [B] Hepburn without diacritics
Database of Japanese Place Name Variants - Sample
FREQ ID JAPANESE YOMI ROMA R_TYPE
012000000 JS007913 安城 あんじょう Anjou V
005820000 JS007913 安城 あんじょう Anjo E
000064800 JS007913 安城 あんじょう Anjyo V
000038400 JS007913 安城 あんじょう Anjoo V
000022600 JS007913 安城 あんじょう Anjoh V
000007350 JS007913 安城 あんじょう Anjō H
000001990 JS007913 安城 あんじょう Anjyou V
000000458 JS007913 安城 あんじょう Anjô V
000000303 JS007913 安城 あんじょう Anzyo V
000000291 JS007913 安城 あんじょう Anzyou V
000000060 JS007913 安城 あんじょう Anjyoh V
000000019 JS007913 安城 あんじょう Anjyoo V
000000004 JS007913 安城 あんじょう Anzyoo V
000000002 JS007913 安城 あんじょう Anzyô KN
000000000 JS007913 安城 あんじょう Anzyō V
000000000 JS007913 安城 あんじょう Anzyoh V
000026600 JS007913 安城市 あんじょうし Anjo city E
000004270 JS007913 安城市 あんじょうし Anjo-shi E
000002080 JS007913 安城市 あんじょうし Anjou-si h
000000517 JS007913 安城市 あんじょうし Anjou city h
000000454 JS007913 安城市 あんじょうし Anjoshi E
000000339 JS007913 安城市 あんじょうし Anjyo city h
000000285 JS007913 安城市 あんじょうし Anjoushi h
000000282 JS007913 安城市 あんじょうし Anjosi h
000000138 JS007913 安城市 あんじょうし Anjou-shi h
000000112 JS007913 安城市 あんじょうし Anjo-si h
000000106 JS007913 安城市 あんじょうし Anjyoushi h
000000077 JS007913 安城市 あんじょうし Anjyousi h
000000065 JS007913 安城市 あんじょうし Anjō-shi H
000000058 JS007913 安城市 あんじょうし Anzyousi h
000000047 JS007913 安城市 あんじょうし Anjyo-shi h
000000023 JS007913 安城市 あんじょうし Anjousi h
000000021 JS007913 安城市 あんじょうし Anjou-chi h
000000013 JS007913 安城市 あんじょうし Anjyoshi h
000000012 JS007913 安城市 あんじょうし Anjoosi h
000000012 JS007913 安城市 あんじょうし Anjyou-shi h
000000011 JS007913 安城市 あんじょうし Anjō city h
000000010 JS007913 安城市 あんじょうし Anjoh city h
000000010 JS007913 安城市 あんじょうし Anjo-chi h
000000009 JS007913 安城市 あんじょうし Anjyou city h
000000005 JS007913 安城市 あんじょうし Anjyoo-shi h
000000003 JS007913 安城市 あんじょうし Anjoh-shi h
000000003 JS007913 安城市 あんじょうし Anjohshi h
000000003 JS007913 安城市 あんじょうし Anjochi h
000000002 JS007913 安城市 あんじょうし Anjô city h
000000002 JS007913 安城市 あんじょうし Anjoo city h
000000002 JS007913 安城市 あんじょうし Anjōshi H
000000001 JS007913 安城市 あんじょうし Anzyo-si h
000000001 JS007913 安城市 あんじょうし Anzyou city h
000000001 JS007913 安城市 あんじょうし Anzyoushi h
000000001 JS007913 安城市 あんじょうし Anjô-si h
000000001 JS007913 安城市 あんじょうし Anjoo-si h
000000001 JS007913 安城市 あんじょうし Anjooshi h
000000001 JS007913 安城市 あんじょうし Anjyosi h
000000001 JS007913 安城市 あんじょうし Anjyoh city h
000000001 JS007913 安城市 あんじょうし Anjyou-si h
000000000 JS007913 安城市 あんじょうし Anzyo city h
000000000 JS007913 安城市 あんじょうし Anzyo-chi h
000000000 JS007913 安城市 あんじょうし Anzyochi h
000000000 JS007913 安城市 あんじょうし Anzyosi h
000000000 JS007913 安城市 あんじょうし Anzyo-shi h
000000000 JS007913 安城市 あんじょうし Anzyoshi h
000000000 JS007913 安城市 あんじょうし Anzyoh city h
000000000 JS007913 安城市 あんじょうし Anzyoh-chi h
000000000 JS007913 安城市 あんじょうし Anzyohchi h
000000000 JS007913 安城市 あんじょうし Anzyoh-si h
000000000 JS007913 安城市 あんじょうし Anzyohsi h
000000000 JS007913 安城市 あんじょうし Anzyoh-shi h
000000000 JS007913 安城市 あんじょうし Anzyohshi h
000000000 JS007913 安城市 あんじょうし Anzyou-chi h
000000000 JS007913 安城市 あんじょうし Anzyouchi h
000000000 JS007913 安城市 あんじょうし Anzyou-si h
000000000 JS007913 安城市 あんじょうし Anzyou-shi h
000000000 JS007913 安城市 あんじょうし Anzyoo city h
000000000 JS007913 安城市 あんじょうし Anzyoo-chi h
000000000 JS007913 安城市 あんじょうし Anzyoochi h
000000000 JS007913 安城市 あんじょうし Anzyoo-si h
000000000 JS007913 安城市 あんじょうし Anzyoosi h
000000000 JS007913 安城市 あんじょうし Anzyoo-shi h
000000000 JS007913 安城市 あんじょうし Anzyooshi h
000000000 JS007913 安城市 あんじょうし Anjô-chi h
000000000 JS007913 安城市 あんじょうし Anjôchi h
000000000 JS007913 安城市 あんじょうし Anjôsi h
000000000 JS007913 安城市 あんじょうし Anjô-shi h
000000000 JS007913 安城市 あんじょうし Anjôshi h
000000000 JS007913 安城市 あんじょうし Anjoh-chi h
000000000 JS007913 安城市 あんじょうし Anjohchi h
000000000 JS007913 安城市 あんじょうし Anjoh-si h
000000000 JS007913 安城市 あんじょうし Anjohsi h
000000000 JS007913 安城市 あんじょうし Anjouchi h
000000000 JS007913 安城市 あんじょうし Anjoo-chi h
000000000 JS007913 安城市 あんじょうし Anjoochi h
000000000 JS007913 安城市 あんじょうし Anjoo-shi h
000000000 JS007913 安城市 あんじょうし Anjyo-chi h
000000000 JS007913 安城市 あんじょうし Anjyochi h
000000000 JS007913 安城市 あんじょうし Anjyo-si h
000000000 JS007913 安城市 あんじょうし Anjyoh-chi h
000000000 JS007913 安城市 あんじょうし Anjyohchi h
000000000 JS007913 安城市 あんじょうし Anjyoh-si h
000000000 JS007913 安城市 あんじょうし Anjyohsi h
000000000 JS007913 安城市 あんじょうし Anjyoh-shi h
000000000 JS007913 安城市 あんじょうし Anjyohshi h
000000000 JS007913 安城市 あんじょうし Anjyou-chi h
000000000 JS007913 安城市 あんじょうし Anjyouchi h
000000000 JS007913 安城市 あんじょうし Anjyoo city h
000000000 JS007913 安城市 あんじょうし Anjyoo-chi h
000000000 JS007913 安城市 あんじょうし Anjyoochi h
000000000 JS007913 安城市 あんじょうし Anjyoo-si h
000000000 JS007913 安城市 あんじょうし Anjyoosi h
000000000 JS007913 安城市 あんじょうし Anjyooshi h
000000000 JS007913 安城市 あんじょうし Anzyō city h
000000000 JS007913 安城市 あんじょうし Anzyō-chi h
000000000 JS007913 安城市 あんじょうし Anzyōchi h
000000000 JS007913 安城市 あんじょうし Anzyō-si h
000000000 JS007913 安城市 あんじょうし Anzyōsi h
000000000 JS007913 安城市 あんじょうし Anzyō-shi h
000000000 JS007913 安城市 あんじょうし Anzyōshi h
000000000 JS007913 安城市 あんじょうし Anzyô city h
000000000 JS007913 安城市 あんじょうし Anzyô-chi h
000000000 JS007913 安城市 あんじょうし Anzyôchi h
000000000 JS007913 安城市 あんじょうし Anzyô-si KN
000000000 JS007913 安城市 あんじょうし Anzyôsi KN
000000000 JS007913 安城市 あんじょうし Anzyô-shi h
000000000 JS007913 安城市 あんじょうし Anzyôshi h
000000000 JS007913 安城市 あんじょうし Anjō-chi h
000000000 JS007913 安城市 あんじょうし Anjōchi h
000000000 JS007913 安城市 あんじょうし Anjō-si h
000000000 JS007913 安城市 あんじょうし Anjōsi h