多言語地名検索サーバGeoWiki

タイトル 多言語地名検索サーバGeoWiki
担当機関 (独)農業・食品産業技術総合研究機構 中央農業総合研究センター
研究期間 2006~2007
研究担当者 岩田洋佳
法隆大輔
孟紅岩
木浦卓治
発行年度 2007
要約  公開されているGeoNamesとWikipediaのデータを利用して多言語で地名を検索できるGeoWikiを作成した。GeoWikiは行政区に関する階層構造を有しており、上位の行政区も検索でき、将来的には多言語対応した地名オントロジーの生成ツールとして利用できる。
キーワード 地名検索、位置検索、多言語対応地名データベース
背景・ねらい  農業情報は主に土地に関連しており地域性が大きく、農業に関するテキスト情報は現地語で書かれていることが多い。地名は行政区などのように他の地名との関係を有しており、タイのタラーン郡に関する情報はプーケット県に関する情報でもある。また、現地で作成されたデータには現地語で地名が入っていることが多く、これらのデータの位置を知り他のデータと連携させるためには、多言語で地名を取り扱う必要がある。
GeoNames(http://www.geonames.org/)は、クリエイティブコモンズによる地名データベースであり、主に英語での地名・位置情報・履歴などの情報を有している。Wikipediaはクリエイティブコモンズによるインターネット百科事典を構築している壮大なプロジェクトであり、各言語で作られている。そこには地名に関する情報もあり、各言語版へのリンクを持っている。これらの情報を利用して、多言語対応の地名データベースを作り、多言語地名オントロジーの構築環境の基盤整備を行う。
成果の内容・特徴
  1. GeoWikiは、GeoNamesのデータに定期的にアクセスして、ローカルな地名データベースを最新に保つ。
  2. GeoWikiは定期的にデータベース内の地名データを利用して各言語版のWikipediaのページにアクセスする。ページ内に緯度経度情報があるGeoNamesのデータと異なっている場合には、新たに位置情報を追加して、Wikipediaとの同期を取る。
  3. GeoWikiは地名の行政区に関する階層構造をWikipediaから自動的に抽出を試みデータベースに格納する。
  4. これらの情報を利用してGeoWikiでは多言語で地名を検索することができるとともに、行政区の階層を示すことができ(表1)、Google Mapsに位置情報を表示することができる(図1)。
  5. 行政区以外の関係も地名間に定義することができる。例えば、ある山は複数の地域に属している可能性があるが、これらも取り扱うことができる。
成果の活用面・留意点
  1. 他のサービスから利用することで、地名を各言語に展開して検索する、緯度経度から地名を検索するサービスの多言語化などに応用可能である。
  2. 新しい地名の関連は手動で入力するか、生成する手法を開発する必要がある。
  3. 現在のところ面的データとの関連は持っていない。将来的には、地名やポイントデータを利用して、面的データと関連づけることが可能である。
  4. 多言語対応の地名オントロジーの構築環境として利用可能である。
図表1 211679-1.jpg
図表2 211679-2.gif
カテゴリ くり データベース

こんにちは!お手伝いします。

メッセージを送信する

こんにちは!お手伝いします。

リサちゃんに問い合わせる