タイトル | 自動抽出した語彙関係と既存シソーラスによるシソーラスの構築・更新支援 |
---|---|
担当機関 | (独)農業・食品産業技術総合研究機構 中央農業総合研究センター |
研究期間 | 2007~2009 |
研究担当者 |
竹﨑あかね 法隆大輔 木浦卓治 斉藤三行 倉嶋明子 |
発行年度 | 2009 |
要約 | 大量のテキストの中から自動で抽出された単語間の上位下位関係の情報と、既存のシソーラスを関連づけることで、専門分野ごとの詳細なシソーラスの構築や、既存のシソーラスの更新を支援することができる。 |
キーワード | シソーラス、AGROVOC、自動抽出 |
背景・ねらい | シソーラスは、同義語、類義語や単語の上位下位関係などを体系化したもので、情報検索における基盤的な情報として利用される。農業分野の代表的なシソーラスとしては、FAOが中心となって整備するAGROVOCがある。しかしながら、シソーラスの構築には人手と多大な時間と労力を要するため、AGROVOCでは専門分野ごとの詳細なシソーラスの構築には至っていない。 一方、大量のテキストの中からシソーラスを構成する情報を自動抽出する技術がある。この自動抽出を利用すれば負担を軽減できると考えられるが、自動抽出した情報は断片的なものになるため、そのままでは体系的なシソーラスとして利用できない。 自動抽出によって得られた断片的な情報を既存のシソーラスと関連づけ、詳細なシソーラスが構築できれば、その体系の一部を専門シソーラスとして利用できる。また、既存のシソーラスにおいては、自動抽出した情報を新しい関係の候補として利用でき、シソーラスの更新が効率化できると期待される。 |
成果の内容・特徴 |
|
成果の活用面・留意点 |
|
図表1 | |
カテゴリ | しそ |