タイトル | 低コストで簡便なテキストマイニング手法によるクレームデータの分析 |
---|---|
担当機関 | (独)農業・生物系特定産業技術研究機構 東北農業研究センター |
研究期間 | 1999~2003 |
研究担当者 |
磯島昭代 川上秀和 |
発行年度 | 2003 |
要約 | 低コストで簡便に実施できるテキストマイニング手法を開発した。この手法をクレームデータの分析に適用すると、単なる要因分類では捉えることのできなかったクレーム内容の差を明示することができ、クレーム管理に有効である。 |
キーワード | テキストマイニング、形態素解析、クレーム、生協、野菜 |
背景・ねらい | 産地から生協への直接販売では、消費者から寄せられるクレームは品質管理を図る上で重要な情報源となり得る。しかし、従来はクレーム発生率や簡単な要因分類の把握に利用される程度で、文章で記された具体的なクレーム内容について分析されることはなかった。そこで、文章データからの情報抽出を可能にするテキストマイニングが低コストで簡便に実施できる手法を開発し、クレームデータに適用した場合の有効性を確認する。 |
成果の内容・特徴 | 1. 文章データとキーワードを関連づけるためのデータファイル作成手順を構築し、文章データの計量分析(テキストマイニング)を可能にした(図1)。作成されるデータファイルは、文章データに含まれるキーワードの有無を1・0のカテゴリカル変数として示すので、出現頻度の算出だけではなく、より高度な統計分析を可能にしている。また、ファイル作成にはフリーソフトウエアの形態素解析ツールと市販の表計算ソフトおよびVBAを利用しており、低コストで簡便な手法である。 2. S事業連合に寄せられたクレームデータは、クレーム処理の担当者によって4つの要因に分類されている。しかし、野菜の種類別にその割合を見ると、どの種類の野菜も「腐り、傷、あたり、カビ、折れ」の占める割合がもっとも多く、この要因分類だけでは野菜の種類によるクレーム内容の差を捉えることは難しい。 3. クレームの文章データに上述のテキストマイニング手法を適用し、野菜の種類とクレームに出現する語との関係を分析した。根菜類および土物類に対するクレームでは商品の劣化に関連した語が、果菜類では熟度や味に関する語が、葉茎菜類については、変色や虫喰いに関する語および葉の変質に関する語がそれぞれ特徴的であり、野菜の種類別にクレーム内容の差を明らかにすることができた(図2)。 4. ブロッコリーのクレームについて見ると、6月と12月にクレーム数が急増するが、従来の要因分類だけではクレーム内容の差を把握することはできない(図3)。しかし、テキストマイニングの適用により、前者は「黄色・黄色い」が、後者は「黒い・真っ黒」が多いことを明らかにすることができた(図4)。 5. 以上のように、開発したテキストマイニング手法をクレームデータに適用することによって、これまで捉えることのできなかったクレーム内容の差を簡便・簡潔に明示することができるので、クレーム管理に有効である。 |
成果の活用面・留意点 | 1. 今回は1年分のクレームデータを分析に用いたが、さらなるデータの蓄積により、年別、産地別など様々な分析に活用できる。 2. ここで紹介したテキストマイニング手法は、アンケート調査などの自由記述回答文の分析にも有効である。 |
カテゴリ | 低コスト ブロッコリー |