予測誤差を小さくするための並列型モデル合成法

タイトル	予測誤差を小さくするための並列型モデル合成法
担当機関	（独）農業・生物系特定産業技術研究機構中央農業総合研究センター
研究期間	2001～2003
研究担当者	橋本大輔（明治大学）大滝　厚（明治大学）竹澤邦夫南石晃明
発行年度	2003
要約	幾つかの方法で作成されたモデルが与える推定値から１つを採用する際に、推定値を必要とする予測変数の値における予測誤差の絶対値が最も小さくなる推定値を選ぶ。これによって、単独のモデルを用いる場合に比べて予測誤差が小さい推定値が得られる。
キーワード	ノンパラメトリック回帰、モデル選択、モデル合成、予測
背景・ねらい	これまでのモデル選択は、同じデータを用いて複数のモデルを作成し、何らかのモデル選択基準を利用してその中の１つを採用するものである。しかし、予測変数の値によって採用すべきモデルが異なることもあり得る。目的変数の振る舞いが予測変数の領域によって多様に変化する場合には、それぞれのモデルが得意とする領域があると見なされるからである。この見方を生かしたアルゴリズムをノンパラメトリック回帰に応用すれば、従来のものよりも予測誤差が小さい推定値を与えるモデルが実現することが期待できる。
成果の内容・特徴	1. 並列型モデル合成法のアルゴリズムの基本的な形態は図1である。 2. 並列型モデル合成法の実行例として、「青果市況データベース」NAPASS(Nationwide Agricultural Products Analysis Support System)から取り出した東京都太田市場のだいこんのデータを利用する。 3. 並列型モデル合成の機能を調べるために用いたデータは、表1に示した３種類である。それぞれのデータは、９つの予測変数（曜日、旬、入荷量など）と１つの目的変数（当日の価格）からなっている。 4. モデル作製手法として用いたのは、CART（樹形モデル）、MARS(Multivariate Adaptive Regression Splines)、TreeNet、ニューラルネットワーク（バックプロパゲーションを用いたもの）の４つである。 5. 予測誤差の２乗和を比較した結果が表2と表３である。ここで、「単独モデル」とは、それぞれのモデル作製手法を単独に用いた場合である。「合成モデル」とは、{Mq}を得るための手法として(4)で示した４つの方法を用い、{Pq}を得るための手法としてCARTを用いた場合である。並列型モデル合成法によって予測誤差が減少していることが分かる。
成果の活用面・留意点	1. それぞれのモデル（図1の{Mq}のそれぞれ）を作製する手法としていろいろなものを利用することができる。 2. それぞれのモデル（図1の{Pq}のそれぞれ）として、他のデータを使って作製された既製のモデルを利用することも考えられる。 3. 並列型モデル合成法には様々な発展的な形態が考えられるので、それらを比較して選択すると更に優れた予測が可能になる。
図表1
図表2
図表3
図表4
カテゴリ	だいこんデータベース