Vol.2 No.3 2009
61/74
−251−Synthesiology Vol.2 No.3(2009)報告:学問と技術の統合- 横幹連合・統数研・産総研合同ワークショップ -きません。したがって、知識やデータが増えるにつれてモデル自体を永続的に改良しなければならないことになります。これはモデルによって知識が得られ蓄積されるとモデルが改良されること、つまり知識発展のスパイラルが構築されるということを意味します。経済の季節調整という1つの歴史的例題を考えてみますと、ノンパラメトリックモデルではn個の観測値に対して、2n個のパラメータがあって、従来の最小二乗法などでは意味のある解が得られません。赤池先生は観測値とパラメータの差の二乗の他に適当な重みをかけたペナルティ項を導入し、ベイズモデル的解釈で事前分布から事後分布を求める方法を提案しました。統計の分野では、実はいろいろな問題がベイズモデルで解けますし、時系列構造を持つ場合には状態空間モデルを使って解けるようになってきています。地下水観測井での地下水位データから地震の影響を抽出するという産総研との共同研究事例では、適度な物理的イメージのモデルとデータの情報の統合でいろいろなことがはっきりわかるようになりました。これからのデータ中心科学としては大量のデータを使った予測と知識発見、リスク管理、人間も含めた実世界のシミュレーション、サービス・サイエンスというところが重要になり、我々のグランドチャレンジになってくるだろうと思います。Inspiration-based第4の科学(データ中心科学)Cyber-enabledデータ主導型理論主導型理論科学(シミュレーション)計算科学実験科学第4の科学(データ中心科学)演繹帰納Inspiration-dependent「モデリングの研究事例」統計数理研究所副所長樋口 知之いろいろな知識の統合の上で重要なのは知識発展のスパイラル構造を自然に達成する仕組みを持つことで、それによって絶え間ないイノベーションや価値の創造が起こるだろうと思います。まず、社会的な要請として個に特化した技術−個人化技術−の開発があります。それをいかに作っていくか。また、個人化技術とは一人ひとりに合わせるだけではなく、何らかの汎用性を持っていなければなりません。持丸さんの「あなただけ」を「だれにでも」ということです。これには統計的なモデル、ベイズモデルで対応できるのではないかと考えています。例えば、たくさんのデータが手元にある時にどんなモデルがいいか、どのモデルを選ぶべきかというところから、いろいろな場面に対する柔軟性や汎用性を持ったモデル化に移っていく。この流れの1つにベイズモデルがあります。ベイズモデルではYのデータを説明するパラメータXに当該分野の“知識”という制約を加えます。知識はさまざまですが、ここでは統計モデルや確率モデルとして導入します。これはある意味で順問題ですから、Xを与えるとモデルを生成できますし、Yも出てきます。この生成モデルを使って、ベイズの反転公式から事後分布を導けることが重要で、逆問題に解くことができるのです。さらに重要なのは元に戻って事前分布にすることができることです。これは非常に有用で、ベイズモデル自体が循環機能を持っていると言えます。スパイラル構造とかサイクルという言葉もありましたが、循環をどのようにして達成するのかをしっかり捉えるのは知の統合の1つの策になるのではないかと考えます。研究事例を少しご紹介します。1つ目はレストランのランチ売上げ予測です。日々10万円から30万円くらいの売上げになっています。これをYというデータだとしていろいろな要因に分解します。例えば、週の何曜日だったか、天気はどうか、どういうイベントがあったかなど、現場の知識や当然取り込んだほうがいい思われるものをどんどん取り込んでいきます。このときベイズモデルで統計モデルを扱っていますから、モデル自体の評価も行い、自然とスパイラル構造が達成できるようにします。週効果のモデルでは祝日と日曜日は似ているのか、祝日の前日は金曜日か土曜日に似ているのか、そのようなことを単に数値で与えるのではなく、パラメータを用意しておきます。そのパラメータはイベントの開かれる場所ごとに違ったものにします。雨のパラメータも入れます。イベント効果として予想入場者数を入れると、売上げの予測能力は上がります。これらは1つ1つ個別化しているのですが、基本となるモデルには汎用性があります。週効果、雨効果、イベント効果などを状態空間モデルに落として計算できます。逆問題を解くことになるのですが、知識を注入してベイズの定理を使って事後分布が出てくる、いろんなことに分解することができます。長期的な効果という点では去年と今年は売上げがどれくらい違うか予測できますし、週のレベルでは曜日ごとの推
元のページ