Vol.2 No.1 2009
10/94

研究論文:大規模データからの日常生活行動予測モデリング(本村)−7−Synthesiology Vol.2 No.1(2009)の応用システムが開発できる。筆者は2001年までのリアルワールドコンピューティングプロジェクト、IPA未踏ソフトウェアプロジェクトなどを通じて、2002年にベイジアンネットを大量データから探索し、その上で確率推論を実行することのできるソフトウェアBayoNetを開発した[17][18]。このソフトウェアは民間企業へのライセンス供与、製品化もされたが、これを特定の問題解決に適用するためには高度な専門知識が必要なこと、利用手順が自明ではないことから、ソフトウェアを使いこなせるユーザがなかなか育たなかった。通常特定の目的のために開発されたソフトウェアであれば、ありえないことであるが、純粋に基礎的な数理モデル研究として生まれたベイジアンネットを実装したソフトウェアは、非常に幅広い目的のために適用することが可能であり、実用化できた時点で、あらためて、より価値の高い目的とのマッチングを検討するということが起こりえる。こうした状況の中で、ベンチャー開発戦略センターのタスクフォースが2003年に開始され、研究者自らがこの技術を使ったビジネスモデルの探索をはじめるという機会を得た。この時点でアルゴリズムの洗練や高速化、推論精度の向上など要素技術としての研究課題も多く残っていたが、アウトカムが明らかでない状態で技術の先鋭化を進めることに抵抗を感じた。そこで、その時点での性能で十分対応可能な問題解決としてのアウトカムの探索を優先することにした。ベイジアンネットを用いるメリットは、確率推論を行うことで、任意の変数に関する確率分布を求め、さまざまな条件における定量的な評価ができる点である。従来の多くの多変量解析的手法では、定量的な関係は、変数間の線形(線形独立)の共変関係に基づいてモデル化が行われることが多い。ベイジアンネットモデルでは定量的関係を条件付き確率表によって表わす。条件付き確率表では確率分布族を仮定することがなく、非線形、非正規な関係や交互作用も表現できる自由度の高いモデルになっている。また説明変数と目的変数を明示的に区別しないので、潜在変数の導入も容易である。つまり観測が得られない変数であっても、それを潜在変数として扱うことができる。これによりユーザや顧客の統計データを分析する際に、カテゴリとなる潜在変数を導入して、同じ行動をとるような集団の属性を抽出して顧客層を分類することができ、顧客セグメンテーションなどにも利用できる。こうした性質はユーザや顧客の行動(Webブラウジング履歴など)や属性、状況に応じて、嗜好性にあった情報や商品を推奨するような応用にとっては非常に重要である。顧客やユーザにとって望ましいと思われる情報や商品を携帯電話やカーナビなどで表示する場合に、協調フィルタリングでは状況依存性が反映できない。こうした動的に変化する環境での情報推薦技術は実空間で多様な状況変化が想定されるユビキタスコンピューティングにおいても重要である。 7.1 カーナビによるユーザ・状況適応型情報推奨車を運転している途中で、どこかに立ち寄りたくなることがある。例えばある目的でドライブ中に、食事のためレストランに立ち寄ることを考える。これまでのカーナビではカテゴリを指定し、該当する全レストランが距離の近い順にリストアップされる。ユーザはリストの中から適切なレストランを見つけなければならないが、詳細な情報はタッチスイッチやリモコンを操作しないと確認できないためドライバーにとって望ましいレストランを見つけることは容易ではない。そこでカーナビシステムがドライバーの嗜好性を表すベイジアンネットを利用し、これを使った確率推論によって、システムが運転中のドライバーに代わって自動的に適切な立ち寄り先を選定することが実現できれば非常に実用的な機能となる。人の嗜好は個人性が大きく、また運転中の状況にも強く依存している。運転中には刻々と変化する状況の中で、その時々での最適な選択が必要である。こうした状況依存性や個人差を表すために、変数間の複雑な依存関係と不確実性をモデル化できるベイジアンネットが有効に適用できる。そこで我々はユーザに適応してコンテンツを推薦するカーナビシステムの試作を行い評価した[6]。このシステムは、ユーザの嗜好モデルをベイジアンネットとして車載情報システム内に持ち、レストランや音楽などコンテンツプロバイダより提供されるコンテンツがその時の状況、ユーザにどれだけ適切であるかを示すスコアを状況とユーザ属性を与えた時の条件付確率として計算し、このスコアの高い順に上位のコンテンツに限って提示するものである。実際に品川周辺の182のレストランに対し、6つの状況(シナリオ)の場合に行きたい店を選択させる質問を300名の被検者に対してアンケート実施し、収集したデータからモデルを構築した。品川周辺の182のレストランに対し、6つの状況(シナリオ)の場合に行きたい店を選択させた。選択手順は、最初に好きなカテゴリを質問し、そのカテゴリに該当する店を表示し、気に入らなければ次のジャンルを選ぶ、という現在の既存のカーナビと同様の選択方法をとった。選択レストランは複数回答であり、結果的に計3778レコードを得た。状況の属性数は12、レストラン属性は17、ユーザの属性数は12である。その結果として、図3のモデルを構築した。ユーザを表す属性ノードは4個、状況を表すノードは3個、レストランを表す属性ノードは6個の計13個の確率変数からなるモデルとなり、ある状況における特定のユーザが好むレストラン属性の確率分布が確率推論により計算できる。

元のページ 

10秒後に元のページに移動します

※このページを正しく表示するにはFlashPlayer9以上が必要です