Vol.2 No.1 2009
9/94
研究論文:大規模データからの日常生活行動予測モデリング(本村)−6−Synthesiology Vol.2 No.1(2009)構造を全て列挙することは記述量の点で困難であるが、その中の重要なものを確率として表現することは近似的に有効な手段である。そこで、実空間におけるこうした確率的な構造をベイジアンネットによりモデル化し、これによるベイズ推定に利用することが考えられる[15]。ベイズ推定では、複数のクラスラベルをCiとし、信号パターンxに対する尤度P(x¦Ci)と事前分布P(Ci)の両者を組み合わせた事後確率、P(Ci¦x)= P(x¦Ci)P(Ci)/ Σj P(x¦Cj)P(Cj) (1)を最大化するクラスラベルCiを決定する。これはベイズ誤り確率を最小にする最適な識別を可能にすることが知られている。データへの当てはまり具合は尤度で表し、事前知識は事前確率分布によって表される。そしてこの両者の積である事後確率を最大にするものを推定結果とすることで、データからの学習と事前知識が自然に統合されている。クラスラベルの発生頻度が観測時間や観測場所に依存しているような場合、事前分布P(Ci)は状況Sに依存したものになっている。そこでこれを条件付確率P(Ci¦S)として考え、これを式(1)のP(Ci)と置き換えて式(2)の事後確率を最大とするクラスを識別結果とする。P(Ci¦x, S)= P(x¦Ci)P(Ci¦S)/Σj P(x¦Cj)P(Cj¦S)(2)式(2)右辺分子の第2項P(Ci¦S)は、ラベル空間における状況Sの下での行動ラベルCiの事前確率である。ここで、ラベル空間における確率的因果構造を考えることにする。場所や行動の系列の間の因果関係をベイジアンネットとして構築すると、例えば「状況Sで時刻tにCitという行動が起きたら、次の時刻t+1にCit+1という行動が起きやすい」といった因果構造の形で事前知識を導入し、人が領域Sに入った時の行動の確率をP(Cit+1¦ Cit, S)として表し、ベイジアンネットでモデル化することができる。実際にリビングルームを模した実験環境で子供が遊んでいる際の行動を観測したデータセットに対する統計的学習によってモデルを構築したところ、過去の行動の他に室内のソファや壁などの相対距離、移動速度などの依存関係が確認された。さらにある子供の行動データでベイジアンネットとナイーブベイズを学習し、これらを用いた式(2)によるベイズ推定による別の子供の行動を推定したところ、ナイーブベイズのみの最尤推定では約50 %未満の識別率であったものが、ベイジアンネットを用いたベイズ推定によって約60 %~80 %まで向上できることを示した[14]。この行動推定アルゴリズムにより、日常生活行動の観測画像などから行動ラベル付きデータを効率的に生成することが可能となった。6 Research as a Service(RaaS)日常における大規模データが観測できるようになったことで、統計的学習により複雑な問題に取り組めるようになった。しかし、統計的学習特有の問題として、モデルが高度で複雑なものになるにつれ、学習のために必要なデータ量が増えることがある。表層的に観測可能なセンサデータなどは比較的容易に取得できるが、人間行動の内部的状態は心理的なものであるため、被験者を用いたアンケート調査も必須になりコストが大きい。またデータを取得する上で、プライバシーの問題や、単に研究目的のためには協力が得られにくいという現実的な問題もある。またたとえ外部的な要因で観測容易な事象だとしても、実際に使う場面において、状況依存性の高い説明変数を網羅的に収集するためには、データを観測する環境が日常的な利用環境とできるだけ合致するように統制しておく必要がある。そこで、筆者はこうした問題に対して実サービスと調査・研究を一体化すべきであるとする「サービスとしての調査・研究(Research as a service)」という概念を提唱している[22]。これによって、行動分析学における人間の行動随伴性としての手段目的連鎖を明らかにし、状況依存性も含めて包括的にモデル化することが容易になる。そのためには、調査・モデル化の段階とそのモデルを用いた応用を切り離すことなく、情報サービスを社会の中で実行しながら、そこで得られる観測や評価アンケート、利用者のフィードバック(心理的調査)の結果を網羅的に収集する。これは古くはサイバネティクス、また信頼性工学ではデミングサイクルとして知られるPDCA(Plan、Do、 Check、Action)サイクルを実問題を通じて回し続けることで、モデルを常に修正していくというものである。不確実性に対する本質的な解決のためには対象を実データによりモデル化し、そのモデルを用いて制御しながらさらにデータを収集する、というサイクルを永続的に続けるアプローチが必要になる。これは単に実データの収集だけにとどまらず、研究という視点で実フィールドに没入することで新しい価値・評価を生み出すという新しい研究のあり方[16]に通じるものである。そのためにも実サービスとして耐えられる製品として社会の中にインフラとして組み込める応用システムの実現が重要である。7 ベイジアンネットの応用システム確率推論アルゴリズムやモデル構築のアルゴリズムをコンピュータプログラムとして実装することでベイジアンネット
元のページ