Vol.2 No.1 2009
6/94

研究論文:大規模データからの日常生活行動予測モデリング(本村)−3−Synthesiology Vol.2 No.1(2009)かりやすい。古典的なベイズ推定ではこの未知(unknown)の確率分布を主観的な事前分布として扱うために、非ベイジアンの統計学者からは批判を浴びていたが、最近では大量データが取り扱い可能になったことで、この確率分布を大量の統計データから経験的に構成することが可能になり、多くの不確実性を持つドメインにおける実用的な方法として有望視されている。 例えば、完全に観測できない事象を扱う確率的な枠組について考えてみる。実世界には将来の天気や雑音混じりの信号、ユーザの意図のように確定値を得ることが難しい不確実な情報が多く存在する。これらを体系的に取り扱うために確率的な枠組を導入する。複雑な要因やノイズの影響などによって不確定さを含む対象を確率変数としてXで表し、その変数がとりうる具体値をx1、x2、…、xnと表すことにする。 次に変数間の依存関係を考える。例えば変数Xiがxという値を取るならば、Xjはyとなる、という関係が成立しているとき、XjがXiに依存していると考える(if Xi = x then Xj =y)。現実に起きている複雑な事象を考えると、複数の変数間の依存関係は複雑になり、「if X1=x1、…、 Xi=xi、…、 then Xj=y」のように明示的に全ての関係を列挙することはあまり現実的でない。また、たとえこのようなif-thenルールを膨大に挙げたとしても実際には例外などがあり、必ずしも完全に状況を記述することは難しいだろう。そこで厳密な表現をあきらめ、主要な変数のみに注目し、ルールが成立する確信の度合いを定量的に表すために「Xi=xiであるときXj=yである確率はP(Xj=y ¦ Xi=xi)」という確率的な表現を導入する。二つの量x、yの間の一意的な依存関係は、例えば関数y=f(x)によって表せるが、これと同様に、確率変数Xi、Xjの依存関係は条件付確率分布P(Xj¦Xi)によって表すことができる。これはXiのとる値に応じて、Xjの分布が影響をうけ、その依存関係の定量的関係が条件付確率分布P(Xj¦Xi)で定められることを示している。さらに複数の確率変数の間の定性的な依存関係をグラフ構造によって表し、個々の変数の間の定量的な関係を先の条件付確率で表したモデルがベイジアンネットである。説明変数、目的変数の区別なく、任意の変数の確率分布が効率よく計算できるのがベイジアンネットの特長でもあり、モデルは様々な用途に再利用することができる。望ましい入力と出力の組からなるデータを与えることで、モデルやシステムの振る舞いを決定する枠組みが機械学習や統計的学習と呼ばれる。ベイジアンネットを実データからの統計的学習により構築することもできる。ベイジアンネットの上で行われる確率分布の計算は確率推論と呼ばれる。以降ではモデル、データからのモデル構築、確率推論のそれぞれについて簡単に述べる。3.2 ベイジアンネットモデルベイジアンネットは数理的には確率変数をノードとするグラフ構造と、各ノードに割り当てられた条件付き確率分布群によってモデルが定義される(図1)。各変数の条件付き確率分布は、離散的な確率変数の場合は条件付き確率表(conditional probability table; CPT)として表現できる。このように条件付き確率を表として与えることで、確率分布を密度関数とパラメータで与えるよりも表現の自由度は高くなる。つまり、対象がどのようなものであるかが事前にはわからない対象に対する非決定論的なモデル化手法として有用である。条件付確率が与えられる側の変数を子ノードと呼び、親ノードから子ノードの向きへ有向リンクを張る。このように変数とグラフ構造、条件付確率表により定義した非循環有向グラフをベイジアンネットモデルとして構築する。3.3 データからのモデル構築ベイジアンネットのモデルが大きなものになってくると、ネットワークの構造や全ての条件付確率表を人手で全て決定することはなかなか容易ではない。そこで大量のデータからの統計的学習によってモデルを構築する方法が必要となる。学習に用いるデータセットが条件付確率表の全ての項目に対応する事例を含んでいる場合は完全データと呼ばれ、この場合には統計データを数え上げて頻度を得て、それを正規化したものが条件付確率値の最尤推定値となる。欠損がある不完全データの場合には各種の補完を行うことで条件付確率値を推定する。モデルのネットワーク構造も図1 ベイジアンネットワーク表1 条件付き確率表(CPT)条件付確率 P(X5| X3,X4)条件付確率 P(X3| X1,X2)条件付確率 P(X4| X2)0.60.210.40.80X4X2X5X3X4X2X101P(y1|Pa(Xj)=x1)P(yn|Pa(Xj)=x1)P(y1|Pa(Xj)=xm)P(yn|Pa(Xj)=xm)………‥‥

元のページ 

10秒後に元のページに移動します

※このページを正しく表示するにはFlashPlayer9以上が必要です