Vol.2 No.1 2009
5/94
研究論文:大規模データからの日常生活行動予測モデリング(本村)−2−Synthesiology Vol.2 No.1(2009)本稿ではまず、非決定論的アプローチと確率モデリングについて述べた後、ベイジアンネットとそれを用いた日常生活における人の行動予測モデルの構築技術と応用事例について述べるとともに、これらを実現する過程において必然として構成されることとなった「Research as a Service(サービスを通じた調査・研究)」について議論する。 2 非決定論的アプローチの選択実世界の問題においては、直接観測することができない対象(確率変数)について、その状態(値)やその可能性(確率)を知りたい。人間を対象にした計算処理にも必然的にこうした不確実性が入り込む。システムが何らかのタスクを実行する場合に、システムの中ではそのタスクがモデル化され、計算操作の対象になっているとみなせる。つまりプログラムは対象とするタスクのモデルと計算操作をプログラム言語によってコード化したものと理解できる。さらにどのユーザに対しても全く同じように動作するのではなく、ユーザによって動作を変えるようなことを考えると、システムの中では、タスクのモデルとユーザのモデルの2つを実装することが必要になる。通常はタスク(プロセス)のモデルに関しては明確に記述できることが多いが、ユーザに関しては人間に関する不確実性を取り扱うために多くの場合で非決定論的な計算モデルが必要になる。ユーザの意図や要求のような人間系内部の潜在的変数は現在の所、明示的にモデル化することが難しく、こうした要素はそもそも非決定的な枠組みで記述せざるを得ない。また多様なユーザが様々な状況においてシステムを利用する際の、システムがとるべき最適な動作を全て事前に規定しておくこともまた難しい問題である。システムが提供する機能はシステム設計者があらかじめデザインすべきであるが、システムのユーザが何を要求していて、提供された情報やサービスについてどのように受け止めたのか、システムの動作は正しかったのか、ユーザの期待とは違ったものであったのか、などはシステムの実行時や実行した後でないとわからない。つまり真に目の前のユーザにとっての最適な動作設計を事前に確定することは難しい。したがって目の前にいるユーザの期待や要求通りにシステムを動作させるためには、単に非決定的な枠組みを用いるだけでも不十分で、さらにユーザの反応を実行時に予測した上で、その反応や評価を最適化するように、ユーザのモデルを動的に構築できる枠組みも重要になる。これが人間に関する不確実性である。また計算対象としての情報が大量に出現し、計算可能な量との間に大きな隔たりが生まれることでも不確実性への対処が必要になる。例えば我々はインターネットの普及により、有限ではあるが、直接取り扱うことが困難な大量のデータというものに直面している。ある一つのWebページが全てのユーザに読まれた頻度というものは計測可能ではあるが、これを全てのWebページについて数え挙げるというような決定論的な取り扱いは現実的ではない。こうした場合に、Webページの間の遷移確率というものを考え、これを定常的な確率過程として非決定的にモデル化することによって、GoogleのPageRankは計算されている[3]。つまり元のWebページやリンク・被リンク構造は決定論的に記述されており、それを扱うコンピュータもまた決定論的なものであるにも関わらず、決定論的枠組みではなく、非決定論的なモデルを用いることで、記述量やデータ数の爆発に対応できているのである。こうした実世界や大量データ、人間を含めた系の不確実性に対処することが、これからの社会問題を解決するための人工知能システムには強く求められ、そこでは非決定論的モデルとして問題を記述することが一つの解決策である。不確実性を含む問題を非決定論的な計算モデルで記述したとしても、それを現在の決定論的なコンピュータで取り扱うということは、計算対象が何であるか、という計算論レベルのプロセスを、計算方法がどのように書かれ(アルゴリズムレベル)、どのように実行されるか(インプリメントレベル)、というレベルとは独立に考えるべきであるというMarrの計算論[4]を想起させる。つまり、決定論的なシリコンチップのコンピュータの上で、決定論的なコンピュータ言語により記述されたプログラムで実行されているとしても、また先のWebの例のように元のデータやメカニズムが決定論的なものであったとしても、その計算対象のモデルとして非決定論的に考えることが有益な場面があるということである。トイ・プロブレムを対象とする限りは計算対象も決定論的に考えていても十分であるが、我々の目の前にある実問題を計算論的にモデル化しようとすると、そこに内在する不確実性に対処するために非決定論的な枠組みで記述せざるを得ない。3 ベイジアンネット3.1 確率モデリング非決定論的アプローチの一つとして、確率を用いる方法がある。確率を用いることで事象の不確実性を定量的にモデル化し、公理的確率論により厳密に取り扱うことが可能となる。観測可能な事象の確率値そのものは大量の観測データから得ることができ、観測不可能な事象については、ベイズ的な確率推論(ベイズ推定)によって推定することができる。これは条件付き確率によって、変数の不確実性と変数間の関係性をモデル化し、ある変数に関する不確実性を他の変数の情報から求めるものとして考えるとわ
元のページ