Vol.4 No.2 2011
5/66
研究論文:適応学習型汎用認識システム: ARGUS(大津)−71−Synthesiology Vol.4 No.2(2011)の大小を判定して数え上げる。しかし、これでは、明らかに計算時間は対象の個数に比例して増大してしまう。一方、図1−b)は、それぞれの対象(動物)が何であるかを答える画像認識の問題である。通常、これら四つの対象を識別する(部分的な)特徴は何かと考えるであろう。それぞれのモデルに照らして、耳や尾、体型等を、部分画像として(あるいは数量化して)照合し、最終判断を行う。しかし、全体の認識が部分の認識に帰着されていて、部分の認識を誤れば全体の認識を誤る。従来方式のほとんどは、このように、まず画像から個々の対象を切り出し、あらかじめ用意したモデルに照らして認識を行う「逐次手順型」の方式である。しかし、一般にパターンはさまざまな変形を伴うので、モデルもそれに応じてさまざまで複雑なものを用意しなければならなくなる。また、逐次手順では各段での処理の誤差が累積するため全体として脆弱となり、計算量も多く、実用に足る認識性能を得ることは難しい。画像レベルでアドホックに論理的な手順として考えがちな所に問題がある。ある意味で、ノイマン型計算機のプログラミングのパラダイムに支配されたアプローチである。これに対するアンチテーゼとして、1980年後半からニューラルネットによる「並列学習型」の方式が提唱され[7]、その理論的性質の研究と共に、特にパターン認識や制御へのさまざまな応用が試みられてきた。しかし、素子の非線形や値域限定[0,1]の制約から、一般には情報表現や特徴抽出の問題が曖昧となる嫌いがあり、さらにはモデルの恣意性や学習の速度と収束の問題等もあるため、近年はカーネル法[8]等の非線形多変量解析へと流れが変わってきている。視覚システム、一般に認識システムの新たな方式を考察するためには、その基礎となるパターン認識の一般的な枠組、特に情報表現と特徴抽出について、理論的枠組から再考する必要がある。2.1 パターン認識の一般的な枠組パターン認識では、一般に時空局在的な関数fで表される信号としてのパターンから、認識に有効な何らかの特徴値(一般に関数の関数としての汎関数xi =φi[f])を複数抽出して(したがってベクトルxで表現して)認識を行う。通常、これは図2に示すように、「特徴抽出」と「認識」の2段階処理の枠組として考えられている。認識には識別と類別とがある。識別は、入力パターンが既知の概念のいずれかを判定することであり、学習段階で答えが与えられる意味で教師有り学習と呼ばれる。類別は、教師無し学習と呼ばれ、入力パターンを幾つかの類(概念)に別けて区別することである。識別に関してはすでに多くの手法が提案されていて、誤識別率最小の識別方式は、事後確率P(Cj│x)が最大となる概念Cjに決定するベイズ決定方式であることがすでに理論的に知られている。したがって、その意味では、前段の特徴抽出が認識システムの性能を左右する要件として重要であるが、これまで認識課題に応じたさまざまなアドホック、あるいはheuristicな手法が提案されてきた。2.2 特徴抽出理論筆者は、これら特徴抽出の理論的な研究を行ってきた[2]。特徴抽出の一般的な枠組としては、幾何学的な側面としての「不変特徴抽出」と統計的な側面としての「判別特徴抽出」があり、この順序でこれら2段階からなる特徴抽出が原理的に重要である。したがって、この理論から帰結されるパターン認識の一般的な枠組は、図3のようになる。2.2.1 不変特徴抽出(幾何学的側面)パターンとしての観測像fは、対象と認識主体との相対的な位置関係や運動により、平行移動、大小伸縮、回転図1 視覚認識課題の例[6]パターン空間P(関数空間)特徴空間F(ベクトル空間)概念集合C(離散集合)特徴抽出 Ψ認識 Φ(類別/識別)Cjfxb) 画像認識a) 画像計測図2 パターン認識の一般的な枠組(通常)パターン空間P(関数空間)不変特徴空間F1(ベクトル空間)判別特徴空間F2(ベクトル空間)概念集合C(離散集合)判別特徴抽出不変特徴抽出認識(類別/識別)xy Ψ(x)x=Φ[ ]=y( )(λ)( | )( | )xyiCiCiCppfTfr図3 パターン認識の一般的な枠組(詳細)
元のページ