Vol.4 No.2 2011
6/66

研究論文:適応学習型汎用認識システム: ARGUS(大津)−72−Synthesiology Vol.4 No.2(2011)等さまざまな連続な幾何学的変換(一般には射影変換)を受けているが、認識結果はそれらによらず不変である。不変特徴抽出理論では、パターン関数fに作用するそれらの概念対応を変えない幾何学的な変換(不変変換と呼ぶ)を作用素T(λ)で表し、その下で不変な特徴値、したがって不変汎関数x =Φ[f]を追求する。Φ[T (λ) f] −Φ[f] = 0 (1)Lie群論に基づく作用素解析から、必要十分条件として導かれる偏微分方程式の基本解として、与えられた不変変換に対する不変特徴が求まる[1][2]。これにより、パターンは、無関係な情報を捨象して認識に本質的な特徴として、理想的には、不変特徴ベクトル空間の1点xとして統一的に捉えられる。2.2.2 判別特徴抽出(統計的側面)しかし、実際のパターンはさまざまな変形やノイズを含み、概念のクラスCj毎に確率的な分布p(x│Cj)に従い分布する。次段の判別特徴抽出理論では、不変特徴ベクトルxから次元を縮小した新特徴ベクトルyへの写像y = Ψ(x)を考え、概念クラスの判別等、yに関する評価基準を最適化する最適写像を求める。線形写像の場合は、いわゆる多変量解析(例えば判別分析)となり、ある種の非線形写像の場合がニューラルネットやカーネル法である。究極の最適非線形判別写像は、実は、変分法を用いて次式で陽に求められる[1][2]。y = ΨN(x) =ΣKj=1P(Cj│x)cj (2)この結果は、パターン判別がベイズ事後確率P(Cj│x)と密接に関係し、パターン認識の背後のベイズ推定の本質的な枠組を示唆している。ここにcjは写像先Yでの各概念を代表表現するベクトルであり、判別分析の場合、元の空間Xでの概念クラス間の推移確率行列の固有ベクトルとして求まる。得られる最適判別空間の次元は本質的にクラス数から決まり、K−1次元となることが分る。実際の応用においては、これらの理論的な枠組を踏まえて、実用ニーズに照らした適切な簡略化が必要である。3 アプローチと構成法への条件柔軟な視覚システムへのアプローチと構成法を考えるにあたり、まず、視覚システムに要請される基本的な条件として、次の3点を挙げた(図4)。R1:位置不変性、R2:画面加法性、R3:適応学習性。認識/計測対象が画像枠のどこにあっても、その認識/計測の結果は変わらない。したがって、最初の条件R1は、パターンから抽出される特徴xは対象の位置によらない(平行移動不変である)ことを要請している。不変変換としては、ほかにも大小スケールや回転等も考えられるが、平行移動が最も基本的であるので、これを要請条件とした。次の条件R2は、画面全体に対する特徴が個々の対象の局所特徴の和になることを要請している。これは、R1からの帰結でもあるが、特徴表現が認識(特に計数)にとって都合の良い表現(線形)となり、後の処理が簡単で高速になるための要請条件である。最後の条件R3は、従来法のように特徴抽出がヒューリスティックな手順として与えられ、認識課題が変わると再度構成法も変わるというのではなく、例からの学習によって課題に適した新特徴yが初期特徴xから最適に自動構成(合成)され、課題の変化にも構造を変えることなく適応的に最適化される汎用的な方式であることを要請している。さらに、これらの要請条件を満たすべく構成される特徴抽出法としては、もちろん計算量が少なく実時間処理が可能であることが望ましい。4 適応学習型汎用認識システムこれらの基本要請条件を満たし、前記のパターン認識、特に特徴抽出理論の枠組を最も簡単な形で実践する「適応学習型汎用画像認識システム」注1を考案した[3][4]。本システムは、特徴抽出の理論的な枠組にしたがって2段階の特徴抽出からなっている(図5)。4.1 不変特徴抽出(HLAC/CHLAC)初段の初期特徴すなわち幾何学的側面としての不変特徴抽出としては、最も基本的な平行移動(位置)不変な特徴を考えた。認識は基本的に時空間でのパターンf(r)の位置rによらないからである。位置不変な特徴として、音声等時系列解析分野では古くから自己相関関数r()=f(t)f(t+)dtが知られている。これは波形パターンの位置によらない相対的な関係を抽出している。これを高次へ拡張したN次自己相関関数x = xx1x2x = x1+x2図4 位置不変性と画面加法性[6]位置不変性(R1) 画面加法性(R2)

元のページ 

10秒後に元のページに移動します

※このページを正しく表示するにはFlashPlayer9以上が必要です