Vol.4 No.2 2011
7/66

研究論文:適応学習型汎用認識システム: ARGUS(大津)−73−Synthesiology Vol.4 No.2(2011)x(a1 , , ,aN)= f(r)f(r + a1) ・・・ f(r + aN) dr (3)が数学的に知られていて、その2次(一般に偶数次)の高次自己相関は位置不変の完全系となる等、パターン認識応用への幾つかの興味ある性質が論じられている[9]。画像の場合は、f(r)は参照点(画素:pixel)rでの濃淡値、aiは参照点r周りの相対的な変位である。しかし、N個の変位の組み合わせによって得られる特徴値の数は指数関数的に膨大となり、それらの計算はほとんど不可能となる。したがって実際の応用には、ある限られた次数、また変位の組み合わせを用いることになる。実際、一般に実世界のパターンは時空局在化していて、局所的な相対的関係が本質的である。また、この局所限定は、画面加法性(R2)を満たすことにもなる。したがって、(3)式の高次自己相関関数を局所変位に限定した高次(N次)局所自己相関(HLAC: Higher-order Local Auto-Collelation)特徴を、R1とR2を満たす非線形特徴として考案して採用した[3][4]。HLAC: 実際の2D画像(静止画像)f(x, y)に対しては、次数を2次まで、局所近傍を3×3とすると、位置不変性を考慮して同値でない独立な積和の取り方に関する局所マスクのパターンは25通り(図6)となる。全画面(もしくは部分領域)XYに関して、図6で表される各局所マスクでスキャンして黒点に対応した画素値の積和を求め、HLAC特徴ベクトルxが得られる。その次元は、濃淡画像の場合には35次元(例えば、No.1のマスクに対しては、f, f 2, f 3が区別される)、2値(0/1,白/黒)画像の場合には、縮退して25次元となる(例えば、No.1のマスクに対しては、f = f 2 = f 3と冪等となる)注2。CHLAC: 動画像(3D)f(x, y, t)の場合は、2次元の静止画が時間軸に沿って並んだ3次元(立体)XYTの数値データであることから、HLACを時間軸を含めて自然に拡張したCHLAC(Cubic HLAC)特徴を抽出する[11]。CHLACの局所3×3×3マスクの一例を図7に示す。独立な局所マスクのパターンは251通りとなる。HLACと同様に、立体枠XYTにわたりそれらのマスクで積和を求め、CHLAC特徴ベクトルx(t)が得られる。その次元は濃淡動画の場合は279次元、2値動画の場合は251次元となる。積分特徴としてのHLAC(CHLAC)による特徴抽出方式は、要請条件のR1(位置不変性)とR2(画面加法性)を満たす基本的で汎用的な「対象の形(と動き)」の特徴抽出方式となっている。これらによって、認識対象は常に統一的に不変特徴空間における1点(ベクトル)xとして捉えられ表現される。4.2 判別特徴抽出(MDA)次段の適応学習的な(R3を満たす)統計的判別特徴抽出としては、線形写像としての多種多様な多変量データ解析(MDA)手法を適用する(図8)。これは、HLACもしくはCHLAC特徴ベクトルxの要素の重み付き線形和として、与えられた認識課題に最適な新特徴yを適応的に求めることであるが(R3:適応学習性)(図5)、線形写像であることから要請条件のR2(画面加法性)を確保している。同様な方式としてニューラルネットがあるが、非線形ゆえにR2を保存しない。また、最適化に逐次解法を要し、計算時間も掛かる。これに対してMDAは、例からの学習によってタスクに最適な重みが解析的に陽な形で容易に求まる利点がある注3。4.3 認識システムARGUSの特長これら2段の特徴抽出からなる本方式は、対象の切り出しや位置合わせが不要であり、対象に関する知識やモデNo.5No.4No.3No.2No.1No.9No.8No.7No.6No.13No.12No.11No.10No.17No.16No.15No.14No.21No.20No.19No.18No.25No.24No.23No.22YXTttt+2t+1図6 2次までの局所3×3マスク[3][4]図7 CHLACマスクの例(hr’b”)[5][11]入力画像重み係数計数認識例からの学習(非線形)(線形で十分)出力(答え)教示(答え)HLACMDA=1m1mn111nm1n初期特徴新特徴xxxxyyyyaaaaA図5 適応学習型汎用認識システム(ARGUS)

元のページ 

10秒後に元のページに移動します

※このページを正しく表示するにはFlashPlayer9以上が必要です