Vol.4 No.2 2011
11/66
研究論文:適応学習型汎用認識システム: ARGUS(大津)−77−Synthesiology Vol.4 No.2(2011)参考文献大津展之, 栗田多喜夫, 関田巌: パターン認識−理論と応用, 行動計量学シリーズ12, 朝倉書店, 東京 (1996).大津展之: パターン認識における特徴抽出に関する数理的研究, 電総研究報告, 818, 210 (1981).大津展之, 島田俊之, 森俊二: N次自己相関マスクによる図形の特徴抽出, 電子通信学会技術報告, PRL-78 (31) (1978).N. Otsu and T. Kurita: A new scheme for practical flexible and intelligent vision systems, Proc. IAPR Workshop on Computer Vision (MVA1988), 431-435 (1988).N. Otsu: Towards flexible and intelligent vision systems - from thresholding to CHLAC, Proc. IAPR Conf. on Machine Vision Applications, Invited talk, 430-439 (2005).N. Otsu: CHLAC approach to flexible and intelligent vision systems, Proc. ECSIS and IEEE Symposium on Bio-inspired Learning and Intelligent Systems for Security (BLISS2008), Invited talk, 23-33 (2008).D. Rumelhart, G. Hinton and R. Williams: Learning representations by back-propagating errors, Nature, 323 (9), 533-536 (1986).J. Shawe-Taylor and N. Cristianini: Kernel methods for pattern analysis, Cambridge Univ. Press, Cambridge (2004).J. Mclaughlin and J. Raviv: N th-Order Autocorrelations in Pattern Recognition, Information and Control, 12, 121-142 (1968).M. Misky and S. Papert: Perceptrons, The MIT Press (1969).T. Kobayashi and N. Otsu: Action and simultaneous multiple-person identification using cubic higher order local auto-correlation, Proc. 17th Int. Conf. on Pattern Recognition (ICPR), 741-744 (2004).T. Kurita and N. Otsu: Face recognition method using [1][2][3][4][5][6] [7][8][9][10][11][12]ほぼ想定どおり、種々の応用をとおしてこれまでの方式を上回る性能が得られている。これは、理論に裏付けされた方式、特に高次局所自己相関特徴の優位性とその本質性によるところが大と思われる。通常の自己相関が2点関係に留まるのに対し、3点関係へと高次化することにより、例えば静止画では輪郭の局所直線方向から曲率(凹凸)、動画像では速度から加速度へと、得られる特徴が詳細となっている。そして、これらの基本的で本質的な初期特徴が、個別の恣意的な逐次手順や論理判断(例えば閾値処理や条件分岐等)を用いず、多変量解析手法を用いて並列・総合的にタスクに有効な新特徴へと統合されていて、情報のロスが少なく頑健な方式となっている。HLAC/CHLACは、時空間に局在する「パターン」の局所的形状パターンの統計量(相関や頻度)という基本的で汎用的な特徴である。その意味で、近年のHOGやSIFT特徴に代表される「モデル照合ベースから局所特徴の統計量へ」といった潮流の先鞭をなすものである。また、画像に限らず、音声や各種センサー情報等の多チャンネル時系列データ、さらには一般の3-wayデータへも広く応用可能である。今後の展開としては量的データから質的(カテゴリカル)データへの拡張が挙げられ、すでに手法[29]の開発を行っている。今後、ニーズの高い知的防犯カメラ等、セキュリティ分野における自動(無人)映像監視を始め、各種外観検査、画像のannotationと検索、ロボットの視覚、スポーツやリハビリ分野での動作解析や評価等、広くコンピュータービジョンへの応用が期待される。現在、医療応用として大学病院や癌センターとの共同研究で、顕微鏡画像からの癌の自動検査システムへの応用を進めている。さらに、産総研認定ベンチャー(融合技術研究所)を中心に、半導体基板検査や各種外観検査への実用化や、地域コンソーシアムプロジェクトでの米の品質検査や乳牛の発情・分娩予知等、農業畜産分野への応用を展開している。本方式の実用化においては、その他の細やかな事柄、例えば前処理やパラメータ(相関幅)の調整が必要であり、それらのノウハウの蓄積や自動化が今後の課題である。謝辞この研究は、併任先の東京大学知能機械情報専攻での卒論・修論指導のもと、大いに進展した。関係学生諸君に記して感謝する。特に小林匠氏(現:情報技術研究部門)には、その後の共同研究においても大いに貢献していただいた。ここに感謝したい。また、初期のHLACの実験で栗田多喜夫氏(現:広島大学)、近年の応用展開でポスドクの方々や坂上グループと樋口グループに貢献していただいた。関係諸氏に感謝する。注1)当初、ギリシャ神話の百の目をもつ巨人にあやかって、ARGUS(Adaptive Recognition for General Use System)と呼ぶ予定であった。近年、本方式の略称にHLAC/CHLACが用いられる向きもあるが、それは初段の特徴抽出法を指すので適切ではない。したがって、今後はシステム/方式全体をARGUSと呼ぶことにする。注2)2値画像のHLACは、パーセプトロン[10]におけるN+1位ベクトル、それによる図形のスペクトルと密接に関係している。そこでは、黒点(1)と白点(0)の組み合わせが考えられていて、我々の黒点のみを考える立場は一見不十分に見えるが、実は十分である。例えば■□は、f0 = f(r) = 1 かつ f1 = f(r+a1) = 1 として、論理的に f0 · f1 = f0 · (1 − f1) = f0 − f0 · f1 となり、マスク(No.1とNo.3)による特徴値の線形和の範囲で表される。注3)この方式は、ニューラルネットの逆伝搬学習法[7]より以前に提案されている[2][3]。注4)HLAC特徴は丁度それら位相幾何的要素の個数を数えあげていて、次段の重回帰でそれらの係数が学習的に決定されている。注5)Minimum Distance Decision:未知入力の特徴ベクトルからの各クラスの重心への距離を測り、最短のクラスへ識別する方式。注6)ヘリオスウォッチャー(KK 日立ビルシステム)http://www.hbs.co.jp/lineup/elevator/hw_outline.html注7)各該当語の有/無を1/0で表したベクトル。
元のページ