独立行政法人産業技術総合研究所
現在位置広報活動 > 出版物 > 産総研 TODAY Vol.5(2005) 一覧 > VOL.5 No.10 > 適応学習型動画像認識の新方式

適応学習型動画像認識の新方式

 [PDF:842.7KB
人および動作の認識で世界最高性能を達成

防犯カメラなど、ビデオサーベイランスで最も重要な鍵となる「人およびその動作の自動認識」の新方式を開発した。これは、これまで2次元の静止画像に対して開発した高次局所自己相関(HLAC)特徴抽出を用いた適応学習型認識方式を、動画像にまで拡張したもので、非常に汎用的で高速・高精度であることが特長である。
大津 展之の写真大津 展之
Nobuyuki Otsu
フェロー
大津連絡先
パターン認識と学習、画像処理、多変量解析など、知能情報処理の理論と応用の研究に従事。旧通産省のRWC(Real World Computing: 実世界情報処理)プロジェクト(1992-2001)の策定と推進を行った。その延長として、現在、「高度ビデオサーベイランス(文部科学省都市エリア産学官連携促進事業)」、「交通事故対策技術(科学技術振興調整費・重要課題解決型研究等の推進)」、東京大学大学院情報理工学系研究科の「実世界情報システム(21世紀COEプログラム)」などのプロジェクトの推進と研究を行っている。
A new scheme has been developed for automatic recognition of persons and movements out of a monitored video image, a key step of automatic video-surveillance such as an anti-crime camera. The method is an extension of adaptive learning recognition scheme based on the Higher-order Local Auto-Correlation (HLAC) feature extraction developed for two-dimensional static images. To cover the feature extraction of "target's movements" in motion images, HLAC was extended to Cubic HLAC (CHLAC). The technology is characterized by enhanced versatility, high speed and high accuracy.

動画像認識の現状

 ロボットの視覚など、これまで多くの動画像認識の研究が行われてきた。特に近年、犯罪やテロの増加に伴い、監視カメラによるビデオサーベイランスの研究が盛んである。監視カメラの知能化のためには、映像中の人とその動作の認識や異常行動の検出を自動的に行う技術が重要であり、実用化のニーズはきわめて高い。しかし、従来の手法の多くは、まず動画から個々の動く物体を切り出し、あらかじめ用意したモデルに照らして対象の認識や、動作の認識を行う手法である。そのため、精度に限界があり、計算量も膨大となってしまい、実用に足る認識性能が得られていなかった。

新方式

 我々は、これまで特徴抽出の理論的な視点から、2次元静止画像からの汎用的な「高次局所自己相関特徴抽出法(HLAC)」と多変量解析手法を用いた適応学習型画像認識方式を開発し、顔認識などさまざまな応用を行ってきた。今回、これをさらに動画像にまで拡張した立体HLAC(CHLAC)に基づく汎用的で高速・高精度な「対象および動き」の認識方式を開発した。

 動画像から対象(例えば歩く人)を認識するには、対象の位置に依存しない特徴の抽出が望ましい。この「位置不変性」を持つことで対象の切り出しが不要となる。また、複数個の対象がある場合、全体の特徴値が個々の対象の特徴値の和になる「加法性」を持つと、以後の認識処理が容易になり精度が向上する。さらに、特徴抽出は計算量が少なくリアルタイム処理ができることが望ましい。HLACとCHLACは、これらの要請を全て満たす基本的で汎用的な特徴抽出方式である。

いくつかの応用例

 この新しい方式による認識性能は、米国のHumanIDプログラムの一環としてNIST(米国立標準技術研究所)が取りまとめているGait認識コンペティション(71名の歩き方から個人を識別)のためのテストデータセットについて、従来の手法を大幅に上回る世界最高の性能をもつことが実証された(図1)。

図1
図1 Gait認識テストデータにおける従来手法との比較

 また、この方式では、動画像から異常行動を直ちに検出することができる。CHLAC特徴は加法性を持つので、正常(通常)動作からなる動画像の特徴ベクトルは、特徴空間(251次元)のある部分空間(通常動作部分空間:SN)に分布する。従って、異常な(通常ではない)行動は、常時学習によって得られるSNからの逸脱(SNからの距離を異常値の指標)として、高速かつ高精度に検出される(図2)。複数人の場合でも、異常値の検出力は同じである。ここでも、対象の切り出しや対象のモデル・知識はいっさい不要である。計算量も人数によらず一定で少なく、実時間処理で検出ができる。

図2写真

図2グラフ
図2 異常検出の応用例
ここでは、歩くが正常、転ぶが異常

 さらに、画面を分割してHLAC特徴の加法性を利用することにより、移動体の自動追跡も可能である。追跡には、対象の形情報に加えて色情報も重要な要素となるので、HLAC特徴をカラー画像に対応できるように拡張した。従来の手法と異なり、この方式は移動対象の「特徴レベル」での同定・認識に基づく追跡法であり、対象が一度物陰に隠れたり、他の対象と交差した場合などでも、確実に安定した実時間追跡ができる(図3)。

図3(上)
図3(下)
図3 移動体の頑健で安定な自動追跡への応用例

実用化に向けての今後の展開

 このように、新方式は、非常に汎用性が高く高速・高精度な「対象および動き」の認識方式である。こうした特徴から、知的防犯カメラなど、セキュリティ分野における自動(無人)ビデオサーベイランスをはじめ、ロボット視覚など、さまざまなコンピュータビジョンの応用に大きく貢献するものと期待される。


関連情報:
  • プレス発表2005年5月24日:「人および動作の認識方式で世界最高性能を達成」.
  • N. Otsu:Towards Flexible and Intelligent Vision Systems - From Thresholding to CHLAC -, IAPR Conf. on Machine Vision Applications, Invited paper, pp.430-439,May 2005.
  • 特願2003-321962「3次元データからの特徴抽出方法および装置」大津展之、小林 匠(東大、現東芝).
  • 特願2004-261179「異常行動検出装置および異常行動検出方法」大津展之、南里卓也(東大).
  • 特願2004-349244「追跡装置および追跡方法」大津展之、河合正明(東大).
  • 本研究は、兼任先の東京大学(情報理工学系研究科知能機械情報専攻)での卒論指導として行ったものである。同大学院学生、小林匠、南里卓也、河合正明の諸君の努力と検証実験の貢献は大きく、ここに記して感謝します。

戻る産総研 TODAY Vol.5 No.10に戻る