適応学習型動画像認識の新方式 |
[PDF:842.7KB] | ||
人および動作の認識で世界最高性能を達成 |
|||
|
防犯カメラなど、ビデオサーベイランスで最も重要な鍵となる「人およびその動作の自動認識」の新方式を開発した。これは、これまで2次元の静止画像に対して開発した高次局所自己相関(HLAC)特徴抽出を用いた適応学習型認識方式を、動画像にまで拡張したもので、非常に汎用的で高速・高精度であることが特長である。
|
|
|||
|
A new scheme has been developed for automatic recognition of persons and movements out of a monitored video image, a key step of automatic video-surveillance such as an anti-crime camera. The method is an extension of adaptive learning recognition scheme based on the Higher-order Local Auto-Correlation (HLAC) feature extraction developed for two-dimensional static images. To cover the feature extraction of "target's movements" in motion images, HLAC was extended to Cubic HLAC (CHLAC). The technology is characterized by enhanced versatility, high speed and high accuracy.
|
動画像認識の現状ロボットの視覚など、これまで多くの動画像認識の研究が行われてきた。特に近年、犯罪やテロの増加に伴い、監視カメラによるビデオサーベイランスの研究が盛んである。監視カメラの知能化のためには、映像中の人とその動作の認識や異常行動の検出を自動的に行う技術が重要であり、実用化のニーズはきわめて高い。しかし、従来の手法の多くは、まず動画から個々の動く物体を切り出し、あらかじめ用意したモデルに照らして対象の認識や、動作の認識を行う手法である。そのため、精度に限界があり、計算量も膨大となってしまい、実用に足る認識性能が得られていなかった。 新方式我々は、これまで特徴抽出の理論的な視点から、2次元静止画像からの汎用的な「高次局所自己相関特徴抽出法(HLAC)」と多変量解析手法を用いた適応学習型画像認識方式を開発し、顔認識などさまざまな応用を行ってきた。今回、これをさらに動画像にまで拡張した立体HLAC(CHLAC)に基づく汎用的で高速・高精度な「対象および動き」の認識方式を開発した。 動画像から対象(例えば歩く人)を認識するには、対象の位置に依存しない特徴の抽出が望ましい。この「位置不変性」を持つことで対象の切り出しが不要となる。また、複数個の対象がある場合、全体の特徴値が個々の対象の特徴値の和になる「加法性」を持つと、以後の認識処理が容易になり精度が向上する。さらに、特徴抽出は計算量が少なくリアルタイム処理ができることが望ましい。HLACとCHLACは、これらの要請を全て満たす基本的で汎用的な特徴抽出方式である。 いくつかの応用例この新しい方式による認識性能は、米国のHumanIDプログラムの一環としてNIST(米国立標準技術研究所)が取りまとめているGait認識コンペティション(71名の歩き方から個人を識別)のためのテストデータセットについて、従来の手法を大幅に上回る世界最高の性能をもつことが実証された(図1)。
また、この方式では、動画像から異常行動を直ちに検出することができる。CHLAC特徴は加法性を持つので、正常(通常)動作からなる動画像の特徴ベクトルは、特徴空間(251次元)のある部分空間(通常動作部分空間:SN)に分布する。従って、異常な(通常ではない)行動は、常時学習によって得られるSNからの逸脱(SNからの距離を異常値の指標)として、高速かつ高精度に検出される(図2)。複数人の場合でも、異常値の検出力は同じである。ここでも、対象の切り出しや対象のモデル・知識はいっさい不要である。計算量も人数によらず一定で少なく、実時間処理で検出ができる。
さらに、画面を分割してHLAC特徴の加法性を利用することにより、移動体の自動追跡も可能である。追跡には、対象の形情報に加えて色情報も重要な要素となるので、HLAC特徴をカラー画像に対応できるように拡張した。従来の手法と異なり、この方式は移動対象の「特徴レベル」での同定・認識に基づく追跡法であり、対象が一度物陰に隠れたり、他の対象と交差した場合などでも、確実に安定した実時間追跡ができる(図3)。
実用化に向けての今後の展開このように、新方式は、非常に汎用性が高く高速・高精度な「対象および動き」の認識方式である。こうした特徴から、知的防犯カメラなど、セキュリティ分野における自動(無人)ビデオサーベイランスをはじめ、ロボット視覚など、さまざまなコンピュータビジョンの応用に大きく貢献するものと期待される。 |
| 関連情報: | |
|
|