計算機の劇的な性能向上や非圧縮画像を連続的に取り込める安価なデジタルTVカメラの出現により、空間中に多数のカメラを配置してその映像を統合的に処理する多視点画像処理技術への期待が高まっている。多視点画像処理は、1台のカメラでは限られる観測視野を広げるとともに、ステレオ視や視体積交差法によってシーンの3次元構造を復元できるため、ロボティクスやヒューマンインタフェースなど様々な分野への応用が予想される。
多視点画像処理を実現する複数カメラシステムに最初に要求されるのは、レンズ焦点距離など各カメラに固有な内部パラメータとカメラ間の相対的位置関係を表す外部パラメータの両方を求めるカメラキャリブレーションである。これによって3次元シーンとその投影像の幾何学的関係が明らかになり、画像情報から3次元形状を計算するための事前知識が得られる。また、エピポーラ拘束を用いて対応探索を行うスレテオビジョンにおいても、キャリブレーションの精度が、最終的な3次元情報のみならず対応の信頼性にも決定的な影響を及ぼす。
カメラキャリブレーションを行うこれまでの典型的な手法は、3次元位置が既知の参照点をカメラに提示してその投影像からカメラパラメータを推定することであった。しかし、参照点を多数配置するには特別の設備が必要であり、その作業には大きな労力を要する。これに対し、我々は、既知の平面パターンを任意の位置(3カ所以上)に置いて提示する(写真)だけで全カメラの全パラメータを同時に推定する手法を開発した。平面の位置・姿勢を知る必要がないため、校正作業は極めて簡便である。また、平面を介して成り立つカメラ間の幾何学的拘束を利用するため、各カメラを個別に校正する従来法よりも大幅に推定精度が高まる(図1)。さらに、透視投影に従わない非線形レンズ歪みも推定でき、その影響を排除するよう画像を補正することも可能である(図2)。
近年、エンターテイメントを指向した家庭向けロボットにもステレオビジョンが搭載されつつあり、経年変化や衝撃によるパラメータ変動を補償するために、誰もがいつでも簡単かつ高精度にキャリブレーションを行える手段が望まれている。本手法は、そのような目的にも適合すると考えられる。

植芝 俊夫
