説明

画像処理装置、画像処理方法およびプログラム

【課題】動きのある対象の形状を高密度かつ高フレームレートに計測可能な画像処理装置、画像処理方法およびプログラムを提供する。
【解決手段】画像処理装置10と、カメラ28と、プロジェクタ24と、プロジェクタ26とで、3次元空間中に存在する物体30の2次元画像を撮影し、撮影された2次元画像から物体の3次元形状を復元している。プロジェクタ24は物体30に対して横方向のパターンを照射し、プロジェクタ26は物体30に対して縦方向のパターンを照射している。そして、これらのパターンが物体30で反射したパターン光をカメラ28で撮影することで2次元画像を取得し、この2次元画像から画像処理装置10により3次元画像を復元している。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像処理装置、画像処理方法およびプログラムに関し、特に、入力された2次元画像に映し出された物体の3次元形状を復元する画像処理装置、画像処理方法およびプログラムに関する。
【背景技術】
【0002】
高密度かつ高フレームレートでダイナミックな動きのある対象物体の3次元計測が必要とされている。例えば、運動する人物の筋肉の変化や、物体が破裂する瞬間の構造解析などは、高密度で高フレームレートでの形状復元が望まれている。
【0003】
このような、実用的な3次元計測ではこれまで、アクティブ計測法が主な解決策と考えられてきた。特にダイナミックに変化するオブジェクトに関しては、短時間に広範囲を取得可能なプロジェクタを利用した方法が適している。しかし、プロジェクタによるアクティブ手法を、動物体の高密度な形状計測に用いることには、本質的な課題がある。
【0004】
プロジェクタを用いた3次元計測として、主に、時間エンコード法と空間エンコード法の2つが知られている。時間エンコード法は複数のパターンを投影する手法のため、動いている物体の高フレームレートでの計測には本質的に適していない。また、広い範囲をカバーしようとして複数のプロジェクタを利用する場合、同期を取ることが難しい。一方で、空間エンコード手法の場合、各プロジェクタの投影パターンは不変であり、撮影画像も一枚で済むため動きのある物体の計測には適しているが、パターン自体が複雑なため、物体表面の色や形状との干渉などの問題が生じ、しばしば画像処理が困難となる。
【0005】
もし、固定された単色ラインパターンを投影した1フレームの画像から形状復元できれば、上記問題を全て解消することができる。そのような手法として、縦・横の直線からなるグリッドパターンを用いた、共面性拘束原理(coplanarity constraint:COP)に基づくワンショット復元手法(shape from grid pattern:SFG)が最近提案されている(非特許文献1)、(非特許文献2)、(非特許文献3)。
【0006】
実用的な3次元計測ではセンサから光を投影するアクティブ手法が多く利用されてきた。特に、効率化のためにビデオプロジェクタを用いた手法が多く提案されている(非特許文献4)、(非特許文献5)。プロジェクタを用いたアクティブ手法に関して、これまでに大きく分けて、時間エンコード法と空間エンコード法の2種類の手法が提案されてきた。
【0007】
近年、ハイスピードカメラとDLPプロジェクタを用いて、ダイナミックシーンを形状復元する研究が行われている。Weiseらは位相シフト法に基づいたパターン投影とステレオ視を組み合わせたシステムを提案した(非特許文献6)。NarasimhanらはDLPプロジェクタが生成する高速な時系列パターンを識別して形状復元を行う方法を提案した(非特許文献7)。また、形状の復元に必要なパターン数を削減する研究も行われている(非特許文献8)、(非特許文献5)。
【0008】
一方で、空間エンコード法では、パターンが固定されているため、映像中の1フレームのみから形状復元が可能であり、ダイナミックシーンの計測に適している(非特許文献9)、(非特許文献10)、(非特許文献11)、(非特許文献12)、(非特許文献13)。
【0009】
更にまた、上記した問題の対処方法の一つが特許文献1に記載されている。
【先行技術文献】
【特許文献】
【0010】
【特許文献1】特開2009−300277号公報
【非特許文献】
【0011】
【非特許文献1】Hiroshi Kawasaki, Ryo Furukawa, , Ryusuke Sagawa, and Yasushi Yagi. Dynamic scene shape reconstruction using a single structured light pattern. InCVPR, pages 1 8, June 23−28 2008.
【非特許文献2】Ryusuke Sagawa, Yuichi Ota, Yasushi Yagi, Ryo Furukawa, Naoki Asada, and Hiroshi Kawasaki. Dense 3d reconstruc−tion method using a single pattern for fast moving object. In ICCV, 2009.
【非特許文献3】Ali Osman Ulusoy, Fatih Calakli, and Gabriel Taubin. One−shot scanning using de bruijn spaced grids. InThe 7th IEEE Conf. 3DIM, 2009.
【非特許文献4】J. Batlle, E. Mouaddib, and J. Salvi. Recent progress incoded structured light as a technique to solve the correspon−dence problem: a survey.Pattern Recognition, 31(7):963 982, 1998.
【非特許文献5】Mark Young, Erik Beeson, James Davis, Szymon Rusinkiewicz, and Ravi Ramamoorthi. Viewpoint−coded structured light. InIEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR), June 2007.
【非特許文献6】T. Weise, B. Leibe, and L. Van Gool. Fast 3d scanning with automatic motion compensation. InIEEE Conference on Computer Vision and Pattern Recognition (CVPR’07), pages 1 8, June 2007.
【非特許文献7】S.G. Narasimhan, S.J. Koppal, and S. Yamazaki. Temporal dithering of illumination for fast active vision. InEuropean Conference on Computer Vision, volume 4, pages 830 844,October 2008.
【非特許文献8】O. Hall−Holt and S. Rusinkiewicz. Stripe boundary codes for real−time structured−light range scanning of moving ob−jects. InICCV, volume 2, pages 359 366, 2001.
【非特許文献9】C. Frueh and A. Zakhor. Capturing21/2d depth and tex−ture of time−varying scenes using structured infrared light. InProc. the 5th International Conference on 3−D Digital Imaging and Modeling, pages 318 325, 2005.
【非特許文献10】Changsoo Je, Sang Wook Lee, and Rae−Hong Park. High−contrast color−stripe pattern for rapid structured−light range imaging. InECCV, volume 1, pages 95 107, 2004.
【非特許文献11】Thomas P. Koninckx and Luc Van Gool. Real−time range ac−quisition by adaptive structured light.IEEE Trans. on PAMI, 28(3):432 445, March 2006.
【非特許文献12】P. Vuylsteke and A. Oosterlinck. Range image acquisition with a single binary−encoded light pattern.IEEE Trans. Pat−tern Anal. Mach. Intell., 12(2):148 164, 1990.
【非特許文献13】L. Zhang, B. Curless, and S. Seitz. Rapid shape acquisition using color structured light and multi−pass dynamicprogramming. InProc. First International Symposium 3DData Processing Visualization and Transmission, pages 24 36, 2002.
【発明の概要】
【発明が解決しようとする課題】
【0012】
しかしながら、上記した文献に記載された技術には以下のような問題があった。
【0013】
非特許文献1〜非特許文献3に記載のSFGでは、唯一の解を得るために、パターンの線の間隔の粗密情報を利用する。このため、縦横両方のパターンを十分密にすることが出来ないという制約があった。これは、計測の密度低下の原因になるばかりでなく、細い、あるいは小さな形状において、交点が不足しやすくなり、形状復元が行えなくなるという問題を生じさせる。
【0014】
非特許文献4および非特許文献5に記載された技術事項では、時間エンコード法を利用する場合、静的シーンでは安定した高精度の復元が可能であるが、複数の異なるパターンを投影することが必要なため、ダイナミックなシーンに利用することが本質的に難しい。
【0015】
非特許文献6〜非特許文献8に記載された手法では、これらの手法は高フレームレートで奥行き情報を取得することができるが、時系列コードを認識する必要があるため、画像中の観測対象の動きは一定速度以下である必要がある。さらに、使用する機器の高精度な同期が必要となる。
【0016】
非特許文献9〜非特許文献13に記載された手法では、多くの場合、複雑なパターンを用いるため、観測対象のテクスチャに影響されたり、奥行きエッジの部分で空間的なパターン情報を識別できず誤差が大きくなる、という問題が発生する。さらに、広い範囲を計測するために、複数のプロジェクタからパターンが同じ観測対象に投影された場合、パターンが干渉し合うため、その分離は容易ではなくなる。
【0017】
更に、特許文献1に記載された手法では、残存している1次元の不定性を、投影したパターンと得られた解とのマッチングを行うことで解消していたが、マッチングが必要とされる分計算時間が増大していた。
【0018】
本発明は、上記した種々の課題を解決するために成されたものであり、本発明の主たる目的は、動きのある物体の形状を高密度かつ高フレームレートに計測し、この結果得られた2次元画像に映し出された物体の3次元形状を適切に復元する画像処理装置、画像処理方法およびプログラムを提供することにある。
【課題を解決するための手段】
【0019】
本発明は、2次元画像から3次元形状を復元する画像処理装置であり、前記2次元画像は、3次元空間に存在する物体に対して第1パターンを投光する第1投光手段と、前記第1パターンと前記物体の表面で交わる第2パターンを前記物体に対して投光する第2投光手段と、前記物体で反射した前記第1パターン光および前記第2パターン光を撮影して2次元画像を得る撮影手段とで取得され、前記2次元画像にて前記物体に投影された前記第1パターンである第1曲線と、前記2次元画像にて前記物体に投影された前記第2パターンである第2曲線とを検出し、前記第1曲線と前記第2曲線との交点の座標である交点座標を算出する第1計算部と、前記交点座標、前記第1投光手段および前記第2投光手段のパラメータ、および前記撮影手段のパラメータから、前記第1曲線と前記第1パターンとの対応である第1対応および、前記第2曲線と前記第2パターンとの対応である第2対応を決定する第2計算部と、前記第1対応、前記第2対応又はその両方から、第1パターン光および前記第2パターン光が照射された部分の前記物体の3次元座標を算出することで、前記3次元形状を復元する第3計算部と、を備えることを特徴とする。
【0020】
更に本発明は、2次元画像から3次元形状を復元する画像処理方法であり、前記2次元画像は、3次元空間に存在する物体に対して第1パターンを投光する第1投光手段と、前記第1パターンと前記物体の表面で交わる第2パターンを前記物体に対して投光する第2投光手段と、前記物体で反射した前記第1パターン光および前記第2パターン光を撮影して2次元画像を得る撮影手段とで取得され、前記2次元画像にて前記物体に投影された前記第1パターンである第1曲線と、前記2次元画像にて前記物体に投影された前記第2パターンである第2曲線とを検出し、前記第1曲線と前記第2曲線との交点の座標である交点座標を算出する第1ステップと、前記交点座標、前記第1投光手段および前記第2投光手段のパラメータ、および前記撮影手段のパラメータから、前記第1曲線と前記第1パターンとの対応である第1対応および、前記第2曲線と前記第2パターンとの対応である第2対応を決定する第2ステップと、前記第1対応、前記第2対応又はその両方から、第1パターン光および前記第2パターン光が照射された部分の前記物体の3次元座標を算出することで、前記3次元形状を復元する第3ステップと、を備えることを特徴とする画像処理方法。
【0021】
更に本発明は、2次元画像から3次元形状を復元する機能を画像処理装置に実行させるプログラムであり、前記2次元画像は、3次元空間に存在する物体に対して第1パターンを投光する第1投光手段と、前記第1パターンと前記物体の表面で交わる第2パターンを前記物体に対して投光する第2投光手段と、前記物体で反射した前記第1パターン光および前記第2パターン光を撮影して2次元画像を得る撮影手段とで取得され、前記2次元画像にて前記物体に投影された前記第1パターンである第1曲線と、前記2次元画像にて前記物体に投影された前記第2パターンである第2曲線とを検出し、前記第1曲線と前記第2曲線との交点の座標である交点座標を算出する第1機能と、前記交点座標、前記第1投光手段および前記第2投光手段のパラメータ、および前記撮影手段のパラメータから、前記第1曲線と前記第1パターンとの対応である第1対応および、前記第2曲線と前記第2パターンとの対応である第2対応を決定する第2機能と、前記第1対応、前記第2対応又はその両方から、第1パターン光および前記第2パターン光が照射された部分の前記物体の3次元座標を算出することで、前記3次元形状を復元する第3機能と、を実行させることを特徴とするプログラム。
【発明の効果】
【0022】
本発明は、物体に投影されたパターン同士の交点の情報のみから、不定性のない解を得ることができる。従って、パターンの粗密情報を利用する必要がないため、縦横両方のパターンを密にすることができる。背景技術では、特に細い領域の復元などにおいて、グリッドパターンの接続関係の検出が困難になり、復元が失敗する場合があったが、本発明ではこの問題が大きく軽減される。
【0023】
更に本発明では、複数のプロジェクタを用いるため、パターンが遮蔽されて形状計測できない部分を大きく減らすことが可能となる。
【0024】
更にまた、本発明では、解の精度向上のためデブルーイン(de Bruijn)系列に基づいた線IDを用いる手法を採用した。更には、検出された線の隣接情報を用いる手法を採用している。このようにすることで、複数のプロジェクタと1つのカメラ方式を用いた密なワンショット形状計測が実現された。更に、グリッドパターンを用いたワンショット復元の線形解法が実現された。更には、高フレームレートで動物体を計測することが可能となった。
【図面の簡単な説明】
【0025】
【図1】(A)は本発明の画像処理装置を用いて物体の2次元画像を取得する状態を示す図であり、(B)は画像処理装置の構成を示す図である。
【図2】本発明の画像処理方法を示すフローチャートである。
【図3】本発明の画像処理装置に含まれるカメラとプロジェクタの位置関係を示す図である。
【図4】本発明の画像処理装置に於いて、プロジェクタの画像面上でのパターン位置を示す図である。
【図5】本発明の画像処理装置を用いた実験シーンを示す図である。
【図6】評価実験のセットアップを示す図であり、(A)は入力画像を示し、(B)はプロジェクタの配置を示す上面図であり、(C)はその側面図である。
【図7】本発明を用いて3つの手法による復元結果を同じ座標系に表示した図であり、(A)はグリッドポイントの拘束のみを用いた方法Aによる復元結果であり、(B)は隣接情報による拘束を加えた方法Bによる復元結果であり、(C)は隣接情報および線IDを利用した方法Cによる復元結果である。
【図8】本発明を用いて2つのペンシルの軸どうしの距離が短い場合に対する評価実験を示す図であり、(A)は入力画像であり、(B)はプロジェクタの配置を示す図であり、(C)は側面図である。
【図9】(A)および(B)は、隣接情報と線IDの利用による精度向上を示す表である。
【図10】本発明の効果を示す図であり、左側に配置された画像は背景技術によるものであり、右側に配置された画像は本形態によるものであり、上段の画像は入力画像であり、中断の画像は線検出によって得られたグリッドグラフであり、下段の画像は3次元形状復元結果である。
【図11】本発明の効果を示す図であり、左側に配置された図は入力画像であり、中央に配置された図は検出されたグリッドパターンであり、右側に配置された図は3次元形状復元結果である。
【発明を実施するための形態】
【0026】
<第1の実施の形態:画像処理装置>
図1を参照して、本発明の実施の形態に係る画像処理装置10の構成を説明する。図1(A)は本形態による装置全体の一例を示す図であり、図1(B)は画像処理装置10の構成を示す図である。
【0027】
図1(A)を参照して、本形態では、画像処理装置10と、カメラ28(撮影手段)と、プロジェクタ24(第1投光手段)と、プロジェクタ26(第2投光手段)とで、3次元空間中に存在する物体30の2次元画像を撮影し、撮影された2次元画像から物体の3次元形状を復元している。ここで、カメラ28とプロジェクタ24、26は校正済みである。すなわち、それぞれの内部パラメータおよび、機器間の剛体変換パラメータは既知である。更にまた、カメラ28、プロジェクタ24、26および画像処理装置10を、本形態の画像処理装置とみなしても良い。
【0028】
プロジェクタ24は、被写体である物体30に対して横パターンを含む光を投光する機能を有し、例えば、ビデオプロジェクタ等の装置が考えられる。その他、ラインレーザ投光機を並べたり組み合わせたりしても良い。あるいはレーザ光源をプリズムやビームスプリッターなどで複数方向に分けて照射しても良い。
【0029】
プロジェクタ26は、物体30に対して縦パターンを投光する。その他のプロジェクタ26の特徴はプロジェクタ24と同様である。なお、各プロジェクタからは固定したパターンが投影されるため、カメラ28とプロジェクタ24、26との間で同期の必要が無い。
【0030】
プロジェクタ24により投光されたパターン光と、プロジェクタ26から投光されたパターン光とは物体30の表面にて交わる。この交わる角度は任意である。
【0031】
ここで、本形態では、2つのプロジェクタは本質的には単色のパターンでの形状復元が可能であるが、精度と安定性の向上のためにカラーパターンを利用する。具体的には、beliefpropagationに基づく線検出と、周期的なパターンであるデブルーイン系列に基づいたカラーコードを用いて、安定した縦・横の線検出と分離を実現する。この方法は、例えば上記した非特許文献10や非特許文献13に記載されている。更には、当該事項はJoaquim Salvi, Joan Batlle, and El Mustapha Mouaddib. Arobust−coded pattern projection for dynamic 3D scene mea−surement.Pattern Recognition, 19(11):1055 1065, 1998.)にも記載されている。
【0032】
カメラ28は、物体30を撮影する手段であり、例えばCCDイメージセンサ等の固体撮像装置が採用される。具体的には、カメラ28は、プロジェクタ24、26から投光されたパターンが物体30で反射したパターン光を撮影する。更には、これらのパターン光が交わる交点もカメラ28により撮影される。カメラ28により2次元画像が撮影され、この2次元画像に基づくデータが画像処理装置10により画像処理されることで、物体30の3次元形状が復元される。
【0033】
図1(B)を参照して、2次元画像から3次元形状を復元する画像処理装置10の構成を説明する。
【0034】
本実施の形態の画像処理装置10は、画像処理部12と、制御部14と、入力部16と、記憶部18と、表示部20と、操作部22とを主要に具備する。画像処理装置10の概略的機能は、入力された2次元画像を画像処理して、3次元形状を復元して出力することにある。また、具現化された画像処理装置10としては、所定の機能を実行するアプリケーション(プログラム)がインストールされたパーソナルコンピュータ等のコンピュータでも良いし、所定の機能を実行するように構成された画像処理専用の機器として構成されても良い。更にまた、画像処理装置10を構成する各部位は、バスを経由して相互に電気的に接続される。
【0035】
画像処理部12は、主たる画像処理の機能を果たす部位であり、第1計算部12Aと、第2計算部12Bと、第3計算部12Cとを含む。
【0036】
第1計算部12Aは、撮影された2次元画像から、物体30に投影された縦パターンの縦曲線および横パターンの横曲線と、両パターンの交点座標を算出する機能を備えている。
【0037】
第2計算部12Bは、各プロジェクタのパラメータ、カメラのパラメータおよび前記光点座標から、対応を決定する機能を備えている。具体的には、プロジェクタ26から投影される縦パターンと画像から検出された縦曲線との第1対応およびプロジェクタ24から投影される横パターンと画像から検出された横曲線との第2対応を決定している。
【0038】
第3計算部12Cは、得られた第1対応、第2対応またはこれらの両方から、両パターン光が照射された部分の3次元座標を決定する機能を備えている。
【0039】
上記した画像処理部を構成する各部位の詳細は、画像処理方法として以下に詳述する。ここで、画像処理部12に含まれる計算部は必ずしも上記した3つである必要はなく、必要に応じて計算部の個数は増減されても良い。
【0040】
制御部14は、画像処理装置10全体(画像処理部12、入力部16、記憶部18、表示部20)の動作を制御している部位である。
【0041】
入力部16は、外部から画像処理装置10に情報が入力される部位である。本実施の形態では、2次元画像である動画像または静止画像が入力される。
【0042】
記憶部18は、HDD(Hard Disk Drive)に代表される固定式の記憶ディスク、CD(Compact Disc)やDVD(Digital Versatile Disk)等の着脱式記憶ディスク、固定式あるいは着脱式の半導体メモリ等である。本実施の形態では、記憶部18には、処理前の2次元画像、当該2次元画像から復元された3次元形状或いは処置途中のデータ等が記憶される。
【0043】
更に、記憶部18には、下記する画像処理方法を画像処理装置10に実行させるためのプログラムが格納される。このプログラムは、使用者が操作部22を操作することにより呼び出されて、入力された2次元画像のデータから、3次元形状のデータを復元するように、上記した各部位の機能を実行させる。
【0044】
表示部20は、例えば液晶ディスプレイ、CRT(Cathode Ray Tube)、ビデオプロジェクタであり、入力された2次元画像や、この2次元画像を基に復元された3次元形状が表示される。
【0045】
操作部22は、例えば、キーボードやマウスであり、使用者がこの操作部22を操作することにより、画像処理装置10は2次元画像から3次元形状を復元する。
【0046】
<第2の実施の形態:画像処理方法>
上記構成の画像処理装置10を用いて2次元画像に映し出された物体の3次元形状を復元する方法を以下に説明する。
【0047】
図2を参照して、本形態の画像処理方法は、物体の2次元画像を撮影するステップS10と、撮影された2次元画像から縦パターン曲線と横パターン曲線とを抽出するステップS11と、これらのパターン曲線の交点を検出するステップS12と、この交点からパターン曲線の連立方程式を導出するステップS13と、連立方程式からパターン曲線の3次元形状を得るステップS14とを備えている。ここで、ステップS13にて連立方程式を導出することは、各パターンと各曲線との対応関係を決定することと等価である。
【0048】
本形態の具現化された画像処理手法を以下にて説明する。
【0049】
先ず、ステップS10では、図1に示したシステムを用いて、プロジェクタ24おおよびプロジェクタ26からパターン光を物体30に向けて投光する。ここでは、プロジェクタ24から、横方向に直線状に伸びる横パターン光を物体30に投光する。そしてプロジェクタ26から、縦方向に直線状に伸びる横パターン光を物体30に投光する。この結果、物体30の表面に両パターン光が投光され、両パターン光の交点が物体30の表面に存在する。この状態の物体30をカメラ28で撮影する。このことにより、各パターン光が照射された物体30の2次元画像が得られる。この2次元画像に基づく画像データは、画像処理装置10に伝送される。
【0050】
次にステップS11では、2次元画像から縦パターン曲線および横パターン曲線を抽出する。2次元画像からカラーコードを安定に検出するには、全体の色数を減らすことが望ましい。そこで、縦・横のパターンに同じ色を用いつつ、それらを識別するために、非特許文献2において提案された線検出法を用いる。
【0051】
本形態で使用されるデブルーイン系列は、それぞれの線に与えられた線IDの決定に用いられる。長さn、記号数qのデブルーイン系列は、長さqnの数列であり、長さnの部分数列を観測すれば、数列中の位置が一意に特定可能という特徴を持つ。投影パターンを画像中で区別できる2つ以上の記号でコード化した場合、投影パターンと観測パターン間の対応が長さnの数列のマッチングによって一意に決まる。非特許文献10、非特許文献10、非特許文献13ではグローバルに一意なIDを決定するため、大きなqとnの値が用いられていたが、本形態では非特許文献2のように、小さな値を用いて生成されたパターンを用いる。
【0052】
これは、本形態ではデブルーインIDは、ノイズなどの影響による誤推定の修正にのみ利用されるため、局所的な一意性が確保されれば十分なためである。小さいqとnのため、IDを決定するために必要な連続パターン数が少なくて済み、少数の色でIDを表現できるので、形状の凹凸や、画像処理の影響を受けにくくなる。本形態では色数q=2、およびコードの長さn=3を用いた。すなわち、カラーパターンの周期は8本となり、各線に与えられる線IDは0から7となる。また、オクルーディングエッジなどにおいて起こる線の誤接続も、このデブルーインIDを用いて解消することができる。
【0053】
縦パターンと横パターンの交点の位置はサブピクセル精度で計算される(ステップS12)。また検出された線の連続性を用いて、隣接する交点が分かるので、線検出の結果として、交点を格子状に接続したグリッドグラフが得られる。この交点座標と、交点の接続情報であるグリッドグラフにより、以下で述べる手法により3次元復元が実現される。
【0054】
ここで、最小構成である2つのプロジェクタと1つのカメラを用いた復元方法について述べる。あるプロジェクタから一組の平行線を投影すると、各線の3次元空間中での軌跡は平面であり、その全ての平面はある一つの直線を共有する。すなわち、この直線を軸とするpencil of planes(同一の直線を共有する面の集合を表し、以下ペンシルと表記する)の要素である。平面を3個のパラメータで表し、その3次元ベクトルを3次元空間の点と見なした時、この点を平面の双対と呼び、その空間を双対空間と呼ぶ。平面の双対は点であり、ペンシルの双対は直線となる。このことから、直線中の点を1パラメータで表現するのと同じように、特定のペンシル中の平面を1パラメータで表現できる。この時、グリッドの交点位置から、パターン平面のパラメータに関する線形方程式を作成することが可能である(ステップS13)。
【0055】
これまで非特許文献2において、単一のプロジェクタによって縦・横の線を投影し、3次元復元する手法が提案されている。また、この方法はRyo Furukawa, Hiroshi Kawasaki, Ryusuke Sagawa, and Yasushi Yagi. Shape from grid pattern based on copla−narity constraints for one−shot scanning.IPSJ Transaction on Computer Vision and Applications, 1:139 157, 2009.でも述べられている。
【0056】
上記文献において、縦・横の線の交点はグリッドポイントと呼ばれる。上記文献より、縦パターン平面が通過する軸と、横パターン平面が通過する軸は、プロジェクタの光学中心で交わる。これにより、グリッドポイントの情報から得られる線形方程式の定数項が消去されるため、構成される連立方程式は、必ず不定性を持つ方程式となる。
【0057】
上記文献においては、線の粗密情報をパターンに付与し、残っている1次元の不定性を、投影したパターンと得られた解とのマッチングを行うことで解消する手法としていた。また、非特許文献3は、デブルーインIDにより、この不定性を解消している。
【0058】
これに対して、本形態では、複数のプロジェクタを利用し、縦平面と横平面を異なるプロジェクタで投影することで一意な解を得る。即ち、図3に示すように、縦パターン平面は、プロジェクタの光学中心を通る直線lを共有する(つまり、lを軸とするペンシルである。)。同様に横パターン平面はlを共有する。カメラで観測された、縦横のパターン光で照射された曲線が、それぞれ、プロジェクタから投影されたどのパターンに対応するかは未知である。この情報を、観測された曲線についての方程式から復元する。lとlがねじれの位置になるようにプロジェクタを配置すると、得られる方程式は、定数項を持つ線形方程式となり、一般に解は不定性を持たない。このため、線形方程式のみから一意に解を定めることが出来る。
パターン平面pを
【0059】
【数1】

で表す。このとき、3次元ベクトルp=(p、p、pは、平面のパラメータベクトルである。ベクトルpは、元の平面の双対ベクトルとも呼ばれる。ベクトルpの空間は、元の空間の双対空間とも呼ばれる。ある縦パターン平面をvとし、vと異なる縦パターン平面をvとする。このとき、v、vの交線であるlを含む平面の集合は、以下の式で表現される。
【0060】
【数2】

この式は、3次元空間中における直線の式と同じ形をしており、縦パターン平面の集合が、双対空間中でv、vを通る直線に含まれることを表す。この直線を表現するために、直線上の任意の点vと、直線の方向ベクトル(あるいは無限遠点を正規化したもの)vinfを用いて、
【0061】
【数3】

と表現することが出来る。ここで、μは、プロジェクタで投影する画像上の各ラインに対して定義できるパラメータである。
【0062】
はlを含む平面の集合から任意に選ぶことが出来る。また、lを含む平面には、カメラの光学中心を通過する唯一の平面が存在するが、vinfは、その平面の法線ベクトルに一致する。式(1)は、平面がカメラの光学中心を通らないことを仮定しているが、カメラの光学中心に平面が近づくと、パラメータpは双対空間中でvinfの方向の無限遠点に近づく。
【0063】
横パターンの集合も、同様に、
【0064】
【数4】

と表されるとする。
【0065】
ある縦パターンvと横パターンhの交点が、正規化カメラ座標において(s、t)で観測されたとする。この時、v、hの双対ベクトルをv、hとし、u=(s、t、−1)とすると、
【0066】
【数5】

である。式(4)、(2)を代入して、
【0067】
【数6】

を得る。
【0068】
上記の式はグリッドポイントごとに得られるので、これから線形連立1次方程式を作ることが出来る。i番目の縦平面について、式(2)のパラメータμをμ、同様にj番目の横平面について、式(4)のパラメータρをρとする。また、K個のグリッドポイントが検出されたとして、そのうちk番目のグリッドポイントu=(s、t、−1)が、α(k)番目の縦平面とβ(k)番目の横平面との交点であるとする。この時、
【0069】
【数7】

がk=1、・・・、Kについて成立する。
【0070】
数式7と類似の数式は、非特許文献2でも与えられるが、上記文献との大きな違いとして、本形態においては、数式7には定数項があり、この項は、変数の置き換えなどによって消去されない。非特許文献2では、そのままで、あるいは変数の置き換えによって、定数項を消去することが出来るので、線形方程式の解が唯一ではなかったが、本形態では唯一の解が線形方程式から求められる。
【0071】
さらに、パターン同士の隣接情報が与えられている場合、それを利用した拘束式を作ることが出来る。特に、パターン上の隣接するラインどうしのμの差が一定値の場合(パターン平面の集合が、双対空間中で等間隔に並ぶ場合に相当する)は、拘束式が以下に述べるように線形となり都合が良い。そこで、本形態では、このように、μは隣接するパターンにおいて一定間隔で変化するという線形関係があると仮定し、以下議論を進める。
【0072】
後述するように、これは投影するパターンの間隔を調整するか、プロジェクタの配置を工夫することで常に成立させることが出来るため、この仮定により手法の一般性が失われることはない。L個のパターンのペアが隣接する場合を考える。l番目のペアがγ(l)番目の縦平面とδ(l)番目の縦平面である場合、
【0073】
【数8】

となる。Dは定数であり、v、vinfの取り方と、μγ(l)、μδ(l)の順序関係からあらかじめ決定できる。
【0074】
式(7)、(8)から得られるμとρに関する線形連立方程式を解くことで、検出された各曲線のパターン平面を決定できる。
【0075】
実際の計算においては、行列方程式Ax=bを生成する。ただしxは、検出された縦パターン及び横パターンのパラメータμ、ρを並べてベクトルにしたものである。十分な交点と隣接情報があれば、Aの行数は列数より大きいので、擬似逆行列を用いてx=(AA)−1cによって解を求める。(AA)−1の計算にはLU分解による方程式解法を利用すればよい。
【0076】
上記方程式で得られる解は、縦パターンまたは横パターンの、観測された曲線について、対応するパターン平面の位置情報を表すものである。この情報が求められると、三角測量の原理によって、その曲線を3次元復元できる。ここで、縦パターンおよび横パターンの両方で観測された曲線が用いられても良い(ステップS14)。
【0077】
上記の位置情報は、方程式から得られた解をそのまま利用してもよいが、投影されるパターン平面は有限であり、位置は既知であるので、これらの既知の平面集合と照合し、近い平面を、対応する平面としても良い。これにより、方程式から得られた解の精度が高ければ、校正誤差以外の誤差のない3次元復元を行うことが出来る。
【0078】
次に、プロジェクタとカメラの配置について説明する。
【0079】
一般に、プロジェクタの画像上のラインパターンが一定間隔であっても、式(3)におけるμはパターン座標に比例した値とはならない(つまり、パターン平面の双対が一定間隔にならない)。このため、μがパターンに応じて線形となるためには、プロジェクタとカメラとの間の剛体変換に従って、投影するパターンを毎回計算する必要がある。この場合、プロジェクタとカメラの位置関係を変更する度にパターンを変更することになり利便性が損なわれる。
【0080】
もう一つの方法として、一定間隔のパターンを投影した場合であっても、μと、プロジェクタの画像面上での位置関係が線型となるような配置が考えられる。プロジェクタの光学中心を通り、プロジェクタの画像面に平行な平面を、O. Faugeras.Three−dimensional computer vision: A geo−metric viewpoint. The MIT press, Cambridge, MA, 1993.に倣ってプロジェクタの焦点面(focal plane)と呼ぶことにする。
【0081】
図4に示すように、プロジェクタの焦点面にカメラの光学中心が含まれるようにし、さらにプロジェクタの光軸を含むパターン平面の双対を、vとする。この時、等間隔のグリッドから生成される縦パターン平面の集合が、双対空間中でも等間隔の点となる。このことは、直感的には、画像面上でのパターンの無限遠の位置と、双対空間中での無限遠点(カメラの光学中心を含む平面)が一致することから示される。本形態ではプロジェクタとカメラが、このように配置されているとすると、パターンの隣接関係を線形方程式に組み入れることが出来る。
【0082】
このような配置の例としては、縦パターンプロジェクタ(第1投光手段)の正面方向と、カメラから、縦パターンプロジェクタ(第1投光手段)光学中心に向かう方向とが直交し、かつ、横パターンプロジェクタ(第2投光手段)の正面方向と、カメラから、横パターンプロジェクタ(第2投光手段)光学中心に向かう方向とが、直交する配置がある。
【0083】
上記の配置が満たされないばあい、隣接関係は線形方程式にはならないが、解の非線形な制約条件としては利用できる。
次に、デブルーイン系列を用いた精度向上に関して説明する。上記したように、線型連立方程式から、検出された曲線を含むパターン平面の3次元位置を一意に決定できる。しかし、実際には、画像処理における誤差の影響で誤った線およびグリッドポイントが検出された場合、得られる解に誤差が生じることが生じる。そこで本形態では、デブルーイン系列によって曲線に付けられた周期的な線IDを利用して、解の誤差を修正する。本形態ではカメラとプロジェクタは校正済みであると仮定しているため、プロジェクターから投影されるパターン平面のパラメータと、それぞれの平面のデブルーイン系列の線IDは既知である。このとき、可能な解はこれらの平面に対して面の位置と線IDが一致するものに限られる。この原理を利用して解の修正を行う。具体的には、上記で得られた検出された曲線についての解の周辺で、投影パターンのIDが一致するものと対応させ、各交点の条件である式(5)が成立しているかどうかを調べる。この条件は、実際には2枚の平面の交線をカメラに投影したものと、検出されたグリッドポイントとの画像上での距離が0であることを表す。そこで、これらの距離を各グリッドポイントについて求め、それらの二乗和を求め、それが小さい解を選べば良い。
【0084】
上記の手順において、「曲線についての解の周辺」を探索する場合、全ての平面について変数を変化させると、大きな次元の空間を探索する必要がある。計算時間の短縮のためには、線形方程式の係数行列Aについて、(AA)の最小固有値に対応する固有ベクトルを求め、このベクトルの方向に解を探索すると、効率がよい。これは、上記の方程式において、誤差が出やすい方向は、多くの場合1次元空間であることから正当化される。隣接関係が非線形な制約条件となるばあい、上記の精度向上と同様な方法で、精度向上の手段として、隣接関係を利用しても良い。
【0085】
パターン同士の隣接関係を線形方程式に利用した場合、縦パターンが共有する直線(第1投光手段の軸)と、縦パターンが共有する直線(第2投光手段の軸)とは、特殊な場合を除いて、交わっていても唯一の解が求められる。しかし、パターン同士の隣接関係を線形方程式に利用しない場合には、これらの軸が交わる場合、方程式に不定性が生じる。このため、隣接関係が得られない場合、これらの軸が交わらないようにプロジェクタを配置する必要がある。
【0086】
上記のように、線形方程式を直接解く手法とは異なる解法も考えられる。既に述べたように、投影されるパターン平面は有限であり、位置は既知であるので、解(観測された曲線と、投影される既知のパターン平面との対応)の候補は有限である。そこで、数式7、数式8が成立する解を、組み合わせ最適化による探索で求めても良い。この場合、ある曲線Aについての対応を仮説として採用すると、その曲線の位置が決定し、数式7、数式8から、曲線Aと交わる曲線Bや、あるいは、曲線Aと隣接する曲線Cについての位置情報が得られ、BあるいはCの対応の仮説も限定される。このようにして、次々と曲線に対するパターン平面の対応を求めることで、限定された仮説の中から、数式7,8の条件を最もよく満たす仮説を求めることで、解を求めることもできる。
【0087】
<第3の実施の形態:実験結果>
本形態では、上記した本形態の画像処理装置および画像処理方法を用いた実験結果を説明する。
【0088】
本形態の実験では、図5に示すように、1台のカメラと2台のプロジェクタを配置し計測を行った。各装置の配置は観測対象によって毎回調整を行い、人物の計測においては、カメラ−プロジェクタの間隔は約1m、相対角は約25度とした。カメラの解像度は1280x960ピクセルでフレームレートは15FPS、プロジェクタの解像度は1024x768ピクセルである。
【0089】
先ず、隣接情報および線IDを用いた解の精度向上の評価を説明する。具体的には、隣接情報および線IDを用いて形状復元を行う効果について、次の3つの条件で立方体を観測し、3次元復元結果を比較した。
(方法A):グリッドポイントから得られる拘束のみの利用
(方法B):グリッドポイントと隣接情報の拘束の利用
(方法C):グリッドポイントと隣接情報の拘束に加え、線IDを用いた解修正の利用
復元した点データを2つの平面に当てはめ、面当てはめの二乗平均平方根誤差(root mean square error、 RMSE)と2面間の角度を評価した。実験環境においてカメラから観測対象までの距離は1.6mであった。
【0090】
入力画像とプロジェクタの配置を図6に示す。立方体の2面を3次元形状復元した結果を図7に示し、平面間の角度および平面当てはめにおけるRMS誤差を図9(A)の表に示す。これらの結果より、2面間の角度は、隣接情報(方法B)、線ID(方法C)を使うことにより、90度に近づくため、形状の精度が改善されていることが分かる。グレイコードを使った時間エンコード法と比較すると、方法Cでは、線IDを用いた対応付けによって、正しい対応が得られたため線検出による誤差を除き、グレイコード法と同じ結果が得られた。
【0091】
3次元形状復元結果を平面に当てはめた際のRMS誤差は追加情報を与える毎に大きくなった。これは以下の理由により、自然な結果である。追加情報がない場合には縦線と横線それぞれを復元すると、交点においてその間の距離を最小化する最適化のため、縦線と横線のずれが小さくなり、結果として平面当てはめ時のRMS誤差は小さくなる。逆に隣接関係や線IDの拘束を追加する場合、縦線と横線のずれが大きくなり、平面当てはめ時の誤差が大きくなる。これは、実際のシステムにおいては、画面全体にわたりサブピクセル以下の精度で校正を行うことが困難なためである。
【0092】
次に、図8に示したプロジェクタの配置を用いて、2つのペンシルの軸どうしの距離が短い場合について評価を行った。同様に立方体の計測を行い、3次元形状復元した結果を2個の平面に当てはめ、面間の角度および当てはめ時のRMS誤差を図9(B)に示す。カメラと観測対象間の距離は3.7mであった。この条件の下では、方法Aはランク落ちにより失敗したが、方法B、Cでは、隣接情報による拘束を用いることで3次元形状復元が可能となることが示された。
【0093】
次に、小物体の形状復元に関して説明する。具体的には、1プロジェクタのみを用いる従来法によるワンショット形状復元(非特許文献2)との比較を行った。従来法では線形解法で残っていた1自由度を決定するために1次元探索が必要であったが、本形態では必要ないため、非特許文献2と比べて密なパターンが利用できる。その利点は細い指などの細かな形状の復元が容易になることである。
【0094】
図10は両手法による結果の比較である。上段は入力画像、中段は線検出によって得られたグリッドグラフ、下段は3次元形状復元結果である。左側に示す従来法ではパターンの不足から指が欠けているのに対し、右側に示す本形態では、指が欠けることなく形状復元できていることが分かる。
【0095】
最後に、人体の密な形状計測を確認するために、動いている人物の上半身を計測した。図11は、複数のポーズについての形状復元結果である。この図において、列(A)は入力画像であり、線検出処理によって線検出およびラインIDを決定した結果が列(B)である。各線の色(ここでは濃淡)によってラインIDを表している。列(C)は線検出結果を用いた形状復元結果の結果である。脇腹や肩といったいくつかの部分では、片方のプロジェクタから死角になっており、縦あるいは横のパターンしか投影されていない部分がある。しかし、そのパターンが死角になっていない部分とつながることにより、形状復元されていることが分かる。これは、複数のプロジェクタを用いる本形態の利点の1つと言える。
【符号の説明】
【0096】
10 画像処理装置
12 画像処理部
12A 第1計算部
12B 第2計算部
12C 第3計算部
14 制御部
16 入力部
18 記憶部
20 表示部
22 操作部
24 プロジェクタ
26 プロジェクタ
28 カメラ
30 物体

【特許請求の範囲】
【請求項1】
2次元画像から3次元形状を復元する画像処理装置であり、
前記2次元画像は、3次元空間に存在する物体に対して第1パターンを投光する第1投光手段と、前記第1パターンと前記物体の表面で交わる第2パターンを前記物体に対して投光する第2投光手段と、前記物体で反射した前記第1パターン光および前記第2パターン光を撮影して2次元画像を得る撮影手段とで取得され、
前記2次元画像にて前記物体に投影された前記第1パターンである第1曲線と、前記2次元画像にて前記物体に投影された前記第2パターンである第2曲線とを検出し、前記第1曲線と前記第2曲線との交点の座標である交点座標を算出する第1計算部と、
前記交点座標、前記第1投光手段および前記第2投光手段のパラメータ、および前記撮影手段のパラメータから、前記第1曲線と前記第1パターンとの対応である第1対応および、前記第2曲線と前記第2パターンとの対応である第2対応を決定する第2計算部と、
前記第1対応、前記第2対応又はその両方から、第1パターン光および前記第2パターン光が照射された部分の前記物体の3次元座標を算出することで、前記3次元形状を復元する第3計算部と、
を備えることを特徴とする画像処理装置。
【請求項2】
前記第1投光手段および前記第2投光手段が、複数の線分の画像である第1パターン画像および第2パターン画像を3次元空間に投影する装置であることを特徴とする請求項1に記載の画像処理装置。
【請求項3】
前記第3計算部では、前記交点座標、前記第1投光手段および前記第2投光手段のパラメータから得られる第1線形方程式を解くことで、前記3次元形状を算出することを特徴とする請求項1または請求項2に記載の画像処理装置。
【請求項4】
前記第3計算部では、前記第1計算部で検出された前記交点座標を制約として、前記各対応を決定する組み合わせ最適化問題として解くことで、前記3次元形状を算出することを特徴とする請求項1または請求項2に記載の画像処理装置。
【請求項5】
前記第1投光手段の軸と前記第2投光手段の軸とが、3次元空間中で交わらないことを特徴とする請求項1から請求項4の何れかに記載の画像処理装置。
【請求項6】
前記第1パターンあるいは前記第2パターンが3次元空間中で通過する平面の集合が、双対空間中で等間隔に並ぶという第1条件が満たされるように、
前記第1投光手段および前記第2投光手段を配置することを特徴とする請求項1から請求項5の何れかに記載の画像処理装置。
【請求項7】
前記第1条件が、前記第1投光手段の正面と前記撮影手段から前記第1投光手段への方向ベクトルとが直角になると共に、前記第2投光手段の正面と前記撮影手段から前記第2投光手段への方向ベクトルが直角になる状態で、前記2次元画像を取得することで満たされることを特徴とする請求項6に記載の画像処理装置。
【請求項8】
前記第1パターンまたは前記第2パターンには、個々の前記パターンを幾つかのクラスに識別可能な識別情報が付与されており、
前記第3計算部では、前記識別情報と前記第1パターンまたは前記第2パターンのクラスが一致するという制約条件が用いられることを特徴とする請求項1から請求項7の何れかに記載の画像処理装置。
【請求項9】
前記第1パターンまたは前記第2パターンに含まれるパターンの色を、2色以上とすることにより前記識別情報を持たせることを特徴とする請求項8に記載の画像処理装置。
【請求項10】
前記第2計算部では、隣接する前記第1パターン同士または隣接する前記第2パターン同士の関係式を用いて前記第1対応あるいは前記第2対応、あるいはその両方を求めることを特徴とする請求項1から請求項9の何れかに記載の画像処理装置。
【請求項11】
2次元画像から3次元形状を復元する画像処理方法であり、
前記2次元画像は、3次元空間に存在する物体に対して第1パターンを投光する第1投光手段と、前記第1パターンと前記物体の表面で交わる第2パターンを前記物体に対して投光する第2投光手段と、前記物体で反射した前記第1パターン光および前記第2パターン光を撮影して2次元画像を得る撮影手段とで取得され、
前記2次元画像にて前記物体に投影された前記第1パターンである第1曲線と、前記2次元画像にて前記物体に投影された前記第2パターンである第2曲線とを検出し、前記第1曲線と前記第2曲線との交点の座標である交点座標を算出する第1ステップと、
前記交点座標、前記第1投光手段および前記第2投光手段のパラメータ、および前記撮影手段のパラメータから、前記第1曲線と前記第1パターンとの対応である第1対応および、前記第2曲線と前記第2パターンとの対応である第2対応を決定する第2ステップと、
前記第1対応、前記第2対応又はその両方から、第1パターン光および前記第2パターン光が照射された部分の前記物体の3次元座標を算出することで、前記3次元形状を復元する第3ステップと、
を備えることを特徴とする画像処理方法。
【請求項12】
2次元画像から3次元形状を復元する機能を画像処理装置に実行させるプログラムであり、
前記2次元画像は、3次元空間に存在する物体に対して第1パターンを投光する第1投光手段と、前記第1パターンと前記物体の表面で交わる第2パターンを前記物体に対して投光する第2投光手段と、前記物体で反射した前記第1パターン光および前記第2パターン光を撮影して2次元画像を得る撮影手段とで取得され、
前記2次元画像にて前記物体に投影された前記第1パターンである第1曲線と、前記2次元画像にて前記物体に投影された前記第2パターンである第2曲線とを検出し、前記第1曲線と前記第2曲線との交点の座標である交点座標を算出する第1機能と、
前記交点座標、前記第1投光手段および前記第2投光手段のパラメータ、および前記撮影手段のパラメータから、前記第1曲線と前記第1パターンとの対応である第1対応および、前記第2曲線と前記第2パターンとの対応である第2対応を決定する第2機能と、
前記第1対応、前記第2対応又はその両方から、第1パターン光および前記第2パターン光が照射された部分の前記物体の3次元座標を算出することで、前記3次元形状を復元する第3機能と、
を実行させることを特徴とするプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図9】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図10】
image rotate

【図11】
image rotate


【公開番号】特開2011−242183(P2011−242183A)
【公開日】平成23年12月1日(2011.12.1)
【国際特許分類】
【出願番号】特願2010−112753(P2010−112753)
【出願日】平成22年5月17日(2010.5.17)
【出願人】(510108951)公立大学法人広島市立大学 (11)
【出願人】(504190548)国立大学法人埼玉大学 (292)
【出願人】(510136231)
【出願人】(302010622)有限会社テクノドリーム二十一 (6)
【Fターム(参考)】