説明

ステレオ画像対における画素のリアルタイムマッチングのための装置及びプログラム

【課題】ステレオ画像対の対応の画素をリアルタイムで正確にマッチングする装置を提供する。
【解決手段】補正されたステレオ画像対の画素対をマッチングする装置は、レンジカメラ画像内の画素をステレオカメラシステムの左右の画像中の画素にマッピングし、レンジカメラ画像内の画素の画素値をしきい値と比較するための前景/背景マッピングモジュール146と、前景/背景マッピングモジュール146に応答して、比較手段の比較結果により、第1の画像内の画素に対応する第2の画像内の画素について、第1のディスパリティ探索又は第2のディスパリティ探索を選択的に行うためのディスパリティ探索モジュール148とを含む。

【発明の詳細な説明】
【技術分野】
【0001】
この発明はステレオ画像のリアルタイムディスパリティ推定のための装置及びコンピュータプログラムに関し、特に、2D/3D頭部姿勢検出、認識、3Dゲーム開発、アニメーション、放送及び通信のための、ステレオ画像対のリアルタイムの、フレームごとの画素のマッチングのための装置及びプログラムに関する。
【背景技術】
【0002】
メディア放送コンテンツにおいて、本物らしい感じを達成するために、送信及び音声―映像マルチメディア技術が速いペースで進展している。視聴者に本物らしさを感じさせるためには、視聴者に対し、超現実的な音声及び映像コンテンツを配信しなければならない。この発明では、3次元(3D)視覚コンテンツ獲得に焦点を当てる。
【0003】
長年にわたって、周知の赤/緑立体視眼鏡に基づく表示、容積表示(非特許文献1)、自動立体視表示(非特許文献2、3)等の様々な種類の3D表示技術が開発されてきた。赤/緑立体視眼鏡に基づく表示は2つのカメラからの入力を必要とするが、処理はほとんど不要である。ただし視聴者は特別な眼鏡をかけなければならない。自動立体視3D表示では特別な眼鏡は必要ないが、コンテンツは3Dでキャプチャし3Dで配信しなければならない。自然なシーンの3Dによるコンテンツの獲得で、既存のテレビジョン放送の品質に達するには、依然としてかなりの困難がある。
【0004】
従来の2Dテレビジョンと対照的に、自動立体視3Dテレビジョンはあるシーンの視覚的外観だけでなく、そのシーンの密度の濃い深度マップ情報を必要とする。このため、主に2つの科学的課題がある。すなわち、シーンの視覚的外観と深度マップとをリアルタイムで獲得することと、結果として得られる3Dテレビジョン上の3D外観が、そのシーンの元の視覚的外観とマッチしていなければならない(本物らしさ)ということと、である。
【0005】
これまで、3Dのシーンキャプチャに多くの技術が提案されてきた。極端なものの一つでは、従来の較正済立体視カメラを用いた画像ベースのアプローチによって、深度マップを推定している。別の極端な例では、赤外光の飛行時間(Time−of−flight:TOF)を用いた光学ベースのカメラを用いて深度を獲得している。
【0006】
TOF3Dカメラは正弦波変調された赤外光信号を射出する(非特許文献4)。光が測定システムを出て対象物に至り、システムに戻るまでの移動に必要な時間が測定され、画像中の各画素の深度が計算される。達成可能な最良の距離精度は、深度距離によるが数センチメートルのオーダであって、動作範囲の制限があり、範囲外の測定値は信頼性が低い。このため、TDFカメラによる獲得アプローチは3Dテレビジョン放送には向いていない。
【0007】
従来の、較正済立体視に基づくアプローチ(非特許文献5、6)は、画像処理アルゴリズム、すなわちテンプレートマッチングを用いて、左右のカメラ画像からのシーンの深度マップを計算する。これはカメラを較正して、内部及び外部のカメラパラメータを推定することを必要とする。深度マップ推定処理は、同期キャプチャ、較正パラメータを用いた補正、及び左右のカメラ画像の画素間のディスパリティ推定のためのテンプレートマッチングを含む。テンプレートマッチングアルゴリズムは通常、正規化相互相関ベースの類似尺度を用いる。
【非特許文献1】B.ブランデル及びA.J.シュワルツ、「容積表示システムの分類:画像空間の特性及び予測可能性」IEEE視覚化及びコンピュータグラフィックトランザクション、第8巻、第1号、66−76ページ、2002年(B. Blundell and A.J. Schwarz, "The classification of volumetric display systems: Characteristics and predictability of the image space," IEEE Transactions on Visualization and Computer Graphics, vol. 8, no. 1, pp. 66-76, 2002.)
【非特許文献2】フィリップスリサーチ、「マルチビュー自動立体視表示」、[online]、平成19年12月3日検索、インターネット<URL:http://www.research.philips.com/technologies/display/ov_3ddisp.html>(Philips Research, "Multi-view autostereoscopic displays," in http://www.research.philips.com/technologies /display/ov_3ddisp.html)
【非特許文献3】R.ボルナー、B.ダックスタイン、O.マチウ、R.ラダー、T.シニング及びT.シコラ、「頭部トラッキング能力を備えた単一ユーザの自動立体視表示のファミリー」IEEEビデオ技術のための回路及びシステムトランザクション、第10巻、第2号、234−243ページ、2000年(R. Borner, B. Duckstein, O. Machui, R. Rder, T. Sinning, and T. Sikora, "A family of single-user autostereoscopic displays with head-tracking capabilities," IEEE Transactions on Circuits and Systems for Video Technology, vol. 10, no. 2, pp. 234-243, 2000.)
【非特許文献4】B.ブットゲン、T.オジヤ、及びM.レーマン、「レンジ画像化のためのCcd/cmosロックイン画素:課題、限界と現状」レンジ画像化研究第1日、予稿集、21−23ページ、インゲンサンド/カールマン(編)、チューリッヒ、2005年(B. Buttgen, T. Oggier, and M. Lehmann, "Ccd/cmos lock-in pixel for range imaging: challenges, limitations and state-of-the-art," in Proceedings of 1st range imaging research day, pp.21-32, Ingensand/Kahlmann (eds.), Zurich, 2005.)
【非特許文献5】K.コーノリヒ、「スモールビジョンシステム:ハードウェア及び実現」ロボティクス研究に関する第8回国際シンポジウム、ハヤマ、日本、1997年(K. Konolige, "Small vision systems: Hardware and implementation," in Eighth International Symposium on Robotics Research, Hayama, Japan, 1997.)
【非特許文献6】C.サン、「矩形サブ領域化及び3d最大面積技術を用いた高速ステレオマッチング」コンピュータビジョン国際ジャーナル、第47巻、第1/2/3巻、99−117ページ、2002年(C. Sun, "Fast stereo matching using rectangular sub-regioning and 3d maximum-surface techniques," International Journal of Computer Vision, vol. 47, no. 1/2/3, pp. 99-117, 2002.)
【非特許文献7】G.R.グリメット及びD.R.スチルゼーカ、確率とランダム処理、第2版、クラレンドンプレス、オックスフォード。ISBN0−19−85366508、1992年(G.R. Grimmett and D.R. Stirzaker, Probability and Random Processes, 2nd Edition, Clarendon Press, Oxford. ISBN 0-19-853665-8, 1992.)
【非特許文献8】P.ヴィオラ及びM.ジョーンズ、「頑健なリアルタイムの物体検出」視覚モデリング、学習、計算及びサンプリングの統計及び計算理論に関する第2回国際ワークショップ、バンクーバー、カナダ、2001年(P. Viola and M. Jones, "Robust real-time object detection," in 2nd International Workshop on Statistical and Computational Theories of Vision-Modeling, Learning, Computing, and Sampling, Vancouver, Canada, 2001.)
【非特許文献9】R.J.シャルコフ、ディジタル画像処理及びコンピュータビジョン、ジョンワイリーアンドサンズ社、1989年(R.J. Schalkoff, Digital Image Processing and Computer Vision, John Wiley and Sons, Inc., 1989.)
【非特許文献10】T.オジヤ、R.カウフマン、M.レーマン、P.メツラー、G.ラング、M.シュバイツァー、M.リヒター、B.ブットゲン、N.ブランク、K.グリースバッハ、B.ウルマン、K−H.ステージマン及びC.エルマー、「小型化された光学レンジカメラでのリアルタイム3dイメージング」ニュルンベルグ光学会議、DE2004年( T Oggier, R. Kaufmann, M. Lehmann, P. Metzler, G. Lang, M. Schweizer, M. Richter, B. Bttgen, N. Blanc, K. Griesbach, B. Uhlmann, K.-H. Stegemann, and C. Ellmers, "3d-imaging in real-time with miniaturized optical range camera," in Opto Conference Nurnberg, DE., 2004.)
【発明の開示】
【発明が解決しようとする課題】
【0008】
しかし、従来のステレオベースの3D再構築アプローチは、多くの場合正確に3D情報を計算することができない。なぜなら、ステレオ画像中の画素の場所によっては、特に、ステレオディスパリティ探索アルゴリズムのための探索範囲が未知である場合は、対応のマッチングのための独自の情報を提供しないことがあるからである。さらに、テンプレートマッチングアルゴリズムは画像にノイズがある場合、しばしば、正確にディスパリティを計算することができない。
【0009】
従って、この発明の目的の1つは、ステレオ画像対の対応の画素をリアルタイムで正確にマッチングする装置を提供することである。
【0010】
この発明の別の目的は、ステレオ画像対の対応の画素をリアルタイムで正確かつ頑健にマッチングする装置を提供することである。
【0011】
この発明のさらに別の目的は、左画像のテンプレートを右画像の対応するブロックと正確にマッチングしてステレオ画像対の画素マッチングを向上させる装置を提供することである。
【課題を解決するための手段】
【0012】
この発明の第1の局面は、補正したステレオ画像対において、対応する画素対をマッチングするための装置に関する。この装置は、ステレオカメラ及びレンジカメラに接続され、それぞれ補正されたステレオ画像対とレンジカメラ画像とを受けることができる。ステレオ画像対は第1の画像と第2の画像とを含む。この装置は、前記レンジカメラ画像中の画素を前記第1の画像中の画素と前記第2の画像中の画素とにマッピングするための第1のマッピング手段と、前記レンジカメラ画像中の前記画素の強度をしきい値と比較するための比較手段と、前記比較手段に応答して、前記比較手段による比較結果に依存して第1のディスパリティ探索と第2のディスパリティ探索とを選択的に行なって、前記第2の画像中の画素であって前記第1の画像中の前記画素にマッチするものを探索する手段と、を含む。
【0013】
好ましくは、探索手段は、前記比較手段が、前記画素の前記強度が前記しきい値より高いと判定したことに応答する第1の探索手段と、前記比較手段が、前記画素の前記強度が前記しきい値以下であると判定したことに応答する第2の探索手段と、を含む。第1の探索手段の探索範囲は前記第2の探索手段の探索範囲より短い。
【0014】
さらに好ましくは、前記第1の探索手段は、前記比較手段が、前記画素の前記強度が前記しきい値より高いと判定したことに応答して、前記レンジカメラ画像の前記画素を前記第2の画像にマッピングするための第2のマッピング手段と、前記第2のマッピング手段によってマッピングされた前記第2の画像のエピポーラ線上の前記画素の両側に延在する第1の探索範囲を規定する、第1の探索範囲規定手段と、前記第1の画像中の前記画素を包含する予め定められたサイズの予め規定されたブロックと、前記第1の探索範囲内のそれぞれの画素を包含する前記第2の画像中の予め定められたサイズのブロックとの、予め定められた類似尺度を計算するための第1の類似度計算手段と、前記第2の画像中の前記ブロックのうち、最も高い類似尺度を有するものを選択するための第1のブロック選択手段と、前記第1のブロック選択手段によって選択された前記ブロックの中心の画素を、前記第1の画像の前記画素にマッチするものとして選択するための、第1の画素選択手段と、を含む。ここで、「包含する」とは、このブロックが予め定められた位置の画素、例えば、ブロックが矩形であるとすればブロックの中心の画素、を含むことを意味する。
【0015】
さらに好ましくは、前記第2の探索手段は、前記第1の探索範囲より長い第2の探索範囲を規定するための、第2の探索範囲規定手段を含み、前記第2の探索範囲は前記第2のマッピング手段によってマッピングされた前記第2の画像のエピポーラ線上の前記画素の一方側のみに延在し、前記第2の探索手段はさらに、前記第1の画像中の前記画素を包含する予め定められたサイズの予め規定されたブロックと、前記第2の探索範囲内のそれぞれの画素を包含する前記第2の画像中の予め定められたサイズのブロックとの、予め定められた類似尺度を計算するための第2の類似度計算手段と、前記第2の画像中の前記ブロックのうち、前記第2の類似手段によって計算された最も高い類似尺度を有するものを選択するための第2のブロック選択手段と、前記第2のブロック選択手段によって選択された前記ブロックの中心の画素を、前記第1の画像の前記画素にマッチするものとして選択するための、第2の画素選択手段と、を含む。
【0016】
前記第1の類似度計算手段は、前記第1の画像中の前記ブロックと前記第2の画像中の前記ブロックとの各々を、同じ形状の複数のサブブロックに分割するための手段と、前記第2の画像中の前記ブロックの各々と、前記第1の画像中の前記ブロックとの平均画素値を計算するための手段と、前記サブブロックの各々の画素の画素値から前記平均画素値を減算するための手段と、前記サブブロックの各々の画素の平均画素値を計算するための手段と、前記第1の画像のサブブロックの平均画素値と、前記第2の画像のブロックの各々のサブブロックのそれぞれの平均画素値との二乗誤差の合計を計算するための手段と、を含んでもよい。前記二乗誤差の合計が前記類似尺度である。
【0017】
この発明の第2の局面は、ステレオカメラ及びレンジカメラに接続されてそれぞれ補正されたステレオ画像対とレンジカメラ像とを受けることができるコンピュータで実行可能なコンピュータプログラムに関する。ステレオ画像対は第1の画像と第2の画像とを含む。前記コンピュータプログラムは、前記コンピュータ上で実行されると、コンピュータを、前記レンジカメラ画像中の画素を前記第1の画像中の画素にマッピングするための第1のマッピング手段と、前記レンジカメラ画像中の前記画素の画素値をしきい値と比較するための比較手段と、前記比較手段に応答して、前記比較手段による比較結果に依存して第1のディスパリティ探索と第2のディスパリティ探索とを選択的に行なって、前記第2の画像中の画素であって前記第1の画像中の前記画素にマッチするものを探索する手段と、として動作させる。
【発明を実施するための最良の形態】
【0018】
深度マップ推定アルゴリズム
ステレオカメラベースの深度マップ推定アルゴリズムはしばしば、補正及び探索メカニズムに依存する。図7はディスパリティ推定のための補正されたステレオ画像対テンプレート探索処理を表す。左カメラ画像240Lにおいて対象点250(x,y)を含む矩形のテンプレートウィンドウ252が、右カメラ画像240R内の、左カメラ画像240L中のエピポーラ線242Lと同じ高さにあるエピポーラ線242R上の同じサイズのブロック262と、二乗誤差又はゼロ平均正規化相関法等の様々な類似尺度を用いて比較される。類似尺度が最も高いブロックが、右カメラ画像240R中の画素260(x+u,y)を規定する。この画素260と左画像中の画素250とは、同じ対象点の画像であると考えられる。
【0019】
マッチングアルゴリズムは、左カメラ画像240L内の2DテンプレートウィンドウA252の、右カメラ画像240R内のサイズw×hの2DブロックB262に対する類似尺度を計算する必要がある。一般に、補正誤差とガウスノイズの存在下で、A及びBを以下のように表すことができる。
【0020】
【数1】

ここでθは、補正誤差による、ウィンドウデータAに対するウィンドウデータBの相対的回転である。γ及びΓはそれぞれ左及び右カメラの任意のスケール値(利得要素)を表す。X―(ここで―は式中文字の上に付されるものである)は平均値を表し、X〜(ここで〜は式中文字の上に付されるものである)はウィンドウデータの固有の形状又はテクスチャ特性を表すものである。N(μ,σ)は、平均μ及び分散σ≧0の時の任意のガウスノイズを表し、ここで画像とノイズデータとは独立である。すなわち、一般に、理想的な条件下では、ウィンドウデータの両方が同じ対象パッチに属し、θがゼロであり、ステレオ画像が完璧に補正されたときのみ、以下が成立する。
【0021】
【数2】

しかし、一般に、我々がアクセスできるのは式1及び式2のA及びBの観察のみであり、画像は、較正誤差、映像ノイズ、又はA〜及びB〜が独自の情報を担持していない場合に独自の固有形状特性がないことにより、画像を完璧にマッチングすることはできないであろう。映像ノイズは、レンズ焦点の違い、視野角の違い、及び左右のカメラ上での照明効果のむら等のために生ずる。
【0022】
TOFカメラ
この実施の形態では、失敗又はマッチングの間違いの数を減じるために、TOFカメラの3D測定値をオンザフライで左右のカメラ画像240L及び240Rの両方に逆投影することで、画像画素の3Dの場所を推定する。従って、ディスパリティアルゴリズムの探索範囲は各画素に制限される。制限アルゴリズムは後述する。
【0023】
TOFカメラは振幅変調された不可視赤外光を射出し、この光はシーンの対象物によって反射されてイメージセンサ上に後方散乱する。イメージセンサ上の各画素は入来する光信号を復調し、正弦波関数を回復して位相遅延を推定する。この場合、位相遅延は対象物のカメラへの距離に直接比例する(非特許文献7)。
【0024】
実務的観点からは、TOFカメラには様々な課題と制限がある。例えば、距離測定の標準偏差は変調周波数と逆比例の挙動をする(非特許文献4)。このため、正確な距離測定を目標とする場合は、高い変調周波数が好ましい。一方、一義的な測定範囲は変調周波数と逆比例する。例えば、変調周波数が20MHzの場合、一義的な測定範囲は7.5メートルである。このため、多義的な範囲(7.5メートル超)に属する測定値は不正確に推定される。
【0025】
射出された赤外光は逆二乗の法則に従うため、入来する画素値の振幅しきい値を設定すればノイズのある画素をフィルタ除去することができる。基本的に、これは、前景の対象物の範囲測定値は入手できるが、背景の対象物については入手できないと考えることができる。従って、この実施の形態では、この情報を、従来のステレオ再構築処理において前景及び背景領域のマスキングに利用する。
【0026】
レンジカメラからステレオカメラへのマッピング
TOFカメラからの一組の3D測定値とステレオ画像中のそれらに対応する画像点とが、レンジカメラからステレオカメラへのマッピングパラメータA=[aij]を与える。均質座標での各カメラに対する、レンジカメラからステレオカメラへのマッピング式は、以下の、周知のカメラ較正手順として書くことができる(非特許文献8)。
【0027】
【数3】

ここで[xはTOFカメラからの3D測定値であり、[xはその対応の画像点であり、wは非ゼロのファクタである。aが以下のようなベクトルの形のマッピングパラメータの組を表すものとする。
【0028】
a=[a11 12 13 14 21 22 23 24 31 32 33
34=1.0と設定することで、式3をスケーリングすることができ、いくつかの代数操作を行なうと、対応の3D−2D点の対の各々がaijパラメータにおいて線形である2つの式を与える。すなわち
【0029】
【数4】

上の式を以下のように定式化することができる。
【0030】
【数5】

こうして、3D−2Dの点の対1つから2つの式と11の未知数が与えられ、ここでQはその行が式3の形である2×11の行列であり、aは式4の未知のマッピングパラメータのベクトルである。式3中の2つの式は線形独立でなければならないので、ここから、同一平面上にないマッピング点の最小数がn=6であることがわかる。実際には、n>>6を選択してQ−R分解により式4を解く。上述の処理の結果、レンジカメラからステレオカメラへの2個のマッピング行列A及びAを、左右のステレオカメラそれぞれについてオフラインで得ることができる。図15はTOFカメラからステレオ画像へのマッピングの画面をキャプチャしたものであって、マッピングされた画素が左右のカメラ画像に重ねられている。
【0031】
ディスパリティ探索範囲を各画素対に限定できるよう、TOFカメラでキャプチャされた3Dレンジデータをオンザフライで左右のステレオ画像にマッピングしたい。いずれの3D−2D対についてもwi≠0なので、式3は次の形に書換えることができる。
【0032】
【数6】

ここで[xはTOFカメラからの画素の場所についての3D測定値であり、以下はそれぞれ、これに対応する左右のステレオカメラ画像の画像座標値である。
【0033】
【数7】

TOFカメラ自体に誤差があるので、右カメラ上で実際に対応する画素の場所は以下の通りとなり、ここでステレオカメラ画像は補正されており、δは前景対象物に対するあらたな探索範囲を表す定数(この実現例では8)である。
【0034】
【数8】

テンプレートマッチングのための正規化された相互相関類似尺度
立体視ディスパリティ探索アルゴリズム等の様々なパターンマッチングアルゴリズムにおいて、2個の画像ブロック間の類似度を測定するのに、相互相関値が利用される。これは、第2のカメラ画像内の一組のブロックを、一つづつ第1のカメラ画像からの既知のものと比較することによって、その一組のブロックのうちからマッチするものを見出すのに慣用される。ブロックのD.C.値は形状情報を担持していないので、式1及び式2から各ブロックの平均を除去する。これによって以下が得られる。
【0035】
【数9】

式6及び式7の個々の分散はウィンドウデータ及びノイズデータの分散の和に等しい。というのも、画像データ(あるシーンの視覚的外観)と画像ノイズとは独立だからである。したがって、分散は以下のように表すことができる。
【0036】
【数10】

そうでなければ、A〜とB〜とはなんら独自の形状情報を担持しない。式6と式7との正規化相互相関式は次のように書くことができる。
【0037】
【数11】

ここでuは第2の画像のエピポーラ線上の場所(x+u)に対応するウィンドウAの前もって仮定された変位値であり、θは一般に、画像が補正されている場合は0であると仮定される。従って、以下の式ではパラメータθを無視することができる。
【0038】
式10をよりよく分析するために、式6−7及び式8−9を式10に代入し、これを拡張すると、以下のようになる。
【0039】
【数12】

ここでN(0,σ)(x,y)は、N(0,σ)分布からくる画素の場所(x,y)でのノイズデータを表す。
【0040】
明らかに、画像中にノイズがあるときには式11が与える類似尺度の信頼性は低くなる。従って、間違ったマッチングを減じるために、パターンマッチングの課題においては類似尺度からノイズ効果を除去しなければならない。
【0041】
テンプレートマッチングのためのmノイズに対し頑健な新規な類似尺度
以下では、テンプレートマッチング課題のための、新たな、ノイズに対し頑健な類似尺度(noise robust similarity measure:NRSM)アルゴリズムを説明する。式6及び式7のブロックデータA^及びB^(ここで^の符号は式中文字の上に付されるものである)をサブブロックに分割する。これは図13に示すとおりであり、以下で表される。
【0042】
【数13】

なぜなら、これらブロックの強度値は平均からの偏差だからである。各サブブロックを次の式に従ってシーンとノイズとに分解することができる。
【0043】
【数14】

新たな係数の組を以下のように規定することによって、上述のノイズ項を除去する。
【0044】
【数15】

これによって次の式が得られる。
【0045】
a=[a,a,...,a],(15)
b=[b,b,...,b],(16)
式6及び式7では、ノイズ項N(0,σ)は独立かつ同一に配分された(independent and identically distributed:i.i.d)ランダム変数から来る。従って、大数の法則により、avg(A^k-noise)→0が成立つ。一方で、以下のシーン項avg(A^k-scene)はシーンパターンからくるもので、その形状特性により、必ずしもゼロに近似しなくてもよいが、テンプレートとの独自のマッチングのためには、少なくとも1個のサブブロックが非ゼロの平均値を生成する必要がある。そうでなければ、形状情報が入手できないと考えられる。
【0046】
上述の処理のために、アルゴリズムは、ブロックサイズに依存せず非常に高速で輪を算出するための、「統合画像」(非特許文献9)と呼ばれる入力画像の中間表現を計算する。簡潔に言えば、統合画像は、画像の各画素について、その画素を包含する任意サイズの矩形内の画素値を合計し、その結果得られる和をその画素に割当てることによって得られる。
【0047】
さて、aとbとはノイズの影響から解放されたが、左右のカメラスケールファクタ、それぞれγ及びΓからは解放されていない。スケールファクタを除去するために、新たな組の正規化記述子を以下のように規定することとする。
【0048】
【数16】

ここでa>0,b>0であり、かつ1≦k≦Nである。最大の絶対値係数、a及びbを正規化のために選択することで、(もし残っていても)正規化記述子上のノイズ効果をさらに低減することができる。その後、差分平方和(sum of squared differences method)の方法を用いて、以下のように正規化記述子の組を比較する。
【0049】
【数17】

正規化相互相関ベースの類似尺度アルゴリズムが生成する結果は、ノイズがある場合には信頼性が低くなることを、数学的に示した。他方で、提案されたNRSMアルゴリズムは、画像のノイズ効果を低減又は除去する。予備的な実験結果は、理論が実践と一致することを示した。
【0050】
システム設定
[構造]
上述の通り、この実施の形態では、リアルタイムのディスパリティデータ獲得のために、TOFカメラによって性能を高めた立体視ベースのディスパリティ探索アルゴリズムを利用する。この実施の形態は、観察されるTOFカメラ画像内の各画素の3D場所情報を利用して、ディスパリティアルゴリズムの探索ドメインを制限し、ディスパリティ探索範囲を選択する。
【0051】
図1はこの実施の形態のディスパリティ推定システム40の全体構造を示す図である。図1を参照して、ディスパリティ推定システム40は、ステレオカメラ60とTOFカメラ62とを含むカメラアセンブリ52と、3Dモニタ54と、通常のモニタ74と、ステレオカメラ60からのステレオ画像ストリームと、TOFカメラ62からのTOF画像ストリームとから、左右のカメラ画像の画素対の各々のディスパリティを計算するリアルタイムディスパリティ計算装置50と、を含む。3Dモニタ54は2Dから3Dへの変換が可能である。すなわち、2D画像のストリームと対応するディスパリティ画像のストリームとを与えられると、3Dモニタ54は与えられた画像に基づいて右画像を計算する。3Dモニタ54の表示スクリーン上には傾斜レンチキュラーレンズが配置され、3Dモニタ54は、レンチキュラーレンズが異なる画素からの光を予め規定された方向に焦点合わせして、見る人にある絵の異なる側を見せるように、左右の画像を交互に表示する。
【0052】
図2は、コンピュータで実現されたこの実施の形態のリアルタイムディスパリティ計算装置50のハードウェアブロック図である。図2を参照して、ディスパリティ計算装置50は、3Dモニタ54及びモニタ74に加えて、コンピュータ70と、マウス82と、キーボード80と、を含む。マウス82と、キーボード80と、モニタ54及び74とは、全てコンピュータ70に接続される。
【0053】
さらに図2を参照して、コンピュータ70は、中央処理装置(central processing unit:CPU)90と、CPU90に接続された双方向データ及びアドレスバス92と、バス92に接続された読出専用メモリ(Read Only Memory:ROM)94と、バス92に接続されたランダムアクセスメモリ(Random Access Memory:RAM)96と、バス92に接続されたハードディスクドライブ98と、バス92に接続されDVDメディア108を駆動するためのディジタル多用途ディスク(Digital Versatile Disk:DVD)ドライブ128と、バス92に接続され、ステレオカメラ60からのステレオ画像ストリームを受け、さらにTOFカメラ62からのTOF画像ストリームを受けるためのビデオキャプチャボード102と、バス92に接続され、半導体メモリ110を駆動するための半導体メモリドライブ106と、バス92、3Dモニタ54及びモニタ74に接続されたグラフィック処理ユニット(Graphic Processing Unit:GPU)104と、を含む。コンピュータ70のこれらの構成要素は全てバス92に接続され、相互にアクセス可能である。
【0054】
別の局面では、リアルタイムディスパリティ計算装置50の機能はコンピュータ70上で実行されるソフトウェアで実現される。図3はリアルタイムディスパリティ計算装置50の機能ブロック図である。
【0055】
図3を参照して、機能的には、リアルタイムディスパリティ計算装置50は、TOFカメラ62の予備較正の間にTOFカメラ62からの画像を記憶するための較正フレームメモリ138と、ステレオカメラ60を較正し、ステレオカメラ60の較正パラメータを出力するための較正ソフトウェア130と、較正ソフトウェア130によって出力された較正パラメータを記憶するための較正パラメータメモリ132と、較正パラメータメモリ132に記憶された較正パラメータを利用して、ステレオカメラ60からのステレオ画像対を補正するための補正ソフトウェア134と、補正ソフトウェア134によって出力される左右の画像を記憶するためのフレームメモリ136と、を含む。較正の間、較正ソフトウェア130はフレームメモリ136に記憶された、補正ソフトウェア134によって補正されていない画像を読出し、ステレオカメラ60の較正パラメータを計算する。
【0056】
リアルタイムディスパリティ計算装置50はさらに、前景対象物の、較正フレームメモリ138に記憶されたTOFカメラ測定値を、補正ソフトウェア134によって補正されフレームメモリ136に記憶された左右の画像にマッピングするためのマッピング行列を計算する予備較正ソフトウェア140と、予備較正ソフトウェア140によって計算されたマッピング行列のパラメータを記憶するTOFマッピングパラメータメモリ142と、較正フレームメモリ138内のTOF画像の各画素について、TOFマッピングパラメータメモリ142に記憶されたマッピング行列によって、左右の画像内の対応の2D画素の場所を計算し、選択されたTOF画素の画素値が予め定められた画素値のしきい値より高ければハイレベルとなりそうでなければローレベルとなる前景/背景(foreground/background:F/G)信号176を出力するための、前景/背景マッピングモジュール146と、前景/背景マッピングモジュール146で用いられる画素値のしきい値を記憶するためのしきい値記憶部144と、を含む。
【0057】
上述のとおり、TOFカメラ62から射出された赤外光は逆二乗の法則に従う。従って、入来するしきい値を設定することで、背景の(TOFカメラ62から遠い)ノイズを含んだ画素をフィルタ除去することができる。
【0058】
リアルタイムディスパリティ計算装置50はさらに、F/G信号176とフレームメモリ136に記憶された画像とを受けるように接続され、右カメラ画像中の画素で左カメラ画像の各画素に対応するものを探索し、左右の画素の画素間のディスパリティを計算するためのディスパリティ探索モジュール148と、ディスパリティ探索モジュール148によって計算されたディスパリティを、左カメラ画像の画素に対応するアドレスに記憶するためのディスパリティメモリ150と、較正フレームメモリ138、フレームメモリ136に記憶された画像、若しくはディスパリティメモリ150に記憶されたディスパリティ画像、又はこれら画像の任意の組合せを、3Dモニタ54及びモニタ74に選択的に出力するためのグラフィック出力ユニット152とを含む。左カメラの2D画像とその対応のディスパリティ画像とのストリームが与えられると、3Dモニタ54は2D画像とディスパリティ画像とを3D画像のストリームに変換し、これを表示する。
【0059】
リアルタイムディスパリティ計算装置50はさらに、リアルタイムディスパリティ計算装置50内のモジュールの動作全体を制御するコントローラ122を含む。予備較正ソフトウェア140、較正ソフトウェア130、補正ソフトウェア134、前景/背景マッピングモジュール146、ディスパリティ探索モジュール148及びコントローラ122の機能は全て、コンピュータ70上で実行されるソフトウェアで実現される。図3には示さないが、これら構成要素のソフトウェア及びモジュールはコントローラ122と通信し、動作においてモニタ74上の好適なGUIを利用する。グラフィック出力ユニット152の機能はCPU90及びCPU104で実行されるソフトウェアの組合せで実現される。
【0060】
この実施の形態では、較正ソフトウェア130はオフラインで用いられてステレオカメラ60の較正パラメータA及びAを計算する。較正は、半径方向の歪、レンズの偏心、焦点距離、画素のアスペクト比、ベースライン、並びにカメラ60L及びカメラ60Rの各々の配向を修正するために行なわれる。較正パラメータは較正パラメータメモリ132に記憶される。この実施の形態の較正処理では、ユーザは予め規定されたパターンをステレオカメラ60に提示する。較正ソフトウェア130はステレオカメラ60の出力を利用してパラメータを計算する。較正のためのソフトウェアは商業的に入手可能である。例えば、SRIインターナショナルが頒布するスモールビジョンシステム(Small Vision SystemTM:SVSTM)ソフトウェアを利用することができる。
【0061】
補正ソフトウェア134はステレオカメラ60の出力ステレオ画像を補正するのに用いられる。ここで補正とは、ステレオカメラ60からの左右の画像の対応するエピポーラ線をそろえることである。この処理を図6に示す。
【0062】
図6を参照して、ステレオカメラ60の左右の画像230L及び230Rが線232Lと対応の線232Rとをそれぞれ含むと仮定する。レンズのディストーションとレンズ配向の差のために、左右の画像では、視差を別にしても、同じ線の画像が異なる位置で異なる形状となる。
【0063】
画像を補正することにより、対応の線232Lと232Rとが画像の行と整列し、較正された左右のカメラ像240L及び240Rのエピポーラ線242L及び242Rとなる。補正なしでは、リアルタイムのディスパリティ探索はほとんど不可能である。補正は所定の計算によって実行される。この計算では、較正パラメータメモリ132に記憶された較正パラメータが用いられる。補正ソフトウェアも商業的に入手可能である。
【0064】
通常の動作では、ステレオカメラ60からの画像が補正ソフトウェア134で補正され、フレームメモリ136に記憶される。
【0065】
予備較正ソフトウェア140はTOFカメラ62からの画像とステレオカメラ60の補正された画像との予備較正のためにオフラインで用いられる。この処理は図11及び図12を参照して説明する。
【0066】
TOFカメラ62からステレオ画像へのマッピング行列を推定するために、グラフィカルユーザインターフェイスが実現される。ユーザは図11に示す予め規定されたパターン340をTOFカメラ62及びステレオカメラ60に提示する。パターン340の面には複数個のマーカ344A、344B、344C、334D及び344Eがある。図12(A)を参照して、TOFカメラ62上のパターン340の画像360が最初にモニタ74に表示される。ユーザはポインタ370をマーカのうち一つにあて、マウスボタンをクリックする。クリックされた位置のx−y座標がメモリに記憶される。次に、左カメラ画像中のパターン340の画像362Lがモニタ74上に表示され、図12(B)に示すように、ユーザはポインタ370を同じマーカにあて、マウスボタンをクリックする。クリックされた位置のx−y座標がメモリに記憶される。同様に、図12(C)に示すように、右カメラ画像のパターン340の画像362Rについても同じポイント―クリック動作が行なわれ、x−y座標値がメモリに記憶される。
【0067】
こうして、グラフィカルユーザインタフェィスによってユーザはオフラインでn個(n>>6)の対象画像点の三つ組を選択することができ、Q−R分解により式4が解かれる。この結果、左右のステレオカメラについて2個のマッピング行列AとAとがそれぞれ得られる。行列Aは、TOFカメラ画像中の画素を、左カメラ画像の対応の画素にマッピングするのに用いられる。行列Aは、画素を右カメラ画像の対応の画素にマッピングするのに用いられる。AとAとを規定するパラメータはTOFマッピングパラメータメモリ142に記憶される。
【0068】
ビデオキャプチャの間に、前景対象物のTOFカメラ測定値がステレオ画像にマッピングされ、ステレオディスパリティアルゴリズムの探索範囲をオンザフライで制限する。
【0069】
図4は前景/背景マッピングモジュール146の全体構造を示す。図4を参照して、前景/背景マッピングモジュール146は、TOFカメラ画像の左上から右下へ向かう順に画素を選択する画素選択部170と、画素選択部170の出力を受けるように接続され、画素選択部170によって選択され較正フレームメモリ138に記憶されたTOFカメラ62の画像中の画素からの画素値(強度)を読出すための画素読出部172と、TOFマッピングパラメータメモリ142に記憶されたパラメータを用いて、マッピング行列Aをx及びyにそれぞれ適用することによって、選択された画素のx−y座標値を左カメラ画像内の座標値x及びyにそれぞれマッピングするための左マッピング部174と、マッピング行列Aをx及びyにそれぞれ適用することによって、選択された画素のx−y座標値を右カメラ画像内の座標値x及びyにそれぞれマッピングするための右マッピング部178と、画素読出部172からの選択された画素の画素値としきい値記憶部144からのしきい値強度とを受けるように接続され、F/G信号176を出力するための、比較器180とを含む。上述の通り、F/G信号176は画素選択部170によって選択された画素の強度がしきい値より高ければハイレベルとなり、そうでなければローレベルとなる。
【0070】
図5は、図3に示したディスパリティ探索モジュール148の全体構造を示す。図5を参照して、ディスパリティ探索モジュール148は、前景/背景マッピングモジュール146からのx及びyを受けるように接続され、フレームメモリ136に記憶された左画像の(x,y)の画素を読出すための左ブロック読出モジュール200と、F/G信号176を受けるように接続され、左ブロック読出モジュール200の出力に接続された入力と、2つの出力202a及び202bとを有し、左ブロック読出モジュール200から受けた画素値をF/G信号176のレベルに依存して出力202a又は202bのいずれかに選択的に出力するための選択部202と、入力が選択部202の出力202aに接続され、右カメラ画像中の画素であって左ブロック読出モジュール200から読出された左画素に対応するものを、前景ディスパリティ探索アルゴリズムを利用して探索し、左右の画素間のディスパリティ値を出力するための前景ディスパリティ探索モジュール208と、右カメラ画像中の画素であって左ブロック読出モジュール200から読出された左画素に対応するものを、背景ディスパリティ探索アルゴリズムを利用して探索し、左右の画素間のディスパリティ値を出力するための背景ディスパリティ探索モジュール210と、F/G信号のレベルに依存して、前景ディスパリティ探索モジュール208及び背景ディスパリティ探索モジュール210の出力の一方を選択する選択部212と、を含む。選択部212の出力はディスパリティメモリ150のデータ入力ポートに接続される。
【0071】
ディスパリティ探索モジュールはさらに、前景ディスパリティ探索アルゴリズムにおいてディスパリティの探索に用いられる間隔の長さを記憶する前景間隔メモリ204と、背景ディスパリティ探索アルゴリズムにおいてディスパリティの探索に用いられる間隔の長さを記憶する背景間隔メモリ206と、選択部212によって選択されたディスパリティ値がディスパリティメモリ150のそれぞれの左画素アドレスに記憶されるように、図3に示すディスパリティメモリ150を制御するためのディスパリティメモリ制御部214と、を含む。ある画素のディスパリティの計算が完了すると、前景ディスパリティ探索モジュール208又は背景ディスパリティ探索モジュール210のいずれかが探索終了を示す信号を出力し、これは選択部212によって選択され、前景/背景マッピングモジュール146の画素選択部170に与えられ、こうして画素選択部170は次の画素を選択する。
【0072】
再び図7を参照して、ディスパリティ探索アルゴリズムは一般に、以下のステップを含む。すなわち、左カメラ画像240L内の画素250(x,y)を選択するステップと、左カメラ画像240L内で対象の画素250(x,y)を含む矩形テンプレートウィンドウ250を規定するステップと、右カメラ画像240R内で(x+u,y)の画素260を選択するステップと、上述の類似度尺度を用いて、右カメラ画像240R内のエピポーラ線242R上のその中心に画素260を含む、同じサイズのブロック262と矩形テンプレートウィンドウ252とを比較するステップと、予め定められた間隔内で値uを変化させて矩形テンプレートウィンドウ252と同じサイズのブロック262との類似尺度を計算するステップと、画素260が予め定められた間隔内で最も左の位置から最も右の位置まで移動するまで、変化させつつ計算するステップを繰返すステップと、右カメラ画像240R中で最も高い類似尺度を有するブロックを選択するステップと、選択されたブロック中の画素260を画素250に対応する画素として選択するステップと、を含む。
【0073】
図8を参照して、左カメラ画像240L内の画素250Lと、右カメラ画像240R内の対応の画素250Rとの距離が、ディスパリティDを規定する。
【0074】
対象物が前景にある場合、その左右カメラ画像間のディスパリティは背景にある対称物のそれよりも大きくなるはずである。従って、探索の間隔を長くしなければならない。探索間隔が長くなると、探索に必要な時間も長くなり、リアルタイムでのディスパリティ探索が困難になる。
【0075】
しかし、この実施の形態のディスパリティ推定システム40でディスパリティの計算に必要とされる時間はかなり短い。これは、ディスパリティ推定システム40がTOFカメラ62を用いるからである。図9(A)及び図9(B)を参照して、TOFカメラ画像中の画素が、左マッピング行列Aによって選択され左カメラ画像240内の画素250にマッピングされる。TOFカメラ画像中の選択された画素の画素値に基づいて、画素が前景の対象物に属するか否かが判定される。
【0076】
画素が前景の対象物に属する場合、右カメラ画像240Rの対応の画素260Rの座標値がマッピング行列Aを用いて推定される。推定された画素260Rを包含するように、探索間隔270が規定される。一般に、画素250Lと260Rとのx座標値は互いに異なる。これらは図9(A)において距離D及びDとしてそれぞれ示される。この実施の形態では、探索間隔270は推定された画素260Rが探索間隔270の中央にくるように選択される。表現を変えれば、もし画素250Lのx軸座標がxなら、右カメラ画像240R中の対応の画素は[x−δ,x+δ]の間隔内で探索され、ここでδは定数(この実現例では8)であり、xは行列ARによってマッピングされた画素のx座標である。
【0077】
画素が背景にある対象物に属する場合、右カメラ画像240R中で、対象の画素250Lと同じ位置にある画素260Rが選択される。この場合探索間隔272は、画素260Rの右側の間隔272として規定される。表現を変えれば、xが左カメラ画像のx軸座標値であれば、右カメラの実際の対応の画素の場所が[x,x+L]の間隔で探索されればよく、ここでステレオカメラ画像は補正され、Lは背景対象物の探索範囲を表す定数(この実現例では40)である。
【0078】
TOFカメラ画像の画素をステレオ画像にマッピングするマッピング行列のために、左右の画像中の対応の画素がおおよそわかっているので、探索範囲は制限される。さらに、画素が前景の対象物に属するか否かがわかっているので、前景又は背景の対象物の画素に好適な探索アルゴリズムを選択することもできる。アルゴリズムの各々について、好ましい探索範囲が予め規定されている。特に、背景画素のための探索間隔は前景画素のものに比べてかなり制限されるので、計算コストは低く、間違ったマッチングが生じる可能性はかなり低い。従って、ディスパリティを計算するにあたって(もしあれば)誤差を訂正することができる。
【0079】
3DでのX,Y座標値がディスパリティ探索範囲になんの影響も持たないことに注意されたい。影響があるのはZ座標のみである。Z座標値はTOFカメラ62によって大まかに測定され、探索範囲を規定するのに用いられる。
【0080】
予備較正アルゴリズム
図10は図3に示した予備較正ソフトウェア140を実現するコンピュータプログラムのフロー図である。図10を参照して、プログラムはステップ300で開始し、ここで変数iがゼロに設定される。変数iはTOFカメラ62の予備較正のためにユーザによって選択された点の数を示す。
【0081】
プログラムはステップ300に続いてステップ302を含む。ここで変数iが定数MAXより大きいか否かが判定され、その判定に応じて、制御フローが2つの方向に分岐する。定数MAXは予備較正に用いられる点(画素)の数であり、予め定められる。明細書の他の箇所で言及したように、MAXは>>6でなければならない。
【0082】
プログラムはさらに以下のステップを含む。ステップ302での判定がNOである場合に実行され、TOFカメラ画像内でユーザによって選択された画素の座標(xoi,yoi,zoi)を検出するステップ304と、RAM96内の記憶領域Range[i]に座標(xoi,yoi,zoi)を記憶するステップ306と、左カメラ画像中でユーザによって選択された画素の座標(xLi,yLi)を検出するステップ308と、RAM96内の記憶領域Left[i]に座標(xLi,yLi)を記憶するステップ310と、右カメラ画像内でユーザによって選択された画素の座標値(xRi,yRi)を検出するステップ312と、RAM96内の記憶領域Right[i]に座標(xRi,yRi)を記憶するステップ314と、変数iを1だけ増分するステップ316とを含む。ステップ316の後、制御フローはステップ302に戻る。
【0083】
プログラムはさらに、ステップ302の判定がYESであるときに実行され、TOFカメラ画像の画素を左右のカメラ画像にそれぞれマッピングするマッピング行列A及びAを計算するステップ318と、ステップ318に続いて、図2に示すRAM96内のTOFマッピングパラメータメモリ142内にマッピング行列A及びAのパラメータを記憶するステップ320とを含む。ステップ318で、行列A及びAが、式4をQ−R分解を利用して解くことによって計算される。
【0084】
ディスパリティ探索アルゴリズム
図14は図3に示すディスパリティ探索モジュール148を実現するソフトウェアのフロー図である。図14を参照して、プログラムは、全てのTOF画素について、TOF画素を左カメラ画像の画素にマッピングするステップ400と、TOF画素が前景にあるか否かを判定し、制御フローの2方向への分岐を引起すステップ401と、ステップ401での判定がNOの場合に実行され、通常の背景探索を行なうステップ402と、ステップ401での判定がYESの場合に実行されTOF画素に対応する右カメラ画像の場所を推定するステップ404と、ステップ404に続いて、左カメラ画像の画素に対応する画素を右カメラ画像中で探索する制限された前景探索を行なうステップ406と、を繰返し行なう。
【0085】
ステップ401は比較器180(図4を参照)のソフトウェア実現例であり、強度がしきい値より大きければ、画素は前景に属するものと判定され、そうでなければ、背景に属するものと判定される。
【0086】
通常の背景探索では、図9(B)を参照して説明した探索方法が行なわれる。制限された背景探索では、図9(A)を参照して説明した探索方法が行なわれる。制限された探索は計算コストを大幅に削減するので、アルゴリズムは左右のカメラ画像間のディスパリティをリアルタイムで見出すことができる。
【0087】
[動作]
図1から図14を参照して、上述のディスパリティ推定システム40は以下のように動作する。図1を参照して、ステレオカメラ60の較正が最初にオフラインで行なわれる。較正プロセスでは、予め定められたパターンプレートがステレオカメラ60に提示される。較正ソフトウェア130は較正パラメータを計算する。パラメータは較正パラメータメモリ132に記憶される。
【0088】
次に、TOFカメラ6が予備較正ソフトウェア140によってオフラインで較正される。予備較正プロセスでは、予め定められたパターン340がステレオカメラ60及びTOFカメラ62に提示される。予備較正プロセスでは、ステレオ画像は補正ソフトウェア134によって補正され、フレームメモリ136に記憶される。図10に示すように、予備較正ソフトウェア140はTOFカメラ画像と補正されたステレオ画像とを、較正フレームメモリ138とフレームメモリ136とから、それぞれ読出す。3つ組の画像(TOFカメラ画像と左右の画像)が3Dモニタ54に順に示され、ユーザはGUIによってこれら画像の対応の画素を繰返し選択する。パターン340を移動させ選択プロセスを繰返すことによって、式(4)を解くに足る充分な数の画素(>>6)が収集される。式4をQ−R分解を用いて解くことによってマッピング行列A及びAが得られる。マッピング行列はTOFマッピングパラメータメモリ142に記憶される。
【0089】
ステレオカメラ60の較正とTOFカメラ62の予備較正が完了すると、ディスパリティ推定システム40は3Dシーンをキャプチャしてディスパリティメモリ150にディスパリティ画像のストリームを生成する準備が整ったことになる。
【0090】
動作において、ディスパリティ推定システム40はステレオカメラ60からのステレオ画像のストリームを獲得する。キャプチャされた画像は較正パラメータメモリ132に記憶された較正パラメータを用いて補正ソフトウェア134によって補正され、エピポーラ線が画像の行に対応するようになる。補正された画像はフレームメモリ136に記憶される。同時に、ディスパリティ推定システム40はTOFカメラ62からTOF画像のストリームを獲得する。
【0091】
TOFカメラ画像の各フレームの各画素について、前景/背景マッピングモジュール146が画素を左カメラ画像にマッピングする。その後、モジュール146はTOFカメラ画像の画素の強度を調べ、画素が前景の対象物に属するか、背景に属するかを判定する。もし画素が前景にあれば、モジュール146はハイレベルのF/G信号176をディスパリティ探索モジュール148に送る。そうでなければ、モジュール146はローレベルのF/G信号176をディスパリティ探索モジュール148に送る。
【0092】
ハイレベルのF/G信号176に応答して、ディスパリティ探索モジュール148はTOFカメラ画像内の興味ある画素を右カメラ画像にマッピングすることによって右カメラ画像の画素を推定する。その後、ディスパリティ探索モジュール148は、制限された探索範囲で前景探索アルゴリズムを利用して、左右のカメラ画像のディスパリティを判定する。
【0093】
ローレベルのF/G信号176に応答して、ディスパリティ探索モジュール148は左画素と同じx−y座標値を有する右カメラ画像中の画素の場所とつきとめ、より長い探索範囲で背景ディスパリティ探索アルゴリズムを利用して、ディスパリティを判定する。対応の画素の探索が終了すると、ディスパリティが計算され、ディスパリティ探索モジュール148は、TOF画像の次の画素を選択するよう、前景/背景マッピングモジュール146に信号を送る。各画素について、ディスパリティ探索モジュール148はディスパリティを、ディスパリティメモリ150の左カメラ画像のその画素のアドレスに書込む。
【0094】
ディスパリティ画像が完成すると、グラフィック出力ユニット152はフレームメモリ136に記憶された左カメラ画像とディスパリティメモリ150に記憶されたディスパリティ画像とを選択し、これらを3Dモニタ54に与える。同時に、グラフィック出力ユニット152はTOF画像、ステレオ画像及びディスパリティ画像のいずれかの組合せをコントローラ122の指示に従って選択し、これをモニタ74に与える。
【0095】
3Dモニタ54は左カメラ画像と対応するディスパリティ画像とに基づいてステレオ表示を生成する能力を有するので、ユーザは3Dモニタ54上に3D画像を見ることができる。
【0096】
[実験的セットアップ]
VidereTMステレオビジョンハードウェアとSVSソフトウェアがこの実現に利用される。カメラのキャリブレーション及び補正はSVSライブラリを用いて自動的に行なわれる。SVSソフトウェアはステレオビデオシーケンスをキャプチャすることができ、ステレオ対の3Dデータを320×240の全画像解像度で30Hzで再構築する。しかし、3Dの再構築にとって興味ある領域(region of interest:ROI)はこの実験においてユーザの顔区域であるので、ディスパリティ探索区域を、上述の説明の通り、顔のホロプタ周辺に限定した。したがって、顔の外側で深さの異なる再構築された3Dデータは、図23(C)に示すように3D推定が不正確である。
【0097】
図1に示すように、システムはSwissrangerTM製の飛行時間(time−of−flight:TOF)レンジカメラ(略してTOFカメラ)と、VidereTM製の従来のCCDステレオカメラから構成され、密なステレオ再構築アルゴリズムのディスパリティ計算を改良する、実質的に並列な画像チャネルを可能にする。SRIインターナショナル(SRI InternationalTM)のSVSTMソフトウェアを利用して、ステレオ画像のキャプチャ、カメラ較正及び補正を行なう。システムはステレオビデオシーケンスをキャプチャすることができ、ステレオ対の3Dデータを320×240の画像解像度で毎秒30フレームで再構築する。
【0098】
再構築された3D座標値は、予め規定された世界座標系に対するものである。この実現例での世界座標系(原点)は左カメラの焦点となるように規定され、右手の座標系である。
【0099】
図15はTOFレンジカメラからステレオ画像へのマッピングのためのスクリーンキャプチャであり、ここでTOFカメラ画像430からマッピングされた画素は左右のカメラ画像432及び434上に重ねられる。
【0100】
図16は左カメラ450の画像フレーム、ディスパリティ画像452、及び再構築された3DデータのオープンGL(Open GL)プロット454をそれぞれ示す。TOFカメラからの範囲情報で、背景の対象物に対する3D再構築が改良される。
【0101】
今回開示された実施の形態は単に例示であって、本発明が上記した実施の形態のみに制限されるわけではない。本発明の範囲は、発明の詳細な説明の記載を参酌した上で、特許請求の範囲の各請求項によって示され、そこに記載された文言と均等の意味および範囲内でのすべての変更を含む。
【図面の簡単な説明】
【0102】
【図1】この発明の一実施の形態に従ったディスパリティ推定システム40のシステム構成要素を示す図である。
【図2】この発明の実施の形態の、コンピュータによって実現されたディスパリティ計算装置50のハードウェアブロック図である。
【図3】ディスパリティ計算装置50の全体の機能ブロック図である。
【図4】前景/背景マッピングモジュール146の詳細を示す図である。
【図5】ディスパリティ探索モジュール148の詳細を示す図である。
【図6】ステレオ画像の補正を示す図である。
【図7】ディスパリティ推定のための、補正されたステレオ画像対テンプレート探索プロセスを示す図である。
【図8】左カメラ画像240Lの画素250Lのディスパリティをどのように計算するかを示す図である。
【図9】(A)は前景ディスパリティ探索を示し、(B)は背景ディスパリティ探索を示す図である。
【図10】TOFカメラ62の予備較正の全体のプロセスステップを示すフロー図である。
【図11】予備較正プロセスで用いられるパターン340を示す図である。
【図12】予備較正プロセスにおいて、ユーザがどのようにTOFカメラ及びステレオカメラの画素を選択するかを示す図である。
【図13】「左」カメラ画像240L及び「右」カメラ画像240R内のブロックがどのようにサブブロックに分割されるかを示す図である。
【図14】ディスパリティ探索アルゴリズムのフロー図である。
【図15】TOFカメラからステレオ画像へのマッピングのためのスクリーンキャプチャを示す図である。
【図16】左カメラ450の画像フレーム、ディスパリティ画像452及び3D再構築データのOpen GLプロット454をそれぞれ示す図である。
【符号の説明】
【0103】
40 ディスパリティ推定システム
50 ディスパリティ計算装置
54 3Dモニタ
60 ステレオカメラ
62 TOFカメラ
70 コンピュータ
74 モニタ
80 キーボード
82 マウス
90 CPU
94 ROM
96 RAM
98 ハードディスクドライブ
130 較正ソフトウェア
132 較正パラメータメモリ
134 補正ソフトウェア
136 フレームメモリ
138 較正フレームメモリ
140 予備較正ソフトウェア


【特許請求の範囲】
【請求項1】
補正したステレオ画像対において、対応する画素対をマッチングするための装置であって、前記装置はステレオカメラ及びレンジカメラに接続されてそれぞれ補正されたステレオ画像対とレンジカメラ画像とを受けることができ、前記ステレオ画像対は第1の画像と第2の画像とを含み、前記装置は
前記レンジカメラ画像中の画素を前記第1の画像中の画素と前記第2の画像中の画素とにマッピングするための第1のマッピング手段と、
前記レンジカメラ画像中の前記画素の画素値をしきい値と比較するための比較手段と、
前記比較手段に応答して、前記比較手段による比較結果に依存して第1のディスパリティ探索と第2のディスパリティ探索とを選択的に行なって、前記第2の画像中の画素であって前記第1の画像中の前記画素にマッチするものを探索するための手段とを含む、装置。
【請求項2】
前記探索手段は、
前記比較手段が、前記画素の前記画素値が前記しきい値より高いと判定したことに応答する第1の探索手段と、
前記比較手段が、前記画素の前記画素値が前記しきい値以下であると判定したことに応答する第2の探索手段とを含み、
前記第1の探索手段の探索範囲は前記第2の探索手段の探索範囲より短い、請求項1に記載の装置。
【請求項3】
前記第1の探索手段は、
前記比較手段が、前記画素の前記画素値が前記しきい値より高いと判定したことに応答して、前記レンジカメラ画像の前記画素を前記第2の画像にマッピングするための第2のマッピング手段と、
前記第2のマッピング手段によってマッピングされた前記第2の画像のエピポーラ線上の前記画素の両側に延在する第1の探索範囲を規定する、第1の探索範囲規定手段と、
前記第1の画像中の前記画素を包含する予め定められたサイズの予め規定されたブロックと、前記第1の探索範囲内のそれぞれの画素を包含する前記第2の画像中の予め定められたサイズのブロックとの、予め定められた類似尺度を計算するための第1の類似度計算手段と、
前記第2の画像中の前記ブロックのうち、最も高い類似尺度を有するものを選択するための第1のブロック選択手段と、
前記第1のブロック選択手段によって選択された前記ブロックの中心の画素を、前記第1の画像の前記画素にマッチするものとして選択するための第1の画素選択手段とを含む、請求項2に記載の装置。
【請求項4】
前記第2の探索手段は、
前記第1の探索範囲より長い第2の探索範囲を規定するための、第2の探索範囲規定手段を含み、前記第2の探索範囲は前記第2のマッピング手段によってマッピングされた前記第2の画像のエピポーラ線上の前記画素の一方側のみに延在し、
前記第2の探索手段はさらに
前記第1の画像中の前記画素を包含する予め定められたサイズの予め規定されたブロックと、前記第2の探索範囲内のそれぞれの画素を包含する前記第2の画像中の予め定められたサイズのブロックとの、予め定められた類似尺度を計算するための第2の類似度計算手段と、
前記第2の画像中の前記ブロックのうち、前記第2の類似手段によって計算された最も高い類似尺度を有するものを選択するための第2のブロック選択手段と、
前記第2のブロック選択手段によって選択された前記ブロックの中心の画素を、前記第1の画像の前記画素にマッチするものとして選択するための第2の画素選択手段とを含む、請求項3に記載の装置。
【請求項5】
前記第1の類似度計算手段は、
前記第1の画像中の前記ブロックと前記第2の画像中の前記ブロックとの各々を、同じ形状の複数のサブブロックに分割するための手段と、
前記第2の画像中の前記ブロックの各々と、前記第1の画像中の前記ブロックとの平均の画素値を計算するための手段と、
前記サブブロックの各々の画素の画素値から前記平均画素値を減算するための手段と、
前記サブブロックの各々の画素の平均画素値を計算するための手段と、
前記第1の画像のサブブロックの平均画素値と、前記第2の画像のブロックの各々のサブブロックのそれぞれの平均画素値との二乗誤差の合計を計算するための手段とを含み、
前記二乗誤差の合計が前記類似尺度である、請求項3に記載の装置。
【請求項6】
ステレオカメラ及びレンジカメラに接続されてそれぞれ補正されたステレオ画像対とレンジカメラ像とを受けることができるコンピュータで実行可能なコンピュータプログラムであって、前記ステレオ画像対は第1の画像と第2の画像とを含み、前記コンピュータプログラムは、前記コンピュータ上で実行されると、コンピュータを
前記レンジカメラ画像中の画素を前記第1の画像中の画素にマッピングするための第1のマッピング手段と、
前記レンジカメラ画像中の前記画素の画素値をしきい値と比較するための比較手段と、
前記比較手段に応答して、前記比較手段による比較結果に依存して第1のディスパリティ探索と第2のディスパリティ探索とを選択的に行なって、前記第2の画像中の画素であって前記第1の画像中の前記画素にマッチするものを探索する手段と、として動作させる、コンピュータプログラム。



【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate


【公開番号】特開2009−139995(P2009−139995A)
【公開日】平成21年6月25日(2009.6.25)
【国際特許分類】
【外国語出願】
【出願番号】特願2007−312428(P2007−312428)
【出願日】平成19年12月3日(2007.12.3)
【出願人】(301022471)独立行政法人情報通信研究機構 (1,071)
【Fターム(参考)】