説明

深度マップを画像から判定する方法、深度マップを判定する装置

ウィンドウ・ベースのマッチングは、別々の向きから得られる画像から深度マップを判定するために使用される。固定マッチング・ウィンドウの組が、深度を判定する画像の点に対して使用される。マッチング・ウィンドウの組は、画像の点周りの画素のフットプリントを包含し、フットプリント(FP)の画素が属するマッチング・ウィンドウの平均数(O)は、フットプリントにおける画素数を15で除算した数に1を加えた数未満(O<FP/15+1)、好ましくは、フットプリントにおける画素数を25で除算した数に1を加えた数未満(O<FP/25+1)である。


【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像の点に対するウィンドウ・ベースのマッチングを使用して、別々の向きから得られる画像から深度マップを判定する方法に関する。
【0002】
本発明は、画像の点に対するウィンドウ・ベースのマッチングを使用して、別々の向きから得られる画像から深度マップを判定する装置にも関する。
【背景技術】
【0003】
いくつかのアプリケーションの場合、深度マップを画像から判定することが望ましい。前述のアプリケーションの例には、対話式で制御可能な向きから視たシーンの画像の計算を可能にするシステム、画像圧縮、検査等がある。ステレオ画像から深度マップを回復する作業は多くの場合、3D表示、製造時の品質管理、自律ナビゲーションや物体認識などの広範囲にわたるアプリケーションに非常に重要である。本明細書及び特許請求の範囲では、画像内の点の深度は、視点と、上記点を通り、カメラの光軸に垂直の平面との間の距離を表す。
【0004】
カメラの視点を第1の視点から第2の視点に移動させると、画像点の深度は画像点の位置の平行移動の量から判定することが可能である。画像が点投影によって得られた場合、平行移動は、カメラの変位の量に比例し、画像の一部の深度に反比例する。
【0005】
平行移動を測定するために、カメラの第1の向きから得られる第1の画像内の画素周りのウィンドウ内の画素値が、第2の向きから得られる第2の画像内の画素周りのウィンドウ内の画素値と比較される。マッチングには通常、マッチング・ウィンドウ内の画素の画素値間の差の総計を求めることが関係する。
【0006】
ウィンドウ・ベースのマッチング手法は、共通の問題(すなわち、バウンダリ・オーバリーチ)を共有する。画像内の境界近傍では、マッチング・ウィンドウを使用したウィンドウ・ベースの手法により、問題に対する対応がなされる。回復されたオブジェクト境界は多くの場合、画像内で変位する。
【0007】
適応型ウィンドウを使用することも提案されている。しかし、適応型ウィンドウの使用には通常、ウィンドウを適応させるための非常に複雑なアルゴリズムが必要である。
【0008】
バウンダリ・オーバリーチの問題を軽減するための手法は、Masatoshi Okutomiらによる、「A Simple Stereo Algorithm to Recover Precise Object Boundaries and Smooth Surfaces (Computer Vision and Pattern Recognition 2001, CVPR2001, Proceedings of the 2001 IEEE Computer Society Conference on Volume 2., 2001, page II−138乃至II−142, vol. 2)」と題する論文に開示されている。
【0009】
既知の手法では、マッチングが行われる画像の点毎に、関心点の位置がウィンドウの点全てにわたって走査されるマッチング・ウィンドウが使用される。マッチング・ウィンドウがオブジェクト境界に及ばないようにマッチング・ウィンドウが関心画素の周りに非対称に設定された場合、バウンダリ・オーバリーチは生じない。関心画素が、マッチング・ウィンドウの組全体にわたって走査される。マッチング・ウィンドウの組全体が、関心画素周りのフットプリントに及ぶ。
【0010】
既知の手法により、バウンダリ・オーバリーチの問題に対する解決策が用意される。しかし、前述の解決策により、大量の計算が必要になる。更に、別の問題が生じる。平滑な視差面が破壊され、多くの段階的な方形が前述の平滑な視差面においてみられる。平滑な視差面における問題は、境界検出法を実現し、境界領域を非境界領域と違ったふうに処理することにより、既知の手法において対処される。
【0011】
しかし、既知の手法は、大量の計算能力及び多少複雑なアルゴリズムを必要とする。
【発明の開示】
【発明が解決しようとする課題】
【0012】
本発明の目的はとりわけ、深度の比較的信頼度及び正確性の高い推定を供給しながら、比較的少ない計算能力を必要とする方法を提供する。
【課題を解決するための手段】
【0013】
本発明によれば、固定マッチング・ウィンドウの組が画像の点に対して使用され、マッチング・ウィンドウの組は、画像の点周りの画素のフットプリントに及び、フットプリントの画素が属するウィンドウの平均数は、フットプリント内の画素数を15で除算した数に1を加えた数未満である。
【0014】
既知の手法は、多少大きなウィンドウ及び大きなマッチング・ウィンドウ組を使用する。既知の手法において提案された大きなウィンドウ組を使用すると、オーバリーチの問題が軽減されるが、大量の計算能力が必要になる。フットプリント、すなわち、少なくとも1つのマッチング・ウィンドウに属する関心画素の周り、又は上記関心画素の近くの画素は全て、大きく、更に、各画素が属する平均ウィンドウ数は、画素数を12.5で除算した数に1を加えた数にほぼ等しい。このことは、フットプリント内の各画素が多数のウィンドウに属するという状態につながる。フットプリント内の画素は最大20乃至25個のウィンドウに属する。マッチング・ウィンドウの重なりは大きい。これは、2つの不利な影響を及ぼす。すなわち、計算の数が多く、エラーが伝播し、それによって、従来技術文献に記載された影響につながる。
【0015】
本願の発明者は、ウィンドウ・ベースの手法の場合、ウィンドウの適切な選択が重要であることを認識した。使用されるマッチング・ウィンドウのサイズが大きい場合、これは、境界が不正確であり、細部が喪失された、ぼやけた深度マップをもたらし得る。好適であり、計算能力を削減する一方で、より小さなウィンドウを使用すれば、雑音をこうむりやすい方法につながる。マッチング・ウィンドウの重なりも重要である。
【0016】
本発明による方法では、固定されたマッチング・ウィンドウの組が使用される。固定ウィンドウを使用すれば、適用型ウィンドウに関連した問題がなくなる。
【0017】
マッチング・ウィンドウの組により、関心画素周りのフットプリントが定められる。平均的な重なりは小さく、好ましくは、従来技術手法の少なくとも2分の1未満の大きさである。意外にも、この場合、「少ないほど良い」ということがあてはまることが分かっている。既知の手法の少なくとも2分の1以下にマッチング・ウィンドウの重なりの数を削減することにより、エラー伝播の問題も軽減する一方で、計算の数を削減することが可能である。ウィンドウは比較的小さくし、それにより、より多くの計算に対する必要性を緩和することが可能である。
【0018】
好ましくは、フットプリントの画素が属する平均ウィンドウ数は、フットプリント内の画素の数を25で除算した数に1を加えた数未満である。重なりはその場合、従来技術の少なくとも2分の1以下の大きさである。
【0019】
好ましくは、フットプリントの画素が属するウィンドウの平均数は、フットプリント内の画素の数を50で除算した数に1を加えた数未満である。
【0020】
小さいウィンドウ(すなわち、20個未満の画素、好ましくは10個未満の画素を含むウィンドウ)の使用が好ましい。
【0021】
ウィンドウのサイズは比較的小さくすることができるので、細部を捕捉することが可能である。
【0022】
方法は好ましくは、別々の向き(好ましくは、互いにほぼ垂直である向き)を備えたマッチング・ウィンドウの組を使用する。別々の向きのマッチング・ウィンドウを使用するので、マッチング・ウィンドウの別々の向きが理由で重なりを小さく保つことが可能な状態で、深度マップにおける画素毎に、いくつかの潜在的なマッチ(及び、よって視差値)がもたらされる。マッチング・ウィンドウの向きは、マッチング・ウィンドウの長軸又は短軸で表される。
【0023】
マッチング・ウィンドウの位置決めの前述の選択が理由で、バウンダリ・オーバリーチが生じない一マッチング・ウィンドウが常に存在するか、又は少なくとも、上記一マッチング・ウィンドウが常に存在する可能性が非常に高いことになる。この冗長度により、この冗長度がなければ失われることがあり得る細部をより好適に回復することが可能になり、最終的な視差推定における信頼度がより高くなることも可能になる。マッチング・ウィンドウのサイズ、及びマッチング・ウィンドウの数は大きくなくてよいので、計算量的負担は低く、作業は容易に並列化される。ウィンドウは比較的小さな重なりしか有していないので、従来技術の問題(すなわち、平滑な視差面が損なわれること)が生じるのはずっと少なくなる。よって、既知の手法と比較してずっと単純な計算を使用すれば、同等に好適又はより好適な結果を得ることが可能である。なお、本発明は、従来技術文献に開示されたマッチング・ウィンドウのサイズを単純に削減することを意味するものでない。重要なことは、平均的な重なりが削減されるということであり。好ましくは、別々の向きのマッチング・ウィンドウがいくつか使用されるということである。別々の向きのマッチング・ウィンドウの前述の使用は、従来技術文献には開示されていない。従来技術文献では、同一の方形形状のウィンドウが使用されている。
【0024】
好ましくは、マッチング・ウィンドウは、向きが垂直であるウィンドウの向きに平行のエッジを備える。
【0025】
好ましい実施例では、マッチング・ウィンドウの数は4個であり、マッチング・ウィンドウは、十文字形の形態のフットプリントを形成する。十文字形は、単純な配置であり、これは、好適な結果をもたらすことが分かっている。
【0026】
別の好ましい実施例では、マッチング・ウィンドウの数は8個であり、ウィンドウは、フォアサム(4つで1組のもの)が2個あり、一方のフォアサムは、他方のフォアサムにおけるウィンドウの左側バージョン又は右側バージョンであり、それぞれが十文字形を形成している。マッチング・ウィンドウの一方のフォアサムを使用すると、左から右への偏り、又は右から左への偏りがわずかに生じ得る。2つのフォアサムを使用することにより、このバイアスをなくすことが可能である。
【0027】
別の実施例では、マッチング・ウィンドウはほぼ三角形である。
【0028】
好ましい実施例では、各ウィンドウはn1n2個の画素を有し、ここで、n1≧2n2である。
【0029】
好ましくは、n1は1、2又は3であり、最も好ましくは、2及びn2は5乃至8である。
【発明を実施するための最良の形態】
【0030】
本発明の前述及び他の効果的な局面は、以下の図面を使用して更に詳細に説明するものとする。
【実施例】
【0031】
図は一律の縮尺に従わずに描いている。一般に、同じ構成部分は、図中の同じ参照符号で表す。
【0032】
図1は、画像10の一部の幾何形状、及び2つの向き12a、12bを示す。画像の一部は例えば、画像内の個人、又は何れかの物体であり得る。本発明は、画像の深度マップを提供する方法に関する。深度マップは、z値(すなわち、深度値)を物体点に帰属させるものとしてみることが可能である。画像10の一部を含むシーンの画像を、別々の向き12a、bからの点投影を使用して得ると、画像の一部の上にある点14、15が画像において目に見える位置は、点14、15の投影16a、b、17a、bである。投影は、線19a乃至19dを点14,15から向き12a、bを通って画像平面まで引くことによって示すことが可能である。基本原則を説明するために、画像平面18に平行の平面において向き12a、bが選択されているが、本発明は、向き12a、bの前述の選択に限定されるものでない。前述の線19a乃至dと画像平面18との間の交差は、画像10の一部の点14、15が画像において目に見える位置を示す。
【0033】
視点12a、12bが変わると、画像の一部における点14、15が画像平面18において目に見える位置16a、b、17a、bが平行移動する。この平行移動は、視点と上記点との間の深度「z」に反比例し、視点の位置における変動の量に比例する。その結果、向き12a、bからの異なる深度「z」を有する画像10の一部の点14、15毎に平行移動は異なる。
【0034】
図2は、画像の一部が目に見える領域22を含む画像20を示す。画像20には、平行移動ベクトル23a、b、25a、bを示している。平行移動ベクトル23a、b、25a、bにより、画像20において画像の一部の点が目に見える位置が視点の移動に応じて平行移動される。平行移動ベクトル25a、bは、視点からより遠くにある点の場合よりも、視点により近い画像の一部の点の場合、より大きくなる。点全ての深度が同じ線26に沿って、平行移動は同じになる。
【0035】
線26に沿った軸及びその線に垂直の軸を有する座標系を使用すると、点が目に見える位置の平行移動「D」の振幅はA+Buになる。ここで、uは、線26に垂直の軸に沿って点が目に見える位置の座標である。平行移動の方向は視点の移動の方向と逆である。パラメータ「A」は、u=0において深度「Z0」の逆数に比例する。A=c/Z0であり、「B」はその深度に同様に比例し、画像の一部の傾き「s」は視線方向に対して垂直である。すなわち、B=cs/Z0である(cは、視点の変位、焦点距離、及び画像のスケールに比例する比例定数である)。図1及び図2は、2つのカメラを使用する状態を示す。深度マップを判定するために、3つ以上のカメラを使用することができる。3つ以上のカメラを使用すると、精度が向上し、フォアグラウンドにおける物体によるオクルージョンをバックグランド・オブジェクトが受ける可能性は減少する。
【0036】
図3は、画像、又は少なくとも画像の一部の深度マップを作成する方法のフローチャートを略示する。
【0037】
フローチャートの第1の工程31及び第2の工程32では、カメラ光学系は、第1の視点及び第2の視点それぞれに配置され、第1の視点及び第2の視点それぞれから第1の画像及び第2の画像が得られる。
【0038】
フローチャートの第3の工程33では、第1の画像における画素が選択される。第4の工程34では、画素に対して最善のマッチが、画像間でマッチング・ウィンドウを使用して求められる。
【0039】
フローチャートの工程35では、工程34の結果(すなわち、ウィンドウの最善のマッチ)を使用してz値を上記画素に帰属させる。最善のマッチを求め、それにより、z値を設定する方法は、最小SSSDが算出される上記引用論文記載の算出手法に限定されないが、前述の手法であり得る、マッチング・ウィンドウを使用して最善のz値を判定する何れかの方法であり得る。本発明による方法は、マッチング・ウィンドウを使用した方法全てに共通するバウンダリ・オーバリーチの問題を軽減するためのマッチング・ウィンドウの選択に関する。
【0040】
前述の工程は、深度マップを得るために画像内の画素の全て又は一部について繰り返される。
【0041】
図4は、引用された従来技術論文に開示されたマッチング・ウィンドウの組を示す。25個のウィンドウが使用され、各ウィンドウは25個の画素を含む。「関心点」と呼ばれる、z値が求められる画素41は、黒色方形で表す。55の画素の標準マッチング・ウィンドウが使用され、関心画素が、標準ウィンドウの点全てにわたって走査される。これにより、25個のマッチング・ウィンドウが与えられる。図4では、前述の25個のマッチング・ウィンドウは、灰色の方形の55の領域によって表す。大量の算出を行わなければならない。25個のマッチング・ウィンドウは、関心画素周りの、関心画素を含む99=81個の画素のフットプリントに及ぶ。底部領域43は、マッチング・ウィンドウのうちの少なくとも2つに共通した、99個の画素のより大きな領域内の画素を示す。このより大きな領域は、合計25個のマッチング・ウィンドウの組のフットプリントである。フットプリントの画素毎に、各画素が共通であるウィンドウの数が示される。大半の画素は、3つ以上の(最大20個の)マッチング・ウィンドウに共通している。特に、垂直軸及び水平軸に沿って数が多い。本願発明者は、重要なパラメータが、画素が共通画素である平均ウィンドウ数であることが分かった。この平均数は、フットプリントにおける数全てを加算し、フットプリントにおける画素の数で和を除算することにより、算出することが可能である。従来技術は、55個の画素のウィンドウを備えた99個の画素のフットプリントを一例として表す。従来技術はこの手法の一般化を開示していないが、より大きなフットプリント、又はより小さなフットプリント(例えば、1111のフットプリント又は77のフットプリント)の場合、同じ手法を想定し得る。その場合、ウィンドウはそれぞれ、66個の画素及び44個の画素になる。既知の手法は、関心画素が標準ウィンドウの画素全てにわたって走査され、よって、44の標準ウィンドウで始めた場合、77のフットプリントに及ぶ16個のマッチング・ウィンドウが存在することになり、66の標準ウィンドウで始めた場合、1111のフットプリントに及ぶ36個のマッチング・ウィンドウが存在することになる。
【0042】
走査する対象の、各画素が共通であるウィンドウの平均数は、従来技術の構成の場合、以下のように算出される。
【0043】
各ウィンドウ(図4の最上部における灰色領域)は、mm個の画素を有し、この例ではm=5である。ウィンドウの数もmmである。関心画素が、標準ウィンドウの画素全てにわたって走査される。よって、完全なマッチング・ウィンドウの組が灰色である画素の合計数はmm=mである。ウィンドウの組全てのフットプリント(すなわち、少なくとも一ウィンドウの一部を形成する画素の組はnnであり、この例ではn=9である。実際に、従来技術の構成では、n=2m−1(又は、m=0.5(n+1))である。
【0044】
よって、画素毎の平均ウィンドウ数はm/nである。フットプリントの各画素は、少なくとも1つのウィンドウの一部である。画素が2つ以上のウィンドウの一部を形成した場合、これは問題を生じ得る。以下に説明する重要な値は、画素毎のウィンドウの平均数である。
【0045】
本発明の概念において、この数は平均重なり数Oと呼ばれる。
【0046】
式では、O=m/nである。
【0047】
n=2m−1であると仮定すれば、これは、
O=l/16((n+l)/n)
として記述することが可能である。
【0048】
図5は、グラフにおいて、フットプリントの数(すなわち、n)としてOの値を表す。
【0049】
9の画素のフットプリントの場合、Oの値は7.716である。すなわち、各画素は平均的に、7.716個のウィンドウに共通である。
【0050】
Oは、一次近似では、マッチング・ウィンドウの組のフットプリント(すなわち、n)の線形関数である。一次近似では、Oは、おおよそ、フットプリントを12.5で除算した数に1を加えた数である。
【0051】
マッチング・ウィンドウの重なりにより、問題(すなわち、エラーの伝播)が特に、平滑な視差面において生じる。マッチング・ウィンドウの重なりが多いほど、問題は大きくなる。既知の手法では、平滑な視差面が損なわれるという問題は、境界検出手法を実現し、境界領域を非境界領域と違ったふうに処理することにより、解決される。しかし、これは更なる算出工程を必要とする。この伝播は、O−1の値が大きいほど、より大きくなる。従来技術では、数Oは大きく、更に垂直方向の線及び水平方向の線に沿って大きく、それにより、問題が加わる。
【0052】
図6は、本発明の方法及び装置において使用されるマッチング・ウィンドウの組を示す。図の下半分はフットプリントを示し、図4に示すように、画素が共通であるウィンドウの数を示す。フットプリントは32個の画素であり、平均重なり値O=40/32=1.25である。この重なり数Oは、約2.5の匹敵するフットプリントを備えた従来技術の重なり数よりもずっと小さい。平滑な視差面が損なわれる問題は、O−1の値に比例する可能性が高い。定義上、Oの最小値は1であるからである。よって、O−1は、画素の重なりに最善の尺度である。O−1を比較すれば、0.25と1.5との間に更に顕著な差(すなわち、6倍の差)がみられる。公式では、本発明の条件は以下として表すことができる。
【0053】
O<FP/15+1であり、好ましくは、O<FP/25+1であり、ここで、FPは、フットプリントにおける画素数を表す。より好ましくは、O<FP/50+1である。
【0054】
従来技術では、O≒FP/12.5+1があてはまる。少なくとも20%だけ、好ましくは少なくとも2分の1に、より好ましくは少なくとも4分の1に削減することにより、従来技術の問題の重なりが低減する。
【0055】
図6の例では、矩形の4つの52マッチング・ウィンドウの組が使用される。前述のマッチング・ウィンドウのフットプリントは、十文字形を形成する。矩形の長軸は、水平方向及び垂直方向に沿って指向させる。
【0056】
図7は、ウィンドウの組の更なる例を示す。フットプリントは比較的小さい(すなわち、17個の画素)である。数O=21/17=1/24である(従来技術の場合のOの値(約2.36)よりもずっと小さい)。矩形の4つの51マッチング・ウィンドウの組を使用する。前述のマッチング・ウィンドウのフットプリントは十文字を形成する。
【0057】
図8は、本発明による方法及び装置において使用されるウィンドウの組の更に別の例を示す。この場合、4つのマッチング・ウィンドウの2つの組が使用される。フットプリントは45であり、平均値Oは80/45−1=0.777であり、これは、同じフットプリントについての従来技術によって知られている構成の平均(すなわち、おおよそ3.6)よりもずっと少ない。
【0058】
図9は、本発明による方法及び装置において使用されるウィンドウの組の更に別の例を示す。フットプリントは81個の画素であり、Oの数は88/81=1.086であり、これは、従来技術の値(6.77)よりもずっと少ない。この例では、4つの三角形のマッチング・ウィンドウの組が使用される。三角形の対称性の適切な軸は、垂直方向及び水平方向に沿って配向されている。
【0059】
図10は、更に別の実施例を表す。
【0060】
図は、本発明の更に別の実施例を表す。この例では、8つの三角形ウィンドウの組が使用される。フットプリントは81であり、Oの数=120/81=1.48である。
【0061】
マッチング・ウィンドウの図示した例は何れも方形でない。本発明の広い概念においては、方形ウィンドウを使用することができるが、マッチング・ウィンドウが非方形であることが好ましい。矩形マッチング・ウィンドウや三角形マッチング・ウィンドウなどの非方形形状のウィンドウは、(図11に示す矩形マッチング・ウィンドウ又は三角形の場合、)水平エッジや垂直エッジなどの、又は(三角形マッチング・ウィンドウの場合、)45度のエッジの特定の画像特徴へのロッキングに、より適切であるからである。
【0062】
好ましくは、フットプリントの画素が属するウィンドウの平均数は、フットプリント内の画素の数を50で除算した数に1を加えた数未満である。本願に示す例は全て、この規則に従う。図5、図6及び図7に示す例は、互いに垂直に配向され、組み合わせて十文字形状を形成する略矩形形状のマッチング・ウィンドウを示す。図9に示すマッチング・ウィンドウと同様に、前述のマッチング・ウィンドウは、垂直方向及び水平方向に沿ったエッジを示す。図5、6及び7に示すマッチング・ウィンドウは、n1n2画素のサイズを有し、本願例では、51画素及び52画素を有する。垂直方向及び水平方向に沿って配向された前述の矩形形状のマッチング・ウィンドウが最も好ましい。
【0063】
好ましくは、マッチング・ウィンドウは同じ形式を有し、フォアサムの形状を形成し、形状は配向され、各マッチング・ウィンドウの形状は別のマッチング・ウィンドウの形状に関連し、マッチング・ウィンドウのうちの別のものの90度、180度又は270度の回転によって得ることができる。図6乃至図12の組は、前述の構成を示し、マッチング・ウィンドウの組それぞれは、他の形態を提供するために90度、180度及び270度だけ回転させた1つ(図6、図7、図9及び図10)又は2つ(図8及び図11)の基本配向形態から得られる。前述の構成により、計算が容易になる。好ましくは、視差候補を生成するよう、相互に直交方向に配向された小さく、比較的薄いマッチング・ウィンドウを使用することにより、バランスが取られる。
【0064】
図12は、本発明によるマッチング・ウィンドウの組の別の例を示す。この例におけるフットプリントは図11に示すフットプリントよりも小さく、77の方形であり、O=80/49=1.6である。
【0065】
フットプリントはなお、55方形に縮減することが可能であり、この場合、O=48/25=1.92になり、これは、ちょうど、O<F/25+1=2という好ましい条件内であり得る。
【0066】
本発明による装置は、別々の向きから得られた画像を入力する入力と、画像の点に対するウィンドウ・ベースのマッチングを使用して入力によって受信された画像から深度マップを判定する判定器とを含み、判定器では、固定マッチング・ウィンドウの組を、画像点に対して使用し、マッチング・ウィンドウの組は、画像点周りの画素のフットプリントに及び、フットプリント(FP)の画素が属するウィンドウの平均数(O)は、フットプリントにおける画素の数を15で除算した数に1を加えた数未満であり(O<FP/15+1)、好ましくは、フットプリントにおける画素の数を25で除算した数に1を加えた数未満であり(O<FP/25+1)、更に好ましくは、フットプリントにおける画素の数を50で除算した数に1を加えた数よりも少ない(O<FP/50+1)。
【0067】
図13は、本発明による装置を示す。図13において立方体で表す物体の画像が、2台のカメラによって撮られる。この例では、2台のカメラが示されているが、装置は、3台以上のカメラを含み得る。カメラは、カラー画像、又はモノクロ画像あるいはX線画像あるいは赤外線画像を記録し得る。カメラはそれぞれ、2組のデータを供給し、各組のデータは、Dl(xl,yl)及びD2(x2,y2)(すなわち、2組の2次元データ)で図に示す2次元画像を表す。カメラは、別々の向きから画像を撮る。装置は、別々の向きから撮られた画像を入力する入力Iと、判定器Dとを備える。判定器D内では、画像は、本発明によるマッチング・ウィンドウ手法を使用した最善のマッチである。この目的で、判定器は、画像D1(x1,y1)又はD2(x2,y2)のうちの一方において画素を選択する選択器133を備えている。選択された画素のマッチング器134では、最善のマッチが、画像間でマッチング・ウィンドウを使用して求められる。
【0068】
帰属器135では、上記画素にz値が、マッチング器134の結果(すなわち、ウィンドウの最善のマッチ)を使用して帰属される。好ましくは、カメラからのデータは、カメラの相互の向き上のデータを含み、判定器はカメラの相互の向きを判定するための手段を有するか、あるいは、カメラは、前述の相互の向きを判定器に通信するための手段を有するか、あるいは、判定器は、前述のデータを(例えば、手作業で)入力する手段を含むか、又は、カメラのセットアップは固定であるので、相互の向きが分かっている。カメラによる画像の撮影は、好ましくは同期化される。判定器は出力OPを有する。出力データ・ストリームD(x,y,z)は、x点座標及びy点座標、並びにz座標(すなわち、深度マップ)を含むデータ・ストリームである。この出力データ・ストリームD(x,y,z)は、記録装置に(例えば、DVDデータ担体や何れかの他のデータ担体上にデータ・ストリームを記録するために)送出してもよく、又は、上記出力データ・ストリームD(x,y,z)は、3次元画像を表示する3次元表示装置に送出することができる。
【0069】
図13は、カメラなどの記録装置を含む装置を示す。
【0070】
図14は、データ担体(例えば、DVD。データD1(x1,y1)及びD2(x2,y2)、並びにカメラの相互の向きに関するデータ(D(cam1,cam2))が記憶される)用の入力を有する装置を示す。本発明による装置は、データを読み出し、出力データ・ストリームD(x,y,z)を供給する。
【0071】
本発明による装置の好ましい実施例は、方法の上記好ましい実施例のうちの何れか1つ又は何れかの組み合わせ(例えば、フットプリント(FP)の画素が属するウィンドウの平均数(O)が、フットプリントにおける画素数を50で除算した数に1を加えた数未満(O<FP/50+1)であるか、又は、マッチング・ウィンドウ若しくは非方形)によって深度マップを判定する手段を備える。
【0072】
本発明による装置は、画像を記録する手段を備え得る。すなわち、装置は、画像を撮影するためのカメラを含み得る。カメラは、画像に関するデータを前述の入力に送出する。装置は、記録装置からのデータを受信することもできる。
【0073】
本発明の概念において、「判定器」、選択器、マッチング器等は、広く解するものとし、例えば、何れかのハードウェア(判定器など)、本願記載の判定、選択又はマッチング機能を行うよう企図された何れかの回路若しくはサブ回路、本発明による判定、選択又はマッチング動作を行うよう企図若しくはプログラムされた何れかのソフトウェア(コンピュータ・プログラムあるいはサブ・プログラムあるいはコンピュータ・プログラムの組、又はプログラム・コード)、並びに、後述する例示的な実施例に制限されることなく、単独に、又は組み合わせで、そういうものとして動作するハードウェア及びソフトウェアの何れかの組み合わせを含むものとする。一プログラムはいくつかの機能を組み合わせることができる。
【0074】
約言すれば、本発明は以下のように説明することができる。
【0075】
ウィンドウ・ベースのマッチングは、別々の向きから得られる画像から深度マップを判定するために使用される。固定マッチング・ウィンドウの組が、深度を判定する画像の点に対して使用される。マッチング・ウィンドウの組は、画像の点周りの画素のフットプリントを包含し、フットプリント(FP)の画素が属するマッチング・ウィンドウの平均数(O)は、フットプリント内の画素数を15で除算した数に1を加えた数未満(0<FP/15+1)であり、好ましくは、フットプリント内の画素数を25で除算した数に1を加えた数未満(0<FP/25+1)である。
【0076】
本発明は、本発明による方法又は装置のために何れかのコンピュータ・プログラム・プロダクトにおいても実施される。コンピュータ・プログラムは、プロセッサ(汎用又は専用)が、一連のロード工程(最終プロセッサ言語及び中間言語への翻訳のような中間翻訳工程を含み得る)後に、プロセッサが、コマンドをプロセッサに入れて、本発明の特徴的な機能の何れかを実行することを可能にするコマンド集合体の何れかの物理的な実現手段として理解されるものとする。特に、コンピュータ・プログラム・プロダクトは、担体(例えば、ディスクやテープなど)上のデータ、メモリに存在しているデータ、ネットワーク接続(有線又は無線)を介して流れるデータや、紙上のプログラム・コードとして実現することができる。プログラム・コード以外に、プログラムに必要な特性データもコンピュータ・プログラム・プロダクトとして実施することができる。
【0077】
方法の実施に必要な工程の一部(デ―タの入力工程及び出力工程など)は、コンピュータ・プログラム・プロダクトに記述されるかわりにプロセッサの機能において既に存在し得る。
【0078】
上記実施例は本発明を限定するよりも例証するものであり、特許請求の範囲記載の範囲から逸脱しない限り、別の多くの実施例を当業者が企図することができるであろう。
【0079】
特許請求の範囲では、括弧内にある参照符号は何れも、本特許請求の範囲を限定するものとして解釈されないものとする。
【0080】
本発明の枠組みにおいて、多くの変形が可能であることは明らかである。上記記載内容に本発明が限定されないことを当業者は理解するであろう。本発明は、新規の特徴的な特性、及び、特徴的な特性の組み合わせ全てにおいて存在している。請求項における参照符号は、その保護範囲を限定するものでない。
【0081】
例えば、方法は、画像の一部のみに使用することができるか、又は、本発明の方法の種々の実施例を、画像の種々の部分に対して(例えば、画像のエッジに別の実施例を使用する一方で、画像の中心に一実施例を使用して)使用することができる。
【0082】
「to comprise」の動詞及びその活用形を用いていることは、特許請求の範囲記載のもの以外の構成要素が存在することを排除するものでない。構成要素に先行する冠詞「a」又は「an」を使用していることは、前述の構成要素が複数存在することを排除するものでない。
【図面の簡単な説明】
【0083】
【図1】画像の一部の幾何形状、及び2つの向きを示す図である。
【図2】画像の一部の画像を示す図である。
【図3】深度マップを作成する方法のフローチャートである。
【図4】従来技術において使用されるマッチング・ウィンドウの組を示す図である。
【図5】既知の方法のフットプリントPの関数としての重なりOの数を示す図である。
【図6】本発明による方法及び装置のマッチング・ウィンドウの組の例を示す図である。
【図7】本発明による方法及び装置のマッチング・ウィンドウの組の例を示す図である。
【図8】本発明による方法及び装置のマッチング・ウィンドウの組の例を示す図である。
【図9】本発明による方法及び装置のマッチング・ウィンドウの組の例を示す図である。
【図10】本発明による方法及び装置のマッチング・ウィンドウの組の例を示す図である。
【図11】本発明による方法及び装置のマッチング・ウィンドウの組の例を示す図である。
【図12】本発明による方法及び装置のマッチング・ウィンドウの組の例を示す図である。
【図13】本発明による装置を示す図である。
【図14】本発明による装置を示す図である。

【特許請求の範囲】
【請求項1】
画像の点に対するウィンドウ・ベースのマッチングを使用して別々の向きから得られる画像から深度マップを判定する方法であって、固定マッチング・ウィンドウの組が前記画像の点に対して使用され、前記マッチング・ウィンドウの組は前記画像の点の周りの画素のフットプリントを包含し、前記フットプリント(FP)の画素が属するマッチング・ウィンドウの平均数(O)は、前記フットプリントにおける画素の数を15で除算した数に1を加えた数未満である方法。
【請求項2】
請求項1記載の方法であって、前記フットプリントの画素が属するウィンドウの平均数(O)は、前記フットプリント内の画素の数を25で除算した数に1を加えた数未満である(O<FP/25+1)方法。
【請求項3】
請求項2記載の方法であって、前記フットプリントの画素が属するウィンドウの平均数(O)は、前記フットプリント内の画素の数を50で除算した数に+1を加えた数未満である(O<FP/50+1)方法。
【請求項4】
請求項1、2又は3に記載の方法であって、前記マッチング・ウィンドウそれぞれは20画素未満である方法。
【請求項5】
請求項4記載の方法であって、前記マッチング・ウィンドウそれぞれは10画素未満である方法。
【請求項6】
請求項1乃至5の何れかに記載の方法であって、別々の向きを備えたマッチング・ウィンドウが使用される方法。
【請求項7】
請求項6記載の方法であって、前記マッチング・ウィンドウの前記向きは、互いに略垂直である方法。
【請求項8】
請求項1乃至7の何れかに記載の方法であって、前記マッチング・ウィンドウが非方形である方法。
【請求項9】
請求項8記載の方法であって、前記マッチング・ウィンドウの形状が矩形である方法。
【請求項10】
請求項8記載の方法であって、前記マッチング・ウィンドウの形状が三角形である方法。
【請求項11】
請求項9記載の方法であって、前記マッチング・ウィンドウがn1n2画素であり、n1≧2n2である方法。
【請求項12】
請求項11記載の方法であって、n1が1、2又は3であり、n2が5乃至8である方法。
【請求項13】
画像の点に対するウィンドウ・ベースのマッチングを使用して別々の向きから得られる画像から深度マップを判定する装置であって、前記装置は、別々の向きから得られる画像(D1(x1,y1),D2(x2,y2))を入力する入力(I)と、前記画像の点に対するウィンドウ・ベースのマッチングを使用して前記入力によって受信された画像から深度マップを判定する判定器(D)とを備え、前記判定器(D)は、前記画像の前記点に対して固定マッチング・ウィンドウの組を使用するよう構成され、前記マッチング・ウィンドウの組は前記画像の前記点周りの画素のフットプリントを包含し、前記フットプリント(FP)の画素が属するマッチング・ウィンドウの平均数(O)は前記フットプリント内の画素の数を15で除算した数に1を加えた数未満である(O<FP/15+1)である装置。
【請求項14】
請求項13記載の装置であって、前記フットプリントの画素が属するウィンドウの平均数は、前記フットプリント内の画素の数を25で除算した数に+1を加えた数未満である(O<FP/25+1)装置。
【請求項15】
請求項14記載の装置であって、前記フットプリントの画素が属するウィンドウの平均数は、前記フットプリント内の画素の数を50で除算した数に1を加えた数未満である(O<FP/50+1)装置。
【請求項16】
プログラムをコンピュータ上で実行させると、請求項1乃至12のうちの何れか一項に記載の方法を行うプログラム・コード手段を備えるコンピュータ・プログラム。
【請求項17】
請求項1乃至12のうちの何れか一項に記載の方法を行うためにコンピュータ読み取り可能な媒体上に記憶されたプログラム・コード手段を備えたコンピュータ・プログラム・プロダクト。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate


【公表番号】特表2009−530701(P2009−530701A)
【公表日】平成21年8月27日(2009.8.27)
【国際特許分類】
【出願番号】特願2008−558971(P2008−558971)
【出願日】平成19年3月14日(2007.3.14)
【国際出願番号】PCT/IB2007/050860
【国際公開番号】WO2007/105176
【国際公開日】平成19年9月20日(2007.9.20)
【出願人】(590000248)コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ (12,071)
【Fターム(参考)】