説明

イメージングシステム及び方法

物体の表面法線の勾配を決定する装置であって、方法は、各画像が異なる方向からの照明のもとで取得された、前記物体の3つの2D画像のデータを受信する手段と、画素からの2つの画像から得られるデータのみがあるように、前記画像のどの画素が陰になっているかを定める手段と、前記2つの画像に関して利用可能な前記データを使用して、陰影画素の表面法線の勾配に関する可能な解の範囲を決定する手段と、前記物体の領域上の勾配場の積分可能性を拘束として使用して、コスト関数を最小化することにより、前記勾配に関する解を選定する手段と、を具備する。
【選定図】図1

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、3D画像の生成のために、データを収集して表示するために使用することができるイメージングシステムの分野に関係している。本発明はまた、複雑な物体の2D及び3D動画(animation)を生成するために使用されることもできる。
【背景技術】
【0002】
3D画像生成の分野は、3D映画を作成するためのデータを取るのに割く時間によって主に阻害されている。以前は、3D映画は、本格的な(serious)記録フォーマットと対照的に、新規なものと理解されていた。現在では、3D画像生成は、CG画像の生成における重要なツールであると考えられている。
【0003】
照度差ステレオは、確立した3D再構成技術である。3Dシーンの一連の(典型的には3つ以上の)画像は、異なる方向からの照明のもとで同じ視点から取得される。各画素での強度変化から、その画素に投影する物体の表面の局所的な方向を推定することができる。
【0004】
全てのこれらの表面方向を積分することにより、表面形状の非常に詳細な推定を得ることができる。何らかの他の再構成法のように、照度差ステレオは、実際の画像に直面したときに、いくつかの困難に直面する。これらの困難のうちの最も重要なものは、画像における陰影(shadow)の常習的な存在である。どんなに慎重に光源を配置したとしても、陰影は、特に複雑な形状の物体では、ほとんど不可避な現象である。
【0005】
これまでは、陰影は、異なる4つの照明方向からの4以上の画像を使用して処理されてきた。これは、3自由度を要求するだけである局所的な表面方向及びアルベド(albedo)を過剰決定する(over-determine)。これは、陰影(shadowing)が発生するかどうかを判定するために、最小二乗解の剰余(residual)を使用することができることを暗示する。しかしながら、2D画像が3つだけである場合、余分の拘束はない。それにより、陰影を検出する問題がより難しくなる。さらに、3つの画像の1つにおいて画素が陰になっている(in shadow)場合、大抵の方法は、それを単に破棄する。
【発明の概要】
【0006】
本発明は、上記課題を解決するためのものであり、第1の態様では、物体の表面法線の勾配を決定する方法であって、各画像が異なる方向からの照明のもとで取得された、前記物体の3つの2D画像のデータを受信し、画素からの2つの画像から得られるデータのみがあるように、前記画像のどの画素が陰になっているかを定め、前記2つの画像に関して利用可能な前記データを使用して、陰影画素の表面法線の勾配に関する可能な解の範囲を決定し、前記物体の領域上の勾配場の積分可能性を拘束として使用して、コスト関数を最小化することにより、前記勾配に関する解を選定することを具備する方法を提供する。
【0007】
上記は、勾配場の積分可能性を強制することにより、物体の陰影部分の表面形状を推定する。
【0008】
好ましい実施形態では、前記勾配に関する解を選定する方法は、前記物体の表面が連続区分的多項式であるという拘束を使用することを備える。
【0009】
コスト関数は、最小二乗問題として最小化されてもよい。コスト関数は、勾配ごとの実際の値と領域上での勾配に関する可能な解との間の差を表すことができる。コスト関数は、ノイズを考慮するように構成されてもよい。
【0010】
解が算出される物体の領域は、一般に、陰影画素及び非陰影画素の両方を含む。さらなる好ましい実施形態では、陰影画素及び非陰影画素の両方に関するデータにノイズがあると想定する。
【0011】
ノイズは、生成された3次元画像において望まれていないアーチファクトをもたらす。従って、好ましい実施形態では、正則化拘束は、取得されたデータにおけるノイズを補うために適用される。
【0012】
一実施形態では、ノイズを補うために、コスト関数は、ノイズを補うために使用される正則化パラメータで表される。そして、コストは、正則化パラメータに課され、その結果、画素は、隣接するものの中間点に近い値を持たざるを得なくなる。コストは、正則化パラメータについての1次の微分又はより高次の微分に関して課される。正則化パラメータは、可能な解の直線に沿った長さであって、その線上の固定点からの長さに関連していてもよい。
【0013】
問題は、2D勾配空間で表面法線をそれらの勾配で表すことによって定式化されることができ、その結果、可能な解の範囲は、2D勾配空間での直線に沿って位置する。最小二乗解析に関する拘束は、正則化パラメータで表されてもよく、画素間での正則化パラメータの変化が所定値未満であり、正則化パラメータは、可能な解の直線に沿った長さであって、線上の固定点からの長さである。
【0014】
例えば、可能な解の範囲は、法線を下記のアルベドスケール化表面法線bとして表し、
【数1】

【0015】
ここで、cは[c]であり、c、c及びcは、前記3つの2D画像の各々で測定される前記画素のそれぞれの強度を表し、L=[Iであり、I、I及びIは、前記3つの2D画像の各々に関する前記物体を照らす前記光源の方向を表すベクトルであり、i番目の2D画像内の画素が陰になっている場合、bは、
【数2】

【0016】
と表され、ここで、eは、3×3の単位行列のi番目の列であり、Diは、対角のi番目の位置がゼロである単位行列であり、μは、それが陰になっていない場合に有すると考えられるcの値を表し、陰になっている点に関して、該点(p,q)がP[L−1c]とP[L−1]を結ぶ線として定義される画素のシャドウラインに沿って位置するように、オペレータP[x]=(x/x,x/x)=(p,q)を使用して、bを2D勾配空間に投影することによって決定されてもよい。
【0017】
前記方法は、コスト関数を最小化することをさらに備え、コスト関数を最小化することは、パラメータwを使用して実行され、ここで、wは、点(p,q)のシャドウラインに沿ったシャドウライン上の固定点からの距離であり、方法は、∇wに関するコストを課すことをさらに備える。
【0018】
3つの画像のうちのi番目の画像において画素が陰になっているかどうかを決定するステップは、全ての画素に関して、強度ベクトルcの大きさで割られたi番目の画像での強度の値が所定値未満であるかどうかを判断することによって実現されてもよい。
【0019】
前記方法は、画素が陰になっているかどうかを定めることをさらに備えてもよく、画素が陰になっているかどうかを定めることは、画素が陰になっていると判断され、隣接する画素が陰になっていないと判断される可能性を低減するさらなる拘束を導入することによるものである。
【0020】
前記方法は、画像が3つの方向だけから画像化される場合に使用されることができる。ちょうど3つの画像に関する照度差ステレオを使用することは、不合理に強い制約のように思えるかもしれない。しかしながら、3つの画像のみが利用可能である特別な状況がある。この手法は、カラー照度差ステレオとして知られており、それは、異なる光の周波数帯を有する3つの光源を使用する。シーンがカラーカメラ(colour camera)で撮影されるときには、3つのカラーチャネルは、3つの異なる照度差ステレオ画像を取得する。
【0021】
形状の取得は、フレームごとに独立に実行されるので、前記方法は、フレーム間で照明を変更することなしに、ビデオシーケンスに使用されることができる。この場合、布や人の顔等の物体を変形させた(deforming)3D形状を取得することが可能である。
【0022】
前記方法は、画像化すべき物体から画像データを取得することをさらに備えてもよく、或いは、それは、予め記録された若しくは遠隔で記録されたデータに関して動作してもよい。
【0023】
第2の態様では、本発明は物体の表面法線の勾配を決定する装置であって、前記方法は、各画像が異なる方向からの照明のもとで取得された、前記物体の3つの2D画像のデータを受信する手段と、画素からの2つの画像から得られるデータのみがあるように、前記画像のどの画素が陰になっているかを定める手段と、前記2つの画像に関して利用可能な前記データを使用して、陰になっている画素の表面法線の勾配に関する可能な解の範囲を決定する手段と、前記物体の領域上の勾配場の積分可能性を拘束として使用して、コスト関数を最小化することにより、前記勾配に関する解を選定する手段と、を具備する装置を提供する。
【0024】
前記手段は、上記の機能を実行するように構成されたプロセッサであってもよい。前記手段は3つの画像からデータを受信するが、4以上の画像からデータを受信するように構成されてもよい。しかしながら、前記方法及び装置は、データが2つの画像からの画素に関してのみ利用可能であるように、画素が陰になっている場合にその画素の表面法線の勾配を決定することを主に対象とする。
【0025】
前記装置は、3つの2D画像のデータを取得する方法をさらに備えてもよい。
【0026】
かかる装置は、3つの異なる角度から前記物体を照らす少なくとも3つの光源と、前記物体で反射された前記3つの放射源からの放射を収集するために設けられたカメラと、前記3次元物体のデプスマップを生成するように構成された画像処理器と、を備え、前記各放射源は、異なる周波数で放射を発し、前記画像処理器は、前記3つの異なる放射源からの反射信号を識別するように構成されるカラー照度差ステレオ装置であってもよい。
【0027】
しかしながら、本発明は、同じ周波数の光を使用して複数の画像が取得されて、異なる照明方向からの画像が順次に取得される標準的な照度差ステレオ技術にも適用することができる。
【0028】
前記装置は、スタンドアロンとすることができるが、デプスマップから3次元動画像を表示する手段をさらに備えた3D画像生成装置の一部に組み入れられてもよい。
【0029】
前述したように、物体は、動くことができ、カメラは、ビデオカメラであってもよい。
【0030】
システムは、決定された勾配から生成されるデプスマップを動かす(moving)手段を備え、2D又は3D動画に使用されてもよい。
【0031】
システムは、デプスマップにパターンを適用する手段をさらに備えてもよく、この手段は、デプスマップのフレームから物体の3Dテンプレートを形成し、フレームの物体上にパターンの位置を決め、後続のフレームにマッチするように、パターンを有するテンプレートを変形させるように構成される。
【0032】
テンプレートは、テンプレートの変形が初めの取得データのオプティカルフローを構成するフレームに適合しなければならないという拘束を使用して、変形させられてもよい。好ましくは、テンプレートは、データと同じくらい柔軟性のない変形が許す拘束をさらに使用して、変形させられる。
【0033】
要約すれば、本発明は、3D再構成、医用画像又は布モデリング(cloth modelling)に使用することができる。
【0034】
本発明は、以下の好ましい限定されない実施形態を参照して以下に説明される。
【図面の簡単な説明】
【0035】
【図1】図1は、照度差ステレオを実行するように構成された装置の概略図である。
【図2】図2は、照度差ステレオを実行するように構成された本発明の一実施形態に従うシステムの概略図である。
【図3】図3は、本発明の一実施形態に従う方法を示す流れ図である。
【図4】図4は、本発明の一実施形態に従う方法を説明するために使用される2D勾配空間を示すプロットである。
【図5】図5は、合成データに実際に適用される勾配を導出する方法を示す。図5aは、陰影領域を有する画像化すべき球面の概略図であり、図5bは、本発明の実施形態に従う手法を使用して画像化した場合の図5aの球面を示し、図5cは、正則化拘束を使用する本発明のさらなる実施形態に従う手法を使用して画像化した図5aの球面を示す。
【図6】図6は、顔の2D画像、及び本発明の一実施形態に従って生成される顔のシャドウマスクである。図6aが顔の2D画像であり、図6bが図6aの顔のシャドウマスクである。
【図7】図7は、本発明の一実施形態に従う方法で使用される方法で使用されるキャリブレーションボードの概略図である。
【図8】図8は、実際の物体の画像を示し、この事例では、物体はカエルである。図8aは、異なる照明方向から得られるカエルの3つの2D画像を示し、図8bは、強度を正規化した図8aの3つの画像を示し、図8cは、本発明の一実施形態に従う陰影の位置を決定する手法を適用した結果を示し、図8dは、図8cのデータから決定されたシャドウマスクを示し、図8eは、本発明の一実施形態に従って実行される、図8aのカエルの3D再構成を示す。
【図9】図9は、3つの有色の光源によって照らされる白塗りの顔のビデオデータを示す。図9aは、陰影を無視して生成された3つの3D画像を示し、図9bは、本発明の一実施形態に従って生成された画像の対応する結果を示す。
【発明を実施するための形態】
【0036】
図1は、物体1を画像化する(image)ために使用される本発明の一実施形態に従うシステムの概略図である。この物体は、相違する3つの光源3、5及び7により照らされる。
【0037】
本実施形態では、システムは、データに影響を及ぼすバックグラウンド放射を最小にするために、暗い屋内又は屋外に設けられる。3つの光源(light)3、5及び7は、物体1の周囲に横方向に配置され、床面から物体1の高さまでの間のレベルに垂直方向の位置を決められている。光源は、物体1へ向けられている。
【0038】
3つの光源3、5及び7の間の角距離(angular separation)は、物体1の回転面において約30度である。光線間の角度が大きくなるほど、向きに依存する色の変化が、よりはっきりと観測される。しかしながら、光源が遠く離れすぎている場合、物体1の凹形状は、そのような形状によって落とされる陰影が物体のより広い部分に及んでデータ解析をより困難にさせることから、識別するのがより困難になる。好ましい配置では、物体1の各部分が3つ全ての光源3、5及び7によって照らされる。
【0039】
第2の光源5の直下に設置されているカメラ9は、3つの光源3、5及び7によって照らされながら動く物体を録画するために使用される。
【0040】
図2は、システム全体の概観を示す。動いていることができる物体は、図1を参照して説明した3つの光源3、5及び7によって照らされており、画像がカメラ9によって取得される。
【0041】
そして、カメラ9の出力は、図2のディスプレイ13に画像を表示するために、図3のステップS103、S105、S107及びS109に従って、受け取ったデータを処理するプロセッサ11へ供給される。
【0042】
図3は、本発明の一実施形態に従う方法を示すフローチャートである。ステップS101では、照度差ステレオ技術を使用してデータが取得される。このデータは、リアルタイムに取得されて直ちに処理されてもよく、或いは、予め記録されたデータからシステムによって取得されてもよい。
【0043】
図1を参照して説明したように、最低限の3つの光源は、特別な想定なしに、照度差ステレオを実行するために必要とされる。2つの画像のみが利用可能である場合、有意義なデータを得るためには、一定のアルベドを仮定しなければならないと以前は考えられていた。本実施形態では、滑らかに変化するアルベドがあると想定する。より多くの光源が利用可能である場合には、光可視問題(light visibility problem)は、表面をうまく再構成するために、表面の各点が光源の正しい組に割り当てられなければならないラベリング問題(labelling problem)になる。
【0044】
より現実的な投影の場合への拡張は容易であるが、簡単にするために、データを取得するために使用されるカメラは、(無限遠焦点距離を有していて)正射であると想定する。
【0045】
正射投影の場合には、xy平面が画像平面に一致し、さらに、z軸が観察方向に対応するように、世界座標系を調整することができる。そして、カメラの前の表面は、高さ関数Z(x,y)としてパラメータ化されることができる。Z及びZをZの偏導関数とすると、法線は、次のように定義することができる。
【数3】

【0046】
これは、(x,y)における表面の局所的な法線である。i=1...3に関して、c(x,y)がi番目の画像における画素(x,y)の画素強度を示すとする。i番目の画像において、方向がベクトルIで示され且つ分光分布がE(λ)である遠くの光源によって、表面点(x y Z(x,y))が照らされていると想定する。さらに、表面点が反射率関数R(x,y,λ)に従って種々の波長の入射光を吸収すると想定する。最後に、各波長でのカメラセンサの応答がS(λ)で与えられると想定する。そうすると、画素強度c(x,y)は、
【数4】

【0047】
により与えられる。
【0048】
この積分の値は、点(x y Z(x,y))の表面アルベドとして知られている。これにより、アルベドスケール化法線ベクトル(albedo scaled normal vector)を次のように定義することができる。
【数5】

【0049】
照度差ステレオ法は、最小二乗センスでbについて解くために、(2)の線形拘束を使用する。これから、高さ関数の偏導関数は、関数自体を生成するために積分される。3光源照度差ステレオでは、3つ全ての光源において点が陰になっていない場合、3つの正の強度cが測定され、これらの各々がbに関する拘束を与える。L=[I、且つ、c=[cの場合、システムは、
−1c (3)
によって与えられる厳密に1つの解を持つ。
【0050】
しかしながら、点が陰になっている(in shadow)場合、この点をi番目の画像のものとすると、cの測定値を拘束として使用することができない。各式(2)は3Dの面を記述するので、2つの残りの拘束の共通部分(intersection)は、3Dの線である。
【0051】
を3×3の単位行列のi番目の列とし、Dを対角におけるi番目の位置がゼロである単位行列とすると、bの可能な解は、
【数6】

【0052】
であり、ここで、μは、スカラーのパラメータである。このパラメータは、点がi番目の画像において陰になっていないとした場合にcが持つと考えられる値を表す。
【0053】
オペレータP[x]=(x/x,x/x)=(p,q)を使用して、bを2D勾配空間に投影すると、陰になっている点に関しては、その点(p,q)は、P[L−1c]とP[L−1]を結ぶ線として規定される画素のシャドウライン(shadow line)に沿って位置する。
【0054】
解を与えるために、スケール化法線bを座標p及びqを持つ2D空間にする。オペレータP[x]=(x/x,x/x)は、この投影を達成するために使用され、表面点(x,y,Z(x,y))のスケール化法線bは、点P[b]=(p,q)に投影する。従って、座標p及びqは、2つの偏導関数Z及びZにそれぞれ等しい。
【0055】
画像拘束では、データにノイズがないと想定すると、次の3つのケースのうちの1つが起こりうる。
【0056】
ケース1。2以上の画像において表面点が陰になっている。この場合、画像からのP[b]の拘束はない。
【0057】
ケース2。3つの画像のいずれにおいても表面点が陰になっていない。この場合、(p,q)は、P[L−1c]=(P,Q)に一致する。
【0058】
ケース3。1つの画像のみにおいて表面点が陰になっている。この画像をi番目の画像とする。
【数7】

【0059】
上述の3つのケースは、画素に関するシャドウラベル(shadow label)と考えることができる。どのシャドウラベルが各画素に適用されるかは、ステップS103において決定される。シャドウラベルを割り当てる方法については後述する。
【0060】
説明は、これからケース3に関係している。
【数8】

【0061】
【数9】

【0062】
図4は、6つの画素の配置を示し、画素1は、i番目の画像において陰になっており、画素2は、どの画像においても陰になっていない。点(p,q)(黒っぽい点)は、画素jの高さ関数の偏導関数を示す。各点(p,q)に関して、対応するデータ点(白い点)がある。画素2は、隠されておらず、従って、(p,q)は、そのデータ点(P,Q)に可能な限り近くなければならない。しかしながら、画素1は、隠されており、従って、(p,q)は、そのシャドウライン57に可能な限り近くなければならない。
【数10】

【0063】
取り得る解(potential solution)の範囲がS105で一線に決定されると、方法は、拘束を使用して解が選定されるステップS107に進む。拘束は、積分可能性条件の形態をしている。
【0064】
(p,q)座標は、スカラー場の偏導関数を表すので、(p,q)座標は、各画素に関して独立ではなく、結果として、それらが積分可能性条件を満たさなければならない。高さ関数が連続区分的多項式(continuous piecewise polynomial)であると仮定することにより、積分可能性条件は、pとqとの間の畳み込みの形になる。例えばZ(x,y)が画素中心Z(i,j)における高さ値の間の線形補間である場合、積分可能性は、次のように表現されることができる。
【数11】

【0065】
解を得るために、積分可能性条件を満たしながらノイズのあるデータ(noisy data)とモデルとの間の不一致を最小化する各画素に関する値(p,q)が取得される。
【0066】
上述したように、画像データcにおけるノイズのもとで、2Dの点(P,Q)及び(p,q)は、モデルと完全には一致しない。非陰影画素(non-shadowed pixel)に関しては、モデルとデータとの間の相違は、2点間の(point-to-point)二乗差項
【数12】

【0067】
によって評価されることができる。
【数13】

【0068】
ここで、mは、L−1のi番目のベクトルである。上記の式は、p及びqに関して線形でなく、従って、最小二乗推定値に関する制約のように適していない(mot suitable)。
【数14】

【0069】
従って、全ての画素がステップS103に従って陰影条件(shadow condition)でラベル付けされると、全ての問題を解決するために最小化されるべきコスト関数は、
【数15】

【0070】
であり、ここで、Sは、非陰影画素(non-shaded pixel)の全てを含み、Sは、i番目の画像において陰になっている(shaded)画素を含む。
【0071】
上記のコスト関数は、p及びqについての二次項であり、従って、積分可能性条件を前提としてこの量の最小値を見つけることは、種々の方法で解くことができる拘束付き線形最小二乗問題である。
【0072】
ステップS109では、3D画像は、決定された勾配から生成される。勾配を知ることにより、物体のデプスマップ(depth map)を決定することが可能になる。デプスマップは、3D画像を直接に生成するために使用されることができ、或いは、動画(animation)のデータを生成するために使用されることができる。
【0073】
例えば、上記の方法は、布や髪等のような複雑な動く物体のデータを取得して移動メッシュ(moving mesh)に関するデータを生成するために使用される。移動メッシュは、交連骨格(articulated skeleton)に取り付けられることができる。
【0074】
スキニングアルゴリズム(skinning algorithm)は、コンピュータアニメーションの技術においてよく知られている。例えば、各頂点vが多くの骨格関節のうちの1つに付けられて、各関節jへのリンクがwi,kによって重み付けされるスムーススキニングアルゴリズム(smooth skinning algorithm)が使用されることができる。重みは、次のように、各関節の動きがどれくらい頂点の変換に影響を与えるかを制御する。
【数16】

【0075】
【数17】

【0076】
メッシュは、まず、固定の衣服又は衣類の他の部分等の奥行きパターンを固定の骨格と合わせ、そして、メッシュ頂点ごとに最近傍の組を骨格に合わせることによって、骨格に取り付けられた。重みは、これらの距離に反比例して設定される。骨格は、公に利用可能なモーキャップ(mocap)データ(カーネギーメロン(Carnegie-mellon)のモーキャップデータベース http://mocap.cs.cmu.edu)を使用して動画にされる(animated)。メッシュは、布の動きについて予め取得されている布シーケンス(cloth sequence)を再生することにより動画にされる。
【0077】
図5は、合成データに実際に適用される勾配を導出する上述の方法を示す。図5aは、合成球面を示し、この球面は3方向から照らされており、明るい領域は、画素が3つの画像のうちの1つにおいて陰になっている(shadowed)領域を示す。
【0078】
図5bは、上述の方法を使用して生成された球面の3D画像を示す。陰影領域(shaded area)の概略の形状は、この領域が非陰影領域(unshaded region)で囲まれるように定められて、うまく生成されている。非陰影領域は、陰影領域(shadowed region)に関する境界条件として働き、問題に唯一の解を与える。スクラッチアーチファクト(scratch artefact)の存在は、図5bの陰影領域に見られる。これらは、コスト関数に十分な拘束を導入しない点と線との距離(point-to-line distance)によって生じる。点(p,q)は、全体的なコストのわずかな減少を得るだけのために、対応するシャドウラインに沿った方向にかなり移動することができる。これは、結果として生じる高さ関数における極端な摂動(violent perturbation)に帰着し、摂動は、シャドウラインに垂直に動くディープスクラッチ(deep scratch)として表す。
【0079】
図5cは、正則化(regularisation)スキームが使用される本発明の一実施形態に従って、図5aのデータから生成された画像を示す。
【0080】
正則化基準は、上述した線形最小二乗フレームワークと一致し、その結果、非線形拘束が強制されることがなく、それは可能な限り多くのデータを保ちながらノイズを抑制する。
【0081】
正則化基準の1つの可能な選定は、高さ場(height field)のラプラシアン∇zを最小化することである。これは、良好なノイズ低減特性を持ち、低い曲率を持つ滑らかでよいふるまいの表面(smooth well behaved surface)を生成することが知られている。しかしながら、ラプラシアンは、等方性があり、なし得る全ての方向に沿って区別なく滑らかにする傾向がある。
【0082】
例えば、画像処理において知られている非等方性フィルタリング(anisotropic filtering)等のラプラシアンに代わる他の非等方性のものがある。
【0083】
特定の場合に正則化を達成する改良された方法は、陰影画素ごとに(p,q)空間でシャドウラインの方向に沿って正則化を実行することである。
【0084】
これは、点と線との間の距離の項を次のように修正することによって達成される。
【数18】

【0085】
これは、陰影画素ごとに、その画素のシャドウラインに沿った位置を特定する新たな変数wを導入する。この項は、p、q及びwに関してなおも二次であるが、これは、ノイズが補われることができる方法で解の正則化を可能にする。変数wは、次のように、(4)のパラメータμに関連する。
【数19】

【0086】
前述したように、μは、画素がその画像において陰になっていないとしたときに評価されるcの値を示す。この方法は、陰影領域内での∇wの長さに関するコストを加え、このコストは、2次又はより高次の項に適用されることができる。wがμの代用となるので、これは、Ibに滑らかさを導入することに対応する。これは、Iに垂直な方向への変動性を持たせるが、スクラッチアーチファクトの除去を可能にさせ、正則化手続きを形成する結果は、図5cに示される。
【0087】
図3のステップS103は、どの画素が陰になっているかの決定を可能にするシャドウマスクを決定することに関係している。
【0088】
4つ以上の画像を用いる照度差ステレオでは、最小二乗センスでの拘束を満たすスケール化法線を算出することによって陰影を検出することができる。この最小二乗演算の剰余(residual)が高い場合、これは、その画素が陰になっている若しくは最も明るい部分にあることを暗示する。しかしながら、3つの画像を用いる場合、3つの拘束が常に厳密に充足されることができて剰余がなくなるので、これは起こり得ないものになる。
【0089】
近年、「Chandraker, M et al ”Shadowcuts: Photometric stereo with shadows” Proceedings of Computer Vision and Pattern Recognition, 17-22 June 2007 p 1-8」は、4つ以上の画像を用いる照度差ステレオにおいて陰影にラベル付けするグラフカットに基づくスキーム(graph-cut based scheme)を提案した。拘束剰余に基づいて、特定のシャドウラベルを各画素に割り当てるためのコストが計算された。そして、このコストは、近傍の画素が同様のシャドウラベルを持つことが推奨されるMRFフレームワークにおいて正則化された。
【0090】
陰影領域(shadow region)の基本特性は、画素強度が暗い(dark)ことである。しかしながら、これは、暗い表面アルベドのために生じることもある。アルベドファクターを取り除くために、画素強度は、強度ベクトルcの大きさで割られる。画素がi番目の画像で隠されるかを決定するためのコストは、c/||c||である。これは、その方線がi番目の光源方向Iiに略垂直であると画素が誤って識別される可能性をさらに残す。しかしながら、その場合には、画素は、同種の陰影(self shadow)の中にあるものに近接し、従って、分類を誤るリスクは小さい。画素を陰にならない集合に割り当てるコストは
【数20】

【0091】
によって与えられる。
【0092】
コストは、ポッツモデルペアワイズコスト(Potts model pairwise cost)のもとでMRFフレームワークにおいて正則化される。これは、異なるシャドウラベルを与えられた2つの近接する画素に一定のペナルティを割り当てる。MRFは、ツリーリウェイテッドメッセージパッシングアルゴリズム(Kolmogorov et al. “Convergent Tree-reweighted message passing for energy minimisation” IEEE Trans. Pattern Anal. Mach. Intell. 28 (2006) 1568-1583)を使用して最適化される。
【0093】
図6aは、撮像すべき顔を示し、図6bは、上述した技術を使用して決定されたシャドウマスクを示す。
【0094】
上述の説明は、3D画像を生成するために3つの画像を使用している。これらの3つの画像を得る特に有用な方法は、カラー照度差ステレオを使用することである。ここでは、画像になる物体は、3つの異なる方向から異なる波長で照らされ、3つの波長を識別することができるカメラが使用され、その結果、3つの画像は、同時に得られることができる。典型的には、赤、緑及び青の3色が使用され、これらの色は、物体で反射され、1つのRGB画像から最小の混合で検出される。
【0095】
カラー照度差ステレオは、1つの画像に適用されるので、人は、フレーム間で照明を変更する必要なしに、ビデオシーケンスにそれを使用することができる。
【0096】
カラー照度差ステレオでは、3つのカメラセンサ(R,G,B)の各々は、代表的な照度差ステレオの3つの画像のうちの1つと見なされることができる。i番目のセンサに関する画素(x,y)の画素強度は、
【数21】

【0097】
によって与えられる。
【0098】
センサ感度Sがセンサごとに異なり、さらに、分光分布Eが光源ごとに異なることに留意されたい。RGB値間の一意的なマッピング及び法線方向を決定することができるように、単色の表面が想定される。従って、R(x,y,λ)=α(x,y)ρ(λ)であり、ここで、α(x,y)は、表面点の単色アルベドであり、ρ(λ)は、物質の特有の色度である。
【数22】

【0099】
【数23】

【0100】
【数24】

【0101】
本質的には、各ベクトルvは、源jからの光線がカメラにより受光される場合に3つのセンサによって測定される応答を与える。
【数25】

【0102】
【数26】

【0103】
システムは、複数の方法で調整されてもよい。図7に示されるタイプのキャリブレーションボード(calibration board)が使用されてもよい。このキャリブレーションボード21は、四角い布23及び円25のパターンを備える。ボード21の移動により、カメラ9と光源3、5及び7との間のホモグラフィ(homography)を算出することが可能となる。ホモグラフィを算出することは、カメラに対する光源方向を算出することを意味する。これがなされると、ズーム及びフォーカスは、色又は光源方向に影響を与えないので、撮影中に変わることができる。布23は、色と方向との間の関連性を測定することを可能にする。
【0104】
物質の各方向に対応するRGB応答を測定することにより、下記の行列が推定されることができる。
【数27】

【0105】
最初の較正ルーチンの結果、ボードの種々の既知の方向に関して画像が取得され、最近傍補間が全ての方向に適したデータを決定するために使用されることができるので、考え得る全てのボード方向に関して実行される必要があるわけではない。3×4行列の較正データを提供するために、ちょうど4方向からデータを取得することができる。良好な較正データは、約50の方向から達成される。しかしながら、較正データは容易に収集されるので、数千もの方向からデータを得ることもある。
【0106】
他の較正方法では、鏡球面(mirror sphere)が光源方向I、I及びIを推定するために使用される。次に、カメラの前で動く物体の3つのシーケンスが取得される。各シーケンスでは、一度に3つの光源のうちの1つのみがスイッチを入れられる。ノイズがない場合には、単色の仮定が満たされれば、光源jがスイッチを入れられているときは、取得されるRGBトリプレットは、vの倍数である。
【0107】
そして、最小二乗フィット(fit)は、方向v、v及びvを得るために実行されることができる。3つのベクトルの相対的な長さを得るために、RGBベクトルの長さの比が使用されることができる。光源jがスイッチを入れられる場合、vの長さは、トリプレットのうちの、RGB空間での最大の長さに設定される。
【0108】
図8は、実際の物体の画像を示し、この事例では物体はカエルである。図8aは、3つの異なる照明方向から取られた3つの画像を示す。実験では、カエルは、5つの異なる方向から撮影されたが、3つの画像のデータだけが最終的な3次元画像を生成するために使用された。
【数28】

【0109】
【数29】

【0110】
図8dは、図8b及び8cに示されるデータを使用して計算されたシャドウマスクである。シャドウマスクの明るい領域は、画像のうちの1つが遮蔽されている領域を示す。これらの陰影領域は、上述した技術を使用して調節される。
【0111】
図8eは、物体の生成された3次元画像である。
【0112】
図9は、3つの有色の光源によって照らされている白塗りの顔のビデオデータを示す。陰影が考慮されていないビデオシーケンスからの3つの再構成されたフレームが列9aに示されている。列9bは、上述したように陰影が考慮されている対応する3つのフレームを示している。2つの光源のみが陰影領域において可視であるとしても、陰影を正しく処理すると、鼻の再構成が劇的に向上しているのがわかる。

【特許請求の範囲】
【請求項1】
物体の表面法線の勾配を決定する装置であって、
前記方法は、
各画像が異なる方向からの照明のもとで取得された、前記物体の3つの2D画像のデータを受信する手段と、
画素からの2つの画像から得られるデータのみがあるように、前記画像のどの画素が陰になっているかを定める手段と、
前記2つの画像に関して利用可能な前記データを使用して、陰影画素の表面法線の勾配に関する可能な解の範囲を決定する手段と、
前記物体の領域上の勾配場の積分可能性を拘束として使用して、コスト関数を最小化することにより、前記勾配に関する解を選定する手段と、を具備する、装置。
【請求項2】
前記装置は、データを取得する手段をさらに備え、
前記データを取得する手段は、
3つの異なる角度から前記物体を照らす少なくとも3つの光源と、
前記物体で反射された前記3つの放射源からの放射を収集するために設けられたカメラと、
前記3次元物体のデプスマップを生成するように構成された画像処理器と、を備え、
前記各放射源は、異なる周波数で放射を発し、前記画像処理器は、前記3つの異なる放射源からの反射信号を識別するように構成される、請求項1に記載の装置。
【請求項3】
前記物体は動いており、前記カメラはビデオカメラである、請求項2に記載の装置。
【請求項4】
前記決定された表面法線から画像を生成する手段をさらに備える、請求項1乃至3のいずれか1項に記載の装置。
【請求項5】
物体の表面法線の勾配を決定する方法であって、
各画像が異なる方向からの照明のもとで取得された、前記物体の3つの2D画像のデータを受信し、
画素からの2つの画像から得られるデータのみがあるように、前記画像のどの画素が陰になっているかを定め、
前記2つの画像に関して利用可能な前記データを使用して、陰影画素の表面法線の勾配に関する可能な解の範囲を決定し、
前記物体の領域上の勾配場の積分可能性を拘束として使用して、コスト関数を最小化することにより、前記勾配に関する解を選定することを具備する方法。
【請求項6】
前記勾配に関する解を選定する方法は、前記物体の表面が連続区分的多項式であるという拘束を使用することを備える、請求項5に記載の方法。
【請求項7】
前記解を選定する方法は、最小二乗解析として実行される、請求項5又は6に記載の方法。
【請求項8】
前記コスト関数は、ノイズを補うために使用される正則化パラメータで表される、請求項5乃至7のいずれか一項に記載の方法。
【請求項9】
コストが、前記正則化パラメータに課せられる、請求項8に記載の方法。
【請求項10】
前記可能な解の範囲が2D勾配空間での直線に沿って位置するように、前記可能な解の範囲は、前記2D勾配空間で前記表面法線をそれらの勾配で表すことによって決定される、請求項5乃至9に記載の方法。
【請求項11】
前記正則化パラメータは、前記線上の固定点からの可能な解の前記直線に沿った長さである、請求項10に記載の方法。
【請求項12】
前記可能な解の範囲は、前記法線を下記のアルベドスケール化表面法線bとして表し、
【数1】

ここで、cは[c]であり、c、c及びcは、前記3つの2D画像の各々で測定される前記画素のそれぞれの強度を表し、L=[Iであり、I、I及びIは、前記3つの2D画像の各々に関する前記物体を照らす前記光源の方向を表すベクトルであり、i番目の2D画像内の画素が陰になっている場合、bは、
【数2】

と表され、ここで、eは、3×3の単位行列のi番目の列であり、Diは、対角のi番目の位置がゼロである単位行列であり、μは、それが陰になっていない場合に有すると考えられるcの値を表し、
陰になっている点に関して、該点(p,q)がP[L−1c]とP[L−1]を結ぶ線として定義される前記画素のシャドウラインに沿って位置するように、オペレータP[x]=(x/x,x/x)=(p,q)を使用して、bを2D勾配空間に投影することによって決定される、請求項5に記載の方法。
【請求項13】
前記コスト関数を最小化することは、前記シャドウライン上の固定点からの、点(p,q)の前記シャドウラインに沿った距離であるパラメータwを使用して実行され、前記方法は、∇wに関するコストを課すことをさらに備える、請求項12に記載の方法。
【請求項14】
前記3つの画像のi番目の画像において画素が陰になっているかどうかを定めることは、前記3つの画像の全てに関して、強度ベクトルcの大きさで割られた前記i番目の画像における強度の値が所定の値未満であるかどうかを判断することによって実現される、請求項5乃至13のいずれか一項に記載の方法。
【請求項15】
画素が陰になっているかどうかを定めることは、画素が陰になっていると判断され、隣接する画素が陰になっていないと判断される可能性を低減するさらなる拘束を導入することによってさらに判断される、請求項14に記載の方法。
【請求項16】
前記3つの2D画像に関する前記データは、3つの異なる角度から前記物体を照らす3つの放射源を使用して取得され、前記3つの放射源からの前記データが同時に取得されることが可能になるように、前記各放射源は、異なる周波数で放射を発する、請求項5乃至15のいずれか一項に記載の方法。
【請求項17】
画像を生成する方法であって、
請求項5乃至16のいずれか一項に従って表面法線の勾配を決定し、前記表面法線のデータから画像を生成することを具備する方法。
【請求項18】
前記生成された画像は、3次元画像である、請求項17に記載の方法。
【請求項19】
布を動画にする方法であって、
請求項5乃至18のいずれか一項の方法に従って布を画像化し、前記決定された勾配から生成されたデプスマップを動画にすることを具備する方法。
【請求項20】
請求項5乃至19のいずれか一項の方法を実行するように構成されたコンピュータプログラムを実行するコンピュータ。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate


【公表番号】特表2012−505368(P2012−505368A)
【公表日】平成24年3月1日(2012.3.1)
【国際特許分類】
【出願番号】特願2011−514988(P2011−514988)
【出願日】平成21年9月24日(2009.9.24)
【国際出願番号】PCT/JP2009/067136
【国際公開番号】WO2010/041584
【国際公開日】平成22年4月15日(2010.4.15)
【出願人】(000003078)株式会社東芝 (54,554)
【Fターム(参考)】