説明

3次元形状モデル高精度化方法およびプログラム

【課題】被写体を撮影した画像と背景のみを撮影した画像から、被写体3次元モデルを高精度に復元する方法を提供する。
【解決手段】各カメラの被写体シルエット画像から視体積交差法により復元されるVisual Hullの表面に存在するボクセルのオブジェクトらしさに関する尤度を算出し、オブジェクトらしさに関する尤度をもとにVisual Hullの整形を行い、Visual Hullの整形が収束するまで、算出と整形を繰り返し適用する。上記のVisual Hullから獲得される3次元形状モデルのテクスチャ状態を評価し、3次元形状モデルのテクスチャ状態をもとに3次元形状モデルの整形を行い、3次元形状モデルの整形が収束するまで、評価と整形を繰り返し適用する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、被写体を撮影した画像と背景のみを撮影した画像から、被写体3次元モデルを高精度に復元する方法およびプログラムに関する。
【背景技術】
【0002】
自由視点映像の画質は、モデルベースの合成方式を考えた場合、多視点映像より生成される3次元形状モデルの精度に大きく左右される。多視点映像をもとに被写体の3次元形状モデル(3次元ボクセルデータ)を構築する代表的な手法として視体積交差法がある(非特許文献1)。しかしながら、この方法には、物体の凹領域を復元できないという原理的課題があった。
【0003】
上記の原理的課題に対して、非特許文献2で提案されるspace carvingを始めとした様々な手法が提案されている。また、特願2009−195334号では、各カメラ画像間でステレオマッチングをもとに高精度化する手法が提案されている。
【0004】
Visual Hull高精度化に関する研究として、Photo Consistencyのみならず、Visual Hull表面形状の安定性を考慮したエネルギー関数を定義し、最適化の枠組みにより形状を補正する手法が提案されている。非特許文献3では、ステレオマッチングによる整形手法が提案されている。当該手法は、Photo Consistencyによりカメラから被写体までの距離値をVisual Hull内側へ押し込むための外力と、Visual Hull表面の局所的な形状特徴を維持するための内力の線形結合により評価関数を定義し、最小化する距離値を求めることで、被写体の表面形状を決定する。Space carving等の単一ボクセルに注目する手法に比べて、表面上に不自然な凹凸が発生することが少なく、滑らかな形状を復元できる結果が示されている。
【0005】
一方、ボクセル空間中での隣接関係を考慮したグラフカットによりVisual Hullの整形を行う手法が提案されている。非特許文献4では、Visual Hull表面近傍のボクセルに関して、ボクセル単体のPhoto Consistencyに基づくエネルギーと、ボクセル間の隣接関係に基づくエネルギー関数を定義し、グラフカットを適用することで、滑らかな形状を復元できることを示している。さらに、Visual Hullの内側に、被写体が確実に存在すると仮定するCore領域を設け、グラフカットの適用範囲をVisual Hull表面とCore領域間に限定することで、被写体領域が誤って削られる可能性を低減することに成功している。
【先行技術文献】
【非特許文献】
【0006】
【非特許文献1】豊浦正広、飯山将晃、舩冨卓哉、角所考、美濃導彦、「欠損および過抽出を含む時系列シルエットからの三次元形状獲得」、電子情報通信学会技術研究報告,PRMU2007-168,Vol.107,No.427,pp.69-74,2008-1
【非特許文献2】Kutulakos他「ATheory of Shape by Space Carving 」 International Journal of Computer Vision 2000年
【非特許文献3】冨山仁博他「局所的形状特徴に拘束された3次元形状復元手法とそのリアルタイム動画表示」 映像情報メディア学会誌, 61, 4, pp. 471-481 (2007)
【非特許文献4】Hisatomi他「Methodof 3D reconstruction using graph cuts, and its application to preservingintangible cultural heritage」 IEEE conference on ICCV, pp. 923 - 930 (2009).
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかしながら、非特許文献2に記載の提案方式等のほとんどの手法は、ボクセル単体のPhoto Consistencyのみに注目して除去するか否かを決定するため、最終的に獲得されるVisual Hullの復元精度は、被写体のテクスチャ状態に大きく依存するという問題があった。また、特願2009−195334号では、マッチング誤差の影響により復元精度が低下するという問題が顕著であった。
【0008】
また、非特許文献3の手法では、最終的な復元結果は、ステレオマッチングの探索精度に大きく依存するため、被写体のテクスチャ変化が少ない領域では十分な復元精度が得られないという問題が残っている。
【0009】
また、非特許文献4の手法では、ボクセル間の隣接関係に基づくエネルギー関数が、単純にボクセル単体のエネルギー値の平均で定義されているため、ボクセル空間中の隣接関係を十分に考慮できているとは言えない。また、グラフカットの適用が一回に限定されているのに加え、適用結果を評価するプロセスが存在しないため、最終的に復元される3次元形状モデルに、背景領域が含まれる可能性が高いと考えられる。
【0010】
以上の問題点を踏まえ、本発明では、ボクセル空間中での連続性を十分に考慮するとともに、整形過程の3次元形状モデルをもとに、実カメラ視点で生成される自由視点画像の画質を評価するプロセスを導入することで、3次元形状モデルのテクスチャ状態を考慮したVisual Hull高精度化方法およびプログラムを提供することを目的とする。
【課題を解決するための手段】
【0011】
上記目的を実現するため本発明による3次元形状モデル高精度化方法は、多視点のカメラ画像から被写体の3次元形状モデルを復元する方法であって、各カメラの被写体シルエット画像から視体積交差法により復元されるVisual Hullの表面に存在するボクセルのオブジェクトらしさに関する尤度を算出する算出ステップと、前記オブジェクトらしさに関する尤度をもとにVisual Hullの整形を行う第1の整形ステップと、前記Visual Hullの整形が収束するまで、前記算出ステップと前記第1の整形ステップを繰り返し適用する第1の収束ステップと、前記収束ステップのVisual Hullから獲得される3次元形状モデルのテクスチャ状態を評価する評価ステップと、前記3次元形状モデルのテクスチャ状態の評価をもとに3次元形状モデルの整形を行う第2の整形ステップと、前記3次元形状モデルの整形が収束するまで、前記評価ステップと前記第2の整形ステップを繰り返し適用する第2の収束ステップとを含む。
【0012】
また、前記算出ステップは、前記Visual Hullの表面に存在する各ボクセルを各撮影カメラ視点に投影し、撮影カメラ間における投影画素値の分散を算出し、前記分散を正規化することで前記オブジェクトらしさに関する尤度を算出することも好ましい。
【0013】
また、前記第1の整形ステップは、3次元ボクセル空間における各ボクセル間の隣接関係を考慮したエネルギー関数を定義し、前記エネルギー関数を最小化する枠組みで、各ボクセルを被写体領域または背景領域のいずれかに割り当てることで被写体領域を決定し、背景領域を不要部として除去することで、整形を行うことも好ましい。
【0014】
また、前記第1の収束ステップは、前記不要部の除去を適用する前後の3次元形状モデルを比較し、表面として指定したボクセルより内側のボクセルが削られていない場合を収束とすることも好ましい。
【0015】
また、前記評価ステップは、各撮影カメラ視点で、前記3次元形状モデルをもとに生成される自由視点画像と、前記撮影カメラ画像との差分画像を抽出することも好ましい。
【0016】
また、前記第2の整形ステップは、各撮影カメラ視点において、前記差分画像の画素間での隣接関係を考慮したエネルギー関数を定義し、前記エネルギー関数を最小化する枠組みで、各画素を被写体領域または背景領域のいずれに割り当てるかを決定し、背景領域と判断される整形候補内に存在する画素の光線を探索し、前記3次元形状モデルとの交点を不要部として除去することで、前記3次元形状モデルの整形を行うことも好ましい。
【0017】
また、前記第2の収束ステップは、前記不要部の除去を適用する前後の3次元形状モデルを比較し、削られるボクセル数が、一定数以下である場合を収束とすることも好ましい。
【0018】
上記目的を実現するため本発明によるプログラムは、多視点のカメラ画像から被写体の3次元形状モデルを復元するためのコンピュータを、各カメラの被写体シルエット画像から視体積交差法により復元されるVisual Hullの表面に存在するボクセルのオブジェクトらしさに関する尤度を算出する算出手段と、前記オブジェクトらしさに関する尤度をもとにVisual Hullの整形を行う第1の整形手段と、前記Visual Hullの整形が収束するまで、前記算出手段と前記第1の整形手段を繰り返し適用する第1の収束手段と、前記収束ステップのVisual Hullから獲得される3次元形状モデルのテクスチャ状態を評価する評価手段と、前記3次元形状モデルのテクスチャ状態の評価をもとに3次元形状モデルの整形を行う第2の整形手段と、前記3次元形状モデルの整形が収束するまで、前記評価手段と前記第2の整形手段を繰り返し適用する第2の収束手段として機能させ、3次元形状モデルを復元する。
【発明の効果】
【0019】
本発明により、Visual Hullの高精度化を実現でき、最終的に復元される3次元形状をもとに生成される自由視点映像を高画質化することが可能となる。
【図面の簡単な説明】
【0020】
【図1】本発明によるフローチャートを示す。
【図2】ボクセル空間内のVisual Hullの表面近傍を各視点に投影することを示す。
【図3】多視点カメラ画像の例を示す。
【図4】オリジナルの3次元形状モデルを示す。
【図5】入力のVisual Hullを示す。
【図6】ステップ4を終了した時点で整形されたVisual Hullを示す。
【図7】最終的に整形された3次元形状モデルを示す。
【発明を実施するための形態】
【0021】
本発明を実施するための最良の実施形態について、以下では図面を用いて詳細に説明する。提案手法は、ボクセル空間中での連続性を考慮した整形、および各視点での自由視点画像の画質を考慮した整形を特徴とする。本発明によるフローチャートを図1に示す。ある時刻1フレーム分の多視点カメラ画像と、各視点のカメラパラメータ、および各カメラの被写体シルエット画像から視体積交差法で復元されるVisual Hullを入力として、最終的に整形済みの3次元形状モデルを出力し、処理を終了する。以下、本フローチャートに基づいて説明する。
【0022】
ステップ1:Visual Hull表面近傍のボクセルのオブジェクトらしさを算出する。図2に示すように、ボクセル空間内のVisual Hull表面近傍を各カメラ視点に投影する。視点i(i=1,…,N)に投影された、カメラ画像内の座標をvとし、この点での投影画素値は、特定の色空間における多次元ベクトルx(v)として表される。色空間は例えば、RGB空間が挙げられる。オブジェクトらしさに関する尤度を算出するため、投影画素値の各カメラ視点での平均および分散を算出する。
平均ベクトルu(v)は、
【数1】

で算出される。ここで、#nvis(v)は、オクルージョンのない視点(表面近傍のボクセルが見える視点)の数を表し、Σは、オクルージョンのない視点で行われる。RGB空間の場合、平均ベクトルu(v)は、u(v)、u(v)、u(v)の3つの成分を有する。
分散ベクトルσ(v)は、
【数2】

で算出される。同様に、RGB空間の場合、分散ベクトルσ(v)は、σ(v)、σ(v)、σ(v)の3つの成分を有する。
【0023】
この分散を正規化することにより、オブジェクトらしさに関する尤度を求める。なお、正規化とは、σ(v)(i=1,…,N)の最大値でσ(v)を除算して、最大値を1.0にしたものである。以下の式に現れているσは、すべて正規化された後の分散を表している。
【0024】
ステップ2:ボクセル空間中でのエネルギー関数を定義する。
エネルギー関数は、
【数3】

で定義される。ここでv=(v,…,v,…,v)は、カメラ画像内の座標をvを表し、λは正の定数であり、aは、ボクセル空間中の各ボクセルを背景領域または被写体領域のいずれかに割り当てるかをそれぞれ0または1で表している。
【0025】
U(v;a)は、各ボクセル単体の尤度値のみに依存するデータ項であり、aで指定される領域に割り当てる場合のエネルギー値は、以下の式で与えられる。
【数4】

ここで、Σは視点i(i=1,…,N)について総和を取り、thv(c)は、一定の閾値である。上式はRGB空間の場合の式を示している。上式で、例えば、thv(c)=1.2とした場合、σ=0.5であるとき、thv(c)−σ=0.7、σ=0.5であるため、a=1、つまり被写体領域に割り当てた方が、エネルギー値が低くなる。σ=0.7であるとき、thv(c)−σ=0.5、σ=0.7であるため、a=0、つまり背景領域に割り当てた方が、エネルギー値が低くなる。つまり、分散が小さいとき、被写体領域に割り当てた方が、エネルギー値が低くなる。
【0026】
一方、V(v;a)は、平滑化項であり、隣接ボクセル間の尤度値の差をもとに以下の式で算出される.
【数5】

ここで、dis(i,j)はボクセル間のユークリッド距離を表し、κは正の定数である。定数κは隣接ボクセルの全組み合わせNに関する期待値の演算子<・>を用いて以下のように算出される。
【数6】

【0027】
ステップ3:エネルギー最小化に基づくVisual Hullの整形を行う。上記エネルギー値E(v;a)が最小になるように、画素値に0または1を割り当てる。これにより、Visual Hullの整形を行う。エネルギー値の最小化は、例えば、Graph-cutのアルゴリズムを用いる。ここで、a=0、つまり背景領域に割り当てられたボクセルを不要部として除去する。
【0028】
ステップ4:収束判定を行う。ステップ3で得られたVisual Hullとステップ1の入力のVisual Hullとを比較して、表面近傍のボクセルより内側のボクセルが削れていない場合、または削れたボクセルの数が一定の閾値内になったかどうかで収束判定を行う。収束が十分でないとき、ステップ3で得られたVisual Hullをステップ1の入力としてステップ1からステップ3を繰り返す。
【0029】
ステップ5:各カメラ視点において、ステップ3で得られたVisual Hullから獲得された3次元形状モデルをもとに自由視点画像を生成し、自由視点画像と撮影画像との差分画像を算出する。以下のステップでは、3次元形状モデルのテクスチャ状態を評価することにより、3次元形状モデルの整形を行う。
【0030】
ステップ6:各撮影カメラ視点で、差分画像中でのエネルギー関数を定義する。各撮影カメラ視点において、前記差分画像の画素間での隣接関係を考慮したエネルギー関数を以下のように定義する。
【数7】

で定義される。ここでpは、差分画像の各画素を表し、λは正の定数であり、aは、差分画像の各画素を背景領域または被写体領域のいずれかに割り当てるかをそれぞれ0または1で表している。
【0031】
U(v;a)は、差分画像の各画素の尤度値のみに依存するデータ項であり、aで指定される領域に割り当てる場合のエネルギー値は、以下の式で与えられる。
【数8】

ここで、Σは差分画像の各画素について総和を取り、x(p)は、画素pでの画素値(x、x、またはx)であり、thp(c)は、一定の閾値である。上式はRGB空間の場合の式を示している。
【0032】
一方、V(v;a)は、平滑化項であり、隣接画素間の画素値の差をもとに以下の式で算出される.
【数9】

ここで、dis(i,j)は画素間のユークリッド距離を表し、κは正の定数であり、ベクトルx(p)は、画素pでの画素値ベクトル(x、x、x)である。定数κは隣接画素間の全組み合わせNに関する距離の期待値の演算子<・>を用いて以下のように算出される。
【数10】

【0033】
ステップ7:エネルギー最小化に基づき、Visual Hullの整形候補を特定する。上記エネルギー値E(v;a)が最小になるように、画素値に0または1を割り当てる。これにより、Visual Hullの整形候補を特定する。エネルギー値の最小化は、例えば、Graph-cutのアルゴリズムを用いる。
【0034】
ステップ8:Visual Hull整形候補に含まれる各画素の光線を探索し、3次元形状モデルとの交点を除去する。上記のステップ5から7は、各視点i(i=1,…,N)のカメラ画像に行われる。a=0、つまり背景領域に割り当てた画素の光線を探索し、3次元形状モデルとの交点を不要部として除去する。これをすべてのカメラ画像に対して行い、不要なボクセルを削る。
【0035】
ステップ9:収束判定を行う。ステップ8で得られた3次元形状モデルとステップ5の入力の3次元形状モデルとを比較して、表面近傍の内側のボクセルが削れていない場合、または削れたボクセルの数が一定の閾値内になったかどうかで収束判定を行う。収束が十分でないとき、ステップ8で得られた3次元形状モデルをステップ5の入力としてステップ5からステップ8を繰り返す。
【0036】
次に、本発明の処理結果を実験結果により示す。実験は、凹領域を含む被写体を含む多視点画像を対象に、視体積交差法で復元されるVisual Hullに本発明の手法を適用した結果得られる3次元形状の精度を評価する。実験データとして、CGモデルを23視点に投影した画像と各視点のカメラパラメータ(中心射影行列)を用いた。
【0037】
図3は、多視点カメラ画像の例を示す。図3aは視点02からのカメラ画像を、図3bは視点06からのカメラ画像を示す。図4は、オリジナルの3次元形状モデルを示す。図5は、入力のVisual Hullを示す。図6は、ステップ4を終了した時点で整形されたVisual Hullを示す。図7は、最終的に整形された3次元形状モデルを示す。
【0038】
図4と図5を比較すると、視体積交差法のみで作成されたVisual Hullは、物体の凹領域を復元できていないことが分かる。図4と図6を比較すると、本発明のステップ1から4の処理で、物体の凹領域が復元されていることが分かる。図6と図7を比較すると、本発明のステップ5から9の処理で、物体の凹領域がより正確に再現できていることが分かる。
【0039】
上記の実験結果を定量的に示す。表1は、オリジナルの3次元形状モデルに対するPrecision/Recall/F値を示す。ここで、Recallは誤って削られたボクセルの比率を示し、Precisionは、本来削るべきボクセルが削れていない比率を示す。F値は、RecallとPrecisionをもとに計算された、3次元形状モデルの正確さを表す指標である。
【表1】

【0040】
表1によると、F値は、最終的に整形された3次元形状モデルが最も良い値を示し、本発明のステップ1から9を実行することにより、物体の凹領域が復元されていることが分かる。
【0041】
以上のように、本発明では、物体の凹領域の復元を行うことができ、Visual Hullの高精度化を実現でき、最終的に復元される3次元形状をもとに生成される自由視点映像を高画質化することが可能となる。
【0042】
また、以上述べた実施形態は全て本発明を例示的に示すものであって限定的に示すものではなく、本発明は他の種々の変形態様および変更態様で実施することができる。従って本発明の範囲は特許請求の範囲およびその均等範囲によってのみ規定されるものである。

【特許請求の範囲】
【請求項1】
多視点のカメラ画像から被写体の3次元形状モデルを復元する方法であって、
各カメラの被写体シルエット画像から視体積交差法により復元されるVisual Hullの表面に存在するボクセルのオブジェクトらしさに関する尤度を算出する算出ステップと、
前記オブジェクトらしさに関する尤度をもとにVisual Hullの整形を行う第1の整形ステップと、
前記Visual Hullの整形が収束するまで、前記算出ステップと前記第1の整形ステップを繰り返し適用する第1の収束ステップと、
前記収束ステップのVisual Hullから獲得される3次元形状モデルのテクスチャ状態を評価する評価ステップと、
前記3次元形状モデルのテクスチャ状態の評価をもとに3次元形状モデルの整形を行う第2の整形ステップと、
前記3次元形状モデルの整形が収束するまで、前記評価ステップと前記第2の整形ステップを繰り返し適用する第2の収束ステップと、
を含むことを特徴とする3次元形状モデルを復元する方法。
【請求項2】
前記算出ステップは、
前記Visual Hullの表面に存在する各ボクセルを各撮影カメラ視点に投影し、
撮影カメラ間における投影画素値の分散を算出し、
前記分散を正規化することで前記オブジェクトらしさに関する尤度を算出することを特徴とする請求項1に記載の方法。
【請求項3】
前記第1の整形ステップは、
3次元ボクセル空間における各ボクセル間の隣接関係を考慮したエネルギー関数を定義し、
前記エネルギー関数を最小化する枠組みで、各ボクセルを被写体領域または背景領域のいずれかに割り当てることで被写体領域を決定し、背景領域を不要部として除去することで、整形を行うことを特徴とする請求項1または2に記載の方法。
【請求項4】
前記第1の収束ステップは、
前記不要部の除去を適用する前後の3次元形状モデルを比較し、
表面として指定したボクセルより内側のボクセルが削られていない場合を収束とすることを特徴とする請求項3に記載の方法。
【請求項5】
前記評価ステップは、
各撮影カメラ視点で、前記3次元形状モデルをもとに生成される自由視点画像と、前記撮影カメラ画像との差分画像を抽出することを特徴とする請求項1から4のいずれか1項に記載の方法。
【請求項6】
前記第2の整形ステップは、
各撮影カメラ視点において、前記差分画像の画素間での隣接関係を考慮したエネルギー関数を定義し、
前記エネルギー関数を最小化する枠組みで、各画素を被写体領域または背景領域のいずれに割り当てるかを決定し、
背景領域と判断される整形候補内に存在する画素の光線を探索し、前記3次元形状モデルとの交点を不要部として除去することで、前記3次元形状モデルの整形を行うことを特徴とする請求項5に記載の方法。
【請求項7】
前記第2の収束ステップは、
前記不要部の除去を適用する前後の3次元形状モデルを比較し、
削られるボクセル数が、一定数以下である場合を収束とすることを特徴とする請求項6に記載の方法。
【請求項8】
多視点のカメラ画像から被写体の3次元形状モデルを復元するためのコンピュータを、
各カメラの被写体シルエット画像から視体積交差法により復元されるVisual Hullの表面に存在するボクセルのオブジェクトらしさに関する尤度を算出する算出手段と、
前記オブジェクトらしさに関する尤度をもとにVisual Hullの整形を行う第1の整形手段と、
前記Visual Hullの整形が収束するまで、前記算出手段と前記第1の整形手段を繰り返し適用する第1の収束手段と、
前記収束ステップのVisual Hullから獲得される3次元形状モデルのテクスチャ状態を評価する評価手段と、
前記3次元形状モデルのテクスチャ状態の評価をもとに3次元形状モデルの整形を行う第2の整形手段と、
前記3次元形状モデルの整形が収束するまで、前記評価手段と前記第2の整形手段を繰り返し適用する第2の収束手段と、
して機能させ、3次元形状モデルを復元することを特徴とするプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate


【公開番号】特開2012−208759(P2012−208759A)
【公開日】平成24年10月25日(2012.10.25)
【国際特許分類】
【出願番号】特願2011−74340(P2011−74340)
【出願日】平成23年3月30日(2011.3.30)
【出願人】(000208891)KDDI株式会社 (2,700)
【Fターム(参考)】