仮想視点画像生成方法および仮想視点画像生成装置
【課題】被写体にオクルージョン(遮蔽)がある場合でも、極端な画像の劣化を防止し、かつ、短時間で画像を生成する。
【解決手段】各投影点毎に、各投影点に対応する被写体の複数の画像の対応点間の相関度を算出するステップDと、前記各投影点における相関度に基づいて、前記各投影点に物体の表面が存在する確率である存在確率を決定するステップEとを有し、ステップDは、被写体の複数の画像の中から選んだいくつかの画像の組み合わせであるカメラセットを複数組用意し、各カメラセットに含まれる画像の各投影点に対応する対応点から各投影点について相関度を求め、前記ステップEは、前記カメラセット毎に求めた前記各投影点の相関度に基づき、カメラセットの代表となる1つの視点位置である代表視点を通る直線上の値の合計が一定値となる正規化処理を施した部分存在確率を算出し、カメラセット毎に決定した部分存在確率の統合処理をして前記各投影点の存在確率を決定する。
【解決手段】各投影点毎に、各投影点に対応する被写体の複数の画像の対応点間の相関度を算出するステップDと、前記各投影点における相関度に基づいて、前記各投影点に物体の表面が存在する確率である存在確率を決定するステップEとを有し、ステップDは、被写体の複数の画像の中から選んだいくつかの画像の組み合わせであるカメラセットを複数組用意し、各カメラセットに含まれる画像の各投影点に対応する対応点から各投影点について相関度を求め、前記ステップEは、前記カメラセット毎に求めた前記各投影点の相関度に基づき、カメラセットの代表となる1つの視点位置である代表視点を通る直線上の値の合計が一定値となる正規化処理を施した部分存在確率を算出し、カメラセット毎に決定した部分存在確率の統合処理をして前記各投影点の存在確率を決定する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、仮想視点画像生成方法および仮想視点画像生成装置に係り、特に、被写体にオクルージョン(遮蔽)がある場合に有効な技術に関する。
【背景技術】
【0002】
近年、コンピュータグラフィックス(CG)やバーチャルリアリティ(VR)の分野では、複数の視点位置のカメラで撮影された画像(多視点画像)をもとに、カメラが設置された視点位置からだけでなく、利用者が望む視点位置(目的視点)から見た被写体の画像(目的画像)をコンピュータにより生成する技術が盛んに研究されている。
これらの技術の多くでは、多視点画像を入力として、まず被写体の3次元幾何的モデルを推定し、次にモデルの表面の色(モノクロ画像の場合は輝度)を推定し、最後に3次元モデルに対し透視射影や正射影などの2次元変換を行って2次元の目的画像を出力するという大きく3つのプロセスを経る。
このうち、最後の3次元モデルから2次元画像への変換処理は、多くの方式において共通のアルゴリズムを用いられているため、幾何的なモデルの推定および色の推定のアルゴリズムが、生成される画質に影響すると言える。
特に、撮影された多視点画像において、ある視点位置から撮影された画像において見えている被写体の部分が、ある他の視点位置からは隠れて撮影されていない場合、すなわち元となる多視点画像がオクルージョン(遮蔽)を含む場合、幾何的なモデルの推定と色の推定が共に難しいことが知られている。
【0003】
なお、本願発明に関連する先行技術文献としては以下のものがある。
【非特許文献1】Okutomi,M.and Kanade,T.:”A multiple-baseline stereo,”Pattern Analysis and Machine Intelligence,IEEE Transactions on,Vol.15,no.4pp.353-363,Apr 1993.
【非特許文献2】Michael Potmesil,”Generating octree models of 3D objects from their Silhouettes in a sequence of images,”Computer Vision,Graphics,and Image Processing,v.40n.1,p.1-29,Oct.1987.
【非特許文献3】Richard Szeliski:”A Multi-View Approach to Motion and Stereo,”In CVPR’99.Vol.1,PP.157-163,Fort Collins,June 1999.
【非特許文献3】C.L.Zitnick,S.B.Kang,M.Uyttendaele,S.Winder,and R.Szeliski.:”High-quality video view interpolation using a layered representation.”In Proceedings of SIGGRAPH 2004,pp.600-608,2004.
【非特許文献5】P.E.Debevec,C.J.Taylor,and J.Malik:”Modeling and Rendering Architecture from Photographs:A Hybrid Geometry-and Image-Based Approach,”SIGGRAPH’96,pp.11-20,1996.
【非特許文献6】Gregory G.Slabaugh,Ronald W.Schafer,and Mat C.Hans:”Image-Based Photo Hulls for Fast and Photo-Realistic New View Synthesis,”Real-Time Imaging,Vol.9,No.5,October 2003.
【発明の開示】
【発明が解決しようとする課題】
【0004】
以下では、既存の手法における幾何的なモデルの推定方法と色の推定方法について、先行研究が採用している手法を述べる。
まず、幾何モデルを推定する方法の代表的なものとして、ステレオ法がある。ステレオ法においては、多視点画像で撮影されている被写体上の同一の点(対応点)を特定し(対応点マッチング)、三角測量の原理でその距離を求める。
多くの対応点マッチングにおいては、想定する奥行きにおける各画像の対応点および周辺領域の色(または輝度)の差により評価関数を設定し、この評価関数を最小となる奥行きを推定値とする。
しかし、ステレオ法を利用した多くの手法においては、すべてのカメラにより対応点が見えていることを仮定している。
よって、対応点がいくつかの画像において隠れている領域(以下、オクルージョン領域)においては、幾何モデルの推定の信頼性(存在確率)は著しく低下する。
カメラの数を多くすることで、オクルージョンが生じているカメラの画像の影響を相対的に小さくするマルチベースライン法(前記非特許文献1参照)も考案されているが、オクルージョン領域付近では効果が十分とは言えず、推定の信頼性が低下する傾向がある。
【0005】
また、幾何モデルの推定法としてステレオ法と並んで代表的な方法に、視体積交差法(Shape from Silhouette)と呼ばれる方法(前記非特許文献2参照)がある。視体積交差法においては、多視点画像における被写体の輪郭をもとに、3次元空間中で被写体が占める領域を求める。
しかし、この方法は原理的に被写体が凸形状であることを仮定しているため、凹形状の被写体に対しては正しくモデルを取得することができない。また、そもそも背景画像と被写体の輪郭を正確に抽出する最初の過程自体が難しく、未だコンピュータ・ビジョン分野における主要な研究課題となっている。
よって、映画の特撮などでよく使われるブルーバックと呼ばれる単色の背景を用いる必要があるなど、撮影条件は限定されることが多い。
【0006】
さて、撮影画像がオクルージョンを含むということは、ある方向からは見ることができ、ある方向からは見ることのできない状況であると言える。よって、位置の近いカメラにおいては被写体を見る方向が類似し、結果として撮影される被写体の遮蔽関係も類似することが多い。
そのため、すべてのカメラからの画像を同等に用いて奥行きを推定するのではなく、位置の近いカメラだけで奥行きを推定した方がオクルージョンの影響を受けにくく、推定の信頼性が向上する場合がある。
このことを利用し、まず位置が近いカメラを用いて部分的な評価関数を設定し、そして部分的な評価関数の合成関数として全体的な評価関数を設定し、その全体的な評価関数を最小とするような奥行きを推定する方法が提案されている(前記非特許文献3参照)。
しかし、合成された評価関数を最小とする最適解を求めるには、繰り返し演算により非常に時間のかかる処理を必要とするため、実時間処理には向かない。
【0007】
一方、複数の位置からの奥行きマップを求め、統合する研究例(前記非特許文献4参照)がある。
しかし、一旦、各視点にて奥行きマップを求めたあと、それらを統合する処理においては、複数の奥行きマップのブレンディングにおいて、推定の信頼性を考慮に入れていない。よって、推定の信頼性の低い奥行きマップの推定値が統合後の奥行きマップに反映される恐れがある。
次に、色の推定としては、視点依存テクスチャマッピング(前記非持許文献5参照)という方法がよく用いられる。
視点依存テクスチャマッピングでは、被写体の着目する点の色を決定する際、複数のカメラの対応点における色を重み付きブレンディングすることで決定し、その重み係数は、着目点から目的視点までの直線およびカメラの視点までの直線のなす角により決定され、その角度が小さいほど重みが大きく設定される。すると、被写体の着目点から目的視点に飛来する光線と角度が近い光線ほど、大きな比重で色がブレンディングされる。
しかし、オクルージョンが生じている場合、光線の角度が近いからといって、目的視点とカメラ視点において、被写体表面上の同一の点を撮影しているとは限らない。すなわち、色の正確な推定のためには、隠れていない色のみを用いて色のブレンディングを行う必要がある。
【0008】
よって、どのカメラで隠れが生じているかを被写体形状より判断する可視性判断(Visibility Check)を行う先行研究がある(前記非特許文献6参照)。
しかし、可視性判断のためには幾何モデルが必要である一方で、そもそも幾何モデルの推定には、カメラの対応点間における色の一致度を用いるため、隠れが生じているカメラを除外するための可視性判断が必要となる。すなわち、可視性判断のためには正確な幾何モデルが必要であり、幾何モデルの推定のためには可視性判断が必要となり、両者は相互に依存している。
そのため、幾何モデルの推定を収束するまで繰り返すという処理が行われることが多いが、そうすると計算機負荷が高くなり、結果として処理速度が遅くなるという欠点がある。
また、可視性判断として、見えているか・見えていないかの2者択一であるため、収束に時間がかかり、また、誤りが生じたときに画像に与える影響が大きいと言える。
本発明は、前記従来技術の問題点を解決するためになされたものであり、本発明の目的は、複数の視点位置で撮影された被写体の画像を元にして所望の視点から見た画像を生成する画像生成方法および画像生成装置において、被写体にオクルージョン(遮蔽)がある場合でも、極端な画像の劣化を防止し、かつ、短時間で画像を生成することが可能となる技術を提供することにある。
本発明の前記ならびにその他の目的と新規な特徴は、本明細書の記述及び添付図面によって明らかにする。
【課題を解決するための手段】
【0009】
本願において開示される発明のうち、代表的なものの概要を簡単に説明すれば、下記の通りである。
(1)複数の異なる視点から被写体を撮影した被写体の複数の画像に基づき、任意の仮想位置の基準視点から見た前記被写体の画像を生成する仮想視点画像生成方法であって、前記複数の異なる視点から被写体を撮影した前記被写体の複数の画像を取得するステップAと、仮想的な3次元空間中に前記基準視点から見て奥行き位置の異なる多層構造の投影面を設定するステップBと、前記複数の投影面上の前記基準視点から見て重なり合う複数の投影点と対応する前記取得した前記被写体の複数の画像の対応点の色情報または輝度情報から、前記各投影点の色情報または輝度情報を決定するステップCと、前記各投影点毎に、前記被写体の複数の画像の前記各投影点に対応する対応点間の相関度を算出するステップDと、前記各投影点における相関度に基づいて、前記各投影点に物体の表面が存在する確率を表す存在確率を決定するステップEと、前記各投影点の色情報または輝度情報と、前記各投影点での存在確率に基づいて、前記基準視点から見た前記被写体の画像を生成するステップFとを有し、前記ステップDは、前記被写体の複数の画像の中から選んだいくつかの画像の組み合わせであるカメラセットを複数組用意するステップD1と、前記各カメラセットに含まれる各被写体の画像上の前記各投影点に対応する対応点から、前記各投影点について相関度を求めるステップD2とを有し、前記ステップEは、前記カメラセット毎に求めた前記各投影点の相関度に基づき、カメラセットの代表となる1つの視点位置である代表視点を通る直線上の値の合計が一定値となる正規化処理を施した部分存在確率を算出するステップE1と、前記カメラセット毎に決定した部分存在確率の統合処理をして前記各投影点の存在確率を決定するステップE2とを有する。
【0010】
(2)(1)において、前記ステップFは、前記各投影点の色情報または輝度情報を前記存在確率の高さに応じた割合で混合して、生成する画像上の点の色情報または輝度情報を決定し、1枚の2次元画像を生成するステップである。
(3)(1)において、前記ステップFは、前記各投影点の色情報または輝度情報を、前記存在確率の高さと投影面の基準視点からの距離に応じた割合で混合して、生成する画像上の色情報または輝度情報を決定し、2枚以上の2次元画像を生成するステップである。
(4)(1)ないし(3)の何れかにおいて、前記ステップCは、それぞれのカメラセットに属する各被写体の画像の対応点の色情報または輝度情報から、前記各投影点におけるカメラセットごとの投影点の色情報または輝度情報を決定するステップC1と、前記各投影点におけるカメラセットごとの部分存在確率の高さに応じてカメラセットごとの寄与率を決定するステップC2と、前記各投影点におけるカメラセットごとの色情報または輝度情報を、カメラセットごとの寄与率の高さに応じた割合で混合し、前記各投影点の色情報または輝度情報を決定するステップC3とを有する。
【0011】
(5)(4)において、前記ステップCは、前記カメラセットごとの寄与率に対し、前記各投影点と前記カメラセットの代表視点とを結ぶ線分上にある他の投影点の存在確率に応じた係数を更に乗じ、新たなカメラセットごとの寄与率を決定するステップC4を有する。
(6)(1)ないし(5)の何れかにおいて、前記ステップE2は、着目する投影点において異なるカメラセットから算出された複数の部分存在確率に、バイアス値を加算し、加算後の部分存在確率に投影面ごとに定めた係数を乗算して統合した存在確率を算出するステップE21と、前記各投影点において統合した存在確率を正規化処理するステップE22とを有する。
(7)(6)において、前記バイアス値あるいは投影面ごとの係数は、着目する投影点と前記基準視点とを結ぶ線分上の他の投影点の存在確率に依存し、それらが大きいほど抑制される。
また、本発明は、(1)ないし(7)の仮想視点画像生成方法を実施する仮想視点画像生成装置である。
【発明の効果】
【0012】
本願において開示される発明のうち代表的なものによって得られる効果を簡単に説明すれば、下記の通りである。
本発明によれば、複数の視点位置で撮影された被写体の画像を元にして所望の視点から見た画像を生成する画像生成方法および画像生成装置において、被写体にオクルージョン(遮蔽)がある場合でも、極端な画像の防止し、かつ、短時間で画像を生成することが可能となる。
【発明を実施するための最良の形態】
【0013】
以下、図面を参照して本発明の実施例を詳細に説明する。
なお、実施例を説明するための全図において、同一機能を有するものは同一符号を付け、その繰り返しの説明は省略する。
本発明の画像生成方法は、撮影視点が異なる複数枚の画像から、前記画像に写っている物体の3次元情報を取得し、前記物体の3次元像を提示する画像、あるいは任意の視点から前記物体を見たときの画像を生成する方法である。
このとき、前記物体の3次元情報は、テクスチャマッピングの手法を用い、多層構造の投影面を設定して、前記観察者の視点(基準視点)から見たときの物体の表面上の各点が存在する確率を推定する。
前記物体の表面が存在する確率を推定するときには、例えば、前記観察者の視点(基準視点)から見て重なり合う各投影面上の点(以下、投影点という)に対して、前記投影点と対応する各画像上の点(以下、対応点という)の相関度を求める。
そして、前記観察者の視点(基準視点)から見て重なり合う各投影点の相関度の高さから、前記重なり合う投影点のうち、どの投影点の近傍に前記物体の表面が存在するか推定する。
【0014】
ただし、本発明の画像生成方法では、前記観察者の視点(基準視点)から見て重なり合う複数の投影点のうち、どの投影点の近傍に前記物体の表面が存在するかということを考えるのではなく、前記各投影点の近傍に、前記各投影点の相関度の大きさに応じた割合で物体の表面が存在すると考える。
このとき、本発明の画像生成方法では、複数の視点で撮影した画像の中から選んだいくつかの画像の組み合わせ(カメラセット)ごとに前記投影点の相開度を求め、それをもとに各投影点、もしくはその近傍に物体の表面が存在する確率(部分存在確率)をカメラセット毎に決定する。そして、前記カメラセット毎に決定した部分存在確率の統合処理をして、観察者の視点(基準視点)における前記各投影点の存在確率を決定する。
この際、着目する投影点と観察者の視点(基準視点)を結ぶ線分上にある他の投影点の存在確率に依存した統合処理を施し、観察者の視点(基準視点)から見て着目する投影点の手前で高い存在確率を持つ場合には、着目する投影点における存在確率が高くなることを抑止する。
【0015】
このようにして、前記投影面を観察している観察者から見て、前記物体表面までの距離の推定が難しい部分を曖昧に描画し、不連続なノイズ等を目立ちにくくするとともに、オクルージョン(遮蔽)により前記投影点を撮影していないカメラの画像の影響を少なくすることで、前記相関度の高さの信頼性が向上し、前記存在確率の信頼性も向上する。
さらに、前記被写体の3次元情報に基づいて画像を生成するときに、前記投影点の色情報を前記生成する画像上の各点の色情報に割り当てるときに、前記統合された存在確率の高さに応じた寄与率で割り当てる。
ここで、投影点の色情報は、部分存在確率の高さに応じた寄与率でカメラセットに含まれるカメラの対応点を混色することや、さらに前記のカメラセット毎の寄与率に対し、着目する投影点とカメラセットの代表視点とを結ぶ線分上にある他の投影点の存在確率に応じた係数を更に乗じ、新たなカメラセットごとの寄与率とすることで、投影点を撮影していないカメラの対応点の色の寄与を少なくすることができ、色の再現性が向上する。
【0016】
<原理説明>
図1乃至図9は、本発明の画像表示方法の原理を説明するための模式図であり、図1は画像生成の座標設定の一例を示す図、図2は被写体表面の色情報および存在確率情報を求める多層の投影面の一例を示す図、図3は複数のカメラ間の対応点を説明した図、図4はカメラで撮影された画像を投影面上に透視投影した一例を示す図、図5は観察者の視点(基準視点)とカメラのなす角度によりカメラ毎の色の寄与率(重み)を決定する一例を示す図、図6は従来法による画像生成の処理フローの一例を示した図、図7はオクルージョンが発生している状況の一例を示す図、図8は着目する投影点よりも手前の投影点の存在確率の累計を説明した図、図9は本発明の実施例の画像生成の処理フローの一例を示した図である。
【0017】
【0018】
【0019】
【数1】
ここで、αu、αvはカメラの焦点距離および画素ピッチにより規定されるパラメータ、u0,v0は画像の中心位置を表すパラメータである。
また、回転行列Riは3×3の行列であり、その成分を下記(3)式とおくと、ベクトルri(1)、ri(2)、ri(3)は互いに直行する単位ベクトルとなる。
【0020】
【数2】
また、並進ベクトルtiは3次元の列ベクトルであり、下記(4)式のように表される。
【0021】
【数3】
【0022】
【0023】
【数4】
【0024】
ここで、投影点が同一の投影面に存在する場合、投影点Mと観察者の視点(基準視点)における点mは一対一写像となり、観察者の視点(基準視点)の画像座標により投影面Lj上の投影点の位置を一意に示すことができる。
そこで、以下では、ある特定の投影面に着目した際の投影点を観察者の視点(基準視点)の画像座標mにより表すことにする。また一方で、異なる投影面に存在するいくつかの投影点が観察者の視点(基準視点)を通る同一直線上にある場合、観察者の視点(基準視点)の画像座標では同一の座標で表される。
すなわち、図2に示すとおり、前述の(5)式により、mに写像される投影点の集合
{Mj|j∈J}は観察者の視点(基準視点)Vを通る同一直線上にある。
【0025】
<画像生成原理>
ここで、投影面上Ljの座標mにおける色をTvj(m)、被写体表面の存在確率をqVj(m)とおく。添え字Vは、観察者の視点(基準視点)Vの画像座標系で表していることを示す。
すると、{TVj(m)|j∈J}と{qVj(m)|j∈J}はそれぞれ観察者の視点(基準視点)Vを通る直線上の色の集合および存在確率の集合となる。
そして、本発明において、観察者の視点(基準視点)Vにおける画像を生成する基本となる処理は、下記(6)式に示す演算により表される。
【0026】
【数5】
【0027】
すなわち、観察者の視点(基準視点)Vから見て同一直線上にある投影点の色にその存在確率を乗算したものを加算していくことで、同一直線上にある投影点の色を期待値として取得し、画像を生成する。
このように、観察者の視点(基準視点)における画像生成法は、前述の(6)式により表されるが、(6)式中のqvj(m)およびTvj(m)をいかにして推定するかが、生成画像の品質を決定する大きな要因となり、本発明の特徴となる。
そこで以下では、対比としてまた出発点として、従来の推定法の一例について述べる。
<従来法による存在確率と色マップの推定>
まず、存在確率qvj(m)は投影面Lj上の観察者の視点(基準視点)座標mの位置に被写体表面が存在する確率を表す関数であり、次の条件を満たす。
【0028】
【数6】
【0029】
すなわち、観察者の視点(基準視点)Vを通る直線上の投影点における存在確率は0から1の間の値をとり、その合計が1となっている。ただし、本発明は合計値が厳密に1となっている場合のみに限定されるものではなく、何らかの正規化処理がされていることをその本旨とする。
この存在確率の推定法は、複数のカメラ{Ci|i∈I}の複数の対応点における色もしくは輝度の相関により求める。
対応点とは、図3に示すように、同一の投影点が、前述の(5)式により写像されたとき、それぞれのカメラの画像上で対応する点とする。このとき、対応点同士が近い色(もしくは輝度)をもつほど、対応点のもととなる投影点上に被写体の表面が存在する確率が高い。
すなわち、図3において、投影点P上に被写体表面が存在する場合、同一の被写体表面上の点が各カメラで対応点にて結像されている。この場合、異なるカメラの対応点同士が近い色(もしくは輝度)をもつ可能性が高い。
一方、投影点Q上に被写体表面が存在しない場合、各カメラの対応点では、異なる被写体表面上の点Qi,Qi+1が結像されている。
この場合は、異なるカメラの対応点同士が近い色(もしくは輝度)をもつ可能性は低い。
ここで、観察者の視点(基準視点)の画像座標においてmにある投影面Lj上の投影点の対応点の集合は、それぞれのカメラの画像座標において、下記(8)で与えられる。
【0030】
【0031】
【数9】
【0032】
ここで、djは観察者の視点(基準視点)から投影面Ljまでの距離、nは観察者の視点(基準視点)座標系における法線ベクトルである。
すると、投影面Ljで関連づけられる対応点の色の集合は、下記(10)式で表される。
【0033】
[数10]
{Ii(mij)|i∈N} ・・・・・・・・・・ (10)
ここで、図4に示すように、各カメラの視点を中心として各カメラの画像を投影面Lj上に透視投影し、観察者の視点(基準視点)Vの画像座標系で表したものをIVij(m)とすると、下記(11)式の関係がある。
【0034】
【数11】
ここで、HiVjは、投影面Ljを介してカメラCiの画像座標から観察者の視点(基準視点)Vの画像座標に変換するホモグラフィ行列である。よって、(10)式の対応点の色の集合は、観察者の視点(基準視点)Vの画像座標系で、下記(12)式として表すことができる。
【0035】
[数12]
{IVij(m)|i∈N} ・・・・・・・・・(12)
【0036】
前述の(10)式が、それぞれのカメラの座標系の異なる位置mijによる表現であるのに対し、(12)式は観察者の視点(基準視点)の座標系の共通の位置mにおける表現となり、前述の(11)式の処理をすることで異なるカメラの対応点を参照する際に共通の座標を用いることができ、効率が向上する。
ただし、本発明は対応点の参照としてこのような形態に限定されるものではない。
ここで、{IVij(m)|i∈N}の各色成分(例えば[R,G,B]値)の分散値を合計したものをσ2(m)とおく。
すると、投影面Ljの位置mにおける対応点の相関の度合いは、例えば、下記(13)式と表すことができる。また別の例としては下記(14)式のように表すことができる。
【0037】
【数13】
【0038】
【数14】
【0039】
ここで、n,ε,τは調整用のパラメータである。
SVj(m)の値が大きいほど画像間の相関が高い。また、ここでは対応点の一画素ごとに相関値をとったが、対応点付近の領域に含まれる画素の相関値の合計値をとることで、平滑化の効果を持たせることもできる。
このようにして計算した相関の度合いを用いると、前述の(7)式の条件を満たす存在確率は、例えば、下記(15)式のように算出することができる。
【0040】
【数15】
【0041】
以上が、観察者の視点(基準視点)から見た投影面上の投影点の存在確率qvj(m)を求める手法の一例である。
次に、観察者の視点(基準視点)Vから見た投影点の色Tvj(m)は、下記(16)式に示すように、各カメラの対応点の色を適切な重みをつけて混合することにより設定することができる。
【0042】
【数16】
【0043】
ここで、Ivij(m)はカメラCjの画像を投影面Ljに投影した画像であり、wvij(m)は投影面LjにおけるカメラCjの重み係数である。
Ivij(m)は前述の(11)式により求めることができるため、wvij(m)を推定することで、Tvj(m)も求めることができる。
wvij(m)の推定は、従来法においては、図5において、近接する光線ほどその色情報が近いという前提により、PVとPCiのなす角度θijにより、重みwvij(m)を決定していた。
その一例として、下記(17)式、(18)式で決定することができる。
【0044】
【数17】
【0045】
【数18】
【0046】
ここで、κは調整用のパラメータである。
例えば、図5では、角度θij<θ(i+1)jとなり、重みwvij(m)>wv(i+1)j(m)となる。
以上、従来法において観察者の視点(基準視点)の画像を生成する方法および、そこで必要となる投影点の存在確率および色(もしくは輝度)情報の求め方について述べた。
上記の処理フローを示した一例を図6に示す。図6中、処理を長方形で、データを角丸長方形で表している。
途中、左右にフローが分かれる箇所があるが、左側のフローで色情報を算出し、右側のフローで存在確率の情報を算出し、最終的に両者を用いて目的となる画像を生成している。
即ち、ステップ10において、カメラパラメータ{Ai,Ri,ti|i∈N}、{AV,RV,tV}に基づき、前述の(17)式、あるいは(18)式に示す計算式により、重みマップ{wVij(m)|i∈N,j∈J}を計算する。
また、ステップ11において、カメラパラメータ{Ai,Ri,ti|i∈N}、{AV,RV,tV}と、カメラ画像{Ii(m)|i∈N}とに基づき、前述の(11)式に示す計算式により、基準視点Vを中心としたカメラ画像の投影画像{IVij(m)|i∈N}を生成する。
また、ステップ12において、重みマップ{wVij(m)|i∈N,j∈J}と、投影画像{IVij(m)|i∈N}とに基づき、前述の(16)式に示す計算式により、色マップ{TVj(m)|j∈J}を生成する。
また、ステップ13において、投影画像{IVij(m)|i∈N}に基づき、前述の(13)式、(14)式、(15)式に示す計算式により、存在確率{qVj(m)|j∈J}を生成する。
最後に、ステップ14において、色マップ{TVj(m)|j∈J}と、存在確率{qVj(m)|j∈J}とに基づき、前述の(6)式に示す計算式により、基準視点Vから見た画像{IV(m)}を生成する。
【0047】
<オクルージョンのあるシーンでの従来法の不具合>
さて、シーンが不連続な奥行きを持つ場合、あるカメラからは撮影できて、あるカメラからは撮影できない箇所があり、このような現象は一般にオクルージョンと呼ばれる。
本発明で開示する手法は、このような場合においても、存在確率および色の推定の精度を高めることにその特徴のひとつがある。
例えば、図7において、いちどにすべてのカメラ集合{Cl,C2,C3,C4}を用いて従来法で存在確率の推定を行うと、隠れている部分も含めて対応点の相関度を計算してしまうので、それを元に求められる存在確率の信頼性が低下してしまう。
それに対し、カメラ部分集合ごとに分けて存在確率を求めることで、あるカメラ部分集合においては構成するカメラの多くが着目する被写体表面上の点を撮影し、その箇所において高い部分存在確率を算出することになる。
逆に、あるカメラ部分集合においては構成するカメラの多くが着目する被写体表面上の点を撮影していないこともあり、この場合は算出される部分存在確率は低くなる。
しかし、その後の統合処理において、高い部分存在確率の影響が大きく、低い部分存在確率の影響が低くなる演算を行うことで、前者が後者を補う働きをし、結果として統合された存在確率の信頼性は高くなる効果がある。
既存技術に見られるように、個々のカメラセットにおいて奥行きの情報のみを求め、それらを取捨選択や平均するなどして奥行き情報を統合する方法に比べ、本発明ではカメラセットごとの推定の信頼性の情報も考慮して統合することにより、より確度の高い被写体の3次元情報を算出する効果があると言える。
例えば、図7において、P1はカメラ部分集合{C1,C2}を用いて推定すると存在確率の信頼度が低いが、カメラ部分集合{C3,C4}を用いると存在確率の信頼度が高まる。逆に、P2はカメラ部分集合{C1,C2}を用いて推定すると存在確率の信頼度が高く、カメラ部分集合{C3,C4}を用いると存在確率の信頼度が低い。
そして、仮想視点Vからの存在確率の信頼度に統合し、それぞれのカメラ部分集合の推定のうち、信頼度の高い部分の影響が大きくなるようにする。
【0048】
<本発明による画像生成法>
以下では、カメラ部分集合ごとの存在確率の推定法について述べる。
カメラ部分集合はそのメンバの中に基準となるカメラ(基準カメラ)を持ち、そこがカメラ部分集合を代表する視点(以下、代表視点)となる。
そして、代表視点の座標系において投影面Ljにおける部分存在確率qkm(m)の推定を行う。
まず、カメラ部分集合をΞk={Ci|i∈Nk}とおく。ここでkはカメラ部分集合を示す添え字である。
また、カメラ部分集合のうち基準カメラを{Ci(k),i(k)∈Nk}とおく。例えば、図7の場合、Ξ1={C1,C2}と、Ξ2={C3,C4}となる2つのカメラ部分集合があり、C1とC3がそれぞれ基準カメラの場合、Ci(1)=C1,Ci(2)=C3となる。
ここでは簡単のため、すべての部分集合における存在確率は共通のレイヤLj上で推定するものとする。
まず、カメラ部分集合Ξkにおける基準カメラと他のカメラとの不一致度は、SSAD(Sum of Square Absolute Differences)により、下記(19)式のように計算される。
【0049】
【数19】
【0050】
ここで、Ik(m)は基準カメラCi(k)における画像、Ikij(m)は平面Ljを投影面として、カメラCiの画像を基準カメラCi(k)の座標系に投影変換した画像を示す。すなわち、下記(20)式となる。
【0051】
【数20】
【0052】
ここで、Hikjは平面Ljを介してカメラCiから基準カメラCi(k)の画像座標に変換するホモグラフィ行列である。
また、|x|はxのL1ノルムを表し、Bは対応点付近のブロック領域を表す。
そして、カメラ部分集合Ξkにより推定される基準カメラCi(k)における部分存在確率qkj(m)は、例えば、下記(21)式のように計算される。
【0053】
【数21】
【0054】
【0055】
【数22】
【0056】
ここで、Hkvjは、投影面Ljを介して基準カメラCkから観察者の視点(基準視点)Vの画像座標に変換するホモグラフィ行列である。
次に、カメラ部分集合毎の存在確率qvkj(m)を統合処理し、観察者の視点(基準視点)からの存在確率を求める。
その一例としては、下記(23)式、(24)式のとおり、全ての部分集合の存在確率qvkj(m)を掛け合わせて、さらにすべての投影面について正規化処理を行い、統合的な存在確率qvj(m)を得ることができる。
【0057】
【数23】
【0058】
【0059】
また、投影面の奥行きに応じてバイアス値を変化させ、例えば、奥の投影面ほど小さく、手前の投影面ほど大きく設定すると、手前の投影点の存在確率の方が大きく算出される傾向がある。
このことで、観察者の視点(基準視点)から見て複数の被写体の表面が重なっている場合でも、手前の被写体が優位に描画され、奥の被写体が透けて描画されてしまうことを抑止することができる。
また、特定の領域のバイアス値のみ0以上の値、その他を0と設定した場合、特定の領域にある被写体を強調した画像を生成することができる。
また、手前の存在確率に依存して、例えば、下記(25)式のバイアス値とすると、着目する投影点よりも手前の投影点の存在確率の累計が大きいほどバイアス値が小さくなり、結果として着目する投影点においては存在確率が抑制されて推定される。
【0060】
【数25】
ここでf(x)は正の値を返す単調減少の関数であり、例えば以下のように与えられる。
【0061】
【数26】
【0062】
【0063】
【数27】
【0064】
【0065】
【0066】
以上、カメラの部分集合ごとの部分存在確率を統合することにより、観察者の視点(基準視点)からの存在確率qVj(m)の推定を行った。
なお、カメラセットはなるべく近傍同士のカメラで構成するのが効果的であり、そうすることで、撮影画像に映っている被写体のオクルージョン傾向が類似し、相関値の計算の信頼性が高くなる。
また、代表視点の位置は任意でもよいが、代表視点の選び方の例としては、カメラセットを構成するカメラのうち、中心に位置するカメラ位置を代表視点する方法がある。
さらに、後述するカメラセットごとの寄与率は、基準視点を与えたときに計算される。すなわち、カメラセットの寄与率は、基準視点とカメラセットとの相対的な位置に依存する。そして、寄与率はカメラセットごとに与えられ、属するカメラごとには算出されない。
【0067】
また、本実施例では、カメラの部分集合ごとの部分存在確率をもとにして、カメラ寄与率マップwij(m)を求める。
従来技術では、前述の(17)式、(18)式に示したように、光線の角度をもとにして求めているが、オクルージョンのあるシーンの場合、2つの光線CiPとCvPのなす角度が小さくても、2つの光線の間に遮蔽物がない保証はない。
例えば、図7においては、θ1j<θ3jであるが、C1の視点位置からはP1はQに遮られており、P1の画像を撮影できていないため、W1jを大きくしてC1の画像の寄与を高くすると、P1の代わりにQの色の寄与が大きくなってしまい、画質が低下する。
そこで、本発明では以下のように、色の寄与率を部分存在確率に連動させ、着目する投影点において高い部分存在確率を持つカメラ部分集合の基準カメラほど高い寄与率を割り振るようにする。
例えば、簡易な形態としては、下記(29)式に示すものがある。
【0068】
【数29】
【0069】
このようにすれば、存在確率が高くなるカメラ部分集合の基準カメラの重みが大きくなる。存在確率が大きくなるということはそのカメラ部分集合にて、多くのカメラで被写体表面を撮影していることであるから、着目する部位でオクルージョンのないカメラ部分集合ほど、重みが大きくなることになる。
ただし、前述の(24)式は、カメラ部分集合毎の寄与率であるため、これを個々のカメラ毎の寄与率として表すと、下記(30)式と表され、前述の(6)式の画像生成式に用いることができる。
【0070】
【数30】
【0071】
また、前述の(17)式、(18)式のように、幾何的な位置関係により決定する重みと、前述の(29)式のようにカメラ部分集合ごとの存在確率により決定する重みとを、両方を考慮し、両者の関数として最終的な重みを決定するともできる。
さらに、(30)式に基準カメラから見て手前の投影面にある存在確率の累計を反映させた項をさらに乗じて、下記(31)式とすることで、基準カメラから見て着目する投影点がどの程度の隠れているかを考慮して、カメラ部分集合カメラ毎の寄与率を決定することができる。
【0072】
【数31】
【0073】
【0074】
<画像生成の手順(フロー図)>
以上で述べた画像生成原理を用いて画像を生成する手順を図9に示す。
図中、処理を長方形で、データを角丸長方形で表している。
投影面の色情報と存在確率情報に、前述の(6)式で表される演算を用い、最終的に基準カメラから見た画像を生成するところは従来法と同様である。
しかし、従来法がすべてのカメラCi(i∈N)をいちどに用いて存在確率情報を求めるとともに、各カメラの色の寄与率(重みマップ)はカメラと観察者の視点(基準視点)の位置関係により決定しているのに対し、本発明の手法においては、カメラを部分集合に分け、部分集合毎に部分存在確率を求め、当該情報をもとにして統合された存在確率および色マップを計算するところが大きな違いとなっている。
即ち、ステップ20において、カメラパラメータ{Ai,Ri,ti|i∈N}、{AV,RV,tV}と、カメラ画像{Ii(m)|i∈N}とに基づき、前述の(11)式に示す計算式により、基準視点Vを中心としたカメラ画像の投影画像{IVij(m)|i∈N}を生成する。
またステップ21において、カメラパラメータ{Ai,Ri,ti|i∈N}、{AV,RV,tV}と、カメラ画像{Ii(m)|i∈N}、カメラ部分集合{Ξk|k∈K}とに基づき、前述の(20)式に示す計算式により、基準カメラCi(k)を中心としたカメラ画像の投影画像{Ikij(m)}を生成する。
また、ステップ22において、投影画像{Ikij(m)}に基づき、前述の(19)式、(21)式に示す計算式により、基準カメラCi(k)を中心とした部分存在確率{qkj(m)}を生成する。
【0075】
また、ステップ23において、基準カメラCi(k)を中心とした部分存在確率{qkj(m)}に基づき、前述の(22)式に示す計算式により、基準視点Vを中心とした部分存在確率{qVkj(m)}を生成する。
また、ステップ24において、カメラパラメータ{Ai,Ri,ti|i∈N}、{AV,RV,tV}と、基準視点Vを中心とした部分存在確率{qVkj(m)}とに基づき、前述の(29)式、(30)式、(31)に示す計算式により、寄与率(重み)マップ{wVij(m)|i∈N,j∈J}を生成する。
また、ステップ25において、寄与率(重み)マップ{wVij(m)|i∈N,j∈J}と、投影画像{IVij(m)|i∈N}とに基づき、前述の(16)式に示す計算式により、色マップ{TVj(m)|j∈J}を生成する。
また、ステップ26において、基準視点Vを中心とした部分存在確率{qVkj(m)}に基づき、前述の(33)式、(24)式、(25)式、(26)式、(27)式、(28)式に示す計算式により、統合された存在確率{qVj(m)|j∈J}を生成する。
最後に、ステップ27において、色マップ{TVj(m)|j∈J}と、統合された存在確率{qVj(m)|j∈J}とに基づき、前述の(6)式に示す計算式により、基準視点Vから見た画像{IV(m)}を生成する。
なお、本実施例において、それぞれのカメラセットに属する画像の対応点の色情報または輝度情報を選択、あるいは混色し、各投影点におけるカメラセットごとの投影点の色情報または輝度情報を決定した後、各投影点におけるカメラセットごとの部分存在確率の高さに応じてカメラセットごとの寄与率を決定し、各投影点におけるカメラセットごとの色情報または輝度情報を、カメラセットごとの寄与率の高さに応じた割合で混合することで、前記各投影点の色情報または輝度情報を決定することも可能である。
また、本実施例において、各投影点の色情報または輝度情報を、存在確率の高さと投影面の基準視点からの距離に応じた割合で混合して、生成する画像上の色情報または輝度情報を決定し、2枚以上の2次元画像を生成することも可能である。この2次元画像を、DFD方式の3次元表示装置の各表示面に表示することにより、3次元立体像を得ることができる。
【0076】
図10は、本発明の実施例の仮想視点画像生成方法を実現するための仮想視点画像生成装置の一例の概略構成を示すブロック図であり、図11は、図10に示す仮想視点画像生成装置を用いたシステムの構成例を示す図である。
図10において、1は仮想視点画像生成装置、101は基準視点決定手段、102はカメラ画像取得手段、103は画像生成手段、103aは投影処理手段A、103bは投影処理手段B、103cは寄与率(重み)マップ計算手段、103dは部分相関・存在確率計算手段、103eは色情報・輝度情報決定手段、103fは部分存在確率統合手段、103gはレンダリング手段、104は生成画像出力手段、2は視点位置入力手段、3は被写体撮影手段、4は画像表示手段である。また、図11において、Userは仮想視点画像生成装置の利用者、Objは被写体である。
本実施例1の仮想視点画像生成装置1は、図10及び図11に示すように、利用者Userが視点位置入力手段2を用いて入力したデータに基づき基準視点を決定する基準視点決定手段101と、複数の視点位置Ciにある被写体撮影手段(カメラ)3で撮影された被写体Objの画像を取得する被写体画像取得手段102と、前記取得した被写体Objの画像をもとに、基準視点から前記被写体Objを見た画像を生成する画像生成手段103と、前記画像生成手段103で生成した仮想視点画像を画像表示手段4に表示させるための生成画像出力手段104とにより構成される。
【0077】
このとき、基準視点決定手段101では、視点位置入力手段2から入力された基準視点の位置に基づき、仮想位置の基準視点と、仮想的な3次元空間中に前記基準視点から見て奥行き位置の異なる多層構造の投影面を設定する。また、視点位置入力手段2からは、カメラパラメータ{Ai,Ri,ti|i∈N}、{AV,RV,tV}と、カメラ画像{Ii(m)|i∈N}、カメラ部分集合{Ξk|k∈K}も入力される。
前記視点位置入力手段2は、例えば、図11に示したように、マウス等の利用者Userが操作して選択するデバイスであってもよいし、キーボード等の利用者Userが直接数値として入力するデバイスでもよいし、前記利用者Userが装着する位置・姿勢検出センサでもよい。また、他のプログラムにより与えられるものでも、ネットワークを介して与えられるものでも可能である。
また、前記被写体画像取得手段102は、刻々と変化する被写体の位置・姿勢を一定の間隔、例えば、30Hzの間隔で逐次的に取得することも、任意の時刻における被写体の静止画像を取得することも可能であるし、あらかじめ撮影した被写体画像を記録装置から読み出すことで取得することも可能である。なお、複数の視点位置からの被写体画像は、すべてのカメラ間の同期をとることにより同一時刻に撮影したものであることが望ましいが、被写体の位置・姿勢の変化が十分に遅く、静止物と見なせる場合にはこの限りではない。
【0078】
また、前記画像生成手段103は、投影処理手段A(103a)と、投影処理手段B(103b)と、寄与率(重み)マップ計算手段103cと、部分相関・存在確率計算手段103dと、色情報・輝度情報決定手段103eと、部分存在確率統合手段103fと、レンダリング処理手段103gとで構成される。
投影処理手段A(103a)は、図9のステップ20の処理を実行する。投影処理手段B(103b)は、図9のステップ21の処理を実行する。
部分相関・存在確率計算手段103dは、図9のステップ22と、ステップ23の処理を実行する。
寄与率(重み)マップ計算手段103cは、図9のステップ24の処理を実行する。色情報・輝度情報決定手段103eは、図9のステップ25の処理を実行する。
部分存在確率統合手段103fは、図9のステップ26の処理を実行する。レンダリング処理手段103gは、図9のステップ27の処理を実行する。
また、前記画像表示手段4は、例えば、ディスプレイ端子等の生成画像出力手段104に接続されたCRT(Cathode Ray Tube),LCD(Liquid Crystal Display),PDP(Plasma Display Panel)等の表示装置である。このとき、前記画像表示手段4は、例えば、2次元平面状の表示装置でもよいし、利用者Userを取り囲むような曲面状の表示装置であってもよい。
【0079】
また、前記画像表示手段4として、例えば、DFD方式の立体表示が可能な表示装置を用いるときには、奥行き位置の異なる2つの表示面に、画像生成手段103で生成したそれぞれの2次元像を表示することにより、利用者に3次元立体像を提示することも可能である。
また、前記仮想視点画像生成装置1を用いたシステムは、例えば、図11に示したような構成になっており、利用者Userは前記視点位置入力手段2を介して仮想視点画像生成装置1に所望の視点位置・方向・画角を指定すると、前記仮想視点画像生成装置1は被写体Objを前記被写体撮影手段(カメラ)3で撮影し、その画像を取得した後、前記取得した被写体の画像をもとに指示された視点における画像(仮想視点画像)を生成する。前記生成された仮想視点画像は、前記画像表示手段4により利用者Userに提示する。
なお、図11のシスデム構成は本発明における画像生成装置の実装の一例を示すものであり、本発明の請求範囲は必ずしもこのような構成に限定されるものではなく、個々の装置の配置、形態、実装は本発明の趣旨を逸脱しない範囲において任意である。
【0080】
以上説明したように、本実施例によれば、従来の方法のように、あらゆる場合及びあらゆる箇所で被写体の正確な幾何モデルを得ようとするのではなく、被写体の撮影条件や部位によっては距離推定で、十分な信頼性の存在確率をもつ推定値が得られないことを前提として、存在確率の信頼性が低い推定値が得られた箇所については曖昧に描画して画像生成への寄与を低くし、極端な画像の劣化を防止するとともに、信頼性が高い存在確率が得られた箇所については明瞭に描画して画像生成への寄与を高くする。そのため、推定の信頼性(存在確率)が低い箇所の画像の劣化が目立たなくなる。
また、正確な幾何モデルを求めるために、最適化問題等、計算機負荷の高い処理を経る必要がないため、インタラクティブ性が要求される条件においても、短い処理時間で映像生成が可能となる。
【0081】
また、本実施例によれば、カメラセットごとの存在確率(部分存在確率)を算出し、それらを統合した存在確率を求めることで、例えば、オクルージョン(遮蔽領域)が生じ、被写体表面のある点が、あるカメラからは見えない場合に、存在確率の推定の信頼性を向上させることができる。
すなわち、いちどにすべてのカメラの画像を用いると、隠れている部分も含めて対応点の相関度を計算してしまうので、それを元に求められる存在確率の信頼性が低下してしまうのに対し、カメラセットごとに分けて存在確率を求めることで、あるカメラセットにおいては構成するカメラの多くが着目する被写体表面上の点を撮影し、その箇所において高い部分存在確率を算出することになる。
逆に、あるカメラセットにおいては構成するカメラの多くが着目する被写体表面上の点を撮影していないこともあり、この場合は算出される部分存在確率は低くなる。
しかし、その後の統合処理において、高い部分存在確率の影響が大きく、低い部分存在確率の影響が低くなる演算を行うことで、前者が後者を補う働きをし、結果として統合された存在確率の信頼性は高くなる効果がある。
先行研究に見られるように、個々のカメラセットにおいて奥行きの情報のみを求め、それらを取捨選択や平均するなどして奥行き情報を統合する方法に比べ、本発明では奥行きの情報だけでなくカメラセットごとの推定の信頼性の情報も考慮して統合する。すなわち、カメラセットごとに相反する奥行き情報を統合する際にも、信頼性の高い奥行き情報に重きを置いた統合がなされる。そうすることにより、本発明はより確度の高い被写体の3次元情報を算出する効果があると言える。
【0082】
また、本実施例によれば、カメラセット毎の部分存在確率を算出するにあたり、対応点間の相関度に基づいて、カメラセットの代表となる1つの視点位置(代表視点)を通る直線上の値の合計が1となる処理(正規化処理)をする。
一般的に、相関度の算出においては対応点間の色情報(もしくは輝度)の差分が小さいほど相関が高いという前提を利用するため、対応点が暗い部分は差分が小さく相関度が高くなり、逆に明るい部分は差分が大きく相関度が低くなる傾向がある。しかし、前述の正規化処理を経ることで、部分存在確率の算出にあたり対応点における撮影画像の明暗の影響を受けず、それらを統合した存在確率の信頼性が高くなる効果がある。
【0083】
また、本実施例によれば、生成される画像の各画素の色は、投影面上の投影点に対応するカメラの画像上の対応点をもとにして決定する。しかし、オクルージョン(遮蔽)等により、あるカメラからはこの投影点における被写体表面上の点が撮影されず、その撮影画像上の対応点の色情報(または輝度情報)を用いると、投影点の位置に存在する被写体表面の色(または輝度)とは異なる色を用いることになり、生成画像の画質が低下する。
ここで、被写体表面が存在している任意の投影点に着目すると、その位置においてカメラセットごとに算出される部分存在確率の違いは、投影点における被写体表面が撮影されているカメラの数に依存する。すなわち、ある投影点において部分存在確率が高く算出されたカメラセットでは、そのカメラセットを構成する多くのカメラにより、着目する投影点における被写体表面が撮影されている可能性が高く、逆に部分存在確率が低く算出されたカメラセットにおいては、そのカメラセットを構成する一部もしくはすべてのカメラから、着目する投影点における被写体表面が撮影されていない可能性が高い。
そこで、投影点の色情報(または輝度情報)を決定する際に、カメラセットごとの対応点の色情報(または輝度情報)を、カメラセットごとの部分存在確率の高さに応じた割合で混合することにより、投影点が撮影できているカメラが多いカメラセットの色の寄与を大きく、投影点が撮影できているカメラが少ないカメラセットの色の寄与を小さくし、投影点の色はその位置に存在する被写体表面の色(または輝度)と近い値が推定され、結果として生成画像の画質を向上させる効果がある。
【0084】
また、本実施例によれば、投影点の色情報を決定する際に、遮蔽により投影点を撮影していないカメラによる寄与を抑制し、結果として生成画像の画質を向上させる効果がある。
あるカメラセットの代表視点から見て着目する投影点よりも手前の他の投影点の存在確率の合計が高い場合には、代表視点と着目する投影点の間に被写体表面が存在している可能性が高い。すなわち、着目する投影点は代表視点から見てそれよりも手前の被写体により遮蔽されている可能性が高いため、その代表視点における対応点の色は、投影点を撮影した色でない可能性が高い。
このようなとき、そのカメラセットによる色の寄与率を低くし、逆に、代表視点から見て手前の存在確率の合計が低いようなカメラサブセットの色の寄与率を高くすることで、投影点において被写体を撮影しているカメラの色の寄与率を高めることができる。
【0085】
また、本実施例によれば、カメラセットごとに算出された部分的な存在確率を乗算して統合された存在確率を算出することで、より多くのカメラセットにより存在確率が高く算出された投影点において、統合された存在確率が高く算出され、その推定精度が向上する。
また、バイアス値を加算することで、あるカメラセットにより算出された部分存在確率が0に近い場合でも、他のカメラセットによる部分存在確率が高い場合には、統合された存在確率が0に近くなることを防止する効果がある。そのため、統合された存在確率の推定がよりロバストになる効果がある。
また、そのバイアス値の大きさを投影面ごとに異なる設定にすることより、統合処理後の存在確率において、投影面ごとに存在確率の分布傾向を調整することができる。例えば、奥の投影面から手前の投影面に向かうにつれて加算するバイアスの値を大きくすることで、手前のものほど存在確率が高くなる傾向になり、奥に存在するものが透けて画像生成することを防止することができる。
また、ある範囲にある投影面のバイアスを高く設定することで、ある特定の奥行きの範囲にある被写体を強調して画像生成する効果がある。
また、投影面上で特定の領域にあるバイアスを、他の領域に比べて高く設定することで、ある特定の範囲にある被写体を強調して画像生成する効果がある。また、ある奥行きの投影面上のある領域にあるバイアスを、他の領域に比べて低く設定することで、ある特定の範囲にある被写体が目立たぬよう画像生成する効果がある。
【0086】
また、本実施例によれば、基準視点から見て隠れている被写体表面を誤って描画することによる画像の劣化を防ぐことができる。
すなわち、基準視点を通る直線上に、複数の被写体表面が存在する場合、複数の位置にて存在確率が高く推定される可能性があり、この場合は基準視点から見て手前の被写体を透けて、奥の被写体を描画してしまうことになる。そこで、手前の存在確率が高い場合、その程度に応じてそれよりも奥の投影面のバイアス値を低く設定することで、存在確率の統合処理時に奥の投影点の存在確率が高くなることを抑制し、結果として生成画像において奥の被写体表面が透けて見えることを防ぐことが出来る。
以上、本発明者によってなされた発明を、前記実施例に基づき具体的に説明したが、本発明は、前記実施例に限定されるものではなく、その要旨を逸脱しない範囲において種々変更可能であることは勿論である。
【図面の簡単な説明】
【0087】
【図1】画像生成の座標設定の一例を示す図である。
【図2】被写体表面の色情報および存在確率情報を求める多層の投影面の一例を示す図である。
【図3】複数のカメラ間の対応点を説明した図である。
【図4】はカメラで撮影された画像を投影面上に透視投影した一例を示す図である。
【図5】観察者の視点(基準視点)とカメラのなす角度によりカメラ毎の色の寄与率(重み)を決定する一例を示す図である。
【図6】従来法による画像生成の処理フローの一例を示す図である。
【図7】オクルージョンが発生している状況の一例を示す図である。
【図8】着目する投影点よりも手前の投影点の存在確率の累計を説明した図である。
【図9】本発明の実施例の画像生成の処理フローの一例を示す図である。
【図10】本発明の実施例の仮想視点画像生成装置の概略構成を示すブロック図である。
【図11】図10に示す画像生成装置を用いたシステムの構成例を示す図である。
【符号の説明】
【0088】
1 仮想視点画像生成装置
2 視点位置入力手段
3 被写体撮影手段
4 画像表示手段
101 基準視点決定手段
102 被写体画像取得手段
103 画像生成手段
103a 投影処理手段A
103b 投影処理手段B
103c 寄与率(重み)マップ計算手段
103d 部分相関・存在確率計算手段
103e 色情報・輝度情報決定手段
103f 部分存在確率統合手段
103g レンダリング処理手段
104 生成画像出力手段
【技術分野】
【0001】
本発明は、仮想視点画像生成方法および仮想視点画像生成装置に係り、特に、被写体にオクルージョン(遮蔽)がある場合に有効な技術に関する。
【背景技術】
【0002】
近年、コンピュータグラフィックス(CG)やバーチャルリアリティ(VR)の分野では、複数の視点位置のカメラで撮影された画像(多視点画像)をもとに、カメラが設置された視点位置からだけでなく、利用者が望む視点位置(目的視点)から見た被写体の画像(目的画像)をコンピュータにより生成する技術が盛んに研究されている。
これらの技術の多くでは、多視点画像を入力として、まず被写体の3次元幾何的モデルを推定し、次にモデルの表面の色(モノクロ画像の場合は輝度)を推定し、最後に3次元モデルに対し透視射影や正射影などの2次元変換を行って2次元の目的画像を出力するという大きく3つのプロセスを経る。
このうち、最後の3次元モデルから2次元画像への変換処理は、多くの方式において共通のアルゴリズムを用いられているため、幾何的なモデルの推定および色の推定のアルゴリズムが、生成される画質に影響すると言える。
特に、撮影された多視点画像において、ある視点位置から撮影された画像において見えている被写体の部分が、ある他の視点位置からは隠れて撮影されていない場合、すなわち元となる多視点画像がオクルージョン(遮蔽)を含む場合、幾何的なモデルの推定と色の推定が共に難しいことが知られている。
【0003】
なお、本願発明に関連する先行技術文献としては以下のものがある。
【非特許文献1】Okutomi,M.and Kanade,T.:”A multiple-baseline stereo,”Pattern Analysis and Machine Intelligence,IEEE Transactions on,Vol.15,no.4pp.353-363,Apr 1993.
【非特許文献2】Michael Potmesil,”Generating octree models of 3D objects from their Silhouettes in a sequence of images,”Computer Vision,Graphics,and Image Processing,v.40n.1,p.1-29,Oct.1987.
【非特許文献3】Richard Szeliski:”A Multi-View Approach to Motion and Stereo,”In CVPR’99.Vol.1,PP.157-163,Fort Collins,June 1999.
【非特許文献3】C.L.Zitnick,S.B.Kang,M.Uyttendaele,S.Winder,and R.Szeliski.:”High-quality video view interpolation using a layered representation.”In Proceedings of SIGGRAPH 2004,pp.600-608,2004.
【非特許文献5】P.E.Debevec,C.J.Taylor,and J.Malik:”Modeling and Rendering Architecture from Photographs:A Hybrid Geometry-and Image-Based Approach,”SIGGRAPH’96,pp.11-20,1996.
【非特許文献6】Gregory G.Slabaugh,Ronald W.Schafer,and Mat C.Hans:”Image-Based Photo Hulls for Fast and Photo-Realistic New View Synthesis,”Real-Time Imaging,Vol.9,No.5,October 2003.
【発明の開示】
【発明が解決しようとする課題】
【0004】
以下では、既存の手法における幾何的なモデルの推定方法と色の推定方法について、先行研究が採用している手法を述べる。
まず、幾何モデルを推定する方法の代表的なものとして、ステレオ法がある。ステレオ法においては、多視点画像で撮影されている被写体上の同一の点(対応点)を特定し(対応点マッチング)、三角測量の原理でその距離を求める。
多くの対応点マッチングにおいては、想定する奥行きにおける各画像の対応点および周辺領域の色(または輝度)の差により評価関数を設定し、この評価関数を最小となる奥行きを推定値とする。
しかし、ステレオ法を利用した多くの手法においては、すべてのカメラにより対応点が見えていることを仮定している。
よって、対応点がいくつかの画像において隠れている領域(以下、オクルージョン領域)においては、幾何モデルの推定の信頼性(存在確率)は著しく低下する。
カメラの数を多くすることで、オクルージョンが生じているカメラの画像の影響を相対的に小さくするマルチベースライン法(前記非特許文献1参照)も考案されているが、オクルージョン領域付近では効果が十分とは言えず、推定の信頼性が低下する傾向がある。
【0005】
また、幾何モデルの推定法としてステレオ法と並んで代表的な方法に、視体積交差法(Shape from Silhouette)と呼ばれる方法(前記非特許文献2参照)がある。視体積交差法においては、多視点画像における被写体の輪郭をもとに、3次元空間中で被写体が占める領域を求める。
しかし、この方法は原理的に被写体が凸形状であることを仮定しているため、凹形状の被写体に対しては正しくモデルを取得することができない。また、そもそも背景画像と被写体の輪郭を正確に抽出する最初の過程自体が難しく、未だコンピュータ・ビジョン分野における主要な研究課題となっている。
よって、映画の特撮などでよく使われるブルーバックと呼ばれる単色の背景を用いる必要があるなど、撮影条件は限定されることが多い。
【0006】
さて、撮影画像がオクルージョンを含むということは、ある方向からは見ることができ、ある方向からは見ることのできない状況であると言える。よって、位置の近いカメラにおいては被写体を見る方向が類似し、結果として撮影される被写体の遮蔽関係も類似することが多い。
そのため、すべてのカメラからの画像を同等に用いて奥行きを推定するのではなく、位置の近いカメラだけで奥行きを推定した方がオクルージョンの影響を受けにくく、推定の信頼性が向上する場合がある。
このことを利用し、まず位置が近いカメラを用いて部分的な評価関数を設定し、そして部分的な評価関数の合成関数として全体的な評価関数を設定し、その全体的な評価関数を最小とするような奥行きを推定する方法が提案されている(前記非特許文献3参照)。
しかし、合成された評価関数を最小とする最適解を求めるには、繰り返し演算により非常に時間のかかる処理を必要とするため、実時間処理には向かない。
【0007】
一方、複数の位置からの奥行きマップを求め、統合する研究例(前記非特許文献4参照)がある。
しかし、一旦、各視点にて奥行きマップを求めたあと、それらを統合する処理においては、複数の奥行きマップのブレンディングにおいて、推定の信頼性を考慮に入れていない。よって、推定の信頼性の低い奥行きマップの推定値が統合後の奥行きマップに反映される恐れがある。
次に、色の推定としては、視点依存テクスチャマッピング(前記非持許文献5参照)という方法がよく用いられる。
視点依存テクスチャマッピングでは、被写体の着目する点の色を決定する際、複数のカメラの対応点における色を重み付きブレンディングすることで決定し、その重み係数は、着目点から目的視点までの直線およびカメラの視点までの直線のなす角により決定され、その角度が小さいほど重みが大きく設定される。すると、被写体の着目点から目的視点に飛来する光線と角度が近い光線ほど、大きな比重で色がブレンディングされる。
しかし、オクルージョンが生じている場合、光線の角度が近いからといって、目的視点とカメラ視点において、被写体表面上の同一の点を撮影しているとは限らない。すなわち、色の正確な推定のためには、隠れていない色のみを用いて色のブレンディングを行う必要がある。
【0008】
よって、どのカメラで隠れが生じているかを被写体形状より判断する可視性判断(Visibility Check)を行う先行研究がある(前記非特許文献6参照)。
しかし、可視性判断のためには幾何モデルが必要である一方で、そもそも幾何モデルの推定には、カメラの対応点間における色の一致度を用いるため、隠れが生じているカメラを除外するための可視性判断が必要となる。すなわち、可視性判断のためには正確な幾何モデルが必要であり、幾何モデルの推定のためには可視性判断が必要となり、両者は相互に依存している。
そのため、幾何モデルの推定を収束するまで繰り返すという処理が行われることが多いが、そうすると計算機負荷が高くなり、結果として処理速度が遅くなるという欠点がある。
また、可視性判断として、見えているか・見えていないかの2者択一であるため、収束に時間がかかり、また、誤りが生じたときに画像に与える影響が大きいと言える。
本発明は、前記従来技術の問題点を解決するためになされたものであり、本発明の目的は、複数の視点位置で撮影された被写体の画像を元にして所望の視点から見た画像を生成する画像生成方法および画像生成装置において、被写体にオクルージョン(遮蔽)がある場合でも、極端な画像の劣化を防止し、かつ、短時間で画像を生成することが可能となる技術を提供することにある。
本発明の前記ならびにその他の目的と新規な特徴は、本明細書の記述及び添付図面によって明らかにする。
【課題を解決するための手段】
【0009】
本願において開示される発明のうち、代表的なものの概要を簡単に説明すれば、下記の通りである。
(1)複数の異なる視点から被写体を撮影した被写体の複数の画像に基づき、任意の仮想位置の基準視点から見た前記被写体の画像を生成する仮想視点画像生成方法であって、前記複数の異なる視点から被写体を撮影した前記被写体の複数の画像を取得するステップAと、仮想的な3次元空間中に前記基準視点から見て奥行き位置の異なる多層構造の投影面を設定するステップBと、前記複数の投影面上の前記基準視点から見て重なり合う複数の投影点と対応する前記取得した前記被写体の複数の画像の対応点の色情報または輝度情報から、前記各投影点の色情報または輝度情報を決定するステップCと、前記各投影点毎に、前記被写体の複数の画像の前記各投影点に対応する対応点間の相関度を算出するステップDと、前記各投影点における相関度に基づいて、前記各投影点に物体の表面が存在する確率を表す存在確率を決定するステップEと、前記各投影点の色情報または輝度情報と、前記各投影点での存在確率に基づいて、前記基準視点から見た前記被写体の画像を生成するステップFとを有し、前記ステップDは、前記被写体の複数の画像の中から選んだいくつかの画像の組み合わせであるカメラセットを複数組用意するステップD1と、前記各カメラセットに含まれる各被写体の画像上の前記各投影点に対応する対応点から、前記各投影点について相関度を求めるステップD2とを有し、前記ステップEは、前記カメラセット毎に求めた前記各投影点の相関度に基づき、カメラセットの代表となる1つの視点位置である代表視点を通る直線上の値の合計が一定値となる正規化処理を施した部分存在確率を算出するステップE1と、前記カメラセット毎に決定した部分存在確率の統合処理をして前記各投影点の存在確率を決定するステップE2とを有する。
【0010】
(2)(1)において、前記ステップFは、前記各投影点の色情報または輝度情報を前記存在確率の高さに応じた割合で混合して、生成する画像上の点の色情報または輝度情報を決定し、1枚の2次元画像を生成するステップである。
(3)(1)において、前記ステップFは、前記各投影点の色情報または輝度情報を、前記存在確率の高さと投影面の基準視点からの距離に応じた割合で混合して、生成する画像上の色情報または輝度情報を決定し、2枚以上の2次元画像を生成するステップである。
(4)(1)ないし(3)の何れかにおいて、前記ステップCは、それぞれのカメラセットに属する各被写体の画像の対応点の色情報または輝度情報から、前記各投影点におけるカメラセットごとの投影点の色情報または輝度情報を決定するステップC1と、前記各投影点におけるカメラセットごとの部分存在確率の高さに応じてカメラセットごとの寄与率を決定するステップC2と、前記各投影点におけるカメラセットごとの色情報または輝度情報を、カメラセットごとの寄与率の高さに応じた割合で混合し、前記各投影点の色情報または輝度情報を決定するステップC3とを有する。
【0011】
(5)(4)において、前記ステップCは、前記カメラセットごとの寄与率に対し、前記各投影点と前記カメラセットの代表視点とを結ぶ線分上にある他の投影点の存在確率に応じた係数を更に乗じ、新たなカメラセットごとの寄与率を決定するステップC4を有する。
(6)(1)ないし(5)の何れかにおいて、前記ステップE2は、着目する投影点において異なるカメラセットから算出された複数の部分存在確率に、バイアス値を加算し、加算後の部分存在確率に投影面ごとに定めた係数を乗算して統合した存在確率を算出するステップE21と、前記各投影点において統合した存在確率を正規化処理するステップE22とを有する。
(7)(6)において、前記バイアス値あるいは投影面ごとの係数は、着目する投影点と前記基準視点とを結ぶ線分上の他の投影点の存在確率に依存し、それらが大きいほど抑制される。
また、本発明は、(1)ないし(7)の仮想視点画像生成方法を実施する仮想視点画像生成装置である。
【発明の効果】
【0012】
本願において開示される発明のうち代表的なものによって得られる効果を簡単に説明すれば、下記の通りである。
本発明によれば、複数の視点位置で撮影された被写体の画像を元にして所望の視点から見た画像を生成する画像生成方法および画像生成装置において、被写体にオクルージョン(遮蔽)がある場合でも、極端な画像の防止し、かつ、短時間で画像を生成することが可能となる。
【発明を実施するための最良の形態】
【0013】
以下、図面を参照して本発明の実施例を詳細に説明する。
なお、実施例を説明するための全図において、同一機能を有するものは同一符号を付け、その繰り返しの説明は省略する。
本発明の画像生成方法は、撮影視点が異なる複数枚の画像から、前記画像に写っている物体の3次元情報を取得し、前記物体の3次元像を提示する画像、あるいは任意の視点から前記物体を見たときの画像を生成する方法である。
このとき、前記物体の3次元情報は、テクスチャマッピングの手法を用い、多層構造の投影面を設定して、前記観察者の視点(基準視点)から見たときの物体の表面上の各点が存在する確率を推定する。
前記物体の表面が存在する確率を推定するときには、例えば、前記観察者の視点(基準視点)から見て重なり合う各投影面上の点(以下、投影点という)に対して、前記投影点と対応する各画像上の点(以下、対応点という)の相関度を求める。
そして、前記観察者の視点(基準視点)から見て重なり合う各投影点の相関度の高さから、前記重なり合う投影点のうち、どの投影点の近傍に前記物体の表面が存在するか推定する。
【0014】
ただし、本発明の画像生成方法では、前記観察者の視点(基準視点)から見て重なり合う複数の投影点のうち、どの投影点の近傍に前記物体の表面が存在するかということを考えるのではなく、前記各投影点の近傍に、前記各投影点の相関度の大きさに応じた割合で物体の表面が存在すると考える。
このとき、本発明の画像生成方法では、複数の視点で撮影した画像の中から選んだいくつかの画像の組み合わせ(カメラセット)ごとに前記投影点の相開度を求め、それをもとに各投影点、もしくはその近傍に物体の表面が存在する確率(部分存在確率)をカメラセット毎に決定する。そして、前記カメラセット毎に決定した部分存在確率の統合処理をして、観察者の視点(基準視点)における前記各投影点の存在確率を決定する。
この際、着目する投影点と観察者の視点(基準視点)を結ぶ線分上にある他の投影点の存在確率に依存した統合処理を施し、観察者の視点(基準視点)から見て着目する投影点の手前で高い存在確率を持つ場合には、着目する投影点における存在確率が高くなることを抑止する。
【0015】
このようにして、前記投影面を観察している観察者から見て、前記物体表面までの距離の推定が難しい部分を曖昧に描画し、不連続なノイズ等を目立ちにくくするとともに、オクルージョン(遮蔽)により前記投影点を撮影していないカメラの画像の影響を少なくすることで、前記相関度の高さの信頼性が向上し、前記存在確率の信頼性も向上する。
さらに、前記被写体の3次元情報に基づいて画像を生成するときに、前記投影点の色情報を前記生成する画像上の各点の色情報に割り当てるときに、前記統合された存在確率の高さに応じた寄与率で割り当てる。
ここで、投影点の色情報は、部分存在確率の高さに応じた寄与率でカメラセットに含まれるカメラの対応点を混色することや、さらに前記のカメラセット毎の寄与率に対し、着目する投影点とカメラセットの代表視点とを結ぶ線分上にある他の投影点の存在確率に応じた係数を更に乗じ、新たなカメラセットごとの寄与率とすることで、投影点を撮影していないカメラの対応点の色の寄与を少なくすることができ、色の再現性が向上する。
【0016】
<原理説明>
図1乃至図9は、本発明の画像表示方法の原理を説明するための模式図であり、図1は画像生成の座標設定の一例を示す図、図2は被写体表面の色情報および存在確率情報を求める多層の投影面の一例を示す図、図3は複数のカメラ間の対応点を説明した図、図4はカメラで撮影された画像を投影面上に透視投影した一例を示す図、図5は観察者の視点(基準視点)とカメラのなす角度によりカメラ毎の色の寄与率(重み)を決定する一例を示す図、図6は従来法による画像生成の処理フローの一例を示した図、図7はオクルージョンが発生している状況の一例を示す図、図8は着目する投影点よりも手前の投影点の存在確率の累計を説明した図、図9は本発明の実施例の画像生成の処理フローの一例を示した図である。
【0017】
【0018】
【0019】
【数1】
ここで、αu、αvはカメラの焦点距離および画素ピッチにより規定されるパラメータ、u0,v0は画像の中心位置を表すパラメータである。
また、回転行列Riは3×3の行列であり、その成分を下記(3)式とおくと、ベクトルri(1)、ri(2)、ri(3)は互いに直行する単位ベクトルとなる。
【0020】
【数2】
また、並進ベクトルtiは3次元の列ベクトルであり、下記(4)式のように表される。
【0021】
【数3】
【0022】
【0023】
【数4】
【0024】
ここで、投影点が同一の投影面に存在する場合、投影点Mと観察者の視点(基準視点)における点mは一対一写像となり、観察者の視点(基準視点)の画像座標により投影面Lj上の投影点の位置を一意に示すことができる。
そこで、以下では、ある特定の投影面に着目した際の投影点を観察者の視点(基準視点)の画像座標mにより表すことにする。また一方で、異なる投影面に存在するいくつかの投影点が観察者の視点(基準視点)を通る同一直線上にある場合、観察者の視点(基準視点)の画像座標では同一の座標で表される。
すなわち、図2に示すとおり、前述の(5)式により、mに写像される投影点の集合
{Mj|j∈J}は観察者の視点(基準視点)Vを通る同一直線上にある。
【0025】
<画像生成原理>
ここで、投影面上Ljの座標mにおける色をTvj(m)、被写体表面の存在確率をqVj(m)とおく。添え字Vは、観察者の視点(基準視点)Vの画像座標系で表していることを示す。
すると、{TVj(m)|j∈J}と{qVj(m)|j∈J}はそれぞれ観察者の視点(基準視点)Vを通る直線上の色の集合および存在確率の集合となる。
そして、本発明において、観察者の視点(基準視点)Vにおける画像を生成する基本となる処理は、下記(6)式に示す演算により表される。
【0026】
【数5】
【0027】
すなわち、観察者の視点(基準視点)Vから見て同一直線上にある投影点の色にその存在確率を乗算したものを加算していくことで、同一直線上にある投影点の色を期待値として取得し、画像を生成する。
このように、観察者の視点(基準視点)における画像生成法は、前述の(6)式により表されるが、(6)式中のqvj(m)およびTvj(m)をいかにして推定するかが、生成画像の品質を決定する大きな要因となり、本発明の特徴となる。
そこで以下では、対比としてまた出発点として、従来の推定法の一例について述べる。
<従来法による存在確率と色マップの推定>
まず、存在確率qvj(m)は投影面Lj上の観察者の視点(基準視点)座標mの位置に被写体表面が存在する確率を表す関数であり、次の条件を満たす。
【0028】
【数6】
【0029】
すなわち、観察者の視点(基準視点)Vを通る直線上の投影点における存在確率は0から1の間の値をとり、その合計が1となっている。ただし、本発明は合計値が厳密に1となっている場合のみに限定されるものではなく、何らかの正規化処理がされていることをその本旨とする。
この存在確率の推定法は、複数のカメラ{Ci|i∈I}の複数の対応点における色もしくは輝度の相関により求める。
対応点とは、図3に示すように、同一の投影点が、前述の(5)式により写像されたとき、それぞれのカメラの画像上で対応する点とする。このとき、対応点同士が近い色(もしくは輝度)をもつほど、対応点のもととなる投影点上に被写体の表面が存在する確率が高い。
すなわち、図3において、投影点P上に被写体表面が存在する場合、同一の被写体表面上の点が各カメラで対応点にて結像されている。この場合、異なるカメラの対応点同士が近い色(もしくは輝度)をもつ可能性が高い。
一方、投影点Q上に被写体表面が存在しない場合、各カメラの対応点では、異なる被写体表面上の点Qi,Qi+1が結像されている。
この場合は、異なるカメラの対応点同士が近い色(もしくは輝度)をもつ可能性は低い。
ここで、観察者の視点(基準視点)の画像座標においてmにある投影面Lj上の投影点の対応点の集合は、それぞれのカメラの画像座標において、下記(8)で与えられる。
【0030】
【0031】
【数9】
【0032】
ここで、djは観察者の視点(基準視点)から投影面Ljまでの距離、nは観察者の視点(基準視点)座標系における法線ベクトルである。
すると、投影面Ljで関連づけられる対応点の色の集合は、下記(10)式で表される。
【0033】
[数10]
{Ii(mij)|i∈N} ・・・・・・・・・・ (10)
ここで、図4に示すように、各カメラの視点を中心として各カメラの画像を投影面Lj上に透視投影し、観察者の視点(基準視点)Vの画像座標系で表したものをIVij(m)とすると、下記(11)式の関係がある。
【0034】
【数11】
ここで、HiVjは、投影面Ljを介してカメラCiの画像座標から観察者の視点(基準視点)Vの画像座標に変換するホモグラフィ行列である。よって、(10)式の対応点の色の集合は、観察者の視点(基準視点)Vの画像座標系で、下記(12)式として表すことができる。
【0035】
[数12]
{IVij(m)|i∈N} ・・・・・・・・・(12)
【0036】
前述の(10)式が、それぞれのカメラの座標系の異なる位置mijによる表現であるのに対し、(12)式は観察者の視点(基準視点)の座標系の共通の位置mにおける表現となり、前述の(11)式の処理をすることで異なるカメラの対応点を参照する際に共通の座標を用いることができ、効率が向上する。
ただし、本発明は対応点の参照としてこのような形態に限定されるものではない。
ここで、{IVij(m)|i∈N}の各色成分(例えば[R,G,B]値)の分散値を合計したものをσ2(m)とおく。
すると、投影面Ljの位置mにおける対応点の相関の度合いは、例えば、下記(13)式と表すことができる。また別の例としては下記(14)式のように表すことができる。
【0037】
【数13】
【0038】
【数14】
【0039】
ここで、n,ε,τは調整用のパラメータである。
SVj(m)の値が大きいほど画像間の相関が高い。また、ここでは対応点の一画素ごとに相関値をとったが、対応点付近の領域に含まれる画素の相関値の合計値をとることで、平滑化の効果を持たせることもできる。
このようにして計算した相関の度合いを用いると、前述の(7)式の条件を満たす存在確率は、例えば、下記(15)式のように算出することができる。
【0040】
【数15】
【0041】
以上が、観察者の視点(基準視点)から見た投影面上の投影点の存在確率qvj(m)を求める手法の一例である。
次に、観察者の視点(基準視点)Vから見た投影点の色Tvj(m)は、下記(16)式に示すように、各カメラの対応点の色を適切な重みをつけて混合することにより設定することができる。
【0042】
【数16】
【0043】
ここで、Ivij(m)はカメラCjの画像を投影面Ljに投影した画像であり、wvij(m)は投影面LjにおけるカメラCjの重み係数である。
Ivij(m)は前述の(11)式により求めることができるため、wvij(m)を推定することで、Tvj(m)も求めることができる。
wvij(m)の推定は、従来法においては、図5において、近接する光線ほどその色情報が近いという前提により、PVとPCiのなす角度θijにより、重みwvij(m)を決定していた。
その一例として、下記(17)式、(18)式で決定することができる。
【0044】
【数17】
【0045】
【数18】
【0046】
ここで、κは調整用のパラメータである。
例えば、図5では、角度θij<θ(i+1)jとなり、重みwvij(m)>wv(i+1)j(m)となる。
以上、従来法において観察者の視点(基準視点)の画像を生成する方法および、そこで必要となる投影点の存在確率および色(もしくは輝度)情報の求め方について述べた。
上記の処理フローを示した一例を図6に示す。図6中、処理を長方形で、データを角丸長方形で表している。
途中、左右にフローが分かれる箇所があるが、左側のフローで色情報を算出し、右側のフローで存在確率の情報を算出し、最終的に両者を用いて目的となる画像を生成している。
即ち、ステップ10において、カメラパラメータ{Ai,Ri,ti|i∈N}、{AV,RV,tV}に基づき、前述の(17)式、あるいは(18)式に示す計算式により、重みマップ{wVij(m)|i∈N,j∈J}を計算する。
また、ステップ11において、カメラパラメータ{Ai,Ri,ti|i∈N}、{AV,RV,tV}と、カメラ画像{Ii(m)|i∈N}とに基づき、前述の(11)式に示す計算式により、基準視点Vを中心としたカメラ画像の投影画像{IVij(m)|i∈N}を生成する。
また、ステップ12において、重みマップ{wVij(m)|i∈N,j∈J}と、投影画像{IVij(m)|i∈N}とに基づき、前述の(16)式に示す計算式により、色マップ{TVj(m)|j∈J}を生成する。
また、ステップ13において、投影画像{IVij(m)|i∈N}に基づき、前述の(13)式、(14)式、(15)式に示す計算式により、存在確率{qVj(m)|j∈J}を生成する。
最後に、ステップ14において、色マップ{TVj(m)|j∈J}と、存在確率{qVj(m)|j∈J}とに基づき、前述の(6)式に示す計算式により、基準視点Vから見た画像{IV(m)}を生成する。
【0047】
<オクルージョンのあるシーンでの従来法の不具合>
さて、シーンが不連続な奥行きを持つ場合、あるカメラからは撮影できて、あるカメラからは撮影できない箇所があり、このような現象は一般にオクルージョンと呼ばれる。
本発明で開示する手法は、このような場合においても、存在確率および色の推定の精度を高めることにその特徴のひとつがある。
例えば、図7において、いちどにすべてのカメラ集合{Cl,C2,C3,C4}を用いて従来法で存在確率の推定を行うと、隠れている部分も含めて対応点の相関度を計算してしまうので、それを元に求められる存在確率の信頼性が低下してしまう。
それに対し、カメラ部分集合ごとに分けて存在確率を求めることで、あるカメラ部分集合においては構成するカメラの多くが着目する被写体表面上の点を撮影し、その箇所において高い部分存在確率を算出することになる。
逆に、あるカメラ部分集合においては構成するカメラの多くが着目する被写体表面上の点を撮影していないこともあり、この場合は算出される部分存在確率は低くなる。
しかし、その後の統合処理において、高い部分存在確率の影響が大きく、低い部分存在確率の影響が低くなる演算を行うことで、前者が後者を補う働きをし、結果として統合された存在確率の信頼性は高くなる効果がある。
既存技術に見られるように、個々のカメラセットにおいて奥行きの情報のみを求め、それらを取捨選択や平均するなどして奥行き情報を統合する方法に比べ、本発明ではカメラセットごとの推定の信頼性の情報も考慮して統合することにより、より確度の高い被写体の3次元情報を算出する効果があると言える。
例えば、図7において、P1はカメラ部分集合{C1,C2}を用いて推定すると存在確率の信頼度が低いが、カメラ部分集合{C3,C4}を用いると存在確率の信頼度が高まる。逆に、P2はカメラ部分集合{C1,C2}を用いて推定すると存在確率の信頼度が高く、カメラ部分集合{C3,C4}を用いると存在確率の信頼度が低い。
そして、仮想視点Vからの存在確率の信頼度に統合し、それぞれのカメラ部分集合の推定のうち、信頼度の高い部分の影響が大きくなるようにする。
【0048】
<本発明による画像生成法>
以下では、カメラ部分集合ごとの存在確率の推定法について述べる。
カメラ部分集合はそのメンバの中に基準となるカメラ(基準カメラ)を持ち、そこがカメラ部分集合を代表する視点(以下、代表視点)となる。
そして、代表視点の座標系において投影面Ljにおける部分存在確率qkm(m)の推定を行う。
まず、カメラ部分集合をΞk={Ci|i∈Nk}とおく。ここでkはカメラ部分集合を示す添え字である。
また、カメラ部分集合のうち基準カメラを{Ci(k),i(k)∈Nk}とおく。例えば、図7の場合、Ξ1={C1,C2}と、Ξ2={C3,C4}となる2つのカメラ部分集合があり、C1とC3がそれぞれ基準カメラの場合、Ci(1)=C1,Ci(2)=C3となる。
ここでは簡単のため、すべての部分集合における存在確率は共通のレイヤLj上で推定するものとする。
まず、カメラ部分集合Ξkにおける基準カメラと他のカメラとの不一致度は、SSAD(Sum of Square Absolute Differences)により、下記(19)式のように計算される。
【0049】
【数19】
【0050】
ここで、Ik(m)は基準カメラCi(k)における画像、Ikij(m)は平面Ljを投影面として、カメラCiの画像を基準カメラCi(k)の座標系に投影変換した画像を示す。すなわち、下記(20)式となる。
【0051】
【数20】
【0052】
ここで、Hikjは平面Ljを介してカメラCiから基準カメラCi(k)の画像座標に変換するホモグラフィ行列である。
また、|x|はxのL1ノルムを表し、Bは対応点付近のブロック領域を表す。
そして、カメラ部分集合Ξkにより推定される基準カメラCi(k)における部分存在確率qkj(m)は、例えば、下記(21)式のように計算される。
【0053】
【数21】
【0054】
【0055】
【数22】
【0056】
ここで、Hkvjは、投影面Ljを介して基準カメラCkから観察者の視点(基準視点)Vの画像座標に変換するホモグラフィ行列である。
次に、カメラ部分集合毎の存在確率qvkj(m)を統合処理し、観察者の視点(基準視点)からの存在確率を求める。
その一例としては、下記(23)式、(24)式のとおり、全ての部分集合の存在確率qvkj(m)を掛け合わせて、さらにすべての投影面について正規化処理を行い、統合的な存在確率qvj(m)を得ることができる。
【0057】
【数23】
【0058】
【0059】
また、投影面の奥行きに応じてバイアス値を変化させ、例えば、奥の投影面ほど小さく、手前の投影面ほど大きく設定すると、手前の投影点の存在確率の方が大きく算出される傾向がある。
このことで、観察者の視点(基準視点)から見て複数の被写体の表面が重なっている場合でも、手前の被写体が優位に描画され、奥の被写体が透けて描画されてしまうことを抑止することができる。
また、特定の領域のバイアス値のみ0以上の値、その他を0と設定した場合、特定の領域にある被写体を強調した画像を生成することができる。
また、手前の存在確率に依存して、例えば、下記(25)式のバイアス値とすると、着目する投影点よりも手前の投影点の存在確率の累計が大きいほどバイアス値が小さくなり、結果として着目する投影点においては存在確率が抑制されて推定される。
【0060】
【数25】
ここでf(x)は正の値を返す単調減少の関数であり、例えば以下のように与えられる。
【0061】
【数26】
【0062】
【0063】
【数27】
【0064】
【0065】
【0066】
以上、カメラの部分集合ごとの部分存在確率を統合することにより、観察者の視点(基準視点)からの存在確率qVj(m)の推定を行った。
なお、カメラセットはなるべく近傍同士のカメラで構成するのが効果的であり、そうすることで、撮影画像に映っている被写体のオクルージョン傾向が類似し、相関値の計算の信頼性が高くなる。
また、代表視点の位置は任意でもよいが、代表視点の選び方の例としては、カメラセットを構成するカメラのうち、中心に位置するカメラ位置を代表視点する方法がある。
さらに、後述するカメラセットごとの寄与率は、基準視点を与えたときに計算される。すなわち、カメラセットの寄与率は、基準視点とカメラセットとの相対的な位置に依存する。そして、寄与率はカメラセットごとに与えられ、属するカメラごとには算出されない。
【0067】
また、本実施例では、カメラの部分集合ごとの部分存在確率をもとにして、カメラ寄与率マップwij(m)を求める。
従来技術では、前述の(17)式、(18)式に示したように、光線の角度をもとにして求めているが、オクルージョンのあるシーンの場合、2つの光線CiPとCvPのなす角度が小さくても、2つの光線の間に遮蔽物がない保証はない。
例えば、図7においては、θ1j<θ3jであるが、C1の視点位置からはP1はQに遮られており、P1の画像を撮影できていないため、W1jを大きくしてC1の画像の寄与を高くすると、P1の代わりにQの色の寄与が大きくなってしまい、画質が低下する。
そこで、本発明では以下のように、色の寄与率を部分存在確率に連動させ、着目する投影点において高い部分存在確率を持つカメラ部分集合の基準カメラほど高い寄与率を割り振るようにする。
例えば、簡易な形態としては、下記(29)式に示すものがある。
【0068】
【数29】
【0069】
このようにすれば、存在確率が高くなるカメラ部分集合の基準カメラの重みが大きくなる。存在確率が大きくなるということはそのカメラ部分集合にて、多くのカメラで被写体表面を撮影していることであるから、着目する部位でオクルージョンのないカメラ部分集合ほど、重みが大きくなることになる。
ただし、前述の(24)式は、カメラ部分集合毎の寄与率であるため、これを個々のカメラ毎の寄与率として表すと、下記(30)式と表され、前述の(6)式の画像生成式に用いることができる。
【0070】
【数30】
【0071】
また、前述の(17)式、(18)式のように、幾何的な位置関係により決定する重みと、前述の(29)式のようにカメラ部分集合ごとの存在確率により決定する重みとを、両方を考慮し、両者の関数として最終的な重みを決定するともできる。
さらに、(30)式に基準カメラから見て手前の投影面にある存在確率の累計を反映させた項をさらに乗じて、下記(31)式とすることで、基準カメラから見て着目する投影点がどの程度の隠れているかを考慮して、カメラ部分集合カメラ毎の寄与率を決定することができる。
【0072】
【数31】
【0073】
【0074】
<画像生成の手順(フロー図)>
以上で述べた画像生成原理を用いて画像を生成する手順を図9に示す。
図中、処理を長方形で、データを角丸長方形で表している。
投影面の色情報と存在確率情報に、前述の(6)式で表される演算を用い、最終的に基準カメラから見た画像を生成するところは従来法と同様である。
しかし、従来法がすべてのカメラCi(i∈N)をいちどに用いて存在確率情報を求めるとともに、各カメラの色の寄与率(重みマップ)はカメラと観察者の視点(基準視点)の位置関係により決定しているのに対し、本発明の手法においては、カメラを部分集合に分け、部分集合毎に部分存在確率を求め、当該情報をもとにして統合された存在確率および色マップを計算するところが大きな違いとなっている。
即ち、ステップ20において、カメラパラメータ{Ai,Ri,ti|i∈N}、{AV,RV,tV}と、カメラ画像{Ii(m)|i∈N}とに基づき、前述の(11)式に示す計算式により、基準視点Vを中心としたカメラ画像の投影画像{IVij(m)|i∈N}を生成する。
またステップ21において、カメラパラメータ{Ai,Ri,ti|i∈N}、{AV,RV,tV}と、カメラ画像{Ii(m)|i∈N}、カメラ部分集合{Ξk|k∈K}とに基づき、前述の(20)式に示す計算式により、基準カメラCi(k)を中心としたカメラ画像の投影画像{Ikij(m)}を生成する。
また、ステップ22において、投影画像{Ikij(m)}に基づき、前述の(19)式、(21)式に示す計算式により、基準カメラCi(k)を中心とした部分存在確率{qkj(m)}を生成する。
【0075】
また、ステップ23において、基準カメラCi(k)を中心とした部分存在確率{qkj(m)}に基づき、前述の(22)式に示す計算式により、基準視点Vを中心とした部分存在確率{qVkj(m)}を生成する。
また、ステップ24において、カメラパラメータ{Ai,Ri,ti|i∈N}、{AV,RV,tV}と、基準視点Vを中心とした部分存在確率{qVkj(m)}とに基づき、前述の(29)式、(30)式、(31)に示す計算式により、寄与率(重み)マップ{wVij(m)|i∈N,j∈J}を生成する。
また、ステップ25において、寄与率(重み)マップ{wVij(m)|i∈N,j∈J}と、投影画像{IVij(m)|i∈N}とに基づき、前述の(16)式に示す計算式により、色マップ{TVj(m)|j∈J}を生成する。
また、ステップ26において、基準視点Vを中心とした部分存在確率{qVkj(m)}に基づき、前述の(33)式、(24)式、(25)式、(26)式、(27)式、(28)式に示す計算式により、統合された存在確率{qVj(m)|j∈J}を生成する。
最後に、ステップ27において、色マップ{TVj(m)|j∈J}と、統合された存在確率{qVj(m)|j∈J}とに基づき、前述の(6)式に示す計算式により、基準視点Vから見た画像{IV(m)}を生成する。
なお、本実施例において、それぞれのカメラセットに属する画像の対応点の色情報または輝度情報を選択、あるいは混色し、各投影点におけるカメラセットごとの投影点の色情報または輝度情報を決定した後、各投影点におけるカメラセットごとの部分存在確率の高さに応じてカメラセットごとの寄与率を決定し、各投影点におけるカメラセットごとの色情報または輝度情報を、カメラセットごとの寄与率の高さに応じた割合で混合することで、前記各投影点の色情報または輝度情報を決定することも可能である。
また、本実施例において、各投影点の色情報または輝度情報を、存在確率の高さと投影面の基準視点からの距離に応じた割合で混合して、生成する画像上の色情報または輝度情報を決定し、2枚以上の2次元画像を生成することも可能である。この2次元画像を、DFD方式の3次元表示装置の各表示面に表示することにより、3次元立体像を得ることができる。
【0076】
図10は、本発明の実施例の仮想視点画像生成方法を実現するための仮想視点画像生成装置の一例の概略構成を示すブロック図であり、図11は、図10に示す仮想視点画像生成装置を用いたシステムの構成例を示す図である。
図10において、1は仮想視点画像生成装置、101は基準視点決定手段、102はカメラ画像取得手段、103は画像生成手段、103aは投影処理手段A、103bは投影処理手段B、103cは寄与率(重み)マップ計算手段、103dは部分相関・存在確率計算手段、103eは色情報・輝度情報決定手段、103fは部分存在確率統合手段、103gはレンダリング手段、104は生成画像出力手段、2は視点位置入力手段、3は被写体撮影手段、4は画像表示手段である。また、図11において、Userは仮想視点画像生成装置の利用者、Objは被写体である。
本実施例1の仮想視点画像生成装置1は、図10及び図11に示すように、利用者Userが視点位置入力手段2を用いて入力したデータに基づき基準視点を決定する基準視点決定手段101と、複数の視点位置Ciにある被写体撮影手段(カメラ)3で撮影された被写体Objの画像を取得する被写体画像取得手段102と、前記取得した被写体Objの画像をもとに、基準視点から前記被写体Objを見た画像を生成する画像生成手段103と、前記画像生成手段103で生成した仮想視点画像を画像表示手段4に表示させるための生成画像出力手段104とにより構成される。
【0077】
このとき、基準視点決定手段101では、視点位置入力手段2から入力された基準視点の位置に基づき、仮想位置の基準視点と、仮想的な3次元空間中に前記基準視点から見て奥行き位置の異なる多層構造の投影面を設定する。また、視点位置入力手段2からは、カメラパラメータ{Ai,Ri,ti|i∈N}、{AV,RV,tV}と、カメラ画像{Ii(m)|i∈N}、カメラ部分集合{Ξk|k∈K}も入力される。
前記視点位置入力手段2は、例えば、図11に示したように、マウス等の利用者Userが操作して選択するデバイスであってもよいし、キーボード等の利用者Userが直接数値として入力するデバイスでもよいし、前記利用者Userが装着する位置・姿勢検出センサでもよい。また、他のプログラムにより与えられるものでも、ネットワークを介して与えられるものでも可能である。
また、前記被写体画像取得手段102は、刻々と変化する被写体の位置・姿勢を一定の間隔、例えば、30Hzの間隔で逐次的に取得することも、任意の時刻における被写体の静止画像を取得することも可能であるし、あらかじめ撮影した被写体画像を記録装置から読み出すことで取得することも可能である。なお、複数の視点位置からの被写体画像は、すべてのカメラ間の同期をとることにより同一時刻に撮影したものであることが望ましいが、被写体の位置・姿勢の変化が十分に遅く、静止物と見なせる場合にはこの限りではない。
【0078】
また、前記画像生成手段103は、投影処理手段A(103a)と、投影処理手段B(103b)と、寄与率(重み)マップ計算手段103cと、部分相関・存在確率計算手段103dと、色情報・輝度情報決定手段103eと、部分存在確率統合手段103fと、レンダリング処理手段103gとで構成される。
投影処理手段A(103a)は、図9のステップ20の処理を実行する。投影処理手段B(103b)は、図9のステップ21の処理を実行する。
部分相関・存在確率計算手段103dは、図9のステップ22と、ステップ23の処理を実行する。
寄与率(重み)マップ計算手段103cは、図9のステップ24の処理を実行する。色情報・輝度情報決定手段103eは、図9のステップ25の処理を実行する。
部分存在確率統合手段103fは、図9のステップ26の処理を実行する。レンダリング処理手段103gは、図9のステップ27の処理を実行する。
また、前記画像表示手段4は、例えば、ディスプレイ端子等の生成画像出力手段104に接続されたCRT(Cathode Ray Tube),LCD(Liquid Crystal Display),PDP(Plasma Display Panel)等の表示装置である。このとき、前記画像表示手段4は、例えば、2次元平面状の表示装置でもよいし、利用者Userを取り囲むような曲面状の表示装置であってもよい。
【0079】
また、前記画像表示手段4として、例えば、DFD方式の立体表示が可能な表示装置を用いるときには、奥行き位置の異なる2つの表示面に、画像生成手段103で生成したそれぞれの2次元像を表示することにより、利用者に3次元立体像を提示することも可能である。
また、前記仮想視点画像生成装置1を用いたシステムは、例えば、図11に示したような構成になっており、利用者Userは前記視点位置入力手段2を介して仮想視点画像生成装置1に所望の視点位置・方向・画角を指定すると、前記仮想視点画像生成装置1は被写体Objを前記被写体撮影手段(カメラ)3で撮影し、その画像を取得した後、前記取得した被写体の画像をもとに指示された視点における画像(仮想視点画像)を生成する。前記生成された仮想視点画像は、前記画像表示手段4により利用者Userに提示する。
なお、図11のシスデム構成は本発明における画像生成装置の実装の一例を示すものであり、本発明の請求範囲は必ずしもこのような構成に限定されるものではなく、個々の装置の配置、形態、実装は本発明の趣旨を逸脱しない範囲において任意である。
【0080】
以上説明したように、本実施例によれば、従来の方法のように、あらゆる場合及びあらゆる箇所で被写体の正確な幾何モデルを得ようとするのではなく、被写体の撮影条件や部位によっては距離推定で、十分な信頼性の存在確率をもつ推定値が得られないことを前提として、存在確率の信頼性が低い推定値が得られた箇所については曖昧に描画して画像生成への寄与を低くし、極端な画像の劣化を防止するとともに、信頼性が高い存在確率が得られた箇所については明瞭に描画して画像生成への寄与を高くする。そのため、推定の信頼性(存在確率)が低い箇所の画像の劣化が目立たなくなる。
また、正確な幾何モデルを求めるために、最適化問題等、計算機負荷の高い処理を経る必要がないため、インタラクティブ性が要求される条件においても、短い処理時間で映像生成が可能となる。
【0081】
また、本実施例によれば、カメラセットごとの存在確率(部分存在確率)を算出し、それらを統合した存在確率を求めることで、例えば、オクルージョン(遮蔽領域)が生じ、被写体表面のある点が、あるカメラからは見えない場合に、存在確率の推定の信頼性を向上させることができる。
すなわち、いちどにすべてのカメラの画像を用いると、隠れている部分も含めて対応点の相関度を計算してしまうので、それを元に求められる存在確率の信頼性が低下してしまうのに対し、カメラセットごとに分けて存在確率を求めることで、あるカメラセットにおいては構成するカメラの多くが着目する被写体表面上の点を撮影し、その箇所において高い部分存在確率を算出することになる。
逆に、あるカメラセットにおいては構成するカメラの多くが着目する被写体表面上の点を撮影していないこともあり、この場合は算出される部分存在確率は低くなる。
しかし、その後の統合処理において、高い部分存在確率の影響が大きく、低い部分存在確率の影響が低くなる演算を行うことで、前者が後者を補う働きをし、結果として統合された存在確率の信頼性は高くなる効果がある。
先行研究に見られるように、個々のカメラセットにおいて奥行きの情報のみを求め、それらを取捨選択や平均するなどして奥行き情報を統合する方法に比べ、本発明では奥行きの情報だけでなくカメラセットごとの推定の信頼性の情報も考慮して統合する。すなわち、カメラセットごとに相反する奥行き情報を統合する際にも、信頼性の高い奥行き情報に重きを置いた統合がなされる。そうすることにより、本発明はより確度の高い被写体の3次元情報を算出する効果があると言える。
【0082】
また、本実施例によれば、カメラセット毎の部分存在確率を算出するにあたり、対応点間の相関度に基づいて、カメラセットの代表となる1つの視点位置(代表視点)を通る直線上の値の合計が1となる処理(正規化処理)をする。
一般的に、相関度の算出においては対応点間の色情報(もしくは輝度)の差分が小さいほど相関が高いという前提を利用するため、対応点が暗い部分は差分が小さく相関度が高くなり、逆に明るい部分は差分が大きく相関度が低くなる傾向がある。しかし、前述の正規化処理を経ることで、部分存在確率の算出にあたり対応点における撮影画像の明暗の影響を受けず、それらを統合した存在確率の信頼性が高くなる効果がある。
【0083】
また、本実施例によれば、生成される画像の各画素の色は、投影面上の投影点に対応するカメラの画像上の対応点をもとにして決定する。しかし、オクルージョン(遮蔽)等により、あるカメラからはこの投影点における被写体表面上の点が撮影されず、その撮影画像上の対応点の色情報(または輝度情報)を用いると、投影点の位置に存在する被写体表面の色(または輝度)とは異なる色を用いることになり、生成画像の画質が低下する。
ここで、被写体表面が存在している任意の投影点に着目すると、その位置においてカメラセットごとに算出される部分存在確率の違いは、投影点における被写体表面が撮影されているカメラの数に依存する。すなわち、ある投影点において部分存在確率が高く算出されたカメラセットでは、そのカメラセットを構成する多くのカメラにより、着目する投影点における被写体表面が撮影されている可能性が高く、逆に部分存在確率が低く算出されたカメラセットにおいては、そのカメラセットを構成する一部もしくはすべてのカメラから、着目する投影点における被写体表面が撮影されていない可能性が高い。
そこで、投影点の色情報(または輝度情報)を決定する際に、カメラセットごとの対応点の色情報(または輝度情報)を、カメラセットごとの部分存在確率の高さに応じた割合で混合することにより、投影点が撮影できているカメラが多いカメラセットの色の寄与を大きく、投影点が撮影できているカメラが少ないカメラセットの色の寄与を小さくし、投影点の色はその位置に存在する被写体表面の色(または輝度)と近い値が推定され、結果として生成画像の画質を向上させる効果がある。
【0084】
また、本実施例によれば、投影点の色情報を決定する際に、遮蔽により投影点を撮影していないカメラによる寄与を抑制し、結果として生成画像の画質を向上させる効果がある。
あるカメラセットの代表視点から見て着目する投影点よりも手前の他の投影点の存在確率の合計が高い場合には、代表視点と着目する投影点の間に被写体表面が存在している可能性が高い。すなわち、着目する投影点は代表視点から見てそれよりも手前の被写体により遮蔽されている可能性が高いため、その代表視点における対応点の色は、投影点を撮影した色でない可能性が高い。
このようなとき、そのカメラセットによる色の寄与率を低くし、逆に、代表視点から見て手前の存在確率の合計が低いようなカメラサブセットの色の寄与率を高くすることで、投影点において被写体を撮影しているカメラの色の寄与率を高めることができる。
【0085】
また、本実施例によれば、カメラセットごとに算出された部分的な存在確率を乗算して統合された存在確率を算出することで、より多くのカメラセットにより存在確率が高く算出された投影点において、統合された存在確率が高く算出され、その推定精度が向上する。
また、バイアス値を加算することで、あるカメラセットにより算出された部分存在確率が0に近い場合でも、他のカメラセットによる部分存在確率が高い場合には、統合された存在確率が0に近くなることを防止する効果がある。そのため、統合された存在確率の推定がよりロバストになる効果がある。
また、そのバイアス値の大きさを投影面ごとに異なる設定にすることより、統合処理後の存在確率において、投影面ごとに存在確率の分布傾向を調整することができる。例えば、奥の投影面から手前の投影面に向かうにつれて加算するバイアスの値を大きくすることで、手前のものほど存在確率が高くなる傾向になり、奥に存在するものが透けて画像生成することを防止することができる。
また、ある範囲にある投影面のバイアスを高く設定することで、ある特定の奥行きの範囲にある被写体を強調して画像生成する効果がある。
また、投影面上で特定の領域にあるバイアスを、他の領域に比べて高く設定することで、ある特定の範囲にある被写体を強調して画像生成する効果がある。また、ある奥行きの投影面上のある領域にあるバイアスを、他の領域に比べて低く設定することで、ある特定の範囲にある被写体が目立たぬよう画像生成する効果がある。
【0086】
また、本実施例によれば、基準視点から見て隠れている被写体表面を誤って描画することによる画像の劣化を防ぐことができる。
すなわち、基準視点を通る直線上に、複数の被写体表面が存在する場合、複数の位置にて存在確率が高く推定される可能性があり、この場合は基準視点から見て手前の被写体を透けて、奥の被写体を描画してしまうことになる。そこで、手前の存在確率が高い場合、その程度に応じてそれよりも奥の投影面のバイアス値を低く設定することで、存在確率の統合処理時に奥の投影点の存在確率が高くなることを抑制し、結果として生成画像において奥の被写体表面が透けて見えることを防ぐことが出来る。
以上、本発明者によってなされた発明を、前記実施例に基づき具体的に説明したが、本発明は、前記実施例に限定されるものではなく、その要旨を逸脱しない範囲において種々変更可能であることは勿論である。
【図面の簡単な説明】
【0087】
【図1】画像生成の座標設定の一例を示す図である。
【図2】被写体表面の色情報および存在確率情報を求める多層の投影面の一例を示す図である。
【図3】複数のカメラ間の対応点を説明した図である。
【図4】はカメラで撮影された画像を投影面上に透視投影した一例を示す図である。
【図5】観察者の視点(基準視点)とカメラのなす角度によりカメラ毎の色の寄与率(重み)を決定する一例を示す図である。
【図6】従来法による画像生成の処理フローの一例を示す図である。
【図7】オクルージョンが発生している状況の一例を示す図である。
【図8】着目する投影点よりも手前の投影点の存在確率の累計を説明した図である。
【図9】本発明の実施例の画像生成の処理フローの一例を示す図である。
【図10】本発明の実施例の仮想視点画像生成装置の概略構成を示すブロック図である。
【図11】図10に示す画像生成装置を用いたシステムの構成例を示す図である。
【符号の説明】
【0088】
1 仮想視点画像生成装置
2 視点位置入力手段
3 被写体撮影手段
4 画像表示手段
101 基準視点決定手段
102 被写体画像取得手段
103 画像生成手段
103a 投影処理手段A
103b 投影処理手段B
103c 寄与率(重み)マップ計算手段
103d 部分相関・存在確率計算手段
103e 色情報・輝度情報決定手段
103f 部分存在確率統合手段
103g レンダリング処理手段
104 生成画像出力手段
【特許請求の範囲】
【請求項1】
複数の異なる視点から被写体を撮影した被写体の複数の画像に基づき、任意の仮想位置の基準視点から見た前記被写体の画像を生成する仮想視点画像生成方法であって、
前記複数の異なる視点から被写体を撮影した前記被写体の複数の画像を取得するステップAと、
仮想的な3次元空間中に前記基準視点から見て奥行き位置の異なる多層構造の投影面を設定するステップBと、
前記複数の投影面上の前記基準視点から見て重なり合う複数の投影点と対応する前記取得した前記被写体の複数の画像の対応点の色情報または輝度情報から、前記各投影点の色情報または輝度情報を決定するステップCと、
前記各投影点毎に、前記被写体の複数の画像の前記各投影点に対応する対応点間の相関度を算出するステップDと、
前記各投影点における相関度に基づいて、前記各投影点に物体の表面が存在する確率を表す存在確率を決定するステップEと、
前記各投影点の色情報または輝度情報と、前記各投影点での存在確率に基づいて、前記基準視点から見た前記被写体の画像を生成するステップFとを有し、
前記ステップDは、前記被写体の複数の画像の中から選んだいくつかの画像の組み合わせであるカメラセットを複数組用意するステップD1と、
前記各カメラセットに含まれる各被写体の画像上の前記各投影点に対応する対応点から、前記各投影点について相関度を求めるステップD2とを有し、
前記ステップEは、前記カメラセット毎に求めた前記各投影点の相関度に基づき、カメラセットの代表となる1つの視点位置である代表視点を通る直線上の値の合計が一定値となる正規化処理を施した部分存在確率を算出するステップE1と、
前記カメラセット毎に決定した部分存在確率の統合処理をして前記各投影点の存在確率を決定するステップE2とを有することを特徴とする仮想視点画像生成方法。
【請求項2】
前記ステップFは、前記各投影点の色情報または輝度情報を前記存在確率の高さに応じた割合で混合して、生成する画像上の点の色情報または輝度情報を決定し、1枚の2次元画像を生成するステップであることを特徴とする請求項1に記載の仮想視点画像生成方法。
【請求項3】
前記ステップFは、前記各投影点の色情報または輝度情報を、前記存在確率の高さと投影面の基準視点からの距離に応じた割合で混合して、生成する画像上の色情報または輝度情報を決定し、2枚以上の2次元画像を生成するステップであることを特徴とする請求項1に記載の仮想視点画像生成方法。
【請求項4】
前記ステップCは、それぞれのカメラセットに属する各被写体の画像の対応点の色情報または輝度情報から、前記各投影点におけるカメラセットごとの投影点の色情報または輝度情報を決定するステップC1と、
前記各投影点におけるカメラセットごとの部分存在確率の高さに応じてカメラセットごとの寄与率を決定するステップC2と、
前記各投影点におけるカメラセットごとの色情報または輝度情報を、カメラセットごとの寄与率の高さに応じた割合で混合し、前記各投影点の色情報または輝度情報を決定するステップC3とを有することを特徴とする請求項1ないし請求項3のいずれか1項に記載の仮想視点画像生成方法。
【請求項5】
前記ステップCは、前記カメラセットごとの寄与率に対し、前記各投影点と前記カメラセットの代表視点とを結ぶ線分上にある他の投影点の存在確率に応じた係数を更に乗じ、新たなカメラセットごとの寄与率を決定するステップC4を有することを特徴とする請求項4に記載の仮想視点画像生成方法。
【請求項6】
前記ステップE2は、着目する投影点において異なるカメラセットから算出された複数の部分存在確率に、バイアス値を加算し、加算後の部分存在確率に投影面ごとに定めた係数を乗算して統合した存在確率を算出するステップE21と、
前記各投影点において統合した存在確率を正規化処理するステップE22とを有することを特徴とする請求項1ないし請求項5のいずれか1項に記載の仮想視点画像生成方法。
【請求項7】
前記バイアス値あるいは投影面ごとの係数は、着目する投影点と前記基準視点とを結ぶ線分上の他の投影点の存在確率に依存し、それらが大きいほど抑制されることを特徴とする請求項6に記載の仮想視点画像生成方法。
【請求項8】
複数の異なる視点から被写体を撮影した被写体の複数の画像に基づき、任意の仮想位置の基準視点から見た前記被写体の画像を生成する仮想視点画像生成装置であって、
任意の仮想位置の基準視点と、仮想的な3次元空間中に前記基準視点から見て奥行き位置の異なる多層構造の投影面を設定する基準視点決定手段と、
前記複数の異なる視点から被写体を撮影した前記被写体の複数の画像を取得する画像取得手段と、
前記基準視点決定手段で決定された前記基準視点と、前記画像取得手段で取得した前記被写体の複数の画像とに基づき、前記基準視点から見た前記被写体の画像を生成する画像生成手段とを有し、
前記画像生成手段は、前記被写体の複数の画像の中から選んだいくつかの画像の組み合わせである複数組のカメラセットを用意し、それぞれのカメラセットに属する各被写体の画像における、前記複数の投影面上の前記基準視点から見て重なり合う複数の投影点と対応する対応点の相関度を求め、前記カメラセットの代表となる1つの視点位置である代表視点を通る直線上の値の合計が一定値となる正規化処理を施した部分存在確率を算出する部分相関・存在確率計算手段と、
前記部分相関・存在確率計算手段で算出した前記カメラセット毎の部分存在確率を統合処理して前記各投影点の存在確率を算出する部分存在確率統合手段と、
前記部分相関・存在確率計算手段で算出した前記カメラセット毎の部分存在確率に基づき、前記カメラセット毎の寄与率を計算する寄与率計算手段と、
前記取得した前記被写体の複数の画像の対応点の色情報または輝度情報と、前記寄与率計算手段で算出した前記カメラセット毎の寄与率に基づき、前記各投影点の色情報または輝度情報を決定する色情報・輝度情報決定手段と、
前記部分存在確率統合手段で決定された前記各投影点の存在確率と、前記色情報・輝度情報決定手段で決定した前記各投影点の色情報または輝度情報とに基づき、前記基準視点から見た前記被写体の画像を生成するレンダリング手段とを有することを特徴とする仮想視点画像生成装置。
【請求項9】
前記画像生成手段は、前記取得した前記被写体の複数の画像を基準視点を中心とした投影画像に変換する投影処理手段Aと、
前記被写体の複数の画像の中から選んだいくつかの画像の組み合わせである複数組のカメラセット毎に、それぞれのカメラセットに属する画像を、カメラセットの代表となる1つの視点位置である代表視点を中心とした投影画像に変換する投影処理手段Bとを有し、
前記部分相関・存在確率計算手段は、カメラセット毎に、前記投影処理手段Bで決定された投影画像における、前記複数の投影面上の前記基準視点から見て重なり合う複数の投影点に対応する対応点の相関度を求め、前記カメラセットの代表となる1つの視点位置である代表視点を通る直線上の値の合計が一定値となる正規化処理を施した部分存在確率を算出し、
前記色情報・輝度情報決定手段は、前記投影処理手段Aで変換された前記被写体の複数の画像の対応点の色情報または輝度情報と、前記寄与率計算手段で算出した前記カメラセット毎の寄与率に基づき、前記各投影点の色情報または輝度情報を決定することを特徴とする請求項8に記載の仮想視点画像生成装置。
【請求項10】
前記レンダリング手段は、前記各投影点の色情報または輝度情報を前記存在確率の高さに応じた割合で混合して、生成する画像上の点の色情報または輝度情報を決定し、1枚の2次元画像を生成することを特徴とする請求項8または請求項9に記載の仮想視点画像生成装置。
【請求項11】
前記レンダリング手段は、前記各投影点の色情報または輝度情報を、前記存在確率の高さと投影面の基準視点からの距離に応じた割合で混合して、生成する画像上の色情報または輝度情報を決定し、2枚以上の2次元画像を生成することを特徴とする請求項8または請求項9に記載の仮想視点画像生成装置。
【請求項12】
前記色情報・輝度情報決定手段は、それぞれのカメラセットに属する各被写体の画像の対応点の色情報または輝度情報から、前記各投影点におけるカメラセットごとの投影点の色情報または輝度情報を決定するとともに、前記各投影点におけるカメラセットごとの色情報または輝度情報を、カメラセットごとの寄与率の高さに応じた割合で混合して、前記各投影点の色情報または輝度情報を決定することを特徴とする請求項8ないし請求項11のいずれか1項に記載の仮想視点画像生成装置。
【請求項13】
前記寄与率計算手段は、前記カメラセットごとの寄与率に対し、前記各投影点と前記カメラセットの代表視点とを結ぶ線分上にある他の投影点の存在確率に応じた係数を更に乗じ、新たなカメラセットごとの寄与率を決定することを特徴とする請求項8ないし請求項12のいずれか1項に記載の仮想視点画像生成装置。
【請求項14】
前記部分存在確率統合手段は、各投影点において異なるカメラセットから算出された複数の部分存在確率に、バイアス値を加算し、加算後の部分存在確率に投影面ごとに定めた係数を乗算して統合した存在確率を算出し、前記各投影点において統合した存在確率を正規化処理することを特徴とする請求項8ないし請求項13のいずれか1項に記載の仮想視点画像生成装置。
【請求項1】
複数の異なる視点から被写体を撮影した被写体の複数の画像に基づき、任意の仮想位置の基準視点から見た前記被写体の画像を生成する仮想視点画像生成方法であって、
前記複数の異なる視点から被写体を撮影した前記被写体の複数の画像を取得するステップAと、
仮想的な3次元空間中に前記基準視点から見て奥行き位置の異なる多層構造の投影面を設定するステップBと、
前記複数の投影面上の前記基準視点から見て重なり合う複数の投影点と対応する前記取得した前記被写体の複数の画像の対応点の色情報または輝度情報から、前記各投影点の色情報または輝度情報を決定するステップCと、
前記各投影点毎に、前記被写体の複数の画像の前記各投影点に対応する対応点間の相関度を算出するステップDと、
前記各投影点における相関度に基づいて、前記各投影点に物体の表面が存在する確率を表す存在確率を決定するステップEと、
前記各投影点の色情報または輝度情報と、前記各投影点での存在確率に基づいて、前記基準視点から見た前記被写体の画像を生成するステップFとを有し、
前記ステップDは、前記被写体の複数の画像の中から選んだいくつかの画像の組み合わせであるカメラセットを複数組用意するステップD1と、
前記各カメラセットに含まれる各被写体の画像上の前記各投影点に対応する対応点から、前記各投影点について相関度を求めるステップD2とを有し、
前記ステップEは、前記カメラセット毎に求めた前記各投影点の相関度に基づき、カメラセットの代表となる1つの視点位置である代表視点を通る直線上の値の合計が一定値となる正規化処理を施した部分存在確率を算出するステップE1と、
前記カメラセット毎に決定した部分存在確率の統合処理をして前記各投影点の存在確率を決定するステップE2とを有することを特徴とする仮想視点画像生成方法。
【請求項2】
前記ステップFは、前記各投影点の色情報または輝度情報を前記存在確率の高さに応じた割合で混合して、生成する画像上の点の色情報または輝度情報を決定し、1枚の2次元画像を生成するステップであることを特徴とする請求項1に記載の仮想視点画像生成方法。
【請求項3】
前記ステップFは、前記各投影点の色情報または輝度情報を、前記存在確率の高さと投影面の基準視点からの距離に応じた割合で混合して、生成する画像上の色情報または輝度情報を決定し、2枚以上の2次元画像を生成するステップであることを特徴とする請求項1に記載の仮想視点画像生成方法。
【請求項4】
前記ステップCは、それぞれのカメラセットに属する各被写体の画像の対応点の色情報または輝度情報から、前記各投影点におけるカメラセットごとの投影点の色情報または輝度情報を決定するステップC1と、
前記各投影点におけるカメラセットごとの部分存在確率の高さに応じてカメラセットごとの寄与率を決定するステップC2と、
前記各投影点におけるカメラセットごとの色情報または輝度情報を、カメラセットごとの寄与率の高さに応じた割合で混合し、前記各投影点の色情報または輝度情報を決定するステップC3とを有することを特徴とする請求項1ないし請求項3のいずれか1項に記載の仮想視点画像生成方法。
【請求項5】
前記ステップCは、前記カメラセットごとの寄与率に対し、前記各投影点と前記カメラセットの代表視点とを結ぶ線分上にある他の投影点の存在確率に応じた係数を更に乗じ、新たなカメラセットごとの寄与率を決定するステップC4を有することを特徴とする請求項4に記載の仮想視点画像生成方法。
【請求項6】
前記ステップE2は、着目する投影点において異なるカメラセットから算出された複数の部分存在確率に、バイアス値を加算し、加算後の部分存在確率に投影面ごとに定めた係数を乗算して統合した存在確率を算出するステップE21と、
前記各投影点において統合した存在確率を正規化処理するステップE22とを有することを特徴とする請求項1ないし請求項5のいずれか1項に記載の仮想視点画像生成方法。
【請求項7】
前記バイアス値あるいは投影面ごとの係数は、着目する投影点と前記基準視点とを結ぶ線分上の他の投影点の存在確率に依存し、それらが大きいほど抑制されることを特徴とする請求項6に記載の仮想視点画像生成方法。
【請求項8】
複数の異なる視点から被写体を撮影した被写体の複数の画像に基づき、任意の仮想位置の基準視点から見た前記被写体の画像を生成する仮想視点画像生成装置であって、
任意の仮想位置の基準視点と、仮想的な3次元空間中に前記基準視点から見て奥行き位置の異なる多層構造の投影面を設定する基準視点決定手段と、
前記複数の異なる視点から被写体を撮影した前記被写体の複数の画像を取得する画像取得手段と、
前記基準視点決定手段で決定された前記基準視点と、前記画像取得手段で取得した前記被写体の複数の画像とに基づき、前記基準視点から見た前記被写体の画像を生成する画像生成手段とを有し、
前記画像生成手段は、前記被写体の複数の画像の中から選んだいくつかの画像の組み合わせである複数組のカメラセットを用意し、それぞれのカメラセットに属する各被写体の画像における、前記複数の投影面上の前記基準視点から見て重なり合う複数の投影点と対応する対応点の相関度を求め、前記カメラセットの代表となる1つの視点位置である代表視点を通る直線上の値の合計が一定値となる正規化処理を施した部分存在確率を算出する部分相関・存在確率計算手段と、
前記部分相関・存在確率計算手段で算出した前記カメラセット毎の部分存在確率を統合処理して前記各投影点の存在確率を算出する部分存在確率統合手段と、
前記部分相関・存在確率計算手段で算出した前記カメラセット毎の部分存在確率に基づき、前記カメラセット毎の寄与率を計算する寄与率計算手段と、
前記取得した前記被写体の複数の画像の対応点の色情報または輝度情報と、前記寄与率計算手段で算出した前記カメラセット毎の寄与率に基づき、前記各投影点の色情報または輝度情報を決定する色情報・輝度情報決定手段と、
前記部分存在確率統合手段で決定された前記各投影点の存在確率と、前記色情報・輝度情報決定手段で決定した前記各投影点の色情報または輝度情報とに基づき、前記基準視点から見た前記被写体の画像を生成するレンダリング手段とを有することを特徴とする仮想視点画像生成装置。
【請求項9】
前記画像生成手段は、前記取得した前記被写体の複数の画像を基準視点を中心とした投影画像に変換する投影処理手段Aと、
前記被写体の複数の画像の中から選んだいくつかの画像の組み合わせである複数組のカメラセット毎に、それぞれのカメラセットに属する画像を、カメラセットの代表となる1つの視点位置である代表視点を中心とした投影画像に変換する投影処理手段Bとを有し、
前記部分相関・存在確率計算手段は、カメラセット毎に、前記投影処理手段Bで決定された投影画像における、前記複数の投影面上の前記基準視点から見て重なり合う複数の投影点に対応する対応点の相関度を求め、前記カメラセットの代表となる1つの視点位置である代表視点を通る直線上の値の合計が一定値となる正規化処理を施した部分存在確率を算出し、
前記色情報・輝度情報決定手段は、前記投影処理手段Aで変換された前記被写体の複数の画像の対応点の色情報または輝度情報と、前記寄与率計算手段で算出した前記カメラセット毎の寄与率に基づき、前記各投影点の色情報または輝度情報を決定することを特徴とする請求項8に記載の仮想視点画像生成装置。
【請求項10】
前記レンダリング手段は、前記各投影点の色情報または輝度情報を前記存在確率の高さに応じた割合で混合して、生成する画像上の点の色情報または輝度情報を決定し、1枚の2次元画像を生成することを特徴とする請求項8または請求項9に記載の仮想視点画像生成装置。
【請求項11】
前記レンダリング手段は、前記各投影点の色情報または輝度情報を、前記存在確率の高さと投影面の基準視点からの距離に応じた割合で混合して、生成する画像上の色情報または輝度情報を決定し、2枚以上の2次元画像を生成することを特徴とする請求項8または請求項9に記載の仮想視点画像生成装置。
【請求項12】
前記色情報・輝度情報決定手段は、それぞれのカメラセットに属する各被写体の画像の対応点の色情報または輝度情報から、前記各投影点におけるカメラセットごとの投影点の色情報または輝度情報を決定するとともに、前記各投影点におけるカメラセットごとの色情報または輝度情報を、カメラセットごとの寄与率の高さに応じた割合で混合して、前記各投影点の色情報または輝度情報を決定することを特徴とする請求項8ないし請求項11のいずれか1項に記載の仮想視点画像生成装置。
【請求項13】
前記寄与率計算手段は、前記カメラセットごとの寄与率に対し、前記各投影点と前記カメラセットの代表視点とを結ぶ線分上にある他の投影点の存在確率に応じた係数を更に乗じ、新たなカメラセットごとの寄与率を決定することを特徴とする請求項8ないし請求項12のいずれか1項に記載の仮想視点画像生成装置。
【請求項14】
前記部分存在確率統合手段は、各投影点において異なるカメラセットから算出された複数の部分存在確率に、バイアス値を加算し、加算後の部分存在確率に投影面ごとに定めた係数を乗算して統合した存在確率を算出し、前記各投影点において統合した存在確率を正規化処理することを特徴とする請求項8ないし請求項13のいずれか1項に記載の仮想視点画像生成装置。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【公開番号】特開2009−116532(P2009−116532A)
【公開日】平成21年5月28日(2009.5.28)
【国際特許分類】
【出願番号】特願2007−287583(P2007−287583)
【出願日】平成19年11月5日(2007.11.5)
【出願人】(000004226)日本電信電話株式会社 (13,992)
【Fターム(参考)】
【公開日】平成21年5月28日(2009.5.28)
【国際特許分類】
【出願日】平成19年11月5日(2007.11.5)
【出願人】(000004226)日本電信電話株式会社 (13,992)
【Fターム(参考)】
[ Back to top ]