説明

画像生成方法、画像生成装置、及びプログラム

【課題】計算機リソースを節約しつつ、被写体以外の場所の見栄えを悪くすることなく、適切に画像を生成する。
【解決手段】被写体を複数の視点位置から撮影した元画像中から、被写体の重要部位が撮影されている領域を検出し(ステップS2)、重要部位が撮影されている検出領域と複数の視点位置の幾何的な条件とから空間中重要部位領域を推定し(ステップS3)、空間中重要部位領域が空間中で被写体が存在する被写体存在領域であると想定し、基準視点から見た被写体の中間画像を生成する(ステップS4)。中間画像中から重要部位領域を切り出し画像として切り出す(ステップS5)。元画像からベース画像を選択し(ステップS6)、ベース画像の重要部位が存在する領域に、切り出し画像を合成する(ステップS7)。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、複数の異なる視点位置から被写体を撮影した画像を元に、所望の視点位置にて被写体を撮影したのと同等の画像を生成する画像生成方法、画像生成装置、及びプログラムに関する。
【背景技術】
【0002】
近年,コンピュータグラフィックス(CG)やバーチャルリアリティ(VR)の分野では、カメラが設置された視点位置からだけでなく、利用者が望む視点位置から見た被写体の画像をコンピュータにより生成する技術が盛んに研究されている。これらの技術の代表的なものとして、被写体の形状を推定し、所望の視点位置からレンダリングする幾何ベースの方法と、被写体から飛来する光線を所望の視点位置で再サンプリングする光線ベースの方法とがある。
【0003】
幾何ベースの方法としては、被写体の幾何形状を推定するために、画像間のステレオ対応を用いる方法(例えば、非特許文献1参照)や、視体積交差法を用いる方法(例えば、非特許文献2参照)などがある。
【0004】
また、光線ベースの方法としては、光線の強度を位置、方向、時間、波長に対する関数であるplenoptic functionにより記述されることに基づき、その次元を落とし、ある視点位置を与えたときに、そこを通る光線群を再サンプリングするのに適した表現方法として、いくつかの方式が提案されている(例えば、非特許文献3、4参照)。
【0005】
光線ベースの方法では、一般的に、計算機負荷は小さく、実時間処理が求められるアプリケーションに適している。しかしながら、光線ベースの方法では、被写体が存在すると仮定した面の付近でしか、正しく画像生成できないことが知られている(例えば、非特許文献5、6参照)。
【0006】
そのため、あらかじめ被写体の位置を、利用者が仮定する必要があるため、利便性が悪く、また、被写体が動いた場合に正しく画像生成できないという欠点があった。そこで、多層の投影面を設定し、被写体が存在すると仮定する範囲を拡げる手法が提案されている(例えば、非特許文献7参照)。
【先行技術文献】
【非特許文献】
【0007】
【非特許文献1】T. Kanade, P. J. Narayanan, and P. W.Rander: “Virtualized Reality: Concepts and Early Results”, In Proc. of IEEE Workshop on the Representation of Visual Scenes, pp.69-76 (1995).
【非特許文献2】W. Matusik, C. Buehler, R. Raskar, S. J. Gortler, and L. McMillan: “Image-Based Visual Hulls”, In Proc. of SIGGRAPH 2000, pp.369-374 (2000).
【非特許文献3】M. Levoy and P. Hanrahan: “Light Field Rendering” In Proc. of SIGGRAPH ’96, pp. 31-41 (1996).
【非特許文献4】S. J. Gortler, R. Grzeszczuk, R. Szeliski, and M. F. Cohen: “The Lumigraph”, In Proc. of SIGGRAPH ’96, pp.43-54 (1996).
【非特許文献5】Y. Kunita, M. Inami, T. Maeda, and S. Tachi: “Realtime Rendering System of Moving Objects”, In Proc. of the 1999 IEEE Workshop on Multi-View Modeling & Analysis of Visual Scenes (MVIEW’99), pp.81-88 (1999).
【非特許文献6】J.-X. Chai, X. Tong, S.-C. Chan, and H.-Y. Shum: “Plenoptic Sampling”, In Proc. of SIGGRAPH 2000, pp.307-318 (2000).
【非特許文献7】特許第4052331号(WO2004/114224):仮想視点画像生成方法及び3次元画像表示方法並びに装置
【発明の概要】
【発明が解決しようとする課題】
【0008】
上述したように、光線ベースの方法(非特許文献3、4)では、被写体が存在すると仮定した面の付近でしか、正しく画像生成できないため、あらかじめ被写体の位置を、利用者が仮定する必要があるので、利便性が悪く、また、被写体が動いた場合に正しく画像生成できないという問題があった。
【0009】
また、上述した従来技術(非特許文献7)においても、利用者が多層の投影面の位置を決定する必要があった。そして、被写体が動く範囲を、多層の投影面でカバーしきれていない場合、適切に画像生成ができないという問題があった。
【0010】
また、例え、多層の投影面が被写体をカバーしたとしても、投影面の数が多すぎると、メモリなどの計算機リソースを多く消費し、また、必要以上に多層の投影面の範囲が広いと、生成画像の劣化を招いていた。また、多層投影面がカバーできていない被写体以外の場所には、多重像などが生じ、生成画像の見た目を悪くしてしまうという問題があった。
【0011】
本発明は、このような事情を考慮してなされたものであり、その目的は、被写体の存在する場所が未知であっても、計算機リソースを節約しつつ、被写体以外の場所の見栄えを悪くすることなく、適切に画像を生成することができる画像生成方法、画像生成装置、及びプログラムを提供することにある。
【課題を解決するための手段】
【0012】
上述した課題を解決するために、本発明は、被写体を複数の撮影手段による視点位置から撮影した元画像に基づいて、所望の基準視点から被写体を見た画像を生成する画像生成方法であって、前記元画像中から、被写体のうち特に重要と定められた重要部位が撮影されている領域を検出する第1のステップと、前記重要部位が撮影されている検出領域と前記複数の撮影手段の幾何的な条件とから、被写体の存在する空間中で重要部位が存在する空間中重要部位領域を推定する第2のステップと、前記空間中重要部位領域が空間中で被写体が存在する被写体存在領域であると想定し、前記元画像の色または輝度情報に基づいて、前記被写体存在領域中の小領域毎の色または輝度を決定して基準視点から見た写像を得ることで、前記基準視点から見た被写体の中間画像を生成する第3のステップと、前記中間画像中において重要部位が存在する重要部位領域を特定し、当該重要部位領域を切り出し画像として切り出す第4のステップと、前記複数の撮影手段により撮影された元画像のうちの1つをベース画像として選択する第5のステップと、前記ベース画像のうち、重要部位が存在する領域に、前記切り出し画像を合成して最終的な生成画像を生成する第6のステップとを含むことを特徴とする画像生成方法である。
【0013】
本発明は、上記の発明において、前記第5のステップは、前記複数の撮影手段により撮影された元画像のうちの1つをベース画像として選択する第7のステップと、前記選択したベース画像に前記基準視点から見た射影変換を施す第8のステップとを含み、前記射影変換後の画像を前記ベース画像として用いることを特徴とする。
【0014】
本発明は、上記の発明において、前記第3のステップは、前記被写体存在領域にまたがって配列された多層の投影面を仮定し、当該多層投影面中の各画素の色または輝度、及び存在確率を推定し、前記基準視点を通る直線と前記多層投影面との交点の色を、前記存在確率に応じた重みを付けて加算することで前記基準視点から見た被写体の中間画像を生成する、ことを特徴とする。
【0015】
また、上述した課題を解決するために、本発明は、被写体を複数の撮影手段による視点位置から撮影した元画像に基づいて、所望の基準視点から被写体を見た画像を生成する画像生成装置であって、前記元画像中から、被写体のうち特に重要と定められた重要部位が撮影されている領域を検出する重要部位検出手段と、前記重要部位検出手段により検出された重要部位が撮影されている検出領域と前記複数の撮影手段の幾何的な条件とから、被写体の存在する空間中で重要部位が存在する空間中重要部位領域を推定する重要部位位置推定手段と、前記重要部位位置推定手段により推定された空間中重要部位領域が空間中で被写体が存在する被写体存在領域であると想定し、前記元画像の色または輝度情報に基づいて、前記被写体存在領域中の小領域毎の色または輝度を決定して基準視点から見た写像を得ることで、前記基準視点から見た被写体の中間画像を生成する中間画像生成手段と、前記中間画像生成手段により生成された中間画像中において重要部位が存在する重要部位領域を特定し、当該重要部位領域を切り出し画像として切り出す重要部位切り出し手段と、前記複数の撮影手段により撮影された元画像のうちの1つをベース画像として選択するベース画像選択手段と、前記ベース画像選択手段により選択されたベース画像のうち、重要部位が存在する領域に、前記重要部位切り出し手段により切り出した切り出し画像を合成して最終的な生成画像を生成する合成手段とを含むことを特徴とする画像生成装置である。
【0016】
本発明は、上記の発明において、前記ベース画像選択手段は、前記複数の撮影手段により撮影された元画像のうちの1つをベース画像として選択し、当該選択したベース画像に前記基準視点から見た射影変換を施し、当該射影変換後の画像を前記ベース画像として用いることを特徴とする。
【0017】
本発明は、上記の発明において、前記中間画像生成手段は、前記被写体存在領域にまたがって配列された多層の投影面を決定する投影面決定手段と、前記投影面決定手段により決定された多層投影面中の各画素の色または輝度、及び存在確率を推定する色/輝度情報推定手段と、前記基準視点を通る直線と前記多層投影面との交点の色を、前記色/輝度情報推定手段により推定された存在確率に応じた重みを付けて加算することで前記基準視点から見た被写体の中間画像を生成する中間画像レンダリング手段とからなることを特徴とする。
【0018】
本発明は、上記の発明において、前記複数の撮影手段は、前記表示手段の表示面の外側に配置されており、前記複数の撮影手段により元画像を撮影し、同一の装置もしくは同様の構成の他の装置における表示手段に、前記基準視点から画像を表示することを特徴とする。
【0019】
本発明は、上記の発明において、前記複数の撮影手段は、前記表示手段の表示面の外側に配置された1つ以上の外側撮影手段と、前記表示手段の内側に配置された少なくとも1つの内側撮影手段とを備え、前記中間画像生成手段は、前記外側撮影手段により撮影された元画像から、前記基準視点からの中間画像を生成し、前記ベース画像選択手段は、前記内側撮影手段により撮影された元画像をベース画像として選択し、前記合成手段は、前記中間画像生成手段により生成された中間画像と前記ベース画像選択手段により選択されたベース画像とを合成する、ことを特徴とする。
【0020】
本発明は、上記の発明において、前記複数の撮影手段は、前記表示手段の表示面の外側に配置された1つ以上の外側撮影手段と、前記表示手段の背面に配置された少なくとも1つの背面撮影手段とを備え、前記中間画像生成手段は、前記外側撮影手段により撮影された元画像から、前記基準視点からの中間画像を生成し、前記ベース画像選択手段は、前記背面撮影手段により撮影された元画像をベース画像として選択し、前記合成手段は、前記中間画像生成手段により生成された中間画像と前記ベース画像選択手段により選択されたベース画像とを合成する、ことを特徴とする。
【0021】
また、上述した課題を解決するために、本発明は、被写体を複数の視点位置から撮影した元画像に基づいて、所望の基準視点から被写体を見た画像を生成する画像生成装置のコンピュータに、前記元画像中から、被写体のうち特に重要と定められた重要部位が撮影されている領域を検出する重要部位検出機能、前記重要部位が撮影されている検出領域と前記複数の撮影手段の幾何的な条件とから、被写体の存在する空間中で重要部位が存在する空間中重要部位領域を推定する重要部位位置推定機能、前記空間中重要部位領域が空間中で被写体が存在する被写体存在領域であると想定し、前記元画像の色または輝度情報に基づいて、前記被写体存在領域中の小領域毎の色または輝度を決定して基準視点から見た写像を得ることで、前記基準視点から見た被写体の中間画像を生成する基準視点画像生成機能、前記中間画像中において重要部位が存在する重要部位領域を特定し、当該重要部位領域を切り出し画像として切り出す重要部位切り出し機能、前記複数の撮影手段により撮影された元画像のうちの1つをベース画像として選択するベース画像選択機能、前記ベース画像のうち、重要部位が存在する領域に、前記切り出し画像を合成して最終的な生成画像を生成する合成機能、を実行させることを特徴とするプログラムである。
【発明の効果】
【0022】
この発明によれば、複数の異なる視点位置から被写体を撮影した画像を元に、所望の視点位置にて被写体を撮影したのと同等の画像を生成する場合に、被写体の存在する場所が未知であっても、計算機リソースを節約しつつ、被写体以外の場所の見栄えを悪くすることなく、適切に画像を生成することができる。
【図面の簡単な説明】
【0023】
【図1】本発明の第1実施形態による画像生成方法での被写体とカメラとの位置関係を示す概念図である。
【図2】本第1実施形態による画像生成方法の動作を説明するためのフローチャートである。
【図3】本第1実施形態において、カメラ毎の重要部位とそれを投影面に投影し、論理積をとった様子を示す概念図である。
【図4】本第1実施形態において、重要部位の位置の推定例を示す概念図である。
【図5】本第1実施形態において、色のブレンディングに用いる角度情報の一例を示す概念図である。
【図6】本第2実施形態による画像生成方法の動作を説明するためのフローチャートである。
【図7】本第3実施形態による代表的な画像生成装置の構成を示す機能ブロック図である。
【図8】本第4実施形態による、カメラの配置例を示す模式図である。
【図9】本第5実施形態による、カメラの配置例を示す模式図である。
【図10】本第6実施形態による、カメラの配置例を示す模式図である。
【発明を実施するための形態】
【0024】
以下、本発明の一実施形態を、図面を参照して説明する。
【0025】
本発明は、画像から被写体の中の重要部位をあらかじめ検出し、重要部位が存在する3次元領域のみ、指定された任意の視点からの画像を作成し、この作成した画像を、あらかじめ準備したベース画像(あるいは、撮影した画像の中の1つ)の中で重要部位が映り込む位置に嵌め込むことにより、重要部分については、指定した視点で画像を生成するため、指定した任意の視点で忠実に描画が可能になり、また、重要部分以外は、画像生成を行わないため、計算量を抑えることができるとともに、合成による多重像や画像劣化を防止できるという特徴がある。以下、詳細に説明する。
【0026】
A.第1実施形態
図1は、本発明の第1実施形態による画像生成方法での被写体とカメラとの位置関係を示す概念図である。ここで、カメラの集合を{C|i∈N}、カメラCにより撮影された元画像をI(m)とおく(mは行列)。m≡[u,v]は、画像座標系であり、画像の画素の位置を表している。また、以下では、次式(1)のように、チルダ記号(〜)を付けた場合には、拡張ベクトルを示すものとする。
【0027】
【数1】

【0028】
また、コンピュータビジョンの分野でよく用いられるように、焦点距離や画像中心、画素サイズなどのカメラ固有の情報を含む3×3の行列(内部行列)をAとおき、世界座標系からカメラのローカル座標系への回転行列、及び並進ベクトルをRi←W,ti←Wとおく。
【0029】
したがって、世界座標系の3次元の点からカメラの画像座標上の2次元の点への射影変換は、次式(2)で示す行列の式で表すことができる。
【0030】
【数2】

【0031】
ここで、本発明における目的は、複数のカメラ映像{I(m)|i∈N}に基づいて、図1に示す基準視点Vから見た画像I(m)を推定して生成することである。また、ここでは、各カメラの内部行列、及び外部行列は、何らかのキャリブレーション手段により求められているものとする。キャリブレーション方法の代表的なものとしては、例えば、「Tsaiの方法」や「Zhangの方法」を用いることができる。
【0032】
図2は、本第1実施形態による画像生成方法の動作を説明するためのフローチャートである。まず、複数の視点位置から被写体を撮影した画像(元画像:複数)を得る(ステップS1)。次に、元画像中から、被写体のうち、特に重要と定められた部位(重要部位)を検出する(ステップS2)。
【0033】
その方法としては、テンプレートマッチングやパターンマッチングと呼ばれるように、重要部位の濃淡パターンと照合する方法、また、重要部位が特定の色分布を持つ場合に色で判断する方法、あらかじめ重要部位を含まない画像を背景として撮影しておき、重要部位を含んだ画像との差分をとる方法などがある。
【0034】
また、元画像を撮影するカメラとは別に、例えば、赤外線イメージを撮影可能な装置を用いて、画像中で熱を持つ領域を重要部位として検出することができる。
【0035】
以下、説明のため、元画像I(m)の重要部位が存在する領域をΓ(m)にて表し、Γ(m)=1なる画像座標では、被写体が存在し、Γ(m)=0なる画像座標では、被写体が存在しないものとする。
【0036】
次に、ステップ2の検出領域と撮影時のカメラの幾何的な条件とから、被写体の存在する空間中で重要部位が存在する領域を推定する(ステップS3)。例えば、次のような方法がある。
【0037】
まず、被写体の空間中に投影面を想定し、これをスクリーンと見立てて前後に走査しつつ、元画像中の重要部位Γ(m)を投影していく。元画像の撮影位置を中心として、撮影時と同じ画角で検出領域を投影し、これを基準視点から見ると、射影変換となり、ホモグラフィと呼ばれる行列により対応付けられる。すなわち、カメラCの画像I(m)上の点mから、投影面Lを介して基準カメラCの画像I(m)上の点mへの写像は、次式(3)、(4)により表される。
【0038】
【数3】

【0039】
【数4】

【0040】
但し、基準カメラCの座標系において、投影面Lの正規ベクトルをn、原点からの距離をdで表している。また、RV←i,tV←iは、カメラCの座標系における点Xを、基準カメラCの座標系における点Xに変換し、X=RV←i+tV←iなる関係がある。
【0041】
投影面LにΓ(m)を投影し、基準視点から見たものを次式(5)とおくと、次式(6)で表される、全てのカメラによる論理積が「1」となるmを持つとき、その投影面上に重要部位が存在する可能性がある。
【0042】
【数5】

【0043】
【数6】

【0044】
投影面を手前から奥に(あるいは、その逆に奥から手前に)走査していき、そのような投影面群{L}の範囲が、重要部位が存在する領域として推定できる。ここで、多層の投影面Lの走査間隔は、基準視点から見たときに、各カメラから投影された点が1画素以内で移動する間隔にすることが1つの目安となる。
【0045】
図3は、本第1実施形態において、カメラ毎の重要部位とそれを投影面に投影し、論理積をとった様子を示す概念図である。上記の例では、投影面の決定のために、元画像中の被写体の領域を投影面に射影変換する手法を用いたが、画像の射影変換処理は、計算機の負荷が高い。また、投影面を走査する区間は、あらかじめ設定する必要があり、それ以外の区間にある被写体は、検出できない。
【0046】
そこで、カメラの視点と検出された重要部位の中心点とを通る直線の交点として、重要部位の位置を求め、その点を含む投影面を設定する方法を示す。
【0047】
図4は、本第1実施形態において、重要部位の位置の推定例を示す概念図である。図4に示すように、世界座標上における重要部位のある点Pが、複数のカメラ{C|i∈N}により画像座標上で、次式(7)で表される位置Qに写像されたとする。
【0048】
【数7】

【0049】
点Pが未知で、数式(7)が既知のとき、カメラ中心と像を結ぶ直線Cの集合{l|i∈N}の交点として点Pの位置を求めることができる。
【0050】
しかし、実際の状況においては、撮影時の雑音や量子化誤差、パラメータの推定誤差を含むため、一般に{l|i∈N}は、1点で交わることがない。そこで、直線lとの距離の2乗和が最小となる点として、P:X=[X,Y,Zを求めることにする。
【0051】
カメラCiにおける投影の数は、数式(2)の通り、次式(8)と表される。
【0052】
【数8】

【0053】
世界座標系で表される点X=[X,Y,ZがカメラCにより撮影され、画像座標系の斉次座標で、数式(9)で表される位置に写像される。
【0054】
【数9】

【0055】
逆に、画像上の点、チルダ(〜)mが与えられたとき、数式(8)をX=[X,Y,Zについて解くと、次式(10)で表される。
【0056】
【数10】

【0057】
これが、すなわち、直線liの式である。このとき、−Ri←W−1i←Wは、世界座標系におけるカメラCの投影中心であり、直線は、必ず、この点を通る。また、Ri←W−1−1[u,v,1]は、直線の向きを表すベクトルであり、sは、媒介変数である。
【0058】
以下,表現の簡略化のため数式(10)を、次式(11)とおく。
【0059】
【数11】

【0060】
sは媒介変数であり、X=[X,Y,Z],a=[a,b,c,X=[X,Y,Zである。このとき、点Pと直線lとの距離を、Dとおくと、次式(12)となる。
【0061】
【数12】

【0062】
以下、評価関数を点Pと各直線lとの距離の2乗和として、次式(13)とおき、これが最小となる点としてPを求める。
【0063】
【数13】

【0064】
Jが最小となるのは、次式(14)となるときである。
【0065】
【数14】

【0066】
まず、XPによる偏微分を計算すると、次式(15)となる。
【0067】
【数15】

【0068】
ここで、次式(16)、また、次式(17)より、数式(18)となる。
【0069】
【数16】

【0070】
【数17】

【0071】
【数18】

【0072】
そこで、数式(16)、(18)に、数式(15)を代入し、数式(19)を得る。
【0073】
【数19】

【0074】
同様にして、Y,Zの偏微分についても計算すると、次式(20)、(21)のようになる。
【0075】
【数20】

【0076】
【数21】

【0077】
数式(19)、(20)、(21)を代入すると、数式(14)は、X=[X,Y,Zの1次形式で表すことができ、数式(22)となる。
【0078】
【数22】

【0079】
これをXについて解くことにより、点Pの座標を求めることができる。この点Pが重要部位の中心的な位置となる。こうして、重要部位の中心的な位置を求めた後、その点を含むように投影面を設定することができる。そして、基準視点から見た画像を生成する(ステップS4)。その際、ステップ3で推定した被写体の重要部位のおよその位置を用いる。その方法としては、例えば、以下のような方法がある。
【0080】
<単一投影面による方法>
1つの投影面を仮定して、カメラで撮影した画像を投影し、それらを混色することで基準視点から見た画像を生成する方法である。
【0081】
投影面の決定方法として、次式(23)となる面積が最大となる投影面Lを採用することができる。
【0082】
【数23】

【0083】
また、数式(22)により求めた、およその位置を通る投影面とすることができる。このように決定した投影面に対し、全ての元画像を投影し、基準視点から見た、次式(24)で表される画像を、次式(25)のように求める。
【0084】
【数24】

【0085】
【数25】

【0086】
これを混色して、次式(26)ように基準視点から見た画像を得る。
【数26】

【0087】
次式(27)で表される、混色の重み関数は、単純に{C|i∈N}の数Num(N)により平均をとり、数式(28)で表す定数に設定してもよいし、カメラの視点と着目する点と基準視点とによりなす角度に依存して決定することもできる。
【0088】
【数27】

【0089】
【数28】

【0090】
ここで、図5は、本第1実施形態において、色のブレンディングに用いる角度情報の一例を示す概念図である。例えば、図5に示すように基準視点V、基準視点の画像座標mにおける投影面Lの点、カメラCの視点のなす角を、次式(29)とおいて、次式(30)のようにすることができる。
【0091】
【数29】

【0092】
【数30】

【0093】
ここで、normは、次式(31)のような正規化演算を行うものとする。
【0094】
【数31】

【0095】
<デプスマップによる方法>
また、平板な投影面を用いる代わりに、被写体の形状を推定し、その形状に応じた凹凸のある面を、CGで用いられるポリゴンで描画することにより、基準視点から見た画像を生成する方法を用いることができる。このような被写体形状を反映した凹凸面を推定する方法は、いくつかあるが、例えば、画像間の相関を利用し、三角測量の原理により、距離を求めるステレオマッチングと呼ばれる方法がある。
【0096】
そのうち、Plane Sweep と呼ばれる方法を例にとると、投影面を奥行き方向に走査しつつ、そこに複数のカメラからの画像を写像し、投影面上の各画素で画像間の色、もしくは輝度の相関をとる。
【0097】
すなわち、基準視点の画像面に平行で距離dにある投影面へのカメラCの画像I(m)の写像を数式(25)により求めると、次式(32)、(33)により画像の分散値V(m)を求めることができる。そして、mの画素毎に、この分散値が最小となる位置として、被写体表面の奥行き情報を求めることができる。
【0098】
【数32】

【0099】
【数33】

【0100】
色については、1枚の平坦な投影面を用いた場合と同様、着目する画素の奥行きに相当する各カメラの画像の画素の色を混色することで決定することができる。
【0101】
<多層投影面による方法>
また、別の方法として、多層の投影面を仮定し、多層投影面中の各画素の色または輝度、及び存在確率を推定し、基準視点を通る直線と多層投影面の交点との色を、存在確率に応じた重みを付けて加算することで基準視点から見た画像を得る方法もある。多層投影面の範囲は、重要部位が存在する範囲に設定する。
【0102】
例えば、既に述べた通り、数式(6)が数式(34)となるmを持つ投影面群{L}の範囲が、重要部位が存在する領域として推定できる。
【0103】
【数34】

【0104】
また、重要部位の大きさが想定できる場合には、数式(22)により、重要部位の中心を求めておき、その前後に投影面を設定することができる。このようにして、多層の投影面{L|j∈M}を決定したのち、投影面上での被写体の存在確率を求める。
【0105】
存在確率の推定方法として、例えば、数式(33)の分散値を元に、次式(35)のように求めることができる。但し、normは正規化を示す。
【0106】
【数35】

【0107】
このような数式(35)で示す存在確率と、数式(25)、(30)の基準視点から見た画像、混色の重み関数を用いて、次式(36)のように、基準視点から見た中間画像を得ることができる。
【0108】
【数36】

【0109】
図2の説明を戻すと、次に、中間画像中において重要部位が存在する領域を特定し、その領域を切り出した画像(切り出し画像)を得る(ステップS5)。領域の特定方法としては、元画像中で重要部位が存在する領域を投影面に射影し、その論理積をとった、数式(37)を用いる方法がある。また,論理積以外にも論理和をとるなど,特定の演算に限定されるものではない。
【0110】
【数37】

【0111】
また、新たに中間画像中からパターンマッチングにより重要部位を検出してもよい。
次に、元画像のうちの1つをベース画像として選択する(ステップS6)。利用者により選択されてもよいし、あらかじめ設計者により設定されていてもよい。
【0112】
そして、ベース画像のうち、重要部位が存在する領域に切り出し画像を合成する(ステップS7)。ベース画像中の重要部位は、ステップ5で選択されている。ここに切り出し画像を合成する。その際、切り出し画像とベース画像との境界を目立たなくするために、サイズの調整や変形を行ってもよいし、境界付近の色をブレンドしてもよい。
【0113】
B.第2実施形態
次に、本発明の第2実施形態について説明する。
図6は、本第2実施形態による画像生成方法の動作を説明するためのフローチャートである。なお、図2に対応する部分には同一の符号を付けて説明を省略する。図2との違いは、ステップ6が、元画像のうちの1つをベース画像として選択するサブステップS6aと、選択したベース画像に基準位置から見た射影変換を施すサブステップS6bとから構成される点にある。射影変換に用いる投影面は、被写体の重要領域がある付近に設定するのがよい。
【0114】
このような投影面の位置の求め方として、例えば、数式(6)で全てのカメラによる論理積が「1」となる面積が最大となる投影面を用いることができる。もしくは、数式(22)で求められる光線の交点を通る投影面を用いることができる。
【0115】
C.第3実施形態
次に、本発明の第3実施形態について説明する。
図7は、本第3実施形態による代表的な画像生成装置の構成を示す機能ブロック図である。図7において、視点位置入力手段1は、視点位置を入力する。被写体撮影手段2は、複数の視点位置から被写体を撮影する。基準視点決定手段3は、基準視点を決定する。被写体画像(元画像)取得手段4は、撮影された被写体から、画像(元画像:複数)を取得する。
【0116】
元画像中重要部位検出手段5は、元画像中から、被写体のうち、特に重要と定められた部位(重要部位)を検出する。3次元空間中重要部位検出手段6は、検出された重要部位と撮影時のカメラの幾何的な条件(基準視点)とから、被写体の存在する3次元空間中で重要部位が存在する領域を推定する。
【0117】
中間画像生成手段7は、投影面決定手段8、テクスチャ配列確保手段9、色/輝度情報決定手段10及び中間画像レンダリング手段11からなる。投影面決定手段8は、元画像中で重要部位が存在する領域を射影する投影面を決定する。テクスチャ配列確保手段9は、投影面へのテクスチャマッピングを行うためのテクスチャ配列を確保する。色/輝度情報決定手段10は、元画像の色または輝度情報に基づいて、被写体の存在する3次元空間中で重要部位が存在する領域の色、もしくは輝度を決定する。
【0118】
中間画像レンダリング手段11は、中間画像に対して、決定された色または輝度によりレンダリングする。画像切り出し手段12は、中間画像中において重要部位が存在する領域を特定し、その領域を切り出した画像(切り出し画像)を取得する。
【0119】
ベース画像選択手段13は、元画像のうちの1つをベース画像として選択する。画像合成手段14は、ベース画像のうち、重要部位が存在する領域に切り出し画像を合成する。生成画像出力手段15は、合成した画像を生成画像として出力する。画像表示手段16は、最終的に出力される生成画像を表示する。
【0120】
なお、本第3実施形態では、中間画像の生成方法として、投影面へのテクスチャマッピングを用いる方法を示しているが、本発明はその限りではない。
【0121】
D.第4実施形態
次に、本発明の第4実施形態について説明する。
図8は、本第4実施形態による、カメラの配置例を示す模式図である。図8に示すように、本発明の画像生成装置がネットワーク22を介して接続されている。本第4実施形態では、図示するように、ディスプレイ20の周囲に複数のカメラ21a〜21dを配置し、ディスプレイ23の周囲に複数のカメラ24a〜24dを配置している。同一装置のディスプレイ20a、20bに、本発明の方法により画像生成した人物像の鏡像を映すことで、電子的な鏡を実現することができる。このようにして実現した鏡は、視点の移動が可能であるため、例えば、横顔や上向き、下向きの顔など、様々な方向から利用者自身の姿を観察することが可能となる。また、通信経路を介した2つ以上の同種の端末を使用し、遠隔地の利用者同士を正面から観た映像を交換することで、視線一致が可能なテレビ電話を実現することができる。
【0122】
E.第5実施形態
次に、本発明の第5実施形態について説明する。
図9は、本第5実施形態による、カメラの配置例を示す模式図である。本第5実施形態では、図示するように、ディスプレイ30の外周、及び内部に複数のカメラ31a〜31gを配置している。外周のカメラ31a〜31dは、高品位な映像を取得可能な大型のカメラであり、内部のカメラ32a〜32cは、映像品質は低いが小型である。このように、ディスプレイ30内部に配置したカメラ32a〜32cを小型にすることで、表示面を大きく遮蔽しない。また、表示面の内部にあるため、観察者の比較的正面から映像を撮影できる。
【0123】
一方で、外周のカメラ31a〜31dは、大きさを気にすることなく、高品位なものを使うことで、解像度の高い映像を取得することが可能である。ゆえに、周囲の高品位なカメラ31a〜31dで顔の表情を合成し、比較的正面から撮影した小型のカメラ32a〜32cの映像に合成し、表情などの重要な部位の品質を補いつつ、正面から見た映像を生成することができる。
【0124】
ここで、正面から見た映像と記述したが、必ずしも利用者の真正面からでなく、ディスプレイ30の内部、もしくは外部の任意の位置から見た映像が合成できることは言うまでもない。例えば、利用者の頭部の位置を検出することで、その位置を基準視点として用いることができる。頭部位置の検出は、利用者の顔を重要部位として数式(22)の方法で求めることもできるし、超音波や磁気や光を用いた他の位置検出センサを用いることもできる。また、ここでは、一例として、被写体を人物として説明したが、被写体は人物に限定するものでもない。
【0125】
F.第6実施形態
次に、本発明の第6実施形態について説明する。
図10は、本第6実施形態による、カメラの配置例を示す模式図である。本第6実施形態では、図示するように、透過ディスプレイ40の背面、及びその外周に複数のカメラ41、42a〜42dを配置している。透過ディスプレイ40とは、表示面が透過、もしくは半透過なディスプレイであり、ホログラフィックスクリーンに斜め方向から映像を投影したり、また、透明電極を用いた有機発光ディスプレイなどでも実現できる。
【0126】
透過ディスプレイ40の背面にあるカメラ41は、比較的正面から利用者を撮影可能である。しかし、透過ディスプレイ40を介して撮影しているため、その映像は、ボケなどの画像の劣化が生じる。一方、表示面の外周に配置したカメラ42a〜42dは、遮蔽物がないので、高品位な映像を取得可能であるが、撮影できる方向が斜め方向からとなってしまう。
【0127】
そこで、背面から撮影した劣化があるものの、比較的正面のカメラ41からの映像をベース画像として、そこに周囲のカメラ42a〜42dで生成した中間画像を合成することで、表情などの重要な部位の品質を補いつつ、正面から見た映像を生成できる。
【0128】
また、重要でない背景などは、ボケる(劣化する)ために、重要な部位が引き立つという副次的な効果も生じる。
【0129】
ここで、正面から見た映像と記述したが、必ずしも利用者の真正面からでなく、ディスプレイの内部、もしくは外部の任意の位置から見た映像が合成できることは言うまでもない。また、ここでは、一例として、被写体を人物として説明したが、被写体は人物に限定するものでもない。
【0130】
上述した第1から第6実施形態によれば、被写体中の特に重要な部位がある奥行き範囲を限定することで、中間画像では、重要部位を良好に、かつ計算機負荷をかけずに描画することができる。さらに、奥行き範囲にない被写体に関しては、ある1つの元画像をベース画像として用いることにより、そもそも多重像を生じない。その両者を嵌め込み合成をすることで、忠実に描画されている重要部位と、忠実ではないものの多重像や劣化のないその他の部位とを共存させ、1つの画像として得ることができる。
【0131】
また、ベース画像中と中間画像中とで重要部位が存在する場所が一致し、ベース画像と切り出し画像との合成時の位置合わせが容易となり、また、両者のテクスチャ(模様)の連続性が増し、繋ぎ目が目立ち難くすることができる。
【0132】
また、被写体の重要部位が存在する範囲を投影面がカバーされ、重要部位の中間画像が再現できる範囲を広くすることができる。また、投影面上で推定した存在確率に応じた明瞭さで重要部位を描画するため、テクスチャが一様である場合やノイズを含む場合など、推定の困難な場合でも、目立った画像の損傷のない中間画像の生成が可能となり、画質が向上させることができる。
【0133】
また、ディスプレイの表示面の外側に複数のカメラを配置し、当該カメラにより元画像を撮影し、同一の装置、もしくは同様の構成の他の装置における映像ディスプレイに基準視点から画像を表示することで、ディスプレイの内部や背後や手前にカメラを置いて撮影したかのような映像を取得しつつ、ディスプレイを遮蔽することなく、そのような映像を提示することができる。例えば、利用者がディスプレイを見た場合に、周囲のカメラでは、視線の合っていない画像が撮影されるが、これらの画像を用いて、実際にはディスプレイがあるために置けない位置から撮影したかのような視線の合った画像を合成することができる。
【0134】
また、透過スクリーン、もしくはディスプレイの表示面の外側、及び内側にカメラを配置し、外側のカメラを含む元画像により基準視点からの中間画像を生成し、内側のカメラの1つをベース画像として選択し、両者を合成することにより、背景部分は、所望の視点位置からのずれが少なく、重要部位は高精細な、ディスプレイの内部や背後や手前の所望の視点から見たかのような高画質な画像を取得することができる。
【0135】
すなわち、一般に、サイズの大きなカメラほど、受光面積の大きな素子と大口径の明るいレンズとを用いるため、高画質な画像を取得することができるが、サイズが大きいことにより、表示面の手前に置くと、表示面を大きく遮蔽してしまい、表示面の内部にある所望の視点位置からは大きく外れた映像しか取得できない。本発明では、外側に配置するカメラは、表示面を遮蔽することはなく、大型の高品位のものを用いて重要な部位を生成し、内部に配置するカメラを小型のものにして遮蔽を少なくし、かつ所望の視点に近い背景画像を合成することができる。
【0136】
また、透過スクリーン、もしくはディスプレイの表示面の外側、及び背面にカメラを配置し、外側のカメラを含む元画像により基準視点からの画像を生成し、背面のカメラの1つをベース画像として選択し、両者を合成することにより、背景部分は、所望の視点位置からのずれが少なく、重要部位は高精細な、ディスプレイの内部や背後や手前の所望の視点から見たかのような映像を得ることができる。
【0137】
すなわち、透過スクリーン、もしくはディスプレイの背面から撮影した場合、ボケや表示画像の映り込みが生じてしまうが、重要な部位は、周辺に配置したカメラを用いて生成することにより明瞭な画像が描画できる。一方、重要でない部位に関しては、背面に配置したカメラで撮影した画像をベース画像としてそのまま用いることで、画像生成に伴う目障りな多重像や雑音は生じず、自然なボケが生じた画像となるため、全体として違和感のある画像とはならない。
【0138】
なお、上述した第1から第6実施形態において、画像生成方法での各ステップは、その機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより、その機能を実現するようにしてもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものであってもよい。また、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、フラッシュメモリ等の書き込み可能な不揮発性メモリ、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。
【0139】
さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(例えばDRAM(Dynamic Random Access Memory))のように、一定時間プログラムを保持しているものも含むものとする。また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。また、上記プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。
【符号の説明】
【0140】
1 視点位置入力手段
2 被写体撮影手段
3 基準視点決定手段
4 被写体画像(元画像)取得手段
5 元画像中重要部位検出手段
6 3次元空間中重要部位検出手段
7 中間画像生成手段
8 投影面決定手段
9 テクスチャ配列確保手段
10 色/輝度情報決定手段
11 中間画像レンダリング手段
12 画像切り出し手段
13 ベース画像選択手段
14 画像合成手段
15 生成画像出力手段
16 画像表示手段
20、23、30、40 ディスプレイ
21a〜21d、24a〜24d、31a〜31d、32a〜32c、41、42a〜42d、 カメラ

【特許請求の範囲】
【請求項1】
被写体を複数の撮影手段による視点位置から撮影した元画像に基づいて、所望の基準視点から被写体を見た画像を生成する画像生成方法であって、
前記元画像中から、被写体のうち特に重要と定められた重要部位が撮影されている領域を検出する第1のステップと、
前記重要部位が撮影されている検出領域と前記複数の撮影手段の幾何的な条件とから、被写体の存在する空間中で重要部位が存在する空間中重要部位領域を推定する第2のステップと、
前記空間中重要部位領域が空間中で被写体が存在する被写体存在領域であると想定し、前記元画像の色または輝度情報に基づいて、前記被写体存在領域中の小領域毎の色または輝度を決定して基準視点から見た写像を得ることで、前記基準視点から見た被写体の中間画像を生成する第3のステップと、
前記中間画像中において重要部位が存在する重要部位領域を特定し、当該重要部位領域を切り出し画像として切り出す第4のステップと、
前記複数の撮影手段により撮影された元画像のうちの1つをベース画像として選択する第5のステップと、
前記ベース画像のうち、重要部位が存在する領域に、前記切り出し画像を合成して最終的な生成画像を生成する第6のステップと
を含むことを特徴とする画像生成方法。
【請求項2】
前記第5のステップは、
前記複数の撮影手段により撮影された元画像のうちの1つをベース画像として選択する第7のステップと、
前記選択したベース画像に前記基準視点から見た射影変換を施す第8のステップと
を含み、
前記射影変換後の画像を前記ベース画像として用いることを特徴とする請求項1に記載の画像生成方法。
【請求項3】
前記第3のステップは、
前記被写体存在領域にまたがって配列された多層の投影面を仮定し、
当該多層投影面中の各画素の色または輝度、及び存在確率を推定し、
前記基準視点を通る直線と前記多層投影面との交点の色を、前記存在確率に応じた重みを付けて加算することで前記基準視点から見た被写体の中間画像を生成する、
ことを特徴とする請求項1に記載の画像生成方法。
【請求項4】
被写体を複数の撮影手段による視点位置から撮影した元画像に基づいて、所望の基準視点から被写体を見た画像を生成する画像生成装置であって、
前記元画像中から、被写体のうち特に重要と定められた重要部位が撮影されている領域を検出する重要部位検出手段と、
前記重要部位検出手段により検出された重要部位が撮影されている検出領域と前記複数の撮影手段の幾何的な条件とから、被写体の存在する空間中で重要部位が存在する空間中重要部位領域を推定する重要部位位置推定手段と、
前記重要部位位置推定手段により推定された空間中重要部位領域が空間中で被写体が存在する被写体存在領域であると想定し、前記元画像の色または輝度情報に基づいて、前記被写体存在領域中の小領域毎の色または輝度を決定して基準視点から見た写像を得ることで、前記基準視点から見た被写体の中間画像を生成する中間画像生成手段と、
前記中間画像生成手段により生成された中間画像中において重要部位が存在する重要部位領域を特定し、当該重要部位領域を切り出し画像として切り出す重要部位切り出し手段と、
前記複数の撮影手段により撮影された元画像のうちの1つをベース画像として選択するベース画像選択手段と、
前記ベース画像選択手段により選択されたベース画像のうち、重要部位が存在する領域に、前記重要部位切り出し手段により切り出した切り出し画像を合成して最終的な生成画像を生成する合成手段と
を含むことを特徴とする画像生成装置。
【請求項5】
前記ベース画像選択手段は、
前記複数の撮影手段により撮影された元画像のうちの1つをベース画像として選択し、当該選択したベース画像に前記基準視点から見た射影変換を施し、当該射影変換後の画像を前記ベース画像として用いることを特徴とする請求項4に記載の画像生成装置。
【請求項6】
前記中間画像生成手段は、
前記被写体存在領域にまたがって配列された多層の投影面を決定する投影面決定手段と、
前記投影面決定手段により決定された多層投影面中の各画素の色または輝度、及び存在確率を推定する色/輝度情報推定手段と、
前記基準視点を通る直線と前記多層投影面との交点の色を、前記色/輝度情報推定手段により推定された存在確率に応じた重みを付けて加算することで前記基準視点から見た被写体の中間画像を生成する中間画像レンダリング手段と
からなることを特徴とする請求項4に記載の画像生成装置。
【請求項7】
前記複数の撮影手段は、
前記表示手段の表示面の外側に配置されており、
前記複数の撮影手段により元画像を撮影し、同一の装置もしくは同様の構成の他の装置における表示手段に、前記基準視点から画像を表示することを特徴とする請求項4から請求項6のいずれかに記載の画像生成装置。
【請求項8】
前記複数の撮影手段は、
前記表示手段の表示面の外側に配置された1つ以上の外側撮影手段と、
前記表示手段の内側に配置された少なくとも1つの内側撮影手段と
を備え、
前記中間画像生成手段は、
前記外側撮影手段により撮影された元画像から、前記基準視点からの中間画像を生成し、
前記ベース画像選択手段は、
前記内側撮影手段により撮影された元画像をベース画像として選択し、
前記合成手段は、
前記中間画像生成手段により生成された中間画像と前記ベース画像選択手段により選択されたベース画像とを合成する、
ことを特徴とする請求項4から請求項6のいずれかに記載の画像生成装置。
【請求項9】
前記複数の撮影手段は、
前記表示手段の表示面の外側に配置された1つ以上の外側撮影手段と、
前記表示手段の背面に配置された少なくとも1つの背面撮影手段と
を備え、
前記中間画像生成手段は、
前記外側撮影手段により撮影された元画像から、前記基準視点からの中間画像を生成し、
前記ベース画像選択手段は、
前記背面撮影手段により撮影された元画像をベース画像として選択し、
前記合成手段は、
前記中間画像生成手段により生成された中間画像と前記ベース画像選択手段により選択されたベース画像とを合成する、
ことを特徴とする請求項4から請求項6のいずれかに記載の画像生成装置。
【請求項10】
被写体を複数の視点位置から撮影した元画像に基づいて、所望の基準視点から被写体を見た画像を生成する画像生成装置のコンピュータに、
前記元画像中から、被写体のうち特に重要と定められた重要部位が撮影されている領域を検出する重要部位検出機能、
前記重要部位が撮影されている検出領域と前記複数の撮影手段の幾何的な条件とから、被写体の存在する空間中で重要部位が存在する空間中重要部位領域を推定する重要部位位置推定機能、
前記空間中重要部位領域が空間中で被写体が存在する被写体存在領域であると想定し、前記元画像の色または輝度情報に基づいて、前記被写体存在領域中の小領域毎の色または輝度を決定して基準視点から見た写像を得ることで、前記基準視点から見た被写体の中間画像を生成する基準視点画像生成機能、
前記中間画像中において重要部位が存在する重要部位領域を特定し、当該重要部位領域を切り出し画像として切り出す重要部位切り出し機能、
前記複数の撮影手段により撮影された元画像のうちの1つをベース画像として選択するベース画像選択機能、
前記ベース画像のうち、重要部位が存在する領域に、前記切り出し画像を合成して最終的な生成画像を生成する合成機能、
を実行させることを特徴とするプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate


【公開番号】特開2011−165081(P2011−165081A)
【公開日】平成23年8月25日(2011.8.25)
【国際特許分類】
【出願番号】特願2010−29386(P2010−29386)
【出願日】平成22年2月12日(2010.2.12)
【出願人】(000004226)日本電信電話株式会社 (13,992)
【Fターム(参考)】