説明

視差画像生成装置、及びその方法

【課題】 複数の手法によって求められた画面内の奥行き分布による立体感を保持しつつ、オブジェクトの凹凸を表現する視差画像の生成
【解決手段】 第1画像を用いて相互に視差のある少なくとも1枚の視差画像を生成する視差画像生成装置において、複数の方法に基づいて、前記方法毎に3次元空間における再現範囲における前記第1画像内の奥行きの分布を示す分布情報を推定する第1推定部と、複数の前記分布情報を合成して第1奥行き情報を求める第1合成部と、を有する第1算出部と、前記第1画像内のオブジェクト毎の相対的な凹凸を示す第2奥行き情報を求める第2算出部と、前記第1奥行き情報と、前記第2奥行き情報とを前記第1合成部とは異なる方法で統合して第3奥行き情報を求める第3合成部と、前記第3奥行き情報と、前記第1画像とに基づいて、前記視差画像を生成する生成部と、を備えることを特徴とする視差画像生成装置。

【発明の詳細な説明】
【技術分野】
【0001】
本開示は、視差画像生成装置、及びその方法に関する。
【背景技術】
【0002】
2次元画像(静止画像、動画像を含む)を元に画面内の奥行き情報を推定し、推定された奥行き情報に従って視差画像を生成する技術がある。
【0003】
画像の高域成分に応じて複数の画面全体の奥行きを表したモデルをブレンドし、ブレンドされた奥行きモデルに画像の色信号の1つである赤信号を加算して最終的な奥行きを求める方法が開示されている(例えば、特許文献1)。また、3つの方法で画面全体の奥行きを推定し、推定された3つの奥行きを重み付き平均して最終的な奥行きを求める方法が開示されている(例えば、非特許文献1)。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2005-151534号
【非特許文献】
【0005】
【非特許文献1】C.-C. Cheng, C.-T. Li, Y.-M. Tsai and L.-G. Chen, "A Quality-Scalable Depth-Aware Video Processing System", SID2009
【発明の概要】
【発明が解決しようとする課題】
【0006】
複数の手法によって求められた画面内の奥行き分布による立体感を保持しつつ、オブジェクトの凹凸を表現する視差画像の生成を目的とする。
【課題を解決するための手段】
【0007】
上記課題を解決するために本発明の一態様に係る視差画像生成装置は、第1画像を用いて相互に視差のある少なくとも1枚の視差画像を生成する視差画像生成装置において、複数の方法に基づいて、前記方法毎に3次元空間における再現範囲における前記第1画像内の奥行きの分布を示す分布情報を推定する第1推定部と、複数の前記分布情報を合成して第1奥行き情報を求める第1合成部と、を有する第1算出部と、前記第1画像内のオブジェクト毎の相対的な凹凸を示す第2奥行き情報を求める第2算出部と、前記第1奥行き情報と、前記第2奥行き情報とを前記第1合成部とは異なる方法で統合して第3奥行き情報を求める第3合成部と、前記第3奥行き情報と、前記第1画像とに基づいて、前記視差画像を生成する生成部とを備える。


【図面の簡単な説明】
【0008】

【図1】第1の実施形態の視差画像生成装置を示す図。
【図2】第1の実施形態の視差画像生成装置の動作を示す図。
【図3】(a)分布情報の奥行きモデルの例を示す図(b)凹凸情報の奥行きモデルの例を示す図。
【図4】奥行き情報から視差ベクトルを算出する方法を説明する図。
【図5】視差ベクトルから、視差画像を生成する方法を説明する図である。
【図6】奥行き情報の例を示す図。
【図7】第1奥行き情報および第2奥行き情報の例を示す図。
【図8】第3奥行き情報の例を示す図。
【図9】奥行き情報から視差への変換モデルの例を示す図。
【発明を実施するための形態】
【0009】

以下、図面を参照しながら本発明の各実施形態について詳細に説明する。なお、以下の実施形態中では、同一の番号を付した部分については同様の動作を行うものとして、重ねての説明を省略する。
【0010】

(第1の実施形態)
本実施形態は、2次元画像(静止画像、動画像を含む)である第1画像から、相互に視差のある少なくとも1枚の視差画像を生成する装置に関する。なお、以下の実施形態では、視差画像を2枚生成する方法について例示するが、これに限られるものではない。例えば、裸眼で立体視を等の用途の場合には、視点数に対応する数の視差画像を生成しても構わない。
【0011】
図1(a)は、本実施形態の視差画像生成装置を示す図である。視差画像生成装置は、第1奥行き算出部100と、第2奥行き算出部200と、合成部300、生成部400とを備える。
第1奥行き算出部101は、N(N≧2)個以上の推定部101(1)〜101(N)と、合成部103とを備える。
推定部101(1)〜101(N)は、それぞれに異なる方法で、推定部101(1)〜101(N)毎に3次元空間における再現範囲における第1画像内の奥行きの分布を示す分布情報を推定する。
合成部103は、推定部101(1)〜101(N)が推定した複数の分布情報を合成して第1奥行き情報を求める。
第2奥行き算出部200は、第1画像内のオブジェクト領域内での相対的な凹凸を示す第2奥行き情報を求める。オブジェクト領域とは、第1画面内でオブジェクトが存在する領域を示す。
【0012】
分布情報は、画面全体での奥行き再現範囲内での絶対的な奥行きを示すのに対して、凹凸情報はオブジェクト内での相対的な奥行きの関係を示すものである。つまり、分布情報が再現する奥行きの範囲は、再現範囲内であればいずれでもいいのに対し、凹凸情報が再現する奥行きの範囲は再現範囲に比べ狭い範囲となる。
【0013】
合成部300は、第1奥行き情報と、第2奥行き情報とを合成して第3奥行き情報を求める。なお、合成部300は、合成部103とは異なる方法で奥行きを合成する。詳細については後述する。
生成部400は、第3奥行き情報と、第1画像とに基づいて、視差画像を生成する。奥行きから視差画像を生成する手法は既存の如何なる手法であっても構わない。
【0014】
図1(b)は、本実施形態の視差画像生成装置の変形例を示す図である。第2奥行き算出部200が、第2奥行き算出部201は、M(M≧2)個以上の推定部201(1)〜201(M)と、合成部203とを備える点が、図1(a)の例とは異なる。
推定部201(m)は、第1画像内の、対象とするオブジェクトを検出し、検出されたオブジェクト毎に検出されたオブジェクトの種類に応じた凹凸情報を推定する(1≦m≦M)。また、推定部201(1)〜201(M)は共通のオブジェクトをM種類の手法で検出し、検出されたオブジェクトの凹凸情報を同じ方法で推定するものであっても構わない。また、推定部201(1)〜201(M)は共通のオブジェクトを共通の手法で検出し、検出されたオブジェクトの凹凸情報をM種類の手法で推定するものであってもよい。
【0015】
合成部203は、推定部201(1)〜201(M)が推定した複数の凹凸情報を合成する。
【0016】
次に、本実施形態の視差画像生成装置の動作を説明するが、簡便のために図1(b)の例について述べる。
図2は、本実施形態の視差画像生成装置の動作を示す図である。以下の各ステップで生成する視差画像によって再現する3次元空間における奥行きの再現範囲を0≦z≦Zとする。ここでzは奥行き情報を表す。z=0が再現範囲内で最も手前側(奥行きが小さい)を表し、z=Zが再現範囲内で最も奥側(奥行きが大きい)を表す。
【0017】
推定部101(1)〜101(N)は、それぞれに異なる方法で、推定部101(1)〜101(N)毎に3次元空間における再現範囲における第1画像内の奥行きの分布を示す分布情報を推定する(S21(1)〜(N))。なお、S21(n)では推定部101(n)が分布情報を推定する(1≦n≦N)。分布情報を推定する方法としては、あらかじめ定められた奥行きモデルを用意しておき、第1画像に応じてそれらを適宜用いる方法でもよい。
【0018】
図3(a)は、分布情報の奥行きモデルの例を示す図である。x軸、y軸は画像内の位置を示す。また、白でハッチングされた領域は奥行きが奥側であることを示し、黒に近づく程に奥行きが手前側となっていることを示す。また、第1画像と、第1画像とは異なる時間に表示すべき第2の画像との間の動きを検出し、検出された動きに基づいて分布情報を推定する方法でもよい。また、特定の画素値パターンに応じて分布情報を推定する方法でも良い。S21(n)における分布情報の推定手法は、第1画像の画面全体での奥行きの分布情報を推定することが出来るものであればいずれの方法でもよい。ここでn番目(1≦n≦N)のS21(n)によって推定された分布情報における、画素位置(x,y)での奥行きzを以下のように定義する。なお、0≦z(x,y)≦Zである。
合成部103は、推定部101(1)〜101(N)が推定した複数の分布情報を合成して第1奥行き情報を求める(S22)。奥行き合成ステップでは、N個の奥行き情報を合成して、一つの第1奥行き情報を求める。コンピュータグラフィックスでは二つの奥行きを合成する場合には、カメラに近いものを選択して合成する。これは光線追跡の考え方に基づいたもので、目に入る光は最終的に遮蔽されなかったものである、という原理に基づいている。ここでも同様に手前側の奥行きを選択して合成する。奥行きの値が小さい程、手前側を表すため、次式のように最小値を選択することにより第1奥行き情報を求める。
zc(x,y)=min{z(x,y),・・・,z(x,y)}
ここでzc(x,y)は画素位置(x,y)における第1奥行き情報である。また、min{a,b,c…}、{a,b,c…}の中から最小値を選択する操作を意味する。また光線追跡的には好ましくはないが、N個の奥行き情報の平均によって、第1奥行き情報を求めても良い。
【0019】
推定部201(1)〜(M)は、第1画像内の、対象とするオブジェクトを検出し、検出されたオブジェクト毎に検出されたオブジェクトの種類に応じた凹凸情報を推定する(S23(1)〜S23(M))。なお、S23(m)では推定部201(m)が凹凸情報を推定する(1≦m≦M)。推定部201は、第1画像内で検出対象のオブジェクトを検出する。検出されたオブジェクトの種類に応じてあらかじめ定めてあった相対的な凹凸モデルをオブジェクト領域内に割り当てることで第2奥行き情報を算出する。なお、本実施形態では第1画像中に存在する顔の位置と大きさを検出し、検出された位置にあらかじめ定めておいた相対的な奥行きモデルを割り当てる手法について例示する。こうすることによって、オブジェクトの領域に適切な凹凸を設定することができる。
【0020】
図3(b)は、顔及び胴のモデルの例を示す図である。x軸、y軸は画像内の位置を示す。また、白でハッチングされた領域は奥行きが奥側であることを示し、黒に近づく程に奥行きが手前側となっていることを示す。また顔だけでなく、のオブジェクトを検出してそれらに応じた奥行きモデルを割り当ててもよい。なお、検出するオブジェクトは顔によらず、例えば人物、動物、車等であっても構わない。本実施形態では、顔以外に車を検出する例について述べる。
【0021】
ここでS23(m)によって推定された画素位置(x,y)における凹凸情報を以下のように定義する。−Z≦r(x,y)≦Zここでr(x,y)=0が相対的な凹凸がない状態であり、−Zがオブジェクト領域内で相対的に手前側に凸な状態、Zが相対的に奥側に凹な状態とする。ここでZは検出されたオブジェクトの大きさに基づいて決定することができる。例えば大きなオブジェクトほど相対的な奥行きも大きく見えるため、Zを大きくし、小さなオブジェクトはZを小さくするなどである。またオブジェクトの位置における第1奥行き情報に基づいてZを決定しても良い。第1奥行き情報が手前を示している場合にはZを大きくし、第1奥行き情報が奥のものはZを小さくする。
【0022】
合成部203は、推定部201(1)〜201(M)が推定した複数の凹凸情報を合成して第2奥行き情報を求める(S24)。コンピュータグラフィックスでは二つの奥行きを合成する場合には、カメラに近いものを選択して合成する。これは光線追跡の考え方に基づいたもので、目に入る光は最終的に遮蔽されなかったものである、という原理に基づいている。S24でも、S22と同様に手前側の奥行きを選択して合成する。奥行き情報は小さい値が手前側を表すため、以下のように最小値を選択することにより達成できる。rc(x,y)=min{r(x,y),・・・,r(x,y)}ここでrc(x,y)は画素位置(x,y)における第2奥行き情報である。また光線追跡的には正しくはないが、M個の凹凸情報の平均を用いても良い。
【0023】
また第1奥行き情報に基づいて凹凸情報の合成をしても良い。凹凸情報を与えているそれぞれのオブジェクトの重心位置における第1奥行き情報を重心奥行き情報とすると、オブジェクト間(例えば、人と車等)で重なり合いが発生している領域において、重心奥行き情報が最も手前になる凹凸情報を選択するようにしても良い。
【0024】
合成部300は、第1奥行き情報と、第2奥行き情報とを合成して第3奥行き情報を求める(S24)。なお、合成部300は、合成部103及び合成部203とは異なる方法で奥行きを合成する。
【0025】
第1画像内の奥行きの絶対的な分布を示す第1奥行き情報に、オブジェクト領域内での相対的な凹凸を付加して奥行きを表現するために、第1奥行き情報と第2奥行き情報を加算することで第3奥行き情報を求める。
zf(x,y)=zc(x,y)+rc(x,y)
ここでzf(x,y)は画素位置(x,y)における第3奥行き情報である。また加算ではなく乗算でも構わない。zf(x,y)=zc(x,y)・rc(x,y)
第1奥行き情報と第2奥行き情報を合成したことにより再現したい3次元空間における奥行きの再現範囲0≦z≦Zを逸脱してしまうことがあり得る。そこで再現範囲内に収まるように第3奥行き情報を調節することが好ましい。
生成部400は、第3奥行き情報と、第1画像とに基づいて、視差画像を生成する(S25)。まずは第3奥行き情報から視差ベクトルを算出する。以下、視差画像の生成方法の一例について詳述する。
【0026】
図4は、奥行き情報から視差ベクトルを算出する方法を説明する図である。右目・左目・物体を結ぶ三角形と、画面上での右視差・左視差・物体、二つの三角形の相似性を利用して、視差ベクトルが算出できる。ここでzfは最終的な奥行き情報、d[cm]は視差ベクトルの大きさ、b[cm]は眼間距離、z[cm]は画面までの距離、z[cm]、実空間での奥行きの距離L[cm]を示す。
【0027】
画素サイズから実空間[cm]への変換を以下に従い行う。
【0028】
pixel=(画面解像度[pixel]/画面サイズ[cm])・d[cm]
奥行き情報zfは0〜Zの範囲であり(0〜1でも良い)、0が手前、Zが奥を表しているとする。しかしこの値は、仮想的なものであり実際の距離に換算する必要がある。実空間での距離Lを用いて奥行き情報から実空間の距離へ変換する。奥行きから実空間へは、以下の変換式によって変換する。γ=Lz/zmax[cm]ここでzmax=Zである。すると画面から対象物までの距離z’は以下のようになる。z’=γzf−z
三角形の相似性から以下の関係が成り立つ。
d:b=(z’):(z+z’) ・・・式(1)
d(z+z’)=bz’ ・・・式(2)
z={(b−d)z+dz}/{γ(b−d)} ・・・式(3)
上記奥行き変換モデルは視差ベクトルと反比例の関係にあるモデルだったが、例えば反比例の関係を部分的な比例関係で近似した関数のモデルでも良い。
【0029】
立体視のパラメータb,z,z,Lは、提供したい立体視に基づいて任意に決定できる。例えば、実際の画面の位置に従ってzを決定し、飛び出しを大きくしたい場合にはzを大きくする。また奥行きの深さはLによって決定できる。
立体視のパラメータが決まれば、式(1)〜(3)を変形した以下の奥行き視差ベクトル変換モデルに従って、奥行き情報から視差ベクトルを算出できる。dの単位は[cm]
d:b=(z’):(z+z’)
d=b{z’/(z+z’)}
図5は、算出された視差ベクトルから、視差画像を生成する方法を説明する図である。第1画像は左目・右目の中間の視点から得られたものだとすると、左視差画像と右視差画像は視差ベクトルdに−1/2,1/2を乗じた視差ベクトルd,dから生成できる。
dL=(−1/2)d、 dR=(1/2)d
左視差画像は、第1画像の画素値I(x,y)をdに従って移動させることにより生成できる。右視差画像は、第1画像の画素値I(x,y)をdに従って移動させることにより生成できる。単純に移動しただけでは画素値が割り当てられていない領域(以下、穴と記載)が発生してしまう場合がある。そのため、穴には周辺の画素値を割り当てる等すればよい。ここでは2つ視差画像を生成する例について述べたが、多視差の場合も同様に処理すればよい。
【0030】
次に、本実施形態の視差画像生成装置による、第3奥行き情報について詳細に説明する。
例えば、部屋の中に人が存在する画像が第1画像の場合を考える。その場合、例えば部屋の奥行きをモデルを当てはめる、動きベクトルを求める等して複数の分布情報を推定し、これらを合成し第1奥行き情報を取得する。また、第1画像内の人を検出して顔の凹凸情報(第2奥行き情報)を推定する。推定された第1奥行き情報と第2奥行き情報を合成する必要がある。しかし凹凸情報の再現範囲は、画面全体の奥行きの分布情報よりも大幅に狭い。従って、第1奥行き情報および第2奥行き情報を、第1奥行き情報及び/又は第2奥行き情報を求める際の合成方法と同様の手法で合成してしまうと、画面内の奥行き分布による立体感を保持しつつ、オブジェクトの凹凸を表現することができない。
【0031】
以下の図6〜図8の横軸は、画素位置を示し、縦軸は、奥行き情報を示す
図6は、奥行き情報の例を示す図である。図6(a)に奥行き情報のテストパターンを示す。なお、図6では0が最も奥側、10が最も手前側を示している。上述した奥行き情報とは奥側と手前側の大小関係が逆転している。分布情報1、分布情報2は、それぞれ推定部101(n)が求めた分布情報の例を示す。凹凸情報1、凹凸情報2は、推定部201(m)が求めた凹凸情報の例を示す。
【0032】
図6(b)は、図6(a)のテストパターンの分布情報1、分布情報2、凹凸情報1、凹凸情報2の平均を取ったものと、図6(a)のテストパターンのうち同位置で最大値を選択して合成したものを示す。平均を取った場合には分布情報が示す奥行きのダイナミックレンジが圧縮されてしまい、凹凸情報は全体に埋もれてしまっている。それに対して最大値を取った場合には、部屋全体の奥行きのダイナミックレンジは保持されるが、顔の奥行きは完全に埋もれてしまっている。これは、画面全体での絶対的な奥行きの分布情報と、オブジェクト内での相対的な奥行きの凹凸情報を一緒に合成したことが原因である。「絶対的」は、奥行き再現範囲0≦z≦Zに対して絶対的な奥行きを意味する。「相対的」は、画面内での局所的なオブジェクト領域内での相対的な奥行きを意味する。相対的な奥行き情報の再現範囲は絶対的な奥行き情報の再現範囲とは異なる。そのため絶対的な奥行き情報と相対的な奥行き情報を同じ手法で合成しようとすると、相互の持っている値の意味が異なるために合成が失敗してしまう。
【0033】
図7(a)は、図6(a)に奥行き情報のテストパターンから、分布情報1及び分布情報2を合成した第1奥行き情報を示す図である。図7(b)は、凹凸情報1及び凹凸情報2から合成した第2奥行き情報の例を示す図である。合成方法は、第1奥行き情報および第2奥行き情報共に同位置で奥行きが最も手前側の奥行き情報を選択して合成したものを示す。
【0034】
図8は、図7で示した第1奥行き情報および第2奥行き情報を合成した第3奥行き情報を示す。第3奥行き情報は、第1奥行き情報と第2奥行き情報とを加算して合成した。
第1奥行き情報および第2奥行き情報を求める際の合成方法と、第1奥行き情報と第2奥行き情報を合成する際の合成方法とで異なる方法を用いることで、複数の手法によって求められた画面内の奥行き分布による立体感を保持しつつ、オブジェクトの凹凸を表現する視差画像の生成をすることが出来る。
【0035】

(第2の実施形態)
図9は、本実施形態の視差画像生成装置を示す図である。本実施形態の視差画像生成装置は、図1(b)の視差画像生成装置に対して、奥行き情報を調節する機能を備える点が異なる。
【0036】
調整部102(n)は、推定部101(n)が推定した分布情報を調節する。例えば、推定部101(1)では0≦z≦Zの範囲の分布情報を推定するが、推定部101(2)では100≦z≦Zの範囲の値を出力するといったように、出力される奥行き情報の範囲が異なる場合に、それらを調節して同じ範囲にする必要がある。そのため、調整部102(n)は、例えば奥行き情報の一点(以下、固定点と記載)を固定して(例えばZ)奥行き範囲の幅を広くしたり狭くしたり、といった調節をする。また、ある推定部101(n)信頼性が低い場合には、奥行き範囲を奥側に狭める調節を行い、信頼性の低い奥行き情報の影響を少なくすることもできる。
【0037】
調整部202(m)は、推定部201(m)が推定した第2奥行き情報を調節する。調整の仕方は、調整部102(n)と同様の手法であって良い。奥行き情報調節ステップと同様に調節を行うことができる。なお、固定点を0にすることにより相対的な凹凸情報の特性を有効に活用することができる。


【符号の説明】
【0038】

第1奥行き算出部100、推定部101(n)、調整部102(n)、調整部202(m)、第2奥行き算出部200、統合部300、生成部400

【特許請求の範囲】
【請求項1】
第1画像を用いて相互に視差のある少なくとも1枚の視差画像を生成する視差画像生成装置において、
複数の方法に基づいて、前記方法毎に3次元空間における奥行きの再現範囲における前記第1画像内の奥行きの分布を示す分布情報を推定する第1推定部と、複数の前記分布情報を合成して第1奥行き情報を求める第1合成部と、を有する第1算出部と、
前記第1画像内のオブジェクト毎の相対的な凹凸を示す第2奥行き情報を求める第2算出部と、
前記第1奥行き情報と、前記第2奥行き情報とを前記第1合成部とは異なる方法で統合して第3奥行き情報を求める第3合成部と、
前記第3奥行き情報と、前記第1画像とに基づいて、前記視差画像を生成する生成部と、
を備えることを特徴とする視差画像生成装置。
【請求項2】
前記第1合成部は、複数の前記分布情報のうち、前記第1画像内の同じ位置における奥行きが手前側の方の奥行きを選択することを特徴とする請求項1記載の視差画像生成装置。
【請求項3】
前記第1合成部及び前記第2合成部は、前記第1奥行き情報及び前記第2奥行き情報をそれぞれ合成の前に奥行き情報の調節を行うことを特徴とする請求項2記載の視差画像生成装置。
【請求項4】
前記第3合成部は、前記第1画像内の同じ位置における前記第1奥行き情報が示す奥行きと、前記第2奥行き情報が示す奥行きとを加算して前記第3奥行き情報を求めることを特徴とする請求項2記載の視差画像生成装置。
【請求項5】
前記第3合成部は、前記第1画像内の同じ位置における前記第1奥行き情報が示す奥行きと、前記第2奥行き情報が示す奥行きとを乗算して前記第3奥行き情報を求めることを特徴とする請求項2記載の視差画像生成装置。
【請求項6】
前記第2算出部は、
前記第1画像内の、複数種類のオブジェクトを検出し、検出されたオブジェクト毎に前記種類に応じた凹凸情報を推定する第2推定部と、
複数の前記凹凸情報を合成する第2合成部と、
を備え、
ることを特徴とする請求項1記載の視差画像生成装置。
【請求項7】
前記第1の推定部は、前記第1画像と、前記第1画像とは異なる時間に表示すべき第2の画像との間の動きに応じて、前記分布情報を推定することを特徴とする請求項1記載の視差画像生成装置。

【請求項8】
前記第1の推定部は、前記第1画像の構図の種類を判定し、判定結果に応じて前記分布情報を推定することを特徴とする請求項1記載の視差画像生成装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate


【公開番号】特開2011−215949(P2011−215949A)
【公開日】平成23年10月27日(2011.10.27)
【国際特許分類】
【出願番号】特願2010−84326(P2010−84326)
【出願日】平成22年3月31日(2010.3.31)
【出願人】(000003078)株式会社東芝 (54,554)
【Fターム(参考)】