説明

自由視点映像生成装置

【課題】奥行が連続的に変化している部分の隠蔽領域の画像についても高精度に生成できる自由視点映像生成装置を提供することにある。
【解決手段】従来技術では、背景バッファ1に記録される背景の映像は、背景は平面であることを仮定しているため、背景バッファ1に記録される背景の映像と実際の奥行が連続的に変化している背景の画像2とにはずれが生じた。本発明では、背景バッファに背景の映像のみならずその奥行値も記録するものであり、背景バッファ3に格納された背景の形状を、奥行画像に基づく実際の形状と一致させることにより、背景バッファ3に格納された背景と実際の背景2との間の位置のずれを減少させた。因みに、該背景バッファ3を従来の平面背景バッファに対して、曲面背景バッファと名付ける。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、2次元画像とその奥行画像のみから任意の視点から見た映像を生成する自由視点映像生成装置に関する。
【背景技術】
【0002】
従来、2次元画像とそれに対応する奥行データとから、任意の仮想視点から見た画像を生成する自由視点映像生成装置に関しては、動的に更新される背景バッファを用いる下記の非特許文献1,2に開示されているものがある。
【0003】
これらの文献1,2に開示されている方法は、2次元動画像と対応するフレーム毎の奥行データからフレーム毎に背景を切り出し、その背景をバッファに蓄えていく、つまり動画像であることを利用し、当該フレームだけでなく過去のフレームにある情報を全て使って背景の画像を動的に更新していくものである。
【0004】
これにより、当該フレームでは新視点から見て前景の陰に隠れている背景部(隠蔽領域)であっても、その動的更新背景バッファから画像を持ってくることによって、隠蔽領域のより少ない任意視点映像が生成できることになる。
【非特許文献1】松村篤志,内藤整,川田亮一,小池淳,松本修一“任意視点動画像の高圧縮伝送を目的とした隠蔽領域補完方式の提案”電子情報通信学会技術報告 Vol. OIS2003-41, IE2003-66 Sep.2003. pp.63-68
【非特許文献2】松村篤志,内藤整,川田亮一,小池淳,松本修一“複数枚の背景バッファを用いた自由視点動画像に対する高精度な補完方式”映像情報メディア学会冬季大会 No.8-8, Dec. 2003.
【発明の開示】
【発明が解決しようとする課題】
【0005】
しかしながら、前記の従来技術では、図1(a)に示すように、前記背景バッファ1に記録される背景の映像は、背景は平面であることを仮定している。そのため、背景バッファ1に記録される背景の映像と実際の奥行が連続的に変化している背景の画像2とにはずれが生じ、例えば人物の陰に隠れた地面などの奥行が連続的に変化している部分の隠蔽領域についてはうまく補完することができず、新視点映像にずれが生じてしまうという課題があった。
【0006】
本発明の目的は、前記した従来技術の課題を解消し、奥行が連続的に変化している部分の隠蔽領域の画像についても高精度に生成できる自由視点映像生成装置を提供することにある。
【0007】
また、他の目的は、背景が激しく動いた場合にも正確な奥行値を求めて、任意視点からの画像を高精度に生成できる自由視点映像生成装置を提供することにある。
【課題を解決するための手段】
【0008】
前記の目的を達成するために、本発明は、2次元画像とその奥行画像を用いて、任意の視点から見た画像を生成する自由視点映像生成装置において、背景バッファを具備し、該背景バッファに前記2次元画像の背景画像とその奥行値を記録するようにした点に特徴がある。また、該背景バッファを、曲面単層背景バッファと曲面多層背景バッファとから構成した点に他の特徴がある。
また、前記奥行値を、奥行画像に射影変換して補正するようにした点に他の特徴がある。
【発明の効果】
【0009】
本発明によれば、背景バッファに格納された背景と実際の背景との間の位置のずれを減少または零にさせることができるので、奥行が連続的に変化している部分の隠蔽領域の画像についても高精度に生成できるようになる。
また、背景が激しく動いた場合でも、正確な奥行値を求めることができるようになる。
この結果、任意視点からの映像を高精度に生成することが可能になる。
【発明を実施するための最良の形態】
【0010】
以下に、図面を参照して、本発明を詳細に説明する。まず、本発明の原理を説明する。
本発明では、背景バッファに背景の映像のみならずその奥行値も記録するものであり、図1(b)に示されているように、背景バッファ3に格納された背景の形状を、奥行画像に基づく実際の形状と一致させることにより、背景バッファ3に格納された背景と実際の背景2との間の位置のずれを減少させるものである。なお、以降では、必要に応じて、この背景バッファ3を「曲面背景バッファ3」と呼ぶ。該曲面背景バッファ3は、従来の背景バッファ1が映像のみを記録する「平面背景バッファ」に対するものである。
【0011】
次に、本発明の第1の実施形態を図2を参照して説明する。図2は、本発明の実施形態に係る自由視点画像の隠蔽領域補完方式における処理手順を示すフロー図である。この処理手順の各ステップはハードウエアあるいはソフトウエアで実現できる。
【0012】
図2に示すように、本発明では、まず、参照画像と奥行マップから各フレームの仮の自由視点画像を生成する(S1)。同時に、参照画像と奥行マップから背景領域を抽出する(S2)。この背景領域の抽出では、曲面単層背景バッファおよび曲面多層背景バッファの両者に保存する背景画像とその奥行値とを背景領域として抽出する。
【0013】
ここで、図3は前記参照画像の一例、図4は該参照画像の背景画像の奥行の概念図を示す。該奥行の概念図では、白黒の濃淡で奥行の大きさを示し、濃度が濃いほど奥行値が大きいことを示している。
【0014】
次に、抽出された背景画像とその奥行値とを、曲面単層背景バッファおよび曲面多層背景バッファに保存する。ここに保存される背景画像とその奥行値は、後続のフレームごとに抽出した最新の背景画像とその奥行値で更新される。すなわち、背景画像とその奥行値は曲面単層背景バッファおよび曲面多層背景バッファに動的に生成・更新される(S3)。
【0015】
ここで、図5は従来手法の平面背景バッファの概念図を示し、図6は本発明手法による曲面背景バッファの概念図を示す。図5には、奥行がない背景画像が示されているが、図6には奥行のある背景画像が示されている。
【0016】
このように動的に生成・更新された背景画像とその奥行値を用いることにより、参照画像における前景領域で隠蔽されていた背景領域に対する画素をより完全に補完できる。なお、1フレーム分前の画像から抽出される背景画像とその奥行値あるいは数フレーム前以降の画像から抽出される背景画像とその奥行値により生成、更新される背景画像とその奥行値を用いてもある程度の画素補完は可能である。
【0017】
再度、図2に戻ると、次に、前記S1で生成された仮の自由視点画像を曲面多層背景バッファに保存した背景画像とその奥行値で補完し(S4−1)、続いて、これにより補完されない画素を曲面単層背景バッファに保存した背景画像とその奥行値で補完する(S4−2)。以上の手順により曲面多層背景バッファを用いた補完方法および曲面単層背景バッファを用いた補完方法の各長所を取り入れた広範囲かつ高精度の補完を行うことができる。
【0018】
以下に、上記処理手順の各ステップについて詳細に説明する。
1.仮の自由視点画像の生成(S1)
まず、参照画像Iを撮影した視点から自由視点への回転、および平行移動を3×3の行列R′、および1×3のベクトルt′として定義すると、参照画像Iにおける画素の位置(u,v,1)と自由視点画像Aにおけるその画素に対応する画素(以下、対応点と称す。)の位置(u″,v″、1)との関係は、式(1)によって表される。ここで、DI(u,v)は参照画像Iにおける画素の位置(u,v)の奥行値を表し、(u,v,1)や(u″,v″、1)は3次元上での画素の位置を表す。なお、奥行値の単位は奥行マップの定義に従うものとする。
(DI(u,v)(u,v,1)−t′)×R′(u″,v″,1)=0 (1)
【0019】
式(1)を(u″,v″,1)について解くことにより、参照画像Iと自由視点画像Aとの間の対応点を求めることができる。この対応関係で式(2)により描画を行い、仮の自由視点画像Aを生成する。なお、式(2)において、A(u″,v″)は自由視点画像Aの位置(u″,v″)の画素値を表し、I(u,v)は参照画像Iの位置(u,v)の画素値を表す。
A(u″,v″)=I(u,v) (2)
【0020】
2.背景領域の抽出(S2)
背景領域の抽出は、曲面多層背景バッファおよび単層背景バッファに保存する背景画像を抽出する処理であり、背景画像の生成・更新の前処理として行われる。ここでは、まず、式(3)を用いて参照画像Iの奥行分布の統計をとる。式(3)の右辺は、参照画像Iにおける奥行がnS以上、(n+1)S未満である画素の個数を意味し、Sは統計をとる際のステップ幅を表す。また、nは整数である。
【0021】
【数1】

【0022】
次に、式(3)で求められたV(n)をガウスフィルタで平滑化し、V′(n)を算出する。ここで、V′(n)が極小値をとる際の奥行を分割指標(Sの整数倍数とする。)として定義し、値が小さい順に分割指標min,min,・・・,minを生成する。最後に、式(4)に従って参照画像Iを複数の画像I(m=0,1,・・・,M)に分割する。なお、式(4)において、nullは画素が存在しないことを表す。また、min=−∞、minM+1=∞とする。この複数の画像I(m=1,・・・,M)は、後述する多層背景バッファ内の背景画像の生成・更新のために使用される。
【0023】
【数2】

【0024】
さらに、式(5)で生成される画像Iallを定義する。画像Iallは、曲面単層背景バッファ内の背景画像の生成・更新のために使用される。
【0025】
【数3】

【0026】
3.曲面背景バッファの生成・更新(S3)
ここでは、背景領域の抽出(S2)で抽出された画像I(m=1,・・・,M,all)を曲面背景バッファ(曲面多層背景バッファおよび曲面単層背景バッファ)に保存し、それをフレームごとに更新する。画像I(m=1,・・・,M,all)のそれぞれに背景バッファU(m=1,・・・,M,all)が対応するとする。なお、画像Iは前景画像であるため、それに対応する背景バッファUは存在しない。
【0027】
先頭フレームでは、画像Iを背景バッファUにそのまま保存する。続く他のフレームでは、画像Iと背景バッファUに保存された画像の合成を以下の手順で行う。
【0028】
まず、画像Iと背景バッファUに保存された曲面背景画像から8点以上の対応点を探索し、それらの対応点を用いて式(6)を満たす射影変換行列Bを算出する。ただし、画像I内の座標(uIm ,vIm)と背景バッファUに保存されている画像内の座標(u′Um ,v′Um)は対応点であるとする。
(uIm ,vIm ,1)T×(u′Um ,v′Um ,1)=0 ・・・(6)
【0029】
その後、式(6)によって求められる(uIm ,vIm)と(u′Um ,v′Um)の対応を式(7)に代入することにより、背景バッファU(m=1,・・・,M,all)に保存した曲面背景画像を更新する。
【0030】
【数4】

【0031】
また、画像I内の座標(uIm ,vIm)における奥行値をDIm(uIm ,vIm)とおき、背景バッファU内の座標(u′Um ,v′Um)における奥行値をDUm(u′Um ,v′Um)とおくと、式(6)によって求められる(uIm ,vIm)と(u′Um ,v′Um)の対応を式(8)に代入することにより、背景バッファUにおける奥行値DUm(m=1,・・・,M,all)の値を更新する。
【0032】
【数5】

【0033】
4.出力画像の生成(S4,S5)
仮の自由視点画像Aを背景バッファU(m=1,・・・,M,all)に保存された背景画像およびその奥行値を用いて補完することにより出力画像を生成する。補完は、対応点が存在しない画素に対して行う。
【0034】
まず、曲面多層背景バッファを用いた補完を行うために、m=1,・・・,Mとして、曲面背景画像U内の座標(u′Um ,v′Um)の点に対応する仮の自由視点画像Aの座標(u″,v″)の点式(9)により算出する。
(DUm(u′Um ,v′Um ,1)(u′Um ,v′Um ,1)−t)×R(u ″,v″,1)=0 ・・・(9)
ただし、行列Rは視点の回転移動を定義し、ベクトルtは視点の平行移動を定義する。
【0035】
次に、(9)式によって求められる(u″,v″)と(u′Um ,v′Um)の対応を式(10)に代入することにより、自由視点画像Aに対する補完を行う。
【0036】
【数6】

【0037】
さらに、曲面単層背景バッファを用いた補完を行うために、m=allとして、上記と同様に、対応点を算出し、この対応点を用いて自由視点画像Aに対する補完を行う。なお、曲面単層背景バッファを用いた補完は、A(u″,v″)=nullの画素、すなわち、曲面多層背景バッファを用いた補完では補完されずに残っている画素に対して行われる。以上によって得られる画像を出力画像として出力する。
【0038】
図7(a)、(b)および(c)の各々に、背景画像を補完しなかった場合(従来)、平面背景バッファで補完した場合(従来)および曲面背景バッファで補完した場合(本発明)の任意視点映像の具体例を示す。図7(a)では隠蔽領域が残り、同図(b)では背景画像の一部が下の方にずれているのに対して、同図(c)では該下方向にずれていた背景画像が他部の背景画像とほぼ整合していることが分かる。すなわち、本発明によれば、奥行が連続的に変化している部分の隠蔽領域についても高精度に任意の視点映像を生成することができる。
【0039】
次に、本発明の第2の実施形態を以下に説明する。この実施形態は、例えばカメラの位置が急激に動いた場合、換言すれば背景が激しく動いた場合でも、正確な奥行値を求めることができるようにするものである。
【0040】
この課題を達成するために、本実施形態では、前記第1の実施形態における奥行値を奥行画像に射影変換して補正することにより、正確な奥行値を求めるようにした。
【0041】
具体的には、前記式(7)の後の文「また、画像I内の座標(uIm ,vIm)における奥行値をDIm(uIm ,vIm)とおき、背景バッファU内の座標(u′Um ,v′Um)における奥行値をDUm(u′Um ,v′Um)とおくと、式(6)によって求められる(uIm ,vIm)と(u′Um ,v′Um)の対応を式(8)に代入することにより、背景バッファUにおける奥行値DUm(m=1,・・・,M,all)の値を更新する。」を、次の文に置き換える処理をする。これ以外の処理は第1の実施形態における処理と同じであるので、説明を省略する。
【0042】
すなわち、「また、画像I内の座標(uIm ,vIm)における奥行値をDIm(uIm ,vIm)、背景バッファU内の座標(u′Um ,v′Um)における奥行値をDUm(u′Um ,v′Um)とおき、式(6)によって求められる(uIm ,vIm)と(u′Um ,v′Um)の対応を求め、式(7)’を使って奥行値DIM(uIm ,vIm)を算出する。
IM(uIm ,vIm)(uIm ,vIm ,1)
=BUm(u′Um ,v′Um)(u′Um ,v′Um ,1)・・・(7)’
【0043】
このDIM(uIm ,vIm)を式(8)に代入することにより、背景バッファUにおける奥行値DUm(m=1,・・・,M,all)の値を更新する。」。なお、これ以外の処理は第1の実施形態における処理と同じであるので、説明を省略する。
【0044】
この第2実施形態は、カメラ位置を、図8の左側のカメラ位置から右側のカメラ位置に急激に移動すると、実際の奥行値(背景バッファの奥行値)と奥行き画像の奥行値とが一致しなくなるのを補正して、一致するようにするものである。すなわち、実際の奥行値が奥行き基準面に対する奥行値と等しくなるように、該実際の奥行値を補正する。
【0045】
以上、実施形態を説明したが、本発明は種々の形態で実施できる。例えば、送信側から参照画像と奥行マップを送信し、送信された参照画像と奥行マップを用いて受信側で自由視点画像を生成することができ、本発明は、放送受信機、映像受信機としての携帯端末などに適用できる。
【図面の簡単な説明】
【0046】
【図1】従来の背景バッファと本発明による曲面背景バッファの概念図である。
【図2】本発明の第1の実施形態の自由視点画像の隠蔽領域補完方式の処理手順を示すフロー図である。
【図3】参照画像の一具体例を示す図である。
【図4】図3に対応する奥行画像の概念図である。
【図5】従来手法による背景バッファの一具体例を示す図である。
【図6】本発明手法による曲面背景バッファの一具体例を示す図である。
【図7】背景画像を補完しなかった場合(a)、平面背景バッファで補完した場合(b)および曲面背景バッファで補完した場合(c)の任意視点映像の一具体例を示す図である。
【図8】本発明の第2の実施形態における奥行値の補正の説明図である。
【符号の説明】
【0047】
S1・・・仮の自由視点画像の生成、S2・・・背景領域の抽出、S3・・・曲面背景バッファの生成・更新、S4−1・・・仮の自由視点画像の補完、S4−2・・・仮の出力画像の補完。

【特許請求の範囲】
【請求項1】
2次元画像とその奥行画像を用いて、任意の視点から見た画像を生成する自由視点映像生成装置において、
背景バッファを具備し、
該背景バッファに前記2次元画像の背景画像とその奥行値を記録するようにしたことを特徴とする自由視点映像生成装置。
【請求項2】
請求項1に記載の自由視点映像生成装置において、
前記背景バッファは曲面単層背景バッファと曲面多層背景バッファとからなることを特徴とする自由視点映像生成装置。
【請求項3】
請求項1または2に記載の自由視点映像生成装置において、
前記奥行値を、奥行画像に射影変換して補正するようにしたことを特徴とする自由視点映像生成装置。

【図1】
image rotate

【図2】
image rotate

【図8】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate


【公開番号】特開2006−146846(P2006−146846A)
【公開日】平成18年6月8日(2006.6.8)
【国際特許分類】
【出願番号】特願2004−349703(P2004−349703)
【出願日】平成16年12月2日(2004.12.2)
【出願人】(000208891)KDDI株式会社 (2,700)
【Fターム(参考)】