説明

自由視点画像ストリーミング方式

【課題】滑らかな視点移動での自由視点画像を実時間で高精度に生成することができる自由視点画像ストリーミング方式を提供すること。
【解決手段】映像配信サーバ1は、一視点からの画像(参照画像)Vと参照画像Vに対する奥行きマップMと参照画像Vに対する射影変換行列Bを圧縮し、これらを1つのグループとして管理し、これらの情報を同時にストリーミング配信する。クライアント2側では、ストリーミング配信された参照画像Vと奥行きマップMと射影変換行列Bを受信し、自由視点画像を生成すると共に、前景画像による隠蔽領域を補完する。クライアント2では、左目画像と右目画像を生成して立体視画像を再生させることもできる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、自由視点画像ストリーミング方式に関し、特にサーバ・クライアント型のデータ伝送において、任意視点からの自由視点画像を実時間で生成することができる自由視点画像ストリーミング方式に関する。
【背景技術】
【0002】
次世代におけるインタラクティブな映像アプリケーションに対する1つの素材として自由視点画像が注目されている。自由視点画像とは、対象物に対する視点をユーザが任意に選択して得られる画像のことである。ユーザにより選択される視点は無数に存在するため、それらに対応した映像を全て用意することは非現実的である。
【0003】
そこで、従来では、対象物を3次元情報で記述した素材を用いて任意視点からの画像を描画する手法が一般に用いられている。例えば、非特許文献1には3次元の位置情報を素材として用いる手法が提案され、非特許文献2には多数の方位から撮影した対象物の画像を画像素材として用いる手法が提案されている。
【0004】
また、参照画像と該参照画像における各画素の奥行き情報(奥行きマップ)を基に3次元情報を推定する手法もある。
【非特許文献1】Saied Moezzi, Li-Cheng Tai, and Philippe Gerard “Virtual View Generation for 3D Digital Video”, IEEE Multimedia, Vol.4, No.1, pp.18-26, 1997
【非特許文献2】橋本奈穂,斎藤英雄“サッカーシーンにおける多視点映像からの中間映像生成”電子情報通信学会技術報告,PRMU2001-151, Nov.2001. pp.87-94
【発明の開示】
【発明が解決しようとする課題】
【0005】
しかしながら、対象物を3次元情報で記述した素材を用いて任意視点からの画像を描画する手法は、正確な3次元情報の取得に特殊な機器を必要とするという課題があり、多数の方位から撮影した対象物の画像を画像素材として用いる手法は、対象物を各方位から撮影する多数のカメラを固定する必要があるため撮影環境が限られてくる、また、視点の位置を切り替える方式であるため、カメラの存在する位置からの画像のみが生成可能であり、滑らかな視点移動での自由視点画像を生成することができないという課題がある。
【0006】
また、参照画像と該参照画像における各画素の奥行き情報(奥行きマップ)を基に3次元情報を推定する手法を採用した場合、クライアント側において自由視点画像の生成を実時間処理で高精度に行うことが望まれる。
【0007】
また、遠隔地間で画像情報を送受信して立体視画像を再生する方式には、送信側より2種類(左目と右目)もしくは数種類の画像を伝送し、受信側でそれらを用いて立体視画像を再生する方式があるが、このような方式においても、滑らかな視点移動での自由視点の立体視画像を実時間で高精度に再生できることが望まれる。
【0008】
本発明の目的は、上記課題を解決し、滑らかな視点移動での自由視点画像を実時間で高精度に生成することができる自由視点画像ストリーミング方式を提供することにある。
【課題を解決するための手段】
【0009】
上記課題を解決するために、本発明は、サーバ側に設けられ、一視点からの画像と該画像に対する奥行き情報と該画像に対する射影変換行列を圧縮し、これらを1つのグループとして管理する管理手段と、前記画像と奥行き情報と射影変換行列を同時にストリーミング配信する配信手段と、クライアント側に設けられ、前記配信手段によりストリーミング配信された前記画像と奥行き情報と射影変換行列を受信し、自由視点画像を生成すると共に、自由視点画像における前景画像で隠蔽されていた箇所に対する背景画像を補完する自由視点画像生成手段とを具備したことを特徴としている。
【0010】
また、本発明は、前記自由視点画像生成装置が、左目出力画像と右目出力画像を生成して立体視画像の再生を可能にするものであることを特徴としている。
【0011】
さらに、本発明は、前記自由視点画像生成装置が、前記画像、前記奥行きマップおよび前記射影変換行列を用いて自由視点画像と背景画像を生成すると共に、、各フレームごとに順次更新した背景画像を用いて自由視点画像における前景画像で隠蔽されていた箇所に対する背景画像を補完することを特徴としている。
【発明の効果】
【0012】
本発明によれば、任意視点からの画像を生成するために、一視点からの画像と該画像に対する奥行き情報と該画像に対する射影変換行列を圧縮して1つのグループとして管理し、これらを同時にストリーミング配信するので、クライアント側では、ストリーミング配信される画像と奥行き情報と射影変換行列を用いて滑らかな視点移動での高精度の自由視点画像を実時間で生成することができる。
【0013】
また、左目画像と右目画像を生成することにより、視点移動による自由視点からの、滑らか且つ高精度の立体視画像を再生できる。
【発明を実施するための最良の形態】
【0014】
以下、図面を参照して本発明を詳細に説明する。図1は、本発明の概略構成示すブロック図である。映像配信サーバ1とクライアント2とはネットワーク3を介して接続される。
【0015】
映像配信サーバ1は、対象物をある視点から撮影することにより得られた画像(以下、参照画像)Vと、該参照画像Vと他の視点から撮影した画像から生成された画像(又は画素)の奥行きマップMと、該参照画像Vに対する射影変換行列Bとを圧縮し、これらを1つのグループとして管理している。
【0016】
画像の奥行きマップMは周知の方法で生成できる。また、射影変換行列Bは以下のようにして算出できる。まず、画像の奥行きマップMを用いて、参照画像Vを、奥行きの値がある閾値Th以上の背景画像と閾値Thより小さい前景画像に分離する。
【0017】
これにより抽出された背景画像を背景バッファに書き込む。背景バッファに画像が存在しない第1フレームでは、抽出された背景画像をそのまま背景バッファに書き込んで記憶するが、第2フレーム以降のフレームでは、背景バッファに記憶されている画像に順次各フレームで抽出された背景画像を合成、すなわち上書きする。この際の合成を行うために、現在の背景バッファに記憶されている画像と抽出された背景画像との間の射影変換行列Bを算出する。この射影変換行列Bは、式(1)により定義される。
【0018】
(u,v,1)×B(u′,v′,1)=0 ・・・(1)
【0019】
ここに、(u,v,1)は現在の背景バッファに記憶されている画像の画素の位置、(u′,v′,1)は抽出された背景画像における前記位置(u,v,1)の画素に対応する画素の位置である。
【0020】
射影変換行列Bは3×3の行列であるが、スケールを任意に決めることができるため、自由度は8である。すなわち、(u,v,1)と(u′,v′,1)の対応が少なくとも8点求まれば、射影変換行列Bを算出することができる。
【0021】
映像配信サーバ1は、ストリーミング配信装置を備え、自己が管理している参照画像Vと該参照画像Vに対する奥行きマップMと該参照画像Vに対する射影変換行列Bを同時にクライアント2にストリーミング配信する。
【0022】
図2は、フレームにおける参照画像V、該参照画像Vに対する奥行きマップM、該参照画像Vに対する射影変換行列Bの具体例を示す図である。参照画像Vは、対象物をある視点から撮影することにより得られた画像であり、奥行きマップMは、該参照画像Vにおける各画素の奥行きを輝度によって表現したデータであり、射影変換行列Bは3×3の行列である。
【0023】
図3は、配信サーバ1からクライアント2へストリーミング配信されるデータの一例を示す。参照画像Vの各1フレーム分のフレームデータ(Frame Data)にフレームヘッダ(Frame Header)が付加される。フレームヘッダは、フレームデータの画像に対する奥行きマップ(Depth Map)Mと射影変換行列(Projection Matrix)Bを含む。フレームヘッダが付加された複数のフレームデータからファイルが構成され、ファイルには、宛先アドレスや送信元アドレス、画像名などを含むファイルヘッダ(File Header)が付加される。
【0024】
図4は、クライアント2における処理の例を示すフロー図である。クライアント2では、まず、映像配信サーバ1から配信されてきた参照画像Vと画像の奥行きマップMを用いて、仮の自由視点画像を生成する(S41)。画像の奥行きマップMでは、参照画像Vの各画素における奥行きZuvが記述されているため、各画素の座標と奥行きにより各画素の3次元上での位置が取得できる。これを用いることにより、仮の自由視点画像を生成できる。
【0025】
すなわち、カメラの回転を3×3の行列R′、カメラの平行移動を1×3のベクトルt′として定義し、参照画像Vにおける画素の位置を(u,v)と表した場合、自由視点における対応点(u″,v″)と、(u,v)の関係は下記の式(2)によって表される。
(u″,v″,1)×(ZuvR′(u,v,1)+t′)=0 ・・・(2)
【0026】
式(2)を(u″,v″,1)について 解くことにより、自由視点における各点の座標を求めることができる。これによって求められた(u″,v″)に対して、参照画像Vにおける(u,v)の輝度を与えることにより、仮の自由視点画像が生成される。
【0027】
また、映像配信サーバ1から配信されてきた参照画像Vと画像の奥行きマップMとから該参照画像Vの背景画像を抽出し、抽出された背景画像を、射影変換行列Bを用いて背景バッファに記憶されている画像に合成することにより背景バッファを更新する(S42)。なお、最初のフレームでは、抽出された背景画像がそのまま背景バッファに記憶される。
【0028】
背景バッファの更新の際、参照画像Vから抽出された背景画像の画素と同一点の画素が背景バッファに既に記憶されていた場合、参照画像Vから抽出された背景画像の画素を優先させることとする。これにより、より新しい情報を優先させて合成させることが可能になり、各フレームにおける背景部の動きに対応させることができるようになる。また、動画像のフレーム数が増えるにつれて背景バッファに蓄積される動画像の背景画像のデータ量が多くなり、動画像の隠蔽領域(前景により隠蔽されていた部分)が小さくなる。なお、配信サーバ1からクライアント1に配信される射影変換行列のデータ量は小さい。
【0029】
次に、仮の自由視点画像と背景バッファに記憶されている背景画像とを合成することにより、出力画像を生成する(S43)。この出力画像は、前景画像による隠蔽領域が補完された自由視点画像である。
【0030】
仮の自由視点画像と背景バッファに記憶されている背景画像とを合成して隠蔽領域を補完する方法を以下に説明する。まず、仮の自由視点画像と背景バッファに記憶されている画像との間の射影変換行列B′を算出する。射影変換行列B′の算出には、画像間の対応点が必要とされるが、前記式(1)で算出した射影変換行列Bと伝送された奥行きマップMから求められた対応点の関係を用いることにより、マッチングを取ることなく対応点を算出できる。この算出は少ない処理量で行うことができるから、クライアント1における計算量の負荷は軽い。
【0031】
その後、算出された射影変換行列B′を用いて、対応点がないとして判断された画像に対する補完を行う。点(u″,v″)の補完を行う際には、下記の式(3)を満たす点(u′,v′,1)を算出し、参照画像の画素(u′,v′)における輝度を点(u″,v″)の輝度として定義する。
【0032】
(u′,v′,1)×B′(u″,v″,1)=0 ・・・(3)
【0033】
ただし、u′およびv′が整数でない場合には、線形補完により輝度値の修正を行う。以上の処理により、隠蔽領域および誤対応などにより対応点なしと判断された箇所に対する高精度な補完が可能になる。
【0034】
図5は、クライアント2における処理の他の例を示すフロー図である。本例は、クライアント2において、左目および右目に対応する2視点からのデータ(左目出力画像と右目出力画像)を生成して立体視画像を再生可能にした例である。
【0035】
クライアント2では、まず、映像配信サーバ1から配信されてきた参照画像Vと画像の奥行きマップMを用いて、仮の左目画像と仮の右目画像を生成する(S51,S52)。また、映像配信サーバ1から配信されてきた参照画像Vと画像の奥行きマップMとから該参照画像Vの背景画像を抽出し、さらに射影変換行列Bを用い、背景画像を背景バッファに記憶されている画像に合成して背景バッファを更新する(S53)。
【0036】
次に、仮の左目画像および仮の右目画像と背景バッファに記憶されている背景画像とを合成して左目出力画像および右目出力画像を生成する(S54,S55)。これにより、隠蔽領域が補完された左目出力画像および右目出力画像を生成することができ、これらの画像を同時に表示させることによって高精度の立体視画像を再生できる。また、自由視点からの画像あるいは立体視画像を任意に選択して再生するようにすることも可能である。
【0037】
本発明は、高精度の画像を各ユーザのニーズに応じてストリーミング配信するものであり、パーソナルコンピュータやワークステーションなどの通信、放送、携帯電話やPDA(Personal Digital Assistants)に代表される無線通信などによる映像配信システム全般に応用可能である。
【図面の簡単な説明】
【0038】
【図1】本発明の概略構成示すブロック図である。
【図2】参照画像、奥行きマップおよび射影変換行列の具体例を示す図である。
【図3】ストリーミング配信されるデータの一例を示す図である。
【図4】クライアントにおける処理の例を示すフロー図である。
【図5】クライアントにおける処理の他の例を示すフロー図である。
【符号の説明】
【0039】
1・・・映像配信サーバ、2・・・クライアント、3・・・ネットワーク

【特許請求の範囲】
【請求項1】
サーバ側に設けられ、一視点からの画像と該画像に対する奥行き情報と該画像に対する射影変換行列を圧縮し、これらを1つのグループとして管理する管理手段と、
前記画像と奥行き情報と射影変換行列を同時にストリーミング配信する配信手段と、
クライアント側に設けられ、前記配信手段によりストリーミング配信された前記画像と奥行き情報と射影変換行列を受信し、自由視点画像を生成すると共に、自由視点画像における前景画像で隠蔽されていた箇所に対する背景画像を補完する自由視点画像生成手段とを具備したことを特徴とする自由視点画像ストリーミング方式。
【請求項2】
前記自由視点画像生成装置は、左目出力画像と右目出力画像を生成して立体視画像の再生を可能にするものであることを特徴とする請求項1に記載の自由視点画像ストリーミング方式。
【請求項3】
前記自由視点画像生成装置は、前記画像、前記奥行きマップおよび前記射影変換行列を用いて自由視点画像と背景画像を生成すると共に、各フレームごとに順次更新した背景画像を用いて自由視点画像における前景画像で隠蔽されていた箇所に対する背景画像を補完することを特徴とする請求項1または2に記載の自由視点画像ストリーミング方式。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate