映像符号化方法及び装置、並びに映像復号化方法及び装置
【課題】 映像符号化方法及び装置、並びに映像復号化方法及び装置を提供する。
【解決手段】 映像符号化方法は、入力映像が2D映像、ステレオ映像又は3D映像であるか否かに関係なく統合された映像圧縮フォーマットに基づいて入力映像を階層的に符号化する。次いで、符号化によって生成された符号化ビットストリームを映像復号化装置に送信する。
【解決手段】 映像符号化方法は、入力映像が2D映像、ステレオ映像又は3D映像であるか否かに関係なく統合された映像圧縮フォーマットに基づいて入力映像を階層的に符号化する。次いで、符号化によって生成された符号化ビットストリームを映像復号化装置に送信する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、映像再生装置の種類に関係なく復元された映像を再生できるように2次元(2D)映像、ステレオ映像、及び3D映像を符号化及び復号化する技術に関する。
【背景技術】
【0002】
3D映像は2D映像とは異なって、ユーザに映像の深さを提供して現実感のある映像を提供する。一般に、3D映像システムは、立体画像よりも多い視点の映像を用いて3D映像を提供するシステムを意味する。言い換えれば、3D映像システムは、ステレオ映像より視点が多い多視点画像を再生するシステムのことを称する。
【0003】
3D映像システムは、複数の多視点カメラから受信された色映像、深度映像、及び付加情報を特定フォーマットに変換して格納する。ここで、3D映像システムは、2D画像、立体画像、及び3D画像を互いに異なる映像圧縮の技術で圧縮して映像再生装置に送信する。これによって、映像の種類に応じて圧縮フォーマットは互いに異なる。
【0004】
これによって、2D映像再生装置は2D映像のみを再生し、ステレオ映像及び3D映像は再生することができない。そして、偏光フィルタリング方式、液晶シャッタリング方式などの両眼式映像再生装置は両眼式立体映像のステレオ映像を再生することはできるものの、3D映像を再生することができない。
【0005】
したがって、映像の種類及び映像再生装置の種類に関係なく互換して映像を再生することのできる信号処理技術が必要である。言い換えれば、2D映像、ステレオ映像、3D映像を種類に関係なく共通に信号を処理することによって、従来の2D映像再生装置、両眼式映像再生装置、及び自動両眼式3D映像再生装置のいずれのものも復元映像を再生することのできる技術が要求される。
【発明の概要】
【発明が解決しようとする課題】
【0006】
本発明の目的は、映像の種類及び映像再生装置の種類に関係なく映像を再生することのできる映像符号化方法及び装置、並びに映像復号化方法及び装置を提供する。
【課題を解決するための手段】
【0007】
本映像符号化方法は、入力映像に含まれた少なくとも1つの視点映像をベースレイヤ、ステレオレイヤ、多視点エンハンスメントレイヤ、及び多視点拡張レイヤの少なくとも1つに割り当てるステップと、前記ベースレイヤ、ステレオレイヤ、多視点エンハンスメントレイヤ及び多視点拡張レイヤに割り当てられた映像を階層的に符号化するステップとを含む。
【0008】
また、前記符号化するステップは、前記ベースレイヤに割り当てられた基準映像を参照し、前記ステレオレイヤに割り当てられた隣接映像を視点間予測符号化し、前記隣接映像は前記基準映像と隣接する映像であってもよい。
【0009】
また、前記符号化するステップは、前記多視点エンハンスメントレイヤに割り当てられた基準映像の深度映像を画面内予測符号化するステップと、前記多視点エンハンスメントレイヤに割り当てられた隣接映像の深度映像を視点間予測符号化するステップとを含んでもよい。
【0010】
また、前記符号化するステップは、前記ベースレイヤに割り当てられた基準映像及び前記ステレオレイヤに割り当てられた隣接映像の少なくとも1つを参照して、前記多視点エンハンスメントレイヤに割り当てられた視点映像を視点間予測符号化してもよい。
【0011】
また、前記符号化するステップは、前記多視点エンハンスメントレイヤに割り当てられた基準映像の深度映像及び前記多視点エンハンスメントレイヤに割り当てられた隣接映像の深度映像の少なくとも1つを参照して、前記多視点拡張レイヤに割り当てられた視点映像の深度映像を視点間予測符号化してもよい。
【0012】
また、前記符号化するステップは、前記多視点拡張レイヤに割り当てられた視点映像の解像度に基づいて前記ベースレイヤに割り当てられた基準映像及び前記ステレオレイヤに割り当てられた隣接映像の少なくとも1つの解像度を変換するステップと、前記解像度が変換された基準映像及び隣接映像の少なくとも1つに基づいて前記多視点拡張レイヤに割り当てられた視点映像を符号化するステップとを含んでもよい。
【0013】
また、前記符号化するステップは、前記多視点拡張レイヤに割り当てられた視点映像の深度映像の解像度に基づいて前記多視点エンハンスメントレイヤに割り当てられた基準映像の深度映像及び隣接映像の深度映像の少なくとも1つの解像度を変換するステップと、前記解像度が変換された基準映像及び隣接映像の少なくとも1つに基づいて前記多視点拡張レイヤに割り当てられた視点映像を符号化するステップとを含んでもよい。
【0014】
また、前記ステレオレイヤに割り当てられた隣接映像は、前記ベースレイヤに割り当てられた基準映像と同じ解像度を有してもよい。
【0015】
また、前記多視点エンハンスメントレイヤに割り当てられた基準映像の深度映像は、基準映像の深度映像及び隣接映像の深度映像と同じ解像度又は異なる解像度を有してもよい。また、前記多視点エンハンスメントレイヤに割り当てられた隣接映像の深度映像は、基準映像及び隣接映像と同じ解像度又は異なる解像度を有してもよい。
【0016】
前記割り当てるステップは、1視点映像(1view)である基準映像を前記ベースレイヤに割り当てるステップと、前記基準映像と隣接し、2視点映像(2view)である隣接映像を前記ステレオレイヤに割り当てるステップと、前記基準映像の深度映像と隣接映像の深度映像を前記多視点エンハンスメントレイヤに割り当てるステップと、前記基準映像と隣接する映像のうち前記隣接映像を除いた残り隣接映像、及び前記残り隣接映像に対応する深度映像を前記多視点拡張レイヤに割り当てるステップとを含み、前記残り隣接映像は、第3視点以上の映像であってもよい。
【0017】
前記符号化するステップは、前記符号化によってベースレイヤストリーム、ステレオレイヤストリーム、多視点エンハンスメントレイヤストリーム、及び多視点拡張レイヤストリームを含む階層構造の符号化ビットストリームを生成してもよい。
【0018】
本映像符号化装置は、入力映像に含まれた少なくとも1つの視点映像をベースレイヤ、ステレオレイヤ、多視点エンハンスメントレイヤ、及び多視点拡張レイヤの少なくとも1つに割り当てるレイヤ割当部と、前記ベースレイヤ、ステレオレイヤ、多視点エンハンスメントレイヤ及び多視点拡張レイヤを階層的に符号化する符号化部とを備える。
【0019】
また、前記符号化部は、前記ベースレイヤに割り当てられた基準映像を参照し、前記ステレオレイヤに割り当てられた隣接映像を視点間予測符号化してもよい。
【0020】
また、前記符号化部は、前記多視点エンハンスメントレイヤに割り当てられた基準映像の深度映像を画面内予測符号化し、隣接映像の深度映像を視点間予測符号化してもよい。
【0021】
また、前記符号化部は、前記ベースレイヤに割り当てられた基準映像及び前記ステレオレイヤに割り当てられた隣接映像の少なくとも1つを参照して、前記多視点エンハンスメントレイヤに割り当てられた視点映像を視点間予測符号化してもよい。
【0022】
また、前記符号化部は、前記多視点エンハンスメントレイヤに割り当てられた基準映像の深度映像及び前記多視点エンハンスメントレイヤに割り当てられた隣接映像の深度映像の少なくとも1つを参照して、前記多視点拡張レイヤに割り当てられた視点映像の深度映像を視点間予測符号化してもよい。
【0023】
また、前記符号化部は、前記多視点拡張レイヤに割り当てられた視点映像の解像度に基づいて前記ベースレイヤに割り当てられた基準映像及び前記ステレオレイヤに割り当てられた隣接映像の少なくとも1つの解像度を変換し、解像度が変換された基準映像及び解像度が変換された隣接映像の少なくとも1つに基づいて前記多視点拡張レイヤに割り当てられた視点映像を符号化してもよい。
【0024】
また、前記符号化部は、前記多視点拡張レイヤに割り当てられた視点映像の深度映像の解像度に基づいて前記多視点エンハンスメントレイヤに割り当てられた基準映像の深度映像及び隣接映像の深度映像の少なくとも1つの解像度を変換し、前記解像度が変換された基準映像及び解像度が変換された隣接映像の少なくとも1つに基づいて前記多視点拡張レイヤに割り当てられた視点映像を符号化してもよい。
【0025】
本映像復号化方法は、ベースレイヤストリーム、ステレオレイヤストリーム、多視点エンハンスメントレイヤストリーム、及び多視点拡張レイヤストリームを含む符号化ビットストリームを受信するステップと、前記符号化ビットストリームを付加情報に基づいて階層的に復号化するステップとを含む。
【0026】
また、前記復号化するステップは、前記付加情報に基づいて前記ベースレイヤストリームを復号化して2D映像を復元してもよい。
【0027】
また、前記復号化するステップは、前記ベースレイヤストリーム及びステレオレイヤストリームを復号化して基準映像及び隣接映像を復元してもよい。
【0028】
また、前記復号化するステップは、前記基準映像及び隣接映像の少なくとも1つを参照し、基準映像の深度映像及び隣接映像の深度映像を生成するステップと、前記基準映像及び隣接映像を参照し、1つ以上の仮想視点映像を生成するステップと、前記基準映像の深度映像及び隣接映像の深度映像を参照し、前記仮想視点映像の深度映像を生成するステップと、前記基準映像、隣接映像、基準映像の深度映像、隣接映像の深度映像、仮想視点映像、及び仮想視点映像の深度映像を合成して多視点映像を生成するステップとを含んでもよい。
【0029】
また、前記復号化するステップは、前記多視点エンハンスメントレイヤストリームを復号化して基準映像の深度映像及び隣接映像の深度映像を復元するステップと、前記基準映像及び隣接映像を参照して1つ以上の仮想視点映像を生成するステップと、前記基準映像の深度映像及び隣接映像の深度映像を参照して前記仮想視点映像の深度映像を生成するステップと、前記基準映像、隣接映像、基準映像の深度映像、隣接映像の深度映像、仮想視点映像、及び仮想視点映像の深度映像を合成して多視点映像を生成するステップとを含んでもよい。
【0030】
また、前記復号化するステップは、前記多視点エンハンスメントレイヤストリームを復号化して基準映像の深度映像及び隣接映像の深度映像を復元するステップと、前記多視点拡張レイヤストリームを復号化して多視点拡張レイヤに割り当てられた1つ以上の視点映像及び視点映像の深度映像を復元するステップと、前記基準映像、隣接映像、基準映像の深度映像、隣接映像の深度映像、多視点拡張レイヤに割り当てられた視点映像及び多視点拡張レイヤに割り当てられた視点映像の深度映像を合成して多視点映像を生成するステップとを含んでもよい。
【0031】
本発明の映像復号化装置は、ベースレイヤストリーム、ステレオレイヤストリーム、多視点エンハンスメントレイヤストリーム、及び多視点拡張レイヤストリームを含む階層構造の符号化ビットストリームを受信するビットストリーム受信部と、前記符号化ビットストリームを付加情報に基づいて階層的に復号化する復号化部とを備える。
【0032】
また、前記復号化部は、前記付加情報に基づいて前記ベースレイヤストリームを復号化して2D映像を復元する2D復号化部を備えてもよい。
【0033】
また、前記復号化部は、前記符号化ビットストリームに含まれた付加情報がステレオ映像モードを含むことによって、前記ベースレイヤストリーム及びステレオレイヤストリームを復号化して基準映像及び隣接映像を復元するステレオ復号化部を備えてもよい。
【0034】
また、前記基準映像及び隣接映像の少なくとも1つを参照し、基準映像の深度映像及び隣接映像の深度映像を生成する深度映像生成部と、前記基準映像及び隣接映像を参照して1つ以上の仮想視点映像を生成し、前記基準映像の深度映像及び隣接映像の深度映像を参照して前記仮想視点映像の深度映像を生成し、前記基準映像、隣接映像、基準映像の深度映像、隣接映像の深度映像、仮想視点映像、及び仮想視点映像の深度映像を合成して多視点映像を復元する視点映像合成部をさらに備えてもよい。
【0035】
また、前記復号化部は、前記ベースレイヤストリーム及びステレオレイヤストリームを復号化して基準映像及び隣接映像を復元し、前記多視点エンハンスメントレイヤストリームを復号化して基準映像の深度映像及び隣接映像の深度映像を復元する3D復号化部を備えてもよい。
【0036】
このとき、前記基準映像及び隣接映像を参照して1つ以上の仮想視点映像を生成し、前記基準映像の深度映像及び隣接映像の深度映像を参照して前記仮想視点映像の深度映像を生成し、前記基準映像、隣接映像、基準映像の深度映像、隣接映像の深度映像、仮想視点映像、及び仮想視点映像の深度映像を合成して多視点映像を復元する視点映像合成部をさらに備えてもよい。
【0037】
また、前記復号化部は、前記符号化ビットストリームに含まれた付加情報が多視点映像モードを含むことによって、前記ベースレイヤストリーム及びステレオレイヤストリームを復号化して基準映像及び隣接映像を復元し、前記多視点エンハンスメントレイヤストリームを復号化して基準映像の深度映像及び隣接映像の深度映像を復元し、前記多視点拡張レイヤストリームを復号化して多視点拡張レイヤに割り当てられた1つ以上の視点映像及び視点映像の深度映像を復元する3D復号化部を備えてもよい。
【0038】
ここで、前記基準映像、隣接映像、基準映像の深度映像、隣接映像の深度映像、1つ以上の視点映像及び視点映像の深度映像を合成して多視点映像を生成する視点映像合成部をさらに備えてもよい。
【発明の効果】
【0039】
本発明の一実施形態によれば、入力映像を階層的に符号化及び復号化することによって映像の種類及び映像再生装置の種類に関係なく統合された映像圧縮フォーマットを提供することができる。
【0040】
本発明の一実施形態によれば、映像の種類に関係なく統合された映像圧縮フォーマットを提供することによって、従来の2D映像再生装置及びステレオ映像再生装置でも多視点映像のうち選択された視点の2D映像を再生する互換性を提供することができる。
【図面の簡単な説明】
【0041】
【図1】本映像処理システムの全般的な構成を示す図である。
【図2】統合された映像圧縮フォーマットに基づいて入力映像を階層的に符号化する動作を説明するために提供されるフローチャートである。
【図3】統合された映像圧縮フォーマットを示す図である。
【図4】3個の視点映像を各レイヤに割り当てて形成された統合された映像圧縮フォーマットを示す図である。
【図5】階層的符号化によって生成された符号化ビットストリームの構造を示す図である。
【図6】各レイヤに割り当てられた映像を階層的に符号化する動作を説明するために提供されるフローチャートである。
【図7】3個の視点映像及び深度映像を含む3D映像を階層的に符号化する過程を説明するために提供される図である。
【図8】4個の視点映像及び深度映像を含む3D映像を各階層に割り当てた構成を示す図である。
【図9】解像度変換を用いて3D映像を階層的に符号化する過程を説明するために提供される図である。
【図10】映像符号化装置の詳細構成を示すブロック図である。
【図11】統合された映像圧縮フォーマットに基づいて符号化ビットストリームを復号化する動作を説明するために提供されるフローチャートである。
【図12】映像モード情報によって符号化ビットストリームを階層的に復号化する動作を説明するために提供されるフローチャートである。
【図13】映像復号化装置の詳細構成を示すブロック図である。
【発明を実施するための形態】
【0042】
以下、本発明の実施形態を添付する図面を参照しながら詳細に説明する。
【0043】
図1は、本映像処理システムの全般的な構成を示す図である。図1に示すように、映像処理システム100は、映像生成装置101、映像符号化装置102、映像復号化装置103及び映像再生装置104を備える。例えば、映像再生装置は2D映像再生装置、ステレオ映像再生装置、及び3D映像再生装置を備える。
【0044】
まず、映像生成装置101は、複数のカメラ105を用いて撮影された視点映像、深度映像、及び付加情報に基づいて入力映像を生成する。ここで、入力映像は、2D映像、両眼式映像であるステレオ映像、または、多視点映像である3D映像を含んでもよい。ここで、カメラは、多視点カメラ、可視帯域カメラ、赤外線カメラ、及び深度カメラの少なくとも1つを含んでもよい。
【0045】
映像符号化装置102は、入力映像に含まれた2D映像、ステレオ映像、または、3D映像を階層的に符号化して符号化ビットストリームを生成する。そして、映像符号化装置102は、符号化ビットストリームを映像復号化装置103に送信する。これによって、映像復号化装置103は、符号化ビットストリームを階層的に復号化して2D映像、ステレオ映像、又は3D映像を復元する。映像再生装置104は、復元された映像を再生する。ここで、映像再生装置は2D映像再生装置であってもよく、ステレオ映像再生装置であってもよく、3D映像再生装置であってもよい。言い換えれば、映像再生装置104は、映像再生装置の種類及び映像の種類に関係なく復元された映像を再生することができる。
【0046】
以下は、映像再生装置の種類及び映像の種類に関係なく復元された映像を再生できるように統合された映像圧縮フォーマットを提供し、統合された映像圧縮フォーマットを用いて入力映像を符号化及び復号化する過程について詳細に説明することにする。
【0047】
図2は、統合された映像圧縮フォーマットに基づいて入力映像を階層的に符号化する動作を説明するために提供されるフローチャートである。図2に示すように、符号化動作は図10の映像符号化装置1000によって行われる。
【0048】
まず、ステップS201において、映像符号化装置は付加情報に基づいて入力映像を各レイヤに割り当てる。
【0049】
ここで、付加情報は、解像度情報、符号化ビットストリームに含まれた視点映像の個数を示す視点映像の個数情報、カメラパラメータ情報、及び映像モード情報の少なくとも1つを含んでもよい。例えば、解像度情報は、視点映像の解像度情報及び深度映像の解像度情報の少なくとも1つを含み、カメラパラメータ情報は視点映像の3次元位置座標を含み、映像モード情報は、入力映像が2D映像、ステレオ映像、及び3D映像のいずれか1つであるかを示すモード情報を含んでもよい。
【0050】
ここで、映像符号化装置は、入力映像をベースレイヤ(Base Layer)、ステレオレイヤ(Stereo Layer)、多視点エンハンスメントレイヤ(Multi−view Enhancement Layer)、及び多視点拡張レイヤ(Multi−view Extension Layer)の少なくとも1つに割り当てる。ここで、入力映像は2D映像、ステレオ映像、または3D映像を含んでもよい。
【0051】
ここで、2D映像は色及びカラー情報を含む1つの視点映像(1view)を含み、ステレオ映像は色及びカラー情報を含む2つの視点映像(2view)を含み、3D映像は色及びカラー情報を含む3個以上の視点映像と各視点映像に対応する深度映像を含む。例えば、ステレオ映像は、左映像及び右映像を含む両眼式映像を含み、3D画像は多視点画像を含む。
【0052】
次に、ステップS202において、映像符号化装置は、各レイヤに割り当てられた映像を階層的に符号化して符号化ビットストリームを生成する。そして、映像符号化装置は、符号化ビットストリームを映像復号化装置に送信する。ここで、映像符号化装置は、付加情報に基づいて入力映像が2D映像、ステレオ映像、または3D映像であるか否かに応じてベースレイヤ、ステレオレイヤ、多視点エンハンスメントレイヤ、及び多視点拡張レイヤの順に階層的に符号化する。
【0053】
一例として、入力映像が2D映像である場合、映像符号化装置は、2D映像をベースレイヤに割り当ててもよい。言い換えれば、2D映像は1つの視点映像を含むため、映像符号化装置は1つの視点映像をベースレイヤに割り当て、ベースレイヤに割り当てられた視点映像を符号化して符号化ビットストリームを生成する。
【0054】
ここで、映像符号化装置は、入力映像が2D映像であるため映像モード情報を2D映像モードに設定する。そして、映像符号化装置は、映像モード情報を含む付加情報を符号化ビットストリームに挿入して映像復号化装置に送信する。
【0055】
他の例として、入力映像がステレオ映像である場合、映像符号化装置は、ステレオ映像のうち基準映像をベースレイヤに割り当て、基準映像を除いた異なる1つの隣接映像をステレオレイヤに割り当てる。そして、映像符号化装置は、ベースレイヤ及びステレオレイヤに割り当てられた視点映像を符号化して符号化ビットストリームを生成する。ここで、基準映像とは、他の視点映像を参照することなく、自身の映像情報だけで映像を復元できる映像を意味する。
【0056】
ここで、映像符号化装置は、入力映像がステレオ映像であるため映像モード情報をステレオ映像モードに設定してもよい。そして、映像符号化装置は、映像モード情報を含む付加情報を符号化ビットストリームに挿入して映像復号化装置に送信する。ここで、入力映像がステレオ映像である場合、付加情報は、カメラパラメータ情報、解像度情報、及び視点映像の個数情報をさらに含んでもよい。例えば、ステレオ映像は2つの視点映像を含むため、視点映像の個数情報は2である。
【0057】
他の例として、入力映像が2つの視点映像及び深度映像を含む3D映像である場合、映像符号化装置は、2つの視点映像のうち基準映像をベースレイヤに割り当て、隣接映像をステレオレイヤに割り当てる。そして、映像符号化装置は、基準映像に対応する深度映像と隣接映像に対応する深度映像を多視点エンハンスメントレイヤに割り当てる。次に、映像符号化装置は、ベースレイヤ、ステレオレイヤ、及び多視点エンハンスメントレイヤの順に各レイヤに割り当てられた映像を符号化して符号化ビットストリームを生成する。
【0058】
ここで、映像符号化装置は、入力映像が3D映像であるため映像モード情報を3D映像モードに設定してもよい。そして、映像符号化装置は、映像モード情報を含む付加情報を符号化ビットストリームに挿入して映像復号化装置に送信する。ここで、入力映像が3D映像である場合、付加情報は、カメラパラメータ情報、解像度情報、及び視点映像の個数情報をさらに含んでもよい。例えば、3D映像が2つの視点映像及び深度映像を含む場合、視点映像の個数情報は2である。
【0059】
他の例として、映像符号化装置は、入力映像が3個以上の視点映像及び深度映像を含む3D映像である場合、映像符号化装置は、3個の視点映像のうち基準映像をベースレイヤに割り当て、基準映像と隣接するいずれか1つの隣接映像をステレオレイヤに割り当てる。そして、映像符号化装置は、基準映像に対応する深度映像と隣接映像に対応する深度映像を多視点エンハンスメントレイヤに割り当てる。次に、映像符号化装置は、3個以上の視点映像のうち基準映像及び隣接映像を除いた残りの視点映像と、残りの視点映像に対応する深度映像を多視点拡張レイヤに割り当てる。そして、映像符号化装置は、ベースレイヤ、ステレオレイヤ、多視点エンハンスメントレイヤ、及び多視点拡張レイヤの順に各レイヤに割り当てられた映像を符号化して符号化ビットストリームを生成する。
【0060】
ここで、映像符号化装置は、入力映像が3D映像であるため映像モード情報を3D映像モードに設定してもよい。そして、映像符号化装置は、映像モード情報を含む付加情報を符号化ビットストリームに挿入して映像復号化装置に送信する。ここで、入力映像が3D映像である場合、付加情報は、カメラパラメータ情報、解像度情報、及び視点映像の個数情報をさらに含んでもよい。例えば、3D映像が3個以上の視点映像及び深度映像を含む場合、視点映像の個数情報は3以上である。
【0061】
図3は、統合された映像圧縮フォーマットを示す図である。図3を参照すると、統合された映像圧縮フォーマットはベースレイヤ(Base Layer)301、ステレオレイヤ(Stereo Layer)302、多視点エンハンスメントレイヤ(Multi−view Enhancement Layer)303、及び多視点拡張レイヤ(Multi−view Extension Layer)304を含む。そして、映像符号化装置は、付加情報に基づいて入力映像を各レイヤに割り当てる。
【0062】
図3に示すように、ベースレイヤ301は、入力映像の符号化において基準となる映像が位置するレイヤである。そして、ステレオレイヤ302は、基準映像と隣接する1つ以上の視点映像のいずれか1つの隣接映像が位置するレイヤである。例えば、ベースレイヤ301にステレオ映像の左映像が位置する場合、ステレオレイヤ302には右映像が位置する。反対に、ベースレイヤ301にステレオ映像の右映像が位置する場合、ステレオレイヤ302には左映像が位置する。
【0063】
次に、多視点エンハンスメントレイヤ303は、基準映像に対応する深度映像及び隣接映像に対応する深度映像が位置するレイヤである。そして、入力映像が3個以上の視点映像を含む多視点映像である場合、多視点拡張レイヤ304はベースレイヤ301及びステレオレイヤ302に位置する視点映像を除いた残りの視点映像及び残りの視点映像に対応する深度映像が位置する。
【0064】
一例として、図4を参考して説明すると、入力映像が3個の視点映像及び深度映像を含む3D映像である場合、映像符号化装置は、3個の視点映像のいずれか1つを基準映像として決定してもよい。ここで、基準映像は、他の視点映像を参照することなく自身の映像情報だけで映像を復元することのできる映像を意味する。例えば、3個の視点映像C(1)401、C(2)402及びC(3)405のうち、C(1)401が画面内の予測によって復元可能な場合、映像符号化装置は、C(1)401を基準映像として決定する。ここで、基準映像はキーフレーム(Key Frame)として表してもよい。
【0065】
次に、映像符号化装置は、基準映像と隣接する1つ以上の視点映像のいずれか1つを隣接映像として決定する。言い換えれば、図4を参考すると、映像符号化装置は、視点映像C(2)402を隣接映像として決定してもよい。ここで、隣接映像は、基準映像と解像度が同一であってもよい。例えば、映像符号化装置は、基準映像と隣接する1つ以上の視点映像のうち基準映像と同一の解像度を有するいずれか1つの視点映像を隣接映像として決定してもよい。
【0066】
これによって、映像符号化装置は、基準映像に決定された視点映像C(1)401をベースレイヤ407に割り当て、隣接映像として決定された視点映像C(2)402をステレオレイヤ408に割り当てる。そして、映像符号化装置は、基準映像に対応する深度映像D(1)403と隣接映像に対応する深度映像D(2)404を多視点エンハンスメントレイヤ409に割り当ててもよい。次に、映像符号化装置は、3個の視点映像のうち基準映像であるC(1)401及び隣接映像であるC(2)402を除いた残りの視点映像C(3)405と視点映像C(3)405に対応する深度映像D(3)406を多視点拡張レイヤ410に割り当ててもよい。
【0067】
他の例として、再び図3を参考すると、入力映像が4個である視点映像及び深度映像を含む3D映像である合、映像符号化装置は、基準映像として決定された視点映像C(1)307をベースレイヤ305に割り当て、隣接映像として決定された視点映像C(2)309をステレオレイヤ308に割り当てる。ここで、ステレオレイヤ308に割り当てられた視点映像C(2)309の解像度はベースレイヤ305に割り当てられた視点映像C(1)307の解像度と同一であってもよい。そして、映像符号化装置は、視点映像C(1)307に対応する深度映像D(1)311及び視点映像C(2)309に対応する深度映像D(2)312を多視点エンハンスメントレイヤ310に割り当てる。次に、映像符号化装置は、4個の視点映像のうち基準映像であるC(1)307及び隣接映像であるC(2)309を除いた残りの視点映像C(3)314及びC(4)315、C(3)314に対応する深度映像D(3)316及びC(4)315に対応する深度映像D(4)317を多視点拡張レイヤ313に割り当てる。ここで、多視点拡張レイヤ313に割り当てられた視点映像C(3)314及びC(4)315それぞれの解像度は基準映像及び隣接映像の解像度と同一であってもよく、互いに異なってもよい。同様に、多視点拡張レイヤ313に割り当てられた深度映像D(3)316及びD(4)317それぞれの解像度は基準映像及び隣接映像の解像度と同一であってもよく、互いに異なってもよい。例えば、多視点拡張レイヤ313に割り当てられた視点映像C(3)314、C(4)315、深度映像D(3)316、D(4)317それぞれの解像度は基準映像及び隣接映像の解像度よりも小さいか同一であってもよい。
【0068】
図5は、階層的符号化によって生成された符号化ビットストリームの構造を示す図である。図5に示すように、符号化ビットストリームは、ベースレイヤストリーム501、ステレオレイヤストリーム502、多視点エンハンスメントレイヤストリーム503、多視点拡張レイヤストリーム504を含む。ここで、ベースレイヤストリーム501は基準映像を符号化したストリーム、ステレオレイヤストリーム502は隣接映像を符号化したストリーム、多視点エンハンスメントレイヤストリーム503は基準映像に対応する深度映像及び隣接映像に対応する深度映像を符号化したストリーム、多視点拡張レイヤストリーム504は入力映像に含まれた視点映像のうち基準映像及び隣接映像を除外した残りの視点映像と残りの視点映像に対応する深度映像を符号化したストリームである。
【0069】
例えば、入力映像が4個の視点映像C1〜C4及び深度映像D1〜D4を含む3D映像である場合、ベースレイヤストリーム501は符号化された視点映像C1を含み、ステレオレイヤストリーム502は符号化された視点映像C2を含み、多視点エンハンスメントレイヤストリーム503は符号化された深度映像D1、D2を含み、多視点拡張レイヤストリーム504は符号化された視点映像C3、C4、及び深度映像D3、D4を含んでもよい。
【0070】
以下は、統合された映像圧縮フォーマットの各レイヤに割り当てられた視点映像及び深度映像の少なくとも1つを階層的に符号化する過程について詳細に説明することにする。
【0071】
図6は、各レイヤに割り当てられた映像を階層的に符号化する動作を説明するために提供されるフローチャートである。図6において、符号化動作は図10に示す映像符号化装置1000によって行われる。ここで、図6において図4に示すように入力映像が3個の視点映像及び深度映像を含む3D映像である場合に各レイヤに割り当てられた映像を階層的に符号化する動作について説明することにする。
【0072】
まず、ステップS601において、映像符号化装置は、ベースレイヤに割り当てられた基準映像を符号化する。ここで、映像符号化装置は、空間軸を基準として基準映像を画面内予測符号化する。そして、映像符号化装置は、時間軸を基準として基準映像を以前映像の少なくとも1つを参照して符号化する。ここで、以前映像は、現在の時間を基準として基準映像と時系列的に以前に位置する映像を意味する。
【0073】
次に、ステップS602において、映像符号化装置は、ステレオレイヤに割り当てられた隣接映像を符号化する。ここで、隣接映像の解像度は基準映像の解像度と同一であり、隣接映像は基準映像と隣接する映像のいずれか1つであってもよい。
【0074】
ここで、映像符号化装置は、空間軸を基準としてベースレイヤに割り当てられた基準映像を参照して隣接映像を視点間予測符号化する。ここで、視点間予測符号化は画面間予測符号化に表してもよい。そして、映像符号化装置は、時間軸を基準として隣接映像の以前映像の少なくとも1つを参照して隣接映像を符号化する。
【0075】
そして、ステップS603において、映像符号化装置は、多視点エンハンスメントレイヤに割り当てられた深度映像を符号化する。ここで、映像符号化装置は、空間軸を基準として基準映像に対応する深度映像を画面内予測符号化してもよい。そして、映像符号化装置は、空間軸を基準として隣接映像に対応する深度映像と同一の時間帯に位置する深度映像である基準映像の深度映像を参照して隣接映像に対応する深度映像を符号化する。そして、映像符号化装置は、時間軸を基準として基準映像に対応する深度映像の以前映像を参照して基準映像に対応する深度映像を符号化し、隣接映像に対応する深度映像の以前映像を参照して以前映像に対応する深度映像を符号化する。
【0076】
次に、ステップS604において、映像符号化装置は、多視点拡張レイヤに割り当てられた視点映像及び深度映像を符号化する。
【0077】
ここで、映像符号化装置は、空間軸を基準として多視点拡張レイヤに割り当てられた視点映像と同一の時間帯に位置する少なくとも1つの視点映像を参照して視点間予測符号化する。そして、映像符号化装置は、時間軸を基準として多視点拡張レイヤに割り当てられた視点映像の以前映像を参照して多視点拡張レイヤに割り当てられた視点映像を符号化する。次に、映像符号化装置は、空間軸を基準として多視点拡張レイヤに割り当てられた深度映像と同一の時間帯に位置する少なくとも1つの深度映像を参照して視点間予測符号化する。そして、映像符号化装置は、時間軸を基準として多視点拡張レイヤに割り当てられた深度映像の隣接映像を参照して多視点拡張レイヤに割り当てられた深度映像を符号化する。
【0078】
そして、ステップS605において、映像符号化装置は符号化ビットストリームを映像復号化装置に送信する。
【0079】
例えば、映像符号化装置は、ステップS601からステップS603において、ベースレイヤ、ステレオレイヤ、多視点エンハンスメントレイヤ、及び多視点拡張レイヤそれぞれに割り当てられた映像を階層的に符号化して符号化ビットストリームを生成する。そして、映像符号化装置は、符号化ビットストリームを映像復号化装置に送信する。
【0080】
図7は、3個の視点映像及び深度映像を含む3D映像を階層的に符号化する過程を説明するために提供される図である。図7を参照すると、3個の視点映像のうちC(1)701が基準映像と決定された場合、映像符号化装置は、空間軸を基準としてベースレイヤに割り当てられた基準映像C(1)701を画面内予測符号化し、時間軸を基準としてC(1)701の以前映像を参照してC(1)701を符号化する。
【0081】
次に、基準映像C(1)701と隣接する視点映像C(2)702及びC(3)703のうち、C(2)702が隣接映像に決定されてステレオレイヤに割り当てられた場合、映像符号化装置は、空間軸を基準として隣接映像C(2)702と同一時間帯に位置する少なくとも1つの視点映像を参照してC(2)702を視点間予測符号化する。そして、映像符号化装置は、時間軸を基準として隣接映像C(2)702の以前映像を参照してC(2)702を符号化する。
【0082】
例えば、映像符号化装置は、空間軸を基準としてC(1)701を参照してC(2)702を符号化する。また、映像符号化装置は、空間軸を基準としてC(3)703を参照してC(2)702を符号化する。また、映像符号化装置は、空間軸を基準としてC(1)701及びC(3)703を参照してC(2)702を符号化する。
【0083】
そして、映像符号化装置は、空間軸を基準として多視点エンハンスメントレイヤに割り当てられたC(1)701の深度映像D(1)704を画面内予測符号化する。次に、映像符号化装置は、時間軸を基準として深度映像D(1)704の以前映像を参照してD(1)704を符号化する。そして、映像符号化装置は、空間軸を基準としてD(1)704及びD(3)706の少なくとも1つを参照してC(2)702の深度映像D(2)705を視点間予測符号化する。次に、映像符号化装置は、時間軸を基準としてD(2)705の以前映像を参照してD(2)705を符号化する。
【0084】
そして、映像符号化装置は、C(2)705と同一の方式によって多視点拡張レイヤに割り当てられたC(3)703及びD(3)706を符号化する。
【0085】
例えば、映像符号化装置は、空間軸を基準としてC(1)701及びC(2)702の少なくとも1つを参照してC(3)703を視点間予測符号化する。そして、映像符号化装置は、時間軸を基準としてC(3)703の以前映像を参照してC(3)703を符号化する。次に、映像符号化装置は、空間軸を基準としてD(1)704及びD(2)705の少なくとも1つを参照してD(3)706を視点間予測符号化する。そして、映像符号化装置は、時間軸を基準としてD(3)706の以前映像を参照してD(3)706を符号化する。
【0086】
図8は、4個の視点映像及び深度映像を含む3D映像を各階層に割り当てた構成を示す図である。
【0087】
そして、図9は、解像度変換を用いて3D映像を階層的に符号化する過程を説明するために提供される図である。
【0088】
図8及び図9において、入力映像は4個の視点映像及び深度映像を含む3D映像であってもよい。図8及び図9を参照すると、4個の視点映像のうちC(1)801が基準映像と決定された場合、映像符号化装置は、空間軸を基準としてベースレイヤに割り当てられた基準映像C(1)801を画面内予測符号化し、時間軸を基準としてC(1)801の以前映像を参照してC(1)801を符号化する。
【0089】
次に、基準映像C(1)801と隣接する視点映像C(2)802、C(3)803、及びC(4)804のうちC(2)802が隣接映像と決定されてステレオレイヤに割り当てられた場合、映像符号化装置は、空間軸を基準として隣接映像C(2)802と同一時間帯に位置する少なくとも1つの視点映像を参照してC(2)802を視点間予測符号化する。例えば、映像符号化装置は、空間軸を基準としてC(1)801、C(2)802、及びC(3)803の少なくとも1つを参照してC(2)802を符号化する。
【0090】
そして、映像符号化装置は、時間軸を基準として隣接映像C(2)802の以前映像を参照してC(2)802を符号化する。ここで、C(2)802とC(1)801の解像度は同一であり、C(3)803又はC(4)804の解像度はC(2)802及びC(1)801の解像度と同一であってもよく、互いに異なってもよい。
【0091】
次に、映像符号化装置は、空間軸を基準として多視点エンハンスメントレイヤに割り当てられたC(1)801の深度映像D(1)805を画面内予測符号化する。次に、映像符号化装置は、時間軸を基準として深度映像D(1)805の以前映像を参照してD(1)805を符号化する。そして、映像符号化装置は、空間軸を基準としてD(1)805を参照してC(2)802の深度映像D(2)806を視点間予測符号化する。次に、映像符号化装置は、時間軸を基準としてD(2)806の以前映像を参照してD(2)806を符号化する。
【0092】
そして、映像符号化装置は、多視点拡張レイヤに割り当てられたC(3)803、C(4)804、D(3)807、及びD(4)808を符号化する。
【0093】
ここで、C(3)803、C(4)804の解像度がC(1)801、C(2)802の解像度の未満である場合、映像符号化装置は、空間軸を基準としてC(1)801及びC(2)802の少なくとも1つの解像度を変換する。
【0094】
一例として、映像符号化装置は、C(1)801をダウンスケーリングしてC(1)801の解像度をC(3)803の解像度と同一の解像度に変換してもよい。そして、映像符号化装置は、解像度が変換されたC(1)801を参照してC(3)803を視点間予測符号化してもよい。
【0095】
他の例として、映像符号化装置は、C(2)802の解像度をC(3)803の解像度と同一の解像度に変換してもよい。そして、映像符号化装置は、解像度が変換されたC(2)802を参照してC(3)803を視点間予測符号化してもよい。
【0096】
他の例として、映像符号化装置は、C(1)801及びC(2)802の解像度をC(3)803の解像度と同一の解像度に変換してもよい。そして、映像符号化装置は、解像度が変換されたC(1)801及びC(2)802を参照してC(3)803を視点間予測符号化してもよい。
【0097】
他の例として、映像符号化装置は、C(1)801及びC(2)802の解像度をC(3)803の解像度と同一の解像度に変換してもよい。そして、映像符号化装置は、C(3)803、解像度が変換されたC(1)801及びC(2)802の少なくとも1つを参照してC(3)803を視点間予測符号化してもよい。
【0098】
そして、映像符号化装置は、時間軸を基準としてC(3)803の以前映像を参照してC(3)803を符号化する。
【0099】
次に、映像符号化装置は、C(3)803と同一の方法によって、C(4)804を視点間予測符号化する。例えば、映像符号化装置は、C(1)801及びC(2)802の少なくとも1つの解像度をC(4)804と同一の解像度に変換してもよい。そして、映像符号化装置は、C(3)803、解像度が変換されたC(1)801及びC(2)802の少なくとも1つを参照してC(4)804を視点間予測符号化する。そして、映像符号化装置は、時間軸を基準としてC(4)804の以前映像を参照してC(4)804を符号化する。
【0100】
同様に、映像符号化装置は、空間軸を基準としてD(3)807及びD(4)808を視点間予測符号化する。
【0101】
一例として、映像符号化装置は、D(1)805及びD(2)806の少なくとも1つの解像度をD(3)807と同一の解像度に変換してもよい。そして、映像符号化装置は、D(4)808、解像度が変換されたD(1)805及びD(2)806の少なくとも1つを参照してD(3)807を視点間予測符号化する。そして、映像符号化装置は、時間軸を基準としてD(3)807の以前映像を参照してD(3)807を符号化してもよい。
【0102】
他の例として、映像符号化装置は、D(1)805及びD(2)806の少なくとも1つの解像度をD(4)808と同一の解像度に変換してもよい。そして、映像符号化装置は、D(3)807、解像度が変換されたD(1)805及びD(2)806の少なくとも1つを参照してD(4)808を視点間予測符号化してもよい。そして、映像符号化装置は、時間軸を基準としてD(4)808の以前映像を参照してD(4)808を符号化してもよい。
【0103】
図10は、映像符号化装置の細部構成を示すブロック図である。図10に示すように、映像符号化装置1000はレイヤ割当部1001及び符号化部1002を備える。
【0104】
まず、レイヤ割当部1001は、付加情報に基づいて入力映像をベースレイヤ、ステレオレイヤ、多視点エンハンスメントレイヤ、及び多視点拡張レイヤの少なくとも1つに割り当てる。ここで、付加情報は、解像度情報、符号化ビットストリームに含まれた視点映像の数を示す視点映像の個数情報、カメラパラメータ情報、及び映像モード情報の少なくとも1つを含んでもよい。
【0105】
一例として、入力映像が2D映像である場合、レイヤ割当部1001は2D映像をベースレイヤに割り当ててもよい。これによって、符号化部1002はH.264/AVC、HEVCなどのような映像符号化方法を用いてベースレイヤに割り当てられた2D映像を符号化して符号化ビットストリームを生成する。例えば、符号化部1002は空間軸を基準として2D映像を画面内予測符号化し、時間軸を基準として以前映像を参照して2D映像を符号化して符号化ビットストリームを生成する。
【0106】
ここで、符号化部1002は映像モード情報を2D映像モードに設定し、映像モード情報を含む付加情報を符号化ビットストリームに挿入して映像復号化装置に送信する。
【0107】
他の例として、入力映像がステレオ映像である場合、レイヤ割当部1001は2つの視点映像のいずれか1つを基準映像として決定し、基準映像を除いた残り1つの視点映像を隣接映像として決定してもよい。ここで、基準映像は、他の映像を参照することなく自身の映像情報だけで映像を復元できる映像を意味する。これによって、レイヤ割当部1001は基準映像をベースレイヤに割り当て、隣接映像をステレオレイヤに割り当ててもよい。ここで、ベースレイヤに割り当てられる視点映像とステレオレイヤに割り当てられる視点映像の解像度は同一であってもよい。
【0108】
これによって、符号化部1002は、ベースレイヤ及びステレオレイヤの順に階層的に符号化して符号化ビットストリームを生成する。例えば、符号化部1002は空間軸を基準として、ベースレイヤに割り当てられた基準映像を画面内予測符号化し、時間軸を基準として以前映像を参照して2D映像を符号化する。そして、符号化部1002は、空間軸を基準としてステレオレイヤに割り当てられた隣接映像と同一時間帯に位置する視点映像の基準映像を参照して隣接映像を視点間予測符号化する。ここで、符号化部1002は映像モード情報をステレオ映像モードに設定し、映像モード情報を含む付加情報を符号化ビットストリームに挿入して映像復号化装置に送信する。
【0109】
他の例として、入力映像が2つの視点映像及び深度映像を含む3D映像である場合、レイヤ割当部1001は2つの視点映像のいずれか1つを基準映像として決定し、基準映像を除いた残りの1つの視点映像を隣接映像として決定してもよい。これによって、レイヤ割当部1001は基準映像をベースレイヤに割り当て、隣接映像をステレオレイヤに割り当ててもよい。そして、レイヤ割当部1001は、基準映像に対応する深度映像と隣接映像に対応する深度映像を多視点エンハンスメントレイヤに割り当ててもよい。
【0110】
これによって、符号化部1002は、ベースレイヤ、ステレオレイヤ、及び多視点エンハンスメントレイヤの順に階層的に符号化して符号化ビットストリームを生成する。例えば、符号化部1002は、空間軸を基準として多視点エンハンスメントレイヤに割り当てられた基準映像の深度映像を画面内予測符号化し、時間軸を基準として以前映像を参照して基準映像の深度映像を符号化して多視点エンハンスメントレイヤストリームを生成する。ここで、ベースレイヤ及びステレオレイヤに割り当てられた視点映像を符号化する動作はステレオ映像を符号化する動作と同一であるため、繰り返しの説明は省略することにする。
【0111】
ここで、符号化部1002は映像モード情報を3D映像モードに設定し、映像モード情報を含む付加情報を符号化ビットストリームに挿入して映像復号化装置に送信する。
【0112】
他の例として、入力映像が3個以上の視点映像及び深度映像を含む3D映像である場合、レイヤ割当部1001は3個以上の視点映像のいずれか1つを基準映像として決定し、基準映像と隣接する映像のいずれか1つを隣接映像として決定してもよい。ここで、隣接映像と基準映像の解像度は同一であってもよい。これによって、レイヤ割当部1001は基準映像をベースレイヤに割り当て、隣接映像をステレオレイヤに割り当ててもよい。次に、レイヤ割当部1001は、基準映像に対応する深度映像と隣接映像に対応する深度映像を多視点エンハンスメントレイヤに割り当てる。そして、レイヤ割当部1001は、3個以上の視点映像及び深度映像のうち基準映像、隣接映像、基準映像の深度映像、及び隣接映像の深度映像を除いた視点映像と深度映像を多視点拡張レイヤに割り当ててもよい。
【0113】
これによって、符号化部1002は、ベースレイヤ、ステレオレイヤ、多視点エンハンスメントレイヤ、及び多視点拡張レイヤの順に階層的に符号化して符号化ビットストリームを生成する。
【0114】
例えば、符号化部1002は、空間軸を基準としてベースレイヤに割り当てられた基準映像及びステレオレイヤに割り当てられた隣接映像の少なくとも1つを参照して、多視点拡張レイヤに割り当てられた視点映像を視点間予測符号化する。そして、符号化部1002は、時間軸を基準として多視点拡張レイヤに割り当てられた視点映像の以前映像を参照して多視点拡張レイヤに割り当てられた視点映像を符号化する。同一の方法として、符号化部1002は、多視点エンハンスメントレイヤに割り当てられた基準映像の深度映像及び隣接映像の深度映像の少なくとも1つを参照して多視点拡張レイヤに割り当てられた視点映像の深度映像を視点間予測符号化する。
【0115】
ここで、多視点拡張レイヤに割り当てられた視点映像の解像度が基準映像及び隣接映像の解像度と異なる場合、符号化部1002は、基準映像及び隣接映像の少なくとも1つの解像度を多視点拡張レイヤに割り当てられた視点映像の解像度と同一になるよう変換してもよい。そして、符号化部1002は、解像度が変換された基準映像及び隣接映像の少なくとも1つを参照して多視点拡張レイヤに割り当てられた視点映像を視点間予測符号化する。
【0116】
同様に、多視点拡張レイヤに割り当てられた視点映像に対応する深度映像の解像度が基準映像の深度映像及び隣接映像の深度映像の解像度と異なる場合、符号化部1002は、基準映像の深度映像及び隣接映像の深度映像の少なくとも1つの解像度を多視点拡張レイヤに割り当てられた視点映像に対応する深度映像の解像度と同一になるように変換してもよい。そして、符号化部1002は、解像度が変換された基準映像の深度映像及び隣接映像の深度映像の少なくとも1つを参照して、多視点拡張レイヤに割り当てられた視点映像の深度映像を視点間予測符号化する。
【0117】
そして、符号化部1002は映像モード情報を3D映像モードに設定し、映像モード情報を含む付加情報を符号化ビットストリームに挿入して映像復号化装置に送信する。
【0118】
図10において、2D映像は色及びカラー情報を含む1つの視点映像(1view)を含み、ステレオ映像は色及びカラー情報を含む2つの視点映像(2view)を含み、3D映像は色及びカラー情報を含む3個以上の視点映像と各視点映像に対応する深度映像を含んでもよい。例えば、ステレオ映像は左映像及び右映像を含む両眼式映像を含み、3D画像は多視点画像を含んでもよい。
【0119】
図11は、統合された映像圧縮フォーマットに基づいて符号化ビットストリームを復号化する動作を説明するために提供されるフローチャートである。図11において、符号化ビットストリームを復号化する動作は図13に示す映像復号化装置によって行われる。
【0120】
まず、ステップS1101において、映像復号化装置は、映像符号化装置から階層的に符号化された符号化ビットストリームを受信する。ここで、符号化ビットストリームは、ベースレイヤストリーム、ステレオレイヤストリーム、多視点エンハンスメントレイヤストリーム、及び多視点拡張レイヤストリームを含んでもよい。
【0121】
次に、ステップS1102において、映像復号化装置は、付加情報に基づいて符号化ビットストリームを階層的に復号化する。ここで、付加情報は、解像度情報、視点映像の個数情報、カメラパラメータ情報、及び映像モード情報の少なくとも1つを含んでもよい。
【0122】
例えば、映像復号化装置は、映像モード情報が2D映像モードであるか、ステレオ映像モードであるか、または、3D映像モードと設定されたかに応じてベースレイヤストリーム、ステレオレイヤストリーム、多視点エンハンスメントレイヤストリーム、及び多視点拡張レイヤストリームの少なくとも1つを復号化する。
【0123】
図12は、映像モード情報により符号化ビットストリームを階層的に復号化する動作を説明するために提供されるフローチャートである。
【0124】
まず、ステップS1201において、映像モード情報が2D映像モードである場合、ステップS1202において、映像復号化装置は、符号化ビットストリームのうちベースレイヤストリームだけを復号化して2D映像を復元する。言い換えれば、映像復号化装置は、ベースレイヤストリーム、ステレオレイヤストリーム、多視点エンハンスメントレイヤストリーム、及び多視点拡張レイヤストリームを全て復号化する必要がなく、ベースレイヤストリームだけを復号化して残りのレイヤストリームを廃棄する。
【0125】
そして、ステップS1203において、映像モード情報がステレオ映像モードである場合、ステップS1204において、映像復号化装置は、ベースレイヤストリーム及びステレオレイヤストリームを復号化してステレオ映像を復元する。
【0126】
次に、ステップS1205において、映像モード情報が3D映像モードである場合、ステップS1206において、映像復号化装置は、各レイヤストリームを復号化して3D映像を復元する。
【0127】
一例として、2つの視点映像を符号化して生成された符号化ビットストリームを映像符号化装置から受信し、付加情報に含まれた映像モード情報が3D映像モードと設定された場合、映像復号化装置は、ベースレイヤストリーム及びステレオレイヤストリームを復号化して2つの視点映像を復元する。例えば、映像復号化装置は、基準映像及び隣接映像を復元してもよい。そして、映像復号化装置は、2つの視点映像の少なくとも1つを参照して2つの視点映像のそれぞれに対応する深度映像を生成する。例えば、映像復号化装置は、深度推定(Depth Estimation)又は視差推定(Disparity Estimation)アルゴリズムを用いて2つの深度映像を生成する。言い換えれば、映像復号化装置は、基準映像の深度映像及び隣接映像の深度映像を生成する。これによって、ステップS1207において、映像復号化装置は、生成された基準映像の深度映像、隣接映像の深度映像、復元された基準映像及び隣接映像を合成して多視点映像を生成する。
【0128】
他の例として、2つの視点映像及び深度映像を符号化して生成された符号化ビットストリームを映像符号化装置から受信し、付加情報に含まれた映像モード情報が3D映像モードと設定された場合、映像復号化装置は、ベースレイヤストリーム及びステレオレイヤストリームを復号化して2つの視点映像を復元し、多視点エンハンスメントレイヤストリームを復号化して2つの深度映像を復元する。言い換えれば、映像復号化装置は、基準映像、隣接映像、基準映像の深度映像及び隣接映像の深度映像を復元してもよい。そして、映像復号化装置は、基準映像及び隣接映像に基づいて内挿(Interpolation)又は外挿(extrapolation)を用いて1つ以上の仮想視点映像を生成する。ここで、映像復号化装置は、生成しようとする仮想視点映像の位置に基づいて内挿又は外挿を用いてもよい。例えば、生成しようとする仮想視点映像の位置が基準映像及び隣接映像の間である場合、映像復号化装置は内挿を用いて仮想視点映像を生成する。そして、生成しようとする仮想視点映像の位置が基準映像及び隣接映像の間ではない場合、映像復号化装置は、外挿を用いて仮想視点映像を生成する。
【0129】
同じ方法として、映像復号化装置は、復元された基準映像の深度映像及び隣接映像の深度映像に基づいて内挿又は外挿を用いて仮想視点映像に対応する深度映像を生成する。これによって、映像復号化装置は、復元された2つの視点映像及び深度映像、そして生成された1つ以上の仮想視点映像及び仮想視点映像に対応する深度映像を合成して多視点映像を生成する。
【0130】
他の例として、3個以上の視点映像及び深度映像を符号化して生成された符号化ビットストリームを映像符号化装置から受信し、付加情報に含まれた映像モード情報が3D映像モードと設定された場合、映像復号化装置は、ベースレイヤストリーム及びステレオレイヤストリームを復号化して2つの視点映像を復元し、多視点エンハンスメントレイヤストリームを復号化して2つの深度映像を復元してもよい。そして、映像復号化装置は、多視点拡張レイヤストリームを復号化して多視点拡張レイヤに割り当てられた1つ以上の視点映像及び深度映像を復元してもよい。これによって、映像復号化装置は、復元された3個以上の視点映像及び3個以上の深度映像を合成して多視点映像を生成する。
【0131】
他の例として、3個以上の視点映像及び深度映像を符号化して生成された符号化ビットストリームを映像符号化装置から受信し、付加情報に含まれた映像モード情報が3D映像モードと設定された場合、映像復号化装置は、ベースレイヤストリーム及びステレオレイヤストリームを復号化して2つの視点映像を復元し、多視点エンハンスメントレイヤストリームを復号化して2つの深度映像を復元してもよい。そして、映像復号化装置は、多視点拡張レイヤストリームを復号化して多視点拡張レイヤに割り当てられた視点映像及び深度映像を復元してもよい。これによって、映像復号化装置は、復元された3個以上の視点映像のうち少なくとも2以上に基づいて内挿又は外挿を用いて1つ以上の仮想視点映像を生成する。
【0132】
同じ方法として、映像復号化装置は、復元された3個の視点映像のそれぞれに対応する深度映像のうち少なくとも2以上に基づいて内挿又は外挿を用いて仮想視点映像に対応する深度映像を生成する。これによって、映像復号化装置は、復元された2つの視点映像及び深度映像、そして生成された1つ以上の仮想視点映像及び仮想視点映像に対応する深度映像を合成して多視点映像を生成する。
【0133】
図13は、映像復号化装置の詳細構成を示すブロック図である。図13に示すように、映像復号化装置1300は、ビットストリーム受信部1301、復号化部1302、深度映像生成部1303、及び視点映像合成部1304を備える。
【0134】
まず、ビットストリーム受信部1301は、映像符号化装置で階層的に符号化された符号化ビットストリームを受信する。ここで、符号化ビットストリームは、ベースレイヤストリーム、ステレオレイヤストリーム、多視点エンハンスメントレイヤストリーム、及び多視点拡張レイヤストリームを含んでもよい。
【0135】
これによって、復号化部1302は、符号化ビットストリームに挿入された付加情報に基づいて符号化ビットストリームを階層的に復号化する。ここで、付加情報は、解像度情報、視点映像の個数情報、カメラパラメータ情報、及び映像モード情報の少なくとも1つを含んでもよい。
【0136】
ここで、復号化部1302は、2D復号化部1305、ステレオ復号化部1306、及び3D復号化部1307を備える。
【0137】
まず、映像モード情報が2D映像モードである場合、2D復号化部1305はベースレイヤストリームを復号化して2D映像を復元する。例えば、2D復号化部1305は、H.264/AVC、HEVCなどのような映像復号化方法を用いてベースレイヤストリームを復号化してもよい。これによって、復元された2D映像は2D映像再生装置を介して再生する。
【0138】
そして、映像モード情報がステレオ映像モードである場合、ステレオ復号化部1306は、ベースレイヤストリーム及びステレオレイヤストリームを復号化してステレオ映像を復元する。ここで、ステレオ映像は2つの視点映像を含んでもよい。ここで、ステレオ映像は基準映像C1及び隣接映像C2を含んでもよい。例えば、ステレオ復号化部1306は、H.264/AVC、HEVCなどのような映像復号化方法を用いてベースレイヤストリーム及びステレオストリームを復号化する。これによって、復元されたステレオ映像は、両眼式再生装置などのステレオ映像再生装置を介して再生する。
【0139】
ここで、映像モード情報が3D映像モードである場合にも、ステレオ復号化部1306は、ベースレイヤストリーム及びステレオレイヤストリームを復号化してステレオ映像を復元する。これによって、深度映像生成部1303は、復元された基準映像及び隣接映像の少なくとも1つを参照して基準映像の深度映像及び隣接映像の深度映像を生成する。そして、視点映像合成部1304は、復元された基準映像、復元された隣接映像、生成された基準映像の深度映像、及び生成された隣接映像の深度映像を合成して多視点映像を生成する。これによって、生成された多視点映像はオートステレオスコピック(Auto−stereoscopic)再生装置を介して再生することができる。
【0140】
また、映像モード情報が3D映像モードである場合、3D復号化部1307は、ベースレイヤストリーム及びステレオレイヤストリームを復号化して基準映像及び隣接映像を復元し、多視点エンハンスメントレイヤストリームを復号化して基準映像の深度映像及び隣接映像の深度映像を復元する。これによって、視点映像合成部1304は、復元された基準映像及び隣接映像に基づいて内挿又は外挿を用いて1つ以上の仮想視点映像を生成する。そして、視点映像合成部1304は、復元された基準映像の深度映像及び隣接映像の深度映像に基づいて、内挿又は外挿を用いて仮想視点映像に対応する深度映像を生成する。次に、視点映像合成部1304は、基準映像、隣接映像、基準映像の深度映像、隣接映像の深度映像、仮想視点映像及び仮想視点映像の深度映像を合成して多視点映像を生成する。
【0141】
また、映像モード情報が3D映像モードである場合、3D復号化部1307は、ベースレイヤストリーム及びステレオレイヤストリームを復号化して基準映像及び隣接映像を復元し、多視点エンハンスメントレイヤストリームを復号化して基準映像の深度映像及び隣接映像の深度映像を復元する。そして、3D復号化部1307は、多視点拡張レイヤストリームを復号化して多視点拡張レイヤに割り当てられた視点映像及び視点映像に対応する深度映像を復元する。これによって、視点映像合成部1304は、基準映像、隣接映像、基準映像の深度映像、隣接映像の深度映像、多視点拡張レイヤに割り当てられた視点映像、及び視点映像の深度映像を合成して多視点映像を生成する。
【0142】
ここで、視点映像合成部1304は、基準映像、隣接映像及び多視点拡張レイヤに割り当てられた視点映像のうち少なくとも2以上に基づいて内挿又は外挿を用いて1つ以上の仮想視点映像を生成する。同じ方法によって、視点映像合成部1304は、基準映像の深度映像、隣接映像の深度映像及び多視点拡張レイヤに割り当てられた視点映像の深度映像のうち少なくとも2以上に基づいて内挿又は外挿を用いて仮想視点映像に対応する深度映像を生成する。そして、視点映像合成部1304は、基準映像、隣接映像、多視点拡張レイヤに割り当てられた視点映像、仮想視点映像、基準映像の深度映像、隣接映像の深度映像、多視点拡張レイヤに割り当てられた視点映像の深度映像、及び前記視点映像の深度映像を合成して多視点映像を生成する。
【0143】
一方、図12及び図13に示すように、映像復号化装置が解像度変換による映像を入力によって生成された符号化ビットストリームを映像符号化装置から受信した場合、映像復号化装置も復号化映像に対しても解像度変換を用いて元の入力解像度に復元することができる。
【0144】
一例として、映像符号化装置から、3個の視点映像及び深度映像を含む3D映像を符号化して生成された符号化ビットストリームを受信した場合、復号化部1302は、付加情報に含まれた解像度情報に基づいて復元された基準映像及び復元された隣接映像の少なくとも1つの解像度を変換する。例えば、復号化部1302は、復元された基準映像及び復元された隣接映像の少なくとも1つの解像度をダウンスケーリングしてもよい。これによって、復元された基準映像及び復元された隣接映像の少なくとも1つの解像度は、符号化の前に多視点拡張レイヤに割り当てられた視点映像の解像度と同一になるよう変換されてもよい。
【0145】
そして、復号化部1302は、解像度が変換された基準映像及び隣接映像の少なくとも1つを参照して多視点拡張レイヤに割り当てられた視点映像を復元する。同じ方法によって復号化部1302は、解像度が変換された基準映像の深度映像及び隣接映像の深度映像の少なくとも1つを参照して多視点拡張レイヤに割り当てられた視点映像の深度映像を復元する。
【0146】
他の例として、映像符号化装置は、解像度変換情報を符号化ビットストリームに挿入して映像復号化装置に送信する。ここで、解像度変換情報は、基準映像及び隣接映像の少なくとも1つをダウンスケーリングした比率、及び基準映像の深度映像及び隣接映像の深度映像の少なくとも1つをダウンスケーリングした比率の少なくとも1つを含んでもよい。
【0147】
これによって、復号化部1302は、解像度変換情報に基づいて復元された基準映像及び復元された隣接映像の少なくとも1つをダウンスケーリングして解像度を変換する。そして、復号化部1302は、解像度が変換された基準映像及び隣接映像の少なくとも1つを参照して多視点拡張レイヤに割り当てられた視点映像を復元する。同じ方法によって復号化部1302は、解像度変換情報に基づいて復元された基準映像の深度映像及び復元された隣接映像の深度映像の少なくとも1つをダウンスケーリングして解像度を変換する。そして、解像度が変換された基準映像の深度映像及び隣接映像の深度映像の少なくとも1つを参照して、多視点拡張レイヤに割り当てられた視点映像の深度映像を復元してもよい。
【0148】
以上で説明したように、映像符号化装置は、統合された映像圧縮フォーマットに基づいて入力映像を階層的に符号化して映像復号化装置に送信し、映像復号化装置は、符号化ビットストリームを付加情報に基づいて階層的に復号化して入力映像を復元することができる。言い換えれば、入力映像が2D映像、ステレオ映像、3D映像であるか否かに関係なく、映像符号化装置は入力映像を符号化し、映像復号化装置は符号化ビットストリームを復号化して2D映像、ステレオ映像、または、3D映像を復元する。これによって、従来の2D映像再生装置、ステレオ映像再生装置、及び3D映像再生装置の全てで本映像符号化及び復号化装置において符号化及び復号化によって復元された映像を再生することができる。
【0149】
本発明の実施形態に係る方法は、多様なコンピュータ手段を介して様々な処理を実行することができるプログラム命令の形態で実現され、コンピュータ読取可能な記録媒体に記録されてもよい。コンピュータ読取可能な媒体は、プログラム命令、データファイル、データ構造などのうちの1つ又はその組合せを含んでもよい。媒体に記録されるプログラム命令は、本発明の目的のために特別に設計されて構成されたものでもよく、コンピュータソフトウェア分野の技術を有する当業者にとって公知のものであり、使用可能なものであってもよい。コンピュータ読取可能な記録媒体の例としては、ハードディスク、フロッピー(登録商標)ディスク及び磁気テープのような磁気媒体、CD−ROM、DVDのような光記録媒体、光ディスクのような光磁気媒体、及びROM、RAM、フラッシュメモリなどのようなプログラム命令を保存して実行するように特別に構成されたハードウェア装置が含まれてもよい。プログラム命令の例としては、コンパイラによって生成されるようなマシンコードだけでなく、インタプリタなどを用いてコンピュータによって実行され得る高水準コードを含む。上述したハードウェア装置は、本発明の動作を行うために1つ以上のソフトウェアのレイヤで動作するように構成されてもよい。
【0150】
上述したように、本発明を限定された実施形態と図面によって説明したが、本発明は、上記の実施形態に限定されることなく、本発明が属する分野における通常の知識を有する者であれば、このような実施形態から多様な変更及び変形が可能である。
【0151】
したがって、本発明の範囲は、開示された実施の形態に限定されるものではなく、特許請求の範囲だけではなく特許請求の範囲と均等なものなどによって定められるものである。
【符号の説明】
【0152】
1000 映像符号化装置
1001 レイヤ割当部
1002 符号化部
1300 映像復号化装置
1301 ビットストリーム受信部
1302 復号化部
1303 深度映像生成部
1304 視点映像合成部
1305 2D復号化部
1306 ステレオ復号化部
1307 3D復号化部
【技術分野】
【0001】
本発明は、映像再生装置の種類に関係なく復元された映像を再生できるように2次元(2D)映像、ステレオ映像、及び3D映像を符号化及び復号化する技術に関する。
【背景技術】
【0002】
3D映像は2D映像とは異なって、ユーザに映像の深さを提供して現実感のある映像を提供する。一般に、3D映像システムは、立体画像よりも多い視点の映像を用いて3D映像を提供するシステムを意味する。言い換えれば、3D映像システムは、ステレオ映像より視点が多い多視点画像を再生するシステムのことを称する。
【0003】
3D映像システムは、複数の多視点カメラから受信された色映像、深度映像、及び付加情報を特定フォーマットに変換して格納する。ここで、3D映像システムは、2D画像、立体画像、及び3D画像を互いに異なる映像圧縮の技術で圧縮して映像再生装置に送信する。これによって、映像の種類に応じて圧縮フォーマットは互いに異なる。
【0004】
これによって、2D映像再生装置は2D映像のみを再生し、ステレオ映像及び3D映像は再生することができない。そして、偏光フィルタリング方式、液晶シャッタリング方式などの両眼式映像再生装置は両眼式立体映像のステレオ映像を再生することはできるものの、3D映像を再生することができない。
【0005】
したがって、映像の種類及び映像再生装置の種類に関係なく互換して映像を再生することのできる信号処理技術が必要である。言い換えれば、2D映像、ステレオ映像、3D映像を種類に関係なく共通に信号を処理することによって、従来の2D映像再生装置、両眼式映像再生装置、及び自動両眼式3D映像再生装置のいずれのものも復元映像を再生することのできる技術が要求される。
【発明の概要】
【発明が解決しようとする課題】
【0006】
本発明の目的は、映像の種類及び映像再生装置の種類に関係なく映像を再生することのできる映像符号化方法及び装置、並びに映像復号化方法及び装置を提供する。
【課題を解決するための手段】
【0007】
本映像符号化方法は、入力映像に含まれた少なくとも1つの視点映像をベースレイヤ、ステレオレイヤ、多視点エンハンスメントレイヤ、及び多視点拡張レイヤの少なくとも1つに割り当てるステップと、前記ベースレイヤ、ステレオレイヤ、多視点エンハンスメントレイヤ及び多視点拡張レイヤに割り当てられた映像を階層的に符号化するステップとを含む。
【0008】
また、前記符号化するステップは、前記ベースレイヤに割り当てられた基準映像を参照し、前記ステレオレイヤに割り当てられた隣接映像を視点間予測符号化し、前記隣接映像は前記基準映像と隣接する映像であってもよい。
【0009】
また、前記符号化するステップは、前記多視点エンハンスメントレイヤに割り当てられた基準映像の深度映像を画面内予測符号化するステップと、前記多視点エンハンスメントレイヤに割り当てられた隣接映像の深度映像を視点間予測符号化するステップとを含んでもよい。
【0010】
また、前記符号化するステップは、前記ベースレイヤに割り当てられた基準映像及び前記ステレオレイヤに割り当てられた隣接映像の少なくとも1つを参照して、前記多視点エンハンスメントレイヤに割り当てられた視点映像を視点間予測符号化してもよい。
【0011】
また、前記符号化するステップは、前記多視点エンハンスメントレイヤに割り当てられた基準映像の深度映像及び前記多視点エンハンスメントレイヤに割り当てられた隣接映像の深度映像の少なくとも1つを参照して、前記多視点拡張レイヤに割り当てられた視点映像の深度映像を視点間予測符号化してもよい。
【0012】
また、前記符号化するステップは、前記多視点拡張レイヤに割り当てられた視点映像の解像度に基づいて前記ベースレイヤに割り当てられた基準映像及び前記ステレオレイヤに割り当てられた隣接映像の少なくとも1つの解像度を変換するステップと、前記解像度が変換された基準映像及び隣接映像の少なくとも1つに基づいて前記多視点拡張レイヤに割り当てられた視点映像を符号化するステップとを含んでもよい。
【0013】
また、前記符号化するステップは、前記多視点拡張レイヤに割り当てられた視点映像の深度映像の解像度に基づいて前記多視点エンハンスメントレイヤに割り当てられた基準映像の深度映像及び隣接映像の深度映像の少なくとも1つの解像度を変換するステップと、前記解像度が変換された基準映像及び隣接映像の少なくとも1つに基づいて前記多視点拡張レイヤに割り当てられた視点映像を符号化するステップとを含んでもよい。
【0014】
また、前記ステレオレイヤに割り当てられた隣接映像は、前記ベースレイヤに割り当てられた基準映像と同じ解像度を有してもよい。
【0015】
また、前記多視点エンハンスメントレイヤに割り当てられた基準映像の深度映像は、基準映像の深度映像及び隣接映像の深度映像と同じ解像度又は異なる解像度を有してもよい。また、前記多視点エンハンスメントレイヤに割り当てられた隣接映像の深度映像は、基準映像及び隣接映像と同じ解像度又は異なる解像度を有してもよい。
【0016】
前記割り当てるステップは、1視点映像(1view)である基準映像を前記ベースレイヤに割り当てるステップと、前記基準映像と隣接し、2視点映像(2view)である隣接映像を前記ステレオレイヤに割り当てるステップと、前記基準映像の深度映像と隣接映像の深度映像を前記多視点エンハンスメントレイヤに割り当てるステップと、前記基準映像と隣接する映像のうち前記隣接映像を除いた残り隣接映像、及び前記残り隣接映像に対応する深度映像を前記多視点拡張レイヤに割り当てるステップとを含み、前記残り隣接映像は、第3視点以上の映像であってもよい。
【0017】
前記符号化するステップは、前記符号化によってベースレイヤストリーム、ステレオレイヤストリーム、多視点エンハンスメントレイヤストリーム、及び多視点拡張レイヤストリームを含む階層構造の符号化ビットストリームを生成してもよい。
【0018】
本映像符号化装置は、入力映像に含まれた少なくとも1つの視点映像をベースレイヤ、ステレオレイヤ、多視点エンハンスメントレイヤ、及び多視点拡張レイヤの少なくとも1つに割り当てるレイヤ割当部と、前記ベースレイヤ、ステレオレイヤ、多視点エンハンスメントレイヤ及び多視点拡張レイヤを階層的に符号化する符号化部とを備える。
【0019】
また、前記符号化部は、前記ベースレイヤに割り当てられた基準映像を参照し、前記ステレオレイヤに割り当てられた隣接映像を視点間予測符号化してもよい。
【0020】
また、前記符号化部は、前記多視点エンハンスメントレイヤに割り当てられた基準映像の深度映像を画面内予測符号化し、隣接映像の深度映像を視点間予測符号化してもよい。
【0021】
また、前記符号化部は、前記ベースレイヤに割り当てられた基準映像及び前記ステレオレイヤに割り当てられた隣接映像の少なくとも1つを参照して、前記多視点エンハンスメントレイヤに割り当てられた視点映像を視点間予測符号化してもよい。
【0022】
また、前記符号化部は、前記多視点エンハンスメントレイヤに割り当てられた基準映像の深度映像及び前記多視点エンハンスメントレイヤに割り当てられた隣接映像の深度映像の少なくとも1つを参照して、前記多視点拡張レイヤに割り当てられた視点映像の深度映像を視点間予測符号化してもよい。
【0023】
また、前記符号化部は、前記多視点拡張レイヤに割り当てられた視点映像の解像度に基づいて前記ベースレイヤに割り当てられた基準映像及び前記ステレオレイヤに割り当てられた隣接映像の少なくとも1つの解像度を変換し、解像度が変換された基準映像及び解像度が変換された隣接映像の少なくとも1つに基づいて前記多視点拡張レイヤに割り当てられた視点映像を符号化してもよい。
【0024】
また、前記符号化部は、前記多視点拡張レイヤに割り当てられた視点映像の深度映像の解像度に基づいて前記多視点エンハンスメントレイヤに割り当てられた基準映像の深度映像及び隣接映像の深度映像の少なくとも1つの解像度を変換し、前記解像度が変換された基準映像及び解像度が変換された隣接映像の少なくとも1つに基づいて前記多視点拡張レイヤに割り当てられた視点映像を符号化してもよい。
【0025】
本映像復号化方法は、ベースレイヤストリーム、ステレオレイヤストリーム、多視点エンハンスメントレイヤストリーム、及び多視点拡張レイヤストリームを含む符号化ビットストリームを受信するステップと、前記符号化ビットストリームを付加情報に基づいて階層的に復号化するステップとを含む。
【0026】
また、前記復号化するステップは、前記付加情報に基づいて前記ベースレイヤストリームを復号化して2D映像を復元してもよい。
【0027】
また、前記復号化するステップは、前記ベースレイヤストリーム及びステレオレイヤストリームを復号化して基準映像及び隣接映像を復元してもよい。
【0028】
また、前記復号化するステップは、前記基準映像及び隣接映像の少なくとも1つを参照し、基準映像の深度映像及び隣接映像の深度映像を生成するステップと、前記基準映像及び隣接映像を参照し、1つ以上の仮想視点映像を生成するステップと、前記基準映像の深度映像及び隣接映像の深度映像を参照し、前記仮想視点映像の深度映像を生成するステップと、前記基準映像、隣接映像、基準映像の深度映像、隣接映像の深度映像、仮想視点映像、及び仮想視点映像の深度映像を合成して多視点映像を生成するステップとを含んでもよい。
【0029】
また、前記復号化するステップは、前記多視点エンハンスメントレイヤストリームを復号化して基準映像の深度映像及び隣接映像の深度映像を復元するステップと、前記基準映像及び隣接映像を参照して1つ以上の仮想視点映像を生成するステップと、前記基準映像の深度映像及び隣接映像の深度映像を参照して前記仮想視点映像の深度映像を生成するステップと、前記基準映像、隣接映像、基準映像の深度映像、隣接映像の深度映像、仮想視点映像、及び仮想視点映像の深度映像を合成して多視点映像を生成するステップとを含んでもよい。
【0030】
また、前記復号化するステップは、前記多視点エンハンスメントレイヤストリームを復号化して基準映像の深度映像及び隣接映像の深度映像を復元するステップと、前記多視点拡張レイヤストリームを復号化して多視点拡張レイヤに割り当てられた1つ以上の視点映像及び視点映像の深度映像を復元するステップと、前記基準映像、隣接映像、基準映像の深度映像、隣接映像の深度映像、多視点拡張レイヤに割り当てられた視点映像及び多視点拡張レイヤに割り当てられた視点映像の深度映像を合成して多視点映像を生成するステップとを含んでもよい。
【0031】
本発明の映像復号化装置は、ベースレイヤストリーム、ステレオレイヤストリーム、多視点エンハンスメントレイヤストリーム、及び多視点拡張レイヤストリームを含む階層構造の符号化ビットストリームを受信するビットストリーム受信部と、前記符号化ビットストリームを付加情報に基づいて階層的に復号化する復号化部とを備える。
【0032】
また、前記復号化部は、前記付加情報に基づいて前記ベースレイヤストリームを復号化して2D映像を復元する2D復号化部を備えてもよい。
【0033】
また、前記復号化部は、前記符号化ビットストリームに含まれた付加情報がステレオ映像モードを含むことによって、前記ベースレイヤストリーム及びステレオレイヤストリームを復号化して基準映像及び隣接映像を復元するステレオ復号化部を備えてもよい。
【0034】
また、前記基準映像及び隣接映像の少なくとも1つを参照し、基準映像の深度映像及び隣接映像の深度映像を生成する深度映像生成部と、前記基準映像及び隣接映像を参照して1つ以上の仮想視点映像を生成し、前記基準映像の深度映像及び隣接映像の深度映像を参照して前記仮想視点映像の深度映像を生成し、前記基準映像、隣接映像、基準映像の深度映像、隣接映像の深度映像、仮想視点映像、及び仮想視点映像の深度映像を合成して多視点映像を復元する視点映像合成部をさらに備えてもよい。
【0035】
また、前記復号化部は、前記ベースレイヤストリーム及びステレオレイヤストリームを復号化して基準映像及び隣接映像を復元し、前記多視点エンハンスメントレイヤストリームを復号化して基準映像の深度映像及び隣接映像の深度映像を復元する3D復号化部を備えてもよい。
【0036】
このとき、前記基準映像及び隣接映像を参照して1つ以上の仮想視点映像を生成し、前記基準映像の深度映像及び隣接映像の深度映像を参照して前記仮想視点映像の深度映像を生成し、前記基準映像、隣接映像、基準映像の深度映像、隣接映像の深度映像、仮想視点映像、及び仮想視点映像の深度映像を合成して多視点映像を復元する視点映像合成部をさらに備えてもよい。
【0037】
また、前記復号化部は、前記符号化ビットストリームに含まれた付加情報が多視点映像モードを含むことによって、前記ベースレイヤストリーム及びステレオレイヤストリームを復号化して基準映像及び隣接映像を復元し、前記多視点エンハンスメントレイヤストリームを復号化して基準映像の深度映像及び隣接映像の深度映像を復元し、前記多視点拡張レイヤストリームを復号化して多視点拡張レイヤに割り当てられた1つ以上の視点映像及び視点映像の深度映像を復元する3D復号化部を備えてもよい。
【0038】
ここで、前記基準映像、隣接映像、基準映像の深度映像、隣接映像の深度映像、1つ以上の視点映像及び視点映像の深度映像を合成して多視点映像を生成する視点映像合成部をさらに備えてもよい。
【発明の効果】
【0039】
本発明の一実施形態によれば、入力映像を階層的に符号化及び復号化することによって映像の種類及び映像再生装置の種類に関係なく統合された映像圧縮フォーマットを提供することができる。
【0040】
本発明の一実施形態によれば、映像の種類に関係なく統合された映像圧縮フォーマットを提供することによって、従来の2D映像再生装置及びステレオ映像再生装置でも多視点映像のうち選択された視点の2D映像を再生する互換性を提供することができる。
【図面の簡単な説明】
【0041】
【図1】本映像処理システムの全般的な構成を示す図である。
【図2】統合された映像圧縮フォーマットに基づいて入力映像を階層的に符号化する動作を説明するために提供されるフローチャートである。
【図3】統合された映像圧縮フォーマットを示す図である。
【図4】3個の視点映像を各レイヤに割り当てて形成された統合された映像圧縮フォーマットを示す図である。
【図5】階層的符号化によって生成された符号化ビットストリームの構造を示す図である。
【図6】各レイヤに割り当てられた映像を階層的に符号化する動作を説明するために提供されるフローチャートである。
【図7】3個の視点映像及び深度映像を含む3D映像を階層的に符号化する過程を説明するために提供される図である。
【図8】4個の視点映像及び深度映像を含む3D映像を各階層に割り当てた構成を示す図である。
【図9】解像度変換を用いて3D映像を階層的に符号化する過程を説明するために提供される図である。
【図10】映像符号化装置の詳細構成を示すブロック図である。
【図11】統合された映像圧縮フォーマットに基づいて符号化ビットストリームを復号化する動作を説明するために提供されるフローチャートである。
【図12】映像モード情報によって符号化ビットストリームを階層的に復号化する動作を説明するために提供されるフローチャートである。
【図13】映像復号化装置の詳細構成を示すブロック図である。
【発明を実施するための形態】
【0042】
以下、本発明の実施形態を添付する図面を参照しながら詳細に説明する。
【0043】
図1は、本映像処理システムの全般的な構成を示す図である。図1に示すように、映像処理システム100は、映像生成装置101、映像符号化装置102、映像復号化装置103及び映像再生装置104を備える。例えば、映像再生装置は2D映像再生装置、ステレオ映像再生装置、及び3D映像再生装置を備える。
【0044】
まず、映像生成装置101は、複数のカメラ105を用いて撮影された視点映像、深度映像、及び付加情報に基づいて入力映像を生成する。ここで、入力映像は、2D映像、両眼式映像であるステレオ映像、または、多視点映像である3D映像を含んでもよい。ここで、カメラは、多視点カメラ、可視帯域カメラ、赤外線カメラ、及び深度カメラの少なくとも1つを含んでもよい。
【0045】
映像符号化装置102は、入力映像に含まれた2D映像、ステレオ映像、または、3D映像を階層的に符号化して符号化ビットストリームを生成する。そして、映像符号化装置102は、符号化ビットストリームを映像復号化装置103に送信する。これによって、映像復号化装置103は、符号化ビットストリームを階層的に復号化して2D映像、ステレオ映像、又は3D映像を復元する。映像再生装置104は、復元された映像を再生する。ここで、映像再生装置は2D映像再生装置であってもよく、ステレオ映像再生装置であってもよく、3D映像再生装置であってもよい。言い換えれば、映像再生装置104は、映像再生装置の種類及び映像の種類に関係なく復元された映像を再生することができる。
【0046】
以下は、映像再生装置の種類及び映像の種類に関係なく復元された映像を再生できるように統合された映像圧縮フォーマットを提供し、統合された映像圧縮フォーマットを用いて入力映像を符号化及び復号化する過程について詳細に説明することにする。
【0047】
図2は、統合された映像圧縮フォーマットに基づいて入力映像を階層的に符号化する動作を説明するために提供されるフローチャートである。図2に示すように、符号化動作は図10の映像符号化装置1000によって行われる。
【0048】
まず、ステップS201において、映像符号化装置は付加情報に基づいて入力映像を各レイヤに割り当てる。
【0049】
ここで、付加情報は、解像度情報、符号化ビットストリームに含まれた視点映像の個数を示す視点映像の個数情報、カメラパラメータ情報、及び映像モード情報の少なくとも1つを含んでもよい。例えば、解像度情報は、視点映像の解像度情報及び深度映像の解像度情報の少なくとも1つを含み、カメラパラメータ情報は視点映像の3次元位置座標を含み、映像モード情報は、入力映像が2D映像、ステレオ映像、及び3D映像のいずれか1つであるかを示すモード情報を含んでもよい。
【0050】
ここで、映像符号化装置は、入力映像をベースレイヤ(Base Layer)、ステレオレイヤ(Stereo Layer)、多視点エンハンスメントレイヤ(Multi−view Enhancement Layer)、及び多視点拡張レイヤ(Multi−view Extension Layer)の少なくとも1つに割り当てる。ここで、入力映像は2D映像、ステレオ映像、または3D映像を含んでもよい。
【0051】
ここで、2D映像は色及びカラー情報を含む1つの視点映像(1view)を含み、ステレオ映像は色及びカラー情報を含む2つの視点映像(2view)を含み、3D映像は色及びカラー情報を含む3個以上の視点映像と各視点映像に対応する深度映像を含む。例えば、ステレオ映像は、左映像及び右映像を含む両眼式映像を含み、3D画像は多視点画像を含む。
【0052】
次に、ステップS202において、映像符号化装置は、各レイヤに割り当てられた映像を階層的に符号化して符号化ビットストリームを生成する。そして、映像符号化装置は、符号化ビットストリームを映像復号化装置に送信する。ここで、映像符号化装置は、付加情報に基づいて入力映像が2D映像、ステレオ映像、または3D映像であるか否かに応じてベースレイヤ、ステレオレイヤ、多視点エンハンスメントレイヤ、及び多視点拡張レイヤの順に階層的に符号化する。
【0053】
一例として、入力映像が2D映像である場合、映像符号化装置は、2D映像をベースレイヤに割り当ててもよい。言い換えれば、2D映像は1つの視点映像を含むため、映像符号化装置は1つの視点映像をベースレイヤに割り当て、ベースレイヤに割り当てられた視点映像を符号化して符号化ビットストリームを生成する。
【0054】
ここで、映像符号化装置は、入力映像が2D映像であるため映像モード情報を2D映像モードに設定する。そして、映像符号化装置は、映像モード情報を含む付加情報を符号化ビットストリームに挿入して映像復号化装置に送信する。
【0055】
他の例として、入力映像がステレオ映像である場合、映像符号化装置は、ステレオ映像のうち基準映像をベースレイヤに割り当て、基準映像を除いた異なる1つの隣接映像をステレオレイヤに割り当てる。そして、映像符号化装置は、ベースレイヤ及びステレオレイヤに割り当てられた視点映像を符号化して符号化ビットストリームを生成する。ここで、基準映像とは、他の視点映像を参照することなく、自身の映像情報だけで映像を復元できる映像を意味する。
【0056】
ここで、映像符号化装置は、入力映像がステレオ映像であるため映像モード情報をステレオ映像モードに設定してもよい。そして、映像符号化装置は、映像モード情報を含む付加情報を符号化ビットストリームに挿入して映像復号化装置に送信する。ここで、入力映像がステレオ映像である場合、付加情報は、カメラパラメータ情報、解像度情報、及び視点映像の個数情報をさらに含んでもよい。例えば、ステレオ映像は2つの視点映像を含むため、視点映像の個数情報は2である。
【0057】
他の例として、入力映像が2つの視点映像及び深度映像を含む3D映像である場合、映像符号化装置は、2つの視点映像のうち基準映像をベースレイヤに割り当て、隣接映像をステレオレイヤに割り当てる。そして、映像符号化装置は、基準映像に対応する深度映像と隣接映像に対応する深度映像を多視点エンハンスメントレイヤに割り当てる。次に、映像符号化装置は、ベースレイヤ、ステレオレイヤ、及び多視点エンハンスメントレイヤの順に各レイヤに割り当てられた映像を符号化して符号化ビットストリームを生成する。
【0058】
ここで、映像符号化装置は、入力映像が3D映像であるため映像モード情報を3D映像モードに設定してもよい。そして、映像符号化装置は、映像モード情報を含む付加情報を符号化ビットストリームに挿入して映像復号化装置に送信する。ここで、入力映像が3D映像である場合、付加情報は、カメラパラメータ情報、解像度情報、及び視点映像の個数情報をさらに含んでもよい。例えば、3D映像が2つの視点映像及び深度映像を含む場合、視点映像の個数情報は2である。
【0059】
他の例として、映像符号化装置は、入力映像が3個以上の視点映像及び深度映像を含む3D映像である場合、映像符号化装置は、3個の視点映像のうち基準映像をベースレイヤに割り当て、基準映像と隣接するいずれか1つの隣接映像をステレオレイヤに割り当てる。そして、映像符号化装置は、基準映像に対応する深度映像と隣接映像に対応する深度映像を多視点エンハンスメントレイヤに割り当てる。次に、映像符号化装置は、3個以上の視点映像のうち基準映像及び隣接映像を除いた残りの視点映像と、残りの視点映像に対応する深度映像を多視点拡張レイヤに割り当てる。そして、映像符号化装置は、ベースレイヤ、ステレオレイヤ、多視点エンハンスメントレイヤ、及び多視点拡張レイヤの順に各レイヤに割り当てられた映像を符号化して符号化ビットストリームを生成する。
【0060】
ここで、映像符号化装置は、入力映像が3D映像であるため映像モード情報を3D映像モードに設定してもよい。そして、映像符号化装置は、映像モード情報を含む付加情報を符号化ビットストリームに挿入して映像復号化装置に送信する。ここで、入力映像が3D映像である場合、付加情報は、カメラパラメータ情報、解像度情報、及び視点映像の個数情報をさらに含んでもよい。例えば、3D映像が3個以上の視点映像及び深度映像を含む場合、視点映像の個数情報は3以上である。
【0061】
図3は、統合された映像圧縮フォーマットを示す図である。図3を参照すると、統合された映像圧縮フォーマットはベースレイヤ(Base Layer)301、ステレオレイヤ(Stereo Layer)302、多視点エンハンスメントレイヤ(Multi−view Enhancement Layer)303、及び多視点拡張レイヤ(Multi−view Extension Layer)304を含む。そして、映像符号化装置は、付加情報に基づいて入力映像を各レイヤに割り当てる。
【0062】
図3に示すように、ベースレイヤ301は、入力映像の符号化において基準となる映像が位置するレイヤである。そして、ステレオレイヤ302は、基準映像と隣接する1つ以上の視点映像のいずれか1つの隣接映像が位置するレイヤである。例えば、ベースレイヤ301にステレオ映像の左映像が位置する場合、ステレオレイヤ302には右映像が位置する。反対に、ベースレイヤ301にステレオ映像の右映像が位置する場合、ステレオレイヤ302には左映像が位置する。
【0063】
次に、多視点エンハンスメントレイヤ303は、基準映像に対応する深度映像及び隣接映像に対応する深度映像が位置するレイヤである。そして、入力映像が3個以上の視点映像を含む多視点映像である場合、多視点拡張レイヤ304はベースレイヤ301及びステレオレイヤ302に位置する視点映像を除いた残りの視点映像及び残りの視点映像に対応する深度映像が位置する。
【0064】
一例として、図4を参考して説明すると、入力映像が3個の視点映像及び深度映像を含む3D映像である場合、映像符号化装置は、3個の視点映像のいずれか1つを基準映像として決定してもよい。ここで、基準映像は、他の視点映像を参照することなく自身の映像情報だけで映像を復元することのできる映像を意味する。例えば、3個の視点映像C(1)401、C(2)402及びC(3)405のうち、C(1)401が画面内の予測によって復元可能な場合、映像符号化装置は、C(1)401を基準映像として決定する。ここで、基準映像はキーフレーム(Key Frame)として表してもよい。
【0065】
次に、映像符号化装置は、基準映像と隣接する1つ以上の視点映像のいずれか1つを隣接映像として決定する。言い換えれば、図4を参考すると、映像符号化装置は、視点映像C(2)402を隣接映像として決定してもよい。ここで、隣接映像は、基準映像と解像度が同一であってもよい。例えば、映像符号化装置は、基準映像と隣接する1つ以上の視点映像のうち基準映像と同一の解像度を有するいずれか1つの視点映像を隣接映像として決定してもよい。
【0066】
これによって、映像符号化装置は、基準映像に決定された視点映像C(1)401をベースレイヤ407に割り当て、隣接映像として決定された視点映像C(2)402をステレオレイヤ408に割り当てる。そして、映像符号化装置は、基準映像に対応する深度映像D(1)403と隣接映像に対応する深度映像D(2)404を多視点エンハンスメントレイヤ409に割り当ててもよい。次に、映像符号化装置は、3個の視点映像のうち基準映像であるC(1)401及び隣接映像であるC(2)402を除いた残りの視点映像C(3)405と視点映像C(3)405に対応する深度映像D(3)406を多視点拡張レイヤ410に割り当ててもよい。
【0067】
他の例として、再び図3を参考すると、入力映像が4個である視点映像及び深度映像を含む3D映像である合、映像符号化装置は、基準映像として決定された視点映像C(1)307をベースレイヤ305に割り当て、隣接映像として決定された視点映像C(2)309をステレオレイヤ308に割り当てる。ここで、ステレオレイヤ308に割り当てられた視点映像C(2)309の解像度はベースレイヤ305に割り当てられた視点映像C(1)307の解像度と同一であってもよい。そして、映像符号化装置は、視点映像C(1)307に対応する深度映像D(1)311及び視点映像C(2)309に対応する深度映像D(2)312を多視点エンハンスメントレイヤ310に割り当てる。次に、映像符号化装置は、4個の視点映像のうち基準映像であるC(1)307及び隣接映像であるC(2)309を除いた残りの視点映像C(3)314及びC(4)315、C(3)314に対応する深度映像D(3)316及びC(4)315に対応する深度映像D(4)317を多視点拡張レイヤ313に割り当てる。ここで、多視点拡張レイヤ313に割り当てられた視点映像C(3)314及びC(4)315それぞれの解像度は基準映像及び隣接映像の解像度と同一であってもよく、互いに異なってもよい。同様に、多視点拡張レイヤ313に割り当てられた深度映像D(3)316及びD(4)317それぞれの解像度は基準映像及び隣接映像の解像度と同一であってもよく、互いに異なってもよい。例えば、多視点拡張レイヤ313に割り当てられた視点映像C(3)314、C(4)315、深度映像D(3)316、D(4)317それぞれの解像度は基準映像及び隣接映像の解像度よりも小さいか同一であってもよい。
【0068】
図5は、階層的符号化によって生成された符号化ビットストリームの構造を示す図である。図5に示すように、符号化ビットストリームは、ベースレイヤストリーム501、ステレオレイヤストリーム502、多視点エンハンスメントレイヤストリーム503、多視点拡張レイヤストリーム504を含む。ここで、ベースレイヤストリーム501は基準映像を符号化したストリーム、ステレオレイヤストリーム502は隣接映像を符号化したストリーム、多視点エンハンスメントレイヤストリーム503は基準映像に対応する深度映像及び隣接映像に対応する深度映像を符号化したストリーム、多視点拡張レイヤストリーム504は入力映像に含まれた視点映像のうち基準映像及び隣接映像を除外した残りの視点映像と残りの視点映像に対応する深度映像を符号化したストリームである。
【0069】
例えば、入力映像が4個の視点映像C1〜C4及び深度映像D1〜D4を含む3D映像である場合、ベースレイヤストリーム501は符号化された視点映像C1を含み、ステレオレイヤストリーム502は符号化された視点映像C2を含み、多視点エンハンスメントレイヤストリーム503は符号化された深度映像D1、D2を含み、多視点拡張レイヤストリーム504は符号化された視点映像C3、C4、及び深度映像D3、D4を含んでもよい。
【0070】
以下は、統合された映像圧縮フォーマットの各レイヤに割り当てられた視点映像及び深度映像の少なくとも1つを階層的に符号化する過程について詳細に説明することにする。
【0071】
図6は、各レイヤに割り当てられた映像を階層的に符号化する動作を説明するために提供されるフローチャートである。図6において、符号化動作は図10に示す映像符号化装置1000によって行われる。ここで、図6において図4に示すように入力映像が3個の視点映像及び深度映像を含む3D映像である場合に各レイヤに割り当てられた映像を階層的に符号化する動作について説明することにする。
【0072】
まず、ステップS601において、映像符号化装置は、ベースレイヤに割り当てられた基準映像を符号化する。ここで、映像符号化装置は、空間軸を基準として基準映像を画面内予測符号化する。そして、映像符号化装置は、時間軸を基準として基準映像を以前映像の少なくとも1つを参照して符号化する。ここで、以前映像は、現在の時間を基準として基準映像と時系列的に以前に位置する映像を意味する。
【0073】
次に、ステップS602において、映像符号化装置は、ステレオレイヤに割り当てられた隣接映像を符号化する。ここで、隣接映像の解像度は基準映像の解像度と同一であり、隣接映像は基準映像と隣接する映像のいずれか1つであってもよい。
【0074】
ここで、映像符号化装置は、空間軸を基準としてベースレイヤに割り当てられた基準映像を参照して隣接映像を視点間予測符号化する。ここで、視点間予測符号化は画面間予測符号化に表してもよい。そして、映像符号化装置は、時間軸を基準として隣接映像の以前映像の少なくとも1つを参照して隣接映像を符号化する。
【0075】
そして、ステップS603において、映像符号化装置は、多視点エンハンスメントレイヤに割り当てられた深度映像を符号化する。ここで、映像符号化装置は、空間軸を基準として基準映像に対応する深度映像を画面内予測符号化してもよい。そして、映像符号化装置は、空間軸を基準として隣接映像に対応する深度映像と同一の時間帯に位置する深度映像である基準映像の深度映像を参照して隣接映像に対応する深度映像を符号化する。そして、映像符号化装置は、時間軸を基準として基準映像に対応する深度映像の以前映像を参照して基準映像に対応する深度映像を符号化し、隣接映像に対応する深度映像の以前映像を参照して以前映像に対応する深度映像を符号化する。
【0076】
次に、ステップS604において、映像符号化装置は、多視点拡張レイヤに割り当てられた視点映像及び深度映像を符号化する。
【0077】
ここで、映像符号化装置は、空間軸を基準として多視点拡張レイヤに割り当てられた視点映像と同一の時間帯に位置する少なくとも1つの視点映像を参照して視点間予測符号化する。そして、映像符号化装置は、時間軸を基準として多視点拡張レイヤに割り当てられた視点映像の以前映像を参照して多視点拡張レイヤに割り当てられた視点映像を符号化する。次に、映像符号化装置は、空間軸を基準として多視点拡張レイヤに割り当てられた深度映像と同一の時間帯に位置する少なくとも1つの深度映像を参照して視点間予測符号化する。そして、映像符号化装置は、時間軸を基準として多視点拡張レイヤに割り当てられた深度映像の隣接映像を参照して多視点拡張レイヤに割り当てられた深度映像を符号化する。
【0078】
そして、ステップS605において、映像符号化装置は符号化ビットストリームを映像復号化装置に送信する。
【0079】
例えば、映像符号化装置は、ステップS601からステップS603において、ベースレイヤ、ステレオレイヤ、多視点エンハンスメントレイヤ、及び多視点拡張レイヤそれぞれに割り当てられた映像を階層的に符号化して符号化ビットストリームを生成する。そして、映像符号化装置は、符号化ビットストリームを映像復号化装置に送信する。
【0080】
図7は、3個の視点映像及び深度映像を含む3D映像を階層的に符号化する過程を説明するために提供される図である。図7を参照すると、3個の視点映像のうちC(1)701が基準映像と決定された場合、映像符号化装置は、空間軸を基準としてベースレイヤに割り当てられた基準映像C(1)701を画面内予測符号化し、時間軸を基準としてC(1)701の以前映像を参照してC(1)701を符号化する。
【0081】
次に、基準映像C(1)701と隣接する視点映像C(2)702及びC(3)703のうち、C(2)702が隣接映像に決定されてステレオレイヤに割り当てられた場合、映像符号化装置は、空間軸を基準として隣接映像C(2)702と同一時間帯に位置する少なくとも1つの視点映像を参照してC(2)702を視点間予測符号化する。そして、映像符号化装置は、時間軸を基準として隣接映像C(2)702の以前映像を参照してC(2)702を符号化する。
【0082】
例えば、映像符号化装置は、空間軸を基準としてC(1)701を参照してC(2)702を符号化する。また、映像符号化装置は、空間軸を基準としてC(3)703を参照してC(2)702を符号化する。また、映像符号化装置は、空間軸を基準としてC(1)701及びC(3)703を参照してC(2)702を符号化する。
【0083】
そして、映像符号化装置は、空間軸を基準として多視点エンハンスメントレイヤに割り当てられたC(1)701の深度映像D(1)704を画面内予測符号化する。次に、映像符号化装置は、時間軸を基準として深度映像D(1)704の以前映像を参照してD(1)704を符号化する。そして、映像符号化装置は、空間軸を基準としてD(1)704及びD(3)706の少なくとも1つを参照してC(2)702の深度映像D(2)705を視点間予測符号化する。次に、映像符号化装置は、時間軸を基準としてD(2)705の以前映像を参照してD(2)705を符号化する。
【0084】
そして、映像符号化装置は、C(2)705と同一の方式によって多視点拡張レイヤに割り当てられたC(3)703及びD(3)706を符号化する。
【0085】
例えば、映像符号化装置は、空間軸を基準としてC(1)701及びC(2)702の少なくとも1つを参照してC(3)703を視点間予測符号化する。そして、映像符号化装置は、時間軸を基準としてC(3)703の以前映像を参照してC(3)703を符号化する。次に、映像符号化装置は、空間軸を基準としてD(1)704及びD(2)705の少なくとも1つを参照してD(3)706を視点間予測符号化する。そして、映像符号化装置は、時間軸を基準としてD(3)706の以前映像を参照してD(3)706を符号化する。
【0086】
図8は、4個の視点映像及び深度映像を含む3D映像を各階層に割り当てた構成を示す図である。
【0087】
そして、図9は、解像度変換を用いて3D映像を階層的に符号化する過程を説明するために提供される図である。
【0088】
図8及び図9において、入力映像は4個の視点映像及び深度映像を含む3D映像であってもよい。図8及び図9を参照すると、4個の視点映像のうちC(1)801が基準映像と決定された場合、映像符号化装置は、空間軸を基準としてベースレイヤに割り当てられた基準映像C(1)801を画面内予測符号化し、時間軸を基準としてC(1)801の以前映像を参照してC(1)801を符号化する。
【0089】
次に、基準映像C(1)801と隣接する視点映像C(2)802、C(3)803、及びC(4)804のうちC(2)802が隣接映像と決定されてステレオレイヤに割り当てられた場合、映像符号化装置は、空間軸を基準として隣接映像C(2)802と同一時間帯に位置する少なくとも1つの視点映像を参照してC(2)802を視点間予測符号化する。例えば、映像符号化装置は、空間軸を基準としてC(1)801、C(2)802、及びC(3)803の少なくとも1つを参照してC(2)802を符号化する。
【0090】
そして、映像符号化装置は、時間軸を基準として隣接映像C(2)802の以前映像を参照してC(2)802を符号化する。ここで、C(2)802とC(1)801の解像度は同一であり、C(3)803又はC(4)804の解像度はC(2)802及びC(1)801の解像度と同一であってもよく、互いに異なってもよい。
【0091】
次に、映像符号化装置は、空間軸を基準として多視点エンハンスメントレイヤに割り当てられたC(1)801の深度映像D(1)805を画面内予測符号化する。次に、映像符号化装置は、時間軸を基準として深度映像D(1)805の以前映像を参照してD(1)805を符号化する。そして、映像符号化装置は、空間軸を基準としてD(1)805を参照してC(2)802の深度映像D(2)806を視点間予測符号化する。次に、映像符号化装置は、時間軸を基準としてD(2)806の以前映像を参照してD(2)806を符号化する。
【0092】
そして、映像符号化装置は、多視点拡張レイヤに割り当てられたC(3)803、C(4)804、D(3)807、及びD(4)808を符号化する。
【0093】
ここで、C(3)803、C(4)804の解像度がC(1)801、C(2)802の解像度の未満である場合、映像符号化装置は、空間軸を基準としてC(1)801及びC(2)802の少なくとも1つの解像度を変換する。
【0094】
一例として、映像符号化装置は、C(1)801をダウンスケーリングしてC(1)801の解像度をC(3)803の解像度と同一の解像度に変換してもよい。そして、映像符号化装置は、解像度が変換されたC(1)801を参照してC(3)803を視点間予測符号化してもよい。
【0095】
他の例として、映像符号化装置は、C(2)802の解像度をC(3)803の解像度と同一の解像度に変換してもよい。そして、映像符号化装置は、解像度が変換されたC(2)802を参照してC(3)803を視点間予測符号化してもよい。
【0096】
他の例として、映像符号化装置は、C(1)801及びC(2)802の解像度をC(3)803の解像度と同一の解像度に変換してもよい。そして、映像符号化装置は、解像度が変換されたC(1)801及びC(2)802を参照してC(3)803を視点間予測符号化してもよい。
【0097】
他の例として、映像符号化装置は、C(1)801及びC(2)802の解像度をC(3)803の解像度と同一の解像度に変換してもよい。そして、映像符号化装置は、C(3)803、解像度が変換されたC(1)801及びC(2)802の少なくとも1つを参照してC(3)803を視点間予測符号化してもよい。
【0098】
そして、映像符号化装置は、時間軸を基準としてC(3)803の以前映像を参照してC(3)803を符号化する。
【0099】
次に、映像符号化装置は、C(3)803と同一の方法によって、C(4)804を視点間予測符号化する。例えば、映像符号化装置は、C(1)801及びC(2)802の少なくとも1つの解像度をC(4)804と同一の解像度に変換してもよい。そして、映像符号化装置は、C(3)803、解像度が変換されたC(1)801及びC(2)802の少なくとも1つを参照してC(4)804を視点間予測符号化する。そして、映像符号化装置は、時間軸を基準としてC(4)804の以前映像を参照してC(4)804を符号化する。
【0100】
同様に、映像符号化装置は、空間軸を基準としてD(3)807及びD(4)808を視点間予測符号化する。
【0101】
一例として、映像符号化装置は、D(1)805及びD(2)806の少なくとも1つの解像度をD(3)807と同一の解像度に変換してもよい。そして、映像符号化装置は、D(4)808、解像度が変換されたD(1)805及びD(2)806の少なくとも1つを参照してD(3)807を視点間予測符号化する。そして、映像符号化装置は、時間軸を基準としてD(3)807の以前映像を参照してD(3)807を符号化してもよい。
【0102】
他の例として、映像符号化装置は、D(1)805及びD(2)806の少なくとも1つの解像度をD(4)808と同一の解像度に変換してもよい。そして、映像符号化装置は、D(3)807、解像度が変換されたD(1)805及びD(2)806の少なくとも1つを参照してD(4)808を視点間予測符号化してもよい。そして、映像符号化装置は、時間軸を基準としてD(4)808の以前映像を参照してD(4)808を符号化してもよい。
【0103】
図10は、映像符号化装置の細部構成を示すブロック図である。図10に示すように、映像符号化装置1000はレイヤ割当部1001及び符号化部1002を備える。
【0104】
まず、レイヤ割当部1001は、付加情報に基づいて入力映像をベースレイヤ、ステレオレイヤ、多視点エンハンスメントレイヤ、及び多視点拡張レイヤの少なくとも1つに割り当てる。ここで、付加情報は、解像度情報、符号化ビットストリームに含まれた視点映像の数を示す視点映像の個数情報、カメラパラメータ情報、及び映像モード情報の少なくとも1つを含んでもよい。
【0105】
一例として、入力映像が2D映像である場合、レイヤ割当部1001は2D映像をベースレイヤに割り当ててもよい。これによって、符号化部1002はH.264/AVC、HEVCなどのような映像符号化方法を用いてベースレイヤに割り当てられた2D映像を符号化して符号化ビットストリームを生成する。例えば、符号化部1002は空間軸を基準として2D映像を画面内予測符号化し、時間軸を基準として以前映像を参照して2D映像を符号化して符号化ビットストリームを生成する。
【0106】
ここで、符号化部1002は映像モード情報を2D映像モードに設定し、映像モード情報を含む付加情報を符号化ビットストリームに挿入して映像復号化装置に送信する。
【0107】
他の例として、入力映像がステレオ映像である場合、レイヤ割当部1001は2つの視点映像のいずれか1つを基準映像として決定し、基準映像を除いた残り1つの視点映像を隣接映像として決定してもよい。ここで、基準映像は、他の映像を参照することなく自身の映像情報だけで映像を復元できる映像を意味する。これによって、レイヤ割当部1001は基準映像をベースレイヤに割り当て、隣接映像をステレオレイヤに割り当ててもよい。ここで、ベースレイヤに割り当てられる視点映像とステレオレイヤに割り当てられる視点映像の解像度は同一であってもよい。
【0108】
これによって、符号化部1002は、ベースレイヤ及びステレオレイヤの順に階層的に符号化して符号化ビットストリームを生成する。例えば、符号化部1002は空間軸を基準として、ベースレイヤに割り当てられた基準映像を画面内予測符号化し、時間軸を基準として以前映像を参照して2D映像を符号化する。そして、符号化部1002は、空間軸を基準としてステレオレイヤに割り当てられた隣接映像と同一時間帯に位置する視点映像の基準映像を参照して隣接映像を視点間予測符号化する。ここで、符号化部1002は映像モード情報をステレオ映像モードに設定し、映像モード情報を含む付加情報を符号化ビットストリームに挿入して映像復号化装置に送信する。
【0109】
他の例として、入力映像が2つの視点映像及び深度映像を含む3D映像である場合、レイヤ割当部1001は2つの視点映像のいずれか1つを基準映像として決定し、基準映像を除いた残りの1つの視点映像を隣接映像として決定してもよい。これによって、レイヤ割当部1001は基準映像をベースレイヤに割り当て、隣接映像をステレオレイヤに割り当ててもよい。そして、レイヤ割当部1001は、基準映像に対応する深度映像と隣接映像に対応する深度映像を多視点エンハンスメントレイヤに割り当ててもよい。
【0110】
これによって、符号化部1002は、ベースレイヤ、ステレオレイヤ、及び多視点エンハンスメントレイヤの順に階層的に符号化して符号化ビットストリームを生成する。例えば、符号化部1002は、空間軸を基準として多視点エンハンスメントレイヤに割り当てられた基準映像の深度映像を画面内予測符号化し、時間軸を基準として以前映像を参照して基準映像の深度映像を符号化して多視点エンハンスメントレイヤストリームを生成する。ここで、ベースレイヤ及びステレオレイヤに割り当てられた視点映像を符号化する動作はステレオ映像を符号化する動作と同一であるため、繰り返しの説明は省略することにする。
【0111】
ここで、符号化部1002は映像モード情報を3D映像モードに設定し、映像モード情報を含む付加情報を符号化ビットストリームに挿入して映像復号化装置に送信する。
【0112】
他の例として、入力映像が3個以上の視点映像及び深度映像を含む3D映像である場合、レイヤ割当部1001は3個以上の視点映像のいずれか1つを基準映像として決定し、基準映像と隣接する映像のいずれか1つを隣接映像として決定してもよい。ここで、隣接映像と基準映像の解像度は同一であってもよい。これによって、レイヤ割当部1001は基準映像をベースレイヤに割り当て、隣接映像をステレオレイヤに割り当ててもよい。次に、レイヤ割当部1001は、基準映像に対応する深度映像と隣接映像に対応する深度映像を多視点エンハンスメントレイヤに割り当てる。そして、レイヤ割当部1001は、3個以上の視点映像及び深度映像のうち基準映像、隣接映像、基準映像の深度映像、及び隣接映像の深度映像を除いた視点映像と深度映像を多視点拡張レイヤに割り当ててもよい。
【0113】
これによって、符号化部1002は、ベースレイヤ、ステレオレイヤ、多視点エンハンスメントレイヤ、及び多視点拡張レイヤの順に階層的に符号化して符号化ビットストリームを生成する。
【0114】
例えば、符号化部1002は、空間軸を基準としてベースレイヤに割り当てられた基準映像及びステレオレイヤに割り当てられた隣接映像の少なくとも1つを参照して、多視点拡張レイヤに割り当てられた視点映像を視点間予測符号化する。そして、符号化部1002は、時間軸を基準として多視点拡張レイヤに割り当てられた視点映像の以前映像を参照して多視点拡張レイヤに割り当てられた視点映像を符号化する。同一の方法として、符号化部1002は、多視点エンハンスメントレイヤに割り当てられた基準映像の深度映像及び隣接映像の深度映像の少なくとも1つを参照して多視点拡張レイヤに割り当てられた視点映像の深度映像を視点間予測符号化する。
【0115】
ここで、多視点拡張レイヤに割り当てられた視点映像の解像度が基準映像及び隣接映像の解像度と異なる場合、符号化部1002は、基準映像及び隣接映像の少なくとも1つの解像度を多視点拡張レイヤに割り当てられた視点映像の解像度と同一になるよう変換してもよい。そして、符号化部1002は、解像度が変換された基準映像及び隣接映像の少なくとも1つを参照して多視点拡張レイヤに割り当てられた視点映像を視点間予測符号化する。
【0116】
同様に、多視点拡張レイヤに割り当てられた視点映像に対応する深度映像の解像度が基準映像の深度映像及び隣接映像の深度映像の解像度と異なる場合、符号化部1002は、基準映像の深度映像及び隣接映像の深度映像の少なくとも1つの解像度を多視点拡張レイヤに割り当てられた視点映像に対応する深度映像の解像度と同一になるように変換してもよい。そして、符号化部1002は、解像度が変換された基準映像の深度映像及び隣接映像の深度映像の少なくとも1つを参照して、多視点拡張レイヤに割り当てられた視点映像の深度映像を視点間予測符号化する。
【0117】
そして、符号化部1002は映像モード情報を3D映像モードに設定し、映像モード情報を含む付加情報を符号化ビットストリームに挿入して映像復号化装置に送信する。
【0118】
図10において、2D映像は色及びカラー情報を含む1つの視点映像(1view)を含み、ステレオ映像は色及びカラー情報を含む2つの視点映像(2view)を含み、3D映像は色及びカラー情報を含む3個以上の視点映像と各視点映像に対応する深度映像を含んでもよい。例えば、ステレオ映像は左映像及び右映像を含む両眼式映像を含み、3D画像は多視点画像を含んでもよい。
【0119】
図11は、統合された映像圧縮フォーマットに基づいて符号化ビットストリームを復号化する動作を説明するために提供されるフローチャートである。図11において、符号化ビットストリームを復号化する動作は図13に示す映像復号化装置によって行われる。
【0120】
まず、ステップS1101において、映像復号化装置は、映像符号化装置から階層的に符号化された符号化ビットストリームを受信する。ここで、符号化ビットストリームは、ベースレイヤストリーム、ステレオレイヤストリーム、多視点エンハンスメントレイヤストリーム、及び多視点拡張レイヤストリームを含んでもよい。
【0121】
次に、ステップS1102において、映像復号化装置は、付加情報に基づいて符号化ビットストリームを階層的に復号化する。ここで、付加情報は、解像度情報、視点映像の個数情報、カメラパラメータ情報、及び映像モード情報の少なくとも1つを含んでもよい。
【0122】
例えば、映像復号化装置は、映像モード情報が2D映像モードであるか、ステレオ映像モードであるか、または、3D映像モードと設定されたかに応じてベースレイヤストリーム、ステレオレイヤストリーム、多視点エンハンスメントレイヤストリーム、及び多視点拡張レイヤストリームの少なくとも1つを復号化する。
【0123】
図12は、映像モード情報により符号化ビットストリームを階層的に復号化する動作を説明するために提供されるフローチャートである。
【0124】
まず、ステップS1201において、映像モード情報が2D映像モードである場合、ステップS1202において、映像復号化装置は、符号化ビットストリームのうちベースレイヤストリームだけを復号化して2D映像を復元する。言い換えれば、映像復号化装置は、ベースレイヤストリーム、ステレオレイヤストリーム、多視点エンハンスメントレイヤストリーム、及び多視点拡張レイヤストリームを全て復号化する必要がなく、ベースレイヤストリームだけを復号化して残りのレイヤストリームを廃棄する。
【0125】
そして、ステップS1203において、映像モード情報がステレオ映像モードである場合、ステップS1204において、映像復号化装置は、ベースレイヤストリーム及びステレオレイヤストリームを復号化してステレオ映像を復元する。
【0126】
次に、ステップS1205において、映像モード情報が3D映像モードである場合、ステップS1206において、映像復号化装置は、各レイヤストリームを復号化して3D映像を復元する。
【0127】
一例として、2つの視点映像を符号化して生成された符号化ビットストリームを映像符号化装置から受信し、付加情報に含まれた映像モード情報が3D映像モードと設定された場合、映像復号化装置は、ベースレイヤストリーム及びステレオレイヤストリームを復号化して2つの視点映像を復元する。例えば、映像復号化装置は、基準映像及び隣接映像を復元してもよい。そして、映像復号化装置は、2つの視点映像の少なくとも1つを参照して2つの視点映像のそれぞれに対応する深度映像を生成する。例えば、映像復号化装置は、深度推定(Depth Estimation)又は視差推定(Disparity Estimation)アルゴリズムを用いて2つの深度映像を生成する。言い換えれば、映像復号化装置は、基準映像の深度映像及び隣接映像の深度映像を生成する。これによって、ステップS1207において、映像復号化装置は、生成された基準映像の深度映像、隣接映像の深度映像、復元された基準映像及び隣接映像を合成して多視点映像を生成する。
【0128】
他の例として、2つの視点映像及び深度映像を符号化して生成された符号化ビットストリームを映像符号化装置から受信し、付加情報に含まれた映像モード情報が3D映像モードと設定された場合、映像復号化装置は、ベースレイヤストリーム及びステレオレイヤストリームを復号化して2つの視点映像を復元し、多視点エンハンスメントレイヤストリームを復号化して2つの深度映像を復元する。言い換えれば、映像復号化装置は、基準映像、隣接映像、基準映像の深度映像及び隣接映像の深度映像を復元してもよい。そして、映像復号化装置は、基準映像及び隣接映像に基づいて内挿(Interpolation)又は外挿(extrapolation)を用いて1つ以上の仮想視点映像を生成する。ここで、映像復号化装置は、生成しようとする仮想視点映像の位置に基づいて内挿又は外挿を用いてもよい。例えば、生成しようとする仮想視点映像の位置が基準映像及び隣接映像の間である場合、映像復号化装置は内挿を用いて仮想視点映像を生成する。そして、生成しようとする仮想視点映像の位置が基準映像及び隣接映像の間ではない場合、映像復号化装置は、外挿を用いて仮想視点映像を生成する。
【0129】
同じ方法として、映像復号化装置は、復元された基準映像の深度映像及び隣接映像の深度映像に基づいて内挿又は外挿を用いて仮想視点映像に対応する深度映像を生成する。これによって、映像復号化装置は、復元された2つの視点映像及び深度映像、そして生成された1つ以上の仮想視点映像及び仮想視点映像に対応する深度映像を合成して多視点映像を生成する。
【0130】
他の例として、3個以上の視点映像及び深度映像を符号化して生成された符号化ビットストリームを映像符号化装置から受信し、付加情報に含まれた映像モード情報が3D映像モードと設定された場合、映像復号化装置は、ベースレイヤストリーム及びステレオレイヤストリームを復号化して2つの視点映像を復元し、多視点エンハンスメントレイヤストリームを復号化して2つの深度映像を復元してもよい。そして、映像復号化装置は、多視点拡張レイヤストリームを復号化して多視点拡張レイヤに割り当てられた1つ以上の視点映像及び深度映像を復元してもよい。これによって、映像復号化装置は、復元された3個以上の視点映像及び3個以上の深度映像を合成して多視点映像を生成する。
【0131】
他の例として、3個以上の視点映像及び深度映像を符号化して生成された符号化ビットストリームを映像符号化装置から受信し、付加情報に含まれた映像モード情報が3D映像モードと設定された場合、映像復号化装置は、ベースレイヤストリーム及びステレオレイヤストリームを復号化して2つの視点映像を復元し、多視点エンハンスメントレイヤストリームを復号化して2つの深度映像を復元してもよい。そして、映像復号化装置は、多視点拡張レイヤストリームを復号化して多視点拡張レイヤに割り当てられた視点映像及び深度映像を復元してもよい。これによって、映像復号化装置は、復元された3個以上の視点映像のうち少なくとも2以上に基づいて内挿又は外挿を用いて1つ以上の仮想視点映像を生成する。
【0132】
同じ方法として、映像復号化装置は、復元された3個の視点映像のそれぞれに対応する深度映像のうち少なくとも2以上に基づいて内挿又は外挿を用いて仮想視点映像に対応する深度映像を生成する。これによって、映像復号化装置は、復元された2つの視点映像及び深度映像、そして生成された1つ以上の仮想視点映像及び仮想視点映像に対応する深度映像を合成して多視点映像を生成する。
【0133】
図13は、映像復号化装置の詳細構成を示すブロック図である。図13に示すように、映像復号化装置1300は、ビットストリーム受信部1301、復号化部1302、深度映像生成部1303、及び視点映像合成部1304を備える。
【0134】
まず、ビットストリーム受信部1301は、映像符号化装置で階層的に符号化された符号化ビットストリームを受信する。ここで、符号化ビットストリームは、ベースレイヤストリーム、ステレオレイヤストリーム、多視点エンハンスメントレイヤストリーム、及び多視点拡張レイヤストリームを含んでもよい。
【0135】
これによって、復号化部1302は、符号化ビットストリームに挿入された付加情報に基づいて符号化ビットストリームを階層的に復号化する。ここで、付加情報は、解像度情報、視点映像の個数情報、カメラパラメータ情報、及び映像モード情報の少なくとも1つを含んでもよい。
【0136】
ここで、復号化部1302は、2D復号化部1305、ステレオ復号化部1306、及び3D復号化部1307を備える。
【0137】
まず、映像モード情報が2D映像モードである場合、2D復号化部1305はベースレイヤストリームを復号化して2D映像を復元する。例えば、2D復号化部1305は、H.264/AVC、HEVCなどのような映像復号化方法を用いてベースレイヤストリームを復号化してもよい。これによって、復元された2D映像は2D映像再生装置を介して再生する。
【0138】
そして、映像モード情報がステレオ映像モードである場合、ステレオ復号化部1306は、ベースレイヤストリーム及びステレオレイヤストリームを復号化してステレオ映像を復元する。ここで、ステレオ映像は2つの視点映像を含んでもよい。ここで、ステレオ映像は基準映像C1及び隣接映像C2を含んでもよい。例えば、ステレオ復号化部1306は、H.264/AVC、HEVCなどのような映像復号化方法を用いてベースレイヤストリーム及びステレオストリームを復号化する。これによって、復元されたステレオ映像は、両眼式再生装置などのステレオ映像再生装置を介して再生する。
【0139】
ここで、映像モード情報が3D映像モードである場合にも、ステレオ復号化部1306は、ベースレイヤストリーム及びステレオレイヤストリームを復号化してステレオ映像を復元する。これによって、深度映像生成部1303は、復元された基準映像及び隣接映像の少なくとも1つを参照して基準映像の深度映像及び隣接映像の深度映像を生成する。そして、視点映像合成部1304は、復元された基準映像、復元された隣接映像、生成された基準映像の深度映像、及び生成された隣接映像の深度映像を合成して多視点映像を生成する。これによって、生成された多視点映像はオートステレオスコピック(Auto−stereoscopic)再生装置を介して再生することができる。
【0140】
また、映像モード情報が3D映像モードである場合、3D復号化部1307は、ベースレイヤストリーム及びステレオレイヤストリームを復号化して基準映像及び隣接映像を復元し、多視点エンハンスメントレイヤストリームを復号化して基準映像の深度映像及び隣接映像の深度映像を復元する。これによって、視点映像合成部1304は、復元された基準映像及び隣接映像に基づいて内挿又は外挿を用いて1つ以上の仮想視点映像を生成する。そして、視点映像合成部1304は、復元された基準映像の深度映像及び隣接映像の深度映像に基づいて、内挿又は外挿を用いて仮想視点映像に対応する深度映像を生成する。次に、視点映像合成部1304は、基準映像、隣接映像、基準映像の深度映像、隣接映像の深度映像、仮想視点映像及び仮想視点映像の深度映像を合成して多視点映像を生成する。
【0141】
また、映像モード情報が3D映像モードである場合、3D復号化部1307は、ベースレイヤストリーム及びステレオレイヤストリームを復号化して基準映像及び隣接映像を復元し、多視点エンハンスメントレイヤストリームを復号化して基準映像の深度映像及び隣接映像の深度映像を復元する。そして、3D復号化部1307は、多視点拡張レイヤストリームを復号化して多視点拡張レイヤに割り当てられた視点映像及び視点映像に対応する深度映像を復元する。これによって、視点映像合成部1304は、基準映像、隣接映像、基準映像の深度映像、隣接映像の深度映像、多視点拡張レイヤに割り当てられた視点映像、及び視点映像の深度映像を合成して多視点映像を生成する。
【0142】
ここで、視点映像合成部1304は、基準映像、隣接映像及び多視点拡張レイヤに割り当てられた視点映像のうち少なくとも2以上に基づいて内挿又は外挿を用いて1つ以上の仮想視点映像を生成する。同じ方法によって、視点映像合成部1304は、基準映像の深度映像、隣接映像の深度映像及び多視点拡張レイヤに割り当てられた視点映像の深度映像のうち少なくとも2以上に基づいて内挿又は外挿を用いて仮想視点映像に対応する深度映像を生成する。そして、視点映像合成部1304は、基準映像、隣接映像、多視点拡張レイヤに割り当てられた視点映像、仮想視点映像、基準映像の深度映像、隣接映像の深度映像、多視点拡張レイヤに割り当てられた視点映像の深度映像、及び前記視点映像の深度映像を合成して多視点映像を生成する。
【0143】
一方、図12及び図13に示すように、映像復号化装置が解像度変換による映像を入力によって生成された符号化ビットストリームを映像符号化装置から受信した場合、映像復号化装置も復号化映像に対しても解像度変換を用いて元の入力解像度に復元することができる。
【0144】
一例として、映像符号化装置から、3個の視点映像及び深度映像を含む3D映像を符号化して生成された符号化ビットストリームを受信した場合、復号化部1302は、付加情報に含まれた解像度情報に基づいて復元された基準映像及び復元された隣接映像の少なくとも1つの解像度を変換する。例えば、復号化部1302は、復元された基準映像及び復元された隣接映像の少なくとも1つの解像度をダウンスケーリングしてもよい。これによって、復元された基準映像及び復元された隣接映像の少なくとも1つの解像度は、符号化の前に多視点拡張レイヤに割り当てられた視点映像の解像度と同一になるよう変換されてもよい。
【0145】
そして、復号化部1302は、解像度が変換された基準映像及び隣接映像の少なくとも1つを参照して多視点拡張レイヤに割り当てられた視点映像を復元する。同じ方法によって復号化部1302は、解像度が変換された基準映像の深度映像及び隣接映像の深度映像の少なくとも1つを参照して多視点拡張レイヤに割り当てられた視点映像の深度映像を復元する。
【0146】
他の例として、映像符号化装置は、解像度変換情報を符号化ビットストリームに挿入して映像復号化装置に送信する。ここで、解像度変換情報は、基準映像及び隣接映像の少なくとも1つをダウンスケーリングした比率、及び基準映像の深度映像及び隣接映像の深度映像の少なくとも1つをダウンスケーリングした比率の少なくとも1つを含んでもよい。
【0147】
これによって、復号化部1302は、解像度変換情報に基づいて復元された基準映像及び復元された隣接映像の少なくとも1つをダウンスケーリングして解像度を変換する。そして、復号化部1302は、解像度が変換された基準映像及び隣接映像の少なくとも1つを参照して多視点拡張レイヤに割り当てられた視点映像を復元する。同じ方法によって復号化部1302は、解像度変換情報に基づいて復元された基準映像の深度映像及び復元された隣接映像の深度映像の少なくとも1つをダウンスケーリングして解像度を変換する。そして、解像度が変換された基準映像の深度映像及び隣接映像の深度映像の少なくとも1つを参照して、多視点拡張レイヤに割り当てられた視点映像の深度映像を復元してもよい。
【0148】
以上で説明したように、映像符号化装置は、統合された映像圧縮フォーマットに基づいて入力映像を階層的に符号化して映像復号化装置に送信し、映像復号化装置は、符号化ビットストリームを付加情報に基づいて階層的に復号化して入力映像を復元することができる。言い換えれば、入力映像が2D映像、ステレオ映像、3D映像であるか否かに関係なく、映像符号化装置は入力映像を符号化し、映像復号化装置は符号化ビットストリームを復号化して2D映像、ステレオ映像、または、3D映像を復元する。これによって、従来の2D映像再生装置、ステレオ映像再生装置、及び3D映像再生装置の全てで本映像符号化及び復号化装置において符号化及び復号化によって復元された映像を再生することができる。
【0149】
本発明の実施形態に係る方法は、多様なコンピュータ手段を介して様々な処理を実行することができるプログラム命令の形態で実現され、コンピュータ読取可能な記録媒体に記録されてもよい。コンピュータ読取可能な媒体は、プログラム命令、データファイル、データ構造などのうちの1つ又はその組合せを含んでもよい。媒体に記録されるプログラム命令は、本発明の目的のために特別に設計されて構成されたものでもよく、コンピュータソフトウェア分野の技術を有する当業者にとって公知のものであり、使用可能なものであってもよい。コンピュータ読取可能な記録媒体の例としては、ハードディスク、フロッピー(登録商標)ディスク及び磁気テープのような磁気媒体、CD−ROM、DVDのような光記録媒体、光ディスクのような光磁気媒体、及びROM、RAM、フラッシュメモリなどのようなプログラム命令を保存して実行するように特別に構成されたハードウェア装置が含まれてもよい。プログラム命令の例としては、コンパイラによって生成されるようなマシンコードだけでなく、インタプリタなどを用いてコンピュータによって実行され得る高水準コードを含む。上述したハードウェア装置は、本発明の動作を行うために1つ以上のソフトウェアのレイヤで動作するように構成されてもよい。
【0150】
上述したように、本発明を限定された実施形態と図面によって説明したが、本発明は、上記の実施形態に限定されることなく、本発明が属する分野における通常の知識を有する者であれば、このような実施形態から多様な変更及び変形が可能である。
【0151】
したがって、本発明の範囲は、開示された実施の形態に限定されるものではなく、特許請求の範囲だけではなく特許請求の範囲と均等なものなどによって定められるものである。
【符号の説明】
【0152】
1000 映像符号化装置
1001 レイヤ割当部
1002 符号化部
1300 映像復号化装置
1301 ビットストリーム受信部
1302 復号化部
1303 深度映像生成部
1304 視点映像合成部
1305 2D復号化部
1306 ステレオ復号化部
1307 3D復号化部
【特許請求の範囲】
【請求項1】
入力映像に含まれた少なくとも1つの視点映像をベースレイヤ、ステレオレイヤ、多視点エンハンスメントレイヤ、及び多視点拡張レイヤの少なくとも1つに割り当てるステップと、
前記ベースレイヤ、ステレオレイヤ、多視点エンハンスメントレイヤ及び多視点拡張レイヤに割り当てられた映像を階層的に符号化するステップと、
を含むことを特徴とする映像符号化方法。
【請求項2】
前記符号化するステップは、
前記ベースレイヤに割り当てられた基準映像を参照し、前記ステレオレイヤに割り当てられた隣接映像を視点間予測符号化し、
前記隣接映像は前記基準映像と隣接する映像である、
ことを特徴とする請求項1記載の映像符号化方法。
【請求項3】
前記符号化するステップは、
前記多視点エンハンスメントレイヤに割り当てられた基準映像の深度映像を画面内予測符号化するステップと、
前記多視点エンハンスメントレイヤに割り当てられた隣接映像の深度映像を視点間予測符号化するステップと、
を含むことを特徴とする請求項1記載の映像符号化方法。
【請求項4】
前記符号化するステップは、前記ベースレイヤに割り当てられた基準映像及び前記ステレオレイヤに割り当てられた隣接映像の少なくとも1つを参照して、前記多視点エンハンスメントレイヤに割り当てられた視点映像を視点間予測符号化する、
ことを特徴とする請求項1記載の映像符号化方法。
【請求項5】
前記符号化するステップは、前記多視点エンハンスメントレイヤに割り当てられた基準映像の深度映像及び前記多視点エンハンスメントレイヤに割り当てられた隣接映像の深度映像の少なくとも1つを参照して、前記多視点拡張レイヤに割り当てられた視点映像の深度映像を視点間予測符号化する、
ことを特徴とする請求項1記載の映像符号化方法。
【請求項6】
前記符号化するステップは、
前記多視点拡張レイヤに割り当てられた視点映像の解像度に基づいて前記ベースレイヤに割り当てられた基準映像及び前記ステレオレイヤに割り当てられた隣接映像の少なくとも1つの解像度を変換するステップと、
前記解像度が変換された基準映像及び隣接映像の少なくとも1つに基づいて前記多視点拡張レイヤに割り当てられた視点映像を符号化するステップと、
を含むことを特徴とする請求項1記載の映像符号化方法。
【請求項7】
前記符号化するステップは、
前記多視点拡張レイヤに割り当てられた視点映像の深度映像の解像度に基づいて前記多視点エンハンスメントレイヤに割り当てられた基準映像の深度映像及び隣接映像の深度映像の少なくとも1つの解像度を変換するステップと、
前記解像度が変換された基準映像及び隣接映像の少なくとも1つに基づいて前記多視点拡張レイヤに割り当てられた視点映像を符号化するステップと、
を含むことを特徴とする請求項1記載の映像符号化方法。
【請求項8】
前記ステレオレイヤに割り当てられた隣接映像は、前記ベースレイヤに割り当てられた基準映像と同じ解像度を有し、
前記多視点エンハンスメントレイヤに割り当てられた基準映像の深度映像は、基準映像の深度映像及び隣接映像の深度映像と同じ解像度又は異なる解像度を有し、
前記多視点エンハンスメントレイヤに割り当てられた隣接映像の深度映像は、基準映像及び隣接映像と同じ解像度又は異なる解像度を有し、
前記多視点拡張レイヤに割り当てられた視点映像は、基準映像及び隣接映像と同じ解像度又は異なる解像度を有し、
前記多視点拡張レイヤに割り当てられた視点映像の深度映像は、基準映像の深度映像及び隣接映像の深度映像と同じ解像度又は異なる解像度を有する、
ことを特徴とする請求項1記載の映像符号化方法。
【請求項9】
前記割り当てるステップは、
1視点映像(1view)である基準映像を前記ベースレイヤに割り当てるステップと、
前記基準映像と隣接し、2視点映像(2view)である隣接映像を前記ステレオレイヤに割り当てるステップと、
前記基準映像の深度映像と隣接映像の深度映像を前記多視点エンハンスメントレイヤに割り当てるステップと、
前記基準映像と隣接する映像のうち前記隣接映像を除いた残り隣接映像、及び前記残り隣接映像に対応する深度映像を前記多視点拡張レイヤに割り当てるステップと、
を含み、
前記残り隣接映像は、第3視点以上の映像である、
ことを特徴とする請求項1記載の映像符号化方法。
【請求項10】
前記符号化するステップは、前記符号化によってベースレイヤストリーム、ステレオレイヤストリーム、多視点エンハンスメントレイヤストリーム、及び多視点拡張レイヤストリームを含む階層構造の符号化ビットストリームを生成する、
ことを特徴とする請求項1記載の映像符号化方法。
【請求項11】
入力映像に含まれた少なくとも1つの視点映像をベースレイヤ、ステレオレイヤ、多視点エンハンスメントレイヤ、及び多視点拡張レイヤの少なくとも1つに割り当てるレイヤ割当部と、
前記ベースレイヤ、ステレオレイヤ、多視点エンハンスメントレイヤ及び多視点拡張レイヤを階層的に符号化する符号化部と、
を備えることを特徴とする映像符号化装置。
【請求項12】
前記符号化部は、前記ベースレイヤに割り当てられた基準映像を参照し、前記ステレオレイヤに割り当てられた隣接映像を視点間予測符号化する、
ことを特徴とする請求項11記載の映像符号化装置。
【請求項13】
前記符号化部は、前記多視点エンハンスメントレイヤに割り当てられた基準映像の深度映像を画面内予測符号化し、隣接映像の深度映像を視点間予測符号化する、
ことを特徴とする請求項11記載の映像符号化装置。
【請求項14】
前記符号化部は、前記ベースレイヤに割り当てられた基準映像及び前記ステレオレイヤに割り当てられた隣接映像の少なくとも1つを参照して、前記多視点エンハンスメントレイヤに割り当てられた視点映像を視点間予測符号化する、
ことを特徴とする請求項11記載の映像符号化装置。
【請求項15】
前記符号化部は、前記多視点エンハンスメントレイヤに割り当てられた基準映像の深度映像及び前記多視点エンハンスメントレイヤに割り当てられた隣接映像の深度映像の少なくとも1つを参照して、前記多視点拡張レイヤに割り当てられた視点映像の深度映像を視点間予測符号化する、
ことを特徴とする請求項11記載の映像符号化装置。
【請求項16】
前記符号化部は、前記多視点拡張レイヤに割り当てられた視点映像の解像度に基づいて前記ベースレイヤに割り当てられた基準映像及び前記ステレオレイヤに割り当てられた隣接映像の少なくとも1つの解像度を変換し、解像度が変換された基準映像及び解像度が変換された隣接映像の少なくとも1つに基づいて前記多視点拡張レイヤに割り当てられた視点映像を符号化する、
ことを特徴とする請求項11記載の映像符号化装置。
【請求項17】
前記符号化部は、前記多視点拡張レイヤに割り当てられた視点映像の深度映像の解像度に基づいて前記多視点エンハンスメントレイヤに割り当てられた基準映像の深度映像及び隣接映像の深度映像の少なくとも1つの解像度を変換し、前記解像度が変換された基準映像及び解像度が変換された隣接映像の少なくとも1つに基づいて前記多視点拡張レイヤに割り当てられた視点映像を符号化する、
ことを特徴とする請求項11記載の映像符号化装置。
【請求項18】
ベースレイヤストリーム、ステレオレイヤストリーム、多視点エンハンスメントレイヤストリーム、及び多視点拡張レイヤストリームを含む符号化ビットストリームを受信するステップと、
前記符号化ビットストリームを付加情報に基づいて階層的に復号化するステップと、
を含むことを特徴とする映像復号化方法。
【請求項19】
前記復号化するステップは、前記付加情報に基づいて前記ベースレイヤストリームを復号化して2D映像を復元する、
ことを特徴とする請求項18記載の映像復号化方法。
【請求項20】
前記復号化するステップは、前記ベースレイヤストリーム及びステレオレイヤストリームを復号化して基準映像及び隣接映像を復元する、
ことを特徴とする請求項18記載の映像復号化方法。
【請求項21】
前記復号化するステップは、
前記基準映像及び隣接映像の少なくとも1つを参照し、基準映像の深度映像及び隣接映像の深度映像を生成するステップと、
前記基準映像及び隣接映像を参照し、1つ以上の仮想視点映像を生成するステップと、
前記基準映像の深度映像及び隣接映像の深度映像を参照し、前記仮想視点映像の深度映像を生成するステップと、
前記基準映像、隣接映像、基準映像の深度映像、隣接映像の深度映像、仮想視点映像、及び仮想視点映像の深度映像を合成して多視点映像を生成するステップと、
を含むことを特徴とする請求項20記載の映像復号化方法。
【請求項22】
前記復号化するステップは、
前記多視点エンハンスメントレイヤストリームを復号化して基準映像の深度映像及び隣接映像の深度映像を復元するステップと、
前記基準映像及び隣接映像を参照して1つ以上の仮想視点映像を生成するステップと、
前記基準映像の深度映像及び隣接映像の深度映像を参照して前記仮想視点映像の深度映像を生成するステップと、
前記基準映像、隣接映像、基準映像の深度映像、隣接映像の深度映像、仮想視点映像、及び仮想視点映像の深度映像を合成して多視点映像を生成するステップと、
を含むことを特徴とする請求項20記載の映像復号化方法。
【請求項23】
前記復号化するステップは、
前記多視点エンハンスメントレイヤストリームを復号化して基準映像の深度映像及び隣接映像の深度映像を復元するステップと、
前記多視点拡張レイヤストリームを復号化して多視点拡張レイヤに割り当てられた1つ以上の視点映像及び視点映像の深度映像を復元するステップと、
前記基準映像、隣接映像、基準映像の深度映像、隣接映像の深度映像、多視点拡張レイヤに割り当てられた視点映像及び多視点拡張レイヤに割り当てられた視点映像の深度映像を合成して多視点映像を生成するステップと、
を含むことを特徴とする請求項20記載の映像復号化方法。
【請求項24】
前記付加情報は、解像度情報、視点映像の個数情報、カメラパラメータ情報、及び映像モード情報の少なくとも1つを含む、
ことを特徴とする請求項20記載の映像復号化方法。
【請求項25】
ベースレイヤストリーム、ステレオレイヤストリーム、多視点エンハンスメントレイヤストリーム、及び多視点拡張レイヤストリームを含む階層構造の符号化ビットストリームを受信するビットストリーム受信部と、
前記符号化ビットストリームを付加情報に基づいて階層的に復号化する復号化部と、
を備えることを特徴とする映像復号化装置。
【請求項26】
前記復号化部は、前記付加情報に基づいて前記ベースレイヤストリームを復号化して2D映像を復元する2D復号化部を備える、
ことを特徴とする請求項25記載の映像復号化装置。
【請求項27】
前記復号化部は、前記符号化ビットストリームに含まれた付加情報がステレオ映像モードを含むことによって、前記ベースレイヤストリーム及びステレオレイヤストリームを復号化して基準映像及び隣接映像を復元するステレオ復号化部を備える、
ことを特徴とする請求項25記載の映像復号化装置。
【請求項28】
前記基準映像及び隣接映像の少なくとも1つを参照し、基準映像の深度映像及び隣接映像の深度映像を生成する深度映像生成部と、
前記基準映像及び隣接映像を参照して1つ以上の仮想視点映像を生成し、前記基準映像の深度映像及び隣接映像の深度映像を参照して前記仮想視点映像の深度映像を生成し、前記基準映像、隣接映像、基準映像の深度映像、隣接映像の深度映像、仮想視点映像、及び仮想視点映像の深度映像を合成して多視点映像を復元する視点映像合成部を更に備える、
ことを特徴とする請求項26記載の映像復号化装置。
【請求項29】
前記復号化部は、前記ベースレイヤストリーム及びステレオレイヤストリームを復号化して基準映像及び隣接映像を復元し、前記多視点エンハンスメントレイヤストリームを復号化して基準映像の深度映像及び隣接映像の深度映像を復元する3D復号化部を備える、
ことを特徴とする請求項25記載の映像復号化装置。
【請求項30】
前記基準映像及び隣接映像を参照して1つ以上の仮想視点映像を生成し、前記基準映像の深度映像及び隣接映像の深度映像を参照して前記仮想視点映像の深度映像を生成し、前記基準映像、隣接映像、基準映像の深度映像、隣接映像の深度映像、仮想視点映像、及び仮想視点映像の深度映像を合成して多視点映像を復元する視点映像合成部を更に備える、
ことを特徴とする請求項29記載の映像復号化装置。
【請求項31】
前記復号化部は、前記符号化ビットストリームに含まれた付加情報が多視点映像モードを含むことによって、前記ベースレイヤストリーム及びステレオレイヤストリームを復号化して基準映像及び隣接映像を復元し、前記多視点エンハンスメントレイヤストリームを復号化して基準映像の深度映像及び隣接映像の深度映像を復元し、前記多視点拡張レイヤストリームを復号化して多視点拡張レイヤに割り当てられた1つ以上の視点映像及び視点映像の深度映像を復元する3D復号化部を備える、
ことを特徴とする請求項25記載の映像復号化装置。
【請求項32】
前記基準映像、隣接映像、基準映像の深度映像、隣接映像の深度映像、1つ以上の視点映像及び視点映像の深度映像を合成して多視点映像を生成する視点映像合成部を更に備える、
ことを特徴とする請求項31記載の映像復号化装置。
【請求項33】
前記付加情報は、解像度情報、視点映像の個数情報、カメラパラメータ情報、及び映像モード情報の少なくとも1つを含む、
ことを特徴とする請求項25記載の映像復号化装置。
【請求項34】
請求項1記載の方法を実行するためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
【請求項35】
請求項18記載の方法を実行するためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
【請求項1】
入力映像に含まれた少なくとも1つの視点映像をベースレイヤ、ステレオレイヤ、多視点エンハンスメントレイヤ、及び多視点拡張レイヤの少なくとも1つに割り当てるステップと、
前記ベースレイヤ、ステレオレイヤ、多視点エンハンスメントレイヤ及び多視点拡張レイヤに割り当てられた映像を階層的に符号化するステップと、
を含むことを特徴とする映像符号化方法。
【請求項2】
前記符号化するステップは、
前記ベースレイヤに割り当てられた基準映像を参照し、前記ステレオレイヤに割り当てられた隣接映像を視点間予測符号化し、
前記隣接映像は前記基準映像と隣接する映像である、
ことを特徴とする請求項1記載の映像符号化方法。
【請求項3】
前記符号化するステップは、
前記多視点エンハンスメントレイヤに割り当てられた基準映像の深度映像を画面内予測符号化するステップと、
前記多視点エンハンスメントレイヤに割り当てられた隣接映像の深度映像を視点間予測符号化するステップと、
を含むことを特徴とする請求項1記載の映像符号化方法。
【請求項4】
前記符号化するステップは、前記ベースレイヤに割り当てられた基準映像及び前記ステレオレイヤに割り当てられた隣接映像の少なくとも1つを参照して、前記多視点エンハンスメントレイヤに割り当てられた視点映像を視点間予測符号化する、
ことを特徴とする請求項1記載の映像符号化方法。
【請求項5】
前記符号化するステップは、前記多視点エンハンスメントレイヤに割り当てられた基準映像の深度映像及び前記多視点エンハンスメントレイヤに割り当てられた隣接映像の深度映像の少なくとも1つを参照して、前記多視点拡張レイヤに割り当てられた視点映像の深度映像を視点間予測符号化する、
ことを特徴とする請求項1記載の映像符号化方法。
【請求項6】
前記符号化するステップは、
前記多視点拡張レイヤに割り当てられた視点映像の解像度に基づいて前記ベースレイヤに割り当てられた基準映像及び前記ステレオレイヤに割り当てられた隣接映像の少なくとも1つの解像度を変換するステップと、
前記解像度が変換された基準映像及び隣接映像の少なくとも1つに基づいて前記多視点拡張レイヤに割り当てられた視点映像を符号化するステップと、
を含むことを特徴とする請求項1記載の映像符号化方法。
【請求項7】
前記符号化するステップは、
前記多視点拡張レイヤに割り当てられた視点映像の深度映像の解像度に基づいて前記多視点エンハンスメントレイヤに割り当てられた基準映像の深度映像及び隣接映像の深度映像の少なくとも1つの解像度を変換するステップと、
前記解像度が変換された基準映像及び隣接映像の少なくとも1つに基づいて前記多視点拡張レイヤに割り当てられた視点映像を符号化するステップと、
を含むことを特徴とする請求項1記載の映像符号化方法。
【請求項8】
前記ステレオレイヤに割り当てられた隣接映像は、前記ベースレイヤに割り当てられた基準映像と同じ解像度を有し、
前記多視点エンハンスメントレイヤに割り当てられた基準映像の深度映像は、基準映像の深度映像及び隣接映像の深度映像と同じ解像度又は異なる解像度を有し、
前記多視点エンハンスメントレイヤに割り当てられた隣接映像の深度映像は、基準映像及び隣接映像と同じ解像度又は異なる解像度を有し、
前記多視点拡張レイヤに割り当てられた視点映像は、基準映像及び隣接映像と同じ解像度又は異なる解像度を有し、
前記多視点拡張レイヤに割り当てられた視点映像の深度映像は、基準映像の深度映像及び隣接映像の深度映像と同じ解像度又は異なる解像度を有する、
ことを特徴とする請求項1記載の映像符号化方法。
【請求項9】
前記割り当てるステップは、
1視点映像(1view)である基準映像を前記ベースレイヤに割り当てるステップと、
前記基準映像と隣接し、2視点映像(2view)である隣接映像を前記ステレオレイヤに割り当てるステップと、
前記基準映像の深度映像と隣接映像の深度映像を前記多視点エンハンスメントレイヤに割り当てるステップと、
前記基準映像と隣接する映像のうち前記隣接映像を除いた残り隣接映像、及び前記残り隣接映像に対応する深度映像を前記多視点拡張レイヤに割り当てるステップと、
を含み、
前記残り隣接映像は、第3視点以上の映像である、
ことを特徴とする請求項1記載の映像符号化方法。
【請求項10】
前記符号化するステップは、前記符号化によってベースレイヤストリーム、ステレオレイヤストリーム、多視点エンハンスメントレイヤストリーム、及び多視点拡張レイヤストリームを含む階層構造の符号化ビットストリームを生成する、
ことを特徴とする請求項1記載の映像符号化方法。
【請求項11】
入力映像に含まれた少なくとも1つの視点映像をベースレイヤ、ステレオレイヤ、多視点エンハンスメントレイヤ、及び多視点拡張レイヤの少なくとも1つに割り当てるレイヤ割当部と、
前記ベースレイヤ、ステレオレイヤ、多視点エンハンスメントレイヤ及び多視点拡張レイヤを階層的に符号化する符号化部と、
を備えることを特徴とする映像符号化装置。
【請求項12】
前記符号化部は、前記ベースレイヤに割り当てられた基準映像を参照し、前記ステレオレイヤに割り当てられた隣接映像を視点間予測符号化する、
ことを特徴とする請求項11記載の映像符号化装置。
【請求項13】
前記符号化部は、前記多視点エンハンスメントレイヤに割り当てられた基準映像の深度映像を画面内予測符号化し、隣接映像の深度映像を視点間予測符号化する、
ことを特徴とする請求項11記載の映像符号化装置。
【請求項14】
前記符号化部は、前記ベースレイヤに割り当てられた基準映像及び前記ステレオレイヤに割り当てられた隣接映像の少なくとも1つを参照して、前記多視点エンハンスメントレイヤに割り当てられた視点映像を視点間予測符号化する、
ことを特徴とする請求項11記載の映像符号化装置。
【請求項15】
前記符号化部は、前記多視点エンハンスメントレイヤに割り当てられた基準映像の深度映像及び前記多視点エンハンスメントレイヤに割り当てられた隣接映像の深度映像の少なくとも1つを参照して、前記多視点拡張レイヤに割り当てられた視点映像の深度映像を視点間予測符号化する、
ことを特徴とする請求項11記載の映像符号化装置。
【請求項16】
前記符号化部は、前記多視点拡張レイヤに割り当てられた視点映像の解像度に基づいて前記ベースレイヤに割り当てられた基準映像及び前記ステレオレイヤに割り当てられた隣接映像の少なくとも1つの解像度を変換し、解像度が変換された基準映像及び解像度が変換された隣接映像の少なくとも1つに基づいて前記多視点拡張レイヤに割り当てられた視点映像を符号化する、
ことを特徴とする請求項11記載の映像符号化装置。
【請求項17】
前記符号化部は、前記多視点拡張レイヤに割り当てられた視点映像の深度映像の解像度に基づいて前記多視点エンハンスメントレイヤに割り当てられた基準映像の深度映像及び隣接映像の深度映像の少なくとも1つの解像度を変換し、前記解像度が変換された基準映像及び解像度が変換された隣接映像の少なくとも1つに基づいて前記多視点拡張レイヤに割り当てられた視点映像を符号化する、
ことを特徴とする請求項11記載の映像符号化装置。
【請求項18】
ベースレイヤストリーム、ステレオレイヤストリーム、多視点エンハンスメントレイヤストリーム、及び多視点拡張レイヤストリームを含む符号化ビットストリームを受信するステップと、
前記符号化ビットストリームを付加情報に基づいて階層的に復号化するステップと、
を含むことを特徴とする映像復号化方法。
【請求項19】
前記復号化するステップは、前記付加情報に基づいて前記ベースレイヤストリームを復号化して2D映像を復元する、
ことを特徴とする請求項18記載の映像復号化方法。
【請求項20】
前記復号化するステップは、前記ベースレイヤストリーム及びステレオレイヤストリームを復号化して基準映像及び隣接映像を復元する、
ことを特徴とする請求項18記載の映像復号化方法。
【請求項21】
前記復号化するステップは、
前記基準映像及び隣接映像の少なくとも1つを参照し、基準映像の深度映像及び隣接映像の深度映像を生成するステップと、
前記基準映像及び隣接映像を参照し、1つ以上の仮想視点映像を生成するステップと、
前記基準映像の深度映像及び隣接映像の深度映像を参照し、前記仮想視点映像の深度映像を生成するステップと、
前記基準映像、隣接映像、基準映像の深度映像、隣接映像の深度映像、仮想視点映像、及び仮想視点映像の深度映像を合成して多視点映像を生成するステップと、
を含むことを特徴とする請求項20記載の映像復号化方法。
【請求項22】
前記復号化するステップは、
前記多視点エンハンスメントレイヤストリームを復号化して基準映像の深度映像及び隣接映像の深度映像を復元するステップと、
前記基準映像及び隣接映像を参照して1つ以上の仮想視点映像を生成するステップと、
前記基準映像の深度映像及び隣接映像の深度映像を参照して前記仮想視点映像の深度映像を生成するステップと、
前記基準映像、隣接映像、基準映像の深度映像、隣接映像の深度映像、仮想視点映像、及び仮想視点映像の深度映像を合成して多視点映像を生成するステップと、
を含むことを特徴とする請求項20記載の映像復号化方法。
【請求項23】
前記復号化するステップは、
前記多視点エンハンスメントレイヤストリームを復号化して基準映像の深度映像及び隣接映像の深度映像を復元するステップと、
前記多視点拡張レイヤストリームを復号化して多視点拡張レイヤに割り当てられた1つ以上の視点映像及び視点映像の深度映像を復元するステップと、
前記基準映像、隣接映像、基準映像の深度映像、隣接映像の深度映像、多視点拡張レイヤに割り当てられた視点映像及び多視点拡張レイヤに割り当てられた視点映像の深度映像を合成して多視点映像を生成するステップと、
を含むことを特徴とする請求項20記載の映像復号化方法。
【請求項24】
前記付加情報は、解像度情報、視点映像の個数情報、カメラパラメータ情報、及び映像モード情報の少なくとも1つを含む、
ことを特徴とする請求項20記載の映像復号化方法。
【請求項25】
ベースレイヤストリーム、ステレオレイヤストリーム、多視点エンハンスメントレイヤストリーム、及び多視点拡張レイヤストリームを含む階層構造の符号化ビットストリームを受信するビットストリーム受信部と、
前記符号化ビットストリームを付加情報に基づいて階層的に復号化する復号化部と、
を備えることを特徴とする映像復号化装置。
【請求項26】
前記復号化部は、前記付加情報に基づいて前記ベースレイヤストリームを復号化して2D映像を復元する2D復号化部を備える、
ことを特徴とする請求項25記載の映像復号化装置。
【請求項27】
前記復号化部は、前記符号化ビットストリームに含まれた付加情報がステレオ映像モードを含むことによって、前記ベースレイヤストリーム及びステレオレイヤストリームを復号化して基準映像及び隣接映像を復元するステレオ復号化部を備える、
ことを特徴とする請求項25記載の映像復号化装置。
【請求項28】
前記基準映像及び隣接映像の少なくとも1つを参照し、基準映像の深度映像及び隣接映像の深度映像を生成する深度映像生成部と、
前記基準映像及び隣接映像を参照して1つ以上の仮想視点映像を生成し、前記基準映像の深度映像及び隣接映像の深度映像を参照して前記仮想視点映像の深度映像を生成し、前記基準映像、隣接映像、基準映像の深度映像、隣接映像の深度映像、仮想視点映像、及び仮想視点映像の深度映像を合成して多視点映像を復元する視点映像合成部を更に備える、
ことを特徴とする請求項26記載の映像復号化装置。
【請求項29】
前記復号化部は、前記ベースレイヤストリーム及びステレオレイヤストリームを復号化して基準映像及び隣接映像を復元し、前記多視点エンハンスメントレイヤストリームを復号化して基準映像の深度映像及び隣接映像の深度映像を復元する3D復号化部を備える、
ことを特徴とする請求項25記載の映像復号化装置。
【請求項30】
前記基準映像及び隣接映像を参照して1つ以上の仮想視点映像を生成し、前記基準映像の深度映像及び隣接映像の深度映像を参照して前記仮想視点映像の深度映像を生成し、前記基準映像、隣接映像、基準映像の深度映像、隣接映像の深度映像、仮想視点映像、及び仮想視点映像の深度映像を合成して多視点映像を復元する視点映像合成部を更に備える、
ことを特徴とする請求項29記載の映像復号化装置。
【請求項31】
前記復号化部は、前記符号化ビットストリームに含まれた付加情報が多視点映像モードを含むことによって、前記ベースレイヤストリーム及びステレオレイヤストリームを復号化して基準映像及び隣接映像を復元し、前記多視点エンハンスメントレイヤストリームを復号化して基準映像の深度映像及び隣接映像の深度映像を復元し、前記多視点拡張レイヤストリームを復号化して多視点拡張レイヤに割り当てられた1つ以上の視点映像及び視点映像の深度映像を復元する3D復号化部を備える、
ことを特徴とする請求項25記載の映像復号化装置。
【請求項32】
前記基準映像、隣接映像、基準映像の深度映像、隣接映像の深度映像、1つ以上の視点映像及び視点映像の深度映像を合成して多視点映像を生成する視点映像合成部を更に備える、
ことを特徴とする請求項31記載の映像復号化装置。
【請求項33】
前記付加情報は、解像度情報、視点映像の個数情報、カメラパラメータ情報、及び映像モード情報の少なくとも1つを含む、
ことを特徴とする請求項25記載の映像復号化装置。
【請求項34】
請求項1記載の方法を実行するためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
【請求項35】
請求項18記載の方法を実行するためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【公開番号】特開2013−98986(P2013−98986A)
【公開日】平成25年5月20日(2013.5.20)
【国際特許分類】
【出願番号】特願2012−237652(P2012−237652)
【出願日】平成24年10月29日(2012.10.29)
【出願人】(390019839)三星電子株式会社 (8,520)
【氏名又は名称原語表記】Samsung Electronics Co.,Ltd.
【住所又は居所原語表記】129,Samsung−ro,Yeongtong−gu,Suwon−si,Gyeonggi−do,Republic of Korea
【Fターム(参考)】
【公開日】平成25年5月20日(2013.5.20)
【国際特許分類】
【出願日】平成24年10月29日(2012.10.29)
【出願人】(390019839)三星電子株式会社 (8,520)
【氏名又は名称原語表記】Samsung Electronics Co.,Ltd.
【住所又は居所原語表記】129,Samsung−ro,Yeongtong−gu,Suwon−si,Gyeonggi−do,Republic of Korea
【Fターム(参考)】
[ Back to top ]