多視点シーケンス符号化/復号化方法及びそのディスプレイ方法
【課題】多視点シーケンスデータを効率的に符号化及び復号化できる多視点シーケンス符号化/復号化方法及びそのディスプレイ方法を提供する。また、符号化されたデータを効率的に多視点シーケンスに復号化する装置及びその装置を用いたディスプレイ方法を提供する。
【解決手段】複数の視点から獲得した複数のピクチャーを符号化することで、ビットストリームを生成する段階を含み、前記ビットストリームは、複数のピクチャーそれぞれに対する視点情報を含み、前記視点情報は、対応するピクチャーが複数の視点のうち何れの視点に対応するかを指定する情報である多視点シーケンス符号化方法を構成する。
【解決手段】複数の視点から獲得した複数のピクチャーを符号化することで、ビットストリームを生成する段階を含み、前記ビットストリームは、複数のピクチャーそれぞれに対する視点情報を含み、前記視点情報は、対応するピクチャーが複数の視点のうち何れの視点に対応するかを指定する情報である多視点シーケンス符号化方法を構成する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、多視点シーケンス符号化/復号化方法に関するもので、特に、多視点シーケンス符号化/復号化方法及びそのディスプレイ方法に関するものである。本発明は、広範囲な応用に適しており、特に、多視点シーケンスデータの符号化/復号化を行い、受信端によって要求された視点に対応する動映像を復号化するための視点選択が可能な応用に適している。
【背景技術】
【0002】
一般的に、現在のメディアは、単純なテキスト及び2次元ビデオをディスプレイするだけでなく、人間の視覚、聴覚、触覚、嗅覚、味覚などの五感を統合的に認知し、事物や状況を正確かつ鮮明に把握できるようにする。このようなマルチメディアは、通信と結合して一層重要な意味を有するようになり、高速及び大容量の情報伝送技術が発達しながら画像電話、遠隔会議、遠隔ショッピングなどのマルチメディア通信が可能になった。
【0003】
マルチメディア技術は、3次元信号処理技術として発展するとき、一層生動感のある力を発揮するはずである。このために、人間の生活空間を現実的かつ自然的に再現できる3次元映像処理及び通信技術の開発が必要である。
【0004】
一方、私たちが生きている世界は、上下左右のみならず、深さ感も含む3次元世界である。したがって、人々は、平面のように感じられる2次元映像のみならず、深さ感までも感じられる立体感及び現実感のある3次元立体映像に対して多くの関心を示しており、現在、3次元映像処理技術は、通信、放送、仮想現実、教育、医療、娯楽などの多様な分野で応用されている。
【0005】
2次元映像で3次元を表現する最も簡単な方式は、ステレオ方式である。ステレオ映像は、左右映像で構成されているので、データ量が膨大になるという問題点がある。したがって、ステレオ映像は、大容量の保存装置、ネットワーク及び高速のコンピュータシステムを要求する。また、ステレオ映像を独立的に符号化する場合、2次元映像を伝送するための帯域幅より約2倍の帯域幅が要求される。ステレオ映像を時間軸に拡張したステレオシーケンスや時間軸及び視点軸に拡張した多視点シーケンスの場合、視点数に比例してデータ量が増加し、要求される帯域幅も増加する。
【0006】
3次元映像に対する関心が高まるにつれて、各機関、大学及び実験室などでは、3次元映像圧縮及び復元ディスプレイシステムに対する研究が行われている。
【0007】
上記のような3次元映像システムの受信端では、多視点シーケンスを復号化してディスプレイできる3次元ディスプレイが必要である。現在開発されている3次元液晶表示装置(LCD)モニターは、一人の観察者に立体感を提供するディスプレイであり、最近、多数の観察者に立体感及び事実感を提供できる3次元多視点ディスプレイモニターが開発中にある。
【0008】
しかしながら、視点数が増加することで、3次元多視点シーケンスのデータ量及び演算量が増加するので、3次元多視点シーケンスを効率的に符号化及び復号化できる多視点シーケンス符号化/復号化器(CODEC)が要求される。また、使用者が保有しているディスプレイによって、受信端で特定の視点のみを復号化することも要求される。
【発明の概要】
【発明が解決しようとする課題】
【0009】
本発明は上記の問題点を解決するためのもので、多視点シーケンス符号化/復号化方法及びそのディスプレイ方法に関するものである。
【0010】
本発明の目的は、多視点シーケンスデータを効率的に符号化及び復号化できる多視点シーケンス符号化/復号化方法及びそのディスプレイ方法を提供することにある。
【0011】
本発明の他の目的は、符号化されたデータを効率的に多視点シーケンスに復号化する装置及びその装置を用いたディスプレイ方法を提供することにある。
【0012】
本発明の付加的な特徴及び長所は、後述する詳細な説明で明らかになるだろう。本発明の目的及び他の長所は、添付の図面のみならず、詳細な説明及び特許請求の範囲に記載された構造によって具現及び獲得される。
【課題を解決するための手段】
【0013】
本発明の目的及び他の利点を達成するために、本発明に係る多視点シーケンス符号化方法は、複数の視点から獲得した複数のピクチャーを符号化することで、ビットストリームを生成する段階を含み、前記ビットストリームは、複数のピクチャーに対する視点情報を含み、前記視点情報は、対応するピクチャーが複数の視点のうち何れの視点に対応するかを指定する情報である。
【0014】
本発明の目的及び他の利点を達成するために、本発明に係る多視点シーケンス符号化方法は、メーン視点に対する第1ピクチャータイプのピクチャーを符号化することで、メーンビットストリームを生成する段階と、一つ以上の補助視点に対する補助ビットストリームを生成する段階と、を含み、前記補助ビットストリームは、前記第1ピクチャータイプのピクチャーを用いて予測された第2ピクチャータイプのピクチャーを符号化することで生成され、前記補助ビットストリームは、前記第2ピクチャータイプのピクチャーに対する視点情報を含み、前記視点情報は、前記第2ピクチャータイプの対応するピクチャーが前記一つ以上の補助視点のうち何れの補助視点に対応するかを指定する情報である。
【0015】
本発明の目的及び他の利点を達成するために、多視点シーケンス復号化方法は、複数の視点から獲得したピクチャーをそれぞれ符号化することで生成されたメーンビットストリームを受信する段階と、特定のピクチャーが前記複数の視点のうち何れに対応するかを指定する視点情報を確認する段階と、前記確認された視点情報によって、ディスプレイで特定の視点と関連したピクチャーを復号化する段階と、を含む。
【0016】
本発明の目的及び他の利点を達成するために、多視点シーケンス復号化方法は、メーン視点から獲得したピクチャーを符号化することで生成されたメーンビットストリーム、及び複数の補助視点から獲得したピクチャーを符号化することで生成された補助ビットストリームを受信する段階と、前記メーンビットストリーム内のピクチャーを復元する段階と、前記補助ビットストリーム内に存在する視点情報によって前記メーンビットストリーム内の前記復元されたピクチャーを用いることで、ディスプレイで特定の補助視点と関連したピクチャーに対する予測復元を選択的に行う段階と、を含む。
【0017】
本発明の目的及び他の利点を達成するために、多視点シーケンス復号化装置は、メーン視点から獲得したピクチャーを符号化することで生成されたメーンビットストリームを受信し、前記メーンビットストリーム内のピクチャーを復元するメーンビットストリーム復号化部と、複数の補助ビットストリームから獲得したピクチャーを符号化することで生成された補助ビットストリームを受信する補助ビットストリーム復号化部と、を含み、前記補助ビットストリーム復号化部は、前記補助ビットストリーム内に存在する視点情報によって前記メーンビットストリーム内の前記復元されたピクチャーを用いることで、特定の補助視点のピクチャーに対する予測復元を選択的に行う。
【0018】
本発明の目的及び他の利点を達成するために、多視点シーケンスディスプレイ方法は、メーン視点に対応するピクチャーをディスプレイする第1ディスプレイモード、及び前記メーン視点に対応するピクチャー及び一つ以上の補助視点に対応するピクチャーを一緒にディスプレイする第2ディスプレイモードを含み、前記第1ディスプレイモードまたは前記第2ディスプレイモードが、前記ピクチャーを含むビットストリーム内に存在する視点情報によって選択される。
【0019】
上述した説明及び後述する本発明の詳細な説明は、本発明の理解を助けるために提示された例示に過ぎなく、その範囲は、特許請求の範囲に記載された通りである。
【産業上の利用可能性】
【0020】
本発明は、多視点シーケンスを効率的に符号化し、受信端で特定の視点のみを復号化するので、符号化/復号化を一層円滑にかつ効率的に行うことができる。
【0021】
また、本発明は、3次元映像処理技術を採用した通信、放送、仮想現実、教育、医療及び娯楽などの多様の分野に適用される。
また、本発明の方法は、プログラムで具現され、コンピュータ可読の記録媒体(CD−ROM、RAM、ROM、フロッピーディスク、ハードディスク、光磁気ディスクなど)に保存される。
【図面の簡単な説明】
【0022】
【図1】本発明に適用される多視点シーケンス符号化装置のブロック図である。
【図2】本発明によって生成された補助ビットストリームの一例を示す図である。
【図3A】本発明によって5視点シーケンスを符号化するための"GGOP"の一実施形態を示す図である。
【図3B】本発明によって5視点シーケンスを符号化するための"GGOP"の一実施形態を示す図である。
【図3C】本発明によって5視点シーケンスを符号化するための"GGOP"の一実施形態を示す図である。
【図4A】本発明に係る9視点シーケンスを符号化するための"GGOP"の一実施形態を示す図である。
【図4B】本発明に係る9視点シーケンスを符号化するための"GGOP"の一実施形態を示す図である。
【図5】本発明の一実施形態に係る多視点シーケンスディスプレイ方法の概念を説明するための概略図である。
【図6】本発明によって復号化を行うために伝送されるヘッダー情報を説明するためのビットストリームを示す図である。
【図7】本発明に係る多視点シーケンス復号化装置のブロック図である。
【図8A】本発明に係る符号化/復号化方法を説明するための多視点シーケンスを示す図である。
【図8B】本発明に係る符号化/復号化方法を説明するための多視点シーケンスを示す図である。
【図8C】本発明に係る符号化/復号化方法を説明するための多視点シーケンスを示す図である。
【図8D】本発明に係る符号化/復号化方法を説明するための多視点シーケンスを示す図である。
【図8E】本発明に係る符号化/復号化方法を説明するための多視点シーケンスを示す図である。
【図9A】本発明に係る符号化/復号化方法を説明するための多視点シーケンスを示す図である。
【図9B】本発明に係る符号化/復号化方法を説明するための多視点シーケンスを示す図である。
【図9C】本発明に係る符号化/復号化方法を説明するための多視点シーケンスを示す図である。
【図9D】本発明に係る符号化/復号化方法を説明するための多視点シーケンスを示す図である。
【図9E】本発明に係る符号化/復号化方法を説明するための多視点シーケンスを示す図である。
【図10】図8A乃至図8Eに示した5視点シーケンスの多様なビット率での符号化結果を説明するためのグラフである。
【図11A】図9Aに示したシーケンスの多様なビット率での符号化結果を説明するためのグラフである。
【図11B】図9Aに示したシーケンスの多様なビット率での符号化結果を説明するためのグラフである。
【図12A】ベースラインの大きい映像をそれぞれ"One−I"タイプと"Two−I"タイプで符号化した場合の結果映像を比較した図である。
【図12B】ベースラインの大きい映像をそれぞれ"One−I"タイプと"Two−I"タイプで符号化した場合の結果映像を比較した図である。
【図13A】本発明のBt,sフレームの性能を説明するための結果映像を示す図である。
【図13B】本発明のBt,sフレームの性能を説明するための結果映像を示す図である。
【図14A】受信端にステレオシーケンスのみをディスプレイできる3次元モニターが提供される場合、図9A乃至図9Eに示した5視点のビットストリームを受信した使用者が2番目の視点及び4番目の視点を選択したときの結果映像を示す図である。
【図14B】受信端にステレオシーケンスのみをディスプレイできる3次元モニターが提供される場合、図9A乃至図9Eに示した5視点のビットストリームを受信した使用者が2番目の視点及び4番目の視点を選択したときの結果映像を示す図である。
【図14C】受信端にステレオシーケンスのみをディスプレイできる3次元モニターが提供される場合、図9A乃至図9Eに示した5視点のビットストリームを受信した使用者が2番目の視点及び4番目の視点を選択したときの結果映像を示す図である。
【図14D】受信端にステレオシーケンスのみをディスプレイできる3次元モニターが提供される場合、図9A乃至図9Eに示した5視点のビットストリームを受信した使用者が2番目の視点及び4番目の視点を選択したときの結果映像を示す図である。
【発明を実施するための形態】
【0023】
以下、本発明の好適な実施形態について、添付の図面に基づいて詳細に説明する。
【0024】
本発明では、可能な限り現在広く用いられる一般的な用語を選択したが、特定の場合に出願人が任意に選定した用語もあり、その場合、該当する発明の説明部分でその意味を詳細に記載した。そのため、本発明は、単純な用語の名称でなく、用語の持つ意味によって把握すべきである。
【0025】
本発明で用いられる"多視点シーケンス”は、同一の事物に対して視点の異なる動映像が同時に獲得されることを意味する。例えば、"多視点シーケンス”は、複数の動映像撮影機構(例えば、カメラ)を用いて多様な角度及び多様な方向に同一の事物を撮影することで得られた動映像を意味する。
【0026】
特に、本発明の"メーン視点"は、多視点のうち符号化の基準になる視点を意味する。"メーン視点"に対応する動映像は、MPEG−2、MPEG−4、H.623、H.264などの従来の動映像符号化方式によってビットストリームに符号化される。このビットストリームは、本発明の"メーンビットストリーム"と呼ばれる。説明の便宜上、本発明では、従来の動映像符号化方式の一例であるMPEG−2が用いられる。
【0027】
本発明の"補助視点"は、多視点のうちメーン視点でない視点を意味する。"補助視点"に対応する動映像は、後述する本発明の固有な符号化方式によってビットストリームに符号化される。このビットストリームは、本発明の"補助ビットストリーム"と呼ばれる。
【0028】
また、本発明の"ビットストリーム"は、"メーンストリーム"または"補助ストリーム"として包括的に用いられる。
【0029】
図1は、本発明に適用される多視点シーケンス符号化装置のブロック図である。
【0030】
本発明に係る符号化方法で、MPEG−2との互換性のために基準となるシーケンスは、MPEG−2エンコーダーで符号化されてメーンビットストリームを生成し、補助視点シーケンスに対して補助ビットストリームを生成する。すなわち、メーンビットストリームは、"I(後述する)"ピクチャーを含むシーケンスに対するデータを含み、補助ビットストリームは、その他のシーケンスの変異推定及び動き推定を通して符号化した多様な種類の情報を含む。
【0031】
図1を参照すると、本発明に適用される多視点符号化装置は、前処理部110、動き推定/補償部120,130、変異推定/補償部140、ビット率制御部150及び差映像符号化部160,170を含む。
【0032】
多視点シーケンスデータAが入力されると、前処理部110は、ノイズ除去及びインバランシング(ImbalancIng)問題を解決しながら、前処理過程を通して多視点シーケンスデータ間の相関度を高めることで、変異推定及び動き推定から得られた各ベクターの信頼度を増加させ、前処理データを変異推定/補償部140、動き推定/補償部120,130及び差映像符号化部160,170に提供する。
【0033】
したがって、インバランシング問題は、基準映像と補正すべき補正映像の平均及び分散を用いてインバランシングを補正し、メディアンフィルターを用いてノイズを簡単に除去することで解決される。
【0034】
前処理部110は、補助ビットストリームに"視点情報"を挿入し、復号化器で特定の視点のみを復元できる情報を提供する。これを、図2を参照して説明する。
【0035】
変異推定/補償部140及び動き推定/補償部120,130は、"I"ピクチャーを含むシーケンス軸を基準にして変異ベクター及び動きベクターを推定し、半画素補償方法を用いて補償する。
【0036】
差映像符号化部160,170は、一層改善した映像画質及び立体感を提供するために、前処理部110から提供される元の映像と、変異推定/補償部140及び動き推定/補償部120,130で補償された復元映像との差情報に対して符号化を行い、提供される多視点シーケンスに対するビットストリームを生成することができる。
【0037】
ビット率制御部150は、各ピクチャーにビットを効率的に割り当てるためのビット率を制御することができる。
【0038】
図2は、本発明によって生成された補助ビットストリームの一例を示す図である。
【0039】
図2を参照すると、本発明によって挿入された"視点情報"210は、例えば、補助ビットストリーム内のピクチャーヘッダーにnビットで挿入される。このとき、nビットは、最大2n個の視点まで支援することができる。
【0040】
すなわち、"視点情報"は、特定のピクチャーが複数の補助視点のうち何れの補助視点に対応するかを指定する情報として用いられる。そのため、複数の視点に対する各ピクチャーが補助ビットストリーム内に混合された場合、"視点情報"は、特定の視点と結合されたピクチャーのみを選択的に復元する必要がある。
【0041】
"視点情報”は、補助ビットストリームのみに限定されず、メーンビットストリームと補助ビットストリームの区分なしに、特定の視点と関連したピクチャーの意味として用いられる。
【0042】
以下、本発明に係る多視点シーケンス符号化を行う特定の方法を説明する。
【0043】
一般的な符号化方式、例えば、MPEG-2符号化方式で、符号化の基本単位はGOP(Group Of PIctures)である。GOPは、"I"ピクチャー、"P"ピクチャー及び"B"ピクチャーを含む。
【0044】
"I"ピクチャーは、イントラ符号化を行うためのもので、シーケンスのランダムアクセスを可能にする。"P"ピクチャーは、以前に符号化された"I"ピクチャーや"P"ピクチャーを基準映像として動きベクターを単方向に推定し、"B"ピクチャーは、"I"ピクチャー及び"P"ピクチャーを用いて動きベクターを両方向に推定する。GOPの長さ、すなわち、"N"は、"I"ピクチャー間の距離を意味し、"M"は、"I"ピクチャーと"P"ピクチャーとの間の距離を意味する。
【0045】
"I"ピクチャー、"P"ピクチャー及び"B"ピクチャーは、MPEG-2符号化方式に用いられるピクチャー用語である。符号化方式が互いに異なると、使用可能な用語も異なってくる。例えば、異なったMPEG2方式によるメーンビットストリームで、任意の基準ピクチャーを参照せずに復号化されるピクチャーは"L"ピクチャーという。また、少なくとも一つまたは二つの基準ピクチャーを参照して復号化されるピクチャーは"H"ピクチャーという。
【0046】
本発明では、多視点シーケンスを符号化するために、多視点シーケンス符号化の基本単位である"GGOP(Group of GOP)構造を提案する。
【0047】
本発明の"GGOP"は、MPEG-2のGOPと異なって、時間軸及び視点軸に対応する各ピクチャーを含む。すなわち、"GGOP"構造を用いて空間上の相関性、時間軸上の相関性、視点間の相関性を除去し、多視点シーケンスを効率的に符号化することができる。
【0048】
図3A及び図3Bは、本発明によって5視点シーケンスを符号化するための"GGOP"の一実施形態を示す図で、それぞれ"One-I"タイプ(図3A)、"Two-I"タイプ(図3B)及び"Five-I"(図3C)を意味する。説明の便宜上、"N=6及びM=3"である場合を例に挙げて説明する。ここで、本発明が"N=6及びM=3"である場合に限定されないことは、当業者にとって明らかである。
【0049】
図3Aを参照すると、本発明の"GGOP"構造のうち"One−I"タイプは、1個の"I"ピクチャー、1個の"Pt"ピクチャー、4個の"Bt"ピクチャー、4個の"Ps"ピクチャー及び20個の"Bt,s"ピクチャーを含む。
【0050】
この場合、"Pt"ピクチャーは、MPEG−2で用いられる"P"ピクチャーと同様に、動きベクターをそれぞれ単方向に推定するピクチャータイプで、"Bt"ピクチャーは、MPEG−2で用いられる"B"ピクチャーと同様に、動きベクターを両方向に推定するピクチャータイプである。本発明において、"I"ピクチャー、"Pt"ピクチャー及び"Bt"ピクチャーは、メーンビットストリームを構成する第1タイプピクチャーという。
【0051】
"Ps"ピクチャーは、視点間の相関、すなわち、変異推定を用いて復元する映像で、"Bt,s"ピクチャーは、時間軸には動きベクター、視点軸には変異ベクターまたは二つのベクターの補間を用いて復元された映像を意味する。
【0052】
図3Aに示すように、"N=6及びM=3"である場合の"One−I"タイプで、基準となるシーケンス、すなわち、MPEG−2で符号化するシーケンスが1個含まれている。この場合、矢印は、変異ベクター及び動きベクターを予測するための方向を意味する。
【0053】
"I"ピクチャーが含まれたメーン視点シーケンスである"…Bt、Bt、I、Bt、Bt、Pt、…”は、MPEG−2との互換性のためにMPEG−2エンコーダーで符号化される。生成されたビットストリームは、MPEG−2のシンタックスと同一に設定される。上述したように、メーンシーケンスに対応するビットストリームは、メーンビットストリームとして定義され、補助視点に対応するシーケンスのデータは、補助ビットストリームとして定義される。したがって、図3Aに示した5視点"One−I"タイプである場合、1個のメーンビットストリーム及び1個の補助ビットストリームを生成することができる。
【0054】
多視点シーケンスを獲得するときのカメラ間の間隔、すなわち、ベースラインが大きい場合、視点間のエラーが増加する。そのため、メーン視点から遠く離れた視点軸に対応するシーケンスの画質が劣化する憂いがある。したがって、ベースラインの大きい多視点カメラから獲得した多視点シーケンスを符号化する場合、二つ以上のメーンシーケンスが必要である。
【0055】
カメラ撮影角度によって多視点が指定される場合、カメラ間のカメラ撮影角度差がベースラインになる。また、カメラ撮影角度差が大きい場合、二つ以上のメーンシーケンスが設定されることが好ましい。
【0056】
図3Bは、5視点"Two−I"タイプを示すもので、ベースラインの大きい多視点カメラから獲得した多視点シーケンスを符号化するために提案されたものである。この場合、多視点シーケンスエンコーダーは、二つのメーンビットストリーム及び一つの補助ビットストリームを生成することができる。
【0057】
3番目の視点における"Bs"ピクチャーは、互いに隣接する左右映像で予測された変異を用いたり、二つの変異の補間を用いて復元されたピクチャータイプを意味する。
【0058】
本発明において、"Ps"ピクチャー、"Bs"ピクチャー及び"Bt,s"ピクチャーは、補助ビットストリームを構成する第2タイプピクチャーという。
【0059】
一方、図3Cに示した"FIve−I"タイプは、変異推定を行わず、多視点シーケンスをそれぞれMPEG−2シーケンスと見なして独立的に符号化する場合を意味する。この場合、5個のメーンビットストリームが生成される。このとき、変異推定を行っていないため、補助ビットストリームは生成されない。
【0060】
図3A及び図3Cに基づいて説明した本発明の一実施形態では、5視点シーケンスに対応する"GGOP"構造を例に挙げたが、これは、視点数が増加しても拡張可能である。
【0061】
図4A及び図4Bは、本発明に係る9視点シーケンスを符号化するための"GGOP"の一例を示す図で、それぞれ"Two−I"タイプ及び"Three−I"タイプを示している。この場合も、MPEG−2との互換性のために、"I"ピクチャーが含まれている基準シーケンスは、MPEG−2エンコーダーによって符号化された後でメインストリームを生成する。これと同様に、他の視点シーケンスは、補助ビットストリームを生成する。
【0062】
図4Aは、"N=6及びM=3"である場合、"Two−I"タイプに対する"GGOP"構造を示している。"GGOP"構造は、2個の"I"ピクチャー、2個の"Pt"ピクチャー、6個の"Ps"ピクチャー、6個の"Bs"ピクチャー及び38個の"Bt,s"ピクチャーを含む。
【0063】
図4Bは、ベースラインが大きい場合、多視点カメラから獲得された9視点シーケンスに対する"GGOP"構造を示している。この場合、3個のメーンビットストリーム及び1個の補助ビットストリームが生成される。図3Cに示した5視点シーケンスのための"FIve−I"タイプのような変異推定を用いる代りに、各視点に対応するシーケンスは、MPEG−2エンコーダーを用いて符号化される。
【0064】
本発明は、受信端で保有しているディスプレイの特徴を考慮し、特定の視点に該当するシーケンスのみを復元可能にする概念を提案する。
【0065】
図5は、本発明の一実施形態に係る多視点シーケンスディスプレイ方法の概念を説明するための概略図である。
【0066】
図5を参照すると、本発明に係るディスプレイ方法で、受信された多視点シーケンスビットストリームは、受信端で保有しているディスプレイの種類によって特定の視点のみを選択することで復元される。
【0067】
例えば、送信端で5視点シーケンスを符号化し、符号化されたシーケンスを受信端に伝送したとき、受信端で3視点シーケンスのみをディスプレイできる多視点モニターがある場合、使用者は、5視点だけでなく、3視点シーケンスも見られなくなる。このような問題点の発生は、送信端で多視点シーケンスを符号化するとき、視点に対する情報がないことに起因する。したがって、本発明は、このような問題点を解決しようとする。
【0068】
すなわち、送信端で5視点シーケンスを符号化し、符号化されたシーケンスを受信端に伝送したとき、受信端で3視点シーケンスのみをディスプレイできる3次元多視点モニターがある場合、使用者は、5視点のうち所望の3個の視点のみを選択して復元することができる(モード2:これは、第2ディスプレイモードと呼ばれる)。選択的な復元が可能な情報は、上述した"視点情報"に対応する。
【0069】
受信端が多視点モニターでない2次元シーケンスのみをディスプレイできるモニターを有する場合、メーンビットストリームのみを復元してディスプレイに伝送することができる(モード0:これは、第1ディスプレイモードと呼ばれる)。
【0070】
特に、本発明に係るディスプレイ方法は、メーン視点に対応するピクチャーのみをディスプレイする第1ディスプレイモード、及びメーン視点に対応するピクチャー及び一つ以上の補助視点に対応する他のピクチャーをディスプレイする第2ディスプレイモードを有し、ディスプレイモードのうち一つが、各ピクチャーを含むビットストリーム内に存在する視点情報によってディスプレイされるように選択されることを特徴とする。
【0071】
図6は、本発明によって復号化を行うために伝送されるヘッダー情報を説明するためのビットストリームを示す図である。
【0072】
図6を参照すると、多視点シーケンスビットストリームを生成するとき、ピクチャーヘッダー情報に"視点情報"を挿入し、現在符号化しているピクチャーが何番目の視点のデータであるかを示す情報を提供する。視点に対する情報は、2n視点のシーケンスを支援で
きるnビットに設定される。
【0073】
図6は、補助ビットストリームのみに"視点情報"が挿入されることを示しているが、用途によって、メーンビットストリーム内の一側に"視点情報"が挿入されることもある。
【0074】
図7は、本発明が適用される多視点シーケンス復号化装置のブロック図である。
【0075】
図7を参照すると、本発明が適用される復号化装置は、メーンビットストリーム復号化部710及び補助ビットストリーム復号化部720を含む。
【0076】
メーンビットストリーム復号化部710は、MPEG−2デコーダーで復号化を行い、補助ビットストリーム復号化部720は、変異ベクター及び動きベクターを用いて復号化を行う。このとき、受信端で特定の視点のみを復号化するためにピクチャーヘッダー情報で"視点情報"を確認し、現在デコーディングするデータが何番目の視点に該当するかを確認する。すなわち、本発明では、特定の視点が復元されるので、デコーディング時間及び復号化部の計算量を減少させられる。
【0077】
特に、メーンビットストリーム復号化部710は、メーン視点によって生成されたメーンビットストリームを受信し、メーンビットストリーム内のピクチャーを復元する。
【0078】
補助ビットストリーム復号化部720は、複数の補助視点によって生成された補助ビットストリームを受信し、メーンビットストリーム復号化部710によって復元されたメーンビットストリーム内のピクチャーを用いることで、補助ビットストリーム内に存在する視点情報によって特定の補助視点のピクチャーに対する予測復元を選択的に行う。
【0079】
図8A乃至図8Eは、本発明に係る符号化/復号化方法を説明するための多視点シーケンスを示す図で、5視点の場合を示している。
【0080】
実験で用いた映像大きさは720×576である。マクロブロックの大きさは16×16である。変異推定のためのx方向の探索範囲は−16〜16に設定する。平行式カメラを仮定したので、y方向の探索範囲は設定されない。動き推定のために、x方向及びy方向の探索範囲は−16〜16に設定する。実験で用いたビデオフォーマットは、Y:U:V=4:2:0に設定する。
【0081】
図10は、図8A〜図8Eに示した5視点シーケンスの多様なビット率での符号化結果を説明するためのグラフである。
【0082】
図10を参照すると、"One−I"タイプ及び"Two−I"タイプと、変異推定を行っていない"FIve−I"タイプとを比較したとき、類似したビット率で良好な効率を示すことを確認することができる。
【0083】
一方、上述したように、本発明は、流動性のある"GGOP"構造を提案する。すなわち、ベースラインの大きい多視点シーケンスを符号化するためには、視点間の相関性を補完するための"Two−I"タイプを適用し、ベースラインの小さい多視点シーケンスに対しては"One−I"タイプを適用することで、"Two−I"タイプと比較するとき、"I"フレームを除いた残りのピクチャータイプにビット量をより多く割り当てる。
【0084】
図11A及び図11Bは、図9Aに示したシーケンスの多様なビット率での符号化結果を説明するためのグラフで、ベースラインの小さい場合及びベースラインの大きい場合を示している。
【0085】
図11A及び図11Bを参照すると、ベースラインの小さい多視点シーケンスでは、"One−I"タイプがPSNR面で優れた効率を示し、ベースラインの大きい多視点シーケンスでは、"Two−I"タイプがPSNR面で"One−I"タイプより優れた性能を示すことを確認することができる。
【0086】
図12A及び図12Bは、ベースラインの大きい映像をそれぞれ"One−I"タイプ及び"Two−I"タイプで符号化を行った場合の結果映像を比較した図である。
【0087】
図12A及び図12Bを参照すると、ベースラインの大きい多視点シーケンスである場合、視点間の相関性が減少する。これを補完するために、"I"フレームを増加させる。減少した相関性を補完するために"I"フレームを増加させた"Two−I"タイプが、一層優れた効率を有する。したがって、本発明の"GGOP"構造が、多視点シーケンスに対するベースラインの大きさによって流動性を有することを知ることができる。
【0088】
一方、本発明の"GGOP"構造で"Bt,s"フレームは、変異ベクターまたは動きベクターのうち予測エラーの少ないベクターを選択したり、二つのベクターの平均合計を使用する。動きの大きい多視点シーケンスの場合、動きベクターよりも変異ベクターで復元することでエラーを一層減少させるので、変異ベクターのみを選択する。その反対に、時間軸に相関度が減少すると、動きベクターを用いて予測することが一層効率的であるので、動きベクターを選択する。
【0089】
図13A及び図13Bは、本発明のBt,sフレームの性能を説明するための結果映像を示す図である。図13Aは、多視点シーケンスをMPEG−2シーケンスと見なして独立的に符号化を行った場合の結果映像で、図13Bは、本発明によって符号化を行った場合の結果映像である。
【0090】
図13Aを参照すると、従来のMPEG−2においては、変異ベクターを用いて動きの大きい領域を予測できないので、大きなエラーが発生した。しかし、本発明によると、変異ベクターを用いて動きの大きい領域を予測できるので、エラーを減少させることができる。
【0091】
本発明において、送信端でメーンビットストリーム及び補助ビットストリームを受信端に伝送すると、受信端で特定の視点のみを復元することができる。
【0092】
図14A及び図14Bは、受信端にステレオシーケンスのみをディスプレイできる3次元モニターが提供される場合、図9A乃至図9Eに示した5視点のビットストリームを受信した使用者が2番目の視点及び4番目の視点を選択したときの結果映像を示す図である。
【0093】
すなわち、図14A及び図14Bは、MPEG−2復号化器を用いて獲得した結果映像を示し、図14C及び図14Dは、本発明に係る復号化方法を用いて復号化した結果映像を示している。
【0094】
図示したように、図14C及び図14Dの映像が、他のものより鮮明であることを確認することができる。図14A及び図14Bの映像は、変異ベクターのみを用いて復元した結果であり、図14C及び図14Dの映像は、"Bt,s"ピクチャーを含む。したがって
、動きベクターや変異ベクターが大きい場合、予測エラーを減少させることができる。
【0095】
以上説明した本発明は、上述した実施形態及び添付の図面によって限定されるものではなく、本発明の技術的思想から逸脱しない範囲内で多様な置換、変形及び変更が可能であることは、本発明の属する技術分野で通常の知識を有する者にとって明らかである。
【符号の説明】
【0096】
110:前処理部
120,130:動き推定/補償部
140:変異推定/補償部
150:ビット率制御部
160,170:差映像符号化部
【技術分野】
【0001】
本発明は、多視点シーケンス符号化/復号化方法に関するもので、特に、多視点シーケンス符号化/復号化方法及びそのディスプレイ方法に関するものである。本発明は、広範囲な応用に適しており、特に、多視点シーケンスデータの符号化/復号化を行い、受信端によって要求された視点に対応する動映像を復号化するための視点選択が可能な応用に適している。
【背景技術】
【0002】
一般的に、現在のメディアは、単純なテキスト及び2次元ビデオをディスプレイするだけでなく、人間の視覚、聴覚、触覚、嗅覚、味覚などの五感を統合的に認知し、事物や状況を正確かつ鮮明に把握できるようにする。このようなマルチメディアは、通信と結合して一層重要な意味を有するようになり、高速及び大容量の情報伝送技術が発達しながら画像電話、遠隔会議、遠隔ショッピングなどのマルチメディア通信が可能になった。
【0003】
マルチメディア技術は、3次元信号処理技術として発展するとき、一層生動感のある力を発揮するはずである。このために、人間の生活空間を現実的かつ自然的に再現できる3次元映像処理及び通信技術の開発が必要である。
【0004】
一方、私たちが生きている世界は、上下左右のみならず、深さ感も含む3次元世界である。したがって、人々は、平面のように感じられる2次元映像のみならず、深さ感までも感じられる立体感及び現実感のある3次元立体映像に対して多くの関心を示しており、現在、3次元映像処理技術は、通信、放送、仮想現実、教育、医療、娯楽などの多様な分野で応用されている。
【0005】
2次元映像で3次元を表現する最も簡単な方式は、ステレオ方式である。ステレオ映像は、左右映像で構成されているので、データ量が膨大になるという問題点がある。したがって、ステレオ映像は、大容量の保存装置、ネットワーク及び高速のコンピュータシステムを要求する。また、ステレオ映像を独立的に符号化する場合、2次元映像を伝送するための帯域幅より約2倍の帯域幅が要求される。ステレオ映像を時間軸に拡張したステレオシーケンスや時間軸及び視点軸に拡張した多視点シーケンスの場合、視点数に比例してデータ量が増加し、要求される帯域幅も増加する。
【0006】
3次元映像に対する関心が高まるにつれて、各機関、大学及び実験室などでは、3次元映像圧縮及び復元ディスプレイシステムに対する研究が行われている。
【0007】
上記のような3次元映像システムの受信端では、多視点シーケンスを復号化してディスプレイできる3次元ディスプレイが必要である。現在開発されている3次元液晶表示装置(LCD)モニターは、一人の観察者に立体感を提供するディスプレイであり、最近、多数の観察者に立体感及び事実感を提供できる3次元多視点ディスプレイモニターが開発中にある。
【0008】
しかしながら、視点数が増加することで、3次元多視点シーケンスのデータ量及び演算量が増加するので、3次元多視点シーケンスを効率的に符号化及び復号化できる多視点シーケンス符号化/復号化器(CODEC)が要求される。また、使用者が保有しているディスプレイによって、受信端で特定の視点のみを復号化することも要求される。
【発明の概要】
【発明が解決しようとする課題】
【0009】
本発明は上記の問題点を解決するためのもので、多視点シーケンス符号化/復号化方法及びそのディスプレイ方法に関するものである。
【0010】
本発明の目的は、多視点シーケンスデータを効率的に符号化及び復号化できる多視点シーケンス符号化/復号化方法及びそのディスプレイ方法を提供することにある。
【0011】
本発明の他の目的は、符号化されたデータを効率的に多視点シーケンスに復号化する装置及びその装置を用いたディスプレイ方法を提供することにある。
【0012】
本発明の付加的な特徴及び長所は、後述する詳細な説明で明らかになるだろう。本発明の目的及び他の長所は、添付の図面のみならず、詳細な説明及び特許請求の範囲に記載された構造によって具現及び獲得される。
【課題を解決するための手段】
【0013】
本発明の目的及び他の利点を達成するために、本発明に係る多視点シーケンス符号化方法は、複数の視点から獲得した複数のピクチャーを符号化することで、ビットストリームを生成する段階を含み、前記ビットストリームは、複数のピクチャーに対する視点情報を含み、前記視点情報は、対応するピクチャーが複数の視点のうち何れの視点に対応するかを指定する情報である。
【0014】
本発明の目的及び他の利点を達成するために、本発明に係る多視点シーケンス符号化方法は、メーン視点に対する第1ピクチャータイプのピクチャーを符号化することで、メーンビットストリームを生成する段階と、一つ以上の補助視点に対する補助ビットストリームを生成する段階と、を含み、前記補助ビットストリームは、前記第1ピクチャータイプのピクチャーを用いて予測された第2ピクチャータイプのピクチャーを符号化することで生成され、前記補助ビットストリームは、前記第2ピクチャータイプのピクチャーに対する視点情報を含み、前記視点情報は、前記第2ピクチャータイプの対応するピクチャーが前記一つ以上の補助視点のうち何れの補助視点に対応するかを指定する情報である。
【0015】
本発明の目的及び他の利点を達成するために、多視点シーケンス復号化方法は、複数の視点から獲得したピクチャーをそれぞれ符号化することで生成されたメーンビットストリームを受信する段階と、特定のピクチャーが前記複数の視点のうち何れに対応するかを指定する視点情報を確認する段階と、前記確認された視点情報によって、ディスプレイで特定の視点と関連したピクチャーを復号化する段階と、を含む。
【0016】
本発明の目的及び他の利点を達成するために、多視点シーケンス復号化方法は、メーン視点から獲得したピクチャーを符号化することで生成されたメーンビットストリーム、及び複数の補助視点から獲得したピクチャーを符号化することで生成された補助ビットストリームを受信する段階と、前記メーンビットストリーム内のピクチャーを復元する段階と、前記補助ビットストリーム内に存在する視点情報によって前記メーンビットストリーム内の前記復元されたピクチャーを用いることで、ディスプレイで特定の補助視点と関連したピクチャーに対する予測復元を選択的に行う段階と、を含む。
【0017】
本発明の目的及び他の利点を達成するために、多視点シーケンス復号化装置は、メーン視点から獲得したピクチャーを符号化することで生成されたメーンビットストリームを受信し、前記メーンビットストリーム内のピクチャーを復元するメーンビットストリーム復号化部と、複数の補助ビットストリームから獲得したピクチャーを符号化することで生成された補助ビットストリームを受信する補助ビットストリーム復号化部と、を含み、前記補助ビットストリーム復号化部は、前記補助ビットストリーム内に存在する視点情報によって前記メーンビットストリーム内の前記復元されたピクチャーを用いることで、特定の補助視点のピクチャーに対する予測復元を選択的に行う。
【0018】
本発明の目的及び他の利点を達成するために、多視点シーケンスディスプレイ方法は、メーン視点に対応するピクチャーをディスプレイする第1ディスプレイモード、及び前記メーン視点に対応するピクチャー及び一つ以上の補助視点に対応するピクチャーを一緒にディスプレイする第2ディスプレイモードを含み、前記第1ディスプレイモードまたは前記第2ディスプレイモードが、前記ピクチャーを含むビットストリーム内に存在する視点情報によって選択される。
【0019】
上述した説明及び後述する本発明の詳細な説明は、本発明の理解を助けるために提示された例示に過ぎなく、その範囲は、特許請求の範囲に記載された通りである。
【産業上の利用可能性】
【0020】
本発明は、多視点シーケンスを効率的に符号化し、受信端で特定の視点のみを復号化するので、符号化/復号化を一層円滑にかつ効率的に行うことができる。
【0021】
また、本発明は、3次元映像処理技術を採用した通信、放送、仮想現実、教育、医療及び娯楽などの多様の分野に適用される。
また、本発明の方法は、プログラムで具現され、コンピュータ可読の記録媒体(CD−ROM、RAM、ROM、フロッピーディスク、ハードディスク、光磁気ディスクなど)に保存される。
【図面の簡単な説明】
【0022】
【図1】本発明に適用される多視点シーケンス符号化装置のブロック図である。
【図2】本発明によって生成された補助ビットストリームの一例を示す図である。
【図3A】本発明によって5視点シーケンスを符号化するための"GGOP"の一実施形態を示す図である。
【図3B】本発明によって5視点シーケンスを符号化するための"GGOP"の一実施形態を示す図である。
【図3C】本発明によって5視点シーケンスを符号化するための"GGOP"の一実施形態を示す図である。
【図4A】本発明に係る9視点シーケンスを符号化するための"GGOP"の一実施形態を示す図である。
【図4B】本発明に係る9視点シーケンスを符号化するための"GGOP"の一実施形態を示す図である。
【図5】本発明の一実施形態に係る多視点シーケンスディスプレイ方法の概念を説明するための概略図である。
【図6】本発明によって復号化を行うために伝送されるヘッダー情報を説明するためのビットストリームを示す図である。
【図7】本発明に係る多視点シーケンス復号化装置のブロック図である。
【図8A】本発明に係る符号化/復号化方法を説明するための多視点シーケンスを示す図である。
【図8B】本発明に係る符号化/復号化方法を説明するための多視点シーケンスを示す図である。
【図8C】本発明に係る符号化/復号化方法を説明するための多視点シーケンスを示す図である。
【図8D】本発明に係る符号化/復号化方法を説明するための多視点シーケンスを示す図である。
【図8E】本発明に係る符号化/復号化方法を説明するための多視点シーケンスを示す図である。
【図9A】本発明に係る符号化/復号化方法を説明するための多視点シーケンスを示す図である。
【図9B】本発明に係る符号化/復号化方法を説明するための多視点シーケンスを示す図である。
【図9C】本発明に係る符号化/復号化方法を説明するための多視点シーケンスを示す図である。
【図9D】本発明に係る符号化/復号化方法を説明するための多視点シーケンスを示す図である。
【図9E】本発明に係る符号化/復号化方法を説明するための多視点シーケンスを示す図である。
【図10】図8A乃至図8Eに示した5視点シーケンスの多様なビット率での符号化結果を説明するためのグラフである。
【図11A】図9Aに示したシーケンスの多様なビット率での符号化結果を説明するためのグラフである。
【図11B】図9Aに示したシーケンスの多様なビット率での符号化結果を説明するためのグラフである。
【図12A】ベースラインの大きい映像をそれぞれ"One−I"タイプと"Two−I"タイプで符号化した場合の結果映像を比較した図である。
【図12B】ベースラインの大きい映像をそれぞれ"One−I"タイプと"Two−I"タイプで符号化した場合の結果映像を比較した図である。
【図13A】本発明のBt,sフレームの性能を説明するための結果映像を示す図である。
【図13B】本発明のBt,sフレームの性能を説明するための結果映像を示す図である。
【図14A】受信端にステレオシーケンスのみをディスプレイできる3次元モニターが提供される場合、図9A乃至図9Eに示した5視点のビットストリームを受信した使用者が2番目の視点及び4番目の視点を選択したときの結果映像を示す図である。
【図14B】受信端にステレオシーケンスのみをディスプレイできる3次元モニターが提供される場合、図9A乃至図9Eに示した5視点のビットストリームを受信した使用者が2番目の視点及び4番目の視点を選択したときの結果映像を示す図である。
【図14C】受信端にステレオシーケンスのみをディスプレイできる3次元モニターが提供される場合、図9A乃至図9Eに示した5視点のビットストリームを受信した使用者が2番目の視点及び4番目の視点を選択したときの結果映像を示す図である。
【図14D】受信端にステレオシーケンスのみをディスプレイできる3次元モニターが提供される場合、図9A乃至図9Eに示した5視点のビットストリームを受信した使用者が2番目の視点及び4番目の視点を選択したときの結果映像を示す図である。
【発明を実施するための形態】
【0023】
以下、本発明の好適な実施形態について、添付の図面に基づいて詳細に説明する。
【0024】
本発明では、可能な限り現在広く用いられる一般的な用語を選択したが、特定の場合に出願人が任意に選定した用語もあり、その場合、該当する発明の説明部分でその意味を詳細に記載した。そのため、本発明は、単純な用語の名称でなく、用語の持つ意味によって把握すべきである。
【0025】
本発明で用いられる"多視点シーケンス”は、同一の事物に対して視点の異なる動映像が同時に獲得されることを意味する。例えば、"多視点シーケンス”は、複数の動映像撮影機構(例えば、カメラ)を用いて多様な角度及び多様な方向に同一の事物を撮影することで得られた動映像を意味する。
【0026】
特に、本発明の"メーン視点"は、多視点のうち符号化の基準になる視点を意味する。"メーン視点"に対応する動映像は、MPEG−2、MPEG−4、H.623、H.264などの従来の動映像符号化方式によってビットストリームに符号化される。このビットストリームは、本発明の"メーンビットストリーム"と呼ばれる。説明の便宜上、本発明では、従来の動映像符号化方式の一例であるMPEG−2が用いられる。
【0027】
本発明の"補助視点"は、多視点のうちメーン視点でない視点を意味する。"補助視点"に対応する動映像は、後述する本発明の固有な符号化方式によってビットストリームに符号化される。このビットストリームは、本発明の"補助ビットストリーム"と呼ばれる。
【0028】
また、本発明の"ビットストリーム"は、"メーンストリーム"または"補助ストリーム"として包括的に用いられる。
【0029】
図1は、本発明に適用される多視点シーケンス符号化装置のブロック図である。
【0030】
本発明に係る符号化方法で、MPEG−2との互換性のために基準となるシーケンスは、MPEG−2エンコーダーで符号化されてメーンビットストリームを生成し、補助視点シーケンスに対して補助ビットストリームを生成する。すなわち、メーンビットストリームは、"I(後述する)"ピクチャーを含むシーケンスに対するデータを含み、補助ビットストリームは、その他のシーケンスの変異推定及び動き推定を通して符号化した多様な種類の情報を含む。
【0031】
図1を参照すると、本発明に適用される多視点符号化装置は、前処理部110、動き推定/補償部120,130、変異推定/補償部140、ビット率制御部150及び差映像符号化部160,170を含む。
【0032】
多視点シーケンスデータAが入力されると、前処理部110は、ノイズ除去及びインバランシング(ImbalancIng)問題を解決しながら、前処理過程を通して多視点シーケンスデータ間の相関度を高めることで、変異推定及び動き推定から得られた各ベクターの信頼度を増加させ、前処理データを変異推定/補償部140、動き推定/補償部120,130及び差映像符号化部160,170に提供する。
【0033】
したがって、インバランシング問題は、基準映像と補正すべき補正映像の平均及び分散を用いてインバランシングを補正し、メディアンフィルターを用いてノイズを簡単に除去することで解決される。
【0034】
前処理部110は、補助ビットストリームに"視点情報"を挿入し、復号化器で特定の視点のみを復元できる情報を提供する。これを、図2を参照して説明する。
【0035】
変異推定/補償部140及び動き推定/補償部120,130は、"I"ピクチャーを含むシーケンス軸を基準にして変異ベクター及び動きベクターを推定し、半画素補償方法を用いて補償する。
【0036】
差映像符号化部160,170は、一層改善した映像画質及び立体感を提供するために、前処理部110から提供される元の映像と、変異推定/補償部140及び動き推定/補償部120,130で補償された復元映像との差情報に対して符号化を行い、提供される多視点シーケンスに対するビットストリームを生成することができる。
【0037】
ビット率制御部150は、各ピクチャーにビットを効率的に割り当てるためのビット率を制御することができる。
【0038】
図2は、本発明によって生成された補助ビットストリームの一例を示す図である。
【0039】
図2を参照すると、本発明によって挿入された"視点情報"210は、例えば、補助ビットストリーム内のピクチャーヘッダーにnビットで挿入される。このとき、nビットは、最大2n個の視点まで支援することができる。
【0040】
すなわち、"視点情報"は、特定のピクチャーが複数の補助視点のうち何れの補助視点に対応するかを指定する情報として用いられる。そのため、複数の視点に対する各ピクチャーが補助ビットストリーム内に混合された場合、"視点情報"は、特定の視点と結合されたピクチャーのみを選択的に復元する必要がある。
【0041】
"視点情報”は、補助ビットストリームのみに限定されず、メーンビットストリームと補助ビットストリームの区分なしに、特定の視点と関連したピクチャーの意味として用いられる。
【0042】
以下、本発明に係る多視点シーケンス符号化を行う特定の方法を説明する。
【0043】
一般的な符号化方式、例えば、MPEG-2符号化方式で、符号化の基本単位はGOP(Group Of PIctures)である。GOPは、"I"ピクチャー、"P"ピクチャー及び"B"ピクチャーを含む。
【0044】
"I"ピクチャーは、イントラ符号化を行うためのもので、シーケンスのランダムアクセスを可能にする。"P"ピクチャーは、以前に符号化された"I"ピクチャーや"P"ピクチャーを基準映像として動きベクターを単方向に推定し、"B"ピクチャーは、"I"ピクチャー及び"P"ピクチャーを用いて動きベクターを両方向に推定する。GOPの長さ、すなわち、"N"は、"I"ピクチャー間の距離を意味し、"M"は、"I"ピクチャーと"P"ピクチャーとの間の距離を意味する。
【0045】
"I"ピクチャー、"P"ピクチャー及び"B"ピクチャーは、MPEG-2符号化方式に用いられるピクチャー用語である。符号化方式が互いに異なると、使用可能な用語も異なってくる。例えば、異なったMPEG2方式によるメーンビットストリームで、任意の基準ピクチャーを参照せずに復号化されるピクチャーは"L"ピクチャーという。また、少なくとも一つまたは二つの基準ピクチャーを参照して復号化されるピクチャーは"H"ピクチャーという。
【0046】
本発明では、多視点シーケンスを符号化するために、多視点シーケンス符号化の基本単位である"GGOP(Group of GOP)構造を提案する。
【0047】
本発明の"GGOP"は、MPEG-2のGOPと異なって、時間軸及び視点軸に対応する各ピクチャーを含む。すなわち、"GGOP"構造を用いて空間上の相関性、時間軸上の相関性、視点間の相関性を除去し、多視点シーケンスを効率的に符号化することができる。
【0048】
図3A及び図3Bは、本発明によって5視点シーケンスを符号化するための"GGOP"の一実施形態を示す図で、それぞれ"One-I"タイプ(図3A)、"Two-I"タイプ(図3B)及び"Five-I"(図3C)を意味する。説明の便宜上、"N=6及びM=3"である場合を例に挙げて説明する。ここで、本発明が"N=6及びM=3"である場合に限定されないことは、当業者にとって明らかである。
【0049】
図3Aを参照すると、本発明の"GGOP"構造のうち"One−I"タイプは、1個の"I"ピクチャー、1個の"Pt"ピクチャー、4個の"Bt"ピクチャー、4個の"Ps"ピクチャー及び20個の"Bt,s"ピクチャーを含む。
【0050】
この場合、"Pt"ピクチャーは、MPEG−2で用いられる"P"ピクチャーと同様に、動きベクターをそれぞれ単方向に推定するピクチャータイプで、"Bt"ピクチャーは、MPEG−2で用いられる"B"ピクチャーと同様に、動きベクターを両方向に推定するピクチャータイプである。本発明において、"I"ピクチャー、"Pt"ピクチャー及び"Bt"ピクチャーは、メーンビットストリームを構成する第1タイプピクチャーという。
【0051】
"Ps"ピクチャーは、視点間の相関、すなわち、変異推定を用いて復元する映像で、"Bt,s"ピクチャーは、時間軸には動きベクター、視点軸には変異ベクターまたは二つのベクターの補間を用いて復元された映像を意味する。
【0052】
図3Aに示すように、"N=6及びM=3"である場合の"One−I"タイプで、基準となるシーケンス、すなわち、MPEG−2で符号化するシーケンスが1個含まれている。この場合、矢印は、変異ベクター及び動きベクターを予測するための方向を意味する。
【0053】
"I"ピクチャーが含まれたメーン視点シーケンスである"…Bt、Bt、I、Bt、Bt、Pt、…”は、MPEG−2との互換性のためにMPEG−2エンコーダーで符号化される。生成されたビットストリームは、MPEG−2のシンタックスと同一に設定される。上述したように、メーンシーケンスに対応するビットストリームは、メーンビットストリームとして定義され、補助視点に対応するシーケンスのデータは、補助ビットストリームとして定義される。したがって、図3Aに示した5視点"One−I"タイプである場合、1個のメーンビットストリーム及び1個の補助ビットストリームを生成することができる。
【0054】
多視点シーケンスを獲得するときのカメラ間の間隔、すなわち、ベースラインが大きい場合、視点間のエラーが増加する。そのため、メーン視点から遠く離れた視点軸に対応するシーケンスの画質が劣化する憂いがある。したがって、ベースラインの大きい多視点カメラから獲得した多視点シーケンスを符号化する場合、二つ以上のメーンシーケンスが必要である。
【0055】
カメラ撮影角度によって多視点が指定される場合、カメラ間のカメラ撮影角度差がベースラインになる。また、カメラ撮影角度差が大きい場合、二つ以上のメーンシーケンスが設定されることが好ましい。
【0056】
図3Bは、5視点"Two−I"タイプを示すもので、ベースラインの大きい多視点カメラから獲得した多視点シーケンスを符号化するために提案されたものである。この場合、多視点シーケンスエンコーダーは、二つのメーンビットストリーム及び一つの補助ビットストリームを生成することができる。
【0057】
3番目の視点における"Bs"ピクチャーは、互いに隣接する左右映像で予測された変異を用いたり、二つの変異の補間を用いて復元されたピクチャータイプを意味する。
【0058】
本発明において、"Ps"ピクチャー、"Bs"ピクチャー及び"Bt,s"ピクチャーは、補助ビットストリームを構成する第2タイプピクチャーという。
【0059】
一方、図3Cに示した"FIve−I"タイプは、変異推定を行わず、多視点シーケンスをそれぞれMPEG−2シーケンスと見なして独立的に符号化する場合を意味する。この場合、5個のメーンビットストリームが生成される。このとき、変異推定を行っていないため、補助ビットストリームは生成されない。
【0060】
図3A及び図3Cに基づいて説明した本発明の一実施形態では、5視点シーケンスに対応する"GGOP"構造を例に挙げたが、これは、視点数が増加しても拡張可能である。
【0061】
図4A及び図4Bは、本発明に係る9視点シーケンスを符号化するための"GGOP"の一例を示す図で、それぞれ"Two−I"タイプ及び"Three−I"タイプを示している。この場合も、MPEG−2との互換性のために、"I"ピクチャーが含まれている基準シーケンスは、MPEG−2エンコーダーによって符号化された後でメインストリームを生成する。これと同様に、他の視点シーケンスは、補助ビットストリームを生成する。
【0062】
図4Aは、"N=6及びM=3"である場合、"Two−I"タイプに対する"GGOP"構造を示している。"GGOP"構造は、2個の"I"ピクチャー、2個の"Pt"ピクチャー、6個の"Ps"ピクチャー、6個の"Bs"ピクチャー及び38個の"Bt,s"ピクチャーを含む。
【0063】
図4Bは、ベースラインが大きい場合、多視点カメラから獲得された9視点シーケンスに対する"GGOP"構造を示している。この場合、3個のメーンビットストリーム及び1個の補助ビットストリームが生成される。図3Cに示した5視点シーケンスのための"FIve−I"タイプのような変異推定を用いる代りに、各視点に対応するシーケンスは、MPEG−2エンコーダーを用いて符号化される。
【0064】
本発明は、受信端で保有しているディスプレイの特徴を考慮し、特定の視点に該当するシーケンスのみを復元可能にする概念を提案する。
【0065】
図5は、本発明の一実施形態に係る多視点シーケンスディスプレイ方法の概念を説明するための概略図である。
【0066】
図5を参照すると、本発明に係るディスプレイ方法で、受信された多視点シーケンスビットストリームは、受信端で保有しているディスプレイの種類によって特定の視点のみを選択することで復元される。
【0067】
例えば、送信端で5視点シーケンスを符号化し、符号化されたシーケンスを受信端に伝送したとき、受信端で3視点シーケンスのみをディスプレイできる多視点モニターがある場合、使用者は、5視点だけでなく、3視点シーケンスも見られなくなる。このような問題点の発生は、送信端で多視点シーケンスを符号化するとき、視点に対する情報がないことに起因する。したがって、本発明は、このような問題点を解決しようとする。
【0068】
すなわち、送信端で5視点シーケンスを符号化し、符号化されたシーケンスを受信端に伝送したとき、受信端で3視点シーケンスのみをディスプレイできる3次元多視点モニターがある場合、使用者は、5視点のうち所望の3個の視点のみを選択して復元することができる(モード2:これは、第2ディスプレイモードと呼ばれる)。選択的な復元が可能な情報は、上述した"視点情報"に対応する。
【0069】
受信端が多視点モニターでない2次元シーケンスのみをディスプレイできるモニターを有する場合、メーンビットストリームのみを復元してディスプレイに伝送することができる(モード0:これは、第1ディスプレイモードと呼ばれる)。
【0070】
特に、本発明に係るディスプレイ方法は、メーン視点に対応するピクチャーのみをディスプレイする第1ディスプレイモード、及びメーン視点に対応するピクチャー及び一つ以上の補助視点に対応する他のピクチャーをディスプレイする第2ディスプレイモードを有し、ディスプレイモードのうち一つが、各ピクチャーを含むビットストリーム内に存在する視点情報によってディスプレイされるように選択されることを特徴とする。
【0071】
図6は、本発明によって復号化を行うために伝送されるヘッダー情報を説明するためのビットストリームを示す図である。
【0072】
図6を参照すると、多視点シーケンスビットストリームを生成するとき、ピクチャーヘッダー情報に"視点情報"を挿入し、現在符号化しているピクチャーが何番目の視点のデータであるかを示す情報を提供する。視点に対する情報は、2n視点のシーケンスを支援で
きるnビットに設定される。
【0073】
図6は、補助ビットストリームのみに"視点情報"が挿入されることを示しているが、用途によって、メーンビットストリーム内の一側に"視点情報"が挿入されることもある。
【0074】
図7は、本発明が適用される多視点シーケンス復号化装置のブロック図である。
【0075】
図7を参照すると、本発明が適用される復号化装置は、メーンビットストリーム復号化部710及び補助ビットストリーム復号化部720を含む。
【0076】
メーンビットストリーム復号化部710は、MPEG−2デコーダーで復号化を行い、補助ビットストリーム復号化部720は、変異ベクター及び動きベクターを用いて復号化を行う。このとき、受信端で特定の視点のみを復号化するためにピクチャーヘッダー情報で"視点情報"を確認し、現在デコーディングするデータが何番目の視点に該当するかを確認する。すなわち、本発明では、特定の視点が復元されるので、デコーディング時間及び復号化部の計算量を減少させられる。
【0077】
特に、メーンビットストリーム復号化部710は、メーン視点によって生成されたメーンビットストリームを受信し、メーンビットストリーム内のピクチャーを復元する。
【0078】
補助ビットストリーム復号化部720は、複数の補助視点によって生成された補助ビットストリームを受信し、メーンビットストリーム復号化部710によって復元されたメーンビットストリーム内のピクチャーを用いることで、補助ビットストリーム内に存在する視点情報によって特定の補助視点のピクチャーに対する予測復元を選択的に行う。
【0079】
図8A乃至図8Eは、本発明に係る符号化/復号化方法を説明するための多視点シーケンスを示す図で、5視点の場合を示している。
【0080】
実験で用いた映像大きさは720×576である。マクロブロックの大きさは16×16である。変異推定のためのx方向の探索範囲は−16〜16に設定する。平行式カメラを仮定したので、y方向の探索範囲は設定されない。動き推定のために、x方向及びy方向の探索範囲は−16〜16に設定する。実験で用いたビデオフォーマットは、Y:U:V=4:2:0に設定する。
【0081】
図10は、図8A〜図8Eに示した5視点シーケンスの多様なビット率での符号化結果を説明するためのグラフである。
【0082】
図10を参照すると、"One−I"タイプ及び"Two−I"タイプと、変異推定を行っていない"FIve−I"タイプとを比較したとき、類似したビット率で良好な効率を示すことを確認することができる。
【0083】
一方、上述したように、本発明は、流動性のある"GGOP"構造を提案する。すなわち、ベースラインの大きい多視点シーケンスを符号化するためには、視点間の相関性を補完するための"Two−I"タイプを適用し、ベースラインの小さい多視点シーケンスに対しては"One−I"タイプを適用することで、"Two−I"タイプと比較するとき、"I"フレームを除いた残りのピクチャータイプにビット量をより多く割り当てる。
【0084】
図11A及び図11Bは、図9Aに示したシーケンスの多様なビット率での符号化結果を説明するためのグラフで、ベースラインの小さい場合及びベースラインの大きい場合を示している。
【0085】
図11A及び図11Bを参照すると、ベースラインの小さい多視点シーケンスでは、"One−I"タイプがPSNR面で優れた効率を示し、ベースラインの大きい多視点シーケンスでは、"Two−I"タイプがPSNR面で"One−I"タイプより優れた性能を示すことを確認することができる。
【0086】
図12A及び図12Bは、ベースラインの大きい映像をそれぞれ"One−I"タイプ及び"Two−I"タイプで符号化を行った場合の結果映像を比較した図である。
【0087】
図12A及び図12Bを参照すると、ベースラインの大きい多視点シーケンスである場合、視点間の相関性が減少する。これを補完するために、"I"フレームを増加させる。減少した相関性を補完するために"I"フレームを増加させた"Two−I"タイプが、一層優れた効率を有する。したがって、本発明の"GGOP"構造が、多視点シーケンスに対するベースラインの大きさによって流動性を有することを知ることができる。
【0088】
一方、本発明の"GGOP"構造で"Bt,s"フレームは、変異ベクターまたは動きベクターのうち予測エラーの少ないベクターを選択したり、二つのベクターの平均合計を使用する。動きの大きい多視点シーケンスの場合、動きベクターよりも変異ベクターで復元することでエラーを一層減少させるので、変異ベクターのみを選択する。その反対に、時間軸に相関度が減少すると、動きベクターを用いて予測することが一層効率的であるので、動きベクターを選択する。
【0089】
図13A及び図13Bは、本発明のBt,sフレームの性能を説明するための結果映像を示す図である。図13Aは、多視点シーケンスをMPEG−2シーケンスと見なして独立的に符号化を行った場合の結果映像で、図13Bは、本発明によって符号化を行った場合の結果映像である。
【0090】
図13Aを参照すると、従来のMPEG−2においては、変異ベクターを用いて動きの大きい領域を予測できないので、大きなエラーが発生した。しかし、本発明によると、変異ベクターを用いて動きの大きい領域を予測できるので、エラーを減少させることができる。
【0091】
本発明において、送信端でメーンビットストリーム及び補助ビットストリームを受信端に伝送すると、受信端で特定の視点のみを復元することができる。
【0092】
図14A及び図14Bは、受信端にステレオシーケンスのみをディスプレイできる3次元モニターが提供される場合、図9A乃至図9Eに示した5視点のビットストリームを受信した使用者が2番目の視点及び4番目の視点を選択したときの結果映像を示す図である。
【0093】
すなわち、図14A及び図14Bは、MPEG−2復号化器を用いて獲得した結果映像を示し、図14C及び図14Dは、本発明に係る復号化方法を用いて復号化した結果映像を示している。
【0094】
図示したように、図14C及び図14Dの映像が、他のものより鮮明であることを確認することができる。図14A及び図14Bの映像は、変異ベクターのみを用いて復元した結果であり、図14C及び図14Dの映像は、"Bt,s"ピクチャーを含む。したがって
、動きベクターや変異ベクターが大きい場合、予測エラーを減少させることができる。
【0095】
以上説明した本発明は、上述した実施形態及び添付の図面によって限定されるものではなく、本発明の技術的思想から逸脱しない範囲内で多様な置換、変形及び変更が可能であることは、本発明の属する技術分野で通常の知識を有する者にとって明らかである。
【符号の説明】
【0096】
110:前処理部
120,130:動き推定/補償部
140:変異推定/補償部
150:ビット率制御部
160,170:差映像符号化部
【特許請求の範囲】
【請求項1】
メインビットストリーム及び補助ビットストリームを含む多視点ビデオビットストリームを受信する段階(ここで、前記メインビットストリームは、メイン視点のピクチャーを符号化して生成され、前記補助ビットストリームは、補助視点のピクチャーを符号化して生成され、前記メイン視点は、前記補助視点と独立して複号化され、前記補助視点は、前記メイン視点以外の視点であり、前記メイン視点及び前記補助視点のそれぞれのピクチャーは、視点情報を含み、ピクチャーの前記視点情報は、前記ピクチャーが複数個の視点のうちいずれの視点に該当するかを示す。)と、
前記メイン視点の第1ピクチャーを複号化する段階と、
前記補助視点の第2ピクチャーの視点情報を前記多視点ビデオビットストリームから獲得する段階と、
前記第2ピクチャーの前記視点情報に基づいて、前記複号化された第1ピクチャーを用いて前記第2ピクチャーの予測復元を行う段階と、
を含むことを特徴とする多視点ビデオ複号化方法。
【請求項2】
前記第1ピクチャーは、イントラ方式でコーディングされたピクチャーであることを特徴とする、請求項1に記載の多視点ビデオ複号化方法。
【請求項3】
前記第1ピクチャー及び前記第2ピクチャーは、同一時間に獲得され、互いに異なる視点情報を有することを特徴とする、請求項1に記載の多視点ビデオ複号化方法。
【請求項4】
メイン視点の第1ピクチャーを複号化するメインビットストリーム複号化ユニットと、
補助視点の第2ピクチャーの視点情報を多視点ビデオビットストリームから獲得し、前記第2ピクチャーの前記視点情報に基づいて、前記複号化された第1ピクチャーを用いて前記第2ピクチャーの予測復元を行う補助ビットストリーム複号化ユニットと、
を含み、
前記多視点ビデオビットストリームは、メインビットストリーム及び補助ビットストリームを含み、前記メインビットストリームは、メイン視点のピクチャーを符号化して生成され、前記補助ビットストリームは、補助視点のピクチャーを符号化して生成され、前記メイン視点は、前記補助視点と独立して複号化され、前記補助視点は、前記メイン視点以外の視点であり、前記メイン視点及び前記補助視点のそれぞれのピクチャーは、視点情報を含み、ピクチャーの前記視点情報は、前記ピクチャーが複数個の視点のうちいずれの視点に該当するかを示すことを特徴とする多視点ビデオビットストリーム複号化装置。
【請求項1】
メインビットストリーム及び補助ビットストリームを含む多視点ビデオビットストリームを受信する段階(ここで、前記メインビットストリームは、メイン視点のピクチャーを符号化して生成され、前記補助ビットストリームは、補助視点のピクチャーを符号化して生成され、前記メイン視点は、前記補助視点と独立して複号化され、前記補助視点は、前記メイン視点以外の視点であり、前記メイン視点及び前記補助視点のそれぞれのピクチャーは、視点情報を含み、ピクチャーの前記視点情報は、前記ピクチャーが複数個の視点のうちいずれの視点に該当するかを示す。)と、
前記メイン視点の第1ピクチャーを複号化する段階と、
前記補助視点の第2ピクチャーの視点情報を前記多視点ビデオビットストリームから獲得する段階と、
前記第2ピクチャーの前記視点情報に基づいて、前記複号化された第1ピクチャーを用いて前記第2ピクチャーの予測復元を行う段階と、
を含むことを特徴とする多視点ビデオ複号化方法。
【請求項2】
前記第1ピクチャーは、イントラ方式でコーディングされたピクチャーであることを特徴とする、請求項1に記載の多視点ビデオ複号化方法。
【請求項3】
前記第1ピクチャー及び前記第2ピクチャーは、同一時間に獲得され、互いに異なる視点情報を有することを特徴とする、請求項1に記載の多視点ビデオ複号化方法。
【請求項4】
メイン視点の第1ピクチャーを複号化するメインビットストリーム複号化ユニットと、
補助視点の第2ピクチャーの視点情報を多視点ビデオビットストリームから獲得し、前記第2ピクチャーの前記視点情報に基づいて、前記複号化された第1ピクチャーを用いて前記第2ピクチャーの予測復元を行う補助ビットストリーム複号化ユニットと、
を含み、
前記多視点ビデオビットストリームは、メインビットストリーム及び補助ビットストリームを含み、前記メインビットストリームは、メイン視点のピクチャーを符号化して生成され、前記補助ビットストリームは、補助視点のピクチャーを符号化して生成され、前記メイン視点は、前記補助視点と独立して複号化され、前記補助視点は、前記メイン視点以外の視点であり、前記メイン視点及び前記補助視点のそれぞれのピクチャーは、視点情報を含み、ピクチャーの前記視点情報は、前記ピクチャーが複数個の視点のうちいずれの視点に該当するかを示すことを特徴とする多視点ビデオビットストリーム複号化装置。
【図1】
【図2】
【図3A】
【図3B】
【図3C】
【図4A】
【図4B】
【図5】
【図6】
【図7】
【図8A】
【図8B】
【図8C】
【図8D】
【図8E】
【図10】
【図11A】
【図11B】
【図9A】
【図9B】
【図9C】
【図9D】
【図9E】
【図12A】
【図12B】
【図13A】
【図13B】
【図14A】
【図14B】
【図14C】
【図14D】
【図2】
【図3A】
【図3B】
【図3C】
【図4A】
【図4B】
【図5】
【図6】
【図7】
【図8A】
【図8B】
【図8C】
【図8D】
【図8E】
【図10】
【図11A】
【図11B】
【図9A】
【図9B】
【図9C】
【図9D】
【図9E】
【図12A】
【図12B】
【図13A】
【図13B】
【図14A】
【図14B】
【図14C】
【図14D】
【公開番号】特開2011−109690(P2011−109690A)
【公開日】平成23年6月2日(2011.6.2)
【国際特許分類】
【出願番号】特願2011−757(P2011−757)
【出願日】平成23年1月5日(2011.1.5)
【分割の表示】特願2007−517962(P2007−517962)の分割
【原出願日】平成17年6月24日(2005.6.24)
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.フロッピー
【出願人】(502032105)エルジー エレクトロニクス インコーポレイティド (2,269)
【出願人】(506157422)インダストリー‐アカデミック・コオペレイション・ファウンデイション,ヨンセイ・ユニバーシティ (8)
【氏名又は名称原語表記】INDUSTRY‐ACADEMIC COOPERATION FOUNDATION, YONSEI UNIVERSITY
【住所又は居所原語表記】YONSEI UNIVERSITY, 134, SHINCHON‐DONG, SEODAEMUN‐GU, SEOUL 120‐749, KOREA
【Fターム(参考)】
【公開日】平成23年6月2日(2011.6.2)
【国際特許分類】
【出願日】平成23年1月5日(2011.1.5)
【分割の表示】特願2007−517962(P2007−517962)の分割
【原出願日】平成17年6月24日(2005.6.24)
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.フロッピー
【出願人】(502032105)エルジー エレクトロニクス インコーポレイティド (2,269)
【出願人】(506157422)インダストリー‐アカデミック・コオペレイション・ファウンデイション,ヨンセイ・ユニバーシティ (8)
【氏名又は名称原語表記】INDUSTRY‐ACADEMIC COOPERATION FOUNDATION, YONSEI UNIVERSITY
【住所又は居所原語表記】YONSEI UNIVERSITY, 134, SHINCHON‐DONG, SEODAEMUN‐GU, SEOUL 120‐749, KOREA
【Fターム(参考)】
[ Back to top ]