残差生成方法及び装置、並びに復元画面生成方法及び装置
【課題】 H.264/MPEG−4AVC FRExt上のRGB符号化技術の動画符号化効率を高める装置及び方法を提供する。
【解決手段】 本発明に係る動画像符号化装置によって実行される残差生成方法は、(a)動画像符号化装置が、所定の色空間を構成する色成分のそれぞれに独立して適用される第1の予測モード及び所定の色空間を構成する全ての色成分に一律に適用される第2の予測モードのうちの何れか1つを選択するステップ、及び(b)動画像符号化装置が、選択された予測モードによって現在画面と予測画面との残差を前記色成分のそれぞれについて生成するステップを含み、動画像符号化装置は、第1の予測モード及び第2の予測モードのうちの何れか一つを表すフラグを動画像復号化装置に伝送する。
【解決手段】 本発明に係る動画像符号化装置によって実行される残差生成方法は、(a)動画像符号化装置が、所定の色空間を構成する色成分のそれぞれに独立して適用される第1の予測モード及び所定の色空間を構成する全ての色成分に一律に適用される第2の予測モードのうちの何れか1つを選択するステップ、及び(b)動画像符号化装置が、選択された予測モードによって現在画面と予測画面との残差を前記色成分のそれぞれについて生成するステップを含み、動画像符号化装置は、第1の予測モード及び第2の予測モードのうちの何れか一つを表すフラグを動画像復号化装置に伝送する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、残差生成方法及び装置、並びに復元画面生成方法及び装置に係り、特に、H.264/MPEG−4AVC(アドバンスト ビデオ コーディング)Fidelity Range Extensions(FRExt)標準分野における動画を符号化または復号化する方法及び装置に関する。
【背景技術】
【0002】
“レジデュアル色変換”と呼ばれる新たなRGB符号化技術は、H.264/MPEG−4AVC FRExt標準化過程で開発された。これは、RGB色空間をYCbCr色空間に変換する時に発生する画質劣化を防止するためのものである。しかし、H.264/MPEG−4AVC FRExt上のRGB符号化技術も、動画再生機器に適用するにはまだ動画符号化効率が十分に高くないとの問題点があった。
【発明の概要】
【発明が解決しようとする課題】
【0003】
本発明が解決しようとする技術的課題は、H.264/MPEG−4AVC FRExt上のRGB符号化技術の動画符号化効率を高める装置及び方法を提供することである。また、前記方法をコンピュータで実行させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体を提供することである。
【課題を解決するための手段】
【0004】
前記技術的課題を解決するための本発明による第1符号化方法は、所定の色空間を構成する全ての色成分に一律的に適用される予測モードを選択するステップと、前記選択された予測モードによって前記色成分のそれぞれについての現在画面と予測画面との差に該当する第1レジデューを生成するステップと、前記生成された第1レジデュー間の差に該当する第2レジデューを生成するステップと、前記生成された第2レジデューを符号化するステップと、を含む。
【0005】
前記技術的課題を解決するために、本発明は、前記第1符号化方法をコンピュータで実行させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体を提供する。
【0006】
前記技術的課題を解決するための本発明による第1符号化装置は、所定の色空間を構成する全ての色成分に一律的に適用される予測モードを選択する選択部と、前記選択部によって選択された予測モードによって前記色成分のそれぞれについての現在画面と予測画面との差に該当する第1レジデューを生成する減算器と、前記生成部によって生成された第1レジデュー間の差に該当する第2レジデューを生成する変換部と、前記変換部によって生成された第2レジデューを符号化する符号化部と、を備える。
【0007】
前記技術的課題を解決するための本発明による第2符号化方法は、複数の色空間のうち何れか一つの色空間を選択するステップと、前記選択された色空間を構成する色成分のそれぞれについての現在画面と予測画面との差に該当する第1レジデューを生成するステップと、前記生成された第1レジデュー間の差に該当する第2レジデューを生成するステップと、前記生成された第2レジデューを符号化するステップと、を含む。
【0008】
前記技術的課題を解決するために、本発明は、前記の第2符号化方法をコンピュータで実行させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体を提供する。
【0009】
前記技術的課題を解決するための本発明による第2符号化装置は、複数の色空間のうち何れか一つの色空間を選択する選択部と、前記選択部によって選択された色空間を構成する色成分ごとに現在画面と予測画面との差に該当する第1レジデューを生成する生成部と、前記生成部によって生成された第1レジデュー間の差に該当する第2レジデューを生成する変換部と、前記変換部によって生成された第2レジデューを符号化する符号化部と、を備える。
【0010】
前記技術的課題を解決するための本発明による第3符号化方法は、複数の色空間のうち何れか一つの色空間を選択するステップと、前記選択された色空間を構成する全ての色成分に一律的に適用される予測モードを選択するステップと、前記選択された予測モードによって前記色成分のそれぞれについての現在画面と予測画面との差に該当する第1レジデューを生成するステップと、前記生成された第1レジデュー間の差に該当する第2レジデューを生成するステップと、前記生成された第2レジデューを符号化するステップと、を含む。
【0011】
前記技術的課題を解決するために、本発明は、前記の第3符号化方法をコンピュータで実行させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体を提供する。
【0012】
前記技術的課題を解決するための本発明による第3符号化装置は、複数の色空間を選択する第1選択部と、前記第1選択部によって選択された色空間を構成する全ての色成分に一律的に適用される予測モードを選択する第2選択部と、前記第2選択部によって選択された予測モードによって前記色成分のそれぞれについての現在画面と予測画面との差に該当する第1レジデューを生成する減算器と、前記減算器によって生成された第1レジデュー間の差に該当する第2レジデューを生成する変換部と、前記変換部によって生成された第2レジデューを符号化する符号化部と、を備える。
【0013】
前記技術的課題を解決するための本発明による第4符号化方法は、所定の色空間を構成する色成分のそれぞれに独立的に適用される第1予測モード及び前記所定の色空間を構成する全ての色成分に一律的に適用される第2予測モードのうち何れか一つを選択するステップと、前記選択された予測モードによって前記色成分のそれぞれについての現在画面と予測画面との差に該当する第1レジデューを生成するステップと、前記生成された第1レジデュー間の差に該当する第2レジデューを生成するステップと、前記生成された第2レジデューを符号化するステップと、を含む。
【0014】
前記技術的課題を解決するために、本発明は、前記の第4符号化方法をコンピュータで実行させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体を提供する。
【0015】
前記技術的課題を解決するための本発明による第4符号化装置は、所定の色空間を構成する色成分のそれぞれに独立的に適用される第1予測モード及び前記所定の色空間を構成する全ての色成分に一律的に適用される第2予測モードのうち何れか一つを選択する選択部と、前記選択部によって選択された第1予測モードまたは第2予測モードによって前記色成分のそれぞれについての現在画面と予測画面との差に該当する第1レジデューを生成する減算器と、前記減算器によって生成された第1レジデュー間の差に該当する第2レジデューを生成する変換部と、前記変換部によって生成された第2レジデューを符号化する符号化部と、を備える。
【0016】
前記技術的課題を解決するための本発明による第1復号化方法は、ビットストリームを復号化することによって第1レジデュー間の差に該当する第2レジデューを生成するステップと、所定の色空間で前記生成された第2レジデュー間の合算に該当する第1レジデューを生成するステップと、前記所定の色空間を構成する全ての色成分に一律的に適用される予測モードによって予測画面を生成するステップと、前記生成された第1レジデューと前記生成された予測画面との合算に該当する復元画面を生成するステップと、を含む。
【0017】
前記技術的課題を解決するために、本発明は、前記の第1復号化方法をコンピュータで実行させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体を提供する。
【0018】
前記技術的課題を解決するための本発明による第1復号化装置は、ビットストリームを復号化することによって第1レジデュー間の差に該当する第2レジデューを生成する復号化部と、所定の色空間で前記復号化部によって生成された第2レジデュー間の合算に該当する第1レジデューを生成する逆変換部と、前記所定の色空間を構成する全ての色成分に一律的に適用される予測モードによって予測画面を生成する予測部と、前記逆変換部によって生成された第1レジデューと前記予測部によって生成された予測画面との合算に該当する復元画面を生成する加算器とを備える。
【0019】
前記技術的課題を解決するための本発明による第2復号化方法は、ビットストリームを復号化することによって第1レジデュー間の差に該当する第2レジデューを生成するステップと、複数の色空間のうち何れか一つの色空間で前記生成された第2レジデュー間の合算に該当する第1レジデューを生成するステップと、前記生成された第1レジデューと予測画面との合算に該当する復元画面を生成するステップとを含む。
【0020】
前記技術的課題を解決するために、本発明は、前記の第2復号化方法をコンピュータで実行させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体を提供する。
【0021】
前記技術的課題を解決するための本発明による第2復号化装置は、ビットストリームを復号化することによって第1レジデュー間の差に該当する第2レジデューを生成する復号化部と、複数の色空間のうち何れか一つの色空間で前記復号化部によって生成された第2レジデュー間の合算に該当する第1レジデューを生成する逆変換部と、前記生成された第1レジデューと予測画面との合算に該当する復元画面を生成する加算器とを備える。
【0022】
前記技術的課題を解決するための本発明による第3復号化方法は、ビットストリームを復号化することによって第1レジデュー間の差に該当する第2レジデューを生成するステップと、複数の色空間のうち何れか一つの色空間で前記生成された第2レジデュー間の合算に該当する第1レジデューを生成するステップと、前記色空間を構成する全ての色成分に一律的に適用される予測モードによって予測画面を生成するステップと、前記生成された第1レジデューと前記生成された予測画面との合算に該当する復元画面を生成するステップと、を含む。
【0023】
前記技術的課題を解決するために、本発明は、前記の第3復号化方法をコンピュータで実行させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体を提供する。
【0024】
前記技術的課題を解決するための本発明による第3復号化装置は、ビットストリームを復号化することによって第1レジデュー間の差に該当する第2レジデューを生成する復号化部と、複数の色空間のうち何れか一つの色空間で前記復号化部によって生成された第2レジデュー間の合算に該当する第1レジデューを生成する逆変換部と、前記色空間を構成する全ての色成分に一律的に適用される予測モードによって予測画面を生成する予測部と、前記逆変換部によって生成された第1レジデューと前記予測部によって生成された予測画面との合算に該当する復元画面を生成する加算器とを備える。
【0025】
前記技術的課題を解決するための本発明による第4復号化方法は、ビットストリームを復号化することによって第1レジデュー間の差に該当する第2レジデューを生成するステップと、所定の色空間で前記生成された第2レジデュー間の合算に該当する第1レジデューを生成するステップと、前記所定の色空間を構成する色成分のそれぞれに独立的に適用される第1予測モード及び前記所定の色空間を構成する全ての色成分に一律的に適用される第2予測モードのうち何れか一つによって予測画面を生成するステップと、前記生成された第1レジデューと前記生成された予測画面との合算に該当する復元画面を生成するステップとを含む。
【0026】
前記技術的課題を解決するために、本発明は、前記の第4復号化方法をコンピュータで実行させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体を提供する。
【0027】
前記技術的課題を解決するための本発明による第4復号化装置は、ビットストリームを復号化することによって第1レジデュー間の差に該当する第2レジデューを生成する復号化部と、所定の色空間で前記復号化部によって前記生成された第2レジデュー間の合算に該当する第1レジデューを生成する逆変換部と、前記所定の色空間を構成する色成分のそれぞれに独立的に適用される第1予測モード及び前記所定の色空間を構成する全ての色成分に一律的に適用される第2予測モードのうち何れか一つによって予測画面を生成する予測部と、前記逆変換部によって生成された第1レジデューと前記予測部によって生成された予測画面との合算に該当する復元画面を生成する加算器とを備える。
【発明の効果】
【0028】
本発明によれば、全ての色成分に一律的に適用される予測モードによってレジデューを生成することにより、レジデューの相関性を高め、その結果、動画符号化の効率を向上させうる。また、本発明によれば、複数の色空間のうち何れか一つの色空間を動画イメージの特性によって適応的に選択することによって動画符号化の効率を向上させうる。さらに、本発明によれば、動画符号化過程に前記の方法を重畳的に適用することによって動画符号化の効率を極大化させうる。
【図面の簡単な説明】
【0029】
【図1】本発明の望ましい一実施形態による動画符号化装置の構成図である。
【図2】本発明の望ましい一実施形態によるブロックサイズの選択を示す図である。
【図3】本発明の望ましい一実施形態による動きベクトルの選択を示す図である。
【図4】本発明の望ましい一実施形態による予測方向の選択を示す図である。
【図5】本発明の望ましい一実施形態の適用による色成分のそれぞれのレジデューの相関性の変化を示す図である。
【図6】本発明の望ましい一実施形態の適用による色成分の間の相関性を示す図である。
【図7】本発明の望ましい一実施形態による動画復号化装置の構成図である。
【図8A】本発明の望ましい一実施形態による動画符号化方法を示すフローチャートである。
【図8B】本発明の望ましい一実施形態による動画符号化方法を示すフローチャートである。
【図9】本発明の望ましい一実施形態による動画復号化方法を示す構成図である。
【図10】本発明の望ましい実施形態についてのシミュレーション結果を示す図である。
【図11】本発明の望ましい実施形態についての無損失モードにおける符号化効率の比較を示す図である。
【図12A】本発明の望ましい実施形態についてのシミュレーションのRDカーブを示す図である。
【図12B】本発明の望ましい実施形態についてのシミュレーションのRDカーブを示す図である。
【発明を実施するための形態】
【0030】
以下、図面を参照して本発明の望ましい実施形態を詳細に説明する。
【0031】
図1は、本発明の望ましい一実施形態による動画符号化装置の構成図である。図1を参照するに、本実施形態による動画符号化装置は、色空間選択部101、インター予測モード選択部102、動き推定部103、動き補償部104、イントラ予測モード選択部105、イントラ予測部106、減算器107、レジデュー変換部108、周波数空間変換部109、量子化部110、エントロピー符号化部111、逆量子化部112、周波数空間逆変換部113、レジデュー逆変換部114、加算器115、及びフィルタ116で構成される。
【0032】
色空間選択部101は、現在画面の特性に基づいて適応的に複数の色空間のうち何れか一つの色空間を選択する。複数の色空間の例としては、YCgCo色空間及びRGB色空間が挙げられる。YCgCo色空間で、Yは、輝度成分を意味し、Coは、色差オレンジ成分を意味し、Cgは、色差グリーン成分を意味する。RGB色空間で、Rは、レッド色成分を意味し、Gは、グリーン色成分を意味し、Bは、ブルー色成分を意味する。
【0033】
本実施形態では、YCgCo色空間で現在画面を符号化する方式をRCT(Residual Color Transformation)と称し、RGB色空間で現在画面を符号化する方式をIPP(Inter−Plane Prediction)と称す。
【0034】
前記の色空間のうち、RGB色空間が人間に認識されるR成分、G成分、及びB成分で構成された色空間である。したがって、色空間選択部101によってRGB色空間でない他の色空間、すなわち、YCgCo色空間が選択された場合には、YCgCo色空間における符号化が行われた後、色ディスプレイ装置に適用するために、YCgCo色空間からRGB色空間に変換されねばならない。
【0035】
HD(High Definition)動画、フィルムスキャンイメージ、トムソンバイパーシーケンス(Thompson Viper Sequences)のような高画質イメージの集合を使用した数多くの実験の結果によれば、多様な特性とビットレートとを有するイメージについてのパナシアはない。あるイメージは、一つの色成分に深刻なフィルムグレーンノイズを有し、他のものは、サーマルノイズを有しており、さらに他のものは、飽和色特性を有している。ある場合には、RCTが効率的であり、ある場合には、IPPが効率的である。したがって、本実施形態では、RCT及びIPPのうち何れか一つをイメージ特性によって適応的に適用する。また、動画符号化装置でいかなる色変換を使用するかについては、H.264/MPEG−4AVC FRExtにおける1ビットフラグを使用して動画復号化装置に知らせうる。
【0036】
特に、動画のビットレートが高い環境でRCTがIPPより符号化効率がさらに高い。但し、RCTの場合に異なる色空間の間の変換による画質劣化が発生する。特に、現在画面にノイズが多く存在するか、または現在画面の構成が複雑な場合には、かかる画質劣化がさらに激しくなる。したがって、色空間選択部101は、現在画面にノイズが多く存在するか、または現在画面の構成が複雑な場合には、RGB色空間を選択し、現在画面にノイズがほとんど存在しないか、現在画面の構成が単純な場合には、YCgCo色空間を選択する。すなわち、色空間選択部101は、動画のビットレート、符号化シーケンスの特性に基づいて適応的に色空間を選択する。
【0037】
インター予測モード選択部102は、色空間選択部101によって選択された色空間を構成する色成分のそれぞれに独立的に適用されるインター予測モード、及び色空間選択部101によって選択された色空間を構成する全ての色成分に一律的に適用されるインター予測モードのうち何れか一つを選択する。一般的に、インター予測で全ての色成分がそれらのそれぞれの動きベクトルを有しているならば、色成分のそれぞれのレジデューは、異なる特性を有するようになり、結局、異なる色成分のレジデュー間の相関性は、小さくなる。したがって、本実施形態では、異なる色成分のレジデュー間の相関性を高めるために、全ての色成分に対して同じ予測モード、すなわち、同じブロックサイズ及び同じ動きベクトルを使用するシングルモードを提案する。これは、RGB成分が類似したテキスチャ特性を有している時に、さらに自然な画像を提供する。また、動画符号化装置でかかるシングルモード及び独立的なモードのうち何れかを使用するかについては、H.264/MPEG−4AVC FRExtにおける1ビットフラグを使用して動画復号化装置に知らせうる。
【0038】
インター予測モード選択部102がシングルモードを選択する場合を具体的に説明すれば、インター予測モード選択部102は、まず色空間選択部101によって選択された色空間を構成する全ての色成分に一律的に適用されるブロックのサイズを選択する。現在画面を構成するブロックのサイズは、16×16、16×8、8×16、8×8、8×4、4×8、4×4となる。一般的に、16×16ブロックをマクロブロックといい、これを色々なサイズに分割して得られたブロックをサブブロックという。動画の符号化及び復号化は、このようなブロック単位でなされ、動画のうちさらに精度の高い符号化及び復号化が要求される部分については、さらに小さなサイズのブロック単位でなされる。
【0039】
さらに詳細に説明すれば、インター予測モード選択部102は、色成分のそれぞれのブロックのサイズに基づいて全ての色成分に一律的に適用されるブロックのサイズを選択する。例えば、インター予測モード選択部102は、Y成分のブロックのサイズ、Co成分のブロックのサイズ、Cg成分のブロックのサイズに基づいてY成分、Co成分、Cg成分の何れもに一律的に適用されるブロックのサイズを選択する。また、インター予測モード選択部102は、R成分のブロックのサイズ、G成分のブロックのサイズ、B成分のブロックのサイズに基づいて、R成分、G成分、B成分の何れもに一律的に適用されるブロックのサイズを選択する。
【0040】
図2は、本発明の望ましい一実施形態によるブロックサイズの選択を示す図である。図2を参照するに、インター予測モード選択部102は、R成分のマクロブロックを構成するブロックのサイズ、G成分のマクロブロックを構成するブロックのサイズ、及びB成分のマクロブロックを構成するブロックのサイズを参照して全ての色成分のマクロブロックに最適のブロックのサイズを選択することによって、全ての色成分に一律的に適用されるブロックのサイズを選択する。これは、YCgCo色空間についても同様に適用される。
【0041】
次いで、インター予測モード選択部102は、前記のところによって選択されたサイズのブロック単位で色空間を構成する色成分のそれぞれの動きベクトルに基づいて、この色空間を構成する全ての色成分に一律的に適用される何れか一つの動きベクトルを選択する。さらに詳細に説明すれば、インター予測モード選択部102は、動き推定部103によって算出された色成分のそれぞれの動きベクトルに基づいて、全ての色成分に一律的に適用される動きベクトルを選択する。例えば、インター予測モード選択部102は、動き推定部103によって算出されたY成分の動きベクトル、Co成分の動きベクトル、Cg成分の動きベクトルに基づいて、Y成分、Co成分、Cg成分の何れもに一律的に適用される動きベクトルを選択する。また、インター予測モード選択部102は、動き推定部103によって算出されたR成分の動きベクトル、G成分の動きベクトル、B成分の動きベクトルに基づいて、R成分、G成分、B成分の何れもに一律的に適用される動きベクトルを選択する。
【0042】
図3は、本発明の望ましい一実施形態による動きベクトルの選択を示す図である。図3を参照するに、インター予測モード選択部102は、R成分のブロックについての動きベクトル、G成分のブロックについての動きベクトル、B成分のブロックについての動きベクトルを参照して、全ての色成分のブロックに最適の動きベクトルを選択することによって、全ての色成分に一律的に適用される動きベクトルを選択する。これは、YCgCo色空間についても同様に適用される。
【0043】
動き推定部103は、色成分ごとにインター予測モード選択部102によって選択されたインター予測モードによって、参照画面を基準に現在画面の動きを推定する。さらに詳細に説明すれば、動き推定部103は、インター予測モード選択部102によって選択されたインター予測モードによって、色成分のそれぞれに独立的に適用されるサイズのブロック単位で色空間を構成する色成分のそれぞれに独立的に適用される動きベクトルを選択するか、または全ての色成分に一律的に適用されるサイズのブロック単位で色空間を構成する全ての色成分に一律的に適用される何れか一つの動きベクトルを選択する。
【0044】
動き推定部103がシングルモードによって動きを推定する場合を具体的に説明すれば、動き推定部103は、インター予測モード選択部102によって選択されたサイズのブロック単位で参照画面と現在画面との変位に該当する動きベクトルを算出する。本実施形態において、現在画面は、現在動画符号化及び復号化の対象となる画面を意味し、参照画面は、現在画面の符号化または復号化に参照される画面を意味する。一般的に、参照画面は、現在画面の過去画面であるが、現在画面の未来画面であっても、複数の画面であってもよい。
【0045】
例えば、動き推定部103は、Y成分、Co成分、及びCg成分ごとにインター予測モード選択部102によって選択されたインター予測モードによって、参照画面を基準に現在画面の動きを推定することによって、Y成分の動きベクトル、Co成分の動きベクトル、Cg成分の動きベクトルを算出する。また、動き推定部103は、R成分、G成分、及びB成分ごとにインター予測モード選択部102によって選択されたインター予測モードによって、参照画面を基準に現在画面の動きを推定することによってR成分の動きベクトル、G成分の動きベクトル、B成分の動きベクトルを算出する。
【0046】
動き補償部104は、色成分ごとにインター予測モード選択部102によって選択されたインター予測モードによって、参照画面と現在画面との間の動きを補償する。さらに詳細に説明すれば、動き補償部104は、インター予測モード選択部102によって選択されたサイズのブロック単位でインター予測モード選択部102によって選択された動きベクトルを使用して、参照画面から現在画面についての予測画面を生成する。動き推定部103及び動き補償部104によって行われるインター予測は、現在画面と参照画面との時間的重畳性を除去するためのものである。
【0047】
例えば、動き補償部104は、Y成分、Co成分、及びCg成分ごとにインター予測モード選択部102によって選択されたインター予測モードによって、参照画面と現在画面との間の動きを補償することによって、Y成分の予測画面、Co成分の予測画面、Cg成分の予測画面を生成する。また、動き補償部104は、R成分、G成分、及びB成分ごとにインター予測モード選択部102によって選択されたインター予測モードによって、参照画面と現在画面との間の動きを補償することによってR成分の予測画面、G成分の予測画面、B成分の予測画面を生成する。
【0048】
イントラ予測モード選択部105は、色空間選択部101によって選択された色空間を構成する色成分のそれぞれに独立的に適用されるイントラ予測モード、及び色空間選択部101によって選択された色空間を構成する全ての色成分に一律的に適用されるイントラ予測モードのうち何れか一つを選択する。MPEG−4
AVC/H.264ビデオ符号化方式によれば、輝度成分については、4×4ブロック単位イントラ予測の9個のモードと、16×16ブロック単位イントラ予測の4個のモードとが存在し、色差成分については、8×8ブロック単位イントラ予測の4個のモードが存在する。一般的に、輝度成分についての予測モードと色差成分についての予測モードとは、異なるため、色成分の間の相関性は低い。これは、RCT、IPP、またはこれと類似した変換については、適していない。動画の符号化効率を高めるためには、全ての色成分に対して同じイントラ予測モードを使用することが望ましい。したがって、本実施形態では、輝度成分についての4×4、8×8、16×16のような予測モードを色差成分に適用する。
【0049】
また、イントラ予測モード選択部105は、前記のように選択されたイントラ予測モードによって、色空間を構成する色成分のそれぞれに独立的に適用される予測方向を選択するか、または色空間を構成する色成分のそれぞれの予測方向に基づいて、この色空間を構成する全ての色成分に一律的に適用される予測方向を選択する。イントラ予測モード選択部105がシングルモードを選択する場合を具体的に説明すれば、イントラ予測モード選択部105は、まず色空間選択部101によって選択された色空間を構成する全ての色成分に一律的に適用されるブロックのサイズを選択する。現在画面を構成するブロックのサイズは、16×16、8×8、4×4となる。イントラ予測におけるブロックサイズ選択も、インター予測と同様に、図2に示したように処理される。
【0050】
次いで、イントラ予測モード選択部105は、前記のところによって選択されたサイズのブロック単位で色空間を構成する色成分のそれぞれの予測方向に基づいて、この色空間を構成する全ての色成分に一律的に適用される予測方向を選択する。例えば、イントラ予測モード選択部105は、Y成分の予測方向、Co成分の予測方向、Cg成分の予測方向に基づいて、Y成分、Co成分、Cg成分の何れもに一律的に適用される予測方向を選択する。また、インター予測モード選択部102は、R成分の予測方向、G成分の予測方向、B成分の予測方向に基づいて、R成分、G成分、B成分の何れにも一律的に適用される予測方向を選択する。
【0051】
図4は、本発明の望ましい一実施形態による予測方向の選択を示す図である。図4を参照するに、イントラ予測モード選択部105は、R成分のブロックについての予測方向、G成分のブロックについての予測方向、B成分のブロックについての予測方向を参照して、全ての色成分のブロックに最適の予測方向を選択することによって全ての色成分に一律的に適用される予測方向を選択する。これは、YCgCo色空間に対しても同様に適用される。
【0052】
イントラ予測部106は、色成分ごとにイントラ予測モード選択部105によって選択されたイントラ予測モードにより、加算器115によって復元された画面内の隣接画素から現在画面を構成するブロックを予測し、このように予測されたブロックで構成された予測画面を生成する。さらに詳細に説明すれば、イントラ予測部106は、色成分のそれぞれに独立的に適用されるサイズのブロック単位で色成分のそれぞれに独立的に適用される予測方向が指示する隣接画素から現在画面を構成するブロックのそれぞれを予測し、このように予測されたブロックで構成された予測画面を生成するか、または全ての色成分に一律的に適用されるサイズのブロック単位で全ての色成分に一律的に適用される予測方向が指示する隣接画素から現在画面を構成するブロックのそれぞれを予測し、このように予測されたブロックで構成された予測画面を生成する。イントラ予測部106によって行われるイントラ予測は、現在画面内での空間的重畳性を除去するためのものである。
【0053】
例えば、イントラ予測部106は、Y成分、Co成分、及びCg成分ごとにイントラ予測モード選択部105によって選択された予測方向が指示する隣接画素から現在画面を構成するブロックのそれぞれを予測することによって、Y成分の予測画面、Co成分の予測画面、Cg成分の予測画面を生成する。また、イントラ予測部106は、R成分、G成分、及びB成分ごとにイントラ予測モード選択部105によって選択された予測方向が指示する隣接画素から現在画面を構成するブロックのそれぞれを予測することによって、R成分の予測画面、G成分の予測画面、B成分の予測画面を生成する。
【0054】
減算器107は、色成分ごとに現在画面と動き補償部104によって生成された予測画面との差に該当する第1レジデューを生成するか、または現在画面とイントラ予測部106によって生成された予測画面との差に該当する第1レジデューを生成する。例えば、減算器107は、Y成分、Co成分、及びCg成分ごとに現在画面と動き補償部104によって生成された予測画面との差を算出するか、または現在画面とイントラ予測部106によって生成された予測画面との差を算出することによって、Y成分の第1レジデュー、Co成分の第1レジデュー、Cg成分の第1レジデューを生成する。また、減算器107は、R成分、G成分、及びB成分ごとに現在画面と動き補償部104によって生成された予測画面との差を算出するか、または現在画面とイントラ予測部106によって生成された予測画面との差を算出することによって、R成分の第1レジデュー、G成分の第1レジデュー、B成分の第1レジデューを生成する。
【0055】
図5は、本発明の望ましい一実施形態の適用による色成分のそれぞれのレジデューの相関性の変化を示す図である。図5を参照するに、グラフ501と502とは、色成分のそれぞれに独立的な予測モードを適用して得られたレジデューの相関性を示している。特に、グラフ501は、R成分とG成分との相関性を示しており、グラフ502は、B成分とG成分との相関性を示している。一方、グラフ503と504とは、全ての色成分に同じ予測モードを適用して得られたレジデューの相関性を示している。特に、グラフ503は、R成分とG成分との相関性を示しており、グラフ504は、B成分とG成分との相関性を示している。図5に示された501−504から色成分のそれぞれに独立的な予測モードを適用するより、同じ予測モードを適用することが色成分のレジデュー間の相関性が高まるということが分かる。
【0056】
レジデュー変換部108は、減算器107によって生成された第1レジデュー間の差に該当する第2レジデューを生成する。本実施形態では、動画の符号化効率を向上させるために、インター予測またはイントラ予測後の色成分の間の重畳性(Redundancy)を利用する。インター予測は、時間的な重畳性を利用し、イントラ予測は、空間的な重畳性を利用するのである。しかし、インター予測またはイントラ予測後にも、色成分の間の重畳性が依然として残っている。
【0057】
図6は、本発明の望ましい一実施形態の適用による色成分の間の相関性を示す図である。図6を参照するに、グラフ601は、イントラ予測後のR成分とG成分との相関性を示しており、グラフ602は、イントラ予測後のB成分とG成分との相関性を示している。グラフ603は、インター予測後のR成分とG成分との相関性を示しており、グラフ604は、インター予測後のB成分とG成分との相関性を示している。図6に示された601−604からインター予測またはイントラ予測後にも、色成分のレジデュー間に強い相関性が存在するということが分かる。
【0058】
すなわち、レジデュー変換部108は、YCgCo色空間で次の式(1)を利用してY成分、Co成分、Cg成分のそれぞれの第1レジデュー間の差に該当する第2レジデューを生成する。特に、Y=(R+2G+B)>>2,Co=(R−B)>>1,Cg=(−R+2G−B)>>2の関係にある。
【0059】
△2B=△R−△B
t=△B+(△2B>>1)
△2R=△G−t (1)
△2G=t+(△2R>>1)
ここで、△×は、第1レジデューを意味し、△2×は、第2レジデューを意味する。また、表記“>>”は、右側シフト演算を意味し、ほぼ2で割るところとなる。また、変数tは、臨時的な計算目的として使われる。
【0060】
また、レジデュー変換部108は、RGB色空間で次の式(2)を利用してR成分、G成分、B成分それぞれの第1レジデュー間の差に該当する第2レジデューを生成する。
【0061】
△2G=△G’
△2R=△R−△G’ (2)
△2B=△B−△G’
ここで、△×は、第1レジデューを意味し、△2×は、第2レジデューを意味する。また、△×’は、復元された第1レジデューを意味する。特に、式(2)は、G成分が画像情報を多く有している時に効果的であり、R成分またはB成分を主な成分として第2レジデューを計算することもある。
【0062】
周波数空間変換部109は、レジデュー変換部108によって生成された第2レジデューを色空間から周波数空間に変換する。H.264/MPEG−4AVCでは、色空間から周波数空間に変換する方式でDHT(Discrete Hadamard Transformation)、DCT(Discrete Cosine Transformation)基盤の整数変換が導入された。
【0063】
量子化部110は、周波数空間変換部109によって変換された値を量子化する。すなわち、量子化部110は、周波数空間変換部109によって変換された周波数成分値を量子化パラメータで割り、その結果を整数値に近似化する。
【0064】
エントロピー符号化部111は、量子化部110によって量子化された値をエントロピー符号化することによってビットストリームを生成し、これを出力する。H.264/MPEG−4AVCでは、エントロピー符号化方式でCAVLC(Conte×t−Adaptive Variable Length Coding)、CABAC(Conte×t−Adaptive Binary Arithmetic Coding)が導入された。
【0065】
逆量子化部112は、量子化部110によって量子化された値を逆量子化する。すなわち、逆量子化部112は、量子化部110によって近似化した整数値に量子化パラメータを乗じることによって周波数成分値を復元する。
【0066】
周波数空間逆変換部113は、逆量子化部112によって復元された周波数成分値を周波数空間から色空間に変換することによって第2レジデューを復元する。
【0067】
レジデュー逆変換部114は、周波数空間逆変換部113によって復元された第2レジデュー間の合算に該当する第1レジデューを生成する。すなわち、レジデュー逆変換部114は、YCgCo色空間で次の式(3)を利用してY成分、Co成分、Cg成分のそれぞれの第2レジデュー間の和に該当するY成分、Co成分、Cg成分のそれぞれの第1レジデューを生成する。
【0068】
t=△2G’−(△2R’>>1)
△G’=△2R’+t
△B’=t−(△2B’>>1) (3)
△R’=△B’+△2B’
ここで、△×’は、復元された第1レジデューを意味し、△2×’は、復元された第2レジデューを意味する。
【0069】
また、レジデュー逆変換部114は、RGB色空間で次の式(4)を利用してR成分、G成分、B成分それぞれの第2レジデュー間の和に該当するR成分、G成分、B成分のそれぞれの第1レジデューを生成する。
【0070】
△G’=△2G’
△R’=△2R’+△G’ (4)
△B’=△2B’+△G’
ここで、△×’は、復元された第1レジデューを意味し、△2×’は、復元された第2レジデューを意味する。
【0071】
加算器115は、動き補償部104またはイントラ予測部106によって生成された予測画面と、レジデュー逆変換部114によって生成された第1レジデューとの合算に該当する復元画面を生成する。例えば、加算器115は、Y成分、Co成分、及びCg成分ごとに動き補償部104またはイントラ予測部106によって生成された予測画面と、レジデュー逆変換部114によって生成された第1レジデューとの合算を算出することによって、YCgCo色空間における復元画面を生成する。また、加算器115は、R成分、G成分、及びB成分ごとに動き補償部104またはイントラ予測部106によって生成された予測画面と、レジデュー逆変換部114によって生成された第1レジデューとの合算を算出することによって、RGB色空間における復元画面を生成する。
【0072】
フィルタ116は、加算器115によって生成された復元画面のブロック境界の歪曲をスムーズにすることで復元画面の画質を向上させる。これは、動画のビットレートが高い場合には、かえって高周波成分が消失される恐れがあるために使われない。
【0073】
図1に示された動画復号化装置には、色空間を適応的に適用する方式とシングルモード方式とが何れも適用されているが、当業者ならば、二つの方式のうち何れか一つのみが適用された動画復号化装置を容易に具現しうるであろう。
【0074】
図7は、本発明の望ましい一実施形態による動画復号化装置の構成図である。図7を参照するに、本実施形態による動画復号化装置は、エントロピー復号化部701、逆量子化部702、周波数空間逆変換部703、レジデュー逆変換部704、動き補償部705、イントラ予測部706、加算器707、及びフィルタ708で構成される。
【0075】
エントロピー復号化部701は、図1に示された動画符号化装置から出力されたビットストリームをエントロピー復号化することによって整数値を復元する。
【0076】
逆量子化部702は、エントロピー復号化部701によって復元された整数値を逆量子化することによって周波数成分値を復元する。すなわち、逆量子化部702は、エントロピー復号化部701によって復元された整数値に量子化パラメータを乗じることによって周波数成分値を復元する。
【0077】
周波数空間逆変換部703は、逆量子化部702によって復元された周波数成分値を周波数空間から複数の色空間のうち動画符号化装置で使われた色空間に変換することにより、この色空間を構成する色成分のそれぞれのレジデュー間の差に該当する第2レジデューを復元する。
【0078】
レジデュー逆変換部704は、複数の色空間のうち動画符号化装置で使われた色空間で周波数空間逆変換部703によって復元された第2レジデュー間の合算に該当する第1レジデューを生成する。すなわち、レジデュー逆変換部704は、YCgCo色空間で前記の式(3)を利用してY成分、Co成分、Cg成分のそれぞれの第2レジデュー間の和に該当するY成分、Co成分、Cg成分のそれぞれの第1レジデューを生成する。また、レジデュー逆変換部704は、RGB色空間で前記の式(4)を利用して、R成分、G成分、B成分のそれぞれの第2レジデュー間の和に該当するR成分、G成分、B成分のそれぞれの第1レジデューを生成する。
【0079】
動き補償部705は、色成分ごとに動画符号化装置で使われたインター予測モードによって、参照画面と現在画面との間の動きを補償する。すなわち、動き補償部705は、色成分のそれぞれに独立的に適用されるインター予測モード、または全ての色成分に一律的に適用されるインター予測モードのうち何れか一つによって、参照画面と現在画面との間の動きを補償する。
【0080】
さらに詳細に説明すれば、動き補償部705は、動画符号化装置で使われたサイズのブロック単位で動画符号化装置で使われた動きベクトルを使用して、参照画面から現在画面についての予測画面を生成する。すなわち、動き補償部705は、色成分のそれぞれに独立的に適用されるサイズのブロック単位で色成分のそれぞれに独立的に適用される動きベクトルを使用して、現在画面についての予測画面を生成するか、または全ての色成分に一律的に適用されるサイズのブロック単位で全ての色成分に一律的に適用される動きベクトルを使用して、参照画面から現在画面についての予測画面を生成する。
【0081】
イントラ予測部706は、色成分ごとに動画符号化装置で使われたイントラ予測モードによって、加算器707によって復元された画面内の隣接画素から現在画面を構成するブロックを予測し、このように予測されたブロックで構成された予測画面を生成する。すなわち、イントラ予測部706は、色成分のそれぞれに独立的に適用されるイントラ予測モード及び全ての色成分に一律的に適用されるイントラ予測モードのうち何れか一つによって加算器707によって復元された画面内の隣接画素から現在画面を構成するブロックを予測し、このように予測されたブロックで構成された予測画面を生成する。
【0082】
さらに詳細に説明すれば、イントラ予測部706は、動画符号化装置で使われた予測方向が指示する隣接画素から現在画面を構成するブロックのそれぞれを予測し、このように予測されたブロックで構成された予測画面を生成する。すなわち、イントラ予測部706は、色成分のそれぞれに独立的に適用されるサイズのブロック単位で色成分のそれぞれに独立的に適用される予測方向が指示する隣接画素から現在画面を構成するブロックのそれぞれを予測し、このように予測されたブロックで構成された予測画面を生成するか、または全ての色成分に一律的に適用されるサイズのブロック単位で全ての色成分に一律的に適用される予測方向が指示する隣接画素から現在画面を構成するブロックのそれぞれを予測し、このように予測されたブロックで構成された予測画面を生成する。
【0083】
加算器707は、動き補償部705またはイントラ予測部706によって生成された予測画面と、レジデュー逆変換部704によって生成された第1レジデューとの合算に該当する復元画面を生成する。例えば、加算器707は、Y成分、Co成分、及びCg成分ごとに動き補償部705またはイントラ予測部706によって生成された予測画面と、レジデュー逆変換部704によって生成された第1レジデューとの合算を算出することによって、YCgCo色空間における復元画面を生成する。また、加算器707は、R成分、G成分、及びB成分ごとに動き補償部705またはイントラ予測部706によって生成された予測画面と、レジデュー逆変換部704によって生成された第1レジデューとの合算を算出することによって、RGB色空間における復元画面を生成する。
【0084】
フィルタ708は、加算器707によって生成された復元画面のブロック境界の歪曲をスムーズにして復元画面の画質を向上させる。これは、動画のビットレートが高い場合には、かえって高周波成分が消失される恐れがあるために使われない。
【0085】
図8A及び図8Bは、本発明の望ましい一実施形態による動画符号化方法を示すフローチャートである。図8A及び図8Bを参照するに、本実施形態による動画符号化方法は、図1に示された動画符号化装置で時系列的に処理されるステップで構成される。したがって、以下省略された内容であっても、図1に示された動画符号化装置について前述された内容は、本実施形態による動画符号化方法にも適用される。
【0086】
ステップ801で、動画符号化装置は、現在画面の特性に基づいて適応的に複数の色空間のうち何れか一つの色空間を選択する。
【0087】
ステップ802で、動画符号化装置は、インター予測なのか、そうでなければイントラ予測なのかを判断し、インター予測である場合には、ステップ803に進み、イントラ予測である場合には、ステップ806に進む。
【0088】
ステップ803で、動画符号化装置は、ステップ801で選択された色空間を構成する色成分のそれぞれに独立的に適用されるインター予測モード、及びステップ801で選択された色空間を構成する全ての色成分に一律的に適用されるインター予測モードのうち何れか一つを選択する。
【0089】
ステップ804で、動画符号化装置は、803ステップで選択されたインター予測モードによって、色空間を構成する色成分のそれぞれに独立的に適用される動きベクトルを選択するか、または色空間を構成する全ての色成分に一律的に適用される何れか一つの動きベクトルを選択する。
【0090】
ステップ805で、動画符号化装置は、ステップ804で選択された動きベクトルを使用して、参照画面から現在画面についての予測画面を生成する。
【0091】
ステップ806で、動画符号化装置は、ステップ801で選択された色空間を構成する色成分のそれぞれに独立的に適用されるイントラ予測モード、及びステップ801で選択された色空間を構成する全ての色成分に一律的に適用されるイントラ予測モードのうち何れか一つを選択する。
【0092】
ステップ807で、動画符号化装置は、ステップ806で選択されたイントラ予測モードによって、色空間を構成する色成分のそれぞれに独立的に適用される予測方向を選択するか、または色空間を構成する色成分のそれぞれの予測方向に基づいてこの色空間を構成する全ての色成分に一律的に適用される予測方向を選択する。
【0093】
ステップ808で、動画符号化装置は、色成分ごとにステップ807で選択された予測方向が指示する隣接画素から現在画面を構成するブロックのそれぞれを予測し、このように予測されたブロックで構成された予測画面を生成する。
【0094】
ステップ809で、動画符号化装置は、色成分ごとに現在画面と、ステップ805またはステップ808で生成された予測画面との差に該当する第1レジデューを生成する。
【0095】
ステップ810で、動画符号化装置は、ステップ809で生成された第1レジデュー間の差に該当する第2レジデューを生成する。
【0096】
ステップ811で、動画符号化装置は、ステップ810で生成された第2レジデューを色空間から周波数空間に変換する。
【0097】
ステップ812で、動画符号化装置は、ステップ811から変換された値を量子化する。
【0098】
ステップ813で、動画符号化装置は、ステップ812で量子化された値をエントロピー符号化することによってビットストリームを生成し、これを出力する。
【0099】
ステップ814で、動画符号化装置は、ステップ812で量子化された値を逆量子化することによって周波数成分値を復元する。
【0100】
ステップ815で、動画符号化装置は、ステップ814で復元された周波数成分値を周波数空間から色空間に変換することによって第2レジデューを復元する。
【0101】
ステップ816で、動画符号化装置は、ステップ815で復元された第2レジデュー間の合算に該当する第1レジデューを生成する。
【0102】
ステップ817で、動画符号化装置は、色成分ごとにステップ805またはステップ808で生成された予測画面と、ステップ816で生成された第1レジデューとの合算に該当する復元画面を生成する。
【0103】
ステップ818で、動画符号化装置は、ステップ816で生成された復元画面のブロック境界の歪曲をスムーズにして復元画面の画質を向上させる。
【0104】
図9は、本発明の望ましい一実施形態による動画復号化方法の構成図である。図9を参照するに、本実施形態による動画復号化方法は、図7に示された動画復号化装置で時系列的に処理されるステップで構成される。したがって、以下省略された内容であっても、図7に示された動画復号化装置について前述された内容は、本実施形態による動画復号化方法にも適用される。
【0105】
ステップ901で、動画復号化装置は、図1に示された動画符号化装置から出力されたビットストリームをエントロピー復号化することによって整数値を復元する。
【0106】
ステップ902で、動画復号化装置は、ステップ902で復元された整数値を逆量子化することによって周波数成分値を復元する。
【0107】
ステップ903で、動画復号化装置は、ステップ902で復元された周波数成分値を周波数空間から、複数の色空間のうち動画符号化装置で使われた色空間に変換することにより、この色空間を構成する色成分のそれぞれの第1レジデュー間の差に該当する第2レジデューを復元する。
【0108】
ステップ904で、動画復号化装置は、複数の色空間のうち動画符号化装置で使われた色空間でステップ903で復元された第2レジデュー間の合算に該当する第1レジデューを生成する。
【0109】
ステップ905で、動画符号化装置は、インター予測なのか、そうでなければ、イントラ予測なのかを判断し、インター予測である場合には、ステップ906に進み、イントラ予測である場合には、ステップ907に進む。
【0110】
ステップ906で、動画復号化装置は、色成分のそれぞれに独立的に適用されるインター予測モードまたは全ての色成分に一律的に適用されるインター予測モードのうち何れか一つによって、参照画面と現在画面との間の動きを補償する。
【0111】
ステップ907で、動画復号化装置は、色成分のそれぞれに独立的に適用されるイントラ予測モード及び全ての色成分に一律的に適用されるイントラ予測モードのうち何れか一つによって、復元された画面内の隣接画素から現在画面を構成するブロックを予測し、このように予測されたブロックで構成された予測画面を生成する。
【0112】
ステップ908で、動画復号化装置は、ステップ906またはステップ907によって生成された予測画面と、ステップ904によって生成された第1レジデューとの合算に該当する復元画面を生成する。
【0113】
ステップ909で、動画復号化装置は、ステップ908で生成された復元画面のブロック境界の歪曲をスムーズにして復元画面の画質を向上させる。
【0114】
図10は、本発明の望ましい実施形態についてのシミュレーション結果を示す図である。図10のテーブル1001及びテーブル1002に示したように、本実施形態、すなわち、シングルモード予測におけるRCT及びIPPとH.264/MPEG−4AVC FRE×tとを比較することにより本実施形態を評価した。シミュレーションとしては、JM9.3レファレンスソフトウェアが使われた。テスト条件は、次の通りである。テスト材料は、フィルムとバイパーシーケンス(1920×1088@24Hz,progressive)であり、探索領域は、64であり、量子化パラメータは、12,18,24,30,36であり、参照画面、すなわち参照フレームの数は、3であり、エントロピー符号化は、CABACであり、RD最適化モード選択は、オンであり、GOP(グループ オブ ピクチャー)構造は、IBBPであり、スライスグループの数は、1である。
【0115】
図10における方法のそれぞれは、次の通りである。IPPは、IPPとシングルモード予測とを使用した本実施形態の方法であり、RCTは、RCTとシングルモード予測とを使用した本実施形態の方法であり、RCT(FRE×T)は、レジデュアル色変換についてYCgCoを使用したRGB符号化であり、YCgCoは、符号化前にRGB入力データがYCgCoに変換される外部YCgCo符号化である。特に、テーブル1001では、復元されたRGBイメージの忠実度(Fidelity)を評価するために、全ての色成分についてのPSNR(Peak Signal to Noise Rate)の平均、すなわち、RGB成分の平均が測定された。テーブル1001は、二つの異なる高ビットレート(20Mbps及び60Mbps)におけるYCgCo方法についてのそれぞれの方法のPSNRゲインを表している。また、テーブル1002では、輝度チャンネル(最も重要なチャンネル)上の影響を孤立させるために、色差チャンネルに対してほぼ同じ忠実度(Fidelity)を有しているYCgCoドメインでYPSNRの結果が比較された。
【0116】
図11は、本発明の望ましい実施形態についての無損失モードにおける符号化効率の比較を示す図である。
【0117】
近い将来には、ビデオの無損失及びほぼ無損失圧縮の支援が重要になる。H.264/MPEG−4AVC FRE×tにおける無損失符号化は、周波数空間変換と量子化過程とが省略されることによって具現される。前記本実施形態も周波数空間変換と量子化との過程が省略されることによって無損失符号化に適用される。図11に示されたように、無損失符号化でIPPとシングルモード予測との効率が最も優れる。
【0118】
図12A及び図12Bは、本発明の望ましい実施形態についてのシミュレーションのRD(Rate Distortion)カーブを示す図である。図12A及び図12Bでは、イントラ符号化のみのシミュレーションが行われた。特に、独立的なイントラ予測モードを適用する成果を評価するために、全ての色成分は、単色イメージとして扱われた。
【0119】
一方、前述した本発明の実施形態は、コンピュータで実行できるプログラムで作成可能であり、コンピュータで読み取り可能な記録媒体を利用して前記プログラムを動作させる汎用ディジタルコンピュータで具現される。また、前述した本発明の実施形態で使われたデータの構造は、コンピュータで読み取り可能な記録媒体に色々な手段を通じて記録されうる。
【0120】
前記コンピュータで読み取り可能な記録媒体は、マグネチック保存媒体(例えば、ROM(リード オンリ メモリ)、フロッピー(登録商標)ディスク、ハードディスクなど)、光学的判読媒体(例えば、CD−ROM、DVD(デジタル ヴァーサタイル ディスプレイ)など)及びキャリアウェーブ(例えば、インターネットを通じた伝送)のような保存媒体を含む。
【0121】
以上、本発明についてその望ましい実施形態を中心に説明した。当業者は、本発明が本発明の本質的な特性から逸脱しない範囲で変形された形態で具現されることを理解できるであろう。したがって、開示された実施形態は、限定的な観点でなく、説明的な観点で考慮されねばならない。本発明の範囲は、前述した説明でなく、特許請求の範囲に表れており、それと同等な範囲内にある全ての差異点は、本発明に含まれていると解釈されねばならない。
【符号の説明】
【0122】
101:色空間選択部
102:インター予測モード選択部
103:動き推定部
104:動き補償部
105:イントラ予測選択部
106:イントラ予測部
107:減算器
108:レジデュー変換部
109:周波数空間変換部
110:量子化部
111:エントロピー符号化部
112:逆量子化部
113:周波数空間逆変換部
114:レジデュー逆変換部
115:加算器
116:フィルタ
【技術分野】
【0001】
本発明は、残差生成方法及び装置、並びに復元画面生成方法及び装置に係り、特に、H.264/MPEG−4AVC(アドバンスト ビデオ コーディング)Fidelity Range Extensions(FRExt)標準分野における動画を符号化または復号化する方法及び装置に関する。
【背景技術】
【0002】
“レジデュアル色変換”と呼ばれる新たなRGB符号化技術は、H.264/MPEG−4AVC FRExt標準化過程で開発された。これは、RGB色空間をYCbCr色空間に変換する時に発生する画質劣化を防止するためのものである。しかし、H.264/MPEG−4AVC FRExt上のRGB符号化技術も、動画再生機器に適用するにはまだ動画符号化効率が十分に高くないとの問題点があった。
【発明の概要】
【発明が解決しようとする課題】
【0003】
本発明が解決しようとする技術的課題は、H.264/MPEG−4AVC FRExt上のRGB符号化技術の動画符号化効率を高める装置及び方法を提供することである。また、前記方法をコンピュータで実行させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体を提供することである。
【課題を解決するための手段】
【0004】
前記技術的課題を解決するための本発明による第1符号化方法は、所定の色空間を構成する全ての色成分に一律的に適用される予測モードを選択するステップと、前記選択された予測モードによって前記色成分のそれぞれについての現在画面と予測画面との差に該当する第1レジデューを生成するステップと、前記生成された第1レジデュー間の差に該当する第2レジデューを生成するステップと、前記生成された第2レジデューを符号化するステップと、を含む。
【0005】
前記技術的課題を解決するために、本発明は、前記第1符号化方法をコンピュータで実行させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体を提供する。
【0006】
前記技術的課題を解決するための本発明による第1符号化装置は、所定の色空間を構成する全ての色成分に一律的に適用される予測モードを選択する選択部と、前記選択部によって選択された予測モードによって前記色成分のそれぞれについての現在画面と予測画面との差に該当する第1レジデューを生成する減算器と、前記生成部によって生成された第1レジデュー間の差に該当する第2レジデューを生成する変換部と、前記変換部によって生成された第2レジデューを符号化する符号化部と、を備える。
【0007】
前記技術的課題を解決するための本発明による第2符号化方法は、複数の色空間のうち何れか一つの色空間を選択するステップと、前記選択された色空間を構成する色成分のそれぞれについての現在画面と予測画面との差に該当する第1レジデューを生成するステップと、前記生成された第1レジデュー間の差に該当する第2レジデューを生成するステップと、前記生成された第2レジデューを符号化するステップと、を含む。
【0008】
前記技術的課題を解決するために、本発明は、前記の第2符号化方法をコンピュータで実行させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体を提供する。
【0009】
前記技術的課題を解決するための本発明による第2符号化装置は、複数の色空間のうち何れか一つの色空間を選択する選択部と、前記選択部によって選択された色空間を構成する色成分ごとに現在画面と予測画面との差に該当する第1レジデューを生成する生成部と、前記生成部によって生成された第1レジデュー間の差に該当する第2レジデューを生成する変換部と、前記変換部によって生成された第2レジデューを符号化する符号化部と、を備える。
【0010】
前記技術的課題を解決するための本発明による第3符号化方法は、複数の色空間のうち何れか一つの色空間を選択するステップと、前記選択された色空間を構成する全ての色成分に一律的に適用される予測モードを選択するステップと、前記選択された予測モードによって前記色成分のそれぞれについての現在画面と予測画面との差に該当する第1レジデューを生成するステップと、前記生成された第1レジデュー間の差に該当する第2レジデューを生成するステップと、前記生成された第2レジデューを符号化するステップと、を含む。
【0011】
前記技術的課題を解決するために、本発明は、前記の第3符号化方法をコンピュータで実行させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体を提供する。
【0012】
前記技術的課題を解決するための本発明による第3符号化装置は、複数の色空間を選択する第1選択部と、前記第1選択部によって選択された色空間を構成する全ての色成分に一律的に適用される予測モードを選択する第2選択部と、前記第2選択部によって選択された予測モードによって前記色成分のそれぞれについての現在画面と予測画面との差に該当する第1レジデューを生成する減算器と、前記減算器によって生成された第1レジデュー間の差に該当する第2レジデューを生成する変換部と、前記変換部によって生成された第2レジデューを符号化する符号化部と、を備える。
【0013】
前記技術的課題を解決するための本発明による第4符号化方法は、所定の色空間を構成する色成分のそれぞれに独立的に適用される第1予測モード及び前記所定の色空間を構成する全ての色成分に一律的に適用される第2予測モードのうち何れか一つを選択するステップと、前記選択された予測モードによって前記色成分のそれぞれについての現在画面と予測画面との差に該当する第1レジデューを生成するステップと、前記生成された第1レジデュー間の差に該当する第2レジデューを生成するステップと、前記生成された第2レジデューを符号化するステップと、を含む。
【0014】
前記技術的課題を解決するために、本発明は、前記の第4符号化方法をコンピュータで実行させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体を提供する。
【0015】
前記技術的課題を解決するための本発明による第4符号化装置は、所定の色空間を構成する色成分のそれぞれに独立的に適用される第1予測モード及び前記所定の色空間を構成する全ての色成分に一律的に適用される第2予測モードのうち何れか一つを選択する選択部と、前記選択部によって選択された第1予測モードまたは第2予測モードによって前記色成分のそれぞれについての現在画面と予測画面との差に該当する第1レジデューを生成する減算器と、前記減算器によって生成された第1レジデュー間の差に該当する第2レジデューを生成する変換部と、前記変換部によって生成された第2レジデューを符号化する符号化部と、を備える。
【0016】
前記技術的課題を解決するための本発明による第1復号化方法は、ビットストリームを復号化することによって第1レジデュー間の差に該当する第2レジデューを生成するステップと、所定の色空間で前記生成された第2レジデュー間の合算に該当する第1レジデューを生成するステップと、前記所定の色空間を構成する全ての色成分に一律的に適用される予測モードによって予測画面を生成するステップと、前記生成された第1レジデューと前記生成された予測画面との合算に該当する復元画面を生成するステップと、を含む。
【0017】
前記技術的課題を解決するために、本発明は、前記の第1復号化方法をコンピュータで実行させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体を提供する。
【0018】
前記技術的課題を解決するための本発明による第1復号化装置は、ビットストリームを復号化することによって第1レジデュー間の差に該当する第2レジデューを生成する復号化部と、所定の色空間で前記復号化部によって生成された第2レジデュー間の合算に該当する第1レジデューを生成する逆変換部と、前記所定の色空間を構成する全ての色成分に一律的に適用される予測モードによって予測画面を生成する予測部と、前記逆変換部によって生成された第1レジデューと前記予測部によって生成された予測画面との合算に該当する復元画面を生成する加算器とを備える。
【0019】
前記技術的課題を解決するための本発明による第2復号化方法は、ビットストリームを復号化することによって第1レジデュー間の差に該当する第2レジデューを生成するステップと、複数の色空間のうち何れか一つの色空間で前記生成された第2レジデュー間の合算に該当する第1レジデューを生成するステップと、前記生成された第1レジデューと予測画面との合算に該当する復元画面を生成するステップとを含む。
【0020】
前記技術的課題を解決するために、本発明は、前記の第2復号化方法をコンピュータで実行させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体を提供する。
【0021】
前記技術的課題を解決するための本発明による第2復号化装置は、ビットストリームを復号化することによって第1レジデュー間の差に該当する第2レジデューを生成する復号化部と、複数の色空間のうち何れか一つの色空間で前記復号化部によって生成された第2レジデュー間の合算に該当する第1レジデューを生成する逆変換部と、前記生成された第1レジデューと予測画面との合算に該当する復元画面を生成する加算器とを備える。
【0022】
前記技術的課題を解決するための本発明による第3復号化方法は、ビットストリームを復号化することによって第1レジデュー間の差に該当する第2レジデューを生成するステップと、複数の色空間のうち何れか一つの色空間で前記生成された第2レジデュー間の合算に該当する第1レジデューを生成するステップと、前記色空間を構成する全ての色成分に一律的に適用される予測モードによって予測画面を生成するステップと、前記生成された第1レジデューと前記生成された予測画面との合算に該当する復元画面を生成するステップと、を含む。
【0023】
前記技術的課題を解決するために、本発明は、前記の第3復号化方法をコンピュータで実行させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体を提供する。
【0024】
前記技術的課題を解決するための本発明による第3復号化装置は、ビットストリームを復号化することによって第1レジデュー間の差に該当する第2レジデューを生成する復号化部と、複数の色空間のうち何れか一つの色空間で前記復号化部によって生成された第2レジデュー間の合算に該当する第1レジデューを生成する逆変換部と、前記色空間を構成する全ての色成分に一律的に適用される予測モードによって予測画面を生成する予測部と、前記逆変換部によって生成された第1レジデューと前記予測部によって生成された予測画面との合算に該当する復元画面を生成する加算器とを備える。
【0025】
前記技術的課題を解決するための本発明による第4復号化方法は、ビットストリームを復号化することによって第1レジデュー間の差に該当する第2レジデューを生成するステップと、所定の色空間で前記生成された第2レジデュー間の合算に該当する第1レジデューを生成するステップと、前記所定の色空間を構成する色成分のそれぞれに独立的に適用される第1予測モード及び前記所定の色空間を構成する全ての色成分に一律的に適用される第2予測モードのうち何れか一つによって予測画面を生成するステップと、前記生成された第1レジデューと前記生成された予測画面との合算に該当する復元画面を生成するステップとを含む。
【0026】
前記技術的課題を解決するために、本発明は、前記の第4復号化方法をコンピュータで実行させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体を提供する。
【0027】
前記技術的課題を解決するための本発明による第4復号化装置は、ビットストリームを復号化することによって第1レジデュー間の差に該当する第2レジデューを生成する復号化部と、所定の色空間で前記復号化部によって前記生成された第2レジデュー間の合算に該当する第1レジデューを生成する逆変換部と、前記所定の色空間を構成する色成分のそれぞれに独立的に適用される第1予測モード及び前記所定の色空間を構成する全ての色成分に一律的に適用される第2予測モードのうち何れか一つによって予測画面を生成する予測部と、前記逆変換部によって生成された第1レジデューと前記予測部によって生成された予測画面との合算に該当する復元画面を生成する加算器とを備える。
【発明の効果】
【0028】
本発明によれば、全ての色成分に一律的に適用される予測モードによってレジデューを生成することにより、レジデューの相関性を高め、その結果、動画符号化の効率を向上させうる。また、本発明によれば、複数の色空間のうち何れか一つの色空間を動画イメージの特性によって適応的に選択することによって動画符号化の効率を向上させうる。さらに、本発明によれば、動画符号化過程に前記の方法を重畳的に適用することによって動画符号化の効率を極大化させうる。
【図面の簡単な説明】
【0029】
【図1】本発明の望ましい一実施形態による動画符号化装置の構成図である。
【図2】本発明の望ましい一実施形態によるブロックサイズの選択を示す図である。
【図3】本発明の望ましい一実施形態による動きベクトルの選択を示す図である。
【図4】本発明の望ましい一実施形態による予測方向の選択を示す図である。
【図5】本発明の望ましい一実施形態の適用による色成分のそれぞれのレジデューの相関性の変化を示す図である。
【図6】本発明の望ましい一実施形態の適用による色成分の間の相関性を示す図である。
【図7】本発明の望ましい一実施形態による動画復号化装置の構成図である。
【図8A】本発明の望ましい一実施形態による動画符号化方法を示すフローチャートである。
【図8B】本発明の望ましい一実施形態による動画符号化方法を示すフローチャートである。
【図9】本発明の望ましい一実施形態による動画復号化方法を示す構成図である。
【図10】本発明の望ましい実施形態についてのシミュレーション結果を示す図である。
【図11】本発明の望ましい実施形態についての無損失モードにおける符号化効率の比較を示す図である。
【図12A】本発明の望ましい実施形態についてのシミュレーションのRDカーブを示す図である。
【図12B】本発明の望ましい実施形態についてのシミュレーションのRDカーブを示す図である。
【発明を実施するための形態】
【0030】
以下、図面を参照して本発明の望ましい実施形態を詳細に説明する。
【0031】
図1は、本発明の望ましい一実施形態による動画符号化装置の構成図である。図1を参照するに、本実施形態による動画符号化装置は、色空間選択部101、インター予測モード選択部102、動き推定部103、動き補償部104、イントラ予測モード選択部105、イントラ予測部106、減算器107、レジデュー変換部108、周波数空間変換部109、量子化部110、エントロピー符号化部111、逆量子化部112、周波数空間逆変換部113、レジデュー逆変換部114、加算器115、及びフィルタ116で構成される。
【0032】
色空間選択部101は、現在画面の特性に基づいて適応的に複数の色空間のうち何れか一つの色空間を選択する。複数の色空間の例としては、YCgCo色空間及びRGB色空間が挙げられる。YCgCo色空間で、Yは、輝度成分を意味し、Coは、色差オレンジ成分を意味し、Cgは、色差グリーン成分を意味する。RGB色空間で、Rは、レッド色成分を意味し、Gは、グリーン色成分を意味し、Bは、ブルー色成分を意味する。
【0033】
本実施形態では、YCgCo色空間で現在画面を符号化する方式をRCT(Residual Color Transformation)と称し、RGB色空間で現在画面を符号化する方式をIPP(Inter−Plane Prediction)と称す。
【0034】
前記の色空間のうち、RGB色空間が人間に認識されるR成分、G成分、及びB成分で構成された色空間である。したがって、色空間選択部101によってRGB色空間でない他の色空間、すなわち、YCgCo色空間が選択された場合には、YCgCo色空間における符号化が行われた後、色ディスプレイ装置に適用するために、YCgCo色空間からRGB色空間に変換されねばならない。
【0035】
HD(High Definition)動画、フィルムスキャンイメージ、トムソンバイパーシーケンス(Thompson Viper Sequences)のような高画質イメージの集合を使用した数多くの実験の結果によれば、多様な特性とビットレートとを有するイメージについてのパナシアはない。あるイメージは、一つの色成分に深刻なフィルムグレーンノイズを有し、他のものは、サーマルノイズを有しており、さらに他のものは、飽和色特性を有している。ある場合には、RCTが効率的であり、ある場合には、IPPが効率的である。したがって、本実施形態では、RCT及びIPPのうち何れか一つをイメージ特性によって適応的に適用する。また、動画符号化装置でいかなる色変換を使用するかについては、H.264/MPEG−4AVC FRExtにおける1ビットフラグを使用して動画復号化装置に知らせうる。
【0036】
特に、動画のビットレートが高い環境でRCTがIPPより符号化効率がさらに高い。但し、RCTの場合に異なる色空間の間の変換による画質劣化が発生する。特に、現在画面にノイズが多く存在するか、または現在画面の構成が複雑な場合には、かかる画質劣化がさらに激しくなる。したがって、色空間選択部101は、現在画面にノイズが多く存在するか、または現在画面の構成が複雑な場合には、RGB色空間を選択し、現在画面にノイズがほとんど存在しないか、現在画面の構成が単純な場合には、YCgCo色空間を選択する。すなわち、色空間選択部101は、動画のビットレート、符号化シーケンスの特性に基づいて適応的に色空間を選択する。
【0037】
インター予測モード選択部102は、色空間選択部101によって選択された色空間を構成する色成分のそれぞれに独立的に適用されるインター予測モード、及び色空間選択部101によって選択された色空間を構成する全ての色成分に一律的に適用されるインター予測モードのうち何れか一つを選択する。一般的に、インター予測で全ての色成分がそれらのそれぞれの動きベクトルを有しているならば、色成分のそれぞれのレジデューは、異なる特性を有するようになり、結局、異なる色成分のレジデュー間の相関性は、小さくなる。したがって、本実施形態では、異なる色成分のレジデュー間の相関性を高めるために、全ての色成分に対して同じ予測モード、すなわち、同じブロックサイズ及び同じ動きベクトルを使用するシングルモードを提案する。これは、RGB成分が類似したテキスチャ特性を有している時に、さらに自然な画像を提供する。また、動画符号化装置でかかるシングルモード及び独立的なモードのうち何れかを使用するかについては、H.264/MPEG−4AVC FRExtにおける1ビットフラグを使用して動画復号化装置に知らせうる。
【0038】
インター予測モード選択部102がシングルモードを選択する場合を具体的に説明すれば、インター予測モード選択部102は、まず色空間選択部101によって選択された色空間を構成する全ての色成分に一律的に適用されるブロックのサイズを選択する。現在画面を構成するブロックのサイズは、16×16、16×8、8×16、8×8、8×4、4×8、4×4となる。一般的に、16×16ブロックをマクロブロックといい、これを色々なサイズに分割して得られたブロックをサブブロックという。動画の符号化及び復号化は、このようなブロック単位でなされ、動画のうちさらに精度の高い符号化及び復号化が要求される部分については、さらに小さなサイズのブロック単位でなされる。
【0039】
さらに詳細に説明すれば、インター予測モード選択部102は、色成分のそれぞれのブロックのサイズに基づいて全ての色成分に一律的に適用されるブロックのサイズを選択する。例えば、インター予測モード選択部102は、Y成分のブロックのサイズ、Co成分のブロックのサイズ、Cg成分のブロックのサイズに基づいてY成分、Co成分、Cg成分の何れもに一律的に適用されるブロックのサイズを選択する。また、インター予測モード選択部102は、R成分のブロックのサイズ、G成分のブロックのサイズ、B成分のブロックのサイズに基づいて、R成分、G成分、B成分の何れもに一律的に適用されるブロックのサイズを選択する。
【0040】
図2は、本発明の望ましい一実施形態によるブロックサイズの選択を示す図である。図2を参照するに、インター予測モード選択部102は、R成分のマクロブロックを構成するブロックのサイズ、G成分のマクロブロックを構成するブロックのサイズ、及びB成分のマクロブロックを構成するブロックのサイズを参照して全ての色成分のマクロブロックに最適のブロックのサイズを選択することによって、全ての色成分に一律的に適用されるブロックのサイズを選択する。これは、YCgCo色空間についても同様に適用される。
【0041】
次いで、インター予測モード選択部102は、前記のところによって選択されたサイズのブロック単位で色空間を構成する色成分のそれぞれの動きベクトルに基づいて、この色空間を構成する全ての色成分に一律的に適用される何れか一つの動きベクトルを選択する。さらに詳細に説明すれば、インター予測モード選択部102は、動き推定部103によって算出された色成分のそれぞれの動きベクトルに基づいて、全ての色成分に一律的に適用される動きベクトルを選択する。例えば、インター予測モード選択部102は、動き推定部103によって算出されたY成分の動きベクトル、Co成分の動きベクトル、Cg成分の動きベクトルに基づいて、Y成分、Co成分、Cg成分の何れもに一律的に適用される動きベクトルを選択する。また、インター予測モード選択部102は、動き推定部103によって算出されたR成分の動きベクトル、G成分の動きベクトル、B成分の動きベクトルに基づいて、R成分、G成分、B成分の何れもに一律的に適用される動きベクトルを選択する。
【0042】
図3は、本発明の望ましい一実施形態による動きベクトルの選択を示す図である。図3を参照するに、インター予測モード選択部102は、R成分のブロックについての動きベクトル、G成分のブロックについての動きベクトル、B成分のブロックについての動きベクトルを参照して、全ての色成分のブロックに最適の動きベクトルを選択することによって、全ての色成分に一律的に適用される動きベクトルを選択する。これは、YCgCo色空間についても同様に適用される。
【0043】
動き推定部103は、色成分ごとにインター予測モード選択部102によって選択されたインター予測モードによって、参照画面を基準に現在画面の動きを推定する。さらに詳細に説明すれば、動き推定部103は、インター予測モード選択部102によって選択されたインター予測モードによって、色成分のそれぞれに独立的に適用されるサイズのブロック単位で色空間を構成する色成分のそれぞれに独立的に適用される動きベクトルを選択するか、または全ての色成分に一律的に適用されるサイズのブロック単位で色空間を構成する全ての色成分に一律的に適用される何れか一つの動きベクトルを選択する。
【0044】
動き推定部103がシングルモードによって動きを推定する場合を具体的に説明すれば、動き推定部103は、インター予測モード選択部102によって選択されたサイズのブロック単位で参照画面と現在画面との変位に該当する動きベクトルを算出する。本実施形態において、現在画面は、現在動画符号化及び復号化の対象となる画面を意味し、参照画面は、現在画面の符号化または復号化に参照される画面を意味する。一般的に、参照画面は、現在画面の過去画面であるが、現在画面の未来画面であっても、複数の画面であってもよい。
【0045】
例えば、動き推定部103は、Y成分、Co成分、及びCg成分ごとにインター予測モード選択部102によって選択されたインター予測モードによって、参照画面を基準に現在画面の動きを推定することによって、Y成分の動きベクトル、Co成分の動きベクトル、Cg成分の動きベクトルを算出する。また、動き推定部103は、R成分、G成分、及びB成分ごとにインター予測モード選択部102によって選択されたインター予測モードによって、参照画面を基準に現在画面の動きを推定することによってR成分の動きベクトル、G成分の動きベクトル、B成分の動きベクトルを算出する。
【0046】
動き補償部104は、色成分ごとにインター予測モード選択部102によって選択されたインター予測モードによって、参照画面と現在画面との間の動きを補償する。さらに詳細に説明すれば、動き補償部104は、インター予測モード選択部102によって選択されたサイズのブロック単位でインター予測モード選択部102によって選択された動きベクトルを使用して、参照画面から現在画面についての予測画面を生成する。動き推定部103及び動き補償部104によって行われるインター予測は、現在画面と参照画面との時間的重畳性を除去するためのものである。
【0047】
例えば、動き補償部104は、Y成分、Co成分、及びCg成分ごとにインター予測モード選択部102によって選択されたインター予測モードによって、参照画面と現在画面との間の動きを補償することによって、Y成分の予測画面、Co成分の予測画面、Cg成分の予測画面を生成する。また、動き補償部104は、R成分、G成分、及びB成分ごとにインター予測モード選択部102によって選択されたインター予測モードによって、参照画面と現在画面との間の動きを補償することによってR成分の予測画面、G成分の予測画面、B成分の予測画面を生成する。
【0048】
イントラ予測モード選択部105は、色空間選択部101によって選択された色空間を構成する色成分のそれぞれに独立的に適用されるイントラ予測モード、及び色空間選択部101によって選択された色空間を構成する全ての色成分に一律的に適用されるイントラ予測モードのうち何れか一つを選択する。MPEG−4
AVC/H.264ビデオ符号化方式によれば、輝度成分については、4×4ブロック単位イントラ予測の9個のモードと、16×16ブロック単位イントラ予測の4個のモードとが存在し、色差成分については、8×8ブロック単位イントラ予測の4個のモードが存在する。一般的に、輝度成分についての予測モードと色差成分についての予測モードとは、異なるため、色成分の間の相関性は低い。これは、RCT、IPP、またはこれと類似した変換については、適していない。動画の符号化効率を高めるためには、全ての色成分に対して同じイントラ予測モードを使用することが望ましい。したがって、本実施形態では、輝度成分についての4×4、8×8、16×16のような予測モードを色差成分に適用する。
【0049】
また、イントラ予測モード選択部105は、前記のように選択されたイントラ予測モードによって、色空間を構成する色成分のそれぞれに独立的に適用される予測方向を選択するか、または色空間を構成する色成分のそれぞれの予測方向に基づいて、この色空間を構成する全ての色成分に一律的に適用される予測方向を選択する。イントラ予測モード選択部105がシングルモードを選択する場合を具体的に説明すれば、イントラ予測モード選択部105は、まず色空間選択部101によって選択された色空間を構成する全ての色成分に一律的に適用されるブロックのサイズを選択する。現在画面を構成するブロックのサイズは、16×16、8×8、4×4となる。イントラ予測におけるブロックサイズ選択も、インター予測と同様に、図2に示したように処理される。
【0050】
次いで、イントラ予測モード選択部105は、前記のところによって選択されたサイズのブロック単位で色空間を構成する色成分のそれぞれの予測方向に基づいて、この色空間を構成する全ての色成分に一律的に適用される予測方向を選択する。例えば、イントラ予測モード選択部105は、Y成分の予測方向、Co成分の予測方向、Cg成分の予測方向に基づいて、Y成分、Co成分、Cg成分の何れもに一律的に適用される予測方向を選択する。また、インター予測モード選択部102は、R成分の予測方向、G成分の予測方向、B成分の予測方向に基づいて、R成分、G成分、B成分の何れにも一律的に適用される予測方向を選択する。
【0051】
図4は、本発明の望ましい一実施形態による予測方向の選択を示す図である。図4を参照するに、イントラ予測モード選択部105は、R成分のブロックについての予測方向、G成分のブロックについての予測方向、B成分のブロックについての予測方向を参照して、全ての色成分のブロックに最適の予測方向を選択することによって全ての色成分に一律的に適用される予測方向を選択する。これは、YCgCo色空間に対しても同様に適用される。
【0052】
イントラ予測部106は、色成分ごとにイントラ予測モード選択部105によって選択されたイントラ予測モードにより、加算器115によって復元された画面内の隣接画素から現在画面を構成するブロックを予測し、このように予測されたブロックで構成された予測画面を生成する。さらに詳細に説明すれば、イントラ予測部106は、色成分のそれぞれに独立的に適用されるサイズのブロック単位で色成分のそれぞれに独立的に適用される予測方向が指示する隣接画素から現在画面を構成するブロックのそれぞれを予測し、このように予測されたブロックで構成された予測画面を生成するか、または全ての色成分に一律的に適用されるサイズのブロック単位で全ての色成分に一律的に適用される予測方向が指示する隣接画素から現在画面を構成するブロックのそれぞれを予測し、このように予測されたブロックで構成された予測画面を生成する。イントラ予測部106によって行われるイントラ予測は、現在画面内での空間的重畳性を除去するためのものである。
【0053】
例えば、イントラ予測部106は、Y成分、Co成分、及びCg成分ごとにイントラ予測モード選択部105によって選択された予測方向が指示する隣接画素から現在画面を構成するブロックのそれぞれを予測することによって、Y成分の予測画面、Co成分の予測画面、Cg成分の予測画面を生成する。また、イントラ予測部106は、R成分、G成分、及びB成分ごとにイントラ予測モード選択部105によって選択された予測方向が指示する隣接画素から現在画面を構成するブロックのそれぞれを予測することによって、R成分の予測画面、G成分の予測画面、B成分の予測画面を生成する。
【0054】
減算器107は、色成分ごとに現在画面と動き補償部104によって生成された予測画面との差に該当する第1レジデューを生成するか、または現在画面とイントラ予測部106によって生成された予測画面との差に該当する第1レジデューを生成する。例えば、減算器107は、Y成分、Co成分、及びCg成分ごとに現在画面と動き補償部104によって生成された予測画面との差を算出するか、または現在画面とイントラ予測部106によって生成された予測画面との差を算出することによって、Y成分の第1レジデュー、Co成分の第1レジデュー、Cg成分の第1レジデューを生成する。また、減算器107は、R成分、G成分、及びB成分ごとに現在画面と動き補償部104によって生成された予測画面との差を算出するか、または現在画面とイントラ予測部106によって生成された予測画面との差を算出することによって、R成分の第1レジデュー、G成分の第1レジデュー、B成分の第1レジデューを生成する。
【0055】
図5は、本発明の望ましい一実施形態の適用による色成分のそれぞれのレジデューの相関性の変化を示す図である。図5を参照するに、グラフ501と502とは、色成分のそれぞれに独立的な予測モードを適用して得られたレジデューの相関性を示している。特に、グラフ501は、R成分とG成分との相関性を示しており、グラフ502は、B成分とG成分との相関性を示している。一方、グラフ503と504とは、全ての色成分に同じ予測モードを適用して得られたレジデューの相関性を示している。特に、グラフ503は、R成分とG成分との相関性を示しており、グラフ504は、B成分とG成分との相関性を示している。図5に示された501−504から色成分のそれぞれに独立的な予測モードを適用するより、同じ予測モードを適用することが色成分のレジデュー間の相関性が高まるということが分かる。
【0056】
レジデュー変換部108は、減算器107によって生成された第1レジデュー間の差に該当する第2レジデューを生成する。本実施形態では、動画の符号化効率を向上させるために、インター予測またはイントラ予測後の色成分の間の重畳性(Redundancy)を利用する。インター予測は、時間的な重畳性を利用し、イントラ予測は、空間的な重畳性を利用するのである。しかし、インター予測またはイントラ予測後にも、色成分の間の重畳性が依然として残っている。
【0057】
図6は、本発明の望ましい一実施形態の適用による色成分の間の相関性を示す図である。図6を参照するに、グラフ601は、イントラ予測後のR成分とG成分との相関性を示しており、グラフ602は、イントラ予測後のB成分とG成分との相関性を示している。グラフ603は、インター予測後のR成分とG成分との相関性を示しており、グラフ604は、インター予測後のB成分とG成分との相関性を示している。図6に示された601−604からインター予測またはイントラ予測後にも、色成分のレジデュー間に強い相関性が存在するということが分かる。
【0058】
すなわち、レジデュー変換部108は、YCgCo色空間で次の式(1)を利用してY成分、Co成分、Cg成分のそれぞれの第1レジデュー間の差に該当する第2レジデューを生成する。特に、Y=(R+2G+B)>>2,Co=(R−B)>>1,Cg=(−R+2G−B)>>2の関係にある。
【0059】
△2B=△R−△B
t=△B+(△2B>>1)
△2R=△G−t (1)
△2G=t+(△2R>>1)
ここで、△×は、第1レジデューを意味し、△2×は、第2レジデューを意味する。また、表記“>>”は、右側シフト演算を意味し、ほぼ2で割るところとなる。また、変数tは、臨時的な計算目的として使われる。
【0060】
また、レジデュー変換部108は、RGB色空間で次の式(2)を利用してR成分、G成分、B成分それぞれの第1レジデュー間の差に該当する第2レジデューを生成する。
【0061】
△2G=△G’
△2R=△R−△G’ (2)
△2B=△B−△G’
ここで、△×は、第1レジデューを意味し、△2×は、第2レジデューを意味する。また、△×’は、復元された第1レジデューを意味する。特に、式(2)は、G成分が画像情報を多く有している時に効果的であり、R成分またはB成分を主な成分として第2レジデューを計算することもある。
【0062】
周波数空間変換部109は、レジデュー変換部108によって生成された第2レジデューを色空間から周波数空間に変換する。H.264/MPEG−4AVCでは、色空間から周波数空間に変換する方式でDHT(Discrete Hadamard Transformation)、DCT(Discrete Cosine Transformation)基盤の整数変換が導入された。
【0063】
量子化部110は、周波数空間変換部109によって変換された値を量子化する。すなわち、量子化部110は、周波数空間変換部109によって変換された周波数成分値を量子化パラメータで割り、その結果を整数値に近似化する。
【0064】
エントロピー符号化部111は、量子化部110によって量子化された値をエントロピー符号化することによってビットストリームを生成し、これを出力する。H.264/MPEG−4AVCでは、エントロピー符号化方式でCAVLC(Conte×t−Adaptive Variable Length Coding)、CABAC(Conte×t−Adaptive Binary Arithmetic Coding)が導入された。
【0065】
逆量子化部112は、量子化部110によって量子化された値を逆量子化する。すなわち、逆量子化部112は、量子化部110によって近似化した整数値に量子化パラメータを乗じることによって周波数成分値を復元する。
【0066】
周波数空間逆変換部113は、逆量子化部112によって復元された周波数成分値を周波数空間から色空間に変換することによって第2レジデューを復元する。
【0067】
レジデュー逆変換部114は、周波数空間逆変換部113によって復元された第2レジデュー間の合算に該当する第1レジデューを生成する。すなわち、レジデュー逆変換部114は、YCgCo色空間で次の式(3)を利用してY成分、Co成分、Cg成分のそれぞれの第2レジデュー間の和に該当するY成分、Co成分、Cg成分のそれぞれの第1レジデューを生成する。
【0068】
t=△2G’−(△2R’>>1)
△G’=△2R’+t
△B’=t−(△2B’>>1) (3)
△R’=△B’+△2B’
ここで、△×’は、復元された第1レジデューを意味し、△2×’は、復元された第2レジデューを意味する。
【0069】
また、レジデュー逆変換部114は、RGB色空間で次の式(4)を利用してR成分、G成分、B成分それぞれの第2レジデュー間の和に該当するR成分、G成分、B成分のそれぞれの第1レジデューを生成する。
【0070】
△G’=△2G’
△R’=△2R’+△G’ (4)
△B’=△2B’+△G’
ここで、△×’は、復元された第1レジデューを意味し、△2×’は、復元された第2レジデューを意味する。
【0071】
加算器115は、動き補償部104またはイントラ予測部106によって生成された予測画面と、レジデュー逆変換部114によって生成された第1レジデューとの合算に該当する復元画面を生成する。例えば、加算器115は、Y成分、Co成分、及びCg成分ごとに動き補償部104またはイントラ予測部106によって生成された予測画面と、レジデュー逆変換部114によって生成された第1レジデューとの合算を算出することによって、YCgCo色空間における復元画面を生成する。また、加算器115は、R成分、G成分、及びB成分ごとに動き補償部104またはイントラ予測部106によって生成された予測画面と、レジデュー逆変換部114によって生成された第1レジデューとの合算を算出することによって、RGB色空間における復元画面を生成する。
【0072】
フィルタ116は、加算器115によって生成された復元画面のブロック境界の歪曲をスムーズにすることで復元画面の画質を向上させる。これは、動画のビットレートが高い場合には、かえって高周波成分が消失される恐れがあるために使われない。
【0073】
図1に示された動画復号化装置には、色空間を適応的に適用する方式とシングルモード方式とが何れも適用されているが、当業者ならば、二つの方式のうち何れか一つのみが適用された動画復号化装置を容易に具現しうるであろう。
【0074】
図7は、本発明の望ましい一実施形態による動画復号化装置の構成図である。図7を参照するに、本実施形態による動画復号化装置は、エントロピー復号化部701、逆量子化部702、周波数空間逆変換部703、レジデュー逆変換部704、動き補償部705、イントラ予測部706、加算器707、及びフィルタ708で構成される。
【0075】
エントロピー復号化部701は、図1に示された動画符号化装置から出力されたビットストリームをエントロピー復号化することによって整数値を復元する。
【0076】
逆量子化部702は、エントロピー復号化部701によって復元された整数値を逆量子化することによって周波数成分値を復元する。すなわち、逆量子化部702は、エントロピー復号化部701によって復元された整数値に量子化パラメータを乗じることによって周波数成分値を復元する。
【0077】
周波数空間逆変換部703は、逆量子化部702によって復元された周波数成分値を周波数空間から複数の色空間のうち動画符号化装置で使われた色空間に変換することにより、この色空間を構成する色成分のそれぞれのレジデュー間の差に該当する第2レジデューを復元する。
【0078】
レジデュー逆変換部704は、複数の色空間のうち動画符号化装置で使われた色空間で周波数空間逆変換部703によって復元された第2レジデュー間の合算に該当する第1レジデューを生成する。すなわち、レジデュー逆変換部704は、YCgCo色空間で前記の式(3)を利用してY成分、Co成分、Cg成分のそれぞれの第2レジデュー間の和に該当するY成分、Co成分、Cg成分のそれぞれの第1レジデューを生成する。また、レジデュー逆変換部704は、RGB色空間で前記の式(4)を利用して、R成分、G成分、B成分のそれぞれの第2レジデュー間の和に該当するR成分、G成分、B成分のそれぞれの第1レジデューを生成する。
【0079】
動き補償部705は、色成分ごとに動画符号化装置で使われたインター予測モードによって、参照画面と現在画面との間の動きを補償する。すなわち、動き補償部705は、色成分のそれぞれに独立的に適用されるインター予測モード、または全ての色成分に一律的に適用されるインター予測モードのうち何れか一つによって、参照画面と現在画面との間の動きを補償する。
【0080】
さらに詳細に説明すれば、動き補償部705は、動画符号化装置で使われたサイズのブロック単位で動画符号化装置で使われた動きベクトルを使用して、参照画面から現在画面についての予測画面を生成する。すなわち、動き補償部705は、色成分のそれぞれに独立的に適用されるサイズのブロック単位で色成分のそれぞれに独立的に適用される動きベクトルを使用して、現在画面についての予測画面を生成するか、または全ての色成分に一律的に適用されるサイズのブロック単位で全ての色成分に一律的に適用される動きベクトルを使用して、参照画面から現在画面についての予測画面を生成する。
【0081】
イントラ予測部706は、色成分ごとに動画符号化装置で使われたイントラ予測モードによって、加算器707によって復元された画面内の隣接画素から現在画面を構成するブロックを予測し、このように予測されたブロックで構成された予測画面を生成する。すなわち、イントラ予測部706は、色成分のそれぞれに独立的に適用されるイントラ予測モード及び全ての色成分に一律的に適用されるイントラ予測モードのうち何れか一つによって加算器707によって復元された画面内の隣接画素から現在画面を構成するブロックを予測し、このように予測されたブロックで構成された予測画面を生成する。
【0082】
さらに詳細に説明すれば、イントラ予測部706は、動画符号化装置で使われた予測方向が指示する隣接画素から現在画面を構成するブロックのそれぞれを予測し、このように予測されたブロックで構成された予測画面を生成する。すなわち、イントラ予測部706は、色成分のそれぞれに独立的に適用されるサイズのブロック単位で色成分のそれぞれに独立的に適用される予測方向が指示する隣接画素から現在画面を構成するブロックのそれぞれを予測し、このように予測されたブロックで構成された予測画面を生成するか、または全ての色成分に一律的に適用されるサイズのブロック単位で全ての色成分に一律的に適用される予測方向が指示する隣接画素から現在画面を構成するブロックのそれぞれを予測し、このように予測されたブロックで構成された予測画面を生成する。
【0083】
加算器707は、動き補償部705またはイントラ予測部706によって生成された予測画面と、レジデュー逆変換部704によって生成された第1レジデューとの合算に該当する復元画面を生成する。例えば、加算器707は、Y成分、Co成分、及びCg成分ごとに動き補償部705またはイントラ予測部706によって生成された予測画面と、レジデュー逆変換部704によって生成された第1レジデューとの合算を算出することによって、YCgCo色空間における復元画面を生成する。また、加算器707は、R成分、G成分、及びB成分ごとに動き補償部705またはイントラ予測部706によって生成された予測画面と、レジデュー逆変換部704によって生成された第1レジデューとの合算を算出することによって、RGB色空間における復元画面を生成する。
【0084】
フィルタ708は、加算器707によって生成された復元画面のブロック境界の歪曲をスムーズにして復元画面の画質を向上させる。これは、動画のビットレートが高い場合には、かえって高周波成分が消失される恐れがあるために使われない。
【0085】
図8A及び図8Bは、本発明の望ましい一実施形態による動画符号化方法を示すフローチャートである。図8A及び図8Bを参照するに、本実施形態による動画符号化方法は、図1に示された動画符号化装置で時系列的に処理されるステップで構成される。したがって、以下省略された内容であっても、図1に示された動画符号化装置について前述された内容は、本実施形態による動画符号化方法にも適用される。
【0086】
ステップ801で、動画符号化装置は、現在画面の特性に基づいて適応的に複数の色空間のうち何れか一つの色空間を選択する。
【0087】
ステップ802で、動画符号化装置は、インター予測なのか、そうでなければイントラ予測なのかを判断し、インター予測である場合には、ステップ803に進み、イントラ予測である場合には、ステップ806に進む。
【0088】
ステップ803で、動画符号化装置は、ステップ801で選択された色空間を構成する色成分のそれぞれに独立的に適用されるインター予測モード、及びステップ801で選択された色空間を構成する全ての色成分に一律的に適用されるインター予測モードのうち何れか一つを選択する。
【0089】
ステップ804で、動画符号化装置は、803ステップで選択されたインター予測モードによって、色空間を構成する色成分のそれぞれに独立的に適用される動きベクトルを選択するか、または色空間を構成する全ての色成分に一律的に適用される何れか一つの動きベクトルを選択する。
【0090】
ステップ805で、動画符号化装置は、ステップ804で選択された動きベクトルを使用して、参照画面から現在画面についての予測画面を生成する。
【0091】
ステップ806で、動画符号化装置は、ステップ801で選択された色空間を構成する色成分のそれぞれに独立的に適用されるイントラ予測モード、及びステップ801で選択された色空間を構成する全ての色成分に一律的に適用されるイントラ予測モードのうち何れか一つを選択する。
【0092】
ステップ807で、動画符号化装置は、ステップ806で選択されたイントラ予測モードによって、色空間を構成する色成分のそれぞれに独立的に適用される予測方向を選択するか、または色空間を構成する色成分のそれぞれの予測方向に基づいてこの色空間を構成する全ての色成分に一律的に適用される予測方向を選択する。
【0093】
ステップ808で、動画符号化装置は、色成分ごとにステップ807で選択された予測方向が指示する隣接画素から現在画面を構成するブロックのそれぞれを予測し、このように予測されたブロックで構成された予測画面を生成する。
【0094】
ステップ809で、動画符号化装置は、色成分ごとに現在画面と、ステップ805またはステップ808で生成された予測画面との差に該当する第1レジデューを生成する。
【0095】
ステップ810で、動画符号化装置は、ステップ809で生成された第1レジデュー間の差に該当する第2レジデューを生成する。
【0096】
ステップ811で、動画符号化装置は、ステップ810で生成された第2レジデューを色空間から周波数空間に変換する。
【0097】
ステップ812で、動画符号化装置は、ステップ811から変換された値を量子化する。
【0098】
ステップ813で、動画符号化装置は、ステップ812で量子化された値をエントロピー符号化することによってビットストリームを生成し、これを出力する。
【0099】
ステップ814で、動画符号化装置は、ステップ812で量子化された値を逆量子化することによって周波数成分値を復元する。
【0100】
ステップ815で、動画符号化装置は、ステップ814で復元された周波数成分値を周波数空間から色空間に変換することによって第2レジデューを復元する。
【0101】
ステップ816で、動画符号化装置は、ステップ815で復元された第2レジデュー間の合算に該当する第1レジデューを生成する。
【0102】
ステップ817で、動画符号化装置は、色成分ごとにステップ805またはステップ808で生成された予測画面と、ステップ816で生成された第1レジデューとの合算に該当する復元画面を生成する。
【0103】
ステップ818で、動画符号化装置は、ステップ816で生成された復元画面のブロック境界の歪曲をスムーズにして復元画面の画質を向上させる。
【0104】
図9は、本発明の望ましい一実施形態による動画復号化方法の構成図である。図9を参照するに、本実施形態による動画復号化方法は、図7に示された動画復号化装置で時系列的に処理されるステップで構成される。したがって、以下省略された内容であっても、図7に示された動画復号化装置について前述された内容は、本実施形態による動画復号化方法にも適用される。
【0105】
ステップ901で、動画復号化装置は、図1に示された動画符号化装置から出力されたビットストリームをエントロピー復号化することによって整数値を復元する。
【0106】
ステップ902で、動画復号化装置は、ステップ902で復元された整数値を逆量子化することによって周波数成分値を復元する。
【0107】
ステップ903で、動画復号化装置は、ステップ902で復元された周波数成分値を周波数空間から、複数の色空間のうち動画符号化装置で使われた色空間に変換することにより、この色空間を構成する色成分のそれぞれの第1レジデュー間の差に該当する第2レジデューを復元する。
【0108】
ステップ904で、動画復号化装置は、複数の色空間のうち動画符号化装置で使われた色空間でステップ903で復元された第2レジデュー間の合算に該当する第1レジデューを生成する。
【0109】
ステップ905で、動画符号化装置は、インター予測なのか、そうでなければ、イントラ予測なのかを判断し、インター予測である場合には、ステップ906に進み、イントラ予測である場合には、ステップ907に進む。
【0110】
ステップ906で、動画復号化装置は、色成分のそれぞれに独立的に適用されるインター予測モードまたは全ての色成分に一律的に適用されるインター予測モードのうち何れか一つによって、参照画面と現在画面との間の動きを補償する。
【0111】
ステップ907で、動画復号化装置は、色成分のそれぞれに独立的に適用されるイントラ予測モード及び全ての色成分に一律的に適用されるイントラ予測モードのうち何れか一つによって、復元された画面内の隣接画素から現在画面を構成するブロックを予測し、このように予測されたブロックで構成された予測画面を生成する。
【0112】
ステップ908で、動画復号化装置は、ステップ906またはステップ907によって生成された予測画面と、ステップ904によって生成された第1レジデューとの合算に該当する復元画面を生成する。
【0113】
ステップ909で、動画復号化装置は、ステップ908で生成された復元画面のブロック境界の歪曲をスムーズにして復元画面の画質を向上させる。
【0114】
図10は、本発明の望ましい実施形態についてのシミュレーション結果を示す図である。図10のテーブル1001及びテーブル1002に示したように、本実施形態、すなわち、シングルモード予測におけるRCT及びIPPとH.264/MPEG−4AVC FRE×tとを比較することにより本実施形態を評価した。シミュレーションとしては、JM9.3レファレンスソフトウェアが使われた。テスト条件は、次の通りである。テスト材料は、フィルムとバイパーシーケンス(1920×1088@24Hz,progressive)であり、探索領域は、64であり、量子化パラメータは、12,18,24,30,36であり、参照画面、すなわち参照フレームの数は、3であり、エントロピー符号化は、CABACであり、RD最適化モード選択は、オンであり、GOP(グループ オブ ピクチャー)構造は、IBBPであり、スライスグループの数は、1である。
【0115】
図10における方法のそれぞれは、次の通りである。IPPは、IPPとシングルモード予測とを使用した本実施形態の方法であり、RCTは、RCTとシングルモード予測とを使用した本実施形態の方法であり、RCT(FRE×T)は、レジデュアル色変換についてYCgCoを使用したRGB符号化であり、YCgCoは、符号化前にRGB入力データがYCgCoに変換される外部YCgCo符号化である。特に、テーブル1001では、復元されたRGBイメージの忠実度(Fidelity)を評価するために、全ての色成分についてのPSNR(Peak Signal to Noise Rate)の平均、すなわち、RGB成分の平均が測定された。テーブル1001は、二つの異なる高ビットレート(20Mbps及び60Mbps)におけるYCgCo方法についてのそれぞれの方法のPSNRゲインを表している。また、テーブル1002では、輝度チャンネル(最も重要なチャンネル)上の影響を孤立させるために、色差チャンネルに対してほぼ同じ忠実度(Fidelity)を有しているYCgCoドメインでYPSNRの結果が比較された。
【0116】
図11は、本発明の望ましい実施形態についての無損失モードにおける符号化効率の比較を示す図である。
【0117】
近い将来には、ビデオの無損失及びほぼ無損失圧縮の支援が重要になる。H.264/MPEG−4AVC FRE×tにおける無損失符号化は、周波数空間変換と量子化過程とが省略されることによって具現される。前記本実施形態も周波数空間変換と量子化との過程が省略されることによって無損失符号化に適用される。図11に示されたように、無損失符号化でIPPとシングルモード予測との効率が最も優れる。
【0118】
図12A及び図12Bは、本発明の望ましい実施形態についてのシミュレーションのRD(Rate Distortion)カーブを示す図である。図12A及び図12Bでは、イントラ符号化のみのシミュレーションが行われた。特に、独立的なイントラ予測モードを適用する成果を評価するために、全ての色成分は、単色イメージとして扱われた。
【0119】
一方、前述した本発明の実施形態は、コンピュータで実行できるプログラムで作成可能であり、コンピュータで読み取り可能な記録媒体を利用して前記プログラムを動作させる汎用ディジタルコンピュータで具現される。また、前述した本発明の実施形態で使われたデータの構造は、コンピュータで読み取り可能な記録媒体に色々な手段を通じて記録されうる。
【0120】
前記コンピュータで読み取り可能な記録媒体は、マグネチック保存媒体(例えば、ROM(リード オンリ メモリ)、フロッピー(登録商標)ディスク、ハードディスクなど)、光学的判読媒体(例えば、CD−ROM、DVD(デジタル ヴァーサタイル ディスプレイ)など)及びキャリアウェーブ(例えば、インターネットを通じた伝送)のような保存媒体を含む。
【0121】
以上、本発明についてその望ましい実施形態を中心に説明した。当業者は、本発明が本発明の本質的な特性から逸脱しない範囲で変形された形態で具現されることを理解できるであろう。したがって、開示された実施形態は、限定的な観点でなく、説明的な観点で考慮されねばならない。本発明の範囲は、前述した説明でなく、特許請求の範囲に表れており、それと同等な範囲内にある全ての差異点は、本発明に含まれていると解釈されねばならない。
【符号の説明】
【0122】
101:色空間選択部
102:インター予測モード選択部
103:動き推定部
104:動き補償部
105:イントラ予測選択部
106:イントラ予測部
107:減算器
108:レジデュー変換部
109:周波数空間変換部
110:量子化部
111:エントロピー符号化部
112:逆量子化部
113:周波数空間逆変換部
114:レジデュー逆変換部
115:加算器
116:フィルタ
【特許請求の範囲】
【請求項1】
動画像符号化装置によって実行される残差生成方法であって、
(a)前記動画像符号化装置が、所定の色空間を構成する色成分のそれぞれに独立して適用される第1の予測モード及び前記所定の色空間を構成する全ての色成分に一律に適用される第2の予測モードのうちの何れか1つを選択するステップと、
(b)前記動画像符号化装置が、前記選択された予測モードによって現在画面と予測画面との残差を前記色成分のそれぞれについて生成するステップとを含み、
前記動画像符号化装置が、前記第1の予測モード及び前記第2の予測モードのうちの何れか一つを表すフラグを動画像復号化装置に伝送する、
ことを特徴とする残差生成方法。
【請求項2】
前記フラグは1ビットフラグである、
ことを特徴とする請求項1記載の残差生成方法。
【請求項3】
コンピュータに、請求項1乃至2のうちの何れか一つに記載の方法を実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
【請求項4】
所定の色空間を構成する色成分のそれぞれに独立して適用される第1の予測モード及び前記所定の色空間を構成する全ての色成分に一律に適用される第2の予測モードのうちの何れか一つを選択する選択部と、
前記選択部により選択された第1の予測モード又は第二の予測モードによって現在画面と予測画面との残差を前記色成分のそれぞれに対して生成する減算器とを備え、
前記第1の予測モード及び前記第2の予測モードのうちの何れか一つを表すフラグを動画像復号化装置に伝送する、
ことを特徴とする残差生成装置。
【請求項5】
動画像復号化装置により実行される復元画面生成方法において、
(a)前記動画像復号化装置が、動画像符号化装置から伝送されたフラグに基づき所定の色空間を構成する色成分のそれぞれに独立して適用される第1の予測モード及び前記所定の色空間を構成する全ての色成分の一律に適用される第2の予測モードのうちの何れか一つによって予測画面を生成するステップと、
(b)前記動画像復号化装置が、前記予測画面に基づき復元画面を生成するステップとを含み、
前記フラグは前記第1の予測モード及び前記第2の予測モードのうちの何れか一つを表す、
ことを特徴とする復元画面生成方法。
【請求項6】
前記フラグは1ビットフラグである、
ことを特徴とする請求項5記載の復元画面生成方法。
【請求項7】
コンピュータに、請求項5乃至6のうちの何れか一つに記載の方法を実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
【請求項8】
動画像符号化装置から伝送されたフラグに基づき所定の色空間を構成する色成分のそれぞれに独立して適用される第1の予測モード及び前記所定の色空間を構成する全ての色成分に一律に適用される第2の予測モードのうちの何れか一つによって予測画面を生成する予測部と、
前記予測部により生成された予測画面に基づき復元画面を生成する加算器とを備え、
前記フラグは前記第1の予測モード及び前記第2の予測モードのうちの何れか一つを表す、
ことを特徴とする復元画面生成装置。
【請求項1】
動画像符号化装置によって実行される残差生成方法であって、
(a)前記動画像符号化装置が、所定の色空間を構成する色成分のそれぞれに独立して適用される第1の予測モード及び前記所定の色空間を構成する全ての色成分に一律に適用される第2の予測モードのうちの何れか1つを選択するステップと、
(b)前記動画像符号化装置が、前記選択された予測モードによって現在画面と予測画面との残差を前記色成分のそれぞれについて生成するステップとを含み、
前記動画像符号化装置が、前記第1の予測モード及び前記第2の予測モードのうちの何れか一つを表すフラグを動画像復号化装置に伝送する、
ことを特徴とする残差生成方法。
【請求項2】
前記フラグは1ビットフラグである、
ことを特徴とする請求項1記載の残差生成方法。
【請求項3】
コンピュータに、請求項1乃至2のうちの何れか一つに記載の方法を実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
【請求項4】
所定の色空間を構成する色成分のそれぞれに独立して適用される第1の予測モード及び前記所定の色空間を構成する全ての色成分に一律に適用される第2の予測モードのうちの何れか一つを選択する選択部と、
前記選択部により選択された第1の予測モード又は第二の予測モードによって現在画面と予測画面との残差を前記色成分のそれぞれに対して生成する減算器とを備え、
前記第1の予測モード及び前記第2の予測モードのうちの何れか一つを表すフラグを動画像復号化装置に伝送する、
ことを特徴とする残差生成装置。
【請求項5】
動画像復号化装置により実行される復元画面生成方法において、
(a)前記動画像復号化装置が、動画像符号化装置から伝送されたフラグに基づき所定の色空間を構成する色成分のそれぞれに独立して適用される第1の予測モード及び前記所定の色空間を構成する全ての色成分の一律に適用される第2の予測モードのうちの何れか一つによって予測画面を生成するステップと、
(b)前記動画像復号化装置が、前記予測画面に基づき復元画面を生成するステップとを含み、
前記フラグは前記第1の予測モード及び前記第2の予測モードのうちの何れか一つを表す、
ことを特徴とする復元画面生成方法。
【請求項6】
前記フラグは1ビットフラグである、
ことを特徴とする請求項5記載の復元画面生成方法。
【請求項7】
コンピュータに、請求項5乃至6のうちの何れか一つに記載の方法を実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
【請求項8】
動画像符号化装置から伝送されたフラグに基づき所定の色空間を構成する色成分のそれぞれに独立して適用される第1の予測モード及び前記所定の色空間を構成する全ての色成分に一律に適用される第2の予測モードのうちの何れか一つによって予測画面を生成する予測部と、
前記予測部により生成された予測画面に基づき復元画面を生成する加算器とを備え、
前記フラグは前記第1の予測モード及び前記第2の予測モードのうちの何れか一つを表す、
ことを特徴とする復元画面生成装置。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8A】
【図8B】
【図9】
【図10】
【図11】
【図12A】
【図12B】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8A】
【図8B】
【図9】
【図10】
【図11】
【図12A】
【図12B】
【公開番号】特開2012−209965(P2012−209965A)
【公開日】平成24年10月25日(2012.10.25)
【国際特許分類】
【出願番号】特願2012−144782(P2012−144782)
【出願日】平成24年6月27日(2012.6.27)
【分割の表示】特願2008−506386(P2008−506386)の分割
【原出願日】平成18年4月18日(2006.4.18)
【出願人】(503447036)サムスン エレクトロニクス カンパニー リミテッド (2,221)
【Fターム(参考)】
【公開日】平成24年10月25日(2012.10.25)
【国際特許分類】
【出願日】平成24年6月27日(2012.6.27)
【分割の表示】特願2008−506386(P2008−506386)の分割
【原出願日】平成18年4月18日(2006.4.18)
【出願人】(503447036)サムスン エレクトロニクス カンパニー リミテッド (2,221)
【Fターム(参考)】
[ Back to top ]