予測映像の生成方法、装置及び記録媒体
【課題】 現在画像の色成分のそれぞれのマクロブロック別に色成分のそれぞれのマクロブロックに最適の予測モードを適応的に適用して動画の符号化及び復号化を行うことによって、動画の符号化及び復号化効率を高めうる。
【解決手段】 ビットストリームを復号化することによって、一つのシーケンスを構成する複数の色成分のブロックに対する一つの予測モードを表す情報を復元するステップと、
前記復元された情報によって、前記色成分のブロックに一律的に適用される予測モードを使用したり、前記色成分のブロックに独立的に予測モードを使用して前記現在映像の予測映像を生成するステップと、を含むことを特徴とする。
【解決手段】 ビットストリームを復号化することによって、一つのシーケンスを構成する複数の色成分のブロックに対する一つの予測モードを表す情報を復元するステップと、
前記復元された情報によって、前記色成分のブロックに一律的に適用される予測モードを使用したり、前記色成分のブロックに独立的に予測モードを使用して前記現在映像の予測映像を生成するステップと、を含むことを特徴とする。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、動画を符号化する方法及び装置、動画を復号化する方法及び装置に係り、特に、H.264/MPEG−4 AVC(Advanced Video Coding)FRExt(Fidelity Range Extensions)標準分野における動画を符号化する方法及び装置、動画を復号化する方法及び装置に関する。
【背景技術】
【0002】
“レジデュアル色変換”と呼ばれる新たなRGB符号化技術は、H.264/MPEG−4 AVC FRExt標準化過程で開発された。これは、RGB色空間をYCbCr色空間に変換する時に発生する画質の劣化を防止するためのものである。しかし、H.264/MPEG−4 AVC FRExt上のRGB符号化及び復号化技術も、動画再生機器に適用するにはまだ動画の符号化及び復号化効率が十分に高くないという問題点があった。
【発明の概要】
【発明が解決しようとする課題】
【0003】
本発明が解決しようとする技術的課題は、H.264/MPEG−4 AVC FRExt上のRGB符号化技術の動画符号化及び復号化効率を高めうる装置及び方法を提供することである。
【0004】
また、前記の方法をコンピュータで実行させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体を提供することである。
【課題を解決するための手段】
【0005】
前記課題を解決するための本発明による符号化装置における予測画像の生成方法は、所定画像の特性に基づいて、現在画像の色成分のそれぞれのブロック別に前記色成分のそれぞれのブロックに最適の予測モードを選択するステップと、前記選択された予測モードによって、前記現在画像に対する予測画像を生成するステップと、を含む。
【0006】
前記他の課題を解決するために、本発明は、前記の符号化装置における予測画像の生成方法をコンピュータで実行させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体を提供する。
【0007】
前記さらに他の課題を解決するための本発明による符号化装置における予測画像生成装置は、所定画像の特性に基づいて、現在画像の色成分のそれぞれのブロック別に前記色成分のそれぞれのブロックに最適の予測モードを選択する選択部と、前記選択された予測モードによって、前記現在画像に対する予測画像を生成する生成部と、を備える。
【0008】
前記さらに他の課題を解決するための本発明による符号化方法は、所定画像の特性に基づいて、現在画像の色成分のそれぞれのブロック別に前記色成分のそれぞれのブロックに最適の予測モードを選択するステップと、前記選択された予測モードによって、前記現在画像に対する予測画像を生成するステップと、前記現在画像と前記予測画像との差に該当する色成分のそれぞれのレジデューを生成するステップと、前記生成されたレジデューを符号化することによってビットストリームを生成するステップと、を含む。
【0009】
前記さらに他の課題を解決するために、本発明は、前記の符号化方法をコンピュータで実行させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体を提供する。
【0010】
前記さらに他の課題を解決するための本発明による符号化装置は、所定画像の特性に基づいて、現在画像の色成分のそれぞれのブロック別に前記色成分のそれぞれのブロックに最適の予測モードを選択する選択部と、前記選択された予測モードによって前記現在画像に対する予測画像を生成し、前記現在画像と前記予測画像との差に該当する色成分のそれぞれのレジデューを生成する生成部と、前記生成されたレジデューを符号化することによって、ビットストリームを生成する符号化部と、を備える。
【0011】
前記さらに他の課題を解決するための本発明による復号化装置における予測画像の生成方法は、ビットストリームを復号化することによって、現在画像の色成分のそれぞれのブロックに最適の予測モードを表す情報を復元するステップと、前記復元された情報が表す予測モードによって、前記現在画像に対する予測画像を生成するステップと、を含む。
【0012】
前記さらに他の課題を解決するために、本発明は、前記の復号化装置における予測画像の生成方法をコンピュータで実行させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体を提供する。
【0013】
前記さらに他の課題を解決するための本発明による復号化装置における予測画像生成装置は、ビットストリームを復号化することによって、現在画像の色成分のそれぞれのブロックに最適の予測モードを表す情報を復元する復号化部と、前記復元された情報が表す予測モードによって、前記現在画像に対する予測画像を生成する生成部と、を備える。
【0014】
前記さらに他の課題を解決するための本発明による復号化方法は、ビットストリームを復号化することによって、現在画像の色成分のそれぞれのブロックに最適の予測モードを表す情報を復元するステップと、前記復元された情報が表す予測モードによって、前記現在画像と前記現在画像に対する予測画像との差に該当するレジデューを生成するステップと、前記復元された情報が表す予測モードによって、前記予測画像を生成するステップと、前記生成されたレジデューと前記生成された予測画面との合算に該当する復元画面を生成するステップと、を含む。
【0015】
前記さらに他の課題を解決するために、本発明は、前記の復号化方法をコンピュータで実行させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体を提供する。
【0016】
前記さらに他の課題を解決するための本発明による復号化装置は、ビットストリームを復号化することによって、現在画像の色成分のそれぞれのブロックに最適の予測モードを表す情報を復元する復号化部と、前記復元された情報が表す予測モードによって、前記予測画像を生成する第1生成部と、前記復元された情報が表す予測モードによって、前記現在画像と前記現在画像に対する予測画像との差に該当するレジデューを生成し、前記生成されたレジデューと前記生成された予測画面との合算に該当する復元画面を生成する第2生成部と、を備える。
【発明の効果】
【0017】
本発明によれば、現在画像の色成分のそれぞれのマクロブロック別に色成分のそれぞれのマクロブロックに最適の予測モードを適応的に適用して動画の符号化及び復号化を行うことによって、動画の符号化及び復号化効率を高めうる。特に、現在画像の色成分のそれぞれのマクロブロック別に、単一予測モード、複合予測モード、インター予測、イントラ予測、レジデュー変換、RCT(Residual Color Transformation)変換、IPP(Inter−Plane Prediction)変換、RCP(Residual Color Prediction)変換などの多様な符号化方式を選択的に適用することによって、動画の符号化及び復号化効率を極大化させうる。
【図面の簡単な説明】
【0018】
【図1】本発明の望ましい一実施形態による動画符号化装置の構成図である。
【図2】図1に示されたレジデュー生成部の構成図である。
【図3】インター予測でのマクロブロックの分割方法を示す図である。
【図4】イントラ予測での予測様子を示す図である。
【図5】図1に示されたレジデュー生成部の他の構成図である。
【図6】図1に示されたレジデュー生成部のさらに他の構成図である。
【図7A】本発明による望ましい一実施形態に適用される5−タブフィルタを示す図である。
【図7B】本発明による望ましい一実施形態に適用される3−タブフィルタとを示す図である。
【図8】図1に示されたレジデュー生成部のさらに他の構成図である。
【図9】図2に示された復元画像生成部の構成図である。
【図10】本発明の望ましい一実施形態による動画復号化装置の構成図である。
【図11】図10に示された予測画像生成部の構成図である。
【図12】図10に示された復元画像生成部の構成図である。
【図13】図12に示されたレジデュー逆変換部の構成図である。
【図14A】本発明の望ましい一実施形態による動画符号化方法を示すフローチャートである。
【図14B】本発明の望ましい一実施形態による動画符号化方法を示すフローチャートである。
【図15】本発明の望ましい一実施形態による動画復号化方法を示すフローチャートである。
【発明を実施するための形態】
【0019】
以下、図面を参照して、本発明の望ましい実施形態を詳細に説明する。特に、以下の実施形態で、現在画像は、現在の動画符号化及び復号化の対象となる画像を意味し、参照画像は、現在画像の符号化または復号化に参照される画像を意味する。一般的に、参照画像は、現在画像の過去画像であるが、現在画像の未来画像となってもよく、複数の画像となってもよい。
【0020】
図1は、本発明の望ましい一実施形態による動画符号化装置の構成図である。図1を参照するに、本実施形態による動画符号化装置は、最適モード選択部110、レジデュー生成部120、周波数空間変換部130、量子化部400、エントロピー符号化部150、逆量子化部160、周波数空間逆変換部170、及び復元画像生成部180で構成される。
【0021】
最適モード選択部110は、サンプル画像の特性に基づいて、現在画像の色成分のそれぞれのマクロブロック別に色成分のそれぞれのマクロブロックに最適の予測モードを選択する。ここで、色成分のそれぞれのマクロブロックは、相互対応するマクロブロックということを、当業者ならば理解できる。
【0022】
例えば、最適モード選択部110は、現在画像の色成分のそれぞれのマクロブロックに最適である予測モードとして、現在画像の色成分のそれぞれのマクロブロックに一律的に適用される予測モード(以下、“単一予測モード”という)及び現在画像の色成分のそれぞれのマクロブロックに独立的に適用される予測モード(以下、“複合予測モード”)のうち何れか一つを選択しうる。
【0023】
また、最適モード選択部110は、現在画像の色成分のそれぞれのマクロブロックに、最適の予測モードとして単一予測モード及び複合予測モードのうち何れか一つを選択し、これらのうち単一予測モードを選択した場合に、色成分のそれぞれの第1レジデュー間の差に該当する第2レジデューを生成する予測モード(以下、“レジデュー変換モード”という)を選択することもある。
【0024】
また、最適モード選択部110は、現在画像の色成分のそれぞれのマクロブロックに、最適の予測モードとして単一予測モード及び複合予測モードのうち何れか一つを選択し、これらのうち単一予測モードを選択した場合に、RCT(Residual Color Transformation)変換を行う予測モード(以下、“RCT変換モード”という)、IPP(Inter−Plane Prediction)変換を行うモード(以下、“IPP変換モード”という)、及びRCP(Residual Color Prediction)変換を行う予測モード(以下、“RCP変換モード”という)のうち何れか一つを選択することもある。RCT変換、IPP変換、RCP変換については後述する。
【0025】
本実施形態で、サンプル画像としては、現在画像の以前画像のうち何れか一つが使われる。最適モード選択部110は、サンプル画像の色成分のそれぞれのマクロブロックに最適の予測モードを選択するために、このサンプル画像に対して全ての可能な予測モードを一つずつ順次に選択し、選択された予測モードによって符号化された全ての結果を比較して、多数の予測モードのうち、このサンプル画像の色成分のそれぞれのマクロブロックに最適の予測モードを選択する。以後、この予測モードが現在画像の色成分のそれぞれのマクロブロックに最適の予測モードとして使われる。
【0026】
さらに詳細に説明すれば、最適モード選択部110は、現在画像の色成分のそれぞれのマクロブロックに最適である予測モードとして、サンプル画像を符号化した結果に該当するビットストリームの量及びサンプル画像とこのサンプル画像の復元画像との間の画質の歪曲が最も少ない予測モードを選択する。下記のものを参照するに、サンプル画像を符号化した結果に該当するビットストリームの量は、エントロピー符号化部150によって生成されたビットストリームの量となり、サンプル画像の復元画像は、復元画像生成部180によって生成された復元画像となる。
【0027】
特に、本実施形態によれば、最適モード選択部110は、ラグランジアン最適化技法を使用して最適モードを選択する。すなわち、最適モード選択部110は、次の式(1)を利用して、原本画像と復元画像との差値を乗算して合算した値の平均から画質の歪曲を算出する。
【0028】
【数1】
ここで、Dは、画質歪曲の程度を表し、pは、現在画像の画素値を表し、qは、以前画像の画素値を表し、iは、現在画像の現在マクロブロック内での画素のインデックスを表す。
【0029】
また、最適モード選択部110は、次の式(2)を利用して画質の歪曲の程度とビットストリームの量のそれぞれの単位との差を調整するために、一定定数“λ”とビットストリームの量“R”とを積算し、この積算値と画質の歪曲の程度“D”とを合算することによって、現在画像の色成分のそれぞれのマクロブロックに最適の予測モードを選択するための最終値“L”を算出する。
【0030】
【数2】
ここで、Rは、ビットストリームの量を表し、λは、所定の定数を表す。このような値を各予測方法別に計算した数Lが最も小さな予測方法を選択する。
【0031】
前記のラグランジアン最適化技法によって実験を行えば、最適モード選択部110は、サンプル画像の色成分のそれぞれの類似性が高い場合には、単一予測モードを選択し、サンプル画像の色成分間の類似性が低い場合には、複合予測モードを選択する。
【0032】
レジデュー生成部120は、最適モード選択部110によって選択された予測モードによって、色成分のそれぞれのマクロブロック別に現在画像に対する予測画像を生成し、現在画像と予測画像との差に該当するレジデューを生成する。そうでなければ、レジデュー生成部120は、最適モード選択部110によって選択された予測モードによって、色成分のそれぞれのマクロブロック別に現在画像に対する予測画像を生成し、現在画像と予測画像との差に該当する第1レジデューを生成し、色成分のそれぞれのマクロブロック別に第1レジデューの差に該当する第2レジデューを生成する。
【0033】
周波数空間変換部130は、レジデュー生成部120によって生成されたレジデューを色空間から周波数空間に変換する。そうでなければ、周波数空間変換部130は、レジデュー生成部120によって生成された第2レジデューを色空間から周波数空間に変換する。H.264/MPEG−4 AVCでは、色空間から周波数空間に変換する方式としてDHT(Discrete Hadamard Transformation)、DCT(Discrete Cosine Transformation)基盤の整数変換が導入された。
【0034】
量子化部140は、周波数空間変換部130によって変換された値を量子化する。すなわち、量子化部140は、周波数空間変換部130によって変換された結果である周波数成分値を量子化パラメータで割って、その結果を整数値に近似化する。
【0035】
エントロピー符号化部150は、量子化部140によって量子化された値をエントロピー符号化することによってビットストリームを生成し、これを出力する。特に、本実施形態によれば、エントロピー符号化部150は、動画符号化装置によって使われた予測モード、すなわち、最適モード選択部110によって選択された予測モードを表す情報も共にエントロピー符号化することによって、これを含むビットストリームを生成する。H.264/MPEG−4 AVCでは、エントロピー符号化方式でCAVLC(Context−Adaptive Variable Length Coding)、CABAC(Context−Adaptive Binary Arithmetic Coding)が導入された。
【0036】
さらに詳細に説明すれば、エントロピー符号化部150は、現在画像の色成分のそれぞれのマクロブロック別に、マクロブロックヘッダに最適モード選択部110によって選択された予測モードを表す情報を含むビットストリームを生成する。図10に示された動画復号化装置は、このビットストリームを受信して復号化することによって、動画符号化装置がいかなる予測モードを使用したのかが分かる。
【0037】
もし、現在画像の色成分の全てのマクロブロックに対して、最適モード選択部110によって選択された予測モードがいずれも同じである場合には、マクロブロックの上位レベルであるシーケンスレベルまたはピクチャレベルで一つのシーケンスを構成する全てのマクロブロック、または一つのピクチャを構成する全てのマクロブロックに対して、最適モード選択部110によって選択された予測モードの一つのみを表す情報を含むビットストリームを生成することによって、マクロブロックヘッダに記録される情報を省略でき、符号化効率を高めうる。
【0038】
さらに、現在画像の色成分の全てのマクロブロックに対して、最適モード選択部110によって選択された予測モードの一部が同じである場合には、マクロブロックの上位レベルであるシーケンスレベルまたはピクチャレベルで一つのシーケンスを構成するマクロブロック、または一つのピクチャを構成するマクロブロックのうち一部に対して、最適モード選択部110によって選択された予測モードの一つのみを表す情報を含み、残りのものに対しては、マクロブロックヘッダに最適モード選択部110によって選択された予測モードを表す情報を含むビットストリームを生成することによって、符号化効率を高めうる。
【0039】
逆量子化部160は、量子化部140によって量子化された値を逆量子化する。すなわち、逆量子化部160は、量子化部140によって近似化された整数値に量子化パラメータを積算することによって周波数成分値を復元する。
【0040】
周波数空間逆変換部170は、逆量子化部160によって復元された周波数成分値を周波数空間から色空間に変換することによって、現在画像と予測画像との差に該当するレジデューを復元する。そうでなければ、周波数空間逆変換部170は、逆量子化部160によって復元された周波数成分値を周波数空間から色空間に変換することによって、色成分のそれぞれの第1レジデュー間の差に該当する第2レジデューを復元する。
【0041】
復元画像生成部180は、レジデュー生成部120によって生成された予測画像と周波数空間逆変換部170によって復元されたレジデューとの合算に該当する復元画像を生成する。そうでなければ、復元画像生成部180は、周波数空間逆変換部170によって復元された第2レジデュー間の合算に該当する第1レジデューを生成し、レジデュー生成部120によって生成された予測画像とこのように生成された第1レジデューとの合算に該当する復元画像を生成する。
【0042】
図2は、図1に示されたレジデュー生成部120の構成図である。図2を参照するに、図1に示されたレジデュー生成部120は、単一モードレジデュー生成部1211及び複合モードレジデュー生成部1212で構成される。
【0043】
単一モードレジデュー生成部1211は、最適モード選択部110によって選択された予測モードが単一予測モードであれば、単一予測モードによって現在画像内の空間的な重畳性を除去する空間上予測(以下、“単一イントラ予測”という)を行うか、または単一予測モードによって現在画像と参照画像との時間的な重畳性を除去する時間上予測(以下、“単一インター予測”という)を行うことによって予測画像を生成する。次いで、単一モードレジデュー生成部1211は、現在画像とこのように生成された予測画像との差に該当するレジデューを生成する。
【0044】
さらに詳細に説明すれば、単一モードレジデュー生成部1211は、現在画像の色成分のそれぞれのマクロブロックに一律的に適用されるサイズに色成分のそれぞれのマクロブロックを分割し、このように分割された色成分のそれぞれのブロック別に、色成分のそれぞれのブロックに一律的に適用される参照画像と現在画像との間の動きベクトルを決定し、このように決定された動きベクトルを使用して、参照画像から現在画像に対する予測画像を生成することによって単一インター予測を行う。
【0045】
すなわち、単一モードレジデュー生成部1211は、現在画像の色成分のそれぞれのマクロブロックを同じサイズに分割し、このように分割された色成分のそれぞれのブロック別に同じ動きベクトルを決定し、このように決定された動きベクトルを使用して、参照画像から現在画像に対する予測画像を生成することによって単一インター予測を行う。
【0046】
図3は、インター予測におけるマクロブロックの分割方法を示す図である。図3を参照するに、インター予測におけるマクロブロックの場合、16×16サイズのマクロブロックを16×16、16×8、8×16、8×16、8×8などの多様なサイズに分割した後、このように分割されたブロック別に動きベクトルが決定される。さらに、8×8サイズのブロックを再び8×8、8×4、4×8、4×4のさらに小さく分割した後、このように分割されたブロック別に動きベクトルが決定されることもある。マクロブロックがさらに小さく分割されるほど、レジデューに現在画像と参照画像との間の精密な動きが含まれる。
【0047】
YCoCg色空間を例と挙げれば、単一モードレジデュー生成部1211は、Y成分のマクロブロック、Co成分のマクロブロック、Cg成分のマクロブロックを何れも同じサイズに分割し、例えば、Y成分のマクロブロック、Co成分のマクロブロック、Cg成分のマクロブロックを何れも8×8サイズに分割し、このように分割されたY成分のブロック、Co成分のブロック、Cg成分のブロック別に同じ動きベクトルを決定する。また、RGB色空間を例と挙げれば、単一モードレジデュー生成部1211は、R成分のマクロブロック、G成分のマクロブロック、B成分のマクロブロックを何れも同じサイズに分割し、例えば、R成分のマクロブロック、G成分のマクロブロック、B成分のマクロブロックを何れも8×8サイズに分割し、このように分割されたR成分のブロック、G成分のブロック、B成分のブロック別に同じ動きベクトルを決定する。
【0048】
また、単一モードレジデュー生成部1211は、現在画像の色成分のそれぞれのマクロブロックに一律的に適用されるサイズに色成分のそれぞれのマクロブロックを分割し、このように分割された色成分のそれぞれのブロック別に色成分のそれぞれのブロックに一律的に適用される予測方向を決定し、このように決定された予測方向を使用して、復元画像生成部180によって生成された復元画像内の隣接画素から現在画像を構成するブロックを予測し、このように予測されたブロックで構成された予測画像を生成することによって、単一イントラ予測を行う。
【0049】
すなわち、単一モードレジデュー生成部1211は、現在画像の色成分のそれぞれのマクロブロックを同じサイズに分割し、このように分割された色成分のそれぞれのブロック別に同じ予測方向を決定し、このように決定された予測方向を使用して、復元画像生成部180によって生成された復元画像内の隣接画素から現在画像を構成するブロックを予測し、このように予測されたブロックで構成された予測画像を生成することによって、単一イントラ予測を行う。
【0050】
図4は、イントラ予測における予測様子を示す図である。図4を参照するに、16×16サイズのマクロブロックを4×4サイズに分割した後、このように分割されたブロック別に9個の予測方向を使用して予測画像が生成される。そうでなければ、16×16サイズのマクロブロックに対して、4個の予測方向を使用して予測画像が生成されることもある。前者の場合をさらに詳細に説明すれば、4×4サイズのブロックPa,Pb,…,Pqを予測するために、復元画像内の空間上隣接画素P0,P1,…,P12を利用する(41)。0から8までの9個の予測方向を使用して、隣接画素P0,P1,…,P12からPa,Pb,…,Pqを予測する(42)。0の方向を例と挙げれば、隣接画素P1,P2,P3,及びP4を0の方向に該当する垂直下降方向に投影することによって、Pa,Pe,Pi,及びPmはP1から予測し、Pb,Pf,Pj,及びPnはP2から予測し、Pc,Pg,Pk,及びPdはP3から予測し、Pd,Ph,Pl,及びPqはP4から予測する。他の方向の場合も同様に、前記のような投影によってPa,Pb,..,Pqが予測される。
【0051】
YCoCg色空間を例と挙げれば、単一モードレジデュー生成部1211は、Y成分のマクロブロック、Co成分のマクロブロック、Cg成分のマクロブロックを何れも同じサイズに分割し、例えば、Y成分のマクロブロック、Co成分のマクロブロック、Cg成分のマクロブロックを何れも4×4サイズに分割し、このように分割されたY成分のブロック、Co成分のブロック、Cg成分のブロック別に同じ予測方向を決定する。また、RGB色空間を例と挙げれば、単一モードレジデュー生成部1211は、R成分のマクロブロック、G成分のマクロブロック、B成分のマクロブロックを何れも同じサイズに分割し、例えば、R成分のマクロブロック、G成分のマクロブロック、B成分のマクロブロックを何れも4×4サイズに分割し、このように分割されたR成分のブロック、G成分のブロック、B成分のブロック別に同じ予測方向を決定する。
【0052】
前記のように、単一モードレジデュー生成部1211は、異なる色成分のそれぞれに同じ時間上予測方式及び同じ空間上予測方式を適用するために、色成分のそれぞれのレジデュー間の類似性が大きくなる。また、ブロックのサイズ、動きベクトル、予測方向が全ての色成分に一律的に適用されるため、色成分ごとにこのような情報を符号化させる必要なく、全ての色成分に対して、1回のみこのような情報を符号化させればよいため、全体的な符号化効率を高めうるという長所がある。
【0053】
複合モードレジデュー生成部1212は、最適モード選択部110によって選択された予測モードが複合予測モードであれば、複合予測モードによって現在画像と参照画像との時間的重畳性を除去する時間上予測(以下、“複合インター予測”という)を行うか、または現在画像の色成分のそれぞれのマクロブロックに独立的に適用される予測モードによって、現在画像内の空間的重複性を除去する空間上予測(以下、“複合イントラ予測”という)を行うことによって予測画像を生成する。また、複合モードレジデュー生成部1212は、現在画像とこのように生成された予測画像との差に該当するレジデューを生成する。
【0054】
さらに詳細に説明すれば、複合モードレジデュー生成部1212は、現在画像の色成分のそれぞれのマクロブロックに独立的に適用されるサイズに色成分のそれぞれのマクロブロックを分割し、このように分割された色成分のそれぞれのブロック別に色成分のそれぞれのブロックに独立的に適用される参照画像と現在画像との間の動きベクトルを決定し、このように決定された動きベクトルを使用して、参照画像から現在画像に対する予測画像を生成することによって複合インター予測を行う。
【0055】
すなわち、複合モードレジデュー生成部1212は、現在画像の色成分のそれぞれのマクロブロックを異なるサイズに分割し、このように分割された色成分のそれぞれのブロック別に異なる動きベクトルを決定し、このように決定された動きベクトルを使用して参照画像から現在画像に対する予測画像を生成することによって、複合インター予測を行う。もちろん、複合モードレジデュー生成部1212は、現在画像の色成分のそれぞれのマクロブロックに独立的に適用される予測モードによってインター予測を行うため、現在画像の色成分のそれぞれのマクロブロックを同じサイズに分割し、このように分割された色成分のそれぞれのブロック別に同じ動きベクトルを決定することもある。
【0056】
YCoCg色空間を例と挙げれば、複合モードレジデュー生成部1212は、Y成分のマクロブロック、Co成分のマクロブロック、Cg成分のマクロブロックを異なるサイズに分割し、例えば、Y成分のマクロブロックを4×4、Co成分のマクロブロックを8×8、Cg成分のマクロブロックを8×8のサイズに分割し、このように分割されたY成分のブロック、Co成分のブロック、Cg成分のブロック別に異なる動きベクトルを決定する。また、RGB色空間を例と挙げれば、複合モードレジデュー生成部1212は、R成分のマクロブロック、G成分のマクロブロック、B成分のマクロブロックを異なるサイズに分割し、例えば、R成分のマクロブロックを8×8、G成分のマクロブロックを4×4、B成分のマクロブロックを8×8のサイズに分割し、このように分割されたR成分のブロック、G成分のブロック、B成分のブロック別に異なる動きベクトルを決定する。
【0057】
また、複合モードレジデュー生成部1212は、現在画像の色成分のそれぞれのマクロブロックに独立的に適用されるサイズに色成分のそれぞれのマクロブロックを分割し、このように分割された色成分のそれぞれのブロック別に色成分のそれぞれのブロックに独立的に適用される予測方向を決定し、このように決定された予測方向を使用して、復元画像生成部180によって生成された復元画像内の隣接画素から現在画像を構成するブロックを予測し、このように予測されたブロックで構成された予測画像を生成することによって、複合イントラ予測を行う。
【0058】
すなわち、複合モードレジデュー生成部1212は、現在画像の色成分のそれぞれのマクロブロックを異なるサイズに色成分のそれぞれのマクロブロックを分割し、このように分割された色成分のそれぞれのブロック別に異なる予測方向を決定し、このように決定された予測方向を使用して、復元画像生成部180によって生成された復元画像内の隣接画素から現在画像を構成するブロックを予測し、このように予測されたブロックで構成された予測画像を生成することによって、複合イントラ予測を行う。もちろん、複合モードレジデュー生成部1212は、現在画像の色成分のそれぞれのマクロブロックに独立的に適用される予測モードによってイントラ予測を行うため、現在画像の色成分のそれぞれのマクロブロックを同じサイズに分割し、このように分割された色成分のそれぞれのブロック別に同じ動きベクトルを決定することもある。
【0059】
YCoCg色空間を例と挙げれば、複合モードレジデュー生成部1212は、Y成分のマクロブロック、Co成分のマクロブロック、Cg成分のマクロブロックを異なるサイズに分割し、例えば、Y成分のマクロブロックを4×4、Co成分のマクロブロックを16×16、Cg成分のマクロブロックを16×16のサイズに分割し、このように分割されたY成分のブロック、Co成分のブロック、Cg成分のブロック別に異なる予測方向を決定する。また、RGB色空間を例と挙げれば、複合モードレジデュー生成部1212は、R成分のマクロブロック、G成分のマクロブロック、B成分のマクロブロックを異なるサイズに分割し、例えば、R成分のマクロブロックを16×16、G成分のマクロブロックを4×4、B成分のマクロブロックを16×16のサイズに分割し、このように分割されたR成分のブロック、G成分のブロック、B成分のブロック別に異なる予測方向を決定する。
【0060】
さらに、複合モードレジデュー生成部1212は、現在画像の色成分のそれぞれのマクロブロック別に複合インター予測または複合イントラ予測を行うこともある。すなわち、複合モードレジデュー生成部1212は、現在画像の色成分のそれぞれのマクロブロックのうち何れか一つの色成分のマクロブロックに対しては、複合インター予測を行い、他の色成分のマクロブロックに対しては、複合イントラ予測を行うこともある。
【0061】
前記のように、複合モードレジデュー生成部1212は、異なる色成分の間に異なる時間上予測方式と異なる空間上予測方式とを行うため、色成分の間に類似性があまりなければ、相互間にそれぞれ独立的な符号化方法を使用して各色成分に最適の方法を使用することによって、予測符号化を効果的に行って、結局、全体的な符号化効率を高めうるが、色成分に独立的に適用されるブロックのサイズ、動きベクトル、及び予測方向を1回のみ符号化すればよいため、符号化効率を高めうる。
【0062】
図5は、図1に示されたレジデュー生成部120の他の構成図である。図5を参照するに、図5に示されたレジデュー生成部120は、単一モードレジデュー生成部1221、レジデュー変換部1222、及び複合モードレジデュー生成部1223で構成される。単一モードレジデュー生成部1221及び複合モードレジデュー生成部1223は、図2に示された単一モードレジデュー生成部1211及び複合モードレジデュー生成部1212と同じ機能を行う。
【0063】
しかしながら、単一モードレジデュー生成部1221でのインター予測またはイントラ予測以後にも、色成分間には重畳性が残っている。レジデュー変換部1222は、このような色成分間の重畳性を除去する役割を行う。単一モードレジデュー生成部1221によって生成されたレジデューとレジデュー変換部1222によって生成されたレジデューとを区別するために、前者を“第1レジデュー”と称し、後者を“第2レジデュー”と称す。
【0064】
レジデュー変換部1222は、最適モード選択部110によって選択された予測モードがレジデュー変換モードであれば、単一モードレジデュー生成部1221によって生成された第1レジデュー間の差に該当する第2レジデューを生成する。
【0065】
図6は、図1に示されたレジデュー生成部120のさらに他の構成図である。図6を参照するに、図6に示されたレジデュー生成部120は、単一モードレジデュー生成部1231、RCT(Residual Color Transformation)変換部1232、IPP(Inter−Plane Prediction)変換部1233、及びRCP(Residual Color Prediction)変換部1234、及び複合モードレジデュー生成部1235で構成される。単一モードレジデュー生成部1231及び複合モードレジデュー生成部1235は、図2に示された単一モードレジデュー生成部1211及び複合モードレジデュー生成部1212と同じ機能を行う。前記と同様に、単一モードレジデュー生成部1231によって生成されたレジデューWARCT変換部1232、IPP変換部1233、及びRCP変換部1234によって生成されたレジデューを区別するために、前者を“第1レジデュー”と称し、後者を“第2レジデュー”と称す。
【0066】
単一モードレジデュー生成部1221によって生成された第1レジデュー間の差に該当する第2レジデューを生成する方式としては、RCT変換方式、IPP変換方式、RCP変換方式がある。RCT変換は、YCoCg色空間で第2レジデューを生成することによって、IPP変換は、RGB色空間で第2レジデューを生成することによって、RCP変換は、IPP変換と類似しているが、G成分のレジデューを予測子として使用する時に所定のフィルタリングを通じてノイズを除去した後にIPP変換と同じ変換を適用する。
【0067】
RCT変換部1232は、最適モード選択部110によって選択された予測モードがRCT変換モードであれば、YCoCg色空間で次の式(3)を利用してY成分、Co成分、Cg成分それぞれの第1レジデュー間の差に該当する第2レジデューを生成する。特に、Y=(R+2G+B)>>2、Co=(R−B)>>1、Cg=(−R+2G−B)>>2の関係にある。
【0068】
【数3】
ここで、△Xは、第1レジデューを意味し、△2Xは、第2レジデューを意味する。また、表記“>>”は、右側シフト演算を意味し、おおよそ2で割ることとなる。また、変数tは、臨時的な計算目的として使われる。
【0069】
IPP変換部1233は、最適モード選択部110によって選択された予測モードがIPP変換モードであれば、このIPP変換モードによって、RGB色空間で次の式(4)を利用して、R成分、G成分、B成分のそれぞれの第1レジデュー間の差に該当する第2レジデューを生成する。
【0070】
【数4】
ここで、△Xは、第1レジデューを意味し、△2Xは、第2レジデューを意味する。また、△X’は、復元された第1レジデューを意味する。特に、式(2)は、G成分が画像情報を多く有している時に効果的であり、R成分またはB成分を主な成分として第2レジデューを計算することもある。
【0071】
RCP変換部1234は、最適モード選択部110によって選択された予測モードがRCP変換モードであれば、RCP変換モードによって、RGB色空間で次の式(5)のような5タップフィルタを使用して、R成分、G成分、B成分のそれぞれのノイズを除去した後、R成分、G成分、B成分のそれぞれの第1レジデュー間の差に該当する第2レジデューを生成する。
【0072】
【数5】
また、RCP変換部1234は、RGB色空間で次の式(6)のような3タップフィルタを使用して、R成分、G成分、B成分のそれぞれのノイズを除去した後、R成分、G成分、B成分のそれぞれの第1レジデュー間の差に該当する第2レジデューを生成する。
【0073】
【数6】
前記の式(5)及び式(6)で、abs(x)は、xの絶対値を意味し、sign(s)は、次の式(7)を意味する。
【0074】
【数7】
図7A及び図7Bは、本発明による望ましい一実施形態に適用される5タップフィルタと3タップフィルタとを示す図である。図7A及び図7Bを参照するに、本実施形態に適用される5タップフィルタは、予測子として使用する画素を中心に周辺の4個の画素を使用し、3タップフィルタは、予測子として使用する画素を中心に周辺の左右の二つの画素を使用する。但し、前記の式(5)及び式(6)のように、加重値を置いて使用しうる。
【0075】
図8は、図1に示されたレジデュー生成部120のさらに他の構成図である。図8を参照するに、図6に示されたレジデュー生成部120は、複合モードレジデュー生成部1241及びレジデュー変換部1242で構成される。複合モードレジデュー生成部1241は、図2に示された複合モードレジデュー生成部1212と同じ機能を行う。
【0076】
ところが、複合モードレジデュー生成部1241でのインター予測またはイントラ予測以後にも、色成分間には重畳性が残っている。レジデュー変換部1242は、このような色成分間の重畳性を除去する役割を行う。単一モードレジデュー生成部1241によって生成されたレジデューとレジデュー変換部1242によって生成されたレジデューとを区別するために、前者を“第1レジデュー”と称し、後者を“第2レジデュー”と称す。
【0077】
レジデュー変換部1242は、最適モード選択部110によって選択された予測モードがレジデュー変換モードであれば、レジデュー変換モードによって、複合モードレジデュー生成部1241によって生成された第1レジデュー間の差に該当する第2レジデューを生成する。但し、複合モードレジデュー生成部1241でのインター予測またはイントラ予測以後にも、色成分間には重畳性が残っているが、単一モード方式に比べて、色成分間の類似性が低いため、レジデュー変換部1242での圧縮効率は、レジデュー変換部1222での圧縮効率よりは劣る。
【0078】
図9は、図2に示された復元画像生成部180の構成図である。図9を参照するに、図2に示された復元画像生成部180は、レジデュー逆変換部181及び予測補償部182で構成される。
【0079】
レジデュー逆変換部181は、周波数空間逆変換部170によって復元された第2レジデュー間の合算に該当する第1レジデューを生成する。例えば、レジデュー逆変換部181は、次の式(8)を利用して、Y成分、Co成分、Cg成分のそれぞれの第2レジデュー間の合算に該当するY成分、Co成分、Cg成分のそれぞれの第1レジデューを生成する。
【0080】
【数8】
ここで、△X’は、復元された第1レジデューを意味し、△2X’は、復元された第2レジデューを意味する。
【0081】
そうでなければ、レジデュー逆変換部181は、次の式(9)を利用して、R成分、G成分、B成分のそれぞれの第2レジデュー間の合算に該当するR成分、G成分、B成分のそれぞれの第1レジデューを生成する。
【0082】
【数9】
ここで、△X’は、復元された第1レジデューを意味し、△2X’は、復元された第2レジデューを意味する。
【0083】
予測補償部182は、レジデュー生成部120によって生成された予測画像とレジデュー逆変換部181によって生成された第1レジデューとの合算に該当する復元画像を生成する。例えば、予測補償部182は、Y成分、Co成分、及びCg成分ごとに、レジデュー生成部120によって生成された予測画像とレジデュー逆変換部181によって生成された第1レジデューとの合算を算出することによって、YCoCg色空間での復元画像を生成する。そうでなければ、予測補償部182は、R成分、G成分、及びB成分ごとに、レジデュー生成部120によって生成された予測画像とレジデュー逆変換部181によって生成された第1レジデューとの合算を算出することによって、RGB色空間での復元画像を生成する。
【0084】
図10は、本発明の望ましい一実施形態による動画復号化装置の構成図である。図10を参照するに、本実施形態による動画復号化装置は、エントロピー復号化部210、逆量子化部220、周波数空間逆変換部230、予測画面生成部240及び復元画像生成部250で構成される。
【0085】
エントロピー復号化部210は、図1に示された動画符号化装置から出力されたビットストリームをエントロピー復号化することによって、現在画像に該当する整数値及び現在画像の色成分のそれぞれのブロックに最適の予測モードを表す情報を復元する。ここで、現在画像の色成分のそれぞれのブロックに最適である予測モードは、動画符号化装置で使われた予測モードである。
【0086】
逆量子化部220は、エントロピー復号化部210によって復元された整数値を逆量子化することによって周波数成分値を復元する。すなわち、逆量子化部220は、エントロピー復号化部210によって復元された整数値に量子化パラメータを積算することによって周波数成分値を復元する。
【0087】
周波数空間逆変換部230は、逆量子化部220によって復元された周波数成分値を周波数空間から色空間に変換することによって、現在画像と予測画像との差に該当するレジデューを生成する。そうでなければ、周波数空間逆変換部230は、逆量子化部220によって復元された周波数成分値を周波数空間から色空間に変換することによって、色成分のそれぞれの第1レジデュー間の差に該当する第2レジデューを復元する。
【0088】
予測画像生成部240は、色成分のそれぞれのマクロブロック別にエントロピー復号化部210によって復元された情報が表す予測モードによって、現在画像に対する予測画像を生成する。
【0089】
復元画像生成部250は、予測画像生成部240によって生成された予測画像と周波数空間逆変換部230によって復元されたレジデューとの合算に該当する復元画像を生成する。そうでなければ、復元画像生成部250は、周波数空間逆変換部230によって復元された第2レジデュー間の合算に該当する第1レジデューを生成し、予測画像生成部240によって生成された予測画像とこのように生成された第1レジデュー間の合算に該当する復元画像とを生成する。
【0090】
図11は、図10に示された予測画像生成部240の構成図である。図11を参照するに、図10に示された予測画像生成部240は、単一モード予測画像生成部241及び複合モード予測画像生成部242で構成される。
【0091】
単一モード予測画像生成部241は、エントロピー復号化部210によって復元された情報が単一予測モードを表せば、単一イントラ予測または単一インター予測を行うことによって予測画像を生成する。さらに詳細に説明すれば、単一モード予測画像生成部241は、現在画像の色成分のそれぞれのマクロブロックに一律的に適用されるサイズに分割されたブロック別に、色成分のそれぞれのブロックに一律的に適用される参照画像と現在画像との間の動きベクトルを使用して、参照画像から現在画像に対する予測画像を生成する。すなわち、単一モード予測画像生成部241は、現在画像の色成分のそれぞれのマクロブロックに対して同じサイズに分割されたブロック別に同じ動きベクトルを使用して、参照画像から現在画像に対する予測画像を生成する。
【0092】
また、単一モード予測画像生成部241は、現在画像の色成分のそれぞれのマクロブロックに一律的に適用されるサイズに分割されたブロック別に、色成分のそれぞれのブロックに一律的に適用される予測方向を使用して、復元画像生成部250によって生成された復元画像内の隣接画素から現在画像を構成するブロックを予測し、このように予測されたブロックで構成された予測画像を生成する。すなわち、単一モードレジデュー生成部は、現在画像の色成分のそれぞれのマクロブロックに対して同じサイズに分割されたブロック別に同じ予測方向を使用して、復元画像生成部250によって生成された復元画像内の隣接画素から現在画像を構成するブロックを予測し、このように予測されたブロックで構成された予測画像を生成する。
【0093】
複合モード予測画像生成部242は、エントロピー復号化部210によって復元された情報が複合予測モードを表せば、複合インター予測または複合イントラ予測を行うことによって予測画像を生成する。さらに詳細に説明すれば、複合モード予測画像生成部242は、現在画像の色成分のそれぞれのマクロブロックに独立的に適用されるサイズに分割されたブロック別に、色成分のそれぞれのブロックに独立的に適用される参照画像と現在画像との間の動きベクトルを使用して、参照画像から現在画像に対する予測画像を生成する。すなわち、複合モード予測画像生成部242は、現在画像の色成分のそれぞれのマクロブロックに対して、異なるサイズに分割された色成分のそれぞれのブロック別に異なる動きベクトルを使用して、参照画像から現在画像に対する予測画像を生成する。
【0094】
また、複合モード予測画像生成部242は、現在画像の色成分のそれぞれのマクロブロックに独立的に適用されるサイズに分割されたブロック別に、色成分のそれぞれのブロックに一律的に適用される予測方向を使用して、復元画像生成部250によって生成された復元画像内の隣接画素から現在画像を構成するブロックを予測し、このように予測されたブロックで構成された予測画像を生成することによって、複合イントラ予測を行う。すなわち、複合モード予測画像生成部242は、現在画像の色成分のそれぞれのマクロブロックに対して、異なるサイズに分割されたブロック別に異なる予測方向を使用して、復元画像生成部250によって生成された復元画像内の隣接画素から現在画像を構成するブロックを予測し、このように予測されたブロックで構成された予測画像を生成する。
【0095】
図12は、図10に示された復元画像生成部250の構成図である。図12を参照するに、図10に示された復元画像生成部250は、レジデュー逆変換部251及び予測補償部252で構成される。
【0096】
レジデュー逆変換部251は、エントロピー復号化部210によって復元された情報がレジデュー変換モードを表せば、周波数空間逆変換部230によって復元された第2レジデュー間の合算に該当する第1レジデューを生成する。例えば、レジデュー逆変換部251は、前記の式(8)を利用して、Y成分、Co成分、Cg成分のそれぞれの第2レジデュー間の合算に該当するY成分、Co成分、Cg成分のそれぞれの第1レジデューを生成する。そうでなければ、レジデュー逆変換部251は、前記の式(9)を利用して、R成分、G成分、B成分のそれぞれの第2レジデュー間の合算に該当するR成分、G成分、B成分のそれぞれの第1レジデューを生成する。
【0097】
予測補償部252は、予測画像生成部240によって生成された予測画像とレジデュー逆変換部251によって生成された第1レジデューとの合算に該当する復元画像を生成する。例えば、予測補償部252は、Y成分、Co成分、及びCg成分ごとに予測画像生成部240によって生成された予測画像とレジデュー逆変換部251によって生成された第1レジデューとの合算を算出することによって、YCoCg色空間での復元画像を生成する。そうでなければ、予測補償部252は、R成分、G成分、及びB成分ごとに予測画像生成部240によって生成された予測画像とレジデュー逆変換部251によって生成された第1レジデューとの合算を算出することによって、RGB色空間での復元画像を生成する。
【0098】
図13は、図12に示されたレジデュー逆変換部251の構成図である。図13を参照するに、図12に示されたレジデュー逆変換部251は、RCT変換部2511、IPP変換部2512、及びRCP変換部2513で構成される。
【0099】
RCT変換部2511は、エントロピー復号化部210によって復元された情報がRCT変換モードを表せば、前記の式(8)を利用して、Y成分、Co成分、Cg成分のそれぞれの第2レジデュー間の合算に該当するY成分、Co成分、Cg成分のそれぞれの第1レジデューを生成する。
【0100】
IPP変換部2512は、エントロピー復号化部210によって復元された情報がIPP変換モードを表せば、前記の式(9)を利用して、R成分、G成分、B成分のそれぞれの第2レジデュー間の合算に該当するR成分、G成分、B成分のそれぞれの第1レジデューを生成する。
【0101】
RCP変換部2513は、エントロピー復号化部210によって復元された情報がRCP変換モードを表せば、前記の式(9)を利用して、R成分、G成分、B成分のそれぞれの第2レジデュー間の合算に該当するR成分、G成分、B成分のそれぞれの第1レジデューを生成する。
【0102】
図14A及び図14Bは、本発明の望ましい一実施形態による動画符号化方法を示すフローチャートである。図14A及び図14Bを参照するに、本実施形態による動画符号化方法は、図1に示された動画符号化装置で時系列的に処理されるステップで構成される。したがって、以下省略された内容であっても、図1に示された動画符号化装置について前述された内容は、本実施形態による動画符号化方法にも適用される。
【0103】
ステップ1401で、動画符号化装置は、サンプル画像に対して全ての可能な予測モードのうち何れか一つを選択する。特に、下記のステップ1406からステップ1401に戻った場合には、動画符号化装置は、全ての可能な予測モードのうち、既に選択された予測モードを除外したもののうち何れか一つを選択する。
【0104】
ステップ1402で、動画符号化装置は、ステップ1401で選択された予測モードによって、色成分のそれぞれのマクロブロック別に現在画像に対する予測画像を生成し、現在画像と予測画像との差に該当するレジデューを生成する。そうでなければ、ステップ1402で、動画符号化装置は、ステップ1401で選択された予測モードによって色成分のそれぞれのマクロブロック別に現在画像に対する予測画像を生成し、現在画像と予測画像との差に該当する第1レジデューを生成し、色成分のそれぞれの第1レジデュー間の差に該当する第2レジデューを生成する。
【0105】
ステップ1403で、動画符号化装置は、ステップ1402で生成されたレジデューを色空間から周波数空間に変換する。そうでなければ、ステップ1403で、動画符号化装置は、ステップ1402で生成された第2レジデューを色空間から周波数空間に変換する。
【0106】
ステップ1404で、動画符号化装置は、ステップ1403で変換された値を量子化する。
【0107】
ステップ1405で、動画符号化装置は、ステップ1404で量子化された値及びステップ1401で選択された予測モードを表す情報をエントロピー符号化することによって、ビットストリームを生成する。
【0108】
ステップ1406で、動画符号化装置は、ステップ1404で量子化された値を逆量子化することによって周波数成分値を復元する。
【0109】
ステップ1407で、動画符号化装置は、ステップ1406で復元された周波数成分値を周波数空間から色空間に変換することによって、現在画像と予測画像との差に該当するレジデューを復元する。そうでなければ、ステップ1407で動画符号化装置は、ステップ1406で復元された周波数成分値を周波数空間から色空間に変換することによって、色成分のそれぞれの第1レジデュー間の差に該当する第2レジデューを復元する。
【0110】
ステップ1408で、動画符号化装置は、ステップ1402で生成された予測画像とステップ1407によって復元されたレジデュー間の合算に該当する復元画像とを生成する。そうでなければ、ステップ1408で、動画符号化装置は、ステップ1407で復元された第2レジデュー間の合算に該当する第1レジデューを生成し、ステップ1402で生成された予測画像とこのように生成された第1レジデュー間の合算に該当する復元画像とを生成する。
【0111】
ステップ1409で、動画符号化装置は、全ての予測モードに対して、前記ステップ1401〜1408が行われたか否かを判断し、もし、全ての予測モードに対して前記ステップ1401〜1408が行われた場合には、ステップ1410に進み、行われていない場合には、ステップ1401に戻る。
【0112】
ステップ1410で、動画符号化装置は、サンプル画像の特性、すなわち、ステップ1401〜1409で行われた結果に基づいて、現在画像の色成分のそれぞれのマクロブロック別に色成分のそれぞれのマクロブロックに最適の予測モードを選択する。すなわち、ステップ1410で、動画符号化装置は、現在画像の色成分のそれぞれのマクロブロックに最適の予測モードとして、ステップ1405で生成されたビットストリームの量及びサンプル画像とステップ1408で生成された復元画像との間の画質の歪曲が最も少ない予測モードを選択する。
【0113】
ステップ1411で、動画符号化装置は、ステップ1410で選択された予測モードによって、色成分のそれぞれのマクロブロック別に現在画像に対する予測画像を生成し、現在画像と予測画像との差に該当するレジデューを生成する。そうでなければ、ステップ1411で、動画符号化装置は、ステップ1410で選択された予測モードによって色成分のそれぞれのマクロブロック別に現在画像に対する予測画像を生成し、現在画像と予測画像との差に該当する第1レジデューを生成し、色成分のそれぞれの第1レジデュー間の差に該当する第2レジデューを生成する。
【0114】
ステップ1412で、動画符号化装置は、ステップ1411で生成されたレジデューを色空間から周波数空間に変換する。そうでなければ、ステップ1412で、動画符号化装置は、ステップ1411で生成された第2レジデューを色空間から周波数空間に変換する。
【0115】
ステップ1413で、動画符号化装置は、ステップ1414で変換された値を量子化する。
【0116】
ステップ1414で、動画符号化装置は、ステップ1413で量子化された値及びステップ1410で選択された予測モードを表す情報をエントロピー符号化することによって、ビットストリームを生成する。
【0117】
ステップ1415で、動画符号化装置は、ステップ1413で量子化された値を逆量子化することによって周波数成分値を復元する。
【0118】
ステップ1416で、動画符号化装置は、ステップ1415で復元された周波数成分値を周波数空間から色空間に変換することによって、現在画像と予測画像との差に該当するレジデューを復元する。そうでなければ、ステップ1416で、動画符号化装置は、ステップ1415で復元された周波数成分値を周波数空間から色空間に変換することによって、色成分のそれぞれの第1レジデュー間の差に該当する第2レジデューを復元する。
【0119】
ステップ1417で、動画符号化装置は、ステップ1411で生成された予測画像とステップ1416で復元されたレジデュー間の合算に該当する復元画像とを生成する。そうでなければ、ステップ1417で、動画符号化装置は、ステップ1416で復元された第2レジデュー間の合算に該当する第1レジデューを生成し、ステップ1411で生成された予測画像とこのように生成された第1レジデュー間の合算に該当する復元画像とを生成する。
【0120】
図15は、本発明の望ましい一実施形態による動画復号化方法を示すフローチャートである。図15を参照するに、本実施形態による動画復号化方法は、図10に示された動画復号化装置で時系列的に処理されるステップで構成される。したがって、以下省略された内容であっても、図10に示された動画復号化装置について前述された内容は、本実施形態による動画復号化方法にも適用される。
【0121】
ステップ1501で、動画復号化装置は、図1に示された動画符号化装置から出力されたビットストリームをエントロピー復号化することによって、現在画像に該当する整数値及び現在画像の色成分のそれぞれのブロックに最適の予測モードを表す情報を復元する。
【0122】
ステップ1502で、動画復号化装置は、ステップ1501で復元された整数値を逆量子化することによって周波数成分値を復元する。
【0123】
ステップ1503で、動画復号化装置は、ステップ1502で復元された周波数成分値を周波数空間から色空間に変換することによって、現在画像と予測画像との差に該当するレジデューを生成する。そうでなければ、ステップ1503で、動画復号化装置は、ステップ1502で復元された周波数成分値を周波数空間から色空間に変換することによって、色成分のそれぞれの第1レジデュー間の差に該当する第2レジデューを復元する。
【0124】
ステップ1504で、動画復号化装置は、ステップ1501で復元された情報がレジデュー変換モードを表せば、ステップ1505に進み、表さなければ、ステップ1506に進む。
【0125】
ステップ1505で、動画復号化装置は、ステップ1502で復元された第2レジデュー間の合算に該当する第1レジデューを生成する。特に、ステップ1505で、動画復号化装置は、ステップ1501で復元された情報がRCT変換モードを表せば、前記の式(8)を利用して、Y成分、Co成分、Cg成分のそれぞれの第2レジデュー間の合算に該当するY成分、Co成分、Cg成分のそれぞれの第1レジデューを生成する。また、ステップ1505で、動画復号化装置は、ステップ1501で復元された情報がIPP変換モードまたはRCP変換モードを表せば、前記の式(9)を利用して、R成分、G成分、B成分のそれぞれの第2レジデュー間の合算に該当するR成分、G成分、B成分のそれぞれの第1レジデューを生成する。
【0126】
RCP変換部1234は、エントロピー復号化部210によって復元された情報がRCP変換モードを表せば、前記の式(9)を利用して、R成分、G成分、B成分のそれぞれの第2レジデュー間の合算に該当するR成分、G成分、B成分のそれぞれの第1レジデューを生成する。
【0127】
ステップ1506で、動画復号化装置は、ステップ1501で復元された情報が単一予測モードを表せば、ステップ1507に進み、複合予測モードを表せば、ステップ1508に進む。
【0128】
ステップ1507で、動画復号化装置は、現在画像の色成分のそれぞれのブロックに一律的に適用されるサイズに分割されたブロック別に、色成分のそれぞれのブロックに一律的に適用される動きベクトルを使用して予測画面を生成するか、または色成分のそれぞれのブロックに一律的に適用される予測方向を使用して予測画面を生成する。
【0129】
ステップ1508で、動画復号化装置は、現在画像の色成分のそれぞれのブロックに独立的に適用されるサイズに分割されたブロック別に、色成分のそれぞれのブロックに独立的に適用される動きベクトルを使用して予測画面を生成するか、または色成分のそれぞれのブロックに独立的に適用される予測方向を使用して予測画面を生成する。
【0130】
ステップ1509で、動画復号化装置は、ステップ1507またはステップ1508で生成された予測画像とステップ1503で復元されたレジデュー間の合算に該当する復元画像とを生成する。そうでなければ、復元画像生成部250は、ステップ1507またはステップ1508で生成された予測画像とステップ1505で生成された第1レジデュー間の合算に該当する復元画像とを生成する。
【0131】
一方、前述した本発明の実施形態は、コンピュータで実行できるプログラムで作成可能であり、コンピュータで読み取り可能な記録媒体を利用して、前記プログラムを動作させる汎用デジタルコンピュータで具現される。また、前述した本発明の実施形態で使われたデータの構造は、コンピュータで読み取り可能な記録媒体に多様な手段を通じて記録される。
【0132】
前記コンピュータで読み取り可能な記録媒体は、マグネチック保存媒体(例えば、ROM(Read Only Memory)、フロッピー(登録商標)ディスク、ハードディスクなど)、光学的判読媒体(例えば、CD−ROM、DVDなど)及びキャリアウェーブ(例えば、インターネットを通じた伝送)のような保存媒体を含む。
【0133】
以上、本発明についてその望ましい実施形態を中心に説明した。当業者は、本発明が本発明の本質的な特性から逸脱しない範囲で変形された形態で具現されるということが分かるであろう。したがって、開示された実施形態は、限定的な観点でなく、説明的な観点で考慮されねばならない。本発明の範囲は、前述した説明でなく、特許請求の範囲に現れており、それと同等な範囲内にある全ての差異点は、本発明に含まれていると解釈されねばならない。
【符号の説明】
【0134】
210 エントロピー復号化部
220 逆量子化部
230 周波数空間逆変換部
240 予測画像生成部
250 復元画像生成部
241 単一モード予測画像生成部
242 複合モード予測画像生成部
【技術分野】
【0001】
本発明は、動画を符号化する方法及び装置、動画を復号化する方法及び装置に係り、特に、H.264/MPEG−4 AVC(Advanced Video Coding)FRExt(Fidelity Range Extensions)標準分野における動画を符号化する方法及び装置、動画を復号化する方法及び装置に関する。
【背景技術】
【0002】
“レジデュアル色変換”と呼ばれる新たなRGB符号化技術は、H.264/MPEG−4 AVC FRExt標準化過程で開発された。これは、RGB色空間をYCbCr色空間に変換する時に発生する画質の劣化を防止するためのものである。しかし、H.264/MPEG−4 AVC FRExt上のRGB符号化及び復号化技術も、動画再生機器に適用するにはまだ動画の符号化及び復号化効率が十分に高くないという問題点があった。
【発明の概要】
【発明が解決しようとする課題】
【0003】
本発明が解決しようとする技術的課題は、H.264/MPEG−4 AVC FRExt上のRGB符号化技術の動画符号化及び復号化効率を高めうる装置及び方法を提供することである。
【0004】
また、前記の方法をコンピュータで実行させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体を提供することである。
【課題を解決するための手段】
【0005】
前記課題を解決するための本発明による符号化装置における予測画像の生成方法は、所定画像の特性に基づいて、現在画像の色成分のそれぞれのブロック別に前記色成分のそれぞれのブロックに最適の予測モードを選択するステップと、前記選択された予測モードによって、前記現在画像に対する予測画像を生成するステップと、を含む。
【0006】
前記他の課題を解決するために、本発明は、前記の符号化装置における予測画像の生成方法をコンピュータで実行させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体を提供する。
【0007】
前記さらに他の課題を解決するための本発明による符号化装置における予測画像生成装置は、所定画像の特性に基づいて、現在画像の色成分のそれぞれのブロック別に前記色成分のそれぞれのブロックに最適の予測モードを選択する選択部と、前記選択された予測モードによって、前記現在画像に対する予測画像を生成する生成部と、を備える。
【0008】
前記さらに他の課題を解決するための本発明による符号化方法は、所定画像の特性に基づいて、現在画像の色成分のそれぞれのブロック別に前記色成分のそれぞれのブロックに最適の予測モードを選択するステップと、前記選択された予測モードによって、前記現在画像に対する予測画像を生成するステップと、前記現在画像と前記予測画像との差に該当する色成分のそれぞれのレジデューを生成するステップと、前記生成されたレジデューを符号化することによってビットストリームを生成するステップと、を含む。
【0009】
前記さらに他の課題を解決するために、本発明は、前記の符号化方法をコンピュータで実行させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体を提供する。
【0010】
前記さらに他の課題を解決するための本発明による符号化装置は、所定画像の特性に基づいて、現在画像の色成分のそれぞれのブロック別に前記色成分のそれぞれのブロックに最適の予測モードを選択する選択部と、前記選択された予測モードによって前記現在画像に対する予測画像を生成し、前記現在画像と前記予測画像との差に該当する色成分のそれぞれのレジデューを生成する生成部と、前記生成されたレジデューを符号化することによって、ビットストリームを生成する符号化部と、を備える。
【0011】
前記さらに他の課題を解決するための本発明による復号化装置における予測画像の生成方法は、ビットストリームを復号化することによって、現在画像の色成分のそれぞれのブロックに最適の予測モードを表す情報を復元するステップと、前記復元された情報が表す予測モードによって、前記現在画像に対する予測画像を生成するステップと、を含む。
【0012】
前記さらに他の課題を解決するために、本発明は、前記の復号化装置における予測画像の生成方法をコンピュータで実行させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体を提供する。
【0013】
前記さらに他の課題を解決するための本発明による復号化装置における予測画像生成装置は、ビットストリームを復号化することによって、現在画像の色成分のそれぞれのブロックに最適の予測モードを表す情報を復元する復号化部と、前記復元された情報が表す予測モードによって、前記現在画像に対する予測画像を生成する生成部と、を備える。
【0014】
前記さらに他の課題を解決するための本発明による復号化方法は、ビットストリームを復号化することによって、現在画像の色成分のそれぞれのブロックに最適の予測モードを表す情報を復元するステップと、前記復元された情報が表す予測モードによって、前記現在画像と前記現在画像に対する予測画像との差に該当するレジデューを生成するステップと、前記復元された情報が表す予測モードによって、前記予測画像を生成するステップと、前記生成されたレジデューと前記生成された予測画面との合算に該当する復元画面を生成するステップと、を含む。
【0015】
前記さらに他の課題を解決するために、本発明は、前記の復号化方法をコンピュータで実行させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体を提供する。
【0016】
前記さらに他の課題を解決するための本発明による復号化装置は、ビットストリームを復号化することによって、現在画像の色成分のそれぞれのブロックに最適の予測モードを表す情報を復元する復号化部と、前記復元された情報が表す予測モードによって、前記予測画像を生成する第1生成部と、前記復元された情報が表す予測モードによって、前記現在画像と前記現在画像に対する予測画像との差に該当するレジデューを生成し、前記生成されたレジデューと前記生成された予測画面との合算に該当する復元画面を生成する第2生成部と、を備える。
【発明の効果】
【0017】
本発明によれば、現在画像の色成分のそれぞれのマクロブロック別に色成分のそれぞれのマクロブロックに最適の予測モードを適応的に適用して動画の符号化及び復号化を行うことによって、動画の符号化及び復号化効率を高めうる。特に、現在画像の色成分のそれぞれのマクロブロック別に、単一予測モード、複合予測モード、インター予測、イントラ予測、レジデュー変換、RCT(Residual Color Transformation)変換、IPP(Inter−Plane Prediction)変換、RCP(Residual Color Prediction)変換などの多様な符号化方式を選択的に適用することによって、動画の符号化及び復号化効率を極大化させうる。
【図面の簡単な説明】
【0018】
【図1】本発明の望ましい一実施形態による動画符号化装置の構成図である。
【図2】図1に示されたレジデュー生成部の構成図である。
【図3】インター予測でのマクロブロックの分割方法を示す図である。
【図4】イントラ予測での予測様子を示す図である。
【図5】図1に示されたレジデュー生成部の他の構成図である。
【図6】図1に示されたレジデュー生成部のさらに他の構成図である。
【図7A】本発明による望ましい一実施形態に適用される5−タブフィルタを示す図である。
【図7B】本発明による望ましい一実施形態に適用される3−タブフィルタとを示す図である。
【図8】図1に示されたレジデュー生成部のさらに他の構成図である。
【図9】図2に示された復元画像生成部の構成図である。
【図10】本発明の望ましい一実施形態による動画復号化装置の構成図である。
【図11】図10に示された予測画像生成部の構成図である。
【図12】図10に示された復元画像生成部の構成図である。
【図13】図12に示されたレジデュー逆変換部の構成図である。
【図14A】本発明の望ましい一実施形態による動画符号化方法を示すフローチャートである。
【図14B】本発明の望ましい一実施形態による動画符号化方法を示すフローチャートである。
【図15】本発明の望ましい一実施形態による動画復号化方法を示すフローチャートである。
【発明を実施するための形態】
【0019】
以下、図面を参照して、本発明の望ましい実施形態を詳細に説明する。特に、以下の実施形態で、現在画像は、現在の動画符号化及び復号化の対象となる画像を意味し、参照画像は、現在画像の符号化または復号化に参照される画像を意味する。一般的に、参照画像は、現在画像の過去画像であるが、現在画像の未来画像となってもよく、複数の画像となってもよい。
【0020】
図1は、本発明の望ましい一実施形態による動画符号化装置の構成図である。図1を参照するに、本実施形態による動画符号化装置は、最適モード選択部110、レジデュー生成部120、周波数空間変換部130、量子化部400、エントロピー符号化部150、逆量子化部160、周波数空間逆変換部170、及び復元画像生成部180で構成される。
【0021】
最適モード選択部110は、サンプル画像の特性に基づいて、現在画像の色成分のそれぞれのマクロブロック別に色成分のそれぞれのマクロブロックに最適の予測モードを選択する。ここで、色成分のそれぞれのマクロブロックは、相互対応するマクロブロックということを、当業者ならば理解できる。
【0022】
例えば、最適モード選択部110は、現在画像の色成分のそれぞれのマクロブロックに最適である予測モードとして、現在画像の色成分のそれぞれのマクロブロックに一律的に適用される予測モード(以下、“単一予測モード”という)及び現在画像の色成分のそれぞれのマクロブロックに独立的に適用される予測モード(以下、“複合予測モード”)のうち何れか一つを選択しうる。
【0023】
また、最適モード選択部110は、現在画像の色成分のそれぞれのマクロブロックに、最適の予測モードとして単一予測モード及び複合予測モードのうち何れか一つを選択し、これらのうち単一予測モードを選択した場合に、色成分のそれぞれの第1レジデュー間の差に該当する第2レジデューを生成する予測モード(以下、“レジデュー変換モード”という)を選択することもある。
【0024】
また、最適モード選択部110は、現在画像の色成分のそれぞれのマクロブロックに、最適の予測モードとして単一予測モード及び複合予測モードのうち何れか一つを選択し、これらのうち単一予測モードを選択した場合に、RCT(Residual Color Transformation)変換を行う予測モード(以下、“RCT変換モード”という)、IPP(Inter−Plane Prediction)変換を行うモード(以下、“IPP変換モード”という)、及びRCP(Residual Color Prediction)変換を行う予測モード(以下、“RCP変換モード”という)のうち何れか一つを選択することもある。RCT変換、IPP変換、RCP変換については後述する。
【0025】
本実施形態で、サンプル画像としては、現在画像の以前画像のうち何れか一つが使われる。最適モード選択部110は、サンプル画像の色成分のそれぞれのマクロブロックに最適の予測モードを選択するために、このサンプル画像に対して全ての可能な予測モードを一つずつ順次に選択し、選択された予測モードによって符号化された全ての結果を比較して、多数の予測モードのうち、このサンプル画像の色成分のそれぞれのマクロブロックに最適の予測モードを選択する。以後、この予測モードが現在画像の色成分のそれぞれのマクロブロックに最適の予測モードとして使われる。
【0026】
さらに詳細に説明すれば、最適モード選択部110は、現在画像の色成分のそれぞれのマクロブロックに最適である予測モードとして、サンプル画像を符号化した結果に該当するビットストリームの量及びサンプル画像とこのサンプル画像の復元画像との間の画質の歪曲が最も少ない予測モードを選択する。下記のものを参照するに、サンプル画像を符号化した結果に該当するビットストリームの量は、エントロピー符号化部150によって生成されたビットストリームの量となり、サンプル画像の復元画像は、復元画像生成部180によって生成された復元画像となる。
【0027】
特に、本実施形態によれば、最適モード選択部110は、ラグランジアン最適化技法を使用して最適モードを選択する。すなわち、最適モード選択部110は、次の式(1)を利用して、原本画像と復元画像との差値を乗算して合算した値の平均から画質の歪曲を算出する。
【0028】
【数1】
ここで、Dは、画質歪曲の程度を表し、pは、現在画像の画素値を表し、qは、以前画像の画素値を表し、iは、現在画像の現在マクロブロック内での画素のインデックスを表す。
【0029】
また、最適モード選択部110は、次の式(2)を利用して画質の歪曲の程度とビットストリームの量のそれぞれの単位との差を調整するために、一定定数“λ”とビットストリームの量“R”とを積算し、この積算値と画質の歪曲の程度“D”とを合算することによって、現在画像の色成分のそれぞれのマクロブロックに最適の予測モードを選択するための最終値“L”を算出する。
【0030】
【数2】
ここで、Rは、ビットストリームの量を表し、λは、所定の定数を表す。このような値を各予測方法別に計算した数Lが最も小さな予測方法を選択する。
【0031】
前記のラグランジアン最適化技法によって実験を行えば、最適モード選択部110は、サンプル画像の色成分のそれぞれの類似性が高い場合には、単一予測モードを選択し、サンプル画像の色成分間の類似性が低い場合には、複合予測モードを選択する。
【0032】
レジデュー生成部120は、最適モード選択部110によって選択された予測モードによって、色成分のそれぞれのマクロブロック別に現在画像に対する予測画像を生成し、現在画像と予測画像との差に該当するレジデューを生成する。そうでなければ、レジデュー生成部120は、最適モード選択部110によって選択された予測モードによって、色成分のそれぞれのマクロブロック別に現在画像に対する予測画像を生成し、現在画像と予測画像との差に該当する第1レジデューを生成し、色成分のそれぞれのマクロブロック別に第1レジデューの差に該当する第2レジデューを生成する。
【0033】
周波数空間変換部130は、レジデュー生成部120によって生成されたレジデューを色空間から周波数空間に変換する。そうでなければ、周波数空間変換部130は、レジデュー生成部120によって生成された第2レジデューを色空間から周波数空間に変換する。H.264/MPEG−4 AVCでは、色空間から周波数空間に変換する方式としてDHT(Discrete Hadamard Transformation)、DCT(Discrete Cosine Transformation)基盤の整数変換が導入された。
【0034】
量子化部140は、周波数空間変換部130によって変換された値を量子化する。すなわち、量子化部140は、周波数空間変換部130によって変換された結果である周波数成分値を量子化パラメータで割って、その結果を整数値に近似化する。
【0035】
エントロピー符号化部150は、量子化部140によって量子化された値をエントロピー符号化することによってビットストリームを生成し、これを出力する。特に、本実施形態によれば、エントロピー符号化部150は、動画符号化装置によって使われた予測モード、すなわち、最適モード選択部110によって選択された予測モードを表す情報も共にエントロピー符号化することによって、これを含むビットストリームを生成する。H.264/MPEG−4 AVCでは、エントロピー符号化方式でCAVLC(Context−Adaptive Variable Length Coding)、CABAC(Context−Adaptive Binary Arithmetic Coding)が導入された。
【0036】
さらに詳細に説明すれば、エントロピー符号化部150は、現在画像の色成分のそれぞれのマクロブロック別に、マクロブロックヘッダに最適モード選択部110によって選択された予測モードを表す情報を含むビットストリームを生成する。図10に示された動画復号化装置は、このビットストリームを受信して復号化することによって、動画符号化装置がいかなる予測モードを使用したのかが分かる。
【0037】
もし、現在画像の色成分の全てのマクロブロックに対して、最適モード選択部110によって選択された予測モードがいずれも同じである場合には、マクロブロックの上位レベルであるシーケンスレベルまたはピクチャレベルで一つのシーケンスを構成する全てのマクロブロック、または一つのピクチャを構成する全てのマクロブロックに対して、最適モード選択部110によって選択された予測モードの一つのみを表す情報を含むビットストリームを生成することによって、マクロブロックヘッダに記録される情報を省略でき、符号化効率を高めうる。
【0038】
さらに、現在画像の色成分の全てのマクロブロックに対して、最適モード選択部110によって選択された予測モードの一部が同じである場合には、マクロブロックの上位レベルであるシーケンスレベルまたはピクチャレベルで一つのシーケンスを構成するマクロブロック、または一つのピクチャを構成するマクロブロックのうち一部に対して、最適モード選択部110によって選択された予測モードの一つのみを表す情報を含み、残りのものに対しては、マクロブロックヘッダに最適モード選択部110によって選択された予測モードを表す情報を含むビットストリームを生成することによって、符号化効率を高めうる。
【0039】
逆量子化部160は、量子化部140によって量子化された値を逆量子化する。すなわち、逆量子化部160は、量子化部140によって近似化された整数値に量子化パラメータを積算することによって周波数成分値を復元する。
【0040】
周波数空間逆変換部170は、逆量子化部160によって復元された周波数成分値を周波数空間から色空間に変換することによって、現在画像と予測画像との差に該当するレジデューを復元する。そうでなければ、周波数空間逆変換部170は、逆量子化部160によって復元された周波数成分値を周波数空間から色空間に変換することによって、色成分のそれぞれの第1レジデュー間の差に該当する第2レジデューを復元する。
【0041】
復元画像生成部180は、レジデュー生成部120によって生成された予測画像と周波数空間逆変換部170によって復元されたレジデューとの合算に該当する復元画像を生成する。そうでなければ、復元画像生成部180は、周波数空間逆変換部170によって復元された第2レジデュー間の合算に該当する第1レジデューを生成し、レジデュー生成部120によって生成された予測画像とこのように生成された第1レジデューとの合算に該当する復元画像を生成する。
【0042】
図2は、図1に示されたレジデュー生成部120の構成図である。図2を参照するに、図1に示されたレジデュー生成部120は、単一モードレジデュー生成部1211及び複合モードレジデュー生成部1212で構成される。
【0043】
単一モードレジデュー生成部1211は、最適モード選択部110によって選択された予測モードが単一予測モードであれば、単一予測モードによって現在画像内の空間的な重畳性を除去する空間上予測(以下、“単一イントラ予測”という)を行うか、または単一予測モードによって現在画像と参照画像との時間的な重畳性を除去する時間上予測(以下、“単一インター予測”という)を行うことによって予測画像を生成する。次いで、単一モードレジデュー生成部1211は、現在画像とこのように生成された予測画像との差に該当するレジデューを生成する。
【0044】
さらに詳細に説明すれば、単一モードレジデュー生成部1211は、現在画像の色成分のそれぞれのマクロブロックに一律的に適用されるサイズに色成分のそれぞれのマクロブロックを分割し、このように分割された色成分のそれぞれのブロック別に、色成分のそれぞれのブロックに一律的に適用される参照画像と現在画像との間の動きベクトルを決定し、このように決定された動きベクトルを使用して、参照画像から現在画像に対する予測画像を生成することによって単一インター予測を行う。
【0045】
すなわち、単一モードレジデュー生成部1211は、現在画像の色成分のそれぞれのマクロブロックを同じサイズに分割し、このように分割された色成分のそれぞれのブロック別に同じ動きベクトルを決定し、このように決定された動きベクトルを使用して、参照画像から現在画像に対する予測画像を生成することによって単一インター予測を行う。
【0046】
図3は、インター予測におけるマクロブロックの分割方法を示す図である。図3を参照するに、インター予測におけるマクロブロックの場合、16×16サイズのマクロブロックを16×16、16×8、8×16、8×16、8×8などの多様なサイズに分割した後、このように分割されたブロック別に動きベクトルが決定される。さらに、8×8サイズのブロックを再び8×8、8×4、4×8、4×4のさらに小さく分割した後、このように分割されたブロック別に動きベクトルが決定されることもある。マクロブロックがさらに小さく分割されるほど、レジデューに現在画像と参照画像との間の精密な動きが含まれる。
【0047】
YCoCg色空間を例と挙げれば、単一モードレジデュー生成部1211は、Y成分のマクロブロック、Co成分のマクロブロック、Cg成分のマクロブロックを何れも同じサイズに分割し、例えば、Y成分のマクロブロック、Co成分のマクロブロック、Cg成分のマクロブロックを何れも8×8サイズに分割し、このように分割されたY成分のブロック、Co成分のブロック、Cg成分のブロック別に同じ動きベクトルを決定する。また、RGB色空間を例と挙げれば、単一モードレジデュー生成部1211は、R成分のマクロブロック、G成分のマクロブロック、B成分のマクロブロックを何れも同じサイズに分割し、例えば、R成分のマクロブロック、G成分のマクロブロック、B成分のマクロブロックを何れも8×8サイズに分割し、このように分割されたR成分のブロック、G成分のブロック、B成分のブロック別に同じ動きベクトルを決定する。
【0048】
また、単一モードレジデュー生成部1211は、現在画像の色成分のそれぞれのマクロブロックに一律的に適用されるサイズに色成分のそれぞれのマクロブロックを分割し、このように分割された色成分のそれぞれのブロック別に色成分のそれぞれのブロックに一律的に適用される予測方向を決定し、このように決定された予測方向を使用して、復元画像生成部180によって生成された復元画像内の隣接画素から現在画像を構成するブロックを予測し、このように予測されたブロックで構成された予測画像を生成することによって、単一イントラ予測を行う。
【0049】
すなわち、単一モードレジデュー生成部1211は、現在画像の色成分のそれぞれのマクロブロックを同じサイズに分割し、このように分割された色成分のそれぞれのブロック別に同じ予測方向を決定し、このように決定された予測方向を使用して、復元画像生成部180によって生成された復元画像内の隣接画素から現在画像を構成するブロックを予測し、このように予測されたブロックで構成された予測画像を生成することによって、単一イントラ予測を行う。
【0050】
図4は、イントラ予測における予測様子を示す図である。図4を参照するに、16×16サイズのマクロブロックを4×4サイズに分割した後、このように分割されたブロック別に9個の予測方向を使用して予測画像が生成される。そうでなければ、16×16サイズのマクロブロックに対して、4個の予測方向を使用して予測画像が生成されることもある。前者の場合をさらに詳細に説明すれば、4×4サイズのブロックPa,Pb,…,Pqを予測するために、復元画像内の空間上隣接画素P0,P1,…,P12を利用する(41)。0から8までの9個の予測方向を使用して、隣接画素P0,P1,…,P12からPa,Pb,…,Pqを予測する(42)。0の方向を例と挙げれば、隣接画素P1,P2,P3,及びP4を0の方向に該当する垂直下降方向に投影することによって、Pa,Pe,Pi,及びPmはP1から予測し、Pb,Pf,Pj,及びPnはP2から予測し、Pc,Pg,Pk,及びPdはP3から予測し、Pd,Ph,Pl,及びPqはP4から予測する。他の方向の場合も同様に、前記のような投影によってPa,Pb,..,Pqが予測される。
【0051】
YCoCg色空間を例と挙げれば、単一モードレジデュー生成部1211は、Y成分のマクロブロック、Co成分のマクロブロック、Cg成分のマクロブロックを何れも同じサイズに分割し、例えば、Y成分のマクロブロック、Co成分のマクロブロック、Cg成分のマクロブロックを何れも4×4サイズに分割し、このように分割されたY成分のブロック、Co成分のブロック、Cg成分のブロック別に同じ予測方向を決定する。また、RGB色空間を例と挙げれば、単一モードレジデュー生成部1211は、R成分のマクロブロック、G成分のマクロブロック、B成分のマクロブロックを何れも同じサイズに分割し、例えば、R成分のマクロブロック、G成分のマクロブロック、B成分のマクロブロックを何れも4×4サイズに分割し、このように分割されたR成分のブロック、G成分のブロック、B成分のブロック別に同じ予測方向を決定する。
【0052】
前記のように、単一モードレジデュー生成部1211は、異なる色成分のそれぞれに同じ時間上予測方式及び同じ空間上予測方式を適用するために、色成分のそれぞれのレジデュー間の類似性が大きくなる。また、ブロックのサイズ、動きベクトル、予測方向が全ての色成分に一律的に適用されるため、色成分ごとにこのような情報を符号化させる必要なく、全ての色成分に対して、1回のみこのような情報を符号化させればよいため、全体的な符号化効率を高めうるという長所がある。
【0053】
複合モードレジデュー生成部1212は、最適モード選択部110によって選択された予測モードが複合予測モードであれば、複合予測モードによって現在画像と参照画像との時間的重畳性を除去する時間上予測(以下、“複合インター予測”という)を行うか、または現在画像の色成分のそれぞれのマクロブロックに独立的に適用される予測モードによって、現在画像内の空間的重複性を除去する空間上予測(以下、“複合イントラ予測”という)を行うことによって予測画像を生成する。また、複合モードレジデュー生成部1212は、現在画像とこのように生成された予測画像との差に該当するレジデューを生成する。
【0054】
さらに詳細に説明すれば、複合モードレジデュー生成部1212は、現在画像の色成分のそれぞれのマクロブロックに独立的に適用されるサイズに色成分のそれぞれのマクロブロックを分割し、このように分割された色成分のそれぞれのブロック別に色成分のそれぞれのブロックに独立的に適用される参照画像と現在画像との間の動きベクトルを決定し、このように決定された動きベクトルを使用して、参照画像から現在画像に対する予測画像を生成することによって複合インター予測を行う。
【0055】
すなわち、複合モードレジデュー生成部1212は、現在画像の色成分のそれぞれのマクロブロックを異なるサイズに分割し、このように分割された色成分のそれぞれのブロック別に異なる動きベクトルを決定し、このように決定された動きベクトルを使用して参照画像から現在画像に対する予測画像を生成することによって、複合インター予測を行う。もちろん、複合モードレジデュー生成部1212は、現在画像の色成分のそれぞれのマクロブロックに独立的に適用される予測モードによってインター予測を行うため、現在画像の色成分のそれぞれのマクロブロックを同じサイズに分割し、このように分割された色成分のそれぞれのブロック別に同じ動きベクトルを決定することもある。
【0056】
YCoCg色空間を例と挙げれば、複合モードレジデュー生成部1212は、Y成分のマクロブロック、Co成分のマクロブロック、Cg成分のマクロブロックを異なるサイズに分割し、例えば、Y成分のマクロブロックを4×4、Co成分のマクロブロックを8×8、Cg成分のマクロブロックを8×8のサイズに分割し、このように分割されたY成分のブロック、Co成分のブロック、Cg成分のブロック別に異なる動きベクトルを決定する。また、RGB色空間を例と挙げれば、複合モードレジデュー生成部1212は、R成分のマクロブロック、G成分のマクロブロック、B成分のマクロブロックを異なるサイズに分割し、例えば、R成分のマクロブロックを8×8、G成分のマクロブロックを4×4、B成分のマクロブロックを8×8のサイズに分割し、このように分割されたR成分のブロック、G成分のブロック、B成分のブロック別に異なる動きベクトルを決定する。
【0057】
また、複合モードレジデュー生成部1212は、現在画像の色成分のそれぞれのマクロブロックに独立的に適用されるサイズに色成分のそれぞれのマクロブロックを分割し、このように分割された色成分のそれぞれのブロック別に色成分のそれぞれのブロックに独立的に適用される予測方向を決定し、このように決定された予測方向を使用して、復元画像生成部180によって生成された復元画像内の隣接画素から現在画像を構成するブロックを予測し、このように予測されたブロックで構成された予測画像を生成することによって、複合イントラ予測を行う。
【0058】
すなわち、複合モードレジデュー生成部1212は、現在画像の色成分のそれぞれのマクロブロックを異なるサイズに色成分のそれぞれのマクロブロックを分割し、このように分割された色成分のそれぞれのブロック別に異なる予測方向を決定し、このように決定された予測方向を使用して、復元画像生成部180によって生成された復元画像内の隣接画素から現在画像を構成するブロックを予測し、このように予測されたブロックで構成された予測画像を生成することによって、複合イントラ予測を行う。もちろん、複合モードレジデュー生成部1212は、現在画像の色成分のそれぞれのマクロブロックに独立的に適用される予測モードによってイントラ予測を行うため、現在画像の色成分のそれぞれのマクロブロックを同じサイズに分割し、このように分割された色成分のそれぞれのブロック別に同じ動きベクトルを決定することもある。
【0059】
YCoCg色空間を例と挙げれば、複合モードレジデュー生成部1212は、Y成分のマクロブロック、Co成分のマクロブロック、Cg成分のマクロブロックを異なるサイズに分割し、例えば、Y成分のマクロブロックを4×4、Co成分のマクロブロックを16×16、Cg成分のマクロブロックを16×16のサイズに分割し、このように分割されたY成分のブロック、Co成分のブロック、Cg成分のブロック別に異なる予測方向を決定する。また、RGB色空間を例と挙げれば、複合モードレジデュー生成部1212は、R成分のマクロブロック、G成分のマクロブロック、B成分のマクロブロックを異なるサイズに分割し、例えば、R成分のマクロブロックを16×16、G成分のマクロブロックを4×4、B成分のマクロブロックを16×16のサイズに分割し、このように分割されたR成分のブロック、G成分のブロック、B成分のブロック別に異なる予測方向を決定する。
【0060】
さらに、複合モードレジデュー生成部1212は、現在画像の色成分のそれぞれのマクロブロック別に複合インター予測または複合イントラ予測を行うこともある。すなわち、複合モードレジデュー生成部1212は、現在画像の色成分のそれぞれのマクロブロックのうち何れか一つの色成分のマクロブロックに対しては、複合インター予測を行い、他の色成分のマクロブロックに対しては、複合イントラ予測を行うこともある。
【0061】
前記のように、複合モードレジデュー生成部1212は、異なる色成分の間に異なる時間上予測方式と異なる空間上予測方式とを行うため、色成分の間に類似性があまりなければ、相互間にそれぞれ独立的な符号化方法を使用して各色成分に最適の方法を使用することによって、予測符号化を効果的に行って、結局、全体的な符号化効率を高めうるが、色成分に独立的に適用されるブロックのサイズ、動きベクトル、及び予測方向を1回のみ符号化すればよいため、符号化効率を高めうる。
【0062】
図5は、図1に示されたレジデュー生成部120の他の構成図である。図5を参照するに、図5に示されたレジデュー生成部120は、単一モードレジデュー生成部1221、レジデュー変換部1222、及び複合モードレジデュー生成部1223で構成される。単一モードレジデュー生成部1221及び複合モードレジデュー生成部1223は、図2に示された単一モードレジデュー生成部1211及び複合モードレジデュー生成部1212と同じ機能を行う。
【0063】
しかしながら、単一モードレジデュー生成部1221でのインター予測またはイントラ予測以後にも、色成分間には重畳性が残っている。レジデュー変換部1222は、このような色成分間の重畳性を除去する役割を行う。単一モードレジデュー生成部1221によって生成されたレジデューとレジデュー変換部1222によって生成されたレジデューとを区別するために、前者を“第1レジデュー”と称し、後者を“第2レジデュー”と称す。
【0064】
レジデュー変換部1222は、最適モード選択部110によって選択された予測モードがレジデュー変換モードであれば、単一モードレジデュー生成部1221によって生成された第1レジデュー間の差に該当する第2レジデューを生成する。
【0065】
図6は、図1に示されたレジデュー生成部120のさらに他の構成図である。図6を参照するに、図6に示されたレジデュー生成部120は、単一モードレジデュー生成部1231、RCT(Residual Color Transformation)変換部1232、IPP(Inter−Plane Prediction)変換部1233、及びRCP(Residual Color Prediction)変換部1234、及び複合モードレジデュー生成部1235で構成される。単一モードレジデュー生成部1231及び複合モードレジデュー生成部1235は、図2に示された単一モードレジデュー生成部1211及び複合モードレジデュー生成部1212と同じ機能を行う。前記と同様に、単一モードレジデュー生成部1231によって生成されたレジデューWARCT変換部1232、IPP変換部1233、及びRCP変換部1234によって生成されたレジデューを区別するために、前者を“第1レジデュー”と称し、後者を“第2レジデュー”と称す。
【0066】
単一モードレジデュー生成部1221によって生成された第1レジデュー間の差に該当する第2レジデューを生成する方式としては、RCT変換方式、IPP変換方式、RCP変換方式がある。RCT変換は、YCoCg色空間で第2レジデューを生成することによって、IPP変換は、RGB色空間で第2レジデューを生成することによって、RCP変換は、IPP変換と類似しているが、G成分のレジデューを予測子として使用する時に所定のフィルタリングを通じてノイズを除去した後にIPP変換と同じ変換を適用する。
【0067】
RCT変換部1232は、最適モード選択部110によって選択された予測モードがRCT変換モードであれば、YCoCg色空間で次の式(3)を利用してY成分、Co成分、Cg成分それぞれの第1レジデュー間の差に該当する第2レジデューを生成する。特に、Y=(R+2G+B)>>2、Co=(R−B)>>1、Cg=(−R+2G−B)>>2の関係にある。
【0068】
【数3】
ここで、△Xは、第1レジデューを意味し、△2Xは、第2レジデューを意味する。また、表記“>>”は、右側シフト演算を意味し、おおよそ2で割ることとなる。また、変数tは、臨時的な計算目的として使われる。
【0069】
IPP変換部1233は、最適モード選択部110によって選択された予測モードがIPP変換モードであれば、このIPP変換モードによって、RGB色空間で次の式(4)を利用して、R成分、G成分、B成分のそれぞれの第1レジデュー間の差に該当する第2レジデューを生成する。
【0070】
【数4】
ここで、△Xは、第1レジデューを意味し、△2Xは、第2レジデューを意味する。また、△X’は、復元された第1レジデューを意味する。特に、式(2)は、G成分が画像情報を多く有している時に効果的であり、R成分またはB成分を主な成分として第2レジデューを計算することもある。
【0071】
RCP変換部1234は、最適モード選択部110によって選択された予測モードがRCP変換モードであれば、RCP変換モードによって、RGB色空間で次の式(5)のような5タップフィルタを使用して、R成分、G成分、B成分のそれぞれのノイズを除去した後、R成分、G成分、B成分のそれぞれの第1レジデュー間の差に該当する第2レジデューを生成する。
【0072】
【数5】
また、RCP変換部1234は、RGB色空間で次の式(6)のような3タップフィルタを使用して、R成分、G成分、B成分のそれぞれのノイズを除去した後、R成分、G成分、B成分のそれぞれの第1レジデュー間の差に該当する第2レジデューを生成する。
【0073】
【数6】
前記の式(5)及び式(6)で、abs(x)は、xの絶対値を意味し、sign(s)は、次の式(7)を意味する。
【0074】
【数7】
図7A及び図7Bは、本発明による望ましい一実施形態に適用される5タップフィルタと3タップフィルタとを示す図である。図7A及び図7Bを参照するに、本実施形態に適用される5タップフィルタは、予測子として使用する画素を中心に周辺の4個の画素を使用し、3タップフィルタは、予測子として使用する画素を中心に周辺の左右の二つの画素を使用する。但し、前記の式(5)及び式(6)のように、加重値を置いて使用しうる。
【0075】
図8は、図1に示されたレジデュー生成部120のさらに他の構成図である。図8を参照するに、図6に示されたレジデュー生成部120は、複合モードレジデュー生成部1241及びレジデュー変換部1242で構成される。複合モードレジデュー生成部1241は、図2に示された複合モードレジデュー生成部1212と同じ機能を行う。
【0076】
ところが、複合モードレジデュー生成部1241でのインター予測またはイントラ予測以後にも、色成分間には重畳性が残っている。レジデュー変換部1242は、このような色成分間の重畳性を除去する役割を行う。単一モードレジデュー生成部1241によって生成されたレジデューとレジデュー変換部1242によって生成されたレジデューとを区別するために、前者を“第1レジデュー”と称し、後者を“第2レジデュー”と称す。
【0077】
レジデュー変換部1242は、最適モード選択部110によって選択された予測モードがレジデュー変換モードであれば、レジデュー変換モードによって、複合モードレジデュー生成部1241によって生成された第1レジデュー間の差に該当する第2レジデューを生成する。但し、複合モードレジデュー生成部1241でのインター予測またはイントラ予測以後にも、色成分間には重畳性が残っているが、単一モード方式に比べて、色成分間の類似性が低いため、レジデュー変換部1242での圧縮効率は、レジデュー変換部1222での圧縮効率よりは劣る。
【0078】
図9は、図2に示された復元画像生成部180の構成図である。図9を参照するに、図2に示された復元画像生成部180は、レジデュー逆変換部181及び予測補償部182で構成される。
【0079】
レジデュー逆変換部181は、周波数空間逆変換部170によって復元された第2レジデュー間の合算に該当する第1レジデューを生成する。例えば、レジデュー逆変換部181は、次の式(8)を利用して、Y成分、Co成分、Cg成分のそれぞれの第2レジデュー間の合算に該当するY成分、Co成分、Cg成分のそれぞれの第1レジデューを生成する。
【0080】
【数8】
ここで、△X’は、復元された第1レジデューを意味し、△2X’は、復元された第2レジデューを意味する。
【0081】
そうでなければ、レジデュー逆変換部181は、次の式(9)を利用して、R成分、G成分、B成分のそれぞれの第2レジデュー間の合算に該当するR成分、G成分、B成分のそれぞれの第1レジデューを生成する。
【0082】
【数9】
ここで、△X’は、復元された第1レジデューを意味し、△2X’は、復元された第2レジデューを意味する。
【0083】
予測補償部182は、レジデュー生成部120によって生成された予測画像とレジデュー逆変換部181によって生成された第1レジデューとの合算に該当する復元画像を生成する。例えば、予測補償部182は、Y成分、Co成分、及びCg成分ごとに、レジデュー生成部120によって生成された予測画像とレジデュー逆変換部181によって生成された第1レジデューとの合算を算出することによって、YCoCg色空間での復元画像を生成する。そうでなければ、予測補償部182は、R成分、G成分、及びB成分ごとに、レジデュー生成部120によって生成された予測画像とレジデュー逆変換部181によって生成された第1レジデューとの合算を算出することによって、RGB色空間での復元画像を生成する。
【0084】
図10は、本発明の望ましい一実施形態による動画復号化装置の構成図である。図10を参照するに、本実施形態による動画復号化装置は、エントロピー復号化部210、逆量子化部220、周波数空間逆変換部230、予測画面生成部240及び復元画像生成部250で構成される。
【0085】
エントロピー復号化部210は、図1に示された動画符号化装置から出力されたビットストリームをエントロピー復号化することによって、現在画像に該当する整数値及び現在画像の色成分のそれぞれのブロックに最適の予測モードを表す情報を復元する。ここで、現在画像の色成分のそれぞれのブロックに最適である予測モードは、動画符号化装置で使われた予測モードである。
【0086】
逆量子化部220は、エントロピー復号化部210によって復元された整数値を逆量子化することによって周波数成分値を復元する。すなわち、逆量子化部220は、エントロピー復号化部210によって復元された整数値に量子化パラメータを積算することによって周波数成分値を復元する。
【0087】
周波数空間逆変換部230は、逆量子化部220によって復元された周波数成分値を周波数空間から色空間に変換することによって、現在画像と予測画像との差に該当するレジデューを生成する。そうでなければ、周波数空間逆変換部230は、逆量子化部220によって復元された周波数成分値を周波数空間から色空間に変換することによって、色成分のそれぞれの第1レジデュー間の差に該当する第2レジデューを復元する。
【0088】
予測画像生成部240は、色成分のそれぞれのマクロブロック別にエントロピー復号化部210によって復元された情報が表す予測モードによって、現在画像に対する予測画像を生成する。
【0089】
復元画像生成部250は、予測画像生成部240によって生成された予測画像と周波数空間逆変換部230によって復元されたレジデューとの合算に該当する復元画像を生成する。そうでなければ、復元画像生成部250は、周波数空間逆変換部230によって復元された第2レジデュー間の合算に該当する第1レジデューを生成し、予測画像生成部240によって生成された予測画像とこのように生成された第1レジデュー間の合算に該当する復元画像とを生成する。
【0090】
図11は、図10に示された予測画像生成部240の構成図である。図11を参照するに、図10に示された予測画像生成部240は、単一モード予測画像生成部241及び複合モード予測画像生成部242で構成される。
【0091】
単一モード予測画像生成部241は、エントロピー復号化部210によって復元された情報が単一予測モードを表せば、単一イントラ予測または単一インター予測を行うことによって予測画像を生成する。さらに詳細に説明すれば、単一モード予測画像生成部241は、現在画像の色成分のそれぞれのマクロブロックに一律的に適用されるサイズに分割されたブロック別に、色成分のそれぞれのブロックに一律的に適用される参照画像と現在画像との間の動きベクトルを使用して、参照画像から現在画像に対する予測画像を生成する。すなわち、単一モード予測画像生成部241は、現在画像の色成分のそれぞれのマクロブロックに対して同じサイズに分割されたブロック別に同じ動きベクトルを使用して、参照画像から現在画像に対する予測画像を生成する。
【0092】
また、単一モード予測画像生成部241は、現在画像の色成分のそれぞれのマクロブロックに一律的に適用されるサイズに分割されたブロック別に、色成分のそれぞれのブロックに一律的に適用される予測方向を使用して、復元画像生成部250によって生成された復元画像内の隣接画素から現在画像を構成するブロックを予測し、このように予測されたブロックで構成された予測画像を生成する。すなわち、単一モードレジデュー生成部は、現在画像の色成分のそれぞれのマクロブロックに対して同じサイズに分割されたブロック別に同じ予測方向を使用して、復元画像生成部250によって生成された復元画像内の隣接画素から現在画像を構成するブロックを予測し、このように予測されたブロックで構成された予測画像を生成する。
【0093】
複合モード予測画像生成部242は、エントロピー復号化部210によって復元された情報が複合予測モードを表せば、複合インター予測または複合イントラ予測を行うことによって予測画像を生成する。さらに詳細に説明すれば、複合モード予測画像生成部242は、現在画像の色成分のそれぞれのマクロブロックに独立的に適用されるサイズに分割されたブロック別に、色成分のそれぞれのブロックに独立的に適用される参照画像と現在画像との間の動きベクトルを使用して、参照画像から現在画像に対する予測画像を生成する。すなわち、複合モード予測画像生成部242は、現在画像の色成分のそれぞれのマクロブロックに対して、異なるサイズに分割された色成分のそれぞれのブロック別に異なる動きベクトルを使用して、参照画像から現在画像に対する予測画像を生成する。
【0094】
また、複合モード予測画像生成部242は、現在画像の色成分のそれぞれのマクロブロックに独立的に適用されるサイズに分割されたブロック別に、色成分のそれぞれのブロックに一律的に適用される予測方向を使用して、復元画像生成部250によって生成された復元画像内の隣接画素から現在画像を構成するブロックを予測し、このように予測されたブロックで構成された予測画像を生成することによって、複合イントラ予測を行う。すなわち、複合モード予測画像生成部242は、現在画像の色成分のそれぞれのマクロブロックに対して、異なるサイズに分割されたブロック別に異なる予測方向を使用して、復元画像生成部250によって生成された復元画像内の隣接画素から現在画像を構成するブロックを予測し、このように予測されたブロックで構成された予測画像を生成する。
【0095】
図12は、図10に示された復元画像生成部250の構成図である。図12を参照するに、図10に示された復元画像生成部250は、レジデュー逆変換部251及び予測補償部252で構成される。
【0096】
レジデュー逆変換部251は、エントロピー復号化部210によって復元された情報がレジデュー変換モードを表せば、周波数空間逆変換部230によって復元された第2レジデュー間の合算に該当する第1レジデューを生成する。例えば、レジデュー逆変換部251は、前記の式(8)を利用して、Y成分、Co成分、Cg成分のそれぞれの第2レジデュー間の合算に該当するY成分、Co成分、Cg成分のそれぞれの第1レジデューを生成する。そうでなければ、レジデュー逆変換部251は、前記の式(9)を利用して、R成分、G成分、B成分のそれぞれの第2レジデュー間の合算に該当するR成分、G成分、B成分のそれぞれの第1レジデューを生成する。
【0097】
予測補償部252は、予測画像生成部240によって生成された予測画像とレジデュー逆変換部251によって生成された第1レジデューとの合算に該当する復元画像を生成する。例えば、予測補償部252は、Y成分、Co成分、及びCg成分ごとに予測画像生成部240によって生成された予測画像とレジデュー逆変換部251によって生成された第1レジデューとの合算を算出することによって、YCoCg色空間での復元画像を生成する。そうでなければ、予測補償部252は、R成分、G成分、及びB成分ごとに予測画像生成部240によって生成された予測画像とレジデュー逆変換部251によって生成された第1レジデューとの合算を算出することによって、RGB色空間での復元画像を生成する。
【0098】
図13は、図12に示されたレジデュー逆変換部251の構成図である。図13を参照するに、図12に示されたレジデュー逆変換部251は、RCT変換部2511、IPP変換部2512、及びRCP変換部2513で構成される。
【0099】
RCT変換部2511は、エントロピー復号化部210によって復元された情報がRCT変換モードを表せば、前記の式(8)を利用して、Y成分、Co成分、Cg成分のそれぞれの第2レジデュー間の合算に該当するY成分、Co成分、Cg成分のそれぞれの第1レジデューを生成する。
【0100】
IPP変換部2512は、エントロピー復号化部210によって復元された情報がIPP変換モードを表せば、前記の式(9)を利用して、R成分、G成分、B成分のそれぞれの第2レジデュー間の合算に該当するR成分、G成分、B成分のそれぞれの第1レジデューを生成する。
【0101】
RCP変換部2513は、エントロピー復号化部210によって復元された情報がRCP変換モードを表せば、前記の式(9)を利用して、R成分、G成分、B成分のそれぞれの第2レジデュー間の合算に該当するR成分、G成分、B成分のそれぞれの第1レジデューを生成する。
【0102】
図14A及び図14Bは、本発明の望ましい一実施形態による動画符号化方法を示すフローチャートである。図14A及び図14Bを参照するに、本実施形態による動画符号化方法は、図1に示された動画符号化装置で時系列的に処理されるステップで構成される。したがって、以下省略された内容であっても、図1に示された動画符号化装置について前述された内容は、本実施形態による動画符号化方法にも適用される。
【0103】
ステップ1401で、動画符号化装置は、サンプル画像に対して全ての可能な予測モードのうち何れか一つを選択する。特に、下記のステップ1406からステップ1401に戻った場合には、動画符号化装置は、全ての可能な予測モードのうち、既に選択された予測モードを除外したもののうち何れか一つを選択する。
【0104】
ステップ1402で、動画符号化装置は、ステップ1401で選択された予測モードによって、色成分のそれぞれのマクロブロック別に現在画像に対する予測画像を生成し、現在画像と予測画像との差に該当するレジデューを生成する。そうでなければ、ステップ1402で、動画符号化装置は、ステップ1401で選択された予測モードによって色成分のそれぞれのマクロブロック別に現在画像に対する予測画像を生成し、現在画像と予測画像との差に該当する第1レジデューを生成し、色成分のそれぞれの第1レジデュー間の差に該当する第2レジデューを生成する。
【0105】
ステップ1403で、動画符号化装置は、ステップ1402で生成されたレジデューを色空間から周波数空間に変換する。そうでなければ、ステップ1403で、動画符号化装置は、ステップ1402で生成された第2レジデューを色空間から周波数空間に変換する。
【0106】
ステップ1404で、動画符号化装置は、ステップ1403で変換された値を量子化する。
【0107】
ステップ1405で、動画符号化装置は、ステップ1404で量子化された値及びステップ1401で選択された予測モードを表す情報をエントロピー符号化することによって、ビットストリームを生成する。
【0108】
ステップ1406で、動画符号化装置は、ステップ1404で量子化された値を逆量子化することによって周波数成分値を復元する。
【0109】
ステップ1407で、動画符号化装置は、ステップ1406で復元された周波数成分値を周波数空間から色空間に変換することによって、現在画像と予測画像との差に該当するレジデューを復元する。そうでなければ、ステップ1407で動画符号化装置は、ステップ1406で復元された周波数成分値を周波数空間から色空間に変換することによって、色成分のそれぞれの第1レジデュー間の差に該当する第2レジデューを復元する。
【0110】
ステップ1408で、動画符号化装置は、ステップ1402で生成された予測画像とステップ1407によって復元されたレジデュー間の合算に該当する復元画像とを生成する。そうでなければ、ステップ1408で、動画符号化装置は、ステップ1407で復元された第2レジデュー間の合算に該当する第1レジデューを生成し、ステップ1402で生成された予測画像とこのように生成された第1レジデュー間の合算に該当する復元画像とを生成する。
【0111】
ステップ1409で、動画符号化装置は、全ての予測モードに対して、前記ステップ1401〜1408が行われたか否かを判断し、もし、全ての予測モードに対して前記ステップ1401〜1408が行われた場合には、ステップ1410に進み、行われていない場合には、ステップ1401に戻る。
【0112】
ステップ1410で、動画符号化装置は、サンプル画像の特性、すなわち、ステップ1401〜1409で行われた結果に基づいて、現在画像の色成分のそれぞれのマクロブロック別に色成分のそれぞれのマクロブロックに最適の予測モードを選択する。すなわち、ステップ1410で、動画符号化装置は、現在画像の色成分のそれぞれのマクロブロックに最適の予測モードとして、ステップ1405で生成されたビットストリームの量及びサンプル画像とステップ1408で生成された復元画像との間の画質の歪曲が最も少ない予測モードを選択する。
【0113】
ステップ1411で、動画符号化装置は、ステップ1410で選択された予測モードによって、色成分のそれぞれのマクロブロック別に現在画像に対する予測画像を生成し、現在画像と予測画像との差に該当するレジデューを生成する。そうでなければ、ステップ1411で、動画符号化装置は、ステップ1410で選択された予測モードによって色成分のそれぞれのマクロブロック別に現在画像に対する予測画像を生成し、現在画像と予測画像との差に該当する第1レジデューを生成し、色成分のそれぞれの第1レジデュー間の差に該当する第2レジデューを生成する。
【0114】
ステップ1412で、動画符号化装置は、ステップ1411で生成されたレジデューを色空間から周波数空間に変換する。そうでなければ、ステップ1412で、動画符号化装置は、ステップ1411で生成された第2レジデューを色空間から周波数空間に変換する。
【0115】
ステップ1413で、動画符号化装置は、ステップ1414で変換された値を量子化する。
【0116】
ステップ1414で、動画符号化装置は、ステップ1413で量子化された値及びステップ1410で選択された予測モードを表す情報をエントロピー符号化することによって、ビットストリームを生成する。
【0117】
ステップ1415で、動画符号化装置は、ステップ1413で量子化された値を逆量子化することによって周波数成分値を復元する。
【0118】
ステップ1416で、動画符号化装置は、ステップ1415で復元された周波数成分値を周波数空間から色空間に変換することによって、現在画像と予測画像との差に該当するレジデューを復元する。そうでなければ、ステップ1416で、動画符号化装置は、ステップ1415で復元された周波数成分値を周波数空間から色空間に変換することによって、色成分のそれぞれの第1レジデュー間の差に該当する第2レジデューを復元する。
【0119】
ステップ1417で、動画符号化装置は、ステップ1411で生成された予測画像とステップ1416で復元されたレジデュー間の合算に該当する復元画像とを生成する。そうでなければ、ステップ1417で、動画符号化装置は、ステップ1416で復元された第2レジデュー間の合算に該当する第1レジデューを生成し、ステップ1411で生成された予測画像とこのように生成された第1レジデュー間の合算に該当する復元画像とを生成する。
【0120】
図15は、本発明の望ましい一実施形態による動画復号化方法を示すフローチャートである。図15を参照するに、本実施形態による動画復号化方法は、図10に示された動画復号化装置で時系列的に処理されるステップで構成される。したがって、以下省略された内容であっても、図10に示された動画復号化装置について前述された内容は、本実施形態による動画復号化方法にも適用される。
【0121】
ステップ1501で、動画復号化装置は、図1に示された動画符号化装置から出力されたビットストリームをエントロピー復号化することによって、現在画像に該当する整数値及び現在画像の色成分のそれぞれのブロックに最適の予測モードを表す情報を復元する。
【0122】
ステップ1502で、動画復号化装置は、ステップ1501で復元された整数値を逆量子化することによって周波数成分値を復元する。
【0123】
ステップ1503で、動画復号化装置は、ステップ1502で復元された周波数成分値を周波数空間から色空間に変換することによって、現在画像と予測画像との差に該当するレジデューを生成する。そうでなければ、ステップ1503で、動画復号化装置は、ステップ1502で復元された周波数成分値を周波数空間から色空間に変換することによって、色成分のそれぞれの第1レジデュー間の差に該当する第2レジデューを復元する。
【0124】
ステップ1504で、動画復号化装置は、ステップ1501で復元された情報がレジデュー変換モードを表せば、ステップ1505に進み、表さなければ、ステップ1506に進む。
【0125】
ステップ1505で、動画復号化装置は、ステップ1502で復元された第2レジデュー間の合算に該当する第1レジデューを生成する。特に、ステップ1505で、動画復号化装置は、ステップ1501で復元された情報がRCT変換モードを表せば、前記の式(8)を利用して、Y成分、Co成分、Cg成分のそれぞれの第2レジデュー間の合算に該当するY成分、Co成分、Cg成分のそれぞれの第1レジデューを生成する。また、ステップ1505で、動画復号化装置は、ステップ1501で復元された情報がIPP変換モードまたはRCP変換モードを表せば、前記の式(9)を利用して、R成分、G成分、B成分のそれぞれの第2レジデュー間の合算に該当するR成分、G成分、B成分のそれぞれの第1レジデューを生成する。
【0126】
RCP変換部1234は、エントロピー復号化部210によって復元された情報がRCP変換モードを表せば、前記の式(9)を利用して、R成分、G成分、B成分のそれぞれの第2レジデュー間の合算に該当するR成分、G成分、B成分のそれぞれの第1レジデューを生成する。
【0127】
ステップ1506で、動画復号化装置は、ステップ1501で復元された情報が単一予測モードを表せば、ステップ1507に進み、複合予測モードを表せば、ステップ1508に進む。
【0128】
ステップ1507で、動画復号化装置は、現在画像の色成分のそれぞれのブロックに一律的に適用されるサイズに分割されたブロック別に、色成分のそれぞれのブロックに一律的に適用される動きベクトルを使用して予測画面を生成するか、または色成分のそれぞれのブロックに一律的に適用される予測方向を使用して予測画面を生成する。
【0129】
ステップ1508で、動画復号化装置は、現在画像の色成分のそれぞれのブロックに独立的に適用されるサイズに分割されたブロック別に、色成分のそれぞれのブロックに独立的に適用される動きベクトルを使用して予測画面を生成するか、または色成分のそれぞれのブロックに独立的に適用される予測方向を使用して予測画面を生成する。
【0130】
ステップ1509で、動画復号化装置は、ステップ1507またはステップ1508で生成された予測画像とステップ1503で復元されたレジデュー間の合算に該当する復元画像とを生成する。そうでなければ、復元画像生成部250は、ステップ1507またはステップ1508で生成された予測画像とステップ1505で生成された第1レジデュー間の合算に該当する復元画像とを生成する。
【0131】
一方、前述した本発明の実施形態は、コンピュータで実行できるプログラムで作成可能であり、コンピュータで読み取り可能な記録媒体を利用して、前記プログラムを動作させる汎用デジタルコンピュータで具現される。また、前述した本発明の実施形態で使われたデータの構造は、コンピュータで読み取り可能な記録媒体に多様な手段を通じて記録される。
【0132】
前記コンピュータで読み取り可能な記録媒体は、マグネチック保存媒体(例えば、ROM(Read Only Memory)、フロッピー(登録商標)ディスク、ハードディスクなど)、光学的判読媒体(例えば、CD−ROM、DVDなど)及びキャリアウェーブ(例えば、インターネットを通じた伝送)のような保存媒体を含む。
【0133】
以上、本発明についてその望ましい実施形態を中心に説明した。当業者は、本発明が本発明の本質的な特性から逸脱しない範囲で変形された形態で具現されるということが分かるであろう。したがって、開示された実施形態は、限定的な観点でなく、説明的な観点で考慮されねばならない。本発明の範囲は、前述した説明でなく、特許請求の範囲に現れており、それと同等な範囲内にある全ての差異点は、本発明に含まれていると解釈されねばならない。
【符号の説明】
【0134】
210 エントロピー復号化部
220 逆量子化部
230 周波数空間逆変換部
240 予測画像生成部
250 復元画像生成部
241 単一モード予測画像生成部
242 複合モード予測画像生成部
【特許請求の範囲】
【請求項1】
ビットストリームを復号化することによって、一つのシーケンスを構成する複数の色成分のブロックに対する一つの予測モードを表す情報を復元するステップと、
前記復元された情報によって、前記色成分のブロックに一律的に適用される予測モードを使用したり、前記色成分のブロックに独立的に予測モードを使用して前記現在映像の予測映像を生成するステップと、を含むことを特徴とする予測映像の生成方法。
【請求項2】
前記予測映像を生成するステップは、前記復元された情報が前記色成分のそれぞれのブロックに一律的に適用される予測モードを表せば、前記色成分のそれぞれのブロックに一律的に適用されるサイズに分割されたブロック別に前記予測画面を生成することを特徴とする請求項1に記載の予測映像の生成方法。
【請求項3】
前記予測映像を生成するステップは、前記復元された情報が前記色成分のそれぞれのブロックに一律的に適用される予測モードを表せば、前記色成分のそれぞれのブロックに一律的に適用される動きベクトルを使用して前記予測画面を生成することを特徴とする請求項1に記載の予測映像の生成方法。
【請求項4】
前記予測映像を生成するステップは、前記復元された情報が前記色成分のそれぞれのブロックに一律的に適用される予測モードを表せば、前記色成分のそれぞれのブロックに一律的に適用される予測方向を使用して前記予測画面を生成することを特徴とする請求項1に記載の予測映像の生成方法。
【請求項5】
前記予測映像を生成するステップは、前記復元された情報が前記色成分のそれぞれのブロックに独立的に適用される予測モードを表せば、前記色成分のそれぞれのブロックに独立的に適用されるサイズに分割されたブロック別に前記予測画面を生成することを特徴とする請求項1に記載の予測映像の生成方法。
【請求項6】
前記予測映像を生成するステップは、前記復元された情報が前記色成分のそれぞれのブロックに独立的に適用される予測モードを表せば、前記色成分のそれぞれのブロックに独立的に適用される動きベクトルを使用して前記予測画面を生成することを特徴とする請求項1に記載の予測映像の生成方法。
【請求項7】
前記予測映像を生成するステップは、前記復元された情報が前記色成分のそれぞれのブロックに独立的に適用される予測モードを表せば、前記色成分のそれぞれのブロックに独立的に適用される予測方向を使用して前記予測画面を生成することを特徴とする請求項1に記載の予測映像の生成方法。
【請求項8】
請求項1ないし7のうちいずれか1項の方法をコンピュータで実行させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体。
【請求項9】
ビットストリームを復号化することによって、一つのシーケンスを構成する複数の色成分のブロックに対する一つの予測モードを表す情報を復元する復号化部と、
前記復元された情報によって、前記色成分のブロックに一律的に適用される予測モードを使用したり、前記色成分のブロックに独立的に予測モードを使用して前記現在映像の予測映像を生成する生成部と、を備えることを特徴とする予測映像の生成装置。
【請求項1】
ビットストリームを復号化することによって、一つのシーケンスを構成する複数の色成分のブロックに対する一つの予測モードを表す情報を復元するステップと、
前記復元された情報によって、前記色成分のブロックに一律的に適用される予測モードを使用したり、前記色成分のブロックに独立的に予測モードを使用して前記現在映像の予測映像を生成するステップと、を含むことを特徴とする予測映像の生成方法。
【請求項2】
前記予測映像を生成するステップは、前記復元された情報が前記色成分のそれぞれのブロックに一律的に適用される予測モードを表せば、前記色成分のそれぞれのブロックに一律的に適用されるサイズに分割されたブロック別に前記予測画面を生成することを特徴とする請求項1に記載の予測映像の生成方法。
【請求項3】
前記予測映像を生成するステップは、前記復元された情報が前記色成分のそれぞれのブロックに一律的に適用される予測モードを表せば、前記色成分のそれぞれのブロックに一律的に適用される動きベクトルを使用して前記予測画面を生成することを特徴とする請求項1に記載の予測映像の生成方法。
【請求項4】
前記予測映像を生成するステップは、前記復元された情報が前記色成分のそれぞれのブロックに一律的に適用される予測モードを表せば、前記色成分のそれぞれのブロックに一律的に適用される予測方向を使用して前記予測画面を生成することを特徴とする請求項1に記載の予測映像の生成方法。
【請求項5】
前記予測映像を生成するステップは、前記復元された情報が前記色成分のそれぞれのブロックに独立的に適用される予測モードを表せば、前記色成分のそれぞれのブロックに独立的に適用されるサイズに分割されたブロック別に前記予測画面を生成することを特徴とする請求項1に記載の予測映像の生成方法。
【請求項6】
前記予測映像を生成するステップは、前記復元された情報が前記色成分のそれぞれのブロックに独立的に適用される予測モードを表せば、前記色成分のそれぞれのブロックに独立的に適用される動きベクトルを使用して前記予測画面を生成することを特徴とする請求項1に記載の予測映像の生成方法。
【請求項7】
前記予測映像を生成するステップは、前記復元された情報が前記色成分のそれぞれのブロックに独立的に適用される予測モードを表せば、前記色成分のそれぞれのブロックに独立的に適用される予測方向を使用して前記予測画面を生成することを特徴とする請求項1に記載の予測映像の生成方法。
【請求項8】
請求項1ないし7のうちいずれか1項の方法をコンピュータで実行させるためのプログラムを記録したコンピュータで読み取り可能な記録媒体。
【請求項9】
ビットストリームを復号化することによって、一つのシーケンスを構成する複数の色成分のブロックに対する一つの予測モードを表す情報を復元する復号化部と、
前記復元された情報によって、前記色成分のブロックに一律的に適用される予測モードを使用したり、前記色成分のブロックに独立的に予測モードを使用して前記現在映像の予測映像を生成する生成部と、を備えることを特徴とする予測映像の生成装置。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7A】
【図7B】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14A】
【図14B】
【図15】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7A】
【図7B】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14A】
【図14B】
【図15】
【公開番号】特開2012−34410(P2012−34410A)
【公開日】平成24年2月16日(2012.2.16)
【国際特許分類】
【出願番号】特願2011−225278(P2011−225278)
【出願日】平成23年10月12日(2011.10.12)
【分割の表示】特願2009−500288(P2009−500288)の分割
【原出願日】平成19年3月13日(2007.3.13)
【出願人】(503447036)サムスン エレクトロニクス カンパニー リミテッド (2,221)
【Fターム(参考)】
【公開日】平成24年2月16日(2012.2.16)
【国際特許分類】
【出願日】平成23年10月12日(2011.10.12)
【分割の表示】特願2009−500288(P2009−500288)の分割
【原出願日】平成19年3月13日(2007.3.13)
【出願人】(503447036)サムスン エレクトロニクス カンパニー リミテッド (2,221)
【Fターム(参考)】
[ Back to top ]