説明

カラー動画像符号化装置、カラー動画像復号装置、カラー動画像符号化方法及びカラー動画像復号方法

【課題】輝度信号と色差信号に適するブロックサイズで圧縮処理を実施して、輝度信号と色差信号の符号化効率を高めることができるようにする。
【解決手段】減算部6により生成された差分画像の色差信号に対する変換・量子化処理を実施する場合、ブロック分割部2により分割された符号化ブロックの形状が正方形であれば、その符号化ブロックと同じサイズのブロック単位で色差信号の変換・量子化処理を実施し、その符号化ブロックの形状が長方形であれば、その符号化ブロックを1階層だけ分割して、分割後のブロック単位で色差信号の変換・量子化処理を実施する。

【発明の詳細な説明】
【技術分野】
【0001】
この発明は、カラー動画像を高効率で符号化を行うカラー動画像符号化装置及びカラー動画像符号化方法と、高効率で符号化されているカラー動画像を復号するカラー動画像復号装置及びカラー動画像復号方法とに関するものである。
【背景技術】
【0002】
例えば、以下の非特許文献1に記載されている従来のカラー動画像符号化装置では、入力されたカラー画像を所定の大きさの最大符号化ブロックに分割し、さらに、最大符号化ブロックをより細かい符号化ブロックに階層分割する。
また、その符号化ブロックをさらに細かい予測ブロックに分割し、その予測ブロックに対する画面内予測や動き補償予測を実施することで予測誤差を生成する。
また、その予測誤差を符号化ブロック内で階層的に変換ブロックに分割し、それぞれの変換係数をエントロピー符号化することで高い圧縮率を達成している。
従来のカラー動画像符号化装置では、YUV4:2:0信号の符号化を行う場合、色差信号の変換ブロックサイズを、輝度信号の変換ブロックサイズの縦横半分のサイズに固定することで、色差信号の変換ブロックサイズに係る情報を符号化する必要をなくして、色差信号の符号化効率を高めている。
【先行技術文献】
【非特許文献】
【0003】
【非特許文献1】B. Bross, W.-J. Han, J.-R. Ohm, G. J. Sullivan and T. Wiegand, “WD4: Working Draft 4 of High-Efficiency Video Coding”, doc. JCTVC-F803, Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11, 6th Meeting, 2011
【発明の概要】
【発明が解決しようとする課題】
【0004】
従来のカラー動画像符号化装置は以上のように構成されているので、色差信号の変換ブロックサイズに係る情報の符号化が不要になり、色差信号の符号化効率が高められるが、色差信号の変換ブロックサイズが輝度信号の変換ブロックサイズに応じて固定される。しかしながら、画像信号における色差信号は、一般的に輝度信号よりも、相対的に平坦な信号変化が多く、輝度信号の最適な変換ブロックサイズと色差信号の最適な変換ブロックサイズが異なる。このため、色差信号の変換ブロックサイズが輝度信号の変換ブロックサイズに応じて固定されると、色差信号の符号化効率が最適にならないことがある課題があった。
【0005】
この発明は上記のような課題を解決するためになされたもので、輝度信号と色差信号に適するブロックサイズで圧縮処理を実施して、輝度信号と色差信号の符号化効率を高めることができるカラー動画像符号化装置及びカラー動画像符号化方法を得ることを目的とする。
また、この発明は、符号化効率の改善が図られている符号化データから正確に動画像を復号することができるカラー動画像復号装置及びカラー動画像復号方法を得ることを目的とする。
【課題を解決するための手段】
【0006】
この発明に係るカラー動画像符号化装置は、画像圧縮手段が、差分画像生成手段により生成された差分画像の輝度信号を圧縮する場合、ブロック分割手段により分割された符号化ブロックをさらに階層的に分割して、分割後のブロック単位で輝度信号の圧縮処理を実施し、差分画像生成手段により生成された差分画像の色差信号を圧縮する場合、ブロック分割手段により分割された符号化ブロックの形状が正方形であれば、その符号化ブロックと同じサイズのブロック単位で色差信号の圧縮処理を実施し、その符号化ブロックの形状が長方形であれば、その符号化ブロックを1階層だけ分割して、分割後のブロック単位で色差信号の圧縮処理を実施し、可変長符号化手段が、画像圧縮手段による輝度信号に係るブロックの分割情報を可変長符号化して、その分割情報の符号化データをビットストリームに多重化するようにしたものである。
【発明の効果】
【0007】
この発明によれば、画像圧縮手段が、差分画像生成手段により生成された差分画像の輝度信号を圧縮する場合、ブロック分割手段により分割された符号化ブロックをさらに階層的に分割して、分割後のブロック単位で輝度信号の圧縮処理を実施し、差分画像生成手段により生成された差分画像の色差信号を圧縮する場合、ブロック分割手段により分割された符号化ブロックの形状が正方形であれば、その符号化ブロックと同じサイズのブロック単位で色差信号の圧縮処理を実施し、その符号化ブロックの形状が長方形であれば、その符号化ブロックを1階層だけ分割して、分割後のブロック単位で色差信号の圧縮処理を実施し、可変長符号化手段が、画像圧縮手段による輝度信号に係るブロックの分割情報を可変長符号化して、その分割情報の符号化データをビットストリームに多重化するように構成したので、輝度信号と色差信号に対する圧縮処理のブロックサイズの適正化が図られて、輝度信号と色差信号の符号化効率を高めることができる効果がある。
【図面の簡単な説明】
【0008】
【図1】この発明の実施の形態1によるカラー動画像符号化装置を示す構成図である。
【図2】この発明の実施の形態1によるカラー動画像符号化装置の処理内容を示すフローチャートである。
【図3】この発明の実施の形態1によるカラー動画像符号化装置のイントラ予測部4を示す構成図である。
【図4】この発明の実施の形態1によるカラー動画像符号化装置の輝度相関利用色差信号予測部24を示す構成図である。
【図5】この発明の実施の形態1によるカラー動画像符号化装置のイントラ予測部4の処理内容を示すフローチャートである。
【図6】この発明の実施の形態1によるカラー動画像符号化装置の輝度相関利用色差信号予測部24の処理内容を示すフローチャートである。
【図7】この発明の実施の形態1によるカラー動画像復号装置を示す構成図である。
【図8】この発明の実施の形態1によるカラー動画像復号装置の処理内容を示すフローチャートである。
【図9】最大サイズの符号化ブロックが階層的に複数の符号化ブロックに分割される様子を示す説明図である。
【図10】符号化ブロックBに属するパーティションPを示す説明図である。
【図11】分割後のパーティションの分布や、階層分割後のパーティションに符号化モードm(B)が割り当てられる状況を4分木グラフで示す説明図である。
【図12】符号化ブロックBに属する各パーティションPにおいて選択可能なイントラ予測パラメータ(イントラ予測モード)の一例を示す説明図である。
【図13】l=m=4の場合において、パーティションP内の画素の予測値を生成する際に用いる画素の一例を示す説明図である。
【図14】色差信号のイントラ予測パラメータと色差イントラ予測モードの対応例を示す説明図である。
【図15】色差信号の予測ブロックと復号済輝度信号などを示す説明図である。
【図16】縮小輝度参照画素Rec’の生成方法を示す説明図である。
【図17】4:2:0フォーマットの信号における輝度信号及び色差信号の圧縮処理を実施する際の変換ブロックサイズを示す説明図である。
【図18】4:2:2フォーマットの信号における輝度信号及び色差信号の圧縮処理を実施する際の変換ブロックサイズを示す説明図である。
【図19】色差成分のフレーム内予測を示す説明図である。
【発明を実施するための形態】
【0009】
実施の形態1.
図1はこの発明の実施の形態1によるカラー動画像符号化装置を示す構成図である。
この実施の形態1のカラー動画像符号化装置が処理対象とする映像信号は、輝度信号と2つの色差信号からなるYUV信号や、ディジタル撮像素子から出力されるRGB信号等の任意の色空間のカラー映像信号のほか、モノクロ画像信号や赤外線画像信号など、映像フレームが水平・垂直2次元のディジタルサンプル(画素)列から構成される任意の映像信号である。
各画素の諧調は8ビットでもよいし、10ビット、12ビットなどの諧調であってもよい。
【0010】
ただし、以下の説明においては、特に断らない限り、入力される映像信号がYUV信号であるものとする。また、2つの色差成分U,Vが輝度成分Yに対して、サブサンプルされた4:2:0フォーマットの信号であるものとする。
なお、映像の各フレームに対応する処理データ単位を「ピクチャ」と称し、この実施の形態1では、「ピクチャ」は順次走査(プログレッシブスキャン)された映像フレームの信号として説明を行う。ただし、映像信号がインタレース信号である場合、「ピクチャ」は映像フレームを構成する単位であるフィールド画像信号であってもよい。
【0011】
図1において、符号化制御部1はイントラ予測処理(フレーム内予測処理)又は動き補償予測処理(フレーム間予測処理)が実施される際の処理単位となる符号化ブロックの最大サイズを決定するとともに、最大サイズの符号化ブロックが階層的に分割される際の上限の階層数を決定する処理を実施する。
また、符号化制御部1は利用可能な1以上の符号化モード(1以上のイントラ符号化モード、1以上のインター符号化モード)の中から、階層的に分割される各々の符号化ブロックに適する符号化モードを選択する処理を実施する。
また、符号化制御部1は各々の符号化ブロック毎に、差分画像が圧縮される際に用いられる量子化パラメータ及び変換ブロックサイズを決定するとともに、予測処理が実施される際に用いられるイントラ予測パラメータ又はインター予測パラメータを決定する処理を実施する。量子化パラメータ及び変換ブロックサイズを示す変換ブロック分割フラグは、予測差分符号化パラメータに含まれて、変換・量子化部7、逆量子化・逆変換部8及び可変長符号化部13等に出力される。
なお、符号化制御部1は符号化制御手段を構成している。
【0012】
ここで、図17は4:2:0フォーマットの信号における輝度信号及び色差信号の圧縮処理(変換処理、量子化処理)を実施する際の変換ブロックサイズを示す説明図である。
変換ブロックサイズは、図17に示すように、符号化ブロックを四分木状に階層分割することによって決定される。
例えば、変換ブロックを分割する場合と変換ブロックを分割しない場合での符号量や、符号化誤差を加味した評価尺度などに基づいて、評価値が最小になるように変換ブロックを分割するか否かを決定することで、符号量と符号化誤差のトレードオフの観点から最適な変換ブロックの分割形状を決定することができる。
【0013】
輝度信号については、例えば、図17に示すように、予測ブロックの形状が正方形である予測モードが符号化ブロックの符号化モードとして選択された場合、符号化ブロックが1つまたは複数の正方形の変換ブロックに階層的に分割されるように構成する。
一方、予測ブロックの形状が長方形である予測モードが符号化ブロックの符号化モードとして選択された場合、符号化ブロックが1つまたは複数の長方形の変換ブロックに階層的に分割されるように構成する。あるいは、正方形の変換ブロックに分割された後に、さらに下の階層で長方形の変換ブロックに分割されるように構成する。
一方、色差信号については、図17に示すように、予測ブロックの形状が正方形である場合、予測ブロックと同じサイズの変換ブロックが適用されるように構成する。
予測ブロックの形状が長方形である場合、予測ブロックが1階層だけ分割されるように構成する。
【0014】
このように輝度信号については、階層的に最適な変換ブロックサイズに分割されて変換が行われ、色差信号については、分割形状が固定された大きいブロックで変換が行われるため、色差信号の変換ブロックの分割形状に関する情報をシグナリングすることなく、色差信号を効率的に圧縮することができる。
また、色差信号の変換ブロックの分割形状が、輝度信号の変換ブロックの分割形状と異なるため、輝度信号に対しては、輝度信号に最適な変換ブロックの分割形状を選択することができるため、輝度信号についても、効率的に圧縮することができる。
輝度信号の変換ブロックの分割情報は、階層毎に分割するか否かを示す変換ブロック分割フラグとして可変長符号化部13に出力する。
なお、予測ブロックの形状が正方形であっても、符号化ブロックを4分割して得られる正方形サイズの予測ブロックの場合には、色差信号の変換ブロックも1階層だけ分割されるように構成してもよい。
このようにすれば、正方形の変換ブロックが正方形の予測ブロックをまたがないように構成できるので、高周波成分の発生を抑制することができ効率よく圧縮できる。
【0015】
ブロック分割部2は入力カラー画像(カレントピクチャ)を示すカラー画像信号を入力すると、その入力カラー画像を符号化制御部1により決定された最大サイズの符号化ブロックに分割するとともに、符号化制御部1により決定された上限の階層数に至るまで、その符号化ブロックを階層的に分割する処理を実施する。なお、ブロック分割部2はブロック分割手段を構成している。
切替スイッチ3は符号化制御部1により選択された符号化モードがイントラ符号化モードであれば、ブロック分割部2により分割された符号化ブロックをイントラ予測部4に出力し、符号化制御部1により選択された符号化モードがインター符号化モードであれば、ブロック分割部2により分割された符号化ブロックを動き補償予測部5に出力する処理を実施する。
【0016】
イントラ予測部4は切替スイッチ3からブロック分割部2により分割された符号化ブロックを受けると、その符号化ブロックに対して、イントラ予測用メモリ10により格納されている上記符号化ブロックに隣接している復号済みの画素を用いて、符号化制御部1から出力されたイントラ予測パラメータに基づくフレーム内予測処理を実施することで予測画像を生成する処理を実施する。
即ち、イントラ予測部4は、ブロック分割部2により分割された符号化ブロックにおける輝度成分については、その輝度成分のフレーム内予測を実施して、輝度成分に対する予測画像を生成する。
一方、ブロック分割部2により分割された符号化ブロックにおける色差成分については、符号化制御部1により選択された符号化モードが、イントラ符号化モードにおける方向性予測モードであれば、ブロック分割部2により分割された符号化ブロックにおける色差成分のフレーム内予測を実施して、色差成分に対する予測画像を生成する。
【0017】
動き補償予測部5はブロック分割部2により分割された符号化ブロックに対応する符号化モードとして、符号化制御部1によりインター符号化モードが選択された場合、動き補償予測フレームメモリ12により格納されている1フレーム以上の参照画像を用いて、符号化制御部1から出力されたインター予測パラメータに基づいて、その符号化ブロックに対する動き補償予測処理を実施することで予測画像を生成する処理を実施する。
なお、切替スイッチ3、イントラ予測部4及び動き補償予測部5から予測画像生成手段が構成されている。
【0018】
減算部6はブロック分割部2により分割された符号化ブロックから、イントラ予測部4又は動き補償予測部5により生成された予測画像を減算することで、差分画像(=符号化ブロック−予測画像)を生成する処理を実施する。なお、減算部6は差分画像生成手段を構成している。
【0019】
変換・量子化部7は符号化制御部1から出力された予測差分符号化パラメータに含まれている変換ブロック分割フラグから特定される変換ブロックサイズ単位で、減算部6により生成された差分画像の変換処理(例えば、DCT(離散コサイン変換)やDST(離散サイン変換)、予め特定の学習系列に対して基底設計がなされているKL変換等の直交変換処理)を実施するとともに、その予測差分符号化パラメータに含まれている量子化パラメータを用いて、その差分画像の変換係数を量子化することで、量子化後の変換係数を差分画像の圧縮データとして出力する処理を実施する。
即ち、変換・量子化部7は減算部6により生成された差分画像の輝度信号に対する変換・量子化処理(圧縮処理)を実施する場合、ブロック分割部2により分割された符号化ブロックをさらに階層的に分割して、分割後のブロック単位で輝度信号の変換・量子化処理を実施し、減算部6により生成された差分画像の色差信号に対する変換・量子化処理を実施する場合、ブロック分割部2により分割された符号化ブロックの形状が正方形であれば、その符号化ブロックと同じサイズのブロック単位で色差信号の変換・量子化処理を実施し、その符号化ブロックの形状が長方形であれば、その符号化ブロックを1階層だけ分割して、分割後のブロック単位で色差信号の変換・量子化処理を実施する。
なお、変換・量子化部7は画像圧縮手段を構成している。
【0020】
逆量子化・逆変換部8は符号化制御部1から出力された予測差分符号化パラメータに含まれている量子化パラメータを用いて、変換・量子化部7から出力された圧縮データを逆量子化し、その予測差分符号化パラメータに含まれている変換ブロック分割フラグから特定される変換ブロックサイズ単位で、逆量子化後の圧縮データの逆変換処理(例えば、逆DCT(逆離散コサイン変換)や逆DST(逆離散サイン変換)、逆KL変換等の逆変換処理)を実施することで、逆変換処理後の圧縮データを局所復号予測差分信号として出力する処理を実施する。
【0021】
加算部9は逆量子化・逆変換部8から出力された局所復号予測差分信号とイントラ予測部4又は動き補償予測部5により生成された予測画像を示す予測信号を加算することで、局所復号画像を示す局所復号画像信号を生成する処理を実施する。
イントラ予測用メモリ10はイントラ予測部4により次回のイントラ予測処理で用いられる画像として、加算部9により生成された局所復号画像信号が示す局所復号画像を格納するRAMなどの記録媒体である。
【0022】
ループフィルタ部11は加算部9により生成された局所復号画像信号に含まれている符号化歪みを補償し、符号化歪み補償後の局所復号画像信号が示す局所復号画像を参照画像として動き補償予測フレームメモリ12に出力する処理を実施する。
動き補償予測フレームメモリ12は動き補償予測部5により次回の動き補償予測処理で用いられる参照画像として、ループフィルタ部11によるフィルタリング処理後の局所復号画像を格納するRAMなどの記録媒体である。
【0023】
可変長符号化部13は変換・量子化部7から出力された圧縮データと、符号化制御部1から出力された符号化モード及び変換ブロック分割フラグを含む予測差分符号化パラメータと、イントラ予測部4から出力されたイントラ予測パラメータ又は動き補償予測部5から出力されたインター予測パラメータとを可変長符号化して、その圧縮データ、符号化モード、予測差分符号化パラメータ、イントラ予測パラメータ/インター予測パラメータの符号化データが多重化されているビットストリームを生成する処理を実施する。なお、可変長符号化部13は可変長符号化手段を構成している。
【0024】
図1では、カラー動画像符号化装置の構成要素である符号化制御部1、ブロック分割部2、切替スイッチ3、イントラ予測部4、動き補償予測部5、減算部6、変換・量子化部7、逆量子化・逆変換部8、加算部9、ループフィルタ部11及び可変長符号化部13のそれぞれが専用のハードウェア(例えば、CPUを実装している半導体集積回路、あるいは、ワンチップマイコンなど)で構成されているものを想定しているが、カラー動画像符号化装置がコンピュータなどで構成される場合、符号化制御部1、ブロック分割部2、切替スイッチ3、イントラ予測部4、動き補償予測部5、減算部6、変換・量子化部7、逆量子化・逆変換部8、加算部9、ループフィルタ部11及び可変長符号化部13の処理内容を記述しているプログラムの全部又は一部を当該コンピュータのメモリに格納し、当該コンピュータのCPUが当該メモリに格納されているプログラムを実行するようにしてもよい。
図2はこの発明の実施の形態1によるカラー動画像符号化装置の処理内容を示すフローチャートである。
【0025】
図3はこの発明の実施の形態1によるカラー動画像符号化装置のイントラ予測部4を示す構成図である。
図3において、輝度信号イントラ予測部21はブロック分割部2により分割された符号化ブロックにおける輝度成分のフレーム内予測を実施して、輝度成分に対する予測画像を生成する処理を実施する。
即ち、輝度信号イントラ予測部21はイントラ予測用メモリ10により格納されている上記符号化ブロックに隣接している復号済みの輝度参照画素を参照して、符号化制御部1から出力されたイントラ予測パラメータに基づく輝度成分のフレーム内予測を実施することで、輝度成分に対する予測画像を生成する処理を実施する。
【0026】
切替スイッチ22は符号化制御部1から出力されたイントラ予測パラメータのうち、色差信号のイントラ符号化モードを示すパラメータが、方向性予測モードである旨を示していれば、予測に用いる参照画素を色差信号方向性イントラ予測部23に与え、色差信号のイントラ符号化モードを示すパラメータが、平滑化輝度相関利用色差信号予測モードである旨を示していれば、予測に用いる参照画素を輝度相関利用色差信号予測部24に出力する処理を実施する。
【0027】
色差信号方向性イントラ予測部23は切替スイッチ22から受け取った上記符号化ブロックに隣接している復号済みの色差参照画素を参照して、符号化制御部1から出力されたイントラ予測パラメータに基づく色差成分のフレーム内予測を実施することで、色差成分に対する予測画像を生成する処理を実施する。
輝度相関利用色差信号予測部24は切替スイッチ22から受け取った復号済みの画素のうち、符号化ブロックに隣接している復号済みの輝度参照画素及び色差参照画素と、当該符号化ブロック内の復号済みの輝度参照画素を用いて、その符号化ブロックを構成している画素のうち、水平方向及び垂直方向に隣接している複数の画素に係る輝度成分を平滑化して、平滑化後の輝度成分と色差成分の相関を示す相関パラメータを算出し、その相関パラメータと平滑化後の輝度成分を用いて、色差成分に対する予測画像を生成する処理を実施する。
なお、図5はこの発明の実施の形態1によるカラー動画像符号化装置のイントラ予測部4の処理内容を示すフローチャートである。
【0028】
図4はこの発明の実施の形態1によるカラー動画像符号化装置の輝度相関利用色差信号予測部24を示す構成図である。
図4において、平滑化輝度参照画素縮小部31はイントラ予測用メモリ10により格納されている符号化ブロックを構成している復号済みの輝度参照画素のうち、水平方向及び垂直方向に隣接している複数の輝度参照画素の平滑化処理等を実施することで、縮小輝度参照画素Rec’を生成する。
相関算出部32はイントラ予測用メモリ10により格納されている色差参照画素と平滑化輝度参照画素縮小部31により生成された縮小輝度参照画素Rec’を用いて、輝度成分と色差成分の相関を示す相関パラメータα,βを算出する処理を実施する。
色差予測画像生成部33は相関算出部32により算出された相関パラメータα,βと平滑化輝度参照画素縮小部31により生成された縮小輝度参照画素Rec’を用いて、色差成分に対する予測画像を生成する処理を実施する。
なお、図6はこの発明の実施の形態1によるカラー動画像符号化装置の輝度相関利用色差信号予測部24の処理内容を示すフローチャートである。
【0029】
図7はこの発明の実施の形態1によるカラー動画像復号装置を示す構成図である。
図7において、可変長復号部41はイントラ予測処理又は動き補償予測処理が実施される際の処理単位となる符号化ブロックの最大サイズ及び最大サイズの符号化ブロックから階層的に分割されている符号化ブロックの階層数を特定することで、ビットストリームに多重化されている符号化データの中で、最大サイズの符号化ブロック及び階層的に分割されている符号化ブロックに係る符号化データを特定し、各々の符号化データから符号化ブロックに係る圧縮データ、符号化モード、変換ブロック分割フラグを含む予測差分符号化パラメータ、イントラ予測パラメータ/インター予測パラメータを可変長復号して、その圧縮データ及び予測差分符号化パラメータを逆量子化・逆変換部45に出力するとともに、その符号化モード及びイントラ予測パラメータ/インター予測パラメータを切替スイッチ42に出力する処理を実施する。なお、可変長復号部41は可変長復号手段を構成している。
【0030】
切替スイッチ42は可変長復号部41から出力された符号化ブロックに係る符号化モードがイントラ符号化モードである場合、可変長復号部41から出力されたイントラ予測パラメータをイントラ予測部43に出力し、その符号化モードがインター符号化モードである場合、可変長復号部41から出力されたインター予測パラメータを動き補償部44に出力する処理を実施する。
イントラ予測部43はイントラ予測用メモリ47により格納されている符号化ブロックに隣接している復号済みの画素を用いて、切替スイッチ42から出力されたイントラ予測パラメータに基づいて、符号化ブロックに対するフレーム内予測処理を実施することで予測画像を生成する処理を実施する。
【0031】
動き補償部44は動き補償予測フレームメモリ49により格納されている1フレーム以上の参照画像を用いて、切替スイッチ42から出力されたインター予測パラメータに基づいて、符号化ブロックに対する動き補償予測処理を実施することで予測画像を生成する処理を実施する。
なお、切替スイッチ42、イントラ予測部43及び動き補償部44から予測画像生成手段が構成されている。
【0032】
逆量子化・逆変換部45は可変長復号部41から出力された予測差分符号化パラメータに含まれている量子化パラメータを用いて、可変長復号部41から出力された符号化ブロックに係る圧縮データを逆量子化し、その予測差分符号化パラメータに含まれている変換ブロック分割フラグから特定される変換ブロックサイズ単位で、逆量子化の圧縮データの逆変換処理(例えば、逆DCT(逆離散コサイン変換)や逆DST(逆離散サイン変換)、逆KL変換等の逆変換処理)を実施することで、逆変換処理後の圧縮データを復号予測差分信号(圧縮前の差分画像を示す信号)として出力する処理を実施する。
即ち、逆量子化・逆変換部45は可変長復号部41から出力された予測差分符号化パラメータに含まれている変換ブロック分割フラグに基づいて階層的に分割された輝度信号の変換ブロック形状を特定し、変換ブロック単位で逆量子化処理・逆変換処理を行う。
色差信号については、図17に示すように、予測ブロックの形状が正方形である場合、予測ブロックと同じサイズの変換ブロック単位で逆量子化処理・逆変換処理を実施し、予測ブロックの形状が長方形である場合、予測ブロックを1階層だけ分割して、分割後のブロック単位で逆量子化処理・逆変換処理を実施する。
なお、逆量子化・逆変換部45は差分画像生成手段を構成している。
【0033】
加算部46は逆量子化・逆変換部45から出力された復号予測差分信号とイントラ予測部43又は動き補償部44により生成された予測画像を示す予測信号を加算することで、復号画像を示す復号画像信号を生成する処理を実施する。なお、加算部46は復号画像生成手段を構成している。
イントラ予測用メモリ47はイントラ予測部43により次回のイントラ予測処理で用いられる画像として、加算部46により生成された復号画像信号が示す復号画像を格納するRAMなどの記録媒体である。
【0034】
ループフィルタ部48は加算部46により生成された復号画像信号に含まれている符号化歪みを補償し、符号化歪み補償後の復号画像信号が示す復号画像を参照画像として動き補償予測フレームメモリ49に出力するとともに、その復号画像を再生画像として外部に出力する処理を実施する。
動き補償予測フレームメモリ49は動き補償部44により次回の動き補償予測処理で用いられる参照画像として、ループフィルタ部48によるフィルタリング処理後の復号画像を格納するRAMなどの記録媒体である。
【0035】
図7では、カラー動画像復号装置の構成要素である可変長復号部41、切替スイッチ42、イントラ予測部43、動き補償部44、逆量子化・逆変換部45、加算部46及びループフィルタ部48のそれぞれが専用のハードウェア(例えば、CPUを実装している半導体集積回路、あるいは、ワンチップマイコンなど)で構成されているものを想定しているが、カラー動画像復号装置がコンピュータなどで構成される場合、可変長復号部41、切替スイッチ42、イントラ予測部43、動き補償部44、逆量子化・逆変換部45、加算部46及びループフィルタ部48の処理内容を記述しているプログラムの全部又は一部を当該コンピュータのメモリに格納し、当該コンピュータのCPUが当該メモリに格納されているプログラムを実行するようにしてもよい。
図8はこの発明の実施の形態1によるカラー動画像復号装置の処理内容を示すフローチャートである。
【0036】
この実施の形態1のカラー動画像符号化装置は、映像信号の空間・時間方向の局所的な変化に適応して、映像信号を多様なサイズの領域に分割してフレーム内・フレーム間適応符号化を行い、色差信号については変換ブロックサイズを2階層のみに限定して一意に決定することを特徴としている。
一般に映像信号は、空間・時間的に信号の複雑さが局所的に変化する特性を有し、空間的に見ると、ある特定の映像フレーム上では、例えば、空や壁などのように、比較的広い画像領域中で均一な信号特性を有する絵柄もあれば、人物や細かいテクスチャを含む絵画などでは、小さい画像領域内で複雑なテクスチャパターンを有する絵柄も混在することがある。
【0037】
時間的に見ても、空や壁は局所的に時間方向の絵柄の変化が小さいが、動く人物や物体は、その輪郭が時間的に剛体・非剛体の運動をするため、時間的な変化が大きい。
符号化処理は、時間・空間的な予測によって、信号電力やエントロピーが小さい予測差分信号を生成して、全体の符号量を削減する処理を行うが、予測処理に用いる予測パラメータをできるだけ大きな画像信号領域に対して均一に適用することができれば、予測パラメータの符号量を小さくすることができる。
一方、時間的・空間的に変化が大きい画像信号パターンに対して、同一の予測パラメータを大きな画像領域に適用すると、予測誤りが増えてしまうため、予測差分信号の符号量を削減することができない。
したがって、時間的・空間的に変化が大きい領域では、予測対象の領域を小さくして、予測処理に用いる予測パラメータのデータ量を増やしても、予測差分信号の電力・エントロピーを低減する方が望ましい。
このような映像信号の一般的な性質に適応している符号化処理を行うため、この実施の形態1のカラー動画像符号化装置では、所定の最大ブロックサイズから映像信号の領域を階層的に分割し、分割領域毎に予測処理や予測差分の符号化処理を適応化する構成を採用している。
【0038】
次に動作について説明する。
最初に、図1のカラー動画像符号化装置の処理内容を説明する。
まず、符号化制御部1は、イントラ予測処理(フレーム内予測処理)又は動き補償予測処理(フレーム間予測処理)が実施される際の処理単位となる符号化ブロックの最大サイズを決定するとともに、最大サイズの符号化ブロックが階層的に分割される際の上限の階層数を決定する(図2のステップST1)。
【0039】
符号化ブロックの最大サイズの決め方として、例えば、全てのピクチャに対して、入力画像の解像度に応じたサイズに決定する方法が考えられる。
また、入力カラー画像の局所的な動きの複雑さの違いをパラメータとして定量化しておき、動きの激しいピクチャでは最大サイズを小さな値に決定し、動きが少ないピクチャでは最大サイズを大きな値に決定する方法などが考えられる。
上限の階層数については、例えば、入力カラー画像の動きが激しい程、階層数を深くして、より細かい動きが検出できるように設定し、入力カラー画像の動きが少なければ、階層数を抑えるように設定する方法が考えられる。
【0040】
また、符号化制御部1は、利用可能な1以上の符号化モード(M種類のイントラ符号化モード、N種類のインター符号化モード)の中から、階層的に分割される各々の符号化ブロックに対応する符号化モードを選択する(ステップST2)。予め用意されているM種類のイントラ符号化モードについては後述する。
ただし、後述するブロック分割部2により階層的に分割された各々の符号化ブロックが更にパーティション単位に分割される場合は、各々のパーティションに対応する符号化モードを選択することが可能である。
以下、この実施の形態1では、各々の符号化ブロックが更にパーティション単位に分割されるものとして説明する。
符号化制御部1による符号化モードの選択方法は、公知の技術であるため詳細な説明を省略するが、例えば、利用可能な任意の符号化モードを用いて、符号化ブロックに対する符号化処理を実施して符号化効率を検証し、利用可能な複数の符号化モードの中で、最も符号化効率がよい符号化モードを選択する方法などがある。
【0041】
また、符号化制御部1は、各々の符号化ブロックに含まれているパーティション毎に、差分画像が圧縮される際に用いられる量子化パラメータ及び変換ブロックサイズを決定するとともに、予測処理が実施される際に用いられるイントラ予測パラメータ又はインター予測パラメータを決定する。
符号化制御部1は、量子化パラメータ及び変換ブロックサイズを含む予測差分符号化パラメータを変換・量子化部7、逆量子化・逆変換部8及び可変長符号化部13に出力する。また、予測差分符号化パラメータを必要に応じてイントラ予測部4に出力する。
【0042】
ブロック分割部2は、入力カラー画像を示す映像信号を入力すると、その入力カラー画像を符号化制御部1により決定された最大サイズの符号化ブロックに分割するとともに、符号化制御部1により決定された上限の階層数に至るまで、その符号化ブロックを階層的に分割する。また、その符号化ブロックをパーティション単位に分割する(ステップST3)。
ここで、図9は最大サイズの符号化ブロックが階層的に複数の符号化ブロックに分割される様子を示す説明図である。
図9の例では、最大サイズの符号化ブロックは、第0階層の符号化ブロックBであり、輝度成分で(L,M)のサイズを有している。
また、図9の例では、最大サイズの符号化ブロックBを出発点として、4分木構造で、別途定める所定の深さまで階層的に分割を行うことによって、符号化ブロックBを得ている。
【0043】
深さnにおいては、符号化ブロックBはサイズ(L,M)の画像領域である。
ただし、LとMは同じであってもよいし異なっていてもよいが、図9の例ではL=Mのケースを示している。
以降、符号化ブロックBのサイズは、符号化ブロックBの輝度成分におけるサイズ(L,M)と定義する。
【0044】
ブロック分割部2では、4分木分割を行うため、常に(Ln+1,Mn+1)=(L/2,M/2)が成立する。
ただし、RGB信号などのように、全ての色成分が同一サンプル数を有するカラー映像信号(4:4:4フォーマット)では、全ての色成分のサイズが(L,M)になるが、4:2:0フォーマットを扱う場合、対応する色差成分の符号化ブロックのサイズは(L/2,M/2)である。
以降、第n階層の符号化ブロックBで選択しうる符号化モードをm(B)と表記する。
【0045】
複数の色成分からなるカラー映像信号の場合、符号化モードm(B)は、色成分ごとに、それぞれ個別のモードを用いるように構成されてもよいが、以降、特に断らない限り、YUV信号、4:2:0フォーマットの符号化ブロックの輝度成分に対する符号化モードのことを指すものとして説明を行う。
符号化モードm(B)には、1つないし複数のイントラ符号化モード(総称して「INTRA」)、1つないし複数のインター符号化モード(総称して「INTER」)があり、符号化制御部1は、上述したように、当該ピクチャで利用可能な全ての符号化モードないしは、そのサブセットの中から、符号化ブロックBに対して最も符号化効率がよい符号化モードを選択する。
【0046】
符号化ブロックBは、図9に示すように、更に1つないし複数の予測処理単位(パーティション)に分割される。
以降、符号化ブロックBに属するパーティションをP(i: 第n階層におけるパーティション番号)と表記する。図10は符号化ブロックBに属するパーティションPを示す説明図である。
符号化ブロックBに属するパーティションPの分割がどのようになされているかは符号化モードm(B)の中に情報として含まれる。
パーティションPは、すべて符号化モードm(B)に従って予測処理が行われるが、パーティションP毎に、個別の予測パラメータを選択することができる。
【0047】
符号化制御部1は、最大サイズの符号化ブロックに対して、例えば、図11に示すようなブロック分割状態を生成して、符号化ブロックBを特定する。
図11(a)の斜線部分は分割後のパーティションの分布を示し、また、図11(b)は階層分割後のパーティションに符号化モードm(B)が割り当てられる状況を4分木グラフで示している。
図11(b)において、□で囲まれているノードが、符号化モードm(B)が割り当てられたノード(符号化ブロックB)を示している。
また、符号化制御部1は、分割後のパーティションに対して、前述の通りに、変換ブロックの分割形状を決定する。
【0048】
切替スイッチ3は、符号化制御部1がイントラ符号化モードを選択すると(m(B)∈INTRA)、ブロック分割部2により分割された符号化ブロックBに属するパーティションPをイントラ予測部4に出力し、符号化制御部1がインター符号化モードを選択すると(m(B)∈INTER)、その符号化ブロックBに属するパーティションPを動き補償予測部5に出力する。
【0049】
イントラ予測部4は、切替スイッチ3から符号化ブロックBに属するパーティションPを受けると(ステップST4)、具体的な処理内容は後述するが、符号化制御部1により決定されたイントラ予測パラメータに基づいて、各パーティションPに対するイントラ予測処理を実施することにより、イントラ予測画像(P)を生成する(ステップST5)。
以下、この明細書では、Pはパーティションを示し、(P)はパーティションPの予測画像を示すものとする。
【0050】
イントラ予測画像(P)の生成に用いられるイントラ予測パラメータは、カラー動画像復号装置側でも、全く同じイントラ予測画像(P)を生成する必要があるため、可変長符号化部13によってビットストリームに多重化される。
なお、イントラ予測パラメータとして選択できるイントラ予測方向数は、処理対象となるブロックのサイズに応じて異なるように構成してもよい。
大きいサイズのパーティションでは、イントラ予測の効率が低下するため、選択できるイントラ予測方向数を少なくし、小さいサイズのパーティションでは、選択できるイントラ予測方向数を多くするように構成することができる。
例えば、4×4画素パーティションや8×8画素パーティションでは34方向、16×16画素パーティションでは17方向、32×32画素パーティションでは9方向などのように構成してもよい。
【0051】
動き補償予測部5は、切替スイッチ3から符号化ブロックBに属するパーティションPを受けると(ステップST4)、符号化制御部1により決定されたインター予測パラメータに基づいて、各パーティションPに対するインター予測処理を実施することにより、インター予測画像(P)を生成する(ステップST6)。
即ち、動き補償予測部5は、動き補償予測フレームメモリ12により格納されている1フレーム以上の参照画像を用いて、符号化制御部1から出力されたインター予測パラメータに基づいて、その符号化ブロックに対する動き補償予測処理を実施することで、インター予測画像(P)を生成する。
インター予測画像(P)の生成に用いられるインター予測パラメータは、カラー動画像復号装置側でも、全く同じインター予測画像(P)を生成する必要があるため、可変長符号化部13によってビットストリームに多重化される。
【0052】
減算部6は、イントラ予測部4又は動き補償予測部5から予測画像(P)を受けると、ブロック分割部2により分割された符号化ブロックBに属するパーティションPから、その予測画像(P)を減算することで、その差分画像を示す予測差分信号eを生成する(ステップST7)。
【0053】
変換・量子化部7は、減算部6が予測差分信号eを生成すると、符号化制御部1で決定された変換ブロックサイズ単位で、その予測差分信号eに対する変換処理(例えば、DCT(離散コサイン変換)やDST(離散サイン変換)、予め特定の学習系列に対して基底設計がなされているKL変換等の直交変換処理)を実施するとともに、その予測差分符号化パラメータに含まれている量子化パラメータを用いて、その予測差分信号eの変換係数を量子化することで、量子化後の変換係数である差分画像の圧縮データを逆量子化・逆変換部8及び可変長符号化部13に出力する(ステップST8)。
即ち、変換・量子化部7は、減算部6が予測差分信号eを生成すると、予測差分信号eの輝度信号に対する変換・量子化処理を実施する場合、ブロック分割部2により分割された符号化ブロックをさらに階層的に分割して、分割後のブロック単位で輝度信号の変換・量子化処理を実施し、予測差分信号eの色差信号に対する変換・量子化処理を実施する場合、ブロック分割部2により分割された符号化ブロックの形状が正方形であれば、その符号化ブロックと同じサイズのブロック単位で色差信号の変換・量子化処理を実施し、その符号化ブロックの形状が長方形であれば、その符号化ブロックを1階層だけ分割して、分割後のブロック単位で色差信号の変換・量子化処理を実施する。
なお、予測ブロックの形状が正方形であっても、符号化ブロックを4分割して得られる正方形サイズの予測ブロックの場合には、色差信号の変換ブロックも1階層だけ分割されるように構成してもよい。
このようにすれば、正方形の変換ブロックが正方形の予測ブロックをまたがないように構成できるので、このように構成された符号化装置の出力するビットストリームを好適に復号することができる。
【0054】
逆量子化・逆変換部8は、変換・量子化部7から圧縮データを受けると、符号化制御部1から出力された予測差分符号化パラメータに含まれている量子化パラメータを用いて、その圧縮データを逆量子化し、その予測差分符号化パラメータに含まれている変換ブロック分割フラグから特定される変換ブロックサイズ単位で、逆量子化の圧縮データの逆変換処理(例えば、逆DCT(逆離散コサイン変換)や逆DST(離散サイン変換)、逆KL変換等の逆変換処理)を実施することで、逆変換処理後の圧縮データを局所復号予測差分信号として加算部9に出力する(ステップST9)。
【0055】
加算部9は、逆量子化・逆変換部8から局所復号予測差分信号を受けると、その局所復号予測差分信号と、イントラ予測部4又は動き補償予測部5により生成された予測画像(P)を示す予測信号とを加算することで、局所復号パーティション画像ないしはその集まりとしての局所復号符号化ブロック画像(以下、「局所復号画像」と称する)を示す局所復号画像信号を生成し、その局所復号画像信号をループフィルタ部11に出力する(ステップST10)。
また、イントラ予測用メモリ10には、イントラ予測に用いるために、当該局所復号画像が格納される。
【0056】
ループフィルタ部11は、加算部9から局所復号画像信号を受けると、その局所復号画像信号に含まれている符号化歪みを補償し、符号化歪み補償後の局所復号画像信号が示す局所復号画像を参照画像として動き補償予測フレームメモリ12に格納する(ステップST11)。
ここで、符号化歪は変換ブロック境界に沿って発生するため、変換ブロック境界に対して符号化歪の補償を行う。小さい変換ブロックについては、変換ブロック境界の符号化歪が目立ちにくいので、ヘッダで最小ループフィルタ適用ブロックサイズをシグナリングし、変換ブロックサイズが最小ループフィルタ適用ブロックサイズより大きいブロックに対してのみ符号化歪補償を適用するよう構成してもよい。
このようにすれば、不要な符号化歪補償を省略できるので、画質を保ちつつ演算量を削減することができる。また、輝度信号と色差信号では、変換ブロックの分割形状が異なるので、符号化歪補償は輝度信号と色差信号でそれぞれ変換ブロックの分割形状を特定して処理するよう構成する。
なお、ループフィルタ部11によるフィルタリング処理は、入力される局所復号画像信号の最大符号化ブロックあるいは個々の符号化ブロック単位で行ってもよいし、1画面分のマクロブロックに相当する局所復号画像信号が入力された後に1画面分まとめて行ってもよい。
【0057】
ステップST4〜ST10の処理は、ブロック分割部2により分割された全ての符号化ブロックBに属するパーティションPに対する処理が完了するまで繰り返し実施される(ステップST12)。
可変長符号化部13は、変換・量子化部7から出力された圧縮データと、符号化制御部1から出力された符号化モード及び変換ブロック分割フラグを含む予測差分符号化パラメータと、イントラ予測部4から出力されたイントラ予測パラメータ又は動き補償予測部5から出力されたインター予測パラメータとを可変長符号化して、その圧縮データ、符号化モード、予測差分符号化パラメータ、イントラ予測パラメータ/インター予測パラメータの符号化データが多重化されているビットストリームを生成する(ステップST13)。
【0058】
次に、イントラ予測部4の処理内容を具体的に説明する。
図12は符号化ブロックBに属する各パーティションPにおいて選択可能なイントラ予測パラメータ(イントラ予測モード)の一例を示す説明図である。
図12の例では、イントラ予測モードに対応する予測方向ベクトルを示しており、選択可能なイントラ予測モードの個数が増えるに従って、予測方向ベクトル同士の相対角度が小さくなるように設計されている。
【0059】
まず、イントラ予測部4の輝度信号イントラ予測部21は、ブロック分割部2により分割された符号化ブロックにおける輝度成分のフレーム内予測を実施して、輝度成分に対する予測画像を生成する(図5のステップST21)。
以下、輝度信号イントラ予測部21の処理内容を具体的に説明する。
ここでは、イントラ予測部4の輝度信号イントラ予測部21が、パーティションPの輝度信号に対するイントラ予測パラメータ(イントラ予測モード)に基づいて、その輝度信号のイントラ予測信号を生成するイントラ処理について説明する。
説明の便宜上、パーティションPのサイズをl×m画素とする。
【0060】
図13はl=m=4の場合において、パーティションP内の画素の予測値を生成する際に用いる画素の一例を示す説明図である。
図13の例では、パーティションPに隣接している符号化済みの上パーティションの画素((2×l+1)個の画素)と、左パーティションの画素((2×m)個の画素)を予測に用いる参照画素としているが、予測に用いる画素は、図13に示す画素より多くても少なくてもよい。
また、図13の例では、隣接している1行又は1列分の画素を予測に用いているが、2行又は2列分の画素、あるいは、それ以上の画素を予測に用いてもよい。
【0061】
輝度信号イントラ予測部21は、例えば、パーティションPに対するイントラ予測モードのインデックス値が2(平均値予測)である場合、上パーティションの隣接画素と左パーティションの隣接画素の平均値をパーティションP内の画素の予測値として予測画像を生成する。
イントラ予測モードのインデックス値が2(平均値予測)以外の場合には、インデックス値が示す予測方向ベクトルv=(dx,dy)に基づいて、パーティションP内の画素の予測値を生成する。
予測値を生成する画素(予測対象画素)のパーティションP内の相対座標(パーティションの左上画素を原点とする)を(x,y)とすると、予測に用いる参照画素の位置は、下記に示すLと、隣接画素の交点となる。

ただし、kは正のスカラ値である。
【0062】
参照画素が整数画素位置にある場合、その整数画素を予測対象画素の予測値とする。参照画素が整数画素位置にない場合、参照画素に隣接する整数画素から生成される補間画素を予測値とする。
図13の例では、参照画素が整数画素位置にないので、参照画素に隣接する2画素の平均値を予測値としている。
なお、隣接する2画素のみではなく、隣接する2画素以上の画素から補間画素を生成して予測値としてもよい。
【0063】
輝度信号イントラ予測部21は、同様の手順で、パーティションP内の輝度信号のすべての画素に対する予測画素を生成し、その生成したイントラ予測画像(P)を出力する。
イントラ予測画像(P)の生成に用いているイントラ予測パラメータは、上述したように、ビットストリームに多重化するために可変長符号化部13に出力される。
【0064】
イントラ予測部4の切替スイッチ22は、符号化制御部1から出力されたイントラ予測パラメータのうち、色差信号のイントラ符号化モードを示すパラメータが、方向性予測モードであるのか、平滑化輝度相関利用色差信号予測モードであるのかを判定する(ステップST22)。
切替スイッチ22は、色差信号のイントラ符号化モードを示すパラメータが、方向性予測モードである旨を示していれば、予測に用いる参照画素を色差信号方向性イントラ予測部23に与え、色差信号のイントラ符号化モードを示すパラメータが、平滑化輝度相関利用色差信号予測モードである旨を示していれば、予測に用いる参照画素を輝度相関利用色差信号予測部24に与える。
【0065】
ここで、図14は色差信号のイントラ予測パラメータと色差イントラ予測モードの対応例を示す説明図である。
図14の例では、色差信号イントラ予測パラメータが“34”である場合には、予測に用いる参照画素が輝度相関利用色差信号予測部24に与えられ、色差信号イントラ予測パラメータが“34”以外である場合には、予測に用いる参照画素が色差信号方向性イントラ予測部23に与えられることになる。
【0066】
色差信号方向性イントラ予測部23は、切替スイッチ22から予測に用いる参照画素を受けると、パーティションPに隣接している復号済みの色差参照画素を参照して、符号化制御部1から出力されたイントラ予測パラメータに基づく色差成分のフレーム内予測を実施することで、色差成分に対する予測画像を生成する(ステップST23)。
色差信号方向性イントラ予測部23におけるイントラ予測の対象が色差信号であり、イントラ予測の対象が輝度信号である輝度信号イントラ予測部21と異なるが、イントラ予測の処理内容自体は輝度信号イントラ予測部21と同様である。よって、方向性予測、水平予測、垂直予測、DC予測などを行うことにより、色差信号のイントラ予測画像が生成される。
【0067】
輝度相関利用色差信号予測部24は、切替スイッチ22から予測に用いる参照画素を受けると、符号化ブロックであるパーティションPに隣接している復号済みの輝度参照画素及び色差参照画素と、パーティションP内の復号済みの輝度参照画素(輝度信号イントラ予測部21により先に生成されたパーティションPのイントラ予測画像(P)から得られた局所復号画像内の輝度参照画素)とを用いて、その符号化ブロックを構成している画素のうち、水平方向及び垂直方向に隣接している複数の画素に係る輝度成分を平滑化して、平滑化後の輝度成分と色差成分の相関を示す相関パラメータを算出し、その相関パラメータと平滑化後の輝度成分を用いて、色差成分に対する予測画像を生成する(ステップST24)。
以下、輝度相関利用色差信号予測部24の処理内容を具体的に説明する。
【0068】
輝度相関利用色差信号予測部24の平滑化輝度参照画素縮小部31は、イントラ予測用メモリ10により格納されているパーティションPを構成している復号済みの輝度参照画素(輝度信号イントラ予測部21により先に生成されたパーティションPのイントラ予測画像(P)から得られた局所復号画像内の輝度参照画素)のうち、水平方向及び垂直方向に隣接している複数の輝度参照画素の平滑化処理等を実施することで、縮小輝度参照画素Rec’を生成する(図6のステップST31)。
即ち、平滑化輝度参照画素縮小部31は、図15に示すように、パーティションP内の色差信号の予測ブロック(図中、左側のN×Nのブロック)に対応するブロック(図中、右側の2N×2Nのブロック)内の復号済の画素値である復号済輝度信号と、その復号済輝度信号の上端と左端に隣接している復号済輝度信号とを用いて、縮小輝度参照画素Rec’を生成する。
ここで、縮小輝度参照画素Rec’は、図16に示すように、YUV4:2:0信号において、色差信号画素と同位相になるように、輝度参照画素Recに対して、横方向に1:2:1のローパスフィルタ、縦方向に1:1のローパスフィルタを施した後に、縦横に偶数列のみをサブサンプリングすることで得られる。
【0069】
輝度相関利用色差信号予測部24の相関算出部32は、平滑化輝度参照画素縮小部31が縮小輝度参照画素Rec’を生成すると、その縮小輝度参照画素Rec’と、色差信号の予測ブロックの上端及び左端に隣接している色差信号の復号済の画素値である色差参照画素Recとを用いて、下記の式(1)及び式(2)に示すように、予測に用いる相関パラメータα,βを算出する(ステップST32)。



式(1),(2)において、Iは処理対象となる色差信号の予測ブロックの1辺の画素数の2倍の値である。
【0070】
色差予測画像生成部33は、相関算出部32が相関パラメータα,βを算出すると、その相関パラメータα,βと縮小輝度参照画素Rec’を用いて、下記の式(3)に示すように、色差予測画像Predを生成する(ステップST33)。

【0071】
なお、イントラ予測は、画面内の未知の領域を既知の領域から予測する手段であるが、輝度信号と色差信号のテクスチャには相関があり、空間方向については、近傍画素同士は画素値の変化が小さいため、予測ブロックに隣接する復号済の輝度信号と色差信号を利用して輝度信号と色差信号の相関パラメータを算出し、その輝度信号と相関パラメータから色差信号を予測することにより、予測効率を向上させることができる。
この際、YUV4:2:0信号では、輝度信号と色差信号の解像度が異なるため、輝度信号をサブサンプリングする必要があるが、ローパスフィルタを施すことによりエイリアシングの発生を抑えることができ、予測効率を向上させることができる。
【0072】
可変長符号化部13は、上述したように、イントラ予測部4から出力されたイントラ予測パラメータを可変長符号化して、そのイントラ予測パラメータの符号語をビットストリームに多重化するが、イントラ予測パラメータを符号化する際に、複数の方向性予測の予測方向ベクトルの中から、代表的な予測方向ベクトル(予測方向代表ベクトル)を選択し、イントラ予測パラメータを予測方向代表ベクトルのインデックス(予測方向代表インデックス)と予測方向代表ベクトルからの差分を表すインデックス(予測方向差分インデックス)で表して、それぞれのインデックス毎に、確率モデルに応じた算術符号化などのハフマン符号化を行うことで、符号量を削減して符号化するよう構成してもよい。
【0073】
次に、図7のカラー動画像復号装置の処理内容を説明する。
可変長復号部41は、図1のカラー動画像符号化装置により生成されたビットストリームを入力すると、そのビットストリームに対する可変長復号処理を実施して(図8のステップST41)、1フレーム以上のピクチャから構成されるシーケンス単位あるいはピクチャ単位にフレームサイズを復号する。
可変長復号部41は、フレームサイズを復号すると、図1のカラー動画像符号化装置で決定された最大符号化ブロックサイズ(イントラ予測処理又は動き補償予測処理が実施される際の処理単位となる符号化ブロックの最大サイズ)と、分割階層数の上限(最大サイズの符号化ブロックから階層的に分割されている符号化ブロックの階層数)をカラー動画像符号化装置と同様の手順で決定する(ステップST42)。
【0074】
例えば、符号化ブロックの最大サイズが、全てのピクチャに対して、入力カラー画像の解像度に応じたサイズに決定されている場合には、先に復号しているフレームサイズに基づいて、図1のカラー動画像符号化装置と同様の手順で、符号化ブロックの最大サイズを決定する。
カラー動画像符号化装置によって、符号化ブロックの最大サイズ及び符号化ブロックの階層数がビットストリームに多重化されている場合には、そのビットストリームから符号化ブロックの最大サイズ及び符号化ブロックの階層数を復号する。
【0075】
可変長復号部41は、符号化ブロックの最大サイズ及び符号化ブロックの階層数を決定すると、最大符号化ブロックを出発点にして、各符号化ブロックの階層的な分割状態を把握することで、ビットストリームに多重化されている符号化データの中で、各符号化ブロックに係る符号化データを特定し、その符号化データから各符号化ブロックに割り当てられている符号化モードを復号する。
そして、可変長復号部41は、その符号化モードに含まれている符号化ブロックBに属するパーティションPの分割情報を参照して、ビットストリームに多重化されている符号化データの中で、各パーティションPに係る符号化データを特定する(ステップST43)。
可変長復号部41は、各パーティションPに係る符号化データから圧縮データ、変換ブロック分割フラグを含む予測差分符号化パラメータ、イントラ予測パラメータ/インター予測パラメータを可変長復号して、その圧縮データ及び予測差分符号化パラメータを逆量子化・逆変換部45に出力するとともに、符号化モード及びイントラ予測パラメータ/インター予測パラメータを切替スイッチ42に出力する(ステップST44)。
【0076】
例えば、予測方向代表インデックスと予測方向差分インデックスがビットストリームに多重化されている場合には、その予測方向代表インデックスと予測方向差分インデックスをそれぞれの確率モデルに応じた算術復号などによりエントロピー復号し、その予測方向代表インデックスと予測方向差分インデックスからイントラ予測パラメータを特定するようにする。
これにより、カラー動画像符号化装置側で、イントラ予測パラメータの符号量を削減している場合でも、イントラ予測パラメータを正しく復号することができる。
【0077】
切替スイッチ42は、可変長復号部41から出力された符号化ブロックBに属するパーティションPの符号化モードがイントラ符号化モードである場合、可変長復号部41から出力されたイントラ予測パラメータをイントラ予測部43に出力し、その符号化モードがインター符号化モードである場合、可変長復号部41から出力されたインター予測パラメータを動き補償部44に出力する。
【0078】
イントラ予測部43は、可変長復号部41からイントラ予測パラメータを受けると(ステップST45)、図1のイントラ予測部4と同様に、そのイントラ予測パラメータに基づいて、各パーティションPに対するイントラ予測処理を実施することにより、イントラ予測画像(P)を生成する(ステップST46)。
即ち、イントラ予測部43は、可変長復号部41からイントラ予測パラメータを受けると、カラー動画像符号化装置の輝度信号イントラ予測部21と同様に、例えば、パーティションPに対するイントラ予測モードのインデックス値が2(平均値予測)である場合、上パーティションの隣接画素と左パーティションの隣接画素の平均値をパーティションP内の画素の予測値として予測画像を生成する。
イントラ予測モードのインデックス値が2(平均値予測)以外の場合には、インデックス値が示す予測方向ベクトルv=(dx,dy)に基づいて、パーティションP内の画素の予測値を生成する。
イントラ予測部43は、同様の手順で、パーティションP内の輝度信号のすべての画素に対する予測画素を生成し、その生成したイントラ予測画像(P)を出力する。
【0079】
動き補償部44は、切替スイッチ42からインター予測パラメータを受けると、カラー動画像符号化装置の動き補償予測部5と同様に、そのインター予測パラメータに基づいて、各パーティションPに対するインター予測処理を実施することにより、インター予測画像(P)を生成する(ステップST47)。
即ち、動き補償部44は、動き補償予測フレームメモリ49により格納されている1フレーム以上の参照画像を用いて、そのインター予測パラメータに基づくパーティションPに対する動き補償予測処理を実施することで、インター予測画像(P)を生成する。
【0080】
逆量子化・逆変換部45は、可変長復号部41から変換ブロック分割フラグを含む予測差分符号化パラメータを受けると、その予測差分符号化パラメータに含まれている量子化パラメータを用いて、変換ブロック分割フラグに従って決定される変換ブロックサイズ毎に、可変長復号部41から出力された符号化ブロックに係る圧縮データを逆量子化し、その予測差分符号化パラメータに含まれている変換ブロック分割フラグから特定される変換ブロックサイズ単位で、逆量子化後の圧縮データの逆変換処理(例えば、逆DCT(逆離散コサイン変換)や逆DST(逆離散サイン変換)、逆KL変換等の逆変換処理)を実施することで、逆変換処理後の圧縮データを復号予測差分信号(圧縮前の差分画像を示す信号)として加算部46に出力する(ステップST48)。
【0081】
加算部46は、逆量子化・逆変換部45から出力された復号予測差分信号と、イントラ予測部43又は動き補償部44により生成された予測画像(P)を示す予測信号とを加算することで、復号パーティション画像ないしはその集まりとしての復号画像を示す復号画像信号を生成し、その復号画像信号をループフィルタ部48に出力する(ステップST49)。
また、イントラ予測用メモリ47には、イントラ予測に用いるために、当該復号画像が格納される。
【0082】
ループフィルタ部48は、加算部46から復号画像信号を受けると、その復号画像信号に含まれている符号化歪みを補償し、符号化歪み補償後の復号画像信号が示す復号画像を参照画像として動き補償予測フレームメモリ49に格納するとともに、その復号画像を再生画像として出力する(ステップST50)。
ここで、符号化歪は変換ブロック境界に沿って発生するため、変換ブロック境界に対して符号化歪の補償を行う。小さい変換ブロックについては、変換ブロック境界の符号化歪が目立ちにくいので、ヘッダで最小ループフィルタ適用ブロックサイズをシグナリングし、変換ブロックサイズが最小ループフィルタ適用ブロックサイズより大きいブロックに対してのみ符号化歪補償を適用するよう構成してもよい。
このようにすれば、不要な符号化歪補償を省略できるので画質を保ちつつ演算量を削減することができる。また、輝度信号と色差信号では変換ブロックの分割形状が異なるので、符号化歪補償は輝度信号と色差信号でそれぞれ変換ブロックの分割形状を特定して処理するよう構成する。
なお、ループフィルタ部48によるフィルタリング処理は、入力される復号画像信号の最大符号化ブロックあるいは個々の符号化ブロック単位で行ってもよいし、1画面分のマクロブロックに相当する復号画像信号が入力された後に1画面分まとめて行ってもよい。
ステップST43〜ST49の処理は、全ての符号化ブロックBに属するパーティションPに対する処理が完了するまで繰り返し実施される(ステップST51)。
【0083】
以上で明らかなように、この実施の形態1によれば、変換・量子化部7が、減算部6により生成された差分画像の輝度信号に対する変換・量子化処理を実施する場合、ブロック分割部2により分割された符号化ブロックをさらに階層的に分割して、分割後のブロック単位で輝度信号の変換・量子化処理を実施し、減算部6により生成された差分画像の色差信号に対する変換・量子化処理を実施する場合、ブロック分割部2により分割された符号化ブロックの形状が正方形であれば、その符号化ブロックと同じサイズのブロック単位で色差信号の変換・量子化処理を実施し、その符号化ブロックの形状が長方形であれば、その符号化ブロックを1階層だけ分割して、分割後のブロック単位で色差信号の変換・量子化処理を実施するように構成したので、輝度信号と色差信号に対する変換・量子化処理のブロックサイズの適正化が図られて、輝度信号と色差信号の符号化効率を高めることができる効果を奏する。
【0084】
即ち、カラー動画像符号化装置の色差信号における変換ブロックの分割形状が符号化ブロック及び予測モードに応じて、少ない階層数となる分割状態に一意に決定されるため、色差信号の変換ブロックの分割形状についての情報をシグナリングすることなく、輝度信号の変換ブロックサイズと比べて、画面サイズに対し相対的に大きいブロックサイズで色差信号の変換が行われるので、色差信号を効率よく圧縮することができる。
また、カラー動画像復号装置の色差信号における変換ブロックの分割形状が符号化ブロック及び予測モードに応じて一意に決定されるので、カラー動画像符号化装置で生成されるビットストリームを好適に復号することができる。
なお、同様に色差信号における変換ブロックの分割形状を予測ブロックの分割形状と同じサイズに構成してもよい。
このように構成することにより、色差信号の変換ブロックの分割形状が一意に決定されると共に、相対的に大きいブロックサイズで色差信号の変換が行われるので、同様の効果を得ることができる。
【0085】
実施の形態2.
上記実施の形態1では、映像信号がYUV4:2:0フォーマットである例で説明をしたが、この実施の形態2では、映像信号がYUV4:2:2フォーマットである場合について説明する。
YUV4:2:2フォーマットでは、色差成分の縦方向のサンプリング数が輝度信号と同数であり、横方向のサンプリング数が輝度信号の半分である。従って、YUV4:2:0フォーマットの符号化・復号の処理に対し、色差成分の処理のみが異なるため、ここでは、主に色差成分の処理について説明する。
【0086】
この実施の形態2のカラー動画像符号化装置における符号化制御部1は、上記実施の形態1と同様に、イントラ予測処理(フレーム内予測処理)又は動き補償予測処理(フレーム間予測処理)が実施される際の処理単位となる符号化ブロックの最大サイズを決定するとともに、最大サイズの符号化ブロックが階層的に分割される際の上限の階層数を決定する処理を実施する。
また、符号化制御部1は利用可能な1以上の符号化モード(1以上のイントラ符号化モード、1以上のインター符号化モード)の中から、階層的に分割される各々の符号化ブロックに適する符号化モードを選択する処理を実施する。
また、符号化制御部1は各々の符号化ブロック毎に、差分画像が圧縮される際に用いられる量子化パラメータ及び変換ブロックサイズを決定するとともに、予測処理が実施される際に用いられるイントラ予測パラメータ又はインター予測パラメータを決定する処理を実施する。量子化パラメータ及び変換ブロックサイズを示す変換ブロック分割フラグは、予測差分符号化パラメータに含まれて、変換・量子化部7、逆量子化・逆変換部8及び可変長符号化部13等に出力される。
【0087】
図18は4:2:2フォーマットの信号における輝度信号及び色差信号の圧縮処理を実施する際の変換ブロックサイズを示す説明図である。
変換ブロックサイズは、図18に示すように、符号化ブロックを四分木状に階層分割することによって決定される。
例えば、変換ブロックを分割する場合と変換ブロックを分割しない場合での符号量や、符号化誤差を加味した評価尺度などに基づいて、評価値が最小になるように変換ブロックを分割するか否かを決定することで、符号量と符号化誤差のトレードオフの観点から最適な変換ブロックの分割形状を決定することができる。
【0088】
輝度信号については、例えば、図18に示すように、予測ブロックの形状が正方形である予測モードが符号化ブロックの符号化モードとして選択された場合、符号化ブロックが1つまたは複数の正方形の変換ブロックに階層的に分割されるように構成する。
一方、予測ブロックの形状が長方形である予測モードが符号化ブロックの符号化モードとして選択された場合、符号化ブロックが1つまたは複数の長方形の変換ブロックに階層的に分割されるように構成する。あるいは、正方形の変換ブロックに分割された後に、さらに下の階層で長方形の変換ブロックに分割されるように構成する。
一方、色差信号については、予測ブロックの形状が正方形である場合、予測ブロックと同じサイズの変換ブロックが適用されるように構成する。
予測ブロックの形状が長方形である場合、図18に示すように、予測ブロックが1階層だけ分割されるように構成する。
【0089】
このように輝度信号については、階層的に最適な変換ブロックサイズに分割されて変換が行われ、色差信号については、分割形状が固定された大きいブロックで変換が行われるため、色差信号の変換ブロックの分割形状に関する情報をシグナリングすることなく、色差信号を効率的に圧縮することができる。
また、色差信号の変換ブロックの分割形状が、輝度信号の変換ブロックの分割形状と異なるため、輝度信号に対しては、輝度信号に最適な変換ブロックの分割形状を選択することができるため、輝度信号についても、効率的に圧縮することができる。
輝度信号の変換ブロックの分割情報は、階層毎に分割するか否かを示す変換ブロック分割フラグとして可変長符号化部13に出力する。
【0090】
イントラ予測部4は切替スイッチ3からブロック分割部2により分割された符号化ブロックを受けると、上記実施の形態1と同様に、その符号化ブロックに対して、イントラ予測用メモリ10により格納されている上記符号化ブロックに隣接している復号済みの画素を用いて、符号化制御部1から出力されたイントラ予測パラメータに基づくフレーム内予測処理を実施することで予測画像を生成する処理を実施する。
即ち、イントラ予測部4は、ブロック分割部2により分割された符号化ブロックにおける輝度成分については、その輝度成分のフレーム内予測を実施して、輝度成分に対する予測画像を生成する。
一方、ブロック分割部2により分割された符号化ブロックにおける色差成分については、符号化制御部1により選択された符号化モードが、イントラ符号化モードにおける方向性予測モードであれば、ブロック分割部2により分割された符号化ブロックにおける色差成分のフレーム内予測を実施して、色差成分に対する予測画像を生成する。
【0091】
ここで、色差成分のフレーム内予測は、図19に示すように、縦長のブロックに対して適用する。
方向性予測の場合、図19に示すように、隣接局部復号画像を直線的に繰り返すことにより予測画像を得る。
平均値予測の場合、上に隣接する画素と左に隣接する画素の平均値を予測値として用いる。あるいは、左に隣接する画素の平均値である左平均値予測値と、上に隣接する画素の平均値である上平均値予測値を個別に算出し、左平均値予測値と上平均値予測値の平均値を平均値予測値としてもよい。
このようにすることで、演算回路において、割り算を用いずシフト演算で処理をすることができるため、回路規模を小さく抑えることができる。
また、左平均値予測値の3倍と上平均値予測値を加算して、2ビット右シフトするよう構成してもよい。
このようにすることで、予測ブロックの形状が縦長なので、より長い辺である左側の画素値により重みを加えた予測値とすることができ、かつ、シフト演算で実現が可能であるため、小さい回路規模で効率のよい予測を行うことができる。
【0092】
動き補償予測部5はブロック分割部2により分割された符号化ブロックに対応する符号化モードとして、符号化制御部1によりインター符号化モードが選択された場合、動き補償予測フレームメモリ12により格納されている1フレーム以上の参照画像を用いて、符号化制御部1から出力されたインター予測パラメータに基づいて、その符号化ブロックに対する動き補償予測処理を実施することで予測画像を生成する処理を実施する。
色差成分については、輝度成分の動きベクトルに対して横方向の動きベクトル成分のみ半分にした値を適用して動き補償予測処理を行う。
【0093】
次に動作について説明する。
最初に、図1のカラー動画像符号化装置の処理内容を説明する。
まず、符号化制御部1は、イントラ予測処理(フレーム内予測処理)又は動き補償予測処理(フレーム間予測処理)が実施される際の処理単位となる符号化ブロックの最大サイズを決定するとともに、最大サイズの符号化ブロックが階層的に分割される際の上限の階層数を決定する(図2のステップST1)。
【0094】
符号化ブロックの最大サイズの決め方として、例えば、全てのピクチャに対して、入力カラー画像の解像度に応じたサイズに決定する方法が考えられる。
また、入力カラー画像の局所的な動きの複雑さの違いをパラメータとして定量化しておき、動きの激しいピクチャでは最大サイズを小さな値に決定し、動きが少ないピクチャでは最大サイズを大きな値に決定する方法などが考えられる。
上限の階層数については、例えば、入力カラー画像の動きが激しい程、階層数を深くして、より細かい動きが検出できるように設定し、入力カラー画像の動きが少なければ、階層数を抑えるように設定する方法が考えられる。
【0095】
また、符号化制御部1は、利用可能な1以上の符号化モード(M種類のイントラ符号化モード、N種類のインター符号化モード)の中から、階層的に分割される各々の符号化ブロックに対応する符号化モードを選択する(ステップST2)。
ただし、後述するブロック分割部2により階層的に分割された各々の符号化ブロックが更にパーティション単位に分割される場合は、各々のパーティションに対応する符号化モードを選択することが可能である。
以下、この実施の形態2では、各々の符号化ブロックが更にパーティション単位に分割されるものとして説明する。
符号化制御部1による符号化モードの選択方法は、公知の技術であるため詳細な説明を省略するが、例えば、利用可能な任意の符号化モードを用いて、符号化ブロックに対する符号化処理を実施して符号化効率を検証し、利用可能な複数の符号化モードの中で、最も符号化効率がよい符号化モードを選択する方法などがある。
【0096】
また、符号化制御部1は、各々の符号化ブロックに含まれているパーティション毎に、差分画像が圧縮される際に用いられる量子化パラメータ及び変換ブロックサイズを決定するとともに、予測処理が実施される際に用いられるイントラ予測パラメータ又はインター予測パラメータを決定する。
符号化制御部1は、量子化パラメータ及び変換ブロックサイズを示す変換ブロック分割フラグ含む予測差分符号化パラメータを変換・量子化部7、逆量子化・逆変換部8及び可変長符号化部13に出力する。また、予測差分符号化パラメータを必要に応じてイントラ予測部4に出力する。
【0097】
ブロック分割部2は、入力カラー画像を示す映像信号を入力すると、上記実施の形態1と同様に、その入力カラー画像を符号化制御部1により決定された最大サイズの符号化ブロックに分割するとともに、符号化制御部1により決定された上限の階層数に至るまで、その符号化ブロックを階層的に分割する。また、その符号化ブロックをパーティション単位に分割する(ステップST3)。
図9の例では、最大サイズの符号化ブロックは、第0階層の符号化ブロックBであり、輝度成分で(L,M)のサイズを有している。
また、図9の例では、最大サイズの符号化ブロックBを出発点として、4分木構造で、別途定める所定の深さまで階層的に分割を行うことによって、符号化ブロックBを得ている。
【0098】
符号化制御部1は、最大サイズの符号化ブロックに対して、例えば、図11に示すようなブロック分割状態を生成して、符号化ブロックBを特定する。
図11(a)の斜線部分は分割後のパーティションの分布を示し、また、図11(b)は階層分割後のパーティションに符号化モードm(B)が割り当てられる状況を4分木グラフで示している。
図11(b)において、□で囲まれているノードが、符号化モードm(B)が割り当てられたノード(符号化ブロックB)を示している。
また、符号化制御部1は、分割後のパーティションに対して、前述の通りに、変換ブロックの分割形状を決定する。
【0099】
切替スイッチ3は、符号化制御部1がイントラ符号化モードを選択すると(m(B)∈INTRA)、上記実施の形態1と同様に、ブロック分割部2により分割された符号化ブロックBに属するパーティションPをイントラ予測部4に出力し、符号化制御部1がインター符号化モードを選択すると(m(B)∈INTER)、その符号化ブロックBに属するパーティションPを動き補償予測部5に出力する。
【0100】
イントラ予測部4は、切替スイッチ3から符号化ブロックBに属するパーティションPを受けると(ステップST4)、上記実施の形態1と同様に、符号化制御部1により決定されたイントラ予測パラメータに基づいて、各パーティションPに対するイントラ予測処理を実施することにより、イントラ予測画像(P)を生成する(ステップST5)。
ただし、色差成分のフレーム内予測は、図19に示すように、縦長のブロックに対して適用する。
イントラ予測画像(P)の生成に用いられるイントラ予測パラメータは、カラー動画像復号装置側でも、全く同じイントラ予測画像(P)を生成する必要があるため、可変長符号化部13によってビットストリームに多重化される。
【0101】
なお、イントラ予測パラメータとして選択できるイントラ予測方向数は、処理対象となるブロックのサイズに応じて異なるよう構成してもよい。
大きいサイズのパーティションでは、イントラ予測の効率が低下するため、選択できるイントラ予測方向数を少なくし、小さいサイズのパーティションでは、選択できるイントラ予測方向数を多くするように構成することができる。
例えば、4×4画素パーティションや8×8画素パーティションでは34方向、16×16画素パーティションでは17方向、32×32画素パーティションでは9方向などのように構成してもよい。
【0102】
動き補償予測部5は、切替スイッチ3から符号化ブロックBに属するパーティションPを受けると(ステップST4)、上記実施の形態1と同様に、符号化制御部1により決定されたインター予測パラメータに基づいて、各パーティションPに対するインター予測処理を実施することにより、インター予測画像(P)を生成する(ステップST6)。
即ち、動き補償予測部5は、動き補償予測フレームメモリ12により格納されている1フレーム以上の参照画像を用いて、符号化制御部1から出力されたインター予測パラメータに基づいて、その符号化ブロックに対する動き補償予測処理を実施することで、インター予測画像(P)を生成する。
インター予測画像(P)の生成に用いられるインター予測パラメータは、カラー動画像復号装置側でも、全く同じインター予測画像(P)を生成する必要があるため、可変長符号化部13によってビットストリームに多重化される。
【0103】
減算部6は、イントラ予測部4又は動き補償予測部5から予測画像(P)を受けると、上記実施の形態1と同様に、ブロック分割部2により分割された符号化ブロックBに属するパーティションPから、その予測画像(P)を減算することで、その差分画像を示す予測差分信号eを生成する(ステップST7)。
【0104】
変換・量子化部7は、減算部6が予測差分信号eを生成すると、上記実施の形態1と同様に、符号化制御部1で決定された変換ブロックサイズ単位で、その予測差分信号eに対する変換処理を実施するとともに、その予測差分符号化パラメータに含まれている量子化パラメータを用いて、その予測差分信号eの変換係数を量子化することで、量子化後の変換係数である差分画像の圧縮データを逆量子化・逆変換部8及び可変長符号化部13に出力する(ステップST8)。
即ち、変換・量子化部7は、減算部6が予測差分信号eを生成すると、予測差分信号eの輝度信号に対する変換・量子化処理を実施する場合、ブロック分割部2により分割された符号化ブロックをさらに階層的に分割して、分割後のブロック単位で輝度信号の変換・量子化処理を実施し、予測差分信号eの色差信号に対する変換・量子化処理を実施する場合、ブロック分割部2により分割された符号化ブロックの形状が正方形であれば、その符号化ブロックと同じサイズのブロック単位で色差信号の変換・量子化処理を実施し、その符号化ブロックの形状が長方形であれば、その符号化ブロックを1階層だけ分割して、分割後のブロック単位で色差信号の変換・量子化処理を実施する。
【0105】
逆量子化・逆変換部8は、変換・量子化部7から圧縮データを受けると、上記実施の形態1と同様に、符号化制御部1から出力された予測差分符号化パラメータに含まれている量子化パラメータを用いて、その圧縮データを逆量子化し、その予測差分符号化パラメータに含まれている変換ブロック分割フラグから特定される変換ブロックサイズ単位で、逆量子化の圧縮データの逆変換処理(例えば、逆DCT(逆離散コサイン変換)や逆DST(離散サイン変換)、逆KL変換等の逆変換処理)を実施することで、逆変換処理後の圧縮データを局所復号予測差分信号として加算部9に出力する(ステップST9)。
【0106】
加算部9は、逆量子化・逆変換部8から局所復号予測差分信号を受けると、上記実施の形態1と同様に、その局所復号予測差分信号と、イントラ予測部4又は動き補償予測部5により生成された予測画像(P)を示す予測信号とを加算することで、局所復号パーティション画像ないしはその集まりとしての局所復号符号化ブロック画像(以下、「局所復号画像」と称する)を示す局所復号画像信号を生成し、その局所復号画像信号をループフィルタ部11に出力する(ステップST10)。
また、イントラ予測用メモリ10には、イントラ予測に用いるために、当該局所復号画像が格納される。
【0107】
ループフィルタ部11は、加算部9から局所復号画像信号を受けると、上記実施の形態1と同様に、その局所復号画像信号に含まれている符号化歪みを補償し、符号化歪み補償後の局所復号画像信号が示す局所復号画像を参照画像として動き補償予測フレームメモリ12に格納する(ステップST11)。
なお、ループフィルタ部11によるフィルタリング処理は、入力される局所復号画像信号の最大符号化ブロックあるいは個々の符号化ブロック単位で行ってもよいし、1画面分のマクロブロックに相当する局所復号画像信号が入力された後に1画面分まとめて行ってもよい。
【0108】
ステップST4〜ST10の処理は、ブロック分割部2により分割された全ての符号化ブロックBに属するパーティションPに対する処理が完了するまで繰り返し実施される(ステップST12)。
可変長符号化部13は、上記実施の形態1と同様に、変換・量子化部7から出力された圧縮データと、符号化制御部1から出力された符号化モード及び変換ブロックサイズを示す変換ブロック分割フラグ含む予測差分符号化パラメータと、イントラ予測部4から出力されたイントラ予測パラメータ又は動き補償予測部5から出力されたインター予測パラメータとを可変長符号化して、その圧縮データ、符号化モード、予測差分符号化パラメータ、イントラ予測パラメータ/インター予測パラメータの符号化データが多重化されているビットストリームを生成する(ステップST13)。
なお、色差信号については変換ブロックが1:2の縦長形状となるため、2次元変換係数を1次元系列にスキャンする場合に、係数を縦2個に対して横1個の割合で斜め方向のラスタスキャンあるいは斜め方向のジグザグスキャンし、得られた1次元系列をエントロピー符号化するよう構成する。
【0109】
次に、図7のカラー動画像復号装置の処理内容を説明する。
可変長復号部41は、図1のカラー動画像符号化装置により生成されたビットストリームを入力すると、上記実施の形態1と同様に、そのビットストリームに対する可変長復号処理を実施して(図8のステップST41)、1フレーム以上のピクチャから構成されるシーケンス単位あるいはピクチャ単位にフレームサイズを復号する。
可変長復号部41は、フレームサイズを復号すると、図1のカラー動画像符号化装置で決定された最大符号化ブロックサイズ(イントラ予測処理又は動き補償予測処理が実施される際の処理単位となる符号化ブロックの最大サイズ)と、分割階層数の上限(最大サイズの符号化ブロックから階層的に分割されている符号化ブロックの階層数)をカラー動画像符号化装置と同様の手順で決定する(ステップST42)。
【0110】
例えば、符号化ブロックの最大サイズが、全てのピクチャに対して、入力カラー画像の解像度に応じたサイズに決定されている場合には、先に復号しているフレームサイズに基づいて、図1のカラー動画像符号化装置と同様の手順で、符号化ブロックの最大サイズを決定する。
カラー動画像符号化装置によって、符号化ブロックの最大サイズ及び符号化ブロックの階層数がビットストリームに多重化されている場合には、そのビットストリームから符号化ブロックの最大サイズ及び符号化ブロックの階層数を復号する。
【0111】
可変長復号部41は、符号化ブロックの最大サイズ及び符号化ブロックの階層数を決定すると、最大符号化ブロックを出発点にして、各符号化ブロックの階層的な分割状態を把握することで、ビットストリームに多重化されている符号化データの中で、各符号化ブロックに係る符号化データを特定し、その符号化データから各符号化ブロックに割り当てられている符号化モードを復号する。
そして、可変長復号部41は、その符号化モードに含まれている符号化ブロックBに属するパーティションPの分割情報を参照して、ビットストリームに多重化されている符号化データの中で、各パーティションPに係る符号化データを特定する(ステップST43)。
可変長復号部41は、各パーティションPに係る符号化データから圧縮データ、変換ブロックサイズを示す変換ブロック分割フラグを含む予測差分符号化パラメータ、イントラ予測パラメータ/インター予測パラメータを可変長復号して、その圧縮データ及び予測差分符号化パラメータを逆量子化・逆変換部45に出力するとともに、符号化モード及びイントラ予測パラメータ/インター予測パラメータを切替スイッチ42に出力する(ステップST44)。
なお、色差信号については変換ブロックが1:2の縦長形状となるため、1次元系列となっている復号された変換係数を2次元系列に逆スキャンする場合に、係数を縦2個に対して横1個の割合で斜め方向のラスタスキャンあるいは斜め方向のジグザグスキャンし、得られた2次元系列を変換ブロックの係数とするよう構成する。
【0112】
例えば、予測方向代表インデックスと予測方向差分インデックスがビットストリームに多重化されている場合には、その予測方向代表インデックスと予測方向差分インデックスをそれぞれの確率モデルに応じた算術復号などによりエントロピー復号し、その予測方向代表インデックスと予測方向差分インデックスからイントラ予測パラメータを特定するようにする。
これにより、カラー動画像符号化装置側で、イントラ予測パラメータの符号量を削減している場合でも、イントラ予測パラメータを正しく復号することができる。
【0113】
切替スイッチ42は、上記実施の形態1と同様に、可変長復号部41から出力された符号化ブロックBに属するパーティションPの符号化モードがイントラ符号化モードである場合、可変長復号部41から出力されたイントラ予測パラメータをイントラ予測部43に出力し、その符号化モードがインター符号化モードである場合、可変長復号部41から出力されたインター予測パラメータを動き補償部44に出力する。
【0114】
イントラ予測部43は、可変長復号部41からイントラ予測パラメータを受けると(ステップST45)、図1のイントラ予測部4と同様に、そのイントラ予測パラメータに基づいて、各パーティションPに対するイントラ予測処理を実施することにより、イントラ予測画像(P)を生成する(ステップST46)。
即ち、イントラ予測部43は、可変長復号部41からイントラ予測パラメータを受けると、カラー動画像符号化装置の輝度信号イントラ予測部21と同様に、例えば、パーティションPに対するイントラ予測モードのインデックス値が2(平均値予測)である場合、上パーティションの隣接画素と左パーティションの隣接画素の平均値をパーティションP内の画素の予測値として予測画像を生成する。
あるいは、左に隣接する画素の平均値である左平均値予測値と、上に隣接する画素の平均値である上平均値予測値を個別に算出し、左平均値予測値と上平均値予測値の平均値を平均値予測値としてもよい。
このようにすることで、演算回路において、割り算を用いずシフト演算で処理をすることができるため、回路規模を小さく抑えることができる。
また、左平均値予測値の3倍と上平均値予測値を加算して、2ビット右シフトするよう構成してもよい。
このようにすることで、予測ブロックの形状が縦長なので、より長い辺である左側の画素値により重みを加えた予測値とすることができ、かつ、シフト演算で実現が可能であるため、小さい回路規模で効率のよい予測を行うことができる。
イントラ予測モードのインデックス値が2(平均値予測)以外の場合には、インデックス値が示す予測方向ベクトルv=(dx,dy)に基づいて、パーティションP内の画素の予測値を生成する。
イントラ予測部43は、同様の手順で、パーティションP内の輝度信号のすべての画素に対する予測画素を生成し、その生成したイントラ予測画像(P)を出力する。
【0115】
動き補償部44は、切替スイッチ42からインター予測パラメータを受けると、カラー動画像符号化装置の動き補償予測部5と同様に、そのインター予測パラメータに基づいて、各パーティションPに対するインター予測処理を実施することにより、インター予測画像(P)を生成する(ステップST47)。
即ち、動き補償部44は、動き補償予測フレームメモリ49により格納されている1フレーム以上の参照画像を用いて、そのインター予測パラメータに基づくパーティションPに対する動き補償予測処理を実施することで、インター予測画像(P)を生成する。
【0116】
逆量子化・逆変換部45は、可変長復号部41から変換ブロックサイズを示す変換ブロック分割フラグを含む予測差分符号化パラメータを受けると、その予測差分符号化パラメータに含まれている量子化パラメータを用いて、その変換ブロック分割フラグに従って決定される変換ブロックサイズ毎に可変長復号部41から出力された符号化ブロックに係る圧縮データを逆量子化し、その予測差分符号化パラメータに含まれている変換ブロック分割フラグから特定される変換ブロックサイズ単位で、逆量子化後の圧縮データの逆変換処理(例えば、逆DCT(逆離散コサイン変換)や逆DST(逆離散サイン変換)、逆KL変換等の逆変換処理)を実施することで、逆変換処理後の圧縮データを復号予測差分信号(圧縮前の差分画像を示す信号)として加算部46に出力する(ステップST48)。
【0117】
加算部46は、上記実施の形態1と同様に、逆量子化・逆変換部45から出力された復号予測差分信号と、イントラ予測部43又は動き補償部44により生成された予測画像(P)を示す予測信号とを加算することで、復号パーティション画像ないしはその集まりとしての復号画像を示す復号画像信号を生成し、その復号画像信号をループフィルタ部48に出力する(ステップST49)。
また、イントラ予測用メモリ47には、イントラ予測に用いるために、当該復号画像が格納される。
【0118】
ループフィルタ部48は、加算部46から復号画像信号を受けると、上記実施の形態1と同様に、その復号画像信号に含まれている符号化歪みを補償し、符号化歪み補償後の復号画像信号が示す復号画像を参照画像として動き補償予測フレームメモリ49に格納するとともに、その復号画像を再生画像として出力する(ステップST50)。
なお、ループフィルタ部48によるフィルタリング処理は、入力される復号画像信号の最大符号化ブロックあるいは個々の符号化ブロック単位で行ってもよいし、1画面分のマクロブロックに相当する復号画像信号が入力された後に1画面分まとめて行ってもよい。
ステップST43〜ST49の処理は、全ての符号化ブロックBに属するパーティションPに対する処理が完了するまで繰り返し実施される(ステップST51)。
【0119】
以上で明らかなように、この実施の形態2によれば、映像信号がYUV4:2:2フォーマットであっても、上記実施の形態1と同様に、カラー動画像符号化装置の色差信号における変換ブロックの分割形状が、符号化ブロック及び予測モードに応じて少ない階層数となる分割状態に一意に決定されるため、色差信号を効率よく圧縮することができる。
また、カラー動画像復号装置の色差信号における変換ブロックの分割形状が、符号化ブロック及び予測モードに応じて一意に決定されるので、カラー動画像符号化装置で生成されたビットストリームを好適に復号することができる。
【0120】
実施の形態3.
この実施の形態3では、カラー動画像符号化装置及びカラー動画像復号装置が、YUV4:2:2信号に対して、色差信号の変換ブロックの分割を輝度信号の変換ブロックの分割形状と共通にすることを特徴としている。その他の構成・処理は、上記実施の形態2と同様である。
【0121】
YUV4:2:2画像では、色差成分の画素数が縦方向については輝度成分と同じであるため、YUV4:2:0信号の色差成分と比べて高周波成分の比率が高いという特性がある。従って、YUV4:2:2画像に対しては、変換ブロックの分割形状を輝度成分と色差成分で共通化しても符号化効率が低下しない場合がある。
そこで、この実施の形態3では、YUV4:2:2画像における色差成分の変換ブロックの分割形状を輝度成分と共通化するために、輝度成分のブロックに対して、横方向のみ半分のサイズにした変換ブロックを適用する。
【0122】
即ち、例えば、輝度成分の変換ブロックサイズが縦32×横32画素の場合には、色差成分の変換ブロックサイズを縦32×横16画素、輝度成分の変換ブロックサイズが縦16×横16画素の場合には、色差成分の変換ブロックサイズを縦16×横8画素、輝度成分の変換ブロックサイズが縦8×横8画素の場合には、色差成分の変換ブロックサイズを縦8×横4画素とする。
例えば、輝度成分の変換ブロックサイズの最小値を4画素としている場合には、輝度成分の変換ブロックサイズが縦4×横4画素であれば、それらを4つまとめた縦8画素×横8画素の領域に対応する色差成分に対して、変換ブロックサイズを縦8×横4画素としたものを適用する。
このように構成すれば、YUV4:2:2画像に対して、色差成分のブロック分割形状の情報を符号化しなくても、効率よく符号化することができる。
【0123】
なお、本願発明はその発明の範囲内において、各実施の形態の自由な組み合わせ、あるいは各実施の形態の任意の構成要素の変形、もしくは各実施の形態において任意の構成要素の省略が可能である。
【符号の説明】
【0124】
1 符号化制御部(符号化制御手段)、2 ブロック分割部(ブロック分割手段)、3 切替スイッチ(予測画像生成手段)、4 イントラ予測部(予測画像生成手段)、5 動き補償予測部(予測画像生成手段)、6 減算部(差分画像生成手段)、7 変換・量子化部(画像圧縮手段)、8 逆量子化・逆変換部、9 加算部、10 イントラ予測用メモリ、11 ループフィルタ部、12 動き補償予測フレームメモリ、13 可変長符号化部(可変長符号化手段)、21 輝度信号イントラ予測部、22 切替スイッチ、23 色差信号方向性イントラ予測部、24 輝度相関利用色差信号予測部、31 平滑化輝度参照画素縮小部、32 相関算出部、33 色差予測画像生成部、41 可変長復号部(可変長復号手段)、42 切替スイッチ(予測画像生成手段)、43 イントラ予測部(予測画像生成手段)、44 動き補償部(予測画像生成手段)、45 逆量子化・逆変換部(差分画像生成手段)、46 加算部(復号画像生成手段)、47 イントラ予測用メモリ、48 ループフィルタ部、49 動き補償予測フレームメモリ。

【特許請求の範囲】
【請求項1】
入力カラー画像を所定のサイズの最大符号化ブロックに分割し、上記最大符号化ブロックを階層的に符号化ブロックに分割するブロック分割手段と、上記ブロック分割手段により分割された符号化ブロックに対応する符号化モードを選択する符号化制御手段と、上記ブロック分割手段により分割された符号化ブロックに対して、上記符号化制御手段により選択された符号化モードに対応する予測処理を実施して予測画像を生成する予測画像生成手段と、上記ブロック分割手段により分割された符号化ブロックと上記予測画像生成手段により生成された予測画像との差分画像を生成する差分画像生成手段と、上記差分画像生成手段により生成された差分画像を圧縮し、上記差分画像の圧縮データを出力する画像圧縮手段と、上記画像圧縮手段から出力された圧縮データ及び上記符号化制御手段により選択された符号化モードを可変長符号化して、上記圧縮データ及び上記符号化モードの符号化データが多重化されたビットストリームを生成する可変長符号化手段とを備え、
上記画像圧縮手段は、上記差分画像生成手段により生成された差分画像の輝度信号を圧縮する場合、上記ブロック分割手段により分割された符号化ブロックをさらに階層的に分割して、分割後のブロック単位で輝度信号の圧縮処理を実施し、上記差分画像生成手段により生成された差分画像の色差信号を圧縮する場合、上記ブロック分割手段により分割された符号化ブロックの形状が正方形であれば、上記符号化ブロックと同じサイズのブロック単位で色差信号の圧縮処理を実施し、上記符号化ブロックの形状が長方形であれば、上記符号化ブロックを1階層だけ分割して、分割後のブロック単位で色差信号の圧縮処理を実施し、
上記可変長符号化手段は、上記画像圧縮手段による輝度信号に係るブロックの分割情報を可変長符号化して、上記分割情報の符号化データをビットストリームに多重化することを特徴とするカラー動画像符号化装置。
【請求項2】
ビットストリームに多重化された符号化データから階層的に分割されている各々の符号化ブロックに係る圧縮データ及び符号化モードを可変長復号する可変長復号手段と、上記可変長復号手段により可変長復号された符号化ブロックに係る符号化モードに対応する予測処理を実施して、当該符号化ブロックに対する予測画像を生成する予測画像生成手段と、上記可変長復号手段により可変長復号された符号化ブロックに係る圧縮データから圧縮前の差分画像を生成する差分画像生成手段と、上記差分画像生成手段により生成された差分画像と上記予測画像生成手段により生成された予測画像とを加算して復号画像を生成する復号画像生成手段とを備え、
上記可変長復号手段は、上記ビットストリームに多重化された符号化データから輝度信号に係るブロックの分割情報を可変長復号し、
上記差分画像生成手段は、上記可変長復号手段により可変長復号された分割情報から差分画像における輝度信号及び色差信号に対する圧縮処理単位のブロックを特定し、上記ブロック単位で圧縮の解除処理を実施して、圧縮前の差分画像における輝度信号及び色差信号を復号するカラー動画像復号装置。
【請求項3】
ブロック分割手段が、入力カラー画像を所定のサイズの最大符号化ブロックに分割し、上記最大符号化ブロックを階層的に符号化ブロックに分割するブロック分割処理ステップと、符号化制御手段が、上記ブロック分割処理ステップで分割された符号化ブロックに対応する符号化モードを選択する符号化制御処理ステップと、予測画像生成手段が、上記ブロック分割処理ステップで分割された符号化ブロックに対して、上記符号化制御処理ステップで選択された符号化モードに対応する予測処理を実施して予測画像を生成する予測画像生成処理ステップと、差分画像生成手段が、上記ブロック分割処理ステップで分割された符号化ブロックと上記予測画像生成処理ステップで生成された予測画像との差分画像を生成する差分画像生成処理ステップと、画像圧縮手段が、上記差分画像生成処理ステップで生成された差分画像を圧縮し、上記差分画像の圧縮データを出力する画像圧縮処理ステップと、可変長符号化手段が、上記画像圧縮処理ステップで出力された圧縮データ及び上記符号化制御処理ステップで選択された符号化モードを可変長符号化して、上記圧縮データ及び上記符号化モードの符号化データが多重化されたビットストリームを生成する可変長符号化処理ステップとを備え、
上記画像圧縮処理ステップでは、上記差分画像生成処理ステップで生成された差分画像の輝度信号を圧縮する場合、上記ブロック分割処理ステップで分割された符号化ブロックをさらに階層的に分割して、分割後のブロック単位で輝度信号の圧縮処理を実施し、上記差分画像生成処理ステップで生成された差分画像の色差信号を圧縮する場合、上記ブロック分割処理ステップで分割された符号化ブロックの形状が正方形であれば、上記符号化ブロックと同じサイズのブロック単位で色差信号の圧縮処理を実施し、上記符号化ブロックの形状が長方形であれば、上記符号化ブロックを1階層だけ分割して、分割後のブロック単位で色差信号の圧縮処理を実施し、
上記可変長符号化処理ステップでは、上記画像圧縮処理ステップによる輝度信号に係るブロックの分割情報を可変長符号化して、上記分割情報の符号化データをビットストリームに多重化することを特徴とするカラー動画像符号化方法。
【請求項4】
可変長復号手段が、ビットストリームに多重化された符号化データから階層的に分割されている各々の符号化ブロックに係る圧縮データ及び符号化モードを可変長復号する可変長復号処理ステップと、予測画像生成手段が、上記可変長復号処理ステップで可変長復号された符号化ブロックに係る符号化モードに対応する予測処理を実施して、当該符号化ブロックに対する予測画像を生成する予測画像生成処理ステップと、差分画像生成手段が、上記可変長復号処理ステップで可変長復号された符号化ブロックに係る圧縮データから圧縮前の差分画像を生成する差分画像生成処理ステップと、復号画像生成手段が、上記差分画像生成処理ステップで生成された差分画像と上記予測画像生成処理ステップで生成された予測画像とを加算して復号画像を生成する復号画像生成処理ステップとを備え、
上記可変長復号処理ステップでは、上記ビットストリームに多重化された符号化データから輝度信号に係るブロックの分割情報を可変長復号し、
上記差分画像生成処理ステップでは、上記可変長復号処理ステップで可変長復号された分割情報から差分画像における輝度信号及び色差信号に対する圧縮処理単位のブロックを特定し、上記ブロック単位で圧縮の解除処理を実施して、圧縮前の差分画像における輝度信号及び色差信号を復号するカラー動画像復号方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate


【公開番号】特開2013−102269(P2013−102269A)
【公開日】平成25年5月23日(2013.5.23)
【国際特許分類】
【出願番号】特願2011−243546(P2011−243546)
【出願日】平成23年11月7日(2011.11.7)
【出願人】(000006013)三菱電機株式会社 (33,312)
【Fターム(参考)】