動画像符号化装置、動画像符号化方法及び動画像符号化プログラム

【課題】動き補償でブロック毎に参照する動き情報の候補の数が従来は固定されていたため、符号化効率が上がらないことがあった。
【解決手段】インター予測情報導出部１０４は、符号化対象の予測ブロックに隣接する予測ブロック、または符号化対象の予測ブロックと時間的に異なる符号化済みのピクチャにおける符号化対象の予測ブロックと同一位置あるいはその付近に存在する予測ブロックのインター予測情報から、インター予測情報の候補を導出する。マージ候補数制限部１３５は、処理機能の集合を示すプロファイルおよびデコード処理能力を示すレベルの少なくとも一方に応じてインター予測情報の候補の候補数を制限する。動き補償予測部１０５は、候補数の制限されたインター予測情報の候補から１つのインター予測情報の候補を選択して、その選択したインター予測情報の候補により符号化対象の予測ブロックのインター予測を行う。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、動画像符号化技術に関し、特に動き補償予測を利用した動画像符号化技術に関する。
【背景技術】
【０００２】
動画像の圧縮符号化方式の代表的なものとして、ＭＰＥＧ−４ＡＶＣ／Ｈ．２６４の規格がある。ＭＰＥＧ−４ＡＶＣ／Ｈ．２６４では、ピクチャを複数の矩形ブロックに分割し、すでに符号化・復号したピクチャを参照ピクチャとし、参照ピクチャからの動きを予測する動き補償が用いられている。この動き補償により動きを予測する手法をインター予測または動き補償予測と呼ぶ。ＭＰＥＧ−４ＡＶＣ／Ｈ．２６４でのインター予測では、複数のピクチャを参照ピクチャとして用いることができ、これらの複数の参照ピクチャから最も適した参照ピクチャをブロック毎に選択して動き補償を行う。そこで、それぞれの参照ピクチャには参照インデックスが割り当てられ、この参照インデックスにより、参照ピクチャを特定する。なお、Ｂピクチャでは、符号化・復号済みの参照ピクチャから最大で２枚を選択してインター予測に用いることができる。それらの２枚の参照ピクチャからの予測をそれぞれ主に前方向の予測として使われるＬ０予測（リスト０予測）、主に後方向の予測として使われるＬ１予測（リスト１予測）として区別している。
【０００３】
さらに、Ｌ０予測とＬ１予測の２つのインター予測を同時に用いる双予測も定義されている。双予測の場合は、双方向の予測を行い、Ｌ０予測、Ｌ１予測のそれぞれのインター予測された信号に重み付け係数を掛け算し、オフセット値を加算して重畳し、最終的なインター予測画像信号を生成する。重み付け予測に用いる重み付け係数及びオフセット値はピクチャ単位で各リストの参照ピクチャ毎に代表的な値が設定され、符号化される。インター予測に関する符号化情報には、ブロック毎に、Ｌ０予測とＬ１予測、双予測を区別する予測モード、ブロック毎の参照リスト毎に、参照ピクチャを特定する参照インデックス、ブロックの移動方向・移動量を表す動きベクトルがあり、これらの符号化情報を符号化・復号する。
【０００４】
さらに、ＭＰＥＧ−４ＡＶＣ／Ｈ．２６４では、符号化／復号済みのブロックのインター予測情報から符号化／復号対象のブロックのインター予測情報を生成するダイレクトモードが定義されている。ダイレクトモードはインター予測情報の符号化が不要となるので、符号化効率が向上する。
【０００５】
時間方向のインター予測情報の相関を利用する時間ダイレクトモードについて図２９を用いて説明する。Ｌ１の参照インデックスが０に登録されているピクチャを基準ピクチャcolPicとする。基準ピクチャcolPic内で符号化／復号対象ブロックと同じ位置のブロックを基準ブロックとする。
【０００６】
基準ブロックがＬ０予測を用いて符号化されていれば、基準ブロックのＬ０の動きベクトルを基準動きベクトルmvColとし、基準ブロックがＬ０予測を用いて符号化されておらず、Ｌ１予測を用いて符号化されていれば、基準ブロックのＬ１の動きベクトルを基準動きベクトルmvColとする。基準動きベクトルmvColが参照するピクチャを時間ダイレクトモードのＬ０の参照ピクチャとし、基準ピクチャcolPicを時間ダイレクトモードのＬ１の参照ピクチャとする。
【０００７】
基準動きベクトルmvColからスケーリング演算処理により時間ダイレクトモードのＬ０の動きベクトルmvL0とＬ１の動きベクトルmvL1を導出する。
【０００８】
基準ピクチャcolPicのＰＯＣから、時間ダイレクトモードのＬ０の参照ピクチャのＰＯＣを減算してピクチャ間距離ｔｄを導出する。なお、ＰＯＣは符号化されるピクチャに関連付けられる変数とし、ピクチャの出力／表示順序で１ずつ増加する値が設定される。２つのピクチャのＰＯＣの差が時間軸方向でのピクチャ間距離を示す。
ｔｄ＝基準ピクチャcolPicのＰＯＣ−時間ダイレクトモードのＬ０の参照ピクチャのＰＯＣ
【０００９】
符号化／復号対象ピクチャのＰＯＣから時間ダイレクトモードのＬ０の参照ピクチャのＰＯＣを減算してピクチャ間距離ｔｂを導出する。
ｔｂ＝符号化／復号対象ピクチャのＰＯＣ−時間ダイレクトモードのＬ０の参照ピクチャのＰＯＣ
【００１０】
基準動きベクトルmvColからスケーリング演算処理により時間ダイレクトモードのＬ０の動きベクトルmvL0を導出する。
mvL0＝ｔｂ / ｔｄ * mvCol
【００１１】
時間ダイレクトモードのＬ０の動きベクトルmvL0から基準動きベクトルmvColを減算しＬ１の動きベクトルmvL1を導出する。
mvL1＝mvL0 - mvCol
【先行技術文献】
【特許文献】
【００１２】
【特許文献１】特開２００４−１２９１９１号公報
【発明の概要】
【発明が解決しようとする課題】
【００１３】
従来の方法では、動き補償でブロック毎に参照する動き情報の候補の数が従来は固定されていたため、符号化効率が上がらないことがあった。
【００１４】
このような状況下、本発明者らは、動き補償予測を使用する動画像符号化方式において、符号化情報をより一層圧縮し、全体の符号量を削減する必要性を認識するに至った。
【００１５】
本発明はこうした状況に鑑みてなされたものであり、その目的は、符号化情報の候補を算出することにより、符号化情報の符号量の削減を図って符号化効率を向上させる動画像符号化技術を提供することにある。
【課題を解決するための手段】
【００１６】
上記課題を解決するために、本発明のある態様の動画像符号化装置は、動画像の各ピクチャを分割したブロック単位で動き補償予測を用いて前記動画像を符号化する動画像符号化装置であって、符号化対象の予測ブロックに隣接する予測ブロック、または符号化対象の予測ブロックと時間的に異なる符号化済みのピクチャにおける前記符号化対象の予測ブロックと同一位置あるいはその付近に存在する予測ブロックのインター予測情報から、インター予測情報の候補を導出する予測情報導出部（１０４）と、処理機能の集合を示すプロファイルおよびデコード処理能力を示すレベルの少なくとも一方に応じて前記インター予測情報の候補の候補数を制限する候補数制限部（１３５）と、候補数の制限された前記インター予測情報の候補から１つのインター予測情報の候補を選択して、その選択したインター予測情報の候補により前記符号化対象の予測ブロックのインター予測を行う動き補償予測部（１０５）とを備える。
【００１７】
本発明の別の態様もまた、動画像符号化装置である。この装置は、動画像の各ピクチャを分割したブロック単位で動き補償予測を用いて前記動画像を符号化する動画像符号化装置であって、符号化対象の予測ブロックに隣接する予測ブロック、または符号化対象の予測ブロックと時間的に異なる符号化済みのピクチャにおける前記符号化対象の予測ブロックと同一位置あるいはその付近に存在する予測ブロックのインター予測情報から、インター予測情報の候補を導出する予測情報導出部（１０４）と、スライスタイプに応じて前記インター予測情報の候補の候補数を制限する候補数制限部（１３５）と、候補数の制限された前記インター予測情報の候補から１つのインター予測情報の候補を選択して、その選択したインター予測情報の候補により前記符号化対象の予測ブロックのインター予測を行う動き補償予測部（１０５）とを備える。
【００１８】
本発明のさらに別の態様は、動画像符号化方法である。この方法は、動画像の各ピクチャを分割したブロック単位で動き補償予測を用いて前記動画像を符号化する動画像符号化方法であって、符号化対象の予測ブロックに隣接する予測ブロック、または符号化対象の予測ブロックと時間的に異なる符号化済みのピクチャにおける前記符号化対象の予測ブロックと同一位置あるいはその付近に存在する予測ブロックのインター予測情報から、インター予測情報の候補を導出する予測情報導出ステップと、処理機能の集合を示すプロファイルおよびデコード処理能力を示すレベルの少なくとも一方に応じて前記インター予測情報の候補の候補数を制限する候補数制限ステップと、候補数の制限された前記インター予測情報の候補から１つのインター予測情報の候補を選択して、その選択したインター予測情報の候補により前記符号化対象の予測ブロックのインター予測を行う動き補償予測ステップとを備える。
【００１９】
本発明のさらに別の態様もまた、動画像符号化方法である。この方法は、動画像の各ピクチャを分割したブロック単位で動き補償予測を用いて前記動画像を符号化する動画像符号化方法であって、符号化対象の予測ブロックに隣接する予測ブロック、または符号化対象の予測ブロックと時間的に異なる符号化済みのピクチャにおける前記符号化対象の予測ブロックと同一位置あるいはその付近に存在する予測ブロックのインター予測情報から、インター予測情報の候補を導出する予測情報導出ステップと、スライスタイプに応じて前記インター予測情報の候補の候補数を制限する候補数制限ステップと、候補数の制限された前記インター予測情報の候補から１つのインター予測情報の候補を選択して、その選択したインター予測情報の候補により前記符号化対象の予測ブロックのインター予測を行う動き補償予測ステップとを備える。
【００２０】
なお、以上の構成要素の任意の組合せ、本発明の表現を方法、装置、システム、記録媒体、コンピュータプログラムなどの間で変換したものもまた、本発明の態様として有効である。
【発明の効果】
【００２１】
本発明によれば、伝送する符号化情報の発生符号量を削減させて、符号化効率を向上させることができる。
【図面の簡単な説明】
【００２２】
【図１】実施の形態に係る動きベクトルの予測方法を実行する動画像符号化装置の構成を示すブロック図である。
【図２】実施の形態に係る動きベクトルの予測方法を実行する動画像復号装置の構成を示すブロック図である。
【図３】ツリーブロック、符号化ブロックを説明する図である。
【図４】予測ブロックの分割モードを説明する図である。
【図５】マージモードでの空間マージ候補の予測ブロックを説明する図である。
【図６】マージモードでの空間マージ候補の予測ブロックを説明する図である。
【図７】マージモードでの空間マージ候補の予測ブロックを説明する図である。
【図８】マージモードでの空間マージ候補の予測ブロックを説明する図である。
【図９】マージモードでの時間マージ候補の予測ブロックを説明する図である。
【図１０】マージモードに関する予測ブロック単位でのビットストリームのシンタックスを説明する図である。
【図１１】マージインデックスのシンタックス要素のエントロピー符号の一例を説明する図である。
【図１２】図１の動画像符号化装置のインター予測情報導出部の詳細な構成を示すブロック図である。
【図１３】図２の動画像復号装置のインター予測情報導出部の詳細な構成を示すブロック図である。
【図１４】マージモードのマージ候補の導出処理及びマージ候補リストの構築処理野手順を説明するフローチャートである。
【図１５】マージモードの空間マージ候補導出処理手順を説明するフローチャートである。
【図１６】マージモードの時間マージ候補の参照インデックスの導出処理手順を説明するフローチャートである。
【図１７】マージモードの時間マージ候補導出処理手順を説明するフローチャートである。
【図１８】マージモードの異なる時間のピクチャの導出処理手順を説明するフローチャートである。
【図１９】マージモードの異なる時間のピクチャの予測ブロックの導出処理手順を説明するフローチャートである。
【図２０】マージモードの時間マージ候補導出処理手順を説明するフローチャートである。
【図２１】マージモードの時間マージ候補導出処理手順を説明するフローチャートである。
【図２２】動きベクトルのスケーリング演算処理手順を説明するフローチャートである。
【図２３】動きベクトルのスケーリング演算処理手順を説明するフローチャートである。
【図２４】マージモードのマージ候補リストへのマージ候補の登録処理手順を説明するフローチャートである。
【図２５】実施例１の方法による符号化側および復号側で共通の最終マージ候補数finalNumMergeCandの設定処理手順を説明するフローチャートである。
【図２６】マージモードに関するスライスヘッダのビットストリームのシンタックスを説明する図である。
【図２７】実施例２の方法による符号化側での最終マージ候補数finalNumMergeCandの設定処理手順を説明するフローチャートである。
【図２８】実施例２の方法による復号側での最終マージ候補数finalNumMergeCandの設定処理手順を説明するフローチャートである。
【図２９】従来のＭＰＥＧ−４ＡＶＣ／Ｈ．２６４の時間ダイレクトモードを説明する図である。
【発明を実施するための形態】
【００２３】
本実施の形態では、動画像の符号化に関し、特にピクチャを任意のサイズ、形状の矩形ブロックに分割し、ピクチャ間でブロック単位に動き補償を行う動画像符号化における符号化効率を向上させる為に、符号化対象ブロックに隣接するブロックまたは符号化済みのピクチャのブロックの動きベクトルから複数の予測動きベクトルを導出し、符号化対象のブロックの動きベクトルと選択された予測動きベクトルとの差分ベクトルを算出して符号化することによって符号量を削減する。あるいは、符号化対象ブロックに隣接するブロックまたは符号化済みのピクチャのブロックの符号化情報を利用することにより、符号化対象ブロックの符号化情報を導出することによって符号量を削減する。また、動画像の復号の場合は、復号対象ブロックに隣接するブロックまたは復号済みのピクチャのブロックの動きベクトルから複数の予測動きベクトルを算出し、符号化ストリームから復号された差分ベクトルと選択された予測動きベクトルとから復号対象のブロックの動きベクトルを算出して復号する。あるいは、復号対象ブロックに隣接するブロックまたは復号済みのピクチャのブロックの符号化情報を利用することにより、復号対象ブロックの符号化情報を導出する。
【００２４】
まず、本実施の形態において使用する技術、及び技術用語を定義する。
【００２５】
（ツリーブロック、符号化ブロックについて）
実施の形態では、ピクチャを１つまたは複数分割したスライスが符号化の基本単位となっており、スライス毎にスライスの種類を示す情報であるスライスタイプが設定される。図３に示されるように、スライス内を任意の同一サイズの正方の矩形の単位にて均等分割する。この単位をツリーブロックと定義し、スライス内での符号化／復号対象ブロック（符号化処理においては符号化対象ブロック、復号処理においては復号対象ブロックのことである。以下、断りのない限り、この意味で用いる。）を特定するためのアドレス管理の基本単位とする。モノクロを除きツリーブロックは１つの輝度信号と２つの色差信号で構成される。ツリーブロックのサイズはピクチャサイズやピクチャ内のテクスチャに応じて、２のべき乗のサイズで自由に設定することができる。ツリーブロックはピクチャ内のテクスチャに応じて、符号化処理を最適にすべく、必要に応じてツリーブロック内の輝度信号、及び色差信号を階層的に４分割（縦横に２分割ずつ）して、ブロックサイズの小さいブロックにすることができる。このブロックをそれぞれ符号化ブロックと定義し、符号化及び復号を行う際の処理の基本単位とする。モノクロを除き符号化ブロックも１つの輝度信号と２つの色差信号で構成される。符号化ブロックの最大サイズはツリーブロックのサイズと同一である。符号化ブロックの最小のサイズとなる符号化ブロックを最小符号化ブロックと呼び、２のべき乗のサイズで自由に設定することができる。
【００２６】
図３においては、符号化ブロックＡは、ツリーブロックを分割せず、１つの符号化ブロックとしたものである。符号化ブロックＢは、ツリーブロックを４分割してできた符号化ブロックである。符号化ブロックＣは、ツリーブロックを４分割してできたブロックをさらに４分割してできた符号化ブロックである。符号化ブロックＤは、ツリーブロックを４分割してできたブロックをさらに階層的に２度４分割してできた符号化ブロックであり、最小サイズの符号化ブロックである。
【００２７】
（予測モードについて）
符号化ブロック単位で、符号化／復号済み（符号化処理においては符号化した信号を復号したピクチャ、予測ブロック、画像信号等に用い、復号処理においては復号したピクチャ、予測ブロック、画像信号等に用いる。以下、断りのない限り、この意味で用いる。）の周囲の画像信号から予測を行うイントラ予測（MODE_INTRA）、及び符号化／復号済みのピクチャの画像信号から予測を行うインター予測（MODE_INTER）を切り替える。このイントラ予測（MODE_INTRA）とインター予測（MODE_INTER）を識別するモードを予測モード（PredMode）と定義する。予測モード（PredMode）はイントラ予測（MODE_INTRA）、またはインター予測（MODE_INTER）を値として持ち、選択して符号化できる。
【００２８】
（分割モード、予測ブロック、予測ユニットについて）
ピクチャ内をブロックに分割してイントラ予測（MODE_INTRA）及びインター予測（MODE_INTER）を行う場合、イントラ予測及びインター予測の方法を切り替える単位をより小さくするために、必要に応じて符号化ブロックを分割して予測を行う。この符号化ブロックの輝度信号と色差信号の分割方法を識別するモードを分割モード（PartMode）と定義する。さらに、この分割されたブロックを予測ブロックと定義する。図４に示すように、符号化ブロックの輝度信号の分割方法に応じて４種類の分割モード（PartMode）を定義する。
符号化ブロックの輝度信号を分割せず１つの予測ブロックとみなしたもの（図４（ａ））の分割モード（PartMode）を２Ｎ×２Ｎ分割（PART_2Nx2N）、符号化ブロックの輝度信号を水平方向に２分割し、２つの予測ブロックとしたもの（図４（ｂ））の分割モード（PartMode）を２Ｎ×Ｎ分割（PART_2NxN）、符号化ブロックの輝度信号を垂直方向に分割し、符号化ブロックを２つの予測ブロックとしたもの（図４（ｃ））の分割モード（PartMode）をＮ×２Ｎ分割（PART_Nx2N）、符号化ブロックの輝度信号を水平と垂直の均等分割により４つの予測ブロックとしたもの（図４（ｄ））の分割モード（PartMode）をＮ×Ｎ分割（PART_NxN）とそれぞれ定義する。なお、イントラ予測（MODE_INTRA）のＮ×Ｎ分割（PART_NxN）を除き、各分割モード（PartMode）毎に輝度信号の縦横の分割比率と同様に色差信号も分割する。
【００２９】
符号化ブロック内部において、各予測ブロックを特定する為に、０から開始する番号を、符号化順序で、符号化ブロック内部に存在する予測ブロックに対して割り当てる。この番号を分割インデックスPartIdxと定義する。図４の符号化ブロックの各予測ブロックの中に記述された数字は、その予測ブロックの分割インデックスPartIdxを表す。図４（ｂ）に示す２Ｎ×Ｎ分割（PART_2NxN）では上の予測ブロックの分割インデックスPartIdxを０とし、下の予測ブロックの分割インデックスPartIdxを１とする。図４（ｃ）に示すＮ×２Ｎ分割（PART_Nx2N）では左の予測ブロックの分割インデックスPartIdxを０とし、右の予測ブロックの分割インデックスPartIdxを１とする。図４（ｄ）に示すＮ×Ｎ分割（PART_NxN）では、左上の予測ブロックの分割インデックスPartIdxを０とし、右上の予測ブロックの分割インデックスPartIdxを１とし、左下の予測ブロックの分割インデックスPartIdxを２とし、右下の予測ブロックの分割インデックスPartIdxを３とする。
【００３０】
予測モード（PredMode）がインター予測（MODE_INTER）では、最小の符号化ブロックである符号化ブロックＤ以外では、分割モード（PartMode）は２Ｎ×２Ｎ分割（PART_2Nx2N）、２Ｎ×Ｎ分割（PART_2NxN）、及びＮ×２Ｎ分割（PART_Nx2N）を定義し、最小の符号化ブロックである符号化ブロックＤのみ、分割モード（PartMode）は２Ｎ×２Ｎ分割（PART_2Nx2N）、２Ｎ×Ｎ分割（PART_2NxN）、及びＮ×２Ｎ分割（PART_Nx2N）に加えてＮ×Ｎ分割（PART_NxN）を定義する。なお、最小の符号化ブロック以外にＮ×Ｎ分割（PART_NxN）を定義しない理由は最小の符号化ブロック以外では、符号化ブロックを４分割して小さな符号化ブロックを表現できるからである。
【００３１】
（ツリーブロック、符号化ブロック、予測ブロック、変換ブロックの位置）
本実施の形態のツリーブロック、符号化ブロック、予測ブロック、変換ブロックを始めとする各ブロックの位置は、輝度信号の画面の一番左上の輝度信号の画素の位置を原点（０，０）とし、それぞれのブロックの領域に含まれる一番左上の輝度信号の画素の位置を（ｘ，ｙ）の二次元座標で表す。座標軸の向きは水平方向に右の方向、垂直方向に下の方向をそれぞれ正の向きとし、単位は輝度信号の１画素単位である。輝度信号と色差信号で画像サイズ（画素数）が同じである色差フォーマットが４：４：４の場合ではもちろんのこと、輝度信号と色差信号で画像サイズ（画素数）が異なる色差フォーマットが４：２：０、４：２：２の場合でも色差信号の各ブロックの位置をそのブロックの領域に含まれる輝度信号の画素の座標で表し、単位は輝度信号の１画素である。この様にすることで、色差信号の各ブロックの位置が特定できるのはもちろんのこと、座標の値を比較するだけで、輝度信号のブロックと色差信号のブロックの位置の関係も明確となる。
【００３２】
（インター予測モード、参照リストについて）
本発明の実施の形態においては、符号化／復号済みのピクチャの画像信号から予測を行うインター予測では、複数の復号済みのピクチャを参照ピクチャとして用いることができる。複数の参照ピクチャから選択された参照ピクチャを特定するため、予測ブロック毎に参照インデックスを付ける。予測ブロック毎に任意の２枚の参照ピクチャを選択してインター予測ことができ、インター予測モードとしてＬ０予測（Pred_L0）、Ｌ１予測（Pred_L1）、双予測（Pred_BI）がある。参照ピクチャはリスト構造のＬ０（参照リスト０）とＬ１（参照リスト１）で管理され、Ｌ０またはＬ１の参照インデックスを指定することにより参照ピクチャを特定することができる。Ｌ０予測（Pred_L0）はＬ０で管理されている参照ピクチャを参照するインター予測であり、Ｌ１予測（Pred_L1）はＬ１で管理されている参照ピクチャを参照するインター予測であり、双予測（Pred_BI）はＬ０予測とＬ１予測が共に行われ、Ｌ０とＬ１のそれぞれで管理されている１つずつの参照ピクチャを参照するインター予測である。スライスタイプがＰスライスのインター予測ではＬ０予測のみが利用でき、スライスタイプがＢスライスのインター予測ではＬ０予測、Ｌ１予測、Ｌ０予測とＬ１予測を平均または重み付け加算する双予測（Pred_BI）が利用できる。以降の処理において出力に添え字ＬＸが付いている定数、変数に関しては、Ｌ０、Ｌ１ごとに処理が行われることを前提とする。
【００３３】
（マージモード、マージ候補）
マージモードとは、符号化／復号対象の予測ブロックの予測モード、参照インデックス、動きベクトル等のインター予測情報を符号化／復号するのではなく、符号化／復号対象の予測ブロックと同一ピクチャ内でその符号化／復号対象の予測ブロックに隣接する予測ブロック、あるいは符号化／復号対象の予測ブロックと時間的に異なる符号化／復号済みのピクチャの符号化／復号対象の予測ブロックと同一位置あるいはその付近（近傍の位置）に存在する予測ブロックのインター予測情報から符号化／復号対象の予測ブロックのインター予測情報を導出することによりインター予測を行うモードである。符号化／復号対象の予測ブロックと同一ピクチャ内でその符号化／復号対象の予測ブロックに隣接する予測ブロック及びその予測ブロックのインター予測情報を空間マージ候補、符号化／復号対象の予測ブロックと時間的に異なる符号化／復号済みのピクチャの符号化／復号対象の予測ブロックと同一位置あるいはその付近（近傍の位置）に存在する予測ブロック及びその予測ブロックのインター予測情報から導出されるインター予測情報を時間マージ候補とする。それぞれのマージ候補はマージ候補リストに登録され、マージインデックスによりインター予測で用いるマージ候補を特定する。
【００３４】
（隣接する予測ブロックについて）
図５、図６、図７及び図８は符号化／復号対象の予測ブロックと同一ピクチャ内でその符号化／復号対象の予測ブロックに隣接する予測ブロックを説明する図である。図９は符号化／復号対象の予測ブロックと時間的に異なる符号化／復号済みのピクチャにおいて、符号化／復号対象の予測ブロックと同一位置あるいはその付近に存在する既に符号化／復号済みの予測ブロックを説明する図である。図５、図６、図７、図８及び図９を用いて符号化／復号対象の予測ブロックの空間方向に隣接する予測ブロック、及び異なる時間の同一位置の予測ブロックについて説明する。
【００３５】
図５に示すように、符号化／復号対象の予測ブロックと同一ピクチャ内でその符号化／復号対象の予測ブロックの左側の辺に隣接する予測ブロックＡ、上側の辺に隣接する予測ブロックＢ、右上の頂点に隣接する予測ブロックＣ、左下の頂点に隣接する予測ブロックＤ、および左上の頂点に隣接する予測ブロックＥを空間方向に隣接する予測ブロックと定義する。
【００３６】
なお、図６に示すように、符号化／復号対象の予測ブロックの左側の辺に隣接する予測ブロックのサイズが符号化／復号対象の予測ブロックより小さく、複数存在する場合には、本実施の形態においては左側の辺に隣接する予測ブロックの中で最も下の予測ブロックＡ１０だけを左側の辺に隣接する予測ブロックＡとする。
【００３７】
同様に、符号化／復号対象の予測ブロックの上側の辺に隣接する予測ブロックのサイズが符号化／復号対象の予測ブロックより小さく、複数存在する場合には、本実施の形態においては左側の辺に隣接する予測ブロックの中で最も右の予測ブロックＢ１０だけを上側の辺に隣接する予測ブロックＢ１とする。
【００３８】
なお、図７に示すように、符号化／復号対象の予測ブロックの左側に隣接する予測ブロックＦのサイズが符号化／復号対象の予測ブロックより大きい場合にも、前記条件に従い、左側に隣接する予測ブロックＦがその符号化／復号対象の予測ブロックの左側の辺に隣接していれば予測ブロックＡとし、符号化／復号対象の予測ブロックの左下の頂点に隣接していれば予測ブロックＤとし、符号化／復号対象の予測ブロックの左上の頂点に隣接していれば予測ブロックＥとする。図６の例では、予測ブロックＡ、予測ブロックＥ及び予測ブロックＥは同一の予測ブロックとなる。
【００３９】
なお、図８に示すように、符号化／復号対象の予測ブロックの上側に隣接する予測ブロックＧのサイズが符号化／復号対象の予測ブロックより大きい場合にも、前記条件に従い、上側に隣接する予測ブロックＧがその符号化／復号対象の予測ブロックの上側の辺に隣接していれば予測ブロックＢとし、符号化／復号対象の予測ブロックの右上の頂点に隣接していれば予測ブロックＣとし、符号化／復号対象の予測ブロックの左上の頂点に隣接していれば予測ブロックＥとする。図８の例では、予測ブロックＢ、予測ブロックＣ及び予測ブロックＥは同一の予測ブロックとなる。
【００４０】
図９に示すように、符号化／復号対象の予測ブロックと時間的に異なる符号化／復号済みのピクチャにおいて、符号化／復号対象の予測ブロックと同一位置あるいはその付近に存在する既に符号化／復号済みの予測ブロックＴ０およびＴ１を異なる時間の同一位置の予測ブロックと定義する。
【００４１】
（ＰＯＣについて）
ＰＯＣは符号化されるピクチャに関連付けられる変数とし、ピクチャの出力／表示順序で１ずつ増加する値が設定される。ＰＯＣの値によって、同じピクチャであるかを判別したり、出力／表示順序でのピクチャ間の前後関係を判別したり、ピクチャ間の距離を導出したりすることができる。例えば、２つのピクチャのＰＯＣが同じ値を持つ場合、同一のピクチャであると判断できる。２つのピクチャのＰＯＣが違う値を持つ場合、ＰＯＣの値が小さいピクチャのほうが、先に出力／表示されるピクチャであると判断でき、２つのピクチャのＰＯＣの差が時間軸方向でのピクチャ間距離を示す。
【００４２】
以下、図面と共に本発明の実施の形態を説明する。図１は本発明の実施の形態に係る動画像符号化装置の構成を示すブロック図である。実施の形態の動画像符号化装置は、画像メモリ１０１、ヘッダ情報設定部１１７、動きベクトル検出部１０２、差分動きベクトル算出部１０３、インター予測情報導出部１０４、動き補償予測部１０５、イントラ予測部１０６、予測方法決定部１０７、残差信号生成部１０８、直交変換・量子化部１０９、第１符号化ビット列生成部１１８、第２符号化ビット列生成部１１０、第３符号化ビット列生成部１１１、多重化部１１２、逆量子化・逆直交変換部１１３、復号画像信号重畳部１１４、符号化情報格納メモリ１１５、および復号画像メモリ１１６を備える。
【００４３】
ヘッダ情報設定部１１７は、シーケンス、ピクチャ、スライス単位の情報を設定する。設定されたシーケンス、ピクチャ、スライス単位の情報はインター予測情報導出部１０４、第１符号化ビット列生成部１１８に供給するとともに、図示していないがすべてのブロックに供給する。
【００４４】
画像メモリ１０１は、撮影／表示時間順に供給された符号化対象のピクチャの画像信号を一時格納する。画像メモリ１０１は、格納された符号化対象のピクチャの画像信号を、所定の画素ブロック単位で、動きベクトル検出部１０２、予測方法決定部１０７、および残差信号生成部１０８に供給する。その際、撮影／表示時間順に格納されたピクチャの画像信号は、符号化順序に並べ替えられて、画素ブロック単位で、画像メモリ１０１から出力される。
【００４５】
動きベクトル検出部１０２は、画像メモリ１０１から供給される画像信号と復号画像メモリ１１６から供給される参照ピクチャ間でブロックマッチング等により各予測ブロックサイズ、各予測モードのそれぞれの動きベクトルを各予測ブロック単位で検出し、検出された動きベクトルを動き補償予測部１０５、差分動きベクトル算出部１０３、および予測方法決定部１０７に供給する。
【００４６】
差分動きベクトル算出部１０３は、符号化情報格納メモリ１１５に記憶されている既に符号化された画像信号の符号化情報を用いて、複数の予測動きベクトルの候補を算出して予測動きベクトルリストに登録し、予測動きベクトルリストに登録された複数の予測動きベクトルの候補の中から最適な予測動きベクトルを選択し、動きベクトル検出部１０２が検出した動きベクトルと予測動きベクトルから差分動きベクトルを算出し、算出された差分動きベクトルを予測方法決定部１０７に供給する。さらに、予測動きベクトルリストに登録された予測動きベクトルの候補から選択された予測動きベクトルを特定する予測動きベクトルインデックスを予測方法決定部１０７に供給する。
【００４７】
インター予測情報導出部１０４は、マージモードでのマージ候補を導出する。符号化情報格納メモリ１１５に記憶されている既に符号化された予測ブロックの符号化情報を用いて、複数のマージ候補を導出して後述するマージ候補リストに登録し、マージ候補リストに登録された複数のマージ候補の中から適したマージ候補を選択し、選択されたマージ候補の各予測ブロックのＬ０予測、及びＬ１予測を利用するかどうかを示すフラグpredFlagL0[xP][yP], predFlagL1[xP][yP]、参照インデックスrefIdxL0[xP][yP], refIdxL1[xP][yP]、動きベクトルmvL0[xP][yP], mvL1[xP][yP]等のインター予測情報を動き補償予測部１０５に供給するとともに、選択されたマージ候補を特定するマージインデックスを予測方法決定部１０７に供給する。ここで、xP、yPはピクチャ内での予測ブロックの左上の画素の位置を示すインデックスである。インター予測情報導出部１０４の詳細な構成と動作は後述する。
【００４８】
動き補償予測部１０５は、動きベクトル検出部１０２およびインター予測情報導出部１０４により検出された動きベクトルを用いて参照ピクチャからインター予測（動き補償予測）により予測画像信号を生成し、予測画像信号を予測方法決定部１０７に供給する。なお、Ｌ０予測、及びＬ１予測では、片方向の予測を行う。双予測（Pred_BI）の場合は、双方向の予測を行い、Ｌ０予測、Ｌ１予測のそれぞれのインター予測された信号に適応的に重み係数を掛け算し、オフセット値を加算して重畳し、最終的な予測画像信号を生成する。
【００４９】
イントラ予測部１０６は、各イントラ予測モードについてイントラ予測を行う。復号画像メモリ２１１に格納されている復号済みの画像信号からイントラ予測により予測画像信号を生成し、複数のイントラ予測モードの中から適したイントラ予測モードを選択し、選択されたイントラ予測モード、及び選択されたイントラ予測モードに応じた予測画像信号を予測方法決定部１０７に供給する。
【００５０】
予測方法決定部１０７は符号化情報及び残差信号の符号量、予測画像信号と画像信号との間の歪量等を評価することにより、複数の予測方法の中から、最適な符号化ブロック単位でインター予測（PRED_INTER）かイントラ予測（PRED_INTRA）かを判別する予測モードPredMode、分割モードPartModeを決定し、インター予測（PRED_INTER）では予測ブロック単位でマージモードか否かを決定し、マージモードの場合はマージインデックス、マージモードでない場合はインター予測モード、予測動きベクトルインデックス、Ｌ０、Ｌ１の参照インデックス、差分動きベクトル等を決定して、決定に応じた符号化情報を第２符号化ビット列生成部１１０に供給する。
【００５１】
さらに、予測方法決定部１０７は、決定された予測方法を示す情報、及び決定された予測方法に応じた動きベクトル等を含む符号化情報を符号化情報格納メモリ１１５に格納する。ここで格納する符号化情報は、各符号化ブロックの予測モードPredMode、分割モードPartMode、各予測ブロックのＬ０予測、及びＬ１予測を利用するかどうかを示すフラグpredFlagL0[xP][yP], predFlagL1[xP][yP]、Ｌ０、Ｌ１の参照インデックスrefIdxL0[xP][yP], refIdxL1[xP][yP]、Ｌ０、Ｌ１の動きベクトルmvL0[xP][yP], mvL1[xP][yP]等である。ここで、xP、yPはピクチャ内での予測ブロックの左上の画素の位置を示すインデックスである。なお、予測モードPredModeがインター予測（MODE_INTER）の場合、Ｌ０予測を利用するかどうかを示すフラグpredFlagL0[xP][yP]、Ｌ１予測を利用するかどうかを示すフラグpredFlagL1[xP][yP]は共に０である。一方、予測モードPredModeがインター予測（MODE_INTER）で、インター予測モードがＬ０予測（Pred_L0）の場合、Ｌ０予測を利用するかどうかを示すフラグpredFlagL0[xP][yP]は１, Ｌ１予測を利用するかどうかを示すフラグpredFlagL1[xP][yP]は０である。インター予測モードがＬ１予測（Pred_L1）の場合、Ｌ０予測を利用するかどうかを示すフラグpredFlagL0[xP][yP]は０, Ｌ１予測を利用するかどうかを示すフラグpredFlagL1[xP][yP]は１である。インター予測モードが双予測（Pred_BI）の場合、Ｌ０予測を利用するかどうかを示すフラグpredFlagL0[xP][yP]、Ｌ１予測を利用するかどうかを示すフラグpredFlagL1[xP][yP]は共に１である。予測方法決定部１０７は、決定された予測モードに応じた予測画像信号を残差信号生成部１０８と復号画像信号重畳部１１４に供給する。
【００５２】
残差信号生成部１０８は、符号化する画像信号と予測画像信号との減算を行うことにより残差信号を生成し、直交変換・量子化部１０９に供給する。
直交変換・量子化部１０９は、残差信号に対して量子化パラメータに応じて直交変換及び量子化を行い直交変換・量子化された残差信号を生成し、第３符号化ビット列生成部１１１と逆量子化・逆直交変換部１１３に供給する。さらに、直交変換・量子化部１０９は、量子化パラメータを符号化情報格納メモリ１１５に格納する。
【００５３】
第１符号化ビット列生成部１１８は、ヘッダ情報設定部１１７で設定されたシーケンス、ピクチャ、スライス単位の情報を符号化する。第１の符号化ビット列を生成し、多重化部１１２に供給する。
【００５４】
第２符号化ビット列生成部１１０は、符号化ブロック及び予測ブロック毎に予測方法決定部１０７によって決定された予測方法に応じた符号化情報を符号化する。具体的には、符号化ブロック毎の予測モードPredMode、分割モードPartMode、インター予測（PRED_INTER）の場合、マージモードかどうかを判別するフラグ、マージモードの場合はマージインデックス、マージモードでない場合はインター予測モード、予測動きベクトルインデックス、差分動きベクトルに関する情報等の符号化情報を後述する規定のシンタックス規則に従って符号化して第２の符号化ビット列を生成し、多重化部１１２に供給する。
【００５５】
第３符号化ビット列生成部１１１は、直交変換及び量子化された残差信号を規定のシンタックス規則に従ってエントロピー符号化して第３の符号化ビット列を生成し、多重化部１１２に供給する。多重化部１１２で、第１の符号化ビット列、第２の符号化ビット列および第３の符号化ビット列を規定のシンタックス規則に従って多重化し、ビットストリームを出力する。
【００５６】
逆量子化・逆直交変換部１１３は、直交変換・量子化部１０９から供給された直交変換・量子化された残差信号を逆量子化及び逆直交変換して残差信号を算出し、復号画像信号重畳部１１４に供給する。復号画像信号重畳部１１４は、予測方法決定部１０７による決定に応じた予測画像信号と逆量子化・逆直交変換部１１３で逆量子化及び逆直交変換された残差信号を重畳して復号画像を生成し、復号画像メモリ１１６に格納する。なお、復号画像に対して符号化によるブロック歪等の歪を減少させるフィルタリング処理を施して、復号画像メモリ１１６に格納されることもある。
【００５７】
図２は図１の動画像符号化装置に対応した本発明の実施の形態に係る動画像復号装置の構成を示すブロックである。実施の形態の動画像復号装置は、分離部２０１、第１符号化ビット列復号部２１２、第２符号化ビット列復号部２０２、第３符号化ビット列復号部２０３、動きベクトル算出部２０４、インター予測情報導出部２０５、動き補償予測部２０６、イントラ予測部２０７、逆量子化・逆直交変換部２０８、復号画像信号重畳部２０９、符号化情報格納メモリ２１０、および復号画像メモリ２１１を備える。
【００５８】
図２の動画像復号装置の復号処理は、図１の動画像符号化装置の内部に設けられている復号処理に対応するものであるから、図２の動き補償予測部２０６、逆量子化・逆直交変換部２０８、復号画像信号重畳部２０９、符号化情報格納メモリ２１０、および復号画像メモリ２１１の各構成は、図１の動画像符号化装置の動き補償予測部１０５、逆量子化・逆直交変換部１１３、復号画像信号重畳部１１４、符号化情報格納メモリ１１５、および復号画像メモリ１１６の各構成とそれぞれ対応する機能を有する。
【００５９】
分離部２０１に供給されるビットストリームは規定のシンタックスの規則に従って分離し、分離された符号化ビット列が第１符号化ビット列復号部２１２、第２符号化ビット列復号部２０２、第３符号化ビット列復号部２０３に供給される。
【００６０】
第１符号化ビット列復号部２１２は、供給された符号化ビット列を復号して、シーケンス、ピクチャ、スライス単位の情報を得る。得られたシーケンス、ピクチャ、スライス単位の情報は図示していないがすべてのブロックに供給する。
【００６１】
第２符号化ビット列復号部２０２は、供給された符号化ビット列を復号して、符号化ブロック単位の情報、及び、予測ブロック単位の符号化情報を得る。具体的には、符号化ブロック単位でインター予測（PRED_INTER）かイントラ予測（PRED_INTRA）かを判別する予測モードPredMode、分割モードPartMode、インター予測（PRED_INTER）の場合、マージモードかどうかを判別するフラグ、マージモードの場合はマージインデックス、マージモードでない場合はインター予測モード、予測動きベクトルインデックス、差分動きベクトル等に関する符号化情報を後述する規定のシンタックス規則に従って復号し、符号化情報を動きベクトル算出部２０４、インター予測情報導出部２０５またはイントラ予測部２０７に供給する。
【００６２】
第３符号化ビット列復号部２０３は、供給された符号化ビット列を復号して直交変換・量子化された残差信号を算出し、直交変換・量子化された残差信号を逆量子化・逆直交変換部２０８に供給する。
【００６３】
動きベクトル算出部２０４は、復号対象の予測ブロックの予測モードPredModeがインター予測（PRED_INTER）でマージモードでない時に、符号化情報格納メモリ２１０に記憶されている既に復号された画像信号の符号化情報を用いて、複数の予測動きベクトルの候補を導出して後述する予測動きベクトルリストに登録し、予測動きベクトルリストに登録された複数の予測動きベクトルの候補の中から、第２符号化ビット列復号部２０２で復号され供給される予測動きベクトルインデックスに応じた予測動きベクトルを選択し、第２符号化ビット列復号部２０２で復号された差分ベクトルと選択された予測動きベクトルから動きベクトルを算出し、他の符号化情報とともに動き補償予測部２０６に供給するとともに、符号化情報格納メモリ２１０に格納する。ここで供給・格納する予測ブロックの符号化情報は、予測モードPredMode、分割モードPartMode、Ｌ０予測、及びＬ１予測を利用するかどうかを示すフラグpredFlagL0[xP][yP], predFlagL1[xP][yP]、Ｌ０、Ｌ１の参照インデックスrefIdxL0[xP][yP], refIdxL1[xP][yP]、Ｌ０、Ｌ１の動きベクトルmvL0[xP][yP], mvL1[xP][yP]等である。ここで、xP、yPはピクチャ内での予測ブロックの左上の画素の位置を示すインデックスである。予測モードPredModeがインター予測（MODE_INTER）で、インター予測モードがＬ０予測（Pred_L0）の場合、Ｌ０予測を利用するかどうかを示すフラグpredFlagL0は１, Ｌ１予測を利用するかどうかを示すフラグpredFlagL1は０である。インター予測モードがＬ１予測（Pred_L1）の場合、Ｌ０予測を利用するかどうかを示すフラグpredFlagL0は０, Ｌ１予測を利用するかどうかを示すフラグpredFlagL1は１である。インター予測モードが双予測（Pred_BI）の場合、Ｌ０予測を利用するかどうかを示すフラグpredFlagL0、Ｌ１予測を利用するかどうかを示すフラグpredFlagL1は共に１である。
【００６４】
インター予測情報導出部２０５は、復号対象の予測ブロックの予測モードPredModeがインター予測（PRED_INTER）でマージモードの時に、マージ候補を導出する。符号化情報格納メモリ１１５に記憶されている既に復号された予測ブロックの符号化情報を用いて、複数のマージの候補を導出して後述するマージ候補リストに登録し、マージ候補リストに登録された複数のマージ候補の中から第２符号化ビット列復号部２０２で復号され供給されるマージインデックスに対応したマージ候補を選択し、選択されたマージ候補のＬ０予測、及びＬ１予測を利用するかどうかを示すフラグpredFlagL0[xP][yP], predFlagL1[xP][yP]、Ｌ０、Ｌ１の参照インデックスrefIdxL0[xP][yP], refIdxL1[xP][yP]、Ｌ０、Ｌ１の動きベクトルmvL0[xP][yP], mvL1[xP][yP]等のインター予測情報を動き補償予測部２０６に供給するとともに、符号化情報格納メモリ２１０に格納する。ここで、xP、yPはピクチャ内での予測ブロックの左上の画素の位置を示すインデックスである。インター予測情報導出部２０５の詳細な構成と動作は後述する。
【００６５】
動き補償予測部２０６は、動きベクトル算出部２０４またはインター予測情報導出部２０５で算出されたインター予測情報を用いて復号画像メモリ２１１に格納されている参照ピクチャからインター予測（動き補償予測）により予測画像信号を生成し、予測画像信号を復号画像信号重畳部２０９に供給する。なお、双予測（Pred_BI）の場合は、Ｌ０予測、Ｌ１予測の２つの動き補償予測画像信号に適応的に重み係数を掛け算して重畳し、最終的な予測画像信号を生成する。
【００６６】
イントラ予測部２０７は、復号対象の予測ブロックの予測モードPredModeがイントラ予測（PRED_INTRA）の時に、イントラ予測を行う。第１符号化ビット列復号部で復号された符号化情報にはイントラ予測モードが含まれており、イントラ予測モードに応じて、復号画像メモリ２１１に格納されている復号済みの画像信号からイントラ予測により予測画像信号を生成し、予測画像信号を復号画像信号重畳部２０９に供給する。Ｌ０予測、及びＬ１予測を利用するかどうかを示すフラグpredFlagL0[xP][yP], predFlagL1[xP][yP]を共に０に設定し、符号化情報格納メモリ２１０に格納する。ここで、xP、yPはピクチャ内での予測ブロックの左上の画素の位置を示すインデックスである。
【００６７】
逆量子化・逆直交変換部２０８は、第２符号化ビット列復号部２０２で復号された直交変換・量子化された残差信号に対して逆直交変換及び逆量子化を行い、逆直交変換・逆量子化された残差信号を得る。
【００６８】
復号画像信号重畳部２０９は、動き補償予測部２０６でインター予測された予測画像信号、またはイントラ予測部２０７でイントラ予測された予測画像信号と、逆量子化・逆直交変換部２０８により逆直交変換・逆量子化された残差信号とを重畳することにより、復号画像信号を復号し、復号画像メモリ２１１に格納する。復号画像メモリ２１１に格納する際には、復号画像に対して符号化によるブロック歪等を減少させるフィルタリング処理を施して、復号画像メモリ２１１に格納されることもある。
【００６９】
次に、本実施の形態に係る動きベクトルの予測方法を備える動画像符号化装置により符号化され、復号装置により復号される動画像のビットストリームの符号化および復号の共通規則であるシンタックスについて説明する。
【００７０】
図１０は予測ブロック単位に記述されるシンタックス規則を示す。予測ブロックの予測モードPredModeの値がインター予測（MODE_INTER）の場合、マージモードかどうかを示すmerge_flag[x0][y0]が設置される。ここで、x0、y0は輝度信号のピクチャ内での予測ブロックの左上の画素の位置を示すインデックスであり、merge_flag[x0][y0]はピクチャ内の(x0, y0)に位置する予測ブロックのマージモードかどうかを示すフラグである。
【００７１】
次に、merge_flag[x0][y0]が１の場合、マージモードであることを示し、参照するマージ候補のリストであるマージリストのインデックスのシンタックス要素merge_idx[x0][y0]が設置される。ここで、x0、y0はピクチャ内での予測ブロックの左上の画素の位置を示すインデックスであり、merge_idx[x0][y0]はピクチャ内の(x0, y0)に位置する予測ブロックのマージインデックスである。マージインデックスをエントロピー符号化／復号する場合、マージ候補数が小さい程、小さい符号量で符号化／復号することができ、少ない処理量で符号化／復号することができる。図１１はマージインデックスのシンタックス要素merge_idx[x0][y0]のエントロピー符号（コード）の一例である。マージ候補数が３の場合、マージインデックスが0, 1, 2の時、マージインデックスのシンタックス要素merge_idx[x0][y0]の符号はそれぞれ'０'、'１０'、'１１'となる。マージ候補数が４の場合、マージインデックスが0, 1, 2, 3の時、マージインデックスのシンタックス要素merge_idx[x0][y0]の符号はそれぞれ'０'、'１０'、'１１０'、'１１１'となる。マージ候補数が５の場合、マージインデックスが0, 1, 2, 3, 4の時、マージインデックスのシンタックス要素merge_idx[x0][y0]の符号はそれぞれ'０'、'１０'、'１１０'、'１１１０'、'１１１１'となる。つまり、マージ候補数がわかっている場合、マージ候補数が少ない方がマージインデックスを小さい符号量で表現可能である。本実施例においては、図１１に示すようにマージ候補数に応じて、マージインデックスのそれぞれの値を示す符号を切り替えることで符号量を削減する。
【００７２】
一方、merge_flag[x0][y0]が０の場合、マージモードでないことを示し、スライスタイプがＢスライスの場合、インター予測モードを識別するシンタックス要素inter_pred_flag[x0][y0]が設置され、このシンタックス要素でＬ０予測（Pred_L0）、Ｌ１予測（Pred_L1）、双予測（Pred_BI）を識別する。Ｌ０、Ｌ１ごとに、参照ピクチャを特定するための参照インデックスのシンタックス要素ref_idx_l0[x0][y0]、ref_idx_l1[x0][y0]、動きベクトル検出にて求められた予測ブロックの動きベクトルと予測動きベクトルとの差分である差分動きベクトルのシンタックス要素mvd_l0[x0][y0][j]、mvd_l1[x0][y0][j]が設置される。ここで、x0、y0はピクチャ内での予測ブロックの左上の画素の位置を示すインデックスであり、ref_idx_l0[x0][y0]、mvd_l0[x0][y0][j]はそれぞれピクチャ内の(x0, y0)に位置する予測ブロックのＬ０の参照インデックス、及び差分動きベクトルであり、ref_idx_l1[x0][y0]、mvd_l1[x0][y0][j]はそれぞれピクチャ内の(x0, y0)に位置する予測ブロックのＬ１の参照インデックス、及び差分動きベクトルである。また、ｊは差分動きベクトルの成分を表し、ｊが０はｘ成分を、ｊが１はｙ成分を表す。次に、参照する予測動きベクトルの候補のリストである予測動きベクトルリストのインデックスのシンタックス要素mvp_idx_l0[x0][y0]、mvp_idx_l1[x0][y0]が設置される。ここで、x0、y0はピクチャ内での予測ブロックの左上の画素の位置を示すインデックスであり、mvp_idx_l0[x0][y0]、mvp_idx_l1[x0][y0]はピクチャ内の(x0, y0)に位置する予測ブロックのＬ０、Ｌ１の予測動きベクトルインデックスである。本発明の本実施の形態においてはこれらの候補数の値を２と設定する。
【００７３】
実施の形態に係るインター予測情報導出方法は、図１の動画像符号化装置のインター予測情報導出部１０４及び図２の動画像復号装置のインター予測情報導出部２０５において実施される。
【００７４】
実施の形態に係るインター予測情報導出方法は、符号化ブロックを構成する予測ブロック単位に、符号化及び復号の処理の何れでも実施される。予測ブロックの予測モードPredModeがインター予測（MODE_INTER）で、マージモードの場合に、符号化の場合、符号化済みの予測ブロックの予測モード、参照インデックス、動きベクトルを利用して符号化対象の予測ブロックの予測モード、参照インデックス、動きベクトルを導出する際、復号の場合、復号済みの予測ブロックの予測モード、参照インデックス、動きベクトルを利用して復号対象の予測ブロックの予測モード、参照インデックス、動きベクトルを導出する際に実施される。
【００７５】
マージモードは図５、図６、図７及び図８を用いて説明した左に隣接する予測ブロックＡ、上に隣接する予測ブロックＢ、右上に隣接する予測ブロックＣ、左下に隣接する予測ブロックＤ、左上に隣接する予測ブロックＥに加えて、図９を用いて説明した異なる時間の同一位置あるいはその付近に存在する予測ブロックＣｏｌ（Ｔ０、Ｔ１のいずれか）の予測ブロックを候補とする。動画像符号化装置のインター予測情報導出部１０４、及び動画像復号装置のインター予測情報導出部２０５はそれらの候補を符号化側と復号側で共通の規定の順序でマージ候補リストに登録し、動画像符号化装置のインター予測情報導出部１０４がマージ候補リストの要素を特定するマージインデックスを決定して第２符号化ビット列生成部１１０を経由して符号化し、動画像復号装置のインター予測情報導出部２０５は第２符号化ビット列復号部２０２で復号されたマージインデックスが供給されて、そのマージインデックスに応じた予測ブロックをマージ候補リストから選択し、その選択されたマージ候補の予測モード、参照インデックス、動きベクトル等のインター予測情報を用いて、動き補償予測を行う。
【００７６】
スライス単位でマージ候補リストmergeCandListに登録される最終的なマージ候補数finalNumMergeCandを設定する。本実施の形態においては、スライスタイプがＰスライスの場合、finalNumMergeCandを後者よりも小さい数に設定し、スライスタイプがＢスライスの場合、finalNumMVPCandを前者よりも大きい数に設定する。スライスタイプがＰスライスの場合は、finalNumMVPCandを３に設定し、スライスタイプがＢスライスの場合は、finalNumMVPCandを５に設定する。
【００７７】
実施の形態に係るインター予測情報導出方法を図面を用いて説明する。図１２は、図１の動画像符号化装置のインター予測情報導出部１０４の詳細な構成を示す図である。また、図１３は、図２の動画像復号装置のインター予測情報導出部２０５の詳細な構成を示す図である。
【００７８】
図１２及び図１３の太枠線で囲まれる部分はそれぞれ、インター予測情報導出部１０４及びインター予測情報導出部２０５を示している。
【００７９】
更に、それらの内部の太点線で囲まれる部分は後述するインター予測情報導出方法の動作部を示しており、実施の形態の動画像符号化装置と対応する動画像復号装置にも同様に設置され、符号化と復号で矛盾しない同一の判定結果を得られるようにしている。
【００８０】
インター予測情報導出部１０４は、空間マージ候補生成部１３０、時間マージ候補の参照インデックス導出部１３１、時間マージ候補生成部１３２、マージ候補登録部１３３、マージ候補同一判定部１３４、マージ候補数制限部１３５、マージ候補補充部１３６、および符号化情報選択部１３７を含む。
【００８１】
インター予測情報導出部２０５は、空間マージ候補生成部２３０、時間マージ候補の参照インデックス導出部２３１、時間マージ候補生成部２３２、マージ候補登録部２３３、マージ候補同一判定部２３４、マージ候補数制限部２３５、マージ候補補充部２３６、および符号化情報選択部２３７を含む。
【００８２】
図１４は本発明の実施の形態による動画像符号化装置のインター予測情報導出部１０４及び動画像復号装置のインター予測情報導出部２０５とで共通する機能を有するマージ候補の導出処理及びマージ候補リストの構築処理の手順を説明するフローチャートである。
以下、諸過程を順を追って説明する。なお、以下の説明においては特に断りのない限りスライスタイプslice_typeがＢスライスの場合について説明するが、Ｐスライスの場合にも適用できる。ただし、スライスタイプslice_typeがＰスライスの場合、インター予測モードとしてＬ０予測（Pred_L0）だけがあり、Ｌ１予測（Pred_L1）、双予測（Pred_BI）がないので、Ｌ１に纏わる処理を省略することができる。
【００８３】
動画像符号化装置のインター予測情報導出部１０４の空間マージ候補生成部１３０及び動画像復号装置のインター予測情報導出部２０５の空間マージ候補生成部２３０では、符号化／復号対象ブロックに隣接するそれぞれの予測ブロックＡ，Ｂ，Ｃ，Ｄ，Ｅからの空間マージ候補Ａ，Ｂ，Ｃ，Ｄ，Ｅを導出する。ここで、Ａ，Ｂ，Ｃ，Ｄ，ＥまたはＣｏｌのいずれかを示すＮを定義する。予測ブロックＮのインター予測情報がマージ候補Ｎとして利用できるかどうかを示すフラグavailableFlagN、Ｌ０の参照インデックスrefIdxL0N及びＬ１の参照インデックスrefIdxL1N、Ｌ０予測が行われるかどうかを示すＬ０予測フラグpredFlagL0NおよびＬ１予測が行われるかどうかを示すＬ１予測フラグpredFlagL1N、Ｌ０の動きベクトルmvL0N、Ｌ１の動きベクトルmvL1Nを出力する（ステップＳ１０１）。
ステップＳ１０１の詳細な処理手順については図１５のフローチャートを用いて後ほど詳細に説明する。
【００８４】
続いて、動画像符号化装置のインター予測情報導出部１０４の時間マージ候補の参照インデックス導出部１３１及び動画像復号装置のインター予測情報導出部２０５の時間マージ候補の参照インデックス導出部２３１では、符号化／復号対象ブロックに隣接する予測ブロックから時間マージ候補の参照インデックスを導出する（ステップＳ１０２）。スライスタイプslice_typeがＰスライスで時間マージ候補のインター予測情報を用いてインター予測を行う場合は、Ｌ０予測（Pred_L0）を行うために、Ｌ０の参照インデックスだけを導出し、スライスタイプslice_typeがＢスライスで時間マージ候補のインター予測情報を用いてインター予測を行う場合は、双予測（Pred_BI）を行うために、Ｌ０とＬ１のそれぞれの参照インデックスを導出する。ステップＳ１０２の詳細な処理手順については図１６のフローチャートを用いて後ほど詳細に説明する。
【００８５】
続いて、動画像符号化装置のインター予測情報導出部１０４の時間マージ候補生成部１３２及び動画像復号装置のインター予測情報導出部２０５の時間マージ候補生成部２３２では、異なる時間のピクチャからの時間マージ候補を導出し、利用できるかどうかを示すフラグavailableFlagCol、Ｌ０予測が行われるかどうかを示すＬ０予測フラグpredFlagL0ColおよびＬ１予測が行われるかどうかを示すＬ１予測フラグpredFlagL1Col、及びＬ０の動きベクトルmvL0N、Ｌ１の動きベクトルmvL1Nを出力する（ステップＳ１０３）。ステップＳ１０３の詳細な処理手順については図１７のフローチャートを用いて後ほど詳細に説明する。
【００８６】
続いて、動画像符号化装置のインター予測情報導出部１０４のマージ候補登録部１３３及び動画像復号装置のインター予測情報導出部２０５のマージ候補登録部２３３では、マージ候補リストmergeCandListを作成し、予測ベクトルの候補Ａ，Ｂ，Ｃ，Ｄ，Ｅ，Ｃｏｌを追加する（ステップＳ１０４）。ステップＳ１０４の詳細な処理手順については図２４のフローチャートを用いて後ほど詳細に説明する。
【００８７】
続いて、動画像符号化装置のインター予測情報導出部１０４のマージ候補同一判定部１３４及び動画像復号装置のインター予測情報導出部２０５のマージ候補同一判定部２３４では、マージ候補リストmergeCandList内で、マージ候補が同じ参照インデックスの動きベクトルが同じ値を持っている場合に、最も小さい順番のマージ候補を除いてそのマージ候補を取り除く（ステップＳ１０５）。
【００８８】
続いて、動画像符号化装置のインター予測情報導出部１０４のマージ候補数制限部１３５及び動画像復号装置のインター予測情報導出部２０５のマージ候補数制限部２３５では、マージ候補リストmergeCandList内に登録されているマージ候補の数をカウントし、マージ候補リストmergeCandList内に登録されているマージ候補数numMergeCandが、最終マージ候補数finalNumMergeCandより大きい場合（ステップＳ１０６のＹＥＳ）、マージ候補リストmergeCandList内のインデックスｉが(finalNumMergeCand-1)よりも大きいすべてのマージ候補を削除することでマージ候補を最終マージ候補数finalNumMergeCandに制限し、マージ候補リストmergeCandList内に登録されているマージ候補数numMergeCandの値を最終マージ候補数finalNumMergeCandに更新する（ステップＳ１０７）。
【００８９】
続いて、動画像符号化装置のインター予測情報導出部１０４のマージ候補補充部１３６及び動画像復号装置のインター予測情報導出部２０５のマージ候補補充部２３６では、マージ候補リストmergeCandList内に登録されているマージ候補数numMergeCandが、最終マージ候補数finalNumMergeCandより小さい場合（ステップＳ１０８のＹＥＳ）、マージ候補リストmergeCandList内に登録されているマージ候補数numMergeCandが最終マージ候補数finalNumMergeCandを上限としてマージ候補を補充し、マージ候補リストmergeCandList内に登録されているマージ候補数numMergeCandの値を最終マージ候補数finalNumMergeCandに更新する（ステップＳ１０９）。最終マージ候補数finalNumMergeCandを上限として、Ｐスライスでは、異なる参照インデックスで動きベクトルが（０，０）の値を持つ予測モードがＬ０予測（Pred_L0）のマージ候補を追加する。Ｂスライスでは、すでに登録されているマージ候補同士のＬ０予測とＬ１予測の組み合わせを変更した予測モードが双予測（Pred_BI）のマージ候補や、異なる参照インデックスで動きベクトルが（０，０）の値を持つ予測モードが双予測（Pred_BI）のマージ候補を追加する。
【００９０】
本実施の形態においては、スライス単位で最終候補数finalNumMVPCandを固定した数に設定している。最終候補数finalNumMVPCandを固定する理由は最終候補数finalNumMVPCandがマージ候補リストの構築状態に応じて変動すると、エントロピー復号とマージ候補リストの構築に依存関係が生じ、復号側では予測ブロック毎にマージ候補リストを構築し最終候補数finalNumMVPCandを導出してからでないと、マージインデックスをエントロピー復号することができず、マージインデックスの復号に遅延が生じるとともにエントロピー復号が複雑になるためである。さらに、エントロピー復号が異なる時間のピクチャの予測ブロックから導出されたマージ候補Colを含むマージ候補リストの構築状態に依存すると、別のピクチャの符号化ビット列の復号時にエラーが発生した際に現在のピクチャの符号化ビット列もそのエラーの影響を受けて正常な最終候補数finalNumMVPCandを導出することができず正常にエントロピー復号を続けることができない問題がある。本実施の形態の様にスライス単位で最終候補数finalNumMVPCandを固定した数に設定すると、予測ブロック単位での最終候補数finalNumMVPCandの導出が不要となり、マージ候補リストの構築と独立して、マージインデックスをエントロピー復号することができるとともに、別のピクチャの符号化ビット列の復号時にエラーが発生してもその影響を受けずに現在のピクチャの符号化ビット列のエントロピー復号を続けることができる。
【００９１】
次に、図１４のステップＳ１０１の処理手順である符号化／復号対象ブロックに隣接する予測ブロックＮからのマージ候補Ｎの導出方法について詳細に説明する。図１５は図１４のステップＳ１０１の空間マージ候補導出処理手順を説明するフローチャートである。Ｎには隣接する予測ブロックの領域を表すＡ（左側）、Ｂ（上側）、Ｃ（右上）、Ｄ（左下）またはＥ（左上）が入る。なお、本実施の形態においては、空間マージ候補数の上限値maxNumSpatialMergeCandを４とし、隣接する５つの予測ブロックから最大４つの空間マージ候補を導出する。なお、スライス単位でマージ候補リストmergeCandListに登録される空間マージ候補数の上限値maxNumSpatialMergeCandを設定することもできる。空間マージ候補数の上限値maxNumSpatialMergeCandに大きな値を設定するとマージ候補の選択の幅が広がるため符号化効率が向上するが、マージ候補の同一判定の対象となるマージ候補数が増加するためマージ候補の同一判定の処理量が増大する。そこで、処理量を削減するために、スライス単位で空間マージ候補数の上限値maxNumSpatialMergeCandを設定し、空間マージ候補導出の処理量やマージ候補同一判定の処理量を制御してもよい。例えば、スライスタイプがＰスライスの場合、本実施の形態では最終マージ候補数finalNumMergeCandを３としているので、４つの空間マージ候補を導出しても図１４のステップＳ１０７の処理で削除される可能性が高くなるため、空間マージ候補数の上限値maxNumSpatialMergeCandを３または２としても符号化効率の低下を小さく抑えて動画像符号化装置のインター予測情報導出部１０４のマージ候補同一判定部１３４及び動画像復号装置のインター予測情報導出部２０５のマージ候補同一判定部２３４でのマージ候補同一判定処理の処理量を削減することができる。
【００９２】
図１５で、変数ＮをＡとして符号化／復号対象の予測ブロックの左側に隣接する予測ブロックＡの符号化情報を調べてマージ候補Ａを導出し、変数ＮをＢとして上側に隣接する予測ブロックＢの符号化情報を調べてマージ候補Ｂを導出し、変数ＮをＣとして右上側に隣接する予測ブロックＣの符号化情報を調べてマージ候補Ｃを導出し、変数ＮをＤとして左下側に隣接する予測ブロックＤの符号化情報を調べてマージ候補Ｄを導出し、変数ＮをＥとして左上側に隣接する予測ブロックＥの符号化情報を調べてマージ候補Ｅを導出する（ステップＳ１１０１〜ステップＳ１１１２）。
【００９３】
まず、これまでに導出できた（availableFlagが１となった）空間マージ候補の合計が空間マージ候補数の上限値maxNumSpatialMergeCandの場合（ステップＳ１１０２のＹＥＳ）、すなわち４つの空間マージ候補が導出された場合、マージ候補ＮのフラグavailableFlagNを０に設定し（ステップＳ１１０５）、マージ候補Ｎの動きベクトルmvL0N, mvL1Nの値を共に（０，０）に設定し（ステップＳ１１０６）、マージ候補ＮのフラグpredFlagL0N、predFlagL1Nの値を共に０に設定し（ステップＳ１１０７）、本空間マージ候補導出処理を終了する。
本実施の形態においては、隣接する予測ブロックから４つのマージ候補を導出するので、既に４つの空間マージ候補が導出された場合はそれ以上の空間マージ候補の導出処理を行う必要がない。
【００９４】
一方、これまでに導出できた（availableFlagが１となった）空間マージ候補の合計が空間マージ候補数の上限値maxNumSpatialMergeCandでない場合（ステップＳ１１０２のＮＯ）、符号化／復号対象の予測ブロックに隣接する予測ブロックＮを特定し、それぞれの予測ブロックＮが利用できる場合は符号化情報格納メモリ１１５または２１０から予測ブロックＮの符号化情報を取得する（ステップＳ１１０３）。
【００９５】
隣接する予測ブロックＮが利用できないか、予測ブロックＮの予測モードPredModeがイントラ予測（MODE_INTRA）である場合（ステップＳ１１０４のＮＯ）、マージ候補ＮのフラグavailableFlagNの値を０に設定し（ステップＳ１１０５）、マージ候補Ｎの動きベクトルmvL0N, mvL1Nの値を共に（０，０）に設定し（ステップＳ１１０６）、マージ候補ＮのフラグpredFlagL0N、predFlagL1Nの値を共に０に設定する（ステップＳ１１０７）。
【００９６】
一方、隣接する予測ブロックＮが利用でき、予測ブロックＮの予測モードPredModeがイントラ予測（MODE_INTRA）でない場合（ステップＳ１１０４のＹＥＳ）、予測ブロックＮのインター予測情報をマージ候補Ｎのインター予測情報とする。マージ候補ＮのフラグavailableFlagNの値を１に設定し（ステップＳ１１０８）、マージ候補Ｎの動きベクトルmvL0N, mvL1Nをそれぞれ予測ブロックＮの動きベクトルmvL0N[xN][yN], mvL1N[xN][yN]と同じ値に設定し（ステップＳ１１０９）、マージ候補Ｎの参照インデックスrefIdxL0N, refIdxL1Nをそれぞれ予測ブロックＮの参照インデックスrefIdxL0[xN][yN], refIdxL1[xN][yN]と同じ値に設定し（ステップＳ１１１０）、マージ候補ＮのフラグpredFlagL0N, predFlagL1Nをそれぞれ予測ブロックＮのフラグpredFlagL0[xN][yN], predFlagL1[xN][yN]に設定する（ステップＳ１１１１）。ここで、xN、yNはピクチャ内での予測ブロックＮの左上の画素の位置を示すインデックスである。
【００９７】
以上のステップＳ１１０２〜ステップＳ１１１１の処理をＮ＝Ａ，Ｂ，Ｃ，Ｄ，Ｅについてそれぞれ繰り返す（ステップＳ１１０１〜ステップＳ１１１２）。
【００９８】
次に、図１４のＳ１０２の時間マージ候補の参照インデックスを導出する方法について詳細に説明する。時間マージ候補のＬ０とＬ１のそれぞれの参照インデックスを導出する。
【００９９】
本実施の形態においては、空間マージ候補の参照インデックス、即ち符号化／復号対象ブロックに隣接する予測ブロックで利用された参照インデックスを利用して時間マージ候補の参照インデックスを導出する。これは、時間マージ候補が選択される場合において、符号化／復号対象の予測ブロックの参照インデックスは空間マージ候補となる符号化／復号対象ブロックに隣接する予測ブロックの参照インデックスと高い相関を持つからである。特に、本実施の形態においては、符号化／復号対象の予測ブロックの左の辺に隣接する予測ブロックＡ、及び上の辺に隣接する予測ブロックＢの参照インデックスだけを利用する。なぜなら、空間マージ候補でもある隣接する予測ブロックＡ，Ｂ，Ｃ，Ｄ，Ｅの中でも符号化／復号対象の予測ブロックの辺に接している予測ブロックＡ，Ｂは、符号化／復号対象の予測ブロックの頂点のみに接している予測ブロックＣ，Ｄ，Ｅよりも相関が高いからである。相対的に相関の低い予測ブロックＣ，Ｄ，Ｅを利用せずに、利用する予測ブロックを予測ブロックＡ，Ｂに限定することで、時間マージ候補の参照インデックスの導出による符号化効率の改善効果を得るとともに、時間マージ候補の参照インデックス導出処理に関する演算量及びメモリアクセス量を削減する。
【０１００】
本実施の形態では、予測ブロックＡ、予測ブロックＢが共にＬＸ予測（Ｌ０またはＬ１で、時間マージ候補の参照インデックスの導出対象のリストをＬＸとし、ＬＸを用いた予測をＬＸ予測とする。以下、断りのない限り、この意味で用いる。）を行う場合は予測ブロックＡ、予測ブロックＢのＬＸの参照インデックスの値の小さい方を時間マージ候補のＬＸの参照インデックスの値として採用する。ただし、予測ブロックＡ、予測ブロックＢのいずれか一方しかＬＸ予測を行わない場合はＬＸ予測を行う方の予測ブロックのＬＸの参照インデックスの値を時間マージ候補のＬＸの参照インデックスの値として採用し、予測ブロックＡ、予測ブロックＢが共にＬＸ予測を行わない場合は時間マージ候補のＬＸの参照インデックスの値をデフォルト値の０とする。
【０１０１】
予測ブロックＡ、予測ブロックＢが共にＬＸ予測を行わない場合に時間マージ候補のＬＸの参照インデックスのデフォルト値を０とする理由は、インター予測において参照インデックスの値が０に対応する参照ピクチャが最も選択される確率が高いからである。ただし、これに限定されず、参照インデックスのデフォルト値を０以外の値（１、２など）としても良いし、シーケンス単位、ピクチャ単位、またはスライス単位で符号化ストリーム内に参照インデックスのデフォルト値を示すシンタックス要素を設置し伝送できるようにして、符号化側で選択できるようにしても良い。
【０１０２】
図１６は本実施の形態の図１４のステップＳ１０２の時間マージ候補の参照インデックスの導出処理手順を説明するフローチャートである。まず、符号化情報格納メモリ１１５または２１０から左に隣接する予測ブロックＡの符号化情報、及び予測ブロックＢの符号化情報を取得する（ステップＳ２１０１、ステップＳ２１０２）。
続くステップＳ２１０４からステップＳ２１１０までの処理をＬ０，Ｌ１それぞれにおいて行う（ステップＳ２１０３〜Ｓ２１１１）。なお、時間マージ候補のＬ０の参照インデックスを導出する際にはＬＸはＬ０に設定され、Ｌ１の参照インデックスを導出する際にはＬＸはＬ１に設定される。ただし、スライスタイプslice_typeがＰスライスの場合、インター予測モードとしてＬ０予測（Pred_L0）だけがあり、Ｌ１予測（Pred_L1）、双予測（Pred_BI）がないので、Ｌ１に纏わる処理を省略することができる。
【０１０３】
予測ブロックＡのＬＸ予測を行うかどうかを示すフラグpredFlagLX[xA][yA]と予測ブロックＢのＬＸ予測を行うかどうかを示すフラグpredFlagLX[xB][yB]が共に０でない場合（ステップＳ２１０４のＹＥＳ）、時間マージ候補のＬＸの参照インデックスrefIdxLXColを予測ブロックＡのＬＸの参照インデックスrefIdxLX[xA][yA]と予測ブロックＢのＬＸの参照インデックスrefIdxLX[xB][yB]の値の小さい方と同じ値に設定する（ステップＳ２１０５）。ここで、xA、yAはピクチャ内での予測ブロックＡの左上の画素の位置を示すインデックスである。ここで、xB、yBはピクチャ内での予測ブロックＢの左上の画素の位置を示すインデックスである。
【０１０４】
なお、本実施の形態においては、予測ブロックＮ（Ｎ＝Ａ，Ｂ）において、予測ブロックＮが符号化／復号対象のスライス外で利用できない場合や予測ブロックＮが符号化／復号順序で符号化／復号対象の予測ブロックよりも後のために符号化／復号されておらず利用できない場合や予測ブロックＮの予測モードPredModeがインター予測（MODE_INTER）の場合、Ｌ０予測を利用するかどうかを示すフラグpredFlagL0[xN][yN]、予測ブロックＮのＬ１予測を利用するかどうかを示すフラグpredFlagL1[xN][yN]は共に０である。ここで、xN、yNはピクチャ内での予測ブロックＮの左上の画素の位置を示すインデックスである。
予測ブロックＮの予測モードPredModeがインター予測（MODE_INTER）で、インター予測モードがＬ０予測（Pred_L0）の場合、予測ブロックＮのＬ０予測を利用するかどうかを示すフラグpredFlagL0[xN][yN]は１, Ｌ１予測を利用するかどうかを示すフラグpredFlagL1[xN][yN]は０である。予測ブロックＮのインター予測モードがＬ１予測（Pred_L1）の場合、予測ブロックＮのＬ０予測を利用するかどうかを示すフラグpredFlagL0[xN][yN]は０, Ｌ１予測を利用するかどうかを示すフラグpredFlagL1[xN][yN]は１である。予測ブロックＮのインター予測モードが双予測（Pred_BI）の場合、予測ブロックＮのＬ０予測を利用するかどうかを示すフラグpredFlagL0[xN][yN]、Ｌ１予測を利用するかどうかを示すフラグpredFlagL1[xN][yN]は共に１である。
【０１０５】
予測ブロックＡのＬＸ予測を行うかどうかを示すフラグpredFlagLX[xA][yA]が０でなく、予測ブロックＢのＬＸ予測を行うかどうかを示すフラグpredFlagLX[xB][yB]が０である場合（ステップＳ２１０４のＮＯで、ステップＳ２１０６のＹＥＳ）、時間マージ候補のＬＸの参照インデックスrefIdxLXColを予測ブロックＡのＬＸの参照インデックスrefIdxLX[xA][yA]と同じ値に設定する（ステップＳ２１０７）。ここで、xA、yAはピクチャ内での予測ブロックＡの左上の画素の位置を示すインデックスであり、xB、yBはピクチャ内での予測ブロックＢの左上の画素の位置を示すインデックスである。
【０１０６】
予測ブロックＡのＬＸ予測を行うかどうかを示すフラグpredFlagLX[xA][yA]が０であり、予測ブロックＢのＬＸ予測を行うかどうかを示すフラグpredFlagLX[xB][yB]が０でない場合（ステップＳ２１０４のＮＯで、ステップＳ２１０６のＮＯで、ステップＳ２１０８のＹＥＳ）、時間マージ候補のＬＸの参照インデックスrefIdxLXColを予測ブロックＢのＬＸの参照インデックスpredFlagLX[xB][yB]と同じ値に設定する（ステップＳ２１０９）。
【０１０７】
予測ブロックＡのＬＸ予測を行うかどうかを示すフラグpredFlagLX[xA][yA]と予測ブロックＢのＬＸ予測を行うかどうかを示すフラグpredFlagLX[xB][yB]が共に０である場合（ステップＳ２１０４のＮＯで、ステップＳ２１０６のＮＯで、ステップＳ２１０８のＮＯ）、時間マージ候補のＬＸの参照インデックスrefIdxLXColをデフォルト値の０に設定する（ステップＳ２１１０）。
【０１０８】
Ｌ０，Ｌ１それぞれにおいて行うステップＳ２１０４からステップＳ２１１０までの処理を行い（ステップＳ２１０３〜Ｓ２１１１）、本参照インデックス導出処理を終了する。
【０１０９】
次に、図１４のＳ１０３の異なる時間のマージ候補の導出方法について詳細に説明する。図１７は図１４のステップＳ１０３の時間マージ候補導出処理手順を説明するフローチャートである。
【０１１０】
まず、図２６のビットストリームの符号化および復号の共通規則であるシンタックス規則の一例に示すように、スライス単位でスライスヘッダに記述されるスライスタイプslice_typeと時間方向の予測動きベクトルの候補、またはマージ候補を導出する際に用いる異なる時間のピクチャcolPicが処理対象の予測ブロックが含まれるピクチャのＬ０の参照リスト或いはＬ１の参照リストのどちらに登録されている参照ピクチャを使用するかを示すフラグcollocated_from_l0_flagにより、異なる時間のピクチャcolPicを導出する（ステップＳ３１０１）。
【０１１１】
図１８は図１７のステップＳ３１０１の異なる時間のピクチャcolPicの導出処理手順を説明するフローチャートである。スライスタイプslice_typeがＢスライスで、フラグcollocated_from_l0_flagが０の場合（ステップＳ３２０１のＹＥＳ、ステップＳ３２０２のＹＥＳ）、RefPicList1[0]、すなわち参照リストＬ１の参照インデックスが０のピクチャが異なる時間のピクチャcolPicとなる（ステップＳ３２０３）。そうでない場合、すなわちスライスタイプslice_typeがＢスライスで前述のフラグcollocated_from_l0_flagが１の場合（ステップＳ３２０１のＹＥＳ、ステップＳ３２０２のＮＯ）、またはスライスタイプslice_typeがＰスライスの場合（ステップＳ３２０１のＮＯ、Ｓ３２０４のＹＥＳ）、RefPicList0[0]、すなわち参照リストＬ０の参照インデックスが０のピクチャが異なる時間のピクチャcolPicとなる（ステップＳ３２０５）。
【０１１２】
次に、図１７のフローチャートに戻り、異なる時間の予測ブロックcolPUを導出し、符号化情報を取得する（ステップＳ３１０２）。
【０１１３】
図１９は図１７のステップＳ３１０２の異なる時間のピクチャcolPicの予測ブロックcolPUの導出処理手順を説明するフローチャートである。
【０１１４】
まず、異なる時間のピクチャcolPic内で処理対象の予測ブロックと同一位置の右下（外側）に位置する予測ブロックを異なる時間の予測ブロックcolPUとする（ステップＳ３３０１）。この予測ブロックは図９の予測ブロックＴ０に相当する。
【０１１５】
次に、異なる時間の予測ブロックcolPUの符号化情報を取得する（ステップＳ３３０２）。異なる時間の予測ブロックcolPUのPredModeが利用できないか、異なる時間の予測ブロックcolPUの予測モードPredModeがイントラ予測（MODE_INTRA）である場合（ステップＳ３３０３のＹＥＳ、ステップＳ３３０４のＹＥＳ）、異なる時間のピクチャcolPic内で処理対象の予測ブロックと同一位置の中央左上に位置する予測ブロックを異なる時間の予測ブロックcolPUとする（ステップＳ３３０５）。この予測ブロックは図９の予測ブロックＴ１に相当する。
【０１１６】
次に、図１７のフローチャートに戻り、符号化／復号対象の予測ブロックと同位置の他ピクチャの予測ブロックから導出されるＬ０の予測動きベクトルmvL0Colと時間マージ候補Ｃｏｌが有効か否かを示すフラグavailableFlagL0Colを導出するとともに（ステップＳ３１０３）、Ｌ１の予測動きベクトルmvL1Colと時間マージ候補Ｃｏｌが有効か否かを示すフラグavailableFlagL1Colを導出する。さらに、フラグavailableFlagL0Col またはフラグavailableFlagL1Colが1の場合に、時間マージ候補Ｃｏｌが有効か否かを示すフラグavailableFlagColを1に設定する。
【０１１７】
図２０は図１７のステップＳ３１０３、ステップＳ３１０４の時間マージ候補のインター予測情報の導出処理手順を説明するフローチャートである。Ｌ０またはＬ１で、時間マージ候補の導出対象のリストをＬＸとし、ＬＸを用いた予測をＬＸ予測とする。以下、断りのない限り、この意味で用いる。時間マージ候補のＬ０の導出処理であるステップＳ３１０３として呼び出される際には、ＬＸがＬ０となり、時間マージ候補のＬ１の導出処理であるステップＳ３１０４として呼び出される際には、ＬＸがＬ１となる。
【０１１８】
異なる時間の予測ブロックcolPUの予測モードPredModeがイントラ予測（MODE_INTRA）か、利用できない場合（ステップＳ３４０１のＮＯ、ステップＳ３４０２のＮＯ）、フラグavailableFlagLXColとフラグpredFlagLXColを共に０とし（ステップＳ３４０３）、動きベクトルmvLXColを（０，０）として（ステップＳ３４０４）、本時間マージ候補のインター予測情報の導出処理を終了する。
【０１１９】
予測ブロックcolPUが利用できて予測モードPredModeがイントラ予測（MODE_INTRA）でない場合（ステップＳ３４０１のＹＥＳ、ステップＳ３４０２のＹＥＳ）、以下の手順でmvColとrefIdxColとavailableFlagColを導出する。
【０１２０】
予測ブロックcolPUのＬ０予測が利用されているかどうかを示すフラグPredFlagL0[xPCol][yPCol]が０の場合（ステップＳ３４０５のＹＥＳ）、予測ブロックcolPUの予測モードはPred_L1であるので、動きベクトルmvColが予測ブロックcolPUのＬ１の動きベクトルであるMvL1[xPCol][yPCol]と同じ値に設定され（ステップＳ３４０６）、参照インデックスrefIdxColがＬ１の参照インデックスRefIdxL1[xPCol][yPCol]と同じ値に設定され（ステップＳ３４０７）、リストListColがＬ１に設定される（ステップＳ３４０８）。ここで、xPCol、yPColは異なる時間のピクチャcolPic内での予測ブロックcolPUの左上の画素の位置を示すインデックスである。
【０１２１】
一方、予測ブロックcolPUのＬ０予測フラグPredFlagL0[xPCol][yPCol]が０でない場合（図２０のステップＳ３４０５のＮＯ）、予測ブロックcolPUのＬ１予測フラグPredFlagL1[xPCol][yPCol]が０かどうかを判定する。予測ブロックcolPUのＬ１予測フラグPredFlagL1[xPCol][yPCol]が０の場合（ステップＳ３４０９のＹＥＳ）、動きベクトルmvColが予測ブロックcolPUのＬ０の動きベクトルであるMvL0[xPCol][yPCol]と同じ値に設定され（ステップＳ３４１０）、参照インデックスrefIdxColがＬ０の参照インデックスRefIdxL0[xPCol][yPCol]と同じ値に設定され（ステップＳ３４１１）、リストListColがＬ０に設定される（ステップＳ３４１２）。
【０１２２】
予測ブロックcolPUのＬ０予測フラグPredFlagL0[xPCol][yPCol]と予測ブロックcolPUのＬ１予測フラグPredFlagL1[xPCol][yPCol]が共に０でない場合（ステップＳ３４０５のＮＯ、ステップＳ３４０９のＮＯ）、予測ブロックcolPUのインター予測モードは双予測（Pred_BI）であるので、Ｌ０、Ｌ１の２つの動きベクトルから、一方を選択する（ステップＳ３４１３）。
【０１２３】
図２１は予測ブロックcolPUのインター予測モードが双予測（Pred_BI）のときの時間マージ候補のインター予測情報の導出処理手順を示すフローチャートである。
【０１２４】
まず、すべての参照リストに登録されているすべてのピクチャのＰＯＣが現在の符号化／復号対象ピクチャのＰＯＣより小さいかどうかを判定し（ステップＳ３５０１）、予測ブロックcolPUのすべての参照リストであるＬ０及びＬ１に登録されているすべてのピクチャのＰＯＣが現在の符号化／復号対象ピクチャのＰＯＣより小さい場合で（ステップＳ３５０１のＹＥＳ）、ＬＸがＬ０、即ち符号化／復号対象ピクチャのＬ０の動きベクトルの予測ベクトル候補を導出している場合（ステップＳ３５０２のＹＥＳ）、予測ブロックcolPUのＬ０の方のインター予測情報を選択し、ＬＸがＬ１、即ち符号化／復号対象ピクチャのＬ１の動きベクトルの予測ベクトル候補を導出している場合（ステップＳ３５０２のＮＯ）、予測ブロックcolPUのＬ１の方のインター予測情報を選択する。一方、予測ブロックcolPUのすべての参照リストＬ０及びＬ１に登録されているピクチャのＰＯＣの少なくとも１つが現在の符号化／復号対象ピクチャのＰＯＣより大きい場合で（ステップＳ３５０１のＮＯ）、フラグcollocated_from_l0_flagが０の場合（ステップＳ３５０３のＹＥＳ）、予測ブロックcolPUのＬ０の方のインター予測情報を選択し、フラグcollocated_from_l0_flagが１の場合（ステップＳ３５０３のＮＯ）、予測ブロックcolPUのＬ１の方のインター予測情報を選択する。
【０１２５】
予測ブロックcolPUのＬ０の方のインター予測情報を選択する場合（ステップのＹＥＳ、ステップＳ３５０３のＹＥＳ）、動きベクトルmvColがMvL0[xPCol][yPCol]と同じ値に設定され（ステップＳ３５０４）、参照インデックスrefIdxColがRefIdxL0[xPCol][yPCol]と同じ値に設定され（ステップＳ３５０５）、リストListColがＬ０に設定される（ステップＳ３５０６）。
【０１２６】
予測ブロックcolPUのＬ１の方のインター予測情報を選択する場合（ステップＳ２５０２のＮＯ、ステップＳ３５０３のＮＯ）、動きベクトルmvColがMvL1[xPCol][yPCol]と同じ値に設定され（ステップＳ３５０７）、参照インデックスrefIdxColがRefIdxL1[xPCol][yPCol]と同じ値に設定され（ステップＳ３５０８）、リストListColがＬ１に設定される（ステップＳ３５０９）。
【０１２７】
図２０に戻り、予測ブロックcolPUからインター予測情報が取得できたらフラグavailableFlagLXColとフラグpredFlagLXColを共に１とする（ステップＳ３４１４）。
【０１２８】
続いて、動きベクトルmvColをスケーリングして時間マージ候補のＬＸの動きベクトルmvLXColとする（ステップＳ３４１５）。この動きベクトルのスケーリング演算処理手順を図２２及び図２３を用いて説明する。
【０１２９】
図２２は図２０のステップＳ３４１５の動きベクトルのスケーリング演算処理手順を示すフローチャートである。
【０１３０】
異なる時間のピクチャcolPicのＰＯＣから、予測ブロックcolPUのリストListColで参照する参照インデックスrefIdxColに対応する参照ピクチャのＰＯＣを減算してピクチャ間距離ｔｄを導出する（ステップＳ３６０１）。なお、異なる時間のピクチャcolPicよりも予測ブロックcolPUのリストListColで参照する参照ピクチャのＰＯＣの方が表示順序で前の場合、ピクチャ間距離ｔｄは正の値となり、異なる時間のピクチャcolPicよりも予測ブロックcolPUのリストListColで参照する参照ピクチャのＰＯＣの方が表示順序で後の場合、ピクチャ間距離ｔｄは負の値となる。
ｔｄ＝異なる時間のピクチャcolPicのＰＯＣ−予測ブロックcolPUのリストListColで参照する参照ピクチャのＰＯＣ
【０１３１】
現在の符号化／復号対象ピクチャのＰＯＣから図１４のステップＳ１０２で導出された時間マージ候補のＬＸの参照インデックスに対応する参照ピクチャのＰＯＣを減算してピクチャ間距離ｔｂを導出する（ステップＳ３６０２）。なお、現在の符号化／復号対象ピクチャよりも現在の符号化／復号対象ピクチャのリストＬＸで参照する参照ピクチャの方が表示順序で前の場合、ピクチャ間距離ｔｂは正の値となり、現在の符号化／復号対象ピクチャのリストＬＸで参照する参照ピクチャの方が表示順序で後の場合、ピクチャ間距離ｔｂは負の値となる。
ｔｂ＝現在の符号化／復号対象ピクチャのＰＯＣ−時間マージ候補のＬＸの参照インデックスに対応する参照ピクチャのＰＯＣ
【０１３２】
続いて、ピクチャ間距離ｔｄとｔｂを比較し（ステップＳ３６０３）、ピクチャ間距離ｔｄとｔｂが等しい場合（ステップＳ３６０３のＹＥＳ）、時間マージ候補のＬＸの動きベクトルmvLXColを動きベクトルmvColと同じ値に設定して（ステップＳ３６０４）、本スケーリング演算処理を終了する。
mvLXCol＝mvCol
【０１３３】
一方、ピクチャ間距離ｔｄとｔｂが等しくない場合（ステップＳ３６０３のＮＯ）、次式によりmvColにスケーリング係数ｔｂ／ｔｄを乗じることでスケーリング演算処理を行い（ステップＳ３６０５）、スケーリングされた時間マージ候補のＬＸの動きベクトルmvLXColを得る。
mvLXCol＝ｔｂ / ｔｄ * mvCol
【０１３４】
また、ステップＳ３６０５のスケーリング演算を整数精度の演算で行う場合の例を図２３に示す。図２３のステップＳ３６０６〜ステップＳ３６０８の処理が、図２２のステップＳ３６０５の処理に相当する。
【０１３５】
まず、図２２のフローチャートと同様に、ピクチャ間距離ｔｄとピクチャ間距離ｔｂを導出する（ステップＳ３６０１、ステップＳ３６０２）。
【０１３６】
続いて、ピクチャ間距離ｔｄとｔｂを比較し（ステップＳ３６０３）、ピクチャ間距離ｔｄとｔｂが等しい場合（ステップＳ３６０３のＹＥＳ）、図２２のフローチャートと同様に、時間マージ候補のＬＸの動きベクトルmvLXColを動きベクトルmvColと同じ値に設定して（ステップＳ３６０４）、本スケーリング演算処理を終了する。
mvLXCol＝mvCol
【０１３７】
一方、ピクチャ間距離ｔｄとｔｂが等しくない場合（ステップＳ３６０３のＮＯ）、次式により変数ｔｘを導出する（ステップＳ３６０６）。
tx = ( 16384 + Abs( td / 2 ) ) / td
【０１３８】
続いて、次式によりスケーリング係数DistScaleFactorを導出する（ステップＳ３６０７）。
DistScaleFactor = ( tb * tx + 32 ) >> 6
【０１３９】
続いて、次式により、スケーリングされた時間マージ候補のＬＸの動きベクトルmvLXColを得る（ステップＳ３６０８）。
mvLXCol = ClipMv( Sign( DistScaleFactor * mvCol ) * ( (Abs( DistScaleFactor * mvCol ) + 127 ) >> 8 ) )
【０１４０】
次に、図１４のステップＳ１０４のマージ候補をマージ候補リストに登録する方法について詳細に説明する。図２４はマージ候補リストへのマージ候補の登録処理手順を示すフローチャートである。本方式では、優先順位をつけて、優先順位の高いものからマージ候補リストmergeCandListに予測動きベクトルの候補を登録することで、マージインデックスmerge_idx[x0][y0]の符号量を削減する。優先順位の高い要素をマージ候補リストの前方に配置することで、符号量を削減する。例えば、マージ候補リストmergeCandListの要素が５個の場合、マージ候補リストのインデックス０を「０」、インデックス１を「１０」、インデックス２を「１１０」、インデックス３を「１１１０」、インデックス４を「１１１１０」とすることで、インデックス０を表す符号量が１ビットとなり、インデックス０に発生頻度が高いと考えられる要素を登録することで、符号量を削減する。
【０１４１】
マージ候補リストmergeCandListはリスト構造を成し、マージ候補リスト内部の所在を示すマージインデックスと、インデックスに対応するマージ候補を要素として格納する記憶領域が設けられている。マージインデックスの数字は０から開始され、マージ候補リストmergeCandListの記憶領域に、マージ候補が格納される。以降の処理では、マージ候補リストmergeCandListに登録されたマージインデックスｉのマージ候補となる予測ブロックは、mergeCandList[i]で表すこととし、マージ候補リストmergeCandListとは配列表記をすることで区別することとする。
【０１４２】
まず、availableFlagAが１の場合（ステップＳ４１０１のＹＥＳ）、マージ候補リストmergeCandListの先頭にマージ候補Ａを登録する（ステップＳ４１０２）。
続いて、availableFlagBが１の場合（ステップＳ４１０３のＹＥＳ）、マージ候補リストmergeCandListの最後にマージ候補Ｂを登録する（ステップＳ４１０４）。
続いて、availableFlagCが１の場合（ステップＳ４１０５のＹＥＳ）、マージ候補リストmergeCandListの最後にマージ候補Ｃを登録する（ステップＳ４１０６）。
続いて、availableFlagDが１の場合（ステップＳ４１０７のＹＥＳ）、マージ候補リストmergeCandListの最後にマージ候補Ｄを登録する（ステップＳ４１０８）。
続いて、availableFlagEが１の場合（ステップＳ４１０９のＹＥＳ）、マージ候補リストmergeCandListの最後にマージ候補Ｅを登録する（ステップＳ４１１０）。
続いて、availableFlagColが１の場合（ステップＳ４１０９のＹＥＳ）、マージ候補リストmergeCandListの最後にマージ候補Ｃｏｌを登録する（ステップＳ４１１０）。
【０１４３】
なお、マージモードにおいて、左に隣接する予測ブロックＡ及び上に隣接する予測ブロックＢは符号化／復号対象の予測ブロックと一体となる動きになることが多いので、予測ブロックＡ、Ｂのインター予測情報が取得できる場合には、マージ候補Ａ、Ｂを他のマージ候補Ｃ，Ｄ，Ｅ，Ｃｏｌよりも優先的にマージ候補リストの前方に登録する。
【０１４４】
図１２において、動画像符号化装置のインター予測情報導出部１０４の符号化情報選択部１３７では、マージ候補リストに登録されているマージ候補の中から、マージ候補を選択し、マージインデックスおよびマージインデックスに対応するマージ候補のインター予測情報を動き補償予測部１０５に供給する。
【０１４５】
マージ候補の選択においては、予測方法決定部１０７と同様の方法を用いることができる。それぞれのマージ候補ごとに符号化情報及び残差信号の符号量と予測画像信号と画像信号との間の符号化歪を導出し、最も少ない発生符号量と符号化歪となるマージ候補が決定される。それぞれのマージ候補毎にマージモードの符号化情報であるマージインデックスのシンタックス要素merge_idxのエントロピー符号化を行い、符号化情報の符号量を算出する。さらに、それぞれのマージ候補毎に動き補償予測部１０５と同様の方法で各マージ候補のインター予測情報に応じて動き補償した予測画像信号と、画像メモリ１０１から供給される符号化対象の画像信号との予測残差信号を符号化した予測残差信号の符号量を算出する。符号化情報、即ちマージインデックスの符号量と予測残差信号の符号量とが加算された総発生符号量を算出し評価値とする。
【０１４６】
また、こうした予測残差信号を符号化後に、歪量評価の為に復号し、符号化により生じる元の画像信号との誤差を表す比率として符号化歪が算出される。これら総発生符号量と符号化歪とをマージ候補毎に比較することで、少ない発生符号量と符号化歪となる符号化情報が決定される。決定された符号化情報に対応するマージインデックスが、予測ブロック単位の第２のシンタックスパターンで表されるフラグmerge_idxとして符号化される。
尚、ここで算出される発生符号量は、符号化過程をシミュレートしたものであることが望ましいが、簡便に近似したり、概算することも可能である。
【０１４７】
一方、図１３において、動画像符号化装置のインター予測情報導出部２０５の符号化情報選択部２３７では、マージ候補リストに登録されているマージ候補の中から、供給されたマージインデックスに対応するマージ候補を選択し、マージ候補のインター予測情報を動き補償予測部２０６に供給するとともに、符号化情報格納メモリ２１０に格納する。
【０１４８】
以上に述べた本実施の形態においては、スライス単位でマージ候補リストmergeCandListに登録される最終的なマージ候補数finalNumMergeCandを設定する。以下、本実施の形態をいくつかの実施例に分けて説明する。まず、本実施の形態の実施例１について説明する。本実施の形態の実施例１においては、スライスタイプ毎に符号化側と復号側で共通の最終マージ候補数finalNumMergeCandを規定する。ＭＰＥＧ−４ＡＶＣ／Ｈ．２６４等と同様に、本実施の形態に準拠する装置、ソフトウェアまたはビットストリームは、主に目的や用途別に定義された処理機能の集合を表すプロファイルと画像サイズやフレームレートにも関係する処理の負荷や使用メモリ量等の処理能力を表すレベルを定義することができ、プロファイルとレベルによって、装置やソフトウェアの性能、またはビットストリームをデコードするのに必要な性能を示す。プロファイルまたはレベルのいずれか一方、またはプロファイルとレベルの組み合わせに応じてスライスタイプ毎に最終マージ候補数finalNumMergeCandの値を規定してもよいし、プロファイルやレベルに係わらずスライスタイプ毎に最終マージ候補数finalNumMergeCandの値を規定してもよい。例えば、ＩスライスとＰスライスのみを利用して符号化／復号するシンプルな機能で構成されるプロファイルにおいては、Ｐスライスの最終マージ候補数finalNumMergeCandを３に規定する。Ｉスライス、Ｐスライスに加えてＢスライスも利用して符号化／復号する複雑で符号化効率のよい機能で構成されるプロファイルにおいては、Ｐスライス、及びＢスライスの最終マージ候補数finalNumMergeCandを共に同数の５に規定してもよいが、Ｐスライスの最終マージ候補数finalNumMergeCandをＢスライスの最終マージ候補数finalNumMergeCandよりも小さい数である３に規定することで、Ｐスライスのマージインデックスの符号量を小さく抑えるとともに、マージインデックスの符号化／復号に係わる処理量を削減することができる。
【０１４９】
スライスタイプがＬ０予測のみを利用できるＰスライスの場合、Ｌ０予測、Ｌ１予測、双予測を利用できるＢスライスに比べて、インター予測が選択されにくいのでマージ候補リストに登録されるマージ候補が得られにくく、またマージ候補同士のインター予測情報が同一になりやすいので、マージ候補リストに登録されるマージ候補数は小さくなりやすい。したがって、ＰスライスではＢスライスよりも最終的なマージ候補数を小さく設定してもＢスライスほど符号化効率が低下せず、マージインデックスの符号量を小さく抑えるとともに、マージインデックスの符号化／復号に係わる処理量を削減することができる。
符号化効率の高いＢスライスではなく、Ｐスライスにより符号化／復号することの理由の一つとして、Ｐスライスの方が処理量が少ないことがあげられる。特に、ＩスライスとＰスライスのみを利用して符号化／復号するシンプルな機能で構成されるプロファイルは、少ない処理量で符号化／復号するために設定されるので、Ｐスライスの最終マージ候補数finalNumMergeCandを小さい数に設定してマージインデックスの符号化／復号に係わる処理量を削減することの効果は大きい。
【０１５０】
図２５は本実施の形態の実施例１の方法による符号化側および復号側で共通の最終マージ候補数finalNumMergeCandの設定処理手順を説明するフローチャートである。最終マージ候補数finalNumMergeCandは符号化装置ではヘッダ情報設定部１１７で設定され、復号装置では第１符号化ビット列復号部２１２で設定される。スライスタイプslice_typeがＰスライスの場合（図２５のステップＳ２０１のＹＥＳ）、最終マージ候補数finalNumMergeCandをＰスライスの規定数（本実施の形態では３）に設定する（図２５のステップＳ２０３）。スライスタイプslice_typeがＢスライスの場合（図２５のステップＳ２０１のＮＯ、ステップＳ２０２のＹＥＳ）、最終マージ候補数finalNumMergeCandをＢスライスの規定数（本実施の形態では５）に設定する（図２５のステップＳ２０４）。スライスタイプslice_typeがＩスライスの場合（図２５のステップＳ２０１のＮＯ、ステップＳ２０２のＮＯ）、最終マージ候補数finalNumMergeCandを０に設定する（図２５のステップＳ２０５）。
【０１５１】
なお、最終マージ候補数finalNumMergeCandと同様に、プロファイルまたはレベルのいずれか一方、またはプロファイルとレベルの組み合わせに応じてスライスタイプ毎に空間マージ候補数の上限値maxNumSpatialMergeCandの値を規定してもよいし、プロファイルやレベルに係わらずスライスタイプ毎に空間マージ候補数の上限値maxNumSpatialMergeCandの値を規定してもよい。符号化効率と処理量を考慮して、符号化効率を重視するケース（プロファイル、レベル、またはスライスタイプ）では空間マージ候補数の上限値maxNumSpatialMergeCandを大きな値に規定し、処理量を重視するケースでは空間マージ候補数の上限値maxNumSpatialMergeCandを小さな値に規定する。
【０１５２】
次に本実施の形態の実施例２について説明する。本実施の形態の実施例２では、図２６のビットストリームの符号化および復号の共通規則であるシンタックス規則の一例に示すように、スライス単位でスライスヘッダに最終的なマージ候補数finalNumMergeCandを示すシンタックス要素num_merge_candを設定する。ただし、スライスタイプ毎に最終マージ候補数の上限値を規定する。プロファイルとレベルの組み合わせに応じてスライスタイプ毎に最終マージ候補数の上限値を規定してもよいし、プロファイルやレベルに係わらずスライスタイプ毎に最終マージ候補数の上限値を規定してもよい。例えば、ＩスライスとＰスライスのみを利用して符号化／復号するシンプルな機能で構成されるプロファイルにおいては、Ｐスライスの最終マージ候補数の上限値を３と規定する。Ｉスライス、Ｐスライスに加えてＢスライスも利用して符号化／復号する複雑で符号化効率のよい機能で構成されるプロファイルにおいては、Ｐスライス、及びＢスライスの最終マージ候補数の上限値を共に同数の５に規定してもよいし、Ｐスライスの最終マージ候補数の上限値をＢスライスの最終マージ候補数の上限値よりも小さい数に規定することもできる。
【０１５３】
図２７は本実施の形態の実施例２の方法による符号化側での最終マージ候補数finalNumMergeCandの設定処理手順を説明するフローチャートであり、図２８は本実施の形態の実施例２の方法による復号側での最終マージ候補数finalNumMergeCandの設定処理手順を説明するフローチャートである。最終マージ候補数finalNumMergeCandは符号化装置ではヘッダ情報設定部１１７で設定され、復号装置では第１符号化ビット列復号部２１２で設定される。符号化側ではスライスタイプslice_typeがＰスライスの場合（図２７のステップＳ２０１のＹＥＳ）、最終マージ候補数finalNumMergeCandを規定されたＰスライスの上限値と同じ値または上限値を超えない値（本実施の形態では３）に設定する（図２７のステップＳ２０６）。スライスタイプslice_typeがＢスライスの場合（図２７のステップＳ２０１のＮＯ、ステップＳ２０２のＹＥＳ）、最終マージ候補数finalNumMergeCandを規定されたＢスライスの上限値と同じ値または上限値を超えない値（本実施の形態では５）に設定する（図２７のステップＳ２０７）。スライスタイプslice_typeがＩスライスの場合（図２７のステップＳ２０１のＮＯ、ステップＳ２０２のＮＯ）、最終マージ候補数finalNumMergeCandを０に設定する（図２７のステップＳ２０５）。さらに、スライス単位で設定された最終マージ候補数finalNumMergeCandを示すシンタックス要素numMergeCandをエントロピー符号化する（図２７のステップＳ２０８）。復号側ではビットストリームを復号してシンタックス要素numMergeCandから最終マージ候補数finalNumMergeCandを導出する（図２８のＳ２０９）。
【０１５４】
なお、シンタックス要素max_num_spatial_merge_candの値に応じて最終マージ候補数finalNumMergeCandとともに空間マージ候補数の上限値maxNumSpatialMergeCandを規定することもできる。この場合、最終マージ候補数finalNumMergeCandと空間マージ候補数の上限値maxNumSpatialMergeCandは同じ値を規定してもよいし、別の値を規定してもよい。プロファイル、レベル、またはスライスタイプに応じて、符号化効率と処理量を考慮して、符号化効率を重視するケースでは空間マージ候補数の上限値maxNumSpatialMergeCandを大きな値に規定し、処理量を重視するケースでは空間マージ候補数の上限値maxNumSpatialMergeCandを小さな値に規定する。
【０１５５】
または、図２６に示すように、スライス単位でスライスヘッダに空間マージ候補数の上限値maxNumSpatialMergeCandを示すシンタックス要素max_num_spatial_merge_candを設定することもできる。符号化側でシンタックス要素max_num_spatial_merge_candを符号化し、復号側ではビットストリームを復号して得られたシンタックス要素max_num_spatial_merge_candの値に応じた空間マージ候補数の上限値maxNumSpatialMergeCandに基づいて復号処理を行う。この場合、符号化側で符号化側の処理能力の範囲内で空間マージ候補数の上限値maxNumSpatialMergeCandを設定することで、空間マージ候補導出の処理量やマージ候補同一判定の処理量を制御する事ができる。
【０１５６】
以上述べた実施の形態の動画像符号化装置が出力する動画像の符号化ストリームは、実施の形態で用いられた符号化方法に応じて復号することができるように特定のデータフォーマットを有しており、動画像符号化装置に対応する動画像復号装置がこの特定のデータフォーマットの符号化ストリームを復号することができる。
【０１５７】
動画像符号化装置と動画像復号装置の間で符号化ストリームをやりとりするために、有線または無線のネットワークが用いられる場合、符号化ストリームを通信路の伝送形態に適したデータ形式に変換して伝送してもよい。その場合、動画像符号化装置が出力する符号化ストリームを通信路の伝送形態に適したデータ形式の符号化データに変換してネットワークに送信する動画像送信装置と、ネットワークから符号化データを受信して符号化ストリームに復元して動画像復号装置に供給する動画像受信装置とが設けられる。
【０１５８】
動画像送信装置は、動画像符号化装置が出力する符号化ストリームをバッファするメモリと、符号化ストリームをパケット化するパケット処理部と、パケット化された符号化データをネットワークを介して送信する送信部とを含む。動画像受信装置は、パケット化された符号化データをネットワークを介して受信する受信部と、受信された符号化データをバッファするメモリと、符号化データをパケット処理して符号化ストリームを生成し、動画像復号装置に提供するパケット処理部とを含む。
【０１５９】
以上の符号化及び復号に関する処理は、ハードウェアを用いた伝送、蓄積、受信装置として実現することができるのは勿論のこと、ＲＯＭ（リード・オンリ・メモリ）やフラッシュメモリ等に記憶されているファームウェアや、コンピュータ等のソフトウェアによっても実現することができる。そのファームウェアプログラム、ソフトウェアプログラムをコンピュータ等で読み取り可能な記録媒体に記録して提供することも、有線あるいは無線のネットワークを通してサーバから提供することも、地上波あるいは衛星ディジタル放送のデータ放送として提供することも可能である。
【０１６０】
以上、本発明を実施の形態をもとに説明した。実施の形態は例示であり、それらの各構成要素や各処理プロセスの組合せにいろいろな変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者に理解されるところである。
【符号の説明】
【０１６１】
１０１画像メモリ、１１７ヘッダ情報設定部、１０２動きベクトル検出部、１０３差分動きベクトル算出部、１０４インター予測情報導出部、１０５動き補償予測部、１０６イントラ予測部、１０７予測方法決定部、１０８残差信号生成部、１０９直交変換・量子化部、１１８第１符号化ビット列生成部、１１０第２符号化ビット列生成部、１１１第３符号化ビット列生成部、１１２多重化部、１１３逆量子化・逆直交変換部、１１４復号画像信号重畳部、１１５符号化情報格納メモリ、１１６復号画像メモリ、１３０空間マージ候補生成部、１３１時間マージ候補の参照インデックス導出部、１３２時間マージ候補生成部、１３３マージ候補登録部、１３４マージ候補同一判定部、１３５マージ候補数制限部、１３６マージ候補補充部、１３７符号化情報選択部、２０１分離部、２１２第１符号化ビット列復号部、２０２第２符号化ビット列復号部、２０３第３符号化ビット列復号部、２０４動きベクトル算出部、２０５インター予測情報導出部、２０６動き補償予測部、２０７イントラ予測部、２０８逆量子化・逆直交変換部、２０９復号画像信号重畳部、２１０符号化情報格納メモリ、２１１復号画像メモリ、２３０空間マージ候補生成部、２３１時間マージ候補の参照インデックス導出部、２３２時間マージ候補生成部、２３３マージ候補登録部、２３４マージ候補同一判定部、２３５マージ候補数制限部、２３６マージ候補補充部、２３７符号化情報選択部。

【特許請求の範囲】
【請求項１】
動画像の各ピクチャを分割したブロック単位で動き補償予測を用いて前記動画像を符号化する動画像符号化装置であって、
符号化対象の予測ブロックに隣接する予測ブロック、または符号化対象の予測ブロックと時間的に異なる符号化済みのピクチャにおける前記符号化対象の予測ブロックと同一位置あるいはその付近に存在する予測ブロックのインター予測情報から、インター予測情報の候補を導出する予測情報導出部と、
処理機能の集合を示すプロファイルおよびデコード処理能力を示すレベルの少なくとも一方に応じて前記インター予測情報の候補の候補数を制限する候補数制限部と、
候補数の制限された前記インター予測情報の候補から１つのインター予測情報の候補を選択して、その選択したインター予測情報の候補により前記符号化対象の予測ブロックのインター予測を行う動き補償予測部とを備えることを特徴とする動画像符号化装置。
【請求項２】
動画像の各ピクチャを分割したブロック単位で動き補償予測を用いて前記動画像を符号化する動画像符号化装置であって、
符号化対象の予測ブロックに隣接する予測ブロック、または符号化対象の予測ブロックと時間的に異なる符号化済みのピクチャにおける前記符号化対象の予測ブロックと同一位置あるいはその付近に存在する予測ブロックのインター予測情報から、インター予測情報の候補を導出する予測情報導出部と、
スライスタイプに応じて前記インター予測情報の候補の候補数を制限する候補数制限部と、
候補数の制限された前記インター予測情報の候補から１つのインター予測情報の候補を選択して、その選択したインター予測情報の候補により前記符号化対象の予測ブロックのインター予測を行う動き補償予測部とを備えることを特徴とする動画像符号化装置。
【請求項３】
前記候補数制限部は、Ｐスライスに対する前記インター予測情報の候補数をＢスライスに対する前記インター予測情報の候補数より少なく設定することを特徴とする請求項２に記載の動画像符号化装置。
【請求項４】
動画像の各ピクチャを分割したブロック単位で動き補償予測を用いて前記動画像を符号化する動画像符号化方法であって、
符号化対象の予測ブロックに隣接する予測ブロック、または符号化対象の予測ブロックと時間的に異なる符号化済みのピクチャにおける前記符号化対象の予測ブロックと同一位置あるいはその付近に存在する予測ブロックのインター予測情報から、インター予測情報の候補を導出する予測情報導出ステップと、
処理機能の集合を示すプロファイルおよびデコード処理能力を示すレベルの少なくとも一方に応じて前記インター予測情報の候補の候補数を制限する候補数制限ステップと、
候補数の制限された前記インター予測情報の候補から１つのインター予測情報の候補を選択して、その選択したインター予測情報の候補により前記符号化対象の予測ブロックのインター予測を行う動き補償予測ステップとを備えることを特徴とする動画像符号化方法。
【請求項５】
動画像の各ピクチャを分割したブロック単位で動き補償予測を用いて前記動画像を符号化する動画像符号化方法であって、
符号化対象の予測ブロックに隣接する予測ブロック、または符号化対象の予測ブロックと時間的に異なる符号化済みのピクチャにおける前記符号化対象の予測ブロックと同一位置あるいはその付近に存在する予測ブロックのインター予測情報から、インター予測情報の候補を導出する予測情報導出ステップと、
スライスタイプに応じて前記インター予測情報の候補の候補数を制限する候補数制限ステップと、
候補数の制限された前記インター予測情報の候補から１つのインター予測情報の候補を選択して、その選択したインター予測情報の候補により前記符号化対象の予測ブロックのインター予測を行う動き補償予測ステップとを備えることを特徴とする動画像符号化方法。
【請求項６】
動画像の各ピクチャを分割したブロック単位で動き補償予測を用いて前記動画像を符号化する動画像符号化プログラムであって、
符号化対象の予測ブロックに隣接する予測ブロック、または符号化対象の予測ブロックと時間的に異なる符号化済みのピクチャにおける前記符号化対象の予測ブロックと同一位置あるいはその付近に存在する予測ブロックのインター予測情報から、インター予測情報の候補を導出する予測情報導出ステップと、
処理機能の集合を示すプロファイルおよびデコード処理能力を示すレベルの少なくとも一方に応じて前記インター予測情報の候補の候補数を制限する候補数制限ステップと、
候補数の制限された前記インター予測情報の候補から１つのインター予測情報の候補を選択して、その選択したインター予測情報の候補により前記符号化対象の予測ブロックのインター予測を行う動き補償予測ステップとをコンピュータに実行させることを特徴とする動画像符号化プログラム。
【請求項７】
動画像の各ピクチャを分割したブロック単位で動き補償予測を用いて前記動画像を符号化する動画像符号化プログラムであって、
符号化対象の予測ブロックに隣接する予測ブロック、または符号化対象の予測ブロックと時間的に異なる符号化済みのピクチャにおける前記符号化対象の予測ブロックと同一位置あるいはその付近に存在する予測ブロックのインター予測情報から、インター予測情報の候補を導出する予測情報導出ステップと、
スライスタイプに応じて前記インター予測情報の候補の候補数を制限する候補数制限ステップと、
候補数の制限された前記インター予測情報の候補から１つのインター予測情報の候補を選択して、その選択したインター予測情報の候補により前記符号化対象の予測ブロックのインター予測を行う動き補償予測ステップとをコンピュータに実行させることを特徴とする動画像符号化プログラム。

【図１】