説明

動画像符号化装置および動画像符号化方法

【課題】動画像符号化装置において画面内予測符号化を行う際に、輝度成分の予測画像を用いて色差成分の予測画像を生成する予測モードで適切な色差成分の予測画像を生成することを可能とする。
【解決手段】本発明に係る動画像符号化装置100は、色差サンプル位置情報生成部108において、符号化対象ピクチャの色差成分のサンプル位置が輝度成分のサンプル位置に対してどのような位置関係にあるかを示す色差サンプル位置情報を生成し符号列に記述することで、画面内予測符号化における輝度成分の予測画像を用いて色差成分の予測画像を生成する予測モードで処理を行う際に、使用する輝度成分の画素を色差サンプル位置情報に基づいた補正を行うことで正確な予測画像を生成することを可能とする。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、プログレッシブ形式の動画像信号およびインターレース形式の動画像信号を入力として符号化する動画像符号化装置および動画像符号化方法に関するものである。
【背景技術】
【0002】
近年、マルチメディアアプリケーションの発展に伴い、画像、音声及びテキストなど、あらゆるメディアの情報を統一的に扱うことが一般的になってきた。また、ディジタル化された画像は膨大なデータ量を持つため、蓄積及び伝送のためには、画像の情報圧縮技術が不可欠である。一方で、圧縮した画像データを相互運用するためには、圧縮技術の標準化も重要である。例えば、画像圧縮技術の標準規格としては、ITU−T(国際電気通信連合 電気通信標準化部門)のH.261、H.263、H.264、ISO/IEC(国際標準化機構)のMPEG−1、MPEG−2、MPEG−4、MPEG−4AVCなどがある。また、現在は、ITU−TとISO/IECとの共同によるHEVCと呼ばれる次世代画像符号化方式の標準化活動が進んでいる。
【0003】
このような動画像の符号化では、符号化対象ピクチャを符号化単位ブロックに分割し、ブロック毎に時間方向および空間方向の冗長性を削減することによって情報量の圧縮を行う。時間的な冗長性の削減を目的とする画面間予測符号化では、前方または後方のピクチャを参照してブロック単位で動きの検出および予測画像の作成を行い、得られた予測画像と符号化対象ブロックとの差分画像を取得する。また空間的な冗長性の削減を目的とする画面内予測符号化では、周辺の符号化済みブロックの画素情報から予測画像の生成を行い、得られた予測画像と符号化対象ブロックとの差分画像を取得する。さらに得られた差分画像に対して離散コサイン変換等の直交変換および量子化を行い、可変長符号化を用いて符号列を生成することで情報量が圧縮される。
【0004】
また復号化では、前記符号化処理によって生成された符号列を解析して予測情報および残差係数情報を取得し、予測情報を用いて画面間予測復号化および画面内予測復号化を行って予測画像を生成し、残差係数情報に対して逆量子化および逆直交変換を行って差分画像を生成し、得られた予測画像と差分画像を加算することで最終的な出力画像を復元する。
【0005】
このとき符号化および復号化の対象となる動画像の形式として、プログレッシブ形式とインターレース形式との2種類の形式がある。
【0006】
プログレッシブ形式は、1画面全ての画素を同時に撮像し1枚のフレームとする形式である。一方、インターレース形式は、1画面の画素のうち偶数行目の画素のみを撮像したトップフィールドと奇数行目の画素のみを撮像したボトムフィールドとの2枚のフィールドで1枚のフレームを構成する形式である。
【0007】
プログレッシブ形式の動画像に対しては、図3にあるように1枚のフレームを1枚のピクチャとして符号化する。例えばFrm3はP_Frm1として符号化されている。画面間予測では符号化順で先に符号化が完了しているピクチャのみを参照することができる。そこで、図3にあるように表示順で入力されたピクチャを符号化順に並び替えることによって、画面間予測における参照ピクチャの参照をより効果的に行うことが可能となる。例えば、P_Frm1はI_Frm0のみが参照可能であり、B_Frm2はI_Frm0とP_Frm1が参照可能である。これを表示順に置き換えて考えると、P_Frm1はFrm3に相当するので前方向にあるFrm0のみが参照可能であるが、B_Frm2はFrm1に相当するので前方向にあるFrm0だけでなく、後方向にあるFrm3も同時に参照可能となる。なお、I_Frm0は他のピクチャを参照することなく画面内予測のみを行うピクチャである。
【0008】
一方、インターレース形式の動画像に対しては、最も簡単な方法として図4にあるように1枚のフィールドを1枚のピクチャとして符号化する方法がある。例えばFldT6とFldB7はそれぞれP_FldT2とP_FldB3のように個別のフィールド構造のピクチャとして符号化されている。このように表示順で入力されたピクチャを符号化順に並び替えることによって、プログレッシブ形式の符号化と同様に画面間予測における参照ピクチャの参照をより効果的に行うことが可能となる。
【0009】
図3および図4で説明した各ピクチャは輝度成分の画素と色差成分の画素とから構成されている。図5は、輝度成分と色差成分のそれぞれを画素値として取得するときのサンプル位置関係を説明するための図である。図中の×記号は輝度成分のサンプル位置、○記号は色差成分のサンプル位置を示している。
【0010】
一般に人間の目は色差成分の変化に対して鈍感である。そのため、1つのピクチャにおけるデータ量を削減するために色差成分を間引く方法が用いられる。間引き方法はいくつかの種類がある。たとえば、図5(a)は水平垂直方向ともに色差成分を1/2に間引く方法を示す。これは、4:2:0サンプリングと呼ばれる。この4:2:0サンプリングの場合、色差成分の垂直方向のサンプル位置は輝度成分のサンプル位置とは一致しない。つまり、色差成分は、輝度成分の中間の位置にサンプルされる。
【0011】
また、図5(b)は水平方向のみ1/2に間引く方法を示す。これは、4:2:2サンプリングと呼ばれる。さらに、図5(c)は間引きを行わない場合を示す。これは、4:4:4サンプリングと呼ばれる。
【0012】
図6は、水平垂直方向ともに1/2に間引く場合のプログレッシブ形式におけるフレーム構造とインターレース形式におけるフィールド構造とでのサンプル位置関係を示している。前述のとおり、フレーム構造では、全てのサンプル位置の画素を同時に撮像し1枚のフレームとするが、フィールド構造では、輝度成分と色差成分のそれぞれに対して、偶数行目の画素のみを撮像したトップフィールドと奇数行目の画素のみを撮像したボトムフィールドとの2枚のフィールドに分けられる。このとき、色差成分の垂直方向のサンプル位置は輝度成分のサンプル位置に対し、トップフィールドでは偶数行目に対して下方向に1/4画素ずらした位置、ボトムフィールドでは奇数行目に対して上方向に1/4画素ずらした位置となっている。
【0013】
次に、現在規格化が行われているHEVCの画面内予測符号化について図7を用いて詳しく説明する。画面内予測符号化では、符号化対象ブロックに隣接する既に符号化が完了しているブロックの画素を参照して、符号化対象ブロックと最も画素値の構成が近くなるような予測画像を生成する予測モードを選択する。これにより、符号化対象ブロックと予測画像との差分画像の情報量が最小化される。前記予測モードは、例えば、符号化対象ブロックの左隣接画素を右方向に延長して予測画像を生成するモード、符号化対象ブロックの左隣接画素および上隣接画素を右下方向に延長して予測画像を生成するモード等がある。前記予測モードは、輝度成分の予測画像を生成するための予測モードと、色差成分の予測画像を生成するための予測モードとが、それぞれ個別に定義され符号列に記述される。
【0014】
基本的に、輝度成分の画面内予測では輝度成分の隣接画素を参照して予測画像を生成し、色差成分の画面内予測では色差成分の隣接画素を参照して予測画像を生成する。しかし、色差成分の予測モードの1つとして、対応する輝度成分の画面内予測によって生成された予測画像を用いて色差成分の予測画像を生成する特別な予測モードがある。この予測モードは、図7に示すように、まず輝度成分の予測画像をダウンサンプルすることによって色差成分の画素数と一致するように変換して中間予測画像を生成する。さらに符号化対象ブロックに隣接する輝度成分および色差成分の画素を参照して、前記中間予測画像の画素値を補正することで、色差成分の予測画像を生成する。
【0015】
図7の例では、色差成分は輝度成分に対して水平垂直方向ともに1/2に間引いている。そのため、ダウンサンプルを行う際には、水平方向における偶数列目の上下2画素の輝度成分の平均値を求めることで中間予測画像の画素値とする。さらに、中間予測画像の画素値の補正のために符号化対象ブロックに隣接する輝度成分を参照する際には、上隣接画素に関しては偶数列目の画素のみを参照し、左隣接画素に関しては上下2画素の中間位置、つまり上下2画素の平均値に置き換えて参照する(非特許文献1および非特許文献2)。
【先行技術文献】
【非特許文献】
【0016】
【非特許文献1】JCTVC D503 : Working Draft 2 of High-Efficiency Video Coding (03/2011)
【非特許文献2】JCTVC-E266 : Chroma intra prediction by reconstructed luma samples (03/2011)
【発明の概要】
【発明が解決しようとする課題】
【0017】
しかしながら上記従来のHEVCの画面内予測符号化の構成では、図3のようにインターレース形式の動画像を入力として1枚のフィールドを1枚のピクチャとして符号化する場合、輝度成分の予測画像を用いて色差成分の予測画像を生成する予測モードにおいて、適切な予測画像を生成することができなくなる。
【0018】
図8は、符号化対象ピクチャがトップフィールドであった場合の、輝度成分の予測画像を用いて色差成分の予測画像を生成する予測モードの例である。このとき、色差成分の垂直方向のサンプル位置は、図6を用いて説明したように、偶数行目の輝度成分のサンプル位置に対して下方向に1/4画素ずらした位置となっている。
【0019】
図8の例では、上記従来のHEVCの画面内予測符号化の構成に従って、ダウンサンプルを行う際に、偶数列目の上下2画素の輝度成分の中間位置の画素値を中間予測画像の画素値とし、また、中間予測画像の画素値の補正を行う際に、左隣接の上下2画素の輝度成分の中間位置の画素値を参照している。
【0020】
しかし、前述のとおり、色差成分の垂直方向のサンプル位置は、輝度成分の垂直方向のサンプル位置の中間ではなく1/4画素ずらした位置であるため、ダウンサンプルおよび中間予測画像の画素値の補正において、上下2画素の輝度成分の中間位置の画素値を使用すると、位相のずれた予測画像が生成されてしまう。
【0021】
本発明は上記課題を解決するものであり、HEVCを用いた動画像符号化装置において、インターレース形式の動画像を入力として1枚のフィールドを1枚のピクチャとして符号化する場合でも、画面内予測符号化において、輝度成分の予測画像を用いて色差成分の予測画像を生成する予測モードを用いて、適切な色差成分の予測画像を生成することを可能とする。
【課題を解決するための手段】
【0022】
本発明の動画像符号化装置は、輝度成分および色差成分によって構成される動画像信号をピクチャ単位で符号化する動画像符号化装置であって、前記動画像信号の動画像形式がインターレース形式およびプログレッシブ形式のうちいずれの形式であるかを示す動画像形式情報、および前記輝度成分に対する前記色差成分の間引き方法に関する間引き情報に基づいて、符号化対象ピクチャにおける前記色差成分のサンプル位置に関するサンプル位置情報を生成するサンプル位置情報生成部と、前記符号化対象ピクチャにおける符号化処理単位であるブロック毎に、前記ブロックに隣接する既に符号化済みのブロックに含まれる輝度成分の画素である第1隣接画素を用いて輝度成分の画面内予測画像を生成し、加えて、生成した前記輝度成分の画面内予測画像、前記第1隣接画素、前記ブロックに隣接する既に符号化済みのブロックの色差成分の画素である第2隣接画素、および前記サンプル位置情報に基づいて、色差成分の画面内予測画像を生成する予測符号化部と、前記生成した輝度成分の画面内予測画像および前記色差成分の画面内予測画像に基づいて、前記符号化対象ピクチャを前記ブロックごとに符号化処理し、符号列を生成するピクチャデータ符号化部と、を備える。
【0023】
また好ましくは、前記予測符号化部は、前記サンプル位置情報に基づいて、前記輝度成分の画面内予測画像をダウンサンプリングすることにより前記色差成分の画素数と同じ画素数の中間予測画像を生成し、生成した前記中間予測画像に含まれる画素値を補正することにより、前記色差成分の画面内予測画像を生成する。
【0024】
また好ましくは、前記予測符号化部は、前記サンプル位置情報に基づいて、前記第1隣接画素を補正することにより補正隣接画素を生成し、生成した補正隣接画素および前記第2隣接画素の画素値の相関関係を用いて、前記輝度成分の画面内予測画像から前記色差成分の画面内予測画像を生成する。
【0025】
また好ましくは、前記サンプル位置情報生成部は、前記符号化対象ピクチャにおける前記色差成分のサンプル位置と、前記輝度成分のサンプル位置とのずれを示すシフト量を前記サンプル位置情報として生成する。
【0026】
また好ましくは、前記予測符号化部は、生成する前記中間予測画像の各画素のサンプル位置が、前記サンプル位置情報に示される前記色差成分のサンプル位置と一致するように、前記中間予測画像の各画素の値を前記輝度成分の画面内予測画像を構成する1つ以上の画素の値を用いて内挿補間することによって算出する。
【0027】
また好ましくは、前記予測符号化部は、生成する前記補正隣接画素の各画素のサンプル位置が、前記サンプル位置情報に示される前記色差成分のサンプル位置と一致するように、前記補正隣接画素の各画素の値を1つ以上の前記第1隣接画素の値を用いて内挿補間することによって算出する。
【0028】
また好ましくは、前記サンプル位置情報生成部は、前記動画像形式情報がインターレース形式を示す場合にのみ、前記動画像信号をフィールド構造としたときの前記色差成分のサンプル位置と前記輝度成分のサンプル位置とのずれを示す情報を有するサンプル位置情報を生成する。
【0029】
また好ましくは、前記サンプル位置情報生成部は、前記符号化対象ピクチャにおける前記色差成分のサンプル位置と前記輝度成分のサンプル位置との垂直方向に対するずれを示す情報のみを有するサンプル位置情報を生成する。
【0030】
また好ましくは、前記サンプル位置情報生成部は、前記符号化対象ピクチャにおける前記色差成分のサンプル位置と前記輝度成分のサンプル位置との垂直方向および水平方向に対するずれを示す情報を有するサンプル位置情報を生成する。
【0031】
また好ましくは、前記サンプル位置情報生成部は、前記符号化対象ピクチャが、インターレース形式のトップフィールドであるか、インターレース形式のボトムフィールドであるかを示す情報を有するサンプル位置情報を生成する。
【0032】
また好ましくは、前記ピクチャデータ符号化部は、前記符号列のヘッダ領域のうちピクチャ全体の符号化制御情報を記述する領域に、前記サンプル位置情報を記述する。
【0033】
また好ましくは、前記ピクチャデータ符号化部は、前記符号列のヘッダ領域のうちピクチャを分割した単位であるスライスに関する符号化制御情報を記述する領域に、前記サンプル位置情報を記述する。
【0034】
また好ましくは、前記シフト量は、前記輝度成分のサンプル位置の間隔の1/4を1単位とした値である。
【0035】
なお、本発明は、このような動画像符号化および動画像復号化装置として実現することができるだけでなく、このような動画像符号化および動画像復号化装置に含まれる各手段と同等の処理をプログラムや集積回路としても実現することもできる。
【発明の効果】
【0036】
以上より、本発明における動画像符号化装置は、インターレース形式の動画像を入力として1枚のフィールドを1枚のピクチャとして符号化する場合でも、画面内予測復号化において、輝度成分の予測画像を用いて色差成分の予測画像を生成する予測モードを用いて、適切な色差成分の予測画像を生成することができる。
【0037】
また、本発明における動画像復号化装置は、インターレース形式の動画像を入力として1枚のフィールドを1枚のピクチャとして符号化した符号列を復号化する場合でも、画面内予測復号化において、輝度成分の予測画像を用いて色差成分の予測画像を生成する予測モードを用いて、適切な色差成分の予測画像を生成することができる。
【図面の簡単な説明】
【0038】
【図1】本発明の実施の形態1に係る動画像符号化装置を示すブロック図である。
【図2】本発明の実施の形態2に係る動画像復号化装置を示すブロック図である。
【図3】従来のプログレッシブ形式の動画像の符号化方法を説明するための概念図である。
【図4】従来のインターレース形式の動画像の符号化方法を説明するための概念図である。
【図5】輝度成分と色差成分のサンプル位置の関係を説明するための概念図である。
【図6】インターレース形式における輝度成分と色差成分のサンプル位置の関係を説明するための概念図である。
【図7】従来の画面内予測における輝度成分の予測画像を用いて色差成分の予測画像を生成する予測モードの一例を説明するための概念図である。
【図8】従来の画面内予測における輝度成分の予測画像を用いて色差成分の予測画像を生成する予測モードの別の一例を説明するための概念図である。
【図9】本発明の実施の形態1に係る符号化処理のフローチャートである。
【図10】本発明の実施の形態における輝度成分の予測画像を用いて色差成分の予測画像を生成する予測モードの一例を説明するための概念図である。
【図11】本発明の実施の形態における輝度成分の予測画像を用いて色差成分の予測画像を生成する予測モードの別の一例を説明するための概念図である。
【図12】本発明の実施の形態における輝度成分の予測画像を用いて色差成分の予測画像を生成する予測モードのさらに別の一例を説明するための概念図である。
【図13】本発明の実施の形態によって生成される符号列の構成を説明するための概念図である。
【図14】本発明の実施の形態によって生成されるスライスヘッダのシンタックスの一例を説明するための概念図である。
【図15】本発明の実施の形態によって生成される符号列の別の構成を説明するための概念図である。
【図16】本発明の実施の形態によって生成されるピクチャヘッダのシンタックスの一例を説明するための概念図である。
【図17】本発明の実施の形態2に係る復号化処理のフローチャートである。
【発明を実施するための形態】
【0039】
(実施の形態1)
以下、本発明の実施の形態1について、図面を参照しながら説明する。
【0040】
(符号化装置全体の処理説明)
図1は、本発明の実施の形態に係る動画像符号化装置100のブロック図である。動画像符号化装置100は、ピクチャ単位で入力された動画像をブロックに分割し、ブロック単位で符号化処理する。そして、動画像符号化装置100は、符号列を生成する。
【0041】
この動画像符号化装置100は、ピクチャメモリ101と、予測残差符号化部102と、予測残差復号化部103と、ローカルバッファ104と、予測符号化部105と、量子化値決定部106と、符号列生成部107と、色差サンプル位置情報生成部108とを備えている。
【0042】
ピクチャメモリ101は、表示を行う順にピクチャ単位で入力される入力画像信号151を、符号化を行う順にピクチャの並び替えを行って蓄積する。入力画像信号151はプログレッシブ形式とインターレース形式との双方があり、プログレッシブ形式の場合は1枚のフレームを1枚のピクチャとして、インターレース形式の場合は1枚のフィールドを1枚のピクチャとして以降の符号化処理を適用する。
【0043】
次に、ピクチャメモリ101は、差分演算部109および予測符号化部105からの読出し命令を受けると当該読出し命令に係る画像信号をそれぞれ出力する。このとき、各々のピクチャは複数の画素から構成される符号化単位であるブロックに分割される。このブロックは、例えば水平64×垂直64画素、水平32×垂直32画素、水平16×垂直16画素から成る。なお、本実施形態における動画像符号化装置100ではブロック単位で以降の処理が行われる。
【0044】
予測残差符号化部102は、差分演算部109から出力される差分画像信号152に対して直交変換を行う。さらに、予測残差符号化部102は、得られた各周波数成分の直交変換係数に対し量子化を行うことで残差符号化信号153を生成する。そして、予測残差符号化部102は、予測残差復号化部103および符号列生成部107に、残差符号化信号153を出力する。このとき予測残差符号化部102は、量子化値決定部106において決定された量子化値を用いて直交変換係数を量子化する。
【0045】
予測残差復号化部103は、予測残差符号化部102から出力される残差符号化信号153に対して、逆量子化および逆直交変換することで差分画像情報の復元を行い、生成した残差復号化信号154を加算演算部110に出力する。
【0046】
ローカルバッファ104は、加算演算部110から出力される再構成画像信号155を格納する。この再構成画像信号155は、現在符号化対象となっているピクチャ以降のピクチャの符号化における予測符号化処理において参照用の画素データとして使用される。ローカルバッファ104は、予測符号化部105からの読出し命令に応じて、格納している再構成画像信号155を画素データとして予測符号化部105へ出力する。
【0047】
予測符号化部105は、ピクチャメモリ101から出力される画像信号を基に、画面内予測、または画面間予測を用いて予測画像信号156を生成し、差分演算部109および加算演算部110に出力する。なお、予測符号化部105は、画面間予測を行う際は、ローカルバッファ104に蓄積される既に符号化済みのピクチャの再構成画像信号155を用いる。また、画面内予測を行う際は、符号化対象ブロックに隣接する既に符号化済みのブロックの再構成画像信号155を用いる。画面内予測を用いるか画面間予測を用いるかのモード判定方法については、どちらの予測方法がより残差信号の情報量を少なくできるかを推定して行われる。予測符号化部105は、予測方法に関する情報である予測情報信号157を、符号列生成部107に出力する。
【0048】
量子化値決定部106は、ピクチャメモリ101に格納されるピクチャに基づいて、予測残差符号化部102で差分画像信号152を量子化する際の量子化値を決定する。なお、量子化値決定106における量子化値の決定方法は、符号列信号159のビットレートが目標とするするビットレートに近づくように量子化値を設定する、いわゆるレート制御に基づく量子化値の決定方法を用いてもよい。
【0049】
符号列生成部107は、予測残差符号化部102が出力する残差符号化信号153と、予測符号化部105が出力する予測情報信号157と、量子化値決定部106が出力する量子化値と、色差サンプル位置情報生成部108が出力する色差サンプル位置情報信号158に対して可変長符号化を施すことで符号列信号159を生成する。
【0050】
色差サンプル位置情報生成部108は、外部から指定される動画像形式に関する情報、例えば、符号化対象の動画像がプログレッシブ形式であるかインターレース形式であるかの情報、もしくは符号化対象の動画像の輝度成分に対する色差成分の間引き方法に関する情報を基に、輝度成分のサンプル位置に対する色差成分のサンプル位置の関係を示す色差サンプル位置情報を生成する。生成された色差サンプル位置情報信号158は予測符号化部105および符号列生成部107に出力される。
【0051】
ここで、色差サンプル位置情報としては、色差成分の(0、0)位置の画素が、輝度成分の(0、0)位置の画素に対して、輝度成分の座標空間上においてどれくらいずれているかを示すシフト量で定義される。従来の技術で説明した図6の例を用いて詳しく説明する。ここで、図6に示すピクチャの座標空間は、最も左上の画素位置の座標を(0,0)とする。さらに、垂直下方向または水平右方向に変位するにつれ座標がプラスとなるように座標空間を設定する。例えば、符号化対象ピクチャが図6(a)のようなフレーム構造であった場合、色差成分の(0、0)位置の画素が、輝度成分の(0、0)位置の画素に対して、水平方向に0画素分、垂直方向に0.5画素分下にずれている。よってシフト量は(0、0.5)となる。同様に、符号化対象ピクチャが図6(b)のようなトップフィールド構造であった場合は、水平方向に0画素分、垂直方向に0.25画素分下にずれている。よってシフト量は(0、0.25)となる。また、符号化対象ピクチャが図6(c)のようなボトムフィールド構造であった場合は、水平方向に0画素分、垂直方向に0.75画素分下にずれている。よってシフト量は(0、0.75)となる。
【0052】
差分演算部109は、ピクチャメモリ101から読み出された画像信号と予測符号化部105から出力される予測画像信号156との差分値である差分画像信号152を生成し、予測残差符号化部102に出力する。
【0053】
加算演算部110は、予測残差復号化部103から出力される残差復号化信号154と予測符号化部105から出力される予測画像信号156とを加算することにより再構成画像信号155を生成し、ローカルバッファ104に出力する。
【0054】
(色差サンプル位置情報生成の処理全体説明)
ここで、色差サンプル位置情報生成部108で色差サンプル位置情報信号158を生成し、符号列生成部107で符号列を生成する方法、および予測符号化部105で画面間予測符号化を行う方法について、図9の符号化処理全体のフローチャートを用いて具体的に説明する。
【0055】
まず、ステップS901において、符号列生成部107はシーケンス単位のヘッダ領域の符号列生成を行う。シーケンス単位のヘッダ領域には、符号化および復号化制御においてシーケンス全体で共通に必要となる情報が記述される。
【0056】
次に、ステップS902において、色差サンプル位置情報生成部108は、外部から指定される動画像形式に関する情報、例えば、符号化対象の動画像がプログレッシブ形式であるかインターレース形式であるかの情報、もしくは符号化対象の動画像の輝度成分に対する色差成分の間引き方法に関する情報を基に、符号化対象ピクチャの色差成分のサンプル位置が輝度成分のサンプル位置に対してどのような位置関係にあるかを示す色差サンプル位置情報信号158を生成する。
【0057】
次に、ステップS903において、符号列生成部107はピクチャ単位およびスライス単位のヘッダ領域の符号列生成を行う。ピクチャ単位のヘッダ領域には、符号化および復号化制御において符号化対象ピクチャ全体で共通に必要となる情報が記述される。また、スライス単位のヘッダ領域には、符号化および復号化制御において符号化対象ピクチャに属する複数のブロックから構成されるスライス全体で共通に必要となる情報、および符号化対象ピクチャ全体で共通に必要となる情報が記述される。このとき、ステップS902において生成された色差サンプル位置情報が、ピクチャ単位のヘッダ領域、もしくはスライス単位のヘッダ領域に記述される。
【0058】
最後に、ステップS904において、図1を用いて説明した符号化対象ピクチャの一連の符号化処理を行いピクチャデータの符号列生成を行う。このとき、予測符号化部105では、ステップS902において生成された色差サンプル位置情報を用いて、輝度成分の予測画像を用いて色差成分の予測画像を生成することで画面内予測処理が行われる。
【0059】
符号化対象ピクチャの処理が完了すると、ステップS902に戻って次のピクチャの符号化処理に移り、シーケンス内の全てのピクチャの符号化処理が完了するまでステップS902からステップS904の処理を繰り返す。
【0060】
(色差成分の予測画像の生成方法)
ここで、予測符号化部105において画面内予測を行う際に、輝度成分の予測画像を用いて色差成分の予測画像を生成する予測モードを用いて予測画像を生成する方法について詳しく説明する。
【0061】
前記予測モードでは、対応する輝度成分の画面内予測によって生成された予測画像を用いて、まず輝度成分の予測画像をダウンサンプルすることによって色差成分の画素数と一致するように変換して中間予測画像を生成する。さらに、前記予測モードは、符号化対象ブロックに隣接する輝度成分および色差成分の画素を参照して前記中間予測画像の画素値を補正することで、色差成分の予測画像を生成する。
【0062】
このとき、本実施の形態では、図7および図8を用いて説明した従来の技術とは異なり、使用する輝度成分の画素を色差サンプル位置情報に基づいて補正することで、輝度成分と色差成分のサンプル位置がどのような関係にあっても正確な色差成分の予測画像を生成することが可能である。
【0063】
(中間予測画像の生成方法)
まず、輝度成分の予測画像をダウンサンプルする処理においては、(数1)に示す方法を用いて中間予測画像の画素値を算出する。
【0064】
なお、M[x、y]は算出する中間予測画像の画素位置(x、y)における画素値とする。また、L[x、y]は参照する輝度成分の予測画像の画素位置(x、y)における画素値とする。さらに、Sftxは符号化対象ピクチャの色差サンプル位置のシフト量の水平方向とする。Sftyは符号化対象ピクチャの色差サンプル位置のシフト量の垂直方向とする。
【0065】
(数1)は色差成分が輝度成分に対して水平垂直方向ともに1/2に間引かれている場合の処理を示している。また、x、yの取りうる範囲は符号化対象ブロックのサイズに依存するが、例えば、符号化対象ブロックのサイズが輝度成分は8×8画素、色差成分は4×4画素であった場合、x、yはそれぞれ0から3の値をとる。なお、説明の簡略化のため、では、Sftx、Sftyの単位は、値1で輝度成分の1画素に相当するものとして表現している。
【0066】
(数1)M[x,y]=(1−Sftx)×(1−Sfty)×L[2x,2y]
+Sftx×(1−Sfty)×L[2x+1,2y]
+(1−Sftx)×Sfty×L[2x,2y+1]
+Sftx×Sfty×L[2x+1,2y+1]
なお、(数1)では小数を用いた演算が必要になるため、Sftx、Sftyの単位を、値1で輝度成分の1/4画素に相当するものとして、(数2)のように表現することも可能である。これにより各演算を整数のみで行うことが可能となる。
【0067】
(数2)M[x,y]=((4−Sftx)×(4−Sfty)×L[2x,2y]
+Sftx×(4−Sfty)×L[2x+1,2y]
+(4−Sftx)×Sfty×L[2x,2y+1]
+Sftx×Sfty×L[2x+1,2y+1])/16
(補正に利用する輝度成分の隣接画素生成方法)
次に、中間予測画像の画素値を補正するために参照する輝度成分の隣接画素については、(数3)および(数4)に示す方法を用いて算出した画素値を使用する。
【0068】
なお、Mr[x]は上隣接画素として使用する画素値とする。さらに、Mr[y]は左隣接画素として使用する画素値とする。また、Lr[x]は、輝度成分の予測画像を生成する際に実際に利用した画素値であって、符号化対象ブロックの上側に隣接する輝度成分の画素値とする。Lr[y]は輝度成分の予測画像を生成する際に実際に利用した画素値であって、符号化対象ブロックの左側に隣接する輝度成分の画素値とする。さらに、Sftxは符号化対象ピクチャの色差サンプル位置のシフト量の水平方向とする。そして、Sftyは符号化対象ピクチャの色差サンプル位置のシフト量の垂直方向とする。
【0069】
(数3)および(数4)は色差成分が輝度成分に対して水平垂直方向ともに1/2に間引かれている場合の処理を示している。また、x、yの取りうる範囲は符号化対象ブロックのサイズに依存するが、例えば、符号化対象ブロックのサイズが輝度成分は8×8画素、色差成分は4×4画素であった場合、x、yはそれぞれ0から3の値をとる。なお、説明の簡略化のため、(数3)および(数4)では、Sftx、Sftyの単位は、値1で輝度成分の1画素に相当するものとして表現している。
【0070】
(数3)Mr[x]=(1−Sftx)×Lr[2x]+Sftx×Lr[2x+1]
(数4)Mr[y]=(1−Sfty)×Lr[2y]+Sfty×Lr[2y+1]
なお、(数3)および(数4)では小数を用いた演算が必要になるため、Sftx、Sftyの単位を、値1で輝度成分の1/4画素に相当するものとして、(数5)および(数6)のように表現することも可能である。これにより各演算を整数のみで行うことが可能となる。
【0071】
(数5)Mr[x]=((4−Sftx)×Lr[2x]+Sftx×Lr[2x+1])/4
(数6)Mr[y]=((4−Sfty)×Lr[2y]+Sfty×Lr[2y+1])/4
(中間予測画像の画素値補正方法)
中間予測画像の画素値の補正は、まず、符号化対象ブロックに隣接する既に符号化済みである輝度成分の画素値と色差成分の画素値の相関関係を求める。このとき、輝度成分の画素値は、(数3)および(数4)または(数5)および(数6)で算出した値を利用する。
【0072】
次に、前記中間予測画像の画素値と補正して求める色差成分の予測画像の画素値とが、上記により求めた相関関係と同じ関係性になるように、前記中間予測画像を補正し、色差成分の予測画像を生成する。
【0073】
本実施形態の場合、上記処理によって参照する輝度成分の画素を色差成分の画素と位相が一致するように補正している。これにより、正確な画素値の関係性を求めることが可能となる。その結果、精度の高い色差成分の予測画像を生成することが可能となる。
【0074】
図10は、符号化対象の動画像がプログレッシブ形式であり、符号化対象ピクチャがフレーム構造である場合の例である。このとき、色差サンプル位置情報として指定されるシフト量は(0、0.5)となる。輝度成分の予測画像をダウンサンプルすることによって得られる中間予測画像の各画素値は、(数1)に従って算出すると、偶数列目の上下2画素の中間位置に相当する画素値となる。また、中間予測画像の画素値の補正を行うために参照する輝度成分の隣接画素の画素値は、(数3)および(数4)に従って算出すると、上隣接画素に関しては偶数列目の画素値そのまま、左隣接画素に関しては上下2画素の中間位置に相当する画素値となる。なお、(数2)および(数5)および(数6)の表現に置き換えると、色差サンプル位置のシフト量は(0、2)となるが、算出される結果は全く同じ値となる。
【0075】
一方、図11は、符号化対象の動画像がインターレース形式であり、符号化対象ピクチャがトップフィールドであった場合の例である。このとき、色差サンプル位置情報として指定されるシフト量は(0、0.25)となる。輝度成分の予測画像をダウンサンプルすることによって得られる中間予測画像の各画素値は、(数1)に従って算出すると、偶数列目の上下2画素の中間位置から上方向に1/4画素シフトした位置に相当する画素値となる。また、中間予測画像の画素値の補正を行うために参照する輝度成分の隣接画素の画素値は、(数3)および(数4)に従って算出すると、上隣接画素に関しては偶数列目の画素値そのまま、左隣接画素に関しては上下2画素の中間位置から上方向に1/4画素シフトした位置に相当する画素値となる。なお、(数2)および(数5)および(数6)の表現に置き換えると、色差サンプル位置のシフト量は(0、1)となるが、算出される結果は全く同じ値となる。
【0076】
同様に、図12は、符号化対象の動画像がインターレース形式であり、符号化対象ピクチャがボトムフィールドであった場合の例である。このとき、色差サンプル位置情報として指定されるシフト量は(0、0.75)となる。輝度成分の予測画像をダウンサンプルすることによって得られる中間予測画像の各画素値は、(数1)に従って算出すると、偶数列目の上下2画素の中間位置から下方向に1/4画素シフトした位置に相当する画素値となる。また、中間予測画像の画素値の補正を行うために参照する輝度成分の隣接画素の画素値は、(数3)および(数4)に従って算出すると、上隣接画素に関しては偶数列目の画素値そのまま、左隣接画素に関しては上下2画素の中間位置から下方向に1/4画素シフトした位置に相当する画素値となる。なお、(数2)および(数5)および(数6)の表現に置き換えると、色差サンプル位置のシフト量は(0、3)となるが、算出される結果は全く同じ値となる。
【0077】
このように、図8を用いて説明した従来の技術では、輝度成分のサンプル位置に対する色差成分のサンプル位置の関係と、色差成分の画面内予測画像を生成するために使用される輝度成分の画素位置の関係とが一致していなかったが、本発明による図11および図12の例では、輝度成分のサンプル位置に対する色差成分のサンプル位置の関係と、色差成分の画面内予測画像を生成するために使用される輝度成分の画素位置の関係とが一致し、正確な色差成分の画面内予測画像が生成できる。
【0078】
なお、符号化対象の動画像がプログレッシブ形式である場合は、従来の方法を用いても本発明の方法を用いても、常に正確な色差成分の画面内予測画像が生成できるため、(数1)および(数3)および(数4)、もしくは(数2)および(数5)および(数6)で説明した処理を行わず、従来の技術と同様の方法で色差成分の画面内予測画像を生成してもよい。
【0079】
また、符号化対象の動画像がインターレース形式であった場合でも、図5を用いて説明した色差成分の間引き方法が、図5(b)のように4:2:2サンプリングと呼ばれる水平方向のみ1/2に間引く方法や、図5(c)のように4:4:4サンプリングと呼ばれる間引きを行わない方法であった場合、前述のプログレッシブ形式の場合と同様に、従来の方法を用いても本発明の方法を用いても、常に正確な色差成分の画面内予測画像が生成できるため、(数1)および(数3)および(数4)、もしくは(数2)および(数5)および(数6)で説明した処理を行わず、従来の技術と同様の方法で色差成分の画面内予測画像を生成してもよい。
【0080】
また、輝度成分の予測画像をダウンサンプルする処理においては、符号化対象の動画像がプログレッシブ形式である場合もインターレースである場合も、色差サンプル位置の水平方向のシフト量は常に0であるため、(数1)もしくは(数2)で説明した処理の替わりに、(数7)もしくは(数8)による処理を用いてもよい。
【0081】
(数7)M[x,y]=(1−Sfty)×L[2x,2y]+Sfty×L[2x,2y+1]
(数8)M[x,y]=((4−Sfty)×L[2x,2y]+Sfty×L[2x,2y+1])/4
また、中間予測画像の画素値を補正するために参照する輝度成分の隣接画素については、符号化対象の動画像がプログレッシブ形式である場合もインターレースである場合も、色差サンプル位置の水平方向のシフト量は常に0であるため、上隣接画素として使用する画素値は(数3)もしくは(数5)で説明した処理を行わずに偶数列目の画素値をそのまま適用し、左隣接画素として使用する画素値のみ(数4)もしくは(数6)で説明した処理を用いて算出するという構成にしてもよい。
【0082】
また、輝度成分の予測画像をダウンサンプルする処理においては、(数1)および(数2)のように周辺の4つの輝度成分の画素を用いる方法、もしくは、(数7)および(数8)のように周辺の2つの輝度成分の画素を用いる方法を説明したが、これらの代わりに、例えば、周辺の6つの輝度成分の画素を用いたり、もしくは、それ以外の個数の輝度成分の画素を用いた処理を行ってもよい。
【0083】
また、(数1)から(数8)で説明したそれぞれの算出処理はあくまで一例であり、色差サンプル位置情報を用いて色差成分の位相が適切な位置となるように制御される算出処理であればこれ以外の算出式を用いてもよい。
【0084】
また、本実施の形態では、輝度成分の予測画像をダウンサンプルする処理と、中間予測画像の画素値を補正するために参照する輝度成分の隣接画素を算出する処理との、それぞれにおいて色差サンプル位置情報による位相制御を行ったが、例えば、前者の処理でのみ色差サンプル位置情報による位相制御を行うという構成にしても、逆に、後者の処理でのみ色差サンプル位置情報による位相制御を行うという構成にしてもよい。
【0085】
(符号列159のシンタックス構成に関して)
次に、本実施の形態によって生成される符号列159の構成を、図13を用いて説明する。
【0086】
生成される符号列159は、シーケンス単位の符号化制御情報を記述したシーケンスヘッダ領域、ピクチャ単位の符号化制御情報を記述したピクチャヘッダ領域、スライス単位の符号化制御情報を記述したスライスヘッダ領域、およびスライスデータで構成されている。このとき、図9におけるステップS902で生成した色差サンプル位置情報はスライスヘッダ領域に記述される。
【0087】
ここで、色差サンプル位置情報が記述されるスライスヘッダ領域のシンタックスについて図14を用いて詳しく説明する。なお、図14では本発明に関連するシンタックス以外は省略して記載している。
【0088】
図14(a)では、色差サンプル位置情報として、chroma_sample_shift_xとchroma_sample_shift_yとがスライスヘッダ領域に記述されている。
【0089】
chroma_sample_shift_xは、符号化対象ピクチャにおける、色差成分のサンプル位置が輝度成分のサンプル位置に対して、輝度成分の座標空間上においてどれくらいずれているかを示す水平方向のシフト量であり、chroma_sample_shift_yは同垂直方向のシフト量である。例えば、従来の技術で説明した図6の例を用いると、シフト量を(chroma_sample_shift_x、chroma_sample_shift_y)と表現したとき、符号化対象ピクチャが図6(a)のようなフレーム構造であった場合は(0、0.5)となり、符号化対象ピクチャが図6(b)のようなトップフィールド構造であった場合は(0、0.25)となり、符号化対象ピクチャが図6(c)のようなボトムフィールド構造であった場合は(0、0.75)となる。
【0090】
なお、chroma_sample_shift_xおよびchroma_sample_shift_yの値の単位は任意であり、例えば、値1が輝度成分の1/4画素に相当するように表現した場合は、図6(a)は(0、2)、図6(b)は(0、1)、図6(c)は(0、3)となる。
【0091】
なお、符号化対象の動画像がプログレッシブ形式である場合は、シーケンスに属する全てのピクチャの色差サンプル位置のシフト量は同じ値となる。そのため、chroma_sample_shift_xおよびchroma_sample_shift_yを記述せずに予め定義された固定値として符号化処理を行うようにしてもよい。
【0092】
また、符号化対象の動画像がインターレース形式であった場合でも、図5を用いて説明した色差成分の間引き方法が、図5(b)のように4:2:2サンプリングと呼ばれる水平方向のみ1/2に間引く方法や、図5(c)のように4:4:4サンプリングと呼ばれる間引きを行わない方法であった場合、前述のプログレッシブ形式の場合と同様に、シーケンスに属する全てのピクチャの色差サンプル位置のシフト量は同じ値となる。そのため、chroma_sample_shift_xおよびchroma_sample_shift_yを記述せずに予め定義された固定値として符号化処理を行うようにしてもよい。
【0093】
また、符号化対象の動画像がプログレッシブ形式である場合もインターレースである場合も、色差サンプル位置の水平方向のシフト量は常に0であるため、chroma_sample_shift_xを記述せずに、chroma_sample_shift_yのみを記述するようにしてもよい。
【0094】
また、図14(a)のように色差サンプル位置のシフト量を直接記述せずに、例えば、図14(b)のchroma_sample_idcように別の意味を持たせたパラメータから間接的に色差サンプル位置のシフト量を指定するようにしてもよい。
【0095】
chroma_sample_idcは、0のときは、符号化対象ピクチャの色差成分は輝度成分に対して水平垂直ともに1/2に間引いたもの(4:2:0サンプル)であり、さらにインターレース形式のトップフィールドであることを示す。つまり、図6(b)の構造のピクチャであることを示す。また、1のときは、符号化対象ピクチャの色差成分は輝度成分に対して水平垂直ともに1/2に間引いたもの(4:2:0サンプル)であり、さらにインターレース形式のボトムフィールドであることを示す。つまり、図6(c)の構造のピクチャであることを示す。また、2のときは、それ以外の構造のピクチャであることを示す。
【0096】
これにより、chroma_sample_idcが、0のときは色差サンプル位置のシフト量が(0、0.25)であり、1のときは色差サンプル位置のシフト量が(0、0.75)であり、2のときは色差サンプル位置のシフト量が(0、0.5)もしくは(0、0)であることを間接的に指定することが可能となる。
【0097】
なお、前述のchroma_sample_idcと同じ情報を、色差成分の間引き方法を示す情報と、インターレース形式のトップフィールドであるかボトムフィールドであるかを示す情報とに分けて記述する構成としてもよい。このとき、色差成分の間引き方法を示す情報として、例えば、図5(a)の4:2:0サンプリング、図5(b)の4:2:2サンプリング、図5(c)の4:4:4サンプリングのいずれかを示す情報とし、シーケンス全体で共通に必要となる情報としてシーケンス単位のヘッダ領域に記述する方法がある。一方、インターレース形式のトップフィールドであるかボトムフィールドであるかを示す情報として、例えば、値0のときはインターレース形式のトップフィールド、値1のときはインターレース形式のボトムフィールドを示すパラメータとし、ピクチャ全体で共通に必要となる情報としてピクチャ単位のヘッダ領域、もしくはスライス単位のヘッダ領域に記述する方法がある。
【0098】
なお、図14を用いて説明した色差サンプル位置情報は、符号化対象ピクチャに対して1つのみを対応付けるものである。しかし、1つのピクチャは複数のスライスから構成されているため、色差サンプル位置情報が記述されているスライスヘッダも複数符号化される。そのため、図14を用いて説明した各パラメータは、対象となるスライスが属するピクチャにおいて常に同じ値が記述されることになる。
【0099】
(符号列159の他のシンタックス構成に関して)
ここで、本実施の形態によって生成される符号列159における別のシンタックス構成を図15に基づいて説明する。
【0100】
生成される符号列159は、図13を用いて説明した符号列の構成と同様に、シーケンス単位の符号化制御情報を記述したシーケンスヘッダ領域、ピクチャ単位の符号化制御情報を記述したピクチャヘッダ領域、スライス単位の符号化制御情報を記述したスライスヘッダ領域、およびスライスデータで構成されている。このとき、図13を用いて説明した符号列の構成とは異なり、色差サンプル位置情報はスライスヘッダ領域ではなくピクチャヘッダ領域に記述されている。
【0101】
色差サンプル位置情報が記述されるピクチャヘッダ領域のシンタックスについては図16に示す通りであり、図14を用いて説明した内容と全く同様であるので説明を省略する。なお、ピクチャヘッダはピクチャ毎に1つずつのみが生成されるため、色差サンプル位置情報もピクチャ毎に1つずつのみが指定可能であり、対象ピクチャ内の全てのスライスで共通して使用される。
【0102】
なお、本実施の形態で説明した全てのパラメータ名およびパラメータ値については一例であり、これ以外のパラメータ名およびパラメータ値を用いて同様の機能を実現してもよい。
【0103】
このように、本実施の形態による動画像符号化装置を用いることにより、インターレース形式の動画像を入力として1枚のフィールドを1枚のピクチャとして符号化する場合でも、画面内予測符号化において、輝度成分の予測画像を用いて色差成分の予測画像を生成する予測モードを用いて、適切な色差成分の予測画像を生成することができる。
【0104】
(実施の形態2)
以下、本発明の実施の形態2について、図面を参照しながら説明する。
【0105】
(復号化装置全体の処理説明)
図2は、本発明の実施の形態に係る動画像復号化装置200のブロック図である。動画像復号化装置200は、実施の形態1で説明した動画像符号化装置によって生成された符号列に対し、ブロック単位で復号化処理する。そして、動画像復号化装置200は、出力画像を生成する。
【0106】
この動画像復号化装置200は、符号列解析部201と、予測残差復号化部202と、ピクチャメモリ203と、予測復号化部204と、量子化値決定部205と、色差サンプル位置情報解析部206を備えている。
【0107】
符号列解析部201は、入力された符号列信号251に対して可変長復号化を施すことによりヘッダ情報の解析およびブロック単位のピクチャデータの解析を行う。符号列解析部201は、解析して得られる残差符号化信号252を予測残差復号化部202へ出力する。また、符号列解析部201は、予測情報信号256を予測復号化部204へ出力する。さらに、符号列解析部201は、量子化値情報を量子化値決定部205へ出力する。そして、符号列解析部201は、色差サンプル位置情報信号257を色差サンプル位置情報解析部206へ出力する。
【0108】
予測残差復号化部202は、符号列解析部201から出力される残差符号化信号252に対して、逆量子化および逆直交変換を行うことで残差復号化信号253を生成し、加算演算部207に出力する。このとき予測残差復号化部202は、量子化値決定部205において決定された量子化値を用いて残差符号化信号252を逆量子化する。
【0109】
ピクチャメモリ203は、加算演算部207から出力される再構成画像信号255を格納する。この再構成画像信号255は、現在復号化対象となっているピクチャ以降のピクチャの復号化における予測復号化処理において参照用の画素データとして使用される。ピクチャメモリ203は、予測復号化部204からの読出し命令に応じて、格納している再構成画像信号255を画素データとして予測復号化部204へ出力する。
【0110】
また同時に、ピクチャメモリ204は、格納している再構成画像信号255を出力画像信号258として外部に出力する。出力画像信号258はプログレッシブ形式とインターレース形式との双方があり、プログレッシブ形式の場合は1枚のピクチャを1枚のフレームとして、インターレース形式の場合は1枚のピクチャを1枚のフィールドとして、表示順に並び替えることによって出力される。
【0111】
予測復号化部204は、符号列解析部201から出力される予測情報信号256を基に、画面内予測、または画面間予測を用いて予測画像信号254を生成し、加算演算部207に出力する。なお、予測復号化部204は、画面間予測を用いる際は、ピクチャメモリ203に蓄積される既に復号化済みのピクチャの再構成画像信号255を用いる。また、画面内予測を用いる際は、復号化対象ブロックに隣接する既に復号化済みのブロックの再構成画像信号255を用いる。画面内予測を用いるか画面間予測を用いるかの判定については、入力される予測情報信号256に従って行われる。
【0112】
色差サンプル位置情報解析部206は、符号列解析部201から出力される色差サンプル位置情報信号257を解析して、輝度成分のサンプル位置に対する色差成分のサンプル位置の関係を示す色差サンプル位置情報を取得する。取得された色差サンプル位置情報は予測符号化部204に出力される。
【0113】
ここで、色差サンプル位置情報としては、色差成分の(0、0)位置の画素が、輝度成分の(0、0)位置の画素に対して、輝度成分の座標空間上においてどれくらいずれているかを示すシフト量で定義される。従来の技術で説明した図6の例を用いて詳しく説明する。ここで、図6に示すピクチャの座標空間は、最も左上の画素位置の座標を(0,0)とする。さらに、垂直下方向または水平右方向に変位するにつれ座標がプラスとなるように座標空間を設定する。例えば、符号化対象ピクチャが図6(a)のようなフレーム構造であった場合、色差成分の(0、0)位置の画素が、輝度成分の(0、0)位置の画素に対して、水平方向に0画素分、垂直方向に0.5画素分下にずれている。よってシフト量は(0、0.5)となる。同様に、符号化対象ピクチャが図6(b)のようなトップフィールド構造であった場合は、水平方向に0画素分、垂直方向に0.25画素分下にずれている。よってシフト量は(0、0.25)となる。また、符号化対象ピクチャが図6(c)のようなボトムフィールド構造であった場合は、水平方向に0画素分、垂直方向に0.75画素分下にずれている。よってシフト量は(0、0.75)となる。
【0114】
加算演算部207は、予測残差復号化部202から出力される残差復号化信号253と予測復号化部204から出力される予測画像信号254を加算することによって再構成画像信号255を生成し、ピクチャメモリ203に出力する。
【0115】
(色差サンプル位置情報の処理全体説明)
ここで、符号列解析部201で符号列を解析して得られた情報を基に、色差サンプル位置情報解析部206で色差サンプル位置情報を取得し、予測復号化部204で予測画像を生成する方法について、図17の復号化処理全体のフローチャートを用いて具体的に説明する。
【0116】
まず、ステップS1701において、符号列解析部201はシーケンス単位のヘッダ領域の符号列解析を行う。シーケンス単位のヘッダ領域には、復号化制御においてシーケンス全体で共通に必要となる情報が記述されている。
【0117】
次に、ステップS1702において、符号列解析部201はピクチャ単位およびスライス単位のヘッダ領域の符号列解析を行う。ピクチャ単位のヘッダ領域には、復号化制御において復号化対象ピクチャ全体で共通に必要となる情報が記述されている。また、スライス単位のヘッダ領域には、復号化制御において復号化対象ピクチャに属する複数のブロックから構成されるスライス全体で共通に必要となる情報、および復号化対象ピクチャ全体で共通に必要となる情報が記述されている。このとき、色差サンプル位置情報信号257が、ピクチャ単位のヘッダ領域、もしくはスライス単位のヘッダ領域から取得される。
【0118】
次に、ステップS1703において、色差サンプル位置情報解析部206は、ステップS1702で取得された色差サンプル位置情報信号257を解析して、符号化対象ピクチャの色差成分のサンプル位置が輝度成分のサンプル位置に対してどのような位置関係にあるかを示す色差サンプル位置情報を生成する。
【0119】
最後に、ステップS1704において、図2を用いて説明した復号化対象ピクチャの一連の復号化処理を行い復号化画像の生成を行う。このとき、予測復号化部204では、ステップS1703において解析された色差サンプル位置情報を用いて、輝度成分の予測画像を用いて色差成分の予測画像を生成することで画面内予測処理が行われる。
【0120】
復号化対象ピクチャの処理が完了すると、ステップS1702に戻って次のピクチャの復号化処理に移り、シーケンス内の全てのピクチャの復号化処理が完了するまでステップS1702からステップS1704の処理を繰り返す。
【0121】
(色差Intra予測画像生成について)
ここで、予測復号化部204において画面内予測を行う際に、輝度成分の予測画像を用いて色差成分の予測画像を生成する予測モードを用いて予測画像を生成する方法について詳しく説明する。
【0122】
前記予測モードでは、対応する輝度成分の画面内予測によって生成された予測画像を用いて、まず輝度成分の予測画像をダウンサンプルすることによって色差成分の画素数と一致するように変換して中間予測画像を生成し、さらに復号化対象ブロックに隣接する輝度成分および色差成分の画素を参照して前記中間予測画像の画素値を補正することで、色差成分の予測画像を生成する。
【0123】
このとき本実施の形態では、色差サンプル位置情報を用いて、実施の形態1で(数1)から(数8)および図10から図12を用いて説明した動画像符号化装置における画面内予測の処理と全く同様の処理を行うことで、色差成分の予測画像を生成する。よって、復号化対象ピクチャが、プログレッシブ形式に属するフレーム構造であっても、インターレース形式に属するトップフィールド構造もしくはボトムフィールド構造であっても、もしくはそれ以外の理由により輝度成分のサンプル位置と色差成分のサンプル位置とが一致していない場合においても、常に正確に輝度成分の予測画像を用いて色差成分の予測画像を生成する画面内予測を行うことができる。
【0124】
(符号列251のシンタックス構成に関して)
最後に、本実施の形態で復号化対象とする符号列251の構成およびシンタックスは、実施の形態1で図13から図16を用いて説明したものと全く同様であるので、ここでは説明を省略する。
【0125】
このように、本実施の形態による動画像復号化装置を用いることにより、インターレース形式の動画像を入力として1枚のフィールドを1枚のピクチャとして符号化した符号列を復号化する場合でも、画面内予測復号化において、輝度成分の予測画像を用いて色差成分の予測画像を生成する予測モードを用いて、適切な色差成分の予測画像を生成することができる。
【0126】
(その他の実施形態)
さらに、上記実施の形態で示した動画像符号化装置および動画像復号化装置に含まれる各手段と同等の機能を備えるプログラムを、フレキシブルディスク等の記録媒体に記録するようにすることにより、上記実施の形態で示した処理を、独立したコンピュータシステムにおいて簡単に実施することが可能となる。なお、記録媒体としてはフレキシブルディスクに限らず、光ディスク、ICカード、ROMカセット等、プログラムを記録できるものであれば同様に実施することができる。
【0127】
また、上記実施の形態で示した動画像符号化装置および動画像復号化装置に含まれる各手段と同等の機能を集積回路であるLSIとして実現してもよい。これらは一部または全てを含むように1チップ化されてもよい。またLSIは集積度の違いにより、IC、システムLSI、スーパーLSI、ウルトラLSIと称されることもある。
【0128】
また、集積回路化の手法はLSIに限るものではなく、専用回路または汎用プロセッサで実現しても良い。LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサを利用しても良い。
【0129】
さらには、半導体技術の進歩または派生する別技術によりLSIなどに置き換わる集積回路の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。
【0130】
また、本発明は、上述した動画像符号化装置および動画像復号化装置を含む、放送局から放送される放送波を圧縮し、記録を行うDVDレコーダー、BDレコーダー等の放送波記録装置に適用しても構わない。
【0131】
また、上記実施の形態に係る、動画像符号化装置および動画像復号化装置、またはその変形例の機能のうち少なくとも一部を組み合わせてもよい。
【産業上の利用可能性】
【0132】
本発明は、例えば、ビデオカメラ、デジタルカメラ、ビデオレコーダ、携帯電話、及びパーソナルコンピューター等における、入力画像を構成する各ピクチャを符号化して動画像符号化データとして出力する動画像符号化装置や、前記動画像符号化データを復号化して復号化画像を生成する動画像復号化装置として有用である。
【符号の説明】
【0133】
100 動画像符号化装置
101 ピクチャメモリ
102 予測残差符号化部
103 予測残差復号化部
104 ローカルバッファ
105 予測符号化部
106 量子化値決定部
107 符号列生成部
108 色差サンプル位置情報生成部
109 差分演算部
110 加算演算部
151 入力画像信号
152 差分画像信号
153 残差符号化信号
154 残差復号化信号
155 再構成画像信号
156 予測画像信号
157 予測情報信号
158 色差サンプル位置情報信号
159 符号列信号
200 動画像復号化装置
201 符号列解析部
202 予測残差復号化部
203 ピクチャメモリ
204 予測復号化部
205 量子化値決定部
206 色差サンプル位置情報解析部
207 加算演算部
251 符号列信号
252 残差符号化信号
253 残差復号化信号
254 予測画像信号
255 再構成画像信号
256 予測情報信号
257 色差サンプル位置情報信号
258 出力画像信号

【特許請求の範囲】
【請求項1】
輝度成分および色差成分によって構成される動画像信号をピクチャ単位で符号化する動画像符号化装置であって、
前記動画像信号の動画像形式がインターレース形式およびプログレッシブ形式のうちいずれの形式であるかを示す動画像形式情報、および前記輝度成分に対する前記色差成分の間引き方法に関する間引き情報に基づいて、符号化対象ピクチャにおける前記色差成分のサンプル位置に関するサンプル位置情報を生成するサンプル位置情報生成部と、
前記符号化対象ピクチャにおける符号化処理単位であるブロック毎に、前記ブロックに隣接する既に符号化済みのブロックに含まれる輝度成分の画素である第1隣接画素を用いて輝度成分の画面内予測画像を生成し、加えて、生成した前記輝度成分の画面内予測画像、前記第1隣接画素、前記ブロックに隣接する既に符号化済みのブロックの色差成分の画素である第2隣接画素、および前記サンプル位置情報に基づいて、色差成分の画面内予測画像を生成する予測符号化部と、
前記生成した輝度成分の画面内予測画像および前記色差成分の画面内予測画像に基づいて、前記符号化対象ピクチャを前記ブロックごとに符号化処理し、符号列を生成するピクチャデータ符号化部と、を備える、
動画像符号化装置。
【請求項2】
前記予測符号化部は、前記サンプル位置情報に基づいて、前記輝度成分の画面内予測画像をダウンサンプリングすることにより前記色差成分の画素数と同じ画素数の中間予測画像を生成し、生成した前記中間予測画像に含まれる画素値を補正することにより、前記色差成分の画面内予測画像を生成する請求項1に記載の動画像符号化装置。
【請求項3】
前記予測符号化部は、前記サンプル位置情報に基づいて、前記第1隣接画素を補正することにより補正隣接画素を生成し、生成した補正隣接画素および前記第2隣接画素の画素値の相関関係を用いて、前記輝度成分の画面内予測画像から前記色差成分の画面内予測画像を生成する請求項1に記載の動画像符号化装置。
【請求項4】
前記サンプル位置情報生成部は、前記符号化対象ピクチャにおける前記色差成分のサンプル位置と、前記輝度成分のサンプル位置とのずれを示すシフト量を前記サンプル位置情報として生成する請求項1から請求項3のいずれかに記載の動画像符号化装置。
【請求項5】
前記予測符号化部は、生成する前記中間予測画像の各画素のサンプル位置が、前記サンプル位置情報に示される前記色差成分のサンプル位置と一致するように、前記中間予測画像の各画素の値を前記輝度成分の画面内予測画像を構成する1つ以上の画素の値を用いて内挿補間することによって算出する請求項2に記載の動画像符号化装置。
【請求項6】
前記予測符号化部は、生成する前記補正隣接画素の各画素のサンプル位置が、前記サンプル位置情報に示される前記色差成分のサンプル位置と一致するように、前記補正隣接画素の各画素の値を1つ以上の前記第1隣接画素の値を用いて内挿補間することによって算出する請求項3に記載の動画像符号化装置。
【請求項7】
前記サンプル位置情報生成部は、前記動画像形式情報がインターレース形式を示す場合にのみ、前記動画像信号をフィールド構造としたときの前記色差成分のサンプル位置と前記輝度成分のサンプル位置とのずれを示す情報を有するサンプル位置情報を生成する請求項1に記載の動画像符号化装置。
【請求項8】
前記サンプル位置情報生成部は、前記符号化対象ピクチャにおける前記色差成分のサンプル位置と前記輝度成分のサンプル位置との垂直方向に対するずれを示す情報のみを有するサンプル位置情報を生成する請求項1に記載の動画像符号化装置。
【請求項9】
前記サンプル位置情報生成部は、前記符号化対象ピクチャにおける前記色差成分のサンプル位置と前記輝度成分のサンプル位置との垂直方向および水平方向に対するずれを示す情報を有するサンプル位置情報を生成する請求項1に記載の動画像符号化装置。
【請求項10】
前記サンプル位置情報生成部は、前記符号化対象ピクチャが、インターレース形式のトップフィールドであるか、インターレース形式のボトムフィールドであるかを示す情報を有するサンプル位置情報を生成する請求項1に記載の動画像符号化装置。
【請求項11】
前記ピクチャデータ符号化部は、前記符号列のヘッダ領域のうちピクチャ全体の符号化制御情報を記述する領域に、前記サンプル位置情報を記述する請求項1に記載の動画像符号化装置。
【請求項12】
前記ピクチャデータ符号化部は、前記符号列のヘッダ領域のうちピクチャを分割した単位であるスライスに関する符号化制御情報を記述する領域に、前記サンプル位置情報を記述する請求項1に記載の動画像符号化装置。
【請求項13】
前記シフト量は、前記輝度成分のサンプル位置の間隔の1/4を1単位とした値である請求項4に記載の動画像符号化装置。
【請求項14】
輝度成分および色差成分によって構成される動画像信号をピクチャ単位で符号化する動画像符号化方法であって、
前記動画像信号の動画像形式がインターレース形式およびプログレッシブ形式のうちいずれの形式であるかを示す動画像形式情報、および前記輝度成分に対する前記色差成分の間引き方法に関する間引き情報に基づいて、符号化対象ピクチャにおける前記色差成分のサンプル位置に関するサンプル位置情報を生成し、
前記符号化対象ピクチャにおける符号化処理単位であるブロック毎に、前記ブロックに隣接する既に符号化済みのブロックに含まれる輝度成分の画素である第1隣接画素を用いて輝度成分の画面内予測画像を生成し、加えて、生成した前記輝度成分の画面内予測画像、前記第1隣接画素、前記ブロックに隣接する既に符号化済みのブロックの色差成分の画素である第2隣接画素、および前記サンプル位置情報に基づいて、色差成分の画面内予測画像を生成し、
前記生成した輝度成分の画面内予測画像および前記色差成分の画面内予測画像に基づいて、前記符号化対象ピクチャを前記ブロックごとに符号化処理し、符号列を生成する、
動画像符号化方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate