説明

動画像復号化装置および動画像復号化方法

【課題】動画像復号化装置において、インターレース形式の動画像を入力として1枚のフィールドを1枚のピクチャとして符号化した符号列を復号化する場合に、画面間予測復号化において、輝度成分の動きベクトルから色差成分の動きベクトルを正確に算出することを可能とする。
【解決手段】本発明に係る動画像復号化装置200は、色差サンプル位置情報解析部206において、復号化対象ピクチャの色差成分のサンプル位置が輝度成分のサンプル位置に対してどのような位置関係にあるかを示す色差サンプル位置情報を取得することで、画面間予測復号化において輝度成分の動きベクトルから色差成分の動きベクトルを算出する際に、前記色差サンプル位置情報に基づいた補正を行うことで正確な動きベクトルを算出することを可能とする。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、プログレッシブ形式の動画像信号およびインターレース形式の動画像信号を入力として符号化されたものを復号化する動画像復号化装置および動画像復号化方法に関するものである。
【背景技術】
【0002】
近年、マルチメディアアプリケーションの発展に伴い、画像、音声及びテキストなど、あらゆるメディアの情報を統一的に扱うことが一般的になってきた。また、ディジタル化された画像は膨大なデータ量を持つため、蓄積及び伝送のためには、画像の情報圧縮技術が不可欠である。一方で、圧縮した画像データを相互運用するためには、圧縮技術の標準化も重要である。例えば、画像圧縮技術の標準規格としては、ITU−T(国際電気通信連合 電気通信標準化部門)のH.261、H.263、H.264、ISO/IEC(国際標準化機構)のMPEG−1、MPEG−2、MPEG−4、MPEG−4AVCなどがある。また、現在は、ITU−TとISO/IECとの共同によるHEVCと呼ばれる次世代画像符号化方式の標準化活動が進んでいる。
【0003】
このような動画像の符号化では、符号化対象ピクチャを符号化単位ブロックに分割し、ブロック毎に時間方向および空間方向の冗長性を削減することによって情報量の圧縮を行う。時間的な冗長性の削減を目的とする画面間予測符号化では、前方または後方のピクチャを参照してブロック単位で動きの検出および予測画像の作成を行い、得られた予測画像と符号化対象ブロックとの差分画像を取得する。また空間的な冗長性の削減を目的とする画面内予測符号化では、周辺の符号化済みブロックの画素情報から予測画像の生成を行い、得られた予測画像と符号化対象ブロックとの差分画像を取得する。さらに得られた差分画像に対して離散コサイン変換等の直交変換および量子化を行い、可変長符号化を用いて符号列を生成することで情報量が圧縮される。
【0004】
また復号化では、前記符号化処理によって生成された符号列を解析して予測情報および残差係数情報を取得し、予測情報を用いて画面間予測復号化および画面内予測復号化を行って予測画像を生成し、残差係数情報に対して逆量子化および逆直交変換を行って差分画像を生成し、得られた予測画像と差分画像を加算することで最終的な出力画像を復元する。
【0005】
このとき符号化および復号化の対象となる動画像の形式として、プログレッシブ形式とインターレース形式との2種類の形式がある。
【0006】
プログレッシブ形式は、1画面全ての画素を同時に撮像し1枚のフレームとする形式である。一方、インターレース形式は、1画面の画素のうち偶数行目の画素のみを撮像したトップフィールドと奇数行目の画素のみを撮像したボトムフィールドとの2枚のフィールドで1枚のフレームを構成する形式である。
【0007】
プログレッシブ形式の動画像に対しては、図3にあるように1枚のフレームを1枚のピクチャとして符号化する。例えばFrm3はP_Frm1として符号化されている。画面間予測では符号化順で先に符号化が完了しているピクチャのみを参照することができる。そこで、図3にあるように表示順で入力されたピクチャを符号化順に並び替えることによって、画面間予測における参照ピクチャの参照をより効果的に行うことが可能となる。例えば、P_Frm1はI_Frm0のみが参照可能であり、B_Frm2はI_Frm0とP_Frm1が参照可能である。これを表示順に置き換えて考えると、P_Frm1はFrm3に相当するので前方向にあるFrm0のみが参照可能であるが、B_Frm2はFrm1に相当するので前方向にあるFrm0だけでなく、後方向にあるFrm3も同時に参照可能となる。なお、I_Frm0は他のピクチャを参照することなく画面内予測のみを行うピクチャである。
【0008】
一方、インターレース形式の動画像に対しては、最も簡単な方法として図4にあるように1枚のフィールドを1枚のピクチャとして符号化する方法がある。例えばFldT6とFldB7はそれぞれP_FldT2とP_FldB3のように個別のフィールド構造のピクチャとして符号化されている。このように表示順で入力されたピクチャを符号化順に並び替えることによって、プログレッシブ形式の符号化と同様に画面間予測における参照ピクチャの参照をより効果的に行うことが可能となる。
【0009】
図3および図4で説明した各ピクチャは輝度成分の画素と色差成分の画素とから構成されている。図5は、輝度成分と色差成分のそれぞれを画素値として取得するときのサンプル位置関係を説明するための図である。図中の×記号は輝度成分のサンプル位置、○記号は色差成分のサンプル位置を示している。
【0010】
一般に人間の目は色差成分の変化に対して鈍感である。そのため、1つのピクチャにおけるデータ量を削減するために色差成分を間引く方法が用いられる。間引き方法はいくつかの種類がある。たとえば、図5(a)は水平垂直方向ともに色差成分を1/2に間引く方法を示す。これは、4:2:0サンプリングと呼ばれる。この4:2:0サンプリングの場合、色差成分の垂直方向のサンプル位置は輝度成分のサンプル位置とは一致しない。つまり、色差成分は、輝度成分の中間の位置にサンプルされる。
【0011】
また、図5(b)は水平方向のみ1/2に間引く方法を示す。これは、4:2:2サンプリングと呼ばれる。さらに、図5(c)は間引きを行わない場合を示す。これは、4:4:4サンプリングと呼ばれる。
【0012】
図6は、水平垂直方向ともに1/2に間引く場合のプログレッシブ形式におけるフレーム構造とインターレース形式におけるフィールド構造とでのサンプル位置関係を示している。前述のとおり、フレーム構造では、全てのサンプル位置の画素を同時に撮像し1枚のフレームとするが、フィールド構造では、輝度成分と色差成分のそれぞれに対して、偶数行目の画素のみを撮像したトップフィールドと奇数行目の画素のみを撮像したボトムフィールドとの2枚のフィールドに分けられる。このとき、色差成分の垂直方向のサンプル位置は輝度成分のサンプル位置に対し、トップフィールドでは偶数行目に対して下方向に1/4画素ずらした位置、ボトムフィールドでは奇数行目に対して上方向に1/4画素ずらした位置となっている。
【0013】
次に、現在規格化が行われているHEVCの画面間予測符号化について図7を用いて詳しく説明する。画面間予測符号化は、既に符号化が完了しているピクチャ(以下、参照ピクチャと称す)から生成される予測画像を用いて符号化する方式である。予測画像を生成する際、符号化対象ブロックと最も画素値の構成が近くなるようなブロック領域を参照ピクチャから探索して予測画像とする。これにより、符号化対象ブロックと予測画像との差分画像の情報量を最小化できる。このとき、符号化対象ブロックの画素位置に対する予測画像として探索されたブロック領域の画素位置の移動量を動きベクトル(MV)と呼ぶ。
【0014】
符号列に記述される動きベクトルは、輝度成分の画素位置の移動量に関する情報のみである。そのため、色差成分の予測画像を生成するための動きベクトルは、前記輝度成分の動きベクトルの値を間引きの割合に応じてスケーリングすることで算出する。図7において、色差成分は輝度成分に対して水平垂直方向ともに1/2に間引かれている。よって、色差成分の動きベクトルの値は、輝度成分の動きベクトルの値(−4、−6)に対して水平垂直方向ともに1/2にスケーリングした値(−2、−3)が適用される(非特許文献1)。
【先行技術文献】
【非特許文献】
【0015】
【非特許文献1】JCTVC D503 : Working Draft 2 of High-Efficiency Video Coding (03/2011)
【発明の概要】
【発明が解決しようとする課題】
【0016】
しかしながら上記従来のHEVCの画面間予測符号化の構成では、図3のようにインターレース形式の動画像を入力として1枚のフィールドを1枚のピクチャとして符号化する場合、輝度成分の動きベクトルの値から色差成分の動きベクトルの値を適切に求めることができなくなる。
【0017】
図8は、符号化対象ピクチャがボトムフィールドで、参照ピクチャがトップフィールドである場合を示す。このとき、輝度成分と色差成分の動きベクトルの関係は図8に示すようになる。なお、図8では説明の簡略化のため、トップフィールドの輝度成分の垂直方向の位置と、ボトムフィールドの輝度成分の垂直方向の位置とが同じ位置になるように並べて記載している。このとき、色差成分の垂直方向のサンプル位置は、図6を用いて説明したように、輝度成分のサンプル位置に対し、トップフィールドでは偶数行目に対して下方向に1/4画素ずらした位置、ボトムフィールドでは奇数行目に対して上方向に1/4画素ずらした位置、言い換えると偶数行目に対して下方向に3/4画素ずらした位置となっている。
【0018】
図8の例では、輝度成分の動きベクトルの値が(−6、2)であるため、上記従来のHEVCの画面間予測符号化の構成に従うと、水平垂直方向ともに1/2にスケーリングした値である(−3、1)が色差成分の動きベクトルとして算出される。具体的には、輝度成分に関しては、符号化対象ピクチャにおける注目ブロックの左上の画素の位置は(6、2)であり、参照ピクチャにおける動きベクトルによって選択されたブロックの左上の画素の位置は(0、4)となっているのに対し、色差成分に関しては、符号化対象ピクチャにおける注目ブロックの左上の画素の位置は(3、1)であり、参照ピクチャにおける動きベクトルによって選択されたブロックの左上の画素の位置は(0、2)となっている。しかし、輝度成分のサンプル位置と色差成分のサンプル位置とを同じスケールで対応付けて考えると、水平垂直方向ともにそのまま1/2にスケーリングした値を用いると、輝度成分の動きベクトルと色差成分の動きベクトルとが同じ方向を示していないことになる。つまり、図8のように2つの動きベクトルの矢印が平行関係でなくなってしまっている。
【0019】
本発明は上記課題を解決するものであり、HEVCを用いた動画像復号化装置において、インターレース形式の動画像を入力として1枚のフィールドを1枚のピクチャとして復号化する場合でも、画面間予測符号化において、輝度成分の動きベクトルから色差成分の動きベクトルを正確に算出することを可能とする。
【課題を解決するための手段】
【0020】
本発明の動画像符号化装置は、インターレース形式またはプログレッシブ形式の動画像形式を有し、輝度成分および色差成分によって構成される動画像信号をピクチャ単位で符号化して得られる符号列を、ピクチャ単位で復号化する動画像復号化装置であって、前記符号列のヘッダ領域を解析し、前記動画像信号の動画像形式がインターレース形式およびプログレッシブ形式のうちいずれの形式であるかを示す動画像形式情報および、前記輝度成分に対する前記色差成分の間引き方法に関する間引き情報に基づいて生成されたピクチャ内における前記色差成分のサンプル位置に関するサンプル位置情報を取得するサンプル位置情報解析部と、前記符号列のヘッダ領域を解析し、前記輝度成分を符号化処理単位であるブロック毎に符号化する際に適用した動きベクトルを取得し、さらに前記色差成分のサンプル位置情報に基づいて前記輝度成分の動きベクトルを補正することにより、前記ブロックにおける前記色差成分を符号化する際に適用した動きベクトルを算出する動きベクトル算出部と、前記算出した輝度成分の動きベクトルおよび前記色差成分の動きベクトルを用いて、前記符号列を復号化単位であるブロック毎に復号化し、前記ピクチャを取得するピクチャデータ復号化部と、前記表示制御情報がプログレッシブ形式を示す場合、前記取得したピクチャを1枚のフレームと設定し前記フレームを表示順に1枚ずつ出力し、一方前記表示制御情報がインターレース形式を示す場合、前記取得したピクチャを1枚のフィールドと設定し、対になるトップフィールドとボトムフィールドを取得した時点で表示順に出力するピクチャメモリと、を備える。
【0021】
また好ましくは、前記サンプル位置情報解析部は、前記ピクチャ内における前記色差成分のサンプル位置と前記輝度成分のサンプル位置とのずれを示すシフト量を前記色差成分のサンプル位置情報として取得し、前記ピクチャデータ復号化部は、前記符号列におけるヘッダ領域のうちピクチャ単位で生成する領域から前記サンプル位置情報を取得する。
【0022】
また好ましくは、前記動きベクトル算出部は、復号化対象ピクチャにおいて生成したサンプル位置情報と、前記ピクチャ復号化対象ピクチャが参照する参照ピクチャにおいて生成したサンプル位置情報との差分値に基づいて、前記輝度成分の動きベクトルを補正することにより、前記色差成分の動きベクトルを算出する。
【0023】
また好ましくは、前記サンプル位置情報解析部は、復号化対象ピクチャにおける色差成分のサンプル位置と、前記復号化対象ピクチャが参照する参照ピクチャにおける色差成分のサンプル位置とのずれを示すシフト量を前記サンプル位置情報として取得し、前記ピクチャデータ復号化部は、前記符号列におけるヘッダ領域のうち前記参照ピクチャを指定するための情報を記述する領域から前記サンプル位置情報を格納する。
【0024】
また好ましくは、前記動きベクトル算出部は、復号化対象である前記ブロックが参照する参照ピクチャに対応づけられた前記サンプル位置情報を用いて、前記輝度成分の動きベクトルを補正することにより、前記色差成分の動きベクトルを算出する。
【0025】
また好ましくは、前記色差成分のサンプル位置情報は、垂直成分のみの情報を有する。
【0026】
また好ましくは、前記色差成分のサンプル位置情報は、垂直成分と水平成分の両方の情報を有する。
【0027】
また好ましくは、前記色差成分のサンプル位置情報は、復号化対象ピクチャが、インターレース形式のトップフィールドであるか、インターレース形式のボトムフィールドであるかを示す情報である。
【0028】
また好ましくは、前記サンプル位置情報解析部は、ピクチャ全体の符号化制御情報を記述するヘッダ領域から前記色差成分のサンプル位置情報を取得する。
【0029】
また好ましくは、前記サンプル位置情報解析部は、前記ピクチャを分割した単位であるスライスに関する符号化制御情報を記述するヘッダ領域から前記色差成分のサンプル位置情報を取得する。
【0030】
また好ましくは、前記シフト量は、輝度成分のサンプル位置の間隔の1/4を1単位とした値である。
【0031】
なお、本発明は、このような動画像符号化および動画像復号化装置として実現することができるだけでなく、このような動画像符号化および動画像復号化装置に含まれる各手段と同等の処理をプログラムや集積回路としても実現することもできる。
【発明の効果】
【0032】
以上より、本発明における動画像符号化装置は、インターレース形式の動画像を入力として1枚のフィールドを1枚のピクチャとして符号化する場合でも、画面間予測符号化において、輝度成分の動きベクトルから色差成分の動きベクトルを正確に算出することができる。
【0033】
また、本発明における動画像復号化装置は、インターレース形式の動画像を入力として1枚のフィールドを1枚のピクチャとして符号化した符号列を復号化する場合でも、画面間予測復号化において、輝度成分の動きベクトルから色差成分の動きベクトルを正確に算出することができる。
【図面の簡単な説明】
【0034】
【図1】本発明の実施の形態1に係る動画像符号化装置を示すブロック図である。
【図2】本発明の実施の形態2に係る動画像復号化装置を示すブロック図である。
【図3】従来のプログレッシブ形式の動画像の符号化方法を説明するための概念図である。
【図4】従来のインターレース形式の動画像の符号化方法を説明するための概念図である。
【図5】輝度成分と色差成分のサンプル位置の関係を説明するための概念図である。
【図6】インターレース形式における輝度成分と色差成分のサンプル位置の関係を説明するための概念図である。
【図7】従来の画面間予測における輝度成分の動きベクトルから色差成分の動きベクトルを算出する一例を説明するための概念図である。
【図8】従来の画面間予測における輝度成分の動きベクトルから色差成分の動きベクトルを算出する別の一例を説明するための概念図である。
【図9】本発明の実施の形態1に係る符号化処理のフローチャートである。
【図10】本発明の実施の形態における輝度成分の動きベクトルから色差成分の動きベクトルを算出する一例を説明するための概念図である。
【図11】本発明の実施の形態における輝度成分の動きベクトルから色差成分の動きベクトルを算出する別の一例を説明するための概念図である。
【図12】本発明の実施の形態における輝度成分の動きベクトルから色差成分の動きベクトルを算出するさらに別の一例を説明するための概念図である。
【図13】本発明の実施の形態によって生成される符号列の構成を説明するための概念図である。
【図14】本発明の実施の形態によって生成されるスライスヘッダのシンタックスの一例を説明するための概念図である。
【図15】本発明の実施の形態によって生成されるスライスヘッダのシンタックスの別の一例を説明するための概念図である。
【図16】本発明の実施の形態によって生成される符号列の別の構成を説明するための概念図である。
【図17】本発明の実施の形態によって生成されるピクチャヘッダのシンタックスの一例を説明するための概念図である。
【図18】本発明の実施の形態2に係る復号化処理のフローチャートである。
【発明を実施するための形態】
【0035】
(実施の形態1)
以下、本発明の実施の形態1について、図面を参照しながら説明する。
【0036】
(符号化装置全体の処理説明)
図1は、本発明の実施の形態に係る動画像符号化装置100のブロック図である。動画像符号化装置100は、ピクチャ単位で入力された動画像をブロックに分割し、ブロック単位で符号化処理する。そして、動画像符号化装置100は、符号列を生成する。
【0037】
この動画像符号化装置100は、ピクチャメモリ101と、予測残差符号化部102と、予測残差復号化部103と、ローカルバッファ104と、予測符号化部105と、量子化値決定部106と、符号列生成部107と、色差サンプル位置情報生成部108とを備えている。
【0038】
ピクチャメモリ101は、表示を行う順にピクチャ単位で入力される入力画像信号151を、符号化を行う順にピクチャの並び替えを行って蓄積する。入力画像信号151はプログレッシブ形式とインターレース形式との双方があり、プログレッシブ形式の場合は1枚のフレームを1枚のピクチャとして、インターレース形式の場合は1枚のフィールドを1枚のピクチャとして以降の符号化処理を適用する。
【0039】
次に、ピクチャメモリ101は、差分演算部109および予測符号化部105からの読出し命令を受けると当該読出し命令に係る画像信号をそれぞれ出力する。このとき、各々のピクチャは複数の画素から構成される符号化単位であるブロックに分割される。このブロックは、例えば水平64×垂直64画素、水平32×垂直32画素、水平16×垂直16画素から成る。なお、本実施形態における動画像符号化装置100ではブロック単位で以降の処理が行われる。
【0040】
予測残差符号化部102は、差分演算部109から出力される差分画像信号152に対して直交変換を行う。さらに、予測残差符号化部102は、得られた各周波数成分の直交変換係数に対し量子化を行うことで残差符号化信号153を生成する。そして、予測残差符号化部102は、予測残差復号化部103および符号列生成部107に、残差符号化信号153を出力する。このとき予測残差符号化部102は、量子化値決定部106において決定された量子化値を用いて直交変換係数を量子化する。
【0041】
予測残差復号化部103は、予測残差符号化部102から出力される残差符号化信号153に対して、逆量子化および逆直交変換することで差分画像情報の復元を行い、生成した残差復号化信号154を加算演算部110に出力する。
【0042】
ローカルバッファ104は、加算演算部110から出力される再構成画像信号155を格納する。この再構成画像信号155は、現在符号化対象となっているピクチャ以降のピクチャの符号化における予測符号化処理において参照用の画素データとして使用される。ローカルバッファ104は、予測符号化部105からの読出し命令に応じて、格納している再構成画像信号155を画素データとして予測符号化部105へ出力する。
【0043】
予測符号化部105は、ピクチャメモリ101から出力される画像信号を基に、画面内予測、または画面間予測を用いて予測画像信号156を生成し、差分演算部109および加算演算部110に出力する。なお、予測符号化部105は、画面間予測を行う際は、ローカルバッファ104に蓄積される既に符号化済みのピクチャの再構成画像信号155を用いる。また、画面内予測を行う際は、符号化対象ブロックに隣接する既に符号化済みのブロックの再構成画像信号155を用いる。画面内予測を用いるか画面間予測を用いるかのモード判定方法については、どちらの予測方法がより残差信号の情報量を少なくできるかを推定して行われる。予測符号化部105は、予測方法に関する情報である予測情報信号157を、符号列生成部107に出力する。
【0044】
量子化値決定部106は、ピクチャメモリ101に格納されるピクチャに基づいて、予測残差符号化部102で差分画像信号152を量子化する際の量子化値を決定する。なお、量子化値決定106における量子化値の決定方法は、符号列信号159のビットレートが目標とするするビットレートに近づくように量子化値を設定する、いわゆるレート制御に基づく量子化値の決定方法を用いてもよい。
【0045】
符号列生成部107は、予測残差符号化部102が出力する残差符号化信号153と、予測符号化部105が出力する予測情報信号157と、量子化値決定部106が出力する量子化値と、色差サンプル位置情報生成部108が出力する色差サンプル位置情報信号158に対して可変長符号化を施すことで符号列信号159を生成する。
【0046】
色差サンプル位置情報生成部108は、外部から指定される動画像形式に関する情報、例えば、符号化対象の動画像がプログレッシブ形式であるかインターレース形式であるかの情報、もしくは符号化対象の動画像の輝度成分に対する色差成分の間引き方法に関する情報を基に、輝度成分のサンプル位置に対する色差成分のサンプル位置の関係を示す色差サンプル位置情報を生成する。生成された色差サンプル位置情報信号158は予測符号化部105および符号列生成部107に出力される。
【0047】
ここで、色差サンプル位置情報としては、色差成分の(0、0)位置の画素が、輝度成分の(0、0)位置の画素に対して、輝度成分の座標空間上においてどれくらいずれているかを示すシフト量で定義される。従来の技術で説明した図6の例を用いて詳しく説明する。ここで、図6に示すピクチャの座標空間は、最も左上の画素位置の座標を(0,0)とする。さらに、垂直下方向または水平右方向に変位するにつれ座標がプラスとなるように座標空間を設定する。例えば、符号化対象ピクチャが図6(a)のようなフレーム構造であった場合、色差成分の(0、0)位置の画素が、輝度成分の(0、0)位置の画素に対して、水平方向に0画素分、垂直方向に0.5画素分下にずれている。よってシフト量は(0、0.5)となる。同様に、符号化対象ピクチャが図6(b)のようなトップフィールド構造であった場合は、水平方向に0画素分、垂直方向に0.25画素分下にずれている。よってシフト量は(0、0.25)となる。また、符号化対象ピクチャが図6(c)のようなボトムフィールド構造であった場合は、水平方向に0画素分、垂直方向に0.75画素分下にずれている。よってシフト量は(0、0.75)となる。
【0048】
差分演算部109は、ピクチャメモリ101から読み出された画像信号と予測符号化部105から出力される予測画像信号156との差分値である差分画像信号152を生成し、予測残差符号化部102に出力する。
【0049】
加算演算部110は、予測残差復号化部103から出力される残差復号化信号154と予測符号化部105から出力される予測画像信号156とを加算することにより再構成画像信号155を生成し、ローカルバッファ104に出力する。
【0050】
(色差サンプル位置情報生成の処理全体説明)
ここで、色差サンプル位置情報生成部108で色差サンプル位置情報信号158を生成し、符号列生成部107で符号列を生成する方法、および予測符号化部105で画面間予測符号化を行う方法について、図9の符号化処理全体のフローチャートを用いて具体的に説明する。
【0051】
まず、ステップS901において、符号列生成部107はシーケンス単位のヘッダ領域の符号列生成を行う。シーケンス単位のヘッダ領域には、符号化および復号化制御においてシーケンス全体で共通に必要となる情報が記述される。
【0052】
次に、ステップS902において、色差サンプル位置情報生成部108は、外部から指定される動画像形式に関する情報、例えば、符号化対象の動画像がプログレッシブ形式であるかインターレース形式であるかの情報、もしくは符号化対象の動画像の輝度成分に対する色差成分の間引き方法に関する情報を基に、符号化対象ピクチャの色差成分のサンプル位置が輝度成分のサンプル位置に対してどのような位置関係にあるかを示す色差サンプル位置情報信号158を生成する。
【0053】
次に、ステップS903において、符号列生成部107はピクチャ単位およびスライス単位のヘッダ領域の符号列生成を行う。ピクチャ単位のヘッダ領域には、符号化および復号化制御において符号化対象ピクチャ全体で共通に必要となる情報が記述される。また、スライス単位のヘッダ領域には、符号化および復号化制御において符号化対象ピクチャに属する複数のブロックから構成されるスライス全体で共通に必要となる情報、および符号化対象ピクチャ全体で共通に必要となる情報が記述される。このとき、ステップS902において生成された色差サンプル位置情報が、ピクチャ単位のヘッダ領域、もしくはスライス単位のヘッダ領域に記述される。
【0054】
最後に、ステップS904において、図1を用いて説明した符号化対象ピクチャの一連の符号化処理を行いピクチャデータの符号列生成を行う。このとき、予測符号化部105では、ステップS902において生成された色差サンプル位置情報を用いて、輝度成分の動きベクトルから色差成分の動きベクトルを算出することで画面間予測処理が行われる。
【0055】
符号化対象ピクチャの処理が完了すると、ステップS902に戻って次のピクチャの符号化処理に移り、シーケンス内の全てのピクチャの符号化処理が完了するまでステップS902からステップS904の処理を繰り返す。
【0056】
(色差成分の動きベクトル算出方法について)
ここで、予測符号化部105において画面間予測を行う際に、輝度成分の動きベクトルから色差成分の動きベクトルを算出する方法について詳しく説明する。
【0057】
画面間予測では、符号列に記述される動きベクトルは輝度成分の画素位置の移動量に関する情報のみとなっている。そのため、色差成分の予測画像を生成するための動きベクトルは、間引きの割合に応じて、前記輝度成分の動きベクトルの値をスケーリングすることで算出する。
【0058】
このとき、本実施の形態では、図7および図8を用いて説明した従来の技術とは異なり、(数1)および(数2)に示す方法により色差サンプル位置情報を用いてスケーリングの補正を行うことで、輝度成分と色差成分のサンプル位置がどのような関係にあっても正確な色差成分の動きベクトルを算出することが可能である。
【0059】
ここで、CMVxは算出する色差成分の動きベクトルの水平方向を示す値とする。CMVyは算出する色差成分の動きベクトルの垂直方向を示す値とする。さらに、LMVxは対応する輝度成分の動きベクトルの水平方向を示す値とする。また、LMVyは対応する輝度成分の動きベクトルの垂直方向を示す値とする。さらに、CurSftxは符号化対象ピクチャの色差サンプル位置のシフト量の水平方向を示す値とする。CurSftyは符号化対象ピクチャの色差サンプル位置のシフト量の垂直方向を示す値とする。RefSftxは参照ピクチャの色差サンプル位置のシフト量の水平方向を示す値とする。さらに、RefSftyは参照ピクチャの色差サンプル位置のシフト量の垂直方向を示す値とする。
【0060】
下記の(数1)および(数2)は、色差成分が輝度成分に対して水平垂直方向ともに1/2に間引かれている場合の処理を示している。なお、説明の簡略化のため、(数1)および(数2)では、CMVx、CMVyの単位を、値1で色差成分の1画素とする。さらに、LMVx、LMVyの単位を、値1で輝度成分の1画素とする。そして、CurSftx、CurSfty、RefSftx、RefSftyの単位を、値1で輝度成分の1画素とする。
【0061】
(数1)CMVx=(LMVx+(CurSftx−RefSftx))/2
(数2)CMVy=(LMVy+(CurSfty−RefSfty))/2
なお、HEVCやH.264の動画像符号化方式では、輝度成分の動きベクトルは1/4画素精度の値を、色差成分の動きベクトルは1/8画素精度の値をとることが可能である。この画素精度の違いを考慮して、(数1)および(数2)は、(数3)および(数4)のように表現することも可能である。このとき、(数3)および(数4)では、CMVx、CMVyの単位を、値1で色差成分の1/8画素とする。さらに、LMVx、LMVyの単位を、値1で輝度成分の1/4画素とする。そして、CurSftx、CurSfty、RefSftx、RefSftyの単位を、値1で輝度成分の1/4画素に相当とする。
【0062】
(数3)CMVx=LMVx+(CurSftx−RefSftx)
(数4)CMVy=LMVy+(CurSfty−RefSfty)
図10は、符号化対象の動画像がプログレッシブ形式であり、符号化対象ピクチャも参照ピクチャもフレーム構造である場合の例である。このとき、色差サンプル位置情報として指定されるシフト量は、符号化対象ピクチャについても参照ピクチャについても(0、0.5)となる。輝度成分の動きベクトルの値が(−4、−6)であるため、(数1)および(数2)に従って色差成分の動きベクトルの値を算出すると(−2、−3)となる。なお、(数3)および(数4)の表現に置き換えると、色差サンプル位置のシフト量は(0、2)であり、輝度成分の動きベクトルの値は(−16、−24)、生成される色差成分の動きベクトルの値は(−16、−24)となる。
【0063】
一方、図11は、符号化対象の動画像がインターレース形式であり、符号化対象ピクチャがボトムフィールドで、参照ピクチャがトップフィールドであった場合の例である。このとき、色差サンプル位置情報として指定されるシフト量は、符号化対象ピクチャは(0、0.75)、参照ピクチャは(0、0.25)となる。輝度成分の動きベクトルの値が(−6、2)であるため、(数1)および(数2)に従って色差成分の動きベクトルの値を算出すると(−3、1.25)となる。なお、(数3)および(数4)の表現に置き換えると、色差サンプル位置のシフト量は、符号化対象ピクチャが(0、3)、参照ピクチャが(0、1)であり、輝度成分の動きベクトルの値は(−24、8)、生成される色差成分の動きベクトルの値は(−24、10)となる。
【0064】
同様に、図12は、符号化対象の動画像がインターレース形式であり、符号化対象ピクチャがトップフィールドで、参照ピクチャがボトムフィールドであった場合の例である。このとき、色差サンプル位置情報として指定されるシフト量は、符号化対象ピクチャは(0、0.25)、参照ピクチャは(0、0.75)となる。輝度成分の動きベクトルの値が(−6、2)であるため、(数1)および(数2)に従って色差成分の動きベクトルの値を算出すると(−3、0.75)となる。なお、(数3)および(数4)の表現に置き換えると、色差サンプル位置のシフト量は、符号化対象ピクチャが(0、1)、参照ピクチャが(0、3)であり、輝度成分の動きベクトルの値は(−24、8)、生成される色差成分の動きベクトルの値は(−24、6)となる。
【0065】
このように、図8を用いて説明した従来の技術では、色差成分の動きベクトルを正確に求めることができず、輝度成分の動きベクトルと色差成分の動きベクトルとが平行関係になかったが、本発明による図11および図12の例では、色差成分の動きベクトルを正確に求めることが可能となり、輝度成分の動きベクトルと色差成分の動きベクトルとが平行関係になっているのが分かる。
【0066】
なお、符号化対象の動画像がプログレッシブ形式である場合は、前述のとおり符号化対象ピクチャと参照ピクチャの色差サンプル位置のシフト量は常に同じ値になるため、(数1)および(数2)、もしくは(数3)および(数4)で説明した処理を行わず、従来の技術と同様に間引きの割合に応じてそのままスケーリングすることで算出してもよい。
【0067】
また、符号化対象の動画像がインターレース形式であった場合でも、図5を用いて説明した色差成分の間引き方法が、図5(b)のように4:2:2サンプリングと呼ばれる水平方向のみ1/2に間引く方法や、図5(c)のように4:4:4サンプリングと呼ばれる間引きを行わない方法であった場合、前述のプログレッシブ形式の場合と同様に、符号化対象ピクチャと参照ピクチャの色差サンプル位置のシフト量は常に同じ値になるため、(数1)および(数2)、もしくは(数3)および(数4)で説明した処理を行わず、従来の技術と同様に間引きの割合に応じてそのままスケーリングすることで算出してもよい。
【0068】
また、符号化対象の動画像がプログレッシブ形式である場合もインターレースである場合も、色差サンプル位置の水平方向のシフト量は常に0であるため、(数1)もしくは(数3)で説明した処理を行わず、(数2)もしくは(数4)で説明した処理のみを行うという構成にしてもよい。
【0069】
(符号列159のシンタックス構成に関して)
次に、本実施の形態によって生成される符号列159の構成を、図13を用いて説明する。
【0070】
生成される符号列159は、シーケンス単位の符号化制御情報を記述したシーケンスヘッダ領域、ピクチャ単位の符号化制御情報を記述したピクチャヘッダ領域、スライス単位の符号化制御情報を記述したスライスヘッダ領域、およびスライスデータで構成されている。このとき、図9におけるステップS902で生成した色差サンプル位置情報はスライスヘッダ領域に記述される。
【0071】
ここで、色差サンプル位置情報が記述されるスライスヘッダ領域のシンタックスについて図14を用いて詳しく説明する。なお、図14では本発明に関連するシンタックス以外は省略して記載している。
【0072】
図14(a)では、色差サンプル位置情報として、chroma_sample_shift_xとchroma_sample_shift_yとがスライスヘッダ領域に記述されている。
【0073】
chroma_sample_shift_xは、符号化対象ピクチャにおける、色差成分のサンプル位置が輝度成分のサンプル位置に対して、輝度成分の座標空間上においてどれくらいずれているかを示す水平方向のシフト量であり、chroma_sample_shift_yは同垂直方向のシフト量である。例えば、従来の技術で説明した図6の例を用いると、シフト量を(chroma_sample_shift_x、chroma_sample_shift_y)と表現したとき、符号化対象ピクチャが図6(a)のようなフレーム構造であった場合は(0、0.5)となり、符号化対象ピクチャが図6(b)のようなトップフィールド構造であった場合は(0、0.25)となり、符号化対象ピクチャが図6(c)のようなボトムフィールド構造であった場合は(0、0.75)となる。
【0074】
なお、chroma_sample_shift_xおよびchroma_sample_shift_yの値の単位は任意であり、例えば、値1が輝度成分の1/4画素に相当するように表現した場合は、図6(a)は(0、2)、図6(b)は(0、1)、図6(c)は(0、3)となる。
【0075】
なお、符号化対象の動画像がプログレッシブ形式である場合は、シーケンスに属する全てのピクチャの色差サンプル位置のシフト量は同じ値となる。そのため、chroma_sample_shift_xおよびchroma_sample_shift_yを記述せずに予め定義された固定値として符号化処理を行うようにしてもよい。
【0076】
また、符号化対象の動画像がインターレース形式であった場合でも、図5を用いて説明した色差成分の間引き方法が、図5(b)のように4:2:2サンプリングと呼ばれる水平方向のみ1/2に間引く方法や、図5(c)のように4:4:4サンプリングと呼ばれる間引きを行わない方法であった場合、前述のプログレッシブ形式の場合と同様に、シーケンスに属する全てのピクチャの色差サンプル位置のシフト量は同じ値となる。そのため、chroma_sample_shift_xおよびchroma_sample_shift_yを記述せずに予め定義された固定値として符号化処理を行うようにしてもよい。
【0077】
また、符号化対象の動画像がプログレッシブ形式である場合もインターレースである場合も、色差サンプル位置の水平方向のシフト量は常に0であるため、chroma_sample_shift_xを記述せずに、chroma_sample_shift_yのみを記述するようにしてもよい。
【0078】
また、図14(a)のように色差サンプル位置のシフト量を直接記述せずに、例えば、図14(b)のchroma_sample_idcように別の意味を持たせたパラメータから間接的に色差サンプル位置のシフト量を指定するようにしてもよい。
【0079】
chroma_sample_idcは、0のときは、符号化対象ピクチャの色差成分は輝度成分に対して水平垂直ともに1/2に間引いたもの(4:2:0サンプル)であり、さらにインターレース形式のトップフィールドであることを示す。つまり、図6(b)の構造のピクチャであることを示す。また、1のときは、符号化対象ピクチャの色差成分は輝度成分に対して水平垂直ともに1/2に間引いたもの(4:2:0サンプル)であり、さらにインターレース形式のボトムフィールドであることを示す。つまり、図6(c)の構造のピクチャであることを示す。また、2のときは、それ以外の構造のピクチャであることを示す。
【0080】
これにより、chroma_sample_idcが、0のときは色差サンプル位置のシフト量が(0、0.25)であり、1のときは色差サンプル位置のシフト量が(0、0.75)であり、2のときは色差サンプル位置のシフト量が(0、0.5)もしくは(0、0)であることを間接的に指定することが可能となる。
【0081】
なお、前述のchroma_sample_idcと同じ情報を、色差成分の間引き方法を示す情報と、インターレース形式のトップフィールドであるかボトムフィールドであるかを示す情報とに分けて記述する構成としてもよい。このとき、色差成分の間引き方法を示す情報として、例えば、図5(a)の4:2:0サンプリング、図5(b)の4:2:2サンプリング、図5(c)の4:4:4サンプリングのいずれかを示す情報とし、シーケンス全体で共通に必要となる情報としてシーケンス単位のヘッダ領域に記述する方法がある。一方、インターレース形式のトップフィールドであるかボトムフィールドであるかを示す情報として、例えば、値0のときはインターレース形式のトップフィールド、値1のときはインターレース形式のボトムフィールドを示すパラメータとし、ピクチャ全体で共通に必要となる情報としてピクチャ単位のヘッダ領域、もしくはスライス単位のヘッダ領域に記述する方法がある。
【0082】
なお、図14を用いて説明した色差サンプル位置情報は、符号化対象ピクチャに対して1つのみを対応付けるものである。しかし、1つのピクチャは複数のスライスから構成されているため、色差サンプル位置情報が記述されているスライスヘッダも複数符号化される。そのため、図14を用いて説明した各パラメータは、対象となるスライスが属するピクチャにおいて常に同じ値が記述されることになる。
【0083】
(符号列159の他のシンタックス構成に関して)
ここで、色差サンプル位置情報が記述されるスライスヘッダ領域のシンタックスの別の構成について図15を用いて詳しく説明する。なお、図15では本発明に関連するシンタックス以外は省略して記載している。
【0084】
図14を用いて説明した構成では、符号化対象ピクチャにおける色差サンプル位置のシフト量を1組だけ色差サンプル位置情報としてスライスヘッダに記述していた。しかし、図15は、画面間予測における参照ピクチャの枚数分だけ色差サンプル位置情報として、chroma_sample_mv_shift_xとchroma_sample_mv_shift_yをスライスヘッダに記述している。
【0085】
chroma_sample_mv_shift_xは、符号化対象ピクチャと参照ピクチャとにおける色差成分のサンプル位置の相対位置関係が、符号化対象ピクチャと参照ピクチャとにおける輝度成分のサンプル位置の相対位置関係に対して、どれだけずれているかを示す水平方向のシフト量である。
【0086】
また、chroma_sample_mv_shift_yは、符号化対象ピクチャと参照ピクチャとにおける色差成分のサンプル位置の相対位置関係が、符号化対象ピクチャと参照ピクチャとにおける輝度成分のサンプル位置の相対位置関係に対して、どれだけずれているかを示す垂直方向のシフト量である。
【0087】
例えば、シフト量を(chroma_sample_mv_shift_x、chroma_sample_mv_shift_y)と表現したとき、図10のように符号化対象ピクチャと参照ピクチャがフレーム構造であった場合は(0、0)となり、図11のように符号化対象ピクチャがボトムフィールド構造で参照ピクチャがトップフィールド構造であった場合は(0、0.5)となり、図12のように符号化対象ピクチャがボトムフィールド構造で参照ピクチャがトップフィールド構造であった場合は(0、−0.5)となる。
【0088】
言い換えると、chroma_sample_mv_shift_xおよびchroma_sample_mv_shift_yは、(数1)および(数2)における、(CurSftx−RefSftx)および(CurSfty−RefSfty)の値に相当する。要するに、図15の構成を用いると(数1)および(数2)は、(数5)および(数6)のように単純化することができる。なお、MVSftxはchroma_sample_mv_shift_xの値であり、MVSftyはchroma_sample_mv_shift_yの値であり、MVSftxおよびMVSftyの単位は、値1で輝度成分の1画素に相当するものとする。
【0089】
(数5)CMVx=(LMVx+MVSftx)/2
(数6)CMVy=(LMVy+MVSfty)/2
また同様に、(数5)および(数6)も(数7)および(数8)のように単純化することができる。このとき、MVSftxおよびMVSftyの単位は、値1で輝度成分の1/4画素に相当するものとする。
【0090】
(数7)CMVx=LMVx+MVSftx
(数8)CMVy=LMVy+MVSfty
なお、chroma_sample_mv_shift_xおよびchroma_sample_mv_shift_yの値の単位は任意である。例えば、値1が輝度成分の1/4画素に相当するとした場合は、図10では(0、0)、図11では(0、2)、図12では(0、−2)となる。
【0091】
なお、符号化対象の動画像がプログレッシブ形式である場合は、シーケンスに属する全てのピクチャの色差サンプル位置のシフト量は同じ値となるので、chroma_sample_mv_shift_xおよびchroma_sample_mv_shift_yを記述せずに予め定義された固定値として符号化処理を行うようにしてもよい。
【0092】
また、符号化対象の動画像がインターレース形式であった場合でも、図5を用いて説明した色差成分の間引き方法が、図5(b)のように4:2:2サンプリングと呼ばれる水平方向のみ1/2に間引く方法や、図5(c)のように4:4:4サンプリングと呼ばれる間引きを行わない方法であった場合、前述のプログレッシブ形式の場合と同様に、シーケンスに属する全てのピクチャの色差サンプル位置のシフト量は同じ値となるので、chroma_sample_mv_shift_xおよびchroma_sample_mv_shift_yを記述せずに予め定義された固定値として符号化処理を行うようにしてもよい。
【0093】
また、符号化対象の動画像がプログレッシブ形式である場合もインターレースである場合も、色差サンプル位置の水平方向のシフト量は常に0であるため、chroma_sample_mv_shift_xを記述せずに、chroma_sample_mv_shift_yのみを記述するようにしてもよい。
【0094】
なお、図15を用いて説明した色差サンプル位置情報は、参照ピクチャ毎に1つずつ対応付けるものである。また、1つのピクチャは複数のスライスから構成されているため、色差サンプル位置情報が記述されているスライスヘッダも複数符号化される。そのため、図15を用いて説明した各パラメータは、1つのピクチャに属する複数のスライスがそれぞれ異なる参照ピクチャを指定する場合はスライス毎に異なる値が記述されるが、1つのピクチャに属する複数のスライスが常に同じ参照ピクチャを指定する場合は、対象となるスライスが属するピクチャにおいて常に同じ値が記述されることになる。
【0095】
(符号列159の他のシンタックス構成に関して)
ここで、本実施の形態によって生成される符号列159における別のシンタックス構成を図16に基づいて説明する。
【0096】
生成される符号列159は、図13を用いて説明した符号列の構成と同様に、シーケンス単位の符号化制御情報を記述したシーケンスヘッダ領域、ピクチャ単位の符号化制御情報を記述したピクチャヘッダ領域、スライス単位の符号化制御情報を記述したスライスヘッダ領域、およびスライスデータで構成されている。このとき、図13を用いて説明した符号列の構成とは異なり、色差サンプル位置情報はスライスヘッダ領域ではなくピクチャヘッダ領域に記述されている。
【0097】
色差サンプル位置情報が記述されるピクチャヘッダ領域のシンタックスについては図17に示す通りであり、図14を用いて説明した内容と全く同様であるので説明を省略する。なお、ピクチャヘッダはピクチャ毎に1つずつのみが生成されるため、色差サンプル位置情報もピクチャ毎に1つずつのみが指定可能であり、対象ピクチャ内の全てのスライスで共通して使用される。
【0098】
なお、本実施の形態で説明した全てのパラメータ名およびパラメータ値については一例であり、これ以外のパラメータ名およびパラメータ値を用いて同様の機能を実現してもよい。
【0099】
このように、本実施の形態による動画像符号化装置を用いることにより、インターレース形式の動画像を入力として1枚のフィールドを1枚のピクチャとして符号化する場合でも、画面間予測符号化において、輝度成分の動きベクトルから色差成分の動きベクトルを正確に算出することができる。
【0100】
(実施の形態2)
以下、本発明の実施の形態2について、図面を参照しながら説明する。
【0101】
(復号化装置全体の処理説明)
図2は、本発明の実施の形態に係る動画像復号化装置200のブロック図である。動画像復号化装置200は、実施の形態1で説明した動画像符号化装置によって生成された符号列に対し、ブロック単位で復号化処理する。そして、動画像復号化装置200は、出力画像を生成する。
【0102】
この動画像復号化装置200は、符号列解析部201と、予測残差復号化部202と、ピクチャメモリ203と、予測復号化部204と、量子化値決定部205と、色差サンプル位置情報解析部206を備えている。
【0103】
符号列解析部201は、入力された符号列信号251に対して可変長復号化を施すことによりヘッダ情報の解析およびブロック単位のピクチャデータの解析を行う。符号列解析部201は、解析して得られる残差符号化信号252を予測残差復号化部202へ出力する。また、符号列解析部201は、予測情報信号256を予測復号化部204へ出力する。さらに、符号列解析部201は、量子化値情報を量子化値決定部205へ出力する。そして、符号列解析部201は、色差サンプル位置情報信号257を色差サンプル位置情報解析部206へ出力する。
【0104】
予測残差復号化部202は、符号列解析部201から出力される残差符号化信号252に対して、逆量子化および逆直交変換を行うことで残差復号化信号253を生成し、加算演算部207に出力する。このとき予測残差復号化部202は、量子化値決定部205において決定された量子化値を用いて残差符号化信号252を逆量子化する。
【0105】
ピクチャメモリ203は、加算演算部207から出力される再構成画像信号255を格納する。この再構成画像信号255は、現在復号化対象となっているピクチャ以降のピクチャの復号化における予測復号化処理において参照用の画素データとして使用される。ピクチャメモリ203は、予測復号化部204からの読出し命令に応じて、格納している再構成画像信号255を画素データとして予測復号化部204へ出力する。
【0106】
また同時に、ピクチャメモリ204は、格納している再構成画像信号255を出力画像信号258として外部に出力する。出力画像信号258はプログレッシブ形式とインターレース形式との双方があり、プログレッシブ形式の場合は1枚のピクチャを1枚のフレームとして、インターレース形式の場合は1枚のピクチャを1枚のフィールドとして、表示順に並び替えることによって出力される。
【0107】
予測復号化部204は、符号列解析部201から出力される予測情報信号256を基に、画面内予測、または画面間予測を用いて予測画像信号254を生成し、加算演算部207に出力する。なお、予測復号化部204は、画面間予測を用いる際は、ピクチャメモリ203に蓄積される既に復号化済みのピクチャの再構成画像信号255を用いる。また、画面内予測を用いる際は、復号化対象ブロックに隣接する既に復号化済みのブロックの再構成画像信号255を用いる。画面内予測を用いるか画面間予測を用いるかの判定については、入力される予測情報信号256に従って行われる。
【0108】
色差サンプル位置情報解析部206は、符号列解析部201から出力される色差サンプル位置情報信号257を解析して、輝度成分のサンプル位置に対する色差成分のサンプル位置の関係を示す色差サンプル位置情報を取得する。取得された色差サンプル位置情報は予測符号化部204に出力される。
【0109】
ここで、色差サンプル位置情報としては、色差成分の(0、0)位置の画素が、輝度成分の(0、0)位置の画素に対して、輝度成分の座標空間上においてどれくらいずれているかを示すシフト量で定義される。従来の技術で説明した図6の例を用いて詳しく説明する。ここで、図6に示すピクチャの座標空間は、最も左上の画素位置の座標を(0,0)とする。さらに、垂直下方向または水平右方向に変位するにつれ座標がプラスとなるように座標空間を設定する。例えば、符号化対象ピクチャが図6(a)のようなフレーム構造であった場合、色差成分の(0、0)位置の画素が、輝度成分の(0、0)位置の画素に対して、水平方向に0画素分、垂直方向に0.5画素分下にずれている。よってシフト量は(0、0.5)となる。同様に、符号化対象ピクチャが図6(b)のようなトップフィールド構造であった場合は、水平方向に0画素分、垂直方向に0.25画素分下にずれている。よってシフト量は(0、0.25)となる。また、符号化対象ピクチャが図6(c)のようなボトムフィールド構造であった場合は、水平方向に0画素分、垂直方向に0.75画素分下にずれている。よってシフト量は(0、0.75)となる。
【0110】
加算演算部207は、予測残差復号化部202から出力される残差復号化信号253と予測復号化部204から出力される予測画像信号254を加算することによって再構成画像信号255を生成し、ピクチャメモリ203に出力する。
【0111】
(色差サンプル位置情報の処理全体説明)
ここで、符号列解析部201で符号列を解析して得られた情報を基に、色差サンプル位置情報解析部206で色差サンプル位置情報を取得し、予測復号化部204で予測画像を生成する方法について、図18の復号化処理全体のフローチャートを用いて具体的に説明する。
【0112】
まず、ステップS1801において、符号列解析部201はシーケンス単位のヘッダ領域の符号列解析を行う。シーケンス単位のヘッダ領域には、復号化制御においてシーケンス全体で共通に必要となる情報が記述されている。
【0113】
次に、ステップS1802において、符号列解析部201はピクチャ単位およびスライス単位のヘッダ領域の符号列解析を行う。ピクチャ単位のヘッダ領域には、復号化制御において復号化対象ピクチャ全体で共通に必要となる情報が記述されている。また、スライス単位のヘッダ領域には、復号化制御において復号化対象ピクチャに属する複数のブロックから構成されるスライス全体で共通に必要となる情報、および復号化対象ピクチャ全体で共通に必要となる情報が記述されている。このとき、色差サンプル位置情報信号257が、ピクチャ単位のヘッダ領域、もしくはスライス単位のヘッダ領域から取得される。
【0114】
次に、ステップS1803において、色差サンプル位置情報解析部206は、ステップS1802で取得された色差サンプル位置情報信号257を解析して、符号化対象ピクチャの色差成分のサンプル位置が輝度成分のサンプル位置に対してどのような位置関係にあるかを示す色差サンプル位置情報を生成する。
【0115】
最後に、ステップS1804において、図2を用いて説明した復号化対象ピクチャの一連の復号化処理を行い復号化画像の生成を行う。このとき、予測復号化部204では、ステップS1803において解析された色差サンプル位置情報を用いて、輝度成分の動きベクトルから色差成分の動きベクトルを算出することで画面間予測処理が行われる。
【0116】
復号化対象ピクチャの処理が完了すると、ステップS1802に戻って次のピクチャの復号化処理に移り、シーケンス内の全てのピクチャの復号化処理が完了するまでステップS1802からステップS1804の処理を繰り返す。
【0117】
(色差成分の動きベクトル算出方法について)
ここで、予測復号化部204において画面間予測を行う際に、輝度成分の動きベクトルから色差成分の動きベクトルを算出する方法について説明する。
【0118】
画面間予測では、符号列に記述されている動きベクトルは輝度成分の画素位置の移動量に関する情報のみである。そのため、色差成分の予測画像を生成するための動きベクトルは、前記輝度成分の動きベクトルの値を間引きの割合に応じてスケーリングすることで算出する。
【0119】
このとき本実施の形態では、色差サンプル位置情報を用いて、実施の形態1で(数1)から(数8)および図10から図12を用いて説明した動画像符号化装置における画面間予測の処理と全く同様の処理を行うことで、色差成分の動きベクトルを生成する。よって、復号化対象ピクチャが、プログレッシブ形式に属するフレーム構造であっても、さらにインターレース形式に属するトップフィールド構造もしくはボトムフィールド構造であっても、もしくはそれ以外の理由により輝度成分のサンプル位置と色差成分のサンプル位置とが一致していない場合においても、常に正確に輝度成分の動きベクトルから色差成分の動きベクトルを算出して画面間予測を行うことができる。
【0120】
(符号列251のシンタックス構成に関して)
最後に、本実施の形態で復号化対象とする符号列251の構成およびシンタックスは、実施の形態1で図13から図17を用いて説明したものと全く同様であるので、ここでは説明を省略する。
【0121】
このように、本実施の形態による動画像復号化装置を用いることにより、インターレース形式の動画像を入力として1枚のフィールドを1枚のピクチャとして符号化した符号列を復号化する場合でも、画面間予測復号化において、輝度成分の動きベクトルから色差成分の動きベクトルを正確に算出することができる。
【0122】
(その他の実施形態)
さらに、上記実施の形態で示した動画像符号化装置および動画像復号化装置に含まれる各手段と同等の機能を備えるプログラムを、フレキシブルディスク等の記録媒体に記録するようにすることにより、上記実施の形態で示した処理を、独立したコンピュータシステムにおいて簡単に実施することが可能となる。なお、記録媒体としてはフレキシブルディスクに限らず、光ディスク、ICカード、ROMカセット等、プログラムを記録できるものであれば同様に実施することができる。
【0123】
また、上記実施の形態で示した動画像符号化装置および動画像復号化装置に含まれる各手段と同等の機能を集積回路であるLSIとして実現してもよい。これらは一部または全てを含むように1チップ化されてもよい。またLSIは集積度の違いにより、IC、システムLSI、スーパーLSI、ウルトラLSIと称されることもある。
【0124】
また、集積回路化の手法はLSIに限るものではなく、専用回路または汎用プロセッサで実現しても良い。LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサを利用しても良い。
【0125】
さらには、半導体技術の進歩または派生する別技術によりLSIなどに置き換わる集積回路の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。
【0126】
また、本発明は、上述した動画像符号化装置および動画像復号化装置を含む、放送局から放送される放送波を圧縮し、記録を行うDVDレコーダー、BDレコーダー等の放送波記録装置に適用しても構わない。
【0127】
また、上記実施の形態に係る、動画像符号化装置および動画像復号化装置、またはその変形例の機能のうち少なくとも一部を組み合わせてもよい。
【産業上の利用可能性】
【0128】
本発明は、例えば、ビデオカメラ、デジタルカメラ、ビデオレコーダ、携帯電話、及びパーソナルコンピューター等における、入力画像を構成する各ピクチャを符号化して動画像符号化データとして出力する動画像符号化装置や、前記動画像符号化データを復号化して復号化画像を生成する動画像復号化装置として有用である。
【符号の説明】
【0129】
100 動画像符号化装置
101 ピクチャメモリ
102 予測残差符号化部
103 予測残差復号化部
104 ローカルバッファ
105 予測符号化部
106 量子化値決定部
107 符号列生成部
108 色差サンプル位置情報生成部
109 差分演算部
110 加算演算部
151 入力画像信号
152 差分画像信号
153 残差符号化信号
154 残差復号化信号
155 再構成画像信号
156 予測画像信号
157 予測情報信号
158 色差サンプル位置情報信号
159 符号列信号
200 動画像復号化装置
201 符号列解析部
202 予測残差復号化部
203 ピクチャメモリ
204 予測復号化部
205 量子化値決定部
206 色差サンプル位置情報解析部
207 加算演算部
251 符号列信号
252 残差符号化信号
253 残差復号化信号
254 予測画像信号
255 再構成画像信号
256 予測情報信号
257 色差サンプル位置情報信号
258 出力画像信号

【特許請求の範囲】
【請求項1】
インターレース形式またはプログレッシブ形式の動画像形式を有し、輝度成分および色差成分によって構成される動画像信号をピクチャ単位で符号化して得られる符号列を、ピクチャ単位で復号化する動画像復号化装置であって、
前記符号列のヘッダ領域を解析し、前記動画像信号の動画像形式がインターレース形式およびプログレッシブ形式のうちいずれの形式であるかを示す動画像形式情報および、前記輝度成分に対する前記色差成分の間引き方法に関する間引き情報に基づいて生成されたピクチャ内における前記色差成分のサンプル位置に関するサンプル位置情報を取得するサンプル位置情報解析部と、
前記符号列のヘッダ領域を解析し、前記輝度成分を符号化処理単位であるブロック毎に符号化する際に適用した動きベクトルを取得し、さらに前記色差成分のサンプル位置情報に基づいて前記輝度成分の動きベクトルを補正することにより、前記ブロックにおける前記色差成分を符号化する際に適用した動きベクトルを算出する動きベクトル算出部と、
前記算出した輝度成分の動きベクトルおよび前記色差成分の動きベクトルを用いて、前記符号列を復号化単位であるブロック毎に復号化し、前記ピクチャを取得するピクチャデータ復号化部と、
前記表示制御情報がプログレッシブ形式を示す場合、前記取得したピクチャを1枚のフレームと設定し前記フレームを表示順に1枚ずつ出力し、一方前記表示制御情報がインターレース形式を示す場合、前記取得したピクチャを1枚のフィールドと設定し、対になるトップフィールドとボトムフィールドを取得した時点で表示順に出力するピクチャメモリと、を備える、
動画像復号化装置。
【請求項2】
前記サンプル位置情報解析部は、前記ピクチャ内における前記色差成分のサンプル位置と前記輝度成分のサンプル位置とのずれを示すシフト量を前記色差成分のサンプル位置情報として取得し、
前記ピクチャデータ復号化部は、前記符号列におけるヘッダ領域のうちピクチャ単位で生成する領域から前記サンプル位置情報を取得する請求項1に記載の動画像復号化装置。
【請求項3】
前記動きベクトル算出部は、復号化対象ピクチャにおいて生成したサンプル位置情報と、前記ピクチャ復号化対象ピクチャが参照する参照ピクチャにおいて生成したサンプル位置情報との差分値に基づいて、前記輝度成分の動きベクトルを補正することにより、前記色差成分の動きベクトルを算出する請求項2に記載の動画像復号化装置。
【請求項4】
前記サンプル位置情報解析部は、復号化対象ピクチャにおける色差成分のサンプル位置と、前記復号化対象ピクチャが参照する参照ピクチャにおける色差成分のサンプル位置とのずれを示すシフト量を前記サンプル位置情報として取得し、
前記ピクチャデータ復号化部は、前記符号列におけるヘッダ領域のうち前記参照ピクチャを指定するための情報を記述する領域から前記サンプル位置情報を格納する請求項1に記載の動画像復号化装置。
【請求項5】
前記動きベクトル算出部は、復号化対象である前記ブロックが参照する参照ピクチャに対応づけられた前記サンプル位置情報を用いて、前記輝度成分の動きベクトルを補正することにより、前記色差成分の動きベクトルを算出する請求項4に記載の動画像復号化装置。
【請求項6】
前記色差成分のサンプル位置情報は、垂直成分のみの情報を有する請求項1に記載の動画像復号化装置。
【請求項7】
前記色差成分のサンプル位置情報は、垂直成分と水平成分の両方の情報を有する請求項1に記載の動画像復号化装置。
【請求項8】
前記色差成分のサンプル位置情報は、復号化対象ピクチャが、インターレース形式のトップフィールドであるか、インターレース形式のボトムフィールドであるかを示す情報である請求項1に記載の動画像復号化装置。
【請求項9】
前記サンプル位置情報解析部は、ピクチャ全体の符号化制御情報を記述するヘッダ領域から前記色差成分のサンプル位置情報を取得する請求項1に記載の動画像復号化装置。
【請求項10】
前記サンプル位置情報解析部は、前記ピクチャを分割した単位であるスライスに関する符号化制御情報を記述するヘッダ領域から前記色差成分のサンプル位置情報を取得する請求項1に記載の動画像復号化装置。
【請求項11】
前記シフト量は、輝度成分のサンプル位置の間隔の1/4を1単位とした値である請求項2または請求項4に記載の動画像復号化装置。
【請求項12】
インターレース形式またはプログレッシブ形式の動画像形式を有し、輝度成分および色差成分によって構成される動画像信号をピクチャ単位で符号化して得られる符号列を、ピクチャ単位で復号化する動画像復号化方法であって、
前記符号列のヘッダ領域を解析し、前記動画像信号の動画像形式がインターレース形式およびプログレッシブ形式のうちいずれの形式であるかを示す動画像形式情報および、前記輝度成分に対する前記色差成分の間引き方法に関する間引き情報に基づいて生成されたピクチャ内における前記色差成分のサンプル位置に関するサンプル位置情報を取得し、
前記符号列のヘッダ領域を解析し、前記輝度成分を符号化処理単位であるブロック毎に符号化する際に適用した動きベクトルを取得し、さらに前記色差成分のサンプル位置情報に基づいて前記輝度成分の動きベクトルを補正することにより、前記ブロックにおける前記色差成分を符号化する際に適用した動きベクトルを算出し、
前記算出した輝度成分の動きベクトルおよび前記色差成分の動きベクトルを用いて、前記符号列を復号化単位であるブロック毎に復号化し、前記ピクチャを取得し、
前記表示制御情報がプログレッシブ形式を示す場合、前記取得したピクチャを1枚のフレームと設定し前記フレームを表示順に1枚ずつ出力し、一方前記表示制御情報がインターレース形式を示す場合、前記取得したピクチャを1枚のフィールドと設定し、対になるトップフィールドとボトムフィールドを取得した時点で表示順に出力する、
動画像復号化方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate