説明

画像符号化装置、画像復号装置、および画像符号化方法、画像復号方法

【課題】4:4:4フォーマットのような色成分間にサンプル比の区別のない動画像信号を符号化するにあたり、最適性を高めた符号化装置、復号装置、符号化方法、および復号方法を提供する。
【解決手段】
4:4:4フォーマットのデジタル動画像信号を入力して圧縮符号化を行う場合に、入力された動画像信号の3つの色成分信号を共通の符号化モードで符号化する処理と、入力された動画像信号の3つの色成分信号をそれぞれ独立の符号化モードで符号化処理を行う処理とを用意し、前記第1の符号化処理と第2の符号化処理のいずれか一方を選択して符号化処理を行うとともに、どちらを選択したかを示す識別信号を圧縮データに含めるようにする。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像圧縮符号化技術や圧縮画像データ伝送技術等に用いられるデジタル画像信号符号化装置、デジタル画像信号復号装置、デジタル画像信号符号化方法、およびデジタル画像信号復号方法に関する。
【背景技術】
【0002】
従来、MPEGやITU-T H.26xなどの国際標準映像符号化方式(例えば非特許文献1)では、主として4:2:0フォーマットと呼ばれる標準化された入力信号フォーマットの使用を前提としてきた。4:2:0とは、RGBなどのカラー動画像信号を輝度成分(Y)と2つの色差成分(Cb、Cr)に変換し、水平・垂直ともに色差成分のサンプル数を輝度成分の半分に削減したフォーマットである。色差成分は輝度成分に比べて視認性が落ちることから、従来の国際標準映像符号化方式では、このように符号化を行う前に色差成分のダウンサンプルを行うことで符号化対象の原情報量を削減しておくことを前提としていた。一方、近年のビデオディスプレイの高解像度化、高階調化に伴い、色差成分をダウンサンプルすることなく輝度成分と同一サンプル数のまま符号化する方式の検討が行われている。輝度成分と色差成分とがまったく同一のサンプル数のフォーマットは4:4:4フォーマットと呼ばれる。従来の4:2:0フォーマットが色差成分のダウンサンプルを前提としたためにY、Cb、Crという色空間定義にのみ限定されたのに対し、4:4:4フォーマットでは色成分間にサンプル比の区別がないため、Y、Cb、Crのほか、R,G,Bを直接使用したり、その他複数の色空間定義を利用することが可能である。4:4:4フォーマットを対象とした映像符号化方式としては、非特許文献2などがある。同文献では、色成分間に残存する相関を利用して異なる色成分間で予測を行うことにより符号化すべき情報量を削減するアプローチを提案している。しかし、色成分間の相関の度合いは映像コンテンツの種類や色空間によって様々であり、予測が符号化効率上逆効果となる場合もありうる。また、複数の色成分をまたがった信号処理を必要とするために、デジタルシネマ映像(4000x2000画素)などきわめて解像度の高い映像信号のリアルタイム処理を行うような例では並列処理効率が悪いという課題がある。
【0003】
【非特許文献1】”Information Technology Coding of Audio-Visual Objects Part10: Advanced Video Coding”, ISO/IEC 14496-10, 2003
【非特許文献2】Woo-Shik Kim, Dae-Sung Cho, and Hyun Mun Kim、”INTER-PLANE PREDICTION FOR RGB VIDEO CODING”, ICIP 2004, October 2004.
【発明の開示】
【発明が解決しようとする課題】
【0004】
非特許文献1におけるMPEG-4 Advanced Video Coding(以下AVC)の4:2:0フォーマットを符号化対象とするハイ4:2:0プロファイルでは、輝度成分16x16画素からなるマクロブロック領域において、対応する色差成分はCb、Crとも各8x8画素ブロックとなる。ハイ4:2:0プロファイルにおける動き補償予測では、輝度成分に対してのみ動き補償予測の単位となるブロックサイズ情報と予測に用いる参照画像情報、各ブロックごとの動きベクトル情報を多重化し、色差成分は輝度成分と同じ情報を用いて動き補償予測を行うことになっている。4:2:0フォーマットは、画像の構造情報(テクスチャ情報)のほとんどが輝度成分に集約されていることと、輝度信号に比べ色差成分のほうが歪の視認性が低く、映像再現性に関する寄与が小さいという色空間定義上の特徴があり、上記ハイ4:2:0プロファイルの予測・符号化はこのような4:2:0フォーマットの性質の前提のもとでなりたつものである。しかしながら、4:4:4フォーマットでは3つの色成分が同等にテクスチャ情報を保持しており、1成分のみに依存したインター予測モード、参照画像情報および動きベクトル情報で動き補償予測が行われる方式は、画像信号の構造表現に際して各色成分が同等に寄与する4:4:4フォーマットでは必ずしも最適な予測方法とはいえない。
【0005】
そこで、本発明は、上記従来技術に述べたように、4:4:4フォーマットのような色成分間にサンプル比の区別のない動画像信号を符号化するにあたり、最適性を高めた符号化装置、復号装置、符号化方法、および復号方法を提供することを目的とする。
【課題を解決するための手段】
【0006】
本発明は、4:4:4フォーマットのデジタル動画像信号を入力して圧縮符号化を行う場合に、入力された動画像信号の3つの色成分信号を共通の符号化モードで符号化する処理と、入力された動画像信号の3つの色成分信号をそれぞれ独立の符号化モードで符号化処理を行う処理とを用意し、前記第1の符号化処理と第2の符号化処理のいずれか一方を選択して符号化処理を行うとともに、どちらを選択したかを示す識別信号を圧縮データに含めるようにしたものである。
また、4:4:4フォーマットのデジタル動画像信号の圧縮データを復号する場合に、3つの色成分信号を共通の符号化モードで復号処理を行う第1の復号処理と、3つの色成分信号をそれぞれ独立の符号化モードで復号処理を行う第2の復号処理とを用意し、圧縮データから、3つの色成分信号を共通の符号化モードで符号化されたものか、独立の符号化モードで符号化されたものかを示す識別信号を復号し、この識別信号に応じて前記第1の復号処理と第2の復号処理のいずれか一方を用いて復号処理を行うようにしたものである。
【発明の効果】
【0007】
本発明によれば、Y、Cb、Crなどの固定された色空間に限定せず多様な色空間を利用する符号化を行う場合において、各色成分で用いるインター予測モード情報を柔軟に選択できるように構成することができ、色空間の定義が種々に及ぶ場合にも最適な符号化処理を行うことができる。
【発明を実施するための最良の形態】
【0008】
実施の形態1.
本実施の形態1では、特定の色空間に限定されない4:4:4フォーマットの映像信号を効率的に符号化する符号化装置、および該符号化装置により生成される符号化ビットストリームを入力として画像信号を復元する復号装置について述べる。
本実施の形態1における符号化装置は、RGB、XYZ、YCbCrといったような3つの色成分からなる映像信号を入力して圧縮符号化を行ってビットストリームを出力する。図1に示すように、入力映像信号は、時間サンプリングによりフレームないしはフィールドの単位で定義される画面情報(以降、ピクチャと呼ぶ)の時系列データとして表現される。ピクチャを時系列に並べたデータ単位をシーケンスと呼ぶ。シーケンスは、いくつかのピクチャのグループ(GOP)に分割されることがある。GOPは、任意のGOPの先頭から他のGOPに依存せずに復号を実行できることを保証し、ビットストリームに対するランダムアクセスを保証するといった用途に利用する。ピクチャはさらにマクロブロックと呼ばれる正方ブロックに分割され、マクロブロックの単位で予測・変換・量子化処理を適用して映像圧縮を行う。
【0009】
また、マクロブロックを複数個集めた単位をスライスと呼ぶ。スライスは、それぞれのスライスで独立に符号化・復号を行うことができるデータ単位であり、例えばHDTVあるいはそれ以上の高い解像度を持つ映像信号をリアルタイム処理する際に、1つのピクチャを複数のスライスに分割し各スライスを並列に符号化・復号することで演算時間を短縮したり、ビットストリームを誤り率の高い回線で伝送する場合に、あるスライスが誤りの影響で破壊されて復号画像が乱れても次のスライスから正しい復号処理に復帰するといった用途に利用する。一般に、スライスの境界では、隣接スライスとの信号の依存性を利用した予測などが使えなくなるため、スライスの数が増えるほど符号化性能は低下するが、並列処理の柔軟性や誤りに対する耐性が高まるという特徴がある。
【0010】
マクロブロックの単位で予測・変換・量子化処理を適用して映像圧縮を行うため、ビットストリームに多重されるマクロブロックの符号化データは、大別して2種類の情報からなる。ひとつは予測モードや動き予測情報、量子化のためのパラメータといった映像信号自体とは異なるサイド情報と呼ばれる類で、これらをまとめてマクロブロックヘッダと呼ぶ。もう一つは映像信号自体の情報であり、本実施の形態では、符号化される映像信号はマクロブロックヘッダの情報に基づいて予測・変換・量子化を行った結果として得られる予測誤差信号の圧縮データであり、変換係数を量子化した形式で表現されることから、以降、係数符号化データと呼ぶ。本実施の形態1におけるマクロブロック符号化データの並びの様子を図2に示す。同図において、マクロブロックヘッダは、マクロブロックタイプ・サブマクロブロックタイプ・イントラ予測モードなどの符号化・予測モード情報、参照画像識別番号・動きベクトルなどの動き予測情報、変換係数に対する量子化パラメータ、8x8ブロック単位での有効変換係数有無判定フラグなど、係数符号化データの前までのすべてのサイド情報を含む。
【0011】
本実施の形態1では、3つの色成分を共通のマクロブロックヘッダに基づいて符号化するか、色成分別に独立のマクロブロックヘッダに基づいて符号化するかを選択しながら符号化を行う符号化装置と、該符号化装置の出力として得られるビットストリームを入力して、3つの色成分が共通のマクロブロックヘッダに基づいて符号化されているか、色成分ごとに独立したマクロブロックヘッダに基づいて符号化されているかを、ビットストリームから復号して取り出した識別情報に基づいて選択しながら映像の復号処理を行う復号装置について説明する。本実施の形態1では、特に、3つの色成分信号を共通のマクロブロックヘッダで符号化・復号するか、色成分ごとに独立のマクロブロックヘッダで符号化・復号するかをシーケンスの単位で切り替えて符号化・復号する装置構成・動作を具体的な図面をもとに説明する。このように符号化装置・復号装置を構成することにより、入力映像信号が定義される色空間や映像信号の統計的性質に合わせて各色成分を共通の予測パラメータで符号化する場合と、各色成分を独立した予測パラメータで符号化する場合とを選択して符号化することできるので、4:4:4フォーマットの映像信号に対して最適な符号化を行うことができる。
【0012】
以降において、1フレームないしは1フィールドの3つの色成分信号を共通のマクロブロックヘッダで符号化する処理を「共通符号化処理」、1フレームないしは1フィールドの3つの色成分信号を個別の独立したマクロブロックヘッダで符号化する処理を「独立符号化処理」と記す。同様に、1フレームないしは1フィールドの3つの色成分信号が共通のマクロブロックヘッダで符号化されたビットストリームから画像データを復号する処理を「共通復号処理」、1フレームないしは1フィールドの3つの色成分信号が個別の独立したマクロブロックヘッダで符号化されたビットストリームから画像データを復号する処理を「独立復号処理」と記す。共通符号化処理では、1フレームないしは1フィールドの3つの色成分をまとめて1つのピクチャとして定義し、3つの色成分をまとめた形のマクロブロックに分割する(図3)。同図ならびに以降の説明において、3つの色成分をC0、C1、C2成分と呼ぶ。一方、独立符号化処理では、1フレームないしは1フィールドの入力映像信号を3つの色成分に分離し、それぞれをピクチャとして定義して、各ピクチャを単一の色成分からなるマクロブロックに分割する(図4)。つまり、共通符号化処理の対象となるマクロブロックは、C0、C1、C2の3つの色成分のサンプル(画素)を含むが、独立符号化処理の対象となるマクロブロックは、C0またはC1またはC2成分のうちのいずれか1つの成分のサンプル(画素)のみを含む。
【0013】
図5には、本実施の形態1の符号化装置・復号装置における、ピクチャ間の時間方向の動き予測参照関係を示す。この例では、太縦棒線で示されるデータ単位をピクチャとし、ピクチャとアクセスユニットとの関係を囲み点線で示している。共通符号化・復号処理の場合、上述のように、1ピクチャは3つの色成分が混在した映像信号を表すデータであって、独立符号化・復号処理の場合、1ピクチャはいずれか1つの色成分からなる映像信号とする。アクセスユニットは、映像信号に対してオーディオ・音声情報などとの同期などを目的とするタイムスタンプを付与する最小データ単位であり、共通符号化・復号処理の場合、1つのアクセスユニットには1ピクチャ分のデータを含む。一方、独立符号化・復号処理の場合は1つのアクセスユニットに3つのピクチャが含まれる。これは独立符号化・復号処理の場合、3つの色成分すべての同一表示時刻のピクチャがそろってはじめて1フレーム分の再生映像信号が得られるためである。なお、各ピクチャの上部に付与した番号は、ピクチャの時間方向の符号化・復号処理順序(AVCのframe_numに相当)を示す。図5では、ピクチャ間の矢印は動き予測の参照方向を示している。すなわち、独立符号化・復号処理の場合、同一アクセスユニットに含まれるピクチャの間での動き予測参照、ならびに異なる色成分間での動き予測参照は行わないものとし、C0、C1、C2の各色成分のピクチャを同一色成分の信号に限定して予測参照しながら符号化・復号する。このような構成とすることにより、本実施の形態1における独立符号化・復号処理の場合は、各色成分の符号化・復号を、他の色成分の符号化・復号処理に全く依存することなく実行でき、並列処理が容易になる。
【0014】
以下、共通符号化処理による符号化を行うか、独立符号化処理による符号化を行うかを示す識別情報を、共通符号化・独立符号化識別信号1と呼ぶ。
図6に、本実施の形態1の符号化装置で生成され、本実施の形態1の復号装置が入力・復号処理の対象とするビットストリームの構造の一例を示す。同図は、シーケンスからスライスレベルまでのビットストリーム構成を示したもので、まず、シーケンスレベルの上位ヘッダ(AVCの場合、シーケンスパラメータセット)に、共通符号化・独立符号化識別信号1を多重する。AUDは、AVCにおいてアクセスユニットの切れ目を識別するためのユニークなNALユニットであるAccess Unit Delimiter NALユニットを示す。AUDはアクセスユニットの先頭をあらわす情報であり、AVCのAUDのデータ形式によらず、その目的に合致すれば任意のデータ形式に適用可能である。例えば、MPEG-2規格ではピクチャスタートコード、MPEG-4規格ではVOPスタートコードなどが対応する。
共通符号化・独立符号化識別信号1が「共通符号化処理」を示す場合は、アクセスユニットには1ピクチャ分の符号化データが含まれる。このときのピクチャは、前述のように3つの色成分が混在した1フレームないしは1フィールド分の映像信号を表すデータである。実際の映像符号化データは、図1のスライスの単位でビットストリームに多重される。一方、共通符号化・独立符号化識別信号1が「独立符号化処理」を示す場合は、1ピクチャは、1フレームないしは1フィールド中のいずれか1つの色成分の映像信号であり、1つのアクセスユニットには3つのピクチャが含まれる。このとき、スライスは各色成分のピクチャに対して定義される。
【0015】
図7は、共通符号化処理、独立符号化処理それぞれの場合のスライスデータのビットストリーム構成を示す。独立符号化処理によって符号化されたビットストリームでは、後述する効果を達成するため、復号装置で受信したスライスデータがアクセスユニット内のどの色成分のピクチャに属するスライスかを識別可能なように、スライスデータの先頭のヘッダ領域に色成分識別フラグ2(color_channel_idc)を付与する。色成分識別フラグ2は、その値が同じスライスをグループ化する。つまり、色成分識別フラグ2の値が異なるスライス間では、いかなる符号化・復号の依存性(例えば動き予測参照、CABACのコンテキストモデリング・生起確率学習など)も持たせないものとする。このように規定することで、独立符号化処理の場合のアクセスユニット内の個々のピクチャの独立性が確保される。また、各スライスヘッダに多重される frame_num (スライスが属するピクチャの符号化・復号処理順序)については、1アクセスユニット内の全色成分ピクチャにおいて同一の値とする。
【0016】
図8に、本実施の形態1の符号化装置の概略構成を示す。同図において、共通符号化処理は第1のピクチャ符号化部5において実行され、独立符号化処理は第2のピクチャ符号化部7a〜7c(3つの色成分分を用意)において実行される。
入力映像信号3は、スイッチ(SW)4によって第1のピクチャ符号化部5か、色成分分離部6および第2のピクチャ符号化部7a〜7c、のいずれかに供給される。スイッチ4は、共通符号化・独立符号化識別信号1によって駆動され、入力映像信号3を指定されたパスへ供給する。
共通符号化・独立符号化識別信号1は、入力映像信号が4:4:4フォーマットの場合にシーケンスパラメータセットに多重され、シーケンスの単位で共通符号化処理と独立符号化処理を選択する信号とする。共通符号化・独立符号化識別信号1は、ビットストリーム11がいずれの処理を用いて生成されたかを指定する情報としてビットストリーム11中のシーケンスパラメータセットに多重する。これによって、ビットストリーム11を入力とする復号装置では、シーケンスパラメータセット中の共通符号化・独立符号化識別信号1を復号してその値を確認することで、ビットストリーム11が共通符号化処理を用いて生成された場合に共通復号処理を実行し、独立符号化処理を用いて生成された場合は独立復号処理を実行することができる。
【0017】
共通符号化・独立符号化識別信号1が「共通符号化処理」を指示する場合は、第1のピクチャ符号化部5において、入力映像信号3を図3に示すように3つの色成分のサンプルをまとめた形式のマクロブロックへ分割して、その単位で符号化処理が行われ、符号化データはビットストリーム8として出力される。第1のピクチャ符号化部5における符号化処理は後述する。
共通符号化・独立符号化識別信号1が「独立符号化処理」を指示する場合は、入力映像信号3は色成分分離部6でC0、C1、C2の各色成分の信号に分離され、それぞれ対応する第2のピクチャ符号化部7a〜7cへ供給される。第2のピクチャ符号化部7a〜7cでは、色成分ごとに分離された信号を図4に示す形式のマクロブロックへ分割して、その単位で符号化処理が行われ、ビットストリーム9a〜9cとして出力される。第2のピクチャ符号化部7a〜7cにおける符号化処理は後述する。
【0018】
多重化部10では、共通符号化・独立符号化識別信号1をシーケンスパラメータセットに付与してビットストリーム11に多重するとともに、共通符号化・独立符号化識別信号1の値に応じて、ビットストリーム8ないしは9a〜9cのいずれかを選択してビットストリーム11に多重する。
【0019】
さらに、詳細は後述するが、ピクチャ符号化過程、特に量子化・逆量子化処理の過程で用いる量子化パラメータに対する量子化重み付け係数情報を3つの色成分ごとにそれぞれ用意し(12a〜12c)、これらを各ピクチャ符号化部へ入力し、色成分ごとの特性に合わせた量子化処理を行うよう構成する。量子化重み付け係数12a〜12cは符号化処理過程で用いた値と同じ値を復号装置側でも使用するため、シーケンスパラメータセットに多重するために多重化部10にも送られる。
さらに、イントラオンリー符号化指示信号13をピクチャ符号化部5、7a〜7cへ入力し、符号化処理を制御するよう構成する。イントラオンリー符号化指示信号13は、ピクチャ符号化部が動き補償予測による時間方向の予測処理を行うか否かを指示する信号であり、同信号が「イントラオンリー符号化」であることを示す場合は、入力映像信号3のすべてのピクチャに対して、動き補償予測による時間方向の予測を行うことなく、画面内に閉じた符号化を行う。また、このとき同時に、ピクチャ符号化部内部でループ内デブロッキングフィルタを無効にする(詳しくは後述する)。イントラオンリー符号化指示信号13が「イントラオンリー符号化ではない」ことを示す場合は、入力映像信号3のピクチャに対して、動き補償予測による時間方向の予測も使用して、画面内・画面間の相関を利用したインター符号化を行う。イントラオンリー符号化指示信号13は多重化部10において、シーケンスパラメータセットに付与してビットストリーム11に多重する。これによって、ビットストリーム11を入力とする復号装置では、シーケンスパラメータセット中のイントラオンリー符号化指示信号13を復号してその値を確認することで、ビットストリーム11がイントラオンリー符号化されたかどうかを認識できるので、イントラオンリー符号化されている場合はループ内デブロッキングフィルタ処理を不要とすることができ、復号装置の演算量を削減することができる。
【0020】
AVCのイントラ符号化処理では、インター符号化処理に比べ符号量が2〜10倍程度必要となるため、「イントラオンリー符号化」で符号化されているデータは「イントラオンリー符号化ではない」ものに比べデータ量がかなり大きくなる。
従来の復号装置では、復号処理を可能とするデータ量に上限を設け、装置内部の動作スピードや必要とするメモリ量などをできる限り小さくすることにより、動作の安定性を図っている。そのため、「イントラオンリー符号化」の場合には、設けられている上限値を超えたデータが入力される可能性があり、安定した動作が可能かどうか判別できない、という問題が生じる。
そこでシーケンスパラメータセットの中に、符号化データが所定量よりも少ないか、あるいは所定量を超えているかいずれであるかを示すためのフラグを設ける。フラグにより判定処理を行い、所定量よりも符号化データが少ない場合には、従来の復号装置でも処理が可能であるとして復号処理を行い、所定量よりも符号化データが超えている場合には、従来の復号装置では安定した処理が困難な可能性があるものとして、例えば警告を発する、といった処理をとることができる。
【0021】
さらに、入力映像信号3の画像サイズ情報14をピクチャ符号化部5、7a〜7cへ入力し、符号化処理を制御するよう構成する。画像サイズ情報14は入力映像信号3のピクチャ内マクロブロック数を示す情報であり、この値が所定の閾値よりも大きい場合にスライス中に含まれるマクロブロックの数の上限値を定め、スライスがそれよりも多くのマクロブロックを含まないように制御する。画像サイズ情報14はシーケンスパラメータセットに付与してビットストリーム11に多重する。これにより、入力映像信号3の画面サイズが大きい(すなわち、空間解像度が高い)場合に、符号化装置・復号装置ともに並列処理可能な単位を特定でき、円滑なタスク割り当てを行うことができる。
【0022】
以下、第1および第2のピクチャ符号化部の動作を詳しく説明する。
第1のピクチャ符号化部の動作概要
第1のピクチャ符号化部5の内部構成を図9に示す。同図において、入力映像信号3は、4:4:4フォーマットで、かつ図3の形式の3つの色成分をまとめたマクロブロックの単位で符号化されるものとする。内部処理は、イントラオンリー符号化指示信号13の値によって異なる。
【0023】
(1)イントラオンリー符号化指示信号13が「イントラオンリー符号化でない」ことを示す場合
予測部15において、メモリ16に格納される動き補償予測参照画像データの中から参照画像を選択し、該マクロブロックの単位で動き補償予測処理を行う。メモリ16には、直前ないしは過去・未来の複数時刻に渡って、3つの色成分で構成される複数枚の参照画像データが格納され、予測部15では、これらの中からマクロブロックの単位で最適な参照画像を選択して動き予測を行う。メモリ16内の参照画像データの配置は、色成分ごとに面順次で分けて格納してもよいし、各色成分のサンプルを点順次で格納してもよい。動き補償予測を行うブロックサイズは7種類用意されており、まずマクロブロック単位に、図10(a)から(d)に示すように、16x16、16x8、8x16、8x8のいずれかのサイズを選択する。さらに8x8が選択された場合には、それぞれの8x8ブロックごとに、図10(e)から(h)に示すように、8x8、8x4、4x8、4x4のいずれかのサイズを選択する。第1のピクチャ符号化部5で実行される共通符号化処理においては、3つの色成分に対して共通の動き補償予測ブロックサイズが選択・適用される。
【0024】
予測部15では、図10のすべてまたは一部のブロックサイズ・サブブロックサイズ、および所定の探索範囲の動きベクトルおよび利用可能な1枚以上の参照画像に対してマクロブロックごとに動き補償予測処理を実行して、動きベクトルおよび予測に用いる参照画像インデックスを含む予測オーバヘッド情報17と予測画像33を出力する。減算器18は予測画像33と入力映像信号3により、動き補償予測単位となるブロックごとの予測差分信号19を得る。符号化モード判定部20では、予測部15で実行した予測処理の中から選定処理を行い、選定された予測差分信号19とマクロブロックタイプ/サブマクロブロックタイプ21を出力する。マクロブロックタイプ、サブマクロブロックタイプ、参照画像インデックス、動きベクトルなどのマクロブロックヘッダ情報はすべて、3つの色成分に対して共通のヘッダ情報として決定され、3つの色成分の符号化に共通に使用され、ビットストリーム8に多重化される。予測効率の最適性の評価にあたっては、演算量を抑制する目的で、ある所定の色成分(たとえばRGBのうちのG成分、YCbCrのうちのY成分など)に対する予測誤差量だけを評価してもよいし、演算量は大きくなるが最適な予測性能を得るべくすべての色成分についての予測誤差量を総合評価するようにしてもよい。
【0025】
同様に、予測部15ではイントラ予測も実行する。イントラ予測実行時は、信号17には、イントラ予測モード情報が出力される。
以降、特にイントラ予測、動き補償予測を区別しない場合には、信号17は予測オーバヘッド情報と呼ぶ。なお、イントラ予測を行う際の参照画像データとしては、デブロッキングフィルタ22を施す前の局部復号画像23を用いる(図示していないが、局部復号画像23はイントラ予測の参照画像データとして用いるため、予測部15などへ一時的に格納される)。第1のピクチャ符号化部5で実行される共通符号化処理においては、3つの色成分に対して共通のイントラ予測モードが選択・適用される。イントラ予測についても所定の色成分だけの予測誤差量を評価してもよいし、すべての色成分についての予測誤差量を総合評価するようにしてもよい。最後に、マクロブロックタイプをイントラ予測にするか、インター予測にするかを、符号化モード判定部20において予測効率または符号化効率で評価して選定する。
【0026】
変換部24は予測差分信号19を変換し変換係数として量子化部25へ出力する。この際、変換を行う単位となるブロックのサイズを4x4か8x8など複数の候補の中から選択するようにしてもよい。変換ブロックサイズを選択可能とする場合は、符号化時に選択されたブロックサイズを、変換ブロックサイズ指定フラグ26の値に反映し、同フラグをビットストリーム8に多重化する。量子化部25は入力される変換係数を、量子化パラメータ27と量子化重み付け係数12a〜12cに基づいて量子化を行い、結果を量子化済み変換係数28として可変長符号化部29および逆量子化部30へ出力する。
量子化部25の処理について記す。変換部24で空間領域から周波数領域の信号に変換された変換係数は、人間の視覚特性上ひずみが目に付きやすい低周波領域と、ひずみを検知しにくい高周波領域に分離されている。そこで、周波数領域ごとに重みをつけ、低周波領域は細かい量子化を、高周波領域は粗い量子化を行うことにより、人間の視覚特性に合わせた量子化処理を実現することが可能である。量子化重み付け係数12a〜12cは、この周波数領域ごとに与える重み付けのパラメータであり、4x4ブロックサイズの変換用に16個の、8x8ブロックサイズの変換用に64個のパラメータが使用される。前述のように量子化重み付け係数12a〜12cはシーケンスパラメータセットに多重されるが、「共通符号化処理」を行う場合には3つの色成分で同じ量子化重み付け係数を使用するため、12a、12b、12cと3つ多重する必要は無く1つだけ多重すれば十分である。量子化部25は3つの色成分の変換係数に対してそれぞれの量子化重み付け係数12a〜12cを用いて重みをつけた量子化処理を行い、量子化済み変換係数28を得る。
【0027】
これら3つの色成分分の量子化済み変換係数28は、可変長符号化部29にてハフマン符号化や算術符号化などの手段によりエントロピー符号化される。
また、量子化済み変換係数28は逆量子化部30、逆変換部31を経て局部復号予測差分信号32へ復元され、選定されたマクロブロックタイプ/サブマクロブロックタイプ21と予測オーバヘッド情報17に基づいて生成される予測画像33と加算器34で加算することで局部復号画像23が生成される。局部復号画像23は、デブロッキングフィルタ22でブロックひずみ除去処理を実施した後、以降の動き補償予測処理に用いるためメモリ16へ格納される。
可変長符号化部29に入力される量子化済み変換係数28、マクロブロックタイプ/サブマクロブロックタイプ21、予測オーバヘッド情報17、量子化パラメータ27は所定のマクロブロック符号化データのシンタックスに従って配列・整形され、図3の形式のマクロブロックが1つないしは複数個まとまったスライスデータの単位でパケット化(AVCでは、NALユニット化とも呼ぶ)されてビットストリーム8として出力される。
【0028】
(2)イントラオンリー符号化指示信号13が「イントラオンリー符号化である」ことを示す場合
予測部15は(1)で述べたイントラ予測処理のみを実行する。イントラ予測実行時は、予測オーバヘッド情報17には、イントラ予測モード情報が出力される。なお、イントラ予測を行う際の参照画像データとしては、デブロッキングフィルタ22を施す前の局部復号画像23を用いる(図示していないが、局部復号画像23はイントラ予測の参照画像データとして用いるため、予測部15などへ一時的に格納される)。第1のピクチャ符号化部5で実行される共通符号化処理においては、3つの色成分に対して共通のイントラ予測モードが選択・適用される。イントラ予測モードの選定は、符号化モード判定部20において予測効率または符号化効率で評価して選定する。
【0029】
符号化モード判定部20は、選定された予測差分信号19を変換部24へ出力する。変換部24は入力される予測差分信号19を変換し変換係数として量子化部25へ出力する。この際、変換を行う単位となるブロックのサイズを4x4か8x8など複数の候補の中から選択するようにしてもよい。AVCでは、イントラ予測モードの被予測ブロックを変換ブロックサイズと合わせるように構成されている。変換ブロックサイズを選択可能とする場合は、符号化時に選択されたブロックサイズを、変換ブロックサイズ指定フラグ26の値に反映し、同フラグをビットストリーム8に多重化する。量子化部25は入力される変換係数を、量子化パラメータ27と量子化重み付け係数12a〜12cに基づいて量子化を行い、結果を量子化済み変換係数28として可変長符号化部29へ出力する。処理の例は上述のとおりである。
3つの色成分分の量子化済み変換係数28は、可変長符号化部29にてハフマン符号化や算術符号化などの手段によりエントロピー符号化される。
【0030】
また、量子化済み変換係数28は逆量子化部30、逆変換部31を経て局部復号予測差分信号32へ復元され、予測オーバヘッド情報17に基づいて生成される予測画像33と加算器34で加算することで局部復号画像23が生成される。イントラオンリー符号化指示情報13が「イントラオンリー符号化である」ことを示す場合は、動き補償予測を実行しないため、デブロッキングフィルタ22は処理を実行せず、参照画像としてのメモリ16への書き出しも行わない。このように構成することで、メモリアクセスやデブロッキングフィルタの処理に要する演算が削減できる。
【0031】
可変長符号化部29に入力される量子化済み変換係数28、マクロブロックタイプ/サブマクロブロックタイプ21(イントラモードに固定)、予測オーバヘッド情報17、量子化パラメータ27は所定のマクロブロック符号化データのシンタックスに従って配列・整形され、図3の形式のマクロブロックが1つないしは複数個まとまったスライスデータの単位でパケット化(AVCでは、NALユニット化とも呼ぶ)されてビットストリーム8として出力される。
【0032】
なお、イントラオンリー符号化指示情報13の値によらず、画像サイズ情報14によってスライスの中に含まれるマクロブロックの個数に制約を与える。画像サイズ情報14は可変長符号化部29に入力され、可変長符号化部29は画像サイズ情報14に基づいて、スライス内に含まれるマクロブロックの個数の上限値を定める。可変長符号化部29は、符号化されたマクロブロックの個数をカウントしておき、スライス内に含まれるマクロブロックの個数が上記上限値に達したとき、そこでスライスデータのパケットを閉じ、以降のマクロブロックは新しいスライスデータとしてパケット化する。
【0033】
また、本実施の形態1における第1のピクチャ符号化部5では、共通符号化・独立符号化識別信号1によってシーケンス中のすべてのスライスデータがC0,C1,C2混在スライス(すなわち、3つの色成分の情報が混在するスライス)であることが識別可能であるため、スライスデータに対して色成分識別フラグ2は付与しない。
【0034】
第2のピクチャ符号化部の動作概要
第2のピクチャ符号化部7aの内部構成を図11に示す。同図において、入力映像信号3aは、図4の形式のC0成分のサンプルからなるマクロブロックの単位で入力されるものとする。第2のピクチャ符号化部7b、7cについては、入力映像信号3aが3b(C1成分),3c(C2成分)を扱うようになるだけで内部構成はまったく同様であるため、以下では第2のピクチャ符号化部7aを代表例として第2のピクチャ符号化部の動作説明を行う。
【0035】
(3)イントラオンリー符号化指示信号13が「イントラオンリー符号化でない」ことを示す場合
予測部115において、メモリ116に格納される動き補償予測参照画像データの中から参照画像を選択し、マクロブロックの単位で動き補償予測処理を行う。メモリ116には、直前ないしは過去・未来の複数時刻に渡って、単一色成分で構成される複数枚の参照画像データを格納でき、予測部115では、これらの中からマクロブロックの単位で最適な参照画像を選択して動き予測を行う。なお、第2のピクチャ符号化部7a〜7cは、それぞれ対象とする色成分の分の参照画像データのみを使用し、他の色成分の参照画像データにはアクセスしない構成をとることも可能なので、メモリ116としては3つの色成分それぞれにメモリを持つ構成ではなく、一つにまとめた構成としてもよい。さらに、第2のピクチャ符号化部7a〜7cによって符号化処理を行うシーケンス中では、第1のピクチャ符号化部5は動作しないため、メモリ116はメモリ16と共用するように構成してもよい。動き補償予測を行うブロックサイズには7種類用意されており、まずマクロブロック単位に、図10(a)から(d)に示すように、16x16、16x8、8x16、8x8のいずれかのサイズを選択することができる。さらに8x8が選択された場合には、それぞれの8x8ブロックごとに、図10(e)から(h)に示すように、8x8、8x4、4x8、4x4のいずれかのサイズを選択することができる。第2のピクチャ符号化部7で実行される独立符号化処理においては、C0〜C2各成分に対して個別に動き補償予測ブロックサイズが選択・適用される。
【0036】
予測部115では、図10のすべてまたは一部のブロックサイズ・サブブロックサイズ、および所定の探索範囲の動きベクトルおよび利用可能な1枚以上の参照画像に対してマクロブロックごとに動き補償予測処理を実行して、動きベクトルと予測に用いる参照画像のインデックスを含む予測オーバヘッド情報117と予測画像133を出力する。減算器118は予測画像133と入力映像信号3aにより、動き補償予測単位となるブロックごとの予測差分信号119を得る。符号化モード判定部120では、予測部115で実行した予測処理の中から選定処理を行い、選定された予測差分信号119とマクロブロックタイプ/サブマクロブロックタイプ121を出力する。マクロブロックタイプ、サブマクロブロックタイプ、参照画像インデックス、動きベクトルなどのマクロブロックヘッダ情報はすべて、入力映像信号3aに対するヘッダ情報として決定され、符号化に使用され、ビットストリーム9aに多重化される。予測効率の最適性の評価にあたっては、符号化処理対象となる入力映像信号3aに対する予測誤差量を評価する。
同様に、予測部115ではイントラ予測も実行する。イントラ予測実行時は、予測オーバヘッド情報117には、イントラ予測モード情報が出力される。
【0037】
入力映像信号3の各色成分におけるイントラ予測モードの選択・適用は、各色成分で個別に行われる。なお、イントラ予測を行う際の参照画像データとしては、デブロッキングフィルタ122を施す前の局部復号画像123を用いる(図示していないが、局部復号画像123はイントラ予測の参照画像データとして用いるため、予測部115などへ一時的に格納される)。イントラ予測についても符号化処理対象となる入力映像信号3aに対する予測誤差量を評価する。最後に、マクロブロックタイプをイントラ予測にするか、インター予測にするかを符号化モード判定部120において予測効率または符号化効率で評価して選定する。
【0038】
変換部124は、予測差分信号119を変換し変換係数として量子化部125へ出力する。この際、変換を行う単位となるブロックのサイズを4x4か8x8のいずれかから選択するようにしてもよい。AVCでは、イントラ予測モードの被予測ブロックを変換ブロックサイズと合わせるように構成されている。選択可能とする場合は、符号化時に選択されたブロックサイズを、変換ブロックサイズ指定フラグ126の値に反映し、同フラグをビットストリーム9aに多重化する。量子化部125は入力される変換係数を、
量子化パラメータ127と量子化重み付け係数12aまたは12bまたは12cに基づいて量子化を行い、結果を量子化済み変換係数128として可変長符号化部129へ出力する。
【0039】
次に量子化部125の処理について記す。変換部124で空間領域から周波数領域の信号に変換された変換係数は、人間の視覚特性上ひずみが目に付きやすい低周波領域と、ひずみを検知しにくい高周波領域に分離されている。そこで、周波数領域ごとに重みをつけ、低周波領域は細かい量子化を、高周波領域は粗い量子化を行うことにより、人間の視覚特性に合わせた量子化処理を実現することが可能である。量子化重み付け係数12a、12b、12cは、いずれもこの周波数領域ごとに与える重み付けのパラメータであり、4x4ブロックサイズの変換用に16個の、8x8ブロックサイズの変換用に64個のパラメータが使用される。前述のように量子化重み付け係数12a、12b、12cはシーケンスパラメータセットに多重されるが、「独立符号化処理」を行う場合には3つの色成分でそれぞれ異なる量子化重み付け係数を使用することが可能であるため、12a、12b、12cと3つともすべて多重してもよいし、同じ値を使用する場合にはそのことを示す情報とともに1つだけを多重してもよい。量子化部125は3つの色成分の変換係数に対してそれぞれの量子化重み付け係数12aまたは12bまたは12cを用いて重みをつけた量子化処理を行い、量子化済み変換係数128を得る。
量子化済み変換係数128は、可変長符号化部129にてハフマン符号化や算術符号化などの手段によりエントロピー符号化される。
【0040】
また、量子化済み変換係数128は逆量子化部130、逆変換部131を経て局部復号予測差分信号132へ復元され、選定されたマクロブロックタイプ/サブマクロブロックタイプ121と予測オーバヘッド情報117に基づいて生成される予測画像133と加算器134で加算することで局部復号画像123が生成される。局部復号画像123は、デブロッキングフィルタ122でブロックひずみ除去処理を実施した後、以降の動き補償予測処理に用いるためメモリ116へ格納される。
可変長符号化部129に入力される量子化済み変換係数128、マクロブロックタイプ/サブマクロブロックタイプ121、予測オーバヘッド情報117、量子化パラメータ127は所定のマクロブロック符号化データのシンタックスに従って配列・整形され、図4の形式のマクロブロックが1つないしは複数個まとまったスライスデータの単位でパケット化(AVCでは、NALユニット化とも呼ぶ)されてビットストリーム9aとして出力される。
【0041】
(4)イントラオンリー符号化指示信号13が「イントラオンリー符号化である」ことを示す場合
予測部115は(3)で述べたイントラ予測処理のみを実行する。イントラ予測実行時は、予測オーバヘッド情報117には、イントラ予測モード情報が出力される。なお、イントラ予測を行う際の参照画像データとしては、デブロッキングフィルタ122を施す前の局部復号画像123を用いる(図示していないが、局部復号画像123はイントラ予測の参照画像データとして用いるため、予測部115などへ一時的に格納される)。AVCにおけるイントラ予測は上述のとおりであり、入力映像信号3aに対して実行されるので、入力映像信号3の各色成分におけるイントラ予測モードの選択・適用は各色成分で個別に行われる。イントラ予測モードの選定は、符号化モード判定部120において予測効率または符号化効率で評価して選定する。
【0042】
符号化モード判定部120は、選定された予測差分信号119を変換部124へ出力する。変換部124は入力される予測差分信号119を変換し変換係数として量子化部125へ出力する。この際、変換を行う単位となるブロックのサイズを4x4か8x8など複数の候補の中から選択するようにしてもよい。AVCでは、イントラ予測モードの被予測ブロックを変換ブロックサイズと合わせるように構成されている。変換ブロックサイズを選択可能とする場合は、符号化時に選択されたブロックサイズを、変換ブロックサイズ指定フラグ126の値に反映し、同フラグをビットストリーム9aに多重化する。量子化部125は入力される変換係数を、量子化パラメータ127と量子化重み付け係数12aに基づいて量子化を行い、結果を量子化済み変換係数128として可変長符号化部129へ出力する。処理の例は上述のとおりである。
【0043】
また、量子化済み変換係数128は、可変長符号化部129にてハフマン符号化や算術符号化などの手段によりエントロピー符号化される。
量子化済み変換係数128は逆量子化部130、逆変換部131を経て局部復号予測差分信号132へ復元され、予測オーバヘッド情報117に基づいて生成される予測画像133と加算器134で加算することで局部復号画像123が生成される。イントラオンリー符号化指示情報113が「イントラオンリー符号化である」ことを示す場合は、動き補償予測を実行しないため、デブロッキングフィルタ122は処理を実行せず、参照画像としてのメモリ116への書き出しも行わない。このように構成することで、メモリアクセスやデブロッキングフィルタの処理に要する演算が削減できる。
可変長符号化部129に入力される量子化済み変換係数128、マクロブロックタイプ/サブマクロブロックタイプ121(イントラモードに固定)、予測オーバヘッド情報117、量子化パラメータ127は所定のマクロブロック符号化データのシンタックスに従って配列・整形され、図4の形式のマクロブロックが1つないしは複数個まとまったスライスデータの単位でパケット化(AVCでは、NALユニット化とも呼ぶ)されてビットストリーム9aとして出力される。
【0044】
本実施の形態1における第2のピクチャ符号化部7a〜7cでは、共通符号化・独立符号化識別信号1により、シーケンス中のすべてのスライスデータが単一色成分スライス(すなわち、C0スライスまたはC1スライスまたはC2スライス)で符号化されているため、スライスデータ先頭に常に色成分識別フラグ2を多重化し、復号装置側でどのスライスがアクセスユニット内のどのピクチャデータに該当するかを識別できるようにする。例えば、第2のピクチャ符号化部7aでは色成分識別フラグ2の値を0、第2のピクチャ符号化部7bでは色成分識別フラグ2の値を1、第2のピクチャ符号化部7cでは色成分識別フラグ2の値を2、といったように設定してスライスデータの先頭に付与する。これによって、ビットストリーム9a〜9cをシリアルにビットストリーム11へ多重しても、その中のどのスライスがC0、C1、C2成分のいずれの符号化データかを容易に識別可能となる。つまり、第2のピクチャ符号化部7a〜7cは、それぞれのビットストリーム出力を1画面分ためこむことなく、1スライス分のデータがたまった時点でいつでも送出することができる。
【0045】
なお、イントラオンリー符号化指示情報13の値によらず、画像サイズ情報14によってスライスの中に含まれるマクロブロックの個数に制約を与える。画像サイズ情報14は可変長符号化部129に入力され、可変長符号化部129は画像サイズ情報14に基づいて、スライス内に含まれるマクロブロックの個数の上限値を定める。可変長符号化部129は、符号化されたマクロブロックの個数をカウントしておき、スライス内に含まれるマクロブロックの個数が上記上限値に達したとき、そこでスライスデータのパケットを閉じ、以降のマクロブロックは新しいスライスデータとしてパケット化する。なお、画像サイズ情報14は4:4:4フォーマットの場合はC0、C1、C2成分で同値であるので、シーケンスパラメータセット中に1つだけ多重しておけばよい。
【0046】
また、第1のピクチャ符号化部5と第2のピクチャ符号化部7a〜7cとは、マクロブロックヘッダ情報を3成分共通の情報として扱うか、単一の色成分の情報として扱うかの違いと、スライスデータのビットストリーム構成が異なるだけである。したがって、図9の変換部24、逆変換部31、量子化部25、逆量子化部30、デブロッキングフィルタ22は、図11の変換部124、逆変換部131、量子化部125、逆量子化部130、デブロッキングフィルタ122をそれぞれ3成分分繰り返す演算で実現できるので、第1のピクチャ符号化部5と第2のピクチャ符号化部7a〜7cの内部構成の一部を共通の機能ブロックで実現することもできる。したがって、図8のような完全に独立な符号化処理部としてだけでなく、図9、図11の構成要素を適宜組み合わせて、例えば同じ回路を複数回繰り返して動作させる、というように多様な符号化装置の実装を実現することができる。また、上述のように、第1のピクチャ符号化部5におけるメモリ16の配置を面順次で持つことにすれば、参照画像格納メモリを第1のピクチャ符号化部5と第2のピクチャ符号化部と7a〜7cで共有できる。
【0047】
図12に、本実施の形態1の復号装置の概略構成を示す。同図において、共通復号処理は第1のピクチャ復号部302において実行され、独立復号処理は色成分判定部303と第2のピクチャ復号部304(3つの色成分分を用意)において実行される。
ビットストリーム11は、上位ヘッダ解析部300でNALユニット単位に分割され、シーケンスパラメータセットやピクチャパラメータセットなどの上位ヘッダ情報は復号して第1のピクチャ復号部302、色成分判定部303、第2のピクチャ復号部304が参照可能な上位ヘッダメモリ305へ格納する。シーケンス単位に多重される共通符号化・独立符号化識別信号1、量子化重み付け係数12a〜12c、イントラオンリー符号化指示情報13、画像サイズ情報14は、シーケンスパラメータセットの一部として上位ヘッダメモリ305に保持される。
復号された共通符号化・独立符号化識別信号1はスイッチ(SW)301に供給され、スイッチ301は共通符号化・独立符号化識別信号1が「共通符号処理されている」ことを示すならば、当該シーケンス中のスライスNALユニットをすべてビットストリーム8として第1のピクチャ復号部302へ供給し、共通符号化・独立符号化識別信号1が「独立符号化処理されている」ことを示すならば、当該シーケンス中のスライスNALユニットをすべて色成分判定部303に供給する。第1および第2のピクチャ復号部の詳細な動作は後述する。
色成分判定部303は、入力されるスライスNALユニットの中から図7で示した色成分識別フラグ2の値を解析し、スライスNALユニットが現在のアクセスユニット内でいずれの色成分ピクチャに相当するかを識別して、第2のピクチャ復号部304a〜304cのうち該当する復号部へビットストリーム9a〜9cとして分配供給する。このような復号装置の構成によって、アクセスユニット内で色成分ごとにスライスがインタリーブされて符号化されたビットストリームを受信しても、どのスライスがどの色成分ピクチャに属するかを容易に判別し正しく復号できる効果がある。
【0048】
第1のピクチャ復号部の動作概要
第1のピクチャ復号部302の内部構成を図13に示す。第1のピクチャ復号部302は、例えば図8の符号化装置から出力されるビットストリーム11を、C0、C1、C2の3つの色成分混在スライスで構成されるビットストリーム8の形式で受信して、図3に示す3つの色成分のサンプルからなるマクロブロックを単位として復号処理を行い、出力映像フレームを復元する。
可変長復号部310はビットストリーム8を入力とし、所定の規則(シンタックス)に従ってビットストリーム8を解読して、3成分分の量子化済み変換係数28、および3成分で共通して用いられるマクロブロックヘッダ情報(マクロブロックタイプ/サブマクロブロックタイプ21、予測オーバヘッド情報17、変換ブロックサイズ指定フラグ26、量子化パラメータ27)をビットストリーム8から抽出する。
【0049】
さらに、量子化済み変換係数28は量子化パラメータ27とともに、第1のピクチャ符号化部5と同じ処理を行う逆量子化部30へ入力され、逆量子化処理が行われる。その際、各色成分で用いる量子化重み付け係数12a〜12cを上位ヘッダメモリ305から参照して使用する。なお3つの量子化重み付け係数12a〜12cにおいて同じ値が使用される場合には、復号器内部では必ずしも3つ分のデータとして持つ必要は無く、1つのデータを共通に使用することも可能である。ついでその出力が第1のピクチャ符号化部5と同じ処理を行う逆変換部31へ入力され、局部復号予測差分信号32へ復元される(変換ブロックサイズ指定フラグ26がビットストリーム8中に存在すれば、それを逆量子化、逆変換処理過程で参照する)。一方、予測部311は、第1のピクチャ符号化部5中の予測部15のうち、予測オーバヘッド情報17を参照して予測画像33を生成する処理だけが含まれ、予測部311に対してマクロブロックタイプ/サブマクロブロックタイプ21、予測オーバヘッド情報17が入力され、3成分分の予測画像33を得る。
【0050】
マクロブロックタイプがイントラ予測であることを示す場合は、予測オーバヘッド情報17からイントラ予測モード情報に従って3成分分の予測画像33を得、マクロブロックタイプがインター予測であることを示す場合は、予測オーバヘッド情報17から動きベクトル、参照画像インデックスに従って3成分分の予測画像33を得る。局部復号予測差分信号32と予測画像33は加算器34により加算され、3成分分の暫定復号画像323を得る。暫定復号画像323は以降のマクロブロックの動き補償予測に用いられるため、第1のピクチャ符号化部5と同じ処理を行うデブロッキングフィルタ22で3成分分の暫定復号画像サンプルに対してブロックひずみ除去処理を実施した後、復号画像313として出力されるとともに、メモリ312へ格納される。メモリ312には、複数時刻に渡る、3つの色成分で構成される複数枚の参照画像データが格納され、予測部311では、これらの中からマクロブロックの単位でビットストリーム8から抽出した参照画像インデックスで示される参照画像を選択して予測画像生成を行う。メモリ312内の参照画像データの配置は、色成分ごとに面順次で分けて格納してもよいし、各色成分のサンプルを点順次で格納してもよい。復号画像313は3つの色成分を含んでいるカラー映像フレームである。
【0051】
また、第1のピクチャ復号部302は、上位ヘッダメモリ305に格納されるイントラオンリー符号化指示情報13が「イントラオンリー符号化である」ことを示す場合は、動き補償予測処理を必要としないので参照画像が不要となるため、デブロッキングフィルタ22における処理をスキップし、参照画像としてのメモリ312への書き出しを行わない構成をとることも可能である。このように構成することで、メモリアクセスやデブロッキングフィルタの処理に要する演算を削減することが可能となる。ただし、たとえ「イントラオンリー符号化」であっても、復号画像を表示するための後処理としてデブロッキングフィルタもしくは類似の後処理フィルタを行うことは可能である。
【0052】
第2のピクチャ復号部の動作概要
第2のピクチャ復号部304の内部構成を図14に示す。第2のピクチャ復号部304は、例えば図8の符号化装置から出力されるビットストリーム11が、色成分判定部303で振り分けられたC0ないしは、C1ないしは、C2スライスNALユニットで構成されるビットストリーム9a〜9cのいずれかを受信して、図4に示す単一色成分のサンプルからなるマクロブロックを単位として復号処理を行い、出力映像フレームを復元する。
【0053】
可変長復号部410はビットストリーム9を入力とし、所定の規則(シンタックス)に従ってビットストリーム9を解読して、単一色成分の量子化済み変換係数128、および単一色成分に適用するマクロブロックヘッダ情報(マクロブロックタイプ/サブマクロブロックタイプ121、予測オーバヘッド情報117、変換ブロックサイズ指定フラグ126、量子化パラメータ127)を抽出する。量子化済み変換係数128は量子化パラメータ127とともに第2のピクチャ符号化部7と同じ処理を行う逆量子化部130へ入力され、逆量子化処理が行われる。その際に用いる量子化重み付け係数は、可変長復号部410で復号した色成分識別フラグ2に基づいて、上位ヘッダメモリ305中の量子化重み付け係数12a〜12cの中から当該色成分に対応するもの一つを選択し参照する。ついでその出力が第2のピクチャ符号化部7と同じ処理を行う逆変換部131へ入力され、局部復号予測差分信号132へ復元される(変換ブロックサイズ指定フラグ126がビットストリーム9中に存在すれば、それを逆量子化、逆直交変換処理過程で参照する)。
【0054】
一方、予測部411は、第2のピクチャ符号化部7中の予測部115のうち、予測オーバヘッド情報117を参照して予測画像133を生成する処理だけが含まれ、予測部411に対してマクロブロックタイプ/サブマクロブロックタイプ121、予測オーバヘッド情報117が入力され、単一色成分の予測画像133を得る。マクロブロックタイプがイントラ予測であることを示す場合は、予測オーバヘッド情報117からイントラ予測モード情報に従って単一色成分の予測画像133を得、マクロブロックタイプがインター予測であることを示す場合は、予測オーバヘッド情報117から動きベクトル、参照画像インデックスに従って単一色成分の予測画像133を得る。局部復号予測差分信号132と予測画像133は加算器134により加算され、単一色成分マクロブロックの暫定復号画像423を得る。暫定復号画像423は以降のマクロブロックの動き補償予測に用いられるため、第2のピクチャ符号化部7と同じ処理を行うデブロッキングフィルタ122で単一色成分の暫定復号画像サンプルに対してブロックひずみ除去処理を実施した後、復号画像413として出力されるとともに、メモリ412へ格納される。復号画像413は単一色成分のサンプルのみを含み、図5に示すように、他の色成分用の第2のピクチャ復号部304のそれぞれの出力を束ねることで、カラー映像フレームとして構成される。
【0055】
また、第2のピクチャ復号部304は、上位ヘッダメモリ305に格納されるイントラオンリー符号化指示情報113が「イントラオンリー符号化である」ことを示す場合は、動き補償予測処理を必要としないので参照画像が不要となるため、デブロッキングフィルタ122における処理をスキップし、参照画像としてのメモリ412への書き出しを行わない構成をとることも可能である。このように構成することで、メモリアクセスやデブロッキングフィルタの処理に要する演算を削減することが可能となる。ただし、たとえ「イントラオンリー符号化」であっても、復号画像を表示するための後処理としてデブロッキングフィルタもしくは類似の後処理フィルタを行うことは可能である。
【0056】
以上のことから明らかなように、第1のピクチャ復号部302と第2のピクチャ復号部304とは、マクロブロックヘッダ情報を3成分共通の情報として扱うか、単一の色成分の情報として扱うかの違いと、スライスデータのビットストリーム構成が異なるだけであるので、図13や図14における予測部、逆変換部、逆量子化部などの基本的な復号処理ブロックは第1のピクチャ復号部302と第2のピクチャ復号部304とで共通の機能ブロックで実現できる。したがって、図12のような完全に独立な符号化処理部としてだけでなく、図13や図14の基本構成要素を適宜組み合わせて多様な復号装置の実装を実現することができる。また、第1のピクチャ復号部302におけるメモリ312の配置を面順次で持つことにすれば、メモリ312、メモリ412の構成を第1のピクチャ復号部302と第2のピクチャ復号部304とで共通にすることができる。
【0057】
上記実施例の第1のピクチャ復号部および第2のピクチャ復号部は、符号化装置が出力するビットストリーム11を入力として説明したが、符号化装置が出力するビットストリームに限定されるものではなく、ハードディスクやDVDのような蓄積メディアから読み出されたビットストリームを入力としてもよいし、サーバーから読み出されてネットワーク経由で送信されてくるビットストリームを入力としてもよい。
【0058】
なお、上記実施例の符号化装置・復号装置において、独立符号化処理の場合には、図15に示すように、3つの色成分のピクチャデータを順番に配置して、ひとつのピクチャデータとして扱っても同様の効果を得ることができる。このときには、水平方向H画素、垂直方向Vラインであるカラー映像信号に対して、垂直方向に3つのデータを連結して、画像サイズ情報14を水平方向H画素、垂直方向V×3ラインとし、単一の色成分画素配列相当とするものである。なお、本実施の形態1の符号化装置・復号装置において、各色成分の信号をそれぞれ独立したピクチャとして扱えるようにするために、各色成分の境界(図15太線点線部)における符号化・復号処理において色成分間の依存性を除去する。依存性の除去の例として、以下のような条件が挙げられる。
【0059】
・符号化時は、各色成分の境界に位置するマクロブロックでは、その動きベクトル探索において、隣接する他の色成分の画素を使用せず、画面境界の場合の処理と同様、自色成分の端点画素を拡張して画面外探索を行うようにする。復号時は、色成分の境界に位置するマクロブロックでは、動きベクトルが自色成分の画像領域を逸脱する場合(画面外の探索が行われている場合)、他の色の画素信号を用いるのではなく、画面境界とみなして自色成分の端点画素を拡張して予測画像生成を行うようにする。
・各色成分の境界に位置するブロック間に対してデブロッキングフィルタ処理は行わない。
・各色成分のマクロブロックの符号化・復号処理で、可変長符号化・可変長復号の処理に学習型の算術符号化を用いる場合、確率モデルを色成分ごとに個別に用意し、学習プロセスを色成分ごとに独立に実施する。
【0060】
これらの条件を課すことにより、それぞれの色成分の信号の独立性が得られ、第1、2、3のピクチャ符号化部、ピクチャ復号部がそれぞれ独立に処理を実行することが可能となる。
【0061】
また、スライスは、各色成分の境界をまたがって定義することを禁止し、1スライス内に複数の異なる色成分の符号化データが含まれないようにするとともに、各色成分の先頭マクロブロックデータは、必ずスライスデータの先頭マクロブロックとなるように制約を課す。
【0062】
また、スライスデータがどの色成分に属するかを規定するために、上記実施例のようにcolor_channel_idcを定義してスライスデータの先頭領域に付与することにより明示的にスライスが属する色成分を指定するように構成してもよいし、color_channel_idcを使用せず、各スライスデータの先頭マクロブロックアドレスと、画像サイズ情報14を使用して、当該スライスデータがどの色成分に属するかを識別するように構成してもよい。例えば、水平画素数W=1920、垂直画素数V=1080の場合、C0成分、C1成分、C2成分それぞれの先頭マクロブロックアドレスを0、8160、16320として、マクロブロックアドレスが0−8159のマクロブロックはC0成分、マクロブロックアドレスが8160−16319のマクロブロックはC1成分、マクロブロックアドレスが16320−24479のマクロブロックはC2成分と割り当てる。
このような構成とすることで、共通符号化処理・独立符号化処理のピクチャ・アクセスユニット構造の共通化をはかることができ、ランダムアクセスや編集作業などを効率化することができる。
【図面の簡単な説明】
【0063】
【図1】シーケンス、GOP、ピクチャ、スライス、マクロブロックにより構成される映像信号の階層構造を示す説明図
【図2】マクロブロック符号化データの構成を示す説明図
【図3】「共通符号化処理」の際にマクロブロックを構成する3つの色信号成分を示す説明図
【図4】「独立符号化処理」の際にマクロブロックを構成する3つの色信号成分を示す説明図
【図5】「共通符号化」・「独立符号化」におけるピクチャ間の時間方向の動き予測参照関係を示す説明図
【図6】実施の形態1におけるビットストリームの構成例を示す説明図
【図7】実施の形態1におけるスライスデータのビットストリームの構成例を示す説明図
【図8】実施の形態1における符号化装置の概略構成図
【図9】第1のピクチャ符号化部5の内部構成図
【図10】動き補償予測を行う7種類のブロックサイズを示す説明図
【図11】第2のピクチャ符号化部7の内部構成図
【図12】実施の形態1における復号装置の概略構成図
【図13】第1のピクチャ復号部302の内部構成図
【図14】第2のピクチャ復号部304の内部構成図
【図15】3つの色成分のピクチャデータの配置例を示す説明図
【符号の説明】
【0064】
1 共通符号化・独立符号化識別信号
2 色成分識別フラグ
3、3a〜3c 入力映像信号
4 スイッチ(SW)
5 第1のピクチャ符号化部
6 色成分分離部
7a〜7c 第2のピクチャ符号化部
8 第1のピクチャ符号化部が出力するビットストリーム
9a〜9c 第2のピクチャ符号化部7a〜7cが出力するビットストリーム
10 多重化部
11 ビットストリーム
12a〜12c 量子化重み付け係数
13 イントラオンリー符号化指示信号
14 画像サイズ情報
15、115 予測部
16、116 メモリ
17、117 予測オーバヘッド情報(参照画像インデックスと動きベクトル情報、もしくはイントラ予測モード情報)
18、118 減算器
19、119 予測差分信号
20、120 符号化モード判定部
21、121 マクロブロックタイプ/サブマクロブロックタイプ
22、122 デブロッキングフィルタ
23、123 局部復号画像
24、124 変換部
25、125 量子化部
26、126 変換ブロックサイズ指定フラグ
27、127 量子化パラメータ
28、128 量子化済み変換係数
29、129 可変長符号化部
30、130 逆量子化部
31、131 逆変換部
32、132 局部復号予測差分信号
33、133 予測画像
34、134 加算器
300 上位ヘッダ解析部
301 スイッチ(SW)
302 第1のピクチャ復号部
303 色成分判定部
304a〜304c 第2のピクチャ復号部
305 上位ヘッダメモリ
311、411 予測部
312、412 メモリ
313、413 復号画像
323、423 暫定復号画像

【特許請求の範囲】
【請求項1】
4:4:4フォーマットのデジタル動画像信号を入力して圧縮符号化を行う画像符号化装置において、
入力された動画像信号の3つの色成分信号を共通の符号化モードで符号化処理を行い、共通の量子化マトリクスを使用して量子化処理を行う第1の符号化部と、
入力された動画像信号の3つの色成分信号をそれぞれ独立の符号化モードで符号化処理を行い、それぞれ独立の量子化マトリクスを使用して量子化処理を行う第2の符号化部とを備え、前記第1の符号化部と前記第2の符号化部のいずれか一方を選択して符号化処理を行うとともに、どちらを選択したかを示す識別信号を圧縮データに含むことを特徴とする画像符号化装置。
【請求項2】
4:4:4フォーマットのデジタル動画像信号の圧縮データを復号して画像信号を得る画像復号装置において、
3つの色成分信号を共通の符号化モードで復号処理を行い、共通の量子化マトリクスを使用して逆量子化処理を行う第1の復号部と、
3つの色成分信号をそれぞれ独立の符号化モードで復号処理を行い、それぞれ独立の量子化マトリクスを使用して逆量子化を行う第2の復号部と、
圧縮データから、3つの色成分信号を共通の符号化モードで符号化されたものか、独立の符号化モードで符号化されたものかを示す識別信号を復号する上位ヘッダ解析部とを備え、
前記識別信号に応じて、前記第1の復号部と前記第2の復号部のいずれか一方を用いて復号処理を行うことを特徴とする画像復号装置。
【請求項3】
4:4:4フォーマットのデジタル動画像信号を入力して圧縮符号化を行う画像符号化装置において、
入力された動画像信号の3つの色成分信号を共通の符号化モードで符号化処理を行い、共通の量子化マトリクスを使用して量子化処理を行う第1の符号化部と、
入力された動画像信号の3つの色成分信号をそれぞれ独立の符号化モードで符号化処理を行い、それぞれ独立の量子化マトリクスを使用して量子化処理を行う第2の符号化部とを備え、
前記第1の符号化部と前記第2の符号化部のいずれか一方を選択して符号化処理を行い、どちらを選択したかを示す識別信号を圧縮データに含むとともに、
第2の符号化部を選択した場合には、3つの色成分信号のうちのどの色成分のものかを示す色成分識別フラグを圧縮データに含むことを特徴とする画像符号化装置。
【請求項4】
4:4:4フォーマットのデジタル動画像信号の圧縮データを復号して画像信号を得る画像復号装置において、
3つの色成分信号を共通の符号化モードで復号処理を行い、共通の量子化マトリクスを使用して逆量子化処理を行う第1の復号部と、
3つの色成分信号をそれぞれ独立の符号化モードで復号処理を行い、それぞれ独立の量子化マトリクスを使用して逆量子化を行う第2の復号部と、
圧縮データから、3つの色成分信号を共通の符号化モードで符号化されたものか、独立の符号化モードで符号化されたものかを示す識別信号を復号する上位ヘッダ解析部とを備え、
前記識別信号に応じて、前記第1の復号部と前記第2の復号部のいずれか一方を用いて復号処理を行うとともに、第2の復号部を用いて復号処理を行う場合には、圧縮データに含まれている色成分識別フラグを用いて3つの色成分のうちのどの色成分のものであるかを判定するとともに、前記色成分識別フラグに基づいて定まる量子化マトリクスを用いて逆量子化処理を行うことを特徴とする画像復号装置。
【請求項5】
4:4:4フォーマットのデジタル動画像信号を入力して圧縮符号化を行う画像符号化装置において、
入力された動画像信号の3つの色成分信号を共通の符号化モードで符号化処理を行い、共通の量子化マトリクスを使用して量子化処理を行う第1の符号化部と、
入力された動画像信号の3つの色成分信号をそれぞれ独立の符号化モードで符号化処理を行い、それぞれ独立の量子化マトリクスを使用して量子化処理を行う第2の符号化部とを備え、
前記第1の符号化部と前記第2の符号化部のいずれか一方を選択して符号化処理を行い、どちらを選択したかを示す識別信号を圧縮データに含むとともに、
第2の符号化部を選択した場合には、3つの色成分信号のうちのどの色成分のものかを示す色成分識別フラグを圧縮データに含むとともに、3つの色成分信号でそれぞれ独立の参照画像を用いて動き補償予測を行うことを特徴とする画像符号化装置。
【請求項6】
4:4:4フォーマットのデジタル動画像信号の圧縮データを復号して画像信号を得る画像復号装置において、
3つの色成分信号を共通の符号化モードで復号処理を行い、共通の量子化マトリクスを使用して逆量子化処理を行う第1の復号部と、
3つの色成分信号をそれぞれ独立の符号化モードで復号処理を行い、それぞれ独立の量子化マトリクスを使用して逆量子化を行う第2の復号部と、
圧縮データから、3つの色成分信号を共通の符号化モードで符号化されたものか、独立の符号化モードで符号化されたものかを示す識別信号を復号する上位ヘッダ解析部とを備え、
前記識別信号に応じて、前記第1の復号部と前記第2の復号部のいずれか一方を用いて復号処理を行うとともに、第2の復号部を用いて復号処理を行う場合には、圧縮データに含まれている色成分識別フラグを用いて3つの色成分のうちのどの色成分のものであるかを判定するとともに、前記色成分識別フラグに基づいて定められる参照画像を用いて動き補償予測を行うことを特徴とする画像復号装置。
【請求項7】
4:4:4フォーマットのデジタル動画像信号を入力して圧縮符号化を行う画像符号化装置において、
入力された動画像信号の3つの色成分信号を共通の符号化モードで符号化処理を行い、共通の量子化マトリクスを使用して量子化処理を行う第1の符号化部と、
入力された動画像信号の3つの色成分信号をそれぞれ独立の符号化モードで符号化処理を行い、それぞれ独立の量子化マトリクスを使用して量子化処理を行う第2の符号化部とを備え、
前記第1の符号化部と前記第2の符号化部のいずれか一方を選択して符号化処理を行い、どちらを選択したかを示す識別信号を圧縮データに含むとともに、
全ての符号化処理をイントラ符号化モードのみで行うか、あるいはインター符号化モードも使用して行うか、を示すイントラオンリー符号化指示信号を圧縮データに含み、
イントラ符号化モードのみで符号化処理を行う場合にはデブロッキングフィルタの処理を行わないことを特徴とする画像符号化装置。
【請求項8】
4:4:4フォーマットのデジタル動画像信号の圧縮データを復号して画像信号を得る画像復号装置において、
3つの色成分信号を共通の符号化モードで復号処理を行い、共通の量子化マトリクスを使用して逆量子化処理を行う第1の復号部と、
3つの色成分信号をそれぞれ独立の符号化モードで復号処理を行い、それぞれ独立の量子化マトリクスを使用して逆量子化を行う第2の復号部と、
圧縮データから、3つの色成分信号を共通の符号化モードで符号化されたものか、独立の符号化モードで符号化されたものかを示す識別信号と、全ての符号化処理がイントラ符号化モードのみで行われているか、あるいはインター符号化モードも使用して行なわれているか、を示すイントラオンリー符号化指示信号を復号する上位ヘッダ解析部を備え、
前記識別信号に応じて、前記第1の復号部と前記第2の復号部のいずれか一方を用いて復号処理を行うとともに、
前記イントラオンリー符号化指示信号によってイントラ符号化モードのみで全ての符号化処理が行われている場合にはデブロッキングフィルタの処理を行わないことを特徴とする画像復号装置。
【請求項9】
4:4:4フォーマットのデジタル動画像信号を入力して圧縮符号化を行う画像符号化方法において、
入力された動画像信号の3つの色成分信号を共通の符号化モードで符号化処理を行い、共通の量子化マトリクスを使用して量子化処理を行う第1の符号化ステップと、入力された動画像信号の3つの色成分信号をそれぞれ独立の符号化モードで符号化処理を行い、それぞれ独立の量子化マトリクスを使用して量子化処理を行う第2の符号化ステップとのいずれか一方を選択して符号化処理するステップと、第1、第2の符号化ステップのどちらを選択したかを示す識別信号を圧縮データに含めるステップとを備えたことを特徴とする画像符号化方法。
【請求項10】
4:4:4フォーマットのデジタル動画像信号の圧縮データを復号して画像信号を得る画像復号方法において、
圧縮データから、3つの色成分信号を共通の符号化モードで符号化されたものか、独立の符号化モードで符号化されたものかを示す識別信号を復号する上位ヘッダ解析ステップと、
この上位ヘッダ解析ステップで復号された識別信号に基づき、3つの色成分信号を共通の符号化モードで復号処理を行い、共通の量子化マトリクスを使用して逆量子化処理を行う第1の復号ステップと、3つの色成分信号をそれぞれ独立の符号化モードで復号処理を行い、それぞれ独立の量子化マトリクスを使用して逆量子化を行う第2の復号ステップとのいずれか一方を用いて復号処理を行うステップを備えたことを特徴とする画像復号方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate


【公開番号】特開2008−193627(P2008−193627A)
【公開日】平成20年8月21日(2008.8.21)
【国際特許分類】
【出願番号】特願2007−28711(P2007−28711)
【出願日】平成19年2月8日(2007.2.8)
【国等の委託研究の成果に係る記載事項】(出願人による申告)平成18年度、文部科学省、「重要課題解決型研究等の推進 デジタルシネマの標準技術に関する研究」委託契約、産業活力再生特別措置法第30条の適用を受ける特許出願
【出願人】(000006013)三菱電機株式会社 (33,312)
【Fターム(参考)】