説明

動画像符号化装置

【課題】動画像符号化処理において、画質を向上させながら符号量の変動を抑えることにより、高画質で低遅延な符号化処理を行うこと。
【解決手段】時系列に並ぶ複数の画像からなる動画像を画面内予測もしくは画面間予測によって符号化する動画像符号化装置であって、この複数の画像を、画面内予測又は画面間予測において画素値を参照する領域である参照領域と、画素値を参照しない領域である非参照領域とに分割し、時系列上においてあらかじめ定められた所定の間隔で複数の画像における参照領域と非参照領域とが入れ替わるように複数の画像における参照領域と非参照領域を決定する。そして、複数の画像の符号化の際には、非参照領域については参照領域よりも粗い粒度で量子化を行う。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、動画像を符号化する技術に関する。
【背景技術】
【0002】
近年、ブロードバンドネットワークの発達による動画配信コンテンツの増加や、DVDなどの大容量記憶媒体と大画面映像表示機器の利用などにより、動画符号化技術は必要不可欠な技術となっている。また、撮像デバイスや表示デバイスの高解像度化と共に、動画像符号化技術において高解像度で符号化する技術も必要不可欠となっている。
【0003】
動画像符号化処理は、動画像符号化装置に入力される原画像(入力画像)をより少ないデータ量のストリームに変換する処理である。例えば、高解像度かつ高画質な符号化が可能な動画符号化技術の一つとして、国際標準であるH.264/AVC規格(非特許文献1)が存在する。
【0004】
H.264/AVCによる符号化処理では、一般的には、原画像に対して16×16の画素で構成されるマクロブロックと呼ばれる単位で処理が行われる。また、H.264/AVCでは、画像情報が一般的に持つ特性、すなわち隣接画素間とフレーム間に高い相関を持つという特性を利用して画像の予測を行い、さらに人間の視覚では変化を知覚しにくい高周波成分などの冗長な情報を削減する。これにより、広い伝送帯域(例えば、HD−SDI(High Definition Serial Digital Interface)では約1.5Gbps)にある入力画像を、低い伝送帯域(例えば、地上波デジタル放送での約15Mbps)に適用する。
【0005】
ところで、H.264/AVC符号化で用いられる予測方式には、主に画面内予測と画面間予測の二つの予測方式が存在する。画面内予測では、予測の単位となるブロックのサイズや予測方向の組み合わせに応じて複数の予測方式が用意されている。画面間予測においても、予測の単位となるブロックのサイズに応じて複数の予測方式が用意されている。H.264/AVCでは、目標とする画質や符号量に応じてこれらの予測方式を動的に選択することで、高画質かつ高圧縮な符号化方式を実現している。
【0006】
ここで、図21を用いて、H.264/AVC符号化の概要について説明する。図21は、従来のH.264/AVC符号化処理を行う画像符号化装置の構成を示す図である。
【0007】
画面内予測を用いた符号化処理を行うには、まず、モード選択部930が画面内予測部910を選択する。そして、画面内予測部910、直交変換部940、量子化部950、および可変長符号化部980を経て、原画像90からストリーム91を得る。また、画面間予測を用いた符号化処理では、モード選択部930が画面間予測部920を選択する。そして、画面間予測部920、直交変換部940、量子化部950、および可変長符号化部980を経て、原画像90からストリーム91を得る。
【0008】
次に、量子化部950で実行される量子化について説明する。
【0009】
H.264/AVC符号化で行う量子化では、符号化制御部990が決定した量子化係数D84を用いて量子化の粒度を調整する。量子化粒度が小さければ符号量は大きくなるがより原画像に近い画像になり易く、量子化粒度が大きければ符号量は小さいが原画像から離れた画像になり易い。
【0010】
そこで、H.264/AVC符号化では、目標とする画質や符号量に応じて量子化係数D84を動的に選択することで、高画質かつ高圧縮な符号化効率の高い符号化を実現している。
【0011】
以下、H.264/AVC符号化の各処理について説明する。
【0012】
画面内予測部910には、原画像90と、その周辺の画像である再構成画像92とが入力される。再構成画像92は、逆直交変換部970から出力される復元差分画像97と、モード選択部930によって出力される予測画像95とが足し合わされて構成される画像である。
【0013】
そして、画面内予測部910は、原画像90と再構成画像92とから、画面内予測処理により適切な画面内予測モード(画面内予測方式)を選択し、画面内予測モードのモード情報を表す画面内予測情報D81、予測結果である画面内予測画像93、および原画像90と画面内予測画像93との差分を表す画面内予測誤差を生成する。
【0014】
画面間予測部920は、原画像90と、その前後(過去または未来)の原画像から生成された再構成画像92の入力を受け付け、画面間予測情報D82、画面間予測画像94、および原画像90と画面間予測画像94との差分を表す画面間予測誤差を生成する。
【0015】
モード選択部930は、画面内予測部910から入力される画面内予測誤差と、画面間予測部920から入力される画面間予測誤差とから、符号化モード選択アルゴリズムに従い、画面内予測および画面間予測のいずれかの符号化モードを決定する。そして、画面内予測を選択した場合には画面内予測画像93を、画面間予測を選択した場合には画面間予測画像94を、予測画像95として出力する。
【0016】
なお、符号化モード選択アルゴリズムは、ストリーム91の符号量および画質に大きな影響を与えるため、符号化対象となる原画像90の内容や映像符号化の用途によって様々な方式が存在している。
【0017】
直交変換部940は、原画像90と予測画像95との差分である差分画像96から、直交変換処理によって周波数成分D83を生成する。
【0018】
量子化部950は、符号化制御部990から入力される量子化係数D84と、直交変換部940から入力される周波数成分D83とから量子化処理を行い、情報量を削減した量子化値D85を出力する。
【0019】
逆量子化部960は、量子化値D85に対して逆量子化処理を行い、復元周波数成分D86を生成する。
【0020】
逆直交変換部970は、復元周波数成分D86に対して逆直交変換処理を行い、復元差分画像97を生成する。そして、生成された復元差分画像97と、モード選択部930によって出力された予測画像95とが足し合わされて、再構成画像92としてメモリ等の記憶装置に記憶される。
【0021】
可変長符号化部980は、量子化値D85と、画面内予測情報D81もしくは画面間予測情報D82を、より少ないデータ量のデータ列に符号化し、ストリーム91として出力する。
【0022】
ストリームバッファ1000は、ストリーム91を一旦バッファリングした後、伝送路もしくは後段のデコーダに出力する。また、バッファリングしているストリーム91の符号量を符号量情報D87として、符号化制御部990に出力する。
【0023】
符号化制御部990は、ストリームバッファ1000から入力される符号量情報D87を用いて、レート制御アルゴリズムに従い量子化係数D84を決定し、これを量子化部950に出力する。
【0024】
ここで、量子化係数D84の制御によるレート制御アルゴリズムは、動画像符号化効率に大きな影響を与えるため、動画像符号化の用途によって様々な方式が存在している。量子化係数D84の制御によるレート制御アルゴリズムで動画像符号化効率を向上させる技術として、例えば、特許文献1に記載の画像符号化技術が挙げられる。
【0025】
特許文献1には、画面間予測における参照関係をピクチャ単位で管理することで、画面間予測において量子化係数を小さくした、より原画像に近い予測画像を参照することで客観画質を向上させる方法が開示されている。さらに、特許文献1には、1コマおきに鋭画像と鈍画像とを繰り返して表示すると、人間の視覚では全体が鋭画像に見える“鋭鈍画像の繰り返し錯覚”と呼ばれる視覚特性を利用して主観画質を向上させる方法も開示されている。
【0026】
図22は、特許文献1に記載の画像符号化技術における“鋭鈍画像の繰り返し錯覚”を利用した符号化効率の向上方法について説明する図である。図22に示されるように、1コマおきに、量子化係数を小さくした高画質な画像と、量子化係数を大きくして符号量を削減した低画質な画像を交互に表示すると、“鋭鈍画像の繰り返し錯覚”により、人間の視覚では動画像全体として量子化係数の小さい高画質な動画像と同等に見える。
【0027】
従って、特許文献1の画像符号化技術では、結果として主観画質を維持したまま量子化係数を大きくして符号量を削減することができる。
【先行技術文献】
【非特許文献】
【0028】
【非特許文献1】ITU−T Recommendation H.264, “Advanced video coding for generic audiovisual services” 2007.
【特許文献】
【0029】
【特許文献1】特開2008−311824号公報
【発明の概要】
【発明が解決しようとする課題】
【0030】
ところで、動画像符号化では、符号化および復号化時に遅延が生じることが一般的に知られている。
【0031】
動画像符号化装置に画像を入力した後、この動画像符号化装置より出力された符号を動画像復号化装置に入力し、復号化処理を実行して表示を行うシステムにおいて、同一画像の入力から表示までの時間差が遅延時間であり、一般的な動画像符号化装置および動画像復号化装置では、数100ミリ秒から数秒程度の遅延となっている。
【0032】
また、昨今では、非圧縮画像データとの同時使用などを目的として、例えば遅延時間が16ミリ秒以下といったような、動画像符号化および復号化における低遅延化の必要性が出てきている。
【0033】
低遅延の動画像符号化および復号化を実現するためには、データ発生量の変動を抑えることが必要である。一般に、画像データは、画像データ全体のデータ量から決定される固定のビットレートにより伝送され、伝送された画像データはバッファに格納されて処理される
ここで、動画像符号化において画像のある領域においてビットレート以上の大量の符号データを生成した場合、この領域については、処理の際にバッファ内にあるデータでは足りず、バッファへの符号データの伝送待ちが生じてしまう。そして、この領域について全ての処理が完了しないと、この領域の表示を行うことができないため、結果として画像全体の表示における遅延時間が大きくなってしまう。
【0034】
つまり、遅延時間は想定される最大符号発生量を処理する時間によって決定され、この遅延時間は、ビットレートと最大符号発生量との差、すなわち発生符号量の変動量に大きく影響される。
【0035】
図23は、特許文献1に記載の画像符号化技術における、ピクチャ単位の量子化制御による符号量変動について説明する図である。
【0036】
特許文献1の画像符号化技術では、量子化係数の大きい非参照ピクチャと、量子化係数の小さい参照ピクチャを決定し、ピクチャ単位で量子化係数を制御する。
【0037】
そのため、非参照ピクチャでは参照ピクチャに比べて大幅に符号量が小さくなり、ピクチャ間の符号量変動が大きくなるため、非参照ピクチャで数ピクチャ分のバッファリングが必要になり、数ピクチャ単位での遅延が生じてしまうという課題があった。
【0038】
そこで本発明は、上記課題に鑑み、動画像符号化処理において、画質を向上させながら符号量の変動を抑えることにより、高画質で低遅延な符号化処理を行うことが可能な動画像符号化装置、動画像符号化方法、および、動画像符号化プログラムを提供することを目的とする。
【課題を解決するための手段】
【0039】
上記課題を解決するために、本発明の一態様によれば、時系列に並ぶ複数の画像からなる動画像を画面内予測もしくは画面間予測によって符号化する動画像符号化装置であって、前記複数の画像を、前記画面内予測又は前記画面間予測において画素値を参照する領域である参照領域と、画素値を参照しない領域である非参照領域と、に分割し、かつ、前記時系列上においてあらかじめ定められた所定の間隔で前記複数の画像における前記参照領域と前記非参照領域とが入れ替わるように前記複数の画像における前記参照領域と前記非参照領域を決定する参照制御部と、前記複数の画像の前記符号化の際に、前記非参照領域については前記参照領域よりも粗い粒度で量子化を行う量子化部と、を有することを特徴とする動画像符号化装置が提供される。
【0040】
この構成によれば、符号量の変動を抑えることにより遅延を抑え、かつ高画質に動画像を符号化することができる。
【0041】
本発明の他の態様によれば、前記参照制御部は、前記画像において、一定単位の領域における前記参照領域と前記非参照領域との割合が、前記画像に含まれるいずれの一定単位の領域でも同じとなるように、前記参照領域と前記非参照領域を決定するようになっていてもよい。
【0042】
この構成によれば、一定単位の領域内に符号量の変動を抑えることができる。
【0043】
本発明の他の態様によれば、動画像符号化装置は、前記複数の画像に対して前記画面内予測による前記符号化を行う画面内予測部をさらに有し、前記画面内予測部は、前記画像内において前記符号化対象のマクロブロックであるカレントマクロブロックと、前記参照領域または前記非参照領域と、の位置関係によって、前記参照領域の画素のみを参照して前記符号化を行うようになっていてもよい。
【0044】
この構成によれば、画面内予測において、高画質である参照領域の画素のみを参照することとなるため、符号化効率の低下を回避することができる。
【0045】
本発明の他の態様によれば、動画像符号化装置は、前記複数の画像に対して前記画面間予測による前記符号化を行う画面間予測部をさらに有し、前記画面間予測部は、前記画面間予測を行う際に、動きベクトルの探索範囲が前記参照領域となる前記複数の画像の少なくとも一つを参照するようになっていてもよい。
【0046】
この構成によれば、画面間予測において、高画質である参照領域の画素のみを参照することとなるため、符号化効率の低下を回避することができる。
【発明の効果】
【0047】
本発明によれば、符号量の変動を抑えることにより遅延を抑え、かつ高画質に動画像を符号化することができる。
【図面の簡単な説明】
【0048】
【図1】本発明の一実施形態に係る動画像符号化装置の構成の一例を示す図である。
【図2】本発明の一実施形態に係る動画像符号化装置における参照制御部が実行するピクチャ毎の参照領域と非参照領域の管理方法の第1の具体例について説明する図である。
【図3】符号化対象ピクチャにおける1マクロブロックラインあたりの符号量について説明する図である。
【図4】符号化対象ピクチャにおける1マクロブロックラインごとの符号量の変動について示す図である。
【図5】画面間予測制限情報の一例について概念的に説明する図である。
【図6】画面間予測制限情報の一例について概念的に説明する図である。
【図7】画面間予測制限情報の一例について概念的に説明する図である。
【図8】H.264/AVC規格における4×4ブロックに対する画面内予測における予測方向の種類を示す図である。
【図9】参照領域とカレントマクロブロックとの各位置関係における画面内予測モードの制限の一例について説明する図である。
【図10】本発明の一実施形態に係る動画像符号化装置における参照制御部が実行するピクチャ毎の参照領域と非参照領域の管理方法の第2の具体例について説明する図である。
【図11】符号化対象ピクチャにおける1ピクチャあたりの符号量について説明する図である。
【図12】符号化対象ピクチャにおける1ピクチャごとの符号量の変動について示す図である。
【図13】画面間予測制限情報の一例について概念的に説明する図である。
【図14】画面間予測制限情報の一例について概念的に説明する図である。
【図15】画面間予測制限情報の一例について概念的に説明する図である。
【図16】参照領域とカレントマクロブロックとの各位置関係における画面内予測モードの制限の一例について説明する図である。
【図17】本発明の一実施形態に係る動画像符号化装置における参照制御部が実行するピクチャ毎の参照領域と非参照領域の管理方法の第3の具体例について説明する図である。
【図18】符号化対象ピクチャにおける1マクロブロックラインあたりの符号量について説明する図である。
【図19】画面間予測制限情報の一例について概念的に説明する図である。
【図20】画面間予測制限情報の一例について概念的に説明する図である。
【図21】従来のH.264/AVC符号化処理を行う画像符号化装置の構成を示す図である。
【図22】特許文献1に記載の画像符号化技術における“鋭鈍画像の繰り返し錯覚”を利用した符号化効率の向上方法について説明する図である。
【図23】特許文献1に記載の画像符号化技術における、ピクチャ単位の量子化制御による符号量変動について説明する図である。
【発明を実施するための形態】
【0049】
以下、本発明の実施形態について、図面を参照して説明する。なお、以下の説明において参照する各図では、他の図と同等部分は同一符号によって示される。
【0050】
(動画像符号化装置の構成)
図1は、本実施形態に係る動画像符号化装置の構成の一例を示す図である。動画像符号化装置1は、画面内予測部110と、画面間予測部120と、モード選択部130と、直交変換部140と、量子化部150と、逆量子化部160と、逆直交変換部170と、可変長符号化部180と、符号化制御部190と、ストリームバッファ200と、参照制御部210と、を有する。
【0051】
ここで、符号化制御部190と参照制御部210以外の構成については、図21に示される従来の動画像符号化装置の構成と同様であるので、以下においては簡単に説明する。
【0052】
なお、図1に示される動画像符号化装置1は、例えば、LSI(Large Scale Integration)やFPGA(Field-Programmable Gate Array)などによって実現可能であり、動画像符号化処理を行う種々の画像処理機器に適用することが可能である。また、例えば、図示しないCPU(Central Processing Unit)、RAM(Random Access Memory)等のメモリ、ハードディスク等の記憶装置、ネットワークインタフェース等の一般的なコンピュータの構成と同様の構成によっても実現可能である。つまり、動画像符号化装置1の各構成の機能は、例えば、CPUがハードディスク等に記憶されているプログラムを読み出して実行することによって実現することが可能である。
【0053】
画面内予測部110は、原画像10と、その周囲に位置する画像である再構成画像12と、参照制御部210から出力される画面内予測制限情報D11(後述する)とを取得する。そして、画面内予測情報D1と、画面内予測の予測結果である画面内予測画像13と、原画像10と画面内予測画像13との差分を表す画面内予測誤差とを生成する。
【0054】
画面内予測情報D1には、画面内予測を行ったブロックサイズを表す情報である画面内予測ブロックタイプや、画面内予測の方向を表す画面内予測モード情報が含まれる。
【0055】
画面間予測部120は、原画像10と、これよりも過去の原画像(時間軸上、原画像10の前に位置する原画像。以下、同様。)または未来の原画像(時間軸上、原画像10の後に位置する原画像。以下、同様。)から生成された再構成画像12と、参照制御部210から出力される画面間予測制限情報D12(後述する)とを取得し、画面間予測情報D2と、画面間予測の予測結果である画面間予測画像14と、原画像10と画面間予測画像14との差分を表す画面間予測誤差とを生成する。
【0056】
画面間予測情報D2には、画面間予測を行った際のブロックサイズを表す画面間予測ブロックタイプや、動き補償を行った結果の動きベクトル情報が含まれる。
【0057】
モード選択部130は、画面内予測部110から出力される画面内予測誤差と、画面間予測部120から出力される画面間予測誤差とから、モード選択アルゴリズムに従って、選択する予測モード(画面内予測もしくは画面間予測)を決定する。“画面内予測”が選択された場合は画面内予測画像13を、“画面間予測”が選択された場合は画面間予測画像14を、予測画像15として出力する。
【0058】
直交変換部140は、原画像10と予測画像15との差分である差分画像16から、直交変換処理によって周波数成分D3を生成する。
【0059】
量子化部150は、符号化制御部190から出力される量子化係数D4と、直交変換部140から出力される周波数成分D3とから量子化処理を行い、情報量を削減した量子化値D5を出力する。
【0060】
逆量子化部160は、量子化部150から出力される量子化値D5に対して逆量子化処理を行い、復元周波数成分D6を生成する。
【0061】
逆直交変換部170は、逆量子化部160から出力される復元周波数成分D6に対して逆直交変換処理を行い、復元差分画像17を生成する。
【0062】
そして、復元差分画像17と、モード選択部130によって選択された予測画像15とを足し合わせて、再構成画像12としてメモリ等の記憶装置に記憶する。
【0063】
可変長符号化部180は、量子化値D5と、画面内予測情報D1もしくは画面間予測情報D2を、より少ないデータ量のデータ列に符号化し、ストリーム11として出力する。
【0064】
ストリームバッファ200は、可変長符号化部180から出力されるストリーム11を取得し、バッファリングした後に、動画像符号化装置1に接続されている伝送路、もしくは後段のデコーダ等にストリーム11を出力する。また、バッファリングしているストリーム11の符号量を符号量情報D7として符号化制御部190へ出力する。
【0065】
符号化制御部190は、ストリームバッファ200から符号量情報D7を取得し、レート制御アルゴリズムに従って量子化係数D4を算出する。さらに、参照制御部210から出力されるカレントMB(マクロブロック。以下、同様。)の領域判定結果D13(後述する)が“参照領域”を示すものだった場合は量子化係数をそのままに、領域判定結果D13が“非参照領域”を示すものだった場合は量子化係数にオフセット値を加算して、量子化部150に出力する。
【0066】
ここで、「参照領域」とは、画面間予測又は画面内予測においてマクロブロックの予測処理を行う際に、画面間予測においては画面間参照の探索範囲となる領域を、画面内予測においては画面内画素参照の対象となる領域を、意味し、「非参照領域」は、画面間予測においては画面間参照の探索範囲としない領域を、画面内予測においては画面内画素参照の対象としない領域を、指す。
【0067】
参照制御部210は、ピクチャ毎に参照領域と非参照領域の位置を管理して、予測処理対象のマクロブロックであるカレントMBが非参照領域と参照領域のどちらに含まれるのかを判定する。そして、その判定結果に応じて、画面内予測部110に画面内予測制限情報D11を出力し、画面間予測部120に画面間予測制限情報D12を出力する。また、符号化制御部190に対して、カレントMBが参照領域もしくは非参照領域のどちらに含まれるのかを表す領域判定結果D13を出力する。この点については、後に詳述する。
【0068】
以下、本実施形態に係る動画像符号化装置の特徴である参照制御部210について、以下、図面を参照しながら詳述する。
【0069】
(参照制御部210)
[具体例1:符号化対象ピクチャを左右分割]
図2は、本実施形態に係る動画像符号化装置1の参照制御部210が実行するピクチャ毎の参照領域と非参照領域の管理方法の一例について説明する図である。
【0070】
本具体例においては、参照制御部210は各ピクチャを左右に分割し、その一方を参照領域、他方を非参照領域として、これを1ピクチャ毎に切り替える制御を行う場合について説明する。
【0071】
参照制御部210は、時系列(表示順。以下、同様。)上、最初のピクチャである符号化対象ピクチャ403では、符号化対象ピクチャ403の左半分を参照領域として、右半分を非参照領域とし、次ピクチャ以降(ピクチャ402、401)では、時系列上の前のピクチャで非参照領域だった領域を参照領域とし、参照領域だった領域を非参照領域とする。また、参照制御部210は、このピクチャ毎の参照領域もしくは非参照領域の位置(左半分もしくは右半分)を示す位置管理情報を保持しておく。そして、この位置管理情報に基づいて、処理中のカレントMBが参照領域もしくは非参照領域のどちらに含まれるのかを判断し、判断結果を領域判定結果D13として符号化制御部190に出力する。
【0072】
(画質についての効果)
これにより、符号化対象ピクチャの左および右のいずれでも、交互に非参照領域と参照領域が切り替わって表示されることとなるため、“鋭鈍画像の繰り返し錯覚”を利用して主観画質を維持することが可能である。さらに、符号量を削減することもできる。
【0073】
なお、本具体例においては、1ピクチャ毎に左右の参照領域と非参照領域とを切り替える点が特徴であり、最初のピクチャ403における参照領域と非参照領域は逆であっても構わない(すなわち、ピクチャ403の右半分を参照領域とし、左半分を非参照領域としてもよい)。
【0074】
(符号量変動についての効果)
次に、図2を用いて説明したように、参照制御部210が、符号化対象ピクチャを左右で非参照領域と参照領域とに分割した場合の符号量変動について説明する。
【0075】
図3は、符号化対象ピクチャにおける1マクロブロックライン(以下、「MBL」という)あたりの符号量について説明する図である。また、図4は、MBLごとにおける符号量の変動を示す図である。
【0076】
動画像符号化処理は、図3に示されるように、符号化対象ピクチャ401に対して、矢印で示されるラスタスキャン順に従ってMB単位で実行される。
【0077】
ここで、本具体例のように、符号化対象ピクチャ401の左半分が参照領域、右半分が非参照領域となった場合、符号量の少ない非参照領域と符号量の多い参照領域の1MBL内に含まれる面積は、いずれのMBLにおいても常に一定となる(図3参照)。そのため、本具体例の場合、図4に示される通り、符号量は1MBL単位でほぼ同じとなり、符号量変動を1MBL単位以内にまで抑えることができる。
【0078】
よって、本具体例の符号化方法によれば、符号量変動を吸収するストリームバッファ200の容量を削減することが可能となり、低遅延化を実現することができる。
【0079】
なお、本具体例では、符号化対象ピクチャを左右に分割しているが、これに限定されるものではない。一定MB数毎に含まれる参照領域と非参照領域の面積が常に同じとなり、一定間隔で非参照領域と参照領域とが切り替わるものであれば、“鋭鈍画像の繰り返し錯覚”を利用したまま低遅延化を実現することが可能である。よって、例えば、ピクチャを上下もしくは斜めに分割する方法や、3つ以上の複数の領域に分割するものであっても構わない。
【0080】
(画面内予測制限情報および画面間予測制限情報について)
ここで、参照制御部210が出力する画面内予測制限情報D11および画面間予測制限情報D12について説明する。
【0081】
図2の例のように、符号化対象ピクチャの左右で高画質な参照領域と低画質な非参照領域とに分けると、画質を維持しつつ、符号量の変動を抑えて遅延を少なくすることが可能である。しかし、一方で、ピクチャの左右で高画質な参照領域と低画質な非参照領域とが分けた場合、画面内予測および画面間予測において非参照領域の画素値が参照された場合に符号化効率が悪化してしまうという懸念がある。
【0082】
そこで、参照制御部210は、非参照領域から画質劣化が伝搬しないように、カレントMBの画面内予測については画面内予測部110に画面内予測制限情報D11を、画面間予測については画面間予測部120に画面間予測制限情報D12を出力する。
【0083】
(画面間予測の制限)
まず、参照制御部210が画面間予測部120に対して出力する画面間予測制限情報D12について説明する。
【0084】
画面間予測制限情報D12には、参照ピクチャ番号が含まれる。「参照ピクチャ番号」は、画面間予測処理において、動きベクトル探索を行う参照画像を示す番号である。また、画面間予測処理は、カレントMBを中心とした探索範囲内でカレントMBと似た画素ブロックを探索する処理である。
【0085】
図5〜図7は、本具体例において、参照制御部210が画面間予測部120に対して出力する画面間予測制限情報D12の一例について概念的に説明する図である。
【0086】
参照制御部210は、図5に示されるように、符号化対象ピクチャ401の探索範囲41が左半分の参照領域内に存在しているならば、時間軸上、過去に左半分の領域が参照領域だった画像のうち符号化対象ピクチャ401に対して時間的に最も近い画像であるピクチャ403のピクチャ番号を、画面間予測制限情報D12に含めて指定する。
【0087】
また、図6に示されるように、探索範囲41が右半分の非参照領域内に存在しているならば、時間軸上、過去に右半分の領域が参照領域だった画像のうち符号化対象ピクチャ401に対して時間的に最も近い画像であるピクチャ402のピクチャ番号を、画面間予測制限情報D12に含めて指定する。
【0088】
また、図7に示されるように、カレントMBが符号化対象ピクチャ401の中央付近に位置することで、探索範囲41が左右両方の領域にまたがっている場合は、過去に左半分の領域が参照領域だった直近の画像であるピクチャ403の参照領域(より具体的には、参照領域における探索範囲41と同一範囲部分。図15においても同様。)と、過去に右半分が参照領域だった直近の画像であるピクチャ402の参照領域(より具体的には、参照領域における探索範囲41と同一範囲部分。図15においても同様。)の両方を参照する様に、両画像のピクチャ番号を指定する。
【0089】
従って、本具体例によれば、画面間予測では常に小さい量子化係数で符号化された参照画像を使用することになるため、結果として、画面間予測精度が向上し動画像符号化効率も向上する。
【0090】
(画面内予測の制限)
次に、参照制御部210が画面内予測部110に対して出力する画面内予測制限情報D11について説明する。
【0091】
画面内予測制限情報D11には、モード制限情報が含まれる。参照制御部210は、画面内予測部110に対して非参照領域から画素値を参照せずに、参照領域からのみ画素値を参照するように、モード制限情報を設定する。以下、「モード制限情報」について説明する。
【0092】
図8は、H.264/AVC規格に規定されている4×4ブロックに対する画面内予測における予測モード(予測方向)の種類を示す図である。また、図9は、参照領域とカレントMBとの各位置関係における画面内予測モードの制限の一例について説明する図である。
【0093】
参照制御部210は、図9(a)に示されるように、符号化対象ピクチャ401aの左側が非参照領域で、カレントMBが参照領域内にあり、非参照領域の右側に隣接している場合は、左側の画素値を参照する画面内予測モードを使用禁止にすることを示すモード制限情報を、画面内予測制限情報D11として指定する(図9(c)「位置A」欄)。
【0094】
また、図9(b)に示されるように、符号化対象ピクチャ401bの右側が非参照領域で、カレントMBが非参照領域の左側に隣接している場合は、右側の画素値を参照する画面内予測モードを使用禁止にすることを示すモード制限情報を、画面内予測制限情報D11として指定する(図9(c)「位置B」欄)。
【0095】
参照領域とカレントMBとの位置関係が上記以外の場合、つまり符号化対象ピクチャの左側が非参照領域で、カレントMBが非参照領域の右側に隣接していない場合と、符号化対象ピクチャの右側が非参照領域で、カレントMBが非参照領域の左側に隣接していない場合は、画面内予測モードに制限を加える必要がない。よって、参照制御部210は、モード制限情報は特に指定しない。この時、例えば、画面内予測制限情報D11としては予測モードに制限がない旨を示す情報が含まれるようになっていてもよい。
【0096】
[具体例2:符号化対象ピクチャを上下分割]
図10は、参照制御部210で行うピクチャ毎の参照領域と非参照領域の管理方法の他の例について説明する図である。本具体例においては、参照制御部210は各ピクチャを上下に分割し、その一方を参照領域、他方を非参照領域として、これを1ピクチャ毎に切り替える制御を行う。
【0097】
図10に示されるように、参照制御部210は、例えば、時系列上、最初のピクチャである符号化対象ピクチャ503の上半分を参照領域として、下半分を非参照領域とし、次ピクチャ以降(ピクチャ502、501)では、時間軸上、前ピクチャで非参照領域だった領域を参照領域とし、参照領域だった領域を非参照領域とする。また、参照制御部210は、この参照領域もしくは非参照領域の位置を示す位置管理情報を保持しておく。そして、この位置管理情報に基づいて、処理中のカレントMBが参照領域もしくは非参照領域のどちらに含まれるのかを判断し、判断結果を領域判定結果D13として符号化制御部190に出力する。
【0098】
(符号量変動についての効果)
以下、図10を用いて説明したように、参照制御部210が、符号化対象ピクチャを上下で非参照領域と参照領域とに分割した場合の符号量変動について説明する。
【0099】
図11は、符号化対象ピクチャにおける1ピクチャあたりの符号量について説明する図である。また、図12は、ピクチャごとにおける符号量の変動を示す図である。
【0100】
動画像符号化処理は、図11に示されるように、符号化対象ピクチャ501に対して、矢印で示されるラスタスキャン順に従ってMB単位で実行される。
【0101】
ここで、本具体例のように、符号化対象ピクチャ501の上半分が参照領域、下半分が非参照領域となった場合、符号量の少ない非参照領域と符号量の多い参照領域の1ピクチャ内に含まれる面積は、いずれのピクチャでも常に一定となる。そのため、本具体例の場合、図12に示される通り、符号量は1ピクチャ単位でほぼ同じ符号量となり、符号量変動を1ピクチャ単位以内にまで抑えることができる。
【0102】
よって、本具体例の符号化方法によれば、符号量変動を吸収するストリームバッファ200の容量を削減することが可能となり、低遅延化を実現することができる。
【0103】
また、画質については、上記具体例1と同様に、符号化対象ピクチャの上下のいずれでも交互に非参照領域と参照領域とが切り替わって表示されることとなるため、“鋭鈍画像の繰り返し錯覚”を利用して主観画質を維持することが可能である。また、符号量を削減することもできる。
【0104】
なお、本具体例においては、1ピクチャ毎に上下の参照領域と非参照領域とを切り替える点が特徴であり、最初のピクチャ503における参照領域と非参照領域は逆であっても構わない(すなわち、ピクチャ503の下半分を参照領域とし、上半分を非参照領域としてもよい)。
【0105】
(画面間予測の制限)
具体例1と同様に、参照制御部210が画面間予測部120に対して出力する画面間予測制限情報D12には、参照ピクチャ番号が含まれ、「参照ピクチャ番号」は画面間予測処理において、動きベクトル探索を行う参照画像を示す番号である。
【0106】
図13〜図15は、本具体例において、参照制御部210が画面間予測部120に対して出力する画面間予測制限情報D12の一例について概念的に説明する図である。
【0107】
参照制御部210は、図13に示されるように、符号化対象ピクチャ501の探索範囲51が上半分の参照領域内に存在しているならば、時間軸上、過去に上半分の領域が参照領域だった画像のうち符号化対象ピクチャ501に対して時間的に最も近い画像であるピクチャ503のピクチャ番号を、画面間予測制限情報D12に含めて指定する。
【0108】
また、図14に示されるように、探索範囲51が下半分の非参照領域内に存在しているならば、時間軸上、過去に下半分の領域が参照領域だった画像のうち符号化対象ピクチャ501に対して時間的に最も近い画像であるピクチャ502のピクチャ番号を、画面間予測制限情報D12に含めて指定する。
【0109】
また、図15に示されるように、カレントMBが符号化対象ピクチャ501の中央付近に位置することで、探索範囲51が上下両方の領域にまたがっている場合は、過去に上半分の領域が参照領域だった直近の画像であるピクチャ503の参照領域と、過去に下半分が参照領域だった直近の画像であるピクチャ502の参照領域の両方を参照する様に、両画像のピクチャ番号を指定する。
【0110】
従って、本具体例によれば、画面間予測では常に小さい量子化係数で符号化された参照画像を使用することになるため、結果として、画面間予測精度が向上し動画像符号化効率も向上する。
【0111】
また、動画像は一般的に横方向への動きが大きい。本具体例では、上記具体例1の場合よりも探索範囲を横長に確保できるため、横方向の画面間予測精度を向上させることができるという利点がある。
【0112】
(画面内予測の制限)
図16は、参照領域とカレントMBとの各位置関係における画面内予測モードの制限の一例について説明する図である。
【0113】
具体例1と同様に、参照制御部210が画面内予測部110に対して出力する画面内予測制限情報D11には、モード制限情報が含まれる。参照制御部210は、図16(a)に示されるように、符号化対象ピクチャ501aの上側が非参照領域で、カレントMBが非参照領域の下側に隣接している場合は、上側の画素値を参照する画面内予測モードを使用禁止にすることを示すモード制限情報を、画面内予測制限情報D11として指定する(図16(b)「位置C」欄)。
【0114】
参照領域とカレントMBとの位置関係が上記以外の場合、つまり符号化対象ピクチャの上側が非参照領域で、カレントMBが非参照領域の下側に隣接していない場合と、符号化対象ピクチャの下側が非参照領域の場合には、画面内予測モードに制限を加える必要はない。よって、参照制御部210は、モード制限情報は特に指定しない。この時、例えば、画面内予測制限情報D11としては予測モードに制限がない旨を示す情報が含まれるようになっていてもよい。
【0115】
本具体例では、画面内予測モードにおいて、ピクチャの左右方向の予測モードが制限されないため、横方向の動きがある画像に対しては、上記具体例1よりも予測精度が向上するという利点がある。
【0116】
[具体例3:符号化対象ピクチャを複数に分割]
図17は、参照制御部210で行うピクチャ毎の参照領域と非参照領域の管理方法の他の例について説明する図である。本具体例においては、参照制御部210は各ピクチャを横方向に3つに分割し、そのうちの2つを参照領域、残りの1つを非参照領域として、これを1ピクチャ毎に切り替える制御を行う。
【0117】
図17に示されるように、参照制御部210は、例えば、時系列上、最初のピクチャである符号化対象ピクチャ604の右の領域を非参照領域として、中央と左を参照領域とし、次ピクチャ以降(ピクチャ603、602、601)では、前ピクチャで非参照領域だった領域が右なら中央、中央なら左、左なら右の領域を非参照領域とし、残りの領域を参照領域とする。
【0118】
参照制御部210は、上記具体例1や具体例2と同様に、この参照領域もしくは非参照領域の位置(左、中央、右)を示す位置管理情報に基づいて、処理中のカレントMBが参照領域もしくは非参照領域のどちらに含まれるのかを表す領域判定結果D13を符号化制御部190に出力する。
【0119】
なお、本具体例ではピクチャを3つに分割し、そのうちの1つを非参照領域、2つを参照領域とし、時系列上、非参照領域を右、中央、左の順番に移動するようにしたが、これに限定されるものではない。ピクチャを複数分割する場合は、分割数や非参照領域の移動順は他の方法でもよく、非参照領域と参照領域の設定パターンが、時系列上、所定の周期で繰り返されるものであればよい。例えば、各ピクチャをより多くの領域に分割してもよい。
【0120】
(符号量変動についての効果)
以下、図17を用いて説明したように、参照制御部210が、符号化対象ピクチャを3分割し、非参照領域と参照領域の位置を管理した場合の符号量変動について説明する。
【0121】
図18は、符号化対象ピクチャにおける1MBLあたりの符号量について説明する図である。
【0122】
動画像符号化処理は、図18に示されるように、符号化対象ピクチャ601に対して、矢印で示されるラスタスキャン順に従ってMB単位で実行される。
【0123】
ここで、本具体例のように、符号化対象ピクチャ601の右が非参照領域となり、中央と左が参照領域となった場合、符号量の少ない非参照領域と符号量の多い参照領域の1MBL内に含まれる面積は、いずれのMBLでも常に一定となる(図18参照)。そのため、本具体例の場合、上記具体例1と同様に、符号量は1MBL単位でほぼ同じとなり、符号量変動を1MBL単位以内にまで抑えることができる。
【0124】
よって、本具体例の符号化方法によれば、符号量変動を吸収するストリームバッファ200の容量を削減することが可能となり、低遅延化を実現することができる。
【0125】
また、画質については、ピクチャ内において画質の低い非参照領域の占める割合が上記具体例1よりも狭く、動画像として再生した場合に、各ピクチャの同一箇所において非参照領域が出現する間隔が上記具体例1よりも長くなる。よって、フレームレートが30fpsなどの低い場合でも、“鋭鈍画像の繰り返し錯覚”の主観画質向上効果を受けることが可能である。
【0126】
(画面間予測の制限)
図19および図20は、本具体例において、参照制御部210が画面間予測部120に対して出力する画面間予測制限情報D12の一例について概念的に説明する図である。
【0127】
参照制御部210は、符号化対象ピクチャ601の探索範囲61が左の参照領域内に存在しているならば、時間軸上、過去に左の領域が参照領域だった画像のうち符号化対象ピクチャ501に対して時間的に最も近い画像のピクチャ番号を、画面間予測制限情報D12に含めて指定する。また、探索範囲61が符号化対象ピクチャ601の中央の領域内に存在しているならば、時間軸上、過去に中央の領域が参照領域だった画像のうち符号化対象ピクチャ601に対して時間的に最も近い画像のピクチャ番号を、画面間予測制限情報D12に含めて指定する。探索範囲61が符号化対象ピクチャ601の右の領域内に存在している場合も同様である。つまり、時間軸上、過去に右の領域が参照領域だった画像のうち符号化対象ピクチャ601に対して時間的に最も近い画像のピクチャ番号を、画面間予測制限情報D12に含めて指定する。
【0128】
また、図19および図20に示されるように、探索範囲61が符号化対象ピクチャ601の左と中央、もしくは中央と右、の様に複数の領域にまたがっている場合は、過去の画像のうち、探索範囲がまたがっている位置と同じ位置の領域が参照領域だった画像の参照領域を参照する様に、その画像のピクチャ番号を画面間予測制限情報D12に含めて指定する。
【0129】
なお、図19および図20の例では、参照画像として単一のピクチャのみを参照する場合を示しているが、上記具体例1で図7を用いて説明したように、複数の参照画像を参照するようになっていてもよい。例えば、図19の例では、探索範囲61が符号化対象ピクチャ601の左と中央の領域にまたがっているが、この場合には、過去に左の領域が参照画像だった直近の画像であるピクチャ603と、過去に中央の領域が参照領域だった直近の画像であるピクチャ602の両方を参照画像とするようになっていてもよい。この時、参照制御部210は、ピクチャ602とピクチャ603のピクチャ番号を画面間予測制限情報D12に含めて指定する。
【0130】
以上のように、本具体例によれば、画面間予測では常に小さい量子化係数で符号化された参照画像を使用することになるため、結果として、画面間予測精度が向上し動画像符号化効率も向上する。
【0131】
また、単一の参照画像に対して、1ピクチャを2つの領域に分割する上記具体例1よりも広い探索範囲を確保できるため、結果として、画面間予測精度が向上し動画像符号化効率も向上するという利点がある。
【0132】
(画面内予測の制限)
画面内予測の制限については、上記具体例1と同様である。すなわち、参照制御部210は、カレントMBが非参照領域に隣接する場合(例えば、図20のような場合)に、非参照領域から画素値を参照しないようにモード制限情報を、画面内予測制限情報D11として指定する。
【0133】
(まとめ)
以上のとおり、本実施形態によれば、符号量の変動を抑えることにより遅延を抑え、かつ高画質に動画像を符号化することができる。
【0134】
なお、本発明の範囲は、図示され記載された例示的な実施形態に限定されるものではなく、本発明が目的とするものと均等な効果をもたらすすべての実施形態をも含む。さらに、本発明の範囲は、すべての開示されたそれぞれの特徴のうち特定の特徴のあらゆる所望する組み合わせによって画されうる。
【0135】
(付記)
以上に、本発明に係る実施形態について詳細に説明したことからも明らかなように、前述の実施形態の一部または全部は、以下の各付記のようにも記載することができる。しかしながら、以下の各付記は、あくまでも、本発明の単なる例示に過ぎず、本発明は、かかる場合のみに限るものではない。
【0136】
(付記1)
参照制御部と量子化部とを有し、時系列に並ぶ複数の画像からなる動画像を画面内予測もしくは画面間予測によって符号化する動画像符号化装置が実行する動画像符号化方法であって、
前記参照制御部は、前記複数の画像を、前記画面内予測又は前記画面間予測において画素値を参照する領域である参照領域と、画素値を参照しない領域である非参照領域と、に分割し、かつ、前記時系列上においてあらかじめ定められた所定の間隔で前記複数の画像における前記参照領域と前記非参照領域とが入れ替わるように前記複数の画像における前記参照領域と前記非参照領域を決定する第1のステップと、
前記量子化部は、前記複数の画像の前記符号化の際に、前記非参照領域については前記参照領域よりも粗い粒度で量子化を行う第2のステップと、
を含むことを特徴とする動画像符号化方法。
【0137】
(付記2)
時系列に並ぶ複数の画像からなる動画像を画面内予測もしくは画面間予測によって符号化する動画像符号化方法をコンピュータに実行させる動画像符号化プログラムであって、該プログラムは、前記コンピュータに、
前記複数の画像を、前記画面内予測又は前記画面間予測において画素値を参照する領域である参照領域と、画素値を参照しない領域である非参照領域と、に分割し、かつ、前記時系列上においてあらかじめ定められた所定の間隔で前記複数の画像における前記参照領域と前記非参照領域とが入れ替わるように前記複数の画像における前記参照領域と前記非参照領域を決定する第1の処理ステップと、
前記複数の画像の前記符号化の際に、前記非参照領域については前記参照領域よりも粗い粒度で量子化を行う第2の処理ステップと、
を含む処理を実行させるための動画像符号化プログラム。
【符号の説明】
【0138】
1 動画像符号化装置
10 原画像
11 ストリーム
12 再構成画像
13 画面内予測画像
14 画面間予測画像
15 予測画像
16 差分画像
17 復元差分画像
41 探索範囲
51 探索範囲
61 探索範囲
90 原画像
91 ストリーム
92 再構成画像
93 画面内予測画像
94 画面間予測画像
95 予測画像
96 差分画像
97 復元差分画像
110 画面内予測部
120 画面間予測部
130 モード選択部
140 直交変換部
150 量子化部
160 逆量子化部
170 逆直交変換部
180 可変長符号化部
190 符号化制御部
200 ストリームバッファ
210 参照制御部
401 符号化対象ピクチャ
401a、401b 符号化対象ピクチャ
402 ピクチャ
403 ピクチャ
501 符号化対象ピクチャ
501a 符号化対象ピクチャ
502 ピクチャ
503 ピクチャ
601 符号化対象ピクチャ
602 ピクチャ
603 ピクチャ
910 画面内予測部
920 画面間予測部
930 モード選択部
940 直交変換部
950 量子化部
960 逆量子化部
970 逆直交変換部
980 可変長符号化部
990 符号化制御部
1000 ストリームバッファ
D1 画面内予測情報
D2 画面間予測情報
D3 周波数成分
D4 量子化係数
D5 量子化値
D6 復元周波数成分
D7 符号量情報
D11 画面内予測制限情報
D12 画面間予測制限情報
D13 領域判定結果
D81 画面内予測情報
D82 画面間予測情報
D83 周波数成分
D84 量子化係数
D85 量子化値
D86 復元周波数成分
D87 符号量情報

【特許請求の範囲】
【請求項1】
時系列に並ぶ複数の画像からなる動画像を画面内予測もしくは画面間予測によって符号化する動画像符号化装置であって、
前記複数の画像を、前記画面内予測又は前記画面間予測において画素値を参照する領域である参照領域と、画素値を参照しない領域である非参照領域と、に分割し、かつ、前記時系列上においてあらかじめ定められた所定の間隔で前記複数の画像における前記参照領域と前記非参照領域とが入れ替わるように前記複数の画像における前記参照領域と前記非参照領域を決定する参照制御部と、
前記複数の画像の前記符号化の際に、前記非参照領域については前記参照領域よりも粗い粒度で量子化を行う量子化部と、
を有することを特徴とする動画像符号化装置。
【請求項2】
前記参照制御部は、前記画像において、一定単位の領域における前記参照領域と前記非参照領域との割合が、前記画像に含まれるいずれの一定単位の領域でも同じとなるように、前記参照領域と前記非参照領域を決定することを特徴とする請求項1に記載の動画像符号化装置。
【請求項3】
前記複数の画像に対して前記画面内予測による前記符号化を行う画面内予測部をさらに有し、
前記画面内予測部は、前記画像内において前記符号化対象のマクロブロックであるカレントマクロブロックと、前記参照領域または前記非参照領域と、の位置関係によって、前記参照領域の画素のみを参照して前記符号化を行うことを特徴とする請求項1又は2に記載の動画像符号化装置。
【請求項4】
前記複数の画像に対して前記画面間予測による前記符号化を行う画面間予測部をさらに有し、
前記画面間予測部は、前記画面間予測を行う際に、動きベクトルの探索範囲が前記参照領域となる前記複数の画像の少なくとも一つを参照することを特徴とする請求項1から3のいずれか一項に記載の動画像符号化装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate

【図21】
image rotate

【図22】
image rotate

【図23】
image rotate


【公開番号】特開2013−110466(P2013−110466A)
【公開日】平成25年6月6日(2013.6.6)
【国際特許分類】
【出願番号】特願2011−251879(P2011−251879)
【出願日】平成23年11月17日(2011.11.17)
【出願人】(000001122)株式会社日立国際電気 (5,007)
【Fターム(参考)】