説明

画素ブロックを符号化及び再構成する方法、並びに対応する装置

【課題】N個の画素からなる現在のブロックを再構成する方法を提案する。
【解決手段】本方法は、N個の残差係数を復号化して逆量子化するステップ100、N個の参照係数を決定するステップ100、前記N個の残差係数と、少なくとも1つの照明の変動のパラメータにより定義される照明の変動のモデルを考慮することで前記N個の参照係数から決定されたN個の予測係数とから、前記現在のブロックについてのN個の係数を繰り返し再構成するステップ110,120,130,140,160及び170、再構成されたN個の係数をN個の画素からなる現在のブロックに変換するステップ180を含み、前記照明の変動のパラメータは、kを整数とし且つ1≦k≦Nとして、前記現在のブロックのついてk個の係数のそれぞれの再構成に関してリファインされる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像符号化の一般的な分野に関する。より詳細には、本発明は、画像の画素ブロックを再構成する方法、及び係る画素ブロックを符号化する方法に関する。また、本発明は、対応する符号化及び復号化装置に関する。
【背景技術】
【0002】
画像系列を符号化データのストリームに符号化する方法、及びこのストリームを復号化する方法の大部分は、時間予測又は画像間予測、及び同様に空間予測又は画像内予測を使用する。画像内又は画像間予測は、画像系列の圧縮が改善されるのを可能にする。画像内又は画像間予測は、現在のブロックについて、予測ブロックの生成及び現在のブロック及び予測ブロックの間の残差とも呼ばれる差の符号化を含む。予測ブロックが現在のブロックと相関すると、現在のブロックを符号化するために必要とされるビット数が少なくなり、従って圧縮が効率的になる。しかし、画像間(それぞれ画像内)予測は、(それぞれの現在の画像における)系列の画像間の輝度の変動があるときにその効率を失う。係る輝度の変動は、例えば照明の変更、フェード効果、フラッシュ等による。
【0003】
輝度における変動を考慮した画像系列を符号化/復号化する方法が知られている。従って、文献ISO/IEC 14496-10に記載される規格MPEG-4 AVC/H.264のフレームワーク内で、輝度の変動の場合において圧縮を改善するため、重み付け予測方法を使用することが知られている。このため、MPEG-4 AVC/H.264規格は、画素の1以上のブロックを含む画像スライス毎に、重み付けされた予測パラメータのストリームにおける明示的な送信を可能にする。従って、重み付け予測パラメータ又は幾つかの重み付け予測パラメータのセットによる照明補正は、重み付けパラメータ又は重み付け予測パラメータのセットが関連付けされる画像スライスの全てのブロックについて同じやり方で適用される。例えば、重み付けパラメータは、動きベクトルMVを使用して、現在のブロックBcurの平均と、個の現在のブロックに関連付けされる参照ブロックBrefの平均との間の比率を計算することで、現在のブロックBcurについて決定される。ブロックの平均は、例えばブロックの画素に関連する輝度値の平均である。参照ブロックは、例えば、動き予測のステップの間に決定される。係る予測方法は、現在のブロックの輝度の変動が現在のブロックに関連する値から決定されるので正確である。しかし、係る方法は、画像スライス毎に、従って潜在的にブロック毎に、重み付け予測パラメータのセットのストリームにおける送信を意味するので、ビットレートの観点で費用がかかる。
【0004】
局所的な輝度の変動を補正して、コーダ側及びデコーダ側で同じやり方で重み付けパラメータをローカルに決定することが、当該技術分野において知られている。この場合、重み付けパラメータは、ストリームで明示的に送信されない。例えば、現在のブロックBcurの重み付けパラメータは、現在のブロックBcurの近傍ブロックNcの平均と、現在のブロックBcurと関連する参照ブロックBrefの近傍ブロックNrとの比率を計算することで決定される。例えば近傍ブロックの平均は、問題となる近傍ブロックの画素に関連する輝度値の平均である。Ncは、ブロックBcurの原因となる近傍ブロックに位置される。従って、Ncは、Bcの前に符号化され(それぞれ再構成される)。係る方法は、重み付け予測パラメータは、ストリームで明示的に送信されないが、コーダ側及びデコーダ側で同じやり方で決定されないため、ビットレートの観点で安価である。しかし、係る予測方法は、現在のブロックBcurに関連付けされる重み付けパラメータがこのブロックのコンテンツを考慮しない点で、先の方法よりも正確ではない。
【0005】
国際出願WO 2011012669は、予測方法が現在のブロックのコンテンツを考慮し、照明の局所的な変動に関連するパラメータを明示的に符号化する必要なしに、照明の局所的な変動に動的に適応する、符号化及び復号化方法を記載する。この符号化及び復号化方法は、重み付け予測パラメータがストリームで送信されない場合に、符号化効率を改善する利点を有する。
【0006】
しかし、WO 2011012669では、重み付けパラメータは、変換の最初に再構成される係数、すなわちDC係数のみから更新される。
【発明の概要】
【発明が解決しようとする課題】
【0007】
本発明の目的は、従来技術の問題点の少なくとも1つを克服することにある。
【課題を解決するための手段】
【0008】
この目的を達成するため、本発明は、Nを整数としてN個の画素からなる現在のブロックを再構成する方法に関する。再構成する方法は、以下のステップを含む。N個の残差係数を復号化及び逆量子化するステップ。N個の参照係数を決定するステップ。N個の残差係数と、少なくとも1つの照明の変動のパラメータにより定義される照明の変動のモデルを考慮することでN個の参照係数から決定されるN個の予測係数とから、現在のブロックのN個の係数を再構成するステップ。照明の変動のパラメータは、kを整数とし且つ1≦k≦Nとして現在のブロックのk個の係数のそれぞれの再構成に関してリファインされる。N個の再構成された係数をN画素からなる現在のブロックに変換するステップ。
【0009】
特定の実施の形態によれば、現在のブロックについてN個の係数を再構成するステップは、以下のステップを含む。a)照明の変動のモデルを考慮することで、参照係数からk個の最初の予測係数を計算するステップ。b)k個の最初の残差係数及びk個の最初に計算された予測係数からk個の再構成された係数を計算するステップ。c)既に再構成された全ての係数及び対応する参照係数から、少なくとも1つの照明の変動のパラメータをリファインするステップ。d)k個の後続の係数により、N個の再構成された係数の計算まで、ステップa)〜c)を繰り返すステップ。
【0010】
本発明の別の態様によれば、再構成方法は、ステップc)とd)の間で、ステップc)でリファインされた少なくとも1つの照明の変動のパラメータから既に再構成された全ての係数をリファインするステップを含む。
【0011】
本発明の特定の特徴によれば、kの値は1に等しい。
本発明の別の特定の特徴によれば、kの値はある繰返しから他の繰返しで変動する。
本発明の別の特定の特徴によれば、kの値は、ゼロの残差係数から分離された2つの非ゼロの残差係数間の距離に等しい。
【0012】
本発明の更に別の特定の特徴によれば、kの値は、閾値よりも低い残差係数から分離された閾値よりも大きい2つの残差係数間の距離に等しい。
本発明の特定の態様によれば、少なくとも1つのリファインされた照明のパラメータは、量子化雑音の分散により重み付けされる二次の誤差を最小化することで決定される。二次の誤差は、再構成された係数と対応する参照係数との間で計算される。
【0013】
本発明は、Nを整数として、N個の画素の現在のブロックを符号化する方法に関し、当該方法は、以下のステップを含む。現在のブロックをN個の現在の係数に変換するステップ。N個の参照係数を計算するステップ。少なくとも1つの照明の変動のパラメータにより定義される照明の変動のモデルを考慮することで、N個の参照係数から決定されたn個の現在の係数とN個の予測係数とからN個の残差係数を計算するステップ。照明の変動のパラメータは、kを整数とし且つ1≦k≦Nとして、現在のブロックのk個の係数のそれぞれの再構成でリファインされる。N個の残差係数を量子化及び符号化するステップ。
【0014】
特定の実施の形態によれば、N個の残差係数を計算するステップは、以下のステップを含む。a)kを1に等しいか又は1よりも大きい整数とし、少なくとも1つの照明の変動のパラメータにより定義される照明の変動のモデルを考慮することで、参照係数からk個の最初の予測係数を計算するステップ。b)k個の最初の現在の係数とk個の最初の予測係数とからk個の残差係数を計算するステップ。c)k個の最初の量子化次いで逆量子化された残差係数と、k個の最初の計算された予測係数とからk個の再構成された係数を計算するステップ。d)既に再構成された全ての係数と対応する参照係数とから、少なくとも1つの照明の変動のパラメータをリファインするステップ。e)k個の後続する係数について、N個の残差の係数の計算まで、ステップa)〜d)を繰返すステップ。
【0015】
本発明の特定の態様によれば、符号化方法は、ステップd)とe)との間で、ステップd)でリファインされた少なくとも1つの照明の変動のパラメータから既に再構成された全ての係数と、対応する参照係数とをリファインするステップを含む。
【0016】
さらに、本発明は、Nを整数としてN画素の現在のブロックを表すストリームを復号化する装置に関し、当該装置は、以下を備える。ストリームからN個の残差係数を復号化及び逆量子化する手段。N個の参照係数を決定する手段。N個の残差係数と、少なくとも1つの照明の変動のパラメータにより定義される照明の変動のモデルを考慮することでN個の参照係数から決定されたN個の予測係数とから、現在のブロックのN個の係数を再構成する手段。照明の変動のパラメータは、kを整数とし且つ1≦k≦Nとして、現在のブロックのk個の係数のそれぞれの再構成に関してリファインされる。N個の再構成された係数をN個の画素の現在のブロックに変換する手段。
【0017】
さらに、本発明は、符号化装置に関し、当該装置は、以下を備える。現在のブロックをN個の現在の係数に変換する手段。N個の参照係数を決定する手段。N個の現在の係数と、少なくとも1つの照明の変動のパラメータにより定義される照明の変動のモデルを考慮することでN個の参照係数から決定されたN個の予測係数とから、N個の残差係数を計算する手段。照明の変動のパラメータは、kを整数であって且つ1≦k≦Nとして、現在のブロックのk個の係数のそれぞれの再構成に関してリファインされる。N個の残差係数を量子化及び符号化する手段。
【0018】
有利なことに、本発明に係る符号化及び再構成方法は、再構成された現在ブロックBrecの係数が計算されたときに、予測ブロックを次第に調節するように、照明の変動の1以上のパラメータのリファインを実現するものであり、これにより符号化効率が改善されるのを可能にする。これらの方法は、特に照明の変動である、信号特性の局所的な変動に対して規則的且つ正確に適合する。加えて、これらの方法は、照明の変動の1以上のパラメータを明示的に符号化することを必要としない。
【図面の簡単な説明】
【0019】
本発明は、以下の添付図面を参照して、限定されるものではない実施の形態及び有利な実現により良好に理解及び例示されるであろう。
【図1】本発明に係る再構成方法を例示する図である。
【図2】残差係数を例示する図である。
【図3】残差係数を例示する図である。
【図4】本発明に係る符号化方法を例示する図である。
【図5】本発明に係る符号化装置を例示する図である。
【図6】本発明に係る復号化装置を例示する図である。
【発明を実施するための形態】
【0020】
本発明は、画像の系列の画素のブロックを再構成する方法、及び係るブロックを符号化する方法に関する。画像系列は、一連の幾つかのピクチャである。それぞれのピクチャは、ピクチャデータの少なくとも1つのアイテムが関連付けされる画素又はピクチャポイントを含む。画像データのアイテムは、例えば輝度データのアイテム又は色度データのアイテムである。
【0021】
また、表現「明るさ変動“brightness variation”」は、英語の用語として、「輝度変動“luminance variation”」、「光度変動“luminosity variation”」又は「照明変動“illumination variation”」として知られる。
【0022】
用語「動きデータ」は、最も広い意味で理解されるべきである。動きデータは、動きベクトルを含み、おそらく参照画像が画像系列において識別されるのを可能にする参照画像インデックスを含む。また、動きデータは、予測ブロックを導出するために参照ブロックに適用される必要がある補間タイプを示す情報のアイテムを含む。
【0023】
用語「残差データ“residual data”」は、他のデータの抽出後に得られるデータを意味する。この用語は、「残差“residue”」の表現と同義語である。残差ブロックは、残差データが関連付けされる画素のブロックである。
【0024】
用語「変換された残差データ」は、変換が適用された残差データを意味する。DCT(離散コサイン変換)は、2003年9月にJ.Wiley&Sonsにより出版された「H.264 and MPEG-4
video compression」と呼ばれるI.E.Richardsonによる書籍の3.4.4.4節に記載される変換の例である。I.E.Richardsonによる書籍の3.4.2.3節に記載されるウェーブレット変換及びアダマール変換は、他の例である。係る変換は、例えば残差の輝度及び/又は色度データといった画像データのブロックを、「周波数データのブロック」又は「係数のブロック」とも呼ばれる「変換データのブロック」に変換する。係数のブロックは、連続する係数又はDC係数の名の下で知られる低周波係数及びAC係数として知られる高周波係数を有する。
【0025】
「予測データ“prediction data”」の表現は、他のデータを予測するために使用されるデータを意味する。予測ブロックは、予測データが関連付けされる画素のブロックである。
【0026】
予測ブロックは、予測(空間予測又は画像内予測)するブロックに属する画像と同じ画像の1又は複数のブロックから得られるか、又は予測するブロックが属する画像の異なる画像(時間予測又は画像間予測)の1つのブロック(単方向予測)又は複数のブロック(双方向予測)から得られる。
【0027】
用語「画像領域“image domain”」は、輝度及び/又は色度が関連付けされる画素の領域を表す。「周波数領域」又は「変換領域」は、係数の領域を表す。画像の例えばDCTといった変換を適用することで画像領域から変換領域に変わり、逆に、例えば逆DCTといった先の変換の逆変換を適用することで、変換領域から画像領域に変わる。
【0028】
その後、符号化及び再構成方法は、ある画素ブロックを参照して記載される。これらの方法は、1以上の画像の符号化及び再構成を視野に入れて、ある画像の幾つかのブロック、及びある系列の幾つかの画像に適用することができることは明らかである。
【0029】
画素領域で考慮されるブロックデータは、Bxxと名付けられる。提案されるスキームでは、変換領域で考慮されるブロックデータは、Cxxと名付けられる。
【0030】
curを予測によりインター画像モード又はイントラ画像モードにおいて再構成される現在ブロックであるとする。Brefを関連される参照ブロックであるとする。この参照ブロックは、現在の画像の既に再構成されたブロックであるか、又は既に再構成された別の画像のブロックである。これは、現在の画像の既に再構成された画素、又は既に再構成された別の画像の画素から補間により構築されるブロックである。確かに、Brefがサブピクセルレベルの精度で動きベクトルにより参照画像において識別されるブロックである場合、参照ブロックBrefが補間される。予測ブロックBpredは、参照ブロックBrefに従うリニアタイプの輝度の局所的な変動のモデルに従って構築される。
【0031】
例えばBpred(x,y)=a+b.Bref(x,y)としてBpred(x,y)=f[Bref(x,y)]
a及びbは、照明の変動のパラメータであり、(x,y)は、画像における画素の座標である。
【0032】
本発明によれば、現在のブロックBcurの再構成されたブロックBrecへの再構成は、変換領域で行われる。ひとたび全てのBcurの係数が変換領域で計算されると、再構成されたブロックを生成するため、逆変換が適用される。本発明によれば、1以上のBcurの係数のそれぞれの再構成に関して、明るさの変動のモデルのパラメータがリファインされる。
【0033】
これを行うため、1つの方法は、符号化スキームで典型的に使用される変換の線形性の特性に基づくものであり、変換係数と明るさの変動のモデルのパラメータとの間のダイレクトリンクが確立されるのを可能にする。標準的なスキームとは異なり、ブロックBcurは、変換領域で再構成される。変換は、予測ブロックが変換領域Cpredで決定される参照ブロックBrefに適用される。変換された残差ブロックCrecは、変換された再構成されたブロックCrecを生成するために、参照ブロックBrefに加えられる。逆変換は、最終的な再構成されたブロックBrecを生成するため、変換領域における再構成されたブロックに適用される。より詳細には、本発明に係るブロックBcurを再構成する方法は、図1を参照して記載される以下のステップを含む。
【0034】
ステップ100で、N個の残差係数を復号化及び逆量子化し、N個の参照係数を決定するステップ。ステップ175で、少なくとも1つの照明の変動のパラメータにより定義される照明の変動のモデルを考慮することで、N個の残差係数と、N個の参照係数から決定されるN個の予測係数とから、現在のブロックのN個の係数を再構成するステップ。照明の変動のパラメータは、kを整数且つ0≦k≦Nとして、現在のブロックについてk個の係数のそれぞれの再構成に関してリファインされる。ステップ180で、N個の再構成された係数をN個の画素の現在のブロックに変換するステップ。
【0035】
本発明に係るブロックBcurを再構成する方法は、図4を参照して記載される以下のステップを含む。ステップ200で、現在のブロックをN個の現在の係数に変換し、N個の参照符号を決定するステップ。ステップ285で、少なくとも1つの照明の変動のパラメータにより定義される照明の変動のモデルを考慮することで、N個の現在の係数と、N個の参照係数から決定されたN個の予測係数とから、N個の残差係数を計算するステップ。照明の変動のパラメータは、kを整数且つ1≦k≦Nとして前記現在のブロックのk個の係数のそれぞれの再構成に関してリファインされる。ステップ290で、N個の残差係数を量子化及び符号化するステップ。
【0036】
有利なことに、本発明に係る符号化及び再構成方法は、再構成された現在のブロックBrecの係数が計算されているとき、予測ブロックを次第に調節するように、照明の変動のパラメータのリファイニングを実現し、このように符号化効率が改善される。照明の変動の1以上のパラメータは、現在のブロックBrecの係数の再構成が長引くときにリファインされる。これは、これらの照明の変動のパラメータがますます正確であり、結果的に現在のブロックの精度が改善されるのを可能となることを意味する。
【0037】
図1は、本発明の特定の実施の形態に係る、画素ブロックBrecを再構成する方法を示す。Brecは、再構成された現在のブロックBcurである。
【0038】
ステップ100の間、変換された残差ブロックは、復号化され、次いで逆量子化される。このようにして得られたブロックは、i=0...N−1であり、整数Nは、変換からの係数の数として、残差係数Cresiを含む。変換8×8の場合、N=64である。照明の変動のパラメータainit及びbinitの初期値は、参照ブロックBrefの参照係数Crefiと同様に得られる。照明の変動のパラメータの初期値が例えば復号化され、或いは例えばビデオ符号化規格により予め定義され、従って再構成方法について知られる。参照ブロックBrefは、例えば動きベクトルを使用して画像領域で決定され、次いで参照係数Crefiのブロックに変換される。同様に、再構成される画素ブロックの最初の係数Crec0は、例えば以下の式に従って再構成される。
【0039】
rec0=ainit.D0+binitref0+Crec0
この場合、
【数1】

であり、d0(.)は、変換のインデックス0の基本ベクトルであり、Brはそのサポートである。
【0040】
ステップ110の間、pはゼロに初期化される。
ステップ120の間、式Cpredi=a.Di+b.Crefiに従って、i=p+1,...,p+kp,kp>=1及びp+kp<Nについて予測係数Cprediが計算される。
【0041】
prediは、予測係数と呼ばれる、予測ブロックのインデックスiの変換係数であり、Crefiは、参照係数と呼ばれる、参照ブロックのインデックスiの変換係数であり、di(.)は、変換のインデックスiの基本ベクトルであり、Brをベクトルのサポートdi(.)として、
【数2】

である。
【0042】
一般に、(例えばDCT−離散コサイン変換、DST−離散サイン変換、FFT−高速フーリエ変換といった)変換ベースは、第一の係数がD0=1である信号の平均となり、変換の後続するベクトルが任意のi>0についてDi=0となるようなものである。
【0043】
本発明の特定の特性によれば、kp=1である。本発明の別の特定の特性によれば、kpは、1とN−1との間の予め決定された値を有する。変形例によれば、kpの値は、ある繰り返しから他の繰り返しへと変わる。例えば、kpの値は、図2に示されるようなゼロ係数Cresiにより分離される2つの非ゼロの係数Cresiの間の距離に等しい。インデックス0の係数は、その値に係らずに考慮される。この図2に関して、インデックス4とN−2の係数はゼロである。更に別の変形例によれば、kpの値は、図3に示されるように、閾値Thよりも小さい振幅の係数Cresiにより分離される、閾値Thよりも大きい振幅の2つの係数Cresiの間の距離に等しく、インデックス0の係数は、その値に係らず考慮される。この図3に関して、インデックス1,3,N−3及びN−1の係数は、Thよりも大きい振幅を有する。
【0044】
ステップ130の間、i=p+1,…,p+kpについて再構成された係数Creciは、以下の式に従って、予測係数Cprediと残差係数Cresiとから計算される。
【0045】
【数3】

ステップ140の間、パラメータa及びbは、p+kpでのi=0について、再構成された係数Creci及び参照ブロックにおけるそれらの対応する係数Crefiからリファインされる。リファインされたパラメータは、
<外1>

として示される。照明の変動のパラメータは、異なる方法によりリファインすることができる。
【0046】
第一の方法によれば、リファインされた照明の変動パラメータ
<外2>

は、量子化雑音の変動により重み付けされたモデリングの二次誤差を最小化することで得られる。
【0047】
【数4】

iは、インデックスiの係数の量子化ステップである。
【0048】
<外3>

は、従って、最小自乗法により得られ、これは、2つの未知数及び2つの式をもつ線形システムを解くことにつながる。
【0049】
変換ベースの第一のベクトルがD0=1であり、他の全てが任意のi>0についてDi=0である(例えばDCT,DST,FFTといった)標準的な変換ベースの場合、以下の式のシステムが得られる。
【0050】
【数5】

従って以下が得られる。
【0051】
<外4>

なお、それぞれの新たな係数について、線形システムを解く前に、以下の項
<外5>

が更新される。
【0052】
第二の方法によれば、リファインされた照明の変動のパラメータ
<外6>

は、尤度最大化により得られる。
【0053】
パラメータ
<外7>

は、a及びb、p+kpでi=0についてCrefi及びCreciを知る正確な係数である(すなわち量子化されていない)係数Ccuriの尤度を最大にするパラメータである。
【0054】
【数6】

は、線形モデル
【数7】

に従ってCrefiにより近似される。ここでεiは、分散σi2に相関しない、雑音であることが想定される白色ガウス性雑音とである。
【0055】
iを量子化雑音として、
【数8】

であるとき、
【数9】

を得る。
【0056】
適用された量子化は一様量子化であり、量子化雑音niは一様であり、使用される量子化ステップをQiとして、確率1/Qiである。
【0057】
εi及びniが両者間で独立であり、且つiとは無関係であると仮定される場合、以下を得る。
【0058】
【数10】

その結果は、関数はa及びbに関して最大にされる。Kは、a及びbとは独立なパラメータである。
【0059】
【数11】

この最大値をサーチするため、確率勾配型の解法が使用される。
この第二の方法の変形例によれば、式
【数12】

において現れる付加雑音niは、正規ガウス型として考えられる。この特定の場合では、この雑音の分散は、一様な量子化雑音の分散、すなわちσi2=Qi2/12に対応する。
【0060】
次いで、尤度は、Kをa及びbに独立なパラメータとして、以下のように書かれる。
【0061】
【数13】

次いで、a及びbに関する尤度の最大化は、先に記載されたような、重み付け最小自乗を解くことになる。
【0062】
任意のステップ150の間、既に再構成されている係数は、p+kpでi=0について、以下の式
【数14】

に従って、新たな照明の変動のパラメータ
【数15】

に基づいてリファインされる。
【0063】
他の変形例によれば、この任意のステップは、N−1でi=0について全ての係数Creciが再構成されたときに一度だけ実現される。
【0064】
ステップ160の間、現在のブロックBcurのN個の係数Creciが再構成されているかがチェックされる。再構成される場合、本方法はステップ180に進み、再構成されていない場合、ステップ170で、pがp=p+kpにインクリメントされ、本方法は、ステップ120に進む。
【0065】
ステップ180の間、変換領域における再構成された係数のブロックCreciは、逆変換により再構成された画素ブロックBrecに変換される。
【0066】
図4は、本発明の特定の実施の形態に係る、現在の画素ブロックBcurを符号化する方法を示す。
【0067】
ステップ200の間、現在のブロックBcurは、i=0...N−1について係数Ccuriに変換される。符号化されるべき現在のブロックの第一の残差係数Cres0は、例えば以下の式
【数16】

に従って計算される。この場合、
【数17】

であり、d0(.)は、変換のインデックス0の基本ベクトルである。ainit及びbinitは、照明の変動のパラメータの初期値である。照明の変動のパラメータのこれらの初期値は、例えば再構成方法に送信されるように符号化されるか、又はさもなければこれらの初期値は、ビデオ符号化規格により予め定義され、すなわち再構成方法について分かっている。参照ブロックBrefの係数Crefiも得られる。参照ブロックBrefは、例えば動きベクトルを使用して画像領域で決定され、次いで、係数Crefiのブロックに変換される。
【0068】
ステップ210の間、pはゼロに初期化される。
【0069】
ステップ220の間、以下の式に従って、i=p+1,...,p+kp,kp>=1及びp+kp<Nとして予測係数Cprediが計算される。
【0070】
【数18】

ステップ230の間、i=p+1,...,p+kpについて残差係数Cres_curiが計算される。
【0071】
【数19】

ステップ240の間、i=p+1,...,p+kpについて再構成された係数Creciは、以下の式に従って、予測係数Cprediと、量子化され、次いで逆量子化された残差係数Cresiから計算される。
【0072】
【数20】

【数21】

であり、Q及びQ-1は、量子化、次いで逆量子化演算をそれぞれ表す。
【0073】
ステップ250の間、パラメータは、a及びbは、再構成された係数Creciと、p+kpでのi=0について参照ブロックにおける対応する係数Crefiとからリファインされる。リファインされたパラメータは、
<外8>

として示される。このステップは、ステップ140に同一である。
【0074】
任意のステップ260の間、既に再構成された係数は、p+kpでi=0について、以下の式
【数22】

に従って、新たな照明の変動のパラメータ
<外9>

に基づいてリファインされる。このステップは、ステップ150と同じである。
【0075】
1つの変形例によれば、N−1でi=0について全ての係数Creciが再構成されたときに、この任意のステップ260が1度だけ実現される。
【0076】
ステップ270の間、変換された残差ブロックの全ての残差係数Cresiが計算されたかがチェックされる。全ての残差係数が計算された場合、本方法がステップ290に進み、全ての残差係数が計算されていない場合、ステップ280で、p=p+pkにpがインクリメントされ、本方法は、ステップ220に進む。
【0077】
ステップ290の間、残差係数Cres_curiが符号化され、エントロピー符号化によりストリームFに符号化される。次いで、変換領域で再構成された係数のブロックCreciは、逆変換により再構成された画素ブロックBrecに変換される。この画素ブロック自身は、ビデオ予測において典型的に行われているように、その後に空間的又は時間的に参照として使用することができる。
【0078】
これらの符号化及び再構成方法は、信号特性の局所的な変動、特に照明の変動に対する永続的且つより正確な適応を可能にする。さらに、これらの方法によれば、明示的な局所的な照明の変動のパラメータをそれぞれ符号化、復号化する必要がない。
【0079】
予測モデルをリファインするステップ140及び240は、Bpred(x,y)=a+b.Bref(x,y)のタイプの線形モデル以外のモデルに適用することができる。本発明は、他のモデルBpred(x,y)=f[Bref(x,y)]に一般化することができ、この場合、f[.]は、ビデオ信号の時間的な変動を表す関数である。
【0080】
また、本発明は、図5を参照して記載される符号化装置12、及び図6を参照して記載される復号化装置13に関するものであり、これらの構成は、照明の変動のパラメータをリファインするために、変換領域における予測を演算するために変更される。これらの図において、グレイで網掛けしたモジュールは、標準的な符号化及び復号化スキームに関して追加又は変更されたモジュールである。図5及び図6では、図示されるモジュールは、物理的に区別可能なユニットに対応するか又は対応しない機能ユニットである。例えば、これらのモジュール又はこれらのモジュールのうちの幾つかは、1つのコンポーネントで互いにグループ化されるか、同じソフトウェアの機能を構成する。反対に、幾つかのモジュールは、個別の物理的なエンティティから構成される。
【0081】
図5を参照して、符号化装置12は、ある画像の系列に属している入力画像を受信する。それぞれの画像は、画素ブロックBcurに分割され、画素ブロックのそれぞれと、ピクチャデータの少なくとも1つのアイテムが関連付けされる。符号化装置12は、特に、時間予測による符号化を実現する。時間予測による符号化又はINTER符号化に関連する符号化装置12のモジュールのみが図3で表される。表現されず且つビデオコーダの分野における当業者にとって知られている他のモジュールは、空間予測あり又はなしでINTRA符号化を実現する。符号化装置12は、特に、現在のブロックBcurを変換されたブロックCcurに変換することができるTを変換するモジュール1100、及び、例えば
現在により、係数毎に、変換ブロックCcurから予測ブロックCpredを抽出して、変換領域において残差ブロックCres_curを生成することができる計算モジュール1200を有する。変換Tは、例えば離散コサイン変換(又はDCT)である。また、変換Tは、変換領域で計算された残差ブロックを量子化された係数に量子化することができるモジュール1202を備える。また、符号化装置12は、量子化された係数をストリームFに符号化することができるエントロピー符号化モジュール1204を有する。符号化装置12は、モジュール1202に対する逆演算を実行するモジュール1206を備える。モジュール1206は、逆量子化IQを実行して、逆量子化される残差係数Cresを生成する。モジュール1206は、係数毎に、例えば加算により、モジュール1206からの残差係数ブロックCresと予測ブロックCpredとをマージして、変換領域Crecにおいて再構成されたブロックを生成することができる計算モジュール1208に接続される。計算モジュール1208は、変換領域において再構成されたブロックCresを、メモリ1212に記憶されている、Brecとして示される再構成された画像データブロックに変換することができる逆変換モジュール1210に接続される。
【0082】
符号化装置12は、ブロックBcurとメモリ1212に記憶される参照ピクチャIrefのブロックとの間の少なくとも1つの動きベクトルを予測することが可能な動き予測モジュール1214を更に有する。この参照ピクチャは、前に符号化され、次いで再構成されている。1つの変形例によれば、動き予測は、現在のブロックBcurとオリジナルの参照画像Icurとの間で行われ、この場合、メモリ1212は、動き予測モジュール1214に接続されない。当業者に知られている方法によれば、動き予測モジュールは、現在のブロックBcurと、動きデータのアイテムを使用して識別された参照画像Irefにおけるブロックとの間で計算されたエラーを最小にするように、参照画像Irefにおいて、動きデータのアイテム、特に動きベクトルをサーチする。
【0083】
動きデータの決定されたアイテムは、動き予測モジュール214により、予め決定された符号化モードのセットにおけるブロックBcurの符号化モードを選択可能な決定モジュール1216に送信される。選択された符号化モードは、例えばビットレートの歪みのタイプの基準を最小にするモードである。しかし、本発明は、この選択モードに限定されるものではなく、例えば先験的なタイプの基準といった別の基準に従って、保持されるモードを選択することができる。
【0084】
決定モジュール1216により選択される符号化モードは、例えば時間予測モード又はINTERモードの場合における動きデータといった、動きデータと同様に、動き補償モジュール1218に送信される。選択された符号化モード、及び必要に応じて動きデータは、エントロピー符号化モジュール1204に送信され、ストリームFに符号化される。動き補償モジュール1218は、決定モジュール1216により決定された符号化モードと、おそらく動き予測モジュール1214(画像間予測)により決定された動きデータとから、参照ブロックBrefを決定する。動き補償モジュール1218は、変換モジュール1100と同じ変換モジュール1220に接続される。変換モジュール1220は、画像領域で得られた参照ブロックBrefを変換された参照ブロックCrefに変換可能である。変換モジュール1220は、照明の変動のパラメータから予測ブロックCpredを生成可能な予測計算モジュール1222に接続される。また、変換モジュール1220は、符号化方法のステップ250に従って照明の変動のパラメータをリファイン可能なモジュール1224、及び任意に符号化方法のステップ260に従って、リファインされた照明の変動のパラメータに基づいて既に再構成された係数をリファイン可能なモジュール1226に接続される。
【0085】
図6を参照して、復号化モジュール13は、画像の系列を表す符号化データのストリームFを入力で受信する。ストリームFは、例えばチャネルを介して符号化装置12に送信される。復号化装置13は、例えば符号化モードといった復号化データ、及び画像のコンテンツに関連する復号化データを生成可能なエントロピー復号化モジュール1300を有する。
【0086】
復号化装置13は、動きデータ再構成モジュールを更に有する。第一の実施の形態によれば、動きデータ再構成モジュールは、エントロピー復号化モジュール1300であり、前記動きデータを表すストリームFの一部を復号化する。図6に示されない変形例によれば、動きデータ再構成モジュールは、動き予測モジュールである。復号化装置13を介して動きデータを再構成するこのソリューションは、「テンプレートマッチング」として知られる。
【0087】
次いで、画像のコンテンツに関して復号化されたデータは、逆量子化を実行して残差係数Cresを生成可能なモジュール1302に送信される。モジュール1302は、符号化さえたストリームFを生成した符号化装置12のモジュール1206と同じである。モジュール1302は、係数毎に、例えば加算により、モジュール1302からの残差係数Cresのブロックと予測ブロックCpredとをマージして、変換領域において再構成された現在ブロックCresを生成可能な計算モジュール1304に接続される。変換領域において再構成された現在ブロックCrecは、符号化装置のモジュール1210と同じである逆変換モジュール1306により画像領域において再構成されたブロックBrecに変換される。逆変換モジュール1306は、メモリ1308に接続され、メモリにおいて、画像領域において再構成されたデータが特に記憶される。復号化装置13は、動き補償モジュール1310を更に有する。動き補償モジュール1310は、エントロピー復号化モジュール1300により現在のブロックについて復号化された符号化モードから、及びおそらく動きデータ再構成モジュールにより決定された動きデータから参照ブロックBrefを決定する。動き補償モジュール1310は、符号化装置の変換モジュール1220と同じ変換モジュール1312に接続される。変換モジュール1312は、画像領域において得られた参照ブロックBrefを変換された参照ブロックCrefに変換可能である。変換モジュール1312は、照明の変動パラメータからリファインされた予測ブロックCpredを生成可能な予測計算モジュール1314に接続される。また、変換モジュール1312は、再構成方法のステップ140に従って照明の変動のパラメータをリファイン可能なリファイニングモジュール1316、及びおそらく再構成方法のステップ150に従って、リファインされた照明の変動のパラメータに基づいて既に再構成された係数をリファイン可能なモジュール1318に接続可能である。
【0088】
本発明に係る符号化及び復号化装置は、例えばハードウェア、ソフトウェア、ファームウェア、特定用途向けプロセッサ又はそれらの組み合わせといった様々な形式で実現される。好ましくは、本発明は、ハードウェアとソフトウェアの組み合わせとして実現される。さらに、ソフトウェアは、プログラム記録媒体で実施されるアプリケーションプログラムとして実現されることが好ましい。アプリケーションプログラムは、任意の適切なアーキテクチャにアップロードされる、マシンにより実行される場合がある。好ましくは、マシンは、1以上の中央処理ユニット(CPU)、ランダムアクセスメモリ(RAM)、及び入力/出力(I/O)インタフェースのようなハードウェアを有するコンピュータプラットフォームで実現される。また、コンピュータプラットフォームは、オペレーティングシステム及びマイクロ命令コードを含む。本明細書で記載された様々なプロセス及び機能は、マイクロ命令コードの一部又はオペレーティングシステムを介して実行されるアプリケーションプログラム(或いはこれらの組み合わせ)の何れかである。さらに、様々な他の周辺装置は、更なるデータ記憶装置及び印刷装置のようなコンピュータプラットフォームに接続される場合がある。
【0089】
変形例に拠れば、本発明に係る符号化及び復号化装置は、例えば(例えばASIC(特定用と向け集積回路)のような)専用コンポーネント又はFPGA(フィールドプログラマブルゲートアレイ)又はVLSI(超大型集積回路)、或いはある装置に集積される幾つかの電子コンポーネントの形式で純粋なハードウェア実装に従って実現されるか、或いはハードウェアエレメントとソフトウェアエレメントの混合の形式で実現される場合がある。
【符号の説明】
【0090】
12 :符号化装置
1100:変換モジュール
1200:計算モジュール
1202:量子化モジュール
1204:エントロピー符号化モジュール
1206:逆量子化モジュール
1208:計算モジュール
1210:逆変換モジュール
1212:メモリ
1214:動き予測モジュール
1216:決定モジュール
1218:動き補償モジュール
1220:変換モジュール
1222:予測計算モジュール
1224:リファインモジュール
1226:リファインモジュール
13 :復号化装置
1300:エントロピー復号化モジュール
1302:逆量子化モジュール
1304:計算モジュール
1306:逆変換モジュール
1308:メモリ
1310:動き補償モジュール
1312:変換モジュール
1314:予測計算モジュール
1316:リファインモジュール
1318:リファインモジュール

【特許請求の範囲】
【請求項1】
Nを整数としてN個の画素からなる現在のブロックを再構成する方法であって、
N個の残差係数を復号化して逆量子化するステップと、
N個の参照係数を決定するステップと、
前記N個の残差係数と、少なくとも1つの照明の変動のパラメータにより定義される照明の変動のモデルを使用することで、前記N個の参照係数から決定されたN個の予測係数とから、前記現在のブロックについてのN個の係数を繰り返し再構成するステップと、前記照明の変動のパラメータは、kを整数とし且つ1≦k≦Nとして、前記現在のブロックのついてk個の係数のそれぞれの再構成に関してリファインされ、
再構成されたN個の係数をN個の画素からなる現在のブロックに変換するステップと、
を含むことを特徴とする再構成方法。
【請求項2】
前記現在のブロックについての前記N個の係数を再構成するステップは、
a)前記照明の変動モデルを考慮することで、前記参照係数からk個の最初の予測係数を計算するステップと、
b)k個の最初の残差係数と、計算されたk個の最初の予測係数とから再構成されるk個の係数を計算するステップと、
c)既に再構成された全ての係数と、対応する参照する係数とから、前記少なくとも1つの照明の変動のパラメータをリファインするステップと、
d)再構成されたN個の係数の計算まで、k個の後続の係数により前記ステップa)からステップc)を繰り返すステップと、
を含む請求項1記載の再構成方法。
【請求項3】
前記ステップc)と前記ステップd)の間で、前記ステップc)でリファインされた前記少なくとも1つの照明の変動パラメータと、前記対応する参照係数とから既に再構成された全ての係数をリファインするステップを含む、
請求項1記載の再構成方法。
【請求項4】
前記kの値は1に等しい、
請求項2又は3記載の再構成方法。
【請求項5】
前記kの値は、ある繰返しのときの値と他の繰り返しのときの値とで変化する、
請求項2又は3記載の再構成方法。
【請求項6】
前記kの値は、ゼロの残差係数により分離された2つの非ゼロの残差係数の間の距離に等しい、
請求項5記載の再構成方法。
【請求項7】
前記kの値は、閾値よりも小さい残差係数により分離される、前記閾値よりも大きい2つの残差係数の間の距離に等しい、
請求項5記載の再構成方法。
【請求項8】
リファインされた前記少なくとも1つの照明の変動のパラメータは、量子化雑音の分散により重み付けされた二次誤差を最小化することで決定され、
前記二次誤差は、前記再構成された係数と前記対応する参照係数との間で計算される、
請求項1乃至7の何れか記載の再構成方法。
【請求項9】
Nを整数としてN個の画素からなる現在のブロックを符号化する方法であって、
前記現在のブロックをN個の現在の係数に変換するステップと、
N個の参照係数を決定するステップと、
前記N個の現在の係数と、少なくとも1つの照明の変動のパラメータにより定義される照明の変動のモデルを使用することで前記N個の参照係数から決定されるN個の予測係数とから、N個の残差係数を繰り返し計算するステップと、前記照明の変動のパラメータは、kを整数とし且つ1≦k≦Nとして、前記現在のブロックのk個の係数のそれぞれの再構成に関してリファインされ、
前記N個の残差係数を量子化及び符号化するステップと、
を含むことを特徴とする符号化方法。
【請求項10】
前記N個の残差係数を計算するステップは、
a)前記照明の変動のモデルを考慮することで、前記参照係数からk個の最初の予測係数を計算するステップと、
b)k個の最初の現在の係数と、計算されたk個の最初の予測係数とから、k個の残差係数を計算するステップと、
c)k個の最初の量子化、次いで逆量子化された残差係数と、計算されたk個の最初の予測係数とから再構成されたk個の係数を計算するステップと、
d)既に再構成された全ての係数と、対応する参照係数とから前記少なくとも1つの照明の変動のパラメータをリファインするステップと、
e)前記N個の残差係数の計算まで、k個の後続の係数により前記ステップa)から前記ステップd)を繰り返すステップと、
を含む請求項6記載の符号化方法。
【請求項11】
前記ステップd)と前記ステップe)との間で、前記ステップd)でリファインされた前記少なくとも1つの照明の変動のパラメータと、前記対応する参照係数とから既に再構成された全ての係数をリファインするステップを含む、
請求項10記載の符号化方法。
【請求項12】
Nを整数としてN個の画素からなる現在のブロックを表すストリームを復号化する復号化装置であって、
N個の残差係数を復号化して逆量子化する手段と、
N個の参照係数を決定する手段と、
前記N個の残差係数と、少なくとも1つの照明の変動のパラメータにより定義される照明の変動のモデルを使用することで、前記N個の参照係数から決定されたN個の予測係数とから、前記現在のブロックについてのN個の係数を繰り返し再構成する手段と、前記照明の変動のパラメータは、kを整数とし且つ1≦k≦Nとして、前記現在のブロックのついてk個の係数のそれぞれの再構成に関してリファインされ、
再構成されたN個の係数をN個の画素からなる現在のブロックに変換する手段と、
を備えることを特徴とする復号化装置。
【請求項13】
当該復号化装置は、請求項1乃至8の何れか記載の再構成方法のステップを実行する、
請求項12記載の復号化装置。
【請求項14】
Nを整数としてN個の画素からなる現在のブロックを符号化する符号化装置であって、
前記現在のブロックをN個の現在の係数に変換する手段と、
N個の参照係数を決定する手段と、
前記N個の現在の係数と、少なくとも1つの照明の変動のパラメータにより定義される照明の変動のモデルを使用することで前記N個の参照係数から決定されるN個の予測係数とから、N個の残差係数を繰り返し計算する手段と、前記照明の変動のパラメータは、kを整数とし且つ1≦k≦Nとして、前記現在のブロックのk個の係数のそれぞれの再構成に関してリファインされ、
前記N個の残差係数を量子化及び符号化する手段と、
を備えることを特徴とする符号化装置。
【請求項15】
当該符号化装置は、請求項9乃至11の何れか記載の符号化方法のステップを実行する、
請求項14記載の符号化装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate


【公開番号】特開2013−98984(P2013−98984A)
【公開日】平成25年5月20日(2013.5.20)
【国際特許分類】
【外国語出願】
【出願番号】特願2012−236420(P2012−236420)
【出願日】平成24年10月26日(2012.10.26)
【出願人】(501263810)トムソン ライセンシング (2,848)
【氏名又は名称原語表記】Thomson Licensing 
【住所又は居所原語表記】1−5, rue Jeanne d’Arc, 92130 ISSY LES MOULINEAUX, France
【Fターム(参考)】