映像符号化の方法及び装置
映像符号化エンティティ及び映像復号化エンティティにおける方法及び装置。方法及び装置は、符号化映像と関連付けられた参照情報の合同符号化に関する。復号化エンティティにおける方法及び装置は、符号化ブロックBeと関連付けられた単一の構文要素を取得すること(402)と、取得した構文要素に基づいて参照モード及び1つ以上の参照ピクチャを識別すること(404)とに関する。また、方法及び装置は、識別された参照モード及び1つ以上の参照ピクチャに基づいてブロックBeを復号化すること(406)により、画素の復号化ブロックBを提供することに関する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、一般に、映像符号化に関連した情報を符号化する方法及び装置に関する。
【背景技術】
【0002】
映像符号化は、イントラモード及び/又はインターモードで実行される。イントラモードは映像フレーム内の冗長性を利用し、インターモードは映像フレーム間の冗長性を利用する。インターモードにおいて、画の輝度(luma)/クロマ(chroma)予測値は、参照ピクチャと呼ばれる既に符号化/復号化されたピクチャから取得される。予測のために使用された参照ピクチャの数に依存して、インターモードは、それぞれ1つ、2つ及び3つの参照ピクチャが使用される単一方向予測モード(又は単一方向モード)、双方向予測モード(Bモード)及び場合によっては3方向予測モード等に分類される。本明細書内において、3つの異なるモード、すなわち単一方向予測、双方向予測等を「参照モード」と呼ぶ。
【0003】
H.264及びMPEG−4 Part10としても既知である高度映像符号化(AVC)は、ITU−T(国際電気通信連合−電気通信標準化部門)及びMPEG(Moving Picture Experts Group)の2D映像符号化に対する最新の規格である。AVCコーデックは、フレーム間及び1つのフレーム内の冗長性を除去することを利用するハイブリッドコーデックである。
【0004】
AVCにおいて、関連する参照ピクチャの標識は、2つの参照リストに順番に配置される。標識は、参照インデックスで示され、0〜N、例えば(0、1、…、N)の番号が付けられる。主に第1のリストList0(L0)は、過去の参照ピクチャ、すなわち時間的に現在のピクチャに先行する参照ピクチャを管理し、一般に第2のリストList1(L1)は、未来の参照ピクチャ、すなわち時間的に現在のピクチャに後続する参照ピクチャを管理する。低遅延映像符号化の場合、L1は過去の参照ピクチャを更に管理する。各リストは、最大15個の参照ピクチャ、すなわちN=14)のインデックスを保持できる。
【0005】
また、AVCにおいて、参照ピクチャリストのうちの一方(例えば、単一方向予測のため)、あるいは双方の参照ピクチャリスト(例えば、双方向予測のため)の選択を指定する標識又は参照モードインデックスは、マクロブロック(MB)モード/サブMBモードでパーティション構造と共に符号化され、それぞれのリストにおいて選択された参照ピクチャを指定する標識又は参照ピクチャインデックスは、独立した構文要素として符号化される。「パーティション構造」は、例えば16x16のMBの16x16、16x8又は8x16等のパーティションを示す。例えば16x16のパーティションは、一般に、単一方向予測が使用される場合に1つの動きベクトル(MV)及び1つの参照インデックスと関連付けられ、双方向予測が使用される場合に2つのMV及び2つの参照インデックスと関連付けられる。MVは、水平成分MVx及び垂直成分MVyを有し、現在のパーティションの画素が対応する参照ピクチャから生成される方法を記述する。例えば、Ipred(x,y)=Iref(x−MVx,y−MVy)と記述される。
【0006】
ピクチャ又はパーティションと関連付けられた参照ピクチャの数は、同一のパーティションと関連付けられた参照モード、すなわちそれが単一方向予測又は双方向予測であるか等に依存する。復号器において参照情報を復号化する場合、ピクチャ又はパーティションと関連付けられた参照モードインデックス及び1つ以上の参照ピクチャインデックスの双方は、復号器が適切にピクチャ又はパーティションを復号化できるように正確に復号化されなければならない。参照モードインデックス及び1つ以上の参照ピクチャインデックスのうちのいずれかが適切に復号化されなければ、結果として参照情報が誤って解釈される可能性がある。
【0007】
上述したAVCの方法等の参照情報を符号化する現在の方法は、各ブロックと関連付けられた参照情報を搬送するために相対的に多数のビットを必要とする。これは、符号化効率の観点から非効率的であると認識される。
【発明の概要】
【発明が解決しようとする課題】
【0008】
参照情報、すなわち現在のフレームを予測するために使用された1つ以上の参照ピクチャを識別する情報の符号化効率の向上を可能にすることが望ましい。本発明の目的は、参照情報の符号化効率の向上を可能にすることである。また、本発明の目的は、参照情報の改善された符号化を可能にする方法及び装置を提供することである。これらの目的は、添付の独立請求項に記載の方法及び装置により達成される。オプションの実施形態は従属請求項により規定される。以下に説明する予測、符号化及び復号化は、同一のエンティティ又はノード内、あるいは種々のエンティティ又はノードにおいて実行される。
【課題を解決するための手段】
【0009】
第1の態様によれば、映像復号化エンティティにおける方法が提供される。この方法は、符号化ブロックBeと関連付けられた単一の構文要素を取得するステップを備える。この方法は、取得した構文要素に基づいて参照モード及び1つ以上の参照ピクチャを識別するステップと、識別された参照モード及び1つ以上の参照ピクチャに基づいてブロックBeを復号化するステップとを更に有し、画素の復号化ブロックBを提供する。
【0010】
第2の態様によれば、映像復号化エンティティにおける装置が提供される。この装置は、符号化ブロックBeと関連付けられた単一の構文要素を取得するように構成される機能ユニットを備える。この装置は、取得した構文要素に基づいて参照モード及び1つ以上の参照ピクチャを識別するように構成される機能ユニットを更に備える。この装置は、識別された参照モード及び1つ以上の参照ピクチャに基づいてブロックBeを復号化することにより、画素の復号化ブロックBを提供するように構成される機能ユニットを更に備える。
【0011】
第3の態様によれば、映像符号化エンティティにおける方法が提供される。この方法は、参照モード及び1つ以上の参照ピクチャを使用して画素のブロックBを符号化するステップを有し、符号化ブロックBeを提供する。この方法は、参照モード及び1つ以上の参照ピクチャを識別する単一の構文要素(single syntax element)を導出するステップと、単一の構文要素をブロックBeの復号器に提供するステップとを更に備える。
【0012】
第4の態様によれば、映像符号化エンティティにおける装置が提供される。この装置は、参照モード及び1つ以上の参照ピクチャを使用して画素のブロックBを符号化することにより、符号化ブロックBeを提供するように構成される機能ユニットを備える。この装置は、参照モード及び1つ以上の参照ピクチャを識別する単一の構文要素を導出するように構成される機能ユニットを更に備える。この装置は、単一の構文要素をブロックBeの復号器に提供するように構成される機能ユニットを更に備える。
【0013】
上述の方法及び装置は、符号化効率を向上するために使用される。符号化効率は、現在のフレームの予測に使用された1つ以上の参照ピクチャを識別するためにより少ないビットを使用することで向上する。上述の方法及び装置により、誤り耐性の向上が更に可能になる。また、単一の構文要素を形成するように参照情報をまとめることにより、参照インデックス番号を容易に操作できるようになる。また、上述したような構文要素を使用することにより、参照インデックスと参照モードとのいくつかの組合せを効率的に符号化できるようにすることで他の組合せより確率の高いそれらの組合せを利用できるようになる。例えば、より短いコードワードは、参照インデックスと参照モードとのより確率の高い組合せに割り当てられる。
【0014】
上述の方法及び装置は、種々の実施形態において実現される。いくつかの実施形態において、参照モード及び1つ以上の参照ピクチャの識別は、構文要素と参照モード及び1つ以上の特定の参照ピクチャとの事前定義されたマッピングに基づく。いくつかの実施形態において、単一の構文要素は、1つ以上のエンティティを含む第1の事前定義された参照リストにおけるエントリを表す。エントリは、複数の参照ピクチャ又は単一の参照ピクチャを識別し、参照モードを更に識別する。
【0015】
単一の構文要素は、それぞれ、単一の参照ピクチャを識別する1つ以上のエントリを含む第2の事前定義された参照リストにおける参照モード及びエントリを更に表す。
【0016】
リストにおけるエントリは、リストインデックスにより識別される。また、取得した構文要素を表すビット数は、構文要素の特定の値の確率に関連する。
【0017】
いくつかの実施形態において、参照情報は、Be(又はB)の隣接ブロックと関連付けられた単一の構文要素に基づいてBe(又は符号化エンティティにおいてはB)に対して予測される。また、いくつかの実施形態において、マルチ予測と関連付けられたブロックのサブ領域が識別され、そのサブ領域に対して、マルチ予測参照ブロックのそれぞれの対応する領域が相対的に低い相関性を有し、マルチ予測ではなく別の予測が識別されたサブ領域に対して使用される。
【0018】
主に方法の観点から上述の実施形態を説明した。しかし、上述の説明は、装置の実施形態を含むことを更に意図し、上述の機能の性能を可能にするように構成される。上述の例示的な実施形態の種々の特徴は、必要性、要求又は好みに従って種々の方法で組み合わされてもよい。
【0019】
更に別の態様によれば、1つ以上の処理ユニットにおいて実行された時に上述の方法のうちの1つに係る対応する手順を上述の装置のうちのいずれかに実行させるコンピュータ可読コード手段を備えるコンピュータプログラムが提供される。
【0020】
更に別の態様によれば、上述のコンピュータプログラムを含むコンピュータプログラム製品が提供される。
【0021】
次に、実施形態の例を使用し、添付の図面を参照して本発明を更に詳細に説明する。
【図面の簡単な説明】
【0022】
【図1】図1は、従来技術に係る参照情報表現から一実施形態の例に係る参照情報表現への変換を示す概略図である
【図2】図2は、実施形態の一例に従って、AVC参照インデックス表現と参照インデックス表現との差分を示すテーブルである。
【図3】図3は、実施形態の一例に従って、参照情報標識の割り当てを示す概略図である
【図4】図4は、実施形態の一例に従って、映像復号化エンティティにおいて参照モード及び1つ以上の参照ピクチャに関連した合同符号化された情報を復号化する手順を示すフローチャートである。
【図5】図5は、実施形態の一例に従って、映像復号化エンティティにおいて参照モード及び1つ以上の参照ピクチャに関連した合同符号化された情報を復号化するように構成された装置を示すブロック図である。
【図6】図6は、実施形態の一例に従って、映像符号化エンティティにおいて参照モード及び1つ以上の参照ピクチャに関連した情報を合同符号化する手順を示すフローチャートである。
【図7】図7は、実施形態の一例に従って、映像符号化エンティティにおいて参照モード及び1つ以上の参照ピクチャに関連した情報を合同符号化するように構成された装置を示すブロック図である。
【図8】図8は、実施形態の一例に従って、映像符号化/復号化エンティティにおける装置を示す概略図である。
【図9】、
【図10】図9及び図10は、例示的な実施形態に従って、現在のブロックの隣接画素と関連付けられた参照モードと1つ以上の参照ピクチャとの種々の組合せの発生頻度を判定することを示す概略図である。
【図11】図11は、従来技術に従って、標識(コードワード)を種々のインデックス記号に割り当てることを示す概略図である。
【図12】図12は、例示する一実施形態に従って、標識(コードワード)を割り当てることを示す概略図である。
【図13】図13は、例示する一実施形態に従って、黙示的な情報に基づいて分割することを示す概略図である。
【発明を実施するための形態】
【0023】
簡単に説明すると、参照情報、すなわち参照モード及び参照ピクチャを表し、搬送する新しい手順がインター予測符号化及び復号化に対して提供される。この手順を参照インデックス信号伝送、すなわち参照情報標識信号伝送(Reference information Indicator Signaling:RIS)と呼ぶ。
【0024】
本明細書内において、「ブロックXの隣接ブロック」という用語は、ブロックXに隣接するブロック、すなわちブロックXに近接するか又はブロックXの近傍に配置されるブロックを示すものとして使用される。また、本明細書内において、「ブロック」という用語は、画素の単位を示すものとして使用される。「参照ピクチャ」又は「参照ブロック」という用語は、以前に符号化/復号化されたピクチャ、ピクチャのブロック、ピクチャの領域(region)又はピクチャのエリアを示すものとして使用される。ここで、ピクチャ、ブロック、領域等は、予測のために参照として使用される。
【0025】
RISを使用する場合、例えばAVC等のようにパーティション構造の標識と密接に関連する参照モードの標識を符号化し且つ参照ピクチャの標識を別個に符号化するのではなく、符号化ブロックと関連付けられた参照モードの標識及び参照ピクチャの標識は、「1つの場所において共にまとめられ」、すなわち合同符号化される。参照モード及び参照ピクチャ、すなわち参照情報の標識の合同符号化の結果、単一の構文要素又は標識は、満足のいく方法で符号化ブロックを復号化するために、必要な参照モード及び参照ピクチャに関する全ての情報を表す。すなわち、この単一の構文要素が符号化ブロックに対して与えられると、復号器は、ブロックを復号化するために必要な参照ピクチャを識別できるはずである。「構文要素(syntax element)」は、「構文単位(syntax unit)」、「合同指示単位(joint indication unit)」又は「合同識別単位(joint identification unit)」等でも示される。
【0026】
RISを記述する1つの方法は、例えば2つの独立したリストを使用する参照情報のAVC表現等の従来の表現からRISに従う参照情報の例示的な表現への「変換」、すなわちマッピングを記述することである。図1に示されるように、そのようなRIS表現への変換は、基本的に3つのステップで実行される。
【0027】
第1のステップ102は、複数のインデックスリストから単一の参照インデックスリストを形成することである。例えば、AVCのように2つの参照インデックスリストを管理するのではなく、全ての参照ピクチャインデックスは、AVCの2つのリストの代わりとして又はそれを補完するものとして、ある特定の順序で単一の合同リストに格納される。これを図1に示す。図中、ピクチャ参照インデックスリストL0及びL1がインタリーブされて新しいリストLRISにマージ又は多重化される。また、第2のステップ104において、インデックス番号は、新しいリストLRISにおいて連続した番号、すなわち0〜5に従うように再度割り当てられる。
【0028】
ステップ104の後のリストLRISにおけるインデックス番号又はエントリは、参照モード(逆方向又は順方向の単一方向予測)及び参照ピクチャの双方に関する情報を表す。LRISにおけるエントリに対するインデックスは、「RISインデックス」又は「インデックスパラメータ」等で示される。この例においてステップ104の後のLRISにおけるRISインデックス番号0〜5は、4つの過去のピクチャ(元々はL0=(0、1、2、3)における)及び2つの未来のピクチャ(元々はL1=(0、1)における)からの単一方向予測を表す。
【0029】
また、双方向予測を示す1つ以上のリストエントリは、挿入又は追記等によりLRISに追加される。従って、双方向予測を表すエントリを示すRISインデックスは、単一の参照ピクチャではなく、2つの参照ピクチャを指し示す。従って、RISインデックスは、参照モードと1つ以上の参照ピクチャとの組合せを識別可能である。
【0030】
その結果、最後のステップ106において、2つの参照ピクチャが予測のために使用される双方向予測モードに関連したエントリは、LRISに連続的に追記され、RISインデックスにより示されるかあるいは表される。例えば、RISインデックス番号7を有するエントリは、現在のピクチャが双方向予測参照としてピクチャ番号0及びピクチャ番号1を使用していることを信号伝送するかあるいは意味するように設定される。従って、この情報はRISインデックス7に固有である。インデックス番号8は、現在のピクチャが双方向予測参照としてピクチャ番号0及びピクチャ番号2を使用していることを意味するように設定される。同様に、リストLRISは、例えば3方向予測を表すエントリにより更に拡張され、3つの参照ピクチャを識別する。
【0031】
あるいは、最初に双方向予測モードに関連したエントリが追加、例えば挿入又は追記され、次にインデックス番号がそれに応じて再度割り当てられるように、ステップ104及びステップ106は逆の順序で実行されてもよい。上述したように、双方向予測モードに関連したエントリは、例えば単一方向予測に関連したエントリ間に更に挿入され、これはステップ104を補完するもの又はその代わりとして、挿入後にインデックス番号を再度割り当てることを必要とする。この例において、マッピングは、種々のエントリのインデックスが参照モード及び1つ以上の参照ピクチャを表す単一の参照リストで表される。尚、これはオプションの一例にすぎず、マッピングはいくつかのステップを含み、例示された種類の明示的なリスト又はレコードはマッピングを実行するために必要ない。
【0032】
実施形態の一例に従って、AVC参照インデックス表現とRISインデックス表現との差分の一例を図2のテーブル示す。この例においては、現在のピクチャを符号化するために使用可能な4つの参照ピクチャがあり、そのうちの2つの参照ピクチャが過去の参照ピクチャであり、2つの参照ピクチャが未来の参照ピクチャであると仮定する。このRIS表現の例において、すなわちインデックス0、1、3及び4は、それぞれの4つの参照ピクチャのうちの1つから単一方向予測を示すように設定される。インデックス2及び5は、4つの参照ピクチャのそれぞれの対から双方向予測を示すように設定される。尚、パーティションに関連した情報が例えば「INTER_16x16_L0」等の参照モードインデックスと共に符号化されるため、参照インデックスのAVC信号伝送(AVC-signaling)はこの情報を更に含む。しかし、これは図2に示されない。
【0033】
図2のテーブルに示された例において、双方向予測を示すかあるいは表すRISインデックスのうちのいくつかは、「最近接する」単一方向予測RISインデックスの直後に配置される。すなわち、単一方向予測を表すインデックスとインタリーブされる。このRISインデックス表現は、いわゆる7B階層のGOP(7B hierarchical Group Of Pictures)(BGOP)を示す図3に更に示される。図3において、いわゆる「現在のフレーム」、すなわち符号化されるフレームは、7B GOPにおけるフレーム3である。図3に示されたRISインデックスは、図2のテーブルにおけるRISインデックス0〜7に対応する。別のRIS表現は、図1に示された例のように、RISインデックス0〜3が単一方向予測を示すようにするものであり、後続のRISインデックスは双方向予測を示す。
【0034】
RISインデックス又はRISパラメータの意味を規定する方法は、本明細書内において与えられた例に限定されない。例えば数式は、例えば双方向予測RISインデックスに対して2つの参照ピクチャインデックスの識別を返送し、単一方向RISインデックスに対して1つの参照ピクチャインデックスを識別する2つの変数f(RIS_index,current_frame_num)を含む関数等のRISインデックスの意味を解釈するように規定される。一例において、current_frame_numは、7BピクチャのBGOP内部のフレーム番号に対応する。この場合、0は表示順序が最初のフレームであり、8はBGOPにおいて最後のフレームである。別の例において、RISインデックスは、常に式を使用して割り当てられる。
順方向:refidx0
範囲:[0〜L0_len−1]
逆方向:L0_len+refidx1
範囲:[L0_len〜L0_len+L1_len−1]
Bi:(L0_len+L1_len)+refidx0*L1_len+refidx1
範囲:[L0_len+L1_len〜L0_len+L1_len+L0_len*L1_len−1]
ここで、refidx0及びrefidx1は、それぞれ、参照リストL0及びL1へのインデックスである。L0_len及びL1_lenは、それぞれ、リストL0及びL1の長さである。
【0035】
あるいは、テーブルは、双方向予測の場合は2つの対応する単一方向インデックス及び単一の予測の場合は1つの単一方向インデックスとRISインデックスを一致させるために使用される。どの方法を選択するかは、ハードウェア/ソフトウェアの制約等に依存する。
【0036】
しかし、構文要素を導出するために使用される方法に関係なく、符号器が適切な構文要素を導出及び提供でき、復号器が構文要素を適切に解釈することで当該符号化ブロック又は符号化フレームを復号化するために必要な関連情報を識別できるように、方法は符号器及び復号器の双方に対して既知であるべきである。
【0037】
RISインデックスは、フレームレベル、高いMBレベル、MBレベル又はサブMBレベル等の種々のレベルの映像符号化に適用できる。
【0038】
手順の例、図4、復号化
次に、図4を参照して、参照情報を搬送する手順の復号化部分の一実施形態を説明する。この手順は、映像復号器又は映像復号器に加えて更なる機能ユニットを備えるエンティティである映像復号化エンティティにおいて実行される。最初に、符号化ブロックBeと関連付けられた単一の構文要素が動作402で取得される。単一の構文要素は、「ビットストリーム」におけるシンボル、すなわち映像シーケンス等の符号化表現等の単位又はビットストリームから復号化される単位である。構文要素は、例えばRISインデックス等の参照情報に対応する番号を表す1ビット以上である。通常、より一般的でないRISインデックスを表すために使用されるビット数と比較して少ないビットが相対的に一般的であるRISインデックスを表すために使用される。構文要素は、ビットストリームから復号化され、それが表すRISインデックス等の番号を取得する。例えば復号化は、CABAC(コンテキスト対応2値算術符号化)等のVLC(可変長符号化)又は算術符号化に従って実行される。
【0039】
次に、動作404において、ブロックBeを復号化する際に使用される参照モード及び1つ以上の参照ピクチャは、取得した構文要素に基づいて識別される。識別された参照モード及び1つ以上の参照ピクチャは、符号器においてブロックを符号化する際に使用されたモード及び参照ピクチャに対応する。識別は、構文要素が与えられたとすると、マッピングテーブル、参照リスト、あるいは他の事前定義された情報又は関数を使用して構文要素をデマッピング、解読(deciphering)又は「復号化」すること等を含む。マッピングテーブル、参照リスト、あるいは他の事前定義された情報又は関数を使用することにより、参照モード及び1つ以上の参照ピクチャが識別される。また、必要な参照モード及び1つ以上の参照ピクチャを識別した場合、従来の方法を使用して取得されると仮定される符号化ブロックBeは、動作406で復号化される。
【0040】
単一の構文要素は、各々が1つ以上の参照モード及び1つ以上の参照ピクチャを表すかあるいは識別する複数のエントリを含む参照リストにおけるエントリの標識又はインデックスであり、例えばRISインデックスで示される。あるいは、構文要素は、ルックアップテーブルにおいてエントリに対応するコードワードである。ルックアップテーブルは、AVCにおいて例えばL0及びL1等の1つ以上の参照リストの参照モード及び1つ以上のエントリ等にコードワードをリンクする。参照モードは、ブロックを復号化するために使用されるべき単一の参照リスト又は複数の参照リストを規定する。
【0041】
装置の例、図5、復号化
以下において、図5を参照して、復号化の上述の手順を実行できるように構成された装置500の一例を説明する。この装置は、映像復号器か、あるいは映像復号器に加えて例えばコンピュータ、移動端末又は映像専用デバイス等の更なる機能ユニットを備えるエンティティである映像復号化エンティティ501内に配置されるものとして示される。この装置500は、あらゆる種類の有線通信又は無線通信のための従来の手段を備えると考えられる通信ユニット502を介して他のエンティティと通信するように更に示される。復号化される符号化映像は、取得ユニット504により通信ユニット502又はメモリから取得されると仮定され、符号化ブロックは、復号化ユニット508において復号化されると仮定され、この場合、機能ユニット508は従来の復号化方法を使用する。
【0042】
取得ユニット504は、符号化ブロックBeと関連付けられた単一の構文要素を取得するように構成される。装置500は、取得した構文要素に基づいて、ブロックBeを復号化する際に使用される参照モード及び1つ以上の参照ピクチャを識別するように構成される識別ユニット506を更に備える。上述したように、装置500は、判定された参照モード及び参照ピクチャに基づいてブロックBeを復号化するように構成されることにより、復号化された画素ブロックBを提供する復号化ユニット508を更に備える。
【0043】
この装置において、構文要素は、各々が1つ以上の参照モード及び1つ以上の参照ピクチャを表すかあるいは示す複数のエントリを含む参照リストにおけるエントリの標識又はインデックスである。あるいは、装置は、構文要素がルックアップテーブルにおいてエントリに対応するコードワードである別の例に適応する。ルックアップテーブルは、AVCにおいて例えばL0及びL1等の1つ以上の参照リストの参照モード及び1つ以上のエントリ等にコードワードをリンクする。
【0044】
映像復号化エンティティ501は、復号化映像を表示するように構成された表示ユニット510等を更に備えても良い。
【0045】
手順の例、図6、符号化
次に、図6を参照して、参照情報を搬送する手順の符号化部分の一実施形態を説明する。この手順は、映像符号器又は映像符号器に加えて更なる機能ユニットを備えるエンティティである映像符号化エンティティにおいて実行される。最初に、画素のブロックBは、参照モード及び1つ以上の参照ピクチャを使用して動作602で符号化され、符号化ブロックBeを提供する。
【0046】
次に、単一の構文要素が、符号化のために使用された参照モード及び1つ以上の参照ピクチャに基づいて動作60にてで導出される。それにより、構文要素は、ブロックBを符号化するために使用された参照モード及び1つ以上の参照ピクチャを直接又は間接的に識別する。例えば構文要素は、事前定義された参照リストにおいて使用された参照モード及び参照ピクチャに対応するリストエントリを配置し、次に構文要素を構成するように前記エントリのインデックス番号を設定することで導出される。あるいは、事前定義されたマッピングテーブル又はルックアップテーブルは、参照モード及び参照ピクチャの種々の組合せと種々の構文要素との間のマッピングを提供する。更に構文要素は、参照モード標識及び1つ以上の参照ピクチャ標識を返送する事前定義された関数への引数である。例えば、そのような「引数」構文要素は、参照モード標識及び1つ以上の参照ピクチャ標識を引数として解釈し、単一の構文要素を返送する事前定義された「逆関数」を使用して導出される。
【0047】
また、導出された構文要素は、動作606において、ブロックBeと関連付けてブロックBeの復号器に提供される。従って、参照情報、すなわちブロックBを符号化する際に使用され且つ符号化ブロックBeを復号化する際にも使用される参照モード及び1つ以上の参照ピクチャに関する情報は、簡潔に且つ誤り耐性を有して復号器に搬送される。例えば構文要素は、無線チャネルを介して復号器を備えるエンティティ又はノードに送信されることで提供される。また、例えば構文要素は、関連付けられた符号化映像と共にメモリに格納され、別の時点で復号化エンティティによりアクセスされる。
【0048】
装置の例、図7、符号化
以下において、図7を参照して、符号化に関連した上述の手順を実行できるように構成された装置700の一例を説明する。この装置は、映像符号器か、あるいは映像符号器に加えて例えばコンピュータ、移動端末又は映像専用デバイス等の更なる機能ユニットを備えるエンティティである映像符号化エンティティ701内に配置されるものとして示される。この装置700は、あらゆる種類の有線通信又は無線通信のための従来の手段を備えると考えられる通信ユニット(不図示)を介して他のエンティティと通信する。符号化される非符号化映像は、通信ユニット又はメモリ等から取得されると仮定される。
【0049】
装置700は、参照モード及び1つ以上の参照ピクチャを使用して画素のブロックBを符号化するように構成されることにより、符号化ブロックBeを提供する符号化ユニット702を備える。装置700は、ブロックBを符号化する際に使用された参照モード及び1つ以上の参照ピクチャを直接又は間接的に識別する単一の構文要素を導出するように構成される導出ユニット704を更に備える。インデックス要素は、種々の方法で導出され、上述したように例えばインデックス又はコードワード等の標識である。
【0050】
装置700は、場合によっては通信ユニットを介して単一の構文要素をブロックBeの復号器に提供するように構成される提供ユニット706を更に備える。例えば単一の構文要素は、無線チャネルを介して復号器を備えるエンティティ又はノードに送出されることで提供されてもよい。
【0051】
装置の例、図8
図8は、映像復号化エンティティにおいて装置800の一実施形態を概略的に示す。更に図8は、図5に示された映像復号化エンティティにおいて復号化する装置の一実施形態を開示する別の方法である。ここで、装置800は、DSP(デジタル信号プロセッサ)等を含む処理ユニット806を備える。処理ユニット806は、本明細書において説明した手順の種々の動作を実行する単一のユニット又は複数のユニットである。装置800は、他のエンティティから信号を入力する入力ユニット802及び他のエンティティに信号を提供する出力ユニット804を更に備える。入力ユニット802及び出力ユニット804は、統合されたエンティティとして構成される。
【0052】
更に装置800は、EEPROM(電気的消去可能プログラマブル読み出し専用メモリ)、フラッシュメモリ及びハードドライブ等の不揮発性メモリの形態の少なくとも1つのコンピュータプログラム製品808を備える。コンピュータプログラム製品808は、装置800の処理ユニット806において実行される場合に図4に関連して上述した手順の動作を装置及び/又は映像復号化エンティティに実行させるコード手段を備えるコンピュータプログラム810を含む。
【0053】
コンピュータプログラム810は、コンピュータプログラムモジュールにおいて構成されたコンピュータプログラムコードとして構成される。従って、説明した実施形態の例において、装置800のコンピュータプログラム810のコード手段は、例えばデータ送信エンティティ又はメモリ等の記憶装置から発生するビットストリームから符号化映像ユニット/ブロックを復号化することにより、符号化映像ユニット/ブロックと関連付けられた単一の構文要素を取得する取得モジュール810aを備える。コンピュータプログラムは、取得した構文要素に基づいて参照モード及び1つ以上の参照ピクチャを識別する識別モジュール810bを更に備える。コンピュータプログラム810は、符号化ブロックを復号化する復号化モジュール810cを更に備える。
【0054】
モジュール810a〜810cは、図5に示された映像復号化エンティティにおける装置をエミュレートするために、実質的に図4に示されたフローの動作を実行する。換言すると、種々のモジュール810a〜810cは、処理ユニット806において実行される場合に図5のユニット502〜506に対応する。
【0055】
同様に、図7に示された装置に対応する代替例も可能である。
【0056】
図8に関連して上述した実施形態におけるコード手段は、処理ユニットにおいて実行される場合に上述の図に関連して上述した動作を装置及び/又は映像処理/提示エンティティに実行させるコンピュータプログラムモジュールとして実現されるが、コード手段のうちの少なくとも1つは、別の実施形態においてハードウェア回路として少なくとも部分的に実現されてもよい。
【0057】
プロセッサは、単一のCPU(中央処理装置)であるが、2つ以上の処理ユニットを更に備えてよい。例えばプロセッサは、汎用マイクロプロセッサと、命令セットプロセッサ及び/又は関連したチップセット、並びに/あるいはASIC(特定用途向け集積回路)等の専用マイクロプロセッサとを備える。プロセッサは、キャッシュするためにボードメモリを更に備える。コンピュータプログラムは、プロセッサに接続されたコンピュータプログラム製品により保持される。コンピュータプログラム製品は、コンピュータプログラムを格納するコンピュータ可読媒体を備える。例えば、コンピュータプログラム製品は、フラッシュメモリ、RAM(ランダムアクセスメモリ)ROM(読み出し専用メモリ)又はEEPROMであってもよく、上述のコンピュータプログラムモジュールは、別の実施形態において、データ受信ユニット内のメモリの形態の種々のコンピュータプログラム製品に分散されてもよい。
【0058】
また、既存の映像符号化技術に関する1つの問題は、満足のいく参照モード/参照ピクチャ予測方式が規定又は適用されないことであることが理解される。以下において、そのような予測方式を説明する。例えば、シーンカット/フェージング/フラッシュシナリオにおいて、例えば参照モードと参照ピクチャとの同一の組合せが隣接又は近接するMBの予測のために使用されることが非常に一般的であることが理解される。また、本発明の符号化方法は、隣接MBに対して使用された参照モード/参照ピクチャとの相関性を利用しないことが理解される。以前の解決方法において、MB参照情報を識別する別個の成分は、個々に符号化され、映像復号器に搬送される。
【0059】
MBレベル上の例示する予測方式を以下の通り説明する。例示する予測方式は、符号器及び復号器の双方に適用され、あらゆるブロックサイズに適用できる。
【0060】
現在のMBの符号化/復号化と関連して、符号器/復号器は、MBの「コンテキスト」とも呼ばれる周囲の符号化MBの参照標識を解析するように構成される。これらの周囲のブロックは、現在のブロックの「隣接ブロック」と示される。符号器/復号器は、候補標識又は候補インデックスの集合のうちの各々が隣接ブロックに現れる回数をカウントし、例えば事前定義された方式に従って、最多カウントの標識を予測値又は推定値として選択する。選択された参照標識は、インター予測に関連しているはずである。選択された参照標識は、現在のMBを符号化/復号化する際に使用するのに適した参照ピクチャ(及び参照モード)の予測値又は推定値に設定される。その予測値は、現在のMB自体の解析ではなく、MBの符号化/復号化隣接ブロックに関連する情報の解析から導出される。符号器において、この例では現在のMBを符号化する際に使用される参照ピクチャ(及び参照モード)を選択するために予測値が使用されないため、MBは、このような予測値の選択中に符号化されてもされなくてもよい。復号器において、現在のMBは予測中に符号化される。
【0061】
例示する隣接ブロック参照標識の解析及び推定値の選択を図9に示す。図9に示される例において、現在のブロックの4つの隣接ブロックを考慮する。しかし、方法は、考慮されるブロックの他の集合又は部分集合にも適用可能である。例えば、隣接ブロックの集合の一例は、現在のブロックに対して左ブロック、左上ブロック及び上ブロックから構成される。別の例の集合は、左ブロック及び上ブロックのみを含む。図9において、現在のブロックの隣接ブロックは、それぞれの参照標識又は参照インデックス1、1、2及び0と関連付けられる。従って、参照標識「1」は、隣接ブロックの間に2回出現することにより、最多カウント、すなわち最も高い発生頻度を有する。従って、参照標識「1」は、現在のブロックを符号化する際又は復号器において予測が行われる際に使用されたかあるいは使用される参照ピクチャ(及びモード)の予測値又は推定値、現在のブロックを復号化する際に使用される参照ピクチャ(及びモード)の予測値を表すように選択される。
【0062】
隣接ブロックの間である特定の参照標識の発生回数をカウントする場合、2つ以上の候補は、同一の最多カウント数を有する可能性がある。これを図10に示す。図中、参照標識「1」及び「2」の双方が4回現れる。例えばこれは、事前定義された順序付け方式に従って参照標識を選択することで解決される。例えば、参照標識が図9及び図10に示されるように0〜2の数で表される場合、最も大きい数又は最も小さい数で表された参照標識が予測値として選択される。
【0063】
予測画素値のブロックと、元の画素値のブロック、すなわち符号化される前の元のブロックとの間の差分は、例えばDCT(離散コサイン変換)である変換符号化により符号化される。変換の出力は、その後量子化される変換係数を含む。ブロックと関連付けられた変換係数の数は、所定の量子化に対して、予測ブロックと元のブロックとの一致の程度を反映する。相対的に少ない変換係数は、適切に一致していることを示す。従って、少ない変換係数を有するブロックと関連付けられた参照標識は、より信頼できると考えられる。
【0064】
従って、発生のカウントは、例えば参照ブロックと関連付けられた符号化変換係数に従って更に重み付けされる。上述したように、少ない符号化変換係数を含む隣接ブロックと関連付けられた参照インデックスは、多くの変換係数を含む隣接ブロックと関連付けられた参照インデックスより信頼できる予測値であると考えられるため、参照インデックス予測のためにより大きい重みを割り当てられる。別の例において、符号化係数を含むブロックは、符号化係数を含まないブロック、すなわちスキップされるブロックより大きな重みを有してもよい。別の例において、例えば大きなMBである大きなMVパーティションを有する隣接ブロックと関連付けられた参照インデックスは、より小さなMVパーティションを含む隣接ブロックより信頼できると考えられるため、参照インデックス予測のためにより大きい重みが割り当てられる。2の倍数の重みを使用することは、複雑さの観点で有益である。重み付きカウントは、ルックアップテーブルを使用することによっても実現される。
【0065】
ある参照標識は、他の参照標識より互いにより強く関連する。例えば、合同符号化された参照情報を使用する場合、参照フレームref0及びref1を使用する双方向予測を表す参照標識は、例えば参照フレームref2を使用する単一方向予測を表す参照標識よりref0及びref1のうちのどちらか一方を使用する単一方向予測を表す参照標識とより強く関連する。従って、双方向予測標識をカウントする場合、同一の参照フレームを使用する単一方向予測を表す対応する標識は、ある小さいカウント値、すなわち「完全な一致」に対するカウント値より小さいカウント値で更新される。同様に、ref0及びref1等を使用する単一方向予測を表す参照標識は、他の双方向予測参照標識よりref0及びref1を使用する双方向予測を表す対応する参照標識とより強く関連する。従って、単一方向参照標識をカウントする場合、当該参照フレームが使用されるマルチ予測に対応する参照標識のカウントは、ある小さい値で更に更新される。
【0066】
図10は、現在のブロックの隣接画素と関連付けられた参照標識をカウントすることにより、現在のブロックに対するある特定の参照標識の発生頻度を判定する別の例示的な実施形態を示す。ここで、現在のブロックは大きなMBであり、隣接ブロックは、現在のブロックよりサイズが小さい。当該ブロックのブロックサイズに関係なくコンテキストで同数の隣接ブロックを有することが興味深い。
【0067】
参照標識予測又は参照インデックス予測を導入する1つの利点は、VLCテーブルをより効率的にマッピングできるようになることである。予測及びVLCテーブルを共に考慮することでより高い圧縮が実現可能である。例えば、予測を使用しない(0、1、2)等の3つのインデックスの符号化を仮定する場合、図11に示されたような固定のVLCテーブルが割り当てられる。インデックス記号「2」が最も頻繁に発生すると仮定すると、「2」が2ビット、すなわち「11」を含むコードワードを使用して符号化され、あまり頻繁でない「0」が1ビット、すなわち「0」を使用して符号化されるため、図11に示されたテーブルは次善の設計を有する。
【0068】
予測が追加される場合、より適切なVLCテーブル設計が可能になる。そのような改良されたVLCテーブル設計の一例を図12に示す。そのような改良されたVLC設計において、参照標識又はインデックス記号を符号化するため使用されるビットは、予測、すなわち現在のブロックのコンテキストに基づいて適応される。図12に示されたテーブルにおいて、現在のブロックのコンテキストにおいて最も頻繁に発生する参照標識は、この例においては「0」である単一ビットのコードワードを使用して符号化される。2ビットから成るコードワード「10」及び「11」は、それぞれ、2番目に高い発生頻度を有する参照標識及び3番目に高い発生頻度を有する参照標識等を識別するように規定される。参照標識の符号器及び復号器の双方は、予測の実行方法及びコードワードの解釈の方法を認識し且つそれらに合意すべきである。
【0069】
上述の例は単なる一例にすぎず、可能な設計はこれに限定されない。例えばより多くの参照標識又はインデックス記号が含まれる場合、種々のVLCテーブルを参照標識又はインデックス記号に割り当てる種々の方法がある。手法の一例は、頻繁に発生する参照標識が小さいインデックス番号を割り当てられ、頻繁に発生しない参照標識が大きいインデックス番号を割り当てられ、並びに大きいインデックス番号より小さいインデックス番号の方が符号化するために少ないビットを要するように、インデックスの発生確率によりインデックス付けを変更することである。コンテキスト対応2値算術符号化(CABAC)は、参照標識又は参照インデックスの確率に従ってそれら参照標識又は参照インデックスを表す変動するビットコストを実現するために使用される。上述したように、種々のコンテキストのいくつかの例は、隣接ブロックと関連付けられた参照標識、参照標識のカウント数又は参照標識の重み付きカウント数等である。
【0070】
例えばH.264を使用する最新技術において、2つのMV/参照ピクチャ、参照ブロック又は参照エリアを使用して双方向予測ブロックを生成することは、2つの参照エリアを平均すること含む。MVが参照エリアにおいてサブ画素の位置を指し示す場合、サブ画素の位置の画素値は、平均する前に最初に生成される必要がある。サブ画素の位置の画素値の生成を「空間フィルタリング(spatial filtering)」と呼ぶ。すなわち、生成処理は各参照エリアの空間フィルタリングを含む。従って、2つの参照エリアを使用して双方向予測ブロックを生成する最新技術の処理は、第1のエリアを空間フィルタリングすること、第2のエリアを空間フィルタリングすること及び最後にフィルタリングされたエリアを平均することを含む。空間フィルタリングは、相対的に複雑な計算を必要とする。
【0071】
この計算の複雑さは軽減されることが理解される。これを以下に説明する。複雑さを軽減するために、ブロックは、例えば2つの参照ブロックを共に追加する(空間フィルタリングを実行せずに)ことにより、最初に整数動きに基づいて構成される。この追加は、計算の複雑さの観点から相対的に安価な演算である。その後、結果として得られるブロックは、1/2画素又は1/4画素解像度等を得るために、補間等のフィルタリングがされる。サブ画素は、MVのうちの1つに従って又は別個に符号化/復号化された追加情報等に基づいて調整される。
【0072】
ブロックが2つ以上のMV及び参照インデックスと関連付けられる場合、これは本明細書において「マルチ予測」と呼ばれ、マルチ予測のそれぞれの単一方向予測成分が判定される。単一方向予測は、例えばイントラ予測であるため「単一予測」と呼ばれる。分割情報は、これらの単一方向予測間の絶対差分に基づいて導出されることが理解される。分割情報は、細粒度分割情報を搬送する際のオーバヘッドを回避するために、符号器及び復号器の双方において導出される。
【0073】
単一方向予測間の絶対差分が相対的に大きい領域において、単一の単一方向予測又は特定の双方向予測が使用される。単一の単一方向予測は、双方向予測(又はマルチ予測)の単一方向予測成分のうちの1つに対してビットストリームにおいて示された参照インデックス及びMVに従って実行される。単一方向予測間の絶対差分が相対的に小さいブロックの他の領域において、双方向予測は、ブロックに対してビットストリームにおいて示されるように使用される。領域に対して単一の双方向予測/特定の双方向予測を使用するか、あるいはビットストリームにおいて示された双方向予測を使用するかの判断は、例えば領域と関連付けられた単一方向予測間の絶対差分と事前定義された閾値との比較に基づく。
【0074】
ここで、2つのMV及び2つの参照エリアと関連付けられた双方向予測ブロックを仮定する。従来、この段階において、このブロックは、更に分割されず、そのまま符号化される。しかし、絶対差分又は「差分マップ」を解析することで取得された「黙示的な(implicit)」情報は、符号器及び復号器の双方においてブロックを更なるパーティションに分割するために使用されることが理解される。
【0075】
2つの参照エリア又は予測の絶対差分が算出される場合、差分マップにおいてより大きい絶対値を含むある領域及びより小さい絶対値を含むある領域がある。領域における小さい値の絶対差分は、通常、同一のオブジェクトが双方の参照エリアのこの領域に描かれることを表す。種々のオブジェクトがそれぞれの参照エリアの領域に描かれる場合、絶対差分は大きくなる。同一のオブジェクトがそれぞれの参照エリアの対応する領域に描かれる場合、領域を平均するのが好適であり適切である。対応する領域が種々のオブジェクトを描く場合、それらを平均することは意味がない。
【0076】
例えば、閾値が規定される。ここで、閾値より大きい差分値は「異なるオブジェクトの領域」を表し、閾値より小さい差分値は「同一のオブジェクトの領域」を表す。ブロックは、事前定義された方式でこれらの領域に従って分割される。上述したように、分割は、黙示的な情報に基づいて、すなわち分割を説明する明示的な信号伝送なしで実行される。この別の利点は、「正方形以外の分割」がサポートされることである。例えば、半球が1つのブロックに描かれる場合、ブロックは、球の境界の周囲で非常に正確に分割される。
【0077】
符号器は、上述の分割手法が使用されるべきかを復号器に信号伝送する。分割手法が使用されるべきであると信号伝送される場合、符号器は、相対的に大きい絶対差分値を有する領域に対して、使用する単一方向予測又は使用する特定の双方向予測を必要に応じて信号伝送する。例えば、重み付き双方向予測(平均以外であり、場合によってはDCオフセットを含む)が使用される。特定の双方向予測を生成できるようにローカルパラメータを判定するために何らかの追加情報を符号化/復号化することが必要な場合もある。取得した分割情報は、分割情報を予測するために更に使用され、符号器は、復号器により復号化され且つ使用される予測パーティションと比較して変更を符号化する。参照エリア間の差分に基づいて分割情報を導出することは、分割方法の大まかな指示を与える。予測された分割情報の改良点を送出することで更なる改良も可能である
分割情報を取得する一例は、ブロックを4つの同等のサイズのサブブロックに分割することである。例えばサブブロックの正規化SAD(差分絶対値和(算出された画素数で除算された))が4倍大きい「親」ブロックの正規化SAD以上である場合、最大の正規化SADを有するサブブロックは、4つの同等のサイズの領域に繰り返し分割される。正規化SADは、画素毎のSAD又は特定のサブブロックサイズ毎のSADを示す。SADではなく、画素差分を示す他の計測値が代わりに使用可能である。一例は、エッジ/線等の強力な局所画像構造に対してより大きな重みを有する計測値である。その後、更に分割されない残りのサブブロックは、双方向予測の何らかの変形例等を使用すべきパーティションに設定される。
【0078】
図13は、分割方法の例示する一実施形態を示す。左側のブロック1302:aは、双方向予測される。SADは、ブロック(ここで1302:bで示された)上で算出され、大きいSADのエリアは、識別及び選択され、それに応じて処理される。この例において、大きいSADのエリアは、逆方向MVのみを使用する単一方向予測に変更することで処理される。従って、元のブロックは2つのパーティションに分割される。2つのパーティションのうちの一方は、ビットストリームにおいて示された双方向予測を使用し、他方(円を含むものとして示された)は、単一方向予測(双方向予測の成分のうちの1つ)を使用する。レート歪み最適化(RDO)は、最適な単一方向予測(双方向予測の成分)を選択するために使用される。
【0079】
分割情報の取得方法の別の例は、例えば双方向予測ブロックを同等のサイズの複数のサブブロックに分割し、当該サブブロックサイズの最大SADを判定し、例えばある特定の間隔内から双方向予測又は単一方向予測の何らかの変更バージョンを使用する領域の部分であるこの最大値に「近接」するSADを有するサブブロックを選択することである。
【0080】
分割することに加えて、例えばこの手法は、双方向予測モードが使用される場合に上述したRISインデックス又は最新技術の参照インデックスを判定するために使用される。例えば、領域に対する平滑差分マップは、領域が場合によっては「双方向RISインデックス」と関連付けられることを示唆し、そのように解釈される。手法は、別の予測としてあるいは上述した参照標識インデックス予測と組み合わせて更に使用される。選択は、双方向予測の可能な候補間のSADに基づいて符号器及び復号器の双方において行われ、最小SADを含む組合せを選択する。
【0081】
尚、分割手法に基づく上述のマルチ予測を使用する場合、ブロックに基づく分割を導出するのではなく、他の種類の分割が符号器及び復号器の双方において導出される。これは、例えばエッジ検出及び/又はセグメンテーション等の非線形画像処理方法に従って、ブロックを2つ以上のパーティションに線形(例えば、水平方向、垂直方向又は対角線方向)分割すること又は非線形分割することを含む。例えば、マルチ予測差分信号は、エッジ検出又は領域成長等の画像セグメンテーション方法に従ってセグメンテーションされ、ブロックパーティションは、セグメンテーションされた差分信号に基づいて導出される。
【0082】
サブパーティションの数は、画像セグメンテーション等の画像処理方法により導出されるか、あるいは符号器から復号器に信号伝送される。線形分割又は非線形分割の代わりとして、画素に基づく分割も適用可能である。1つの変形例は、使用される分割方法を符号器から復号器に信号伝送することであり、別の変形例は、分割方法が他の信号伝送手段を介して符号器と復号器との間で合意されることである。マルチ予測に基づく方法を使用する利点は、分割情報が符号器及び復号器において既に使用可能な情報に基づいて導出されることである。すなわち、分割情報が明示的に信号伝送される必要がないため、符号化のために使用されるビット数は減少する。
【0083】
尚、マルチ予測に基づく分割によれば、双方向予測から双方向予測のために使用されたMVから導出された単一方向MVによる単一方向予測に切り替えるのではなく、サブパーティションに対して更なるMV及び/又は予測モード(単一方向インターピクチャ予測、双方向インターピクチャ予測又はイントラピクチャ予測)を信号伝送することも可能である。換言すると、ブロックに対するパーティションの数及び形状は、セグメンテーション方法等に基づいて明示的に信号伝送され且つ/あるいは黙示的な情報から導出される。また、MV及び/又は予測モードは、結果として得られるサブパーティションのうちのいくつか又は全てに対して信号伝送される。
【0084】
例として提供された特定の実施形態を参照して上述したような手順を説明したが、一般に説明は、本発明の概念を例示することのみを意図し、添付の請求の範囲により規定される提案された方法及び装置の範囲を限定するものとして解釈されるべきではない。一般的な用語で説明したが、例えば方法及び装置は、例えばGSM(登録商標)/EDGE、W CDMA又はLTE、あるいはDVB−S、DVB−T又はDVB−C等の衛星、地上波又はケーブルを介した放送技術等の一般に使用可能な通信技術を使用する種々の通信システムに対してだけでなく、メモリに対する映像の格納/検索に対しても適用可能である。
【0085】
対話ユニット又はモジュールの選択及びユニットの名称は、例示する目的のためにすぎず、上述の方法のうちのいずれかを実行するのに適した映像処理エンティティは、提案された処理動作を実行できるように複数の別の方法で構成されてもよいことが更に理解される。
【0086】
尚、本明細書において説明したユニット又はモジュールは、独立した物理エンティティとして考えられる必要はなく、論理エンティティとして考えられる。
【0087】
略語
AVC 高度映像符号化
CABAC コンテキスト対応2値算術符号化
GOP Group Of Pictures
MB マクロブロック
MV 動きベクトル
RIS 参照インデックス信号伝送(Reference Index Signaling)/参照情報標識信号伝送(Reference Information Indicator Signaling)
SAD 差分絶対値和
VLC 可変長符号化
【技術分野】
【0001】
本発明は、一般に、映像符号化に関連した情報を符号化する方法及び装置に関する。
【背景技術】
【0002】
映像符号化は、イントラモード及び/又はインターモードで実行される。イントラモードは映像フレーム内の冗長性を利用し、インターモードは映像フレーム間の冗長性を利用する。インターモードにおいて、画の輝度(luma)/クロマ(chroma)予測値は、参照ピクチャと呼ばれる既に符号化/復号化されたピクチャから取得される。予測のために使用された参照ピクチャの数に依存して、インターモードは、それぞれ1つ、2つ及び3つの参照ピクチャが使用される単一方向予測モード(又は単一方向モード)、双方向予測モード(Bモード)及び場合によっては3方向予測モード等に分類される。本明細書内において、3つの異なるモード、すなわち単一方向予測、双方向予測等を「参照モード」と呼ぶ。
【0003】
H.264及びMPEG−4 Part10としても既知である高度映像符号化(AVC)は、ITU−T(国際電気通信連合−電気通信標準化部門)及びMPEG(Moving Picture Experts Group)の2D映像符号化に対する最新の規格である。AVCコーデックは、フレーム間及び1つのフレーム内の冗長性を除去することを利用するハイブリッドコーデックである。
【0004】
AVCにおいて、関連する参照ピクチャの標識は、2つの参照リストに順番に配置される。標識は、参照インデックスで示され、0〜N、例えば(0、1、…、N)の番号が付けられる。主に第1のリストList0(L0)は、過去の参照ピクチャ、すなわち時間的に現在のピクチャに先行する参照ピクチャを管理し、一般に第2のリストList1(L1)は、未来の参照ピクチャ、すなわち時間的に現在のピクチャに後続する参照ピクチャを管理する。低遅延映像符号化の場合、L1は過去の参照ピクチャを更に管理する。各リストは、最大15個の参照ピクチャ、すなわちN=14)のインデックスを保持できる。
【0005】
また、AVCにおいて、参照ピクチャリストのうちの一方(例えば、単一方向予測のため)、あるいは双方の参照ピクチャリスト(例えば、双方向予測のため)の選択を指定する標識又は参照モードインデックスは、マクロブロック(MB)モード/サブMBモードでパーティション構造と共に符号化され、それぞれのリストにおいて選択された参照ピクチャを指定する標識又は参照ピクチャインデックスは、独立した構文要素として符号化される。「パーティション構造」は、例えば16x16のMBの16x16、16x8又は8x16等のパーティションを示す。例えば16x16のパーティションは、一般に、単一方向予測が使用される場合に1つの動きベクトル(MV)及び1つの参照インデックスと関連付けられ、双方向予測が使用される場合に2つのMV及び2つの参照インデックスと関連付けられる。MVは、水平成分MVx及び垂直成分MVyを有し、現在のパーティションの画素が対応する参照ピクチャから生成される方法を記述する。例えば、Ipred(x,y)=Iref(x−MVx,y−MVy)と記述される。
【0006】
ピクチャ又はパーティションと関連付けられた参照ピクチャの数は、同一のパーティションと関連付けられた参照モード、すなわちそれが単一方向予測又は双方向予測であるか等に依存する。復号器において参照情報を復号化する場合、ピクチャ又はパーティションと関連付けられた参照モードインデックス及び1つ以上の参照ピクチャインデックスの双方は、復号器が適切にピクチャ又はパーティションを復号化できるように正確に復号化されなければならない。参照モードインデックス及び1つ以上の参照ピクチャインデックスのうちのいずれかが適切に復号化されなければ、結果として参照情報が誤って解釈される可能性がある。
【0007】
上述したAVCの方法等の参照情報を符号化する現在の方法は、各ブロックと関連付けられた参照情報を搬送するために相対的に多数のビットを必要とする。これは、符号化効率の観点から非効率的であると認識される。
【発明の概要】
【発明が解決しようとする課題】
【0008】
参照情報、すなわち現在のフレームを予測するために使用された1つ以上の参照ピクチャを識別する情報の符号化効率の向上を可能にすることが望ましい。本発明の目的は、参照情報の符号化効率の向上を可能にすることである。また、本発明の目的は、参照情報の改善された符号化を可能にする方法及び装置を提供することである。これらの目的は、添付の独立請求項に記載の方法及び装置により達成される。オプションの実施形態は従属請求項により規定される。以下に説明する予測、符号化及び復号化は、同一のエンティティ又はノード内、あるいは種々のエンティティ又はノードにおいて実行される。
【課題を解決するための手段】
【0009】
第1の態様によれば、映像復号化エンティティにおける方法が提供される。この方法は、符号化ブロックBeと関連付けられた単一の構文要素を取得するステップを備える。この方法は、取得した構文要素に基づいて参照モード及び1つ以上の参照ピクチャを識別するステップと、識別された参照モード及び1つ以上の参照ピクチャに基づいてブロックBeを復号化するステップとを更に有し、画素の復号化ブロックBを提供する。
【0010】
第2の態様によれば、映像復号化エンティティにおける装置が提供される。この装置は、符号化ブロックBeと関連付けられた単一の構文要素を取得するように構成される機能ユニットを備える。この装置は、取得した構文要素に基づいて参照モード及び1つ以上の参照ピクチャを識別するように構成される機能ユニットを更に備える。この装置は、識別された参照モード及び1つ以上の参照ピクチャに基づいてブロックBeを復号化することにより、画素の復号化ブロックBを提供するように構成される機能ユニットを更に備える。
【0011】
第3の態様によれば、映像符号化エンティティにおける方法が提供される。この方法は、参照モード及び1つ以上の参照ピクチャを使用して画素のブロックBを符号化するステップを有し、符号化ブロックBeを提供する。この方法は、参照モード及び1つ以上の参照ピクチャを識別する単一の構文要素(single syntax element)を導出するステップと、単一の構文要素をブロックBeの復号器に提供するステップとを更に備える。
【0012】
第4の態様によれば、映像符号化エンティティにおける装置が提供される。この装置は、参照モード及び1つ以上の参照ピクチャを使用して画素のブロックBを符号化することにより、符号化ブロックBeを提供するように構成される機能ユニットを備える。この装置は、参照モード及び1つ以上の参照ピクチャを識別する単一の構文要素を導出するように構成される機能ユニットを更に備える。この装置は、単一の構文要素をブロックBeの復号器に提供するように構成される機能ユニットを更に備える。
【0013】
上述の方法及び装置は、符号化効率を向上するために使用される。符号化効率は、現在のフレームの予測に使用された1つ以上の参照ピクチャを識別するためにより少ないビットを使用することで向上する。上述の方法及び装置により、誤り耐性の向上が更に可能になる。また、単一の構文要素を形成するように参照情報をまとめることにより、参照インデックス番号を容易に操作できるようになる。また、上述したような構文要素を使用することにより、参照インデックスと参照モードとのいくつかの組合せを効率的に符号化できるようにすることで他の組合せより確率の高いそれらの組合せを利用できるようになる。例えば、より短いコードワードは、参照インデックスと参照モードとのより確率の高い組合せに割り当てられる。
【0014】
上述の方法及び装置は、種々の実施形態において実現される。いくつかの実施形態において、参照モード及び1つ以上の参照ピクチャの識別は、構文要素と参照モード及び1つ以上の特定の参照ピクチャとの事前定義されたマッピングに基づく。いくつかの実施形態において、単一の構文要素は、1つ以上のエンティティを含む第1の事前定義された参照リストにおけるエントリを表す。エントリは、複数の参照ピクチャ又は単一の参照ピクチャを識別し、参照モードを更に識別する。
【0015】
単一の構文要素は、それぞれ、単一の参照ピクチャを識別する1つ以上のエントリを含む第2の事前定義された参照リストにおける参照モード及びエントリを更に表す。
【0016】
リストにおけるエントリは、リストインデックスにより識別される。また、取得した構文要素を表すビット数は、構文要素の特定の値の確率に関連する。
【0017】
いくつかの実施形態において、参照情報は、Be(又はB)の隣接ブロックと関連付けられた単一の構文要素に基づいてBe(又は符号化エンティティにおいてはB)に対して予測される。また、いくつかの実施形態において、マルチ予測と関連付けられたブロックのサブ領域が識別され、そのサブ領域に対して、マルチ予測参照ブロックのそれぞれの対応する領域が相対的に低い相関性を有し、マルチ予測ではなく別の予測が識別されたサブ領域に対して使用される。
【0018】
主に方法の観点から上述の実施形態を説明した。しかし、上述の説明は、装置の実施形態を含むことを更に意図し、上述の機能の性能を可能にするように構成される。上述の例示的な実施形態の種々の特徴は、必要性、要求又は好みに従って種々の方法で組み合わされてもよい。
【0019】
更に別の態様によれば、1つ以上の処理ユニットにおいて実行された時に上述の方法のうちの1つに係る対応する手順を上述の装置のうちのいずれかに実行させるコンピュータ可読コード手段を備えるコンピュータプログラムが提供される。
【0020】
更に別の態様によれば、上述のコンピュータプログラムを含むコンピュータプログラム製品が提供される。
【0021】
次に、実施形態の例を使用し、添付の図面を参照して本発明を更に詳細に説明する。
【図面の簡単な説明】
【0022】
【図1】図1は、従来技術に係る参照情報表現から一実施形態の例に係る参照情報表現への変換を示す概略図である
【図2】図2は、実施形態の一例に従って、AVC参照インデックス表現と参照インデックス表現との差分を示すテーブルである。
【図3】図3は、実施形態の一例に従って、参照情報標識の割り当てを示す概略図である
【図4】図4は、実施形態の一例に従って、映像復号化エンティティにおいて参照モード及び1つ以上の参照ピクチャに関連した合同符号化された情報を復号化する手順を示すフローチャートである。
【図5】図5は、実施形態の一例に従って、映像復号化エンティティにおいて参照モード及び1つ以上の参照ピクチャに関連した合同符号化された情報を復号化するように構成された装置を示すブロック図である。
【図6】図6は、実施形態の一例に従って、映像符号化エンティティにおいて参照モード及び1つ以上の参照ピクチャに関連した情報を合同符号化する手順を示すフローチャートである。
【図7】図7は、実施形態の一例に従って、映像符号化エンティティにおいて参照モード及び1つ以上の参照ピクチャに関連した情報を合同符号化するように構成された装置を示すブロック図である。
【図8】図8は、実施形態の一例に従って、映像符号化/復号化エンティティにおける装置を示す概略図である。
【図9】、
【図10】図9及び図10は、例示的な実施形態に従って、現在のブロックの隣接画素と関連付けられた参照モードと1つ以上の参照ピクチャとの種々の組合せの発生頻度を判定することを示す概略図である。
【図11】図11は、従来技術に従って、標識(コードワード)を種々のインデックス記号に割り当てることを示す概略図である。
【図12】図12は、例示する一実施形態に従って、標識(コードワード)を割り当てることを示す概略図である。
【図13】図13は、例示する一実施形態に従って、黙示的な情報に基づいて分割することを示す概略図である。
【発明を実施するための形態】
【0023】
簡単に説明すると、参照情報、すなわち参照モード及び参照ピクチャを表し、搬送する新しい手順がインター予測符号化及び復号化に対して提供される。この手順を参照インデックス信号伝送、すなわち参照情報標識信号伝送(Reference information Indicator Signaling:RIS)と呼ぶ。
【0024】
本明細書内において、「ブロックXの隣接ブロック」という用語は、ブロックXに隣接するブロック、すなわちブロックXに近接するか又はブロックXの近傍に配置されるブロックを示すものとして使用される。また、本明細書内において、「ブロック」という用語は、画素の単位を示すものとして使用される。「参照ピクチャ」又は「参照ブロック」という用語は、以前に符号化/復号化されたピクチャ、ピクチャのブロック、ピクチャの領域(region)又はピクチャのエリアを示すものとして使用される。ここで、ピクチャ、ブロック、領域等は、予測のために参照として使用される。
【0025】
RISを使用する場合、例えばAVC等のようにパーティション構造の標識と密接に関連する参照モードの標識を符号化し且つ参照ピクチャの標識を別個に符号化するのではなく、符号化ブロックと関連付けられた参照モードの標識及び参照ピクチャの標識は、「1つの場所において共にまとめられ」、すなわち合同符号化される。参照モード及び参照ピクチャ、すなわち参照情報の標識の合同符号化の結果、単一の構文要素又は標識は、満足のいく方法で符号化ブロックを復号化するために、必要な参照モード及び参照ピクチャに関する全ての情報を表す。すなわち、この単一の構文要素が符号化ブロックに対して与えられると、復号器は、ブロックを復号化するために必要な参照ピクチャを識別できるはずである。「構文要素(syntax element)」は、「構文単位(syntax unit)」、「合同指示単位(joint indication unit)」又は「合同識別単位(joint identification unit)」等でも示される。
【0026】
RISを記述する1つの方法は、例えば2つの独立したリストを使用する参照情報のAVC表現等の従来の表現からRISに従う参照情報の例示的な表現への「変換」、すなわちマッピングを記述することである。図1に示されるように、そのようなRIS表現への変換は、基本的に3つのステップで実行される。
【0027】
第1のステップ102は、複数のインデックスリストから単一の参照インデックスリストを形成することである。例えば、AVCのように2つの参照インデックスリストを管理するのではなく、全ての参照ピクチャインデックスは、AVCの2つのリストの代わりとして又はそれを補完するものとして、ある特定の順序で単一の合同リストに格納される。これを図1に示す。図中、ピクチャ参照インデックスリストL0及びL1がインタリーブされて新しいリストLRISにマージ又は多重化される。また、第2のステップ104において、インデックス番号は、新しいリストLRISにおいて連続した番号、すなわち0〜5に従うように再度割り当てられる。
【0028】
ステップ104の後のリストLRISにおけるインデックス番号又はエントリは、参照モード(逆方向又は順方向の単一方向予測)及び参照ピクチャの双方に関する情報を表す。LRISにおけるエントリに対するインデックスは、「RISインデックス」又は「インデックスパラメータ」等で示される。この例においてステップ104の後のLRISにおけるRISインデックス番号0〜5は、4つの過去のピクチャ(元々はL0=(0、1、2、3)における)及び2つの未来のピクチャ(元々はL1=(0、1)における)からの単一方向予測を表す。
【0029】
また、双方向予測を示す1つ以上のリストエントリは、挿入又は追記等によりLRISに追加される。従って、双方向予測を表すエントリを示すRISインデックスは、単一の参照ピクチャではなく、2つの参照ピクチャを指し示す。従って、RISインデックスは、参照モードと1つ以上の参照ピクチャとの組合せを識別可能である。
【0030】
その結果、最後のステップ106において、2つの参照ピクチャが予測のために使用される双方向予測モードに関連したエントリは、LRISに連続的に追記され、RISインデックスにより示されるかあるいは表される。例えば、RISインデックス番号7を有するエントリは、現在のピクチャが双方向予測参照としてピクチャ番号0及びピクチャ番号1を使用していることを信号伝送するかあるいは意味するように設定される。従って、この情報はRISインデックス7に固有である。インデックス番号8は、現在のピクチャが双方向予測参照としてピクチャ番号0及びピクチャ番号2を使用していることを意味するように設定される。同様に、リストLRISは、例えば3方向予測を表すエントリにより更に拡張され、3つの参照ピクチャを識別する。
【0031】
あるいは、最初に双方向予測モードに関連したエントリが追加、例えば挿入又は追記され、次にインデックス番号がそれに応じて再度割り当てられるように、ステップ104及びステップ106は逆の順序で実行されてもよい。上述したように、双方向予測モードに関連したエントリは、例えば単一方向予測に関連したエントリ間に更に挿入され、これはステップ104を補完するもの又はその代わりとして、挿入後にインデックス番号を再度割り当てることを必要とする。この例において、マッピングは、種々のエントリのインデックスが参照モード及び1つ以上の参照ピクチャを表す単一の参照リストで表される。尚、これはオプションの一例にすぎず、マッピングはいくつかのステップを含み、例示された種類の明示的なリスト又はレコードはマッピングを実行するために必要ない。
【0032】
実施形態の一例に従って、AVC参照インデックス表現とRISインデックス表現との差分の一例を図2のテーブル示す。この例においては、現在のピクチャを符号化するために使用可能な4つの参照ピクチャがあり、そのうちの2つの参照ピクチャが過去の参照ピクチャであり、2つの参照ピクチャが未来の参照ピクチャであると仮定する。このRIS表現の例において、すなわちインデックス0、1、3及び4は、それぞれの4つの参照ピクチャのうちの1つから単一方向予測を示すように設定される。インデックス2及び5は、4つの参照ピクチャのそれぞれの対から双方向予測を示すように設定される。尚、パーティションに関連した情報が例えば「INTER_16x16_L0」等の参照モードインデックスと共に符号化されるため、参照インデックスのAVC信号伝送(AVC-signaling)はこの情報を更に含む。しかし、これは図2に示されない。
【0033】
図2のテーブルに示された例において、双方向予測を示すかあるいは表すRISインデックスのうちのいくつかは、「最近接する」単一方向予測RISインデックスの直後に配置される。すなわち、単一方向予測を表すインデックスとインタリーブされる。このRISインデックス表現は、いわゆる7B階層のGOP(7B hierarchical Group Of Pictures)(BGOP)を示す図3に更に示される。図3において、いわゆる「現在のフレーム」、すなわち符号化されるフレームは、7B GOPにおけるフレーム3である。図3に示されたRISインデックスは、図2のテーブルにおけるRISインデックス0〜7に対応する。別のRIS表現は、図1に示された例のように、RISインデックス0〜3が単一方向予測を示すようにするものであり、後続のRISインデックスは双方向予測を示す。
【0034】
RISインデックス又はRISパラメータの意味を規定する方法は、本明細書内において与えられた例に限定されない。例えば数式は、例えば双方向予測RISインデックスに対して2つの参照ピクチャインデックスの識別を返送し、単一方向RISインデックスに対して1つの参照ピクチャインデックスを識別する2つの変数f(RIS_index,current_frame_num)を含む関数等のRISインデックスの意味を解釈するように規定される。一例において、current_frame_numは、7BピクチャのBGOP内部のフレーム番号に対応する。この場合、0は表示順序が最初のフレームであり、8はBGOPにおいて最後のフレームである。別の例において、RISインデックスは、常に式を使用して割り当てられる。
順方向:refidx0
範囲:[0〜L0_len−1]
逆方向:L0_len+refidx1
範囲:[L0_len〜L0_len+L1_len−1]
Bi:(L0_len+L1_len)+refidx0*L1_len+refidx1
範囲:[L0_len+L1_len〜L0_len+L1_len+L0_len*L1_len−1]
ここで、refidx0及びrefidx1は、それぞれ、参照リストL0及びL1へのインデックスである。L0_len及びL1_lenは、それぞれ、リストL0及びL1の長さである。
【0035】
あるいは、テーブルは、双方向予測の場合は2つの対応する単一方向インデックス及び単一の予測の場合は1つの単一方向インデックスとRISインデックスを一致させるために使用される。どの方法を選択するかは、ハードウェア/ソフトウェアの制約等に依存する。
【0036】
しかし、構文要素を導出するために使用される方法に関係なく、符号器が適切な構文要素を導出及び提供でき、復号器が構文要素を適切に解釈することで当該符号化ブロック又は符号化フレームを復号化するために必要な関連情報を識別できるように、方法は符号器及び復号器の双方に対して既知であるべきである。
【0037】
RISインデックスは、フレームレベル、高いMBレベル、MBレベル又はサブMBレベル等の種々のレベルの映像符号化に適用できる。
【0038】
手順の例、図4、復号化
次に、図4を参照して、参照情報を搬送する手順の復号化部分の一実施形態を説明する。この手順は、映像復号器又は映像復号器に加えて更なる機能ユニットを備えるエンティティである映像復号化エンティティにおいて実行される。最初に、符号化ブロックBeと関連付けられた単一の構文要素が動作402で取得される。単一の構文要素は、「ビットストリーム」におけるシンボル、すなわち映像シーケンス等の符号化表現等の単位又はビットストリームから復号化される単位である。構文要素は、例えばRISインデックス等の参照情報に対応する番号を表す1ビット以上である。通常、より一般的でないRISインデックスを表すために使用されるビット数と比較して少ないビットが相対的に一般的であるRISインデックスを表すために使用される。構文要素は、ビットストリームから復号化され、それが表すRISインデックス等の番号を取得する。例えば復号化は、CABAC(コンテキスト対応2値算術符号化)等のVLC(可変長符号化)又は算術符号化に従って実行される。
【0039】
次に、動作404において、ブロックBeを復号化する際に使用される参照モード及び1つ以上の参照ピクチャは、取得した構文要素に基づいて識別される。識別された参照モード及び1つ以上の参照ピクチャは、符号器においてブロックを符号化する際に使用されたモード及び参照ピクチャに対応する。識別は、構文要素が与えられたとすると、マッピングテーブル、参照リスト、あるいは他の事前定義された情報又は関数を使用して構文要素をデマッピング、解読(deciphering)又は「復号化」すること等を含む。マッピングテーブル、参照リスト、あるいは他の事前定義された情報又は関数を使用することにより、参照モード及び1つ以上の参照ピクチャが識別される。また、必要な参照モード及び1つ以上の参照ピクチャを識別した場合、従来の方法を使用して取得されると仮定される符号化ブロックBeは、動作406で復号化される。
【0040】
単一の構文要素は、各々が1つ以上の参照モード及び1つ以上の参照ピクチャを表すかあるいは識別する複数のエントリを含む参照リストにおけるエントリの標識又はインデックスであり、例えばRISインデックスで示される。あるいは、構文要素は、ルックアップテーブルにおいてエントリに対応するコードワードである。ルックアップテーブルは、AVCにおいて例えばL0及びL1等の1つ以上の参照リストの参照モード及び1つ以上のエントリ等にコードワードをリンクする。参照モードは、ブロックを復号化するために使用されるべき単一の参照リスト又は複数の参照リストを規定する。
【0041】
装置の例、図5、復号化
以下において、図5を参照して、復号化の上述の手順を実行できるように構成された装置500の一例を説明する。この装置は、映像復号器か、あるいは映像復号器に加えて例えばコンピュータ、移動端末又は映像専用デバイス等の更なる機能ユニットを備えるエンティティである映像復号化エンティティ501内に配置されるものとして示される。この装置500は、あらゆる種類の有線通信又は無線通信のための従来の手段を備えると考えられる通信ユニット502を介して他のエンティティと通信するように更に示される。復号化される符号化映像は、取得ユニット504により通信ユニット502又はメモリから取得されると仮定され、符号化ブロックは、復号化ユニット508において復号化されると仮定され、この場合、機能ユニット508は従来の復号化方法を使用する。
【0042】
取得ユニット504は、符号化ブロックBeと関連付けられた単一の構文要素を取得するように構成される。装置500は、取得した構文要素に基づいて、ブロックBeを復号化する際に使用される参照モード及び1つ以上の参照ピクチャを識別するように構成される識別ユニット506を更に備える。上述したように、装置500は、判定された参照モード及び参照ピクチャに基づいてブロックBeを復号化するように構成されることにより、復号化された画素ブロックBを提供する復号化ユニット508を更に備える。
【0043】
この装置において、構文要素は、各々が1つ以上の参照モード及び1つ以上の参照ピクチャを表すかあるいは示す複数のエントリを含む参照リストにおけるエントリの標識又はインデックスである。あるいは、装置は、構文要素がルックアップテーブルにおいてエントリに対応するコードワードである別の例に適応する。ルックアップテーブルは、AVCにおいて例えばL0及びL1等の1つ以上の参照リストの参照モード及び1つ以上のエントリ等にコードワードをリンクする。
【0044】
映像復号化エンティティ501は、復号化映像を表示するように構成された表示ユニット510等を更に備えても良い。
【0045】
手順の例、図6、符号化
次に、図6を参照して、参照情報を搬送する手順の符号化部分の一実施形態を説明する。この手順は、映像符号器又は映像符号器に加えて更なる機能ユニットを備えるエンティティである映像符号化エンティティにおいて実行される。最初に、画素のブロックBは、参照モード及び1つ以上の参照ピクチャを使用して動作602で符号化され、符号化ブロックBeを提供する。
【0046】
次に、単一の構文要素が、符号化のために使用された参照モード及び1つ以上の参照ピクチャに基づいて動作60にてで導出される。それにより、構文要素は、ブロックBを符号化するために使用された参照モード及び1つ以上の参照ピクチャを直接又は間接的に識別する。例えば構文要素は、事前定義された参照リストにおいて使用された参照モード及び参照ピクチャに対応するリストエントリを配置し、次に構文要素を構成するように前記エントリのインデックス番号を設定することで導出される。あるいは、事前定義されたマッピングテーブル又はルックアップテーブルは、参照モード及び参照ピクチャの種々の組合せと種々の構文要素との間のマッピングを提供する。更に構文要素は、参照モード標識及び1つ以上の参照ピクチャ標識を返送する事前定義された関数への引数である。例えば、そのような「引数」構文要素は、参照モード標識及び1つ以上の参照ピクチャ標識を引数として解釈し、単一の構文要素を返送する事前定義された「逆関数」を使用して導出される。
【0047】
また、導出された構文要素は、動作606において、ブロックBeと関連付けてブロックBeの復号器に提供される。従って、参照情報、すなわちブロックBを符号化する際に使用され且つ符号化ブロックBeを復号化する際にも使用される参照モード及び1つ以上の参照ピクチャに関する情報は、簡潔に且つ誤り耐性を有して復号器に搬送される。例えば構文要素は、無線チャネルを介して復号器を備えるエンティティ又はノードに送信されることで提供される。また、例えば構文要素は、関連付けられた符号化映像と共にメモリに格納され、別の時点で復号化エンティティによりアクセスされる。
【0048】
装置の例、図7、符号化
以下において、図7を参照して、符号化に関連した上述の手順を実行できるように構成された装置700の一例を説明する。この装置は、映像符号器か、あるいは映像符号器に加えて例えばコンピュータ、移動端末又は映像専用デバイス等の更なる機能ユニットを備えるエンティティである映像符号化エンティティ701内に配置されるものとして示される。この装置700は、あらゆる種類の有線通信又は無線通信のための従来の手段を備えると考えられる通信ユニット(不図示)を介して他のエンティティと通信する。符号化される非符号化映像は、通信ユニット又はメモリ等から取得されると仮定される。
【0049】
装置700は、参照モード及び1つ以上の参照ピクチャを使用して画素のブロックBを符号化するように構成されることにより、符号化ブロックBeを提供する符号化ユニット702を備える。装置700は、ブロックBを符号化する際に使用された参照モード及び1つ以上の参照ピクチャを直接又は間接的に識別する単一の構文要素を導出するように構成される導出ユニット704を更に備える。インデックス要素は、種々の方法で導出され、上述したように例えばインデックス又はコードワード等の標識である。
【0050】
装置700は、場合によっては通信ユニットを介して単一の構文要素をブロックBeの復号器に提供するように構成される提供ユニット706を更に備える。例えば単一の構文要素は、無線チャネルを介して復号器を備えるエンティティ又はノードに送出されることで提供されてもよい。
【0051】
装置の例、図8
図8は、映像復号化エンティティにおいて装置800の一実施形態を概略的に示す。更に図8は、図5に示された映像復号化エンティティにおいて復号化する装置の一実施形態を開示する別の方法である。ここで、装置800は、DSP(デジタル信号プロセッサ)等を含む処理ユニット806を備える。処理ユニット806は、本明細書において説明した手順の種々の動作を実行する単一のユニット又は複数のユニットである。装置800は、他のエンティティから信号を入力する入力ユニット802及び他のエンティティに信号を提供する出力ユニット804を更に備える。入力ユニット802及び出力ユニット804は、統合されたエンティティとして構成される。
【0052】
更に装置800は、EEPROM(電気的消去可能プログラマブル読み出し専用メモリ)、フラッシュメモリ及びハードドライブ等の不揮発性メモリの形態の少なくとも1つのコンピュータプログラム製品808を備える。コンピュータプログラム製品808は、装置800の処理ユニット806において実行される場合に図4に関連して上述した手順の動作を装置及び/又は映像復号化エンティティに実行させるコード手段を備えるコンピュータプログラム810を含む。
【0053】
コンピュータプログラム810は、コンピュータプログラムモジュールにおいて構成されたコンピュータプログラムコードとして構成される。従って、説明した実施形態の例において、装置800のコンピュータプログラム810のコード手段は、例えばデータ送信エンティティ又はメモリ等の記憶装置から発生するビットストリームから符号化映像ユニット/ブロックを復号化することにより、符号化映像ユニット/ブロックと関連付けられた単一の構文要素を取得する取得モジュール810aを備える。コンピュータプログラムは、取得した構文要素に基づいて参照モード及び1つ以上の参照ピクチャを識別する識別モジュール810bを更に備える。コンピュータプログラム810は、符号化ブロックを復号化する復号化モジュール810cを更に備える。
【0054】
モジュール810a〜810cは、図5に示された映像復号化エンティティにおける装置をエミュレートするために、実質的に図4に示されたフローの動作を実行する。換言すると、種々のモジュール810a〜810cは、処理ユニット806において実行される場合に図5のユニット502〜506に対応する。
【0055】
同様に、図7に示された装置に対応する代替例も可能である。
【0056】
図8に関連して上述した実施形態におけるコード手段は、処理ユニットにおいて実行される場合に上述の図に関連して上述した動作を装置及び/又は映像処理/提示エンティティに実行させるコンピュータプログラムモジュールとして実現されるが、コード手段のうちの少なくとも1つは、別の実施形態においてハードウェア回路として少なくとも部分的に実現されてもよい。
【0057】
プロセッサは、単一のCPU(中央処理装置)であるが、2つ以上の処理ユニットを更に備えてよい。例えばプロセッサは、汎用マイクロプロセッサと、命令セットプロセッサ及び/又は関連したチップセット、並びに/あるいはASIC(特定用途向け集積回路)等の専用マイクロプロセッサとを備える。プロセッサは、キャッシュするためにボードメモリを更に備える。コンピュータプログラムは、プロセッサに接続されたコンピュータプログラム製品により保持される。コンピュータプログラム製品は、コンピュータプログラムを格納するコンピュータ可読媒体を備える。例えば、コンピュータプログラム製品は、フラッシュメモリ、RAM(ランダムアクセスメモリ)ROM(読み出し専用メモリ)又はEEPROMであってもよく、上述のコンピュータプログラムモジュールは、別の実施形態において、データ受信ユニット内のメモリの形態の種々のコンピュータプログラム製品に分散されてもよい。
【0058】
また、既存の映像符号化技術に関する1つの問題は、満足のいく参照モード/参照ピクチャ予測方式が規定又は適用されないことであることが理解される。以下において、そのような予測方式を説明する。例えば、シーンカット/フェージング/フラッシュシナリオにおいて、例えば参照モードと参照ピクチャとの同一の組合せが隣接又は近接するMBの予測のために使用されることが非常に一般的であることが理解される。また、本発明の符号化方法は、隣接MBに対して使用された参照モード/参照ピクチャとの相関性を利用しないことが理解される。以前の解決方法において、MB参照情報を識別する別個の成分は、個々に符号化され、映像復号器に搬送される。
【0059】
MBレベル上の例示する予測方式を以下の通り説明する。例示する予測方式は、符号器及び復号器の双方に適用され、あらゆるブロックサイズに適用できる。
【0060】
現在のMBの符号化/復号化と関連して、符号器/復号器は、MBの「コンテキスト」とも呼ばれる周囲の符号化MBの参照標識を解析するように構成される。これらの周囲のブロックは、現在のブロックの「隣接ブロック」と示される。符号器/復号器は、候補標識又は候補インデックスの集合のうちの各々が隣接ブロックに現れる回数をカウントし、例えば事前定義された方式に従って、最多カウントの標識を予測値又は推定値として選択する。選択された参照標識は、インター予測に関連しているはずである。選択された参照標識は、現在のMBを符号化/復号化する際に使用するのに適した参照ピクチャ(及び参照モード)の予測値又は推定値に設定される。その予測値は、現在のMB自体の解析ではなく、MBの符号化/復号化隣接ブロックに関連する情報の解析から導出される。符号器において、この例では現在のMBを符号化する際に使用される参照ピクチャ(及び参照モード)を選択するために予測値が使用されないため、MBは、このような予測値の選択中に符号化されてもされなくてもよい。復号器において、現在のMBは予測中に符号化される。
【0061】
例示する隣接ブロック参照標識の解析及び推定値の選択を図9に示す。図9に示される例において、現在のブロックの4つの隣接ブロックを考慮する。しかし、方法は、考慮されるブロックの他の集合又は部分集合にも適用可能である。例えば、隣接ブロックの集合の一例は、現在のブロックに対して左ブロック、左上ブロック及び上ブロックから構成される。別の例の集合は、左ブロック及び上ブロックのみを含む。図9において、現在のブロックの隣接ブロックは、それぞれの参照標識又は参照インデックス1、1、2及び0と関連付けられる。従って、参照標識「1」は、隣接ブロックの間に2回出現することにより、最多カウント、すなわち最も高い発生頻度を有する。従って、参照標識「1」は、現在のブロックを符号化する際又は復号器において予測が行われる際に使用されたかあるいは使用される参照ピクチャ(及びモード)の予測値又は推定値、現在のブロックを復号化する際に使用される参照ピクチャ(及びモード)の予測値を表すように選択される。
【0062】
隣接ブロックの間である特定の参照標識の発生回数をカウントする場合、2つ以上の候補は、同一の最多カウント数を有する可能性がある。これを図10に示す。図中、参照標識「1」及び「2」の双方が4回現れる。例えばこれは、事前定義された順序付け方式に従って参照標識を選択することで解決される。例えば、参照標識が図9及び図10に示されるように0〜2の数で表される場合、最も大きい数又は最も小さい数で表された参照標識が予測値として選択される。
【0063】
予測画素値のブロックと、元の画素値のブロック、すなわち符号化される前の元のブロックとの間の差分は、例えばDCT(離散コサイン変換)である変換符号化により符号化される。変換の出力は、その後量子化される変換係数を含む。ブロックと関連付けられた変換係数の数は、所定の量子化に対して、予測ブロックと元のブロックとの一致の程度を反映する。相対的に少ない変換係数は、適切に一致していることを示す。従って、少ない変換係数を有するブロックと関連付けられた参照標識は、より信頼できると考えられる。
【0064】
従って、発生のカウントは、例えば参照ブロックと関連付けられた符号化変換係数に従って更に重み付けされる。上述したように、少ない符号化変換係数を含む隣接ブロックと関連付けられた参照インデックスは、多くの変換係数を含む隣接ブロックと関連付けられた参照インデックスより信頼できる予測値であると考えられるため、参照インデックス予測のためにより大きい重みを割り当てられる。別の例において、符号化係数を含むブロックは、符号化係数を含まないブロック、すなわちスキップされるブロックより大きな重みを有してもよい。別の例において、例えば大きなMBである大きなMVパーティションを有する隣接ブロックと関連付けられた参照インデックスは、より小さなMVパーティションを含む隣接ブロックより信頼できると考えられるため、参照インデックス予測のためにより大きい重みが割り当てられる。2の倍数の重みを使用することは、複雑さの観点で有益である。重み付きカウントは、ルックアップテーブルを使用することによっても実現される。
【0065】
ある参照標識は、他の参照標識より互いにより強く関連する。例えば、合同符号化された参照情報を使用する場合、参照フレームref0及びref1を使用する双方向予測を表す参照標識は、例えば参照フレームref2を使用する単一方向予測を表す参照標識よりref0及びref1のうちのどちらか一方を使用する単一方向予測を表す参照標識とより強く関連する。従って、双方向予測標識をカウントする場合、同一の参照フレームを使用する単一方向予測を表す対応する標識は、ある小さいカウント値、すなわち「完全な一致」に対するカウント値より小さいカウント値で更新される。同様に、ref0及びref1等を使用する単一方向予測を表す参照標識は、他の双方向予測参照標識よりref0及びref1を使用する双方向予測を表す対応する参照標識とより強く関連する。従って、単一方向参照標識をカウントする場合、当該参照フレームが使用されるマルチ予測に対応する参照標識のカウントは、ある小さい値で更に更新される。
【0066】
図10は、現在のブロックの隣接画素と関連付けられた参照標識をカウントすることにより、現在のブロックに対するある特定の参照標識の発生頻度を判定する別の例示的な実施形態を示す。ここで、現在のブロックは大きなMBであり、隣接ブロックは、現在のブロックよりサイズが小さい。当該ブロックのブロックサイズに関係なくコンテキストで同数の隣接ブロックを有することが興味深い。
【0067】
参照標識予測又は参照インデックス予測を導入する1つの利点は、VLCテーブルをより効率的にマッピングできるようになることである。予測及びVLCテーブルを共に考慮することでより高い圧縮が実現可能である。例えば、予測を使用しない(0、1、2)等の3つのインデックスの符号化を仮定する場合、図11に示されたような固定のVLCテーブルが割り当てられる。インデックス記号「2」が最も頻繁に発生すると仮定すると、「2」が2ビット、すなわち「11」を含むコードワードを使用して符号化され、あまり頻繁でない「0」が1ビット、すなわち「0」を使用して符号化されるため、図11に示されたテーブルは次善の設計を有する。
【0068】
予測が追加される場合、より適切なVLCテーブル設計が可能になる。そのような改良されたVLCテーブル設計の一例を図12に示す。そのような改良されたVLC設計において、参照標識又はインデックス記号を符号化するため使用されるビットは、予測、すなわち現在のブロックのコンテキストに基づいて適応される。図12に示されたテーブルにおいて、現在のブロックのコンテキストにおいて最も頻繁に発生する参照標識は、この例においては「0」である単一ビットのコードワードを使用して符号化される。2ビットから成るコードワード「10」及び「11」は、それぞれ、2番目に高い発生頻度を有する参照標識及び3番目に高い発生頻度を有する参照標識等を識別するように規定される。参照標識の符号器及び復号器の双方は、予測の実行方法及びコードワードの解釈の方法を認識し且つそれらに合意すべきである。
【0069】
上述の例は単なる一例にすぎず、可能な設計はこれに限定されない。例えばより多くの参照標識又はインデックス記号が含まれる場合、種々のVLCテーブルを参照標識又はインデックス記号に割り当てる種々の方法がある。手法の一例は、頻繁に発生する参照標識が小さいインデックス番号を割り当てられ、頻繁に発生しない参照標識が大きいインデックス番号を割り当てられ、並びに大きいインデックス番号より小さいインデックス番号の方が符号化するために少ないビットを要するように、インデックスの発生確率によりインデックス付けを変更することである。コンテキスト対応2値算術符号化(CABAC)は、参照標識又は参照インデックスの確率に従ってそれら参照標識又は参照インデックスを表す変動するビットコストを実現するために使用される。上述したように、種々のコンテキストのいくつかの例は、隣接ブロックと関連付けられた参照標識、参照標識のカウント数又は参照標識の重み付きカウント数等である。
【0070】
例えばH.264を使用する最新技術において、2つのMV/参照ピクチャ、参照ブロック又は参照エリアを使用して双方向予測ブロックを生成することは、2つの参照エリアを平均すること含む。MVが参照エリアにおいてサブ画素の位置を指し示す場合、サブ画素の位置の画素値は、平均する前に最初に生成される必要がある。サブ画素の位置の画素値の生成を「空間フィルタリング(spatial filtering)」と呼ぶ。すなわち、生成処理は各参照エリアの空間フィルタリングを含む。従って、2つの参照エリアを使用して双方向予測ブロックを生成する最新技術の処理は、第1のエリアを空間フィルタリングすること、第2のエリアを空間フィルタリングすること及び最後にフィルタリングされたエリアを平均することを含む。空間フィルタリングは、相対的に複雑な計算を必要とする。
【0071】
この計算の複雑さは軽減されることが理解される。これを以下に説明する。複雑さを軽減するために、ブロックは、例えば2つの参照ブロックを共に追加する(空間フィルタリングを実行せずに)ことにより、最初に整数動きに基づいて構成される。この追加は、計算の複雑さの観点から相対的に安価な演算である。その後、結果として得られるブロックは、1/2画素又は1/4画素解像度等を得るために、補間等のフィルタリングがされる。サブ画素は、MVのうちの1つに従って又は別個に符号化/復号化された追加情報等に基づいて調整される。
【0072】
ブロックが2つ以上のMV及び参照インデックスと関連付けられる場合、これは本明細書において「マルチ予測」と呼ばれ、マルチ予測のそれぞれの単一方向予測成分が判定される。単一方向予測は、例えばイントラ予測であるため「単一予測」と呼ばれる。分割情報は、これらの単一方向予測間の絶対差分に基づいて導出されることが理解される。分割情報は、細粒度分割情報を搬送する際のオーバヘッドを回避するために、符号器及び復号器の双方において導出される。
【0073】
単一方向予測間の絶対差分が相対的に大きい領域において、単一の単一方向予測又は特定の双方向予測が使用される。単一の単一方向予測は、双方向予測(又はマルチ予測)の単一方向予測成分のうちの1つに対してビットストリームにおいて示された参照インデックス及びMVに従って実行される。単一方向予測間の絶対差分が相対的に小さいブロックの他の領域において、双方向予測は、ブロックに対してビットストリームにおいて示されるように使用される。領域に対して単一の双方向予測/特定の双方向予測を使用するか、あるいはビットストリームにおいて示された双方向予測を使用するかの判断は、例えば領域と関連付けられた単一方向予測間の絶対差分と事前定義された閾値との比較に基づく。
【0074】
ここで、2つのMV及び2つの参照エリアと関連付けられた双方向予測ブロックを仮定する。従来、この段階において、このブロックは、更に分割されず、そのまま符号化される。しかし、絶対差分又は「差分マップ」を解析することで取得された「黙示的な(implicit)」情報は、符号器及び復号器の双方においてブロックを更なるパーティションに分割するために使用されることが理解される。
【0075】
2つの参照エリア又は予測の絶対差分が算出される場合、差分マップにおいてより大きい絶対値を含むある領域及びより小さい絶対値を含むある領域がある。領域における小さい値の絶対差分は、通常、同一のオブジェクトが双方の参照エリアのこの領域に描かれることを表す。種々のオブジェクトがそれぞれの参照エリアの領域に描かれる場合、絶対差分は大きくなる。同一のオブジェクトがそれぞれの参照エリアの対応する領域に描かれる場合、領域を平均するのが好適であり適切である。対応する領域が種々のオブジェクトを描く場合、それらを平均することは意味がない。
【0076】
例えば、閾値が規定される。ここで、閾値より大きい差分値は「異なるオブジェクトの領域」を表し、閾値より小さい差分値は「同一のオブジェクトの領域」を表す。ブロックは、事前定義された方式でこれらの領域に従って分割される。上述したように、分割は、黙示的な情報に基づいて、すなわち分割を説明する明示的な信号伝送なしで実行される。この別の利点は、「正方形以外の分割」がサポートされることである。例えば、半球が1つのブロックに描かれる場合、ブロックは、球の境界の周囲で非常に正確に分割される。
【0077】
符号器は、上述の分割手法が使用されるべきかを復号器に信号伝送する。分割手法が使用されるべきであると信号伝送される場合、符号器は、相対的に大きい絶対差分値を有する領域に対して、使用する単一方向予測又は使用する特定の双方向予測を必要に応じて信号伝送する。例えば、重み付き双方向予測(平均以外であり、場合によってはDCオフセットを含む)が使用される。特定の双方向予測を生成できるようにローカルパラメータを判定するために何らかの追加情報を符号化/復号化することが必要な場合もある。取得した分割情報は、分割情報を予測するために更に使用され、符号器は、復号器により復号化され且つ使用される予測パーティションと比較して変更を符号化する。参照エリア間の差分に基づいて分割情報を導出することは、分割方法の大まかな指示を与える。予測された分割情報の改良点を送出することで更なる改良も可能である
分割情報を取得する一例は、ブロックを4つの同等のサイズのサブブロックに分割することである。例えばサブブロックの正規化SAD(差分絶対値和(算出された画素数で除算された))が4倍大きい「親」ブロックの正規化SAD以上である場合、最大の正規化SADを有するサブブロックは、4つの同等のサイズの領域に繰り返し分割される。正規化SADは、画素毎のSAD又は特定のサブブロックサイズ毎のSADを示す。SADではなく、画素差分を示す他の計測値が代わりに使用可能である。一例は、エッジ/線等の強力な局所画像構造に対してより大きな重みを有する計測値である。その後、更に分割されない残りのサブブロックは、双方向予測の何らかの変形例等を使用すべきパーティションに設定される。
【0078】
図13は、分割方法の例示する一実施形態を示す。左側のブロック1302:aは、双方向予測される。SADは、ブロック(ここで1302:bで示された)上で算出され、大きいSADのエリアは、識別及び選択され、それに応じて処理される。この例において、大きいSADのエリアは、逆方向MVのみを使用する単一方向予測に変更することで処理される。従って、元のブロックは2つのパーティションに分割される。2つのパーティションのうちの一方は、ビットストリームにおいて示された双方向予測を使用し、他方(円を含むものとして示された)は、単一方向予測(双方向予測の成分のうちの1つ)を使用する。レート歪み最適化(RDO)は、最適な単一方向予測(双方向予測の成分)を選択するために使用される。
【0079】
分割情報の取得方法の別の例は、例えば双方向予測ブロックを同等のサイズの複数のサブブロックに分割し、当該サブブロックサイズの最大SADを判定し、例えばある特定の間隔内から双方向予測又は単一方向予測の何らかの変更バージョンを使用する領域の部分であるこの最大値に「近接」するSADを有するサブブロックを選択することである。
【0080】
分割することに加えて、例えばこの手法は、双方向予測モードが使用される場合に上述したRISインデックス又は最新技術の参照インデックスを判定するために使用される。例えば、領域に対する平滑差分マップは、領域が場合によっては「双方向RISインデックス」と関連付けられることを示唆し、そのように解釈される。手法は、別の予測としてあるいは上述した参照標識インデックス予測と組み合わせて更に使用される。選択は、双方向予測の可能な候補間のSADに基づいて符号器及び復号器の双方において行われ、最小SADを含む組合せを選択する。
【0081】
尚、分割手法に基づく上述のマルチ予測を使用する場合、ブロックに基づく分割を導出するのではなく、他の種類の分割が符号器及び復号器の双方において導出される。これは、例えばエッジ検出及び/又はセグメンテーション等の非線形画像処理方法に従って、ブロックを2つ以上のパーティションに線形(例えば、水平方向、垂直方向又は対角線方向)分割すること又は非線形分割することを含む。例えば、マルチ予測差分信号は、エッジ検出又は領域成長等の画像セグメンテーション方法に従ってセグメンテーションされ、ブロックパーティションは、セグメンテーションされた差分信号に基づいて導出される。
【0082】
サブパーティションの数は、画像セグメンテーション等の画像処理方法により導出されるか、あるいは符号器から復号器に信号伝送される。線形分割又は非線形分割の代わりとして、画素に基づく分割も適用可能である。1つの変形例は、使用される分割方法を符号器から復号器に信号伝送することであり、別の変形例は、分割方法が他の信号伝送手段を介して符号器と復号器との間で合意されることである。マルチ予測に基づく方法を使用する利点は、分割情報が符号器及び復号器において既に使用可能な情報に基づいて導出されることである。すなわち、分割情報が明示的に信号伝送される必要がないため、符号化のために使用されるビット数は減少する。
【0083】
尚、マルチ予測に基づく分割によれば、双方向予測から双方向予測のために使用されたMVから導出された単一方向MVによる単一方向予測に切り替えるのではなく、サブパーティションに対して更なるMV及び/又は予測モード(単一方向インターピクチャ予測、双方向インターピクチャ予測又はイントラピクチャ予測)を信号伝送することも可能である。換言すると、ブロックに対するパーティションの数及び形状は、セグメンテーション方法等に基づいて明示的に信号伝送され且つ/あるいは黙示的な情報から導出される。また、MV及び/又は予測モードは、結果として得られるサブパーティションのうちのいくつか又は全てに対して信号伝送される。
【0084】
例として提供された特定の実施形態を参照して上述したような手順を説明したが、一般に説明は、本発明の概念を例示することのみを意図し、添付の請求の範囲により規定される提案された方法及び装置の範囲を限定するものとして解釈されるべきではない。一般的な用語で説明したが、例えば方法及び装置は、例えばGSM(登録商標)/EDGE、W CDMA又はLTE、あるいはDVB−S、DVB−T又はDVB−C等の衛星、地上波又はケーブルを介した放送技術等の一般に使用可能な通信技術を使用する種々の通信システムに対してだけでなく、メモリに対する映像の格納/検索に対しても適用可能である。
【0085】
対話ユニット又はモジュールの選択及びユニットの名称は、例示する目的のためにすぎず、上述の方法のうちのいずれかを実行するのに適した映像処理エンティティは、提案された処理動作を実行できるように複数の別の方法で構成されてもよいことが更に理解される。
【0086】
尚、本明細書において説明したユニット又はモジュールは、独立した物理エンティティとして考えられる必要はなく、論理エンティティとして考えられる。
【0087】
略語
AVC 高度映像符号化
CABAC コンテキスト対応2値算術符号化
GOP Group Of Pictures
MB マクロブロック
MV 動きベクトル
RIS 参照インデックス信号伝送(Reference Index Signaling)/参照情報標識信号伝送(Reference Information Indicator Signaling)
SAD 差分絶対値和
VLC 可変長符号化
【特許請求の範囲】
【請求項1】
映像復号化エンティティにおける方法であって、
符号化ブロックBeと関連付けられた単一の構文要素を取得するステップ(402)と、
前記取得した構文要素に基づいて参照モード及び1つ以上の参照ピクチャを識別するステップ(404)と、
前記識別された参照モード及び1つ以上の参照ピクチャに基づいて前記ブロックBeを復号化(406)するステップとを有し、画素の復号化ブロックBを提供することを特徴とする方法。
【請求項2】
参照モード及び1つ以上の参照ピクチャの前記識別は、前記取得した構文要素と前記ブロックBeを復号化する際に使用される前記参照モード及び1つ以上の特定の参照ピクチャとの事前定義されたマッピングに基づくことを特徴とする請求項1に記載の方法。
【請求項3】
前記単一の構文要素は、事前定義された第1の参照リストにおけるエントリを表すことを特徴とする請求項1又は2に記載の方法。
【請求項4】
前記第1の参照リストは、
複数の参照ピクチャ、
単一の参照ピクチャ
のうちの少なくとも1つを識別する1つ以上のエントリを含むことを特徴とする請求項3に記載の方法。
【請求項5】
前記第1の参照リストにおける各エントリは、参照モードを更に識別することを特徴とする請求項4に記載の方法。
【請求項6】
前記単一の構文要素は、事前定義された第2の参照リストにおける参照モード及びエントリを更に表すことを特徴とする請求項3又は4に記載の方法。
【請求項7】
前記第2の参照リストは、単一の参照ピクチャを識別する1つ以上のエントリを含むことを特徴とする請求項6に記載の方法。
【請求項8】
前記1つ以上のリストエントリはリストインデックスにより識別されることを特徴とする請求項3乃至7のいずれか1項に記載の方法。
【請求項9】
前記取得した構文要素を表すビット数は、前記構文要素の特定の値の確率に関連し、少ないビットが確率値を示し、より多くのビットがより小さい確率値を示すことを特徴とする請求項1乃至8のいずれか1項に記載の方法。
【請求項10】
隣接ブロックと関連付けられた単一の構文要素に基づいてBeに対して参照情報予測を実行するステップを更に備えることを特徴とする請求項1乃至9のいずれか1項に記載の方法。
【請求項11】
マルチ予測と関連付けられたブロックの1つ以上のサブ領域を識別するステップと、
ここで、そのサブ領域に対して、前記マルチ予測参照ブロックのそれぞれの対応する領域は相対的に低い相関性を有するl
前記ブロックの前記識別された1つ以上のサブ領域に対して、前記マルチ予測ではなく別の予測を使用するステップと
を更に備えることを特徴とする請求項1乃至10のいずれか1項に記載の方法。
【請求項12】
映像復号化エンティティ(501)における装置(500)であって、
符号化ブロックBeと関連付けられた単一の構文要素を取得するように構成された取得ユニット(504)と、
前記取得した構文要素に基づいて参照モード及び1つ以上の参照ピクチャを識別するように構成された識別ユニット(506)と、
前記識別された参照モード及び1つ以上の参照ピクチャに基づいて前記ブロックBeを復号化し、画素の復号化ブロックBを提供するように構成された復号化ユニット(508)と、
を備えることを特徴とする装置(500)。
【請求項13】
前記取得した構文要素と前記ブロックBeを復号化する際に使用される前記参照モード及び1つ以上の特定の参照ピクチャとの事前定義されたマッピングに基づいて、前記参照モード及び前記1つ以上の参照ピクチャを識別するように更に構成されることを特徴とする請求項12に記載の装置。
【請求項14】
前記単一の構文要素を事前定義された第1の参照リストにおけるエントリを表すものとして解釈するように更に構成されることを特徴とする請求項12又は13に記載の装置。
【請求項15】
前記第1の参照リストは、
複数の参照ピクチャ、
単一の参照ピクチャ
のうちの少なくとも1つを識別する1つ以上のエントリを含むことを特徴とする請求項14に記載の装置。
【請求項16】
前記第1の参照リストにおける各エントリは、参照モードを更に識別することを特徴とする請求項15に記載の装置。
【請求項17】
前記単一の構文要素を事前定義された第2の参照リストにおける参照モード及びエントリを更に表すものとして解釈するように更に構成されることを特徴とする請求項14又は15に記載の装置。
【請求項18】
前記第2の参照リストは、単一の参照ピクチャを識別する1つ以上のエントリを含むことを特徴とする請求項17に記載の装置。
【請求項19】
前記1つ以上のリストエントリはリストインデックスにより識別されることを特徴とする請求項14乃至18のいずれか1項に記載の装置。
【請求項20】
少ないビットが確率値を示し、より多くのビットがより小さい確率値を示すように、前記取得した構文要素を表すビット数を前記構文要素の特定の値の確率に相関するものとして解釈するように更に構成されることを特徴とする請求項12乃至19のいずれか1項に記載の装置。
【請求項21】
隣接ブロックと関連付けられた単一の構文要素に基づいてBeに対して参照情報予測を実行するように更に構成されることを特徴とする請求項12乃至20のいずれか1項に記載の装置。
【請求項22】
マルチ予測と関連付けられたブロックの1つ以上のサブ領域を識別するように更に構成され、そのサブ領域に対して、前記マルチ予測参照ブロックのそれぞれの対応する領域が相対的に低い相関性を有し、
前記ブロックの前記識別された1つ以上のサブ領域に対して、前記マルチ予測ではなく別の予測を使用するように更に構成されることを特徴とする請求項12乃至21のいずれか1項に記載の装置。
【請求項23】
映像符号化エンティティにおける方法であって、
参照モード及び1つ以上の参照ピクチャを使用して画素のブロックBを符号化(602)し、符号化ブロックBeを提供するステップと、
前記参照モード及び前記1つ以上の参照ピクチャを識別する単一の構文要素を導出するステップ(604)と、
前記単一の構文要素を前記ブロックBeの復号器に提供するステップ(606)と、
を有することを特徴とする方法。
【請求項24】
前記構文要素は、前記使用された参照モード及び1つ以上の参照ピクチャが事前定義されたマッピング方式に従って前記構文要素にマッピングされることで導出されることを特徴とする請求項23に記載の方法。
【請求項25】
前記単一の構文要素は、事前定義された第1の参照リストにおけるエントリを表すことを特徴とする請求項23又は24に記載の方法。
【請求項26】
前記第1の参照リストは、
複数の参照ピクチャ、
それぞれの単一の参照ピクチャ
のうちの少なくとも1つを識別する1つ以上のエントリを含むことを特徴とする請求項25に記載の方法。
【請求項27】
前記第1の参照リストにおける各エントリは、参照モードを更に識別することを特徴とする請求項26に記載の方法。
【請求項28】
前記単一の構文要素は、事前定義された第2の参照リストにおける参照モード及びエントリを更に表すことを特徴とする請求項25又は26に記載の方法。
【請求項29】
前記第2の参照リストは、それぞれの単一の参照ピクチャを識別する1つ以上のエントリを含むことを特徴とする請求項28に記載の方法。
【請求項30】
前記1つ以上のリストエントリはリストインデックスにより識別されることを特徴とする請求項25乃至29のいずれか1項に記載の方法。
【請求項31】
より高い確率が少ないビットに対応し、より低い確率がより多くのビットに対応するように、前記構文要素が識別する前記特定のモード及びピクチャの確率に相関するように前記構文要素を表すビット数を選択するステップを更に備えることを特徴とする請求項23乃至30のいずれか1項に記載の方法。
【請求項32】
Bの隣接ブロックと関連付けられた単一の構文要素に基づいてB又はBeに対して参照情報予測を実行することを更に備えることを特徴とする請求項23乃至31のいずれか1項に記載の方法。
【請求項33】
マルチ予測と関連付けられたブロックの1つ以上のサブ領域を識別するステップと、
ここで、そのサブ領域に対して、前記マルチ予測参照ブロックのそれぞれの対応する領域は相対的に低い相関性を有する;
前記ブロックの前記識別された1つ以上のサブ領域に対して、前記マルチ予測ではなく別の予測を使用するステップと
を更に備えることを特徴とする請求項23乃至32のいずれか1項に記載の方法。
【請求項34】
映像符号化エンティティにおける装置(700)であって、
参照モード及び1つ以上の参照ピクチャを使用して画素のブロックBを符号化することにより、符号化ブロックBeを提供するように構成された符号化ユニット(702)と、
前記参照モード及び前記1つ以上の参照ピクチャを識別する単一の構文要素を導出するように構成された導出ユニット(704)と、
前記単一の構文要素を前記ブロックBeの復号器に提供するように構成された提供ユニット(706)と、
を備えることを特徴とする装置(700)。
【請求項35】
前記参照モード及び1つ以上の参照ピクチャと前記構文要素との所定のマッピングから前記構文要素を導出するように更に構成されることを特徴とする請求項34に記載の装置。
【請求項36】
事前定義された第1の参照リストにおけるエントリを表す単一の構文要素を選択することで前記単一の構文要素を導出するように更に構成されることを特徴とする請求項34又は35に記載の装置。
【請求項37】
前記第1の参照リストは、
複数の参照ピクチャ、
それぞれの単一の参照ピクチャ
のうちの少なくとも1つを識別する1つ以上のエントリを含むことを特徴とする請求項36に記載の装置。
【請求項38】
前記第1の参照リストにおける各エントリは、参照モードを更に識別することを特徴とする請求項37に記載の装置。
【請求項39】
事前定義された第2の参照リストにおける参照モード及びエントリを更に表すように前記単一の構文要素を導出するように更に構成されることを特徴とする請求項36又は37に記載の装置。
【請求項40】
前記第2の参照リストは、それぞれの単一の参照ピクチャを識別する1つ以上のエントリを含むことを特徴とする請求項39に記載の装置。
【請求項41】
1つ以上の事前定義された参照リストにおける1つ以上のエントリを識別するリストインデックスを前記選択することで前記単一の構文要素を導出するように更に構成されることを特徴とする請求項36乃至40のいずれか1項に記載の装置。
【請求項42】
より高い確率が少ないビットに対応し、より低い確率がより多くのビットに対応するように、前記構文要素が識別する前記特定のモード及びピクチャの確率に相関するように前記構文要素を表すビット数を選択するように更に構成されることを特徴とする請求項34乃至41のいずれか1項に記載の装置。
【請求項43】
隣接ブロックと関連付けられた単一の構文要素に基づいてB又はBeに対して参照情報予測を実行するように更に構成されることを特徴とする請求項34乃至42のいずれか1項に記載の装置。
【請求項44】
マルチ予測と関連付けられたブロックの1つ以上のサブ領域を識別するように更に構成され、
ここで、そのサブ領域に対して、前記マルチ予測参照ブロックのそれぞれの対応する領域は相対的に低い相関性を有する;
前記ブロックの前記識別された1つ以上のサブ領域に対して、前記マルチ予測ではなく別の予測を使用するように更に構成される
ことを特徴とする請求項34乃至43のいずれか1項に記載の装置。
【請求項45】
請求項12乃至22及び請求項34乃至44のいずれか1項に記載の装置において実行された時に請求項1乃至11及び請求項23乃至33のいずれか1項に記載の対応する手順を前記装置に実行させるコンピュータ可読コード手段を備えることを特徴とするコンピュータプログラム(810)。
【請求項46】
請求項45に記載の前記コンピュータプログラムを含むことを特徴とするコンピュータが可読な記憶媒体(808)。
【請求項1】
映像復号化エンティティにおける方法であって、
符号化ブロックBeと関連付けられた単一の構文要素を取得するステップ(402)と、
前記取得した構文要素に基づいて参照モード及び1つ以上の参照ピクチャを識別するステップ(404)と、
前記識別された参照モード及び1つ以上の参照ピクチャに基づいて前記ブロックBeを復号化(406)するステップとを有し、画素の復号化ブロックBを提供することを特徴とする方法。
【請求項2】
参照モード及び1つ以上の参照ピクチャの前記識別は、前記取得した構文要素と前記ブロックBeを復号化する際に使用される前記参照モード及び1つ以上の特定の参照ピクチャとの事前定義されたマッピングに基づくことを特徴とする請求項1に記載の方法。
【請求項3】
前記単一の構文要素は、事前定義された第1の参照リストにおけるエントリを表すことを特徴とする請求項1又は2に記載の方法。
【請求項4】
前記第1の参照リストは、
複数の参照ピクチャ、
単一の参照ピクチャ
のうちの少なくとも1つを識別する1つ以上のエントリを含むことを特徴とする請求項3に記載の方法。
【請求項5】
前記第1の参照リストにおける各エントリは、参照モードを更に識別することを特徴とする請求項4に記載の方法。
【請求項6】
前記単一の構文要素は、事前定義された第2の参照リストにおける参照モード及びエントリを更に表すことを特徴とする請求項3又は4に記載の方法。
【請求項7】
前記第2の参照リストは、単一の参照ピクチャを識別する1つ以上のエントリを含むことを特徴とする請求項6に記載の方法。
【請求項8】
前記1つ以上のリストエントリはリストインデックスにより識別されることを特徴とする請求項3乃至7のいずれか1項に記載の方法。
【請求項9】
前記取得した構文要素を表すビット数は、前記構文要素の特定の値の確率に関連し、少ないビットが確率値を示し、より多くのビットがより小さい確率値を示すことを特徴とする請求項1乃至8のいずれか1項に記載の方法。
【請求項10】
隣接ブロックと関連付けられた単一の構文要素に基づいてBeに対して参照情報予測を実行するステップを更に備えることを特徴とする請求項1乃至9のいずれか1項に記載の方法。
【請求項11】
マルチ予測と関連付けられたブロックの1つ以上のサブ領域を識別するステップと、
ここで、そのサブ領域に対して、前記マルチ予測参照ブロックのそれぞれの対応する領域は相対的に低い相関性を有するl
前記ブロックの前記識別された1つ以上のサブ領域に対して、前記マルチ予測ではなく別の予測を使用するステップと
を更に備えることを特徴とする請求項1乃至10のいずれか1項に記載の方法。
【請求項12】
映像復号化エンティティ(501)における装置(500)であって、
符号化ブロックBeと関連付けられた単一の構文要素を取得するように構成された取得ユニット(504)と、
前記取得した構文要素に基づいて参照モード及び1つ以上の参照ピクチャを識別するように構成された識別ユニット(506)と、
前記識別された参照モード及び1つ以上の参照ピクチャに基づいて前記ブロックBeを復号化し、画素の復号化ブロックBを提供するように構成された復号化ユニット(508)と、
を備えることを特徴とする装置(500)。
【請求項13】
前記取得した構文要素と前記ブロックBeを復号化する際に使用される前記参照モード及び1つ以上の特定の参照ピクチャとの事前定義されたマッピングに基づいて、前記参照モード及び前記1つ以上の参照ピクチャを識別するように更に構成されることを特徴とする請求項12に記載の装置。
【請求項14】
前記単一の構文要素を事前定義された第1の参照リストにおけるエントリを表すものとして解釈するように更に構成されることを特徴とする請求項12又は13に記載の装置。
【請求項15】
前記第1の参照リストは、
複数の参照ピクチャ、
単一の参照ピクチャ
のうちの少なくとも1つを識別する1つ以上のエントリを含むことを特徴とする請求項14に記載の装置。
【請求項16】
前記第1の参照リストにおける各エントリは、参照モードを更に識別することを特徴とする請求項15に記載の装置。
【請求項17】
前記単一の構文要素を事前定義された第2の参照リストにおける参照モード及びエントリを更に表すものとして解釈するように更に構成されることを特徴とする請求項14又は15に記載の装置。
【請求項18】
前記第2の参照リストは、単一の参照ピクチャを識別する1つ以上のエントリを含むことを特徴とする請求項17に記載の装置。
【請求項19】
前記1つ以上のリストエントリはリストインデックスにより識別されることを特徴とする請求項14乃至18のいずれか1項に記載の装置。
【請求項20】
少ないビットが確率値を示し、より多くのビットがより小さい確率値を示すように、前記取得した構文要素を表すビット数を前記構文要素の特定の値の確率に相関するものとして解釈するように更に構成されることを特徴とする請求項12乃至19のいずれか1項に記載の装置。
【請求項21】
隣接ブロックと関連付けられた単一の構文要素に基づいてBeに対して参照情報予測を実行するように更に構成されることを特徴とする請求項12乃至20のいずれか1項に記載の装置。
【請求項22】
マルチ予測と関連付けられたブロックの1つ以上のサブ領域を識別するように更に構成され、そのサブ領域に対して、前記マルチ予測参照ブロックのそれぞれの対応する領域が相対的に低い相関性を有し、
前記ブロックの前記識別された1つ以上のサブ領域に対して、前記マルチ予測ではなく別の予測を使用するように更に構成されることを特徴とする請求項12乃至21のいずれか1項に記載の装置。
【請求項23】
映像符号化エンティティにおける方法であって、
参照モード及び1つ以上の参照ピクチャを使用して画素のブロックBを符号化(602)し、符号化ブロックBeを提供するステップと、
前記参照モード及び前記1つ以上の参照ピクチャを識別する単一の構文要素を導出するステップ(604)と、
前記単一の構文要素を前記ブロックBeの復号器に提供するステップ(606)と、
を有することを特徴とする方法。
【請求項24】
前記構文要素は、前記使用された参照モード及び1つ以上の参照ピクチャが事前定義されたマッピング方式に従って前記構文要素にマッピングされることで導出されることを特徴とする請求項23に記載の方法。
【請求項25】
前記単一の構文要素は、事前定義された第1の参照リストにおけるエントリを表すことを特徴とする請求項23又は24に記載の方法。
【請求項26】
前記第1の参照リストは、
複数の参照ピクチャ、
それぞれの単一の参照ピクチャ
のうちの少なくとも1つを識別する1つ以上のエントリを含むことを特徴とする請求項25に記載の方法。
【請求項27】
前記第1の参照リストにおける各エントリは、参照モードを更に識別することを特徴とする請求項26に記載の方法。
【請求項28】
前記単一の構文要素は、事前定義された第2の参照リストにおける参照モード及びエントリを更に表すことを特徴とする請求項25又は26に記載の方法。
【請求項29】
前記第2の参照リストは、それぞれの単一の参照ピクチャを識別する1つ以上のエントリを含むことを特徴とする請求項28に記載の方法。
【請求項30】
前記1つ以上のリストエントリはリストインデックスにより識別されることを特徴とする請求項25乃至29のいずれか1項に記載の方法。
【請求項31】
より高い確率が少ないビットに対応し、より低い確率がより多くのビットに対応するように、前記構文要素が識別する前記特定のモード及びピクチャの確率に相関するように前記構文要素を表すビット数を選択するステップを更に備えることを特徴とする請求項23乃至30のいずれか1項に記載の方法。
【請求項32】
Bの隣接ブロックと関連付けられた単一の構文要素に基づいてB又はBeに対して参照情報予測を実行することを更に備えることを特徴とする請求項23乃至31のいずれか1項に記載の方法。
【請求項33】
マルチ予測と関連付けられたブロックの1つ以上のサブ領域を識別するステップと、
ここで、そのサブ領域に対して、前記マルチ予測参照ブロックのそれぞれの対応する領域は相対的に低い相関性を有する;
前記ブロックの前記識別された1つ以上のサブ領域に対して、前記マルチ予測ではなく別の予測を使用するステップと
を更に備えることを特徴とする請求項23乃至32のいずれか1項に記載の方法。
【請求項34】
映像符号化エンティティにおける装置(700)であって、
参照モード及び1つ以上の参照ピクチャを使用して画素のブロックBを符号化することにより、符号化ブロックBeを提供するように構成された符号化ユニット(702)と、
前記参照モード及び前記1つ以上の参照ピクチャを識別する単一の構文要素を導出するように構成された導出ユニット(704)と、
前記単一の構文要素を前記ブロックBeの復号器に提供するように構成された提供ユニット(706)と、
を備えることを特徴とする装置(700)。
【請求項35】
前記参照モード及び1つ以上の参照ピクチャと前記構文要素との所定のマッピングから前記構文要素を導出するように更に構成されることを特徴とする請求項34に記載の装置。
【請求項36】
事前定義された第1の参照リストにおけるエントリを表す単一の構文要素を選択することで前記単一の構文要素を導出するように更に構成されることを特徴とする請求項34又は35に記載の装置。
【請求項37】
前記第1の参照リストは、
複数の参照ピクチャ、
それぞれの単一の参照ピクチャ
のうちの少なくとも1つを識別する1つ以上のエントリを含むことを特徴とする請求項36に記載の装置。
【請求項38】
前記第1の参照リストにおける各エントリは、参照モードを更に識別することを特徴とする請求項37に記載の装置。
【請求項39】
事前定義された第2の参照リストにおける参照モード及びエントリを更に表すように前記単一の構文要素を導出するように更に構成されることを特徴とする請求項36又は37に記載の装置。
【請求項40】
前記第2の参照リストは、それぞれの単一の参照ピクチャを識別する1つ以上のエントリを含むことを特徴とする請求項39に記載の装置。
【請求項41】
1つ以上の事前定義された参照リストにおける1つ以上のエントリを識別するリストインデックスを前記選択することで前記単一の構文要素を導出するように更に構成されることを特徴とする請求項36乃至40のいずれか1項に記載の装置。
【請求項42】
より高い確率が少ないビットに対応し、より低い確率がより多くのビットに対応するように、前記構文要素が識別する前記特定のモード及びピクチャの確率に相関するように前記構文要素を表すビット数を選択するように更に構成されることを特徴とする請求項34乃至41のいずれか1項に記載の装置。
【請求項43】
隣接ブロックと関連付けられた単一の構文要素に基づいてB又はBeに対して参照情報予測を実行するように更に構成されることを特徴とする請求項34乃至42のいずれか1項に記載の装置。
【請求項44】
マルチ予測と関連付けられたブロックの1つ以上のサブ領域を識別するように更に構成され、
ここで、そのサブ領域に対して、前記マルチ予測参照ブロックのそれぞれの対応する領域は相対的に低い相関性を有する;
前記ブロックの前記識別された1つ以上のサブ領域に対して、前記マルチ予測ではなく別の予測を使用するように更に構成される
ことを特徴とする請求項34乃至43のいずれか1項に記載の装置。
【請求項45】
請求項12乃至22及び請求項34乃至44のいずれか1項に記載の装置において実行された時に請求項1乃至11及び請求項23乃至33のいずれか1項に記載の対応する手順を前記装置に実行させるコンピュータ可読コード手段を備えることを特徴とするコンピュータプログラム(810)。
【請求項46】
請求項45に記載の前記コンピュータプログラムを含むことを特徴とするコンピュータが可読な記憶媒体(808)。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【公表番号】特表2013−514718(P2013−514718A)
【公表日】平成25年4月25日(2013.4.25)
【国際特許分類】
【出願番号】特願2012−544439(P2012−544439)
【出願日】平成22年12月17日(2010.12.17)
【国際出願番号】PCT/SE2010/051412
【国際公開番号】WO2011/075071
【国際公開日】平成23年6月23日(2011.6.23)
【出願人】(598036300)テレフオンアクチーボラゲット エル エム エリクソン(パブル) (2,266)
【Fターム(参考)】
【公表日】平成25年4月25日(2013.4.25)
【国際特許分類】
【出願日】平成22年12月17日(2010.12.17)
【国際出願番号】PCT/SE2010/051412
【国際公開番号】WO2011/075071
【国際公開日】平成23年6月23日(2011.6.23)
【出願人】(598036300)テレフオンアクチーボラゲット エル エム エリクソン(パブル) (2,266)
【Fターム(参考)】
[ Back to top ]