説明

ハイブリッド・イントラ・インター符号化ブロックを符号化する方法及び装置

ハイブリッド・イントラ・インターの両方向予測(又は多方向予測)の符号化モードによって、現行のマクロブロック又はサブブロック(図5中の310)をハイブリッド符号化するうえでフレーム内(イントラ)(図5中の301)予測とフレーム間(インター)(図5中の302)とを一諸に組み合わせることが可能になる。両方向予測は、2つの別々のイントラ予測方向を用いる2つのイントラ予測を組み合わせて、Iピクチャにも用い得る。ビデオ符号器(700)は、市場で入手可能な従来のビデオカメラによって生成された2次元ビデオ画像を表すデータを処理する。ビデオ符号器は、現行マクロブロックを符号化するうえで、イントラ符号化モードと、Pフレーム・インター符号化モードと、Bフレーム両方向インター・モードと、ハイブリッド・イントラ・インター両方向予測符号化モードとのうちから選択するよう形成される。ビデオ復号器(800)は、ハイブリッド・イントラ・インター両方向予測符号化モードによって符号化されるブロック/マクロブロックを含み得るデータストリームを受信し、復号化する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、一般的に、ディジタル・ビデオ・コデックに関し、特に、マクロブロックのイントラ符号化とインター符号化とのハイブリッド利用に関する。
【背景技術】
【0002】
ビデオ符号器は、画像系列の1つ又は複数のフレームをディジタル情報に符号化するのに用いることができる。このディジタル情報は更に、受信器に送信し得るものであり、画像又は画像系列は更に、再構成(復号化)することができる。伝送チャネル自体は、何れかの数の、考えられる伝送チャネルを含み得る。例えば、伝送チャネルは、無線で放送する無線チャネルや他の手段、同軸のケーブル・テレビのケーブル、GSM携帯電話のTDMAチャネル、固定回線電話リンクやインターネットであり得る。こうした伝送手段のリストは、例証的なものに過ぎず、全て包含することを意味するものでは何らない。
【0003】
種々の国際標準が、ビデオの符号化及び伝送について合意されている。一般的には、標準は、画像のフレームに関するデータを圧縮し、符号化するうえでの規則を備える。こうした規則は、画像データを圧縮し、符号化して、画像について元々備えられるビューイングカメラよりも少ないデータを伝送する方法を備える。こうしたデータ容量の削減によって、更に、伝送に必要とするチャネル帯域が少なくて済む。受信器は、送信器が圧縮及び符号化を行うのに用いた規則が分かっている場合に送信データから画像を再構成(すなわち復号化)することができる。H.264標準は、先行フレームからのマクロブロックの動き補償予測を用いることによって画像の一部の冗長な伝送を最小にする。
【0004】
MPEG−2やJVT/H.264/MPEGパート10/AVCなどのビデオ圧縮のアーキテクチャ及び標準は、各マクロブロックを符号化するうえでフレーム内(「イントラ」)符号化手法とフレーム間(「インター」)符号化手法との何れかのみを用いてマクロブロックを符号化する。フレーム間動き推定/補償の場合、符号化する対象のビデオ・フレームは、重なり合わない矩形の画素ブロックに分割され、更に一般的には、重なり合わない正方形の画素ブロックに分割される。こうしたマクロブロック毎に、最善のマッチのマクロブロックが、所定のマッチ誤差基準による所定のサーチ・ウインドウにおいて参照フレームからサーチされる。更に、マッチするマクロブロックを用いて現行マクロブロックを予測し、予測誤差マクロブロックは更に処理され、復号器に送信される。元のマクロブロックに対する参照マクロブロックの水平方向及び垂直方向における相対的なシフトは、グルーピングされ、元のマクロブロックの動きベクトル(MV)として表され、これは復号器にも送信される。動き推定の主な目的は、参照マクロブロックと現行マクロブロックとの差分を得ることによって得られる差分マクロブロックが符号化における最低数のビットを生成するようにマクロブロックを予測するというものである。
【0005】
イントラ符号化の場合、ピクチャ内のマクロブロック(MB)又はサブマクロブロックは空間予測手法を用いて予測される。インター符号化の場合、時間予測手法(すなわち、動き推定/補償手法)が用いられる。一般的には、インター予測(符号化)手法は通常、
イントラ符号化手法よりも効率が高い。既存のアーキテクチャ/標準では、復号器に送信するよう、符号化することができるイントラMB又はインターMBのタイプを規定又は制限する特定のピクチャ・タイプ又はスライス・タイプが定義される。イントラ(I)のピクチャ又はスライスでは、イントラMBタイプのもののみを符号化することができるが、予測(P)ピクチャ又はスライス、及び両方向予測(B)ピクチャ又はスライスに対しては、イントラMBタイプのものもインターMBタイプのものも符号化し得る。
【0006】
Iピクチャ又はIスライスは、イントラ符号化マクロブロックのみを含み、時間予測は用いない。現行マクロブロックの画素値はまず、その近傍の画素の値から空間的に予測される。残差情報は更に、NxN変換(例えば、4x4DCT変換又は8x8DCT変換)を用いて変換され、更に量子化される。
【0007】
Bピクチャ又はBスライスによって、両方向予測の(すなわち、一般化すれば、複数の予測の)インター符号化マクロブロック・タイプの概念が導入され、マクロブロック(MB)又はサブブロックは、2つ(又は3つ以上)のフレーム間予測によって予測される。両方向予測によって、Bピクチャは通常、Iピクチャ及びPピクチャよりも符号化における効率が高くなりがちである。
【0008】
Pピクチャ又はBピクチャは、種々のスライス・タイプを含み得るものであり、種々の手法によって符号化されたマクロブロックを含み得る。スライスは、I(イントラ)タイプ、P(予測)タイプ、B(両方向予測)タイプ、SP(スイッチングP)タイプ又はSI(スイッチングI)タイプのものであり得る。
【0009】
イントラ予測手法及びインター予測手法は、MPEG−2やH.264などのビデオ符号化のアーキテクチャ及び標準内で別個に用いられている。イントラ符号化マクロブロックの場合、同じフレーム内又はピクチャ内に利用可能なものとして存在する空間サンプルを用いて現行マクロブロックを予測する一方、インター予測では、他のピクチャ内又は他のフレーム内の時間サンプルを代わりに用いる。H.264標準では、マクロブロック内の4x4ブロック毎に予測処理を行う4x4イントラ・モードと、単一の工程でマクロブロック全体について予測を行う16x16イントラ・モードとの2つの別々のイントラ符号化モードが存在する。
【0010】
ビデオ系列の各フレームは、ルミナンス(Y)情報と、(色空間によって、場合によっては空間的にサブサンプリングされる)関連したクロミナンス(U,V)情報とを備えるいわゆる「マクロブロック」に分割される。マクロブロックは、元の画像における16x16の画像画素領域を4つの8x8のルミナンス(ルマ)情報ブロックとして表すことによって形成され、各ルミナンス・ブロックは、8x8のルミナンス(Y)値アレイと、相当する、8x8のクロミナンス(U,Y)値アレイをもたらすよう水平方向及び垂直方向において2倍でサブサンプリングされる、2つの空間的に相当するクロミナンス成分(U及びV)とを備える。
【0011】
16x16の空間(イントラ)予測モードでは、16x16マクロブロック全体のルマ値が、MBのエッジ付近の画素から予測される。16x16イントラ予測モードでは、16x16のルマ・ブロックの、すぐ上にあるもの及び/又は左にあるものである33の近傍サンプルを、現行マクロブロックの予測に用い、4つのモード(0垂直、1水平、2DC、3平面予測)のみを用いる。
【0012】
図1は、関連技術のH.264標準における4x4イントラ・モードのフレーム内(イントラ)予測を示す。図1における画素「a」乃至「p」を含む、イントラ符号化する対象の4x4ルマ・ブロックのサンプルは、近傍ブロックからの、図1における近くの画素「A」乃至「M」を用いて予測される。復号器では、同じピクチャ/フレームの先行マクロブロックからのサンプル「A」乃至「M」は通常、既に復号化されており、更に、現行マクロブロック110の予測に用いることができる。
【0013】
図2は、図1の4x4ルマ・ブロック110について、0、1、3、4、5、6、7及び8とラベリングされた9つのイントラ予測モードを示す。モード2は、「DC予測」である。他のモード(1、3、4、5、6、7及び8)は、図2において矢印で示す予測の方向を表す。
【0014】
H.264標準において定義されているイントラ・マクロブロックのタイプは以下の通りである。
【0015】
【表1】

図3は、2つのピクチャ(301及び302)のブロックのうちの最善のマッチ(BM)間の動きベクトル(すなわち、MV、Motion Vector)を推定することによって、空間予測の代わりに時間予測を用いてPフレーム又はPスライスにおいてインター符号化される対象の現行マクロブロック310を表す。インター符号化では、現行フレーム301における現行ブロック310は、先行フレーム302における変位マッチング・ブロック(BM)から予測される。各インター符号化ブロック(例えば、310)は、ブロック310における画素全てを予測することができる参照インデックスref_idxに関連付けられる参照ピクチャ(302)内の相当する位置を復号器に備える動きパラメータ群(動きベクトル及び参照インデックスref_idx)に関連付けられる。元のブロック(310)とその予測(BM)との差分が圧縮され、変位動きベクトル(MV)とともに送信される。動きは、16x16マクロブロック又は、そのサブマクロブロック分割である16x8と8x16と8x8と8x4と4x8と4x4との何れかについて無関係に推定することができる。8x8マクロブロック分割は、サブマクロブロック(又はサブブロック)として知られている。以降、「ブロック」の語は、概括的に、16x16マクロブロック全体及び/又はサブマクロブロック分割などの何れかの寸法の矩形の近傍画素群を表す。サブマクロブロック分割毎に1つの動きベクトル(MV)のみが許容される。動きは、マクロブロックのref_idxを用いて、選択されるフレームとマクロブロックを関連付けることによって過去又は将来における別々のフレームからマクロブロック毎に推定することができる。
【0016】
Pスライスは、イントラ符号化マクロブロックも含み得る。Pスライス内のイントラ符号化マクロブロックは、Iスライスにおけるイントラ符号化マクロブロックと同様に圧縮される。インター符号化ブロックは、動き推定及び動き補償のストラテジを用いて予測される。
【0017】
フレーム全体のマクロブロック全てがイントラ・モードを用いて符号化され、伝送される場合、「INTRAフレーム」(Iフレーム又はIピクチャ)の伝送として表す。INTRAフレームはよって、全て、イントラ・マクロブロックから成る。通常、INTRAフレームは、受信マクロブロックを受信器が未だ何ら保持していない、画像伝送の開始時に伝送しなければならない。マクロブロックの一部又は全部を符号化することによってフレームが符号化され、伝送される場合、フレームは、「INTERフレーム」として表す。通常、INTERフレームは、INTRAフレームよりも、伝送するうえで備えるデータが少ない。しかし、符号器は、特定のマクロブロックが、最も効率的なものが何れであるかによって、イントラ符号化マクロブロック又はインター符号化マクロブロックとして伝送される。
【0018】
Pスライスにおいてインター符号化する対象の16x16マクロブロックは全て、16x8分割と、8x16分割と、8x8分割に分割し得る。サブマクロブロック自体は、8x4サブマクロブロック分割、4x8サブマクロブロック分割又は4x4サブマクロブロック分割に分割し得る。H.264におけるマクロブロック分割又はサブマクロブロック分割は各々、一意の動きベクトルに割り当てられる。インター符号化されるマクロブロック及びマクロブロック分割は、一意の予測モード及び参照インデックスを有する。現行のH.264標準では、インター予測及びイントラ予測が同じマクロブロックの別々の分割において選択し、一緒に混ぜることは可能でない。西暦2002年2月に採用された、H.264/AVCにおいて企図されたものでは、ウィーガンド他によって当初採用された分割手法は、マクロブロック(8x8ルマ及び4x4クロマ)単位でイントラとインターとの間の切り替えのサポートを含んでいた。この機能は、復号化の計算量を削減するために後に除外された。
【0019】
Pピクチャ及びPスライスでは、以下の更なるブロック・タイプが定義されている。
【0020】
【表2】

図4は、Bピクチャ又はBスライスにおけるマクロブロックのインター符号化を行ううえでの2つの(時間的)予測の組み合わせを示す。
【0021】
図4に示すように、マクロブロック410をBピクチャ内又はBスライス内でインター符号化する場合、現行のマクロブロックについて1つの「最善のマッチ」(BM)予測子(予測)のみを用いる代わりに、2つの(時間的)予測(BML0及びBML1)を、現行マクロブロック410に用い、それらを併せて平均をとって最終予測を形成することができる。Bピクチャ又はBスライスでは、サブマクロブロック分割毎に、動きの2つの推定を表す、2つの動きベクトル(MVL0及びMVL1)まで、時間予測に許容される。それらは、後続又は先行する何れかの参照ピクチャ(List0参照及びList1参照)からのものであり得る。(List0及びList1の)参照ピクチャ内の最善マッチ・ブロック(BML0及びBML1)における画素値の平均が予測子として用いられる。この標準は、それらの平均をとる代わりに、最善マッチ・ブロック(BML0及びBML1)各々の画素値の不均一な重み付けを行うことも可能にする。これは、重み付け予測モードと呼ばれ、フェージングなどの特殊ビデオ作用が存在する状態において有用である。Bスライスは、特殊モードである直接モードを有する。MotionCopyスキップ・モードにおいて用いる空間手法と、直接モードは、動きパラメータの推定についてのみ制限され、マクロブロック(画素)の推定については制限されるものでなく、空間的近傍サンプルは何ら用いられない。直接モードでは、マクロブロックの動きベクトルは、明示的に送られるものでない。
【0022】
以下のマクロブロック・タイプは、Bピクチャ及びBスライスにおける利用について定義される。
【0023】
【表3】

上記表に示すように、Bスライスでは、2つの時間予測は、同じブロック・タイプを用いるよう常に制限される。
【0024】
デブロッキング・フィルタ及び重複ブロック動き補償(OBMC)は、ある程度の空間相関を用いる。これらの手法によれば、再構成画素には、予測と、関連した残差の加算との後に、そのモード(イントラ又はインター)、位置(MB/ブロック・エッジ、内部画素等)、動き情報、関連残差及び、周囲の画素の差分によって空間的に処理/フィルタリングが行われる。この処理はかなり、ブロッキング・アーチファクトを削減し、品質を向上させる一方、(特に復号器内で)計算量をかなり増大させ得るものでもある。この処理は、常に最善の結果をもたらす訳でないことがあり得るものでもあり、それ自体が、エッジ上に更なるぼかしを挿入することもあり得る。
【発明の開示】
【発明が解決しようとする課題】
【0025】
既存のビデオ圧縮標準(例えば、MPEG−2及びH.264)では、現行のマクロブロック又はサブブロックを符号化するうえで(インターのみの両方向予測における2つのインターフレーム予測の組み合わせのように)フレーム内(イントラ)予測とフレーム間(インター)予測を一緒に組み合わせることが可能でない。
【課題を解決するための手段】
【0026】
本発明の原理によれば、特定のマクロブロック、サブブロック又は分割の符号化及び復号化におけるイントラ予測とインター予測とを組み合わせるようにしている。イントラ予測及びインター予測の組み合わせは、利得及び/又は符号化効率を可能にするもの及び/又はビデオ・データ誤差伝播を更に削減し得るものである。
【0027】
本発明の実施例は、現行ブロックの第1の予測を現行ブロックの第2の予測と組み合わせることによってハイブリッド・イントラ・インター符号化ブロックを復号化するようにしており、現行ブロックの第1の予測は、イントラ予測であり、現行ブロックの第2の予測は、インター予測である。
【0028】
以下の記載を通して、マクロブロックのルミナンス(ルマ)成分は、4つの8x8ブロック・アレイとして配置される16x16画素を備え、関連したクロミナンス成分に、水平方向及び垂直方向で2倍の空間的サブサンプリングを施して8x8ブロックを形成することとする。他のブロック・サイズ及び他のサブサンプリング手法に対する、以下の記載の拡張は、当業者に明らかになるものである。本発明は、16x16マクロブロック構造によって限定されない一方、何れかのセグメント化ベースのビデオ符号化システムに用いることができる。
【発明を実施するための最良の形態】
【0029】
本発明の上記特徴は、添付図面を参照しながらその例示的な実施例を詳細に説明することによって一層明らかになる。
【実施例】
【0030】
図5は、同じ4x4ブロックがインター予測及びイントラ予測を用いて予測される、インター・イントラ・ハイブリッド両方向予測の例を表す。図5は、関連技術とは違って、
空間予測(「A」乃至「M」、301)と時間予測(MV、302)とを組み合わせて、現行マクロブロック又は現行サブブロック110を両方向予測符号化することができる、関連技術のイントラのみ(図1及び図2)の予測モード及びインターのみ(図3及び図4)の予測モードとは区別される、本明細書及び特許請求の範囲ではイントラ・インター・ハイブリッド符号化モードと呼ぶ新たな両方向予測モード・タイプを示す。この新たな両方向予測(又は多方向予測)モードは、1つ又は複数のイントラ予測を含み得る2つ(又は3つ以上)の予測を、特定のブロック又はマクロブロックの最終予測を行うのに用いる(組み合わせる)というものである。両方向予測は、イントラとイントラとを組み合わせた予測によってIピクチャにおいても用い得る。これらの2つのイントラ予測は、2つの別々のイントラ予測方向を用い得る。
【0031】
本願に開示するハイブリッド両方向予測符号化モードによって、現行のマクロブロック、サブマクロブロック又は分割を符号化するうえでフレーム内(イントラ)予測とフレーム間(インター)予測とを一緒に組み合わせる(例えば、平均をとるか、重み付けを行う)ことが可能になる。本発明の原理によれば、関連技術の、予測を組み合わせる手法(両方向予測又は多方向予測)は、特定のマクロブロック、サブブロック又は分割を符号化するうえでイントラ予測とインター予測とを組み合わせるようにすることによって拡張される。イントラ予測とインター予測とを組み合わせは、利得及び符号化効率を向上させることを可能にするもの及び/又はビデオ・データ誤差伝播を削減し得るものである。
【0032】
本発明の実施例は、ビデオ符号器内及びビデオ復号器内で一体化させることができるいくつかの新たなマクロブロック・モード/タイプを備える。新たなマクロブロック・モードは、MPEG−2やH.264などのいくつかの符号化アーキテクチャ及び符号化標準において既に用いられている両方向予測(多方向予測)マクロブロック・モードと、マクロブロック又はサブブロック毎に2つ以上の予測を用いるという点で類似している一方、従来のインターのみの(時間的)両方向予測に対して、フレーム内(空間的)予測、も用いることができる(しか用いることができない)という点で異なる。例えば、2つの別々のイントラ予測の組み合わせ又はインター予測とイントラ予測との組み合わせ利用が特定のマクロブロックについてより良好な予測を与える一方、本願に開示する両方向予測符号化方法を行っている間に近傍空間サンプルを考慮し得るものとすれば、ブロッキング・アーチファクトを削減するうえで有益であり得るものでもあるということが考えられる。同じマクロブロック又はサブブロックを符号化するうえでイントラ予測及びインター予測を組み合わせるという本願に開示する方法は、更に高い性能につながり得るが、それは、a)単一の予測のみを用いる場合に維持されない重要な特徴的情報を何れかの予測が含み得ることと、b)何れかのピクチャが、平均をとるか重み付けを行うことによって削減することができる種々の符号化アーチファクトを含み得ることと、c)平均をとることが、雑音除去手法等として機能することが理由である。
【0033】
更に、本願に開示する両方向予測マクロブロック符号化モード(又は多方向予測マクロブロック符号化モード)は、同じ分割タイプを用いるよう制約されないインター予測モードをサポートし、表1乃至表3に定義されるイントラ・タイプと単一リスト・インター・タイプとの考えられる組み合わせ全てを用いることを可能にする。本願に開示する両方向マクロブロック符号化モード(又は多方向マクロブロック符号化モード)は、同じ符号化対象マクロブロックの別々の分割に基づいて行う対象のインター予測及びイントラ予測をサポートする。例えば、マクロブロック毎に2つまでの(両方向)予測のみが、ハイブリッド・イントラ・インター符号化マクロブロックについて可能である場合、第1の予測はintra4x4(表1におけるmb_type0)である一方、第2の予測は、16x8list1ブロック予測(表3におけるmb_type6)であり得る。
【0034】
シンタックス及びサブモードのタイプ
各マクロブロックをハイブリッド符号化するうえで用いる予測タイプは、(H.264におけるBスライスに用いる形式のような)組み合わせ形式においてか、別個に(すなわち、ツリー構造を用いて)ビットストリーム内で通知される。任意的には、予測の数(例えば、1、2、又は3以上)もビットストリーム内で通知し得る。関連技術において用いる組み合わせ通知手法は、考えられる、予測タイプの組み合わせ全て又は、最も可能性が高い、予測タイプの組み合わせを列挙することを必要とすることになり、最高の圧縮利得をもたらす訳でないことがあり得る。圧縮利得は、各予測モードを別個に通知して、別個のツリー構造アーキテクチャを用いることによって最適化することができる。この方法によって、シンタックスを単純な状態に維持する一方で、表1乃至表3に定義されるイントラ・タイプと単一リスト・インター・タイプとの考えられる組み合わせ全てを用いることが可能になる。例えば、マクロブロック毎に2つの(両方向)予測までのみハイブリッド符号化マクロブロックについて可能な場合、第1の予測がintra4x4(表1におけるmb_type0)である一方、第2の予測は16x8list1ブロック予測(表3におけるmb_type6)であり得る。これらの更なるサブモードについて、イントラ方向及び/又は関連した参照インデックス及び動きベクトルなどのそれらの関連パラメータも送信する必要がある。この手法によって、両方の/全ての、予測が、イントラであるが、別々の方向を有するか、別々のリストの予測であるか、別々のブロック分割を用いるものなどの種々の組み合わせが可能になる。
【0035】
H.264標準に備えるサブモードに対する調節及び拡張を行うことも好ましいものであり得るが、それは、(a)一部の組み合わせが同一であることと、(b)マクロブロックに単一の予測を用いることが一部の場合には望ましいことがあり得ることが理由である。例えば、ケース(a)の場合、同一の予測モードを禁止し、サブモード・タイプを自動的に調節し得る一方。ケース(b)の場合、予測をしないことを示唆する新たなヌル・ブロック予測タイプを定義する以下の更なるモードを導入することができる。
【0036】
【表4】

同じサブ分割(例えば、B_Null_L0_8x16やB_Null_L1_8x16)について2つのヌル予測ブロック・タイプを組み合わせることは禁止されており、このことは、この場合も又、関連技術のmb_typeの表を適合させることによって更なる効果を備えることになるということを示唆する。同様な拡張を8x8サブブロック/分割について行い得る。表3に定義される両方向予測モードは全て、本願に開示するハイブリッド・モードによってサポートすることができるので、冗長であるものとして除外し得る。
【0037】
ハイブリッド・イントラ・インター両方向予測による直接モードの拡張
H.264において用いる空間的直接モードを、本発明のハイブリッド・イントラ・インター両方向予測モード実施例によって拡張することができる。現在、直接モード・ブロックの動きベクトルは、3つの近傍ブロックの動きベクトルのメジアンに基づいて判定される。
【0038】
少なくとも1つの近傍の両方向予測モードがハイブリッド(インター・イントラ)である場合、現行の予測モード(直接モード)のブロックもハイブリッド(インター・イントラ)であり得る。この予測方法は、近傍ブロックによって利用される予測リストの利用可能性によって制限され得る。例えば、両方のリストが空間的近傍において利用可能である場合、直接モード・ブロックの動きベクトルが、近傍の1つがハイブリッド予測を利用するかにかかわらず、もう一度メジアン予測を用いて算出される。一方、近傍の1つがハイブリッド予測を利用する一方で、1つのリスト(例えば、list_1)のみが利用可能である場合、直接モード・ブロックも、同様に、同じ、利用可能なリストを利用する一方で、ハイブリッド予測によって予測される。更に、2つ以上の近傍ブロックがハイブリッド予測を利用する場合、予測に用いる対象のイントラ・モードに関する規則を規定することができる。例えば、Intra16x16は、この場合、その、予測の容易性によってIntra4x4に取って代わるものである。Intra4x4も直接モード・ブロック内で禁止し得るが、用いられる場合には、全ての4x4ブロック方向を、利用可能である場合に外部マクロブロック予測を当初用いて予測し得る。外部Intra4x4マクロブロックが何ら利用可能でない場合、近接ブロックから利用可能な最低イントラmb_typeが用いられる。一般的に、2つ以上の空間的近傍ブロックの、予測モードがイントラである場合、最低次イントラ予測が好ましくは用いられる一方、両方のリストが利用可能である場合、イントラは好ましくは用いられない。予測に必要なサンプルが利用可能でない場合にもイントラは用いられない。
【0039】
ループ内デブロッキング・フィルタ
H.264/AVC標準によるビデオ符号器は、ループ内デブロッキング・フィルタを利用して、主に、ブロック及びマクロブロックMBのエッジでの近傍画素間の相関を高め、復号化ピクチャに挿入されるブロック歪み(ブロッキング・アーチファクト)を削減し得る。フィルタリングされた復号化ピクチャを用いて、他のピクチャの動きを予測する。デブロッキング・フィルタは、マクロブロックの圧縮モード(イントラ又はインター)、量子化パラメータ、動きベクトル、フレーム又はフィールドの符号化判定、及び画素値によってその強度を調節する適応型フィルタである。量子化サイズが小さい場合、フィルタは自ら遮断する。このフィルタは、スライス・レベルで符号器によって明示的に遮断し得るものでもある。デブロッキング・フィルタについて種々の強度及び方法を、近傍ブロック符号化タイプ、動き及び伝送残差によって用いられる。本発明の実施例の特徴を利用することによって、ハイブリッド・イントラ・インター・マクロブロック・タイプは常に、その符号化中に近傍画素を考慮するイントラ予測子を含むので、デブロッキング・フィルタの強度を適宜修正し得る。例えば、ブロックがハイブリッド符号化され、その予測モードが、一方がイントラであり、更なる係数を有する2つ(又は3つ以上)の予測を用いる場合、相当するエッジのフィルタ強度を(例えば、1だけ)削減することができる。
【0040】
図6は、本発明の実施例による、ビデオ符号器604及びビデオ復号器605を示す構成略図を示す。符号器604は、ビデオ源602、例えばカメラから、画像系列についてのデータを受信する。本明細書及び特許請求の範囲に開示する方法によってカメラからのデータを圧縮し、符号化した後、符号器604は、情報を送信システム606に転送する。送信器606は、チャネル媒体611を介して、ハイブリッド符号化マクロブロックを含むビットストリームを送信する。送信チャネル媒体611は、無線、ケーブルや何れかの他の伝送手法又はルーティング手法によるものであり得る。符号器604又は復号器605の回路は、例えば、移動無線機すなわち携帯用双方向無線機、又は携帯電話機の一部を形成し得る。
【0041】
チャネル媒体611の復号化側にある動画像復号化装置(復号器605)は、ビットストリームをビットストリーム・バッファ631において受信し、(ビットストリーム解析器プロセッサ633によって)ビットストリームを解析し、イントラ符号化フレームAからの符号化画像データを復号化し、フレームAの復号化画像データをフレーム・メモリ635に記憶する。インター符号化差分データを受信すると、復号化装置(復号器605)は、フレームAの復号化データから動き補償予測画像を生成する。フレームAの受信データにおいて誤差が何らない場合、フレームAの復号化画像は、符号化装置(符号器604)側にあるフレームAの局所復号化画像とマッチするので、この復号化データから生成される動き補償予測画像は、符号化装置(符号器604)側にある動き補償予測画像にマッチする。符号化装置(符号器604)は、元の画像と動き補償予測画像との間の差分画像を送出するため、復号化装置は、動き補償予測画像を受信差分画像に加えることによってフレームBの復号化画像を生成することができる。復号化装置によって受信されるフレームAのデータが誤差を含む場合、フレームAの正確に復号化された画像は、生成することができない。よって、動き補償予測画像の誤差含有部分から生成される画像は全て、エラー・データになる。こうしたエラー・データは、リフレッシュ処理がイントラ符号化によって行われるまで残る。
【0042】
復号器605が、ハイブリッド符号化両方向予測データを受信すると、イントラ符号化情報を含むハイブリッド符号化ブロック・データを、復号器で利用して、画像データ・エラーの伝播を妨げるか、阻止する。画像内又は画像系列内のオブジェクトの特定の部分すなわち領域は、他の領域よりも重要であるか、エラーを受けやすいものとしてユーザ又は符号化装置によって識別可能であり得る。よって、符号化装置(符号器604)を、フレーム系列において、より重要な領域又はオブジェクトにおけるマクロブロックを、当該領域における画像データ・エラー伝播が妨げられるか削減されるように、選択的にハイブリッド符号化するよう形成し得る。
【0043】
図7は、参照数字700によって概括的に示す、本発明の実施例による例示的な符号器を表す。符号器700は、合計ブロック714の正の入力と信号通信するよう結合されるビデオ入力端子712を含む。合計ブロック714は、同様に、整数変換を実施して係数を備える機能ブロック716に結合される。機能ブロック716は、エントロピ符号化を実施して出力ビットストリームを備えるエントロピ符号化ブロック718に結合される。機能ブロック716は更に、スケーリング及び逆変換のブロック722でループ内部分720に結合される。機能ブロック722は合計ブロック724に結合され、合計ブロック724は同様に、フレーム内予測ブロック727に結合される。フレーム内予測ブロック726は、組み合わせ装置727の第1の入力であり、その出力は、合計ブロック724の第2の入力と、合計ブロック714の反転入力とに結合される。
【0044】
合計ブロック724の出力は、デブロッキング・フィルタ740に結合される。デブロッキング・フィルタ740は、フレーム記憶装置728に結合される。フレーム記憶装置728は、動き補償(フレーム間予測)ブロック730に結合され、このブロックは組み合わせ装置727の第2の出力に結合される。
【0045】
組み合わせ装置727は、フレーム内予測ブロック726からの第1の(イントラ)予測を、動き補償(フレーム間予測)ブロック730からの第2の(インター)予測と組み合わせて、結果として生じる、組み合わせた(ハイブリッド・イントラ・インター)予測を合計ブロック724の第2の入力と合計ブロック714の反転入力とに出力する。本発明の一部の実施例では、組み合わせ装置727を、動作するように1つ又は複数の利得ブロック(図9A参照。)に結合される(例えば、合計ブロック724又は714と同様な)合計ブロックとして実施して、入力されるイントラ予測及びインター予測の「平均」又は、イントラ予測及びインター予測の、違ったふうに重み付けされる組み合わせを生成し得る。本発明の他の実施例では、組み合わせ装置727は、フレーム内予測ブロック726からの第1のイントラ予測を、フレーム内予測ブロック726からの第2の(例えば、後続の)イントラ予測と組み合わせるよう形成され、フレーム内予測ブロック726からの第1の(イントラ)予測と動き補償(フレーム間予測)ブロック730からの第2の(インター)予測とを組み合わせるよう更に形成されるシーケンシャル加算器として実施し得る。
【0046】
ビデオ入力端子712は、動きベクトルを備えるよう更に、動き推定ブロック719に結合される。デブロッキング・フィルタ740は、動き推定(フレーム間予測)ブロック719の第2の入力に結合される。動き推定ブロック719の出力は、動き補償(フレーム間予測)ブロック730と、エントロピ符号化ブロック718の第2の入力にも結合される。
【0047】
ビデオ入力端子712は、符号器制御ブロック760に更に結合される。符号器制御ブロック760は、制御信号を備えて符号器700の動作を制御するよう、ブロック716、718、719、722、726、730及び740の各々の制御入力に結合される。
【0048】
図8は、参照数字800によって概括的に示す、本発明の実施例による例示的な復号器を表す。復号器800は、入力ビットストリームを受信するエントロピ復号化ブロック810を含む。復号化ブロック810は、スケーリング及び逆変換のブロック822でループ内部分820に係数を備えるよう結合される。逆変換ブロック822は合計ブロック824に結合され、合計ブロック824は同様にフレーム内予測ブロック826に結合される。フレーム内予測ブロック826は、組み合わせ装置827の第1の入力に結合され、その出力は合計ブロック824の第2の入力に結合される。
【0049】
合計ブロック824の出力は、出力画像を備えるようデブロッキング・フィルタ840に結合される。デブロッキング・フィルタ840は、フレーム記憶装置828に結合される。フレーム記憶装置828は動き補償(フレーム間予測)ブロック830に結合され、このブロックは組み合わせ装置827の第2の入力に結合される。復号化ブロック810は、動き補償(フレーム間予測)ブロック830の第2の入力に、動きベクトルを備えるよう更に結合される。
【0050】
復号器組み合わせ装置827は、フレーム内予測ブロック826からの第1の(イントラ)予測を動き補償(フレーム間予測)ブロック830から第2の(インター)予測と組み合わせて、結果として生じる、組み合わせた(ハイブリッド・イントラ・インター)予測を合計ブロック824の第2の入力に出力するという点で、図7の符号器における組み合わせ装置727に機能的に類似している。本発明の一部の実施例では、組み合わせ装置827は、1つ又は複数の利得ブロック(図9A参照。)に、動作するよう結合して、入力されるイントラ予測及びインター予測の「平均」又は、イントラ予測及びインター予測の、違ったふうに重み付けされる組み合わせを生成する(例えば、合計ブロック824に類似した)合計ブロックとして実施し得る。本発明の他の実施例では、組み合わせ装置827は、フレーム内予測ブロック826からの第1のイントラ予測をフレーム内予測ブロック826からの第2の(例えば、後続する)イントラ予測と組み合わせるよう形成され、フレーム内予測ブロック826からの第1の(イントラ)予測を動き補償(フレーム間予測)ブロック830からの第2の(インター)予測と組み合わせるよう更に形成されるシーケンシャル加算器回路として実施し得る。
【0051】
エントロピ復号化ブロック810は、復号器制御ブロック862に入力を備えるよう更に結合される。復号器制御ブロック862は、制御信号を通信し、復号器800の動作を制御するよう、ブロック822、826、830及び840の各々の入力を制御するよう結合される。
【0052】
図9A及び図9Bは、第1の予測と第2の予測とを加算して組み合わせる、例えば、イントラ予測とインター予測とを加算して組み合わせる回路を備える、図7の符号器又は図8の復号器における組み合わせ装置(例えば、727又は827)の例示的な実施例を各々が示す構成略図である。図9Aは、結合されるフレーム内予測ブロック(例えば、726又は826)からの第1のイントラ予測をフレーム内予測ブロック(例えば、726又は826)からの第2の(例えば、後続する)イントラ予測と組み合わせるよう形成され、フレーム内予測ブロック(例えば、726又は826)からの第1の(イントラ)予測を動き補償(フレーム間予測)ブロック(例えば、730又は830)からの第2の(インター)予測と組み合わせるよう更に形成される(シグマ信号によって表す)加算器回路A27を含む(例えば、組み合わせ装置727及び827を実施する)例示的な組み合わせ装置x27−aを表す。ディジタル利得ブロックG1、G2及びG3は、複数の(例えば、2つの)予測の重み付け(又は単純平均)を組み合わせるようにしている。本発明の別の実施例では、3つ未満(例えば、1つ又は2つ)のディジタル利得ブロックを備えて2つの予測を、例えば、図9Bに表すように組み合わせ得るということを当業者は認識するものである。
【0053】
図9Bは、フレーム内予測ブロック(例えば、726又は826)からの第1のイントラ予測とフレーム内予測ブロック(例えば、726又は826)からの第2の(例えば、後続する)イントラ予測との平均をとるよう形成され、フレーム内予測ブロック(例えば、726又は826)からの第1の(イントラ)予測と動き補償(フレーム間予測)ブロック(例えば、730又は830)からの第2の(インター)予測との平均をとるよう更に形成される(シグマ信号によって表す)加算器回路A27を含む例示的な組み合わせ装置x27−b(例えば、727及び827)を表す。1/2の利得値で固定されるディジタル利得ブロックG3は、(シグマ信号によって表す)加算器回路A27からの2つの予測出力の、和を除算する(和の平均をとる)ようにしている。
【0054】
本発明の種々の局面は、汎用コンピュータや何れかの他の適切な計算機環境において実行し得るソフトウェアで実施することができる。本発明は、パソコン、汎用コンピュータ、サーバ・コンピュータ、ハンドヘルド機器、ラップトップ機器、マルチプロセッサ、マイクロプロセッサ、セットトップボックス、プログラム可能な消費者向電子機器、ネットワークPC、ミニコンピュータ、メインフレーム・コンピュータ、分散処理計算機環境等のいくつかの汎用計算機環境や特殊用途向計算機環境において、コンピュータ判読可能媒体上に記憶されている、本発明のフレーム・ツー・フレーム・ディジタルビデオ符号化を行う旨のコンピュータ実行可能命令を実行するよう動作可能である。本発明は、コンピュータによって実行されるプログラム・モジュールなどのコンピュータ実行可能命令として部分的又は全体的に実施し得る。一般的に、プログラム・モジュールは、特定のタスクを行うか特定の抽象データ・タイプを実施するようルーチン、プログラム、オブジェクト、コンポーネント、データ構造等を含む。分散計算機環境では、プログラム・モジュールは、局所記憶装置内又は遠隔記憶装置内にあり得る。
【0055】
本発明の例示的な実施例は、前述しており、添付図面に示す。しかし、本発明は、上記例示的な実施例に限定されず、変形及び修正を、本発明の技術思想内及び範囲内で当業者によって行うことができる。したがって、例示的な実施例は、限定としてではなく、例として解されることとする。本発明の範囲は、上記説明によって定められるものでなく、本特許請求の範囲によって定められ、変形及び修正を、本発明の実施例に対して、本特許請求の範囲及びその均等物によって範囲が定められる、本発明の範囲から逸脱することなく行い得る。
【図面の簡単な説明】
【0056】
【図1】H.264標準による、イントラ符号化される対象の4x4画素ルマ・ブロック付近のサンプルを示す図である。
【図2】H.264標準による、図1の4x4ブロックの予測符号化の9つの方向を示す図である。
【図3】H.264標準による、動きベクトルを推定することによってインター符号化されるマクロブロックを表す図である。
【図4】H.264標準による、2つのインター符号化を組み合わせることによる、マクロブロックの両方向予測を表す図である。
【図5】本発明の原理による、インター予測及びイントラ予測を組み合わせた4x4ブロックのイントラ・インター・ハイブリッド両方向予測を表す図である。
【図6】本発明の原理によるビデオ符号器及びビデオ復号器を示す構成図である。
【図7】本発明の原理によるビデオ符号器を示す構成図である。
【図8】本発明の原理によるビデオ復号器を示す構成図である。
【図9A】図7の符号器又は図8の復号器における、イントラ予測とインター予測とを組み合わせる回路を示す構成図である。
【図9B】図7の符号器又は図8の復号器における、イントラ予測とインター予測とを組み合わせる回路を示す別の構成図である。

【特許請求の範囲】
【請求項1】
ハイブリッド・イントラ・インター符号化ブロックを復号化する方法であって、
現行ブロックの第1の予測を現行ブロックの第2の予測と組み合わせる工程を備え、
前記現行ブロックの前記第1の予測がイントラ予測であり、前記現行ブロックの前記第2の予測がインター予測であることを特徴とする方法。
【請求項2】
請求項1記載の方法であって、
前記ブロックの復号化が、
前記現行ブロックの前記第1の予測と、前記第2の予測と、第3の予測とを組み合わせることを特徴とする方法。
【請求項3】
請求項1記載の方法であって、
前記現行ブロックに隣接する画素間の相関を高めるよう形成されるデブロッキング・フィルタのフィルタ強度を削減する工程を更に備えることを特徴とする方法。
【請求項4】
請求項1記載の方法であって、
前記第1の予測及び前記第2の予測を、前記第1の予測と前記第2の予測との平均をとることによって組み合わせることを特徴とする方法。
【請求項5】
請求項1記載の方法であって、
前記第1の予測及び前記第2の予測を、前記第1の予測と前記第2の予測との各々を重み付けすることによって組み合わせることを特徴とする方法。
【請求項6】
請求項1記載の方法であって、
前記現行ブロックが、16x16マクロブロックであることを特徴とする方法。
【請求項7】
請求項1記載の方法であって、
前記現行ブロックが、サブマクロブロックであることを特徴とする方法。
【請求項8】
請求項1記載の方法であって、
前記現行ブロックが、4x4サブマクロブロック分割であることを特徴とする方法。
【請求項9】
ハイブリッド・イントラ・インター符号化ブロックを復号化し、再構成された画素データを備えるよう形成されるビデオ復号器であって、
動作するよう組み合わせ装置に接続され、ブロックの第1のイントラ予測を出力するフレーム内予測ブロックと、
動作するよう前記組み合わせ装置に接続され、前記ブロックの第1のインター予測を出力するフレーム間予測ブロックとを備えることを特徴とするビデオ復号器。
【請求項10】
請求項9記載のビデオ復号器であって、
前記組み合わせ装置は、前記第1のイントラ予測と前記第1のインター予測とを組み合わせるよう形成されることを特徴とするビデオ復号器。
【請求項11】
請求項9記載のビデオ復号器であって、
前記ハイブリッド・イントラ・インター符号化ブロックが、前記第1のイントラ予測と前記第1のインター予測との平均であることを特徴とするビデオ復号器。
【請求項12】
テレビであって、
請求項9記載のビデオ復号器を備えることを特徴とするテレビ。
【請求項13】
ビデオ復号器であって、
両方向予測イントラ・インター符号化ブロックを含むビットストリームを復号化するよう形成されることを特徴とするビデオ復号器。
【請求項14】
ブロックをビデオ復号化する方法であって、
現行ブロックの第1の予測を、現行ブロックの第2の予測と組み合わせる工程を備え、
前記現行ブロックの前記第1の予測はイントラ予測であり、前記現行ブロックの前記第2の予測はインター予測であることを特徴とする方法。
【請求項15】
2次元画像系列のフレーム内のブロックを復号化するビデオ復号器であって、
動作するよう組み合わせ装置に接続され、ブロックの第1のイントラ予測を出力するフレーム内予測ブロックと、
動作するよう前記組み合わせ装置に接続され、前記ブロックの第1のインター予測を出力するフレーム間予測ブロックとを備え、
前記組み合わせ装置は、前記第1のイントラ予測と前記第1のインター予測とを組み合わせ、ハイブリッド・イントラ・インター符号化ブロックを出力するよう形成されることを特徴とするビデオ復号器。
【請求項16】
請求項15記載のビデオ復号器であって、
前記組み合わせ装置は、合計ブロックであることを特徴とするビデオ復号器。
【請求項17】
請求項15記載のビデオ復号器であって、
前記組み合わせ装置は、前記第1のイントラ予測と前記第1のインター予測とを、2つの予測の平均をとることによって組み合わせることを特徴とするビデオ復号器。
【請求項18】
請求項15記載のビデオ復号器であって、
前記組み合わせ装置は、前記第1のイントラ予測と前記第1のインター予測とを、2つの予測を重み付けした組み合わせを用いることによって組み合わせることを特徴とするビデオ復号器。
【請求項19】
ブロックをビデオ復号化する方法であって、
現行ブロックについての第1の予測タイプを現行ブロックについての第2の予測タイプと組み合わせる工程を備え、
前記第1の予測タイプと前記第2の予測タイプとの前記組み合わせがハイブリッド予測タイプを形成することを特徴とする方法。
【請求項20】
請求項19記載の方法であって、
前記組み合わせる工程が、合計ブロックを用いて達成されることを特徴とする方法。
【請求項21】
請求項19記載の方法であって、
前記2つの予測タイプを組み合わせる工程が、前記2つの予測タイプの平均をとることによって達成されることを特徴とする方法。
【請求項22】
請求項19記載の方法であって、
前記2つの予測タイプを組み合わせる工程が、前記2つの予測タイプの、重み付けした組み合わせを施すことによって達成されることを特徴とする方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9A】
image rotate

【図9B】
image rotate


【公表番号】特表2007−503775(P2007−503775A)
【公表日】平成19年2月22日(2007.2.22)
【国際特許分類】
【出願番号】特願2006−524780(P2006−524780)
【出願日】平成16年8月24日(2004.8.24)
【国際出願番号】PCT/US2004/027397
【国際公開番号】WO2005/022919
【国際公開日】平成17年3月10日(2005.3.10)
【出願人】(501263810)トムソン ライセンシング (2,848)
【氏名又は名称原語表記】Thomson Licensing 
【住所又は居所原語表記】46 Quai A. Le Gallo, F−92100 Boulogne−Billancourt, France
【Fターム(参考)】