説明

イメージをコード化する方法およびイメージコーダ

【課題】本発明はデジタルイメージをコード化する方法に関する。
【解決手段】本方法において、デジタルイメージはブロック(C、L、U、UL、UR)に分割される。本方法においては、伝送されるべき情報量を減少させるために、ブロック(C)に関する空間予測が実施され、少なくとも1つの予測方法(P1−P13)が定義済みである。本方法においては、前述の隣接ブロック(L、U)の内容に従って予測されるべき既述ブロック(C)の少なくとも1つの隣接ブロック(L、U)に関して分類が決定され、予測方法(P1−P13)は、少なくとも1つの既述分類に基づいて現行ブロック(C)に関して選定される。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、デジタルイメージを複数のブロックに分割して符号化、すなわちコード化する方法に関する。また本発明は、デジタルイメージを複数のブロックに分割してコード化するデバイスにも関する。更に、本発明はデジタルイメージをコード化する手段と、デジタルイメージを複数のブロックに分割する手段と、を備えたエンコーダ、複数のブロックに分割されたデジタルイメージを復号するデコーダ、デジタルイメージをコード化する手段と、デジタルイメージを複数のブロックに分割する手段と、デジタルイメージを復号する手段と、を備えたコウディック、デジタルイメージをコード化する手段と、デジタルイメージを複数のブロックに分割する手段と、デジタルイメージを復号する手段と、を備えた移動ターミナル、及びデジタルイメージをコード化し、デジタルイメージを複数のブロックに分割する機械実行可能ステップを含むソフトウェアプログラムを記憶する記憶媒体に関する。
【背景技術】
【0002】
本イメージはあらゆるデジタルイメージ、ビデオイメージ、TVイメージ、ビデオレコーダによって生成されたイメージ、コンピュータアニメーション、静止イメージ、等々であっても差し支えない。一般にデジタルイメージは水平および垂直線に配列された画素から成り、1つの単一イメージ内のそれらの個数は一般に数万個である。更に、各画素に関して生成される情報は、たとえば、一般に8ビットの解像度を持つ画素に関するルミナンス情報、および、色の適用においては、例えば、クロミナンス信号などのクロミナンス情報も含む。このクロミナンス信号は一般に2つの成分Cb及びCrから成り、これらの成分は一般に両方共8ビットの解像度で伝送される。これらルミナンス及びクロミナンス値に基づいて、ビデオ受信ターミナルのディスプレイデバイスにおける原画素に対応する情報を形成することが可能である。この例においては、各画素に関して伝送されるべきデータ量は非圧縮の24ビットである。従って、1つのイメージに関する情報の全体量は数メガビットに達する。移動イメージの伝送においては、毎秒数個のイメージが伝送される。たとえば、TVイメージにおいては、毎秒25個のイメージが伝送される。圧縮なしで伝送されるべき情報量は毎秒数十メガビットに達する。ただし、例えばインターネットデータ網におけるデータ伝送速度(レート)は毎秒64キロビット(kbits)程度であり、従って、このネットワークを介して非圧縮リアルタイムイメージ伝送を実際上不可能にする。
【0003】
伝送されるべき情報量を減少させるには、例えばJPEG、MPEG、H.263規格などのように、幾つかの異なる圧縮方法が開発されている。ビデオ伝送におけるイメージ(画像)圧縮はインタフレーム圧縮、イントラフレーム圧縮、または、これらの組み合わせのいずれかとして実施可能である。インタフレーム圧縮における目的は連続するイメージフレーム内の冗長情報を除去することにある。一般にイメージは例えば静止している背景のような多量の非変化情報、又は、例えば徐々に移動するとしても、ゆっくり変化する情報を含む。インタフレーム圧縮においては、動作補償された予測を利用することも可能であり、この場合の目的は動いているイメージ内のエレメントを検出することにあり、この場合には画素値を伝送する代りに運動ベクトル及び予測エラー情報が伝送される。
【0004】
リアルタイムでイメージ圧縮技法の使用を可能にするには、圧縮および圧縮解除をリアルタイムで実施することが可能であるような十分に高い処理速度を送受信ビデオターミナルが持たねばならない。
【0005】
幾つかのイメージ圧縮技法においては、イメージ信号が伝送通路に送られるか、或いは、記憶手段に記憶される以前に、デジタルフォーマットにおけるイメージ信号には離散型コサイン変換(DCT)が適用される。DCTを用いると、周期信号の周波数スペクトルを計算すること、即ち、時間ドメインから周波数ドメインへの変換を実施することが可能である。この文脈における離散的という用語は変換において連続関数の代わりに個別画素が処理されることを示す。デジタルイメージ信号における隣接画素は一般に本質的な空間相関性を持つ。DCTの一特徴は、DCTの結果として確立される係数は実質的に相互関係を持たないことである。従って、DCTは効率的な仕方において時間ドメインから(空間)周波数ドメインへのイメージ信号変換を実施し、イメージデータの冗長度を低下させる。従って、変換コード化の使用はインタフレームおよびイントラフレームコード化の両方において冗長度を低下させる効果的な方法である。
【0006】
独立コード化済みキーフレーム(イントラフレーム)に関するスチルイメージコード化およびビデオコード化において用いられる現行ブロックを基調とするコード化方法ではブリックを基調とする方法が用いられる。一般にイメージは、或る種の変換コード化を用いて独立してコード化されるNxMブロックに分割される。純粋ブロック基調コード化は画素のインターブロック相関については考慮することなしに特定のブロック内のインター画素相関を低下させるに過ぎない。従って、高度に相互関係を持つデータに関して非常に効率的なエネルギパッキング特質を持つ例えばDCTコーディングのような変換基調コーディングを用いる場合であってさえも純粋ブロック基調コード化はいくぶん高いビットレートを生成する。従って、現行デジタルイメージコード化規格はブロック間画素値の相関性も低下させる或る種の方法を開発する。
【0007】
現行デジタルイメージコード化方法は変換ドメインにおける予測を実施する。即ち、以前のコード化済みブロックを用いて現在コード化されつつあるブロックのDCT係数を予測することが試みられ、それによって、圧縮方法と結合させる。一般にイメージブロック内の平均画素値に対応するDCT係数は、以前のコード化済みブロックからの同一DCT係数を用いて予測される。実際の係数と予測された係数の差はデコーダに送られる。ただし、この方式は平均画素値のみを予測可能であり、あまり効率的ではない。
【0008】
また、DCT係数の予測は空間的に隣接するブロックを用いても実施可能である。例えば、ブロック内の平均画素値に対応するDCT係数は1つのブロックから左に向かうか、又は、コード化されつつある現行ブロック上に向かうDCT係数を用いて予測可能である。水平周波数(即ち垂直エッジ)に対応するDCT係数は現行ブロック上のブロックから予測可能であり、垂直周波数(即ち水平エッジ)に対応する係数は左に位置するブロックから予測可能である。以前の方法と同様に、実際の係数と予測された係数の間の差はコード化されて、デコーダに送られる。この方法は数個のブロックを通過する水平および垂直エッジの予測を可能にする。
【0009】
MPEG−2圧縮において、DCTはブロックサイズ8×8の画素を用いてブロックにおいて実施される。ルミナンスレベルは十分な空間解像度を用いて変換されるが、クロミナンス両信号はサブサンプリングされる。例えば、16×16画素のフィールドは8×8画素のフィールドへサブサンプリングされる。ブロックサイズの差は目はクロミナンスの変化をルミナンスの変化と同等に見分けないという事実に主として起因する。この場合、2×2画素のフィールドは同じクロミナンス値を用いてコード化される。
【0010】
MPEG−2規格は3つのフレームタイプ、即ち、Iフレーム(イントラ)、Pフレーム(予測済み)、Bフレーム(双方向性)を規定する。Iフレームはイメージ自体に含まれる情報に基づいて単独で生成される。この場合、イメージ全体を形成するために受信端においてIフレームを使用可能である。Pフレームは一般に最も近い先行IフレームまたはPフレームに基づいて形成される。この場合、受信段階において、先行Iフレーム又はPフレームは受信されたPフレームと共に応対的に使用される。Pフレームの合成に際して、情報量を圧縮するために、例えば動作補償が用いられる。Bフレームは先行Iフレーム及び後続PまたはIフレームに基づいて形成される。応対的に、受信段階において、先行および後続フレームの受信が終了するまで、Bフレームを合成することは可能でない。更に、送信段階において、PフレームとBフレームの順序が変えられる。この場合、Bフレームに後続するPフレームが先ず受信される。これは受信機におけるイメージの復元を加速する傾向がある。
【0011】
従来技術による解決方法において用いられるイントラフレームコード化方式は非能率的である。この場合、イントラコード化済みフレームの送信は帯域幅過剰である。これは低ビット速度デジタルイメージコード化利用における独立コード化済みキーフレームの使用を制限する。
【発明の概要】
【課題を解決するための手段】
【0012】
本発明は、幾つかの方向から予測の可能性を提供する画素値の予測を包含する空間予測方式を導入することによって、イメージデータにおける冗長度をどのようにして更に減少させるか、及び、イメージデータの更に効率的なコード化をどのようにして実現するかの問題を取り扱う。これは、異なる配向に関する縁の効率的な予測を可能にし、その結果としてビットレートがかなり節約される。本発明に従った方法も、ビットレートの更なる節約を提供する適当な予測方法を文脈に沿って選択する。
【0013】
本発明はイメージ内の画素値の空間的予測を実施する方法を導入する。本文書の技術的な記述はブロックに基づく静止イメージコード化およびブロックに基づくビデオコーダ用に使用できる空間予測に関する方法およびシステムを導入する。本発明のキーエレメントは多重予測方法と、文脈従属選択と、選定された予測方法の信号化を使用することである。多重予測方法と、文脈従属選択と、選定された予測方法の信号化の使用は、従来技術による解決方法に比べて、達成されるべきビットレートの実質的な節約を可能にする。
【0014】
本発明の一目的は、更に高い符号化効率が達成可能であり、コード化済みデジタルイメージのビットレートを更に低下可能であるように、デジタルイメージのコード化および復号を改良することにある。
【0015】
本発明によれば、本目的はイメージデータの空間的予測済みコード化を実施するためのエンコーダによって達成される。
【0016】
本発明の第1態様によれば、デジタルイメージをコード化する方法が提供され、この方法においては、デジタルイメージがブロックに分割され、伝送されるべき情報量を減少させるためにブロックに関する空間予測が実施されることを特徴とし、この場合、少なくとも1つの予測方法が規定され、予測されるべき前記ブロックの少なくとも1つの隣接ブロックに関して前記隣接ブロックの内容に従って分類が決定され、少なくとも1つの前記分類に基づいて現行ブロックに関する予測方法が選定される。
【0017】
本発明の第2態様によれば、ブロックに分割されるデジタルイメージをコード化するデバイスが提供される。本デバイスは、伝送されるべき情報量を減少させるためにブロックに関する空間予測を実施する手段を有することを特徴とし、ここに、少なくとも1つの予測方法が規定され、当該デバイスは更に予測されるべき前記ブロックの少なくとも1つの隣接ブロックに関する分類を前記隣接ブロックの内容に従って決定する手段と、少なくとも1つの前記分類に基づいて現行ブロックに関する予測方法を選択する手段を有する。
【0018】
本発明の第3態様に従い、デジタルイメージをコード化するための手段およびデジタルイメージをブロックに分割する手段を有するエンコーダが提供され、本エンコーダは伝送されるべき情報量を減少させるためにブロックに関する空間予測を実施する手段を有することを特徴とし、この場合、少なくとも1つの予測方法が規定済みであり、本エンコーダは更に予測されるべき前記ブロックの少なくとも1つ近隣ブロックに関して分類を前記隣接ブロックの内容に従って決定するための手段と、少なくとも前記1つの分類に基づいて現行ブロックに関して予測方法を選択する手段を有することを特徴とする。
【0019】
本発明の第4の態様に従い、ブロックに分割されるデジタルイメージを復号する手段を有するデコーダが提供され、本デコーダは伝送されるべき情報量を減少させるためにブロックに関する空間予測を実施する手段を有し、この場合、少なくとも1つの予測方法が規定済みであり、本デコーダは更に予測されるべき前記ブロックの少なくとも1つの隣接ブロックブロックに関する分類を前記隣接ブロックの内容に従って決定する手段を有し、少なくとも1つの前記分類に基づいて現行ブロックに関する予測方法を選択する手段を有することを特徴とする。
【0020】
本発明の第5の態様に従い、デジタルイメージをコード化する手段と、デジタルイメージをブロックに分割する手段と、デジタルイメージを復号する手段とを有するコウディックが提供され、本コウディックが伝送されるべき情報量を減少させるためにブロックに関する空間予測を実施する手段と、ここに少なくとも1つの予測方法が規定済みであり、本コウディックが予測されるべき前記ブロックの少なくとも1つの隣接ブロックに関する分類を前記隣接ブロックの内容に従って決定する手段と、少なくとも1つの前記分類に基づいて現行ブロックに関する予測方法を選択する手段と、を有することを特徴とする。
【0021】
本発明の第6の態様に従い、デジタルイメージをコード化する手段と、デジタルイメージをブロックに分割する手段と、デジタルイメージを復号する手段とを有する移動ターミナルが提供され、本移動ターミナルが伝送されるべき情報量を減少させるためにブロックに関する空間予測を実施する手段を有し、ここに少なくとも1つの予測方法が規定済みであり、本移動ターミナルが予測されるべき前記ブロックの少なくとも1つの隣接ブロックに関する分類を前記隣接ブロックの内容に従って決定する手段と、少なくとも1つの前記分類に基づいて現行ブロックに関する予測方法を選択する手段と、を有することを特徴とする。
【0022】
本発明の第7の態様に従い、デジタルイメージをコード化するため、および、デジタルイメージをブロックに分割するための機械実行可能なステップを含むソフトウェアプログラムを記憶する記憶媒体が提供され、本ソフトウェアプログラムが更に伝送されるべき情報量を減少させるためにブロックに関する空間予測を実施する機械実行可能なステップを含み、ここに少なくとも1つの予測方法が規定済みであり、予測されるべき前記ブロックの少なくとも1つの隣接ブロックに関する分類を前記隣接ブロックの内容に従って決定するためのステップと、少なくとも1つの前記分類に基づいて現行ブロックに関する予測方法を選択するステップと、を含むことを特徴とする。
【0023】
本発明はコード化されるべきブロックに関する画素の空間予測を実施するために隣接ブロックの内容に何等かの方向性が存在するかどうかを決定するための隣接復号済みブロックが調査されるというアイデアに基づく。次に、この方向性情報はブロックを分類するために使われる。隣接ブロックのクラスの組み合わせに基づき、次に、適当な予測方法を用いて現行ブロックの内容(画素値)が予測される。予測方法はデコーダに合図される。ひずみ対ビットレートセンスにおいてそれをすることが効率的であるならば予測エラー情報も同様に送られる。
【0024】
従来技術の解決方法と比較すると、本発明によりかなりの利点が達成される。本発明に従った方法を用いると、デジタルフォーマットにおいてイメージを伝送する場合に必要な情報量を減少させることが可能である。
【0025】
一般に、本発明に従った方法はブロックを基調とする静止イメージのコード化ならびにブロックを基調とするデジタルイメージコーダにおけるイントラフレームコード化に適用可能である。
【図面の簡単な説明】
【0026】
添付図面を参照して、本発明について更に詳細に説明することとする。
【図1】デジタルイメージ伝送システムの構造を示す図である。
【図2】構成図の形式において本発明の空間予測方法を示す図である。
【図3a】本発明の有利な実施形態に従って予測用に使用されるブロックを示す図である。
【図3b】本発明の有利な実施形態に従って予測用に使用されるブロックを示す図である。
【図3c】本発明の有利な実施形態に従って予測用に使用されるブロックを示す図である。
【図4】本発明の有利な実施形態に従う文脈クラスへの方向性クラスのマッピングを示す図である。
【図5a】本発明の有利な実施形態に従った予測用に用いられる画素について示す図である。
【図5b】本発明の有利な実施形態に従った予測用に用いられる画素について示す図である。
【図5c】本発明の有利な実施形態に従った予測用に用いられる画素について示す図である。
【図5d】本発明の有利な実施形態に従った予測用に用いられる画素について示す図である。
【図5e】本発明の有利な実施形態に従った予測用に用いられる画素について示す図である。
【図5f】本発明の有利な実施形態に従った予測用に用いられる画素について示す図である。
【図5g】本発明の有利な実施形態に従った予測用に用いられる画素について示す図である。
【図5h】本発明の有利な実施形態に従った予測用に用いられる画素について示す図である。
【図5i】本発明の有利な実施形態に従った予測用に用いられる画素について示す図である。
【図5j】本発明の有利な実施形態に従った予測用に用いられる画素について示す図である。
【図5k】本発明の有利な実施形態に従った予測用に用いられる画素について示す図である。
【図5l】本発明の有利な実施形態に従った予測用に用いられる画素について示す図である。
【図5m】本発明の有利な実施形態に従った予測用に用いられる画素について示す図である。
【図5n】本発明の有利な実施形態に従った予測用に用いられる画素について示す図である。
【図5o】本発明の有利な実施形態に従った予測用に用いられる画素について示す図である。
【図5p】本発明の有利な実施形態に従った予測用に用いられる画素について示す図である。
【図6】変位情報の伝送に用いられる有利なビットストリームシンタクスを示す図である。
【図7】本発明に従った方法を実現する携帯用通信装置の概略図である。
【発明を実施するための形態】
【0027】
本発明に記述されているイントラフレーム予測方法はブロックを基調とする仕方において作動し、例えば左から右へ、又は、最上部から底部へ向かう列x列によって走査されるNxMブロックを含むイメージフレームに適用可能である。本発明と関連して他の走査方向も使用可能であることは明白である。空間予測は同一フレーム内において既に復元済みのブロックを用いて各イントラコード化済みブロックに関して実施される。残余エラーは、例えば、現行規格の場合と同様にDCTを使用することにより任意の適当な方法を用いて圧縮され得る。本発明に従った方法はモノクローム及びカラーイメージの両方に平等に適用可能であることも理解されたい。
【0028】
本発明に従ったシステムは図2に示すように2つの主要部分から成る。第一に予測方法の適当な部分集合文脈従属選択17は隣接復元済みブロックを分類することによって実施される。第二に予測ブロックは選定された部分集合における予測方法の1つを使用して18組み立てられ、この予測方法はデコーダに合図される。
【0029】
予測方法部分集合の文脈従属選択は可能性のある隣接ブロックの方向性分類、方向性クラスの文脈クラスへのマッピング、及び、適切な予測方法部分集合の文脈従属選択を含む。
【0030】
下記において、伝送システムにおけるデジタルイメージフレームの送受信は図1に示すデジタルイメージ転送配置構成に関して記述される。現行フレームは例えばデジタルビデオカメラの出力として供給される入力データ2として伝送システム1に到達する。現行フレームはその全体が(即ちNxMイメージブロックを含む完全フレーム)提供されても差し支えなく、この場合にはフレームが記憶され、又は、伝送システム1は入力データブロックをブロック別に受け取ることができる。フレームのブロックは加算器4に順々に向けられ、ここで、例えば予測されたブロックからフレームのブロックを減算することによって、1つのブロックの予測エラーが算定される。予測エラーはコーダ5においてコード化され、デコーダ6において復号される。加算器7において、復号済み予測エラーは予測されたブロックと合計され、結果はフレームメモリ8に保管される。本発明の方法に従って空間予測が実施される予測エスチメイタ3は予測と共に使用されるべきブロックをフレームメモリ8から受け取る。
【0031】
新規予測ブロックを形成するために、予測エスチメイタ3は現行ブロックの可能性のある隣接ブロックに何等かの方向性が存在するかどうかを調査する。この方式を図3aに示す。基準Cは現行ブロックを示し、基準Lは現行ブロックの第1隣接ブロックを示し、基準Uは現行ブロックの第2隣接ブロックを示す。本発明のこの有利な実施形態において、第1隣接ブロックは現行ブロックCの左に位置し、第2隣接ブロックは現行ブロックCの上に位置する。走査順序が左から右へ、及び、最上部から底部へと異なるならば、第1隣接ブロックLおよび第2隣接ブロックUはそれぞれ必ずしも現行ブロックCの左および上に位置するとは限らない。隣接ブロックL、Uは既に復元済みの現行ブロックCに隣接するブロックである。本発明の幾らかの実施形態において、複数のブロックが分類可能であり、現行ブロックCに関する予測方法を選択するために使用可能である。ただし、本発明の好ましい実施形態についての次の記述において、2つの隣接ブロックL、Uの大きい方が調査されている各ブロックCに関して分類される。更に、隣接ブロックLまたはUが存在しさえすれば分類は実施される。現行ブロックが一切の隣接ブロックを持たないならば、本文において後で説明するように、予測方法の文脈従属選択に際して「非イントラ」として扱われる。
【0032】
また、既に復元されたイントラコード化済みブロックのみを用いて実施される方法において予測は同様に実施可能である。この場合、イントラコード化済みブロック以外の全てのブロックは「非イントラ」として扱われる。
【0033】
第1隣接ブロックLおよび第2隣接ブロックUはブロック内のイメージ詳細部の方向性に従って分類される。図2に示すように、方向性クラシファイア19は画素値勾配を用いて隣接ブロックの方向性を分析する。その結果、各隣接ブロックは出力クラスへマップ20される。本発明の有利な実施形態においては、11種の出力クラスが存在するが、出力クラスの個数が変化可能であることは明白である。有利であることには、出力クラスはエッジオリエンテーション(縁配向)k・22.5°、k=0、1、・・・、7に対応する8種類の方向性クラスD0からD7、及び、平坦、平滑テクスチャ、及び、粗テクスチャブロックに対応する3種の非方向性クラスD8−D10によって構成される。本発明の代替実施形態においては、方向性クラスの個数およびこれらが画定される方法は変化可能である。
【0034】
図1のシステムにおいて、予測エスチメイタ3は先ず第1隣接ブロックL、及び/又は、第2隣接ブロックUが存在するかどうかを調査する。これらのブロックのどちらの1つも存在しないならば、当該隣接ブロックはC0ブロック(「非イントラ」として画定され、即ち、現行ブロックCはフレームの縁または隅に所在するか、または、イントラブロックで構成される部位(エリア)の縁または入来部(カマー)に存在する。次に、この記述の後の方に示すように、予測エスチメイタ3は現行ブロックCに関して適当な予測方法を選択する。ほかの点では、予測エスチメイタ3は1つ又は複数のブロックL、Uに関する勾配情報を算定する。
【0035】
勾配情報の算定には多くの適当な方法がある。下記において、1つの有利な方法について記述する。第1に、ブロックL、Uの平均絶対方向性勾配gk、k=0、1、・・・、7は次のように定義される:
【0036】
【数1】

ここに、Nはブロックのサイズであり、I(x,y)は画素密度値を表す。指標x及びyはブロック内部の画素の座標を表し、kは縁配向を表す。予測エスチメイタ3は上式に従って勾配値gkを算定する。
【0037】
勾配値gkを用いて、勾配比率rk、k=0、1、・・・、7は或る特定方向における勾配値と直交方向における勾配値との間の比率として定義される。
【0038】
【数2】

【0039】
数値を敷居値として使用し、次の分類ステップ1−12に有利に従って(1)及び(2)に定義される絶対勾配値gkおよび勾配比率rkに基づき、ブロックの分類が実施される。この分類プロセスは各々の隣接ブロックをブロックタイプD0−D10の第1集合の1つに分類する。本発明はアルゴリズムに使われる値に限られることなく、次のステップにおけるアルゴリズムに使われる値であることが好ましい。この方法はあらゆるブロックサイズに同様に適用可能である。
【0040】
本発明のこの有利な実施形態において、分類段階は13ステップを含むが、分類が異なる数のステップを含むことがあり得ることは明白である。
【0041】
ステップ1
このステップにおいて、ブロックの平坦度がチェックされる。予測エスチメイタ3は勾配値g0及びg4を算艇する。これらは水平(0°)および垂直(90°)イメージ細部に対応する。g0≦2.0、及び、g4≦2.0の両方に関して、ブロックがクラスD8として分類されるならば、初期分類プロセスは終了する。そうでない場合には、分類ステップ2が実施される。
【0042】
ステップ2
このステップにおいては、ブロックの平坦度に関して更なるチェックが実施される。残りの勾配値gkが算定され、最大勾配値gmax=max{gk}が決定される。最大勾配値gmaxは2.5と比較される。gmax≦2.5であれば、ブロックはD8として分類され、初期分類プロセスは終了する。そうでなければ、方法はステップ3から継続する。
【0043】
ステップ3
ステップ3においては、明瞭な方向性に関するチェックが実施される。勾配比率rkが算定され、最小勾配比率rmin=min{rk}が決定される。最小勾配比率が見付かると、対応する指標kminが確定される。rmin≦0.15であれば、当該ブロックは対応するクラスDkminに分類され、方法はステップ12から継続しそうでなければ、方法はステップ4から継続する。
【0044】
ステップ4
ステップ4においてはテクスチャに関するチェックが実施される。最小勾配比率rminは0.6と比較される。rmin≧0.6であれば方法はステップ13から継続し、そうでないならば、方法は次のステップから継続する。
【0045】
【数3】

【0046】
ステップ6
ステップ6においては、最小勾配比率が方向性クラスD2またはD6に対応するかどうか、及び、最小勾配比率が充分に小さいかどうかを決定するために最小勾配比率がチェックされる。予測エスチメイタ3は第1に勾配比率r(0)の指標が2又は6であるかを調査する。ここで第1勾配比率r(0)は0.6と比較される。r(0)∈{rk|k=2,6}およびr(0)<0.6であれば、当該ブロックはクラスDk(0)に対応するとして分類され、方法はステップ12から継続し、そうでなければ、方法はステップ7から継続する。
【0047】
ステップ7
ステップ7においては、予測エスチメイタ3は第2勾配比率r(1)の指標が2又は6であるかどうかを先ず調査し、ここで第1勾配比率r(0)は0.6と比較される。r(1)∈{rk|k=2,6}およびr(0)<0.6ならば、当該ブロックはDk(1)に対応するとして分類され、方法はステップ12から継続し、そうでなければ、方法はステップ8から継続する。
【0048】
ステップ8
ステップ8においては、最小勾配比率がチェックされ、それが方向性クラスD1、D3、D5、または、D7に対応するかどうか、及び、最小勾配比率が十分に小さいかが決定される。第1勾配比率r(0)は0.5と比較される。r(0)∈{rk|k=1,3,5,7}及びr(0)<0.5であれば、当該ブロックはDk(0)に対応するとして分類され、方法はステップ12から継続する。そうでなければ、方法はステップ9から継続する。
【0049】
ステップ9
ステップ9においては、第2勾配比率がチェックされ、それが方向性クラスD1、D3、D5、または、D7、に対応するかどうか、及び、最小勾配比率が十分に小さいかどうかが決定される。r(1)∈{rk|k=1,3,5,7}であれば、第1勾配比率r(0)は0.5と比較される。r(0)<0.5であれば、当該ブロックはクラスDk(1)に対応するとして分類され、方法はステップ12から継続する。そうでなければ、方法はステップ10から継続する。
【0050】
ステップ10
方向性は未だ見付かっていない。従って、方向性をチェックするためにステップ3に用いられ敷居値と比較して(幾分か)更に高い敷居値を用いることが出来る。これは更に不確実な調査が実施されることを意味する。ステップ10においては、下記の表1に規定された敷居値T1が用いられる。T1に関する値は第1勾配比率と比較される。表1に規定されているようにr(0)<T1であるならば、当該ブロックはクラスDk(0)に対応するとして分類され、方法はステップ12から継続する。そうでなければ、方法はステップ11から継続する。
【0051】
【表1】

【0052】
ステップ11
方向性は未だ見付かっていない。従ってステップ11において、3つの最小勾配比率がチェックされ、それらが隣接ブロックであるか、及び、最小勾配比率が中央に位置するかが決定される。この場合、方向性をチェックするためにステップ3の場合と比較して依然として高い敷居値が用いられる。これは更に不確実な調査が実施されることを意味する。ステップ11では、下記の表2に規定された敷居値T2が用いられる。次に、第2r(1)に対応する方向性および第3勾配比率r(2)が第1勾配比率r(0)に対応する方向性に関して最も近く隣接し、表2に規定されているようにr(0)<T2であるならば、当該ブロックはクラスDk(0)に対応するとして分類され、方法はステップ12から継続する。そうでないならば、方法はステップ13から継続する。
【0053】
【表2】

【0054】
ステップ12
ステップ12はテクスチャ以外の何等かのオリエンテーションにより分類がイメージの縁に実際に基づいていることのチェックを実施する。ステップ12は下記の表3に規定された敷居値T3の値を使用する。表3においては可能性のある2つのブロックサイズ(8×8、4×4)のみに関する値が示されているが、実用的な実施形態においては、他のブロックサイズ寸も存在し得る。この場合には、T3に関するそれぞれの値が規定されている。ステップ12においては、最小勾配値gmin=min{gk}が調査される。分類およびブロックのサイズに応じて、敷居値T3は表3から選択される。gmin≦T3ならば、初期分類プロセスが終了する。そうでないならば、方法はステップ13から継続する。
【0055】
【表3】

【0056】
ステップ13
ステップ13はテクスチャが滑らかか又は粗いかのチェックを実施する。最大勾配値gmaxは10.0と比較される。gmax≦10.0であるならば、当該ブロックはD9として分類される。そうでないならば、当該ブロックはD10として分類される。平滑および粗の両テクスチャが同一文脈クラスにマップされるならば、ステップ13は必ずしも必要とはかぎらない。
【0057】
次に、現行ブロックCに関して適当な予測方法の選択21が実施される。本発明の好ましい実施形態においては、選択段階はマッピング段階によって先行される。マッピングの目的は実装のメモリ消費量を減少させることにある。いくらかの方向性クラスはまとめてマッピングすることが可能である。マッピング段階の結果として得られるクラスはコンテキスト(文脈)クラスと呼ばれ、C1からC6で表される。本発明の好ましい実施形態においては、対角線クラスは2つの代替クラスに組合わされ、一方は底部左から最上部右までの対角性であり、もう一方は最上部左から底部右までの対角性である。
【0058】
適度および急峻な対角線クラスD5、D6、及び、D7は第1対角線文脈クラスC4にマッピングされる。同様に、クラスD1、D2、及び、D3は第2対角線文脈クラスC2にマッピングされる。更に、滑らかなテクスチャクラスD9及び粗いテクスチャクラスD10は一緒にマッピングされてテクスチャ文脈クラスC6を生成する。このマッピングを図4に示す。
【0059】
6種の文脈クラスC1−C6に加えて、更に、「非イントラ」ブロック用に用いられる1つの更なる文脈クラスC0がある。一般に、「非イントラ」ブロックはブロックCがイメージ境界に位置する場合には、存在しないブロックである。イントラコード化済みブロックのみが基準として使用される方法において予測が実施される場合には、「非イントラ」ブロックの定義はイントラコード化済みでないブロックまで拡張される。
【0060】
本発明の好ましい実施形態においては、合計13種の異なる予測方法があり、8×8ブロックの場合を図5a−5pに示す。他のブロックサイズ及び文脈クラスに関する予測方法は同様の仕方において推論可能である。それぞれの場合において、隣接した復元済みのイントラコード化済みブロックL、U、UL、URを基準として使用し、原因を示す仕方において予測は実施される。予測のために使われる領域は図3a及び3bに示すように予測方法に依存する。この場合、ブロックCはコード化されるべき現行ブロックである。予測方法P1−P12の場合において、予測用に用いられるブロックが属する領域は図3bに示すように4個の隣接ブロックL、UL、U、Rによって覆われた部位である。予測方法P13に関しては、図3cに示すように、この領域は比較的大きい。本発明の他の実施形態においては、予測方法の件数、予測基準として用いられるブロック数、ならびに、予測を実施するために用いられるブロック内の画素の個数は変化することがあり得ることを参照されたい。
【0061】
本発明に従った方法の有利な実施形態においては、各文脈クラス組み合わせに関する予測方法で構成される部分集合は定義済みであり、予測方法は各部分集合において優先順位が決定される(ランク付けされる)。次に、現行ブロックCの内容を予測するために用いられる予測方法が予測方法の部分集合から選出される。LおよびUのように隣接ブロックに関する特定の分類が得られる場合には、部分集合内の予測方法は相互に異なり、かつブロックCに関して正確な予測を提供する可能性が最も大きい予測方法に対応する。部分集合に関する1つの有利な定義を下記の表4に示す。
【0062】
第1隣接ブロックLおよび第2隣接ブロックUに関する文脈分類の結果が効果的に組合わされている。即ち、ブロックCのために予測方法を選択する際に両ブロックが考慮された。予測方法の部分集合は隣接ブロックL、Uの文脈情報に従って表4から選出される。表4の各列は、隣接ブロックL、Uに関する或る特定の対に関する予測方法部分集合および当該部分集合内の予測方法の優先順位(ランク)を定義する。本文に後で記述するように、予測方法の文脈従属信号を簡素化するためにランキングが用いられる。例えば、第1隣接ブロックLが文脈クラスC2に分類され、第2隣接ブロックUが文脈クラスC4に分類される場合には、この組み合わせに関する部分集合は予測方法P1、P9、P5、P13、P7、P6(ランキング順)を含む。本文の後の方で述べるように、予測エスチメイタ3は、この部分集合の中から最も適切な予測方法を選択する。
【0063】
【表4】

【0064】
【表5】

【0065】
次に、明確に規定された予測方法について更に詳細に述べることとする。
【0066】
予測方法 P1
予測方法P1は、ブロックL、UL、U、URの平均画素値からブロックCの平均画素値を予測する。復元されたブロックL、UL、Uの平均画素値dL、dUL、dUは次式のように定義される整数除算として計算される:
【0067】
【数4】

ここに、Nはブロックサイズであり、I(x,y)は画素密度値を表し、”//”は整数値への省略を伴った除算を表す。ブロックCの平均画素値dCは次に示す規則の集合(疑似コードの形で次に示す)に従って予測される。
全てのブロックL、U、ULが存在する場合に、
dL=dU=dULであればdC=dUL
又は、dUL=dUであれば、dC=dL
又は、dUL=dLであれば、dC=dU
又は、dL=dUである場合に、
クロミナンス予測であれば、dC=dL
又は、|dUL−dL|<4であれば、dC=s(dL+dU−dUL)
又は、dC=dL
又は、dUL<dL<dUであれば、dC=dU
又は、dUL<dU<dLであれば、dC=dL
又は、dU<dL<dULであれば、dC=dU
又はdL<dU<dULであれば dC=dL
又は、dL〈dUL〈dU OR dU〈dUL〈dLであれば、
dC=s(dL+dU−dUL)
ブロックL、及び、Uが存在するならば、dC=(dL+dU+1)//2
ブロックL、及び、ULが存在するならば dC=dL
又は、ブロックU、及び、ULが存在するならばdC=dU
又は、ブロックLが存在するならば dC=dL
又は、ブロックUが存在するならば dC=dU
又は、ブロックULが存在するならばdC=dUL
又はd=p
ここにpは可能性のある画素値の中央に位置する値であり、例えば、128”//”は省略を伴った除算であり、sは値を画素の可能性のある範囲に制限する切り抜き関数であり、例えば、ルミナンス/クロミナンス値を表すために8ビット表現を用いるシステムにおいては0と255の間である。その結果、Cに関する予測ブロックはdCで与えられる一定値を持つ画素によって満たされる。予測方法P1を図5aに示す。
【0068】
予測方法P2−P4
予測方法P2からP4までは、右上方向からブロックCへイメージ細目を拡張することによってブロックCにおける対角形状を予測する。予測は、それぞれ図5b、5c、5dに示すようにブロックUおよびURの境界における基準画素値をブロックCへコピーすることによって実施される。灰色で記された基準画素は1つ又は複数の画素へ接続される。点と線で記された接続は予測された画素への接続を示し、基準画素の値は接続された全ての予測済み画素にコピーされる。
【0069】
1つ又は複数の基準ブロックは利用可能でないこともあり得るので、即ち、それらの文脈クラスはC0であり得るので、予測は次に示す規則に従って実施される。
【0070】
規則1
両方ブロックU及びURがクラスC1―C6の1つに分類されるならば、各々図5b、5c、5dに示すように画素予測が実施される。予測方法P2(図5b)に関しては、ブロックURにおけるあらゆる対応する基準画素なしの画素がブロックURにおける右端の基準画素の値に有利に割り当てられる。
【0071】
規則2
ブロックUがクラスC1−C6の1つに分類され、ブロックURがC0として分類されるならば、ブロックU内に基準画素を有する画素に関する画素予測は図5b、5c、5dに示すように実施される。残りの画素は基準ブロックUの右下隅に位置する画素の値に有利に設定される。
【0072】
規則3
ブロックUがC0として分類されるならば、現行ブロックCは画素値の可能性のある動的範囲の中央に実質的に位置する一定値を持つ画素によって有利に満たされる。例えば、128(ルミナンス/クロミナンス値の8ビット表現を使用するシステムの場合)。
【0073】
予測方法P5及びP9
予測方法P5(図5e)及びP9(図5i)はイメージ細目を上或いは左のどちらかから現行ブロックC内に伸延することにより現行ブロックCにおける垂直および水平形状を予測する。どちらの方法(P5またはP9)を選定するかに応じて、ブロックUまたはLどちらかの境界における基準画素値は、図5eおよび5iに示すように現行ブロックCにコピーされる。
【0074】
基準ブロックの文脈クラスがC0であるならば、現行ブロックCは画素値の可能性のある動的範囲の実質的に中央に位置する一定値を持つ画素によって有利に満たされる。この値は例えば128である(ルミナンス/クロミナンス値の8ビット表現を用いるシステムにおいて)。
【0075】
予測方法P6、P7、及び、P8
予測方法P6、P7、および、P8は、それぞれ図5f、5g、及5hに示すように左上方から現行ブロックCへイメージ細目を伸延することにより、現行ブロックCにおける対角形状を予測する。予測は、以下の規則に従って、ブロックL、UL、Uの境界において、基準画素値を現行ブロックC内にコピーすることにより実施される。
【0076】
規則1
全てのブロックL、UL、UがクラスC1−C6の1つに分類されるならば、現行ブロックCに関する画素予測はそれぞれ図5f、5g、及び、5hに示すように実施される。
【0077】
規則2
ブロックULおよびUがクラスC1−C6の1つに分類され、ブロックLがC0として分類されるならば、現行ブロックCに関する画素予測は、ブロックUL及びLに基準画素を持つ現行ブロックCのこれらの画素に関してそれぞれ図5f,5g,5hに示すように実施される。現行ブロックCにおける残りの画素には、ブロックULにおける基準画素部位の左下隅に位置する画素の値が有利に割り当てられる。
【0078】
規則3
ブロックLおよびULがクラスC1−C6の1つに分類され、ブロックUがC0として分類されるならば、現行ブロックCに関する画素予測は、ブロックL及びULに基準画素を持つ現行ブロックCのこれらの画素に関してそれぞれ図5f、5g、5hに示すように実施される。現行ブロックCにおける残りの画素には、ブロックULにおける基準画素部位の右上隅に位置する画素の値が有利に割り当てられる。
【0079】
規則4
ブロックLおよびUがクラスC1−C6の1つに分類され、ブロックULがC0として分類されるならば、現行ブロックCに関する画素予測はブロックLおよびUに基準画素を持つ現行ブロックCのこれらの画素に関して図5f、5g、5hに示すように実施される。ブロックULに基準画素を持つ画素を図5n、5o、5pに示す。方法P7の場合には、予測済み画素値は、図5oに示すように、最も近い整数値に丸められた2つの基準画素値の平均である。
【0080】
規則5
ブロックLがクラスC1−C6の1つに分類され、ブロックULおよびUがC0として分類されるならば、現行ブロックCに関する画素予測はブロックLに基準画素を持つ現行ブロックCのこれらの画素に関してそれぞれ図5f、5g、5hに示すように実施される。現行ブロックCにおける残りの画素には、ブロックLにおける基準画素部位の右上隅に位置する画素の値が有利に割り当てられる。
【0081】
規則6
ブロックULがクラスC1−C6の1つに分類され、ブロックLおよびUがC0として分類されるならば、現行ブロックCに関する画素予測はブロックULに基準画素を持つ現行ブロックCのこれらの画素に関してそれぞれ図5f、5g、5hに示すように実施される。ブロックLにおける基準標準画素を持つ電流現行ブロックCの画素にはブロックULにおける下/左基準画素の値が有利に割り当てられる。ブロックUに基準画素を持つ現行ブロックCの画素にはブロックULにおける上/右基準画素の値が割り当てられる。
【0082】
規則7
ブロックUがクラスC1−C6の1つに分類され、ブロックULおよびUがC0として分類されるならば、現行ブロックCに関する画素予測はブロックUに基準画素を持つ現行ブロックCのこれらの画素に関してそれぞれ図5f、5g、5hに示すように実施される。現行ブロックCにおける残りの画素には、ブロックUにおける基準画素部位の下左隅に位置する画素の値が有利に割り当てられる。
【0083】
規則8
全てのブロックL、UL、LがC0として分類されるならば、現行ブロックC現行ブロックCは画素値の可能性のある動的範囲の中央に実質的に位置する一定値を持つ画素によって有利に満たされる。例えば、128(ルミナンス/クロミナンス値の8ビット表現を使用するシステムの場合)。
【0084】
予測方法P10、P11、及び、P12
予測方法P10からP12は、それぞれ図5j、5k、及び、5lに示すようにイメージ細目を左から現行ブロックC内に伸延することにより現行ブロックCにおける対角形状を予測する。予測はブロックLの境界における基準画素値を以下に示す規則に従って現行ブロックCへコピーすることによって実施される。
【0085】
規則1
ブロックLがクラスC1−C6の1つに分類されているならば、現行ブロックCに関する画素予測は図5j、5k、及び、5lに示すように実施される。ブロックL内に基準画素を含まない現行ブロックCの画素は基準画素部位の下右隅に位置する画素の値で有利に満たされる。
【0086】
規則2
ブロックLがC0として分類されているならば、現行ブロックCは画素値の可能性のある範囲の実質的な中央に位置する一定値を持つ画素によって有利に満たされる。この値は、例えば128である(ルミナンス/クロミナンス値の8ビット表現を使用するシステムにおいて)。
【0087】
予測方法P13
予測方法P13は現行ブロックCの画素値に実質的に対応する値を持つ画素範囲が存在するかどうかを調査することによって隣接イメージの内容から現行ブロックCの内容を予測する。現行ブロックCの予測は図5mに示すように探索範囲SR内の基準ブロックBから復元済み画素値をコピーすることによって実施される。探索範囲SRは水平(x)および垂直(y)変位のリストによって画定される。水平変位および対応する垂直変位値(x、y)の各対は現行ブロックCの左上隅と基準ブロックBの左上隅の座標の間の変位ベクトルを画定する。当該フレーム復元された部分の完全な内部に位置する基準ブロックBに対応するこれらの変位に関してのみ予測が可能である。8x8ブロックに関する512変位を用いた変位対の例を表9aおよび9bに示す。この例において、表の走査順序は列毎に最上左から底部右である。本発明の代替実施形態において、探索範囲は図5mに示す場合と異なることがあり、かつ/または、基準ブロックBと現行ブロックの間の変位は異なって定義されることがあり得る。
【0088】
許容された変位のリストはエンコーダ及びデコーダの両方にとって既知であり、選定済み基準ブロック位置の文脈従属信号連絡を可能にする。
【0089】
予測方法の部分集合の中から予測方法を選択する多くの代替方法がある。使用すべき部分集合の種々異なる予測方法の実用性を評価するために、例えば、コスト関数を定義することができる。コスト関数は特定の予測方法を用いた現行ブロックCの予測に際して発生するエラーに関する情報に基づいて計算されても差し支えない。このエラーは実画素値と復元された画素値の間の差を表す。一般に、現行ブロックCにおける各画素に関するエラー値はブロック全体の測定誤差の平方値をもとめるために二乗して合計される。コスト関数はビット数に関する情報、即ち、受信機に情報を転送するために必要なビットレートも含むこともあり得る。コスト関数のエレメント、特にビットレートは、エレメントを強調するために重みつけすることも可能である。コスト関数の一例を次に示す:
Cx=D+λR (4)
ここに、コストCxは各予測方法と関連したひずみDとレートRの重み付けされた和として定義され、λは重みつけ係数である。伝送システムが帯域制限されている場合には、重み値は帯域幅がより広い場合よりも一般に更に大きい。式(4)に関する値は種々異なる予測方法を対象として計算され、コスト関数に関して最小値を生じる予測方法が選定されることが好ましい。
【0090】
その上、予測エラー情報は受信機への伝送に先立って同様にコード化可能である。有利に、各予測方法に関して定義されたコード化方法で構成された部分集合がある。コード化方法は予測エラーをコード化するために必要なビット数を最小限化するように選定可能であることは明確である。例えば、コード化方法の実用性(ビットレート)が調査される。
【0091】
予測エラーが比較的小さいならば、予測エラー情報は全く伝達する必要がないかもしれない。
【0092】
図1及び2を再度参照することとし、現行ブロックCを予測するために適当な予測方法が一旦選定されると、予測エスチメイタ3は選定済み予測方法に従って空間予測22を実施する。予測エスチメイタ3は復元されたブロックを加算器4に向け、ここで、復元済みブロックは現行ブロックCの実内容から差し引かれ、現行ブロックに関する予測エラー情報が生成される。
【0093】
エンコーダ1は選定された予測方法に関する情報をマルチプレクサ9に送り23、この場合、方法P13が用いられた場合には変位情報が添付される。問題の隣接ブロック(U、L)の特定組み合わせに関して適切な予測方法で構成される部分集合におけるランキングによって選定済み予測方法が指示されることは有利である。情報のコード化は可変長コード化を用いて有利に実施される。
【0094】
情報は受信機10へ更に伝送され、ここで、デマルチプレックサ11は受信済み情報を逆多重化する。受信機10において、予測情報は予測器16に向けられる。受信機10はフレームメモリ14も装備し、既に復元されたブロックがここに保管されている。新規コード化済みブロックが受信機に到着すると、予測器16は受信した現行ブロックCの隣接ブロックU、Lに関して分類ステップを実施し、既に述べたように、方向性クラスに分類する。次に、予測器16は分類情報の文脈クラスC1−C6へのマッピングを実施する。その後で、予測器16は予測方法のランクを調査する。受信機10は表4および5の情報を含み、予測器16は文脈クラス組み合わせ及びランクに従って正しい予測方法を決定することが可能である。
【0095】
予測方法が決定されると、予測器16は現行ブロックCを復元し、それをフレームメモリ14に保管することができる。予測エラー情報も同様に受信される状況においては、当該情報は、必要に応じて、先ずデコーダ12において復号され、復元されたブロックCの画素値と組合わされる。次に、現行ブロックCは受信機の出力15に向けられる準備が整えられる。
【0096】
現行ブロックCの予測方法がP13であるならば、現行ブロックCの復元はわずかに異なる仕方において実施される。この場合、受信機10は同様に変位情報を復号しなければならず、ここに、変位情報は現行ブロックCの値画素値をフレームメモリ14内の復元済み画素値からコピーするために用いられる。
【0097】
予測方法の信号連絡は表5に定義された文脈従属コードに有利に基づく。適切な予測方法を選定した後で、エンコーダ1は文脈従属部分集合における選定済み予測方法のランクに対応する可変長コードワードを送る。各予測方法ランクを表す可変長コードワードの有利な事例を表5に示す。例えば、第1隣接ブロックLが文脈クラスC3に分類され、第2隣接ブロックUが文脈クラスC1に分類され、この組み合わせに関する予測方法の部分集合から予測方法P9が選定されると、それぞれのランクは2である。次に、このランクに対応するコードワードは「01」である。
【0098】
【表6】

【0099】
受信機10は表4の内容を関知している。即ち、可能な全ての文脈における各ランクにどちらの予測方法が対応するか(隣接ブロックL及びUに関するクラスの組み合わせ)が既知である。受信機10は予測エスチメイタ3と同じ文脈情報を導出できるので、受信機10は受信したコードワードによって表されるランクを正しい予測方法に関連付け、当該方法に従ってブロックCに関する空間予測を実施することができる。
【0100】
本発明の有利な実施形態において、予測方法P13と関連する水平および垂直変位の信号による連絡は次のとおりに実施される:
【0101】
ステップ1
フレームの外に部分的または完全に位置するブロックBに対応する水平および垂直変位(X(i)、Y(i))のこれらの対は表9a、9bの記載から除去される。有効な対の個数はNvによって表され、除去された後で保持される有効な対のリストはLvによって表される。
【0102】
ステップ2
ステップ1において作られたリストLv内の選定されたブロックBに対応するランクr(1、2、…、Nvの1つである)が算定される。
【0103】
ステップ3
ステップ1において決定されたランクrの値に基づいて、表6に従って価index1が算定される。
【0104】
ステップ4
表6にリストされた値を用いて、値index2=r−OffsetLow(index1)が算定される。
【0105】
【表7】

【0106】
ステップ5
次に、可変ビットが次のとおりに算定される。Nv<OffsetHigh(index1)であれば、可変ビットに関する値は、次式を用いて有利に計算される:bits=[log2(1+Nv−OffsetLow(index1))]、ここに[x]はが最も近い整数xを表す。そうでなければ、bits=Aux長さ(index1)。
【0107】
ステップ6
表7および表8に示される対応する可変長コード化を用いてNvの値に応じて添字がindex1である可変数がコード化される。このコードワードは図6にブロックCW1で示されるデコーダに伝送される。
【0108】
ステップ7
可変ビットが非ゼロであるならば、可変ビットの値に対応するいくつかのビットを用いて、index2の2進表現がコード化され、このコードワードは図6にブロックCW2で示される受信機に伝送される。
【0109】
【表8】

【0110】
【表9】

【0111】
【表10】

【0112】
【表11】

【0113】
デコーダは有効な変位ベクトル順序付き表を導出できるので、受信したコードワードによって表されるランクを正しい変位ベクトルと関係付けることが出来る。
【0114】
本発明に従った予測方法を実行するブロックは、デジタル信号プロセッサまたはデジタル信号処理に適した対応する汎用デバイスにおいて特に有利に実装され、入力データとしての受信した信号に事前決定された処理機能を供給するようにプログラムされることが可能である。本発明に従った測度は個別の信号プロセッサにおいて実施可能であり、又は、信号処理のための他の配置構成を含むこの種プロセッサの動作の一部分であり得る。
【0115】
記憶媒体は本発明に従った方法を実施する機械実行可能なステップを含むソフトウェアプログラムを記憶するために使用できる。本発明の有利な実施形態において、本発明の方法を実施するためにソフトウェアプログラムは記憶媒体から、例えばプロセッサのようなプログラマブル手段を含むデバイスに読み取り可能である。
【0116】
携帯用ビデオ電気通信装置としての使用を意図し、かつ本発明に従った方法を適用するための移動ターミナル24は、イメージをディスプレイする少なくともディスプレイ手段25、オーディオ情報を獲得および再生するオーディオ手段26、例えばユーザコマンドの入力用キーボード27、移動ネットワークと交信する無線部分28、デバイスの動作を制御する処理手段29、情報を記憶するメモリ手段30、好ましくは撮影用カメラ31を有利に備える。
【0117】
本発明は前述の実施形態にのみ制限されることなく、添付特許請求項の範囲内で改変可能である。

【特許請求の範囲】
【請求項1】
デジタルイメージをコード化する方法であって、前記方法において、前記デジタルイメージがブロック(C、L、U、UL、UR)に分割され、前記方法において、伝送されるべき情報量を減少させるようにブロック(C)に関する空間予測が実施され、少なくとも1つの予測方法(P1−P13)が規定され、前記隣接ブロック(L、U)の前記内容に従って予測されるべき前記ブロック(C)の少なくとも1つの隣接ブロック(L、U)に関して分類が決定され、少なくとも1つの前記分類に基づき現行ブロック(C)に関して予測方法(P1−P13)が選定されることを特徴とする方法。
【請求項2】
前記分類が前記ブロックの方向性情報に基づいて決定されることを特徴とする、請求項1に記載の方法。
【請求項3】
前記ブロックの方向性情報が前記ブロックの画素値に基づいて少なくとも1つの勾配値(gk)を計算することによって決定されることを特徴とする、請求項2に記載の方法。
【請求項4】
前記勾配値(gk)が次式によって計算され、
【数1】

ここにNは前記ブロックのサイズであり、I(x,y)は画素密度値を表し、指標x及びyは前記ブロック内画素の座標を示し、kはエッジオリエンテーションを表すことを特徴とする、請求項3に記載の方法。
【請求項5】
少なくとも8種の方向性クラス(D0−D7)が異なるエッジオリエンテーションに関して定義されることを特徴とする、請求項4に記載の方法。
【請求項6】
前記分類が更に平坦および平滑テクスチャと粗テクスチャブロックに対応する3つの非方向性クラス(D8−D10)を含むことを特徴とする、請求項1から5のいずれか一つに記載の方法。
【請求項7】
前記方法において少なくとも2つの文脈クラス(C0−C6)が定義され、マッピング段階が実施され、前記分類情報(D8−D10)が前記文脈クラス(C0−C6)の1つにマッピングされることを特徴とする、請求項1から6のいずれか一つに記載の方法。
【請求項8】
前記方法において、予測されるべき前記ブロック(C)の2つの隣接ブロック(L、U)に関する分類が前記隣接ブロック(L、U)の内容に従って決定され、前記隣接ブロック(L、U)に関する文脈クラス(C0−C6)が定義され、前記定義済み文脈クラス(C0−C6)の組み合わせに基づいて前記現行ブロック(C)に関する予測方法(P1−P13)が選択されることを特徴とする、請求項1から7のいずれか一つに記載の方法。
【請求項9】
前記方法においてコスト関数が定義され、前記予測方法の前記選択において、
少なくとも2つの予測方法に関する前記コスト関数の値を計算するステップと、
前記最小値を見付けるために前記計算済みコスト関数を探究するステップと、
前記コスト関数に関する前記最小値を生成する前記予測方法を選択するステップと、
を含むことを特徴とする、請求項1から8のいずれか一つに記載の方法。
【請求項10】
前記コスト関数が下記表現であることが定義され、
Cx=D+λR
コストCxが各々の予測方法と関連した歪みD及びレートRの重み見付け和として定義され、λが重み付け係数であることを特徴とする、請求項9に記載の方法。
【請求項11】
前記方法における予測エラーが前記予測済みブロック及び前記ブロック(C)の実画素値に基づいて定義され、前記予測エラー情報がコード化され、前記コード化済み予測エラー情報が伝送されることを特徴とする、請求項1から10のいずれか一つに記載の方法。
【請求項12】
デジタルイメージをコード化するデバイスであって、前記デジタルイメージがブロック(C、L、U、UL、UR)に分割され、前記デバイスが伝送されるべき情報量を減少させるためにブロック(C)に関する空間予測を実施する手段を含み、少なくとも1つの予測方法(P1−P13)が定義済みであり、前記隣接ブロック(L、U)の内容に従って予測されるべき前記ブロック(C)の少なくとも1つの隣接ブロック(L、U)に関する分類を決定する手段および少なくとも1つの前記分類に基づいて前記現行ブロック(C)に関する予測方法(PI−P13)を選択する手段を含むことを特徴とするデバイス。
【請求項13】
前記分類決定手段が前記ブロックの方向性情報を決定する手段を有することを特徴とする、請求項12に記載のデバイス。
【請求項14】
方向性情報を決定する前記手段が前記ブロックの画素値に基づいて少なくとも1つの勾配値(gk)を計算する手段を有することを特徴とする、請求項13に記載のデバイス。
【請求項15】
前記勾配値(gk)が次式によって計算され、
【数2】

ここにNは前記ブロックのサイズであり、I(x,y)は画素密度値を表し、指標x及びyは前記ブロック内画素の座標を示し、kはエッジオリエンテーションを表すことを特徴とする、請求項14に記載のデバイス。
【請求項16】
少なくとも8種の方向性クラス(D0−D7)が異なるエッジオリエンテーションに関して定義されることを特徴とする、請求項15に記載のデバイス。
【請求項17】
前記分類が更に平坦および平滑テクスチャと粗テクスチャブロックに対応する3つの非方向性クラス(D8−D10)を含むことを特徴とする、請求項12から16のいずれか一つに記載のデバイス。
【請求項18】
前記方法において少なくとも2つの文脈クラス(C0−C6)が定義され、マッピング段階が実施され、前記分類情報(D8−D10)が前記文脈クラス(C0−C6)の1つにマッピングされることを特徴とする、請求項12から17のいずれか一つに記載のデバイス。
【請求項19】
前記方法において、予測されるべき前記ブロック(C)の2つの隣接ブロック(L、U)に関する分類が前記隣接ブロック(L、U)の内容に従って決定され、前記隣接ブロック(L、U)に関する文脈クラス(C0−C6)が定義され、前記定義済み文脈クラス(C0−C6)の組み合わせに基づいて前記現行ブロック(C)に関する予測方法(P1−P13)が選択されることを特徴とする、請求項12から18のいずれか一つに記載のデバイス。
【請求項20】
前記方法においてコスト関数が定義され、前記予測方法(P1―P13)の前記選択において、
少なくとも2つの予測方法に関する前記コスト関数の値を計算するステップと、
前記最小値を見付けるために前記計算済みコスト機能を探究するステップと、
前記コスト関数に関する前記最小値を生成する前記予測方法を選択するステップと、
を含むことを特徴とする、請求項12から19のいずれか一つに記載のデバイス。
【請求項21】
前記コスト関数が下記表現であることが定義され、
Cx=D+λR
コストCxが各々の予測方法と関連した歪みD及びレートRの重み見付け和として定義され、λが重み付け係数であることを特徴とする、請求項20に記載のデバイス。
【請求項22】
前記デバイスが前記予測済みブロックおよび前記ブロック(C)の実画素値に基づいて予測エラーを定義する手段と、前記予測エラー情報をコード化する手段と、前記コード化済み予測エラー情報を伝送する手段とを有することを特徴とする、請求項12から21のいずれか一つに記載のデバイス。
【請求項23】
エンコーダ(1)であって、デジタルイメージをコード化する手段と、前記デジタルイメージをブロック(C、L、U、UL、UR)に分割する手段とを有し、前記エンコーダ(1)が伝送されるべき情報量を減少させるためにブロック(C)に関して空間予測を実施する手段を有し、少なくとも1つの予測方法(P1−P13)が定義済みであり、前記エンコーダ(1)が更に前記隣接ブロック(L、U)の内容に従って予測されるべき前記ブロック(C)の少なくとも1つの隣接ブロック(L、U)に関する分類を決定する手段と、少なくとも1つの前記分類に基づいて前記現行ブロック(C)に関する予測方法(P1−P13)を選択する手段と、を有することを特徴とするエンコーダ。
【請求項24】
デコーダ(10)であって、デジタルイメージを復号する手段を有し、前記デジタルイメージがブロック(C、L、U、UL、UR)に分割され、前記デコーダ(10)が伝送されるべき情報量を減少させるためにブロック(C)に関する空間予測を実施する手段を有し、少なくとも1つの予測方法(P1−P13)が定義済みであり、前記デコーダ(10)が更に前記隣接ブロック(L、U)の内容に従って予測されるべき前記ブロック(C)の少なくとも1つの隣接ブロック(L、U)に関する分類を決定する手段と、少なくとも1つの前記分類に基づいて前記現行ブロック(C)に関する予測方法(P1−P13)を選択する手段と、を有することを特徴とするデコーダ。
【請求項25】
コウディック(1,10)であって、デジタルイメージをコード化する手段と、前記デジタルイメージをブロック(C、L、U、UL、UR)に分割する手段と、デジタルイメージを復号する手段と、を有し、前記コウディック(1,10)が伝送されるべき情報量を減少させるためにブロック(C)に関して空間予測を実施する手段を有し、少なくとも1つの予測方法(P1―P13)が定義済みであり、前記コウディック(1,10)が更に前記隣接ブロック(L、U)の内容に従って予測されるべき前記ブロック(C)の少なくとも1つの隣接ブロック(L、U)に関する分類を決定する手段と、少なくとも1つの前記分類に基づいて前記現行ブロック(C)に関する予測方法(P1−P13)を選択する手段と、を有することを特徴とするコウディック。
【請求項26】
移動ターミナル(24)であって、デジタルイメージをコード化する手段と、前記デジタルイメージをブロック(C、L、U、UL、UR)に分割する手段と、デジタルイメージを復号する手段と、を有し、前記移動ターミナル(24)が伝送されるべき情報量を減少させるためにブロック(C)に関して空間予測を実施する手段を有し、少なくとも1つの予測方法(P1―P13)が定義済みであり、前記移動ターミナル(24)が更に前記隣接ブロック(L、U)の内容に従って予測されるべき前記ブロック(C)の少なくとも1つの隣接ブロック(L、U)に関する分類を決定する手段と、少なくとも1つの前記分類に基づいて前記現行ブロック(C)に関する予測方法(P1−P13)を選択する手段と、を有することを特徴とする移動ターミナル。
【請求項27】
記憶媒体であって、デジタルイメージをコード化する機械実行可能ステップと、前記デジタルイメージをブロック(C、L、U、UL、UR)に分割する機械実行可能ステップと、を含むソフトウェアプログラムを記憶し、前記ソフトウェアプログラムが更に伝送されるべき情報量を減少させるためにブロック(C)に関して空間の予測を実施する機械実行可能なステップを含み、少なくとも1つの予測方法(P1―P13)が定義済みであり、更に前記隣接ブロック(L、U)の内容に従って予測されるべき前記ブロック(C)の少なくとも1つの隣接ブロック(L、U)に関する分類を決定するステップと、少なくとも1つの前記分類に基づいて前記現行ブロック(C)に関する予測方法(P1−P13)を選択するステップと、を有することを特徴とする記憶媒体。

【図1】
image rotate

【図2】
image rotate

【図3a】
image rotate

【図3b】
image rotate

【図3c】
image rotate

【図4】
image rotate

【図5a】
image rotate

【図5b】
image rotate

【図5c】
image rotate

【図5d】
image rotate

【図5e】
image rotate

【図5f】
image rotate

【図5g】
image rotate

【図5h】
image rotate

【図5i】
image rotate

【図5j】
image rotate

【図5k】
image rotate

【図5l】
image rotate

【図5m】
image rotate

【図5n】
image rotate

【図5o】
image rotate

【図5p】
image rotate

【図6】
image rotate

【図7】
image rotate


【公開番号】特開2012−170122(P2012−170122A)
【公開日】平成24年9月6日(2012.9.6)
【国際特許分類】
【出願番号】特願2012−96255(P2012−96255)
【出願日】平成24年4月20日(2012.4.20)
【分割の表示】特願2007−244456(P2007−244456)の分割
【原出願日】平成13年1月22日(2001.1.22)
【出願人】(398012616)ノキア コーポレイション (1,359)
【Fターム(参考)】