適応型ウィンドウを有する変換ベースの符号化／復号化

適応型ウィンドウを有する、変換ベースの符号化/復号化。本発明は、デジタル信号の符号化/復号化に関し、具体的には重み付けウィンドウを用いた重なりを有する変換に基づくものに関する。本発明の意味において、2つの連続する等しいサイズの、信号のサンプルのブロックは、それぞれ2つの異なる連続するウィンドウによって重み付けすることができる。これらの2つのウィンドウは、2つのブロックのそれぞれに対して決定される、信号の特性に対して特定の基準(エントロピー、データレート/歪など)に従って互いに無関係に選択することができる。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、デジタル信号の符号化および復号化に関する。
【背景技術】
【０００２】
変換ベースの符号化方式において低減されたビットレートを得るには、通常、知覚し得る劣化を最小に保ちながら、サンプル符号化プロセスに充てられた精度を減少させる試みがなされる。この目的のために、量子化精度の減少は、知覚的重み付けを用いることによって制御される。たとえば、(映像符号化のために)人間の目、または(音声符号化のために)人間の耳の知られている特性に基づいて、この手法は量子化ノイズを、知覚される可能性の最も小さい周波数帯域内に配置することを可能にする。
【０００３】
基本的に周波数領域において映像心理学的または音声心理学的モデルからの情報を用いるには、量子化が周波数領域においてもたらされる時間/周波数変換を適用するのが標準的技法である。
【０００４】
図1は、下記を有する変換ベースの符号化器の構造を示す図である。
・入力信号Xを受け取る、分析フィルタFA1からFAnのバンクBA
・量子化ブロックQ(帯域量子化モジュールQ1、・・・、Qnを含む)と、それに続く符号化モジュールCOD1からCODnを含む符号化ブロックCOD
・符号化された信号X'を供給する、合成フィルタFS1、・・・、FSnのバンクBS
【０００５】
伝送前にビットレートをさらに低減するために、量子化された周波数領域サンプルは、しばしばエントロピー(無損失)符号化プロセスによって符号化される。量子化は、標準の方法で一様または非一様スカラー量子化器、またはベクトル量子化器によってもたらされる。
【０００６】
量子化ステップにおいて導入されるノイズは、合成フィルタのバンクによって整形される(このプロセスは、逆変換の適用として知られる)。したがって分析変換に関連する逆変換は、量子化ノイズを、それが知覚し得るようになるのを防ぐように周波数または時間領域内で集中させるように選ばれなければならない。
【０００７】
分析変換は、変換された領域でのサンプルの符号化を容易にするために、信号のエネルギーを最適に集中させなければならない。このプロセスは、エネルギー圧縮と呼ばれる。具体的には、入力信号に依存する、分析変換の符号化利得が最大化されなければならない。このために以下のタイプの式が用いられ、Kは有利には値6.02を有することができる定数であり、Rはそれぞれの選択されたサンプルのビット数である。
SNR=G_TC+K・R (1)
【０００８】
したがって、得られる信号対ノイズ比(SNR)は、Rへの比例分に変換の符号化利得を表す成分G_TCを加えたものになる。
【０００９】
符号化利得が高いほど、復元の品質は良くなる。したがって符号化プロセスのために用いられる変換の重要性は明らかである。これは、(分析部による)信号のエネルギーと、(合成部による)量子化ノイズの両方を集中させる能力によってサンプルの符号化を容易にする。
【００１０】
音声および映像信号は良く知られているように非定常的であり、時間-周波数変換は、フィルタのバンクの入力信号の性質の関数として、時間と共に適合されなければならない。
【００１１】
通常の符号化技術へのいくつかの応用例について以下に述べる。
【００１２】
変調された変換にて、正規化された音声符号化技術は、コサイン変換または高速フーリエ変換に基づく高速アルゴリズムを用いて、これらの符号化技術の実装を可能にするコサイン変調フィルタのバンクを統合する。
【００１３】
最も一般に(特にMP3、MPEG-2、およびMPEG-4 AAC符号化で)用いられるこのタイプの変換は、修正離散コサイン変換(MDCT:Modified Discrete Cosine Transform)であり、そのための表式は次の通りである。
【００１４】
【数１】

【００１５】
ただし、
・Mは、変換のサイズ
・x_n+tMは、時間n+tMでの、周期
【００１６】
【数２】

【００１７】
(サンプリング周波数の逆数)を有するデジタル化された信号のサンプル
・tはフレームインデックス
・
【００１８】
【数３】

【００１９】
は、フレームtに対する変換された領域でのサンプル
・
【００２０】
【数４】

【００２１】
は、変換の基本関数であり、ここで
・項h_a(n)は、プロトタイプフィルタまたは分析重み付けウィンドウと呼ばれ、2M個のサンプルを扱い、
・項C_n,kは、変調を定義する。
【００２２】
この変換は、音声処理に適用される。これは映像処理、特に固定画像符号化にも適用され、変換は標準の方法で行と列に次々に適用される。この原理はさらに、2次元以上の信号にも拡張される。
【００２３】
最初の時間サンプルを復元するには、そのときに2つの連続する変換の重なりの領域内に位置する0≦n<Mのサンプルを再構成するために、以下の逆変換が復号化に適用される。次いで、復号化されたサンプルは、次式によって与えられ、ここで
【００２４】
【数５】

【００２５】
は、合成変換を定義し、合成重み付けウィンドウはh_s(n)で示され、やはり2M個のサンプルを扱う。
【００２６】
【数６】

【００２７】
複合化されたサンプルを生じる復元式はまた、次の形に書くことができる。
【００２８】
【数７】

【００２９】
このもう1つの復元式の表式は、2つの逆コサイン変換を、変換領域におけるサンプル
【００３０】
【数８】

【００３１】
および
【００３２】
【数９】

【００３３】
に、次々に適用することができ、次いでそれらの結果は重み付けおよび加算演算によって組み合わされると考えられることを意味する。この復元方法は図2に示され、ここで変換領域でのサンプルはX_t,kで示され、時間領域での復元されたサンプルは
【００３４】
【数１０】

【００３５】
で示される。
【００３６】
MDCTは通常、分析用と合成用に同一のウィンドウを使用し、したがってh(n)=h_a(n)=h_s(n)である。
【００３７】
信号の正確な(完全と呼ばれる)復元を、(条件
【００３８】
【数１１】

【００３９】
に従って)確保するためには、いくつかの制約を満足するプロトタイプウィンドウh(n)を選ぶ必要がある。
【００４０】
次式は、完全な復元を得るのに十分である。これらは通常、MDCTに適した復元ウィンドウのために採用される。
【００４１】
【数１２】

【００４２】
ウィンドウは、図3の例に示すように中央のサンプルに対して偶対称のものである。
【００４３】
これらの簡単な制約を満たすことは比較的簡単であり、この目的のために標準のプロトタイプフィルタは、次のように記述される正弦ウィンドウ(図3に実線で示される)からなる。
【００４４】
【数１３】

【００４５】
もちろん、MPEG-4標準で規定されるカイザー・ベッセル派生型(KBD:Kaiser-Bessel-derived)ウィンドウ(図3の破線の曲線に相当する)、および低オーバラップウィンドウなど、他の形のプロトタイプフィルタが存在する。
【００４６】
変換を、符号化されるべき信号に適合させる必要性を考えて、従来技術の技法は用いられる変換を時間と共に変化させることを可能にしており、これは以下ではウィンドウ切り換えと呼ばれる。ここで変換を変化させるときに、用いられるウィンドウのサイズは同じままであり、したがってウィンドウの重み係数だけが時間と共に変化することが分かる。
【００４７】
一定ウィンドウのための上記の表式は、以下ではウィンドウの変化の場合に適合される。一般性を失わずに、オーバラップはMDCTに対する2つの連続するフレームのみに関わり、2つの連続するフレームT₁とT₂に対する遷移は、以下のように説明される。第1のフレームT₁は分析ウィンドウh_a1を用いるとともに、第2のフレームT₂は分析ウィンドウh_a2を用いる。復元のために用いられる合成ウィンドウは、2つのウィンドウh_a1およびh_a2の重なり部分の分析ウィンドウと同一になるように選ばれる。したがって、0≦n<Mに対して
h_a1(n+M)=h_s1(n+M)
h_a2(n)=h_s2(n)
【００４８】
複数の連続するフレームに対して同じウィンドウが用いられる、先の場合と異なり、もはや分析ウィンドウの前半と後半との間に直接の関係はない。これは重み係数h_a1(n+M)は、係数h_a1(n)と独立であり得るということを意味する。同様に、係数h_a2(n)は、係数h_a2(n+M)と独立であり得る。したがって、分析ウィンドウの形状は、時間と共に進化させることが可能となる。
【００４９】
完全な復元のための条件は、0≦n<Mに対して次のようになる。
【００５０】
【数１４】

【００５１】
上記の条件を検証するための非常に簡単な標準の解決法は、0≦n<Mに対して次のように選ぶことにある。
h_a1(n+M)=h_a2(M-1-n)
【００５２】
したがって、図4を参照すると、フレームT₂(図4の破線の曲線)の前半で用いられる分析ウィンドウは、フレームT₁(図4の実線の曲線)の後半で用いられる分析ウィンドウの鏡映バージョンである。言い換えれば完全な復元を確実にするために、従来技術は鏡映効果の他に、同じ分析ウィンドウを共有する区間を介した漸進的な遷移を教示している。
【００５３】
この鏡映効果は、合成ウィンドウ及び分析ウィンドウに与えられた等式によって、合成ウィンドウにも当てはまる。
【００５４】
鏡映効果のために、ウィンドウh_a1内の係数h_a1(n+M)の後にゼロ(値が0の重み係数)を挿入することは、ウィンドウh_a2の始まりに(項h_a2(n)に)同じ数のゼロを挿入する効果を有する。さらにこのゼロの挿入は、逆順位M-nに対して値1を有する同じ数の係数を与えることを意味する。より正確には、次のようになる。
h_a1(n+M)=h_a2(M-1-n)
【００５５】
このために、このような多くのゼロを含むウィンドウの一般的な外観は、図5に示されるように矩形ウィンドウのものと同様になる。矩形ウィンドウは、周波数領域において分解能が劣り、高レベルの不連続性を有する。これは、従来技術の符号化器/復号化器に固有の第1の問題である。
【００５６】
標準化され、知られている符号化器/復号化器では通常、符号化器は用いられるべき変換を時間と共に選択する。したがってAAC標準では、文書「Information technology - Coding of audio-visual objects - Part 3: Audio」、ISO/IEC 14496-3 (2001)で述べられているように、符号化器は、分析ウィンドウの後半に対応するウィンドウ形状を選択しかつ送り、前半は先行するフレームのためにもたらされた選択によって生成される。AAC標準では、合成のために同じタイプのウィンドウが用いられることを可能にするために、ビットが復号化器に送られる。
【００５７】
したがって、復号化器は、符号化器に対してスレーブとして動作し、符号化器によって決定されたウィンドウのタイプを忠実に適用する。
【先行技術文献】
【非特許文献】
【００５８】
【非特許文献１】「Information technology - Coding of audio-visual objects - Part 3: Audio」、ISO/IEC 14496-3 (2001)
【非特許文献２】「Bancs de Filtres et quantification vectorielle sur reseau - Etude conjointe pour la compression d'images」、P. Onno、Universite de Rennes 1 thesis (1996)
【発明の概要】
【発明が解決しようとする課題】
【００５９】
したがって、従来技術の欠点は、時間と共に用いられるウィンドウのタイプの遷移を確実にするためには、完全な復元を確実にするためにインターリーブされた半分のウィンドウを導入する必要があることである。それにより上記の分析ウィンドウh_a1およびh_a2は、それらの共通の媒体上で互いに無関係とすることはできない。
【００６０】
本発明は、この状況を改善することを目的とする。
【課題を解決するための手段】
【００６１】
この目的のために本発明は、連続するウィンドウに関して制約のない、ウィンドウ間の遷移を提案する。
【００６２】
この目的のために本発明は第一に、重み付けウィンドウを用いて重なりを有するデジタル信号を符号化する変換ベースの方法を提供し、同じサイズ2Mの信号のサンプルの2つの連続するブロックは、それぞれ第1の分析ウィンドウおよび第2の分析ウィンドウによって重み付けされる。これらのウィンドウのそれぞれは、立ち上がりエッジおよび立ち下がりエッジを含み、第2のウィンドウの立ち上がりエッジは、時間反転された第1のウィンドウの立ち下がりエッジとは異なる。
【００６３】
この特徴は上述の従来技術とは明確に区別され、したがって第1および第2のウィンドウは、たとえば2つのブロックのそれぞれにわたって判定される信号の特性に対して適当な基準に従って、互いに完全に無関係に選ぶことができることを明らかに示している。
【００６４】
したがって、少なくとも2つのタイプの重み付けウィンドウが、具体的には符号化時に分析のために用意され、たとえば特定の事象が検出された現在のブロックを符号化するために重み付けウィンドウのタイプを変化させることが可能である。この特定の事象とは、典型的には信号の統計的特性の変化、または現在のフレームが含むデジタル信号のエネルギーの大きな増加などの特定の現象の発生である。
【００６５】
これらのステップは次のブロックに対して繰り返され、それにより本発明を用いて、制約なしに、特に必然的にインターリーブされたウィンドウを課す従来技術の制約なしに、所与のタイプの重み付けウィンドウを適用することによって所与のブロックを符号化し、別のタイプの重み付けウィンドウを直接適用することによって所与のブロックの直後のブロックを符号化することが可能になる。
【００６６】
上述のブロックは、たとえば上記のように信号フレームに対応させることができる。
【００６７】
1つのタイプのウィンドウから他へ直接移行する可能性を提供することにより、本発明は、これらのウィンドウによって扱われる信号のそれぞれに適合されたウィンドウを用いて、符号化を実行することを可能にする。それにより、ウィンドウによって扱われる信号セグメントのそれぞれにおいて、改善された符号化利得が得られる。
【００６８】
従来技術と比べて、信号の特性に対するウィンドウの正確な適合により改善された符号化品質が得られる。
【００６９】
同様にして本発明は、重み付けウィンドウを用いて重なりを有するデジタル信号を復号化する変換ベースの方法を提供し、同じサイズの信号のサンプルの2つの連続するブロックは、それぞれ第1の合成ウィンドウおよび第2の合成ウィンドウによって重み付けされ、それぞれは立ち上がりエッジおよび立ち下がりエッジを含み、特に第2のウィンドウの立ち上がりエッジは、時間反転された第1のウィンドウの立ち下がりエッジとは異なる。
【００７０】
本発明の一実施形態では、上述の2つのタイプの分析ウィンドウの少なくとも1つの分析ウィンドウは、すべてゼロの係数を含む少なくとも1つの終わりの部分を含む。次いで復号化時には、合成ウィンドウはウィンドウの始まりにゼロを含む。これは、適用される変換に関連した符号化/復号化遅延の低減を可能にする。
【００７１】
したがって本発明には、遅延を最小化することが重要である対話型通信において有利な用途が見出される。
【００７２】
本発明の他の特徴および利点は、以下の詳細な説明および添付の図面を考察することにより明らかになるであろう。
【図面の簡単な説明】
【００７３】
【図１】従来技術に関する図である。
【図２】従来技術に関する図である。
【図３】従来技術に関する図である。
【図４】従来技術に関する図である。
【図５】従来技術に関する図である。
【図６】本発明の、第1および第2のウィンドウが異なる形状を有するウィンドウタイプの変化を示す図である。
【図７】本発明の有利な実施形態において、ウィンドウの終わりにM_Z個のゼロ係数を含む分析ウィンドウを示す図である。
【図８】この有利な実施形態が達成する、符号化/復号化遅延の低減を示す図である。
【図９】本発明の符号化/復号化システムを示す図である。
【図１０Ａ】本発明の符号化方法のステップを示す図である。
【図１０Ｂ】復号化方法のステップを示す図である。
【図１１】有利な合成ウィンドウ形状を(破線にて)示す図である。
【発明を実施するための形態】
【００７４】
以下に、特別の事前対策なしに、特に遷移ウィンドウなしに、1つの分析ウィンドウから他へ移行することを可能にする本発明の一実施形態について述べる。それにより符号化時に選ばれる分析ウィンドウは互いに無関係であり、これは符号化品質の改善に寄与する。
【００７５】
現在のフレームT₂を考えると、ここで直前のフレームT₁に対しては、分析ウィンドウの特定の選択がすでになされているものとする。周波数領域における現在のフレームT₂のサンプルの符号化を容易にするために、フレームT₂のために別の分析ウィンドウが選ばれる。たとえば1つの可能な基準は、フレームT₂のために選ばれるウィンドウh_a2は、次式で与えられる変換された領域での符号化利得を最大にするべきであるというもので、この式で
【００７６】
【数１５】

【００７７】
は、変換されたサンプルX_kの分散の推定値を表す。
【００７８】
【数１６】

【００７９】
別法として別の基準は、たとえば次の形で表されるように、変換されたサンプルのエントロピーの最小化に基づくものとすることができる。
【００８０】
【数１７】

【００８１】
第一に符号化/復号化後の歪と、第二にその符号化に必要なビットレートとの間の最適な妥協を規定する、より複雑な基準を想定することが可能である。最小にされるべき、このより複雑な基準は、たとえば以下の形に書くことができ、ここでD(X)は選択されたビットレートに対するサンプルX_kの歪の測定値であり、R(X)はその選択されたビットレートである。
J_RD=D(X)+λR(X)
【００８２】
最終的に採用された基準による、最良の分析ウィンドウh_a2は、限定された組み合わせのセットにおいて決定されることが好ましい。用いられる分析フィルタ(特に符号化重み付けウィンドウに対応する分析プロトタイプフィルタ)のタイプは、復号化器に知られていなければならず、したがって復号化器に送られなければならないという点において、依然として1つの制約が課される。
【００８３】
したがってウィンドウh_a2は、分析ウィンドウの辞書{h₀、h₁、h₂、・・・、h_Nb-1}から選ぶことができ、ここでNbは可能な選択の数を表す。log₂(Nb)≧の整数のビット数にわたり、選択されたウィンドウ形状のインデックスを符号化し、次いでその符号化されたインデックスを復号化器へ送る手段をもつことができる。
【００８４】
このようにして定義されたすべてのウィンドウはM個のサンプルに適用することができ、用いられる長さ2Mの分析ウィンドウh_a1および/またはh_a2は、両端を含めて0とNb-1の間の整数iおよびjに対して次のように構成される。
【００８５】
【数１８】

【００８６】
ウィンドウh_iおよびh_jは、たとえば下記を用いて構成される。
・様々な形状係数値(しばしばαと示される)に設定されたパラメータを有するKBDウィンドウ(図3の破線)
・正弦ウィンドウ
・AAC標準で述べられている低オーバラップ(低遅延)ウィンドウ
・様々な基準に基づいて、たとえば「Bancs de Filtres et quantification vectorielle sur reseau - Etude conjointe pour la compression d'images」、P. Onno、Universite de Rennes 1 thesis (1996)で述べられている符号化利得基準により、最適化されたウィンドウ
【００８７】
ウィンドウの選択を、1群のパラメータ化可能なウィンドウ(KBDウィンドウなど)に限定することが可能である。この場合は、すべてのパラメータは符号化された形(KBDウィンドウの場合は、形状係数αを量子化し符号化した値に限定される)で送ることができる。
【００８８】
復号化時には、符号化のために用いられた分析ウィンドウh_a2のタイプを受け取った後、および周波数領域サンプルX_kを復号化し、次いで逆DCT変換を適用した後に、時間サンプルを再構成するために合成ウィンドウが適用されなければならない。復元された信号がどれだけ劣化するかを制限するために、変換レベルでの完全な復元を確実にする合成ウィンドウを選ぶことが好ましい。量子化がない場合は、直接変換に後続する逆変換は何らの歪も生じない。しかしながらここで採用される基準は、所定の知覚閾値に対する、変換復元誤差の知覚可能性が無視し得るものに留まるべきであるというものである。
【００８９】
フレームT₁およびT₂の共通部分を、変換によって生じる歪なしに再構成するためには、この共通部分(0≦n<Mでの、h_s2(n)およびh_s1(n+M))に影響する合成ウィンドウ部分は、同じ共通部分(h_a1(n+M)およびh_a2(n))にわたる分析ウィンドウに関連付けられなければならない。次式は、この共通部分での完全な復元を確実にするために遵守されるべき条件を規定し、ただしn=O・・・M-1である。
【００９０】
【数１９】

【００９１】
この連立方程式をウィンドウh_s2(n)およびh_s1(n+M)について解くと、D(n)=h_a1(n+M)・h_a2(M-1-n)+h_a2(n)・h_a1(2M-1-n)≠0を条件として、次のようになることが分かる。
【００９２】
【数２０】

【００９３】
したがってこの合成ウィンドウh_s1(n+M)およびh_s2(n)の選択は、完全な復元を確実にする。
【００９４】
これに従って、合成時には、
・ウィンドウh_s1(n+M)は、フレームT₁の第2の部分に適用される逆MDCTに対して適用され、
・ウィンドウh_s2(n)は、フレームT₂の前半に適用される逆MDCTに対して適用される。
【００９５】
2つの重み付けの結果は、復号化されたサンプルを得るために項ごとに加算される。
【００９６】
ウィンドウh_s1(n+M)およびh_s2(n)は、単に、分析ウィンドウの時間反転と、それに後続する補正係数D'(n)=1/D(n)の適用によって構成されることが分かる。それに従って、ウィンドウh_s1(n+M)は分析ウィンドウh_a2(n)の時間インデックスを反転することによって構成され、相互的に、ウィンドウh_s2(n)は分析ウィンドウh_a1(n+M)の時間インデックスを反転することによって構成される。補正係数(ウィンドウのそれぞれに適用されるべき利得に相当する)は、D'(n)=1/D(n)によって定義される。時間反転または時間インデックス反転という表現は、ここではウィンドウの形状を、現在の時間インデックスnに等しく反対のインデックス(-n)の関数として定義することを指す。
【００９７】
h_a2(M-1-n)のタイプのウィンドウはフレームT₁の第2の部分に適用することができ、h_a1(2M-1-n)のタイプのウィンドウはフレームT₂の前半に適用することができる。この重み付けの結果は次いで加算され、最後に重み係数D'(n)=1/D(n)によって重み付けされる。
【００９８】
注目すべき特性は重み係数1/D(n)が、振幅歪を補正する簡単な利得係数であることである。それによりウィンドウh_a2(M-1-n)およびh_a1(2M-1-n)を用いた復元演算は、時間反転要素が取り除かれた復元信号を生じる。したがって利得D'(n)は、簡単な振幅補正項とみなすことができる。
【００９９】
利得D(n)に対する表式はまた注目すべき特性、すなわちD(n)=D(M-1-n)を示し、これはM/2個だけの利得係数D(n)を計算し、かつ/または記憶する必要があるという事実に反映される。この特性は、合成時の利得D'(n)にも当てはまる。
【０１００】
したがって第1の実施形態は、符号化時に、分析ウィンドウ間の遷移のすべての可能性を組み合わせてすべての合成ウィンドウを記憶することができ、すなわち結果として次のようになる(ここでD_i,j(n)=h_i(n+M)・h_j(M-1-n)+h_j(n)・h_i(2M-1-n))。
【０１０１】
【数２１】

【０１０２】
この場合、この実施形態は大量のメモリを必要とする。
【０１０３】
第2の実施形態は、復号化器内に分析ウィンドウを、そのまま、または時間反転されたインデックスで記憶することができる。次いで利得D_i,j(n)、0≦n<M/2が計算され、その後に時間反転された分析ウィンドウが復元のために用いられる。最後に、加算後に得られた結果は、利得D'_i,j(n)=1/D_i,j(n)によって重み付けされる。
【０１０４】
ペア(i,j)のいくつかの特定の組み合わせについて、1組のサンプルnに対して利得D_i,j(n)=1となることが起こり得る。この特定の場合には、最終の重み付けは不要とすることができる。
【０１０５】
この簡略化を、利得D_i,j(n)が1に非常に近い場合、具体的にはたとえば補正すべき振幅歪が0.1dB未満の場合に拡張することが可能であり、これは実際には、選択された閾値たとえば0.01未満の、利得D_i,j(n)と1の絶対値差に反映されるようにすることができる。
【０１０６】
上記の実施形態のいずれにおいても、利得関数D_i,j(n)およびそれらの逆数の関数D'_i,j(n)は、使用時に計算するか、または必要なときのために始めに記憶することができる。
【０１０７】
さらに利得関数D_i,j(n)は、各ペア(i,j)に対してM/2個だけの記憶要素を必要とすることが留意されるべきである。さらに、どのようなペア(i,j)であってもD_i,j(n)=D_j,i(n)であるので、すべての組み合わせを記憶する必要はない。
【０１０８】
遅延低減に適用される本発明の有利な実施形態について、以下に述べる。
【０１０９】
この特定の実施形態では、分析ウィンドウh_a1(n+M)において、ゼロの重み付けウィンドウの整数部分(重み係数の隣接する値)が課される。より具体的には図7に示されるように、ウィンドウh_a1(n+M)は、M_Z<M/2として2M-M_Z≦n<2Mの範囲内にM_Z個のゼロの部分を含み、この図はこの実施形態での2つの典型的なウィンドウを表す。
【０１１０】
第1の実施形態では従来技術とは対照的に、ウィンドウh_a1およびh_a2は、両端を含めてMと2Mの間の範囲内では互いに無関係である。ウィンドウh_a1およびh_a2の選択に関するただ1つの条件は、値D(n)は0≦n<Mに対してゼロであってはならないことである。この特定のウィンドウh_a1(n+M)の構成は、合成ウィンドウh_s2(n)が0とM_Z-1の間にゼロを含むことができることを確実にする。この結果は、次式から生じる。
【０１１１】
【数２２】

【０１１２】
したがって、分析のために用いられたのと同じ非対称ウィンドウh_a1に対して、ゼロ係数の個数M_Zは、次式によって与えられる利得D(n)に対する条件を遵守するためには、条件M_Z< M/2を満足しなければならないことは明らかである。
D(n)=h_a1(n+M)・h_a1(M-1-n)+h_a1(n)・h_a1(2M-1-n)≠0
【０１１３】
この、分析ウィンドウh_a1(n+M)の一部分をゼロに設定することは、以下に述べるようにサンプル復元遅延に対して有利な効果を有する。
【０１１４】
図8を参照すると、フレームT1(2M個のサンプルのサイズを有する)は、ウィンドウh_a1を適用することによって処理される。この重み付けの結果は、DCTによって処理される。ウィンドウh_a1はゼロを含むので、フレームT1は単に、符号化し、2M-M_Z個のサンプルの終わりに送ることができる。対応する符号化されたフレームを送るのに、フレームT1の2M個のサンプルの終わりを待つ必要はなく、その最初の2M-M_Z個のサンプルの処理を待つだけでよい。従来技術の標準ウィンドウの使用と比べてこれは、フレームT1の終わりのM_Z個のサンプルを処理するのにかかる時間に相当する進みを表す。
【０１１５】
合成時には、同様な合成ウィンドウh_s1は、ゼロの最初のM_Z個の係数を含み(もはやウィンドウの終わりではなく、ここではウィンドウの始まりにある)、これは同様にして、M_Z個のサンプルの進みを有して復号化されたサンプルを復元することを可能にする。合成ウィンドウの始まりに対応するM_Z個のサンプルは、ウィンドウh_s1の始まりは効果を及ぼさないので、実際には図8から先行するウィンドウh_s0によって再構成される。それによりやはり、M_Z個の復号化されたサンプルを効率的に復元するように、逆DCTの後に後続のサンプルを待つ必要はなく、これは合成時にさらにM_Z個の進みを生じる。
【０１１６】
したがって分析ウィンドウの終わりにM_Z個の連続するゼロ係数を課すことにより、2M_Z個のサンプルの直接MDCTおよび次いで逆MDCT^-1処理によって引き起こされる遅延を低減することできる。それにより総遅延は、2M-2M_Zサンプルとなる。この遅延の低減は、2M-M_Zの実効長さを有するウィンドウによって達成され、一方、従来技術の解決策の教示によれば標準の方法では、分析および合成ウィンドウは同じ遅延低減に対しては同一(時間反転は別として)であり、2M-2M_Zの実効長さを有する。それによりこの実施形態を用いて、より長いウィンドウを使用することができ、したがって得られる周波数応答はより有利となり、符号化品質が改善される。
【０１１７】
従来技術は、ウィンドウの終わりまたは始まりにゼロが導入された場合は、重み付けウィンドウの中央の係数に1の値を与え、これはこのタイプのウィンドウ(図5)を有する符号化特性を不利にするが、本発明にはこの欠点はない。さらに、連続する分析ウィンドウの選択には制約がないので、満足な符号化特性を得ることができる。
【０１１８】
したがって、符号化されるべき信号に対して他よりも適した分析変換を、ゼロをその終わりに含む分析フィルタから(たとえばプロトタイプフィルタの辞書内で)選択することができ、最適な信号符号化/復号化となり、従来技術と比べて2M_Z個だけ低減された遅延となる。
【０１１９】
合成時の補正D'(n)を避けることを可能にする符号化のための1対のウィンドウh_a1およびh_a2が選択される、本発明の特定の一実施形態について以下に述べる。ここで論点は、最初の分析ウィンドウを大幅に変更して、合成時に一定でかつ1に等しい重み関数D'(n)を保証することである。
【０１２０】
この目的のために、0≦n<2Mの範囲にわたって定義され、任意のインデックスnに対して非ゼロ正規化係数Δ(n)ただし0≦n<Mを満足するウィンドウh(n)に基づいて2つの分析ウィンドウ部分が決定される。
【０１２１】
【数２３】

【０１２２】
次いで0≦n<Mに対して、下記が構成される。
h_a1(n+M)=h(n+M)/Δ(n)、およびh_a2(n)=h(n)/Δ(n)
【０１２３】
このようにして、復元時の利得D'(n)は任意のnに対して1であり、合成時の復元は同じであるが時間反転された分析ウィンドウh_a1およびh_a2による重み付けによってもたらされ、この重み付けの後に簡単な加算が続く。
【０１２４】
M_Z個のゼロを含み、0≦n<2M-M_Zに対して2M_Z個のサンプルの遅延を制限することができるウィンドウh(n)の一例は、0≦n<2Mに対して、
【０１２５】
【数２４】

【０１２６】
その他では、すなわち2M-M_Z≦n<2Mに対しては、h(n)=0となる。
【０１２７】
周波数選択性が形状パラメータαに従って変化することを可能にするもう1つの可能な選択は、0≦n<M-M_Z/2に対して次のように定義されるカイザー・ベッセルウィンドウにある。
【０１２８】
【数２５】

【０１２９】
ただしM'=M-M_Z/2
【０１３０】
ここで0≦n<M-M_Z/2に対して、h(2M-M_Z-1-n,α)=h(n,α)であり、
・その他では(2M-M_Z≦n<2Mなどのnに対しては)、h(n,α)=0である。
【０１３１】
したがって、選択された初期化ウィンドウh(n)から分析ウィンドウh_a1およびh_a2を決定し、そこから単に時間反転によって合成ウィンドウを決定することが可能であることが分かる。
【０１３２】
本発明による復号化を実装するには、ウィンドウの始まりにM_Z個のゼロ係数を含む初期化ウィンドウh(n)から直接、2つの合成ウィンドウ部分h_s1およびh_s2を決定することも可能である。
【０１３３】
正弦初期化ウィンドウ(図11の実線の曲線)に基づき、0≦n<M_Zに対して
h(n)=0
および0≦n<2M-M_Zに対して
【０１３４】
【数２６】

【０１３５】
次いで合成ウィンドウ部分h_s1およびh_s2は直接、次のように推論することができる。
h_s1=(n+M)=h(n+M)/Δ(n)
h_s2(n)=h(n)/Δ(n) 0≦n<M
【０１３６】
前のように、0≦n<Mに対しては、
【０１３７】
【数２７】

【０１３８】
図11は、この実施形態において実線で示される正弦的に表された初期化ウィンドウh(n)から得られる2つのウィンドウ部分h_s1およびh_s2から結果として生じる全体としての合成ウィンドウh_siの形状を破線にて示す。
【０１３９】
本明細書で例示として述べられる本発明の一実施形態はまた、図9に示されるような符号化/復号化システムを提供する。符号化器CODは、一連のサンプルX_nを含む符号化されるべきデジタル信号Sを受け取る。この一連のサンプルは、それぞれが2M個のサンプルの連続するブロックB_i、B_i+1などにおいて処理される(ステップ101、図10A)。符号化器の処理手段μPは、たとえば所与の基準(エントロピー、符号化利得、歪/ビットレートなど)に従ってブロックB_iの内容を1つずつ分析し(ステップ102、図10A)、これから符号化器の辞書DICを用いて、上述の基準に従ってこのブロックBiに最適となる分析ウィンドウha_iを推論する。このようにして選択された分析重み付けウィンドウha_iは現在のブロックB_iに適用され(ステップ103、図10A)、これは次いで符号化される(ステップ104)。
【０１４０】
この符号化から結果として生じるブロックB'_iは次いで、選択された分析ウィンドウha_iの辞書DIC内の符号と共に、符号化された信号S'にて、図9の復号化器DECODへ送られる(ステップ105、図10A)。もちろん復号化器DECODは、前のブロックB'_i-1と共に、前に用いられた分析ウィンドウha_i-1を指定する辞書DICからの符号を受け取っている。一連の符号化されたブロックB'_i、B'_i+1など、およびブロックB_iの符号化において分析のために用いられたウィンドウ符号ha_iを含む符号化された信号S'を受け取ると(ステップ106、図10B)、復号化器DECODは、それ自体の辞書DIC'(符号化器の辞書DICと同様の)から、合成のために用いられるべき半分のウィンドウhs_i-1(n+M)およびhs_i(n)を決定する(ステップ107)。
【０１４１】
ここで述べる実施例では、復号化器DECODの処理手段μPは、分析において前に用いられたウィンドウha_i-1に関連する各時間インデックスnに対する補正係数D(n)を推定する(ステップ108)。補正係数が1に近い場合(たとえば0.1dBの絶対値閾値を用いて)は、図10Bのテスト109では復号化器は補正を適用しない(テスト109からの出口のy矢印)。そうでない場合(n矢印)は処理手段μPは、上述の補正D'(n)=1/D(n)を適用する(ステップ110)。ステップ111において処理は、ウィンドウhs_iで重み付けされたブロックB'_i(適切な場合には係数D'によって補正された)などの復号化を継続して、復号化された信号
【０１４２】
【数２８】

【０１４３】
の復号化されたブロック
【０１４４】
【数２９】

【０１４５】
、
【０１４６】
【数３０】

【０１４７】
などを供給し、その(無損失の)サンプル
【０１４８】
【数３１】

【０１４９】
は、完全な復元が実現されるので最初のサンプルX_nの値を有する。
【０１５０】
本発明はまた、図9に表されるタイプの符号化器COD、ならびにこのような符号化器のメモリに記憶されることが意図されたコンピュータプログラム、および図10Aのフローチャートによって表すことができるアルゴリズムを提供する。本発明はさらに、図9に表されるタイプの復号化器DECOD、ならびにこのような復号化器のメモリに記憶されることが意図されたコンピュータプログラム、および図10Bのフローチャートによって表すことができるアルゴリズムを提供する。

【特許請求の範囲】
【請求項１】
重み付けウィンドウを用いて重なりを有するデジタル信号を符号化する変換ベースの方法であって、
同じサイズ(2M)の前記信号のサンプルの2つの連続するブロックは、それぞれ第1の分析ウィンドウ(h_a1)および第2の分析ウィンドウ(h_a2)によって重み付けされ、
前記第1および第2のウィンドウはそれぞれ、立ち上がりエッジおよび立ち下がりエッジを含み、前記第2のウィンドウ(h_a2)の立ち上がりエッジは、時間反転された前記第1のウィンドウ(h_a1)の立ち下がりエッジとは異なる、符号化方法。
【請求項２】
前記第1および第2のウィンドウが、前記2つのブロックのそれぞれにわたって決定される前記信号の特性に対して特定の基準に従って、互いに無関係に選択される、請求項1に記載の符号化方法。
【請求項３】
重み付けウィンドウを選択するための前記基準が、
・最大化された符号化利得(G_TC)、
・変換されたサンプルの、最小化されたエントロピー(J_H)、
・符号化/復号化によって生じる歪と、前記符号化のために必要なビットレートとの間の最適化されたトレードオフ(J_RD)
の1つまたは組み合わせである、請求項2に記載の符号化方法。
【請求項４】
ブロックを符号化するために選択される各重み付けウィンドウは、可能な重み付けウィンドウの辞書内で選択され、ウィンドウインデックスが前記辞書からの各ウィンドウに関連付けられ、
前記選択されたウィンドウの前記インデックスは、符号化のために選択された前記ウィンドウと同様なウィンドウを復号化するための復号化器に送られる、請求項1から3のいずれか一項に記載の符号化方法。
【請求項５】
前記分析ウィンドウの少なくともいくつかが、ウィンドウの終わりに選択された個数(M_Z)の値ゼロの連続する重み係数を含み、ゼロ係数の前記選択された個数(M_Z)はウィンドウの係数の総数(2M)の4分の1未満である、請求項1から4のいずれか一項に記載の符号化方法。
【請求項６】
重み付けウィンドウを用いて重なりを有するデジタル信号を復号化する変換ベースの方法であって、
同じサイズ(2M)の前記信号のサンプルの2つの連続するブロックは、それぞれ第1の合成ウィンドウ(h_s1)および第2の合成ウィンドウ(h_s2)によって重み付けされ、
前記第1および第2のウィンドウはそれぞれ、立ち上がりエッジおよび立ち下がりエッジを含み、前記第2のウィンドウ(h_s2)の立ち上がりエッジは、時間反転された前記第1のウィンドウ(h_s1)の立ち下がりエッジとは異なる、復号化方法。
【請求項７】
符号化のために次々に用いられた分析ウィンドウについての情報(cod(ha_i))が符号化器から受け取られ、前記第1および第2の合成ウィンドウ(h_s1, h_s2)は、符号化のために次々に用いられた前記第1および第2の分析ウィンドウ(h_a1, h_a2)から推論され、前記第1および第2の合成ウィンドウはそれぞれ、それぞれ第2および第1の分析ウィンドウの重み係数の時間位置を反転し、それぞれ第2および第1の分析ウィンドウの各重み係数に補正係数(1/D(n))を適用することにより、それぞれ第2および第1の分析ウィンドウから推論される、請求項6に記載の復号化方法。
【請求項８】
前記第1の合成ウィンドウ(h_s1)および前記第2の合成ウィンドウ(h_s2)は、それぞれ前記第1および第2の分析ウィンドウ(h_a1)および(h_a2)から下記のタイプの式を用いて推論され、
【数１】

・ここで数Mは、サンプルのブロックが2M個のサンプルを含むようになる数、
・nは、両端を含めて0とM-1の間の時間位置インデックス、
・h(n)は、時間位置インデックスnを用いてウィンドウhの重み係数を示し、
・-nは、インデックスnと等しく反対であることを示して前記時間位置の反転を明示し、
・D(n)は、時間位置係数nに対して適用されるべき補正係数を示し、この係数は両端を含めて0とM-1の間のnに対して非ゼロであり、式
D(n)=h_a1(n+M)・h_a2(M-1-n)+h_a2(n)・h_a1(2M-1-n)
によって与えられる、請求項7に記載の復号化方法。
【請求項９】
前記分析ウィンドウについての前記情報は、符号化のために用いられるウィンドウの辞書(DIC)からのインデックスからなり、復号化のために同様な辞書(DIC')が設けられ、前記同様な辞書は、符号化のために用いられる前記分析ウィンドウと同様な、かつ前記補正係数(1/D(n))によって事前に補正された合成ウィンドウを含み、辞書インデックスをもつ前記同様な辞書からの各ウィンドウは、前記復号化器に送られた前記分析ウィンドウインデックスから決定することができる、請求項7または8に記載の復号化方法。
【請求項１０】
前記分析ウィンドウについての前記情報は、符号化のために用いられるウィンドウの辞書(DIC)からのインデックスからなり、符号化のための分析フィルタのバンクのプロトタイプフィルタから得られるそれぞれのウィンドウを含む同じ辞書が復号化のために設けられ、復号化のために、
・時間位置の反転と、
・係数に対して推定された前記補正係数(1/D(n))が、所定の閾値内で1と大幅に異なる場合に、前記辞書からのウィンドウの係数に対する補正係数の適用と
が適用される、請求項7または8に記載の復号化方法。
【請求項１１】
前記合成ウィンドウの少なくともいくつかが、ウィンドウの始まりに選択された個数のゼロ値の連続する重み係数を含み、ゼロ係数の前記選択された個数(M_Z)はウィンドウの係数の総数(2M)の4分の1未満である、請求項6から10のいずれか一項に記載の復号化方法。
【請求項１２】
2つの時間反転された分析ウィンドウ部分に対応する重み付けウィンドウを用いた合成演算を含み、前記合成ウィンドウによる重み付けは加算によってもたらされ、前記分析ウィンドウ部分h_a1(n)およびh_a2(n)は、h_a1(n+M)=h(n+M)/Δ(n)およびh_a2(n)=h(n)/Δ(n)のタイプの表式によって初期化ウィンドウh(n)の関数として表され、Mはブロックが2M個のサンプルを含むようになる数、nは0≦n<Mとなる時間インデックス、およびΔ(n)は0≦n<Mとなる任意のインデックスに対して定義される非ゼロ正規化係数である、請求項11に記載の復号化方法。
【請求項１３】
2つの合成ウィンドウ部分(h_s1)および(h_s2)が、0≦n<Mに対して、h_s1(n+M)=h(n+M)/Δ(n)およびh_s2(n)=h(n)/Δ(n)のタイプの表式に従って選択される、ある個数(M_Z)のゼロ係数をその始まりに含む初期化ウィンドウh(n)から直接決定され、Mはブロックが2M個のサンプルを含むようになる数、nは0≦n<Mとなる時間インデックス、およびΔ(n)は0≦n<Mとなる任意のインデックスnに対して定義される非ゼロ正規化係数である、請求項11または12に記載の復号化方法。
【請求項１４】
前記正規化係数が、
【数２】

のタイプの表式によって定義される、請求項12または13に記載の方法。
【請求項１５】
前記初期化ウィンドウh(n)が次式、すなわち
0≦n<M_Zに対してh(n)=O、および
【数３】

によって表され、ただしM_Zは前記初期化ウィンドウの始まりのゼロ係数の前記選択された数であることを特徴とする、請求項13または14に記載の方法。
【請求項１６】
重み付けウィンドウを用いて重なりを有するデジタル信号の変換ベースの符号化のためのデバイスであって、請求項1から5のいずれか一項に記載の方法を実施する手段を含むことを特徴とするデバイス。
【請求項１７】
重み付けウィンドウを用いて重なりを有するデジタル信号の変換ベースの復号化のためのデバイスであって、請求項6から15のいずれか一項に記載の方法を実施するための命令を含むことを特徴とするデバイス。
【請求項１８】
符号化または復号化デバイスのメモリ内に記憶されるように適合されたコンピュータプログラムであって、命令が前記デバイスのプロセッサによって実行されるときに、請求項1から5のいずれか一項に記載の符号化方法、または請求項6から15のいずれか一項に記載の復号化方法を実施するための命令を含むことを特徴とするコンピュータプログラム。

【図１】

【図２】

【図３】

【図４】

【図５】

【図６】

【図７】

【図８】

【図９】

【図１０Ａ】

【図１０Ｂ】

【図１１】

【公表番号】特表２０１１−５０７４４０（Ｐ２０１１−５０７４４０Ａ）
【公表日】平成２３年３月３日（２０１１．３．３）
【国際特許分類】

電気 (1,674,590)
- 電気通信技術 (544,871)
  - 画像通信，例．テレビジョン (280,882)
    - テレビジョン方式［４，２０１１．０１］ (43,981)
      - パルス符号変調を用いるテレビジョン信号の伝送方式［６，２０１１... (10,979)
        
        ビットレートの低減をするもの (10,935)
        
        変換符号化を含むもの (1,758)

【出願番号】特願２０１０−５３８８５７（Ｐ２０１０−５３８８５７）
【出願日】平成２０年１２月１１日（２００８．１２．１１）
【国際出願番号】ＰＣＴ／ＦＲ２００８／０５２２８６
【国際公開番号】ＷＯ２００９／０８１００３
【国際公開日】平成２１年７月２日（２００９．７．２）
【出願人】（５９１０３４１５４）フランス・テレコム (290)
【Ｆターム（参考）】

[ Back to top ]

適応型ウィンドウを有する変換ベースの符号化／復号化

メニュー

スポンサーリンク

次の公報 »

« 前の公報

適応型ウィンドウを有する変換ベースの符号化／復号化

メニュー

スポンサー リンク

次の公報 »

« 前の公報

スポンサーリンク