説明

適応型ウィンドウを有する変換ベースの符号化/復号化

適応型ウィンドウを有する、変換ベースの符号化/復号化。本発明は、デジタル信号の符号化/復号化に関し、具体的には重み付けウィンドウを用いた重なりを有する変換に基づくものに関する。本発明の意味において、2つの連続する等しいサイズの、信号のサンプルのブロックは、それぞれ2つの異なる連続するウィンドウによって重み付けすることができる。これらの2つのウィンドウは、2つのブロックのそれぞれに対して決定される、信号の特性に対して特定の基準(エントロピー、データレート/歪など)に従って互いに無関係に選択することができる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、デジタル信号の符号化および復号化に関する。
【背景技術】
【0002】
変換ベースの符号化方式において低減されたビットレートを得るには、通常、知覚し得る劣化を最小に保ちながら、サンプル符号化プロセスに充てられた精度を減少させる試みがなされる。この目的のために、量子化精度の減少は、知覚的重み付けを用いることによって制御される。たとえば、(映像符号化のために)人間の目、または(音声符号化のために)人間の耳の知られている特性に基づいて、この手法は量子化ノイズを、知覚される可能性の最も小さい周波数帯域内に配置することを可能にする。
【0003】
基本的に周波数領域において映像心理学的または音声心理学的モデルからの情報を用いるには、量子化が周波数領域においてもたらされる時間/周波数変換を適用するのが標準的技法である。
【0004】
図1は、下記を有する変換ベースの符号化器の構造を示す図である。
・入力信号Xを受け取る、分析フィルタFA1からFAnのバンクBA
・量子化ブロックQ(帯域量子化モジュールQ1、・・・、Qnを含む)と、それに続く符号化モジュールCOD1からCODnを含む符号化ブロックCOD
・符号化された信号X'を供給する、合成フィルタFS1、・・・、FSnのバンクBS
【0005】
伝送前にビットレートをさらに低減するために、量子化された周波数領域サンプルは、しばしばエントロピー(無損失)符号化プロセスによって符号化される。量子化は、標準の方法で一様または非一様スカラー量子化器、またはベクトル量子化器によってもたらされる。
【0006】
量子化ステップにおいて導入されるノイズは、合成フィルタのバンクによって整形される(このプロセスは、逆変換の適用として知られる)。したがって分析変換に関連する逆変換は、量子化ノイズを、それが知覚し得るようになるのを防ぐように周波数または時間領域内で集中させるように選ばれなければならない。
【0007】
分析変換は、変換された領域でのサンプルの符号化を容易にするために、信号のエネルギーを最適に集中させなければならない。このプロセスは、エネルギー圧縮と呼ばれる。具体的には、入力信号に依存する、分析変換の符号化利得が最大化されなければならない。このために以下のタイプの式が用いられ、Kは有利には値6.02を有することができる定数であり、Rはそれぞれの選択されたサンプルのビット数である。
SNR=GTC+K・R (1)
【0008】
したがって、得られる信号対ノイズ比(SNR)は、Rへの比例分に変換の符号化利得を表す成分GTCを加えたものになる。
【0009】
符号化利得が高いほど、復元の品質は良くなる。したがって符号化プロセスのために用いられる変換の重要性は明らかである。これは、(分析部による)信号のエネルギーと、(合成部による)量子化ノイズの両方を集中させる能力によってサンプルの符号化を容易にする。
【0010】
音声および映像信号は良く知られているように非定常的であり、時間-周波数変換は、フィルタのバンクの入力信号の性質の関数として、時間と共に適合されなければならない。
【0011】
通常の符号化技術へのいくつかの応用例について以下に述べる。
【0012】
変調された変換にて、正規化された音声符号化技術は、コサイン変換または高速フーリエ変換に基づく高速アルゴリズムを用いて、これらの符号化技術の実装を可能にするコサイン変調フィルタのバンクを統合する。
【0013】
最も一般に(特にMP3、MPEG-2、およびMPEG-4 AAC符号化で)用いられるこのタイプの変換は、修正離散コサイン変換(MDCT:Modified Discrete Cosine Transform)であり、そのための表式は次の通りである。
【0014】
【数1】

【0015】
ただし、
・Mは、変換のサイズ
・xn+tMは、時間n+tMでの、周期
【0016】
【数2】

【0017】
(サンプリング周波数の逆数)を有するデジタル化された信号のサンプル
・tはフレームインデックス

【0018】
【数3】

【0019】
は、フレームtに対する変換された領域でのサンプル

【0020】
【数4】

【0021】
は、変換の基本関数であり、ここで
・項ha(n)は、プロトタイプフィルタまたは分析重み付けウィンドウと呼ばれ、2M個のサンプルを扱い、
・項Cn,kは、変調を定義する。
【0022】
この変換は、音声処理に適用される。これは映像処理、特に固定画像符号化にも適用され、変換は標準の方法で行と列に次々に適用される。この原理はさらに、2次元以上の信号にも拡張される。
【0023】
最初の時間サンプルを復元するには、そのときに2つの連続する変換の重なりの領域内に位置する0≦n<Mのサンプルを再構成するために、以下の逆変換が復号化に適用される。次いで、復号化されたサンプルは、次式によって与えられ、ここで
【0024】
【数5】

【0025】
は、合成変換を定義し、合成重み付けウィンドウはhs(n)で示され、やはり2M個のサンプルを扱う。
【0026】
【数6】

【0027】
複合化されたサンプルを生じる復元式はまた、次の形に書くことができる。
【0028】
【数7】

【0029】
このもう1つの復元式の表式は、2つの逆コサイン変換を、変換領域におけるサンプル
【0030】
【数8】

【0031】
および
【0032】
【数9】

【0033】
に、次々に適用することができ、次いでそれらの結果は重み付けおよび加算演算によって組み合わされると考えられることを意味する。この復元方法は図2に示され、ここで変換領域でのサンプルはXt,kで示され、時間領域での復元されたサンプルは
【0034】
【数10】

【0035】
で示される。
【0036】
MDCTは通常、分析用と合成用に同一のウィンドウを使用し、したがってh(n)=ha(n)=hs(n)である。
【0037】
信号の正確な(完全と呼ばれる)復元を、(条件
【0038】
【数11】

【0039】
に従って)確保するためには、いくつかの制約を満足するプロトタイプウィンドウh(n)を選ぶ必要がある。
【0040】
次式は、完全な復元を得るのに十分である。これらは通常、MDCTに適した復元ウィンドウのために採用される。
【0041】
【数12】

【0042】
ウィンドウは、図3の例に示すように中央のサンプルに対して偶対称のものである。
【0043】
これらの簡単な制約を満たすことは比較的簡単であり、この目的のために標準のプロトタイプフィルタは、次のように記述される正弦ウィンドウ(図3に実線で示される)からなる。
【0044】
【数13】

【0045】
もちろん、MPEG-4標準で規定されるカイザー・ベッセル派生型(KBD:Kaiser-Bessel-derived)ウィンドウ(図3の破線の曲線に相当する)、および低オーバラップウィンドウなど、他の形のプロトタイプフィルタが存在する。
【0046】
変換を、符号化されるべき信号に適合させる必要性を考えて、従来技術の技法は用いられる変換を時間と共に変化させることを可能にしており、これは以下ではウィンドウ切り換えと呼ばれる。ここで変換を変化させるときに、用いられるウィンドウのサイズは同じままであり、したがってウィンドウの重み係数だけが時間と共に変化することが分かる。
【0047】
一定ウィンドウのための上記の表式は、以下ではウィンドウの変化の場合に適合される。一般性を失わずに、オーバラップはMDCTに対する2つの連続するフレームのみに関わり、2つの連続するフレームT1とT2に対する遷移は、以下のように説明される。第1のフレームT1は分析ウィンドウha1を用いるとともに、第2のフレームT2は分析ウィンドウha2を用いる。復元のために用いられる合成ウィンドウは、2つのウィンドウha1およびha2の重なり部分の分析ウィンドウと同一になるように選ばれる。したがって、0≦n<Mに対して
ha1(n+M)=hs1(n+M)
ha2(n)=hs2(n)
【0048】
複数の連続するフレームに対して同じウィンドウが用いられる、先の場合と異なり、もはや分析ウィンドウの前半と後半との間に直接の関係はない。これは重み係数ha1(n+M)は、係数ha1(n)と独立であり得るということを意味する。同様に、係数ha2(n)は、係数ha2(n+M)と独立であり得る。したがって、分析ウィンドウの形状は、時間と共に進化させることが可能となる。
【0049】
完全な復元のための条件は、0≦n<Mに対して次のようになる。
【0050】
【数14】

【0051】
上記の条件を検証するための非常に簡単な標準の解決法は、0≦n<Mに対して次のように選ぶことにある。
ha1(n+M)=ha2(M-1-n)
【0052】
したがって、図4を参照すると、フレームT2(図4の破線の曲線)の前半で用いられる分析ウィンドウは、フレームT1(図4の実線の曲線)の後半で用いられる分析ウィンドウの鏡映バージョンである。言い換えれば完全な復元を確実にするために、従来技術は鏡映効果の他に、同じ分析ウィンドウを共有する区間を介した漸進的な遷移を教示している。
【0053】
この鏡映効果は、合成ウィンドウ及び分析ウィンドウに与えられた等式によって、合成ウィンドウにも当てはまる。
【0054】
鏡映効果のために、ウィンドウha1内の係数ha1(n+M)の後にゼロ(値が0の重み係数)を挿入することは、ウィンドウha2の始まりに(項ha2(n)に)同じ数のゼロを挿入する効果を有する。さらにこのゼロの挿入は、逆順位M-nに対して値1を有する同じ数の係数を与えることを意味する。より正確には、次のようになる。
ha1(n+M)=ha2(M-1-n)
【0055】
このために、このような多くのゼロを含むウィンドウの一般的な外観は、図5に示されるように矩形ウィンドウのものと同様になる。矩形ウィンドウは、周波数領域において分解能が劣り、高レベルの不連続性を有する。これは、従来技術の符号化器/復号化器に固有の第1の問題である。
【0056】
標準化され、知られている符号化器/復号化器では通常、符号化器は用いられるべき変換を時間と共に選択する。したがってAAC標準では、文書「Information technology - Coding of audio-visual objects - Part 3: Audio」、ISO/IEC 14496-3 (2001)で述べられているように、符号化器は、分析ウィンドウの後半に対応するウィンドウ形状を選択しかつ送り、前半は先行するフレームのためにもたらされた選択によって生成される。AAC標準では、合成のために同じタイプのウィンドウが用いられることを可能にするために、ビットが復号化器に送られる。
【0057】
したがって、復号化器は、符号化器に対してスレーブとして動作し、符号化器によって決定されたウィンドウのタイプを忠実に適用する。
【先行技術文献】
【非特許文献】
【0058】
【非特許文献1】「Information technology - Coding of audio-visual objects - Part 3: Audio」、ISO/IEC 14496-3 (2001)
【非特許文献2】「Bancs de Filtres et quantification vectorielle sur reseau - Etude conjointe pour la compression d'images」、P. Onno、Universite de Rennes 1 thesis (1996)
【発明の概要】
【発明が解決しようとする課題】
【0059】
したがって、従来技術の欠点は、時間と共に用いられるウィンドウのタイプの遷移を確実にするためには、完全な復元を確実にするためにインターリーブされた半分のウィンドウを導入する必要があることである。それにより上記の分析ウィンドウha1およびha2は、それらの共通の媒体上で互いに無関係とすることはできない。
【0060】
本発明は、この状況を改善することを目的とする。
【課題を解決するための手段】
【0061】
この目的のために本発明は、連続するウィンドウに関して制約のない、ウィンドウ間の遷移を提案する。
【0062】
この目的のために本発明は第一に、重み付けウィンドウを用いて重なりを有するデジタル信号を符号化する変換ベースの方法を提供し、同じサイズ2Mの信号のサンプルの2つの連続するブロックは、それぞれ第1の分析ウィンドウおよび第2の分析ウィンドウによって重み付けされる。これらのウィンドウのそれぞれは、立ち上がりエッジおよび立ち下がりエッジを含み、第2のウィンドウの立ち上がりエッジは、時間反転された第1のウィンドウの立ち下がりエッジとは異なる。
【0063】
この特徴は上述の従来技術とは明確に区別され、したがって第1および第2のウィンドウは、たとえば2つのブロックのそれぞれにわたって判定される信号の特性に対して適当な基準に従って、互いに完全に無関係に選ぶことができることを明らかに示している。
【0064】
したがって、少なくとも2つのタイプの重み付けウィンドウが、具体的には符号化時に分析のために用意され、たとえば特定の事象が検出された現在のブロックを符号化するために重み付けウィンドウのタイプを変化させることが可能である。この特定の事象とは、典型的には信号の統計的特性の変化、または現在のフレームが含むデジタル信号のエネルギーの大きな増加などの特定の現象の発生である。
【0065】
これらのステップは次のブロックに対して繰り返され、それにより本発明を用いて、制約なしに、特に必然的にインターリーブされたウィンドウを課す従来技術の制約なしに、所与のタイプの重み付けウィンドウを適用することによって所与のブロックを符号化し、別のタイプの重み付けウィンドウを直接適用することによって所与のブロックの直後のブロックを符号化することが可能になる。
【0066】
上述のブロックは、たとえば上記のように信号フレームに対応させることができる。
【0067】
1つのタイプのウィンドウから他へ直接移行する可能性を提供することにより、本発明は、これらのウィンドウによって扱われる信号のそれぞれに適合されたウィンドウを用いて、符号化を実行することを可能にする。それにより、ウィンドウによって扱われる信号セグメントのそれぞれにおいて、改善された符号化利得が得られる。
【0068】
従来技術と比べて、信号の特性に対するウィンドウの正確な適合により改善された符号化品質が得られる。
【0069】
同様にして本発明は、重み付けウィンドウを用いて重なりを有するデジタル信号を復号化する変換ベースの方法を提供し、同じサイズの信号のサンプルの2つの連続するブロックは、それぞれ第1の合成ウィンドウおよび第2の合成ウィンドウによって重み付けされ、それぞれは立ち上がりエッジおよび立ち下がりエッジを含み、特に第2のウィンドウの立ち上がりエッジは、時間反転された第1のウィンドウの立ち下がりエッジとは異なる。
【0070】
本発明の一実施形態では、上述の2つのタイプの分析ウィンドウの少なくとも1つの分析ウィンドウは、すべてゼロの係数を含む少なくとも1つの終わりの部分を含む。次いで復号化時には、合成ウィンドウはウィンドウの始まりにゼロを含む。これは、適用される変換に関連した符号化/復号化遅延の低減を可能にする。
【0071】
したがって本発明には、遅延を最小化することが重要である対話型通信において有利な用途が見出される。
【0072】
本発明の他の特徴および利点は、以下の詳細な説明および添付の図面を考察することにより明らかになるであろう。
【図面の簡単な説明】
【0073】
【図1】従来技術に関する図である。
【図2】従来技術に関する図である。
【図3】従来技術に関する図である。
【図4】従来技術に関する図である。
【図5】従来技術に関する図である。
【図6】本発明の、第1および第2のウィンドウが異なる形状を有するウィンドウタイプの変化を示す図である。
【図7】本発明の有利な実施形態において、ウィンドウの終わりにMZ個のゼロ係数を含む分析ウィンドウを示す図である。
【図8】この有利な実施形態が達成する、符号化/復号化遅延の低減を示す図である。
【図9】本発明の符号化/復号化システムを示す図である。
【図10A】本発明の符号化方法のステップを示す図である。
【図10B】復号化方法のステップを示す図である。
【図11】有利な合成ウィンドウ形状を(破線にて)示す図である。
【発明を実施するための形態】
【0074】
以下に、特別の事前対策なしに、特に遷移ウィンドウなしに、1つの分析ウィンドウから他へ移行することを可能にする本発明の一実施形態について述べる。それにより符号化時に選ばれる分析ウィンドウは互いに無関係であり、これは符号化品質の改善に寄与する。
【0075】
現在のフレームT2を考えると、ここで直前のフレームT1に対しては、分析ウィンドウの特定の選択がすでになされているものとする。周波数領域における現在のフレームT2のサンプルの符号化を容易にするために、フレームT2のために別の分析ウィンドウが選ばれる。たとえば1つの可能な基準は、フレームT2のために選ばれるウィンドウha2は、次式で与えられる変換された領域での符号化利得を最大にするべきであるというもので、この式で
【0076】
【数15】

【0077】
は、変換されたサンプルXkの分散の推定値を表す。
【0078】
【数16】

【0079】
別法として別の基準は、たとえば次の形で表されるように、変換されたサンプルのエントロピーの最小化に基づくものとすることができる。
【0080】
【数17】

【0081】
第一に符号化/復号化後の歪と、第二にその符号化に必要なビットレートとの間の最適な妥協を規定する、より複雑な基準を想定することが可能である。最小にされるべき、このより複雑な基準は、たとえば以下の形に書くことができ、ここでD(X)は選択されたビットレートに対するサンプルXkの歪の測定値であり、R(X)はその選択されたビットレートである。
JRD=D(X)+λR(X)
【0082】
最終的に採用された基準による、最良の分析ウィンドウha2は、限定された組み合わせのセットにおいて決定されることが好ましい。用いられる分析フィルタ(特に符号化重み付けウィンドウに対応する分析プロトタイプフィルタ)のタイプは、復号化器に知られていなければならず、したがって復号化器に送られなければならないという点において、依然として1つの制約が課される。
【0083】
したがってウィンドウha2は、分析ウィンドウの辞書{h0、h1、h2、・・・、hNb-1}から選ぶことができ、ここでNbは可能な選択の数を表す。log2(Nb)≧の整数のビット数にわたり、選択されたウィンドウ形状のインデックスを符号化し、次いでその符号化されたインデックスを復号化器へ送る手段をもつことができる。
【0084】
このようにして定義されたすべてのウィンドウはM個のサンプルに適用することができ、用いられる長さ2Mの分析ウィンドウha1および/またはha2は、両端を含めて0とNb-1の間の整数iおよびjに対して次のように構成される。
【0085】
【数18】

【0086】
ウィンドウhiおよびhjは、たとえば下記を用いて構成される。
・様々な形状係数値(しばしばαと示される)に設定されたパラメータを有するKBDウィンドウ(図3の破線)
・正弦ウィンドウ
・AAC標準で述べられている低オーバラップ(低遅延)ウィンドウ
・様々な基準に基づいて、たとえば「Bancs de Filtres et quantification vectorielle sur reseau - Etude conjointe pour la compression d'images」、P. Onno、Universite de Rennes 1 thesis (1996)で述べられている符号化利得基準により、最適化されたウィンドウ
【0087】
ウィンドウの選択を、1群のパラメータ化可能なウィンドウ(KBDウィンドウなど)に限定することが可能である。この場合は、すべてのパラメータは符号化された形(KBDウィンドウの場合は、形状係数αを量子化し符号化した値に限定される)で送ることができる。
【0088】
復号化時には、符号化のために用いられた分析ウィンドウha2のタイプを受け取った後、および周波数領域サンプルXkを復号化し、次いで逆DCT変換を適用した後に、時間サンプルを再構成するために合成ウィンドウが適用されなければならない。復元された信号がどれだけ劣化するかを制限するために、変換レベルでの完全な復元を確実にする合成ウィンドウを選ぶことが好ましい。量子化がない場合は、直接変換に後続する逆変換は何らの歪も生じない。しかしながらここで採用される基準は、所定の知覚閾値に対する、変換復元誤差の知覚可能性が無視し得るものに留まるべきであるというものである。
【0089】
フレームT1およびT2の共通部分を、変換によって生じる歪なしに再構成するためには、この共通部分(0≦n<Mでの、hs2(n)およびhs1(n+M))に影響する合成ウィンドウ部分は、同じ共通部分(ha1(n+M)およびha2(n))にわたる分析ウィンドウに関連付けられなければならない。次式は、この共通部分での完全な復元を確実にするために遵守されるべき条件を規定し、ただしn=O・・・M-1である。
【0090】
【数19】

【0091】
この連立方程式をウィンドウhs2(n)およびhs1(n+M)について解くと、D(n)=ha1(n+M)・ha2(M-1-n)+ha2(n)・ha1(2M-1-n)≠0を条件として、次のようになることが分かる。
【0092】
【数20】

【0093】
したがってこの合成ウィンドウhs1(n+M)およびhs2(n)の選択は、完全な復元を確実にする。
【0094】
これに従って、合成時には、
・ウィンドウhs1(n+M)は、フレームT1の第2の部分に適用される逆MDCTに対して適用され、
・ウィンドウhs2(n)は、フレームT2の前半に適用される逆MDCTに対して適用される。
【0095】
2つの重み付けの結果は、復号化されたサンプルを得るために項ごとに加算される。
【0096】
ウィンドウhs1(n+M)およびhs2(n)は、単に、分析ウィンドウの時間反転と、それに後続する補正係数D'(n)=1/D(n)の適用によって構成されることが分かる。それに従って、ウィンドウhs1(n+M)は分析ウィンドウha2(n)の時間インデックスを反転することによって構成され、相互的に、ウィンドウhs2(n)は分析ウィンドウha1(n+M)の時間インデックスを反転することによって構成される。補正係数(ウィンドウのそれぞれに適用されるべき利得に相当する)は、D'(n)=1/D(n)によって定義される。時間反転または時間インデックス反転という表現は、ここではウィンドウの形状を、現在の時間インデックスnに等しく反対のインデックス(-n)の関数として定義することを指す。
【0097】
ha2(M-1-n)のタイプのウィンドウはフレームT1の第2の部分に適用することができ、ha1(2M-1-n)のタイプのウィンドウはフレームT2の前半に適用することができる。この重み付けの結果は次いで加算され、最後に重み係数D'(n)=1/D(n)によって重み付けされる。
【0098】
注目すべき特性は重み係数1/D(n)が、振幅歪を補正する簡単な利得係数であることである。それによりウィンドウha2(M-1-n)およびha1(2M-1-n)を用いた復元演算は、時間反転要素が取り除かれた復元信号を生じる。したがって利得D'(n)は、簡単な振幅補正項とみなすことができる。
【0099】
利得D(n)に対する表式はまた注目すべき特性、すなわちD(n)=D(M-1-n)を示し、これはM/2個だけの利得係数D(n)を計算し、かつ/または記憶する必要があるという事実に反映される。この特性は、合成時の利得D'(n)にも当てはまる。
【0100】
したがって第1の実施形態は、符号化時に、分析ウィンドウ間の遷移のすべての可能性を組み合わせてすべての合成ウィンドウを記憶することができ、すなわち結果として次のようになる(ここでDi,j(n)=hi(n+M)・hj(M-1-n)+hj(n)・hi(2M-1-n))。
【0101】
【数21】

【0102】
この場合、この実施形態は大量のメモリを必要とする。
【0103】
第2の実施形態は、復号化器内に分析ウィンドウを、そのまま、または時間反転されたインデックスで記憶することができる。次いで利得Di,j(n)、0≦n<M/2が計算され、その後に時間反転された分析ウィンドウが復元のために用いられる。最後に、加算後に得られた結果は、利得D'i,j(n)=1/Di,j(n)によって重み付けされる。
【0104】
ペア(i,j)のいくつかの特定の組み合わせについて、1組のサンプルnに対して利得Di,j(n)=1となることが起こり得る。この特定の場合には、最終の重み付けは不要とすることができる。
【0105】
この簡略化を、利得Di,j(n)が1に非常に近い場合、具体的にはたとえば補正すべき振幅歪が0.1dB未満の場合に拡張することが可能であり、これは実際には、選択された閾値たとえば0.01未満の、利得Di,j(n)と1の絶対値差に反映されるようにすることができる。
【0106】
上記の実施形態のいずれにおいても、利得関数Di,j(n)およびそれらの逆数の関数D'i,j(n)は、使用時に計算するか、または必要なときのために始めに記憶することができる。
【0107】
さらに利得関数Di,j(n)は、各ペア(i,j)に対してM/2個だけの記憶要素を必要とすることが留意されるべきである。さらに、どのようなペア(i,j)であってもDi,j(n)=Dj,i(n)であるので、すべての組み合わせを記憶する必要はない。
【0108】
遅延低減に適用される本発明の有利な実施形態について、以下に述べる。
【0109】
この特定の実施形態では、分析ウィンドウha1(n+M)において、ゼロの重み付けウィンドウの整数部分(重み係数の隣接する値)が課される。より具体的には図7に示されるように、ウィンドウha1(n+M)は、MZ<M/2として2M-MZ≦n<2Mの範囲内にMZ個のゼロの部分を含み、この図はこの実施形態での2つの典型的なウィンドウを表す。
【0110】
第1の実施形態では従来技術とは対照的に、ウィンドウha1およびha2は、両端を含めてMと2Mの間の範囲内では互いに無関係である。ウィンドウha1およびha2の選択に関するただ1つの条件は、値D(n)は0≦n<Mに対してゼロであってはならないことである。この特定のウィンドウha1(n+M)の構成は、合成ウィンドウhs2(n)が0とMZ-1の間にゼロを含むことができることを確実にする。この結果は、次式から生じる。
【0111】
【数22】

【0112】
したがって、分析のために用いられたのと同じ非対称ウィンドウha1に対して、ゼロ係数の個数MZは、次式によって与えられる利得D(n)に対する条件を遵守するためには、条件MZ< M/2を満足しなければならないことは明らかである。
D(n)=ha1(n+M)・ha1(M-1-n)+ha1(n)・ha1(2M-1-n)≠0
【0113】
この、分析ウィンドウha1(n+M)の一部分をゼロに設定することは、以下に述べるようにサンプル復元遅延に対して有利な効果を有する。
【0114】
図8を参照すると、フレームT1(2M個のサンプルのサイズを有する)は、ウィンドウha1を適用することによって処理される。この重み付けの結果は、DCTによって処理される。ウィンドウha1はゼロを含むので、フレームT1は単に、符号化し、2M-MZ個のサンプルの終わりに送ることができる。対応する符号化されたフレームを送るのに、フレームT1の2M個のサンプルの終わりを待つ必要はなく、その最初の2M-MZ個のサンプルの処理を待つだけでよい。従来技術の標準ウィンドウの使用と比べてこれは、フレームT1の終わりのMZ個のサンプルを処理するのにかかる時間に相当する進みを表す。
【0115】
合成時には、同様な合成ウィンドウhs1は、ゼロの最初のMZ個の係数を含み(もはやウィンドウの終わりではなく、ここではウィンドウの始まりにある)、これは同様にして、MZ個のサンプルの進みを有して復号化されたサンプルを復元することを可能にする。合成ウィンドウの始まりに対応するMZ個のサンプルは、ウィンドウhs1の始まりは効果を及ぼさないので、実際には図8から先行するウィンドウhs0によって再構成される。それによりやはり、MZ個の復号化されたサンプルを効率的に復元するように、逆DCTの後に後続のサンプルを待つ必要はなく、これは合成時にさらにMZ個の進みを生じる。
【0116】
したがって分析ウィンドウの終わりにMZ個の連続するゼロ係数を課すことにより、2MZ個のサンプルの直接MDCTおよび次いで逆MDCT-1処理によって引き起こされる遅延を低減することできる。それにより総遅延は、2M-2MZサンプルとなる。この遅延の低減は、2M-MZの実効長さを有するウィンドウによって達成され、一方、従来技術の解決策の教示によれば標準の方法では、分析および合成ウィンドウは同じ遅延低減に対しては同一(時間反転は別として)であり、2M-2MZの実効長さを有する。それによりこの実施形態を用いて、より長いウィンドウを使用することができ、したがって得られる周波数応答はより有利となり、符号化品質が改善される。
【0117】
従来技術は、ウィンドウの終わりまたは始まりにゼロが導入された場合は、重み付けウィンドウの中央の係数に1の値を与え、これはこのタイプのウィンドウ(図5)を有する符号化特性を不利にするが、本発明にはこの欠点はない。さらに、連続する分析ウィンドウの選択には制約がないので、満足な符号化特性を得ることができる。
【0118】
したがって、符号化されるべき信号に対して他よりも適した分析変換を、ゼロをその終わりに含む分析フィルタから(たとえばプロトタイプフィルタの辞書内で)選択することができ、最適な信号符号化/復号化となり、従来技術と比べて2MZ個だけ低減された遅延となる。
【0119】
合成時の補正D'(n)を避けることを可能にする符号化のための1対のウィンドウha1およびha2が選択される、本発明の特定の一実施形態について以下に述べる。ここで論点は、最初の分析ウィンドウを大幅に変更して、合成時に一定でかつ1に等しい重み関数D'(n)を保証することである。
【0120】
この目的のために、0≦n<2Mの範囲にわたって定義され、任意のインデックスnに対して非ゼロ正規化係数Δ(n)ただし0≦n<Mを満足するウィンドウh(n)に基づいて2つの分析ウィンドウ部分が決定される。
【0121】
【数23】

【0122】
次いで0≦n<Mに対して、下記が構成される。
ha1(n+M)=h(n+M)/Δ(n)、およびha2(n)=h(n)/Δ(n)
【0123】
このようにして、復元時の利得D'(n)は任意のnに対して1であり、合成時の復元は同じであるが時間反転された分析ウィンドウha1およびha2による重み付けによってもたらされ、この重み付けの後に簡単な加算が続く。
【0124】
MZ個のゼロを含み、0≦n<2M-MZに対して2MZ個のサンプルの遅延を制限することができるウィンドウh(n)の一例は、0≦n<2Mに対して、
【0125】
【数24】

【0126】
その他では、すなわち2M-MZ≦n<2Mに対しては、h(n)=0となる。
【0127】
周波数選択性が形状パラメータαに従って変化することを可能にするもう1つの可能な選択は、0≦n<M-MZ/2に対して次のように定義されるカイザー・ベッセルウィンドウにある。
【0128】
【数25】

【0129】
ただしM'=M-MZ/2
【0130】
ここで0≦n<M-MZ/2に対して、h(2M-MZ-1-n,α)=h(n,α)であり、
・その他では(2M-MZ≦n<2Mなどのnに対しては)、h(n,α)=0である。
【0131】
したがって、選択された初期化ウィンドウh(n)から分析ウィンドウha1およびha2を決定し、そこから単に時間反転によって合成ウィンドウを決定することが可能であることが分かる。
【0132】
本発明による復号化を実装するには、ウィンドウの始まりにMZ個のゼロ係数を含む初期化ウィンドウh(n)から直接、2つの合成ウィンドウ部分hs1およびhs2を決定することも可能である。
【0133】
正弦初期化ウィンドウ(図11の実線の曲線)に基づき、0≦n<MZに対して
h(n)=0
および0≦n<2M-MZに対して
【0134】
【数26】

【0135】
次いで合成ウィンドウ部分hs1およびhs2は直接、次のように推論することができる。
hs1=(n+M)=h(n+M)/Δ(n)
hs2(n)=h(n)/Δ(n) 0≦n<M
【0136】
前のように、0≦n<Mに対しては、
【0137】
【数27】

【0138】
図11は、この実施形態において実線で示される正弦的に表された初期化ウィンドウh(n)から得られる2つのウィンドウ部分hs1およびhs2から結果として生じる全体としての合成ウィンドウhsiの形状を破線にて示す。
【0139】
本明細書で例示として述べられる本発明の一実施形態はまた、図9に示されるような符号化/復号化システムを提供する。符号化器CODは、一連のサンプルXnを含む符号化されるべきデジタル信号Sを受け取る。この一連のサンプルは、それぞれが2M個のサンプルの連続するブロックBi、Bi+1などにおいて処理される(ステップ101、図10A)。符号化器の処理手段μPは、たとえば所与の基準(エントロピー、符号化利得、歪/ビットレートなど)に従ってブロックBiの内容を1つずつ分析し(ステップ102、図10A)、これから符号化器の辞書DICを用いて、上述の基準に従ってこのブロックBiに最適となる分析ウィンドウhaiを推論する。このようにして選択された分析重み付けウィンドウhaiは現在のブロックBiに適用され(ステップ103、図10A)、これは次いで符号化される(ステップ104)。
【0140】
この符号化から結果として生じるブロックB'iは次いで、選択された分析ウィンドウhaiの辞書DIC内の符号と共に、符号化された信号S'にて、図9の復号化器DECODへ送られる(ステップ105、図10A)。もちろん復号化器DECODは、前のブロックB'i-1と共に、前に用いられた分析ウィンドウhai-1を指定する辞書DICからの符号を受け取っている。一連の符号化されたブロックB'i、B'i+1など、およびブロックBiの符号化において分析のために用いられたウィンドウ符号haiを含む符号化された信号S'を受け取ると(ステップ106、図10B)、復号化器DECODは、それ自体の辞書DIC'(符号化器の辞書DICと同様の)から、合成のために用いられるべき半分のウィンドウhsi-1(n+M)およびhsi(n)を決定する(ステップ107)。
【0141】
ここで述べる実施例では、復号化器DECODの処理手段μPは、分析において前に用いられたウィンドウhai-1に関連する各時間インデックスnに対する補正係数D(n)を推定する(ステップ108)。補正係数が1に近い場合(たとえば0.1dBの絶対値閾値を用いて)は、図10Bのテスト109では復号化器は補正を適用しない(テスト109からの出口のy矢印)。そうでない場合(n矢印)は処理手段μPは、上述の補正D'(n)=1/D(n)を適用する(ステップ110)。ステップ111において処理は、ウィンドウhsiで重み付けされたブロックB'i(適切な場合には係数D'によって補正された)などの復号化を継続して、復号化された信号
【0142】
【数28】

【0143】
の復号化されたブロック
【0144】
【数29】

【0145】

【0146】
【数30】

【0147】
などを供給し、その(無損失の)サンプル
【0148】
【数31】

【0149】
は、完全な復元が実現されるので最初のサンプルXnの値を有する。
【0150】
本発明はまた、図9に表されるタイプの符号化器COD、ならびにこのような符号化器のメモリに記憶されることが意図されたコンピュータプログラム、および図10Aのフローチャートによって表すことができるアルゴリズムを提供する。本発明はさらに、図9に表されるタイプの復号化器DECOD、ならびにこのような復号化器のメモリに記憶されることが意図されたコンピュータプログラム、および図10Bのフローチャートによって表すことができるアルゴリズムを提供する。

【特許請求の範囲】
【請求項1】
重み付けウィンドウを用いて重なりを有するデジタル信号を符号化する変換ベースの方法であって、
同じサイズ(2M)の前記信号のサンプルの2つの連続するブロックは、それぞれ第1の分析ウィンドウ(ha1)および第2の分析ウィンドウ(ha2)によって重み付けされ、
前記第1および第2のウィンドウはそれぞれ、立ち上がりエッジおよび立ち下がりエッジを含み、前記第2のウィンドウ(ha2)の立ち上がりエッジは、時間反転された前記第1のウィンドウ(ha1)の立ち下がりエッジとは異なる、符号化方法。
【請求項2】
前記第1および第2のウィンドウが、前記2つのブロックのそれぞれにわたって決定される前記信号の特性に対して特定の基準に従って、互いに無関係に選択される、請求項1に記載の符号化方法。
【請求項3】
重み付けウィンドウを選択するための前記基準が、
・最大化された符号化利得(GTC)、
・変換されたサンプルの、最小化されたエントロピー(JH)、
・符号化/復号化によって生じる歪と、前記符号化のために必要なビットレートとの間の最適化されたトレードオフ(JRD)
の1つまたは組み合わせである、請求項2に記載の符号化方法。
【請求項4】
ブロックを符号化するために選択される各重み付けウィンドウは、可能な重み付けウィンドウの辞書内で選択され、ウィンドウインデックスが前記辞書からの各ウィンドウに関連付けられ、
前記選択されたウィンドウの前記インデックスは、符号化のために選択された前記ウィンドウと同様なウィンドウを復号化するための復号化器に送られる、請求項1から3のいずれか一項に記載の符号化方法。
【請求項5】
前記分析ウィンドウの少なくともいくつかが、ウィンドウの終わりに選択された個数(MZ)の値ゼロの連続する重み係数を含み、ゼロ係数の前記選択された個数(MZ)はウィンドウの係数の総数(2M)の4分の1未満である、請求項1から4のいずれか一項に記載の符号化方法。
【請求項6】
重み付けウィンドウを用いて重なりを有するデジタル信号を復号化する変換ベースの方法であって、
同じサイズ(2M)の前記信号のサンプルの2つの連続するブロックは、それぞれ第1の合成ウィンドウ(hs1)および第2の合成ウィンドウ(hs2)によって重み付けされ、
前記第1および第2のウィンドウはそれぞれ、立ち上がりエッジおよび立ち下がりエッジを含み、前記第2のウィンドウ(hs2)の立ち上がりエッジは、時間反転された前記第1のウィンドウ(hs1)の立ち下がりエッジとは異なる、復号化方法。
【請求項7】
符号化のために次々に用いられた分析ウィンドウについての情報(cod(hai))が符号化器から受け取られ、前記第1および第2の合成ウィンドウ(hs1, hs2)は、符号化のために次々に用いられた前記第1および第2の分析ウィンドウ(ha1, ha2)から推論され、前記第1および第2の合成ウィンドウはそれぞれ、それぞれ第2および第1の分析ウィンドウの重み係数の時間位置を反転し、それぞれ第2および第1の分析ウィンドウの各重み係数に補正係数(1/D(n))を適用することにより、それぞれ第2および第1の分析ウィンドウから推論される、請求項6に記載の復号化方法。
【請求項8】
前記第1の合成ウィンドウ(hs1)および前記第2の合成ウィンドウ(hs2)は、それぞれ前記第1および第2の分析ウィンドウ(ha1)および(ha2)から下記のタイプの式を用いて推論され、
【数1】

・ここで数Mは、サンプルのブロックが2M個のサンプルを含むようになる数、
・nは、両端を含めて0とM-1の間の時間位置インデックス、
・h(n)は、時間位置インデックスnを用いてウィンドウhの重み係数を示し、
・-nは、インデックスnと等しく反対であることを示して前記時間位置の反転を明示し、
・D(n)は、時間位置係数nに対して適用されるべき補正係数を示し、この係数は両端を含めて0とM-1の間のnに対して非ゼロであり、式
D(n)=ha1(n+M)・ha2(M-1-n)+ha2(n)・ha1(2M-1-n)
によって与えられる、請求項7に記載の復号化方法。
【請求項9】
前記分析ウィンドウについての前記情報は、符号化のために用いられるウィンドウの辞書(DIC)からのインデックスからなり、復号化のために同様な辞書(DIC')が設けられ、前記同様な辞書は、符号化のために用いられる前記分析ウィンドウと同様な、かつ前記補正係数(1/D(n))によって事前に補正された合成ウィンドウを含み、辞書インデックスをもつ前記同様な辞書からの各ウィンドウは、前記復号化器に送られた前記分析ウィンドウインデックスから決定することができる、請求項7または8に記載の復号化方法。
【請求項10】
前記分析ウィンドウについての前記情報は、符号化のために用いられるウィンドウの辞書(DIC)からのインデックスからなり、符号化のための分析フィルタのバンクのプロトタイプフィルタから得られるそれぞれのウィンドウを含む同じ辞書が復号化のために設けられ、復号化のために、
・時間位置の反転と、
・係数に対して推定された前記補正係数(1/D(n))が、所定の閾値内で1と大幅に異なる場合に、前記辞書からのウィンドウの係数に対する補正係数の適用と
が適用される、請求項7または8に記載の復号化方法。
【請求項11】
前記合成ウィンドウの少なくともいくつかが、ウィンドウの始まりに選択された個数のゼロ値の連続する重み係数を含み、ゼロ係数の前記選択された個数(MZ)はウィンドウの係数の総数(2M)の4分の1未満である、請求項6から10のいずれか一項に記載の復号化方法。
【請求項12】
2つの時間反転された分析ウィンドウ部分に対応する重み付けウィンドウを用いた合成演算を含み、前記合成ウィンドウによる重み付けは加算によってもたらされ、前記分析ウィンドウ部分ha1(n)およびha2(n)は、ha1(n+M)=h(n+M)/Δ(n)およびha2(n)=h(n)/Δ(n)のタイプの表式によって初期化ウィンドウh(n)の関数として表され、Mはブロックが2M個のサンプルを含むようになる数、nは0≦n<Mとなる時間インデックス、およびΔ(n)は0≦n<Mとなる任意のインデックスに対して定義される非ゼロ正規化係数である、請求項11に記載の復号化方法。
【請求項13】
2つの合成ウィンドウ部分(hs1)および(hs2)が、0≦n<Mに対して、hs1(n+M)=h(n+M)/Δ(n)およびhs2(n)=h(n)/Δ(n)のタイプの表式に従って選択される、ある個数(MZ)のゼロ係数をその始まりに含む初期化ウィンドウh(n)から直接決定され、Mはブロックが2M個のサンプルを含むようになる数、nは0≦n<Mとなる時間インデックス、およびΔ(n)は0≦n<Mとなる任意のインデックスnに対して定義される非ゼロ正規化係数である、請求項11または12に記載の復号化方法。
【請求項14】
前記正規化係数が、
【数2】

のタイプの表式によって定義される、請求項12または13に記載の方法。
【請求項15】
前記初期化ウィンドウh(n)が次式、すなわち
0≦n<MZに対してh(n)=O、および
【数3】

によって表され、ただしMZは前記初期化ウィンドウの始まりのゼロ係数の前記選択された数であることを特徴とする、請求項13または14に記載の方法。
【請求項16】
重み付けウィンドウを用いて重なりを有するデジタル信号の変換ベースの符号化のためのデバイスであって、請求項1から5のいずれか一項に記載の方法を実施する手段を含むことを特徴とするデバイス。
【請求項17】
重み付けウィンドウを用いて重なりを有するデジタル信号の変換ベースの復号化のためのデバイスであって、請求項6から15のいずれか一項に記載の方法を実施するための命令を含むことを特徴とするデバイス。
【請求項18】
符号化または復号化デバイスのメモリ内に記憶されるように適合されたコンピュータプログラムであって、命令が前記デバイスのプロセッサによって実行されるときに、請求項1から5のいずれか一項に記載の符号化方法、または請求項6から15のいずれか一項に記載の復号化方法を実施するための命令を含むことを特徴とするコンピュータプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10A】
image rotate

【図10B】
image rotate

【図11】
image rotate


【公表番号】特表2011−507440(P2011−507440A)
【公表日】平成23年3月3日(2011.3.3)
【国際特許分類】
【出願番号】特願2010−538857(P2010−538857)
【出願日】平成20年12月11日(2008.12.11)
【国際出願番号】PCT/FR2008/052286
【国際公開番号】WO2009/081003
【国際公開日】平成21年7月2日(2009.7.2)
【出願人】(591034154)フランス・テレコム (290)
【Fターム(参考)】