重み付けウィンドウを用いた低遅延変換符号化
本発明は、異なる長さのウィンドウを用いて、フレームの連続によって表現されるデジタルオーディオ信号の変換符号化/復号化に関する。本発明による符号化のために、現在のフレーム(Ti)においてアタックのような特定の事象を検出(51)することが求められ、少なくとも、現在のフレーム(53)の始めにおいて前記特定の事象が検出(53)されると、遷移ウィンドウを適用することなく、現在のフレーム(Ti)を符号化(56)するために短いウィンドウ(54)が直接に適用される。従って、この符号化は先行技術に対して低減した遅延を有する。さらに、符号化の間の長いウィンドウから短いウィンドウへの直接の移行を補償するために、復号化の間に特別な処理が適用される。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、デジタルオーディオ信号の符号化/復号化に関する。
【背景技術】
【0002】
データ転送速度低減のための変換符号化方式において、一般に、サンプルの符号化に与えられる正確さを低減することが求められ、一方、それにもかかわらず、聞き手が可能な限り最も低い程度の劣化を認識することを保証することが求められる。
【0003】
この目的のために、量子化処理によって実行される正確さの低減は、心理音響学モデルを用いて制御される。人間の耳の特性の知識に基づくこのモデルは、最も認識されにくい聴覚周波数において量子化ノイズを調整することを可能とする。
【0004】
心理音響学モデルからのデータ、本質的に周波数領域におけるデータを使用するために、この周波数領域において実行される量子化とともに、時間/周波数変換を実行することは標準的な習慣である。
【0005】
図1は、
・入力信号Xに作用する解析フィルタFA1,...,FAnのバンクBA、
・符号化モジュールCODが続く量子化モジュールQ、
・符号化された信号X’を出力する合成フィルタFS1,...,FSnのバンクBS、
を有する変換符号化器の構造を図式的に表わす。
【0006】
伝送前にデータ転送速度を低減させるために、多くの場合、“エントロピー”(無損失符号化)と呼ばれる符号化を用いて、量子化された周波数サンプルが符号化される。量子化は、一様な、または、一様でない、スカラー量子化器、または、ベクトル量子化器による標準的な仕方で実行される。
【0007】
量子化ステップにおいて導入されるノイズは、(“逆変換”とも呼ばれる)合成フィルタバンクによって形成される。従って、解析変換と対応付けされた逆変換は、ノイズが聞こえるようになることを防止するために、周波数または時間によって量子化ノイズを効果的に純化させるように選択されなければならない。
【0008】
解析変換は、変換された領域における容易なサンプル符号化を可能とするために、可能な限り信号エネルギーを純化させなければならない。特に、入力信号に依存する変換符号化利得は、可能な限り最大化されなければならない。この目的のために、
SNR=GTC+K・R
の形の関係式を使用することができ、ここで、Kは定数項であり、その値は好ましくは6.02でありうる。
【0009】
従って、得られる信号対雑音比(SNR)は、選択されたサンプル毎のビット数(R)に比例し、変換符号化利得を表わす成分GTCが増加される。符号化利得が大きくなるほど、復元の品質が高くなる。
【0010】
従って、符号化変換の重要さを理解することができる。(解析部による)信号エネルギーおよび(合成部による)量子化ノイズの両方を純化させる機能により、サンプルの容易な符号化を可能とする。
【0011】
オーディオ信号は非定常(non-stationary)であることがよく知られているので、オーディオ信号の特性の関数として、時間上で時間/周波数変換を採用することが適切である。
【0012】
標準的な符号化技術への適用を以下で説明する。
【0013】
変調変換の場合、標準的なオーディオ符号化技術は、コサイン変換または高速フーリエ変換に基づく高速なアルゴリズムを用いてこれらの符号化技術を実現することを可能とするコサイン変調フィルタバンクを組み込む。
【0014】
この種類の変換の中で、(特に、MP3、MPEG−2、MPEG−4 AAC符号化において)最も一般的に使用される変換は、MDCT(Modified Discrete Cosine Transform)変換である。その式は、0≦k<Mについて、
【0015】
【数1】
【0016】
であり、次の表記を用いる。
・Mは、変換のサイズを表わす。
・xn+tMは、時間n+tMの瞬間に周期1/Fe(サンプリング周波数の逆数)でデジタル化された音のサンプルである。
・tはフレームのインデックスである。
【0017】
【数2】
【0018】
はフレームtについて変換された領域におけるサンプルである。
【0019】
【数3】
【0020】
は、変換の基底関数(base function)であり、h(n)はサイズ2Mのプロトタイプフィルタと呼ばれる。
【0021】
初期の時間サンプルを復元するため、サンプル0≦n≦M−1を復元するために、次の逆変換が適用される。
【0022】
【数4】
【0023】
図1aを参照すると、次のように復元が実行される。
・2M個のサンプルを生成する、サンプル
【0024】
【数5】
【0025】
の逆DCT変換(以下、DCT−1と示す)。
・2M個のサンプルを生成する、サンプル
【0026】
【数6】
【0027】
の逆DCT変換。最初のM個のサンプルは前のフレームの最後のM個のフレームと同一の時間をサポートする。
・フレームTiの2番目の半分(最後のM個のサンプル)について合成ウィンドウh(M+n)による、および、続くフレームTi+1の最初の半分(最初のM個のサンプル)について合成ウィンドウh(n)による重み付け。
・共通のサポートにおけるウィンドウ化された成分の加算。
【0028】
条件
【0029】
【数7】
【0030】
による信号の(完全と呼ばれる)正確な復元を保証するために、多数の制約を満たすプロトタイプウィンドウh(n)を選択することが適切である。
完全な復元を可能とするために、典型的に、次の関係式
【0031】
【数8】
【0032】
が十分であり、ウィンドウは中央のサンプルに関して同等の対称性を有する。
【0033】
これら2つの簡単な制約を満たすことは比較的簡単であり、この目的のために、
【0034】
【数9】
【0035】
と書かれる正弦曲線のウィンドウによって標準的なプロトタイプフィルタが構成される。
【0036】
もちろん、“Kaiser Bessel Derived”(またはKBD)という名称のMPEG−4標準で定義されたウィンドウ、または、重複の少ないウィンドウのような他の形態のプロトタイプフィルタが存在する。
【0037】
図1aは、長いウィンドウを用いたMDCT変換による処理の一例を表わす。この図において、
・破線矢印は減算を表わす。
・実線矢印は加算を表わす。
・一点鎖線矢印は、符号化のためのDCT処理、および、復号化DECのためのDCT−1処理を表わし、このDCTは上記の基底関数のコサインの項に対応する。
・符号化される信号のサンプルはフローにおいてxinと表わされ、円で囲まれ、図1bにおいてaおよびb、図1cにおいてeおよびfの符号が付けられた特定のサンプルの符号化/復号化処理の詳述が続く。
・サンプルxinはフレームによってグループ化され、現在のフレームはTiと表わされ、前後のフレームはそれぞれTi−1、Ti+1と表わされる。
・符号DECは、(追加の復元を有する合成ウィンドウFSを用いて)復号化器によって実行される処理に関する。
・解析ウィンドウはFAと表わされ、合成ウィンドウはFSと表わされる。
・nは、ウィンドウとウィンドウの中間と、サンプルaの間の距離である。
【0038】
符号Calc T’iは、解析ウィンドウFAを用いて符号化されたフレームT’iの計算、および、フレームTi−1およびTiのそれぞれのサンプルに関する。これは、図1aに表わされているのは、単に従来の例である。また、例えば、符号化されたフレームT’iを計算するために、フレームTiおよびTi+1をインデックスするように決定することができる。図1aの例に続いて、符号Calc T’i+1は、フレームTiおよびTi+1のそれぞれのサンプルを用いた符号化されたフレームT’i+1の計算に関する。
【0039】
変換DCTおよび逆変換DCT−1の前に得られたv1およびv2は、
v1=a*h(M+n)+b*h(2*M−1−n)
v2=b*h(M−1−n)−a*h(n)
の形の式を用いて得られる。
従って、全体的なDCT/DCT−1および合成ウィンドウの処理の後、復元の項a’およびb’は、
a’=v1*h(M+n)−v2*h(n)=a*h(M+n)*h(M+n)+b*h(2*M−1−n)*h(M+n)−b*h(M−1−n)*h(n)+a*h(n)*h(n)
b’=v1*h(2*M−1−n)+v2*h(M−1−n)=a*h(M+n)*h(2*M−n−1)+b*h(2*M−1−n−1)*h(2*M−n−1)+b*h(M−1−n)*h(M−1−n)−a*h(n)*h(M−1−n)
と表わされ、従って、(関係式(1)を使用して、かつ、h(M−1−n)=h(n+M)を差し引いて、)復元が完全であること(a’=aおよびb’=b)を検証することが可能である。
【0040】
上述したMDCT変換の原理は、特に、0≦k<MおよびL=2kM、kは2より大きい正の整数について、
【0041】
【数10】
【0042】
を用いて、基底関数の次数が変換のサイズの2倍より大きいELT(“Extended Lapped Transform”)と呼ばれる変換に自然に拡張される。
【0043】
復元のために、MDCT変換に関する2つの続くフレームを結合させることに代えて、サンプルの合成は、K個のウィンドウ化された連続したフレームを含む。
【0044】
さらに、ウィンドウの対称性の制約(後に詳細に説明する原則)は、ELT型の変換のために緩めることが可能であることが示される。また、解析および合成ウィンドウの間の同一性の制約を緩めることが可能であり、双直交(biorthogonal)フィルタを使用することを可能とする。
【0045】
符号化される信号に変換を適用する必要性を考慮して、先行技術は、“ウィンドウ切り替え”と呼ばれるもの、すなわち、時間にわたって使用される変換のサイズを変更することを可能とする。
【0046】
ウィンドウの長さを変更する必要性は、特に次の場合に正当化することができる。符号化される信号、例えば音声(speech)信号は、強いアタック(attack)を特徴付ける過渡(非定常)信号(例えば、音声信号における破裂音を特徴付ける“ta”または“pa”の音の発音)を含むとき、符号化の時間の解像度を増加させ、従って、符号化ウィンドウのサイズを減少させることが適切であり、従って、これは長いウィンドウから短いウィンドウに移行することを必要とする。より正確には、先行技術において、移行は、この場合において、長いウィンドウ(後述する図2a)から遷移ウィンドウ(後述する図2c)へ、そして、一連の短いウィンドウ(後述する図2b)へと生じる。従って、後に詳細に理解されるように、現在のフレームの符号化ウィンドウの長さを決定することができ、結果として現在のフレームを符号化する前に、少なくとも1つの続くフレームにおけるアタックを予想することが必要である。
【0047】
先行技術によるウィンドウ長の変更の一例を以下で説明する。
【0048】
典型的な例は、MPEG−AAC標準で規定されているように、サイズMのMDCT変換のサイズをサイズM/8に変更することである。
【0049】
完全な復元の特性を保持するために、上記の式(1)は、2つのサイズの間での遷移のときに次式によって置換されなければならない。
【0050】
【数11】
【0051】
さらに、異なるサイズの続くプロトタイプフィルタのために、0≦n<MSについて関係式
hl(M+M/2−MS/2+n)=h2(MS−n)
が与えられる。従って、遷移のときにサイズM/2について対称性が存在する。
【0052】
図2aから図2eには、異なる種類のウィンドウがそれぞれ表わされている。
・図2aは、サイズ2M=512個のサンプルの正弦曲線ウィンドウ(対称正弦関数)。
・図2bは、サイズ2M=64個のサンプルの正弦曲線ウィンドウ(対称正弦関数)。
・図2cは、サイズ512から64に移行することを可能とする遷移ウィンドウ。
・図2dは、サイズ64から512に移行することを可能とする遷移ウィンドウ。
・図2eは、上述した基本ウィンドウを用いて実行される構成の例。
【0053】
各々の連続したものは、“ウィンドウ長”と呼ばれるものを定義する予め定められた“長さ”を有する。従って、図1aを参照して示したように、符号化されるサンプルは、少なくとも組に結合され、結合において、それぞれのウィンドウの重み付け値によって重み付けされる。
【0054】
より詳しくは、正弦曲線ウィンドウ(図2aおよび図2b)は対称的であり、すなわち、ウィンドウを構成する値の連続の中間における中央の値の両側で、重み付け値はほぼ等しい。効果的な実施形態は、これらのウィンドウの重み付け値の変化を定義するために“サイン”関数を選択することからなる。他のウィンドウ選択(例えば、MPEG AACにおいて使用されるもの)も可能である。
【0055】
しかし、遷移ウィンドウ(図2cおよび図2d)は非対称であり、(PLAと示す)“平坦”な領域を含むことが表わされている。これは、これらの領域における重み付け値が最大であり、例えば“1”に等しいことを意味する。長いウィンドウから短いウィンドウへの遷移ウィンドウ(図1c)を使用して、図1bおよび図1cを参照して分かるように、(図1bに表わされている例における)サンプルaを含む2つのサンプルは係数“1”によって単純に重み付けされ、一方、サンプルbは符号化されたフレームT’iの計算において係数“0”によって重み付けされ、それによって、符号化されたフレームT’iにおいて、サンプルaを含む2つのサンプルが(DCTを除いて)そのままで単純に送信される。
【0056】
符号化システムにおける可変サイズの変換の使用を以下で説明する。また、オーディオサンプルを復元するための復号化器に関する処理を説明する。
【0057】
標準的なシステムにおいて、符号化器は、習慣的に、時間にわたって使用される変換を選択する。従って、AAC標準において、符号化器は、上述した4つのウィンドウサイズ設定のうち1つを選択することを可能とする2つのビットを送信する。
【0058】
遷移ウィンドウ(長い−短い)を用いたMDCT変換処理は、図1bおよび図1cに表わされている。これらの図は、図1aと同様に実行される計算を表わす。
【0059】
図1bおよび図1cにおいて、FAと示す(表わされた例においてMS=M/2である)いくつかの短い解析ウィンドウのみが表わされている。しかし、実際、図2eに表わされているように、いくつかの(典型的に、MS=M/8である)短いウィンドウの連続が与えられる。従って、図1bおよび図1cにおける各ウィンドウFAは、実際、短いウィンドウの連続を含むことが理解される。
【0060】
符号化されたフレームT’iを計算する(Calc T’iと示す。)ために、遷移ウィンドウFTA(図1b)は、
− 上昇エッジにおいてM個のサンプルにわたる長い半分のウィンドウと、
− 下降エッジにおいて、
・(M/2−MS/2個の)サンプルにわたる(1に等しい重み付け値を有する)第1の平坦な領域PLAと、
・MS個のサンプルにわたる下降する短い半分のウィンドウと、
・(M/2−MS/2個の)サンプルにわたる(0に等しい重み付け値を有する)第2の平坦な領域PLAと、
を含む。
【0061】
続く符号化されたフレームT’i+1(Calc T’i+1と示す。)を計算するために、最初の(M/2−MS/2個の)サンプルは無視され、従って、短いウィンドウによって処理されず、続くMS個のサンプルは、図1bおよび図1cに表わされている短い解析ウィンドウFAの上昇エッジによって重み付けされ、続くMS個のサンプルは、その下降エッジによって重み付けされる。
【0062】
以下で、次の記号が使用される。
・Mは長いフレームのサイズである。
・MSは短いフレームのサイズである。
【0063】
図1bにおいて、サンプルbは、長いウィンドウのための計算と同様に、短いウィンドウのみ使用して合成される。そして、長い−短い遷移の半分のウィンドウの特定の形態により、解析および合成の遷移ウィンドウから直接にサンプルaが復元される。遷移ウィンドウは図1bおよび図1cにおいてFTAと示されている。
【0064】
図1cにおいて、長い−短いウィンドウと短いウィンドウの間の遷移領域に対応するサンプルが計算される。図1aにおける長いウィンドウのための計算と同様に、ここでは、eおよびfと示された(円で囲まれた)サンプルの処理が続く。
【発明の概要】
【発明が解決しようとする課題】
【0065】
ウィンドウ遷移の2つの例の場合を以下で説明する。
【0066】
第1の例において、時間t=720(図2e)でオーディオ信号において短いウィンドウの使用を必要とするアタックが検出される。符号化器は、復号化器に、前に使用された長いウィンドウと続く短いウィンドウの間に介在させる長い−短い遷移ウィンドウの使用を通知しなければならない。
【0067】
従って、符号化器は、復号化器に、
・長いウィンドウ
・長い−短い遷移ウィンドウ
・短いウィンドウ
・長い−短い遷移ウィンドウ
・長いウィンドウ
の系列を連続的に指示する。そして、復号化器は、
【0068】
【数12】
【0069】
の形の関係式を適用し、ここで、
【0070】
【数13】
【0071】
および
【0072】
【数14】
【0073】
は、互いに異なりうる、時間tおよびt+1における変換の合成関数を表わす。
【0074】
基底関数
【0075】
【数15】
【0076】
および
【0077】
【数16】
【0078】
が異なる“サイズ”を有するならば、図1bを参照して、次が実行されることを除いて、復元は前述のように実行される。
・2M個のサンプルを生成するサイズMのサンプル
【0079】
【数17】
【0080】
の逆DCT変換。
【0081】
・2MS個のサンプルを生成するサイズMSのサンプル
【0082】
【数18】
【0083】
の逆DCT変換。最初のMS個のサンプルは、短いウィンドウの上昇部分を含む重複領域において、長さMSの共通する時間をサポートし、遷移ウィンドウFTAのサイズMの下降部分の逆DCT変換から生じるサンプルを有する。
・最初の半分について、遷移ウィンドウFTAおよび図1bに示すFTSの2つの合成ウィンドウによる乗算、および、次の半分について、短い合成ウィンドウFSによる乗算。
・重複領域にわたるこれらのウィンドウ化された構成要素の加算。時間サポートは初期のフレームTiの最後の部分に対応する。
従って、復号化器は、符号化器に従い、かつ、符号化器によって決定されるウィンドウの種類を信頼して適用する。
【0084】
この第1の例において、符号化器は、第1のフレーム(例えば、時間t=512とt=767の間にサンプルを有する、図2eにおけるフレーム1)のサンプルの到達の間に遷移を検出する。そして、符号化器は、現在のウィンドウが長い−短い遷移ウィンドウでなければならず、符号化され、送信され、復号化器にシグナリングされなければならないと決定することができる。そして、8個の短いウィンドウが、サンプルt=624とt=911の間に連続的に適用される。従って、遷移の時(t=720)において、復号化器は短いウィンドウを使用し、これは信号の向上した時間表現を可能とする。
【0085】
第2の例において、サンプルt=540において遷移が検出される。符号化器が最初のフレーム(例えば、図2eにおけるフレーム0)のサンプルを受信すると、遷移を検出せず、従って、長いウィンドウを選択する。次の続くフレーム(例えば、図2eにおけるフレーム1)のサンプルの到達の間に、符号化器は(時間t=540において)アタックを検出する。そして、この場合において、検出は遅過ぎて実行され、遷移ウィンドウの使用は、アタックの瞬間における短い時間サポート(短いウィンドウ)の使用から利益を得ることができない。そして、符号化器は短いウィンドウの使用を予想すべきであり、結果として、少なくともM/2個のサンプルに対応する追加の符号化遅延を挿入する。
【0086】
従って、知られた先行技術の欠点は、続くフレームの時間信号におけるアタックを検出し、従って、短いウィンドウに移行することを予想することを可能とするために、符号化器に追加の遅延を導入する必要があるという事実に存在することを理解すべきである。この“アタック”は、例えば、音声信号における破裂音のような高い強度の過渡信号、または、音楽シーケンスにおける打撃的な信号の出現に対応しうる。
【0087】
ある通信の応用において、過渡信号の検出のために必要とされる追加の遅延、および、遷移ウィンドウの使用は受け入れられない。従って、例えば、MPEG−4 AAC低遅延符号化器において、短いウィンドウは使用されず、長いウィンドウのみが許される。
【課題を解決するための手段】
【0088】
本発明は、上記の場合における向上を提供する。
【0089】
これは、追加の遅延の導入を必要としないウィンドウ間の遷移に関する。
【0090】
この目的のために、フレームの連続によって表現されるデジタルオーディオ信号の変換符号化/復号化の方法を提供し、ここで、
・異なるそれぞれの長さを有する少なくとも2つの重み付けウィンドウが与えられ、
・特定の事象が検出されたフレームを符号化するために短いウィンドウが使用される。
この特定の事象は、例えば、現在のフレームが含むデジタルオーディオ信号に存在する強いアタックのような非定常現象でありうる。
【0091】
より詳しくは、現在のフレームの符号化のために、この現在のフレームにおける特定の事象を検出することが求められ、
・少なくとも、現在のフレームの始めにおいて特定の事象が検出されると、現在のフレームを符号化するために短いウィンドウが使用され、
・一方、現在のフレームにおいて特定の事象が検出されないならば、現在のフレームを符号化するために長いフレームが適用される。
これらのステップは、続くフレームについて繰り返され、それによって、本発明により、長いウィンドウを使用して与えられたフレームを符号化し、かつ、先行技術におけるような遷移ウィンドウを使用することなく、直後に短いウィンドウを使用してこの与えられたフレームにすぐに続くフレームを符号化することを可能とする。
【0092】
長いウィンドウから短いウィンドウへの直接の移行を可能とすることによって、特定の事象の検出が符号化されるフレームに直接に実行され、先行技術におけるような続くフレームにはもはや実行されない。従って、本発明による方法によって実行される符号化は、先行技術の符号化と異なり、固定サイズのMDCT変換と比較して追加の遅延なしで実行される。
【0093】
本発明の他の特徴および効果は、以下の詳細な説明、および、先行技術に関して上述した図1、1a、1b、1c、2a、2b、2c、2d、2e以外の添付図面を検討して明らかになる。
【図面の簡単な説明】
【0094】
【図1】変換符号化器の構造を表わす図である。
【図1a】サンプルの符号化/復号化処理を表わす図である。
【図1b】サンプルの符号化/復号化処理を表わす図である。
【図1c】サンプルの符号化/復号化処理を表わす図である。
【図2a】サンプルの符号化/復号化処理を表わす図である。
【図2b】サンプルの符号化/復号化処理を表わす図である。
【図2c】サンプルの符号化/復号化処理を表わす図である。
【図2d】サンプルの符号化/復号化処理を表わす図である。
【図2e】サンプルの符号化/復号化処理を表わす図である。
【図3a】前述した図1bにおけるサンプルaおよびbの詳述が続く、本発明による符号化/復号化処理を表わす図である。
【図3b】前述した図1cにおけるサンプルeおよびfの詳述が続く、本発明による符号化/復号化処理を表わす図である。
【図4a】本発明の実装において実行される、復号化の補償のために使用される重み付け関数の変形例を表わす。
【図4b】本発明の実装において実行される、復号化の補償のために使用される重み付け関数の変形例を表わす。
【図5a】本発明による符号化器に適用することができる処理の例を表わす。
【図5b】本発明による復号化器に適用することができる処理の例を表わす。
【図6】符号化器および復号化器のそれぞれの構造、および、符号化において使用されるウィンドウの種類の情報の通信を表わす。
【図7】M=512個の成分および重複係数K=4を有するELT変換の場合のための長い合成ウィンドウを表わす。
【図8】重複を有する符号化の場合に過去のサンプルの影響を考慮する実施形態において(0とM/2−MS/2の間に含まれるnについての)重み付け関数w1,nおよびw2,nの態様を表わす。
【図9】この実施形態において(M/2−MS/2とM/2+MS/2の間に含まれるnについての)重み付け関数w’1,nおよびw’2,nの態様を表わす。
【図10】この実施形態において(M/2−MS/2とM/2+MS/2の間に含まれるnについての)重み付け関数w’3,nおよびw’4,nの態様を表わす。
【図11】図8に表わされている実施形態の変形において0とM/2+MS/2の間に含まれる全ての範囲のnにわたる重み付け関数w1,nおよびw2,nの態様を表わす。
【図12】この変形において0とM/2+MS/2の間に含まれる全ての範囲のnにわたる重み付け関数w3,nおよびw4,nの態様を表わす。
【発明を実施するための形態】
【0095】
本発明は、少なくとも長いウィンドウから短いウィンドウへの移行のために遷移ウィンドウの適用を防止することを可能とする。
【0096】
こうして、図2eを参照して前述した第2の例では、時間t=540において非定常現象または“アタック”が検出されると、本発明は、フレーム0(時間t=256から時間t=511まで広がるウィンドウ)のために長いウィンドウを使用することを提案する。そして、続くフレーム(t=512からt=767)のサンプルの取得およびt=540におけるアタックの検出の間に、符号化器は、時間t=368(t=512−M/2−MS/2に対応する。)から、時間t=655(t=512+M/2+MS/2−1に対応し、ここで、説明している例において、
・ 2*M=512は長いウィンドウのサイズ、
・ 2*MS=64は短いウィンドウのサイズ
である。)までのサンプルを符号化するために、先行技術に関して図1bおよび図1cに表わされた標準的な非対称遷移ウィンドウなしで、8個の短いウィンドウを使用する。
【0097】
そして、復号化器に関して、短いウィンドウを用いた符号化されたフレームの受信の間に、復号化器は次の処理を進める。
・現在のフレームのために短いウィンドウを使用しなければならないことを示す符号化器からの情報を受信する。
・符号化の間の長いウィンドウから短いウィンドウへの直接の遷移を補償するために効果的な処理を適用し、この処理の例は、図5bを参照して後に詳細に説明する。
【0098】
図3aおよび図3bは、一方で、長いウィンドウと短いウィンドウの間で重複しない領域内で見出されるサンプルaおよびb(図3a)、および、他方で、重複領域内で見出されるサンプルeおよびf(図3b)を得るための本発明による符号化/復号化方法を表わす。特に、この重複領域は、長いウィンドウFLの下降エッジ、および、最初の短いウィンドウFCの上昇エッジ、によって定義される。
【0099】
従って、図3aおよび図3bを参照して、符号化の間に、符号化されたフレームT’iを構成するために、フレームTi−1およびTiのサンプルが長い解析ウィンドウFLによって重み付けされ、続くフレームTiおよびTi+1のサンプルが、遷移ウィンドウを適用することなく、短い解析ウィンドウFCによって直接に重み付けされる。
【0100】
また、図3aおよび図3bを参照すると、最初の短い解析ウィンドウFCは、(図3bの例におけるサンプルeに先行するサンプルのための)短いウィンドウによって考慮されない値が先行することに留意すべきである。より詳しくは、この処理は、先行技術の符号化器/復号化器と同様に、符号化されるフレームT’i+1の最初のM/2−MS/2個のサンプルに適用される。一般に、先行技術と比較して、符号化の間に、および、同様に復号化の間に、実行される処理を可能な限り乱さないことが求められる。従って、例えば、符号化されるフレームT’i+1の最初のサンプルを無視する選択が行われる。
【0101】
もちろん、図3aおよび図3bにおいて、2つの短い(MS=M/2)解析ウィンドウFCの場合のみ表わした。それにもかかわらず、先行技術におけるように、いくつかの短いウィンドウの連続が与えられ、各々のウィンドウの連続は、符号FCが与えられた図3aおよび図3bに表わされている。
【0102】
直前のフレームT’iは長いウィンドウFLを用いて符号化される一方で、短いウィンドウFCを用いて符号化されるフレームT’i+1の復号化について、2つの実施形態を以下で説明する。
【0103】
第1の実施形態において、復号化の間に合成ウィンドウの使用は全くなしで済まされ、完全な復元の特性が保証されることを表わす。
【0104】
図3aにおいて、(長いウィンドウから直接に短いウィンドウへの)ウィンドウの変更を必要とするアタックの検出の間に、まず、短いウィンドウのみからのサンプルが合成される(図3aにおけるサンプルb)。そして、長い解析ウィンドウから計算された値v1において、前もって計算されたサンプルbの影響は補償される。サンプルaについて符号化の計算(符号化されたフレームT’i)が次のように実行される。
v1=a*h(M+n)+b*h(2*M−1−n)
【0105】
一方、異なる時間サポート(符号化されたフレームT’i+1)について、結合が続く短いウィンドウからの重み付け計算が実行されるとき、符号化値v2においてサンプルaは重み付けされず、短いウィンドウからの復元の後、
v2=b
を得る。
【0106】
好ましくは、本発明による符号化/復号化において完全な復元が検証される。実際、
a’=(v1−v2*h(2*M−1−n))/h(M+n)=a
【0107】
また、復号化の間に、(サンプルaのような)フレームの始めにおけるサンプルの決定の前に、値v2=bから導かれるサンプルおよび続くサンプルがまず決定されなければならないことに留意すべきである。従って、復号化の間に、時間の反転が実行される。
【0108】
図3bにおいて、長いウィンドウFL(下降エッジ)と最初の短いウィンドウFC(上昇エッジ)の間の遷移領域の符号化されたサンプルが、従って、サンプルeおよびfにおいて計算される。2つのウィンドウFLおよびFCの間のこの重複領域において、符号化された係数(または、以下、“値v1およびv2”)の表現が次式によって与えられる。
v1=e*h(M+n)+f*h(2*M−1−n)
v2=f*hS(MS−1−m)−e*hS(m)
【0109】
従って、サンプルeおよびfの値を見つけるために、復号化器において、2つの未知数を有するこの方程式を解かなければならない。
e=[v1*hS(MS−1−m)−v2*h(2*M−1−n)]/[h(M+n)*hS(MS−1−m)+hS(m)*h(2*M−1−n)]
f=[v1*hS(m)+v2*h(M+n)]/[hS(MS−1−m)*h(M+n)+h(2*h−1−n)*hS(m)]
また、完全な復元の特性を効果的に検証する数式が導き出され、m=n−M/2+MS/2を用いて、
e’=[v1*hS(MS+m)−v2*h(n)]/[h(M+n)*hS(MS+m)+h(2*M−1−n)*hS(m)]=e
f’=[v1*hS(2*MS−1−m)+v2*h(M−1−n)]/[h(M+n)*hS(MS+m)+h(2*M−1−n)*hS(m)]=f
【0110】
(図1cの下に表わされているようにv2が短いウィンドウhSによって重み付けされた)先行技術の規定とは対照的に、値v2が長いウィンドウhによって重み付けされることに留意すべきである。
【0111】
第2の実施形態において、復号化の間に合成ウィンドウが保持される。それらは、図3aおよび図3bに表わされ、長い合成ウィンドウについて符号FLS、短い合成ウィンドウについて符号FCSが付されているように、解析ウィンドウと同じ形態を有する(解析ウィンドウの同類または双対)。この第2の実施形態は、現状の技術の復号化処理、すなわち、長い解析ウィンドウを用いて符号化されたフレームを復号化するために長い合成ウィンドウを用いること、および、一連の短い解析ウィンドウを用いて符号化されたフレームを復号化するために一連の短い合成ウィンドウを用いることに従う利点を有する。
【0112】
一方、長い−短い遷移ウィンドウを用いて符号化されるべきとき、長いウィンドウを用いて符号化されたフレームを復号化するために“補償”によるこれらの合成ウィンドウの訂正が適用される。言い換えると、長いウィンドウから短いウィンドウへの直接の移行の影響を補償するために、直前のフレームT’iが長いウィンドウFLを用いることによって符号化される一方で、短いウィンドウFCを用いることによって符号化された現在のフレームT’i+1を復号化するために、符号化器において以下で説明する処理が用いられる。
【0113】
サンプルa、b、e、fを値v1およびv2に復号化および結合するための上述した数式は、以下のように、特に、時間の反転を実行する、重み付けされた2項の和の形に書き換えることができる。
【0114】
まず、最初の短い合成ウィンドウFCS内で、上述した重複領域の後の(典型的に、図3aの説明におけるサンプルv2=bおよび続くサンプルにおける)位置が採用される。短い合成ウィンドウFCSのみから、重複しないこの部分の復号化のために、符号化されたフレームT’i+1の“値”が、まず、v2=b(図3a)から復号化される。サンプルbおよび続くサンプルが復号化されると、続く2項の重み付けされた和が適用され、0≦n<M/2−MS/2について、
【0115】
【数19】
【0116】
であり、ここで、
【0117】
【数20】
【0118】
は、(符号化/復号化は完全な復元であるので、初期のサンプルxnに対応する)復号化されたサンプルを表わす。
記号
【0119】
【数21】
【0120】
は、訂正なしで長い合成ウィンドウFLSを使用して復号化(DCT−1逆変換の適用)されたサンプルに該当するものを示す。
snは、短い合成ウィンドウFCSの連続を用いて十分に復号化されたサンプル(典型的に、サンプルbおよび続くサンプル)を表わす。
【0121】
2つの重み付け関数w1,nおよびw2,nは、0≦n<M/2−MS/2について、
【0122】
【数22】
【0123】
および
【0124】
【数23】
【0125】
と表わされる。
【0126】
“サンプル”
【0127】
【数24】
【0128】
は、長い合成ウィンドウを使用することによる合成および重み付けによって不完全に復号化された実際の値であることを理解すべきである。典型的に、これは、ウィンドウFLSの係数h(M+n)によって乗算される、図3aにおける値v1に関し、サンプルaのようなフレームTiの始めからのサンプルも含まれる。
【0129】
また、サンプルbおよび続くサンプルがここでまず決定され、上記の数式において“sM−1−n”と表わされ、従って、この第2の実施形態における復号化処理によって提案される時間の反転を表わすことに留意すべきである。
【0130】
また、(h(M+n)による除算のために)項w1,nが存在しないので、長い合成ウィンドウFLSによって実行される重み付けが防止されることに留意すべきである。
【0131】
さらに、図3bにおけるサンプルeおよびfの領域に対応する、長いウィンドウFL(下降エッジ)および最初の短いウィンドウFC(上昇エッジ)の両方によって覆われる部分のサンプルの復元のために、好ましくは、2つの重み付けされた項の次の結合が適用される。
【0132】
【数25】
【0133】
ここで、m=n−M/2+MS/2、M/2−MS/2≦n<M/2+MS/2である。
上述したように、項
【0134】
【数26】
【0135】
は、長い合成ウィンドウFLSによる合成および重み付けによって不完全に復元された値を構成し、項
【0136】
【数27】
【0137】
は、最初の短い合成ウィンドウFCSの上昇エッジから不完全に復元された値を表わす。
【0138】
ここで、重み付け関数w’1,nおよびw’2,nは、次式で与えられる。
【0139】
【数28】
【0140】
および
【0141】
【数29】
【0142】
これら全ての重み付け関数w1,n、w2,n、w’1,n、w’2,nは、長いおよび短いウィンドウのみに依存する固定した要素によって構成される。そのような重み付け関数の変形例は、図4aおよび図4bに表わされている。効果的な実施形態において、これらの関数がとる値は、事前に計算し(一覧表にし)、最終的に本発明による復号化器のメモリに記憶させることができる。
【0143】
こうして、図5bを参照すると、一実施形態において、長い解析ウィンドウから短い解析ウィンドウに直接に移行するときに、符号化されたフレームT’iの復号化の間の処理は次のステップを含みうる。フレームT’i(ステップ60)を復号化するために、まず、フレームの終わりの値v2=bを復号化する(ステップ63)ために、短い合成ウィンドウが適用される(ステップ61)。ここで、bを決定するために、続く符号化されたフレームT’i+1に依存する(ステップ62)。そして、関係式
【0144】
【数30】
【0145】
を用いて(ステップ67)、および、事前に計算され一覧表にされた重み付け値w1,nおよびw2,nを用いて(ステップ66)、0とM/2−MS/2の間の含まれる任意のnについて補償を適用することによって、フレームT’iの始めにおけるサンプルを復号化する(ステップ65)ために、長い合成ウィンドウ(ステップ64)が適用される。
【0146】
(eとfの間の)符号化されたフレームT’iの“中央”の領域の復号化、従って、M/2−MS/2とM/2+MS/2の間に含まれるnについての復号化は、短いおよび長い合成ウィンドウの両方を使用して(ステップ68)、および、特に、事前に計算され一覧表にされた重み付け値w’1,nおよびw’2,nを用いて(ステップ70)、m=n−M/2+MS/2である関係式
【0147】
【数31】
【0148】
による補償を適用することによって(ステップ69)、同様に実行することができる(図5bにおける“+”の符号)。最後に、この処理から、初期のフレームTiの全ての種類のサンプルa、b、e、fについての値が導き出される(ステップ71)。
【0149】
上述した第1および第2の実施形態は、長い解析ウィンドウから短い解析ウィンドウに直接に移行することによって符号化されたフレームT’iの復号化の間に、完全な復元を保証し、そして、符号化の間に、長いウィンドウから短いウィンドウに直接に移行することを効果的に可能とする。
【0150】
ここで、図5aを参照して、少なくとも、ある場合において、長い−短い遷移ウィンドウの符号化の間の適用なしで済ませることを提案する実施形態を説明する。
【0151】
フレームTiを受信すると(ステップ50)、このフレームTiにおいて直接に存在するデジタルオーディオ信号の中にアタックATTのような非定常現象の存在が探し出される。この種類の現象が検出されない限り(判定51の出力における矢印n)、このフレームTiの符号化のために、長いウィンドウの適用(ステップ52)が継続する。そうでないならば(判定51の出力における矢印y)、現在のフレームTiの始め(例えば、最初の半分)において事象ATTが存在するかどうか判定することが求められ(判定53)、この場合(判定53の出力における矢印y)、フレームTiの符号化(ステップ56)のために、短いウィンドウ、より正確には、一連の短いウィンドウが直接に適用される(ステップ54)。そして、この実施形態は、遷移ウィンドウを防止し、短いウィンドウを適用するために続くフレームTi+1を待たないことを可能とする。
【0152】
従って、現状の技術とは反対に、続くフレームTi+1ではなく、符号化されるフレームTi内に直接に、非定常現象のような特定の事象を検出することが可能であることを理解すべきである。そして、本発明による符号化遅延は、先行技術のものと比較して低減される。実際、現在のフレームの始めにおいて非定常現象が検出されるならば、短いウィンドウが直接に適用されるが、先行技術においては、Tiを符号化する間のフレームに遷移ウィンドウを適用することができるように、続くフレームTi+1において非定常現象を検出することが必要であった。
【0153】
再び図5aを参照すると、現在のフレームTiの終わり(例えば、後半)において非定常現象が検出されるならば(判定53の出力における矢印n)、短いウィンドウの連続を適用する前に、現在のフレームTiを符号化する(ステップ56)ために、遷移ウィンドウを適用する(ステップ55)ことを効果的に選択することが可能である。この実施形態は、特に、低減した符号化遅延を保証する一方で、現状の技術の処理に等価な処理を提案することを可能とする。
【0154】
従って、全体として、この実施形態において少なくとも3つの重み付けウィンドウ
・短いウィンドウ、
・長いウィンドウ、
・長いウィンドウの使用から短いウィンドウの使用に移行するための遷移ウィンドウ、
が与えられ、現在のフレームの終わりにおいて非定常現象のような特定の事象が検出されるならば(ステップ53)、現在のフレーム(Ti)を符号化する(ステップ56)ために遷移ウィンドウ(ステップ55)が適用される。
【0155】
この実施形態の変形において、長いウィンドウの使用から短いウィンドウの使用に移行するために、次を与えることができる。
・現在のフレームTiについて、長いウィンドウFLの使用。
・直後のフレームTi+1について、現在のフレームの終わりにおいて特定の事象が検出されても、遷移ウィンドウを使用しない、短いウィンドウFCの直接の使用。
【0156】
この変形は次の利点を有する。符号化器は、ウィンドウの種類の変更についての情報を復号化器に送信しなければならないとき、この情報は、もはや短いウィンドウと遷移ウィンドウの間の選択を復号化器に通知する必要がないので、単一のビットに符号化することができる。
【0157】
それにもかかわらず、短いウィンドウから長いウィンドウに移行するために、特に、長いウィンドウから短いウィンドウに移行する情報の受信に従い、単一のビットへのウィンドウの種類の変更についての情報の送信を保証し続けるために、遷移ウィンドウを保持することができ、復号化器は、この目的のために、
・短いウィンドウを使用し、
・そして、ウィンドウの種類の変更の情報を受信しないとき、短いウィンドウから長いウィンドウへの遷移ウィンドウを使用し、
・そして、最後に、長いウィンドウを使用することができる。
【0158】
符号化器10から復号化器20への、符号化の間に使用されるウィンドウの種類の情報の通信が図6に表わされている。符号化器10は、符号化の間にフレームTiに含まれる信号において強いアタックのような特定の事象の検出モジュール11を備え、この検出から使用するウィンドウの種類を導き出すことに留意すべきである。この目的のために、モジュール12は、使用するウィンドウの種類を選択し、モジュール12によって選択された解析ウィンドウFAを用いて符号化されたフレームT’iを送出する符号化モジュール13にこの情報を送信する。符号化されたフレームT’iは、符号化の間に使用されるウィンドウの種類についての情報INFとともに、(通常、単一のデータフローで)復号化器20に送信される。復号化器20は、符号化器10から受信した情報INFに従って合成ウィンドウFSを選択するモジュール22を備え、モジュール23は、復号化されたフレーム
【0159】
【数32】
【0160】
を送出するために、フレームT’iの復号化を適用する。
【0161】
また、本発明は、本発明による方法を実現するための、より詳しくは、図5aに表わされている処理、または、前述したその変形(単一のビットにおけるウィンドウの種類の変更の情報の送信)を実現するための、図6における符号化器10のような符号化器に関する。
【0162】
また、本発明は、そのような符号化器のメモリ内に記憶され、符号化器のプロセッサによって実行されるとき、そのような処理またはその変形を実現するための命令を含むコンピュータプログラムに関する。この目的のために、図5aは、そのようなプログラムのフローチャートを表現しうる。
【0163】
上記の第2の実施形態に従って、符号化器10は解析ウィンドウFAを使用し、復号化器20は合成ウィンドウを使用し、これらの合成ウィンドウは、それにもかかわらず、(重み付け関数w1,n、w2,n、w’1,n、w’2,nを使用して)前述した補償による訂正を進めることによって、解析ウィンドウFAに対応するものであることに留意すべきである。
【0164】
また、本発明は、図6に表わされている復号化器20のような変換復号化器のメモリ内に記憶され、この復号化器20のプロセッサによって実行されるとき、第1の実施形態、または、図5bを参照して上述した第2の実施形態に従う復号化の実現のための命令を含むもう1つのコンピュータプログラムに関する。この目的のために、図5bは、そのようなプログラムのフローチャートを表現しうる。
【0165】
また、本発明は、変換復号化器それ自身に関し、復号化のためのコンピュータプログラムの命令を記憶するメモリを備える。
【0166】
包括的な用語では、それぞれ異なる長さの、少なくとも2つの種類の重み付け関数を使用して符号化されたフレームの連続によって表現される信号の本発明による変換復号化方法は、次のように実行される。
【0167】
長いウィンドウから短いウィンドウに移行するための情報を受信した場合、短い解析ウィンドウFCを使用して符号化された、与えられたフレームT’i+1に、1つの種類の短い合成ウィンドウFCSを使用した復号化から(種類bの)サンプルが決定される。
1つの種類の長い解析ウィンドウFLを使用して符号化された、与えられたフレームに先行するフレームT’iを部分的に復号化し(逆変換DCT−1の適用)、かつ、
一覧表にされ、かつ、復号化器のメモリ内に記憶された重み付け関数を用いて2つの重み付けされた項を結合することによって他のサンプルが得られる。
【0168】
上記の第2の実施形態において、w1,n、w2,n、w’1,n、w’2,nと示された関数が含まれる。
【0169】
しかし、この包括的な復号化処理は、第1および第2の実施形態の2つの場合に適用される。
【0170】
第2の実施形態において、
・まず、与えられたフレーム(T’i+1)からサンプル(b)が決定され(図5bのステップ63)、
・時間的に前のフレーム(T’i)の始めに対応するサンプル(a)が導き出され(ステップ65〜67)、これらは長い合成ウィンドウFLSを使用した復号化から生じ、第2の実施形態に属す。
【0171】
この場合において、
・M個のサンプルを含むフレーム、
・2M個のサンプルを含む長いウィンドウ、
・MSはMより小さい、2MS個のサンプルを含む短いウィンドウについて、
n=0は復号化されるフレームの始めに対応し、0と(M/2−MS/2)の間に含まれるnについて、サンプル
【0172】
【数33】
【0173】
は、
【0174】
【数34】
【0175】
の形の2つの重み付けされた項の結合によって与えられ、ここで、
【0176】
【数35】
【0177】
は、前のフレームT’iから生じる値(v1)であり、
sM−1−nは、与えられたフレームT’i+1に適用される短い合成ウィンドウを使用して既に復号化されたサンプル(b)であり、
w1,nおよびw2,nは、nの関数としてとる値が一覧表にされ、かつ、復号化器のメモリ内に記憶されうる重み付け関数である。
【0178】
あるいは、(M/2−MS/2)と(M/2+MS/2)の間に含まれるnについて、サンプル
【0179】
【数36】
【0180】
は、
【0181】
【数37】
【0182】
の形の2つの重み付けされた項の結合によって与えられ、ここで、m=n−M/2+MS/2であり、
【0183】
【数38】
【0184】
は、前のフレームT’iから生じる値v1であり、
【0185】
【数39】
【0186】
は、与えられたフレームT’i+1から生じる値v2であり、
w’1,nおよびw’2,nは、nの関数としてとる値が一覧表にされ、かつ、復号化器のメモリ内に記憶されうる重み付け関数である。
【0187】
従って、本発明は、変換の完全な復元の特性を保持する一方で、先行技術と比較して低減した遅延を有するウィンドウ間の遷移を提供することを可能とする。この方法は、全ての種類のウィンドウ(非対称なウィンドウ、および、異なる解析および合成ウィンドウ)を用いて、異なる変換およびフィルタバンクのために適用することができる。
【0188】
長いウィンドウからより小さいサイズのウィンドウへの遷移の場合において上述した補償処理は、短いウィンドウからより大きいサイズのウィンドウへの遷移の場合に、自然に、かつ、同様に、拡張される。この場合において、短い−長い遷移ウィンドウの不存在は、上述した場合と同様の重み付けによって復号化器において補償することができる。
【0189】
そして、本発明は任意の変換符号化、特に、MPEG−4“AAC−低遅延”標準におけるような対話的な従来の応用のために提供される変換符号化だけでなく、MDCT変換と異なる変換、特に、上述したELT(Extended Lapped Transform)およびそれらの双直交の拡張に適用することができる。
【0190】
しかし、特に、ELT型の変換の場合に、変調(v1)による時間畳み込みの項は、過去に生じた時間畳み込みの項と結合されうることが認められる。従って、上述した訂正処理は、将来のサンプルに影響する現象(または“折り返し歪み(aliasing)”)を考慮する。一方、また、以下で示す詳述は、少なくとも量子化の不存在において、完全な復元を得るように、過去の成分を除去するために、過去の成分を考慮する。従って、合成された過去の信号と結合して、時間畳み込みの項なしで済ませることを可能とする追加の重み付け関数をここで定義することを提案する。
【0191】
以下でELT変換の一例として文献:Gerald D. T. Schuller、Tanja Karp、“Modulated Filter Banks with Arbitrary System Delay: Efficient Implementations and the Time-Varying Case”、IEEE Transactions on Signal Processing、2000年3月、第48巻、第3号の記載を参照する。
【0192】
本発明の枠組みの中での続く実施形態は、(例えば、2048個のサンプルを有する)長いウィンドウと(例えば、128個のサンプルを有する)短いウィンドウの間の遷移なしで移行することを提案する。
【0193】
<長いウィンドウ(K=4、M=512)を用いた変換>
これは低遅延の変換であり、そのウィンドウはK・M=2048のサイズを有し、その解析は、0≦k≦M−1について、
【0194】
【数40】
【0195】
の形で表わされる。
Mは得られたスペクトル成分の数であり、
【0196】
【数41】
【0197】
は、−2M≦n≦2M−1について、ウィンドウ化された入力信号の表記であり、
【0198】
【数42】
【0199】
は長い合成ウィンドウの表記である。
【0200】
図7は、M=512個の成分および重複係数K=4を有するELT変換の場合についての長い合成ウィンドウを表わす。
【0201】
逆変換は、0≦n≦4M−1について、
【0202】
【数43】
【0203】
と表わされ、復元される信号xn+tMは、4つの要素(K=4)の復元する加算
xn+tM=zt,n+zt−1,n+M+zt−2,n+2M+zt−3,n+3M
によって得られ、ここで、0≦n≦M−1、および、
【0204】
【数44】
【0205】
である。
【0206】
合成ウィンドウは、0≦n≦4M−1について、
【0207】
【数45】
【0208】
として定義され、一方、解析ウィンドウは、サンプルの順序の反転、すなわち、0≦n≦4M−1について、
【0209】
【数46】
【0210】
によって合成ウィンドウから定義されることに留意すべきである。
【0211】
<短いウィンドウ(K=2、MS=64)を用いた変換>
短いウィンドウの場合に、解析変換は、0≦k≦MS−1について、
【0212】
【数47】
【0213】
の形に表わされ、ここで、ウィンドウ化された入力信号として、0≦n≦2MS−1について、
【0214】
【数48】
【0215】
であり、短い合成ウィンドウとしてwS(n)である。
逆変換は、0≦n≦2MS−1について、
【0216】
【数49】
【0217】
であり、復元される信号xn+tMは、2つの要素(KS=2)の復元する加算によって得られ、0≦n≦M−1について、
【0218】
【数50】
【0219】
および
【0220】
【数51】
である。
【0221】
この表記において、tは短いフレームのインデックスであり、解析および合成ウィンドウは同一であり、それらは対称であるので、0≦n<2MSについて、
【0222】
【数52】
【0223】
である。
【0224】
<重み付け関数の数式>
この実施形態において、
・M個のサンプルを含むフレーム、
・4M個のサンプルを含む長いウィンドウ、
・MSはMより小さい、2MS個のサンプルを含む短いウィンドウについて、
0と(M/2−MS/2)の間に含まれるn(n=0は復号化の処理においてフレームの始めに対応する)について、サンプル
【0225】
【数53】
【0226】
は、0≦n≦M/2−MS/2について、
【0227】
【数54】
【0228】
の形の4つの重み付けされた項の結合によって与えられ、ここで、
【0229】
【数55】
【0230】
は、(符号化/復号化が完全な復元であるならば、初期のサンプルxnに対応する)復号化されたサンプルを表わす。
表記
【0231】
【数56】
【0232】
は、フレームT’iを訂正することなく、先行する計算要素zt−1,n+2M+zt−2,n+3Mに加算して、長い合成ウィンドウを使用して、与えられたフレーム(T’i+1)に先行するフレーム(T’i)の不完全に復号化されたサンプル(逆変換の適用)に対応することを示す。
snは、(M/2+MS/2≦n<Mであるようなインデックスnのサンプルについて)フレームT’i+1の短い合成ウィンドウFCSの連続を使用して完全に復号化されたサンプル、および、前のフレームの完全に復号化されたサンプル(0≦n<Mについてsn−2Mと表わされ、{s−2M,s−2M+1,...,s−M−1}に等しい。)を表わす。
w1,n、w2,n、w3,n、w4,nは、nの関数としてとる値が一覧表にされ、かつ、復号化器のメモリ内に記憶され、または、長いおよび短い解析および合成ウィンドウの関数として計算されうる重み付け関数である。
【0233】
好ましくは、特に、完全な復元を保証するために、重み付け関数として次式を選択することができる。0≦n<M/2−MS/2について、
【0234】
【数57】
【0235】
w1,nおよびw2,nの形式は、MDCT変換の場合に前述したものと少し異なることに留意すべきである。実際、フィルタはもはや対称でなく(h2の項が消えている)、変調の項が変更され、これは符号の変更を説明する。
【0236】
そして、この実施形態において、M/2−MS/2とM/2+MS/2の間に含まれるnについて、サンプル
【0237】
【数58】
【0238】
は、
【0239】
【数59】
【0240】
の形の4つの重み付けされた項の結合によって与えられ、ここで、m=n−M/2+MS/2、かつ、M/2−MS/2≦n<M/2+MS/2である。
同じ表記に従い、
【0241】
【数60】
【0242】
は、与えられたフレームT’i+1に先行するフレームT’iの不完全に復号化されたサンプルである。
【0243】
【数61】
【0244】
は、与えられたフレームT’i+1の最初の短いウィンドウの不完全に復号化されたサンプルである。
snは、前のフレーム(T’i−1,T’i−2,...)において完全に復号化されたサンプルを表わす。
w’1,n、w’2,n、w’3,n、w’4,nは、nの関数としてとる値が一覧表にされ、かつ、復号化器のメモリ内に記憶され、または、長いおよび短い解析および合成ウィンドウの関数として計算されうる重み付け関数である。
好ましくは、完全な復元を保証するために、次式
【0245】
【数62】
【0246】
に従って重み付け関数を選択することができ、ここで、M/2−MS/2≦n<M/2+MS/2、m=n−M/2+MS/2である。
【0247】
従って、この実施形態において、長いウィンドウと短いウィンドウの間での遷移の間に、信号は、
・短いウィンドウから復元されたサンプルの重み付けされたもの、
・長いウィンドウから部分的に復元されたサンプルの重み付けされたもの(計算の項zt−1,n+2M+zt−2,n+3Mの部分)、
・過去の合成された信号のサンプルの結合の重み付けされたもの、
の結合から復元される。
【0248】
この実施形態の変形において、関数w’3,nおよびw’4,nは大きく異ならないことに留意すべきである。項h(4M−1−n)およびh(3M+n)のみがそれらの数式において異なる。一実施形態は、例えば、項h(4M−1−n)sn−2M+h(3M+n)s−M−1−nを用意し、そして、
【0249】
【数63】
【0250】
によって表現される関数による結果を重み付けすることからなり、従って、これは項h(4M−1−n)およびh(3M+n)の寄与が除かれた関数w’3,nおよびw’4,nに対応する。
【0251】
これと同じ原理が同様にw3,nおよびw4,nに適用される。
【0252】
もう1つの変形において、合成の計算が重み付けされる。好ましくは、長いウィンドウから不完全に復元されたサンプルが、重み付けされた計算zt−1,n+2M+zt−2,n+3Mに加算されるように、合成の計算のこの重み付けをゼロに設定することができる。この場合において、過去に合成された信号に適用される重み付けは異なりうる。
【0253】
前述した実施形態において得られる重み付け関数wおよびw’の特性の形態は、図9および図10に表わされている。特に、これらのグラフのy軸の値を参照すると、図10に表わされている関数w’3,nおよびw’4,nは、図9に表わされている関数w’1,nおよびw’2,nに関して(とる値を考慮して)無視できることが分かる。従って、関数w’3,nおよびw’4,nが含まれる項は、信号
【0254】
【数64】
【0255】
の復元に関して上記で与えられた合計
【0256】
【数65】
【0257】
において省略することができる。この省略は低い復元のエラーに導く。
【0258】
また、より大きい処理の簡単さを意図する変形において、w’3,nおよびw’4,nはたいへん類似していることが分かる。従って、時間の計算における利得を達成するために、これらの2つの関数の重み付けの結合のみ、例えば、2つの関数の平均を使用するために提供することができる。
【0259】
(重み付け関数w1,nおよびw2,nの態様を表わす)図8および(重み付け関数w3,nおよびw4,nの態様を表わす)図12における比較は、関数w1,nおよびw2,nに関して関数w3,nおよびw4,nのために同じ言及を引き起こす。
【0260】
従って、
【0261】
【数66】
【0262】
の前述の数式を簡単にすることを可能とする。
・関数w3,nおよびw4,nによる重み付けが省略されるならば、
【0263】
【数67】
【0264】
・または、例えば、
【0265】
【数68】
【0266】
、または、緩やかな復元のエラーに導くこれら2つの関数の任意の他の線形結合を用いて、
【0267】
【数69】
【0268】
関数w3,nおよびw4,nによる重み付けの省略が信号より下の84dBの電力を有する復元のエラーに導き、単純な線形結合(例えば、これらの関数の平均)の使用それ自体が信号より下の96dBのエラーに導くことを留意すべきであり、これら両方の場合においてオーディオの応用のために既にたいへん十分である。完全な復元は、実際、通常、信号より下の120から130dBのエラー電力を測定することを可能とすることに留意すべきである。
【0269】
さらに、重み付け[1]において、もはや計算の項sn−2Mおよびs−M−1−nを使用しないことは、過去からの量子化ノイズの拡散を防止することを可能とする。従って、量子化が存在しない不完全な復元が、信号が良好に符号化されるとき量子化ノイズの制限のために差し替えられる。
【0270】
また、時間サポート0−128(図8および図12)において、重み付け関数は特定の形
【0271】
【数70】
【0272】
を有することに留意すべきである。
説明した例において、0と128の間にゼロの大きさを有する最初の部分を含むウィンドウh(n)(図7)の形式によってこの観察が説明される。従って、この例において、複雑さのために、最初の復元を2つのフェーズ、0≦n<128について、
【0273】
【数71】
【0274】
および、128≦n<M/2−MS/2=224について、
【0275】
【数72】
【0276】
に細分化することが好ましい。
【0277】
効果的なアルゴリズム構造を有する一実施形態において、一方で、重み付け関数w1,nおよびw2,n(図11)、および、他方で、w3,nおよびw4,n(図12)は、ここで開示されたように、0から(M+MS)/2の全体の間隔にわたって定義することができる。
【0278】
最初のステップにおいて、復元される信号
【0279】
【数73】
【0280】
の(
【0281】
【数74】
【0282】
と示す)主要な数式の計算は、0から(M+MS)/2まで、次のように行われる。
【0283】
【数75】
【0284】
(これは、この同じ範囲にわたって計算され、図12に表わされている関数w3,nおよびw4,nとともに、図11において0とM/2+MS/2の間に含まれるnの全体の範囲にわたって表わされている関数w1,nの計算に導く。)
【0285】
そして、(n=0は復号化の処理においてフレームの始めに対応する)0とM/2−MS/2の間に含まれるnについて、
【0286】
【数76】
【0287】
とし、ここで、w2,nは、図11においてw2,nと示す曲線の始め(x軸における224の前)に対応し、M/2−MS/2とM/2+MS/2の間に含まれるnについて、
【0288】
【数77】
【0289】
とし、m=n−M/2+MS/2、および、M/2−MS/2≦n<M/2+MS/2であり、ここで、w’2,nは、図11においてw2,nと示す曲線の終わり(x軸における224の後)に対応する。
【0290】
関数w2,nおよびw’2,nによって重み付けするための特定の処理の特徴を以下で説明する。
各々の関数w1,n、w3,n、w4,nについて、0とM/2+MS/2の間の1つのみの変化を用いることが可能である。他方、関数w2,nおよびw’2,nについて、
・関数w2,nは完全に復号化されたサンプルを重み付けし、
・一方、関数w’2,nは不完全に復号化されたサンプルを重み付けする。
さらに、処理の“時間の反転”は、重み付けw2,nについてのみに示し(−nによるsのインデックス)、重み付けw’2,nについては示さない。
【0291】
従って、(重複K>2である)長いウィンドウから(重複K’<Kである)短いウィンドウへの遷移の間のサンプルの完全な復号化のために過去のサンプルの影響を低減させることを可能とするこの詳述を包括的な用語で要約すると、復号化されたサンプルは、過去の合成信号を含む少なくとも2つの重み付けされた項の結合によって得られる。
【符号の説明】
【0292】
10 ・・・符号化器
20 ・・・復号化器
【技術分野】
【0001】
本発明は、デジタルオーディオ信号の符号化/復号化に関する。
【背景技術】
【0002】
データ転送速度低減のための変換符号化方式において、一般に、サンプルの符号化に与えられる正確さを低減することが求められ、一方、それにもかかわらず、聞き手が可能な限り最も低い程度の劣化を認識することを保証することが求められる。
【0003】
この目的のために、量子化処理によって実行される正確さの低減は、心理音響学モデルを用いて制御される。人間の耳の特性の知識に基づくこのモデルは、最も認識されにくい聴覚周波数において量子化ノイズを調整することを可能とする。
【0004】
心理音響学モデルからのデータ、本質的に周波数領域におけるデータを使用するために、この周波数領域において実行される量子化とともに、時間/周波数変換を実行することは標準的な習慣である。
【0005】
図1は、
・入力信号Xに作用する解析フィルタFA1,...,FAnのバンクBA、
・符号化モジュールCODが続く量子化モジュールQ、
・符号化された信号X’を出力する合成フィルタFS1,...,FSnのバンクBS、
を有する変換符号化器の構造を図式的に表わす。
【0006】
伝送前にデータ転送速度を低減させるために、多くの場合、“エントロピー”(無損失符号化)と呼ばれる符号化を用いて、量子化された周波数サンプルが符号化される。量子化は、一様な、または、一様でない、スカラー量子化器、または、ベクトル量子化器による標準的な仕方で実行される。
【0007】
量子化ステップにおいて導入されるノイズは、(“逆変換”とも呼ばれる)合成フィルタバンクによって形成される。従って、解析変換と対応付けされた逆変換は、ノイズが聞こえるようになることを防止するために、周波数または時間によって量子化ノイズを効果的に純化させるように選択されなければならない。
【0008】
解析変換は、変換された領域における容易なサンプル符号化を可能とするために、可能な限り信号エネルギーを純化させなければならない。特に、入力信号に依存する変換符号化利得は、可能な限り最大化されなければならない。この目的のために、
SNR=GTC+K・R
の形の関係式を使用することができ、ここで、Kは定数項であり、その値は好ましくは6.02でありうる。
【0009】
従って、得られる信号対雑音比(SNR)は、選択されたサンプル毎のビット数(R)に比例し、変換符号化利得を表わす成分GTCが増加される。符号化利得が大きくなるほど、復元の品質が高くなる。
【0010】
従って、符号化変換の重要さを理解することができる。(解析部による)信号エネルギーおよび(合成部による)量子化ノイズの両方を純化させる機能により、サンプルの容易な符号化を可能とする。
【0011】
オーディオ信号は非定常(non-stationary)であることがよく知られているので、オーディオ信号の特性の関数として、時間上で時間/周波数変換を採用することが適切である。
【0012】
標準的な符号化技術への適用を以下で説明する。
【0013】
変調変換の場合、標準的なオーディオ符号化技術は、コサイン変換または高速フーリエ変換に基づく高速なアルゴリズムを用いてこれらの符号化技術を実現することを可能とするコサイン変調フィルタバンクを組み込む。
【0014】
この種類の変換の中で、(特に、MP3、MPEG−2、MPEG−4 AAC符号化において)最も一般的に使用される変換は、MDCT(Modified Discrete Cosine Transform)変換である。その式は、0≦k<Mについて、
【0015】
【数1】
【0016】
であり、次の表記を用いる。
・Mは、変換のサイズを表わす。
・xn+tMは、時間n+tMの瞬間に周期1/Fe(サンプリング周波数の逆数)でデジタル化された音のサンプルである。
・tはフレームのインデックスである。
【0017】
【数2】
【0018】
はフレームtについて変換された領域におけるサンプルである。
【0019】
【数3】
【0020】
は、変換の基底関数(base function)であり、h(n)はサイズ2Mのプロトタイプフィルタと呼ばれる。
【0021】
初期の時間サンプルを復元するため、サンプル0≦n≦M−1を復元するために、次の逆変換が適用される。
【0022】
【数4】
【0023】
図1aを参照すると、次のように復元が実行される。
・2M個のサンプルを生成する、サンプル
【0024】
【数5】
【0025】
の逆DCT変換(以下、DCT−1と示す)。
・2M個のサンプルを生成する、サンプル
【0026】
【数6】
【0027】
の逆DCT変換。最初のM個のサンプルは前のフレームの最後のM個のフレームと同一の時間をサポートする。
・フレームTiの2番目の半分(最後のM個のサンプル)について合成ウィンドウh(M+n)による、および、続くフレームTi+1の最初の半分(最初のM個のサンプル)について合成ウィンドウh(n)による重み付け。
・共通のサポートにおけるウィンドウ化された成分の加算。
【0028】
条件
【0029】
【数7】
【0030】
による信号の(完全と呼ばれる)正確な復元を保証するために、多数の制約を満たすプロトタイプウィンドウh(n)を選択することが適切である。
完全な復元を可能とするために、典型的に、次の関係式
【0031】
【数8】
【0032】
が十分であり、ウィンドウは中央のサンプルに関して同等の対称性を有する。
【0033】
これら2つの簡単な制約を満たすことは比較的簡単であり、この目的のために、
【0034】
【数9】
【0035】
と書かれる正弦曲線のウィンドウによって標準的なプロトタイプフィルタが構成される。
【0036】
もちろん、“Kaiser Bessel Derived”(またはKBD)という名称のMPEG−4標準で定義されたウィンドウ、または、重複の少ないウィンドウのような他の形態のプロトタイプフィルタが存在する。
【0037】
図1aは、長いウィンドウを用いたMDCT変換による処理の一例を表わす。この図において、
・破線矢印は減算を表わす。
・実線矢印は加算を表わす。
・一点鎖線矢印は、符号化のためのDCT処理、および、復号化DECのためのDCT−1処理を表わし、このDCTは上記の基底関数のコサインの項に対応する。
・符号化される信号のサンプルはフローにおいてxinと表わされ、円で囲まれ、図1bにおいてaおよびb、図1cにおいてeおよびfの符号が付けられた特定のサンプルの符号化/復号化処理の詳述が続く。
・サンプルxinはフレームによってグループ化され、現在のフレームはTiと表わされ、前後のフレームはそれぞれTi−1、Ti+1と表わされる。
・符号DECは、(追加の復元を有する合成ウィンドウFSを用いて)復号化器によって実行される処理に関する。
・解析ウィンドウはFAと表わされ、合成ウィンドウはFSと表わされる。
・nは、ウィンドウとウィンドウの中間と、サンプルaの間の距離である。
【0038】
符号Calc T’iは、解析ウィンドウFAを用いて符号化されたフレームT’iの計算、および、フレームTi−1およびTiのそれぞれのサンプルに関する。これは、図1aに表わされているのは、単に従来の例である。また、例えば、符号化されたフレームT’iを計算するために、フレームTiおよびTi+1をインデックスするように決定することができる。図1aの例に続いて、符号Calc T’i+1は、フレームTiおよびTi+1のそれぞれのサンプルを用いた符号化されたフレームT’i+1の計算に関する。
【0039】
変換DCTおよび逆変換DCT−1の前に得られたv1およびv2は、
v1=a*h(M+n)+b*h(2*M−1−n)
v2=b*h(M−1−n)−a*h(n)
の形の式を用いて得られる。
従って、全体的なDCT/DCT−1および合成ウィンドウの処理の後、復元の項a’およびb’は、
a’=v1*h(M+n)−v2*h(n)=a*h(M+n)*h(M+n)+b*h(2*M−1−n)*h(M+n)−b*h(M−1−n)*h(n)+a*h(n)*h(n)
b’=v1*h(2*M−1−n)+v2*h(M−1−n)=a*h(M+n)*h(2*M−n−1)+b*h(2*M−1−n−1)*h(2*M−n−1)+b*h(M−1−n)*h(M−1−n)−a*h(n)*h(M−1−n)
と表わされ、従って、(関係式(1)を使用して、かつ、h(M−1−n)=h(n+M)を差し引いて、)復元が完全であること(a’=aおよびb’=b)を検証することが可能である。
【0040】
上述したMDCT変換の原理は、特に、0≦k<MおよびL=2kM、kは2より大きい正の整数について、
【0041】
【数10】
【0042】
を用いて、基底関数の次数が変換のサイズの2倍より大きいELT(“Extended Lapped Transform”)と呼ばれる変換に自然に拡張される。
【0043】
復元のために、MDCT変換に関する2つの続くフレームを結合させることに代えて、サンプルの合成は、K個のウィンドウ化された連続したフレームを含む。
【0044】
さらに、ウィンドウの対称性の制約(後に詳細に説明する原則)は、ELT型の変換のために緩めることが可能であることが示される。また、解析および合成ウィンドウの間の同一性の制約を緩めることが可能であり、双直交(biorthogonal)フィルタを使用することを可能とする。
【0045】
符号化される信号に変換を適用する必要性を考慮して、先行技術は、“ウィンドウ切り替え”と呼ばれるもの、すなわち、時間にわたって使用される変換のサイズを変更することを可能とする。
【0046】
ウィンドウの長さを変更する必要性は、特に次の場合に正当化することができる。符号化される信号、例えば音声(speech)信号は、強いアタック(attack)を特徴付ける過渡(非定常)信号(例えば、音声信号における破裂音を特徴付ける“ta”または“pa”の音の発音)を含むとき、符号化の時間の解像度を増加させ、従って、符号化ウィンドウのサイズを減少させることが適切であり、従って、これは長いウィンドウから短いウィンドウに移行することを必要とする。より正確には、先行技術において、移行は、この場合において、長いウィンドウ(後述する図2a)から遷移ウィンドウ(後述する図2c)へ、そして、一連の短いウィンドウ(後述する図2b)へと生じる。従って、後に詳細に理解されるように、現在のフレームの符号化ウィンドウの長さを決定することができ、結果として現在のフレームを符号化する前に、少なくとも1つの続くフレームにおけるアタックを予想することが必要である。
【0047】
先行技術によるウィンドウ長の変更の一例を以下で説明する。
【0048】
典型的な例は、MPEG−AAC標準で規定されているように、サイズMのMDCT変換のサイズをサイズM/8に変更することである。
【0049】
完全な復元の特性を保持するために、上記の式(1)は、2つのサイズの間での遷移のときに次式によって置換されなければならない。
【0050】
【数11】
【0051】
さらに、異なるサイズの続くプロトタイプフィルタのために、0≦n<MSについて関係式
hl(M+M/2−MS/2+n)=h2(MS−n)
が与えられる。従って、遷移のときにサイズM/2について対称性が存在する。
【0052】
図2aから図2eには、異なる種類のウィンドウがそれぞれ表わされている。
・図2aは、サイズ2M=512個のサンプルの正弦曲線ウィンドウ(対称正弦関数)。
・図2bは、サイズ2M=64個のサンプルの正弦曲線ウィンドウ(対称正弦関数)。
・図2cは、サイズ512から64に移行することを可能とする遷移ウィンドウ。
・図2dは、サイズ64から512に移行することを可能とする遷移ウィンドウ。
・図2eは、上述した基本ウィンドウを用いて実行される構成の例。
【0053】
各々の連続したものは、“ウィンドウ長”と呼ばれるものを定義する予め定められた“長さ”を有する。従って、図1aを参照して示したように、符号化されるサンプルは、少なくとも組に結合され、結合において、それぞれのウィンドウの重み付け値によって重み付けされる。
【0054】
より詳しくは、正弦曲線ウィンドウ(図2aおよび図2b)は対称的であり、すなわち、ウィンドウを構成する値の連続の中間における中央の値の両側で、重み付け値はほぼ等しい。効果的な実施形態は、これらのウィンドウの重み付け値の変化を定義するために“サイン”関数を選択することからなる。他のウィンドウ選択(例えば、MPEG AACにおいて使用されるもの)も可能である。
【0055】
しかし、遷移ウィンドウ(図2cおよび図2d)は非対称であり、(PLAと示す)“平坦”な領域を含むことが表わされている。これは、これらの領域における重み付け値が最大であり、例えば“1”に等しいことを意味する。長いウィンドウから短いウィンドウへの遷移ウィンドウ(図1c)を使用して、図1bおよび図1cを参照して分かるように、(図1bに表わされている例における)サンプルaを含む2つのサンプルは係数“1”によって単純に重み付けされ、一方、サンプルbは符号化されたフレームT’iの計算において係数“0”によって重み付けされ、それによって、符号化されたフレームT’iにおいて、サンプルaを含む2つのサンプルが(DCTを除いて)そのままで単純に送信される。
【0056】
符号化システムにおける可変サイズの変換の使用を以下で説明する。また、オーディオサンプルを復元するための復号化器に関する処理を説明する。
【0057】
標準的なシステムにおいて、符号化器は、習慣的に、時間にわたって使用される変換を選択する。従って、AAC標準において、符号化器は、上述した4つのウィンドウサイズ設定のうち1つを選択することを可能とする2つのビットを送信する。
【0058】
遷移ウィンドウ(長い−短い)を用いたMDCT変換処理は、図1bおよび図1cに表わされている。これらの図は、図1aと同様に実行される計算を表わす。
【0059】
図1bおよび図1cにおいて、FAと示す(表わされた例においてMS=M/2である)いくつかの短い解析ウィンドウのみが表わされている。しかし、実際、図2eに表わされているように、いくつかの(典型的に、MS=M/8である)短いウィンドウの連続が与えられる。従って、図1bおよび図1cにおける各ウィンドウFAは、実際、短いウィンドウの連続を含むことが理解される。
【0060】
符号化されたフレームT’iを計算する(Calc T’iと示す。)ために、遷移ウィンドウFTA(図1b)は、
− 上昇エッジにおいてM個のサンプルにわたる長い半分のウィンドウと、
− 下降エッジにおいて、
・(M/2−MS/2個の)サンプルにわたる(1に等しい重み付け値を有する)第1の平坦な領域PLAと、
・MS個のサンプルにわたる下降する短い半分のウィンドウと、
・(M/2−MS/2個の)サンプルにわたる(0に等しい重み付け値を有する)第2の平坦な領域PLAと、
を含む。
【0061】
続く符号化されたフレームT’i+1(Calc T’i+1と示す。)を計算するために、最初の(M/2−MS/2個の)サンプルは無視され、従って、短いウィンドウによって処理されず、続くMS個のサンプルは、図1bおよび図1cに表わされている短い解析ウィンドウFAの上昇エッジによって重み付けされ、続くMS個のサンプルは、その下降エッジによって重み付けされる。
【0062】
以下で、次の記号が使用される。
・Mは長いフレームのサイズである。
・MSは短いフレームのサイズである。
【0063】
図1bにおいて、サンプルbは、長いウィンドウのための計算と同様に、短いウィンドウのみ使用して合成される。そして、長い−短い遷移の半分のウィンドウの特定の形態により、解析および合成の遷移ウィンドウから直接にサンプルaが復元される。遷移ウィンドウは図1bおよび図1cにおいてFTAと示されている。
【0064】
図1cにおいて、長い−短いウィンドウと短いウィンドウの間の遷移領域に対応するサンプルが計算される。図1aにおける長いウィンドウのための計算と同様に、ここでは、eおよびfと示された(円で囲まれた)サンプルの処理が続く。
【発明の概要】
【発明が解決しようとする課題】
【0065】
ウィンドウ遷移の2つの例の場合を以下で説明する。
【0066】
第1の例において、時間t=720(図2e)でオーディオ信号において短いウィンドウの使用を必要とするアタックが検出される。符号化器は、復号化器に、前に使用された長いウィンドウと続く短いウィンドウの間に介在させる長い−短い遷移ウィンドウの使用を通知しなければならない。
【0067】
従って、符号化器は、復号化器に、
・長いウィンドウ
・長い−短い遷移ウィンドウ
・短いウィンドウ
・長い−短い遷移ウィンドウ
・長いウィンドウ
の系列を連続的に指示する。そして、復号化器は、
【0068】
【数12】
【0069】
の形の関係式を適用し、ここで、
【0070】
【数13】
【0071】
および
【0072】
【数14】
【0073】
は、互いに異なりうる、時間tおよびt+1における変換の合成関数を表わす。
【0074】
基底関数
【0075】
【数15】
【0076】
および
【0077】
【数16】
【0078】
が異なる“サイズ”を有するならば、図1bを参照して、次が実行されることを除いて、復元は前述のように実行される。
・2M個のサンプルを生成するサイズMのサンプル
【0079】
【数17】
【0080】
の逆DCT変換。
【0081】
・2MS個のサンプルを生成するサイズMSのサンプル
【0082】
【数18】
【0083】
の逆DCT変換。最初のMS個のサンプルは、短いウィンドウの上昇部分を含む重複領域において、長さMSの共通する時間をサポートし、遷移ウィンドウFTAのサイズMの下降部分の逆DCT変換から生じるサンプルを有する。
・最初の半分について、遷移ウィンドウFTAおよび図1bに示すFTSの2つの合成ウィンドウによる乗算、および、次の半分について、短い合成ウィンドウFSによる乗算。
・重複領域にわたるこれらのウィンドウ化された構成要素の加算。時間サポートは初期のフレームTiの最後の部分に対応する。
従って、復号化器は、符号化器に従い、かつ、符号化器によって決定されるウィンドウの種類を信頼して適用する。
【0084】
この第1の例において、符号化器は、第1のフレーム(例えば、時間t=512とt=767の間にサンプルを有する、図2eにおけるフレーム1)のサンプルの到達の間に遷移を検出する。そして、符号化器は、現在のウィンドウが長い−短い遷移ウィンドウでなければならず、符号化され、送信され、復号化器にシグナリングされなければならないと決定することができる。そして、8個の短いウィンドウが、サンプルt=624とt=911の間に連続的に適用される。従って、遷移の時(t=720)において、復号化器は短いウィンドウを使用し、これは信号の向上した時間表現を可能とする。
【0085】
第2の例において、サンプルt=540において遷移が検出される。符号化器が最初のフレーム(例えば、図2eにおけるフレーム0)のサンプルを受信すると、遷移を検出せず、従って、長いウィンドウを選択する。次の続くフレーム(例えば、図2eにおけるフレーム1)のサンプルの到達の間に、符号化器は(時間t=540において)アタックを検出する。そして、この場合において、検出は遅過ぎて実行され、遷移ウィンドウの使用は、アタックの瞬間における短い時間サポート(短いウィンドウ)の使用から利益を得ることができない。そして、符号化器は短いウィンドウの使用を予想すべきであり、結果として、少なくともM/2個のサンプルに対応する追加の符号化遅延を挿入する。
【0086】
従って、知られた先行技術の欠点は、続くフレームの時間信号におけるアタックを検出し、従って、短いウィンドウに移行することを予想することを可能とするために、符号化器に追加の遅延を導入する必要があるという事実に存在することを理解すべきである。この“アタック”は、例えば、音声信号における破裂音のような高い強度の過渡信号、または、音楽シーケンスにおける打撃的な信号の出現に対応しうる。
【0087】
ある通信の応用において、過渡信号の検出のために必要とされる追加の遅延、および、遷移ウィンドウの使用は受け入れられない。従って、例えば、MPEG−4 AAC低遅延符号化器において、短いウィンドウは使用されず、長いウィンドウのみが許される。
【課題を解決するための手段】
【0088】
本発明は、上記の場合における向上を提供する。
【0089】
これは、追加の遅延の導入を必要としないウィンドウ間の遷移に関する。
【0090】
この目的のために、フレームの連続によって表現されるデジタルオーディオ信号の変換符号化/復号化の方法を提供し、ここで、
・異なるそれぞれの長さを有する少なくとも2つの重み付けウィンドウが与えられ、
・特定の事象が検出されたフレームを符号化するために短いウィンドウが使用される。
この特定の事象は、例えば、現在のフレームが含むデジタルオーディオ信号に存在する強いアタックのような非定常現象でありうる。
【0091】
より詳しくは、現在のフレームの符号化のために、この現在のフレームにおける特定の事象を検出することが求められ、
・少なくとも、現在のフレームの始めにおいて特定の事象が検出されると、現在のフレームを符号化するために短いウィンドウが使用され、
・一方、現在のフレームにおいて特定の事象が検出されないならば、現在のフレームを符号化するために長いフレームが適用される。
これらのステップは、続くフレームについて繰り返され、それによって、本発明により、長いウィンドウを使用して与えられたフレームを符号化し、かつ、先行技術におけるような遷移ウィンドウを使用することなく、直後に短いウィンドウを使用してこの与えられたフレームにすぐに続くフレームを符号化することを可能とする。
【0092】
長いウィンドウから短いウィンドウへの直接の移行を可能とすることによって、特定の事象の検出が符号化されるフレームに直接に実行され、先行技術におけるような続くフレームにはもはや実行されない。従って、本発明による方法によって実行される符号化は、先行技術の符号化と異なり、固定サイズのMDCT変換と比較して追加の遅延なしで実行される。
【0093】
本発明の他の特徴および効果は、以下の詳細な説明、および、先行技術に関して上述した図1、1a、1b、1c、2a、2b、2c、2d、2e以外の添付図面を検討して明らかになる。
【図面の簡単な説明】
【0094】
【図1】変換符号化器の構造を表わす図である。
【図1a】サンプルの符号化/復号化処理を表わす図である。
【図1b】サンプルの符号化/復号化処理を表わす図である。
【図1c】サンプルの符号化/復号化処理を表わす図である。
【図2a】サンプルの符号化/復号化処理を表わす図である。
【図2b】サンプルの符号化/復号化処理を表わす図である。
【図2c】サンプルの符号化/復号化処理を表わす図である。
【図2d】サンプルの符号化/復号化処理を表わす図である。
【図2e】サンプルの符号化/復号化処理を表わす図である。
【図3a】前述した図1bにおけるサンプルaおよびbの詳述が続く、本発明による符号化/復号化処理を表わす図である。
【図3b】前述した図1cにおけるサンプルeおよびfの詳述が続く、本発明による符号化/復号化処理を表わす図である。
【図4a】本発明の実装において実行される、復号化の補償のために使用される重み付け関数の変形例を表わす。
【図4b】本発明の実装において実行される、復号化の補償のために使用される重み付け関数の変形例を表わす。
【図5a】本発明による符号化器に適用することができる処理の例を表わす。
【図5b】本発明による復号化器に適用することができる処理の例を表わす。
【図6】符号化器および復号化器のそれぞれの構造、および、符号化において使用されるウィンドウの種類の情報の通信を表わす。
【図7】M=512個の成分および重複係数K=4を有するELT変換の場合のための長い合成ウィンドウを表わす。
【図8】重複を有する符号化の場合に過去のサンプルの影響を考慮する実施形態において(0とM/2−MS/2の間に含まれるnについての)重み付け関数w1,nおよびw2,nの態様を表わす。
【図9】この実施形態において(M/2−MS/2とM/2+MS/2の間に含まれるnについての)重み付け関数w’1,nおよびw’2,nの態様を表わす。
【図10】この実施形態において(M/2−MS/2とM/2+MS/2の間に含まれるnについての)重み付け関数w’3,nおよびw’4,nの態様を表わす。
【図11】図8に表わされている実施形態の変形において0とM/2+MS/2の間に含まれる全ての範囲のnにわたる重み付け関数w1,nおよびw2,nの態様を表わす。
【図12】この変形において0とM/2+MS/2の間に含まれる全ての範囲のnにわたる重み付け関数w3,nおよびw4,nの態様を表わす。
【発明を実施するための形態】
【0095】
本発明は、少なくとも長いウィンドウから短いウィンドウへの移行のために遷移ウィンドウの適用を防止することを可能とする。
【0096】
こうして、図2eを参照して前述した第2の例では、時間t=540において非定常現象または“アタック”が検出されると、本発明は、フレーム0(時間t=256から時間t=511まで広がるウィンドウ)のために長いウィンドウを使用することを提案する。そして、続くフレーム(t=512からt=767)のサンプルの取得およびt=540におけるアタックの検出の間に、符号化器は、時間t=368(t=512−M/2−MS/2に対応する。)から、時間t=655(t=512+M/2+MS/2−1に対応し、ここで、説明している例において、
・ 2*M=512は長いウィンドウのサイズ、
・ 2*MS=64は短いウィンドウのサイズ
である。)までのサンプルを符号化するために、先行技術に関して図1bおよび図1cに表わされた標準的な非対称遷移ウィンドウなしで、8個の短いウィンドウを使用する。
【0097】
そして、復号化器に関して、短いウィンドウを用いた符号化されたフレームの受信の間に、復号化器は次の処理を進める。
・現在のフレームのために短いウィンドウを使用しなければならないことを示す符号化器からの情報を受信する。
・符号化の間の長いウィンドウから短いウィンドウへの直接の遷移を補償するために効果的な処理を適用し、この処理の例は、図5bを参照して後に詳細に説明する。
【0098】
図3aおよび図3bは、一方で、長いウィンドウと短いウィンドウの間で重複しない領域内で見出されるサンプルaおよびb(図3a)、および、他方で、重複領域内で見出されるサンプルeおよびf(図3b)を得るための本発明による符号化/復号化方法を表わす。特に、この重複領域は、長いウィンドウFLの下降エッジ、および、最初の短いウィンドウFCの上昇エッジ、によって定義される。
【0099】
従って、図3aおよび図3bを参照して、符号化の間に、符号化されたフレームT’iを構成するために、フレームTi−1およびTiのサンプルが長い解析ウィンドウFLによって重み付けされ、続くフレームTiおよびTi+1のサンプルが、遷移ウィンドウを適用することなく、短い解析ウィンドウFCによって直接に重み付けされる。
【0100】
また、図3aおよび図3bを参照すると、最初の短い解析ウィンドウFCは、(図3bの例におけるサンプルeに先行するサンプルのための)短いウィンドウによって考慮されない値が先行することに留意すべきである。より詳しくは、この処理は、先行技術の符号化器/復号化器と同様に、符号化されるフレームT’i+1の最初のM/2−MS/2個のサンプルに適用される。一般に、先行技術と比較して、符号化の間に、および、同様に復号化の間に、実行される処理を可能な限り乱さないことが求められる。従って、例えば、符号化されるフレームT’i+1の最初のサンプルを無視する選択が行われる。
【0101】
もちろん、図3aおよび図3bにおいて、2つの短い(MS=M/2)解析ウィンドウFCの場合のみ表わした。それにもかかわらず、先行技術におけるように、いくつかの短いウィンドウの連続が与えられ、各々のウィンドウの連続は、符号FCが与えられた図3aおよび図3bに表わされている。
【0102】
直前のフレームT’iは長いウィンドウFLを用いて符号化される一方で、短いウィンドウFCを用いて符号化されるフレームT’i+1の復号化について、2つの実施形態を以下で説明する。
【0103】
第1の実施形態において、復号化の間に合成ウィンドウの使用は全くなしで済まされ、完全な復元の特性が保証されることを表わす。
【0104】
図3aにおいて、(長いウィンドウから直接に短いウィンドウへの)ウィンドウの変更を必要とするアタックの検出の間に、まず、短いウィンドウのみからのサンプルが合成される(図3aにおけるサンプルb)。そして、長い解析ウィンドウから計算された値v1において、前もって計算されたサンプルbの影響は補償される。サンプルaについて符号化の計算(符号化されたフレームT’i)が次のように実行される。
v1=a*h(M+n)+b*h(2*M−1−n)
【0105】
一方、異なる時間サポート(符号化されたフレームT’i+1)について、結合が続く短いウィンドウからの重み付け計算が実行されるとき、符号化値v2においてサンプルaは重み付けされず、短いウィンドウからの復元の後、
v2=b
を得る。
【0106】
好ましくは、本発明による符号化/復号化において完全な復元が検証される。実際、
a’=(v1−v2*h(2*M−1−n))/h(M+n)=a
【0107】
また、復号化の間に、(サンプルaのような)フレームの始めにおけるサンプルの決定の前に、値v2=bから導かれるサンプルおよび続くサンプルがまず決定されなければならないことに留意すべきである。従って、復号化の間に、時間の反転が実行される。
【0108】
図3bにおいて、長いウィンドウFL(下降エッジ)と最初の短いウィンドウFC(上昇エッジ)の間の遷移領域の符号化されたサンプルが、従って、サンプルeおよびfにおいて計算される。2つのウィンドウFLおよびFCの間のこの重複領域において、符号化された係数(または、以下、“値v1およびv2”)の表現が次式によって与えられる。
v1=e*h(M+n)+f*h(2*M−1−n)
v2=f*hS(MS−1−m)−e*hS(m)
【0109】
従って、サンプルeおよびfの値を見つけるために、復号化器において、2つの未知数を有するこの方程式を解かなければならない。
e=[v1*hS(MS−1−m)−v2*h(2*M−1−n)]/[h(M+n)*hS(MS−1−m)+hS(m)*h(2*M−1−n)]
f=[v1*hS(m)+v2*h(M+n)]/[hS(MS−1−m)*h(M+n)+h(2*h−1−n)*hS(m)]
また、完全な復元の特性を効果的に検証する数式が導き出され、m=n−M/2+MS/2を用いて、
e’=[v1*hS(MS+m)−v2*h(n)]/[h(M+n)*hS(MS+m)+h(2*M−1−n)*hS(m)]=e
f’=[v1*hS(2*MS−1−m)+v2*h(M−1−n)]/[h(M+n)*hS(MS+m)+h(2*M−1−n)*hS(m)]=f
【0110】
(図1cの下に表わされているようにv2が短いウィンドウhSによって重み付けされた)先行技術の規定とは対照的に、値v2が長いウィンドウhによって重み付けされることに留意すべきである。
【0111】
第2の実施形態において、復号化の間に合成ウィンドウが保持される。それらは、図3aおよび図3bに表わされ、長い合成ウィンドウについて符号FLS、短い合成ウィンドウについて符号FCSが付されているように、解析ウィンドウと同じ形態を有する(解析ウィンドウの同類または双対)。この第2の実施形態は、現状の技術の復号化処理、すなわち、長い解析ウィンドウを用いて符号化されたフレームを復号化するために長い合成ウィンドウを用いること、および、一連の短い解析ウィンドウを用いて符号化されたフレームを復号化するために一連の短い合成ウィンドウを用いることに従う利点を有する。
【0112】
一方、長い−短い遷移ウィンドウを用いて符号化されるべきとき、長いウィンドウを用いて符号化されたフレームを復号化するために“補償”によるこれらの合成ウィンドウの訂正が適用される。言い換えると、長いウィンドウから短いウィンドウへの直接の移行の影響を補償するために、直前のフレームT’iが長いウィンドウFLを用いることによって符号化される一方で、短いウィンドウFCを用いることによって符号化された現在のフレームT’i+1を復号化するために、符号化器において以下で説明する処理が用いられる。
【0113】
サンプルa、b、e、fを値v1およびv2に復号化および結合するための上述した数式は、以下のように、特に、時間の反転を実行する、重み付けされた2項の和の形に書き換えることができる。
【0114】
まず、最初の短い合成ウィンドウFCS内で、上述した重複領域の後の(典型的に、図3aの説明におけるサンプルv2=bおよび続くサンプルにおける)位置が採用される。短い合成ウィンドウFCSのみから、重複しないこの部分の復号化のために、符号化されたフレームT’i+1の“値”が、まず、v2=b(図3a)から復号化される。サンプルbおよび続くサンプルが復号化されると、続く2項の重み付けされた和が適用され、0≦n<M/2−MS/2について、
【0115】
【数19】
【0116】
であり、ここで、
【0117】
【数20】
【0118】
は、(符号化/復号化は完全な復元であるので、初期のサンプルxnに対応する)復号化されたサンプルを表わす。
記号
【0119】
【数21】
【0120】
は、訂正なしで長い合成ウィンドウFLSを使用して復号化(DCT−1逆変換の適用)されたサンプルに該当するものを示す。
snは、短い合成ウィンドウFCSの連続を用いて十分に復号化されたサンプル(典型的に、サンプルbおよび続くサンプル)を表わす。
【0121】
2つの重み付け関数w1,nおよびw2,nは、0≦n<M/2−MS/2について、
【0122】
【数22】
【0123】
および
【0124】
【数23】
【0125】
と表わされる。
【0126】
“サンプル”
【0127】
【数24】
【0128】
は、長い合成ウィンドウを使用することによる合成および重み付けによって不完全に復号化された実際の値であることを理解すべきである。典型的に、これは、ウィンドウFLSの係数h(M+n)によって乗算される、図3aにおける値v1に関し、サンプルaのようなフレームTiの始めからのサンプルも含まれる。
【0129】
また、サンプルbおよび続くサンプルがここでまず決定され、上記の数式において“sM−1−n”と表わされ、従って、この第2の実施形態における復号化処理によって提案される時間の反転を表わすことに留意すべきである。
【0130】
また、(h(M+n)による除算のために)項w1,nが存在しないので、長い合成ウィンドウFLSによって実行される重み付けが防止されることに留意すべきである。
【0131】
さらに、図3bにおけるサンプルeおよびfの領域に対応する、長いウィンドウFL(下降エッジ)および最初の短いウィンドウFC(上昇エッジ)の両方によって覆われる部分のサンプルの復元のために、好ましくは、2つの重み付けされた項の次の結合が適用される。
【0132】
【数25】
【0133】
ここで、m=n−M/2+MS/2、M/2−MS/2≦n<M/2+MS/2である。
上述したように、項
【0134】
【数26】
【0135】
は、長い合成ウィンドウFLSによる合成および重み付けによって不完全に復元された値を構成し、項
【0136】
【数27】
【0137】
は、最初の短い合成ウィンドウFCSの上昇エッジから不完全に復元された値を表わす。
【0138】
ここで、重み付け関数w’1,nおよびw’2,nは、次式で与えられる。
【0139】
【数28】
【0140】
および
【0141】
【数29】
【0142】
これら全ての重み付け関数w1,n、w2,n、w’1,n、w’2,nは、長いおよび短いウィンドウのみに依存する固定した要素によって構成される。そのような重み付け関数の変形例は、図4aおよび図4bに表わされている。効果的な実施形態において、これらの関数がとる値は、事前に計算し(一覧表にし)、最終的に本発明による復号化器のメモリに記憶させることができる。
【0143】
こうして、図5bを参照すると、一実施形態において、長い解析ウィンドウから短い解析ウィンドウに直接に移行するときに、符号化されたフレームT’iの復号化の間の処理は次のステップを含みうる。フレームT’i(ステップ60)を復号化するために、まず、フレームの終わりの値v2=bを復号化する(ステップ63)ために、短い合成ウィンドウが適用される(ステップ61)。ここで、bを決定するために、続く符号化されたフレームT’i+1に依存する(ステップ62)。そして、関係式
【0144】
【数30】
【0145】
を用いて(ステップ67)、および、事前に計算され一覧表にされた重み付け値w1,nおよびw2,nを用いて(ステップ66)、0とM/2−MS/2の間の含まれる任意のnについて補償を適用することによって、フレームT’iの始めにおけるサンプルを復号化する(ステップ65)ために、長い合成ウィンドウ(ステップ64)が適用される。
【0146】
(eとfの間の)符号化されたフレームT’iの“中央”の領域の復号化、従って、M/2−MS/2とM/2+MS/2の間に含まれるnについての復号化は、短いおよび長い合成ウィンドウの両方を使用して(ステップ68)、および、特に、事前に計算され一覧表にされた重み付け値w’1,nおよびw’2,nを用いて(ステップ70)、m=n−M/2+MS/2である関係式
【0147】
【数31】
【0148】
による補償を適用することによって(ステップ69)、同様に実行することができる(図5bにおける“+”の符号)。最後に、この処理から、初期のフレームTiの全ての種類のサンプルa、b、e、fについての値が導き出される(ステップ71)。
【0149】
上述した第1および第2の実施形態は、長い解析ウィンドウから短い解析ウィンドウに直接に移行することによって符号化されたフレームT’iの復号化の間に、完全な復元を保証し、そして、符号化の間に、長いウィンドウから短いウィンドウに直接に移行することを効果的に可能とする。
【0150】
ここで、図5aを参照して、少なくとも、ある場合において、長い−短い遷移ウィンドウの符号化の間の適用なしで済ませることを提案する実施形態を説明する。
【0151】
フレームTiを受信すると(ステップ50)、このフレームTiにおいて直接に存在するデジタルオーディオ信号の中にアタックATTのような非定常現象の存在が探し出される。この種類の現象が検出されない限り(判定51の出力における矢印n)、このフレームTiの符号化のために、長いウィンドウの適用(ステップ52)が継続する。そうでないならば(判定51の出力における矢印y)、現在のフレームTiの始め(例えば、最初の半分)において事象ATTが存在するかどうか判定することが求められ(判定53)、この場合(判定53の出力における矢印y)、フレームTiの符号化(ステップ56)のために、短いウィンドウ、より正確には、一連の短いウィンドウが直接に適用される(ステップ54)。そして、この実施形態は、遷移ウィンドウを防止し、短いウィンドウを適用するために続くフレームTi+1を待たないことを可能とする。
【0152】
従って、現状の技術とは反対に、続くフレームTi+1ではなく、符号化されるフレームTi内に直接に、非定常現象のような特定の事象を検出することが可能であることを理解すべきである。そして、本発明による符号化遅延は、先行技術のものと比較して低減される。実際、現在のフレームの始めにおいて非定常現象が検出されるならば、短いウィンドウが直接に適用されるが、先行技術においては、Tiを符号化する間のフレームに遷移ウィンドウを適用することができるように、続くフレームTi+1において非定常現象を検出することが必要であった。
【0153】
再び図5aを参照すると、現在のフレームTiの終わり(例えば、後半)において非定常現象が検出されるならば(判定53の出力における矢印n)、短いウィンドウの連続を適用する前に、現在のフレームTiを符号化する(ステップ56)ために、遷移ウィンドウを適用する(ステップ55)ことを効果的に選択することが可能である。この実施形態は、特に、低減した符号化遅延を保証する一方で、現状の技術の処理に等価な処理を提案することを可能とする。
【0154】
従って、全体として、この実施形態において少なくとも3つの重み付けウィンドウ
・短いウィンドウ、
・長いウィンドウ、
・長いウィンドウの使用から短いウィンドウの使用に移行するための遷移ウィンドウ、
が与えられ、現在のフレームの終わりにおいて非定常現象のような特定の事象が検出されるならば(ステップ53)、現在のフレーム(Ti)を符号化する(ステップ56)ために遷移ウィンドウ(ステップ55)が適用される。
【0155】
この実施形態の変形において、長いウィンドウの使用から短いウィンドウの使用に移行するために、次を与えることができる。
・現在のフレームTiについて、長いウィンドウFLの使用。
・直後のフレームTi+1について、現在のフレームの終わりにおいて特定の事象が検出されても、遷移ウィンドウを使用しない、短いウィンドウFCの直接の使用。
【0156】
この変形は次の利点を有する。符号化器は、ウィンドウの種類の変更についての情報を復号化器に送信しなければならないとき、この情報は、もはや短いウィンドウと遷移ウィンドウの間の選択を復号化器に通知する必要がないので、単一のビットに符号化することができる。
【0157】
それにもかかわらず、短いウィンドウから長いウィンドウに移行するために、特に、長いウィンドウから短いウィンドウに移行する情報の受信に従い、単一のビットへのウィンドウの種類の変更についての情報の送信を保証し続けるために、遷移ウィンドウを保持することができ、復号化器は、この目的のために、
・短いウィンドウを使用し、
・そして、ウィンドウの種類の変更の情報を受信しないとき、短いウィンドウから長いウィンドウへの遷移ウィンドウを使用し、
・そして、最後に、長いウィンドウを使用することができる。
【0158】
符号化器10から復号化器20への、符号化の間に使用されるウィンドウの種類の情報の通信が図6に表わされている。符号化器10は、符号化の間にフレームTiに含まれる信号において強いアタックのような特定の事象の検出モジュール11を備え、この検出から使用するウィンドウの種類を導き出すことに留意すべきである。この目的のために、モジュール12は、使用するウィンドウの種類を選択し、モジュール12によって選択された解析ウィンドウFAを用いて符号化されたフレームT’iを送出する符号化モジュール13にこの情報を送信する。符号化されたフレームT’iは、符号化の間に使用されるウィンドウの種類についての情報INFとともに、(通常、単一のデータフローで)復号化器20に送信される。復号化器20は、符号化器10から受信した情報INFに従って合成ウィンドウFSを選択するモジュール22を備え、モジュール23は、復号化されたフレーム
【0159】
【数32】
【0160】
を送出するために、フレームT’iの復号化を適用する。
【0161】
また、本発明は、本発明による方法を実現するための、より詳しくは、図5aに表わされている処理、または、前述したその変形(単一のビットにおけるウィンドウの種類の変更の情報の送信)を実現するための、図6における符号化器10のような符号化器に関する。
【0162】
また、本発明は、そのような符号化器のメモリ内に記憶され、符号化器のプロセッサによって実行されるとき、そのような処理またはその変形を実現するための命令を含むコンピュータプログラムに関する。この目的のために、図5aは、そのようなプログラムのフローチャートを表現しうる。
【0163】
上記の第2の実施形態に従って、符号化器10は解析ウィンドウFAを使用し、復号化器20は合成ウィンドウを使用し、これらの合成ウィンドウは、それにもかかわらず、(重み付け関数w1,n、w2,n、w’1,n、w’2,nを使用して)前述した補償による訂正を進めることによって、解析ウィンドウFAに対応するものであることに留意すべきである。
【0164】
また、本発明は、図6に表わされている復号化器20のような変換復号化器のメモリ内に記憶され、この復号化器20のプロセッサによって実行されるとき、第1の実施形態、または、図5bを参照して上述した第2の実施形態に従う復号化の実現のための命令を含むもう1つのコンピュータプログラムに関する。この目的のために、図5bは、そのようなプログラムのフローチャートを表現しうる。
【0165】
また、本発明は、変換復号化器それ自身に関し、復号化のためのコンピュータプログラムの命令を記憶するメモリを備える。
【0166】
包括的な用語では、それぞれ異なる長さの、少なくとも2つの種類の重み付け関数を使用して符号化されたフレームの連続によって表現される信号の本発明による変換復号化方法は、次のように実行される。
【0167】
長いウィンドウから短いウィンドウに移行するための情報を受信した場合、短い解析ウィンドウFCを使用して符号化された、与えられたフレームT’i+1に、1つの種類の短い合成ウィンドウFCSを使用した復号化から(種類bの)サンプルが決定される。
1つの種類の長い解析ウィンドウFLを使用して符号化された、与えられたフレームに先行するフレームT’iを部分的に復号化し(逆変換DCT−1の適用)、かつ、
一覧表にされ、かつ、復号化器のメモリ内に記憶された重み付け関数を用いて2つの重み付けされた項を結合することによって他のサンプルが得られる。
【0168】
上記の第2の実施形態において、w1,n、w2,n、w’1,n、w’2,nと示された関数が含まれる。
【0169】
しかし、この包括的な復号化処理は、第1および第2の実施形態の2つの場合に適用される。
【0170】
第2の実施形態において、
・まず、与えられたフレーム(T’i+1)からサンプル(b)が決定され(図5bのステップ63)、
・時間的に前のフレーム(T’i)の始めに対応するサンプル(a)が導き出され(ステップ65〜67)、これらは長い合成ウィンドウFLSを使用した復号化から生じ、第2の実施形態に属す。
【0171】
この場合において、
・M個のサンプルを含むフレーム、
・2M個のサンプルを含む長いウィンドウ、
・MSはMより小さい、2MS個のサンプルを含む短いウィンドウについて、
n=0は復号化されるフレームの始めに対応し、0と(M/2−MS/2)の間に含まれるnについて、サンプル
【0172】
【数33】
【0173】
は、
【0174】
【数34】
【0175】
の形の2つの重み付けされた項の結合によって与えられ、ここで、
【0176】
【数35】
【0177】
は、前のフレームT’iから生じる値(v1)であり、
sM−1−nは、与えられたフレームT’i+1に適用される短い合成ウィンドウを使用して既に復号化されたサンプル(b)であり、
w1,nおよびw2,nは、nの関数としてとる値が一覧表にされ、かつ、復号化器のメモリ内に記憶されうる重み付け関数である。
【0178】
あるいは、(M/2−MS/2)と(M/2+MS/2)の間に含まれるnについて、サンプル
【0179】
【数36】
【0180】
は、
【0181】
【数37】
【0182】
の形の2つの重み付けされた項の結合によって与えられ、ここで、m=n−M/2+MS/2であり、
【0183】
【数38】
【0184】
は、前のフレームT’iから生じる値v1であり、
【0185】
【数39】
【0186】
は、与えられたフレームT’i+1から生じる値v2であり、
w’1,nおよびw’2,nは、nの関数としてとる値が一覧表にされ、かつ、復号化器のメモリ内に記憶されうる重み付け関数である。
【0187】
従って、本発明は、変換の完全な復元の特性を保持する一方で、先行技術と比較して低減した遅延を有するウィンドウ間の遷移を提供することを可能とする。この方法は、全ての種類のウィンドウ(非対称なウィンドウ、および、異なる解析および合成ウィンドウ)を用いて、異なる変換およびフィルタバンクのために適用することができる。
【0188】
長いウィンドウからより小さいサイズのウィンドウへの遷移の場合において上述した補償処理は、短いウィンドウからより大きいサイズのウィンドウへの遷移の場合に、自然に、かつ、同様に、拡張される。この場合において、短い−長い遷移ウィンドウの不存在は、上述した場合と同様の重み付けによって復号化器において補償することができる。
【0189】
そして、本発明は任意の変換符号化、特に、MPEG−4“AAC−低遅延”標準におけるような対話的な従来の応用のために提供される変換符号化だけでなく、MDCT変換と異なる変換、特に、上述したELT(Extended Lapped Transform)およびそれらの双直交の拡張に適用することができる。
【0190】
しかし、特に、ELT型の変換の場合に、変調(v1)による時間畳み込みの項は、過去に生じた時間畳み込みの項と結合されうることが認められる。従って、上述した訂正処理は、将来のサンプルに影響する現象(または“折り返し歪み(aliasing)”)を考慮する。一方、また、以下で示す詳述は、少なくとも量子化の不存在において、完全な復元を得るように、過去の成分を除去するために、過去の成分を考慮する。従って、合成された過去の信号と結合して、時間畳み込みの項なしで済ませることを可能とする追加の重み付け関数をここで定義することを提案する。
【0191】
以下でELT変換の一例として文献:Gerald D. T. Schuller、Tanja Karp、“Modulated Filter Banks with Arbitrary System Delay: Efficient Implementations and the Time-Varying Case”、IEEE Transactions on Signal Processing、2000年3月、第48巻、第3号の記載を参照する。
【0192】
本発明の枠組みの中での続く実施形態は、(例えば、2048個のサンプルを有する)長いウィンドウと(例えば、128個のサンプルを有する)短いウィンドウの間の遷移なしで移行することを提案する。
【0193】
<長いウィンドウ(K=4、M=512)を用いた変換>
これは低遅延の変換であり、そのウィンドウはK・M=2048のサイズを有し、その解析は、0≦k≦M−1について、
【0194】
【数40】
【0195】
の形で表わされる。
Mは得られたスペクトル成分の数であり、
【0196】
【数41】
【0197】
は、−2M≦n≦2M−1について、ウィンドウ化された入力信号の表記であり、
【0198】
【数42】
【0199】
は長い合成ウィンドウの表記である。
【0200】
図7は、M=512個の成分および重複係数K=4を有するELT変換の場合についての長い合成ウィンドウを表わす。
【0201】
逆変換は、0≦n≦4M−1について、
【0202】
【数43】
【0203】
と表わされ、復元される信号xn+tMは、4つの要素(K=4)の復元する加算
xn+tM=zt,n+zt−1,n+M+zt−2,n+2M+zt−3,n+3M
によって得られ、ここで、0≦n≦M−1、および、
【0204】
【数44】
【0205】
である。
【0206】
合成ウィンドウは、0≦n≦4M−1について、
【0207】
【数45】
【0208】
として定義され、一方、解析ウィンドウは、サンプルの順序の反転、すなわち、0≦n≦4M−1について、
【0209】
【数46】
【0210】
によって合成ウィンドウから定義されることに留意すべきである。
【0211】
<短いウィンドウ(K=2、MS=64)を用いた変換>
短いウィンドウの場合に、解析変換は、0≦k≦MS−1について、
【0212】
【数47】
【0213】
の形に表わされ、ここで、ウィンドウ化された入力信号として、0≦n≦2MS−1について、
【0214】
【数48】
【0215】
であり、短い合成ウィンドウとしてwS(n)である。
逆変換は、0≦n≦2MS−1について、
【0216】
【数49】
【0217】
であり、復元される信号xn+tMは、2つの要素(KS=2)の復元する加算によって得られ、0≦n≦M−1について、
【0218】
【数50】
【0219】
および
【0220】
【数51】
である。
【0221】
この表記において、tは短いフレームのインデックスであり、解析および合成ウィンドウは同一であり、それらは対称であるので、0≦n<2MSについて、
【0222】
【数52】
【0223】
である。
【0224】
<重み付け関数の数式>
この実施形態において、
・M個のサンプルを含むフレーム、
・4M個のサンプルを含む長いウィンドウ、
・MSはMより小さい、2MS個のサンプルを含む短いウィンドウについて、
0と(M/2−MS/2)の間に含まれるn(n=0は復号化の処理においてフレームの始めに対応する)について、サンプル
【0225】
【数53】
【0226】
は、0≦n≦M/2−MS/2について、
【0227】
【数54】
【0228】
の形の4つの重み付けされた項の結合によって与えられ、ここで、
【0229】
【数55】
【0230】
は、(符号化/復号化が完全な復元であるならば、初期のサンプルxnに対応する)復号化されたサンプルを表わす。
表記
【0231】
【数56】
【0232】
は、フレームT’iを訂正することなく、先行する計算要素zt−1,n+2M+zt−2,n+3Mに加算して、長い合成ウィンドウを使用して、与えられたフレーム(T’i+1)に先行するフレーム(T’i)の不完全に復号化されたサンプル(逆変換の適用)に対応することを示す。
snは、(M/2+MS/2≦n<Mであるようなインデックスnのサンプルについて)フレームT’i+1の短い合成ウィンドウFCSの連続を使用して完全に復号化されたサンプル、および、前のフレームの完全に復号化されたサンプル(0≦n<Mについてsn−2Mと表わされ、{s−2M,s−2M+1,...,s−M−1}に等しい。)を表わす。
w1,n、w2,n、w3,n、w4,nは、nの関数としてとる値が一覧表にされ、かつ、復号化器のメモリ内に記憶され、または、長いおよび短い解析および合成ウィンドウの関数として計算されうる重み付け関数である。
【0233】
好ましくは、特に、完全な復元を保証するために、重み付け関数として次式を選択することができる。0≦n<M/2−MS/2について、
【0234】
【数57】
【0235】
w1,nおよびw2,nの形式は、MDCT変換の場合に前述したものと少し異なることに留意すべきである。実際、フィルタはもはや対称でなく(h2の項が消えている)、変調の項が変更され、これは符号の変更を説明する。
【0236】
そして、この実施形態において、M/2−MS/2とM/2+MS/2の間に含まれるnについて、サンプル
【0237】
【数58】
【0238】
は、
【0239】
【数59】
【0240】
の形の4つの重み付けされた項の結合によって与えられ、ここで、m=n−M/2+MS/2、かつ、M/2−MS/2≦n<M/2+MS/2である。
同じ表記に従い、
【0241】
【数60】
【0242】
は、与えられたフレームT’i+1に先行するフレームT’iの不完全に復号化されたサンプルである。
【0243】
【数61】
【0244】
は、与えられたフレームT’i+1の最初の短いウィンドウの不完全に復号化されたサンプルである。
snは、前のフレーム(T’i−1,T’i−2,...)において完全に復号化されたサンプルを表わす。
w’1,n、w’2,n、w’3,n、w’4,nは、nの関数としてとる値が一覧表にされ、かつ、復号化器のメモリ内に記憶され、または、長いおよび短い解析および合成ウィンドウの関数として計算されうる重み付け関数である。
好ましくは、完全な復元を保証するために、次式
【0245】
【数62】
【0246】
に従って重み付け関数を選択することができ、ここで、M/2−MS/2≦n<M/2+MS/2、m=n−M/2+MS/2である。
【0247】
従って、この実施形態において、長いウィンドウと短いウィンドウの間での遷移の間に、信号は、
・短いウィンドウから復元されたサンプルの重み付けされたもの、
・長いウィンドウから部分的に復元されたサンプルの重み付けされたもの(計算の項zt−1,n+2M+zt−2,n+3Mの部分)、
・過去の合成された信号のサンプルの結合の重み付けされたもの、
の結合から復元される。
【0248】
この実施形態の変形において、関数w’3,nおよびw’4,nは大きく異ならないことに留意すべきである。項h(4M−1−n)およびh(3M+n)のみがそれらの数式において異なる。一実施形態は、例えば、項h(4M−1−n)sn−2M+h(3M+n)s−M−1−nを用意し、そして、
【0249】
【数63】
【0250】
によって表現される関数による結果を重み付けすることからなり、従って、これは項h(4M−1−n)およびh(3M+n)の寄与が除かれた関数w’3,nおよびw’4,nに対応する。
【0251】
これと同じ原理が同様にw3,nおよびw4,nに適用される。
【0252】
もう1つの変形において、合成の計算が重み付けされる。好ましくは、長いウィンドウから不完全に復元されたサンプルが、重み付けされた計算zt−1,n+2M+zt−2,n+3Mに加算されるように、合成の計算のこの重み付けをゼロに設定することができる。この場合において、過去に合成された信号に適用される重み付けは異なりうる。
【0253】
前述した実施形態において得られる重み付け関数wおよびw’の特性の形態は、図9および図10に表わされている。特に、これらのグラフのy軸の値を参照すると、図10に表わされている関数w’3,nおよびw’4,nは、図9に表わされている関数w’1,nおよびw’2,nに関して(とる値を考慮して)無視できることが分かる。従って、関数w’3,nおよびw’4,nが含まれる項は、信号
【0254】
【数64】
【0255】
の復元に関して上記で与えられた合計
【0256】
【数65】
【0257】
において省略することができる。この省略は低い復元のエラーに導く。
【0258】
また、より大きい処理の簡単さを意図する変形において、w’3,nおよびw’4,nはたいへん類似していることが分かる。従って、時間の計算における利得を達成するために、これらの2つの関数の重み付けの結合のみ、例えば、2つの関数の平均を使用するために提供することができる。
【0259】
(重み付け関数w1,nおよびw2,nの態様を表わす)図8および(重み付け関数w3,nおよびw4,nの態様を表わす)図12における比較は、関数w1,nおよびw2,nに関して関数w3,nおよびw4,nのために同じ言及を引き起こす。
【0260】
従って、
【0261】
【数66】
【0262】
の前述の数式を簡単にすることを可能とする。
・関数w3,nおよびw4,nによる重み付けが省略されるならば、
【0263】
【数67】
【0264】
・または、例えば、
【0265】
【数68】
【0266】
、または、緩やかな復元のエラーに導くこれら2つの関数の任意の他の線形結合を用いて、
【0267】
【数69】
【0268】
関数w3,nおよびw4,nによる重み付けの省略が信号より下の84dBの電力を有する復元のエラーに導き、単純な線形結合(例えば、これらの関数の平均)の使用それ自体が信号より下の96dBのエラーに導くことを留意すべきであり、これら両方の場合においてオーディオの応用のために既にたいへん十分である。完全な復元は、実際、通常、信号より下の120から130dBのエラー電力を測定することを可能とすることに留意すべきである。
【0269】
さらに、重み付け[1]において、もはや計算の項sn−2Mおよびs−M−1−nを使用しないことは、過去からの量子化ノイズの拡散を防止することを可能とする。従って、量子化が存在しない不完全な復元が、信号が良好に符号化されるとき量子化ノイズの制限のために差し替えられる。
【0270】
また、時間サポート0−128(図8および図12)において、重み付け関数は特定の形
【0271】
【数70】
【0272】
を有することに留意すべきである。
説明した例において、0と128の間にゼロの大きさを有する最初の部分を含むウィンドウh(n)(図7)の形式によってこの観察が説明される。従って、この例において、複雑さのために、最初の復元を2つのフェーズ、0≦n<128について、
【0273】
【数71】
【0274】
および、128≦n<M/2−MS/2=224について、
【0275】
【数72】
【0276】
に細分化することが好ましい。
【0277】
効果的なアルゴリズム構造を有する一実施形態において、一方で、重み付け関数w1,nおよびw2,n(図11)、および、他方で、w3,nおよびw4,n(図12)は、ここで開示されたように、0から(M+MS)/2の全体の間隔にわたって定義することができる。
【0278】
最初のステップにおいて、復元される信号
【0279】
【数73】
【0280】
の(
【0281】
【数74】
【0282】
と示す)主要な数式の計算は、0から(M+MS)/2まで、次のように行われる。
【0283】
【数75】
【0284】
(これは、この同じ範囲にわたって計算され、図12に表わされている関数w3,nおよびw4,nとともに、図11において0とM/2+MS/2の間に含まれるnの全体の範囲にわたって表わされている関数w1,nの計算に導く。)
【0285】
そして、(n=0は復号化の処理においてフレームの始めに対応する)0とM/2−MS/2の間に含まれるnについて、
【0286】
【数76】
【0287】
とし、ここで、w2,nは、図11においてw2,nと示す曲線の始め(x軸における224の前)に対応し、M/2−MS/2とM/2+MS/2の間に含まれるnについて、
【0288】
【数77】
【0289】
とし、m=n−M/2+MS/2、および、M/2−MS/2≦n<M/2+MS/2であり、ここで、w’2,nは、図11においてw2,nと示す曲線の終わり(x軸における224の後)に対応する。
【0290】
関数w2,nおよびw’2,nによって重み付けするための特定の処理の特徴を以下で説明する。
各々の関数w1,n、w3,n、w4,nについて、0とM/2+MS/2の間の1つのみの変化を用いることが可能である。他方、関数w2,nおよびw’2,nについて、
・関数w2,nは完全に復号化されたサンプルを重み付けし、
・一方、関数w’2,nは不完全に復号化されたサンプルを重み付けする。
さらに、処理の“時間の反転”は、重み付けw2,nについてのみに示し(−nによるsのインデックス)、重み付けw’2,nについては示さない。
【0291】
従って、(重複K>2である)長いウィンドウから(重複K’<Kである)短いウィンドウへの遷移の間のサンプルの完全な復号化のために過去のサンプルの影響を低減させることを可能とするこの詳述を包括的な用語で要約すると、復号化されたサンプルは、過去の合成信号を含む少なくとも2つの重み付けされた項の結合によって得られる。
【符号の説明】
【0292】
10 ・・・符号化器
20 ・・・復号化器
【特許請求の範囲】
【請求項1】
それぞれ異なる長さを有する少なくとも2つの種類の重み付けウィンドウを使用して符号化されたフレームの連続によって表現される信号の変換復号化のための方法であって、
長いウィンドウから短いウィンドウに移行するための情報を受信した場合に、
短い解析ウィンドウを使用して符号化された、与えられたフレーム(T’i+1)に、1つの種類の短い合成ウィンドウ(61)を使用した復号化からサンプル(b)を決定し(63)、
前記与えられたフレームに先行し、かつ、1つの種類の長い解析ウィンドウを使用して符号化されたフレーム(T’i)を部分的に復号化し(DCT−1)、かつ、
一覧表にされ、かつ、復号化器のメモリ内に記憶された重み付け関数(w1,n,w2,n;w’1,n,w’2,n)を用いて少なくとも2つの重み付けされた項を結合して他のサンプルを得る(67,69)ことを特徴とする方法。
【請求項2】
前記与えられたフレーム(T’i+1)から生じるサンプル(b)がまず決定され(63)、
該サンプルから時間的に前のフレーム(T’i)の始めに対応するサンプル(a)が導き出され(65〜67)、該サンプルは長い合成ウィンドウを使用した復号化から生じることを特徴とする請求項1に記載の方法。
【請求項3】
フレームはM個のサンプルを含み、
長いウィンドウは2M個のサンプルを含み、
短いウィンドウは2MS個のサンプルを含み、MSはMより小さく、
サンプル
【数1】
は、n=0が復号化の処理においてフレームの始めに対応し、0と(M/2−MS/2)の間に含まれるnについて、
【数2】
の形の2つの重み付けされた項の結合によって与えられ、ここで、
【数3】
は、前のフレーム(T’i)から生じる値(v1)であり、
sM−1−nは、前記与えられたフレーム(T’i+1)に適用される短い合成ウィンドウを使用して既に復号化されたサンプル(b)であり、
w1,nおよびw2,nは、nの関数としての値が一覧表にされ、かつ、復号化器のメモリ内に記憶された重み付け関数であることを特徴とする請求項2に記載の方法。
【請求項4】
フレームはM個のサンプルを含み、
長いウィンドウは2M個のサンプルを含み、
短いウィンドウは2MS個のサンプルを含み、MSはMより小さく、
サンプル
【数4】
は、n=0が復号化の処理においてフレームの始めに対応し、(M/2−MS/2)と(M/2+MS/2)の間に含まれるnについて、
【数5】
の形の2つの重み付けされた項の結合によって与えられ、ここで、m=n−M/2+MS/2であり、
【数6】
は、前のフレーム(T’i)から生じる値(v1)であり、
【数7】
は、前記与えられたフレーム(T’i+1)から生じる値(v2)であり、
w’1,nおよびw’2,nは、nの関数としての値が一覧表にされ、かつ、復号化器のメモリ内に記憶された重み付け関数であることを特徴とする請求項1から3のいずれか1項に記載の方法。
【請求項5】
過去のサンプルの影響を低減させるために、重複変換符号化によって符号化されたフレームを復号化するために、復号化される信号は、
短いウィンドウから復元されたサンプルの重み付け、
長いウィンドウから部分的に復元されたサンプルの重み付け、
過去の復号化された信号のサンプルの重み付け、
の結合から復元されることを特徴とする請求項1から4のいずれか1項に記載の方法。
【請求項6】
M個のサンプルを含むフレーム、
4M個のサンプルを含む長いウィンドウ、
MSがMより小さい、2MS個のサンプルを含む短いウィンドウを用いて、
n=0が復号化の処理においてフレームの始めに対応し、0とM/2−MS/2の間に含まれるサンプルのインデックスnについて、復号化されるサンプル
【数8】
は、0≦n<M/2−MS/2について、
【数9】
の形の4つの重み付けされた項の結合によって生成され、
表記
【数10】
は、zt−1,n+2M+zt−2,n+3Mと示す先行する計算要素への訂正なしで加算して、長い合成ウィンドウを使用して、前記与えられたフレーム(T’i+1)に先行するフレーム(T’i)の不完全に復号化されたサンプルを示し、インデックスtはフレームのインデックスであり、
snは、M/2+MS/2≦n<Mについて、前記与えられたフレーム(T’i+1)の短い合成ウィンドウ(FCS)の連続を使用して完全に復号化されたサンプル、および、−2M≦n<Mについて、前のフレーム(T’i,T’i−1,T’i−2...)の完全に復号化されたサンプルを表わし、
w1,n,w2,n,w3,n,w4,nは、それぞれ、サンプルのインデックスnに依存する第1、第2、第3、第4の重み付け関数であり、nの関数として少なくとも第1および第2の重み付け関数w1,nおよびw2,nがとる値は一覧表にされ、かつ、復号化器のメモリ内に記憶されることを特徴とする請求項5に記載の方法。
【請求項7】
M個のサンプルを含むフレーム、
4M個のサンプルを含む長いウィンドウ、
MSがMより小さい、2MS個のサンプルを含む短いウィンドウを用いて、
M/2−MS/2とM/2+MS/2の間に含まれるnについて、復号化されるサンプル
【数11】
は、
【数12】
の形の4つの重み付けされた項の結合によって与えられ、
【数13】
は、前記与えられたフレーム(T’i+1)に先行するフレーム(T’i)の不完全に復号化されたサンプルであり、
【数14】
は、m=n−M/2+MS/2であり、前記与えられたフレーム(T’i+1)の最初の短いウィンドウの不完全に復号化されたサンプルであり、
snは、前のフレーム(T’i,T’i−1,T’i−2...)の完全に復号化されたサンプルを表わし、
w’1,n,w’2,n,w’3,n,w’4,nは、それぞれ、nに依存する第1、第2、第3、第4の重み付け関数であり、nの関数として少なくとも第1および第2の重み付け関数w’1,nおよびw’2,nがとる値は一覧表にされ、かつ、復号化器のメモリ内に記憶されることを特徴とする請求項5または6に記載の方法。
【請求項8】
nの関数として前記第1および第2の重み付け関数(w1,n,w2,n;w’1,n,w’2,n)がとる値のみが一覧表にされ、かつ、復号化器のメモリ内に記憶され、サンプル
【数15】
の計算において前記第3および第4の重み付け関数(w3,n,w4,n;w’3,n,w’4,n)の寄与は無視されることを特徴とする請求項6または7に記載の方法。
【請求項9】
前記第3および第4の重み付け関数(w3,n,w4,n;w’3,n,w’4,n)は、前記第3および第4の重み付け関数(w3,n,w4,n;w’3,n,w’4,n)の線形結合の結果である単一の重み付け関数(w3−4,n;w’3−4,n)によって与えられ、nの関数として前記単一の重み付け関数(w3−4,n;w’3−4,n)がとる値とともに、前記第1および第2の重み付け関数(w1,n,w2,n;w’1,n,w’2,n)がとる値のみが一覧表にされ、かつ、復号化器のメモリ内に記憶されることを特徴とする請求項6または7に記載の方法。
【請求項10】
0から(M+MS)/2までのnについて、
【数16】
の形の重み付けされた結合に従って、復号化される信号
【数17】
の主要な数式
【数18】
が計算され、
n=0が復号化の処理においてフレームの始めに対応し、0とM/2−MS/2の間に含まれるnについて、
【数19】
とし、
M/2−MS/2とM/2+MS/2の間に含まれるnについて、
【数20】
とし、m=n−M/2+MS/2であることを特徴とする請求項6および7に記載の方法。
【請求項11】
それぞれ異なる長さを有する少なくとも2つの種類の重み付けウィンドウを使用する符号化器から生じるフレームの連続によって表現される信号の変換復号化器であって、
長いウィンドウから短いウィンドウに移行するための情報を受信する手段と、
短い解析ウィンドウを使用して符号化された、与えられたフレーム(T’i+1)に、1つの種類の短い合成ウィンドウ(61)を使用した復号化からサンプル(b)を決定する手段と、
前記与えられたフレームに先行し、かつ、1つの種類の長い解析ウィンドウを使用して符号化されたフレーム(T’i)を部分的に復号化し(DCT−1)、かつ、
一覧表にされ、かつ、復号化器のメモリ内に記憶された重み付け関数(w1,n,w2,n;w’1,n,w’2,n)を用いて少なくとも2つの重み付けされた項を結合して他のサンプルを得る(67,69)手段と、
を備えることを特徴とする変換復号化器。
【請求項12】
変換復号化器のメモリ内に記憶されるコンピュータプログラムであって、
前記変換復号化器のプロセッサによって実行されるとき、請求項1から10のいずれか1項に記載の方法を実現するための命令を含むことを特徴とするコンピュータプログラム。
【請求項13】
請求項12に記載のコンピュータプログラムの命令を記憶するメモリを備えることを特徴とする変換復号化器。
【請求項1】
それぞれ異なる長さを有する少なくとも2つの種類の重み付けウィンドウを使用して符号化されたフレームの連続によって表現される信号の変換復号化のための方法であって、
長いウィンドウから短いウィンドウに移行するための情報を受信した場合に、
短い解析ウィンドウを使用して符号化された、与えられたフレーム(T’i+1)に、1つの種類の短い合成ウィンドウ(61)を使用した復号化からサンプル(b)を決定し(63)、
前記与えられたフレームに先行し、かつ、1つの種類の長い解析ウィンドウを使用して符号化されたフレーム(T’i)を部分的に復号化し(DCT−1)、かつ、
一覧表にされ、かつ、復号化器のメモリ内に記憶された重み付け関数(w1,n,w2,n;w’1,n,w’2,n)を用いて少なくとも2つの重み付けされた項を結合して他のサンプルを得る(67,69)ことを特徴とする方法。
【請求項2】
前記与えられたフレーム(T’i+1)から生じるサンプル(b)がまず決定され(63)、
該サンプルから時間的に前のフレーム(T’i)の始めに対応するサンプル(a)が導き出され(65〜67)、該サンプルは長い合成ウィンドウを使用した復号化から生じることを特徴とする請求項1に記載の方法。
【請求項3】
フレームはM個のサンプルを含み、
長いウィンドウは2M個のサンプルを含み、
短いウィンドウは2MS個のサンプルを含み、MSはMより小さく、
サンプル
【数1】
は、n=0が復号化の処理においてフレームの始めに対応し、0と(M/2−MS/2)の間に含まれるnについて、
【数2】
の形の2つの重み付けされた項の結合によって与えられ、ここで、
【数3】
は、前のフレーム(T’i)から生じる値(v1)であり、
sM−1−nは、前記与えられたフレーム(T’i+1)に適用される短い合成ウィンドウを使用して既に復号化されたサンプル(b)であり、
w1,nおよびw2,nは、nの関数としての値が一覧表にされ、かつ、復号化器のメモリ内に記憶された重み付け関数であることを特徴とする請求項2に記載の方法。
【請求項4】
フレームはM個のサンプルを含み、
長いウィンドウは2M個のサンプルを含み、
短いウィンドウは2MS個のサンプルを含み、MSはMより小さく、
サンプル
【数4】
は、n=0が復号化の処理においてフレームの始めに対応し、(M/2−MS/2)と(M/2+MS/2)の間に含まれるnについて、
【数5】
の形の2つの重み付けされた項の結合によって与えられ、ここで、m=n−M/2+MS/2であり、
【数6】
は、前のフレーム(T’i)から生じる値(v1)であり、
【数7】
は、前記与えられたフレーム(T’i+1)から生じる値(v2)であり、
w’1,nおよびw’2,nは、nの関数としての値が一覧表にされ、かつ、復号化器のメモリ内に記憶された重み付け関数であることを特徴とする請求項1から3のいずれか1項に記載の方法。
【請求項5】
過去のサンプルの影響を低減させるために、重複変換符号化によって符号化されたフレームを復号化するために、復号化される信号は、
短いウィンドウから復元されたサンプルの重み付け、
長いウィンドウから部分的に復元されたサンプルの重み付け、
過去の復号化された信号のサンプルの重み付け、
の結合から復元されることを特徴とする請求項1から4のいずれか1項に記載の方法。
【請求項6】
M個のサンプルを含むフレーム、
4M個のサンプルを含む長いウィンドウ、
MSがMより小さい、2MS個のサンプルを含む短いウィンドウを用いて、
n=0が復号化の処理においてフレームの始めに対応し、0とM/2−MS/2の間に含まれるサンプルのインデックスnについて、復号化されるサンプル
【数8】
は、0≦n<M/2−MS/2について、
【数9】
の形の4つの重み付けされた項の結合によって生成され、
表記
【数10】
は、zt−1,n+2M+zt−2,n+3Mと示す先行する計算要素への訂正なしで加算して、長い合成ウィンドウを使用して、前記与えられたフレーム(T’i+1)に先行するフレーム(T’i)の不完全に復号化されたサンプルを示し、インデックスtはフレームのインデックスであり、
snは、M/2+MS/2≦n<Mについて、前記与えられたフレーム(T’i+1)の短い合成ウィンドウ(FCS)の連続を使用して完全に復号化されたサンプル、および、−2M≦n<Mについて、前のフレーム(T’i,T’i−1,T’i−2...)の完全に復号化されたサンプルを表わし、
w1,n,w2,n,w3,n,w4,nは、それぞれ、サンプルのインデックスnに依存する第1、第2、第3、第4の重み付け関数であり、nの関数として少なくとも第1および第2の重み付け関数w1,nおよびw2,nがとる値は一覧表にされ、かつ、復号化器のメモリ内に記憶されることを特徴とする請求項5に記載の方法。
【請求項7】
M個のサンプルを含むフレーム、
4M個のサンプルを含む長いウィンドウ、
MSがMより小さい、2MS個のサンプルを含む短いウィンドウを用いて、
M/2−MS/2とM/2+MS/2の間に含まれるnについて、復号化されるサンプル
【数11】
は、
【数12】
の形の4つの重み付けされた項の結合によって与えられ、
【数13】
は、前記与えられたフレーム(T’i+1)に先行するフレーム(T’i)の不完全に復号化されたサンプルであり、
【数14】
は、m=n−M/2+MS/2であり、前記与えられたフレーム(T’i+1)の最初の短いウィンドウの不完全に復号化されたサンプルであり、
snは、前のフレーム(T’i,T’i−1,T’i−2...)の完全に復号化されたサンプルを表わし、
w’1,n,w’2,n,w’3,n,w’4,nは、それぞれ、nに依存する第1、第2、第3、第4の重み付け関数であり、nの関数として少なくとも第1および第2の重み付け関数w’1,nおよびw’2,nがとる値は一覧表にされ、かつ、復号化器のメモリ内に記憶されることを特徴とする請求項5または6に記載の方法。
【請求項8】
nの関数として前記第1および第2の重み付け関数(w1,n,w2,n;w’1,n,w’2,n)がとる値のみが一覧表にされ、かつ、復号化器のメモリ内に記憶され、サンプル
【数15】
の計算において前記第3および第4の重み付け関数(w3,n,w4,n;w’3,n,w’4,n)の寄与は無視されることを特徴とする請求項6または7に記載の方法。
【請求項9】
前記第3および第4の重み付け関数(w3,n,w4,n;w’3,n,w’4,n)は、前記第3および第4の重み付け関数(w3,n,w4,n;w’3,n,w’4,n)の線形結合の結果である単一の重み付け関数(w3−4,n;w’3−4,n)によって与えられ、nの関数として前記単一の重み付け関数(w3−4,n;w’3−4,n)がとる値とともに、前記第1および第2の重み付け関数(w1,n,w2,n;w’1,n,w’2,n)がとる値のみが一覧表にされ、かつ、復号化器のメモリ内に記憶されることを特徴とする請求項6または7に記載の方法。
【請求項10】
0から(M+MS)/2までのnについて、
【数16】
の形の重み付けされた結合に従って、復号化される信号
【数17】
の主要な数式
【数18】
が計算され、
n=0が復号化の処理においてフレームの始めに対応し、0とM/2−MS/2の間に含まれるnについて、
【数19】
とし、
M/2−MS/2とM/2+MS/2の間に含まれるnについて、
【数20】
とし、m=n−M/2+MS/2であることを特徴とする請求項6および7に記載の方法。
【請求項11】
それぞれ異なる長さを有する少なくとも2つの種類の重み付けウィンドウを使用する符号化器から生じるフレームの連続によって表現される信号の変換復号化器であって、
長いウィンドウから短いウィンドウに移行するための情報を受信する手段と、
短い解析ウィンドウを使用して符号化された、与えられたフレーム(T’i+1)に、1つの種類の短い合成ウィンドウ(61)を使用した復号化からサンプル(b)を決定する手段と、
前記与えられたフレームに先行し、かつ、1つの種類の長い解析ウィンドウを使用して符号化されたフレーム(T’i)を部分的に復号化し(DCT−1)、かつ、
一覧表にされ、かつ、復号化器のメモリ内に記憶された重み付け関数(w1,n,w2,n;w’1,n,w’2,n)を用いて少なくとも2つの重み付けされた項を結合して他のサンプルを得る(67,69)手段と、
を備えることを特徴とする変換復号化器。
【請求項12】
変換復号化器のメモリ内に記憶されるコンピュータプログラムであって、
前記変換復号化器のプロセッサによって実行されるとき、請求項1から10のいずれか1項に記載の方法を実現するための命令を含むことを特徴とするコンピュータプログラム。
【請求項13】
請求項12に記載のコンピュータプログラムの命令を記憶するメモリを備えることを特徴とする変換復号化器。
【図1】
【図1a】
【図1b】
【図1c】
【図2a】
【図2b】
【図2c】
【図2d】
【図2e】
【図3a】
【図3b】
【図4a】
【図4b】
【図5a】
【図5b】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図1a】
【図1b】
【図1c】
【図2a】
【図2b】
【図2c】
【図2d】
【図2e】
【図3a】
【図3b】
【図4a】
【図4b】
【図5a】
【図5b】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【公表番号】特表2010−515106(P2010−515106A)
【公表日】平成22年5月6日(2010.5.6)
【国際特許分類】
【出願番号】特願2009−544424(P2009−544424)
【出願日】平成19年12月18日(2007.12.18)
【国際出願番号】PCT/FR2007/052541
【国際公開番号】WO2008/081144
【国際公開日】平成20年7月10日(2008.7.10)
【出願人】(591034154)フランス・テレコム (290)
【Fターム(参考)】
【公表日】平成22年5月6日(2010.5.6)
【国際特許分類】
【出願日】平成19年12月18日(2007.12.18)
【国際出願番号】PCT/FR2007/052541
【国際公開番号】WO2008/081144
【国際公開日】平成20年7月10日(2008.7.10)
【出願人】(591034154)フランス・テレコム (290)
【Fターム(参考)】
[ Back to top ]