説明

オーディオデコーダ内で信号を後処理する方法

本発明は、第1周波数帯における推定パラメータから得られる励起信号の時間および周波数整形(805,807)によって復元された信号をオーディオデコーダ内で後処理する方法に関し、前記時間および周波数整形は、少なくとも第2周波数帯における時間エンベロープおよび受信されてデコードされた(801,802)周波数エンベロープに基づいて遂行される。この方法は、前記整形(805,807)の後に、前記復元された信号の振幅を前記受信されてデコードされた時間エンベロープと比較するステップと、前記時間エンベロープの関数である閾値を超える場合に、前記復元された信号に対して振幅圧縮を適用するステップとを含む。本発明は、また、本発明の方法を実行するのに適合した後処理モジュールおよびオーディオデコーダに関する。デジタル信号、例えばオーディオ周波数信号、すなわちスピーチ、音楽などを送信して格納することに対して応用される。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、オーディオデコーダ内で信号を後処理する方法に関する。
【背景技術】
【0002】
本発明は、デジタル信号、例えばオーディオ周波数信号、すなわちスピーチ、音楽などを送信して格納することに対する特に有利な応用を見いだす。
【0003】
オーディオ周波数のスピーチ、音楽などの信号をデジタル化して圧縮するための様々な技術がある。最も一般的な方法は、「波形コーディング」方法、例えばPCMおよびADPCMコーディング、「合成によるパラメータ分析コーディング」方法、例えばコード励起線形予測(CELP)コーディング、および「サブバンドまたは変換知覚的コーディング」方法である。
【0004】
オーディオ周波数信号をコーディングするためのこれらの古典的な技術は、例えば、1992年にKluwer Academic Publisherから出版されたA. GershoおよびR.M. Grayによる"Vector Quantization and Signal Compression"および1995年にElsevierから出版されたB. KleijnおよびK.K. Paliwal編による"Speech Coding and Synthesis"に記載されている。
【0005】
従来のスピーチコーディングにおいて、コーダは、固定ビットレートでビットストリームを生成する。この固定ビットレート制約は、コーダおよびデコーダ(コーデック)の実施および使用を単純化する。このようなシステムの例は、64kbpsのITU-T G.711コーディング、8kbpsのITU-T G.729コーディング、および12.2kbpsのGSM-EFRシステムである。
【0006】
いくつかの応用、例えば携帯電話およびvoice over IPにおいて、可変ビットレートのビットストリームを生成することが好ましく、ビットレート値は予め定められた一群からとられている。
【0007】
固定ビットレートコーディングより柔軟な多重ビットレートコーディング技術は、以下のものを含む:
・AMR-NB、AMR-WB、SMVおよびVMR-WBシステムの中で用いられるような、ソースおよび/またはチャネルによって制御されるマルチモードコーディング;
・コアビットレートおよび1つ以上の強化層を含むので階層的と呼ばれるビットストリームを生成する階層的(「スケーラブル」)コーディング。48kbps、56kbpsおよび64kbpsのG.722システムは、ビットレートスケーラブルコーディングの簡単な例である。MPEG-4 CELPコーデックは、ビットレートおよび帯域幅がスケーラブルである;このようなコーダの他の例は、B. Kovesi, D. Massaloux, A. Sollaudによる"A Scalable Speech and Audio Coding Scheme with Continuous Bit rate Flexibility", ICASSP 2004およびH. Taddei et al.による"A Scalable Three Bit rate (8, 14.2 and 24 kbps) Audio Coder", 107th Convention AES, 1999の論文の中から見つけることができる。
・多重記述コーディング。
【0008】
本発明は、より詳しくは、階層的コーディングに関する。
【0009】
階層的オーディオコーディングの基本的概念は、例えば、Y. Hiwasaki, T. Mori, H. Ohmuro, J. Ikedo, D. Tokumoto and A. Kataokaによる"Scalable Speech Coding Technology for High Quality Ubiquitous Communications", NTT Technical Review, March 2004という論文の中に示されている。ビットストリームは、ベース層および1つ以上の強化層を含む。ベース層は、「コアコーデック」として知られたコーデックによって、最低限のコーディング品質を保証する固定の低ビットレートで生成される;この層は、品質の許容可能なレベルを維持するためにデコーダによって受信されなければならない。強化層は、品質を強化するために用いられる;それらの全てがデコーダによって受信されるとは限らない。階層的コーディングの主な利点は、単にビットストリームの端を切り捨てることによってビットレートが適合されることを可能にすることである。層の可能な数、すなわちビットストリームの切り捨ての可能な数は、コーディングの粒状度を定める:4kbpsから8kbpsのオーダーの増加によって、ビットストリームがほとんど層を含まない(2から4層のオーダーの)場合に、「強い粒状度」という表現が用いられる;「微細な粒状度のコーディング」という表現は、1kbpsのオーダーの増加による多数の層を意味する。
【0010】
本発明は、より詳しくは、電話帯域および1つ以上の広帯域強化層においてCELPコアコーダを用いるビットレートおよび帯域幅スケーラブルコーディング技術に関する。このようなシステムの例は、8kbps、14.2および24kbpsの強い粒状度と共にH. Taddei et al.による上述した論文に挙げられていて、かつ6.4kbpsから32kbpsの微細な粒状度と共にB. Kovesi et al.による上述した論文に挙げられている。
【0011】
2004年にITU-Tは、コア階層的コーダのための草案規格に着手した。このG.729EV規格(EVは"embedded variable bit rate"を表す)は、周知のG.729コーダ規格に対するアドオンである。G.729EV規格の目的は、会話サービスのための8kbpsから32kbpsまでのビットレートで、狭帯域(300ヘルツ(Hz)〜3400Hz)から広帯域(50Hz〜7000Hz)までの帯域内で信号を発生するG.729コア階層的コーダを得ることである。このコーダは、本質的に、G.729設備と相互動作することができ、これは、既存のvoice over IP設備との互換性を保証する。
【0012】
この草案に応じて、特に、8kbps〜12kbpsでのカスケードCELPコーディングを備えていて、その後に14kbpsでのパラメータ帯域拡張が続き、そして次に14から32kbpsでの変換コーディングが続く3層コーディングシステムが提案された。このコーダは、ITU-T SG16/WP3 D214コーダ(ITU-T, COM 16, D214 (WP 3/16), "High level description of the scalable 8 kbps-32 kbps algorithm submitted to the Qualification Test by Matsushita, Mindspeed and Siemens", Q.10/16, 研究期間2005年〜2008年、ジュネーブ、2005年7月26日〜8月5日)として知られている。
【0013】
帯域拡張概念は、信号の高帯域のコーディングに関する。本発明の状況において、入力オーディオ信号は、50Hzから7000Hzまでの使用可能な帯域にわたって16kHzでサンプリングされる。上記で引用したITU-T SG16/WP3 D214コーダのために、高帯域は、通常は3400Hzから7000Hzの範囲の周波数に対応する。この帯域は、コーダ内で時間および周波数エンベロープを抽出することに基づいて、帯域拡張テクニックを用いてコード化される。このエンベロープは、デコーダ内で、8kHzでサンプリングされ、低帯域(50Hzから3400Hzの範囲)において推定されたパラメータから高帯域において復元される合成励起信号に対して適用される。低帯域は以下「第1周波数帯」と呼ばれ、高帯域は「第2周波数帯」と呼ばれる。
【0014】
図1は、この帯域拡張技法の図である。
【0015】
コーダにおいて、3400Hzから7000Hzの原信号の高周波成分は、バンドパスフィルタ100によって分離される。信号の時間および周波数エンベロープは、それぞれ、モジュール101および102によって算出される。エンベロープは、ブロック103において、2kbpsで、共同で量子化される。
【0016】
デコーダにおいて、合成励起は、復元モジュール104によってカスケードCELPデコーダのパラメータから復元される。時間および周波数エンベロープは、逆量子化器ブロック105によってデコードされる。復元モジュール104から来ている合成励起信号は、スケーリングモジュール106(時間エンベロープ)およびフィルタモジュール107(周波数エンベロープ)によって整形される。
【0017】
ちょうど今ITU-T SG16/WP3 D214コーデックに関して記載した帯域拡張メカニズムは、従って、時間および周波数エンベロープによって合成励起信号を形成することに依存する。しかし、励起と整形間の結合なしで、この種のモデルを適用することは困難であり、振幅の上限を大きく超えるので、非常によく聞こえる局所化された「クリック」の形での人工産物の原因となる。
【発明の開示】
【課題を解決するための手段】
【0018】
従って、本発明の内容によって解決される技術的課題は、オーディオデコーダ内で、第1周波数帯において推定されるパラメータから得られる励起信号の時間および周波数整形によって復元された信号を後処理する方法を提案することである。この方法は、合成励起信号を整形することによって引き起こされる人工産物を防止するはずである。前記時間および周波数整形は、時間エンベロープおよび第2周波数帯における受信されてデコードされた周波数エンベロープに基づいて実行される。
【0019】
上述した技術的課題に対する本発明による解決策は前記方法にあり、この方法は、前記復元された信号の振幅を前記受信されてデコードされた時間エンベロープと比較するステップと、前記時間エンベロープの関数である閾値を超える場合に、前記復元された信号に対して振幅圧縮を適用するステップとを含む。
【0020】
従って、本発明の方法は、第2周波数帯(高帯域)において、デコーダによって供給されるオーディオ信号を後処理するために、振幅圧縮を用いて励起と整形間の十分な結合の不足を補償する。
【0021】
一実施形態において、前記振幅が、前記受信されてデコードされた時間エンベロープの関数である起動(triggering)閾値より大きい場合に、前記振幅圧縮において、前記信号の振幅に対して線形減衰を適用する。
【0022】
なお、信号の振幅を制限し従って高振幅と関係する人工産物を制限することに加えて、本発明の方法は、それが受信されてデコードされた時間エンベロープの値を追跡するので、起動閾値が可変であるという意味で、適応性があるという利点を持っていることに注意されたい。
【0023】
本発明は、また、プログラムがコンピュータ上で実行される時に、本発明の後処理方法を実行するためのプログラムコードインストラクションを含んでいるコンピュータプログラムに関する。
【0024】
本発明は、更に、オーディオデコーダ内で、第1周波数帯における推定パラメータから得られる励起信号を整形することによって復元された信号を後処理するためのモジュールに関する。前記時間および周波数整形は、時間エンベロープおよび第2周波数帯における受信されてデコードされた周波数エンベロープに基づいて遂行される。このモジュールは、前記復元された信号の振幅を前記受信されてデコードされた時間エンベロープと比較するためのコンパレータと、正の比較結果の場合に、前記復元された信号に対して振幅圧縮を適用するように適合された振幅圧縮手段とを備える点で注目に値する。
【0025】
本発明は、最後に、オーディオデコーダに関し、このオーディオデコーダは、少なくとも第1周波数帯における励起信号のパラメータを推定するためのモジュールと、前記パラメータから励起信号を復元するためのモジュールと、第2周波数帯における時間エンベロープをデコードするためのモジュールと、第2周波数帯における周波数エンベロープをデコードするためのモジュールと、少なくとも前記デコードされた時間エンベロープによって、前記励起信号を時間整形するためのモジュールと、少なくとも前記デコードされた周波数エンベロープによって、前記励起信号を周波数整形するためのモジュールとを備え、前記デコーダは、本発明による後処理モジュールを備える点で注目に値する。
【0026】
非限定的な例として提供される、添付の図面を参照する以下の説明は、本発明が、何にあり、かつどのように実施し得るのかを明確に説明する。
【発明を実施するための最良の形態】
【0027】
本発明の一般的な状況は、3つのビットレート、すなわち8kbps、12kbpsおよび13.65kbpsでのサブバンド階層的オーディオコーディングおよびデコーディングであるということを忘れてはならない。実際には、コーダは、常に13.65kbpsの最高ビットレートで動作し、デコーダは、8kbpsのコアおよび12kbpsまたは13.65kbpsの強化層の一方または両方を受信することができる。
【0028】
図2は、階層的オーディオコーダの図である。
【0029】
16kHzでサンプリングされた広帯域入力信号は、まず、QMF(直交ミラーフィルタバンク)技法を用いてそれをフィルタリングすることによって2つのサブバンドに分割される。0から4000Hzまでの範囲の第1周波数帯(低帯域)は、ローパス(L)フィルタリング400およびデシメーション401によって得られ、4000Hzから8000Hzまでの範囲の第2周波数帯(高帯域)は、ハイパス(H)フィルタリング402およびデシメーション403によって得られる。好ましい実施形態において、LおよびHフィルタは、長さが64であり、J. Johnstonによる"A filter family designed for use in quadrature mirror filter banks", ICASSP, vol. 5, pp. 291-294, 1980という論文に記載されたものに準拠する。
【0030】
低帯域は、8kbpsおよび12kbpsの狭帯域CELPコーディング405の前に、ハイパスフィルタ404によって前処理されて50Hz以下の成分が除去される。このハイパスフィルタリングは、広帯域が50Hz〜7000Hzの範囲をカバーすると定義されていることを考慮に入れている。一実施形態において、狭帯域CELPコーダは、ITU-T SG16/WP3 D135コーダ(ITU-T, COM 16, D135 (WP 3/16), "France Telecom G.729EV Candidate: High level description and complexity evaluation", Q.10/16, 研究期間2005〜2008年、ジュネーブ、2005年7月26日〜8月5日)である。これは、前処理フィルタおよび追加の固定CELP辞書を用いる12kbpsの第2段階コーディングなしで、修正されたG.729の8kbps第1段階コーディング(ITU-T勧告G.729, Coding of Speech at 8 kbps using Conjugate Structure Algebraic Code Excited Linear Prediction (CS-ACELP), 1996年3月)を含むカスケードCELPコーディングを遂行する。CELPコーディングは、低帯域における励起信号のパラメータを決定する。
【0031】
高帯域は、まず、デシメーション403と連動するハイパスフィルタリング402によって引き起こされるエイリアシングを補償するために、アンチエイリアシング処理406にかけられる。高帯域は、次に、ローパスフィルタ407によって前処理されて、3000Hzから4000Hzまでの範囲の高帯域における成分、すなわち7000Hzから8000Hzまでの範囲の原信号における成分が除去される。この後に、13.65kbpsでの帯域拡張(高周波帯域コーディング)408が続く。
【0032】
コーディングモジュール405および408によって生成されたビットストリームは、マルチプレクサ409で多重化されて階層的ビットストリームとして構築される。
【0033】
コーディングは、320サンプルのブロック(20ミリ秒(ms)フレーム)で遂行される。階層的コーディングのビットレートは、8kbps、12kbpsおよび13.65kbpsである。
【0034】
図3は、高帯域コーダ408を更に詳細に示している。その原理は、ITU-T SG16/WP3 D214コーダのパラメータ帯域拡張と似ている。
【0035】
高周波帯域信号xhiは、N/2サンプルのフレームにコード化される。ここで、Nは原広帯域フレームのサンプルの数であり、2で割ると高帯域を2の率で減衰させる結果となる。好ましい実施形態において、N/2=160であり、これは8kHzのサンプリング周波数での20msフレームに相当する。各フレームに対して、すなわち20ms毎に、モジュール600および601は、ITU-T SG16/WP3 D214コーダと同様に、時間および周波数エンベロープを抽出する。これらのエンベロープは、ブロック602で共同で量子化される。
【0036】
モジュール600によって遂行される周波数エンベロープの抽出の簡単な説明は、以下の通りである。
【0037】
スペクトル分析は、未来フレームとオーバーラップする現在フレームを中心とする時間ウィンドウを用いるので、この動作は「未来」サンプルを必要とし、通常「先取り」と呼ばれる。好ましい実施形態において、高周波帯域の先取りは、L=16サンプル、すなわち2msで設定される。周波数エンベロープの抽出は、例えば、以下の方法で実行され得る:
・現在フレームのウィンドウイングを伴う短期スペクトルの算出および先取りおよび離散的フーリエ変換;
・スペクトルのサブバンドへの分割;
・サブバンドの短期エネルギーの算出および二乗平均(rms)値への変換。
【0038】
周波数エンベロープは、従って、信号xhiのサブバンドの各々の二乗平均値として定義される。
【0039】
次に、図4を参照して、モジュール601による時間エンベロープの抽出を説明するが、これは信号xhiの時間分割をより詳細に示している。
【0040】
各20msフレームは、160サンプルから成る:
・xhi = [x0 x1 ... x159]
【0041】
xhiの最後の16サンプルは、現在フレームに対する先取りを構成する。
【0042】
現在フレームの時間エンベロープは、以下の方法で算出される:
・xhiの10サンプルの16サブフレームへの分割;
・サブフレームの各々のエネルギーの算出および二乗平均値への変換。
【0043】
時間エンベロープは、従って、信号xhiの16サブフレームの各々の二乗平均値として定義される。
【0044】
図5は、図2および3を参照して説明したコーダと関連する階層的オーディオデコーダを示している。
【0045】
各20msフレームを定めているビットは、デマルチプレクサ500によって多重分離される。8kbpsおよび12kbps層のビットストリームは、0から4000Hzまでの範囲の低帯域における励起信号の合成パラメータを生成するために、CELPデコーディングモジュール501によって用いられる。低帯域の合成音声信号は、ブロック502によってポストフィルタリングされる。
【0046】
13.65kbps層と関連するビットストリームの一部は、帯域拡張モジュール503によってデコードされる。
【0047】
アンチエイリアシング506を組み込んでいる合成QMFフィルタバンク504、505、507、508および509によって、16kHzでサンプリングされた広帯域出力信号が得られる。
【0048】
図5の高周波帯域デコーダ503を、図6を参照して更に詳細に説明する。
【0049】
このデコーダは、図1のコーダの所で説明した高周波帯域の合成の原理を用いるが、2つの変更がある:それは、周波数エンベロープ補間モジュール806および後処理モジュール808を含んでいる。周波数エンベロープ補間および後処理モジュールは、高帯域におけるコーディングの品質を改良する。モジュール806は、前のフレームの周波数エンベロープと現在のフレームの周波数エンベロープとの間の補間を遂行して、このエンベロープを20ms毎ではなく10ms毎に進化させる。
【0050】
図6の高周波帯域デコーダにおいて、デマルチプレクサ800で、ビットストリームの中で受信されたパラメータを多重分離し、デコーディングモジュール801および802で、時間および周波数エンベロープ情報をデコードする。合成励起信号は、復元モジュール803で、8kbpsおよび12kbps層によって受信されたCELP励起パラメータから生成される。この励起は、原信号の4000Hzから7000Hzまでの帯域に対応する0から3000Hzまでの範囲の周波数のみを保持するために、ローパスフィルタ804にかけられる。図1のコーダと同様に、合成励起信号は、モジュール805および807によって整形される:
・時間整形モジュール805の出力は、理想的には、サブフレームの各々に対する二乗平均値を有していて、それは、デコードされた時間エンベロープに対応する;モジュール805は、従って、遅れずに適応できる利得の応用に対応する;
・周波数整形モジュール807の出力は、理想的には、サブバンドの各々に対する二乗平均値を有していて、それは、デコードされた周波数エンベロープに対応する;モジュール807は、フィルタバンクまたはオーバーラップを伴う変換によって実現され得る。
【0051】
励起信号を整形することから生じる信号xは、復元された高帯域yを得るために、後処理モジュール808によって処理される。
【0052】
次に、後処理モジュール808を更に詳細に説明する。
【0053】
モジュール808によって遂行される後処理は、周波数整形モジュール807から来る信号xに対して振幅圧縮を適用して、この信号の振幅を制限し、従って人工産物を防止する。さもないと、それは、励起と整形間の結合の不足のため、発生され得る。
【0054】
後処理モジュール808の出力信号yは、以下の形に記述される。この中で、σは、デコードされた時間エンベロープを表す:
・y = C(x) = σ.F(x/σ)
【0055】
本発明によって提案される後処理の特性は、以下の通りである:
・それは、即座に、すなわちサンプル毎に、いかなる処理遅延も発生させずに作用する;
・振幅圧縮のための起動閾値は、時間エンベロープデコーディングモジュール801によってデコードされる時、時間エンベロープによって与えられる;定義上、σ≧0である;
・σの値が10サンプルの各サブフレームの中で、すなわち1.25ms毎に変化するので、後処理は適応性がある。
・図4に示したように、現在フレームに対するデコードされた時間エンベロープは、2msのシフト、すなわち16サンプルに対応する。従って、適応性のある後処理は、先取りに関連する2つのサブフレームの二乗平均値を格納する:これらの2つのサブフレームは、現在フレームの開始時の2つのサブフレームに対応する。
【0056】
図7のフローチャートは、第1後処理圧縮関数C1(x)を示している。計算の開始および終了は、ブロック1000および1006によって示されている。出力値yは、まずxに初期化される(ブロック1001)。それから、yが範囲[-σ, σ]の中にあるかどうかを確認するために、2つのテストが遂行される(ブロック1002および1004)。3つの状況が可能である:
yが範囲[-σ, σ]の中にある場合、yの計算は終了している:y = xかつC1(x) = x;F1(x/σ) = x/σ;
・y > σである場合、その値は、ブロック1003の中で定義したように修正される;yと+σの差は、16の率で減衰される;
y < -σである場合、その値は、ブロック1005の中で定義したように修正される;yと-σの差は、16の率で減衰される。
【0057】
演算y = C1(x)はどのように作用するかを明確に示すために、図8は、x/σの関数としてのy/σのグラフを示している。データは、入/出力特性がσの値に左右されないようにするために、σによって正規化されている。この正規化された特性は、F1(x/σ)と表される;従って:C1(x) = σ F1(x/σ)。
【0058】
図8は、関数C1(x)が+/-σで設定される起動閾値によって対称振幅圧縮を遂行することを明確に示している。より正確には、F1(x/σ)の傾きは、範囲[-1, +1]の中では1であり、他の場所では1/16である。同様に、C1(x)の傾きは、範囲[-σ, +σ]の中では1であり、他の場所では1/16である。
【0059】
後処理の2つの変形が、図9から12を参照して説明される。対応する関数は、それぞれC2(x)およびC3(x)と表される。
【0060】
図9および10に示した後処理C2(x)は、起動閾値が+/-σから+/-2σに変更されている点以外は、C1(x)と同じである。従って、C2(x)の傾きは、範囲[-2σ, +2σ]の中では1であり、他の場所では1/16である。
【0061】
後処理C3(x)は、C1(x)のより発展した変形であり、その中で、振幅圧縮は、2つの連続したステップで遂行される。図11に示すように、起動範囲は依然として[-σ, +σ]に設定される(ブロック1402および1406)が、対照的に、yの値は1/2の率だけによって減衰され、ブロック1403および1407によって修正されたyの値が範囲[-2.5 σ, +2.5 σ]の外にある場合を除き、yの値はブロック1405および1409によって再び修正される。C3(x)の関数が図12に示されていて、C3(x)の傾きは以下の通りであることが分かる:
・範囲[-∞, -4σ]および[4σ, +∞]の中では1/16;
・範囲[-4σ, -σ]および[σ, 4σ]の中では1/2;かつ
・範囲[-σ, +σ]の中では1。
【図面の簡単な説明】
【0062】
【図1】従来技術における高周波帯域コーディング−デコーディング段の図である。
【図2】8kbps、12kbps、13.65kbps階層的オーディオコーダのハイレベルな図である。
【図3】図2のコーダの13.65kbpsモードのための高周波帯域コーダの図である。
【図4】図3の高周波帯域コーダによって遂行されるフレームへの分割を示している図である。
【図5】図2のコーダと関連する8kbps、12kbps、13.65kbps階層的オーディオデコーダのハイレベルな図である。
【図6】図5のデコーダの13.65kbpsモードのための高周波帯域デコーダの図である。
【図7】振幅圧縮関数の第1実施形態のフローチャートである。
【図8】図7の振幅圧縮関数のグラフである。
【図9】振幅圧縮関数の第2実施形態のフローチャートである。
【図10】図9の振幅圧縮関数のグラフである。
【図11】振幅圧縮関数の第3実施形態のフローチャートである。
【図12】図11の振幅圧縮関数のグラフである。
【符号の説明】
【0063】
801 時間エンベロープデコーダ
802 周波数エンベロープデコーダ
805 時間整形モジュール
807 周波数整形モジュール

【特許請求の範囲】
【請求項1】
第1周波数帯の推定パラメータから得られる励起信号の時間および周波数整形(805,807)によって復元された信号をオーディオデコーダ内で後処理する方法において、前記時間および周波数整形は、少なくとも第2周波数帯における時間エンベロープおよび受信されてデコードされた(801,802)周波数エンベロープに基づいて遂行され、前記方法は、前記整形(805,807)の後に、前記復元された信号の振幅を前記受信されてデコードされた時間エンベロープ(σ)と比較するステップと、前記時間エンベロープの関数である閾値を超える場合に、前記復元された信号に対して振幅圧縮を適用するステップとを有していることを特徴とする方法。
【請求項2】
前記受信されてデコードされた時間エンベロープ(σ)は、第2周波数帯(xhi)における信号のサブフレームの各々に対する二乗平均値として定義されることを特徴とする請求項1に記載の方法。
【請求項3】
前記振幅が、前記受信されてデコードされた時間エンベロープ(σ)の関数である起動閾値より大きい場合に、前記振幅圧縮において、前記復元された信号の振幅に対して線形減衰を適用することを特徴とする請求項1または2に記載の方法。
【請求項4】
前記振幅圧縮は、前記受信されてデコードされた時間エンベロープ(σ)の関数としての起動閾値によって起動されるフラグメントによって、線形減衰の法則に従って遂行されることを特徴とする請求項1から3のうちのいずれか一項に記載の方法。
【請求項5】
プログラムがコンピュータの中で実行される時に、請求項1から4のうちのいずれか一項に記載の後処理方法を実行するためのプログラムコードインストラクションを含んでいるコンピュータプログラム。
【請求項6】
第1周波数帯の推定パラメータから得られる励起信号の時間および周波数整形によって復元された信号をオーディオデコーダ内で後処理するためのモジュールにおいて、前記時間および周波数整形は、少なくとも第2周波数帯における時間エンベロープおよび受信されてデコードされた周波数エンベロープに基づいて遂行され、前記後処理モジュール(808)は、前記復元された信号の振幅を前記受信されてデコードされた時間エンベロープ(σ)と比較するためのコンパレータと、前記時間エンベロープの関数である閾値を超える場合に、前記復元された信号に対して振幅圧縮を適用するように適合された振幅圧縮手段とを含むことを特徴とするモジュール。
【請求項7】
第1周波数帯における励起信号のパラメータを推定するためのモジュール(501)と、前記パラメータから励起信号を復元するためのモジュール(803)と、第2周波数帯における受信されてデコードされた時間エンベロープ(σ)をデコードするためのモジュール(801)と、第2周波数帯における周波数エンベロープをデコードするためのモジュール(802)と、少なくとも前記受信されてデコードされた時間エンベロープ(σ)によって、前記励起信号を時間整形するためのモジュール(805)と、少なくとも前記デコードされた周波数エンベロープによって、前記励起信号を周波数整形するためのモジュール(807)とを備えるオーディオデコーダにおいて、前記デコーダは、請求項6に記載の後処理モジュール(808)を更に備えていることを特徴とするオーディオデコーダ。
【請求項8】
周波数エンベロープ補間モジュール(806)を含むことを特徴とする請求項7に記載のデコーダ。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate


【公表番号】特表2009−530679(P2009−530679A)
【公表日】平成21年8月27日(2009.8.27)
【国際特許分類】
【出願番号】特願2009−500896(P2009−500896)
【出願日】平成19年3月20日(2007.3.20)
【国際出願番号】PCT/FR2007/050959
【国際公開番号】WO2007/107670
【国際公開日】平成19年9月27日(2007.9.27)
【出願人】(591034154)フランス テレコム (290)