デコーダおよび対応するデバイス中のディジタル信号のエコーの訓練された弁別および減衰のための方法
本発明は、変換符号化によって生成されるディジタル可聴信号のエコーの訓練された弁別および減衰のための方法であって、信号の現在のフレーム毎に、実時間で、少なくとも1つの周波数帯域において、エコー生成信号の1つの特性から引き出される変数と閾値の値における非エコー生成信号から引き出される変数を比較するステップ(A)と、その比較から、変換符号化から引き出されるエコーが存在していること、あるいは存在していないこと(C)を演繹するステップ(B)と、エコーの存在を弁別し、かつ、ディジタル可聴信号の高エネルギー部分に擬似警報ゾーンを画定するステップ(D)と、初期処理を決定し、かつ、低エネルギー擬似警報ゾーンと相補をなす部分のエコーを減衰させるステップ(E)と、擬似警報ゾーンのエコーの減衰を禁止するステップ(F)とを含む方法に関する。本発明は、コーダ/デコーダの技術、とりわけ階層型コーダ/デコーダの技術に適用することができる。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、デコーダおよび対応するデバイス中のディジタル信号のエコーを安全に弁別し、かつ、減衰させるための方法およびデバイスに関する。
【背景技術】
【0002】
固定ネットワークであれ、移動ネットワークであれ、あるいは同報通信ネットワークであれ、伝送ネットワークを介したディジタル可聴信号の転送、またはこれらの信号の記憶には、時間符号化タイプ、場合によっては予測型時間符号化タイプの符号化システム、あるいはいわゆる変換符号化タイプの符号化システムを実施する圧縮プロセスが使用されている。
【0003】
本発明の主題である方法およびデバイスは、音響信号、詳細には、符号化されたディジタル可聴信号の圧縮に適用することができる。これらの信号のフレームは、音楽楽器によって生成される増音源および/または減音源、破裂音音節を含む音声信号、および、詳細には、時間領域におけるデコーダ(予測型デコーダその他)および逆周波数変換デコーダを始めとする多層デコーダデバイスである。
【0004】
図1は、実例として、従来技術による、変換および加算/重畳によるディジタル可聴信号の符号化および復号化を略図で示したものである。
【0005】
上で言及した符号化プロセスおよび復号化プロセスをより詳細に説明するために、たとえば、本出願人が2005年7月12日に出願した仏国特許出願第05 07471号の説明の概論を参照することができる。
【0006】
パーカッションなどのいくつかの音楽音響、および破裂音音節などの特定の音声シーケンスは、いくつかのサンプル(図1のサンプル410から)の空間でサンプルされる信号のダイナミックレンジが極めて強く変化する極めて急激なトランジションに反映される極端に突発的なアタックを特徴としている。
【0007】
変換符号化によって適用される複数のサンプルの連続するブロックへの再分割は、音響信号には全く無関係であり、したがってトランジションは解析窓内のあらゆるポイントに出現する。変換符号化の場合、雑音は、サンプルされた長さ2Lのブロックの全継続期間にわたって時間的に一様に分布する。これが、トランジションに先立つプリエコーの出現およびトランジション後のポストエコーの出現に反映される。
【0008】
雑音レベルは、トランジション直後の高エネルギーサンプルに対する信号の雑音レベルより小さいが、エネルギーがより小さいサンプル、とりわけ先行するトランジション部分のサンプル(図1のサンプル160〜410)に対する信号の雑音レベルより大きい。上記部分の信号対雑音比は極めて小さく、プリエコーで示される、結果として生じる劣化は、極めて煩わしいものとして出現することになる。
【0009】
図1から、プリエコーは、トランジションに先行するフレームおよびトランジション中のフレームに影響を及ぼすことが分かる。
【0010】
実際には、人間の耳は、アタックの生理学的伝送に先立って、数ミリ秒程度の極めて限られたプリマスキングを適用する。
【0011】
生成される雑音、すなわちプリエコーは、プリエコーの継続期間がプリマスキングの継続期間より長い場合、耳に聴こえる。
【0012】
また、人間の耳は、高エネルギーシーケンスから低エネルギーシーケンスへのトランジションの際に、継続期間がより長い、5ミリ秒ないし60ミリ秒のポストマスキングを適用する。したがって、ポストエコーを許容することができる苛立ちの割合すなわちレベルは、プリエコーに対するそれより大きい。
【0013】
プリエコーのより重大な現象は、数に換算したサンプルのブロックの長さが長くなるほど、苛立ちの程度が増すことである。現在、変換符号化の場合、最も重要な周波数帯の正確な分解能を有することが必要である。固定サンプル周波数および固定ビットレートでは、窓のポイント数が増加すると、心理音響学モデルによって有用と見なされている周波数線を符号化するために利用することができるより多くのビットが存在することになり、したがって長さが長いブロックを使用する利点が得られる。たとえば、符号化プロセスAAC(Advanced Audio Coding)が実施されると、長さが長い窓は、サンプリング周波数が32kHzの場合、たとえば64msの継続期間にわたって2048個の固定数のサンプルを含むことになる。会話アプリケーションのために使用されるエンコーダには、継続期間が16kHzにおいて40ms、また、フレーム更新継続期間が20msの窓がしばしば使用されている。
【0014】
上で言及したプリエコー現象の苛立ち効果を抑制するために、また、ポストエコー現象をある程度抑制するために、これまで様々な解決法が提案されている。
【0015】
第1の解決法には、フィルタの適用が必然的に伴っている。アタックによる伝送に先行するゾーンでは、復元された信号は、実際、元の信号から構築されており、その信号の上に量子化雑音が重畳している。
【0016】
Y. MahieuxおよびJ.P. Petitによって発行された、High Quality Audio Transform Coding at 64 kbits、IEEE Trans on Communications Vol 42 No.11、1994年11月、という名称の論文に、対応するフィルタリング技法が記載されている。
【0017】
このようなフィルタリングを実施するためにはパラメータを知る必要があり、そのうちのいくつかは、雑音によって影響されたサンプルからデコーダ上で予測される。しかしながら、元の信号のエネルギーなどの情報を知ることができるのはエンコーダのみであり、したがってこれらの情報を伝送しなければならない。受け取ったブロックにダイナミックレンジの突発的な変化が含まれている場合、その突発的なダイナミックレンジの変化にフィルタリングプロセスが適用される。
【0018】
上で言及したフィルタリングプロセスによれば、元の信号を検索することはできないが、プリエコーが強力に抑制される。しかしながら、このフィルタリングプロセスには、追加補助パラメータをデコーダに伝送する必要がある。
【0019】
第2の解決法には、窓を動的に切り換えることによってプリエコーを小さくする必要がある。
【0020】
B. Edlerに付与された米国特許第5214742号に、このような技法が記載されている。この解決法は、国際規格に基づく様々な可聴周波符号化解決法におけるアプリケーションの主体である。
【0021】
この解決法によれば、信号の時間分解能および周波数分解能が符号化窓の長さに強く依存しているため、周波数コーダは、静止信号に対しては長い窓(たとえば2048サンプル)間を切り換え、また、ダイナミックレンジが広範囲にわたって変化する信号または過渡信号に対しては、短い窓(たとえば256サンプル)間を切り換える。この適合は、AACモジュール内で実行され、その決定は、エンコーダ上でフレーム毎に採用される。
【0022】
この第2の解決法の欠点の1つは、トランジションが次の窓の中で始まる場合、そのトランジションの準備をすることができること、および完全な復元の保持を可能にするトランジション窓に切り換えることができることが肝要であるため、この解決法にはN/2サンプル程度の追加遅延が含まれていることである。
【0023】
しかしながら、デコーダが、複数の時間復号化段、場合によっては予測型時間復号化段および変換復号化段を備えている場合、階層型エンコーダ内で容易にエコーを抑制することができる。その場合、時間復号化段を使用してエコーを検出することができる。K. Kikuiriらによる米国特許出願第2003/0154074号に、このタイプの復号化の実施例が記載されている。
【0024】
上で言及した特許出願によって説明されている、従来技術で知られている方法には、復号化されたCELP基本コア信号に排他的に基づくプリエコーの検出を実行するステップが含まれている。CELPとは、符号励起線形予測(Code Excited Linear Prediction)のことである。
【0025】
そのため、このような方法は、付随する情報に基づく、時間デコーダおよび変換デコーダからの復元フレームに同期したプリエコー抑制処理を提供することはできない。
【0026】
上で言及した仏国特許出願第05 07471号によれば、エコーの存在を弁別し、かつ、エコーを生成する変換符号化およびエコーを生成しない時間符号化からの多層階層型符号化によって生成されるディジタル可聴信号のエコーを減衰させることができる。この特許出願の場合、復号化中、ディジタル可聴信号の現在のフレーム毎に、非エコー生成復号化によって得られる信号の振幅に対するエコー生成復号化によって得られる信号の振幅の比率の値が、実時間で閾値の値と比較される。この比率の値がこの閾値の値より大きいか、あるいはこの閾値の値に等しい場合、変換符号化に由来するエコーが現在のフレームに存在している、と結論付けることができる。あるいは、この比率の値がこの閾値の値より小さい場合、この現在のフレームには変換符号化に由来するエコーは存在していない、と結論付けることができる。
【0027】
上で言及した特許出願の図3aおよび3bに対応している図2aおよび図2bは、この方法を示したものである。以下、本特許出願についての説明の概論では、括弧内の図面番号は、参照を目的として本出願に導入されている仏国特許出願第05 07471号の図面番号を表している。
【0028】
図2aは、「予測型復号化層i」と呼ばれる複数の非エコー生成デコーダと、「変換復号化層j」と呼ばれる複数の変換デコーダとを備えた階層型デコーダを示したものである。
【0029】
図2b(図3b)は、時間デコーダに由来する復号化信号および変換デコーダに由来する復号化信号を入力として備えた、エコーを弁別するためのデバイス1を示したものである。エコーデバイスの出力は、加算/重畳出力部の復号化信号を減衰させることによってエコー減衰デバイス2を制御している。
【0030】
図2c(図3c)は、それぞれ時間デコーダおよび変換デコーダに由来する信号の時間包絡線およびエコー存在フラグを計算する方法を示したものである。
【0031】
図2d(図3e)は、エコーが存在している継続期間の間、加算/重畳出力信号に、変換復号化信号の包絡線に対する時間信号の包絡線の比率に等しい利得g(k)を掛け合わせることによってエコーを減衰させる方法を示したものである。
g(k)=Min(EnvPi(k)/EnvTj(k)、1)
【0032】
この図では、POSの値がゼロである場合に、フレーム全体にわたってプリエコー処理が実行される。
【0033】
図2e(図11)は、エコーの弁別およびそれらの減衰が非制限方式で2つの周波数副帯域で実行される多層システムにおけるエコー弁別の原理を示したものである。
【0034】
この実施例では、信号フィルタリング操作は、時間信号xPi(n)に対する時間フィルタリングは、あるいはMDCT(修正離散余弦変換(Modified Discrete Cosine Transform))周波数領域におけるフィルタリングのいずれかによって実行される。このMDCT周波数領域におけるフィルタリングは、時間信号をMDCT係数に変換し、次に、MDCT係数を操作し(MDCT係数をゼロにセットし、加算し、置換し、等々)、最後に、加算/重畳が後続する逆MDCT変換を副帯域毎に実行することによって実施される。
【0035】
上で言及した仏国特許出願第05 07471号に記載されている方法およびデバイスは、既に言及した従来技術の欠点に対する解決法を提供している。
【0036】
仏国特許出願第05 07471号に記載されている解決法には、エコー減衰デバイスに対する誤ったトリガリングを除去するために、エコー減衰デバイスに対するトリガリングを予測するための手順がエンコーダ上で使用されている。
【0037】
より詳細には、エンコーダは、変換符号化される信号を有しているため、非量子化信号に対するエコーの弁別がエンコーダ上で実行され、また、エンコーダはプリエコーに支配されないため、すべてのトリガリングは、間違いなく誤りと言える。エコーは、エンコーダ上で検出され、異常が検出されると、デコーダ上でのエコーの減衰を禁止するために、そのフレーム内でフラグが伝送される。
【特許文献1】仏国特許出願第05 07471号
【特許文献2】米国特許第5214742号
【特許文献3】米国特許出願第2003/0154074号
【非特許文献1】High Quality Audio Transform Coding at 64 kbits、IEEE Trans on Communications Vol 42 No.11、1994年11月
【発明の開示】
【発明が解決しようとする課題】
【0038】
本発明の目的は、一方では、エンコーダからの特定の補助指示の伝送が存在しない場合に、また、他方では、符号化に対する余計な複雑性の導入が存在しない場合に、エコー減衰デバイスを誤ってトリガリングする事態を回避することである。
【0039】
本発明の他の目的は、さらに、エンコーダからの擬似警報の伝送が存在しない場合に、アタックの出現と同期したエコーの減衰を禁止することができるようにすることである。これは、時間エンコーダは、通常、アタックに対して瞬時に反応しないため、従来技術によるデバイスでは実施することができない。
【0040】
本発明の他の目的は、さらに、変換デコーダに由来する信号が一定のダイナミックレンジを有している場合、エコー減衰デバイスに対する誤ったトリガリングを回避することである。アタックが存在しないため、時間デコーダによって復号化された信号が変換デコーダによって復号化された信号に対して弱い場合に、エコー減衰デバイスがトリガされる従来技術によるデバイスとは異なり、エコー減衰デバイスを起動する必要はない。
【0041】
本発明の他の目的は、遅いデータ転送速度が時間エンコーダに割り当てられ、したがってすべての入力信号を正しく符号化することができない場合に、実施態様を提供することである。
【0042】
引用することができる一例は、4000Hzから7000Hzの狭い信号周波数帯域で動作し、この帯域に存在する正弦曲線を正しく符号化することができない、従来技術による特定の時間エンコーダの場合である。したがって時間エンコーダの出力部の信号が弱く、エコー減衰が不適切に起動され、そのために符号化が著しく劣化する。
【0043】
また、本発明の他の目的は、先行するフレームにアタックが存在する場合に、ポストエコーの減衰が不適切に禁止されることを防止することができる、多層デコーダ中のディジタル信号のエコーを安全に弁別し、かつ、減衰させるための方法およびデバイスの実施態様を提供することである。
【課題を解決するための手段】
【0044】
本発明の主題である、エコーを生成する変換符号化によって生成されるディジタル可聴信号のエコーを弁別し、かつ、減衰させるための方法は、少なくとも復号化において、このディジタル可聴信号の現在のフレーム毎に、高エネルギーゾーンへのトランジションに先行する低エネルギーゾーンを弁別するステップと、現在のフレームの非弁別ゾーンに対応する擬似警報ゾーンを画定するステップと、減衰利得値を使用してエコーの初期処理を決定するステップと、現在のフレームの低エネルギー弁別ゾーン内のエコーの初期処理に基づいてエコーを減衰させるステップと、擬似警報ゾーン内の初期処理のエコーの減衰を禁止するステップとを含むことを特徴としている。
【0045】
本発明の主題である上記方法によれば、アタックによって生成される高エネルギー信号を劣化させることなく、エコー、プリエコーおよびポストエコーを除去することができる。
【0046】
以下、図2fおよび次の式の参照には次の表記法が使用される。
n∈[0、L-1]に対してxrec(n)=h(n+L)xprev(N+L)+h(n)xcur(n)
【0047】
変換エンコーダでは、現在のフレームの復元信号(xrec(n)、n=0からL-1)は、先行するフレーム(xprev(n)、n=Lから2L-1)のMDCT係数の逆MDCTの出力の第2の部分と、現在のフレーム(xcur(n)、n=0からL-1)のMDCT係数の逆MDCTの出力の第1の部分の重み付け合計によって得られる。現在のフレーム(xcur(n)、n=Lから2L-1)のMDCT係数の逆MDCTの出力の第2の部分は、メモリに記憶し、次のフレームの復元信号を得るために使用することができる。同様に、以下、「現在のフレームの第1の部分」、「現在のフレームの第2の部分」、「現在のフレームの復元信号」という用語が使用される。したがって次のフレームでは、現在のフレームの第2の部分は、先行するフレームの第2の部分になる。
【0048】
詳細には、アタックが現在のフレームの第1の部分または第2の部分に位置している場合、本発明の主題である上記方法には、現在のフレームの復元信号および現在のフレームの第2の部分の信号から連結信号を生成するステップと、この連結信号を決定済み長さのサンプルの偶数数のサブブロックに分割するステップと、決定済み長さのサブブロックの各々の信号のエネルギーを計算するステップと、最大エネルギーサンプルのランクを表す第1の指標、および最後の高エネルギーサンプルを表す第2の指標を計算するステップと、ディジタル可聴信号の第1のサブブロックの偶数数のサブブロックの半分である数に対する最小エネルギーを計算するステップと、最小エネルギーに対する最大エネルギーの比率が決定済み閾値の値より大きく、プリエコーの危険が信号の低エネルギー部分のみに存在することが明らかになると、第1の指標と第2の指標の間のランクの高エネルギーサンプルに対するあらゆる減衰アクションを禁止するステップが含まれている。
【0049】
第1および第2の指標を決定することにより、後者の間に、意味のない、あるいは信号を損傷するエコーの減衰を除去しなければならない高エネルギー信号に対応する擬似警報レンジを画定することができる。
【0050】
多層階層型エンコーダによって、エコーを生成しない少なくとも1つの時間デコーダと、エコーを示す可能性のある少なくとも1つの変換デコーダとを備えた本発明の主題であるデコーダ中に生成されるディジタル可聴信号のエコーを弁別し、かつ、減衰させるためのデバイスは、少なくとも時間デコーダ上および変換デコーダ上に、高エネルギーゾーンへのトランジションに先行する低エネルギーゾーンを弁別する手段と、現在のフレームの非弁別ゾーンに対応する擬似警報ゾーンを画定する手段と、減衰利得値を使用してエコーの初期処理を決定する手段と、現在のフレームの低エネルギー弁別ゾーンに適用されるエコーの初期処理に基づいてエコーを減衰させる手段と、擬似警報ゾーンに適用される初期処理のエコーの減衰を禁止する手段とを備えたことを特徴としている。
【0051】
それらについては、以下の説明を読み、また、仏国特許出願第05 07471号に記載されている従来技術に関連する図1および図2aないし2e、ならびに従来技術に関連する図2fとは別の添付図面を考察することにより、より深く理解されよう。
【0052】
以下、本発明の主題である方法について、図2bおよび3aに関連してより詳細に説明する。
【0053】
本発明の主題である方法によれば、復号化におけるディジタル可聴信号のエコーを弁別することができる。このディジタル可聴信号は、変換符号化および予測符号化から多層階層型符号化によって生成される。
【発明を実施するための最良の形態】
【0054】
図2bを参照すると、
- xTj(n)は、多層階層型デコーダの層j変換デコーダによって引き渡される逆変換復号化によって引き渡される信号を表し、
-
【0055】
【数1】
【0056】
は、対応する階層型デコーダ中の層i予測型デコーダによって実行される予測復号化によって引き渡される信号を表している。信号
【0057】
【数2】
【0058】
は、エコーを生成しない予測型デコーダからの出力信号であるか、あるいはこの信号のフィルタリングされたバージョンまたはこの信号の短期間エネルギー表現のいずれかであってもよい。
【0059】
図2a、図2bおよび図3aを参照すると、本発明の主題である方法には、ステップAで、エコーを生成しない復号化に由来する信号の振幅に対するエコーを生成する復号化に由来する信号の振幅の比率R(k)の値と閾値の値Sを実時間で比較するステップが含まれていることに留意されたい。
【0060】
図3aでは、エコーを生成する復号化に由来する信号の振幅はEnvTj(k)で表されており、また、エコーを生成しない復号化に由来するこの信号の振幅はEnvPi(k)で表されている。
【0061】
示されている表記法を参照すると、とりわけ、有利には、エコーを生成する復号化に由来する信号の振幅およびエコーを生成しない復号化に由来する信号の振幅は、それぞれ非エコー生成復号化に由来する信号のエコー生成復号化信号xTj(n)の包絡線信号、
【0062】
【数3】
【0063】
によって表現することができることは理解されよう。
【0064】
図3aでは、振幅信号の獲得は、
【0065】
【数4】
【0066】
の関係で表現されている。
【0067】
一般的には、それぞれ非エコー生成復号化に由来する信号のエコー生成復号化に由来する信号の振幅信号は、上で言及した包絡線信号によってだけでなく、上で言及した振幅を表す絶対値などの任意の信号によって表現することができることに留意されたい。
【0068】
同じ図3aを参照すると、非エコー生成復号化に由来する信号の振幅に対するエコー生成復号化に由来する信号の振幅の比率は、
【0069】
【数5】
【0070】
の関係で表現されていることに留意されたい。
【0071】
前述の表記法を参照すると、図3aの比較ステップAには、比率R(k)の値と閾値の値Sを比較するステップ、優位性と同等性の比較を適用するステップが含まれていることに留意されたい。
【0072】
ステップAに対する正の応答で、上記比率の値が閾値の値Sより大きいか、あるいは閾値の値Sに等しい場合、上で言及した試験により、ステップBで、変換符号化に由来するエコーが現在のフレームの中に存在している、と結論付けることができ、このエコーは復号化に現われる。
【0073】
エコーの存在は、ステップBで、
【0074】
【数6】
【0075】
の関係で表現される。
【0076】
一方、ステップAの試験に対する負の応答で、上記比率の値が閾値の値Sより小さい場合、ステップAの試験により、ステップCで、変換符号化に由来するエコーは現在のフレームには存在していない、と結論付けることができる。
【0077】
この関係は、ステップCで、
【0078】
【数7】
【0079】
で表される。
【0080】
とりわけ有利な方法では、本発明の主題である方法の実施態様によれば、現在のフレーム内におけるエコーの元の位置は、実際、現在のフレーム内における、閾値の値Sにほぼ等しい比率の値の位置によって与えられることに留意されたい。
【0081】
上記の値は、図3aのステップBで、
Pos k|R(k)=S
の関係で与えられる。
【0082】
一般に、図2bまたは3aのステップAの試験および最終的には試験CおよびBの実施、とりわけステップAに続くステップBの試験の実施に関して、比率R(k)の値は、現在のフレーム全体にわたって平滑化された値として計算することができ、それにより、上記比率の値と閾値の値Sを実時間で比較することができることは理解されよう。上記比率の値がSの値に等しい場合、エコーの元の位置は、現在のフレーム内の復号化信号の対応するサンプルのランクkの特定の値によって与えられる。
【0083】
エコーが存在している場合、ステップBに続いて実施されるステップDには、XTj(n)lowで示されている低エネルギーディジタル可聴信号部分におけるエコーの存在を弁別するステップが含まれている。対応するエコーは、EXTj(n)lowで示されている。また、ステップDで、上記弁別から、現在のフレームの非弁別ゾーンに対応する擬似警報ゾーンを画定することができる。
【0084】
ステップDにおける弁別に続いてステップEが実施される。ステップEには、減衰利得値を使用してエコーの初期処理を決定するステップ、および低エネルギーディジタル可聴信号部分のエコーを減衰させるステップが含まれている。ステップEに続いて実施されるステップFには、XTj(n)hiwで示されている高エネルギーディジタル可聴信号部分のエコーの減衰を禁止するステップが含まれている。
【0085】
一般に、本発明の主題である方法は、複数の信号帯域、たとえば非制限の実施例として、低帯域[0〜4kHz]および高帯域[4〜8kHz]の2つの周波数帯域のエコーの弁別および減衰を実行することによって実施することができる。この実施例では、信号の個々の帯域に時間/変換多層エンコーダが実施されている。低帯域では、変換エンコーダは、知覚領域における元の信号と復号化されたCELP信号の差を量子化し(知覚フィルタW(z)によってフィルタリングされた後に)、一方、高帯域では、変換エンコーダは、知覚フィルタリングすることなく元の信号を量子化し、復号化の際に、適切に復号化された帯域が、帯域拡張モジュールによって供給される時間信号のMDCTに由来する既に復号化済みの帯域に取って代わる。したがって、本発明によって提供される加算は、個々の副帯域のデバイスに対して記述される。
【0086】
図3bは、図2aに示されているタイプのCELP予測型/多層変換デコーダ中の信号の低帯域の合成に伴う可聴信号を示したものである。n=0ないしn=85のサンプル間のプリエコーの形態のエコーの出現を免れない変換出力段(完全な復元を備えたフィルタバンクであるTDAC(時間領域エイリアシング相殺(Time Domain Aliasing Cancellation))デコーダからの出力信号)とは異なり、予測/CELP復号化段はエコーを生成しないことが分かる。したがって、このことから、CELP予測型エンコーダの出力段を変換復号化段からの出力と組み合わせて使用して、エコーを減衰させることができる、と結論付けられる。
【0087】
復号化されたCELP信号の加算および復号化された変換信号の加算によって得られる最終出力信号自体も、同じエコー現象の発生源である。
【0088】
従来技術によるエコー減衰デバイス(たとえば図2bに示されているデバイス)が起動されると、図3cに示されている信号が得られる。最初の3つのプロットは、図3bに示されている信号と同じ信号を示している。その次の3つのプロットは、それぞれ、
- 0と1の間の値を有するプリエコー処理利得(図2bの長方形1)
- プリエコー処理後の変換復号化段から出力される信号(TDACデコーダ出力)。アタックに先行するエコーは除去されているが、変換デコーダに由来するアタック部分は、不適切に減衰していることが分かる。本発明の主題である方法およびデバイスの基本的な利点の1つは、この欠点が克服されることである。
- CELPデコーダからの出力信号とTDACデコーダからの出力の合計である、聴取経験におけるディジタル可聴信号の劣化に反映されるプリエコーをもたらさず、また、そのアタックがほとんど消失した最終出力信号
を表している。
【0089】
本発明の主題である方法およびデバイスによれば、図3dに示されているように、従来技術による1つまたは複数の変換復号化段の出力の誤った減衰を除去することができる。この図の可聴出力は、その前の図の可聴出力と同じである。
【0090】
図3cと図3dを比較すると、本発明の主題である方法によれば、アタックの瞬間にエコーの減衰を禁止することができ(サンプル80ないし120)、かつ、アタックの前のエコーを除去することができることが分かる(プリエコー処理利得参照)。それによる結果は、プリエコーが処理された後のTDACデコーダの出力部に復元される信号は、もはやエコーを有していないこと、およびアタックの良好な復元が得られることである。これは、この信号とCELPデコーダの出力を加算することによって得られる、もはやエコーをもたらさない最終出力信号についても同様である。
【0091】
次に、エコー処理利得生成プロセスについて、図4aおよび図4bを参照して説明する。
【0092】
エコーが存在している場合、MDCT窓の中の信号の一部のエネルギーを他の部分のエネルギーより著しく大きくしなければならない(アタック)。エコーが観察されるのは低エネルギー部分であり、したがってエコーを減衰させる必要があるのはこれらの部分のエコーのみであり、高エネルギーゾーンのエコーは減衰させる必要はない。
【0093】
2つの可能な場合が存在し、アタックは、現在のフレームまたは次のフレームのいずれかに位置している。第1の場合、エコーを不適切に減衰させる危険が存在している。
【0094】
図4aは、図2fを参照した、サンプルn=0ないし2L-1に対する前記連結信号を示したものである。サンプルn=0ないしN=L-1(L=160)に対しては、前記連結信号は、現在のフレームの復元信号に等しく、また、サンプルn=Lないし2L-1に対しては、前記連結信号は、現在のフレームの第2の部分に等しい。次のフレームでは、この第2の部分が信号xprev(n+L)に対応する先行フレームになる。
【0095】
本発明の主題であるエコー減衰修正プロセスは、ind1およびind2の2つの指標、エコーを抑制するために従来技術によるデバイスのアクションを禁止する必要のある可能領域の始まりおよび終わりを引き渡す。ind1>ind2は、現在のフレームにはこのようなゾーンは存在していないことを表している。
【0096】
以下、本発明の主題である方法の非制限の好ましい実施形態について、図4aおよび4bに関連してより詳細に説明する。
【0097】
上で言及した、図4aに示されている実施形態によれば、本発明の主題である方法には、
- 図4aの信号を長さN2=L/K2の2K2個のサブブロックに再分割するステップと、
- 図4aに示されている信号の長さN2のサブブロックの各々のエネルギーを計算するステップ
が含まれている。信号の第2の半分が対称であるため、計算しなければならないのは第1の1.5K2個のブロックのエネルギーのみであることに留意されたい。
【0098】
本発明の主題である方法には、さらに、
- 最大エネルギーブロックの第1のサンプルの指標ind1を計算するステップと、
- 復元信号xrec(n)の第1のK2個のブロック全体の最小エネルギーを計算するステップ
が含まれている。
【0099】
最小エネルギーに対する最大エネルギーの比率が閾値の値Sより大きい場合、プリエコーの危険が存在しているが、それは、低エネルギーゾーンのみである。高エネルギーサンプルからのエコーは存在していない。
【0100】
エコーを減衰させる従来技術によるエコー検出デバイスの場合、高エネルギーサンプルを含む信号のゾーンを画定している指標ind1およびind2によって範囲が定められた高エネルギーサンプルに対する後者の減衰アクションを禁止し、利得を値1にリセットする必要がある。図4aの一番下に表現式で示されているこれらの2つの指標は、次の通りに決定される。
- ind1は、最大エネルギーが生じるブロックの第1のサンプルの指標である。
- ind2は、ind1+C-1とL-1の間の最小であり、処理されるブロックの終わりの指標である。Cは、サンプルの数としての擬似警報ゾーンの最大長さであり、1つまたは複数のブロックの継続期間の位数の値にセットされる。一例として、C=80の値によって良好な結果が得られる。
【0101】
図4aに示す実施例では、プリエコーの原因になるアタックが次のフレームで検出され、ind1の方がind2より大きいため、エコー減衰の禁止は存在していない。これによる結果は、現在のフレーム全体、つまりn=0から159までのサンプルに対して適切にエコーが減衰することである。
【0102】
図4bに示されているように、1つの信号フレーム(L=160サンプル)のオフセットが適用され、したがってアタックは、現時点では現在のフレームに位置している。
L=160;K2=4;N2=L/K2=40;C=80
【0103】
この状況の場合、既に説明した最大エネルギーおよび最小エネルギーを計算するための手順が反復される。
【0104】
最大エネルギーは、n=80で始まるブロックに対して見出されること、また、この場合、最小エネルギーに対する最大エネルギーの比率は、閾値の値Sより大きいとは言えないが極めて大きいことが分かる。一例として、S=8の値によって良好な結果が得られる。
【0105】
この場合、最大エネルギーの前にプリエコーが存在しているが、それとは反対に、その最大エネルギーが位置しているブロックおよびいくつかの後続するブロックは、エコー現象を免れることができる。したがって、本発明の主題である方法によれば、アタックの瞬間およびアタック後にエコー減衰の起動を禁止しなければならない。このエコー減衰の起動の禁止は、図4bにおけるn=80から159までの範囲のサンプルに対して実施され、上で言及したサンプルn=80ないし159の間に含まれているゾーンは、擬似警報ゾーンとして画定される。
【0106】
したがって、図3dでは、n=80から120までのサンプルに対しては事実上1に等しい利得(平滑化された)が得られ、図3cにおける同じサンプルと比較すると、この利得減衰は禁止されている。また、プリエコーが処理された後のTDACデコーダから出力される信号のn=80から160までのサンプルは、適切に減衰している。これによる結果は、この場合、この信号とCELPデコーダからの出力信号を合計することによって得られる最終出力信号が適切に復元されることである。
【0107】
本発明の主題である方法は、図4cに関連して以下で説明するように、正弦波信号のための低周波数帯域または高周波数帯域の多層エンコーダのエコーを減衰させるための特定の変形態様の中で実施することも可能である。
【0108】
図4cは、時間デコーダ、場合によっては、図2aで説明したタイプの可聴信号の高帯域の予測型/多層変換における信号の合成に伴う可聴信号を示したものである。復号化される信号は正弦曲線である。入力信号と比較すると、時間復号化段の出力が劣化していることが分かる。これは、この事例の場合、正弦曲線の適切な復元を可能にするには遅すぎるビットレートで時間デコーダが動作していることによるものである。TDACデコーダからの出力信号は適切である。最終出力信号についても同様である。
【0109】
たとえば図2aに示されているような従来技術によるエコー減衰プロセスが起動されると、図4dに示されている信号が得られる。最初の3つのプロットは、図4cに示されている信号と同じ信号を示している。その次の3つのプロットは、それぞれ、
- 0と1の間の値のエコー減衰利得(図2bの長方形1)
- エコー処理後のTDACデコーダから出力される信号。エコーの減衰が起動され、それにより、減衰利得による掛算によって振幅変調された、元の正弦曲線を忠実に再現していない正弦曲線に等しいTDAC段出力信号が生成されていることが分かる。
- TDACデコーダ出力信号の欠陥と同じ欠陥を示す最終出力信号。これらの2つの信号は全く同じである。
を表している。
【0110】
本発明によれば、図4eで説明するように、信号の不十分なモデル化を除去することができる。
【0111】
正弦曲線が存在しているエコー減衰の禁止動作について、図5を参照して説明する。既に説明した最大エネルギーおよび最小エネルギーを計算するための手順がここでも取り上げられる。
【0112】
上記の図から、最大正味エネルギーは存在しないことが分かる。この場合、最小エネルギーに対する最大エネルギーの比率は極めて小さく、閾値の値S未満である。これは、エコーが存在しないことを示している。したがって、本発明の主題である方法によれば、フレーム全体にわたるエコー減衰器の起動を禁止することが肝要である。これは、エコー処理利得が1に等しい図4eのn=0からn=159までの範囲のサンプル(これらのサンプルに対するエコー処理利得は1に等しい)に対して示されている。プリエコー処理後のTDACデコーダ出力部の信号は適切に減衰している。これによる結果は、この場合、この信号と全く同じ最終出力信号が適切に復元されることである。
【0113】
図5では、
L=160;K2=4;N2=L/K2=40;C=80;S=8
である。
【0114】
図6は、ポストエコー現象を示したものである。
【0115】
図6を参照すると、入力信号の速やかな衰退を含んだフレームの中およびその次のフレームの中の出力信号にポストエコー現象を観察することができる。強い衰退に続くフレーム(ポストエコーゾーン)では、エコーの減衰を禁止しないことが肝要であることは明らかである。
【0116】
ポストエコー状況は、先行するフレームの最大エネルギーと現在のフレームの最大エネルギーの間の比率をチェックすることによって検出することができる。この比率が閾値の値より大きい場合、そのフレームは、ポストエコーを生じるフレームと見なされ、エコー減衰アルゴリズムは、このフレームのエコーの減衰を維持する。
【0117】
次に、本発明の主題による、多層階層型エンコーダによって生成されるディジタル可聴信号のエコーを弁別し、かつ、減衰させるためのデバイスについて、図7に関連してより詳細に説明する。
【0118】
一般に、図7に示されている、本発明の主題であるデバイスは、図2bに示されているように、従来技術によるエコー弁別デバイスに組み込まれていることは理解されよう。
【0119】
本発明の主題であるデバイスは、従来技術による弁別デバイスと同様の方法で、エコーの元の位置の存在および減衰値を計算するためのモジュールであって、一方では、複数の予測型デコーダのランクiの予測型デコーダの第2の出力によって引き渡される補助信号、
【0120】
【数8】
【0121】
を受け取り、また、他方では、複数の逆変換デコーダのランクjの逆変換デコーダの出力によって引き渡される復号化信号xTj(n)を受け取るモジュールを備えている。
【0122】
本発明の主題であるデバイスは、さらに、望ましくないエコーを確実に減衰させることができるよう、ランクjの逆変換デコーダによって引き渡される現在のフレームの復元信号、および存在、元のエコー位置ならびに適用可能エコー減衰値信号を受け取るエコー減衰モジュールを備えている。
【0123】
したがって、図7には、ランクiの予測型デコーダおよび変換デコーダ、ランクjのMDCTデコーダが、既に説明したアーキテクチャに従って、非制限の方法で示されている。
【0124】
次に、本発明の主題による、多層階層型エンコーダによって生成されるディジタル可聴信号のエコーを弁別し、かつ、減衰させるためのデバイスの非制限の好ましい実施形態について、図7に関連して説明する。
【0125】
図7に示されている、本発明の主題であるデバイスには、図2bに示されている従来技術によるデバイスのアーキテクチャと同じアーキテクチャが使用されているが、その特定の構成要素は特化されている。
【0126】
詳細には、図7に示されているように、現在のフレームの少なくとも1つの低周波数帯域および/または高周波数帯域におけるエコーの存在および元の位置を計算するための構造は、有利には、デバイスのデマルチプレクサ00に結合された、チャネルLで示されている、ディジタル可聴信号のための低周波数帯域復号化チャネル、およびチャネルHで示されている、ディジタル可聴信号のための高周波数帯域復号化チャネルを備えている。
【0127】
また、加算回路14は、高周波数帯域復号化チャネルであるチャネルHおよび低周波数帯域復号化チャネルであるチャネルLによってそれぞれ引き渡される信号を受け取り、かつ、復元されたディジタル可聴信号を引き渡している。
【0128】
図7を考察すると、とりわけ、高チャネルおよび低チャネルは、それぞれ、図2bに示されている従来技術による構造のランクiの予測型デコーダおよびランクjの変換デコーダにほぼ対応していることが理解されよう。
【0129】
詳細には、図7に示されているように、低周波数帯域復号化チャネル、チャネルLは、有利には、逆多重化されたディジタル可聴ビットストリームを受け取り、かつ、予測復号化によって復号化された信号を引き渡す予測型復号化モジュール01、および逆多重化されたディジタル可聴ビットストリームを受け取り、かつ、
【0130】
【数9】
【0131】
で示されている、低周波数帯域における符号化差信号のスペクトル係数を引き渡す変換復号化モジュール04を備えている。
【0132】
低周波数帯域復号化チャネル、チャネルLは、さらに、低周波数帯域における符号化差信号
【0133】
【数10】
【0134】
のスペクトル係数を受け取り、かつ、
【0135】
【数11】
【0136】
で示されている低周波数帯域ディジタル可聴信号を引き渡す逆変換周波数-時間置換モジュール05を備えている。
【0137】
さらに、低周波数帯域復号化チャネル、チャネルLに特化された、低エネルギー信号部分にエコーが存在していることを弁別するための資源および減衰禁止資源は、図7に示されているように、擬似警報ゾーンを画定するためのモジュール15と、低周波数帯域ディジタル可聴信号
【0138】
【数12】
【0139】
から、また、予測復号化によって復号化された信号からエコーを検出するためのモジュール16とを備えている。エコー検出モジュール16は、Gloで示されている低周波数利得値を引き渡している。
【0140】
最後に、低周波数帯域復号化チャネル、チャネルLは、変換によって復号化され、かつ、WNB(z)-1によってフィルタリングされた信号に低周波数利得値Gloを適用するための回路17、加算資源08、ポストフィルタリング資源09、オーバサンプリング資源10およびQMF合成フィルタリング資源11を備えており、これらの様々な構成要素は縦続接続されており、加算器14にディジタル可聴低周波数帯域合成信号を引き渡している。
【0141】
さらに、同じく図7に示されているように、高周波数帯域復号化チャネル、チャネルHは、有利には、逆多重化されたディジタル可聴ビットストリームを受け取り、かつ、プリエコーが存在しない時間基準信号を引き渡す帯域拡張チャネル02を備えている。この信号は、高周波数帯域復号化チャネルのための基準としての役割を果たしており、事実上、低周波数復号化チャネル、チャネルLのための予測復号化機能を提供している。
【0142】
高周波数帯域復号化チャネル、チャネルHは、さらに、逆多重化されたディジタル可聴ビットストリームを受け取り、かつ、MDCT変換時間-周波数置換03を介して時間基準信号のスペクトル係数を受け取る変換復号化モジュール04を備えている。MDCT変換時間-周波数置換03は、
【0143】
【数13】
【0144】
で示されている高周波数の時間基準信号のスペクトル係数を変換復号化モジュール04に引き渡すことができる。
【0145】
後者は、
【0146】
【数14】
【0147】
で示されている高周波数帯域符号化ディジタル可聴信号のスペクトル係数を引き渡している。
【0148】
ディジタル可聴信号のための高周波数帯域復号化チャネル、チャネルHは、さらに、逆変換周波数-時間置換モジュール06を備えており、逆変換動作は、高周波数帯域のディジタル可聴信号
【0149】
【数15】
【0150】
のスペクトルの係数を受け取り、かつ、
【0151】
【数16】
【0152】
で示されている高周波数帯域時間ディジタル可聴信号を引き渡す、「加算-重畳」で示されている加算-重畳動作が後続するMDCT-1で示されている。
【0153】
低周波数帯域復号化チャネルのアーキテクチャと同様の方法で、プリエコー擬似警報ゾーンを画定するための資源18、およびエコー減衰禁止資源を形成するプリエコーを検出するための資源19が提供されている。後者は、擬似警報ゾーンを画定するためのモジュール18、および高周波数帯域ディジタル可聴信号
【0154】
【数17】
【0155】
から、また、帯域拡張モジュールから出力される信号からエコーを検出するためのモジュール19からなっている。エコー、詳細にはプリエコーを検出するためのモジュール19は、Ghiで示されている高周波数利得値信号を引き渡している。
【0156】
最後に、高周波数帯域ディジタル可聴信号に高周波数利得値を適用するための回路20が提供されており、その後段に、加算回路14にディジタル可聴信号の高周波数帯域合成信号を引き渡すオーバサンプリング回路12および高域通過フィルタリング回路13が提供されている。
【0157】
図7に示されている本発明の主題であるデバイスの動作は次の通りである。それぞれ20msフレームを表すビットがデマルチプレクサ00で逆多重化される。ここでの説明は、8ビットから32ビットまで動作する復号化に対するものである。実際には、ビットストリームは、8kbit/s、12kbit/s、14kbit/sおよび14kbit/sと32kbit/sの間の値を有しており、必要に応じてビットレートを選択することができる。
【0158】
第1の狭帯域合成(0〜4000Hz)を生成するために、CELPデコーダには8kbit/sおよび12kbit/sの層のビットストリームが使用されている。14kbit/sの層と結合したビットストリーム部分が帯域拡張モジュール02によって復号化される。高帯域(4000〜7000Hz)中に得られる時間信号が、MDCTモジュール03によってスペクトル
【0159】
【数18】
【0160】
に変換される。受け取ったビットレート(14kbit/sないし32kbit/s)の可変部分によって、低帯域差信号および高帯域置換信号のMDCT係数の復号化が制御され、また、知覚的に重要な順序で符号化されたMDCT係数を復号化するためのモジュール04が制御される。低帯域では、符号化された差信号
【0161】
【数19】
【0162】
のスペクトルには、デコーダが受け取っていない非復号化帯域に対する復元スペクトル帯域およびゼロが含まれている。高帯域では、
【0163】
【数20】
【0164】
には、帯域拡張に由来するスペクトル
【0165】
【数21】
【0166】
と、直接符号化された高帯域のMDCT係数のスペクトル帯域の組合せが含まれている。逆MDCT周波数-時間置換モジュール05および逆MDCT加算/重畳モジュール06によってこれらの2つのスペクトルが、時間領域
【0167】
【数22】
【0168】
および
【0169】
【数23】
【0170】
に調整される。
【0171】
モジュール15および18によって、復元フレーム内における従来技術によるエコーの減衰を禁止することが肝要であるすべてのゾーンが決定される。
【0172】
既に説明したように、モジュール15は、入力信号として、現在のフレームの復元信号
【0173】
【数24】
【0174】
および図7にMemloで示されている現在のフレームの第2の部分を受け取っている。
【0175】
図8aおよび図8bは、モジュール15の機能を実行するための流れ図の2つの実施例を示したものである。モジュール15の出力は、擬似警報ゾーンで示されている、エコーの減衰を適用する必要のないゾーンの始まりおよび終わりを画定している2つの指標からなっている。これらの2つの指標が同じである場合、それは、現在のフレーム内における従来技術によるエコーの減衰を修正する必要がないことを意味している。
【0176】
ブロック07は、逆変換デコーダ05の出力の、エンコーダ上で実行された知覚フィルタリングの逆知覚フィルタリングを実行している。モジュール16は、この信号の包絡線とCELPデコーダの出力信号の包絡線との間の比率に応じて、本発明によるモジュール15内で得られる指標を同じく考慮することによってプリエコー減衰利得を決定する。モジュール16内では、特定の範囲の利得値が1にリセットされ、実際、それらを値1にリセットし、エコー減衰が存在しない状態にすることにより、従来技術によって確立される利得値を禁止することができる。
【0177】
図8cの流れ図は、モジュール16の一例示的実施形態を示したもので、従来技術による状態と、本発明によって実施される修正、すなわち図8cのブロック310ないし313を組み合わせたものである。モジュール16は、さらに、低域通過フィルタリングによって利得を平滑化するためのモジュールを備えており、図8dは、その一例示的実施形態を示したものである。
【0178】
モジュール17は、エコーが減衰した信号を得るために、モジュール16によって計算された利得を、逆知覚フィルタ07によってフィルタリングされた変換デコーダの出力信号に適用している。次に、この信号が加算器08によってCELPデコーダの出力信号に加えられ、それにより新しい信号が得られる。ポストフィルタリングモジュール09によってポストフィルタリングされるこの新しい信号は、復元された低帯域信号である。この信号は、オーバサンプリング10を経て低帯域合成QMFフィルタ11に転送された後、加算器14によって高帯域の信号に加えられ、それにより復元信号が得られる。
【0179】
高帯域では、モジュール18の動作は、モジュール15の動作と全く同じである。モジュール18は、
【0180】
【数25】
【0181】
から、また、現在のフレームの復元信号および図7にMemhiで示されている現在のフレームの第2の部分の復元信号から、エコーの減衰を適用する必要のないゾーンの始まりおよび終わりを決定する。
【0182】
モジュール19は、周波数-時間置換06の出力信号の包絡線と帯域拡張02の出力の包絡線の比率に応じて、モジュール18によって得られる指標を同じく考慮することによってプリエコー減衰利得を決定する(図8aおよび図8bに示されている、本発明(図8c参照)に従って利得が値1にセットされる流れ図参照)。次に、得られた利得が低域通過フィルタリングによって平滑化される(図8d参照)。モジュール20は、モジュール19によって計算された利得を周波数-時間置換06の出力の結合信号
【0183】
【数26】
【0184】
に適用する。
【0185】
オーバサンプリング10および低域通過フィルタリング11によって合成された低帯域からの信号と、オーバサンプリング12および高域通過フィルタリング13によって同じく合成された高帯域からの信号とを加算14することにより、16kHzでサンプルされた広帯域出力信号が得られる。
【0186】
図7に示されているモジュール15および18によって実行されるエコー減衰禁止の動作について、図4a、図4bおよび図4cに関連する説明を参照して、図8aの流れ図に関連して説明する。
【0187】
流れ図の最初の部分である、103で参照されているステップの周りには、K2個のサブブロックである、加算/重畳後の復元信号xrec(n)のエネルギーを計算するステップが含まれている。この流れ図におけるxrec(n)は、それぞれ、図7の信号
【0188】
【数27】
【0189】
および
【0190】
【数28】
【0191】
に対応している。
【0192】
次の部分である、107で参照されているステップの周りには、逆MDCTの出力部分で、現在のフレームの第2の部分の個々のサブブロックのエネルギーを計算するステップが含まれている。信号のこの部分の対称性のため、異なっているのはK2/2値のみである。
【0193】
ステップ110で、復元信号のK2個のサブブロックに対する最小エネルギーminenが計算される。ステップ111で、K2+K2/2個のブロックに対して、信号サブブロックxrec(n)およびxcur(n)の最小のエネルギーが計算される。
【0194】
図8aに示されている流れ図の最後の部分には、エコー減衰利得を値1にリセットすることができる指標ind1およびind2を計算するステップが含まれており、したがって従来技術による利得の減衰が禁止される。そのために、ステップ112で、最小エネルギーに対する最大エネルギーの比率が計算され、かつ、閾値の値Sと比較される。この比率が閾値の値Sより小さい場合、ind1が0にセットされ、ind2がL-1にセットされる。つまり、引き続いて、n=0からn=L-1の範囲にわたる現在のフレーム全体の利得が1にリセットされる。実際には、エネルギー間の差は小さく、したがってアタックは存在していない。上記比率が閾値の値Sより大きいか、あるいは閾値の値Sに等しい場合、Cがサンプルの決定済みの数である値ind1+C-1を使用してind2が例示される。したがって一定の範囲のサンプルが選択され、アタックが存在しているこの範囲のサンプルに対するエコー利得の減衰を禁止することにより、この範囲の利得が1にリセットされる。値ind2がフレーム長(L)より大きい場合、ind2はL-1にセットされる。ind2は、そのフレームの最後のサンプルを指している。
【0195】
図8aに示されている流れ図による手順は、ポストエコーの減衰を不適切に禁止している。ポストエコーの場合、先行するフレームにアタックが存在しており、一方、現在のフレームおよび次のフレームでは、エネルギーを極めて一様にすることができる。さらに、このエネルギーは、通常、減少する。これらの2つの理由のうちの1つのため、図8aに示されている手順によって擬似警報が不適切に検出される。
【0196】
ポストエコーの減衰処理をそのままの状態で維持するために、図8aに示されている手順に修正が加えられる。以下、プリエコーおよびポストエコーの減衰を禁止するためのサンプルの範囲を計算するための修正流れ図について、図8bを参照して、修正手順の中で説明する。
【0197】
図8bに示されている流れ図の208で参照されているステップまでの最初の部分は、図8aに示されている流れ図の108で参照されているステップまでの部分と同様である。
【0198】
また、次の部分でも、ポストエコー利得の減衰の起動を禁止する必要のないポストエコーの場合が考慮されている。
【0199】
最初に、ステップ210で、復元信号のK2個のブロック全体の最大エネルギーmaxrecが計算される。先行するフレームからの最大エネルギーmaxprevがメモリに記憶されると、次に、現在の最大maxrecに対するmaxprevの比率が比較される。この比率が閾値の値S1より大きい場合、ポストエコー状況が存在し、ポストエコー減衰を禁止してはならない。したがって、ステップ212で、次のフレームのためにmaxrecが記憶され、また、ind1がLで例示され、かつ、ind2がL-1で例示され、手順が終了する。上記比率が閾値の値S1に等しいか、あるいはそれより小さい場合、ステップ213で、次のフレームのためにmaxrecが記憶される。次に、ステップ214で、連結信号の1.5K2個のすべてのブロック全体の最大エネルギーmaxenおよび最大エネルギーブロックの開始指標が計算される。次に、最小エネルギーが計算され、次に、ステップ112、113、114および115で、最小エネルギーに対する最大エネルギーの比率が、図8aに示されている流れ図と同様の方法で比較される。比率が閾値の値より小さい場合、ind1が0にセットされ、ind2がL-1にセットされる。つまり、0からL-1までの範囲またはフレーム全体のサンプルの利得を1にセットすることによってエコーの減衰が禁止される。上記比率が閾値の値に等しいか、あるいはそれより大きい場合、Cがサンプルの固定数である値ind1+C-1がind2に割り当てられ、次に、ind1からind2までの範囲のサンプルの利得が値1で例示される。ind2の値がフレームの長さ(L)より大きい場合、L-1でind2が例示される。この場合、ind2はフレームの最後のサンプルを指している。
【0200】
次に、擬似警報レンジ全体にわたるエコー減衰の禁止について、図8cに関連して説明する。図8cに示されている流れ図の最初の部分は、図2dに示されている、エコー減衰を計算するための従来技術による流れ図が繰り返されている。
【0201】
変換エンコーダに由来する信号の包絡線を計算するためのステップ301、および時間エンコーダに由来する信号の包絡線を計算するためのステップ302が、流れ図の最初の部分に追加されている。また、図8cに追加されている、図2dにはない本質的な部分は、図8cのステップ310ないし314に関係している。この部分は、サンプルind1とind2の間でエコー減衰利得を値1にセットすることに関連している。本発明の主題である方法によれば、ind1からind2の範囲は、従来技術によるエコー減衰の起動が不適切に動作し、したがって既に説明したように修正しなければならないサンプルの範囲として決定されている。
【0202】
図8cに示されている方法の実施態様の場合、実際、不連続性を回避するために、第1次数帰納フィルタによって、信号の個々のサンプルに対して初期利得係数g(n)が平滑化される。平滑フィルタの伝達関数は、
【0203】
【数29】
【0204】
で与えられる。
【0205】
したがって、時間領域におけるフィルタリングの式は、
g'(n)=αg'(n-1)+(1-α)g(n)
である。
【0206】
先行する関係では、αは、0と1の間の実数値である。
【0207】
実際には、この初期利得は、k2個(一般的にはk2=40)のサンプル毎に計算され、サブブロックのすべてのサンプルに対してその値が繰り返される。図8dに示されている流れ図の平滑化が使用されるのは、そのために初期利得が階段状になることによるものである。このエコー減衰利得の平滑化は、一例として図3dに明確に示されており、小さい値から値1まで利得が緩やかに大きくなっている。
【0208】
擬似警報領域を画定するためのモジュール15および/または18は、加算/重畳のための逆変換に由来する信号である入力信号のみで動作していることに留意されたい。このモジュールは、加算/重畳による逆変換を使用して、任意のデコーダ(階層型であれ非階層型であれ、あるいは多重帯域であれ非多重帯域であれ)の中で実施することができ、それにより、他のデバイスによって与えられる初期エコー減衰決定を保証するための復元信号が生成される。
【0209】
図9aは、例示的実施態様を示したものである。利得の開始は、エコー減衰利得を計算する他の任意の方法に基づくことができる。
【0210】
図9aでは、二重参照05と06、15と18、16と19および17と20は、実際、図7に示されている、擬似警報ゾーンを画定するためのモジュール15および18のための対応する構成要素を表している。また、利得初期化サブモジュール16a、19aが追加されている。
【0211】
図9bは、初期利得を計算するための例示的実施態様を示したものである。この事例では、最初に利得がゼロにセットされ、また、エコー減衰禁止手順を使用して、エコーが存在していないすべてのゾーンの利得が1にリセットされる。
【0212】
対応するサブステップには、擬似警報ゾーンを画定するためのモジュール15および18の場合と同様、値がゼロのサンプルnのランクの利得G(n)を初期化するためのサブステップ500、処理されるサンプルnのランクを第1の指標値ind1で例示するためのステップ501、第2の指標値マイナス1に対するランクnの劣等性を比較するための試験ステップ502が含まれている。
【0213】
この値に到達しない限り、ステップ503で利得値G(n)が値1に修正され、方法は、n=n+1によって次のランクサンプル504へ進み、サブステップ502で利得修正動作が終了する。
【0214】
本発明の主題である方法には、アタックの開始を決定する他の任意の方法と共に動作させることができる、アタックの開始を計算するための特定の例(個々のサブブロックの最大エネルギーを探索する)が使用されている。
【0215】
本発明の主題である方法および上で言及した変形態様は、MDCTフィルタバンク、もしくは実数値あるいは複素数値を有する完全な復元を備えた任意のフィルタバンク、またはほぼ完全な復元を備えたフィルタバンク、およびフーリエ変換あるいはウェーブレット変換を使用したフィルタバンクを使用しているあらゆる変換エンコーダのエコーの減衰に適用される。
【0216】
また、本発明には、媒体に記憶された、コンピュータまたは専用デバイスによって実行するための一連の命令を備えたコンピュータプログラムであって、これらの命令が実行されると、本発明の主題である、図3aないし5bに関連して上で説明した方法が後者によって実行されることを特徴とするコンピュータプログラムが包含されている。
【0217】
上で言及したコンピュータプログラムは、低エネルギー信号部分におけるエコーの存在を弁別するためのモジュール、エコー減衰モジュール、および図7ないし8dに関連して説明したエコー減衰検出デバイスの現在のフレームの信号の高エネルギー部分のエコーの減衰を禁止するためのモジュールに搭載される、直接実行することができるプログラムである。
【図面の簡単な説明】
【0218】
【図1】実例として、従来技術による、変換および加算/重畳によるディジタル可聴信号の符号化および復号化を示す略図である。
【図2a】「予測型復号化層i」と呼ばれる複数の非エコー生成デコーダと、「変換復号化層j」と呼ばれる複数の変換デコーダとを備えた階層型デコーダを示す図である。
【図2b】時間デコーダに由来する復号化信号および変換デコーダに由来する復号化信号を入力として備えた、エコーを弁別するためのデバイス1を示す図である。
【図2c】それぞれ時間デコーダおよび変換デコーダに由来する信号の時間包絡線およびエコー存在フラグを計算する方法を示す図である。
【図2d】エコーが存在している継続期間の間、加算/重畳出力信号に、変換復号化信号の包絡線に対する時間信号の包絡線の比率に等しい利得g(k)を掛け合わせることによってエコーを減衰させる方法を示す図である。
【図2e】エコーの弁別およびそれらの減衰が非制限方式で2つの周波数副帯域で実行される多層システムにおけるエコー弁別の原理を示す図である。
【図2f】変換エンコーダにおける現在のフレームの復元信号を得る方法を示す図である。
【図3a】本発明の主題である方法を実施するためのステップ全体の流れ図を実例によって示す図である。
【図3b】エコー減衰がない場合の、信号の低帯域のCELP予測型/多層変換エンコーダ中のディジタル可聴信号のタイミング図である。
【図3c】図2bに示す従来技術によるエコー減衰が存在する場合の、信号の低帯域におけるCELP予測型/多層変換エンコーダ中のディジタル可聴信号のタイミング図である。
【図3d】エコーの減衰が起動され、信号の低周波数帯域における誤った起動の減衰が禁止されたCELP/多層変換エンコーダ中の可聴信号のタイミング図である。
【図4a】本発明の非制限の好ましい第1の例示的実施態様による、エコー減衰の禁止を制御する前記連結信号を実例によって示すグラフである。
【図4b】本発明の非制限の好ましい第2の例示的実施態様による、エコー減衰の禁止を制御する前記連結信号を実例によって示すグラフである。
【図4c】正弦曲線を復号化する場合の、エコーの減衰がない場合の、信号の高周波数帯域の時間/多層変換デコーダ中のディジタル可聴信号のタイミング図である。
【図4d】従来技術による、正弦曲線を復号化する場合の、エコーの減衰が起動された信号の高周波数帯域における時間/多層変換デコーダ中の可聴信号のタイミング図である。
【図4e】本発明の主題である方法による、正弦曲線を復号化する場合の、減衰が起動された信号およびエコーの減衰が禁止された信号の高周波数帯域の時間/多層変換デコーダ中の可聴信号のタイミング図である。
【図5】本発明の非制限の好ましい第1の例示的実施態様による、エコー減衰の禁止を制御する前記連結信号を実例によって示すグラフである。
【図6】変換符号化およびフレーム加算/重畳プロセスにおけるポストエコーの生成を示すグラフである。
【図7】エコー減衰およびエコー減衰禁止手段を備えた本発明の主題による多層階層型エンコーダによって生成されるディジタル可聴信号のエコーを弁別し、かつ、減衰させるためのデバイスの機能線図を実例によって示す図である。
【図8a】プリエコー減衰禁止サンプルの範囲を計算するための流れ図を実例によって示す図である。
【図8b】プリエコーおよびポストエコー減衰禁止サンプルの範囲を計算するためのタイミング図を実例によって示す図である。
【図8c】プリエコー減衰禁止を実施する流れ図を実例によって示す図である。
【図8d】利得係数を平滑にする流れ図を実例によって示す図である。
【図9a】擬似警報ゾーンを画定するためのモジュールのブロック図を実例によって示す図である。
【図9b】図9aに示す利得計算サブモジュールの利得を計算するための流れ図を実例によって示す図である。
【符号の説明】
【0219】
1 0と1の間の値を有するプリエコー処理利得
00 デマルチプレクサ
01 予測型復号化モジュール
02 帯域拡張チャネル(帯域拡張モジュール)
03 MDCT変換時間-周波数置換
04 変換復号化モジュール
05 逆変換周波数-時間置換モジュール(逆変換デコーダ)
06 逆変換周波数-時間置換モジュール(逆MDCT加算/重畳モジュール)
07 逆知覚フィルタ
08 加算資源(加算器)
09 ポストフィルタリング資源(ポストフィルタリングモジュール)
10 オーバサンプリング資源
11 QMF合成フィルタリング資源
12 オーバサンプリング回路
13 高域通過フィルタリング回路
14 加算回路(加算器)
15 擬似警報ゾーンを画定するためのモジュール
16 エコー検出モジュール
16a、19a 利得初期化サブモジュール
17 変換によって復号化され、かつ、WNB(z)-1によってフィルタリングされた信号に低周波数利得値Gloを適用するための回路(モジュール)
18 プリエコー擬似警報ゾーンを画定するための資源(擬似警報ゾーンを画定するためのモジュール)
19 プリエコーを検出するための資源(エコーを検出するためのモジュール)
20 高周波数帯域ディジタル可聴信号に高周波数利得値を適用するための回路(モジュール)
【技術分野】
【0001】
本発明は、デコーダおよび対応するデバイス中のディジタル信号のエコーを安全に弁別し、かつ、減衰させるための方法およびデバイスに関する。
【背景技術】
【0002】
固定ネットワークであれ、移動ネットワークであれ、あるいは同報通信ネットワークであれ、伝送ネットワークを介したディジタル可聴信号の転送、またはこれらの信号の記憶には、時間符号化タイプ、場合によっては予測型時間符号化タイプの符号化システム、あるいはいわゆる変換符号化タイプの符号化システムを実施する圧縮プロセスが使用されている。
【0003】
本発明の主題である方法およびデバイスは、音響信号、詳細には、符号化されたディジタル可聴信号の圧縮に適用することができる。これらの信号のフレームは、音楽楽器によって生成される増音源および/または減音源、破裂音音節を含む音声信号、および、詳細には、時間領域におけるデコーダ(予測型デコーダその他)および逆周波数変換デコーダを始めとする多層デコーダデバイスである。
【0004】
図1は、実例として、従来技術による、変換および加算/重畳によるディジタル可聴信号の符号化および復号化を略図で示したものである。
【0005】
上で言及した符号化プロセスおよび復号化プロセスをより詳細に説明するために、たとえば、本出願人が2005年7月12日に出願した仏国特許出願第05 07471号の説明の概論を参照することができる。
【0006】
パーカッションなどのいくつかの音楽音響、および破裂音音節などの特定の音声シーケンスは、いくつかのサンプル(図1のサンプル410から)の空間でサンプルされる信号のダイナミックレンジが極めて強く変化する極めて急激なトランジションに反映される極端に突発的なアタックを特徴としている。
【0007】
変換符号化によって適用される複数のサンプルの連続するブロックへの再分割は、音響信号には全く無関係であり、したがってトランジションは解析窓内のあらゆるポイントに出現する。変換符号化の場合、雑音は、サンプルされた長さ2Lのブロックの全継続期間にわたって時間的に一様に分布する。これが、トランジションに先立つプリエコーの出現およびトランジション後のポストエコーの出現に反映される。
【0008】
雑音レベルは、トランジション直後の高エネルギーサンプルに対する信号の雑音レベルより小さいが、エネルギーがより小さいサンプル、とりわけ先行するトランジション部分のサンプル(図1のサンプル160〜410)に対する信号の雑音レベルより大きい。上記部分の信号対雑音比は極めて小さく、プリエコーで示される、結果として生じる劣化は、極めて煩わしいものとして出現することになる。
【0009】
図1から、プリエコーは、トランジションに先行するフレームおよびトランジション中のフレームに影響を及ぼすことが分かる。
【0010】
実際には、人間の耳は、アタックの生理学的伝送に先立って、数ミリ秒程度の極めて限られたプリマスキングを適用する。
【0011】
生成される雑音、すなわちプリエコーは、プリエコーの継続期間がプリマスキングの継続期間より長い場合、耳に聴こえる。
【0012】
また、人間の耳は、高エネルギーシーケンスから低エネルギーシーケンスへのトランジションの際に、継続期間がより長い、5ミリ秒ないし60ミリ秒のポストマスキングを適用する。したがって、ポストエコーを許容することができる苛立ちの割合すなわちレベルは、プリエコーに対するそれより大きい。
【0013】
プリエコーのより重大な現象は、数に換算したサンプルのブロックの長さが長くなるほど、苛立ちの程度が増すことである。現在、変換符号化の場合、最も重要な周波数帯の正確な分解能を有することが必要である。固定サンプル周波数および固定ビットレートでは、窓のポイント数が増加すると、心理音響学モデルによって有用と見なされている周波数線を符号化するために利用することができるより多くのビットが存在することになり、したがって長さが長いブロックを使用する利点が得られる。たとえば、符号化プロセスAAC(Advanced Audio Coding)が実施されると、長さが長い窓は、サンプリング周波数が32kHzの場合、たとえば64msの継続期間にわたって2048個の固定数のサンプルを含むことになる。会話アプリケーションのために使用されるエンコーダには、継続期間が16kHzにおいて40ms、また、フレーム更新継続期間が20msの窓がしばしば使用されている。
【0014】
上で言及したプリエコー現象の苛立ち効果を抑制するために、また、ポストエコー現象をある程度抑制するために、これまで様々な解決法が提案されている。
【0015】
第1の解決法には、フィルタの適用が必然的に伴っている。アタックによる伝送に先行するゾーンでは、復元された信号は、実際、元の信号から構築されており、その信号の上に量子化雑音が重畳している。
【0016】
Y. MahieuxおよびJ.P. Petitによって発行された、High Quality Audio Transform Coding at 64 kbits、IEEE Trans on Communications Vol 42 No.11、1994年11月、という名称の論文に、対応するフィルタリング技法が記載されている。
【0017】
このようなフィルタリングを実施するためにはパラメータを知る必要があり、そのうちのいくつかは、雑音によって影響されたサンプルからデコーダ上で予測される。しかしながら、元の信号のエネルギーなどの情報を知ることができるのはエンコーダのみであり、したがってこれらの情報を伝送しなければならない。受け取ったブロックにダイナミックレンジの突発的な変化が含まれている場合、その突発的なダイナミックレンジの変化にフィルタリングプロセスが適用される。
【0018】
上で言及したフィルタリングプロセスによれば、元の信号を検索することはできないが、プリエコーが強力に抑制される。しかしながら、このフィルタリングプロセスには、追加補助パラメータをデコーダに伝送する必要がある。
【0019】
第2の解決法には、窓を動的に切り換えることによってプリエコーを小さくする必要がある。
【0020】
B. Edlerに付与された米国特許第5214742号に、このような技法が記載されている。この解決法は、国際規格に基づく様々な可聴周波符号化解決法におけるアプリケーションの主体である。
【0021】
この解決法によれば、信号の時間分解能および周波数分解能が符号化窓の長さに強く依存しているため、周波数コーダは、静止信号に対しては長い窓(たとえば2048サンプル)間を切り換え、また、ダイナミックレンジが広範囲にわたって変化する信号または過渡信号に対しては、短い窓(たとえば256サンプル)間を切り換える。この適合は、AACモジュール内で実行され、その決定は、エンコーダ上でフレーム毎に採用される。
【0022】
この第2の解決法の欠点の1つは、トランジションが次の窓の中で始まる場合、そのトランジションの準備をすることができること、および完全な復元の保持を可能にするトランジション窓に切り換えることができることが肝要であるため、この解決法にはN/2サンプル程度の追加遅延が含まれていることである。
【0023】
しかしながら、デコーダが、複数の時間復号化段、場合によっては予測型時間復号化段および変換復号化段を備えている場合、階層型エンコーダ内で容易にエコーを抑制することができる。その場合、時間復号化段を使用してエコーを検出することができる。K. Kikuiriらによる米国特許出願第2003/0154074号に、このタイプの復号化の実施例が記載されている。
【0024】
上で言及した特許出願によって説明されている、従来技術で知られている方法には、復号化されたCELP基本コア信号に排他的に基づくプリエコーの検出を実行するステップが含まれている。CELPとは、符号励起線形予測(Code Excited Linear Prediction)のことである。
【0025】
そのため、このような方法は、付随する情報に基づく、時間デコーダおよび変換デコーダからの復元フレームに同期したプリエコー抑制処理を提供することはできない。
【0026】
上で言及した仏国特許出願第05 07471号によれば、エコーの存在を弁別し、かつ、エコーを生成する変換符号化およびエコーを生成しない時間符号化からの多層階層型符号化によって生成されるディジタル可聴信号のエコーを減衰させることができる。この特許出願の場合、復号化中、ディジタル可聴信号の現在のフレーム毎に、非エコー生成復号化によって得られる信号の振幅に対するエコー生成復号化によって得られる信号の振幅の比率の値が、実時間で閾値の値と比較される。この比率の値がこの閾値の値より大きいか、あるいはこの閾値の値に等しい場合、変換符号化に由来するエコーが現在のフレームに存在している、と結論付けることができる。あるいは、この比率の値がこの閾値の値より小さい場合、この現在のフレームには変換符号化に由来するエコーは存在していない、と結論付けることができる。
【0027】
上で言及した特許出願の図3aおよび3bに対応している図2aおよび図2bは、この方法を示したものである。以下、本特許出願についての説明の概論では、括弧内の図面番号は、参照を目的として本出願に導入されている仏国特許出願第05 07471号の図面番号を表している。
【0028】
図2aは、「予測型復号化層i」と呼ばれる複数の非エコー生成デコーダと、「変換復号化層j」と呼ばれる複数の変換デコーダとを備えた階層型デコーダを示したものである。
【0029】
図2b(図3b)は、時間デコーダに由来する復号化信号および変換デコーダに由来する復号化信号を入力として備えた、エコーを弁別するためのデバイス1を示したものである。エコーデバイスの出力は、加算/重畳出力部の復号化信号を減衰させることによってエコー減衰デバイス2を制御している。
【0030】
図2c(図3c)は、それぞれ時間デコーダおよび変換デコーダに由来する信号の時間包絡線およびエコー存在フラグを計算する方法を示したものである。
【0031】
図2d(図3e)は、エコーが存在している継続期間の間、加算/重畳出力信号に、変換復号化信号の包絡線に対する時間信号の包絡線の比率に等しい利得g(k)を掛け合わせることによってエコーを減衰させる方法を示したものである。
g(k)=Min(EnvPi(k)/EnvTj(k)、1)
【0032】
この図では、POSの値がゼロである場合に、フレーム全体にわたってプリエコー処理が実行される。
【0033】
図2e(図11)は、エコーの弁別およびそれらの減衰が非制限方式で2つの周波数副帯域で実行される多層システムにおけるエコー弁別の原理を示したものである。
【0034】
この実施例では、信号フィルタリング操作は、時間信号xPi(n)に対する時間フィルタリングは、あるいはMDCT(修正離散余弦変換(Modified Discrete Cosine Transform))周波数領域におけるフィルタリングのいずれかによって実行される。このMDCT周波数領域におけるフィルタリングは、時間信号をMDCT係数に変換し、次に、MDCT係数を操作し(MDCT係数をゼロにセットし、加算し、置換し、等々)、最後に、加算/重畳が後続する逆MDCT変換を副帯域毎に実行することによって実施される。
【0035】
上で言及した仏国特許出願第05 07471号に記載されている方法およびデバイスは、既に言及した従来技術の欠点に対する解決法を提供している。
【0036】
仏国特許出願第05 07471号に記載されている解決法には、エコー減衰デバイスに対する誤ったトリガリングを除去するために、エコー減衰デバイスに対するトリガリングを予測するための手順がエンコーダ上で使用されている。
【0037】
より詳細には、エンコーダは、変換符号化される信号を有しているため、非量子化信号に対するエコーの弁別がエンコーダ上で実行され、また、エンコーダはプリエコーに支配されないため、すべてのトリガリングは、間違いなく誤りと言える。エコーは、エンコーダ上で検出され、異常が検出されると、デコーダ上でのエコーの減衰を禁止するために、そのフレーム内でフラグが伝送される。
【特許文献1】仏国特許出願第05 07471号
【特許文献2】米国特許第5214742号
【特許文献3】米国特許出願第2003/0154074号
【非特許文献1】High Quality Audio Transform Coding at 64 kbits、IEEE Trans on Communications Vol 42 No.11、1994年11月
【発明の開示】
【発明が解決しようとする課題】
【0038】
本発明の目的は、一方では、エンコーダからの特定の補助指示の伝送が存在しない場合に、また、他方では、符号化に対する余計な複雑性の導入が存在しない場合に、エコー減衰デバイスを誤ってトリガリングする事態を回避することである。
【0039】
本発明の他の目的は、さらに、エンコーダからの擬似警報の伝送が存在しない場合に、アタックの出現と同期したエコーの減衰を禁止することができるようにすることである。これは、時間エンコーダは、通常、アタックに対して瞬時に反応しないため、従来技術によるデバイスでは実施することができない。
【0040】
本発明の他の目的は、さらに、変換デコーダに由来する信号が一定のダイナミックレンジを有している場合、エコー減衰デバイスに対する誤ったトリガリングを回避することである。アタックが存在しないため、時間デコーダによって復号化された信号が変換デコーダによって復号化された信号に対して弱い場合に、エコー減衰デバイスがトリガされる従来技術によるデバイスとは異なり、エコー減衰デバイスを起動する必要はない。
【0041】
本発明の他の目的は、遅いデータ転送速度が時間エンコーダに割り当てられ、したがってすべての入力信号を正しく符号化することができない場合に、実施態様を提供することである。
【0042】
引用することができる一例は、4000Hzから7000Hzの狭い信号周波数帯域で動作し、この帯域に存在する正弦曲線を正しく符号化することができない、従来技術による特定の時間エンコーダの場合である。したがって時間エンコーダの出力部の信号が弱く、エコー減衰が不適切に起動され、そのために符号化が著しく劣化する。
【0043】
また、本発明の他の目的は、先行するフレームにアタックが存在する場合に、ポストエコーの減衰が不適切に禁止されることを防止することができる、多層デコーダ中のディジタル信号のエコーを安全に弁別し、かつ、減衰させるための方法およびデバイスの実施態様を提供することである。
【課題を解決するための手段】
【0044】
本発明の主題である、エコーを生成する変換符号化によって生成されるディジタル可聴信号のエコーを弁別し、かつ、減衰させるための方法は、少なくとも復号化において、このディジタル可聴信号の現在のフレーム毎に、高エネルギーゾーンへのトランジションに先行する低エネルギーゾーンを弁別するステップと、現在のフレームの非弁別ゾーンに対応する擬似警報ゾーンを画定するステップと、減衰利得値を使用してエコーの初期処理を決定するステップと、現在のフレームの低エネルギー弁別ゾーン内のエコーの初期処理に基づいてエコーを減衰させるステップと、擬似警報ゾーン内の初期処理のエコーの減衰を禁止するステップとを含むことを特徴としている。
【0045】
本発明の主題である上記方法によれば、アタックによって生成される高エネルギー信号を劣化させることなく、エコー、プリエコーおよびポストエコーを除去することができる。
【0046】
以下、図2fおよび次の式の参照には次の表記法が使用される。
n∈[0、L-1]に対してxrec(n)=h(n+L)xprev(N+L)+h(n)xcur(n)
【0047】
変換エンコーダでは、現在のフレームの復元信号(xrec(n)、n=0からL-1)は、先行するフレーム(xprev(n)、n=Lから2L-1)のMDCT係数の逆MDCTの出力の第2の部分と、現在のフレーム(xcur(n)、n=0からL-1)のMDCT係数の逆MDCTの出力の第1の部分の重み付け合計によって得られる。現在のフレーム(xcur(n)、n=Lから2L-1)のMDCT係数の逆MDCTの出力の第2の部分は、メモリに記憶し、次のフレームの復元信号を得るために使用することができる。同様に、以下、「現在のフレームの第1の部分」、「現在のフレームの第2の部分」、「現在のフレームの復元信号」という用語が使用される。したがって次のフレームでは、現在のフレームの第2の部分は、先行するフレームの第2の部分になる。
【0048】
詳細には、アタックが現在のフレームの第1の部分または第2の部分に位置している場合、本発明の主題である上記方法には、現在のフレームの復元信号および現在のフレームの第2の部分の信号から連結信号を生成するステップと、この連結信号を決定済み長さのサンプルの偶数数のサブブロックに分割するステップと、決定済み長さのサブブロックの各々の信号のエネルギーを計算するステップと、最大エネルギーサンプルのランクを表す第1の指標、および最後の高エネルギーサンプルを表す第2の指標を計算するステップと、ディジタル可聴信号の第1のサブブロックの偶数数のサブブロックの半分である数に対する最小エネルギーを計算するステップと、最小エネルギーに対する最大エネルギーの比率が決定済み閾値の値より大きく、プリエコーの危険が信号の低エネルギー部分のみに存在することが明らかになると、第1の指標と第2の指標の間のランクの高エネルギーサンプルに対するあらゆる減衰アクションを禁止するステップが含まれている。
【0049】
第1および第2の指標を決定することにより、後者の間に、意味のない、あるいは信号を損傷するエコーの減衰を除去しなければならない高エネルギー信号に対応する擬似警報レンジを画定することができる。
【0050】
多層階層型エンコーダによって、エコーを生成しない少なくとも1つの時間デコーダと、エコーを示す可能性のある少なくとも1つの変換デコーダとを備えた本発明の主題であるデコーダ中に生成されるディジタル可聴信号のエコーを弁別し、かつ、減衰させるためのデバイスは、少なくとも時間デコーダ上および変換デコーダ上に、高エネルギーゾーンへのトランジションに先行する低エネルギーゾーンを弁別する手段と、現在のフレームの非弁別ゾーンに対応する擬似警報ゾーンを画定する手段と、減衰利得値を使用してエコーの初期処理を決定する手段と、現在のフレームの低エネルギー弁別ゾーンに適用されるエコーの初期処理に基づいてエコーを減衰させる手段と、擬似警報ゾーンに適用される初期処理のエコーの減衰を禁止する手段とを備えたことを特徴としている。
【0051】
それらについては、以下の説明を読み、また、仏国特許出願第05 07471号に記載されている従来技術に関連する図1および図2aないし2e、ならびに従来技術に関連する図2fとは別の添付図面を考察することにより、より深く理解されよう。
【0052】
以下、本発明の主題である方法について、図2bおよび3aに関連してより詳細に説明する。
【0053】
本発明の主題である方法によれば、復号化におけるディジタル可聴信号のエコーを弁別することができる。このディジタル可聴信号は、変換符号化および予測符号化から多層階層型符号化によって生成される。
【発明を実施するための最良の形態】
【0054】
図2bを参照すると、
- xTj(n)は、多層階層型デコーダの層j変換デコーダによって引き渡される逆変換復号化によって引き渡される信号を表し、
-
【0055】
【数1】
【0056】
は、対応する階層型デコーダ中の層i予測型デコーダによって実行される予測復号化によって引き渡される信号を表している。信号
【0057】
【数2】
【0058】
は、エコーを生成しない予測型デコーダからの出力信号であるか、あるいはこの信号のフィルタリングされたバージョンまたはこの信号の短期間エネルギー表現のいずれかであってもよい。
【0059】
図2a、図2bおよび図3aを参照すると、本発明の主題である方法には、ステップAで、エコーを生成しない復号化に由来する信号の振幅に対するエコーを生成する復号化に由来する信号の振幅の比率R(k)の値と閾値の値Sを実時間で比較するステップが含まれていることに留意されたい。
【0060】
図3aでは、エコーを生成する復号化に由来する信号の振幅はEnvTj(k)で表されており、また、エコーを生成しない復号化に由来するこの信号の振幅はEnvPi(k)で表されている。
【0061】
示されている表記法を参照すると、とりわけ、有利には、エコーを生成する復号化に由来する信号の振幅およびエコーを生成しない復号化に由来する信号の振幅は、それぞれ非エコー生成復号化に由来する信号のエコー生成復号化信号xTj(n)の包絡線信号、
【0062】
【数3】
【0063】
によって表現することができることは理解されよう。
【0064】
図3aでは、振幅信号の獲得は、
【0065】
【数4】
【0066】
の関係で表現されている。
【0067】
一般的には、それぞれ非エコー生成復号化に由来する信号のエコー生成復号化に由来する信号の振幅信号は、上で言及した包絡線信号によってだけでなく、上で言及した振幅を表す絶対値などの任意の信号によって表現することができることに留意されたい。
【0068】
同じ図3aを参照すると、非エコー生成復号化に由来する信号の振幅に対するエコー生成復号化に由来する信号の振幅の比率は、
【0069】
【数5】
【0070】
の関係で表現されていることに留意されたい。
【0071】
前述の表記法を参照すると、図3aの比較ステップAには、比率R(k)の値と閾値の値Sを比較するステップ、優位性と同等性の比較を適用するステップが含まれていることに留意されたい。
【0072】
ステップAに対する正の応答で、上記比率の値が閾値の値Sより大きいか、あるいは閾値の値Sに等しい場合、上で言及した試験により、ステップBで、変換符号化に由来するエコーが現在のフレームの中に存在している、と結論付けることができ、このエコーは復号化に現われる。
【0073】
エコーの存在は、ステップBで、
【0074】
【数6】
【0075】
の関係で表現される。
【0076】
一方、ステップAの試験に対する負の応答で、上記比率の値が閾値の値Sより小さい場合、ステップAの試験により、ステップCで、変換符号化に由来するエコーは現在のフレームには存在していない、と結論付けることができる。
【0077】
この関係は、ステップCで、
【0078】
【数7】
【0079】
で表される。
【0080】
とりわけ有利な方法では、本発明の主題である方法の実施態様によれば、現在のフレーム内におけるエコーの元の位置は、実際、現在のフレーム内における、閾値の値Sにほぼ等しい比率の値の位置によって与えられることに留意されたい。
【0081】
上記の値は、図3aのステップBで、
Pos k|R(k)=S
の関係で与えられる。
【0082】
一般に、図2bまたは3aのステップAの試験および最終的には試験CおよびBの実施、とりわけステップAに続くステップBの試験の実施に関して、比率R(k)の値は、現在のフレーム全体にわたって平滑化された値として計算することができ、それにより、上記比率の値と閾値の値Sを実時間で比較することができることは理解されよう。上記比率の値がSの値に等しい場合、エコーの元の位置は、現在のフレーム内の復号化信号の対応するサンプルのランクkの特定の値によって与えられる。
【0083】
エコーが存在している場合、ステップBに続いて実施されるステップDには、XTj(n)lowで示されている低エネルギーディジタル可聴信号部分におけるエコーの存在を弁別するステップが含まれている。対応するエコーは、EXTj(n)lowで示されている。また、ステップDで、上記弁別から、現在のフレームの非弁別ゾーンに対応する擬似警報ゾーンを画定することができる。
【0084】
ステップDにおける弁別に続いてステップEが実施される。ステップEには、減衰利得値を使用してエコーの初期処理を決定するステップ、および低エネルギーディジタル可聴信号部分のエコーを減衰させるステップが含まれている。ステップEに続いて実施されるステップFには、XTj(n)hiwで示されている高エネルギーディジタル可聴信号部分のエコーの減衰を禁止するステップが含まれている。
【0085】
一般に、本発明の主題である方法は、複数の信号帯域、たとえば非制限の実施例として、低帯域[0〜4kHz]および高帯域[4〜8kHz]の2つの周波数帯域のエコーの弁別および減衰を実行することによって実施することができる。この実施例では、信号の個々の帯域に時間/変換多層エンコーダが実施されている。低帯域では、変換エンコーダは、知覚領域における元の信号と復号化されたCELP信号の差を量子化し(知覚フィルタW(z)によってフィルタリングされた後に)、一方、高帯域では、変換エンコーダは、知覚フィルタリングすることなく元の信号を量子化し、復号化の際に、適切に復号化された帯域が、帯域拡張モジュールによって供給される時間信号のMDCTに由来する既に復号化済みの帯域に取って代わる。したがって、本発明によって提供される加算は、個々の副帯域のデバイスに対して記述される。
【0086】
図3bは、図2aに示されているタイプのCELP予測型/多層変換デコーダ中の信号の低帯域の合成に伴う可聴信号を示したものである。n=0ないしn=85のサンプル間のプリエコーの形態のエコーの出現を免れない変換出力段(完全な復元を備えたフィルタバンクであるTDAC(時間領域エイリアシング相殺(Time Domain Aliasing Cancellation))デコーダからの出力信号)とは異なり、予測/CELP復号化段はエコーを生成しないことが分かる。したがって、このことから、CELP予測型エンコーダの出力段を変換復号化段からの出力と組み合わせて使用して、エコーを減衰させることができる、と結論付けられる。
【0087】
復号化されたCELP信号の加算および復号化された変換信号の加算によって得られる最終出力信号自体も、同じエコー現象の発生源である。
【0088】
従来技術によるエコー減衰デバイス(たとえば図2bに示されているデバイス)が起動されると、図3cに示されている信号が得られる。最初の3つのプロットは、図3bに示されている信号と同じ信号を示している。その次の3つのプロットは、それぞれ、
- 0と1の間の値を有するプリエコー処理利得(図2bの長方形1)
- プリエコー処理後の変換復号化段から出力される信号(TDACデコーダ出力)。アタックに先行するエコーは除去されているが、変換デコーダに由来するアタック部分は、不適切に減衰していることが分かる。本発明の主題である方法およびデバイスの基本的な利点の1つは、この欠点が克服されることである。
- CELPデコーダからの出力信号とTDACデコーダからの出力の合計である、聴取経験におけるディジタル可聴信号の劣化に反映されるプリエコーをもたらさず、また、そのアタックがほとんど消失した最終出力信号
を表している。
【0089】
本発明の主題である方法およびデバイスによれば、図3dに示されているように、従来技術による1つまたは複数の変換復号化段の出力の誤った減衰を除去することができる。この図の可聴出力は、その前の図の可聴出力と同じである。
【0090】
図3cと図3dを比較すると、本発明の主題である方法によれば、アタックの瞬間にエコーの減衰を禁止することができ(サンプル80ないし120)、かつ、アタックの前のエコーを除去することができることが分かる(プリエコー処理利得参照)。それによる結果は、プリエコーが処理された後のTDACデコーダの出力部に復元される信号は、もはやエコーを有していないこと、およびアタックの良好な復元が得られることである。これは、この信号とCELPデコーダの出力を加算することによって得られる、もはやエコーをもたらさない最終出力信号についても同様である。
【0091】
次に、エコー処理利得生成プロセスについて、図4aおよび図4bを参照して説明する。
【0092】
エコーが存在している場合、MDCT窓の中の信号の一部のエネルギーを他の部分のエネルギーより著しく大きくしなければならない(アタック)。エコーが観察されるのは低エネルギー部分であり、したがってエコーを減衰させる必要があるのはこれらの部分のエコーのみであり、高エネルギーゾーンのエコーは減衰させる必要はない。
【0093】
2つの可能な場合が存在し、アタックは、現在のフレームまたは次のフレームのいずれかに位置している。第1の場合、エコーを不適切に減衰させる危険が存在している。
【0094】
図4aは、図2fを参照した、サンプルn=0ないし2L-1に対する前記連結信号を示したものである。サンプルn=0ないしN=L-1(L=160)に対しては、前記連結信号は、現在のフレームの復元信号に等しく、また、サンプルn=Lないし2L-1に対しては、前記連結信号は、現在のフレームの第2の部分に等しい。次のフレームでは、この第2の部分が信号xprev(n+L)に対応する先行フレームになる。
【0095】
本発明の主題であるエコー減衰修正プロセスは、ind1およびind2の2つの指標、エコーを抑制するために従来技術によるデバイスのアクションを禁止する必要のある可能領域の始まりおよび終わりを引き渡す。ind1>ind2は、現在のフレームにはこのようなゾーンは存在していないことを表している。
【0096】
以下、本発明の主題である方法の非制限の好ましい実施形態について、図4aおよび4bに関連してより詳細に説明する。
【0097】
上で言及した、図4aに示されている実施形態によれば、本発明の主題である方法には、
- 図4aの信号を長さN2=L/K2の2K2個のサブブロックに再分割するステップと、
- 図4aに示されている信号の長さN2のサブブロックの各々のエネルギーを計算するステップ
が含まれている。信号の第2の半分が対称であるため、計算しなければならないのは第1の1.5K2個のブロックのエネルギーのみであることに留意されたい。
【0098】
本発明の主題である方法には、さらに、
- 最大エネルギーブロックの第1のサンプルの指標ind1を計算するステップと、
- 復元信号xrec(n)の第1のK2個のブロック全体の最小エネルギーを計算するステップ
が含まれている。
【0099】
最小エネルギーに対する最大エネルギーの比率が閾値の値Sより大きい場合、プリエコーの危険が存在しているが、それは、低エネルギーゾーンのみである。高エネルギーサンプルからのエコーは存在していない。
【0100】
エコーを減衰させる従来技術によるエコー検出デバイスの場合、高エネルギーサンプルを含む信号のゾーンを画定している指標ind1およびind2によって範囲が定められた高エネルギーサンプルに対する後者の減衰アクションを禁止し、利得を値1にリセットする必要がある。図4aの一番下に表現式で示されているこれらの2つの指標は、次の通りに決定される。
- ind1は、最大エネルギーが生じるブロックの第1のサンプルの指標である。
- ind2は、ind1+C-1とL-1の間の最小であり、処理されるブロックの終わりの指標である。Cは、サンプルの数としての擬似警報ゾーンの最大長さであり、1つまたは複数のブロックの継続期間の位数の値にセットされる。一例として、C=80の値によって良好な結果が得られる。
【0101】
図4aに示す実施例では、プリエコーの原因になるアタックが次のフレームで検出され、ind1の方がind2より大きいため、エコー減衰の禁止は存在していない。これによる結果は、現在のフレーム全体、つまりn=0から159までのサンプルに対して適切にエコーが減衰することである。
【0102】
図4bに示されているように、1つの信号フレーム(L=160サンプル)のオフセットが適用され、したがってアタックは、現時点では現在のフレームに位置している。
L=160;K2=4;N2=L/K2=40;C=80
【0103】
この状況の場合、既に説明した最大エネルギーおよび最小エネルギーを計算するための手順が反復される。
【0104】
最大エネルギーは、n=80で始まるブロックに対して見出されること、また、この場合、最小エネルギーに対する最大エネルギーの比率は、閾値の値Sより大きいとは言えないが極めて大きいことが分かる。一例として、S=8の値によって良好な結果が得られる。
【0105】
この場合、最大エネルギーの前にプリエコーが存在しているが、それとは反対に、その最大エネルギーが位置しているブロックおよびいくつかの後続するブロックは、エコー現象を免れることができる。したがって、本発明の主題である方法によれば、アタックの瞬間およびアタック後にエコー減衰の起動を禁止しなければならない。このエコー減衰の起動の禁止は、図4bにおけるn=80から159までの範囲のサンプルに対して実施され、上で言及したサンプルn=80ないし159の間に含まれているゾーンは、擬似警報ゾーンとして画定される。
【0106】
したがって、図3dでは、n=80から120までのサンプルに対しては事実上1に等しい利得(平滑化された)が得られ、図3cにおける同じサンプルと比較すると、この利得減衰は禁止されている。また、プリエコーが処理された後のTDACデコーダから出力される信号のn=80から160までのサンプルは、適切に減衰している。これによる結果は、この場合、この信号とCELPデコーダからの出力信号を合計することによって得られる最終出力信号が適切に復元されることである。
【0107】
本発明の主題である方法は、図4cに関連して以下で説明するように、正弦波信号のための低周波数帯域または高周波数帯域の多層エンコーダのエコーを減衰させるための特定の変形態様の中で実施することも可能である。
【0108】
図4cは、時間デコーダ、場合によっては、図2aで説明したタイプの可聴信号の高帯域の予測型/多層変換における信号の合成に伴う可聴信号を示したものである。復号化される信号は正弦曲線である。入力信号と比較すると、時間復号化段の出力が劣化していることが分かる。これは、この事例の場合、正弦曲線の適切な復元を可能にするには遅すぎるビットレートで時間デコーダが動作していることによるものである。TDACデコーダからの出力信号は適切である。最終出力信号についても同様である。
【0109】
たとえば図2aに示されているような従来技術によるエコー減衰プロセスが起動されると、図4dに示されている信号が得られる。最初の3つのプロットは、図4cに示されている信号と同じ信号を示している。その次の3つのプロットは、それぞれ、
- 0と1の間の値のエコー減衰利得(図2bの長方形1)
- エコー処理後のTDACデコーダから出力される信号。エコーの減衰が起動され、それにより、減衰利得による掛算によって振幅変調された、元の正弦曲線を忠実に再現していない正弦曲線に等しいTDAC段出力信号が生成されていることが分かる。
- TDACデコーダ出力信号の欠陥と同じ欠陥を示す最終出力信号。これらの2つの信号は全く同じである。
を表している。
【0110】
本発明によれば、図4eで説明するように、信号の不十分なモデル化を除去することができる。
【0111】
正弦曲線が存在しているエコー減衰の禁止動作について、図5を参照して説明する。既に説明した最大エネルギーおよび最小エネルギーを計算するための手順がここでも取り上げられる。
【0112】
上記の図から、最大正味エネルギーは存在しないことが分かる。この場合、最小エネルギーに対する最大エネルギーの比率は極めて小さく、閾値の値S未満である。これは、エコーが存在しないことを示している。したがって、本発明の主題である方法によれば、フレーム全体にわたるエコー減衰器の起動を禁止することが肝要である。これは、エコー処理利得が1に等しい図4eのn=0からn=159までの範囲のサンプル(これらのサンプルに対するエコー処理利得は1に等しい)に対して示されている。プリエコー処理後のTDACデコーダ出力部の信号は適切に減衰している。これによる結果は、この場合、この信号と全く同じ最終出力信号が適切に復元されることである。
【0113】
図5では、
L=160;K2=4;N2=L/K2=40;C=80;S=8
である。
【0114】
図6は、ポストエコー現象を示したものである。
【0115】
図6を参照すると、入力信号の速やかな衰退を含んだフレームの中およびその次のフレームの中の出力信号にポストエコー現象を観察することができる。強い衰退に続くフレーム(ポストエコーゾーン)では、エコーの減衰を禁止しないことが肝要であることは明らかである。
【0116】
ポストエコー状況は、先行するフレームの最大エネルギーと現在のフレームの最大エネルギーの間の比率をチェックすることによって検出することができる。この比率が閾値の値より大きい場合、そのフレームは、ポストエコーを生じるフレームと見なされ、エコー減衰アルゴリズムは、このフレームのエコーの減衰を維持する。
【0117】
次に、本発明の主題による、多層階層型エンコーダによって生成されるディジタル可聴信号のエコーを弁別し、かつ、減衰させるためのデバイスについて、図7に関連してより詳細に説明する。
【0118】
一般に、図7に示されている、本発明の主題であるデバイスは、図2bに示されているように、従来技術によるエコー弁別デバイスに組み込まれていることは理解されよう。
【0119】
本発明の主題であるデバイスは、従来技術による弁別デバイスと同様の方法で、エコーの元の位置の存在および減衰値を計算するためのモジュールであって、一方では、複数の予測型デコーダのランクiの予測型デコーダの第2の出力によって引き渡される補助信号、
【0120】
【数8】
【0121】
を受け取り、また、他方では、複数の逆変換デコーダのランクjの逆変換デコーダの出力によって引き渡される復号化信号xTj(n)を受け取るモジュールを備えている。
【0122】
本発明の主題であるデバイスは、さらに、望ましくないエコーを確実に減衰させることができるよう、ランクjの逆変換デコーダによって引き渡される現在のフレームの復元信号、および存在、元のエコー位置ならびに適用可能エコー減衰値信号を受け取るエコー減衰モジュールを備えている。
【0123】
したがって、図7には、ランクiの予測型デコーダおよび変換デコーダ、ランクjのMDCTデコーダが、既に説明したアーキテクチャに従って、非制限の方法で示されている。
【0124】
次に、本発明の主題による、多層階層型エンコーダによって生成されるディジタル可聴信号のエコーを弁別し、かつ、減衰させるためのデバイスの非制限の好ましい実施形態について、図7に関連して説明する。
【0125】
図7に示されている、本発明の主題であるデバイスには、図2bに示されている従来技術によるデバイスのアーキテクチャと同じアーキテクチャが使用されているが、その特定の構成要素は特化されている。
【0126】
詳細には、図7に示されているように、現在のフレームの少なくとも1つの低周波数帯域および/または高周波数帯域におけるエコーの存在および元の位置を計算するための構造は、有利には、デバイスのデマルチプレクサ00に結合された、チャネルLで示されている、ディジタル可聴信号のための低周波数帯域復号化チャネル、およびチャネルHで示されている、ディジタル可聴信号のための高周波数帯域復号化チャネルを備えている。
【0127】
また、加算回路14は、高周波数帯域復号化チャネルであるチャネルHおよび低周波数帯域復号化チャネルであるチャネルLによってそれぞれ引き渡される信号を受け取り、かつ、復元されたディジタル可聴信号を引き渡している。
【0128】
図7を考察すると、とりわけ、高チャネルおよび低チャネルは、それぞれ、図2bに示されている従来技術による構造のランクiの予測型デコーダおよびランクjの変換デコーダにほぼ対応していることが理解されよう。
【0129】
詳細には、図7に示されているように、低周波数帯域復号化チャネル、チャネルLは、有利には、逆多重化されたディジタル可聴ビットストリームを受け取り、かつ、予測復号化によって復号化された信号を引き渡す予測型復号化モジュール01、および逆多重化されたディジタル可聴ビットストリームを受け取り、かつ、
【0130】
【数9】
【0131】
で示されている、低周波数帯域における符号化差信号のスペクトル係数を引き渡す変換復号化モジュール04を備えている。
【0132】
低周波数帯域復号化チャネル、チャネルLは、さらに、低周波数帯域における符号化差信号
【0133】
【数10】
【0134】
のスペクトル係数を受け取り、かつ、
【0135】
【数11】
【0136】
で示されている低周波数帯域ディジタル可聴信号を引き渡す逆変換周波数-時間置換モジュール05を備えている。
【0137】
さらに、低周波数帯域復号化チャネル、チャネルLに特化された、低エネルギー信号部分にエコーが存在していることを弁別するための資源および減衰禁止資源は、図7に示されているように、擬似警報ゾーンを画定するためのモジュール15と、低周波数帯域ディジタル可聴信号
【0138】
【数12】
【0139】
から、また、予測復号化によって復号化された信号からエコーを検出するためのモジュール16とを備えている。エコー検出モジュール16は、Gloで示されている低周波数利得値を引き渡している。
【0140】
最後に、低周波数帯域復号化チャネル、チャネルLは、変換によって復号化され、かつ、WNB(z)-1によってフィルタリングされた信号に低周波数利得値Gloを適用するための回路17、加算資源08、ポストフィルタリング資源09、オーバサンプリング資源10およびQMF合成フィルタリング資源11を備えており、これらの様々な構成要素は縦続接続されており、加算器14にディジタル可聴低周波数帯域合成信号を引き渡している。
【0141】
さらに、同じく図7に示されているように、高周波数帯域復号化チャネル、チャネルHは、有利には、逆多重化されたディジタル可聴ビットストリームを受け取り、かつ、プリエコーが存在しない時間基準信号を引き渡す帯域拡張チャネル02を備えている。この信号は、高周波数帯域復号化チャネルのための基準としての役割を果たしており、事実上、低周波数復号化チャネル、チャネルLのための予測復号化機能を提供している。
【0142】
高周波数帯域復号化チャネル、チャネルHは、さらに、逆多重化されたディジタル可聴ビットストリームを受け取り、かつ、MDCT変換時間-周波数置換03を介して時間基準信号のスペクトル係数を受け取る変換復号化モジュール04を備えている。MDCT変換時間-周波数置換03は、
【0143】
【数13】
【0144】
で示されている高周波数の時間基準信号のスペクトル係数を変換復号化モジュール04に引き渡すことができる。
【0145】
後者は、
【0146】
【数14】
【0147】
で示されている高周波数帯域符号化ディジタル可聴信号のスペクトル係数を引き渡している。
【0148】
ディジタル可聴信号のための高周波数帯域復号化チャネル、チャネルHは、さらに、逆変換周波数-時間置換モジュール06を備えており、逆変換動作は、高周波数帯域のディジタル可聴信号
【0149】
【数15】
【0150】
のスペクトルの係数を受け取り、かつ、
【0151】
【数16】
【0152】
で示されている高周波数帯域時間ディジタル可聴信号を引き渡す、「加算-重畳」で示されている加算-重畳動作が後続するMDCT-1で示されている。
【0153】
低周波数帯域復号化チャネルのアーキテクチャと同様の方法で、プリエコー擬似警報ゾーンを画定するための資源18、およびエコー減衰禁止資源を形成するプリエコーを検出するための資源19が提供されている。後者は、擬似警報ゾーンを画定するためのモジュール18、および高周波数帯域ディジタル可聴信号
【0154】
【数17】
【0155】
から、また、帯域拡張モジュールから出力される信号からエコーを検出するためのモジュール19からなっている。エコー、詳細にはプリエコーを検出するためのモジュール19は、Ghiで示されている高周波数利得値信号を引き渡している。
【0156】
最後に、高周波数帯域ディジタル可聴信号に高周波数利得値を適用するための回路20が提供されており、その後段に、加算回路14にディジタル可聴信号の高周波数帯域合成信号を引き渡すオーバサンプリング回路12および高域通過フィルタリング回路13が提供されている。
【0157】
図7に示されている本発明の主題であるデバイスの動作は次の通りである。それぞれ20msフレームを表すビットがデマルチプレクサ00で逆多重化される。ここでの説明は、8ビットから32ビットまで動作する復号化に対するものである。実際には、ビットストリームは、8kbit/s、12kbit/s、14kbit/sおよび14kbit/sと32kbit/sの間の値を有しており、必要に応じてビットレートを選択することができる。
【0158】
第1の狭帯域合成(0〜4000Hz)を生成するために、CELPデコーダには8kbit/sおよび12kbit/sの層のビットストリームが使用されている。14kbit/sの層と結合したビットストリーム部分が帯域拡張モジュール02によって復号化される。高帯域(4000〜7000Hz)中に得られる時間信号が、MDCTモジュール03によってスペクトル
【0159】
【数18】
【0160】
に変換される。受け取ったビットレート(14kbit/sないし32kbit/s)の可変部分によって、低帯域差信号および高帯域置換信号のMDCT係数の復号化が制御され、また、知覚的に重要な順序で符号化されたMDCT係数を復号化するためのモジュール04が制御される。低帯域では、符号化された差信号
【0161】
【数19】
【0162】
のスペクトルには、デコーダが受け取っていない非復号化帯域に対する復元スペクトル帯域およびゼロが含まれている。高帯域では、
【0163】
【数20】
【0164】
には、帯域拡張に由来するスペクトル
【0165】
【数21】
【0166】
と、直接符号化された高帯域のMDCT係数のスペクトル帯域の組合せが含まれている。逆MDCT周波数-時間置換モジュール05および逆MDCT加算/重畳モジュール06によってこれらの2つのスペクトルが、時間領域
【0167】
【数22】
【0168】
および
【0169】
【数23】
【0170】
に調整される。
【0171】
モジュール15および18によって、復元フレーム内における従来技術によるエコーの減衰を禁止することが肝要であるすべてのゾーンが決定される。
【0172】
既に説明したように、モジュール15は、入力信号として、現在のフレームの復元信号
【0173】
【数24】
【0174】
および図7にMemloで示されている現在のフレームの第2の部分を受け取っている。
【0175】
図8aおよび図8bは、モジュール15の機能を実行するための流れ図の2つの実施例を示したものである。モジュール15の出力は、擬似警報ゾーンで示されている、エコーの減衰を適用する必要のないゾーンの始まりおよび終わりを画定している2つの指標からなっている。これらの2つの指標が同じである場合、それは、現在のフレーム内における従来技術によるエコーの減衰を修正する必要がないことを意味している。
【0176】
ブロック07は、逆変換デコーダ05の出力の、エンコーダ上で実行された知覚フィルタリングの逆知覚フィルタリングを実行している。モジュール16は、この信号の包絡線とCELPデコーダの出力信号の包絡線との間の比率に応じて、本発明によるモジュール15内で得られる指標を同じく考慮することによってプリエコー減衰利得を決定する。モジュール16内では、特定の範囲の利得値が1にリセットされ、実際、それらを値1にリセットし、エコー減衰が存在しない状態にすることにより、従来技術によって確立される利得値を禁止することができる。
【0177】
図8cの流れ図は、モジュール16の一例示的実施形態を示したもので、従来技術による状態と、本発明によって実施される修正、すなわち図8cのブロック310ないし313を組み合わせたものである。モジュール16は、さらに、低域通過フィルタリングによって利得を平滑化するためのモジュールを備えており、図8dは、その一例示的実施形態を示したものである。
【0178】
モジュール17は、エコーが減衰した信号を得るために、モジュール16によって計算された利得を、逆知覚フィルタ07によってフィルタリングされた変換デコーダの出力信号に適用している。次に、この信号が加算器08によってCELPデコーダの出力信号に加えられ、それにより新しい信号が得られる。ポストフィルタリングモジュール09によってポストフィルタリングされるこの新しい信号は、復元された低帯域信号である。この信号は、オーバサンプリング10を経て低帯域合成QMFフィルタ11に転送された後、加算器14によって高帯域の信号に加えられ、それにより復元信号が得られる。
【0179】
高帯域では、モジュール18の動作は、モジュール15の動作と全く同じである。モジュール18は、
【0180】
【数25】
【0181】
から、また、現在のフレームの復元信号および図7にMemhiで示されている現在のフレームの第2の部分の復元信号から、エコーの減衰を適用する必要のないゾーンの始まりおよび終わりを決定する。
【0182】
モジュール19は、周波数-時間置換06の出力信号の包絡線と帯域拡張02の出力の包絡線の比率に応じて、モジュール18によって得られる指標を同じく考慮することによってプリエコー減衰利得を決定する(図8aおよび図8bに示されている、本発明(図8c参照)に従って利得が値1にセットされる流れ図参照)。次に、得られた利得が低域通過フィルタリングによって平滑化される(図8d参照)。モジュール20は、モジュール19によって計算された利得を周波数-時間置換06の出力の結合信号
【0183】
【数26】
【0184】
に適用する。
【0185】
オーバサンプリング10および低域通過フィルタリング11によって合成された低帯域からの信号と、オーバサンプリング12および高域通過フィルタリング13によって同じく合成された高帯域からの信号とを加算14することにより、16kHzでサンプルされた広帯域出力信号が得られる。
【0186】
図7に示されているモジュール15および18によって実行されるエコー減衰禁止の動作について、図4a、図4bおよび図4cに関連する説明を参照して、図8aの流れ図に関連して説明する。
【0187】
流れ図の最初の部分である、103で参照されているステップの周りには、K2個のサブブロックである、加算/重畳後の復元信号xrec(n)のエネルギーを計算するステップが含まれている。この流れ図におけるxrec(n)は、それぞれ、図7の信号
【0188】
【数27】
【0189】
および
【0190】
【数28】
【0191】
に対応している。
【0192】
次の部分である、107で参照されているステップの周りには、逆MDCTの出力部分で、現在のフレームの第2の部分の個々のサブブロックのエネルギーを計算するステップが含まれている。信号のこの部分の対称性のため、異なっているのはK2/2値のみである。
【0193】
ステップ110で、復元信号のK2個のサブブロックに対する最小エネルギーminenが計算される。ステップ111で、K2+K2/2個のブロックに対して、信号サブブロックxrec(n)およびxcur(n)の最小のエネルギーが計算される。
【0194】
図8aに示されている流れ図の最後の部分には、エコー減衰利得を値1にリセットすることができる指標ind1およびind2を計算するステップが含まれており、したがって従来技術による利得の減衰が禁止される。そのために、ステップ112で、最小エネルギーに対する最大エネルギーの比率が計算され、かつ、閾値の値Sと比較される。この比率が閾値の値Sより小さい場合、ind1が0にセットされ、ind2がL-1にセットされる。つまり、引き続いて、n=0からn=L-1の範囲にわたる現在のフレーム全体の利得が1にリセットされる。実際には、エネルギー間の差は小さく、したがってアタックは存在していない。上記比率が閾値の値Sより大きいか、あるいは閾値の値Sに等しい場合、Cがサンプルの決定済みの数である値ind1+C-1を使用してind2が例示される。したがって一定の範囲のサンプルが選択され、アタックが存在しているこの範囲のサンプルに対するエコー利得の減衰を禁止することにより、この範囲の利得が1にリセットされる。値ind2がフレーム長(L)より大きい場合、ind2はL-1にセットされる。ind2は、そのフレームの最後のサンプルを指している。
【0195】
図8aに示されている流れ図による手順は、ポストエコーの減衰を不適切に禁止している。ポストエコーの場合、先行するフレームにアタックが存在しており、一方、現在のフレームおよび次のフレームでは、エネルギーを極めて一様にすることができる。さらに、このエネルギーは、通常、減少する。これらの2つの理由のうちの1つのため、図8aに示されている手順によって擬似警報が不適切に検出される。
【0196】
ポストエコーの減衰処理をそのままの状態で維持するために、図8aに示されている手順に修正が加えられる。以下、プリエコーおよびポストエコーの減衰を禁止するためのサンプルの範囲を計算するための修正流れ図について、図8bを参照して、修正手順の中で説明する。
【0197】
図8bに示されている流れ図の208で参照されているステップまでの最初の部分は、図8aに示されている流れ図の108で参照されているステップまでの部分と同様である。
【0198】
また、次の部分でも、ポストエコー利得の減衰の起動を禁止する必要のないポストエコーの場合が考慮されている。
【0199】
最初に、ステップ210で、復元信号のK2個のブロック全体の最大エネルギーmaxrecが計算される。先行するフレームからの最大エネルギーmaxprevがメモリに記憶されると、次に、現在の最大maxrecに対するmaxprevの比率が比較される。この比率が閾値の値S1より大きい場合、ポストエコー状況が存在し、ポストエコー減衰を禁止してはならない。したがって、ステップ212で、次のフレームのためにmaxrecが記憶され、また、ind1がLで例示され、かつ、ind2がL-1で例示され、手順が終了する。上記比率が閾値の値S1に等しいか、あるいはそれより小さい場合、ステップ213で、次のフレームのためにmaxrecが記憶される。次に、ステップ214で、連結信号の1.5K2個のすべてのブロック全体の最大エネルギーmaxenおよび最大エネルギーブロックの開始指標が計算される。次に、最小エネルギーが計算され、次に、ステップ112、113、114および115で、最小エネルギーに対する最大エネルギーの比率が、図8aに示されている流れ図と同様の方法で比較される。比率が閾値の値より小さい場合、ind1が0にセットされ、ind2がL-1にセットされる。つまり、0からL-1までの範囲またはフレーム全体のサンプルの利得を1にセットすることによってエコーの減衰が禁止される。上記比率が閾値の値に等しいか、あるいはそれより大きい場合、Cがサンプルの固定数である値ind1+C-1がind2に割り当てられ、次に、ind1からind2までの範囲のサンプルの利得が値1で例示される。ind2の値がフレームの長さ(L)より大きい場合、L-1でind2が例示される。この場合、ind2はフレームの最後のサンプルを指している。
【0200】
次に、擬似警報レンジ全体にわたるエコー減衰の禁止について、図8cに関連して説明する。図8cに示されている流れ図の最初の部分は、図2dに示されている、エコー減衰を計算するための従来技術による流れ図が繰り返されている。
【0201】
変換エンコーダに由来する信号の包絡線を計算するためのステップ301、および時間エンコーダに由来する信号の包絡線を計算するためのステップ302が、流れ図の最初の部分に追加されている。また、図8cに追加されている、図2dにはない本質的な部分は、図8cのステップ310ないし314に関係している。この部分は、サンプルind1とind2の間でエコー減衰利得を値1にセットすることに関連している。本発明の主題である方法によれば、ind1からind2の範囲は、従来技術によるエコー減衰の起動が不適切に動作し、したがって既に説明したように修正しなければならないサンプルの範囲として決定されている。
【0202】
図8cに示されている方法の実施態様の場合、実際、不連続性を回避するために、第1次数帰納フィルタによって、信号の個々のサンプルに対して初期利得係数g(n)が平滑化される。平滑フィルタの伝達関数は、
【0203】
【数29】
【0204】
で与えられる。
【0205】
したがって、時間領域におけるフィルタリングの式は、
g'(n)=αg'(n-1)+(1-α)g(n)
である。
【0206】
先行する関係では、αは、0と1の間の実数値である。
【0207】
実際には、この初期利得は、k2個(一般的にはk2=40)のサンプル毎に計算され、サブブロックのすべてのサンプルに対してその値が繰り返される。図8dに示されている流れ図の平滑化が使用されるのは、そのために初期利得が階段状になることによるものである。このエコー減衰利得の平滑化は、一例として図3dに明確に示されており、小さい値から値1まで利得が緩やかに大きくなっている。
【0208】
擬似警報領域を画定するためのモジュール15および/または18は、加算/重畳のための逆変換に由来する信号である入力信号のみで動作していることに留意されたい。このモジュールは、加算/重畳による逆変換を使用して、任意のデコーダ(階層型であれ非階層型であれ、あるいは多重帯域であれ非多重帯域であれ)の中で実施することができ、それにより、他のデバイスによって与えられる初期エコー減衰決定を保証するための復元信号が生成される。
【0209】
図9aは、例示的実施態様を示したものである。利得の開始は、エコー減衰利得を計算する他の任意の方法に基づくことができる。
【0210】
図9aでは、二重参照05と06、15と18、16と19および17と20は、実際、図7に示されている、擬似警報ゾーンを画定するためのモジュール15および18のための対応する構成要素を表している。また、利得初期化サブモジュール16a、19aが追加されている。
【0211】
図9bは、初期利得を計算するための例示的実施態様を示したものである。この事例では、最初に利得がゼロにセットされ、また、エコー減衰禁止手順を使用して、エコーが存在していないすべてのゾーンの利得が1にリセットされる。
【0212】
対応するサブステップには、擬似警報ゾーンを画定するためのモジュール15および18の場合と同様、値がゼロのサンプルnのランクの利得G(n)を初期化するためのサブステップ500、処理されるサンプルnのランクを第1の指標値ind1で例示するためのステップ501、第2の指標値マイナス1に対するランクnの劣等性を比較するための試験ステップ502が含まれている。
【0213】
この値に到達しない限り、ステップ503で利得値G(n)が値1に修正され、方法は、n=n+1によって次のランクサンプル504へ進み、サブステップ502で利得修正動作が終了する。
【0214】
本発明の主題である方法には、アタックの開始を決定する他の任意の方法と共に動作させることができる、アタックの開始を計算するための特定の例(個々のサブブロックの最大エネルギーを探索する)が使用されている。
【0215】
本発明の主題である方法および上で言及した変形態様は、MDCTフィルタバンク、もしくは実数値あるいは複素数値を有する完全な復元を備えた任意のフィルタバンク、またはほぼ完全な復元を備えたフィルタバンク、およびフーリエ変換あるいはウェーブレット変換を使用したフィルタバンクを使用しているあらゆる変換エンコーダのエコーの減衰に適用される。
【0216】
また、本発明には、媒体に記憶された、コンピュータまたは専用デバイスによって実行するための一連の命令を備えたコンピュータプログラムであって、これらの命令が実行されると、本発明の主題である、図3aないし5bに関連して上で説明した方法が後者によって実行されることを特徴とするコンピュータプログラムが包含されている。
【0217】
上で言及したコンピュータプログラムは、低エネルギー信号部分におけるエコーの存在を弁別するためのモジュール、エコー減衰モジュール、および図7ないし8dに関連して説明したエコー減衰検出デバイスの現在のフレームの信号の高エネルギー部分のエコーの減衰を禁止するためのモジュールに搭載される、直接実行することができるプログラムである。
【図面の簡単な説明】
【0218】
【図1】実例として、従来技術による、変換および加算/重畳によるディジタル可聴信号の符号化および復号化を示す略図である。
【図2a】「予測型復号化層i」と呼ばれる複数の非エコー生成デコーダと、「変換復号化層j」と呼ばれる複数の変換デコーダとを備えた階層型デコーダを示す図である。
【図2b】時間デコーダに由来する復号化信号および変換デコーダに由来する復号化信号を入力として備えた、エコーを弁別するためのデバイス1を示す図である。
【図2c】それぞれ時間デコーダおよび変換デコーダに由来する信号の時間包絡線およびエコー存在フラグを計算する方法を示す図である。
【図2d】エコーが存在している継続期間の間、加算/重畳出力信号に、変換復号化信号の包絡線に対する時間信号の包絡線の比率に等しい利得g(k)を掛け合わせることによってエコーを減衰させる方法を示す図である。
【図2e】エコーの弁別およびそれらの減衰が非制限方式で2つの周波数副帯域で実行される多層システムにおけるエコー弁別の原理を示す図である。
【図2f】変換エンコーダにおける現在のフレームの復元信号を得る方法を示す図である。
【図3a】本発明の主題である方法を実施するためのステップ全体の流れ図を実例によって示す図である。
【図3b】エコー減衰がない場合の、信号の低帯域のCELP予測型/多層変換エンコーダ中のディジタル可聴信号のタイミング図である。
【図3c】図2bに示す従来技術によるエコー減衰が存在する場合の、信号の低帯域におけるCELP予測型/多層変換エンコーダ中のディジタル可聴信号のタイミング図である。
【図3d】エコーの減衰が起動され、信号の低周波数帯域における誤った起動の減衰が禁止されたCELP/多層変換エンコーダ中の可聴信号のタイミング図である。
【図4a】本発明の非制限の好ましい第1の例示的実施態様による、エコー減衰の禁止を制御する前記連結信号を実例によって示すグラフである。
【図4b】本発明の非制限の好ましい第2の例示的実施態様による、エコー減衰の禁止を制御する前記連結信号を実例によって示すグラフである。
【図4c】正弦曲線を復号化する場合の、エコーの減衰がない場合の、信号の高周波数帯域の時間/多層変換デコーダ中のディジタル可聴信号のタイミング図である。
【図4d】従来技術による、正弦曲線を復号化する場合の、エコーの減衰が起動された信号の高周波数帯域における時間/多層変換デコーダ中の可聴信号のタイミング図である。
【図4e】本発明の主題である方法による、正弦曲線を復号化する場合の、減衰が起動された信号およびエコーの減衰が禁止された信号の高周波数帯域の時間/多層変換デコーダ中の可聴信号のタイミング図である。
【図5】本発明の非制限の好ましい第1の例示的実施態様による、エコー減衰の禁止を制御する前記連結信号を実例によって示すグラフである。
【図6】変換符号化およびフレーム加算/重畳プロセスにおけるポストエコーの生成を示すグラフである。
【図7】エコー減衰およびエコー減衰禁止手段を備えた本発明の主題による多層階層型エンコーダによって生成されるディジタル可聴信号のエコーを弁別し、かつ、減衰させるためのデバイスの機能線図を実例によって示す図である。
【図8a】プリエコー減衰禁止サンプルの範囲を計算するための流れ図を実例によって示す図である。
【図8b】プリエコーおよびポストエコー減衰禁止サンプルの範囲を計算するためのタイミング図を実例によって示す図である。
【図8c】プリエコー減衰禁止を実施する流れ図を実例によって示す図である。
【図8d】利得係数を平滑にする流れ図を実例によって示す図である。
【図9a】擬似警報ゾーンを画定するためのモジュールのブロック図を実例によって示す図である。
【図9b】図9aに示す利得計算サブモジュールの利得を計算するための流れ図を実例によって示す図である。
【符号の説明】
【0219】
1 0と1の間の値を有するプリエコー処理利得
00 デマルチプレクサ
01 予測型復号化モジュール
02 帯域拡張チャネル(帯域拡張モジュール)
03 MDCT変換時間-周波数置換
04 変換復号化モジュール
05 逆変換周波数-時間置換モジュール(逆変換デコーダ)
06 逆変換周波数-時間置換モジュール(逆MDCT加算/重畳モジュール)
07 逆知覚フィルタ
08 加算資源(加算器)
09 ポストフィルタリング資源(ポストフィルタリングモジュール)
10 オーバサンプリング資源
11 QMF合成フィルタリング資源
12 オーバサンプリング回路
13 高域通過フィルタリング回路
14 加算回路(加算器)
15 擬似警報ゾーンを画定するためのモジュール
16 エコー検出モジュール
16a、19a 利得初期化サブモジュール
17 変換によって復号化され、かつ、WNB(z)-1によってフィルタリングされた信号に低周波数利得値Gloを適用するための回路(モジュール)
18 プリエコー擬似警報ゾーンを画定するための資源(擬似警報ゾーンを画定するためのモジュール)
19 プリエコーを検出するための資源(エコーを検出するためのモジュール)
20 高周波数帯域ディジタル可聴信号に高周波数利得値を適用するための回路(モジュール)
【特許請求の範囲】
【請求項1】
エコーを生成する変換符号化によって生成されるディジタル可聴信号のエコーを弁別し、かつ、減衰させるための方法であって、少なくとも復号化において、このディジタル可聴信号の現在のフレーム毎に、
- 高エネルギーゾーンへのトランジションに先行する低エネルギーゾーンを弁別するステップと、
- 前記現在のフレームの非弁別ゾーンに対応する擬似警報ゾーンを画定するステップと、
- 前記現在のフレームの減衰利得値を使用して前記エコーの初期処理を決定するステップと、
- 前記現在のフレームの前記低エネルギー弁別ゾーン内の前記エコーの前記初期処理に基づいて前記エコーを減衰させるステップと、
- 前記擬似警報ゾーン内の前記初期処理における前記エコーの減衰を禁止するステップと
を含むことを特徴とする方法。
【請求項2】
前記符号化が、エコーを生成する前記変換符号化段と並列に、エコーを生成しない時間符号化段をさらに備え、前記エコーの前記初期処理の前記決定が、前記復号化において、このディジタル可聴信号の現在のフレーム毎に、
- 実時間で、少なくとも1つの周波数帯域において、エコー生成復号化によって得られる信号の時間包絡線の特性から得られる変数、および非エコー生成復号化によって得られる信号の対応する特性から得られる変数を表す値と閾値の値を比較するステップと、
- この比較の結果に基づいて、前記変換符号化によって得られるエコーが前記現在のフレームに存在していること、あるいは存在していないことを結論付けるステップと、
- エコーが存在している場合、前記エコー生成復号化および前記非エコー生成復号化によって得られる前記変数に基づいて前記エコーの初期減衰利得を決定するステップと
を含むことを特徴とする請求項1に記載の方法。
【請求項3】
前記エコーの前記初期処理の前記決定が、デコーダ上で、このディジタル可聴信号の現在のフレーム毎に、前記現在のフレームの前記初期利得に値0を割り当てるステップを含むことを特徴とする請求項1に記載の方法。
【請求項4】
現在のフレームが第1および第2の部分を備え、前記擬似警報ゾーンを画定するステップを含む前記ステップが、少なくとも、
- 前記現在のフレームの復元信号および前記現在のフレームの前記第2の部分の信号から連結信号を生成するステップと、
- 前記連結信号を決定済み長さのサンプルの偶数数のサブブロックに分割するステップと、
- 決定済み長さの前記サブブロックの各々の信号のエネルギーを計算するステップと、
- すべての前記サブブロックの前記エネルギー値の最大を計算するステップと、
- 前記現在のフレームの前記復元信号のサブブロックに対するエネルギー値の最小を計算するステップと、
- 前記最小エネルギーに対する前記最大エネルギーの比率が決定済み閾値の値より小さいか、あるいは閾値の値に等しく、すべての前記現在のフレームにエコーが存在しないことが明らかになると、前記現在のフレームの第1のサンプルのランクを第1の指標に割り当て、また、前記現在のフレームの最後のサンプルのランクを第2の指標に割り当てるステップと、
- 前記擬似警報ゾーンを前記第1の指標と第2の指標の間に含まれている前記現在のフレームの前記サンプルとして識別するステップと
を含むことを特徴とする請求項1、2または3に記載の方法。
【請求項5】
前記最小エネルギーに対する前記最大エネルギーの前記比率が前記決定済み閾値の値より大きく、プリエコーの危険が前記信号の低エネルギー部分のみに存在することが明らかになると、前記方法が、前記高エネルギーゾーンの前記第1のサンプルのランクを表す第1の指標および前記高エネルギーゾーンの前記最後のサンプルのランクを表す第2の指標を計算するためのステップをさらに含むことを特徴とする請求項4に記載の方法。
【請求項6】
前記第1の指標が第1の高エネルギーサブブロックの前記第1のサンプルの指標であることを特徴とする請求項5に記載の方法。
【請求項7】
前記第2の指標が、サンプル数マイナス1に換算した最大擬似警報長によって増補された前記第1の指標の値と、処理される前記現在のフレームの前記最後のサンプルの指標の値マイナス1との間の最小として計算されることを特徴とする請求項4から6の一項に記載の方法。
【請求項8】
前記禁止が、前記擬似警報ゾーンの外部の初期利得値を維持しつつ前記擬似警報ゾーンの前記減衰利得値を値1にセットし、かつ、結果として得られる減衰利得値を前記現在のフレームの前記復元信号の前記サンプルに適用することによって実行される、請求項1から7の一項に記載の方法。
【請求項9】
前記結果として得られる利得値が、前記現在のフレームの前記復元信号の前記サンプルへの適用に先立って、フィルタリングによって平滑化されることを特徴とする請求項8に記載の方法。
【請求項10】
先行するフレームの最大エネルギーの比率が記憶され、
- 前記現在のフレームのエネルギーに対する前記先行するフレームのエネルギーの比率が決定済み閾値の値より大きく、ポストエコーの危険が前記現在のフレームに存在していることが明らかになると、前記方法が、
- 前記現在のフレームの前記エコーの前記初期処理に基づいて前記エコーを減衰させるステップ
をさらに含むことを特徴とする請求項1から9の一項に記載の方法。
【請求項11】
エコーを示す可能性のある変換エンコーダによって生成されるディジタル可聴信号のエコーを弁別し、かつ、減衰させるためのデバイスであって、少なくとも変換デコーダ上に、
- 高エネルギーゾーンへのトランジションに先行する低エネルギーゾーンを弁別する手段と、
- 現在のフレームの非弁別ゾーンに対応する擬似警報ゾーンを画定する手段と、
- 減衰利得値を使用して前記エコーの初期処理を決定する手段と、
- 前記現在のフレームの前記低エネルギー弁別ゾーンに適用される前記エコーの前記初期処理に基づいて前記エコーを減衰させる手段と、
- 前記擬似警報ゾーンに適用される前記初期処理の前記エコーの前記減衰を禁止する手段と
を備えたことを特徴とするデバイス。
【請求項12】
多層階層型エンコーダによってデコーダ中に生成されるディジタル可聴信号に対して、前記デコーダが、エコーを生成しない少なくとも1つの時間デコーダと、エコーを示す可能性のある少なくとも1つの変換デコーダとを備え、前記デバイスが、少なくとも時間デコーダ上および変換デコーダ上に、
- 高エネルギーゾーンへのトランジションに先行する低エネルギーゾーンを弁別し、前記エコーの減衰を禁止しなければならないゾーンの指標を引き渡す手段と、
- 前記現在のフレームの少なくとも1つの周波数帯域内におけるエコーの存在および元の位置を計算し、前記エコーの減衰を禁止しなければならないゾーンの少なくとも前記指標を受け取り、かつ、前記現在のフレームに適用することができるエコー減衰値を引き渡す手段と、
- 前記逆変換デコーダによって引き渡される前記現在のフレームの前記復号信号および前記現在のフレームに適用することができる前記エコー減衰値を受け取る、前記エコーを減衰させる手段と
を備えたことを特徴とする請求項11に記載のデバイス。
【請求項13】
前記現在のフレームの少なくとも1つの低周波数帯域および1つの高周波数帯域内におけるエコーの存在および元の位置を計算する前記手段が統合され、かつ、前記デコーダのデマルチプレクサに接続された、
- 前記ディジタル可聴信号のための低周波数帯域復号化チャネルと、
- 前記ディジタル可聴信号のための高周波数帯域復号化チャネルと、
- それぞれ前記高周波数帯域復号化チャネルおよび前記低周波数帯域復号化チャネルによって引き渡される信号を受け取り、かつ、復元されたディジタル可聴信号を引き渡す加算回路と
を備えたことを特徴とする請求項11または12に記載のデバイス。
【請求項14】
前記低周波数帯域復号化チャネルが、
- 逆多重化されたビットストリームを受け取り、かつ、予測復号化によって復号化された信号を引き渡す予測型復号化モジュールと、
- 前記逆多重化されたビットストリームを受け取り、かつ、低周波数帯域符号化差信号
【数1】
のスペクトル係数を引き渡すスペクトル係数復号化モジュールと、
- 前記低周波数帯域符号化差信号
【数2】
の前記スペクトル係数を受け取り、かつ、低周波数帯域ディジタル可聴信号
【数3】
を引き渡し、また、低エネルギー信号部分におけるエコーの存在を弁別する前記手段および前記減衰禁止手段を形成する周波数/時間置換モジュールと、
- 擬似警報ゾーンを画定し、かつ、フィルタリングされた信号
【数4】
および予測復号化によって復号化された前記信号の低周波数帯域ディジタル可聴信号
【数5】
、Memloからエコーを検出し、また、低周波数利得値信号(Glo)を引き渡す手段と、
- 変換復号化によって復号化され、場合によってはフィルタリングされた信号に前記低周波数利得値(Glo)を適用し、加算し、ポストフィルタリングし、オーバサンプリングし、かつ、前記ディジタル可聴信号の低周波数帯域合成信号を引き渡すQMF合成フィルタリングを実行する手段と
を備えたことを特徴とする請求項13に記載のデバイス。
【請求項15】
前記高周波数帯域復号化チャネルが、
- 前記逆多重化されたビットストリームを受け取り、かつ、プリエコーが存在しない前記ディジタル可聴信号の時間包絡線基準信号を引き渡す帯域拡張チャネルと、
- 前記逆多重化されたビットストリームおよび前記時間基準信号のスペクトル係数を受け取り、かつ、高周波数帯域符号化ディジタル可聴信号
【数6】
のスペクトル係数を引き渡す前記スペクトル係数復号化モジュールと、
- 前記高周波数帯域符号化ディジタル可聴信号のスペクトルの前記係数を受け取り、かつ、前記高周波数帯域ディジタル可聴信号
【数7】
を引き渡し、また、前記低エネルギー信号部分におけるエコーの存在を弁別する前記手段および前記減衰禁止手段を形成する周波数/時間置換モジュールと、
- 擬似警報ゾーンを画定し、かつ、高周波数帯域ディジタル可聴信号
【数8】
、Memhi、高周波数帯域利得値信号(Ghi)を引き渡す帯域拡張モジュールの出力からエコーを検出する手段と、
- 前記高周波数帯域ディジタル可聴信号に高周波数利得値を適用し、オーバサンプリングし、かつ、前記ディジタル可聴信号の高周波数帯域合成信号を引き渡す高域通過フィルタリングを実行する手段と
を備えたことを特徴とする請求項13に記載のデバイス。
【請求項16】
前記低周波数帯域復号化チャネルにおいて、擬似警報ゾーンを画定する前記手段が、前記現在のフレームの中で第1および第2の指標を計算する手段であって、前記第1の指標が最大エネルギーサンプルのランクを表し、前記第2の指標が最後の高エネルギーサンプルを表す手段を備えたことを特徴とし、また、前記エコー検出手段が前記第1および第2の指標を使用して前記低周波数利得値信号(Glo)を引き渡し、前記低周波数帯域ディジタル可聴信号
【数9】
が、符号化の中で適用される知覚重み付けフィルタとは逆の知覚重み付けフィルタによって重み付けされ、また、前記信号が予測復号化によって復号化され、前記利得値が、調整可能利得増幅器を介して、符号化の中で適用される知覚重み付けフィルタとは逆の知覚重み付けフィルタによって重み付けされた前記低周波数帯域ディジタル可聴信号
【数10】
に適用されることを特徴とする請求項14に記載のデバイス。
【請求項17】
前記高周波数帯域復号化チャネルにおいて、擬似警報ゾーンを画定する前記手段が、前記現在のフレームの中で第1および第2の指標を計算する手段であって、前記第1の指標が最大エネルギーサンプルのランクを表し、前記第2の指標が最後の高エネルギーサンプルを表す手段を備えたことを特徴とし、また、前記エコー検出手段が前記第1および第2の指標を使用して前記高周波数利得値信号(Ghi)を引き渡し、前記高周波数帯域ディジタル可聴信号
【数11】
および前記ディジタル可聴信号が前記帯域拡張モジュールから得られ、前記利得値が、調整可能増幅器を介して、前記高周波数帯域ディジタル可聴信号
【数12】
に適用されることを特徴とする請求項15に記載のデバイス。
【請求項18】
エコーが存在している前記擬似警報ゾーンを前記第1の指標と第2の指標の間に画定するために、前記画定手段が、少なくとも、
- それぞれ低周波数帯域
【数13】
および高周波数帯域
【数14】
における前記現在のフレームの復元信号のK2個のサブブロックのエネルギーを計算するステップと、
- それぞれ低周波数帯域Memloおよび高周波数帯域Memhiにおける前記現在のフレームの第2の部分の前記ディジタル可聴信号の第1のK2/2個のサブブロックのエネルギーを計算するステップと、
- それぞれ低周波数帯域および高周波数帯域における前記現在のフレームの前記復元信号の前記K2個のサブブロック全体の最小エネルギーを計算するステップと、
- それぞれ低周波数帯域および高周波数帯域における計算されたすべてのエネルギーに対する前記サブブロックの前記エネルギーの最大を計算するステップと、
- 前記最小エネルギーに対する前記最大エネルギーの比率の決定済み閾値の値に対する劣等性を比較することによって前記第1および第2の指標を計算するステップであって、前記劣等性の比較が検証されると、前記第1の指標の値が値0で例示され、前記第2の指標の値が前記現在のフレームのサンプル数マイナス1に換算した最大値で例示され、1に等しい利得が前記エコーに適用され、前記現在のフレームの長さ全体にわたって減衰が禁止されるステップと、
- 前記劣等性の比較が検証されない場合、前記第1の指標を最大エネルギーブロックの第1のサンプルの位置で例示するステップであって、前記第2の指標の値が、決定済みサンプル数マイナス1によって増補された前記第1の指標およびフレームの最後のサンプルの指標の最小の値で例示され、アタックが前記第1の指標と前記第2の指標の間に存在するサンプルの範囲全体にわたって1に等しい利得が信号に適用され、また、減衰が禁止されるステップと
を含むことを特徴とする請求項16または17の一項に記載のデバイス。
【請求項19】
ポストエコーの処理を考慮し、また、前記ポストエコーの減衰の禁止を除去することによるプリエコーおよび前記ポストエコーの処理の実行を考慮するために、前記現在のフレームの前記信号の個々のサブブロックのエネルギーを計算する前記手段が、
- 前記現在のフレームの前記復元信号の前記K2個のサブブロックに対する最大エネルギーの計算と、
- 優越性比較による、決定済み閾値の値に対する、前記現在のフレームの前記最大エネルギーに対する先行するフレームの最大エネルギーの比率の比較であって、優越性比較に合格すると、ポストエコーが存在していることを示す比較と、
- 次のフレームのための前記現在のフレームの前記最大エネルギーの記憶および終了状態への復帰であって、前記最小エネルギー、前記最大エネルギー、前記第1の指標および第2の指標の計算が禁止され、また、前記ポストエコーの減衰の禁止が除去され(これは、前記第1の指標の値が前記第2の指標の値より大きい場合に実行される)、また、優越性比較に合格しない場合、ポストエコーが存在していないことを示す記憶および復帰と、
- 次のフレームのための前記復元信号のフレームの最大エネルギーの記憶と、
- 請求項12に記載されている前記第1および第2の指標の計算と
を含むことを特徴とする請求項18に記載のデバイス。
【請求項20】
前記エコー減衰手段が調整可能利得増幅器を備え、調整可能利得値が0に例示され、利得値を1にセットすることにより、前記第1の指標値と第2の指標値の間に含まれているサンプルの減衰が禁止され、それにより、高エネルギーディジタル可聴信号のサンプルに適用される減衰を禁止することができ、かつ、トランジションがそれぞれ前記現在のフレームおよび先行するフレームに出現することによって生成されるポストエコーおよびプリエコーにそれぞれ適用される減衰を維持することができることを特徴とする請求項11に記載のデバイス。
【請求項21】
媒体に記憶された、コンピュータまたは専用デバイスによって実行するための一連の命令であって、前記命令が実行されると、後者が、請求項1から10の一項に記載されている、ディジタル可聴信号のエコーを弁別し、かつ、減衰させる方法を実施することを特徴とする命令を備えたコンピュータプログラム。
【請求項22】
前記プログラムが、信号の低エネルギー部分におけるエコーの存在を弁別するためのモジュール、エコーを減衰させるためのモジュール、および請求項11から20の一項に記載されている、エコーを検出し、かつ、減衰させるためのデバイスにおける現在のフレームまたは先行するフレームの信号の高エネルギー部分のエコーの減衰を禁止するためのモジュールに搭載される、直接実行することができるプログラムであることを特徴とする請求項21に記載のコンピュータプログラム。
【請求項1】
エコーを生成する変換符号化によって生成されるディジタル可聴信号のエコーを弁別し、かつ、減衰させるための方法であって、少なくとも復号化において、このディジタル可聴信号の現在のフレーム毎に、
- 高エネルギーゾーンへのトランジションに先行する低エネルギーゾーンを弁別するステップと、
- 前記現在のフレームの非弁別ゾーンに対応する擬似警報ゾーンを画定するステップと、
- 前記現在のフレームの減衰利得値を使用して前記エコーの初期処理を決定するステップと、
- 前記現在のフレームの前記低エネルギー弁別ゾーン内の前記エコーの前記初期処理に基づいて前記エコーを減衰させるステップと、
- 前記擬似警報ゾーン内の前記初期処理における前記エコーの減衰を禁止するステップと
を含むことを特徴とする方法。
【請求項2】
前記符号化が、エコーを生成する前記変換符号化段と並列に、エコーを生成しない時間符号化段をさらに備え、前記エコーの前記初期処理の前記決定が、前記復号化において、このディジタル可聴信号の現在のフレーム毎に、
- 実時間で、少なくとも1つの周波数帯域において、エコー生成復号化によって得られる信号の時間包絡線の特性から得られる変数、および非エコー生成復号化によって得られる信号の対応する特性から得られる変数を表す値と閾値の値を比較するステップと、
- この比較の結果に基づいて、前記変換符号化によって得られるエコーが前記現在のフレームに存在していること、あるいは存在していないことを結論付けるステップと、
- エコーが存在している場合、前記エコー生成復号化および前記非エコー生成復号化によって得られる前記変数に基づいて前記エコーの初期減衰利得を決定するステップと
を含むことを特徴とする請求項1に記載の方法。
【請求項3】
前記エコーの前記初期処理の前記決定が、デコーダ上で、このディジタル可聴信号の現在のフレーム毎に、前記現在のフレームの前記初期利得に値0を割り当てるステップを含むことを特徴とする請求項1に記載の方法。
【請求項4】
現在のフレームが第1および第2の部分を備え、前記擬似警報ゾーンを画定するステップを含む前記ステップが、少なくとも、
- 前記現在のフレームの復元信号および前記現在のフレームの前記第2の部分の信号から連結信号を生成するステップと、
- 前記連結信号を決定済み長さのサンプルの偶数数のサブブロックに分割するステップと、
- 決定済み長さの前記サブブロックの各々の信号のエネルギーを計算するステップと、
- すべての前記サブブロックの前記エネルギー値の最大を計算するステップと、
- 前記現在のフレームの前記復元信号のサブブロックに対するエネルギー値の最小を計算するステップと、
- 前記最小エネルギーに対する前記最大エネルギーの比率が決定済み閾値の値より小さいか、あるいは閾値の値に等しく、すべての前記現在のフレームにエコーが存在しないことが明らかになると、前記現在のフレームの第1のサンプルのランクを第1の指標に割り当て、また、前記現在のフレームの最後のサンプルのランクを第2の指標に割り当てるステップと、
- 前記擬似警報ゾーンを前記第1の指標と第2の指標の間に含まれている前記現在のフレームの前記サンプルとして識別するステップと
を含むことを特徴とする請求項1、2または3に記載の方法。
【請求項5】
前記最小エネルギーに対する前記最大エネルギーの前記比率が前記決定済み閾値の値より大きく、プリエコーの危険が前記信号の低エネルギー部分のみに存在することが明らかになると、前記方法が、前記高エネルギーゾーンの前記第1のサンプルのランクを表す第1の指標および前記高エネルギーゾーンの前記最後のサンプルのランクを表す第2の指標を計算するためのステップをさらに含むことを特徴とする請求項4に記載の方法。
【請求項6】
前記第1の指標が第1の高エネルギーサブブロックの前記第1のサンプルの指標であることを特徴とする請求項5に記載の方法。
【請求項7】
前記第2の指標が、サンプル数マイナス1に換算した最大擬似警報長によって増補された前記第1の指標の値と、処理される前記現在のフレームの前記最後のサンプルの指標の値マイナス1との間の最小として計算されることを特徴とする請求項4から6の一項に記載の方法。
【請求項8】
前記禁止が、前記擬似警報ゾーンの外部の初期利得値を維持しつつ前記擬似警報ゾーンの前記減衰利得値を値1にセットし、かつ、結果として得られる減衰利得値を前記現在のフレームの前記復元信号の前記サンプルに適用することによって実行される、請求項1から7の一項に記載の方法。
【請求項9】
前記結果として得られる利得値が、前記現在のフレームの前記復元信号の前記サンプルへの適用に先立って、フィルタリングによって平滑化されることを特徴とする請求項8に記載の方法。
【請求項10】
先行するフレームの最大エネルギーの比率が記憶され、
- 前記現在のフレームのエネルギーに対する前記先行するフレームのエネルギーの比率が決定済み閾値の値より大きく、ポストエコーの危険が前記現在のフレームに存在していることが明らかになると、前記方法が、
- 前記現在のフレームの前記エコーの前記初期処理に基づいて前記エコーを減衰させるステップ
をさらに含むことを特徴とする請求項1から9の一項に記載の方法。
【請求項11】
エコーを示す可能性のある変換エンコーダによって生成されるディジタル可聴信号のエコーを弁別し、かつ、減衰させるためのデバイスであって、少なくとも変換デコーダ上に、
- 高エネルギーゾーンへのトランジションに先行する低エネルギーゾーンを弁別する手段と、
- 現在のフレームの非弁別ゾーンに対応する擬似警報ゾーンを画定する手段と、
- 減衰利得値を使用して前記エコーの初期処理を決定する手段と、
- 前記現在のフレームの前記低エネルギー弁別ゾーンに適用される前記エコーの前記初期処理に基づいて前記エコーを減衰させる手段と、
- 前記擬似警報ゾーンに適用される前記初期処理の前記エコーの前記減衰を禁止する手段と
を備えたことを特徴とするデバイス。
【請求項12】
多層階層型エンコーダによってデコーダ中に生成されるディジタル可聴信号に対して、前記デコーダが、エコーを生成しない少なくとも1つの時間デコーダと、エコーを示す可能性のある少なくとも1つの変換デコーダとを備え、前記デバイスが、少なくとも時間デコーダ上および変換デコーダ上に、
- 高エネルギーゾーンへのトランジションに先行する低エネルギーゾーンを弁別し、前記エコーの減衰を禁止しなければならないゾーンの指標を引き渡す手段と、
- 前記現在のフレームの少なくとも1つの周波数帯域内におけるエコーの存在および元の位置を計算し、前記エコーの減衰を禁止しなければならないゾーンの少なくとも前記指標を受け取り、かつ、前記現在のフレームに適用することができるエコー減衰値を引き渡す手段と、
- 前記逆変換デコーダによって引き渡される前記現在のフレームの前記復号信号および前記現在のフレームに適用することができる前記エコー減衰値を受け取る、前記エコーを減衰させる手段と
を備えたことを特徴とする請求項11に記載のデバイス。
【請求項13】
前記現在のフレームの少なくとも1つの低周波数帯域および1つの高周波数帯域内におけるエコーの存在および元の位置を計算する前記手段が統合され、かつ、前記デコーダのデマルチプレクサに接続された、
- 前記ディジタル可聴信号のための低周波数帯域復号化チャネルと、
- 前記ディジタル可聴信号のための高周波数帯域復号化チャネルと、
- それぞれ前記高周波数帯域復号化チャネルおよび前記低周波数帯域復号化チャネルによって引き渡される信号を受け取り、かつ、復元されたディジタル可聴信号を引き渡す加算回路と
を備えたことを特徴とする請求項11または12に記載のデバイス。
【請求項14】
前記低周波数帯域復号化チャネルが、
- 逆多重化されたビットストリームを受け取り、かつ、予測復号化によって復号化された信号を引き渡す予測型復号化モジュールと、
- 前記逆多重化されたビットストリームを受け取り、かつ、低周波数帯域符号化差信号
【数1】
のスペクトル係数を引き渡すスペクトル係数復号化モジュールと、
- 前記低周波数帯域符号化差信号
【数2】
の前記スペクトル係数を受け取り、かつ、低周波数帯域ディジタル可聴信号
【数3】
を引き渡し、また、低エネルギー信号部分におけるエコーの存在を弁別する前記手段および前記減衰禁止手段を形成する周波数/時間置換モジュールと、
- 擬似警報ゾーンを画定し、かつ、フィルタリングされた信号
【数4】
および予測復号化によって復号化された前記信号の低周波数帯域ディジタル可聴信号
【数5】
、Memloからエコーを検出し、また、低周波数利得値信号(Glo)を引き渡す手段と、
- 変換復号化によって復号化され、場合によってはフィルタリングされた信号に前記低周波数利得値(Glo)を適用し、加算し、ポストフィルタリングし、オーバサンプリングし、かつ、前記ディジタル可聴信号の低周波数帯域合成信号を引き渡すQMF合成フィルタリングを実行する手段と
を備えたことを特徴とする請求項13に記載のデバイス。
【請求項15】
前記高周波数帯域復号化チャネルが、
- 前記逆多重化されたビットストリームを受け取り、かつ、プリエコーが存在しない前記ディジタル可聴信号の時間包絡線基準信号を引き渡す帯域拡張チャネルと、
- 前記逆多重化されたビットストリームおよび前記時間基準信号のスペクトル係数を受け取り、かつ、高周波数帯域符号化ディジタル可聴信号
【数6】
のスペクトル係数を引き渡す前記スペクトル係数復号化モジュールと、
- 前記高周波数帯域符号化ディジタル可聴信号のスペクトルの前記係数を受け取り、かつ、前記高周波数帯域ディジタル可聴信号
【数7】
を引き渡し、また、前記低エネルギー信号部分におけるエコーの存在を弁別する前記手段および前記減衰禁止手段を形成する周波数/時間置換モジュールと、
- 擬似警報ゾーンを画定し、かつ、高周波数帯域ディジタル可聴信号
【数8】
、Memhi、高周波数帯域利得値信号(Ghi)を引き渡す帯域拡張モジュールの出力からエコーを検出する手段と、
- 前記高周波数帯域ディジタル可聴信号に高周波数利得値を適用し、オーバサンプリングし、かつ、前記ディジタル可聴信号の高周波数帯域合成信号を引き渡す高域通過フィルタリングを実行する手段と
を備えたことを特徴とする請求項13に記載のデバイス。
【請求項16】
前記低周波数帯域復号化チャネルにおいて、擬似警報ゾーンを画定する前記手段が、前記現在のフレームの中で第1および第2の指標を計算する手段であって、前記第1の指標が最大エネルギーサンプルのランクを表し、前記第2の指標が最後の高エネルギーサンプルを表す手段を備えたことを特徴とし、また、前記エコー検出手段が前記第1および第2の指標を使用して前記低周波数利得値信号(Glo)を引き渡し、前記低周波数帯域ディジタル可聴信号
【数9】
が、符号化の中で適用される知覚重み付けフィルタとは逆の知覚重み付けフィルタによって重み付けされ、また、前記信号が予測復号化によって復号化され、前記利得値が、調整可能利得増幅器を介して、符号化の中で適用される知覚重み付けフィルタとは逆の知覚重み付けフィルタによって重み付けされた前記低周波数帯域ディジタル可聴信号
【数10】
に適用されることを特徴とする請求項14に記載のデバイス。
【請求項17】
前記高周波数帯域復号化チャネルにおいて、擬似警報ゾーンを画定する前記手段が、前記現在のフレームの中で第1および第2の指標を計算する手段であって、前記第1の指標が最大エネルギーサンプルのランクを表し、前記第2の指標が最後の高エネルギーサンプルを表す手段を備えたことを特徴とし、また、前記エコー検出手段が前記第1および第2の指標を使用して前記高周波数利得値信号(Ghi)を引き渡し、前記高周波数帯域ディジタル可聴信号
【数11】
および前記ディジタル可聴信号が前記帯域拡張モジュールから得られ、前記利得値が、調整可能増幅器を介して、前記高周波数帯域ディジタル可聴信号
【数12】
に適用されることを特徴とする請求項15に記載のデバイス。
【請求項18】
エコーが存在している前記擬似警報ゾーンを前記第1の指標と第2の指標の間に画定するために、前記画定手段が、少なくとも、
- それぞれ低周波数帯域
【数13】
および高周波数帯域
【数14】
における前記現在のフレームの復元信号のK2個のサブブロックのエネルギーを計算するステップと、
- それぞれ低周波数帯域Memloおよび高周波数帯域Memhiにおける前記現在のフレームの第2の部分の前記ディジタル可聴信号の第1のK2/2個のサブブロックのエネルギーを計算するステップと、
- それぞれ低周波数帯域および高周波数帯域における前記現在のフレームの前記復元信号の前記K2個のサブブロック全体の最小エネルギーを計算するステップと、
- それぞれ低周波数帯域および高周波数帯域における計算されたすべてのエネルギーに対する前記サブブロックの前記エネルギーの最大を計算するステップと、
- 前記最小エネルギーに対する前記最大エネルギーの比率の決定済み閾値の値に対する劣等性を比較することによって前記第1および第2の指標を計算するステップであって、前記劣等性の比較が検証されると、前記第1の指標の値が値0で例示され、前記第2の指標の値が前記現在のフレームのサンプル数マイナス1に換算した最大値で例示され、1に等しい利得が前記エコーに適用され、前記現在のフレームの長さ全体にわたって減衰が禁止されるステップと、
- 前記劣等性の比較が検証されない場合、前記第1の指標を最大エネルギーブロックの第1のサンプルの位置で例示するステップであって、前記第2の指標の値が、決定済みサンプル数マイナス1によって増補された前記第1の指標およびフレームの最後のサンプルの指標の最小の値で例示され、アタックが前記第1の指標と前記第2の指標の間に存在するサンプルの範囲全体にわたって1に等しい利得が信号に適用され、また、減衰が禁止されるステップと
を含むことを特徴とする請求項16または17の一項に記載のデバイス。
【請求項19】
ポストエコーの処理を考慮し、また、前記ポストエコーの減衰の禁止を除去することによるプリエコーおよび前記ポストエコーの処理の実行を考慮するために、前記現在のフレームの前記信号の個々のサブブロックのエネルギーを計算する前記手段が、
- 前記現在のフレームの前記復元信号の前記K2個のサブブロックに対する最大エネルギーの計算と、
- 優越性比較による、決定済み閾値の値に対する、前記現在のフレームの前記最大エネルギーに対する先行するフレームの最大エネルギーの比率の比較であって、優越性比較に合格すると、ポストエコーが存在していることを示す比較と、
- 次のフレームのための前記現在のフレームの前記最大エネルギーの記憶および終了状態への復帰であって、前記最小エネルギー、前記最大エネルギー、前記第1の指標および第2の指標の計算が禁止され、また、前記ポストエコーの減衰の禁止が除去され(これは、前記第1の指標の値が前記第2の指標の値より大きい場合に実行される)、また、優越性比較に合格しない場合、ポストエコーが存在していないことを示す記憶および復帰と、
- 次のフレームのための前記復元信号のフレームの最大エネルギーの記憶と、
- 請求項12に記載されている前記第1および第2の指標の計算と
を含むことを特徴とする請求項18に記載のデバイス。
【請求項20】
前記エコー減衰手段が調整可能利得増幅器を備え、調整可能利得値が0に例示され、利得値を1にセットすることにより、前記第1の指標値と第2の指標値の間に含まれているサンプルの減衰が禁止され、それにより、高エネルギーディジタル可聴信号のサンプルに適用される減衰を禁止することができ、かつ、トランジションがそれぞれ前記現在のフレームおよび先行するフレームに出現することによって生成されるポストエコーおよびプリエコーにそれぞれ適用される減衰を維持することができることを特徴とする請求項11に記載のデバイス。
【請求項21】
媒体に記憶された、コンピュータまたは専用デバイスによって実行するための一連の命令であって、前記命令が実行されると、後者が、請求項1から10の一項に記載されている、ディジタル可聴信号のエコーを弁別し、かつ、減衰させる方法を実施することを特徴とする命令を備えたコンピュータプログラム。
【請求項22】
前記プログラムが、信号の低エネルギー部分におけるエコーの存在を弁別するためのモジュール、エコーを減衰させるためのモジュール、および請求項11から20の一項に記載されている、エコーを検出し、かつ、減衰させるためのデバイスにおける現在のフレームまたは先行するフレームの信号の高エネルギー部分のエコーの減衰を禁止するためのモジュールに搭載される、直接実行することができるプログラムであることを特徴とする請求項21に記載のコンピュータプログラム。
【図1】
【図2a】
【図2b】
【図2c】
【図2d】
【図2e】
【図2f】
【図3a】
【図3b】
【図3c】
【図3d】
【図4a】
【図4b】
【図4c】
【図4d】
【図4e】
【図5】
【図6】
【図7】
【図8a】
【図8b】
【図8c】
【図8d】
【図9a】
【図9b】
【図2a】
【図2b】
【図2c】
【図2d】
【図2e】
【図2f】
【図3a】
【図3b】
【図3c】
【図3d】
【図4a】
【図4b】
【図4c】
【図4d】
【図4e】
【図5】
【図6】
【図7】
【図8a】
【図8b】
【図8c】
【図8d】
【図9a】
【図9b】
【公表番号】特表2009−527773(P2009−527773A)
【公表日】平成21年7月30日(2009.7.30)
【国際特許分類】
【出願番号】特願2008−554821(P2008−554821)
【出願日】平成19年2月13日(2007.2.13)
【国際出願番号】PCT/FR2007/050786
【国際公開番号】WO2007/096552
【国際公開日】平成19年8月30日(2007.8.30)
【出願人】(591034154)フランス テレコム (290)
【Fターム(参考)】
【公表日】平成21年7月30日(2009.7.30)
【国際特許分類】
【出願日】平成19年2月13日(2007.2.13)
【国際出願番号】PCT/FR2007/050786
【国際公開番号】WO2007/096552
【国際公開日】平成19年8月30日(2007.8.30)
【出願人】(591034154)フランス テレコム (290)
【Fターム(参考)】
[ Back to top ]