実数値のフィルタバンクにおけるスペクトルエンベロープ調整によって生じたエイリアシングを低減するための方法
【課題】スペクトルエンベロープ調整のための改良された技術を提供する。
【解決手段】本発明は、実数値のフィルタバンク対応のスペクトルエンベロープ調整器の性能を向上させるための新たな方法を提案する。本出願に規定するように、チャンネルの符号に基づいて、互いに隣接するチャンネルのためのゲイン値を適応的に固定することによって、低減されたエイリアシングが実現される。さらに、ゲイン計算中のチャンネルのグループ化は、フィルタバンクにおける実数値のサブバンド信号の改良されたエネルギー推定を与える。
【解決手段】本発明は、実数値のフィルタバンク対応のスペクトルエンベロープ調整器の性能を向上させるための新たな方法を提案する。本出願に規定するように、チャンネルの符号に基づいて、互いに隣接するチャンネルのためのゲイン値を適応的に固定することによって、低減されたエイリアシングが実現される。さらに、ゲイン計算中のチャンネルのグループ化は、フィルタバンクにおける実数値のサブバンド信号の改良されたエネルギー推定を与える。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、実数値のサブバンドフィルタバンクを用いる、音声信号のスペクトルエンベロープ調整を備えるシステムに関する。これは、スペクトルエンベロープ調整のための実数値のサブバンドフィルタバンクを用いる際に生じたエイリアシングを低減する。また、これは、実数値のサブバンドフィルタバンク内の正弦波成分の正確なエネルギー計算を可能にする。
【背景技術】
【0002】
PCT/SE02/00626の「複素指数変調されたフィルタバンクを用いるエイリアシング低減」には、複素指数変調されたフィルタバンクが、スペクトルエンベロープ調整音声信号にとって優れたツールであることが示されている。このような手順において、信号のスペクトルエンベロープは、特定のフィルタバンクチャンネルに対応するエネルギー値によって表される。これらのチャンネルにおける現在のエネルギーを推定することによって、対応するサブバンドサンプルが修正されて所定のエネルギーを有するようになり、よって、スペクトルエンベロープが調整される。計算上の複雑さに関する制約により、複素指数変調されたフィルタバンクを使用することができず、コサイン変調された(実数値の)実施のみ見込む場合には、フィルタバンクをスペクトルエンベロープ調整のために用いたときには、深刻なエイリアシングが得られる。このことは、強い音構成の音声信号であって、エイリアシング成分が元のスペクトル成分との相互変調を生じさせる場合に特に顕著である。本発明は、これに対する解決策を、信号に依存した方法で周波数関数としての制約をゲイン値に対して課すことによって提供する。
【発明の概要】
【発明が解決しようとする課題】
【0003】
本発明の目的は、スペクトルエンベロープ調整のための改良された技術を提供することである。
【課題を解決するための手段】
【0004】
本目的は、請求項1若しくは8に記載の複数のチャンネルの中でどのチャンネルがチャンネルをゲイン調整するために結合ゲイン係数を有するべきかを判断するための装置若しくは方法、または請求項9に記載のコンピュータプログラムによって達成される。
【0005】
本発明は、スペクトルエンベロープ調整のために用いた実数値のフィルタバンクにおけるエイリアシングによって生じた相互変調の問題に関する。本発明は、入力信号を分析して、得た情報を用いて、所定の時間における信号のスペクトル特性によって決定される次元で隣接するチャンネルのゲイン値のグループ化を行うことによって、フィルタバンクのエンベロープ調整能力を制限する。実数値のフィルタバンク、例えばトランジションバンドが最も隣接するものとだけ重なる擬似QMFでは、エイリアシングキャンセル特性により、エイリアシングは、プロトタイプフィルタの遮断帯域レベルよりも低く保たれることを示すことができる。プロトタイプフィルタがエイリアシングを充分に抑圧して設計されている場合は、フィルタバンクは、厳密な数学的な意味ではではそうではないが、知覚的な観点からしては完全に復元されたタイプのものである。しかしながら、互いに隣接するチャンネルのチャンネルゲインが分析と合成とで変更されている場合には、エイリアシングキャンセル特性が妨害されており、エイリアシング成分が出力信号で聞こえるようになる。フィルタバンクチャンネルのサブバンドサンプルに対して低次の線形予測を行うことによって、LPC多項式の性質を観察することにより、強い音成分がフィルタバンクチャンネル内のどこに存在するかを判断することができる。よって、チャンネル内にある音成分から強いエイリアシング成分を回避するために、どの隣接したチャンネルが独立したゲイン値を有してはならないかを判断することができる。
【0006】
本発明は、以下の特徴を備える。
強い音成分がサブバンドチャンネル内のどこにあるかを判断するためのサブバンドチャンネルの分析手段、
サブチャンネルすべてにおいて、低次の線形予測器によって分析すること、
LPC多項式のゼロの位置に基づく、ゲイングループ化の決定、
実数値での実施のための正確なエネルギー計算。
【0007】
本発明は、添付の図面を参照して、説明に役立つ実施例によって説明されるが、本発明の範囲または精神を制限するものではない。
【図面の簡単な説明】
【0008】
【図1】図1は、複数の正弦波成分を含む元信号の、Mチャンネルサブバンドフィルタバンクのチャンネル15〜24によってカバーされる周波数範囲の周波数分析を示す。正弦波がフィルタバンクチャンネル内のどこに存在するかを示すために、図示の分析の周波数分解能は、使用されたフィルタバンクの周波数分解能よりも意図的に高くしている。
【図2】図2は、元信号のサブバンドチャンネル15〜24に適用されるゲイン値を含むゲインベクトルを示す。
【図3】図3は、本発明を用いない実数値での実施における上記ゲイン調整からの出力を示す。
【図4】図4は、複素数値での実施における上記ゲイン調整からの出力を示す。
【図5】図5は、すべてのチャンネルの半分に正弦波成分があることを示す。
【図6】図6は、本発明に係る好ましいチャンネルグループ化を示す。
【図7】図7は、本発明を用いる実数値での実施における上記ゲイン調整からの出力を示す。
【図8】図8は、本発明の装置のブロック図を示す。
【図9】図9は、本発明を都合よく用いることができる分析および合成フィルタバンクの組み合わせを示す。
【図10】図10は、好ましい実施形態に係る図8からの検査のための手段のブロック図である。
【図11】図11は、本発明の好ましい実施形態に係る図8からのゲイン調整のための手段のブロック図である。
【発明を実施するための形態】
【0009】
好ましい実施形態の説明
下記の実施形態は、実数値のフィルタバンクに基づくスペクトルエンベロープ調整器の改良のための本発明の原理を単に例証するに過ぎない。本明細書において説明された仕組みおよび詳細の修正および変形は、当業者にとって明らかであろうことが理解される。したがって、特許請求項の範囲によってのみ制限され、本明細書の実施形態の説明によって表される特定の詳細によっては制限されないことが意図されている。
【0010】
以下の説明では、実数値の分析および実数値の合成を備える実数値の擬似QMFが用いられる。しかしながら、本発明が対処するエイリアシングの問題は、複素数の分析および実数値の合成のシステムにおいても生じ、また、本説明で用いられる擬似QMFとは別の、他のコサイン変調されたフィルタバンクでも生じることが理解されるべきである。本発明は、そのようなシステムにも適用可能である。擬似QMFにおいて、すべてのチャンネルは、実質的にその隣接するものとのみ周波数において重なる。チャンネルの周波数応答は、点線によって以下の図面に示される。これは、チャンネルの重なりを示すための例証的な目的のためのみのものであり、プロトタイプフィルタによって与えられた実際のチャンネル応答であると解釈されるべきではない。図1において、元信号の周波数分析が示されている。この図は、Mチャンネルフィルタバンクの15・π/Mから25・π/Mでカバーされる周波数範囲を示す。以下の説明では、示されたチャンネル番号は、それらの低いクロスオーバ周波数に由来するものであり、よって、チャンネル16は、その付近での重なりを除いた16・π/Mから17・π/Mの周波数範囲をカバーする。分析と合成とにおいてサブバンドサンプルに対して修正を行わない場合には、エイリアシングは、プロトタイプフィルタの特性によって制限されるであろう。図2に示すように、互いに隣接するチャンネルのサブバンドサンプルがゲインベクトルに従って修正される場合には、すべてのチャンネルの個別のゲイン値と共に、エイリアシングキャンセル特性が失われる。よって、図3に示すように、エイリアシング成分が、出力信号におけるフィルタバンクチャンネルのクロスオーバ領域周辺に反映されて現れる。これは、図4に示すような、妨害を生じさせるエイリアシング成分の悪影響を出力が受けることがないPCT/SE02/00626で概説されたような複素数での実施には当てはまらない。出力に深刻な相互変調歪みを生じさせるエイリアシング成分を回避するために、本発明は、例えば図1におけるチャンネル18および19といった、正弦波成分を共有する2つの互いに隣接するチャンネルは、同様に修正されるべきである、すなわち、2つのチャンネルに対して適用するゲイン係数が同一にされるべきであることを教示する。これは、以下、これらチャンネルの結合ゲインと称する。当然ながら、このことは、エイリアシングを低減するためにエンベロープ調整器の周波数分解能が犠牲になることを意味する。しかしながら、チャンネル数が充分あれば、周波数分解能の損失は、深刻な相互変調歪みをなくすために払う小さな代償である。
【0011】
どのチャンネルが結合ゲイン係数を有するべきかを判断するために、本発明は、帯域内線形予測の使用を教示する。例えば2次LPCなどの低次の線形予測を用いる場合、この周波数分析ツールは、全てのチャンネルにおいて1つの正弦波成分を分解することができる。第1の予測子多項式係数の符号を確認することによって、正弦波成分がサブバンドチャンネルの周波数範囲の上半分または下半分のいずれに存在するかを決定するのは容易である。
2次の予測多項式
【数1】
は、スペクトルエンベロープ調整によって影響を受けるであろうQMFフィルタバンクにおけるすべてのチャンネルに対する自己相関方法または共分散方法を用いる線形予測によって得られる。QMFバンクチャンネルの符号は、以下に従って規定される。
【数2】
式中、kはチャンネル番号、Mはチャンネル数であり、1つおきのQMFチャンネルの周波数反転が考慮される。よって、すべてのチャンネルについて、強い音成分の存在する場所を判断することができ、よって、強い正弦波成分を共有するチャンネル同士をグループ化する。図5において、各チャンネルの符号が示されており、よって、サブバンドチャンネルの正弦波がいずれの半分に存在するかが示され、図中、+1は上半分、−1は下半分を示す。本発明は、エイリアシング成分を回避するために、チャンネルkが負の符号を有し、チャンネルk−1が正の符号を有するチャンネルについて、サブバンドチャンネルのゲイン係数がグループ化されることを教示している。したがって、図5に示すようなチャンネルの符号は、図6に係る所要のグループ化をもたらし、図中、チャンネル16および17がグループ化され、チャンネル18および19がグループ化され、チャンネル21および22がグループ化され、チャンネル23および24がグループ化される。これは、グループ化されたチャンネルkおよびk−1についてのゲイン値gk(m)が、以下の式に従って、別々ではなく共に計算されることを意味する。
【数3】
おけるものである。これにより、グループ化されたチャンネルは、同一のゲイン値を得ることが保証される。このようなゲイン係数のグループ化は、フィルタバンクのエイリアシングキャンセル特性を維持するものであり、図7に係る出力を与える。ここで、図3にあるエイリアシング成分が消滅していることが明らかである。強い正弦波成分がなくても、チャンネルの符号によって示される、ゼロがz面のいずれかの半分に存在するであろうから、チャンネルはそれに従ってグループ化される。これは、強い音成分があるか否かについての検出ベースの決定を行う必要がないことを意味する。
【0012】
実数値のフィルタバンクにおいて、エネルギー推定は、複素数表現におけるほど直接的ではない。単一のチャンネルの二乗されたサブバンドサンプルを合計することによってエネルギーを計算すると、実際のエネルギーというよりも、信号の時間エンベロープに追従するという危険性がある。これは、正弦波成分が、0からフィルタバンクチャンネル幅の任意の周波数を有しうるということによる。正弦波成分がフィルタバンクチャンネルに存在する場合、元信号では高い周波数正弦波であるにもかかわらず、非常に低い相対周波数を有しうる。この信号のエネルギーを評価することは、実数値のシステムにおいては困難となる。なぜならば、平均時間が正弦波の周波数に対して不適切に選ばれると、信号エネルギーが実際には一定の場合に、トレモロ(振幅変動)が生じる可能性があるからである。しかしながら、本発明は、フィルタバンクチャンネルは、正弦波成分の位置を考慮して2つずつグループ化されるべきであることを教示する。これにより、以下に概説するように、トレモロの問題は大幅に低減される。
【0013】
コサイン変調されたフィルタバンクにおいて、分析フィルタhk(n)は、以下のように、対称ローパスプロトタイプフィルタp0(n)をコサイン変調したものである。
【数4】
式中、Mはチャンネル数、k=0,1,・・・,M−1、Nはプロトタイプフィルタの次元、n=0,1,・・・,Nである。ここで、プロトタイプフィルタの対称度は、n=N/2に関して仮定される。以下の派生物は、半サンプル対称度の場合に同様である。
【0014】
周波数が0≦Ω≦πである正弦波入力信号x(n)=Acos(Ωn+θ)とすると、チャンネルk≧1のサブバンド信号は、概ね以下のように計算することができる。
【数5】
式中、P(ω)は、シフトされたプロトタイプフィルタp0(n+N/2)の実数値の離散時間フーリエ変換である。P(Ω+π(k+1/2)/M)が小さい場合、近似は良好であり、これは、P(ω)が、以下の説明の基礎となる仮定である|ω|≧π/Mについて無視できる場合に特に当てはまる。スペクトルエンベロープ調整に関して、サブバンドk内の平均エネルギーは、次のように計算できるであろう。
【数6】
式中、w(n)は長さLの窓である。式(5)を式(6)に代入すると、以下のようになる。
【数7】
式中、Ψ(Ω)はkとは無関係の位相の項であり、W(ω)は窓の離散時間フールエ変換である。このエネルギーは、入力信号が定常の正弦波であるがΩがπ/Mの整数倍に近い場合に、非常に変動する可能性がある。トレモロ型の生成物が、そのような単一の実数分析バンクチャンネルエネルギー推定に基づくシステムにおいて生じるであろう。
【0015】
一方、π(k−1/2)/M≦Ω≦π(k+1/2)/Mであり、かつP(ω)が|ω|≧π/Mについて無視できると仮定すると、サブバンドチャンネルkおよびk−1のみがゼロでない出力を有し、本発明が提案するように、これらのチャンネルは共にグループ化されるであろう。これら2つのチャンネルに基づくエネルギー推定は、
【数8】
であり、式中、
【数9】
および
【数10】
である。
【0016】
プロトタイプフィルタをより有用に設計するには、S(Ω)を上記周波数範囲においてほぼ一定にするように保つ。さらに、窓w(n)がローパスフィルタ特性を有する場合には、|ε(Ω)|が|W(0)|よりも大幅に小さくする。そうすれば、式(8)のエネルギー推定の変動は、式(7)の場合と比較して、著しく低減される。
【0017】
図8は、信号のスペクトルエンベロープ調整のための発明の装置を示す。この発明の装置は、複数のサブバンド信号を与えるための手段80を備える。サブバンド信号は、サブバンド信号でカバーされる周波数範囲を示すチャンネル番号kに関連付けられているという点で注意すべきである。サブバンド信号は、分析フィルタバンクにおけるチャンネル番号kを有するチャンネルフィルタから生じる。分析フィルタバンクは、複数のチャンネルフィルタを有し、チャンネル番号kを有するチャンネルフィルタは、より低いチャンネル番号k−1を有する隣接するチャンネルフィルタのチャンネル応答に重なる所定のチャンネル応答を有する。重なりは、所定の重なり範囲において生じる。重なり範囲については、分析フィルタバンクの隣接するチャンネルフィルタの点線における重なりインパルス応答を示す図1,3,4,および7を参照する。
【0018】
図8からの手段80によって出力されたサブバンド信号は、エイリアシング生成信号成分についてサブバンド信号を検査するための手段82に入力される。特に、手段82は、チャンネル番号kに関連付けられたサブバンド信号を検査し、かつ、チャンネル番号k−1に関連付けられた隣接するサブバンド信号を検査するように動作する。これは、サブバンド信号および隣接するサブバンド信号が、例えば図1に示すような正弦波成分のような重なり範囲においてエイリアシング生成信号成分を有するかどうかを決定するためである。ここで注意すべきなのは、例えばチャンネル番号15に関連付けられたサブバンド信号における正弦波信号成分は重なり範囲内に位置していないという点である。同じことは、チャンネル番号20に関連付けられたサブバンド信号における正弦波信号成分にも当てはまる。図1に示す他の正弦波成分については、それらが対応の互いに隣接するサブバンド信号の重なり範囲内にあることが明らかである。
【0019】
検査のための手段82は、重なり範囲内にエイリアシング生成信号成分を有する2つの互いに隣接するサブバンド信号を識別するように動作する。手段82は、互いに隣接するサブバンド信号のゲイン調整値を計算するための手段84に結合されている。特に、手段84は、一方のサブバンド信号ともう一方の隣接するサブバンド信号との第1のゲイン調整値と第2のゲイン調整値とを計算するように動作する。この計算は、検査のための手段の肯定的な結果に応じて行われる。特に、計算するための手段は、互いに独立しておらず互いに依存している第1のゲイン調整値および第2のゲイン調整値を決定するように動作する。
【0020】
手段84は、第1のゲイン調整値および第2のゲイン調整値を出力する。この点で注意すべきなのは、好ましくは、第1のゲイン調整値および第2のゲイン調整値は、好ましい実施形態においては、互いに等しいということである。例えばスペクトル帯域複製エンコーダにおいて計算されたゲイン調整値を修正する場合には、以下に概説するように、元のSBRゲイン調整値に対応する修正されたゲイン調整値は共に、元の値の高い値よりも小さく、かつ元の値の低い値よりも高い。
【0021】
したがって、ゲイン調整値を計算するための手段84は、互いに隣接するサブバンド信号の2つのゲイン調整値を計算する。これらのゲイン調整値およびサブバンド信号自体は、計算されたゲイン調整値を用いて互いに隣接するサブバンド信号をゲイン調整するための手段86に与えられる。好ましくは、手段86によって行われるゲイン調整は、ゲイン調整値がゲイン調整係数であるように、サブバンドサンプルにゲイン調整値を乗算することによって行われる。言い換えれば、数個のサブバンドサンプルを有するサブバンド信号のゲイン調整は、サブバンドからの各サブバンドサンプルに、各サブバンドについて計算されたゲイン調整係数を乗算することによって行われる。したがって、サブバンド信号の細かい構造は、ゲイン調整によって影響を受けない。言い換えれば、サブバンドサンプルの相対的な振幅値は維持され、サブバンドサンプルの絶対振幅値は、これらのサンプルに各サブバンド信号に関連付けられたゲイン調整値を乗算することによって変化される。
【0022】
手段86の出力時に、ゲイン調整されたサブバンド信号が得られる。これらのゲイン調整されたサブバンド信号が合成フィルタバンク、好ましくは実数値の合成フィルタバンクに入力されると、合成フィルタバンクの出力、すなわち、合成された出力信号には、図7を参照して上述したように、重大なエイリアシング成分は見られない。
【0023】
ここで注意すべきなのは、互いに隣接するサブバンド信号のゲイン値が互いに等しくなっている場合には、エイリアシング成分の完全なキャンセルが得られることができる点である。それにもかかわらず、互いに隣接するサブバンド信号のゲイン調整値が互いに依存して計算される場合には、エイリアシング成分の少なくとも低減が得られることができる。これは、ゲイン調整値が互いに完全に等しくはないものの、発明の工程が行われていない場合に比べて互いに近い場合には、エイリアシングの状況の改善が既に得られていることを意味する。
【0024】
通常、本発明は、WO98/57436A2に記載されているスペクトル帯域複製(SBR)または高周波数再構築(HFR)に関連して用いられる。
【0025】
当該技術において知られているように、スペクトルエンベロープ複製または高周波数再構築は、エンコーダ側における所定の工程およびデコーダ側における所定の工程を含む。
【0026】
エンコーダにおいて、全帯域幅を有する元信号は、ソースエンコーダによって符号化される。ソースエンコーダは、出力信号、すなわち、元信号の符号化されたものを生成し、元信号に含まれていた1つ以上の周波数帯は、元信号の符号化されたものにはもはや含まれていない。通常、元信号の符号化されたものは、元の帯域幅の低帯域しか含まない。元信号の元の帯域幅の高帯域は、元信号の符号化されたものには含まれない。エンコーダ側において、さらに、元信号の符号化されたものでは欠損している帯域における元信号のスペクトルエンベロープを分析するためのスペクトルエンベロープ分析器がある。この欠損した(複数の)帯域は、例えば、高帯域である。スペクトルエンベロープ分析器は、元信号の符号化されたものでは欠損している帯域の粗いエンベロープ表現を生成するように動作する。この粗いスペクトルエンベロープ表現は、いくつかの方法で生成できる。1つの方法は、対応する周波数範囲における各チャンネルの各サブバンド信号が得られるように元信号の各周波数部を分析フィルタバンクに通し、かつ、それらのエネルギー値が粗いスペクトルエンベロープ表現となるように、各サブバンドのエネルギーを計算するというものである。
【0027】
別の可能性としては、欠損した帯域のフーリエ分析を行って、音声信号を考えた場合に重要な帯域などといったグループにおけるスペクトル係数の平均エネルギーを、周知のバーク尺度に従ったグループ化を用いて計算することによって、欠損した周波数帯域のエネルギーを計算する。
【0028】
この場合、粗いスペクトルエンベロープ表現は、所定の基準エネルギー値からなり、ある基準エネルギー値は、所定の周波数帯域に関連付けられている。そして、SBRエンコーダは、この粗いスペクトルエンベロープ表現に、元信号の符号化されたものを多重化して、出力信号を形成し、これは受信器またはSBR対応のデコーダに送信される。
【0029】
SBR対応のデコーダは、当該技術において知られているように、元信号の符号化されたものを復号化して元信号の復号化されたものを得ることによって得られた所定またはすべての周波数帯域を用いることによって、欠損した周波数帯域を再生させるように動作する。当然ながら、元信号の復号化されたものも、欠損した帯域を含まない。そこで、この欠損した帯域は、スペクトル帯域複製によって、元信号に含まれる帯域を用いて再構築される。特に、元信号の復号化されたものにある1つまたは数個の帯域が選ばれて、再構築しなければならない帯域にコピーされる。その後、コピーされたサブバンド信号または周波数/スペクトル係数の細かい構造が、一方にコピーされたサブバンド信号の実際のエネルギーを用いて計算されるゲイン調整値を用いて、およびエンコーダからデコーダへ送信された粗いスペクトルエンベロープ表現から抽出された基準エネルギーを用いて、調整される。通常、ゲイン調整係数は、基準エネルギーおよび実際のエネルギーの比率を決定して、この値の平方根をとることによって計算される。
【0030】
これが、先に図2を参照して説明した状態である。特に、図2は、例えばSBR対応のデコーダまたは高周波数再構築におけるゲイン調整ブロックによって決定されたゲイン調整値を示す。
【0031】
図8に示すこの発明の装置は、通常のSBRゲイン調整装置を完全に置き換えるために用いられたり、または先行技術のゲイン調節装置を拡張するために用いられたりすることができる。第1の可能性では、ゲイン調整値は、互いに依存し合う隣接するサブバンド信号にエイリアシングの問題がある場合に、これら隣接するサブバンド信号について決定される。これは、互いに隣接するサブバンド信号が生じるフィルタの重なったフィルタ応答において、図1に関連して説明した音信号成分などのエイリアシング生成信号成分があることを意味する。この場合、ゲイン調整値は、SBR対応のエンコーダから送信された基準エネルギーによって、およびコピーされたサブバンド信号のエネルギーの推定によって、エイリアシング生成信号成分についてサブバンド信号を検査する手段に応答して、計算される。
【0032】
他の場合、すなわち、既存のSBR対応のデコーダの操作性を拡張するためにこの発明の装置が用いられる場合には、互いに隣接するサブバンド信号のゲイン調整値を計算するための手段は、エイリアシングの問題がある2つの互いに隣接するサブバンド信号のゲイン調整値を取り出すように、実施されることができる。典型的なSBR対応のエンコーダは、エイリアシングの問題に注意を払っていないので、これら2つの互いに隣接するサブバンド信号のゲイン調整値は、互いに独立している。ゲイン調整値を計算するためのこの発明の手段は、取り出された2つの「元の」ゲイン調整値に基づいて、隣接するサブバンドの信号の計算されたゲイン調整値を導出するように動作する。これは、いくつかの方法で行うことができる。第1の方法は、第1のゲイン調整値に等しい第2のゲイン調整値を作成することである。別の可能性としては、第2のゲイン調整値に等しい第1の調整値を作成することである。第3の可能性としては、両方の元のゲイン調整値の平均を計算して、この平均を第1の計算されたゲイン調整値および第2の計算されたエンベロープ調整値として用いることである。他の場合では、2つの元のゲイン調整値のうち、高い方の元のゲイン調整値よりも共に低いく、低い方のゲイン調整値よりも共に高い、互いに異なるかまたは等しい第1および第2の計算されたゲイン調整値を選択する。図2と図6とを比較すると、2つの互いに隣接するサブバンドについての、互いに依存し合って計算された第1および第2のゲイン調整値は、共に元の低い方の値よりも高く、かつ共にもとの高い方の値よりも低いことが明らかになる。
【0033】
本発明の他の実施形態によれば、SBR対応のエンコーダは、サブバンド信号をを与える機能を既に行っており(図8のブロック80)、エイリアシング生成信号成分についてサブバンド信号を検査すること(図8のブロック82)と、互いに隣接するサブバンド信号のゲイン調整値を計算すること(ブロック84)とがSBR対応のエンコーダで行われるが、いかなるゲイン調節動作も行わない。この場合、図8の参照符号84に示す計算するための手段は、第1および第2の計算されたゲイン調節値を出力してデコーダに送信するための手段に結合されている。
【0034】
この場合、デコーダは、既に「エイリアシングが低減された」粗いスペクトルエンベロープ表現を、好ましくは、エイリアシングを低減する隣接するサブバンド信号のグループ化が既に行われたという指標と共に受信する。その後、通常のSBRデコーダに対する修正は必要ない。なぜならば、合成信号がエイリアシング歪みを示さないように、ゲイン調整値は既に良好な状態にあるからである。
【0035】
以下では、サブバンド信号を与えるための手段80の特定の実施例について説明する。本発明が新規のエンコーダにおいて実施される場合、複数のサブバンド信号を与えるための手段は、欠損した周波数帯域、すなわち元信号の符号化されたものには含まれない周波数帯域を分析するための分析器である。
【0036】
本発明が新規のデコーダにおいて実施される場合、複数のサブバンド信号を与えるための手段は、低帯域のサブバンド信号を高帯域のサブバンドチャンネルに入れ換えるためのSBR装置と組み合わせた、元信号のデコードされたものを分析するための分析フィルタバンクであってもよい。しかしながら、元信号の符号化されたものが、量子化されかつ潜在的にエントロピーが符号化されたサブバンド信号自体を含む場合には、与えるための手段は、分析フィルタバンクを含まない。この場合、与えるための手段は、エントロピーが復号化されかつ再量子化されたサブバンド信号を、デコーダに入力された送信信号から抽出するように動作する。与える手段は、スペクトル帯域複製または高周波数再構築の技術において既知であるように、任意の既知の入れ換え規則に従って、そのような低帯域の抽出されたサブバンド信号を高帯域のバンドに入れ換えるようにさらに動作する。
【0037】
図9は、(エンコーダまたはデコーダ内に位置しうる)分析フィルタバンクおよびSBRデコーダ内に位置する合成フィルタバンク90の協働を示す。デコーダ内に位置する合成フィルタバンク90は、ゲイン調整されたサブバンド信号を受信して、高帯域信号を合成するように動作し、そして、高帯域信号は、合成後、元信号の復号化されたものに組み合わされて、全帯域の復号化された信号を得る。代わりに、実数値の合成フィルタバンクが、元の周波数帯域全体をカバーすることもでき、合成フィルタバンク90の低帯域チャンネルに元信号の復号化されたものを表すサブバンド信号が与えられ、高帯域のフィルタチャンネルに図8からの手段84によって出力されたゲイン調整されたサブバンド信号が与えられるようにしてもよい。
【0038】
先に概説したように、互いに独立したゲイン調整値のこの発明の計算により、複素数の分析フィルタバンクおよび実数値の合成フィルタバンクを組み合わせるか、または、特に低コストのデコーダの応用のために、実数値の分析フィルタバンクおよび実数値の合成フィルタバンクを組み合わせることができる。
【0039】
図10は、サブバンド信号を検査するための手段82の好ましい実施形態を示す。先に図5を参照して概説したように、図8からの検査するための手段82は、予測子多項式の係数が得られるように、サブバンド信号および隣接するサブバンド信号についての低次の予測子多項式係数を決定するための手段100を含む。好ましくは、式(1)について概説したように、式(1)に規定するような2次の予測多項式の第1の予測子多項式係数が計算される。手段100は、互いに隣接するサブバンド信号の係数の符号を決定するための手段102に結合される。本発明の好ましい実施形態によれば、決定するための手段102は、サブバンド信号および隣接するサブバンド信号が得られるように、式(2)を計算するように動作する。手段102によって得られたサブバンド信号の符号は、一方で、予測子多項式係数の符号に左右され、また一方で、チャンネル番号またはサブバンド番号kの符号に左右される。図10の手段102は、符号を分析するための手段104に結合されて、エイリアシングの問題のある成分を有する互いに隣接するサブバンド信号を決定する。
【0040】
特に、本発明の好ましい実施形態において、低いチャンネル番号を有するサブバンド信号が正の符号を有し、高いチャンネル番号を有するサブバンド信号が負の符号を有する場合に、手段104は、サブバンド信号をエイリアシング生成信号成分を有するサブバンド信号であると決定するように動作する。図5を考慮すると明らかなように、サブバンド信号16および17について、このような状況が生じ、サブバンド信号16および17は、結合されたゲイン調整値を有する互いに隣接するサブバンド信号であると決定される。同じことは、サブバンド信号18および19、サブバンド信号21および22、またはサブバンド信号23および24についても当てはまる。
【0041】
ここで、注意すべきなのは、代わりに、他の予測多項式、すなわち、3次、4次、または5次の予測多項式が用いられることもでき、また、他の多項式係数が、2次、3次、または4次の予測多項式係数のような符号を決定するために用いられることもできるという点である。しかしながら、式1および2に関して示した手順は、計算のオーバヘッドが低いので、好ましい。
【0042】
図11は、本発明の好ましい実施形態に係る、互いに隣接するサブバンド信号のゲイン調整値を計算するための手段の好ましい実施例を示す。特に、図8からの手段84は、互いに隣接するサブバンドの基準エネルギーを示すことを提供するための手段110と、互いに隣接するサブバンドの推定されたエネルギーを計算するための手段112と、第1および第2のゲイン調整値を決定するための手段114とを含む。好ましくは、第1のゲイン調整値gkおよび第2のゲイン調整値gk-1は等しい。好ましくは、手段114は、上記式(3)を実行するように動作する。ここで、注意すべきなのは、通常、互いに隣接するサブバンドの基準エネルギーについての示唆が、通常のSBRエンコーダから出力された符号化された信号から得られる点である。特に、基準エネルギーは、通常のSBR対応のエンコーダによって生成されるような粗いスペクトルエンベロープ情報を構成する。
【0043】
また、本発明は、信号のスペクトルエンベロープ調整のための方法に関し、当該方法はフィルタバンクを用い、前記フィルタバンクは実数値の分析部と実数値の合成部とを備えるか、または、前記フィルタバンクは複素数の分析部と実数値の合成部とを備え、周波数で低い方のチャンネルおよび周波数で高い方の隣接するチャンネルが同一のゲイン値を用いて修正され、前記低い方のチャンネルが正の符号を有し、前記高い方のチャンネルが負の符号を有する場合には、前記低い方のチャンネルのサブバンドサンプルおよび前記高い方のチャンネルのサブバンドサンプル間の関係が維持される。
【0044】
上述の方法において、好ましくは、前記ゲイン値は前記近接するチャンネルの平均エネルギーを用いることによって計算される。
【0045】
状況によっては、スペクトルエンベロープ調整のこの発明の方法は、ハードウェアにおいてまたはソフトウェアにおいて実施することができる。この実施は、この発明の方法が実施されるようにプログラム可能なコンピュータシステムと協働することもできる、電子的に読み取り可能な制御信号を有するディスクまたはCDのようなデジタル格納媒体上で生じることもできる。したがって、一般的に、本発明は、コンピュータプログラム生産物であって、コンピュータプログラム生産物がコンピュータ上で動作する際にこの発明の方法を実施するための、機械で読み取り可能なキャリアに格納されたプログラムコードを有するコンピュータプログラム生産物である。したがって、言い換えれば、本発明は、コンピュータプログラムであって、コンピュータプログラムがコンピュータ上で動作する際に、この発明の方法を実施するためのプログラムコードを有するコンピュータプログラムである。
【技術分野】
【0001】
本発明は、実数値のサブバンドフィルタバンクを用いる、音声信号のスペクトルエンベロープ調整を備えるシステムに関する。これは、スペクトルエンベロープ調整のための実数値のサブバンドフィルタバンクを用いる際に生じたエイリアシングを低減する。また、これは、実数値のサブバンドフィルタバンク内の正弦波成分の正確なエネルギー計算を可能にする。
【背景技術】
【0002】
PCT/SE02/00626の「複素指数変調されたフィルタバンクを用いるエイリアシング低減」には、複素指数変調されたフィルタバンクが、スペクトルエンベロープ調整音声信号にとって優れたツールであることが示されている。このような手順において、信号のスペクトルエンベロープは、特定のフィルタバンクチャンネルに対応するエネルギー値によって表される。これらのチャンネルにおける現在のエネルギーを推定することによって、対応するサブバンドサンプルが修正されて所定のエネルギーを有するようになり、よって、スペクトルエンベロープが調整される。計算上の複雑さに関する制約により、複素指数変調されたフィルタバンクを使用することができず、コサイン変調された(実数値の)実施のみ見込む場合には、フィルタバンクをスペクトルエンベロープ調整のために用いたときには、深刻なエイリアシングが得られる。このことは、強い音構成の音声信号であって、エイリアシング成分が元のスペクトル成分との相互変調を生じさせる場合に特に顕著である。本発明は、これに対する解決策を、信号に依存した方法で周波数関数としての制約をゲイン値に対して課すことによって提供する。
【発明の概要】
【発明が解決しようとする課題】
【0003】
本発明の目的は、スペクトルエンベロープ調整のための改良された技術を提供することである。
【課題を解決するための手段】
【0004】
本目的は、請求項1若しくは8に記載の複数のチャンネルの中でどのチャンネルがチャンネルをゲイン調整するために結合ゲイン係数を有するべきかを判断するための装置若しくは方法、または請求項9に記載のコンピュータプログラムによって達成される。
【0005】
本発明は、スペクトルエンベロープ調整のために用いた実数値のフィルタバンクにおけるエイリアシングによって生じた相互変調の問題に関する。本発明は、入力信号を分析して、得た情報を用いて、所定の時間における信号のスペクトル特性によって決定される次元で隣接するチャンネルのゲイン値のグループ化を行うことによって、フィルタバンクのエンベロープ調整能力を制限する。実数値のフィルタバンク、例えばトランジションバンドが最も隣接するものとだけ重なる擬似QMFでは、エイリアシングキャンセル特性により、エイリアシングは、プロトタイプフィルタの遮断帯域レベルよりも低く保たれることを示すことができる。プロトタイプフィルタがエイリアシングを充分に抑圧して設計されている場合は、フィルタバンクは、厳密な数学的な意味ではではそうではないが、知覚的な観点からしては完全に復元されたタイプのものである。しかしながら、互いに隣接するチャンネルのチャンネルゲインが分析と合成とで変更されている場合には、エイリアシングキャンセル特性が妨害されており、エイリアシング成分が出力信号で聞こえるようになる。フィルタバンクチャンネルのサブバンドサンプルに対して低次の線形予測を行うことによって、LPC多項式の性質を観察することにより、強い音成分がフィルタバンクチャンネル内のどこに存在するかを判断することができる。よって、チャンネル内にある音成分から強いエイリアシング成分を回避するために、どの隣接したチャンネルが独立したゲイン値を有してはならないかを判断することができる。
【0006】
本発明は、以下の特徴を備える。
強い音成分がサブバンドチャンネル内のどこにあるかを判断するためのサブバンドチャンネルの分析手段、
サブチャンネルすべてにおいて、低次の線形予測器によって分析すること、
LPC多項式のゼロの位置に基づく、ゲイングループ化の決定、
実数値での実施のための正確なエネルギー計算。
【0007】
本発明は、添付の図面を参照して、説明に役立つ実施例によって説明されるが、本発明の範囲または精神を制限するものではない。
【図面の簡単な説明】
【0008】
【図1】図1は、複数の正弦波成分を含む元信号の、Mチャンネルサブバンドフィルタバンクのチャンネル15〜24によってカバーされる周波数範囲の周波数分析を示す。正弦波がフィルタバンクチャンネル内のどこに存在するかを示すために、図示の分析の周波数分解能は、使用されたフィルタバンクの周波数分解能よりも意図的に高くしている。
【図2】図2は、元信号のサブバンドチャンネル15〜24に適用されるゲイン値を含むゲインベクトルを示す。
【図3】図3は、本発明を用いない実数値での実施における上記ゲイン調整からの出力を示す。
【図4】図4は、複素数値での実施における上記ゲイン調整からの出力を示す。
【図5】図5は、すべてのチャンネルの半分に正弦波成分があることを示す。
【図6】図6は、本発明に係る好ましいチャンネルグループ化を示す。
【図7】図7は、本発明を用いる実数値での実施における上記ゲイン調整からの出力を示す。
【図8】図8は、本発明の装置のブロック図を示す。
【図9】図9は、本発明を都合よく用いることができる分析および合成フィルタバンクの組み合わせを示す。
【図10】図10は、好ましい実施形態に係る図8からの検査のための手段のブロック図である。
【図11】図11は、本発明の好ましい実施形態に係る図8からのゲイン調整のための手段のブロック図である。
【発明を実施するための形態】
【0009】
好ましい実施形態の説明
下記の実施形態は、実数値のフィルタバンクに基づくスペクトルエンベロープ調整器の改良のための本発明の原理を単に例証するに過ぎない。本明細書において説明された仕組みおよび詳細の修正および変形は、当業者にとって明らかであろうことが理解される。したがって、特許請求項の範囲によってのみ制限され、本明細書の実施形態の説明によって表される特定の詳細によっては制限されないことが意図されている。
【0010】
以下の説明では、実数値の分析および実数値の合成を備える実数値の擬似QMFが用いられる。しかしながら、本発明が対処するエイリアシングの問題は、複素数の分析および実数値の合成のシステムにおいても生じ、また、本説明で用いられる擬似QMFとは別の、他のコサイン変調されたフィルタバンクでも生じることが理解されるべきである。本発明は、そのようなシステムにも適用可能である。擬似QMFにおいて、すべてのチャンネルは、実質的にその隣接するものとのみ周波数において重なる。チャンネルの周波数応答は、点線によって以下の図面に示される。これは、チャンネルの重なりを示すための例証的な目的のためのみのものであり、プロトタイプフィルタによって与えられた実際のチャンネル応答であると解釈されるべきではない。図1において、元信号の周波数分析が示されている。この図は、Mチャンネルフィルタバンクの15・π/Mから25・π/Mでカバーされる周波数範囲を示す。以下の説明では、示されたチャンネル番号は、それらの低いクロスオーバ周波数に由来するものであり、よって、チャンネル16は、その付近での重なりを除いた16・π/Mから17・π/Mの周波数範囲をカバーする。分析と合成とにおいてサブバンドサンプルに対して修正を行わない場合には、エイリアシングは、プロトタイプフィルタの特性によって制限されるであろう。図2に示すように、互いに隣接するチャンネルのサブバンドサンプルがゲインベクトルに従って修正される場合には、すべてのチャンネルの個別のゲイン値と共に、エイリアシングキャンセル特性が失われる。よって、図3に示すように、エイリアシング成分が、出力信号におけるフィルタバンクチャンネルのクロスオーバ領域周辺に反映されて現れる。これは、図4に示すような、妨害を生じさせるエイリアシング成分の悪影響を出力が受けることがないPCT/SE02/00626で概説されたような複素数での実施には当てはまらない。出力に深刻な相互変調歪みを生じさせるエイリアシング成分を回避するために、本発明は、例えば図1におけるチャンネル18および19といった、正弦波成分を共有する2つの互いに隣接するチャンネルは、同様に修正されるべきである、すなわち、2つのチャンネルに対して適用するゲイン係数が同一にされるべきであることを教示する。これは、以下、これらチャンネルの結合ゲインと称する。当然ながら、このことは、エイリアシングを低減するためにエンベロープ調整器の周波数分解能が犠牲になることを意味する。しかしながら、チャンネル数が充分あれば、周波数分解能の損失は、深刻な相互変調歪みをなくすために払う小さな代償である。
【0011】
どのチャンネルが結合ゲイン係数を有するべきかを判断するために、本発明は、帯域内線形予測の使用を教示する。例えば2次LPCなどの低次の線形予測を用いる場合、この周波数分析ツールは、全てのチャンネルにおいて1つの正弦波成分を分解することができる。第1の予測子多項式係数の符号を確認することによって、正弦波成分がサブバンドチャンネルの周波数範囲の上半分または下半分のいずれに存在するかを決定するのは容易である。
2次の予測多項式
【数1】
は、スペクトルエンベロープ調整によって影響を受けるであろうQMFフィルタバンクにおけるすべてのチャンネルに対する自己相関方法または共分散方法を用いる線形予測によって得られる。QMFバンクチャンネルの符号は、以下に従って規定される。
【数2】
式中、kはチャンネル番号、Mはチャンネル数であり、1つおきのQMFチャンネルの周波数反転が考慮される。よって、すべてのチャンネルについて、強い音成分の存在する場所を判断することができ、よって、強い正弦波成分を共有するチャンネル同士をグループ化する。図5において、各チャンネルの符号が示されており、よって、サブバンドチャンネルの正弦波がいずれの半分に存在するかが示され、図中、+1は上半分、−1は下半分を示す。本発明は、エイリアシング成分を回避するために、チャンネルkが負の符号を有し、チャンネルk−1が正の符号を有するチャンネルについて、サブバンドチャンネルのゲイン係数がグループ化されることを教示している。したがって、図5に示すようなチャンネルの符号は、図6に係る所要のグループ化をもたらし、図中、チャンネル16および17がグループ化され、チャンネル18および19がグループ化され、チャンネル21および22がグループ化され、チャンネル23および24がグループ化される。これは、グループ化されたチャンネルkおよびk−1についてのゲイン値gk(m)が、以下の式に従って、別々ではなく共に計算されることを意味する。
【数3】
おけるものである。これにより、グループ化されたチャンネルは、同一のゲイン値を得ることが保証される。このようなゲイン係数のグループ化は、フィルタバンクのエイリアシングキャンセル特性を維持するものであり、図7に係る出力を与える。ここで、図3にあるエイリアシング成分が消滅していることが明らかである。強い正弦波成分がなくても、チャンネルの符号によって示される、ゼロがz面のいずれかの半分に存在するであろうから、チャンネルはそれに従ってグループ化される。これは、強い音成分があるか否かについての検出ベースの決定を行う必要がないことを意味する。
【0012】
実数値のフィルタバンクにおいて、エネルギー推定は、複素数表現におけるほど直接的ではない。単一のチャンネルの二乗されたサブバンドサンプルを合計することによってエネルギーを計算すると、実際のエネルギーというよりも、信号の時間エンベロープに追従するという危険性がある。これは、正弦波成分が、0からフィルタバンクチャンネル幅の任意の周波数を有しうるということによる。正弦波成分がフィルタバンクチャンネルに存在する場合、元信号では高い周波数正弦波であるにもかかわらず、非常に低い相対周波数を有しうる。この信号のエネルギーを評価することは、実数値のシステムにおいては困難となる。なぜならば、平均時間が正弦波の周波数に対して不適切に選ばれると、信号エネルギーが実際には一定の場合に、トレモロ(振幅変動)が生じる可能性があるからである。しかしながら、本発明は、フィルタバンクチャンネルは、正弦波成分の位置を考慮して2つずつグループ化されるべきであることを教示する。これにより、以下に概説するように、トレモロの問題は大幅に低減される。
【0013】
コサイン変調されたフィルタバンクにおいて、分析フィルタhk(n)は、以下のように、対称ローパスプロトタイプフィルタp0(n)をコサイン変調したものである。
【数4】
式中、Mはチャンネル数、k=0,1,・・・,M−1、Nはプロトタイプフィルタの次元、n=0,1,・・・,Nである。ここで、プロトタイプフィルタの対称度は、n=N/2に関して仮定される。以下の派生物は、半サンプル対称度の場合に同様である。
【0014】
周波数が0≦Ω≦πである正弦波入力信号x(n)=Acos(Ωn+θ)とすると、チャンネルk≧1のサブバンド信号は、概ね以下のように計算することができる。
【数5】
式中、P(ω)は、シフトされたプロトタイプフィルタp0(n+N/2)の実数値の離散時間フーリエ変換である。P(Ω+π(k+1/2)/M)が小さい場合、近似は良好であり、これは、P(ω)が、以下の説明の基礎となる仮定である|ω|≧π/Mについて無視できる場合に特に当てはまる。スペクトルエンベロープ調整に関して、サブバンドk内の平均エネルギーは、次のように計算できるであろう。
【数6】
式中、w(n)は長さLの窓である。式(5)を式(6)に代入すると、以下のようになる。
【数7】
式中、Ψ(Ω)はkとは無関係の位相の項であり、W(ω)は窓の離散時間フールエ変換である。このエネルギーは、入力信号が定常の正弦波であるがΩがπ/Mの整数倍に近い場合に、非常に変動する可能性がある。トレモロ型の生成物が、そのような単一の実数分析バンクチャンネルエネルギー推定に基づくシステムにおいて生じるであろう。
【0015】
一方、π(k−1/2)/M≦Ω≦π(k+1/2)/Mであり、かつP(ω)が|ω|≧π/Mについて無視できると仮定すると、サブバンドチャンネルkおよびk−1のみがゼロでない出力を有し、本発明が提案するように、これらのチャンネルは共にグループ化されるであろう。これら2つのチャンネルに基づくエネルギー推定は、
【数8】
であり、式中、
【数9】
および
【数10】
である。
【0016】
プロトタイプフィルタをより有用に設計するには、S(Ω)を上記周波数範囲においてほぼ一定にするように保つ。さらに、窓w(n)がローパスフィルタ特性を有する場合には、|ε(Ω)|が|W(0)|よりも大幅に小さくする。そうすれば、式(8)のエネルギー推定の変動は、式(7)の場合と比較して、著しく低減される。
【0017】
図8は、信号のスペクトルエンベロープ調整のための発明の装置を示す。この発明の装置は、複数のサブバンド信号を与えるための手段80を備える。サブバンド信号は、サブバンド信号でカバーされる周波数範囲を示すチャンネル番号kに関連付けられているという点で注意すべきである。サブバンド信号は、分析フィルタバンクにおけるチャンネル番号kを有するチャンネルフィルタから生じる。分析フィルタバンクは、複数のチャンネルフィルタを有し、チャンネル番号kを有するチャンネルフィルタは、より低いチャンネル番号k−1を有する隣接するチャンネルフィルタのチャンネル応答に重なる所定のチャンネル応答を有する。重なりは、所定の重なり範囲において生じる。重なり範囲については、分析フィルタバンクの隣接するチャンネルフィルタの点線における重なりインパルス応答を示す図1,3,4,および7を参照する。
【0018】
図8からの手段80によって出力されたサブバンド信号は、エイリアシング生成信号成分についてサブバンド信号を検査するための手段82に入力される。特に、手段82は、チャンネル番号kに関連付けられたサブバンド信号を検査し、かつ、チャンネル番号k−1に関連付けられた隣接するサブバンド信号を検査するように動作する。これは、サブバンド信号および隣接するサブバンド信号が、例えば図1に示すような正弦波成分のような重なり範囲においてエイリアシング生成信号成分を有するかどうかを決定するためである。ここで注意すべきなのは、例えばチャンネル番号15に関連付けられたサブバンド信号における正弦波信号成分は重なり範囲内に位置していないという点である。同じことは、チャンネル番号20に関連付けられたサブバンド信号における正弦波信号成分にも当てはまる。図1に示す他の正弦波成分については、それらが対応の互いに隣接するサブバンド信号の重なり範囲内にあることが明らかである。
【0019】
検査のための手段82は、重なり範囲内にエイリアシング生成信号成分を有する2つの互いに隣接するサブバンド信号を識別するように動作する。手段82は、互いに隣接するサブバンド信号のゲイン調整値を計算するための手段84に結合されている。特に、手段84は、一方のサブバンド信号ともう一方の隣接するサブバンド信号との第1のゲイン調整値と第2のゲイン調整値とを計算するように動作する。この計算は、検査のための手段の肯定的な結果に応じて行われる。特に、計算するための手段は、互いに独立しておらず互いに依存している第1のゲイン調整値および第2のゲイン調整値を決定するように動作する。
【0020】
手段84は、第1のゲイン調整値および第2のゲイン調整値を出力する。この点で注意すべきなのは、好ましくは、第1のゲイン調整値および第2のゲイン調整値は、好ましい実施形態においては、互いに等しいということである。例えばスペクトル帯域複製エンコーダにおいて計算されたゲイン調整値を修正する場合には、以下に概説するように、元のSBRゲイン調整値に対応する修正されたゲイン調整値は共に、元の値の高い値よりも小さく、かつ元の値の低い値よりも高い。
【0021】
したがって、ゲイン調整値を計算するための手段84は、互いに隣接するサブバンド信号の2つのゲイン調整値を計算する。これらのゲイン調整値およびサブバンド信号自体は、計算されたゲイン調整値を用いて互いに隣接するサブバンド信号をゲイン調整するための手段86に与えられる。好ましくは、手段86によって行われるゲイン調整は、ゲイン調整値がゲイン調整係数であるように、サブバンドサンプルにゲイン調整値を乗算することによって行われる。言い換えれば、数個のサブバンドサンプルを有するサブバンド信号のゲイン調整は、サブバンドからの各サブバンドサンプルに、各サブバンドについて計算されたゲイン調整係数を乗算することによって行われる。したがって、サブバンド信号の細かい構造は、ゲイン調整によって影響を受けない。言い換えれば、サブバンドサンプルの相対的な振幅値は維持され、サブバンドサンプルの絶対振幅値は、これらのサンプルに各サブバンド信号に関連付けられたゲイン調整値を乗算することによって変化される。
【0022】
手段86の出力時に、ゲイン調整されたサブバンド信号が得られる。これらのゲイン調整されたサブバンド信号が合成フィルタバンク、好ましくは実数値の合成フィルタバンクに入力されると、合成フィルタバンクの出力、すなわち、合成された出力信号には、図7を参照して上述したように、重大なエイリアシング成分は見られない。
【0023】
ここで注意すべきなのは、互いに隣接するサブバンド信号のゲイン値が互いに等しくなっている場合には、エイリアシング成分の完全なキャンセルが得られることができる点である。それにもかかわらず、互いに隣接するサブバンド信号のゲイン調整値が互いに依存して計算される場合には、エイリアシング成分の少なくとも低減が得られることができる。これは、ゲイン調整値が互いに完全に等しくはないものの、発明の工程が行われていない場合に比べて互いに近い場合には、エイリアシングの状況の改善が既に得られていることを意味する。
【0024】
通常、本発明は、WO98/57436A2に記載されているスペクトル帯域複製(SBR)または高周波数再構築(HFR)に関連して用いられる。
【0025】
当該技術において知られているように、スペクトルエンベロープ複製または高周波数再構築は、エンコーダ側における所定の工程およびデコーダ側における所定の工程を含む。
【0026】
エンコーダにおいて、全帯域幅を有する元信号は、ソースエンコーダによって符号化される。ソースエンコーダは、出力信号、すなわち、元信号の符号化されたものを生成し、元信号に含まれていた1つ以上の周波数帯は、元信号の符号化されたものにはもはや含まれていない。通常、元信号の符号化されたものは、元の帯域幅の低帯域しか含まない。元信号の元の帯域幅の高帯域は、元信号の符号化されたものには含まれない。エンコーダ側において、さらに、元信号の符号化されたものでは欠損している帯域における元信号のスペクトルエンベロープを分析するためのスペクトルエンベロープ分析器がある。この欠損した(複数の)帯域は、例えば、高帯域である。スペクトルエンベロープ分析器は、元信号の符号化されたものでは欠損している帯域の粗いエンベロープ表現を生成するように動作する。この粗いスペクトルエンベロープ表現は、いくつかの方法で生成できる。1つの方法は、対応する周波数範囲における各チャンネルの各サブバンド信号が得られるように元信号の各周波数部を分析フィルタバンクに通し、かつ、それらのエネルギー値が粗いスペクトルエンベロープ表現となるように、各サブバンドのエネルギーを計算するというものである。
【0027】
別の可能性としては、欠損した帯域のフーリエ分析を行って、音声信号を考えた場合に重要な帯域などといったグループにおけるスペクトル係数の平均エネルギーを、周知のバーク尺度に従ったグループ化を用いて計算することによって、欠損した周波数帯域のエネルギーを計算する。
【0028】
この場合、粗いスペクトルエンベロープ表現は、所定の基準エネルギー値からなり、ある基準エネルギー値は、所定の周波数帯域に関連付けられている。そして、SBRエンコーダは、この粗いスペクトルエンベロープ表現に、元信号の符号化されたものを多重化して、出力信号を形成し、これは受信器またはSBR対応のデコーダに送信される。
【0029】
SBR対応のデコーダは、当該技術において知られているように、元信号の符号化されたものを復号化して元信号の復号化されたものを得ることによって得られた所定またはすべての周波数帯域を用いることによって、欠損した周波数帯域を再生させるように動作する。当然ながら、元信号の復号化されたものも、欠損した帯域を含まない。そこで、この欠損した帯域は、スペクトル帯域複製によって、元信号に含まれる帯域を用いて再構築される。特に、元信号の復号化されたものにある1つまたは数個の帯域が選ばれて、再構築しなければならない帯域にコピーされる。その後、コピーされたサブバンド信号または周波数/スペクトル係数の細かい構造が、一方にコピーされたサブバンド信号の実際のエネルギーを用いて計算されるゲイン調整値を用いて、およびエンコーダからデコーダへ送信された粗いスペクトルエンベロープ表現から抽出された基準エネルギーを用いて、調整される。通常、ゲイン調整係数は、基準エネルギーおよび実際のエネルギーの比率を決定して、この値の平方根をとることによって計算される。
【0030】
これが、先に図2を参照して説明した状態である。特に、図2は、例えばSBR対応のデコーダまたは高周波数再構築におけるゲイン調整ブロックによって決定されたゲイン調整値を示す。
【0031】
図8に示すこの発明の装置は、通常のSBRゲイン調整装置を完全に置き換えるために用いられたり、または先行技術のゲイン調節装置を拡張するために用いられたりすることができる。第1の可能性では、ゲイン調整値は、互いに依存し合う隣接するサブバンド信号にエイリアシングの問題がある場合に、これら隣接するサブバンド信号について決定される。これは、互いに隣接するサブバンド信号が生じるフィルタの重なったフィルタ応答において、図1に関連して説明した音信号成分などのエイリアシング生成信号成分があることを意味する。この場合、ゲイン調整値は、SBR対応のエンコーダから送信された基準エネルギーによって、およびコピーされたサブバンド信号のエネルギーの推定によって、エイリアシング生成信号成分についてサブバンド信号を検査する手段に応答して、計算される。
【0032】
他の場合、すなわち、既存のSBR対応のデコーダの操作性を拡張するためにこの発明の装置が用いられる場合には、互いに隣接するサブバンド信号のゲイン調整値を計算するための手段は、エイリアシングの問題がある2つの互いに隣接するサブバンド信号のゲイン調整値を取り出すように、実施されることができる。典型的なSBR対応のエンコーダは、エイリアシングの問題に注意を払っていないので、これら2つの互いに隣接するサブバンド信号のゲイン調整値は、互いに独立している。ゲイン調整値を計算するためのこの発明の手段は、取り出された2つの「元の」ゲイン調整値に基づいて、隣接するサブバンドの信号の計算されたゲイン調整値を導出するように動作する。これは、いくつかの方法で行うことができる。第1の方法は、第1のゲイン調整値に等しい第2のゲイン調整値を作成することである。別の可能性としては、第2のゲイン調整値に等しい第1の調整値を作成することである。第3の可能性としては、両方の元のゲイン調整値の平均を計算して、この平均を第1の計算されたゲイン調整値および第2の計算されたエンベロープ調整値として用いることである。他の場合では、2つの元のゲイン調整値のうち、高い方の元のゲイン調整値よりも共に低いく、低い方のゲイン調整値よりも共に高い、互いに異なるかまたは等しい第1および第2の計算されたゲイン調整値を選択する。図2と図6とを比較すると、2つの互いに隣接するサブバンドについての、互いに依存し合って計算された第1および第2のゲイン調整値は、共に元の低い方の値よりも高く、かつ共にもとの高い方の値よりも低いことが明らかになる。
【0033】
本発明の他の実施形態によれば、SBR対応のエンコーダは、サブバンド信号をを与える機能を既に行っており(図8のブロック80)、エイリアシング生成信号成分についてサブバンド信号を検査すること(図8のブロック82)と、互いに隣接するサブバンド信号のゲイン調整値を計算すること(ブロック84)とがSBR対応のエンコーダで行われるが、いかなるゲイン調節動作も行わない。この場合、図8の参照符号84に示す計算するための手段は、第1および第2の計算されたゲイン調節値を出力してデコーダに送信するための手段に結合されている。
【0034】
この場合、デコーダは、既に「エイリアシングが低減された」粗いスペクトルエンベロープ表現を、好ましくは、エイリアシングを低減する隣接するサブバンド信号のグループ化が既に行われたという指標と共に受信する。その後、通常のSBRデコーダに対する修正は必要ない。なぜならば、合成信号がエイリアシング歪みを示さないように、ゲイン調整値は既に良好な状態にあるからである。
【0035】
以下では、サブバンド信号を与えるための手段80の特定の実施例について説明する。本発明が新規のエンコーダにおいて実施される場合、複数のサブバンド信号を与えるための手段は、欠損した周波数帯域、すなわち元信号の符号化されたものには含まれない周波数帯域を分析するための分析器である。
【0036】
本発明が新規のデコーダにおいて実施される場合、複数のサブバンド信号を与えるための手段は、低帯域のサブバンド信号を高帯域のサブバンドチャンネルに入れ換えるためのSBR装置と組み合わせた、元信号のデコードされたものを分析するための分析フィルタバンクであってもよい。しかしながら、元信号の符号化されたものが、量子化されかつ潜在的にエントロピーが符号化されたサブバンド信号自体を含む場合には、与えるための手段は、分析フィルタバンクを含まない。この場合、与えるための手段は、エントロピーが復号化されかつ再量子化されたサブバンド信号を、デコーダに入力された送信信号から抽出するように動作する。与える手段は、スペクトル帯域複製または高周波数再構築の技術において既知であるように、任意の既知の入れ換え規則に従って、そのような低帯域の抽出されたサブバンド信号を高帯域のバンドに入れ換えるようにさらに動作する。
【0037】
図9は、(エンコーダまたはデコーダ内に位置しうる)分析フィルタバンクおよびSBRデコーダ内に位置する合成フィルタバンク90の協働を示す。デコーダ内に位置する合成フィルタバンク90は、ゲイン調整されたサブバンド信号を受信して、高帯域信号を合成するように動作し、そして、高帯域信号は、合成後、元信号の復号化されたものに組み合わされて、全帯域の復号化された信号を得る。代わりに、実数値の合成フィルタバンクが、元の周波数帯域全体をカバーすることもでき、合成フィルタバンク90の低帯域チャンネルに元信号の復号化されたものを表すサブバンド信号が与えられ、高帯域のフィルタチャンネルに図8からの手段84によって出力されたゲイン調整されたサブバンド信号が与えられるようにしてもよい。
【0038】
先に概説したように、互いに独立したゲイン調整値のこの発明の計算により、複素数の分析フィルタバンクおよび実数値の合成フィルタバンクを組み合わせるか、または、特に低コストのデコーダの応用のために、実数値の分析フィルタバンクおよび実数値の合成フィルタバンクを組み合わせることができる。
【0039】
図10は、サブバンド信号を検査するための手段82の好ましい実施形態を示す。先に図5を参照して概説したように、図8からの検査するための手段82は、予測子多項式の係数が得られるように、サブバンド信号および隣接するサブバンド信号についての低次の予測子多項式係数を決定するための手段100を含む。好ましくは、式(1)について概説したように、式(1)に規定するような2次の予測多項式の第1の予測子多項式係数が計算される。手段100は、互いに隣接するサブバンド信号の係数の符号を決定するための手段102に結合される。本発明の好ましい実施形態によれば、決定するための手段102は、サブバンド信号および隣接するサブバンド信号が得られるように、式(2)を計算するように動作する。手段102によって得られたサブバンド信号の符号は、一方で、予測子多項式係数の符号に左右され、また一方で、チャンネル番号またはサブバンド番号kの符号に左右される。図10の手段102は、符号を分析するための手段104に結合されて、エイリアシングの問題のある成分を有する互いに隣接するサブバンド信号を決定する。
【0040】
特に、本発明の好ましい実施形態において、低いチャンネル番号を有するサブバンド信号が正の符号を有し、高いチャンネル番号を有するサブバンド信号が負の符号を有する場合に、手段104は、サブバンド信号をエイリアシング生成信号成分を有するサブバンド信号であると決定するように動作する。図5を考慮すると明らかなように、サブバンド信号16および17について、このような状況が生じ、サブバンド信号16および17は、結合されたゲイン調整値を有する互いに隣接するサブバンド信号であると決定される。同じことは、サブバンド信号18および19、サブバンド信号21および22、またはサブバンド信号23および24についても当てはまる。
【0041】
ここで、注意すべきなのは、代わりに、他の予測多項式、すなわち、3次、4次、または5次の予測多項式が用いられることもでき、また、他の多項式係数が、2次、3次、または4次の予測多項式係数のような符号を決定するために用いられることもできるという点である。しかしながら、式1および2に関して示した手順は、計算のオーバヘッドが低いので、好ましい。
【0042】
図11は、本発明の好ましい実施形態に係る、互いに隣接するサブバンド信号のゲイン調整値を計算するための手段の好ましい実施例を示す。特に、図8からの手段84は、互いに隣接するサブバンドの基準エネルギーを示すことを提供するための手段110と、互いに隣接するサブバンドの推定されたエネルギーを計算するための手段112と、第1および第2のゲイン調整値を決定するための手段114とを含む。好ましくは、第1のゲイン調整値gkおよび第2のゲイン調整値gk-1は等しい。好ましくは、手段114は、上記式(3)を実行するように動作する。ここで、注意すべきなのは、通常、互いに隣接するサブバンドの基準エネルギーについての示唆が、通常のSBRエンコーダから出力された符号化された信号から得られる点である。特に、基準エネルギーは、通常のSBR対応のエンコーダによって生成されるような粗いスペクトルエンベロープ情報を構成する。
【0043】
また、本発明は、信号のスペクトルエンベロープ調整のための方法に関し、当該方法はフィルタバンクを用い、前記フィルタバンクは実数値の分析部と実数値の合成部とを備えるか、または、前記フィルタバンクは複素数の分析部と実数値の合成部とを備え、周波数で低い方のチャンネルおよび周波数で高い方の隣接するチャンネルが同一のゲイン値を用いて修正され、前記低い方のチャンネルが正の符号を有し、前記高い方のチャンネルが負の符号を有する場合には、前記低い方のチャンネルのサブバンドサンプルおよび前記高い方のチャンネルのサブバンドサンプル間の関係が維持される。
【0044】
上述の方法において、好ましくは、前記ゲイン値は前記近接するチャンネルの平均エネルギーを用いることによって計算される。
【0045】
状況によっては、スペクトルエンベロープ調整のこの発明の方法は、ハードウェアにおいてまたはソフトウェアにおいて実施することができる。この実施は、この発明の方法が実施されるようにプログラム可能なコンピュータシステムと協働することもできる、電子的に読み取り可能な制御信号を有するディスクまたはCDのようなデジタル格納媒体上で生じることもできる。したがって、一般的に、本発明は、コンピュータプログラム生産物であって、コンピュータプログラム生産物がコンピュータ上で動作する際にこの発明の方法を実施するための、機械で読み取り可能なキャリアに格納されたプログラムコードを有するコンピュータプログラム生産物である。したがって、言い換えれば、本発明は、コンピュータプログラムであって、コンピュータプログラムがコンピュータ上で動作する際に、この発明の方法を実施するためのプログラムコードを有するコンピュータプログラムである。
【特許請求の範囲】
【請求項1】
分析フィルタバンクを用いて信号をフィルタリングすることによって生成される複数のチャンネルの中でどのチャンネルがチャンネルをゲイン調整するために結合ゲイン係数を有するべきかを判断するための装置であって、フィルタバンクはサブバンドフィルタを有し、フィルタバンクの隣接するフィルタは重なり範囲において重なるトランジションバンドを有し、
隣接するチャンネルが重なり範囲においてエイリアシング生成信号成分を有するかどうか、隣接するチャンネルを検査するための手段(82)を備え、検査するための手段は、
隣接するチャンネルについての予測多項式の係数に基づいて隣接するチャンネルの符号を計算するように動作し(100,102)、かつ
隣接するチャンネルの符号が互いに所定の関係を有している場合に、隣接するチャンネルを結合ゲイン係数が必要とされるチャンネルとして示す(104)ように動作する、装置。
【請求項2】
検査するための手段(82)は、自己相関方法または共分散方法を適用するように動作する、請求項1に記載の装置。
【請求項3】
予測多項式は1次係数を有する低次の多項式であって、低次の多項式の次元は4より小さく、さらに
検査するための手段(82)はチャンネルの符号を計算するための1次係数を用いるように動作する、請求項1または2に記載の装置。
【請求項4】
検査するための手段(82)は、サブバンド信号についての符号を以下の式に基づいて計算するように動作し、
式中、kはチャンネル番号であり、α1は1次係数である、請求項1,2,または3に記載の装置。
【請求項5】
所定の関係は、第1のチャンネルが第1の符号を有し、隣接する第2のチャンネルが第1の符号とは反対の第2の符号を有するように規定される、請求項1から4のうちの1つに記載の装置。
【請求項6】
第1の符号は負であり、第2の符号は正である、請求項5に記載の装置。
【請求項7】
検査するための手段(82)は、音調閾値を超える音調基準を有する音成分を決定するために、チャンネルおよび隣接するチャンネルについての音分析を行うように動作する、請求項1に記載の装置。
【請求項8】
分析フィルタバンクを用いて信号をフィルタリングすることによって生成される複数のチャンネルの中でどのチャンネルがチャンネルをゲイン調整するために結合ゲイン係数を有するべきかを判断する方法であって、フィルタバンクはサブバンドフィルタを有し、フィルタバンクの隣接するフィルタは重なり範囲において重なるトランジションバンドを有し、
隣接するチャンネルが重なり範囲においてエイリアシング生成信号成分を有するかどうか、
隣接するチャンネルについての予測多項式の係数に基づいて隣接するチャンネルの符号を計算することによって(100,102)、かつ
隣接するチャンネルの符号が互いに所定の関係を有している場合に、隣接するチャンネルを結合ゲイン係数が必要とされるチャンネルとして示すこと(104)によって、
隣接するチャンネルを検査すること(82)を備える、方法。
【請求項9】
コンピュータプログラムであって、コンピュータプログラムがコンピュータ上で動作する際に、請求項8に記載の方法を実行するためのプログラムコードを有する、コンピュータプログラム。
【請求項1】
分析フィルタバンクを用いて信号をフィルタリングすることによって生成される複数のチャンネルの中でどのチャンネルがチャンネルをゲイン調整するために結合ゲイン係数を有するべきかを判断するための装置であって、フィルタバンクはサブバンドフィルタを有し、フィルタバンクの隣接するフィルタは重なり範囲において重なるトランジションバンドを有し、
隣接するチャンネルが重なり範囲においてエイリアシング生成信号成分を有するかどうか、隣接するチャンネルを検査するための手段(82)を備え、検査するための手段は、
隣接するチャンネルについての予測多項式の係数に基づいて隣接するチャンネルの符号を計算するように動作し(100,102)、かつ
隣接するチャンネルの符号が互いに所定の関係を有している場合に、隣接するチャンネルを結合ゲイン係数が必要とされるチャンネルとして示す(104)ように動作する、装置。
【請求項2】
検査するための手段(82)は、自己相関方法または共分散方法を適用するように動作する、請求項1に記載の装置。
【請求項3】
予測多項式は1次係数を有する低次の多項式であって、低次の多項式の次元は4より小さく、さらに
検査するための手段(82)はチャンネルの符号を計算するための1次係数を用いるように動作する、請求項1または2に記載の装置。
【請求項4】
検査するための手段(82)は、サブバンド信号についての符号を以下の式に基づいて計算するように動作し、
式中、kはチャンネル番号であり、α1は1次係数である、請求項1,2,または3に記載の装置。
【請求項5】
所定の関係は、第1のチャンネルが第1の符号を有し、隣接する第2のチャンネルが第1の符号とは反対の第2の符号を有するように規定される、請求項1から4のうちの1つに記載の装置。
【請求項6】
第1の符号は負であり、第2の符号は正である、請求項5に記載の装置。
【請求項7】
検査するための手段(82)は、音調閾値を超える音調基準を有する音成分を決定するために、チャンネルおよび隣接するチャンネルについての音分析を行うように動作する、請求項1に記載の装置。
【請求項8】
分析フィルタバンクを用いて信号をフィルタリングすることによって生成される複数のチャンネルの中でどのチャンネルがチャンネルをゲイン調整するために結合ゲイン係数を有するべきかを判断する方法であって、フィルタバンクはサブバンドフィルタを有し、フィルタバンクの隣接するフィルタは重なり範囲において重なるトランジションバンドを有し、
隣接するチャンネルが重なり範囲においてエイリアシング生成信号成分を有するかどうか、
隣接するチャンネルについての予測多項式の係数に基づいて隣接するチャンネルの符号を計算することによって(100,102)、かつ
隣接するチャンネルの符号が互いに所定の関係を有している場合に、隣接するチャンネルを結合ゲイン係数が必要とされるチャンネルとして示すこと(104)によって、
隣接するチャンネルを検査すること(82)を備える、方法。
【請求項9】
コンピュータプログラムであって、コンピュータプログラムがコンピュータ上で動作する際に、請求項8に記載の方法を実行するためのプログラムコードを有する、コンピュータプログラム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【公開番号】特開2012−123428(P2012−123428A)
【公開日】平成24年6月28日(2012.6.28)
【国際特許分類】
【出願番号】特願2012−72474(P2012−72474)
【出願日】平成24年3月27日(2012.3.27)
【分割の表示】特願2009−109603(P2009−109603)の分割
【原出願日】平成15年8月27日(2003.8.27)
【出願人】(506427990)ドルビー・インターナショナル・アクチボラゲット (24)
【氏名又は名称原語表記】DOLBY INTERNATIONAL AB
【公開日】平成24年6月28日(2012.6.28)
【国際特許分類】
【出願日】平成24年3月27日(2012.3.27)
【分割の表示】特願2009−109603(P2009−109603)の分割
【原出願日】平成15年8月27日(2003.8.27)
【出願人】(506427990)ドルビー・インターナショナル・アクチボラゲット (24)
【氏名又は名称原語表記】DOLBY INTERNATIONAL AB
[ Back to top ]