説明

可変レートボコーダのエンコードレート決定方法および装置

【課題】可変レートボコーダのエンコーディングレートを決定する装置および方法を提供する。
【解決手段】入力信号を受取り、予め定められたサブバンドエネルギ計算フォーマットにしたがって複数のサブバンドエネルギ値を計算するサブバンドエネルギ計算手段4,6と、それら複数のサブバンドエネルギ値を受取って、複数のサブバンドエネルギ値にしたがってそのエンコーディングレートを選択または決定するエンコーディングレート決定手段16とを具備している。

【発明の詳細な説明】
【技術分野】
【0001】
本発明はボコーダに関し、例えば、可変レートボコーダにおけるスピーチエンコーディングレート決定のための発明および、改良されたその装置と方法に関する。
【背景技術】
【0002】
可変レートスピーチ圧縮システムは、エンコーディングが始まる以前に、レート決定アルゴリズムのある種のフォーム(即ち、形式)を使用することが一般的である。このレート決定アルゴリズムは、高いビットレート・エンコーディング・スキームを、スピーチが在る処のオーディオ信号のセグメントヘアサインすると共に、サイレント(即ち、無音)セグメントのためのより低いレート・エンコーディング・スキームが在る。この方法では、再構築されたスピーチのボイス(以下、音声と称する)の質が高く保たれる期間において、より低いビットレートが達成される。このように、効率的にオペレートするために、可変レートスピーチコーダは、種々の背景雑音環境において無音とスピーチとを識別することができるようなロバストレート(即ち、粗いレート)の決定アルゴリズムを要する。
【0003】
可変レートスピーチ圧縮システムと、可変レートボコーダの一例は、米国特許番号07/713,661、出願日1991年6月11日、その発明の名称は「可変レートボコーダ」であり、本願発明の譲受人に譲渡されたものであり、この内容は本発明の参考文献である。
【0004】
可変レートボコーダのこの改良においては、入力スピーチは、符号励起線形予測符号化(CELP)技術を使ってエンコードされる。スピーチアクティビティのレベルは、音声化されたスピーチに加えて、背景雑音を含む入力オーディオ・サンプルにおけるエネルギから決定される。このボコーダが種々のレベルの背景雑音のもとでエンコードし高い質の音声を提供するためには、適合する適応閾値技術が、レート決定アルゴリズム上の背景雑音の影響のため補償することが要求される。
【0005】
ボコーダは主として、例えばセルラーテレホンまたは、パーソナル・コミュニケーション・デバイス等のような通信デバイスに使用され、それは、送信のためのデジタル形式に変換される処のアナログオーディオ信号へのデジタル信号圧縮を提供するものである。モバイル環境においては、セルラーテレホンまたは、パーソナル・コミュニケーション・デバイス等が使用され得るが、高レベルの背景雑音エネルギは、レート決定アルゴリズムがレート決定アルゴリズムに基づく信号エネルギを使用して、低エネルギの非音声音と背景雑音の静粛(即ち、サイレンス)とを識別することを困難なものにしている。このように、非音声音の周波数は低ビットレートにエンコードされ、その音声質は、子音として例えば、”s”,”x”,”ch”,”sh”,”t”などのような再構築されたスピーチにおいて、質的低下を生ずる。
【0006】
背景雑音のエネルギにおける単なるベースレート決定を行うボコーダは、閾値の設定における背景雑音に関係する処の信号強度を考慮することを忘れてしまう。背景雑音において単にその閾値レベルを基礎にするボコーダは、背景雑音が上昇するときには、それらの閾値レベルを1つに合わせて圧縮処理を行おうとする。また、その信号レベルが固定されて継続されるような場合には、閾値レベルを設定するためには、確かにこれが正しい手法ではあるが、しかし、その信号レベルが背景雑音を伴って上昇するときは、その閾値レベルを圧縮することは、最適な解決策では決してない。よって、その信号強度を考慮する処の閾値レベル設定のための代替的な方法は、可変レートボコーダに必要とされるものである。
【0007】
背景雑音エネルギに基づくベースレート決定を行うボコーダを通しての音楽再生中においては、最終的な問題がまだ存在する。人がしゃべるときには、息継ぎするためのポーズ(即ち、休止)しなければならず、これは、適切な背景雑音レベルにリセット(即ち、再設定)するための閾値を許容するものである。しかしながら、ボコーダを通しての音楽の伝送において、例えば、ミュージック・オン・ホールド・コンディション(即ち、状況)において起こるような、ポーズが無くて、フルレートよりも少ないレートでコード化されるべき音楽が演奏開始されるまでには、その閾値は上昇し続けることがある。このような状況においては、その可変レートコーダは、音楽と背景雑音とを混同してしまう。
【発明の開示】
【発明が解決しようとする課題】
【0008】
本発明の第1の目的は、背景雑音としての低エネルギの非音声音スピーチのコーディングの確率を削減することによる一方法を提供することである。本発明においては、入力信号は、高周波数成分と低周波数成分とにフルタリングされる。このフルタリングされた入力信号の成分は、次に、スピーチの存在を検出するためにそれぞれ分析される。なぜならば、非音声音は高い周波数成分をもっており、その強度は高い周波数バンドに係わり、このバンドにおいては、全周波数バンドにわたる背景雑音に比較すれば、その背景雑音からの識別が更にしやすい故である。
【0009】
本発明の第2の目的は、信号エネルギのみならず背景雑音エネルギをも考慮した、閾値レベルの設定をすることによる一手段を提供することにある。本発明において、音声検知の閾値設定は、その入力信号の信号対雑音比(SNR)の予測に基づいている。例示する実施例によれば、信号エネルギは、アクティブスピーチの時間中における、その最大信号エネルギとして予測され、また、背景雑音エネルギは、無音の時間中におけるその最大信号エネルギとして予測される。
【0010】
本発明の第3の目的は、可変レートボコーダを通る音楽のためのコーディングの一方法を提供することである。例示する実施例によれば、レート選択装置は、閾値レベルが上昇した閾値を超過する連続的なフレームの数を検知して、そのフレームの数の周期性のチェックを行う。もし、その入力信号に周期的があれば、音楽が在ることを示している。音楽の存在が検知されると、その信号がフルレートでコード化されるようなレベルに閾値が設定される。
【課題を解決するための手段】
【0011】
本発明は、可変レートボコーダにおけるエンコーディングレートの選択決定のための発明装置および、その改良された方法である。
【0012】
本発明は、「可変レートボコーダのエンコーディングレートを決定する装置において、入力信号を受取り、予め定められたサブバンドエネルギ計算フォーマットにしたがって複数のサブバンドエネルギ値を計算するサプバンドエネルギ計算手段と、前記複数のサブバンドエネルギ値を受取って、前記複数のサブバンドエネルギ値にしたがってそのエンコーディングレートを決定するレート決定手段とを具備していることを特徴とする。」とする。
【発明を実施するための最良の形態】
【0013】
図1を参照すると、入力信号S(n)は、サブバンドエネルギ計算用の構成要素4および、サブバンドエネルギ計算用の構成要素6に供給される。この入力信号S(n)は、オーディオ信号と背景雑音とから構成されている。このオーディオ信号は一般的にはスピーチであるが、もちろん音楽であってもよい。本発明の実施例においては、入力信号S(n)は、0〜4kHzの周波数を有し、これはほぼ人間のスピーチ信号のバンド幅である。
【0014】
例示する実施例においては、4kHzの入力信号S(n)は、2つに分離したサブバンドにフィルタリングされる。この2つに分離したサブバンドは、各々、0〜2kHzの間および、2〜4kHzの間に存在する。例示する実施例においては、入力信号は、サブバンドフィルタによって、複数のサブバンドに分離されてもよく、このデザインは、従来技術で良く知られており、1994年2月1日出願の米国特許番号08/189,819「周波数選択アダプティプ(適応)フィルタリング」に詳細開示され、本願発明の譲受人に譲渡されたものであり、この内容の開示は文献の援用である。
【0015】
サブフィルタのインパルス・レスポンスは、ローパスフィルタのためのものとしては、h(n)で示され、ハイパスフィルタのためのものとしては、h(n)で示されている。その信号のサブバンド構成要素の結果得られるエネルギは、例えば、値R(0)および値R(0)を与えるために計算され得る。すなわち、従来技術で良く知られているように、単純に、サブバンドフィルタ出力サンプルのスクエア(即ち、二乗)を合算することによって得られる。
【0016】
好適実施例によっては、入力信号S(n)がサブバンドエネルギ計算用の構成要素4に供給されたとき、入力フレームの低周波数構成要素であるR(0)が、下式により算出される。
【数4】

【0017】
ただし、 Lは、インパルス・レスポンスh(n)をもつローパスフィルタにおいて、タップ(tap)する数である。また、このRs(i)は、下式で与えられる入力信号S(n)の自己相関関数(autocorrelation)である。
【数5】

【0018】
ただし、 Nは、フレーム中のサンプル数である。また、Rhは、下式で与えられるローパスフィルタh(n)の自己相関関数である。
【数6】

【0019】
高周波数R(0)は、サブバンドエネルギ計算用の構成要素6において、計算される。
【0020】
サブバンドフィルタの自己相関関数の値は、計算ロード(即ち、負荷)を削減するため、先に計算され得る。さらに、計算された幾つかのRS(i)の値は、入力信号S(n)のコーディングにおける他の計算に使われる。そしてこれは、本発明のエンコーディングレート選択方法のネット(即ち、正味)の計算負担を削減する。例えば、LPCフィルタ・タップ値の計算については、上述の従来技術では良く知られており、米国特許番号08/004,484には詳述されている。もし、あるものが10タップLPCフィルタを要する方法でスピーチをコード化すると仮定した場合、Rs(i)だけは計算が必要であり(但し、i は、11〜L-1)、更にこれらに加えて、この計算は信号のコーディングにおいても利用される。なぜならば、Rs(i)(但し、i は、0〜10)は、LPCフィルタ・タップ値の計算において使用される。例示する実施例では、これらのサブバンドフィルタは17タップ、即ち、L=17である。
【0021】
サブバンドエネルギ計算用の構成要素4は、計算されたR(0)の値を供給し、そして、サブバンドエネルギ計算用の構成要素6は、計算されたR(0)の値を、サブバンドレート決定用の構成要素14へ供給する。サブバンドレート決定用の構成要素12は、R(0)の値を、2つの所定の閾値TL1/2とTLfullとに対して比較を行い、圧縮に従って、示唆されたエンコーディングレートRATELをアサインする。
【0022】
そのレートのアサイメントは、次記に従って処理される。
【0023】
RATEL =1/8レート RL(0)≦TL1/2 (4)
RATEL = 半レート TL1/2<RL(0)≦TLfull (5)
RATEL = フルレート RL(0)>TLfull (6)
サブバンドレート決定用の構成要素14は、同様な取扱いによって、高い周波数エネルギ値RH(0)に従って、異なる2つの閾値TH1/2およびTHfullに基づき、示唆するエンコーディングレートRATEHを選択する。サブバンドレート決定用の構成要素12は、示唆されたエンコーディングレートRATELをエンコーディングレート選択用の構成要素16へ供給し、一方、サブバンドレート決定用の構成要素14は、示唆されたエンコーディングレートRATEHをこのエンコーディングレート選択用の構成要素16へ供給する。例示する実施例においては、このエンコーディングレート選択用の構成要素16は、2つの示唆するレートの高い方を選択し、選択された「エンコードレート」として、高いレートを提供する。
【0024】
また、サブバンドエネルギ計算用の構成要素4は、低い周波数エネルギの値R(0)も、閾値適応用の構成要素8に供給する。そしてここでは、次の入力フレームのために、閾値TL1/2およびTLfullが計算される。同様に、サブバンドエネルギ計算用の構成要素6は、高い周波数エネルギの値R(0)を、閾値適応用の構成要素10に供給する。そしてここでも、次の入力フレームのために、閾値TH1/2およびTHfullが計算される。
【0025】
閾値適応用の構成要素8は、低い周波数エネルギ値R(0)を受け取ると、S(n)が背景雑音またはオーディオ信号を含むか否かを判定する。例示する実施例では、オーディオ信号が在るか否かをこの閾値適応用の構成要素8が判定することによる方法としては、下式で与えられる「正規化自己相関関数機能」(以下、NACFと略称する)によって審査する方法である。
【数7】

【0026】
ただし、 e(n)は、LPCフィルタによる、入力信号S(n)のフィルタリングからの結果をもたらすホルマント・残留信号。
【0027】
LPCフィルタによる、信号のフィルタリングや、設計については良く知られており、前述された米国特許番号08/004,484に詳述されている。入力信号S(n)は、LPCフィルタによりフィルタリングされ、ホルマントの相互作用を取り除く。NACFは、オーディオ信号が存在するか否かを判断するために、再び閾値と比較される。もし、NACFが所定の閾値よりも大きい場合は、これは、スピーチ又は音楽のようなオーディオ信号の存在を特徴づける周期性を有する入力フレームであることを示している。ここで、スピーチおよび音楽のパーツには周期性はないが、NACFのローバリュー(即ち、極小値)を示すであろうし、背景雑音は通常、どんな周期性も現わさないと共に、NACFのローバリューをほとんど常に示す。
【0028】
S(n)が背景雑音を含んでいると判断されると、NACFの値は、閾値T H1よりも小さく、よって、R(0)の値は、現在の背景雑音の予測値BGNLを更新するために使用される。ここに例示した実施例では、T H1は0.35である。
【0029】
(0)は、再び、現在の背景雑音の予測値BGNLと比較される。もし、R(0)がこの予測値BGNLより小さい場合には、NACFの値を無視して、この予測値BGNLがR(0)に等しいとして設定される。
【0030】
背景雑音の予測値BGNLは、NACFが閾値T H1よりも小さい場合にのみ増加される。もし、このR(0)がBGNLよりも大きく、そしてNACFがT H1よりも小さい場合には、背景雑音エネルギを示すBGNLが、αl・BGNLとして設定される。なお、αlは1以上の数である。なお、ここで例示する実施例では、αlは1.03である。BGNLは、NACFがT H1より小さい限り増加し続ける。また、背景雑音の予測値BGNLが最大値BGNmaxに設定される時点において、BGNLが所定のこの最大値BGNmaxに達するまでは、R(0)が現在の背景雑音の予測値BGNLより大きい。
【0031】
もし、オーディオ信号が検出された場合には、第2の閾値T H2を超過するNACFの値によって表され、この信号エネルギ予測値SLが更新される。例示する実施例では、T H2は0.5に設定される。R(0)の値は、現在のローパス信号エネルギ予測値SLに対して比較される。もし、R(0)がこの現在のローパス信号エネルギ予測値SLよりも大きい場合は、SLはR(0)に等しく設定される。もし逆に、R(0)がこの予測値SLよりも小さい場合は、再度、NACFがT H2より大きい場合にだけ、SLは、α2・SLとして設定される。なお、ここで例示する実施例では、α2は0.96である。
【0032】
閾値適応用の構成要素8は、次に、下式(8)に従って信号対雑音比の予測値を計算する。
【数8】

【0033】
閾値適応用の構成要素8は、次に、下式(9)〜(12)に従って、量子化信号対雑音比のインデックスISNRL を計算する。
【数9】

【0034】
ただし、 nintとは、最も近い整数にラウンド(例えば、四捨五入)する機能値である。
【0035】
閾値適応用の構成要素8は、信号対雑音比のインデックスISNRLへの信号に従って、2つのスケーリングファクタ(即ち、計数逓減率)KL1/2およびKLfullを選択または計算する。例えば、次に示す表1にはスケーリングファクタ値のルックアップテーブル1が提供されている。
【表1】

【0036】
これらの2つの値は、下式に従ってレート選択のための閾値を計算するのに使用される。TL1/2 = KL1/2・BGNL (11)
TLfull = KLfull・BGNL (12)
ただし、TL1/2は、低周波数ハーフ(半)レート閾値、 TLfullは、低周波数フルレート閾値。
【0037】
閾値適応用の構成要素8は、レート決定用の構成要素12に、TL1/2およびTLfullを供給する。一方、閾値適応用の構成要素10は、レート決定用の構成要素14に、TH1/2およびTHfullを供給する。
【0038】
オーディオ信号エネルギの予測値Sの初期値は次のように設定される。(但し、SL又はSHでもよい)。
【0039】
初期の信号エネルギの予測値SINITは、−18.0dBMOで、3.17dBmOは、フル・サイン(sine)曲線の信号強度を示す。例示する実施例では、−8031〜8031の増幅範囲でのデジタルのサイン曲線である。また、SINITは、アコースティック信号が存在することが決定されるまで使用される。
【0040】
1つのアコースティック信号が最初に検出されることによる方法は、1つの閾値に対してNACFを比較することである。例示する実施例では、このNACFは、連続する10フレームのための閾値を超過しなければならない。このコンディションが合致した後には、信号エネルギの予測値Sは、先の10フレームにその最大の信号エネルギ値が設定される。
【0041】
背景雑音の予測値BGNLの初期値は、BGNmaxに初めは設定される。サブバンドフレームエネルギ値が受け取られると直ちに、(但し、その値はBGNmaxよりも小さいが)
背景雑音の予想値が、受け取られたサブバンドエネルギレベルの値にリセットされる。そして、前述されたように、背景雑音の予想値BGNLの生成が行われる。
【0042】
好適実施例においては、フルレート・スピーチフレームの連続が続くときには、ハングオーバー・コンディションがアクチュエートされる。そして、ローレートのフレームが検出される。例示する実施例において、4つの連続するスピーチフレームが、1フレームによりフルレートでエンコードされるときには、エンコーディングレート(ENC0RDING RATE)がフルレートよりも小さく設定され、その計算された信号対雑音比は、所定の最小SNRよりも小さく、また、そのフレームのためのエンコーディングレートがフルレートで設定される。なお、例示する実施例では、この所定の最小SNRは、式(8)の規定によれば、27.5dBである。
【0043】
好適実施例においては、ハングオーバーフレームの数は、信号のノイズレシオ(即ち、S/N)に対する一作用機能である。例示する実施例では、ハングオーバーフレームの数は、次のように規定されている。
【0044】
#ハングオーバーフレーム番号=1 22.5<SNR<27.5 (13)
#ハングオーバーフレーム=2 SNR≦27.5 (14)
#ハングオーバーフレーム=0 SNR≧27.5 (15)
本発明はまた、音楽の存在を検知するための一方法を提供することでもあり、前述したように、ポーズの無いことで、その背景雑音の測定が再設定されることを許容する。音楽の存在を検知する方法とは、コールの最初に音楽成分が存在しないことを推量することである。これは、本発明のエンコーディングレート選択装置をして、適切に推測し、初期の背景雑音エネルギBGNinitに初期化することを許容している。なぜならば、背景雑音と異なる音楽は、ある周期的な特徴を有している。本発明は、背景雑音から音楽を区別するためにNACFの値を検証している。また、本発明の音楽検知方法は、下式に従って平均NACFの値を計算する。
【数10】

【0045】
ただし、 NACFは、式(7)に規定されている。
【0046】
また、Tは、背景雑音の予測された値が、初期の背景雑音の予測値BGNINITから増加していく場合における連続するフレーム数である。
【0047】
もし、背景雑音BGNが、フレームの所定の値Tのために増加していき、NACFAVEが所定の閾値を超過すると、音楽の存在が検知され、背景雑音BGNは予測値BGNINITにリセットされる。ここで、注意することは、このT値は、エンコーディングレートがフルレートより下に降下しない十分な低さにセットされることである。したがって、このT値は、BGNintおよびアコースティック信号の一機能として設定されるべきである。
【0048】
好適実施例の前述の内容は、当業者だれもが本発明品を作り又は利用できるようにするために提供されている。したがって、これらの好適実施例の種々な改良については当業者には明らかであり、また、ここで定義された本発明の要旨は、その発明の能力を使うことなく、他の実施例にも応用され得るものである。以上のように、本発明は、ここで開示された実施例に限るものではなく、この要旨およびここに開示の発明を有した広い範囲にも一致するものである。
【図面の簡単な説明】
【0049】
【図1】本発明のブロック図である。

【特許請求の範囲】
【請求項1】
可変レートボコーダのエンコーディングレートを決定する装置であって、
入力信号(S(n))を受取り、予め定められたサブバンドエネルギ計算フォーマットにしたがって複数のサブバンドエネルギ値を決定するサブバンドエネルギ計算手段(4, 6)と、
信号エネルギ推定値と背景雑音推定値を決定し、各サブバンドにおける複数のエンコーディングレート閾値を決定し、各エンコーディングレート閾値が前記信号エネルギ推定値対前記背景雑音推定値の比に基づいている閾値計算手段(8,10)と、
前記複数のサブバンドエネルギ値および前記複数のエンコーディングレート閾値を受信し、前記複数のサブバンドエネルギ値および前記複数のエンコーディングレート閾値により前記入力信号(S(n))に対するエンコーディングレートを決定するレート決定手段(12,14,16)とを具備している装置。
【請求項2】
前記サブバンドエネルギ計算装置(4, 6)は、
【数1】

にしたがって前記複数のサブバンドエネルギ値のそれぞれを決定するように適用され、
ここで、Lはバンドパススフィルタhbp(n)のタップ数であり、Rs(i)は入力信号S(n)の自己相関関数であり、Rhbp はバンドパスフィルタhbp(n)の自己相関関数である請求項1記載の装置。
【請求項3】
前記閾値計算手段(8,10)は信号対雑音比値にしたがってスケール値を決定するように適用される請求項1記載の装置。
【請求項4】
前記閾値計算手段(8,10)は背景雑音推定値と前記スケール値とを乗算することにより少なくとも1つの閾値を決定するように適用される請求項3記載の装置。
【請求項5】
前記レート決定手段は、前記エンコーディングレートを決定するために前記複数のサブバンドエネルギ値の少なくとも1つを前記少なくとも1つの閾値と比較するように適用される請求項1記載の装置。
【請求項6】
前記レート決定手段は、前記エンコーディングレートを決定するために前記複数のサブバンドエネルギ値の少なくとも1つを前記少なくとも1つの閾値と比較するように適用される請求項4記載の装置。
【請求項7】
前記レート決定手段(12,14,16)は複数の示唆されたエンコーディングレートを決定するように適用され、各示唆されたエンコーディングレートは前記複数のサブバンドエネルギ値の各々に対応し、前記レート決定手段は前記複数の示唆されたエンコーディングレートにしたがって前記エンコーディングレートを決定するように適用される請求項1記載の装置。
【請求項8】
前記サブバンドエネルギ計算手段(4, 6)はサブバンドエネルギ計算装置を含み、前記レート決定手段(12,14,16)は、前記複数のサブバンドエネルギ値を受信し前記複数のサブバンドエネルギ値にしたがって前記エンコーディングレートを選択するように適用されたレート選択装置を含む請求項1記載の装置。
【請求項9】
前記サブバンドエネルギ計算装置は、
【数2】

にしたがって前記複数のサブバンドエネルギ値のそれぞれを決定するように適用され、
ここで、Lはバンドパススフィルタhbp(n)のタップ数であり、Rs(i)は入力信号S(n)の自己相関関数であり、Rhbp はバンドパスフィルタhbp(n)の自己相関関数である請求項8記載の装置。
【請求項10】
前記サブバンドエネルギ計算装置および前記レート選択装置間に配置された閾値計算装置をさらに含み、前記閾値計算装置が前記サブバンドエネルギ値を受け、複数のサブバンドエネルギ値にしたがってエンコーディングレート閾値のセットを決定するように適用される請求項8記載の装置。
【請求項11】
前記閾値計算装置が前記複数のサブバンドエネルギ値にしたがって信号対雑音比値を決定するように適用される請求項10記載の装置。
【請求項12】
前記閾値計算装置が前記信号対雑音比値にしたがってスケール値を決定するように適用される請求項11記載の装置。
【請求項13】
前記閾値計算装置が背景雑音推定値と前記スケール値とを乗算することにより少なくとも1つの閾値を決定するように適用される請求項12記載の装置。
【請求項14】
前記レート選択装置は、前記エンコーディングレートを決定するために前記複数のサブバンドエネルギ値の少なくとも1つを少なくとも1つの閾値と比較するように適用される請求項8記載の装置。
【請求項15】
前記レート選択装置は、前記エンコーディングレートを決定するために前記複数のサブバンドエネルギ値の少なくとも1つを前記少なくとも1つの閾値と比較するように適用される請求項13記載の装置。
【請求項16】
前記レート選択装置は複数の示唆されたエンコーディングレートを決定するように適用され、各示唆されたエンコーディングレートは前記複数のサブバンドエネルギ値の各々に対応し、前記レート選択装置は前記複数の示唆されたエンコーディングレートにしたがって前記エンコーディングレートを決定するように適用される請求項8記載の装置。
【請求項17】
可変レートボコーダのエンコーディングレートを決定する方法であって、
入力信号(S(n))を受取り、
予め定められたサブバンドエネルギ計算フォーマットにしたがって複数のサブバンドエネルギ値を決定し、
信号エネルギ推定値と背景雑音推定値の比に基づいて信号対雑音比値を決定し、
各サブバンドにおいて信号対雑音比値に基づいて複数のエンコーディングレート閾値を決定し、
前記複数のサブバンドエネルギ値および前記複数のエンコーディングレート閾値にしたがって前記入力信号(S(n))に対するエンコーディングレートを決定するステップを含む方法。
【請求項18】
複数のサブバンドエネルギ値を決定する前記ステップは、
【数3】

にしたがって行なわれ、
ここで、Lはバンドパススフィルタhbp(n)のタップ数であり、Rs(i)は入力信号S(n)の自己相関関数であり、Rhbp はバンドパスフィルタhbp(n)の自己相関関数である請求項17記載の方法。
【請求項19】
エンコーディングレート閾値のセットを決定する前記ステップは前記信号対雑音比値にしたがってスケール値を決定する請求項17記載の方法。
【請求項20】
エンコーディングレート閾値のセットを決定する前記ステップは背景雑音推定値と前記スケール値とを乗算することにより前記レート閾値を決定する請求項19記載の方法。
【請求項21】
前記エンコーディングレートを決定するステップは、前記エンコーディングレートを決定するために前記複数のサブバンドエネルギ値の少なくとも1つを少なくとも1つの閾値と比較する請求項17記載の方法。
【請求項22】
前記エンコーディングレートを決定するステップは、前記エンコーディングレートを決定するために前記複数のサブバンドエネルギ値の少なくとも1つを前記少なくとも1つの閾値と比較する請求項20記載の方法。
【請求項23】
前記複数のサブバンドエネルギ値の各々にしたがって示唆されたエンコーディングレートを発生するステップをさらに含み、前記エンコーディングレートを決定するステップは前記示唆されたエンコーディングレートの1つを選択する請求項17記載の方法。
【請求項24】
前記サブバンドエネルギ計算手段が入力信号の各周波数サブバンドに対する信号エネルギを決定するサブバンドフィルタサブシステムを含み、前記レート決定手段が入力信号(S(n))の各周波数サブバンドの信号エネルギに基づいて入力信号のエンコーディングレートを選択するレート選択サブシステムを含む請求項1記載の装置。
【請求項25】
サブバンドフィルタサブシステムは複数のサブバンドエネルギ計算素子(4, 6)を含み、各複数のサブバンドエネルギ計算素子は周波数サブバンド信号エネルギを決定するように適用される請求項24記載の装置。
【請求項26】
レート選択サブシステムは複数の閾値適用素子(8,10) を含み、各複数の閾値適用素子は、オーディオ信号が周波数サブバンドに存在するか否かを判断するため、対応しているサブバンドエネルギ計算素子(4, 6)からの周波数サブバンド信号エネルギを使用するように適用される請求項25記載の装置。
【請求項27】
各閾値適用素子(8,10)は対応する周波数サブバンドの信号エネルギおよび雑音推定値に基づいた閾値を決定するように構成され、閾値はオーディオ信号が周波数サブバンド中に存在するか否かを決定するために使用される請求項26記載の装置。
【請求項28】
複数の閾値適用素子(8,10)は入力信号(S(n))の各周波数サブバンドの結合された信号エネルギに基づいて閾値を決定するように構成され、閾値はオーディオ信号が周波数サブバンド中に存在するか否かを決定するために使用される請求項26記載の装置。

【図1】
image rotate


【公開番号】特開2007−293355(P2007−293355A)
【公開日】平成19年11月8日(2007.11.8)
【国際特許分類】
【出願番号】特願2007−145736(P2007−145736)
【出願日】平成19年5月31日(2007.5.31)
【分割の表示】特願2003−297412(P2003−297412)の分割
【原出願日】平成7年8月1日(1995.8.1)
【出願人】(595020643)クゥアルコム・インコーポレイテッド (7,166)
【氏名又は名称原語表記】QUALCOMM INCORPORATED