説明

反響消去装置とその方法とプログラム

【課題】周囲雑音レベルが大きな環境下でも受話音声を聞き取り易くすることのできる反響消去装置を提供する。
【解決手段】反響消去装置の再生音制御部は、雑音レベル推定部と受話音声制御量生成部とフィルタ部とを備える。雑音レベル推定部は、周波数領域の収音信号から擬似エコー信号を減じた誤差信号を入力としてその誤差信号の雑音レベルを推定し、受話音声制御量生成部は、スピーカ特性と音声の平均スペクトルの積で近似したスピーカ音声レベルを、雑音レベルで除したSN値と、上限雑音閾値と下限雑音閾値とをそれぞれ比較して、SN比と閾値の上下関係により受話信号を抑圧または強調するようなフィルタを出力する。そして、フィルタ部は、受話端に入力される受話信号を、入力されたフィルタでフィルタリングした信号レベル調整済み受話信号を出力する。

【発明の詳細な説明】
【技術分野】
【0001】
この発明は、反響消去装置とその方法に係り、特に周囲雑音レベルが大きな環境下でも受話音声を聞き取り易くすることのできる反響消去装置と、その方法とプログラムに関する。
【背景技術】
【0002】
近年、通話時の利便性を高める目的で、送受話器を手に持つことなく通話が行えるハンズフリー通話を可能にした各種の機器が急増している。双方向通信を行う際に、音声を再生する側(受話側)の周囲雑音レベルが大きいと通信相手の受話音声が聞き取り難くなる。この現象は、スピーカと受話者の耳との距離が大きいハンズフリーによる双方向通信を行う際により顕著である。
【0003】
周囲雑音レベルが大きな環境において受話音声を聞き取り易くするためには、受話音量を大きくすることが直接的な解決方法である。しかし、受話音量を大きくするとハウリングやエコーの原因になる。特にスピーカからマイクに入る音量が大きな小型端末においてハウリングが起き易くなる。また、ハウリングやエコーを抑制しようとすると、反響消去装置の性能の限界から最大音量が制限され、十分な音量が出せないことから、受話音声が聞き取り難い状態で、送受話器を使い続けなければならない場合もある。
【0004】
受話音量を上げた場合にエコー(反響音)の戻りやハウリングを起こさないような反響消去方法としては、例えば特許文献1に開示された反響消去装置500が知られている。図10に、反響消去装置500の構成図を示して、その動作を簡単に説明する。
【0005】
反響消去装置500は、反響消去部200と損失制御部300とから成る。反響消去部200は、送話信号s(n)から反響路を模擬して推定した擬似反響信号y^(n)を減じた誤差信号e(n)と、送話手段(マイクロホン)420で収音した反響信号y(n)と送話信号s(n)とが重畳した入力信号z(n)を、損失制御部300に出力する。
【0006】
損失制御部300の損失量決定手段310は、入力信号z(n)と誤差信号e(n)とから、反響路の音響結合量を求め、受話信号側又は送話信号側のどちらか一方の通信路に挿入する損失量を決定する。この損失量によって、エコーの量を低減し、特に反響路の音響結合量が大きい場合、つまり、受話音声の送話側への入力が大きい場合でも通信路の1巡ループ利得が1を超えないように制御することができる。その結果、ハウリングの発生を防止することが可能である。
【先行技術文献】
【特許文献】
【0007】
【特許文献1】特許第3268572号
【発明の概要】
【発明が解決しようとする課題】
【0008】
従来の反響消去装置においては、反響路の音響結合量が大きい場合に、通信路に損失量を挿入してその1巡ループ利得が1を超えないようにするので、ハウリングの発生を防止することができる。しかし、損失量を挿入するので、相手と自分の音声が時間的に重なった場合、本来通したい通話音声の音量が下がり、相手と自分のどちらかの音声が聞き取りづらくなる。また、従来の反響消去装置500では、そもそも受話音声が周囲雑音に対して相対的に小さくて聞き取り難い場合を想定していないので、その場合の解決策を提供できない。
【0009】
この発明は、このような課題に鑑みてなされたものであり、受話音声が周囲雑音レベルよりも小さくて聞き取り難い状態でもエコーの増加やハウリングを起こすことなく、受話信号を聞き取り易くすることが出来るハンズフリー送受話器に利用して好適な反響消去装置と、その方法とプログラムを提供することを目的とする。
【課題を解決するための手段】
【0010】
この発明の反響消去装置は、再生音制御部と反響消去部とで構成される。再生制御部は、雑音レベル推定部と、受話音声制御量生成部と、フィルタ部と、を備える。雑音レベル推定部は、周波数領域の収音信号から擬似エコー信号を減じた誤差信号を入力としてその誤差信号の雑音レベルを推定する。受話音声制御量生成部は、スピーカ特性と音声の平均スペクトルの積で近似したスピーカ音声レベルを、雑音レベルで除したSN値と、上限雑音閾値と下限雑音閾値とをそれぞれ比較して、SN比と閾値の上下関係により受話信号を抑圧または強調するようなフィルタを出力する。フィルタ部は、受話端に入力される受話信号を、入力されたフィルタでフィルタリングした信号レベル調整済み受話信号を出力する。
【0011】
反響消去部は、適応フィルタ部と、差信号生成部とを備える。適応フィルタ部は、信号レベル調整済み受話信号から擬似エコー信号を生成する。差信号生成部は、収音信号から擬似エコー信号を減じた送話端に出力される送話信号となる誤差信号を生成する。
【発明の効果】
【0012】
この発明の反響消去装置によれば、フィルタ部が、雑音レベルとスピーカ音声レベルとの比が閾値以下の周波数に関しては受話信号を強調し、閾値以上の周波数に関しては受話信号を抑圧する。その結果、受話信号の全ての周波数の音量を上げるよりも効率的に、受話信号を聞き取り易くすることができる。
【0013】
また、受話音量を単純に上げるのと異なり、雑音より十分パワーの大きな周波数に関しては増幅しない若しくは減衰させるため、スピーカ・マイク間の回り込み量が大きい周波数に対してエコーの返りが大きくなるなどの悪影響を与えることが少ない。
【図面の簡単な説明】
【0014】
【図1】この発明の反響消去装置100の機能構成例を示す図。
【図2】反響消去装置100の動作フローを示す図。
【図3】この発明の反響消去装置110の機能構成例を示す図。
【図4】ゲイン量F(ω)によって受話信号x(n)を強調及び抑制した信号レベル調整済み受話信号x′(n)の近似SN比の様子を示す図。
【図5】この発明の反響消去装置120の機能構成例を示す図。
【図6】この発明の反響消去装置140の機能構成例を示す図。
【図7】この発明の反響消去装置160の機能構成例を示す図。
【図8】この発明の反響消去装置180の機能構成例を示す図。
【図9】この発明の反響消去装置210の機能構成例を示す図。
【図10】従来の反響消去装置500の機能構成を示す図。
【発明を実施するための形態】
【0015】
以下、この発明の実施の形態を図面を参照して説明する。複数の図面中同一のものには
同じ参照符号を付し、説明は繰り返さない。
【実施例1】
【0016】
図1に、この発明の反響消去装置100の機能構成例を示す。その動作フローを図2に示す。反響消去装置100は、再生音制御部110と反響消去部200′と、周波数領域変換部5と、時間領域変換部12とから構成される。反響消去部200′は、従来技術で説明した反響消去装置900の反響消去部200と、基本的に同じものである。反響消去装置100は、例えばROM、RAM、CPU等で構成されるコンピュータに所定のプログラムが読み込まれて、CPUがそのプログラムを実行することで実現される。
【0017】
周波数領域変換部5では、サンプリング周波数fsを用いて、収音信号y(n)を周波数領域の収音信号Y(ω)に変換する。nはディジタル信号のサンプル番号である。ωは離散周波数であり、0からL-1の整数である。
【0018】
時間領域変換部12では、再生音制御部100が出力する誤差信号E1(ω)をサンプリング周波数fsで再合成して時間領域の送話信号e(n)に変換する。
【0019】
周波数領域変換部5と時間領域変換部12とでは、各信号をL個のサンプルを持つフレームに格納して変換を行う。フレーム長Lは2以上の偶数で、例えば音声がf s=16kHzサンプリングの場合、L=160(10ms相当)などの値を用いる。
【0020】
反響消去部200′は、適応フィルタ部7と、差信号生成部6と、周波数領域変換部8と、を備える。反響消去部200′は、背景技術で説明した従来の反響消去装置500の反響消去部200と基本的に同じ動作を行うものであり、適応フィルタ部7と差信号生成部6とが周波数領域で動作する点のみが異なる。
【0021】
適応フィルタ部7は、周波数領域の信号レベル調整済み受話信号X′(ω)を入力とし、適応フィルタ^H(ω)を用いて擬似エコー信号^Y(ω)を生成する(ステップS7)。
【0022】
【数1】

ωは離散周波数であり、0からL-1の整数である。
【0023】
さらに適応フィルタ部7は、X′(ω)と、以下で説明する差信号生成部6で生成される誤差信号E1(ω)を入力とし、収音信号Y(ω)と擬似エコー信号^Y(ω)との差が小さくなるように適応フィルタ^H(ω)を更新する。
【0024】
差信号生成部6は、周波数領域の収音信号Y(ω)から周波数領域の擬似エコー信号^Y(ω)を減じて誤差信号E1(ω)を生成する(ステップS6)。
【0025】
再生音制御部110は、雑音レベル推定部9と、受話音声制御量生成部10と、フィルタ部11と、を備える。雑音レベル推定部9は、周波数領域の収音信号Y(ω)から擬似エコー信号^Y(ω)を減じた誤差信号E1(ω)を入力としてその誤差信号E1(ω)の雑音レベル^N(ω)を推定する(ステップS9)。雑音レベル^N(ω)の推定は、例えば誤差信号E1(ω)のパワーレベル分布のヒストグラムを用いて雑音レベルを推定する公知の方法(参考文献:特許第3309895号)等を用いる。なお、図1では、受話信号x(n)をアナログ信号に変換するDA変換器と、収音信号y(n)をディジタル信号に変換するAD変換器の表記を省略している。
【0026】
受話音声制御量生成部10は、スピーカの周波数特性S(ω)と音声の平均スペクトルP(ω)の積で近似したスピーカ音声レベルS(ω)・P(ω)を、雑音レベル^N(ω)で除したSN値と、上限雑音閾値Thighと下限雑音閾値Tlowとをω毎にそれぞれ比較して、SN値が上限雑音閾値Thighより大きいとき受話信号x(n)のωに当たる周波数成分を抑圧し、SN値が下限雑音閾値Tlowより小さいとき受話信号x(n)のωに当たる周波数成分を強調する時間領域のフィルタf(n)を出力する(ステップS10)。
【0027】
上記した音声の平均スペクトルP(ω)は、例えば標準的なレベルのパワーが周波数に反比例するピンクノイズなどで、各周波数ω毎に予め値を計測するか設定しておく定数である。また、S(ω)はスピーカの周波数特性であり、各周波数ω毎に予め値を計測するか、予め値を入力するなどして設定しておく定数である。音声の平均スペクトルP(ω)及びスピーカ3の周波数特性S(ω)は図示しない記憶部に記憶しておき、受話音声制御量生成部10では該記憶部に記憶された音声の平均スペクトルP(ω)及びスピーカの周波数特性S(ω)を読み出して使用する。受話音声制御量生成部10は、SN値、つまりS(ω)・P(ω)/^N(ω)と上限雑音閾値Thigh(ω),下限雑音閾値Tlow(ω)を比較して次式に示す処理を行う。Thigh(ω),Tlow(ω)は、SN比の閾値である。
【0028】
【数2】

【0029】
式(2)のTN(ω)は、雑音の閾値であり、雑音レベル推定部9で推定した雑音レベル^N(ω)がTN(ω)未満の場合、受話端1に入力された受話信号x(n)がフィルタ部11をそのまま通過させる時間領域のフィルタf(n)に対応した制御量F(ω)を出力する。受話音声制御量生成部10は、雑音レベルN(ω)が閾値TN(ω)未満の場合、F(ω)=1の制御量を出力するだけの処理を行う。
【0030】
制御量F(ω)は、受話信号X(ω)の振幅を制御するゲイン量である。以降、F(ω)をゲイン量と称する。つまり、受話音声制御量生成部10は、受話信号x(n)がスピーカ2で出力された際のある周波数のSN比が、フィルタ部11において望ましい範囲に調整されるようなゲイン量を生成する。ここで、望ましいSN比の範囲とは、受話信号X(ω)が聞き取り易いSN比の範囲のことである。よって、下限雑音閾値Tlowは、受話音声が聞き取れる下限のSN比に相当し、例えば-3dB(≒0.7079)程度に設定される。上限雑音閾値Thighに関しては、ある周波数帯域で受話音声が大き過ぎる場合にのみ作用するのが望ましいので、例えば30dBなどの大きめの値が設定される。
【0031】
このように計算したゲイン量F(ω)から、時間領域のフィルタf(n)を計算してフィルタ部11に出力する。具体的なフィルタf(n)の計算方法の一例を次式に示す。
【0032】
【数3】

【0033】
フィルタ部11では、受話端1に入力される受話信号x(n)を、受話音声制御部10が出力する時間領域のフィルタf(n)で畳み込み演算した信号レベル調整済み受話信号x′(n)を出力する。
【0034】
この信号レベル調整済み受話信号x′(n)は、スピーカ2で音響信号に変換され、出力される。その音響信号に変換された音は、信号レベル調整済み受話信号x′(n)が聞き取り易いSN比の範囲に調整されたものなので、聞き取り易いものになる。
【0035】
〔変形例1〕
なお、受話音声制御量生成部10で計算したゲイン量F(ω)を、周波数領域の受話信号X(ω)に乗じて信号レベル調整済み受話信号X′(ω)を生成するようにしてもよい(式(7))。
【数4】

【0036】
そうした場合の反響消去装置110の機能構成例を図3に示す。反響消去装置110は、再生音制御部120と反響消去部200″とで構成される。反響消去装置110は、反響消去装置100に対して、受話信号側に周波数領域変換部13と時間領域変換部15を備える点で異なる。
【0037】
再生音制御部120は、再生音制御部110に対して受話音声制御量生成部10′がゲイン量F(ω)をフィルタ部11′に出力する点でのみ異なる。反響消去部200″は、周波数領域変換部13が新たに設けられたことによって不要となった周波数領域変換部8が削除されている点でのみ異なる。
【0038】
周波数領域変換部13は、受話端1に入力される時間領域の受話信号x(ω)を周波数領域の受話信号X(ω)に変換してフィルタ部11に入力する。フィルタ部11′は、その受話信号X(ω)にゲイン量F(ω)を乗じた信号レベル調整済み受話信号X′(ω)を、反響消去部200″に出力する。
【0039】
信号レベル調整済み受話信号X′(ω)は、時間領域変換部15で時間領域の信号に変換された後に、スピーカ2によって音響信号に変換される。適用フィルタ部7と差信号生成部6の動作は、上記した反響消去部200′と同じである。
【0040】
このように、受話音声制御量生成部10で計算した周波数領域のゲイン量F(ω)を、周波数領域の受話信号X(ω)に乗算する方法でも、実施例1の反響消去装置100と同じ効果を奏する。
【実施例2】
【0041】
受話音声制御量生成部10において、閾値Thigh(ω)とTlow(ω)のそれぞれに、受話信号x(n)を強調や抑圧する最大値を設定した実施例2を次に説明する。フィルタ部11で受話信号x(n)を増幅する量には、ハウリングを防止する目的で制限を加えた方が好ましい。また減衰する量には、元の音質音量を損なわないよう下限値を設定する方が好ましい。
【0042】
下限雑音閾値Tlow(ω)側の最大値をTlow(ω)/Mlow(ω)、上限雑音閾値Thigh(ω)側の抑圧の上限を与える閾値をThigh(ω)/Mhigh(ω)、Mlow(ω)>1,Mhigh(ω)<1と置く。Mlow(ω)は例えば10dB(≒3.162)、Mhigh(ω)は例えば-10dB(≒0.316)等の値を設定する。Mhigh(ω)とMlow(ω)の値は、スピーカ2からマイク3までの音の回り込みの大きさを表すエコー経路H(ω)に応じて変える。なお、エコー経路H(ω)は予め測定しておく。
【0043】
エコー経路H(ω)が大きい周波数では、増幅量が大きいとエコーが目立ったり、ハウリングの原因になるのでMlow(ω)を小さめに設定する。Mlow(ω)の設定の基準は、例えばMlow(ω) H(ω)<1等とする。
【0044】
実施例2では、上記した式(2)〜(4)に代えて次式を用いる。
【0045】
【数5】

【0046】
図4に、ゲイン量F(ω)によって受話信号x(n)を強調及び抑制した信号レベル調整済み受話信号x′(n)のSN比の様子を示す。図4の横軸はスピーカ音声レベルと雑音レベルから計算される近似SN比、縦軸はゲイン量F(ω)で増幅した後の近似SN比である。
【0047】
なお、スピーカ特性S(ω)の代わりに予め測定したエコー経路H(ω)を用いてH(ω)・P(ω)を計算しても良い。更に、予め測定したエコー経路H(ω)を、適応フィルタ部7で推定されたエコー経路^H(ω)に置き換えても良い(図3に破線で示す^H(ω))。適応フィルタ部7で推定したエコー経路^H(ω)は、スピーカ特性以外のスピーカマイク間の伝達特性等も含むため、音声スペクトルの推定精度は粗くなるが、予めスピーカ特性が測定できない場合の代替手段となる。当然、適応フィルタ部7で推定したエコー経路^H(ω)をM1(ω)の設定の基準に用いても良い。この考えは、全ての実施例に適用することが可能である。
【実施例3】
【0048】
図5に、受話信号x(n)のパワーが変動した影響を考慮した反響消去装置120の機能構成例を示す。反響消去装置120は、反響消去装置100(図1)に対して音響結合量推定部16とノイズ・エコー抑圧部17を備える点で異なる。
【0049】
音響結合量推定部16は、信号レベル調整済み受話信号X′(ω)と、差信号生成部6が出力する誤差信号E1(ω)を入力としてその両信号の音響結合量A(ω)を推定する。ノイズ・エコー抑圧部17は、音響結合量A(ω)と受話音声制御量生成部10で計算されたゲイン量F(ω)を入力として、誤差信号E1(ω)の残留エコーとノイズを除去する。
【0050】
ノイズ・エコー抑圧部17は通常、音響結合量A(ω)が与えられた時、自身の利得G(ω)を式(11)のように計算し、誤差信号E1(ω)の残留エコーを式(12)に示すように消去する。
【0051】
【数6】

【0052】
S(ω)は、相手に送りたい話者の音声であり、1つ前のフレームで計算した送話信号のパワーなどで代用する。αは原音付加率0≦α≦1の実数である。E2(ω)は、ノイズ・エコー抑圧部17が出力する残留エコーを消去した誤差信号である。
【0053】
ここで、ノイズ・エコー抑圧部17は、受話音声制御量生成部10で計算したゲイン量F(ω)を用いて利得G(ω)を次式に示すように計算する。これにより、F(ω)によって受話信号が持ち上げられた周波数は、エコーとしても大きくマイクロホンに入力されるが、F(ω)の分G(ω)の値は小さくなるので、結果消し残りのエコーが小さくなり、受話信号を持ち上げた影響は相殺される。同様に、F(ω)によって受話信号が抑圧された周波数は、F(ω)の分G(ω)の値は大きくなり、送話信号を潰しすぎず、送話音質への影響を軽減できる。
【0054】
【数7】

【実施例4】
【0055】
上記した説明では、音声の平均スペクトルP(ω)を、例えば標準的なレベルのパワーが周波数に反比例するピンクノイズなどで各周波数ω毎に予め値を設定した定数としたが、このP(ω)を信号レベル調整済み受話信号X′(ω)から別途計算して求めるようにしても良い。
【0056】
図6に、音声の平均スペクトルP(ω)を、信号レベル調整済み受話信号X′(ω)から計算して求めるようにした反響消去装置140の機能構成例を示す。反響消去装置140は、反響消去装置120に対して受話音声制御量生成部60に、信号レベル調整済み受話信号X′(ω)が入力されている点のみが異なる。
【0057】
音声の平均スペクトルP(ω)の計算は、例えば信号レベル調整済み受話信号X′(ω)の音声パワーがある程度以上大きい箇所を抜き出して、そのスペクトルを加算平均するなどの方法が考えられる。良好な平均スペクトルを得るために受話信号をある程度長時間に渡って解析する必要はあるが、例えば通話相手側のマイクロホンの低域特性が不十分等の送話側の送話特性の影響により、予め音声の平均スペクトルの特性を設定するのが難しい場合に効果がある。
【実施例5】
【0058】
時間領域のフィルタf(n)を、受話音声制御量生成部10において毎回計算するのではなく、予めFIRフィルタを計算、記憶しておき、ゲイン量F(ω)に応じて一意に定まるFIRフィルタを選択して用いる。
【0059】
例えば、各周波数帯域ω(0≦ω≦L/2-1)においてインデックスI(ω)を式(14)に示すように計算する。これにより、任意のF(ω)はL/2個のインデックスI(ω)によって対応付けられる。このインデックスの組み合わせは(Imax)L/2個あり、その個数分のFIRフィルタ(タップ長はL)を記憶部に格納しておく。そして、F(ω)が与えられた時、対応するI(ω)を用いてメモリスペースM内に格納されたフィルタの値を、式(15)〜(18)に示すように参照して求める。TI(ω)は予め設定する閾値である。記憶部は、スピーカの周波数特性S(ω)を記憶する上記した記憶部と同じものである。これによりメモリの消費量は多くなるが、フィルタf(n)を計算する演算量を削減することが可能である。
【0060】
【数8】

【0061】
予め計算しておくf(n)の決定方法は、例えば
【数9】

として式(5)と式(6)を用いる。
【実施例6】
【0062】
図7に、選択的にフィルタ部11を動作させるようにした反響消去装置160の機能構成例を示す。反響消去装置160は、再生音制御部170が周波数領域変換部12を含み、本来、反響消去装置が備える送受話検出部70と受話損失挿入部71と送話損失挿入部72とを明記した点で異なる。上記した実施例では、説明の必要の無い送受話検出部と受話損失挿入部と送話損失挿入部とを省略していた。
【0063】
送受話検出部70は、信号レベル調整済み受話信号X′(ω)と誤差信号E2(ω)を入力として、送話音声の有無と受話音声の有無を表す送話音声フラグfsと受話音声フラグfを、受話音声制御量生成部73に出力する。
【0064】
受話音声制御量生成部73は、送話音声なし(例えばfs=0)で且つ受話音声あり(例えばf=1)の場合のみ、求めた時間領域のフィルタf(n)をフィルタ部11に転送するという処理を新たに行う。これにより、送話音声がある時には音声強調を行わないため、送話音声内に含まれるエコーの増加を防ぐことができる。
【実施例7】
【0065】
図8に、受話音声制御量生成部73で計算するゲイン量F(ω)に基づいて、受話側と送話側に挿入する損失量を制御するようにした反響消去装置180の機能構成例を示す。反響消去装置180は、反響消去装置160(図7)の受話音声制御量生成部73が出力するゲイン量F(ω)がノイズ・エコー抑圧部17ではなく、送受話検出部70に入力される点で異なる。
【0066】
例えば、受話損失挿入部71の挿入損失が0で、送話損失挿入部72の挿入損失がg<1であるような場合に、ゲイン量F(ω)によって受話音量が平均的にα倍の大きさになることが分かっていれば、送話損失挿入部72の挿入損失をg/αとする。
【0067】
αは、例えばゲイン量F(ω)の重み付け平均値であり次式で求めることができる。
【0068】
【数10】

【0069】
ただし、αはgを超えない値とする。P(ω)は前出の音声の平均スペクトルである。αはF(ω)による全帯域での凡その音量変化を表す。これを損失に用いることで、送話音質をF(ω)によって変化させた時、音量が大きくなった場合はエコーがその分返るので損失を大きく、音量が小さくなった場合はエコーの大きさが小さくなるので損失を小さくする、ということが可能となり、音質面の劣化が抑えられる。そのため、実施例3のような周波数ごとではなくなるものの、F(ω)による音声強調の影響に対処することができる。
【実施例8】
【0070】
図9に、受話音声の大きさを制御するようにしたこの発明の反響消去装置210の機能構成例を示す。反響消去装置210は、反響消去装置180に対して利得制御部90を備える点のみが異なる。
【0071】
利得制御部90は、受話損失挿入部71が出力する受話信号x(n)を入力として受話信号~x(n)をフィルタ部11に出力する。受話信号~x(n)は、受話音声x(n)のある区間(x(n-M+1)〜x(n),Mは2以上の整数)の二乗平均パワーをp(n)として、例えば次式で計算される。
【0072】
【数11】

【0073】
TVは所定の音量値である。この利得制御部90の動作によりフィルタ部11と合わせてより音声が聞き取り易くなる。音声のパワーが小さいところを大きくするのみなので、標準的な音量時と同等のエコー消去性能が得られ、エコーが返り易くなるというような欠点は発生しない。なお、図9に破線で示すように送話音声フラグfsと受話音声フラグfを、更に利得制御部90に入力し、送話状態の時に利得制御部90を動作させないようにしても良い。
【0074】
以上説明したようにこの発明の反響消去装置は、受話音声と雑音の周波数特性の違いに着目し、受話音声のうち大きな成分を維持もしくは影響がない範囲で減衰させて小さな成分に分配することで、エコーの返り易い周波数を大きく変えずに全周波数でのSN比を向上させることができる。フィルタ部が、雑音レベルとスピーカ音声レベルとの比が閾値以下の周波数に関しては受話信号を強調し、閾値以上の周波数に関しては受話信号を抑圧するので、受話信号の全ての周波数の音量を上げるよりも効率的に、受話信号を聞き取り易くすることができ、ハンズフリー送受話器に利用して好適な反響消去装置とその方法を提供することができる。
【0075】
なお、この発明の反響消去装置のフィルタ部11について、時間領域のフィルタである場合と、周波数毎のゲイン量F(ω)を受話信号X(ω)に乗算する場合の2つの例を示して説明を行ったが、どちらの技術思想も同じであり、同一の効果を奏する。上記した実施例はフィルタ部11を、前者を例で説明したが、何れの実施例もゲイン量F(ω)を乗算して受話信号のパワーを調整する後者の方法に代えても良い。
【0076】
上記装置における処理手段をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、各装置における処理手段がコンピュータ上で実現される。
【0077】
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(Digital Versatile Disc)、DVD-RAM(Random Access Memory)、CD-ROM(Compact Disc Read Only Memory)、CD-R(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto Optical disc)等を、半導体メモリとしてEEP-ROM(Electronically Erasable and Programmable-Read Only Memory)等を用いることができる。
【0078】
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD-ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記録装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
【0079】
また、各手段は、コンピュータ上で所定のプログラムを実行させることにより構成することにしてもよいし、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。

【特許請求の範囲】
【請求項1】
再生音制御部と反響消去部とから構成される反響消去装置であって、
再生音制御部は、
周波数領域の収音信号から擬似エコー信号を減した誤差信号を入力としてその誤差信号の雑音レベルを推定する雑音レベル推定部と、
受話信号を出力するためのスピーカの予め設定されたスピーカ特性と予め設定された音声の平均スペクトルの積で近似したスピーカ音声レベルを、上記雑音レベルで除したSN値と、上限雑音閾値Thigh(ω)と下限雑音閾値Tlow(ω)とをそれぞれ比較して、上記SN値が上記上限雑音閾値Thighより大きいとき受話信号を抑圧し、上記SN値が上記下限雑音閾値Tlowより小さいとき受話信号を強調するゲイン量F(ω)に基づいた時間領域のフィルタf(n)を出力する受話音声制御量生成部と、
受話端に入力される上記受話信号を上記時間領域のフィルタf(n)で畳み込み演算した信号レベル調整済み受話信号を出力するフィルタ部と、を備え、
反響消去部は、
上記信号レベル調整済み受話信号と、上記受話信号を出力するためのスピーカと上記収音信号を得るためのマイクロホンとの間の推定エコー経路^H(ω)とから上記擬似エコー信号を生成し、上記信号レベル調整済み受話信号と上記誤差信号とを用いて上記推定エコー経路^H(ω)を更新する適応フィルタ部と、
上記収音信号から上記擬似エコー信号を減じることで送話端に出力される送話信号となる上記誤差信号を生成する差信号生成部と、を備える
ことを特徴とする反響消去装置。
【請求項2】
再生音制御部と反響消去部とから構成される反響消去装置であって、
再生音制御部は、
周波数領域の収音信号から擬似エコー信号を減した誤差信号を入力としてその誤差信号の雑音レベルを推定する雑音レベル推定部と、
受話信号を出力するためのスピーカの予め設定されたスピーカ特性と予め設定された音声の平均スペクトルの積で近似したスピーカ音声レベルを、上記雑音レベルで除したSN値と、上限雑音閾値Thigh(ω)と下限雑音閾値Tlow(ω)とをそれぞれ比較して、上記SN値が上記上限雑音閾値Thighより大きいとき受話信号を抑圧し、上記SN値が上記下限雑音閾値Tlowより小さいとき受話信号を強調するゲイン量F(ω)を出力する受話音声制御量生成部と、
受話端に入力される上記受話信号に、上記ゲイン量F(ω)を乗じた信号レベル調整済み受話信号を出力するフィルタ部と、を備え、
反響消去部は、
上記信号レベル調整済み受話信号と、上記受話信号を出力するためのスピーカと上記収音信号を得るためのマイクロホンとの間の推定エコー経路^H(ω)とから上記擬似エコー信号を生成し、上記信号レベル調整済み受話信号と上記誤差信号とを用いて上記推定エコー経路^H(ω)を更新する適応フィルタ部と、
上記収音信号から上記擬似エコー信号を減じることで送話端に出力される送話信号となる上記誤差信号を生成する差信号生成部と、を備える
ことを特徴とする反響消去装置。
【請求項3】
請求項1又は2に記載の反響消去装置において、
上記上限雑音閾値Thigh(ω)と上記下限雑音閾値Tlow(ω)は、
Thigh(ω)/Mhigh(ω)の第2上限雑音閾値と、Tlow(ω)/Mlow(ω)の第2下限雑音閾値と、をそれぞれ有し、Mlow(ω)>1,Mhigh(ω)<1で且つMlow(ω)・H(ω)<1であり、H(ω)は予め定めたエコー経路であり、
上記SN値が上記第2上限雑音閾値よりも大きい場合にはゲイン量F(ω)をMhigh(ω)とし、
上記SN値が上記第2下限雑音閾値よりも小さい場合にはゲイン量Mlow(ω)とするものであることを特徴とする反響消去装置。
【請求項4】
請求項1乃至3の何れかに記載した反響消去装置において、
更に、
上記信号レベル調整済み受話信号と、上記誤差信号とを入力としてその両信号の音響結合量を推定する音響結合量推定部と、
上記音響結合量と上記ゲイン量F(ω)とによって調整された値に基づいて、上記誤差信号から送話信号を生成するノイズ・エコー抑圧部と、
を具備することを特徴とする反響消去装置。
【請求項5】
請求項3に記載した反響消去装置において、
上記予め定めたエコー経路H(ω)の代わりに、上記推定エコー経路^H(ω)を用いることを特徴とする反響消去装置。
【請求項6】
請求項1乃至5の何れかに記載した反響消去装置において、
上記受話音声制御量生成部は、上記予め設定された音声の平均スペクトルの代わりに、上記信号レベル調整済み受話信号の音声スペクトルを加算平均したものを用いるものであることを特徴とする反響消去装置。
【請求項7】
請求項1又は請求項3乃至6の何れかに記載した反響消去装置において、
上記ゲイン量F(ω)から時間領域のフィルタf(n)を次式に基づいて計算することを特徴とする反響消去装置。
【数12】

【請求項8】
請求項1又は請求項3乃至6の何れかに記載した反響消去装置において、
上記受話音声制御量生成部には、複数のFIRフィルタがゲイン量F(ω)に対応付けられて記憶されており、上記受話音声制御量生成部は、上記ゲイン量F(ω)を入力としてそのゲイン量F(ω)に対応するFIRフィルタを出力するものであることを特徴とする反響消去装置。
【請求項9】
請求項1又は請求項3乃至6の何れかに記載した反響消去装置において、
更に、
上記受話信号と上記送話信号を入力として送話音声の有無と受話音声の有無を表す送話音声フラグと受話音声フラグを、受話音声制御部に出力する送受話検出部を備え、
上記受話音声制御部は、上記送話音声フラグと上記受話音声フラグとを入力として、送話音声なしで且つ受話音声ありの場合にのみ上記時間領域のフィルタf(n)を出力するものであることを特徴とする反響消去装置。
【請求項10】
請求項2乃至6の何れかに記載した反響消去装置において、
更に、
上記受話信号と上記送話信号を入力として送話音声の有無と受話音声の有無を表す送話音声フラグと受話音声フラグを、受話音声制御部に出力する送受話検出部を備え、
上記受話音声制御部は、上記送話音声フラグと上記受話音声フラグとを入力として、送話音声なしで且つ受話音声ありの場合にのみ上記ゲイン量F(ω)を出力するものであることを特徴とする反響消去装置。
【請求項11】
請求項9又は10に記載した反響消去装置において、
更に、
上記送話端に損失量を挿入した送話信号を出力する送話損失挿入部とを備え、
上記送受話検出部は、上記ゲイン量F(ω)を入力として、上記ゲイン量F(ω)を重み付け平均した値に基づいて上記送話損失挿入部に挿入する損失量を算出することを特徴とする反響消去装置。
【請求項12】
再生音制御過程と反響消去過程とを有する反響消去方法であって、
再生音制御過程は、
周波数領域の収音信号から擬似エコー信号を減した誤差信号を入力としてその誤差信号の雑音レベルを推定する雑音レベル推定ステップと、
受話信号を出力するためのスピーカの予め設定されたスピーカ特性と予め設定された音声の平均スペクトルの積で近似したスピーカ音声レベルを、上記雑音レベルで除したSN値と、上限雑音閾値Thigh(ω)と下限雑音閾値Tlow(ω)とをそれぞれ比較して、上記SN値が上記上限雑音閾値Thighより大きいとき受話信号を抑圧し、上記SN値が上記下限雑音閾値Tlowより小さいとき受話信号を強調するゲイン量F(ω)に基づいた時間領域のフィルタf(n)を出力する受話音声制御量生成ステップと、
受話端に入力される上記受話信号を上記時間領域のフィルタf(n)で畳み込み演算した信号レベル調整済み受話信号を出力するフィルタステップと、を含み、
反響消去過程は、
上記信号レベル調整済み受話信号と、上記受話信号を出力するためのスピーカと上記収音信号を得るためのマイクロホンとの間の推定エコー経路^H(ω)とから上記擬似エコー信号を生成し、上記信号レベル調整済み受話信号と上記誤差信号とを用いて上記推定エコー経路^H(ω)を更新する適応フィルタステップと、
上記収音信号から上記擬似エコー信号を減じることで送話端に出力される送話信号となる上記誤差信号を生成する差信号生成ステップと、を含む
ことを特徴とする反響消去方法。
【請求項13】
再生音制御過程と反響消去過程とを有する反響消去方法であって、
再生音制御過程は、
周波数領域の収音信号から擬似エコー信号を減した誤差信号を入力としてその誤差信号の雑音レベルを推定する雑音レベル推定ステップと、
受話信号を出力するためのスピーカの予め設定されたスピーカ特性と予め設定された音声の平均スペクトルの積で近似したスピーカ音声レベルを、上記雑音レベルで除したSN値と、上限雑音閾値Thigh(ω)と下限雑音閾値Tlow(ω)とをそれぞれ比較して、上記SN値が上記上限雑音閾値Thighより大きいとき受話信号を抑圧し、上記SN値が上記下限雑音閾値Tlowより小さいとき受話信号を強調するゲイン量F(ω)を出力する受話音声制御量生成ステップと、
受話端に入力される上記受話信号に、上記ゲイン量F(ω)を乗じた信号レベル調整済み受話信号を出力するフィルタステップと、を含み、
反響消去過程は、
上記信号レベル調整済み受話信号と、上記受話信号を出力するためのスピーカと上記収音信号を得るためのマイクロホンとの間の推定エコー経路^H(ω)とから上記擬似エコー信号を生成し、上記信号レベル調整済み受話信号と上記誤差信号とを用いて上記推定エコー経路^H(ω)を更新する適応フィルタステップと、
上記収音信号から上記擬似エコー信号を減じることで送話端に出力される送話信号となる上記誤差信号を生成する差信号生成ステップと、を含む
ことを特徴とする反響消去方法。
【請求項14】
請求項12又は13に記載の反響消去方法において、
上記上限雑音閾値Thigh(ω)と上記下限雑音閾値Tlow(ω)は、
Thigh(ω)/Mhigh(ω)の第2上限雑音閾値と、Tlow(ω)/Mlow(ω)の第2下限雑音閾値と、をそれぞれ有し、Mlow(ω)>1,Mhigh(ω)<1で且つMlow(ω)・H(ω)<1であり、H(ω)は予め定めたエコー経路であり、
上記SN値が上記第2上限雑音閾値よりも大きい場合にはゲイン量F(ω)をMhigh(ω)とし、
上記SN値が上記第2下限雑音閾値よりも小さい場合にはゲイン量Mlow(ω)とするものであることを特徴とする反響消去方法。
【請求項15】
請求項14に記載した反響消去方法において、
上記予め定めたエコー経路H(ω)の代わりに、上記推定エコー経路^H(ω)を用いることを特徴とする反響消去方法。
【請求項16】
請求項12乃至15の何れかに記載した反響消去方法において、
上記受話音声制御量生成ステップは、上記予め設定された音声の平均スペクトルの代わりに、上記信号レベル調整済み受話信号の音声スペクトルを加算平均したものを用いるステップであることを特徴とする反響消去方法。
【請求項17】
請求項1乃至11の何れかに記載した反響消去装置としてコンピュータを機能させるためのプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate


【公開番号】特開2012−222389(P2012−222389A)
【公開日】平成24年11月12日(2012.11.12)
【国際特許分類】
【出願番号】特願2011−82571(P2011−82571)
【出願日】平成23年4月4日(2011.4.4)
【出願人】(000004226)日本電信電話株式会社 (13,992)
【Fターム(参考)】