説明

音声通信装置、方法及びプログラム

【課題】 残留エコー抑圧機能が過度に作用しても、通話品質を劣化させない音声通信装置を提供する。
【解決手段】 本発明の音声通信装置は、疑似エコーを生成して送話信号に含まれているエコー成分を除去するエコーキャンセラ本体と、当該エコーキャンセラ本体からの出力送話信号に含まれている残留エコー成分を抑圧する残留エコー成分抑圧手段とを有するエコーキャンセラを有する。また、送話信号から、背景雑音成分を抽出する背景雑音成分抽出手段と、エコーキャンセラから出力された送話信号に、抽出された背景雑音成分を重畳する雑音重畳手段とを有する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は音声通信装置、方法及びプログラムに関し、例えば、送受話路間で発生するエコーを消去するために用いるエコーキャンセラと送話マイクロフォンから入力されるノイズを消去するために用いるノイズキャンセラとを併用する場合に適用し得るものである。
【背景技術】
【0002】
電話通信網には、ハイブリッド回路(2線4線変換回路)で発生するエコー(回線エコー)や、電話端末のスピーカからマイクロフォンに回り込むエコー(音響エコー)を除去するために、適応型エコーキャンセラが広く用いられている。
【0003】
一般的に、エコーキャンセラは、適応フィルタを用いて、相手話者からの受話信号と、その受話信号のエコーが混じった送話信号を入力として、疑似エコーを生成し、送話信号から減算する方法が採られている。さらに、エコーキャンセラの機能の一部として、アッテネータやセンタークリッパ等を用いて、適応フィルタを用いて推定した疑似エコーによる減算処理で消し残ったエコーのレベルを非線形に抑圧する方法も併用されている(特許文献1参照)。
【0004】
また、エコーキャンセラとは別に、マイクロフォンから拾うノイズを除去するためにノイズキャンセラを有する音声通信装置もある。
【0005】
さらに、これらのエコーキャンセラとノイズキャンセラの両機能を有する音声通信装置がある(特許文献2参照)。このような両機能を有する音声通信装置は、ノイズキャンセラの挿入位置として、2つのパターンが考えられる。すなわち、ノイズを先にキャンセルした後に、エコーをキャンセルする音声通信装置と、エコーを先にキャンセルした後に、ノイズをキャンセルする音声通信装置とがある。
【0006】
ノイズを先にキャンセルした後に、エコーをキャンセルする音声通信装置のエコーキャンセラは、遠端入力(Rin)端からの受話信号と近端入力(Sin)端からの送話信号のノイズキャンセラ出力を入力とする。
【0007】
エコーを先にキャンセルした後に、ノイズをキャンセルする音声通信装置のエコーキャンセラは、Rin端からの受話信号とSin端からの送話信号を入力とする。エコーキャンセラの出力信号を、ノイズキャンセラの入力とする。
【先行技術文献】
【特許文献】
【0008】
【特許文献1】特開平8−32494
【特許文献2】特開2002−118504
【発明の概要】
【発明が解決しようとする課題】
【0009】
しかしながら、エコーキャンセラとノイズキャンセラを併用する場合、以下の課題を有するものであった。
【0010】
ノイズを先にキャンセルした後でエコーをキャンセルする場合には、ノイズをキャンセルするフィルタが時間によって変化するため、エコーを学習する際、ノイズキャンセラの影響が入って正確な学習ができないという課題がある。
【0011】
一方、エコーを先にキャンセルした後でノイズをキャンセルする場合には、エコーキャンセラが学習中はエコーキャンセラ出力に誤差が多く残り、ノイズキャンセラが、これを雑音又は音声と誤判断し、状態判定及びパラメータ推定に誤りが生ずる。
【0012】
特許文献2に記載の音声通信装置では、エコーキャンセラとノイズキャンセラ間でパラメータの受け渡すことで、エコー抑圧とノイズ抑圧の効果を向上させようとしている。しかし、エコーキャンセラの誤学習やノイズキャンセラの打ち消し誤りを防ぐことは不完全であり、通話品質に劣化が生じることがあった。
【0013】
本発明は、以上の点に鑑みなされたものであり、残留エコー抑圧機能が過度に作用しても、通話品質を劣化させることがない音声通信装置、方法及びプログラムを提供しようとしたものである。
【課題を解決するための手段】
【0014】
第1の本情報の音声通信装置は、(1)疑似エコーを生成して送話信号に含まれているエコー成分を除去するエコーキャンセラ本体と、当該エコーキャンセラ本体からの出力送話信号に含まれている残留エコー成分を抑圧する残留エコー成分抑圧手段とを有するエコーキャンセラと、(2)上記送話信号から、背景雑音成分を抽出する背景雑音成分抽出手段と、(3)上記エコーキャンセラから出力された送話信号に、上記背景雑音成分抽出手段が抽出した背景雑音成分を第1の所定倍して重畳する雑音重畳手段とを有することを特徴とする。
【0015】
第2の本発明の音声通信方法は、(1)エコーキャンセラのエコーキャンセラ本体は、疑似エコーを生成して送話信号に含まれているエコー成分を除去し、上記エコーキャンセラの残留エコー成分抑圧手段は、上記エコーキャンセラ本体からの出力送話信号に含まれている残留エコー成分を抑圧し、(2)背景雑音成分抽出手段は、上記送話信号から背景雑音成分を抽出し、(3)雑音重畳手段は、上記エコーキャンセラから出力された送話信号に、上記背景雑音成分抽出手段が抽出した背景雑音成分を第1の所定倍して重畳することを特徴とする。
【0016】
第3の本発明の音声通信プログラムは、コンピュータを、(1)疑似エコーを生成して送話信号に含まれているエコー成分を除去するエコーキャンセラ本体と、当該エコーキャンセラ本体からの出力送話信号に含まれている残留エコー成分を抑圧する残留エコー成分抑圧手段とを有するエコーキャンセラと、(2)上記送話信号から、背景雑音成分を抽出する背景雑音成分抽出手段と、(3)上記エコーキャンセラから出力された送話信号に、上記背景雑音成分抽出手段が抽出した背景雑音成分を第1の所定倍して重畳する雑音重畳手段として機能させることを特徴とする。
【発明の効果】
【0017】
本発明によれば、残留エコー抑圧機能が過度に作用した期間に背景雑音成分を重畳できるので、その期間の通話品質が劣化することを防止できるようになる。
【図面の簡単な説明】
【0018】
【図1】第1の実施形態に係る音声通信装置の構成を示すブロック図である。
【図2】第1の実施形態におけるノイズ抽出部の構成例を示すブロック図である。
【図3】第1の実施形態における、背景雑音(ノイズ)のレベルが大きい状況下での遠端話者によるシングルトーク状態前後の各部信号波形図である。
【図4】第2の実施形態に係る音声通信装置の構成を示すブロック図である。
【発明を実施するための形態】
【0019】
(A)第1の実施形態
以下、本発明に係る音声通信装置、方法及びプログラムの第1の実施形態を、図面を参照しながら詳述する。
【0020】
(A−1)第1の実施形態の構成
図1は、第1の実施形態に係る音声通信装置の構成を示すブロック図である。例えば、第1の実施形態の音声通信装置がソフトフォンであって、CPUと、CPUが実行するプログラム(第1の実施形態の音声通信プログラム)で実現される場合であっても、機能的には、図1の機能ブロック図で表すことができる。
【0021】
図1において、第1の実施形態の音声通信装置1は、電話端末のスピーカ2からマイクロフォン3に回り込む音響エコーを消去するためのエコーキャンセラ4を有する音声通信装置である。なお、図1に示す第1の実施形態のエコーキャンセラ4は、音響エコーを消去するものになっているが、電話通信網に存在するハイブリッド回路で発生する回線エコーを消去するものであっても良い。
【0022】
第1の実施形態のエコーキャンセラ4は、適応フィルタ101、減算器102及びアッテネータ103を有する。
【0023】
適応フィルタ101は、スピーカ2からマイクロフォン3へ回り込むエコーのインパルス応答を推定し、疑似エコーを生成するものである。
【0024】
減算器102は、マイクロフォン3が捕捉した送話信号から、適応フィルタ101によって生成された疑似エコーを減算することにより、音声通信装置1が送信する送話信号からエコー成分を消去するものである。
【0025】
アッテネータ103は、減算器102から出力された送話信号における、消去し切れなかったエコー成分のレベルを減衰するものである。アッテネータ103は、近端からマイクロフォン3へ近端話者の音声信号が入力されることがなく、遠端話者の音声信号を受信してスピーカ2に遠端話者の音声信号が出力されている状態(遠端話者のシングルトーク状態)のときに動作するものである。
【0026】
なお、図1では、消去し切れなかったエコー成分のレベルを減衰するものとして、アッテネータ103を適用したものを示したが、他の構成によって、消去し切れなかったエコー成分のレベルを減衰するようにしても良い。例えば、アッテネータ103に代えて、センタークリッパを適用することができる。
【0027】
ここで、マイクロフォン3が拾う背景雑音のレベルが高い場合には、アッテネータ103は、消し残りのエコー成分のみならずその背景雑音まで除去してしまう。このような背景雑音の除去によって、相手通話者には、音声が途切れるように聴こえ、通話に違和感が生まれることになる。また、遠端話者及び近端話者の音声信号がない区間における、マイクロフォン3が拾う背景雑音のレベルがアッテネータ103の抑圧動作が働かないレベルである場合には、アッテネータ103からは背景雑音が出力される。
【0028】
第1の実施形態の場合、背景雑音に対する処理を、近端話者が選択し得るようになされている。例えば、近端話者は遠端話者から希望を聴き取り、背景雑音に対する処理を選択する。
【0029】
図1において、第1の実施形態の音声通信装置1は、背景雑音に対する処理構成として、ノイズ抽出部104、レベル可変器105、加算器106、レベル可変器107、減算器108、スイッチ109及び110を有する。ここで、ノイズ抽出部104、レベル可変器107及び減算器108は、ノイズキャンセラを構成している。
【0030】
ノイズ抽出部104には、マイクロフォン3が捕捉して得た信号が入力され、ノイズ抽出部104は、その信号に基づいてノイズ(背景雑音)成分を生成(抽出)するものである。ノイズ抽出部104として、既存のノイズキャンセラにおけるノイズ成分の抽出構成を適用することができる。図2は、ノイズ抽出部104の構成例を示すブロック図である。なお、図2では、FFT(Fast Fourier Transform)を用いた周波数領域での方式の例を挙げたが、この方式に限るものではない。
【0031】
図2において、ノイズ抽出部104は、窓関数処理部111、FFT処理部112、抑圧器113、IFFT処理部114及び窓関数オーバーラップ部115を有する。
【0032】
窓関数処理部111は、マイクロフォン3が捕捉して得た信号を入力し、窓関数処理によって、FFT処理の分析区間データを切り出すものである。
【0033】
FFT処理部112は、窓関数処理部111から出力された実時間領域データを入力とし、FFT処理によって、その時間信号をFFTポイント数個の周波数領域データに変換するものである。
【0034】
抑圧器113は、FFT処理部112から出力された周波数領域データを入力とし、ノイズ成分を抑圧せずに音声成分のみを抑圧し、ノイズ成分のみの周波数領域データを出力するものである。
【0035】
IFFT処理部114は、抑圧器113によってノイズ成分だけとなった周波数領域データを入力し、逆FFT処理によって、周波数領域データから実時間領域データに逆変換するものである。
【0036】
窓関数オーバーラップ部115は、切り出されている状態のデータを連続するデータにつなぎ合わせて出力するものである。
【0037】
スイッチ109及び110は、ユーザ(近端話者)の操作に応じて択一的かつ相補的にオン動作するものである。
【0038】
スイッチ109は、例えば、アッテネータ103によって非線形に減衰された信号部分に対し、ノイズを付加し、信号の途切れによる通話の違和感を解消したい場合にオンにされるものである。スイッチ109のオン時には、レベル可変器105及び加算器106が有効に機能する。
【0039】
レベル可変器105は、スイッチ109のオン時に、ノイズ抽出部104によって抽出されたノイズ成分のレベルを可変して加算器106に与えるものである。レベル可変器105は、ユーザ(近端話者)の操作に応じて、可変利得を変化させるものである。
【0040】
加算器106は、アッテネータ103から出力された信号に、レベル可変器105から出力されたノイズ成分を加算するものである。なお、加算器106は、スイッチ110のオン時には、アッテネータ103から出力された信号をそのまま通過させるものとなっている。
【0041】
スイッチ110は、例えば、アッテネータ103による減衰がなされないとき(遠端話者のシングルトーク状態でないとき)、ノイズを減算するノイズキャンセラとして動作させ、ノイズによる音質劣化を解消したい場合にオンにされるものである。
【0042】
レベル可変器107は、スイッチ110のオン時に、ノイズ抽出部104によって抽出されたノイズ成分のレベルを可変して減算器108に与えるものである。レベル可変器107は、ユーザ(近端話者)の操作に応じて、可変利得を変化させるものである。
【0043】
減算器108は、アッテネータ103から出力された信号から、レベル可変器107から出力されたノイズ成分を減算するものである。なお、減算器108は、スイッチ109のオン時には、加算器106から出力された信号をそのまま通過させるものとなっている。
【0044】
(A−2)第1の実施形態の動作
次に、第1の実施形態に係る音声通信装置1の動作を、スイッチ109のオン時の動作、スイッチ110のオン時の動作の順に、説明する。
【0045】
背景雑音(ノイズ)のレベルが大きく、アッテネータ103による減衰によって、背景雑音までが大きく抑圧され、遠端話者への信号に途切れが生じ、遠端話者が通話の違和感を抱くような状況では、ユーザ(近端話者)は、スイッチ109をオン操作する。
【0046】
このときには、マイクロフォン3が捕捉して得た信号からノイズ抽出部104によって抽出されたノイズ成分が、スイッチ109を介してレベル可変器105に与えられ、そのレベルが調整される。このようにして調整されたノイズ成分が、加算器105によって、アッテネータ103から出力された信号に加算される。この加算により、アッテネータ103から出力された信号に途切れがあったとしても、その途切れがなくなり、信号の途切れによる通話の違和感を解消することができる。
【0047】
図3は、背景雑音(ノイズ)のレベルが大きい状況における、遠端話者のシングルトーク状態前後の各部の信号波形を示している。マイクロフォン3が捕捉した信号は、図3(A)に示すように、エコー成分と背景雑音(ノイズ)とが重畳されたものとなっている。疑似エコーを利用したエコーの除去動作を経ても、背景雑音(ノイズ)のレベルが大きく適応フィルタの101のフィルタ係数の収束性などが悪いと、図3(B)に示すように、残留エコーにノイズが重畳した信号が減算器102から出力される。アッテネータ103の非線形な抑圧特性により、残留エコーが大きい区間で大きく抑圧され、アッテネータ103からの出力信号は、図3(C)に示すように、一部区間でノイズも有効な信号成分も存在しないようになる。このようなアッテネータ103からの出力信号に、ノイズ抽出部104によって抽出され、レベル可変器105によってレベル調整されたノイズを、加算器106で加算することにより、当該音声通信装置1からは、図3(D)に示すような概ねレベル調整されたノイズだけを含む信号が、遠端側に送信される。
【0048】
アッテネータ103の動作が背景雑音(ノイズ)の途切れを生じさせない場合には、ノイズキャンセラを有効に機能させるべく、ユーザ(近端話者)は、スイッチ110をオン操作する。
【0049】
遠端話者の音声信号も近端話者の音声信号も存在しない状態や、遠端話者の音声信号だけが存在する状態においては、アッテネータ103からの出力信号は、概ね背景雑音(ノイズ)だけを含むものとなっている。
【0050】
スイッチ110のオンによって、マイクロフォン3が捕捉して得た信号からノイズ抽出部104によって抽出されたノイズ成分が、スイッチ110を介してレベル可変器107に与えられ、そのレベルが調整される。このようにして調整されたノイズ成分が、減算器108によって、アッテネータ103から出力された信号から減算され、これにより、当該音声通信装置1からは、ノイズが除去された信号が遠端側に送信される。
【0051】
なお、ノイズキャンセラとして動作させる際の各部信号波形図は、従来のノイズキャンセラのものと同様であるので、その図示は省略する。
【0052】
(A−3)第1の実施形態の効果
第1の実施形態によれば、エコーキャンセラとして、アッテネータやセンタークリッパなどの残留エコーを抑圧する補器を有するものを適用した場合でも、大きなエコー消去量を確保しつつ途切れ感の少ない通話を可能とすることができる。
【0053】
また、ユーザの選択によっては、途切れ感の補償に代え、ノイズ除去に重みをおいた動作を実行させることもできる。
【0054】
(B)第2の実施形態
次に、本発明に係る音声通信装置、方法及びプログラムの第2の実施形態を、図面を参照しながら詳述する。
【0055】
図4は、第2の実施形態に係る音声通信装置の構成を示すブロック図であり、第1の実施形態に係る図1との同一、対応部分には同一、対応符号を付して示している。
【0056】
第1の実施形態ではスイッチ109及び110はユーザ(近端話者)が手動操作するものであったが、この第2の実施形態の音声通信装置1Aでは、スイッチ制御回路120がスイッチ109及び110のオンオフ状態を制御する。
【0057】
スイッチ制御回路120は、例えば、(1)適応フィルタ101が適応動作を開始した時点から所定時間の間(若しくは収束したと捉えられるまで)、(2)受話信号だけがあるシングルトーク状態においてアッテネータ103への入力レベルの平均レベルが所定閾値を越えているとき、(3)アッテネータ103に設定されているアッテネート量が大きい(例えば6dB)ときに、スイッチ109をオンさせ、(1)〜(3)以外ではスイッチ110をオンさせる。
【0058】
このようなスイッチ109及び110に対する制御を除けば、第2の実施形態の構成及び動作は、第1の実施形態と同様である。
【0059】
第2の実施形態によっても、残留エコーを抑圧する補器を有するものを適用した場合でも、大きなエコー消去量を確保しつつ途切れ感の少ない通話を可能とすることができ、しかも、途切れ感の補償に代え、ノイズ除去に重みをおいた動作を実行させることもできる。
【0060】
第2の実施形態によれば、このような種類の動作モードを自動的に設定することができるという効果を奏することができる。
【0061】
(C)他の実施形態
上記各実施形態の説明においても、種々変形実施形態に言及したが、さらに、以下に例示するような変形実施形態を挙げることができる。
【0062】
上記各実施形態では、残留エコーを抑圧する補器の機能のために途切れ感が生じることを補償する構成に加え、ノイズキャンセラの構成を備える音声通信装置を示したが、ノイズキャンセラ構成をも備えないように音声通信装置を構成しても良い。
【0063】
また、上記各実施形態では、途切れ感が生じることを補償する構成と、ノイズキャンセラの構成との切換えを瞬間的に行うものを示したが、徐々に切り替えるようにしても良い。例えば、有効に動作していた一方のレベル可変器105又は107の利得を徐々に小さくしていくと共に、無効となっていた他方のレベル可変器107又は105の利得を徐々に大きくしていくことで切り替えるようにしても良い。
【0064】
さらに、上記各実施形態では、スイッチ109及び110が、択一的かつ相補的にオン動作するものを示したが、同時にオンするものでなければ良い。例えば、第2の実施形態の変形例として、スイッチ109をオンしない期間に常にスイッチ110をオンするのに代え、スイッチ109をオンしない期間で、しかも、受話音声がなく、ノイズパワーが所定の閾値以上のときだけスイッチ110をオンするようにしても良い。
【0065】
上記実施形態の電話通信装置が適用される装置は、電話端末に限定されるものではなく、PBXなどであっても良い。
【符号の説明】
【0066】
1、1A…音声通信装置、4…エコーキャンセラ、104…ノイズ抽出部、105、107…レベル可変器、106…加算器、108…減算器、109、110…スイッチ、120…スイッチ制御回路。

【特許請求の範囲】
【請求項1】
疑似エコーを生成して送話信号に含まれているエコー成分を除去するエコーキャンセラ本体と、当該エコーキャンセラ本体からの出力送話信号に含まれている残留エコー成分を抑圧する残留エコー成分抑圧手段とを有するエコーキャンセラと、
上記送話信号から、背景雑音成分を抽出する背景雑音成分抽出手段と、
上記エコーキャンセラから出力された送話信号に、上記背景雑音成分抽出手段が抽出した背景雑音成分を第1の所定倍して重畳する雑音重畳手段と
を有することを特徴とする音声通信装置。
【請求項2】
上記エコーキャンセラから出力された送話信号から、上記背景雑音成分抽出手段が抽出した背景雑音成分を第2の所定倍して除去する雑音除去手段と
上記雑音重畳手段及び上記雑音除去手段の多くても一方だけを有効にさせる雑音処理選択手段と
をさらに備えることを特徴とする音声通信装置。
【請求項3】
エコーキャンセラのエコーキャンセラ本体は、疑似エコーを生成して送話信号に含まれているエコー成分を除去し、上記エコーキャンセラの残留エコー成分抑圧手段は、上記エコーキャンセラ本体からの出力送話信号に含まれている残留エコー成分を抑圧し、
背景雑音成分抽出手段は、上記送話信号から背景雑音成分を抽出し、
雑音重畳手段は、上記エコーキャンセラから出力された送話信号に、上記背景雑音成分抽出手段が抽出した背景雑音成分を第1の所定倍して重畳する
ことを特徴とする音声通信方法。
【請求項4】
雑音除去手段は、上記エコーキャンセラから出力された送話信号から、上記背景雑音成分抽出手段が抽出した背景雑音成分を第2の所定倍して除去し、
雑音処理選択手段は、上記雑音重畳手段及び上記雑音除去手段の多くても一方だけを有効にさせる
ことを特徴とする音声通信方法。
【請求項5】
コンピュータを、
疑似エコーを生成して送話信号に含まれているエコー成分を除去するエコーキャンセラ本体と、当該エコーキャンセラ本体からの出力送話信号に含まれている残留エコー成分を抑圧する残留エコー成分抑圧手段とを有するエコーキャンセラと、
上記送話信号から、背景雑音成分を抽出する背景雑音成分抽出手段と、
上記エコーキャンセラから出力された送話信号に、上記背景雑音成分抽出手段が抽出した背景雑音成分を第1の所定倍して重畳する雑音重畳手段と
して機能させることを特徴とする音声通信プログラム。
【請求項6】
コンピュータをさらに、
上記エコーキャンセラから出力された送話信号から、上記背景雑音成分抽出手段が抽出した背景雑音成分を第2の所定倍して除去する雑音除去手段と
上記雑音重畳手段及び上記雑音除去手段の多くても一方だけを有効にさせる雑音処理選択手段と
して機能させることを特徴とする請求項5に記載の音声通信プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate


【公開番号】特開2010−239243(P2010−239243A)
【公開日】平成22年10月21日(2010.10.21)
【国際特許分類】
【出願番号】特願2009−82733(P2009−82733)
【出願日】平成21年3月30日(2009.3.30)
【出願人】(000000295)沖電気工業株式会社 (6,645)
【Fターム(参考)】