説明

音声通信システム及び音声通信装置

【課題】通信ネットワークを介して音声通信を行う際に、自端末から送信した音声データが相手側端末で正常に再生されているかを確認することができるとともに、各拠点の音響状態(エコー抑圧)が正常か否かを遠隔地から確認可能にする技術を提供する。
【解決手段】端末10のエコーキャンセル部15は、メモリ23に記憶されたフィルタ係数を用いて、マイクロホン11で収音された音声を表す音声データに対してエコーキャンセル処理を行う。エコーキャンセル部15の適応フィルタは、外部から供給されるリセット信号によって初期化される。リセット信号を外部から受信すると、通信/制御部16は、メモリ23に記憶されたフィルタ係数の値を予め定められた初期設定値に書き換える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音声通信システム及び音声通信装置に関する。
【背景技術】
【0002】
近年、通信ネットワークを介して接続された複数の通信端末を用いて会議を行う遠隔会議システムが普及している。特許文献1には、ネットワークを介して接続された複数の拠点同士で音声データを送受信する音声会議システムにおいて、ネットワークを介して接続された他の拠点(自拠点)から伝送された入力音声のエコーの音声信号を他の拠点に送り返すことにより、送り返された他の拠点にて、相手拠点において期待する明瞭な音声品質で再生されているかを確認することができる技術が提案されている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2007−274176号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、特許文献1に記載の技術では、音響エコーキャンセラのON/OFFの両経路を設ける必要があり、従来の装置よりも装置構成が複雑になってしまうという問題がある。また、特許文献1に記載の技術では、音響エコーキャンセラがONしている状況の確認は可能だが適応していく過程は確認出来ないため必要十分かどうかの確認はできない。
本発明は上述した背景に鑑みてなされたものであり、通信ネットワークを介して音声通信を行う際に、自端末から送信した音声データが、相手側端末で正常に再生されているかを確認することができるとともに、各拠点の音響状態(エコー抑圧)が正常か否かを遠隔地から確認可能にする技術を提供することを目的とする。
【課題を解決するための手段】
【0005】
上記課題を解決するために、本発明は、第1の端末と、該第1の端末と通信ネットワークを介して接続された第2の端末とを有する音声通信システムであって、前記第1の端末は、前記第2の端末から音声データを受信する音声データ受信手段と、前記音声データ受信手段により受信された音声データが示す音声を放音する放音手段と、該第1の端末の周囲の音声を収音する収音手段と、前記音声データ受信手段により受信された音声データに基づき擬似エコー信号を生成する適応フィルタと、前記収音手段によって収音された音声を表す音声データから該擬似エコー信号を減算する減算部とを備えたエコーキャンセル手段と、前記適応フィルタの係数を記憶するフィルタ係数記憶手段と、前記エコーキャンセル手段によってエコーキャンセル処理を施された音声データを、前記第2の端末に対して送信する音声データ送信手段と、前記第2の端末からリセット信号を受信するリセット信号受信手段と、前記リセット信号受信手段によって前記リセット信号が受信されたときに、前記フィルタ係数記憶手段に記憶されたフィルタ係数の値を、予め定められた初期設定値に書き換えるフィルタ係数リセット手段と、前記第2の端末から前記エコーキャンセル処理の処理態様を示す制御信号を受信する制御信号受信手段と、前記制御信号受信手段によって前記制御信号が受信されたときに、該受信された制御信号の示す処理態様でエコーキャンセル処理を行うように前記エコーキャンセル手段を制御するエコーキャンセル制御手段とを具備し、前記第2の端末は、残響状況とエコーキャンセル処理の処理態様との対応関係を記憶する対応関係記憶手段と、前記第1の端末に対して前記リセット信号を送信するリセット信号送信手段と、前記第1の端末に対して音声データを送信する送信手段と、前記第1の端末から音声データを受信する受信手段と、前記受信手段により受信された音声データと前記送信手段によって送信された音声データとを用いて、前記第1の端末が設置された空間における残響状況を検出する残響状況検出手段と、前記対応関係記憶手段に記憶された対応関係に基づいて、前記残響状況検出手段によって検出された残響状況に対応する処理の処理態様を特定する特定手段と、前記特定手段によって特定された処理態様を示す制御信号を、前記第1の端末に送信する制御信号送信手段とを具備することを特徴とする音声通信システムを提供する。
【0006】
また、本発明は、残響状況とエコーキャンセル処理の処理態様との対応関係を記憶する対応関係記憶手段と、通信ネットワークを介して接続された端末に対してリセット信号を送信するリセット信号送信手段と、前記端末に対して音声データを送信する音声データ送信手段と、前記端末から音声データを受信する音声データ受信手段と、前記音声データ受信手段により受信された音声データと前記音声データ送信手段によって送信された音声データとを用いて、前記端末が設置された空間における残響状況を検出する残響状況検出手段と、前記対応関係記憶手段に記憶された対応関係に基づいて、前記残響状況検出手段によって検出された残響状況に対応する処理態様を特定し、特定した処理態様を示す制御信号を、前記端末に送信する制御信号送信手段とを具備することを特徴とする音声通信装置を提供する。
【0007】
本発明の好ましい態様において、前記対応関係記憶手段は、適応フィルタの収束時間とエコーキャンセル処理の処理態様との対応関係を記憶し、前記残響状況検出手段は、前記音声データ受信手段により受信された音声データと前記音声データ送信手段によって送信された音声データとを用いて、前記端末における適応フィルタの収束に要した時間を計測してもよい。
【0008】
また、本発明の更に好ましい態様において、前記対応関係記憶手段は、残響状況とフィルタ係数との対応関係を記憶し、前記制御信号送信手段は、前記対応関係記憶手段に記憶された対応関係に基づいて、前記残響状況検出手段によって検出された残響状況に対応するフィルタ係数を特定し、特定したフィルタ係数を前記端末へ送信してもよい。
【0009】
また、本発明の更に好ましい態様において、前記対応関係記憶手段は、残響状況とサプレッサのパラメータとの対応関係を記憶し、前記制御信号送信手段は、前記対応関係記憶手段に記憶された対応関係に基づいて、前記残響状況検出手段によって検出された残響状況に対応するパラメータを特定し、特定したパラメータを前記端末へ送信してもよい。
【0010】
また、本発明の更に好ましい態様において、前記残響状況検出手段によって検出された残響状況を報知する報知手段を具備してもよい。
【0011】
また、本発明の更に好ましい態様において、音声データを記憶する音声データ記憶手段を具備し、前記音声データ送信手段は、前記音声データ記憶手段に記憶された音声データを前記端末に対して送信してもよい。
また、前記音声データ送信手段は、収音手段によって収音された音声を表す音声データを前記端末に対して送信してもよい。
【0012】
また、本発明は、エコーキャンセル処理を行う際に用いられるフィルタ係数を記憶するフィルタ係数記憶手段と、通信ネットワークを介して接続された端末から音声データを受信する音声データ受信手段と、前記音声データ受信手段により受信された音声データが示す音声を放音する放音手段と、周囲の音声を収音する収音手段と、前記音声データ受信手段により受信された音声データに基づき擬似エコー信号を生成する適応フィルタと、前記収音手段によって収音された音声を表す音声データから該擬似エコー信号を減算する減算部を備えたエコーキャンセル手段と、前記エコーキャンセル手段によってエコーキャンセル処理を施された音声データを、前記端末に対して送信する音声データ送信手段と、前記端末からリセット信号を受信するリセット信号受信手段と、前記リセット信号受信手段によって前記リセット信号が受信されたときに、前記フィルタ係数記憶手段に記憶されたフィルタ係数の値を、予め定められた初期設定値に書き換えるフィルタ係数リセット手段と、前記端末から前記エコーキャンセル処理の処理態様を示す制御信号を受信する制御信号受信手段と、前記制御信号受信手段によって前記制御信号が受信されたときに、該受信された制御信号の示す処理態様でエコーキャンセル処理を行うように前記エコーキャンセル手段を制御するエコーキャンセル制御手段とを具備することを特徴とする音声通信装置を提供する。
【0013】
本発明の好ましい態様において、前記エコーキャンセル制御手段は、前記フィルタ係数記憶手段に記憶されたフィルタ係数の値を、前記制御信号受信手段によって受信された制御信号の示すフィルタ係数の値に書き換えてもよい。
【0014】
また、本発明の更に好ましい態様において、前記エコーキャンセル処理を施された音声データに対して、設定されたパラメータに従って音響処理を施すサプレッサを具備し、前記エコーキャンセル制御手段は、前記制御信号受信手段によって受信された制御信号の示すパラメータを前記サプレッサに設定してもよい。
【発明の効果】
【0015】
本発明によれば、通信ネットワークを介して音声通信を行う際に、自端末から送信した音声データが、相手側端末で正常に再生されているかを確認することができるとともに、各拠点の音響状態(エコー抑圧)が正常か否かを遠隔地から確認することができる。
【図面の簡単な説明】
【0016】
【図1】遠隔会議システムの構成の一例を示すブロック図である。
【図2】端末の構成の一例を示すブロック図である。
【図3】パラメータテーブルの内容の一例を示す図である。
【図4】端末が行う処理の流れを示すフローチャートである。
【発明を実施するための形態】
【0017】
<A:構成>
図1は、この発明の一実施形態である遠隔会議システム1の構成を示すブロック図である。この遠隔会議システム1は、各地に設置された複数の端末10a,10b,10c…が、インターネット等の通信ネットワーク100に接続されて構成される。なお、以下の説明においては、説明の便宜上、端末10a,10b,10c…を各々区別する必要がない場合には、これらを「端末10」と称して説明する。遠隔会議の参加者が端末10を用いて音声通信を行うことで、遠隔会議が実現される。
【0018】
図2は、端末10の構成の一例を示す図である。図において、マイクロホン11−1,11−2,…,11−16はそれぞれ、会議に参加している者(以下「参加者」という)の音声を収音し、収音した音声を表す音声信号(アナログ信号)を出力する収音手段である。マイクロホン11−1,11−2,…,11−16のそれぞれから出力される音声信号は、アンプ12−1,12−2,…,12−16にそれぞれ出力される。アンプ12−1,12−2,…,12−16は、マイクロホン11−1,11−2,…,11−16から出力される音声信号を増幅し、A/Dコンバータ13−1,13−2,…,13−16に出力する。A/Dコンバータ13−1,13−2,…,13−16はそれぞれ、アンプ12−1,12−2,…,12−16から出力される音声信号をデジタル信号に変換する。以下の説明では、説明の便宜上、マイクロホン11−1,11−2,…,11−16を各々区別する必要がない場合には、これらを「マイクロホン11」と称して説明する。同様に、アンプ12−1,12−2,…,12−16を各々区別する必要がない場合には、これらを「アンプ12」と称して説明する。また、A/Dコンバータ13−1,13−2,…,13−16を各々区別する必要がない場合にはこれらを「A/Dコンバータ13」と称して説明する。
【0019】
マイク信号処理部14は、A/Dコンバータ13−1,13−2,…13−16のそれぞれから出力される音声信号に対して、例えば遅延処理を施した後に加算する(遅延和)などの処理をすることにより、指向性特性を示すマイク信号MBを生成する。マイク信号処理部14は生成したマイク信号MBをエコーキャンセル部15に送信する。
【0020】
エコーキャンセル部15は、音響エコーをキャンセルするための機能を有する。音響エコーは、スピーカから放音された音がマイクロホンに回り込む音響帰還により生じるエコーである。スピーカからマイクロホンへのエコーの伝播には、直接伝播する経路以外に、室内の壁や話者で反射する経路がある。音響エコーは、継続時間が長くスピーカやマイクロホンの移動など音響空間の変化により急激に特性が変化することが特徴である。エコーキャンセル部15は、通信/制御部16により制御されるリセット信号によって、適応フィルタ151の学習結果をリセットする。このとき通信/制御部16はリセット信号受信手段およびフィルタ係数リセット手段としての動作を行う。
【0021】
通信/制御部16は、通信ネットワーク100と接続され遠隔地にある他の端末10との間で音声データを相互にやりとりする。すなわち、通信/制御部16は音声データ受信手段および音声データ送信手段としての機能も有する。操作部17は、利用者の操作内容に応じた信号を出力する。通信/制御部16は、操作部17から供給される信号に応じて制御動作を実施する。
また通信/制御部16は、他の端末10からエコキャン制御信号を受信すると、受信したパラメータに応じて、エコーサプレッサ22のゲイン又は適応フィルタ151のフィルタ係数を更新する。このとき通信/制御部16は制御信号受信手段及びエコーキャンセル制御手段としての動作を行う。他の端末10から受信したデータが音声データであるか、リセット信号であるか、エコキャン制御信号であるかの判断は、受信データに含まれるヘッダにより行う。
【0022】
スピーカ18−1,18−2,…,18−16は、供給されるスピーカ駆動信号に応じて放音する放音手段である。スピーカ信号処理部19は、遠隔地から送信された音声信号から各スピーカ駆動信号を生成する。指向性制御を行う場合には、スピーカ毎に最適な遅延処理を実施し各D/Aコンバータ20−1,20−2,…20−16に出力する。D/Aコンバータ20−1,20−2,…,20−16は、スピーカ信号処理部19から供給される音声データをアナログ信号に変換し、アンプ21−1,21−2,…21−16に供給する。アンプ21−1,21−2,…21−16はそれぞれ、D/Aコンバータ20−1,20−2,…20−16から供給される音声信号を増幅し、スピーカ18−1,18−2,…,18−16に供給する。以下の説明では、説明の便宜上、スピーカ18−1,18−2,…,18−16を各々区別する必要がない場合には、これらを「スピーカ18」と称して説明する。同様に、アンプ21−1,21−2,…,21−16を各々区別する必要がない場合には、これらを「アンプ21」と称して説明する。また、D/Aコンバータ20−1,20−2,…,20−16を各々区別する必要がない場合にはこれらを「D/Aコンバータ20」と称して説明する。なお、図2に示す例では、16個のマイクロホンを有するアレイマイクと16個のスピーカによるアレイスピーカを示しているが、スピーカ及びマイクロホンの数は16に限定されるものではなく、これより多くても少なくてもよい。
【0023】
エコーサプレッサ22は、設定されたパラメータに従ってエコーキャンセル部15が出力する信号に音響処理を施して通信/制御部16に出力する。メモリ23には、テスト音声データと、フィルタ係数と、パラメータテーブルとが記憶されている。テスト音声データは、端末10が通信・残響確認処理を行う際に用いられる音声データである。テスト音声データの表す音は高い周波数(例えば3kHz)が好適であるが、後述する残響特性の測定を行うのに適切な音響特性を有していれば良い。
【0024】
フィルタ係数は、端末10がエコーキャンセル処理を行う際に用いられるパラメータである。エコーキャンセル部15は、他の端末10から受信される音声データを、フィルタ係数によりフィルタリングすることにより擬似エコーZを生成し、生成した擬似エコーZをマイク信号MBから差し引くことによってエコーキャンセル処理を行う。
【0025】
次に、メモリ23に記憶されたパラメータテーブルについて説明する。図3に示すように、パラメータテーブルには音響エコーの消去機能を最適化するためのパラメータが収束時間に対応付けて書き込まれている。本実施形態においては、音響エコーの消去機能を最適化するためのパラメータとして、ゲインスペクトルデータが対応付けられている。すなわち、収束時間tが 0≦t<TaのときゲインスペクトルA(f)が対応づけられ、Ta≦t<TbのときゲインスペクトルB(f)が対応付けられ、Tb≦t<TcのときゲインスペクトルC(f)が対応付けられている。ただし、Ta<Tb<Tcである。ゲインスペクトルパラメータは、エコーサプレッサ22が音響エコー成分を除去する際に用いるパラメータである。ゲインスペクトルは、特定の周波数帯域で定義される利得(ゲイン)のスペクトルである。該ゲインスペクトルにおいては、入力される信号に対して、通すべき信号(話者の発言)に由来する周波数成分については高い値が、除去すべき信号(エコーに由来する信号)については低い値が設定されている。エコーサプレッサ22は、FFT処理された音声信号(スペクトル)と設定されたゲインスペクトルを乗算して周波数特性を変化させる。図3のゲインスペクトルデータは、定義された特定の周波数帯域内の任意の周波数fにおいて、A(f)≧B(f)≧C(f)となっている。したがって図3の場合は、収束時間が長いほどエコーサプレッサ22のゲインは小さくなり、音声信号の減衰量が大きくなる。これにより、エコーキャンセル部15によるエコーの消し残しをエコーサプレッサ22で減衰させる効果を奏する。
【0026】
以下、エコーキャンセル部15における音声信号の流れについて、図2を用いて説明する。他の端末10から通信ネットワーク100を介して送信された音声データは、通信/制御部16で受信される。受信された音声データはスピーカ信号処理部19に供給されるとともに、適応フィルタ151に供給される。適応フィルタ151は、フィルタ係数を用いて受信された音声データをフィルタリングすることにより擬似エコーZを生成し、生成した擬似エコーZを加算器152へ出力する。適応フィルタ151は、複数の構成単位(タップ)が組み合わされて成り、各タップは単位遅延素子及び乗算器から成る。単位遅延素子は、供給される音声信号を1単位時間だけ遅延させる。各乗算器には時変のフィルタ係数Wn(k)(括弧内は、時刻kであることを示す。以下同様)が設定されている。入力された音声信号は、適応フィルタにて積和演算され、該演算結果が擬似エコーZとして生成される。すなわち、擬似エコーZ(k)は、時刻k及び時刻kより前に入力されたリファレンス信号の各フィルタ係数による積和演算により生成される。
【0027】
エコーキャンセル部15は、加算器152から出力される音声信号、すなわちエコーキャンセル処理の処理結果をフィードバックさせることによって、該処理結果が所定の条件を満たすまで(適応フィルタ151が収束するまで)フィルタ係数の修正を行いながらエコーキャンセル処理を行う。
【0028】
さて、マイクロホン11から入力された音声信号は、アンプ12,A/Dコンバータ13及びマイク信号処理部14を介して加算器152へ出力される。加算器152では、マイク信号処理部14から音声信号(マイク信号MB)を受け取り、適応フィルタ151から受け取った擬似エコーZを差し引いて、エコーサプレッサ22へ出力する。エコーサプレッサ22は、加算器152から受け取った音声信号に対し、設定されたパラメータに従って音響処理を施して、通信/制御部16に出力する。音声信号は、通信/制御部16を介して通信ネットワーク100に向けて出力される。
【0029】
<B:動作>
次に、端末10の動作について図面を参照しつつ説明する。
<B−1:エコーキャンセル処理>
まず、端末10が行うエコーキャンセル処理について説明する。端末10の適応フィルタ151は、外部から供給されるリセット信号によって初期化される。リセット信号を外部から受信すると、通信/制御部16は、適応フィルタ151を初期化する。すなわち、通信/制御部16は、他の端末10からリセット信号を受信すると、メモリ23に記憶されたフィルタ係数の値を、予め定められた初期設定値に書き換える。初期設定値は端末10が置かれた室の音響環境によって最適な値が異なる。すなわち、適応フィルタ151が収束していない状態であり、かつ、適応フィルタ151が収束していないことにより生じる音響エコーが過大な音響障害とならない程度のエコーキャンセル能力を発揮する範囲が望ましい。この値は端末10を設置後に実験的に定めることができる。しかし、騒音が少なく、残響時間が短い場合等、音響エコーが大きな問題とならない場合は、初期設定値として、フィルタ係数をすべて0にしてもよい。
【0030】
次に、通信/制御部16は、スピーカ18に対し、他の端末10から受信された音声データに応じて放音させる。スピーカ18から放音される音は、端末10が設置された音響空間において音響エコーを生じる。マイクロホン11は、音響エコーを収音する。マイク信号処理部14はマイクロホン11が収音した音響エコーを表す音声信号の遅延和(以下「エコーY」という)を生成する。エコーキャンセル部15は、このエコーYを用いて、フィルタ係数の更新を行う。簡単には、適応フィルタ151は、他の端末10から受信された音声データとフィルタ係数とから擬似エコーZを生成する。エコーキャンセル部15は、生成された擬似エコーZとエコーYとの差分を算出し、算出結果に基づいて所定のアルゴリズムに従ってフィルタ係数を更新する。このアルゴリズムには、LMS(Least Mean Square)法が用いられる。簡単には、算出される差分信号レベルが最小の音声信号に近づくように、すなわちエコーキャンセル部15のフィルタ処理により生成される擬似エコーZがエコーYに最も近似するようにエコーキャンセル部15はフィルタ係数を更新する。このようにフィルタ係数を更新することにより、エコーYを模した擬似エコーZを生成するために最適化されたフィルタ係数が定まる。なお、エコーキャンセル部15が用いるアルゴリズムはLMS法以外の適応アルゴリズムであっても良い。
【0031】
また、通信/制御部16は、相手側端末10からエコキャン制御信号を受信すると、受信したエコキャン制御信号の示す処理態様でエコーキャンセル処理を行うようにエコーキャンセル部15を制御する。この実施形態では、通信/制御部16は、受信されたエコキャン制御信号の示すパラメータをエコーサプレッサ22に設定する。
【0032】
<B−2:通信接続・音響確認処理>
次に、端末10が行う通信接続・音響確認処理について説明する。図4は、端末10が行う通信接続・音響確認処理の流れを示すフローチャートである。まず、端末10は他の端末10との接続を開始する(ステップS1)。端末10の通信/制御部16は、接続が確立されたか否かを判定する(ステップS2)。ここで、通信障害等によって接続が確立されなかった場合には(ステップS2;NO)、ステップS3以降の処理を行わずにそのまま処理を終了する。一方、接続の確立が完了したと判定された場合には(ステップS2;YES)、通信/制御部16は、テスト音声データの送信を開始するとともに、相手側端末10に対してリセット信号を送信する(ステップS3)。
【0033】
次いで、通信/制御部16は、他の端末10から受信される音声データと、自端末10が相手側端末10へ送信した音声データとを用いて、相手側端末10が設置された空間における音響状態を検出する。この動作例では、通信/制御部16は、受信される音声データにおいて音響エコーの出現が確認できたか否かを判定する(ステップS4)。このとき、相手端末の放音系統又は収音系統に異常がある場合等は、エコー出現が確認されない場合がある。エコー出現が確認できないと判定された場合には(ステップS4;NO)、通信/制御部16は、ステップS5以降の処理を行わずにそのまま処理を終了する。
【0034】
一方、ステップS4において、エコーの出現が確認されたと判定された場合には(ステップS4;YES)、通信/制御部16は、エコーキャンセル部15における適応フィルタ151が収束したか否かを判定する(ステップS5)。適応フィルタ151が収束したと判定された場合には(ステップS5;YES)、通信/制御部16は、そのまま処理を終了する。適応フィルタ151が収束したかどうかの判定は、自端末10が相手側端末10へ送信した音声データの信号レベルに対して、相手側端末10から受信される音声データが一定時間の間所定のレベル以下になっているかどうかにより行う。例えば、受信した音声データが送信した音声データの±1%以内のレベルの状態が1秒間続いたときに収束したと判定する。ただし、このレベル比(1%)と継続時間(1秒間)は端末10の設置環境に応じて変更してもよい。例えば、人の動きが大きい状況ではレベル比を±5%以下としてもよいし、継続時間を0.5秒としてもよい。
【0035】
一方、ステップS5において、適応フィルタが収束していないと判定された場合には(ステップS5;NO)、通信/制御部16は、予め定められた時間T1が経過したか否かを判定する(ステップS6)。時間T1が経過していない場合には(ステップS6;NO)、通信/制御部16は、ステップS5の処理に戻り、適応フィルタの収束判定を行う。一方、ステップS6において、一定時間が経過したと判定された場合には(ステップS6;YES)、通信/制御部16は、経過時間に対応するパラメータをメモリ23に記憶されたパラメータテーブルを参照して特定する。本実施形態においては、T1=Taのとき、エコーサプレッサ22のゲインスペクトルとしてB(f)を特定し、T1=Tbのとき、エコーサプレッサ22のゲインスペクトルC(f)を特定する。次いで、通信/制御部16は、特定したパラメータを相手側端末10へ送信することによって相手側端末10のパラメータを変更し(ステップS7)、ステップS3の処理に戻る。
【0036】
すなわち、この動作例では、端末10は、受信した音声データと送信した音声データとを用いて、相手側端末10における適応フィルタの収束に要した時間を計測し、計測結果に応じたパラメータを相手側端末10へ送信する。
【0037】
このように本実施形態によれば、遠隔操作によって音響エコーキャンセル機能(適応フィルタ)をリセットする機能を持たせ、リセットした後の収束状態を確認することにより正常に動作しているかを確認することができる。このように、エコー出現を確認することにより、相手に音声が届いているか(通信のOK/NG)を確認できる。
【0038】
更に、本実施形態によれば、エコーキャンセルの収束状態を確認することにより、エコーキャンセルが正しく動作しているかを確認することができる。このように、音声会議を行う際に各拠点の音響状態(エコー抑圧)が正常か否かを遠隔地から確認することができる。このようにすることにより、最適な音響パラメータ環境で音声会議を実現することができる。また、本実施形態によれば、相手の部屋の音響状況も把握することができるから、これにより、相手の環境に合わせて、パラメータ値を調整することができる。
【0039】
なお、エコーサプレッサ22が行う音響処理は、上述した処理に限定されるものではなく、上述の適応フィルタを用いてエコーキャンセリング処理により除去しきれない成分を除去するような音響処理であれば良い。他の音響処理を行う場合には、ゲインスペクトルに代えて又は併せて、該処理に係るパラメータをメモリ23に記憶されたパラメータテーブルに対応付けておけば良い。
【0040】
<変形例>
以上、本発明の実施形態について説明したが、本発明は上述した実施形態に限定されることなく、他の様々な形態で実施可能である。以下にその例を示す。なお、以下の各態様を適宜に組み合わせてもよい。
(1)上述の実施形態では、本発明に係る端末を用いて遠隔会議を行う場合について説明したが、本発明はこれに限らず、例えば、通信ネットワークを介して講義や講演を行う場合においても本発明を適用することができる。
【0041】
(2)上述の実施形態では、テスト音声データを用いて適応フィルタの収束確認を行ったが、テスト音声データを用いるに代えて、マイクロホン11で収音された音声を表す音声データを用いて適応フィルタの収束確認を行うようにしてもよい。また、これに限らず、例えば、相手側端末10との通信の際に生じる発信音や着信音などを用いるようにしても良い。
【0042】
(3)上記実施形態では、端末10は有線の通信ネットワーク100でネットワーク接続されている場合について説明したが、無線で各装置をつないでもよい。通信ネットワーク100はインターネットの他、LAN(Local Area Network)などでも良い。
【0043】
(4)上述の実施形態では、端末10が、適応フィルタの収束時間を検出するようにしたが、端末10が検出する残響状況はこれに限らず、相手側端末10が設置された空間における残響状況を検出するものであれよく、要は、受信された音声データと送信した音声データとを用いて、相手側端末10が設置された空間における残響状況を検出するものであればよい。
【0044】
(5)上述の実施形態では、パラメータテーブルにエコーサプレッサ22に設定するパラメータを記憶したが、パラメータテーブルに記憶するパラメータはこれに限らず、例えば、適応フィルタのフィルタ係数であってもよく、要は、残響状況とエコーキャンセル処理の処理態様との対応関係を端末10に予め記憶しておき、端末10が、記憶された対応関係に基づいて、検出された残響状況に対応する処理態様を特定し、特定した処理態様を示す制御信号を、相手側端末10へ送信するようにすればよい。例えば、パラメータとしてフィルタ係数を用いる場合には、端末10は、検出した残響状況に対応するフィルタ係数をパラメータテーブルから読み出し、読み出したフィルタ係数を相手側端末10へ送信する。この場合は、端末10は、相手側端末10からフィルタ係数を受信すると、メモリ23に記憶されたフィルタ係数の値を、受信されたフィルタ係数の値に書き換え、書き換えたフィルタ係数を用いてエコーキャンセル処理を行う。また、フィルタ係数の代わりに適応フィルタのタップ数をパラメータとしてもよい。これにより、残響時間の長短に合わせた適応フィルタのタップ数を設定することができる。
【0045】
(6)上述の実施形態において、端末10が、検出した残響状況を報知するようにしてもよい。具体的には、例えば、検出した残響状況を表す画像を液晶ディスプレイ等の表示装置に表示するようにしてもよく、また、例えば、検出した残響状況を模擬するようにしてもよい。
【0046】
(7)上述の実施形態における端末10の各部は、ハードウェアとして構成されてもよく、また、CPU(Central Processing Unit)等の制御部がハードディスク等の記憶手段に記憶されたコンピュータプログラムを実行することによってソフトウェアとして実現するようにしてもよい。この場合、制御部によって実行されるプログラムは、磁気記録媒体(磁気テープ、磁気ディスクなど)、光記録媒体(光ディスクなど)、光磁気記録媒体、半導体メモリなどのコンピュータが読取可能な記録媒体に記録した状態で提供し得る。また、インターネットのようなネットワーク経由で端末10にダウンロードさせることも可能である。
【符号の説明】
【0047】
1…遠隔会議システム、10…端末、11…マイクロホン、12…アンプ、13…A/Dコンバータ、14…マイク信号処理部、15…エコーキャンセル部、16…通信/制御部、17…操作部、18…スピーカ、19…スピーカ信号処理部、20…D/Aコンバータ、21…アンプ、22…エコーサプレッサ、23…メモリ、100…通信ネットワーク、151…適応フィルタ、152…加算器。

【特許請求の範囲】
【請求項1】
第1の端末と、該第1の端末と通信ネットワークを介して接続された第2の端末とを有する音声通信システムであって、
前記第1の端末は、
前記第2の端末から音声データを受信する音声データ受信手段と、
前記音声データ受信手段により受信された音声データが示す音声を放音する放音手段と、
該第1の端末の周囲の音声を収音する収音手段と、
前記音声データ受信手段により受信された音声データに基づき擬似エコー信号を生成する適応フィルタと、前記収音手段によって収音された音声を表す音声データから該擬似エコー信号を減算する減算部とを備えたエコーキャンセル手段と、
前記適応フィルタの係数を記憶するフィルタ係数記憶手段と、
前記エコーキャンセル手段によってエコーキャンセル処理を施された音声データを、前記第2の端末に対して送信する音声データ送信手段と、
前記第2の端末からリセット信号を受信するリセット信号受信手段と、
前記リセット信号受信手段によって前記リセット信号が受信されたときに、前記フィルタ係数記憶手段に記憶されたフィルタ係数の値を、予め定められた初期設定値に書き換えるフィルタ係数リセット手段と、
前記第2の端末から前記エコーキャンセル処理の処理態様を示す制御信号を受信する制御信号受信手段と、
前記制御信号受信手段によって前記制御信号が受信されたときに、該受信された制御信号の示す処理態様でエコーキャンセル処理を行うように前記エコーキャンセル手段を制御するエコーキャンセル制御手段と
を具備し、
前記第2の端末は、
残響状況とエコーキャンセル処理の処理態様との対応関係を記憶する対応関係記憶手段と、
前記第1の端末に対して前記リセット信号を送信するリセット信号送信手段と、
前記第1の端末に対して音声データを送信する送信手段と、
前記第1の端末から音声データを受信する受信手段と、
前記受信手段により受信された音声データと前記送信手段によって送信された音声データとを用いて、前記第1の端末が設置された空間における残響状況を検出する残響状況検出手段と、
前記対応関係記憶手段に記憶された対応関係に基づいて、前記残響状況検出手段によって検出された残響状況に対応する処理の処理態様を特定する特定手段と、
前記特定手段によって特定された処理態様を示す制御信号を、前記第1の端末に送信する制御信号送信手段と
を具備することを特徴とする音声通信システム。
【請求項2】
残響状況とエコーキャンセル処理の処理態様との対応関係を記憶する対応関係記憶手段と、
通信ネットワークを介して接続された端末に対してリセット信号を送信するリセット信号送信手段と、
前記端末に対して音声データを送信する音声データ送信手段と、
前記端末から音声データを受信する音声データ受信手段と、
前記音声データ受信手段により受信された音声データと前記音声データ送信手段によって送信された音声データとを用いて、前記端末が設置された空間における残響状況を検出する残響状況検出手段と、
前記対応関係記憶手段に記憶された対応関係に基づいて、前記残響状況検出手段によって検出された残響状況に対応する処理態様を特定し、特定した処理態様を示す制御信号を、前記端末に送信する制御信号送信手段と
を具備することを特徴とする音声通信装置。
【請求項3】
前記対応関係記憶手段は、適応フィルタの収束時間とエコーキャンセル処理の処理態様との対応関係を記憶し、
前記残響状況検出手段は、前記音声データ受信手段により受信された音声データと前記音声データ送信手段によって送信された音声データとを用いて、前記端末における適応フィルタの収束に要した時間を計測する
ことを特徴とする請求項2に記載の音声通信装置。
【請求項4】
前記対応関係記憶手段は、残響状況とフィルタ係数との対応関係を記憶し、
前記制御信号送信手段は、前記対応関係記憶手段に記憶された対応関係に基づいて、前記残響状況検出手段によって検出された残響状況に対応するフィルタ係数を特定し、特定したフィルタ係数を前記端末へ送信する
ことを特徴とする請求項2又は3に記載の音声通信装置。
【請求項5】
前記対応関係記憶手段は、残響状況とサプレッサのパラメータとの対応関係を記憶し、
前記制御信号送信手段は、前記対応関係記憶手段に記憶された対応関係に基づいて、前記残響状況検出手段によって検出された残響状況に対応するパラメータを特定し、特定したパラメータを前記端末へ送信する
ことを特徴とする請求項2乃至4のいずれか1項に記載の音声通信装置。
【請求項6】
前記残響状況検出手段によって検出された残響状況を報知する報知手段
を具備することを特徴とする請求項2乃至5のいずれか1項に記載の音声通信装置。
【請求項7】
音声データを記憶する音声データ記憶手段
を具備し、
前記音声データ送信手段は、前記音声データ記憶手段に記憶された音声データを前記端末に対して送信する
ことを特徴とする請求項2乃至6のいずれか1項に記載の音声通信装置。
【請求項8】
前記音声データ送信手段は、収音手段によって収音された音声を表す音声データを前記端末に対して送信する
ことを特徴とする請求項2乃至6のいずれか1項に記載の音声通信装置。
【請求項9】
エコーキャンセル処理を行う際に用いられるフィルタ係数を記憶するフィルタ係数記憶手段と、
通信ネットワークを介して接続された端末から音声データを受信する音声データ受信手段と、
前記音声データ受信手段により受信された音声データが示す音声を放音する放音手段と、
周囲の音声を収音する収音手段と、
前記音声データ受信手段により受信された音声データに基づき擬似エコー信号を生成する適応フィルタと、前記収音手段によって収音された音声を表す音声データから該擬似エコー信号を減算する減算部を備えたエコーキャンセル手段と、
前記エコーキャンセル手段によってエコーキャンセル処理を施された音声データを、前記端末に対して送信する音声データ送信手段と、
前記端末からリセット信号を受信するリセット信号受信手段と、
前記リセット信号受信手段によって前記リセット信号が受信されたときに、前記フィルタ係数記憶手段に記憶されたフィルタ係数の値を、予め定められた初期設定値に書き換えるフィルタ係数リセット手段と、
前記端末から前記エコーキャンセル処理の処理態様を示す制御信号を受信する制御信号受信手段と、
前記制御信号受信手段によって前記制御信号が受信されたときに、該受信された制御信号の示す処理態様でエコーキャンセル処理を行うように前記エコーキャンセル手段を制御するエコーキャンセル制御手段と
を具備することを特徴とする音声通信装置。
【請求項10】
前記エコーキャンセル制御手段は、前記フィルタ係数記憶手段に記憶されたフィルタ係数の値を、前記制御信号受信手段によって受信された制御信号の示すフィルタ係数の値に書き換える
ことを特徴とする請求項9に記載の音声通信装置。
【請求項11】
前記エコーキャンセル処理を施された音声データに対して、設定されたパラメータに従って音響処理を施すサプレッサ
を具備し、
前記エコーキャンセル制御手段は、前記制御信号受信手段によって受信された制御信号の示すパラメータを前記サプレッサに設定する
ことを特徴とする請求項9又は10に記載の音声通信装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate


【公開番号】特開2010−183434(P2010−183434A)
【公開日】平成22年8月19日(2010.8.19)
【国際特許分類】
【出願番号】特願2009−26272(P2009−26272)
【出願日】平成21年2月6日(2009.2.6)
【出願人】(000004075)ヤマハ株式会社 (5,930)
【Fターム(参考)】