説明

放収音装置

【課題】処理負荷をかけずに、音源(例えば、主な発話者)の方位を正確に推定することができる放収音装置を提供する。
【解決手段】放収音装置1は、他の放収音装置とネットワーク等を介して接続される。放収音装置1は、他の放収音装置からの音声信号を放音信号FEとして受信してスピーカSPから放音する。また、放収音装置1は、マイクMIC1〜MIC3で収音して、異なる複数方位の収音ビーム信号NE1〜NE3を生成する。放収音装置は、各収音ビーム信号NE1〜NE3をダウンサンプリングして、ダウンサンプリングの収音ビーム信号DNE1〜DNE3のエコーを除去する。放収音装置は、エコーを除去した収音ビーム信号DNE1’〜DNE3’の中から最も信号レベルが高い収音ビーム信号DNE1’を選択する。放収音装置は、収音ビーム信号DNE1’の収音方位D1からの収音ビーム信号NE1のエコーを除去して、他の放収音装置へ送信する。

【発明の詳細な説明】
【技術分野】
【0001】
この発明は、複数方位の音声を収音する放収音装置に関する。
【背景技術】
【0002】
従来、話者の音声を収音するとともに、入力された放音信号に基づいて音声を放音する放収音装置が各種提案されている(例えば、特許文献1参照。)。
【0003】
例えば、特許文献1の放収音装置は、複数のマイクからなるマイクアレイを備え、各マイクが収音した音声信号に対して遅延処理等を行い、それぞれ異なる方向を指向性の軸方向とする収音指向性を備える複数の収音ビーム信号を生成する。そして、放収音装置は、複数の収音ビーム信号の中から最も信号レベルが高い収音ビーム信号を選択し、選択した収音ビーム信号からエコーを除去して、通信相手に送信することで、主な話者の音声を通信相手に送信している。
【特許文献1】特開2002−238091号公報
【発明の開示】
【発明が解決しようとする課題】
【0004】
しかしながら、収音ビーム信号には、話者の音声と、自装置から放音した音声に基づく回帰音と、が含まれる。このため、放収音装置は、回帰音が話者の音声より大きい場合に、主な話者の音声を正確に選択することができない。
【0005】
このような場合、放収音装置は、エコーを除去した後の各収音ビーム信号の信号レベルに基づいて、送信する収音ビーム信号を選択すれば、主な話者の音声を正確に選択することができる。しかし、全収音ビーム信号(例えば6方向)のエコーを除去する処理は、負荷が大きく、現実的に全方位のエコーを除去することは不可能であった。
【0006】
そこで、処理負荷をかけずに、主な話者の音声を正確に選択することができる放収音装置を提供することを目的とする。
【課題を解決するための手段】
【0007】
この発明の放収音装置は、複数の異なる方位毎に収音信号を生成して、音源(例えば、主な発話者)の方位を推定する。また、放収音装置は、第1エコーキャンセル手段と複数の第2エコーキャンセル手段とを備える。第1エコーキャンセル手段は、推定した方位からの収音信号のエコーを除去する。第2エコーキャンセル手段は、第1エコーキャンセル手段よりも簡易な構成からなり、方位毎の収音信号からエコーを除去する。放収音装置は、複数の第2エコーキャンセル手段での処理後の収音信号の信号レベルに基づいて、音源の方位を推定する。なお、簡易な構成からなるエコーキャンセル手段とは、ダウンサンプリング後の収音信号に対してエコーを除去するものや、タップ数が少ない適応フィルタを用いてエコーを除去するものである。
【0008】
これにより、放収音装置は、簡易にエコーを除去した後の収音信号を用いて音源の方位を推定するため、処理負荷をかけずに、音源の方位を正確に推定することができる。
【0009】
また、この発明の放収音装置の第1エコーキャンセル手段及び複数の第2エコーキャンセル手段は、それぞれ適応フィルタと、該適応フィルタのフィルタ係数を推定するフィルタ係数推定部を備える。第1エコーキャンセル手段のフィルタ係数推定手段は、推定した音源の方位からの収音信号のエコーを除去した第2エコーキャンセル手段のフィルタ係数を初期値として、フィルタ係数を更新する処理を行う。
【0010】
これにより、放収音装置は、音源方位の推定の際に用いたフィルタ係数を初期値として、音源方位からの収音信号のエコーを除去することができるため、フィルタ係数の推定時間を短縮することができる。よって、放収音装置は、初期状態からエコーの除去を行うことができる。
【0011】
更に、この発明の放収音装置の第1エコーキャンセル手段は、適応フィルタのフィルタ係数を方位毎に記憶している。第1エコーキャンセル手段のフィルタ係数推定手段は、フィルタ係数が記憶されていない場合のみ、上述のように第2エコーキャンセル手段のフィルタ係数を初期値とする初期処理を行う。
【0012】
これにより、放収音装置の第1エコーキャンセル手段は、記憶部にフィルタ係数を記憶していない場合のみ、音源方位の推定時に用いたフィルタ係数を初期値とし、それ以外は、以前に用いたフィルタ係数を初期値とするため、環境(話者)が変わっても即座にエコーを除去することができる。
【発明の効果】
【0013】
この発明の放収音装置は、処理負荷をかけずに、音源(例えば、主な発話者)の方位を正確に推定することができる。
【発明を実施するための最良の形態】
【0014】
本発明の実施形態に係る放収音装置1について、図1〜4を参照して説明する。放収音装置1は、他の放収音装置とネットワーク等を介して接続される。放収音装置1は、他の放収音装置からの音声信号を放音信号として受信してスピーカSPから放音する。また、放収音装置1は、マイクMIC1〜MIC3で収音して、複数方位からの収音ビーム信号を生成する。そして、放収音装置は、主な発話者の方位からの収音ビーム信号を他の放収音装置へ送信する。
【0015】
まず、放収音装置1の機能、構成について、図1,2を参照して説明する。図1は、放収音装置の機能、構成を示すブロック図である。図2は、収音ビーム信号毎の収音方位を説明するための説明図である。放収音装置1は、スピーカSP、マイクMIC1〜MIC3、通信制御部11、収音制御部12、ダウンサンプリング部(以下、DS部と称す。)13、ダウンサンプリング部(以下、DS部と称す。)14A〜14C、エコーキャンセル部(本発明の第2エコーキャンセル部に相当する。)15A〜15C、方位推定部16、制御部17、収音信号選択部18、及びエコーキャンセル部(本発明の第1エコーキャンセル部に相当する。)19から構成される。
【0016】
通信制御部11は、他の放収音装置とネットワークを介して接続され、他の放収音装置との通信に関する制御を行う。通信制御部11は、具体的には、他の放収音装置から放音信号FEを受信して、エコーキャンセル部19を介して、後述するDS部13及びスピーカSPへ出力する。スピーカSPは、放音信号FEに基づく音声を放音する。また、通信制御部11は、後述するエコーキャンセル部19から入力された収音ビーム信号NE1’を他の放収音装置へ送信する。
【0017】
マイクMIC1〜MIC3は、周囲の音声を収音して、それぞれ収音信号を生成して、収音制御部12へ出力する。なお、マイクの台数は、3台に限らない。
【0018】
収音制御部12は、各マイクMIC1〜MIC3からの収音信号に対して、遅延処理等を行い、図2に示すように異なる方位を収音指向性の中心方向とする複数の収音ビーム信号NE1〜NE3を生成する。なお、以下、収音ビーム信号NE1〜NE3のそれぞれの収音方位をD1〜D3とする。
【0019】
そして、収音制御部12は、収音ビーム信号NE1〜NE3をそれぞれDS部14A〜14Cへ出力するとともに、収音ビーム信号NE1〜NE3を収音信号選択部18へ出力する。なお、収音制御部12が生成する収音ビーム信号の数は3本に限らない。また、収音制御部12は、必須の構成ではない。この場合、各マイクMIC1〜MIC3は、それぞれ異なる方位からの音声を収音して収音信号を生成し、DS部14A〜14C及び収音信号選択部18へ出力する。
【0020】
DS部14A〜14Cは、ローパスフィルタを含み、それぞれ入力された収音ビーム信号NE1〜NE3のダウンサンプリングを行い、ダウンサンプリング後の収音ビーム信号DNE1〜DNE3をそれぞれエコーキャンセル部15A〜15Cに出力する。例えば、DS部14A〜14Cは、20kHzのサンプリング周波数でサンプリングされた収音ビーム信号DNE1〜NE3を10kHzのサンプリング周波数の信号にダウンサンプリングする。
【0021】
DS部13は、ローパスフィルタを含み、入力された放音信号FEのダウンサンプリングを行い、ダウンサンプリング後の放音信号DFEをエコーキャンセル部15A〜15Cに出力する。例えば、DS部13は、20kHzのサンプリング周波数でサンプリングされた放音信号FEを10kHzのサンプリング周波数の信号にダウンサンプリングする。
【0022】
エコーキャンセル部15A〜15Cは、ダウンサンプリング後の放音信号DFEに基づいて、スピーカSPから各マイクMIC1〜MIC3へ至る回り込成分の擬似信号である擬似回帰音信号を生成する。エコーキャンセル部15A〜15Cは、それぞれダウンサンプリング後の収音ビーム信号DNE1〜DNE3から擬似回帰音信号を差し引くことで、エコーを除去する。そして、エコーキャンセル部15A〜15Cは、エコーを除去した後の収音ビーム信号DNE1’〜DNE3’を方位推定部16へ出力する。
【0023】
このエコーキャンセル部15A〜15Cは、ダウンサンプリング後の収音ビーム信号DNE1〜DNE3のエコーを除去するためのものであるため、エコーキャンセル部19よりも簡易な構成からなり、処理負荷をかけずにエコーを除去することができる。また、エコーキャンセル部15A〜15Cは、エコーキャンセル部19よりもタップ数を少なくしてもよい。なお、エコーキャンセル部15A〜15Cの詳細な機能、構成については後述する。
【0024】
方位推定部16は、エコーキャンセル後の収音ビーム信号DNE1’〜DNE3’の中から最も信号レベルが高い収音ビーム信号を選択する。以下、方位推定部16は、収音方位D1からの収音ビーム信号DNE1’を選択したとして説明する。そして、方位推定部16は、選択した収音ビーム信号DNE1’の収音方位D1を取得して、制御部17へ出力する。
【0025】
制御部17は、方位推定部16から入力された収音方位D1に基づいて、収音信号選択部18、及びエコーキャンセル部19を制御する。
【0026】
収音信号選択部18は、収音制御部12から入力された収音ビーム信号NE1〜NE3の中から、制御部17から入力された収音方位D1からの収音ビーム信号NE1を選択して、エコーキャンセル部19へ出力する。
【0027】
エコーキャンセル部19は、放音信号FEに基づいて、スピーカSPから各マイクMIC1〜MIC3へ至る回り込成分の擬似信号である擬似回帰音信号を生成して、収音信号選択部18から入力された収音ビーム信号NE1から擬似回帰音信号を差し引くことでエコーを除去する。そして、エコーキャンセル部19は、エコーを除去した後の収音ビーム信号NE1’を通信制御部11へ出力する。なお、エコーキャンセル部19の詳細な機能、構成については後述する。
【0028】
以上より、エコーキャンセル部15A〜15Cは、ダウンサンプリングした後の収音ビーム信号DNE1〜DNE3に対してエコーを除去するため、処理負荷を低減することができる。また、放収音装置1は、エコーを除去した後の収音ビーム信号DNE1’〜DNE3’を用いて、主な発話者の方位を取得して、主な発話者の方位からの収音ビーム信号を選択するため、主な発話者の音声を正確に選択することができる。よって、放収音装置1は、処理負荷をかけずに、主な発話者の音声を正確に選択することができる。
【0029】
次に、エコーキャンセル部15A〜15C、エコーキャンセル部19の機能、構成の詳細について、図3,4を参照して説明する。図3は、エコーキャンセル部の機能、構成を示すブロック図である。図4は、適応フィルタの収音方位毎のフィルタ係数の一例を示す図である。エコーキャンセル部15A〜15Cとエコーキャンセル部19とは、同じ機能、構成を有する。以下は、エコーキャンセル部19を例に挙げて説明する。
【0030】
図3に示すように、エコーキャンセル部19は、記憶部21、フィルタ係数推定部22、適応フィルタ23、及び加算部24から構成される。
【0031】
記憶部21は、図4に示すような係数一覧表211を一時記憶している。係数一覧表211は、収音方位毎のフィルタ係数が記載されており、フィルタ係数推定部22により参照される。なお、係数一覧表211に記憶されているフィルタ係数は、放収音装置1の電源のオンオフに伴ってリセットされる。
【0032】
フィルタ係数推定部22は、音響伝達系(スピーカSPから各マイクMIC1〜MIC3に至る音響伝搬経路)の伝達関数を推定し、推定した伝達関数でFIRフィルタのフィルタ係数を設定する。この際、フィルタ係数推定部22は、制御部17から入力された収音方位D1に対応するフィルタ係数を係数一覧表211から取得し、該フィルタ係数を初期値として、フィルタ係数を算出する。また、フィルタ係数推定部22は、加算部24から出力された収音ビーム信号NE1’と放音信号FEとに基づいて、適応アルゴリズムを用いてフィルタ係数の更新を行う。そして、フィルタ係数推定部22は、算出したフィルタ係数を適応フィルタ23へ出力する。
【0033】
適応フィルタ23は、FIRフィルタ等のデジタルフィルタを含んでおり、フィルタ係数推定部22から入力されたフィルタ係数で、擬似回帰音信号を生成する。適応フィルタ23は、生成した擬似回帰音信号を加算部24へ出力する。
【0034】
加算部24は、適応フィルタ23から入力された擬似回帰音信号を収音ビーム信号NE1から差し引いた収音ビーム信号NE1’を出力する。
【0035】
なお、記憶部21は必須の構成ではない。しかし、エコーキャンセル部19は、収音方位が切り替わると、フィルタ係数の初期値を変更する必要があるため、記憶部21を備えた方がよい。
【0036】
また、エコーキャンセル部15A〜15Cのフィルタ係数推定部22は、それぞれ加算部24から出力された収音ビーム信号DNE1’〜DNE3’とダウンサンプリング後の放音信号DFEとに基づいて、適応アルゴリズムを用いてフィルタ係数の更新を行う。
【0037】
以上より、エコーキャンセル部19は、収音方位毎のフィルタ係数を記憶部21に記憶しているため、収音方位を切り替えた際には環境(話者)が変わるが、過去の適応済みのフィルタ係数を記憶部21から取得して適応フィルタを推定する。このため、エコーキャンセル部19は、適応フィルタの推定を短縮することがきでき、環境(話者)が変わっても即座にエコーを除去することができる。
【0038】
なお、エコーキャンセル部19は、エコーキャンセル部15A〜15Cから取得したフィルタ係数を用いて、エコーキャンセルを行ってもよい。この場合、エコーキャンセル部15A〜15Cのフィルタ係数をアップサンプリングして使用する。図5は、他の実施形態に係る放収音装置の機能、構成を示すブロック図である。図5に示すように、制御部17は、放収音装置1の電源オン時や収音方位を切り替えた際に、エコーキャンセル部19の記憶部21の係数一覧表211を参照する。制御部17は、方位推定部16から入力された収音方位のフィルタ係数が係数一覧表211に記載されていない場合にのみ、当該収音方位からの収音ビーム信号のエコーを除去したエコーキャンセル部15A〜15Cからフィルタ係数を取得して、エコーキャンセル部19のフィルタ係数推定部22へ出力する。そして、フィルタ係数推定部22は、制御部17から入力されたフィルタ係数を初期値としてフィルタ係数を算出する。これにより、エコーキャンセル部19は、ダウンサンプリングした収音ビーム信号DNE1〜DNE3のエコーを除去した際のフィルタ係数を初期値として、フィルタ係数の算出を行うため、フィルタ係数の推定時間を短縮することができる。このため、エコーキャンセル部19は、初期状態からエコーを除去することができる。
【図面の簡単な説明】
【0039】
【図1】放収音装置の機能、構成を示すブロック図である。
【図2】収音ビーム信号毎の収音方位を説明するための説明図である。
【図3】エコーキャンセル部の機能、構成を示すブロック図である。
【図4】適応フィルタの収音方位毎のフィルタ係数の一例を示す図である。
【図5】他の実施形態に係る放収音装置の機能、構成を示すブロック図である。
【符号の説明】
【0040】
1…放収音装置,11…通信制御部, 12…収音制御部,13,14…DS部,15,19…エコーキャンセル部,16…方位推定部,17…制御部,18…収音信号選択部,21…記憶部,211…係数一覧表,22…フィルタ係数推定部,23…適応フィルタ,24…加算部,MIC1〜MIC3…マイク,SP…スピーカ

【特許請求の範囲】
【請求項1】
複数方位の音声を収音して、方位毎に収音信号を生成する収音手段と、
音声を放音する放音手段と、
前記方位毎の収音信号の信号レベルに基づいて、音源の方位を推定する方位推定手段と、
前記方位推定手段が推定した音源の方位からの収音信号のエコーを除去する第1エコーキャンセル手段と、
前記方位毎の収音信号からそれぞれエコーを第1エコーキャンセル手段よりも簡易な構成からなる複数の第2エコーキャンセル手段と、を備え、
前記方位推定手段は、前記複数の第2エコーキャンセル手段による処理後の収音信号の信号レベルに基づいて、音源の方位を推定する放収音装置。
【請求項2】
前記第1エコーキャンセル手段及び前記複数の第2エコーキャンセル手段は、それぞれ適応フィルタと該適応フィルタのフィルタ係数を推定するフィルタ係数推定手段とを備え、
前記第1エコーキャンセル手段のフィルタ係数推定手段は、前記方位推定手段が推定した方位の収音信号のエコーを除去した第2エコーキャンセル手段の適応フィルタのフィルタ係数を初期値とする初期処理を行う請求項1に記載の放収音装置。
【請求項3】
前記第1エコーキャンセル手段は、前記適応フィルタのフィルタ係数を方位毎に記憶する記憶手段を更に備え、
前記第1エコーキャンセル手段のフィルタ係数推定手段は、前記記憶手段にフィルタ係数が記憶されていない場合のみ、前記初期処理を行う請求項2に記載の放収音装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate


【公開番号】特開2010−114554(P2010−114554A)
【公開日】平成22年5月20日(2010.5.20)
【国際特許分類】
【出願番号】特願2008−284030(P2008−284030)
【出願日】平成20年11月5日(2008.11.5)
【出願人】(000004075)ヤマハ株式会社 (5,930)
【Fターム(参考)】