説明

放収音装置、および放収音システム

【課題】話頭欠けを防止する放収音装置、および放収音システムを提供する。
【解決手段】比較処理部8に収音信号と放音信号を入力する。比較処理部8は、収音信号と放音信号との相関を求め、直接反射音、間接反射音などを測定する。直接反射音、間接反射音に変化があった場合に、ユーザが存在すると判断し、収音処理部6に移動検出情報を出力する。収音処理部6は、移動検出情報を入力した場合、マイク2の収音信号を後段に出力し、チャンネルを取得する。

【発明の詳細な説明】
【技術分野】
【0001】
この発明は、音声を収音するとともに、特定の地点の音声を放音する放収音装置、および放収音システムに関する。
【背景技術】
【0002】
従来、室内にマイクとスピーカを配置し、マイクからの音声入力信号に基づいて話者を検出する拡声システムが提案されている(例えば特許文献1参照)。
【0003】
特許文献1に記載の拡声システムでは、ある位置に存在する話者Aが発話すると、話者Aに最も近い位置に設置されたマイクを音源位置として検出し、他のスピーカに音声信号を供給する。一方で、他の位置に存在する話者Bが発話すると、話者Bに最も近い位置に設置されたマイクを第2の音源位置として検出し、話者Bに近い位置のスピーカのゲインを低下させる。これによりハウリングを抑制するものである。
【特許文献1】特開2006−238254号公報
【発明の開示】
【発明が解決しようとする課題】
【0004】
しかし、特許文献1の拡声システムでは、実際に話者が発話してからでなければ音源位置を検出できなかった。そのため、会話の先頭(話頭)を収音することができず、話頭欠けが発生していた。
【0005】
そこで、この発明は、話頭欠けを防止する放収音装置、および放収音システムを提供することを目的とする。
【課題を解決するための手段】
【0006】
この発明の放収音装置は、装置周囲の音声を収音して収音信号を出力する収音部と、他の装置から放音信号を受信する通信部と、前記通信部が受信した前記放音信号を入力し、音声を放音する放音部と、前記放音信号と前記収音信号との相関を求め、前記放音信号に対する反射音を測定する測定部と、前記放音信号と前記収音信号との相関を記録する記録部と、前記反射音の変化に基づいて、移動物体があるか否かを判定する判定部と、前記検出部で前記移動物体を検出した場合に、前記通信部を介して前記収音信号を他の装置に送信する処理部と、を備えたことを特徴とする。
【0007】
この構成では、収音信号と放音信号との相関を求め、反射音を検出する。例えば相互相関係数を求め、時間軸上のピークを求めることで反射音を検出する。この反射音の時間変化を検出することで、移動物体(ユーザ)が存在するか否かを判定する。移動物体がある場合に収音信号を他装置に送信する(発話チャンネルを取得する)。ユーザが存在すると判定した場合に予めチャンネルを取得しておくため、話頭欠けが生じることがない。
【0008】
また、この発明は、さらに、前記収音部は、複数のマイクユニットを配列してなるマイクアレイ、および各マイクユニットが収音した収音信号をそれぞれ遅延して合成することにより、複数の方向に指向性を有する複数の収音ビームを生成する収音処理部からなり、前記測定部は、収音ビーム毎に反射音を測定し、前記判定部は、収音ビーム毎に移動物体があるか否かを判定することを特徴とする。
【0009】
この構成では、マイクアレイにより複数の方向に指向性を有した収音ビームを形成する。これらの収音ビーム毎に反射音を検出し、ユーザの存在を検出する。それぞれの収音ビームについてユーザが存在するか否かを検出することができ、より精度の高い検出を行うことができる。
【0010】
この発明の放収音システムは、さらに、請求項2に記載の放収音装置を複数接続してなる放収音システムであって、前記放収音装置の処理部は、前記移動物体との距離を示す情報を他の装置と送受信し、前記移動物体との距離を示す情報に基づいて前記移動物体との距離を求め、自装置が前記移動物体に最も近いと判断した場合に、前記収音信号を他の装置に送信することを特徴とする。
【0011】
この構成では、ユーザとの距離を示す情報を送受信する。距離を示す情報とは、例えば収音ビームのレベルや遅延パターンである。レベルや遅延パターンにより自装置が最もユーザに近いか否かを推定することができる。自装置が最もユーザに近いと判断した場合に収音信号を送信する。
【0012】
また、この発明は、さらに、請求項2に記載の放収音装置を複数接続してなる放収音システムであって、各放収音装置に接続され、前記移動物体に最も近い放収音装置に収音信号を送信するように設定する設定情報を各放収音装置に送信する調停装置をさらに備え、前記放収音装置の処理部は、前記設定情報を受信し、この設定情報に基づいて、自装置が最も前記移動物体に近いと判断した場合に、前記収音信号を他の装置に送信することを特徴とする。
【0013】
この構成では、調停装置(サーバ)が最も移動物体に近い放収音装置を判定し、その装置に収音信号を送信するように設定する。
【0014】
また、この発明は、さらに、前記処理部は、自装置が前記移動物体に最も近いと判断した場合にのみ前記放音部に音声を放音させることを特徴とする。
【0015】
この構成では、最もユーザに近い装置のみ音声を放音する。最も近い装置のみ放音することで、他装置の放音音声が収音されることがなくなり、ハウリングを防止することができる。
【発明の効果】
【0016】
この発明によれば、収音信号と放音信号との相関を求め、反射音の時間変化からユーザの存在を判定し、ユーザが存在すると判定した場合に予めチャンネルを取得しておくため、話頭欠けが生じることがない。
【発明を実施するための最良の形態】
【0017】
以下、図面を参照してこの発明の実施形態である放収音システムについて説明する。図1は放収音システムの構成を示すブロック図である。図2は、放収音装置の構成を示すブロック図である。
【0018】
図1において、この放収音システムは、ネットワークを介して接続される複数の放収音装置1A〜1Dを備えている。放収音装置1A〜1Dは、それぞれ部屋A〜Dに設置されている。放収音装置1A〜1Dは全て同じ構成、機能を有しており、図2においては、代表して放収音装置1Aの構成を示す。
【0019】
図2において、この放収音装置1Aは、マイク2、スピーカ3、エコーキャンセラ4、入出力インタフェース(I/F)5、収音処理部6、放音処理部7、および比較処理部8を備えている。
【0020】
なお、同図において、フロントエンドのアンプ、アナログ音声信号をデジタル変換するA/Dコンバータ、デジタル音声信号をアナログ変換するD/Aコンバータ、およびパワーアンプは省略している。また、本実施形態において、特に記載無き場合、放収音装置1A内を伝達する音声信号は、全てデジタル音声信号とする。
【0021】
マイク2は、装置周囲の音声を収音し、音声信号(収音信号)を出力する。マイク2の出力した収音信号は、収音処理部6および比較処理部8に入力される。
【0022】
収音処理部6は、装置周囲にユーザが存在する場合、マイク2から入力された収音信号を後段のエコーキャンセラ4に出力する。収音処理部6は、ユーザが存在しない場合には収音信号をエコーキャンセラ4に出力しない。ユーザが存在しない場合に収音信号を出力しないことで、処理負荷、通信負荷を軽減する。ユーザが存在するか否かの検出手法については後述する。エコーキャンセラ4は、収音処理部6から入力された収音信号のエコー成分を除去し、入出力I/F5に出力する。
【0023】
入出力I/F5は、入力された音声信号を所定のプロトコルに変換して音声情報として他の放収音装置に送信する。また、入出力I/F5は、他の放収音装置から音声情報を受信し、音声信号(放音信号)に変換してエコーキャンセラ4に入力する。
【0024】
エコーキャンセラ4は、入出力I/F5から入力された放音信号を放音処理部7に出力する。
放音処理部7は、エコーキャンセラ4から入力された放音信号のレベル、周波数特性等を調整し、スピーカ3および比較処理部8に出力する。例えば、難聴者が音声の内容を聴き取りやすいように、音量を大きくする。また、周波数特性を調整する場合、例えば人の聴覚特性に応じた補正を行う。人間の聴覚は年齢が高くなるにつれ、高音域が中低音域に比べて聴きとり難くなる性質があり、これを補償するための補正を行う。例えば70歳代以上の平均的な聴覚特性に応じた補正を行う。
スピーカ3は、放音処理部7から入力された放音信号に基づいて音声を放音する。
【0025】
比較処理部8は、放音信号と収音信号との相関を求める。図3は、比較処理部8の構成を示すブロック図である。同図に示すように、比較処理部8は、比較回路81、遅延測定部82、記録部83、および動き検出部84を備えている。
【0026】
比較回路81は、マイク2の出力する収音信号、およびエコーキャンセラ4の出力する放音信号を入力する。比較回路81は、入力した収音信号と放音信号との相関を求める。収音信号と放音信号との相関は、例えば相互相関係数により表される。
【0027】
図4は、収音信号と放音信号との相関を示す図である。同図(A)は、放音信号を示す図であり、同図(B)は、収音信号を示す図である。同図(C)は、相互相関係数を示す図である。同図(A)および同図(B)に示すグラフの縦軸はレベルを表し、同図(C)に示すグラフの縦軸は相互相関係数γを表す。また、同図(A)〜(C)に示すグラフの横軸は時間tを表す。
【0028】
同図(A)および同図(B)に示すように、収音信号は、放音信号に対して所定の遅延τを有している。これはスピーカ3から放音された音声が音響伝達経路を経てマイク2に帰還するためである。遅延測定部82は、比較回路81から相互相関係数γを入力し、直接回帰音や反射音の遅延量を求める。すなわち、同図(C)に示すように、相互相関係数γの最初のピークを直接回帰音の遅延量τと推定し、他のピークを反射音の遅延量(τ1、τ2、τ3、τ4)と推定する。
【0029】
記録部83は、遅延測定部82で求めた各遅延量を入力し、記録する。
【0030】
動き検出部84は、記録部83に記録されている過去の相互相関係数γの各ピークの遅延量と、現在遅延測定部82から入力されている相互相関係数γの各ピークの遅延量との差から、移動物体があるか否かを検出する。移動物体があるか否かを検出することで、ユーザの存在を検出する。ユーザが存在する場合、反射音を示すピークの遅延量が変化する。これは、ユーザ(物体)が移動したために、音響伝達経路の環境が変化し、反射音の到達時間が変化したためである。動き検出部84は、この反射音の遅延量の変化を検知することでユーザが存在するか否かを検出することができる。
【0031】
なお、反射音の遅延量に少しでも変化があればユーザが存在すると判定してもよいし、所定の閾値を超える変化があればユーザが存在すると判定してもよい。また、遅延測定部82が遅延量を測定するタイミング(測定時間間隔)、および動き検出部84が遅延量の変化を測定するタイミングは、どのようなタイミングであってもよいが、比較回路81に収音信号が入力されたとき(所定レベル以上の収音信号が入力されたとき)に、これをトリガとし、その後収音信号が入力されなくなるまで周期的に(例えば数100ms毎に)測定すればよい。
【0032】
また、室内にユーザがいないときの相互相関係数γをリファレンスとして記録部83に記録しておき、このリファレンスの相互相関係数γの各ピークの遅延量と現在の相互相関係数γの各ピークの遅延量とを比較してユーザの存在を判定してもよい。
【0033】
図3において、動き検出部84は、ユーザの存在を検出した場合、収音処理部6に移動検出情報を出力する。収音処理部6は、移動検出情報を入力した場合、マイク2から入力された収音信号をエコーキャンセラに出力する(チャンネルをオンする)。移動検出情報を入力していなければ収音信号を出力しない(チャンネルをオフする)。ユーザが存在すると判断した場合にチャンネルをオンしておくことで、話頭欠けが発生することがない。また、上記移動検出情報を放音処理部7に出力し、放音処理部7が移動検出情報を入力したときのみ放音信号を出力するようにしてもよい。
【0034】
次に、図5は、エコーキャンセラ4の構成を示すブロック図である。エコーキャンセラ4は、適応型フィルタ41、および加算器42を含み、入出力I/F5から入力された音声信号(放音信号)を適応型フィルタ41、および後段の放音処理部7に入力する。適応型フィルタ41は、この放音信号をフィルタ処理し、スピーカ3からマイク2に回り込む回帰音声信号を擬似した擬似回帰音信号を生成する。加算器42は、この擬似回帰音信号を収音信号から減算することでエコー成分を除去する。エコー成分を除去した収音信号は、入出力I/F5に出力される。なお、エコー成分を除去した収音信号は、適応型フィルタ41に入力され、フィルタ係数の更新に用いられる。
なお、エコーキャンセラ4は、本発明において必須の構成要素ではないが、エコーキャンセラ4によりエコー成分を除去するため、放収音装置を音声会議に用いる場合に好適である。
【0035】
なお、マイク2およびスピーカ3は複数であってもよい。また、複数のマイクユニットを配列したマイクアレイ、複数のスピーカユニットを配列したスピーカアレイであってもよい。スピーカアレイを用いる場合、放音処理部7が各スピーカユニットに供給する音声信号の遅延量を制御することで放音の指向性を制御することができる。
【0036】
また、マイクアレイを用いる場合、収音処理部6が各マイクユニットから入力した音声信号の遅延量を制御することで収音の指向性(以下、収音ビームと言う。)を制御することができる。図6は、マイクアレイを備えた放収音装置10の構成を示すブロック図である。なお、同図において、図2に示した放収音装置1Aと共通する構成については同一の符号を付し、その説明を省略する。
【0037】
この放収音装置10は、複数のマイクユニット11、スピーカ3、エコーキャンセラ4、入出力インタフェース(I/F)5、収音処理部6、放音処理部7、比較処理部8、およびビーム制御部9を備えている。
【0038】
なお、同図においても、フロントエンドのアンプ、アナログ音声信号をデジタル変換するA/Dコンバータ、デジタル音声信号をアナログ変換するD/Aコンバータ、およびパワーアンプは省略している。
【0039】
ビーム制御部9は、各マイクユニット11から入力した収音信号を所定数(例えば4つ)に分岐し、それぞれに所定の遅延量を付与して合成する。各分岐した収音信号は、異なる位置(領域)の音声を収音するように遅延量が付与される。これにより、同時に複数の収音ビームを設定する。
【0040】
同時に複数の方向に収音ビームを設定する場合、それぞれの収音ビームについてユーザが存在するか否かを検出することができ、より精度の高い検出を行うことができる。
【0041】
また、一つの部屋にマイクアレイを備えた放収音装置を複数台設置する場合、以下のような応用例が可能である。
図7は、応用例に係る放収音システムの構成を示すブロック図である。この放収音システムは、ネットワークを介して接続される複数の放収音装置10A〜10Dを備えている。放収音装置10A〜10Dは、同じ部屋Eに設置されている。また、ユーザ101が放収音装置10Bの近くに存在する。放収音装置10A〜10Dは、全て図6に示した放収音装置10と同じ構成、同じ機能を有する。
【0042】
各放収音装置10A〜10Dは、互いに接続されており、音声情報を入力する。この音声情報から放音信号を生成し、音声を放音する。ここで、各収音装置10A〜10Dは、複数の収音ビーム毎に放音信号との相関を求め、収音ビーム毎にユーザの存在を検出する。ユーザの存在を検出した場合、最もユーザの位置に近い放収音装置が収音ビームを出力し、他の放収音装置は収音ビームを出力しない。また、最もユーザの位置に近い放収音装置のみ音声を放音し、他の放収音装置は音声を放音しない。これにより、ハウリングの発生を防止する。
【0043】
ユーザの位置と各装置との距離は収音レベルにより判断すればよい。各放収音装置は、ユーザの存在を検出した場合、その収音ビームのレベルを示す情報を送信する。各放収音装置は、他の放収音装置からレベルを示す情報を受信し、自装置の収音ビームのレベルと比較する。その結果、自装置の収音ビームのレベルが最も高ければ自装置がユーザに最も近い位置であると判断し、エコーキャンセラ4を通過した収音ビームをネットワークI/Fに出力し、放音信号に基づいて音声を放音する。なお、収音ビームを形成するために設定した遅延パターンを送受信するようにしてもよい。遅延パターンを参照することでも、各装置とユーザとの距離を推定することができる。また、各放収音装置からレベルを示す情報や遅延パターンを受信して調停する専用の装置(サーバ)を備え、このサーバが収音信号を出力する装置を指示するようにしてもよい。サーバが、最も移動物体に近い放収音装置に収音信号を出力するように設定する情報を放収音装置に送信すればよい。なお、サーバは、1つだけ設置されていてもよいし、複数設置されていてもよい。例えば、それぞれの放収音装置に1台ずつ設置されていてもよい。この場合、サーバ同士でレベルや遅延パターンの比較を行い、収音信号を出力する放収音装置を決定する。
【0044】
なお、各放収音装置は、ユーザの存在を検出した場合、ユーザが存在する旨を示す情報を他の装置に送信し、他の装置においてこの情報に基づいてユーザが存在する旨を表示部等に表示してもよい。
【0045】
以上のように、本実施形態の放収音システムによれば、ユーザが存在すると判断した場合にチャンネルをオンしておくことで、話頭欠けが発生することがない。無論、ユーザが存在しない場合には収音信号を出力しないため、処理負荷、通信負荷を軽減することができる。
【図面の簡単な説明】
【0046】
【図1】放収音システムの構成を示すブロック図である。
【図2】放収音装置の構成を示すブロック図である。
【図3】比較処理部8の構成を示すブロック図である。
【図4】放音信号と収音信号との相関を示す図である。
【図5】エコーキャンセラ4の構成を示すブロック図である。
【図6】マイクアレイを備えた放収音装置の構成を示すブロック図である。
【図7】応用例に係る放収音システムの構成を示すブロック図である。
【符号の説明】
【0047】
1−放収音装置
2−マイク
3−スピーカ
4−エコーキャンセラ
5−入出力I/F
6−収音処理部
7−放音処理部
8−比較処理部

【特許請求の範囲】
【請求項1】
装置周囲の音声を収音して収音信号を出力する収音部と、
他の装置から放音信号を受信する通信部と、
前記通信部が受信した前記放音信号を入力し、音声を放音する放音部と、
前記放音信号と前記収音信号との相関を求め、前記放音信号に対する反射音を測定する測定部と、
前記放音信号と前記収音信号との相関を記録する記録部と、
前記反射音の変化に基づいて、移動物体があるか否かを判定する判定部と、
前記検出部で前記移動物体を検出した場合に、前記通信部を介して前記収音信号を他の装置に送信する処理部と、
を備えた放収音装置。
【請求項2】
前記収音部は、複数のマイクユニットを配列してなるマイクアレイ、および各マイクユニットが収音した収音信号をそれぞれ遅延して合成することにより、複数の方向に指向性を有する複数の収音ビームを生成する収音処理部からなり、
前記測定部は、収音ビーム毎に反射音を測定し、
前記判定部は、収音ビーム毎に移動物体があるか否かを判定する請求項1に記載の放収音装置。
【請求項3】
請求項2に記載の放収音装置を複数接続してなる放収音システムであって、
前記放収音装置の処理部は、前記移動物体との距離を示す情報を他の装置と送受信し、
前記移動物体との距離を示す情報に基づいて前記移動物体との距離を求め、自装置が前記移動物体に最も近いと判断した場合に、前記収音信号を他の装置に送信する放収音システム。
【請求項4】
請求項2に記載の放収音装置を複数接続してなる放収音システムであって、
各放収音装置に接続され、前記移動物体に最も近い放収音装置に収音信号を送信するように設定する設定情報を各放収音装置に送信する調停装置をさらに備え、
前記放収音装置の処理部は、前記設定情報を受信し、この設定情報に基づいて、自装置が最も前記移動物体に近いと判断した場合に、前記収音信号を他の装置に送信する放収音システム。
【請求項5】
前記処理部は、自装置が前記移動物体に最も近いと判断した場合にのみ前記放音部に音声を放音させる請求項3、または請求項4に記載の放収音システム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate


【公開番号】特開2008−294600(P2008−294600A)
【公開日】平成20年12月4日(2008.12.4)
【国際特許分類】
【出願番号】特願2007−136182(P2007−136182)
【出願日】平成19年5月23日(2007.5.23)
【出願人】(000004075)ヤマハ株式会社 (5,930)
【Fターム(参考)】