説明

音声処理装置、音声処理方法、および音声処理プログラム

【課題】製造コストを抑制しつつ、複数の音声処理装置を相互に接続して使用する場合にエコーやハウリングの発生を抑止することができる音声処理装置、音声処理方法、および音声処理プログラムを提供する。
【解決手段】音声処理装置10は、他の音声処理装置10と通信を行うことによって、テスト音を出力するタイミングを決定する。音声処理装置10は、特定したタイミングで、順番にテスト音を所定の音量でスピーカから出力する。音声処理装置11は、音声処理装置12、13から送信されたテスト音を受信し、受信音量および到来方向を特定する。音声処理装置11は、音声処理装置12から送信されたテスト音を受信した場合の受信音量が所定値以上である場合、マイクのうち、音声処理装置12が配置されている方向に相当する到来方向の受信感度を減衰させる。音声処理装置11のマイクは、指向性パターン31にて示される指向性を有するように調整される。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音の入出力処理を行い、且つ、他の音声処理装置と接続して通信を行うことが可能な音声処理装置、音声処理方法、および音声処理プログラムに関する。
【背景技術】
【0002】
マイクによって集音した音声を、遠隔地に設置された他の音声処理装置に対してネットワークを介して送信すると同時に、ネットワークを介して遠隔地の音声を受信し、スピーカから出力する音声処理装置が知られている。このような音声処理装置は、遠隔会議システム等において広く使用されている。音声処理装置の一例として、スピーカフォンが挙げられる。音声処理装置には、通常、エコー除去の機能が搭載されている。音声処理装置は、エコー除去を機能させることによって、エコーやハウリングの発生を抑止することができる。例えば特許文献1では、エコー除去の機能を応用し、音響結合の利得を軽減させることによって、2以上のスピーカおよびマイクを備えた系においてエコーやハウリングの発生を抑止する技術が開示されている。
【0003】
同一拠点内で複数の音声処理装置を相互に接続し、使用することが可能な音声処理装置が知られている。このような音声処理装置では、拠点内の広い領域に音声処理装置を点在させることによって、会議音声の可聴範囲、および発話音の集音範囲を広げることができる。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2001−95084号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
従来のエコー除去は、単一の音声処理装置のスピーカおよびマイクが使用された場合に機能するように設定されている。このため、同一拠点内で複数の音声処理装置が接続された場合、従来のエコー除去ではエコーやハウリングの発生を十分抑止することができない可能性がある。一方で、特許文献1に記載された技術を用いた場合、同一拠点内で複数の音声処理装置が接続された場合でも、エコーやハウリングの発生を抑止することができることが想定される。しかしながらこの場合、音響結合の利得を制御するための複雑なアルゴリズムを音響処理装置に実装しなければならない。従って、音声処理装置の構成が複雑化したり、装置に含まれる部品点数が増加したりすることで、音声処理装置を安価に提供できないという問題点がある。
【0006】
本発明の目的は、装置構成の複雑化や、装置に含まれる部品点数の増加を抑制しつつ、複数の音声処理装置を相互に接続して使用する場合にエコーやハウリングの発生を抑止することができる音声処理装置、音声処理方法、および音声処理プログラムを提供することである。
【課題を解決するための手段】
【0007】
本発明の第一態様に係る音声処理装置は、マイクおよびスピーカを備えた音声処理装置であって、他の音声処理装置と通信を行う通信制御手段と、前記通信制御手段によって前記他の音声処理装置と通信を行うことによって、前記スピーカから所定音を出力するタイミングを特定する第一特定手段と、前記第一特定手段によって特定された前記タイミングで、前記スピーカから前記所定音を所定音量で出力する制御を行う出力制御手段と、前記他の音声処理装置に接続された他のスピーカから前記所定音量で出力された前記所定音を、前記マイクを介して取得した場合に、取得した前記所定音の音量および到来方向を特定する第二特定手段と、前記第二特定手段によって特定された前記音量および前記到来方向に基づき、前記音声処理装置に到来する音に対する感度の指向性である全体指向性を調整する第一調整手段であって、前記音声処理装置に向けて特定の方向から到来する音に対する感度が減衰するように前記全体指向性を調整する第一調整手段とを備えを備えている。
【0008】
第一態様によれば、複数の音声処理装置が相互に接続された状態で使用される場合であっても、他の音声処理装置から出力された音が要因でエコーやハウリングが発生することを抑止することができる。また、音声処理装置が通常備える周知のエコー除去機能をそのまま利用することができるため、新たにエコー除去のための特別な機能を音声処理装置に実装する必要がない。このため、音声処理装置の構成の複雑化や、装置に含まれる部品点数の増加を抑制しつつ、複数の音声処理装置が接続された場合のエコーやハウリングの発生を効率的に抑止することができる。
【0009】
第一態様において、前記第一調整手段は、前記第二特定手段によって特定された前記音量が所定閾値以上である場合に、前記音量に対応する前記到来方向の感度を減衰させることによって、前記全体指向性を調整してもよい。他の音声処理装置から出力される音の入力レベルを選択的に減衰させることで、エコーやハウリングの発生を効果的に抑止することができる。
【0010】
第一態様において、前記第一調整手段は、前記マイクを介して前記所定音を取得した場合の音量が前記所定閾値以内となるように、前記音量に対応する前記到来方向の感度を減衰させることによって、前記全体指向性を調整してもよい。これによって、他の音声処理装置から出力される音の入力レベルを、エコーやハウリングが発生しないレベルまで減衰させることができる。これによって、エコーやハウリングの発生を更に効果的に抑止することができる。
【0011】
第一態様において、前記スピーカから音を出力する場合の音量が変更された場合に、変更後の前記音量を特定するための情報を通知する変更通知を、前記他の音声処理装置に対して送信する送信手段と、前記他の音声処理装置によって送信された前記変更通知を受信する受信手段と、前記受信手段によって前記変更通知を受信した場合に、前記変更通知によって通知された前記情報に基づいて、前記第一調整手段によって調整された前記全体指向性を再調整する第二調整手段とを備えていてもよい。他の音声処理装置のスピーカから出力される音の音量が変更された場合、エコーやハウリングの発生を抑止するために必要な全体指向性も、再度調整する必要がある。これに対して本態様では、他の音声処理装置のスピーカから出力される音の変更後の音量に基づいて全体指向性を再調整することによって、音声処理装置に対して到来方向から到来する音に対する感度を減衰させることができる。これによって音声処理装置は、全体指向性を最適な状態に再調整することができる。また、全体指向性は自動的に調整されるので、再度、他の音声処理装置のスピーカから所定音を出力させることによって全体指向性を最初から設定しなおす手間を省くことができる。
【0012】
第一態様において、前記送信手段は、変更前後での前記音量の差分を算出し、前記差分を通知するための前記変更通知を送信し、前記第二調整手段は、前記変更通知によって通知された前記差分に基づいて、前記第一調整手段によって調整された前記全体指向性を再調整してもよい。音声処理装置は、他の音声処理装置のスピーカから出力される音の音量の変更前後での差分に基づいて、全体指向性を再調整し、到来方向から到来する音に対する感度を減衰させることができる。これによって音声処理装置は、他の音声処理装置のスピーカから出力される音の音量の変化の程度に応じ、全体指向性を最適な状態に調整することができる。
【0013】
第一態様において、前記マイクが音を集音する場合の感度が変更された場合に、変更前後での前記感度の差分を算出し、算出した前記差分に基づいて、前記第一調整手段によって調整された前記全体指向性を再調整する第二調整手段とを備えていてもよい。マイクの感度が変更された場合、エコーやハウリングの発生を抑止するために必要な全体指向性も、再度調整する必要がある。これに対して本発明では、感度の変更前後での差分を算出し、差分に基づいて全体指向性を再調整することによって、到来方向から到来する音に対する感度を減衰させることができる。これによって音声処理装置は、マイクの感度の変化の程度に応じ、全体指向性を最適な状態に再調整することができる。また、差分に応じて全体指向性は自動的に調整されるので、再度、他の音声処理装置のスピーカから所定音を出力させることによって全体指向性を最初から設定しなおす手間を省くことができる。
【0014】
第一態様において、前記第一特定手段は、前記通信制御手段によって、前記音声処理装置および前記他の音声処理装置に対して順番に割り当てられる識別情報に基づいて、前記タイミングを決定してもよい。音声処理装置は、所定音を出力するタイミングを容易に決定することができる。音声処理装置を使用するユーザや、音声処理装置を制御する制御機器によって、音声処理装置から所定音を所定のタイミングで出力させることを要することなく、音声処理装置は、独自にタイミングを判断して所定音を出力することができる。
【0015】
本発明の第二態様に係る音声処理方法は、他の音声処理装置と通信を行う通信制御ステップと、前記通信制御ステップによって前記他の音声処理装置と通信を行うことによって、音声処理装置のスピーカから所定音を出力するタイミングを特定する第一特定ステップと、前記第一特定ステップによって特定された前記タイミングで、前記スピーカから前記所定音を所定音量で出力する制御を行う出力制御ステップと、前記他の音声処理装置に接続された他のスピーカから前記所定音量で出力された前記所定音を、前記音声処理装置のマイクを介して取得した場合に、取得した前記所定音の音量および到来方向を特定する第二特定ステップと、前記第二特定ステップによって特定された前記音量および前記到来方向に基づき、前記音声処理装置に到来する音に対する感度の指向性である全体指向性を調整する第一調整ステップであって、前記音声処理装置に向けて特定の方向から到来する音に対する感度が減衰するように前記全体指向性を調整する第一調整ステップとを備えている。第二態様によれば、第一態様と同様の効果を奏することができる。
【0016】
本発明の第三態様に係る音声処理プログラムは、他の音声処理装置と通信を行う通信制御ステップと、前記通信制御ステップによって前記他の音声処理装置と通信を行うことによって、音声処理装置のスピーカから所定音を出力するタイミングを特定する第一特定ステップと、前記第一特定ステップによって特定された前記タイミングで、前記スピーカから前記所定音を所定音量で出力する制御を行う出力制御ステップと、前記他の音声処理装置の制御によって、前記他の音声処理装置に接続された他のスピーカから前記所定音量で出力された前記所定音を、前記音声処理装置のマイクを介して取得した場合に、取得した前記所定音の音量および到来方向を特定する第二特定ステップと、前記第二特定ステップによって特定された前記音量および前記到来方向に基づき、前記音声処理装置に到来する音に対する感度の指向性である全体指向性を調整する第一調整ステップであって、前記音声処理装置に向けて特定の方向から到来する音に対する感度が減衰するように前記全体指向性を調整する第一調整ステップとを前記音声処理装置のコンピュータに実行させる。第三態様によれば、第一態様と同様の効果を奏することができる。
【図面の簡単な説明】
【0017】
【図1】音声処理装置10を含む会議システム1の概要、および音声処理装置10の電気的構成を示す図である。
【図2】状態テーブル231の第一例を示す模式図である。
【図3】メイン処理を示すフローチャートである。
【図4】メイン処理を示すフローチャートであって、図3の続きである。
【図5】メイン処理を示すフローチャートであって、図4の続きである。
【図6】全体指向性のパターンを示す図である。
【図7】状態テーブル231の第二例を示す模式図である。
【図8】音声処理装置10のネットワーク構成を示す図である。
【発明を実施するための形態】
【0018】
以下、本発明の一実施形態について、図面を参照して説明する。これらの図面は、本発明が採用しうる技術的特徴を説明するために用いられるものである。記載されている装置の構成、各種処理のフローチャート等は、それのみに限定する趣旨ではなく、単なる説明例である。
【0019】
図1を参照し、会議システム1の概要について説明する。会議システム1は、音声処理装置11、12、13、およびPC15を備えている。音声処理装置11、12、13、およびPC15は、同一拠点(以下、自拠点ともいう)内に設置されている。音声処理装置11、12、13、およびPC15は、通信ケーブルによってディジーチェーン接続している。ディジーチェーンとは、複数の装置を数珠つなぎに連結する接続方法を示す。音声処理装置11は、PC15および音声処理装置12と接続している。音声処理装置12は、音声処理装置11、13と接続している。PC15は、インターネット網16にも接続している。従って会議システム1では、(インターネット網16、)PC15、音声処理装置11、12、13の順に接続されていることになる。以下、音声処理装置11、12、13を区別しない場合または総称する場合、これらを音声処理装置10という。
【0020】
音声処理装置10は、PC15およびインターネット網16を介し、自拠点とは異なる他拠点に設置された他のPC(図示外)および他の音声処理装置(図示外)と通信を行うことができる。音声処理装置10は、マイク25(後述)によって集音した音声のデータを、インターネット網16を介して他の音声処理装置に送信すると同時に、インターネット網16を介して他の音声処理装置から音声のデータを受信し、スピーカ24から音声を出力する。音声処理装置10を使用する自拠点のユーザは、他の音声処理装置を使用する他拠点の他のユーザとの間で、音声による遠隔会議を行うことができる。
【0021】
また会議システム1では、音声処理装置11、12、13を自拠点内の広い領域に点在させることができる。そして、他拠点に設置された他の音声処理装置から送信された音声のデータに基づく音声を、音声処理装置11、12、13のスピーカ24(後述)から出力させることができる。これによって、スピーカ24から出力される音声が広範にわたる領域で聞こえるようにすることができる。また音声処理装置10は、自拠点内の音声を隅々まで集音し、他拠点に設置された他の音声処理装置に対して音声データを送信することができる。
【0022】
なお図1のシステム構成は本発明の一例であり、他のシステム構成であってもよい。例えばインターネット網16の代わりに、固定電話網、移動電話網、専用通信網等、周知の様々な外部通信網が使用され、自拠点と他拠点との間で通信が実行されてもよい。音声処理装置10は、PC15の代わりに、音声処理装置10以外の様々な機器(固定電話機、携帯電話機、ルータ、モデム等)を介して外部通信網と接続してもよい。また音声処理装置10は、外部通信網と直接接続してもよい。
【0023】
また会議システム1において、PC15にディスプレイおよびカメラが接続されてもよい。PC15は、カメラによって撮影された自拠点の映像のデータを、インターネット網16を介して他のPCに送信すると同時に、インターネット網16を介して他のPCから映像のデータを受信し、ディスプレイに映像を表示してもよい。これによって自拠点のユーザは、他拠点の他のユーザとの間で、映像および音声による遠隔会議を行うことができる。
【0024】
音声処理装置10の電気的構成について説明する。音声処理装置10は、音声処理装置10の制御を司るCPU20を備えている。CPU20は、ROM21、RAM22、フラッシュメモリ23、スピーカ24、マイク25、通信インタフェース(以下、通信I/Fという。)26、および入力部27と電気的に接続している。ROM21には、ブートプログラム、BIOS、OS等が記憶される。RAM22には、タイマやカウンタ、一時的なデータが記憶される。またRAM22には、スピーカ24から出力される音の音量の設定値、およびマイク25の感度の設定値が記憶される。以下、スピーカ24から出力される音の音量の設定値としてRAM22に記憶された情報を、スピーカ音量という。マイク25の感度の設定値としてRAM22に記憶された情報を、マイク感度という。ユーザは、入力部27(後述)を操作することによって、スピーカ音量およびマイク感度を設定することができる。
【0025】
フラッシュメモリ23には、CPU20の制御プログラムが記憶される。またフラッシュメモリ23には、後述する状態テーブル231(図2参照)が記憶される。更にフラッシュメモリ23には、後述するテスト音のデータ、およびテスト音の音量であるテスト音量が記憶される。スピーカ24は、RAM22に記憶されたスピーカ音量で音を出力することができる。マイク25は、RAM22に記憶されたマイク感度で音を集音することができる。マイク25は、音声処理装置10の周囲に複数設けられている。CPU20は、其々のマイク25によって集音した音の音量、および、其々のマイク25における音の集音タイミングの時間差に基づき、集音した音の到来方向を特定することができる。またCPU20は、其々のマイク25によって集音した音の増幅度を調節することによって、マイク25全体としての指向性を調整することができる。以下、マイク25全体としての指向性を、全体指向性という。通信I/F26は、他の音声処理装置10およびPC15と通信を行うためのインタフェースである。なお音声処理装置10は、異なる二つの他の装置と接続することによってディジーチェーン接続を実現している。このため、異なる二つの他の装置の其々と通信を行うために、通信I/F26は二つ以上設けられる。入力部27は、スピーカ音量およびマイク感度を設定するためのボタンである。
【0026】
音声処理装置10には、周知のエコー除去機能が搭載されている。音声処理装置10は、音声処理装置10のスピーカ24から出力された音をマイク25が集音することによって発生するエコーやハウリングを、エコー除去を機能させることによって抑止することができる。しかしながら、例えば音声処理装置11のマイク25によって、音声処理装置12、13のスピーカ24から出力された音が集音された場合、音声処理装置11はエコー除去を有効に機能させることができない場合がある。エコー除去の機能は、マイク25によって集音された音に基づき、自装置のスピーカ24から出力される音をフィードバック制御によって調節し、エコーやハウリングを抑止するためである。従って音声処理装置11は、接続されている他の音声処理装置12、13のスピーカ24から出力された音がエコーやハウリングの要因となっている場合、音声処理装置12、13のスピーカ24から出力される音を調節することができないため、エコーやハウリングを抑止することができない。
【0027】
これに対して本実施形態における音声処理装置11は、全体指向性を調整し、音声処理装置12、13のスピーカ24から出力された音がマイク25によって集音される場合の音量を小さくする。これによって音声処理装置11は、音声処理装置12、13のスピーカ24から出力された音が要因となってエコーやハウリングが発生することを抑止することができる。また音声処理装置11は、音声処理装置11のスピーカ24から出力された音が要因となってエコーやハウリングが発生することを、周知のエコー除去機能を利用して抑止することができる。従って音声処理装置11は、相互に接続した音声処理装置12、13が自拠点内に設置される場合でも、エコーやハウリングのないクリアな音声環境で遠隔会議を行うことができる。以下詳説する。
【0028】
図2を参照し、音声処理装置11のフラッシュメモリ23に記憶された状態テーブル231について説明する。状態テーブル231は、音声処理装置11が全体指向性を調整する場合に参照するテーブルである。状態テーブル231には、受信音量および音の到来方向を示す情報が、音声処理装置10のIDに対応付けて記憶されている。受信音量は、到来方向から到来した音を集音した場合の音量である。到来方向は、音声処理装置10の所定方向に対する角度で示されている。状態テーブル231の作成方法、および参照方法についての詳細は後述する。
【0029】
図3から図5を参照し、音声処理装置10が実行するメイン処理について説明する。以下説明するメイン処理は、フラッシュメモリ23に記憶されている音声処理プログラムに従って、音声処理装置10のCPU20が実行する。メイン処理は、音声処理装置10の電源がONされた場合に、フラッシュメモリ23に記憶されたメイン処理用のプログラムが起動されて開始される。そして、CPU20がこのプログラムを実行することにより行われる。なおCPU20では、メイン処理以外にも様々な周知の音響処理(エコーキャンセル処理など)が並列して実行されている。これらについての説明は、以下では省略している。なおRAM22には、メイン処理の起動時において、変数ID、X、およびMが定義される。
【0030】
メイン処理が開始されると、CPU20は、IDに0を記憶することによってIDを初期化する(S11)。CPU20は、他の音声処理装置10またはPC15が通信I/F26(図1参照)を介して接続されたかを判断する(S13)。他の音声処理装置10またはPC15が接続されていないと判断した場合(S13:NO)、他の音声処理装置10またはPC15が接続されるのを継続して監視するために、処理はS13に戻る。一方、音声処理装置10またはPC15が接続されたと判断した場合(S13:YES)、CPU20は、PC15が接続されたかを判断する(S15)。具体的には、通信ケーブルに含まれている信号の電気的な状態(例えばプルアップ状態など)を検出することによって、PC15が接続されたか否かを判断する。なお、PC15が接続されたか否かを判断する方法はこの方法に限定されない。例えば装置間が通信ケーブルを介して接続された場合、互いの種別を通知するための初期通信が実行されてもよい。CPU20は、初期通信によってPC15が接続されたか否かを判断してもよい。PC15が接続されたと判断した場合(S15:YES)、CPU20は、IDに1を記憶する(S17)。これによって、音声処理装置10のIDが決定される。CPU20は、決定したIDを通知するためのID通知データを、通信ケーブルを介して接続された他の音声処理装置10に対して送信する(S19)。処理はS29に進む。
【0031】
一方、S15で、PC15が接続されていないと判断した場合(S15:NO)、音声処理装置10には他の音声処理装置10が接続されたことになる。CPU20は、接続された状態のPC15または他の音声処理装置10から送信されたID通知データを受信したかを判断する(S21)。ID通知データを受信したと判断した場合(S21:YES)、CPU20は、受信したID通知データによって通知されたIDに1を加算した値を、IDに記憶する(S23)。これによって、音声処理装置10のIDが決定される。CPU20は、決定したIDを通知するためのID通知データを、通信ケーブルを介して接続された他の音声処理装置10に対して送信する(S25)。処理はS29に進む。
【0032】
他方、S21で、ID通知データを受信していないと判断した場合(S21:NO)、CPU20は、ディジーチェーン接続の終端に接続した状態であるかを判断する(S27)。CPU20は、通信I/F26の一方側に他の音声処理装置10またはPC15が接続されており、他方側に他の音声処理装置10およびPC15のいずれも接続されていない場合、ディジーチェーン接続の終端に接続した状態であると判断する。ディジーチェーン接続の終端に接続した状態であると判断した場合(S27:YES)、他の音声処理装置10またはPC15が新たに接続されるのを継続して監視するために、処理はS13に戻る。一方、ディジーチェーン接続の終端に接続した状態でないと判断した場合(S27:NO)、PC15または他の音声処理装置10から送信されたID通知データを受信するのを継続して監視するために、処理はS21に戻る。
【0033】
S29において、CPU20は、S19またはS25でID通知データを送信してから所定時間が経過したかを判断する(S29)。所定時間が経過していないと判断した場合(S29:NO)、処理はS29に戻る。所定時間が経過したと判断した場合(S29:YES)、処理はS31(図4参照)に進む。
【0034】
例えば、音声処理装置10が図1に示すようにディジーチェーン接続している場合、音声処理装置11は、PC15が接続された場合(S15:YES)、IDとして1を決定し(S17)、通信ケーブルを介して接続した音声処理装置12に対してID通知データを送信する(S19)。音声処理装置12は、音声処理装置11からID通知データを受信し(S21:YES)、IDとして2を決定する(S23)。音声処理装置12は、通信ケーブルを介して接続した音声処理装置13に対してID通知データを送信する(S25)。音声処理装置13は、音声処理装置12からID通知データを受信し(S21:YES)、IDとして3を決定する(S23)。以上のようにして、音声処理装置11、12、13のIDが、其々1、2、3として決定される。
【0035】
図4に示すように、CPU20は、Xに1を記憶することによって初期化する(S31)。CPU20は、状態テーブル231(図2参照)に記憶されたID、受信音量、および到来方向を削除し、状態テーブル231をクリアする(S33)。CPU20は、RAM22に記憶されたスピーカ音量に0を記憶する(S35)。
【0036】
CPU20は、ディジーチェーン接続した音声処理装置10の総数とXとが等しいかを判断する(S37)。Xが総数よりも小さい場合(S37:NO)、CPU20は、XとIDとが一致するかを判断する(S39)。XとIDとが一致すると判断した場合(S39:YES)、CPU20は、RAM22のスピーカ音量に、フラッシュメモリ23のテスト音量を記憶する(S41)。CPU20は、フラッシュメモリ23のテスト音のデータに基づき、スピーカ24からテスト音を出力する(S43)。テスト音はテスト音量でスピーカ24から出力される。スピーカ24からのテスト音の出力が終了した後、CPU20は、RAM22のスピーカ音量に0を記憶する(S45)。CPU20は、Xに1を加算することによってXを更新する(S47)。処理はS37に戻る。
【0037】
一方、S39で、XとIDとが一致しないと判断した場合(S39:NO)、CPU20は、他の音声処理装置10のスピーカ24からテスト音が出力されているかを判断する(S49)。マイク25を介してテスト音を受信することができない場合、CPU20は、他の音声処理装置10がテスト音を出力していないと判断する(S49:NO)。この場合、継続してテスト音の受信を監視するために、処理はS49に戻る。一方、マイク25を介してテスト音を受信した場合、他の音声処理装置10のスピーカ24からテスト音が出力されたと判断する(S49:YES)。CPU20は、マイク25を介して受信したテスト音の受信音量と到来方向を特定する(S51)。CPU20は、この時点でのXを、テスト音を出力した他の音声処理装置10のIDとして特定する。CPU20は、特定した受信音量および到来方向を、特定した他の音声処理装置10のIDに対応付けて、状態テーブル231(図2参照)に記憶する(S53)。CPU20は、Xに1を加算することによってXを更新する(S55)。処理はS37に戻る。
【0038】
S47、およびS55においてXが繰り返し更新され、Xが総数と等しくなった場合(S37:YES)、処理はS61(図5参照)に進む。
【0039】
例えば図1において、音声処理装置11、12、13のIDが、其々1、2、3として決定されている場合、はじめにID 1の音声処理装置11のスピーカ24から、テスト音がテスト音量で出力される(S43)。音声処理装置12、13は、音声処理装置11のスピーカ24から出力されたテスト音を、マイク25を介して受信し、その受信音量および到来方向を特定する(S51)。音声処理装置12、13は、特定した受信音量および到来方向を、ID 1に対応付けて、フラッシュメモリ23の状態テーブル231(図2参照)に記憶する。次に、ID 2の音声処理装置12のスピーカ24から、テスト音がテスト音量で出力される(S43)。音声処理装置11、13は、音声処理装置12のスピーカ24から出力されたテスト音を、マイク25を介して受信し、その受信音量および到来方向を特定する(S51)。音声処理装置11、13は、特定した受信音量および到来方向を、ID 2に対応付けて、状態テーブル231(図2参照)に記憶する。同様の処理が、音声処理装置13のスピーカ24からテスト音が出力された場合にも繰り返される。
【0040】
図5に示すように、CPU20は、Mに1を記憶することによって初期化する(S61)。CPU20は、状態テーブル231のうちID Mに対応する受信音量が、所定値(例えば70dB)以上であるかを判断する(S63)。なお所定値は、他の音声処理装置10のスピーカ24から出力された音がマイク25を介して受信された場合に、ハウリングやエコーが発生する可能性のある最小の音量に設定される。ID Mに対応する受信音量が所定値未満である場合(S63:NO)、ID Mの音声処理装置10のスピーカ24から出力される音の音量は十分小さく、エコーやハウリングの発生の要因となる可能性は低い。CPU20は、Mに1を加算することによってMを更新する(S69)。更新したMに基づいて受信音量の判断を繰り返し実行するために、処理はS63に戻る。
【0041】
一方、状態テーブル231のうちID Mに対応する受信音量が所定値以上である場合(S63:YES)、ID Mの音声処理装置10のスピーカ24から出力される音の音量は大きく、エコーやハウリングの発生の要因となる可能性が高い。従って、ID Mの音声処理装置10のスピーカ24から出力される音がマイク25によって集音される場合の受信音量を小さくすることによって、エコーやハウリングの発生を抑制する必要がある。CPU20は、状態テーブル231のうちID Mに対応する到来方向の感度を下げることによって、全体指向性を調整する(S65)。CPU20は、ディジーチェーン接続した音声処理装置10の総数とMとが等しいかを判断する(S67)。Mが総数よりも小さい場合(S67:NO)、CPU20は、Mに1を加算することによってMを更新する(S69)。更新したMに基づいて受信音量の判断を繰り返し実行するため、処理はS63に戻る。S69においてMが繰り返し更新され、Mが総数と等しくなった場合(S67:YES)、全体指向性の調整は終了する。処理はS71に進む。
【0042】
図6は、S61〜S69の処理によって調整された、音声処理装置11〜13の全体指向性のパターンを示している。音声処理装置11(ID:1)、12(ID:2)、13(ID:3)は、左から右側に向かって順番に一直線上に並んで配置されていたとする。そして、音声処理装置11において、図2に示す状態テーブル231が作成されたとする。音声処理装置11、12間の距離は小さいため、図2にて示されているように、音声処理装置12(ID:2)から出力されたテスト音が音声処理装置11において集音された場合の受信音量は大きくなっている(75dB)。この値は所定値(70dB)よりも大きいため(S63:YES、図5参照)、全体指向性が調整される(S65、図5参照)。調整の具体的な方法は次のとおりである。音声処理装置11は、音声処理装置12から送信されたテスト音を受信した場合の受信音量(75dB)が所定値(70dB)以下となるように、到来方向(0deg、図2参照)に近い位置に配置されているマイク25の感度を減衰させる。これによって、音声処理装置11に対して到来方向(0deg)から到来する音の感度を5dB分減衰させる。
【0043】
一方、音声処理装置11、13間の距離は十分大きいため、音声処理装置13(ID:3)から出力されたテスト音が音声処理装置11において集音された場合の受信音量は小さくなっている(63dB、図2参照)。この値は所定値(70dB)よりも小さいため(S63:NO、図5参照)、全体指向性は調整されない。以上の結果、図6に示すように、音声処理装置11の全体指向性のパターン31は、音声処理装置11に対して音声処理装置12が配置されている方向(図6の右方向)の感度が、他の方向の感度に比べて5dB分小さくなっている。
【0044】
一方、音声処理装置12では、音声処理装置11との間の距離、および、音声処理装置13との間の距離の両方が小さくなっている。従って音声処理装置12の全体指向性のパターン32は、音声処理装置12に対して音声処理装置11が配置されている方向(図6の左方向)、および、音声処理装置12に対して音声処理装置13が配置されている方向(図6の右方向)の両方の感度が、他の方向の感度に比べて小さくなっている。
【0045】
以上のように音声処理装置10では、音声処理装置10に向けて特定の方向から到来する音に対する感度を減衰させることによって、他の音声処理装置10から出力された音を受信した場合の受信音量を選択的に減衰させることができる。これによって音声処理装置10は、他の音声処理装置10から出力された音が要因となってエコーやハウリングが発生することを効果的に抑止できる。また音声処理装置10は、他の音声処理装置10から出力された音を受信した場合の受信音量が所定値以下となるように、特定の方向に近い位置に配置されたマイク25の感度を調整し、全体指向性を調整する。これによって、エコーやハウリングが発生しないレベルまで受信音量を効率的に減衰させることができる。これによって音声処理装置10は、エコーやハウリングの発生を更に効果的に抑止することができる。
【0046】
図5に示すように、全体指向性が調整された後、CPU20は、他拠点に設置された他の音声処理装置との間で音声のデータの通信を行うことによって、音声による遠隔会議を開始する。遠隔会議の開始後、CPU20は、スピーカ音量を変更する操作が入力部27を介してユーザによって行われたかを判断する(S71)。スピーカ音量を変更する操作が行われたと判断した場合(S71:YES)、CPU20は、変更後のスピーカ音量をRAM22に記憶する。CPU20は、スピーカ24から出力される音の音量を、RAM22に記憶したスピーカ音量に基づいて変更する。
【0047】
音声処理装置10のスピーカ音量が変更された場合、他の音声処理装置10では、S65で調整した全体指向性を、変更後のスピーカ音量に基づいて再調整する必要がある。CPU20は、変更前のスピーカ音量と変更後のスピーカ音量との差分を他の音声処理装置10に対して通知するための変更通知データを、通信ケーブルを介して接続された他の音声処理装置10に対して送信する(S73)。処理はS61に戻る。
【0048】
S71で、スピーカ音量を変更する操作が行われていないと判断した場合(S71:NO)、CPU20は、他の音声処理装置10から変更通知データを受信したかを判断する(S75)。変更通知データを受信したと判断した場合(S75:YES)、CPU20は、ディジーチェーン接続された全ての音声処理装置10に変更通知データが到達するように、変更通知データを中継転送する。例えば音声処理装置12(図1参照)が音声処理装置11(図1参照)から変更通知データを受信した場合、音声処理装置12のCPU20は、受信した変更通知データを音声処理装置13(図1参照)に対して中継転送する。次にCPU20は、受信した変更通知データによって通知された差分に基づいて、状態テーブル231の内容を更新する。具体的には以下の通りである。
【0049】
CPU20は、状態テーブル231のうち、変更通知データを送信した音声処理装置10のIDに対応する受信音量を選択する。CPU20は、受信した変更通知データによって通知された差分を、選択した受信音量に加算することによって、状態テーブル231を更新する(S79)。例えば、他の音声処理装置10においてスピーカ音量が10dB分大きくなるように変更されていたとする。この場合、変更通知データによって通知される差分は+10dBとなる。CPU20は、通知された差分+10dBを、状態テーブル231から選択した受信音量に加算することで、状態テーブル231を更新する。処理はS61に戻る。
【0050】
CPU20は、更新した状態テーブル231に基づいて、其々のIDに対応する受信音量が所定値以上であるかを判断する(S63)。受信音量が所定値未満である場合(S63:NO)、変更後のスピーカ音量で他の音声処理装置10のスピーカ24から出力される音野音量は十分小さく、エコーやハウリングの発生の要因となる可能性は低い。この場合、全体指向性は再調整されない。一方、受信音量が所定値以上である場合(S63:YES)、変更後のスピーカ音量で他の音声処理装置10のスピーカ24から出力される音の音量は大きく、エコーやハウリングの発生の要因となる可能性が高い。従って、エコーやハウリングの発生を抑制するために、CPU20は全体指向性を再調整する(S65)。具体的には、スピーカ音量が変更された他の音声処理装置10が配置されている方向を、状態テーブル231の到来方向によって特定し、特定した方向に近い位置に配置されたマイク25の感度を減衰させることによって、全体指向性を再調整する。詳細は、テスト音を使用して実行された全体指向性の調整方法と同一であるので、説明を省略する。
【0051】
他の音声処理装置10のスピーカ音量が変更された場合、エコーやハウリングの発生を抑止するために必要な全体指向性も、再度調整される必要がある。これに対して本実施形態では、他の音声処理装置10における変更後のスピーカ音量に基づいて、全体指向性を再調整することができる。これによって音声処理装置10は、全体指向性を最適な状態に再調整することができる。また、スピーカ音量の変更前後での差分に応じて全体指向性が調整されるので、再度、他の音声処理装置10のスピーカ24からテスト音を出力させることによって全体指向性を最初から設定しなおす手間を省くことができる。従って音声処理装置10は、全体指向性を迅速に再調整することができる。
【0052】
さらに音声処理装置10は、他の音声処理装置10のスピーカ音量の変更前後での差分に基づいて全体指向性を再調整することによって、他の音声処理装置10のスピーカ24から出力される音の音量の変化の程度に応じ、全体指向性を最適な状態に調整することができる。
【0053】
S75で、変更通知データを受信していないと判断した場合(S75:NO)、CPU20は、マイク感度を変更する操作が入力部27を介してユーザによって行われたかを判断する(S77)。マイク感度を変更する操作が行われていないと判断した場合(S77:NO)、処理はS81に進む。一方、マイク感度を変更する操作が行われたと判断した場合(S77:YES)、CPU20は、変更後のマイク感度をRAM22に記憶する。CPU20は、マイク25を介して音を集音する場合の感度を、RAM22に記憶したマイク感度に基づいて変更する。
【0054】
音声処理装置10のマイク感度が変更された場合、S65で調整した全体指向性を、変更後のマイク感度に基づいて再調整する必要がある。CPU10は、変更前後でのマイク感度の差分を算出する。CPU20は、算出した差分を、状態テーブル231に記憶されているすべての受信音量に加算することによって、状態テーブル231を更新する(S79)。例えば、マイクの感度が10dB分小さくなるように変更されていたとする。この場合、変更前後でのマイク感度の差分は−10dBとなる。CPU20は、算出された差分−10dBを、状態テーブル231に記憶されたすべての受信音量に加算することで、状態テーブル231を更新する。処理はS61に戻る。
【0055】
CPU20は、更新した状態テーブル231に基づいて、其々のIDに対応する受信音量が所定値以上であるかを判断する(S63)。受信音量が所定値未満である場合(S63:NO)、変更後のマイク感度で他の音声処理装置10のスピーカ24から出力された音を受信した場合、受信音量は十分小さく、エコーやハウリングの発生の要因となる可能性は低い。この場合、全体指向性は再調整されない。一方、受信音量が所定値以上である場合(S63:YES)、変更後のマイク感度で他の音声処理装置10のスピーカ24から出力された音を受信した場合、受信音量は大きくなり、エコーやハウリングの発生の要因となる可能性が高い。従って、エコーやハウリングの発生を抑制するために、CPU20は全体指向性を再調整する(S65)。具体的には、状態テーブル231のうち所定値よりも大きい受信音量に対応する到来方向の近くに配置されたマイク25の感度を減衰させることによって、全体指向性を再調整する。詳細は、テスト音を使用して実行されたマイク25の指向性の調整方法と同一であるので、説明を省略する。
【0056】
マイク25の感度が変更された場合、エコーやハウリングの発生を抑止するために必要な全体指向性も再度調整される必要がある。これに対して本実施形態では、感度の変更前後での差分を算出し、差分に基づいて全体指向性を再調整することができる。これによって音声処理装置10は、マイク25の感度の変化の程度に応じ、全体指向性を最適な状態に再調整することができる。また、差分に応じて全体指向性が調整されるので、再度、他の音声処理装置10のスピーカ24からテスト音を出力させることによって全体指向性を最初から設定しなおす手間を省くことができる。従って音声処理装置10は、全体指向性を迅速に再調整することができる。
【0057】
S81において、CPU20は、ディジーチェーン接続された状態の音声処理装置10に対して新たに別の音声処理装置10が接続されたかを判断する(S81)。別の音声処理装置10が接続されたと判断した場合(S81:YES)、テスト音を出力することによって全体指向性を調整する処理を最初から実行するために、処理はS31(図4参照)に戻る。別の音声処理装置10が接続されていないと判断した場合(S81:NO)、処理はS71に戻る。
【0058】
以上説明したように、音声処理装置10は、複数の音声処理装置10が相互に接続され、同一拠点内に設置された状態で使用される場合であっても、他の音声処理装置10から出力された音が要因でエコーやハウリングが発生することを抑止することができる。また、音声処理装置10が通常備える周知のエコー除去機能をそのまま利用することができるため、新たにエコー除去のための特別な機能を音声処理装置10に実装する必要がない。このため、音声処理装置10のコストを抑制しつつ、複数の音声処理装置10が接続された場合のエコーやハウリングの発生を効率的に抑止することができる。
【0059】
また音声処理装置10は、ID通知データの通信を行うことによって、テスト音を出力するタイミングを容易に決定することができる。従って、音声処理装置10を使用するユーザや、音声処理装置10を制御する制御機器によって、音声処理装置10からテスト音を所定のタイミングで出力させる制御を行うことを要することなく、音声処理装置10は、独自にタイミングを判断してテスト音を出力することができる。
【0060】
なお、S19、S25の処理を行うCPU20が本発明の「通信制御手段」に相当する。S39の処理を行うCPU20が本発明の「第一特定手段」に相当する。S43の処理を行うCPU20が本発明の「出力制御手段」に相当する。S51の処理を行うCPU20が本発明の「第二特定手段」に相当する。S65の処理を行うCPU20が本発明の「第一調整手段」「第二調整手段」に相当する。S73の処理を行うCPU20が本発明の「送信手段」に相当する。S75の処理を行うCPU20が本発明の「受信手段」に相当する。S19、S25の処理が本発明の「通信制御ステップ」に相当する。S23の処理が本発明の「第一特定ステップ」に相当する。S43の処理が本発明の「出力制御ステップ」に相当する。S51の処理が本発明の「第二特定ステップ」に相当する。S65の処理が本発明の「第一調整ステップ」に相当する。
【0061】
なお本発明は上述の実施形態に限定されず、種々の変更が可能である。上述では、音声処理装置10はディジーチェーン接続されていたが、他の接続形態、例えばツリー型、リング型、スター型等の接続形態で音声処理装置10が接続されてもよい。音声処理装置10は、通信ケーブルによって相互に接続されていたが、音声処理装置10は無線によって相互に接続されてもよい。音声処理装置10は、スピーカ24およびマイク25を備えていない構成であってもよく、外部のスピーカおよびマイクを接続可能とする構成であってもよい。
【0062】
上述では、音声処理装置10間でID通知データの通信を行うことによって、其々の音声処理装置10がIDを決定していた。また音声処理装置10は、決定したIDの順番でテスト音を送信していた。これに対し、PC15が音声処理装置10にID通知データを送信することによって、PC15が音声処理装置10のIDを一括決定してもよい。また、PC15が音声処理装置10に制御信号を送信することによって、其々の音声処理装置10がテスト音を出力するタイミングが制御されてもよい。例えば音声処理装置10は、PC15から通知されたタイミングで、テスト音を出力してもよい。
【0063】
例えば音声処理装置10は、テスト音を出力するタイミングで、RAM22のスピーカ音量にテスト音量を記憶する制御のみを行ってもよい。PC15は、音声処理装置10に対して継続的にテスト音のデータを送信してもよい。音声処理装置10は、PC15から受信したテスト音のデータに基づき、スピーカ音量にテスト音量が記憶されている場合にのみ、テスト音をスピーカ24から出力してもよい。
【0064】
音声処理装置10は、状態テーブル231に記憶された受信音量を到来方向毎に加算してもよい。音声処理装置10は、加算した受信音量が所定値以上となった場合に、対応する到来方向の感度が減衰するように全体指向性を調整してもよい。
【0065】
全体指向性の調整方法は、上述の実施形態に限定されない。上述において音声処理装置10は、状態テーブル231の受信音量が所定値以上である場合に、受信音量が所定値となる様にマイク25の感度を調整していた。これに対し、所定値から所定のマージン分を減算し、受信音量がこの値となるように、マイク25の感度を調整してもよい。
【0066】
上述において音声処理装置10は、スピーカ音量の差分を通知する変更通知データを他の音声処理装置10に対して送信していた。これに対して音声処理装置10は、変更後のスピーカ音量を通知する変更通知データを他の音声処理装置10に対して送信してもよい。また音声処理装置10は、このような変更通知データを他の音声処理装置10から受信した場合、受信した変更通知データによって通知された変更後のスピーカ音量をテスト音量から減算することによって差分を算出してもよい。音声処理装置10は、算出した差分に基づいて、全体指向性を再調整してもよい。
【0067】
状態テーブル231に記憶された情報に基づき、音声処理装置10のネットワーク構成を特定してもよい。例えば図8に示す状態テーブル231が音声処理装置11において作成されたとする。ID 3の音声処理装置13から出力されたテスト音が集音された場合の受信音量(85dB)の方が、ID 2の音声処理装置12から出力されたテスト音が集音された場合の受信音量(75dB)よりも大きくなっている。この場合、音声処理装置12よりも音声処理装置13の方が、音声処理装置11の近くに配置されていることになる。またID 3の音声処理装置13から出力されたテスト音の到来方向は45degとなっている。従って音声処理装置11は、図9に示すように、音声処理装置11、12が並んで配置されており、音声処理装置13が音声処理装置11側に近づくように且つ音声処理装置11に対して45度の位置に配置されていることを認識する。音声処理装置11は、認識したネットワーク構成に基づいて全体指向性を調節することができるようになる。このように音声処理装置11は、テスト音の受信音量および到来方向に基づいて、音声処理装置11、12、13のネットワーク構成を特定し、特定したネットワーク構成に基づいて全体指向性を調節することができる。
【符号の説明】
【0068】
1 会議システム
10、11、12、13 音声処理装置
23 フラッシュメモリ
24 スピーカ
25 マイク
231 状態テーブル

【特許請求の範囲】
【請求項1】
マイクおよびスピーカを備えた音声処理装置であって、
他の音声処理装置と通信を行う通信制御手段と、
前記通信制御手段によって前記他の音声処理装置と通信を行うことによって、前記スピーカから所定音を出力するタイミングを特定する第一特定手段と、
前記第一特定手段によって特定された前記タイミングで、前記スピーカから前記所定音を所定音量で出力する制御を行う出力制御手段と、
前記他の音声処理装置に接続された他のスピーカから前記所定音量で出力された前記所定音を、前記マイクを介して取得した場合に、取得した前記所定音の音量および到来方向を特定する第二特定手段と、
前記第二特定手段によって特定された前記音量および前記到来方向に基づき、前記音声処理装置に到来する音に対する感度の指向性である全体指向性を調整する第一調整手段であって、前記音声処理装置に向けて特定の方向から到来する音に対する感度が減衰するように前記全体指向性を調整する第一調整手段と
を備えたことを特徴とする音声処理装置。
【請求項2】
前記第一調整手段は、
前記第二特定手段によって特定された前記音量が所定閾値以上である場合に、前記音量に対応する前記到来方向の感度を減衰させることによって、前記全体指向性を調整することを特徴とする請求項1に記載の音声処理装置。
【請求項3】
前記第一調整手段は、
前記マイクを介して前記所定音を取得した場合の音量が前記所定閾値以内となるように、前記音量に対応する前記到来方向の感度を減衰させることによって、前記全体指向性を調整することを特徴とする請求項2に記載の音声処理装置。
【請求項4】
前記スピーカから音を出力する場合の音量が変更された場合に、変更後の前記音量を特定するための情報を通知する変更通知を、前記他の音声処理装置に対して送信する送信手段と、
前記他の音声処理装置によって送信された前記変更通知を受信する受信手段と、
前記受信手段によって前記変更通知を受信した場合に、前記変更通知によって通知された前記情報に基づいて、前記第一調整手段によって調整された前記全体指向性を再調整する第二調整手段と
を備えたことを特徴とする請求項1から3のいずれかに記載の音声処理装置。
【請求項5】
前記送信手段は、変更前後での前記音量の差分を算出し、前記差分を通知するための前記変更通知を送信し、
前記第二調整手段は、
前記変更通知によって通知された前記差分に基づいて、前記第一調整手段によって調整された前記全体指向性を再調整することを特徴とする請求項4に記載の音声処理装置。
【請求項6】
前記マイクが音を集音する場合の感度が変更された場合に、変更前後での前記感度の差分を算出し、算出した前記差分に基づいて、前記第一調整手段によって調整された前記全体指向性を再調整する第二調整手段を備えたことを特徴とする請求項1から3のいずれかに記載の音声処理装置。
【請求項7】
前記第一特定手段は、
前記通信制御手段によって、前記音声処理装置および前記他の音声処理装置に対して順番に割り当てられる識別情報に基づいて、前記タイミングを特定することを特徴とする請求項1から6のいずれかに記載の音声処理装置。
【請求項8】
他の音声処理装置と通信を行う通信制御ステップと、
前記通信制御ステップによって前記他の音声処理装置と通信を行うことによって、音声処理装置のスピーカから所定音を出力するタイミングを特定する第一特定ステップと、
前記第一特定ステップによって特定された前記タイミングで、前記スピーカから前記所定音を所定音量で出力する制御を行う出力制御ステップと、
前記他の音声処理装置に接続された他のスピーカから前記所定音量で出力された前記所定音を、前記音声処理装置のマイクを介して取得した場合に、取得した前記所定音の音量および到来方向を特定する第二特定ステップと、
前記第二特定ステップによって特定された前記音量および前記到来方向に基づき、前記音声処理装置に到来する音に対する感度の指向性である全体指向性を調整する第一調整ステップであって、前記音声処理装置に向けて特定の方向から到来する音に対する感度が減衰するように前記全体指向性を調整する第一調整ステップと
を備えたことを特徴とする音声処理方法。
【請求項9】
他の音声処理装置と通信を行う通信制御ステップと、
前記通信制御ステップによって前記他の音声処理装置と通信を行うことによって、音声処理装置のスピーカから所定音を出力するタイミングを特定する第一特定ステップと、
前記第一特定ステップによって特定された前記タイミングで、前記スピーカから前記所定音を所定音量で出力する制御を行う出力制御ステップと、
前記他の音声処理装置の制御によって、前記他の音声処理装置に接続された他のスピーカから前記所定音量で出力された前記所定音を、前記音声処理装置のマイクを介して取得した場合に、取得した前記所定音の音量および到来方向を特定する第二特定ステップと、
前記第二特定ステップによって特定された前記音量および前記到来方向に基づき、前記音声処理装置に到来する音に対する感度の指向性である全体指向性を調整する第一調整ステップであって、前記音声処理装置に向けて特定の方向から到来する音に対する感度が減衰するように前記全体指向性を調整する第一調整ステップと
を前記音声処理装置のコンピュータに実行させるための音声処理プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate


【公開番号】特開2013−78010(P2013−78010A)
【公開日】平成25年4月25日(2013.4.25)
【国際特許分類】
【出願番号】特願2011−217119(P2011−217119)
【出願日】平成23年9月30日(2011.9.30)
【出願人】(000005267)ブラザー工業株式会社 (13,856)
【Fターム(参考)】