音声出力較正システム及び音声出力較正方法

【課題】音声出力較正システム及び音声出力較正方法を提供する。
【解決手段】本発明に係る音声出力較正システムは、座標系を構築し且つカメラ及びスピーカーの位置座標を記録する設定モジュールと、カメラがリスナーを検知した際に、リスナーの座標位置を確定する検知モジュールと、スピーカーとリスナーとの間の距離を計算し且つリスナーから一番遠いスピーカーを指定し、指定スピーカー及び非指定スピーカーの音声信号の強度の比率及び音声信号の出力時間の時間差をそれぞれ計算する計算モジュールと、前記時間差に基づいて非指定スピーカーの音声信号の出力時間を遅延させて、非指定スピーカーを指定スピーカーと同時に信号を出力させ、且つ前記強度の比率に基づいて非指定スピーカーの音声信号の強度を調節して、非指定スピーカーを指定スピーカーと同じ強度の音声信号を出力させる較正モジュールと、を備える。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、音声較正技術に関し、特に複数のスピーカーの音声出力に対して較正を行うシステム及びその較正方法に関するものである。
【背景技術】
【０００２】
会議室等に設置された音響設備は、通常複数のスピーカーを介して音声を出力する。その際、リスナーの音声に対する感受は、スピーカーの設置位置及びリスナー本人の位置によってそれぞれ異なる。例えば、会議中にスピーカーが移動したり或いはリスナーが常に動いている場合、スピーカーからリスナーまでの距離が変化して、音声出力の時間及び強度に差異が生じる。その結果、リスナーの聴覚感受にも差異が生じる。
【０００３】
そこで、それぞれのリスナーに、均一な音響効果をもたらすために、予め複数のスピーカーの各々の取付位置を決めて、その音響効果を確認しなければならない。しかし、スピーカーの取付位置及びリスナーの位置は、実際の状況に応じて変わるので、リスナーはその度快適な音響効果を得ることができない。
【発明の概要】
【発明が解決しようとする課題】
【０００４】
以上の問題点に鑑みて、本発明は、複数のスピーカーが出力した音声を較正することによって、リスナーがどの位置にいても均一な音響効果を得ることができる音声出力較正システム及び音声出力較正方法を提供することを目的とする。
【課題を解決するための手段】
【０００５】
上記の目的を達成するために、本発明に係る音声出力較正システムは、複数のスピーカー及び人の有無を識別する機能を持つ少なくとも二つのカメラに接続された電子装置に用いられる。前記音声出力較正システムは、前記カメラ及び／或いは前記スピーカーの位置に基づいて座標系を構築し、且つ各カメラ及び各スピーカーの位置座標を記録する設定モジュールと、前記カメラがリスナーを感知した際に、リスナーの座標位置を確定する検知モジュールと、リスナー及び各スピーカーの位置座標に基づいて各スピーカーとリスナーとの間の距離を計算し、且つリスナーから一番遠いスピーカーを指定し、前記指定スピーカーが出力した音声信号と各非指定スピーカーが出力した音声信号との強度の比率をそれぞれ計算し、且つ前記指定スピーカーの音声信号の出力時間と各非指定スピーカーの音声信号の出力時間との時間差をそれぞれ計算する計算モジュールと、前記時間差に基づいて各非指定スピーカーの信号出力時間をそれぞれ遅延させて、各非指定スピーカーを前記指定スピーカーと同時に音声信号を出力させ、且つ前記強度の比率に基づいて各非指定スピーカーが出力した音声信号の強度を調節して、各非指定スピーカーを前記指定スピーカーと同じ強度の音声信号を出力させる較正モジュールと、を備える。
【０００６】
また、上記の目的を達成するために、本発明に係る音声出力較正方法は、複数のスピーカー及び人の有無を識別する機能を持つ少なくとも二つのカメラに接続された電子装置に用いられる。前記音声出力較正方法は、前記カメラ及び／或いは前記スピーカーの位置に基づいて座標系を構築し、且つ前記カメラ及び各スピーカーの位置座標を記録するステップと、前記カメラがリスナーを感知した際に、リスナーの位置座標を確定するステップと、リスナー及び各スピーカーの位置座標に基づいて、各スピーカーとリスナーとの間の距離を計算し、且つリスナーから一番遠いスピーカーを指定するステップと、前記指定スピーカーと各非指定スピーカーとが出力した音声信号の強度の比率、及び前記指定スピーカーの音声信号の出力時間と各非指定スピーカーの音声信号の出力時間との時間差をそれぞれ計算するステップと、前記時間差に基づいて各非指定スピーカーの信号出力時間をそれぞれ遅延させて、各非指定スピーカーを前記指定スピーカーと同時に音声信号を出力させ、且つ前記強度の比率に基づいて各非指定スピーカーの音声信号の強度を調節して、各非指定スピーカーを前記指定スピーカーと同じ強度の音声信号を出力させるステップと、を備える。
【発明の効果】
【０００７】
従来の技術と比較して、本発明の音声出力較正システム及び音声出力較正方法は、複数のスピーカーが出力する音声に対して較正することができる。これにより、リスナーがどの位置にいても、均一な音響効果を得ることができる。
【図面の簡単な説明】
【０００８】
【図１】本発明の実施形態に係る音声出力較正システムを示す図である。
【図２】本発明の実施形態に係る音声出力較正システムの機能ブロック図である。
【図３】本発明の実施形態に係る音声出力較正システムの座標系の構造を示す図である。
【図４】本発明の実施形態に係る音声出力較正方法のフローチャートである。
【発明を実施するための形態】
【０００９】
図１に示したように、本発明の実施形態に係る音声出力較正システム２は電子装置１に使用される。前記電子装置１には、少なくとも二つのカメラ３０、３２及び複数のスピーカー４０、４２が接続されている。説明を簡潔にするため、本発明の実施形態では二つのカメラ３０、３２及び二つのスピーカー４０、４２を例として説明する。但し実際の応用において、前記カメラ及び前記スピーカーの数は二つに限定されるものではない。
【００１０】
前記電子装置１は、音響設備等の装置或いは音響設備に接続される独立した電子装置である。前記音声出力較正システム２は、リスナーの位置を確定するために用いられ、且つ複数の前記スピーカー４０、４２が出力した音声に対して較正を行うことにより、複数の前記スピーカー４０、４２に同じ強度の音声信号を同時に出力させる。
【００１１】
前記カメラ３０、３２は、人の顔を感知することにより人の有無を識別する機能を備える。前記カメラ３０、３２は、起動された後に回転しながら撮影してリスナーの有無を識別する。また、本発明の他の実施形態では、前記カメラ３０、３２は、一般のカメラでもよく、前記電子装置１に人の顔を識別できるソフトウェアを設けることによって、撮影された影像を分析処理し、リスナーの有無を確認する。
【００１２】
図２に示したように、前記電子装置１は、処理器１０及び記憶装置１２を備える。前記処理器１０は、前記電子装置１の内部にインストールされた各種のソフトウェアを実行する。例えば、前記音声出力較正システム２或いは操作システム等のアプリケーションソフトを実行する。
【００１３】
前記記憶装置１２は、撮影された影像、前記音声出力較正システム２を利用して設置及び計算して得たデータ等のような各種のデータを格納するために用いられる。前記記憶装置１２は、前記電子装置１の内部記憶装置であり、ポータブルなメモリーカード或いはフラッシュメモリー等である。
【００１４】
前記音声出力較正システム２は、設定モジュール２０、検知モジュール２２、計算モジュール２４及び較正モジュール２６を備える。前記設定モジュール２０は、前記カメラ３０、３２及び／或いは前記スピーカー４０、４２の位置に基づいて座標系を構築し、且つ前記カメラ３０、３２及び各スピーカー４０、４２の位置座標を記録する。
【００１５】
例えば、図３に示している座標系において、前記カメラ３０を点Ａ１、前記カメラ３２を点Ａ２とし、前記カメラ３０、３２の最短距離の中間点を原点Ｏとする。また前記スピーカー４０をＢ１、前記スピーカー４２をＢ２とする。カメラ間の距離及び各カメラとスピーカーとの間の距離は、実際の測定によってデータを獲得できる。従って、以下に述べる計算において、前記カメラ３０及び前記カメラ３２の間の距離Ｌ、カメラＡ１とスピーカーＢ１との間の距離Ｅ、及びカメラＡ２とスピーカーＢ２との間の距離Ｆは、既知の距離であり、また前記座標系において、前記カメラ３０、３２及び前記スピーカー４０、４２の位置も固定されているので、前記カメラ３０、３２及び前記スピーカー４０、４２の位置座標も既知のものである。
【００１６】
上記座標系の構築方法及び以下に述べる計算方法は、例に挙げたものであり、これに限定されるものではない。実際の必要に応じて、スピーカーの位置をもって座標系を確定し或いはカメラとスピーカーとの位置関係をもって座標系を確定する等の方式で直角座標系を構築したり、球面座標系等の他のタイプの座標系を構築したりすることができる。また、この座標系の既知位置の情報を利用して、異なる方式で前記各装置の相対位置を計算する方法はこれに限定されるものではない。
【００１７】
実際の使用において、前記座標系は仮想座標系であり、ユーザーはカメラ間の距離、スピーカー間の距離及びカメラとスピーカーとの間の距離を示すデータを前記音声出力較正システム２に入力するだけで、自動的に計算を行い、その結果を得ることできる。
【００１８】
前記検知モジュール２２は、前記カメラ３０、３２が撮影した影像の中から人の顔を感知した際に、リスナーの存在を確定する。例えば、前記カメラ３０、３２により撮影された影像に映し出された人の顔が前記影像の広角の中間に位置すると、前記検知モジュール２２は、リスナーの存在を確定する。また、前記検知モジュール２２は、リスナーが感知された際にリスナーの位置座標を確定するためにも用いられる。例えば、カメラの回転角度及びカメラ間の距離に基づいてリスナーの位置座標を計算する。
【００１９】
前記カメラ３０、３２は、回転しがら影像を撮影する。影像中の人の顔が感知されると、前記検知モジュール２２は前記カメラ３０、３２の回転角度を得る。図３に示した座標系を例とすると、前記カメラ３０、３２の前記座標系におけるＡ１、Ａ２点は、それぞれ一つの垂直線（破線で示す）が通る。前記カメラ３０、３２が二つの前記垂直線に対して回転した角度θ１、θ２は既知角度である。前記カメラ３０が角度θ１回転し並びに前記カメラ３２が角度θ２回転すると、前記検知モジュール２２はリスナーＰを検知する。ここでリスナーＰの座標を（Ｐ１，Ｐ２）と仮定する。
【００２０】
上記の角度θ１及び角度θ２によって、α角及びβ角を計算することができる。例えば、α角の値はθ１＋９０度であり、β角の値はθ２＋９０度である。次に、以下の公式で前記カメラ３０からリスナーＰまでの距離ａ及び前記カメラ３２からリスナーＰまでの距離ｂを計算する。
【００２１】
【数１】

【００２２】
ａ及びｂの数値を得れば、リスナーＰの座標（Ｐ１，Ｐ２）を確定することができる。即ち、P1=L÷2+a×cos(180°-α)；P2=a×sin(180°-α)。また、他の数学計算方法でリスナーＰの座標位置を確定することも可能である。
【００２３】
前記計算モジュール２４は、リスナー及び前記スピーカー４０、４２の位置座標に基づいて、前記スピーカー４０、４２からリスナーまでの距離をそれぞれ計算する役割を果たしている。例えば、前記スピーカー４０からリスナーまでの距離はｄ_ｎであり、前記スピーカー４２からリスナーまでの距離はｄ_ｆである。
【００２４】
また、前記計算モジュール２４は、リスナーから一番遠いスピーカーを指定するためにも用いられる。例えば、図３に示したように、ｄ_ｆ＞ｄ_ｎの場合、前記スピーカー４２を指定スピーカーとし、前記スピーカー４０を非指定スピーカーとする。
【００２５】
さらに、前記計算モジュール２４は、前記指定スピーカーが出力した音声信号の強度と前記非指定スピーカーが出力した音声信号の強度との比率を計算し、且つ前記指定スピーカーが音声信号を出力する時間と各非指定スピーカーが音声信号を出力する時間との時間差をそれぞれ計算する。
【００２６】
例えば、本発明の実施形態において、非指定スピーカー（例えば、スピーカー４０）が出力した信号の強度をＳ_ｎと仮定し、指定スピーカー（例えば、スピーカー４２）が出力した信号の強度をＳ_ｆと仮定すると、前記計算モジュール２４は、公式S_n=S_f×(d_n÷d_f)²に基づいて前記指定スピーカーと各非指定スピーカーとの音声信号の強度比率を計算する。
【００２７】
前記非指定スピーカー（例えば、スピーカー４０）からリスナーまでの距離が前記指定スピーカー（例えば、スピーカー４２）からリスナーまでの距離より短いので、前記非指定スピーカー（スピーカー４０）が出力する音声信号は、前記指定スピーカー（スピーカー４２）より早くリスナーの耳に入る。だから、前記非指定スピーカー（スピーカー４０）の信号出力時間を遅延させて、前記非指定スピーカーの信号出力時間と前記指定スピーカーの信号出力時間とを一致させる必要がある。そこで、本発明の実施形態では、非指定スピーカー（スピーカー４０）が音声信号を出力する時間点をＴ_ｎと仮定し、指定スピーカー（スピーカー４２）が音声信号を出力する時間点をＴ_ｆと仮定し、且つＴ_ｎ=Ｔ_ｆ+(d_f-d_n)÷cのように設定する。この公式において、ｃは音速である。音速ｃは、実際の状況に応じて変更することができる。例えば、空気中で１５℃の条件で伝播される際の音速は約３４０ｍ／ｓであり、空気中で２８℃の条件で伝播される際の音速は約３４８．５ｍ／ｓである。
【００２８】
前記公式Ｔ_ｎ=Ｔ_ｆ+(d_f-d_n)÷cから分かるように、Ｔ_ｎ＞Ｔ_ｆ。即ち、本発明は、公式Ｔ_ｎ=Ｔ_ｆ+(d_f-d_n)÷cを介して前記非指定スピーカー（スピーカー４０）の音声信号の出力時間点を前記指定スピーカー（スピーカー４２）の音声信号の出力時間点より遅くさせている。前記計算モジュール２４は、この公式Ｔ_ｎ=Ｔ_ｆ+(d_f-d_n)÷cに基づいて、前記指定スピーカーと各非指定スピーカーとの音声信号出力時間の時間差をそれぞれ計算する。
【００２９】
前記較正モジュール２６は、上記の計算により得られた時間差に基づいて、各非指定スピーカー（例えばスピーカー４０）の音声信号出力時間をそれぞれ遅延させることによって、各非指定スピーカーと前記指定スピーカー（例えばスピーカー４２）とを同時に音声信号を出力させる。例えば、前記時間差が２秒であれば、前記較正モジュール２６は、前記非指定スピーカーの音声信号の出力時間を２秒ほど遅延させて、前記非指定スピーカーを前記指定スピーカーと同時に音声信号を出力させるようにする。
【００３０】
また、前記較正モジュール２６は、計算により得られた音声信号の強度比率に基づいて各非指定スピーカーが出力した音声信号の強度を調節して、各非指定スピーカー（例えばスピーカー４０）を前記指定スピーカー（例えばスピーカー４２）と同じ強度の音声信号を出力させる。例えば、前記スピーカー４０と前記スピーカー４２との音声信号の強度比率が１／２である場合、前記スピーカー４０の音声信号の強度を増強するか又は前記スピーカー４２の音声信号の強度を低減することにより、前記スピーカー４０及び前記スピーカー４２を同じ強度の音声信号を出力させるようにする。
【００３１】
しかし、上記の計算方式は、例に挙げたものであって、実際の使用において、これらに限定されるものではなく、異なる数学方法に基づいて上記のデータを計算することもできる。
【００３２】
図４に示したように、本発明の実施形態に係る音声出力較正方法は、以下のステップを備える。
【００３３】
ステップ１では、前記設定モジュール２０は、前記カメラ３０、３２及び／或いは前記スピーカー４０、４２の位置に基づいて座標系を構築し、且つ前記カメラ３０、３２及び各スピーカー４０、４２の位置座標を記録する。
【００３４】
ステップ２では、前記検知モジュール２２は、前記カメラ３０、３２を利用してリスナーが感知されたかどうかを判断する。例えば、前記カメラ３０、３２により撮影された影像に映し出された人の顔は、前記影像の広角の中間に位置すると、前記検知モジュール２２はリスナーの存在を確定し、ステップ３へと移る。しかし、もしリスナーが検知されなければ、ステップ２に戻って検知を続ける。
【００３５】
ステップ３では、前記検知モジュール２２は、リスナーの位置座標を確定する。例えば、カメラの回転角度及びカメラ間の距離に基づいてリスナーの位置座標を計算する。
【００３６】
ステップ４では、前記計算モジュール２４は、リスナー及びスピーカー４０、４２の位置座標に基づいて前記スピーカー４０、４２とリスナーとの間の距離を計算する。例えば、前記スピーカー４０とリスナーとの間の距離はｄ_ｎであり、前記スピーカー４２とリスナーとの間の距離はｄ_ｆである。
【００３７】
ステップ５では、前記計算モジュール２４は、リスナーから一番遠いスピーカーを指定する。例えば、図３に示したように、ｄ_ｆ＞ｄ_ｎの場合、前記スピーカー４２は指定スピーカーであり、前記スピーカー４０は非指定スピーカーである。
【００３８】
ステップ６では、前記計算モジュール２４は、前記指定スピーカー４２が出力した音声信号の強度と前記非指定スピーカー４０が出力した音声信号の強度との比率を計算する。
【００３９】
ステップ７では、前記計算モジュール２４は、前記指定スピーカー４２が音声信号を出力する時間と各非指定スピーカー４０が音声信号を出力する時間との時間差を計算する。。
【００４０】
ステップ８では、前記較正モジュール２６は、計算により得られた時間差に基づいて各非指定スピーカー４０の信号出力時間をそれぞれ遅延させて、各非指定スピーカー４０と前記指定スピーカー４２とを同時に音声信号を出力させる。また、前記音声信号の強度比率に基づいて各非指定スピーカー４０が出力した音声信号の強度を調節して、各非指定スピーカー４０を前記指定スピーカー４２と同じ強度の音声信号を出力させる。
【００４１】
以上、本発明の好適な実施形態について詳細に説明したが、本発明は前記実施形態に限定されるものではなく、本発明の範囲内で種々の変形又は修正が可能であり、該変形又は修正も又、本発明の特許請求の範囲内に含まれるものであることは、いうまでもない。
【符号の説明】
【００４２】
１電子装置
２音声出力較正システム
１０処理器
１２記憶装置
２０設定モジュール
２２検知モジュール
２４計算モジュール
２６較正モジュール
３０、３２カメラ
４０、４２スピーカー

【特許請求の範囲】
【請求項１】
複数のスピーカー及び人の有無を識別する機能を持つ少なくとも二つのカメラに接続された電子装置に用いられる音声出力較正システムであって、
前記カメラ及び／或いは前記スピーカーの位置に基づいて座標系を構築し、且つ各カメラ及び各スピーカーの位置座標を記録する設定モジュールと、
前記カメラがリスナーを感知した際に、リスナーの座標位置を確定する検知モジュールと、
リスナー及び各スピーカーの位置座標に基づいて各スピーカーとリスナーとの間の距離を計算し、且つリスナーから一番遠いスピーカーを指定し、前記指定スピーカーが出力した音声信号と各非指定スピーカーが出力した音声信号との強度の比率をそれぞれ計算し、且つ前記指定スピーカーの音声信号の出力時間と各非指定スピーカーの音声信号の出力時間との時間差をそれぞれ計算する計算モジュールと、
前記時間差に基づいて各非指定スピーカーの信号出力時間をそれぞれ遅延させて、各非指定スピーカーを前記指定スピーカーと同時に音声信号を出力させ、且つ前記強度の比率に基づいて各非指定スピーカーが出力した音声信号の強度を調節して、各非指定スピーカーを前記指定スピーカーと同じ強度の音声信号を出力させる較正モジュールと、
を備えることを特徴とする音声出力較正システム。
【請求項２】
前記構築された座標系は、二つの前記カメラの間の最短距離の中間点を原点とすることを特徴とする請求項１に記載の音声出力較正システム。
【請求項３】
前記検知モジュールは、前記カメラが撮影した影像に映し出された人の顔が前記影像の広角の中間に位置すると、リスナーが検知されたことを確定することを特徴とする請求項１に記載の音声出力較正システム。
【請求項４】
前記検知モジュールは、カメラの回転角度及びカメラ間の距離に基づいてリスナーの位置座標を計算することを特徴とする請求項１に記載の音声出力較正システム。
【請求項５】
前記計算モジュールは、下記の公式に基づいて前記指定スピーカーが出力した音声信号の強度と各非指定スピーカーが出力した音声信号の強度の比率を計算することを特徴とする請求項１に記載の音声出力較正システム。
S_n=S_f×(d_n÷d_f)²
（ただし、Ｓ_ｎは非指定スピーカーが出力する信号の強度を示し、Ｓ_ｆは指定スピーカーが出力する信号の強度を示し、ｄ_ｎは非指定スピーカーとリスナーとの間の距離を示し、ｄ_ｆは指定スピーカーとリスナーとの間の距離を示す）
【請求項６】
前記計算モジュールは、下記の公式に基づいて、前記指定スピーカーが音声信号を出力する時間と各非指定スピーカーが音声信号を出力する時間との時間差をそれぞれ計算することを特徴とする請求項５に記載の音声出力較正システム。
Ｔ_n=Ｔ_f+(d_f-d_n)÷c
（ただし、Ｔ_ｎは非指定スピーカーの音声信号の出力時間を示し、Ｔ_ｆは指定スピーカーの音声信号の出力時間を示し、ｃは音速である）
【請求項７】
複数のスピーカー及び人の有無を識別する機能を持つ少なくとも二つのカメラに接続された電子装置に用いられる音声出力較正方法であって、
前記カメラ及び／或いは前記スピーカーの位置に基づいて座標系を構築し、且つ前記カメラ及び各スピーカーの位置座標を記録するステップと、
前記カメラがリスナーを感知した際に、リスナーの位置座標を確定するステップと、
リスナー及び各スピーカーの位置座標に基づいて各スピーカーとリスナーとの間の距離を計算し、且つリスナーから一番遠いスピーカーを指定するステップと、
前記指定スピーカーと各非指定スピーカーとが出力した音声信号の強度の比率、及び前記指定スピーカーの音声信号の出力時間と各非指定スピーカーの音声信号の出力時間との時間差をそれぞれ計算するステップと、
前記時間差に基づいて各非指定スピーカーの信号出力時間をそれぞれ遅延させて、各非指定スピーカーを前記指定スピーカーと同時に音声信号を出力させ、且つ前記強度の比率に基づいて各非指定スピーカーの音声信号の強度を調節して、各非指定スピーカーを前記指定スピーカーと同じ強度の音声信号を出力させるステップと、
を備えることを特徴とする音声出力較正方法。

【図１】