説明

音声出力較正システム及び音声出力較正方法

【課題】音声出力較正システム及び音声出力較正方法を提供する。
【解決手段】本発明に係る音声出力較正システムは、座標系を構築し且つカメラ及びスピーカーの位置座標を記録する設定モジュールと、カメラがリスナーを検知した際に、リスナーの座標位置を確定する検知モジュールと、スピーカーとリスナーとの間の距離を計算し且つリスナーから一番遠いスピーカーを指定し、指定スピーカー及び非指定スピーカーの音声信号の強度の比率及び音声信号の出力時間の時間差をそれぞれ計算する計算モジュールと、前記時間差に基づいて非指定スピーカーの音声信号の出力時間を遅延させて、非指定スピーカーを指定スピーカーと同時に信号を出力させ、且つ前記強度の比率に基づいて非指定スピーカーの音声信号の強度を調節して、非指定スピーカーを指定スピーカーと同じ強度の音声信号を出力させる較正モジュールと、を備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、音声較正技術に関し、特に複数のスピーカーの音声出力に対して較正を行うシステム及びその較正方法に関するものである。
【背景技術】
【0002】
会議室等に設置された音響設備は、通常複数のスピーカーを介して音声を出力する。その際、リスナーの音声に対する感受は、スピーカーの設置位置及びリスナー本人の位置によってそれぞれ異なる。例えば、会議中にスピーカーが移動したり或いはリスナーが常に動いている場合、スピーカーからリスナーまでの距離が変化して、音声出力の時間及び強度に差異が生じる。その結果、リスナーの聴覚感受にも差異が生じる。
【0003】
そこで、それぞれのリスナーに、均一な音響効果をもたらすために、予め複数のスピーカーの各々の取付位置を決めて、その音響効果を確認しなければならない。しかし、スピーカーの取付位置及びリスナーの位置は、実際の状況に応じて変わるので、リスナーはその度快適な音響効果を得ることができない。
【発明の概要】
【発明が解決しようとする課題】
【0004】
以上の問題点に鑑みて、本発明は、複数のスピーカーが出力した音声を較正することによって、リスナーがどの位置にいても均一な音響効果を得ることができる音声出力較正システム及び音声出力較正方法を提供することを目的とする。
【課題を解決するための手段】
【0005】
上記の目的を達成するために、本発明に係る音声出力較正システムは、複数のスピーカー及び人の有無を識別する機能を持つ少なくとも二つのカメラに接続された電子装置に用いられる。前記音声出力較正システムは、前記カメラ及び/或いは前記スピーカーの位置に基づいて座標系を構築し、且つ各カメラ及び各スピーカーの位置座標を記録する設定モジュールと、前記カメラがリスナーを感知した際に、リスナーの座標位置を確定する検知モジュールと、リスナー及び各スピーカーの位置座標に基づいて各スピーカーとリスナーとの間の距離を計算し、且つリスナーから一番遠いスピーカーを指定し、前記指定スピーカーが出力した音声信号と各非指定スピーカーが出力した音声信号との強度の比率をそれぞれ計算し、且つ前記指定スピーカーの音声信号の出力時間と各非指定スピーカーの音声信号の出力時間との時間差をそれぞれ計算する計算モジュールと、前記時間差に基づいて各非指定スピーカーの信号出力時間をそれぞれ遅延させて、各非指定スピーカーを前記指定スピーカーと同時に音声信号を出力させ、且つ前記強度の比率に基づいて各非指定スピーカーが出力した音声信号の強度を調節して、各非指定スピーカーを前記指定スピーカーと同じ強度の音声信号を出力させる較正モジュールと、を備える。
【0006】
また、上記の目的を達成するために、本発明に係る音声出力較正方法は、複数のスピーカー及び人の有無を識別する機能を持つ少なくとも二つのカメラに接続された電子装置に用いられる。前記音声出力較正方法は、前記カメラ及び/或いは前記スピーカーの位置に基づいて座標系を構築し、且つ前記カメラ及び各スピーカーの位置座標を記録するステップと、前記カメラがリスナーを感知した際に、リスナーの位置座標を確定するステップと、リスナー及び各スピーカーの位置座標に基づいて、各スピーカーとリスナーとの間の距離を計算し、且つリスナーから一番遠いスピーカーを指定するステップと、前記指定スピーカーと各非指定スピーカーとが出力した音声信号の強度の比率、及び前記指定スピーカーの音声信号の出力時間と各非指定スピーカーの音声信号の出力時間との時間差をそれぞれ計算するステップと、前記時間差に基づいて各非指定スピーカーの信号出力時間をそれぞれ遅延させて、各非指定スピーカーを前記指定スピーカーと同時に音声信号を出力させ、且つ前記強度の比率に基づいて各非指定スピーカーの音声信号の強度を調節して、各非指定スピーカーを前記指定スピーカーと同じ強度の音声信号を出力させるステップと、を備える。
【発明の効果】
【0007】
従来の技術と比較して、本発明の音声出力較正システム及び音声出力較正方法は、複数のスピーカーが出力する音声に対して較正することができる。これにより、リスナーがどの位置にいても、均一な音響効果を得ることができる。
【図面の簡単な説明】
【0008】
【図1】本発明の実施形態に係る音声出力較正システムを示す図である。
【図2】本発明の実施形態に係る音声出力較正システムの機能ブロック図である。
【図3】本発明の実施形態に係る音声出力較正システムの座標系の構造を示す図である。
【図4】本発明の実施形態に係る音声出力較正方法のフローチャートである。
【発明を実施するための形態】
【0009】
図1に示したように、本発明の実施形態に係る音声出力較正システム2は電子装置1に使用される。前記電子装置1には、少なくとも二つのカメラ30、32及び複数のスピーカー40、42が接続されている。説明を簡潔にするため、本発明の実施形態では二つのカメラ30、32及び二つのスピーカー40、42を例として説明する。但し実際の応用において、前記カメラ及び前記スピーカーの数は二つに限定されるものではない。
【0010】
前記電子装置1は、音響設備等の装置或いは音響設備に接続される独立した電子装置である。前記音声出力較正システム2は、リスナーの位置を確定するために用いられ、且つ複数の前記スピーカー40、42が出力した音声に対して較正を行うことにより、複数の前記スピーカー40、42に同じ強度の音声信号を同時に出力させる。
【0011】
前記カメラ30、32は、人の顔を感知することにより人の有無を識別する機能を備える。前記カメラ30、32は、起動された後に回転しながら撮影してリスナーの有無を識別する。また、本発明の他の実施形態では、前記カメラ30、32は、一般のカメラでもよく、前記電子装置1に人の顔を識別できるソフトウェアを設けることによって、撮影された影像を分析処理し、リスナーの有無を確認する。
【0012】
図2に示したように、前記電子装置1は、処理器10及び記憶装置12を備える。前記処理器10は、前記電子装置1の内部にインストールされた各種のソフトウェアを実行する。例えば、前記音声出力較正システム2或いは操作システム等のアプリケーションソフトを実行する。
【0013】
前記記憶装置12は、撮影された影像、前記音声出力較正システム2を利用して設置及び計算して得たデータ等のような各種のデータを格納するために用いられる。前記記憶装置12は、前記電子装置1の内部記憶装置であり、ポータブルなメモリーカード或いはフラッシュメモリー等である。
【0014】
前記音声出力較正システム2は、設定モジュール20、検知モジュール22、計算モジュール24及び較正モジュール26を備える。前記設定モジュール20は、前記カメラ30、32及び/或いは前記スピーカー40、42の位置に基づいて座標系を構築し、且つ前記カメラ30、32及び各スピーカー40、42の位置座標を記録する。
【0015】
例えば、図3に示している座標系において、前記カメラ30を点A1、前記カメラ32を点A2とし、前記カメラ30、32の最短距離の中間点を原点Oとする。また前記スピーカー40をB1、前記スピーカー42をB2とする。カメラ間の距離及び各カメラとスピーカーとの間の距離は、実際の測定によってデータを獲得できる。従って、以下に述べる計算において、前記カメラ30及び前記カメラ32の間の距離L、カメラA1とスピーカーB1との間の距離E、及びカメラA2とスピーカーB2との間の距離Fは、既知の距離であり、また前記座標系において、前記カメラ30、32及び前記スピーカー40、42の位置も固定されているので、前記カメラ30、32及び前記スピーカー40、42の位置座標も既知のものである。
【0016】
上記座標系の構築方法及び以下に述べる計算方法は、例に挙げたものであり、これに限定されるものではない。実際の必要に応じて、スピーカーの位置をもって座標系を確定し或いはカメラとスピーカーとの位置関係をもって座標系を確定する等の方式で直角座標系を構築したり、球面座標系等の他のタイプの座標系を構築したりすることができる。また、この座標系の既知位置の情報を利用して、異なる方式で前記各装置の相対位置を計算する方法はこれに限定されるものではない。
【0017】
実際の使用において、前記座標系は仮想座標系であり、ユーザーはカメラ間の距離、スピーカー間の距離及びカメラとスピーカーとの間の距離を示すデータを前記音声出力較正システム2に入力するだけで、自動的に計算を行い、その結果を得ることできる。
【0018】
前記検知モジュール22は、前記カメラ30、32が撮影した影像の中から人の顔を感知した際に、リスナーの存在を確定する。例えば、前記カメラ30、32により撮影された影像に映し出された人の顔が前記影像の広角の中間に位置すると、前記検知モジュール22は、リスナーの存在を確定する。また、前記検知モジュール22は、リスナーが感知された際にリスナーの位置座標を確定するためにも用いられる。例えば、カメラの回転角度及びカメラ間の距離に基づいてリスナーの位置座標を計算する。
【0019】
前記カメラ30、32は、回転しがら影像を撮影する。影像中の人の顔が感知されると、前記検知モジュール22は前記カメラ30、32の回転角度を得る。図3に示した座標系を例とすると、前記カメラ30、32の前記座標系におけるA1、A2点は、それぞれ一つの垂直線(破線で示す)が通る。前記カメラ30、32が二つの前記垂直線に対して回転した角度θ1、θ2は既知角度である。前記カメラ30が角度θ1回転し並びに前記カメラ32が角度θ2回転すると、前記検知モジュール22はリスナーPを検知する。ここでリスナーPの座標を(P1,P2)と仮定する。
【0020】
上記の角度θ1及び角度θ2によって、α角及びβ角を計算することができる。例えば、α角の値はθ1+90度であり、β角の値はθ2+90度である。次に、以下の公式で前記カメラ30からリスナーPまでの距離a及び前記カメラ32からリスナーPまでの距離bを計算する。
【0021】
【数1】

【0022】
a及びbの数値を得れば、リスナーPの座標(P1,P2)を確定することができる。即ち、P1=L÷2+a×cos(180°-α);P2=a×sin(180°-α)。また、他の数学計算方法でリスナーPの座標位置を確定することも可能である。
【0023】
前記計算モジュール24は、リスナー及び前記スピーカー40、42の位置座標に基づいて、前記スピーカー40、42からリスナーまでの距離をそれぞれ計算する役割を果たしている。例えば、前記スピーカー40からリスナーまでの距離はdであり、前記スピーカー42からリスナーまでの距離はdである。
【0024】
また、前記計算モジュール24は、リスナーから一番遠いスピーカーを指定するためにも用いられる。例えば、図3に示したように、d>dの場合、前記スピーカー42を指定スピーカーとし、前記スピーカー40を非指定スピーカーとする。
【0025】
さらに、前記計算モジュール24は、前記指定スピーカーが出力した音声信号の強度と前記非指定スピーカーが出力した音声信号の強度との比率を計算し、且つ前記指定スピーカーが音声信号を出力する時間と各非指定スピーカーが音声信号を出力する時間との時間差をそれぞれ計算する。
【0026】
例えば、本発明の実施形態において、非指定スピーカー(例えば、スピーカー40)が出力した信号の強度をSと仮定し、指定スピーカー(例えば、スピーカー42)が出力した信号の強度をSと仮定すると、前記計算モジュール24は、公式Sn=Sf×(dn÷df)2に基づいて前記指定スピーカーと各非指定スピーカーとの音声信号の強度比率を計算する。
【0027】
前記非指定スピーカー(例えば、スピーカー40)からリスナーまでの距離が前記指定スピーカー(例えば、スピーカー42)からリスナーまでの距離より短いので、前記非指定スピーカー(スピーカー40)が出力する音声信号は、前記指定スピーカー(スピーカー42)より早くリスナーの耳に入る。だから、前記非指定スピーカー(スピーカー40)の信号出力時間を遅延させて、前記非指定スピーカーの信号出力時間と前記指定スピーカーの信号出力時間とを一致させる必要がある。そこで、本発明の実施形態では、非指定スピーカー(スピーカー40)が音声信号を出力する時間点をTと仮定し、指定スピーカー(スピーカー42)が音声信号を出力する時間点をTと仮定し、且つT=T+(df-dn)÷cのように設定する。この公式において、cは音速である。音速cは、実際の状況に応じて変更することができる。例えば、空気中で15℃の条件で伝播される際の音速は約340m/sであり、空気中で28℃の条件で伝播される際の音速は約348.5m/sである。
【0028】
前記公式T=T+(df-dn)÷cから分かるように、T>T。即ち、本発明は、公式T=T+(df-dn)÷cを介して前記非指定スピーカー(スピーカー40)の音声信号の出力時間点を前記指定スピーカー(スピーカー42)の音声信号の出力時間点より遅くさせている。前記計算モジュール24は、この公式T=T+(df-dn)÷cに基づいて、前記指定スピーカーと各非指定スピーカーとの音声信号出力時間の時間差をそれぞれ計算する。
【0029】
前記較正モジュール26は、上記の計算により得られた時間差に基づいて、各非指定スピーカー(例えばスピーカー40)の音声信号出力時間をそれぞれ遅延させることによって、各非指定スピーカーと前記指定スピーカー(例えばスピーカー42)とを同時に音声信号を出力させる。例えば、前記時間差が2秒であれば、前記較正モジュール26は、前記非指定スピーカーの音声信号の出力時間を2秒ほど遅延させて、前記非指定スピーカーを前記指定スピーカーと同時に音声信号を出力させるようにする。
【0030】
また、前記較正モジュール26は、計算により得られた音声信号の強度比率に基づいて各非指定スピーカーが出力した音声信号の強度を調節して、各非指定スピーカー(例えばスピーカー40)を前記指定スピーカー(例えばスピーカー42)と同じ強度の音声信号を出力させる。例えば、前記スピーカー40と前記スピーカー42との音声信号の強度比率が1/2である場合、前記スピーカー40の音声信号の強度を増強するか又は前記スピーカー42の音声信号の強度を低減することにより、前記スピーカー40及び前記スピーカー42を同じ強度の音声信号を出力させるようにする。
【0031】
しかし、上記の計算方式は、例に挙げたものであって、実際の使用において、これらに限定されるものではなく、異なる数学方法に基づいて上記のデータを計算することもできる。
【0032】
図4に示したように、本発明の実施形態に係る音声出力較正方法は、以下のステップを備える。
【0033】
ステップ1では、前記設定モジュール20は、前記カメラ30、32及び/或いは前記スピーカー40、42の位置に基づいて座標系を構築し、且つ前記カメラ30、32及び各スピーカー40、42の位置座標を記録する。
【0034】
ステップ2では、前記検知モジュール22は、前記カメラ30、32を利用してリスナーが感知されたかどうかを判断する。例えば、前記カメラ30、32により撮影された影像に映し出された人の顔は、前記影像の広角の中間に位置すると、前記検知モジュール22はリスナーの存在を確定し、ステップ3へと移る。しかし、もしリスナーが検知されなければ、ステップ2に戻って検知を続ける。
【0035】
ステップ3では、前記検知モジュール22は、リスナーの位置座標を確定する。例えば、カメラの回転角度及びカメラ間の距離に基づいてリスナーの位置座標を計算する。
【0036】
ステップ4では、前記計算モジュール24は、リスナー及びスピーカー40、42の位置座標に基づいて前記スピーカー40、42とリスナーとの間の距離を計算する。例えば、前記スピーカー40とリスナーとの間の距離はdであり、前記スピーカー42とリスナーとの間の距離はdである。
【0037】
ステップ5では、前記計算モジュール24は、リスナーから一番遠いスピーカーを指定する。例えば、図3に示したように、d>dの場合、前記スピーカー42は指定スピーカーであり、前記スピーカー40は非指定スピーカーである。
【0038】
ステップ6では、前記計算モジュール24は、前記指定スピーカー42が出力した音声信号の強度と前記非指定スピーカー40が出力した音声信号の強度との比率を計算する。
【0039】
ステップ7では、前記計算モジュール24は、前記指定スピーカー42が音声信号を出力する時間と各非指定スピーカー40が音声信号を出力する時間との時間差を計算する。。
【0040】
ステップ8では、前記較正モジュール26は、計算により得られた時間差に基づいて各非指定スピーカー40の信号出力時間をそれぞれ遅延させて、各非指定スピーカー40と前記指定スピーカー42とを同時に音声信号を出力させる。また、前記音声信号の強度比率に基づいて各非指定スピーカー40が出力した音声信号の強度を調節して、各非指定スピーカー40を前記指定スピーカー42と同じ強度の音声信号を出力させる。
【0041】
以上、本発明の好適な実施形態について詳細に説明したが、本発明は前記実施形態に限定されるものではなく、本発明の範囲内で種々の変形又は修正が可能であり、該変形又は修正も又、本発明の特許請求の範囲内に含まれるものであることは、いうまでもない。
【符号の説明】
【0042】
1 電子装置
2 音声出力較正システム
10 処理器
12 記憶装置
20 設定モジュール
22 検知モジュール
24 計算モジュール
26 較正モジュール
30、32 カメラ
40、42 スピーカー

【特許請求の範囲】
【請求項1】
複数のスピーカー及び人の有無を識別する機能を持つ少なくとも二つのカメラに接続された電子装置に用いられる音声出力較正システムであって、
前記カメラ及び/或いは前記スピーカーの位置に基づいて座標系を構築し、且つ各カメラ及び各スピーカーの位置座標を記録する設定モジュールと、
前記カメラがリスナーを感知した際に、リスナーの座標位置を確定する検知モジュールと、
リスナー及び各スピーカーの位置座標に基づいて各スピーカーとリスナーとの間の距離を計算し、且つリスナーから一番遠いスピーカーを指定し、前記指定スピーカーが出力した音声信号と各非指定スピーカーが出力した音声信号との強度の比率をそれぞれ計算し、且つ前記指定スピーカーの音声信号の出力時間と各非指定スピーカーの音声信号の出力時間との時間差をそれぞれ計算する計算モジュールと、
前記時間差に基づいて各非指定スピーカーの信号出力時間をそれぞれ遅延させて、各非指定スピーカーを前記指定スピーカーと同時に音声信号を出力させ、且つ前記強度の比率に基づいて各非指定スピーカーが出力した音声信号の強度を調節して、各非指定スピーカーを前記指定スピーカーと同じ強度の音声信号を出力させる較正モジュールと、
を備えることを特徴とする音声出力較正システム。
【請求項2】
前記構築された座標系は、二つの前記カメラの間の最短距離の中間点を原点とすることを特徴とする請求項1に記載の音声出力較正システム。
【請求項3】
前記検知モジュールは、前記カメラが撮影した影像に映し出された人の顔が前記影像の広角の中間に位置すると、リスナーが検知されたことを確定することを特徴とする請求項1に記載の音声出力較正システム。
【請求項4】
前記検知モジュールは、カメラの回転角度及びカメラ間の距離に基づいてリスナーの位置座標を計算することを特徴とする請求項1に記載の音声出力較正システム。
【請求項5】
前記計算モジュールは、下記の公式に基づいて前記指定スピーカーが出力した音声信号の強度と各非指定スピーカーが出力した音声信号の強度の比率を計算することを特徴とする請求項1に記載の音声出力較正システム。
Sn=Sf×(dn÷df)2
(ただし、Sは非指定スピーカーが出力する信号の強度を示し、Sは指定スピーカーが出力する信号の強度を示し、dは非指定スピーカーとリスナーとの間の距離を示し、dは指定スピーカーとリスナーとの間の距離を示す)
【請求項6】
前記計算モジュールは、下記の公式に基づいて、前記指定スピーカーが音声信号を出力する時間と各非指定スピーカーが音声信号を出力する時間との時間差をそれぞれ計算することを特徴とする請求項5に記載の音声出力較正システム。
n=Tf+(df-dn)÷c
(ただし、Tは非指定スピーカーの音声信号の出力時間を示し、Tは指定スピーカーの音声信号の出力時間を示し、cは音速である)
【請求項7】
複数のスピーカー及び人の有無を識別する機能を持つ少なくとも二つのカメラに接続された電子装置に用いられる音声出力較正方法であって、
前記カメラ及び/或いは前記スピーカーの位置に基づいて座標系を構築し、且つ前記カメラ及び各スピーカーの位置座標を記録するステップと、
前記カメラがリスナーを感知した際に、リスナーの位置座標を確定するステップと、
リスナー及び各スピーカーの位置座標に基づいて各スピーカーとリスナーとの間の距離を計算し、且つリスナーから一番遠いスピーカーを指定するステップと、
前記指定スピーカーと各非指定スピーカーとが出力した音声信号の強度の比率、及び前記指定スピーカーの音声信号の出力時間と各非指定スピーカーの音声信号の出力時間との時間差をそれぞれ計算するステップと、
前記時間差に基づいて各非指定スピーカーの信号出力時間をそれぞれ遅延させて、各非指定スピーカーを前記指定スピーカーと同時に音声信号を出力させ、且つ前記強度の比率に基づいて各非指定スピーカーの音声信号の強度を調節して、各非指定スピーカーを前記指定スピーカーと同じ強度の音声信号を出力させるステップと、
を備えることを特徴とする音声出力較正方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate


【公開番号】特開2012−161073(P2012−161073A)
【公開日】平成24年8月23日(2012.8.23)
【国際特許分類】
【出願番号】特願2012−3950(P2012−3950)
【出願日】平成24年1月12日(2012.1.12)
【出願人】(500080546)鴻海精密工業股▲ふん▼有限公司 (1,018)
【Fターム(参考)】