説明

音場共有システムおよび最適化方法

【構成】 音場共有システム10は、サーバ12を含み、サーバ12には、或る音場に配置されるマイクロホンアレイ14が接続される。マイクロホンアレイ14で収録されサーバ12に与えられた音場データは、逆フィルタとともに畳み込み処理を施され、ネットワーク16を介して、コンピュータ18、20に伝送される。コンピュータ18、20は、それぞれ、音場データをスピーカアレイシステム22、26に出力する。したがって、音場が再現される。このようなシステムにおいて、グラムシュミットの直交化法により、ラウドスピーカ230の数を低減し、さらに、それに応じてマイクロホンの数を低減する。したがって、畳み込みの処理およびデータ伝送量が低減され、リアルタイムに処理および伝送が実行される。
【効果】 リアルタイムに音場を共有することができる。

【発明の詳細な説明】
【技術分野】
【0001】
この発明は音場共有システムおよび最適化方法に関し、特にたとえば、原音場を物理的に忠実に記録・再現する音場制御再生システムを用いた、音場共有システムおよび最適化方法に関する。
【背景技術】
【0002】
この種の従来の音場共有システムの一例が非特許文献1に開示されている。この非特許文献1に開示される3次元音場通信システムでは、70ch(チャネル)のマイクロホンアレイで収録した音響データを62chのラウドスピーカで再現する音場制御(Boundary Surface Control:BoSC)再生システムを用いて、遠隔地に存在する利用者が音響空間を共有しながら会話を行うことが可能である。具体的には、予め収録し逆フィルタが畳み込まれた62chの音場データがサーバに記憶される。このサーバには、インターネットおよびLANのようなネットワークを介して、2台のクライアントマシン(PC)が異なる場所に配置される。各クライアントマシンには、3次元の音場再現システムが接続されている。サーバは、利用者が選択した再現音場を双方の音場再現システムに同時に伝送する。各音場再現システムの利用者の音声に対応する音声データは、ネットワークを介して、それぞれ他方のクライアントマシンに伝送される。各クライアントマシンでは、他方の利用者の音声に対応する音声データ(1ch)が、実時間で畳み込まれた後に、音場データ(62ch)に重ね合わせて出力される。したがって、異なる場所に存在する利用者は、サーバから出力される音場データを共有するとともに、会話することができる。
【先行技術文献】
【非特許文献】
【0003】
【非特許文献1】「1.数値解析技術と可視化・可聴化 1.7三次元音場通信システム」 榎本成悟 音響技術 No.148/Dec.2009 pp37-42
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかし、非特許文献1の3次元音場通信システムでは、70chのマイクロホンアレイで収録した音場データを、62chのスピーカアレイ(音場再現システム)で再現するため、その音場データのデータ量が膨大である。また、チャネル数が多いため、畳み込みの処理も負荷が大きい。このため、予め収録するとともに、予め畳み込み処理を行った音場データを各クライアントマシンに伝送するようにしてある。したがって、リアルタイムに収録した音場データを共有することは困難であった。
【0005】
それゆえに、この発明の主たる目的は、新規な、音場共有システムおよび最適化方法を提供することである。
【0006】
また、この発明の他の目的は、リアルタイムに収録された音場データを異なる場所に存在する利用者によって共有することができる、音場共有システムおよび最適化方法を提供することである。
【課題を解決するための手段】
【0007】
本発明は、上記の課題を解決するために、以下の構成を採用した。なお、括弧内の参照符号および補足説明等は、本発明の理解を助けるために後述する実施の形態との対応関係を示したものであって、本発明を何ら限定するものではない。
【0008】
第1の発明は、音場共有システムは、或る音場に配置され、第1所定数のマイクホンを有するマイクロホンアレイ(14)、マイクロホンアレイによって検出された音場データを収録し、当該音場データを複数の再現システムに伝送するサーバ(12)、およびサーバからの音場データを第2所定数のラウドスピーカを有するスピーカアレイによって再生する再現システム(22、26)を備える。この音場共有システムは、初期スピーカ選択手段、第1評価値算出手段、基準スピーカ選択手段、第1実行手段、初期マイク選択手段、第2評価値算出手段、基準マイク選択手段および第2実行手段を備える。たとえば、これらの手段は、コンピュータ(12、18、20など)によって実現される。
【0009】
初期スピーカ選択手段は、スピーカアレイのうちの1個のラウドスピーカを最初の基準ラウドスピーカとして選択する。第1評価値算出手段は、スピーカアレイのうち、選択された基準ラウドスピーカと当該基準ラウドスピーカ以外のすべての評価対象ラウドスピーカのそれぞれとの間のグラムシュミット直交化評価値を算出する。基準スピーカ選択手段は、第1評価値算出手段によって算出されたグラムシュミット直交化評価値が最も高い評価対象ラウドスピーカを基準ラウドスピーカとして選択する。第1実行手段は、基準スピーカ選択手段による選択の結果、基準ラウドスピーカの数が第2所定数よりも少ない第3所定数になるまで、第1評価値算出手段および基準スピーカ選択手段を繰り返し実行させる。
【0010】
初期マイク選択手段は、マイクロホンアレイのうちの1個のマイクロホンを最初の基準マイクロホンとして選択する。第2評価値算出手段は、マイクロホンアレイのうち、選択された基準マイクロホンと当該基準マイクロホン以外のすべての評価対象マイクロホンのそれぞれとの間のグラムシュミット直交化評価値を算出する。基準マイク選択手段は、第2評価値算出手段によって算出されたグラムシュミット直交化評価値が最も高い評価対象マイクロホンを基準マイクロホンとして選択する。第2実行手段は、基準マイク選択手段による選択の結果、基準マイクロホンの数が第1所定数よりも少ない第4所定数になるまで、第2評価値算出手段および基準マイク選択手段を繰り返し実行させる。そして、サーバは、第4所定数の基準マイクロホンによって検出された音場データを複数の再現システムに伝送する。したがって、複数の再現システムの各々は、第3所定数の基準ラウドスピーカを用いて、サーバから伝送された音場データを再生する。
【0011】
第1の発明によれば、第2所定数のラウドスピーカを第3所定数に低減するとともに、第1所定数のマイクロホンを第4所定数に低減するので、畳み込み処理の負荷およびデータ量を低減することができる。したがって、リアルタイムに、畳み込み処理およびデータの伝送を行うことができ、音場を共有することができる。
【0012】
第2の発明は、第1の発明に従属し、音場共有システムは、初期スピーカ変化手段、第1組記憶手段および第1組選択手段をさらに備える。これらの手段もまた、コンピュータ(12、18、20など)によって実現される。初期スピーカ変化手段は、初期スピーカ選択手段によって選択される最初の基準ラウドスピーカを順次変化させる。したがって、最初に選択される基準ラウドスピーカ毎に、第1実行手段によって、第1評価値算出手段および基準スピーカ選択手段を繰り返し実行することにより、第3所定数の基準ラウドスピーカの組が複数(ラウドスピーカの総数)得られる。第1組記憶手段は、初期スピーカ変化手段によって最初の基準ラウドスピーカを順次変化させたとき、それぞれの場合について、選択された第3所定数の基準ラウドスピーカの複数の組を記憶する。たとえば、複数の組は、コンピュータのメモリ(ハードディスクやRAM)などに記憶される。第1組選択手段は、第1組記憶手段によって記憶された複数の組のうち、第1評価値算出手段によって算出されたグラムシュミット直交化評価値が所定の条件を満たす一組の第3所定数の基準ラウドスピーカを選択する。具体的には、グラムシュミット直交化法による評価指標の平均値が最大である組が選択される。ただし、評価指標の平均値が最大である組についての評価指標の最小値が極端に低い場合には、線形独立性の低い周波数が存在するため、評価指標の平均値が最大であっても、選択するのは適切ではない。正しく音場を再現できないと考えられるからである。かかる場合には、次に評価指標の平均値が大きい組が選択される。ただし、次に評価指標の平均値が大きい組についての評価指標の最小値が極端に低い場合には、その次に評価指標の平均値が大きい組が選択される。それ以降も同様である。このようにして、最適と考えられる組の第3所定数の基準ラウドスピーカが選択される。したがって、複数の再現システムの各々は、第1組選択手段によって選択された一組の第3所定数の基準ラウドスピーカを用いて、サーバから伝送された音場データを再生する。
【0013】
第2の発明によれば、最適と考えられるラウドスピーカを選択することができるので、正しく音場を再現することができる。
【0014】
第3の発明は、第2の発明に従属し、音場共有システムは、初期マイク変化手段、第2組記憶手段および第2組選択手段をさらに備える。これらの手段もまた、コンピュータ(12、18、20など)によって実現される。初期マイク変化手段は、初期マイク選択手段によって選択される最初の基準マイクロホンを順次変化させる。第2組記憶手段は、初期マイク変化手段によって最初の基準マイクロホンを順次変化させたとき、それぞれの場合について、選択された第4所定数の基準マイクロホンの複数の組を記憶する。そして、第2組選択手段は、第2組記憶手段によって記憶された複数の組のうち、グラムシュミット直交化評価値が所定の条件を満たす一組の第4所定数の基準マイクロホンを選択する。したがって、ラウドスピーカの場合と同様に、最適と考えられる組の第4所定数のマイクロホンが選択される。そして、サーバは、第2組選択手段によって選択された一組の第4所定数のマイクロホンによって検出された音場データを複数の再現システムに伝送する。
【0015】
第3の発明によれば、最適と考えられるマイクロホンが選択されるため、第2の発明と同様に、音場を正しく再現することができる。
【0016】
第4の発明は、第1ないし第3の発明に従属し、第4所定数は、第3所定数に応じて決定される。具体的には、逆システムの行列の全要素数は決定されており、したがって、ラウドスピーカを第4所定数に決定すると、全要素数を第4所定数で割った値に第3所定数が決定される。
【0017】
第4の発明によれば、第4所定数に応じて第3所定数を決定するので、第3所定数を簡単に決定することができる。
【0018】
第5の発明は、第1ないし第4の発明に従属し、第3所定数および第4所定数は、少なくともサーバおよび再現システムの処理能力に応じて決定される。つまり、逆システムの行列の全要素数は、サーバおよび再現システムの処理能力によって決定されるのである。
【0019】
第5の発明によれば、第3所定数および第4所定数は、サーバおよび再現システムの処理能力に応じて決定されるため、確実に、音場データの畳み込み処理、伝送および再現を、リアルタイムに実行させることができる。
【0020】
第6の発明は、第1ないし第5の発明に従属し、第2所定数は62であり、第3所定数は24を超えない値である。つまり、ラウドスピーカは、最大で24個選択される。
【0021】
第6の発明によれば、62個のラウドスピーカを24個に低減できるため、畳み込み処理およびデータ量を低減することができる。
【0022】
第7の発明は、第6の発明に従属し、第1所定数は70であり、第3所定数は8を超えない値である。
【0023】
第7の発明によれば、たとえば、逆行列の要素数は192に設定され、ラウドスピーカを24個にした場合には、マイクロホンを最大で8個選択することができる。
【0024】
第8の発明は、或る音場に配置され、第1所定数のマイクホンを有するマイクロホンアレイ、マイクロホンアレイによって検出された音場データを収録し、当該音場データを複数の再現システムに伝送するサーバ、およびサーバからの音場データを第2所定数のラウドスピーカを有するスピーカアレイによって再生する再現システムを備える、音場共有システムのマイクロホンアレイおよびスピーカアレイの個数および配置を最適化する最適化方法であって、(a)スピーカアレイのうちの1個のラウドスピーカを最初の基準ラウドスピーカとして選択し、(b)スピーカアレイのうち、選択された基準ラウドスピーカと当該基準ラウドスピーカ以外のすべての評価対象ラウドスピーカのそれぞれとの間のグラムシュミット直交化評価値を算出し、(c)ステップ(b)によって算出されたグラムシュミット直交化評価値が最も高い評価対象ラウドスピーカを基準ラウドスピーカとして選択し、(d)ステップ(c)による選択の結果、基準ラウドスピーカの数が第2所定数よりも少ない第3所定数になるまで、ステップ(b)およびステップ(c)を繰り返し実行させ、(e)マイクロホンアレイのうちの1個のマイクロホンを最初の基準マイクロホンとして選択し、(f)マイクロホンアレイのうち、選択された基準マイクロホンと当該基準マイクロホン以外のすべての評価対象マイクロホンのそれぞれとの間のグラムシュミット直交化評価値を算出し、(g)ステップ(f)によって算出されたグラムシュミット直交化評価値が最も高い評価対象マイクロホンを基準マイクロホンとして選択し、そして(h)ステップ(g)による選択の結果、基準マイクロホンの数が第1所定数よりも少ない第4所定数になるまで、ステップ(f)およびステップ(g)を繰り返し実行させる、最適化方法である。
【0025】
第8の発明によれば、ラウドスピーカの数およびマイクロホンの数を低減することにより、リアルタイムに畳み込み処理およびデータを伝送できる、音場共有システムを提供することができる。
【発明の効果】
【0026】
この発明によれば、第2所定数のラウドスピーカを第3所定数に低減するとともに、第1所定数のマイクロホンを第4所定数に低減するので、畳み込み処理の負荷およびデータ量を低減することができる。したがって、リアルタイムに、畳み込み処理およびデータの伝送を行うことができ、音場を共有することができる。
【0027】
この発明の上述の目的,その他の目的,特徴および利点は、図面を参照して行う以下の実施例の詳細な説明から一層明らかとなろう。
【図面の簡単な説明】
【0028】
【図1】図1はこの発明の音場共有システムの一例を示す図解図である。
【図2】図2は図1に示すマイクロホンアレイの例を示す図解図である。
【図3】図3は図1に示すスピーカアレイシステムの例を示す図解図である。
【図4】図4は音場再現の原理を説明するための図解図である。
【図5】図5はグラムシュミットの直交化法を説明するための図解図である。
【図6】図6は各ラウドスピーカを最初に選択した場合に、62個のマイクロホンに対して24個のラウドスピーカを選択したときの評価指標の平均値および最小値の変化を示すグラフである。
【図7】図7は60番のラウドスピーカを最初に選択した場合における選択処理に従う評価指数の平均値および最小値の変化を示すグラフである。
【図8】図8は各マイクロホンを最初に選択した場合に、24個のラウドスピーカに対して8個のマイクロホンを選択したときの評価指数の平均値および最小値の変化を示すグラフである。
【図9】図9は最初に65番のマイクロホンを選択し、選択処理の回数を増加させた場合における評価指標の値の変化を示すグラフである。
【図10】図10は60番のラウドスピーカを最初に選択した場合において、選択された24個のスピーカ位置の分布を示す図解図である。
【図11】図11は65番のマイクロホンを最初に選択した場合において、選択された8個のマイクロホンの位置の分布を示す図解図である。
【図12】図12は実験条件のテーブルを示す図解図である。
【図13】図13は提示された音源定位について被験者が認識した角度の差についてのRMS値および提示された音源定位について被験者が認識した角度の正解率を示すグラフである。
【図14】図14は差のRMS値についてのテューキーの多重比較試験の結果を示すテーブルおよび正解率についてのテューキーの多重比較試験の結果を示すテーブルである。
【発明を実施するための形態】
【0029】
図1を参照して、この実施例の音場共有システム10はサーバ12を含み、サーバ12には、マイクロホンアレイ14が接続される。サーバ12は、汎用のサーバであり、インターネットまたはLAN或いはその両方のようなネットワーク16を介して、コンピュータ18およびコンピュータ20に接続される。コンピュータ18、20は、汎用のPCまたはワークステーションである。コンピュータ18には、スピーカアレイシステム22およびマイク24が接続され、同様に、コンピュータ20には、スピーカアレイシステム26およびマイク28が接続される。
【0030】
この図1に示す音場共有システム10は、2つの音場制御(BoSC)再生システム10aおよび10bを含む。図1の点線枠で囲むように、BoSC再生システム10aは、サーバ12、マイクロホンアレイ14、ネットワーク16、コンピュータ18、スピーカアレイシステム22およびマイク24によって構成される。また、図1の一点鎖線枠で囲むように、BoSC再生システム10bは、サーバ12、マイクロホンアレイ14、ネットワーク16、コンピュータ20、スピーカアレイシステム26およびマイク28によって構成される。
【0031】
図2に示すように、マイクロホンアレイ14は、球形に近い形状の骨格14aおよびこの骨格14aを支持するスタンド14bを含む。骨格14aは、C80 フラーレン(Fullerene)の構造を基に、底部の10個の頂点を切り取った70個の頂点を有している。図示は省略するが、骨格14aの表面(外面)であり、70個の頂点の各々には1個の無指向性のマイクロホンが取り付けられる。たとえば、マイクロホンとしては、DPA 4060−BMを用いることができる。スタンド14bは、支持軸140および三脚142によって構成され、支持軸140は、骨格14aの切り取った底部を通ってこの骨格14aの天井をその内側から支持している。
【0032】
なお、骨格14aは、前面側と重なる部分以外は、背面側であっても正面から見えるが、分かり易く示すために、図2では、背面側に相当する部分を点線で示してある。
【0033】
また、図3に示すように、スピーカアレイシステム22、26は、楕円形のドーム部220およびこれを支える4本の柱部222を含む。この楕円形のドーム部220は、たとえば木製の4層の架台220a、220b、220c、220dによって構成される。ただし、図3では、ドーム部220の内部をその斜め下方から見た図であり、架台220dおよび柱部222についてはその一部を示してある。図示は省略するが、ドーム部220および柱部222の内部は空洞にされ、架台(220a−220d)自体が密室型エンクロージャの役割を果たす。
【0034】
また、スピーカアレイシステム22、26の各々には、70個のラウドスピーカ230が設置される。具体的には、架台220aには6個のフルレンジユニット(Fostex FE83E)すなわちラウドスピーカ230が設置され、架台220bには16個のラウドスピーカ230が設置され、架台220cには24個のラウドスピーカ230が設置され、そして、架台220dには16個のラウドスピーカ230が設置される。さらに、4本の柱部222の各々には、低域を補うため、2個のサブウーファーユニット(Fostex FW108N)すなわちラウドスピーカ230が設置される。
【0035】
このようなスピーカアレイシステム22、26は、それぞれ、音場再現ルーム(図示せず)内に設置される。音場再現ルームは、1.5帖の防音室であり、YAMAHAウッディボックス(遮音性能Dr−30)が用いられる。また、音場再現ルーム内には、リフト付きの椅子(図示せず)が設けられる。これは、スピーカアレイシステム22、26のドーム部220内であり、ラウドスピーカ230の数が最大となる架台220cの高さに、椅子に座ったユーザの耳の位置(高さ)を設定するためである。
【0036】
なお、マイクロホンアレイ14、およびコンピュータ(18、20)とスピーカアレイシステム(26、28)とを含む音場再現ルーム(音場再現システム)については、「1.数値解析技術と可視化・可聴化 1.7三次元音場通信システム」 榎本成悟 音響技術 No.148/Dec.2009 pp37-42に開示されているため、さらなる詳細な説明は省略することにする。
【0037】
たとえば、図1に示した音場共有システム10では、マイクロホンアレイ14は、オーケストラの演奏会場などの音場に配置される。サーバ12は、マイクロホンアレイ14からアンプ(図示せず)を介して入力される音声信号(音場信号)をディジタルの音声データ(音場データ)に変換し、この音場データに対して逆システムの畳み込み処理を実行する。サーバ12は、畳み込み処理を実行した音場データを、ネットワーク16を介して、コンピュータ18および20に送信する。
【0038】
コンピュータ18、20は、それぞれ、サーバ12からの音場データをアナログの音場信号に変換し、スピーカアレイシステム22、26に出力する。したがって、スピーカアレイシステム22、26では、上述の音場が再現される。このため、スピーカアレイシステム22、26を使用する各ユーザ(図示せず)は、遠隔地に存在している場合であっても、スピーカアレイシステム22、26を介して、たとえば演奏会場で収録した生のオーケストラを楽しむことができる。
【0039】
また、各ユーザは、マイク24、28を通して音声を入力することができる。マイク24で検出された音声信号はコンピュータ18でディジタルの音声データに変換され、ネットワーク16を介してコンピュータ20に送信される。コンピュータ20は、受信した音声データと音声フィルタを畳み込み演算し、音場データに重ね合わせて、スピーカアレイシステム26に出力する。したがって、音場が再現されるとともに、他のユーザの音声が再現される。同様に、マイク28で検出された音声信号はコンピュータ20でディジタルの音声データに変換され、ネットワーク16を介してコンピュータ18に送信される。コンピュータ18は、受信した音声データと音声フィルタを畳み込み演算し、音場データに重ね合わせて、スピーカアレイシステム24に出力する。
【0040】
したがって、スピーカアレイシステム22のユーザと、スピーカアレイシステム26のユーザとは、音場を共有するとともに、会話することが可能である。
【0041】
なお、詳細な説明は省略するが、たとえば、マイク24、28はヘッドセットマイクを用いることができる。
【0042】
ここで、境界音場制御(BoSC)の原理およびBoSCを用いた音場再現システムについて簡単に説明する。境界音場制御では、キルヒホッフ・ヘルムホルツ積分方程式(KHIE)に基づき、図4の左側に示す原音場内の領域V内の音場が、図4の右側に示す際現音場内の領域V´において再現される。ただし、領域Vを囲む境界S上の収録点rと、領域V’を囲む境界S’上の制御点r’との相対的な位置は等しいものとする。つまり、数1が成立すると仮定する。ただし、点sおよび点s’は各領域内部の任意の点である。
【0043】
[数1]
|r−s|=|r’−s’|,s∈V,s’∈V’
このとき、内部に音源を含まない領域内の音圧p(s),p(s’)はKHIEより、数2および数3のそれぞれで示される。
【0044】
【数2】

【0045】
【数3】

【0046】
ただし、ωは角周波数であり、ρは媒質の密度であり、p(r),v(r)はそれぞれ境界上の点rにおける音圧と法線nの方向の粒子速度であり、G(r|s)は自由空間グリーン関数である。
【0047】
ここで、数1より、数4に示す関係が成立する。さらに、数4に従って、数5が成立する。
【0048】
【数4】

【0049】
【数5】

【0050】
この数5から、原音原で収音された境界面S上の音圧と粒子速度が再現音場において等しくなるように、2次音源から信号を出力すれば、領域V内の音場が領域V’において再現されることが分かる。
【0051】
ただし、2次音源の出力は、すべての2次音源からすべての制御点までの伝達特性を打ち消す逆フィルタと収録点で観測された信号を畳み込むことにより決定される。したがって、図4に示すような、BoSC音場再現システムを実現するためには、安定であり、かつ頑健な逆フィルタ(pinv(H))を設計することが重要になる。
【0052】
なお、逆フィルタの設計方法は、文献(S.Enomoto et al., "Three-dimensional sound field reproduction and recording systems based on boundary surface control principle", Proc. of 14th ICAD, Presentation o 16, 2008 Jun.)に詳細に開示されているため、ここでは、簡単に説明することにする。
【0053】
図4に示すような、2次音源数M、制御点数Nの多チャネル−多点制御逆システム(以下、単に「逆システム」という)を周波数領域で設計する方法について簡単に説明する。ただし、逆システムとは、M×N個の逆フィルタ群の総称である。
【0054】
2次音源iから制御点jまでの伝達関数をHji(ω)とし、入力信号をXj(ω)とし、そして、観測信号をPj(ω)とすると、これらの関係は、数6で表すことができる。ただし、iは2次音源番号(1、2、…、M)であり、jは制御点番号(1、2、…、N)であり、そして、W(ω)は逆システムである。
【0055】
[数6]


【0056】
このとき、P(ω)=X(ω)とするためには、数7を満たす必要がある。ただし、+は疑似逆行列を意味する。これによって、[W(ω)]は、[H(ω)]の逆システムとして定義される。
【0057】
[数7]
[W(ω)] = [H(ω)]+
ここで、正則化法が逆問題を解決する合理的な方法であることは良く知られている。これは既に音再生システムに適用されている(TOKUNO et al., "Inverse Filter of Sound Reproduction Systems Using Regularization" EIEIC TRANS. FUNDAMENTALS, Vol.E80-A, NO.5 MAY 1997など)。正則化法を用いることにより、ランク([H(ω)])=Nについての算出された逆行列[W^(ω)](表記の都合上、“^”をWの横に示してあるが、実際には数8に示すように、Wの上に記載される。以下、同じ。)は数8で与えられる。ただし、数8において、#は共役転置を意味し、β(ω)は正則化パラメータであり、IはM×Mの単位行列である。以下、同様である。
【0058】
[数8]


【0059】
一方、数7の右辺に示される、ランク([H(ω)])=Mについての逆行列[H(ω)]は、数9として導かれる。
【0060】
[数9]


【0061】
数8および数9は、それぞれ、最小二乗解および最小ノルム解(ノルム最小型一般逆行列)として解釈される。ただし、ランク([H(ω)])=N=Mであり、[H(ω)]は特異行列(非正則行列)では無く、そして[W(ω)]=[H(ω)]−1で与えられる。また、−1は逆行列を意味する。最後に、時間領域逆フィルタ係数は、[W^(ω)]の逆離散フーリエ変換から得られる。
【0062】
なお、BoSC再生システムにおいては、ラウドスピーカ230およびマイクロホンの配置は、空間サンプリングに影響を及ぼす。
【0063】
数8および数9においては、適切な正則化パラメータβ(ω)が選択されることにより、逆システムの不安定性を緩和する(取り除く)ことができる。この実施例では、正則化パラメータβ(ω)は、発見的に、各オブターブの周波数帯域で定義される。さらに、逆フィルタは、予め防音室でそれぞれのラウドスピーカ230とマイクロホンとの組の間で測定されたインパルス応答を使用することによって、計算された。測定されたインパルス応答を使用したため、環境の変化によって引き起こされた変動には追従しなかった。ただし、変動する実際の環境においては、MIMO(Multiple-Input Multiple-Output)の適応型の逆フィルタをBoSC再生システムに適用することができる。
【0064】
ここで、図1−図3に示したマイクロホンアレイ14およびスピーカアレイシステム22、26をそのまま使用する場合には、サーバ12における処理負荷がかなり大きい。具体的には、マイクロホンアレイ14が70chであり、スピーカアレイシステム22が62chであるため、サーバ12は、マイクロホン70chの音声信号(音場データ)と、逆システムとの畳み込み処理を62×70回行う必要があり、また、各回の畳み込み処理は、逆システム(逆フィルタ)のタップ数(この実施例では、4096)分実行する必要がある。
【0065】
また、伝送する音場データの量(データ量)が膨大であるため、各クライアント(コンピュータ18、20)において、約45Mbpsの帯域を必要とする。
【0066】
さらに、コンピュータ18、20によって、ユーザの音声に対応する音声データと音声フィルタを畳み込み演算する場合にも、70chをフルに使用する場合には、処理負荷が比較的大きくなってしまう。
【0067】
したがって、サーバ12からコンピュータ18、20に音場データをリアルタイムに送信するのは困難であり、当然のことながら、スピーカアレイシステム22、26を使用するユーザがリアルタイムにオーケストラ等を楽しむことも困難である。つまり、リアルタイムに音場を共有することができない。
【0068】
これを回避するため、たとえば、マイクロホンアレイ14のマイクロホンの数やスピーカアレイシステム22、26のラウドスピーカ230の数を減らすことにより、畳み込み処理の処理負荷および伝送するデータ量を低減することが考えられる。しかし、マイクロホンおよびラウドスピーカ230の数を単に減らせば良いということでは無く、再現される音場の臨場感を損なわない必要がある。
【0069】
そこで、この実施例では、臨場感を損なうことなく、マイクロホンおよびラウドスピーカ230を低減するとともに、マイクロホンおよびラウドスピーカ230の妥当な個数を決定することにする。
【0070】
この実施例では、まず、グラムシュミットの直交化法を用いて、70chのマイクロホンアレイ14を用いた場合に、スピーカアレイシステム22で使用するラウドスピーカ230が抽出(選出)される。そして、選出されたラウドスピーカ230を用いる場合に、グラムシュミットの直交化法を用いて、マイクロホンアレイ14で使用するマイクロホンが抽出(選出)される。
【0071】
詳細な説明は省略するが、使用するラウドスピーカ230およびマイクロホンの抽出(選出)は、サーバ12、コンピュータ18、20または図示しない別のコンピュータを用いて実行することができる。
【0072】
ここでは、単一の周波数について、グラムシュミットの直交化法を使用することでラウドスピーカ230を選択する場合の基本的なアルゴリズムを説明する。N×Mに含まれるN次元の縦ベクトルからの線形独立性が低ければ、行列式は悪い状態であると言われる。[H(ω)]において線形独立性の劣化は、BoSC再生システムの不安定性を引き起こす。ここで、数6に示した[H(ω)]は、数10のように書くことができる。
【0073】
[数10]
P(ω) = [H(ω)]Y(ω)
= {h1(ω),…,hM(ω)}Y(ω)
ただし、Y(ω)=[W(ω)]X(ω)およびh(ω)は、[H(ω)]に含まれるN次元の縦ベクトルである。この縦ベクトルh(ω)は、周波数ωにおける、或るラウドスピーカ230と各々のマイクロホンとの間の伝達関数である。それゆえに、グラムシュミットの直交化法を用いたラウドスピーカ230の選択は、[H(ω)]から高い線形独立を有する縦ベクトルh(ω)の組を選択することを意味する。以下、グラムシュミットの直交化法のアルゴリズムについて簡単に説明することにする。
【0074】
ラウドスピーカ230を選択するn番目のステップにおいては、既にn−1個のラウドスピーカ230が選択されている。[H]に含まれる縦ベクトルの集合は、τ={h,…,h}で示される。Sn−1は、n−1番目のステップまでに選択されたベクトルの部分集合を示し、τn−1は、n−1番目のステップまでに未使用のベクトルの部分集合を示す。vn−1={v,…,vn−1}は、部分集合Sn−1によって張られる平面の正規直交基底を示す。
【0075】
たとえば、最初のステップでは、すべてのラウドスピーカ230のうちの1つのラウドスピーカ230が基準ラウドスピーカ230として選択され、基準ラウドスピーカ230以外のすべてのラウドスピーカ230が評価対象のラウドスピーカ230(評価対象ラウドスピーカ230)として選択される。後述するように、グラムシュミットの直交化法により、基準ラウドスピーカ230との関係において、複数の評価対象ラウドスピーカ230から1の評価対象ラウドスピーカ230が選択される。次のステップでは、同じくグラムシュミットの直交化法により、最初に選択された基準ラウドスピーカ230および先のステップで選択された評価対象ラウドスピーカ230との関係において、残りの複数の評価対象ラウドスピーカ230から1の評価対象ラウドスピーカ230が選択される。つまり、このステップでは、先のステップで選択された評価対象ラウドスピーカ230は、基準ラウドスピーカ230と言える。これが繰り返されるのである。
ただし、低域を補う8個のラウドスピーカ230は、基準ラウドスピーカ230や評価対象ラウドスピーカ230の対象外である。
【0076】
図5は、部分集合Sn−1によって張られた平面の一例である。n番目のステップでは、部分集合Sn−1によって張られた平面に対するh^(数11に示すように、実際には“^”はhの上に表記される。以下、同じ。)の垂直成分が最大となるように、h^が選択される。部分集合τn−1に含まれる任意のベクトルhの垂直成分rは数11で表される。
【0077】
[数11]
ri = zi - p
ただし、pは部分集合Sn−1によって張られた平面上の投影(射影)を示す。n番目のラウドスピーカ230は、たとえば数12で示される、垂直成分rのノルムが最大となるように決定される。
【0078】
[数12]


【0079】
ただし、評価指標の値であるJ(h)は数13で定義される。
【0080】
[数13]
J(hi) = ||ri||
^の垂直成分がr^(実際には“^”の記号はrの上に表記される。以下、同じ。)として示される場合には、n番目の正規直交ベクトルvは数14に従って決定される。
【0081】
[数14]


【0082】
n番目のステップで最大化された評価指標の値J^(実際には“^”の記号はJの上に表記される。以下、同じ。)は数15で示される。
【0083】
[数15]


【0084】
このような数11−数15に従う処理は、評価指標の値J^が予め設定された閾値Jthr^よりも小さくなるまで繰り返される。ただし、周波数帯域[ω,ω]について、2つの評価指標の値が数16に従って求められる。
【0085】
[数16]


【0086】
ただし、h ̄={h(ω),…,h(ω)}であり(実際には、数16に示すように、“ ̄”はhの上に表記される。)、Kは離散周波数ωの数であり、aは離散周波数ωに対する任意の重み係数を示す。垂直成分r(ω)と正規直交ベクトルv(ω)は、単一の周波数の場合と同様に、離散周波数毎に分離して求められる。最適化処理では、評価指標の値Javgは最大化される。一方、評価指標の値Jminは最適化処理の終了判定に用いられる。つまり、Jmin^<Jthr^となったときにラウドスピーカ230の選択を終了する。
【0087】
ただし、最適化処理については、文献(Asano, Suzuki, and Swanson " Optimization of control source configuration in active control systems using Gram-Schmidt orthogonalization", Speech and Audio Processing, IEEE Transactions on, Mar. 1999)に開示されている。
【0088】
この文献においては、評価指標の値が閾値以上(Jmin^≧Jthr^)である場合には、ラウドスピーカ230の選択は継続される。しかし、適切な閾値を決定する方法は確認されていない。したがって、この実施例では、音場共有システム10において、リアルタイムに音場を共有することができるラウドスピーカ230の最大数とマイクロホンの最大数とを検証した。そして、グラムシュミットの直交化法を使用することで、最大数までのラウドスピーカ230の番号(配置位置)を決定した。
【0089】
ここで、上述したように、グラムシュミットの直交化法では、スピーカ位置は、それ以前に選択されたスピーカ位置に基づいて決定されるため、その選択結果は、1番目に選択されるスピーカ位置に強い影響を及ぼされる。
【0090】
たとえば、使用するラウドスピーカ230の個数を、半数程度(32個)、3分の1程度(24個)、4分の1程度(16個)に削減する場合について検討した。図6は、24個のラウドスピーカ230が選択された(24ステップの選択処理を実行した)場合の評価指標の値Javg,Jminの変化である。図6において、横軸は最初に選択されたラウドスピーカ230(基準ラウドスピーカ230)のスピーカ位置(図10参照)を示し、縦軸は評価値(dB)を示す。ただし、2本の実線のうち、細い実線が評価指標の値Javgを示し、細い実線が評価指標の値Jminの変化を示す。
【0091】
詳細な説明は省略するが、たとえば、最初に選択される基準ラウドスピーカ230は「1」番(図10参照)から順次変化(2、3、…、62)され、それぞれの場合について、選択された24個のスピーカ位置(ラウドスピーカ230の番号)の組が選択されるとともに、各組について評価指標の値Javg,Jminが算出される。ただし、選択された24個のスピーカ位置(ラウドスピーカ230の番号)の組と、各組について算出された評価指標の値Javg,Jminは、上述したコンピュータのメモリ(図示は省略するが、ハードディスクやRAM)に記憶される。そして、後述するように、複数の組のうち、評価指標の値Javg,Jminが所定の条件を満たす一組が選択される。したがって、選択された一組の24個のラウドスピーカ230を用いて音場が再現されるのである。
【0092】
また、自由空間グリーン関数は、各ラウドスピーカ230とマイクロホンとの間の伝達関数を得るのに使用された。後述する刺激のための上限周波数は、ここでは制限されなかった。しかし、ラウドスピーカ230の構成(設定)は、20Hzから1kHzまでの範囲を、20Hz毎の周波数で決定された。図示は省略するが、上限周波数が制限されない場合には、上側の層(架台220a、架台220b)に配置されたラウドスピーカ230が、多く選択された。ラウドスピーカ230が全く無い方向から来る波面を統合するのは立体音の再生系においては困難である。したがって、ラウドスピーカ230は、マイクロホンアレイに囲まれるあらゆる可能な方向に位置されるべきである。
【0093】
上述したように、図6には、ラウドスピーカ230について、24ステップ(回)の選択処理を実行した場合の評価指標の値Javg,Jminを折れ線で示したグラフである。この図6からも分かるように、スピーカ位置が「60」(図10参照)であるラウドスピーカ230を最初に選択し、全部で24個のラウドスピーカ230を選択した場合の評価指標の値Javg,Jminが最大である。
【0094】
この実施例では、複数の組(この実施例では、62個の組)のうち、評価指標の値Javg,Jminが所定の条件を満たす一組の24個のラウドスピーカ230が選択される。具体的には、評価指標の値Javgが最大である組が選択される。ただし、評価指標の値Javgが最大である組についての評価指標の値Jminが極端に低い場合には、線形独立性の低い周波数が存在するため、評価指標の値Javgが最大であっても、選択するのは適切ではない。正しく音場を再現できないと考えられるからである。かかる場合には、次に評価指標の値Javgが大きい組が選択される。ただし、次に評価指標の値Javgが大きい組についての評価指標の値Jminが極端に低い場合には、その次に評価指標の値Javgが大きい組が選択される。それ以降も同様である。たとえば、評価指標の値Jminが極端に低いかどうかについては、予め設定された閾値によってコンピュータは判断する。この閾値は、音場共有システム10の開発者ないし使用者が設定する値である。ただし、後述の図7に示すように、選択するラウドスピーカ230の個数が増えるに従って、評価指標の値Javg,Jminは次第に低下するため、選択するラウドスピーカ230の個数に応じて、閾値も可変的に設定する必要がある。
【0095】
また、図7は、スピーカ位置が「60」であるラウドスピーカ230を最初に選択し、その後、選択処理を繰り返した場合の評価指標の値Javg,Jminの変化を示すグラフである。図7から分かるように、評価指標の値Javg,Jminは次第に低下している。
【0096】
簡単のため、図示は省略するが、上述したように、ラウドスピーカ230の個数を16個や32個に低減した場合についても、図6に示すような評価指標の値Javg,Jminの変化を示した。ただし、後述するように、音源定位テストの結果に基づいて、ラウドスピーカ230の最大数を24個に決定した。
【0097】
予備試験の結果では、サーバ12およびコンピュータ18、20の性能およびネットワーク16を含む通信速度の制約から、[W(ω)]における要素の数がM×N=192以内で、ラウドスピーカ230の数(M)およびマイクロホンの数(N)が決定されるべきであることが示された。ただし、この実施例では、サーバ12およびコンピュータ18、20のCPU(図示せず)はXeon(登録商標) QuadCore×2であり、メモリ(図示せず)は4GBである。また、サーバ12には、オペレーティングシステムとして、Windows(登録商標) XP 64bitが採用された。また、サーバ12とコンピュータ18、20とを結ぶネットワーク16としては、超高速・高機能研究開発テストベッドネットワーク(JGN2plus:1Gbps)およびLAN(100Mbps)が用いられた。
【0098】
なお、図示は省略するが、予備実験においては、サーバ12とコンピュータ18とは、上述のLANを用いて接続され、サーバ12とコンピュータ20とは、上述のJGN2plusおよびLANを用いて接続される。
【0099】
したがって、上述したように、ラウドスピーカ230の数(M)を「24」に決定したため、選択されるマイクロホンの数(N)は最大で「8」である。図8は、マイクロホンについて、8ステップの選択処理を実行した場合の評価指標の値Javg,Jminの変化が示される。この図8からも分かるように、マイクロホン位置が「65」であるマイクロホン(基準のマイクロホン)を最初に選択した場合に、全部で8個のマイクロホンを選択したときの評価指標の値Javg,Jminが最大である。
【0100】
また、図9は、マイクロホン位置が「65」であるマイクロホンを最初に選択し、その後、選択処理を繰り返した場合の評価値J,Jminの変化が示される。図9に示すように、評価指標の値J,Jminは選択処理を繰り返すと次第に小さくなり、繰り返し回数が「25」である場合に、つまりマイクロホンが25個選択された場合に、評価指標の値J,Jminが著しく低下する。したがって、マイクロホンの最大数は、24個以内に決定するのが望ましいと考えられる。上述したように、ここでは、8個のマイクロホンを選択するため、この要件は満たしていると言える。
【0101】
図10には、上述したように、スピーカ位置が「60」のラウドスピーカ230が最初に選択し、全部で24個のラウドスピーカ230を選択した場合の24個のラウドスピーカ230のスピーカ位置の分布が示される。ただし、図10では省略するが、スピーカ位置が中央に向かうに従って高さ方向(Z方向)の値は大きくなる。したがって、架台220aに設けられたラウドスピーカ230のスピーカ位置は、「1」−「6」である。また、架台220bに設けられたラウドスピーカ230のスピーカ位置は、「7」−「22」である。さらに、架台220cに設けられたラウドスピーカ230のスピーカ位置は、「23」−「46」である。そして、架台220dに設けられたラウドスピーカ230のスピーカ位置は、「47」−「62」である。
【0102】
なお、低域を補うために、4本の柱部222に設けられた8個のラウドスピーカ230は選択の対象では無いため、図10には示されていない。
【0103】
図10においては、最初に選択されたラウドスピーカ230のスピーカ位置を示す丸印(「60」が記載された丸印)に網掛模様が付される。また、これに続いて、グラムシュミットの直交化法に基づく繰り返しの結果として選ばれたラウドスピーカ230のスピーカ位置を示す丸印(ここでは、「1」−「6」、「7」、「9」、「11」、「13」、「15」、「17」、「19」、「21」、「23」、「31」、「35」、「48」、「51」、「54」、「56」、「58」、「62」が記載された丸印)に斜線模様が付されている。さらに、模様が付されていない丸印は、選択されなかったラウドスピーカ230のスピーカ位置を示す。この図10からは、各方向と高さに分布されたラウドスピーカ230が規則的に観測される。図10のように平面的に見た場合には、上下および左右のそれぞれにおいて、選択されたラウドスピーカ230が略対称に分布していることが分かる。
【0104】
また、ラウドスピーカ230とマイクロホンとの構成を入れ替えることによって、上述したグラムシュミットの直交化法を適用することにより、マイクロホンを選択した。ただし、グラムシュミットの直交化法を用いた選択方法については既に説明したため、重複した説明は省略することにする。
【0105】
図11は、図10に示した24個のラウドスピーカ230の配列に対する8個のマイクロホンの配列を示す。図示は省略するが、マイクロホンの位置は、ラウドスピーカ230のスピーカ位置と同様に、番号が割り当てられている。図11では少し分かり難いが、XY平面を真上方向から平面的に見た場合には、選択されたマイクロホンはすべての方向に均等に分布している。
【0106】
このように、グラムシュミットの直交化法を使用することによって、マイクロホンおよびラウドスピーカ230の数を低減するようにしたが、この低減による影響を評価するために、水平面の音源定位テストが行われた。
【0107】
音源定位テストにおいては、BoSC再生システムを使用することで再生された刺激は、ピンクノイズとインパルス応答の畳み込みから発生させた。ただし、インパルス応答は、自由空間グリーン関数からシミュレートされた。シミュレーションにおいては、音源の位置は、マイクロホンアレイ14の中心から1メートル離れたところに配置されているものと仮定した。また、BoSC再生システムにおける音場再生(立体音響再生)のための逆フィルタは、あらかじめ48kHzのサンプリング周波数で測定されたインパルス応答を使用することによって計算され、逆フィルタの長さは4096ポイントであった。刺激の音圧レベルは、各実験条件と方向との間のレベル差を排除するように、マイクロホンアレイ14の中心においてLA,Fmax=55dBに調整された。
【0108】
ラウドスピーカ230の数とマイクロホンの数に関する実験条件は図12に示す表にまとめた。すべてのラウドスピーカ230とすべてのマイクロホンは、条件5において使用された。条件4においては、すべてのマイクロホンに対して、ラウドスピーカ230の数が24まで低減された。条件1、2および3は、上述したように、ラウドスピーカの数を24、32および16にしており、逆行列[W(ω)]の要素数(192)を一致させるように、マイクロホンの数がそれぞれ8、6、12に決定された。
【0109】
また、この音源定位テストにおいては、20歳代から50歳代までの13人の被験者(5人の男性と8人の女性)は、再生された刺激を聞いた後に、知覚した角度を回答した。刺激は、水平面において、0度−330度の間を、30度刻みで提示された。それらは、2秒継続され、各角度について2回繰り返された。ただし、提示順序は、ラテン方格法を用いることにより、決定された。ただし、被験者は刺激を聞いている間、頭と体を動かすことは許容された。
【0110】
音源定位テストの結果は、図13(A)および図13(B)に示される。図13(A)は、各条件における、再生した音の角度と知覚された角度の差についてのRMS値(二乗平均値)の被験者間の平均を示す。ただし、図13(A)では、エラーバーは95%の信頼区間(CI)を示す。図13(A)から分かるように、条件5の場合に、最も低いRMS値が得られ、そして、結果として、音源定位の最も高い精度は実現されました。条件4では、上述したように、24個のラウドスピーカ230と70個のマイクロホンとが使用され、RMS値は、条件5の場合よりも約5度大きかった。条件1のRMS値は、条件5の場合よりも約15度大きかった。また、条件2と条件3のRMS値はほとんど同じであるが、それらの値は、条件5の場合よりも約25度大きかった。
【0111】
また、図13(B)には、各条件における、被験者の正解率およびエラーバーが95%の信頼区間(CI)を示す。図13(B)から分かるように、条件5においては、図13(A)に示した結果と同様に、最も高い正解率が得られた。また、条件5の正解率は、条件4の場合よりも約5%高く、条件1の場合よりも約10%高い。
【0112】
詳細な説明は省略するが、ハートレイ検定では、すべての条件について同様の変化を有することが確認されたため、他のシステム(条件)とは著しく異なるシステム(条件)を見つけるために、テューキーの多重比較法が適用される。この統計的検査法の結果は、図14(A)および(B)に示す表で示される。ただし、図14(A)および(B)に示す表では、“*”が各条件の間における1%の顕著な差を示し、“**”が各条件の間における5%の顕著な差を示している。テューキーの多重比較法では、条件5と条件4との間および条件5と条件1との間には、著しい違いが無いことが確認された。したがって、BoSC再生システムを構成するラウドスピーカ230とマイクロホンの数がグラムシュミットの直交化法を使用することで低減することができると言える。対照的に、条件5と条件2との間および条件5と条件3との間には、著しい違いが有ることが確認された。したがって、条件2や条件3を用いた場合には、BoSC再生システムによる再生は、臨場感を損なうと言える。
【0113】
以上のように、この実施例では、グラムシュミットの直交化法を用いて、ラウドスピーカ230とマイクロホンの数を低減する方法が示された。グラムシュミットの直交化法を使用して、高い線形独立性を有する縦ベクトルのグループが各ラウドスピーカ230とマイクロホンの間の伝達関数マトリクスから選択するようにした。選択されたベクトルは、BoSC再生システム10a、10bでのラウドスピーカ230とマイクロホンの構成に対応している。したがって、他の評価基準を使用することで選択されたラウドスピーカ230とマイクロホンとによって構成されたシステムと比べて、そのようなシステムは音響の環境の変化に打ち勝つことができると考えられる。
【0114】
また、選択手順において、20Hzから1kHzまでの周波数帯域の制限は、シミュレーションにおいて、ラウドスピーカ230が規則的に分散している構成を満たした。また、同様に、グラムシュミットの直交化法を用いて、マイクロホンを選択した結果、すべての水平な方向に規則的に分配され、低減された数のマイクロホンが得られた。このように、マイクロホンは、ラウドスピーカ230と同じ方法で選択されたが、ラウドスピーカ230の数は、グラムシュミットの直交化法により既に低減されていた。
【0115】
また、ラウドスピーカ230とマイクロホンの数を低減したことによる劣化を評価するために、水平面の音源定位テストが行われた。主観評価の結果によれば、62個のラウドスピーカ230からなるBoSC再生システムと24個のラウドスピーカ230から成るBoSC再生システムとの間には、統計的に著し違いは存在しなかった。さらに、24個のラウドスピーカ230に対して、8個のマイクロホンを用いたシステムと、70個のマイクロホンを用いたシステムとの間にも、統計的な著しい違いは存在しなかった。
【0116】
したがって、24個のラウドスピーカ230の構成を適用しても良いと考えられる。また、この実施例では、サーバ12、コンピュータ18、20の性能およびネットワーク16の制約から、逆行列[W(ω)]の要素数(192)が決定され、したがって、24個のラウドスピーカ230に対して8個のマイクロホンの構成を適用することに決定された。
【0117】
詳細な説明は省略するが、選択されたマイクロホンで検出された音場信号がマイクロホンアレイ14からサーバ12に与えられる。このとき、選択されていないマイクロホンは不能化される。つまり、サーバ12は、選択されていないマイクロホンからの音場信号を検出しない。一方、コンピュータ18および20は、選択されたラウドスピーカ230のみに、音場データや音声データを出力する。
【0118】
この実施例によれば、グラムシュミットの直交評価法に従って、2次音源であるラウドスピーカの数を低減するとともに、1次音源の音を収録するためのマイクロホンの数も低減するため、畳み込みの処理負荷を低減することができるとともに、伝送するデータ量を低減することができる。したがって、音場で収録した音に対応する音場データを、リアルタイムに伝送し、クライアント側で再生することができる。つまり、音場に存在する人間と、スピーカシステムを使用するユーザとによって、リアルタイムに音場を共有することができる。
【0119】
なお、この実施例では、2台のクライアントコンピュータを示したが、3台以上のクライアントコンピュータがネットワークに接続されてもよい。かかる場合には、各クライアントコンピュータは、他の2台以上のクライアントコンピュータからの音声データを個別に畳み込み、音場データに重畳する。
【符号の説明】
【0120】
10 …音場共有システム
12 …サーバ
14 …マイクロホンアレイ
18,20 …コンピュータ
22,26 …スピーカアレイシステム

【特許請求の範囲】
【請求項1】
或る音場に配置され、第1所定数のマイクホンを有するマイクロホンアレイ、
前記マイクロホンアレイによって検出された音場データを収録し、当該音場データを複数の再現システムに伝送するサーバ、および
前記サーバからの音場データを第2所定数のラウドスピーカを有するスピーカアレイによって再生する前記再現システムを備える、音場共有システムであって、
前記スピーカアレイのうちの1個のラウドスピーカを最初の基準ラウドスピーカとして選択する初期スピーカ選択手段、
前記スピーカアレイのうち、選択された基準ラウドスピーカと当該基準ラウドスピーカ以外のすべての評価対象ラウドスピーカのそれぞれとの間のグラムシュミット直交化評価値を算出する第1評価値算出手段、
前記第1評価値算出手段によって算出されたグラムシュミット直交化評価値が最も高い前記評価対象ラウドスピーカを前記基準ラウドスピーカとして選択する基準スピーカ選択手段、
前記基準スピーカ選択手段による選択の結果、前記基準ラウドスピーカの数が前記第2所定数よりも少ない第3所定数になるまで、前記第1評価値算出手段および前記基準スピーカ選択手段を繰り返し実行させる第1実行手段、
前記マイクロホンアレイのうちの1個のマイクロホンを最初の基準マイクロホンとして選択する初期マイク選択手段、
前記マイクロホンアレイのうち、選択された基準マイクロホンと当該基準マイクロホン以外のすべての評価対象マイクロホンのそれぞれとの間のグラムシュミット直交化評価値を算出する第2評価値算出手段、
前記第2評価値算出手段によって算出されたグラムシュミット直交化評価値が最も高い前記評価対象マイクロホンを前記基準マイクロホンとして選択する基準マイク選択手段、および
前記基準マイク選択手段による選択の結果、前記基準マイクロホンの数が前記第1所定数よりも少ない第4所定数になるまで、前記第2評価値算出手段および前記基準マイク選択手段を繰り返し実行させる第2実行手段を備え、
前記サーバは、前記第4所定数の前記基準マイクロホンによって検出された音場データを前記複数の再現システムに伝送し、
前記複数の再現システムの各々は、前記第3所定数の基準ラウドスピーカを用いて、前記サーバから伝送された前記音場データを再生する、音場共有システム。
【請求項2】
前記初期スピーカ選択手段によって選択される前記最初の基準ラウドスピーカを順次変化させる初期スピーカ変化手段、
前記初期スピーカ変化手段によって前記最初の基準ラウドスピーカを順次変化させたとき、それぞれの場合について、選択された前記第3所定数の前記基準ラウドスピーカの複数の組を記憶する第1組記憶手段、および
前記第1組記憶手段によって記憶された複数の組のうち、前記第1評価値算出手段によって算出されたグラムシュミット直交化評価値が所定の条件を満たす一組の前記第3所定数の前記基準ラウドスピーカを選択する第1組選択手段をさらに備え、
前記複数の再現システムの各々は、前記第1組選択手段によって選択された一組の前記第3所定数の前記基準ラウドスピーカを用いて、前記サーバから伝送された前記音場データを再生する、請求項1記載の音場共有システム。
【請求項3】
前記初期マイク選択手段によって選択される前記最初の基準マイクロホンを順次変化させる初期マイク変化手段、
前記初期マイク変化手段によって前記最初の基準マイクロホンを順次変化させたとき、それぞれの場合について、選択された前記第4所定数の前記基準マイクロホンの複数の組を記憶する第2組記憶手段、および
前記第2組記憶手段によって記憶された複数の組のうち、前記グラムシュミット直交化評価値が所定の条件を満たす一組の前記第4所定数の前記基準マイクロホンを選択する第2組選択手段をさらに備え、
前記サーバは、第2組選択手段によって選択された一組の前記第4所定数の前記マイクロホンによって検出された音場データを前記複数の再現システムに伝送する、請求項2記載の音場共有システム。
【請求項4】
前記第4所定数は、前記第3所定数に応じて決定される、請求項1ないし3のいずれかに記載の音場共有システム。
【請求項5】
前記第3所定数および前記第4所定数は、少なくとも前記サーバおよび前記再現システムの処理能力に応じて決定される、請求項1ないし4のいずれかに記載の音場共有システム。
【請求項6】
前記第2所定数は62であり、前記第3所定数は24を超えない値である、請求項1ないし5のいずれかに記載の音場共有システム。
【請求項7】
前記第1所定数は70であり、前記第4所定数は8を超えない値である、請求項6記載の音場共有システム。
【請求項8】
或る音場に配置され、第1所定数のマイクホンを有するマイクロホンアレイ、
前記マイクロホンアレイによって検出された音場データを収録し、当該音場データを複数の再現システムに伝送するサーバ、および
前記サーバからの音場データを第2所定数のラウドスピーカを有するスピーカアレイによって再生する前記再現システムを備える、音場共有システムの前記マイクロホンアレイおよび前記スピーカアレイの個数および配置を最適化する最適化方法であって、
(a)前記スピーカアレイのうちの1個のラウドスピーカを最初の基準ラウドスピーカとして選択し、
(b)前記スピーカアレイのうち、選択された基準ラウドスピーカと当該基準ラウドスピーカ以外のすべての評価対象ラウドスピーカのそれぞれとの間のグラムシュミット直交化評価値を算出し、
(c)前記ステップ(b)によって算出されたグラムシュミット直交化評価値が最も高い前記評価対象ラウドスピーカを前記基準ラウドスピーカとして選択し、
(d)前記ステップ(c)による選択の結果、前記基準ラウドスピーカの数が前記第2所定数よりも少ない第3所定数になるまで、前記ステップ(b)および前記ステップ(c)を繰り返し実行させ、
(e)前記マイクロホンアレイのうちの1個のマイクロホンを最初の基準マイクロホンとして選択し、
(f)前記マイクロホンアレイのうち、選択された基準マイクロホンと当該基準マイクロホン以外のすべての評価対象マイクロホンのそれぞれとの間のグラムシュミット直交化評価値を算出し、
(g)前記ステップ(f)によって算出されたグラムシュミット直交化評価値が最も高い前記評価対象マイクロホンを前記基準マイクロホンとして選択し、そして
(h)前記ステップ(g)による選択の結果、前記基準マイクロホンの数が前記第1所定数よりも少ない第4所定数になるまで、前記ステップ(f)および前記ステップ(g)を繰り返し実行させる、最適化方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate


【公開番号】特開2012−85035(P2012−85035A)
【公開日】平成24年4月26日(2012.4.26)
【国際特許分類】
【出願番号】特願2010−228392(P2010−228392)
【出願日】平成22年10月8日(2010.10.8)
【新規性喪失の例外の表示】特許法第30条第1項適用申請有り システム制御情報学会「第54回システム制御情報学会 研究発表講演会 講演論文集」2010年5月19日発行 オーストラリア音響学会 「Proceedings of 20th International Congress on Acoustics,ICA2010」 2010年8月発行
【出願人】(301022471)独立行政法人情報通信研究機構 (1,071)