説明

記録された音場の再構築

【課題】記録された音場を再構築するための優れた機器や方法を提供する。
【解決手段】記録された音場を再構築するための機器(10)は、音場を測定して記録されたデータを取得するための検知装置(12)を含む。信号処理モジュール(14)は、検知装置(12)と通信し、(a)記録された音場のスパース性を推定すること、及び、(b)記録された音場を再構築することができるように平面波信号を取得すること、のうちの少なくとも1つのために記録されたデータを処理する。

【発明の詳細な説明】
【技術分野】
【0001】
本開示は一般に、記録された音場の再構築に関し、より詳細には、圧縮検知及び独立成分解析のうちの少なくとも一方に関する技術を使用して音場を記録し、次いで再構築するための機器及び方法に関する。
【0002】
[関連出願の相互参照]
本出願は、本明細書にその内容が参照により完全に組み込まれる、2009年10月7日出願のオーストラリア特許仮出願第2009904871号の優先権を主張する。
【背景技術】
【0003】
マイクロフォン及びスピーカ(又はヘッドホン)を使用して音場を記録し、次いで再生するための様々な手段が存在する。本開示の焦点は、創造的な変更が許容される芸術的な音場の再生と比較して、正確な音場の再構築及び/又は再生である。現在、音場を正確に記録し、再生するために使用される主な最新の技術が2つあり、すなわち、高次アンビソニックス(higher order ambisonics:HOA)及び波面合成(wave−field synthesis:WFS)である。WFS技術は一般に、音源ごとにスポットマイクを必要とする。さらに、各音源の位置を決定し、記録しなければならない。次いで、各スポットマイクからの記録は、WFSの数学的装置を使用して行われる。スポットマイクは、音源ごとに使用可能でないことがあり、又はスポットマイクは、使いにくい場合がある。こうした場合、一般に、例えば線形、円形、又は球状のアレイなど、よりコンパクトなマイクロフォンアレイを使用する。現在、コンパクトなマイクロフォンアレイからの音場の再構築に使用可能な最適な技術は、HOAである。しかし、HOAは、(1)スイートスポットが小さいこと、及び(2)数学系が過小制約されているとき(例えば、非常に多くのスピーカが使用されるとき)、再構築の劣化という主に2つの問題を被る。スイートスポットが小さい現象は、音場が小さいスペース領域について正確であるにすぎないことを意味する。
【0004】
本開示に関するいくつかの用語については、以下で定義される。
【0005】
「音場を再構築すること」とは、記録された音場を再生することに加えて、1組の解析平面波の方向を使用して、1組の平面波ソース信号及びその関連のソース方向を決定することを指す。通常、密度の高い1組の平面波ソース方向に関連して、平面波ソース信号のベクトルgの各エントリが関連するソース方向に明確に一致するgを取得するための解析が行われる。
【0006】
「頭部伝達関数」(HRTF)又は「頭部インパルス応答」(HRIR)とは、線型システムとして外耳、頭、肩、及び胴を含む人間の聴覚末梢系の方向の音響特性を数学的に指定する伝達関数を指す。HRTFは、周波数領域における伝達関数を表し、HRIRは、時間領域における伝達関数を表す。
【0007】
「HOA領域」及び「HOA領域フーリエ展開」とは、例えばフーリエベッセルシステム、円形高調波法(circular harmonics)など、高次アンビソニックスのための解析及び合成に使用され得る任意の数学的基準の組を指す。信号は、HOA領域の数学的基準の組における信号の展開に基づいて、信号の成分で表され得る。信号がこうした成分で表されるとき、「HOA領域」で表されると言われる。HOA領域における信号は、他の信号と類似の方法で周波数及び時間領域において表され得る。
【0008】
「HOA」とは、HOA領域における音場の表現及び操作を含む一般的な用語である高次アンビソニックスを指す。
【0009】
「圧縮サンプリング」又は「圧縮検知(Compressed Sensing)」又は「圧縮検知(Compressive Sensing)」はすべて、スパース領域(sparse domain)(以下に定義)における信号を解析する1組の技術を指す。
【0010】
「スパース領域(Sparsity Domain)」又は「スパース領域(Sparse Domain)」は、サンプリングされた観察値のベクトルyが、例えば以下の通り行列ベクトル積として書かれ得ることを指す圧縮サンプリング用語である。
y=Ψx
式中、Ψは基本関数の基準であり、xにおける係数はほとんどすべてヌルである。xにおけるS個の係数がヌル以外である場合、観察された現象がスパース領域ΨにおいてSスパースであると言う。
【0011】
関数「pinv」とは、疑似逆行列、正規化された疑似逆行列、又はムーアペンローズ逆行列を指す。
【0012】
ベクトルxのL1ノルムは、||x||によって表され、
【数1】


によって得られる。
【0013】
ベクトルxのL2ノルムは、||x||によって表され、
【数2】


によって得られる。
【0014】
行列AのL1−L2ノルムは、||A||1−2によって表され、
||A||1−2=||u||
によって得られ、この場合、
【数3】


であり、u[i]は、uのi番目の要素であり、A[i,j]は、Aのi番目の行及びj番目の列の要素である。
【0015】
「ICA」は、例えば、所与の1組の混合信号について、混合行列及び非混合行列を推定するための手段を提供する数学的方法である独立成分解析である。ICAは、1組の混合信号についての1組の分離されたソース信号も提供する。
【0016】
記録された音場の「スパース性(sparsity)」は、どの程度少数のソースが音場を支配するかの基準を提供する。
【0017】
ベクトル又は行列の「優位な成分」とは、他の成分の一部より相対値においてかなり大きいベクトル又は行列の成分を指す。例えば、ベクトルxについて、比率
【数4】


又は比率の対数
【数5】


を計算することによって、xと比較して成分xの相対値を測定することができる。比率又はログ比が何らかの特定の閾値、すなわちθthを超える場合、xは、xと比較して優位な成分と考えられ得る。
【0018】
「ベクトル又は行列をクリーニングすること」とは、ベクトル又は行列において優位な成分(上記で定義した通り)を検索し、次いで、優位な成分ではない成分の一部を削除する、又はゼロに設定することによってベクトル又は行列を変更することを指す。
【0019】
「行列Mを縮小すること」とは、すべてゼロを含むMの列を削除し得る操作、及び/又は優位な成分を有していない列を削除し得る操作を指す。代わりに、「行列Mを縮小すること」とは、何らかのベクトルxに応じて行列Mの列を削除することを指し得る。この場合、ベクトルxの優位な成分に対応しない行列Mの列は削除される。さらにまた、「行列Mを縮小すること」とは、何らかの他の行列Nに応じて行列Mの列を削除することを指し得る。この場合、行列Mの列は、行列Nの列又は行に何らかの形で対応していなければならない。この対応があるとき、「行列Mを縮小すること」とは、優位な成分を有していない行列Nの行又は列に対応する行列Mの列を削除することを指す。
【0020】
「行列Mを拡大すること」とは、すべてゼロを含む1組の列を行列Mに挿入し得る操作を指す。こうした操作が必要とされ得るときの一例は、行列Mの列がより小さい1組の基底関数に対応し、より大きい1組の基底関数に適した方法で行列Mを表すことが必要とされるときである。
【0021】
「時間信号x(t)のベクトルを拡大すること」とは、すべてゼロを含む信号を時間信号のベクトルx(t)に挿入し得る操作を指す。こうした操作が必要とされ得るときの一例は、x(t)のエントリがより小さい1組の基底関数に一致する時間信号に対応し、より大きい1組の基底関数に適した方法で時間信号のベクトルx(t)を表すことが必要とされるときである。
【0022】
「FFT」とは、高速フーリエ変換を意味する。
【0023】
「IFFT」とは、逆高速フーリエ変換を意味する。
【0024】
「バフル付き球状マイクロフォンアレイ」とは、固体球など、剛体バフルに取り付けられるマイクロフォンの球状アレイを指す。バフル付き球状マイクロフォンアレイは、バフルを有していないマイクロフォンのオープン球状アレイとは対照的である。
【0025】
この開示に関連したいくつかの表記について、以下で説明される。
【0026】
時間領域及び周波数領域のベクトルは、以下の表記を使用して表されることがある。時間領域信号のベクトルは、x(t)と書かれる。周波数領域において、このベクトルは、xと書かれる。換言すれば、xは、x(t)のFFTである。この表記との混同を避けるために、時間信号のすべてのベクトルは、明示的にx(t)と書き出される。
【0027】
行列及びベクトルは、太字を使用して表される。行列は太字の大文字を使用して表され、ベクトルは太字の英小文字を使用して表される。
【0028】
フィルタの行列は、太字の大文字を使用して、例えば時間領域において表されるときには明示的な時間成分によってM(t)のように、又は周波数領域において表されるときには明示的な周波数成分によってM(ω)のように表される。この定義の残りの部分では、フィルタの行列が時間領域において表されると仮定する。次いで、行列の各エントリは、それ自体、有限インパルス応答フィルタである。行列M(t)の列インデックスは、行列によってフィルタ処理されるべき時間信号の何らかのベクトルのインデックスに対応するインデックスである。行列M(t)の行インデックスは、出力信号のグループのインデックスに対応する。フィルタの行列が時間信号のベクトルに対して演算を行うとき、「乗算演算子」は、以下でさらに詳細に説明される畳込み演算子である。
【0029】
【数6】


は、畳込みを意味する数学的演算子である。この演算子は、時間信号のベクトルによる(一般の行列として表される)フィルタの行列の畳込みを表すために使用され得る。例えば、
【数7】


は、x(t)の対応する時間信号のベクトルによるフィルタの行列M(t)の畳込みを表す。M(t)の各エントリはフィルタであり、M(t)の各列に沿って並ぶエントリは、時間信号x(t)のベクトルに含まれる時間信号に対応する。M(t)の各行に沿って並ぶフィルタは、出力信号のベクトルy(t)における異なる時間信号に対応する。具体例として、x(t)は、1組のマイクロフォン信号に対応し、一方、y(t)は、1組のHOA領域の時間信号に対応し得る。この場合、式
【数8】


は、マイクロフォン信号がM(t)の各行によって得られる1組のフィルタでフィルタ処理され、次いで合計されて、y(t)でHOA領域成分信号のうちの1つに対応する時間信号を提供することを示す。
【0030】
信号処理操作のフローチャートは、数字を使用して、特定のステップ番号を示し、文字を使用して、いくつかの異なる操作パスのうちの1つを示すことによって表される。したがって、例えば、ステップ1.A.2.B.1は、第1のステップに、代替の操作パスAがあり、パスAは第2のステップを有し、第2のステップは代替の操作パスBを有し、パスBは第1のステップを有することを示す。
【発明の概要】
【0031】
第1の態様において、記録された音場を再構築するための機器が提供され、当該機器が
音場を測定して記録されたデータを取得するための検知装置と、
検知装置と通信し、
(a)記録された音場のスパース性を推定すること、及び
(b)記録された音場を再構築することができるように平面波信号及びその関連のソース方向を取得することのうちの少なくとも1つのために記録されたデータを処理する信号処理モジュールと
を含む。
【0032】
検知装置は、マイクロフォンアレイを備え得る。マイクロフォンアレイは、バフル付きアレイ及びオープン球状アレイのうちの一方でもよい。
【0033】
信号処理モジュールは、以下の態様3及び4のうちの一方の方法に従って記録されたデータのスパース性を推定するように構成され得る。
【0034】
さらに、信号処理モジュールは、以下の態様5〜7の方法を使用して、記録された音場を解析して、音場におけるソースを分離し、ソース位置を識別する1組の平面波信号を取得し、音場を再構築できるように構成され得る。
【0035】
信号処理モジュールは、1組の平面波信号を変更して、残響などの不要なアーチファクト及び/又は不要な音源を低減するように構成され得る。残響を低減するために、信号処理モジュールは、平面波信号における信号のうちのいくつかの信号値を低減することができる。不要な音源が低減され得るように、音場の再構築において音源を分離するために、信号処理モジュールは、1組の平面波信号における信号のうちのいくつかをゼロに設定するように動作可能であり得る。
【0036】
当該機器は、再構築された音場を再生するための再生装置を含み得る。再生装置は、スピーカアレイ及びヘッドホンのうちの一方とすることができる。信号処理モジュールは、再構築された音場を再生するためにどの再生装置が使用されるかに基づいて、記録されたデータを変更するように動作可能とすることができる。
【0037】
第2の態様において、記録された音場を再構築するための方法が提供され、当該方法が
時間領域技術及び周波数領域技術のうちの一方を使用して、スパース領域における記録されたデータを解析するステップと、
記録された音場を再構築することができるように、選択された技術から生成された平面波信号及びその関連のソース方向を取得するステップと
を含む。
【0038】
当該方法は、音響検知装置を使用して、1組の信号smic(t)の形で記録されたデータを取得するために、音場の音声の時間フレームを記録するステップを含み得る。好ましくは、音響検知装置は、マイクロフォンアレイを備える。マイクロフォンアレイは、バフル付き、又はオープン球状マイクロフォンアレイとすることができる。
【0039】
第3の態様において、当該方法は、記録された音場のスパース性を計算するために、HOA領域においてICAを適用することによって、記録された音場のスパース性を推定するステップを含み得る。
【0040】
当該方法は、HOA領域における記録された音場を解析して、HOA領域の時間信号のベクトルbHOA(t)を取得し、信号処理技術を使用して、bHOA(t)から混合行列MICAを計算するステップを含み得る。方法は、信号処理技術として瞬時の独立成分解析を使用するステップを含み得る。
【0041】
当該方法は、
【数9】


を計算することによって、1組の平面波基準方向と関連したHOA方向ベクトル上に混合行列MICAを投影するステップを含み得る。式中、
【数10】


は、平面波基準方向と関連した実数値(複素数値)のHOA方向行列の転置(エルミート共役)であり、
【数11】


におけるハット演算子は、その行列がHOA次数Mに切り捨てられたことを示す。
【0042】
当該方法は、最初にVsourceによって表される優位な平面波方向の数Nsourceを決定し、次いで
【数12】


を計算することによって、記録されたデータのスパース性Sを推定するステップを含み得る。式中、Nplwは、平面波基準方向の数である。
【0043】
第4の態様において、当該方法は、記録された音場のスパース性を計算するために圧縮検知又は凸最適化技術を使用して記録されたデータを解析することによって、記録された音場のスパース性を推定するステップを含み得る。
【0044】
当該方法は、HOA領域における記録された音場を解析して、HOA領域の時間信号のベクトルbHOA(t)を取得し、所与の時間フレームLにわたってHOA領域の時間信号のベクトルをサンプリングして、時刻t〜tにおいて時間サンプルの集まりを取得して、以下によって、行列BHOAとして表される各時刻における1組のHOA領域ベクトルbHOA(t),bHOA(t),・・・,bHOA(t)を取得するステップを含み得る。
【0045】
HOA=[bHOA(t),bHOA(t),・・・,bHOA(t)]
当該方法は、特異値分解をBHOAに適用して、行列分解
HOA=USV
を取得するステップを含み得る。
【0046】
当該方法は、mがBHOAの行の数である場合、Sの最初のm個の列のみを保持することによって行列Sreducedを形成し、
Ω=USreduced
によって得られる行列Ωを形成するステップを含み得る。
【0047】
当該方法は、行列Γについて、以下の凸計画問題を解決するステップを含み得る。
【0048】
ここでの凸計画問題とは、
||YplwΓ−Ω||L2≦εの条件で、||Γ||L1−L2を最小にする問題である。
plwは、列が何らかの1組の解析平面波に対応する1組の方向についての球面調和関数の値である行列(高い球面調和次数に切り捨てられる)であり、
εは、負でない実数である。
【0049】
当該方法は、以下を使用して、ΓからGplwを取得するステップを含み得る。
【0050】
plw=ΓV
式中、Vは、BHOAの行列分解から取得される。
【0051】
当該方法は、以下を計算することによって、L番目の時間フレームについて、非混合行列Πを取得するステップを含み得る。
【0052】
Π=(1−α)ΠL−1+αΓpinv(Ω)
式中、ΠL−1は、L−1時間フレームについての混合行列であり、
αは、0≦α≦1となるような忘却因子である。
【0053】
当該方法は、以下を使用してGplw−smoothを取得するステップを含み得る。
plw−smooth=ΠHOA
【0054】
当該方法は、標準の重畳加算(overlap−add)技術を使用して、平面波時間サンプルの集まりGplw−smoothから平面波信号のベクトルgplw−cs(t)を取得するステップを含み得る。代わりに、平面波信号のベクトルgplw−cs(t)を取得するとき、当該方法は、標準の重畳加算技術を使用して平滑化することなく、平面波時間サンプルの集まりGplwからgplw−cs(t)を取得するステップを含み得る。
【0055】
当該方法は、最初にgplw−cs(t)の優位な成分の数Ncompを計算し、次いで
【数13】


を計算することによって、記録されたデータのスパース性を推定するステップを含み得る。式中、Nplwは、解析平面波基準方向の数である。
【0056】
第5の態様において、当該方法は、スパース領域における記録されたデータを解析するために周波数領域技術を使用することによって、記録された音場を再構築するステップと、記録された音場を再構築することができるように周波数領域技術から平面波信号を取得するステップとを含み得る。
【0057】
当該方法は、FFTを使用して1組の信号smic(t)を周波数領域に変換してsmicを取得するステップを含み得る。
【0058】
当該方法は、平面波解析を使用して周波数領域における記録された音場を解析して、平面波形振幅のベクトルgplw−csを生成するステップを含み得る。
【0059】
第5の態様の第1の実施形態において、当該方法は、平面波形振幅のベクトルgplw−csについて、以下の凸計画問題を解決することによって、記録された音場の平面波解析を行うステップを含み得る。
【0060】
ここでの凸計画問題とは、
【数14】


の条件で、||gplw−cs||を最小にする問題である。
plw/micは、平面波とマイクロフォンとの間の伝達行列であり、
micは、マイクロフォンアレイによって記録される信号の組であり、
εは、負でない実数である。
【0061】
第5の態様の第2の実施形態において、当該方法は、平面波振幅のベクトルgplw−csについて、以下の凸計画問題を解決することによって、記録された音場の平面波解析を行うステップを含み得る。
【0062】
ここでの凸計画問題とは、
【数15】


及び
【数16】


の条件で、||gplw−cs||を最小にする問題である。
plw/micは、平面波とマイクロフォンとの間の伝達行列であり、
micは、マイクロフォンアレイによって記録される信号の組であり、
εは、負でない実数であり、
plw/HOAは、平面波とHOA領域フーリエ展開との間の伝達行列であり、
HOAは、Tmic/HOAがマイクロフォンとHOA領域フーリエ展開との間の伝達行列である場合、bHOA=Tmic/HOAmicによって得られる1組のHOA領域フーリエ係数であり、
εは、負でない実数である。
【0063】
第5の態様の第3の実施形態において、当該方法は、平面波振幅のベクトルgplw−csについて、以下の凸計画問題を解決することによって、記録された音場の平面波解析を行うステップを含み得る。
【0064】
ここでの凸計画問題とは、
【数17】


の条件で、||gplw−cs||を最小にする問題である。
plw/micは、平面波とマイクロフォンとの間の伝達行列であり、
mic/HOAは、マイクロフォンとHOA領域フーリエ展開との間の伝達行列であり、
HOAは、bHOA=Tmic/HOAmicによって得られる1組のHOA領域フーリエ係数であり、
εは、負でない実数である。
【0065】
第5の態様の第4の実施形態において、当該方法は、平面波振幅のベクトルgplw−csについて、以下の凸計画問題を解決することによって、記録された音場の平面波解析を行うステップを含み得る。
【0066】
ここでの凸計画問題とは、
【数18】


及び
【数19】


の条件で、||gplw−cs||を最小にする問題である。
plw/micは、平面波とマイクロフォンとの間の伝達行列であり、
εは、負でない実数であり、
plw/HOAは、平面波とHOA領域フーリエ展開との間の伝達行列であり、
HOAは、Tmic/HOAがマイクロフォンとHOA領域フーリエ展開との間の伝達行列である場合、bHOA=Tmic/HOAmicによって得られる1組のHOA領域フーリエ係数であり、
εは、負でない実数である。
【0067】
当該方法は、1組の解析平面波に対応する1組の方向の空間分割の解に基づいてεを設定するステップと、音場の計算されたスパース性に基づいてεの値を設定するステップとを含み得る。さらに、当該方法は、逆FFTを使用してgplw−csを時間領域に変換し直して、gplw−cs(t)を取得するステップを含み得る。方法は、gplw−cs又はgplw−cs(t)の各エントリによりソース方向を識別するステップを含み得る。
【0068】
第6の態様において、当該方法は、時間領域技術を使用してスパース領域における記録されたデータを解析するステップと、記録された音場を再構築することができるように、選択された時間領域技術から生成されたパラメータを取得するステップとを含み得る。
【0069】
当該方法は、1組の基準平面波に従って平面波解析を使用して時間領域における記録された音場を解析して、1組の平面波信号gplw−cs(t)を生成するステップを含み得る。方法は、HOA領域における記録された音場を解析して、HOA領域の時間信号のベクトルbHOA(t)を取得するステップと、所与の時間フレームLにわたってHOA領域の時間信号のベクトルをサンプリングして、時刻t〜tにおいて時間サンプルの集まりを取得して、以下によって、行列BHOAとして表される各時刻における1組のHOA領域ベクトルbHOA(t),bHOA(t),・・・,bHOA(t)を取得するステップとを含み得る。
HOA=[bHOA(t),bHOA(t),・・・,bHOA(t)]
【0070】
当該方法は、相関ベクトルγをγ=BHOAomniの通り計算するステップを含み得る。式中、bomniは、bHOA(t)の全方向のHOA成分である。
【0071】
第6の態様の第1の実施形態において、当該方法は、平面波利得のベクトルβplw−csについて、以下の凸計画問題を解決するステップを含み得る。
【0072】
ここでの凸計画問題とは、
【数20】


の条件で、||βplw−cs||を最小にする問題である。
γ=BHOAomniであり、
plw/HOAは、平面波とHOA領域フーリエ展開との間の伝達行列であり、
εは、負でない実数である。
【0073】
第6の態様の第2の実施態様において、当該方法は、平面波利得のベクトルβplw−csについて、以下の凸計画問題を解決するステップを含み得る。
【0074】
ここでの凸計画問題とは、
【数21】


及び
【数22】


の条件で、||βplw−cs||を最小にする問題である。
γ=BHOAomniであり、
plw/HOAは、平面波とHOA領域フーリエ展開との間の伝達行列であり、
εは、負でない実数であり、
εは、負でない実数である。
【0075】
当該方法は、1組の解析平面波に対応する1組の方向の空間分割の解に基づいてεを設定するステップと、音場の計算されたスパース性に基づいてεの値を設定するステップとを含み得る。方法は、βplw−csを閾値処理し、クリーニングして、その小さい成分のいくつかをゼロに設定するステップを含み得る。
【0076】
当該方法は、平面波基準に従って行列
【数23】


を形成し、次いでβplw−csにおけるゼロ以外の成分に対応する列のみを保持することによって
【数24】



【数25】


に縮小するステップを含むことができ、式中、
【数26】


は平面波基準についてのHOA方向行列であり、
【数27】


におけるハット演算子は、その行列が何らかのHOA次数Mに切り捨てられたことを示す。
【0077】
当該方法は、gplw−cs−reduced(t)を
【数28】


により計算するステップを含み得る。さらに、gplw−cs(t)が平面波基準に一致するように、ゼロの時間信号の行を挿入することによって、gplw−cs−reduced(t)を拡大して、gplw−cs(t)を取得するステップを含み得る。
【0078】
第6の態様の第3の実施形態において、当該方法は、行列Gplwについて、以下の凸計画問題を解決するステップを含み得る。
【0079】
ここでの凸計画問題とは、||Yplwplw−BHOA||L2≦ε
の条件で、||Gplw||L1−L2を最小にする問題である。
plwは、列が何らかの組の解析平面波に対応する1組の方向についての球面調和関数の値である行列(高い球面調和次数に切り捨てられる)であり、
εは、負でない実数である。
【0080】
当該方法は、以下を計算することによって、L番目の時間フレームについて、非混合行列Πを取得するステップを含み得る。
【0081】
Π=(1−α)ΠL−1+αGplwpinv(BHOA
式中、ΠL−1は、L−1時間フレームについての非混合行列を指し、
αは、0≦α≦1となるような忘却因子である。
【0082】
第5の態様の第4の実施形態において、当該方法は、特異値分解をBHOAに適用して、行列分解
HOA=USV
を取得するステップを含み得る。
【0083】
当該方法は、mがBHOAの行の数である場合、Sの最初のm個の列のみを保持することによって行列Sreducedを形成し、
Ω=USreduced
によって得られる行列Ωを形成するステップを含み得る。
【0084】
当該方法は、行列Γについて、以下の凸計画問題を解決するステップを含み得る。
【0085】
ここでの凸計画問題とは、||YplwΓ−Ω||L2≦ε
の条件で、||Γ||L1−L2を最小にする問題である。
ε及びYplwは、上記に定義した通りである。
【0086】
当該方法は、以下を使用して、ΓからGplwを取得するステップを含み得る。
【0087】
plw=ΓV
式中、Vは、BHOAの行列分解から取得される。
【0088】
当該方法は、以下を計算することによって、L番目の時間フレームについて、非混合行列Πを取得するステップを含み得る。
【0089】
Π=(1−α)ΠL−1+αΓpinv(Ω)
式中、ΠL−1は、L−1時間フレームについての非混合行列であり、
αは、0≦α≦1となるような忘却因子である。
【0090】
当該方法は、以下を使用してGplw−smoothを取得するステップを含み得る。
plw−smooth=ΠHOA
【0091】
当該方法は、標準の重畳加算技術を使用して、平面波時間サンプルの集まりGplw−smoothから平面波信号のベクトルgplw−cs(t)を取得するステップを含み得る。代わりに、平面波信号のベクトルgplw−cs(t)を取得するとき、当該方法は、標準の重畳加算技術を使用して平滑化することなく、平面波時間サンプルの集まりGplwからgplw−cs(t)を取得するステップを含み得る。方法は、gplw−cs(t)の各エントリによりソース方向を識別するステップを含み得る。
【0092】
当該方法は、gplw−cs(t)を変更して、残響などの不要なアーチファクト及び/又は不要な音源を低減するステップを含み得る。さらに、当該方法は、残響を低減するために、信号ベクトルgplw−cs(t)における信号のうちのいくつかの信号値を低減するステップを含み得る。方法は、不要な音源が低減され得るように、音場の再構築において音源を分離するために、信号ベクトルgplw−cs(t)における信号のうちのいくつかをゼロに設定するステップを含み得る。
【0093】
さらに、当該方法は、再構築された音場の再生の手段に応じてgplw−cs(t)を変更するステップを含み得る。再構築された音場がスピーカを介して再生されることになっているとき、一実施形態において、当該方法はgplw−cs(t)を以下の通り変更するステップを含み得る。
【0094】
spk(t)=Pphw/spkplw−cs(t)
式中、Pphw/spkは、スピーカパニング行列(loudspeaker panning matrix)である。
【0095】
別の実施形態において、再構築された音場がスピーカを介して再生されることになっているとき、当該方法は、
【数29】


を計算することによって、gplw−cs(t)をHOA領域に変換し直すステップを含み得る。式中、bHOA−highres(t)は、任意のHOA領域次数に展開することができるgplw−cs(t)の高分解能のHOA領域表現であり、
【数30】


は、平面波基準のHOA方向行列であり、
【数31】


におけるハット演算子は、その行列が何らかのHOA次数Mに切り捨てられたことを示す。方法は、HOAデコード技術を使用して、bHOA−highres(t)をgspk(t)にデコードするステップを含み得る。
【0096】
再構築された音場がヘッドホンを介して再生されることになっているとき、当該方法は、gplw−cs(t)を以下の通り変更してヘッドホン利得を決定するステップを含み得る。
【数32】


この式中、Pplw/hph(t)は、1組の平面波方向に対応するフィルタの頭部インパルス応答行列である。
【0097】
第7の態様において、当該方法は、HOA領域において独立成分解析(ICA)の時間領域技術を使用して、スパース領域における記録されたデータを解析するステップと、記録された音場を再構築することができるように、選択された時間領域技術からパラメータを取得するステップとを含み得る。
【0098】
当該方法は、HOA領域における記録された音場を解析して、HOA領域の時間信号のベクトルbHOA(t)を取得するステップを含み得る。方法は、ICA信号処理を使用してHOA領域の時間信号を解析して、1組の平面波ソース信号gplw−ica(t)を生成するステップを含み得る。
【0099】
第7の態様の第1の実施形態において、当該方法は、信号処理技術を使用してbHOA(t)から混合行列MICAを計算するステップを含み得る。方法は、信号処理技術として瞬時の独立成分解析を使用するステップを含み得る。方法は、
【数33】


を計算することによって、1組の平面波基準方向と関連したHOA方向ベクトル上に混合行列MICAを投影するステップを含み得る。式中、
【数34】


は、平面波基準と関連した実数値(複素数値)のHOA方向行列の転置(エルミート共役)であり、
【数35】


におけるハット演算子は、その行列が何らかのHOA次数Mに切り捨てられたことを示す。
【0100】
当該方法は、閾値処理技術を使用して、優位なソース方向を示すVsourceの列を識別するステップを含み得る。これらの列は、単一の優位な成分を有することに基づいて識別され得る。
【0101】
当該方法は、行列Vsourceと関連した優位なソース方向に対応しない
【数36】


における平面波方向ベクトルを削除することによって、行列
【数37】


を縮小して、行列
【数38】


を取得するステップを含み得る。
【0102】
当該方法は、gplw−ica−reduced(t)を
【数39】


により推定するステップを含み得る。代わりに、当該方法は、周波数領域において動作して、smic(t)のFFTとしてsmicを計算することによってgplw−ica−reduced(t)を推定するステップを含み得る。
【0103】
当該方法は、行列Vsourceと関連した優位なソース方向に対応していないTplw/micにおける列を削除することによって、周波数ごとに、平面波とマイクロフォンとの間の伝達行列Tplw/micを縮小して、行列Tplw/mic−reducedを取得するステップを含み得る。
【0104】
当該方法は、gplw−ica−reduced=pinv(Tplw/mic−reduced)smicを計算することによってgplw−ica−reducedを推定し、逆FFTを使用してgplw−ica−reducedを時間領域に変換し直して、gplw−ica−reduced(t)を取得するステップを含み得る。方法は、gplw−ica(t)が平面波基準に一致するように、ゼロの時間信号の行を挿入することによって、gplw−cs−reduced(t)を拡大して、gplw−ica(t)を取得するステップを含み得る。
【0105】
第7の態様の第2の実施形態において、当該方法は、信号処理技術を使用してbHOA(t)から混合行列MICA、及び1組の分離されたソース信号gica(t)を計算するステップを含み得る。方法は、信号処理技術として瞬時の独立成分解析を使用するステップを含み得る。方法は、
【数40】


を計算することによって、1組の平面波基準方向と関連したHOA方向ベクトル上に混合行列MICAを投影するステップを含み得る。式中、
【数41】


は、平面波基準と関連した実数値(複素数値)のHOA方向行列の転置(エルミート共役)であり、
【数42】


におけるハット演算子は、その行列が何らかのHOA次数Mに切り捨てられたことを示す。
【0106】
当該方法は、閾値処理技術を使用して、Vsourceから優位な平面波方向を識別するステップを含み得る。さらに、当該方法は、gica(t)をクリーニングして、Vsourceにおける優位な平面波方向に対応する信号を保持し、他の信号をゼロに設定するgplw−ica(t)を取得するステップを含み得る。
【0107】
当該方法は、gplw−ica(t)を変更して、残響などの不要なアーチファクト及び/又は不要な音源を低減するステップを含み得る。方法は、残響を低減するために、信号ベクトルgplw−ica(t)における信号のうちのいくつかの信号値を低減するステップを含み得る。さらに、当該方法は、不要な音源が低減され得るように、音場の再構築において音源を分離するために、信号ベクトルgplw−ica(t)における信号のうちのいくつかをゼロに設定するステップを含み得る。
【0108】
さらにまた、当該方法は、再構築された音場の再生の手段に応じてgplw−ica(t)を変更するステップを含み得る。再構築された音場がスピーカを介して再生されることになっているとき、一実施形態において、当該方法は、gplw−ica(t)を以下の通り変更するステップを含み得る。
【0109】
spk(t)=Pphw/spkplw−ica(t)
式中、Pplw/spkは、スピーカパニング行列である。
【0110】
別の実施形態において、再構築された音場がスピーカを介して再生されることになっているとき、当該方法は、
【数43】


を計算することによって、gplw−ica(t)をHOA領域に変換し直すステップを含み得る。式中、bHOA−highres(t)は、任意のHOA領域次数に展開することができるgplw−ica(t)の高分解能のHOA領域表現であり、
【数44】


は、平面波基準のHOA方向行列であり、
【数45】


におけるハット演算子は、その行列が何らかのHOA次数Mに切り捨てられたことを示す。
【0111】
当該方法は、HOAデコード技術を使用して、bHOA−highres(t)をgspk(t)にデコードするステップを含み得る。
【0112】
再構築された音場がヘッドホンを介して再生されることになっているとき、当該方法は、gplw−cs(t)を変更して、ヘッドホン利得を以下の通り決定するステップを含み得る。
【数46】


式中、Pplw/hph(t)は、1組の平面波方向に対応するフィルタの頭部インパルス応答行列である。
【0113】
本開示は、上述したように方法を実行するようにプログラムされるとき、コンピュータに拡張する。
【0114】
また、本開示は、コンピュータが上述されたように方法を実行することができるようにコンピュータ可読媒体に拡張する。
【図面の簡単な説明】
【0115】
【図1】記録された音場を再構築し、また記録された音場のスパース性を推定するための機器の一実施形態のブロック図を示す図である。
【図2】図1の機器を使用して記録された音場のスパース性を推定することに関与するステップのフローチャートを示す図である。
【図3】図1の機器を使用して記録された音場のスパース性を推定することに関与するステップのフローチャートを示す図である。
【図4】図1の機器を使用して記録された音場のスパース性を推定することに関与するステップのフローチャートを示す図である。
【図5】図1の機器を使用して記録された音場のスパース性を推定することに関与するステップのフローチャートを示す図である。
【図6】図1の機器を使用して記録された音場を再構築する実施形態のフローチャートを示す図である。
【図7】図1の機器を使用して記録された音場を再構築する実施形態のフローチャートを示す図である。
【図8】図1の機器を使用して記録された音場を再構築する実施形態のフローチャートを示す図である。
【図9】図1の機器を使用して記録された音場を再構築する実施形態のフローチャートを示す図である。
【図10】図1の機器を使用して記録された音場を再構築する実施形態のフローチャートを示す図である。
【図11】図1の機器を使用して記録された音場を再構築する実施形態のフローチャートを示す図である。
【図12】図1の機器を使用して記録された音場を再構築する実施形態のフローチャートを示す図である。
【図13】図1の機器を使用して記録された音場を再構築する実施形態のフローチャートを示す図である。
【図14】図1の機器を使用して記録された音場を再構築する実施形態のフローチャートを示す図である。
【図15】図1の機器を使用して記録された音場を再構築する実施形態のフローチャートを示す図である。
【図16】図1の機器を使用して記録された音場を再構築する実施形態のフローチャートを示す図である。
【図17】図1の機器を使用して記録された音場を再構築する実施形態のフローチャートを示す図である。
【図18】図1の機器を使用して記録された音場を再構築する実施形態のフローチャートを示す図である。
【図19】図1の機器を使用して記録された音場を再構築する実施形態のフローチャートを示す図である。
【図20】図1の機器を使用して記録された音場を再構築する実施形態のフローチャートを示す図である。
【図21】図1の機器を使用して記録された音場を再構築する実施形態のフローチャートを示す図である。
【図22】図1の機器を使用して記録された音場を再構築する実施形態のフローチャートを示す図である。
【図23】図1の機器を使用して記録された音場を再構築する実施形態のフローチャートを示す図である。
【図24A】記録された音場を再構築するためのHOAの解の写真表現の第1の例をそれぞれ示す図である。
【図24B】記録された音場を再構築するための最初の音場の写真表現の第1の例をそれぞれ示す図である。
【図24C】記録された音場を再構築するための本開示によって提供される解の写真表現の第1の例をそれぞれ示す図である。
【図25A】記録された音場を再構築するためのHOAの解の写真表現の第2の例をそれぞれ示す図である。
【図25B】記録された音場を再構築するための最初の音場の写真表現の第2の例をそれぞれ示す図である。
【図25C】記録された音場を再構築するための本開示によって提供される解の写真表現の第2の例をそれぞれ示す図である。
【発明を実施するための形態】
【0116】
図面の図1において、参照番号10は、記録された音場を再構築し、及び/又は音場のスパース性を推定するための機器の一実施形態を全般的に示す。機器10は、音場を測定して記録されたデータを取得するための検知装置12を含む。検知装置12は、例えばマイクロプロセッサなどの信号処理モジュール14に接続されており、信号処理モジュール14は、記録されたデータを処理して、平面波信号を取得して、記録された音場を再構成できるようにし、及び/又は記録されたデータを処理して、音場のスパース性を取得する。音場のスパース性、分離された平面波ソース、及びその関連のソース方向は、出力ポート24を介して提供される。簡潔にするために、信号処理モジュール14は、以下、SPM14と呼ばれる。
【0117】
データアクセスモジュール16は、SPM14に接続される。一実施形態において、データアクセスモジュール16は、データが格納されるメモリモジュールである。SPM14は、必要に応じて、メモリモジュールにアクセスして、メモリモジュールから必要なデータを取り出す。他の実施形態では、データアクセスモジュール16は、SPM14が遠隔地からデータを取り出すことができるようにするための、例えばモデムなどの接続モジュールである。
【0118】
機器10は、再構築された音場を再生するための再生モジュール18を含む。再生モジュール18は、スピーカアレイ20及び/又は1つ又は複数のヘッドホン22を備える。
【0119】
検知装置12は、音場を記録して、1組の信号smic(t)の形で記録されたデータを生成するためのバフル付き球状マイクロフォンアレイである。
【0120】
SPM14は、平面波解析を使用して音場に関係する記録されたデータを解析して、平面波信号のベクトルgplw(t)を生成する。平面波信号のベクトルgplw(t)を生成することは、関連の1組の平面波ソース方向を取得することとしても理解されたい。平面波振幅のベクトルを生成するために使用される特定の方法に応じて、gplw(t)は、より詳細には、圧縮検知技術が使用される場合、gplw−cs(t)と呼ばれ、又はICA技術が使用される場合、gplw−ica(t)と呼ばれる。以下でさらに詳しく説明されるように、SPM14は、必要に応じてgplw(t)を変更するためにも使用される。
【0121】
SPM14は、一旦その解析を実行すると、音場のスパース性、分離された平面波ソース信号、及び平面波ソース信号の関連のソース方向を含み得る出力ポート24の出力データを生成する。さらに、SPM14は、一旦その解析を実行すると、信号sout(t)を生成して、スピーカアレイ20及び/又は1つ又は複数のヘッドホン22を介して再生される音声として決定されたgplw(t)をレンダリングする。
【0122】
信号がマイクロフォンアレイ12によって記録された後、SPM14は、1組の信号smic(t)に一連の操作を実行して、信号を、記録された音場に著しく近似する音場に再構築できるようにする。
【0123】
信号処理操作を簡潔に説明するために、マイクロフォンアレイ12を特徴付ける1組の行列が定義される。これらの行列は、SPM14によって必要に応じて計算されるようにしてもよく、又はデータアクセスモジュール16を使用してデータストレージから必要に応じて取り出されるようにしてもよい。これらの行列のうちの1つは、言及されるとき、「定義済み行列のうちの1つ」として表される。
【0124】
以下は、必要に応じて計算され得る又は取り出され得る定義済み行列のリストである。
【数47】


は、球面調和領域とマイクロフォン信号との間の伝達行列であり、行列
【数48】


は、以下の通り次数Mに切り捨てられる。
【数49】


式中、
【数50】


は、列が球面調和関数
【数51】


の値である行列の転置であり、式中、(r,θ,φ)はl番目のマイクロフォンについての極座標であり、
【数52】


におけるハット演算子は、その行列が何らかの次数Mに切り捨てられたことを示し、
【数53】


は、係数が
【数54】


によって定義される対角行列であり、式中、Rは、マイクロフォンアレイの球体の半径であり、h(2)は、第2の種類の次数mの球ハンケル関数であり、jは、次数mの球ベッセル関数であり、j’’及びh’(2)はそれぞれj及びh(2)の派生物である。この場合もまた、
【数55】


におけるハット演算子は、その行列が何らかの次数Mに切り捨てられたことを示す。
【0125】
sph/micは、かなり高い次数M’’(M’’>M)に切り捨てられたことを除いて、
【数56】


と類似する。
【0126】
plwは、列が何らかの組の解析平面波に対応する1組の方向についての球面調和関数の値である行列(高い次数M’’に切り捨てられる)である。
【数57】


は、低次のM(M<M’’)に切り捨てられたことを除いて、Yplwと類似する。
【0127】
plw/HOAは、以下の通り、解析平面波と(マイクロフォンアレイ12から導出された)HOA推定球面調和の展開との間の伝達行列である。
【数58】

【0128】
plw/micは、以下の通り、解析平面波とマイクロフォンアレイ12との間の伝達行列である。
plw/mic=Tsph/micplw
式中、Tsph/micは、上記で定義された通りである。
【0129】
mic/HOA(t)は、畳込み演算を介して、マイクロフォンアレイ12の時間信号とHOA領域の時間信号との間にその変形を実施するフィルタの行列であり、以下の通り定義される。
【0130】
mic/HOA(t)=IFFT(Emic/HOA(ω))
式中、Emic/HOA(ω)の各周波数成分は、
【数59】


によって得られる。
【0131】
次に、図面の図2〜図16に示されるフローチャートを参照して、信号の組smic(t)に実行される操作について説明される。図2に示されるフローチャートは、記録された音場のスパース性(S)を推定するための操作のフローの概要を示す。このフローチャートは、図3〜図5における高レベルの詳細に分けられる。図6に示されるフローチャートは、記録された音場を再構築するための操作のフローの概要を示す。図6のフローチャートは、図7〜図16における高レベルの詳細に分けられる。
【0132】
次に、図2〜図5のフローチャートを参照して、音場のスパース性Sを決定するために、SPM14によって信号の組smic(t)に対して実行される操作について説明される。図2において、ステップ1で、1組の信号smic(t)を記録するために、マイクロフォンアレイ12が使用される。ステップ2で、SPM14は、音場のスパース性を推定する。
【0133】
図3に示されるフローチャートは、ステップ2の計算の詳細について説明する。ステップ2.1で、SPM14は、HOA領域の時間信号のベクトルbHOA(t)を以下の通り計算する。
【数60】


ステップ2.2で、ステップ2.2.A及びステップ2.2.Bの利用可能な2つの異なるオプションがある。ステップ2.2.Aで、SPM14は、HOA領域においてICAを適用することによって、音場のスパース性を推定する。代わりに、ステップ2.2.Bで、SPM14は、圧縮サンプリング技術を使用して音場のスパース性を推定する。
【0134】
図4のフローチャートは、ステップ2.2.Aの詳細について説明する。ステップ2.2.A.1で、SPM14は、独立成分解析技術を使用して、混合行列MICAを決定する。
【0135】
ステップ2.2.A.2で、SPM14は、1組の平面波基準方向と関連したHOA方向ベクトル上に混合行列MICAを投影する。この投影は、
【数61】


を計算することによって取得され、式中、
【数62】


は、定義済み行列
【数63】


の転置である。
【0136】
ステップ2.2.A.3で、SPM14は、Vsource−cleanを取得するために、閾値処理技術を適用して、Vsourceをクリーニングする。Vsourceのクリーニングの操作は、以下の通りに行われる。まず、Vsourceの理想的なフォーマットが定義される。Vsourceは、理想的には、すべての成分をゼロとして有する、又は特定の平面波方向に対応する単一の優位な成分を含み、列の残りの成分がゼロである、列から成る行列である。閾値処理技術は、Vsourceがその理想的なフォーマットになることを確実にするために適用される。すなわち、優位な成分未満のすべての成分がゼロに設定されるように、列の残りの成分と比較して優位な値を含むVsourceの列は閾値処置される。また、優位な成分を有していないVsourceの列では、その成分のすべてがゼロに設定される。上記の閾値処理操作をVsourceに適用することによって、Vsource−cleanが得られる。
【0137】
ステップ2.2.A.4で、SPM14は、音場のスパース性を計算する。SPM14は、Vsource−cleanの優位な平面波方向の数Nsourceを計算することによって、このステップを行う。次いでSPM14は、音場のスパース性Sを
【数64】


の通り計算する。式中、Nplwは、解析平面波基準方向の数である。
【0138】
図5のフローチャートは、図3におけるステップ2.2.Bの詳細について説明し、ステップ2.2.Bは、ステップ2.2.Aの代替である。ステップ2.2.B.1で、SPM14は、時間が行列BHOAの行に沿って並び、様々なHOA次数が行列BHOAの列に沿って並ぶように、bHOA(t)における各信号をBHOAの行に沿って並ぶように設定することによって、HOA信号のベクトルbHOA(t)から、行列BHOAを計算する。より詳細には、SPM14は、Lによってラベル表示される所与の時間フレームにわたってbHOA(t)をサンプリングして、時刻t〜tにおいて時間サンプルの集まりを取得する。したがって、SPM14は、各時刻で1組のHOA領域ベクトルbHOA(t),bHOA(t),・・・,bHOA(t)を取得する。次いでSPM14は、以下によって行列BHOAを形成する。
HOA=[bHOA(t),bHOA(t),・・・,bHOA(t)]
【0139】
ステップ2.2.B.2で、SPM14は、相関ベクトルγを
γ=BHOAomni
の通り計算する。式中、bomniは、列ベクトルとして表されるbHOA(t)の全方向のHOA成分である。
【0140】
ステップ2.2.B.3で、SPM14は、平面波利得のベクトルβplw−csを取得するために、以下の凸計画問題を解決する。
【0141】
ここでの凸計画問題とは、
【数65】


の条件で、||βplw−cs||を最小にする問題である。
plw/HOAは定義済み行列のうちの1つであり、εは負でない実数である。
【0142】
ステップ2.2.B.4で、SPM14は、音場のスパース性を推定する。SPM14は、その優位な成分の数Ncompを推定するために、閾値処理技術をβplw−csに適用することによって、このステップを行う。次いで、SPM14は、音場のスパース性Sを
【数66】


の通り計算し、式中、Nplwは、解析平面波基準方向の数である。
【0143】
次に、音場を再構築するために、SPM14によって信号の組smic(t)に実行される操作が説明され、図6〜図23のフローチャートを使用して示される。
【0144】
図6において、ステップ1及びステップ2は、上述された図2のフローチャートと同じである。しかし、図6の操作フローで、ステップ2は、オプションであり、したがって、点線ボックスによって表される。
【0145】
ステップ3で、SPM14は、音場を再構築することができるように、平面波信号gplw(t)の形でパラメータを推定する。平面波信号gplw(t)は、導出の方法に応じて、gplw−cs(t)又はgplw−ica(t)のいずれかとして表される。ステップ4で、残響を低減し、及び/又は不要な音を分離するために、推定されたパラメータがSPM14によって変更されるオプションのステップ(点線ボックスによって表される)がある。ステップ5で、SPM14は、音場を再構築し、再生するために使用される(場合によっては変更された)平面波信号gplw−cs(t)又はgplw−ica(t)を推定する。
【0146】
ステップ1及びステップ2の操作は上述されており、次にステップ3に含まれる操作のフローについて説明される。
【0147】
図7のフローチャートは、図6に示されるフローチャートのステップ3に必要とされる操作の概要を示す。図7のフローチャートは、ステップ3.A、ステップ3.B、ステップ3.C、及びステップ3.Dの4つの利用可能な異なるパスがあることを示す。
【0148】
ステップ3.Aで、SPM14は、時間領域において圧縮サンプリング技術を使用して平面波信号を推定する。ステップ3.Bで、SPM14は、周波数領域において圧縮サンプリング技術を使用して平面波信号を推定する。ステップ3.Cで、SPM14は、HOA領域においてICAを使用して平面波信号を推定する。ステップ3.Dで、SPM14は、多重測定ベクトル技術を使用して時間領域において圧縮サンプリングを使用して平面波信号を推定する。
【0149】
図8に示されるフローチャートは、ステップ3.Aの詳細について説明する。ステップ3.A.1で、bHOA(t)及びBHOAは、それぞれステップ2.1及びステップ2.2.B.1について上述されたようにSPM14によって決定される。
【0150】
ステップ3.A.2で、相関ベクトルγは、ステップ2.2.B.2について上述されたようにSPM14によって決定される。
【0151】
ステップ3.A.3で、ステップ3.A.3.A及びステップ3.A.3.Bの2つのオプションがある。ステップ3.A.3.Aで、SPM14は、平面波方向利得βplw−csを決定するために、凸計画問題を解決する。この凸計画問題は、スパース制約を含まない。より詳細には、以下の凸計画問題が解決される。
【0152】
ここでの凸計画問題とは、
【数67】


の条件で、||βplw−cs||を最小にする問題である。
γは上記で定義された通りであり、Tplw/HOAは定義済み行列のうちの1つであり、
εは、負でない実数である。
【0153】
ステップ3.A.3.Bで、SPM14は、平面波方向利得βplw−csを決定するために、凸計画問題を解決し、今回のみ、スパース制約は、凸計画問題に含まれる。より詳細には、以下の凸計画問題は、βplw−csを決定するために解決される。
【0154】
ここでの凸計画問題とは、
【数68】


及び
【数69】


の条件で、||βplw−cs||を最小にする問題である。
γ、εは上記で定義された通りであり、
plw/HOAは、定義済み行列のうちの1つであり、
εは、負でない実数である。
【0155】
ステップ3.A.3での凸計画問題について、εは、解析平面波の組に対応する1組の方向の空間分割の解に基づいて、SPM14によって設定され得る。さらに、εの値は、音場の計算されたスパース性に基づいて、SPM14によって設定され得る(オプションのステップ2)。
【0156】
ステップ3.A.4で、SPM14は、その小さい成分のうちのいくつかがゼロに設定されるように、閾値処理技術を適用して、βplw−csをクリーニングする。
【0157】
ステップ3.A.5で、SPM14は、平面波基準に従って行列
【数70】


を形成し、次いでβplw−csにおけるゼロ以外の成分に対応する列のみを保持することによって、
【数71】



【数72】


に縮小する。式中、
【数73】


は平面波基準のHOA方向行列であり、
【数74】


におけるハット演算子は、その行列が何らかのHOA次数Mに切り捨てられたことを示す。
【0158】
ステップ3.A.6で、SPM14は、gplw−cs−reduced(t)を以下の通り計算する。
【0159】
plw−cs−reduced(t)=pinv(Tplw/HOA−reduced)bHOA(t)
式中、
【数75】


及びbHOA(t)は、上記で定義した通りである。
【0160】
ステップ3.A.7で、SPM14は、解析のために使用された平面波基準と一致させるためにゼロの時間信号の行を挿入することによって、gplw−cs−reduced(t)を拡大してgplw−cs(t)を取得する。
【0161】
上述したように、ステップ3.Aの代替は、ステップ3.Bである。図9のフローチャートは、ステップ3.Bを詳述する。ステップ3.B.1で、SPM14は、bHOA(t)を
【数76】


により計算する。さらに、ステップ3.B.1で、SPM14は、smic(t)のFFT、smic、及び/又はbHOA(t)のFFT、bHOAを計算する。
【0162】
ステップ3.B.2で、SPM14は、4つのオプションの凸計画問題のうちの1つを解決する。ステップ3.B.2.Aに示される凸計画問題は、smicに対して演算を行い、スパース制約を使用しない。より正確には、SPM14は、gplw−csを決定するために、以下の凸計画問題を解決する。
【0163】
ここでの凸計画問題とは、
【数77】


の条件で、||gplw−cs||を最小にする問題である。
plw/micは、定義済み行列のうちの1つであり、
micは、上記で定義された通りであり、
εは、負でない実数である。
【0164】
ステップ3.B.2.Bに示される凸計画問題は、smicに対して演算を行い、スパース制約を含む。より正確には、SPM14は、gplw−csを決定するために、以下の凸計画問題を解決する。
【0165】
ここでの凸計画問題とは、
【数78】


及び
【数79】


の条件で、||gplw−cs||を最小にする問題である。
plw/mic、Tplw/HOAはそれぞれ、定義済み行列のうちの1つであり、
mic、bHOA、εは、上記で定義された通りであり、
εは、負でない実数である。
【0166】
ステップ3.B.2.Cに示される凸計画問題は、bHOAに対して演算を行い、スパース制約を使用しない。より正確には、SPM14は、gplw−csを決定するために、以下の凸計画問題を解決する。
【0167】
ここでの凸計画問題とは、
【数80】


の条件で、||gplw−cs||を最小にする問題である。
plw/mic、Tplw/HOAはそれぞれ、定義済み行列のうちの1つであり、
HOA、及びεは、上記で定義された通りである。
【0168】
ステップ3.B.2.Dに示される凸計画問題は、bHOAに対して演算を行い、スパース制約を含む。より正確には、SPM14は、gplw−csを決定するために、以下の凸計画問題を解決する。
【0169】
ここでの凸計画問題とは、
【数81】


及び
【数82】


の条件で、||gplw−cs||を最小にする問題である。
plw/mic、Tplw/HOA、Tmic/HOAはそれぞれ、定義済み行列のうちの1つであり、
HOA、ε、及びεは、上記で定義された通りである。
【0170】
ステップ3.B.3で、SPM14は、gplw−cs(t)を取得するために、gplw−csの逆FFTを計算する。複数の時間フレームに対して演算を行うとき、重畳加算手順に従う。
【0171】
ステップ3.A又はステップ3.Bに対するさらなるオプションは、ステップ3.Cである。図10のフローチャートは、ステップ3.Cの概要を提供する。ステップ3.C.1で、SPM14は、bHOA(t)を
【数83】


により計算する。
【0172】
ステップ3.C.2で、ステップ3.C.2.A及びステップ3.C.2.Bの2つのオプションがある。ステップ3.C.2.Aで、SPM14は、HOA領域においてICAを使用して、混合行列を推定し、混合行列は、次いでgplw−ica(t)を取得するために使用される。代わりに、ステップ3.C.2.Bで、SPM14は、HOA領域においてICAを使用して、混合行列、及び1組の分離されたソース信号も推定する。次いで、混合行列及び分離されたソース信号は、gplw−ica(t)を取得するために、SPM14によって使用される。
【0173】
図11のフローチャートは、ステップ3.C.2.Aの詳細について説明する。ステップ3.C.2.A.1で、SPM14は、混合行列MICAを取得するために、ICAを信号のベクトルbHOA(t)に適用する。
【0174】
ステップ3.C.2.A.2で、SPM14は、ステップ2.2.A.2に記載されているように、1組の平面波基準方向と関連したHOA方向ベクトル上に混合行列MICAを投影する。すなわち、投影は、
【数84】


を計算することによって取得され、式中、
【数85】


は、定義済み行列
【数86】


の転置である。
【0175】
ステップ3.C.2.A.3で、SPM14は、Vsourceにおける優位な平面波方向を識別するために、閾値処理技術をVsourceに適用する。ステップ3.C.2.A.3は、ステップ2.2.A.3を参照して上述した操作と同様に達成される。
【0176】
ステップ3.C.2.A.4で、ステップ3.C.2.A.4.A及びステップ3.C.2.A.4.Bの2つのオプションがある。ステップ3.C.2.A.4.Aで、SPM14は、HOA領域行列
【数87】


を使用して、gplw−ica−reduced(t)を計算する。代わりに、ステップ3.C.2.A.4.Bで、SPM14は、マイクロフォン信号smic(t)及び行列Tplw/micを使用して、gplw−ica−reduced(t)を計算する。
【0177】
図12のフローチャートは、ステップ3.C.2.A.4.Aの詳細について説明する。ステップ3.C.2.A.4.A.1で、SPM14は、行列Vsourceと関連した優位なソース方向に対応しない
【数88】


における平面波方向ベクトルを削除することによって、行列
【数89】


を縮小して、行列
【数90】


を取得する。
【0178】
ステップ3.C.2.A.4.A.2で、SPM14は、gplw−ica−reduced(t)を
【数91】


により計算する。式中、
【数92】


及びbHOA(t)は、上記で定義した通りである。
【0179】
ステップ3.C.2.A.4.Aの代替は、ステップ3.C.2.A.4.Bである。図13のフローチャートは、ステップ3.C.2.A.4.Bを詳述する。
【0180】
ステップ3.C.2.A.4.B.1で、SPM14は、smic(t)のFFT、smicを計算する。ステップ3.C.2.A.4.B.2で、SPM14は、行列Vsourceと関連した優位なソース方向に対応しないTplw/micにおける平面波方向ベクトルを削除することによって、行列Tplw/micを縮小して、行列Tplw/mic−reducedを取得する。
【0181】
ステップ3.C.2.A.4.B.3で、SPM14は、gplw−ica−reduced
plw−ica−reduced=pinv(Tplw/mic−reduced)smic
の通り計算し、式中、Tplw/mic−reduced及びsmicは、上記で定義された通りである。
【0182】
ステップ3.C.2.A.4.B.4で、SPM14は、gplw−ica−reducedのIFFTとして、gplw−ica−reduced(t)を計算する。
【0183】
図11に戻って、ステップ3.C.2.A.5で、SPM14は、解析のために使用された平面波基準と一致させるためにゼロの時間信号の行を挿入することによって、gplw−ica−reduced(t)を拡大してgplw−ica(t)を取得する。
【0184】
ステップ3.C.2.Aの代替は、ステップ3.C.2.Bである。図14のフローチャートは、ステップ3.C.2.Bの詳細について説明する。
【0185】
ステップ3.C.2.B.1で、SPM14は、混合行列MICA、及び1組の分離されたソース信号gica(t)を取得するために、ICAを信号bHOA(t)のベクトルに適用する。
【0186】
ステップ3.C.2.B.2で、SPM14は、ステップ2.2.A.2に記載されているように、1組の平面波基準方向と関連したHOA方向ベクトル上に混合行列MICAを投影し、すなわち、投影は、
【数93】


を計算することによって取得され、式中、
【数94】


は、定義済み行列
【数95】


の転置である。
【0187】
ステップ3.C.2.B.3で、SPM14は、Vsourceにおける優位な平面波方向を識別するために、閾値処理技術をVsourceに適用する。ステップ3.C.2.B.3は、ステップ2.2.A.3のために上述した操作と同様に達成される。一旦Vsourceにおける優位な平面波方向が識別されると、SPM14は、gica(t)をクリーニングして、優位な平面波方向Vsourceに対応する信号を保持し、他の信号をゼロに設定するgplw−ica(t)を取得する。
【0188】
上述したように、ステップ3.A、3.B、及び3.Cに対するさらなるオプションは、ステップ3.Dである。図15のフローチャートは、ステップ3.Dの概要を示す。
【0189】
ステップ3.D.1で、SPM14は、bHOA(t)をbHOA
【数96】


の通り計算する。次いでSPM14は、時間が行列BHOAの行に沿って並び、様々なHOA次数が行列BHOAの列に沿って並ぶように、bHOA(t)における各信号をBHOAの行に沿って並ぶように設定することによって、HOA信号のベクトルbHOA(t)から、行列BHOAを計算する。より詳細には、SPM14は、所与の時間フレームLにわたってbHOA(t)をサンプリングして、時刻t〜tにおいて時間サンプルの集まりを取得する。したがって、SPM14は、各時刻で1組のHOA領域ベクトルbHOA(t),bHOA(t),・・・,bHOA(t)を取得する。SPM14は、以下によって行列BHOAを形成する。
HOA=[bHOA(t),bHOA(t),・・・,bHOA(t)]
【0190】
ステップ3.D.2で、ステップ3.D.2.A及びステップ3.D.2.Bの2つのオプションがある。ステップ3.D.2.Aで、SPM14は、BHOAに直接適用される多重測定ベクトル技術を使用して、gplw−csを計算する。代わりに、ステップ3.D.2.Bで、SPM14は、BHOAの特異値分解に基づいて多重測定ベクトル技術を使用してgplw−csを計算する。
【0191】
図16のフローチャートは、ステップ3.D.2.Aの詳細について説明する。ステップ3.D.2.A.1で、SPM14は、Gplwを決定するために、以下の凸計画問題を解決する。
【0192】
ここでの凸計画問題とは、||Yplwplw−BHOA||L2≦ε
の条件で、||Gplw||L1−L2を最小にする問題である。
plwは、定義済み行列のうちの1つであり、
HOAは、上記で定義した通りであり、
εは、負でない実数である。
【0193】
ステップ3.D.2.A.2で、2つのオプション、すなわちステップ3.D.2.A.2.A及びステップ3.D.2.A.2.Bがある。ステップ3.D.2.A.2.Aで、SPM14は、重畳加算技術を使用して、Gplwから直接gplw−cs(t)を計算する。代わりに、ステップ3.D.2.A.2.Bで、SPM14は、Gplwの平滑化バージョン及び重畳加算技術を使用してgplw−cs(t)を計算する。
【0194】
図17のフローチャートは、ステップ3.D.2.A.2.Bについてより詳細に説明する。
【0195】
ステップ3.D.2.A.2.B.1で、SPM14は、以下を計算することによって、L番目の時間フレームについて、非混合行列Πを計算する。
【0196】
Π=(1−α)ΠL−1+αGplwpinv(BHOA
式中、ΠL−1は、L−1時間フレームについての非混合行列を指し、αは、0≦α≦1となるような忘却因子であり、BHOAは、上記で定義された通りである。
【0197】
ステップ3.D.2.A.2.B.2で、SPM14は、Gplw−smoothを以下の通り計算する。
【0198】
plw−smooth=ΠHOA
式中、Π及びBHOAは、上記で定義された通りである。
【0199】
ステップ3.D.2.A.2.B.3で、SPM14は、重畳加算技術を使用してGplw−smoothからgplw−cs(t)を計算する。
【0200】
ステップ3.D.2.Aの代替は、ステップ3.D.2.Bである。図18のフローチャートは、ステップ3.D.2.Bの詳細について説明する。
【0201】
ステップ3.D.2.B.1で、SPM14は、BHOAの特異値分解を計算して、行列分解を取得する。
HOA=USV
【0202】
ステップ3.D.2.B.2で、SPM14は、mがBHOAの行の数である場合、Sの最初のm個の列のみを保持することによって行列Sreducedを計算する。
【0203】
ステップ3.D.2.B.3で、SPM14は、行列Ωを以下の通り計算する。
Ω=USreduced
【0204】
ステップ3.D.2.B.4で、SPM14は、行列Γについて、以下の凸計画問題を解決する。
【0205】
ここでの凸計画問題とは、||YplwΓ−Ω||L2≦ε
の条件で、||Γ||L1−L2を最小にする問題である。
plwは、定義済み行列のうちの1つであり、
Ωは、上記で定義された通りであり、
εは、負でない実数である。
【0206】
ステップ3.D.2.B.5で、ステップ3.D.2.B.5.A及びステップ3.D.2.B.5.Bの2つのオプションがある。ステップ3.D.2.B.5.Aで、SPM14は、以下を使用して、ΓからGplwを計算する。
【0207】
plw=ΓV
式中、Vは、上述したように、BHOAの行列分解から取得される。次いでSPM14は、重畳加算技術を使用して、Gplwから直接gplw−cs(t)を計算する。
【0208】
代わりに、ステップ3.D.2.B.5.Bで、SPM14は、Gplwの平滑化バージョン及び重畳加算技術を使用してgplw−cs(t)を計算する。
【0209】
図19のフローチャートは、ステップ3.D.2.B.5.Bの詳細を示す。
【0210】
ステップ3.D.2.B.5.B.1で、SPM14は、以下を計算することによって、L番目の時間フレームについて、非混合行列Πを計算する。
【0211】
Π=(1−α)ΠL−1+αΓpinv(Ω)
式中、ΠL−1は、L−1時間フレームについての非混合行列を指し、αは、0≦α≦1となるような忘却因子であり、Γ及びΩは、上記で定義された通りである。
【0212】
ステップ3.D.2.B.5.B.2で、SPM14は、Gplw−smoothを以下の通り計算する。
【0213】
plw−smooth=ΠHOA
式中、Π及びBHOAは、上記で定義した通りである。
【0214】
ステップ3.D.2.B.2.B.3で、SPM14は、重畳加算技術を使用してGplw−smoothからgplw−cs(t)を計算する。
【0215】
上述したように、不要なアーチファクトを低減するオプションのステップは、図6のフローチャートのステップ4に示される。SPM14は、信号ベクトルgplw(t)における信号のうちのいくつかの信号値を低減することによって、音場再構築に存在する残響の量を制御する。代わりに、又はさらに、SPM14は、信号ベクトルgplw(t)における信号のうちのいくつかをゼロに設定することによって、音場再構築で望ましくない音源を削除する。
【0216】
図6のフローチャートのステップ5において、パラメータgplw(t)は、音場を再生するために使用される。図20のフローチャートは、音場の再生のための3つのオプションのパス、ステップ5.A、ステップ5.B、及びステップ5.Cを示す。図21のフローチャートは、ステップ5.Aの詳細について説明する。
【0217】
ステップ5.A.1で、SPM14は、スピーカアレイ20を介して再構築された音場のスピーカの再生を可能にするために、スピーカパニング行列Pplw/spkを計算する、又はデータストレージから取り出す。パニング行列Pplw/spkは、例えばベクトルベースの振幅パニング(VBAP)など、様々なパニング技術のいずれかを使用して導出され得る。ステップ5.A.2で、SPM14は、スピーカ信号gspk(t)をgspk(t)=Pplw/spkplw(t)の通り計算する。
【0218】
ステップ5.Bの詳細について説明する図22のフローチャートに別のオプションが示される。
【0219】
ステップ5.B.1で、SPM14は、スピーカアレイ20を介して再構築された音場のスピーカ再生を可能にするために、bHOA−highres(t)を計算する。bHOA−highres(t)は、任意のHOA領域次数に展開することができるgplw(t)の高分解能のHOA領域表現である。SPM14は、bHOA−highres(t)を以下の通り計算する。
【数97】


式中、
【数98】


は、定義済み行列のうちの1つであり、
【数99】


におけるハット演算子は、その行列が何らかのHOA次数Mに切り捨てられたことを示す。
【0220】
ステップ5.B.2で、SPM14は、HOAデコード技術を使用して、bHOA−highres(t)をgspk(t)にデコードする。
【0221】
スピーカの再生の代替は、ヘッドホンの再生である。ヘッドホンの再生の操作は、図20のフローチャートのステップ5.Cに示される。図23のフローチャートは、ステップ5.Cの詳細について説明する。
【0222】
ステップ5.C.1で、SPM14は、ヘッドホン22のうちの1つ又は複数を介して再構築された音場のヘッドホンの再生を可能にするために、解析平面波方向の組に対応するフィルタの頭部インパルス応答行列Pplw/hph(t)を計算する、又はデータストレージから取り出す。フィルタの頭部インパルス応答(HRIR)行列Pplw/hph(t)は、HRTF測定から導出される。
【0223】
ステップ5.C.2で、SPM14は、フィルタ畳込み演算を使用して、ヘッドホン信号ghph(t)を
【数100】


により計算する。
【0224】
スピーカのための基本的なHOAデコーディングが以下によって(周波数領域において)得られることを当業者であれば理解されよう。
【数101】


式中、Nspkは、スピーカの数であり、
【数102】


は、列が球面調和関数
【数103】


の値である行列の転置であり、式中、(r,θ,φ)はk番目のスピーカについての極座標であり、
【数104】


におけるハット演算子は、その行列が何らかの次数Mに切り捨てられたことを示し、
HOAは、HOA領域において表される再生信号である。
【0225】
3次元の基本的なHOAデコーディングは、様々な及び任意のスピーカ構成を使用して音場を容易に再構築する能力を含むいくつかの利点を有する球面調和ベースの方法である。しかし、球面調和ベースの方法は、符号化及び復号プロセスに関連した制限も被ることを当業者であれば理解されよう。第1に、音場を観察するために有限数のセンサが使用されるので、符号化は、高周波で空間エイリアシングを被る(N.Epain及びJ.Daniel「球状マイクロフォンアレイの改良(Improving spherical microphone arrays)」Proceedings of the AES 124th Convention、2008年5月参照)。第2に、再生に使用されるスピーカの数が音場の説明において使用される球面調和成分の数より多いとき、一般に、構築された音場の忠実度の低下に気づく(A.Solvang「2次元高次アンビソニックのスペクトル障害(Spectral impairment of two dimensional higher−order ambisonics)」音響学会誌、第56巻、2008年4月、pp.267〜279参照)。
【0226】
いずれの場合でも、制限は、過小決定された課題が疑似逆行列方法を使用して解決されることに関連する。本開示の場合、これらの制限は、いくつかの例において、圧縮サンプリング又はICAの一般的な原理を使用して回避される。圧縮サンプリングに関して、出願人は、平面波基準を音場のスパース領域として使用し、次いで上記で定義されたいくつかの凸計画問題のうちの1つを解析することが記録された音場の驚くほど正確な再構築につながることを見出した。平面波の説明は、定義済みの行列Tplw/micに含まれる。
【0227】
標準HOAの解と圧縮サンプリングの解との間の距離は、例えば、制約
【数105】


を使用して制御され得る。εがゼロであるとき、圧縮サンプリングの解は、標準HOAの解と同じである。SPM14は、音場の計算されたスパース性に従って、εの値を動的に設定することができる。
【0228】
HOA領域においてICAを適用することに関して、出願人は、HOA領域が記録された信号の瞬間的な混合を提供することから、統計的独立の適用は、かなりの利点になることを見出した。さらに、統計的独立の適用は、スパース性を解に課すように見えるという点で、圧縮サンプリングと類似しているようである。
【0229】
上述したように、圧縮サンプリングの技術又はHOA領域でのICAの技術を使用して音場のスパース性を推定することが可能である。
【0230】
図24A〜図24C及び図25A〜図25Cに、本開示を使用して音場再構築の電力を示すシミュレーション結果が示されている。シミュレーションにおいて、マイクロフォンアレイ12は、球体の表面上に均一に分散される32の全指向性マイクロフォンを有する4cm半径の剛性の球体である。音場は、1mの半径を有する48個のスピーカのリングを使用して再構築される。
【0231】
HOAの場合、マイクロフォン利得は、最高次数4までHOA符号化される。スパース制約を含む周波数領域技術を使用し、水平面において均一に分散される360の平面波の基準を使用して、圧縮サンプリング平面波解析が実行される。ε及びεの値は、それぞれ10−3及び2に固定されている。あらゆる場合に、音場を定義する音源の方向は、水平面においてランダムに選択されている。
【0232】
実施例1
図24A〜図24Cを参照すると、このシミュレーションでは、2kHzの4つの音源が使用された。HOAの解が図24Aに示され、最初の音場が図24Bに示され、本開示の技術を使用した解が図24Cに示される。明確に、記載された方法は、標準のHOA方法よりよく機能する。
【0233】
実施例2
図25A〜図25Cを参照すると、このシミュレーションでは、16kHzの12の音源が使用された。上述したように、HOAの解が図25Aに示され、最初の音場が図25Bに示され、本開示の技術を使用した解が図25Cに示される。図25A〜図25Cの結果は、マイクロフォンアレイのシャノン−ナイキスト空間エイリアシング制限外で取得され、しかし音場の正確な再構築を依然として提供することを、当業者であれば理解されたい。
【0234】
スイートスポットがより大きくなるように、向上した及びより強い音場の再構築が提供されることは、記載された実施形態の利点である。システムを定義しているパラメータが過小制約されているとき、再構築の品質の劣化は、仮にあるとしてもわずかしかなく、スピーカの数が増加するにつれて、再構築の精度は向上する。
【0235】
広義に記載される本開示の範囲を逸脱することなく、特定の実施形態に示されるように、多数の変形及び/又は変更が本開示に加えられてもよいことを当業者であれば理解されよう。したがって、本実施形態は、あらゆる点で、制限としてではなく、例示として考慮されるものとする。

【特許請求の範囲】
【請求項1】
記録された音場を再構築するための機器であって、
前記音場を測定して記録されたデータを取得するための検知装置と、
前記検知装置と通信し、
(a)前記記録された音場のスパース性を推定すること、及び
(b)前記記録された音場を再構築することができるように平面波信号及びその関連のソース方向を取得することのうちの少なくとも1つのために前記記録されたデータを処理する信号処理モジュールと、
を含む機器。
【請求項2】
前記検知装置がマイクロフォンアレイを備える請求項1に記載の機器。
【請求項3】
前記マイクロフォンアレイが、バフル付きアレイ及びオープン球状マイクロフォンアレイ、のうちの1つである請求項2に記載の機器。
【請求項4】
前記信号処理モジュールが、前記記録されたデータの前記スパース性を推定するように構成された請求項1〜3のいずれか一項に記載の機器。
【請求項5】
前記信号処理モジュールが、
前記記録された音場を解析して、前記音場における前記ソースを分離し、前記ソース方向を識別する1組の平面波信号を取得し、前記音場を再構築できるように構成された請求項1〜4のいずれか一項に記載の機器。
【請求項6】
前記信号処理モジュールが、不要なアーチファクトを低減するために前記1組の平面波信号を変更するように構成された請求項5に記載の機器。
【請求項7】
前記機器は、
前記再構築された音場を再生するための再生装置、を含む請求項1〜6のいずれか一項に記載の機器。
【請求項8】
前記信号処理モジュールが、前記再構築された音場を再生するためにどの再生装置が使用されるかに基づいて前記記録されたデータを変更するように動作可能である請求項7に記載の機器。
【請求項9】
記録された音場を再構築する方法であって、
時間領域技術及び周波数領域技術のうちの一方を使用して、スパース領域における記録されたデータを解析するステップと、
前記記録された音場を再構築することができるように、前記選択された技術から生成された平面波信号及びその関連のソース方向を取得するステップと、
を含む、当該方法。
【請求項10】
前記方法は、
音響検知装置を使用して、1組の信号smic(t)の形で前記記録されたデータを取得するために、前記音場の音声の時間フレームを記録するステップ、を含む請求項9に記載の方法。
【請求項11】
前記方法は、
前記記録された音場の前記スパース性を計算するために、HOA領域においてICAを適用することによって、前記記録された音場の前記スパース性を推定するステップ、を含む請求項9又は請求項10に記載の方法。
【請求項12】
前記方法は、
前記HOA領域における前記記録された音場を解析してHOA領域の時間信号のベクトルbHOA(t)を取得し、信号処理技術を使用してbHOA(t)から混合行列MICAを計算するステップ、を含む請求項11に記載の方法。
【請求項13】
前記方法は、
【数1】


を計算することによって、1組の平面波基準方向と関連した前記HOA方向ベクトル上に前記混合行列MICAを投影するステップであって、上記の式中で、
【数2】


が前記平面波基準方向と関連した実数値(複素数値)のHOA方向行列の転置(エルミート共役)であり、
【数3】


におけるハット演算子が、行列がHOA次数Mに切り捨てられたことを示す、当該投影するステップ、
を含む請求項12に記載の方法。
【請求項14】
前記方法は、
最初にVsourceによって表される優位な平面波方向の数、Nsourceを決定し、次いで
【数4】


を計算することによって、前記記録されたデータの前記スパース性Sを推定するステップであって、式中、Nplwが解析平面波基準方向の数である、当該推定するステップ、
を含む請求項13に記載の方法。
【請求項15】
前記方法は、
前記記録された音場の前記スパース性を計算するために圧縮検知又は凸最適化技術を使用して記録されたデータを解析することによって、前記記録された音場の前記スパース性を推定するステップ、
を含む請求項9又は請求項10に記載の方法。
【請求項16】
前記方法は、
前記HOA領域における前記記録された音場を解析してHOA領域の時間信号のベクトルbHOA(t)を取得するステップと、
所与の時間フレームLにわたってHOA領域の時間信号の前記ベクトルをサンプリングして、時刻t〜tにおいて時間サンプルの集まりを取得して、
HOA=[bHOA(t),bHOA(t),・・・,bHOA(t)]
によって、行列BHOAとして表される各時刻における1組のHOA領域ベクトルbHOA(t),bHOA(t),・・・,bHOA(t)を取得するステップと、
を含む請求項15に記載の方法。
【請求項17】
前記方法は、
特異値分解をBHOAに適用して、行列分解
HOA=USV
を取得するステップ、
を含む請求項16に記載の方法。
【請求項18】
前記方法は、
mがBHOAの行の数であるとして、Sの最初のm個の列のみを保持することによって行列Sreducedを形成し、Ω=USreducedという式で与えられる行列Ωを形成するステップ、
を含む請求項17に記載の方法。
【請求項19】
前記方法は、
行列Γについて、以下の凸計画問題を解決するステップであって、
前記凸計画問題とは、
||YplwΓ−Ω||L2≦εという条件で、||Γ||L1−L2を最小にする問題であり、
上記の式中で、Yplwが、列が何らかの組の解析平面波に対応する前記1組の方向についての前記球面調和関数の前記値である前記行列(高い球面調和次数に切り捨てられる)であり、εが負でない実数である、当該解決するステップ、
を含む請求項17に記載の方法。
【請求項20】
前記方法は、
plw=ΓVを使用して、ΓからGplwを取得するステップであって、
上記の式中におけるVは、BHOAの前記行列分解から取得される、当該ステップ、
を含む請求項19に記載の方法。
【請求項21】
前記方法は、
Π=(1−α)ΠL−1+αΓpinv(Ω)
を計算することによって、L番目の時間フレームについて、非混合行列Πを取得するステップであって、上記の式中で、ΠL−1が、前記L−1時間フレームについての混合行列であり、αが、0≦α≦1となるような忘却因子である、当該ステップ、
を含む請求項20に記載の方法。
【請求項22】
前記方法は、
plw−smooth=ΠHOA
を使用して、Gplw−smoothを取得するステップ、
を含む請求項21に記載の方法。
【請求項23】
前記方法は、
標準の重畳加算技術を使用して、平面波時間サンプルの集まりGplw−smoothから平面波信号のベクトルgplw−cs(t)を取得するステップ、
を含む請求項22に記載の方法。
【請求項24】
前記方法は、
標準の重畳加算技術を使用して平滑化することなく、平面波時間サンプルの集まりGplwからgplw−cs(t)を取得するステップ、
を含む請求項22に記載の方法。
【請求項25】
前記方法は、
最初にgplw−cs(t)の優位な成分の数Ncompを計算し、次いで
【数5】


を計算することによって、前記記録されたデータの前記スパース性を推定するステップであって、上記の式中で、Nplwが、解析平面波基準方向の数である、当該ステップ、
を含む請求項24に記載の方法。
【請求項26】
前記方法は、
前記スパース領域における前記記録されたデータを解析するために周波数領域技術を使用することによって、前記記録された音場を再構築するステップと、
前記記録された音場を再構築することができるように前記周波数領域技術から前記平面波信号を取得するステップと、
を含む請求項9〜25のいずれか一項に記載の方法。
【請求項27】
前記方法は、
FFTを使用して前記1組の信号smic(t)を前記周波数領域に変換してsmicを取得するステップ、
を含む請求項26に記載の方法。
【請求項28】
前記方法は、
平面波解析を使用して前記周波数領域における前記記録された音場を解析して、平面波形振幅のベクトルgplw−csを生成するステップ、
を含む請求項27に記載の方法。
【請求項29】
前記方法は、
平面波振幅の前記ベクトルgplw−csについて、以下の凸計画問題を解決することによって、前記記録された音場の前記平面波解析を行うステップであって、
前記凸計画問題とは、
【数6】


の条件で、||gplw−cs||を最小にする問題であり、
上記の式中で、Tplw/micが、平面波と前記マイクロフォンとの間の伝達行列であり、smicが、前記マイクロフォンアレイによって記録される前記1組の信号であり、εが、負でない実数である、当該ステップ、
を含む請求項28に記載の方法。
【請求項30】
前記方法は、
平面波振幅の前記ベクトルgplw−csについて、以下の凸計画問題を解決することによって、前記記録された音場の前記平面波解析を行うステップであって、
前記凸計画問題とは、
【数7】


及び
【数8】


の条件で、||gplw−cs||を最小にする問題であり、
上記の式中で、Tplw/micが、前記平面波と前記マイクロフォンとの間の伝達行列であり、smicが、前記マイクロフォンアレイによって記録される前記1組の信号であり、εが、負でない実数であり、Tmic/HOAが、前記平面波と前記HOA領域フーリエ展開との間の伝達行列であり、bHOAが、bHOA=Tmic/HOAmicによって得られる1組のHOA領域フーリエ係数であり、ここでのTmic/HOAが前記マイクロフォンと前記HOA領域フーリエ展開との間の伝達行列であり、εが、負でない実数である、当該ステップ、
を含む請求項29に記載の方法。
【請求項31】
前記方法は、
平面波振幅の前記ベクトルgplw−csについて、以下の凸計画問題を解決することによって、前記記録された音場の前記平面波解析を行うステップであって、
前記凸計画問題とは、
【数9】


の条件で、||gplw−cs||を最小にする問題であり、
上記の式中で、Tplw/micが、平面波と前記マイクロフォンとの間の伝達行列であり、Tmic/HOAが、前記マイクロフォンと前記HOA領域フーリエ展開との間の伝達行列であり、bHOAが、bHOA=Tmic/HOAmicによって得られる1組のHOA領域フーリエ係数であり、εが、負でない実数である、当該ステップ、
を含む請求項28に記載の方法。
【請求項32】
前記方法は、
平面波振幅の前記ベクトルgplw−csについて、以下の凸計画問題を解決することによって、前記記録された音場の前記平面波解析を行うステップであって、
前記凸計画問題とは、
【数10】


及び
【数11】


の条件で、||gplw−cs||を最小にする問題であり、
上記の式中で、Tplw/micが、平面波と前記マイクロフォンとの間の伝達行列であり、εが、負でない実数であり、Tmic/HOAが、前記平面波と前記HOA領域フーリエ展開との間の伝達行列であり、bHOAが、bHOA=Tmic/HOAmicによって得られる1組のHOA領域フーリエ係数であり、ここでのTmic/HOAが前記マイクロフォンと前記HOA領域フーリエ展開との間の伝達行列であり、εが、負でない実数である、当該ステップ、
を含む請求項28に記載の方法。
【請求項33】
前記方法は、
前記1組の解析平面波に対応する1組の方向の前記空間分割の解に基づいて、εを設定するステップと、
前記音場の前記計算されたスパース性に基づいてεの前記値を設定するステップと、
を含む請求項32に記載の方法。
【請求項34】
前記方法は、
逆FFTを使用してgplw−csを前記時間領域に変換し直して、gplw−cs(t)を取得するステップ、
を含む請求項28〜33のいずれか一項に記載の方法。
【請求項35】
前記方法は、
時間領域技術を使用して前記スパース領域における記録されたデータを解析するステップと、
前記記録された音場を再構築することができるように、前記選択された時間領域技術から生成されたパラメータを取得するステップと、
を含む請求項9〜25のいずれか一項に記載の方法。
【請求項36】
前記方法は、
1組の基準平面波に従って平面波解析を使用して前記時間領域における前記記録された音場を解析して、1組の平面波信号gplw−cs(t)を生成するステップ、
を含む請求項35に記載の方法。
【請求項37】
前記方法は、
前記HOA領域における前記記録された音場を解析して、HOA領域の時間信号のベクトルbHOA(t)を取得するステップと、
所与の時間フレームLにわたってHOA領域の時間信号の前記ベクトルをサンプリングして、時刻t〜tにおいて時間サンプルの集まりを取得して、
HOA=[bHOA(t),bHOA(t),・・・,bHOA(t)]
によって、行列BHOAとして表される各時刻における1組のHOA領域ベクトルbHOA(t),bHOA(t),・・・,bHOA(t)を取得するステップと、
を含む請求項36に記載の方法。
【請求項38】
前記方法は、
相関ベクトルγをγ=BHOAomniの通り計算するステップであって、ここでのbomniは、bHOA(t)の全方向のHOA成分である、当該ステップ、
を含む請求項37に記載の方法。
【請求項39】
前記方法は、
平面波利得のベクトルβplw−csについて、以下の凸計画問題を解決するステップであって、
前記凸計画問題とは、
【数12】


の条件で、||βplw−cs||を最小にする問題であり、
上記の式中で、γ=BHOAomniであり、Tplw/HOAが、前記平面波と前記HOA領域フーリエ展開との間の伝達行列であり、εが、負でない実数である、当該ステップ、
を含む請求項38に記載の方法。
【請求項40】
前記方法は、
平面波利得のベクトルβplw−csについて、以下の凸計画問題を解決するステップであって、
前記凸計画問題とは、
【数13】


及び
【数14】


の条件で、||βplw−cs||を最小にする問題であり、
上記の式中で、γ=BHOAomniであり、Tmic/HOAが、前記平面波と前記HOA領域フーリエ展開との間の伝達行列であり、εが、負でない実数であり、εが、負でない実数である、当該ステップ、
を含む請求項38に記載の方法。
【請求項41】
前記方法は、
前記1組の解析平面波に対応する1組の方向の前記空間分割の解に基づいて、εを設定するステップと、
前記音場の前記計算されたスパース性に基づいてεの前記値を設定するステップと、
を含む請求項40に記載の方法。
【請求項42】
前記方法は、
βplw−csを閾値処理しクリーニングして、その小さい成分のいくつかをゼロに設定するステップ、
を含む請求項40又は請求項41に記載の方法。
【請求項43】
前記方法は、
前記平面波基準に従って行列
【数15】


を形成し、次いで、βplw−csにおける前記ゼロ以外の成分に対応する前記列のみを保持することによって、
【数16】


を、
【数17】


に縮小するステップであって、
【数18】


が、前記平面波基準のHOA方向行列であり、
【数19】


におけるハット演算子が、その行列が何らかのHOA次数Mに切り捨てられたことを示す、当該ステップ、
を含む請求項42に記載の方法。
【請求項44】
前記方法は、
plw−cs−reduced(t)を、
【数20】


により計算するステップ、
を含む請求項43に記載の方法。
【請求項45】
前記方法は、
plw−cs(t)が前記平面波基準に一致するように、ゼロの時間信号の行を挿入することによって、gplw−cs−reduced(t)を拡大してgplw−cs(t)を取得するステップ、
を含む請求項44に記載の方法。
【請求項46】
前記方法は、
行列Gplwについて、以下の凸計画問題を解決するステップであって、
前記凸計画問題とは、
||Yplwplw−BHOA||L2≦εの条件で
||Gplw||L1−L2を最小にする問題であり、
上記の式中で、Yplwが、列が何らかの組の解析平面波に対応する前記1組の方向についての前記球面調和関数の値である行列(高い球面調和次数に切り捨てられる)であり、εが、負でない実数である、当該ステップ、
を含む請求項38に記載の方法。
【請求項47】
前記方法は、
Π=(1−α)ΠL−1+αGplwpinv(BHOA
を計算することによって、L番目の時間フレームについて、非混合行列Πを取得するステップであって、前記ΠL−1が、L−1時間フレームについての非混合行列を指し、αが、0≦α≦1となるような忘却因子である、当該ステップ、
を含む請求項46に記載の方法。
【請求項48】
前記方法は、
特異値分解をBHOAに適用して、行列分解
HOA=USV
を取得するステップ、
を含む請求項47に記載の方法。
【請求項49】
前記方法は、
mがBHOAの行の数であるとして、Sの最初のm個の列のみを保持することによって行列Sreducedを形成するステップと、
Ω=USreduced によって得られる行列Ωを形成するステップと、
を含む請求項48に記載の方法。
【請求項50】
前記方法は、
行列Γについて、以下の凸計画問題を解決するステップであって、
前記凸計画問題とは、
||YplwΓ−Ω||L2≦εの条件で、||Γ||L1−L2 を最小にする問題であり、
ε及びYplwが、上記に定義された通りである、当該ステップ、
を含む請求項49に記載の方法。
【請求項51】
前記方法は、
plw=ΓVを使用して、ΓからGplwを取得するステップであって、前記Vが、BHOAの前記行列分解から取得される、当該ステップ、
を含む請求項50に記載の方法。
【請求項52】
前記方法は、
Π=(1−α)ΠL−1+αΓpinv(Ω)
を計算することによって、L番目の時間フレームについて、非混合行列Πを取得するステップであって、前記ΠL−1が、前記L−1時間フレームについての非混合行列であり、αが、0≦α≦1となるような忘却因子である、当該ステップ、
を含む請求項51に記載の方法。
【請求項53】
前記方法は、
plw−smooth=ΠHOA
を使用して、Gplw−smoothを取得するステップ、
を含む請求項52に記載の方法。
【請求項54】
前記方法は、
標準の重畳加算技術を使用して、平面波時間サンプルの集まりGplw−smoothから平面波信号の前記ベクトルgplw−cs(t)を取得するステップ、
を含む請求項53に記載の方法。
【請求項55】
前記方法は、
標準の重畳加算技術を使用して平滑化することなく、平面波時間サンプルの前記集まりGplwからgplw−cs(t)を取得するステップ、
を含む請求項52又は請求項53に記載の方法。
【請求項56】
前記方法は、
plw−ica(t)を変更して、残響などの不要なアーチファクト及び/又は不要な音源を低減するステップ、
を含む請求項34、36〜45、又は54〜55のいずれか一項に記載の方法。
【請求項57】
前記方法は、
残響を低減するために、前記信号ベクトルgplw−cs(t)における前記信号のうちのいくつかの前記信号値を低減するステップ、
を含む請求項56に記載の方法。
【請求項58】
前記方法は、
前記不要な音源が低減され得るように、前記音場の再構築において音源を分離するために、前記信号ベクトルgplw−ica(t)における前記信号のうちのいくつかをゼロに設定するステップ、
を含む請求項56又は請求項57に記載の方法。
【請求項59】
前記方法は、
前記再構築された音場の再生の手段に応じてgplw−cs(t)を変更するステップ、
を含む請求項56〜58のいずれか一項に記載の方法。
【請求項60】
前記方法は、
plw−csを以下の式により変更するステップであって、
spk(t)=Pplw/spk/gplw−cs(t)
ここでのPplw/spkが、スピーカパニング行列である、当該ステップ、
を含む請求項59に記載の方法。
【請求項61】
前記方法は、
【数21】


によってgplw−cs(t)を前記HOA領域に変換し直すステップであって、ここでの、bHOA−highres(t)が、任意のHOA領域次数に展開することができるgplw−cs(t)の高分解能のHOA領域表現であり、
【数22】


が、平面波基準のHOA方向行列であり、
【数23】


における前記ハット演算子が、その行列が何らかのHOA次数Mに切り捨てられたことを示す、当該ステップ、
を含む請求項59に記載の方法。
【請求項62】
前記方法は、
HOAデコード技術を使用して、bHOA−highres(t)をgspk(t)にデコードするステップ、
を含む請求項61に記載の方法。
【請求項63】
前記方法は、
【数24】


により、gplw−cs(t)を修正してヘッドホン利得を決定するステップであって、前記Pplw/hph(t)は、前記1組の平面波方向に対応するフィルタの頭部インパルス応答行列である、当該ステップ、
を含む請求項59に記載の方法。
【請求項64】
前記方法は、
前記HOA領域において独立成分解析(ICA)の時間領域技術を使用して、スパース領域における記録されたデータを解析するステップと、
前記記録された音場を再構築することができるように、前記選択された時間領域技術からパラメータを取得するステップと、
を含む請求項9〜20のいずれか一項に記載の方法。
【請求項65】
前記方法は、
前記HOA領域における前記記録された音場を解析して、HOA領域の時間信号のベクトルbHOA(t)を取得するステップ、
を含む請求項64に記載の方法。
【請求項66】
前記方法は、
ICA信号処理を使用して前記HOA領域の時間信号を解析して、1組の平面波ソース信号gplw−ica(t)を生成するステップ、
を含む請求項65に記載の方法。
【請求項67】
前記方法は、
信号処理技術を使用してbHOA(t)から混合行列MICAを計算するステップ、
を含む請求項66又は請求項67に記載の方法。
【請求項68】
前記方法は、
【数25】


を計算することによって、1組の平面波基準方向と関連した前記HOA方向ベクトル上に前記混合行列MICAを投影するステップであって、
【数26】


が、前記平面波基準方向と関連した実数値(複素数値)のHOA方向行列の転置(エルミート共役)であり、
【数27】


における前記ハット演算子が、その行列が何らかのHOA次数Mに切り捨てられたことを示す、当該ステップ、
を含む請求項67に記載の方法。
【請求項69】
前記方法は、
閾値処理技術を使用して、優位なソース方向を示すVsourceの前記列を識別するステップ、
を含む請求項68に記載の方法。
【請求項70】
前記方法は、
行列Vsourceと関連した優位なソース方向に対応しない
【数28】


における前記平面波方向ベクトルを削除することによって、行列
【数29】


を縮小して、行列
【数30】


を取得するステップ、
を含む請求項69に記載の方法。
【請求項71】
前記方法は、
plw−cs−reduced(t)を、
【数31】


により推定するステップ、
を含む請求項70に記載の方法。
【請求項72】
前記方法は、
前記周波数領域において動作して、smic(t)のFFTとしてsmicを計算することによってgplw−ica−reduced(t)を推定するステップ、
を含む請求項70に記載の方法。
【請求項73】
前記方法は、
行列Vsourceと関連した優位なソース方向に対応しないTplw/micにおける列を削除することによって、周波数ごとに、伝達行列Tplw/micを縮小して、行列plw/mic−reducedを取得するステップ、
を含む請求項72に記載の方法。
【請求項74】
前記方法は、
plw−ica−reduced=pinv(Tplw/mic−reduced)smicを計算することによってgplw−ica−reducedを推定し、逆FFTを使用してgplw−ica−reducedを前記時間領域に変換し直して、gplw−ica−reduced(t)を取得するステップ、
を含む請求項73に記載の方法。
【請求項75】
前記方法は、
plw−ica(t)が前記平面波基準に一致するように、ゼロの時間信号の行を挿入することによって、gplw−ica−reduced(t)を拡大して、gplw−ica(t)を取得するステップ、
を含む請求項74に記載の方法。
【請求項76】
前記方法は、
信号処理技術を使用してbHOAから混合行列MICA及び1組の分離されたソース信号gica(t)を計算するステップ、
を含む請求項65又は請求項66に記載の方法。
【請求項77】
前記方法は、
【数32】


を計算することによって、1組の平面波基準方向と関連した前記HOA方向ベクトル上に前記混合行列MICAを投影するステップであって、ここでの
【数33】


は、前記平面波基準方向と関連した実数値(複素数値)のHOA方向行列の転置(エルミート共役)であり、
【数34】


におけるハット演算子は、その行列が何らかのHOA次数Mに切り捨てられたことを示す、当該ステップ、
を含む請求項76に記載の方法。
【請求項78】
前記方法は、
閾値処理技術を使用して、Vsourceから前記優位な平面波方向を識別するステップ、
を含む請求項77に記載の方法。
【請求項79】
前記方法は、
ica(t)をクリーニングして、Vsourceにおける前記優位な平面波方向に対応する前記信号を保持し、他の信号をゼロに設定するgplw−ica(t)を取得するステップ、
を含む請求項78に記載の方法。
【請求項80】
前記方法は、
plw−ica(t)を変更して、残響などの不要なアーチファクト及び/又は不要な音源を低減するステップ、
を含む請求項79に記載の方法。
【請求項81】
前記方法は、
残響を低減するために、前記信号ベクトルgplw−cs(t)における前記信号のうちのいくつかの前記信号値を低減するステップ、
を含む請求項80に記載の方法。
【請求項82】
前記方法は、
前記不要な音源が低減され得るように、前記音場の再構築において音源を分離するために、前記信号ベクトルgplw−ica(t)における前記信号のうちのいくつかをゼロに設定するステップ、
を含む請求項80又は請求項81に記載の方法。
【請求項83】
前記方法は、
前記再構築された音場の再生の手段に応じてgplw−cs(t)を変更するステップ、
を含む請求項80〜82のいずれか一項に記載の方法。
【請求項84】
前記方法は、
plw−ica(t)を以下の通り変更するステップであって、
spk(t)=Pphw/spkplw−ica(t)
ここでのPplw/spkがスピーカパニング行列である、当該ステップ、
を含む請求項83に記載の方法。
【請求項85】
前記方法は、
【数35】


を計算することによって、gplw−ica(t)を前記HOA領域に変換し直すステップであって、
ここでのbHOA−highres(t)が、任意のHOA領域次数に展開することができるgplw−ica(t)の高分解能のHOA領域表現であり、
【数36】


が、平面波基準のHOA方向行列であり、
【数37】


における前記ハット演算子が、その行列が何らかのHOA次数Mに切り捨てられたことを示す、当該ステップ、
を含む請求項83に記載の方法。
【請求項86】
前記方法は、
HOAデコード技術を使用して、bHOA−highres(t)をgspk(t)にデコードするステップ、
を含む請求項85に記載の方法。
【請求項87】
前記方法は、
【数38】


によりgplw−cs(t)を変更してヘッドホン利得を決定するステップであって、
ここでのPplw/hph(t)が、前記1組の平面波方向に対応するフィルタの頭部インパルス応答行列である、当該ステップ、
を含む請求項83に記載の方法。
【請求項88】
請求項9〜87のいずれか一項に記載の方法を実行するようにプログラムされたコンピュータ。
【請求項89】
コンピュータが請求項9〜87のいずれか一項に記載の方法を実行することができるようにするためのコンピュータ可読媒体。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate

【図21】
image rotate

【図22】
image rotate

【図23】
image rotate

【図24A】
image rotate

【図24B】
image rotate

【図24C】
image rotate

【図25A】
image rotate

【図25B】
image rotate

【図25C】
image rotate


【公表番号】特表2013−507796(P2013−507796A)
【公表日】平成25年3月4日(2013.3.4)
【国際特許分類】
【出願番号】特願2012−532418(P2012−532418)
【出願日】平成22年10月6日(2010.10.6)
【国際出願番号】PCT/AU2010/001312
【国際公開番号】WO2011/041834
【国際公開日】平成23年4月14日(2011.4.14)
【出願人】(501305257)ザ・ユニバーシティ・オブ・シドニー (6)
【Fターム(参考)】