説明

オーディオ信号変換

本発明は、複数のオーディオ入力信号にダイナミック変動変換マトリックスを適用して、第1のフォーマットから第2のフォーマットに再フォーマットする方法に関する。特に、本発明は、1以上の方向信号成分の方角と強度を抽出することが可能な情報を抽出し、第1と第2の規則に基づき変換マトリックスを計算し、そして、出力信号を生成するために前記オーディオ入力信号を前記変換マトリックスに適用する。

【発明の詳細な説明】
【技術分野】
【0001】
(関連出願の相互参照)
本出願は、2008年8月14日出願の米国暫定特許出願番号61/189,087に基づく優先権を主張する。この暫定特許出願はそのすべてを参照として本明細書に組み込むものとする。
【0002】
本発明は、オーディオ信号処理に関する。特に、本発明は、複数のオーディオ入力信号にダイナミック変動変換マトリックスを適用して、第1のフォーマットから第2のフォーマットに再フォーマットする方法に関する。また、本発明は、このような方法のための装置及びコンピュータプログラムに関する。
【発明の概要】
【0003】
本発明の特徴は、複数の(NI個の)オーディオ入力信号(Input(t))にダイナミック変動変換マトリックス(M)を適用して、第1のフォーマットから第2のフォーマットに再フォーマットする方法であって、エンコーディングマトリックス(I)への複数の概念的音源信号(Source(t)...SourceNS(t))がそれぞれ自分自身についての情報と関連し、該エンコーディングマトリックスは、各概念的音源信号を関連する概念的情報に従い処理する第1の規則に従い概念的音源信号を処理し、前記変換マトリックスは、それにより生成される複数の(NO個の)出力信号(Output(t)...OutputNO(t))と、理想デコーディングマトリックス(O)に前記概念的音源信号を適用することにより導き出されたと推定される複数の(NO個の)概念的理想出力信号(IdealOut(t)...IdealOutNO(t))との間の差を少なくするように制御され、前記デコーディングマトリックスは、各概念的音源信号を関連する概念的情報に従い処理する第2の規則に従い概念的音源信号を処理し、
複数の周波数及び複数の時間セグメント中の各々のオーディオ入力信号に応答して、拡散した方向性のない信号成分の方角と強度に寄与する情報を取得するステップと、
前記第1の規則及び前記第2の規則に基づき前記変換マトリックスを計算するステップであって、該計算には、(a)(i)前記複数の周波数及び前記複数の時間セグメントの少なくとも1つにおけるオーディオ入力信号の共分散マトリックス、及び(ii)前記複数の周波数及び時間セグメントの少なくとも同じ1つにあるオーディオ入力信号と概念的理想出力信号の相互共分散マトリックスの推定と、(i)方角信号成分の方角と強度、及び(ii)拡散した方向性のない信号成分が含まれることを特徴とするステップと、
出力信号を生成するために前記オーディオ入力信号を前記変換マトリックスに適用するステップと、
を具備することである。
【0004】
前記変換マトリックス特性は、前記共分散マトリックス及び前記相互共分散マトリックスの関数として計算することができる。前記ダイナミック変動変換マトリックス[M]の要素は、下記のように、共分散マトリックスの逆演算を右から相互共分散マトリックスに作用させることにより取得することができる。
【0005】
M=Cov([IdealOutput],[Input]){Cov([Input],[Input])-1
複数の概念的音源信号は、相互に相関関係がないとみなすことができ、Mの計算においては概念的音源信号の共分散マトリックスの計算を内在し、概念的音源信号の共分散マトリックスを対角化するので、計算が単純になる。このデコーダーマトリックス(M)は、最急降下法で計算することができる。最急降下法は、前の時間区間のMの先の推定値に基づき変換マトリックスの推定を繰り返し計算する勾配降下法により得ることができる。
【0006】
本発明の特徴は、複数の(NI個の)オーディオ入力信号(Input(t)...InputNI(t))にダイナミック変動変換マトリックス(M)を適用して、第1のフォーマットから第2のフォーマットに再フォーマットする方法であって、前記複数のオーディオ入力信号は、エンコーディングマトリックス(I)に、それぞれ相互に無関係であると推定されそしてそれぞれ自分自身についての情報と関連する複数の概念的音源信号(Source(t)...SourceNS(t))を適用することにより導き出されたものであると推定され、前記エンコーディングマトリックスは、各概念的音源信号を関連する概念的情報に従い処理する第1の規則に従い概念的音源信号を処理し、前記変換マトリックスは、それにより生成される複数の(NO個の)出力信号(Output(t)...OutputNO(t))と、理想デコーディングマトリックス(O)に前記概念的音源信号を適用することにより導き出されたと推定される複数の(NO個の)概念的理想出力信号(IdealOut(t)...IdealOutNO(t))との間の差を少なくするように制御され、前記デコーディングマトリックスは、各概念的音源信号を関連する概念的情報に従い処理する第2の規則に従い概念的音源信号を処理し、
複数の周波数及び複数の時間セグメント中の各々のオーディオ入力信号に応答して、1以上の方角信号成分の方角と強度と、拡散した方向性のない信号成分の強度とに寄与する情報を取得するステップと、
前記変換マトリックスMを計算するステップであって、該計算には、(a)複数の周波数セグメント及び複数の時間セグメントと、(i)前記方角信号成分の方角と強度及び(ii)前記拡散した方向性のない信号成分の強度とを結合するステップであって、結合結果が、音源信号[S×S]の共分散マトリックスの推定値を構成することを特徴とする、ステップと、(b)ISSI=I×(S×S)×I及びOSSI=O×(S×S)×Iを計算するステップと、(c)M=(OSSI)×(ISSI)−1を計算するステップと、が含まれことを特徴とするステップと、
出力信号を生成するために前記オーディオ入力信号を前記変換マトリックスに適用するステップと、
を具備することである。
【0007】
概念的な情報は、インデックスを具備することができ、特定のインデックスと関連付けた第1の規則に従う処理は、同じインデックスと関連付けた第2の規則に従う処理とペアを組むことができる。前記第1の規則と前記第2の規則は、第1のルックアップテーブル及び第2のルックアップテーブルとして実施することができ、テーブル入力は共通のインデックスによりペアを構成する。
【0008】
前記概念的な情報は、概念的方角情報とすることができる。概念的方角情報は、概念的3次元方角情報とすることができる。概念的3次元情報は、概念的なリスニング位置に関する概念的な方位角と高さとの関係を具備することができる。概念的方角情報は、概念的2次元方角情報とすることができる。概念的2次元方角情報報は、概念的なリスニング位置に関する概念的な方位角との関係を具備することができる。
【0009】
前記第1の規則は、入力パンニング規則とすることができ、前記第2の規則は、出力パンニング規則とすることができる。
【0010】
複数の周波数セグメントと複数の時間セグメントの各々におけるオーディオ入力信号に応答して、1以上の方角信号成分の方角及び強度に寄与し、かつ、拡散した方向性のない信号成分の強度に寄与する情報を取得するステップは、前記複数の周波数セグメントと複数の時間セグメントの各々におけるオーディオ入力信号の共分散マトリックスを計算するステップを含む。前記1以上の方角信号成分の方角及び強度と、各周波数セグメント及び各時間セグメントの拡散した方向性のない信号成分の強度は、前記共分散マトリックスの計算結果に基づいて推定する。各周波数セグメント及び時間セグメントの拡散した方向性のない信号成分の推定は、前記共分散マトリックスの計算における最小固有値の値から形成することができる。前記変換マトリックスは、可変係数を有する可変マトリックス、又は、固定係数と可変出力を有する可変マトリックスとすることができ、該変換マトリックスは、該可変係数を変化させることにより又は可変出力を変化させることにより制御することができる。
【0011】
前記デコーダーマトリックス(M)は、周波数に依存するデコーダーマトリックス(M)の加重和、M=Σ、とすることができ、この周波数依存性は、帯域幅Bに関連する。
【0012】
本発明の特徴には、上記方法を実行するために作られた装置が含まれる。
【0013】
本発明の特徴には、さらに、上記方法を実行するためのコンピュータプログラムが含まれる。
【図面の簡単な説明】
【0014】
【図1】本発明に係る変換器の特徴及びこのような変換器を識別する方法の説明に役立つ機能ブロック図である。
【図2】リスナーの周囲に分配した複数のオーディオ源の実施例である。
【図3】本発明に係る変換器の入力に関する1セットの規則を定義するために用いられるような「I」マトリックスエンコーダーの実施例である。
【図4】本発明に係る変換器の理想出力に関する1セットの規則を定義するために用いられるような「O」マトリックスエンコーダーの実施例である。
【図5】Iマトリックスは2出力をもち、Oマトリックスは5出力をもち、方位角についてプロットした、Iマトリックス及びOマトリックスを並べた例である。
【図6】本発明の特徴に係るM変換器の実施例を図示した機能図である。
【図7】本発明の特徴を理解するのに役立つ方位角の関数としての音源出力を示す概念的な図解である。
【図8】本発明の特徴を理解するのに役立つ短時間フーリエ変換(STFT)空間の概念を示す。
【図9】3期間スロットの長さの時間長と2つのビンの周波数高さを有する周波数・時間セグメントのSTFT空間の例を示す。
【図10】人の知覚帯域に類似するように、低周波数と高周波数の間で時間/周波数分解能が異なる複数の周波数・時間セグメントを示す。
【図11】指向性信号成分、拡散信号成分、及び音源方位角方向の推定値を周波数・時間セグメントから概念的に抽出したものを示す。
【図12】指向性信号成分、拡散信号成分、及び音源方位角方向の推定値を複数の周波数・時間セグメントから概念的に結合したものを示す。
【図13】拡散信号成分の推定値を、指向性信号成分及び音源方位角方向とは別に、結合した図12の変形例を示す。
【図14】共分散マトリックスを対角化することにより推定を簡単化することを含む概念的音源信号の共分散マトリックスを推定するステップを具備するステップにより、Mマトリックスを計算する図13の変形例を示す。
【図15】図14の実施例におけるステップを再構成した図14の変形例を示す。
【図16】本発明の特徴に係る複数帯域デコーダの実施例を示す機能ブロック図である。
【図17】各出力処理帯域に近似ミックスマトリックスMbを定めることにより、大きな周波数帯域のセットを小さなセットに合併させる実施例を示す概念的表現である。
【図18】本発明の特徴に係る複数帯域デコーダの分析帯域データを計算する概念的実施例を示す。
【発明を実施するための形態】
【0015】
本発明は、変換処理又は変換装置(変換器)が複数のオーディオ入力信号を受け取り、第1のフォーマットから 第2のフォーマットに再フォーマットすることを特徴とする。表現を明確にするために、この処理及び装置はここでしばしば「変換器」と称される。この変換器はダイナミック変動変換マトリックス又はダイナミック変動変換マトリックス処理(例えば、線形マトリックス又は線形マトリックス処理)とすることができる。このようなマトリックス又はマトリックス処理は、当業者に「アクティブマトリックス」又は「適応マトリックス」のように称される。
【0016】
しかし、原則として、本発明はアナログ領域又はディジタル領域(又はこの2つの組み合わせ)で実行することができ、本発明の実際的な実施の形態では、オーディオ信号は、データのブロック中の時間サンプルで表現され、ディジタル領域で処理がなされる。種々のオーディオ信号の各々は、アナログオーディオ信号から導き出すことのできる時間サンプル又はアナログオーディオ信号に変換すべき時間サンプルとすることができる。この種々の時間サンプル化された信号は、適切な形式に、例えば、線形パルス符号変調(PCM)のような形式にエンコードすることができる。
【0017】
第1のフォーマットの実施例は、それぞれ、左(L)、中央(C)、右(R)、左サラウンド、(LS)、及び右サラウンド(RS)のように、リスナーに対する方位角方向に概念的に関連付けた5つの分離したオーディオ信号又はオーディオ「チャンネル」をマトリックスエンコーディングした結果又は結果と推定される1対の立体音響オーディオ信号(しばしば、Lt(左トータル)チャンネル及びRt(右トータル)チャンネルと称される)である。オーディオ信号は、概念的に空間的方角と関連させて、しばしば「チャンネル」と称される。このようなマトリックスエンコーディングは、例えば、当業者によく知られている、MPマトリックスエンコーダー又はプロロジックIIマトリックスエンコーダーのような定義済みのパンニング規則に従い、5つの方角チャンネルを2つの方角チャンネルにマップする受動的マトリックスエンコーダーにより達成することができる。このようなエンコーダーの詳細は、本発明にとって重要ではなく必要でもない。
【0018】
第2のフォーマットの実施例は、それぞれ、左(L)チャンネル、中央(C)チャンネル、右(R)チャンネル、左サラウンド(LS)チャンネル、及び右サラウンド(RS)チャンネルのように、リスナーに対する方位角方向に概念的に関連付けた5つの分離したオーディオ信号又はオーディオチャンネルのセットである。一般に、各チャンネルに別個に信号付与するならば、各チャンネルが関連づけられた方角からくるような印象を適切な位置にいるリスナーに与えるような方法で、そのような信号が再生されると仮定する。
【0019】
ここに記載の例示的な変換器は、上述のような2つの入力チャンネルと上述のような5つの出力チャンネルを有するが、本発明に係る変換器は、2つではない入力チャンネルと5つではない出力チャンネルとを有することができる。入力チャンネルの数は出力チャンネルの数より多くても少なくてもよく、同じ数でもよい。本発明に係る変換器によるフォーマッティングにおける変換は、チャンネルの数に関係するだけでなくチャンネルの概念的な方角の変更にも関係する。
【0020】
本発明の特徴に係る変換器を説明する1つの有用な方法は、図1に記載のような環境である。図1を参照して、ベクトル「S」で表すことができる複数の概念的なオーディオ音源信号(NS)(Source(t)...SourceNS(t))は、ライン2で受け取られると仮定する。Sは以下のように定義することができる。
【式1】
【0021】

ここで、Source(t)からSourceNS(t)までは、NS個の概念的なオーディオ音源信号又はオーディオ音源信号成分である。この概念的なオーディオ音源信号は、概念的であり(存在しているかもしれないし存在しないかもしれない、又は存在していたのかもしれない)、変換器マトリックスの計算において知られていない。しかし、ここに説明したように、概念的音源信号への寄与の推定は、本発明に有用である。
【0022】
一定数の概念的音源信号があることを仮定することができる。例えば、(以下の実施例のような)12の入力音源を仮定することができ、又は、(例えば、リスナーの周囲の水平面に方位角が1度ずつ増加するように離した)360の音源信号を仮定することができ、つまり、どのような数(NS)の音源であってもよいと理解される。各オーディオ音源信号が概念的なリスナーに対する方位角又は方位角及び高さのようなそれ自体についての情報であることに関連する。以下に説明する図2の実施例を参照のこと。
【0023】
表現を明確にするために、本明細書全体にわたって、複数の信号(又は複数の信号成分を有する1つのベクトル)を伝達する線は単線で表す。実際のハードウェアでの実施の形態及び同様のソフトウェアでの実施の形態において、この線は、複数の物理的な線又は信号が多重化した形態で伝送される1以上の複数物理的な線で表示する。
【0024】
図1の記載に戻って、概念的なオーディオ音源信号は2つの経路に適用される。図1において上側の経路で示した第1の経路において、概念的なオーディオ音源信号が「I」エンコーダー又は「I」エンコーディング処理(エンコーダー)4に適用される。さらに以下に説明するようにIエンコーダー4は、第1の規則のセットに従い動作する、固定(時不変)エンコーディングマトリックス処理又は固定(時不変)マトリックスエンコーダー(例えば、線形ミキシング処理又は線形ミキサー)Iとすることができる。これらの規則により、各概念的音源信号に関連づけられた概念的な情報に従い、Iエンコーダーマトリックスは各概念的音源信号を処理する。例えば、方角が音源信号に関連付けられている場合、この音源信号は、この方角に関連づけられたパンニング規則又はパンニング係数に従いエンコードすることができる。規則の第1のセットの実施例は、いかに記載する入力パンニング規則である。Iエンコーダー4は、入力されたNS個の音源信号に応答して、オーディオ入力信号(Input(t)...InputNI(t))として線6に沿って変換器に入力する複数の(NI個の)オーディオ信号を出力する。このNS個のオーディオ入力信号は、ベクトル「Input」で表すことができ、以下のように定義することができる。
【式2】
【0025】

ここで、Input(t)からInputNI(t)までは、NI個の入力信号又は入力信号成分である。
【0026】
NI個のオーディオ入力信号は、変換処理又は変換器(変換器)Mに適用される。さらに以下に説明するように、変換器Mは、ダイナミック変動変換マトリックス又はダイナミック変動変換マトリックス処理により制御可能とすることができる。変換器の制御について図1には示されていない。変換器Mの制御について、まず図6に関連させて、以下に説明する。変換器Mは、ライン10に、以下のように定義することのできるベクトル「Output」で表される複数の(NOの)出力信号(Output(t)...OutputNO(t))を出力する。
【式3】
【0027】

ここで、Output(t)からOutputNO(t)まではNO個のオーディオ出力信号又はオーディオ出力信号成分である。
【0028】
上述したように、概念的なオーディオ音源信号(Source(t)...SourceNS(t))は2つの経路に適用される。図1に示す下側の経路である2番目の経路において、概念的なオーディオ音源 信号は、エンコーダー又はエンコーディング処理(理想デコーダー、O)に適用される。さらに以下に説明するように、理想デコーダーOは、固定(時不変)デコーディングマトリックス処理又はマトリックスデコーダー(例えば、線形ミキシング処理又は線形ミキサー)Oとすることができ、第2の規則に従い動作する。この規則により、デコーダーマトリックスOは、各概念的音源信号に関連づけられた概念的な情報に従い各概念的音源信号を処理することができる。例えば方角が音源信号に関連付けられている場合、音源信号を、その方角に関連づけられたパンニング係数に従いデコードすることができる。第2の規則の実施例は、以下に説明するような出力パンニング規則である。
【0029】
理想デコーダーは、ライン10に、以下のように定義することのできるベクトル「Ideal Out」で表される複数の(NOの)理想出力信号(IdealOut(t)...IdealOutNO(t))を出力する。
【式4】
【0030】

ここで、IdealOut(t)からIdealOutNO(t)まではNO個の理想出力信号又は理想出力信号成分である。
【0031】
リスナー20の周囲に別々に置かれた複数の仮想的なサウンド音源がある、図2に示した状況にできるだけ近似した状況をリスナーに体験させるために、本発明の特徴に係る変換器Mを使うことを前提とすることは有用であろう。図2の実施例において、8個のサウンド音源があるが、当然のことながら、上述のように音源の数(NS)は任意である。各サウンド音源は、概念的なリスナーに対する方位角又は方位角及び高さのようなそれ自体についての情報であることに関連する。
【0032】
原則として、本発明の特徴に従い動作する変換器Mは、入力がNI個の個別の音源に過ぎないときは完璧な結果(理想出力に完全に一致する出力)を出すことができる。例えば、多くの信号状態において、各信号が異なる方向角にパンする2つの音源信号から導き出された2つの入力信号(NI=2)の場合、変換器Mは、2つの音源を分離し適切な方向の出力チャンネルにパンすることができる。
【0033】
上述のとおり、入力音源信号Source(t),Source(t),...SourceNS(t)は概念的なものであり未知のものである。そのかわり、知られているのは、マトリックスエンコーダーIによりNS音源信号から混合された入力信号(NI)の最小のセットである。これらの入力信号の生成は、既知の固定のミキシングマトリックス、I(NI×NSマトリックス)を用いて行われることが前提となる。マトリックスIは、必要に応じて、ミキシング処理に位相のずれを表現するために複素数を含むことができる。
【0034】
変換器Mからの出力信号は、ラウドスピーカのセットを駆動し又は駆動を意図し、ここでラウドスピーカの数は既知であり、このラウドスピーカは、必ずしも、もとの音源信号の方角に対応する方角の位置に置く必要はない。変換器Mの目的は、入力信号を受け取り、ラウドスピーカに適用したとき、リスナーに、図2の実施例におけるシナリオにできるだけ近似するような体験を与えるような出力信号を生成することである。
【0035】
元の音源信号、Source(t),Source(t),...SourceNS(t)が与えられたと仮定すると、「理想」ラウドスピーカ信号を生成する最適なミキシング処理があることを前提とすることができる。理想デコーダーマトリックスO(NO×NSマトリックス)は、音源信号を混合しこのような理想スピーカへの出力を生成する。変換器Mからの出力信号と理想デコーダーマトリックスOからの出力信号の両方は、1以上のリスナーに同じように向かいあって配置した同じセットのラウドスピーカに出力し又は出力を意図する。
【0036】
変換器MはNI個の入力信号を受ける。変換器Mは、線形マトリックスミキサーM(Mは時間可変)を用いてNO個の出力信号を生成する。MはNO×NIマトリックスである。変換器の目的は、理想デコーダーの出力(しかし理想出力信号は知られていない)にできるだけ近似するような出力を生成することである。しかし、変換器はOマトリックスとIマトリックスのミキサーの係数を識別し(例えば、以下に説明する入出力パンニングテーブルから得ることができる)、この識別結果を用いてミキシング特性の決定に導く。もちろん、「理想デコーダー」は変換器の実用的な部分ではないが、以下に説明するように理想デコーダーの出力は変換器の効率と理論的に比較するために用いられるので図1に示した。
【0037】
変換器Mからの入出力数(NI及びNO)は変換器により定まってしまうが、入力音源の数は未知であり、1つの非常に有効な方法が、音源の数NSが大きい(NS=360とか)と「推定」することである。一般に、NSを非常に少なく見積ると、変換器の精度が下がり、NSの理想値が精度と効率との二律背反になってしまう可能性がある。NS=360にすることは、読者に(a)音源の数は大きい方が望ましいこと、及び(b)音源はリスナーの周りに水平面に360度の範囲となることを思い出させるのに役立つであろう。実際のシステムでは、NSは(以下の実施例におけるNS=12のように)もっと小さく選定し、又は、実施の形態によっては、固定の角度位置に量子化するのではなく(あたかもNS=∞であるかのように)音源オーディオを角度の連続関数として扱うことができる。
【0038】
パンニングテーブルは入力パンニング規則及び出力パンニング規則を表すために採用することができる。このようなパンニングテーブルは、例えば、テーブルの行をサウンド音源の方角の角度に対応するよう構成することができる。同様に、パンニング規則を、具体的なサウンド音源の方位角を参照することなく、対となった項目を有する入力対出力の再フォーマット規則の形で定義することもできる。
【0039】
両方とも同じ項目数を有し、第1番目が入力パンニングテーブルで第2番目が出力パンニングテーブルとする、1対のルックアップテーブルを定義することができる。例えば、以下のテーブル1は、テーブル中の12の行が12の入力シナリオ(この場合、サウンド再生システムの水平サラウンドサウンドについての12の方位角に対応する)に対応する、マトリックスエンコーダーの入力パンニングテーブルを示す。以下のテーブル2は、同じ12の入力シナリオについて所定の出力規則を示す出力パンニングテーブルを示す。入力パンニングテーブル及び出力パンニングテーブルは、入力パンニングテーブルの各行が出力パンニングテーブルの対応する行と対をなすように、同じ行数とすることができる。
【0040】
ここでの実施例において、パンニングテーブルを参照するが、パンニング関数として特徴付けることも可能である。主たる違いは、パンニングテーブルでは、整数であるインデックスによりテーブルの行にたどりつくように用いられる一方、パンニング関数では、(方位角のような)連続的な入力により検索する。パンニング関数は無限大のパンニングテーブルに似たような動作を行い、ある種のパンニング値の計算アルゴリズム(例えば、マトリックスエンコードされた入力の場合のsin( )関数及びcos( ) 関数)に依存する。
【0041】
パンニングテーブルの各行はシナリオに対応させることができる。テーブル中の行数に等しいシナリオの総数は、NSである。ここでの実施例では、NS=12である。一般に、下記テーブル3に示すように、入力パンニングテーブルと出力パンニングテーブルとを1つの入出力パンニングテーブルに結合することができる。
【0042】
図3は、12入力、2出力マトリックスエンコーダー30のIエンコーダー4の実施例を示す。このようなマトリックスエンコーダーは、RS(右サラウンド)チャンネル、R(右)チャンネル、C(中央)チャンネル、L(左)チャンネル、及びLS(左サラウンド)チャンネルを有する、通常のの5入力・2出力(Lt及びRt)エンコーダーの上位概念と考えることができる。公称到達角度値は、下記テーブル1に示したように、12の入力チャンネル(シナリオ)のそれぞれに対応付けることができる。この実施例におけるゲインは、それに続く計算を簡単にするために、単純な角度のコサインに対応するよう選ばれる。他の値を用いることが可能である。特定のゲインを用いることが本発明の本質とはならない。
【表1】

【0043】
従って、この実施例によれば、入力パンニングマトリックス、I、は2×12マトリックスとなり、以下のように定義される。
【式5】
【0044】

ここで
【式6】
【0045】

これらのゲイン値は、マトリックスエンコーディングに一般的に受け入れられる規則に従う。
【0046】
1)信号が90°(左へ)パンするときは、左チャンネルに対するゲインは1.0であり、右チャンネルに対するゲインは0.0である。
【0047】
2)信号が−90°(右へ)パンするときは、左チャンネルに対するゲインは0.0であり、右チャンネルに対するゲインは1.0である。
【0048】
3)信号が0°(中央へ)パンするときは、左チャンネルに対するゲインは1/√2であり、右チャンネルに対するゲインは1/√2である。
【0049】
4)信号が180°(後へ)パンするときは、左右のチャンネルに対するゲインは逆位相である。
【0050】
5)角度、θ、の如何にかかわらず、2つのゲイン値の2乗の和は1.0となる。すなわち、
【式7】
【0051】

図4は、O理想デコーダー12、すなわち、12入力、5出力のマトリックスデコーダー40の実施例を示す。出力は、リスナーに対して定めた名目的な方向にそれぞれ配置した5つのラウドスピーカを対象とする。名目的な到着値は、下記のテーブル2に示すように、12の各入力チャンネル(シナリオ)に関連付けることができる。この実施例におけるゲイン値は、それに続く計算を簡単にするために、単純な角度のコサインに対応するよう選ばれる。他の値を用いることが可能である。特定のゲインを用いることが本発明の本質とはならない。
【表2】

【0052】
テーブル2のパンニング係数は典型的なOマトリックスを事実上定義する。すなわち、
【式8】
【0053】

代替的に、定パワー出力パンニングマトリックスが式(1.4)により得られる。
【式9】
【0054】

定パワー出力パンニングマトリックスは、Oマトリックスの各列のパンニングゲインの2乗和が1となる性質を持っている。入力エンコーディングマトリックス、I、は一般に所定のマトリックスである一方、出力ミキシングマトリックス、O、はある程度「手作り」とすることができ、パンニング規則に修正を加えることを許容する。有用性が認められるパンニングマトリックスは以下に示す通りであり、LとLs及びRとRs間のパンニングが定パワーとなり、他のスピーカーの対は定強度パンニングでパンする。すなわち、
【式10】
【0055】

図5は、IマトリックスとOマトリックスを並べたものであり、方位角に対してプロットしたものである(Iマトリックスは2行となっており、Oマトリックスは52行となっていて、あわせて7つの曲線がプロットされている)。これらのプロットは、(リスナーの周囲に、12点ではなく72点の方位角を量子化した角度を用いることにより)上記マトリックスより高い分解能のパンニング曲線を実質的に示している。ここに示したパンニング出力曲線は、LとLsとの間及びRとRsとの間の定パワーパンニングと他のスピーカー対との間の定強度パンニングとの混合に基づくものであることに留意しなければならない。
【0056】
実際には、マトリックスエンコーダー(又は同様のデコーダー)のパンニングテーブルは、θ=0で、LtのゲインとRtのゲインが「フリップ」する、不連続点を有する。これらのサラウンドチャンネルに位相シフトを導入することによりこの位相フリップを克服することが可能であり、その結果として、テーブル2の最後の2行が実数ではなく虚数のゲイン値となる。
【0057】
上述のとおり、入力パンニングテーブルと出力パンニングテーブルとを一緒にして入出力パンニングテーブルに結合することができる。このような、対となった項目をもち行番号でインデックス化したテーブルを、テーブル3として示す。
【表3】

【0058】
入力パンニングテーブル中に配列したミキシング規則に従い入力信号を生成したと仮定することができる。また、入力信号の創作者は、入力パンニングテーブル中のシナリオに従い多数の元の音源信号を混合することによりこれらの入力信号を生成したと仮定することもできる。例えば、元の音源信号、Source及びSource、は、入力パンニングテーブル中のシナリオ3及びシナリオ8に従い混合される場合、入力信号は以下のようになる。
【式11】
【0059】

従って、各信号(i=1...NI)は、入力パンニングテーブル中の行3及び行8で定義されるゲイン係数、Ii,3及びIi,8に従い元の音源信号、Source及びSource、を混合することにより作られる。
【0060】
理想的には、変換器は可能な限り理想に近い出力を生成する。すなわち、
【式12】
【0061】

従って、各理想出力チャンネル(o=1...NO)は、出力パンニングテーブル中の行3及び行8で定義されるゲイン係数、Oo,3及びOo,8に従い元の音源信号、Source及びSource、を混合することにより作られる。
【0062】
入力信号(上記実施例では2つの信号)の生成で用いられる元の音源信号の実際の数にかかわらず、パンニングテーブル中の各シナリオに1つの元の音源信号がある(従って、元の音源信号の実際の数は、これらの音源信号のいくつかがゼロであったとしても、NSに等しくなる)と仮定すると、計算は単純化できる。この場合式(1.6)と式(1.7)は以下のようになる。
【式13】
【0063】

図1を参照して、変換器Mの目的は、その出力とO理想デコーダーの出力との間の振幅2乗誤差を最小限にすることである。すなわち、
【式14】
【0064】

ここで、「*」演算子は、マトリックス又はベクトルの共役転置を示す。
【0065】
式(1.10)を拡張して、
【式15】
【0066】

目的は、上記関数の傾き(Gradient)をゼロにすることにより式(1.9)を最小化することである。
【式16】
【0067】

以下のよく知られたマトリックスの固有の性質を用いて、
【式17】
【0068】

式(1.12)は単純化することができ、
【式18】
【0069】

式(1.15)をゼロにすることにより、
【式19】
【0070】

式(1.16)の両側を転置すると、
【式20】
【0071】

式(1.17)に示すように、マトリックス、M、の最適値は、S×Sのみならず2つのマトリックス、I及びO、に依存する。上述のとおり、I及びOは既知であり、従って、M変換器の最適化は、S×S、すなわち音源信号の共分散、を推定することにより行うことができる。音源共分散マトリックスは以下のように表すことができる。
【式21】
【0072】

原則的に、変換器は、新しいマトリックス、M、を各サンプル期間に計算できるように、サンプル期間毎に共分散S×Sの新たな推定値を生成することができる。しかしながら、これは極わずかな誤差を生成し、M変換器を採用するシステムにより生成されたオーディオ中に好ましくない歪をもたらすことがある。このような歪を減少又は削除するために、平滑化をMの時間更新に適用することができる。これにより、ゆっくり変化し頻度の少ないS×Sの更新が行われる。
【0073】
実際には、音源共分散マトリックスを時間窓において時間平均することにより組み立てることができる。
【式22】
【0074】

簡潔な標記を用いることができ、
【式23】
【0075】

理想的には、時間平均処理は、式(1.19)のように時間的に前方及び後方を見るべきであるが、実際のシステムでは、入力信号のサンプルの将来部分にふれることはできないであろう。従って、実際のシステムでは、十分分析が可能な過去の入力サンプルを用いることに限定されるであろう。しかし、「先読み」の効果をもたらすために、システムの他の場所に時間遅れを加えることができる(図6の「時間遅れブロック」参照のこと)。
【0076】
[ISSIマトリックス及びOSSIマトリックス]
式(1.19)には、I×S×S×I項とO×S×S×I項とが含まれる。簡単な命名法として、これらのマトリックスに関してISSI及びOSSIが用いられる。2チャンネル入力から5チャンネル出力変換器として、ISSIは2×2マトリックスとなり、OSSIは5×2マトリックスとなる。その結果として、Sベクトル(非常に大きくなることがある)のサイズにかかわらず、ISSIマトリックス及びOSSIマトリックスは比較的小さい。本発明の特徴は、ISSIマトリックス及びOSSIマトリックスがSのサイズとは無関係であることだけでなく、Sについての直接的な知識が不要であることである。
【0077】
ISSIマトリックス及びOSSIマトリックスの意味の解釈はいろいろある。音源共分散(S×S)の推定を形成することができるなら、ISSI及びOSSIを以下のように考えることができる。
【式24】
【0078】

上式は、音源共分散、S×S、をISSI及びOSSIの計算のために使うことができることを明らかにしている。Mの最適値を求めるために実際の音源信号Sを知る必要はなく、音源共分散S×Sのみを知ればよいことが本発明の特徴である。
【0079】
代替的に、ISSI及びOSSIを以下のように解釈することができる。
【式25】
【0080】

従って、本発明のさらなる特徴によれば、
・ ISSIは変換器の入力信号の共分散であり、音源信号Sを知らなくても決定することができる。
【0081】
・ OSSIマトリックスは、IdealOut信号とInput信号との間の相互共分散である。ISSIマトリックスとは異なり、(a)OSSIマトリックスを計算するために音源信号S×Sの共分散又は(b)IdealOut信号の推定値(Input信号は既知)、の何れか一方を知ることが必要である。
【0082】
本発明の特徴によれば、Output信号とIdealOutput信号との差を最小化するためにM変換器を制御する(最小2乗近似のような)近似手法を以下のような方法で達成することができる。例えば、
Input信号(Input,Input,...,InputNI)をM変換器にもってゆき、その共分散(ISSIマトリックス)を計算する。共分散データを検査することにより、入力データ(元の音源信号のパワー推定)を生成するために使うべき入力パンニングテーブルの行を推定する。そして、入力パンニングテーブル及び出力パンニングテーブルを用いてIdealOutput相互共分散への入力を推定する。次いで、入力共分散及び入力理想出力相互共分散を用いて、ミックスマトリックスMを計算し、そしてこのマトリックスを入力信号に適用してOutput信号を生成する。以下にさらに説明するように、元の音源信号が相互に無相関であると見なされる場合、入力と理想出力の相互共分散の推定はパンニングテーブルを参照することなしに得ることができる。
【0083】
入力パンニングテーブル及び出力パンニングテーブルを新しいISSIテーブル及びOSSIテーブルで置き換えることができる。例えば元の入力/出力パンニングテーブルがテーブル3で示される場合は、ISSI/OSSIルックアップテーブルはテーブル4のようになる。
【表4】

【0084】
ISSI/OSSIルックアップテーブルを使って、本発明によれば、Output信号とIdealOutput信号との差を最小化するためにM変換器を制御する(最小2乗近似のような)近似手法を以下のような方法で達成することができる。例えば、
Input信号(Input,Input,...,InputNI)を取り込み、これらの共分散(ISSIマトリックス)を計算する。計算したInput共分散をISSI/OSSIルックアップテーブル中のLookupISSI値とマッチングさせることにより、入力共分散データ(元の音源信号のパワー推定)を生成するために用いることのできるISSI/OSSIルックアップテーブルの行を推定する。次いで、LookupOSSI値を用いてIdealOutputに対するInput相互共分散を計算する。そして、前記Input共分散と前記入出力相互共分散を用いて、ミックスマトリックスMを計算し、次いで、このマトリックスを入力信号に適用し出力信号を生成する。
【0085】
図6の機能図は、本発明の特徴に係るM変換器の実施例を示す。M変換器、すなわち第1の経路62、すなわち信号経路、中のミキサー又はミキシング機能(ミキサー(M))60、の中心的な作用は、任意的な時間遅れ64を経由してNI個の入力信号を受け取り、NO個の出力信号を出力する。Mミキサー60は、NO×NIマトリックスMからなり、式(1.3)に従いNI個の入力信号をNO個の出力信号にマッピングする。Mミキサー60の係数は、第2の経路又は「サイドチェーン」、すなわち3つの装置又は機能を有する制御経路出の処理により時間的に変動することができる。すなわち、
・ 入力信号は、装置又は機能66(入力の分析及び推定S×S)により分析され、音源信号Sの共分散の推定を形成する。
【0086】
・ 該音源共分散の推定値は、装置又は機能68(ISSI及びOSSIの計算)においてISSIマトリックス及びOSSIマトリックスの計算に用いられる。
【0087】
・ 該ISSIマトリックス及びOSSIマトリックスは装置又は機能70(Mの計算)で用いられる。
【0088】
サイドチェーンは、S×Sの適当な推定値を見つけ出すことを試みることで、音源信号についての推測を行うことを試みる。この処理は、適当にサイズ分けしたデータについて統計分析を行うことができるように入力オーディオの窓処理されたブロックを取り込むことにより補助することができる。加えて、S×S,ISSI,OSSI及び/又はMの計算において、この時間平滑化を適用することができる。ブロック処理及び平滑化操作の結果、ミキサーMの係数の計算がオーディオデータに遅れをとくことがあり、従って、図6の任意的時間遅れ64で示したよう該ミキサーの入力に時間遅れを持たせることは有益である。マトリックス、M、はNO個の行とNI個の列を有し、NI個の入力信号とNO個の出力信号との間で線形マッピングを定義する。現在観測中の入力信号に基づいて適切なマッピングを行うために時間に関して連続的に修正するので、マトリックス、M、は「アクティブマトリックスデコーダー」と称されることもある。
【0089】
[音源共分散S×Sの詳細]
既に定められた複数の音源位置がリスニング環境を表現するために用いられる場合、音源位置間で幻覚の(パンされた)音像を作り出すことにより任意の方角からサウンドが到着するような印象をリスナーに与えることが理論的には可能となる。音源位置の数(NS)が十分大きい場合は、幻覚の音像パンニングの必要性が回避され、音源信号、Source,...,SourceNS、が相互に非相関となると推定することができる。一般的に正しいとは言えないが、経験から、この単純化とは無関係にこのアルゴリズムがうまく行くことが示されている。本発明の特徴に係る変換器は、音源信号が相互に非相関であることを推定することにより計算される。
【0090】
この推定の最も顕著な副作用は音源共分散マトリックスが対角化することである。すなわち、
【式26】
【0091】

その結果として、ISSIマトリックス及びOSSIマトリックスの推定が、図2の例に示したようなリスナーの周りに位置する多様な方位角位置での音源信号、Source,...,SourceNS、の相対的パワーの推定に単純化される。音源共分散マトリックス(NS×NS)は、従って、式(1.24)で示したような音源パワー列ベクトル(NS×1)の観点から考えることができ、方位角位置の関数としての音源パワーを概念的に描くと、例えば、図7のように示すことができる。301におけるような強度分布のピークは、302で示された角度における高められた音源パワーを示す(図7)。
【0092】
[到着方向の推定]
図6のブロック図に示すように、入力信号の分析には音源共分散(S×S)の推定が含まれる。上述のとおり、(S×S)の推定は、入力信号の共分散を用いてパワー対方位角の分布を決定することにより得ることができる。これは、いわゆる短時間フーリエ変換、すなわち、STFTを用いることにより行うことができる。STFTの概念は図8に示されており、ここで、垂直軸は(約20kHzまでの)n個の周波数帯域又は周波数ビンに分割した周波数であり、水平軸は時間区間に分割した時間である。任意の周波数・時間セグメントF(m,n)が示されている。スロットmに続く時間スロットは、m+1及びm+2のように示される。
【0093】
時間依存フーリエ変換データは、積Δf×Δtが所定の値(しかし、固定する必要はない)になるように、最も単純な場合は一定の値になるように、隣接する周波数帯域Δfに分離し、時間間隔Δtを変化させて積分することができる。各周波数帯域に関連づけられたデータから情報を抽出することにより、パワーレベルと推定した音源方位角を推測することができる。すべての周波数帯域にわたるそのような情報の集合体により、図7の実施例に示すような音源パワー対方位角の分布の相対的に完全な推定値を得ることができる。
【0094】
図8,9,及び10はSTFT法を示す。種々の周波数帯域、Δf、が、時間区間、Δt、を変化させながら積分される。一般に、低い周波数では高い周波数よりも長い時間で積分される。STFTにより、各時間区間及び各周波数ビンで複素フーリエ係数のセットが得られる。
【0095】
STFTにより、元の時間サンプルした入力信号のベクトルをサンプルしたフーリエ係数のセットに変換される。すなわち、
【式27】
【0096】

次いで、このような時間/周波数区間に対する入力信号の共分散を決定する。これらを、入力信号の一部からのみで決定するので、これらは、部分ISSI(m,n,Am,An)と称される。
【式28】
【0097】

ここで、mは開始時間インデックスであり、Δmはその継続時間である。同様に、nは開始周波数ビンであり、Δnはその範囲である。図9はΔm=3及びΔn=2の場合を示す。
【0098】
時間/周波数ブロックのグループ分けは多くの方法で行うことができる。これは決して本発明にとって本質的ではないが、以下の方法は有用であるとが分かっている。
【0099】
・ 部分ISSI(m,n,Am,An)の計算で結合されるフーリエ変換係数の数は、Δm×Δnである。共分散の偏りのない妥当な推定値を計算するためにΔm×Δnは少なくとも10とすべきである。実際には、Δm×Δn=32のように、もっと大きなブロックを用いるのが有効であることが分かっている。
【0100】
・ 低い周波数領域では、高い周波数で効率的に低い周波数で選択的になり、時間的不鮮明さが増すという犠牲を払うことになるが、Δn=1及びΔm=32に設定することがしばしば好都合である。
【0101】
・ 高い周波数領域では、低い周波数で効率的に高い周波数で選択的になるが、時間分解能を改善するという利点があり、Δn=32及びΔm=1に設定することがしばしば好都合である。この概念は図10に示されており、人の近く帯域に近似する態様で低周波数及び高周波数間で時間/周波数分解能が変化する。
【0102】
部分ISSI共分散計算は、時間サンプルしたInput(t)信号を用いて行うことができる。しかしながら、STFT係数を使うことで、部分ISSI計算から位相情報を抽出する能力を付加するだけでなく、異なる周波数帯域で部分ISSIをより簡単に計算できるようになる。
【0103】
[マトリックスデコーダーの到着方向の分配]
各部分ISSIマトリックスからの音源方位角の抽出について、2入力チャンネル(NI=2)の場合について以下に例示する。入力信号は2つの信号成分からなると推定する。
【式29】
【0104】

【式30】
【0105】

ここで成分信号のRMSパワーは以下で得られる。
【式31】
【0106】

言い換えると、方向信号又は「指向」信号は、音源の方角θに基づく入力チャンネルにパンした音源信号(Sig(t))からなり、拡散信号は、両方の入力チャンネルに等しく広がる非相関なノイズからなる。
【0107】
共分散マトリックスは、
【式32】
【0108】

この共分散マトリックスは2つの固有値を持つ。すなわち、
【式33】
【0109】

共分散マトリックスの固有値を調べることにより、σnoise、拡散信号成分、及びσsig、指向信号成分、の強度がわかる。さらに、以下のように、適切な三角法を角θの抽出に用いることができる。
【式34】
【0110】

このようにして、各部分ISSIマトリックスを分析し、図11に示すように、指向信号成分、拡散信号成分、及び音源方位角方向を抽出する。次いで、部分ISSIの完全なセットからのデータの集合体を結合し、図12に示すような1つの合成した分布を形成する。実際には、図13に示すように、指向データは拡散分布データとは別にしておくことが好ましい。各部分ISSIの計算により自らの指向分布データと拡散分布データを生み出し、これらを線形加算することにより最終分布ができるので、図14の信号フローにおいて、抽出した信号の統計量から前記分布を形成するのは、線形演算である。さらに、この最終分布を用いて、線形演算処理を行うことにより、ISSI及びOSSIを作り出す。これらは線形演算なので、図15に示すように、計算を簡単化するために再構成することができる。
【0111】
[指向及び拡散ISSIマトリックス及び指向及び拡散OSSIマトリックスの計算]
最終ISSI(FinalISSI)及び最終OSSI(FinalOSSI)は以下のように計算する。
【式35】
【0112】

ここで、部分ISSIマトリックスの分析は、各成分で変数を計算するために用いられる。ISSIマトリックス及びOSSIマトリックスの全指向成分は、
【式36】
【0113】

ここで、pについての総和は、すべてのそれぞれの部分ISSIマトリックス及び部分OSSIマトリックスのすべてにわたる総和を意味する。
【0114】
各部分ISSIマトリックスを分析することにより、信号パワー強度σsig、拡散パワー強度σnoise、及び音源方位角θが得られる。各部分ISSIマトリックスは以下のように書き直すことができる。
【式37】
【0115】

ここで、上記式の第1項は拡散成分、そして第2項は指向成分である。以下の点に留意することが重要である。
【0116】
・ 拡散成分、ISSIdiff.p、はスカラーと単位マトリックスの積である。拡散成分は方位角θと無関係である。
【0117】
・ 指向成分、ISSIsteered.p、はスカラーと、方位角θにのみ依存する要素を持つマトリックスとの積である。後者は、直近の近傍方位角によりインデックスが付加された、あらかじめ計算済みのルックアップテーブル中に都合よく格納される。
【0118】
[指向(方向)成分]
指向項は以下のように記述される。
【式38】
【0119】

ここで、現実施例では、
【式39】
【0120】

及び
【式40】
【0121】

k,θの例は、
【式41】
【0122】

同様にθk,θの例は、
【式42】
【0123】

[拡散成分]
全拡散ISSI(DiffuseISSI)及び全拡散OSSI(DiffuseOSSI)は以下のように記述することができる。
【式43】
【0124】

ここで、DisiredDiffuseISSI及びDisiredDiffuseOSSIは、一様に拡がる指向信号のセットと同じ方法で拡散入力信号をデコードするために設計したあらかじめ計算済みのマトリックスである。実際には、DisiredDiffuseISSIマトリックス及びDisiredDiffuseOSSIマトリックスを、例えば、指向信号の主観的音量に応じての場合のような、主観的評価に基づいて修正することが好都合であることがわかっている。
【0125】
実施例として、DisiredDiffuseISSI及びDisiredDiffuseOSSIの1つの選択肢は以下のようになる。
【式44】
【0126】

[ミキシングマトリックス、M、の計算]
デコーダーにおける最終ステップはミックスマトリックスMの係数を計算することである。理論的には、Mは、等式の最小2乗平均解法となる。すなわち、
【式45】
【0127】

実際にはISSIマトリックスは常に正定値である。従って、このことによりMを効率的に計算するための2つの可能な方法が生み出される。
【0128】
・ 正定値なので、ISSIは可逆である。従って、式、M=ISSI×OSSI−1によりMを計算することができる。
【0129】
・ ISSIは正定値なので、勾配降下法を用いて、Mを繰り返し計算することは、極めて簡単である。勾配降下法は以下のようになる。
【式46】
【0130】

ここで、δは、勾配降下アルゴリズムの収束率を調整するために選択する。δの値は、Mの更新を遅くするために意図的に小さく選ぶことができ、従って、ミックス係数中の時間変動を平滑化し、急激に係数を変化させた場合に結果として生じるひずみアーティファクトを回避することができる。
【0131】
[変換器の複数帯域版]
先の方法は、出力信号を作るために入力信号を処理するのに、一般に、1つのマトリックス、M、を用いることに言及している。これは、入力信号のすべての周波数成分が同じ方法で処理されるので広帯域マトリックスのように称することができる。しかし、複数帯域版は、異なる周波数帯域に対して、前記同じマトリックス演算とは別の演算をデコーダーが適用することを可能にする。
【0132】
一般に、すべての複数帯域技法は以下の重要な特徴を見せることがある。
【0133】
・ 入力信号は、複数の帯域、P、に分割することができ、指向情報を帯域中で推定又は計算することができる。数量Pは、指向情報を推定又は計算する帯域の数を意味する。
【0134】
・ 入力から出力への処理演算は、広帯域ミックス、M、ではなく、周波数について変化させ、それぞれ異なる周波数に適用する個々のミックス演算、B、の数に概ね等しくなる。Bは、出力信号を処理するときに用いられる周波数帯域に数を意味する。
【0135】
複数帯域デコーダーは、入力信号を多くの個々の帯域に分割し、図16に示すような方法で各帯域に広帯域マトリックスデコーダーを用いることにより実行することができる。
【0136】
この実施例では、入力信号は3つの周波数帯域に分割されている。「分割」処理は、ラウドスピーカクロスオーバーに用いるときに、フィルター又はフィルタリング処理(クロスオーバー)160及び162を用いることにより実行することができる。クロスオーバー160は第1の入力信号Input1を受け取り、クロスオーバー162は第2の入力信号Input2を受け取る。2つの入力から導き出された低周波数信号、中周波数信号、及び高周波数信号は、3つの広帯域のマトリックスデコーダー又は、それぞれ、マトリックスデコーダー機能(広帯域マトリックスデコーダー)164、166、及び168に送られ、この3つのデコーダーからの出力は加算結合器又は加算結合機能(それぞれ、「プラス」記号で示されている)再加算されて、最終的な5つの出力チャンネル(L,C, R1Ls, Rs)となる。
【0137】
3つの広帯域のマトリックスデコーダー164、166、及び168の各々は、異なる周波数帯域で動作し、それぞれの周波数帯域内でパンしたオーディオの支配的な方向を独自に決定することができる。結果として、複数帯域デコーダーは、異なる周波数帯域で異なる方法でデコーディングすることでより良い結果を得ることができる。例えば、複数帯域デコーダーは、チューバやピッコロのマトリックスエンコードしたレコーディングを、2つの楽器を異なる出力チャンネルに指向させることで、デコードすることができ、これにより、これらの異なる周波数範囲の利点を生かすことができる。
【0138】
図16の実施例において、3つの広帯域デコーダーは3つの周波数帯域で効果的に分析を行い、続いて、同じ3つの周波数帯域で出力オーディオの処理を行う。従ってこの実施例では、P=B=3となる。
【0139】
本発明の特徴は、P>Bのときに動作する変換器の能力である。すなわち、指向情報の(P)のチャンネルが導出され(部分ISSIの統計的抽出)、出力処理をより広い周波数帯域のより少ない数(B)に適用されるとき、本発明の特徴によれば、各出力処理帯域に対して適切なミックスマトリックスを定義することにより、より大きなセットを小さいセットに併合する方法を定める。この状況を図17の実施例に示した。各出力処理帯域(Hb:b=1...B)は、図中のグループ化したブレースで示したような入力分析帯域のそれぞれのセットと重複している。
【0140】
P個の分析帯域での動作とそれに続くB個の処理帯域でのオーディオの処理のために、次に説明するようにP個の分析データセットを計算することにより、変換器の複数帯域版が始まる。これは図16の上半分と比べることができる。分析データは、1つの分析帯域に対するデータのセットを表す。各帯域、b=1...B、について、分析データは以下のように結合される(式(1.35)、(1.36)、(1.43)、及び(1.46)と比較すること)。
【式47】
【0141】

ここで、
【式48】
【0142】

そして、
【式49】
【0143】

最後に、
【式50】
【0144】

Mマトリックス及びFinalISSlマトリックスとFinalOSSIマトリックスが、各処理帯域(b=1...B)出計算され、部分ISSI分析データ(ISSIS.p,OSSIS.p,及びσp)がBandWeightb.pで重み付けがなされることを除いて、上記計算は、広帯域デコーダーの場合と同じである。重み付けファクターは、各出力処理帯域が重複分析帯域からの分析データだけに影響されるように用いられる。
【0145】
各出力処理帯域(b)は、少数の入力分析帯域と重複することができる。従って、多くのBandWeightb,p重み付けはゼロにすることができる。まばらなBandWeightsデータは、式(1.50)及び(1.51)で示した加算演算で必要な項数を減らすために用いることができる。
【0146】
Mbマトリクスを(b=1...Bについて)一度計算すると、出力信号は種々の相異なる技法で計算することができる。すなわち、
・ 入力信号はB個の帯域に分割することができ、各帯域(b)をそれぞれのマトリックスMbで処理しNO個の出力チャンネルを生成することができる。この場合B×NOの中間信号が生成される。NO個の出力チャンネルのB個のセットは、次いで、相互に加算されてNO個の広帯域出力信号となることができる。この技術は図18に示したものと非常に似ている。
【0147】
入力信号は周波数領域で混合される。この場合、ミキシング係数は、周波数の平滑化関数として変化させることができる。例えば、中間FFTビンのミキシング係数は、FFTビンが処理帯域b及びb+1の中心周波数間にある周波数に対応すると仮定して、マトリックスMb及びMb+1の係数間を補間することにより計算することができる。
【0148】
[実施形態]
本発明は、ハードウェア又はソフトウェア又は両方を組み合わせたもの(例えば、プログラマブルロジックアレー)で実施することができる。特に記載がない限り、本発明の一部として含まれているアルゴリズムは本質的に、特定のコンピュータや他の装置と関連付けられるものではない。特に、種々の汎用機をこの記載に従って書かれたプログラムと共に用いてもよい、あるいは、要求の方法を実行するために、より特化した装置(例えば、集積回路)を構成することが便利かもしれない。このように、本発明は、それぞれ少なくとも1つのプロセッサ、少なくとも1つの記憶システム(揮発性及び非揮発性メモリー及び/又は記憶素子を含む)、少なくとも1つの入力装置又は入力ポート、及び少なくとも1つの出力装置又は出力ポートを具備する、1つ以上のプログラマブルコンピュータシステム上で実行される1つ以上のコンピュータプログラムにより実現することができる。ここに記載した機能を遂行し、出力情報を出力させるために入力データにプログラムコードを適用する。この出力情報は、公知の方法で、1以上の出力装置に適用される。
【0149】
このようなプログラムの各々は、コンピュータシステムとの通信のために、必要とされるどんなコンピュータ言語(機械語、アセンブリ、又は、高級な、手続言語、論理型言語、又は、オブジェクト指向言語を含む)ででも実現することができる。いずれにせよ、言語はコンパイル言語であってもインタープリタ言語であってもよい。
【0150】
このようなコンピュータプログラムの各々は、ここに記載の手順を実行するために、コンピュータにより記憶媒体又は記憶装置を読み込んだとき、コンピュータを設定し動作させるための、汎用プログラマブルコンピュータ又は専用プログラマブルコンピュータにより、読み込み可能な記憶媒体又は記憶装置(例えば、半導体メモリー又は半導体媒体、又は磁気媒体又は光学媒体)に保存又はダウンロードすることができる。本発明のシステムはまた、コンピュータプログラムにより構成されるコンピュータにより読み込み可能な記憶媒体として実行することを考えることもできる。ここで、この記憶媒体は、コンピュータシステムを、ここに記載した機能を実行するために、具体的にあらかじめ定めた方法で動作させる。
【0151】
本発明の多くの実施の形態について記載した。しかしながら、本発明の精神と技術範囲を逸脱することなく多くの修正を加えることができることは明らかであろう。例えば、ここに記載したステップのいくつかの順序は独立であり、従って、記載とは異なる順序で実行することができる。

【特許請求の範囲】
【請求項1】
複数の(NI個の)オーディオ入力信号(Input(t)...InputNI(t))にダイナミック変動変換マトリックス(M)を適用して、第1のフォーマットから第2のフォーマットに再フォーマットする方法であって、前記複数のオーディオ入力信号は、エンコーディングマトリックス(I)に、それぞれ自分自身についての情報と関連する複数の概念的音源信号(Source(t)...SourceNS(t))を適用することにより導き出されたものと推定され、前記エンコーディングマトリックスは、各概念的音源信号を関連する概念的情報に従い処理する第1の規則に従い概念的音源信号を処理し、前記変換マトリックスは、それにより生成される複数の(NO個の)出力信号(Output(t)...OutputNO(t))と、理想デコーディングマトリックス(O)に前記概念的音源信号を適用することにより導き出されたと推定される複数の(NO個の)概念的理想出力信号(IdealOut(t)...IdealOutNO(t))との間の差を少なくするように制御され、前記デコーディングマトリックスは、各概念的音源信号を関連する概念的情報に従い処理する第2の規則に従い概念的音源信号を処理し、
複数の周波数及び複数の時間セグメント中の各々のオーディオ入力信号に応答して、1以上の方向信号成分の方角と強度、及び拡散した方向性のない信号成分の強度に寄与する情報を取得するステップと、
前記第1の規則及び前記第2の規則に基づき前記変換マトリックスを計算するステップであって、該計算には、(a)(i)前記複数の周波数及び前記複数の時間セグメントの少なくとも1つにおけるオーディオ入力信号の共分散マトリックス、及び(ii)前記複数の周波数及び時間セグメントの少なくとも同じ1つにあるオーディオ入力信号と概念的理想出力信号との相互共分散マトリックスを推定するステップと、(b)前記複数の周波数及び時間セグメント中に、(i)支配的な成分の前記方角と強度、及び(ii)拡散した方向性のない信号成分の前記強度を結合するステップが含まれることを特徴とするステップと、
出力信号を生成するために前記オーディオ入力信号を前記変換マトリックスに適用するステップと、
を具備することを特徴とする方法。
【請求項2】
複数の(NI個の)オーディオ入力信号(Input(t)...InputNI(t))にダイナミック変動変換マトリックス(M)を適用して、第1のフォーマットから第2のフォーマットに再フォーマットする方法であって、前記複数のオーディオ入力信号は、エンコーディングマトリックス(I)に、それぞれ相互に無関係であると推定されそしてそれぞれ自分自身についての情報と関連する複数の概念的音源信号(Source(t)...SourceNS(t))を適用することにより導き出されたものと推定され、前記エンコーディングマトリックスは、各概念的音源信号を関連する概念的情報に従い処理する第1の規則に従い概念的音源信号を処理し、前記変換マトリックスは、それにより生成される複数の(NO個の)出力信号(Output(t)...OutputNO(t))と、理想デコーディングマトリックス(O)に前記概念的音源信号を適用することにより導き出されたと推定される複数の(NO個の)概念的理想出力信号(IdealOut(t)...IdealOutNO(t))との間の差を少なくするように制御され、前記デコーディングマトリックスは、各概念的音源信号を関連する概念的情報に従い処理する第2の規則に従い概念的音源信号を処理し、
複数の周波数及び複数の時間セグメント中の各々のオーディオ入力信号に応答して、1以上の方向信号成分の方角と強度、及び拡散した方向性のない信号成分の強度に寄与する情報を取得するステップと、
前記変換マトリックスMを計算するステップであって、該計算には、(a)前記複数の周波数及び時間セグメント中に、(i)支配的な成分の前記方角と強度、及び(ii)拡散した方向性のない信号成分の前記強度を結合するステップであって、該結合するステップにより得られたものが前記音源信号の共分散マトリックスを推定することを特徴とするステップと、(b)ISSI=I×[cov(Source)]×I、OSSI=0×[cov(Source)]及び、(c)M=OSSI×ISSIを計算するステップと、が含まれることを特徴とするステップと、
出力信号を生成するために前記オーディオ入力信号を前記変換マトリックスに適用するステップと、
を具備することを特徴とする方法。
【請求項3】
前記概念的情報はインデックスを具備し、特定のインデックスと関連付けた第1の規則に従う処理は、同じ前記インデックスと関連付けた第2の規則に従う処理とペアを組むことを特徴とする、請求項1又は請求項2に記載の方法。
【請求項4】
前記概念的情報は概念的方角情報であることを特徴とする、請求項3に記載の方法。
【請求項5】
前記概念的情報は概念的3次元方角情報であることを特徴とする、請求項4に記載の方法。
【請求項6】
前記概念的3次元方角情報は、概念的なリスニング位置に関する概念的な方位角と高さとの関係を具備することを特徴とする、請求項5に記載の方法。
【請求項7】
前記概念的方角情報は、概念的2次元方角情報であることを特徴とする請求項4に記載の方法。
【請求項8】
前記概念的2次元方角情報は、概念的なリスニング位置に関する概念的な方位角との関係を具備することを特徴とする請求項7に記載の方法。
【請求項9】
前記第1の規則は、入力パンニング規則であり、前記第2の規則は、出力パンニング規則であることを特徴とする請求項1乃至請求項8の何れか1項に記載の方法。
【請求項10】
前記取得するステップは、前記複数の周波数セグメントと複数の時間セグメントの各々におけるオーディオ入力信号の共分散マトリックスを計算するステップを具備することを特徴とする請求項1又は請求項2に記載の方法。
【請求項11】
前記1以上の支配的な信号成分の方角及び強度と、各周波数セグメント及び各時間セグメントの拡散した方向性のない信号成分の強度は、前記共分散マトリックスの計算結果に基づいて推定することを特徴とする請求項10に記載の方法 。
【請求項12】
各周波数セグメント及び各時間セグメントの拡散した方向性のない信号成分の推定は、前記共分散マトリックスにおける最小固有値の値から形成することを特徴とする請求項11に記載の方法 。
【請求項13】
前記変換マトリックスの特性を、前記共分散マトリックス及び相互共分散マトリックスの関数として計算することを特徴とする請求項1又は請求項1に従属する請求項3乃至請求項12の何れか1項に記載の方法 。
【請求項14】
下式に示すように、共分散マトリックスの逆演算を右から相互共分散マトリックスに作用させることにより、前記変換マトリックス(M)の要素を取得することを特徴とする請求項13に記載の方法、
M=Cov([IdealOutput],[Input]){Cov([Input],[Input])}-1
【請求項15】
前記複数の概念的音源信号は、相互に相関関係がないとみなすことができ、これにより前記概念的音源信号の共分散マトリックスの計算がMの計算に内在し、前記概念的音源信号の共分散マトリックスを対角化、従って、計算が単純になることを特徴とする請求項14に記載の方法。
【請求項16】
前記デコーダーマトリックス(M)を、最急降下法で計算することをことを特徴とする請求項14又は請求項15に記載の方法。
【請求項17】
最急降下法による前記方法は、前の時間区間のMの先の推定値に基づき変換マトリックスの推定を繰り返し計算する勾配降下法により計算することを特徴とする請求項16に記載の方法。
【請求項18】
前記変換マトリックスは、可変係数を有する可変マトリックス、又は、固定係数と可変出力を有する可変マトリックスであり、該変換マトリックスは、該可変係数を変化させることにより又は可変出力を変化させることにより制御されることを特徴とする請求項1乃至請求項17の何れか1項に記載の方法。
【請求項19】
前記第1の規則と前記第2の規則は、第1のルックアップテーブル及び第2のルックアップテーブルとして実施され、テーブル入力は共通のインデックスによりペアを構成することを特徴とする請求項3乃至請求項18の何れか1項に記載の方法。
【請求項20】
前記デコーダーマトリックス(M)は、周波数に依存するデコーダーマトリックス(MB)の加重和、すなわちM=Σ、であることを特徴とする請求項1乃至請求項19の何れか1項に記載の方法。
【請求項21】
請求項1乃至請求項20の何れか1項に記載の方法を実行するために作られた装置。
【請求項22】
請求項1乃至請求項20の何れか1項に記載の方法を実行するために作られたコンピュータプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate


【公表番号】特表2012−500532(P2012−500532A)
【公表日】平成24年1月5日(2012.1.5)
【国際特許分類】
【出願番号】特願2011−523160(P2011−523160)
【出願日】平成21年8月13日(2009.8.13)
【国際出願番号】PCT/US2009/053664
【国際公開番号】WO2010/019750
【国際公開日】平成22年2月18日(2010.2.18)
【出願人】(591102637)ドルビー・ラボラトリーズ・ライセンシング・コーポレーション (111)
【氏名又は名称原語表記】DOLBY LABORATORIES LICENSING CORPORATION
【Fターム(参考)】