説明

3次元パンニング装置

【課題】音響信号を3次元的にパンニングすることができる3次元パンニング装置を提供する。
【解決手段】パンニング前音響信号s(t)を読み込むパンニング前音響信号読み込み手段11と、パンニング後音響信号q(t)を出力するパンニング後音響信号出力手段12と、パンニング前音響信号s(t)を周波数領域パンニング前音響信号S(ω)に変換する変換手段13と、定位位置情報を生成する定位位置情報生成手段14と、パンニング後音響信号出力手段12の配置情報を記憶する配置情報記憶手段15と、定位位置情報、および配置情報に基づいて周波数領域パンニング前音響信号S(ω)をパンニングさせた周波数領域パンニング後音響信号Q(ω)を生成する周波数領域パンニング後音響信号生成手段16と、周波数領域パンニング後音響信号Q(ω)をパンニング後音響信号q(t)に逆変換する逆変換手段17とを含む。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、3次元パンニング装置に係り、特に、スピーカの配置に係わらず音響信号を3次元的にパンニングすることの可能な3次元パンニング装置に関する。
【背景技術】
【0002】
2チャンネルオーディオシステム、または5.1サラウンドシステムのようなオーディオ再生装置にあっては、ミクシングコンソールのパンポット等により各スピーカが出力する音源の音量を変更して、当該音源の音像の定位や移動を調整していた。
【0003】
しかし、上記オーディオ再生装置にあっては、すべてのスピーカを受音点、即ち聴取者を中心とする一定半径の円周上に配置する必要があるため、劇場のような直方形の再生場で適用することは不可能であった。
【0004】
そこで、劇場のような直方形の再生場の周囲に沿って複数のスピーカを配置し、1つのスピーカの出力を他のスピーカの出力に対して遅延させることにより、音像位置を移動させることが可能な音声処理装置が提案されている(例えば、特許文献1参照)。
【0005】
しかし、上記の音声処理装置にあっては、スピーカを同一水平面内に配置する必要があるため、音像をスピーカ配置面内で2次元的にパンニングすることは可能であるものの、音像を3次元的にパンニングすることは不可能であった。
【0006】
そこで、3次元的なパンニングを可能とするために、スピーカを3次元的に配置し、ベクトル基準振幅パンニング(Vector Base Amplitude Panning)法を適用して音像を3次元的にパンニングすることが可能な3次元パンニング装置も既に提案されている(例えば、非特許文献1参照)。
【0007】
また、FIRフィルタを適用することにより、同一平面に配置された2つのスピーカであっても音像を水平方向だけでなく上下方向にパンニング可能な3次元パンニング装置も提案されている(例えば、特許文献2参照)。
【特許文献1】米国特許公開公報第20020048380号([0026]、図3)
【特許文献2】特許第3177714号([0005]、図1)
【非特許文献1】“Virtual Sound Source Positioning Using Vector Base Amplitude Panning” VILLE PULKKI, J. Audio Eng. Soc. Vol.45, No,6, 1997 June
【発明の開示】
【発明が解決しようとする課題】
【0008】
しかしながら、上記した従来の3次元パンニング装置は、スピーカを受音点、即ち、聴取者の耳の位置を中心とする一定半径の球面上に設置する必要があるが、直方体に近い再生場で、受音点を中心とする一定半径の球面上にスピーカを配置すると、聴取可能範囲が狭小化してしまうという課題があった。
【0009】
本発明は、従来の課題を解決するためになされたものであって、スピーカの配置に係わらず音響信号を3次元的にパンニングすることの可能な3次元パンニング装置を提供することを目的とする。
【課題を解決するための手段】
【0010】
本発明の3次元パンニング装置は、時間関数であるパンニング前音響信号を読み込むパンニング前音響信号読み込み手段と、時間関数であるパンニング後音響信号を出力するパンニング後音響信号出力手段と、前記パンニング前音響信号を周波数領域パンニング前音響信号に変換する変換手段と、前記パンニング前音響信号に付加する定位位置情報を生成する定位位置情報生成手段と、前記パンニング後音響信号出力手段の配置情報を記憶する配置情報記憶手段と、前記定位位置情報、および前記配置情報に基づいて前記周波数領域パンニング前音響信号をパンニングさせた周波数領域パンニング後音響信号を生成する周波数領域パンニング後音響信号生成手段と、前記周波数領域パンニング後音響信号を時間関数であるパンニング後音響信号に逆変換する逆変換手段とを含む構成を有している。
【0011】
この構成により、音響信号を3次元的にパンニングすることができることとなる。
【0012】
本発明の3次元パンニング装置は、前記周波数領域パンニング後音響信号生成手段が、前記パンニング後音響信号出力手段から前記パンニング後音響信号を放射したときの受音点におけるパンニング後音響物理量ベクトルを、音源から前記パンニング前音響信号を放射したときの前記受音点におけるパンニング前音響物理量ベクトルと等しくする前記周波数領域パンニング後音響信号を生成するものである構成を有している。
【0013】
この構成により、スピーカの配置に係わらず音響信号を3次元的にパンニングすることができることとなる。
【0014】
本発明の3次元パンニング装置は、前記周波数領域パンニング後音響信号生成手段が、前記パンニング後音響信号出力手段から前記パンニング後音響信号を放射したときの受音領域におけるパンニング後音響物理量ベクトルを、音源から前記パンニング前音響信号を放射したときの前記受音領域におけるパンニング前音響物理量ベクトルと等しくする前記周波数領域パンニング後音響信号を生成するものである構成を有している。
【0015】
この構成により、多数の聴取者を対象として音像を定位させることができることとなる。
【発明の効果】
【0016】
本発明は、定位位置情報、および配置情報に基づいて周波数領域パンニング前音響信号をパンニングさせた周波数領域パンニング後音響信号を生成する周波数領域パンニング後音響信号生成手段を設けることにより、スピーカの配置に係わらず音響信号を3次元的にパンニングすることができるという効果を有する3次元パンニング装置を提供することができるものである。
【発明を実施するための最良の形態】
【0017】
以下、本発明に係る3次元パンニング装置の実施形態について、図面を用いて説明する。
【0018】
本明細書において、音響物理量ベクトルとは、点音源から放射された音響信号を受音する受音点における音響的な物理量を示すベクトル、即ち、音圧または粒子速度の少なくとも一方を成分とするベクトル、あるいは、粒子速度ベクトルにスカラ量である音圧を乗じてある時間区間で積分した音響インテンシティベクトルを意味するものとする。
【0019】
また、以下の説明において、英太字はベクトルあるいは行列を示し、英細字はスカラ量を示す。
【0020】
(第1の実施の形態)
本発明に係る3次元パンニング装置1の実施形態は、図1のブロック図に示すように、時間関数であるパンニング前音響信号s(t)を読み込むパンニング前音響信号読み込み手段11と、時間関数であるパンニング後音響信号q(t)を出力するパンニング後音響信号出力手段12と、パンニング前音響信号s(t)を周波数領域パンニング前音響信号S(ω)に変換する変換手段13と、パンニング前音響信号s(t)に付加する定位位置情報を生成する定位位置情報生成手段14と、パンニング後音響信号出力手段12の配置情報を記憶する配置情報記憶手段15と、定位位置情報、および配置情報に基づいて周波数領域パンニング前音響信号S(ω)をパンニングさせた周波数領域パンニング後音響信号Q(ω)を生成する周波数領域パンニング後音響信号生成手段16と、周波数領域パンニング後音響信号Q(ω)を時間関数であるパンニング後音響信号q(t)に逆変換する逆変換手段17とを含む。
【0021】
そして、本発明に係る3次元パンニング装置1は、チャンネル数Mのパンニング後音響信号出力手段12からパンニング後音響信号qを放射したときの受音点におけるパンニング後音響物理量ベクトルPが、チャンネル数Nの音源のそれぞれからパンニング前音響信号sを放射したときの受音点kにおけるパンニング前音響物理量ベクトルPと等しくなるようにパンニング後音響信号qを生成する。
【0022】
まず、点音源が1つ、受音点が1つの場合における受音点の音圧について説明する。
【0023】
3次元空間の原点に配置された点音源から放射された音響信号の原点から半径rの球面上の音圧p(t,r)は[数1]の波動方程式により決定される。
【数1】

【0024】
よって、点音源から放射された音響信号をs(t)とすれば、原点から半径rの球面上の音圧p(t,r)は[数2]によって表される。
【数2】

[数2]の周波数領域表現は、[数3]となる。
【数3】

【0025】
上式は、1つの点音源から放射された周波数領域パンニング前音響信号S(ω)の1つの受音点における音圧は、点音源から受音点までの距離に反比例し、点音源から受音点までの音響信号の伝播時間遅延し、点音源から受音点までの距離の関数である音圧伝達関数G(ω,r)と周波数領域パンニング前音響信号S(ω)との積で定まることを示している。
【0026】
点音源から受音点までの距離および音響信号の伝播時間は、任意の座標系における点音源座標および受音点座標を定めれば一義的に定まるので、音圧伝達関数も任意の座標系における点音源座標および受音点座標を定めれば一義的に定まることとなる。
【0027】
3次元空間の原点に配置された点音源から放射された音響信号の原点から半径rの球面上の粒子速度をv(r,t)とすれば、半径rの球面上の運動方程式は[数4]で表される。
【数4】

[数4]を解いて、粒子速度v(r)は[数5]により表すことができる。
【数5】

[数5]の周波数領域表現は[数6]となる。
【数6】

【0028】
従って、受音点kにおける音圧p(t,r)および粒子速度v(t,r)の双方を成分とする音響物理量ベクトルPは[数7]によって定義することができる。
【数7】

【0029】
音響物理量ベクトルPは、音圧p(t,r)または粒子速度v(t,r)の一方だけを成分としてもよい。
【0030】
さらに、音響物理量ベクトルPは音圧p(t,r)と粒子速度v(t,r)の積である瞬時音響インテンシティII(t,r)、あるいは、瞬時音響インテンシティのある時間区間の積分値である音響インテンシティI(t,r)を成分とするものであってもよい。
【0031】
ここで、瞬時音響インテンシティII(t,r)は[数8]で、音響インテンシティI(t,r)は[数9]で定義される。
【数8】

【数9】

【0032】
なお、以下の実施形態においては、音響物理量ベクトルPは音圧p(t,r)だけを成分とする場合について説明する。
【0033】
上記においては、再生音場を極座標で表しているが、以下では再生音場を相互に直交するX軸、Y軸およびZ軸を有する直交座標で表す。
【0034】
3次元再生音場内のパンニング前音響信号s(t)の定位位置である仮想の音源位置をξ(n)=[ξ(n)、ξ(n)、ξ(n)(nは1からNまでの整数であるとする。)、受音点の位置をr=[r、r、rとすれば、N個の音源位置ξ(n)から放射された周波数領域パンニング前音響信号S(ω)の受音点位置rにおけるパンニング前音圧ベクトルP=[は、[数10]で表される。
【数10】

【0035】
ここで、音源位置ξ(n)を固定値とすればパンニング前音響信号s(t)を音源位置ξ(n)に定位させることができ、音源位置ξ(n)を時間関数値とすればパンニング前音響信号s(t)を所定の方向および速さで移動させることができる。
【0036】
なお、以下では簡単のためにパンニング前音響信号s(t)は1つ、即ち、N=1として説明する。
【0037】
また、予め定められたM個の配置位置ζ(1)、ζ(2)・・・ζ(M)に配置されたスピーカからパンニング後音響信号q(t)、q(t)・・・q(t)を出力したときの受音点位置rにおけるパンニング後音圧ベクトルP=[は、[数11]で表される。
【数11】

【0038】
ここで、次に示す[数12]が成立するように周波数領域パンニング後音響信号Q(ω)、Q(ω)・・・Q(ω)を決定し、時間領域に逆変換してスピーカから出力すれば、パンニング前音響信号s(t)をパンニングしたパンニング後音響信号q(t)、q(t)・・・q(t)を予め定められた配置位置ζ(1)、ζ(2)・・・ζ(M)に配置されたスピーカにより再生することが可能となる。ただし、[数10]において、N=1としている。
【数12】

【0039】
そして、[数12]が成立するようにパンニング後音響信号q(t)、q(t)・・・q(t)を決定するためには、[数13]で表されるパンニング前音圧ベクトルPとパンニング後音圧ベクトルPの二乗誤差Eが最少となるq(t)、q(t)・・・q(t)を求めればよい。
【数13】

【0040】
[数13]に[数10]および[数11]を代入して展開すると[数14]となる。
【数14】

ここで、[数15]を使用して[数14]を書き換えると、[数16]となる。
【数15】

【数16】

【0041】
二乗誤差Eを最小とするQ(ω)は、EをQ(ω)について偏微分して零とおいた[数17]により決定することができる。
【数17】

よって、二乗誤差Eを最小とするQ(ω)は[数18]となる。
【数18】

【0042】
図2は、本発明に係る3次元パンニング装置1のハードウエア構成を示すブロック図であって、パンニング前音響信号を読み込むアナログ・デジタル(A/D)変換器21と、パンニング後音響信号を出力するデジタル・アナログ(D/A)変換器22と、3次元パンニング処理を実行するCPU23と、3次元パンニングプログラムを記憶するメモリ24と、3次元パンニング装置を操作するための周辺機器が接続されるインターフェイス(I/F)25とがバス20に接続された構成を有する。
【0043】
I/F25には、表示パネル26と、キーボード27と、マウス28とが接続される。なお、表示パネル26、キーボード27、およびマウス28に代えて、操作パネルを適用することも可能である。
【0044】
即ち、本発明の3次元パンニング装置は、コンピュータに3次元パンニングプログラムをインストールすることにより構成される。
【0045】
次に、本発明の3次元パンニング装置の動作を説明する。
【0046】
図3は、メモリ24にインストールされる3次元パンニングプログラムのフローチャートであって、CPU23は、まずA/D変換器21を介して、パンニング前音響信号s(t)を読み込む(ステップS31)。
【0047】
CPU23は、パンニング前音響信号s(t)をフーリエ変換して周波数領域パンニング前音響信号S(ω)を算出する(ステップS32)。
【0048】
次に、CPU23は、パンニングルーチンを実行して(ステップS33)、周波数領域パンニング後音響信号Q(ω)、Q(ω)・・・Q(ω)を算出するが、詳細は以下に説明する。
【0049】
さらに、CPU23は、周波数領域パンニング後音響信号Q(ω)、Q(ω)・・・Q(ω)を逆フーリエ変換してパンニング後音響信号q(t)、q(t)・・・q(t)を算出し(ステップS34)、D/A変換器22を介してパンニング後音響信号q(t)、q(t)・・・q(t)(ベクトル表示q(t))を出力(ステップS35)してこのルーチンを終了する。
【0050】
図4は、図3の3次元パンニングプログラムのステップS33で実行されるパンニングルーチンのフローチャートである。ここで、3次元再生音場内のパンニング前音響信号s(t)の定位位置である音源位置がξ=[ξ、ξ、ξ、受音点位置がr=[r、r、rで表されるものとする。なお、音源の個数はN個であるものとする。
【0051】
まず、CPU23は、受音点位置r=[r、r、rを読み込む(ステップS331)。
【0052】
次に、CPU23は、音源位置ξ=[ξ、ξ、ξの情報を生成する(ステップS332)。例えば、予め定められた始点と終点の間を音源が移動するような軌跡を算出するとよい。なお、外部から音源位置の情報を入力することも可能である。
【0053】
次に、CPU23は、[数15]に示した係数を算出し(ステップS333)、さらに[数16]に示したベクトルhおよび行列Hを算出し(ステップS334)、[数18]より周波数領域パンニング後音響信号Q(ω)を算出して(ステップS335)、このルーチンを終了する。
【0054】
ここで、図5に示すように、2つのスピーカから出力される音響信号により音像を定位させる場合を想定する。
【0055】
受音点Jは、X−Y座標の原点であり、左スピーカSLは受音点Jからd離れた位置にY軸左方30度の角度で配置され、右スピーカSRは受音点Jからd離れた位置にY軸右方30度の角度で配置されている。そして、音源SSは受音点JからD離れた位置にY軸に対してθの角度で存在するものとする。なお、θはY軸上で0度であり、Y軸右方では正の値、Y軸左方では負の値を取るものとする。
【0056】
すると、[数15]の係数は[数19]となる。
【数19】

【0057】
また、[数16]は[数20]となる。
【数20】

【0058】
よって、[数18]を使用して左スピーカSLの出力Q(ω)および右スピーカSRの出力Q(ω)は[数21]により算出される。
【数21】

【0059】
ここで、d=Dとすれば、周知の“tangent law”によるパンニングと一致し、従って、非特許文献1に開示されているベクトル基準振幅パンニング(Vector Base Amplitude Panning)法によるパンニングとも一致する。
【0060】
以上説明したように、本発明に係る3次元パンニング装置は、d≠Dの場合も取り扱うことが可能であり、従来の“tangent law”およびベクトル基準振幅パンニング法を拡張したパンニング法を提供できるものである。
【0061】
(第2の実施の形態)
第1の実施の形態は1つの受音点を対象としていたが、第2の実施の形態では1つの再生領域Vを対象とする。
【0062】
即ち、第2の実施の形態においては、パンニング前音圧ベクトルPとパンニング後音圧ベクトルPの二乗誤差Eとして[数22]を使用する。
【数22】

【0063】
なお、上記では2台のスピーカが同一平面内に配置されているものとしているが、スピーカを3次元空間に配置した場合にも本発明に係る3次元パンニング装置を適用できることは明らかである。
【0064】
即ち、第2の実施の形態によれば、多数の聴取者を対象として音像を定位させることが可能となる。
【0065】
上述した第1の実施の形態および第2の実施の形態においては、パンニング前音響信号をフーリエ変換して周波数領域に変換した後に周波数領域でパンニング処理を実行し、算出された周波数領域パンニング後音響信号を逆フーリエ変換してパンニング後音響信号を算出することとしているが、フーリエ変換処理、ダウンミックス処理、および逆フーリエ変換処理を遅延素子とフィルタで構成し、時間領域でパンニングすることも可能であることは当業者にとって明らかである。
【産業上の利用可能性】
【0066】
以上のように、本発明に係る3次元パンニング装置は、パンニング前音響信号を3次元的にパンニングして予め定められた位置に配置されたスピーカから再生することのできるという効果を有し、音響信号処理装置等として有効である。
【図面の簡単な説明】
【0067】
【図1】本発明に係る3次元パンニング装置の第1の実施形態の構成を示すブロック図
【図2】本発明に係る3次元パンニング装置のハードウエア構成を示すブロック図
【図3】本発明に係るパンニング装置で実行される3次元パンニングプログラムのフローチャート
【図4】本発明に係るパンニング装置で実行されるパンニングルーチンのフローチャート
【図5】2つのスピーカの配置図
【符号の説明】
【0068】
1 3次元パンニング装置
11 パンニング前音響信号読み込み手段
12 パンニング後音響信号出力手段
13 変換手段
14 定位位置情報生成手段
15 配置情報記憶手段
16 周波数領域パンニング後音響信号生成手段
17 逆変換手段

【特許請求の範囲】
【請求項1】
時間関数であるパンニング前音響信号を読み込むパンニング前音響信号読み込み手段と、
時間関数であるパンニング後音響信号を出力するパンニング後音響信号出力手段と、
前記パンニング前音響信号を周波数領域パンニング前音響信号に変換する変換手段と、
前記パンニング前音響信号に付加する定位位置情報を生成する定位位置情報生成手段と、
前記パンニング後音響信号出力手段の配置情報を記憶する配置情報記憶手段と、
前記定位位置情報、および前記配置情報に基づいて前記周波数領域パンニング前音響信号をパンニングさせた周波数領域パンニング後音響信号を生成する周波数領域パンニング後音響信号生成手段と、
前記周波数領域パンニング後音響信号を時間関数であるパンニング後音響信号に逆変換する逆変換手段とを含む3次元パンニング装置。
【請求項2】
前記周波数領域パンニング後音響信号生成手段が、
前記パンニング後音響信号出力手段から前記パンニング後音響信号を放射したときの受音点におけるパンニング後音響物理量ベクトルを、音源から前記パンニング前音響信号を放射したときの前記受音点におけるパンニング前音響物理量ベクトルと等しくする前記周波数領域パンニング後音響信号を生成するものである請求項1に記載の3次元パンニング装置。
【請求項3】
前記周波数領域パンニング後音響信号生成手段が、
前記パンニング後音響信号出力手段から前記パンニング後音響信号を放射したときの受音領域におけるパンニング後音響物理量ベクトルを、音源から前記パンニング前音響信号を放射したときの前記受音領域におけるパンニング前音響物理量ベクトルと等しくする前記周波数領域パンニング後音響信号を生成するものである請求項1に記載の3次元パンニング装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate


【公開番号】特開2007−194900(P2007−194900A)
【公開日】平成19年8月2日(2007.8.2)
【国際特許分類】
【出願番号】特願2006−10943(P2006−10943)
【出願日】平成18年1月19日(2006.1.19)
【出願人】(000004352)日本放送協会 (2,206)
【Fターム(参考)】