説明

音響再生装置

【課題】直接音と間接音の比率を調整して、映像に応じた位置に音像を定位させることができる音響再生装置を提供する。
【解決手段】音響再生装置3は、モニタ38が映像を表示した際に、この映像の座標情報を取得する。音響再生装置3は、視聴者の視聴位置90の直近に配置したアタッチスピーカ47と、視聴位置の周囲(視聴位置から離れた位置)に配置した複数のサラウンドスピーカ40と、を備えており、映像の座標に応じて、アタッチスピーカ47及びサラウンドスピーカ40に出力する音声信号のゲインや位相を調整して、映像の位置に映像の音像を定位させる。人は、間接音の比率が高い音を遠くからの音と知覚し、直接音の比率が高い音を近くからの音と知覚するが、視聴位置の直近と視聴位置から離れた位置にスピーカを設置することで、アタッチスピーカ47とサラウンドスピーカ40の間に音像を定位させることができる。

【発明の詳細な説明】
【技術分野】
【0001】
この発明は、任意の位置に音像を定位させる音響再生装置に関する。
【背景技術】
【0002】
従来、図1(A)に示すように、視聴者Uの周囲に設置した5つのスピーカL,C,R,SL,SRからオーディオ信号に基づく音声を放音することで、聴取者の周囲に音像を定位させる立体音像制御装置があった(例えば、特許文献1参照。)。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2002−44799号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
図1(B)に示すように、視聴者Uは通常、オーディオ用アンプに接続した5つのスピーカL,C,R,SL,SRを部屋Rの壁Kの近くに設置することが多い。そして、視聴者Uは一般的にスピーカから一定距離離れた場所で視聴するため、視聴者Uはスピーカからの直接音だけでなく部屋の天井、床、壁面からの反射音(間接音)も同時に聞いている。一般に人間は音源までの距離を、直接音と間接音の音量比を主な手がかりとして判断しているから、各スピーカから音声を放音したときは、視聴者Uは音源までの距離としてスピーカまでの実距離を感じている。
【0005】
そのため、図1(B)に示したように、5つのスピーカL,C,R,SL,SRにより囲まれた領域Tの内側(例えば、視聴者Uの左前方)に音源が定位するように、従来のオーディオ用アンプで音源Sを模擬しようとしても、視聴者Uには実際にその位置に音源が置かれた時の直接音と間接音の比率を再現することができない。そのため、視聴者Uにあたかもその場所に音源があるような距離感に知覚させることは困難であった。
【0006】
そこで、本発明は、視聴者の周囲における任意の位置に音像を定位することができる音響再生装置を提供することを目的とする。
【課題を解決するための手段】
【0007】
この発明の音響再生装置は、座標情報取得手段と、放音手段と、供給手段と、音像制御手段と、を備えている。座標情報取得手段は、表示装置が表示する映像の視聴環境における座標情報を取得する。放音手段は、視聴位置の周囲に第1音源を配置し、第2音源を第1音源よりも視聴位置の近くに配置する。供給手段は、映像に対応する音声信号を第1音源と第2音源に供給し、これにより、第1音源と第2音源から同じ音声を放音させる。音像制御手段は、座標情報に応じて第1音源と第2音源に供給する音声信号のゲイン比率を調整する。
【0008】
音響再生装置を、例えば立方体型の室内に設置して視聴者の視聴位置を部屋の中央に設定した場合、第2音源は第1音源よりも視聴位置の近傍に設置する。直接音の音圧が距離の逆二乗に反比例して急激に減衰するのに対し、間接音の音圧は音源からの距離が変わってもそれほど音量が変化しない。したがって、視聴者は、これを手がかりに第1音源が放音した音を間接音の比率が高い音、すなわち遠くから聞こえる音と知覚する。一方、第2音源から視聴者までの距離は、第1音源から視聴者までの距離より小さいので、聴こえる音量のうち直接音の占める比率が第1音源からの場合より大きくなる。そこで、視聴位置にいる視聴者は、第2音源が放音した音を、直接音の比率が高い音、すなわち近くから聞こえる音と知覚する。したがって、第1音源と第2音源から同じ音声を放音させ、両音声信号のゲインを調整することで、視聴位置において視聴者に聞こえる直接音と間接音の比率を調整でき、第1音源と第2音源の間における任意の距離の位置に音像を定位させることができる。例えば、第2音源を視聴位置の直近とすれば、第2音源から放音される音は視聴者にはほとんど直接音として聞こえるので、視聴者の視聴位置の直近にも音源を定位させることができる。
【0009】
第1音源と第2音源は、具体的には以下のようにして実現することができる。例えば、第1スピーカと第2スピーカを放音手段が備える構成とし、第1スピーカに第1音源の音声信号を放音させ、第2スピーカを第1スピーカよりも視聴位置の近くに設置して第2音源の音声信号を放音させることで実現できる。
【0010】
本発明の構成は、実際には、例えば5.1サラウンドシステムのような形態において、従来の5.1チャンネルに相当する6個のスピーカを上記第1スピーカとし、この構成にあらたに追加するスピーカを視聴者近傍設置用として上記第2スピーカとすることで実現できる。この第2スピーカの形態として1個または複数個のスピーカを視聴者正面に設置する、または視聴者の背後、例えばソファのヘッドレスト部に設置したり、立体映像を見る際に使用するメガネを構成するフレームに設置するなどが考えられる。このような構成により視聴者の実際に耳の近傍に音源を設置することができ、第1スピーカとの間で直接音と間接音との比率を制御することができる。
【0011】
また、第1音源と第2音源は、以下のようにして実現することもできる。例えば、放音手段が、スピーカアレイと信号処理手段を組み合わせた指向性制御スピーカと、前記信号処理や、特殊構造による指向性制御をしない通常のスピーカを備える構成とする。
【0012】
この構成においては、第2音源の音声信号をスピーカアレイにより音声ビーム化して放音させるので、指向性制御をしないスピーカと比較して、視聴位置での直接音比率を上げることができる。このため実際に視聴位置の近くにスピーカを設置することなく第2音源を視聴位置近傍に定位させることができる。これにより、第1音源スピーカと同じ位置に第2音源スピーカを設置できたり、第1音源スピーカと第2音源スピーカを一体化したりするなど、設置位置や構成の自由度を高めることができる。また、前記構成において、指向性制御スピーカとしてスピーカアレイではなく、例えば平面スピーカなど構造的に指向性を制御しているようなスピーカを使用しても良い。
【0013】
また、前記構成のスピーカを設置する環境の中には、スタジオなど部屋自体の音響が意図的にコントロールされている場合がある。このような環境の場合、吸音壁などにより通常の部屋より残響が少ないため、第1音源から視聴位置に到達する音の直接音比率が高く、その結果、第2音源との間で直接、間接音比率による距離感制御が困難な場合がある。本発明ではこのような特殊な環境においても、充分な効果を再現するために、第1音源が放音する音声信号に残響成分を付加し、その付加量を映像の座標情報に従って増減することができる。
【0014】
この構成においては、第1音源が放音する音声信号に残響成分を付加することで、たとえ残響が少ない環境においても視聴者に第1音源からの間接音の比率が高くなったように聴かせることができる。視聴者は、第1音源から間接音の比率が高い(ような)音が聞こえると、残響を付加しない場合より遠くから音が放音されたように感じるため、第2音源との間に距離感の差を再現することができる。ここで付加される残響成分の量は次のように決定すればよい。予め部屋の残響時間を測定しておき、その残響時間が予め決定された時間に対して少ない場合は、残響付加量を増やし、残響時間が大きい場合は残響付加量を減らすようにする。このように残響測定値に従って第1音源に付加する残響量を決定すると、異なる環境においても一定の効果を再現することができる。また、残響付加量を測定値等により決定される適性量より多く付加することで、第1音源の距離感を意図的に大きくして、立体映像の座標がTV画面の奥行き方向にある場合にも、その距離感を立体映像に応じて再現し、音源定位位置制御をより効果的にすることもできる。立体映像が同時に奥行き効果と飛び出し効果を伴っている場合は、奥行き方向を第1音源に残響を付加することで表現しつつ、同時に飛び出し方向の定位を第2音源で表現する。この場合は残響付加により視聴者に聞こえる第1音源の直接音と間接音の比率が変わるため、残響付加量に応じて第1音源と第2音源の間のゲイン比率を変動させる(残響付加量が多くなると、同じ定位位置での第2音源のゲイン比率を大きくする。残響付加量が少なくなると、同じ定位位置での第1音源のゲイン比率を大きくする。)ことで立体映像の座標位置に正しく定位を保つことができる。
【0015】
すなわち、立体映像によっては、背景は奥行き方向に拡がり、人物など強調したい映像部分は逆に飛び出しているような表現があるが、このような場合は、奥行きを表現するために第1音源に残響を付加し、かつ飛び出しを表現するために第2音源へのゲインを上げる必要がある。このとき、固定の距離−音源間ゲイン比率を使用していると、残響付加により、第1音源の直接−間接音比率が変わり、算出された映像の位置に正しく定位させることができなくなる。そのため、音像制御手段は残響成分量に応じて距離−音源間ゲイン比率を可変させることで、常時正しい音声定位位置を保つように動作させることができる。具体的には、残響付加量が多くなるにつれて、同じ定位位置における第2音源のゲイン比率を上げ、逆に残響付加量が少なくなるにつれて、同じ定位位置における第2音源のゲイン比率を下げるとよい。
【0016】
また、この発明の音響再生装置では、音像制御手段は、映像に対応する音声信号における所定帯域の周波数特性の変化を抑制するように、第1音源と第2音源の音声信号の周波数特性を調整することもできる。
【0017】
音響効果の手法の1つに、音像が遠くから近づいてくる状態を表現するために、音像の音声の高域成分を徐々に増加させ、音像が遠くに離れてゆく状態を表現するために、音像の音声の高域成分を徐々に減少させる手法がある。一方、この発明の音響再生装置は、視聴位置の周囲に第1音源を配置し、該第1音源よりも視聴位置の近くに第2音源を配置させ、座標情報に応じて、第1音源と第2音源の音声信号のゲインを調整することにより、音像を実際に移動させる。そのため、3Dコンテンツの音声信号自体に上記の音響効果が付加されていると、実際に視聴位置近傍で再生する第2音源からの音声にとっては高域成分が過剰となり、視聴に適さない音質となる可能性がある。そこで、本発明では、映像の前後座標に応じて、前記音響効果を抑制することで、第2音源から再生される音声の品質を確保する。つまり、映像が視聴位置に近づくにつれて第1音源と第2音源の音声信号における所定帯域の周波数成分、例えば高域成分を減少させ、また、映像が視聴位置から遠ざかるにつれて第1音源と第2音源の音声信号における所定帯域の周波数成分、例えば高域成分を回復させる。これにより、映像が視聴位置方向に飛び出す効果を強調する音響効果がコンテンツ側に施されていても第2音源から再生される音声の品質を適正にすることができる。
【発明の効果】
【0018】
この発明によれば、従来のサラウンドシステムに対して、視聴位置直近傍に追加した音源から、映像の視聴環境における座標情報に応じた音声を出力することによって、より臨場感の高い音場を再現することができる。
【図面の簡単な説明】
【0019】
【図1】図1(A)は、従来のオーディオ用アンプに接続するスピーカの配置図であり、図1(B)は、従来のオーディオ用アンプに接続するスピーカを室内に設置し、視聴者の近くに音源を定位させる場合を説明するための図である。
【図2】本発明の第1実施形態に係る音響再生装置を備えた3Dシステムの概略構成を示すブロック図である。
【図3】図3は、モニタの画面に表示する映像と視聴者が知覚する立体映像の関係を示す図である。図3(A)は、立体映像をモニタの画面より奥に知覚する場合、図3(B)は立体映像をモニタの画面上に知覚する場合、図3(C)は、立体映像をモニタの画面よりも手前に知覚する場合である。
【図4】図4は、視聴者とモニタの映像と立体映像の距離関係を示すXY平面図である。図4(A)は、立体映像がモニタの画面より奥に位置する場合、図3(B)は立体映像がモニタの画面上に位置する場合、図3(C)は、立体映像がモニタの画面よりも手前に位置する場合である。
【図5】図5は、音像の定位位置を説明するための図である。図5(A)は視聴位置に音像が定位する場合、図5(B)はアタッチスピーカとサラウンドスピーカの間に音像が定位する場合、図5(C)は、サラウンドスピーカ(Cch)の位置に音像が定位する場合、図5(D)は、サラウンドスピーカ(Cch)の背後に音像が定位する場合、図5(E)は、複数のスピーカにより音像を定位する場合である。
【図6】プレゼンススピーカを室内に設置した状態を示す図である。
【図7】音源の距離に応じた周波数特性を示すグラフである。
【図8】第2実施形態に係る音響再生装置を備えた3Dシステムの概略構成を示すブロック図である。
【図9】スピーカアレイの音声ビームの放音状態を示す図である。
【発明を実施するための形態】
【0020】
以下、音響再生装置の詳細について説明する。
【0021】
[第1実施形態]
図2は、本発明の第1実施形態に係る音響再生装置を備えた3Dシステムの概略構成を示すブロック図である。図2に示すように、3Dシステム1は、映像再生装置2と音響再生装置3を備えている。映像再生装置2は、コンテンツ信号受信部21、コンテンツ再生部22、映像処理部23、映像信号出力部25、及び音声信号出力部26を備えている。
【0022】
音響再生装置3は、映像信号入力部31、映像処理部32(座標情報取得手段に相当)、音声信号入力部33、音像処理部34、第1音源信号出力部35、第2音源信号出力部36、及び映像信号出力部37を備えている。音像処理部34は、ミックスレベル算出部(音像制御手段に相当)341、波形調整部(供給手段に相当)343、波形調整部(供給手段に相当)345、残響付加部347、及び監視部348を備えている。映像信号出力部37には、モニタ(表示装置に相当)38が接続されている。第1音源信号出力部35には一例として、5つのスピーカ41〜45が接続されている。各スピーカ41〜45は、放音手段(第1スピーカ)に相当し、以下の説明では、L(前方左)chスピーカ41、C(前方中)chスピーカ42、R(前方右)chスピーカ43、SL(後方左)chスピーカ44、及びSR(後方右)chスピーカ45と称する。また、以下の説明では、Lchスピーカ41、Cchスピーカ42、Rchスピーカ43、SLchスピーカ44、及びSRchスピーカ45をまとめてサラウンドスピーカ40と称する。図2には、サラウンドスピーカ40を、ITU−R BS.775−1に基づいて配置し、Lchスピーカ41、Cchスピーカ42、Rchスピーカ43の付近にモニタ38を配置した例を示している。なお、5.1chサラウンドシステムにおいては、サブウーファを設置するが、以下の説明ではサブウーファの音声信号の処理については説明を省略する。
【0023】
第2音源信号出力部36にはアタッチスピーカ47が接続されている。アタッチスピーカ47は、放音手段(第2スピーカ)に相当し、第2音源信号出力部36が出力した音声を放音する。
【0024】
第1実施形態では、視聴者Uの近傍に本発明の第2音源を定位するために、視聴者Uの直近にアタッチスピーカ47を設置(配置)している。また、視聴者Uの周囲に第1音源を定位させるために、サラウンドスピーカ40を設置(配置)し、サラウンドスピーカ40とアタッチスピーカ47の間の任意の位置に立体映像に対応する音像を定位させる。音響再生装置3の音像処理部34は、映像処理部32が出力した立体映像の3次元座標情報に基づいて、サラウンドスピーカ40とアタッチスピーカ47に出力する音声信号の比率(ミックスレベル)を算出し、このミックスレベルに基づいて、サラウンドスピーカ40とアタッチスピーカ47に出力する音声信号の振幅(ゲイン)を調整する。そして、音像処理部34は、第1音源信号出力部35と第2音源信号出力部36に音声信号を出力し、サラウンドスピーカ40とアタッチスピーカ47から放音させる。
【0025】
映像再生装置2は、3Dコンテンツの映像信号と音声信号を音響再生装置3に出力する。この例においては、映像再生装置2のコンテンツ信号受信部21は、放送波を受信して、3Dコンテンツの映像信号を映像処理部23に出力し、3Dコンテンツの音声信号を音声信号出力部26に出力する。
【0026】
コンテンツ再生部22は、不図示の記憶メディアを再生して3Dコンテンツの映像信号を映像処理部23に出力し、3Dコンテンツの音声信号を音声信号出力部26に出力する。
【0027】
映像処理部23は、コンテンツ信号受信部21またはコンテンツ再生部22から入力された3Dコンテンツの映像信号を、映像信号出力部25に出力する。映像信号出力部25は、3Dコンテンツの映像信号を音響再生装置3に出力し、音声信号出力部26は3Dコンテンツの複数チャンネルの音声信号を音響再生装置3に出力する。
【0028】
音響再生装置3の映像信号入力部31は、入力された3Dコンテンツの映像信号を、映像処理部32と映像信号出力部37に出力する。映像処理部32は、入力された映像信号を解析して、視聴位置90に対する立体映像の3次元座標を取得して音像処理部34に出力する。映像信号出力部37は、映像信号入力部31から入力された映像信号をモニタ38に出力する。モニタ38は、3Dコンテンツの立体映像を表示する。
【0029】
映像再生装置2は、例えば、視差(左右の映像のずれ)を設けた2つの映像を特殊なメガネにより視聴者の左目と右目で別々に見えるように作成された3Dコンテンツの映像を再生することで、この映像を視聴者に立体的な映像と知覚させている。
【0030】
音響再生装置3の映像処理部32は、立体映像に対応する位置に音像を定位させるために、3Dコンテンツの左目用の映像(以下、左映像と称する。)と右目用の映像(以下、右映像と称する。)とのずれを解析して、立体映像がどれくらい画面から飛び出しているか(引っ込んでいるか)、またその立体映像が画面上の左右上下のどこに位置するかを示す座標を算出する。
【0031】
図3は、モニタの画面に表示する映像と視聴者が知覚する立体映像の関係を示す図である。図3(A)は、立体映像をモニタの画面よりも奥に知覚する場合、図3(B)は立体映像をモニタの画面上に知覚する場合、図3(C)は、立体映像をモニタの画面よりも手前に知覚する場合である。
【0032】
人間の目には左右の視差(両眼視差)があり、左目と右目とでは物体を見る位置が異なるため見え方が異なっており、人間の脳は、視線が交差したところに立体的な物体が存在していると知覚する。また、人間は視差が大きいほど物体が近くに存在し、視差が小さいほど物体が遠くに存在していると知覚する。3Dコンテンツは、このような人間の特性を応用したものであり、視差(左右の映像のずれ)を設けた2つの映像を、例えば特殊なメガネにより左目と右目で別々に見えるようにすることで、この映像を視聴者に立体的な映像として知覚させる。また、3Dコンテンツでは、左映像と右映像との違い(視差)を変えることで、画面から立体映像が飛び出したり引っ込んだりしていると知覚させる。
【0033】
図3(A)に示すように、左映像131Lをモニタ38の左側にずらして表示し、右映像131Rをモニタ38の右側にずらして表示すると、視線が交差する場所が画面よりも奥になるので、視聴者Uは立体映像131が画面の奥に引っ込んだように知覚する。また、図3(B)に示すように、左映像132Lと右映像132Rとをモニタ38の同じ位置にずれなしに表示すると、視線が交差する場所が画面上になるので、視聴者Uは立体映像132が画面と同じ位置にあるように知覚する。また、図3(C)に示すように、左映像133Lをモニタ38の右側にずらして表示し、右映像133Rをモニタ38の左側にずらして表示すると、視線が交差する場所が画面よりも手前になるので、視聴者Uは立体映像133が画面の手前に飛び出したように知覚する。
【0034】
このように、視聴者Uは、左映像と右映像との違い(視差)によって立体映像の位置を異なって知覚するので、モニタ38の画面に垂直な方向において、視差と立体映像の位置には比例関係が成り立つ。そこで、映像処理部32は、3Dコンテンツの左映像と右映像とにおける立体映像のずれ(視差)と、そのずれが発生している画面上の位置を解析して、画面に対する立体映像の位置、すなわち立体映像の視聴位置90に対する3次元座標を算出して、音像処理部34に出力する。立体映像の座標は、例えば以下のようにして算出する。
【0035】
図4は、視聴者とモニタの映像と立体映像の距離関係を示すXY平面図である。図4(A)は、立体映像がモニタの画面より奥に位置する場合、図4(B)は立体映像がモニタの画面上に位置する場合、図4(C)は、立体映像がモニタの画面よりも手前に位置する場合である。図4において、視聴者Uの視聴位置90(両目の中点)を原点O(0,0)とし、視聴者Uの視聴位置90(原点O)からモニタ38の画面までのY軸方向の距離をLs、視聴者Uの視聴位置90(原点O)から立体映像131までのY軸方向の距離をLdとする。
【0036】
例えば、左映像131Lと右映像131Rの一致点の座標の差を算出することで視差の値がわかる。図4(A)に示すように、立体映像(同図では一例として立方体)131がモニタ38の画面よりも奥の点P(0,Ld)に位置する場合、この点Pは、左映像131Lでは一致点P(x,Ls)、右映像131Rでは一致点P(x,Ls)である。この場合、映像処理部32は、例えば左映像131Lと右映像131Rに対してテンプレートマッチングを行って、2つの映像における物体の一致点を求める。例えば、左映像を任意の数のブロックに区切り、このブロックをテンプレートとみなして、テンプレートに類似したブロックを右映像から1画素ずつずらしながら探し出す。左映像と右映像には視差があるので、まったく同一にはならず、実際にはテンプレートと最も類似したブロックを探し出すことになる。映像処理部32は、右映像において、左映像のテンプレートとの相関値が最大となるブロックを一致点と判定する。
【0037】
なお、上記のように相関を求める場合、図4(A)と図4(C)に示すように、左映像に対する右映像の一致点のずれがプラスの値の場合には、立体映像はモニタの画面より奥に位置し、ずれがマイナスの値の場合には、立体映像はモニタの画面よりも手前に位置する。
【0038】
映像処理部32は、左映像131Lの点Pと右映像131Rの点Pを一致点と判定すると、点Pと点Pのずれ、すなわち視差を用いて、立体映像131の座標、すなわち、視聴位置90から立体映像131までの距離を、そして一致点のブロックの位置から、立体映像の画面平面上での位置座標を算出する。
【0039】
映像処理部32は、例えば、視聴位置90から立体映像131までの距離(Y軸方向の座標)を以下のようにして算出する。図4(A)に示すように、視聴者の左目ULと右目URの距離をE、モニタ38の画面上に表示される左映像131Lと右映像131Rとのずれ(視差)をD(=x−x)とすると、以下の比例関係が成り立つので式1が得られる。
【0040】
Ld:(Ld−Ls)=E:D
Ld=Yp=(E/E−D)Ls …(式1)
同様に、図4(B)、図4(C)に示す立体映像132,133についても比例関係が成り立つので、式1により立体映像131までの距離を算出できる。
【0041】
なお、式1の定数Eは、人の一般的な両目の距離を予め音響再生装置3に入力しておくとよい。また、式1の定数Lsは、視聴位置90に応じて予め音響再生装置3に入力しておくとよい。
【0042】
また、定数(E、Ls)を用いた式1の計算を行わなくても、左映像38Lと右映像38Rの視差D(=x−x)から立体映像の定位位置を推定して、視差Dをそのまま座標に対応させてもよい。例えば、D=3(cm)でLd=1(m)等としておく。
【0043】
なお、上記の説明では、モニタ38の画面に対して前後方向(Y軸方向:奥向き方向及び飛び出し方向)について、立体映像の座標を算出する場合について説明したが、モニタ38の画面に対して上下方向(Z軸方向)や左右方向(X軸方向)についても同様に立体映像の座標を算出できる。
【0044】
図2に示した音響再生装置3のミックスレベル算出部341は、映像処理部32が出力した立体映像の視聴位置90に対する3次元位置情報に基づいて、サラウンドスピーカ40とアタッチスピーカ47に出力する音声信号の配分(ミックスレベル情報)を算出する。そして、ミックスレベル算出部341は、波形調整部343と波形調整部345にミックスレベル情報を出力する。ミックスレベル情報は、立体映像に対応する位置に音像を定位させるために、サラウンドスピーカ40とアタッチスピーカ47とに分配する同じソースの音声信号のゲイン比率に関する情報と、ソースがどのチャンネルの音声信号であるかを示す情報を含む。立体映像の座標Pが、例えば画面真正面のCchスピーカ42とアタッチスピーカ47の中間にある場合には、この立体映像に対応する音声信号(この場合Cchの音声信号)がCchスピーカ42とアタッチスピーカ47から座標位置に応じたゲイン配分で再生される。また、立体映像の座標Pが画面上の左側で画面と視聴位置の間にある場合には、例えばLchスピーカ41とCchスピーカ42とアタッチスピーカ47から座標位置に応じたゲイン配分で再生される。
【0045】
なお、上記のゲイン配分方法は、立体映像の座標Pがサラウンドスピーカ40とアタッチスピーカ47の間にあることを前提としているが、アタッチスピーカの位置によっては、算出した座標がアタッチスピーカより、視聴位置に近い場合も考えられる。この場合はアタッチスピーカの位置を限度としてアタッチスピーカを最大音量とてしてもよい。また、実際の座標をアタッチスピーカとサラウンドスピーカの距離で表現できるようにスケーリングしてもよい。つまり、座標位置を必ずアタッチスピーカとサラウンドスピーカの間にくるようにスケーリング(変換)する。例えば、算出された座標位置が画面と視聴者の中間にある場合は、サラウンドスピーカとアタッチスピーカの中間に定位するようにする。
【0046】
波形調整部343は、入力されたミックスレベル情報に基づいて、音声信号入力部33から入力されたLch、Cch、Rch、SLch、及びSRchの音声信号から立体映像に対応する音声信号を選択し、選択した音声信号のゲインを調整して第1音源信号出力部35に出力する。
【0047】
波形調整部345も、波形調整部343と同様に、入力されたミックスレベル情報に基づいて、立体映像に対応する音声信号(波形調整部343が選択したのと同じ音声信号)を選択し、選択した音声信号のゲインを調整して第2音源信号出力部36に出力する。
【0048】
また、波形調整部343と波形調整部345は、サラウンドスピーカ40から放音する音声とアタッチスピーカ47から放音する音声とが同じタイミングで視聴位置90に到達するように位相調整(遅延量の調整)を行う。
【0049】
例えば、Cchスピーカ42とアタッチスピーカ47の間に音像を定位する場合、波形調整部343と波形調整部345は以下の処理を行う。図2に示したように、アタッチスピーカ47は視聴者Uの直近に設置され、Cchスピーカ42はモニタ38の近傍に設置されているので、波形調整部345は、例えば、アタッチスピーカ47の放音タイミングを、Cchスピーカ42の放音タイミングに対して、モニタ38から視聴位置までの距離(例えば、1〜2m)を音声が伝搬する時間だけ遅延させる。これにより、視聴位置90にほぼ同時に音声が伝搬するように調整できる。なお、視聴位置90に対するCchスピーカ42とアタッチスピーカ47の距離を予め測定しておき、波形調整部343と波形調整部345は、この距離に応じて両スピーカの放音タイミングを調整することで、より正確に視聴位置90に同時に音声を伝搬させることができる。これにより、サラウンドスピーカ40とアタッチスピーカ47から放音した音声信号が、視聴位置90において打ち消し合うのを防止できる。
【0050】
残響付加部347は、算出された立体映像の座標が画面の奥行き方向に位置している場合に、その距離Ldに応じた量の残響成分をサラウンドスピーカ40に付加し、奥行き方向を表現する。これは、人は音声に残響(リバーブ)が付加されると、音声の間接音比率が高くなるため、実際のスピーカの位置よりも遠くから聞こえる音と知覚する現象を利用している。また、残響付加部347は、スピーカを設置した部屋の残響が著しく少なかったり、アタッチスピーカとサラウンドスピーカの設置位置が近接していたりするような、スピーカ間の直接音−間接音比率の差が少なく奥行き方向の定位の表現が困難である場合にも、設置環境に拠らず一定の効果が出せるように、直接音、間接音比率の差をつけるための残響付加も行う。この場合の残響付加量は予め設置した部屋の残響特性を測定した結果により決定される。
【0051】
立体映像によっては、背景は奥行き方向に拡がり、人物など強調したい映像部分は逆に飛び出しているような表現があるが、このような場合は、奥行きを表現するためにサラウンドスピーカ40に残響を付加し、かつ飛び出しを表現するためにアタッチスピーカへのゲインを上げなくてはいけない。このとき、固定の距離−音源間ゲイン比率を使用していると、残響付加により、サラウンドスピーカ40の直接−間接音比率が変わり、算出された立体映像の位置に正しく定位させることができなくなるので、ミックスレベル算出部341は音声信号に付加する残響成分量に応じて前記距離−音源間ゲイン比率を変動させることで常時正しい音声定位位置を保つように動作する。具体的には付加する残響成分量が多くなるにつれて、同じ定位位置におけるアタッチスピーカのゲイン比率を上げ、逆に付加する残響成分量が少なくなるにつれて、同じ定位位置におけるアタッチスピーカのゲイン比率を下げる。
【0052】
図5は、音像の定位位置を説明するための図である。図5(A)は視聴位置に音像が定位する場合、図5(B)はアタッチスピーカとサラウンドスピーカの間に音像が定位する場合、図5(C)は、サラウンドスピーカ(Cch)の位置に音像が定位する場合、図5(D)は、サラウンドスピーカ(Cch)の背後に音像が定位する場合、図5(E)は、複数のスピーカにより音像を定位する場合である。図6は、プレゼンススピーカを室内に設置した状態を示す図である。以下の説明では、図4(A)と同様に視聴位置を原点Oとする。
【0053】
(1)図5(A)に示すように、立体映像の座標Pが原点O(Ld=0)の場合、波形調整部343と波形調整部345は立体映像に対応する音声信号のゲインを調整して、アタッチスピーカ47からのみ放音し、Cchスピーカ42から音声を放音しないように設定する。この時アタッチスピーカは視聴者直近に設置されているため、アタッチスピーカから知覚される音声は主に直接音となり、当然ながらその結果、視聴者直近から聞こえるものと知覚される。
【0054】
(2)図5(B)に示すように、立体映像の座標Pが原点OとCchスピーカ42との間(0<Ld<Ls)の場合、波形調整部343と波形調整部345は立体映像に対応する音声信号のゲインを調整して、アタッチスピーカ47とCchスピーカ42から放音する音声の音量を調整することで、視聴者が中点55の位置に音声定位を知覚する直接音−間接音比率を持つ音声を再生することができる。
【0055】
(3)図5(C)に示すように、立体映像の座標PがCchスピーカ42の放音面(Ld=Ls)の場合、波形調整部343と波形調整部345は立体映像に対応する音声信号のゲインを調整して、アタッチスピーカ47から音声を放音しないように設定し、Cchスピーカ4からのみ音声を再生する。したがって、視聴者Uは、Cchスピーカ42からの音声が持つ直接音−間接音比率で決まる距離感を知覚することになる。
【0056】
(4)図5(D)に示すように、立体映像の座標PがCchスピーカ42の背後にある(Ld>Ls)場合、(3)と同様にCchスピーカ4単独、またはCchを含む複数個のサラウンドスピーカを使用して再生し、同時に画面から座標Pまでの距離に応じた残響成分を残響付加部347によりサラウンドスピーカ音声に付加する。また、画面から座標Pまでの距離(立体映像の座標情報)に応じて、残響付加部347によりサラウンドスピーカ音声に付加する残響成分を増減する。これにより、視聴者Uは画面の奥行きに拡がった音場を知覚する。
【0057】
このように、アタッチスピーカ47の音量の変化と、サラウンドスピーカ40に付加する残響量を変化させることで、アタッチスピーカ47とサラウンドスピーカ40との音声のバランスが変化し、視聴者Uに聞こえる音の直接音と間接音の比率が変わる。人は、直接音と間接音の比率や周波数特性や位相差などにより音像の定位感を感じるが、本発明では、直接音と間接音の比率を制御して主に音像の距離感を調整している。これにより、モニタ38の画面から飛び出したり、引っ込んだりして移動する立体映像に追従して音像を移動させることができる。
【0058】
以上の説明では、主にCchスピーカ42とアタッチスピーカ47のみを使い音像を定位させた場合について説明したが、実際のコンテンツではCchと相関性が高い音声が他のチャンネル(例えばL/Rch)にも含まれていることが多いため、Cchだけを取り出して本発明の効果を適用すると音質的に違和感を生じる可能性がある。このため、実際にはCchを含む複数チャンネルを選択して再生することもできる。さらに、本発明では立体映像の画面上での左右の位置によってサラウンドスピーカ40とアタッチスピーカ47の各チャンネルの音声ゲインを調整することによって、真正面以外の位置に音像を定位させることもできる。
【0059】
例えば、立体映像の画面上での左右の位置に応じて、Lchスピーカ41とSLchスピーカ44とアタッチスピーカ47の音声ゲインを調整して放音することで、図5(E)に示すように、Lchスピーカ41とSLchスピーカ44とアタッチスピーカ47を結ぶ線により形成された三角形の領域に音像57を定位させることができる。
【0060】
また、図6に示すように、視聴位置90の前左右上方にプレゼンス左チャンネル(PLch)用のスピーカ51と、プレゼンス右チャンネル(PRch)用のスピーカ52を設置する。そして、立体映像の画面上での上下の位置に応じて、例えば、Rchスピーカ43とPRchスピーカ52とアタッチスピーカ47の音声ゲインを調整して放音することで、部屋91の上下方向にも音像を定位させることができる。すなわち、図6に示すように、Rchスピーカ43とPRchスピーカ52とアタッチスピーカ47を結ぶ線により形成された三角形の領域に音像58を定位させることができる。
【0061】
また、音像処理部34では、監視部348により、映像処理部32による立体映像の視聴位置90に対する座標の移動を監視する。監視部348は、波形調整部343,345に制御信号を出力させて、立体映像の座標情報と、アタッチスピーカの設置位置に応じて、アタッチスピーカ47の音声信号の周波数特性を調整する。
【0062】
図7は、音源の距離に応じた周波数特性を示すグラフである。音響効果の手法の1つに、音像が遠くから近づいてくる状態を表現するために、音像の音声の高域成分を徐々に増加させ、音像が近くから遠くに離れていく状態を表現するために、音像の音声の高域成分を徐々に減少させる手法がある。この手法は、図7に示すように、例えば低域から高域まで一定レベルの音を放音すると、音源が視聴位置の近くにある場合には、音の高域成分に減衰なく到達するが、音源視聴位置から遠くへ離れていくにつれて、音の高域成分が減衰していく現象を模擬したものである。この手法を以下、接離効果と称する。一般的な音響再生装置では、上記のような接離効果が付加された音声信号を再生することで、視聴者に音像の接離を体感させることができる。
【0063】
一方、本発明の音響再生装置3は、音像を実際に接離させることができる。そのため、3Dコンテンツの音声信号に接離効果が予め付加されていると、アタッチスピーカからそのまま再生すると、視聴者にとって音質的に高域成分が過剰になり、快適な視聴を阻害したり、音響再生装置3が意図する立体映像の定位位置に音像を正確に定位させることができなかったりする可能性がある。そこで、本発明では、監視部348により映像処理部32による立体映像の視聴位置90に対する座標の移動を監視し、座標の移動とアタッチスピーカの設置位置(視聴者からの距離)に応じて周波数特性を調整して、高域成分の過剰さや接離効果を抑制する。つまり、立体映像が画面から手前に移動する場合には視聴位置に近づくほど音声信号の高域成分の減少量を増加させ、立体映像が手前から画面方向に移動する場合には遠くなるにつれて音声信号の高域成分を増加させ、Cchスピーカの位置で完全に元の周波数特性に回復させるようにする。また、立体映像が画面より奥にある場合は、上記周波数特性の調整は行わない。
【0064】
ここまで言及してきたアタッチスピーカ47は、必ずしも全周波数帯域が再生できるスピーカでなくても良い。視聴者Uが音像の定位や音像の移動を知覚できる周波数帯域の音声を放音できるもの、例えば、最低共振周波数f0が500Hz以上の小型のアタッチスピーカを用いても良い。このような小型のアタッチスピーカであれば設置位置や方法の自由度が高く、例えば3D映像を見るために使用するメガネに取り付けるといったことが可能となり、視聴者Uの耳の近傍にスピーカを配置できるので、直接音の比率が非常に高い音声を視聴者に聞かせることができ本発明の効果を最大化することができる。
【0065】
[第2実施形態]
次に、本発明の第2実施形態に係る音響再生装置について説明する。図8は、第2実施形態に係る音響再生装置を備えた3Dシステムの概略構成を示すブロック図である。図9は、スピーカアレイの音声ビームの放音状態を示す図である。以下の説明では、第1実施形態と同様の構成には同じ符号を付して説明を省略する。
【0066】
図8に示す3Dシステム6は、映像再生装置2と、音響再生装置8を備えている。3Dシステム6では、図1に示した3Dシステム1と異なり、音響再生装置3のアタッチスピーカ47を視聴位置90の直近に設置せずに、スピーカアレイ49により視聴位置90の直近の点50で焦点を結ぶ音声ビーム(第2音源の音声信号)を放音させている。他の構成は3Dシステム1と同様であり、サラウンドスピーカ40から第1音源の音声信号を放音させて、視聴位置90の任意の位置に音像を定位(配置)させる。スピーカアレイ49は、一例として部屋91のモニタ38の近傍(部屋91の前側)に設置している。スピーカアレイ49は、複数のスピーカユニット49−1〜49−Nが所定の配列で配置されている。
【0067】
音響再生装置8は、音響再生装置3の構成を一部変更しており、音像処理部34Bにおいて、波形調整部345の後段に位相調整部349を備えている。位相調整部349は、信号処理手段に相当し、図9に示すように、スピーカアレイ49の各スピーカユニット49−1〜49−Nに出力する音声信号(第2音源の音声信号)の遅延量を調整して、スピーカアレイ49により視聴位置90の直近(例えば前方)の点50で焦点を結ぶ音声ビームを放音させる。視聴者Uは、スピーカアレイ49から上記のような音声ビームが放音されると、音源(第2音源)が点50付近に定位していると知覚する。これは、スピーカアレイと同じ位置にある信号処理や、特殊な構造による指向性制御を行わないスピーカからの音声と比較して、音声ビームはその鋭い指向性によって直接音の比率が高くなるからである。そのため、視聴者Uはスピーカアレイが設置されている場所より近くに音源があるかのような印象を受ける。これにより、アタッチスピーカを視聴位置90の直近に設置しなくてもよくなり、構成、配置の自由度や、利便性を高めることができる。また前記と同様な効果をスピーカアレイ以外の方法で実現しても良い。アタッチスピーカは指向性制御を行わない通常のスピーカより、直接音比率が高い音声が出力できればよいので、例えば、超音波を使用するパラメトリックアレイスピーカや、直進性が高い音を再生できる平面バッフルスピーカなどを使用しても良い。
【0068】
以上のように、本発明では、視聴位置90の周囲(視聴位置90から離れた位置)に複数のスピーカ(サラウンドスピーカ40)を配置することで、これらのスピーカが放音した音は視聴位置では間接音の比率が高くなるので、視聴者に遠くから聞こえる音と知覚させることができる。また、視聴者Uの視聴位置90の直近にアタッチスピーカ47を配置することで、このスピーカが放音した音は、視聴位置では直接音の比率が高くなるので、視聴者に近くから聞こえる音と知覚させることができる。また、第2音源を視聴位置の直近に配置させれば、第2音源から放音される音は視聴者にはほとんど直接音として聞こえるので、視聴者の視聴位置に音源を定位させることができる。したがって、サラウンドスピーカとアタッチスピーカのミックスレベルを調整することで、任意の位置に音像を定位することができる。
【0069】
なお、第1実施形態においては、視聴者Uの視聴位置90の周囲に5つのサラウンドスピーカ40を配置している例を示したが、これに限るものではなく、他の方式を用いることも可能である。例えば、サラウンドスピーカに代えてスピーカアレイを設置し、スピーカアレイに5チャンネルの音声信号を入力し、各スピーカユニットの放音タイミングを制御して、5つの音声ビームを生成し、部屋の壁に音声ビームを反射させることで、視聴位置90の周囲に、5つのスピーカを配置したのと同様の音場を生成することができる。したがって、アタッチスピーカを視聴位置90の直近に設置し、スピーカアレイによりサラウンドスピーカ40を模擬した音声を放音する構成とすることも可能である。
【0070】
また、2つのスピーカアレイを視聴位置90の周囲に設置し、一方のスピーカアレイに、視聴位置90の直近に焦点を結ぶ音声ビームを放音させて、アタッチスピーカを模擬し、他方のスピーカアレイに、サラウンドスピーカ40を模擬した音声を放音する構成とすることも可能である。
【0071】
なお、図2には視聴者Uの前方(直近)に1つのアタッチスピーカを配置した例を示したが、本発明はこれに限るものではない。例えば視聴者Uの前方または側方に2つのアタッチスピーカを配置し、ステレオ音声を放音するように設定してもよいし、正中面方向の音声に対して定位の前後を誤判定し易い人間の聴覚の特性を利用して、視聴者の頭部直近後方のソファや、映画館の座席のヘッドレストにアタッチスピーカを設置しても良い。
【0072】
いずれの場合も、アタッチスピーカとサラウンドスピーカの音量バランスを調整することで、視聴者の周囲の任意の位置に音像を定位させることができる。
【0073】
また、図8には、視聴者Uの前方(直近)に1つの音声ビームが焦点を結ぶ例を示したが、本発明はこれに限るものではなく、例えばスピーカアレイが2つの音声ビーム(ステレオ音声ビーム)を出力(放音)し、視聴者Uの前方の左右でそれぞれ焦点を結ぶように設定してもよい。このようにすることで、2つのアタッチスピーカを配置した場合と同様の効果が得られる。
【0074】
なお、以上の説明では、音響再生装置3は、映像再生装置が出力した映像信号を解析して、映像の座標を算出する構成を説明したが、例えばコンテンツの信号ストリームに予め書き込まれた映像の座標情報を用いるなど音響再生装置3の外部から映像の座標情報を与えても良い。その場合は映像信号を解析することなく、この座標情報に基づいてミックスレベルを算出するように構成するとよい。これにより、音響再生装置3の構成を簡略化できる。また、座標情報は、必ずしも3Dコンテンツから取得しなくてもよい。例えば、2Dコンテンツを再生装置によって3D映像に変換した後の映像データを使ってもよいし、2D映像の画像の時系列相関の解析や、画像と音声/音量変化の連動の解析から3次元座標を予想して作成された座標情報を使用してもよい。
【0075】
具体的には、2D画像から動きのある物体の座標を取得するためには、以下のような方法が考えられる。時系列相関の解析により、時間軸上の連続したフレーム中からある物体像を抽出し、次フレームで(相似図形で)像が大きくなっている物体は近づいていると推測する。また、背景と注目物体の大きさの関連(遠近法)から座標情報(の変化)を取得したり、霧の中から近づいてくるときに輪郭が次第にはっきりすることを利用したりするなどすればよい。前述の例では、抽出したある物体が近づく/遠ざかる、の相対関係が主に抽出される。絶対的な距離は、その映像が室内シーンなのか屋外なのか、などシーン判別の手法を用いて算出できる絶対的な距離を概算すると、上記遠近移動を組み合わせて判断することも可能である。また、上記映像上で大きくなる物体が、近づいてくるのか、風船を膨らませているときのように物体自体が膨張しているのか、判別がつきにくい場合も考えられる。そのような場合は音声信号を援用してもよい。例えば物体の見かけ(画角)上の寸法が大きくなるに従い音量が大きくなるような音声信号成分があれば、その物体は近づいていると判断する。あるいは後述のようにマルチチャンネル信号の音像のパンニング状況も勘案して判断することも可能である。また、近年デジタルカメラなどで頻用されている顔検出を利用して、顔の部位間の距離(例えば目の間隔)の変化などで前後移動を推定するなどの方法も考えられる。
【0076】
また、必ずしも画像処理を用いないでもソースの音源から音像の座標情報を抽出することにより本発明を実施することも可能である。コンテンツの音声トラック内でも音像移動を意図して5.1chや7.1chなど複数の音声チャンネルを用いてミキシングされたものがある。例えば頭上(真上)を通過するヘリコプタなどの音源が前後に移動する場合を考える。このとき、最初は音像の持つ信号(モノラル)をセンタスピーカのみから放音し、次にセンタ+L・R同音量に振り分け、次にL・R同音量+SR・SL同音量(このとき前後の音量比で前後の音像移動をする)、次にSR+SL同音量、(バックスピーカがあればさらにこの後バックに音量を振り分ける)のようにして前方から後方に向けての音像の移動を感じさせる。このようなソースの場合、音響再生装置では、逆にミキシングされた音声トラックを解析して、同相(モノラル)成分がどのようにチャンネルに振り分けられているか解析することで製作者の意図する音像の移動を推測することができる。さらに、[発明が解決しようとする課題]で述べたような距離感と音に関する人間の知覚の習性を利用して、コンテンツ製作者が距離感を感じさせるための表現として、直接音と間接音の比率を変えることが通常行われている。前記と同様、音声トラックから直接音と間接音の比率を算出し、算出値から製作者の意図する音像の座標を推測することができる。これらを用いて音像の位置情報を得て本発明の音像移動に利用することができる。
【0077】
以上のように、音像の座標情報は種々の方法によって取得することができ、いずれの方法をとってもよいし、複数の方法を組み合わせて座標情報取得精度を向上することも考えられる。
【符号の説明】
【0078】
1,6…3Dシステム 2…映像再生装置 3,8…音響再生装置 21…コンテンツ信号受信部 22…コンテンツ再生部 23…映像処理部 25…映像信号出力部 26…音声信号出力部 31…映像信号入力部 32…映像処理部 33…音声信号入力部 34…音像処理部 35…第1音源信号出力部 36…第2音源信号出力部 37…映像信号出力部 37…映像信号出力部 38…モニタ 41…Lchスピーカ 42…Cchスピーカ 43…Rchスピーカ 44…SLchスピーカ 45…SRchスピーカ 47…アタッチスピーカ

【特許請求の範囲】
【請求項1】
表示装置が表示する映像の視聴環境における座標情報を取得する座標情報取得手段と、
視聴位置の周囲に第1音源を配置し、該第1音源よりも前記視聴位置の近くに第2音源を配置させる放音手段と、
前記映像に対応する音声信号を前記第1音源と前記第2音源に供給する供給手段と、
前記座標情報に応じて、前記第1音源と前記第2音源に供給する音声信号のゲイン比率を調整する音像制御手段と、
を備えた音響再生装置。
【請求項2】
前記放音手段は、前記第1音源の音声信号を放音する第1スピーカと、該第1スピーカよりも前記視聴位置の近くに設置され、前記第2音源の音声信号を放音する第2スピーカと、を備えた請求項1に記載の音響再生装置。
【請求項3】
前記放音手段は、
複数のスピーカユニットが配列されたスピーカアレイと、
前記第2音源の音声信号を遅延させて前記複数のスピーカユニットに分配し、前記第2音源を定位させる位置で焦点を結ぶ音声ビームを前記スピーカアレイに放音させる信号処理手段と、
前記第1音源の音声信号を放音するスピーカと、
を備えた請求項1または2に記載の音響再生装置。
【請求項4】
前記音像制御手段は、前記第1音源が放音する音声信号に残響成分を付加し、その付加量を前記映像の座標情報に従って増減する請求項1乃至3のいずれかに記載の音響再生装置。
【請求項5】
前記音像制御手段は、前記第1音源が放音する音声信号に付加する残響成分量に応じて、第1音源と第2音源に供給する音声信号のゲイン比率を変動させる請求項4に記載の音響再生装置。
【請求項6】
前記音像制御手段は、前記映像の座標情報に応じて音声信号における所定帯域の周波数の変化を抑制するように、前記第2音源の音声信号の周波数特性を調整する請求項1乃至5のいずれかに記載の音響再生装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate