説明

3次元音場情報再生装置及びプログラム

【課題】3次元音場情報を記録再生する際にノーマルなノーマルオーディオ情報と互換を保って3次元音場情報再生を可能とするフォーマットを提供する。
【解決手段】3次元音場情報再生装置は、ノーマルオーディオのオーディオオブジェクトを再生する手段と、オーディオオブジェクトを管理する管理情報を再生しその管理情報を用いてオーディオオブジェクトの再生を制御する手段と、ノーマルオーディオの各フレームの所定単位ごとにオーディオオブジェクトのユーザーデータ領域に記録されている3次元音場情報に関する情報を再生しその情報を用いて3次元音場データの再生を制御する手段とを有する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、3次元音場情報を再生する装置及びプログラムに係り、特にノーマルオーディオ情報と互換を保って3次元音場情報再生を好適に実現する方法であって、DVD等の既存のノーマルオーディオを記録してあるメディアの互換性を損なわずに、音の定位技術を用いて立体音響を視聴者が高臨場感で楽しむことが可能な高臨場感シアターシステム技術に関する。
【背景技術】
【0002】
従来、3D音場に関する技術、即ちスピーカーのないところから、あたかもスピーカーがあるように音を定位させて再生する技術がいくつかの方式で提案されている。また、DVDビデオ、DVDオーディオ等の規格に関する技術も提案されている。
【0003】
従来から、例えば、3次元バーチャルリアリティシステム等において、仮想体験による臨場感を向上させる手段として、音像定位装置が使用されている。この種のシステムでは、例えばモノラル音源からバイノーラル手法に基づいて、時間差、振幅差及び周波数特性差を持つ複数チャネルの信号を発生させることにより、聴感上、方向感及び距離感を与えて立体音場を生成する。即ち、オーディオ入力信号は、例えばノッチフィルタにより特定の周波数成分が減衰されて上下方向感が付与され、遅延回路によって時間差を持つ左右チャネルの信号に変換され、FIR(有限インパルス応答)フィルタにより、仮想音源位置からの音響伝達特性が付与される。FIRフィルタのフィルタ係数は、予めダミーヘッドにより測定された頭部伝達関数(HRTF:Head Related Transfer Function)を記憶したHRTFデータベースから与えられる。
【0004】
特許文献1には、こうした従来の音像定位装置では、すべての仮想音源位置からのHRTFを記憶しておくことは不可能であるため、通常は、リスナから所定距離だけ離れた位置からの伝達特性のみを測定して記憶することで発生する、所定外の距離における各耳で感じる音像が一致せず良好に定位しないという問題を解決するために、リスナから前記所定距離とは異なる距離だけ隔てた位置が仮想音源位置として指定された際、その指定された仮想音源位置により特定される伝達距離及び伝達方向とリスナの両耳間の距離とに基づいて前記仮想音源位置から前記リスナの各耳に至る右チャネルの伝達方向と左チャネルの伝達方向とをそれぞれ算出し、これら左右チャンネルの伝達方向により前記左右チャネル用のフィルタの音響伝達特性をそれぞれ決定する技術が開示されている。
【0005】
また、特許文献2には、DVDビデオやDVDオーディオのフォーマットに互換性を持って独自のデータを記述する方法の一例が開示されている。
【特許文献1】特開平10−17420号公報
【特許文献2】特開平11−178090号公報
【非特許文献1】NHK放送技術研究所、「3次元映像の基礎」、オーム社、1995年
【非特許文献2】イエンスブラウエルト著、「空間音響」、鹿島出版会、1985年
【発明の開示】
【発明が解決しようとする課題】
【0006】
解決しようとする問題点は、空間音響の空間定位技術を用いた音響の再生を、既存のDVDビデオ規格や、DVDオーディオのように、ステレオ再生を含む従来再生方法と互換性を持って、記録再生するフォーマットがなかった点である。
【0007】
本発明は、このような従来の事情に鑑みてなされたもので、3次元音場情報を記録再生する際にノーマルなノーマルオーディオ情報と互換を保って3次元音場情報再生を可能とするフォーマットを提供することができ、空間音響の空間定位技術を用いた音響の再生を既存のDVDビデオ規格やDVDオーディオのようにステレオ再生を含む従来再生方法と互換性を持って記録再生することを目的とする。
【課題を解決するための手段】
【0008】
上記目的を達成するため、本発明に係る3次元音場情報再生装置は、ノーマルオーディオのオーディオオブジェクトを再生する手段と、前記オーディオオブジェクトを管理する管理情報を再生しその管理情報を用いて前記オーディオオブジェクトの再生を制御する手段と、前記ノーマルオーディオの各フレームの所定単位ごとに、前記オーディオオブジェクトのユーザーデータ領域に記録されている3次元音場情報に関する情報を再生しその情報を用いて3次元音場データの再生を制御する手段とを有することを特徴とする。
【0009】
別の側面において、本発明に係る3次元音場情報再生装置は、ノーマルオーディオのオーディオオブジェクトを再生する手段と、前記オーディオオブジェクトを管理する管理情報を再生しその管理情報を用いて前記オーディオオブジェクトの再生を制御する手段と、前記ノーマルオーディオの各フレームの所定単位ごとに、前記オーディオオブジェクトのノーマルオーディオとは別のストリームデータとして多重化し記録されているストリームから3次元音場情報に関する情報を分離して再生しその情報を用いて3次元音場データの再生を制御する手段とを有することを特徴とする。
【0010】
さらに別の側面において、本発明に係る3次元音場情報再生装置は、ノーマルオーディオのオーディオオブジェクトを再生する手段と、前記オーディオオブジェクトを管理する管理情報を再生しその管理情報を用いて前記オーディオオブジェクトの再生を制御する手段と、前記ノーマルオーディオの各フレームの所定単位ごとに、前記管理情報が記録されている領域とは別の3次元音場用の管理情報領域に記録されている3次元音場情報に関する情報を再生しその情報を用いて3次元音場データの再生を制御する手段とを有することを特徴とする。
【0011】
上記目的を達成するため、本発明に係るプログラムは、ノーマルオーディオのオーディオオブジェクトを再生するステップと、前記オーディオオブジェクトを管理する管理情報を再生しその情報を用いて前記オーディオオブジェクトの再生を制御するステップと、前記ノーマルオーディオの各フレームの所定単位ごとに、前記オーディオオブジェクトのユーザーデータ領域に記録されている3次元音場情報に関する情報を再生しその情報を用いて3次元音場データの再生を制御するステップとをコンピュータに実行させることを特徴とする。
【0012】
別の側面において、本発明に係るプログラムは、ノーマルオーディオのオーディオオブジェクトを再生するステップと、前記オーディオオブジェクトを管理する管理情報を再生しその情報を用いて前記オーディオオブジェクトの再生を制御するステップと、前記ノーマルオーディオの各フレームの所定単位ごとに、前記オーディオオブジェクトのノーマルオーディオとは別のストリームデータとして多重化し記録されているストリームから3次元音場情報に関する情報を分離して再生しその情報を用いて3次元音場データの再生を制御するステップとをコンピュータに実行させることを特徴とする。
【0013】
さらに別の側面において、本発明に係るプログラムは、ノーマルオーディオのオーディオオブジェクトを再生するステップと、前記オーディオオブジェクトを管理する管理情報を再生しその情報を用いて前記オーディオオブジェクトの再生を制御するステップと、ノーマルオーディオの各フレームの所定単位ごとに、前記管理情報領域とは別の3次元音場用の管理情報領域に記録されている3次元音場情報に関する情報を再生しその情報を用いて3次元音場データの再生を制御するステップとをコンピュータに実行させることを特徴とする。
【発明の効果】
【0014】
本発明によれば、3次元音場情報を記録再生する際にノーマルなノーマルオーディオ情報と互換を保って3次元音場情報再生を可能とするフォーマットを提供することができ、空間音響の空間定位技術を用いた音響の再生を既存のDVDビデオ規格やDVDオーディオのようにステレオ再生を含む従来再生方法と互換性を持って記録再生することができるようになる。例えば、バイフォニック録音のように、オーディオのデータはノーマルなものと非常に相関関係があるもの、とくにDVD等の既存のノーマルオーディオを記録してあるメディアからの再生互換性を損なわずに、音の定位技術を用いて立体音響を視聴者が高臨場感で楽しむことが可能な3次元音場再生が可能な高臨場感シアターシステムを実現することができる。
【発明を実施するための最良の形態】
【0015】
以下、本発明に係る3次元音場情報再生装置及びプログラムを実施するための最良の形態について、添付図面を参照して説明する。
【0016】
本実施形態は、例えばDVDビデオやDVDオーディオの規格に準拠した状態で、立体音場再生に必要な3次元音場情報をDVD規格に互換性を保ってメディアに記録再生することができるシステムを提供するものである。この形態は、DVDに限らず、ノーマルオーディオを再生する仕組みを持つアプリケーションやメディアに関して同様に応用できる。
【実施例】
【0017】
本実施例は、3次元音場情報の記録装置とその再生装置とから構成されている。
【0018】
図1は、本実施例の記録装置の全体構成を示す。図1に示す記録装置は、ノーマルオーディオマイク1、バイノーラルオーディオマイク2、ノーマルオーディオ圧縮器3、バッファ4、ノーマルオーディオ復号器5、減算器5a、差分バイノーラルオーディオ圧縮器6、情報多重化器7、カメラ8、ビデオ圧縮器9、バッファ10、DVDフォーマット化器11、記録器12、バッファ13、タイムスタンプ発生器14、及び制御部15を備えている。制御部15は、本装置内の各部に指令信号を出力して個々の動作を行わせるようになっている。
【0019】
ノーマルオーディオマイク1は、ノーマルなオーディオ情報を収録し、ノーマルオーディオ圧縮器3に供給する。ここでいうノーマルオーディオとは、3次元音場オーディオ以外のものと定義する。例えば、通常のステレオオーディオである。
【0020】
バイノーラルオーディオマイク2は、ノーマルオーディオマイク1によるノーマルオーディオの収録と同時に、3次元音場データとして、バイノーラル収録を行い、バイノーラルオーディオデータとして減算器5aに供給する。このバイノーラル収録は、ダミーヘッドを用いる等をして行う。
【0021】
ノーマルオーディオ圧縮器3は、ノーマルオーディオマイク1によって収録されたノーマルオーディオデータを所定の圧縮方式を用いて圧縮し、バッファ4及びノーマルオーディオ復号器5に供給する。ここで用いる圧縮方式は、MPEG方式でもDOLBY−DIGITAL(AC3)であっても構わない。
【0022】
バッファ4は、ノーマルオーディオ圧縮器3によって圧縮されたデータを、後述するビデオや差分バイノーラルオーディオとの同期を取るために一時的にバッファリングする。
【0023】
ノーマルオーディオ復号器5は、ノーマルオーディオ圧縮器3によって圧縮されたデータを復号し、減算器5aに供給する。
【0024】
減算器5aは、ノーマルオーディオ復号器5にて復号化されたノーマルオーディオデータから、バイノーラルオーディオマイク2にて収録されたバイノーラルオーディオデータを減算して差分バイノーラルオーディオデータを作成し、これを差分バイノーラルオーディオ圧縮器6に供給する。
【0025】
差分バイノーラルオーディオ圧縮器6は、減算器5aからの差分バイノーラルオーディオデータを所定の圧縮方式を用いて圧縮する。圧縮方式は、MPEG方式でもDOLBY−DIGITAL(AC3)であっても構わない。AAC方式等は、可変長符号化を用いて非常に圧縮効率が良いものであり、本方式では好適なアルゴリズムといえる。
【0026】
ここで、上記圧縮方式としてAAC方式を用いた場合の圧縮器(符号化装置)について、図2及び図3を参照して説明する。
【0027】
図2に示すAAC方式を用いた符号化装置は、図示の機能部、即ち聴覚心理分析器101、MDCT(変形離散コサイン変換:Modified Discrete Cosine Transform)器102、量子化器103、グループ処理器104、可変長符号化器105、ビット数判定器106、ビットストリーム生成器107、及び処理制御部108から構成されている。
【0028】
聴覚心理分析器101は、オーディオ信号を所定サンプル数からなるフレーム単位で取り込み、その入力オーディオ信号に対して高速フーリエ変換(FFT:Fast Fourier Transform)を行って周波数スペクトルを求め、その周波数スペクトルに基づいて聴覚上のマスキングを演算し、予め設定された周波数帯域毎の許容量子化雑音電力と聴覚心理パラメータを算出すると共に、その聴覚心理パラメータに基づいてMDCTのための変換ブロック長を決定する。
【0029】
MDCT器102は、聴覚心理分析器101と同様にオーディオ信号を所定サンプル数からなるフレーム単位で取り込み、入力オーディオ信号に対してMDCTを行って周波数スペクトルに変換し、各周波数スペクトルに係るMDCT係数を求める。その場合、MDCT器102は、周波数スペクトルへの変換に際して、その変換ブロック長を50%ずつオーバーラップさせ、例えば、2048サンプルを1024本のMDCT係数に変換する。
【0030】
このMDCT器102は、聴覚心理分析器101から得られる変換ブロック長情報に基づいてMDCTの対象となるブロック長を長い変換ブロック(ロングブロック)又は短い変換ブロック(ショートブロック)に切り替えるためのブロックスイッチング機能を採用している。これは、一般に長い変換ブロック長を用いる方がスペクトルの集中度が高まるので効率的なビット配分を行えるが、周波数領域での量子化雑音は時間領域に戻された時に変換ブロック長全体に広がるため、静寂部の後で急峻な立ち上がり(アタック部)を有するような波形を長いブロック長で変換して量子化すると、その量子化雑音が静寂部まで広がることになり、聴覚上極めて耳障りなものとなるからである。
【0031】
即ち、MDCT器102は、聴覚心理分析器101から得た変換ブロック長情報に基づいて変換ブロック長を選択し、特に、アタック部の前後では長い変換ブロックから複数個の短い変換ブロックに切り替えるようにしている。例えば、定常的な信号の場合には、MDCTの変換ブロック長は2048サンプルのロングブロックとして1024本のMDCT係数に変換し、一方、過渡的な信号の場合には、256サンプルのショートブロックとして128本のMDCT係数に変換する。そして、ショートブロックについては、8個連続で短い変換長を選択することとし、出力されるMDCT係数の本数を1024本としてロングブロックと一致させるようにしている。
【0032】
量子化器103は、人間の聴覚特性に基づいて周波数帯域毎に1024本のMDCT係数を複数のスケールファクタバンドに分け、各スケールファクタバンド毎にMDCT係数を正規化して量子化を行う。その際に、ショートブロックの場合には128本のMDCT係数を複数のスケールファクタバンドに分ける。また、各スケールファクタバンドについて計算された量子化雑音が聴覚心理分析器101で算出された許容量子化雑音電力よりも大きくならないように、各スケールファクタバンドの量子化ステップ数を制御し、且つ量子化に必要なビット数がフレーム単位で所定ビット数以内に収まるように全体の量子化ステップ数を制御して量子化を実行する。なお、スケールファクタバンドの量子化ステップ数とは、各周波数帯域内のサンプルデータを波形と倍率に分離し、波形の最大振幅が1.0となるように正規化して倍率を符号化したものに相当し、スケールファクタとも言われるものである。量子化されたデータはグループ処理器104へ供給される。
【0033】
グループ処理器104は、量子化器103からの量子化されたデータに対し、より高い符号化効率が得られるようにショートブロックについてグループ化を行う。グループ化されたブロックでは補助情報が共有化され、符号化効率が改善されることになる。
【0034】
図3は、そのグルーピングの一例を示し、8個のショートブロックが4組のグループ(Group 0〜4)に分けられており、各グループには、それぞれ3個(Group 0)、1個(Group 1)、2個(Group 2)、2個(Group 3)のショートブロックが含まれている。
【0035】
可変長符号化器105は、量子化器103とグループ処理器104で処理された後のMDCT係数の量子化値やスケールファクタ等の符号化パラメータに対して可変長符号化処理を施して冗長度を削減し、それをビット数判定器106へ出力する。
【0036】
ビット数判定器106は、符号化された1フレーム分のビット数が予め設定された所定範囲内に収まっているか否かを判定し、その条件を満たしていれば、符号化データをそのままビットストリーム生成器107へ出力するが、満たしていない場合には、その判定結果を処理制御部108へ出力する。
【0037】
処理制御部108は、その判定結果に基づいて量子化器103とグループ処理器104と可変長符号化器105による前記の一連の処理を再度実行させ、ビット数判定器106において前記条件を満たしていると判定されるまでその処理を反復させる。ビット数判定器106にて前記条件を満たした符号化データは、ビットストリーム生成器107へ出力され、ブロック情報等の符号化パラメータと共に多重化されたビットストリームとして伝送されることになる。
【0038】
以上が圧縮方式としてAAC方式を用いた場合の説明である。
【0039】
引き続いて、図1に示す記録装置の構成の説明に戻る。
【0040】
ビデオ圧縮器9は、カメラ8から入力されるビデオ信号を所定の圧縮方式を用いて圧縮する。ここでの圧縮方式は、MPEG方式等を用いる。
【0041】
バッファ10は、ビデオ圧縮器9にて圧縮されたビデオ圧縮データを、ノーマルオーディオ圧縮器3によって圧縮されてバッファ4にバッファリングされているデータや、差分バイノーラルオーディオ圧縮器6にて圧縮されてバッファ13にバッファリングされている差分バイノーラルオーディオとの同期を取るために一時的にバッファリングする。
【0042】
タイムスタンプ発生器14は、タイムスタンプとして、27MHzまたは90KHzのカウンター情報を使用し、情報多重化器7に供給する。
【0043】
情報多重器7は、バッファ10にバッファリングされているビデオ圧縮データ、バッファ4にバッファリングされているノーマルオーディオ圧縮データ、及びバッファ13にバッファリングされている差分バイノーラルオーディオ圧縮データを、同期を取りながら多重化する。ここでの多重化は、MPEGシステムレイヤの同期方式でプログラムストリーム方式を用いて各エレメンタリー毎にパック化し、再生時の同期を取れるようにプレゼンテーションタイムスタンプを打ちながら多重化する。タイムスタンプは、タイムスタンプ発生器14から27MHzまたは90KHzのカウンター情報が使用される。この仕組みは、MPEG多重化の規格を用いれば可能であるので詳細な説明は省略する。
【0044】
DVDフォーマット化器11は、多重化されたストリームを後述するDVDの規格に準拠した形式にフォーマット化する。
【0045】
記録器12は、DVDフォーマット化器11にてDVDの規格に準拠した形式にフォーマット化された多重化ストリームを記録媒体RMに記録する。ここで記録媒体RMとしてDVDのROM型のメディアを作成するには、DVDのマスターデータとして一旦HDDに記録してから製造工程を経て、DVDメディアに記録される。
【0046】
次に、本実施例の再生装置について、図4を参照して説明する。
【0047】
図4に示す再生装置は、再生器21、DVDフォーマット復号器22、情報分離化器23、差分バイノーラルオーディオ復号器24、加算器24a、ノーマルオーディオ復号器25、音源選択器26、GUI(Graphical User Interface)27、スピーカー28、バッファ29、ビデオ復号器30、バッファ31、画像表示器32、バッファ33、STCタイムスタンプ比較器34、及び制御部35を備えている。制御部35は、本装置内の各部に指令信号を出力して個々の動作を行わせるようになっている。
【0048】
再生器21は、記録媒体15からデータを再生し、DVDフォーマット復号器22に供給する。
【0049】
DVDフォーマット復号器22は、再生データのDVDフォーマットからMPEGのストリームを抽出する。この図には示していないがDVDは再生するための情報(例えばプレイリスト情報や、特殊再生情報)は別途、抽出して、図示していないユーザーインターフェースやCPUを経由して、インターラクティブな再生を行うことができる。
【0050】
情報分離化器23は、抽出されたMPEGストリームからMPEG多重化を解いて、ビデオ、ノーマルオーディオ、及び差分バイノーラルオーディオに分離する。
【0051】
ビデオ復号器30は、分離されたビデオを復号し、バッファ31に供給する。バッファ31は、復号されたビデオを一時的にバッファリングする。
【0052】
ノーマルオーディオ復号器25は、分離されたノーマルオーディオを復号し、バッファ29及び加算器24aに供給する。バッファ29は、復号されたノーマルオーディオを一時的にバッファリングする。
【0053】
差分バイノーラルオーディオ復号器24は、差分バイノーラルオーディオデータを復号し、加算器24aに供給する。加算器24aは、復号された差分バイノーラルオーディオデータとノーマルオーディオ復号器25からのノーマルオーディオと加算し、バッファ33に供給する。バッファ33は、加算されたデータを一時的にバッファリングする。
【0054】
STCタイムスタンプ比較器34は、情報分離化器23にて各エレメンタリーのパック化されたデータのヘッダに記録されているSCR(システムクロックリファレンス)やタイムスタンプを検出し、MPEG多重化方式で設定されているSCRにて同期させたSTC(システムタイムクロック)時刻と、プレゼンテーションタイムスタンプとを比較し、プレゼンテーションタイムスタンプ時刻がSTC時刻と一致したときに、バッファ33,29,31のそれぞれの復号データからエレメンタリー情報を出力する。
【0055】
画像表示器32は、バッファ31からのビデオを画像表示する。
【0056】
GUI27は、ユーザーにより指定された音源、即ちノーマルオーディオかバイノーラルオーディオかを選択する選択信号を入力し、音源選択器26に出力する。音源選択器26は、バッファ33,29からのオーディオを、GUI27からの選択信号に従って、オーディオの音源を選択し、スピーカー28にて出力再生させる。
【0057】
このようにして、ノーマルオーディオデータと3次元音場データであるバイノーラルオーディオデータは、差分をとることで相関の強い部分を削除して、音場を表現する位相差や響き部分の情報が差分として符号化されることで、より符号化効率及び記録能率を上げることができる。
【0058】
次に、図5に示すDVDビデオ規格を利用して、ノーマルオーディオの各フレームの所定単位ごとに、3次元音場情報に関する情報をオーディオオブジェクトのノーマルオーディオとは別のストリームデータとして多重化して記録再生する場合の実施例を説明する。
【0059】
前述した差分バイノーラルオーディオデータは、本来、DVD規格ではないので、MPEG多重化されるパックに別のストリームとして記録することが考えられる。図5に示す一番下の階層には、その差分バイノーラルオーディオデータが所定のサンプル数で1オーディオフレームとしてレイヤを構成している。これらの1オーディオフレームが所定数集まって、約2kBでパック(PACK)を構成する。このパックにはヘッダが付いており、14バイトのパックヘッダとオーディオパケットにより構成され、オーディオパケットは9〜29バイトのパケットヘッダ、1バイトのサブストリームID、3バイトのオーディオフレーム情報、3バイトのオーディオデータ情報を記録し、その後ろに2013バイトの差分オーディオデータにより構成される。これらはディファレンシャルパック(D_PACK)として、ほかのノーマルオーディオパック(A_PACK)やビデオパック(V_PACK)と共に、バイノーラルオーディオデータパックとしてMPEG多重化される。
【0060】
ここで、図5に示すDVDビデオフォーマットを上位から見てみると、DVDビデオには、記録層がVolume spaceとして、Volume and File structure、DVD-video zone、及びDVD-others zoneに分かれている。この内、DVD-video zoneにはビデオマネージャー(VMG)及びビデオタイトルセット(VTS)という構造が存在している。
【0061】
ビデオマネージャーは、ビデオマネージャーインフォメーション等後続するビデオタイトルセットの識別情報や様々な情報自体のスタートアドレスやエンドアドレス、どこのビデオストリームから再生を開始するか等の情報が記述されている。ビデオタイトルセットには、再生されるべきオーディオやビデオのデータのアドレス情報や識別情報等のControl Dataが記述されている。
【0062】
これらのビデオマネージャーやビデオタイトルセット中のControl Dataは、管理情報領域であり、再生には必須な情報であって、この領域のデータは、前述したDVDフォーマット化器11やDVDフォーマット化ステップによって記録され、前述したDVDフォーマット復号器22やDVDフォーマット復号ステップによって再生される。
【0063】
Control Dataの後側には、ビデオオブジェクトセット(VOBS)というビデオとオーディオの多重化されたMPEGストリームのセットがあり、さらにビデオオブジェクトセットにはビデオオブジェクト(VOB)という小単位のMPEGストリームがある。ビデオオブジェクトの下にはさらに細分化されたセル(CELL)という単位、さらにセルの下にはビデオオブジェクトユニット(VOBU)があり、これがMPEGストリームのグループオブピクチャー(GOP)にほぼ相当する構造となっていて、0.4〜1.0秒程度のものである。
【0064】
ビデオオブジェクトユニットには、先頭にナビゲーションパック(NV_PACK)というストリームサーチ情報等が記述されている。また、ビデオパック(V_PACK)というビデオ圧縮データがパック化されたデータ、オーディオパック(A_PACK)というオーディオ圧縮データがパック化されたデータがあり、それぞれMPEG多重化されている。このようにDVDビデオ規格に準拠した形式で、ディファレンシャルパック(D_PACK)という前述したバイノーラルオーディオデータパックとしてパック化してMPEG多重化される。
【0065】
従って、本実施例では、ディファレンシャルパックを用いれば、バイノーラル3次元音場オーディオが再生でき、ディファレンシャルパックを用いなければ、DVDビデオ規格として標準的なノーマルオーディオが出力できるフォーマットとなる。
【0066】
次に、図6に示すDVDビデオ規格を利用して、ノーマルオーディオの各フレームの所定単位ごとに、3次元音場情報に関する情報を前記管理情報領域とは別の3次元音場用の管理情報領域に記録再生する場合の実施例を説明する。
【0067】
この方法は、DVDビデオの規格を準拠する形式をとりながらも、前述したディファレンシャルパックに記録するのではなく、DVD-others zoneというDVD規格準拠の形式で、自由に使用できる領域にバイノーラル3次元音場オーディオ情報を記録再生する方法である。
【0068】
DVD-others zoneには、ビデオマネージャー(DVMG)及びビデオタイトルセット(DVTS)という構造を記述する。ビデオマネージャーは、ビデオマネージャーインフォメーション等後続するビデオタイトルセットの識別情報や様々な情報自体のスタートアドレスやエンドアドレス、どこのビデオストリームから再生を開始するか等の情報が記述されている。ビデオタイトルセットには、再生されるべきオーディオやビデオのデータのアドレス情報や識別情報等のビデオタイトルセットインフォメーション(DVTSI)が記述されている。
【0069】
これらのビデオマネージャーやビデオタイトルセットインフォメーションは、管理情報領域であり、再生には必須な情報であって、この領域のデータは、前述したDVDフォーマット化器11やDVDフォーマット化ステップによって記録され、前述したDVDフォーマット復号器22やDVDフォーマット復号ステップによって再生される。
【0070】
ビデオタイトルセットには、ビデオタイトルセット情報の後側にビデオオブジェクトセット(DVOBS)というビデオとオーディオの多重化されたMPEGストリームのセットがあり、さらにビデオオブジェクト(DVOB)という小単位のMPEGストリームがある。ビデオオブジェクトの下にはさらに細分化されたセル(DCELL)という単位、さらにはビデオオブジェクトユニット(DVOBU)があり、このビデオオブジェクトユニットに、バイノーラル3次元音場オーディオ情報のフレームレイヤの数フレームをまとめた構造になっている。
【0071】
このように、DVD-video zoneの2D映像のデータと同じ構造とし、一つ一つのビデオオブジェクトユニット、セル、ビデオオブジェクト等は、同じフレーム枚数(同じ再生時間長)を持たせることで、サーチ等のアクセス性を高めることができる。
【0072】
このようにして、DVDビデオ規格に準拠した形式で、DVD-video zoneとDVD-others zoneにリンクした形式でバイノーラル3次元音場オーディオ情報データを記述しておけば、バイノーラル3次元音場オーディオとノーマルオーディオをDVDビデオ規格互換で記録再生することができる。
【0073】
次に、図7に示すDVDオーディオ規格を利用して、ノーマルオーディオの各フレームの所定単位ごとに、3次元音場情報に関する情報をオーディオオブジェクトのノーマルオーディオとは別のストリームデータとして多重化により記録再生する場合の実施例を説明する。
【0074】
図7に示すように、DVDオーディオのフォーマットは、オーディオマネージャ(AMG)と、オーディオマネージャに続く複数のオーディオタイトルセット(ATS)の各エリアにより構成されている。オーディオタイトルセットの各々は、これに対応して先頭のATSインフォメーション(ATSI)と、それに続く1以上のオーディオオブジェクトセット(AOBS)により構成されている。
【0075】
これらのオーディオマネージャやATSインフォメーションは、管理情報領域であり、再生には必須な情報であって、この領域のデータは、前述したDVDフォーマット化器11やDVDフォーマット化ステップによって記録され、DVDフォーマット復号器22やDVDフォーマット復号ステップによって再生される。
【0076】
オーディオオブジェクトセットの各々は、複数のオーディオオブジェクト(AOB)により構成されている。オーディオオブジェクトの各々は、複数のセル(CELL)により構成され、セルは、さらに、複数のオーディオオブジェクトユニット(AOBU)により構成されている。オーディオオブジェクトユニットの各々は、複数のパックにより構成され、1パックは2048バイトで構成されている。オーディオオブジェクトユニットは、0.4〜1.0秒分の任意の数のパックにより構成されている。隣接するオーディオパック(A_PACK)は、オーディオ信号が互いに関連するように配置され、例えばステレオの場合にはLチャネルパックとRチャネルパックが隣接して配置され、また、マルチチャネルの場合にも同様に隣接して配置される。これらはそれぞれMPEG多重化されている。オーディオオブジェクトユニットのなかに、ディファレンシャルパック(D_PACK)という前述したバイノーラルオーディオデータパックとしてパック化してMPEG多重化する。
【0077】
従って、ディファレンシャルパックを用いれば、バイノーラル3次元音場オーディオが再生でき、ディファレンシャルパックを用いなければ、DVDビデオ規格として標準的なノーマルオーディオが出力できるフォーマットとなる。
【0078】
次に、図8−1〜図8−7及び図9を参照して、DVDビデオ規格を利用して、ノーマルオーディオの各フレームの所定単位ごとに、3次元音場情報に関する情報をオブジェクトのユーザーデータ領域に記録再生する実施例を説明する。
【0079】
図8−1〜図8−7は、MPEGのビデオストリームビデオレイヤ(MPEG1ビデオ規格のビデオレイヤ(MPEG1 VIDEO SYNTAX(ISO-IEC11172-2より抜粋)))の説明表を、図9は、MPEGの多重化トランスポートストリームシステムレイヤの説明表をそれぞれ示す。
【0080】
MPEG規格には、互換性の取れるような、ユーザーデータ(user data)領域やプライベートストリーム(private stream)にて伝送する仕組みが用意されている。
【0081】
例えば、MPEGビデオの規格には、ピクチャーレイヤ、GOPレイヤ等にそれぞれ、ユーザーデータ領域が設定されている。これらは、MPEGのシンタックスで映像音声とは関係ないデータを埋め込むことのできる所定のエリアとして設定されているuser_data、もしくはprivate_data_byte、もしくはユーザーが任意に設定できるprivate_stream等のデータパケットに記録する。
【0082】
例えば、MPEG1のビデオにおけるピクチャーレイヤは、図8−1〜図8−7に示すようになっていて、スライスレイヤの手前で、user_data_start_codeを送った後にuser_dataを8ビット単位で記録することができるような仕組みが定義されている。
【0083】
また、MPEG2等の多重化トランスポートストリームのシステムレイヤにも図9に示すようにtransport_private_data_flagに1を立てると、private_dataが存在することを明示でき、データ長もトランスポートパケットをはみ出さないという制限のもとで、transport_private_data_lengthに設定したデータ長のprivate_dataを送信することができる。
【0084】
これ以外にも、MPEGシステムでユーザー固有のデータを記録する方法は、stream_idにprivate_streamを設定して専用のパケットを宣言することで送信する等、仕組みは幾つか定義されており、本発明におけるバイノーラル3次元音場オーディオ情報は、これらの領域に記録することができる。
【0085】
MPEG1ビデオのuser_dataを用いる例をもう少し詳細に説明する。
【0086】
user_data_start_codeは、スライスレイヤの手前で0x000001B2とMPEGでは定義されている。そのコードを送った後に、ユーザーデータエリア内で本発明の認証に用いる関数値の存在を示す、予め一意に識別可能なコードである例えば0x0f0f0f0f2428fdaaのコードを送信する。このコードは他のアプリケーションで、user_dataを使う場合に、識別する目的で記録するもので、コードの値は特に意味はない。そのコードの後に図6のオーディオフレームレイヤー構造を、MPEGの1ピクチャー毎にピクチャー表示区間に相当するオーディーフレームレイヤを記録する。ピクチャー表示区間とオーディオフレーム再生区間の時間幅が違う場合には、1パケット程度の誤差を平均的に許容する形式で多重化して、ビデオの先頭とオーディオの先頭のプレゼンテーションの時刻の差の情報を、user_dataの先頭に90KHzもしくは27MHzのクロックのカウント数で32ビット程度で記録するのでも良いし、再生側のクロックでデータ到着順に再生をし、暗黙の同期を取るのでも良い。
【0087】
また、ここでは伝送レートが高く取れるMPEGビデオのユーザーデータ領域に記録することを説明したが、オーディオの圧縮方式のDOLBY-DIGITAL(AC3)においても、SyncFrameという圧縮データを所定の単位で繰り返すファンクションの最後にauxdataとerrorcheckというファンクションが存在していて、auxdataには、最初の1ビットを1とすればユーザーデータを送れるようになっている。従って、このような仕組みを使用しても良い。DOLBY-DIGITAL(AC3)は、米国のATSCの規格になっており、ATSC standard (20 Dec.1995) Digital audio Compression (AC-3) (Doc.A/52)に、このシンタックスが詳細に記述されている。
【0088】
次に、本実施例の記録装置で用いるプログラムの処理フローチャートについて、図10を参照して説明する。ここでの詳細なステップの処理内容は、前述した図1に示す記録装置のブロック図で説明した内容と実質的に同じなので、ここではステップの順番についてのみ簡単に説明する。
【0089】
まず、ステップS110にて、ノーマルオーディオマイク1、バイノーラルマイク2から音響データを入力する。またカメラ8からの画像データを所定の時間分入力し、メモリに記憶する。
【0090】
次いで、ステップS120にて、ビデオデータとノーマルオーディオデータの圧縮を行い、ステップS130にて、ビデオ圧縮データと、ノーマルオーディオ圧縮データを一時バッファし、ステップS140にて、ノーマルオーディオデータの復号を行う。
【0091】
次いで、ステップS150にて、バイノーラルオーディオデータとノーマルオーディオ復号データの減算計算を行い、ステップS160にて、差分バイノーラルオーディオデータの圧縮を行う。
【0092】
次いで、ステップS170にて、ビデオ圧縮データ、ノーマルオーディオ圧縮データ、差分バイノーラルオーディオ圧縮データを、同期を取りながら多重化し、ステップS180にて、DVDフォーマット化を行い、ステップS190にて、所定の単位でメディアに記録する。記録メディアがDVDであれば、2KBが単位である。通信路等に出力する場合にはこのステップで通信路特有のパケット化を行う。
【0093】
次いで、ステップS200にて、入力画像データがまだあるかどうかを判定し、ある場合(YES)はステップS110に戻り、ない場合(NO)には、プログラムを終了する。
【0094】
次に、本実施例の再生装置で用いるプログラムの処理フローチャートについて、図11を参照して説明する。ここでの詳細なステップの処理内容は、前述した図4に示す再生装置のブロック図で説明した内容と実質的に同じなので、ここではステップの順番についてのみ簡単に説明する。
【0095】
まず、ステップS210にて、記録媒体もしくは伝送路から、多重化されたデータを所定の単位で読み取る。
【0096】
次いで、ステップS220にて、DVDフォーマットを復号する。DVDフォーマットの復号には、DVDフォーマットからMPEGのストリームを抽出し、このステップには示していないがDVDは再生するための情報(例えばプレイリスト情報や、特殊再生情報)は別途、抽出して、ユーザーインターフェースやCPUを経由して、インターラクティブな再生を行うことを含む。
【0097】
次いで、ステップS230にて、抽出されたMPEGストリームの情報分離化を行い、ステップS240にて、圧縮ビデオデータと圧縮ノーマルオーディオデータとを復号し、ステップS250にて、圧縮ビデオデータ、圧縮ノーマルオーディオデータ、一時バッファし、ステップS260にて、圧縮差分バイノーラルオーディオデータを復号する。
【0098】
次いで、ステップS270にて、差分バイノーラルオーディオデータとノーマルオーディオ復号データを加算計算し、ステップS280にて、GUIよりユーザーが指定した音源、即ちノーマルオーディオか、バイノーラルオーディオかを選択する信号等をもとに、バイノーラルオーディオデータとノーマルオーディオのどちらを再生するか選択する。
【0099】
次いで、ステップS290にて、ビデオと選択されたオーディオを同期して表示及びスピーカー再生を行う。
【0100】
次いで、ステップS300にて、表示画像音響データがまだあるかどうかを判定し、ある場合(YES)にはステップS210に戻り、ない場合(NO)は、プログラムを終了する。
【0101】
なお、本実施例では、図1及び図4に示す装置、図10及び図11に示すプログラムによる各処理において、最終的な情報は記録媒体に記録されたが、その他として、通信や放送特有のパケット化がなされて、パケット化器を経由して放送や通信網に伝送や受信をしてもよい。
【0102】
また、記録媒体にデータを記録しなくても、通信、放送等あらゆる伝送媒体を経由してデータを送信することが可能で、その場合には、記録装置は伝送装置として使用することもできる。また再生装置は受信装置として使用することも可能である。
【0103】
また、本実施例の信号データを記録した記録媒体は、3次元音場情報を記録再生する際に、ノーマルなノーマルオーディオ情報と互換を保って3次元音場情報再生を可能とするフォーマットを記録してあるという媒体特有の効果があり特徴を持っている。
【0104】
また、記録媒体は、媒体という定義はデータを記録できる媒体という、狭義な媒体というものだけでなく、信号データを伝送するための電磁波、光等を含む。また、記録媒体に記録されている情報は、記録されていない状態での、電子ファイル等のデータ自身を含むものとする。
【0105】
また、本実施例によるバイノーラルオーディオデータ情報は、MPEGのビデオのユーザーデータを用いる場合には、1ピクチャー毎に記録するように説明したが、0.5秒程度ごとでも、1秒程度ごとでも構わない。その場合には、MPEGのGOPレイヤのユーザーデータを用いることで実現できる。
【0106】
また、本実施例は、オーディオを中心に記載したが、ビデオと共にオーディオデータが存在していてMPEGの多重化でオーディオとビデオが多重化されていても本発明は有効であり、オーディオやビデオに限らず、他のサブピクチャーや制御情報等のデータがあっても同様である。
【0107】
また、3次元音場データにはバイフォニック録音されたオーディオデータの他にも、特別なサラウンド効果をもたらすデータや、3次元音場を作成するにあたり必要な無響室で録音されたようなレアな音源データから、頭部伝達関数とホール等の音場環境データによってシミュレーションにより仮想的に、バイフォニック録音に近い音場を作成することも可能である。
【0108】
また、本実施例では、3次元音場情報に関する情報はバイフォニック録音されたオーディオデータで説明を行ったが、上記の特別なサラウンド効果をもたらすデータや、3次元音場を作成するにあたり必要な無響室で録音されたようなレアな音源データ(レアオーディオ)であってもよい。レアオーディオからは特殊なエフェクトがかかっていないことから3次元音場を創生しやすいという利点がある。
【0109】
また、本実施例では、3次元音場データの圧縮方式は、MPEGやDOLBY−DIGITAL(AC3)で説明したが、他のDPCMやDCT等の直交変換で量子化する方式でも良い。またオーディオオブジェクトの種類としても、リニアPCMで圧縮をしないものや、可逆圧縮をしたもの、例えばDVDオーディオに採用されているPacked PCM (ロスレス圧縮方式)を用いても構わない。ノーマルオーディオにはリニアPCMのマルチチャンネルオーディオも応用できる。即ち、マルチチャンネルのLRの2CHを、本実施例のように3次元音場データに対応するLRとの差分をとるようにすればよい。それ以外のCHに関してはそのまま記録する。また、処理量に余裕がある場合には、所定の時間ごとにもっとも相関強いCHを選んで、適応的に3次元音場データとの差分をとるようにしてもよい。その場合、どのCHからの差分かを示す情報を数ビットで示し、ヘッダやユーザー領域に指示するフォーマットとすれば良い。また、レアオーディオとしては、無響室で録音したデータだけでなく、マルチマイクによるホール録音や6chにミックスダウンしたマスター音源でも良い。
【0110】
また、本実施例では、3次元音場を再生する方法としてバイノーラルオーディオを用いて説明したが、例えば複数のCHを持つことで、アレイスピーカーを用いて局在的音場を作り出すことも考えられる。即ち、空間上のある焦点付近の音圧を局所的に上昇させるようにスピーカーアレイの中心から焦点までの経路と、各スピーカーアレイから焦点までの経路との差に応じた遅延量を与えた再生信号により実現する方法である。
【0111】
この方法の原理について、図12を参照して説明する。まず、前述した再生装置の音源選択器に接続されるスピーカー28として、図12に示すようにスピーカーアレイ28a〜28aをアレイ状に複数組み、各スピーカーアレイ28a〜28aの一つ一つに遅延回路28b〜28bを個別に設ける。この構成において、聴取位置近傍に焦点を結ぶように各遅延回路28b〜28bにその遅延時間を設定すると、聴取位置において、スピーカーアレイ28〜28からの直接音よりも焦点において発生する音圧成分が極めて高くなるように再生させることが可能となる。この原理を用いて連続的にリアルタイムで制御することで立体動画像のオブジェクトの位置にリンクして音像の定位を制御できる。
【0112】
この場合、図13に示すように、再生装置のスピーカーを成すスピーカーアレイ28a〜28a及び画像表示器を成すLCD(液晶ディスプレイ)32aを臨む聴取位置P1から、いくつかの局在音場P2,P3を生成して3次元音場空間を作ることが可能である。この場合には、複数のCHを図5や図7に示すようにディファレンシャルパック(D_PACK)にして複数のストリームで多重化して記録する。もしくは図6に示すようにDVD others zoneにCH毎にオーディオフレームを作成し、所定の順に複数のCHを順番に多重化して記録することで、既存DVDと互換性を保ちながら、3次元音場データを記録(伝送)することが可能である。
【0113】
なお、上記した装置の機能をプログラムによりコンピュータに実現させるようにしてもよい。このプログラムは、記録媒体から読み取られてコンピュータに取り込まれてもよいし、通信ネットワークを介して伝送されてコンピュータに取り込まれてもよい。
【0114】
以上、本発明の実施例について説明したが、本発明の好適な実施の態様を以下の(1)〜(40)に列挙する。
【0115】
(1):3次元音場情報記録メディアにおいて、ノーマルオーディオのオーディオオブジェクトを記録した領域と、前記オーディオオブジェクトを管理する情報を記録した管理情報領域とを備えた情報記録メディアにおいて、ノーマルオーディオの各フレームの所定単位ごとに、3次元音場情報に関する情報をオブジェクトのユーザーデータ領域に記録したことを特徴とした。
【0116】
(2):3次元音場情報記録メディアにおいて、ノーマルオーディオのオーディオオブジェクトを記録した領域と、前記オーディオオブジェクトを管理する情報を記録した管理情報領域とを備えた情報記録メディアにおいて、ノーマルオーディオの各フレームの所定単位ごとに、3次元音場情報に関する情報をオーディオオブジェクトのノーマルオーディオとは別のストリームデータとして多重化により記録したことを特徴とした。
【0117】
(3):3次元音場情報記録メディアにおいて、ノーマルオーディオのオーディオオブジェクトを記録した領域と、前記オーディオオブジェクトを管理する情報を記録した管理情報領域とを備えた情報記録メディアにおいて、ノーマルオーディオの各フレームの所定単位ごとに、3次元音場情報に関する情報を前記管理情報領域とは別の3次元音場用の管理情報領域に記録したことを特徴とした。
【0118】
(4):上記(1)〜(3)の3次元音場情報記録メディアにおいて、ノーマルオーディオの各フレームの所定単位ごとの3次元音場情報に関する情報は、ノーマルオーディオ情報と、ほぼ無響室で録音したと等価のレアオーディオ情報との差分情報を差分符号化、予測符号化、もしくは直交変換を用いた符号化の少なくとも一方を用いて符号化をしてから記録するようにした。
【0119】
(5):上記(1)〜(3)の3次元音場情報記録メディアにおいて、ノーマルオーディオの各フレームの所定単位ごとの3次元音場情報に関する情報は、ノーマルオーディオ情報を、ホールや頭部伝達関数に関するホール音響化を目的とするパラメータ情報であるようにした。
【0120】
(6):3次元音場情報再生方法において、ノーマルオーディオのオーディオオブジェクトを再生するステップと、前記オーディオオブジェクトを管理する情報を再生しその情報を用いて前記オーディオオブジェクトの再生を制御するステップと、ノーマルオーディオの各フレームの所定単位ごとに、オーディオオブジェクトのユーザーデータ領域に記録されている3次元音場情報に関する情報を再生しその情報を用いて3次元音場データの再生を制御するステップとを有することを特徴とした。
【0121】
(7):3次元音場情報再生方法において、ノーマルオーディオのオーディオオブジェクトを再生するステップと、前記オーディオオブジェクトを管理する情報を再生しその情報を用いて前記オーディオオブジェクトの再生を制御するステップと、ノーマルオーディオの各フレームの所定単位ごとに、オーディオオブジェクトのノーマルオーディオとは別のストリームデータとして多重化し記録されているストリームから3次元音場情報に関する情報を分離して再生しその情報を用いて3次元音場データの再生を制御するステップとを有することを特徴とした。
【0122】
(8):3次元音場情報再生方法において、ノーマルオーディオのオーディオオブジェクトを再生するステップと、前記オーディオオブジェクトを管理する情報を再生しその情報を用いて前記オーディオオブジェクトの再生を制御するステップと、ノーマルオーディオの各フレームの所定単位ごとに、前記管理情報領域とは別の3次元音場用の管理情報領域に記録されている3次元音場情報に関する情報を再生しその情報を用いて3次元音場データの再生を制御するステップとを有することを特徴とした。
【0123】
(9):上記(6)〜(8)の3次元音場情報再生方法において、ノーマルオーディオの各フレームの所定単位ごとの3次元音場情報に関する情報は、ノーマルオーディオ情報と、ほぼ無響室で録音したと等価のレアオーディオ情報との差分情報を差分符号化、予測符号化、もしくは直交変換を用いた符号化がなされており、前記3次元音場情報に関する情報を差分符号化、予測符号化、もしくは直交変換の少なくとも一方を用いて復号化をしてから再生をすることを特徴とした。
【0124】
(10):上記(6)〜(8)の3次元音場情報再生方法において、ノーマルオーディオの各フレームの所定単位ごとの3次元音場情報に関する情報は、ノーマルオーディオ情報を、ホールや頭部伝達関数に関するホール音響化を目的とするパラメータ情報であることを特徴とした。
【0125】
(11):3次元音場情報再生装置において、ノーマルオーディオのオーディオオブジェクトを再生する手段と、前記オーディオオブジェクトを管理する情報を再生しその情報を用いて前記オーディオオブジェクトの再生を制御する手段と、ノーマルオーディオの各フレームの所定単位ごとに、オーディオオブジェクトのユーザーデータ領域に記録されている3次元音場情報に関する情報を再生しその情報を用いて3次元音場データの再生を制御する手段とを有することを特徴とした。
【0126】
(12):3次元音場情報再生装置において、ノーマルオーディオのオーディオオブジェクトを再生する手段と、前記オーディオオブジェクトを管理する情報を再生しその情報を用いて前記オーディオオブジェクトの再生を制御する手段と、ノーマルオーディオの各フレームの所定単位ごとに、オーディオオブジェクトのノーマルオーディオとは別のストリームデータとして多重化し記録されているストリームから3次元音場情報に関する情報を分離して再生しその情報を用いて3次元音場データの再生を制御する手段とを有することを特徴とした。
【0127】
(13):3次元音場情報再生装置において、ノーマルオーディオのオーディオオブジェクトを再生する手段と、前記オーディオオブジェクトを管理する情報を再生する手段と、ノーマルオーディオの各フレームの所定単位ごとに、前記管理情報領域とは別の3次元音場用の管理情報領域に記録されている3次元音場情報に関する情報を再生しその情報を用いて3次元音場データの再生を制御する手段とを有することを特徴とした。
【0128】
(14):(11)〜(13)の3次元音場情報再生装置において、ノーマルオーディオの各フレームの所定単位ごとの3次元音場情報に関する情報は、ノーマルオーディオ情報と、ほぼ無響室で録音したと等価のレアオーディオ情報との差分情報を差分符号化、予測符号化、もしくは直交変換を用いた符号化がなされており、前記3次元音場情報に関する情報を差分符号化、予測符号化、もしくは直交変換の少なくとも一方を用いて復号化をしてから再生することを特徴とした。
【0129】
(15):(11)〜(13)の3次元音場情報再生装置において、ノーマルオーディオの各フレームの所定単位ごとの3次元音場情報に関する情報は、ノーマルオーディオ情報を、ホールや頭部伝達関数に関するホール音響化を目的とするパラメータ情報であることを特徴とした。
【0130】
(16):3次元音場情報再生プログラムにおいて、ノーマルオーディオのオーディオオブジェクトを再生するステップと、前記オーディオオブジェクトを管理する情報を再生しその情報を用いて前記オーディオオブジェクトの再生を制御するステップと、ノーマルオーディオの各フレームの所定単位ごとに、オーディオオブジェクトのユーザーデータ領域に記録されている3次元音場情報に関する情報を再生しその情報を用いて3次元音場データの再生を制御するステップとをコンピュータに実行させることを特徴とした。
【0131】
(17):3次元音場情報再生プログラムにおいて、ノーマルオーディオのオーディオオブジェクトを再生するステップと、前記オーディオオブジェクトを管理する情報を再生しその情報を用いて前記オーディオオブジェクトの再生を制御するステップと、ノーマルオーディオの各フレームの所定単位ごとに、オーディオオブジェクトのノーマルオーディオとは別のストリームデータとして多重化し記録されているストリームから3次元音場情報に関する情報を分離して再生しその情報を用いて3次元音場データの再生を制御するステップとをコンピュータに実行させることを特徴とした。
【0132】
(18):3次元音場情報再生プログラムにおいて、ノーマルオーディオのオーディオオブジェクトを再生するステップと、前記オーディオオブジェクトを管理する情報を再生しその情報を用いて前記オーディオオブジェクトの再生を制御するステップと、ノーマルオーディオの各フレームの所定単位ごとに、前記管理情報領域とは別の3次元音場用の管理情報領域に記録されている3次元音場情報に関する情報を再生しその情報を用いて3次元音場データの再生を制御するステップとをコンピュータに実行させることを特徴とした。
【0133】
(19):上記(16)〜(18)の3次元音場情報再生プログラムにおいて、ノーマルオーディオの各フレームの所定単位ごとの3次元音場情報に関する情報は、ノーマルオーディオ情報と、ほぼ無響室で録音したと等価のレアオーディオ情報との差分情報を差分符号化、予測符号化、もしくは直交変換を用いた符号化がなされており、前記3次元音場情報に関する情報を差分符号化、予測符号化、もしくは直交変換の少なくとも一方を用いて復号化をしてから再生をすることを特徴とした。
【0134】
(20):上記(16)〜(18)の3次元音場情報再生プログラムにおいて、ノーマルオーディオの各フレームの所定単位ごとの3次元音場情報に関する情報は、ノーマルオーディオ情報を、ホールや頭部伝達関数に関するホール音響化を目的とするパラメータ情報であることを特徴とした。
【0135】
上記(1)〜(20)によれば、3次元音場情報を記録再生する際に、ノーマルなノーマルオーディオ情報と互換を保って3次元音場情報再生を可能とするフォーマットを提供することができ、空間音響の空間定位技術を用いた音響の再生を既存のDVDビデオ規格やDVDオーディオのようにステレオ再生を含む従来再生方法と互換性を持って記録再生することができるようになる。例えば、バイフォニック録音のように、オーディオのデータはノーマルなものと非常に相関関係があるもの、とくにDVD等の既存のノーマルオーディオを記録してあるメディアからの再生互換性を損なわずに、音の定位技術を用いて立体音響を視聴者が高臨場感で楽しむことが可能な3次元音場再生が可能な高臨場感シアターシステムを実現することができる。
【0136】
(21):3次元音場情報記録メディアにおいて、ノーマルオーディオ信号とビデオ信号をオーディオオブジェクトとして記録した領域と、前記オーディオオブジェクトを管理する情報を記録した管理情報領域とを備えた情報記録メディアにおいて、ノーマルオーディオの各フレームの所定単位ごとに、3次元音場情報に関する情報をオブジェクトのユーザーデータ領域に記録したことを特徴とした。
【0137】
(22):3次元音場情報記録メディアにおいて、ノーマルオーディオ信号とビデオ信号をオーディオオブジェクトとして記録した領域と、前記オーディオオブジェクトを管理する情報を記録した管理情報領域とを備えた情報記録メディアにおいて、ノーマルオーディオの各フレームの所定単位ごとに、3次元音場情報に関する情報をオーディオオブジェクトのノーマルオーディオとは別のストリームデータとして多重化により記録したことを特徴とした。
【0138】
(23):3次元音場情報記録メディアにおいて、ノーマルオーディオ信号とビデオ信号をオーディオオブジェクトとして記録した領域と、前記オーディオオブジェクトを管理する情報を記録した管理情報領域とを備えた情報記録メディアにおいて、ノーマルオーディオの各フレームの所定単位ごとに、3次元音場情報に関する情報を前記管理情報領域とは別の3次元音場用の管理情報領域に記録したことを特徴とした。
【0139】
(24):上記(21)〜(23)の3次元音場情報記録メディアにおいて、ノーマルオーディオの各フレームの所定単位ごとの3次元音場情報に関する情報は、ノーマルオーディオ情報と、ほぼ無響室で録音したと等価のレアオーディオ情報との差分情報を差分符号化、予測符号化、もしくは直交変換を用いた符号化の少なくとも一方を用いて符号化をしてから記録をするようにした。
【0140】
(25):上記(21)〜(23)の3次元音場情報記録メディアにおいて、ノーマルオーディオの各フレームの所定単位ごとの3次元音場情報に関する情報は、ノーマルオーディオ情報を、ホールや頭部伝達関数に関するホール音響化を目的とするパラメータ情報であるようにした。
【0141】
(26):3次元音場情報再生方法において、ノーマルオーディオ信号とビデオ信号をオーディオオブジェクトとし、オーディオオブジェクトを再生するステップと、前記オーディオオブジェクトを管理する情報を再生しその情報を用いて前記オーディオオブジェクトの再生を制御するステップと、ノーマルオーディオの各フレームの所定単位ごとに、オーディオオブジェクトのユーザーデータ領域に記録されている3次元音場情報に関する情報を再生しその情報を用いて3次元音場データの再生を制御するステップとを有することを特徴とした。
【0142】
(27):3次元音場情報再生方法において、ノーマルオーディオ信号とビデオ信号をオーディオオブジェクトとし、オーディオオブジェクトを再生するステップと、前記オーディオオブジェクトを管理する情報を再生しその情報を用いて前記オーディオオブジェクトの再生を制御するステップと、ノーマルオーディオの各フレームの所定単位ごとに、オーディオオブジェクトのノーマルオーディオとは別のストリームデータとして多重化し記録されているストリームから3次元音場情報に関する情報を分離して再生しその情報を用いて3次元音場データの再生を制御するステップとを有することを特徴とした。
【0143】
(28):3次元音場情報再生方法において、ノーマルオーディオ信号とビデオ信号をオーディオオブジェクトとし、オーディオオブジェクトを再生するステップと、前記オーディオオブジェクトを管理する情報を再生しその情報を用いて前記オーディオオブジェクトの再生を制御するステップと、ノーマルオーディオの各フレームの所定単位ごとに、前記管理情報領域とは別の3次元音場用の管理情報領域に記録されている3次元音場情報に関する情報を再生しその情報を用いて3次元音場データの再生を制御するステップとを有することを特徴とした。
【0144】
(29):上記(26)〜(28)の3次元音場情報再生方法において、ノーマルオーディオの各フレームの所定単位ごとの3次元音場情報に関する情報は、ノーマルオーディオ情報と、ほぼ無響室で録音したと等価のレアオーディオ情報との差分情報を差分符号化、予測符号化、もしくは直交変換を用いた符号化がなされており、前記3次元音場情報に関する情報を差分符号化、予測符号化、もしくは直交変換の少なくとも一方を用いて復号化をしてから再生をすることを特徴とした。
【0145】
(30):上記(26)〜(28)の3次元音場情報再生方法において、ノーマルオーディオの各フレームの所定単位ごとの3次元音場情報に関する情報は、ノーマルオーディオ情報を、ホールや頭部伝達関数に関するホール音響化を目的とするパラメータ情報であることを特徴とした。
【0146】
(31):3次元音場情報再生装置において、ノーマルオーディオ信号とビデオ信号をオーディオオブジェクトとし、オーディオオブジェクトを再生する手段と、前記オーディオオブジェクトを管理する情報を再生しその情報を用いて前記オーディオオブジェクトの再生を制御する手段と、ノーマルオーディオの各フレームの所定単位ごとに、オーディオオブジェクトのユーザーデータ領域に記録されている3次元音場情報に関する情報を再生しその情報を用いて3次元音場データの再生を制御する手段とを有することを特徴とした。
【0147】
(32):3次元音場情報再生装置において、ノーマルオーディオ信号とビデオ信号をオーディオオブジェクトとし、オーディオオブジェクトを再生する手段と、前記オーディオオブジェクトを管理する情報を再生しその情報を用いて前記オーディオオブジェクトの再生を制御する手段と、ノーマルオーディオの各フレームの所定単位ごとに、オーディオオブジェクトのノーマルオーディオとは別のストリームデータとして多重化し記録されているストリームから3次元音場情報に関する情報を分離して再生しその情報を用いて3次元音場データの再生を制御する手段とを有することを特徴とした。
【0148】
(33):3次元音場情報再生装置において、ノーマルオーディオ信号とビデオ信号をオーディオオブジェクトとし、オーディオオブジェクトを再生する手段と、前記オーディオオブジェクトを管理する情報を再生しその情報を用いて前記オーディオオブジェクトの再生を制御する手段と、ノーマルオーディオの各フレームの所定単位ごとに、前記管理情報領域とは別の3次元音場用の管理情報領域に記録されている3次元音場情報に関する情報を再生しその情報を用いて3次元音場データの再生を制御する手段とを有することを特徴とした。
【0149】
(34):上記(31)〜(33)の3次元音場情報再生装置において、ノーマルオーディオの各フレームの所定単位ごとの3次元音場情報に関する情報は、ノーマルオーディオ情報と、ほぼ無響室で録音したと等価のレアオーディオ情報との差分情報を差分符号化、予測符号化、もしくは直交変換を用いた符号化がなされており、前記3次元音場情報に関する情報を差分符号化、予測符号化、もしくは直交変換の少なくとも一方を用いて復号化をしてから再生をすることを特徴とした。
【0150】
(35):上記(31)〜(33)の3次元音場情報再生装置において、ノーマルオーディオの各フレームの所定単位ごとの3次元音場情報に関する情報は、ノーマルオーディオ情報を、ホールや頭部伝達関数に関するホール音響化を目的とするパラメータ情報であることを特徴とした。
【0151】
(36):3次元音場情報再生プログラムにおいて、ノーマルオーディオ信号とビデオ信号をオーディオオブジェクトとし、オーディオオブジェクトを再生するステップと、前記オーディオオブジェクトを管理する情報を再生しその情報を用いて前記オーディオオブジェクトの再生を制御するステップと、ノーマルオーディオの各フレームの所定単位ごとに、オーディオオブジェクトのユーザーデータ領域に記録されている3次元音場情報に関する情報を再生しその情報を用いて3次元音場データの再生を制御するステップとをコンピュータに実行させることを特徴とした。
【0152】
(37):3次元音場情報再生プログラムにおいて、ノーマルオーディオ信号とビデオ信号をオーディオオブジェクトとし、オーディオオブジェクトを再生するステップと、前記オーディオオブジェクトを管理する情報を再生しその情報を用いて前記オーディオオブジェクトの再生を制御するステップと、ノーマルオーディオの各フレームの所定単位ごとに、オーディオオブジェクトのノーマルオーディオとは別のストリームデータとして多重化し記録されているストリームから3次元音場情報に関する情報を分離して再生しその情報を用いて3次元音場データの再生を制御するステップとをコンピュータに実行させることを特徴とした。
【0153】
(38):3次元音場情報再生プログラムにおいて、ノーマルオーディオ信号とビデオ信号をオーディオオブジェクトとし、オーディオオブジェクトを再生するステップと、前記オーディオオブジェクトを管理する情報を再生しその情報を用いて前記オーディオオブジェクトの再生を制御するステップと、ノーマルオーディオの各フレームの所定単位ごとに、前記管理情報領域とは別の3次元音場用の管理情報領域に記録されている3次元音場情報に関する情報を再生しその情報を用いて3次元音場データの再生を制御するステップとをコンピュータに実行させることを特徴とした。
【0154】
(39):上記(36)〜(38)の3次元音場情報再生プログラムにおいて、ノーマルオーディオの各フレームの所定単位ごとの3次元音場情報に関する情報は、ノーマルオーディオ情報と、ほぼ無響室で録音したと等価のレアオーディオ情報との差分情報を差分符号化、予測符号化、もしくは直交変換を用いた符号化がなされており、前記3次元音場情報に関する情報を差分符号化、予測符号化、もしくは直交変換の少なくとも一方を用いて復号化をしてから再生をすることを特徴とした。
【0155】
(40):上記(36)〜(38)の3次元音場情報再生プログラムにおいて、ノーマルオーディオの各フレームの所定単位ごとの3次元音場情報に関する情報は、ノーマルオーディオ情報を、ホールや頭部伝達関数に関するホール音響化を目的とするパラメータ情報であることを特徴とした。
【0156】
上記(20)〜(40)によれば、3次元音場情報を記録再生する際に、ノーマルなノーマルオーディオ情報と互換を保って3次元音場情報再生を可能とするフォーマットを提供することができ、空間音響の空間定位技術を用いた音響の再生を、ビデオ映像と共に、既存のDVDビデオ規格や、DVDオーディオのように、ステレオ再生を含む従来再生方法と互換性を持って、記録再生することができるようになる。例えばバイフォニック録音のように、オーディオのデータはノーマルなものと非常に相関関係があるもの、とくにDVD等の既存のノーマルオーディオを記録してあるメディアからの再生互換性を損なわずに、音の定位技術を用いて立体音響を視聴者に高臨場感で楽しむことができ、3次元音場再生が可能な、高臨場感シアターシステムを実現することができる。
【産業上の利用可能性】
【0157】
以上説明したように、本発明は、ノーマルオーディオ情報と互換を保って3次元音場情報再生を好適に実現する装置、方法、及びプログラムの用途に適用できる。特に、DVD等の既存のノーマルオーディオを記録してあるメディアの互換性を損なわずに、音の定位技術を用いて立体音響を視聴者が高臨場感で楽しむことが可能な高臨場感シアターシステム技術の用途に適用できる。
【図面の簡単な説明】
【0158】
【図1】本発明の実施例に係る3次元音場情報記録装置の全体構成を示す概略ブロック図である。
【図2】圧縮方式としてAAC方式を用いた圧縮器の全体構成を示す概略ブロック図である。
【図3】図2に示す圧縮器内のグループ処理器によるグルーピングの一例を説明する図である。
【図4】本発明の実施例に係る3次元音場情報再生装置の全体構成を示す概略ブロック図である。
【図5】本発明の実施例で用いるDVDビデオ規格のフォーマット例を説明する図である。
【図6】本発明の実施例で用いるDVDビデオ規格の他のフォーマット例を説明する図である。
【図7】本発明の実施例で用いるDVDオーディオ規格のフォーマット例を示す説明図である。
【図8−1】MPEGのビデオストリームビデオレイヤの説明表(その1)である。
【図8−2】MPEGのビデオストリームビデオレイヤの説明表(その2)である。
【図8−3】MPEGのビデオストリームビデオレイヤの説明表(その3)である。
【図8−4】MPEGのビデオストリームビデオレイヤの説明表(その4)である。
【図8−5】MPEGのビデオストリームビデオレイヤの説明表(その5)である。
【図8−6】MPEGのビデオストリームビデオレイヤの説明表(その6)である。
【図8−7】MPEGのビデオストリームビデオレイヤの説明表(その7)である。
【図9】MPEGの多重化トランスポートストリームシステムレイヤの説明表である。
【図10】本発明の実施例の記録プログラムを示すフローチャート図である。
【図11】本発明の実施例の再生プログラムを示すフローチャート図である。
【図12】アレイスピーカーを用いた場合の説明図である。
【図13】アレイスピーカーを用いた場合のシステム図である。
【符号の説明】
【0159】
1 ノーマルオーディオマイク
2 バイノーラルオーディオマイク
3 ノーマルオーディオ圧縮器
4 バッファ
5 ノーマルオーディオ復号器
5a 減算器
6 差分バイノーラルオーディオ圧縮器
7 情報多重化器
8 カメラ
9 ビデオ圧縮器
10 バッファ
11 DVDフォーマット化器
12 記録器
13 バッファ
14 タイムスタンプ発生器
15 制御部
21 再生器
22 DVDフォーマット復号器
23 情報分離化器
24 差分バイノーラルオーディオ復号器
25 ノーマルオーディオ復号器
26 音源選択器
27 GUI
28 スピーカー
28a アレイスピーカー
28b 遅延回路
29 バッファ
30 ビデオ復号器
31 バッファ
32 画像表示器
32a LCD
33 バッファ
34 STCタイムスタンプ比較器
35 制御部
101 聴覚心理分析器
102 MDCT器
103 量子化器
104 グループ処理器
105 可変長符号化器
106 ビット数判定器
107 ビットストリーム生成器
108 処理制御部

【特許請求の範囲】
【請求項1】
ノーマルオーディオのオーディオオブジェクトを再生する手段と、
前記オーディオオブジェクトを管理する管理情報を再生しその管理情報を用いて前記オーディオオブジェクトの再生を制御する手段と、
前記ノーマルオーディオの各フレームの所定単位ごとに、前記オーディオオブジェクトのユーザーデータ領域に記録されている3次元音場情報に関する情報を再生しその情報を用いて3次元音場データの再生を制御する手段とを有することを特徴とする3次元音場情報再生装置。
【請求項2】
ノーマルオーディオのオーディオオブジェクトを再生する手段と、
前記オーディオオブジェクトを管理する管理情報を再生しその管理情報を用いて前記オーディオオブジェクトの再生を制御する手段と、
前記ノーマルオーディオの各フレームの所定単位ごとに、前記オーディオオブジェクトのノーマルオーディオとは別のストリームデータとして多重化し記録されているストリームから3次元音場情報に関する情報を分離して再生しその情報を用いて3次元音場データの再生を制御する手段とを有することを特徴とする3次元音場情報再生装置。
【請求項3】
ノーマルオーディオのオーディオオブジェクトを再生する手段と、
前記オーディオオブジェクトを管理する管理情報を再生しその管理情報を用いて前記オーディオオブジェクトの再生を制御する手段と、
前記ノーマルオーディオの各フレームの所定単位ごとに、前記管理情報が記録されている領域とは別の3次元音場用の管理情報領域に記録されている3次元音場情報に関する情報を再生しその情報を用いて3次元音場データの再生を制御する手段とを有することを特徴とする3次元音場情報再生装置。
【請求項4】
ノーマルオーディオのオーディオオブジェクトを再生するステップと、
前記オーディオオブジェクトを管理する管理情報を再生しその情報を用いて前記オーディオオブジェクトの再生を制御するステップと、
前記ノーマルオーディオの各フレームの所定単位ごとに、前記オーディオオブジェクトのユーザーデータ領域に記録されている3次元音場情報に関する情報を再生しその情報を用いて3次元音場データの再生を制御するステップとをコンピュータに実行させることを特徴とする3次元音場情報再生プログラム。
【請求項5】
ノーマルオーディオのオーディオオブジェクトを再生するステップと、
前記オーディオオブジェクトを管理する管理情報を再生しその情報を用いて前記オーディオオブジェクトの再生を制御するステップと、
前記ノーマルオーディオの各フレームの所定単位ごとに、前記オーディオオブジェクトのノーマルオーディオとは別のストリームデータとして多重化し記録されているストリームから3次元音場情報に関する情報を分離して再生しその情報を用いて3次元音場データの再生を制御するステップとをコンピュータに実行させることを特徴とする3次元音場情報再生プログラム。
【請求項6】
ノーマルオーディオのオーディオオブジェクトを再生するステップと、
前記オーディオオブジェクトを管理する管理情報を再生しその情報を用いて前記オーディオオブジェクトの再生を制御するステップと、
ノーマルオーディオの各フレームの所定単位ごとに、前記管理情報領域とは別の3次元音場用の管理情報領域に記録されている3次元音場情報に関する情報を再生しその情報を用いて3次元音場データの再生を制御するステップとをコンピュータに実行させることを特徴とする3次元音場情報再生プログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8−1】
image rotate

【図8−2】
image rotate

【図8−3】
image rotate

【図8−4】
image rotate

【図8−5】
image rotate

【図8−6】
image rotate

【図8−7】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate


【公開番号】特開2006−148542(P2006−148542A)
【公開日】平成18年6月8日(2006.6.8)
【国際特許分類】
【出願番号】特願2004−335923(P2004−335923)
【出願日】平成16年11月19日(2004.11.19)
【出願人】(000004329)日本ビクター株式会社 (3,896)
【Fターム(参考)】