説明

信号再生装置及び信号再生方法

【課題】再現音場内の最適位置に鮮明な虚音像を定位する。
【解決手段】信号再生装置1は、音像情報抽出処理部24においてオーディオデータに含まれる音源毎の楽音を分離し、音源信号算出処理部26において聴取点に近い音源を聴取者の距離知覚が敏感な位置に変更するための制御パラメータを算出し遠くに定位される音像をより遠くに再配置するための制御パラメータを算出し、仮想音源位置算出処理部25において算出された仮想音源位置に特定の音源信号を再合成することにより、仮想音場の臨場感を顕著にすることができる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、信号再生装置及び信号再生方法に関し、特にマルチチャンネル方式と音場合成技術により音像を仮想音源位置に定位させる信号再生装置及び信号再生方法に関する。
【背景技術】
【0002】
大容量記憶媒体、ネットワークを介したダウンロード又はストリームによるコンテンツ配信等をはじめとする情報伝達形態の発達と再生機器性能の進化により、家庭でも高画質、高音質で映像コンテンツ及び音楽コンテンツが楽しめるようになった。
【0003】
ビデオデータ、音楽データ等の再生装置において臨場感や音質は、ユーザにとって善し悪しが比較的判断しやすい。例えば、ユーザがオーケストラ曲を聴くとき、仮想音場のなかで個々の楽器の位置が鮮明に感じられ、本物のオーケストラが眼前で演奏しているかのようなイメージが想起されることが好ましい。ユーザは、より現実味のある音声再生を望む傾向にあり、音を再生したときに音声或いは音楽を録音したときの音場が如何に忠実に再現できているかがユーザに機器特性の印象を与えてしまうことにもなるため、重要になっている。
【0004】
例えば、2チャンネルステレオでは、再生音場の音像が虚音像として最適な場所に定位するようにL信号とR信号からなる2チャンネルステレオ信号の各信号チャンネルのバランスを調整し2つのスピーカから出力している。しかし、2チャンネルステレオの場合、虚音像は、音像が鮮明でなく、受聴位置が左右スピーカの中央からずれると音像の定位位置が変化してしまうという欠点があった。そこで、少なくとも左右に設置した2つのスピーカの中央位置、すなわち受聴者の正面位置にはより鮮明な音像が定位し且つ受聴位置が左右にずれても音像が中央に留まっているようにするために、左右の2チャンネルスピーカの中央にセンタスピーカを加えた3チャンネルステレオ方式、更に背面スピーカを加えた5.1チャンネルステレオ方式が存在する。
【0005】
一方、従来一般的な2チャンネルステレオ信号は、3チャンネル、5.1チャンネルのような多チャンネルステレオ装置によっても再生できなければならない。そのために、2チャンネルステレオ信号からセンターチャンネルの信号や背面のLチャンネルと背面のRチャンネルの信号を生成することによって、2チャンネルステレオ信号を多チャンネル信号に変換できるようにした技術も公開されている(特許文献1参照)。
【0006】
また、より現実味のある音場を再現するための技術としては、このほかにも、音場合成技術を用いて点音源や平面波を合成することにより5.1チャンネルステレオ信号を再生する技術(非特許文献1参照)、音場合成技術の仮想音源の位置制御技術を利用して音像位置を任意に動かす技術が開示されている(非特許文献2参照)。更に、混合された音響信号から特定の信号を抽出する一般調和信号解析技術があげられる(非特許文献3参照)。
【0007】
【特許文献1】特表2003−516069号公報
【非特許文献1】Spatial Sound in the Age of Fast Convolution Technologies,ICA2004, P.I-515〜P.I-518)
【非特許文献2】MONITORING DISTANCE EFFECT WITH WAVE FIELD SYNTHESIS, Proc. of the 6th Int. Conference on Digital Audio Effects(DAFX-03), London, UK, September 8-11,2003)
【非特許文献3】一般調和解析による音響信号の分離 日本音響学会講演論文集 P607−608 平成8年9月
【発明の開示】
【発明が解決しようとする課題】
【0008】
ところが、2チャンネルステレオ信号からセンターチャンネルの信号を合成する方法は、簡便ではあるが鮮明な音像を得られない。また、非特許文献3に説明されている一般調和信号解析技術により、従来の2チャンネルステレオ信号に含まれる音源の信号を抽出し、音源毎に独立した信号のチャンネルを作り出すには多くの信号処理が必要である。また生成されたチャンネルの信号処理の結果を検証し、処理条件を変えて再度信号処理をやり直すという繰り返し処理が必要になることもあるため、2チャンネルステレオ信号に対してリアルタイムで一般調和信号解析処理を実行し、検出結果を再合成して多チャンネルステレオ信号を生成しこれをリアルタイム再生することは困難であった。
【0009】
そこで、本発明は、上述した従来の実情に鑑みて提案されたものであり、再現音場内の最適位置に鮮明な虚音像を定位することができる信号再生装置及びその方法を提供することを目的とする。
【課題を解決するための手段】
【0010】
上述した目的を達成するために、本発明に係る信号再生装置は、オーディオ信号が多重化された多チャンネルデータを再生する信号再生装置において、多チャンネルデータを取得する多チャンネルデータ取得手段と、多チャンネルデータから特定音像の音源情報と音像位置情報とを抽出する信号解析手段と、音源情報から音源信号を算出する音源信号算出手段と、抽出された特定音像の音像情報を変更し変更後の特定音像の音源信号を任意の仮想音源位置に配置する音場合成を行う音場合成手段とを備え、再現音場内の最適位置に鮮明な虚音像を定位する。
【0011】
ここで、本発明に係る信号再生装置は、抽出された特定音像の音源情報と音像位置情報とにしたがって特定音像の仮想音源位置を算出する仮想音源位置算出手段を備え、この場合、音場合成手段は、音源信号算出手段において算出された音源信号を仮想音源算出手段で算出された仮想音源位置に配置する。
【0012】
また、上述した目的を達成するために、本発明に係る信号再生方法は、オーディオ信号が多重化された多チャンネルデータを再生する信号再生方法において、多チャンネルデータを取得する多チャンネルデータ取得工程と、多チャンネルデータから特定音像の音源情報と音像位置情報を抽出する信号解析工程と、音源情報から音源信号を算出する音源信号算出工程と、抽出された特定音像の音像情報を変更し変更後の特定音像の音源信号を任意の仮想音源位置に配置する音場合成を行う音場合成工程とを有する。
【発明の効果】
【0013】
本発明に係る信号再生装置及び信号再生方法によれば、再現音場内の最適位置に鮮明な虚音像を定位させた音場合成が可能になる。また、オーディオ信号が多重化された多チャンネルデータから特定音像の音源情報及び音像位置情報を分離して用意することで、音場解析と音場合成処理に係る処理負荷が軽減できる。
【発明を実施するための最良の形態】
【0014】
本発明の具体例として示す信号再生装置は、マルチチャンネル方式で作成され、複数の音源情報を含む音楽データに対して、一般調和信号解析技術をはじめとする音源信号抽出と音場合成技術とを用いて、オーディオ信号から特定の音源信号を抽出し、この音源信号の音像を最適な仮想音源位置に定位させる信号処理を行う再生装置である。
【0015】
なお、本発明では、オーディオ信号が多重化されたデータとは、例えば、複数の楽器で演奏された音楽データ、“演奏”と“歌声”とが含まれる音楽データのように複数の音源が含まれるオーディオデータであって、リニアPCM(Linear Pulse Code Modulation)、ドルビーデジタル、DTS(Digital Theater Systems)、DVD−Audioフォーマット、DVD−Videoフォーマットに決められたオーディオデータを含むが、いわゆるMIDI(Musical Instrument Digital Interface)規格に準拠するデータのように、予めチャンネル毎(音源毎)に作成された複数パートのデータを合成(多重化)してできるオーディオデータは、本発明及び本発明の具体例では含まれない。
【0016】
以下、本発明の第1の具体例として示す信号再生装置1について、図面を参照して詳細に説明する。信号再生装置1は、記録媒体から入力したオーディオデータを含むコンテンツデータを再生する再生装置である。
【0017】
図1に示す信号再生装置1は、光ディスクを回転駆動し記録されたデータを読み出す光ディスク再生部11と、読み出したデータを圧縮されたオーディオデータ、ビデオデータ、字幕データ、その他のデータ等に分離する信号分離回路12とを備える。また、圧縮されたオーディオデータを復号するオーディオデコーダ13と、復号されたオーディオデータを再生するとともに仮想音源の位置情報に応じて音場合成するオーディオ信号処理回路14と、圧縮された字幕データを復号する字幕デコーダ15と、復号された字幕を再生する字幕再生回路16とを備えている。また、圧縮されたビデオデータを復号するビデオデコーダ17と、復号されたビデオデータを再生するビデオ信号再生回路18と、ビデオ信号に同期して字幕を合成する字幕合成回路19と、字幕が合成されたビデオ信号を外部に出力するビデオ信号出力回路20とを備える。
【0018】
なお、オーディオデコーダ13からの出力とこれに対応する音源信号算出処理部26及びオーディオ信号再生処理部23への入力、並びに音が合成処理部27からの出力とこれに対応する多チャンネルアンプ21への入力、オーディオ信号出力回路22への入力及び出力は、チャンネル数に併せた信号線が用意されている。
【0019】
オーディオデータ及びビデオデータとしては、MPEG1、MPEG2、AVI、WMV、WMA等の各フォーマットが適用可能であるが、以下に説明する例では、光ディスクとしてDVD(Digital Versatile Disc)を使用する。この場合、ビデオデータはMPEG(Moving Picture Experts Group)によって標準化されたMPEG2であり、オーディオデータは、リニアPCM、ドルビーデジタル、DTS、SDDS等が適用される。
【0020】
オーディオ信号処理回路14は、オーディオデコーダ13で復号されたオーディオデータを再生するオーディオ信号再生処理部23と、光ディスク再生部11で再生された再生信号から音像情報を抽出する処理を行う音像情報抽出処理部24と、仮想音源位置を算出する仮想音源位置算出処理部25と、音像情報から音源信号を算出する音源信号算出処理部26と、音源信号と仮想音源位置に基づいて音場を合成する音場合成処理部27とを備える。
【0021】
オーディオ信号再生処理部23は、オーディオデコーダ13で復号されたオーディオデータを再生し多チャンネルアンプ21に送る。
【0022】
音像情報抽出処理部24は、光ディスク再生部11が読み出したデータから音像情報と音像位置情報とを抽出し、抽出した音像情報及び音像位置情報を仮想音源位置算出処理部25と音源信号算出処理部26に送る。音源情報としては、オーディオデータを構成する楽器、音声等があげられる。また、音像情報抽出処理部24は、一般調和信号解析により数種類の音源からの音が混在した音声波形から主要音源の時間変動に相関がある周波数成分を抽出する。例えば、音像情報抽出処理部24は、一般調和信号解析によって、目的の女声ボーカル信号を構成する周波数成分を分離することができる。また、例えば中央位置に定位させる音源信号の周波数成分を分離することができる。
【0023】
仮想音源位置算出処理部25は、音像情報抽出処理部24で抽出された音像位置情報にしたがって音場を合成すべき音源位置を算出する。ここで、音場合成すべき音源位置とは、後段の音場合成処理部27の精度やスピーカ配置に応じた仮想音源の位置である。仮想音源位置算出処理部25は、例えば中央位置に音像定位する音源信号であれば、聴取点からこの音仮想源信号までの仮想音源距離を、後段の音場合成処理部27の精度やスピーカ配置に応じて計算して算出又は変更する。
【0024】
音源信号算出処理部26は、音像情報抽出処理部24で一般調和信号解析によって音源毎に分離されたオーディオデータに仮想音源位置算出処理部25で算出した音源位置に所定の音源を音像定位させるための制御パラメータを与える。図2〜図5には、オーディオデータから分離された周波数波形を示す。
【0025】
音源信号算出処理部26は、2チャンネルオーディオデータ、多チャンネルオーディオデータ等のオーディオデータから音像情報抽出処理部24及び仮想音源位置算出処理部25における解析結果に基づいて特定位置に音像定位する音源信号、パート毎に異なる音源信号を分離している。例えば、音源信号算出処理部26は、音像情報抽出処理部24で一般調和信号解析によって分離された目的の女声ボーカル信号を構成する周波数成分から女声ボーカルの音源信号を算出する。また、例えば中央位置に定位させる音源信号の周波数成分を分離することができる。音源信号算出処理部26は、算出した音源信号を音場合成処理部27に送る。
【0026】
また、音源信号算出処理部26は、分離した所定の周波数成分を広がり方向(水平方向)、又は奥行き方向に定位位置変更する制御パラメータを算出する。
【0027】
音源音像を広がり方向(水平方向)に定位位置変更するための制御パラメータの変更例として、音源信号算出処理部26は、例えば、観測点と仮想音源との方向に関して、後述する音場合成処理部27の精度が10°刻み程度の精度でしか音場合成できない場合には、音像方向8°刻みの音像位置変化を生じさせるパラメータを10°に再変換する。また、スピーカ配置上の制約で横方向に40°の範囲内にしか音像配置できない場合には、音像位置50°という音像位置変化を生じさせるパラメータは40°に再変換する。
【0028】
また、観測点と仮想音源との距離である音像位置距離データについても同様である。一般的に、3メートル以上の遠方の音源に対しては人間の距離知覚の精度が低下することが知られている。そこで音源信号算出処理部26は、音源音像を奥行き方向に定位位置変更するための制御パラメータの変更例として、例えば、音像距離5メートル程度の距離変化を生じさせるパラメータを音源位置3メートル程度に音像定位させるパラメータに変換し、音像距離8メートル程度の距離変化を生じさせるパラメータを音源距離10メートルに再変換する。
【0029】
また、音源信号算出処理部26は、分離された音源に基づいて新たな音源信号を作成することもできる。例えば、音像情報抽出処理部24によって分離された特定音源の音源信号を別の位置に定位させるパラメータを算出したり、特定音源と周波数が若干異なる音源信号を生じるための制御パラメータを算出したりする。これにより、ある音源に対していわゆるユニゾンする別の音源、或いはある音源とハーモニーを生じる別の音源の周波数成分を生成することができる。
【0030】
音場合成処理部27は、音源信号算出処理部26によって算出された音源信号を仮想音源位置算出処理部25で算出された仮想音源位置に配置する音場合成を行う。このとき、音場合成処理部27は、ピッチ変更、タイミング変更、エンベロープジェネレータのうち1又は組合せにより、抽出された音源信号を仮想音源位置に再配置する音場合成を行う。また、音場合成処理部27は、中央位置に音像定位する音源信号が取り除かれたインテンシティステレオ信号を通常のインテンシティステレオ再生し、分離した音源信号を中央位置に再配置する音場合成を行う。
【0031】
オーディオ信号出力回路22にオーディオ信号の出力手段の一例として平面アレイスピーカが使用される場合、音場合成処理部27は、中央位置から同心円状に広がる音波を出力するためのアレイスピーカ駆動用のデジタルフィルタ係数を算出し、目的のボーカル信号に畳み込み演算を行う。
【0032】
図2〜図5は、音像情報抽出処理部24によって分離された周波数成分を示している。図2〜図5において横軸は時間であり、縦軸は信号レベルを表している。図2に示す周波数成分f1の信号レベルと図3に示す周波数成分f2の信号レベルは、互いに時間変動に強い相関があるため、音場合成処理部27は、f1とf2を同じ音源として音像定位する。また、音場合成処理部27は、同様に、図4に示す周波数成分f3と図5に示す周波数成分f4とを同じ音源として音像定位する。
【0033】
音源信号算出処理部26は、元のオーディオ信号から一般調和信号解析によって分離された図2〜図5に示す周波数成分f1〜f4に対して、互いに時間変動に強い相関があるものを同じ音源とし、再生空間内における同一位置に定位させるための制御パラメータを与える。音場合成処理部27は、与えられた制御パラメータを抽出した周波数成分に、例えばf1とf2に重畳して再合成する。そして、この抽出した音源の周波数成分に所定の音源に、同じ音源として音像定位させるためのパラメータが与えられ、所定の楽器の周波数成分として再合成する。
【0034】
続く多チャンネルアンプ21は、アレイスピーカ用の多チャンネル信号を増幅するとともに、オーディオ信号のうち再合成されなかった音源信号を2チャンネル又は5.1チャンネルで再生するための増幅を行う。例えば、多チャンネルアンプ21は、上述のようにボーカル信号が音場の再合成をするために分離された場合、ボーカル信号をアレイスピーカ用に多チャンネルで増幅し、ボーカル信号成分が分離された後のオーディオ信号をLチャンネル信号、Rチャンネル信号の2チャンネルで増幅する。
【0035】
上述した構成を有する信号再生装置1が光ディスクから読み出したコンテンツデータを再生する動作について説明する。
【0036】
光ディスク再生部11は、光ディスクを回転駆動しDVDに記録されたデータを読み出す。光ディスク再生部11によって読み出されたデータは、信号分離回路12において、圧縮されたオーディオデータ、圧縮されたビデオデータ、字幕データ、その他のデータ等に分離される。圧縮されたオーディオデータは、オーディオデコーダ13で復号された後、オーディオ信号処理回路14のオーディオ信号再生処理部23に送られる。オーディオ信号再生処理部23は、復号されたオーディオデータを再生し多チャンネルアンプ21に送る。
【0037】
光ディスク再生部11によって読み出されたデータは、オーディオ信号処理回路14の音像情報抽出処理部24にも送られる。音像情報抽出処理部24は、一般調和信号解析によって、再生信号から音源毎の音像情報と音像位置情報とを抽出し、抽出した音像情報及び音像位置情報を仮想音源位置算出処理部25と音源信号算出処理部26に送る。仮想音源位置算出処理部25では、音像情報抽出処理部24で抽出された音像位置情報にしたがって音場を合成すべき音源位置が算出される。また、音源信号算出処理部26では、音像情報抽出処理部24で一般調和信号解析によって音源毎に分離されたオーディオデータに仮想音源位置算出処理部25で算出した音源位置に所定の音源を音像定位させるための制御パラメータが与えられる。
【0038】
音場合成処理部27は、音源信号算出処理部26によって算出された音源信号と制御パラメータに基づいて、仮想音源位置算出処理部25で算出された仮想音源位置に配置する音場合成を行う。このとき、音場合成処理部27は、ピッチ変更、タイミング変更、エンベロープジェネレータのうち1又は組合せにより、抽出された音源信号を仮想音源位置に再配置する音場合成を行う。音場合成処理部27において音場が再合成されたオーディオ信号は、多チャンネルアンプ21に送られる。多チャンネルアンプ21では、特定の音声信号、例えばボーカル信号成分が分離された場合、分離されたボーカル信号を多チャンネルで増幅し、ボーカル信号成分が分離された後のオーディオ信号をLチャンネル信号、Rチャンネル信号の2チャンネルで増幅する。
【0039】
一方、ビデオデータと字幕データは、ビデオデコーダ17、字幕デコーダ15に送られ、続く字幕再生回路16或いはビデオ信号再生回路18で再生される。字幕信号とビデオ信号は、字幕合成回路19においてビデオ信号に同期して映像に字幕が合成される。音場が再合成されたオーディオ信号はオーディオ信号出力回路22から、字幕が合成されたビデオ信号はビデオ信号出力回路20から互いに同期され外部のスピーカシステム、表示装置等に出力される。
【0040】
したがって、信号再生装置1は、音像情報抽出処理部24においてオーディオデータに含まれる音源毎の楽音を分離算出し、音源信号算出処理部26において聴取点に近い音源を聴取者の距離知覚が敏感な位置に変更し、遠くに定位される音像をより遠くに再配置するパラメータを算出し、仮想音源位置算出処理部25において算出された仮想音源位置に特定の音源信号を再合成し、再生される仮想音場を再構築することにより、視聴者の臨場感を高めることができる。上述した信号再生装置1は、本発明の基本的な構成を実現したものである。
【0041】
以下では、本発明のほかの応用例について説明する。本発明の第2の具体例として信号再生装置2を図6に示す。図2に示す信号再生装置2は、音像毎の音源情報及び音像位置情報が多チャンネルのオーディオデータから独立して、例えば、楽曲、映画等といったコンテンツ毎にメタデータとして用意されていることが特徴である。そして、このメタデータは、コンテンツと対応づけるためにコンテンツを識別するための識別コードに対応して予め所定の領域に格納されている。ここで識別コードとは、所定のルールを用いてオーディオデータ等のコンテンツデータの一部から生成されたコンテンツ毎に固有な情報である。
【0042】
そのため、信号再生装置2は、オーディオデータから切り離されてコンテンツ毎に所定領域に格納された音源情報及び音像位置情報を読み出すために必要な識別コードを、この識別コードを光ディスクに格納したと同じ手順で生成する識別コード生成部28と、ここで生成された識別コードに対応するメタデータを光ディスクから検索する検索処理部29とを備えることを特徴としている。なお、図6に示す信号再生装置2において、図1に示した信号再生装置1と同様の機能を有する構成は、同一の番号を付けて詳細な説明を省略する。
【0043】
識別コード生成部28は、オーディオデータから切り離されてメタデータとして所定領域に格納された音源情報及び音像位置情報を読み出すために必要な識別コードを、多チャンネルデータの一部から生成する。識別コードとしては、TOCに記録されているトラック数、各トラックの演奏時間等のデータ、またこれらを組み合わせたデータのほか、多チャンネルデータそのものに対して所定の符号化を施して得られるデータ等があげられる。
【0044】
検索処理部29は、識別コード生成部28で生成されたコンテンツを特定するための識別コードに応じて演奏対象となっている楽曲の識別コードを多重化されたデータから検索する。
【0045】
上述した構成を有する信号再生装置2が光ディスクから読み出したコンテンツデータを再生する動作について説明する。
【0046】
光ディスク再生部11によって読み出されたデータは、信号分離回路12において、圧縮されたオーディオデータ、圧縮されたビデオデータ、字幕データ、その他のデータ等に分離される。圧縮されたオーディオデータは、オーディオデコーダ13で復号された後、オーディオ信号処理回路14のオーディオ信号再生処理部23に送られる。オーディオ信号再生処理部23は、復号されたオーディオデータを再生し多チャンネルアンプ21に送る。
【0047】
オーディオ信号処理回路14の識別コード生成部28は、光ディスク再生部11で読み出されたデータから作成時と同様のルールで識別コードを生成する。そして、検索処理部29は、生成された識別コードに応じて、演奏対象の楽曲の音源情報及び音像位置情報のデータを多重化されたデータから検索する。
【0048】
信号再生装置2では、音像情報抽出処理部24は、検索処理部29が検索して得たメタデータから音源毎の音像情報と音像位置情報とを抽出し、抽出した音像情報及び音像位置情報を仮想音源位置算出処理部25と音源信号算出処理部26に送る。仮想音源位置算出処理部25では、音像情報抽出処理部24で抽出された音像位置情報にしたがって音場を合成すべき音源位置が算出される。また、音源信号算出処理部26では、音像情報抽出処理部24で音源毎に分離されたオーディオデータに仮想音源位置算出処理部25で算出した音源位置に所定の音源を音像定位させるための制御パラメータが与えられる。
【0049】
音場合成処理部27は、音源信号算出処理部26によって算出された音源信号と制御パラメータに基づいて、仮想音源位置算出処理部25で算出された仮想音源位置に配置する音場合成を行う。このとき、音場合成処理部27は、ピッチ変更、タイミング変更、エンベロープジェネレータのうち1又は組合せにより、抽出された音源信号を仮想音源位置に再配置する音場合成を行う。音場合成処理部27において音場が再合成されたオーディオ信号は、多チャンネルアンプ21に送られ、分離された特定の音源信号を多チャンネルで増幅され、特定の音源信号成分が分離された後のオーディオ信号を2チャンネルで増幅される。字幕信号とビデオ信号は、字幕合成回路19においてビデオ信号に同期して映像に字幕が合成され、音場が再合成されたオーディオ信号はオーディオ信号出力回路22から、また字幕が合成されたビデオ信号はビデオ信号出力回路20から、互いに同期されて外部のスピーカシステム、表示装置等に出力される。
【0050】
上述したように信号再生装置2は、音像毎の音源情報及び音像位置情報を多チャンネルのオーディオデータから独立してメタデータとして用意し、更にメタデータを識別コードに対応して予め所定の領域に格納したことにより、一般調和信号解析等による音源抽出処理にかかる演算量を低減することができる。また、音像情報抽出処理部24において音源毎の信号を分離し、音源信号算出処理部26において聴取点に近い音源を聴取者の距離知覚が敏感な位置に変更し、遠くに定位される音像をより遠くに再配置するパラメータを算出し、仮想音源位置算出処理部25において算出された仮想音源位置に特定の音源信号を再合成し、再生される仮想音場を再構築することにより、視聴者の臨場感を高めることができる。
【0051】
続いて、本発明の第3の具体例として信号再生装置3を図7に示す。図7では、図1及び図6に示す信号再生装置と同様の機能を有する構成に関しては同一の番号を付けて詳細な説明を省略する。図7に示す信号再生装置3は、上述した多チャンネルのオーディオデータが光ディスクのようないわゆるパッケージングメディアとして提供される場合でなく、ネットワークを介して送られる場合である。そして更に、信号再生装置3では、音像毎の音源情報及び音像位置情報が多チャンネルのオーディオデータから独立して、メタデータとして用意されており、多チャンネルデータとメタデータが混合されてネットワークを介して提供されることが特徴である。
【0052】
そのため、信号再生装置3は、光ディスク再生部11の代わりに、無線又は有線接続されるローカルエリアネットワーク、オリジナルネットワーク、いわゆるインターネット等のネットワークに接続するネットワークインターフェイス(以下、ネットワークI/Fという。)31と、ネットワークを介して送られたオーディオデータ等のコンテンツデータを一時的に記憶する受信バッファ32を備えている。ネットワークの通信プロトコルとしては、TCP/IPをはじめとする汎用プロトコルがあげられる。
【0053】
また、信号再生装置3は、コンテンツ毎に作成された音源情報及び音像位置情報のメタデータを読み出すために必要な識別コードをこのコンテンツの識別コードを送信するときと同じ手順で生成する識別コード生成部33と、ここで生成された識別コードに対応するメタデータをネットワークから受け取ったデータ中から検索する検索処理部34とを備えている。
【0054】
なお、図7に示す信号再生装置3において、ネットワークを介して伝送されるオーディオデータは、リアルタイム再生を可能とするストリームデータであってもよいし、いわゆるダウンロードのような一括伝送データであってもよい。また、信号再生装置3は、識別コード入力部35を備え、ユーザによって、識別コードが直接入力できてもよい。
【0055】
上述した構成を有する信号再生装置3がネットワークを介して受信したコンテンツデータを再生する動作について説明する。
【0056】
ネットワークI/F31で受け取ったデータは、受信バッファ32に一時的に記憶され、信号分離回路12において、圧縮されたオーディオデータ、圧縮されたビデオデータ、字幕データ、その他のデータ等に分離される。圧縮されたオーディオデータは、オーディオデコーダ13で復号された後、オーディオ信号処理回路14のオーディオ信号再生処理部23に送られる。オーディオ信号再生処理部23は、復号されたオーディオデータを再生し多チャンネルアンプ21に送る。
【0057】
オーディオ信号処理回路14の識別コード生成部33は、ネットワークI/F31で受け取ったデータから作成時と同様のルールで識別コードを生成する。そして、検索処理部34は、生成された識別コードに応じて、演奏対象の楽曲のメタデータを多重化されたデータから検索する。
【0058】
信号再生装置3では、音像情報抽出処理部24は、検索処理部29が検索して得たメタデータから音源毎の音像情報と音像位置情報とを抽出し、抽出した音像情報及び音像位置情報を仮想音源位置算出処理部25と音源信号算出処理部26に送る。仮想音源位置算出処理部25では、音像情報抽出処理部24で抽出された音像位置情報にしたがって音場を合成すべき音源位置が算出される。また、音源信号算出処理部26では、音像情報抽出処理部24で音源毎に分離されたオーディオデータに仮想音源位置算出処理部25で算出した音源位置に所定の音源を音像定位させるための制御パラメータが与えられる。
【0059】
音場合成処理部27は、音源信号算出処理部26によって算出された音源信号と制御パラメータに基づいて抽出された音源信号を仮想音源位置に再配置する音場合成を行う。音場合成処理部27において音場が再合成されたオーディオ信号は、多チャンネルアンプ21に送られ、分離された特定の音源信号を多チャンネルで増幅され、特定の音源信号成分が分離された後のオーディオ信号を2チャンネルで増幅される。字幕信号とビデオ信号は、字幕合成回路19においてビデオ信号に同期して映像に字幕が合成され、音場が再合成されたオーディオ信号はオーディオ信号出力回路22から、また字幕が合成されたビデオ信号はビデオ信号出力回路20から、互いに同期されて外部のスピーカシステム、表示装置等に出力される。
【0060】
上述したように信号再生装置3は、音像毎の音源情報及び音像位置情報を多チャンネルのオーディオデータから独立してメタデータとして用意し、更にメタデータを識別コードに対応して予め所定の領域に格納したことにより、一般調和信号解析等による音源抽出処理にかかる演算量を低減することができる。したがって、信号再生装置3は、音源毎の信号を分離し、聴取点に近い音源を聴取者の距離知覚が敏感な位置に変更し、遠くに定位される音像をより遠くに再配置するパラメータを算出し、仮想音源位置に特定の音源信号を再合成し、再生される仮想音場を再構築するという信号処理がネットワークを介して送信されるオーディオデータ等のコンテンツデータに対してもリアルタイムに可能になる。
【0061】
次に、本発明の第4の具体例として信号再生装置4を図8に示す。図8に示す信号再生装置4は、多チャンネルのオーディオデータから独立して音像毎の音源情報及び音像位置情報がメタデータとして用意されているのは同一であるが、オーディオデータは光ディスクから、また音源情報及び音像位置情報はネットワークを介して信号再生装置4に送られることを特徴としている。
【0062】
そのため、信号再生装置4は、コンテンツ毎に作成された音源情報及び音像位置情報のメタデータを読み出すために必要な識別コードをこのコンテンツの識別コードを送信するときと同じ手順で生成する識別コード生成部36と、無線又は有線接続されるローカルエリアネットワーク又はオリジナルネットワーク、いわゆるインターネット等のネットワークに接続するネットワークインターフェイス(以下、ネットワークI/Fという。)36と、識別コード生成部36で生成された識別コードに対応するメタデータをネットワークから受け取ったデータ中から検索する検索処理部38とを備えている。信号再生装置4は、図8には図示していないがネットワークを介して送られたオーディオデータ等のコンテンツデータを一時的に記憶する受信バッファを備えている。ネットワークの通信プロトコルとしては、TCP/IPをはじめとする汎用プロトコルがあげられる。なお、図8に示すに示す信号再生装置4において、図1、図6及び図7に示す信号再生装置と同様の機能を有する構成に関しては同一の番号を付けて詳細な説明を省略する。
【0063】
上述した構成を有する信号再生装置4が光ディスクから読み出したコンテンツデータを再生する動作について説明する。
【0064】
光ディスク再生部11で読み出されたデータは、信号分離回路12において、圧縮されたオーディオデータ、圧縮されたビデオデータ、字幕データ、その他のデータ等に分離される。圧縮されたオーディオデータは、オーディオデコーダ13で復号された後、オーディオ信号処理回路14のオーディオ信号再生処理部23に送られる。オーディオ信号再生処理部23は、復号されたオーディオデータを再生し多チャンネルアンプ21に送る。
【0065】
オーディオ信号処理回路14の識別コード生成部36は、ネットワークI/F37で受け取った識別コードを検索処理部38に送る。検索処理部38は、生成された識別コードに応じて、演奏対象の楽曲のメタデータを多重化されたデータから検索する。
【0066】
光ディスク再生部11から読み出されたデータは、信号分離回路12において、圧縮されたオーディオデータ、圧縮されたビデオデータ、字幕データ、その他のデータ等に分離される。圧縮されたオーディオデータは、オーディオデコーダ13で復号された後、オーディオ信号処理回路14のオーディオ信号再生処理部23に送られる。オーディオ信号再生処理部23は、復号されたオーディオデータを再生し多チャンネルアンプ21に送る。
【0067】
信号再生装置4では、音像情報抽出処理部24は、検索処理部29が検索して得たメタデータから音源毎の音像情報と音像位置情報とを抽出し、抽出した音像情報及び音像位置情報を仮想音源位置算出処理部25と音源信号算出処理部26に送る。仮想音源位置算出処理部25では、音像情報抽出処理部24で抽出された音像位置情報にしたがって音場を合成すべき音源位置が算出される。また、音源信号算出処理部26では、音像情報抽出処理部24で音源毎に分離されたオーディオデータに仮想音源位置算出処理部25で算出した音源位置に所定の音源を音像定位させるための制御パラメータが与えられる。
【0068】
音場合成処理部27は、音源信号算出処理部26によって算出された音源信号と制御パラメータに基づいて抽出された音源信号を仮想音源位置に再配置する音場合成を行う。音場合成処理部27において音場が再合成されたオーディオ信号は、多チャンネルアンプ21に送られ、分離された特定の音源信号を多チャンネルで増幅され、特定の音源信号成分が分離された後のオーディオ信号を2チャンネルで増幅される。字幕信号とビデオ信号は、字幕合成回路19においてビデオ信号に同期して映像に字幕が合成され、音場が再合成されたオーディオ信号はオーディオ信号出力回路22から、また字幕が合成されたビデオ信号はビデオ信号出力回路20から、互いに同期されて外部のスピーカシステム、表示装置等に出力される。
【0069】
上述したように信号再生装置4は、音像毎の音源情報及び音像位置情報を多チャンネルのオーディオデータから独立してメタデータとして用意して、これをネットワークから受け取る。そして、オーディオデータは光ディスクで提供されることにより、一般調和信号解析等による音源抽出処理にかかる演算量を低減することができる。したがって、信号再生装置4は、音源毎の信号を分離し、聴取点に近い音源を聴取者の距離知覚が敏感な位置に変更し、遠くに定位される音像をより遠くに再配置するパラメータを算出し、仮想音源位置に特定の音源信号を再合成し、再生される仮想音場を再構築するという信号処理がネットワークを介して送信されるオーディオデータ等のコンテンツデータに対してもリアルタイムに可能になる。
【0070】
また例えば、信号再生装置4では、オーディオデータ等のコンテンツデータを提供する提供業者が過去に発売されたCD、DVD等のコンテンツについての音源情報及び音像位置情報が記述されたメタデータをWebページ上で提供するなどして旧来資産であるコンテンツに対しても仮想音場を再構築する信号処理を実行することにより視聴者の臨場感を高めることができる。
【0071】
図1、図6、図7、図8に示した信号再生装置の多チャンネルアンプ21及びオーディオ信号出力回路22の出力先として適用可能なスピーカシステムの具体例について説明する。
【0072】
図9に示すスピーカシステム50は、音波面再生用多チャンネル音響増幅回路51と、5.1チャンネル用多チャンネル音響増幅回路52と、音波面再生用スピーカ531、532、・・・、53nと、聴取者の正面スピーカ541、右前方スピーカ542、左前方スピーカ543、右後方スピーカ544、左後方スピーカ545、低音出力用サブウーファースピーカ546の6つのスピーカからなる5.1チャンネル用スピーカシステムとを備えている。
【0073】
スピーカシステム50は、図1、図6、図7、図8に示した信号再生装置における多チャンネルアンプ21及びオーディオ信号出力回路22を含んで構成されており、多チャンネルアンプ21は、音波面用多チャンネル音響増幅回路51及び5.1チャンネル用音響増幅回路52に相当する。したがって、音波面用多チャンネル音響増幅回路51、5.1チャンネル用音響増幅回路52には、音源信号算出処理部26によって算出された音源信号と制御パラメータに基づいて仮想音源位置算出処理部25で算出された仮想音源位置に再配置するための音場合成が行われたオーディオ信号が音場合成処理部27から送られるようになっている。
【0074】
オーディオデータは、音波面用多チャンネル音響増幅回路51、5.1チャンネル用音響増幅回路52によってチャンネル毎に増幅され、音声出力デバイスとしてのスピーカから出力される。5.1チャンネルサラウンド方式の場合には、聴取者の正面、右前方、左前方、右後方、左後方、低音出力用サブウーファースピーカの6つのスピーカから出力される。また、音波面再生用スピーカ531〜53nからは、それぞれ異なる波面をもつ音が出力され、任意の位置に音像定位する波面合成が行われる。
【0075】
この平面アレイスピーカ50は、例えば、投写型プロジェクタ60と組み合わせて使用することにより、ユーザはより臨場感のある音場を得ることができる。投写型プロジェクタ60から出射された映像光は、音波面再生用スピーカ53前面聴者側に置かれたスクリーン61に投写される。スクリーン61の背後に配置されたスピーカシステムから音場合成処理部27で合成された合成音響信号が各スピーカから出力されると、上述した信号再生装置によって再合成された音場が構築される
【図面の簡単な説明】
【0076】
【図1】本発明の第1の具体例として示す信号再生装置を説明する構成図である。
【図2】上記信号再生装置の音像情報抽出回路によって分離される周波数成分f1の時間に対する強度を示す波形図である。
【図3】上記信号再生装置の音像情報抽出回路によって分離される周波数成分f2の時間に対する強度を示す波形図である。
【図4】上記信号再生装置の音像情報抽出回路によって分離される周波数成分f3の時間に対する強度を示す波形図である。
【図5】上記信号再生装置の音像情報抽出回路によって分離される周波数成分f4の時間に対する強度を示す波形図である。
【図6】本発明の第2の具体例として示す信号再生装置を説明する構成図である。
【図7】本発明の第3の具体例として示す信号再生装置を説明する構成図である。
【図8】本発明の第4の具体例として示す信号再生装置を説明する構成図である。
【図9】本発明の具体例として示す信号再生装置で合成された音響信号を再生することのできるスピーカシステムの一例を説明する構成図である。
【符号の説明】
【0077】
1,2,3,4 信号再生装置、 11 光ディスク再生部、 12 信号分離回路、 13 オーディオデコーダ、 14 オーディオ信号処理回路、 15 字幕デコーダ、 16 字幕再生回路、 17 ビデオデコーダ、 18 ビデオ信号再生回路、 19 字幕合成回路、 20 ビデオ信号出力回路、 21 多チャンネルアンプ、 22 オーディオ信号出力回路、 23 オーディオ信号再生処理部、 24 音像情報抽出処理部、 25 仮想音源位置算出処理部、 26 音源信号算出処理部、 27 音場合成処理部、 28,33,36 識別コード生成部、 29,34,38 検索処理部、 31,37 ネットワークI/F、 32 受信バッファ、 35 識別コード入力部

【特許請求の範囲】
【請求項1】
オーディオ信号が多重化された多チャンネルデータを再生する信号再生装置において、
上記多チャンネルデータを取得する多チャンネルデータ取得手段と、
上記多チャンネルデータから特定音像の音源情報と音像位置情報とを抽出する信号解析手段と、
上記音源情報から音源信号を算出する音源信号算出手段と、
上記抽出された特定音像の音源情報を変更し変更後の特定音像の音源信号を任意の仮想音源位置に配置する音場合成を行う音場合成手段と
を備えることを特徴とする信号再生装置。
【請求項2】
上記抽出された特定音像の音源情報と上記音像位置情報とにしたがって上記特定音像の仮想音源位置を算出する仮想音源位置算出手段を備え、上記音場合成手段は、上記音源信号算出手段において算出された音源信号を上記仮想音源位置に配置することを特徴とする請求項1記載の信号再生装置。
【請求項3】
上記音源信号算出手段は上記音源情報に基づいて新たな音源信号を算出し、上記音場合成手段は上記新たな音源信号を任意の仮想音源位置に配置することを特徴とする請求項2記載の信号再生装置。
【請求項4】
上記音源信号算出手段は、上記特定音像の音源信号を奥行き方向に配置変更した音源信号を算出することを特徴とする請求項1記載の信号再生装置。
【請求項5】
上記多チャンネルデータは、インテンシティステレオ信号であって、上記音源信号算出手段は上記信号解析手段における解析結果に基づいて上記インテンシティステレオ信号から中央位置に音像定位する音源信号のみを分離し、上記音場合成手段は上記中央位置に音像定位する音源信号が取り除かれたインテンシティステレオ信号を通常のインテンシティステレオ再生するとともに上記分離した音源信号を中央位置に再配置することを特徴とする請求項1記載の信号再生装置。
【請求項6】
音像毎の音源情報及び音像位置情報が上記多チャンネルデータから独立して用意されていることを特徴とする請求項1記載の信号再生装置。
【請求項7】
上記記録媒体には、上記音源情報及び音像位置情報が多チャンネルデータの一部から生成された各コンテンツ固有のデータ識別情報に対応づけて所定領域に格納され、上記多チャンネルデータを特定するデータ識別情報を該多チャンネルデータの一部から生成するデータ識別情報生成手段と、上記生成されたデータ識別情報に対応する上記音源情報及び音像位置情報を上記領域から検索する検索手段とを備えることを特徴とする請求項6記載の信号再生装置。
【請求項8】
上記多チャンネルデータと、該多チャンネルデータから独立して用意された上記音像毎の音源情報及び音像位置情報は、ネットワークを介して提供されることを特徴とする請求項6記載の信号再生装置。
【請求項9】
上記多チャンネルデータは記録媒体に格納されて提供され、上記音像毎の音源情報及び音像位置情報はネットワークを介して提供されることを特徴とする請求項6記載の信号再生装置。
【請求項10】
オーディオ信号が多重化された多チャンネルデータを再生する信号再生方法において、
上記多チャンネルデータを取得する多チャンネルデータ取得工程と、
上記多チャンネルデータから特定音像の音源情報と音像位置情報を抽出する信号解析工程と、
上記音源情報から音源信号を算出する音源信号算出工程と、
上記抽出された特定音像の音像情報を変更し変更後の特定音像の音源信号を任意の仮想音源位置に配置する音場合成を行う音場合成工程と
を有することを特徴とする信号再生方法。
【請求項11】
上記抽出された特定音像の音像情報と上記音像位置情報とにしたがって上記特定音像の仮想音源位置を算出する仮想音源位置算出工程を有し、
上記音場合成工程では、上記音源信号算出工程で算出された音源信号を上記仮想音源位置に配置することを特徴とする請求項10記載の信号再生方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate


【公開番号】特開2006−279555(P2006−279555A)
【公開日】平成18年10月12日(2006.10.12)
【国際特許分類】
【出願番号】特願2005−95713(P2005−95713)
【出願日】平成17年3月29日(2005.3.29)
【出願人】(000002185)ソニー株式会社 (34,172)
【Fターム(参考)】