説明

オーディオ符号化及び復号

オーディオエンコーダが、Mチャンネルのオーディオ信号を入力する多チャンネルレシーバ401を有し、ここで、M>2である。ダウンミックスプロセッサ403は、上記Mチャンネルオーディオ信号を第1ステレオ信号及び関連パラメトリックデータにダウン混合する。空間プロセッサ407は、上記関連パラメトリックデータ及び頭部伝達関数(HRTF)等の両耳知覚伝達関数のための空間パラメータデータに応答して、上記第1ステレオ信号を修正し、第2ステレオ信号を発生する。該第2ステレオ信号は、両耳信号であり、特には(3D)仮想空間信号とすることができる。符号化されたデータ及び上記関連パラメトリックデータを有する出力データストリームが、エンコードプロセッサ411及び出力プロセッサ413により発生される。上記HRTF処理は、従来のステレオデコーダによる(3D)仮想空間信号の発生を可能にすることができる。多チャンネルデコーダは、上記空間プロセッサ407の処理を逆に処理して、改善された品質の多チャンネル信号を発生することができる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、オーディオ符号化及び/又は復号に係り、専らではないが、特には両耳仮想空間信号を含むようなオーディオ符号化及び/又は復号に関する。
【背景技術】
【0002】
種々のソースの信号のデジタル符号化は、デジタル信号表現及び通信がアナログ表現及び通信を置換するにつれて、最近の十年にわたり益々重要になってきている。例えば、ビデオ及び音楽等のメディアコンテンツの配信は、益々、デジタルコンテンツの符号化に基づくものとなっている。
【0003】
更に、最近の十年においては、多チャンネルオーディオに向かう、特には従来のステレオ信号を超えて広がるような空間オーディオに向かう傾向がある。例えば、伝統的なステレオ記録が2つのチャンネルのみを有するのに対し、近年の進んだオーディオシステムは、典型的には、ポピュラーな5.1サラウンドサウンドシステムにおけるように5つ又は6つのチャンネルを使用する。これは、ユーザが音源により取り囲まれ得るような一層引き込まれる聴取体験を提供する。
【0004】
このような多チャンネル信号の通信のために、種々の技術及び規格が開発されている。例えば、5.1サラウンドシステムを表す6つの個別チャンネルは、アドバンスド・オーディオ・コーディング(AAC)又はドルビー・デジタル規格等の規格に従って送信することができる。
【0005】
しかしながら、後方互換性を提供するために、大きな数のチャンネルを小さな数にダウン混合(down-mix)することが知られており、これが、特に、5.1サラウンドサウンド信号をステレオ信号にダウン混合して、ステレオ信号が旧来の(ステレオ)デコーダにより再生され、5.1信号がサラウンドサウンドデコーダにより再生されるのを可能にするためにしばしば用いられる。
【0006】
一例が、MPEG2後方互換性符号化方法である。多チャンネル信号が、ステレオ信号にダウン混合される。追加の信号が補助データ部分に符号化され、MPEG2多チャンネルデコーダが多チャンネル信号の表現を発生するのを可能にする。MPEG1デコーダは上記補助データを無視し、かくして、ステレオダウンミックスのみを復号する。MPEG2に適用される該符号化方法の主たる問題点は、上記追加の信号に要する追加のデータレートが、当該ステレオ信号を符号化するのに要するデータレートと同程度の大きさである点である。従って、ステレオを多チャンネルオーディオに拡張するための該追加のビットレートは、大きなものとなる。
【0007】
追加の多チャンネル情報を用いない後方互換性多チャンネル送信のための他の既存の方法は、典型的には、マトリクス型サラウンド方法として特徴付けられることができる。マトリクスサラウンドサウンド符号化の例は、ドルビプロロジックII及びロジック7等の方法を含む。これら方法の共通原理は、これらが、入力信号の複数チャンネルを適切な非二次(non-quadratic)マトリクスにより行列乗算し、これにより、より小数のチャンネルの出力信号を発生するということである。特に、マトリクスエンコーダは、典型的には、サラウンドチャンネルに対して、これらを前(フロント)及び中央(センタ)チャンネルと混合する前に位相シフトを付与する。
【0008】
チャンネル変換の他の理由は、符号化効率である。例えば、サラウンドサウンドオーディオ信号が、当該オーディオ信号の空間特性を記述するパラメータビットストリームと組み合わされたステレオチャンネルオーディオ信号として符号化することができることが分かっている。デコーダは該ステレオ信号を非常に満足のゆく精度で再生することができる。この様にして、かなりのビットレート節約を獲得することができる。
【0009】
オーディオ信号の空間特性を記述するために使用することができる幾つかのパラメータが存在する。1つの斯様なパラメータは、ステレオ信号に関する左チャンネルと右チャンネルとの間の相互相関(cross-correlation)のような、チャンネル間相互相関である。他のパラメータは、チャンネルの出力比(power ratio)である。所謂(パラメトリック)空間オーディオ(エン)コーダにおいては、これら及び他のパラメータが元のオーディオ信号から抽出されて、例えば単一のチャンネルと元のオーディオ信号の空間特性を記述した一群のパラメータとを加えたもの等の、低減されたチャンネル数を持つオーディオ信号を生成する。所謂(パラメトリック)空間オーディオデコーダにおいては、送信された空間パラメータにより記述された空間特性が回復される。
【0010】
このような空間オーディオ符号化は、好ましくは、エンコーダ及びデコーダに標準のユニットを有する縦続接続された又はツリー型の階層構造を採用する。エンコーダにおいて、これらの標準のユニットは、2/1、3/1、3/2他のダウンミキサ等のチャンネルを一層少ない数のチャンネルに組み合わせるダウンミキサとすることができる一方、デコーダにおいて、対応する標準のユニットは1/2、2/3他のアップミキサ等のチャンネルを一層多い数のチャンネルに分割するアップミキサであり得る。
【0011】
3D音源配置法は、現在、特に移動体分野において関心を得ている。移動体ゲームにおける音楽再生及び音響効果は、3Dに配置された場合に消費者の体験に大きな価値を追加することができ、効果的に"頭部外"3D効果を生成する。特に、人の耳が敏感な固有の指向性情報を含んだ両耳オーディオ信号を記録及び再生することが知られている。両耳記録は、典型的には、ダミーの人の頭部に装着された2つのマイクロフォンを用いてなされ、かくして、記録された音は人の耳により捕捉された音に対応し、頭部及び耳の形状による如何なる影響をも含む。両耳記録はステレオ(即ち、立体音響:ステレオフォニック)記録とは、両耳記録の再生が一般的にヘッドセット又はヘッドフォンのためのものであるのに対し、ステレオ記録が一般的にスピーカによる再生のためになされる点で相違する。両耳記録が2つのチャンネルのみを用いて全空間情報の再生を可能にするのに対し、ステレオ記録は同様の空間的知覚を提供することはない。通常の双チャンネル(ステレオフォニック)又は多チャンネル(例えば、5.1)記録は、各々の通常の信号を一群の知覚伝達関数で畳み込むことにより、両耳記録に変換することができる。このような知覚伝達関数は、当該信号に対する人の頭部の、及び恐らくは他の物体の影響をモデル化する。良く知られたタイプの空間知覚伝達関数は、所謂、頭部伝達関数(Head-Related Transfer Function: HRTF)である。部屋の壁、天井及び床により生じる反射も考慮した代替タイプの空間知覚伝達関数は、両耳室内インパルス応答(BRIR)である。
【0012】
典型的に、3D配置アルゴリズムは、或る音源位置から鼓膜へのインパルス応答による伝達を記述するようなHRTFを使用する。3D音源配置法は、HRTFにより多チャンネル信号に適用することができ、これにより、両耳信号が例えば一対のヘッドフォンを用いてユーザに空間音響情報を提供することを可能にする。
【0013】
高さ(又は仰角:elevation)の知覚は、両耳に到達するスペクトル中の固有のピーク及びノッチ(V字状切り込み)により主に可能にされることが知られている。一方、音源の(知覚される)方位(azimuth)は、鼓膜における信号の間のレベル差及び到達時間差等の"両耳的"合図(cue)で捕捉される。距離の知覚は、全体の信号レベルにより主に可能にされ、反響する環境の場合は、直接及び反響エネルギの比により可能にされる。殆どの場合において、特に遅い反響音末尾においては、信頼のおける音源突き止め合図は存在しないと仮定される。
【0014】
高さ、方位及び距離に関する知覚合図は、インパルス応答(の対)により捕捉することができ、ここで、一方のインパルス応答は特定の音源位置から左耳への伝達を示し、もう一方は右耳に対するものである。従って、高さ、方位及び距離に関する知覚合図は、HRTFインパルス応答の対応する特性により決定される。殆どの場合において、HRTF対は、大きな群の音源位置に関し、典型的には高さ及び方位の両方において約5°の空間的分解能で測定される。
【0015】
従来の両耳3D合成は、所望の音源位置に対するHRTF対による入力信号のフィルタ処理(畳み込み)を含む。しかしながら、HRTFは典型的には無響条件で測定されるので、"距離"又は"頭部外"位置特定の知覚が、しばしば、欠ける。無響HRTFによる信号の畳み込みは3Dサウンド合成にとり十分ではないが、無響HRTFの使用は、複雑さ及び柔軟性の観点から時には好ましい。反響性環境の効果(距離の知覚の生成に必要とされる)は後の段階で追加することができ、エンドユーザが部屋の音響特性を変更するための幾らかの柔軟性を残すようにする。更に、遅い反響は、しばしば、全方向的である(指向的合図がない)と仮定されるので、この処理方法は、全ての音源を反響性HRTF対により畳み込むより時には効率的である。更に、室内音響学に関する複雑さ及び柔軟性の反対論とは別に、無響HRTFの使用は、"ドライな"(指向的合図の)信号に対しても利点を有している。
【0016】
3D配置法の分野における最近の研究は、無響HRTFインパルス応答により表される周波数分解能が、多くの場合、必要以上であることを示している。特に、位相及び振幅スペクトルの両方にとり、ERBスケールにより提案された非線形周波数分解能は、3D音源を、完全な無響HRTFで処理するのと知覚的に異ならないような精度で合成するのに十分であるように思われる。言い換えると、無響HRTFスペクトルは、人の聴覚系の周波数分解能より高いスペクトル分解能を必要としない。
【0017】
従来の両耳合成アルゴリズムが、図1に概略図示されている。一群の入力チャンネルが、一群のHRTFによりフィルタ処理される。各入力信号は2つの信号(左"L"及び右"R"成分)に分割され、次いで、これら信号の各々が所望の音源位置に対応するHRTFによりフィルタ処理される。次いで、全ての左耳信号は加算されて左の両耳出力信号を発生し、右耳信号は加算されて、右の両耳出力信号を発生する。
【0018】
HRTF畳み込みは、時間ドメインでも実行することができるが、積としての該フィルタ処理を周波数ドメインで実行することが、しばしば、好まれる。その場合、上記加算も周波数ドメインで実行することができる。
【0019】
サラウンドサウンド符号化信号を入力し、両耳信号からサラウンドサウンドの体験を生じさせることが可能なデコーダシステムが知られている。例えば、サラウンドサウンド信号がサラウンドサウンド両耳信号に変換されるのを可能にして、ユーザにサラウンドサウンド体験を提供するようなヘッドフォンシステムが知られている。
【0020】
図2は、MPEGサラウンドデコーダが空間パラメトリックデータを伴うステレオ信号を入力するようなシステムを図示している。入力ビットストリームはデマルチプレクス処理されて、空間パラメータ及びダウンミックスビットストリームが得られる。後者のビットストリームは、従来のモノラル又はステレオデコーダを用いて復号される。復号されたダウンミックスは空間デコーダにより復号されるが、該空間デコーダは伝送された空間パラメータに基づいて多チャンネル出力信号を発生する。最後に、上記多チャンネル出力信号は両耳合成段(図1のものと同様のもの)により処理されて、ユーザにサラウンドサウンド体験を提供するような両耳出力信号となる。
【発明の開示】
【発明が解決しようとする課題】
【0021】
しかしながら、このような方法は、多数の問題点を有している。
【0022】
例えば、サラウンドサウンドデコーダと両耳合成の縦続接続は、中間ステップとしての多チャンネル信号表現の計算に、両耳合成ステップにおけるHRTF畳み込み及びダウンミックス処理が後続する処理を含む。これは、結果として、複雑さの増加及び性能の低減となり得る。
【0023】
また、該システムは非常に複雑である。例えば、空間デコーダは典型的にはサブバンド(QMF)ドメインで動作する。一方、HRTF畳み込みは、典型的には、FFTドメインにおいて最も効率的に実施化することができる。従って、多チャンネルQMF合成フィルタバンク、多チャンネルFFT変換及びステレオ逆FFT変換の縦続接続が必要となり、結果的に高い計算要求度のシステムとなってしまう。
【0024】
提供されるユーザ体験の品質も、低下され得る。例えば、多チャンネル再生を行う上記空間デコーダにより生成される符号化アーチファクトが、(ステレオ)両耳出力においても依然として聴こえるようになる。
【0025】
更に、該方法は、専用のデコーダを必要とすると共に、複雑な信号処理が個々のユーザ装置により実行されることを必要とする。これは、多くの状況における応用を妨げ得る。例えば、ステレオダウンミックスしか復号することができない旧来の装置は、サラウンドサウンドのユーザ体験を適用することはできないであろう。
【0026】
従って、改善されたオーディオ符号化/復号が有利であろう。
【0027】
従って、本発明は上述した問題点の1以上を単独又は何らかの組み合わせで好ましくも緩和、軽減又は除去することを目指すものである。
【課題を解決するための手段】
【0028】
本発明の第1態様によれば、Mチャンネルオーディオ信号を入力する手段と(但し、M>2)、該Mチャンネルオーディオ信号を第1ステレオ信号及び関連パラメトリックデータにダウン混合するダウン混合手段と、上記関連パラメトリックデータ及び両耳知覚伝達関数のための空間パラメータデータに応答して上記第1ステレオ信号を修正し、両耳信号である第2ステレオ信号を発生する発生手段と、該第2ステレオ信号を符号化して符号化データを発生する手段と、該符号化データ及び前記関連パラメトリックデータを有する出力データストリームを発生する出力手段とを有するようなオーディオエンコーダが提供される。
【0029】
本発明は、改善されたオーディオ符号化を可能にする。特に、本発明は多チャンネル信号の効果的ステレオ符号化を可能にする一方、旧来の(レガシ)ステレオデコーダが空間体験を向上させるのを可能にすることができる。更に、本発明はデコーダにおいて両耳仮想空間合成処理が逆処理されるのを可能にし、これにより、高品質多チャンネル復号を可能にする。本発明は、複雑さの少ないエンコーダを可能にすると共に、特に両耳信号の少ない複雑さでの発生を可能にすることができる。本発明は、実施の容易化及び機能の再利用を可能にすることができる。
【0030】
特に、本発明は、多チャンネル信号からの両耳仮想空間信号のパラメータに基づく決定を行う。
【0031】
上記両耳信号は、特定的には、仮想3D両耳ステレオ信号等の両耳仮想空間信号とすることができる。前記Mチャンネルオーディオ信号は、5.1又は7.1サラウンド信号等のサラウンド信号とすることができる。上記両耳仮想空間信号は、上記Mチャンネルオーディオ信号の各チャンネルに対して1つの音源位置をエミュレーションすることができる。前記空間パラメータデータは、意図する音源位置から意図するユーザの鼓膜までの伝達関数を示すデータを有することができる。
【0032】
前記両耳知覚伝達関数は、例えば、頭部伝達関数(HRTF)又は両耳室内インパルス応答(BPIR)とすることができる。
【0033】
本発明のオプション的フィーチャによれば、前記発生手段は前記第2ステレオ信号を、前記関連パラメトリックデータ、前記空間パラメータデータ及び前記第1ステレオ信号用のサブバンドデータ値に応答して該第2ステレオ信号用のサブバンドデータ値を計算することにより発生するよう構成される。
【0034】
これは、符号化が改善され、及び/又は実施化が容易にされるのを可能にすることができる。即ち、該フィーチャは、複雑さの低減及び/又は計算的負荷の軽減を提供することができる。第1ステレオ信号、第2ステレオ信号、前記関連パラメトリックデータ及び前記空間パラメータデータの周波数サブバンド間隔は異なることができるか、又はこれらの幾つか若しくは全てに関して幾つか若しくは全てのサブバンドは実質的に同一とすることもできる。
【0035】
本発明のオプション的フィーチャによれば、前記発生手段は前記第2ステレオ信号の第1サブバンドのためのサブバンド値を、前記第1ステレオ信号用の対応するステレオサブバンド値の第1サブバンドマトリクスによる乗算に応答して発生するよう構成され、該発生手段は、第1サブバンド用の関連パラメトリックデータ及び空間パラメータデータに応答して上記第1サブバンドマトリクスのデータ値を決定するパラメータ手段を更に有する。
【0036】
これは、符号化の改善及び/又は実施化の容易化を可能にし得る。即ち、該フィーチャは複雑さを低減し及び/又は計算的負荷を軽減し得る。特に、本発明は、個々のサブバンドに対してマトリクス演算を実行することにより、多チャンネル信号から両耳仮想空間信号をパラメータに基づいて決定するのを可能にする。第1サブバンドマトリクス値は、多チャンネル復号及び結果としての多チャンネルのHRTF/BRIRフィルタ処理の縦続接続の組み合わせ効果を反映し得る。サブバンドマトリクス乗算は、第1ステレオ信号の全サブバンドに対して実行することができる。
【0037】
本発明のオプション的フィーチャによれば、前記発生手段は、更に、第1サブバンド間隔とは異なる周波数間隔を持つサブバンドに関連する第1ステレオ信号、関連パラメトリックデータ及び空間パラメータデータのうちの少なくとも1つのデータ値を、第1サブバンドのための対応するデータ値に変換する手段を有する。
【0038】
これは、符号化の改善及び/又は実施化の容易化を可能にし得る。即ち、該フィーチャは複雑さを低減し及び/又は計算的負荷を軽減し得る。特に、本発明は、異なる処理及びアルゴリズムが、個々の処理に最適なサブバンド分割に基づくものとなるのを可能にし得る。
【0039】
本発明のオプション的フィーチャによれば、前記発生手段は、前記第2ステレオ信号の第1サブバンドのためのステレオサブバンド値L,Rを、実質的に、
【数1】

として決定するように構成され、ここで、L,Rは第1ステレオ信号の対応するサブバンド値である。そして、前記パラメータ手段は乗算マトリクスのデータ値を、実質的に、
【数2】

として決定するように構成され、ここで、mk,lは前記ダウン混合手段によるチャンネルL、R及びCの前記第1ステレオ信号へのダウンミックスに関する関連パラメトリックデータに応答して決定されるパラメータであり、H(X)は第2ステレオ信号のステレオ出力チャンネルJに対するチャンネルXに関する空間パラメータデータに応答して決定される。
【0040】
これは、改善された符号化及び/又は容易化された実施構成を可能にする。即ち、該フィーチャは複雑さの低減及び/又は計算的負荷の低減を提供することができる。
【0041】
本発明のオプション的フィーチャによれば、チャンネルL及びRの少なくとも一方は、少なくとも2つのダウン混合されたチャンネルのダウンミックスに対応し、前記パラメータ手段は、H(X)を、上記少なくとも2つのダウン混合されたチャンネルに関する空間パラメータデータの加重組み合わせに応答して決定するように構成される。
【0042】
これは、改善された符号化及び/又は容易化された実施構成を可能にする。即ち、該フィーチャは複雑さの低減及び/又は計算的負荷の低減を提供することができる。
【0043】
本発明のオプション的フィーチャによれば、前記パラメータ手段は、上記少なくとも2つのダウン混合されたチャンネルに関する空間パラメータデータの重み付けを、該少なくとも2つのダウン混合されたチャンネルに関する相対エネルギ尺度に応答して決定するように構成される。
【0044】
これは、改善された符号化及び/又は容易化された実施構成を可能にする。即ち、該フィーチャは複雑さの低減及び/又は計算的負荷の低減を提供することができる。
【0045】
本発明のオプション的フィーチャによれば、前記空間パラメータデータは、サブバンド当たりの平均レベルパラメータ、平均到達時間パラメータ、少なくとも1つのステレオチャンネルの位相、タイミングパラメータ、群遅延パラメータ、ステレオチャンネル間の位相、及びチャンネル相互間相関パラメータからなるグループから選択される少なくとも1つのパラメータを含む。
【0046】
これらのパラメータは、特別に有利な符号化を提供することができると共に、特にサブバンド処理に特別に適している。
【0047】
本発明のオプション的フィーチャによれば、前記出力手段は出力ストリームに音源位置データを含めるように構成される。
【0048】
これは、デコーダが適切な空間パラメータデータを決定するのを可能にし、及び/又は少ないオーバーヘッドで空間パラメータデータを示す効率的な方法を提供することができる。また、これは、デコーダにおける両耳仮想空間合成処理を逆処理する効率的方法を提供することができ、これにより、高品質な多チャンネル復号を可能にする。該フィーチャは、更に、改善されたユーザ体験を可能にすると共に、移動する音源での両耳仮想空間信号の実施化を可能又は容易化し得る。該フィーチャは、代わりに又は追加的に、例えば先ずエンコーダで実行された合成を逆処理し、次いで個別化された又は個性化された両耳知覚伝達関数を用いて合成する等により、デコーダにおける空間合成の個別化を可能にする。
【0049】
本発明のオプション的フィーチャによれば、前記出力手段は、出力ストリームに前記空間パラメータデータの少なくとも幾らかを含ませるように構成される。
【0050】
これは、デコーダにおける両耳仮想空間合成処理を逆処理する効率的方法を提供することができ、これにより、高品質な多チャンネル復号を可能にする。該フィーチャは、更に、改善されたユーザ体験を可能にすると共に、移動する音源での両耳仮想空間信号の実施化を可能又は容易化し得る。上記空間パラメータデータは、例えばデコーダが該空間パラメータデータを決定するのを可能にするような情報を含めることにより、出力ストリームに直接的に又は間接的に含めることができる。該フィーチャは、代わりに又は追加的に、例えば先ずエンコーダで実行された合成を逆処理し、次いで個別化された又は個性化された両耳知覚伝達関数を用いて合成する等により、デコーダにおける空間合成の個別化を可能にする。
【0051】
本発明のオプション的フィーチャによれば、前記エンコーダは、前記空間パラメータデータを所望のサウンド信号位置に応答して決定する手段を更に有する。
【0052】
これは、改善された符号化及び/又は容易化された実施構成を可能にする。上記所望のサウンド信号位置は、前記Mチャンネル信号の個々のチャンネルに関する音源の位置に対応することができる。
【0053】
本発明の他の態様によれば、Mチャンネルオーディオ信号(但し、M>2)に対応した両耳信号である第1ステレオ信号と該Mチャンネルオーディオ信号のダウン混合されたステレオ信号に関連するパラメトリックデータとを有する入力データを入力する手段と、前記パラメトリックデータと前記第1ステレオ信号に関連する両耳知覚伝達関数のための第1空間パラメータデータとに応答して、前記第1ステレオ信号を修正することにより前記ダウン混合されたステレオ信号を発生する発生手段とを有するようなオーディオデコーダが提供される。
【0054】
本発明は、改善されたオーディオ復号を可能にし得る。特に、本発明は、高品質のステレオ復号を可能にすると共に、特にエンコーダの両耳仮想空間合成処理がデコーダにおいて逆処理されるのを可能にする。本発明は、低複雑度のデコーダを可能にする。本発明は、容易化された実施構成及び機能の再利用を可能にする。
【0055】
上記両耳信号は、特には、仮想3D両耳ステレオ信号等の両耳仮想空間信号とすることができる。上記空間パラメータデータは、意図する音源位置から意図するユーザの耳までの伝達関数を示すデータを有することができる。上記両耳知覚伝達関数は、例えば、頭部伝達関数(HRTF)又は両耳室内インパルス応答(BRIR)とすることができる。
【0056】
本発明のオプション的フィーチャによれば、当該オーディオデコーダは、前記ダウン混合されたステレオ信号及び前記パラメトリックデータに応答して、前記Mチャンネルオーディオ信号を発生する手段を更に有する。
【0057】
本発明は、改善されたオーディオ復号を可能にし得る。特に、本発明は、高品質の多チャンネル復号を可能にすると共に、特にエンコーダの両耳仮想空間合成処理がデコーダにおいて逆処理されるのを可能にする。本発明は、低複雑度のデコーダを可能にする。本発明は、容易化された実施構成及び機能の再利用を可能にする。
【0058】
上記Mチャンネルオーディオ信号は、5.1又は7.1サラウンド信号等のサラウンド信号とすることができる。上記両耳信号は、Mチャンネルオーディオ信号の各チャンネルに対して1つの音源位置をエミュレーションするような仮想空間信号とすることができる。
【0059】
本発明のオプション的フィーチャによれば、前記発生手段は、前記第1ステレオ信号に関するサブバンドデータ値、前記空間パラメータデータ及び前記関連するパラメトリックデータに応答して、前記ダウン混合されたステレオ信号に関するサブバンドデータ値を計算することにより前記ダウン混合されたステレオ信号を発生するよう構成される。
【0060】
これは、改善された復号及び/又は容易化された実施構成を可能にする。特に、該フィーチャは、複雑さを低減させ、及び/又は計算的負荷を低減させる。前記第1ステレオ信号、ダウン混合されたステレオ信号、関連するパラメトリックデータ及び空間パラメータデータの周波数サブバンド間隔は異なってもよく、又は幾つかの若しくは全てのサブバンドは、これらの幾つか又は全てに対して実質的に同一であってもよい。
【0061】
本発明のオプション的フィーチャによれば、前記発生手段は、前記ダウン混合されたステレオ信号の第1サブバンドに関するサブバンド値を、前記第1ステレオ信号に関する対応するステレオサブバンド値の第1サブバンドマトリクスによる乗算に応答して発生するよう構成され、該発生手段は、前記第1サブバンドに関する空間パラメータデータ及びパラメトリックデータに応答して前記第1サブバンドマトリクスのデータ値を決定するパラメータ手段を更に有している。
【0062】
これは、改善された復号及び/又は容易化された実施構成を可能にする。特に、該フィーチャは、複雑さを低減させ、及び/又は計算的負荷を低減させる。上記第1サブバンドマトリクス値は、多チャンネル復号及び結果としての多チャンネルのHRTF/BRIRフィルタ処理の縦続接続の組み合わせ効果を反映し得る。サブバンドマトリクス乗算は、ダウン混合されたステレオ信号の全てのサブバンドに対して実行することができる。
【0063】
本発明のオプション的フィーチャによれば、前記入力データは少なくとも幾らかの空間パラメータデータを有する。
【0064】
これは、エンコーダにおいて実行された両耳仮想空間合成処理を逆処理する効率的な方法を提供し、これにより、高品質の多チャンネル復号を可能にする。該フィーチャは、更に、改善されたユーザ体験を可能にすると共に、移動する音源の両耳仮想空間信号の実施化を可能に又は容易化し得る。上記空間パラメータデータは前記入力データに直接的に又は間接的に含めることができ、例えば、該データはデコーダが当該空間パラメータデータを決定するのを可能にするような如何なる情報とすることもできる。
【0065】
本発明のオプション的フィーチャによれば、前記入力データは音源位置データを有し、当該デコーダは該音源位置データに応答して空間パラメータデータを決定する手段を有する。
【0066】
これは、改善された符号化及び/又は容易化された実施構成を可能にする。所望のサウンド信号位置は、Mチャンネル信号の個々のチャンネルに関する音源の位置に対応し得る。
【0067】
当該デコーダは、例えば、異なる音源位置に関連したHRTF空間パラメータデータを有するようなデータ記憶部を有することができ、使用すべき空間パラメータデータを、示された位置に対するパラメータデータを取り出すことにより決定することができる。
【0068】
本発明のオプション的フィーチャによれば、当該オーディオデコーダは、前記関連するパラメトリックデータと、前記第1空間パラメータデータとは異なる第2両耳感知伝達関数に関する第2空間パラメータデータとに応答して、前記第1ステレオ信号を修正することにより1対の両耳出力チャンネルを生成する空間デコーダユニットを更に有する。
【0069】
該フィーチャは、改善された空間合成を可能にすると共に、特に、特定のユーザに特に適した個人的又は個別化された空間合成両耳信号を可能にする。これは、旧来のステレオデコーダが該デコーダにおける空間合成を必要とすることなく空間両耳信号を発生するのを可能にしながら、達成することができる。従って、改善されたオーディオシステムを達成することができる。上記第2両耳知覚伝達関数は、特には第1空間パラメータデータの両耳知覚伝達関数とは異なるものとすることができる。該第2両耳知覚伝達関数及び第2空間データは、特に、当該デコーダの個々のユーザに対して個別化することができる。
【0070】
本発明のオプション的フィーチャによれば、上記空間デコーダユニットは、前記パラメトリックデータを、前記第2空間パラメータデータを用いて両耳合成パラメータに変換するパラメータ変換ユニットと、前記1対の両耳チャンネルを、前記両耳合成パラメータ及び前記第1ステレオ信号を用いて合成する空間合成ユニットとを有する。
【0071】
これは、改善された性能及び/又は容易化された実施構成及び/又は複雑さの低減を可能にする。上記両耳パラメータは、両耳チャンネルのサブバンドサンプルを発生するために第1ステレオ信号及び/又はダウン混合されたステレオ信号のサブバンドサンプルで乗算することができるようなパラメータとすることができる。該乗算は、例えば、マトリクス乗算であり得る。
【0072】
本発明のオプション的フィーチャによれば、上記両耳合成パラメータは、前記ダウン混合されたステレオ信号のステレオサンプルを前記1対の両耳出力チャンネルのステレオサンプルに関係付ける2x2マトリクスのマトリクス係数を有する。
【0073】
これは、改善された性能及び/又は容易化された実施構成及び/又は複雑さの低減を可能にする。上記ステレオサンプルは、例えばQMF又はフーリエ変換周波数サブバンドのステレオサブバンドサンプルであり得る。
【0074】
本発明のオプション的フィーチャによれば、上記両耳合成パラメータは、前記第1ステレオ信号のステレオサブバンドサンプルを前記1対の両耳出力チャンネルのステレオサンプルに関係付ける2x2マトリクスのマトリクス係数を有する。
【0075】
これは、改善された性能及び/又は容易化された実施構成及び/又は複雑さの低減を可能にする。上記ステレオサンプルは、例えばQMF又はフーリエ変換周波数サブバンドのステレオサブバンドサンプルであり得る。
【0076】
本発明の他の態様によれば、Mチャンネルオーディオ信号を入力するステップと(但し、M>2)、前記Mチャンネルオーディオ信号を第1ステレオ信号及び関連するパラメトリックデータにダウン混合するステップと、前記関連するパラメトリックデータ及び両耳知覚伝達関数のための空間パラメータデータに応答して前記第1ステレオ信号を修正し、両耳信号である第2ステレオ信号を発生するステップと、前記第2ステレオ信号を符号化して符号化データを発生するステップと、前記符号化データ及び前記関連するパラメトリックデータを有する出力データストリームを発生するステップとを有するようなオーディオ符号化方法が提供される。
【0077】
本発明の他の態様によれば、
− Mチャンネルオーディオ信号(但し、M>2)に対応した両耳信号である第1ステレオ信号と該Mチャンネルオーディオ信号のダウン混合されたステレオ信号に関連するパラメトリックデータとを有するような入力データを入力するステップと、
− 前記パラメトリックデータと前記第1ステレオ信号に関連する両耳知覚伝達関数のための空間パラメータデータとに応答して、前記第1ステレオ信号を修正することにより前記ダウン混合されたステレオ信号を発生するステップと、
を有するオーディオ復号方法が提供される。
【0078】
本発明の他の態様によれば、Mチャンネルオーディオ信号(但し、M>2)に対応した両耳信号である第1ステレオ信号と該Mチャンネルオーディオ信号のダウン混合されたステレオ信号に関連するパラメトリックデータとを有する入力データを入力する手段と、前記パラメトリックデータと前記第1ステレオ信号に関連する両耳知覚伝達関数のための空間パラメータデータとに応答して、前記第1ステレオ信号を修正することにより前記ダウン混合されたステレオ信号を発生する発生手段とを有するオーディオ信号を受信する受信機が提供される。
【0079】
本発明の他の態様によれば、Mチャンネルオーディオ信号を入力する手段と(但し、M>2)、前記Mチャンネルオーディオ信号を第1ステレオ信号及び関連するパラメトリックデータにダウン混合するダウン混合手段と、前記関連するパラメトリックデータ及び両耳知覚伝達関数のための空間パラメータデータに応答して前記第1ステレオ信号を修正し、両耳信号である第2ステレオ信号を発生する発生手段と、前記第2ステレオ信号を符号化して符号化データを発生する手段と、前記符号化データ及び前記関連するパラメトリックデータを有するような出力データストリームを発生する出力手段と、前記出力データストリームを送信する手段とを有するような出力データストリームを送信する送信機が提供される。
【0080】
本発明の他の態様によれば、
Mチャンネルオーディオ信号を入力する手段と(但し、M>2)、前記Mチャンネルオーディオ信号を第1ステレオ信号及び関連するパラメトリックデータにダウン混合するダウン混合手段と、前記関連するパラメトリックデータ及び両耳知覚伝達関数のための空間パラメータデータに応答して前記第1ステレオ信号を修正し、両耳信号である第2ステレオ信号を発生する発生手段と、前記第2ステレオ信号を符号化して符号化データを発生する手段と、前記符号化データ及び前記関連するパラメトリックデータを有するようなオーディオ出力データストリームを発生する出力手段と、前記オーディオ出力データストリームを送信する手段とを有する送信機と、
前記オーディオ出力データストリームを受信する手段と、前記パラメトリックデータと前記空間パラメータデータとに応答して、前記第2ステレオ信号を修正することにより前記第1ステレオ信号を発生する手段とを有する受信機と、
を有するようなオーディオ信号を伝送する伝送システムが提供される。
【0081】
本発明の他の態様によれば、Mチャンネルオーディオ信号(但し、M>2)に対応した両耳信号である第1ステレオ信号と該Mチャンネルオーディオ信号のダウン混合されたステレオ信号に関連するパラメトリックデータとを有する入力データを受信するステップと、前記パラメトリックデータと前記第1ステレオ信号に関連する両耳知覚伝達関数のための空間パラメータデータとに応答して、前記第1ステレオ信号を修正することにより前記ダウン混合されたステレオ信号を発生するステップとを有するようなオーディオ信号を受信する方法が提供される。
【0082】
本発明の他の態様によれば、Mチャンネルオーディオ信号を入力するステップと(但し、M>2)、前記Mチャンネルオーディオ信号を第1ステレオ信号及び関連するパラメトリックデータにダウン混合するステップと、前記関連するパラメトリックデータ及び両耳知覚伝達関数のための空間パラメータデータに応答して前記第1ステレオ信号を修正し、両耳信号である第2ステレオ信号を発生するステップと、前記第2ステレオ信号を符号化して符号化データを発生するステップと、前記符号化データ及び前記関連するパラメトリックデータを有するようなオーディオ出力データストリームを発生するステップと、前記オーディオ出力データストリームを送信するステップとを有するようなオーディオ出力データストリームを送信する方法が提供される。
【0083】
本発明の他の態様によれば、Mチャンネルオーディオ信号を入力するステップと(但し、M>2)、前記Mチャンネルオーディオ信号を第1ステレオ信号及び関連するパラメトリックデータにダウン混合するステップと、前記関連するパラメトリックデータ及び両耳知覚伝達関数のための空間パラメータデータに応答して前記第1ステレオ信号を修正し、両耳信号である第2ステレオ信号を発生するステップと、前記第2ステレオ信号を符号化して符号化データを発生するステップと、前記符号化データ及び前記関連するパラメトリックデータを有するようなオーディオ出力データストリームを発生するステップと、前記オーディオ出力データストリームを送信するステップと、前記オーディオ出力データストリームを受信するステップと、前記パラメトリックデータと前記空間パラメータデータとに応答して、前記第2ステレオ信号を修正することにより前記第1ステレオ信号を発生するステップとを有するようなオーディオ信号を送信及び受信する方法が提供される。
【0084】
本発明の他の態様によれば、上述した方法の何れかを実行するためのコンピュータプログラムが提供される。
【0085】
本発明の他の態様によれば、前述したエンコーダに従うエンコーダを有するようなオーディオ記録装置が提供される。
【0086】
本発明の他の態様によれば、前述したデコーダに従うデコーダを有するようなオーディオ再生装置が提供される。
【0087】
本発明の他の態様によれば、第1ステレオ信号と、Mチャンネルオーディオ信号(但し、M>2)のダウン混合されたステレオ信号に関連するパラメトリックデータとを有し、前記第1ステレオ信号が前記Mチャンネルオーディオ信号に対応する両耳信号であるようなオーディオ信号のためのオーディオデータストリームが提供される。
【0088】
本発明の他の態様によれば、上述したような信号が記憶された記憶媒体が提供される。
【0089】
本発明の、これら及び他の態様、フィーチャ並びに利点は、以下に説明する実施例から明らかとなり、斯かる実施例を参照して解説されるであろう。
【発明を実施するための最良の形態】
【0090】
以下、本発明の実施例を、図面を参照して例示としてのみ説明する。
【0091】
図3は、本発明の幾つかの実施例によるオーディオ信号の通信のための伝送システム300を示す。該伝送システム300は、ネットワーク305を開始して受信機303に結合された送信機301を示し、上記ネットワークはインターネットとすることができる。
【0092】
該特定の例において、送信機301は信号記録装置であり、受信機は信号再生装置303であるが、他の実施例では送信機及び受信機は他の用途において他の目的に使用することができると理解される。例えば、送信機301及び/又は受信機303は、トランスコーディング機能の一部とすることができ、例えば他の信号源又は宛先に対するインターフェース機能を提供することができる。
【0093】
信号記録機能がサポートされる該特定の例では、送信機301はデジタイザ307を有し、該デジタイザはアナログ信号を受信し、該アナログ信号はサンプリング及びアナログ/デジタル変換によりデジタルPCM信号に変換される。デジタイザ307は、複数の信号をサンプリングし、これにより多チャンネル信号を発生する。
【0094】
送信機301は図1のエンコーダ309に結合され、該エンコーダは上記多チャンネル信号を符号化アルゴリズムに従って符号化する。エンコーダ309はネットワーク送信機311に結合され、該ネットワーク送信機は上記符号化された信号を入力すると共にインターネット305にインターフェースする。上記ネットワーク送信機は、上記符号化された信号を、インターネット305を介して受信機303に送信することができる。
【0095】
受信機303はネットワークレシーバ313を有し、該ネットワークレシーバはインターネット305とインターフェースすると共に、送信機301から前記符号化された信号を受信するように構成されている。
【0096】
ネットワークレシーバ313はデコーダ315に結合されている。デコーダ315は、上記の符号化された信号を入力し、該信号を復号アルゴリズムに従って復号する。
【0097】
信号再生機能がサポートされる該特定の例では、受信機303は更に信号再生器317を有し、該再生器はデコーダ315から復号されたオーディオ信号を入力すると共に、該信号をユーザに提供する。即ち、信号再生器313は、復号されたオーディオ信号を出力する必要に応じて、デジタル/アナログ変換器、増幅器及びスピーカを有することができる。
【0098】
当該特定の例において、エンコーダ309は5チャンネルサラウンドサウンド信号を入力し、該信号をステレオ信号にダウン混合する。次いで、該ステレオ信号は両耳信号を発生するように後処理されるが、該両耳信号は、特には、3D両耳ダウンミックスの形態の両耳仮想空間信号である。空間符号化の後のダウンミックスに作用する3D後処理段を使用することにより、3D処理はデコーダ315において逆処理することができる。結果として、スピーカ再生用の多チャンネルデコーダは、修正されたステレオダウンミックスによる品質の大きな劣化は示すことがなく、同時に、従来のステレオデコーダも3D適合信号を生成するであろう。このように、エンコーダ309は、高品質多チャンネル復号を可能にすると同時に、1対のヘッドフォンに信号を供給する伝統的なデコーダからのような、伝統的ステレオ出力からの疑似空間体験を可能にするような信号を発生することができる。
【0099】
図4は、エンコーダ309を、より詳細に示す。
【0100】
エンコーダ309は、多チャンネルオーディオ信号を入力する多チャンネルレシーバを有している。説明される原理は、2より大きな如何なる数のチャンネルをも有する多チャンネル信号に適用されるが、該特定の例は、標準のサラウンドサウンド信号に対応する5チャンネル信号に焦点を絞る(明瞭化及び簡略化のために、サウンド信号にしばしば使用される低い周波数の信号は無視される。しかしながら、当業者にとっては、当該多チャンネル信号が追加の低周波数チャンネルを有することができることは明らかであろう。このチャンネルは、例えば、ダウン混合プロセッサによりセンタチャンネルと組み合わせることができる)。
【0101】
多チャンネルレシーバ401はダウンミックスプロセッサ403に結合され、該プロセッサは上記5チャンネルオーディオ信号を第1ステレオ信号にダウン混合するように構成されている。更に、該ダウンミックスプロセッサ403は、第1ステレオ信号に関連されると共に該第1ステレオ信号を当該多チャンネル信号の元のチャンネルに関係付けるオーディオキュー及び情報を含むようなパラメトリックデータ405を発生する。
【0102】
ダウンミックスプロセッサ403は、例えば、MPEGサラウンド多チャンネルエンコーダとして実施化することができる。このようなエンコーダの一例が、図5に図示されている。該例において、多チャンネル入力信号はLf(左フロント)、Ls(左サラウンドサウンド)、C(センタ)、RF(右フロント)及びRs(右サラウンド)チャンネルからなっている。Lf及びLsチャンネルは第1のTTO(2/1)ダウンミキサ501に供給され、該ダウンミキサは左(L)チャンネル用のモノダウンミックス、並びに2つの入力チャンネルLf及びLsを出力Lチャンネルに関係付けるパラメータを発生する。同様にして、Rf及びRsチャンネルは第2のTTOダウンミキサ503に供給され、該ダウンミキサは右(R)チャンネル用のモノダウンミックス、並びに2つの入力チャンネルRf及びRsを出力Rチャンネルに関係付けるパラメータを発生する。次いで、R、L及びCチャンネルはTTT(3/2)ダウンミキサ505に供給され、該ダウンミキサは、これら3つの信号を組み合わせてステレオダウンミックス及び付加的空間パラメータを発生する。
【0103】
TTTダウンミキサ505から得られる上記パラメータは、典型的には、各パラメータ帯域に関する1対の予測係数、又は上記3つの信号のエネルギ比を記述する1対のレベル差からなる。TTOダウンミキサ501、503のパラメータは、典型的には、各周波数帯域に関する入力信号間のレベル差及びコヒーレンス又は相互相関値からなる。
【0104】
このように、発生された第1ステレオ信号は、複数のダウン混合されたチャンネルを有する従来の標準のステレオ信号である。多チャンネルデコーダは、アップ混合すると共に関連パラメトリックデータを適用することにより元の多チャンネル信号を生成することができる。しかしながら、標準のステレオデコーダはステレオ信号を単に提供するのみであるので、空間情報を放出してしまい、ユーザ体験を低下させる。
【0105】
しかしながら、エンコーダ309においては、ダウン混合された信号は直接符号化及び送信されるのではない。むしろ、第1ステレオ信号は空間プロセッサ407に供給され、該プロセッサにはダウンミックスプロセッサ403から関連パラメータデータ405も供給される。該空間プロセッサ407は、更に、HRTFプロセッサ409にも結合されている。
【0106】
HRTFプロセッサ409は、3D両耳信号を発生するために空間プロセッサ407により使用される頭部伝達関数(HRTF)を発生する。即ち、HRTFは所与の音源位置から鼓膜までのインパルス応答による伝達関数を記述する。HRTFプロセッサ409は、特に、或る周波数副帯域(サブバンド)における所望のHRTF関数の値に対応するようなHRTFパラメータデータを発生する。HRTFプロセッサ409は、例えば、当該多チャンネル信号のチャンネルのうちの1つの音源位置に対してHRTFを計算することができる。この伝達関数は、適切な周波数サブバンドドメイン(QMF又はFFTサブバンドドメイン等の)に変換することができ、各サブバンドにおける対応するHRTFパラメータ値を決定することができる。
【0107】
本説明は頭部伝達関数の適用に焦点を絞っているが、説明される方法及び原理は、両耳室内インパルス応答(BRIR)関数等の他の(空間)両耳知覚伝達関数にも同様に等しく適用することができることが理解されよう。両耳知覚伝達関数の他の例は、1つの入力チャンネルから両耳ステレオ出力チャンネルの各々への信号レベルの相対量を記述する簡単な振幅パンニング規則(panning rule)である。
【0108】
幾つかの実施例では、上記HRTFパラメータは動的に計算することができる一方、他の実施例では、斯かるパラメータは予め決定され、適切なデータ記憶部に記憶することができる。例えば、HRTFパラメータはデータベースに方位(azimuth)、仰角(elevation)、距離及び周波数帯域の関数として記憶することができる。この場合、所与の周波数サブバンドに対する適切なHRTFパラメータは、所望の空間音源位置に対する値を選択することにより簡単に取り出すことができる。
【0109】
空間プロセッサ407は、関連パラメトリックデータ及び空間HRTFパラメータデータに応答して、第1ステレオ信号を修正し、第2ステレオ信号を発生する。第1ステレオ信号とは対照的に、第2ステレオ信号は、両耳仮想空間信号であり、特には、通常のステレオシステムを介して(例えば、1対のヘッドフォンにより)提供された場合に、異なる音源位置にある3以上の音源の存在をエミュレーションするような向上された空間体験を提供することができるような3D両耳信号である。
【0110】
第2ステレオ信号はエンコードプロセッサ411に供給され、該エンコードプロセッサは上記空間プロセッサ407に結合されると共に、第2ステレオ信号を送信に適したデータストリームに符号化する(例えば、適切な量子化レベルを適用する等)。該エンコードプロセッサ411は出力プロセッサ413に結合され、該出力プロセッサは少なくとも符号化された第2ステレオ信号データ及びダウンミックスプロセッサ403により発生された関連パラメータデータ405を組み合わせることにより出力ストリームを発生する。
【0111】
典型的には、HRTF合成は個々の音源の全てに関する波形(例えば、サラウンドサウンド信号の状況でのスピーカ信号)を必要とする。しかしながら、エンコーダ307においてはHRTF対が周波数サブバンドに対してパラメータ化されており、これにより、例えば仮想5.1スピーカ設定が、符号化(及びダウン混合)の間に抽出された空間パラメータの助けにより、前記多チャンネル入力信号のダウンミックスの低複雑度の後処理により発生されるのを可能にする。
【0112】
前記空間プロセッサは、特に、QMF又はFFTサブバンドドメイン等のサブバンドドメインで動作することができる。ダウン混合された第1ステレオ信号を復号して元の多チャンネル信号を発生し、これにHRTFフィルタ処理を用いたHRTF合成が後続されるようにする代わりに、空間プロセッサ407は、各サブバンドに対して、ダウン混合された第1ステレオ信号の多チャンネル信号への復号と、これに後続する該多チャンネル信号の3D両耳信号としての再符号化との組み合わせ効果に対応するようなパラメータ値を発生する。
【0113】
即ち、発明者は、3D両耳信号は上記第1信号のサブバンド信号値に2x2マトリクス乗算を適用することにより発生することができることを理解した。該第2信号の結果的信号値は、縦続接続されたチャンネル復号及びHRTF合成により発生されるであろう信号値に密接に対応する。このように、多チャンネル復号とHRTF合成との組み合わせ信号処理は、第2信号の所望のサブバンド値を発生するために第1信号のサブバンド信号値に簡単に適用することができるような4つのパラメータ値(マトリクス係数)へと組み合わせることができる。該マトリクスパラメータ値は、多チャンネル信号の復号とHRTF合成との組み合わせ処理を反映するので、斯かるパラメータ値は、ダウンミックスプロセッサ403からの関連パラメータデータ及びHRTFパラメータの両方に応答して決定される。
【0114】
エンコーダ309において、HRTF関数は個々の周波数帯域に対してパラメータ化される。HRTFパラメータ化の目的は、各HRTF対から音源配置に関する最も重要なキュー(合図)を捕捉することである。これらのパラメータは、
− 左耳インパルス応答に関する周波数サブバンド毎の(平均)レベル、
− 右耳インパルス応答に関する周波数サブバンド毎の(平均)レベル、
− 左耳インパルス応答と右耳インパルス応答との間の(平均)到達時間又は位相差、
− 左耳インパルス応答及び右耳インパルス応答の両方に関する周波数サブバンド毎の(平均)絶対位相又は時間(若しくは群遅延)(この場合、上記時間又は位相差は、殆どの場合、不要となる)、
− 対応するインパルス応答の間の周波数サブバンド毎のチャンネル相互間相関又はコヒーレンス、
を含むことができる。
【0115】
周波数サブバンド当たりの上記レベルパラメータは、仰角合成(スペクトルにおける特定のピーク及び谷による)及び方位に対するレベル差(各サブバンドに関するレベルパラメータの比により決定される)を容易にすることができる。
【0116】
前記絶対位相値又は位相差値は両耳の間の到達時間差を捕捉することができ、これらは音源方位に対する重要なキューでもある。前記コヒーレンス値は、(パラメータ)帯域毎に平均されるレベル及び/又は位相差に貢献し得ない両耳の間の微細な構造差をシミュレーションするために追加することができる。
【0117】
以下、空間プロセッサ407による処理の特定の例を説明する。該例において、音源の位置は、聴取者に対して図6に示されるように方位角α及び距離Dにより定められる。当該聴取者の左に配置された音源は、正の方位角に対応する。該音源位置から左耳までの伝達関数はHにより示され、該音源位置から右耳までの伝達関数はHにより示される。
【0118】
伝達関数H及びHは、方位角α、距離D及び仰角ε(図6には示されていない)に依存する。パラメトリック表現では、上記伝達関数は、HRTF周波数サブバンドb当たり3つのパラメータの組として記述することができる。このパラメータの組は、左伝達関数に関する周波数帯域当たりの平均レベルPl(α,ε,D,bh)、右伝達関数に関する周波数帯域当たりの平均レベルPr(α,ε,D,bh)及び周波数帯域当たりの平均位相差φ(α,ε,D,bh)を含む。この組の可能性のある拡張は、HRTF周波数帯域当たりの左及び右伝達関数のコヒーレンス尺度ρ(α,ε,D,bh)を含めることである。これらのパラメータはデータベースに方位、仰角、距離及び周波数帯域の関数として記憶することができ、及び/又は何らかの解析関数を用いて計算することができる。例えば、P及びPパラメータは方位及び仰角の関数として記憶することができる一方、距離の効果は、これらの値を距離自体で除算することにより得られる(信号レベルと距離との間の1/Dなる関係を仮定する)。以下において、Pl(Lf)なる表記は、Lfチャンネルの音源位置に対応する空間パラメータPlを示す。
【0119】
HRTFパラメータ化のための周波数サブバンド(b)の数及び各サブバンドの帯域幅は、空間プロセッサ407により使用される(QMF)フィルタバンクの周波数分解能(k)又はダウンミックスプロセッサ403及び関連パラメータバンド(b)の空間パラメータ分解能と必ずしも等しい必要はないことに注意すべきである。例えば、QMFハイブリッドフィルタバンクは71チャンネルを持つことができ、HRTFは28の周波数帯域でパラメータ化することができ、空間符号化は10個のパラメータバンドを用いて実行することができる。そのような場合、空間及びHRTFパラメータからQMFハイブリッドインデックスへのマッピングは、例えば、ルックアップテーブル又は補間若しくは平均化関数を用いて適用することができる。当該説明では、下記のパラメータインデックスが用いられる。
【表1】

【0120】
該特定の例において、空間プロセッサ407は前記第1ステレオ信号をQMFフィルタ処理により適切な周波数サブバンドに分割する。各サブバンドに関し、サブバンド値L及びRは、
【数3】

として決定され、ここでL及びRは第1ステレオ信号の対応するサブバンド値であり、マトリクス値hi,jはHRTFパラメータ及びダウンミックス関連パラメトリックデータから決定される。
【0121】
上記マトリクス係数は、ダウンミックスの特性を全ての個々のチャンネルが所望の音源位置に対応するHRTFにより処理されたかのように再生することを目的とするもので、これらは前記多チャンネル信号の復号と、これに対するHRTF合成の実行との組み合わせ効果を有するものである。
【0122】
即ち、図5及び該図の説明を参照すると、上記マトリクス値は、
【数4】

として決定することができ、ここで、mk,lはTTTダウンミキサ505により発生されたパラメトリックデータに応答して決定されるパラメータである。
【0123】
詳細に述べると、L、R及びC信号はステレオダウンミックス信号L及びRから、
【数5】

により発生され、ここで、mk,lは2つの予測係数c及びcに依存し、これらは送信される空間パラメータの一部である。
【数6】

【0124】
(X)は、第2ステレオ信号のステレオ出力チャンネルJに対するチャンネルX用のHRTFパラメータデータ及び適切なダウンミックスパラメータに応答して決定される。
【0125】
詳細には、H(X)パラメータは2つのTTOダウンミキサ501及び503により発生された左(L)及び右(R)ダウンミックス信号に関係するもので、2つのダウン混合されたチャンネルに対するHRTFパラメータデータに応答して決定することができる。即ち、2つの個々の左(Lf及びLs)又は右(Rf及びRs)チャンネルに関するHRTFパラメータの加重組み合わせを使用することができる。個々のパラメータは、個々の信号の相対エネルギにより重みを付けることができる。特定の例として、左(L)信号に対して下記の値を決定することができ、
【数7】

ここで、重みWは、
【数8】

により与えられ、CLDはデシベルで規定される左フロント(Lf)と左サラウンド(Ls)との間の"チャンネルレベル差"であり(これは空間パラメータビットストリームの一部である)、
【数9】

ここで、ρ2lfはLfチャンネルのパラメータサブバンドにおけるパワーであり、ρ2lsはLsチャンネルの対応するサブバンドにおけるパワーである。
【0126】
同様にして、右(R)信号に対して下記の値を決定することができ、
【数10】

センタ(C)信号に対して、
【数11】

を決定することができる。
【0127】
このように、上述した方法を使用すれば、低複雑度の空間処理が、ダウン混合された多チャンネル信号に基づいて両耳仮想空間信号が発生されるのを可能にすることができる。
【0128】
以上のように、上述した方法の利点は、前記関連ダウンミックスパラメータの周波数サブバンド、空間プロセッサ407による空間処理及びHRTFパラメータが同一である必要がないということである。例えば、或るサブバンドのパラメータと空間処理のサブバンドとの間のマッピングを実行することができる。例えば、空間処理サブバンドが2つのHRTFパラメータサブバンドに対応する周波数区間をカバーする場合、空間プロセッサ407は、全てのHRTFパラメータサブバンドに対して当該空間パラメータに対応するのと同一の空間パラメータを使用して、HRTFパラメータサブバンドに対し(個々の)処理を単に適用することができる。
【0129】
幾つかの実施例では、エンコーダ309は、デコーダが出力ストリームにおける音源の1以上の所望の位置データを識別するのを可能にするような音源位置データを含むように構成することができる。これは、デコーダがエンコーダ309により適用されたHRTFパラメータを決定するのを可能にし、これにより、デコーダが空間プロセッサ407の処理を逆処理するのを可能にする。付加的に又は代替的に、上記エンコーダは出力ストリームにHRTFパラメータの少なくとも幾つかを含むように構成することができる。
【0130】
このように、オプションとして、HRTFパラメータ及び/又はスピーカ位置データを出力ストリームに含めることができる。これは、例えば、スピーカ位置データの時間の関数としての動的更新(スピーカ位置の送信の場合)又は個性化されたHRTFデータの使用(HRTFパラメータの送信の場合)を可能にする。
【0131】
HRTFパラメータがビットストリームの一部として送信される場合、各周波数帯域及び各音源位置に対して少なくともP、P及びφパラメータを送信することができる。大きさのパラメータP、Pは、線形量子化器を用いて量子化することができるか、又は対数ドメインで量子化することができる。位相角φは線形に量子化することができる。この場合、量子化器のインデックスをビットストリームに含めることができる。
【0132】
更に、位相角φは、典型的には2.5kHzより高い周波数に対してはゼロであると仮定することができる。何故なら、両耳間位相情報は高い周波数に対しては知覚的に無関係であるからである。
【0133】
量子化の後、HRTFパラメータ量子化器インデックスに対して種々の無損失圧縮方式を適用することができる。例えば、恐らくは周波数帯域に跨る異なる符号化との組み合わせで、エントロピ符号化を適用することができる。他の例として、HRTFパラメータは、共通の又は平均のHRTFパラメータ組に対する差分として表すこともできる。これは、特に、大きさのパラメータに対して当てはまる。それ以外では、位相パラメータは、単に仰角及び方位を符号化することにより極めて正確に近似することができる。両耳に対する経路差がある場合、到達時間差を計算することにより(典型的に、到達時間差は特に周波数依存性であり、殆どの方位及び仰角に依存する)、対応する位相パラメータを導出することができる。更に、測定された差は、方位及び仰角値に基づいて予測値に対して差分的に符号化することができる。
【0134】
また、主成分の分解に、幾つかの最も重要なPCA重みの送信が後続するような損失性圧縮方式も適用することができる。
【0135】
図7は、本発明の実施例による多チャンネルデコーダの一例を示す。該デコーダは、特には、図3のデコーダ315であり得る。
【0136】
該デコーダ315は、エンコーダ309からの出力ストリームを入力する入力レシーバ701を有している。該入力レシーバ701は、入力されたデータストリームをデマルチプレクスし、関連するデータを適切な機能エレメントに供給する。
【0137】
入力レシーバ701はデコードプロセッサ703に結合され、該プロセッサには前記第2ステレオ信号の符号化データが供給される。デコードプロセッサ703は、このデータを復号して、前記空間プロセッサ407により作成された両耳仮想空間信号を発生する。
【0138】
デコードプロセッサ703は逆処理プロセッサ705に結合され、該プロセッサは、空間プロセッサ407により実行された処理を逆処理するように構成されている。このようにして、逆処理プロセッサ705は、ダウンミックスプロセッサ403により作成されたダウン混合されたステレオ信号を発生する。
【0139】
詳細には、上記逆処理プロセッサ705は、入力された両耳仮想空間信号のサブバンド値にマトリクス乗算を適用することにより、ダウン混合されたステレオ信号を発生する。該マトリクス乗算は、空間プロセッサ407により使用されたものの逆行列に対応するマトリクスによるもので、これにより、この処理を逆処理する、
【数12】

【0140】
このマトリクス乗算は、
【数13】

と書くこともできる。
【0141】
上記マトリクス係数qk,lは、ダウンミックス信号に関連する(及びエンコーダ309からのデータストリームで受信された)パラメトリックデータ及びHRTFパラメータデータから決定される。即ち、前記エンコーダ309に関して説明した方法を、マトリクス係数hxyを発生するためにデコーダ409により使用することもできる。この場合、マトリクス係数qxyは、標準の行列反転により見つけることができる。
【0142】
上記逆処理プロセッサ705はパラメータプロセッサ707に結合され、該パラメータプロセッサは使用されるべきHRTFパラメータを決定する。幾つかの実施例では、該HRTFパラメータは受信されたデータストリームに含まれており、該データストリームから簡単に抽出することができる。他の実施例では、例えばデータベースに異なる音源位置に関して異なるHRTFパラメータを記憶することができ、パラメータプロセッサ707がHRTFパラメータを所望の信号源位置に対応する値を取り出すことにより決定することができる。幾つかの実施例では、所望の信号源位置(又は複数の位置)を、エンコーダ309からのデータストリームに含めることができる。パラメータプロセッサ707は、この情報を抽出し、該情報を使用してHRTFパラメータを決定することができる。例えば、該プロセッサは、音源位置(又は複数の位置)を示すために記憶されたHRTFパラメータを取り出すことができる。
【0143】
幾つかの実施例では、前記逆処理プロセッサにより発生されたステレオ信号を直接出力することができる。しかしながら、他の実施例では、該ステレオ信号は多チャンネルデコーダ709に供給され、該デコーダは、ダウン混合されたステレオ信号及び入力されたパラメトリックデータからMチャンネル信号を発生することができる。
【0144】
当該例において、3D両耳合成の逆処理は、QMF又はフーリエ周波数サブバンドにおけるように、サブバンドドメインにおいて実行される。このように、デコードプロセッサ703は、逆処理プロセッサ705に供給されるサブバンドサンプルを発生するためにQMFフィルタバンク又は高速フーリエ変換(FFT)を有することができる。同様にして、逆処理プロセッサ705又は多チャンネルデコーダ709は、当該信号を時間ドメインに戻すように変換するために逆FFT又はQMFフィルタバンクを有することができる。
【0145】
エンコーダ側における3D両耳信号の発生は、従来のステレオデコーダによりヘッドセットのユーザに空間聴取体験が提供されるのを可能にする。このように、上述した方法は、旧来のステレオ装置が3D両耳信号を再生することができるという利点を有している。そのようであるので、3D両耳信号を再生するために、追加の後処理を適用する必要がなく、結果的に低複雑度の解決策となる。
【0146】
しかしながら、このような方法では、典型的には一般化されたHRTFが使用され、斯かるHRTFは、幾つかのケースにおいては、特定のユーザに対して最適化された専用のHRTFデータを使用するデコーダにおける3D両耳信号の発生と比較して、準最適な空間発生にしかならない。
【0147】
即ち、距離の限られた知覚及び可能性のある音源配置エラーが、時には、個性化されていないHRTF(ダミー頭部又は他人に対して測定されたインパルス応答等)の使用から生じ得る。基本的に、HRTFは、人体の解剖学的幾何学構造の差により、人毎に相違する。従って、正しい音源配置の点での最適な結果は、個性化されたHRTFデータにより最良に達成され得るものである。
【0148】
幾つかの実施例においては、デコーダ315は、先ずエンコーダ309の空間処理を逆処理し、次にローカルなHRTFデータを用いて、特には特定のユーザに対して最適化された個人的HRTFデータを用いて3D両耳信号を発生するような機能を更に有することができる。このように、この実施例においては、デコーダ315は、ダウン混合されたステレオ信号を前記関連パラメトリックデータ及びエンコーダ309において使用された(HRTF)データとは異なるHRTFパラメータデータを使用して修正することにより1対の両耳出力チャンネルを発生する。従って、この方法は、エンコーダ側の3D合成、デコーダ側の逆処理、及びこれらに後続する他のステージのデコーダ側3D合成の組み合わせを提供する。
【0149】
斯様な方法の利点は、旧来のステレオ装置が基本的3D品質を提供するような出力としての3D両耳信号を有する一方、拡張されたデコーダは個性化されたHRTFを使用して改善された3D品質を可能にするようなオプションを有することになることである。この様に、旧来の互換性のある3D合成及び高品質の専用3D合成の両方が、同一のオーディオシステムで可能となる。
【0150】
このようなシステムの一例が図8に示されており、該図は個別化された3D両耳信号を提供するために、図7のデコーダに追加の空間プロセッサ801をどの様に追加することができるかを示している。幾つかの実施例では、空間プロセッサ801は、オーディオチャンネルの各々に対し個人的HRTFを用いて単に直截な3D両耳合成を行うことができる。このように、当該デコーダは元の多チャンネル信号を生成し、これを個別化されたHRTFフィルタ処理を用いて3D両耳信号に変換することができる。
【0151】
他の実施例では、エンコーダ合成の逆処理及びデコーダ合成を組み合わせて、低複雑度の処理を提供することができる。即ち、デコーダ合成に使用される個別化されたHRTFを、パラメータ化し、エンコーダ3D合成に使用されたパラメータ(の逆)と組み合わせることができる。
【0152】
更に詳細には、前述したように、エンコーダ合成は、ダウン混合された信号のステレオサブバンドサンプルを2x2マトリクスにより乗算する処理、
【数14】

を含み、ここで、L、Rは上記ダウン混合されたステレオ信号の対応するサブバンド値であり、マトリクス値hj,kは前述したようにHRTFパラメータ及びダウンミックス関連パラメトリックデータから決定されるパラメータである。
【0153】
逆処理プロセッサ705により実行される反転は、
【数15】

により与えられ、ここで、L、Rはデコーダのダウン混合されたステレオ信号の対応するサブバンド値である。
【0154】
デコーダ側の適切な逆処理を保証するためには、3D両耳信号を発生するためにエンコーダにおいて使用されたHRTFパラメータ及び該3D両耳信号を逆処理するために使用されるHRTFパラメータは同一とするか又は十分に類似したものとする。1つのビットストリームは、通常、幾つかのデコーダに作用するので、3D両耳ダウンミックスの個性化はエンコーダ合成により得るのは困難である。
【0155】
しかしながら、3D両耳合成処理は可逆的であるので、逆処理プロセッサ705はダウン混合されたステレオ信号を再生し、次いで該ステレオ信号が、個性化されたHRTFに基づいて3D両耳信号を発生するために使用される。
【0156】
即ち、エンコーダ309における処理と同様に、デコーダ315における3D両耳合成は、3D両耳信号LB、RBを発生するためのダウンミックス信号L,Rに対する簡単なサブバンド毎の2x2マトリクス演算により下記のように発生することができ、
【数16】

ここで、パラメータpx,yは、hx,yが汎用HRTFに基づきエンコーダ309により発生されたのと同様の方法で、個性化されたHRTFに基づいて決定される。更に詳細には、エンコーダ309においては、パラメータhx,yは多チャンネルパラメトリックデータ及び汎用HRTFから決定される。上記多チャンネルパラメトリックデータはデコーダ315に送信されるので、該デコーダにより上記と同じ方法を個人的HRTFに基づいてpx,yを計算するために使用することができる。
【0157】
これを、逆処理プロセッサ705の処理と組み合わせると、
【数17】

となる。
【0158】
この式において、マトリクスエントリhx,yはエンコーダで使用された汎用の個性化されていないHRTFを用いて得られる一方、マトリクスエントリpx,yは別の好ましくは個性化されたHRTF組を用いて求められる。従って、非個性化HRTFデータを用いて発生された3D両耳入力信号L,Rは、別の個性化されたHRTFデータを用いて他の3D両耳出力信号LB',RB'に変換される。
【0159】
更に、示されたように、エンコーダ合成の逆処理及びデコーダ合成の組み合わせ方法は、簡単な2x2マトリクス演算により達成することができる。従って、この組み合わせ処理の計算的複雑さは、実質的に、簡単な3D両耳逆処理に関するものと同じである。
【0160】
図9は、上述した原理に従って動作するデコーダ315の一例を示す。詳細には、エンコーダ309からの3D両耳ステレオダウンミックスのステレオサブバンドサンプルは逆処理プロセッサ705に供給され、該プロセッサは2x2マトリクス演算により元のステレオダウンミックスサンプルを再生する。
【数18】

【0161】
結果としてのサブバンドサンプルは空間合成ユニット901に供給され、該ユニットは、これらサンプルを2x2マトリクスにより乗算することにより個性化された3D両耳信号を発生する。
【数19】

【0162】
上記マトリクス係数は、エンコーダ309から受信された多チャンネル拡張データと個性化されたHRTFとに基づいてパラメータを発生するパラメータ変換ユニット903により発生される。
【0163】
合成サブバンドサンプルL,Rはサブバンド/時間ドメイン変換器905に供給され、該変換器はユーザに提供することが可能な3D時間ドメイン信号を発生する。
【0164】
図9は、非個性化HRTFに基づく3D逆処理のステップ及び個性化されたHRTFに基づく3D合成のステップを異なる機能ユニットによる順次処理として示しているが、多くの実施例においては、これら処理は単一のマトリクスの適用により同時に適用することができることが分かるであろう。即ち、2x2マトリクス、
【数20】

が計算され、出力サンプルが、
【数21】

と計算される。
【0165】
上述したシステムは下記のものを含む多数の利点を提供することが分かるであろう。
− 多チャンネルデコーダにおいて、空間ステレオ処理としての多チャンネル再生を(知覚的に)僅かな品質劣化又は品質劣化なしで逆処理することができる。
− (3D)空間両耳ステレオ体験を従来のステレオデコーダによっても提供することができる。
− 既存の空間配置方法と比較して複雑さが低減される。複雑さは次のような多数の態様で低減される。
HRTFの効率的な記憶。HRTFインパルス応答を記憶する代わりに、HRTFを特徴付けるべく限られた数のパラメータが使用される。
効率的な3D処理。HRTFは限られた周波数分解能においてパラメータとして特徴付けられ、HRTFパラメータの適用は(高度にダウンサンプリングされた)パラメータドメインで実行されるので、空間合成段は完全なHRTF畳み込みに基づく従来の合成方法よりも一層効率的である。
必要とされる処理は例えばQMFドメインで実行することができるので、結果的に、FFTに基づく方法よりも計算的負荷及びメモリの負荷が小さくなる。
− 既存のサラウンドサウンド構築ブロック(標準のMPEGサラウンドサウンド符号化/復号機能等の)の効率的な再利用が、最小の複雑さの実施化を可能にする。
− エンコーダにより送信された(パラメータ化された)HRTFデータの修正による個人化の可能性。
− 送信される位置情報により、音源位置がオンザフライで変化し得る。
【0166】
図10は、本発明の実施例によるオーディオ符号化の方法を示す。
【0167】
該方法はステップ1001で開始し、該ステップにおいてMチャンネルオーディオ信号が入力される(M>2)。
【0168】
ステップ1001にはステップ1003が後続し、該ステップにおいて上記Mチャンネルオーディオ信号は第1ステレオ信号及び関連するパラメトリックデータにダウン混合される。
【0169】
ステップ1003にはステップ1005が後続し、該ステップにおいて上記第1ステレオ信号は、上記関連パラメトリックデータ及び空間頭部伝達関数(HRTF)パラメータデータに応答して、第2ステレオ信号を発生すべく修正される。該第2ステレオ信号は両耳仮想空間信号である。
【0170】
ステップ1005にはステップ1007が後続し、該ステップにおいては、上記第2ステレオ信号が符号化されて、符号化データを発生する。
【0171】
ステップ1007にはステップ1009が後続し、該ステップにおいて上記符号化データ及び前記関連パラメトリックデータを有する出力データストリームが発生される。
【0172】
図11は、本発明の実施例によるオーディオ復号の方法を示す。
【0173】
該方法はステップ1101で開始し、該ステップにおいて、デコーダは、第1ステレオ信号及びMチャンネルオーディオ信号(ここで、M>2である)のダウン混合されたステレオ信号に関連するパラメトリックデータを有するような入力データを受信する。上記第1ステレオ信号は両耳仮想空間信号である。
【0174】
ステップ1101にはステップ1103が後続し、該ステップにおいて上記第1ステレオ信号は、上記パラメトリックデータ及び該第1ステレオ信号に関連する空間頭部伝達関数(HRTF)パラメータデータに応答して、前記ダウン混合されたステレオ信号を発生すべく修正される。
【0175】
ステップ1103にはステップ1105が後続し、該ステップにおいては、上記ダウン混合されたステレオ信号及びパラメトリックデータに応答して、前記Mチャンネルオーディオ信号が発生される。
【0176】
上記記載は、明瞭化のために、本発明の実施例を異なる機能ユニット及びプロセッサを参照して説明したことが分かるであろう。しかしながら、異なる機能ユニット又はプロセッサの間の如何なる適切な機能の分散も、本発明から逸脱することなしに利用することができることは明であろう。例えば、別個のプロセッサ又はコントローラにより実行されるように説明された機能は、同一のプロセッサ又はコントローラにより実行することができる。従って、特定の機能ユニットに対する言及は、厳密な論理的又は物理的構造又は編成を示すというより、説明された機能を提供する適切な手段を示すものとだけ理解されるべきである。
【0177】
本発明は、ハードウェア、ソフトウェア、ファームウエア又はこれらの何れかの組み合わせを含む如何なる好適な形態でも実施化することができる。本発明は、オプションとして、少なくとも部分的に、1以上のデータプロセッサ及び/又はデジタル信号プロセッサ上で動作するコンピュータソフトウェアとして実施化することができる。本発明の実施例のエレメント及びコンポーネントは物理的に、機能的に及び論理的に如何なる好適な態様でも実施化することができる。機能は、単一のユニットにおいて、複数のユニットにおいて、又は他の機能ユニットの一部として実施化することができる。そのようであるので、本発明は、単一のユニット内で実施化することができるか、又は異なるユニット及びプロセッサの間で物理的に及び機能的に分散させることもできる。
【0178】
以上、本発明を幾つかの実施例に関連して説明したが、本発明をここで述べた特定の形態に限定しようとするものではない。むしろ、本発明の範囲は添付請求項によってのみ限定されるものである。更に、或るフィーチャは特定の実施例に関連して説明されているように見えるかもしれないが、当業者であれば、説明された実施例の種々のフィーチャは本発明により組み合わせることができると理解するであろう。請求項において、"有する"なる用語は、他のエレメント又はステップの存在を排除するものではない。
【0179】
更に、個別に掲載されていても、複数の手段、エレメント又は方法のステップは、例えば単一のユニット又はプロセッサにより実施化することができる。更に、個々のフィーチャが異なる請求項に含まれていても、これらは有利に組み合わせることができ、異なる請求項に含めることは、フィーチャの組み合わせが可能及び/又は有利ではないことを意味するものではない。また、1つのカテゴリの請求項にフィーチャを含めることは、このカテゴリへの限定を意味するものではなく、該フィーチャが、適宜、他のカテゴリの請求項へも等しく適用可能であることを示すものである。更に、請求項におけるフィーチャの順序は、斯かるフィーチャが実行されるべき如何なる特定の順序を意味するものではなく、特に、方法の請求項における個々のステップの順序は、この順序で斯かるステップが実行されねばならないことを意味するものではない。むしろ、斯かるステップは如何なる好適な順序で実行することもできる。更に、単一的参照は複数を排除するものではない。かくして、単一表現、"第1の"及び"第2の"等は複数を排除するものではない。請求項における括弧内の符号は、単に明瞭化のための例として付されたもので、請求項の範囲を如何なる形でも限定するものとして見なしてはならない。
【図面の簡単な説明】
【0180】
【図1】図1は、従来技術による両耳合成の説明図である。
【図2】図2は、多チャンネルデコーダ及び両耳合成の縦続接続の説明図である。
【図3】図3は、本発明の実施例によるオーディオ信号の通信のための伝送システムを示す。
【図4】図4は、本発明の実施例によるエンコーダを示す。
【図5】図5は、サラウンドサウンド・パラメトリック・ダウンミックス・エンコーダを示す。
【図6】図6は、ユーザに対する音源位置の一例を示す。
【図7】図7は、本発明の実施例による多チャンネルデコーダを示す。
【図8】図8は、本発明の実施例によるデコーダを示す。
【図9】図9は、本発明の実施例によるデコーダを示す。
【図10】図10は、本発明の実施例によるオーディオ符号化の方法を示す。
【図11】図11は、本発明の実施例によるオーディオ復号の方法を示す。

【特許請求の範囲】
【請求項1】
Mチャンネルオーディオ信号を入力する手段と(但し、M>2)、
前記Mチャンネルオーディオ信号を第1ステレオ信号及び関連するパラメトリックデータにダウン混合するダウン混合手段と、
前記関連するパラメトリックデータ及び両耳知覚伝達関数のための空間パラメータデータに応答して前記第1ステレオ信号を修正し、両耳信号である第2ステレオ信号を発生する発生手段と、
前記第2ステレオ信号を符号化して符号化データを発生する手段と、
前記符号化データ及び前記関連するパラメトリックデータを有する出力データストリームを発生する出力手段と、
を有するオーディオエンコーダ。
【請求項2】
前記発生手段が、前記関連するパラメトリックデータ、前記空間パラメータデータ及び前記第1ステレオ信号に関するサブバンドデータ値に応答して、前記第2ステレオ信号に関するサブバンドデータ値を計算することにより前記第2ステレオ信号を発生するよう構成されている請求項1に記載のエンコーダ。
【請求項3】
前記発生手段が、前記第2ステレオ信号の第1サブバンドに関するサブバンド値を、前記第1ステレオ信号に関する対応するステレオサブバンド値の第1サブバンドマトリクスによる乗算に応答して発生するよう構成され、該発生手段が、前記第1サブバンドに関する空間パラメータデータ及び関連するパラメトリックデータに応答して前記第1サブバンドマトリクスのデータ値を決定するパラメータ手段を更に有しているような請求項2に記載のエンコーダ。
【請求項4】
前記発生手段が、前記第1サブバンド区間とは異なる周波数区間を有するサブバンドに関連する空間パラメータデータ、前記関連するパラメトリックデータ及び前記第1ステレオ信号のうちの少なくとも1つのデータ値を、前記第1サブバンドに関する対応するデータ値に変換する手段を更に有しているような請求項3に記載のエンコーダ。
【請求項5】
前記発生手段が、前記第2ステレオ信号の前記第1サブバンドに関するステレオサブバンド値LB,RBを、実質的に、
【数1】

として決定するように構成され、ここで、L,Rは前記第1ステレオ信号の対応するサブバンド値であり、前記パラメータ手段が、前記乗算マトリクスのデータ値を、実質的に、
【数2】

として決定するように構成され、ここで、mk,lは前記ダウン混合手段によるチャンネルL、R及びCの前記第1ステレオ信号へのダウンミックスに対する関連するパラメトリックデータに応答して決定されるパラメータであり、HJ(X)は前記第2ステレオ信号の出力チャンネルJに対するチャンネルXに関する空間パラメータデータに応答して決定されるような請求項3に記載のエンコーダ。
【請求項6】
チャンネルL及びRの少なくとも一方が、少なくとも2つのダウン混合されたチャンネルのダウンミックスに対応し、前記パラメータ手段がHJ(X)を前記少なくとも2つのダウン混合されたチャンネルに関する空間パラメータデータの加重組み合わせに応答して決定するように構成されている請求項5に記載のエンコーダ。
【請求項7】
前記パラメータ手段が、前記少なくとも2つのダウン混合されたチャンネルに関する前記空間パラメータデータの重み付けを前記少なくとも2つのダウン混合されたチャンネルに関する相対エネルギ尺度に応答して決定するように構成された請求項6に記載のエンコーダ。
【請求項8】
前記空間パラメータデータが、
− サブバンド当たりの平均レベルパラメータ、
− 平均到達時間パラメータ、
− 少なくとも1つのステレオチャンネルの位相、
− タイミングパラメータ、
− 群遅延パラメータ、
− ステレオチャンネル間の位相、及び
− チャンネル相互相関パラメータ、
からなるグループから選択された少なくとも1つのパラメータを含むような請求項1に記載のエンコーダ。
【請求項9】
前記出力手段が、前記出力データストリームに音源位置データを含めるように構成された請求項1に記載のエンコーダ。
【請求項10】
前記出力手段が、前記出力データストリームに前記空間パラメータデータの少なくとも幾らかを含めるように構成された請求項1に記載のエンコーダ。
【請求項11】
前記空間パラメータデータを所望のサウンド信号位置に応答して決定する手段を更に有するような請求項1に記載のエンコーダ。
【請求項12】
Mチャンネルオーディオ信号(但し、M>2)に対応した両耳信号である第1ステレオ信号と該Mチャンネルオーディオ信号のダウン混合されたステレオ信号に関連するパラメトリックデータとを有する入力データを入力する手段と、
前記パラメトリックデータと前記第1ステレオ信号に関連する両耳知覚伝達関数のための第1空間パラメータデータとに応答して、前記第1ステレオ信号を修正することにより前記ダウン混合されたステレオ信号を発生する発生手段と、
を有するオーディオデコーダ。
【請求項13】
前記ダウン混合されたステレオ信号及び前記パラメトリックデータに応答して、前記Mチャンネルオーディオ信号を発生する手段を更に有するような請求項12に記載のデコーダ。
【請求項14】
前記発生手段が、前記第1ステレオ信号に関するサブバンドデータ値、前記第1空間パラメータデータ及び前記関連するパラメトリックデータに応答して、前記ダウン混合されたステレオ信号に関するサブバンドデータ値を計算することにより前記ダウン混合されたステレオ信号を発生するよう構成された請求項12に記載のデコーダ。
【請求項15】
前記発生手段が、前記ダウン混合されたステレオ信号の第1サブバンドに関するサブバンド値を、前記第1ステレオ信号に関する対応するステレオサブバンド値の第1サブバンドマトリクスによる乗算に応答して発生するよう構成され、該発生手段が、前記第1サブバンドに関する両耳知覚伝達関数及びパラメトリックデータに応答して前記第1サブバンドマトリクスのデータ値を決定するパラメータ手段を更に有しているような請求項14に記載のデコーダ。
【請求項16】
前記入力データが前記第1空間パラメータデータの少なくとも幾らかを有するような請求項12に記載のデコーダ。
【請求項17】
前記入力データが音源位置データを有し、当該デコーダが該音源位置データに応答して前記第1空間パラメータデータを決定する手段を有しているような請求項12に記載のデコーダ。
【請求項18】
前記関連するパラメトリックデータと、前記第1空間パラメータデータとは異なる第2両耳感知伝達関数に関する第2空間パラメータデータとに応答して、前記第1ステレオ信号を修正することにより1対の両耳出力チャンネルを生成する空間デコーダユニット、
を更に有するような請求項12に記載のデコーダ。
【請求項19】
前記空間デコーダユニットが、
− 前記パラメトリックデータを、前記第2空間パラメータデータを用いて両耳合成パラメータに変換するパラメータ変換ユニットと、
− 前記1対の両耳出力チャンネルを、前記両耳合成パラメータ及び前記第1ステレオ信号を用いて合成する空間合成ユニットと、
を有するような請求項18に記載のデコーダ。
【請求項20】
前記両耳合成パラメータが、前記ダウン混合されたステレオ信号のステレオサンプルを前記1対の両耳出力チャンネルのステレオサンプルに関係付ける2x2マトリクスのマトリクス係数を有しているような請求項19に記載のデコーダ。
【請求項21】
前記両耳合成パラメータが、前記第1ステレオ信号のステレオサブバンドサンプルを前記1対の両耳出力チャンネルのステレオサンプルに関係付ける2x2マトリクスのマトリクス係数を有しているような請求項19に記載のデコーダ。
【請求項22】
Mチャンネルオーディオ信号を入力するステップと(但し、M>2)、
前記Mチャンネルオーディオ信号を第1ステレオ信号及び関連するパラメトリックデータにダウン混合するステップと、
前記関連するパラメトリックデータ及び両耳知覚伝達関数のための空間パラメータデータに応答して前記第1ステレオ信号を修正し、両耳信号である第2ステレオ信号を発生するステップと、
前記第2ステレオ信号を符号化して符号化データを発生するステップと、
前記符号化データ及び前記関連するパラメトリックデータを有する出力データストリームを発生するステップと、
を有するオーディオ符号化方法。
【請求項23】
Mチャンネルオーディオ信号(但し、M>2)に対応した両耳信号である第1ステレオ信号と該Mチャンネルオーディオ信号のダウン混合されたステレオ信号に関連するパラメトリックデータとを有するような入力データを入力するステップと、
前記パラメトリックデータと前記第1ステレオ信号に関連する両耳知覚伝達関数のための空間パラメータデータとに応答して、前記第1ステレオ信号を修正することにより前記ダウン混合されたステレオ信号を発生するステップと、
を有するオーディオ復号方法。
【請求項24】
Mチャンネルオーディオ信号(但し、M>2)に対応した両耳信号である第1ステレオ信号と該Mチャンネルオーディオ信号のダウン混合されたステレオ信号に関連するパラメトリックデータとを有する入力データを入力する手段と、
前記パラメトリックデータと前記第1ステレオ信号に関連する両耳知覚伝達関数のための空間パラメータデータとに応答して、前記第1ステレオ信号を修正することにより前記ダウン混合されたステレオ信号を発生する発生手段と、
を有するオーディオ信号を受信する受信機。
【請求項25】
Mチャンネルオーディオ信号を入力する手段と(但し、M>2)、
前記Mチャンネルオーディオ信号を第1ステレオ信号及び関連するパラメトリックデータにダウン混合するダウン混合手段と、
前記関連するパラメトリックデータ及び両耳知覚伝達関数のための空間パラメータデータに応答して前記第1ステレオ信号を修正し、両耳信号である第2ステレオ信号を発生する発生手段と、
前記第2ステレオ信号を符号化して符号化データを発生する手段と、
前記符号化データ及び前記関連するパラメトリックデータを有するような出力データストリームを発生する出力手段と、
前記出力データストリームを送信する手段と、
を有する出力データストリームを送信する送信機。
【請求項26】
Mチャンネルオーディオ信号を入力する手段と(但し、M>2)、
前記Mチャンネルオーディオ信号を第1ステレオ信号及び関連するパラメトリックデータにダウン混合するダウン混合手段と、
前記関連するパラメトリックデータ及び両耳知覚伝達関数のための空間パラメータデータに応答して前記第1ステレオ信号を修正し、両耳信号である第2ステレオ信号を発生する発生手段と、
前記第2ステレオ信号を符号化して符号化データを発生する手段と、
前記符号化データ及び前記関連するパラメトリックデータを有するようなオーディオ出力データストリームを発生する出力手段と、
前記オーディオ出力データストリームを送信する手段と、
を有する送信機と、
前記オーディオ出力データストリームを受信する手段と、
前記パラメトリックデータと前記空間パラメータデータとに応答して、前記第2ステレオ信号を修正することにより前記第1ステレオ信号を発生する手段と、
を有する受信機と、
を有するオーディオ信号を伝送する伝送システム。
【請求項27】
Mチャンネルオーディオ信号(但し、M>2)に対応した両耳信号である第1ステレオ信号と該Mチャンネルオーディオ信号のダウン混合されたステレオ信号に関連するパラメトリックデータとを有する入力データを受信するステップと、
前記パラメトリックデータと前記第1ステレオ信号に関連する両耳知覚伝達関数のための空間パラメータデータとに応答して、前記第1ステレオ信号を修正することにより前記ダウン混合されたステレオ信号を発生するステップと、
を有するオーディオ信号を受信する方法。
【請求項28】
Mチャンネルオーディオ信号を入力するステップと(但し、M>2)、
前記Mチャンネルオーディオ信号を第1ステレオ信号及び関連するパラメトリックデータにダウン混合するステップと、
前記関連するパラメトリックデータ及び両耳知覚伝達関数のための空間パラメータデータに応答して前記第1ステレオ信号を修正し、両耳信号である第2ステレオ信号を発生するステップと、
前記第2ステレオ信号を符号化して符号化データを発生するステップと、
前記符号化データ及び前記関連するパラメトリックデータを有するようなオーディオ出力データストリームを発生するステップと、
前記オーディオ出力データストリームを送信するステップと、
を有するオーディオ出力データストリームを送信する方法。
【請求項29】
Mチャンネルオーディオ信号を入力するステップと(但し、M>2)、
前記Mチャンネルオーディオ信号を第1ステレオ信号及び関連するパラメトリックデータにダウン混合するステップと、
前記関連するパラメトリックデータ及び両耳知覚伝達関数のための空間パラメータデータに応答して前記第1ステレオ信号を修正し、両耳信号である第2ステレオ信号を発生するステップと、
前記第2ステレオ信号を符号化して符号化データを発生するステップと、
前記符号化データ及び前記関連するパラメトリックデータを有するようなオーディオ出力データストリームを発生するステップと、
前記オーディオ出力データストリームを送信するステップと、
前記オーディオ出力データストリームを受信するステップと、
前記パラメトリックデータと前記空間パラメータデータとに応答して、前記第2ステレオ信号を修正することにより前記第1ステレオ信号を発生するステップと、
を有するオーディオ信号を送信及び受信する方法。
【請求項30】
請求項22、23、27、28及び29の何れか一項に記載の方法を実行するためのコンピュータプログラム。
【請求項31】
請求項1に記載のエンコーダを有するオーディオ記録装置。
【請求項32】
請求項12に記載のデコーダを有するオーディオ再生装置。
【請求項33】
第1ステレオ信号と、
Mチャンネルオーディオ信号(但し、M>2)のダウン混合されたステレオ信号に関連するパラメトリックデータと、
を有し、前記第1ステレオ信号が前記Mチャンネルオーディオ信号に対応する両耳信号であるようなオーディオ信号のためのオーディオデータストリーム。
【請求項34】
請求項33に記載のオーディオデータストリームを記憶した記憶媒体。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate


【公表番号】特表2009−527970(P2009−527970A)
【公表日】平成21年7月30日(2009.7.30)
【国際特許分類】
【出願番号】特願2008−555915(P2008−555915)
【出願日】平成19年2月13日(2007.2.13)
【国際出願番号】PCT/IB2007/050473
【国際公開番号】WO2007/096808
【国際公開日】平成19年8月30日(2007.8.30)
【出願人】(590000248)コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ (12,071)