説明

多重チャンネルオーディオデータの再構成

本発明は、少なくとも限定された数のチャンネル上のデータ及び空間化データに基づいて多重チャンネルオーディオデータを再構成する方法に関係する。受信された空間化データは妥当性について検査される。もしその検査が肯定であるならば、複数のモデルのそれぞれのモデルごとに、空間化値が、このモデルに従って予測される。このように予測された空間化値に基づいて、そして受信された空間化データに基づいて、もしその後に不完全な空間化データが受信されたならば、選択されたモデルに従って空間化値を予測すると共に、多重チャンネルオーディオデータの再構成のために前記予測された空間化値を使用することができるように、予測モデルが選択される。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、多重チャンネルオーディオデータの再構成のための、不完全な空間化データ(spatialization data)の隠蔽に関連する。多重チャンネルオーディオデータは、概して、少なくとも空間化データに基づいて、そして、限定された数のチャンネル上のオーディオデータ、例えばモノラルチャンネルデータに基づいて再構成される。
【背景技術】
【0002】
多重チャンネルオーディオデータは、概して、いくらかのそれぞれのオーディオトラックを対象としている。いくらかのそれぞれの音源は、サラウンド音響の錯覚を聞き手に与えるのを助けるために使用され得る。
【0003】
多重チャンネルオーディオデータは、例えば、2チャンネルのステレオのデータ、または、特にホームシネマアプリケーションのための6チャンネルの5.1データを含み得る。本発明は、同様に、話し手に対応するデータが、この話し手の音声が空間の特定の位置から発生している錯覚を聞き手に与えるように空間化処理を受ける、空間化された電話会議(audio conference)の分野におけるアプリケーションを見い出すことができる。
【0004】
空間化データは、より少ない数のチャンネル上のデータ、例えばモノラルチャンネルデータに基づいて多重チャンネルデータを獲得するために使用される。これらの空間化データは、例えば、経路間レベル(inter-pathway level)またはILD(“チャンネル間レベル差:Interchannel Level Differences”)、経路間相関(inter-pathway correlations)またはICC(“チャンネル間相互相関:Interchannel Cross Correlations”)、経路間遅延(delays between pathways)またはITD(“チャンネル間時間差:Interchannel Time Differences”)、経路間位相差(phase differences between pathways)またはIPD(“チャンネル間位相差:Interchannel Phase Differences”)等の差異を含むことができる。
【0005】
少なくともモノラルチャンネルデータ及び空間化データを含む受信されたオーディオデータが不完全である場合、すなわちいくらかのデータが欠落しているか、または誤っている場合が起こり得る。
【0006】
この不完全な伝送の検出は、CRC(周期的冗長検査:Cyclic Redundancy Check)タイプの符号を用いて実行され得る。
【0007】
不完全な値を予測値と交換することによって、これらの不具合を緩和するということが知られている。これらの予測値は、既知の予測モデルに従って決定され得る。
【0008】
いくらかの予測モデルが知られている。例えば、例えば線形予測等の方法に従って、予測値として、任意の値、前の値、以前に受信されたオーディオデータに基づいて決定された値が選択される。
【0009】
モノラルチャンネルデータが不完全な方法で受信される場合に、不完全な値をモノラルチャンネルデータの予測値によって交換することは、概して、比較的満足できるものであるということが分かる。
【0010】
しかしながら、空間化データが不完全な方法で受信される場合に、不完全な値を予測値によって交換することは、満足できないものであるということが分かる。
【0011】
経時的な空間化データの強い変化は、聞き手において、音源の突然の変位の感覚として現れる。
【0012】
例えば、もし不完全な値が空間化の欠如に対応する任意の値と交換されるならば、モノラルチャンネル音に戻る感覚は、特に両耳用の信号の場合は、聞き手に混乱を起こさせ得る。実際には、両耳用の信号、すなわち耳のレベルで3次元空間における忠実な再生を可能にすることは、多くの場合、空間において相対的に固定された仮想音源に対応する。
【発明の概要】
【発明が解決しようとする課題】
【0013】
従って、多重チャンネルオーディオデータの再構成の間の空間化データの不具合の更に良い隠蔽に関する要求が存在する。
【課題を解決するための手段】
【0014】
第1の特徴によれば、本発明の主題は、少なくとも限定された数のチャンネル上のデータ及び空間化データに基づいた、多重チャンネルオーディオデータの再構成のための音響データの処理方法であって、この方法は、受信されたフレームの空間化データの妥当性を検査するステップを含んでいる。もしこの検査が、これらの空間化データが有効であることを示す場合に、a/複数の予測モデルのそれぞれのモデルごとに、空間化値(spatialization value)がこのモデルに従って予測されると共に、b/このように予測された空間化値に基づいて、そして実際に受信された空間化データに基づいて、その後の不完全な空間化データの受信が発生したら、選択された予測モデルに従って空間化値を予測すると共に、この多重チャンネルオーディオデータの再構成のためにこの予測された空間化値を使用することができるように、予測モデルが選択される。
【0015】
従って、有効であると見なされた空間化データは、不完全であると見なされた空間化データの受信が発生したら、複数の予測モデルの中から利用されるべき予測モデルを選択するために使用される。内容に応じて適応できるそのような方法は、単一の予測モデルが使用される従来技術より更に満足な方法で空間化データの不具合を緩和することを可能にする。
【0016】
“限定された数のチャンネル”という表現は、多重チャンネルデータのチャンネルの数より少ない数のチャンネルを意味すると理解される。例えば、限定された数のチャンネル上のデータは、モノラルチャンネルデータを含むことができる。
【0017】
空間化データ、そしてより一般に受信されたオーディオデータは、伝送路から発生し得る。例えば、これらのデータは、インターネットを介して受信され得る。その代りに、受信されたオーディオデータは、記憶媒体、例えばDVD(“デジタル多用途ディスク:Digital Versatile Disk”)等から読み取られ得る。本発明は、受信されたオーディオデータの発信源によって決して制限されない。
【0018】
受信されたオーディオデータは、符号化された信号、逆多重化された(demultiplexed)及び/または復号化された信号、数値等を含むことができる。
【0019】
ステップ“a/”及び“b/”は、有効であると見なされたフレームの受信の後に系統的に実行され得る。様々な処理は、従って経時的に分散される。
【0020】
特に、ステップ“a/”及び“b/”が各有効なフレームに関して実行される場合に、その後の不完全な空間化データの受信が発生したら、適用されるべき予測モデルを迅速に検索することができるように、選択された予測モデルの識別子をメモリに書き込むための対策が講じられ得る。
【0021】
その代りに、ステップ“a/”及び/または“b/”の実行は、いくらかの条件の実現に支配され得ると共に、これは、無関係な計算を実行するのを回避することを可能にし得る。
【0022】
例えば、フレームが有効であると見なされる場合に、空間化データは、少なくとも一時的方法でメモリに格納される。ステップ“a/”及び“b/”は、その後の不完全であると見なされた空間化データの受信が発生した場合にのみ、(このように格納されたデータに基づいて)実行される。これは、従って、特にステップ“a/”の予測を実行することを、そのようなものが必要ではない場合に回避する。
【0023】
別の例によれば、有効であると見なされたフレームの受信に続いて系統的にステップ“a/”の予測を実行するための対策が講じられ得ると共に、一方、ステップ“b/”は、不完全なフレームを受信する場合にのみ、(メモリに保持された前のフレームまたは前の複数のフレームの空間化データに基づいて)実行される。
【0024】
有利に、ステップ“b/”の間、それぞれ予測された空間化値は、受信された空間化データに基づいて推定された値と対比される。特に、モデルごとに、類似値を、一方では、このモデルに応じて予測された空間化値に基づいて、そして、他方では、受信された空間化データに基づいて推定された値に基づいて、計算するための対策が講じられ得る。そして、類似値が予測値と推定値との間のより大きい適合度を示す予測モデルが選択される。
【0025】
推定値は、空間化データの内の1つであり得ると共に、例えば推定値は、ILDを含み得る。この場合、ステップ“b/”の間に、予測された空間化値を受信された空間化データと直接比較するための対策が講じられ得る。
【0026】
その代りに、推定値は、単に空間化データに由来し得る。例えば、推定値は、フレームに関するILD及び与えられる周波数から生じる利得、そして遅延等を含み得る。この場合、ステップ“b/”の間に、予測された空間化値を受信された空間化データに基づいて獲得された値と比較するための対策が講じられ得る。
【0027】
有利に、少なくとも1つのモデルに関して、以前に予測された空間化値が、対応する推定値と更に対比される。従って、内容との最良適合になる予測モデルの選択が、より適切に実行され得る。
【0028】
例えば、いくらかのフレーム上で受信された空間化データを使用すると共に、いくらかのフレームに関して、予測値と推定値を対比することが可能である。
【0029】
特に、受信された一連のフレームのフレームごとに、そして少なくとも1つのモデルに関して、一連の空間化値が予測されるように、空間化値をこのモデルに従って予測することが可能である。このモデルに関して、類似値が、一方では、一連の予測された空間化値に基づいて、そして、他方では、一連のフレームのデータに基づいて推定された一連の値に基づいて、計算され得る。
【0030】
有利に、不完全な空間化データは、この選択をゆがめることを回避するように、予測モデルの選択ステップの間に使用されないことになる。
【0031】
その代りに、例えば予測モデルの選択に関して、同一のフレームにおいて受信された現在の空間化データで対処することが可能である。
【0032】
データは、伝送の間に導入された劣化のせいで、もしくは、データ記憶媒体の劣化のせいで、不完全であり得る。本発明は、不具合のこの原因には制限されない。例えば、送信機または伝送ネットワークの別の構成要素が一組のデータを送信しないことを選択し得る、レイヤに階層化された伝送(または、いわゆる“スケーラブル符号化(scalable coding)”)の場合に、いくらかのデータが、受信された空間化データの中から欠落し得る。
【0033】
空間化データの不完全な性質は、既知の方法に従って、例えばCRCタイプの符号を用いて、検出され得る。
【0034】
本発明は、選択された予測モデルの識別子のメモリへの書き込みの形式によって、決して制限されない。例えば、このモデルに対応するプログラムの全ての命令をプログラムメモリにコピーするか、もしくは、任意に揮発性のメモリに、全く単にモデル名を格納することが可能である。
【0035】
ステップ“a/”の間、空間化値の予測は予測モデルに従って実行され、すなわち、特に、予測のために使用されるデータはモデルに従って異なり得る。例えば、任意の値を空間化値に割り当てることになるモデルに関して、予測のためのデータは必要ではない。前の空間化値を再利用するか、及び/または、前の空間化値に加重することになるモデルに関して、この前の空間化値が予測の間に使用される。
【0036】
有利に、ステップ“a/”は、所定の周波数帯域に対応する空間化データに関して実行される。従って、様々な周波数帯域において、いくらかの予測が並列に実行され得る。実際には、ステレオ信号の場合、最も適切な予測モデルの選択は、周波数に関連し得ると共に、人は、考察された周波数帯域に従って異なる予測モデルを選択するように導かれ得る。
【0037】
別の特徴によれば、本発明の主題は、命令がプロセッサによって実行された場合に上記で説明された方法を実施するためのこれらの命令を含むことを特徴とするコンピュータプログラムである。
【0038】
更にもう一つの特徴によれば、本発明の特徴は、不完全な空間化データを隠蔽するための隠蔽デバイスである。このデバイスは、1つ以上のメモリを有することができると共に、それぞれの命令の組が予測モデルに対応する、複数の命令の組を格納するための記憶装置を備える。このデバイスは、更に、空間化データを受信するための受信手段を備える。検査モジュールは、受信手段によって受信された空間化データの妥当性を検査することを可能にする。検出モジュールによって有効であると検出された空間化データの受信が発生したら、推定モジュールは、記憶装置に格納された命令の組ごとに、空間化値を予測するようにこの命令の組を実行することを可能にする。選択モジュールは、推定モジュールによって予測された空間化値に基づいて、そして、受信手段によって受信された空間化データに基づいて、予測モデルを選択することを可能にする。隠蔽デバイスは、更に、検出モジュールによって不完全であると見なされた空間化データの受信が発生したら、選択モジュールによって選択されたモデルに従って空間化値を予測するように作られた予測モジュールを備える。
【0039】
更にもう一つの特徴によれば、本発明の主題は、多重チャンネルオーディオデータを再構成するための装置である。この装置は、少なくとも限定された数のチャンネル上のデータ、例えばモノラルチャンネルデータに基づいて多重チャンネルオーディオデータを再構成するための多重チャンネル再構成手段を備える。この装置は、更に、上記で説明された隠蔽デバイスを備える。予測モジュールは、検出モジュールによって不完全であると見なされた空間化データの受信が発生したら、多重チャンネルオーディオデータを再構成するための多重チャンネル再構成手段に、予測された空間化値を提供するように作られている。
【0040】
多重チャンネルオーディオデータを再構成するための装置は、プロセッサに統合され得るか、さもなければ、コンピュータもしくはハイファイ(Hi-Fi)システムタイプ等の装置からなり得る。
【0041】
再構成装置の様々なハードウェア装置、例えば再構成手段、隠蔽デバイス、検出モジュール等は、分離していても良いし、もしくは、併合されていても良い。
【図面の簡単な説明】
【0042】
【図1】代表的な会話の符号化デバイスを示す図である。
【図2】本発明の一実施例による代表的な再構成装置を含む代表的な復号化デバイスを示す図である。
【図3】本発明の一実施例による方法の代表的なアルゴリズムを示す図である。
【図4】代表的な起こり得る利得の変化を示すグラフである。
【図5】本発明の1つの特徴によるコンピュータプログラムを実行することができるデバイスを示す図である。
【発明を実施するための形態】
【0043】
本発明の他の特徴及び利点は、添付された図面に対する参照と共に与えられた、以下に詳述された説明において、明白になるであろう。
【0044】
1つの図面から別の図面まで、同じ参照符号は、同じであるか、もしくは類似している対象物を表示する。
【0045】
図面で例証された例において、多重チャンネルオーディオデータのチャンネルの数は、ちょうど2つであるが、しかし、それについて更に多くのチャンネルを提供することは、もちろん可能である。多重チャンネルオーディオデータは、例えば6チャンネル上の5.1のデータを含むことができる。本発明は、更に、空間化された電話会議の分野おけるアプリケーションを見い出すことができる。
【0046】
特に、MPEGサラウンド標準(MPEG Surround standard)に対する参照が行われ得ると共に、すなわち、2を超える経路を生み出すために、ツリー構造が、使用されるか、もしくはシミュレートされ得る。
【0047】
表示された例において、オーディオデータは、インデックスnが付けられたフレームまたはパケットにグループ化される。
【0048】
図1は、ステレオの情報が、周波数帯域によって送信されると共に、周波数領域に適用される、代表的な符号器を示す。
【0049】
この目的のために、その符号器は、時間周波数変換手段10、例えば離散型フーリエ変換またはDFT、MDCT変換(“修正離散コサイン変換:Modified Discrete Cosine Transform”)、MCLT変換(“変調複素重複変換:Modulated Complex Lapped Transform”)のような変換を実行することができる例えばDSP(Digital Signal Processor)を統合する。
【0050】
左側周波数信号S(k)及び右側周波数信号S(k)の値は、従って、左側及び右側の時間信号に対応する値S(n)、S(n)に基づいて獲得される。
【0051】
マトリクス化は、その後、マトリクス化手段11によって、左側信号S(k)及び右側信号S(k)の経路に適用される。
【0052】
これらの手段11は、ステレオの信号S(k)及びS(k)に基づいて、モノラルチャンネル信号M(k)及び残留信号E(k)を決定することを可能にする。モノラルチャンネル信号M(k)は、一般的に、左側信号S(k)と右側信号S(k)との和の半分である。残留信号E(k)は、左側信号S(k)と右側信号S(k)との間の差の半分に等しくすることができる。
【0053】
モノラルチャンネル信号M(k)が更に多くの情報を伝送できるようにマトリクス化を適応させるための対策が講じられ得る。この目的のために、左の経路と右の経路との間で位相が反対であろう成分を相殺することを回避できるように、マトリクス化手段11によって実行された方法は、経時的に変化し得る。
【0054】
空間化データ推定手段12は、モノラルチャンネル信号M(k)及び残留信号E(k)に基づいて、空間化データ、例えばステレオパラメータを推定することを可能にする。これらのステレオパラメータは、当業者に知られ得ると共に、例えば経路間レベル(ILD)、経路間相関(ICC)、及び経路間の遅延または位相差(IPD/ITD)を含み得る。
【0055】
これらのステレオパラメータILD(b)は、変数bによってインデックスが付けられた周波数帯域によって決定され得る。これらの帯域は、人体感覚に近い周波数スケールに従って構成され得る。例えば、それは、望まれた精度及び考察されたスペクトルの豊かさに応じて、8個から20個の周波数帯域を使用することが可能である。
【0056】
量子化、符号化、及び多重化手段13は、減少したスループットにおける伝送を可能にするように、ステレオパラメータILD(b)を量子化して、符号化することを可能にする。
【0057】
モノラルチャンネル信号M(k)は、更に、手段13によって、図1において提示された変換された領域もしくは時間領域で、量子化されて、符号化される。このモノラルチャンネル信号M(k)を処理するために、標準化されたアルゴリズム、例えばITU G.729.1、またはG.718タイプの音声符号器を使用することが可能である。それは、更に、MPEG−4 AAC、またはHE−AACタイプの一般的なオーディオ符号器であり得る。
【0058】
残留信号E(k)は、任意に送信されるが、同様に、周波数領域または時間領域におけるこの信号に特有の標準化された符号化技術または伝送技術を必要とする。
【0059】
量子化、符号化、及び多重化手段13からの出力として獲得された、符号化された信号Sencは、例えば、無線経路によって送信される。
【0060】
その代りに、符号器からの出力として獲得されたデータのチャンネルの数が符号器に入力されるデータのチャンネルの数より小さいという条件で、1つを超えるモノラルのチャンネル上で獲得されたデータに符号器を導くための対策が講じられ得る。
【0061】
図2は、送信された信号Sencに対応する信号S’encを受信する傾向がある代表的な復号器を示す。
【0062】
復号化及び逆多重化手段29は、受信された信号S’encより、モノラルチャンネルデータM’(k)、空間化データILD’(b)の他に、任意に残留信号E’(k)を抽出することを可能にする。
【0063】
復号器は、更に、モノラルチャンネルデータM’(k)、空間化データILD’(b)、そして任意に残留信号E’(k)に基づいて、多重チャンネルオーディオデータS’(k)、S’(k)を再構成するための、再構成装置26を備える。
【0064】
図3は、図2の再構成装置26によって実行可能なアルゴリズムを示す。これらの2つの図面は、従って同時に論評されることになる。
【0065】
再構成装置26は、不完全な空間化データILD’(b)の場合に交換値を提供するための隠蔽デバイス20、及び再構成に適当な多重チャンネル再構成手段27を備える。
【0066】
多重チャンネル再構成手段27は、例えばステップ300の間に、下記数1のタイプの組み合わせを実行することができる。
【0067】
【数1】

【0068】
ここで、kは、考察された周波数インデックスを示すと共に、bは、送信されたステレオのパラメータ、すなわち、モノラルチャンネルデータM’(k)に基づいて、ステップ301の間に、空間化データ(図示せず)から獲得された位相シフトまたは遅延を当業者に知られている方法で適用することによって獲得された左側の経路に対応する周波数領域の信号M(k)、及びステップ301の間に、同等の方法で獲得された右側の経路に関する周波数領域の信号M(k)、によって割り当てられた帯域を示す。
【0069】
特に、全く位相シフトが適用されない場合、その場合には、下記数2のようになる。
【0070】
【数2】

【0071】
E’は、当業者に知られている方法で任意に送信された残留信号E’(k)から生じる左側の経路に特有の信号であると共に、E’は、当業者に知られている方法で任意に送信された残留信号E’(k)から生じる右側の経路に特有の信号である。データE’、E’を獲得するステップは、図3には表示されない。
【0072】
残留データが伝送されない場合は、下記数3のようになる。
【0073】
【数3】

【0074】
及びWは、考察された帯域b及びフレームnに関する空間化データILD’(b,n)から生じる利得である。
【0075】
利得W及びWは、ステップ302の間に、値W’及びW’として、例えば下記数4のとおりに決定され得る。
【0076】
【数4】

【0077】
ここで、ILD’(b,n)は、フレームnに関して受信された空間化データILD’(b)である。
【0078】
0と1との間の時定数α、例えばα=0.8による平滑化は、その場合に、下記数5に従ってステップ304の間に実行される。
【0079】
【数5】

【0080】
ここで、W(b,n−1)は、前のフレームにおいて獲得された値を示す。
【0081】
右側の経路に関して、ステップ304の間に、下記数6のように、同じ平滑化を実行することが可能である。
【0082】
【数6】

【0083】
ここで、W(b,n−1)は、前のフレームにおいて獲得された値を示す。
【0084】
その代りに、例えば下記数7に従って、左側の経路に関して獲得された値を使用することが可能である。
【0085】
【数7】

【0086】
隠蔽装置20は、データW及びWが、全てのものをよそに決定され得るように、データILD’(b,n)の見込まれる損失を回避することを可能にする。
【0087】
隠蔽装置20は、ステップ305の間に、空間化データILD’(b,n)の他に、任意にモノチャンネルデータM’(k)及び残留データE’(k)を受信するための受信手段(図示せず)を備える。
【0088】
これらの受信手段は、例えば入力ポート、入力ピン等を備えることができる。
【0089】
これらの受信手段に連結された検査モジュール22は、ステップ306の間に、空間化データILD’(b)の妥当性を検査することを可能にする。この検査モジュールは、例えば、その伝送が空間化データの劣化を全く引き起こさなかったということを確認するために、CRCタイプの符号化の検査を実行し得る。
【0090】
検査モジュール22は、更に、受信された信号S’encから抽出されたいくらかの値(図示せず)を読むことができると共に、これらの値は、送信されたデータの階層の削除の可能性を示す。実際には、特に、ネットワークがつまるか、もしくは伝送路の帯域幅が減少する場合に、伝送ネットワークのいくらかの構成要素が、このようなデータセットを送信することを自制するための対策が講じられ得る。送信されなかったデータセットは、例えば音響の詳細に対応し得る。検査モジュール22がいくらかのデータの削除を示す値を読み取る場合に、これらのデータは欠落していると考えられる。
【0091】
隠蔽装置20は、各命令の組が予測モデルに対応する、いくらかの命令の組を格納する記憶装置21を備える。
【0092】
例えば、第1の予測モデルに従って、フレームn及び所定の周波数帯域bに関する空間化データILD’(b,n)が不完全である場合に、下記数8が選択される。
【0093】
【数8】

【0094】
その場合に、対応する命令は、前のフレームに関して獲得された値W(b,n−1)、W(b,n−1)をコピーすることになる。
【0095】
例えば、第2の予測モデルに従って、下記数9が選択される。
【0096】
【数9】

【0097】
ここで、βは0と1との間の数値である。
【0098】
従って、いくらかの空間化データが不完全であるフレームが連続する場合に、
【数10】

は、1である傾向があると共に、その結果として多重チャンネルオーディオデータS’(k)、S’(k)は、モノラルチャンネルデータM’(k)に近くなる。別の方法で明記すると、空間化効果は、モノラルチャンネル信号に戻るように徐々に削除される。
【0099】
別の代表的な予測モデルによれば、下記数11が選択される。
【0100】
【数11】

【0101】
あるいは、下記数12が選択される。
【0102】
【数12】

【0103】
さもなければ、下記数13のようにメディアンフィルタ(median filter)が使用される。
【0104】
【数13】

【0105】
任意に、更に良い安定性を保証するために、減衰した値、例えば“0.9W(b,n−i)”及び“0.9W(b,n−i)”が、それそれ“W(b,n−i)”及び“W(b,n−i)”の代わりに使用されることになる。これらの減衰した値が、上記で説明されたモデルの内の1つ適用することによってそれらを使用するように、記憶装置内に保存されるための対策が講じられ得る。
【0106】
他のモデルが同様に可能であると共に、それは、例えば、予測の次数に関してPが可能である下記数14の形式の、更に一般的な予測である。
【0107】
【数14】

【0108】
それらの係数αは、経時的に変化し得ると共に、レビンソン−ダービン(Levinson-Durbin)タイプのスキームを用いて再度更新され得る。
【0109】
モデルのこれらの例は、W及びWの値の予測につながる。その代りに、それらのモデルは、W’及びW’の変数ILD’(b,n)の値等を予測することを可能にし得る。
【0110】
例えば、上記で説明された第1のモデルに相当する予測モデルに従って、フレームn及び所定の周波数帯域bに関して、空間化データILD’(b,n)が欠落した場合に、“ILD’(b,n)=ILD’(b,n−1)”が選択される。その場合に、対応する命令は、前のフレームに関して獲得されたこの値“ILD’(b,n−1)”をコピーすることになる。
【0111】
推定モジュール23は、様々な命令の組の命令を実行することを可能にする。このモジュール23は、例えば、対応する空間化データILD’(b,n)が検査モジュール22によって有効であると見なされる各フレームに関して活性化されるか、または、さもなければ、有効であると見なされると共に、不完全であると見なされたフレームに先行するフレームに関してのみ活性化される。
【0112】
このモジュール23が活性化される場合、一組の値
【数15】

を獲得するように、命令の組を詳しく検討するループにおいて繰り返されるステップ307の間に、初期化、検査、及び増加の従来のステップを伴う、全ての格納された命令の組が実行され、ここで、mは使用されたモデルを示す。
【0113】
選択モジュール24は、実際に受信された空間化データILD’(b,n)に基づいて、予測された空間化値
【数16】

を、推定された空間化値W、Wと対比することによって、これらのモデルの内の1つを選択することを可能にする。
【0114】
ステップ308の間に、例えば、各モデルに関して、予測値
【数17】

に基づいて、そして、推定値W(b,n)、W(b,n)に基づいて、類似値
【数18】

を計算することを可能にする。類似値は、例えば、下記数19のように、各予測の分散を含むことができる。
【0115】
【数19】

【0116】
ここで、Eは、数学的期待値を表すと共に、例えば下記数20に従う。
【0117】
【数20】

【0118】
受信されたN個のフレームの系列は、従って、N個の値
【数21】

を決定すると共に、それらをN個の推定値W(b,n)と比較するために使用される。
【0119】
同等の式が、右側の経路に関して適用される。
【0120】
その代りに、例えば、各経路に関して、下記数22に従って、再帰的に分散を計算するための対策が講じられ得る。
【0121】
【数22】

【0122】
ここでαは、例えば0.975に等しい時定数であり、そして、
【数23】

は、フレームnにおける分散の推定値を示す。
【0123】
代替実施例(図示せず)によれば、分散を推定する代わりに、実際に受信された値に基づいて獲得されたデータW、Wに関して、データ
【数24】

の尤度が推定される。例えば、下記数25に示す一組の推定量を使用することが可能である。
【0124】
【数25】

【0125】
【数26】

のタイプの推定量を比較することによって、類似値が予測値と推定値との間のより大きい適合度を示す予測モデルを選択することが可能である。例えば、最良の隠蔽を与えるモデルのインデックスmが決定され、これは、
【数27】

を最小化するか、または別の実施例において、
【数28】

を最大化することになるインデックスになるであろう。
【0126】
簡単にするために、1つの経路上、例えば左側の経路上で、
【数29】

を最小化するインデックスを選択するための対策が講じられ得る。
【0127】
この値mは、選択された予測モデルの識別子を構成すると共に、ステップ309の間に、記憶装置21に格納される。
【0128】
ステップ307がステップ302、304の前に、またはさもなければステップ307と並列に、実行され得ることは、明瞭である。ここで各ステップ308は、ステップ304の間に獲得された値を包含すると共に、従って、このステップ304の次に実行される。
【0129】
隠蔽装置20は、更に、不完全であると見なされた空間化データの受信が発生したら、値mによって識別されたモデルに従って、ステップ310の間に、空間化値
【数30】

を予測するための予測モジュール25を備える。
【0130】
この値は、多重チャンネル再構成手段27に提供されると共に、多重チャンネル再構成手段27は、その場合に、空間化データの不具合にもかかわらず、ステップ300の間に、多重チャンネルデータS’(k)、S’(k)を再構成することができる。
【0131】
周波数時間変換手段28、例えばDSPは、再構成された多重チャンネルデータS’(k)、S’(k)に基づいて、一時的なオーディオデータS’(n)、S’(n)を検索することを可能にする。
【0132】
図4は、第2の周波数サブバンド、すなわちb=1に関する、値W(b,n)の代表的な変化を表すプロットを示す。フレームインデックスnは、横座標、及び縦座標の値W(1,n)として現れる。
【0133】
おおよそ500番目のフレームと810番目のフレームとの間に対応する部分Aに関して、W(1,n)の値は、概して1に等しく、従って、比較的モノラルの音響信号に対応する。
【0134】
部分Bに関して、W(1,n)の値は、左側に位置する信号に対応し、一方、部分Cに関して、W(1,n)の値は、右側に位置する信号に対応する。
【0135】
部分Dに関して、W(1,n)の値は、様々な場所に位置する複数の音源に対応する。
【0136】
選択された最良の予測モデルは、利得変化のタイプに従って変化し得る。
【0137】
従って、部分Aに関して、前のフレームに関して獲得された値を繰り返すことになるモデルは、W(1,n)の値のスパイクを誤って繰り返すことにつながるであろう。更に多くの賢明なモデルは、モノラルチャンネル信号に対応する任意の値を選択するか、さもなければ、1の利得に徐々に近づけるように、前のフレームに関して獲得した利得を重み付けすることになるであろう。
【0138】
一方、部分B、及び部分Cに関して、最も賢明なアプローチは、前のフレームのために獲得された利得値を繰り返すことになり得る。
【0139】
部分Dに関して、その利得が比較的ゆっくりと変化すると共に、従って、比較的予測どおりに変化する場合に、賢明なアプローチは、P個の前のフレームに関して獲得された利得の加重平均を実行することになるであろう。ステレオのパラメータが更に急速に変化する場合に、最も賢明なアプローチは、あらゆる人為要素を回避するように、モノラルチャンネル信号に戻ることになるであろう。
【0140】
従って、最も賢明なモデルは、1つのフレームから別のフレームまでの利得変化のタイプに従って変化することができる。図3の方法は、人間の介入なしで、最も適当な予測モデルを選択することを可能にする。
【0141】
最も適当な予測モデルのこの選択は、不完全なデータの場合に、更に良い品質の隠蔽を獲得することを可能にする。
【0142】
図5は、画面502、キーボード、及び中央ユニットを備えるコンピュータを示す。この中央ユニットは、上記で説明された方法のステップに対応する命令を含むコンピュータプログラムを格納するためのメモリ500を備える。これらの命令を実行するために、この中央ユニットは、メモリ500に連結されるプロセッサ501を更に備える。
【符号の説明】
【0143】
10 時間周波数変換手段
11 マトリクス化手段
12 空間化データ推定手段
13 量子化、符号化、及び多重化手段
20 隠蔽デバイス
21 記憶装置
22 検査モジュール
23 推定モジュール
24 選択モジュール
25 予測モジュール
26 再構成装置
27 多重チャンネル再構成手段
28 周波数時間変換手段
29 復号化及び逆多重化手段
500 メモリ
501 プロセッサ
502 画面

【特許請求の範囲】
【請求項1】
少なくとも限定された数のチャンネル上のデータ及び空間化データに基づいた、多重チャンネルオーディオデータの再構成のための音響データの処理方法であって、
前記方法が、受信されたフレームの空間化データの妥当性を検査するステップ(306)を含み、もし前記検査が、受信された前記空間化データが有効であることを示す場合に、
a/複数の予測モデルのそれぞれのモデルごとに、前記モデルに従って空間化値を予測するステップ(307)と、
b/このように予測された前記空間化値に基づいて、そして受信された前記空間化データに基づいて、その後の不完全な空間化データの受信が発生したら、選択された予測モデルに従って空間化値を予測すると共に、前記多重チャンネルオーディオデータの再構成のために前記予測された空間化値を使用することができるように、前記予測モデルを選択するステップとを含む
ことを特徴とする方法。
【請求項2】
もし前記検査が、受信された前記空間化データが有効であることを示す場合に、そして、ステップ“a/”の前に、
前記有効な空間化データを格納するステップを更に含み、
ステップ“b/”が、その後の不完全な空間化データの受信が発生したら、前記格納された空間化データに基づいて実行される
ことを特徴とする請求項1に記載の方法。
【請求項3】
ステップ“a/”が、その後の不完全な空間化データの受信が発生したら、前記格納された空間化データに基づいて実行される
ことを特徴とする請求項2に記載の方法。
【請求項4】
ステップ“a/”及び“b/”が、有効なフレームの受信の後に系統的に実行されると共に、
前記方法が、ステップ“b/”の後に、前記選択された予測モデルの識別子をメモリに書き込むステップを更に含む
ことを特徴とする請求項1に記載の方法。
【請求項5】
前記予測された空間化値が、利得
【数1】

を含む
ことを特徴とする請求項1に記載の方法。
【請求項6】
前記予測された空間化値が、遅延を含む
ことを特徴とする請求項1に記載の方法。
【請求項7】
ステップ“b/”の間に、
前記複数のモデルのそれぞれのモデルごとに、類似値
【数2】

が、一方では、前記モデル
【数3】

に応じた前記予測された空間化値に基づいて、そして、他方では、受信された前記空間化データに基づく推定値
【数4】

に基づいて、計算されると共に、
前記類似値が前記予測された空間化値と前記推定値との間のより大きい適合度を示す前記予測モデルが選択される
ことを特徴とする請求項1に記載の方法。
【請求項8】
ステップ“a/”及び“b/”の間に、
受信された一連のフレームのフレームごとに、そして前記複数のモデルの内の少なくとも1つのモデルに関して、空間化値
【数5】

が、前記モデルに従って予測されると共に、
前記モデルに関して、類似値
【数6】

が、一方では、前記モデルに応じた一連の予測された前記空間化値に基づいて、そして、他方では、受信された前記一連のフレームの前記空間化データに基づく一連の推定値
【数7】

に基づいて、計算される
ことを特徴とする請求項7に記載の方法。
【請求項9】
ステップ“a/”が、所定の周波数帯域(b)に対応する空間化データに関して実行される
ことを特徴とする請求項1に記載の方法。
【請求項10】
命令がコンピュータによって実行された場合に請求項1に記載の方法を実施するための前記命令を含むことを特徴とするコンピュータプログラム。
【請求項11】
不完全な空間化データを隠蔽するための隠蔽デバイス(20)であって、
それぞれの命令の組が予測モデルに対応する、複数の命令の組を格納するための記憶装置(21)と、
空間化データを受信するための受信手段と、
前記受信手段によって受信された前記空間化データの妥当性を検査するための検査モジュール(22)と、
前記検出モジュールによって有効であると検出された空間化データの受信が発生したら、前記記憶装置に格納された命令の組ごとに、空間化値を予測するように前記命令の組を実行することができる推定モジュール(23)と、
前記推定モジュールによって予測された前記空間化値に基づいて、そして、前記受信手段によって受信された前記空間化データに基づいて、予測モデルを選択するための選択モジュール(24)とを備え、
前記隠蔽デバイスが、
その後の前記検出モジュールによって不完全であると見なされた空間化データの受信が発生したら、前記選択モジュールによって選択された前記モデルに従って空間化値を予測するように作られた予測モジュール(25)を更に備える
ことを特徴とする隠蔽デバイス。
【請求項12】
多重チャンネルオーディオデータを再構成するための装置(26)であって、前記装置が、
少なくともモノラルチャンネルデータに基づいて多重チャンネルオーディオデータを再構成するための多重チャンネル再構成手段(27)と、
前記予測モジュール(25)が、前記検出モジュールによって不完全であると見なされた空間化データの受信が発生したら、前記多重チャンネルオーディオデータを再構成するための前記多重チャンネル再構成手段に、前記予測された空間化値を提供するように作られた、請求項11に記載された前記隠蔽デバイス(20)と
を備えることを特徴とする装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate


【公表番号】特表2011−529579(P2011−529579A)
【公表日】平成23年12月8日(2011.12.8)
【国際特許分類】
【出願番号】特願2011−520560(P2011−520560)
【出願日】平成21年7月3日(2009.7.3)
【国際出願番号】PCT/FR2009/051304
【国際公開番号】WO2010/012927
【国際公開日】平成22年2月4日(2010.2.4)
【出願人】(591034154)フランス・テレコム (290)