説明

オーディオ信号の処理方法及び装置

本発明のオーディオ信号の処理方法は、ダウンミックス信号、オブジェクト情報及びプリセット情報を受信し、前記オブジェクト情報及びプリセット情報を用いてダウンミックス処理情報を生成し、前記ダウンミックス処理情報を用いて前記ダウンミックス信号を処理し、前記オブジェクト情報及びプリセット情報を用いてマルチチャネル情報を生成し、前記プリセット情報はビットストリームから抽出されることを特徴とする。
本発明のオーディオ信号処理方法によると、それぞれのオブジェクトに対するユーザの設定なしに、既に設定されたプリセット情報を用いて容易にオブジェクトの利得及びパニングをコントロールすることができ、ユーザの選択を基盤にして変形されたプリセット情報又は外部から入力されるユーザプリセット情報を用いて容易にオブジェクトの利得及びパニングをコントロールすることができる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、オーディオ信号の処理方法及び装置に関するもので、より詳細には、デジタル媒体、放送信号などで受信されたオーディオ信号を処理することができるオーディオ信号の処理方法及び装置に関するものである。
【背景技術】
【0002】
多数個のオブジェクトを含むオーディオ信号をモノ又はステレオ信号にダウンミックスする過程において、それぞれのオブジェクト信号から各パラメータが抽出される。これらパラメータはデコーダで使用されるが、それぞれのオブジェクトのパニング及び利得はユーザの選択によってコントロールされる。
【0003】
それぞれのオブジェクト信号を制御するためには、ダウンミックスに含まれているそれぞれのソースがユーザの選択によって適切にポジショニングまたはパニングされなければならない。しかしながら、ユーザによってオブジェクトを制御する場合、全てのオブジェクト信号を制御すべきであるという煩雑さがあり、専門家が制御する場合に比べて、多数個のオブジェクトを含むオーディオ信号の最適な状態を再現することが困難であった。
【0004】
また、オブジェクト信号を復元するためのオブジェクト情報がエンコーダから伝送されない場合、ダウンミックス信号に含まれたオブジェクト信号を制御することが難しくなる。
【発明の概要】
【発明が解決しようとする課題】
【0005】
本発明は、上記のような問題点を解決するためになされたもので、既に設定されたプリセット情報を用いてオブジェクトの利得及びパニングをコントロールすることができるオーディオ信号処理方法及び装置を提供することを目的とする。
【0006】
本発明の他の目的は、既に設定されたプリセット情報をオーディオ信号と別途伝送または保存することができるオーディオ信号処理方法及び装置を提供することにある。
【0007】
本発明の更に他の目的は、ユーザの選択を基盤にして既に設定された多数個のプリセット情報のうち一つを選択し、オブジェクトの利得及びパニングをコントロールすることができるオーディオ信号処理方法及び装置を提供することにある。
【0008】
本発明の更に他の目的は、外部から入力されるユーザプリセット情報を用いてオブジェクトの利得及びパニングをコントロールすることができるオーディオ信号処理方法及び装置を提供することにある。
【0009】
本発明の更に他の目的は、エンコーダからオブジェクト情報が伝送されない場合、ダウンミックス信号を用いてブラインド情報を生成し、オーディオ信号を制御することができるオーディオ信号処理方法及び装置を提供することにある。
【課題を解決するための手段】
【0010】
前記のような目的を達成するために、本発明に係るオーディオ信号処理方法は、ダウンミックス信号、オブジェクト情報及びプリセット情報を受信し、前記オブジェクト情報及びプリセット情報を用いてダウンミックス処理情報を生成し、前記ダウンミックス処理情報を用いて前記ダウンミックス信号を処理し、前記オブジェクト情報及びプリセット情報を用いてマルチチャネル情報を生成し、前記オブジェクト情報は、オブジェクトレベル情報、オブジェクト関連情報及びオブジェクト利得情報のうちいずれか一つ以上を含み、前記オブジェクトレベル情報は、前記オブジェクトレベルのうち一つを用いてオブジェクトに対応するオブジェクトレベルを正規化することによって生成され、前記オブジェクト関連情報は、二つの選択されたオブジェクトの組み合わせから生成され、前記オブジェクト利得情報は、ダウンミックス信号を生成するために、それぞれのダウンミックス信号のチャネルに対するオブジェクトの寄与度を決定するもので、前記プリセット情報はビットストリームから抽出される。
【発明の効果】
【0011】
本発明は、次のような効果及び利点を提供する。
【0012】
第一に、それぞれのオブジェクトに対するユーザの設定なしに、既に設定されたプリセット情報を用いて容易にオブジェクトの利得及びパニングをコントロールすることができる。
【0013】
第二に、ユーザの選択を基盤にして変更されたプリセット情報を用いてオブジェクトの利得及びパニングをコントロールすることができる。
【0014】
第三に、既に設定された多数個のプリセット情報を用いて、ユーザの趣向によって容易にオブジェクトの利得及びパニングをコントロールすることができる。
【0015】
第四に、外部から入力されるユーザプリセット情報を用いることによって、多様なプリセット情報を用いてオブジェクトの利得及びパニングをコントロールすることができる。
【0016】
第五に、ブラインド情報を用いることによって、オブジェクト情報を生成不可能なエンコーダを用いる場合にもオブジェクトの利得及びパニングをコントロールすることができる。
【図面の簡単な説明】
【0017】
【図1】本発明の実施例に係るオーディオ信号装置の構成図である。
【図2A】本発明の実施例に係るオーディオ信号処理装置に伝送されるビットストリームの構成図である。
【図2B】本発明の実施例に係るオーディオ信号処理装置に伝送されるビットストリームの構成図である。
【図3】本発明の実施例に係るオーディオ信号処理装置のうち情報生成ユニットの構成図である。
【図4】図3の情報生成ユニットを含むオーディオ信号処理装置のビットストリームインタフェースを示す概略図である。
【図5】本発明の他の実施例に係るオーディオ信号処理装置のうち情報生成ユニットの構成図である。
【図6】図5の情報生成ユニットを含むオーディオ信号処理装置のビットストリームインタフェースを示す概略図である。
【図7】図5の情報生成ユニットを含むオーディオ信号処理装置のユーザインタフェースの表示部を示す図である。
【図8】本発明の更に他の実施例に係るオーディオ信号処理装置のビットストリームインタフェースを示す概略図である。
【図9】本発明の更に他の実施例に係るオーディオ信号処理装置のうち情報生成ユニットの構成図である。
【図10A】本発明の更に他の実施例に係るオーディオ信号の処理方法の出力信号を示す概略図である。
【図10B】本発明の更に他の実施例に係るオーディオ信号の処理方法の出力信号を示す概略図である。
【図11】本発明の更に他の実施例に係るステレオ出力信号を分析する時間―周波数ドメインを示すグラフである。
【図12A】本発明の更に他の実施例に係るブラインド情報の生成過程を示すブロック図及びフローチャートである。
【図12B】本発明の更に他の実施例に係るブラインド情報の生成過程を示すブロック図及びフローチャートである。
【図13】本発明の更に他の実施例に係るオーディオ信号処理装置の構成図である。
【図14】本発明の更に他の実施例に係るブラインド情報生成部を含む情報生成ユニットの細部構成図である。
【図15】本発明の更に他の実施例に係る図14の情報生成ユニットを含むオーディオ信号処理装置のビットストリームインタフェースを示す概略図である。
【図16】本発明の更に他の実施例に係るオーディオ信号処理装置の構成図である。
【発明を実施するための形態】
【0018】
以下、添付された図面を参照して、本発明の好適な実施例を詳細に説明する。ここで、本明細書及び特許請求の範囲で使用された用語や単語は、通常的または辞典的な意味に限定して解釈されてはならず、発明者が自身の発明を最も最善の方法で説明するために用語の概念を適切に定義できるとの原則に立脚して、本発明の技術的思想に符合する意味及び概念に解釈されるべきである。したがって、本明細書に記載された実施例及び図面に示した構成は、本発明の最も好適な一実施例に過ぎないもので、本発明の技術的思想を全て代弁するものではないので、本出願時点において、これらに取って代わる多様な均等物及び変形例があり得ることを理解しなければならない。
【0019】
特に、本明細書で、情報とは、値、パラメータ、係数、成分などを総称する用語として、場合によって異なる意味に解釈されるが、本発明がこれに限定されることはない。
【0020】
図1は、本発明の実施例に係るオーディオ信号処理装置100の構成を示す図である。図1を参照すると、まず、本発明の実施例に係るオーディオ信号処理装置100は、情報生成ユニット110、ダウンミックス処理ユニット120及びマルチチャネルデコーダ130を含む。
【0021】
情報生成ユニット110は、オブジェクト情報(object information;OI)及びプリセット情報(preset information;PI)をオーディオ信号ビットストリームから受信する。ここで、オブジェクト情報(OI)は、ダウンミックス信号(downmix signal;DMX)内に含まれているオブジェクトに関する情報として、オブジェクトレベル情報、オブジェクト相関情報、オブジェクト利得情報などを含むことができる。前記オブジェクトレベル情報は、参照情報を用いてオブジェクトレベルを正規化することによって生成されたもので、前記参照情報は、オブジェクトレベルのうちの一つであり、詳細には、全てのオブジェクトレベルのうち最も大きいレベルである。前記オブジェクト相関情報は、二つのオブジェクト間の相関性を表すもので、選択された二つのオブジェクトが同一の起源を有するステレオ出力のそれぞれ異なるチャネルの信号であることを表す。前記オブジェクト利得情報は、ダウンミックス信号(DMX)を生成するために、それぞれのダウンミックス信号のチャネルに対するオブジェクトの寄与度に関する値を表し、詳細には、オブジェクトの寄与度を変形させるための値を表す。
【0022】
前記プリセット情報(PI)は、プリセット位置情報、プリセット利得情報及び再生環境情報などを根拠にして生成された情報として、ビットストリームから抽出されたものである。
【0023】
前記プリセット位置情報とは、それぞれのオブジェクトの位置またはパニングを制御するために設定された情報であり、前記プリセット利得情報は、それぞれのオブジェクトの利得を制御するために設定された情報で、オブジェクト別利得ファクタを含み、前記オブジェクト別利得ファクタは時間によって変化することができる。また、再生環境情報は、スピーカーの個数、スピーカーの位置、アンビエント情報(スピーカーの仮想位置)などを含む情報である。
【0024】
前記プリセット情報(PI)は、オーディオ信号に対して特定の音場感または効果を得るために、特定のモードに該当するオブジェクト位置情報、オブジェクト利得情報及び再生環境情報を既に設定したものを表す。例えば、プリセット情報のうちカラオケモードは、ボーカルオブジェクトの利得を「0」にするプリセット利得情報を含むことができ、スタジアムモードは、オーディオ信号が広い空間内に存在する効果を与えるためのプリセット位置情報及びプリセット利得情報を含むことができる。本発明に係るオーディオ信号処理装置は、ユーザがそれぞれのオブジェクトの利得又はパニングを調節する必要なしに、既に設定されたプリセット情報(PI)のうち所望のモードを選択することによって、容易にオブジェクトの利得またはパニングを調節することができる。
【0025】
また、情報生成ユニット110は、プリセット情報に対するメタ情報(meta information;MTI)(図示せず)をさらに受信することができ、前記メタ情報(MTI)は、プリセット情報に対応するもので、プリセット情報(PI)名、製作者名などを含むことができる。また、プリセット情報(PI)が二つ以上である場合には、それぞれのプリセット情報(PI)に関するメタ情報(MTI)が含まれてインデックス形式で表現される。また、メタ情報(MTI)は、ユーザインタフェースなどによって示され、ユーザから選択命令の入力を受けることによって用いられる。
【0026】
情報生成ユニット110は、前記オブジェクト情報(OI)及びプリセット情報(PI)を用いてマルチチャネル情報(multi-channel information;MI)を生成する。前記マルチチャネル情報(MI)は、ダウンミックス信号(DMX)をアップミキシングするためのもので、チャネルレベル情報及びチャネル相関情報を含むことができる。また、前記情報生成ユニット110は、オブジェクト情報(OI)及びプリセット情報(PI)を用いてダウンミックス処理情報(downmix processing information;DPI)を生成することができる。
【0027】
ダウンミックス処理ユニット120は、ダウンミックス信号(DMX)を受信し、ダウンミックス処理情報(DPI)を用いてダウンミックス信号(DMX)を処理する。前記ダウンミックス処理情報(DPI)は、ダウンミックス信号(DMX)に含まれたそれぞれのオブジェクト信号のパニング又は利得を調節するためにダウンミックス信号(DMX)を処理することができる。
【0028】
マルチチャネルデコーダ130は、ダウンミックス処理ユニット120から処理されたダウンミックス(processed downmix;PDMX)を受信し、前記情報生成ユニット110から生成されたマルチチャネル情報(MI)を用いて処理されたダウンミックス信号(PDMX)をアップミキシングし、マルチチャネル信号を生成する。
【0029】
図2A及び図2Bは、本発明の実施例に係るオーディオ信号の処理装置に伝送されるビットストリームの構成を示す一例である。一般的に、図2Aに示すように、エンコーダから伝送されるビットストリームは、ダウンミックス信号(Mixed_Obj BS)、オブジェクト情報(Obj_Info BS)及びプリセット情報(Preset_Info BS)を含む統合された単一のビットストリームであり、前記オブジェクト情報及びプリセット情報は、前記ダウンミックス信号ビットストリームの付加領域に保存される。一方、図2Bを参照すると、本発明の一実施例に係るビットストリームは、多様な形態で独立的なビット列として保存及び伝送される。例えば、ダウンミックス信号(Mixed_Obj BS)は第1のビットストリーム202で伝送され、オブジェクト情報(Obj_Info BS)及びプリセット情報(Preset_Info BS)は第2のビットストリーム204で伝送される。他の一実施例で、ダウンミックス信号(Mixed_Obj BS)及びオブジェクト情報(Obj_Info BS)は第1のビットストリーム206で伝送され、プリセット情報(Preset_Info BS)のみが別途の第2のビットストリーム208で伝送される。また、他の実施例では、ダウンミックス信号(Mixed_Obj BS)、オブジェクト情報(Obj_Info BS)及びプリセット情報(Preset_Info BS)は、別個の三つのビットストリーム210,212,214で伝送される。
【0030】
このような第1のビットストリーム及び第2のビットストリーム又は別個のビットストリームは、同一又は異なるビット率で伝送され、特に、プリセット情報(Preset_Info BS)(PI)の場合、オーディオ信号の復元後、ダウンミックス信号(Mixed_Obj BS)(DMX)又はオブジェクト情報(Obj_Info BS)(OI)と別途分離されることによって保存または伝送される。
【0031】
また、本発明に係るオーディオ信号処理装置は、エンコーダから伝送されたプリセット情報(PI)の他に、ユーザからユーザ制御情報(user control information;UCI)を受信し、オブジェクト信号の利得又はパニングを調節することができる。
【0032】
図3は、本発明の実施例に係るオーディオ信号処理装置のうち情報生成ユニット110の細部構成図を示した一例である。図3を参照すると、情報生成ユニット110は、情報送受信部310、プリセット情報受信部330及び情報生成部340を含み、ユーザ制御情報(UCI)を受信するユーザインタフェース320を含む。
【0033】
情報送受信部310は、エンコーダから伝送されたビットストリームからオブジェクト情報(OI)及びプリセット情報(PI)を受信する。一方、ユーザインタフェース320は、ユーザから別個のユーザ制御情報(UCI)を受信することができ、前記ユーザ制御情報(UCI)は、ユーザプリセット情報(UPI)を含むことができる。
【0034】
ユーザインタフェース320は、ユーザ制御情報(UCI)を受信し、これは、エンコーダから入力されたプリセット情報(PI)を用いるかどうかを選択する。また、プリセット情報受信部330は、エンコーダから伝送されたプリセット情報(PI)またはユーザから受信されたユーザプリセット情報(UPI)を受信する。前記ユーザ制御情報(UCI)から前記プリセット情報(PI)を用いないように選択される場合、ユーザプリセット情報(UPI)が選択され、これが前記プリセット情報受信部330に入力されて用いられる。
【0035】
情報生成部340は、プリセット情報受信部330から受信されたプリセット情報(PI)又はユーザプリセット情報(UPI)、及び情報送受信部310から受信されたオブジェクト情報(OI)を用いてマルチチャネル情報(MI)を生成することができる。
【0036】
図4は、図3の情報生成ユニット110を含むオーディオ信号処理装置のビットストリームインタフェースを示す概略図である。本発明の一実施例によると、デコーダ410に入力されるビットストリームは、ダウンミックス信号(DMX)、オブジェクト情報(OI)、プリセット情報(PI)及びユーザプリセット情報(UPI)を含む。また、デコーダ410から出力されるビットストリームは、マルチチャネル信号(MI)及びユーザプリセット情報(UPI)を含むことができる。前記ユーザプリセット情報は、デコーダ410から出力され、メモリ420に別個に保存されて再び用いられる。
【0037】
以下では、図5〜図7を参照して、ユーザインタフェースから入力されたユーザ制御情報(UCI)を用いてエンコーダから伝送されたプリセット情報(PI)の一部のみを変形し、変形プリセット情報(MPI)を用いてマルチチャネル情報(MI)を生成する過程について具体的に説明する。
【0038】
図5は、本発明の実施例に係るオーディオ信号処理装置のうち情報生成ユニット110の細部構成図を示した一例で、図6は、図5の情報生成ユニット110を含むオーディオ信号処理装置のビットストリームインタフェースを示す概略図で、図7は、図5の情報生成ユニットを含むオーディオ信号処理装置のユーザインタフェースを示す図である。以下、図5〜図7を参照して、各構成要素及び各段階について具体的に説明する。
【0039】
まず、図5を参照すると、図3及び図4に示すように、ユーザ制御情報(UCI)が入力されることによって、エンコーダから伝送されたプリセット情報(PI)を排除し、前記ユーザ制御情報(UCI)に含まれたユーザプリセット情報(UPI)を用いてダウンミックス処理情報(DPI)及びマルチチャネル情報(MI)を生成することができる。一方、図5に示すように、ユーザ制御情報(UCI)は、エンコーダから伝送されたプリセット情報(PI)の一部のみを変形し、変形プリセット情報(MPI)を生成することができる。
【0040】
図5に示すように、情報生成ユニット110は、情報送受信部510、プリセット情報変形部530及び情報生成部540を含み、ユーザ制御情報を受信するユーザインタフェース520を含む。
【0041】
情報送受信部510は、エンコーダから伝送されたビットストリームからオブジェクト情報(OI)及びプリセット情報(PI)を受信する。一方、ユーザインタフェース520は、ユーザが各オブジェクトの利得又はパニングを制御できるように前記プリセット情報(PI)を画面に表示する。
【0042】
プリセット情報変形部530は、情報送受信部510からプリセット情報(PI)を受信し、ユーザインタフェース520から入力されたユーザ制御情報(UCI)を用いて変形プリセット情報(MPI)を生成することができる。前記変形プリセット情報(MPI)は、全体のオブジェクトに関するものでない場合があり、一部のオブジェクトに関するものである場合には、変形の対象でないオブジェクトに関するプリセット情報が変形されずに維持される。
【0043】
情報生成部540は、プリセット情報変形部530から受信された変形プリセット情報(MPI)及び情報送受信部510から受信されたオブジェクト情報(OI)を用いてマルチチャネル情報(MI)を生成することができる。
【0044】
図6は、図5の情報生成ユニット110を含むオーディオ信号処理装置のビットストリームインタフェースを示す概略図である。本発明の一実施例によると、デコーダ610に入力されるビットストリームは、ダウンミックス信号(DMX)、オブジェクト情報(OI)、プリセット情報(PI)及びユーザ制御情報(UCI)を含む。また、デコーダ610から出力されるビットストリームは、ユーザ制御情報(UCI)、変形プリセット情報(MPI)及びマルチチャネル信号(MI)を含むことができる。前記ユーザ制御情報(UCI)及び変形プリセット情報(MPI)は、デコーダ610から出力され、メモリ620に別個に保存されて再び用いられる。
【0045】
図7を参照すると、エンコーダから伝送された前記プリセット情報(PI)は、ユーザインタフェース(UI)に各オブジェクトに該当するインデックス(例えば、オブジェクト名、記号及び記号に該当するテーブル)と一緒に、音量調節器又はスイッチの形態で表示することができる。また、ユーザインタフェース(UI)の画面部は、ユーザ制御情報(UCI)によってプリセット情報(PI)を変形することによって、変形プリセット情報(MPI)に該当するオブジェクト別にプリセット情報の変形を表示することができる。また、提供されるプリセット情報(PI)として表現されるモードが多数である場合、ユーザインタフェース(UI)は、設定された多数個のプリセット情報(PI)と関連したモード情報を画面部に表示し、ユーザが選択することによって該当するモードのプリセット情報(PI)を図7のように表示することができる。
【0046】
図8は、本発明の他の実施例に係るオーディオ信号処理装置のビットストリームインタフェースを示す概略図である。図5の情報生成ユニットを含むデコーダ1 810は、ダウンミックス信号(DMX)、オブジェクト情報(OI)、プリセット情報(PI)及びユーザ制御情報(UCI)の入力を受けて、マルチチャネル信号(MI)、ユーザ制御情報(UCI)及び変形プリセット情報(MPI)を出力することができる。前記ユーザ制御情報(UCI)と変形プリセット情報(MPI)はメモリ820に別個に保存され、他のデコーダ2 830には、前記変形プリセット情報(MPI)に対応するダウンミックス信号(DMX)及びオブジェクト情報(PI)が入力される。この場合、メモリ820に保存された変形プリセット情報(MPI)を用いて、デコーダ2 830は、前記デコーダ1 810で生成されたマルチチャネル信号と同一のマルチチャネル信号を生成することができる。
【0047】
前記変形プリセット情報(MPI)は、フレーム別に異なる値を有することができ、一つの曲に対して共通の値を有することができ、特徴または製作者を記載するメタ情報を含むことができる。また、マルチチャネル信号と別個に保存または伝送されることによって、前記変形プリセット情報(MPI)のみを合法的に共有できるようになる。
【0048】
本発明の他の実施例に係るオーディオ信号処理装置は、多数個のプリセット情報(PI)を含むことができ、以下、図9を参照して、マルチチャネル情報(MI)を生成する過程について具体的に説明する。
【0049】
図9は、本発明の実施例に係るオーディオ信号処理装置のうち情報生成ユニット110の細部構成図を示す一例である。図9を参照すると、情報生成ユニット110は、情報送受信部910、プリセット情報決定部930及び情報生成部940を含み、ユーザ制御情報(UCI)を受信可能なユーザインタフェース920を含む。
【0050】
情報送受信部910は、エンコーダから伝送されたビットストリームからオブジェクト情報(OI)及び各プリセット情報(PI_n)を受信する。前記各プリセット情報(PI)は、多数個のプリセットモード、例えば、カラオケモード、R&B強調モードなどで構成される。
【0051】
一方、ユーザインタフェース920は、前記各プリセット情報(PI_n)の簡略な情報を画面にディスプレイしてユーザに提供することができ、ユーザからプリセット情報を選択するユーザ制御情報(UCI)を受信することができる。
【0052】
プリセット情報決定部930は、前記情報送受信部910から入力された各プリセット情報(PI_n)のうち前記ユーザ制御情報を用いて一つのプリセット情報(PI)を決定することができる。例えば、図9のプリセット情報_1はカラオケモードで、プリセット情報_2はR&B強調モードで、プリセット情報_3はコンサートモードで、プリセット情報_4はアコースティックモードである場合、ユーザインタフェース920に前記それぞれのプリセット情報(PI)に該当するモード名が表示される。ユーザが広い空間で聞く場合のような音場感を得たい場合、プリセット情報3を選択することができる。前記ユーザインタフェース920は、ユーザから入力されたプリセット情報3を選択するユーザ制御情報(UCI)を出力し、プリセット情報決定部930は、前記ユーザ制御情報(UCI)を用いて選択されたプリセット_3をプリセット情報(PI)として決定し、これを情報生成部940に出力する。
【0053】
情報生成部940は、プリセット情報受信部930から受信されたプリセット情報(PI)及び情報送受信部910から受信されたオブジェクト情報(OI)を用いてマルチチャネル情報(MI)を生成することができる。
【0054】
本発明に係るオーディオ信号処理装置は、エンコーダから伝送された多数個のプリセット情報(PI)及びユーザによって選択されたプリセットの情報を含むユーザ制御情報(UCI)を用いて、ユーザがオブジェクトの利得又はパニングを個別的に調節することなく、既に設定された最適のプリセット情報を選択及び適用することによってオブジェクトの利得またはパニングを調節することができる。
【0055】
以下では、エンコーダからオブジェクト情報(OI)が伝送されない場合、多数個のオブジェクト信号を含むダウンミックス信号(DMX)をデコーディングするためのオーディオ信号処理方法及び装置について、図10などの図面を参照して具体的に説明する。
【0056】
ここで、ブラインド情報(blind information;BI)は、オブジェクト情報と類似した概念を有し、デコーダの内部でエンコーダから伝送されたダウンミックス信号(DMX)を用いる形でダウンミックス信号に含まれたオブジェクト信号のレベル及び利得情報を含むことができ、関連情報またはメタ情報をさらに含むことができる。ブラインド情報(BI)の生成過程は、以下に詳細に説明する。
【0057】
図10A及び図10Bは、出力信号の位置情報を用いてブラインド情報(BI)を生成するオーディオ信号処理方法を示す概略図である。図10Aに示すように、ステレオチャネルを有する出力装置を用いる場合、聴取者は、左側及び右側のチャネルからオーディオ信号(DMX)を受信する。前記オーディオ信号が多数個のオブジェクト信号を含む場合、それぞれのオブジェクト信号は、左側または右側のチャネルに寄与する利得情報によって、空間上に位置する領域が変わり得る。
【0058】
図10Bは、位置領域によって区別されるオブジェクト信号のうち一つのオブジェクト信号を生成するために、それぞれのステレオチャネルから出力される信号の構成を示す。図10Bにおいて、オブジェクト信号sは、利得ファクタaによって決定された方向に位置する信号を表し、独立的なオブジェクト信号n1, n2は、信号sに対する周辺信号を表す。また、前記オブジェクト信号は、特定の方向情報を有してステレオチャネルに出力され、前記方向情報は、レベル差情報及び時間差情報などである。一方、前記周辺信号は、再生環境または聴覚的に感じられる幅などによって決定される。このような図10Bのステレオ出力信号は、オブジェクト信号s、周辺信号n1, n2及びオブジェクト信号の方向を決定する利得ファクタaを用いて下記の式1のように表現することができる。
【0059】
【数1】

【0060】
同時に活性化された多数個のオブジェクト信号を含む非線形的なダウンミックス信号(DMX)を効果的に分析するためには、前記式1を多数個に分割された周波数バンド及び時間領域を用いて独立的に分析すべきであり、この場合、前記x1(n)及びx2(n)は、次のように表すことができる。
【0061】
【数2】

【0062】
前記iは周波数バンドインデックスを表し、kは時間バンドインデックスを表す。
【0063】
図11は、ステレオ出力信号を分析する時間―周波数ドメインを示すグラフである。それぞれの時間―周波数領域はインデックスi及びkを含み、オブジェクト信号S、周辺信号N1及びN2、利得ファクタAは独立的に推定される。以下では、周波数バンドインデックスi及び時間バンドインデックスkを省略する。
【0064】
ダウンミックス信号(DMX)の分析のための周波数バンドの帯域幅は、特定のバンドと同一になるように選択され、ダウンミックス信号(DMX)の特性によって決定される。それぞれの周波数バンドで、S, N1, N2, Aはtミリ秒ごとに推定され、X1及びX2がダウンミックス信号(DMX)として与えられる場合、図11の時間―周波数ドメイン別分析によってS, N1, N2, Aの推定値が決定される。X1のパワーは、下記の式3のように推定される。
【0065】
【数3】

【0066】
ここで、E{.}は平均を表す。
【0067】
N1及びN2のパワーは同一のものと仮定し、外部で影響を及ぼす従属的な信号も、ステレオチャネルの左側及び右側のチャネルで同一のパワーを有するものと仮定する。
【0068】
また、ダウンミックス信号(DMX)が時間―周波数ドメインで表現される場合、利得情報(A)、オブジェクト信号のパワー(PS)、周辺信号のパワー(PN)及び正規化された交差相関関係(φ)を測定できるようになる。ステレオチャネル間の正規化された交差相関関係は、下記の式4のように表すことができる。
【0069】
【数4】

【0070】
A, PS, PNは、測定されたPX1, PX2, φを用いて決定される。前記PX1, PX2, φに関する関係は、次の式5に示す通りである。
【0071】
【数5】

【0072】
前記式5をA, PS, PNに関して整理した結果を下記の式6に示す。
【0073】
【数6】

【0074】
図12A及び図12Bは、エンコーダから伝送されるダウンミックス信号(DMX)からブラインド情報(BI)を生成する過程を示すブロック図及びフローチャートである。まず、ステレオチャネルを有するダウンミックス信号(x1(n), x2(n))は、フィルタバンク分析部1210に入力され、各時間―周波数ドメイン別信号(x1(i,k), x2(i,k))に変換される(S1200)。前記変換されたダウンミックス信号(x1(i,k), x2(i,k))は、利得情報推定部1220に入力され、利得情報推定部1220は、変換されたダウンミックス信号(x1(i,k), x2(i,k))を分析し、オブジェクト信号の利得情報(A)を推定し(S1210)、ダウンミックス出力信号のうちオブジェクト信号の位置を決定する(S1220)。このとき、前記推定された利得情報(A)は、ダウンミックス信号に含まれたオブジェクト信号がダウンミックス出力信号のステレオチャネルに寄与する程度を表すもので、ダウンミックス信号の出力時、それぞれ異なる位置に存在する信号は別個のオブジェクト信号と判断し、一つのオブジェクト信号は、一つの利得情報を有するものと仮定する。オブジェクトレベル推定部1230は、前記利得情報推定部1220から出力された利得情報(A)及び位置情報を用いて、各位置に対応するオブジェクト信号のレベル(Ps)を推定するようになり(S1230)、ブラインド情報生成部1240は、利得情報及びオブジェクト信号のレベルを用いてブラインド情報(SOLD)(BI)を生成するようになる(S1240)。
【0075】
ブラインド情報(BI)は、ブラインド相関情報(blind correlation information;BCI)及びブラインド利得情報(blind gain information;BGI)をさらに含むことができる。前記ブラインド相関情報(BCI)は、二つのオブジェクト間の相関性を表すもので、推定された利得情報及びオブジェクト信号のレベルを用いて生成される。
【0076】
図13は、本発明の一実施例に係るオーディオ信号処理装置を示す構成図である。本発明の実施例に係るオーディオ信号処理装置1300は、情報生成ユニット1210、ダウンミックス処理ユニット1220及びマルチチャネルデコーダ1230を含む。ダウンミックス処理ユニット1220及びマルチチャネルデコーダ1230は、図1のダウンミックス処理ユニット120及びマルチチャネルデコーダ130と構成及び役割が同一であるので、それに関する説明は省略することにする。
【0077】
図13を参照すると、情報生成ユニット1210は、エンコーダからダウンミックス信号(DMX)、オブジェクト情報(OI)及びプリセット情報(PI)の入力を受けて、ダウンミックス処理情報(DPI)及びマルチチャネル情報(MI)を生成し、大きくブラインド情報生成部1211及び情報生成部1212を含む。
【0078】
エンコーダからオブジェクト情報(OI)が伝送される場合、ブラインド情報生成部1211は、ブラインド情報(BI)を生成することなく、情報生成部1212は、図1を参照して説明したように、伝送されたオブジェクト情報(OI)を用いてダウンミックス処理情報及びマルチチャネル情報を生成する。
【0079】
一方、情報生成ユニット1210にオブジェクト情報(OI)が伝送されない場合、図11〜図12Bを参照して説明したように、ブラインド情報生成部1211は、ダウンミックス信号(DMX)を受信し、ダウンミックス信号を時間―周波数ドメイン別信号(x1(i,k), x2(i,k))に変換し、変換されたダウンミックス信号から別個の位置に存在する信号を一つのオブジェクト信号と把握し、オブジェクト信号の利得情報(A)を推定し、利得情報(A)を用いてオブジェクト信号のレベルを推定することによってブラインド情報(BI,SOLD)を生成する。
【0080】
図14は、ブラインド情報生成部1211を含む情報生成ユニット1210の細部構成図である。図14を参照すると、情報生成ユニット1210は、大きくフィルタバンク1310、ブラインド情報推定部1320及び情報生成部1330を含み、フィルタバンク1310は、ダウンミックス信号を時間―周波数ドメイン別信号に変換し、ブラインド情報(BI)を生成するための分析が可能になるようにする。前記フィルタバンク1310によって時間―周波数ドメイン別信号(x1(i,k), x2(i,k))に変換されたダウンミックス信号(DMX)は、ブラインド情報推定部1320に入力され、位置情報、オブジェクト信号の利得情報(A)、オブジェクト信号のレベル(Ps)を用いてダウンミックス信号(DMX)のデコーディングのためのブラインド情報(SOLD)を生成する。一方、情報生成部1330は、前記ブラインド情報(BI)(SOLD)及びプリセット情報(PI)を用いてマルチチャネル情報を生成する。
【0081】
図15は、図14の情報生成ユニットを含むオーディオ信号処理装置のビットストリームインタフェースを示す概略図である。本発明の一実施例によると、デコーダ1510に入力されるビットストリームは、ダウンミックス信号(DMX)、プリセット情報(PI)及びユーザ制御情報(UCI)を含む。前記ユーザ制御情報(UCI)は、エンコーダから伝送されたプリセット情報(PI)の代わりに用いられるユーザプリセット情報(UPI)であり、プリセット情報(PI)を一部変形するための制御情報(UCI)である。また、オブジェクト信号(OI)は入力されることなく、デコーダ1510の内部にブラインド情報生成部(図示せず)を含む。デコーダ1510から出力されるビットストリームは、マルチチャネル信号(MI)及びブラインド情報(BI)を含むことができる。前記ブラインド情報(BI)は、デコーダ1510から出力され、メモリ1520に別個に保存されて再び用いられる。
【0082】
図16は、本発明の実施例に係るオーディオ信号処理装置1600の構成を示す図である。図16を参照すると、本発明の実施例に係るオーディオ信号処理装置1600は、情報生成ユニット1610、ユーザインタフェース1620、ダウンミックス処理ユニット1630及びマルチチャネルデコーダ1640を含む。
【0083】
情報生成ユニット1610は、ブラインド情報生成部1612、情報送受信部1614及び情報生成部1616を含み、前記ブラインド情報生成部1612は、エンコーダからオブジェクト情報(OI)が伝送されない場合、ダウンミックス信号(DMX)を用いてブラインド情報(BI)を生成する。一方、情報送受信部1614は、ブラインド情報(BI)またはオブジェクト情報(OI)の入力を受けて、ユーザインタフェース1620からユーザ制御情報(UCI)を受信し、エンコーダからプリセット情報(PI)を受信する。また、情報生成部1616は、前記情報送受信部1614から受信されたプリセット情報(PI)、ユーザ制御情報(UCI)、ブラインド情報(BI)(またはオブジェクト情報(OI))を用いてマルチチャネル情報(MI)及びダウンミックス処理情報(DPI)を生成する。
【0084】
ダウンミックス処理ユニット1630は、エンコーダから伝送されたダウンミックス信号(DMX)及び情報生成ユニットから入力されたダウンミックス処理情報(DPI)を用いて、処理されたダウンミックス(PDMX)を生成し、マルチチャネルデコーダ1640は、前記処理されたダウンミックス(PDMX)及びマルチチャネル情報(MI)を用いてマルチチャネル信号(channel_1、channel_2、…、channel_n)を生成する。
【0085】
このように、本発明の他の実施例に係るオーディオ信号処理方法及び装置は、エンコーダからオブジェクト情報(OI)が伝送されない場合にも、ブラインド情報(BI)を生成し、プリセット情報(PI)を用いて容易に多様なモードでオブジェクト信号の利得及びパニングを調節することができる。
【0086】
以上のように、本発明について、限定された実施例及び図面によって説明したが、これによって限定されるものではなく、本発明の属する技術分野で通常の知識を有する者によって本発明の技術思想及び特許請求の範囲の均等の範囲内で多様な修正及び変形が可能であることは当然である。
【産業上の利用可能性】
【0087】
本発明は、オーディオエンコーディング及びデコーディングを行うときに適用可能である。

【特許請求の範囲】
【請求項1】
ダウンミックス信号、オブジェクト情報及びプリセット情報を受信し、
前記オブジェクト情報及びプリセット情報を用いてダウンミックス処理情報を生成し、
前記ダウンミックス処理情報を用いて前記ダウンミックス信号を処理し、
前記オブジェクト情報及びプリセット情報を用いてマルチチャネル情報を生成し、
前記オブジェクト情報は、オブジェクトレベル情報、オブジェクト関連情報及びオブジェクト利得情報のうちいずれか一つ以上を含み、
前記オブジェクトレベル情報は、前記オブジェクトレベルのうちの一つを用いてオブジェクトに対応するオブジェクトレベルを正規化することによって生成され、
前記オブジェクト関連情報は、二つの選択されたオブジェクトの組み合わせから生成され、前記オブジェクト利得情報は、ダウンミックス信号を生成するために、それぞれのダウンミックス信号のチャネルに対するオブジェクトの寄与度を決定し、
前記プリセット情報は、ビットストリームから抽出されることを特徴とするオーディオ信号の処理方法。
【請求項2】
前記プリセット情報は、前記ダウンミックス信号及びオブジェクト情報のうちいずれか一つ以上の情報と別途のビットストリームから抽出される、請求項1に記載のオーディオ信号の処理方法。
【請求項3】
前記プリセット情報は、オブジェクト別利得ファクタを含む、請求項1に記載のオーディオ信号の処理方法。
【請求項4】
前記利得ファクタは、時間によって変化する、請求項3に記載のオーディオ信号の処理方法。
【請求項5】
前記利得ファクタは、周波数別に変化する、請求項3に記載のオーディオ信号の処理方法。
【請求項6】
前記プリセット情報は、始点情報、前記始点での利得ファクタ、終点情報及び前記終点での利得ファクタを含む、請求項3に記載のオーディオ信号の処理方法。
【請求項7】
さらに、前記プリセット情報を変更または選択するユーザ制御情報を受信する、請求項1に記載のオーディオ信号の処理方法。
【請求項8】
前記ユーザ制御情報は、前記プリセット情報を用いる、請求項7に記載のオーディオ信号の処理方法。
【請求項9】
前記プリセット情報を用いない場合、
ユーザからユーザプリセット情報を受信し、
前記オブジェクト情報及びユーザプリセット情報を用いてダウンミックス信号を処理し、
前記オブジェクト情報及びプリセット情報を用いてマルチチャネル情報を生成する、請求項8に記載のオーディオ信号の処理方法。
【請求項10】
さらに、前記ユーザプリセット情報を出力し、
前記ユーザプリセット情報を保存する、請求項9に記載のオーディオ信号の処理方法。
【請求項11】
さらに、前記ユーザ制御情報の入力を受けて変形プリセット情報を生成し、
前記変形プリセット情報を出力し、
前記変形プリセット情報を保存する、請求項7に記載のオーディオ信号の処理方法。
【請求項12】
前記変形プリセット情報が一部のオブジェクトに関するものである場合、その他のオブジェクトに関するプリセット情報は変形されない、請求項11に記載のオーディオ信号の処理方法。
【請求項13】
さらに、前記プリセット情報が変形されたという事実をオブジェクト別に表示する、請求項11に記載のオーディオ信号の処理方法。
【請求項14】
前記プリセット情報が二つ以上である場合、さらに、選択情報を受信し、
前記マルチチャネル情報の生成は、選択されたプリセット情報を用いることによって行われる、請求項1に記載のオーディオ信号の処理方法。
【請求項15】
さらに、前記プリセット情報に関するメタ情報を受信し、
前記メタ情報をユーザインタフェースに表示する、請求項1に記載のオーディオ信号の処理方法。
【請求項16】
前記ダウンミックス信号は、放送信号を通して受信される、請求項1に記載のオーディオ信号の処理方法。
【請求項17】
前記ダウンミックス信号は、デジタル媒体を通して受信される、請求項1に記載のオーディオ信号の処理方法。
【請求項18】
請求項1に記載の段階を行うためのプログラムが記録されたコンピュータ読取可能記録媒体。
【請求項19】
ダウンミックス信号、オブジェクト情報及びプリセット情報を受信する情報送受信部と、
前記オブジェクト情報及びプリセット情報を用いてダウンミックス処理情報を生成するダウンミックス処理情報生成部と、
前記ダウンミックス処理情報を用いて前記ダウンミックス信号を処理するダウンミックス信号処理部と、
前記オブジェクト情報及びプリセット情報を用いてマルチチャネル情報を生成するマルチチャネル情報生成部と、を含むことを特徴とするオーディオ信号の処理装置。

【図1】
image rotate

【図2A】
image rotate

【図2B】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10A】
image rotate

【図10B】
image rotate

【図11】
image rotate

【図12A】
image rotate

【図12B】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate


【公表番号】特表2010−521115(P2010−521115A)
【公表日】平成22年6月17日(2010.6.17)
【国際特許分類】
【出願番号】特願2009−553513(P2009−553513)
【出願日】平成20年3月7日(2008.3.7)
【国際出願番号】PCT/KR2008/001312
【国際公開番号】WO2008/111770
【国際公開日】平成20年9月18日(2008.9.18)
【出願人】(502032105)エルジー エレクトロニクス インコーポレイティド (2,269)
【Fターム(参考)】