説明

マルチオブジェクトオーディオ符号化および復号化方法とその装置

【課題】本発明はオーディオ符号化および復号化方法とその装置に関するもので、より一層詳細にマルチオブジェクトオーディオ符号化および復号化方法とその装置に関するものである。
【解決手段】本発明によるマルチオブジェクトオーディオ符号化方法は主オーディオオブジェクトと副オーディオオブジェクトをダウンミックスしてダウンミックス信号および残余信号(residual signal)を生成するステップと、ダウンミックス信号および残余信号を含むビットストリームを生成するステップとを含む。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、オーディオ符号化および復号化方法とその装置に関するもので、より詳細には、マルチオブジェクトオーディオ符号化および復号化方法とその装置に関するものである。
【0002】
本発明は、情報通信部および情報通信研究振興院の情報通信標準開発支援の一環として行われた研究から導出されたものである。[課題管理番号:2007−S−004−01、課題名:眼鏡なし個人型3D放送技術開発(Development of Glassless Single−User 3D Broadcasting Technologies)]
【背景技術】
【0003】
空間キューを基盤とした空間オーディオ符号化(SAC:Spatial Audio coding)方法は、関連した従来技術に係るオーディオ信号を圧縮及び復元する方法として導入された。SACは、マルチチャネルオーディオ符号化のために発展した技術であった。
【0004】
一般に、従来のオーディオ技術は、ユーザが受動的にオーディオコンテンツを聴くことのみを可能にする機能的制約を有する。それ故に、従来のオーディオ技術は、様々なオーディオサービスをユーザに提供することができなかった。
【発明の概要】
【発明が解決しようとする課題】
【0005】
本発明の実施形態は、多様なオーディオサービスを効率的に提供する符号化および復号化方法ならびにその装置を提供することを目的とする。
【0006】
本発明の他の目的および長所は、下記の説明によって理解可能であり、本発明の実施形態によって分明に知り得るものである。また、本発明の目的および長所は、特許請求の範囲に示した手段およびその組合せによって実現される可能性があることを容易に知ることができるであろう。
【課題を解決するための手段】
【0007】
本発明の態様によると、主オーディオオブジェクトと副オーディオオブジェクトをダウンミックスしてダウンミックス信号および残余信号を生成するステップと、ダウンミックス信号および残余信号を含むビットストリームを生成するステップとを含むマルチオブジェクトオーディオ符号化方法が提供される。
【0008】
本発明の他の態様によると、マルチオブジェクトオーディオ符号化方法は、モノ主オーディオオブジェクトとモノ副オーディオオブジェクトをダウンミックスしてダウンミックス信号および残余信号を生成するステップと、ダウンミックス信号および残余信号を含むビットストリームを生成するステップとを含むマルチオブジェクトオーディオ符号化方法が提供される。
【0009】
本発明の他の態様によると、ステレオ主オーディオオブジェクトとモノ副オーディオオブジェクトをダウンミックスしてダウンミックス信号と残余信号を生成するステップと、ダウンミックス信号と残余信号を含むビットストリームを生成するステップとを含むマルチオブジェクトオーディオ符号化方法が提供される。
【0010】
本発明の他の態様によると、ステレオ主オーディオオブジェクトとステレオ副オーディオオブジェクトをダウンミックスしてダウンミックス信号および残余信号を生成するステップと、ダウンミックス信号と残余信号を含むビットストリームを生成するステップとを含むマルチオブジェクトオーディオ符号化方法が提供される。
【0011】
本発明の他の態様によると、主オーディオオブジェクトと副オーディオオブジェクトがダウンミックスされたダウンミックス信号およびダウンミックスによる残余信号を含むビットストリームを受信するステップと、残余信号を利用してダウンミックス信号から主オーディオオブジェクトと副オーディオオブジェクトを復元するステップとを含むマルチオブジェクトオーディオ符号化方法が提供される。
【0012】
本発明の他の態様によると、モノ主オーディオオブジェクトとモノ副オーディオオブジェクトがダウンミックスされたダウンミックス信号およびダウンミックスによる残余信号を含むビットストリームを受信するステップと、残余信号を利用してダウンミックス信号から主オーディオオブジェクトおよび副オーディオオブジェクトを復元するステップとを含むマルチオブジェクトオーディオ符号化方法が提供される。
【0013】
本発明の他の態様によると、ステレオ主オーディオオブジェクトとモノ副オーディオオブジェクトがダウンミックスされたダウンミックス信号およびダウンミックスによる残余信号を含むビットストリームを受信するステップと、残余信号を利用してダウンミックス信号からステレオ主オーディオオブジェクトとモノ副オーディオオブジェクトを復元するステップとを含むマルチオブジェクトオーディオ符号化方法が提供される。
【0014】
本発明の他の態様によると、ステレオ主オーディオオブジェクトとステレオ副オーディオオブジェクトがダウンミックスされたダウンミックス信号およびダウンミックスによる残余信号を含むビットストリームを受信するステップと、残余信号を利用してダウンミックス信号からステレオ主オーディオオブジェクトとステレオ副オーディオオブジェクトを復元するステップとを含むマルチオブジェクトオーディオ符号化方法が提供される。
【0015】
本発明の他の態様によると、主オーディオオブジェクトと副オーディオオブジェクトをダウンミックスしてダウンミックス信号および残余信号を生成するダウンミックス生成部と、ダウンミックス信号および残余信号を含むビットストリームを生成するビットストリーム生成部とを備えるマルチオブジェクトオーディオ符号化装置が提供される。
【0016】
本発明の他の態様によると、モノ主オーディオオブジェクトとモノ副オーディオオブジェクトをダウンミックスしてダウンミックス信号および残余信号を生成するダウンミックス生成部と、ダウンミックス信号および残余信号を含むビットストリームを生成するビットストリーム生成部とを備えるマルチオブジェクトオーディオ符号化装置が提供される。
【0017】
本発明の他の態様によると、ステレオ主オーディオオブジェクトとモノ副オーディオオブジェクトをダウンミックスしてダウンミックス信号と残余信号を生成するダウンミックス生成部と、ダウンミックス信号と残余信号を含むビットストリームを生成するビットストリーム生成部とを備えるマルチオブジェクトオーディオ符号化装置が提供される。
【0018】
本発明の他の態様によると、ステレオ主オーディオオブジェクトとステレオ副オーディオオブジェクトをダウンミックスしてダウンミックス信号および残余信号を生成するダウンミックス生成部と、ダウンミックス信号と残余信号を含むビットストリームを生成するビットストリーム生成部とを備えるマルチオブジェクトオーディオ符号化装置が提供される。
【0019】
本発明の他の態様によると、主オーディオオブジェクトと副オーディオオブジェクトがダウンミックスされたダウンミックス信号およびダウンミックスによる残余信号を含むビットストリームを受信する受信部と、残余信号を利用してダウンミックス信号から主オーディオオブジェクトと副オーディオオブジェクトを復元する復元部とを備えるマルチオブジェクトオーディオ符号化装置が提供される。
【0020】
本発明の他の態様によると、モノ主オーディオオブジェクトとモノ副オーディオオブジェクトがダウンミックスされたダウンミックス信号およびダウンミックスによる残余信号を含むビットストリームを受信する受信部と、残余信号を利用してダウンミックス信号から主オーディオオブジェクトおよび副オーディオオブジェクトを復元する復元部とを備えるマルチオブジェクトオーディオ符号化装置が提供される。
【0021】
本発明の他の態様によると、ステレオ主オーディオオブジェクトとモノ副オーディオオブジェクトがダウンミックスされたダウンミックス信号およびダウンミックスによる残余信号を含むビットストリームを受信する受信部と、残余信号を利用してダウンミックス信号からステレオ主オーディオオブジェクトとモノ副オーディオオブジェクトを復元する復元部とを備えるマルチオブジェクトオーディオ符号化装置が提供される。
【0022】
本発明の他の態様によると、ステレオ主オーディオオブジェクトとステレオ副オーディオオブジェクトがダウンミックスされたダウンミックス信号およびダウンミックスによる残余信号を含むビットストリームを受信する受信部と、残余信号を利用してダウンミックス信号からステレオ主オーディオオブジェクトとステレオ副オーディオオブジェクトを復元する復元部とを備えるマルチオブジェクトオーディオ符号化装置が提供される。
【0023】
上述した目的、特徴および長所は添付された図面と関連した次の詳細な説明によって、より明確になるものであり、それに応じて本発明が属する技術分野で通常の知識を有する者が本発明の技術的思想を容易に実施できるであろう。また、本発明を説明するにおいて本発明と関連した公知技術に対する具体的な説明が本発明の要旨を不必要にぼかし得ると判断される場合にその詳細な説明を省略するものとする。以下、添付した図面を参照し本発明による好ましい実施形態を詳細に説明する。
【発明の効果】
【0024】
本発明に係る符号化及び復号化方法及び装置は、多様なオーディオサービスを効率的に提供することができる。
【図面の簡単な説明】
【0025】
【図1】本発明の第1の概念を説明するための図である。
【図2】本発明の第2の概念を説明するための図である。
【図3】図2に示された第1のダウンミックス生成部203を詳細に説明するための図である。
【図4】本発明による第1の実施形態を説明するための図である。
【図5】本発明による第2の実施形態を説明するための図である。
【図6】本発明による第3の実施形態を説明するための図である。
【図7】本発明による第4の実施形態を説明するための図である。
【図8】本発明による復号化を説明するための図である。
【図9】本発明の具体的な実施形態を説明するための図である。
【発明を実施するための形態】
【0026】
以下の説明は、単に本発明の原理を例示する。当業者は、たとえ本明細書に明確に説明されたり示されていなくとも、本発明の原理を具現して本発明の概念と範囲に含まれた多様な装置を発明できるものである。また、本明細書に列挙されたすべての条件付き用語および実施形態は原則的に、本発明の概念が理解されるようにするための目的にのみ明確に意図され、このように特別に列挙された実施形態および形態に制限的でないものと理解されなければならない。
【0027】
また、本発明の原理、観点および実施形態だけでなく特定実施形態を列挙するすべての詳細な説明は、このような事項の構造的および機能的均等物を含むように意図されたものと理解されなければならない。またこのような均等物は現在公知された均等物だけでなく将来に開発される均等物すなわち構造と関係がなく同一の機能を遂行するように発明されたすべての素子を含むものと理解されなければならない。
【0028】
したがって、例えば、本明細書のブロック図は本発明の原理を具体化する例示的な回路の概念的な観点を示すものと理解されなければならない。これと類似して、すべてのフローチャート、状態変換図、疑似コードなどはコンピュータが判読可能な媒体に実質的に示すことができコンピュータまたはプロセッサが明確に示されたのかの可否を問わず、コンピュータまたはプロセッサによって行われる多様なプロセスを示すものと理解されなければならない。
【0029】
プロセッサまたはこれと類似の概念と表示された機能ブロックを含む図に示された多様な素子の機能は、専用ハードウェアだけでなく適切なソフトウェアと関連してソフトウェアを実行する能力を有するハードウェアの使用で提供可能である。プロセッサによって提供される時、前記機能は単一専用プロセッサ、単一共有プロセッサまたは複数の個別的プロセッサによって提供可能であり、これらのうち一部は共有可能である。
【0030】
またプロセッサ、制御またはこれと類似の概念で提示される用語の明確な使用はソフトウェアを実行する能力を有するハードウェアを排他的に引用して解釈してはならず、制限なしでデジタル信号プロセッサ(DSP)ハードウェア、ソフトウェアを保存するためのROM、RAMおよび非揮発性メモリを暗示的に含むものと理解されなければならない。周知慣用の他のハードウェアも含むことができる。
【0031】
本明細書の請求の範囲で、詳細な説明に記載された機能を遂行するための手段と表現された構成要素は、例えば前記機能を遂行する回路素子の組合せまたはファームウェア/マイクロコードなどを含むすべての形式のソフトウェアを含む機能を遂行するすべての方法を含むものと意図され、前記機能を遂行するように前記ソフトウェアを実行するための適切な回路と結合される。このような請求の範囲によって定義される本発明は多様に列挙された手段によって提供される機能が結合して請求項が要求する方式と結合されるため前記機能を提供可能ないかなる手段も本明細書から把握されるものと均等なものに理解されなければならない。
【0032】
上述した目的、特徴および長所は添付された図面と関連した後の詳細な説明によってより明確になるものであり、それに応じて本発明が属する技術分野で通常の知識を有する者が本発明の技術的思想を容易に実施できるだろう。また、本発明を説明するにおいて本発明と関連した公知技術に対する具体的な説明が本発明の要旨を不必要にぼかし得ると判断される場合にその詳細な説明を省略するものとする。以下、添付された図面を参照して本発明による好ましい実施形態を詳細に説明する。
【0033】
本発明は、マルチオブジェクトオーディオの符号化及び復号化技術に関するものである。マルチオブジェクトオーディオは、オーディオコンテンツを構成する複数個のオーディオオブジェクトを含むことができる。例えば、伴奏またはバックミュージックとボーカルで構成されるオーディオコンテンツにおいて、伴奏またはバックミュージックが1つのオーディオオブジェクトであり、ボーカルがまた他のオーディオオブジェクトの場合がこれに該当しうる。伴奏またはバックミュージックは、ピアノ、ドラム、その他のように、それぞれの楽器によるオーディオオブジェクトに細分化することができる。マルチオブジェクトオーディオ符号化はこのような相異したオーディオオブジェクトらを圧縮する技術であり、マルチオブジェクトオーディオ復号化は符号化されたマルチオブジェクトオーディオを復号化する技術である。したがって、複数のオーディオオブジェクトをオブジェクト別にオーディオ符号化または復号化することになれば、ユーザにより能動的なサービスを提供できることになる。すなわち、ユーザの要請により各オーディオオブジェクトを制御できるだけでなく1つのオーディオコンテンツを構成する複数のオーディオオブジェクトを組み合わせることによって多様なオーディオサービスおよびコンテンツ創出が可能になる。
【0034】
本発明では、マルチオブジェクトオーディオの符号化と復号化のために残余信号を利用することができる。ここで、残余信号とは、任意の信号に対して予測前と予測後の信号差を意味する。これは下記の数1のように定義されうる。
X(t)−X’(t)=Xresidual(t) 数1
ここで、X(t)は、予測前の原信号であり、X’(t)は、予測後の予測信号であり、Xresidual(t)は、原信号と予測信号の差を意味する。
【0035】
残余信号を利用したマルチオブジェクトオーディオの符号化は、以下に説明されることになる。例えば、第1のオーディオオブジェクト及び第2のオーディオオブジェクトを含むマルチオブジェクトオーディオの場合、第1のオーディオオブジェクトと第2のオーディオオブジェクトとをダウンミックスしてダウンミックス信号を生成する。第1のオーディオオブジェクト及び第2のオーディオオブジェクトは、第1の予測オーディオオブジェクトと第2の予測オーディオオブジェクトで予測可能である。ここで、第1のオーディオオブジェクト及び第2のオーディオオブジェクトは原信号であり、第1の予測オーディオオブジェクト及び第2の予測オーディオオブジェクトは予測信号である。原信号及び予測信号を利用して残余信号を生成することができる。したがって、本発明の例示的な実施形態に係る第1のオーディオオブジェクトと第2のオーディオオブジェクトとをダウンミックスして、ダウンミックス信号及び残余信号を生成することができる。本発明の例示的な実施形態に係るマルチオブジェクトオーディオ復号化では、符号化と反対の過程が行われる。すなわち、ダウンミックス信号と残余信号を利用して第1のオーディオオブジェクトと第2のオーディオオブジェクトを復元することになる。
【0036】
本発明の実施形態によるマルチオブジェクトオーディオ符号化方法は、主オーディオオブジェクトと副オーディオオブジェクトとをダウンミックスしてダウンミックス信号および残余信号を生成するステップと、ダウンミックス信号および残余信号を含むビットストリームを生成するステップとを含む。ここで、主オーディオオブジェクトは、第1の主オーディオオブジェクトおよび第2の主オーディオオブジェクトを含み、ダウンミックス信号と残余信号とを生成するステップは、副オーディオオブジェクトと第1の主オーディオオブジェクトとをダウンミックスして第1のダウンミックス信号および第1の残余信号を生成するステップと、第1のダウンミックス信号と第2の主オーディオオブジェクトとをダウンミックスして第2のダウンミックス信号および第2の残余信号を生成するステップとを含むことができる。ここで、ダウンミックス信号および残余信号を生成するステップは、第2の主オーディオオブジェクトをバイパスするステップをさらに含むことができる。
【0037】
本発明によるオーディオ符号化装置は、主オーディオオブジェクトと副オーディオオブジェクトをダウンミックスしてダウンミックス信号および残余信号を生成するダウンミックス生成部と、ダウンミックス信号および残余信号を含むビットストリームを生成するビットストリーム生成部とを備える。ここで、主オーディオオブジェクトは、第1の主オーディオオブジェクトおよび第2の主オーディオオブジェクトを含み、ダウンミックス信号と残余信号を生成するステップは、副オーディオオブジェクトと第1の主オーディオオブジェクトをダウンミックスして第1のダウンミックス信号および第1の残余信号を生成する第1のダウンミックス生成部と、第1のダウンミックス信号と第2の主オーディオオブジェクトをダウンミックスして第2のダウンミックス信号および第2の残余信号を生成する第2のダウンミックス生成部とを備えることができる。ここで、第1のダウンミックス生成部は、第2の主オーディオオブジェクトをバイパスすることができる。
【0038】
本発明によるマルチオブジェクトオーディオ復号化方法は、主オーディオオブジェクトと副オーディオオブジェクトがダウンミックスされたダウンミックス信号およびダウンミックスによる残余信号を含むビットストリームを受信するステップと、残余信号を利用してダウンミックス信号から主オーディオオブジェクトと副オーディオオブジェクトを復元するステップとを含む。ここで、主オーディオオブジェクトは、第1の主オーディオオブジェクトおよび第2の主オーディオオブジェクトを含み、残余信号は、第1の主オーディオオブジェクトに対する第1の残余信号および第2の主オーディオオブジェクトに対する第2の残余信号を含み、復元するステップは、ダウンミックス信号と第1の残余信号を利用して第1の主オーディオオブジェクトを復元するステップと、第1の主オーディオオブジェクトが復元された後のダウンミックス信号と第2の残余信号を利用して第2の主オーディオオブジェクトを復元するステップとを含むことができる。
【0039】
本発明によるマルチオブジェクトオーディオ復号化装置は、主オーディオオブジェクトと副オーディオオブジェクトがダウンミックスされたダウンミックス信号およびダウンミックスによる残余信号を含むビットストリームを受信する受信部と、残余信号を利用してダウンミックス信号から主オーディオオブジェクトと副オーディオオブジェクトを復元する復元部とを備える。ここで、主オーディオオブジェクトは、第1の主オーディオオブジェクトおよび第2の主オーディオオブジェクトを含み、残余信号は、第1の主オーディオオブジェクトに対する第1の残余信号および第2の主オーディオオブジェクトに対する第2の残余信号を含み、復元部は、ダウンミックス信号と第1の残余信号を利用して第1の主オーディオオブジェクトを復元する第1の復元部と、第1の主オーディオオブジェクトが復元された後のダウンミックス信号と第2の残余信号を利用して第2の主オーディオオブジェクトを復元する第2の復元部とを備えることができる。
【0040】
オーディオオブジェクトには、モノ(mono)信号を含むモノオーディオオブジェクトとステレオ信号を含むステレオオーディオオブジェクトが含まれる。ここで、ステレオオーディオオブジェクトは、左側チャネルの信号と右側チャネルの信号を含むことができる。
【0041】
一方、副オーディオオブジェクトは、ステレオオーディオオブジェクトがモノオーディオオブジェクトにダウンミックスされたオーディオオブジェクトでありえ、またはモノオーディオオブジェクトがステレオオーディオオブジェクトにダウンミックスされたオーディオオブジェクトでありうる。したがって、副オーディオオブジェクトは、複数のモノオーディオオブジェクトが、ステレオオーディオオブジェクトまたは複数のステレオオーディオオブジェクトが1つのモノオーディオオブジェクトにダウンミックスされたものでありうる。もちろん、副オーディオオブジェクトは、複数個でありうる。また、副オーディオオブジェクトは、複数のモノオーディオオブジェクトまたはステレオオーディオオブジェクトが1つのステレオオーディオオブジェクトにダウンミックスされたものでありうる。もちろん、ここでも副オーディオオブジェクトは、複数個でありうる。主オーディオオブジェクトも副オーディオオブジェクトと同様にステレオオーディオオブジェクトがモノオーディオオブジェクトにダウンミックスされたオーディオオブジェクトでありえ、またはモノオーディオオブジェクトがステレオオーディオオブジェクトにダウンミックスされたオーディオオブジェクトでありうる。
【0042】
本発明は、残余信号を利用してマルチオブジェクトオーディオを符号化または復号化することによって、オーディオオブジェクトを能動的に制御することができる。また、モノまたはステレオオーディオオブジェクトで構成されるマルチオブジェクトオーディオを効率的に符号化または復号化することができる。
【0043】
以下、主オーディオオブジェクトと副オーディオオブジェクトで構成されたマルチオブジェクトオーディオに対して説明する。主オーディオオブジェクトは、制御しようとするオーディオオブジェクトを意味するものであるが、主オーディオオブジェクトと副オーディオオブジェクトは、互いに変更可能である。また主オーディオオブジェクトと副オーディオオブジェクトは、複数のオーディオオブジェクトを含むことができる。
【0044】
図1は、本発明の第1の概念を説明するための図である。図1を参照すれば、主オーディオオブジェクト(FGO:ForeGround Object)と副オーディオオブジェクト(BGO:BackGround Object)は、ダウンミックス生成部101に入力される。図1において、主オーディオオブジェクトFGOは、第1の主オーディオオブジェクトFGO1と第2の主オーディオオブジェクトFGO2を含む。
【0045】
まず、副オーディオオブジェクトBGO及び第1の主オーディオオブジェクトFGO1は、第1のダウンミックス生成部103に入力される。第1のダウンミックス生成部103では、副オーディオオブジェクトBGOと第1の主オーディオオブジェクトFGO1とをダウンミックスして第1のダウンミックス信号と第1の残余(Residual)信号を生成する。
【0046】
第2のダウンミックス生成部105は、第1のダウンミックス信号と第2の主オーディオオブジェクトFGO2の入力を受ける。第2のダウンミックス生成部105は、第1のダウンミックス信号と第2の主オーディオオブジェクトFGO2とをダウンミックスして第2のダウンミックス信号DMXと第2の残余信号を生成する。
【0047】
図1において、2つの主オーディオオブジェクトFGO1、FGO2が入力されているが、当業者であれば3つ以上の主オーディオオブジェクトが入力される場合もあることは自明である。主オーディオオブジェクトが3つ以上の場合、増加した主オーディオオブジェクトの個数の分だけ、第1及び第2のダウンミックス生成部103、105がカスケードで連結されて増加する。
【0048】
残余信号を除外すれば、第1のダウンミックス生成部103および第2のダウンミックス生成部105は、2つの信号を受信し、1つのダウンミックス信号を出力する。例えば、第1のダウンミックス生成部103は、副オーディオオブジェクトBGOと第1の主オーディオオブジェクトFGO1を受信し、第1のダウンミックス信号を出力する。したがって、第1のダウンミックス生成部103は、入力が2つで、出力が1つのインバースOTT−1(:One To Two)構造を有するようになる。ここで、OTT−1は、符号化の観点から定義したものである。復号化の観点では、OTT−1は、OTTと等しい。これらを第1のダウンミックス生成部103および第2のダウンミックス生成部105を含むダウンミックス生成部101に拡張させ、3つ以上の主オーディオオブジェクトFGOが入力される場合、入力がNで、出力が1つのインバースOTN−1(Inverse One To N)構造を有するようになる。ここで、OTN−1は、符号化の観点で定義したものである。復号化の観点では、OTN−1は、OTNと等しい。復号化過程は、前述した符号化過程の逆順で行われる。
【0049】
図2は、本発明の第2の概念を説明するための図である。図2を参照すれば、全体的な構成は前述した図1と類似する。しかしながら、第1のダウンミックス生成部203は、第2の主オーディオオブジェクトFGO2をバイパス(bypass)し、第2のダウンミックス生成部205は、第2の主オーディオオブジェクトFGO2を副オーディオオブジェクトBGOと第1の主オーディオオブジェクトFGO1がダウンミックスすることによって生成されたダウンミックス信号にダウンミックスする。
【0050】
残余信号を除外すれば、第1のダウンミックス生成部203または第2のダウンミックス生成部205は、3つの信号を受信し、2つの信号を出力する。2つの出力信号は、ダウンミックス信号とバイパスされた信号である。例えば、第1のダウンミックス生成部203は、副オーディオオブジェクトBGO、第1の主オーディオオブジェクトFGO1および第2の主オーディオオブジェクトFGO2を受信し、第1のダウンミックス信号と第2の主オーディオオブジェクトFGO2とを出力する。したがって、第1のダウンミックス生成部は、3つの入力で、2つの出力のインバースTTT−1(Two To Three)構造を有する。しかしながら、3つの入力のうちの1つは、変調されずに出力される。したがって、このような構造をトリビアル(trivial)TTT−1(tTTT−1)と指称する。ここで、tTTT−1は、符号化の観点で定義され、復号化の観点ではtTTT(trivial Two To Three)に等しい。これらを第1のダウンミックス生成部203および第2のダウンミックス生成部205を含むダウンミックス生成部201に拡張させ、主オーディオオブジェクトFGOが3つ以上入力される場合、出力が2つのインバースtTTN−1(Inverse trival Two To N)構造を有することができる。ここで、tTTN−1は、符号化の観点で定義され、復号化の観点ではtTTN(trival Two To N)に等しい。
【0051】
図3は、図2に図示された第1のダウンミックス生成部203を詳細に説明するための図である。図3を参照すれば、第1のダウンミックス生成部203は、Input1、Input2、Input3の3つの入力信号を受信し、Output1、Output2の出力信号を出力する。
【0052】
第1のダウンミックス生成部301は、第1の入力信号Input1と第2の入力信号Input2とをダウンミックスしたダウンミックス信号である第1の出力信号Output1を出力し、残余(Residual)信号を生成する。第1のダウンミックス生成部301は、第3の入力信号をバイパスしてそのまま第2の出力信号Output2として出力する。したがって、第1の出力信号Output1は、第1の入力信号Input1と第2の入力信号Input2とがダウンミックスされた信号であり、第2の出力信号Output2は第3の入力信号Input3と同一の信号となる。
【0053】
前述した説明は、本発明による以下の具体的な実施形態に同一に適用することができる。以下では図面を参照して本発明の具体的な実施形態について詳細に説明する。
【0054】
〈第1の実施形態〉モノ主オーディオオブジェクト及びモノ副オーディオオブジェクト 本発明による第1の実施形態において、主オーディオオブジェクトは、モノ(mono)主オーディオオブジェクトを含み、副オーディオオブジェクトは、モノ副オーディオオブジェクトを含む。
【0055】
本発明の第1の実施形態によるマルチオブジェクトオーディオ符号化方法は、モノ主オーディオオブジェクトとモノ副オーディオオブジェクトをダウンミックスしてダウンミックス信号および残余信号を生成するステップと、ダウンミックス信号および残余信号を含むビットストリームを生成するステップとを含む。ここで、モノ主オーディオオブジェクトは、第1のモノ主オーディオオブジェクトおよび第2のモノ主オーディオオブジェクトを含み、ダウンミックス信号および残余信号を生成するステップは、モノ副オーディオオブジェクトと第1のモノ主オーディオオブジェクトをダウンミックスして第1のダウンミックス信号および第1の残余信号を生成するステップと、第1のダウンミックス信号と第2のモノ主オーディオオブジェクトをダウンミックスして第2のダウンミックス信号および第2の残余信号を生成するステップとを含むことができる。また、ダウンミックス信号および残余信号を生成するステップは、第2のモノ主オーディオオブジェクトをバイパスするステップをさらに含むことができる。
【0056】
第1の実施形態によるマルチオブジェクトオーディオ符号化装置は、モノ主オーディオオブジェクトとモノ副オーディオオブジェクトをダウンミックスしてダウンミックス信号および残余信号を生成するダウンミックス生成部と、ダウンミックス信号および残余信号を含むビットストリームを生成するビットストリーム生成部とを備える。ここで、モノ主オーディオオブジェクトは、第1のモノ主オーディオオブジェクトおよび第2のモノ主オーディオオブジェクトを含み、ダウンミックス生成部は、モノ副オーディオオブジェクトと第1のモノ主オーディオオブジェクトをダウンミックスして第1のダウンミックス信号および第1の残余信号を生成する第1のダウンミックス生成部と、第1のダウンミックス信号と第2のモノ主オーディオオブジェクトをダウンミックスして第2のダウンミックス信号および第2の残余信号を生成する第2のダウンミックス生成部とを備えることができる。また、第1のダウンミックス生成部は、第2のモノ主オーディオオブジェクトをバイパスすることができる。
【0057】
第1の実施形態によるマルチオブジェクトオーディオ復号化方法は、モノ主オーディオオブジェクトとモノ副オーディオオブジェクトがダウンミックスされたダウンミックス信号およびダウンミックスによる残余信号を含むビットストリームを受信するステップと、残余信号を利用してダウンミックス信号から前記主オーディオオブジェクトおよび副オーディオオブジェクトを復元するステップとを含む。ここで、モノ主オーディオオブジェクトは、第1のモノ主オーディオオブジェクトおよび第2のモノ主オーディオオブジェクトを含み、残余信号は、第1のモード主オーディオオブジェクトに対する第1の残余信号および第2のモノ主オーディオオブジェクトに対する第2の残余信号を含み、復元するステップは、ダウンミックス信号と第1の残余信号を利用して第1のモノ主オーディオオブジェクトを復元するステップと、第1のモノ主オーディオオブジェクトが復元された後のダウンミックス信号と第2の残余信号を利用して第2のモノ主オーディオオブジェクトを復元するステップとを含むことができる。
【0058】
第1の実施形態によるマルチオブジェクトオーディオ復号化装置は、モノ主オーディオオブジェクトとモノ副オーディオオブジェクトがダウンミックスされたダウンミックス信号およびダウンミックスによる残余信号を含むビットストリームを受信する受信部と、残余信号を利用してダウンミックス信号から主オーディオオブジェクトおよび副オーディオオブジェクトを復元する復元部とを備える。ここで、モノ主オーディオオブジェクトは、第1のモノ主オーディオオブジェクトおよび第2のモノ主オーディオオブジェクトを含み、残余信号は、第1のモード主オーディオオブジェクトに対する第1の残余信号および第2のモノ主オーディオオブジェクトに対する第2の残余信号を含み、復元部は、ダウンミックス信号と第1の残余信号を利用して第1のモノ主オーディオオブジェクトを復元する第1の復元部と、第1のモノ主オーディオオブジェクトが復元された後のダウンミックス信号と第2の残余信号を利用して第2のモノ主オーディオオブジェクトを復元する第2の復元部とを備えることができる。
【0059】
図4は、本発明による第1の実施形態を説明するための図である。図4を参照すれば、主オーディオオブジェクトFGO及び副オーディオオブジェクトBGOは、モノ信号である。モノ主オーディオオブジェクトMono FGO1、Mono FGO2及びモノ副オーディオオブジェクトMono BGOは、ダウンミックス生成部401に入力される。
【0060】
第1のダウンミックス生成部403は、モノ副オーディオオブジェクトMono BGO及び第1のモノ主オーディオオブジェクトMono FGO1を受信し、第1のダウンミックス信号と第1の残余(Residual)信号とを生成する。第2のダウンミックス生成部405は、第1のダウンミックス信号及び第2のモノ主オーディオオブジェクトMono FGO2を入力し、第2のダウンミックス信号DMXと第2の残余信号を生成する。
【0061】
図4では、2つのモノ主オーディオオブジェクトMono FGO1、Mono FGO2を入力しているが、3つ以上のモノオーディオオブジェクトを入力する場合がることは当業者には自明である。モノ主オーディオオブジェクトが3つ以上入力される場合、増加する主オーディオオブジェクトの数の分だけ、第1のまたは第2のダウンミックス生成部403、404がカスケード(cascade)で連結され増加する。
【0062】
主オーディオオブジェクトFGOが3つ以上入力される場合、入力が複数Nで、出力が1つのインバースOTN−1(One To N)構造を有することができる。ここで、OTN−1は、符号化の観点で定義され、復号化の観点ではOTN(One To N)に等しい。復号化過程は、前述した符号化過程の逆順に行われる。
【0063】
〈第2の実施形態〉ステレオ主オーディオオブジェクト及びモノ副オーディオオブジェクト
本発明による第2の実施形態で主オーディオオブジェクトは、ステレオ(stereo)主オーディオオブジェクトを含み、副オーディオオブジェクトは、モノ副オーディオオブジェクトを含む。
【0064】
第2の実施形態によるマルチオブジェクトオーディオ符号化方法は、ステレオ主オーディオオブジェクトとモノ副オーディオオブジェクトをダウンミックスしてダウンミックス信号と残余信号を生成するステップと、ダウンミックス信号と残余信号を含むビットストリームを生成するステップとを含む。ここで、ステレオ主オーディオオブジェクトは、第1の信号および第2の信号を含み、ダウンミックス信号と残余信号を生成するステップは、モノ副オーディオオブジェクトと第1の信号をダウンミックスして第1のダウンミックス信号と第1の残余信号を生成するステップと、第1のダウンミックス信号と前記第2の信号をダウンミックスして第2のダウンミックス信号と第2の残余信号を生成するステップとを含むことができる。また、ダウンミックス信号と残余信号を生成するステップは、第2の信号をバイパスするステップをさらに含むことができる。
【0065】
第2の実施形態によるマルチオブジェクトオーディオ符号化装置は、ステレオ主オーディオオブジェクトとモノ副オーディオオブジェクトをダウンミックスしてダウンミックス信号と残余信号を生成するダウンミックス生成部と、ダウンミックス信号と残余信号を含むビットストリームを生成するビットストリーム生成部とを備える。ここで、ステレオ主オーディオオブジェクトは、第1の信号および第2の信号を含み、ダウンミックス生成部はモノ副オーディオオブジェクトと第1の信号をダウンミックスして第1のダウンミックス信号と第1の残余信号を生成する第1のダウンミックス生成部と、第1のダウンミックス信号と前記第2の信号をダウンミックスして第2のダウンミックス信号と第2の残余信号を生成する第2のダウンミックス生成部とを備えることができる。また、第1のダウンミックス生成部は、第2の信号をバイパスすることができる。
【0066】
第2の実施形態によるマルチオブジェクトオーディオ復号化方法は、ステレオ主オーディオオブジェクトとモノ副オーディオオブジェクトがダウンミックスされたダウンミックス信号およびダウンミックスによる残余信号を含むビットストリームを受信するステップと、残余信号を利用してダウンミックス信号からステレオ主オーディオオブジェクトとモノ副オーディオオブジェクトを復元するステップとを含む。ここで、ステレオ主オーディオオブジェクトは、第1の信号および第2の信号を含み、残余信号は、第1の信号に対する第1の残余信号および第2の信号に対する第2の残余信号を含み、復元するステップは、ダウンミックス信号と第1の残余信号を利用して第1の信号を復元するステップと、第1の信号が復元された後のダウンミックス信号と第2の残余信号を利用して第2の信号を復元するステップとを含むことができる。
【0067】
第2の実施形態によるマルチオブジェクトオーディオ復号化装置は、ステレオ主オーディオオブジェクトとモノ副オーディオオブジェクトがダウンミックスされたダウンミックス信号およびダウンミックスによる残余信号を含むビットストリームを受信する受信部と、残余信号を利用してダウンミックス信号からステレオ主オーディオオブジェクトとモノ副オーディオオブジェクトを復元する復元部とを備える。ここで、ステレオ主オーディオオブジェクトは、第1の信号および第2の信号を含み、残余信号は、第1の信号に対する第1の残余信号および第2の信号に対する第2の残余信号を含み、復元部は、ダウンミックス信号と第1の残余信号を利用して第1の信号を復元する第1の復元部と、第1の信号が復元された後のダウンミックス信号と第2の残余信号を利用して第2の信号を復元する第2の復元部とを備えることができる。
【0068】
図5は、本発明による第2の実施形態を説明するための図である。図5を参照すれば、ダウンミックス生成部501は、モノ副オーディオオブジェクトMono BGO及びステレオ主オーディオオブジェクトStereo Left、 Right FGOを受信する。ステレオ主オーディオオブジェクトStereo Left、Right FGOは、左チャネル信号Left FGOおよび右チャネル信号Right FGOを含む。
【0069】
第1のダウンミックス生成部503は、モノ副オーディオオブジェクトMono BGOと左チャネル信号Left FGOを受信し、第1のダウンミックス信号と第1の残余(Residual)信号を生成する。第2のダウンミックス生成部505は、第1のダウンミックス信号と右チャネル信号Right FGOを受信し、第2のダウンミックス信号DMXと第2の残余信号を生成する。
【0070】
図5では、1つのステレオ主オーディオオブジェクトStereo Left、Right FGOが入力されているが、2つ以上のステレオ主オーディオオブジェクトを入力する場合があることは当業者には自明である。ステレオ主オーディオオブジェクトが2つ以上の場合、増加する主オーディオオブジェクトの数の分だけ、第1のまたは第2のダウンミックス生成部503、505がカスケード(cascade)で連結され増加する。一方、復号化過程は前述した符号化過程の逆順に行われる。
【0071】
〈第3の実施形態〉ステレオ主オーディオオブジェクト及びステレオ副オーディオオブジェクト
本発明による第3の実施形態で主オーディオオブジェクトは、ステレオ(stereo)主オーディオオブジェクトを含み、副オーディオオブジェクトは、ステレオ副オーディオオブジェクトを含む。ステレオオーディオオブジェクトは、左チャネルと右チャネル信号を含むことができる。
【0072】
第3の実施形態によるマルチオブジェクトオーディオ符号化方法は、ステレオ主オーディオオブジェクトとステレオ副オーディオオブジェクトをダウンミックスしてダウンミックス信号および残余信号を生成するステップと、ダウンミックス信号と残余信号を含むビットストリームを生成するステップとを含む。ここで、ステレオ主オーディオオブジェクトとステレオ副オーディオ信号は、各々第1の信号および第2の信号を含み、ダウンミックス信号および残余信号を生成するステップは、ステレオ主オーディオオブジェクトとステレオ副オーディオ信号の第1の信号をダウンミックスして第1のダウンミックス信号および第1の残余信号を生成するステップと、ステレオ主オーディオオブジェクトとステレオ副オーディオ信号の第2の信号をダウンミックスして第2のダウンミックス信号および第2の残余信号を生成するステップとを含むことができる。ここで、ステレオ主オーディオオブジェクトの第1の信号は、第1の左チャネル信号および第2の左チャネル信号を含み、第1のダウンミックス信号および第1の残余信号を生成するステップは、ステレオ副オーディオ信号の第1の信号と第1の左チャネル信号をダウンミックスして第1の左チャネルダウンミックス信号および第1の左チャネル残余信号を生成するステップと、第1の左チャネルダウンミックス信号と第2の左チャネル信号をダウンミックスして第2の左チャネルダウンミックス信号および第2の左チャネル残余信号を生成するステップとを含むことができる。ここで、第1のダウンミックス信号および第1の残余信号を生成するステップは、第2の左チャネル信号をバイパスするステップをさらに含むことができる。
【0073】
第3の実施形態によるマルチオブジェクトオーディオ符号化装置は、ステレオ主オーディオオブジェクトとステレオ副オーディオオブジェクトをダウンミックスしてダウンミックス信号および残余信号(residual signal)を生成するダウンミックス生成部と、ダウンミックス信号と残余信号を含むビットストリームを生成するビットストリーム生成部とを備える。ここで、ステレオ主オーディオオブジェクトとステレオ副オーディオ信号は、各々第1の信号および第2の信号を含み、ダウンミックス生成部は、ステレオ主オーディオオブジェクトとステレオ副オーディオ信号の第1の信号をダウンミックスして第1のダウンミックス信号および第1の残余信号を生成する第1のダウンミックス生成部と、ステレオ主オーディオオブジェクトとステレオ副オーディオ信号の第2の信号をダウンミックスして第2のダウンミックス信号および第2の残余信号を生成する第2のダウンミックス生成部とを備えることができる。ここで、ステレオ主オーディオオブジェクトの第1の信号は第1の左チャネル信号および第2の左チャネル信号を含み、第1のダウンミックス生成部はステレオ副オーディオ信号の第1の信号と第1の左チャネル信号をダウンミックスして第1の左チャネルダウンミックス信号および第1の左チャネル残余信号を生成する第1の左チャネルダウンミックス生成部と、第1の左チャネルダウンミックス信号と第2の左チャネル信号をダウンミックスして第2の左チャネルダウンミックス信号および第2の左チャネル残余信号を生成する第2の左チャネルダウンミックス生成部とを備えることができる。ここで、第1のダウンミックス生成部は、第2の左チャネル信号をバイパスするステップをさらに含むことができる。
【0074】
第3の実施形態によるマルチオブジェクトオーディオ復号化方法は、ステレオ主オーディオオブジェクトとステレオ副オーディオオブジェクトがダウンミックスされたダウンミックス信号およびダウンミックスによる残余信号を含むビットストリームを受信するステップと、残余信号を利用してダウンミックス信号からステレオ主オーディオオブジェクトとステレオ副オーディオオブジェクトを復元するステップとを含む。ここで、ステレオ主オーディオオブジェクトとステレオ副オーディオ信号は、各々第1の信号および第2の信号を含み、残余信号は、第1の信号に対する第1の残余信号および第2の信号に対する第2の残余信号を含み、復元するステップはダウンミックス信号と第1の残余信号を利用して第1の信号を復元するステップと、ダウンミックス信号と第2の残余信号を利用して第2の信号を復元するステップとを含むことができる。また、ステレオ主オーディオオブジェクトの第1の信号は、第1の左チャネル信号および第2の左チャネル信号を含み、第1の残余信号は、第1の左チャネル信号に対する第1の左チャネル残余信号および第2の左チャネル信号に対する第2の左チャネル残余信号を含み、第1の信号を復元するステップはダウンミックス信号と気第1の左チャネル残余信号を利用して第1の左チャネル信号を復元するステップと、第1の左チャネル信号が復元された後のダウンミックス信号と第2の左チャネル信号を利用して第2の左チャネル信号を復元するステップとを含むことができる。
【0075】
第3の実施形態によるマルチオブジェクトオーディオ復号化装置は、ステレオ主オーディオオブジェクトとステレオ副オーディオオブジェクトがダウンミックスされたダウンミックス信号およびダウンミックスによる残余信号を含むビットストリームを受信する受信部と、残余信号を利用してダウンミックス信号からステレオ主オーディオオブジェクトとステレオ副オーディオオブジェクトを復元する復元部とを備える。ここで、ステレオ主オーディオオブジェクトとステレオ副オーディオ信号は、各々第1の信号および第2の信号を含み、残余信号は、第1の信号に対する第1の残余信号および第2の信号に対する第2の残余信号を含み、復元部は、ダウンミックス信号と第1の残余信号を利用して第1の信号を復元する第1の復元部と、ダウンミックス信号と第2の残余信号を利用して第2の信号を復元する第2の復元部とを備えることができる。また、ステレオ主オーディオオブジェクトの第1の信号は、第1の左チャネル信号および第2の左チャネル信号を含み、第1の残余信号は、第1の左チャネル信号に対する第1の左チャネル残余信号および第2の左チャネル信号に対する第2の左チャネル残余信号を含み、第1の復元部は、ダウンミックス信号と気第1の左チャネル残余信号を利用して第1の左チャネル信号を復元する第1の左チャネル復元部と、第1の左チャネル信号が復元された後のダウンミックス信号と第2の左チャネル信号を利用して第2の左チャネル信号を復元する第2の左チャネル復元部とを備えることができる。
【0076】
図6は、本発明による第3の実施形態を説明するための図である。図6を参照すれば、主オーディオオブジェクトStereo Left/Right FGOはステレオ信号で、副オーディオオブジェクトStereo Left/Right BGOもステレオ信号である。図6を参照して、2つのステレオ主オーディオオブジェクトStereo Left/Right FGO1及びStereo Left/Right FGO2について説明する。
【0077】
ダウンミックス生成部601は、ステレオ主オーディオオブジェクトStereo Left/Right FGO及び2つのステレオ主オーディオオブジェクトStereo Left/Right FGO1及びStereo Left/Right FGO2を受信する。
【0078】
第1の左チャネルダウンミックス生成部603は、左チャネル副オーディオオブジェクトLeft BGOと第1の左チャネル主オーディオオブジェクトLeft FGO1を受信し、第1の左チャネルダウンミックス信号と第1の左チャネル残余信号Left Residualを生成する。第2の左チャネルダウンミックス生成部605は、第1の左チャネルダウンミックス信号と第2の左チャネル主オーディオオブジェクトLeft FGO2を受信し、第2の左チャネルダウンミックス信号Left DMXと第2の左チャネル残余信号Left Residualを生成する。
【0079】
右チャネル副オーディオオブジェクトRight BGO及び右チャネル主オーディオオブジェクトRight FGO1、2も前述した過程によりダウンミックスされる。
【0080】
図6では、2つのステレオ主オーディオオブジェクトStereo Left、Right FGOが入力されているが、3つ以上のステレオ主オーディオオブジェクトを入力する場合があることは当業者には自明である。ステレオ主オーディオオブジェクトが3つ以上入力される場合、増加する主オーディオオブジェクトの数の分だけ、第1のまたは第2の左チャネルダウンミックス生成部603、605がカスケード(cascade)で連結され増加する。復号化過程は、前述した符号化過程の逆順に行われる。
【0081】
図6では、第1の左チャネルダウンミックス生成部603は、左チャネル副オーディオオブジェクトLeft BGO、第1の左チャネル主オーディオオブジェクトLeft FGO1および第2の左チャネル主オーディオオブジェクトLeft FGO2を受信する。第1の左チャネルダウンミックス生成部603は、第2の左チャネル主オーディオオブジェクトLeft FGO2をバイパスする。すなわち、第1の左チャネルダウンミックス生成部は、3つの入力及び2つの出力を有するインバースTTT−1(Two To Three)を有する。このような構造を、tTTT−1(trivial TTT−1)と指称するのは前述した通りである。また、左チャネル信号と右チャネル信号を含むステレオ主オーディオオブジェクトを3つ以上入力する場合、3個以上の入力及び2つの出力を有するインバースtTTN−1(trival Two To N)を有する。ここで、tTTN−1は、符号化の観点で定義したものであり、復号化の観点ではtTTN(trival Two To N)に等しい。
【0082】
〈第4の実施形態〉ステレオ主オーディオオブジェクト及びモノ副オーディオオブジェクト
本発明による第4の実施形態で、主オーディオオブジェクトは、ステレオ(stereo)主オーディオオブジェクトを含み、副オーディオオブジェクトは、モノ(mono)副オーディオオブジェクトを含む。ステレオオーディオオブジェクトは、左チャネルと右チャネル信号を含むことができる。第4の実施形態は、ダウンミックスされた出力信号がステレオの点で前述した第2の実施形態と区別される。
【0083】
第4の実施形態によるマルチオブジェクトオーディオ符号化方法は、ステレオ主オーディオオブジェクトとモノ副オーディオオブジェクトをダウンミックスしてダウンミックス信号および残余信号を生成するステップと、ダウンミックス信号および残余信号を含むビットストリームを生成するステップとを含み、ステレオ主オーディオオブジェクトは、第1の、2左チャネル信号および第1の、2右チャネル信号を含み、ダウンミックス信号および残余信号を生成するステップは、モノ副オーディオオブジェクトと第1の左チャネル信号および第1の右チャネル信号を各々ダウンミックスして第1の左チャネルダウンミックス信号、第1の右チャネルダウンミックス信号および第1の残余信号を生成するステップと、第1の左チャネルダウンミックス信号および第1の右チャネルダウンミックス信号と第2の左チャネル信号および第2の右チャネル信号を各々ダウンミックスして第2の左チャネルダウンミックス信号、第2の右チャネルダウンミックス信号および第2の残余信号を生成するステップとを含むことができる。ここで、ダウンミックス信号および残余信号を生成するステップは、第2の左チャネル信号および第2の右チャネル信号をバイパスするステップをさらに含むことができる。
【0084】
第4の実施形態によるマルチオブジェクトオーディオ符号化装置は、ステレオ主オーディオオブジェクトとモノ副オーディオオブジェクトをダウンミックスしてダウンミックス信号および残余信号を生成するダウンミックス生成部と、ダウンミックス信号および残余信号を含むビットストリームを生成するビットストリーム生成部とを備え、ステレオ主オーディオオブジェクトは第1の、2左チャネル信号および第1の、2右チャネル信号を含み、ダウンミックス生成部は、モノ副オーディオオブジェクトと第1の左チャネル信号および第1の右チャネル信号を各々ダウンミックスして第1の左チャネルダウンミックス信号、第1の右チャネルダウンミックス信号および第1の残余信号を生成する第1の左チャネルダウンミックス生成部と、第1の左チャネルダウンミックス信号および第1の右チャネルダウンミックス信号と第2の左チャネル信号および第2の右チャネル信号を各々ダウンミックスして第2の左チャネルダウンミックス信号、第2の右チャネルダウンミックス信号および第2の残余信号を生成する第2の左チャネルダウンミックス生成部とを備えることができる。ここで、ダウンミックス生成部は第2の左チャネル信号および第2の右チャネル信号をバイパスするステップをさらに含むことができる。
【0085】
第4の実施形態によるマルチオブジェクトオーディオ復号化方法は、ステレオ主オーディオオブジェクトとモノ副オーディオオブジェクトがダウンミックスされたダウンミックス信号およびダウンミックスによる残余信号を含むビットストリームを受信するステップと、残余信号を利用してダウンミックス信号からステレオ主オーディオオブジェクトとモノ副オーディオオブジェクトを復元するステップとを含み、ステレオ主オーディオオブジェクトは、第1の、2左チャネル信号および第1の、2右チャネル信号を含み、残余信号は、第1の左チャネルおよび右チャネル信号に対する第1の残余信号と、第2の左チャネルおよび右チャネル信号に対する第2の残余信号とを含み、復元するステップはダウンミックス信号と第1の残余信号を利用して第1の左チャネルおよび右チャネル信号を復元するステップと、第1の左チャネルおよび右チャネル信号が復元された後のダウンミックス信号と第2の残余信号を利用して第2の左チャネルおよび右チャネル信号を復元するステップとを含むことができる。
【0086】
第4の実施形態によるマルチオブジェクトオーディオ復号化装置は、ステレオ主オーディオオブジェクトとモノ副オーディオオブジェクトがダウンミックスされたダウンミックス信号およびダウンミックスによる残余信号を含むビットストリームを受信する受信部と、残余信号を利用してダウンミックス信号からステレオ主オーディオオブジェクトとモノ副オーディオオブジェクトを復元する復元部とを備え、ステレオ主オーディオオブジェクトは、第1の、2左チャネル信号および第1の、2右チャネル信号を含み、残余信号は、第1の左チャネルおよび右チャネル信号に対する第1の残余信号と、第2の左チャネルおよび右チャネル信号に対する第2の残余信号を含み、復元部は、ダウンミックス信号と第1の残余信号を利用して第1の左チャネルおよび右チャネル信号を復元する第1の復元部と、第1の左チャネルおよび右チャネル信号が復元された後のダウンミックス信号と第2の残余信号を利用して第2の左チャネルおよび右チャネル信号を復元する第2の復元部とを備えることができる。
【0087】
図7は、本発明による第4の実施形態を説明するための図である。図7を参照すれば、主オーディオオブジェクトは、ステレオで、副オーディオオブジェクトは、モノである。ステレオオーディオオブジェクトは、左チャネル信号と右チャネル信号を含むことができる。ダウンミックス生成部701は、モノ副オーディオオブジェクトMono BGOとステレオ主オーディオオブジェクトFGO1、2 Left/Rightを受信する。
【0088】
第1のダウンミックス生成部702は、モノ副オーディオオブジェクトMono BGOと第1のステレオ主オーディオオブジェクトFGO1 Left及びFGO2 Rightを受信して各々ダウンミックスし、第1のダウンミックス信号および第1の残余(Residual)信号を生成する。第1のダウンミックス信号は、第1の左チャネルダウンミックス信号および第2の右チャネルダウンミックス信号を含むことができる。第2のダウンミックス信号と第2の残余信号は、第1のダウンミックス信号と第2のステレオ主オーディオオブジェクトFGO2 Left及びFGO2 Rightとをダウンミックスすることにより生成される。第2のダウンミックス信号は、第2の左チャネルダウンミックス信号Left DMX および第2の右チャネルダウンミックス信号Right DMXを含むことができる。第2の左チャネルダウンミックス生成部703aは、第1の左チャネルダウンミックス信号と第2のステレオ左チャネル主オーディオオブジェクトFGO2 Leftとをダウンミックスすることにより第2の左チャネルダウンミックス信号Left DMXを生成する。第2の右チャネルダウンミックス生成部703bは、第1の右チャネルダウンミックス信号と第2のステレオ右チャネル主オーディオオブジェクトFGO2 Rightとをダウンミックスすることより第2の右チャネルダウンミックス信号Right DMXを生成する。
【0089】
図8は、本発明による復号化を説明するための図である。残余信号とダウンミックス信号を含むビットストリームを受信してダウンミックス信号を復元する。ダウンミックス信号は、左チャネルダウンミックス信号Left DMXと右チャネルダウンミックス信号Right DMXを含むステレオダウンミックス信号を含むことができる。
【0090】
モノ主オーディオオブジェクト復元部804は、ステレオダウンミックス信号Left DMX、Right DMXと残余信号Residualを利用してモノ主オーディオオブジェクトMono FGOsを復元する。モノ主オーディオオブジェクト復元部804は、それぞれのモノ主オーディオオブジェクトを復元するために第1のモノ主オーディオオブジェクト復元部802、第2のモノ主オーディオオブジェクト復元部803を含む。ここで、第1のモノ主オーディオオブジェクト復元部802と第2のモノ主オーディオオブジェクト復元部803は、TTT構造を有し、モノ主オーディオオブジェクト復元部804は、TTN構造を有する。
【0091】
ステレオ主オーディオオブジェクト復元部806は、ステレオダウンミックス信号Left DMX、Right DMXと残余信号Residualを利用してステレオ主オーディオオブジェクトStereo Left、Right FGOsを復元する。ステレオ主オーディオオブジェクトStereo Left/Right FGOsは、左チャネル信号Left FGOsと右チャネル信号Right FGOsを含む。最終的には、ステレオ副オーディオオブジェクトLeft BGO、Right BGOを出力する。ステレオ主オーディオオブジェクト復元部806は、複数のオブジェクト復元部805a、805b、...、806a、806b、807a、807bを含む。複数のオブジェクト復元部805a、805b、...、806a、806b、807a、807bは、OTT構造を有し、ステレオ主オーディオオブジェクト復元部806は、OTN構造を有する。
【0092】
図8は、副オーディオオブジェクトがステレオで、主オーディオオブジェクトがモノまたはステレオの場合の復号化について示されている。副オーディオオブジェクトがモノで、主オーディオオブジェクトがモノの場合には左チャネルダウンミックス信号Left DMXと残余信号Residualを利用してモノ副オーディオオブジェクトとモノ主オーディオオブジェクトに復元される。一方、副オーディオオブジェクトがモノで、主オーディオオブジェクトがステレオの場合は、ステレオ主オーディオオブジェクト復元部806により復元されうる。したがって、図8に示されたことにより容易に類推することができるため、詳しい説明は省略する。
【0093】
以下では本発明の例示的な実施形態について説明する。
【0094】
図9は、本発明の例示的な実施形態を説明するための図である。図9を参照すれば、MBO(Multichannel Background−scene Object)は、複数のチャネルChannel 1、Channel 2、...、Channel nを含む。MPSエンコーダ901(MPEG Surround encoder)は、MBOを符号化してステレオダウンミックス信号MBO Left、MBO Rightと付加情報(side information)のMPSビットストリームを出力する。ここで、ステレオダウンミックス信号MBO Left、MBO Rightは、副オーディオオブジェクトに該当する。
【0095】
ステレオダウンミックス信号MBO Left、MBO Right、ステレオ主オーディオオブジェクトStereo FGO及びモノ主オーディオオブジェクトMono FGOは、SAOCエンコーダ(Spatial Audio Object Coding encoder)に入力される。ステレオ主オーディオオブジェクトStereo FGOとモノ主オーディオオブジェクトMono FGOは、主オーディオオブジェクトに該当する。ステレオ主オーディオオブジェクトStereo FGOは、複数のステレオオブジェクトobject 1、object 2、...、object Nを含むことができ、モノ主オーディオオブジェクトMono FGOは、複数のモノオブジェクトobject 1、object 2、...、object Mを含むことができる。
【0096】
第1のダウンミックス生成部903は、ステレオダウンミックス信号MBO Left、MBO Rightとステレオ主オーディオオブジェクトStereo FGOをダウンミックスしてステレオダウンミックス信号Left及びRightと残余信号を生成する。ここで、第1のダウンミックス生成部903は、ステレオ主オーディオオブジェクトとステレオ副オーディオオブジェクトをダウンミックスするものであって、図5で説明したステレオダウンミックス生成部505に該当する。
【0097】
第2のダウンミックス生成部904は、ステレオダウンミックス信号Left、Rightとモノ主オーディオオブジェクトMono FGOをダウンミックスして最終ダウンミックス信号Left DMX、Right DMXと残余信号を生成する。ここで、第2のダウンミックス生成部904は、図4で説明したダウンミックス生成部401に該当する。
【0098】
SAOCエンコーダ902は、SAOCビットストリームを抽出される。符号化過程で生成されたMPSビットストリーム、SAOCビットストリーム、残余信号および最終ダウンミックス信号Left DMX、Right DMXは、ビットストリームで復号化機に伝送される。
【0099】
復号化の過程は符号化過程の逆過程であるため詳細な説明は省略する。簡単に説明すれば、復号化機ではMPSビットストリーム、SAOCビットストリーム、残余信号および最終ダウンミックス信号Left DMX、Right DMXを受信する。SAOCデコーダでは、残余信号と最終ダウンミックス信号Left DMX、Right DMXを利用して主オーディオオブジェクトを復元する。MPSデコーダは、主オーディオオブジェクトが復元された最終ダウンミックス信号Left DMX、Right DMXとMPSビットストリームを受信し、MPSビットストリームを利用して副オーディオオブジェクトのマルチチャネル信号を復元する。
【0100】
次は残余信号を生成する実施形態に対して説明する。
【0101】
復号化過程でダウンミックス信号と残余信号を利用して復元された左チャネル信号と右チャネル信号を生成する過程は、下記の数2によって説明されることができる。
【0102】
【数1】

【0103】
ここで、左側の行列では、復元された左チャネル信号および右チャネル信号を意味し、右側の行列では、Mはパラメータ行列であり、mはダウンミックスされた信号であり、resは残余信号を意味する。
【0104】
M行列が逆行列を有するならば、符号化の過程でダウンミックスされた信号mと残余信号resは下記の数3と数4とによって得ることができる。
【0105】
【数2】

【0106】
【数3】

【0107】
上述したような本発明の方法は、プログラムで具現されてコンピュータで読み取り可能な形態で記録媒体(CD−ROM、RAM、ROM、フロッピー(登録商標)ディスク、ハードディスク、光磁気ディスクなど)に保存されうる。このような過程は本発明が属する技術分野で通常の知識を有する者が容易に実施することができるため、これ以上詳細に説明しない。
【0108】
以上で説明した本発明は、本発明が属する技術分野で通常の知識を有する者にあって本発明の技術的思想に外れない範囲内で色々な置換、変形および変更が可能なため、前述した実施形態および添付された図面によって限定されるものではない。
【産業上の利用可能性】
【0109】
本発明は、オーディオオブジェクトを符号化して、復号化することに使用される。

【特許請求の範囲】
【請求項1】
n個(nは整数)の主オーディオオブジェクトと副オーディオオブジェクトがダウンミックスされたダウンミックス信号および前記ダウンミックスによるn個の残余信号(residual signal)を含むビットストリームを受信し、前記残余信号を利用して前記ダウンミックス信号から前記主オーディオオブジェクトと前記副オーディオオブジェクトを復元するオブジェクト復元手段であって、前記n個の残余信号は、前記n個の主オーディオオブジェクトのそれぞれに対応する、オブジェクト復元手段を備え、
前記オブジェクト復元手段は、カスケード構造で接続されたn個のオブジェクト復元部を備え、
前記n個の残余信号のうち、m番目(mはn以下の整数)のオブジェクト復元部は、
前記n個の残余信号のうち、m番目の残余信号と、まだ復元されていない主オーディオオブジェクトと副オーディオオブジェクトがダウンミックスされたダウンミックス信号を用いて前記n個の主オーディオオブジェクトのうち、前記m番目の残余信号に対応するm番目の主オーディオオブジェクトを復元し、前記m番目の主オーディオオブジェクトが復元された後のダウンミックス信号を出力することを特徴とするマルチオブジェクトオーディオ復号化装置。
【請求項2】
前記nは2であることを特徴とする請求項1に記載のマルチオブジェクトオーディオ復号化装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate


【公開番号】特開2012−212160(P2012−212160A)
【公開日】平成24年11月1日(2012.11.1)
【国際特許分類】
【出願番号】特願2012−138607(P2012−138607)
【出願日】平成24年6月20日(2012.6.20)
【分割の表示】特願2010−530928(P2010−530928)の分割
【原出願日】平成20年10月21日(2008.10.21)
【出願人】(596180076)韓國電子通信研究院 (733)
【氏名又は名称原語表記】Electronics and Telecommunications Research Institute
【住所又は居所原語表記】161 Kajong−dong, Yusong−gu, Taejon korea
【Fターム(参考)】