オーディオ信号の処理方法及び装置
【課題】既に設定されたプリセット情報及びプリセットメタデータを用いてオブジェクトのレベル及びパニングをコントロールすることができるオーディオ信号処理方法及び装置を提供する。
【解決手段】少なくとも一つのオブジェクトを含むダウンミックス信号及びオブジェクト情報を受信する段階であって、前記オブジェクト情報は、前記オブジェクト情報の拡張領域に含まれているデータのタイプを表すデータタイプ情報と、オブジェクトゲイン及びオブジェクトゲイン比率のうち少なくとも一つと、を有する段階と、前記データタイプ情報に基づいて、前記オブジェクトをレンダリングするためのプリセット情報が前記オブジェクト情報の拡張領域に含まれているか否かを判断する段階と、前記プリセット情報が前記オブジェクト情報に含まれていない場合、前記オブジェクトゲイン及び前記オブジェクトゲイン比率のうち少なくとも一つを用いて前記オブジェクトをレンダリングするための初期プリセット情報を生成する段階と、前記初期プリセット情報を用いて、前記ダウンミックス信号に含まれているオブジェクトをレンダリングする段階と、を有することを特徴とするオーディオ信号処理方法を提供する。これによれば、エンコーダからプリセット情報が受信されない場合にも、受信されたオブジェクト情報を用いて初期プリセット情報を生成することによって、オーディオ信号を復元することができる。
【解決手段】少なくとも一つのオブジェクトを含むダウンミックス信号及びオブジェクト情報を受信する段階であって、前記オブジェクト情報は、前記オブジェクト情報の拡張領域に含まれているデータのタイプを表すデータタイプ情報と、オブジェクトゲイン及びオブジェクトゲイン比率のうち少なくとも一つと、を有する段階と、前記データタイプ情報に基づいて、前記オブジェクトをレンダリングするためのプリセット情報が前記オブジェクト情報の拡張領域に含まれているか否かを判断する段階と、前記プリセット情報が前記オブジェクト情報に含まれていない場合、前記オブジェクトゲイン及び前記オブジェクトゲイン比率のうち少なくとも一つを用いて前記オブジェクトをレンダリングするための初期プリセット情報を生成する段階と、前記初期プリセット情報を用いて、前記ダウンミックス信号に含まれているオブジェクトをレンダリングする段階と、を有することを特徴とするオーディオ信号処理方法を提供する。これによれば、エンコーダからプリセット情報が受信されない場合にも、受信されたオブジェクト情報を用いて初期プリセット情報を生成することによって、オーディオ信号を復元することができる。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、オーディオ信号の処理方法及び装置に係り、特に、デジタル媒体、放送信号などを通じて受信されたオーディオ信号を処理することができるオーディオ信号の処理方法及び装置に関するものである。
【背景技術】
【0002】
複数個のオブジェクトを含むオーディオ信号を、モノまたはステレオ信号にダウンミックスしてダウンミックス信号を生成する過程において、オブジェクトからパラメータが抽出される。これらのパラメータは、ダウンミックスされた信号をデコーディングする過程で用いられる。また、オブジェクトの位置(position)及びゲイン(gain)は、パラメータの他にユーザの選択によってもコントロールすることができる。
【発明の概要】
【発明が解決しようとする課題】
【0003】
しかしながら、ダウンミックス信号に含まれているオブジェクトは、ユーザの選択によって調節しなければならない。このようにユーザによってオブジェクトを制御する場合、すべてのオブジェクト信号を直接制御しなければならないという面倒さがある他、専門家によって制御される場合に比べてはオーディオ信号を最適の状態に再現し難い。
【0004】
本発明は、従来技術の制限や欠点による上記問題のうちの一つ又は複数を実質的に防止するオーディオ信号の処理方法および装置を対象とする。
【0005】
本発明は、上記問題点を解決するためのもので、その目的は、既に設定されたプリセット情報及びプリセットメタデータを用いてオブジェクトのレベル及びパニングをコントロールすることができるオーディオ信号処理方法及び装置を提供することにある。
【0006】
本発明の他の目的は、オブジェクトのレベル及びパニングをコントロールするプリセット情報が受信されない場合、オブジェクト情報に含まれるオブジェクトゲイン及びオブジェクトゲイン比率のうち少なくとも一つを用いて初期プリセット情報を生成することができるオーディオ信号処理方法及び装置を提供することにある。
【0007】
本発明のさらに他の目的は、音源の特性及びユーザの利用目的に応じて、オブジェクトゲイン及び/またはオブジェクトゲイン比率を用いて、ダウンミックス信号に含まれているオブジェクトのゲインのみを調節したり、ゲイン及びパニングの両方を調節したりすることができるプリセット情報を提供するオーディオ信号処理方法及び装置を提供することにある。
【0008】
本発明のさらに他の目的は、オブジェクトゲイン及びオブジェクトゲイン比率のうち少なくとも一つを用いて生成されたプリセット情報を、音源と別に抽出して保存することによって、別の再生装置でプリセット情報を利用することができるオーディオ信号処理方法及び装置を提供することにある。
【0009】
本発明のさらに他の目的は、音源の特性によってプリセット情報及びプリセットメタデータをダウンミックス信号の全データ領域にまたはダウンミックス信号の一データ領域に適用することによってダウンミックス信号に含まれているオブジェクトを調節することができるオーディオ信号処理方法及び装置を提供することにある。
【課題を解決するための手段】
【0010】
上記の目的を達成するために、本発明に係るオーディオ信号処理方法は、
少なくとも一つのオブジェクトを含むダウンミックス信号及びオブジェクト情報を受信する段階であって、前記オブジェクト情報は、前記ダウンミックス信号に含まれている前記オブジェクトに適用されたゲインを表すオブジェクトゲイン及び前記ダウンミックス信号の2つ以上のチャネルに含まれている前記オブジェクトのゲイン差を表すオブジェクトゲイン比率のうち少なくとも一つと、前記オブジェクト情報の拡張領域に含まれているデータのタイプを表すデータタイプ情報と、を有する、段階と、
前記データタイプ情報に基づいて、前記オブジェクトをレンダリングするためのプリセット情報が前記オブジェクト情報の拡張領域に含まれているか否かを判断する段階と、
前記プリセット情報が前記オブジェクト情報に含まれていない場合、前記オブジェクトゲイン及び前記オブジェクトゲイン比率のうち少なくとも一つを用いて、前記オブジェクトをレンダリングするための初期プリセット情報を生成する段階と、
前記初期プリセット情報を用いて、前記ダウンミックス信号に含まれているオブジェクトをレンダリングする段階と、を有する。
【0011】
前記ダウンミックス信号がモノ信号である場合、前記初期プリセット情報は、前記オブジェクトゲインを用いて生成することができる。
【0012】
前記ダウンミックス信号がステレオ信号である場合、前記初期プリセット情報は、前記オブジェクトゲイン及び前記オブジェクトゲイン比率を用いて生成することができる。前記初期プリセット情報は、前記オブジェクトのゲインのみを調節する第1初期プリセット情報と、前記オブジェクトのゲイン及びパニングを調節する第2初期プリセット情報と、を有することができる。
【0013】
好適には、前記初期プリセット情報を、前記オブジェクト情報のデータ領域ごとに生成することができる。
【0014】
より好適には、前記オブジェクトをレンダリングする段階は、前記オブジェクトゲイン及び前記オブジェクトゲイン比率をさらに用いることができる。
【0015】
また、上記の目的を達成するために、本発明に係るオーディオ信号処理装置は、
少なくとも一つのオブジェクトを含むダウンミックス信号及びオブジェクト情報を受信する受信部であって、前記オブジェクト情報は、前記ダウンミックス信号に含まれている前記オブジェクトに適用されたゲインを表すオブジェクトゲイン及び前記ダウンミックス信号の2つ以上のチャネルに含まれている前記オブジェクトのゲイン差を表すオブジェクトゲイン比率のうちの少なくとも一つと、前記オブジェクト情報の拡張領域に含まれているデータのタイプを表すデータタイプ情報とを有する、受信部と、
前記データタイプ情報に基づいて、前記オブジェクトをレンダリングするためのプリセット情報が前記オブジェクト情報の拡張領域に含まれているか否かを判断するプリセット情報判断部と、
前記プリセット情報が含まれない場合、前記オブジェクトゲイン及び前記オブジェクトゲイン比率のうち少なくとも一つを用いて、前記オブジェクトをレンダリングするための初期プリセット情報を生成する初期プリセット情報生成部と、
前記初期プリセット情報を用いて、前記ダウンミックス信号に含まれているオブジェクトをレンダリングするレンダリング部と、を有することができる。
【発明の効果】
【0016】
本発明は、下記の効果及び利点を提供する。
【0017】
第一に、既に設定されたプリセット情報を受信する場合、それぞれのオブジェクトへのユーザの設定なしに、既に設定された複数個のプリセット情報のうち一つを複数個のプリセットメタデータを用いて選択することによって容易にオブジェクトの出力チャネルのレベルを調節することができる。
【0018】
第二に、プリセット情報が受信されない場合にも、受信されたオブジェクト情報を用いて初期プリセット情報を生成することによってオーディオ信号を復元することができる。
【0019】
第三に、音源の特性及びユーザの利用目的に応じて、デコーダ側で生成されたプリセット情報を用いてダウンミックス信号に含まれているオブジェクトのゲイン及び/またはパニングを調節することができる。
【0020】
第四に、プリセット情報を音源と別に抽出して保存することによって、音源とは別にプリセット情報のみを抽出して使用することができ、音源に対する著作権侵害の問題なしに、別個の再生装置で効果的にプリセット情報を用いることができる。
【0021】
第五に、音源の特性によってプリセット情報をデータ領域単位に個別に選択して適用したり、ダウンミックス信号全体に同じプリセット情報を選択して適用したりすることによって、オーディオ信号を効率的に復元することができる。
【図面の簡単な説明】
【0022】
【図1】本発明の一実施例による、オブジェクト情報を用いてプリセット情報を生成するプリセット情報生成部を含むオーディオ信号処理装置の構成を示す図である。
【図2】図1のプリセット情報生成部の構成を示す図である。
【図3】図2の初期プリセット情報生成部の構成を示す図である。
【図4A】プリセットモードのうち、カラオケモードまたはアカペラモードが選択される場合、調節されたオブジェクトのレベルが表示される表示部を示す図である。
【図4B】プリセットモードのうち、カラオケモードまたはアカペラモードが選択される場合、調節されたオブジェクトのレベルが表示される表示部を示す図である。
【図5】本発明の他の実施例によるオーディオ信号処理装置を示す図である。
【図6】本発明のさらに他の実施例による、プリセット情報保存部及びプリセットメタデータ生成部を含むオーディオ信号処理装置を示す図である。
【図7】プリセット情報を別に保存して利用できるオーディオ信号処理方法を示す概念図である。
【図8A】本発明のさらに他の実施例によるプリセット属性情報によってプリセット情報を適用してダウンミックス信号に含まれたオブジェクトを調節する概念図である。
【図8B】本発明のさらに他の実施例によるプリセット属性情報によってプリセット情報を適用してダウンミックス信号に含まれたオブジェクトを調節する概念図である。
【図9】本発明のさらに他の実施例によるオーディオ信号処理装置を示す図である。
【図10A】本発明のさらに他の実施例によってプリセット情報がレンダリング部に適用される方法を示すブロック図である。
【図10B】本発明のさらに他の実施例によってプリセット情報がレンダリング部に適用される方法を示すブロック図である。
【図11】本発明のさらに他の実施例によるプリセット生成部を含んでいる製品の概略的な構成を示す図である。
【図12A】本発明のさらに他の実施例によるプリセット生成部を含んでいる製品間の関係を示す図である。
【図12B】本発明のさらに他の実施例によるプリセット生成部を含んでいる製品間の関係を示す図である。
【図13】本発明のさらに他の実施例によるプリセット生成部を含んでいる放送信号デコーディング装置の概略的な構成を示す図である。
【発明を実施するための形態】
【0023】
以下、本発明をよりよく理解するため添付された図面は、本明細書に組み込まれて本明細書の一部を構成する。これらの添付図面は、本発明の実施形態を例示し、本明細書の記載と併せて本明細書の主旨を説明するためのものである。
【0024】
本発明の他の特徴および利点は、以下の記載で説明するが、その一部については、この記載から明らかになるであろうし、あるいは、本発明の実施によって理解されるであろう。本発明の目的および他の利点は、明細書および特許請求の範囲の書面ならびに添付図面で示された構成によって、実現され達成されるであろう。
【0025】
上記の目的を達成するために、本発明に係るオーディオ信号処理方法は、
少なくとも一つのオブジェクトを含むダウンミックス信号及びオブジェクト情報を受信する段階であって、前記オブジェクト情報は、前記ダウンミックス信号に含まれている前記オブジェクトに適用されたゲインを表すオブジェクトゲイン及び前記ダウンミックス信号の2つ以上のチャネルに含まれている前記オブジェクトのゲイン差を表すオブジェクトゲイン比率のうち少なくとも一つと、前記オブジェクト情報の拡張領域に含まれているデータのタイプを表すデータタイプ情報と、を有する、段階と、
前記データタイプ情報に基づいて、前記オブジェクトをレンダリングするためのプリセット情報が前記オブジェクト情報の拡張領域に含まれているか否かを判断する段階と、
前記プリセット情報が前記オブジェクト情報に含まれていない場合、前記オブジェクトゲイン及び前記オブジェクトゲイン比率のうち少なくとも一つを用いて、前記オブジェクトをレンダリングするための初期プリセット情報を生成する段階と、
前記初期プリセット情報を用いて、前記ダウンミックス信号に含まれているオブジェクトをレンダリングする段階と、を有する。
【0026】
前記ダウンミックス信号がモノ信号である場合、前記初期プリセット情報は、前記オブジェクトゲインを用いて生成することができる。
【0027】
前記ダウンミックス信号がステレオ信号である場合、前記初期プリセット情報は、前記オブジェクトゲイン及び前記オブジェクトゲイン比率を用いて生成することができる。前記初期プリセット情報は、前記オブジェクトのゲインのみを調節する第1初期プリセット情報と、前記オブジェクトのゲイン及びパニングを調節する第2初期プリセット情報と、を有することができる。
【0028】
好適には、前記初期プリセット情報を、前記オブジェクト情報のデータ領域ごとに生成することができる。
【0029】
より好適には、前記オブジェクトをレンダリングする段階は、前記オブジェクトゲイン及び前記オブジェクトゲイン比率をさらに用いることができる。
【0030】
また、上記の目的を達成するために、本発明に係るオーディオ信号処理装置は、
少なくとも一つのオブジェクトを含むダウンミックス信号及びオブジェクト情報を受信する受信部であって、前記オブジェクト情報は、前記ダウンミックス信号に含まれている前記オブジェクトに適用されたゲインを表すオブジェクトゲイン及び前記ダウンミックス信号の2つ以上のチャネルに含まれている前記オブジェクトのゲイン差を表すオブジェクトゲイン比率のうちの少なくとも一つと、前記オブジェクト情報の拡張領域に含まれているデータのタイプを表すデータタイプ情報とを有する、受信部と、
前記データタイプ情報に基づいて、前記オブジェクトをレンダリングするためのプリセット情報が前記オブジェクト情報の拡張領域に含まれているか否かを判断するプリセット情報判断部と、
前記プリセット情報が含まれない場合、前記オブジェクトゲイン及び前記オブジェクトゲイン比率のうち少なくとも一つを用いて、前記オブジェクトをレンダリングするための初期プリセット情報を生成する初期プリセット情報生成部と、
前記初期プリセット情報を用いて、前記ダウンミックス信号に含まれているオブジェクトをレンダリングするレンダリング部と、を有することができる。
【0031】
以下の本発明に関する概略説明とそれに続く詳細説明は、共に、実施例とその説明であり、特許請求の範囲に記載された本発明をさらに説明するためのものであることを理解されたい。
【実施例】
【0032】
以下、添付の図面を参照しつつ、本発明の好適な実施例を詳細に説明する。特に、本発明における用語は、以下で参照されるように解釈することができる。また、本明細書に開示されていない用語は、以下の本発明の技術的思想に符合する意味および概念として解釈することができる。したがって、本明細書に記載された実施例と図面に例示された構成は、本発明の最も好適な一実施例に過ぎず、本発明の技術的思想を全部示すものではないため、本出願時点においてそれらに代替可能な様々な均等物と変形例が存在することができる。
【0033】
特に、本明細書で情報(information)は、値(values)、パラメータ(parameters)、係数(coefficients)、要素(elements)などを総称する用語であり、その意味は場合によって適宜解釈すればよく、したがって、本発明はこれに限定されない。
【0034】
図1は、本発明の一実施例による、オブジェクト情報を用いてプリセット情報を生成するプリセット情報生成部を含むオーディオ信号処理装置100の構成を示す図である。オブジェクトを調節するために既に設定された情報の集合を、本明細書ではプリセットモード(preset mode)といい、プリセットモードは、プリセットメタデータ(preset metadata)及びプリセット情報(preset information)を含む。プリセット情報は、オーディオ信号の特性または聴取環境に応じてユーザにより選択されうる様々なモードを表すことができるとともに、少なくとも一つが存在することができ、特に、オブジェクトの出力時、エンコーディング時に存在していたチャネルではなく他のチャネルに含めたり(以下、パニングという。)、オブジェクトのゲインを調節することによって出力チャネルのレベルを調節することができる。
【0035】
図1を参照すると、本発明の一実施例によるオーディオ信号処理装置100は、主として、ダウンミキシング部110、オブジェクト情報生成部120、情報受信部130、プリセット生成部140及びレンダリング部150を含む。
【0036】
複数個のオブジェクトは、ダウンミキシング部110に入力されてモノまたはステレオダウンミックス信号を生成する。また、複数個のオブジェクトは、オブジェクト情報生成部120に入力されて、オブジェクトの属性を表すオブジェクト情報(object information)を生成する。オブジェクト情報は、オブジェクトのレベルを表すオブジェクトレベル情報、ダウンミックス信号生成時にオブジェクトに適用されるゲインを表すオブジェクトゲイン、ダウンミックス信号がステレオまたはマルチチャネルダウンミックス信号である場合、当該ダウンミックス信号の各チャネルにオブジェクトが含まれた程度を表すゲイン間の差を表すオブジェクトゲイン比率(object gain ratio)を含む。また、オブジェクト情報は、オブジェクト間相関関係が存在するか否かを示すオブジェクト間相関情報をさらに有する。
【0037】
また、オブジェクト情報生成部120は、情報生成部120で生成されるビットストリームのうち、オブジェクト情報の拡張領域に含まれているデータタイプを表すデータタイプ情報(data_type_information)を生成することができる。このデータタイプ情報の詳細な意味を、下記の表1に示す。オブジェクト情報生成部120で生成されたオブジェクトゲイン、オブジェクトゲイン比率及びデータタイプ情報などは、一つのビットストリームに含めて転送することができ、具体的には、ダウンミックス信号を含むビットストリームの補助領域(ancillary region)に含めて転送することができる。
【0038】
【表1】
【0039】
情報受信部130は、オブジェクトゲイン、オブジェクトゲイン比率及びデータタイプ情報を含むビットストリームを受信し、オブジェクトゲイン、オブジェクトゲイン比率及びデータタイプ情報をプリセット生成部140及びレンダリング部150に出力する。
【0040】
一方、プリセット生成部140は、データタイプ情報と、オブジェクトゲイン及びオブジェクトゲイン比率のうち少なくとも一つとを受信する。入力されたオブジェクトゲイン及びオブジェクトゲイン比率のうち少なくとも一つを用いて初期プリセット情報を生成することができ、これについては、図2及び図3を参照して詳細に後述する。
【0041】
レンダリング部150は、複数個のオブジェクトを含むオーディオ信号をダウンミキシングして生成されたダウンミックス信号、情報受信部130から出力されたオブジェクト情報、及びプリセット生成部140から出力されたプリセット情報を受信する。この場合、プリセット情報は、ダウンミックス信号に含まれているオブジェクトに適用されて、オブジェクトのレベルを調節したり、オブジェクトの含まれる出力チャネルを調節したりすることができる。
【0042】
また、オーディオ信号処理装置100がディスプレイ部(図示せず)を含む場合、レンダリング部150でレンダリングされたオーディオ信号のレベル、生成されたプリセット情報の特徴などを画面に表示することができる。
【0043】
このように、本発明のオーディオ信号処理装置100は、デコーディング装置にプリセット生成部140を含むので、エンコーダからプリセット情報を転送しなかった場合にも、レンダリングデータであるプリセット情報を生成して用いることによって、音源の特性またはユーザの利用目的に応じてオーディオ信号を調節することができる。
【0044】
図2は、図1のプリセット情報生成部140の構成を示す図である。図2を参照すると、プリセット情報生成部140は、プリセット情報有無判断部210及び初期プリセット情報生成部220を含む。
【0045】
プリセット情報有無判断部210は、まず、データタイプ情報を受信し、受信したデータタイプ情報に基づいて、ビットストリームにプリセット情報が含まれているか否かを判断する。上記表1に表すように、データタイプ情報が1の場合、すなわち、プリセット情報がビットストリームに含まれている場合には、ビットストリームからプリセット情報を抽出してダウンミックス信号に適用する。これについては、図8A乃至図10Bで詳細に後述する。
【0046】
一方、データタイプ情報が0の場合、すなわち、転送されたビットストリームにプリセット情報が含まれていない場合には、オーディオ信号をデコーディングするためのプリセット情報が必要とされる。この場合、初期プリセット生成部220は、オブジェクトゲイン及びオブジェクトゲイン比率を受信し、これらを用いて初期プリセット情報を生成することができる。以下、初期プリセット生成部220で初期プリセット情報を生成する方法について、図3を参照して説明する。
【0047】
図3は、図2の初期プリセット情報生成部220の構成を示す図である。図3を参照すると、初期プリセット情報生成部220は、主に、モノ初期プリセット情報生成部310及びステレオ初期プリセット情報生成部320を含む。
【0048】
モノ初期プリセット情報生成部310が初期プリセット情報を生成するか、或いは、ステレオ初期プリセット情報生成部320が初期プリセット情報を生成するかは、ダウンミックス信号のチャネルによって決定される。ダウンミックス信号がモノ信号である場合、モノ初期プリセット情報生成部310が活性化される。この場合、モノ初期プリセット情報生成部310は、オブジェクトゲインを受信してモノ初期プリセット情報を生成することができる。好ましくは、モノ初期プリセット情報は、オブジェクトゲインを、レンダリングマトリクスのうちセンターチャネルの要素(element)とし、残りのチャネルの要素(element)は0に設定することができる。
【0049】
ダウンミックス信号がステレオ信号である場合、ステレオ初期プリセット情報生成部320が活性化され、オブジェクトゲインの他にオブジェクトゲイン比率も用いて初期プリセット情報を生成することができる。ステレオ初期プリセット情報生成部320は、ゲイン調節モード生成部321及びステレオ調節モード生成部322を含む。
【0050】
ステレオ調節モード生成部322は、オブジェクトのゲインを調節し、当該オブジェクトが他のチャネルに存在しうるようにオブジェクトの位置を調節する第2初期プリセット情報を生成することができる。好ましくは、第2初期プリセット情報は、オブジェクトが、ダウンミックス信号のうちいずれかのチャネルにのみ存在する場合、他のチャネルにも存在できるようにオブジェクトの位置を調節する(以下、“パニング”という)。
【0051】
第2初期プリセットモードも、オブジェクトゲイン及びオブジェクトゲイン比率を用いて生成されたマトリクスで表現することができる。このマトリクスは、下記の式1で表現することができ、マトリクスの各要素(element)は、下記の式2及び3を用いて計算することができる。
【0052】
[式1]
【数1】
【0053】
[式2]
【数2】
【0054】
[式3]
【数3】
【0055】
一方、ゲイン調節モード生成部321は、オブジェクトのゲインを修正するための情報のみを含む第1初期プリセット情報を生成することができる。好ましくは、第1初期プリセット情報は、ボーカルオブジェクトにのみ小さいゲイン値を適用することでボーカルオブジェクトのレベルを略0にさせるカラオケモード、及びボーカルオブジェクト以外の他のオブジェクトに小さいゲイン値を適用することで、他のオブジェクトのレベルを略0にさせるボーカルオブジェクトのみを出力するアカペラモードを含むことができる。これらオブジェクトのうち、ボーカルオブジェクトは、エンコーディング時に生成されたオブジェクトの位置情報及びオブジェクト情報に含まれているチャネル相関差情報のうち少なくとも一つを用いて判断することができる。
【0056】
また、第1初期プリセット情報も同様に、オブジェクトゲイン及びオブジェクトゲイン比率を用いて生成されたマトリクスで表現することができる。このマトリクスは、下記の式3のような形態とすることができ、マトリクスの各要素は、下記の式4及び5を用いて計算することができる。
【0057】
[式4]
【数4】
【0058】
[式5]
【数5】
【0059】
[式6]
【数6】
【0060】
ゲイン調節モード生成部321またはステレオ調節モード生成部322で生成された第1初期プリセット情報または第2初期プリセット情報は、図1のレンダリング部150に入力されてダウンミックス信号に適用されることができ、ダウンミックス信号に含まれているオブジェクトを調節する。
【0061】
好ましくは、初期プリセット情報が第1初期プリセット情報である場合には、オブジェクトのゲインのみを調節し、第2初期プリセット情報である場合には、オブジェクトのゲイン及びパニングを調節することができる。
【0062】
また、初期プリセット情報を、オブジェクトゲイン及びオブジェクトゲイン比率のうち少なくとも一つを用いてオブジェクト情報のデータ領域ごとに生成することができる。データ領域は、実際にオーディオ信号に関するデータを含むビットストリームの領域で、フレームを含むことができる。
【0063】
図4A及び図4Bは、本発明の一実施例によって調節されたオブジェクトを表示するディスプレイ部を示す図である。図4A及び図4Bを参照すると、初期プリセット情報が適用されて調節されたオブジェクトのレベルは、オブジェクトの特徴を表すメタデータと一緒にディスプレイ部に表示することができる。
【0064】
例えば、初期プリセット情報がゲイン調節初期プリセット情報のうちカラオケモードである場合は、図4Aに示すように、初期プリセット情報を用いて、出力信号に含まれているオブジェクトのうちボーカルオブジェクトの大きさを減少させることができ、これを画面に表示して、カラオケモードが活性化されたことをユーザに認知させることができる。
【0065】
一方、初期プリセット情報がアカペラモードである場合には、図4Bに示すように、初期プリセット情報を用いて、出力信号に含まれているオブジェクトのうちボーカルオブジェクト以外の残りオブジェクトの大きさを減少させることができ、これを画面に表示して、アカペラモードが活性化されたことをユーザに認知させることができる。
【0066】
オブジェクトがどのようなものかを表すテキスト形態の情報を、プリセットメタデータという。プリセットメタデータは、オブジェクト名の他に、プリセット情報の生成日、作成者、プリセットモードの名称なども表すことができるが、これに限定されない。
【0067】
図5は、本発明の他の実施例によるオーディオ信号処理装置500を示す図である。オーディオ信号処理装置500は、主に、ダウンミキシング部510、オブジェクト情報生成部520、情報生成部530、ダウンミックス信号処理部540及びマルチチャネルデコーディング部550を含む。図5のダウンミキシング部510及びオブジェクト情報生成部520は、図1のダウンミキシング部110及び情報生成部120と同一の機能及び構成を有するので、その詳細な説明は省略する。
【0068】
情報生成部530は、プリセット情報生成部531及びダウンミックス信号処理情報生成部532を含み、SAOCビットストリームを受信する。プリセット情報生成部531でプリセット情報を生成するか否かは、入力されたSAOCビットストリームに含まれているデータタイプ情報に基づいて判断する。
【0069】
データタイプ情報に基づいてビットストリームにプリセット情報が含まれない場合、プリセット情報生成部531は、SAOCビットストリームに含まれているオブジェクトゲイン及びオブジェクトゲイン比率を用いて初期プリセット情報をデコーダ側で生成して出力することができる。
【0070】
プリセット情報生成部531は、図1乃至図3で説明したように初期プリセット情報を生成することができる。
【0071】
ダウンミックス信号処理情報生成部532は、プリセット情報及びSAOCビットストリームを受信し、これらを用いてダウンミックス信号を前処理(pre-processing)するためのダウンミックス処理情報を生成する。
【0072】
以降、このダウンミックス処理情報はダウンミックス信号処理部540に入力されて、ダウンミックス信号に含まれているオブジェクトが含まれるチャネルを変動させることによってパニングを行うことができる。
【0073】
もし、オーディオ信号の最終出力チャネルの数がダウンミックス信号のチャネルの数よりも多い場合、情報生成部530は、SAOCビットストリーム及び生成されたプリセット情報を用いて、ダウンミックス信号をアップミキシングするためのマルチチャネル情報をさらに生成することができる。この場合、マルチチャネル情報はマルチチャネルデコーディング部550に出力され、マルチチャネルデコーディング部550は、前処理されたダウンミックス信号とマルチチャネル情報を受信してアップミキシングを行うことで、マルチチャネルオーディオ信号を生成することができる。
【0074】
このように、本発明のオーディオ信号処理装置は、複数個のオブジェクトを含むダウンミックス信号をマルチチャネル信号にデコーディングする際に、プリセット情報が転送されない場合にも、SAOCビットストリームに含まれているオブジェクト情報を用いて初期プリセット情報を生成することができる。
【0075】
よって、このデコーダ側で生成された初期プリセット情報を用いてオブジェクトのレベル及び/またはパニングを調節することができる。この時、初期プリセット情報はデータ領域ごとに生成されるため、オーディオ信号を原音により近く復元することができる。
【0076】
図6は、本発明のさらに他の実施例によるオーディオ信号処理装置600を示す図である。本発明のオーディオ信号処理装置及び方法は、プリセット情報を用いてダウンミックス信号をレンダリングすることによって、ユーザの利用目的または再生環境に応じて様々なバージョンのオーディオ信号を聴取可能にする。この場合、プリセット情報の適用されたオーディオ信号を別に抽出して保存したり、許可されていない経路を通じて他の再生装置で利用したりすることは不法とされている。そこで、本発明のオーディオ信号処理装置は、オーディオ信号とは別に生成されたプリセット情報のみを別に保存するプリセット情報保存部をさらに含む。
【0077】
図6を参照すると、本発明のさらに他の実施例によるオーディオ信号処理装置600は、主に、ダウンミキシング部610、情報生成部620、プリセット生成部630、レンダリング部640、プリセットメタデータ生成部650及びプリセット情報保存部660を含む。図6のダウンミキシング部610、情報生成部620、レンダリング部640は、図5における同一の名前のブロックと同一の機能及び構成を有するので、その詳細な説明を省略する。
【0078】
一方、プリセット生成部630は、図5のプリセット生成部531と同一の機能及び構成によって初期プリセット情報を生成することができる。また、プリセット生成部630は、情報生成部620から、ダウンミックス信号に含まれているオブジェクトをレンダリングするためのプリセット情報が転送される場合、ユーザ入力をさらに用いて修正プリセット情報を生成することもできる。
【0079】
プリセット情報保存部660は、プリセット生成部630で生成されたプリセット情報を保存することができる。このプリセット情報保存部660は、別のメモリ形態を有してもよく、生成されたプリセット情報の他に、プリセット情報の適用されるデータ領域に関する情報、プリセット情報生成時に用いられたオブジェクトゲイン及びオブジェクトゲイン比率なども保存することができる。プリセット情報生成部630が修正プリセット情報を生成する場合、この情報がプリセット情報保存部660保存されうることは勿論である。
【0080】
プリセットメタデータ生成部650は、プリセット情報に対応するプリセットメタデータを生成することができる。プリセットメタデータは、ユーザから入力される信号を用いて生成することができて、ユーザから入力される信号は、ユーザ入力部(図示せず)を介して入力されることができる。また、プリセットメタデータは、プリセット情報の適用されるダウンミックス信号名、プリセット情報の作成者、作成日などを含むことができる。
【0081】
図7は、図6のオーディオ信号処理装置を用いてプリセット情報を別に保存、転送及び利用することを示す概念図である。プリセット情報は、修正プリセット情報及び初期プリセット情報を有する。
【0082】
図7を参照すると、エンコーディング装置で複数個のオブジェクトを用いて生成されたビットストリームをHeyJude.saocと命名する。このHeyJude.saocは、複数個のオブジェクトがダウンミキシングされたダウンミックス信号Downmix、オブジェクトの属性を表すオブジェクト情報SAOC params、及びダウンミックス信号をレンダリングするためのプリセット情報artistic Presetを含む。
【0083】
このようにエンコーディングされたSAOCコンテンツは、サービスポータル(Service Portal)によって有/無線で提供されることができる。サービスポータルは、コンテンツサーバとユーザプリセットサーバを有することができる。ここで、コンテンツサーバは、エンコーディングされたダウンミックス信号及びオブジェクト情報を保存することができ、ユーザプリセットサーバは、プリセット情報を保存することができる。コンテンツサーバ及びユーザプリセットサーバは、別のユニットとしてもよく、同一ユニットに含まれて動作してもよい。
【0084】
ユーザは、サービスポータルから適法に許可を受けた場合、例えば、転送料を支給する等して許可を受けた場合、ダウンミックス信号及びオブジェクト情報を受け取ることができ、これとは別に、ユーザプリセットサーバからプリセット情報を受け取ることができる。図7に示すように、HeyJude.saocを転送料を支払って受け取ることができ、SAOCプレイヤAで直接生成したプリセット情報及び該当の音源名をプリセットメタデータとして生成してHeyJude_Mymix.saoc+というファイルをサービスポータルに転送することができる。
【0085】
一方、SAOCプレイヤBは、転送料を支払ってHeyJude.saocファイルを受け取ることとは別に、HeyJude_Mymix.saoc+ファイルをサービスポータルから受け取ることができる。この場合、HeyJude_Mymix.saoc+ファイルはHeyJude.saocファイルとは別の著作物であるから、HeyJude_Mymix.saoc+ファイルの転送はHeyJude.saocファイルの原著作者の権利を侵害しない。
【0086】
図8A及び図8Bは、本発明の一実施例によるプリセット属性情報によってプリセット情報を適用して、ダウンミックス信号に含まれているオブジェクトを調節する概念図である。本発明のオーディオ信号は、エンコーダでダウンミックス信号及びオブジェクト情報にエンコーディングされ、これらは一つのビットストリームまたは別個のビットストリームの形態としてデコーダに転送される。
【0087】
図8A及び図8Bを参照すると、ビットストリームに含まれているオブジェクト情報は、具体的に、構成情報領域と複数個のデータ領域(データ領域1、データ領域2、…、データ領域n)とで構成される。構成情報領域は、オブジェクト情報のビットストリームにおいて先頭部に位置している領域で、オブジェクト情報の全データ領域に共通して適用される情報を含む。
【0088】
例えば、ツリー構造などを含む構成情報、データ領域長情報(data region length information)及びオブジェクトの個数情報などを含むことができる。
【0089】
一方、データ領域は、構成情報領域に含まれているデータ領域長情報に基づいてオーディオ信号全体の時間ドメインを分割したユニットであり、フレームを含むことができる。オブジェクト情報のデータ領域は、ダウンミックス信号のデータ領域に対応し、対応するデータ領域のオブジェクトの属性に基づくオブジェクトレベル情報、オブジェクトゲイン情報などのオブジェクトデータ情報を含む。
【0090】
まず、本発明の一実施例によるオーディオ信号処理方法では、ビットストリームのオブジェクト情報からプリセット属性情報(preset_attribute_information)を読む。プリセット属性情報は、プリセット情報がビットストリームにおいてどの領域に含まれているかを表すもので、具体的には、プリセット情報がオブジェクト情報の構成情報領域に含まれるか或いはデータ領域に含まれるかを表し、その詳細な意味は、下記表2の通りである。
【0091】
【表2】
【0092】
まず、図8Aを参照すると、プリセット属性情報が0であって、プリセット情報が構成情報領域に含まれることを表す場合、構成情報領域から抽出されたプリセット情報は、ダウンミックス信号の全データ領域に同一に適用されてレンダリングを行う。
【0093】
一方、図8Bを参照すると、プリセット属性情報が1であって、プリセット情報がデータ領域に含まれることを表す場合、データ領域から抽出されたプリセット情報は、対応するダウンミックス信号のデータ領域に適用されてレンダリングを行う。例えば、データ領域1から抽出されたプリセット情報は、データ領域1のダウンミックス信号に適用され、データ領域nから抽出されたプリセット情報は、データ領域nのダウンミックス信号に適用されることができる。
【0094】
また、プリセット属性情報は、プリセット情報が変動であるか或いは固定であるかを表すことができる。プリセット属性情報が0に設定され、構成情報領域に含まれる場合、プリセット情報は、固定(static)であるとすることができる。この場合、プリセット情報は、全データ領域に固定して同一に適用される。
【0095】
一方、プリセット属性情報が1に設定され、データ領域に含まれる場合、プリセット情報は変動(dynamic)であるとすることができる。この場合、プリセット情報は、該当のデータ領域にのみ適用されて、対応するデータ領域のダウンミックス信号をレンダリングするから、データ領域別に変動して適用される。ここで、プリセット情報は、変動である場合、データ領域の拡張領域(extension region)に存在することが好ましく、プリセット情報が固定である場合は、構成情報領域の拡張領域(extension region)に存在することが好ましい。
【0096】
したがって、本発明の一実施例によるオーディオ信号処理方法は、プリセット属性情報に基づいて、音源の特性によってデータ領域別に適切なプリセット情報を用いたり、同一プリセット情報を全データ領域に用いたりして、ダウンミックス信号をレンダリングすることができる。
【0097】
図9は、本発明の実施例によるオーディオ信号処理装置900を示す図である。図9を参照すると、オーディオ信号処理装置900は、プリセットモード生成部910、情報受信部(図示せず)、変動プリセットモード受信部920、固定プリセットモード受信部930及びレンダリング部940を含むことができる。
【0098】
プリセットモード生成部910は、オーディオ信号に含まれているオブジェクトをレンダリング時に調節するためのプリセットモードを生成し、プリセット属性決定部911、プリセットメタデータ生成部912及びプリセット情報生成部913を含むことができる。
【0099】
プリセット属性決定部911は、上述の通り、プリセット情報を構成情報領域に含めて全データ領域に適用するか、或いは、データ領域に含めてデータ領域別に適用するかを表すプリセット属性情報を決定する。
【0100】
以降、プリセット属性情報に基づいて、プリセットメタデータ生成部912及びプリセット情報生成部913は、一つのプリセットメタデータ及びプリセット情報、またはデータ領域数だけのプリセットメタデータ及びプリセット情報を生成することができる。
【0101】
プリセットメタデータ生成部912は、プリセット情報を表現するテキスト情報を受信してプリセットメタデータを生成することができる。一方、オブジェクトのレベルを調節するためのゲイン及び/またはオブジェクトの位置がプリセット情報生成部913に入力される場合、オブジェクトに適用されるプリセット情報を生成することができる。
【0102】
プリセット情報は、オブジェクトごとに適用されるように生成することができ、様々なタイプ、例えば、チャネルレベル差(CLD:Channel Level Difference)パラメータ、マトリクス(matrix)などとすることができる。
【0103】
また、プリセット情報生成部913は、オブジェクトの出力チャネルの数を表す出力チャネル情報をさらに生成することができる。
【0104】
プリセットメタデータ生成部912で生成されたプリセットメタデータ及びプリセット情報生成部913で生成されたプリセット情報、出力チャネル情報などは、一つのビットストリームに含めて転送することができ、特に、ダウンミックス信号を含むビットストリームの補助領域に含めて転送することができる。
【0105】
一方、プリセットモード生成部910は、プリセットメタデータ、プリセット情報及び出力チャネル情報がビットストリームに含まれていることを表すプリセット存在情報をさらに生成することができる。このプリセット存在情報は、プリセット情報などがビットストリームのどの領域に含まれているかを表すコンテナタイプとすることもでき、どの領域に含まれているかを表さずに、単にビットストリームに含まれているか否かを表すフラグタイプ(flag type)とすることもできるが、これに限定されない。
【0106】
また、プリセットモード生成部910は、複数個のプリセットモードを生成することができ、それぞれのプリセットモードは、プリセット情報、プリセットメタデータ及び出力チャネル情報を含む。ここで、プリセットモード生成部910は、プリセットモードの個数を表すプリセット個数情報をさらに生成することができる。
【0107】
このように、プリセットモード生成部910は、プリセット属性情報、プリセットメタデータ及びプリセット情報をビットストリームの形態で生成して出力することができる。
【0108】
このビットストリームは、図8A及び8Bに示すような形態を有し、情報受信部(図示せず)に入力される。情報受信部(図示せず)に入力されたビットストリームから、まず、プリセット属性情報を獲得し、プリセット情報が、転送されたビットストリームにおいてどの領域に含まれているかを決定する。
【0109】
変動プリセットモード受信部920は、プリセット属性決定部911から出力されるプリセット属性情報に基づいてプリセット情報がデータ領域に含まれていることを表す場合(表2のpreset_attribute_flag=1の場合)に、動作する。
【0110】
変動プリセットモード受信部920は、該当のデータ領域に対応するプリセットメタデータを受信する変動プリセットメタデータ受信部921及びデータ領域別プリセット情報を受信する変動プリセット情報受信部922を含むことができる。変動プリセットメタデータ受信部921は、選択されたプリセットメタデータを受信して出力し、変動プリセット情報受信部922はプリセット情報を受信する。これについての詳細な説明は、図10A及び図10Bを参照して詳細に後述する。
【0111】
固定プリセットモード受信部930は、プリセット属性情報に基づいてプリセット情報が構成情報領域に含まれていることを表す場合(表2のpreset_attribute_flag=0の場合)に、動作する。
【0112】
固定プリセットモード受信部930は、全データ領域に対応するプリセット情報を受信する固定プリセット情報受信部931、及びプリセットメタデータを受信する固定プリセットメタデータ受信部932を含むことができる。
【0113】
固定プリセットモード受信部930の固定プリセット情報受信部931及び固定プリセットメタデータ受信部932は、受信して出力するプリセット情報及びプリセットメタデータに対応するダウンミックス信号の範囲が異なる以外は、変動プリセットモード受信部920の変動プリセットメタデータ受信部921及び変動プリセット情報受信部922と略同一の構成及び機能を有する。
【0114】
レンダリング部940は、複数個のオブジェクトを含むオーディオ信号をダウンミキシングして生成されたダウンミックス信号、及び変動プリセット情報受信部922から出力されたプリセット情報または固定プリセット情報受信部931から出力されたプリセット情報を取り込む。プリセット情報を、ダウンミックス信号に含まれているオブジェクトに適用することによって、当該オブジェクトのレベルを調節したりオブジェクトの位置を調節したりすることができる。
【0115】
また、オーディオ信号処理装置900がディスプレイ部(図示せず)を含む場合、変動プリセットメタデータ受信部921から出力される選択されたプリセットメタデータ、または固定プリセットメタデータ受信部932から出力される選択されたプリセットメタデータが画面に表示されることができる。
【0116】
図10A及び図10Bは、本発明の実施例によるプリセット情報がレンダリング部に適用される方法を示すブロック図である。
【0117】
まず、図10Aは、変動プリセットモード受信部920から出力されたプリセット情報が、レンダリング部1040で適用される方法を示す図である。変動プリセットモード受信部920は、図3の変動プリセットモード受信部920と同一のもので、変動プリセットメタデータ受信部921及び変動プリセット情報受信部922を含む。
【0118】
変動プリセットモード受信部920は、データ領域ごとにプリセットメタデータ及びプリセット情報を受信して出力し、このプリセット情報はレンダリング部1040に入力される。
【0119】
レンダリング部1040は、プリセット情報の他に、ダウンミックス信号も受信して、データ領域別にレンダリングを行い、データ領域1のレンダリング部1041、データ領域2のレンダリング部1042、…、データ領域nのレンダリング部104nを含む。ここで、レンダリング部1040のそれぞれのデータ領域のレンダリング部104Xはそれぞれ、データ領域に対応するプリセット情報を受信してダウンミックス信号に適用することによってレンダリングを行う。
【0120】
例えば、1番目のデータ領域にはスタジアムモードであるプリセット情報_1が適用され、2番目のデータ領域にはカラオケモードであるプリセット情報_3が適用され、n番目のデータ領域にはニュースモードであるプリセット情報_2(ここで、プリセット情報_nのnは、データ領域モードのインデックスを表す。)が適用されることができる。この時、プリセットメタデータもデータ領域ごとに出力されることは勿論である。
【0121】
図10Bは、固定プリセットモード受信部930から出力されたプリセット情報が、レンダリング部1040で適用される方法を示す図である。
【0122】
固定プリセットモード受信部930は、図9の固定プリセットモード受信部930と同一のものである。固定プリセットモード受信部930は、全データ領域に対応するプリセットメタデータ及びプリセット情報を受信して出力し、レンダリング部1040は、このプリセット情報を受信する。
【0123】
図10Bのレンダリング部1040は、図10Aのレンダリング部と同様に、データ領域数だけのデータ領域レンダリング部104Xを含む。レンダリング部1040は、固定プリセットモード受信部930からプリセット情報を受信する場合、全データ領域レンダリング部104Xで、受信したプリセット情報をダウンミックス信号に同一に適用することによってレンダリングを行う。
【0124】
例えば、固定プリセットモード受信部930から出力されたプリセット情報が、ニュースモードを表すプリセット情報2の場合、1番目のデータ領域からn番目のデータ領域にわたる全データ領域にニュースモードを適用することができる。
【0125】
図11は、本発明の一実施例によるプリセット生成部を含む製品の概略的な構成を示す図であり、図12A及び図12Bは、本発明の実施例によるプリセット生成部を含む製品間の関係を示す図である。
【0126】
図11を参照すると、有/無線通信部1110は、有/無線通信方式によってビットストリームを受信する。具体的に、有/無線通信部1110は、有線通信部1111、赤外線通信部1112、ブルトゥース部1113、無線LAN通信部1114のうち少なくとも一つを含むことができる。
【0127】
ユーザ認証部1120は、ユーザ情報を受信してユーザ認証を行うもので、指紋認識部1121、虹彩認識部1122、顔面認識部1123、及び音声認識部1124のうち少なくとも一つを含むことができる。このユーザ認証部1120では、それぞれ、指紋情報、虹彩情報、顔面輪郭情報、音声情報を受信してユーザ情報に変換し、ユーザ情報と既に登録されているユーザデータとが一致するか否かを判断して、ユーザ認証を行うことができる。
【0128】
入力部1130は、ユーザが様々な種類の命令を入力するための入力装置で、キーパッド部1131、タッチパッド部1132、リモコン部1133のうち少なくとも一つを含むことができるが、本発明はこれに限定されない。一方、プリセット生成部1141に対応するプリセットメタデータが生成される場合、このプリセットメタデータは、ディスプレイ部1162を通じて画面に表示される場合に、入力部1130を介してユーザがプリセットメタデータを選択することができ、選択されたプリセットメタデータに関する情報が制御部1150に入力される。
【0129】
信号デコーディング部1140は、プリセット生成部1141を含み、まず、受信したビットストリームに含まれているプリセットフラグに基づいてプリセット情報が含まれていないと判断される場合、プリセット生成部1141は、オブジェクトゲイン及びオブジェクトゲイン比率を用いてプリセット情報を生成する。受信したビットストリームにプリセット情報が含まれていると、プリセット生成部1141は別のプリセットを生成せずに、ビットストリームからプリセット情報を抽出する。この場合、プリセット情報は、プリセット情報が存在するか否かを表すプリセット存在情報、プリセット情報の個数を表すプリセット個数情報及び出力チャネルの個数に基づく、例えば、出力チャネルがモノ、ステレオ及びマルチチャネルのうち一つであるかを表す出力チャネル情報に基づいて獲得される。プリセット情報がマトリクスで表現された場合、出力チャネル情報を受信しこれに基づいてプリセットマトリクスを受信する。
【0130】
信号デコーディング部1140は、受信したビットストリーム、プリセットメタデータ、及びプリセット情報を用いてオーディオ信号をデコーディングして出力信号を生成し、プリセットメタデータをテキスト形態として出力する。
【0131】
制御部1150は、入力装置から入力信号を受信し、信号デコーディング部1140及び出力部1160のプロセス全般を制御する。上述の通り、制御部1150に、入力部1130から選択されたプリセットメタデータに関する情報が入力信号として入力される。また、有/無線通信部1110から、プリセット情報がビットストリームに含まれていないことを表すデータタイプ情報が入力される場合、オブジェクトゲイン及びオブジェクトゲイン比率を用いてプリセット情報を生成し、これを用いてオーディオ信号をデコーディングする。
【0132】
出力部1160は、信号デコーディング部1140で生成された出力信号などを出力する構成要素で、スピーカ部1161及びディスプレイ部1162を含むことができる。出力信号がオーディオ信号の場合、出力信号はスピーカ部1161から出力され、ビデオ信号の場合、出力信号はディスプレイ部1162から出力される。また、制御部1150により選択されたプリセットメタデータを、ディスプレイ部1162を通じて画面に表示する。
【0133】
図12A及び図12Bは、図11に示す製品に該当する端末同士の関係及び該端末とサーバとの関係をそれぞれ示す図である。
【0134】
図12Aを参照すると、第1端末1210及び第2端末1220が有/無線通信部を通じてデータまたはビットストリームを両方向に通信できることがわかる。有/無線通信部を通じて通信するデータまたはビットストリームは、本発明の図1で生成されたビットストリームであって、図8A及び図8Bに示すビットストリームの形態を有することもでき、図1乃至図11を参照して説明した本発明のプリセットフラグ、プリセット属性情報、プリセット情報、プリセットメタデータ、データタイプ情報などを含むデータであってもよい。また、データタイプ情報のみを含むビットストリームであってもよい。
【0135】
図12Bを参照すると、サーバ1230及び第1端末1240も互いに有/無線通信を行うことができる。
【0136】
図13は、本発明の一実施例によるプリセット生成部を含む放送信号デコーディング装置1300の概略的な構成を示す図である。
【0137】
図13を参照すると、デマルチプレクサ1320は、チューナ1310からTV放送と関連するデータを受信する。これら受信データは、デマルチプレクサ1320で分離され、データデコーダ1330でデコーディングされる。一方、デマルチプレクサ1320で分離されたデータは、HDDのような記憶媒体1350に記憶することができる。
【0138】
デマルチプレクサ1320で分離されたデータは、オーディオデコーダ1341及びビデオデコーダ1342を含むデコーダ1340に入力されてオーディオ信号及びビデオ信号をデコーディングする。オーディオデコーダ1341は、本発明の一実施例によるプリセット生成部1341Aを含み、まず、受信したビットストリームに含まれているプリセットフラグに基づいてプリセット情報が含まれていないと判断される場合、プリセット生成部1341Aは、オブジェクトゲイン及びオブジェクトゲイン比率を用いてプリセット情報を生成する。
【0139】
受信したビットストリームにプリセット情報が含まれている場合には、プリセット生成部1341Aは、別にプリセットを生成せずに、ビットストリームからプリセット情報を抽出する。この場合、プリセット情報は、プリセット情報が存在するか否かを表すプリセット存在情報、プリセット情報の個数を表すプリセット個数情報及び出力チャネルがモノ、ステレオ及びマルチチャネルのうち一つであることを表す出力チャネル情報に基づいて獲得される。プリセット情報がマトリクスで表現された場合、出力チャネル情報を受信してこれに基づいてプリセットマトリクスを受信する。オーディオデコーダ1341は、受信したビットストリーム、プリセットメタデータ、及びプリセット情報を用いてオーディオ信号をデコーディングして出力信号を生成し、プリセットメタデータをテキスト形態として出力する。
【0140】
ディスプレイ部1370は、ビデオデコーダ1342から出力されたビデオ信号とオーディオデコーダ1341から出力されたプリセットメタデータを画面に表示する。また、ディスプレイ部1370は、スピーカ部(図示せず)を含み、オーディオデコーダ1341から出力されるオブジェクトのレベルがプリセット情報に基づいて調節されたオーディオ信号を、ディスプレイ部1370に含まれたスピーカ部から出力する。また、デコーダ1340でデコーディングされたデータは、HDDのような記憶媒体1350に記憶することができる。
【0141】
一方、信号デコーディング装置1300は、ユーザから情報を受け取って、受信したデータを制御できるアプリケーションマネージャ1360をさらに含むことができる。
【0142】
アプリケーションマネージャ1360は、ユーザインターフェースマネージャ1361及びサービスマネージャ1362を含む。ユーザインターフェースマネージャ1361は、ユーザから情報を受け取るためのインターフェースを制御する。例えば、ディスプレイ部1370に表示されるテキストの書体、画面の明るさ、メニュー構成などを制御することができる。一方、サービスマネージャ1362は、デコーダ1340及びディスプレイ部1370で放送信号をデコーディングして出力する場合、受信される放送信号を、ユーザから入力される情報を用いて制御することができる。例えば、放送チャネルの設定、アラーム機能設定、成人認証機能などを提供することができる。アプリケーションマネージャ1360から出力されるデータは、デコーダ1340の他に、ディスプレイ部1370にも転送される。
【0143】
以上では具体的な実施例及び図面に基づいて本発明を説明してきたが、本発明は、それらの具体例に限定されず、本発明の属する技術分野における通常の知識を有する者にとっては、本発明の技術思想及び添付の特許請求の範囲とその均等範囲内で様々な修正及び変形が可能であるということは明らかである。
【産業上の利用可能性】
【0144】
本発明は、オーディオ信号をエンコーディング及びデコーディングするのに適用することができる。
【技術分野】
【0001】
本発明は、オーディオ信号の処理方法及び装置に係り、特に、デジタル媒体、放送信号などを通じて受信されたオーディオ信号を処理することができるオーディオ信号の処理方法及び装置に関するものである。
【背景技術】
【0002】
複数個のオブジェクトを含むオーディオ信号を、モノまたはステレオ信号にダウンミックスしてダウンミックス信号を生成する過程において、オブジェクトからパラメータが抽出される。これらのパラメータは、ダウンミックスされた信号をデコーディングする過程で用いられる。また、オブジェクトの位置(position)及びゲイン(gain)は、パラメータの他にユーザの選択によってもコントロールすることができる。
【発明の概要】
【発明が解決しようとする課題】
【0003】
しかしながら、ダウンミックス信号に含まれているオブジェクトは、ユーザの選択によって調節しなければならない。このようにユーザによってオブジェクトを制御する場合、すべてのオブジェクト信号を直接制御しなければならないという面倒さがある他、専門家によって制御される場合に比べてはオーディオ信号を最適の状態に再現し難い。
【0004】
本発明は、従来技術の制限や欠点による上記問題のうちの一つ又は複数を実質的に防止するオーディオ信号の処理方法および装置を対象とする。
【0005】
本発明は、上記問題点を解決するためのもので、その目的は、既に設定されたプリセット情報及びプリセットメタデータを用いてオブジェクトのレベル及びパニングをコントロールすることができるオーディオ信号処理方法及び装置を提供することにある。
【0006】
本発明の他の目的は、オブジェクトのレベル及びパニングをコントロールするプリセット情報が受信されない場合、オブジェクト情報に含まれるオブジェクトゲイン及びオブジェクトゲイン比率のうち少なくとも一つを用いて初期プリセット情報を生成することができるオーディオ信号処理方法及び装置を提供することにある。
【0007】
本発明のさらに他の目的は、音源の特性及びユーザの利用目的に応じて、オブジェクトゲイン及び/またはオブジェクトゲイン比率を用いて、ダウンミックス信号に含まれているオブジェクトのゲインのみを調節したり、ゲイン及びパニングの両方を調節したりすることができるプリセット情報を提供するオーディオ信号処理方法及び装置を提供することにある。
【0008】
本発明のさらに他の目的は、オブジェクトゲイン及びオブジェクトゲイン比率のうち少なくとも一つを用いて生成されたプリセット情報を、音源と別に抽出して保存することによって、別の再生装置でプリセット情報を利用することができるオーディオ信号処理方法及び装置を提供することにある。
【0009】
本発明のさらに他の目的は、音源の特性によってプリセット情報及びプリセットメタデータをダウンミックス信号の全データ領域にまたはダウンミックス信号の一データ領域に適用することによってダウンミックス信号に含まれているオブジェクトを調節することができるオーディオ信号処理方法及び装置を提供することにある。
【課題を解決するための手段】
【0010】
上記の目的を達成するために、本発明に係るオーディオ信号処理方法は、
少なくとも一つのオブジェクトを含むダウンミックス信号及びオブジェクト情報を受信する段階であって、前記オブジェクト情報は、前記ダウンミックス信号に含まれている前記オブジェクトに適用されたゲインを表すオブジェクトゲイン及び前記ダウンミックス信号の2つ以上のチャネルに含まれている前記オブジェクトのゲイン差を表すオブジェクトゲイン比率のうち少なくとも一つと、前記オブジェクト情報の拡張領域に含まれているデータのタイプを表すデータタイプ情報と、を有する、段階と、
前記データタイプ情報に基づいて、前記オブジェクトをレンダリングするためのプリセット情報が前記オブジェクト情報の拡張領域に含まれているか否かを判断する段階と、
前記プリセット情報が前記オブジェクト情報に含まれていない場合、前記オブジェクトゲイン及び前記オブジェクトゲイン比率のうち少なくとも一つを用いて、前記オブジェクトをレンダリングするための初期プリセット情報を生成する段階と、
前記初期プリセット情報を用いて、前記ダウンミックス信号に含まれているオブジェクトをレンダリングする段階と、を有する。
【0011】
前記ダウンミックス信号がモノ信号である場合、前記初期プリセット情報は、前記オブジェクトゲインを用いて生成することができる。
【0012】
前記ダウンミックス信号がステレオ信号である場合、前記初期プリセット情報は、前記オブジェクトゲイン及び前記オブジェクトゲイン比率を用いて生成することができる。前記初期プリセット情報は、前記オブジェクトのゲインのみを調節する第1初期プリセット情報と、前記オブジェクトのゲイン及びパニングを調節する第2初期プリセット情報と、を有することができる。
【0013】
好適には、前記初期プリセット情報を、前記オブジェクト情報のデータ領域ごとに生成することができる。
【0014】
より好適には、前記オブジェクトをレンダリングする段階は、前記オブジェクトゲイン及び前記オブジェクトゲイン比率をさらに用いることができる。
【0015】
また、上記の目的を達成するために、本発明に係るオーディオ信号処理装置は、
少なくとも一つのオブジェクトを含むダウンミックス信号及びオブジェクト情報を受信する受信部であって、前記オブジェクト情報は、前記ダウンミックス信号に含まれている前記オブジェクトに適用されたゲインを表すオブジェクトゲイン及び前記ダウンミックス信号の2つ以上のチャネルに含まれている前記オブジェクトのゲイン差を表すオブジェクトゲイン比率のうちの少なくとも一つと、前記オブジェクト情報の拡張領域に含まれているデータのタイプを表すデータタイプ情報とを有する、受信部と、
前記データタイプ情報に基づいて、前記オブジェクトをレンダリングするためのプリセット情報が前記オブジェクト情報の拡張領域に含まれているか否かを判断するプリセット情報判断部と、
前記プリセット情報が含まれない場合、前記オブジェクトゲイン及び前記オブジェクトゲイン比率のうち少なくとも一つを用いて、前記オブジェクトをレンダリングするための初期プリセット情報を生成する初期プリセット情報生成部と、
前記初期プリセット情報を用いて、前記ダウンミックス信号に含まれているオブジェクトをレンダリングするレンダリング部と、を有することができる。
【発明の効果】
【0016】
本発明は、下記の効果及び利点を提供する。
【0017】
第一に、既に設定されたプリセット情報を受信する場合、それぞれのオブジェクトへのユーザの設定なしに、既に設定された複数個のプリセット情報のうち一つを複数個のプリセットメタデータを用いて選択することによって容易にオブジェクトの出力チャネルのレベルを調節することができる。
【0018】
第二に、プリセット情報が受信されない場合にも、受信されたオブジェクト情報を用いて初期プリセット情報を生成することによってオーディオ信号を復元することができる。
【0019】
第三に、音源の特性及びユーザの利用目的に応じて、デコーダ側で生成されたプリセット情報を用いてダウンミックス信号に含まれているオブジェクトのゲイン及び/またはパニングを調節することができる。
【0020】
第四に、プリセット情報を音源と別に抽出して保存することによって、音源とは別にプリセット情報のみを抽出して使用することができ、音源に対する著作権侵害の問題なしに、別個の再生装置で効果的にプリセット情報を用いることができる。
【0021】
第五に、音源の特性によってプリセット情報をデータ領域単位に個別に選択して適用したり、ダウンミックス信号全体に同じプリセット情報を選択して適用したりすることによって、オーディオ信号を効率的に復元することができる。
【図面の簡単な説明】
【0022】
【図1】本発明の一実施例による、オブジェクト情報を用いてプリセット情報を生成するプリセット情報生成部を含むオーディオ信号処理装置の構成を示す図である。
【図2】図1のプリセット情報生成部の構成を示す図である。
【図3】図2の初期プリセット情報生成部の構成を示す図である。
【図4A】プリセットモードのうち、カラオケモードまたはアカペラモードが選択される場合、調節されたオブジェクトのレベルが表示される表示部を示す図である。
【図4B】プリセットモードのうち、カラオケモードまたはアカペラモードが選択される場合、調節されたオブジェクトのレベルが表示される表示部を示す図である。
【図5】本発明の他の実施例によるオーディオ信号処理装置を示す図である。
【図6】本発明のさらに他の実施例による、プリセット情報保存部及びプリセットメタデータ生成部を含むオーディオ信号処理装置を示す図である。
【図7】プリセット情報を別に保存して利用できるオーディオ信号処理方法を示す概念図である。
【図8A】本発明のさらに他の実施例によるプリセット属性情報によってプリセット情報を適用してダウンミックス信号に含まれたオブジェクトを調節する概念図である。
【図8B】本発明のさらに他の実施例によるプリセット属性情報によってプリセット情報を適用してダウンミックス信号に含まれたオブジェクトを調節する概念図である。
【図9】本発明のさらに他の実施例によるオーディオ信号処理装置を示す図である。
【図10A】本発明のさらに他の実施例によってプリセット情報がレンダリング部に適用される方法を示すブロック図である。
【図10B】本発明のさらに他の実施例によってプリセット情報がレンダリング部に適用される方法を示すブロック図である。
【図11】本発明のさらに他の実施例によるプリセット生成部を含んでいる製品の概略的な構成を示す図である。
【図12A】本発明のさらに他の実施例によるプリセット生成部を含んでいる製品間の関係を示す図である。
【図12B】本発明のさらに他の実施例によるプリセット生成部を含んでいる製品間の関係を示す図である。
【図13】本発明のさらに他の実施例によるプリセット生成部を含んでいる放送信号デコーディング装置の概略的な構成を示す図である。
【発明を実施するための形態】
【0023】
以下、本発明をよりよく理解するため添付された図面は、本明細書に組み込まれて本明細書の一部を構成する。これらの添付図面は、本発明の実施形態を例示し、本明細書の記載と併せて本明細書の主旨を説明するためのものである。
【0024】
本発明の他の特徴および利点は、以下の記載で説明するが、その一部については、この記載から明らかになるであろうし、あるいは、本発明の実施によって理解されるであろう。本発明の目的および他の利点は、明細書および特許請求の範囲の書面ならびに添付図面で示された構成によって、実現され達成されるであろう。
【0025】
上記の目的を達成するために、本発明に係るオーディオ信号処理方法は、
少なくとも一つのオブジェクトを含むダウンミックス信号及びオブジェクト情報を受信する段階であって、前記オブジェクト情報は、前記ダウンミックス信号に含まれている前記オブジェクトに適用されたゲインを表すオブジェクトゲイン及び前記ダウンミックス信号の2つ以上のチャネルに含まれている前記オブジェクトのゲイン差を表すオブジェクトゲイン比率のうち少なくとも一つと、前記オブジェクト情報の拡張領域に含まれているデータのタイプを表すデータタイプ情報と、を有する、段階と、
前記データタイプ情報に基づいて、前記オブジェクトをレンダリングするためのプリセット情報が前記オブジェクト情報の拡張領域に含まれているか否かを判断する段階と、
前記プリセット情報が前記オブジェクト情報に含まれていない場合、前記オブジェクトゲイン及び前記オブジェクトゲイン比率のうち少なくとも一つを用いて、前記オブジェクトをレンダリングするための初期プリセット情報を生成する段階と、
前記初期プリセット情報を用いて、前記ダウンミックス信号に含まれているオブジェクトをレンダリングする段階と、を有する。
【0026】
前記ダウンミックス信号がモノ信号である場合、前記初期プリセット情報は、前記オブジェクトゲインを用いて生成することができる。
【0027】
前記ダウンミックス信号がステレオ信号である場合、前記初期プリセット情報は、前記オブジェクトゲイン及び前記オブジェクトゲイン比率を用いて生成することができる。前記初期プリセット情報は、前記オブジェクトのゲインのみを調節する第1初期プリセット情報と、前記オブジェクトのゲイン及びパニングを調節する第2初期プリセット情報と、を有することができる。
【0028】
好適には、前記初期プリセット情報を、前記オブジェクト情報のデータ領域ごとに生成することができる。
【0029】
より好適には、前記オブジェクトをレンダリングする段階は、前記オブジェクトゲイン及び前記オブジェクトゲイン比率をさらに用いることができる。
【0030】
また、上記の目的を達成するために、本発明に係るオーディオ信号処理装置は、
少なくとも一つのオブジェクトを含むダウンミックス信号及びオブジェクト情報を受信する受信部であって、前記オブジェクト情報は、前記ダウンミックス信号に含まれている前記オブジェクトに適用されたゲインを表すオブジェクトゲイン及び前記ダウンミックス信号の2つ以上のチャネルに含まれている前記オブジェクトのゲイン差を表すオブジェクトゲイン比率のうちの少なくとも一つと、前記オブジェクト情報の拡張領域に含まれているデータのタイプを表すデータタイプ情報とを有する、受信部と、
前記データタイプ情報に基づいて、前記オブジェクトをレンダリングするためのプリセット情報が前記オブジェクト情報の拡張領域に含まれているか否かを判断するプリセット情報判断部と、
前記プリセット情報が含まれない場合、前記オブジェクトゲイン及び前記オブジェクトゲイン比率のうち少なくとも一つを用いて、前記オブジェクトをレンダリングするための初期プリセット情報を生成する初期プリセット情報生成部と、
前記初期プリセット情報を用いて、前記ダウンミックス信号に含まれているオブジェクトをレンダリングするレンダリング部と、を有することができる。
【0031】
以下の本発明に関する概略説明とそれに続く詳細説明は、共に、実施例とその説明であり、特許請求の範囲に記載された本発明をさらに説明するためのものであることを理解されたい。
【実施例】
【0032】
以下、添付の図面を参照しつつ、本発明の好適な実施例を詳細に説明する。特に、本発明における用語は、以下で参照されるように解釈することができる。また、本明細書に開示されていない用語は、以下の本発明の技術的思想に符合する意味および概念として解釈することができる。したがって、本明細書に記載された実施例と図面に例示された構成は、本発明の最も好適な一実施例に過ぎず、本発明の技術的思想を全部示すものではないため、本出願時点においてそれらに代替可能な様々な均等物と変形例が存在することができる。
【0033】
特に、本明細書で情報(information)は、値(values)、パラメータ(parameters)、係数(coefficients)、要素(elements)などを総称する用語であり、その意味は場合によって適宜解釈すればよく、したがって、本発明はこれに限定されない。
【0034】
図1は、本発明の一実施例による、オブジェクト情報を用いてプリセット情報を生成するプリセット情報生成部を含むオーディオ信号処理装置100の構成を示す図である。オブジェクトを調節するために既に設定された情報の集合を、本明細書ではプリセットモード(preset mode)といい、プリセットモードは、プリセットメタデータ(preset metadata)及びプリセット情報(preset information)を含む。プリセット情報は、オーディオ信号の特性または聴取環境に応じてユーザにより選択されうる様々なモードを表すことができるとともに、少なくとも一つが存在することができ、特に、オブジェクトの出力時、エンコーディング時に存在していたチャネルではなく他のチャネルに含めたり(以下、パニングという。)、オブジェクトのゲインを調節することによって出力チャネルのレベルを調節することができる。
【0035】
図1を参照すると、本発明の一実施例によるオーディオ信号処理装置100は、主として、ダウンミキシング部110、オブジェクト情報生成部120、情報受信部130、プリセット生成部140及びレンダリング部150を含む。
【0036】
複数個のオブジェクトは、ダウンミキシング部110に入力されてモノまたはステレオダウンミックス信号を生成する。また、複数個のオブジェクトは、オブジェクト情報生成部120に入力されて、オブジェクトの属性を表すオブジェクト情報(object information)を生成する。オブジェクト情報は、オブジェクトのレベルを表すオブジェクトレベル情報、ダウンミックス信号生成時にオブジェクトに適用されるゲインを表すオブジェクトゲイン、ダウンミックス信号がステレオまたはマルチチャネルダウンミックス信号である場合、当該ダウンミックス信号の各チャネルにオブジェクトが含まれた程度を表すゲイン間の差を表すオブジェクトゲイン比率(object gain ratio)を含む。また、オブジェクト情報は、オブジェクト間相関関係が存在するか否かを示すオブジェクト間相関情報をさらに有する。
【0037】
また、オブジェクト情報生成部120は、情報生成部120で生成されるビットストリームのうち、オブジェクト情報の拡張領域に含まれているデータタイプを表すデータタイプ情報(data_type_information)を生成することができる。このデータタイプ情報の詳細な意味を、下記の表1に示す。オブジェクト情報生成部120で生成されたオブジェクトゲイン、オブジェクトゲイン比率及びデータタイプ情報などは、一つのビットストリームに含めて転送することができ、具体的には、ダウンミックス信号を含むビットストリームの補助領域(ancillary region)に含めて転送することができる。
【0038】
【表1】
【0039】
情報受信部130は、オブジェクトゲイン、オブジェクトゲイン比率及びデータタイプ情報を含むビットストリームを受信し、オブジェクトゲイン、オブジェクトゲイン比率及びデータタイプ情報をプリセット生成部140及びレンダリング部150に出力する。
【0040】
一方、プリセット生成部140は、データタイプ情報と、オブジェクトゲイン及びオブジェクトゲイン比率のうち少なくとも一つとを受信する。入力されたオブジェクトゲイン及びオブジェクトゲイン比率のうち少なくとも一つを用いて初期プリセット情報を生成することができ、これについては、図2及び図3を参照して詳細に後述する。
【0041】
レンダリング部150は、複数個のオブジェクトを含むオーディオ信号をダウンミキシングして生成されたダウンミックス信号、情報受信部130から出力されたオブジェクト情報、及びプリセット生成部140から出力されたプリセット情報を受信する。この場合、プリセット情報は、ダウンミックス信号に含まれているオブジェクトに適用されて、オブジェクトのレベルを調節したり、オブジェクトの含まれる出力チャネルを調節したりすることができる。
【0042】
また、オーディオ信号処理装置100がディスプレイ部(図示せず)を含む場合、レンダリング部150でレンダリングされたオーディオ信号のレベル、生成されたプリセット情報の特徴などを画面に表示することができる。
【0043】
このように、本発明のオーディオ信号処理装置100は、デコーディング装置にプリセット生成部140を含むので、エンコーダからプリセット情報を転送しなかった場合にも、レンダリングデータであるプリセット情報を生成して用いることによって、音源の特性またはユーザの利用目的に応じてオーディオ信号を調節することができる。
【0044】
図2は、図1のプリセット情報生成部140の構成を示す図である。図2を参照すると、プリセット情報生成部140は、プリセット情報有無判断部210及び初期プリセット情報生成部220を含む。
【0045】
プリセット情報有無判断部210は、まず、データタイプ情報を受信し、受信したデータタイプ情報に基づいて、ビットストリームにプリセット情報が含まれているか否かを判断する。上記表1に表すように、データタイプ情報が1の場合、すなわち、プリセット情報がビットストリームに含まれている場合には、ビットストリームからプリセット情報を抽出してダウンミックス信号に適用する。これについては、図8A乃至図10Bで詳細に後述する。
【0046】
一方、データタイプ情報が0の場合、すなわち、転送されたビットストリームにプリセット情報が含まれていない場合には、オーディオ信号をデコーディングするためのプリセット情報が必要とされる。この場合、初期プリセット生成部220は、オブジェクトゲイン及びオブジェクトゲイン比率を受信し、これらを用いて初期プリセット情報を生成することができる。以下、初期プリセット生成部220で初期プリセット情報を生成する方法について、図3を参照して説明する。
【0047】
図3は、図2の初期プリセット情報生成部220の構成を示す図である。図3を参照すると、初期プリセット情報生成部220は、主に、モノ初期プリセット情報生成部310及びステレオ初期プリセット情報生成部320を含む。
【0048】
モノ初期プリセット情報生成部310が初期プリセット情報を生成するか、或いは、ステレオ初期プリセット情報生成部320が初期プリセット情報を生成するかは、ダウンミックス信号のチャネルによって決定される。ダウンミックス信号がモノ信号である場合、モノ初期プリセット情報生成部310が活性化される。この場合、モノ初期プリセット情報生成部310は、オブジェクトゲインを受信してモノ初期プリセット情報を生成することができる。好ましくは、モノ初期プリセット情報は、オブジェクトゲインを、レンダリングマトリクスのうちセンターチャネルの要素(element)とし、残りのチャネルの要素(element)は0に設定することができる。
【0049】
ダウンミックス信号がステレオ信号である場合、ステレオ初期プリセット情報生成部320が活性化され、オブジェクトゲインの他にオブジェクトゲイン比率も用いて初期プリセット情報を生成することができる。ステレオ初期プリセット情報生成部320は、ゲイン調節モード生成部321及びステレオ調節モード生成部322を含む。
【0050】
ステレオ調節モード生成部322は、オブジェクトのゲインを調節し、当該オブジェクトが他のチャネルに存在しうるようにオブジェクトの位置を調節する第2初期プリセット情報を生成することができる。好ましくは、第2初期プリセット情報は、オブジェクトが、ダウンミックス信号のうちいずれかのチャネルにのみ存在する場合、他のチャネルにも存在できるようにオブジェクトの位置を調節する(以下、“パニング”という)。
【0051】
第2初期プリセットモードも、オブジェクトゲイン及びオブジェクトゲイン比率を用いて生成されたマトリクスで表現することができる。このマトリクスは、下記の式1で表現することができ、マトリクスの各要素(element)は、下記の式2及び3を用いて計算することができる。
【0052】
[式1]
【数1】
【0053】
[式2]
【数2】
【0054】
[式3]
【数3】
【0055】
一方、ゲイン調節モード生成部321は、オブジェクトのゲインを修正するための情報のみを含む第1初期プリセット情報を生成することができる。好ましくは、第1初期プリセット情報は、ボーカルオブジェクトにのみ小さいゲイン値を適用することでボーカルオブジェクトのレベルを略0にさせるカラオケモード、及びボーカルオブジェクト以外の他のオブジェクトに小さいゲイン値を適用することで、他のオブジェクトのレベルを略0にさせるボーカルオブジェクトのみを出力するアカペラモードを含むことができる。これらオブジェクトのうち、ボーカルオブジェクトは、エンコーディング時に生成されたオブジェクトの位置情報及びオブジェクト情報に含まれているチャネル相関差情報のうち少なくとも一つを用いて判断することができる。
【0056】
また、第1初期プリセット情報も同様に、オブジェクトゲイン及びオブジェクトゲイン比率を用いて生成されたマトリクスで表現することができる。このマトリクスは、下記の式3のような形態とすることができ、マトリクスの各要素は、下記の式4及び5を用いて計算することができる。
【0057】
[式4]
【数4】
【0058】
[式5]
【数5】
【0059】
[式6]
【数6】
【0060】
ゲイン調節モード生成部321またはステレオ調節モード生成部322で生成された第1初期プリセット情報または第2初期プリセット情報は、図1のレンダリング部150に入力されてダウンミックス信号に適用されることができ、ダウンミックス信号に含まれているオブジェクトを調節する。
【0061】
好ましくは、初期プリセット情報が第1初期プリセット情報である場合には、オブジェクトのゲインのみを調節し、第2初期プリセット情報である場合には、オブジェクトのゲイン及びパニングを調節することができる。
【0062】
また、初期プリセット情報を、オブジェクトゲイン及びオブジェクトゲイン比率のうち少なくとも一つを用いてオブジェクト情報のデータ領域ごとに生成することができる。データ領域は、実際にオーディオ信号に関するデータを含むビットストリームの領域で、フレームを含むことができる。
【0063】
図4A及び図4Bは、本発明の一実施例によって調節されたオブジェクトを表示するディスプレイ部を示す図である。図4A及び図4Bを参照すると、初期プリセット情報が適用されて調節されたオブジェクトのレベルは、オブジェクトの特徴を表すメタデータと一緒にディスプレイ部に表示することができる。
【0064】
例えば、初期プリセット情報がゲイン調節初期プリセット情報のうちカラオケモードである場合は、図4Aに示すように、初期プリセット情報を用いて、出力信号に含まれているオブジェクトのうちボーカルオブジェクトの大きさを減少させることができ、これを画面に表示して、カラオケモードが活性化されたことをユーザに認知させることができる。
【0065】
一方、初期プリセット情報がアカペラモードである場合には、図4Bに示すように、初期プリセット情報を用いて、出力信号に含まれているオブジェクトのうちボーカルオブジェクト以外の残りオブジェクトの大きさを減少させることができ、これを画面に表示して、アカペラモードが活性化されたことをユーザに認知させることができる。
【0066】
オブジェクトがどのようなものかを表すテキスト形態の情報を、プリセットメタデータという。プリセットメタデータは、オブジェクト名の他に、プリセット情報の生成日、作成者、プリセットモードの名称なども表すことができるが、これに限定されない。
【0067】
図5は、本発明の他の実施例によるオーディオ信号処理装置500を示す図である。オーディオ信号処理装置500は、主に、ダウンミキシング部510、オブジェクト情報生成部520、情報生成部530、ダウンミックス信号処理部540及びマルチチャネルデコーディング部550を含む。図5のダウンミキシング部510及びオブジェクト情報生成部520は、図1のダウンミキシング部110及び情報生成部120と同一の機能及び構成を有するので、その詳細な説明は省略する。
【0068】
情報生成部530は、プリセット情報生成部531及びダウンミックス信号処理情報生成部532を含み、SAOCビットストリームを受信する。プリセット情報生成部531でプリセット情報を生成するか否かは、入力されたSAOCビットストリームに含まれているデータタイプ情報に基づいて判断する。
【0069】
データタイプ情報に基づいてビットストリームにプリセット情報が含まれない場合、プリセット情報生成部531は、SAOCビットストリームに含まれているオブジェクトゲイン及びオブジェクトゲイン比率を用いて初期プリセット情報をデコーダ側で生成して出力することができる。
【0070】
プリセット情報生成部531は、図1乃至図3で説明したように初期プリセット情報を生成することができる。
【0071】
ダウンミックス信号処理情報生成部532は、プリセット情報及びSAOCビットストリームを受信し、これらを用いてダウンミックス信号を前処理(pre-processing)するためのダウンミックス処理情報を生成する。
【0072】
以降、このダウンミックス処理情報はダウンミックス信号処理部540に入力されて、ダウンミックス信号に含まれているオブジェクトが含まれるチャネルを変動させることによってパニングを行うことができる。
【0073】
もし、オーディオ信号の最終出力チャネルの数がダウンミックス信号のチャネルの数よりも多い場合、情報生成部530は、SAOCビットストリーム及び生成されたプリセット情報を用いて、ダウンミックス信号をアップミキシングするためのマルチチャネル情報をさらに生成することができる。この場合、マルチチャネル情報はマルチチャネルデコーディング部550に出力され、マルチチャネルデコーディング部550は、前処理されたダウンミックス信号とマルチチャネル情報を受信してアップミキシングを行うことで、マルチチャネルオーディオ信号を生成することができる。
【0074】
このように、本発明のオーディオ信号処理装置は、複数個のオブジェクトを含むダウンミックス信号をマルチチャネル信号にデコーディングする際に、プリセット情報が転送されない場合にも、SAOCビットストリームに含まれているオブジェクト情報を用いて初期プリセット情報を生成することができる。
【0075】
よって、このデコーダ側で生成された初期プリセット情報を用いてオブジェクトのレベル及び/またはパニングを調節することができる。この時、初期プリセット情報はデータ領域ごとに生成されるため、オーディオ信号を原音により近く復元することができる。
【0076】
図6は、本発明のさらに他の実施例によるオーディオ信号処理装置600を示す図である。本発明のオーディオ信号処理装置及び方法は、プリセット情報を用いてダウンミックス信号をレンダリングすることによって、ユーザの利用目的または再生環境に応じて様々なバージョンのオーディオ信号を聴取可能にする。この場合、プリセット情報の適用されたオーディオ信号を別に抽出して保存したり、許可されていない経路を通じて他の再生装置で利用したりすることは不法とされている。そこで、本発明のオーディオ信号処理装置は、オーディオ信号とは別に生成されたプリセット情報のみを別に保存するプリセット情報保存部をさらに含む。
【0077】
図6を参照すると、本発明のさらに他の実施例によるオーディオ信号処理装置600は、主に、ダウンミキシング部610、情報生成部620、プリセット生成部630、レンダリング部640、プリセットメタデータ生成部650及びプリセット情報保存部660を含む。図6のダウンミキシング部610、情報生成部620、レンダリング部640は、図5における同一の名前のブロックと同一の機能及び構成を有するので、その詳細な説明を省略する。
【0078】
一方、プリセット生成部630は、図5のプリセット生成部531と同一の機能及び構成によって初期プリセット情報を生成することができる。また、プリセット生成部630は、情報生成部620から、ダウンミックス信号に含まれているオブジェクトをレンダリングするためのプリセット情報が転送される場合、ユーザ入力をさらに用いて修正プリセット情報を生成することもできる。
【0079】
プリセット情報保存部660は、プリセット生成部630で生成されたプリセット情報を保存することができる。このプリセット情報保存部660は、別のメモリ形態を有してもよく、生成されたプリセット情報の他に、プリセット情報の適用されるデータ領域に関する情報、プリセット情報生成時に用いられたオブジェクトゲイン及びオブジェクトゲイン比率なども保存することができる。プリセット情報生成部630が修正プリセット情報を生成する場合、この情報がプリセット情報保存部660保存されうることは勿論である。
【0080】
プリセットメタデータ生成部650は、プリセット情報に対応するプリセットメタデータを生成することができる。プリセットメタデータは、ユーザから入力される信号を用いて生成することができて、ユーザから入力される信号は、ユーザ入力部(図示せず)を介して入力されることができる。また、プリセットメタデータは、プリセット情報の適用されるダウンミックス信号名、プリセット情報の作成者、作成日などを含むことができる。
【0081】
図7は、図6のオーディオ信号処理装置を用いてプリセット情報を別に保存、転送及び利用することを示す概念図である。プリセット情報は、修正プリセット情報及び初期プリセット情報を有する。
【0082】
図7を参照すると、エンコーディング装置で複数個のオブジェクトを用いて生成されたビットストリームをHeyJude.saocと命名する。このHeyJude.saocは、複数個のオブジェクトがダウンミキシングされたダウンミックス信号Downmix、オブジェクトの属性を表すオブジェクト情報SAOC params、及びダウンミックス信号をレンダリングするためのプリセット情報artistic Presetを含む。
【0083】
このようにエンコーディングされたSAOCコンテンツは、サービスポータル(Service Portal)によって有/無線で提供されることができる。サービスポータルは、コンテンツサーバとユーザプリセットサーバを有することができる。ここで、コンテンツサーバは、エンコーディングされたダウンミックス信号及びオブジェクト情報を保存することができ、ユーザプリセットサーバは、プリセット情報を保存することができる。コンテンツサーバ及びユーザプリセットサーバは、別のユニットとしてもよく、同一ユニットに含まれて動作してもよい。
【0084】
ユーザは、サービスポータルから適法に許可を受けた場合、例えば、転送料を支給する等して許可を受けた場合、ダウンミックス信号及びオブジェクト情報を受け取ることができ、これとは別に、ユーザプリセットサーバからプリセット情報を受け取ることができる。図7に示すように、HeyJude.saocを転送料を支払って受け取ることができ、SAOCプレイヤAで直接生成したプリセット情報及び該当の音源名をプリセットメタデータとして生成してHeyJude_Mymix.saoc+というファイルをサービスポータルに転送することができる。
【0085】
一方、SAOCプレイヤBは、転送料を支払ってHeyJude.saocファイルを受け取ることとは別に、HeyJude_Mymix.saoc+ファイルをサービスポータルから受け取ることができる。この場合、HeyJude_Mymix.saoc+ファイルはHeyJude.saocファイルとは別の著作物であるから、HeyJude_Mymix.saoc+ファイルの転送はHeyJude.saocファイルの原著作者の権利を侵害しない。
【0086】
図8A及び図8Bは、本発明の一実施例によるプリセット属性情報によってプリセット情報を適用して、ダウンミックス信号に含まれているオブジェクトを調節する概念図である。本発明のオーディオ信号は、エンコーダでダウンミックス信号及びオブジェクト情報にエンコーディングされ、これらは一つのビットストリームまたは別個のビットストリームの形態としてデコーダに転送される。
【0087】
図8A及び図8Bを参照すると、ビットストリームに含まれているオブジェクト情報は、具体的に、構成情報領域と複数個のデータ領域(データ領域1、データ領域2、…、データ領域n)とで構成される。構成情報領域は、オブジェクト情報のビットストリームにおいて先頭部に位置している領域で、オブジェクト情報の全データ領域に共通して適用される情報を含む。
【0088】
例えば、ツリー構造などを含む構成情報、データ領域長情報(data region length information)及びオブジェクトの個数情報などを含むことができる。
【0089】
一方、データ領域は、構成情報領域に含まれているデータ領域長情報に基づいてオーディオ信号全体の時間ドメインを分割したユニットであり、フレームを含むことができる。オブジェクト情報のデータ領域は、ダウンミックス信号のデータ領域に対応し、対応するデータ領域のオブジェクトの属性に基づくオブジェクトレベル情報、オブジェクトゲイン情報などのオブジェクトデータ情報を含む。
【0090】
まず、本発明の一実施例によるオーディオ信号処理方法では、ビットストリームのオブジェクト情報からプリセット属性情報(preset_attribute_information)を読む。プリセット属性情報は、プリセット情報がビットストリームにおいてどの領域に含まれているかを表すもので、具体的には、プリセット情報がオブジェクト情報の構成情報領域に含まれるか或いはデータ領域に含まれるかを表し、その詳細な意味は、下記表2の通りである。
【0091】
【表2】
【0092】
まず、図8Aを参照すると、プリセット属性情報が0であって、プリセット情報が構成情報領域に含まれることを表す場合、構成情報領域から抽出されたプリセット情報は、ダウンミックス信号の全データ領域に同一に適用されてレンダリングを行う。
【0093】
一方、図8Bを参照すると、プリセット属性情報が1であって、プリセット情報がデータ領域に含まれることを表す場合、データ領域から抽出されたプリセット情報は、対応するダウンミックス信号のデータ領域に適用されてレンダリングを行う。例えば、データ領域1から抽出されたプリセット情報は、データ領域1のダウンミックス信号に適用され、データ領域nから抽出されたプリセット情報は、データ領域nのダウンミックス信号に適用されることができる。
【0094】
また、プリセット属性情報は、プリセット情報が変動であるか或いは固定であるかを表すことができる。プリセット属性情報が0に設定され、構成情報領域に含まれる場合、プリセット情報は、固定(static)であるとすることができる。この場合、プリセット情報は、全データ領域に固定して同一に適用される。
【0095】
一方、プリセット属性情報が1に設定され、データ領域に含まれる場合、プリセット情報は変動(dynamic)であるとすることができる。この場合、プリセット情報は、該当のデータ領域にのみ適用されて、対応するデータ領域のダウンミックス信号をレンダリングするから、データ領域別に変動して適用される。ここで、プリセット情報は、変動である場合、データ領域の拡張領域(extension region)に存在することが好ましく、プリセット情報が固定である場合は、構成情報領域の拡張領域(extension region)に存在することが好ましい。
【0096】
したがって、本発明の一実施例によるオーディオ信号処理方法は、プリセット属性情報に基づいて、音源の特性によってデータ領域別に適切なプリセット情報を用いたり、同一プリセット情報を全データ領域に用いたりして、ダウンミックス信号をレンダリングすることができる。
【0097】
図9は、本発明の実施例によるオーディオ信号処理装置900を示す図である。図9を参照すると、オーディオ信号処理装置900は、プリセットモード生成部910、情報受信部(図示せず)、変動プリセットモード受信部920、固定プリセットモード受信部930及びレンダリング部940を含むことができる。
【0098】
プリセットモード生成部910は、オーディオ信号に含まれているオブジェクトをレンダリング時に調節するためのプリセットモードを生成し、プリセット属性決定部911、プリセットメタデータ生成部912及びプリセット情報生成部913を含むことができる。
【0099】
プリセット属性決定部911は、上述の通り、プリセット情報を構成情報領域に含めて全データ領域に適用するか、或いは、データ領域に含めてデータ領域別に適用するかを表すプリセット属性情報を決定する。
【0100】
以降、プリセット属性情報に基づいて、プリセットメタデータ生成部912及びプリセット情報生成部913は、一つのプリセットメタデータ及びプリセット情報、またはデータ領域数だけのプリセットメタデータ及びプリセット情報を生成することができる。
【0101】
プリセットメタデータ生成部912は、プリセット情報を表現するテキスト情報を受信してプリセットメタデータを生成することができる。一方、オブジェクトのレベルを調節するためのゲイン及び/またはオブジェクトの位置がプリセット情報生成部913に入力される場合、オブジェクトに適用されるプリセット情報を生成することができる。
【0102】
プリセット情報は、オブジェクトごとに適用されるように生成することができ、様々なタイプ、例えば、チャネルレベル差(CLD:Channel Level Difference)パラメータ、マトリクス(matrix)などとすることができる。
【0103】
また、プリセット情報生成部913は、オブジェクトの出力チャネルの数を表す出力チャネル情報をさらに生成することができる。
【0104】
プリセットメタデータ生成部912で生成されたプリセットメタデータ及びプリセット情報生成部913で生成されたプリセット情報、出力チャネル情報などは、一つのビットストリームに含めて転送することができ、特に、ダウンミックス信号を含むビットストリームの補助領域に含めて転送することができる。
【0105】
一方、プリセットモード生成部910は、プリセットメタデータ、プリセット情報及び出力チャネル情報がビットストリームに含まれていることを表すプリセット存在情報をさらに生成することができる。このプリセット存在情報は、プリセット情報などがビットストリームのどの領域に含まれているかを表すコンテナタイプとすることもでき、どの領域に含まれているかを表さずに、単にビットストリームに含まれているか否かを表すフラグタイプ(flag type)とすることもできるが、これに限定されない。
【0106】
また、プリセットモード生成部910は、複数個のプリセットモードを生成することができ、それぞれのプリセットモードは、プリセット情報、プリセットメタデータ及び出力チャネル情報を含む。ここで、プリセットモード生成部910は、プリセットモードの個数を表すプリセット個数情報をさらに生成することができる。
【0107】
このように、プリセットモード生成部910は、プリセット属性情報、プリセットメタデータ及びプリセット情報をビットストリームの形態で生成して出力することができる。
【0108】
このビットストリームは、図8A及び8Bに示すような形態を有し、情報受信部(図示せず)に入力される。情報受信部(図示せず)に入力されたビットストリームから、まず、プリセット属性情報を獲得し、プリセット情報が、転送されたビットストリームにおいてどの領域に含まれているかを決定する。
【0109】
変動プリセットモード受信部920は、プリセット属性決定部911から出力されるプリセット属性情報に基づいてプリセット情報がデータ領域に含まれていることを表す場合(表2のpreset_attribute_flag=1の場合)に、動作する。
【0110】
変動プリセットモード受信部920は、該当のデータ領域に対応するプリセットメタデータを受信する変動プリセットメタデータ受信部921及びデータ領域別プリセット情報を受信する変動プリセット情報受信部922を含むことができる。変動プリセットメタデータ受信部921は、選択されたプリセットメタデータを受信して出力し、変動プリセット情報受信部922はプリセット情報を受信する。これについての詳細な説明は、図10A及び図10Bを参照して詳細に後述する。
【0111】
固定プリセットモード受信部930は、プリセット属性情報に基づいてプリセット情報が構成情報領域に含まれていることを表す場合(表2のpreset_attribute_flag=0の場合)に、動作する。
【0112】
固定プリセットモード受信部930は、全データ領域に対応するプリセット情報を受信する固定プリセット情報受信部931、及びプリセットメタデータを受信する固定プリセットメタデータ受信部932を含むことができる。
【0113】
固定プリセットモード受信部930の固定プリセット情報受信部931及び固定プリセットメタデータ受信部932は、受信して出力するプリセット情報及びプリセットメタデータに対応するダウンミックス信号の範囲が異なる以外は、変動プリセットモード受信部920の変動プリセットメタデータ受信部921及び変動プリセット情報受信部922と略同一の構成及び機能を有する。
【0114】
レンダリング部940は、複数個のオブジェクトを含むオーディオ信号をダウンミキシングして生成されたダウンミックス信号、及び変動プリセット情報受信部922から出力されたプリセット情報または固定プリセット情報受信部931から出力されたプリセット情報を取り込む。プリセット情報を、ダウンミックス信号に含まれているオブジェクトに適用することによって、当該オブジェクトのレベルを調節したりオブジェクトの位置を調節したりすることができる。
【0115】
また、オーディオ信号処理装置900がディスプレイ部(図示せず)を含む場合、変動プリセットメタデータ受信部921から出力される選択されたプリセットメタデータ、または固定プリセットメタデータ受信部932から出力される選択されたプリセットメタデータが画面に表示されることができる。
【0116】
図10A及び図10Bは、本発明の実施例によるプリセット情報がレンダリング部に適用される方法を示すブロック図である。
【0117】
まず、図10Aは、変動プリセットモード受信部920から出力されたプリセット情報が、レンダリング部1040で適用される方法を示す図である。変動プリセットモード受信部920は、図3の変動プリセットモード受信部920と同一のもので、変動プリセットメタデータ受信部921及び変動プリセット情報受信部922を含む。
【0118】
変動プリセットモード受信部920は、データ領域ごとにプリセットメタデータ及びプリセット情報を受信して出力し、このプリセット情報はレンダリング部1040に入力される。
【0119】
レンダリング部1040は、プリセット情報の他に、ダウンミックス信号も受信して、データ領域別にレンダリングを行い、データ領域1のレンダリング部1041、データ領域2のレンダリング部1042、…、データ領域nのレンダリング部104nを含む。ここで、レンダリング部1040のそれぞれのデータ領域のレンダリング部104Xはそれぞれ、データ領域に対応するプリセット情報を受信してダウンミックス信号に適用することによってレンダリングを行う。
【0120】
例えば、1番目のデータ領域にはスタジアムモードであるプリセット情報_1が適用され、2番目のデータ領域にはカラオケモードであるプリセット情報_3が適用され、n番目のデータ領域にはニュースモードであるプリセット情報_2(ここで、プリセット情報_nのnは、データ領域モードのインデックスを表す。)が適用されることができる。この時、プリセットメタデータもデータ領域ごとに出力されることは勿論である。
【0121】
図10Bは、固定プリセットモード受信部930から出力されたプリセット情報が、レンダリング部1040で適用される方法を示す図である。
【0122】
固定プリセットモード受信部930は、図9の固定プリセットモード受信部930と同一のものである。固定プリセットモード受信部930は、全データ領域に対応するプリセットメタデータ及びプリセット情報を受信して出力し、レンダリング部1040は、このプリセット情報を受信する。
【0123】
図10Bのレンダリング部1040は、図10Aのレンダリング部と同様に、データ領域数だけのデータ領域レンダリング部104Xを含む。レンダリング部1040は、固定プリセットモード受信部930からプリセット情報を受信する場合、全データ領域レンダリング部104Xで、受信したプリセット情報をダウンミックス信号に同一に適用することによってレンダリングを行う。
【0124】
例えば、固定プリセットモード受信部930から出力されたプリセット情報が、ニュースモードを表すプリセット情報2の場合、1番目のデータ領域からn番目のデータ領域にわたる全データ領域にニュースモードを適用することができる。
【0125】
図11は、本発明の一実施例によるプリセット生成部を含む製品の概略的な構成を示す図であり、図12A及び図12Bは、本発明の実施例によるプリセット生成部を含む製品間の関係を示す図である。
【0126】
図11を参照すると、有/無線通信部1110は、有/無線通信方式によってビットストリームを受信する。具体的に、有/無線通信部1110は、有線通信部1111、赤外線通信部1112、ブルトゥース部1113、無線LAN通信部1114のうち少なくとも一つを含むことができる。
【0127】
ユーザ認証部1120は、ユーザ情報を受信してユーザ認証を行うもので、指紋認識部1121、虹彩認識部1122、顔面認識部1123、及び音声認識部1124のうち少なくとも一つを含むことができる。このユーザ認証部1120では、それぞれ、指紋情報、虹彩情報、顔面輪郭情報、音声情報を受信してユーザ情報に変換し、ユーザ情報と既に登録されているユーザデータとが一致するか否かを判断して、ユーザ認証を行うことができる。
【0128】
入力部1130は、ユーザが様々な種類の命令を入力するための入力装置で、キーパッド部1131、タッチパッド部1132、リモコン部1133のうち少なくとも一つを含むことができるが、本発明はこれに限定されない。一方、プリセット生成部1141に対応するプリセットメタデータが生成される場合、このプリセットメタデータは、ディスプレイ部1162を通じて画面に表示される場合に、入力部1130を介してユーザがプリセットメタデータを選択することができ、選択されたプリセットメタデータに関する情報が制御部1150に入力される。
【0129】
信号デコーディング部1140は、プリセット生成部1141を含み、まず、受信したビットストリームに含まれているプリセットフラグに基づいてプリセット情報が含まれていないと判断される場合、プリセット生成部1141は、オブジェクトゲイン及びオブジェクトゲイン比率を用いてプリセット情報を生成する。受信したビットストリームにプリセット情報が含まれていると、プリセット生成部1141は別のプリセットを生成せずに、ビットストリームからプリセット情報を抽出する。この場合、プリセット情報は、プリセット情報が存在するか否かを表すプリセット存在情報、プリセット情報の個数を表すプリセット個数情報及び出力チャネルの個数に基づく、例えば、出力チャネルがモノ、ステレオ及びマルチチャネルのうち一つであるかを表す出力チャネル情報に基づいて獲得される。プリセット情報がマトリクスで表現された場合、出力チャネル情報を受信しこれに基づいてプリセットマトリクスを受信する。
【0130】
信号デコーディング部1140は、受信したビットストリーム、プリセットメタデータ、及びプリセット情報を用いてオーディオ信号をデコーディングして出力信号を生成し、プリセットメタデータをテキスト形態として出力する。
【0131】
制御部1150は、入力装置から入力信号を受信し、信号デコーディング部1140及び出力部1160のプロセス全般を制御する。上述の通り、制御部1150に、入力部1130から選択されたプリセットメタデータに関する情報が入力信号として入力される。また、有/無線通信部1110から、プリセット情報がビットストリームに含まれていないことを表すデータタイプ情報が入力される場合、オブジェクトゲイン及びオブジェクトゲイン比率を用いてプリセット情報を生成し、これを用いてオーディオ信号をデコーディングする。
【0132】
出力部1160は、信号デコーディング部1140で生成された出力信号などを出力する構成要素で、スピーカ部1161及びディスプレイ部1162を含むことができる。出力信号がオーディオ信号の場合、出力信号はスピーカ部1161から出力され、ビデオ信号の場合、出力信号はディスプレイ部1162から出力される。また、制御部1150により選択されたプリセットメタデータを、ディスプレイ部1162を通じて画面に表示する。
【0133】
図12A及び図12Bは、図11に示す製品に該当する端末同士の関係及び該端末とサーバとの関係をそれぞれ示す図である。
【0134】
図12Aを参照すると、第1端末1210及び第2端末1220が有/無線通信部を通じてデータまたはビットストリームを両方向に通信できることがわかる。有/無線通信部を通じて通信するデータまたはビットストリームは、本発明の図1で生成されたビットストリームであって、図8A及び図8Bに示すビットストリームの形態を有することもでき、図1乃至図11を参照して説明した本発明のプリセットフラグ、プリセット属性情報、プリセット情報、プリセットメタデータ、データタイプ情報などを含むデータであってもよい。また、データタイプ情報のみを含むビットストリームであってもよい。
【0135】
図12Bを参照すると、サーバ1230及び第1端末1240も互いに有/無線通信を行うことができる。
【0136】
図13は、本発明の一実施例によるプリセット生成部を含む放送信号デコーディング装置1300の概略的な構成を示す図である。
【0137】
図13を参照すると、デマルチプレクサ1320は、チューナ1310からTV放送と関連するデータを受信する。これら受信データは、デマルチプレクサ1320で分離され、データデコーダ1330でデコーディングされる。一方、デマルチプレクサ1320で分離されたデータは、HDDのような記憶媒体1350に記憶することができる。
【0138】
デマルチプレクサ1320で分離されたデータは、オーディオデコーダ1341及びビデオデコーダ1342を含むデコーダ1340に入力されてオーディオ信号及びビデオ信号をデコーディングする。オーディオデコーダ1341は、本発明の一実施例によるプリセット生成部1341Aを含み、まず、受信したビットストリームに含まれているプリセットフラグに基づいてプリセット情報が含まれていないと判断される場合、プリセット生成部1341Aは、オブジェクトゲイン及びオブジェクトゲイン比率を用いてプリセット情報を生成する。
【0139】
受信したビットストリームにプリセット情報が含まれている場合には、プリセット生成部1341Aは、別にプリセットを生成せずに、ビットストリームからプリセット情報を抽出する。この場合、プリセット情報は、プリセット情報が存在するか否かを表すプリセット存在情報、プリセット情報の個数を表すプリセット個数情報及び出力チャネルがモノ、ステレオ及びマルチチャネルのうち一つであることを表す出力チャネル情報に基づいて獲得される。プリセット情報がマトリクスで表現された場合、出力チャネル情報を受信してこれに基づいてプリセットマトリクスを受信する。オーディオデコーダ1341は、受信したビットストリーム、プリセットメタデータ、及びプリセット情報を用いてオーディオ信号をデコーディングして出力信号を生成し、プリセットメタデータをテキスト形態として出力する。
【0140】
ディスプレイ部1370は、ビデオデコーダ1342から出力されたビデオ信号とオーディオデコーダ1341から出力されたプリセットメタデータを画面に表示する。また、ディスプレイ部1370は、スピーカ部(図示せず)を含み、オーディオデコーダ1341から出力されるオブジェクトのレベルがプリセット情報に基づいて調節されたオーディオ信号を、ディスプレイ部1370に含まれたスピーカ部から出力する。また、デコーダ1340でデコーディングされたデータは、HDDのような記憶媒体1350に記憶することができる。
【0141】
一方、信号デコーディング装置1300は、ユーザから情報を受け取って、受信したデータを制御できるアプリケーションマネージャ1360をさらに含むことができる。
【0142】
アプリケーションマネージャ1360は、ユーザインターフェースマネージャ1361及びサービスマネージャ1362を含む。ユーザインターフェースマネージャ1361は、ユーザから情報を受け取るためのインターフェースを制御する。例えば、ディスプレイ部1370に表示されるテキストの書体、画面の明るさ、メニュー構成などを制御することができる。一方、サービスマネージャ1362は、デコーダ1340及びディスプレイ部1370で放送信号をデコーディングして出力する場合、受信される放送信号を、ユーザから入力される情報を用いて制御することができる。例えば、放送チャネルの設定、アラーム機能設定、成人認証機能などを提供することができる。アプリケーションマネージャ1360から出力されるデータは、デコーダ1340の他に、ディスプレイ部1370にも転送される。
【0143】
以上では具体的な実施例及び図面に基づいて本発明を説明してきたが、本発明は、それらの具体例に限定されず、本発明の属する技術分野における通常の知識を有する者にとっては、本発明の技術思想及び添付の特許請求の範囲とその均等範囲内で様々な修正及び変形が可能であるということは明らかである。
【産業上の利用可能性】
【0144】
本発明は、オーディオ信号をエンコーディング及びデコーディングするのに適用することができる。
【特許請求の範囲】
【請求項1】
少なくとも一つのオブジェクトを含むダウンミックス信号及びオブジェクト情報を受信する段階であって、前記オブジェクト情報は、
前記ダウンミックス信号に含まれている前記オブジェクトに適用されたゲインを表すオブジェクトゲイン及び前記ダウンミックス信号の2つ以上のチャネルに含まれている前記オブジェクトのゲイン差を表すオブジェクトゲイン比率のうち少なくとも一つと、
前記オブジェクト情報の拡張領域に含まれているデータのタイプを表すデータタイプ情報と、を有する、段階と、
前記データタイプ情報に基づいて、前記オブジェクトをレンダリングするためのプリセット情報が前記オブジェクト情報の拡張領域に含まれているか否かを判断する段階と、
前記プリセット情報が前記オブジェクト情報に含まれていない場合、前記オブジェクトゲイン及び前記オブジェクトゲイン比率のうち少なくとも一つを用いて、前記オブジェクトをレンダリングするための初期プリセット情報を生成する段階と、
前記初期プリセット情報を用いて、前記ダウンミックス信号に含まれているオブジェクトをレンダリングする段階と、
を有することを特徴とするオーディオ信号処理方法。
【請求項2】
前記ダウンミックス信号がモノ信号である場合、
前記初期プリセット情報は、前記オブジェクトゲインを用いて生成されることを特徴とする、請求項1に記載のオーディオ信号処理方法。
【請求項3】
前記ダウンミックス信号がステレオ信号である場合、
前記初期プリセット情報は、前記オブジェクトゲイン及び前記オブジェクトゲイン比率を用いて生成されることを特徴とする、請求項1に記載のオーディオ信号処理方法。
【請求項4】
前記初期プリセット情報は、前記オブジェクトのゲインのみを調節する第1初期プリセット情報と、前記オブジェクトのゲイン及びパニングを調節する第2初期プリセット情報と、を有することを特徴とする、請求項3に記載のオーディオ信号処理方法。
【請求項5】
前記初期プリセット情報は、前記オブジェクト情報のデータ領域ごとに生成されることを特徴とする、請求項1に記載のオーディオ信号処理方法。
【請求項6】
前記オブジェクトをレンダリングする段階は、
前記オブジェクトゲイン及び前記オブジェクトゲイン比率をさらに用いることを特徴とする、請求項1に記載のオーディオ信号処理方法。
【請求項7】
少なくとも一つのオブジェクトを含むダウンミックス信号及びオブジェクト情報を受信する受信部であって、前記オブジェクト情報は、
前記ダウンミックス信号に含まれている前記オブジェクトに適用されたゲインを表すオブジェクトゲイン及び前記ダウンミックス信号の2つ以上のチャネルに含まれている前記オブジェクトのゲイン差を表すオブジェクトゲイン比率のうち少なくとも一つと、
前記オブジェクト情報の拡張領域に含まれているデータのタイプを表すデータタイプ情報と、を有する、受信部と、
前記データタイプ情報に基づいて、前記オブジェクトをレンダリングするためのプリセット情報が前記オブジェクト情報の拡張領域に含まれているか否かを判断するプリセット情報判断部と、
前記プリセット情報が前記オブジェクト情報に含まれていない場合、前記オブジェクトゲイン及び前記オブジェクトゲイン比率のうち少なくとも一つを用いて、前記オブジェクトをレンダリングするための初期プリセット情報を生成する初期プリセット情報生成部と、
前記初期プリセット情報を用いて、前記ダウンミックス信号に含まれているオブジェクトをレンダリングするレンダリング部と、
を有することを特徴とするオーディオ信号処理装置。
【請求項8】
前記初期プリセット情報生成部は、前記ダウンミックス信号のチャネル数によって、モノ初期プリセット情報生成部及びステレオ初期プリセット情報生成部を有することを特徴とする、請求項6に記載のオーディオ信号処理装置。
【請求項9】
前記モノ初期プリセット情報生成部は、前記オブジェクトゲインを用いて前記初期プリセット情報を生成することを特徴とする、請求項8に記載のオーディオ信号処理装置。
【請求項10】
前記ステレオ初期プリセット情報生成部は、前記オブジェクトゲイン及び前記オブジェクトゲイン比率を用いて前記初期プリセット情報を生成することを特徴とする、請求項8に記載のオーディオ信号処理装置。
【請求項11】
前記ステレオ初期プリセット情報生成部は、
前記オブジェクトのゲインのみを調節する第1初期プリセット情報を生成するゲイン調節初期プリセット情報生成部と、
前記オブジェクトのゲイン及びパニングを調節する第2初期プリセット情報を生成するステレオ調節初期プリセット情報生成部と、
を有することを特徴とする、請求項8に記載のオーディオ信号処理装置。
【請求項12】
前記初期プリセット情報は、前記オブジェクト情報のデータ領域ごとに生成されることを特徴とする、請求項7に記載のオーディオ信号処理装置。
【請求項13】
前記オブジェクトゲイン及び前記オブジェクトゲイン比率を用いて前記ダウンミックス信号を調節するためのダウンミックス処理情報を生成するダウンミックス処理情報生成部と、
前記ダウンミックス処理情報を用いて前記オブジェクトのパニングを調節するダウンミックス信号処理部と、
をさらに有することを特徴とする、請求項7に記載のオーディオ信号処理装置。
【請求項14】
少なくとも一つのオブジェクトをダウンミキシングしてダウンミックス信号を生成する段階と、
前記ダウンミックス信号生成時に前記オブジェクトに適用されるゲインを表すオブジェクトゲインを生成する段階と、
前記ダウンミックス信号が2つ以上のチャネルを有する場合、前記ダウンミックス信号の2つ以上のチャネルに前記オブジェクトを含めるゲインの差を表すオブジェクトゲイン比率を生成する段階と、
前記オブジェクトゲイン及び前記オブジェクトゲイン比率の少なくとも一つを有するオブジェクト情報の拡張領域に含まれているデータのタイプを表すデータタイプ情報を生成する段階と、
を有する、オーディオ信号処理方法。
【請求項15】
少なくとも一つのオブジェクトをダウンミキシングしてダウンミックス信号を生成するダウンミキシング部と、
前記ダウンミックス信号生成時に前記オブジェクトに適用されるゲインを表すオブジェクトゲインと、前記ダウンミックス信号が2つ以上のチャネルを有する場合、前記ダウンミックス信号の2つ以上のチャネルに前記オブジェクトを含めるゲインの差を表すオブジェクトゲイン比率と、前記オブジェクトゲイン及び前記オブジェクトゲイン比率の少なくとも一つを有するオブジェクト情報の拡張領域に含まれているデータのタイプを表すデータタイプ情報と、を生成するオブジェクト情報生成部と、
を有するオーディオ信号処理装置。
【請求項1】
少なくとも一つのオブジェクトを含むダウンミックス信号及びオブジェクト情報を受信する段階であって、前記オブジェクト情報は、
前記ダウンミックス信号に含まれている前記オブジェクトに適用されたゲインを表すオブジェクトゲイン及び前記ダウンミックス信号の2つ以上のチャネルに含まれている前記オブジェクトのゲイン差を表すオブジェクトゲイン比率のうち少なくとも一つと、
前記オブジェクト情報の拡張領域に含まれているデータのタイプを表すデータタイプ情報と、を有する、段階と、
前記データタイプ情報に基づいて、前記オブジェクトをレンダリングするためのプリセット情報が前記オブジェクト情報の拡張領域に含まれているか否かを判断する段階と、
前記プリセット情報が前記オブジェクト情報に含まれていない場合、前記オブジェクトゲイン及び前記オブジェクトゲイン比率のうち少なくとも一つを用いて、前記オブジェクトをレンダリングするための初期プリセット情報を生成する段階と、
前記初期プリセット情報を用いて、前記ダウンミックス信号に含まれているオブジェクトをレンダリングする段階と、
を有することを特徴とするオーディオ信号処理方法。
【請求項2】
前記ダウンミックス信号がモノ信号である場合、
前記初期プリセット情報は、前記オブジェクトゲインを用いて生成されることを特徴とする、請求項1に記載のオーディオ信号処理方法。
【請求項3】
前記ダウンミックス信号がステレオ信号である場合、
前記初期プリセット情報は、前記オブジェクトゲイン及び前記オブジェクトゲイン比率を用いて生成されることを特徴とする、請求項1に記載のオーディオ信号処理方法。
【請求項4】
前記初期プリセット情報は、前記オブジェクトのゲインのみを調節する第1初期プリセット情報と、前記オブジェクトのゲイン及びパニングを調節する第2初期プリセット情報と、を有することを特徴とする、請求項3に記載のオーディオ信号処理方法。
【請求項5】
前記初期プリセット情報は、前記オブジェクト情報のデータ領域ごとに生成されることを特徴とする、請求項1に記載のオーディオ信号処理方法。
【請求項6】
前記オブジェクトをレンダリングする段階は、
前記オブジェクトゲイン及び前記オブジェクトゲイン比率をさらに用いることを特徴とする、請求項1に記載のオーディオ信号処理方法。
【請求項7】
少なくとも一つのオブジェクトを含むダウンミックス信号及びオブジェクト情報を受信する受信部であって、前記オブジェクト情報は、
前記ダウンミックス信号に含まれている前記オブジェクトに適用されたゲインを表すオブジェクトゲイン及び前記ダウンミックス信号の2つ以上のチャネルに含まれている前記オブジェクトのゲイン差を表すオブジェクトゲイン比率のうち少なくとも一つと、
前記オブジェクト情報の拡張領域に含まれているデータのタイプを表すデータタイプ情報と、を有する、受信部と、
前記データタイプ情報に基づいて、前記オブジェクトをレンダリングするためのプリセット情報が前記オブジェクト情報の拡張領域に含まれているか否かを判断するプリセット情報判断部と、
前記プリセット情報が前記オブジェクト情報に含まれていない場合、前記オブジェクトゲイン及び前記オブジェクトゲイン比率のうち少なくとも一つを用いて、前記オブジェクトをレンダリングするための初期プリセット情報を生成する初期プリセット情報生成部と、
前記初期プリセット情報を用いて、前記ダウンミックス信号に含まれているオブジェクトをレンダリングするレンダリング部と、
を有することを特徴とするオーディオ信号処理装置。
【請求項8】
前記初期プリセット情報生成部は、前記ダウンミックス信号のチャネル数によって、モノ初期プリセット情報生成部及びステレオ初期プリセット情報生成部を有することを特徴とする、請求項6に記載のオーディオ信号処理装置。
【請求項9】
前記モノ初期プリセット情報生成部は、前記オブジェクトゲインを用いて前記初期プリセット情報を生成することを特徴とする、請求項8に記載のオーディオ信号処理装置。
【請求項10】
前記ステレオ初期プリセット情報生成部は、前記オブジェクトゲイン及び前記オブジェクトゲイン比率を用いて前記初期プリセット情報を生成することを特徴とする、請求項8に記載のオーディオ信号処理装置。
【請求項11】
前記ステレオ初期プリセット情報生成部は、
前記オブジェクトのゲインのみを調節する第1初期プリセット情報を生成するゲイン調節初期プリセット情報生成部と、
前記オブジェクトのゲイン及びパニングを調節する第2初期プリセット情報を生成するステレオ調節初期プリセット情報生成部と、
を有することを特徴とする、請求項8に記載のオーディオ信号処理装置。
【請求項12】
前記初期プリセット情報は、前記オブジェクト情報のデータ領域ごとに生成されることを特徴とする、請求項7に記載のオーディオ信号処理装置。
【請求項13】
前記オブジェクトゲイン及び前記オブジェクトゲイン比率を用いて前記ダウンミックス信号を調節するためのダウンミックス処理情報を生成するダウンミックス処理情報生成部と、
前記ダウンミックス処理情報を用いて前記オブジェクトのパニングを調節するダウンミックス信号処理部と、
をさらに有することを特徴とする、請求項7に記載のオーディオ信号処理装置。
【請求項14】
少なくとも一つのオブジェクトをダウンミキシングしてダウンミックス信号を生成する段階と、
前記ダウンミックス信号生成時に前記オブジェクトに適用されるゲインを表すオブジェクトゲインを生成する段階と、
前記ダウンミックス信号が2つ以上のチャネルを有する場合、前記ダウンミックス信号の2つ以上のチャネルに前記オブジェクトを含めるゲインの差を表すオブジェクトゲイン比率を生成する段階と、
前記オブジェクトゲイン及び前記オブジェクトゲイン比率の少なくとも一つを有するオブジェクト情報の拡張領域に含まれているデータのタイプを表すデータタイプ情報を生成する段階と、
を有する、オーディオ信号処理方法。
【請求項15】
少なくとも一つのオブジェクトをダウンミキシングしてダウンミックス信号を生成するダウンミキシング部と、
前記ダウンミックス信号生成時に前記オブジェクトに適用されるゲインを表すオブジェクトゲインと、前記ダウンミックス信号が2つ以上のチャネルを有する場合、前記ダウンミックス信号の2つ以上のチャネルに前記オブジェクトを含めるゲインの差を表すオブジェクトゲイン比率と、前記オブジェクトゲイン及び前記オブジェクトゲイン比率の少なくとも一つを有するオブジェクト情報の拡張領域に含まれているデータのタイプを表すデータタイプ情報と、を生成するオブジェクト情報生成部と、
を有するオーディオ信号処理装置。
【図1】
【図2】
【図3】
【図4A】
【図4B】
【図5】
【図6】
【図7】
【図8A】
【図8B】
【図9】
【図10A】
【図10B】
【図11】
【図12A】
【図12B】
【図13】
【図2】
【図3】
【図4A】
【図4B】
【図5】
【図6】
【図7】
【図8A】
【図8B】
【図9】
【図10A】
【図10B】
【図11】
【図12A】
【図12B】
【図13】
【公表番号】特表2011−519223(P2011−519223A)
【公表日】平成23年6月30日(2011.6.30)
【国際特許分類】
【出願番号】特願2011−506198(P2011−506198)
【出願日】平成21年4月23日(2009.4.23)
【国際出願番号】PCT/KR2009/002131
【国際公開番号】WO2009/131392
【国際公開日】平成21年10月29日(2009.10.29)
【出願人】(502032105)エルジー エレクトロニクス インコーポレイティド (2,269)
【Fターム(参考)】
【公表日】平成23年6月30日(2011.6.30)
【国際特許分類】
【出願日】平成21年4月23日(2009.4.23)
【国際出願番号】PCT/KR2009/002131
【国際公開番号】WO2009/131392
【国際公開日】平成21年10月29日(2009.10.29)
【出願人】(502032105)エルジー エレクトロニクス インコーポレイティド (2,269)
【Fターム(参考)】
[ Back to top ]