メディア信号の処理方法及び装置
【解決手段】空間情報を用いてサラウンド信号に変換することができるメディア信号の処理装置及び方法を開示する。本発明は、マルチソース間の特徴を表す空間情報を用いてソース別に対応するソースマッピング情報を生成する段階と、ソースマッピング情報及びサラウンド効果を与えるフィルター情報を用いてレンダリング情報を生成する段階と、少なくとも一つのレンダリング情報の隣接したレンダリング情報を用いて平滑化する段階と、を含むことを特徴とする信号処理方法を提供する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、メディア信号の処理方法及び装置に関し、より詳細には、メディア信号の空間情報を用いてサラウンド信号を生成する信号処理方法及び装置に関する。
【背景技術】
【0002】
一般に、メディア信号をモノ又はステレオ信号をダウンミックスして生成されたダウンミックス信号と、このメディア信号の空間情報とを用いてマルチチャンネルメディア信号を生成する方法及び装置が多く用いられてきている。
【発明の開示】
【発明が解決しようとする課題】
【0003】
しかしながら、上記のような方法及び装置は、マルチチャンネル信号を生成出できない環境、例えば、ステレオ信号のみ生成可能な装置では用いられることができない。すなわち、マルチチャンネル信号を生成できない環境で、メディア信号の空間情報を用いてマルチチャンネル信号の効果を出せるサラウンド信号を生成する方法及び装置は存在していない。したがって、モノ又はステレオ信号のみ生成可能な装置ではサラウンド信号を生成する方法及び装置が存在しておらず、メディア信号を效率的に処理する上で多くの問題点があった。
【0004】
本発明は上記の問題点を解決するためのもので、その目的は、メディア信号の空間情報を用いてメディア信号をサラウンド信号に変換するメディア信号の処理方法及び装置を提供することにある。
【課題を解決するための手段】
【0005】
上記の目的を達成するために、本発明は、マルチソース間の特徴を表す空間情報を用いてソース別に対応するソースマッピング情報を生成する段階と、前記ソースマッピング情報にサラウンド効果を与えるフィルター情報をソース別に適用し、サブレンダリング情報を生成する段階と、少なくとも一つの前記サブレンダリング情報を合成し、サラウンド信号を生成するためのレンダリング情報を生成する段階と、前記レンダリング情報を、前記マルチソースをダウンミックスして生成されたダウンミックス信号に適用し、サラウンド信号を生成する段階と、を含むことを特徴とする信号処理方法を提供する。
【0006】
また、前記目的を達成するために、本発明は、マルチソース間の特徴を表す空間情報を用いてソース別に対応するソースマッピング情報を生成するソースマッピング部と、前記ソースマッピング情報にサラウンド効果を与えるフィルター情報をソース別に適用し、サブレンダリング情報を生成するサブレンダリング情報生成部と、少なくとも一つの前記サブレンダリング情報を合成し、サラウンド信号を生成するためのレンダリング情報を生成する合成部と、前記レンダリング情報を、前記マルチソースをダウンミックスして生成されたダウンミックス信号に適用し、サラウンド信号を生成するレンダリング部と、を含むことを特徴とする信号処理装置を提供する。
【0007】
以下、上記の目的を具体的に実現できる本発明の好適な実施例を、添付の図面を参照しつつ説明する。本発明で使われる用語は、可能なかぎり現在広く使われている一般的な用語を選択したが、特定の場合は、の出願人が任意に選定した用語もある。この場合には発明の詳細な説明でその意味を記載したので、単純な用語の名称ではなく用語が持つ意味として本発明を把握すべきである。以下、本発明は、便宜上、オーディオ信号を取り上げて記述されるが、本発明がオーディオ信号に限定されることはない。
【発明の効果】
【0008】
本発明に係る信号処理方法及び装置によれば、マルチチャンネル信号をダウンミックスして生成されたダウンミックス信号及び前記マルチチャンネル信号の空間情報を含むビットストリームを受信したデコーディング装置が、マルチチャンネル信号を復元できない環境においも、サラウンド効果を持つ信号を生成することが可能になる。
【発明を実施するための最良の形態】
【0009】
図1は、本発明の一実施例によるオーディオ信号の符号化装置及び復号化装置を示すブロック図である。図1を参照すると、符号化装置10は、ダウンミックス部100、空間情報生成部200、ダウンミックス信号符号化部300、空間情報符号化部400及び多重化部500を含む。
【0010】
マルチソースオーディオ信号X1,X2,…,Xnがダウンミックス部100に入力されると、ダウンミックス部100は、マルチソースオーディオ信号をダウンミックスしてダウンミックス信号を生成する。ダウンミックス信号は、モノ、ステレオ又はマルチソースオーディオ信号を含む。ここで、ソースはチャンネルを含み、便宜上、以下ではチャンネルと記述する。本明細書では、モノ又はステレオダウンミックス信号を基準として説明するが、本発明がモノ又はステレオダウンミックス信号に限定されることはない。また、符号化装置10は、選択的に外部から直接提供される任意のダウンミックス信号を用いることができる。空間情報生成部200は、マルチチャンネルオーディオ信号から空間情報を生成する。この空間情報をダウンミックス過程中に生成することができる。生成されたダウンミックス信号及び空間情報はそれぞれ、ダウンミックス信号符号化部300及び空間情報符号化部400に符号化された後、多重化部500に転送される。
【0011】
本発明でいう「空間情報とは、符号化装置でマルチチャンネル信号をダウンミックスし、生成されたダウンミックス信号を復号化装置で転送し、このダウンミックス信号を復号化装置がアップミックスしてマルチチャンネル信号を生成するのに必要な情報のことを意味する。空間情報は、空間パラメータを含む。空間パラメータには、チャンネル間のエネルギー差を意味するCLD(チャンネルレベル差)、チャンネル間の相関関係を意味するICC(チャンネル間の信号相関)、2チャンネルから3チャンネルを生成する時に用いられるCPC(チャンネル予測係数)などがある。
【0012】
本発明でいう「ダウンミックス信号符号化部」又は「ダウンミックス信号復号化部」とは、空間情報でないオーディオ信号を符号化又は復号化するコーデックのことを意味する。本明細書は、空間情報でないオーディオ信号としてダウンミックスオーディオ信号を取り上げて記述する。また、ダウンミックス信号符号化部又はダウンミックス信号復号化部は、MP3、AC−3、DTS又はAACを含むことができる。オーディオ信号にコーデック機能を行うものであれば、既存に開発されたコーデックの他、今後開発されるコーデックをも含むことができる。
【0013】
多重化部500は、ダウンミックス信号及び空間情報を多重化してビットストリームを生成し、生成されたビットストリームを復号化装置20に転送する。このビットストリームの構造は、図2で説明される。
【0014】
デコーディング装置20は、逆多重化部600、ダウンミックス信号復号化部700、空間情報復号化部800、レンダリング部900及び空間情報変換部1000を含む。逆多重化部600は、ビットストリームを受信し、該ビットストリームから符号化されたダウンミックス信号と符号化された空間情報とを分離する。その後、ダウンミックス信号復号化部700は、符号化されたダウンミックス信号を復号化し、空間情報復号化部800は、符号化された空間情報を復号化する。空間情報変換部1000は、復号化された空間情報及びフィルター情報用いてダウンミックス信号に適用させられるレンダリング情報を生成する。このレンダリング情報は、ダウンミックス信号に適用されてサラウンド信号を生成できる。
【0015】
サラウンド信号を生成する、例えば、符号化装置10でマルチチャンネルオーディオ信号からダウンミックス信号を生成する過程を、OTT(1対2)ボックス又はTTT(3対3)ボックスなどを用いて多段階で行うことができる。この時、段階ごとに空間情報を生成することができる。この空間情報は、復号化装置20に転送され、復号化装置20は、受信した空間情報を変換した後、変換された空間情報をダウンミックス信号にレンダリングすることによってサラウンド信号を生成することができる。本発明は、ダウンミックス信号をアップミックスしてマルチチャンネル信号を生成するのではなく、アップミックス段階別に空間情報のみを抽出し、抽出された空間情報を用いてレンダリングを行う方法に関する。レンダリング方法には、例えば、HRTF(頭部伝達関数)フィルターリングを用いることができる。
【0016】
この時、空間情報は、ハイブリッドドメインで適用可能な値である。レンダリングは、ドメインによって下記のような種類がありうる。
その第一は、ハイブリッドフィルターバンクにダウンミックス信号を通過させ、ハイブリッドドメインでレンダリングを行う方法である。この時、空間情報に対するドメインの変換は不要である。
【0017】
その第二は、時間ドメインでレンダリングを行う方法である。この方法は、HRTFフィルターが、時間ドメインでFIR(有限逆応答)フィルター又はIIR(無限逆応答)フィルターとしてモデリングされる点を用い、空間情報を時間ドメインのフィルター係数に変換する過程が必要とされる。
【0018】
その第三は、異なる周波数ドメインでレンダリングを行う方法である。例えば、DFT(離散フーリエ変換)ドメインでレンダリングを行う方法である。この第三の方法は、空間情報を該当のドメインへと変換する過程を必要とする。また、この方法は、時間ドメインにおけるフィルターリングを周波数ドメインにおける演算に置換することによって高速演算が可能である。
【0019】
本発明でいうフィルター情報は、オーディオ信号を処理するためのフィルターに関する情報を意味し、特定フィルターが持つフィルター係数を含む。このフィルター情報の例には、次のようなものがある。プロトタイプフィルター情報は、特定フィルターが持つ元来のフィルター情報を意味し、GL_Lなどで表現可能である。変換フィルター情報は、プロトタイプフィルタ情報が変形された後のフィルター係数を意味し、GL_L'などで表現可能である。サブレンダリング情報は、サラウンド信号を生成するためにプロトタイプフィルタ情報を空間化したフィルター情報を意味し、FL_L1等で表現可能である。レンダリング情報は、レンダリングを行うために必要なフィルター情報を意味し、HL_Lなどで表現可能だ。補間/平滑化されたレンダリング情報は、レンダリング情報を補間及び/又は平滑化したフィルター情報を意味し、HL_L'などで表現可能である。本明細書は、上記のフィルター情報を取り上げて記述するが、これらのフィルター情報の名称に本発明が限定されるわけではない。特に、フィルター情報は、HRTFを取り上げて説明するが、本発明がこのHRTFに限定されることはない。
【0020】
その後、レンダリング部900は、復号化されたダウンミックス信号及びレンダリング情報を受信し、これら復号化されたダウンミックス信号及びレンダリング情報を用いてサラウンド信号を生成する。このサラウンド信号は、ステレオ信号のみ生成可能なオーディオ・システムにサラウンド効果を提供する信号になりうる。本発明は、ステレオ信号のみ生成可能なオーディオ・システムの他にも適用可能である。
【0021】
図2は、本発明の一実施例によるオーディオ信号ビットストリームの構造を示す図である。このビットストリームは、符号化されたダウンミックス信号及び符号化された空間情報を含む。図2を参照すると、1フレームオーディオペイロードは、ダウンミックス信号フィールド及び補助データフィールドを含む。この補助データフィールドに、符号化された空間情報を保存することができる。例えば、オーディオペイロードが48〜128kbpsの時、空間情報は5〜32kbps程度の範囲を持つことができるが、このオーディオペイロード及び空間情報の範囲に特に制限はない。
【0022】
図3は、本発明の一実施例による空間情報変換部を示す詳細ブロック図である。図3を参照すると、空間情報変換部1000は、ソースマッピング部1010、サブレンダリング情報生成部1020、統合部1030、処理部1040、ドメイン変換部1050を含む。
【0023】
ソースマッピング部1010は、空間情報を用いてソースマッピング過程を行うことによって、オーディオ信号の各ソースに対応するソースマッピング情報を生成する。ソースマッピング情報とは、オーディオ信号の各ソースに対応するように空間情報などを用いて生成された各ソース別情報のことを指す。ソースはチャンネルを含み、この場合に各チャンネルに対応するソースマッピング情報が生成される。ソースマッピング情報は、係数形態で表現されることができる。ソースマッピング過程についての詳細な説明は、後ほど図4及び図5を参照して記述する。
【0024】
サブレンダリング情報生成部1020は、ソースマッピング情報及びフィルター情報を用いて各ソースに対応するサブレンダリング情報を生成する。例えば、レンダリング部900がHRTFフィルターである場合、サブレンダリング情報生成部1020は、HRTFフィルター情報を用いてサブレンダリング情報を生成することができる。
【0025】
統合部1030は、サブレンダリング情報をダウンミックス信号のソースに対応するように統合し、レンダリング情報を生成する。レンダリング情報とは、空間情報及びフィルター情報を用いて生成された情報で、ダウンミックス信号に適用されてサラウンド信号を生成する情報のことを指す。レンダリング情報は、フィルター係数形態を含む。統合は、レンダリング過程の演算量を減らすために省略しても良い。その後、レンダリング情報は、プロセシング部1042に転送される。プロセシング部1042は、補間部1041及び/又は平滑化部1042を含む。レンダリング情報は補間部1041及び/又は平滑化部1042で補間及び/又は平滑化される。その後、ドメイン変換部1050は、レンダリング情報のドメインを、レンダリング部900で用いられるダウンミックス信号のドメインに変換する。このドメイン変換部1005は、図3に示す位置以外にも様々な位置に適用されることができる。したがって、レンダリング情報がレンダリング部900と同じドメインで生成された場合、ドメイン変換部1050を省略しても良い。ドメイン変換されたレンダリング情報は、レンダリング部900に転送される。
【0026】
また、空間情報変換部1000は、フィルター情報変換部1060を含むことができる。図3で、フィルター情報変換部1060は、空間情報変換部1000の内部に含まれているが、空間情報変換部1000の外部に存在しても良い。フィルター情報変換部1060は、任意のフィルター情報、例えば、HRTFを、サブレンダリング情報又はレンダリング情報を生成するのに適合するように変換する。このフィルター情報の変換過程は、下記のような過程を含むことができる。
【0027】
先ず、適用するドメインを合わせる過程が含まれる。フィルター情報の持っているドメインとレンダリングの行われるドメインとが一致しない場合、これらのドメインを合わせる過程が必要である。例えば、時間ドメインHRTFを、レンダリング情報が生成されるDFT、QMF又はハイブリッドドメインに変換する過程が必要である。
【0028】
次に、ドメイン変換されたHRTFを保存し、空間情報に適用するのを容易にするよう、係数減少過程を含むことができる。例えば、プロトタイプHRTFフィルター係数が長いタブ数(長さ)の応答を持つ場合では、5.1チャンネルの場合、合計10個の該当長さだけの応答に対応するメモリーに該当の係数を保存しなければならない。これは、メモリーへの負担とともに演算量を増加させる要因となる。このような問題を防ぐために、ドメイン変換過程でフィルターの特性を維持しながら保存されなければならないフィルター係数については、減少する方法を考慮することができる。例えば、HRTF応答を少数個のパラメータ値に変換することができる。この時、適用されるドメインによってパラメータ生成過程及び値が異なることができる。
【0029】
ダウンミックス信号は、レンダリング部900でレンダリング情報とレンダリングされる前に、ドメイン変換部1100及び/又はデコリレーティング部1200を通過する。ドメイン変換部1100は、レンダリング情報のドメインとダウンミックス信号のドメインとが異なる場合、両ドメインを一致させるためにダウンミックス信号のドメイン変換を行う。
【0030】
デコリレーティング部1200は、ドメイン変換されたダウンミックス信号に適用される。レンダリング情報にデコリレータを適用する方法に比べて、ダウンミックス信号に適用するという点で演算量は相対的に高いが、レンダリング情報生成過程で生じる歪曲を防ぐことができる。デコリレーティング部1200は、演算量が許容する範囲でそれぞれ異なる特性を持つ複数のデコリレータ含むことができる。また、デコリレーティング部1200は、ダウンミックス信号がステレオ信号である場合には適用されなくて良い。図3では、ドメイン変換されたモノダウンミックス信号、すなわち、周波数ドメイン、ハイブリッドドメイン、QMFドメイン又はDFTドメインにおけるモノダウンミックス信号がレンダリング過程に用いられる場合、該当のドメインにおけるデコリレータを用いる例を示す。また、本発明は、時間ドメインにおいて用いられるデコリレータも含む。この時は、ドメイン変換部1100以前のモノダウンミックス信号が直接デコリレーティング部1200に入力される。前記デコリレータとして一次以上のIIRフィルター(又は、FIRフィルター)を用いることができる。
【0031】
その後、レンダリング部900は、ダウンミックス信号、デコリレートされたダウンミックス信号及びレンダリング情報を用いてサラウンド信号を生成する。ダウンミックス信号がステレオ信号である場合、デコリレートされたダウンミックス信号を用いなくて良い。レンダリング過程についての詳細な説明は、後ほど図6〜図9を参照して記述する。サラウンド信号は、逆ドメイン変換部1300で時間ドメインに変換されて出力される。これで、使用者はステレオ信号が聞けるイヤホンなどでマルチチャンネル効果を持つ音を聞くことができる。
【0032】
図4及び5は、本発明の一実施例によるソースマッピング過程で用いられるチャンネル構成を示す。ソースマッピング過程は、空間情報を用いてオーディオ信号の各ソースに対応するソースマッピング情報を生成する過程である。前述したように、ソースは、チャンネルを含み、図4及び図5に示すチャンネルに対応するようにソースマッピング情報を生成することができる。ソースマッピング情報は、レンダリング過程に適合した形態で生成される。例えば、ダウンミックス信号がモノ信号である場合、CLD1〜CLD5、ICC1〜ICC5などの空間情報を用いてソースマッピング情報を生成することができる。このソースマッピング情報を、D_L(=DL)、D_R(=DR)、D_C(=DC)、D_LFE(=DLFE)、D_Ls(=DLs)、D_Rs(=DRs)などの値で表現することができる。この時、ソースマッピング情報を生成する過程は、空間情報に対応するツリー構造及び使われる空間情報の範囲などによって変化しうる。本明細書ではダウンミックス信号がモノである場合を取り上げて説明するが、本発明がこれに限定されるわけではない。
【0033】
レンダリング部900から出力された左右チャンネル出力を、下の[数式1]のように表現することができる。
【0034】
【数1】
【0035】
ここで、演算子*は、DFTドメインでは積であり、QMF及び時間ドメインでは畳み込みに置換することができる。本発明は、前記L、C、R、Ls、Rsを、空間情報を用いたソースマッピング情報又は空間情報及びフィルター情報を用いたソースマッピング情報により生成する方法を含む。例えば、ソースマッピング情報を、空間情報のCLDのみを用いて又は空間情報のCLD及びICCを用いて生成することができる。CLDのみを用いてソースマッピング情報を生成する方法は、下記の通りである。ツリー構造が図4のような構造である場合、CLDのみを用いてソースマッピング情報を得る第1方法を、下の[数式2]のように表現することができる。
【0036】
【数2】
であり、mはモノダウンミックス信号である。
【0037】
ツリー構造が図5のような構造である場合、CLDのみを用いてソースマッピング情報を得る第2方法を、下の[数式3]のように表現することができる。
【0038】
【数3】
【0039】
CLDのみを用いてソースマッピング情報を生成する場合、3次元の影響を減少することができる。したがって、ICC及び/又はデコリレータを用いてソースマッピング情報を生成することができる。デコリレータ出力信号dx(m)を用いて生成するマルチチャンネル信号は、以下の[数式4]のように表現されることができる。
【0040】
【数4】
【0041】
ここで、A、B、Cは、CLD及びICCで表現できる値であり、d0〜d3はデコリレータであり、mはモノダウンミックス信号である。この方法はD_L、D_Rなどのソースマッピング情報を生成することができない。
【0042】
したがって、ダウンミックス信号に対してCLD、ICC及び/又はデコリレータを用いてソースマッピング情報を生成する第1方法は、dx(m)(x=0,1,2)をそれぞれ独立した入力として見なす。この場合、dxを、下記の[数式5]のようにサブレンダリングフィルター情報の生成過程に用いることができる。
【0043】
【数5】
【0044】
レンダリング情報を、上記[数式5]の結果を用いて下記の[数式6]のように生成することができる。
【0045】
【数6】
【0046】
上記レンダリング情報の生成過程についての詳細は、後述される。上記CLD、ICC及び/又はデコリレータを用いてソースマッピング情報を生成する第1方法は、dx出力値、すなわち、dx(m)を独立した入力として処理するので、演算量を増加することができる。
【0047】
CLD、ICC及び/又はデコリレータを用いてソースマッピング情報を生成する第2方法は、周波数ドメインで適用されるデコリレータを用いる。この場合に、ソースマッピング情報を、下記の[数式7]のように表現することができる。
【0048】
【数7】
【0049】
この場合に、周波数ドメインでデコリレータを適用することによって、デコリレータを適用する前と同じD_L、D_Rなどのソースマッピング情報を生成できるので、簡単に実現可能である。
【0050】
CLD、ICC及び/又はデコリレータを用いてソースマッピング情報を生成する第3方法は、上記第2方法のデコリレータとして全域通過特性を持つデコリレータを使用する。全域通過特性とは、大きさは一定で、位相変化のみを有することを意味する。また、本発明は、上記第1方法のデコリレータとして全域通過特性を持つデコリレータを使用するものを含む。
【0051】
CLD、ICC及び/又はデコリレータを用いてソースマッピング情報を生成する第4方法は、上記第2方法でd0〜d3を用いてデコリレーションを行うのではなく、各チャンネル(例えば、L、R、C、Ls、Rs等)に対するそれぞれのデコリレータを使用してデコリレーションを行う。この場合、ソースマッピング情報を、下記の[数式8]のように表現することができる。
【0052】
【数8】
【0053】
ここで、Kは、CLD及びICC値から決定されるデコリレーションされた信号のエネルギー値であり、d_L、d_R、d_C、d_Ls及びd_Rsは、チャンネル別に適用されるデコリレータである。
【0054】
CLD、ICC及び/又はデコリレータを用いてソースマッピング情報を生成する第5方法は、上記第4方法でd_Lとd_Rとを対称に構成し、d_Lsとd_Rsとを対称に構成することによって、デコリレーション効果を極大化する。すなわち、d_R=f(d_L)、d_Rs=f(d_Ls)といえるので、d_L、d_C及びd_Lsのみを設計すればよい。
【0055】
CLD、ICC及び/又はデコリレータを用いてソースマッピング情報を生成する第6方法は、上記第5方法でd_Lとd_Lsとが相関関係を持つように構成する。また、d_Lとd_Cも相関関係を持つように構成することができる。
【0056】
CLD、ICC及び/又はデコリレータを用いてソースマッピング情報を生成する第7方法は、上記第3方法でデコリレータを全域通過フィルターの直列構造又はネスト化された(nested)構造として使用する。この第7方法は、全域通過フィルターが特性上、直列構造で用いられても全域通過の特性が維持され、重複構造で使用されても全域通過の特性が維持されるという点を利用するのである。直列構造又はネスト化された構造で使用される場合、より様々な形態の位相応答(を得ることができるので、デコリレーション効果を極大化させることができる。
【0057】
CLD、ICC及び/又はデコリレータを用いてソースマッピング情報を生成する第8方法は、従来のデコリレータと上記第2方法の周波数ドメインデコリレータとを共に使用する。この場合、マルチチャンネル信号を、下記の[数式9]のように表現することができる。
【0058】
【数9】
【0059】
この場合に、フィルター係数生成過程は、AがA+Kdに変更される以外は上記第1方法と同様になる。
【0060】
CLD、ICC及び/又はデコリレータを用いてソースマッピング情報を生成する第9方法は、従来のデコリレータを用いる場合、従来のデコリレータ出力に周波数ドメインデコリレータを適用することによって、さらにデコリレーションされた値を生成する。したがって、周波数ドメインデコリレータが持つ限界を克服しながら、少ない演算量でソースマッピング情報を生成することができる。
【0061】
上記のCLD、ICC及び/又はデコリレータを用いてソースマッピング情報を生成する第10方法を、下記の[数式10]のように表現することができる。
【0062】
【数10】
【0063】
ここで、di_(m)(i=L、R、C、Ls、Rs)は、iチャンネルに適用されるデコリレータ出力値であり、この出力値を、時間ドメイン、周波数ドメイン、QMFドメイン又はハイブリッドドメインなどで処理することができる。現在のプロセスが進行中のドメインと異なるドメインで処理されたものであれば、当該出力値をドメイン変換を通じて変換することができる。また、演算量減少を目的にd_L、d_R、d_C、d_Ls、d_Rsに同じdを使用することができ、この場合に、上記[数式10]を非常に簡単に表現することができる。
【0064】
[数式10]を[数式1]に適用すると、上記[数式1]を下記の[数式11]のように表現することができる。
【0065】
【数11】
【0066】
ここで、レンダリング情報HM_Lは、入力mを用いてサラウンド信号Loを作るための空間情報とフィルター情報との組み合わせ値であり、レンダリング情報HM_Rは、入力mを用いてサラウンド信号Roを作るための空間情報とフィルター情報との組み合わせ値である。d(m)は、任意のドメインでデコリレータ出力値を現在のドメインに移した値又は現在のドメインで処理されて生成されたデコリレータ出力値である。レンダリング情報HMD_Lは、デコリレータ出力値であるd(m)がレンダリングされる時、Loに加えられる程度を表す値であり、空間情報とフィルター情報との組み合わせ値である。レンダリング情報HMD_Rは、d(m)がRoに加えられる程度を表す値である。
【0067】
上記のように、本発明は、モノダウンミックス信号へとレンダリング過程を行うために、空間情報とフィルター情報(例えば、HRTFフィルター係数)とを組み合わせて生成したレンダリング情報をダウンミックス信号及びデコリレートされたダウンミックス信号にレンダリングし、サラウンド信号を生成する方法を提案する。このレンダリング過程は、ドメインによらず行われることができる。d(m)を、周波数ドメインで実行されるd*m(積演算子)で表現することができるならば、[数式11]を、下記の[数式12]のように表現することができる。
【0068】
【数12】
【0069】
このように、周波数ドメインでダウンミックス信号にレンダリング過程を行う場合に、空間情報、フィルター情報及びデコリレータが適宜組み合わせられた値を積の形態で表現することによって、演算量を最小化することができる。
【0070】
図6及び図7は、本発明の一実施例によるステレオダウンミックス信号に対するレンダリング部の詳細ブロック図である。図6を参照すると、レンダリング部900は、第Aレンダリング部910及び第Bレンダリング部920を含む。ダウンミックス信号がステレオ信号である場合、空間情報変換部1000は、ダウンミックス信号の左及び右チャンネルに適用されるレンダリング情報を生成する。第Aレンダリング部910は、ダウンミックス信号の左チャンネルに対するレンダリング情報を、該ダウンミックス信号の左チャンネルにレンダリングし、サラウンド信号を生成する。第Bレンダリング部920は、ダウンミックス信号の右チャンネルに対するレンダリング情報を、当該ダウンミックス信号の右チャンネルにレンダリングし、サラウンド信号を生成する。これら各チャンネルの名称は例示的なもので、本発明はこれらのチャンネルの名称に制限されない。
【0071】
また、レンダリング情報は、それぞれのチャンネルから自己チャンネルに伝達されるレンダリング情報と相手側のチャンネルに伝達されるレンダリング情報を含むことができる。例えば、空間情報変換部1000は、ダウンミックス信号の左チャンネルに対するレンダリング部に入力され、自己チャンネル出力である左出力に伝達されるレンダリング情報(HL_L)と、相手側のチャンネルである右出力に伝達されるレンダリング情報(HL_R)とを生成できる。そして、空間情報変換部1000は、ダウンミックス信号の右チャンネルに対するレンダリング部に入力され、自己チャンネル出力である右出力に伝達するレンダリング情報(HR_R)と、相手側のチャンネルである左出力に伝達するレンダリング情報(HR_L)とを生成できる。
【0072】
図7を参照すると、レンダリング部900は、第1Aレンダリング部911、第2Aレンダリング部912、第1Bレンダリング部921及び第2Bレンダリング部922を含む。このレンダリング部900は、ステレオダウンミックス信号を受信し、空間情報変換部1000からレンダリング情報を受信する。その後、レンダリング部900は、受信したレンダリング情報をステレオダウンミックス信号にレンダリングし、サラウンド信号を生成する。
【0073】
より詳細には、第1Aレンダリング部911は、ダウンミックス信号の左チャンネルに対するレンダリング情報のうち、自己チャンネルに伝達されるレンダリング情報(HL_L)を用いてレンダリングを行い、第2Aレンダリング部912は、ダウンミックス信号の左チャンネルに対するレンダリング情報のうち、相手側のチャンネルに伝達されるレンダリング情報(HL_R)を用いてレンダリングを行う。また、第1Bレンダリング部921は、ダウンミックス信号の右チャンネルに対するレンダリング情報のうち、自己チャンネルに伝達されるレンダリング情報(HR_R)を用いてレンダリングを行い、第2Bレンダリング部922は、ダウンミックス信号の右チャンネルに対するレンダリング情報のうち、相手側のチャンネルに伝達されるレンダリング情報(HR_L)を用いてレンダリングを行う。以下では、相手側のチャンネルに伝達されるレンダリング情報を「クロスレンダリング情報」という。このクロスレンダリング情報HL_R及びHR_Lは、自己チャンネルに適用された後、加算器で相手側のチャンネルに加えられる。この時、場合によっては、クロスレンダリング情報HL_R及び/又はHR_Lが‘0’になりうる。クロスレンダリング情報HL_R及び/又はHR_Lが‘0’になるというのは、該当のパスに何らの寄与もしないという意味である。
【0074】
図6及び図7に示すサラウンド信号の生成方法の一例について説明すると、次の通りである。ダウンミックス信号がステレオ信号である場合、ダウンミックス信号をx、空間情報を用いて生成されたソースマッピング情報をD、プロトタイプフィルタ情報をG、マルチチャンネル信号をp、サラウンド信号をyと定義し、これを行列式にすると、下記の[数式13]のように表現することができる。
【0075】
【数13】
【0076】
ここで、各値が周波数ドメインの値であれば、下記のような形態に展開することができる。まず、マルチチャンネル信号pを、下記の[数式14]のように、空間情報を用いて生成されたソースマッピング情報Dとダウンミックス信号xとの積で表すことができる。
【0077】
【数14】
【0078】
そして、サラウンド信号yを、下記の[数式15]のように、マルチチャンネル信号pにプロトタイプフィルタ情報Gをレンダリングして生成することができる。
【0079】
【数15】
【0080】
ここで、pに[数式14]を代入すると、下記の[数式16]を生成することができる。
【0081】
【数16】
【0082】
この時、レンダリング情報HをH=GDと定義すると、サラウンド信号yとダウンミックス信号xは、下記の[数式17]のような関係を持つ。
【0083】
【数17】
【0084】
したがって、フィルター情報とソースマッピング情報間の積を処理することによってレンダリング情報Hを生成した後、ダウンミックス信号xにレンダリング情報Hを乗じ、サラウンド信号yを生成できる。
【0085】
レンダリング情報Hに関する上記定義によると、レンダリング情報Hを、下記の[数式18]のように表現することができる。
【0086】
【数18】
【0087】
図8及び9は、本発明の一実施例によるモノダウンミックス信号に対するレンダリング部の詳細ブロック図である。図8を参照すると、レンダリング部900は、第Aレンダリング部930及び第Bレンダリング部940を含む。ダウンミックス信号がモノ信号である場合、空間情報変換部1000は、モノ信号を左チャンネルにレンダリングするのに使用するレンダリング情報HM_Lとモノ信号を右チャンネルにレンダリングするのに使用するレンダリング情報HM_Rを生成する。第Aレンダリング部930は、レンダリング情報HM_Lをモノダウンミックス信号に適用して左チャンネルのサラウンド信号を生成し、第Bレンダリング部940は、レンダリング情報HM_Rをモノダウンミックス信号に適用して右チャンネルのサラウンド信号を生成する。レンダリング部900は、デコリレータが用いられない場合を取り上げるが、第Aレンダリング部930及び第Bレンダリング部940がそれぞれ、[数式12]で定義したレンダリング情報HMoverall_R及びHMoverall_Lを用いてレンダリングを行うと、デコリレータの適用された形態の出力を得ることができる。
【0088】
一方、モノダウンミックス信号への上記のレンダリング後の出力信号を、サラウンド信号ではなくステレオ信号のような形態の出力としたい場合には、次のような2通りの方法が可能である。その一つは、レンダリング部900でサラウンド効果のためのレンダリング情報を使用するのではなく、ステレオ出力時に使用する値を用いる方法である。この場合に、図3に示す構造でレンダリング情報のみを変更し、ステレオ信号を得ることができる。もう一つは、ダウンミックス信号及び空間情報を用いてマルチチャンネル信号を生成するデコーディング過程で、所望のチャンネル数を得るために該当の段階までのみ復号化を進行することによってステレオ信号を得る方法である。
【0089】
図9を参照すると、レンダリング部900は、デコリレートされた信号が一つで表現された場合、すなわち、[数式11]に対応する。このレンダリング部900は、第1Aレンダリング部931、第2Aレンダリング部932、第1Bレンダリング部941及び第2Bレンダリング部942を含む。レンダリング部900は、デコリレートされた信号に対するレンダリング部941,942を含む以外は、ステレオダウンミックス信号に対するレンダリング過程と略同様である。ステレオダウンミックス信号である場合は、2信号間デコリレーションが行われたものと解析できるので、別のデコリレータを必要とせず、上に定義したHL_L、HL_Rなどの4つのレンダリング情報を用いてレンダリング過程を行うことができる。特に、第1Aレンダリング部931は、レンダリング情報HM_Lをモノダウンミックス信号に適用し、自己チャンネルに伝達される信号を生成し、第2Aレンダリング部932は、レンダリング情報HM_Rをモノダウンミックス信号に適用し、相手側のチャンネルに伝達される信号を生成する。また、第1Bレンダリング部941は、レンダリング情報HMD_Rをデコリレートされた信号に適用し、自己チャンネルに伝達される信号を生成し、第2Bレンダリング部942は、レンダリング情報HMD_Lをデコリレートされた信号に適用し、相手側のチャンネルに伝達される信号を生成する。
【0090】
ダウンミックス信号がモノ信号である場合、ダウンミックス信号をxと定義し、空間情報を用いたソースチャンネル情報をDと定義し、プロトタイプフィルタ情報をGと定義し、マルチチャンネル信号をpと定義し、サラウンド信号をyと定義し、これを行列式にすると、下記の[数式19]のように表現することができる。
【0091】
【数19】
【0092】
ここで、各行列式の関係は、ダウンミックス信号がステレオ信号である場合と類似しているので、具体的な説明は省略する。
【0093】
図4及び5を参照して説明したソースマッピング情報及び/又は該ソースマッピング情報を用いて生成されたレンダリング情報は、周波数バンド別、パラメータバンド別及び/又は転送されたタイムスロット別に異なる値を持つ。この時、隣接するバンド間及び境界となるタイムスロット間においてソースマッピング情報及び/又はレンダリング情報の値に大きく差が出る場合、レンダリング過程で歪曲が発生しうる。この歪曲を防ぐためには、周波数及び/又は時間ドメインでの平滑化過程が必要である。周波数ドメインでの平滑化及び/又は時間ドメインでの平滑化の他に、レンダリングに適合する他の平滑化方法を用いることができる。また、ソースマッピング情報及び/又はレンダリング情報のそれぞれに特定ゲインを生じた値を用いることができる。
【0094】
図10及び図11は、本発明の一実施例による平滑化部及び拡張部が適用される位置を示すブロック図である。図10及び図11に示すように、本発明による平滑化方法を、レンダリング情報及び/又はソースマッピング情報に適用することができるが、他の形態の情報にも適用することができる。以下では、周波数ドメインでの平滑化について説明するが、本発明は、上記周波数ドメインでの平滑化に制限されず、時間ドメインでの平滑化も含む。
【0095】
図10及び図11を参照すると、平滑化部1042は、レンダリング情報及び/又はソースマッピング情報への平滑化を行うことができる。この平滑化が起きる位置の詳細例は、図18〜図20を参照して後ほど説明する。平滑化部1042は、平滑化されたレンダリング情報及び/又はソースマッピング情報を、パラメータバンドよりも広い範囲、例えば、フィルターバンドに拡張する拡張部1043と共に構成することができる。例えば、ソースマッピング情報は、サブレンダリング情報生成部1020でフィルター情報(例えば、HRTFフィルター係数)に乗じられるために、当該フィルター情報に対応する周波数解像度(例えば、フィルターバンド)に拡張することができる。本発明による平滑化を、前述した拡張前に行ない又は拡張と共に行うことができる。この拡張と共に使われる平滑化としては、図12〜図16に示す方法を用いることができる。
【0096】
図12は、本発明の一実施例による第1平滑化方法を説明するグラフである。この第1平滑化方法は、周波数ドメインで直接平滑化を行わず、各パラメータバンドでの空間情報と同じ大きさの値を使用する。この時、適当な平滑化関数を用いて平滑化効果を得ることができる。
【0097】
図13は、本発明の一実施例による第2平滑化方法を説明するグラフである。この第2平滑化方法は、各パラメータバンドの代表位置間を連結して平滑化効果を得る。この代表位置は、各パラメータバンドの真中央であるか、ログスケール(log scale)/バークスケール(bark scale)などに比例した中心位置、最も低い周波数値又は他の方法によりあらかじめ定められた位置になりうる。
【0098】
図14は、本発明の一実施例による第3平滑化方法を説明するグラフである。この第3平滑化方法は、各パラメータの境界を滑らかにつなぐ曲線(又は、直線)の形態で平滑化を行う。この時、第3平滑化方法は、あらかじめ定められた境界平滑化曲線又は一次以上のIIRフィルター(又は、FIRフィルター)によるローパスフィルターリングを用いることができる。
【0099】
図15は、本発明の一実施例による第4平滑化方法を説明するグラフである。この第4平滑化方法は、ランダムノイズのような信号を空間情報輪郭線に加えることによって平滑化効果を得る。ランダムノイズは、チャンネル別及び帯域別に異なる値を使用することができる。周波数ドメインでランダムノイズを加える場合、位相値はそのままとし、大きさ値のみを合算することができる。この第4平滑化方法によれば、周波数ドメインでの平滑化効果だけでなく、各チャンネル間のデコリレーション効果も得ることができる。
【0100】
図16は、本発明の一実施例による第5平滑化方法を説明するグラフである。この第5平滑化方法は、上記第2平滑化方法乃至第4平滑化方法を組み合わせて用いるものである。例えば、各パラメータバンドの代表位置を連結した後に、ランダムノイズを加え、ローパスフィルターリングを適用することができる。この時、順序を変えることができる。この第5平滑化方法によれば、周波数ドメインでの不連続点は最小化し、チャンネル間のデコリレーション効果は向上するという結果を得ることができる。上記第1平滑化方法乃至第5平滑化方法において、各チャンネル別各周波数ドメインにおける空間情報(例えば、CLD)値に対するパワー(power)の和は定数と一定になる必要がある。このためには、各チャンネル別に上記平滑化方法を行った後、パワー正規化(power normalization)過程を行う必要がある。例えば、ダウンミックス信号がモノ信号である場合、各チャンネルのレベル値は、下記の[数式20]の関係を満足しなければならない。
【0101】
【数20】
【0102】
ここで、pb=0〜全体パラメータバンド数−1であり、Cは任意の定数である。
【0103】
図17は、各チャンネル別プロトタイプフィルタ情報を説明するための図である。レンダリングのために、左チャンネルソースに対してGL_Lフィルターを通過した信号は左出力に送られ、GL_Rフィルターを通過した信号は右出力に送られる。その後、左最終出力(例えば、Lo)及び右最終出力(例えば、Ro)は、各チャンネルから受信した信号を全部合わせて生成される。特に、レンダリングされた左/右チャンネル出力を、下記の[数式21]のように表現することができる。
【0104】
【数21】
【0105】
本発明では、空間情報を用いてダウンミックス信号をマルチチャンネル信号に復号化して生成されたL、R、C、Ls、Rsを用いて、レンダリングされた左/右チャンネル出力を生成し、空間情報及びフィルター情報を用いて生成されたレンダリング情報を用いて、L、R、C、Ls、Rsを生成することなくレンダリングされた左/右チャンネル出力を生成することができる。空間情報を用いたレンダリング情報の生成過程について、図18〜図20を参照して説明する。
【0106】
図18は、本発明の一実施例による空間情報変換部900でレンダリング情報を生成する第1方法を示すブロック図である。前述のように、空間情報変換部900は、ソースマッピング部1010、サブレンダリング情報生成部1020、統合部1030、プロセシング部1040及びドメイン変換部1050を含む。空間情報変換部900は、図3に示すものと同一である。ここで、サブレンダリング情報生成部1020は、一つ以上のサブレンダリング情報生成部(第1サブレンダリング情報生成部、第2サブレンダリング情報生成部、…、第Nサブレンダリング情報生成部)を含む。
【0107】
サブレンダリング情報生成部1020は、空間情報を用いて生成されたソースマッピング情報及びフィルター情報を用いてサブレンダリング情報を生成する。例えば、ダウンミックス信号がモノ信号である場合、第1サブレンダリング情報生成部は、マルチチャンネル上の左チャンネルに対応するサブレンダリング情報を生成できる。このサブレンダリング情報を、ソースマッピング情報D_L及び変形されたフィルター情報GL_L’及びGL_R’を用いて下記の[数式22]のように表現することができる。
【0108】
【数22】
【0109】
ここで、D_Lは、ソースマッピング部1010で空間情報を用いて生成された値である。ただし、D_Lを生成する過程は、ツリー構造によって異なることができる。第2サブレンダリング情報生成部は、マルチチャンネル上の右チャンネルに対応するサブレンダリング情報FR_L及びFR_Rを生成でき、第Nサブレンダリング情報生成部は、マルチチャンネル上の右サラウンドチャンネルに対応するサブレンダリング情報FRs_L及びFRs_Rを生成することができる。
【0110】
ダウンミックス信号がステレオ信号である場合、第1サブレンダリング情報生成部は、マルチチャンネル上の左チャンネルに対応するサブレンダリング情報を生成できる。このサブレンダリング情報は、ソースマッピング情報D_L1、D_L2を用いて下記の[数式23]のように表現することができる。
【0111】
【数23】
【0112】
ここで、FL_R1を取り上げて[数式23]を説明すると、FL_R1で、Lはマルチチャンネルの位置を表し、Rはサラウンド信号の出力チャンネルを表し、1はダウンミックス信号のチャンネルを表す。すなわち、FL_R1は、ダウンミックス信号の左チャンネルからサラウンド信号の右出力チャンネルを生成するのに用いられるサブレンダリング情報を表す。D_L1、D_L2は、ソースマッピング部1010で空間情報を用いて生成された値である。ダウンミックス信号がステレオ信号である場合、ダウンミックス信号がモノ信号である場合と同じ方法で1つ以上のサブレンダリング情報生成部で複数のサブレンダリング情報を生成することができる。複数のサブレンダリング情報生成部が生成するサブレンダリング情報の種類は例示的なもので、これらのサブレンダリング情報の種類に本発明が制限されることはない。
【0113】
サブレンダリング情報生成部1020で生成されたサブレンダリング情報は、統合部1030、処理部1040及びドメイン変換部1050を経てレンダリング部900に転送される。統合部1030は、チャンネル別に生成されたサブレンダリング情報を統合して、レンダリング過程のためのレンダリング情報(例えば、HL_L、HL_R、HR_L、HR_R)にする。この統合部1030での統合過程を、ダウンミックス信号がモノ信号である場合とステレオ信号である場合とに分けて説明すると、次の通りである。ダウンミックス信号がモノ信号である場合、レンダリング情報を、下記の[数式24]のように表現することができる。
【0114】
【数24】
【0115】
ダウンミックス信号がステレオ信号である場合、レンダリング情報を、下記の[数式25]のように表現することができる。
【0116】
【数25】
【0117】
その後、プロセシング部1040は、補間部1041及び/又は平滑化部1042を含み、当該レンダリング情報に補間及び平滑化を行うことができる。この補間及び平滑化を、時間ドメイン、周波数ドメイン又はQMFドメインで行うことができる。本明細書は、時間ドメインを挙げて記述しているが、この時間ドメインに本発明が限定されることはない。
【0118】
補間は、転送されたレンダリング情報が時間ドメインで広い間隔を有する場合、これらレンダリング情報間に存在しないレンダリング情報を得るために行われる。例えば、n番目のタイムスロットとn+k番目のタイムスロットでレンダリング情報が存在するとする時(k>1)、生成されたレンダリング情報(例えば、HL_L、HR_L、HL_R、HR_R)を用いて、転送されなかったタイムスロット上で線形補間を行うことができる。補間によって生成されたレンダリング情報は、ダウンミックス信号がモノ信号である場合とステレオ信号である場合とに分けて説明すると、次の通りである。ダウンミックス信号がモノ信号である場合、補間されたレンダリング情報を、下記の[数式26]のように表現することができる。
【0119】
【数26】
【0120】
ダウンミックス信号がステレオ信号である場合、補間されたレンダリング情報を、下記の[数式27]のように表現することができる。
【0121】
【数27】
【0122】
ここで、0<j<kであり、j、kはそれぞれ整数であり、aは0<a<1の実数でであり、下記の[数式28]のように表現することができる。
【0123】
【数28】
【0124】
上記[数式27]又は[数式28]によって2つのタイムスロットにおける値を直線で連結した線上で、転送されなかったタイムスロットに対応する値を得ることができる。補間についての詳細は、図22及び図23を参照して後述する。
【0125】
時間ドメインにおいて隣接するタイムスロット間でフィルター係数値が急に変化する場合、平滑化部1042は、不連続点が発生して歪曲を招くという問題を防ぐために平滑化を行う。時間ドメイン上の平滑化を、図12〜図16を参照して記述した平滑化方法によって行うことができる。また、この平滑化を拡張とともに行うことができ、適用される位置によって平滑化方法を異ならせることができる。ダウンミックス信号がモノ信号である場合、時間ドメイン平滑化を、下記の[数式29]のように表現することができる。
【0126】
【数29】
【0127】
すなわち、以前のタイムスロット(n−1)で平滑化処理されたレンダリング情報HM_L(n−1)'又はHM_R(n−1)'に(1−b)を乗じ、現在タイムスロット(n)で生成されたレンダリング情報HM_L(n)又はHM_R(n)にbを乗じ、これらを合算することによって、1−pole IIRフィルター形態の平滑化を行うことができる。ここで、bは、0<b<1の定数値であり、b値が小さいほど平滑化効果が大きくなり、b値が大きいほど平滑化効果は小さくなる。また、残りのフィルターも同じ方法で適用することができる。
【0128】
上記時間ドメイン平滑化に対する[数式29]を用いることによって、下記の[数式30]のように表現されるように補間及び平滑化を一つの式にすることができる。
【0129】
【数30】
【0130】
補間部1041及び/又は平滑化部1042で補間及び/又は平滑化を行うと、プロトタイプレンダリング情報が持つエネルギーと異なるエネルギー値を持つレンダリング情報を得ることができる。このような問題を防止するためのエネルギー正規化をさらに行うことができる。
【0131】
ドメイン変換部1050は、レンダリングを行うためのドメインに対してレンダリング情報のドメイン変換を行う。レンダリングを行うためのドメインとレンダリング情報の適用ドメインとが同じ場合には、ドメイン変換を行わなくて良い。その後、ドメイン変換されたレンダリング情報は、レンダリング部900に転送される。
【0132】
図19は、本発明の一実施例による空間情報変換部でレンダリング情報を生成する第2方法を示すブロック図である。この第2方法は、空間情報変換部1000が、ソースマッピング部1010、サブレンダリング情報生成部1020、統合部1030、処理部1040及びドメイン変換部1050を含み、サブレンダリング情報生成部1020は、一つ以上のサブレンダリング情報生成部を含むという点で、レンダリング情報を生成する上記第1方法と類似している。
【0133】
図19を参照すると、レンダリング情報を生成する第2方法とレンダリング情報を生成する第1方法との差異は、処理部1040の位置にある。したがって、サブレンダリング情報生成部1020で各チャンネル別に生成されたサブレンダリング情報(例えば、モノ信号である場合はFL_L、FL_R、ステレオ信号である場合はFL_L1、FL_L2、FL_R1、FL_R2)に対してチャンネル別に補間及び/又は平滑化を行うことができる。その後、併合部1030は、補間及び/又は平滑化の行われたサブレンダリング情報を併合し、レンダリング情報を生成する。生成されたレンダリング情報は、ドメイン変換部1050を経てレンダリング部900に転送される。
【0134】
図20は、本発明の一実施例による空間情報変換部1000でレンダリング情報を生成する第3方法を示すブロック図である。この第3方法は、空間情報変換部1000が、ソースマッピング部1010、サブレンダリング情報生成部1020、併合部1030、処理部1040及びドメイン変換部1050を含み、サブレンダリング情報生成部1020は、一つ以上のサブレンダリング情報生成部を含むという点で、レンダリング情報を生成する上記第1方法及び第2方法と似ている。
【0135】
図20を参照すると、レンダリング情報を生成する第3方法とレンダリング情報を生成する第1方法及び第2方法との差異は、プロセシング部1040がソースマッピング部1010の次に位置するということにある。したがって、ソースマッピング部1010で空間情報を用いて生成されたソースマッピング情報を、それぞれのチャンネル別に補間及び/又は平滑化が行うことができる。その後、サブレンダリング情報生成部1020は、補間及び/又は平滑化されたソースマッピング情報及びフィルター情報を用いてサブレンダリング情報を生成する。これらサブレンダリング情報は、併合部1030で併合されてレンダリング情報となり、ドメイン変換部1050を経てレンダリング部900に転送される。
【0136】
図21は、本発明の一実施例によるレンダリング過程で行われるレンダリング情報処理方法を示す。図21は、DFTドメインでレンダリング過程を行う場合を示すが、他のドメインでも類似な方法で具現されることができる。また、図21は、入力信号がモノダウンミックス信号である場合を示すが、ステレオダウンミックス信号などの他の入力チャンネルにも同じ方法で適用可能である。
【0137】
図21を参照すると、時間ドメインのモノダウンミックス信号は、ドメイン変換部でオーバーラップ区間OLを持つウィンドイングをまず行う。図21は、50%オーバーラップを使用した場合を示すが、本発明は他のオーバーラップを使用した場合も含む。このウィンドイングを行う窓関数は、時間ドメインで不連続が発生せずにシームレス連結されながら、DFTドメインの周波数選択性に優れた関数を用いることができる。例えば、窓関数としてサイン二乗窓関数を使用することができる。その後、ウィンドイングによって得られた長さOL*2のモノダウンミックス信号は、ドメイン変換部で変換されたレンダリング情報HL_L'を用いるレンダリングフィルターのタブ長さだけ(正確にはタブ長さ−1)のゼロパッディングZLをした後、DFTドメインへとドメイン変換を行う。図20は、kブロックダウンミックス信号がDFTドメインへとドメイン変換されたものを示す。
【0138】
ドメイン変換されたダウンミックス信号は、レンダリング部でレンダリング情報を用いるレンダリングフィルターによりレンダリングされる。このレンダリング過程を、周波数ドメインでダウンミックス信号とレンダリング情報との積で表現することができる。レンダリングされたダウンミックス信号は、逆ドメイン変換部でIDFT(離散逆フーリエ変換)を行った後、以前に長さOLの遅延で実行されたダウンミックス信号(図20で、k−1ブロック)にオーバーラップし、サラウンド信号を生成する。このようなレンダリング過程が行われる各ブロックで補間を行うことができるが、以下、この補間方法について説明する。
【0139】
図22は、本発明の一実施例による第1補間方法を示す。本発明による補間を、様々な位置で行うことができる。例えば、図18〜図20に示す空間情報変換部内の様々な位置で行うことができ、レンダリング部でも行うことができる。補間される値は、空間情報、ソースマッピング情報、レンダリング情報、フィルター情報などになりうる。本明細書では、空間情報を基準に説明されるが、この空間情報に本発明が限定されるわけではない。また、補間を、より広いバンドに拡張された後又はより広いバンドに拡張されるのと共に行うことができる。
【0140】
図22を参照すると、符号化装置から転送される空間情報を、タイムスロットごとに転送するのではなく、任意の位置で転送することができる。一つの空間フレームには複数の空間情報セット(例えば、図22のパラメータセットn、n+1)を転送することができ、ビットレートが低い場合には、一つの空間フレームに一つの新しい空間情報セットを転送することができる。したがって、転送されないタイムスロットに対しては隣接する転送された空間情報セットの値を用いて補間を行う。レンダリングを行うウィンド間の間隔はタイムスロットと常に一致するのではないので、図22のようにレンダリング窓(K−1、K、K+1、K+2等)の中央における補間値を探し、この値を用いることができる。図22は、空間情報セットが存在するタイムスロット間を線形補間する場合を示すが、この補間方法に本発明が限定されことはない。例えば、空間情報セットが存在しないタイムスロットは、補間をせず、以前の値を使用し又はあらかじめ定められた値を使用することができる。
【0141】
図23は、本発明の一実施例による第2補間方法を示す。図23を参照すると、第2補間方法は、以前の値を使用する区間、あらかじめ定められたデフォルト値を使用する区間などを組み合わせた形態である。例えば、一つの空間フレームの一定区間で以前の値を維持する方法、あらかじめ定められたデフォルト値を使用する方法及び線形補間を行う方法のうち少なくとも一つを使用し、補間を行うことができる。一つの窓に二つ以上の新しい空間情報セットが存在する場合には歪曲が生じうるが、この歪曲を防止するためのブロックスイッチングについて以下に説明する。
【0142】
図24は、本発明の一実施例によるブロックスイッチングを示す図である。図24の(a)に示すように、窓長さがタイムスロットの長さよりも大きいので、一つの窓区間に二つ以上の空間情報セット(例えば、図24のパラメータセットn、n+1)が存在する場合がありうる。この場合に、それぞれの空間情報セットを、それぞれ異なるタイムスロットに適用する必要があり、二つ以上の空間情報セットを補間した一つの値が適用されると、歪曲の発生につながることがある。すなわち、窓長さによる時間解像度不足による歪曲が発生することがある。
【0143】
この問題を解決するために、窓の大きさをタイムスロットの解像度に合うように可変にする切替方法を使用することができる。例えば、図24の(b)に示すように、高い解像度が要求される区間では、より短い長さの窓を使用するように切り替えることができる。この時、切り替えられた窓の時間ドメインで継ぎ目が生じないように、切り替えられる部分の開始部及び終了部には連結形態の窓を使用する。この窓長さを、別の付加情報として転送するのではなく、復号化装置で空間情報を用いて決定することができる。例えば、空間情報が更新されるタイムスロットの間隔を用いて窓長さを決定することができる。すなわち、前記空間情報の更新される間隔が狭いと、短い長さの窓関数を用い、空間情報の更新される間隔が広いと、長い長さの窓関数を用いることができる。この場合、レンダリング時に可変窓を使用することによって、窓長さ情報を別途に送るのに必要なビットを使用しなくて済むという長所がある。また、図24の(b)に示すように、窓長さは単に2種類のみ使用するのではなく、空間情報の転送頻度及び関係によって様々な長さの窓を使用することができる。決定された窓長さ情報は、サラウンド信号を生成する様々な段階に適用されることができるが、この窓長さ情報が適用される段階について以下に説明する。
【0144】
図25は、本発明の一実施例による窓長さ決定部で決定された窓長さが適用される位置を示すブロック図である。図25を参照すると、窓長さ決め部1400は、空間情報を用いて窓長さを決定することができる。決定された窓長さに関する情報は、ソースマッピング部1010、統合部1030、処理部1040、ドメイン変換部1050、1100、逆ドメイン変換部1300に適用されることができる。図25は、ステレオダウンミックス信号が用いられる場合を示すが、このステレオダウンミックス信号に本発明が制限されることはない。上記のように、窓の長さを短くするとしても、フィルターのタブ数によって決定されるゼロパッディングの長さは調節されないという問題点がある。以下、この問題点の解決方法について説明する。
【0145】
図26は、本発明の一実施例による様々な長さを持つフィルター処理方法を示す図である。前述のように、フィルターのタブ数によって決定されるゼロパッディングの長さが調節されない場合、実際に該当の長さだけの重複が発生し、依然として時間解像度が不足するという問題点が生じうる。この問題点の解決方法は、短い長さの窓を使用する場合、フィルタータブの長さを制限し、ゼロパッディングの長さを短くすることである。このゼロパッディングの長さを短くする方法は、フィルター応答の後部分(例えば、残響に対応する拡散区間)を切り捨てることによって実現可能である。この場合、たとえフィルター応答の後部分を切り捨てない場合に比べて不正確なレンダリング過程となるが、時間ドメインでのフィルター係数値は非常に小さな値で、主として残響に影響を与えるから、省略しても音質に大きな差はない。
【0146】
図26を参照すると、4種類のフィルターが用いられることができる。4種類のフィルターを、DFTドメインで用いることができるが、本発明が、DFTドメインで用いられるフィルターに限定されるわけではない。N1フィルターは、長いフィルター長(FL)及びフィルタータブ数を制限しない長いゼロパッディングの長さ(2*OL)を持つフィルターを表す。N2フィルターは、N1フィルターとフィルター長(FL)は同一であるが、フィルターのタブ数を制限し、ゼロパッディングの長さ(2*OL')が短いフィルターを表す。N3フィルターは、N1フィルターに比べてフィルター長(FL')は短いが、フィルターのタブ数を制限せず、ゼロパッディングの長さ(2*OL)は長いフィルターを表す。N4フィルターは、N1フィルターと比べてウィンド長(FL')も短く、フィルターのタブ数を制限してゼロパッディングの長さ(2*OL')も短いフィルターを表す。本発明は、上記例示された4種類のフィルターを用いて時間解像度問題を解決することができる。また、フィルター応答の後部分に対して、ドメイン別に異なるフィルター係数を用いることができる。
【0147】
図27は、本発明の一実施例による複数個のサブフィルターでオーディオ信号を処理する方法を示す。一つのフィルターを、異なるフィルター係数を持つサブフィルターに分離することができる。サブフィルターを用いてオーディオ信号を処理した後、処理結果を加える方法が用いられることができる。エネルギーの小さいフィルター応答の後部分に空間情報を適用する場合、すなわち、長いフィルタータブを持つレンダリングをする場合、定められた長さ単位にオーディオ信号を分割して処理する機能を提供する。例えば、フィルター応答の後部分は、各チャンネルに対応するHRTF別に大きく変化しない部分であるので、複数の窓に対する共通の係数を抽出してレンダリングすることができる。本明細書では、DFTドメインで実施される場合について説明するが、本発明はDFTドメインに限定されない。
【0148】
図27を参照すると、一つのフィルター(FL)を複数個のサブ領域に分離した後、それぞれのサブ領域を、異なるフィルター係数を持つ複数個のサブフィルター(フィルターA及びフィルターB)で処理することができる。その後、フィルターAで処理された出力及びフィルターBで処理された出力を互いに結合する。例えば、フィルターAで処理された出力及びフィルターBで処理された出力のそれぞれに対してIDFT(離散逆フーリエ変換)をし、時間ドメインの信号を生成した後、それぞれの信号は互いに加えられる。この時、フィルターBにより処理された出力は、フィルターAにより処理された出力に比べてFL'だけ時間遅延された位置に加えられる。このように複数のサブフィルターで処理された信号は、一つのフィルターで処理される場合と同じ効果を得ることができる。また、本発明は、フィルターBで処理された出力を別途にダウンミックス信号にレンダリングする方法を含む。この時、空間情報から抽出された係数などを用いたり、空間情報を部分的に用いたり、又は、空間情報を用いず、直接ダウンミックス信号に対する出力にレンダリングすることができる。
【0149】
上記方法は、フィルターのタブ数(長さ)が長い場合にこれを分割して適用でき、エネルギーの小さい後部分は、空間情報を用いた変換を行うことなく適用できるという特徴を持つ。この時、空間情報を用いた変換を行わない場合、処理された窓ごとに異なるフィルターを適用するのではないので、ブロックスイッチングのような手法を適用しなくてもよい。図26では、2個のドメインに分割する場合を示すが、本発明はこれに限定されず、複数個の領域に分割しても良い。
【0150】
図28は、本発明の一実施例による複数個のサブフィルターを用いてフィルター係数をモノダウンミックス信号に分割レンダリングする方法を示す。図28は、一つのレンダリング係数に関連する。この方法を、レンダリング係数別に行う。図28を参照すると、図27のフィルターA情報が第1分割レンダリング情報HM_L_Aに該当し、図27のフィルターB情報が第2分割レンダリング情報HM_L_Bに該当する。図28は、二つのサブフィルターに分割して行われる実施例を示すが、二つのサブフィルターに本発明が限定されるわけではない。二つのサブフィルターは、空間情報変換部1000で生成されたレンダリング情報HM_Lを用い、二つのサブフィルターを、分配器1500を介して得ることができる。二つのサブフィルターを、プロトタイプHRTF情報又は使用者の選択によって決定された情報を用いて得ることができる。使用者の選択によって決定された情報は、例えば、使用者の好みによって選択された空間情報になりうる。ここで、HM_L_Aは、受信した空間情報に基づいたレンダリング情報であり、HM_L_Bを、信号に共通して適用される空間感を与えるためのレンダリング情報と見なすことができる。
【0151】
前述のように、複数個のサブフィルターでの処理は、DFTドメインの他に時間及びQMFドメインでも適用されることができる。すなわち、フィルターAとフィルターBに分離された係数値がそれぞれ、時間又はQMFドメインレンダリングを通じてダウンミックス信号に適用された後に加えられて、最終信号を生成することができる。レンダリング部900は、第1分割レンダリング部950及び第2分割レンダリング部960を含み、第1分割レンダリング部950はHM_L_Aを用いてレンダリング過程を行い、第2分割レンダリング部960はHM_L_Bを用いてレンダリング過程を行う。
【0152】
図27のように、フィルターA及びフィルターBが時間的に従った同一フィルターの分割である場合、当該時間間隔に対応する適切な遅延を反映することができる。図28は、モノダウンミックス信号である場合を取り上げているが、モノダウンミックス信号であり且つデコリレータ使用する場合、フィルターBに該当する部分はデコリレータに適用せず、直接モノダウンミックス信号にのみ適用することも可能である。
【0153】
図29は、本発明の一実施例による複数個のサブフィルターを用いてフィルター係数をステレオ信号に分割レンダリングする方法のブロック図である。図29に示す分割レンダリング過程は、二つのサブフィルターを、空間情報変換部1000で生成されたレンダリング情報、プロトタイプHRTFフィルター情報又は使用者決定情報を用いて分配器1500を介して得ることができるという点で、図28と似ている。ただし、図28と違い、フィルターBに対応する分割レンダリング過程がL/R信号に共通して適用される。すなわち、分配器1500でフィルターA情報に該当する第1分割レンダリング情報、第2分割レンダリング情報及びフィルターB情報に該当する第3分割レンダリング情報が生成される。この時、第3分割レンダリング情報を、L/R信号に共通して適用されうるフィルター情報又は空間情報を用いて生成することができる。図29を参照すると、レンダリング部900は、第1分割レンダリング部970、第2分割レンダリング部980及び第3分割レンダリング部990を含む。第3分割レンダリング情報は、第3分割レンダリング部990でL/R信号の和信号に適用されて一つの出力信号を生成する。その後、第1分割レンダリング部970及び第2分割レンダリング部980で、フィルターA1及びA2によりそれぞれ独立してレンダリングされたL/R出力信号に加えられ、サラウンド信号を生成する。この時、第3分割レンダリング部990の出力信号を、適切な遅延後に加えることができる。図29では便宜上、L/R入力から相手側のチャンネルに適用されるクロスレンダリング情報の表現を省略した。
【0154】
図30は、本発明の一実施例によるダウンミックス信号の第1ドメイン変換方法のブロック図である。以上ではDFTドメインで行われるレンダリング過程について説明した。前述のように、レンダリング過程を、DFTドメインだけでなく、他のドメインでも行うことができるが、図30は、DFTドメインで行われるレンダリング過程を示す。ドメイン変換部1100は、QMF及びDFTフィルターを含み、逆ドメイン変換部1300は、IDFT及びIQMFフィルターを含む。図30は、モノダウンミックス信号に対して示すが、本発明はこれに制限されない。
【0155】
図30を参照すると、Pサンプルの時間ドメインダウンミックス信号がQMFフィルターを通過すると、P個のサブバンドサンプルが生成される。バンド別に再びW個のサンプルを集めてウィンドイングを行った後、ゼロパッディングしてM−ポイントDFT(FFT)を行う。この時のDFTは、前述した形態のウィンドイングによる処理が可能である。M−ポイントDFTを介して得られるバンド別M/2個の周波数ドメイン値を再びPバンドに連結した値は、M/2*P−ポイントDFTを介して得た周波数スペクトルの近似値と見ることができる。したがって、M/2*P−ポイントDFTドメインで表現されたフィルター係数を周波数スペクトルに乗じると、前述のDFTドメインにおけるレンダリング過程と同じ効果が得られる。
【0156】
この時、QMFフィルターを通過した信号は、隣接するバンド間に漏洩(leakage)、例えば、エイリアシングを有する。すなわち、現在のバンドに隣接するバンドに該当する値がしみ込んでおり、現在のバンドに存在する値の一部は隣接するバンドを超えている状態が存在する。この状態でQMF統合を行うとQMFの特性によって元の信号が復元されるが、本発明のように、該当バンドの信号にフィルターリングなどの処理を行うと、漏洩の影響で信号に歪曲が発生する。このような問題を最小化するために、ドメイン変換部1100でQMF後に各バンド別DFTを行う前に、最小漏洩バタフライBを通過させ、逆ドメイン変換部1300でIDFT後にその逆過程Cを行い、元の信号を復元する処理をすることができる。
【0157】
一方、空間情報変換部1000で生成されるレンダリング情報の生成過程をダウンミックス信号の生成過程と一致させるために、はじめからM/2*P−ポイントDFTを行うのではなく、プロトタイプフィルタ情報に対するQMF通過信号をDFTして処理する方法も可能である。この場合には、QMFフィルターによる遅延及びデータ広がりが存在しうる。
【0158】
図31は、本発明の一実施例によるダウンミックス信号の第2ドメイン変換を示すブロック図である。図31は、QMFドメインで行われるレンダリング過程を示す。ドメイン変換部1100はQMFドメイン変換部を含み、逆ドメイン変換部1300はIQMFを含む。図31は、ドメイン変換部がQMFフィルターである以外は、処理構造がDFTのみを用いる場合と同一である。以下、QMFは、同じ帯域幅を持つQMF及びハイブリッドQMFを含むQMFとする。DFTのみを利用する場合との差異は、レンダラーM3012で行われるレンダリング過程がQMFドメインで実施されるので、レンダリング情報の生成もQMFドメインで行われ、レンダリング過程がDFTドメインでのように積で表現されず、畳み込みで表現されるという点である。
【0159】
QMFフィルターがB個のバンドを持つとすれば、フィルター係数を、B個のバンドに対してそれぞれ異なる特性(異なる係数値)を持つフィルター係数の集合で表現することができる。場合によって、フィルターのタブ数が1次になる場合(すなわち、定数が乗じられる場合)、B個周波数スペクトルを持つDFTドメインでのレンダリング過程と演算処理が一致する。下記の[数式31]は、HM_Lレンダリング情報を用いてレンダリング過程が行われる一つの経路に対し、一つのQMFバンド(b)で行われるレンダリング過程を表す。
【0160】
【数31】
【0161】
ここで、kは、QMFバンドでの時間順序、すなわち、タイムスロット単位を意味する。このQMFドメインで行われるレンダリング過程は、実際転送された空間情報がQMFドメインで適用可能な値である場合、該当のデータを最も適用しやすく、適用過程における歪曲を最小化できるという利点を有する。ただし、プロトタイプフィルタ情報(例えば、プロトタイプHRTFフィルター係数)の変換過程でQMFドメインに変換した時、変換された値を適用する過程が多い演算量を必要とする。この場合に、フィルター情報の変換過程でHRTF係数をパラメータ化する方法を通じて演算量を最小化することができる。
【0162】
以上では具体的な実施例に挙げて本発明を説明してきたが、これらの実施例は、本発明を例示するためのもので、本発明の範囲を制限するためのものではない。したがって、当業者にとっては本発明の技術的思想の範囲内で様々な変形が可能であるということは明らかであり、本発明の範囲は、添付の特許請求の範囲によって解析されるべきである。
【産業上の利用可能性】
【0163】
本発明による信号処理方法及び装置は、符号化装置で提供された空間情報を用いて、マルチチャンネルを生成できない復号化装置でもHRTFフィルター情報又は使用者によるフィルター情報を用いてサラウンド信号を生成することができる。特に、本発明を、ステレオ信号のみ再生可能な多くの復号化装置に有用に用いることができる。
【図面の簡単な説明】
【0164】
【図1】本発明の一実施例によるオーディオ信号の符号化装置及び復号化装置を示すブロック図である。
【図2】本発明の一実施例によるオーディオ信号のビットストリーム構造を示す図である。
【図3】本発明の一実施例による空間情報変換部を示す詳細ブロック図である。
【図4】本発明の一実施例によるソースマッピング過程で用いられるチャンネル構成を示す図である。
【図5】本発明の一実施例によるソースマッピング過程で用いられるチャンネル構成を示す図である。
【図6】本発明の一実施例によるステレオダウンミックス信号に対するレンダリング部の詳細ブロック図である。
【図7】本発明の一実施例によるステレオダウンミックス信号に対するレンダリング部の詳細ブロック図である。
【図8】本発明の一実施例によるモノダウンミックス信号に対するレンダリング部の詳細ブロック図である。
【図9】本発明の一実施例によるモノダウンミックス信号に対するレンダリング部の詳細ブロック図である。
【図10】本発明の一実施例による平滑化部及び拡張部が適用される位置を示すブロック図である。
【図11】本発明の一実施例による平滑化部及び拡張部が適用される位置めを示すブロック図である。
【図12】本発明の一実施例による第1平滑化方法を説明するグラフである。
【図13】本発明の一実施例による第2平滑化方法を説明するグラフである。
【図14】本発明の一実施例による第3平滑化方法を説明するグラフである。
【図15】本発明の一実施例による第4平滑化方法を説明するグラフである。
【図16】本発明の一実施例による第5平滑化方法を説明するグラフである。
【図17】チャンネル別プロトタイプフィルタ情報を説明するための図である。
【図18】本発明の一実施例による空間情報変換部でレンダリングフィルター情報を生成する第1方法を示すブロック図である。
【図19】本発明の一実施例による空間情報変換部でレンダリングフィルター情報を生成する第2方法を示すブロック図である。
【図20】本発明の一実施例による空間情報変換部でレンダリングフィルター情報を生成する第3方法を示すブロック図である。
【図21】本発明の一実施例によるレンダリング部でレンダリング情報を用いてサラウンド信号を生成する方法を示す図である。
【図22】本発明の一実施例による第1補間方法を示す図である。
【図23】本発明の一実施例による第2補間方法を示す図である。
【図24】本発明の一実施例によるブロックスイッチング方法を示す図である。
【図25】本発明の一実施例による窓長さ決め部で決定された窓長さが適用される位置を示すブロック図である。
【図26】本発明の一実施例によるオーディオ信号を処理するのに用いられる様々な長さのフィルターを示す図である。
【図27】本発明の一実施例による複数個のサブフィルターでオーディオ信号を処理する方法を示す図である。
【図28】本発明の一実施例による複数個のサブフィルターを用いて生成された分割レンダリング情報をモノダウンミックス信号にレンダリングする方法を示すブロック図である。
【図29】本発明の一実施例による複数個のサブフィルターを用いて生成された分割レンダリング情報をステレオダウンミックス信号にレンダリングする方法を示すブロック図である。
【図30】本発明の一実施例によるダウンミックス信号の第1ドメイン変換方法を示すブロック図である。
【図31】本発明の一実施例によるダウンミックス信号の第2ドメイン変換方法を示すブロック図である。
【技術分野】
【0001】
本発明は、メディア信号の処理方法及び装置に関し、より詳細には、メディア信号の空間情報を用いてサラウンド信号を生成する信号処理方法及び装置に関する。
【背景技術】
【0002】
一般に、メディア信号をモノ又はステレオ信号をダウンミックスして生成されたダウンミックス信号と、このメディア信号の空間情報とを用いてマルチチャンネルメディア信号を生成する方法及び装置が多く用いられてきている。
【発明の開示】
【発明が解決しようとする課題】
【0003】
しかしながら、上記のような方法及び装置は、マルチチャンネル信号を生成出できない環境、例えば、ステレオ信号のみ生成可能な装置では用いられることができない。すなわち、マルチチャンネル信号を生成できない環境で、メディア信号の空間情報を用いてマルチチャンネル信号の効果を出せるサラウンド信号を生成する方法及び装置は存在していない。したがって、モノ又はステレオ信号のみ生成可能な装置ではサラウンド信号を生成する方法及び装置が存在しておらず、メディア信号を效率的に処理する上で多くの問題点があった。
【0004】
本発明は上記の問題点を解決するためのもので、その目的は、メディア信号の空間情報を用いてメディア信号をサラウンド信号に変換するメディア信号の処理方法及び装置を提供することにある。
【課題を解決するための手段】
【0005】
上記の目的を達成するために、本発明は、マルチソース間の特徴を表す空間情報を用いてソース別に対応するソースマッピング情報を生成する段階と、前記ソースマッピング情報にサラウンド効果を与えるフィルター情報をソース別に適用し、サブレンダリング情報を生成する段階と、少なくとも一つの前記サブレンダリング情報を合成し、サラウンド信号を生成するためのレンダリング情報を生成する段階と、前記レンダリング情報を、前記マルチソースをダウンミックスして生成されたダウンミックス信号に適用し、サラウンド信号を生成する段階と、を含むことを特徴とする信号処理方法を提供する。
【0006】
また、前記目的を達成するために、本発明は、マルチソース間の特徴を表す空間情報を用いてソース別に対応するソースマッピング情報を生成するソースマッピング部と、前記ソースマッピング情報にサラウンド効果を与えるフィルター情報をソース別に適用し、サブレンダリング情報を生成するサブレンダリング情報生成部と、少なくとも一つの前記サブレンダリング情報を合成し、サラウンド信号を生成するためのレンダリング情報を生成する合成部と、前記レンダリング情報を、前記マルチソースをダウンミックスして生成されたダウンミックス信号に適用し、サラウンド信号を生成するレンダリング部と、を含むことを特徴とする信号処理装置を提供する。
【0007】
以下、上記の目的を具体的に実現できる本発明の好適な実施例を、添付の図面を参照しつつ説明する。本発明で使われる用語は、可能なかぎり現在広く使われている一般的な用語を選択したが、特定の場合は、の出願人が任意に選定した用語もある。この場合には発明の詳細な説明でその意味を記載したので、単純な用語の名称ではなく用語が持つ意味として本発明を把握すべきである。以下、本発明は、便宜上、オーディオ信号を取り上げて記述されるが、本発明がオーディオ信号に限定されることはない。
【発明の効果】
【0008】
本発明に係る信号処理方法及び装置によれば、マルチチャンネル信号をダウンミックスして生成されたダウンミックス信号及び前記マルチチャンネル信号の空間情報を含むビットストリームを受信したデコーディング装置が、マルチチャンネル信号を復元できない環境においも、サラウンド効果を持つ信号を生成することが可能になる。
【発明を実施するための最良の形態】
【0009】
図1は、本発明の一実施例によるオーディオ信号の符号化装置及び復号化装置を示すブロック図である。図1を参照すると、符号化装置10は、ダウンミックス部100、空間情報生成部200、ダウンミックス信号符号化部300、空間情報符号化部400及び多重化部500を含む。
【0010】
マルチソースオーディオ信号X1,X2,…,Xnがダウンミックス部100に入力されると、ダウンミックス部100は、マルチソースオーディオ信号をダウンミックスしてダウンミックス信号を生成する。ダウンミックス信号は、モノ、ステレオ又はマルチソースオーディオ信号を含む。ここで、ソースはチャンネルを含み、便宜上、以下ではチャンネルと記述する。本明細書では、モノ又はステレオダウンミックス信号を基準として説明するが、本発明がモノ又はステレオダウンミックス信号に限定されることはない。また、符号化装置10は、選択的に外部から直接提供される任意のダウンミックス信号を用いることができる。空間情報生成部200は、マルチチャンネルオーディオ信号から空間情報を生成する。この空間情報をダウンミックス過程中に生成することができる。生成されたダウンミックス信号及び空間情報はそれぞれ、ダウンミックス信号符号化部300及び空間情報符号化部400に符号化された後、多重化部500に転送される。
【0011】
本発明でいう「空間情報とは、符号化装置でマルチチャンネル信号をダウンミックスし、生成されたダウンミックス信号を復号化装置で転送し、このダウンミックス信号を復号化装置がアップミックスしてマルチチャンネル信号を生成するのに必要な情報のことを意味する。空間情報は、空間パラメータを含む。空間パラメータには、チャンネル間のエネルギー差を意味するCLD(チャンネルレベル差)、チャンネル間の相関関係を意味するICC(チャンネル間の信号相関)、2チャンネルから3チャンネルを生成する時に用いられるCPC(チャンネル予測係数)などがある。
【0012】
本発明でいう「ダウンミックス信号符号化部」又は「ダウンミックス信号復号化部」とは、空間情報でないオーディオ信号を符号化又は復号化するコーデックのことを意味する。本明細書は、空間情報でないオーディオ信号としてダウンミックスオーディオ信号を取り上げて記述する。また、ダウンミックス信号符号化部又はダウンミックス信号復号化部は、MP3、AC−3、DTS又はAACを含むことができる。オーディオ信号にコーデック機能を行うものであれば、既存に開発されたコーデックの他、今後開発されるコーデックをも含むことができる。
【0013】
多重化部500は、ダウンミックス信号及び空間情報を多重化してビットストリームを生成し、生成されたビットストリームを復号化装置20に転送する。このビットストリームの構造は、図2で説明される。
【0014】
デコーディング装置20は、逆多重化部600、ダウンミックス信号復号化部700、空間情報復号化部800、レンダリング部900及び空間情報変換部1000を含む。逆多重化部600は、ビットストリームを受信し、該ビットストリームから符号化されたダウンミックス信号と符号化された空間情報とを分離する。その後、ダウンミックス信号復号化部700は、符号化されたダウンミックス信号を復号化し、空間情報復号化部800は、符号化された空間情報を復号化する。空間情報変換部1000は、復号化された空間情報及びフィルター情報用いてダウンミックス信号に適用させられるレンダリング情報を生成する。このレンダリング情報は、ダウンミックス信号に適用されてサラウンド信号を生成できる。
【0015】
サラウンド信号を生成する、例えば、符号化装置10でマルチチャンネルオーディオ信号からダウンミックス信号を生成する過程を、OTT(1対2)ボックス又はTTT(3対3)ボックスなどを用いて多段階で行うことができる。この時、段階ごとに空間情報を生成することができる。この空間情報は、復号化装置20に転送され、復号化装置20は、受信した空間情報を変換した後、変換された空間情報をダウンミックス信号にレンダリングすることによってサラウンド信号を生成することができる。本発明は、ダウンミックス信号をアップミックスしてマルチチャンネル信号を生成するのではなく、アップミックス段階別に空間情報のみを抽出し、抽出された空間情報を用いてレンダリングを行う方法に関する。レンダリング方法には、例えば、HRTF(頭部伝達関数)フィルターリングを用いることができる。
【0016】
この時、空間情報は、ハイブリッドドメインで適用可能な値である。レンダリングは、ドメインによって下記のような種類がありうる。
その第一は、ハイブリッドフィルターバンクにダウンミックス信号を通過させ、ハイブリッドドメインでレンダリングを行う方法である。この時、空間情報に対するドメインの変換は不要である。
【0017】
その第二は、時間ドメインでレンダリングを行う方法である。この方法は、HRTFフィルターが、時間ドメインでFIR(有限逆応答)フィルター又はIIR(無限逆応答)フィルターとしてモデリングされる点を用い、空間情報を時間ドメインのフィルター係数に変換する過程が必要とされる。
【0018】
その第三は、異なる周波数ドメインでレンダリングを行う方法である。例えば、DFT(離散フーリエ変換)ドメインでレンダリングを行う方法である。この第三の方法は、空間情報を該当のドメインへと変換する過程を必要とする。また、この方法は、時間ドメインにおけるフィルターリングを周波数ドメインにおける演算に置換することによって高速演算が可能である。
【0019】
本発明でいうフィルター情報は、オーディオ信号を処理するためのフィルターに関する情報を意味し、特定フィルターが持つフィルター係数を含む。このフィルター情報の例には、次のようなものがある。プロトタイプフィルター情報は、特定フィルターが持つ元来のフィルター情報を意味し、GL_Lなどで表現可能である。変換フィルター情報は、プロトタイプフィルタ情報が変形された後のフィルター係数を意味し、GL_L'などで表現可能である。サブレンダリング情報は、サラウンド信号を生成するためにプロトタイプフィルタ情報を空間化したフィルター情報を意味し、FL_L1等で表現可能である。レンダリング情報は、レンダリングを行うために必要なフィルター情報を意味し、HL_Lなどで表現可能だ。補間/平滑化されたレンダリング情報は、レンダリング情報を補間及び/又は平滑化したフィルター情報を意味し、HL_L'などで表現可能である。本明細書は、上記のフィルター情報を取り上げて記述するが、これらのフィルター情報の名称に本発明が限定されるわけではない。特に、フィルター情報は、HRTFを取り上げて説明するが、本発明がこのHRTFに限定されることはない。
【0020】
その後、レンダリング部900は、復号化されたダウンミックス信号及びレンダリング情報を受信し、これら復号化されたダウンミックス信号及びレンダリング情報を用いてサラウンド信号を生成する。このサラウンド信号は、ステレオ信号のみ生成可能なオーディオ・システムにサラウンド効果を提供する信号になりうる。本発明は、ステレオ信号のみ生成可能なオーディオ・システムの他にも適用可能である。
【0021】
図2は、本発明の一実施例によるオーディオ信号ビットストリームの構造を示す図である。このビットストリームは、符号化されたダウンミックス信号及び符号化された空間情報を含む。図2を参照すると、1フレームオーディオペイロードは、ダウンミックス信号フィールド及び補助データフィールドを含む。この補助データフィールドに、符号化された空間情報を保存することができる。例えば、オーディオペイロードが48〜128kbpsの時、空間情報は5〜32kbps程度の範囲を持つことができるが、このオーディオペイロード及び空間情報の範囲に特に制限はない。
【0022】
図3は、本発明の一実施例による空間情報変換部を示す詳細ブロック図である。図3を参照すると、空間情報変換部1000は、ソースマッピング部1010、サブレンダリング情報生成部1020、統合部1030、処理部1040、ドメイン変換部1050を含む。
【0023】
ソースマッピング部1010は、空間情報を用いてソースマッピング過程を行うことによって、オーディオ信号の各ソースに対応するソースマッピング情報を生成する。ソースマッピング情報とは、オーディオ信号の各ソースに対応するように空間情報などを用いて生成された各ソース別情報のことを指す。ソースはチャンネルを含み、この場合に各チャンネルに対応するソースマッピング情報が生成される。ソースマッピング情報は、係数形態で表現されることができる。ソースマッピング過程についての詳細な説明は、後ほど図4及び図5を参照して記述する。
【0024】
サブレンダリング情報生成部1020は、ソースマッピング情報及びフィルター情報を用いて各ソースに対応するサブレンダリング情報を生成する。例えば、レンダリング部900がHRTFフィルターである場合、サブレンダリング情報生成部1020は、HRTFフィルター情報を用いてサブレンダリング情報を生成することができる。
【0025】
統合部1030は、サブレンダリング情報をダウンミックス信号のソースに対応するように統合し、レンダリング情報を生成する。レンダリング情報とは、空間情報及びフィルター情報を用いて生成された情報で、ダウンミックス信号に適用されてサラウンド信号を生成する情報のことを指す。レンダリング情報は、フィルター係数形態を含む。統合は、レンダリング過程の演算量を減らすために省略しても良い。その後、レンダリング情報は、プロセシング部1042に転送される。プロセシング部1042は、補間部1041及び/又は平滑化部1042を含む。レンダリング情報は補間部1041及び/又は平滑化部1042で補間及び/又は平滑化される。その後、ドメイン変換部1050は、レンダリング情報のドメインを、レンダリング部900で用いられるダウンミックス信号のドメインに変換する。このドメイン変換部1005は、図3に示す位置以外にも様々な位置に適用されることができる。したがって、レンダリング情報がレンダリング部900と同じドメインで生成された場合、ドメイン変換部1050を省略しても良い。ドメイン変換されたレンダリング情報は、レンダリング部900に転送される。
【0026】
また、空間情報変換部1000は、フィルター情報変換部1060を含むことができる。図3で、フィルター情報変換部1060は、空間情報変換部1000の内部に含まれているが、空間情報変換部1000の外部に存在しても良い。フィルター情報変換部1060は、任意のフィルター情報、例えば、HRTFを、サブレンダリング情報又はレンダリング情報を生成するのに適合するように変換する。このフィルター情報の変換過程は、下記のような過程を含むことができる。
【0027】
先ず、適用するドメインを合わせる過程が含まれる。フィルター情報の持っているドメインとレンダリングの行われるドメインとが一致しない場合、これらのドメインを合わせる過程が必要である。例えば、時間ドメインHRTFを、レンダリング情報が生成されるDFT、QMF又はハイブリッドドメインに変換する過程が必要である。
【0028】
次に、ドメイン変換されたHRTFを保存し、空間情報に適用するのを容易にするよう、係数減少過程を含むことができる。例えば、プロトタイプHRTFフィルター係数が長いタブ数(長さ)の応答を持つ場合では、5.1チャンネルの場合、合計10個の該当長さだけの応答に対応するメモリーに該当の係数を保存しなければならない。これは、メモリーへの負担とともに演算量を増加させる要因となる。このような問題を防ぐために、ドメイン変換過程でフィルターの特性を維持しながら保存されなければならないフィルター係数については、減少する方法を考慮することができる。例えば、HRTF応答を少数個のパラメータ値に変換することができる。この時、適用されるドメインによってパラメータ生成過程及び値が異なることができる。
【0029】
ダウンミックス信号は、レンダリング部900でレンダリング情報とレンダリングされる前に、ドメイン変換部1100及び/又はデコリレーティング部1200を通過する。ドメイン変換部1100は、レンダリング情報のドメインとダウンミックス信号のドメインとが異なる場合、両ドメインを一致させるためにダウンミックス信号のドメイン変換を行う。
【0030】
デコリレーティング部1200は、ドメイン変換されたダウンミックス信号に適用される。レンダリング情報にデコリレータを適用する方法に比べて、ダウンミックス信号に適用するという点で演算量は相対的に高いが、レンダリング情報生成過程で生じる歪曲を防ぐことができる。デコリレーティング部1200は、演算量が許容する範囲でそれぞれ異なる特性を持つ複数のデコリレータ含むことができる。また、デコリレーティング部1200は、ダウンミックス信号がステレオ信号である場合には適用されなくて良い。図3では、ドメイン変換されたモノダウンミックス信号、すなわち、周波数ドメイン、ハイブリッドドメイン、QMFドメイン又はDFTドメインにおけるモノダウンミックス信号がレンダリング過程に用いられる場合、該当のドメインにおけるデコリレータを用いる例を示す。また、本発明は、時間ドメインにおいて用いられるデコリレータも含む。この時は、ドメイン変換部1100以前のモノダウンミックス信号が直接デコリレーティング部1200に入力される。前記デコリレータとして一次以上のIIRフィルター(又は、FIRフィルター)を用いることができる。
【0031】
その後、レンダリング部900は、ダウンミックス信号、デコリレートされたダウンミックス信号及びレンダリング情報を用いてサラウンド信号を生成する。ダウンミックス信号がステレオ信号である場合、デコリレートされたダウンミックス信号を用いなくて良い。レンダリング過程についての詳細な説明は、後ほど図6〜図9を参照して記述する。サラウンド信号は、逆ドメイン変換部1300で時間ドメインに変換されて出力される。これで、使用者はステレオ信号が聞けるイヤホンなどでマルチチャンネル効果を持つ音を聞くことができる。
【0032】
図4及び5は、本発明の一実施例によるソースマッピング過程で用いられるチャンネル構成を示す。ソースマッピング過程は、空間情報を用いてオーディオ信号の各ソースに対応するソースマッピング情報を生成する過程である。前述したように、ソースは、チャンネルを含み、図4及び図5に示すチャンネルに対応するようにソースマッピング情報を生成することができる。ソースマッピング情報は、レンダリング過程に適合した形態で生成される。例えば、ダウンミックス信号がモノ信号である場合、CLD1〜CLD5、ICC1〜ICC5などの空間情報を用いてソースマッピング情報を生成することができる。このソースマッピング情報を、D_L(=DL)、D_R(=DR)、D_C(=DC)、D_LFE(=DLFE)、D_Ls(=DLs)、D_Rs(=DRs)などの値で表現することができる。この時、ソースマッピング情報を生成する過程は、空間情報に対応するツリー構造及び使われる空間情報の範囲などによって変化しうる。本明細書ではダウンミックス信号がモノである場合を取り上げて説明するが、本発明がこれに限定されるわけではない。
【0033】
レンダリング部900から出力された左右チャンネル出力を、下の[数式1]のように表現することができる。
【0034】
【数1】
【0035】
ここで、演算子*は、DFTドメインでは積であり、QMF及び時間ドメインでは畳み込みに置換することができる。本発明は、前記L、C、R、Ls、Rsを、空間情報を用いたソースマッピング情報又は空間情報及びフィルター情報を用いたソースマッピング情報により生成する方法を含む。例えば、ソースマッピング情報を、空間情報のCLDのみを用いて又は空間情報のCLD及びICCを用いて生成することができる。CLDのみを用いてソースマッピング情報を生成する方法は、下記の通りである。ツリー構造が図4のような構造である場合、CLDのみを用いてソースマッピング情報を得る第1方法を、下の[数式2]のように表現することができる。
【0036】
【数2】
であり、mはモノダウンミックス信号である。
【0037】
ツリー構造が図5のような構造である場合、CLDのみを用いてソースマッピング情報を得る第2方法を、下の[数式3]のように表現することができる。
【0038】
【数3】
【0039】
CLDのみを用いてソースマッピング情報を生成する場合、3次元の影響を減少することができる。したがって、ICC及び/又はデコリレータを用いてソースマッピング情報を生成することができる。デコリレータ出力信号dx(m)を用いて生成するマルチチャンネル信号は、以下の[数式4]のように表現されることができる。
【0040】
【数4】
【0041】
ここで、A、B、Cは、CLD及びICCで表現できる値であり、d0〜d3はデコリレータであり、mはモノダウンミックス信号である。この方法はD_L、D_Rなどのソースマッピング情報を生成することができない。
【0042】
したがって、ダウンミックス信号に対してCLD、ICC及び/又はデコリレータを用いてソースマッピング情報を生成する第1方法は、dx(m)(x=0,1,2)をそれぞれ独立した入力として見なす。この場合、dxを、下記の[数式5]のようにサブレンダリングフィルター情報の生成過程に用いることができる。
【0043】
【数5】
【0044】
レンダリング情報を、上記[数式5]の結果を用いて下記の[数式6]のように生成することができる。
【0045】
【数6】
【0046】
上記レンダリング情報の生成過程についての詳細は、後述される。上記CLD、ICC及び/又はデコリレータを用いてソースマッピング情報を生成する第1方法は、dx出力値、すなわち、dx(m)を独立した入力として処理するので、演算量を増加することができる。
【0047】
CLD、ICC及び/又はデコリレータを用いてソースマッピング情報を生成する第2方法は、周波数ドメインで適用されるデコリレータを用いる。この場合に、ソースマッピング情報を、下記の[数式7]のように表現することができる。
【0048】
【数7】
【0049】
この場合に、周波数ドメインでデコリレータを適用することによって、デコリレータを適用する前と同じD_L、D_Rなどのソースマッピング情報を生成できるので、簡単に実現可能である。
【0050】
CLD、ICC及び/又はデコリレータを用いてソースマッピング情報を生成する第3方法は、上記第2方法のデコリレータとして全域通過特性を持つデコリレータを使用する。全域通過特性とは、大きさは一定で、位相変化のみを有することを意味する。また、本発明は、上記第1方法のデコリレータとして全域通過特性を持つデコリレータを使用するものを含む。
【0051】
CLD、ICC及び/又はデコリレータを用いてソースマッピング情報を生成する第4方法は、上記第2方法でd0〜d3を用いてデコリレーションを行うのではなく、各チャンネル(例えば、L、R、C、Ls、Rs等)に対するそれぞれのデコリレータを使用してデコリレーションを行う。この場合、ソースマッピング情報を、下記の[数式8]のように表現することができる。
【0052】
【数8】
【0053】
ここで、Kは、CLD及びICC値から決定されるデコリレーションされた信号のエネルギー値であり、d_L、d_R、d_C、d_Ls及びd_Rsは、チャンネル別に適用されるデコリレータである。
【0054】
CLD、ICC及び/又はデコリレータを用いてソースマッピング情報を生成する第5方法は、上記第4方法でd_Lとd_Rとを対称に構成し、d_Lsとd_Rsとを対称に構成することによって、デコリレーション効果を極大化する。すなわち、d_R=f(d_L)、d_Rs=f(d_Ls)といえるので、d_L、d_C及びd_Lsのみを設計すればよい。
【0055】
CLD、ICC及び/又はデコリレータを用いてソースマッピング情報を生成する第6方法は、上記第5方法でd_Lとd_Lsとが相関関係を持つように構成する。また、d_Lとd_Cも相関関係を持つように構成することができる。
【0056】
CLD、ICC及び/又はデコリレータを用いてソースマッピング情報を生成する第7方法は、上記第3方法でデコリレータを全域通過フィルターの直列構造又はネスト化された(nested)構造として使用する。この第7方法は、全域通過フィルターが特性上、直列構造で用いられても全域通過の特性が維持され、重複構造で使用されても全域通過の特性が維持されるという点を利用するのである。直列構造又はネスト化された構造で使用される場合、より様々な形態の位相応答(を得ることができるので、デコリレーション効果を極大化させることができる。
【0057】
CLD、ICC及び/又はデコリレータを用いてソースマッピング情報を生成する第8方法は、従来のデコリレータと上記第2方法の周波数ドメインデコリレータとを共に使用する。この場合、マルチチャンネル信号を、下記の[数式9]のように表現することができる。
【0058】
【数9】
【0059】
この場合に、フィルター係数生成過程は、AがA+Kdに変更される以外は上記第1方法と同様になる。
【0060】
CLD、ICC及び/又はデコリレータを用いてソースマッピング情報を生成する第9方法は、従来のデコリレータを用いる場合、従来のデコリレータ出力に周波数ドメインデコリレータを適用することによって、さらにデコリレーションされた値を生成する。したがって、周波数ドメインデコリレータが持つ限界を克服しながら、少ない演算量でソースマッピング情報を生成することができる。
【0061】
上記のCLD、ICC及び/又はデコリレータを用いてソースマッピング情報を生成する第10方法を、下記の[数式10]のように表現することができる。
【0062】
【数10】
【0063】
ここで、di_(m)(i=L、R、C、Ls、Rs)は、iチャンネルに適用されるデコリレータ出力値であり、この出力値を、時間ドメイン、周波数ドメイン、QMFドメイン又はハイブリッドドメインなどで処理することができる。現在のプロセスが進行中のドメインと異なるドメインで処理されたものであれば、当該出力値をドメイン変換を通じて変換することができる。また、演算量減少を目的にd_L、d_R、d_C、d_Ls、d_Rsに同じdを使用することができ、この場合に、上記[数式10]を非常に簡単に表現することができる。
【0064】
[数式10]を[数式1]に適用すると、上記[数式1]を下記の[数式11]のように表現することができる。
【0065】
【数11】
【0066】
ここで、レンダリング情報HM_Lは、入力mを用いてサラウンド信号Loを作るための空間情報とフィルター情報との組み合わせ値であり、レンダリング情報HM_Rは、入力mを用いてサラウンド信号Roを作るための空間情報とフィルター情報との組み合わせ値である。d(m)は、任意のドメインでデコリレータ出力値を現在のドメインに移した値又は現在のドメインで処理されて生成されたデコリレータ出力値である。レンダリング情報HMD_Lは、デコリレータ出力値であるd(m)がレンダリングされる時、Loに加えられる程度を表す値であり、空間情報とフィルター情報との組み合わせ値である。レンダリング情報HMD_Rは、d(m)がRoに加えられる程度を表す値である。
【0067】
上記のように、本発明は、モノダウンミックス信号へとレンダリング過程を行うために、空間情報とフィルター情報(例えば、HRTFフィルター係数)とを組み合わせて生成したレンダリング情報をダウンミックス信号及びデコリレートされたダウンミックス信号にレンダリングし、サラウンド信号を生成する方法を提案する。このレンダリング過程は、ドメインによらず行われることができる。d(m)を、周波数ドメインで実行されるd*m(積演算子)で表現することができるならば、[数式11]を、下記の[数式12]のように表現することができる。
【0068】
【数12】
【0069】
このように、周波数ドメインでダウンミックス信号にレンダリング過程を行う場合に、空間情報、フィルター情報及びデコリレータが適宜組み合わせられた値を積の形態で表現することによって、演算量を最小化することができる。
【0070】
図6及び図7は、本発明の一実施例によるステレオダウンミックス信号に対するレンダリング部の詳細ブロック図である。図6を参照すると、レンダリング部900は、第Aレンダリング部910及び第Bレンダリング部920を含む。ダウンミックス信号がステレオ信号である場合、空間情報変換部1000は、ダウンミックス信号の左及び右チャンネルに適用されるレンダリング情報を生成する。第Aレンダリング部910は、ダウンミックス信号の左チャンネルに対するレンダリング情報を、該ダウンミックス信号の左チャンネルにレンダリングし、サラウンド信号を生成する。第Bレンダリング部920は、ダウンミックス信号の右チャンネルに対するレンダリング情報を、当該ダウンミックス信号の右チャンネルにレンダリングし、サラウンド信号を生成する。これら各チャンネルの名称は例示的なもので、本発明はこれらのチャンネルの名称に制限されない。
【0071】
また、レンダリング情報は、それぞれのチャンネルから自己チャンネルに伝達されるレンダリング情報と相手側のチャンネルに伝達されるレンダリング情報を含むことができる。例えば、空間情報変換部1000は、ダウンミックス信号の左チャンネルに対するレンダリング部に入力され、自己チャンネル出力である左出力に伝達されるレンダリング情報(HL_L)と、相手側のチャンネルである右出力に伝達されるレンダリング情報(HL_R)とを生成できる。そして、空間情報変換部1000は、ダウンミックス信号の右チャンネルに対するレンダリング部に入力され、自己チャンネル出力である右出力に伝達するレンダリング情報(HR_R)と、相手側のチャンネルである左出力に伝達するレンダリング情報(HR_L)とを生成できる。
【0072】
図7を参照すると、レンダリング部900は、第1Aレンダリング部911、第2Aレンダリング部912、第1Bレンダリング部921及び第2Bレンダリング部922を含む。このレンダリング部900は、ステレオダウンミックス信号を受信し、空間情報変換部1000からレンダリング情報を受信する。その後、レンダリング部900は、受信したレンダリング情報をステレオダウンミックス信号にレンダリングし、サラウンド信号を生成する。
【0073】
より詳細には、第1Aレンダリング部911は、ダウンミックス信号の左チャンネルに対するレンダリング情報のうち、自己チャンネルに伝達されるレンダリング情報(HL_L)を用いてレンダリングを行い、第2Aレンダリング部912は、ダウンミックス信号の左チャンネルに対するレンダリング情報のうち、相手側のチャンネルに伝達されるレンダリング情報(HL_R)を用いてレンダリングを行う。また、第1Bレンダリング部921は、ダウンミックス信号の右チャンネルに対するレンダリング情報のうち、自己チャンネルに伝達されるレンダリング情報(HR_R)を用いてレンダリングを行い、第2Bレンダリング部922は、ダウンミックス信号の右チャンネルに対するレンダリング情報のうち、相手側のチャンネルに伝達されるレンダリング情報(HR_L)を用いてレンダリングを行う。以下では、相手側のチャンネルに伝達されるレンダリング情報を「クロスレンダリング情報」という。このクロスレンダリング情報HL_R及びHR_Lは、自己チャンネルに適用された後、加算器で相手側のチャンネルに加えられる。この時、場合によっては、クロスレンダリング情報HL_R及び/又はHR_Lが‘0’になりうる。クロスレンダリング情報HL_R及び/又はHR_Lが‘0’になるというのは、該当のパスに何らの寄与もしないという意味である。
【0074】
図6及び図7に示すサラウンド信号の生成方法の一例について説明すると、次の通りである。ダウンミックス信号がステレオ信号である場合、ダウンミックス信号をx、空間情報を用いて生成されたソースマッピング情報をD、プロトタイプフィルタ情報をG、マルチチャンネル信号をp、サラウンド信号をyと定義し、これを行列式にすると、下記の[数式13]のように表現することができる。
【0075】
【数13】
【0076】
ここで、各値が周波数ドメインの値であれば、下記のような形態に展開することができる。まず、マルチチャンネル信号pを、下記の[数式14]のように、空間情報を用いて生成されたソースマッピング情報Dとダウンミックス信号xとの積で表すことができる。
【0077】
【数14】
【0078】
そして、サラウンド信号yを、下記の[数式15]のように、マルチチャンネル信号pにプロトタイプフィルタ情報Gをレンダリングして生成することができる。
【0079】
【数15】
【0080】
ここで、pに[数式14]を代入すると、下記の[数式16]を生成することができる。
【0081】
【数16】
【0082】
この時、レンダリング情報HをH=GDと定義すると、サラウンド信号yとダウンミックス信号xは、下記の[数式17]のような関係を持つ。
【0083】
【数17】
【0084】
したがって、フィルター情報とソースマッピング情報間の積を処理することによってレンダリング情報Hを生成した後、ダウンミックス信号xにレンダリング情報Hを乗じ、サラウンド信号yを生成できる。
【0085】
レンダリング情報Hに関する上記定義によると、レンダリング情報Hを、下記の[数式18]のように表現することができる。
【0086】
【数18】
【0087】
図8及び9は、本発明の一実施例によるモノダウンミックス信号に対するレンダリング部の詳細ブロック図である。図8を参照すると、レンダリング部900は、第Aレンダリング部930及び第Bレンダリング部940を含む。ダウンミックス信号がモノ信号である場合、空間情報変換部1000は、モノ信号を左チャンネルにレンダリングするのに使用するレンダリング情報HM_Lとモノ信号を右チャンネルにレンダリングするのに使用するレンダリング情報HM_Rを生成する。第Aレンダリング部930は、レンダリング情報HM_Lをモノダウンミックス信号に適用して左チャンネルのサラウンド信号を生成し、第Bレンダリング部940は、レンダリング情報HM_Rをモノダウンミックス信号に適用して右チャンネルのサラウンド信号を生成する。レンダリング部900は、デコリレータが用いられない場合を取り上げるが、第Aレンダリング部930及び第Bレンダリング部940がそれぞれ、[数式12]で定義したレンダリング情報HMoverall_R及びHMoverall_Lを用いてレンダリングを行うと、デコリレータの適用された形態の出力を得ることができる。
【0088】
一方、モノダウンミックス信号への上記のレンダリング後の出力信号を、サラウンド信号ではなくステレオ信号のような形態の出力としたい場合には、次のような2通りの方法が可能である。その一つは、レンダリング部900でサラウンド効果のためのレンダリング情報を使用するのではなく、ステレオ出力時に使用する値を用いる方法である。この場合に、図3に示す構造でレンダリング情報のみを変更し、ステレオ信号を得ることができる。もう一つは、ダウンミックス信号及び空間情報を用いてマルチチャンネル信号を生成するデコーディング過程で、所望のチャンネル数を得るために該当の段階までのみ復号化を進行することによってステレオ信号を得る方法である。
【0089】
図9を参照すると、レンダリング部900は、デコリレートされた信号が一つで表現された場合、すなわち、[数式11]に対応する。このレンダリング部900は、第1Aレンダリング部931、第2Aレンダリング部932、第1Bレンダリング部941及び第2Bレンダリング部942を含む。レンダリング部900は、デコリレートされた信号に対するレンダリング部941,942を含む以外は、ステレオダウンミックス信号に対するレンダリング過程と略同様である。ステレオダウンミックス信号である場合は、2信号間デコリレーションが行われたものと解析できるので、別のデコリレータを必要とせず、上に定義したHL_L、HL_Rなどの4つのレンダリング情報を用いてレンダリング過程を行うことができる。特に、第1Aレンダリング部931は、レンダリング情報HM_Lをモノダウンミックス信号に適用し、自己チャンネルに伝達される信号を生成し、第2Aレンダリング部932は、レンダリング情報HM_Rをモノダウンミックス信号に適用し、相手側のチャンネルに伝達される信号を生成する。また、第1Bレンダリング部941は、レンダリング情報HMD_Rをデコリレートされた信号に適用し、自己チャンネルに伝達される信号を生成し、第2Bレンダリング部942は、レンダリング情報HMD_Lをデコリレートされた信号に適用し、相手側のチャンネルに伝達される信号を生成する。
【0090】
ダウンミックス信号がモノ信号である場合、ダウンミックス信号をxと定義し、空間情報を用いたソースチャンネル情報をDと定義し、プロトタイプフィルタ情報をGと定義し、マルチチャンネル信号をpと定義し、サラウンド信号をyと定義し、これを行列式にすると、下記の[数式19]のように表現することができる。
【0091】
【数19】
【0092】
ここで、各行列式の関係は、ダウンミックス信号がステレオ信号である場合と類似しているので、具体的な説明は省略する。
【0093】
図4及び5を参照して説明したソースマッピング情報及び/又は該ソースマッピング情報を用いて生成されたレンダリング情報は、周波数バンド別、パラメータバンド別及び/又は転送されたタイムスロット別に異なる値を持つ。この時、隣接するバンド間及び境界となるタイムスロット間においてソースマッピング情報及び/又はレンダリング情報の値に大きく差が出る場合、レンダリング過程で歪曲が発生しうる。この歪曲を防ぐためには、周波数及び/又は時間ドメインでの平滑化過程が必要である。周波数ドメインでの平滑化及び/又は時間ドメインでの平滑化の他に、レンダリングに適合する他の平滑化方法を用いることができる。また、ソースマッピング情報及び/又はレンダリング情報のそれぞれに特定ゲインを生じた値を用いることができる。
【0094】
図10及び図11は、本発明の一実施例による平滑化部及び拡張部が適用される位置を示すブロック図である。図10及び図11に示すように、本発明による平滑化方法を、レンダリング情報及び/又はソースマッピング情報に適用することができるが、他の形態の情報にも適用することができる。以下では、周波数ドメインでの平滑化について説明するが、本発明は、上記周波数ドメインでの平滑化に制限されず、時間ドメインでの平滑化も含む。
【0095】
図10及び図11を参照すると、平滑化部1042は、レンダリング情報及び/又はソースマッピング情報への平滑化を行うことができる。この平滑化が起きる位置の詳細例は、図18〜図20を参照して後ほど説明する。平滑化部1042は、平滑化されたレンダリング情報及び/又はソースマッピング情報を、パラメータバンドよりも広い範囲、例えば、フィルターバンドに拡張する拡張部1043と共に構成することができる。例えば、ソースマッピング情報は、サブレンダリング情報生成部1020でフィルター情報(例えば、HRTFフィルター係数)に乗じられるために、当該フィルター情報に対応する周波数解像度(例えば、フィルターバンド)に拡張することができる。本発明による平滑化を、前述した拡張前に行ない又は拡張と共に行うことができる。この拡張と共に使われる平滑化としては、図12〜図16に示す方法を用いることができる。
【0096】
図12は、本発明の一実施例による第1平滑化方法を説明するグラフである。この第1平滑化方法は、周波数ドメインで直接平滑化を行わず、各パラメータバンドでの空間情報と同じ大きさの値を使用する。この時、適当な平滑化関数を用いて平滑化効果を得ることができる。
【0097】
図13は、本発明の一実施例による第2平滑化方法を説明するグラフである。この第2平滑化方法は、各パラメータバンドの代表位置間を連結して平滑化効果を得る。この代表位置は、各パラメータバンドの真中央であるか、ログスケール(log scale)/バークスケール(bark scale)などに比例した中心位置、最も低い周波数値又は他の方法によりあらかじめ定められた位置になりうる。
【0098】
図14は、本発明の一実施例による第3平滑化方法を説明するグラフである。この第3平滑化方法は、各パラメータの境界を滑らかにつなぐ曲線(又は、直線)の形態で平滑化を行う。この時、第3平滑化方法は、あらかじめ定められた境界平滑化曲線又は一次以上のIIRフィルター(又は、FIRフィルター)によるローパスフィルターリングを用いることができる。
【0099】
図15は、本発明の一実施例による第4平滑化方法を説明するグラフである。この第4平滑化方法は、ランダムノイズのような信号を空間情報輪郭線に加えることによって平滑化効果を得る。ランダムノイズは、チャンネル別及び帯域別に異なる値を使用することができる。周波数ドメインでランダムノイズを加える場合、位相値はそのままとし、大きさ値のみを合算することができる。この第4平滑化方法によれば、周波数ドメインでの平滑化効果だけでなく、各チャンネル間のデコリレーション効果も得ることができる。
【0100】
図16は、本発明の一実施例による第5平滑化方法を説明するグラフである。この第5平滑化方法は、上記第2平滑化方法乃至第4平滑化方法を組み合わせて用いるものである。例えば、各パラメータバンドの代表位置を連結した後に、ランダムノイズを加え、ローパスフィルターリングを適用することができる。この時、順序を変えることができる。この第5平滑化方法によれば、周波数ドメインでの不連続点は最小化し、チャンネル間のデコリレーション効果は向上するという結果を得ることができる。上記第1平滑化方法乃至第5平滑化方法において、各チャンネル別各周波数ドメインにおける空間情報(例えば、CLD)値に対するパワー(power)の和は定数と一定になる必要がある。このためには、各チャンネル別に上記平滑化方法を行った後、パワー正規化(power normalization)過程を行う必要がある。例えば、ダウンミックス信号がモノ信号である場合、各チャンネルのレベル値は、下記の[数式20]の関係を満足しなければならない。
【0101】
【数20】
【0102】
ここで、pb=0〜全体パラメータバンド数−1であり、Cは任意の定数である。
【0103】
図17は、各チャンネル別プロトタイプフィルタ情報を説明するための図である。レンダリングのために、左チャンネルソースに対してGL_Lフィルターを通過した信号は左出力に送られ、GL_Rフィルターを通過した信号は右出力に送られる。その後、左最終出力(例えば、Lo)及び右最終出力(例えば、Ro)は、各チャンネルから受信した信号を全部合わせて生成される。特に、レンダリングされた左/右チャンネル出力を、下記の[数式21]のように表現することができる。
【0104】
【数21】
【0105】
本発明では、空間情報を用いてダウンミックス信号をマルチチャンネル信号に復号化して生成されたL、R、C、Ls、Rsを用いて、レンダリングされた左/右チャンネル出力を生成し、空間情報及びフィルター情報を用いて生成されたレンダリング情報を用いて、L、R、C、Ls、Rsを生成することなくレンダリングされた左/右チャンネル出力を生成することができる。空間情報を用いたレンダリング情報の生成過程について、図18〜図20を参照して説明する。
【0106】
図18は、本発明の一実施例による空間情報変換部900でレンダリング情報を生成する第1方法を示すブロック図である。前述のように、空間情報変換部900は、ソースマッピング部1010、サブレンダリング情報生成部1020、統合部1030、プロセシング部1040及びドメイン変換部1050を含む。空間情報変換部900は、図3に示すものと同一である。ここで、サブレンダリング情報生成部1020は、一つ以上のサブレンダリング情報生成部(第1サブレンダリング情報生成部、第2サブレンダリング情報生成部、…、第Nサブレンダリング情報生成部)を含む。
【0107】
サブレンダリング情報生成部1020は、空間情報を用いて生成されたソースマッピング情報及びフィルター情報を用いてサブレンダリング情報を生成する。例えば、ダウンミックス信号がモノ信号である場合、第1サブレンダリング情報生成部は、マルチチャンネル上の左チャンネルに対応するサブレンダリング情報を生成できる。このサブレンダリング情報を、ソースマッピング情報D_L及び変形されたフィルター情報GL_L’及びGL_R’を用いて下記の[数式22]のように表現することができる。
【0108】
【数22】
【0109】
ここで、D_Lは、ソースマッピング部1010で空間情報を用いて生成された値である。ただし、D_Lを生成する過程は、ツリー構造によって異なることができる。第2サブレンダリング情報生成部は、マルチチャンネル上の右チャンネルに対応するサブレンダリング情報FR_L及びFR_Rを生成でき、第Nサブレンダリング情報生成部は、マルチチャンネル上の右サラウンドチャンネルに対応するサブレンダリング情報FRs_L及びFRs_Rを生成することができる。
【0110】
ダウンミックス信号がステレオ信号である場合、第1サブレンダリング情報生成部は、マルチチャンネル上の左チャンネルに対応するサブレンダリング情報を生成できる。このサブレンダリング情報は、ソースマッピング情報D_L1、D_L2を用いて下記の[数式23]のように表現することができる。
【0111】
【数23】
【0112】
ここで、FL_R1を取り上げて[数式23]を説明すると、FL_R1で、Lはマルチチャンネルの位置を表し、Rはサラウンド信号の出力チャンネルを表し、1はダウンミックス信号のチャンネルを表す。すなわち、FL_R1は、ダウンミックス信号の左チャンネルからサラウンド信号の右出力チャンネルを生成するのに用いられるサブレンダリング情報を表す。D_L1、D_L2は、ソースマッピング部1010で空間情報を用いて生成された値である。ダウンミックス信号がステレオ信号である場合、ダウンミックス信号がモノ信号である場合と同じ方法で1つ以上のサブレンダリング情報生成部で複数のサブレンダリング情報を生成することができる。複数のサブレンダリング情報生成部が生成するサブレンダリング情報の種類は例示的なもので、これらのサブレンダリング情報の種類に本発明が制限されることはない。
【0113】
サブレンダリング情報生成部1020で生成されたサブレンダリング情報は、統合部1030、処理部1040及びドメイン変換部1050を経てレンダリング部900に転送される。統合部1030は、チャンネル別に生成されたサブレンダリング情報を統合して、レンダリング過程のためのレンダリング情報(例えば、HL_L、HL_R、HR_L、HR_R)にする。この統合部1030での統合過程を、ダウンミックス信号がモノ信号である場合とステレオ信号である場合とに分けて説明すると、次の通りである。ダウンミックス信号がモノ信号である場合、レンダリング情報を、下記の[数式24]のように表現することができる。
【0114】
【数24】
【0115】
ダウンミックス信号がステレオ信号である場合、レンダリング情報を、下記の[数式25]のように表現することができる。
【0116】
【数25】
【0117】
その後、プロセシング部1040は、補間部1041及び/又は平滑化部1042を含み、当該レンダリング情報に補間及び平滑化を行うことができる。この補間及び平滑化を、時間ドメイン、周波数ドメイン又はQMFドメインで行うことができる。本明細書は、時間ドメインを挙げて記述しているが、この時間ドメインに本発明が限定されることはない。
【0118】
補間は、転送されたレンダリング情報が時間ドメインで広い間隔を有する場合、これらレンダリング情報間に存在しないレンダリング情報を得るために行われる。例えば、n番目のタイムスロットとn+k番目のタイムスロットでレンダリング情報が存在するとする時(k>1)、生成されたレンダリング情報(例えば、HL_L、HR_L、HL_R、HR_R)を用いて、転送されなかったタイムスロット上で線形補間を行うことができる。補間によって生成されたレンダリング情報は、ダウンミックス信号がモノ信号である場合とステレオ信号である場合とに分けて説明すると、次の通りである。ダウンミックス信号がモノ信号である場合、補間されたレンダリング情報を、下記の[数式26]のように表現することができる。
【0119】
【数26】
【0120】
ダウンミックス信号がステレオ信号である場合、補間されたレンダリング情報を、下記の[数式27]のように表現することができる。
【0121】
【数27】
【0122】
ここで、0<j<kであり、j、kはそれぞれ整数であり、aは0<a<1の実数でであり、下記の[数式28]のように表現することができる。
【0123】
【数28】
【0124】
上記[数式27]又は[数式28]によって2つのタイムスロットにおける値を直線で連結した線上で、転送されなかったタイムスロットに対応する値を得ることができる。補間についての詳細は、図22及び図23を参照して後述する。
【0125】
時間ドメインにおいて隣接するタイムスロット間でフィルター係数値が急に変化する場合、平滑化部1042は、不連続点が発生して歪曲を招くという問題を防ぐために平滑化を行う。時間ドメイン上の平滑化を、図12〜図16を参照して記述した平滑化方法によって行うことができる。また、この平滑化を拡張とともに行うことができ、適用される位置によって平滑化方法を異ならせることができる。ダウンミックス信号がモノ信号である場合、時間ドメイン平滑化を、下記の[数式29]のように表現することができる。
【0126】
【数29】
【0127】
すなわち、以前のタイムスロット(n−1)で平滑化処理されたレンダリング情報HM_L(n−1)'又はHM_R(n−1)'に(1−b)を乗じ、現在タイムスロット(n)で生成されたレンダリング情報HM_L(n)又はHM_R(n)にbを乗じ、これらを合算することによって、1−pole IIRフィルター形態の平滑化を行うことができる。ここで、bは、0<b<1の定数値であり、b値が小さいほど平滑化効果が大きくなり、b値が大きいほど平滑化効果は小さくなる。また、残りのフィルターも同じ方法で適用することができる。
【0128】
上記時間ドメイン平滑化に対する[数式29]を用いることによって、下記の[数式30]のように表現されるように補間及び平滑化を一つの式にすることができる。
【0129】
【数30】
【0130】
補間部1041及び/又は平滑化部1042で補間及び/又は平滑化を行うと、プロトタイプレンダリング情報が持つエネルギーと異なるエネルギー値を持つレンダリング情報を得ることができる。このような問題を防止するためのエネルギー正規化をさらに行うことができる。
【0131】
ドメイン変換部1050は、レンダリングを行うためのドメインに対してレンダリング情報のドメイン変換を行う。レンダリングを行うためのドメインとレンダリング情報の適用ドメインとが同じ場合には、ドメイン変換を行わなくて良い。その後、ドメイン変換されたレンダリング情報は、レンダリング部900に転送される。
【0132】
図19は、本発明の一実施例による空間情報変換部でレンダリング情報を生成する第2方法を示すブロック図である。この第2方法は、空間情報変換部1000が、ソースマッピング部1010、サブレンダリング情報生成部1020、統合部1030、処理部1040及びドメイン変換部1050を含み、サブレンダリング情報生成部1020は、一つ以上のサブレンダリング情報生成部を含むという点で、レンダリング情報を生成する上記第1方法と類似している。
【0133】
図19を参照すると、レンダリング情報を生成する第2方法とレンダリング情報を生成する第1方法との差異は、処理部1040の位置にある。したがって、サブレンダリング情報生成部1020で各チャンネル別に生成されたサブレンダリング情報(例えば、モノ信号である場合はFL_L、FL_R、ステレオ信号である場合はFL_L1、FL_L2、FL_R1、FL_R2)に対してチャンネル別に補間及び/又は平滑化を行うことができる。その後、併合部1030は、補間及び/又は平滑化の行われたサブレンダリング情報を併合し、レンダリング情報を生成する。生成されたレンダリング情報は、ドメイン変換部1050を経てレンダリング部900に転送される。
【0134】
図20は、本発明の一実施例による空間情報変換部1000でレンダリング情報を生成する第3方法を示すブロック図である。この第3方法は、空間情報変換部1000が、ソースマッピング部1010、サブレンダリング情報生成部1020、併合部1030、処理部1040及びドメイン変換部1050を含み、サブレンダリング情報生成部1020は、一つ以上のサブレンダリング情報生成部を含むという点で、レンダリング情報を生成する上記第1方法及び第2方法と似ている。
【0135】
図20を参照すると、レンダリング情報を生成する第3方法とレンダリング情報を生成する第1方法及び第2方法との差異は、プロセシング部1040がソースマッピング部1010の次に位置するということにある。したがって、ソースマッピング部1010で空間情報を用いて生成されたソースマッピング情報を、それぞれのチャンネル別に補間及び/又は平滑化が行うことができる。その後、サブレンダリング情報生成部1020は、補間及び/又は平滑化されたソースマッピング情報及びフィルター情報を用いてサブレンダリング情報を生成する。これらサブレンダリング情報は、併合部1030で併合されてレンダリング情報となり、ドメイン変換部1050を経てレンダリング部900に転送される。
【0136】
図21は、本発明の一実施例によるレンダリング過程で行われるレンダリング情報処理方法を示す。図21は、DFTドメインでレンダリング過程を行う場合を示すが、他のドメインでも類似な方法で具現されることができる。また、図21は、入力信号がモノダウンミックス信号である場合を示すが、ステレオダウンミックス信号などの他の入力チャンネルにも同じ方法で適用可能である。
【0137】
図21を参照すると、時間ドメインのモノダウンミックス信号は、ドメイン変換部でオーバーラップ区間OLを持つウィンドイングをまず行う。図21は、50%オーバーラップを使用した場合を示すが、本発明は他のオーバーラップを使用した場合も含む。このウィンドイングを行う窓関数は、時間ドメインで不連続が発生せずにシームレス連結されながら、DFTドメインの周波数選択性に優れた関数を用いることができる。例えば、窓関数としてサイン二乗窓関数を使用することができる。その後、ウィンドイングによって得られた長さOL*2のモノダウンミックス信号は、ドメイン変換部で変換されたレンダリング情報HL_L'を用いるレンダリングフィルターのタブ長さだけ(正確にはタブ長さ−1)のゼロパッディングZLをした後、DFTドメインへとドメイン変換を行う。図20は、kブロックダウンミックス信号がDFTドメインへとドメイン変換されたものを示す。
【0138】
ドメイン変換されたダウンミックス信号は、レンダリング部でレンダリング情報を用いるレンダリングフィルターによりレンダリングされる。このレンダリング過程を、周波数ドメインでダウンミックス信号とレンダリング情報との積で表現することができる。レンダリングされたダウンミックス信号は、逆ドメイン変換部でIDFT(離散逆フーリエ変換)を行った後、以前に長さOLの遅延で実行されたダウンミックス信号(図20で、k−1ブロック)にオーバーラップし、サラウンド信号を生成する。このようなレンダリング過程が行われる各ブロックで補間を行うことができるが、以下、この補間方法について説明する。
【0139】
図22は、本発明の一実施例による第1補間方法を示す。本発明による補間を、様々な位置で行うことができる。例えば、図18〜図20に示す空間情報変換部内の様々な位置で行うことができ、レンダリング部でも行うことができる。補間される値は、空間情報、ソースマッピング情報、レンダリング情報、フィルター情報などになりうる。本明細書では、空間情報を基準に説明されるが、この空間情報に本発明が限定されるわけではない。また、補間を、より広いバンドに拡張された後又はより広いバンドに拡張されるのと共に行うことができる。
【0140】
図22を参照すると、符号化装置から転送される空間情報を、タイムスロットごとに転送するのではなく、任意の位置で転送することができる。一つの空間フレームには複数の空間情報セット(例えば、図22のパラメータセットn、n+1)を転送することができ、ビットレートが低い場合には、一つの空間フレームに一つの新しい空間情報セットを転送することができる。したがって、転送されないタイムスロットに対しては隣接する転送された空間情報セットの値を用いて補間を行う。レンダリングを行うウィンド間の間隔はタイムスロットと常に一致するのではないので、図22のようにレンダリング窓(K−1、K、K+1、K+2等)の中央における補間値を探し、この値を用いることができる。図22は、空間情報セットが存在するタイムスロット間を線形補間する場合を示すが、この補間方法に本発明が限定されことはない。例えば、空間情報セットが存在しないタイムスロットは、補間をせず、以前の値を使用し又はあらかじめ定められた値を使用することができる。
【0141】
図23は、本発明の一実施例による第2補間方法を示す。図23を参照すると、第2補間方法は、以前の値を使用する区間、あらかじめ定められたデフォルト値を使用する区間などを組み合わせた形態である。例えば、一つの空間フレームの一定区間で以前の値を維持する方法、あらかじめ定められたデフォルト値を使用する方法及び線形補間を行う方法のうち少なくとも一つを使用し、補間を行うことができる。一つの窓に二つ以上の新しい空間情報セットが存在する場合には歪曲が生じうるが、この歪曲を防止するためのブロックスイッチングについて以下に説明する。
【0142】
図24は、本発明の一実施例によるブロックスイッチングを示す図である。図24の(a)に示すように、窓長さがタイムスロットの長さよりも大きいので、一つの窓区間に二つ以上の空間情報セット(例えば、図24のパラメータセットn、n+1)が存在する場合がありうる。この場合に、それぞれの空間情報セットを、それぞれ異なるタイムスロットに適用する必要があり、二つ以上の空間情報セットを補間した一つの値が適用されると、歪曲の発生につながることがある。すなわち、窓長さによる時間解像度不足による歪曲が発生することがある。
【0143】
この問題を解決するために、窓の大きさをタイムスロットの解像度に合うように可変にする切替方法を使用することができる。例えば、図24の(b)に示すように、高い解像度が要求される区間では、より短い長さの窓を使用するように切り替えることができる。この時、切り替えられた窓の時間ドメインで継ぎ目が生じないように、切り替えられる部分の開始部及び終了部には連結形態の窓を使用する。この窓長さを、別の付加情報として転送するのではなく、復号化装置で空間情報を用いて決定することができる。例えば、空間情報が更新されるタイムスロットの間隔を用いて窓長さを決定することができる。すなわち、前記空間情報の更新される間隔が狭いと、短い長さの窓関数を用い、空間情報の更新される間隔が広いと、長い長さの窓関数を用いることができる。この場合、レンダリング時に可変窓を使用することによって、窓長さ情報を別途に送るのに必要なビットを使用しなくて済むという長所がある。また、図24の(b)に示すように、窓長さは単に2種類のみ使用するのではなく、空間情報の転送頻度及び関係によって様々な長さの窓を使用することができる。決定された窓長さ情報は、サラウンド信号を生成する様々な段階に適用されることができるが、この窓長さ情報が適用される段階について以下に説明する。
【0144】
図25は、本発明の一実施例による窓長さ決定部で決定された窓長さが適用される位置を示すブロック図である。図25を参照すると、窓長さ決め部1400は、空間情報を用いて窓長さを決定することができる。決定された窓長さに関する情報は、ソースマッピング部1010、統合部1030、処理部1040、ドメイン変換部1050、1100、逆ドメイン変換部1300に適用されることができる。図25は、ステレオダウンミックス信号が用いられる場合を示すが、このステレオダウンミックス信号に本発明が制限されることはない。上記のように、窓の長さを短くするとしても、フィルターのタブ数によって決定されるゼロパッディングの長さは調節されないという問題点がある。以下、この問題点の解決方法について説明する。
【0145】
図26は、本発明の一実施例による様々な長さを持つフィルター処理方法を示す図である。前述のように、フィルターのタブ数によって決定されるゼロパッディングの長さが調節されない場合、実際に該当の長さだけの重複が発生し、依然として時間解像度が不足するという問題点が生じうる。この問題点の解決方法は、短い長さの窓を使用する場合、フィルタータブの長さを制限し、ゼロパッディングの長さを短くすることである。このゼロパッディングの長さを短くする方法は、フィルター応答の後部分(例えば、残響に対応する拡散区間)を切り捨てることによって実現可能である。この場合、たとえフィルター応答の後部分を切り捨てない場合に比べて不正確なレンダリング過程となるが、時間ドメインでのフィルター係数値は非常に小さな値で、主として残響に影響を与えるから、省略しても音質に大きな差はない。
【0146】
図26を参照すると、4種類のフィルターが用いられることができる。4種類のフィルターを、DFTドメインで用いることができるが、本発明が、DFTドメインで用いられるフィルターに限定されるわけではない。N1フィルターは、長いフィルター長(FL)及びフィルタータブ数を制限しない長いゼロパッディングの長さ(2*OL)を持つフィルターを表す。N2フィルターは、N1フィルターとフィルター長(FL)は同一であるが、フィルターのタブ数を制限し、ゼロパッディングの長さ(2*OL')が短いフィルターを表す。N3フィルターは、N1フィルターに比べてフィルター長(FL')は短いが、フィルターのタブ数を制限せず、ゼロパッディングの長さ(2*OL)は長いフィルターを表す。N4フィルターは、N1フィルターと比べてウィンド長(FL')も短く、フィルターのタブ数を制限してゼロパッディングの長さ(2*OL')も短いフィルターを表す。本発明は、上記例示された4種類のフィルターを用いて時間解像度問題を解決することができる。また、フィルター応答の後部分に対して、ドメイン別に異なるフィルター係数を用いることができる。
【0147】
図27は、本発明の一実施例による複数個のサブフィルターでオーディオ信号を処理する方法を示す。一つのフィルターを、異なるフィルター係数を持つサブフィルターに分離することができる。サブフィルターを用いてオーディオ信号を処理した後、処理結果を加える方法が用いられることができる。エネルギーの小さいフィルター応答の後部分に空間情報を適用する場合、すなわち、長いフィルタータブを持つレンダリングをする場合、定められた長さ単位にオーディオ信号を分割して処理する機能を提供する。例えば、フィルター応答の後部分は、各チャンネルに対応するHRTF別に大きく変化しない部分であるので、複数の窓に対する共通の係数を抽出してレンダリングすることができる。本明細書では、DFTドメインで実施される場合について説明するが、本発明はDFTドメインに限定されない。
【0148】
図27を参照すると、一つのフィルター(FL)を複数個のサブ領域に分離した後、それぞれのサブ領域を、異なるフィルター係数を持つ複数個のサブフィルター(フィルターA及びフィルターB)で処理することができる。その後、フィルターAで処理された出力及びフィルターBで処理された出力を互いに結合する。例えば、フィルターAで処理された出力及びフィルターBで処理された出力のそれぞれに対してIDFT(離散逆フーリエ変換)をし、時間ドメインの信号を生成した後、それぞれの信号は互いに加えられる。この時、フィルターBにより処理された出力は、フィルターAにより処理された出力に比べてFL'だけ時間遅延された位置に加えられる。このように複数のサブフィルターで処理された信号は、一つのフィルターで処理される場合と同じ効果を得ることができる。また、本発明は、フィルターBで処理された出力を別途にダウンミックス信号にレンダリングする方法を含む。この時、空間情報から抽出された係数などを用いたり、空間情報を部分的に用いたり、又は、空間情報を用いず、直接ダウンミックス信号に対する出力にレンダリングすることができる。
【0149】
上記方法は、フィルターのタブ数(長さ)が長い場合にこれを分割して適用でき、エネルギーの小さい後部分は、空間情報を用いた変換を行うことなく適用できるという特徴を持つ。この時、空間情報を用いた変換を行わない場合、処理された窓ごとに異なるフィルターを適用するのではないので、ブロックスイッチングのような手法を適用しなくてもよい。図26では、2個のドメインに分割する場合を示すが、本発明はこれに限定されず、複数個の領域に分割しても良い。
【0150】
図28は、本発明の一実施例による複数個のサブフィルターを用いてフィルター係数をモノダウンミックス信号に分割レンダリングする方法を示す。図28は、一つのレンダリング係数に関連する。この方法を、レンダリング係数別に行う。図28を参照すると、図27のフィルターA情報が第1分割レンダリング情報HM_L_Aに該当し、図27のフィルターB情報が第2分割レンダリング情報HM_L_Bに該当する。図28は、二つのサブフィルターに分割して行われる実施例を示すが、二つのサブフィルターに本発明が限定されるわけではない。二つのサブフィルターは、空間情報変換部1000で生成されたレンダリング情報HM_Lを用い、二つのサブフィルターを、分配器1500を介して得ることができる。二つのサブフィルターを、プロトタイプHRTF情報又は使用者の選択によって決定された情報を用いて得ることができる。使用者の選択によって決定された情報は、例えば、使用者の好みによって選択された空間情報になりうる。ここで、HM_L_Aは、受信した空間情報に基づいたレンダリング情報であり、HM_L_Bを、信号に共通して適用される空間感を与えるためのレンダリング情報と見なすことができる。
【0151】
前述のように、複数個のサブフィルターでの処理は、DFTドメインの他に時間及びQMFドメインでも適用されることができる。すなわち、フィルターAとフィルターBに分離された係数値がそれぞれ、時間又はQMFドメインレンダリングを通じてダウンミックス信号に適用された後に加えられて、最終信号を生成することができる。レンダリング部900は、第1分割レンダリング部950及び第2分割レンダリング部960を含み、第1分割レンダリング部950はHM_L_Aを用いてレンダリング過程を行い、第2分割レンダリング部960はHM_L_Bを用いてレンダリング過程を行う。
【0152】
図27のように、フィルターA及びフィルターBが時間的に従った同一フィルターの分割である場合、当該時間間隔に対応する適切な遅延を反映することができる。図28は、モノダウンミックス信号である場合を取り上げているが、モノダウンミックス信号であり且つデコリレータ使用する場合、フィルターBに該当する部分はデコリレータに適用せず、直接モノダウンミックス信号にのみ適用することも可能である。
【0153】
図29は、本発明の一実施例による複数個のサブフィルターを用いてフィルター係数をステレオ信号に分割レンダリングする方法のブロック図である。図29に示す分割レンダリング過程は、二つのサブフィルターを、空間情報変換部1000で生成されたレンダリング情報、プロトタイプHRTFフィルター情報又は使用者決定情報を用いて分配器1500を介して得ることができるという点で、図28と似ている。ただし、図28と違い、フィルターBに対応する分割レンダリング過程がL/R信号に共通して適用される。すなわち、分配器1500でフィルターA情報に該当する第1分割レンダリング情報、第2分割レンダリング情報及びフィルターB情報に該当する第3分割レンダリング情報が生成される。この時、第3分割レンダリング情報を、L/R信号に共通して適用されうるフィルター情報又は空間情報を用いて生成することができる。図29を参照すると、レンダリング部900は、第1分割レンダリング部970、第2分割レンダリング部980及び第3分割レンダリング部990を含む。第3分割レンダリング情報は、第3分割レンダリング部990でL/R信号の和信号に適用されて一つの出力信号を生成する。その後、第1分割レンダリング部970及び第2分割レンダリング部980で、フィルターA1及びA2によりそれぞれ独立してレンダリングされたL/R出力信号に加えられ、サラウンド信号を生成する。この時、第3分割レンダリング部990の出力信号を、適切な遅延後に加えることができる。図29では便宜上、L/R入力から相手側のチャンネルに適用されるクロスレンダリング情報の表現を省略した。
【0154】
図30は、本発明の一実施例によるダウンミックス信号の第1ドメイン変換方法のブロック図である。以上ではDFTドメインで行われるレンダリング過程について説明した。前述のように、レンダリング過程を、DFTドメインだけでなく、他のドメインでも行うことができるが、図30は、DFTドメインで行われるレンダリング過程を示す。ドメイン変換部1100は、QMF及びDFTフィルターを含み、逆ドメイン変換部1300は、IDFT及びIQMFフィルターを含む。図30は、モノダウンミックス信号に対して示すが、本発明はこれに制限されない。
【0155】
図30を参照すると、Pサンプルの時間ドメインダウンミックス信号がQMFフィルターを通過すると、P個のサブバンドサンプルが生成される。バンド別に再びW個のサンプルを集めてウィンドイングを行った後、ゼロパッディングしてM−ポイントDFT(FFT)を行う。この時のDFTは、前述した形態のウィンドイングによる処理が可能である。M−ポイントDFTを介して得られるバンド別M/2個の周波数ドメイン値を再びPバンドに連結した値は、M/2*P−ポイントDFTを介して得た周波数スペクトルの近似値と見ることができる。したがって、M/2*P−ポイントDFTドメインで表現されたフィルター係数を周波数スペクトルに乗じると、前述のDFTドメインにおけるレンダリング過程と同じ効果が得られる。
【0156】
この時、QMFフィルターを通過した信号は、隣接するバンド間に漏洩(leakage)、例えば、エイリアシングを有する。すなわち、現在のバンドに隣接するバンドに該当する値がしみ込んでおり、現在のバンドに存在する値の一部は隣接するバンドを超えている状態が存在する。この状態でQMF統合を行うとQMFの特性によって元の信号が復元されるが、本発明のように、該当バンドの信号にフィルターリングなどの処理を行うと、漏洩の影響で信号に歪曲が発生する。このような問題を最小化するために、ドメイン変換部1100でQMF後に各バンド別DFTを行う前に、最小漏洩バタフライBを通過させ、逆ドメイン変換部1300でIDFT後にその逆過程Cを行い、元の信号を復元する処理をすることができる。
【0157】
一方、空間情報変換部1000で生成されるレンダリング情報の生成過程をダウンミックス信号の生成過程と一致させるために、はじめからM/2*P−ポイントDFTを行うのではなく、プロトタイプフィルタ情報に対するQMF通過信号をDFTして処理する方法も可能である。この場合には、QMFフィルターによる遅延及びデータ広がりが存在しうる。
【0158】
図31は、本発明の一実施例によるダウンミックス信号の第2ドメイン変換を示すブロック図である。図31は、QMFドメインで行われるレンダリング過程を示す。ドメイン変換部1100はQMFドメイン変換部を含み、逆ドメイン変換部1300はIQMFを含む。図31は、ドメイン変換部がQMFフィルターである以外は、処理構造がDFTのみを用いる場合と同一である。以下、QMFは、同じ帯域幅を持つQMF及びハイブリッドQMFを含むQMFとする。DFTのみを利用する場合との差異は、レンダラーM3012で行われるレンダリング過程がQMFドメインで実施されるので、レンダリング情報の生成もQMFドメインで行われ、レンダリング過程がDFTドメインでのように積で表現されず、畳み込みで表現されるという点である。
【0159】
QMFフィルターがB個のバンドを持つとすれば、フィルター係数を、B個のバンドに対してそれぞれ異なる特性(異なる係数値)を持つフィルター係数の集合で表現することができる。場合によって、フィルターのタブ数が1次になる場合(すなわち、定数が乗じられる場合)、B個周波数スペクトルを持つDFTドメインでのレンダリング過程と演算処理が一致する。下記の[数式31]は、HM_Lレンダリング情報を用いてレンダリング過程が行われる一つの経路に対し、一つのQMFバンド(b)で行われるレンダリング過程を表す。
【0160】
【数31】
【0161】
ここで、kは、QMFバンドでの時間順序、すなわち、タイムスロット単位を意味する。このQMFドメインで行われるレンダリング過程は、実際転送された空間情報がQMFドメインで適用可能な値である場合、該当のデータを最も適用しやすく、適用過程における歪曲を最小化できるという利点を有する。ただし、プロトタイプフィルタ情報(例えば、プロトタイプHRTFフィルター係数)の変換過程でQMFドメインに変換した時、変換された値を適用する過程が多い演算量を必要とする。この場合に、フィルター情報の変換過程でHRTF係数をパラメータ化する方法を通じて演算量を最小化することができる。
【0162】
以上では具体的な実施例に挙げて本発明を説明してきたが、これらの実施例は、本発明を例示するためのもので、本発明の範囲を制限するためのものではない。したがって、当業者にとっては本発明の技術的思想の範囲内で様々な変形が可能であるということは明らかであり、本発明の範囲は、添付の特許請求の範囲によって解析されるべきである。
【産業上の利用可能性】
【0163】
本発明による信号処理方法及び装置は、符号化装置で提供された空間情報を用いて、マルチチャンネルを生成できない復号化装置でもHRTFフィルター情報又は使用者によるフィルター情報を用いてサラウンド信号を生成することができる。特に、本発明を、ステレオ信号のみ再生可能な多くの復号化装置に有用に用いることができる。
【図面の簡単な説明】
【0164】
【図1】本発明の一実施例によるオーディオ信号の符号化装置及び復号化装置を示すブロック図である。
【図2】本発明の一実施例によるオーディオ信号のビットストリーム構造を示す図である。
【図3】本発明の一実施例による空間情報変換部を示す詳細ブロック図である。
【図4】本発明の一実施例によるソースマッピング過程で用いられるチャンネル構成を示す図である。
【図5】本発明の一実施例によるソースマッピング過程で用いられるチャンネル構成を示す図である。
【図6】本発明の一実施例によるステレオダウンミックス信号に対するレンダリング部の詳細ブロック図である。
【図7】本発明の一実施例によるステレオダウンミックス信号に対するレンダリング部の詳細ブロック図である。
【図8】本発明の一実施例によるモノダウンミックス信号に対するレンダリング部の詳細ブロック図である。
【図9】本発明の一実施例によるモノダウンミックス信号に対するレンダリング部の詳細ブロック図である。
【図10】本発明の一実施例による平滑化部及び拡張部が適用される位置を示すブロック図である。
【図11】本発明の一実施例による平滑化部及び拡張部が適用される位置めを示すブロック図である。
【図12】本発明の一実施例による第1平滑化方法を説明するグラフである。
【図13】本発明の一実施例による第2平滑化方法を説明するグラフである。
【図14】本発明の一実施例による第3平滑化方法を説明するグラフである。
【図15】本発明の一実施例による第4平滑化方法を説明するグラフである。
【図16】本発明の一実施例による第5平滑化方法を説明するグラフである。
【図17】チャンネル別プロトタイプフィルタ情報を説明するための図である。
【図18】本発明の一実施例による空間情報変換部でレンダリングフィルター情報を生成する第1方法を示すブロック図である。
【図19】本発明の一実施例による空間情報変換部でレンダリングフィルター情報を生成する第2方法を示すブロック図である。
【図20】本発明の一実施例による空間情報変換部でレンダリングフィルター情報を生成する第3方法を示すブロック図である。
【図21】本発明の一実施例によるレンダリング部でレンダリング情報を用いてサラウンド信号を生成する方法を示す図である。
【図22】本発明の一実施例による第1補間方法を示す図である。
【図23】本発明の一実施例による第2補間方法を示す図である。
【図24】本発明の一実施例によるブロックスイッチング方法を示す図である。
【図25】本発明の一実施例による窓長さ決め部で決定された窓長さが適用される位置を示すブロック図である。
【図26】本発明の一実施例によるオーディオ信号を処理するのに用いられる様々な長さのフィルターを示す図である。
【図27】本発明の一実施例による複数個のサブフィルターでオーディオ信号を処理する方法を示す図である。
【図28】本発明の一実施例による複数個のサブフィルターを用いて生成された分割レンダリング情報をモノダウンミックス信号にレンダリングする方法を示すブロック図である。
【図29】本発明の一実施例による複数個のサブフィルターを用いて生成された分割レンダリング情報をステレオダウンミックス信号にレンダリングする方法を示すブロック図である。
【図30】本発明の一実施例によるダウンミックス信号の第1ドメイン変換方法を示すブロック図である。
【図31】本発明の一実施例によるダウンミックス信号の第2ドメイン変換方法を示すブロック図である。
【特許請求の範囲】
【請求項1】
マルチソース間の特徴を表す空間情報を用いてソース別に対応するソースマッピング情報を生成する段階と、
前記ソースマッピング情報及びサラウンド効果を与えるフィルター情報を用いてレンダリング情報を生成する段階と、
少なくとも一つの前記レンダリング情報の隣接したレンダリング情報を用いて平滑化する段階と、
を含むことを特徴とする信号処理方法。
【請求項2】
前記平滑化は、時間ドメイン又は周波数ドメインで行われることを特徴とする、請求項1に記載の信号処理方法。
【請求項3】
前記平滑化は、前記レンダリング情報にランダムノイズを加えることによってなることを特徴とする、請求項2に記載の信号処理方法。
【請求項4】
前記ランダムノイズは、前記平滑化が行われる帯域別に、前記レンダリング情報に異なる値が加えられることを特徴とする、請求項3に記載の信号処理方法。
【請求項5】
前記平滑化は、前記平滑化が行われる帯域の代表位置におけるレンダリング情報を補間することによってなることを特徴とする、請求項1に記載の信号処理方法。
【請求項6】
前記代表位置は、前記平滑化が行われる帯域の中心、最も低い位置又はログスケール/バークスケールに比例した中心位置であることを特徴とする、請求項5に記載の信号処理方法。
【請求項7】
前記平滑化は、前記レンダリング情報を連結する曲線形態で行われることを特徴とする、請求項1に記載の信号処理方法。
【請求項8】
前記平滑化は、あらかじめ定められた平滑化曲線又は一次以上のローパスフィルターを用いることによって行われることを特徴とする、請求項7に記載の信号処理方法。
【請求項9】
前記平滑化は、前記平滑化が行われる帯域の代表位置でレンダリング情報を補間し、前記レンダリング情報にランダムノイズを加えた後にローパスフィルターリングを行うことによって行われることを特徴とする、請求項1に記載の信号処理方法。
【請求項10】
前記レンダリング情報が生成された第1周波数帯域から第2周波数帯域に前記レンダリング情報を拡散する段階をさらに含むことを特徴とする、請求項1に記載の信号処理方法。
【請求項11】
前記拡散する段階は、前記第1周波数帯域のレンダリング情報と同じ値を用いて行われることを特徴とする、請求項10に記載の信号処理方法。
【請求項12】
前記平滑化に用いられるフィルターは、1次IIRフィルターであることを特徴とする、請求項1に記載の信号処理方法。
【請求項13】
前記平滑化過程が行われたレンダリング情報を、前記マルチソースをダウンミックスして生成されたダウンミックス信号に適用し、サラウンド信号を生成する段階をさらに含むことを特徴とする、請求項1に記載の信号処理方法。
【請求項14】
前記フィルター情報は、HRTFフィルター情報又は使用者の選択によって決定された値を含むことを特徴とする、請求項13に記載の信号処理方法。
【請求項15】
前記フィルター情報は、前記サラウンド信号を生成するドメインへとドメイン変換されたフィルター情報であることを特徴とする、請求項14に記載の信号処理方法。
【請求項16】
前記フィルター情報は、前記HRTFフィルター情報をパラメータに変換することによって生成されることを特徴とする、請求項15に記載の信号処理方法。
【請求項17】
マルチソース間の特徴を表す空間情報を用いてソース別に対応するソースマッピング情報を生成するソースマッピング部と、
前記ソースマッピング情報及びサラウンド効果を与えるフィルター情報を用いてレンダリング情報を生成する合成部と、
前記レンダリング情報の隣接したレンダリング情報を用いて平滑化を行う平滑化部と、
を含むことを特徴とする信号処理装置。
【請求項18】
前記平滑化が行われたレンダリング情報を、前記マルチソースをダウンミックスして生成されたダウンミックス信号に適用してサラウンド信号を生成するレンダリング部をさらに含むことを特徴とする、請求項17に記載の信号処理装置。
【請求項19】
HRTFフィルター情報又は使用者の選択によって決定された値を含むフィルター情報を、前記サラウンド信号を生成するドメインへとドメイン変換するフィルター情報変換部をさらに含むことを特徴とする、請求項18に記載の信号処理装置。
【請求項1】
マルチソース間の特徴を表す空間情報を用いてソース別に対応するソースマッピング情報を生成する段階と、
前記ソースマッピング情報及びサラウンド効果を与えるフィルター情報を用いてレンダリング情報を生成する段階と、
少なくとも一つの前記レンダリング情報の隣接したレンダリング情報を用いて平滑化する段階と、
を含むことを特徴とする信号処理方法。
【請求項2】
前記平滑化は、時間ドメイン又は周波数ドメインで行われることを特徴とする、請求項1に記載の信号処理方法。
【請求項3】
前記平滑化は、前記レンダリング情報にランダムノイズを加えることによってなることを特徴とする、請求項2に記載の信号処理方法。
【請求項4】
前記ランダムノイズは、前記平滑化が行われる帯域別に、前記レンダリング情報に異なる値が加えられることを特徴とする、請求項3に記載の信号処理方法。
【請求項5】
前記平滑化は、前記平滑化が行われる帯域の代表位置におけるレンダリング情報を補間することによってなることを特徴とする、請求項1に記載の信号処理方法。
【請求項6】
前記代表位置は、前記平滑化が行われる帯域の中心、最も低い位置又はログスケール/バークスケールに比例した中心位置であることを特徴とする、請求項5に記載の信号処理方法。
【請求項7】
前記平滑化は、前記レンダリング情報を連結する曲線形態で行われることを特徴とする、請求項1に記載の信号処理方法。
【請求項8】
前記平滑化は、あらかじめ定められた平滑化曲線又は一次以上のローパスフィルターを用いることによって行われることを特徴とする、請求項7に記載の信号処理方法。
【請求項9】
前記平滑化は、前記平滑化が行われる帯域の代表位置でレンダリング情報を補間し、前記レンダリング情報にランダムノイズを加えた後にローパスフィルターリングを行うことによって行われることを特徴とする、請求項1に記載の信号処理方法。
【請求項10】
前記レンダリング情報が生成された第1周波数帯域から第2周波数帯域に前記レンダリング情報を拡散する段階をさらに含むことを特徴とする、請求項1に記載の信号処理方法。
【請求項11】
前記拡散する段階は、前記第1周波数帯域のレンダリング情報と同じ値を用いて行われることを特徴とする、請求項10に記載の信号処理方法。
【請求項12】
前記平滑化に用いられるフィルターは、1次IIRフィルターであることを特徴とする、請求項1に記載の信号処理方法。
【請求項13】
前記平滑化過程が行われたレンダリング情報を、前記マルチソースをダウンミックスして生成されたダウンミックス信号に適用し、サラウンド信号を生成する段階をさらに含むことを特徴とする、請求項1に記載の信号処理方法。
【請求項14】
前記フィルター情報は、HRTFフィルター情報又は使用者の選択によって決定された値を含むことを特徴とする、請求項13に記載の信号処理方法。
【請求項15】
前記フィルター情報は、前記サラウンド信号を生成するドメインへとドメイン変換されたフィルター情報であることを特徴とする、請求項14に記載の信号処理方法。
【請求項16】
前記フィルター情報は、前記HRTFフィルター情報をパラメータに変換することによって生成されることを特徴とする、請求項15に記載の信号処理方法。
【請求項17】
マルチソース間の特徴を表す空間情報を用いてソース別に対応するソースマッピング情報を生成するソースマッピング部と、
前記ソースマッピング情報及びサラウンド効果を与えるフィルター情報を用いてレンダリング情報を生成する合成部と、
前記レンダリング情報の隣接したレンダリング情報を用いて平滑化を行う平滑化部と、
を含むことを特徴とする信号処理装置。
【請求項18】
前記平滑化が行われたレンダリング情報を、前記マルチソースをダウンミックスして生成されたダウンミックス信号に適用してサラウンド信号を生成するレンダリング部をさらに含むことを特徴とする、請求項17に記載の信号処理装置。
【請求項19】
HRTFフィルター情報又は使用者の選択によって決定された値を含むフィルター情報を、前記サラウンド信号を生成するドメインへとドメイン変換するフィルター情報変換部をさらに含むことを特徴とする、請求項18に記載の信号処理装置。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【図20】
【図21】
【図22】
【図23】
【図24】
【図25】
【図26】
【図27】
【図28】
【図29】
【図30】
【図31】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【図20】
【図21】
【図22】
【図23】
【図24】
【図25】
【図26】
【図27】
【図28】
【図29】
【図30】
【図31】
【公表番号】特表2009−524336(P2009−524336A)
【公表日】平成21年6月25日(2009.6.25)
【国際特許分類】
【出願番号】特願2008−551193(P2008−551193)
【出願日】平成19年1月19日(2007.1.19)
【国際出願番号】PCT/KR2007/000340
【国際公開番号】WO2007/083952
【国際公開日】平成19年7月26日(2007.7.26)
【出願人】(502032105)エルジー エレクトロニクス インコーポレイティド (2,269)
【Fターム(参考)】
【公表日】平成21年6月25日(2009.6.25)
【国際特許分類】
【出願日】平成19年1月19日(2007.1.19)
【国際出願番号】PCT/KR2007/000340
【国際公開番号】WO2007/083952
【国際公開日】平成19年7月26日(2007.7.26)
【出願人】(502032105)エルジー エレクトロニクス インコーポレイティド (2,269)
【Fターム(参考)】
[ Back to top ]