説明

多チャネル音響符号化装置およびそのプログラム

【課題】多チャネル音響方式の入力信号を行列変換した伝送信号を符号化する際に、伝送信号の各チャネル間の関連性に基づくビット割当てを行う。
【解決手段】本発明に係る多チャネル音響符号化装置1は、多チャネル音響方式の入力信号を行列変換により複数のチャネルの伝送信号に変換する行列変換部20と、前記伝送信号のチャネル毎の聴覚モデルに基づき前記チャネル毎のスケールファクタを計算する計算部32と、前記伝送信号の各チャネル間の相関係数を計算する相関計算部34と、前記相関係数が閾値以上となる前記伝送信号のチャネル群に対し、前記チャネル群のスケールファクタに基づく適用スケールファクタを選択する選択部35と、前記チャネル群の前記伝送信号に対し、前記適用スケールファクタによるビット割当てを行うビット割当部36を備える。

【発明の詳細な説明】
【技術分野】
【0001】
この発明は、多チャネル音響符号化装置およびそのプログラムに関する。
【背景技術】
【0002】
社団法人電波産業会(ARIB)では、22.2チャネル音響を伝送・符号化するために、既存のAAC(Advanced Audio Coding)符号化を用いる方式が標準化されている。AAC方式は、CD(コンパクトディスク)の品質を保ったまま1/10程度のビットレートで符号化可能な方式である(例えば、非特許文献1参照)。
【0003】
22.2チャネル音響の伝送・符号化を行う際に、伝送チャネル数を増やさずに従来の2チャネルステレオなどとの互換性を確保するためには、行列変換などの信号変換を行う必要がある。行列変換を用いた従来のAAC符号化について図3を用いて説明する。図3は、行列変換により22.2チャネル音響信号である入力信号を2チャネルの伝送信号に変換してAAC伝送する処理の概要を示す図である。まず、送信ブロックでは、22.2チャネルの入力信号が行列変換され、例えば、基本信号および補助信号の2つのチャネルを含む伝送信号に変換される。ここで、基本信号とは、22.2チャネル音響信号の主要な空間情報を表す8〜10チャネルの信号であり、補助信号とは、基本信号を補完して元の22.2チャネル音響信号を復元するための信号である。
【0004】
次に、送信ブロックにおいては、基本信号および補助信号のAAC符号化がそれぞれ独立に行われる。ここで、AAC符号化では、各伝送信号を周波数分析した後、顕著な周波数成分の検出を行い、この成分によって聞き取れなくなる(マスクされる)周波数成分の上限を表すマスキング曲線を算出し、マスキング曲線以下の周波数成分に対するビット割当てを削減するとともに、マスキング曲線以下に収まる量子化雑音を許容したビット割当てが行われる。
【0005】
送信ブロックから受信ブロックにAAC符号化された伝送信号が伝送されると、受信ブロックでは、基本信号および補助信号がそれぞれ独立にAAC復号が行われ、逆行列変換により22.2チャネル音響信号が復元される。
【先行技術文献】
【非特許文献】
【0006】
【非特許文献1】Marina Bosi, Richard E. Goldberg, "Introduction to Digital Audio Coding and Standards" Springer, 2002-12-31
【発明の概要】
【発明が解決しようとする課題】
【0007】
ここで、従来のAAC符号化では、22.2チャネル音響の入力信号をよりチャネル数の少ない伝送信号にダウンミックスして伝送する場合のように、行列変換を伴う信号の符号化に対する処理が検討されていない。
【0008】
例えば、図3に示す従来のAAC符号化では、送信ブロックにおいて、行列変換後の伝送信号の各チャネル(基本信号および補助信号)が独立して処理される。即ち、複数の多チャネル音響信号が行列変換により混在している伝送信号に対して、行列変換後のチャネル毎に、個別にマスキング曲線に基づくビット割当て処理が行われることになる。このため、行列変換後のチャネルによっては、特定の成分が残されたり削除されたりする現象が起こり、結果として、逆行列変換後に、元の多チャネル音響信号の成分を復元できなかったり、あるいは、相殺すべき成分がなくなったため雑音が発生するということが起こっていた。
【0009】
したがって、かかる点に鑑みてなされた本発明の目的は、多チャネル音響方式の入力信号を行列変換した伝送信号を符号化する際に、伝送信号の各チャネル間の関連性に基づくビット割当てを行うことが可能な、多チャネル音響符号化装置およびそのプログラムを提供することである。
【課題を解決するための手段】
【0010】
上述した諸課題を解決すべく、本発明に係る多チャネル音響符号化装置は、多チャネル音響方式の入力信号を行列変換により複数のチャネルの伝送信号に変換する行列変換部と、前記伝送信号のチャネル毎に、前記伝送信号に対するビット割当てを行う符号化部と、を備える多チャネル音響符号化装置であって、前記符号化部は、前記伝送信号のチャネル毎の聴覚モデルに基づき前記チャネル毎のスケールファクタを計算する計算部と、前記伝送信号の各チャネル間の相関係数を計算する相関計算部と、前記相関係数が閾値以上となる前記伝送信号のチャネル群に対し、前記チャネル群のスケールファクタに基づく適用スケールファクタを選択する選択部と、前記チャネル群の前記伝送信号に対し、前記適用スケールファクタによるビット割当てを行うビット割当部と、を備えることを特徴とする。
【0011】
また、前記相関計算部は、前記伝送信号の各チャネルのサブバンド毎の相関係数を計算し、前記選択部は、前記サブバンド毎に、前記相関係数に応じて前記適用スケールファクタの選択方法を変更する、ことが好ましい。
【0012】
また、前記選択部は、過去の適用スケールファクタに基づく適用スケールファクタの平滑化と、隣接周波数帯のチャネル間における適用スケールファクタの平滑化との少なくとも一方の平滑化を行うことを特徴とすることが好ましい。
【0013】
上述したように本発明の解決手段を装置として説明してきたが、本発明はこれらに実質的に相当する方法、プログラム、プログラムを記録した記憶媒体としても実現し得るものであり、本発明の範囲にはこれらも包含されるものと理解されたい。
【0014】
例えば、本発明をプログラムとして実現した発明は、コンピュータに、多チャネル音響方式の入力信号を行列変換により複数のチャネルの伝送信号に変換する手順と、前記伝送信号のチャネル毎の聴覚モデルに基づき前記チャネル毎のスケールファクタを計算する手順と、前記伝送信号の各チャネル間の相関係数を計算する手順と、前記相関係数が閾値以上となる前記伝送信号のチャネル群に対し、前記チャネル群のスケールファクタに基づく適用スケールファクタを選択する手順と、前記チャネル群の前記伝送信号に対し、前記適用スケールファクタによるビット割当てを行う手順と、を実行させるものである。
【発明の効果】
【0015】
本発明による多チャネル音響符号化装置およびそのプログラムによれば、多チャネル音響方式の入力信号を行列変換した伝送信号を符号化する際に、伝送信号の各チャネル間の関連性に基づくビット割当てを行うことが可能となる。
【図面の簡単な説明】
【0016】
【図1】本発明の一実施形態に係る多チャネル音響符号化装置の機能ブロックを示す図である。
【図2】符号化部の詳細な機能ブロックを示す図である。
【図3】多チャネルの入力信号を行列変換により2チャネルの伝送信号に変換してAAC伝送する処理の概要を示す図である。
【発明を実施するための形態】
【0017】
以降、諸図面を参照しながら、本発明の実施態様を詳細に説明する。ここで、以下の説明においては、多チャネル音響方式として、スーパーハイビジョン用の音響方式である22.2チャネル音響を例に説明を行うが、本発明は22.2チャネル音響のみに限定されるものではない点に留意されたい。
【0018】
図1は、本発明の一実施形態に係る多チャネル音響符号化装置1の機能ブロック図である。多チャネル音響符号化装置1は、音響信号入力部10と、行列変換部20と、符号化部30と、伝送部40とを備える。
【0019】
ここで、多チャネル音響符号化装置1として機能させるために、コンピュータを好適に用いることができ、そのようなコンピュータは、多チャネル音響符号化装置1の各機能を実現する処理内容を記述したプログラムを、当該コンピュータの記憶部(図示せず)に格納しておき、当該コンピュータの中央演算処理装置(CPU)によってこのプログラムを読み出して実行させることで実現することができる。
【0020】
音響信号入力部10は、入力される22.2チャネル音響信号をA/D変換し、デジタル形式の音響信号を、入力信号として行列変換部20に出力する。
【0021】
行列変換部20は、22.2チャネル音響信号である入力信号を行列変換によってよりチャネル数の少ない伝送信号にダウンミックスする。行列変換部20は、行列変換後の伝送信号を符号化部30に出力する。
【0022】
符号化部30は、伝送信号のチャネル毎に伝送信号へのビット割当てを行う。図2は、符号化部30の詳細な機能ブロックを示す図である。符号化部30は、マスキング曲線計算部31と、サブバンドスケールファクタ計算部32と、サブバンド分割部33と、チャネル間相関計算部34と、スケールファクタ選択部35と、ビット割当部36とを備える。ここで、マスキング曲線計算部31と、サブバンドスケールファクタ計算部32と、サブバンド分割部33と、ビット割当部36とは、伝送信号のチャネル毎に独立した構成とすることも可能であり、説明の便宜上、図2の各チャネルの機能ブロックには符号にチャネル番号(例えばa〜c)付して記載している。なお、図2においては、bチャネルおよびcチャネルに対応する機能ブロックを概略的に記載しているが、bチャネルおよびcチャネルに対しても、aチャネル同様に、マスキング曲線計算部31と、サブバンドスケールファクタ計算部32と、サブバンド分割部33a、ビット割当部36とを構成できる点に留意されたい。
【0023】
マスキング曲線計算部31は、伝送信号の各チャネルの聴覚モデルを計算する。ここで、各チャネルの聴覚モデルとは、「エネルギーの大きな信号の近傍周波数帯域では比較的小さいエネルギーを有する音は聞き取ることができない」という聴覚特性に基づくマスキング曲線や、「周波数毎に聞き取ることのできないエネルギーの音がある」という聴覚特性に基づく最小可聴曲線などに基づいて計算されるものである。なお、マスキング曲線や最小可聴曲線の計算は当業者にとって公知であるため、本稿において詳述は行わない。これ以降、説明の便宜上、聴覚モデルとしてマスキング曲線を用いる場合を例に説明を行うが、本発明はこれに限定されない。マスキング曲線計算部31は、計算した各チャネルのマスキング曲線をサブバンドスケールファクタ計算部32に出力する。
【0024】
サブバンドスケールファクタ計算部32は、各チャネルのマスキング曲線から、各チャネルのサブバンド毎のスケールファクタを計算する。具体的には、サブバンドスケールファクタ計算部32は、各チャネルのサブバンドの信号から、最大絶対値をもつサンプルを探し、その値を対数に変換して量子化したものをスケールファクタとして取得する。なお、サブバンド毎のスケールファクタの計算は当業者にとって公知であるため、本稿において詳述は行わない。サブバンドスケールファクタ計算部32は、計算した各チャネルのサブバンド毎のスケールファクタをスケールファクタ選択部35に出力する。
【0025】
サブバンド分割部33は、伝送信号のチャネル毎に、伝送信号をサブバンドに分割し、チャネル間相関計算部34に出力する。
【0026】
チャネル間相関計算部34は、伝送信号の各チャネル間の相関係数を計算する。特に、チャネル間相関計算部34は、サブバンド毎に、各チャネルの一定の時間区間の伝送信号の変化から、各チャネル間の相関係数を計算する。即ち、一定の時間区間における伝送信号の変化の仕方が近いチャネル間の相関係数は高く、変化の仕方が異なるチャネル間の相関係数は低く計算される。チャネル間相関計算部34は、計算した相関係数をスケールファクタ選択部35に供給する。
【0027】
スケールファクタ選択部35は、相関係数が一定値以上となるチャネル群の伝送信号に対し、当該伝送信号のサブバンド毎のスケールファクタに基づく適用スケールファクタを選択する。ここで、適用スケールファクタとは、相関係数が一定値以上となるチャネル群の伝送信号のビット割当てに用いられるスケールファクタを意味する。
【0028】
例えば、スケールファクタ選択部35は、式1のように、サブバンド毎に、チャネル群に属する各チャネルのスケールファクタの最大値を選択し、適用スケールファクタとすることができる。ここで、G(k)はk番目のサブバンドに対する適用スケールファクタを表し、F(k)は、チャネル群に属するj番目のチャネルのk番目のサブバンドのスケールファクタを表す。なお、この場合、適用スケールファクタは、チャネル群に属する各チャネルの伝送信号に対して共通となる。適用スケールファクタとして、各チャネルのスケールファクタの最大値を合成すると、量子化の粒度が最も細かくなるため、量子化精度は向上するが、量子化効率は低下する。
【0029】
【数1】

【0030】
また、スケールファクタ選択部35は、式2のように、サブバンド毎に、チャネル群に属する各チャネルのスケールファクタの最小値を選択し、適用スケールファクタとすることができる。なお、この場合も、適用スケールファクタは、チャネル群に属する各チャネルの伝送信号に対して共通となる。適用スケールファクタとして、各チャネルのスケールファクタの最小値を合成すると、量子化の粒度が最も荒くなるため、量子化精度は低下するが、量子化効率は向上する。
【0031】
【数2】

【0032】
さらに、スケールファクタ選択部35は、式3のように、チャネル間の相関係数に基づき各チャネルの適用スケールファクタを選択することができる。式3において、G(k)は、k番目のサブバンドにおけるi番目のチャネルの伝送信号に対する適用スケールファクタを表し、rij(k)はk番目のサブバンドにおけるi番目のチャネルとj番目のチャネルとの相関係数を表す。この場合、適用スケールファクタは、伝送信号のチャネル毎に異なる値となる。適用スケールファクタとして、各チャネル間の相関係数に基づき各スケールファクタを合成すると、チャネル間の量子化精度の違いを押さえながら、各チャネルに沿った量子化を行うことができ、量子化効率を向上させることができる。
【0033】
【数3】

【0034】
さらに、スケールファクタ選択部35は、サブバンド毎に、相関係数に応じて適用スケールファクタの選択方法を変更することができる。具体的には、予め閾値ThおよびTh(Th>Th)を設定し、式4に示すとおり、あるサブバンドkにおける相関係数が閾値Thより高い場合には、各チャネル間に共通の適用スケールファクタを用いるものとして、式(1)と同様に適用スケールファクタを選択し、相関係数が閾値Thより高く閾値Th以下である場合には、各チャネル間の相関度を考慮した適用スケールファクタを用いるものとして、式(3)と同様に適用スケールファクタを選択する。なお、相関係数が閾値Th未満の場合には、各チャネル間の相関は低いものとして、各チャネルのスケールファクタをそのまま各チャネルのビット割当てに用いるものとする。
【0035】
【数4】

【0036】
適用スケールファクタの選択は式(1)〜(4)に限定されず、例えば、スケールファクタ選択部35は、各チャネルのスケールファクタの平均値などを適用スケールファクタとして選択することができる。
【0037】
さらに、スケールファクタ選択部35は、過去の適用スケールファクタに基づく適用スケールファクタの平滑化や、隣接周波数帯のチャネル間における適用スケールファクタの平滑化など、スケールファクタに関する種々の平滑化を行うことができる。
【0038】
スケールファクタ選択部35は、相関係数が一定値以上となるチャネル群の伝送信号に対しては、式(1)〜(4)などにより求めた適用スケールファクタをビット割当部36に出力し、相関係数が一定値未満のチャネルに対しては、各チャネルのスケールファクタをそのままビット割当部36に出力する。
【0039】
ビット割当部36は、スケールファクタ選択部35からの適用スケールファクタ又はスケールファクタに基づき、伝送信号のチャネル毎に伝送信号へのビット割当てを行う。ビット割当部36は、符号化した伝送信号を伝送部60に出力する。
【0040】
伝送部60は、符号化部50により符号化された伝送信号を受信側に送信する。
【0041】
このように、本実施形態によれば、チャネル間相関計算部34は、伝送信号の各チャネル間の相関係数を計算し、スケールファクタ選択部35は、相関係数が閾値以上となる伝送信号のチャネル群に対し、当該チャネル群のスケールファクタに基づく適用スケールファクタを選択し、ビット割当部36は、当該チャネル群の伝送信号に対し、適用スケールファクタによるビット割当てを行う。これにより、多チャネル音響方式の入力信号を行列変換した伝送信号を符号化する際に、伝送信号の各チャネル間の関連性に基づくビット割当てを行うことが可能となる。例えば、相関係数が一定値以上となるチャネル群の伝送信号に対しては、各チャネルのスケールファクタの最小値又は最大値から、各チャネルに共通の適用スケールファクタを用いてビット割当てを行うことにより、量子化精度や量子化効率を要求に応じて調整することが可能となる。このため、量子化精度を高めた場合などは、従来問題となった逆行列変換による信号の消失や雑音の発生を低減させることができる。特に、例えば、22.2チャネル音響信号を、主要な空間情報を表す8〜10チャネルの基本信号と、元の信号を復元するための補助信号に分離して伝送し、主要な空間情報に対しては高いビットレートを割当て、補助信号に対してはビットレートを抑制するような場合に対しても、量子化雑音の少ない符号化・伝送が可能となる。また、例えば、スーパーハイビジョン用の22.2チャネル音響信号を、2チャネルステレオ信号や5.1チャネル信号として伝送する場合においても、高品質かつ1/10程度のビットレートで符号化・伝送することが可能となる。
【0042】
また、本実施形態によれば、チャネル間相関計算部34は、伝送信号の各チャネルのサブバンド毎の相関係数を計算し、スケールファクタ選択部35は、サブバンド毎に、相関係数に応じて適用スケールファクタの選択方法を変更する。これにより、相関係数の高いサブバンドに関しては共通のスケールファクタを用い、相関係数が中程度のサブバンドに関しては相関係数に基づくスケールファクタを設定できるなど、より細かい粒度で量子化精度および量子化効率を制御することが可能となる。
【0043】
また、本実施形態によれば、スケールファクタ選択部35は、過去の適用スケールファクタに基づく適用スケールファクタの平滑化や、隣接周波数帯のチャネル間における適用スケールファクタの平滑化など、スケールファクタに関する種々の平滑化を行うことができる。これにより、隣接する時間帯、周波数帯におけるスケールファクタの差異が低減され、急激なスケールファクタの変化による信号の消失や雑音の発生を低減させることができる。
【0044】
本発明を諸図面や実施例に基づき説明してきたが、当業者であれば本開示に基づき種々の変形や修正を行うことが容易であることに注意されたい。従って、これらの変形や修正は本発明の範囲に含まれることに留意されたい。例えば、各部材、各手段、各ステップなどに含まれる機能などは論理的に矛盾しないように再配置可能であり、複数の手段やステップなどを1つに組み合わせたり、或いは分割したりすることが可能である。
【0045】
例えば、上記実施形態では、多チャネル音響方式の入力信号を22.2チャネル音響、行列変換後の伝送信号を2チャネルステレオ信号として説明を行ったが、本発明は、他の5.1チャネル音響、7.1チャネル音響など任意の多チャネル音響方式であって、符号化伝送に関し信号の行列変換を伴う処理全般に適応可能なことは言うまでもない。また、行列変換などの線形処理を伴う信号として、アンビソニックス等の音響信号に対しても適用可能である。
【0046】
また、上記実施形態では、符号化方式としてAACを例に説明をしたが、本発明におけるAAC符号化とは、MPEG2−AAC、MPEG4−AAC、HE−AACなど、AACに関するあらゆるバージョンを包括するものである。また、本発明が対応可能な符号化はAACに限定されず、人間の聴覚特性に基づいて高品質に符号化する方式であれば、任意の符号化方式に対応可能である。
【産業上の利用可能性】
【0047】
本発明によれば、多チャネル音響方式の入力信号を行列変換した伝送信号を符号化する際に、伝送信号の各チャネル間の関連性に基づくビット割当てを行うことが可能となるという有用性がある。
【符号の説明】
【0048】
1 多チャネル音響符号化装置
10 音響信号入力部
20 行列変換部
30 符号化部
31 マスキング曲線計算部
32 サブバンドスケールファクタ計算部(計算部)
33 サブバンド分割部
34 チャネル間相関計算部(相関計算部)
35 スケールファクタ選択部(選択部)
36 ビット割当部
40 伝送部


【特許請求の範囲】
【請求項1】
多チャネル音響方式の入力信号を行列変換により複数のチャネルの伝送信号に変換する行列変換部と、
前記伝送信号のチャネル毎に、前記伝送信号に対するビット割当てを行う符号化部と、を備える多チャネル音響符号化装置であって、
前記符号化部は、
前記伝送信号のチャネル毎の聴覚モデルに基づき前記チャネル毎のスケールファクタを計算する計算部と、
前記伝送信号の各チャネル間の相関係数を計算する相関計算部と、
前記相関係数が閾値以上となる前記伝送信号のチャネル群に対し、前記チャネル群のスケールファクタに基づく適用スケールファクタを選択する選択部と、
前記チャネル群の前記伝送信号に対し、前記適用スケールファクタによるビット割当てを行うビット割当部と、を備えることを特徴とする多チャネル音響符号化装置。
【請求項2】
前記相関計算部は、前記伝送信号の各チャネルのサブバンド毎の相関係数を計算し、
前記選択部は、前記サブバンド毎に、前記相関係数に応じて前記適用スケールファクタの選択方法を変更する、ことを特徴とする請求項1に記載の多チャネル音響符号化装置。
【請求項3】
前記選択部は、過去の適用スケールファクタに基づく適用スケールファクタの平滑化と、隣接周波数帯のチャネル間における適用スケールファクタの平滑化との少なくとも一方の平滑化を行うことを特徴とする請求項1又は2に記載の多チャネル音響符号化装置。
【請求項4】
コンピュータに、
多チャネル音響方式の入力信号を行列変換により複数のチャネルの伝送信号に変換する手順と、
前記伝送信号のチャネル毎の聴覚モデルに基づき前記チャネル毎のスケールファクタを計算する手順と、
前記伝送信号の各チャネル間の相関係数を計算する手順と、
前記相関係数が閾値以上となる前記伝送信号のチャネル群に対し、前記チャネル群のスケールファクタに基づく適用スケールファクタを選択する手順と、
前記チャネル群の前記伝送信号に対し、前記適用スケールファクタによるビット割当てを行う手順と、を実行させるためのプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate


【公開番号】特開2013−50663(P2013−50663A)
【公開日】平成25年3月14日(2013.3.14)
【国際特許分類】
【出願番号】特願2011−189741(P2011−189741)
【出願日】平成23年8月31日(2011.8.31)
【出願人】(000004352)日本放送協会 (2,206)