説明

復号化装置

【課題】 受聴者の位置が変化した場合に、受聴位置の変化に追随しにくい。追随する場合には多大な演算が必要となる。
【解決手段】 基本符号化データとサイド情報を分離するサイド情報分離手段と、サイド情報を調整するサイド情報調整手段と、基本符号化データをサイド情報調整手段により調整されたサイド情報を用いて復号化する復号化手段とを備え、サイド情報には、基本符号化データを復号化する際の、位相情報、遅延情報、及びゲイン情報が含まれる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、オーディオ信号の復号化方法に関するものである。
【背景技術】
【0002】
従来のオーディオ信号符号化方法、および、復号化方法としては、公知なものとしてISO/IECの国際標準方式、通称MPEG方式などが挙げられる。現在、幅広い応用を持ち、低ビットレート時でも高音質な符号化方式として、ISO/IEC 13818−7、通称MPEG2 AAC(Advanced Audio Coding)などがあげられる。本方式の拡張規格も複数規格化が現在なされている。その一つとして、空間音響情報(Spatial Cue Information)もしくは、聴覚的音響情報(Binaural Cue)と呼ばれる情報を利用する技術がある。このような技術の例としては、ISO国際標準規格であるMPEG-4 Audio (ISO/IEC 14496-3)において定められたパラメトリックステレオ(Parametric Stereo)方式がある(例えば、非特許文献1参照)。また、別の方式も提案されている(例えば、特許文献1、特許文献2参照)。
【非特許文献1】ISO/IEC 14496-3:2001 AMD2 "Parametric Coding for High Quality Audio"
【特許文献1】米国公開特許US2003/0035553 "Backwards-compatible Perceptual Coding of Spatial Cues"
【特許文献2】米国公開特許US2003/0219130 "Coherence-based Audio Coding and Synthesis"
【発明の開示】
【発明が解決しようとする課題】
【0003】
従来のマルチチャンネル再生装置においては、ステレオ音源を固定的な係数をもとにマルチチャンネル化していた例が多い。そのため、受聴者の位置が変化した場合には、固定的なフィルタ係数を再計算してマルチチャンネル効果を得ていたがその効果は薄く、時々刻々と変化する微妙な受聴位置変化に対応できず、マルチチャンネル効果が得にくかった。また、マルチチャンネル効果をより最適に実現するために、マルチチャンネル出力に対して遅延演算やゲイン調整演算を行う必要があり、演算負荷が大きかった。
【0004】
本発明は、このような従来の問題点に鑑みてなされたものであって、マルチチャンネル出力信号を最適に制御できるような、復号化装置を提供することを目的とする。
【課題を解決するための手段】
【0005】
上記課題を解決するため、本願請求項1の発明は、
基本符号化データとサイド情報を分離する分離手段と、前記サイド情報を調整する調整手段と、前記基本符号化データを前記調整されたサイド情報を用いて復号化する復号化手段とを備えたことを特徴とするものである。
【0006】
また本願請求項2の発明は、本願請求項1の発明において、
前記サイド情報には、基本符号化データを復号化する際の、位相情報が含まれており、前記調整手段は、前記位相情報を調整することを特徴とするものである。
【0007】
また本願請求項3の発明は、本願請求項1又は2に記載の発明において、
前記サイド情報には、基本符号化データを復号化する際の、遅延情報が含まれており、前記調整手段は、前記遅延情報を調整することを特徴とするものである。
【0008】
また本願請求項4の発明は、本願請求項1〜3のいずれか1項に記載の発明において、
前記サイド情報には、基本符号化データを復号化する際の、ゲイン情報が含まれており、前記調整手段は、前記ゲイン情報を調整することを特徴とするものである。
【0009】
また本願請求項5の発明は、
基本符号化データとサイド情報を分離する分離手段と、前記サイド情報を調整する調整手段と、前記基本符号化データを前記調整されたサイド情報を用いて復号化する復号化手段とを備えたことを特徴とするものである。
【0010】
また本願請求項6の発明は、本願請求項5の発明において、
前記サイド情報には、基本符号化データを復号化する際の、位相情報が含まれており、前記調整手段は、前記位相情報を調整することを特徴とするものである。
【0011】
また本願請求項7の発明は、本願請求項5又は6に記載の発明において、
前記サイド情報には、基本符号化データを復号化する際の、遅延情報が含まれており、前記調整手段は、前記遅延情報を調整することを特徴とするものである。
【0012】
また本願請求項8の発明は、本願請求項5〜7のいずれか1項に記載の発明において、
前記サイド情報には、基本符号化データを復号化する際の、ゲイン情報が含まれており、前記調整手段は、前記ゲイン情報を調整することを特徴とするものである。
【発明の効果】
【0013】
前記手段を設けることで、時々刻々と変化する微妙な受聴位置変化を検出し、少ない計算量で最適かつ効果的にマルチチャンネル再生を実現することが可能となる。
【発明を実施するための最良の形態】
【0014】
以下、本発明の実施の形態を、図面を参照しながら説明する。
(実施の形態1)
図1は、本発明の基本図である。復号化装置103は基本符号化データ101とサイド情報102と受聴位置受信手段104からの出力である受聴位置105を入力とし、それらからマルチチャンネル、ここでは6チャンネル分の音声データを出力する装置である。基本符号化データはたとえば2ch分の音声データをAAC方式で圧縮したものであり、復号化処理はAAC方式に従う。AAC方式で復号化された2チャンネル分の音声データと、サイド情報102を用いて、複数の(ここではLf、Rf、C、Ls、Rs、LFE)チャンネルに再構成する装置である。サイド情報102としては、たとえば、チャンネル間の相関度や位相差、チャンネル間のゲイン差などである。
【0015】
復号化装置103は図2に示すような構成になっている。基本符号化データ101とサイド情報102が合わさったものを入力として、基本符号化データ203とサイド情報204を分離するサイド情報分離手段201と、受聴位置105と前記サイド情報分離手段201によって分離されたサイド情報204とを入力として、調整されたサイド情報205を出力とするサイド情報調整手段202と、基本データ203と調整されたサイド情報205を入力とし、マルチチャンネルの音声データを出力する復号化手段206で構成される。
【0016】
図3は、図2の復号化装置103が組み込まれた復号化機器301と、マルチチャンネルの音声データを再生する6つのスピーカの配置を表している。標準受聴位置302から受聴者が受聴位置303へと移動した場合、サイド情報調整手段202の内部では次のような処理が行われる。LfとLs、あるいはRfとRsというような前後方向のチャンネル間のゲイン差を、後ろから出力(Ls、Rs)が大きくなるように調整する。その調整割合は、標準受聴位置302と受聴位置303との距離差で比例配分した割合にする。また同時に前後のチャンネル間位相差を、前からの出力(Lf、Rf、C)が遅く出力されるように遅延させるように調整する。その調整割合は前記ゲイン差での調整と同様である。前後のチャンネルの相関度が高い場合には、位相調整はほとんど行わず、ゲイン調整を主たる処理とする。あるいは、受聴位置304にずれた場合、LfとRfあるいはLsとRsという左右方向のチャンネル間ゲイン差を、右からの出力(Rf、Rs)が大きくなるように調整する。位相差に関しても同様である。左右のチャンネルの相関度が高い場合には、位相調整はほとんど行わず、ゲイン調整を主たる処理とすることで、演算資源を節約することが出来る。
【0017】
また、図3には受聴位置発信手段305が備わっている。通常は、復号化機器301を操作するためのリモコンなどである。
図4は前記復号化機器301の基本構成である。前記受聴位置発信手段305からの受聴位置情報(角度402、距離403)を入力として受聴位置404を出力する受聴位置受信手段104と前記復号化装置103で構成されている。
【0018】
なお、図1記載の受聴位置受信手段104は、受聴位置発信手段305との組で用いられる場合もあるが、それ以外の手段、たとえば、受聴者があらかじめ受聴位置を設定した情報を入力として、受聴位置を復号化装置103に入力しても良い。
【実施例】
【0019】
本発明のより具体的な実施の形態について、
(実施例1)
図1は、本発明の基本図である。受聴者の前方の左右チャンネル信号であるLf、Rf、及び前方センターチャンネルC、受聴者の後方の左右チャンネル出力であるLs、Rs、及び超低域成分であるLFEの6ch信号を5.1ch信号と呼ぶが、それをダウンミックスして2chの信号に変換して符号化したものを基本符号化データ101と呼ぶ。5.1ch信号をダウンミックスする際に、各チャンネル間のゲイン差、位相差、相関度をサイド情報102として付加する仕組みをもつ符号化装置がある。本実施例は、前記符号化装置の出力である基本符号化データとサイド情報を復号化し、2chまたは5.1ch信号を復元することを目的とする装置である。
【0020】
復号化装置103は基本符号化データ101とサイド情報102と受聴位置受信手段104からの出力である受聴位置105を入力とし、それらからマルチチャンネル、ここでは6チャンネル分の音声データを出力する装置である。基本符号化データはたとえば2ch分の音声データをAAC方式で圧縮したものであり、復号化処理はAAC方式に従う。AAC方式で復号化された2チャンネル分の音声データと、サイド情報102を用いて、複数の(ここではLf、Rf、C、Ls、Rs、LFE)チャンネルに再構成する装置である。サイド情報102としては、たとえば、チャンネル間の相関度や位相差、チャンネル間のゲイン差などである。
【0021】
復号化装置103は図2に示すような構成になっている。基本符号化データ101とサイド情報102が合わさったものを入力として、基本符号化データ203とサイド情報204を分離するサイド情報分離手段201と、受聴位置105と前記サイド情報分離手段201によって分離されたサイド情報204とを入力として、調整されたサイド情報205を出力とするサイド情報調整手段202と、基本データ203と調整されたサイド情報205を入力とし、マルチチャンネルの音声データを出力する復号化手段206で構成される。
【0022】
図3は、図2の復号化装置103が組み込まれた復号化機器301と、マルチチャンネルの音声データを再生する6つのスピーカの配置を表している。標準受聴位置302から受聴者が受聴位置303へと移動した場合、サイド情報調整手段202の内部では次のような処理が行われる。LfとLs、あるいはRfとRsというような前後方向のチャンネル間のゲイン差を、後ろから出力(Ls、Rs)が大きくなるように調整する。その調整割合は、標準受聴位置302と受聴位置303との距離差で比例配分した割合にする。また同時に前後のチャンネル間位相差を、前からの出力(Lf、Rf、C)が遅く出力されるように遅延させるように調整する。その調整割合は前記ゲイン差での調整と同様である。前後のチャンネルの相関度が高い場合には、位相調整はほとんど行わず、ゲイン調整を主たる処理とする。あるいは、受聴位置304にずれた場合、LfとRfあるいはLsとRsという左右方向のチャンネル間ゲイン差を、右からの出力(Rf、Rs)が大きくなるように調整する。位相差に関しても同様である。左右のチャンネルの相関度が高い場合には、位相調整はほとんど行わず、ゲイン調整を主たる処理とすることで、演算資源を節約することが出来る。
【0023】
また、図3には受聴位置発信手段305が備わっている。通常は、復号化機器301を操作するためのリモコンなどである。
図4は前記復号化機器301の基本構成である。前記受聴位置発信手段305からの受聴位置情報(角度402、距離403)を入力として受聴位置404を出力する受聴位置受信手段104と前記復号化装置103で構成されている。
【0024】
なお、図1記載の受聴位置受信手段104は、受聴位置発信手段305との組で用いられる場合もあるが、それ以外の手段、たとえば、受聴者があらかじめ受聴位置を設定した情報を入力として、受聴位置を復号化装置103に入力しても良い。
【0025】
(実施例2)
図5で示す復号化装置501は、図1で示した復号化装置103と同様に基本符号化データ101とサイド情報102が混合されたものと、復号化装置501の音声データ出力チャンネル数を受信する出力数受信手段502の出力である出力数504を入力として、一つまたは複数の音声データ出力を行うものである。復号化装置501は図6に示す構成になっている。復号化装置501は、基本符号化データ101とサイド情報102の混合入力を基本符号化データ203とサイド情報204に分離するサイド情報分離手段201と、出力数504と前記サイド情報分離手段201によって分離されたサイド情報204とを入力として、出力数504に応じてサイド情報を調整するサイド情報調整手段601と、復号化手段206とを備える。実施例1記載のものとは、サイド情報調整手段601の作用が若干異なる。本実施例では、出力数504に応じて調整する。たとえば、図7に示すように、出力数504が3の場合、サイド情報204に含まれるチャンネル間位相差、チャンネル間相関値、チャンネル間ゲイン差を、たとえば次のように調整する。前後のチャンネル(LfとLs、RfとRs)間の相関値を1に限りなく近い値に設定し、前後のチャンネル間位相差を限りなく0に設定し、前後のチャンネル間ゲイン差を限りなく大きく設定することで実現する。そうすることによって、後ろ側の音声データ出力(Ls、Rs)が結果的に0に限りなく近くなり、3チャンネル再生が実現する。
【0026】
現実的には、スピーカ配置(出力数504)は2か3か6かのどれかである。2の場合は、上記の処理に加え、センターチャンネル(C)とLf、センターチャンネル(C)とRfのチャンネル間相関値を限りなく1に近い値に設定し、前記チャンネル間のチャンネル間位相差を限りなく0に設定し、前記チャンネル間のチャンネル間ゲイン差を限りなく大きくすることで実現できる。結果的に、センターチャンネルの出力を0にすることである。
【0027】
出力数受信手段502は、出力数検出手段701と組で使われる。ここでいう出力数検出手段701とはたとえば復号化機器702を遠隔操作するリモコンなどである。復号化機器702には、図5載の復号化装置501と出力数受信手段502を具備している。出力数検出手段701で検出された出力数504は無線または有線にて出力数受信手段502に送られる。出力数検出手段701の構成は図8及び図9に示す。図8は出力数検出手段701の具体的構成例である。出力数検出手段701は、出力機器801から基準信号を発しその角度及び距離を入力するための音声入力手段802と、音声入力手段802の出力を入力として出力数504を算出する出力数算出手段803で構成される。
【0028】
なお、出力数検出手段701は、図9のような構成をとることもできる。図8との大きな違いは、出力機器801からの基準信号ではなく、出力機器801の配置を画像撮影手段901で撮影して出力数504を得る点である。
【0029】
なお、出力数504は、たとえば受聴者が手動で入力しても良い。
(実施例3)
図10に示すように、復号化装置1001は、基本符号化データ101とサイド情報102が合成されたものと、制御情報1003を入力として、一つまたは複数個のチャンネルの音声データを出力するものである。制御情報1003はサイド情報102を、所望の音声データ出力を得られるように制御するための情報である。制御情報1003はサイド情報制御手段1002によって出力されるが、サイド情報制御手段1002の入力としては、たとえば、受聴位置であるとか、スピーカの数であるとか、である。制御情報1003を復号化装置1001の入力とすることで、たとえば、Cの出力をLfとRfに振り分けたい場合、従来で有れば、一端復号化装置1001で復号化してから、C出力成分を半分にし、LfとRfに足し合わせる作業が必要であった。それを行うメモリも必要であったし、出力全体に対して演算を施さねばならなかった。それに比べ、制御情報1003を入力としてサイド情報102を操作することで、サイド情報102の簡単な変更だけでCの出力をなくすことも可能である。
【0030】
たとえば、サイド情報102に含まれているRfとCのゲイン差を限りなく大きくしてRfにのみ出力するように設定することで実現できる。同様にLfとCのゲイン差も設定する。
図11は復号化装置1001の構成を示している。前記のような調整を、サイド情報調整手段1101内部で行う。サイド情報分離手段201で分離されたサイド情報204のゲイン差や位相差、相関度を変更することで、LfやRf、C、Ls、Rs、LFEの出力が自動的に変化することになり、出力段での余計な演算やメモリを必要とせず、所望の音場再生が実現可能となる。
【産業上の利用可能性】
【0031】
本発明は、空間音響符号化技術を用いた機器、たとえば家庭用AVアンプや携帯電話や小型情報機器に有用である。
将来、放送・通信・インターネットなどで空間符号化を施されたデータが流通する際にも有益であろう。
【図面の簡単な説明】
【0032】
【図1】受聴位置受信手段を説明する図である。
【図2】復号化装置を説明する図である。
【図3】復号化機器と受聴位置を説明する図である。
【図4】復号化機器を説明する図である。
【図5】出力数受信手段を説明する図である。
【図6】出力数受信手段を鑑みた復号化装置を説明する図である。
【図7】出力数が3の場合を説明する図である。
【図8】音声入力手段を具備した出力数検出手段を説明する図である。
【図9】画像入力手段を具備した出力数検出手段を説明する図である。
【図10】サイド情報制御手段と復号化装置を説明する図である。
【図11】復号化装置を説明する図である。
【符号の説明】
【0033】
101 基本符号化データ
102 サイド情報
103 復号化装置
104 受聴位置受信手段
105 受聴位置
201 サイド情報分離手段
202 サイド情報調整手段
203 基本符号化データ
204 サイド情報
205 調整後のサイド情報
206 復号化手段
301 復号化機器
302 標準受聴位置
303 前後にずれた受聴位置
304 左右にずれた受聴位置
305 受聴位置発信手段
402 角度
403 距離
404 受聴位置
501 復号化装置
502 出力数受信手段
503 復号化機器
504 出力数
601 サイド情報調整手段
602 調整後のサイド情報
701 出力数検出手段
702 復号化機器
801 出力機器
802 音声入力手段
803 出力数算出手段
901 画像入力手段
902 出力数算出手段
1001 復号化装置
1002 サイド情報制御手段
1003 制御情報
1101 サイド情報調整手段


【特許請求の範囲】
【請求項1】
基本符号化データとサイド情報を分離する分離手段と、前記サイド情報を調整する調整手段と、前記基本符号化データを前記調整されたサイド情報を用いて復号化する復号化手段とを備えたことを特徴とする復号化装置。
【請求項2】
前記サイド情報には、基本符号化データを復号化する際の、位相情報が含まれており、前記調整手段は、前記位相情報を調整することを特徴とした請求項1記載の復号化装置。
【請求項3】
前記サイド情報には、基本符号化データを復号化する際の、遅延情報が含まれており、前記調整手段は、前記遅延情報を調整することを特徴とした請求項1又は2に記載の復号化装置。
【請求項4】
前記サイド情報には、基本符号化データを復号化する際の、ゲイン情報が含まれており、前記調整手段は、前記ゲイン情報を調整することを特徴とした請求項1〜3のいずれか
項に記載の復号化装置。
【請求項5】
基本符号化データとサイド情報を分離する分離手段と、前記サイド情報を調整する調整手段と、前記基本符号化データを前記調整されたサイド情報を用いて復号化する復号化手段とを備えたことを特徴とする復号化方法。
【請求項6】
前記サイド情報には、基本符号化データを復号化する際の、位相情報が含まれており、前記調整手段は、前記位相情報を調整することを特徴とした請求項5記載の復号化装置。
【請求項7】
前記サイド情報には、基本符号化データを復号化する際の、遅延情報が含まれており、前記調整手段は、前記遅延情報を調整することを特徴とした請求項5又は6に記載の復号化装置。
【請求項8】
前記サイド情報には、基本符号化データを復号化する際の、ゲイン情報が含まれており、前記調整手段は、前記ゲイン情報を調整することを特徴とした請求項5〜7のいずれか1項に記載の復号化装置。


【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate