説明

音響信号符号化装置

【課題】 従来は、全帯域共通量子化精度情報の初期値が適当でない場合、繰り返し処理の回数が増大し、必ずしも高速であるとはいえない場合があり、全帯域共通量子化精度情報を初期値から変更する事によって、個別の量子化精度に誤差が生じる可能性もある。
【解決手段】 全帯域共通量子化精度決定部13は、入力される現ブロック音響信号の特性を基に、予め分類してある全帯域共通量子化精度値統計テーブルを用いて、現ブロックに近似する音響信号を検索し、その音響信号の特性に最もふさわしいと推定される統計上の全帯域共通量子化精度値を抽出する。量子化器11は、個別帯域量子化精度値と全帯域共通量子化精度値とを用いて、周波数信号を量子化信号へ変換する。周波数帯域決定部16は、符号化情報量の条件を満足するため、人間の聴感特性にとって重要な分割周波数帯域に優先的に情報を割り当てる周波数帯域の決定を行う。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は音響信号符号化装置に係り、特に情報圧縮によって生じる量子化雑音を的確に制御し、音質を保ちながら高速に符号化信号を生成する音響信号符号化装置に関する。
【背景技術】
【0002】
時間領域のディジタル化された音響信号を周波数領域に変換した後、周波数領域にて情報圧縮を行って符号化信号を生成する音響信号符号化装置では、ビデオCD等で用いられるMPEG-1 AUDIO Layer2、インターネット等のデータ配信で利用されているMPEG-1 Layer3(略称MP3)、BSディジタル放送で採用されているMPEG-2 AUDIO NBC、別名アドバンスト・オーディオ・コーディング(Advanced Audio Coding:略称AAC)、DVD(Digital Versatile Disk)の音声フォーマットであるドルビーディジタル(Dolby Digital)、MD(ミニディスク)の圧縮方式ATRACまたはATRAC3などの符号化方式で符号化を行う。
【0003】
これらは時間領域のディジタル化された音響信号を周波数領域に変換し、特定の周波数帯に偏りを持つ音響信号の特徴と、人間の聴覚の特性を考慮した聴覚の感度に応じた周波数帯毎の重み付けに従い、聴感的に重要とされない周波数帯の情報を削減又は減少することによって情報圧縮を行っている。
【0004】
上記の符号化方式において、特にMP3やAACは周波数帯毎の情報量削減方法に二重の繰り返し処理を取り入れており、非常に細かい尺度で周波数帯毎の情報量を制御している。上記の二重の繰り返し処理のうちの一方の繰り返し処理は、圧縮信号の品質を向上するための個々の周波数帯毎における量子化雑音を制御するものであり、もう一方の繰り返し処理は圧縮率に従ったブロック毎の割り当て情報量以内で符号化を行うために符号化情報量を制御するものである。両者の条件を満足するために、一方の繰り返し処理が終了した後、他方の繰り返し処理へと移行し、相互に渡り合う事によって品質及び符号化情報量の要求を両立している。
【0005】
ところが、これらの繰り返し処理は非常に負荷が重く、ディジタル信号処理プロセッサ(DSP)や中央処理装置(CPU)などを用いたリアルタイム性が重要なシステムに対してふさわしいとはいえない。従って、リアルタイム処理を必要とする用途に対しては、制限時間で符号化を終了するための負荷の軽い量子化部が求められる。
【0006】
そこで、本来の二重の繰り返し処理の代わりに符号化情報量を制御する一重の繰り返し処理のみを行い、量子化雑音の制御は最初の1回の処理で終了する構造を取り入れ高速化を実現する音響信号符号化装置が従来より知られている(例えば、特許文献1参照)。この従来の音響信号符号化装置の動作について、図6のフローチャートと共に説明するに、まず、周波数帯重み付け情報によって各々の周波数帯域の量子化精度を修正するための個別帯域量子化精度を算出する(ステップS1)。
【0007】
次に、この個別帯域量子化精度と全帯域共通量子化精度の初期値を用いて、入力音響信号である周波数信号を量子化器において所定の演算式に基づき量子化を行う(ステップS2)。続いて、量子化後の周波数信号を集計し、他の符号化に必要な補助情報と共に総情報量を算出する(ステップS3)。続いて、求められた総情報量が情報圧縮率に依存するブロックに対して与えられた割り当て情報量以内であるかどうか判定する(ステップS4)。
【0008】
量子化後の総情報量が与えられた割当情報量以内と判定された場合、符号化品質及び符号化情報量の両者の条件を満たすものとして、量子化を終了する。他方、量子化後の総情報量が与えられた割り当て情報量を超えていると判定された場合、全帯域共通量子化精度を一律に粗くする方向に修正し、量子化雑音が増加することによる若干の符号化品質劣化を許容しながら符号化情報量の条件を満たすため、新しい全帯域共通量子化精度値を設定し直す(ステップS5)。
【0009】
次に、この設定し直した全帯域共通量子化精度と個別帯域量子化精度とを用いて、入力音響信号である周波数信号を量子化器において所定の演算式に基づき再度量子化を行う(ステップS2)。以下、ステップS3の量子化後の周波数信号の集計を行った後、符号化によって生成された総情報量が割り当て情報量の条件を満足するまで全帯域共通量子化精度値を変更する処理を繰り返す。このようにして、全体の量子化精度を加減しながら目標とする符号化情報量へ調整するための繰り返し処理を経て符号化信号を生成する。
【0010】
【特許文献1】特開2001−148632号公報
【発明の開示】
【発明が解決しようとする課題】
【0011】
しかしながら、上述の一重の繰り返し処理による量子化部を有する従来の音響信号符号化装置は、二重の繰り返し処理による量子化部を有する音響信号符号化装置に比べて、符号化情報量を制御する一重の繰り返し構造を採用しているため処理量を削減でき、高速に符号化信号を生成することはできるが、全帯域共通量子化精度情報の初期値が適当でない場合、繰り返し処理の回数が増大し、必ずしも高速であるとはいえない場合がある。
【0012】
また、全帯域共通量子化精度情報を初期値から変更する事によって、各々の帯域において最適であった個別の量子化精度に誤差が生じる可能性があり、符号化情報量は目標とすべき情報量を満足するものの、理想的な量子化雑音レベルからの乖離が起きてしまうことで音質が低下するといった危惧がある。
【0013】
本発明は以上の点に鑑みなされたもので、本来量子化部において二重の繰り返し構造を持つ音響信号符号化方式を高速処理が可能な構造にするべく、全帯域共通量子化精度に予め適当と推定される数値を与え、それに基づき量子化雑音が許容される水準へと個別帯域量子化精度値を修正し、割り当て情報量については打ち切り周波数帯域を設ける事によって符号化情報量の制御を行うことで、負荷の軽い音響信号符号化装置を提供することを目的とする。
【課題を解決するための手段】
【0014】
本発明は上記の目的を達成するため、時間領域のディジタル化された音響信号をある定められた時間間隔でブロック化した後、ブロック内の音響信号を複数の周波数帯域に分割し、分割した各周波数帯域毎の重み付けに基づき、ブロック内の音響信号の量子化を行い情報圧縮する音響信号符号化装置において、複数の周波数帯域からなる全周波数帯域共通の全帯域共通量子化精度値を決定する全帯域共通量子化精度決定部と、分割した各周波数帯域毎の聴覚的な重み付けによって、全帯域共通量子化精度値を各周波数帯域毎に修正するための個別帯域量子化精度値を決定する個別帯域量子化精度決定部と、全帯域共通量子化精度値及び個別帯域量子化精度値に従い、ブロック内の音響信号を量子化する量子化器と、量子化器から出力された量子化信号の符号化情報量を集計する符号化情報量集計部と、情報圧縮率及びディジタル化された音響信号の特性に従い、ブロック毎に情報量を割り与える割り当て情報量決定部と、割り当てられた情報量と量子化信号の符号化情報量とを比較し、符号化情報量が割り当てられた情報量より小なる範囲内で最終的に出力する量子化信号の周波数帯域を決定する周波数帯域決定部とを有することを特徴とする。
【0015】
この発明では、従来繰り返し処理が行われていた量子化部において、音質条件を満たすための全帯域共通量子化精度値の統計的及び適応的な推定を行う全帯域共通量子化精度決定部と、符号化情報量を満たすための周波数帯域決定部とにより、繰り返し処理を削減することができる。また、音響信号の特性と全帯域共通量子化精度値との誤差による量子化信号の符号化情報量の増減を、適応的な情報割り当てと周波数帯域決定部とによって吸収することができる。
【0016】
また、本発明は上記の目的を達成するため、全帯域共通量子化精度決定部は、ブロック内の音響信号エネルギー、音響信号振幅値及び割り当て情報量のうちの少なくとも一の情報を要素として予め求めた全帯域共通量子化精度値の統計情報に基づく全帯域共通量子化精度値と、現在符号化中の現ブロックの音響信号よりも過去のブロックの音響信号の符号化の際に用いた全帯域共通量子化精度値とのいずれか一方又は両者の組み合わせ値を、全帯域共通量子化精度値として決定することを特徴とする。この発明では、全帯域共通量子化精度値を繰り返し処理を行わずに決定することができる。
【0017】
また、上記の目的を達成するため、本発明は全帯域共通量子化精度決定部を、現ブロックの音響信号のブロック内の音響信号エネルギー、最大または代表的な振幅値、及びブロック内割り当て情報量の何れか一つ又は二つ以上を組み合わせた情報を、現ブロックの音響信号から抽出する音響信号特性抽出部と、ブロック内の音響信号のエネルギー、最大または代表的な音響信号の振幅値、及びブロック割り当て情報量の何れか一つ又は二つ以上を組み合わせて得られた全帯域共通量子化精度値の統計結果を示す統計的音響信号特性分類情報と、音響信号特性抽出部から出力された情報とを比較し、統計的音響信号特性分類情報の中から音響信号特性抽出部から出力された情報に最も近似する統計的音響信号特性分類情報を検索する特性比較部及び近似情報検索部と、検索結果から現ブロックの全帯域共通量子化精度値を特定する全帯域共通量子化精度特定部とを有する構成としたことを特徴とする。この発明では、音響信号の特性を考慮した全帯域共通量子化精度値を取得することができる。
【0018】
また、上記の目的を達成するため、本発明は、全帯域共通量子化精度決定部を、過去に決定した全帯域共通量子化精度値を用いて量子化された量子化信号の符号化情報量と、過去の1又は複数ブロックの量子化信号の周波数帯域の情報とを再帰的に用いて、全帯域共通量子化精度特定部で特定された全帯域共通量子化精度値を補正する補正部を含む構成としたことを特徴とする。この発明では、音響信号の特性を考慮し、過去の情報を再帰的に用いた補正部により、信頼性の高い全帯域共通量子化精度値を得ることができる。
【発明の効果】
【0019】
本発明によれば、従来繰り返し処理が行われていた量子化部において、音質条件を満たすための全帯域共通量子化精度値の統計的及び適応的な推定を行う全帯域共通量子化精度決定部と、符号化情報量を満たすための周波数帯域決定部とにより、繰り返し処理を削減し、また、音響信号の特性と全帯域共通量子化精度値との誤差による量子化信号の符号化情報量の増減を、適応的な情報割り当てと周波数帯域決定部とによって吸収することで符号化情報量の制御を容易に可能としたため、低負荷な構成により音質劣化を抑えた符号化信号を高速に生成することができる。
【0020】
また、本発明によれば、音響信号の特性を考慮し、過去の情報を再帰的に用いた補正部によって信頼性の高い全帯域共通量子化精度値を特定するようにしたため、品質劣化をできるだけ抑えて音質を維持することができる。
【発明を実施するための最良の形態】
【0021】
次に、本発明を実施するための最良の形態について図面と共に説明する。図1は一般的な音響信号符号化装置のブロック図を示す。同図において、時間領域のディジタル音響信号は、時間−周波数変換部1に供給され、ある一定の時間間隔によってブロック化された後、ブロック内のディジタル音響信号が複数の周波数帯域に分割され周波数信号へと変換される。また、上記の時間領域のディジタル音響信号は、周波数帯重み付け情報算出部2に供給され、上記のブロック化された周波数信号の特徴を抽出するため、上記の分割された周波数帯域毎に人間の聴覚特性を用いた聴感的な感度を示す周波数帯重み付け情報が算出される。
【0022】
時間−周波数変換部1から出力された周波数帯域に変換された信号は、周波数帯重み付け情報算出部2から出力された周波数帯重み付け情報を基に、量子化部3にて周波数帯域毎に異なる量子化精度で量子化されて情報圧縮される。量子化部3にて得られた量子化信号は、符号化信号生成部4に供給され、ここで周波数帯重み付け情報や個別の周波数帯域量子化精度情報などからなる補助情報と多重化されて音響信号符号化信号が生成される。
【0023】
AACやMP3などではこの量子化部3に前述のように繰り返し構造を採用している。そのため符号化品質は向上するが、符号化処理は非常に多くの演算が必要である。
【0024】
AACの場合、量子化精度は全帯域共通量子化精度を表すグローバルゲイン(global_gain)と個別の周波数帯域量子化精度を表すスケールファクタ(Scalefactor)を用いて次式で与えられている。
【0025】
X=(int)(sample3/4×2((Scalefactor-global_gain)×3/16))
ただし、上式中、Xは量子化後の周波数信号であり、Sampleは量子化される周波数信号の絶対値であり、「(int)」は浮動小数点で表現された数値から整数値への変換を示す。
【0026】
上式中において、2のべき乗に関わるglobal_gainは(マイナス)の要素を持つがゆえ、大きければ大きいほど量子化される周波数サンプルの量子化後振幅を小さくする。この時、整数値に変換される量子化後の周波数信号Xの振幅が小さくなるに従い量子化精度は粗くなり、逆量子化後信号の量子化雑音が増大する事に繋がる。
【0027】
一方、一律の量子化精度を与えるglobal_gainに対し、Scalefactorは2のべき乗に対し(プラス)の要素を持ち、Scalefactorを増加する事によって、個別帯域の量子化後の周波数信号Xの振幅を増加させる方向に修正する事ができるので、個々の帯域の量子化精度を向上させるためにはScalefactorの値を増やしてあげれば良い事がわかる。
【0028】
ここで、全帯域共通量子化精度値(global_gain)は、ブロック毎の符号化品質を左右する重要な要素である。符号化品質と符号化情報量との間では相反する関係がある。すなわち、符号化品質を高くするには符号化情報量が増加するが、符号化情報量には伝送路で定められた上限値があり、その許容範囲内で符号化品質をできるだけ高くするように、符号化品質と符号化情報量の両者の最適な関係を、前述した従来の二重の繰り返し処理により導くには多くの処理を費やさねばならない。
【0029】
一方、リアルタイム処理が要求される状況においては、処理量の最大値がシステム全体のコストを押し上げる要因に直結し、できるだけ平均化された処理工程を持つ事が望まれる。従って、繰り返し構造は少なければ少ないほどリアルタイム処理にはふさわしい。
【0030】
また、全帯域共通量子化精度値(global_gain)はそもそもの音響信号の持つエネルギーや振幅値と依存関係を持ち、信号エネルギーが大きい、または音圧が高い時などは量子化精度を粗くしてもよく、更に割り当て情報量が少ない時も必然的に量子化精度を粗くし、情報量を節約しなくてはならいことは容易に推測できる。これは聴感特性からも裏付けられることであり、音響信号エネルギーや音圧が高い場合は、聴感的に許容される雑音レベルが増加し、よりマスキング効果が働くからである。
【0031】
音質を左右するのは情報圧縮によって各々の帯域に生じる量子化雑音の影響である。人間の聴感特性は低域ほど感度が良く、高域は非常に暖味である。よって、10数kHzを超える帯域の瞬間的な存在・非存在の現象は捉える事が難しく、言い換えると周波数帯域が高域にて変化するような音質の違いを把握できないと推測される。
【0032】
また、AACやMP3は厳密には一定情報量が与えられる固定転送レートに従い符号化が行われるが、ブロック毎に情報量の貸し借りが許されており、擬似的な可変情報割り当てが可能である。
【0033】
以上の点に鑑み、本発明では音響信号エネルギー、音響信号振幅値及び割り当て情報量の何れか一つまたは組み合わせにより示される音響信号の特性によって全帯域共通量子化精度を推定し、更に符号化情報量は低域信号を優先した周波数帯符号割り当てによって制御する手段を講じたものである。
【0034】
図2は本発明になる音響信号符号化装置の一実施の形態における量子化部のブロック図を示す。図2において、図1の量子化部3に相当する量子化部10は、量子化器11、個別帯域量子化精度決定部12、全帯域共通量子化精度決定部13、割り当て情報決定部14、符号化情報量集計部15、周波数帯域決定部16とからなる。全帯域共通量子化精度決定部13による全帯域共通量子化精度の決定には数種類の方法が考えられる。ここでは音響信号の特性に応じて予め繰り返し処理を用いた量子化部で求めた全帯域共通量子化精度値を音響信号の特性別に分類したテーブルを使って導く手法を例に上げる。
【0035】
この本実施の形態の動作について、図3のフローチャートを併せ参照して説明する。図1に示した時間-周波数変換部1において生成された周波数信号が、図2の量子化器11へ伝送される。同じく図1に示した周波数帯重み付け情報算出部2にて導かれた周波数帯重み付け情報が個別帯域量子化精度決定部12へ伝送され、この情報を基に個別帯域量子化精度値が決定される(図3のステップS11)。
【0036】
一方、全帯域共通量子化精度決定部13では、入力される現ブロック音響信号の特性を基に、予め分類してある全帯域共通量子化精度値統計テーブルを用いて、現ブロックに近似する音響信号を検索し、その音響信号の特性に最もふさわしいと推定される統計上の全帯域共通量子化精度値を抽出する(図3のステップS12)。なお、この全帯域共通量子化精度値は過去に用いられた量子化精度値を代入してもよい。この理由は音響信号が定常的な場合、量子化精度はブロック間で大きく異なる事がないという性質から来ている。
【0037】
更に、全帯域共通量子化精度に用いた推定値を、1又は複数の過去のブロック間の推移や、後述の割り当て帯域の増減、使用可能な情報配分量により調整する事によって、より信頼性の高い量子化精度値を取得する事が可能である。
【0038】
量子化器11は、上記の個別帯域量子化精度値と全帯域共通量子化精度値とを用いて、周波数信号を量子化信号へ変換する(図3のステップS13)。この量子化信号は、例えば、前記式のXで表わされ、前記式で示すように個別帯域量子化精度値(Scalefactor)と、全帯域共通量子化精度値(global_gain)とが反映された信号である。変換された量子化信号は符号化情報量集計部15へ供給される。
【0039】
符号化情報量集計部15は、符号化総情報量を得るために、量子化信号と符号化に必要な補助情報から総情報量を算出する(図3のステップS14)。総情報量は低域の周波数から順次算出し、ブロック毎に割り当てられた割り当て情報量を超えない帯域まで集計していく。
【0040】
一方、割り当て情報決定部14は、符号化レート情報と周波数信号とを入力信号として受け、現ブロックで使用可能な割り当て情報量を算出する。この割り当て情報量は符号化レートによって自ずと求まるが、擬似的な可変レートが許されているAACやMP3では、ブロック毎の音響信号の複雑度に応じて情報量をブロック間で増減する事によって、より高品質な符号化が実現できる。情報量の増減は入力信号のエネルギー、振幅値、変化量等によって決定される。
【0041】
以上の工程で得られた量子化信号は量子化雑音が分割周波数帯域毎に制御された状態であり、品質面では問題ないが、符号化情報量が割り当て情報量以内でなければならないという条件を満たす必要がある。そこで、周波数帯域決定部16では、この符号化情報量の条件を満足するため、人間の聴感特性にとって重要な分割周波数帯域に優先的に情報を割り当てる周波数帯域の決定を行う(図3のステップS15)。すなわち、周波数帯域決定部16は、割り当て情報量以内である最高帯域を特定し、周波数帯域の制限によって符号化総情報量を制御する。
【0042】
以上で、量子化部10で行われる処理は終了し、最終的に得られた量子化信号とその補助情報が符号化信号生成部4において多重化され、符号化信号として生成される。
【0043】
本実施の形態によれば、従来繰り返し処理が行われていた量子化部10において、音質条件を満たすための量子化精度値の統計的及び適応的な推定を行う全帯域共通量子化精度決定部13と、符号化情報量を満たすための周波数帯域決定部16とにより、図3に示すように、繰り返し処理を削減し、非常に高速で、かつ、音質劣化を抑えた良好な音響信号符号化信号を生成する事ができる。
【0044】
次に、図2中の個別のブロックについて更に詳しく説明する。全帯域共通量子化精度決定部13による全帯域共通量子化精度決定方法の例として統計情報を用いる方法と、以前使用した量子化精度値を用いる方法と、使用した符号化情報量や周波数帯域の増減量などの補助情報を用いる方法について述べる。これらの方法は単独で使用しても組み合わせて使用してもよい。
【0045】
まず、統計量から求める方法について説明する。既に簡単な説明をしたように、二重の繰り返し構造を持つ量子化部において量子化された音響信号は、品質及び情報量のバランスがとれた状態で量子化されており、仮に全帯域共通量子化精度値が既知なる値であれば、符号化情報量を制御するための繰り返し処理を省略できるはずである。
【0046】
音響信号の特性から考慮して、この全帯域共通量子化精度値はブロック内音響信号エネルギー、音響信号振幅値、割り当て情報量に大きく関係している。そこで、予めこれらを要素とした全帯域共通量子化精度値の統計を取り、音響信号エネルギー、音響信号振幅値、割り当て情報量の何れか一つまたは組み合わせたとき、最も適当と推定される全帯域共通量子化精度が得られるようなテーブルを用意しておく事で、繰り返し処理によらずとも信頼性の高い全帯域共通量子化精度値を取得する事ができる。前記実施の形態の説明は、この方法による。
【0047】
次に、以前使用した量子化精度値を用いる方法について説明する。この方法は、符号化過程で導いた過去のブロックにおける全帯域共通量子化精度値を現ブロックの全帯域共通量子化精度値として当てはめる方法である。音響信号が定常的に推移しているとき、情報圧縮で使用すべき量子化精度はブロック間で大きく異なる事はない。前ブロックで使用した全帯域共通量子化精度値を現ブロックにて使用しても、多くの場合、品質劣化には繋がらない。従って、音響信号が定常的であると判定された場合、前ブロックの全帯域共通量子化精度値をそのまま現ブロックの全帯域共通量子化精度値に用いる事によって、量子化処理を極めて簡単に行うことができる。
【0048】
次に、使用した符号化情報量や周波数帯域の増減量などの補助情報を用いる方法について説明する。この方法は、割り当て情報量又は符号化周波数帯域情報による全帯域共通量子化精度値推定方法であり、前記の二つの方法と組み合わせて用いるとより効果的である。統計的情報や過去のブロックで用いた全帯域共通量子化精度値を代用した場合、最終的に符号化した結果、予定より情報を多く使用したり、あるいは少なく使用したり、また、予定より周波数帯域が高かったり、あるいは低かったりと、推定による誤差が生じることがある。これは音響信号の変化によるものであり、現在符号化中の音響信号の特性に由来するものと考えられる。推定した全帯域共通量子化精度値と符号化中の音響信号との特性の不一致が原因であるため、これを修正する必要がある。修正する手段として、過去の割り当て情報量の大小や周波数帯域の高低などの情報をフィードバックすることによって推定誤差を小さくする事ができる。
【0049】
図4は図2中の全帯域共通量子化精度決定部13の一実施の形態のブロック図を示す。この全帯域共通量子化精度決定部13は、これまで説明した全帯域共通量子化精度値算出方法を組み合わせて全帯域共通量子化精度を決定する回路部である。図4において、音響信号特性抽出部131は、入力された現ブロックの周波数信号のブロック内音響信号エネルギー、最大又は代表的な振幅値、及びブロック内割り当て符号量の何れか一つ又は任意の二つ若しくは三つを組み合わせた情報である音響信号の特性を算出(抽出)する。
【0050】
統計的音響信号特性分類情報132は、ブロック内音響信号エネルギー、最大又は代表的な振幅値、及びブロック内割り当て符号量の何れか一つ又は任意の二つ若しくは三つを組み合わせて得られた全帯域共通量子化精度値の統計結果を示す情報であり、予め外部の記憶装置等に記憶されている。
【0051】
特性比較器及び近似情報検索器133は、音響信号特性抽出部131からの現ブロックの音響信号の特性と統計的音響信号特性分類情報132とを比較し、統計的音響信号特性分類情報132の中で現ブロックの音響信号の特性に最も近似した統計的音響信号特性分類情報を検索する。この特性比較器及び近似情報検索器133により検索された統計的音響信号特性分類情報は、全帯域共通量子化精度特定器134に供給され、ここで、現ブロックにふさわしいと推定される全帯域共通量子化精度値が特定される。
【0052】
全帯域共通量子化精度特定器134で特定された全帯域共通量子化精度値は、外部へ出力される一方、符号化情報蓄積器135に過去情報として蓄積される。符号化情報蓄積器135には、過去の周波数帯域情報や割り当て符号化情報量なども供給されて蓄積される。全帯域共通量子化精度特定器134は、符号化情報蓄積器135で蓄積された、以前のブロックにおいて使用された全帯域共通量子化精度値や周波数帯域情報、割り当て符号化情報量などが現在符号化中の音響信号との特性情報としてフィードバック入力され、特性比較器及び近似情報検索器133からの一般的な統計的音響信号特性分類情報を、フィードバック入力された現在符号化中の音響信号との特性との相違点に基づき修正し、最終的な全帯域共通量子化精度値を得る。
【0053】
次に、符号化情報量集計部15及び周波数帯域決定部16について、更に詳細に説明する。図2に示した周波数帯域決定部16は、従来の符号化情報量を制御する量子化の繰り返し処理の役目を果たす部分である。現ブロックの音響信号において適当であると推定された全帯域共通量子化精度値と個別帯域量子化精度値を用いて量子化された周波数信号は、従来と同様の周波数帯域を確保しなくては品質上劣化が検知されてしまう。従って、音響信号の重要な要素である低中域を重視し、低域から順次加算された符号化情報量が目標とする割り当て情報量を超えるまで符号化を行えば、品質的に満足する符号化情報が生成できるはずである。
【0054】
与えられた符号化情報量に応じて可能な限り高域の周波数帯まで符号化してもよいが、符号化レートによって音質上過剰品質となる場合も有り得るので、適当な高域の周波数帯で打ち切り、余剰情報量は余剰情報量を蓄積するバッファに預ける事によって、現ブロック以降のブロック用に確保しておけばよい。このようなブロック間の情報量の貸し借りによって全体の符号化品質も向上する。
【0055】
但し、全帯域共通量子化精度値の推定に誤差が生じた場合、情報量が不足し所望の周波数帯より低い帯域で打ち切られる恐れがある。そこで、図2の割り当て情報決定部14では二種類の割り当て情報量を用意し、符号化における品質劣化を防いでいる。
【0056】
図5は二種類の割り当て情報量を用い、ブロック間でほぼ一定の品質の維持を可能にする、符号化情報量集計部15及び周波数帯域決定部16の動作説明用フローチャートである。まず、量子化された信号の分割周波数帯0〜nまでのn+1個の分割周波数帯の符号化情報量Sを集計する(ステップS21)。上記の変数nの初期値は0であり、最初は0番目の分割周波数帯、すなわち、最も低域の分割周波数帯の符号化情報量Sが集計される。
【0057】
続いて、集計された符号化情報量Sが二種類の割り当て情報量のうち、少ない方の第1の割り当て情報量よりも小であるかどうか判定される(ステップS22)。最初はn=0であり、集計された符号化情報量Sは第1の割り当て情報量よりも小であるので、0番目の分割周波数帯に基づく周波数帯域を仮決定し(ステップS23)、周波数帯域は適当かどうか判定する(ステップS24)。ここで、周波数帯域が適当かどうかは、情報量の不足により符号化における品質劣化が生じないかどうかにより判断される。最初は当然周波数帯域が狭すぎるので、適当でないと判定され、周波数帯域nを1つ増加させ(ステップS25)、今度は0番目の分割周波数帯域とそれより周波数帯域の高い1番目の分割周波数帯域の総符号化情報量Sが算出される(ステップS21)。
【0058】
以下、同様にして、低域の分割周波数帯から順次高域の分割周波数帯へ周波数帯域を広げていき、それらの符号化情報量Sを算出していき、周波数帯域nまでの総情報量が割り当て情報量以内であり、かつ、符号化される周波数帯域が所定の周波数帯域を満足すると、つまり、ステップS24で周波数帯域が適当であると判定されると、情報割り当てを打ち切り、最終的な周波数帯域を決定し(ステップS29)、量子化部の処理を終了する。
【0059】
周波数帯域が狭く不適当である場合、周波数帯域nを増加させながら割り当て情報量と帯域nまでの総符号化情報量Sとを比較し、可能な限り適当とされる所定の周波数帯域まで拡大する。適当とされる周波数帯域まで符号化情報量を取り込めればよいが、そのブロックにおける音響信号の符号化難易度が高く、符号化するための情報量が多く必要なとき、又は全帯域共通量子化精度値の推定値に誤差が存在し、量子化信号の情報量が増大したときなどは、ステップS22で符号化情報量Sが割り当て情報量以上と判定される。
【0060】
この場合は、補助情報量があるかどうか判定し(ステップS26)、補助情報量が無ければ、そこで周波数帯域の決定処理を強制的に終了する(ステップS27)。他方、補助情報量がある場合は、今までの第1の割り当て情報量に、周波数帯域を拡大するために余剰情報量として確保した補助情報量を追加して第2の割り当て情報量とし(ステップS28)、この第2の割り当て情報量と符号化情報量Sとを再度比較する(ステップS21)。これにより、符号化情報量Sが第2の割り当て情報量よりも小さくなると、周波数帯域を仮決定し、周波数帯域が適当であれば、周波数帯域を最終決定する(ステップS23、S24、S29)。
【0061】
このようにして、本実施の形態では、あるブロックにおける音響信号の符号化難易度が高く、符号化するための情報量が多く必要なとき、又は全帯域共通量子化精度値の推定値に誤差が存在し、量子化信号の情報量が増大したときなどにおいて、周波数帯域が他のブロックと比較し極端に低下する事態を防止することができる。
【0062】
また、本実施の形態では、割り当て情報量は1ブロックで消費してもよい通常の第1の割り当て情報量と、上記のような品質に関わる事態に対処するために余剰情報量として確保した補助情報量を追加した第2の割り当て情報量とを設定し、符号化情報量と品質保持の両立を図る役目を担っている。
【0063】
また、ここで得られた割り当て情報量と周波数帯域情報は、次ブロックの全帯域共通量子化精度値の推定材料として、図4の符号化情報蓄積器135に供給して使用する事もできる。このような再帰処理によって安定した品質が保たれ、更に信頼性の高い量子化精度で符号化を行えるため、情報量の余分な消費も抑制できる。
【0064】
なお、上記した符号化装置の機能をプログラムによりコンピュータに実現させるようにしてもよい。このプログラムは、記録媒体から読みとられてコンピュータに取り込まれてもよいし、通信ネットワークを介して伝送されてコンピュータに取り込まれてもよい。
【図面の簡単な説明】
【0065】
【図1】一般的な音響信号符号化装置のブロック図である。
【図2】本発明の音響信号符号化装置の一実施の形態における量子化部のブロック図である。
【図3】図2の量子化部の動作説明用フローチャートである。
【図4】図2中の全帯域共通量子化精度決定部の一実施の形態のブロック図である。
【図5】本発明における量子化部内の要部の動作説明用フローチャートである。
【図6】一重の繰り返し構造を持つ従来の音響信号符号化装置の量子化部の動作説明用フローチャートである。
【符号の説明】
【0066】
1 時間−周波数変換部
2 周波数帯重み付け情報算出部
3、10 量子化部
4 符号化信号生成部
11 量子化器
12 個別帯域量子化精度決定部
13 全帯域共通量子化精度決定部
14 割り当て情報決定部
15 符号化情報量集計部
16 周波数帯域決定部
131 音響信号特性抽出部
132 統計的音響信号特性分類情報
133 特性比較器及び近似情報検索器
134 全帯域共通量子化精度特定器
135 符号化情報蓄積器



【特許請求の範囲】
【請求項1】
時間領域のディジタル化された音響信号をある定められた時間間隔でブロック化した後、ブロック内の前記音響信号を複数の周波数帯域に分割し、分割した各周波数帯域毎の重み付けに基づき、ブロック内の前記音響信号の量子化を行い情報圧縮する音響信号符号化装置において、
前記複数の周波数帯域からなる全周波数帯域共通の全帯域共通量子化精度値を決定する全帯域共通量子化精度決定部と、
分割した各周波数帯域毎の聴覚的な重み付けによって、前記全帯域共通量子化精度値を各周波数帯域毎に修正するための個別帯域量子化精度値を決定する個別帯域量子化精度決定部と、
前記全帯域共通量子化精度値及び個別帯域量子化精度値に従い、前記ブロック内の音響信号を量子化する量子化器と、
前記量子化器から出力された量子化信号の符号化情報量を集計する符号化情報量集計部と、
情報圧縮率及び前記ディジタル化された音響信号の特性に従い、前記ブロック毎に情報量を割り与える割り当て情報量決定部と、
前記割り当てられた情報量と前記量子化信号の符号化情報量とを比較し、前記符号化情報量が前記割り当てられた情報量より小なる範囲内で最終的に出力する量子化信号の周波数帯域を決定する周波数帯域決定部と
を有することを特徴とする音響信号符号化装置。
【請求項2】
前記全帯域共通量子化精度決定部は、前記ブロック内の音響信号エネルギー、音響信号振幅値及び割り当て情報量のうちの少なくとも一の情報を要素として予め求めた全帯域共通量子化精度値の統計情報に基づく前記全帯域共通量子化精度値と、現在符号化中の現ブロックの音響信号よりも過去のブロックの音響信号の符号化の際に用いた前記全帯域共通量子化精度値とのいずれか一方又は両者の組み合わせ値を、前記全帯域共通量子化精度値として決定することを特徴とする請求項1記載の音響信号符号化装置。
【請求項3】
前記全帯域共通量子化精度決定部は、
現ブロックの音響信号のブロック内の音響信号エネルギー、最大または代表的な振幅値、及びブロック内割り当て情報量の何れか一つ又は二つ以上を組み合わせた情報を、前記現ブロックの音響信号から抽出する音響信号特性抽出部と、
前記ブロック内の音響信号のエネルギー、最大または代表的な音響信号の振幅値、及びブロック割り当て情報量の何れか一つ又は二つ以上を組み合わせて得られた全帯域共通量子化精度値の統計結果を示す統計的音響信号特性分類情報と、前記音響信号特性抽出部から出力された情報とを比較し、前記統計的音響信号特性分類情報の中から前記音響信号特性抽出部から出力された情報に最も近似する統計的音響信号特性分類情報を検索する特性比較部及び近似情報検索部と、
前記検索結果から現ブロックの全帯域共通量子化精度値を特定する全帯域共通量子化精度特定部と
を有することを特徴とする請求項1記載の音響信号符号化装置。
【請求項4】
前記全帯域共通量子化精度決定部は、過去に決定した前記全帯域共通量子化精度値を用いて量子化された量子化信号の符号化情報量と、過去の1又は複数ブロックの前記量子化信号の周波数帯域の情報とを再帰的に用いて、前記全帯域共通量子化精度特定部で特定された前記全帯域共通量子化精度値を補正する補正部を含むことを特徴とする請求項3記載の音響信号符号化装置。


【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate


【公開番号】特開2006−10817(P2006−10817A)
【公開日】平成18年1月12日(2006.1.12)
【国際特許分類】
【出願番号】特願2004−184829(P2004−184829)
【出願日】平成16年6月23日(2004.6.23)
【出願人】(000004329)日本ビクター株式会社 (3,896)
【Fターム(参考)】