説明

エンコードと複雑性の低いトランスコードのための合成スペクトル成分の変換

【課題】トランスコードされた信号の品質を改善する。
【解決手段】オーディオコーディングシステムにおいて、正規化された浮動小数点で表現された数値としてオーディオエンコーディング伝送器がエンコードされたスペクトル成分を表現する。この伝送器は、エンコードされたスペクトルパラメータをトランスコードするために用いられる第1及び第2の制御パラメータを提供する。トランスコーダは第1の制御パラメータを用いてエンコードされた成分を部分的にデコードし、第2の制御パラメータを用いて成分を再エンコードする。この伝送器は、どこで浮動小数点表現が正規化を失ったのかを特定するために、部分的なデコーディング処理における算術演算の効果を分析することで第2の制御パラメータを決定する。正規化を失った数値と関連付けられた指数は補正され、補正された指数は第2の制御パラメータを計算するために用いられる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は一般にオーディオコーディング方法と装置に関し、より具体的には改善されたオーディオ情報のエンコードとトランスコードに関する。
【背景技術】
【0002】
A.コーディング
多くの通信システムは、情報伝達容量と記録容量の需要がしばしば利用可能な容量を上回ることがあるという問題に直面している。その結果、人間の感覚で感知できる音質を損なうことなくオーディオ信号を伝達又は記憶させるのに必要な情報量を減らすことが放送及び記録分野に携わる人々の間で多大な関心事となっている。また与えられたバンド幅又は記憶容量において出力信号の感知できる音質を改善することも関心事となっている。
【0003】
必要な情報量を減少させるための従来の方法は、入力信号のうち一部の選択された部分のみを伝達又は記録させるものである。その他の部分は放棄される。聴覚エンコード(perceptual encoding)として知られる技術では、冗長なあるいは不適切な信号部分を容易に特定し廃棄することができるように、一般に元のオーディオ信号をスペクトル成分又は周波数サブ帯域信号に変換する。ある信号部分が他の部分から再現できる場合はその信号部分は冗長であると判断される。聴覚デコーダ(perceptual decoder)は、失われた冗長部分をエンコードされた信号から再現することができるが、冗長ではなかった失われた不適切な情報を再現することができない。しかしながら、不適切な情報を失うことは、その情報がなくなってもデコードされた信号において聴覚的などんな効力も及ぼさないので、多くのアプリケーションで容認できる。
【0004】
信号エンコード技術では、冗長な又は聴覚的に不適切な信号部分のみを廃棄したとしても聴覚的に明白となる。信号の不適切な部分を廃棄するひとつの方法は、信号の不適切な部分の廃棄されたスペクトルを表現することであり、また、正確さが低いスペクトルを表現することであり、これはしばしば量子化と呼ばれている。元のスペクトル成分とその量子化された表現との差は量子化ノイズとして知られている。聴覚エンコード技術により、聞こえない程度まで量子化ノイズのレベルを制御するよう試みられる。
【0005】
もし、聴覚的に明白な技術により必要な情報要求量を十分減らすことができないのならば、冗長でもなく聴覚的に不適切でもない信号部分をさらに廃棄する、聴覚的に明白でない技術が必要となる。その結果、伝達されたあるいは記録された信号の忠実度が劣化することが避けられない。聴覚的に明白でない技術では、聴覚的にほとんど意味のないと判断される信号部分のみが廃却される。
【0006】
しばしば聴覚的に明白でない技術とみなされる「カップリング」といわれるエンコーディング技術を必要な情報要求量を減らすために用いてもよい。この技術によれば2以上のオーディオ入力信号のスペクトル成分を結合してこれらのスペクトル成分を合成して表現するチャンネル結合信号を形成する。結合し合成した表現となっている、各入力信号におけるスペクトル成分のスペクトル包絡線を表すサイドインフォメーションも生成される。チャンネル結合信号を含むエンコードされた信号とサイドインフォメーションとは受信器により引き続きデコードするために伝達又は記録される。受信器は、元の入力信号のスペクトル包絡線を実質的に復元するために、チャンネル結合信号のコピーを生成し、このコピーされた信号中のスペクトル成分をスケーリングするためのサイドインフォメーションを用いることにより、元の入力信号の不正確な複製である分離された信号を生成する。2チャンネルステレオシステムの一般的なカップリング技術では、左右のチャンネルの信号における高周波成分を結合して合成された単一の高周波成分を形成し、元の左右のチャンネルの信号における高周波成分のスペクトル包絡線を表現するサイドインフォメーションを生成する。カップリング技術の一例が、ここでA/52書面として引用している、「ディジタルオーディオ圧縮(AC−3)」、Advanced Television System Committee (ATSC) Standard document A/52 (1994)である。
【0007】
スペクトル再生として知られるエンコード技術は、必要情報容量を減らすために用いられる聴覚的に明白ではない技術である。多くの実施形態において、高周波スペクトル成分のみが再生されるのでこの技術は「高周波再生」(HFR)と称されている。この技術によれば、オーディオ入力信号の低周波成分のみを含むベース帯域信号が伝達され記録される。元の高周波数成分のスペクトル包絡線を表現するサイドインフォメーションもまた提供される。ベース帯域信号とサイドインフォメーションとを含むエンコードされた信号が、受信器で引き続いてデコーディングを行うために伝達又は記録される。受信器は、サイドインフォメーションに基づいてスペクトルレベルで、削除された高周波成分を再生し、再生された高周波成分とベース帯域信号とを結合し出力信号を生成する。既知のHFRの方法はMakhoul及びBeroutiの「スピーチコーディングシステムにおける高周波再生」Proc. of the International Conf. on Acoust., Speech and Signal Proc., 1979年4月に見つけることができる。高品質の音楽のコーディングに適切な改良されたスペクトル再生技術は、米国特許出願番号10/113,858表題「Broadband Frequency Translation for High Frequency Regeneration」2002年3月28日出願、米国特許出願番号10/174,493表題「Audio Coding System Using Spectral Hole Filling」2002年6月17日出願、米国特許出願番号10/238,047表題「Audio Coding System Using Characteristics of a Decoded Signal to Adapt Synthesized Spectral Components」2002年9月6日出願、及び、米国特許出願番号10/434,449表題「Improved Audio Coding Systems and Methods Using Spectral Component Coupling and Spectral Component Regeneration」2003年5月8日出願に開示されている。
【0008】
B.トランスコーディング
既知のコーディング技術により、聴覚的に感知できる所定のレベルまでオーディオ信号の必要情報容量を削減する。逆に言えば、所定の情報容量を持ったオーディオ信号の聴覚的に感知できるレベルを改善する。このような成功にもかかわらず、さらなる改良の必要性が存在し、新しいコーディング技術を発見し、既知の技術を使う新しい方法を発見するために、コーディングについての研究が続けられている。
【0009】
さらなる進歩における重要な問題は、新しいコーディング技術によりエンコードされた信号と、古いコーディング技術を組み込んだ既設の装置との潜在的な不適合である。早期の陳腐化を避けるための、標準化組織や装置製造業者の多大な努力にもかかわらず、古い受信器は新しいコーディング技術によりエンコードされた信号を常に正しくデコードできるとは限らない。逆に、新しい受信器は古いコーディング技術によりエンコードされた信号を常に正しくデコードできるとは限らない。その結果、専門家も消費者も、もし古いコーディング技術でエンコードされた信号と新しいコーディング技術でエンコードされた信号との互換性を確保しようとするならば、多くの装置を入手し保持することになる。
【0010】
このような負担を軽減し避けるための1つの方法は、エンコードされた信号を1つのフォーマットから他のフォーマットに変換することのできるトランスコーダを手に入れることである。トランスコーダは異なったコーディング技術間の架け橋としての役割を果たす。例えば、トランスコーダにより、新しいコーディング技術によりエンコードされた信号を、古い技術によりエンコードされた信号のみデコードすることのできる受信器と相性の合う他の信号に変換することができる。
【0011】
通常のトランスコーディングにおいて、完全なデコーディングとエンコーディングの工程が実行される。上記コーディングの例を参照すると、エンコードされた入力信号は、新しいコーディング技術を用いてデコードされ、その後合成フィルタによりディジタルオーディオ信号に変換されるべきスペクトル成分を得る。次に、このディジタルオーディオ信号は、分析フィルタにより再びスペクトル成分に変換され、続いてこれらのスペクトル成分は古いコーディング技術を用いてエンコードされる。その結果エンコードされた信号は古い受信装置と互換性を持つようになる。古いフォーマットから新しいフォーマットに変換するため、同時期の相異なるフォーマット間での変換を行うため、及び、同じフォーマットで異なったビットレート間での変換を行うためにトランスコーディングを用いてもよい。
【0012】
通常のトランスコーディング技術は、聴覚符号化(perceptual coding system)によりエンコードされた信号を変換するために用いられたとき深刻な不利益がある。1番目の不利益は、通常のトランスコーディング装置は、デコーディングとエンコーディングの工程を完全に実行しなければならないので、比較的高価となることである。2番目の不利益は、デコーディングを行った後トランスコードされた信号の聴覚的音質は、ほとんど常に、デコーディングの後エンコードされた入力信号の聴覚的音質に比べて劣化していることである。
【発明の開示】
【0013】
トランスコードされた信号の品質を改善するため、及び安価にトランスコーディング装置を導入することができるようにするために用いることができるコーディング技術を提供することが本発明の1つの目的である。
この目的は特許請求の範囲に記載された発明により達成される。トランスコーディングにより、エンコードされた入力信号をデコードしてスペクトル成分を取得し、そして、このスペクトル成分をエンコードしてエンコードされた出力信号とする。合成フィルタと分析フィルタのために被る実施のためのコストと信号の劣化が避けられる。トランスコーダに自分自身の制御パラメータを決定させるよりむしろエンコードされた信号内に制御パラメータを用意することにより、トランスコーダの実施のためのコストをさらに下げることができる。
【0014】
本発明とその好ましい実施の形態における様々な機能は、以下の説明と、図の相当する要素に参照番号を付加した添付図面を参照することによりよく理解できるであろう。以下の説明と図面の内容は例示としてのみ述べたもので、本発明の技術範囲を限定するためのものではないと理解すべきである。
【図面の簡単な説明】
【0015】
【図1】オーディオエンコーディング伝送器の概念図である。
【図2】オーディオデコーディング受信器の概念図である。
【図3】トランスコーダの概念図である。
【図4】本発明の種々の特徴を組み込んだオーディオエンコーディング伝送器の概念図である。
【図5】本発明の種々の特徴を組み込んだオーディオエンコーディング伝送器の概念図である。
【図6】本発明の種々の特徴を実行することのできる装置の構成概念図である。
【発明を実施するための最良の形態】
【0016】
A.システムの概観
基本的なオーディオコーディングシステムは、エンコーディング伝送器、デコーディング受信器、及び、通信経路又は記録媒体を具備する。伝送器は、オーディオの1以上のチャンネルを表現する入力信号を受信し、そのオーディオを表現するエンコードされた信号を生成する。次に伝送器は、エンコードされた信号を伝達するために通信経路に伝送するか又は、エンコードされた信号を記録するために記録媒体に伝送する。受信器は、通信経路又は記録媒体からエンコードされた信号を受信し、元のオーディオの正確な又は類似の複製となる出力信号を生成する。出力信号が正確な複製でない場合、多くのコーディングシステムにより、元の入力オーディオと聴覚的に区別できない複製を供給するよう試みる。
【0017】
コーディングシステムを適切に動作させるための生来的で明らかな条件は、受信器が正確に信号をデコード及びエンコードすることである。しかしながらコーディング技術の進歩により、受信器が正確にデコードできないコーディング技術によりエンコードされた信号をデコードするためにその受信器を使う必要が生じる場合がある。例えば、デコーダがスペクトル生成を行うことを前提とするエンコーディング技術によりエンコードされた信号が生成されているが、受信器はスペクトル生成ができない場合である。逆に、デコーダがスペクトル生成を行うことを前提としないエンコーディング技術によりエンコードされた信号が生成されているが、受信器はスペクトル生成を必要とするエンコードされた信号を要求し必要とする場合もある。本発明は、互換性のないコーディング技術とコーディング装置との間の架け橋となるトランスコーディングを目的とする。
【0018】
本発明を実行する方法の詳細な説明の導入部として以下に2,3のコーディング技術について説明する。
【0019】
1.基本システム
a)エンコーディング伝送器
経路11からオーディオ入力信号を受信するスプリットバンドオーディオコーディング伝送器10の一実施の形態の概念図である。分析フィルスペクトル成分タバンク12により、オーディオ入力信号はこのオーディオ入力信号のスペクトル成分の内容を表すスペクトル成分に分割される。エンコーダ13は、少なくとも一部のスペクトル成分をコード化されたスペクトル情報にエンコードする工程を実行する。エンコーダ13によりエンコードされなかったスペクトル成分は、量子化制御装置14から受け取った制御パラメータに応じて修正された量子化分解能を用いて、量子化装置15により量子化される。あるいは、コード化されたスペクトル成分の一部又は全てを量子化することができる。量子化制御装置14は、検出したオーディオ入力信号の特性から制御パラメータを抽出する。図示の実施の形態において、検出された特性はエンコーダ13により提供された情報から得られる。量子化制御装置14は、オーディオ信号の時間特性を含む他の特性に応答して制御信号を抽出するようにしてもよい。分析フィルタバンクにより処理がなされる前、最中、又は後にオーディオ信号の分析から、これらの特性を得ても良い。量子化されたスペクトル情報、コード化されたスペクトル情報、及び制御パラメータを表現するデータは、フォーマッタ16によりアセンブルされてエンコードされた信号になり、エンコードされた信号は送信又は記録のために経路17に伝送される。フォーマッタ16は、他のデータを、同期化ワード、パリティ又は検出コード、データベース、データベース検索キー、及び補助信号のような、エンコードされた信号にアセンブルすることができるが、これらは本発明の理解に関係しないので、これ以上説明しない。
【0020】
エンコードされた信号は、超音波領域から紫外線領域の周波数を含むスペクトルにわたって、ベース帯域又は変調した通信経路を介して送信することができ、又は、磁気テープ、カード、又はディスク、光学カード又はディスク、紙のような媒体上の検出可能な表示を含む本資質的にあらゆる記録技術を用いて媒体上に記録することができる。
【0021】
(1)分析フィルタバンク
以下に説明する、分析フィルタバンク12と合成フィルタバンク25は、広い範囲のディジタルフィルタ技術、ブロック変換、及びウェーブレット変換を含む、本質的にどのような方法により実行しても良い。オーディオコーディングシステムの1つにおいて、分析フィルタバンク12は、修正離散コサイン変換(MDCT)により実行され、合成フィルタバンク25は、プリンセン、他による「基時間領域エリアスキャンセル技術に基づくフィルタバンク設計を用いたサブ帯域/変換コーディング」、Proc. of the International Conf. on Acoust., Speech and Signal Proc., 1987年5月, 2161−64ページに記載された逆離散コサイン変換(IMDCT)により実行される。本質的にどんなフィルタバンクの実施も重要ではない。
【0022】
ブロック変換により実行される分析フィルタバンクは、入力信号のブロック又はインターバルを分割して、その信号のインターバルにおけるスペクトル内容を表現する1組の変換係数にする。隣り合う1以上の係数のグループは、グループ内の係数の数に相応する帯域幅を持った特定の周波数サブ帯域内のスペクトル内容を表現する。ブロック変換よりむしろポリフェーズフィルタのようなディジタルフィルタにより実行される分析フィルタバンクが入力信号を分割し1組のサブ帯域信号にする。各サブ帯域信号は、特定の周波数サブ帯域内において入力信号のスペクトル内容を時間基準で表現する。サブ帯域信号は、時間の単位インターバルに対するサブ帯域信号内のサンプル数に相応する帯域幅を各サブ帯域信号が持つように、間引きすることが好ましい。
【0023】
以下の説明において、上述の基時間領域エリアスキャンセル(TDAC)変換のようなブロック変換を用いる実施の形態について特に説明する。この説明において、用語「スペクトル成分」は、変換係数を意味し、用語「周波数サブ帯域」と「サブ帯域信号」は、1以上の隣接する変換係数のグループに関する。しかしながら、本発明の原理は他の実施の形態に適用しても良いので、用語「周波数サブ帯域」と「サブ帯域信号」はまた、信号の全帯域のうち一部のスペクトル内容を表現する信号に関し、用語「スペクトル成分」はサブ帯域信号のサンプル又は要素を一般に意味すると理解してよい。聴覚コーディングシステムは、人間の聴覚システムのいわゆる限界帯域幅に相応する帯域幅を持つ周波数サブ帯域を提供するための分析フィルタバンクを実行する。
【0024】
(2)コーディング
エンコーダ13は必要とされるどのようなタイプのエンコーディング処理も本質的に実行することができる。一実施の形態において、エンコーディング処理によりスペクトル成分が変換されてスケーリングした値とその係数とを表すスケーリング表現となり、このスケーリング表現を以下に説明する。他の実施の形態において、スペクトル再生又はスペクトル結合のためのマトリックス化やサイドインフォメーションの生成のようなエンコーディング処理もまた用いられる。これらの技術のいくつかは以下の詳細に説明する。
【0025】
伝送器10は、図1に提示されていない他のコーディング処理を具備しても良い。例えば、量子化スペクトル成分を算術コーディングやハフマンコーディングのようなエントロピーコーディング処理の対象にしてもよい。このようなコーディング処理の詳細な説明は本発明を理解するために必要ではない。
【0026】
(3)量子化
量子化装置15により提供される量子化分解能は、量子化制御装置14から受け取った制御パラメータに応答して修正される。これらの制御パラメータは、要求されるいかなる方法によっても抽出することができるが、聴覚エンコーダにおいて、エンコードされたオーディオ信号によりどれだけの量の量子化されたノイズがマスクされるかを評価するためにいくつかの聴覚モデルが用いられる。多くのアプリケーションにおいて、量子化制御装置は、エンコードされた信号の情報容量に課せられた制限にも対応する。この制限は、エンコードされた信号又はエンコードされた信号の特定部分の最大許容ビットレートという用語で表現される。
【0027】
聴覚コーディングシステムの好ましい実施の形態において、制御パラメータは、情報容量又はビットレート制限を前提として可聴な量子化ノイズを最小限にするために、各スペクトル成分に配分するビット数を決定し、量子化装置15が各スペクトル成分を量子化するのに用いる量子化解像度を決定するために、ビット配分処理で使われる。量子化制御装置14の特別な実施形態が本発明にとって決定的要素となることはない。
【0028】
量子化制御装置の一例が、しばしばドルビーAC−3と称されるコーディングシステムについて記載したA/52書面に開示されている。本実施の形態において、オーディオ信号のスペクトル外形の推定値を与えるスケールファクタにてスケーリングされた表現で、オーディオ信号のスペクトル成分が表される。聴覚モデルは、オーディオ信号のマスキング効果を評価するマスキング曲線を計算するためにこのスケールファクタを用いる。次に量子化制御装置は、許容されるノイズの閾値を決定し、この閾値により、課せられた情報容量制限又はビットレートに適合する最適なやり方で量子化ノイズを配分するためには、どのようにスペクトル成分が量子化されるべきかを制御する。許容ノイズの閾値はマスキング曲線の複製であり、量子化制御装置により定められた量のマスキング曲線とのオフセット量である。本実施の形態において、制御パラメータは、許容ノイズの閾値を定める値である。これらのパラメータは、閾値自身、又は、スケールファクタや許容ノイズの閾値を導き出すオフセット量のような値のような数々の方法で表現することができる。
【0029】
b)デコーディング受信器
経路21からオーディオ信号を表現するエンコードされた信号を受信する分割帯域オーディオデコーディング受信器20の一実施の形態を示す概念図である。デフォーマッタ22は、エンコードされた信号から量子化されたスペクトル情報、コード化されたスペクトル情報、及び制御パラメータを取得する。量子化されたスペクトル情報は、制御パラメータに応じて修正された分解能を用いて、逆量子化装置23により逆量子化される。あるいは、コード化されたスペクトル情報の一部又は全てを逆量子化しても良い。コード化されたスペクトル情報はデコーダ24によりデコードされ逆量子化されたスペクトル成分と結合され、合成フィルタバンク25によりオーディオ信号に変換されて経路26に沿って送り出される。
【0030】
受信器で行われる処理は、これに対応する送信器で行われる処理を補完するものである。デフォーマッタ22は、フォーマッタ16でアセンブルされたものを逆アセンブルする。デコーダ24は、エンコーダ13により行われるエンコーディング処理とまったく逆の処理又は逆の処理に準じる処理であるデコーディング処理を行い、逆量子化装置23は、量子化装置15により行われる処理の逆の処理に準じる処理を行う。合成フィルタバンク25は、分析フィルタバンク12の行う処理と逆のフィルタ処理を行う。デコーディング処理と逆量子化処理は、送信器における処理を完全に補完する逆の処理ではないので、逆の処理に準じる処理と言われている。
【0031】
ある実施の形態において、合成ノイズ又は擬似ランダムノイズは量子化されたスペクトル成分の最下位ビットに挿入されるか又は1以上のスペクトル成分の代替として用いられる。受信器はまた、送信器で行うかもしれない他のコーディング処理を補完する付加的なデコーディング処理を行っても良い。
【0032】
c)トランスコーダ
図3は、オーディオ信号を表現するエンコードされた信号を経路31を通じて受け取るトランスコーダ30の一実施の形態の概念図である。デフォーマッタ32は、量子化されたスペクトル情報、コード化されたスペクトル情報、1以上の第1の制御パラメータ、及び第2の1以上の制御パラメータを、エンコードされた信号から取得する。量子化されたスペクトル情報は、エンコードされた信号から受け取った1以上の第1の制御パラメータに応じて修正された量子化分解能を用いて、逆量子化装置33により量子化される。任意的に、コード化されたスペクトル情報の一部又は全部もまた逆量子化しても良い。必要ならば、コード化されたスペクトル情報を、トランスコーディングのためにデコーダ34によりデコードしても良い。
【0033】
エンコーダ35は任意的な構成要素で、特定のトランスコーディングアプリケーションには必要でないかもしれない。必要に応じてエンコーダ35は、量子化されたスペクトル情報の少なくとも一部、又はコード化及び/又はデコードされたスペクトル情報の少なくとも一部をエンコードし、再エンコードされたスペクトル情報に変換する処理を実行する。エンコーダ35によりエンコードされないスペクトル成分は、エンコードされた信号から受け取った1以上の第2の制御パラメータに応じて修正された量子化分解能を用いて、量子化装置36により再量子化される。任意的に、再エンコードされたスペクトル情報の一部又は全部を量子化してもよい。再量子化されたスペクトル情報を表すデータ、再エンコードされたスペクトル情報を表すデータ、及び、1以上の第2の制御パラメータを表すデータは、フォーマッタ37によりアセンブルされてエンコードされた信号となり、送信又は記録のために経路38を通じて送り出される。フォーマッタ37は、他のデータをアセンブルして、フォーマッタ16について上述したようなエンコードされた信号にする。
【0034】
トランスコーダ30は、量子化制御装置に第1又は第2の制御パラメータを決定させるためにコンピュータのリソースを必要としないので、その動作をより効率的に行うことができる。トランスコーダ30には、エンコードされた信号から取得しないで、1以上の第2の制御パラメータ、及び/又は、1以上の第1の制御パラメータを導き出すための、上述のような量子化制御装置14のような1以上の量子化制御装置が含まれる。第1又は第2の制御パラメータを決定するために必要なエンコーディング伝送器の特徴については以下に説明する。
【0035】
2.数値の説明
スケーリング
オーディオコーディングシステムは、一般に100dB以上のダイナミックレンジを持つオーディオ信号を表現しなければならない。このダイナミックレンジを表現するオーディオ信号又はそのスペクトル表現の2進表示に必要なビット数はその表現の精度に比例する。従来のコンパクトディスクオーディオ、パルス符号変調(PCM)オーディオのようなアプリケーションでは、16ビットで表現される。多くの専門的なアプリケーションでは、より広いダイナミックを持ちより精度の高いPCMオーディオを表現するために、もっと多くのビット、例えば20ビット又は24ビットが用いられる。
【0036】
オーディオ信号又はそのスペクトル成分を整数で表現することは非常に非効率であり、多くのコーディングシステムでは、スケーリングされた値と対応するスケールファクタを含む他の形式の表現を用いる。
【0037】
s=ν・f (1)
ここで、
s=オーディオ成分
ν=スケーリングされた値
f=対応するスケールファクタ

スケーリングされた値νは、本質的に、小数表現や整数表現を含むどんな方法で表現してもよい。正数と負数は、サインマグニチュード及び、2進数に対する1の補数と2の補数のような様々な補数表現のような種々の方法で表現してもよい。スケールファクタfは単純な数でもよく、あるいは、本質的に、指数関数gf又は対数関数loggfのようなあらゆる関数としてもよく、ここでgは指数関数又は対数関数の底である。
【0038】
ディジタルコンピュータに用いるのに適した好ましい実施の形態において、2の補数を用いた2進小数で表現される「仮数」mがスケーリングされた値であり、指数関数2−xにおける「指数」xがスケールファクタである、特別な浮動小数点表現が用いられる。本説明の残りの部分では浮動小数点の仮数と指数について言及する。しかし、このような特別な表現方法は、本発明に適用するスケーリングされた値とスケールファクタで表現されたオーディオ情報の1つの方法であるにすぎないことを了解すべきである。
【0039】
オーディオ信号成分の値はこの特別な浮動小数点表現では以下のように表される。
【0040】
s=m・2−x (2)
例えば、スペクトル成分が0.1757812510に等しい値、これは2進数で0.00101101である、を持っていたと仮定する。この値は表Iに示すような多くの仮数と指数の対により表現することができる。
【表1】

【0041】
この特別な浮動小数点表現において、負数は2の補数の値を持つ仮数により表現される。表Iの最後の行を参照すると、例えば2の補数で表現した2進数1.01101は、10進数で-0.59375を意味する。結局、表の最後の行で示した浮動小数点で表現した実際の値は、-0.59375 x 2−3 = -0.07421875であり、表に示した意図した値とは異なる。この特徴の重要性については以下に説明する。
【0042】
(2)正規化
浮動小数点表現が「正規化」されている場合は、浮動小数点で表現された数値は少ないビット数で表現できる。仮数の2進数表現におけるが、その値における情報を失うことなく可能な限り最上位のビットに移動する場合を、非ゼロ浮動小数点表現は正規化されると言われている。2の補数で表現する場合において、正規化された正の仮数は常に+0.5以上で+I未満であり、正規化された負の仮数は常に−0.5未満で−1以上である。これは、符号ビットと等しくない最上位ビットを有するのと等しい。表Iにおいて、第3行の浮動小数点表現は正規化されている。正規化された仮数の指数xは2に等しく、これは1ビット分最上位ビット位置に移動させることを要求するビット移動の数である。
【0043】
スペクトル成分が10進数で-0.17578125、2進数で-1.01101と等しい値を持つと仮定する。2の補数表現で最初の1ビットは数値が負であることを示す。この値は、正規化された仮数m=1.01101を持つ浮動小数点で表現された数値を表す。この正規化された仮数に対する指数xは2に等しく、これはゼロビット分最上位ビット位置に移動させることを要求するビット移動の数である。
【0044】
表Iの第1、第2、及び最後の行に示した浮動小数点表現は、正規化されていない表現である。表の最初の2行に示した表現は「不足正規化(under normalized)」されており、最後の行は「過剰正規化(over normalized)」されている。
【0045】
コーディングの目的で、浮動小数点で表現された数値の仮数の正確な値を少ないビット数で表現することができる。例えば、正規化されていない仮数m=0.00101101を9ビットで表現することができる。8ビットは小数値を表現するために用い、1ビットは符号を表現するために用いる。正規化された仮数m=0.101101はほんの7ビットで表現することができる。過剰正規化された表Iの最後の行に示された仮数m=1.01101はさらに少ないビットで表現することができる。しかしながら、上述したように、過剰正規化された仮数を有する浮動小数点で表現された数値はもはや正確な値を表さない。
【0046】
これらの例は、不足正規化された仮数を避けることが一般に望ましい理由と過剰正規化を避けることが一般に重要である理由を説明するのに役立つ。不足正規化された仮数が存在するということは、ビットが効率的に使われていないこと又は数値が正確に表現されていないことを意味し、過剰正規化された仮数が存在するということは、値が不当に歪められているということを意味する。
【0047】
(3)正規化についての他の考察
多くの実施の形態において、指数は固定ビット数で表現されるか、又は、あらかじめ定めた範囲の値を持つように制限される。もし、仮数のビット長が指数の最大可能値より長ければ、仮数は正規化することのできない値を表現することができる。例えば、指数を3ビットで表現する場合、0から7までの値を表現することができる。もし指数を16ビットで表現したとすると、表現可能な最も小さいゼロでない値は正規化のために14ビット移動する必要がある。3ビットの指数は、この仮数を正規化するために必要な値を表現することができない。この状況は、本発明の基本原理に影響を与えず、実用的な実施の形態では、算術演算において関連する指数で表現できる範囲を超えて仮数を移動させることがないようにすべきである。
【0048】
各スペクトル成分を独自の仮数と指数を持ったエンコードされた信号で表現することは一般に非常に非効率的である。もし複数の仮数が共通の指数を共有するならば、指数は少なくてすむ。このような構成をしばしばブロック浮動小数点(BFP)表現と称す。ブロックの指数値は、そのブロック中の最大値を持つ値を正規化した仮数で表現できるように定められる。
【0049】
指数を少なくすること、そしてその結果として指数を表現するためのビット数を少なくすることは、大きなブロックを用いるとした場合に必要である。大きなブロックを用いることはしかしながら、通常、ブロック中の多くの値を不足正規化させる。従ってブロックのサイズは、指数を伝達するのに必要なビット数と、不足正規化された仮数を表現することによる不正確さと非効率化を招くことの二律背反関係のバランスをとって、通常は選ばれる。
【0050】
ブロックサイズの選択により、量子化制御装置14に用いられる聴覚モデルにより計算されるマスキング曲線の正確さのような他のコーディング特性も影響を受ける。ある実施の形態において、聴覚モデルは、マスキング曲線を計算するためにスペクトルの形の推定値としてBFPを用いる。もし非常に大きなブロックサイズをBFPに用いる場合は、BFPの指数のスペクトル分解能を減少させ、聴覚モデルで計算されたマスキング曲線の精度を下げる。追加すべき詳細はA/52書面で入手できる。
【0051】
BFP表現を用いることの重要性については以下では説明しない。BFP表現を用いたとき、あるスペクトル成分は常に不足正規化されやすいということを理解すれば十分である。
【0052】
(4)量子化
浮動小数点形式で表現されたスペクトル成分の量子化は一般に仮数の量子化と称される。指数は一般に量子化されず、固定ビット数で表現されるか、又は、あらかじめ定めた範囲の値を持つように制限される。
【0053】
もし正規化された仮数がm=0.101101表Iに示したように0.0625=0.0001の分解能で量子化されたならば、量子化された仮数q(m)は2進数の小数0.1011に等しく、これは5ビットで表現することができ、10進数の小数0.6875に等しい。この特定の分解能で量子化した後の浮動小数点表現により表現された値はq(m)・2−x=0.6875 x 0.25=0.171875となる。
【0054】
より粗い分解能で量子化した後の浮動小数点表現により表された値は、q(s)=0.5 x 0.25=0.125である。
【0055】
このような特別な例は、説明の便宜のためだけのものである。量子化の特別な形式や量子化分解能と量子化された仮数を表現するためのビット数との特別な関係は、本発明の本質とは関係がない。
【0056】
(5)算術演算
多くのプロセッサや他のハードウエアロジックにより、数値の浮動小数点表現に直接適用することができる特定の一群の算術演算が実行される。あるプロセッサやプロセッシングロジックは、このような演算を行わず、これらは通常非常に安価なのでこれらの型式のプロセッサを用いることはしばしば魅力的なものとなる。このようなプロセッサを用いるとき、浮動小数点演算をシミュレートする1つの方法は、浮動小数点表現を精度を向上させた固定小数点表現に変換し、変換された値に整数値用算術演算を行い、浮動小数点表現に再度変換することである。もっと効率的な方法は、仮数と指数に別々に整数値用算術演算を行うことである。
【0057】
これらの算術演算を仮数に行うことの効果を考えることにより、エンコーディング伝送器は、引き続き行われるデコーディング処理における過剰正規化と不足正規化を要望通り制限又は回避できるように、そのエンコーディング処理を修正することができるであろう。スペクトル成分における仮数の過剰正規化と不足正規化とがデコーディング処理において起こったとすると、デコーダは関連する指数の値を変更することなくこの状況を訂正することができない。
【0058】
指数の変更は、トランスコーディングのための制御パラメータを決定するために量子化制御装置での複雑な処理を必要とすることを意味するので、トランスコーダ30にとって特に厄介である。スペクトル成分の指数が変更された場合、エンコードされた信号中に伝達された1以上の制御パラメータはもはや有効ではなく、これらの制御パラメータを決定したエンコーディング処理がこの変更をあらかじめ見込むことができた場合でない限り再び制御パラメータを決定しなければならない。
【0059】
加算、減算、及び除算の効果は、これらの算術演算が以下に説明するようなコーディング技術に用いられるので、特に関心がある。
【0060】
(a)加算
2個の浮動小数点で表現された数値の加算は2つのステップにより行われる。第1のステップにおいて、必要に応じて2個の数値間で調整が行われる。もし2個の数値の指数が等しくなければ、大きい指数を持つほうの仮数のビットを、2個の指数の差に等しい数だけ右に移動させる。第2のステップでは、「仮数の和」が、2の補数計算を用いて2個の仮数の数値を加えることにより計算される。仮数の和と2個の元の数の小さいほうの指数とにより2個の元の数の和が表現される。
【0061】
この加算演算の結果、仮数の和が過剰正規化又は不足正規化されるかもしれない。2個の元の仮数の和が+1以上であるか、−1未満である場合は、仮数の和は過剰正規化される。2個の元の仮数の和が+0.5未満であるか、−0.5以上である場合は、仮数の和は不足正規化される。後者の状況は2つの元の仮数が反対の符号を持つ場合に生じる。
【0062】
(b)減算
2個の浮動小数点で表現された数値の減算は、加算について上述したのと類似の方法で2つのステップにより行われる。第2のステップで、「仮数の差」が、2の補数計算を用いて一方の元の仮数を他方の元の仮数から減算することにより計算される。仮数の差と2個の元の数の小さいほうの指数とにより2個の元の数の差が表現される。
【0063】
この減算演算の結果、仮数の差が過剰正規化又は不足正規化されるかもしれない。2個の元の仮数の差が+0.5未満であるか、−0.5以上である場合は、仮数の差は不足正規化される。2個の元の仮数の差が+1以上であるか、−1未満である場合は、仮数の差は過剰正規化される。後者の状況は2つの元の仮数が反対の符号を持つ場合に生じる。
【0064】
(c)乗算
2個の浮動小数点で表現された数値の乗算は2つのステップにより行われる。第1のステップにおいて、「指数の和」が、2個の元の数の指数を加えることにより計算される。第2のステップでは、「仮数の積」が、2の補数計算を用いて2個の仮数の数値を乗算することにより計算される。仮数の積と指数の和により2個の元の数の積が表現される。
【0065】
この乗算演算の結果、仮数の積は不足正規化されるかもしれないが、1つの例外を除いて、仮数の積の大きさが決して+1以上又は−1未満とならないので、過剰正規化されることはない。2個の元の仮数の積が+0.5未満であるか、−0.5以上である場合は、仮数の積は不足正規化される。
【0066】
乗算すべき両方の浮動小数点で表現された数値が−1に等しい仮数を持つとき、過剰正規化が起こる1つの例外となる。この場合、乗算により仮数の積が+1に等しくなり、これは過剰正規化である。しかしながら、乗算すべき値のうち少なくとも1つを間違いなく負にしないことにより、このような状況を避けることができる。以下に説明する合成技術として、乗算は、結合されたチャンネル信号の合成信号のためとスペクトル再生のためにのみ用いられる。結合係数を負でない値にするよう要求することによりこの例外的な状況を避け、包絡線スケーリング情報、変換された成分の混合係数、及びノイズのような成分の混合係数を負でない値にするよう要求することにより、この例外的な状況を避ける。
【0067】
本説明の残りでは、この1つの例外的な状況を避けるためのコーディング技術が実行されるものと仮定する。この状況を避けることができない場合は、乗算を用いるとき過剰正規化を避けるためのステップも行わなければならない。
【0068】
(d)まとめ
仮数に対するこれらの演算の効果は以下のようにまとめられる。
【0069】
(1)2個の正規化された数値の加算により、正規化された、不足正規化された、又は過剰正規化された和がもたらされる。
【0070】
(2)2個の正規化された数値の減算により、正規化された、不足正規化された、又は過剰正規化された差がもたらされる。
【0071】
(3)2個の正規化された数値の乗算により、正規化された、不足正規化された積がもたらされるが、上述の制限を考慮すると、過剰正規化されるものではない。
【0072】
これらの数値演算から得られる値は、それが正規化された場合は少ないビット数で表現することができる。不足正規化された仮数は、正規化された仮数に対する望ましい値よりも小さい指数と結びつき、不足正規化された仮数の整数表現は、最下位ビット位置からかなりのビットが失われるので、精度を失う。過剰正規化された仮数は、正規化された仮数に対する望ましい値よりも大きい指数と結びつき、過剰正規化された仮数の整数表現は、かなりのビットが最上位ビットから符号ビット位置に移動するので、歪を生じさせる。コーディング技術により正規化に影響を与えさせる方法を以下に説明する。
【0073】
3.コーディング技術
アプリケーションによっては、デコードされた信号に受忍できないレベルの量子化ノイズを混入させることなしに基本的な聴覚エンコーディング技術に適合しないエンコードされた信号の情報容量に厳しい制限を課している。デコードされた信号の質を劣化させるが量子化ノイズを許容レベルに減少させる方法でそれを行う付加的なコーディング技術を用いることもできる。このようなコーディング技術を以下に説明する。
【0074】
a)マトリックス化
もし2つのチャンネルの信号に高い相関関係があるならば、2チャンネルコーディングシステムの必要情報容量を減らすためにマトリックス化を用いることができる。2つの相関関係のある信号を和と差の信号にマトリックス化することにより、マトリックス化された2つの信号の内の1つは、2つの元の信号の内の1つと同じ必要情報容量を持つが、他の1つは非常に少ない必要情報容量を持つようになる。例えば、もし2つの元の信号に完全に相関関係があるのなら、マトリックス化された信号の1つの必要情報容量はゼロに近づく。
【0075】
原則的に、2個の元の信号はマトリックス化された和と差の2個の信号から完全に復元することができるが、他のコーディング技術により混入された量子化ノイズにより完全な復元が妨げられる。量子化ノイズに起因するマトリックス化の問題点は本発明を理解する上での本質的事項ではないのでこれ以上説明しない。さらなる詳細は、米国特許5,291,557及びバーモン「ドルビーデジタル:デジタルテレビジョン及び記憶装置」Audio Eng. Soc. 17回国際会議、1999年8月40−57ページ、特に50−51ページのような他の文献から得られる。
【0076】
2チャンネル立体音響プログラムをエンコーディングする一般的なマトリックスを以下に示す。2個の元のサブ帯域信号が高い相関性を持つと判断されるときのみ、サブ帯域信号のスペクトル成分に臨機応変にマトリックス化を適用することが好ましい。このマトリックスにより、左右の入力チャンネルのスペクトル成分は、以下のような和チャンネルの信号と差チャンネルの信号とに結合される。
【0077】

Mi=1/2(Li+Ri) (3a)
Di=1/2(Li−Ri) (3b)

ここで、
Mi=マトリックスの和チャンネル出力におけるスペクトル成分i
Di=マトリックスの差チャンネル出力におけるスペクトル成分i
Li=マトリックスへの左チャンネル入力におけるスペクトル成分i
Ri=マトリックスへの右チャンネル入力におけるスペクトル成分i
和チャンネル信号と差チャンネル信号のスペクトル成分は、マトリックス化されていない信号におけるスペクトル成分に対して行うのと同様の方法でエンコードされる。左チャンネルと右チャンネルのサブ帯域信号が高い相関関係を持ち同位相である場合、和チャンネル信号におけるスペクトル成分は、左チャンネルと右チャンネルのスペクトル成分の大きさとほぼ同じ大きさを持ち、差チャンネル信号におけるスペクトル成分は、実質的にゼロに等しくなる。左チャンネルと右チャンネルのサブ帯域信号が高い相関関係を持ちお互いに逆位相である場合、スペクトル成分の大きさと、和チャンネル信号と差チャンネル信号との関係は逆になる。
【0078】
サブ帯域信号に臨機応変にマトリックス化を適用する場合は、受信器がいつ相補的な逆マトリックスを使うべきかを判断できるように、各周波数のサブバンドにマトリックス化の表示を含める。受信器は、サブ帯域信号がマトリックス化されているという表示を受け取らない限り、エンコードされた信号の各チャンネルに対するサブ帯域信号を独立に処理しデコードする。受信器は、以下の逆マトリックスを適用することで、マトリックス化の効果をひっくり返し、左チャンネルと右チャンネルのサブ帯域信号のスペクトル成分を復元する。
【0079】

L’i=Mi+Di (4a)
R’i=Mi−Di (4b)

ここで、
L’i=マトリックスの復元された左チャンネル出力におけるスペクトル成分i
R’i=マトリックスの復元された右チャンネル出力におけるスペクトル成分i
一般に、量子化効果があるので、復元されたスペクトル成分は元のスペクトル成分と正確に同じではない。
【0080】
逆マトリックスが、正規化された仮数を持つスペクトル成分を受け取った場合は、上述したように、逆マトリックスにおける和演算と差演算により、不足正規化または過剰正規化された仮数を持つスペクトル成分を復元する結果となるかもしれない。
【0081】
マトリックス化されたサブ帯域信号において1以上のスペクトル成分の代替となるものを受信器が合成する場合はこの状況はもっと複雑になる。一般に合成処理により確かでないスペクトル成分値を生成する。このように確かでないために、あらかじめ合成処理全体の効果が分かっていない限り、逆マトリックスからどのスペクトル成分が過剰正規化または不足正規化されるのかをあらかじめ判断することが不可能になる。
【0082】
b)カップリング
多数チャンネルのスペクトル成分をエンコードするためにカップリングを用いてもよい。好ましい実施の形態において、カップリングは高い周波数のサブ帯域のスペクトル成分に制限される。しかし、原則的にはカップリングをどんなスペクトル部分に用いてもよい。
【0083】
カップリングにより、多数チャンネルのスペクトル成分が結合されて単一の結合されたチャンネルの信号のスペクトル成分となり、元の多数チャンネルを表現する情報がエンコードされないで結合されたチャンネルの信号を表現する情報がエンコードされる。エンコードされた信号には、元の信号のスペクトルの形を表現するサイドインフォメーションが含まれる。このサイドインフォメーションにより、受信器は、結合されたチャンネルの信号から、元の多数チャンネル信号のスペクトルの形と実質的に同じ多数の信号を合成することが可能となる。カップリングを行う1つの方法はA/52書面に記載されている。
【0084】
カップリングが行われる1つの簡単な実施の形態を以下に記載する。本実施の形態によれば、結合されたチャンネルのスペクトル成分は、複数チャンネルにおける対応するスペクトル成分の平均値を計算することにより形成される。元の信号のスペクトルの形を表現するこのサイドインフォメーションはカップリング係数と称される。特定のチャンネルのカップリング係数は、結合されたチャンネルの信号におけるスペクトル成分のエネルギに対する特定のチャンネルのスペクトル成分のエネルギの比から計算される。
【0085】
好ましい実施の形態において、スペクトル成分とカップリング係数とは、浮動小数点で表現された数値としてエンコードされた信号内に伝達される。受信器は、結合されたチャンネルの信号における各スペクトル成分を適切なカップリング係数で乗算することにより、結合されたチャンネルの信号から複数のチャンネル信号を合成する。その結果、元の信号と同じか又は実質的に同じスペクトルの形を有する1組の合成信号となる。この演算は以下のように表現できる。
【0086】

Sij=Ci・ccij (5)

ここで、
Sij=チャンネルjにおける合成スペクトル成分i
Ci=結合されたチャンネルの信号におけるスペクトル成分i
ccij=チャンネルjにおける合成スペクトル成分iのカップリング係数
結合されたチャンネルのスペクトル成分とカップリング係数とが正規化された浮動小数点で表現された数値で表わされている場合、これらの2つの数値の積は、上述した理由により不足正規化されるかもしれないが過剰正規化されることのない仮数により表現される値となる。
【0087】
結合されたチャンネルの信号において1以上のスペクトル成分の代替となるものを受信器が合成する場合はこの状況はもっと複雑になる。上述のように、一般に合成処理により確かでないスペクトル成分値を生成し、スペクトル成分値が確かでないために、あらかじめ合成処理全体の効果が分かっていない限り、乗算から得られるどのスペクトル成分が不足正規化されるのかをあらかじめ判断することが不可能になる。
【0088】
c)スペクトルの再生
コーディングシステムにおいて、エンコーディング伝送器はオーディオ入力信号のベース帯域部分のみエンコードし他を廃棄する。デコーディング受信器はこの廃棄された部分を代替する合成信号を生成する。エンコードされた信号には、合成された信号が廃棄されたオーディオ入力信号の部分のスペクトルレベルをある値に保持するよう信号の合成を制御ためにデコーディング処理が用いるスケーリング情報が含まれる。
【0089】
スペクトル成分を様々な方法で再生してよい。スペクトル成分を生成又は合成するために方法によっては擬似乱数発生装置を用いる。他の方法では、ベース帯域信号のスペクトル成分を再生する必要のあるスペクトル部分に変換又はコピーする。本発明においてこの方法はさほど重要ではないが、いくつかの好ましい実施の形態の説明は先に引用した参考文献から得ることができる。
【0090】
以下に説明するのはスペクトル成分の再生についての1つの簡単な実施の形態である。本実施の形態によれば、ベース帯域信号からスペクトル成分をコピーすることによりスペクトル成分を合成し、擬似乱数発生装置により作られたノイズのような成分とコピーした成分とを結合し、エンコードされた信号内のスケーリング情報に従い結合した信号をスケーリングする。コピーされた成分及びノイズに類似の成分の相対的な重みは、伝達されたエンコードされた信号中の混合係数に従い調整される。この演算は以下のように表現される。
【0091】

si=ei・[ai・Ti+bi・Ni] (6)

ここで
si=合成されたスペクトル成分i
ei=スペクトル成分iのスケーリング情報の包絡
Ti=スペクトル成分iについてのコピーされたスペクトル成分
Ni=スペクトル成分iについて生成されたノイズに類似の成分
ai=変換された成分Tiの混合係数
bi=ノイズに類似の成分Niの混合係数
コピーされたスペクトル成分、スケーリング情報の包絡、ノイズに類似の成分、及び混合係数が正規化された浮動小数点で表現された数値で表現される場合、合成スペクトル成分を生成するために必要な加算演算及び乗算演算により、上述した理由で不足正規化または過剰正規化された仮数で表現された値が生まれる。あらかじめ合成処理全体の効果が分かっていない限り、どの合成スペクトル成分が不足正規化または過剰正規化されるのかをあらかじめ判断することが不可能になる。
【0092】
B.改良された技術
本発明は、聴覚エンコードされた信号のトランスコーディングがより効率的に実施されより高品質のトランスコードされた信号を提供できるようにする技術に関する。従来のエンコーディング伝送器及びデコーディング受信器において必要とした分析フィルタと合成フィルタのようないくつかの機能をトランスコーディング処理から削除することによりこのことが達成される。簡単な形態においては、本発明によるトランスコーディングは、スペクトル情報を逆量子化するのに必要な範囲にのみ部分的なデコーディング処理を行い、逆量子化されたスペクトル情報を再量子化するのに必要な範囲にのみ部分的なエンコーディング処理を行う。必要に応じて付加的なデコーディング及びエンコーディングを行ってもよい。逆量子化及び再量子化を制御するために必要な制御パラメータをエンコードされた信号から取得することにより、トランスコーディング処理はさらに単純化される。エンコーディング伝送器がトランスコーディングに必要な制御パラメータ生成するために用いる2つの方法について以下に説明する。
【0093】
1.最悪の場合の想定
a)概要
制御パラメータ生成するための第1の方法では、最悪の場合を想定し、浮動小数点で表現された指数を、過剰正規化が決して起こらないようにするために必要な範囲だけになるよう補正する。必要でない不足正規化のいくつかは予想している。1以上の第2の制御パラメータを決定するために補正された指数を量子化制御装置14が用いる。トランスコーディング処理において同様の条件で指数を補正し、浮動小数点表現が正確な値を表現するように補正された指数に関連する仮数を補正するので、補正された指数をエンコードされた信号に含める必要はない。
【0094】
図2と図4を参照すると、上述したように量子化制御装置14が1以上の第1の制御パラメータを決定し、合成処理において過剰正規化が起こることのないようにするためにはどの指数を補正しなければならないかを決定するためのデコーダ24の合成処理に関連して評価装置43がスペクトル成分を分析する。これらの指数は補正され他の補正されない指数と共に量子化制御装置44に送られ、量子化制御装置44は、トランスコーダ30にて実行される再エンコーディング処理のための1以上の第2の制御パラメータを決定する。評価装置43は、過剰正規化を起こすかもしれない合成処理における算術演算のみを考慮する必要がある。このため、上述したように、この処理は過剰正規化を起こすことがないので、上述のような結合されたチャンネルの信号についての合成処理を考慮する必要がない。カップリングの他の実施の形態における算術演算は考慮する必要があるかもしれない。
【0095】
b)処理の詳細
(1)マトリックス化
マトリックス化において、逆マトリックスに用いられる各仮数の正確な値は、量子化装置15により量子化が行われ、デコーディング処理により生じるノイズに類似の成分が合成された後でなければ知ることができない。この実施の形態において、仮数の値が分からないので、各マトリックス処理において最悪の条件を想定しなければならない。式4aと4bを参照すると、逆マトリックスにおける最悪の条件における演算は、同じ符号及び加算すると十分1より大きな値になる大きさを持つ2つの仮数の加算演算、又は、異なった符号及び加算すると十分1より大きな値になる大きさを持つ2つの仮数の減算演算のどちらかである。各仮数を1ビットだけ右にずらしその指数を1だけ減らすことにより、どちらの最悪の場合においてもトランスコーダの過剰正規化を避けることができる。従って、評価装置43は、逆マトリックス計算において各スペクトル成分の指数を減少させ、量子化制御装置44は、これらの補正された指数を用いて、トランスコーダのための1以上の第2の制御パラメータを決定する。これ以降の説明において、補正前の指数の値はゼロ以上であると仮定する。
【0096】
逆マトリックスに実際に提供された2つの仮数が最悪の場合の条件を満たす場合、その結果は適切に正規化された仮数となる。実際の仮数が最悪の場合の条件を満たさない場合は、その結果は不足正規化された仮数となる。
【0097】
(2)スペクトルの再生(HFR)
スペクトルの再生において、再生処理に用いられる各仮数の正確な値は、量子化装置15により量子化が行われ、デコーディング処理で生成されノイズに類似の成分が合成されるまで知ることができない。この実施の形態において、仮数の値が分からないので、各算術演算について最悪の場合を想定する必要がある。式6を参照すると、最悪の場合の演算とは、同じ符号及び加算すると十分1より大きな値になる大きさを持つスペクトル成分の仮数及び同じ符号及び加算すると十分1より大きな値になる大きさを持つノイズに類似の成分の仮数を加算する演算である。乗算演算が過剰正規化の原因となることはないが、過剰正規化が起こらないことを保証するものでもない。従って、合成されたスペクトル成分が過剰正規化されることを想定しなければならない。スペクトル成分の仮数とノイズに類似の成分の仮数とを1ビットだけ右にずらしその指数を1だけ減らすことにより、トランスコーダにおいて過剰正規化を避けることができる。従って、評価装置43は、変換された成分の指数を減少させ、量子化制御装置44は、これらの補正された指数を用いて、トランスコーダのための1以上の第2の制御パラメータを決定する
再生処理に実際に提供された2つの仮数が最悪の場合の条件を満たす場合、その結果は適切に正規化された仮数となる。実際の仮数が最悪の場合の条件を満たさない場合は、その結果は不足正規化された仮数となる。
【0098】
c)長所と短所
最悪の場合を想定する第1の方法は、安価に実施することができる。しかしこの方法は、トランスコーダがスペクトル成分を不足正規化させ、それらを表現するためにより多くのビットを割り振らない限り、エンコードされた信号が正確さの劣るものとなってしまう。さらに、いくつかの指数値が減少しているので、これらの補正された指数に基づくマスキング曲線の精度も低下する。
【0099】
2.決定論的処理
a)概要
制御パラメータ生成するための第2の方法では、過剰正規化と不足正規化の具体例で判断することを許容する処理を行う。過剰正規化を避け不足正規化の発生を最小限にするために浮動小数点の指数が補正される。補正された指数を量子化制御装置14が用いて1以上の第2の制御パラメータを決定する。トランスコーディング処理において同様の条件で指数を補正し、浮動小数点表現が正確な値を表現するように補正された指数に関連する仮数を補正するので、補正された指数をエンコードされた信号に含める必要はない。
【0100】
図2と図5を参照すると、上述したように量子化制御装置14が1以上の第1の制御パラメータを決定し、合成処理において過剰正規化が起こることのないよう、また合成処理において起こる不足正規化の発生を最小限にするためにはどの指数を補正しなければならないかを決定するためのデコーダ24の合成処理に関連して合成モデル53がスペクトル成分を分析する。これらの指数は補正され他の補正されない指数と共に量子化制御装置54に送られ、量子化制御装置54は、トランスコーダ30にて実行される再エンコーディング処理のための1以上の第2の制御パラメータを決定する。合成モデル53は合成処理の全て又は一部を行い、あるいは、合成処理における全ての算術演算の正規化の効果を前もって決定しておくためにその効果をシミュレートする。
【0101】
各量子化された仮数とあらゆる合成された成分は、合成モデル53で行われる分析処理に利用できるものでなければならない。合成処理において擬似乱数発生装置又は準乱数処理を用いる場合、初期化又は初期値は伝送器の分析処理及び受信器の合成処理間で同期させておく必要がある。このことは、伝送エンコーダ10に全ての初期値を決定させ、エンコードされた信号中にこれらの値の表示を含めさせることにより行うことができる。エンコードされた信号が独立した間隔又はフレーム中に配置されるならば、デコーディングにおける開始遅れを最小限にし編集のような種々のプログラム生成を容易にするために各フレーム中にこの情報を入れることが好ましい。
【0102】
b)処理の詳細
(1)マトリックス化
マトリックス化において、デコーダ24により用いられるデコーディング処理において、逆マトリックスに入力するスペクトル成分の1つ又は両方を合成することは可能である。どちらかの成分が合成された場合、逆マトリックスで計算されたスペクトル成分が過剰正規化されるのか不足正規化されるのかを判断することができる。逆マトリックスで計算されたスペクトル成分は、仮数における量子化誤差に起因して過剰正規化または不足正規化されることもある。合成モデル53は、逆マトリックスに入力される仮数と指数の正確な値を決定することができるので、このような正規化されない状態をテストすることができる。
【0103】
合成モデル53は、正規化が失われると判断した場合は、逆マトリックスに入力される1つ又は両方の成分の指数を、過剰正規化を避けるために減らすことができ、不足正規化を避けるために増やすことができる。補正された指数は、エンコードされた信号には含まれないが、2以上の第2の制御パラメータを決定するために量子化制御装置54により用いられる。トランスコーダ30が指数に同じ補正を行ったとき、結果として発生した浮動小数点で表現された数値が正確な指数値を表現するように、関連する仮数も補正する。
【0104】
(2)スペクトルの再生(HFR)
スペクトルの再生において、デコーダ24で用いられるデコーディング処理により、変換されたスペクトル成分を合成し、変換された成分に付加されるノイズに類似の成分も合成することができる。結果として、スペクトル再生処理により計算されたスペクトル成分を過剰正規化または不足正規化することが可能となる。変換された成分の量子化誤差に起因して、再生された成分も過剰正規化又は不足正規化することができる。合成モデル53は、再生処理に入力される仮数値と指数値の正確な値を算定することができるので、これらの正規化されない状態をテストすることができる。
【0105】
合成モデル53は、正規化が失われると判断した場合は、再生処理に入力される1つ又は両方の成分の指数を、過剰正規化を避けるために減らすことができ、不足正規化を避けるために増やすことができる。補正された指数は、エンコードされた信号には含まれないが、2以上の第2の制御パラメータを決定するために量子化制御装置54により用いられる。トランスコーダ30が指数に同じ補正を行ったとき、結果として発生した浮動小数点で表現された数値が正確な指数値を表現するように、関連する仮数も補正する。
【0106】
カップリング
結合されたチャンネル信号の合成処理において、結合されたチャンネル信号内の1以上のスペクトル成分に、ノイズに類似の成分をデコーダ24で用いられるデコーディング処理により合成することが可能である。結果として、合成処理により計算されたスペクトル成分を不足正規化することが可能となる。結合されたチャンネル信号におけるスペクトル成分の仮数における量子化誤差に起因して、合成された成分を不足正規化することもできる。合成モデル53は、逆マトリックスに入力される仮数と指数の正確な値を決定することができるので、このような正規化されない状態をテストすることができる。
【0107】
合成モデル53は、正規化が失われると判断した場合は、合成処理に入力される1つ又は両方の成分の指数を、不足正規化を避けるために増やすことができる。補正された指数は、エンコードされた信号には含まれないが、2以上の第2の制御パラメータを決定するために量子化制御装置54により用いられる。トランスコーダ30が指数に同じ補正を行ったとき、結果として発生した浮動小数点で表現された数値が正確な指数値を表現するように、関連する仮数も補正する。
【0108】
c)長所と短所
決定論的方法を行う処理は、最悪の場合を推定する方法を行う場合に比べて実施がより高価となる。しかし、これらの付加的な実施コストはエンコーディング伝送器に関し、もっと安価にトランスコーダに組み込むことができる。加えて、正規化されない仮数による不正確さは、避けること又は最小限に抑えることができ、決定論的方法により補正された指数に基づくマスキング曲線は、最悪の場合を推定する方法により計算されたマスキング曲線に比べてより正確である。
【0109】
C.実施
汎用コンピュータにあるのと同様の構成要素を組み合わせたディジタル信号処理(DSP)のようなより専門化した装置を含むコンピュータ又は他の装置により実行されるソフトウエアを含めた様々な方法により、本発明を様々な形態で実施することができる。図6は、本発明の実施の形態に用いることのできる装置70の構成概念図である。DSP72は計算手段を提供する。RAM73は信号処理のためにDSP72により用いられるランダムアクセスメモリ(RAM)システムである。ROM74は装置70を動作させるのに必要なプログラムを記録するためのリードオンリーメモリ(ROM)のような永続的な記憶装置を表し、本発明の様々な形態を実行する。I/O制御75は、通信チャンネル76,77の経路を通じて受信及び送信するインターフェース回路を表す。アナログオーディオ信号を受信及び/又は送信するために、アナログ・ディジタル変換器とディジタル・アナログ変換器とをI/O制御75に含めてもよい。図示の実施の形態において、全ての主な構成要素は、2以上の物理的なバスを表している場合もあるバス71につながっている。しかし、バス構造は本発明を実施するために必要なものではない。汎用コンピュータシステムで実行される実施の形態において、キーボードやマウス及びディスプレイのような装置とのインターフェースのため、及び、磁気テープ又はディスク、又は光媒体のような記憶媒体を有する記憶装置を制御するために構成要素を追加してもよい。記憶媒体は、オペレーティングシステム、ユーティリティ、及びアプリケーションへの指令のプログラムを記録するために用いてもよく、本発明の様々な特徴を実行するプログラムの形態を具備することができる。
【0110】
本発明の種々の特徴を実行する上で必要な機能は、個別論理素子、集積回路、1以上の特定用途向け集積回路、及び/又は、プログラム制御プロセッサを含む種々の方法で導入される構成要素により実行することができる。これらの構成要素を導入する態様については本発明にとって重要ではない。
【0111】
本発明のソフトウエアでの実施の形態は、ベース帯域又は超音波領域から紫外線領域の周波数を含むスペクトルにわたって変調した通信経路のような種々の機械的な読み取り媒体、又は磁気テープ、カード、又はディスク、光学カード又はディスク、紙のような媒体上の検出可能な表示を含む本資質的にあらゆる記録技術を用いて情報を伝達する記憶媒体により譲渡される。

【特許請求の範囲】
【請求項1】
エンコードされたオーディオ情報をトランスコーディングする方法であって、
第1の量子化されスケーリングされた値と、オーディオ信号のスペクトル成分を表現するスケールファクタとを伝達する第1のエンコードされた信号を受信するステップであって、第1のスケールファクタの各々は、1以上の第1の量子化されスケーリングされた値と関連付けられ、第1の量子化されスケーリングされた値の各々は、関連付けられた第1のスケールファクタによりスケーリングされ、第1の量子化されスケーリングされた値の各々及び関連付けられた第1のスケールファクタとがそれぞれスペクトル成分を表現することを特徴とするステップと、
前記第1のスケールファクタから第2のスケールファクタを導き出すステップであって、1以上の前記第2のスケールファクタは対応する第1のスケールファクタとは値が異なることを特徴とするステップと、
1以上の第1の制御パラメータに応答して第1のビット配置処理に従いビットを配置し、前記第1のビット配置処理により配置されたビット数に基づく量子化分解能に従い逆量子化することで前記第1の量子化されスケーリングされた値から逆量子化されスケーリングされた値を取得するステップと、
1以上の第2の制御パラメータに応答して第2のビット配置処理に従いビットを配置し、前記第2のビット配置処理により配置されたビット数に基づく量子化分解能を用いて逆量子化されスケーリングされた値を量子化することで前記第2の量子化されスケーリングされた値を取得するステップであって、各第2のスケールファクタは1以上の第2の量子化されスケーリングされた値と関連付けられ、各第2の量子化されスケーリングされた値は、関連付けられた第2のスケールファクタに従いスケーリングされ、各第2の量子化されスケーリングされた値及び関連付けられた第2のスケールファクタはそれぞれのスペクトル成分の値を表現することを特徴とするステップと、
前記第2の量子化されスケーリングされた値と、前記第2のスケールファクタと、1以上の第2の制御パラメータを第2のエンコードされた信号にアセンブルするステップと、
を具備するエンコードされたオーディオ情報をトランスコーディングする方法。
【請求項2】
前記第1のエンコードされた信号から1以上の第1の制御パラメータと1以上の第2の制御パラメータとを取得するステップを具備することを特徴とする請求項に記載の方法。
【請求項3】
前記1以上の第1の制御パラメータは、前記第1のエンコードされた信号のビットレート要件に応答して導き出され、前記1以上の第2の制御パラメータは、前記第2のエンコードされた信号のビットレート要件に応答して導き出されたことを特徴とする請求項に記載の方法。
【請求項4】
前記第2のスケールファクタと前記第2のエンコードされた信号のビットレート要件から、前記1以上の第2の制御パラメータを導き出すステップを具備することを特徴とする請求項に記載の方法。
【請求項5】
前記第1のビット配置処理は、前記第1のエンコードされた信号の第1のビットレートに従って行われ、前記第2のビット配置処理は、第1のビットレートに等しい前記第2のエンコードされた信号の第2のビットレートに従って行われることを特徴とする請求項に記載の方法。
【請求項6】
1以上の前記逆量子化されスケーリングされた値に応答するコーディング処理を行うことによりコード化されたスペクトル情報を生成するステップを具備することを特徴とする請求項に記載の方法。
【請求項7】
前記コーディング処理は、マトリックス化、逆マトリックス化、カップリング、デカップリング、スペクトル成分を再生するためのスケールファクタ形成、及び、スペクトル成分再生の中から、1以上のコーディング技術を実行することにより前記第2のスケールファクタを生成することを特徴とする請求項に記載の方法。
【請求項8】
エンコードされたオーディオ情報をトランスコーディングするトランスコーダであって、
第1の量子化されスケーリングされた値と、オーディオ信号のスペクトル成分を表現するスケールファクタとを伝達する第1のエンコードされた信号を受信する手段であって、第1のスケールファクタの各々は、1以上の第1の量子化されスケーリングされた値と関連付けられ、第1の量子化されスケーリングされた値の各々は、関連付けられた第1のスケールファクタによりスケーリングされ、第1の量子化されスケーリングされた値の各々及び関連付けられた第1のスケールファクタとがそれぞれスペクトル成分を表現することを特徴とする、手段と、
前記第1のスケールファクタから第2のスケールファクタを導き出す手段であって、1以上の前記第2のスケールファクタは対応する第1のスケールファクタとは値が異なることを特徴とする手段と、
1以上の第1の制御パラメータに応答して第1のビット配置処理に従いビットを配置し、前記第1のビット配置処理により配置されたビット数に基づく量子化分解能に従い逆量子化することで前記第1の量子化されスケーリングされた値から逆量子化されスケーリングされた値を取得する手段であって、各第2のスケールファクタは1以上の第2の量子化されスケーリングされた値と関連付けられ、各第2の量子化されスケーリングされた値は、関連付けられた第2のスケールファクタに従いスケーリングされ、各第2の量子化されスケーリングされた値及び関連付けられた第2のスケールファクタはそれぞれのスペクトル成分の値を表現することを特徴とする手段と、
1以上の第2の制御パラメータに応答して第2のビット配置処理に従いビットを配置し、前記第2のビット配置処理により配置されたビット数に基づく量子化分解能を用いて逆量子化されスケーリングされた値を量子化することで前記第2の量子化されスケーリングされた値を取得する手段と、
前記第2の量子化されスケーリングされた値と、前記第2のスケールファクタと、1以上の第2の制御パラメータを第2のエンコードされた信号にアセンブルする手段と、
を具備するトランスコーダ。
【請求項9】
前記第1のエンコードされた信号から1以上の第1の制御パラメータと1以上の第2の制御パラメータとを取得する手段を具備することを特徴とする請求項に記載のトランスコーダ。
【請求項10】
前記1以上の第1の制御パラメータは、前記第1のエンコードされた信号のビットレート要件に応答して導き出され、前記1以上の第2の制御パラメータは、前記第2のエンコードされた信号のビットレート要件に応答して導き出されたことを特徴とする請求項に記載のトランスコーダ。
【請求項11】
前記第2のスケールファクタと前記第2のエンコードされた信号のビットレート要件から、前記1以上の第2の制御パラメータを導き出すステップを具備することを特徴とする請求項に記載のトランスコーダ。
【請求項12】
前記第1のビット配置処理は、前記第1のエンコードされた信号の第1のビットレートに従って行われ、前記第2のビット配置処理は、第1のビットレートに等しい前記第2のエンコードされた信号の第2のビットレートに従って行われることを特徴とする請求項に記載のトランスコーダ。
【請求項13】
1以上の前記逆量子化されスケーリングされた値に応答するコーディング処理を行うことによりコード化されたスペクトル情報を生成する手段を具備することを特徴とする請求項に記載のトランスコーダ。
【請求項14】
前記コーディング処理は、マトリックス化、逆マトリックス化、カップリング、デカップリング、スペクトル成分を再生するためのスケールファクタ形成、及び、スペクトル成分再生の中から、1以上のコーディング技術を実行することにより前記第2のスケールファクタを生成することを特徴とする請求項13に記載のトランスコーダ。
【請求項15】
装置により実行できる命令のプログラムを伝達するための媒体であって、命令のプログラムを実行することにより、装置にオーディオ情報をトランスコーディングする方法を実行させ、該方法は、
第1の量子化されスケーリングされた値と、オーディオ信号のスペクトル成分を表現するスケールファクタとを伝達する第1のエンコードされた信号を受信するステップであって、第1のスケールファクタの各々は、1以上の第1の量子化されスケーリングされた値と関連付けられ、第1の量子化されスケーリングされた値の各々は、関連付けられた第1のスケールファクタによりスケーリングされ、第1の量子化されスケーリングされた値の各々及び関連付けられた第1のスケールファクタとがそれぞれスペクトル成分を表現することを特徴とする、ステップと、
前記第1のスケールファクタから第2のスケールファクタを導き出すステップであって、1以上の前記第2のスケールファクタは対応する第1のスケールファクタとは値が異なることを特徴とするステップと、
1以上の第1の制御パラメータに応答して第1のビット配置処理に従いビットを配置し、前記第1のビット配置処理により配置されたビット数に基づく量子化分解能に従い逆量子化することで前記第1の量子化されスケーリングされた値から逆量子化されスケーリングされた値を取得するステップと、
1以上の第2の制御パラメータに応答して第2のビット配置処理に従いビットを配置し、前記第2のビット配置処理により配置されたビット数に基づく量子化分解能を用いて逆量子化されスケーリングされた値を量子化することで前記第2の量子化されスケーリングされた値を取得するステップであって、各第2のスケールファクタは1以上の第2の量子化されスケーリングされた値と関連付けられ、各第2の量子化されスケーリングされた値は、関連付けられた第2のスケールファクタに従いスケーリングされ、各第2の量子化されスケーリングされた値及び関連付けられた第2のスケールファクタはそれぞれのスペクトル成分の値を表現することを特徴とするステップと、
前記第2の量子化されスケーリングされた値と、前記第2のスケールファクタと、1以上の第2の制御パラメータを第2のエンコードされた信号にアセンブルするステップと、
を具備する媒体。
【請求項16】
前記第1のエンコードされた信号から1以上の第1の制御パラメータと1以上の第2の制御パラメータとを取得するステップを具備することを特徴とする請求項15に記載の媒体。
【請求項17】
前記1以上の第1の制御パラメータは、前記第1のエンコードされた信号のビットレート要件に応答して導き出され、前記1以上の第2の制御パラメータは、前記第2のエンコードされた信号のビットレート要件に応答して導き出されたことを特徴とする請求項16に記載の媒体。
【請求項18】
前記第2のスケールファクタと前記第2のエンコードされた信号のビットレート要件から、前記1以上の第2の制御パラメータを導き出すステップを具備することを特徴とする請求項15に記載の媒体。
【請求項19】
前記第1のビット配置処理は、前記第1のエンコードされた信号の第1のビットレートに従って行われ、前記第2のビット配置処理は、第1のビットレートに等しい前記第2のエンコードされた信号の第2のビットレートに従って行われることを特徴とする請求項15に記載の媒体。
【請求項20】
1以上の前記逆量子化されスケーリングされた値に応答するコーディング処理を行うことによりコード化されたスペクトル情報を生成するステップを具備することを特徴とする請求項15に記載の媒体。
【請求項21】
前記コーディング処理は、マトリックス化、逆マトリックス化、カップリング、デカップリング、スペクトル成分を再生するためのスケールファクタ形成、及び、スペクトル成分再生の中から、1以上のコーディング技術を実行することにより前記第2のスケールファクタを生成することを特徴とする請求項20に記載の媒体。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate


【公開番号】特開2010−250328(P2010−250328A)
【公開日】平成22年11月4日(2010.11.4)
【国際特許分類】
【出願番号】特願2010−112800(P2010−112800)
【出願日】平成22年5月17日(2010.5.17)
【分割の表示】特願2006−503173(P2006−503173)の分割
【原出願日】平成16年1月30日(2004.1.30)
【出願人】(591102637)ドルビー・ラボラトリーズ・ライセンシング・コーポレーション (111)
【氏名又は名称原語表記】DOLBY LABORATORIES LICENSING CORPORATION
【Fターム(参考)】