離散値のシーケンスを有する信号を処理するための装置および方法

離散値のシーケンスを有する信号を処理する場合に、信号が高いエネルギーを有する第１の周波数範囲が存在し、信号が低いエネルギーを有する第２の周波数範囲が存在し、離散値のシーケンスは、処理値のうちの少なくとも１つは整数でないように、処理値のシーケンスを得るために、まず処理される（２０２）。その後、丸められた処理値のシーケンスを得るために、処理値のシーケンスは丸められる（２０４）。丸めは、スペクトル整形された丸めエラーが第２の周波数範囲におけるよりも高いエネルギーを第１の周波数範囲において有するように、生成された丸めエラーのスペクトル整形を生じさせるように形成される。丸めエラーが信号エネルギーの存在しないどの記憶領域においてもエネルギーを有しないように丸めエラーをスペクトル整形することにより、特に可逆な符号化の場合に関連して、特に効率的な符号化を得る。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、信号処理に関し、特定的には、音声サンプルまたは映像サンプルなどの、とりわけ可逆符号化用途に特に適した連続値の信号処理に関する。
【背景技術】
【０００２】
本発明は、音声および／または画像情報を備える離散値のための圧縮アルゴリズムにさらに適しており、ハフマンまたは演算符号化の形式を取るエントロピー符号化などの符号化に先行する、周波数領域または時間領域または位置領域における変換を含む符号化アルゴリズムに特に適している。
【０００３】
ＭＰＥＧＬａｙｅｒ３（ＭＰ３）またはＭＰＥＧＡＡＣなどの現代の音声符号化方法は、音声信号のブロック的な周波数表現を得るために、いわゆる変形離散コサイン変換（ＭＤＣＴ）などの変換を使用する。そのような音声符号器は、通常、時間離散音声サンプルのストリームを取得する。音声サンプルのストリームは、例えば１，０２４または２，０４８個の窓掛けされた音声サンプルを取得するために、窓掛けされる。窓掛けのためには、サインウィンドウなどの様々なウィンドウ関数が用いられる。
【０００４】
窓掛けされた時間離散音声サンプルは、その後、フィルタバンクによってスペクトル表現に変換される。原則として、フーリエ変換または、特殊な事情により、高速フーリエ変換（ＦＦＴ）または上述のＭＤＣＴのような多様なフーリエ変換がこのために用いられてもよい。フィルタバンクの出力における音声スペクトル値のブロックは、その後、必要に応じてさらに処理されてもよい。上記の音声符号器において、音声スペクトル値の量子化が続き、そこにおいて、量子化の段階は、典型的には、量子化によって生じた量子化ノイズが音響心理学上の遮蔽閾値を下回るように、すなわち、「遮蔽されるように」選ばれる。量子化は、非可逆符号化である。さらなるデータ量の削減を得るためには、量子化されたスペクトル値が、その後、例えばハフマン符号化によってエントロピー符号化される。スケール係数などの副次的な情報を加えることによって、エントロピー符号化された量子化スペクトル値からビットストリームマルチプレクサによってビットストリームが形成され、このビットストリームは、記憶または送信されてもよい。
【０００５】
音声復号器において、ビットストリームは、ビットストリームマルチプレクサによって、符号化された量子化スペクトル値と、副次的な情報とに分割される。エントロピー符号化された量子化スペクトル値は、まず、量子化スペクトル値を得るために、エントロピー復号化される。量子化スペクトル値は、その後、量子化ノイズを備える復号化されたスペクトル値を得るために、逆量子化されるが、これは、音響心理学上の遮蔽閾値を下回っているので、聞き取れない。これらのスペクトル値は、その後、時間離散復号化音声サンプルを得るために、合成フィルタバンクによって時間表現に変換される。合成フィルタバンクにおいて、変換アルゴリズムとは逆の変換アルゴリズムが用いられなければならない。さらに、窓掛けは、周波数時間逆変換後に逆にされなければならない。
【０００６】
良好な周波数選択性を実現するために、現代の音声符号器は、典型的には、ブロック重複を使用する。そのような一事例を図６ａに示す。まず、例えば２，０４８個の時間離散音声サンプルが、手段４０２によって取り込まれて窓掛けされる。ウィンドウ使用手段４０２は、２Ｎ個のサンプルというウィンドウ長を有し、２Ｎ個の窓掛けされたサンプルのブロックを出力側に与える。ウィンドウ重複を実現するために、２Ｎ個の窓掛けされたサンプルの第２のブロックが、手段４０４によって形成される。手段４０４は、図６ａでは、明確にするために手段４０２と別個に示されている。しかしながら、手段４０４へ与えられた２，０４８個のサンプルは、第１のウィンドウの直後に続く時間離散音声サンプルではなく、手段４０２によって窓掛けされたサンプルの後半を含み、１，０２４個の「新たな」サンプルを余分に含む。重複は、象徴的には、図６ａの手段４０６によって示されており、重複度は５０％となる。手段４０２によって出力された２Ｎ個の窓掛けされたサンプルおよび手段４０４によって出力された２Ｎ個の窓掛けされたサンプルは、その後、それぞれ、手段４０８および４１０によって、ＭＤＣＴアルゴリズムの処理を受ける。手段４０８は、既知のＭＤＣＴアルゴリズムに従って、第１のウィンドウについてＮ個のスペクトル値を与え、手段４１０も、第２のウィンドウについてＮ個のスペクトル値を与えるが、第２のウィンドウについては、第１のウィンドウおよび第２のウィンドウとの５０％の重複がある。
【０００７】
復号器において、図６ｂに示すように、第１のウィンドウのＮ個のスペクトル値が、逆変形離散コサイン変換を行う手段４１２に与えられる。同じことが、第２のウィンドウのＮ個のスペクトル値にも適用される。それらは、同じく逆変形離散コサイン変換を行う手段４１４に与えられる。手段４１２および／または手段４１４は共に、それぞれ、第１のウィンドウについて２Ｎ個のサンプルを、第２のウィンドウについて２Ｎ個のサンプルを与える。
【０００８】
図６ｂの手段４１６、指定されたＴＤＡＣ（時間領域エイリアシングキャンセル）において、２つのウィンドウが重なり合っている旨が考慮される。特に、第１のウィンドウの後半のサンプルｙ₁、すなわち、指数Ｎ＋ｋが付されたものが、第２のウィンドウの前半のサンプルｙ₂、すなわち、指数ｋが付されたものと合計されて、Ｎ個の復号化された時間的なサンプルが、出力側、すなわち、復号器にあるようにする。
【０００９】
注意すべきなのは、加算機能とも称される手段４１６の機能によって、図６ａに概略的に示す符号化における窓掛けが、ある程度自動的に考慮され、図６ｂに示す復号器において、明示的な「逆窓掛け」が生じる必要がない。
【００１０】
手段４０２または４０４によって実施されるウィンドウ機能をｗ（ｋ）で示し、インデックスｋが時間インデックスを表すとすると、ｋを０からｎ−１の範囲として、二乗ウィンドウ重みｗ（Ｎ＋ｋ）に加算された二乗のウィンドウ重みｗ（ｋ）は共に１であるという条件が満たされなければならない。ウィンドウ重み付けがサイン関数の前半波に続くサインウィンドウを使用すると、この条件は常に満たされる。なぜなら、サインの二乗とコサインの二乗との和は、各角について値１という結果となるからである。
【００１１】
図６ａに記載する後続のＭＤＣＴ関数を伴うウィンドウ方法において、サインウィンドウを考えた場合に、時間離散サンプルの乗算による窓掛けは浮動少数点数で実現されるという欠点がある。なぜならば、０から１８０度の間の角の正弦は、９０度の角を除いて、整数を生じさせないからである。整数時間離散サンプルが窓掛けされる場合でも、浮動小数点が窓掛け後に生じる。
【００１２】
したがって、たとえ音響心理学的な符号器を使用しなくても、すなわち、可逆符号化を達成するには、合理的に管理可能なエントロピー符号化を行うことができるように、手段４０８および４１０の出力においてそれぞれ量子化が必要となる。
【００１３】
一般的に、可逆音声および／または映像符号化のための現在知られている整数変換は、そこで使用される変換をギブンズ回転に分解して、各ギブンズ回転にリフティングスキームを適用することによって取得される。よって、丸めエラーが各ステップに生じる。ギブンズ回転の後続段については、丸めエラーは蓄積され続ける。特に、重複および加算を伴う既知のＭＤＣＴ（ＭＤＣＴ＝変形離散コサイン変換）における場合のような、例えば１，０２４個のスペクトル値を与える長い変換が使用されると、結果として生じる概算のエラーは、特に可逆音声符号化への取り組みに関して問題となる。特により高い周波数範囲において、音声信号は、典型的には、非常に低いエネルギーを有するので、概算のエラーは実際の信号よりすぐに大きくなる場合があり、この取り組みは、可逆符号化に関して、特に達成されるだろう符号化効率に関して問題となる。
【００１４】
音声符号化に関して、整数変換、すなわち整数出力値を生成する変換アルゴリズムは、特に、直流成分を考慮しない既知のＤＣＴ−ＩＶに基づく一方で、画像用途の整数変換は、むしろ、直流成分対応を特に含むＤＣＴ−ＩＩに基づく。そのような整数変換は、例えば、Ｙ．ゼン（Ｚｅｎｇ）、Ｇ．ビ（Ｂｉ）、Ｚ．リン（Ｌｉｎ）著、「リフティング因数分解に基づく整数正弦波変換（Ｉｎｔｅｇｅｒｓｉｎｕｏｓｉｄａｌｔｒａｎｓｆｏｒｍｓｂａｓｅｄｏｎｌｉｆｔｉｎｇｆａｃｔｏｒｉｚａｔｉｏｎ）」、国際音響スピーチおよび信号処理学会（ＩＣＡＳＳＰ）会報’０１、２００１年５月、１，１８１〜１，１８４頁、Ｋ．Ｋｏｍａｔｓｕ、Ｋ．Ｓｅｚａｋｉ著、「可逆性離散コサイン変換（ＲｅｖｅｒｓｉｂｌｅＤｉｓｃｒｅｔｅＣｏｓｉｎｅＴｒａｎｓｆｏｒｍ）」、国際音響スピーチおよび信号処理学会（ＩＣＡＳＳＰ）会報、１９９８年、第３巻、１，７６９〜１，７７２頁、Ｐ．ハオ（Ｈａｏ），Ｑ．シ（Ｓｈｉ）著、「可逆性整数マッピングのための行列因数分解（Ｍａｔｒｉｘｆａｃｔｏｒｉｚａｔｉｏｎｓｆｏｒｒｅｖｅｒｓｉｂｌｅｉｎｔｅｇｅｒｍａｐｐｉｎｇ）」、ＩＥＥＥ会報、信号処理、信号処理、第４９巻、２，３１４〜２，３２４頁、ならびにＪ．ワング（Ｗａｎｇ），Ｊ．スン（Ｓｕｎ）、およびＳ．ユ（Ｙｕ）著、「整数から整数への一次元および二次元変換（１−ｄａｎｄ２−ｄｔｒａｎｓｆｏｒｍｓｆｒｏｍｉｎｔｅｇｅｒｔｏｉｎｔｅｇｅｒｓ）」、国際音響スピーチおよび信号処理学会（ＩＣＡＳＳＰ）会報’０３、香港、２００３年４月において知られている。
【００１５】
上述のように、説明した整数変換は、変換をギブンズ回転に分解すること、および既知のリフティングスキームをギブンズ回転に適用することに基づいており、その結果、累積丸めエラーの問題が生じる。これは、特に、変換内において、丸めを何度も、すなわち、各リフティングステップ後に行なわれなければならず、特に、長い変換においては、対応する数多くのリフティングステップが生じるので、とりわけ数多くの丸めが必要となる。上述のように、この結果、累積エラーが生じ、また、特に比較的複雑な処理が生じる。なぜならば、丸めは、次のリフティングステップを行うために、各リフティングステップ後に行われるからである。
【００１６】
続いて、ＭＤＣＴ窓掛けの分解が、独国特許出願公開第１０１２９２４０号に記載されているような、図９から１１に関連して示される。リフティング行列および対応する丸めでＭＤＣＴ窓掛けをギブンズ回転に分解することは、完全な整数ＭＤＣＴ近似、すなわち、本発明に係る整数ＭＤＣＴ（ＩｎｔＭＤＣＴ）を得るために、変換に関しては図１で、逆変換に関しては図２で説明する考え方と好都合に組み合わせることができる。順方向および逆方向変換の考え方は、ＭＤＣＴの例について与えられている。
【００１７】
図３は、Ｉｎｔ−ＭＤＣＴ整数変換アルゴリズムが動作可能な基礎となる整数値を得るために、音声信号を表わす時間離散サンプルを処理するための進歩的な好ましい装置についての概要図を示す。時間離散サンプルは、図３に示す装置によって窓掛けされ、必要に応じてスペクトル表現に変換される。装置の入力１０に供給される時間離散サンプルは、２Ｎ個の時間離散サンプルに対応する長さを有するウィンドウｗで窓掛けされて、出力１２において、変換、特に整数ＤＣＴを行うための手段１４によってスペクトル表現に変換するに適した整数窓掛けされたサンプルを実現する。整数ＤＣＴは、Ｎ個の出力値をＮ個の入力値から生成するように設計されており、これは、ＭＤＣＴ式のためにＮ個のスペクトル値を２Ｎ個の窓掛けされたサンプルから生成する図６ａのＭＤＣＴ関数と対照的である。
【００１８】
時間離散サンプルの窓掛けについて、時間離散サンプルのベクトルを共に表す最初の２つの時間離散サンプルが、手段１６で選択される。手段１６によって選択された時間離散サンプルは、ウィンドウの第１の４分の１内にある。他の時間離散サンプルは、図５に関してさらに詳細に説明するように、ウィンドウの第２の４分の１内にある。ここで、手段１６によって生成されたベクトルは、２×２の大きさの回転行列が与えられており、この動作は直接ではなく、いくつかのいわゆるリフティング行列によって行われる。
【００１９】
リフティング行列は、ウィンドウＷに基づく、「１」または「０」と等しくない１つの要素のみを備えるという性質を有する。
【００２０】
リフティングステップにおけるウェーブレット変換の因数分解は、専門刊行物である「リフティングステップへの因数分解ウェーブレット変換（ＦａｃｔｏｒｉｎｇＷａｖｅｌｅｔＴｒａｎｓｆｏｒｍｓＩｎｔｏＬｉｆｔｉｎｇＳｔｅｐｓ）」、イングリッド・ドーベチーズ（ＩｎｇｒｉｄＤａｕｂｅｃｈｉｅｓ）およびウィム・スウェルデンズ（ＷｉｍＳｗｅｌｄｅｎｓ）、前刷り、ベル研究所（ＢｅｌｌＬａｂｏｒａｔｏｒｉｅｓ）、ルーセントテクノロジーズ（ＬｕｃｅｎｔＴｅｃｈｎｏｌｏｇｉｅｓ）、１９９６年に提示されている。一般的に、リフティングスキームは、同一の低域通過および高域通過フィルタを有する完全再構築フィルタ対間の単純な関係である。相補フィルタの各対は、リフティングステップに因数分解される。これは、特にギブンズ回転に当てはまる。多相行列がギブンズ回転である場合を考える。そして、以下が当てはまる。

等号の右側の項にある３つのリフティング行列は、それぞれ、値「１」を主対角要素として有している。さらに、各リフティング行列において、０に等しい副対角要素と、回転角αに依存する副対角要素とがある。
【００２１】
ここで、ベクトルは、第３のリフティング行列、すなわち、第１の結果ベクトルを得るために、上記式の右端のリフティング行列によって乗算される。このことは、図３の手段１８によって図示されている。ここで、第１の結果ベクトルは、図３の手段２０によって図示するように、実数の組を整数の組にマッピングする任意の丸め関数で丸められる。手段２０の出力において、丸められた第１の結果ベクトルが得られる。丸められた第１の結果ベクトルは、今度は、それを中央、すなわち、第２の結果ベクトルを得るために、第２のリフティング行列で乗算するための手段２２に供給されて、第２の結果ベクトルは、丸められた第２の結果ベクトルを得るために、手段２４によって再び丸められる。丸められた第２の結果ベクトルは、今度は、上記式の左に示すリフティング行列、すなわち、第３の結果ベクトルを得るために、最初のものによって乗算するための手段に供給されて、最終的に出力１２において整数窓掛けされたサンプルを得るために、第３の結果ベクトルは、最終的に手段２８によって丸められて、そのスペクトル表現が所望されれば、スペクトル出力３０において整数スペクトル値を得るために、手段１４によって処理される。
【００２２】
好ましくは、手段１４は、整数ＤＣＴとして実施される。
【００２３】
長さＮを有するタイプ４に係る離散コサイン変換（ＤＣＴ−ＩＶ）は、以下の式によって与えられる。

ＤＣＴ−ＩＶの係数は、正規直交のＮ×Ｎ行列を形成する。各直交Ｎ×Ｎ行列は、Ｎ（Ｎ−１）／２のギブンズ回転に分解されてもよく、このことは、専門刊行物であるＰ．Ｐ．バイダイアナサン（Ｖａｉｄｙａｎａｔｈａｎ）著、「マルチレートシステムおよびフィルタバンク（ＭｕｌｔｉｒａｔｅＳｙｓｔｅｍｓＡｎｄＦｉｌｔｅｒＢａｎｋｓ）」、プレンティス・ホール（ＰｒｅｎｔｉｃｅＨａｌｌ）、イングルウッド・クリフス（ＥｎｇｌｅｗｏｏｄＣｌｉｆｆｓ）、１９９３年に説明されている通りである。他の分解も存在することに注意すべきである。
【００２４】
様々なＤＣＴアルゴリズムの分類に関しては、Ｈ．Ｓ．マルバー（Ｍａｌｖａｒ）著、「重複変換を伴う信号処理（ＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇＷｉｔｈＬａｐｐｅｄＴｒａｎｓｆｏｒｍｓ）」、アーテック・ハウス（ＡｒｔｅｃｈＨｏｕｓｅ）、１９９２年を参照されたい。一般的に、ＤＣＴアルゴリズムは、それらの基礎となる関数の種類が異なる。本明細書において好ましいＤＣＴ−ＩＶは、非対称を基本とする関数、すなわち、コサイン４分の１波、コサイン４分の３波、コサイン４分の５波、コサイン４分の７波などを含み、例えばタイプＩＩ（ＤＣＴ−ＩＩ）の離散コサイン変換は、軸対象かつ点対称を基本とする関数を有する。０番目を基本とする関数は、直流成分を有し、第１の基本関数は、余弦波の半分であり、第２の基本関数は、全余弦波等である。ＤＣＴ−ＩＩは、直流成分に特に重点をおいているという事実により、映像符号化において使用されるが、音声符号化においては使用されない。なぜなら、直流成分は、映像符号化とは異なり、音声符号化においては適切ではないからである。
【００２５】
以下では、ギブンズ回転の回転角αがウィンドウ関数にどのように依存するかを説明する。
【００２６】
２Ｎのウィンドウ長を有するＭＤＣＴは、長さＮを有するタイプＩＶの離散コサイン変換に低減されてもよい。これは、時間領域においてＴＤＡＣ動作を明示的に行い、その後ＤＣＴ−ＩＶを適用することによって実現される。５０％の重複の場合、ブロックｔについてのウィンドウの左半分は、先のブロック、すなわち、ブロックｔ−１の右半分と重なる。２つの連続するブロックｔ−１およびｔの重複部分は、時間領域において、すなわち、下記の変換の前に前処理が行われ、すなわち、図３の入力１０および出力１２の間で処理される。

波形記号で示す値は、図３の出力１２における値であり、上記式中で波形記号で示さないｘ値は、入力１０および／または後続の選択のための手段１６における値である。実行指標ｋは、０からＮ／２−１までの範囲であり、ｗは、ウィンドウ関数を表す。
【００２７】
ウィンドウ関数ｗのためのＴＤＡＣ条件から、以下が当てはまる。

【００２８】
ある角度α_kであって、ｋ＝０，．．．，Ｎ／２−１の場合、時間領域におけるこの前処理は、以下に説明するように、ギブンズ回転として記述されてもよい。
【００２９】
ギブンズ回転の角度αは、以下のように、ウィンドウ関数ｗに依存する。

α＝ａｒｃｔａｎ［ｗ（Ｎ／２−１−ｋ）／ｗ（Ｎ／２＋ｋ）］（５）

このＴＤＡＣ条件を満たすならば、任意のウィンドウ関数ｗを使用してもよいことに注意すべきである。
【００３０】
以下では、図４に関するカスケード式符号器および復号器を説明する。ウィンドウによってまとめて「窓掛け」されている時間離散サンプルｘ（０）からｘ（２Ｎ−１）が、まず図３の手段１６によって選択され、サンプルｘ（０）およびサンプルｘ（Ｎ−１）、すなわち、ウィンドウの１番目の４分の１からのサンプルおよびウィンドウの２番目の４分の１からのサンプルが選択されて手段１６の出力においてベクトルを形成するようにする。交差する矢印は、ＤＣＴ−ＩＶブロックの入力において整数窓掛けされたサンプルを取得するための、手段１８，２０および２２，２４および２６，２８のリフティング乗算および後続の丸めを概略的に表す。
【００３１】
第１のベクトルが上述のように処理されると、第２のベクトルが、サンプルｘ（Ｎ／２−１）およびｘ（Ｎ／２）、すなわち、同じくウィンドウの１番目の４分の１からのサンプルおよびウィンドウの２番目の４分の１からのサンプルからさらに選択され、同じく図３で説明したアルゴリズムによって処理される。同様に、ウィンドウの１番目および２番目の４分の１からのすべての他のサンプル対が処理される。同じ処理が、第１のウィンドウの第３番目および第４番目の４分の１に対して行われる。ここで、２Ｎ個の窓掛けされた整数サンプルが出力１２に存在し、そこには、図４に示すようなＤＣＴ−ＩＶ変換に供給される。特に、第２番目および第３番目の４分の１の整数窓掛けされたサンプルは、ＤＣＴへ供給される。ウィンドウの第１番目の４分の１の窓掛けされた整数サンプルは、処理されて、先行するウィンドウの第４番目の４分の１の窓掛けされた整数サンプルを伴う先行するＤＣＴ−ＩＶとなる。同様に、図４において、窓掛けされた整数サンプルの４番目の４分の１が、次のウィンドウの第１の４分の１と共にＤＣＴ−ＩＶ変換に供給される。図４に示す中央の整数ＤＣＴ−ＩＶ変換３２は、ここで、Ｎ個の整数スペクトル値ｙ（０）からｙ（Ｎ−１）を与える。ここで、これらの整数スペクトル値は、例えば、量子化を介在させる必要なく、単にエントロピー符号化されてもよい。なぜならば、窓掛けおよび変換により、整数出力値が生じるからである。
【００３２】
図４の右半分において、復号器を示す。逆方向変換および「逆窓掛け」からなる復号器は、符号器とは逆に動作する。図４に示すように、逆ＤＣＴ−ＩＶをＤＣＴ−ＩＶの逆方向変換のために使用してもよいことが知られている。ここで、復号器ＤＣＴ−ＩＶ３４の出力値は、図４に示すように、先の変換および／または後続の変換の対応値と共に逆に処理される。これは、手段３４および／または先のおよび後続の変換の出力において、整数窓掛けされたサンプルから時間離散音声サンプルｘ（０）からｘ（２−Ｎ１）を同様に生成するためである。
【００３３】
出力側の動作は、逆ギブンズ回転によって生じる。すなわち、ブロック２６，２８および２２，２４および１８，２０が、それぞれ、反対方向に向きが変えられる。これを、式１の第２のリフティング行列に関してより詳細に説明する。（符号器において）第２の結果ベクトルが、第２のリフティング行列（手段２２）による丸められた第１の結果ベクトルの乗算によって形成されると、以下の式が生じる。

式６の右側の値ｘ，ｙは整数である。しかしながら、これはｘｓｉｎαには当てはまらない。ここで、以下の式において示すような丸め関数ｒを導入しなければならない。

この演算は、手段２４によって行われる。
（復号器における）逆マッピングは、以下のように規定される。

丸め動作の前の減法記号により、リフティングステップの整数近似はエラーを生じさせずに反転されてもよいことが明らかになる。この近似を３つのリフティングステップそれぞれに適用すると、ギブンズ回転の整数近似となる。（符号器における）丸められた回転は、逆丸めリフティングステップを逆方向に向きを変えることによって、すなわち、復号化において、図３のアルゴリズムが下から上へ行われれば、エラーを生じさせずに（復号器において）反転させてもよい。
【００３４】
丸め関数ｒが点対称であれば、逆丸め回転は、角度−αを伴う丸め回転と同一となり、以下のように表される。

この場合の復号器のための、すなわち、逆ギブンズ回転のためのリフティング行列は、式「ｓｉｎα」を式「−ｓｉｎα」に単に置き換えることによって、式（１）から直接生じる。
【００３５】
以下では、図５に関して、共通のＭＤＣＴの重複ウィンドウ４０から４６での分解を再び説明する。ウィンドウ４０から４６は、それぞれ、５０％の重複を有する。まず、矢印４８によって模式的に示すように、ギブンズ回転が、ウィンドウの第１番目および第２番目の４分の１、および／またはウィンドウの第３番目および第４番目の４分の１内で、ウィンドウ毎に行われる。その後、回転された値、すなわち、窓掛けされた整数サンプルは、ウィンドウの第２番目および第３番目の４分の１と、後続のウィンドウの第４番目と第１番目の４分の１とが常に、それぞれ、ＤＣＴ−ＩＶアルゴリズムによってまとめてスペクトル表現に変換されるように、Ｎ対ＮのＤＣＴに供給される。
【００３６】
したがって、共通のギブンズ回転は、順次実行されるリフティング行列に分解され、各リフティング行列乗算の後に丸めステップが挿入される。これにより、結果ベクトルをリフティング行列で乗算する前に、結果ベクトルが整数のみを有するようにするために、浮動小数点数が生成直後に丸められるようにしている。
【００３７】
よって、出力値は、常に整数のままであり、しかも整数入力値を使用するのが好ましい。これは、制限を表すものではない。なぜならば、ＣＤに典型的なＰＣＭサンプルの例は、値の範囲がビット幅に依存して、すなわち、時間離散デジタル入力値が１６ビット値であるか、または２４ビット値であるかに依存して変換する整数値だからである。それにもかかわらず、処理全体は、上述のように、逆回転を逆順に行うことにより可逆的である。よって、ＭＤＣＴの整数近似は、完全な復元、すなわち可逆変換となる。
【００３８】
図示の変換は、浮動小数点値の代わりに整数出力値を提供する。それは、順方向、そして逆方向変換が行われる際にエラーが生じないように、完全な復元を提供する。本発明の好ましい実施形態によれば、変換は、変形離散コサイン変換の代替物である。しかしながら、回転への分解および回転のリフティングステップへの分解が可能であれば、整数を使用して他の変換方法を行ってもよい。
【００３９】
整数ＭＤＣＴは、ＭＤＣＴの有利な性質の多くを有する。それは、重複構造を有し、それにより、重複しないブロック変換よりも良好な周波数選択性が得られる。変換前に窓掛けにおいて既に考慮しているＴＤＡＣ機能により、音声信号を表わすスペクトル値の総数が入力サンプルの総数と同一であるように、重要なサンプリングが維持される。
【００４０】
浮動小数点サンプルを与える通常のＭＤＣＴと比較して、上述の好ましい整数変換は、通常のＭＤＣＴと比較して、信号レベルがあまりないスペクトル範囲においてのみノイズが上昇する一方で、このノイズの上昇は、重要な信号レベルにおいて顕著とはならないことを示す。しかしながら、整数処理は、効率的なハードウェアによる実施のために示唆される。なぜなら、ハードウェアによって簡易にかつ迅速に実施されるシフト／加算ステップに容易に分解できるような乗算ステップのみを使用するからである。当然ながら、ソフトウェアによる実施も可能である。
【００４１】
整数変換は、音声信号の良好なスペクトル表現を提供し、しかも整数領域に留まったままである。音声信号の音質部分に適用されると、エネルギーを良好に集中させることとなる。これにより、図３に示す窓掛け／変換をエントロピー符号器で単にカスケード接続することによって、効率的な可逆符号化手法が構築されてもよい。特に、ＭＰＥＧＡＡＣにおいて用いられているようなエスケープ値を使用するスタック化符号化が有利である。所望する符号テーブルに適合するように、２の何らかの累乗によってすべての値を縮小し、その後、省略された最小桁のビットを追加的に符号化することが好ましい。より大きな符号テーブルを使用する代案に比べて、上述の代案は、符号テーブルを記憶するための記憶装置の消費に関して、より有利である。最小桁のビットのうちのいくつかを単に省略することによって、可逆の符号器も得られる。
【００４２】
特に音質信号について、整数スペクトル値のエントロピー符号化によって、高い符号化ゲインが得られる。信号の過渡的な部分については、符号化ゲインは低い。すなわち、過渡的な信号はスペクトルが平坦であり、すなわち、スペクトル値は０に等しいかそれに近いという小さな値だからである。しかしながら、Ｊ．ヘア（Ｈｅｒｒｅ），Ｊ．Ｄ．ジョンストン（Ｊｏｈｎｓｔｏｎ）著、「時間的ノイズ整形（ＴＮＳ）を使用することによる知覚音声符号器の性能の拡大（ＥｎｈａｎｃｉｎｇｔｈｅＰｅｒｆｏｒｍａｎｃｅｏｆＰｅｒｃｅｐｔｕａｌＡｕｄｉｏＣｏｄｅｒｓｂｙＵｓｉｎｇＴｅｍｐｏｒａｌＮｏｉｓｅＳｈａｐｉｎｇ（ＴＮＳ））」、第１０１回音声技術協会大会、ロス・アンジェルス、１９９６年、前刷り、４３８４に説明されているように、周波数領域における線形予測を使用することにより、この平坦性を使用してもよい。一代案は、開ループでの予測である。他の代案は、閉ループでの予測器である。第１の代案、すなわち、開ループでの予測器は、ＴＮＳとも呼ばれる。予測後の量子化により、結果生じる量子化ノイズを音声信号の時間的構成に適合させることになり、よって、音響心理的な音声符号器におけるプレエコーを防止する。可逆音声符号化については、第２の代案、すなわち、閉ループでの予測器がより適切である。なぜならば、閉ループでの予測により、入力信号を正確に再構築できるからである。この手法が生成されたスペクトルに適用されると、丸めステップは、整数領域に留まるためには、予測フィルタの各ステップ後に行われなければならない。逆フィルタおよび同じ丸め関数を使用することにより、元のスペクトルは、正確に再生されてもよい。
【００４３】
データを削減するための２つのチャンネル間の重複を利用するためには、π／４の角度の丸め回転を使用する場合に、中央側の符号化が、可逆な方法で用いてもよい。ステレオ信号の左および右のチャンネルの合計および差を計算する代案に比較して、丸め回転は、エネルギー変換の利点を有する。標準的なＭＰＥＧＡＡＣにおいても行われるように、いわゆる結合ステレオ符号化手法を使用することで、帯域毎にスイッチオンまたはオフしてもよい。２つのチャンネル間の重複をより柔軟に削減することができるように、さらなる回転角度を考慮してもよい。
【００４４】
特に、図３に関して示す変換の考え方は、ＭＤＣＴの整数による実施、すなわちＩｎｔＭＤＣＴを提供し、これは、順方向変換および後続の逆方向変換に関して可逆で動作する。丸めステップ２０，２４，２８および整数ＤＣＴにおける対応丸めステップ（図３におけるブロック１４）によって、整数処理、すなわち、例えばリフティング行列での浮動小数点乗算（図３におけるブロック１８，２２，２６）整数処理によって生成されたものよりもより大まかに量子化された値での処理が、さらに常に可能である。
【００４５】
その結果、ＩｎｔＭＤＣＴ全体が、計算に関して効率的に行われてもよい。
【００４６】
このＩｎｔＭＤＣＴの可逆性、または、一般的には、可逆と呼ばれる全ての符号化アルゴリズムの可逆性は、信号が符号化信号を実現するために符号化された後に符号化／復号化信号を実現するために再び復号化される場合に、元信号と全く同様に「見える」という事実に関連する。言い換えれば、元信号は、符号化／復号化された元信号と同一である。これは、音響心理学的原理における音声符号化処理の場合において、符号化処理および特に音響心理学的モデルによって制御された量子化処理によってデータが回復不可能に失われる、いわゆる非可逆の符号化とは明らかに対照的である。
【００４７】
当然ながら、丸めエラーが依然として生じる。よって、図３に関して示すように、ブロック２０，２４，２８において、逆演算が行われる場合に復号器において「除去」されるしかない丸めエラーを当然生じさせる丸め処理が行われる。そのような可逆符号化／復号化の考え方は、非可逆の符号化／復号化の考え方とは以下の点で本質的に異なる。可逆符号化／復号化の考え方においては、丸めエラーは、再び削除される可能性があるように生じるが、非可逆の符号化／復号化の考え方においてはそうではない。
【００４８】
しかしながら、符号化信号を考える場合、すなわち、変換符号器の例の場合における時間的なサンプルのブロックのスペクトルを考える場合、順方向変換の丸め、および／または、一般的にそのような信号の量子化は、信号においてエラーが生じさせることになる。よって、信号の理想的なエラーのないスペクトルに丸めエラーが重畳され、このエラーは、典型的には、例えば図３の場合には、考慮されたスペクトル範囲の全ての周波数成分を均等に含むホワイトノイズである。よって、理想的なスペクトルに重畳されたこのホワイトノイズは、例えば、窓掛け中にブロック２０，２４，２８における丸め、すなわち、ブロック１４における実際のＤＣＴ以前の信号の前処理によって生じる丸めエラーを表す。特に注意すべきなのは、可逆の要件のためには、丸めエラー全体が必ず符号化されなければならず、すなわち、復号器に送信されなければならない。なぜならば、復号器は、正確な可逆再構築を達成するには、符号器において生じた丸めエラー全体を必要とするからである。
【００４９】
丸めエラーは、スペクトル表現で何も「行わない」場合、すなわち、スペクトル表現が正しく一致する逆復号器によって記憶、送信、および再び復号化されるだけの場合には、問題とならないことがある。その場合には、可逆基準は、スペクトルにどれほどの丸めエラーが生じたかに関係なく、いつも満たされる。しかしながら、スペクトル表現で何かを行う場合、すなわち、丸めエラーを含む元信号の理想的なスペクトル表現で何かを行う場合には、例えば拡張性層が生成される場合など、丸めエラーが少なければ、これらのこと全てはよりよく働く。
【００５０】
よって、一方では、信号は特殊な復号器によって可逆で再構築可能であるべきであるが、しかしながら、理想的でない可逆復号器にスペクトル表現を与えるような、または変倍層などを生成できるような柔軟性を保つために、信号はそのスペクトル表現に最小限の丸めエラーを含むべきであるという、可逆符号化／復号化における要件もある。
【００５１】
上述のように、丸めエラーは、考慮するスペクトル全体に渡るホワイトノイズとして表現される。他方、特に、可逆のためには特に興味深いような、高品質の応用例において、すなわち、９６ｋＨｚなどの非常に高いサンプリング周波数の音声による応用例において、音声信号は、あるスペクトル範囲内に合理的な信号内容を有するだけであり、その範囲は、典型的には、せいぜい２０ｋＨｚまでである。典型的には、音声信号のほとんどの信号エネルギーが集中する範囲は、０から１０ｋＨｚの範囲となるのに対して、１０ｋＨｚを上回る範囲においては、信号エネルギーは大幅に減少することになる。しかしながら、これは、丸めによって生じたホワイトノイズには問題とならない。それは、信号エネルギーの考慮されたスペクトル範囲全体に渡って自身を重畳する。その結果、スペクトル範囲、すなわち、典型的には音声信号エネルギーがまったくないかほんのわずかに過ぎない高いスペクトル範囲において、丸めエラーがあるだけである。同時に、特にその非決定論的性質により、丸めエラーは、符号化が困難でもある。すなわち、比較的高いビット条件で符号化可能なだけである。ビット条件は、特にある可逆応用例においては、決定的な役割を果たさない。しかしながら、可逆符号化の応用例がますます普及しているので、非常に重要なのは、ここでも非常に高いビット効率で動作して、可逆応用例において固有である、品質低下がないという利点を、非可逆の符号化の考え方から知られているような対応するビット効率性と組み合わせることである。
【００５２】
【特許文献１】独国特許出願公開第１０１２９２４０号
【非特許文献１】Ｙ．ゼン（Ｚｅｎｇ）、Ｇ．ビ（Ｂｉ）、Ｚ．リン（Ｌｉｎ）著、「リフティング因数分解に基づく整数正弦波変換（Ｉｎｔｅｇｅｒｓｉｎｕｏｓｉｄａｌｔｒａｎｓｆｏｒｍｓｂａｓｅｄｏｎｌｉｆｔｉｎｇｆａｃｔｏｒｉｚａｔｉｏｎ）」、国際音響スピーチおよび信号処理学会（ＩＣＡＳＳＰ）会報’０１、２００１年５月、１，１８１〜１，１８４頁
【非特許文献２】Ｋ．Ｋｏｍａｔｓｕ、Ｋ．Ｓｅｚａｋｉ著、「可逆性離散コサイン変換（ＲｅｖｅｒｓｉｂｌｅＤｉｓｃｒｅｔｅＣｏｓｉｎｅＴｒａｎｓｆｏｒｍ）」、国際音響スピーチおよび信号処理学会（ＩＣＡＳＳＰ）会報、１９９８年、第３巻、１，７６９〜１，７７２頁
【非特許文献３】Ｐ．ハオ（Ｈａｏ），Ｑ．シ（Ｓｈｉ）著、「可逆性整数マッピングのための行列因数分解（Ｍａｔｒｉｘｆａｃｔｏｒｉｚａｔｉｏｎｓｆｏｒｒｅｖｅｒｓｉｂｌｅｉｎｔｅｇｅｒｍａｐｐｉｎｇ）」、ＩＥＥＥ会報、信号処理、信号処理、第４９巻、２，３１４〜２，３２４頁
【非特許文献４】Ｊ．ワング（Ｗａｎｇ），Ｊ．スン（Ｓｕｎ）、およびＳ．ユ（Ｙｕ）著、「整数から整数への一次元および二次元変換（１−ｄａｎｄ２−ｄｔｒａｎｓｆｏｒｍｓｆｒｏｍｉｎｔｅｇｅｒｔｏｉｎｔｅｇｅｒｓ）」、国際音響スピーチおよび信号処理学会（ＩＣＡＳＳＰ）会報’０３、香港、２００３年４月
【非特許文献５】Ｊ．ヘア（Ｈｅｒｒｅ），Ｊ．Ｄ．ジョンストン（Ｊｏｈｎｓｔｏｎ）著、「時間的ノイズ整形（ＴＮＳ）を使用することによる知覚音声符号器の性能の拡大（ＥｎｈａｎｃｉｎｇｔｈｅＰｅｒｆｏｒｍａｎｃｅｏｆＰｅｒｃｅｐｔｕａｌＡｕｄｉｏＣｏｄｅｒｓｂｙＵｓｉｎｇＴｅｍｐｏｒａｌＮｏｉｓｅＳｈａｐｉｎｇ（ＴＮＳ））」、第１０１回音声技術協会大会、ロス・アンジェルス、１９９６年、前刷り、４３８４
【発明の開示】
【課題を解決するための手段】
【００５３】
本発明の目的は、信号を処理するための効率的な考え方を提供することである。
【００５４】
この目的は、離散値のシーケンスを有する信号を処理するための請求項１に記載の装置、離散値のシーケンスを有する信号を処理するための請求項１８に記載の方法、または請求項１９に記載のコンピュータプログラムによって実現される。
【００５５】
本発明は、特に可逆符号化／復号化の場合において、とにかく高い信号エネルギーを有する符号化されるべき信号の周波数範囲に「適応される」ように、丸めエラーをスペクトル整形し、その結果、丸めエラーは、信号がとにかくエネルギーを有しない範囲には存在しないという知見に基づいている。先行技術において、丸めエラーは、可逆符号化、特に整数アルゴリズムに可逆符号化における信号のスペクトル全体に渡ってホワイトで分散されたが、本発明によれば、丸めエラーは、ピンクノイズの形式において、理想的なスペクトル上に重畳される。すなわち、丸めによるノイズエネルギーが生じるのは、信号がとにかくその最も高い信号エネルギーを有するところであり、よって、丸めエラーによるノイズは、符号化すべき信号が自身のエネルギーを有しないところにはほとんどまたは全くエネルギーを有しない。よって、確率論的な信号であるために符号化が困難な丸めエラーが周波数範囲において符号化される唯一の信号であるためにビットレートが不必要に上昇するという最悪の事態が回避される。
【００５６】
エネルギーが低周波数範囲にある音声信号を考えると、符号化信号の高い周波数では信号エネルギーもノイズエネルギーもないが、信号がとにかくたくさんのエネルギーを有する範囲には丸めエラーがマッピングされるように、生成された丸めエラーのスペクトル低域通過整形を実現するように、丸めるための進歩的な手段が設計される。
【００５７】
特に可逆符号化の応用例において、このことは、可聴範囲外の丸めエラーを得るために、丸めエラーがスペクトルの高域通過フィルタリングされることから、先行技術と対照的である。これは、また、丸めエラーが存在するスペクトル範囲が、電子的に、または耳自体で除去して丸めエラーを削除される場合に対応する。しかしながら、可逆符号化／復号化のためには、丸めエラーは、復号器において絶対的に必要である。なぜならば、そうでなければ、可逆復号化アルゴリズムとは逆の、復号器において使用されるアルゴリズムが、歪みを発生させるからである。
【００５８】
丸めエラーのスペクトル整形という進歩的な考え方は、高いサンプリングレートを伴う可逆の応用例において使用されるのが好ましい。なぜならば、特にスペクトルが（オーバーサンプリングのために）４０ｋＨｚ以上まで理論的には拡大する場合には、信号エネルギーが高い周波数範囲においてゼロである整数でない符号化の場合におけるように、とにかく信号エネルギーがない、すなわち、符号化が非常に効率的に行われうるという同じ状況が、高い周波数範囲において達成されるからである。
【００５９】
数多くのゼロが非常に効率的に符号化されて、符号化にとっては問題となる丸めエラーが典型的にはとにかく非常に細かく符号化される範囲へ移動されるので、信号のデータレート全体は、丸めエラーが周波数範囲全体に渡ってホワイトノイズとして分散される場合に比べて減少する。さらに、符号化性能、したがって復号化性能も上昇する。なぜならば、高い周波数範囲の符号化および復号化のために時間を費やす必要がないからである。よって、進歩的な考え方によって、符号器の部分および／または復号器の部分において、より高速の信号処理が達成できるという結果となる。
【００６０】
本発明の好ましい一実施形態において、近似エラーの整形／削減という進歩的な考え方は、可逆的な整数変換、特にＩｎｔＭＤＣＴに適用される。２つの分野、すなわち、１つは、必要とされた丸め演算に関して、ＭＤＣＴが非常に簡素化された多次元リフティングと、他方は、実際のＤＣＴの前の前処理において生じるような整数窓掛けにおいて必要な丸め演算という適用例がある。
【００６１】
本発明によれば、丸めエラーのスペクトル整形のためにエラーフィードバックの考え方が使用され、そこにおいて、本発明によれば、丸めエラーは、処理される信号が高い信号エネルギーを有する周波数範囲に移動する。音声信号および特に映像信号について、エラーフィードバックシステムが低域通過特性を有するように、これは低周波数範囲となる。この結果、高い周波数範囲における丸めエラーがより少なくなり、通常、信号成分もより少なくなる。先行技術においては、丸めエラーは、高い範囲に広く存在しており、これは、その後、符号化して、その後で符号化に必要なビット数を増加させなければならない。本発明によれば、この丸めエラーは、より高い周波数において減少され、符号化に必要なビット数を減少する。
【００６２】
本発明の好ましい実施形態を、添付の図面に関連して、より詳細に以下に説明する。
図１は、離散値のシーケンスを有する信号を処理するための進歩的な考え方のブロック回路図を示し、
図２ａは、量子化エラーを高域スペクトル整形するための既知の考え方を示し、
図２ｂは、本発明に係る丸めエラーを低域整形するための考え方を示し、
図２ｃは、スペクトル整形／丸めブロックについての、本発明の好ましい一実施形態に係るブロック回路図であり、
図３は、整数スペクトル値を決定するであろう整数値を取得するために時間離散音声サンプルを処理するための好ましい手段のブロック回路図であり、
図４は、ＭＤＣＴおよび逆ＭＤＣＴをギブンズ回転および２つのＤＣＴ−ＩＶ動作へ分解することについての概略図であり、
図５は、５０％重複のあるＭＤＣＴを回転およびＤＣＴ−ＩＶ動作へ分解することを示すための図であり、
図６ａは、ＭＤＣＴおよび５０％重複を使用する既知の符号器の概略ブロック回路図を示し、
図６ｂは、図１０ａによって生成された値を復号化するための既知の復号器のブロック回路図を示し、
図７は、図３に係る窓掛けにおけるリフティングの図であり、
図８は、実際の変換前に窓掛けするための、図７のリフティングの「再分類された」図であり、
図９は、図３，７，および８に係る窓掛けのための、本発明の一応用を示し、
図１０ａ〜１０ｃは、本発明の好ましい一実施形態に係る変換のための装置のブロック回路図を示し、
図１１は、本発明の好ましい一実施形態に係る逆変換のための装置を示し、
図１２は、本発明のために使用可能な、値の２つの後続ブロックの変換の図であり、
図１３は、順方向変換行列を使用する多次元リフティングステップの詳細図であり、
図１４は、逆方向変換行列を使用する多次元逆リフティングステップの図であり、
図１５は、長さＮのＤＣＴ−ＩＶを長さＮ／２の２つのＤＣＴ−ＩＶに分解するための本発明の図であり、
図１６は、図１０の多次元リフティングを使用する変換内での進歩的な考え方の一応用を示し、
図１７は、２つの連続リフティングステップの図であり、
図１８は、図１７の２つの連続リフティングステップにおける丸めエラーを減少させるための考え方の図であり、
図１９は、図１６の考え方を使用する図１８の考え方の逆の組合せを示す。
【発明を実施するための最良の形態】
【００６３】
図１は、信号入力２００を介して処理するための手段２０２に入力される離散値をシーケンスを有する信号を処理するための装置を示す。信号は、典型的には、信号が高いエネルギーを有する第１の周波数範囲を有し、かつ、信号が比較的低いエネルギーを有する第２の周波数範囲を有するように形成される。第１の信号は、音声信号であり、第１の周波数範囲、すなわち、低い周波数範囲において高いエネルギーを有することになり、高い周波数範囲において低いエネルギーを有することになる。また一方、信号が映像信号である場合には、低い範囲において高いエネルギーを有することになり、高い範囲において低いエネルギーを有することになる。音声信号とは異なり、映像信号における周波数範囲は、時間周波数も存在する連続した映像フレームを考慮しない限り、例えば選択された画像領域に関連する、連続フレームにおける空間周波数範囲である。
【００６４】
処理のための手段２０２は、一般的に、離散値のシーケンスを処理するように形成され、これにより、少なくとも１つの処理値が整数でない処理値のシーケンスが取得される。この整数でない離散値のシーケンスは、丸められた処理値のシーケンスを取得するために、処理値のシーケンスを丸めるための手段２０４に与えられる。本発明によれば、丸めるための手段２０４は、丸めによって生成された丸めエラーのスペクトル整形を生じさせるように形成され、これにより、第１の周波数範囲において、すなわち、元信号が高いエネルギーを有する周波数範囲において、スペクトル整形された丸めエラーも高いエネルギーを有するように、かつ、第２の周波数範囲において、すなわち、元信号が低いエネルギーを有する周波数範囲において、スペクトル整形された丸めエラーも低いエネルギーを有するか、またはエネルギーを有しないようにする。よって、一般的に、第１の周波数範囲におけるスペクトル整形された丸めエラーのエネルギーは、第２の周波数範囲におけるスペクトル整形された丸めエラーのエネルギーよりも高い。しかしながら、スペクトル整形は、丸めエラーのエネルギー全体において、何も変更しないのが望ましい。
【００６５】
好ましくは、エラーを含む丸められた処理値のシーケンスを生成するための進歩的な装置は、直接、もしくは、さらなる処理または丸めの組合せを介して、スペクトル表現に変換するための手段２０６に結合される。よって、エラーを含む丸められた処理値のシーケンスは、エラーを含む丸められた処理値のシーケンスの直接スペクトルを実現するために、スペクトル表現に変換するための手段２０６に直接与えられてもよい。
【００６６】
また一方、本発明の好ましい一実施形態において、処理するための手段は、リフティングステップおよび／またはリフティング行列であり、丸めるための手段は、リフティングステップの整数でない結果を丸めるために形成される。この場合、手段２０４は、第２のリフティングステップを行うように処理するためのさらなる手段が続き、その次には、丸めるための手段が続き、その次には、第３のリフティングステップを実施するように処理するための第３の手段が続き、その後、３つのリフティングステップが実現されるように他の処理がある。よって、手段２０４の出力における丸められた処理値の元エラーを含むシーケンスから派生された、丸められた処理値のエラーを含むシーケンスが生成され、その後、ブロック２０６によって示すように、好ましくは整数変換、特に好ましくは進歩的な考え方が与えられた整数変換によって、最終的にはスペクトル表現に変換される。ここで、ブロック２０６の出力におけるスペクトル表現の出力信号は、先行技術とは異なって、もはやホワイト分散丸めエラーを有しないが、スペクトル的に丸めエラーは整形され、すなわち、これにより、実際の「有用なスペクトル」が高い信号エネルギーを有する高い丸めエラーエネルギーもある一方で、最良の場合でも、信号エネルギーがない周波数範囲において丸めエラーエネルギーがないことになる。
【００６７】
本発明に従って生成されたこのスペクトルは、その後、スペクトル表現のエントロピー符号化のための手段２０８に供給される。エントロピー符号化のための手段は、ハフマン符号化、演算符号化などの任意の符号化方法を備えることができる。特に、ゼロであり互いに境を接する数多くのスペクトル線を符号化するためには、先行技術においては当然ながら適用できなかった連長符号化も適切である。なぜならば、ここで、実際に決定論的な信号は、ホワイトスペクトルを有するのでどの種類の符号化ツールも特に好ましくないような周波数範囲において符号化されなければならないからであり、これは、個別のスペクトル値は完全に互いに相関性がないからである。
【００６８】
続いて、スペクトル整形で丸めるための手段２０４の好ましい一実施形態を、図２ａ，２ｂ，２ｃに関連して説明する。
【００６９】
図２ａは、専門家の書籍である「デジタル音声信号処理（ＤｉｇｉｔａｌｅＡｕｄｉｏｓｉｇｎａｌｖｅｒａｒｂｅｉｔｕｎｇ）」、Ｕ．ツォエルツァー（Ｚｏｅｌｚｅｒ）、トイブナー出版(Ｔｅｕｂｎｅｒ−Ｖｅｒｌａｇ)，シュツットガルト、１９９７年に記載されているように、量子化エラーのスペクトル整形のための既知のエラーフィードバックシステムを示す。入力値ｘ（ｉ）が入力加算器２１０に供給される。加算器２１０の出力信号は、スペクトル整形装置の出力において量子化出力値ｙ（ｉ）を与える量子化器２１２に供給される。第２の加算器２１４において、量子化器２１２の後の値と量子化器２１２の前の値との間の差、すなわち、丸めエラーｅ（ｉ）が決定される。第２の加算器２１４の出力信号は、遅延手段２１６に与えられる。１つの時間単位分遅延された丸めエラーｅ（ｉ）は、その後、加算器２１０によって入力値から差し引かれる。これにより、元のエラー信号ｅ（ｎ）の高域通過評価となる。
【００７０】
図２ａにおけるＺ^-1が指定された遅延手段２１６の代わりにＺ^-1（−２＋Ｚ^-1）が使用される場合には、結果は、二次高域通過評価となる。ある実施形態において、量子化エラーのそのようなスペクトル整形は、量子化エラーが知覚されないように、知覚しうる範囲から、すなわち、例えば、信号ｘ（ｎ）の低域通過範囲から量子化エラーを「遮蔽」する。
【００７１】
本発明によれば、図２ｂに示すように、知覚範囲外ではなく、まさに知覚範囲へのエラーのスペクトル整形を実現するために、低域通過評価が代わりに行われる。このために、図２ｂに示すような、加算器２１０の出力信号が、ある丸め関数を実施する丸めブロック２１８に与えられ、丸め関数は、例えば、切り上げ、切り捨て、切捨てによる丸め、次の整数、または１つおいて、２つおいて…次の整数への端数の切り上げ／切り捨てであってもよい。エラーフィードバックパスにおいて、すなわち、加算器２１４および加算器２１０の間において、遅延手段２１６に加えて、インパルス応答ｈ（ｎ）および／または変換関数Ｈ（ｚ）を伴うさらなるフィードバックブロック２２０がある。出力シーケンスのｚ変換、すなわち、Ｙ（ｚ）は、図２ｂに示す式を介して、入力シーケンスＸ（ｚ）に関連付けられる。

ｅ（ｎ）＝ｙ（ｎ）−ｘ’（ｎ）

上記式において、ｘ’（ｎ）は、加算器２１０の出力信号であり、ｙ（ｎ）は、丸めブロック２１８からの出力信号である。
【００７２】
さらに、以下の式が適用される。

ｙ（ｎ）＝ｒｏｕｎｄ（ｘ’（ｎ））

上記式のおいて、「ｒｏｕｎｄ」は、ブロック２１８によって実施される丸め関数を表す。さらに、以下の式が適用され、式中、「＊」は、畳み込み動作を表す。

ｘ’（ｎ）＝ｘ（ｎ）−ｈ（ｎ）＊ｅ（ｎ−１）

Ｚ範囲において、以下の結果がある。

Ｙ（ｚ）＝Ｘ’（ｚ）＋Ｅ（ｚ）
Ｘ’（ｚ）＝Ｘ（ｚ）−Ｅ（ｚ）ｚ^-1Ｈ（ｚ）
Ｙ（ｚ）＝Ｘ（ｚ）＋（１−ｚ^-1Ｈ（ｚ））Ｅ（ｚ）

Ｅ（ｚ）が丸めエラーであるので、フィルタ（１−ｚ^-1Ｈ（ｚ））によってスペクトル整形される。本発明によれば、低域通過のような伝達関数が使用される。例えば、Ｈ（ｚ）＝−１を設定すれば、最も簡単な低域通過のような伝達関数が得られる。したがって、この簡単な例において、過去の丸め動作の丸めエラーが、次の丸め動作を適用する前に、丸める値に対して単に加算される。よって、本発明にとって非常に効率的であるがゆえに好ましい、丸めエラーの簡単な低域通過フィルタリングが実現される。
【００７３】
一実施を、図２ｃに示す。特に、整数離散値の元シーケンスを処理するための手段２０２を示しており、これにより、出力側に整数でない離散値ｙ₀，ｙ₁，ｙ₂，…，ｙ_iのシーケンスが提供される。ここで、先行技術との対比において、図示のように、例えば図３のブロック２０，２４，２８、図１０Ｃのブロック１０４，１１０，１４２、または図１１の１２６，１３２，１５０に関して、各値は、もはやそれ自体で丸められない。代わりに、シーケンスの整数でない離散値ｙ₀，ｙ₁，ｙ₂，…，ｙ_iが、図２に示す「ネットワーク」によるフィードバック分岐における低域通過特性で互いに依存してフィルタされ、これにより、進歩的なスペクトル整形となる。図２ｃおよび図２ｂにおける同様の要素は、同一の参照される数表示で示されている。
【００７４】
さらに、図２ｃは、並列的な一実施、すなわち、丸めるべき値が並列的に与えられる一実施を示している。当然ながら、この図は概略である。値ｙ₀，ｙ₁，ｙ₂，…は、その後、連続的な出力値が得られるために、順次与えられてもよく、この場合には、要素２１０，２１４，２１６，２１８，２２０の構成を１つ実施すれば十分である。要素２１４，２１８，２２０の構成が繰り返して示されているのは、明確にするためだけである。
【００７５】
まず丸められた値［ｙ₀］を計算するために、図２ｃに示す丸めるための手段２０４は、動作する。それゆえに、その後、丸めエラーｉ₀が計算される。その後、丸めエラーｉ₀は、ブロック２２０によって、好ましくは−１である変換関数Ｈ（ｚ）で重み付け（フィルタ）され、加算器２１０に与えられる。このフィルタされた丸めエラーは、シーケンスｙ_iの次の値に加算され、加算器２１０の結果は、丸められた次の値［ｙ₁］を得るために、ブロック２１８において丸められる。続いて、丸めエラーが加算器２１４によって再び決定され、すなわち、丸められた値［ｙ₁］および元の値ｙ₁を使用して決定され、この得られた丸めエラーｉ₁は、シーケンスの次の値ｙ２に対して同じ処理を行うために、再びブロック２２０においてフィルタされる。
【００７６】
この点で、方向は問題ではないことに注意すべきである。このことは、より大きな指標を伴うｙ_iからより小さな指標を伴うｙ₁へ、すなわちブロック２２０から加算器２１０へと伸びる図２ｃの矢印によって特に表されるのとは反対方向に処理が進むことも可能であることを意味する。よって、順序、すなわち処理が小さなシーケンス指標から大きなシーケンス指標へと進むか、大きなシーケンス指標から小さなシーケンス指標へと進むかは、重要ではない。
【００７７】
特に、整数ＭＤＣＴ（ＩｎｔＭＤＣＴ）の応用例の場合において、丸めエラーのスペクトル整形は、以下の条件に合致する箇所における特殊な効率で使用されるのが好ましい。
−丸めエラーは、互いに独立しているいくつかの隣接する値で加算される。
−隣接する値は、（広義では）時間信号であって、後に変換によってスペクトル表現に変換される、すなわち、周波数領域に変換される。
【００７８】
以下では、整数ＭＤＣＴのどの部分で丸めエラーのスペクトル整形が使用されるのが好ましいかをより詳細に説明する。
【００７９】
第１の好ましい実施形態は、実際の変換に先立つ窓掛け、すなわち、図３においてブロック２０，２４，２８によって特定された丸めについてのそれにおいて成り立っている。各個別の元サンプルｘ₁，…，ｘ_Nが受けた、図３に基づいて概説されるようなリフティング動作は、図７に示す図によって示すこともできる。ここで、３つのリフティング行列の適用、すなわちサンプルに対する係数での各乗算を、サンプルに関して示し、その結果、「上から下へ」、「下から上へ」、および「上から下へ」のシーケンスとなる。
【００８０】
図７の注釈に関して、注意すべきなのは、矢印が水平線と交わる場合に、加算がそこで行われる。そのような加算は、例えば、図７の２７において示されている。図４を図７と比較すると、唯一の違いは、図４のｘ（０）は、図７のｘ₁に対応することである。この点で、図７のｘ_Nは、図４のｘ（Ｎ−１）に対応する。また一方、図４のｘ（Ｎ／２−１）は、図７のｘ_N/2に対応する。さらに、図４のｘ（Ｎ／２）は、図７のｘ_N/2+1に対応し、その結果、リフティングステップに従って、ウィンドウの第１の４分の１からの１つの値が当該ウィンドウの第２の４分の１からの１つの値によって重み付けされることによって、図２において示されるバタフライ演算であり、一方で、同様に、当該ウィンドウの第３の４分の１の値が図７に示す「下−上−下システム」によって当該ウィンドウの第４の４分の１の値で処理されることになる。
【００８１】
ｘ_N/2およびｘ_N/2+1の値の対に対して、対応する処理がある。再び下−上−下のシーケンスがあり、下向きステップ２９ａには上向きステップ２９ｂが続き、その次には下向きステップ２９ｃが続く。
【００８２】
よって、図７は、リフティングによる整数窓掛けを示している。この計算は、図８に示すように、結果を変更せずに容易に使用されてもよい。よって、当然ながら、すべての下方向ステップ（すべてのステップ２９ａ）がまず行われてもよい。その後、すべての上方向ステップ（２９ｂ）が行われて、最後にすべての下方向ステップ２９ｃが行われてもよく、その結果、下向きブロック３１ａ、上向きブロック３１ｂ、および再び下向きブロック３１ｃとなる。図８は図７と対応するが、本発明を理解するのにより適した他の図であることに注意すべきである。
【００８３】
ここで、図９は、進歩的な丸めがスペクトル整形で丸めるために行われる進歩的な考え方を示す。図９に示すリフティング計算の考え方は、図１に対応しており、入力値ｘ₁，ｘ_N/2は、入力２００における整数離散値の元シーケンスを表す。下向きブロック３１ａにおける評価ブロックｃｓ₁，ｃｓ₂，…，ｃｓ_kは、一体となって、処理するための手段２０２を形成する。［．］／ＮｏｉｓｅＳｈａｐｉｎｇで示すブロックは、図１の丸めるための手段２０４を表す。ここで、エラーを含む丸められた処理値のシーケンスが、このブロック２０４の出力において生じる。
【００８４】
図９に示す実施形態において、エラーを含む丸められた処理値のシーケンスが、整数離散値の新たなシーケンスを得るために、ｘ_N/2+1からｘ_Nのさらなるシーケンスに加算される。その次に、新たなシーケンスは、要素２０４（ｂ）によって上向きブロック３１ｂにおける進歩的な丸めが再び実現するために、（上向きブロック３１ｂのブロックｓ₁，ｓ_kによって）処理される。その後、新たなシーケンスを得るために、下向きブロック３１ａにおけるような、すなわち、加算器２０５ａの場合のような、値に関する加算器２０５ｂが再び与えられる。その次に、新たなシーケンスは、処理器２０２ｃに与えられる。処理器２０２ｃの出力信号は整数ではなく、さらなる丸め器２０４ｃにおいて丸められ、その次に、さらなる加算器２０５ｃによって加算され、すなわち処理器２０２ｂに与えられたシーケンスに加算される。
【００８５】
図９に示す実施形態において、出力側の結果は、窓掛けされたサンプルのブロックであり、これらのサンプルは、図４に関して示したようなシステム化された手法に従って、対応するように移動されたＤＣＴ−ＩＶブロックに与えられる。これらの移動されたＤＣＴブロックは、エラーを含む丸められた処理値をスペクトル表現に変換するために変換に提供する。よって、図４のＤＣＴ−ＩＶブロックは、図１の手段２０６の一実施を表す。同様に、逆整数ＤＣＴ−ＩＶを行うためのブロックは、時間的表現へ変換するための同様の手段を表す。
【００８６】
続いて、多次元リフティングの応用例が、図１０ａのスペクトル表現２０６への変換のための手段の整数による実施、および／または（復号器のための）逆変換の同様の整数による実施を提示するために、図１０から１５に関して説明される。多次元リフティングの考え方は、公式参照番号１０３３１８０３．８を有する独国特許出願において提示されている。
【００８７】
図１０ａは、離散値を整数値を伴う変換表現に変換するための装置を示す。離散値は、第１の入力１００ａと、第２の入力１００ｂとを介して、当該装置に与えられる。離散値の第１のブロックは、入力１００ａを介して供給され、離散値の第２のブロックは、入力１００ｂを介して供給される。離散値は、音声データもしくは画像データおよび／または映像データを表す。以下に説明するように、離散値の第１のブロックおよび離散値の第２のブロックは、実際には、音声サンプルの２つの時間的に連続するブロックを含んでもよい。また、離散値の第１および第２のブロックは、離散値および／または予測後の残存値または差分符号化における差分値などによって表される２つの画像を含んでもよい。しかしながら、代わりに、離散値の２つのブロックは、ＭＤＣＴの整数による実施におけるような前処理を受けていてもよく、離散値の第１のブロックおよび第２のブロックは、実際に窓掛けされたサンプルからギブンズ回転によって生成されている。よって、離散値の第１のブロックおよび第２のブロックは、元の音声データまたはイメージデータから、回転、置換、正／負バタフライ演算、変倍などといった何らかの処理によって派生してもよい。さらに、離散値の第１のブロックおよび離散値の第２のブロックは、直接音声サンプル化された、または離散化された画像値ではないものの、音声情報および／または画像情報を取得する。
【００８８】
離散値の第１のブロックは、図１０ａに示すように、手段１０２の出力において、変換値の第１のブロックを得るために、入力１００ａを介して、第１の変換規則を使用して離散値の第１のブロックを処理するための手段に対して、与えられる。この変換値の第１のブロックは、典型的には整数でなく、浮動小数点値を含むことになる。これは、ラプラス変換、ＦＦＴ，ＤＣＴ，ＤＳＴ，ＭＤＣＴ，ＭＤＳＴ，または任意の基本関数を伴うウェーブレット変換といった何らかの他の変換などの、何らかの変換規則によって取得されているからである。出力側において、丸められた変換値の第1のブロックを得るために、変換値の第1のブロックは、変換値の第1のブロックを丸めるために手段１０４に与えられる。浮動小数点値等に依存している切捨て、もしくは切り上げおよび／または切り捨ての処理されることによる丸めのように、丸めるための手段１０４は、いくつかの丸め機能の実行するために形成される。
【００８９】
したがって、手段１０４によって実施される丸め規則は、丸められた変換値の第１のブロックに関与しており、このブロックは、手段１０４によって使用される丸め規則によって精度が決定される整数値のみを備える。丸められた変換値の第１のブロックは、第２の入力１００ｂに与えられる離散値の第２のブロックと同様に、合計値の第２のブロックを取得するために、合計するための手段１０６に供給される。音声信号例を考えると、丸められた変換値の第１のブロックからのスペクトル値は、手段１０６によって、離散値の第２のブロックからの時間値に加算されるのは明らかである。第２のブロックの離散値は、例えば、電圧値であって、丸められた変換値の第１のブロックは、電圧振幅として、すなわち、単位Ｖの値としても存在することが推奨される。この場合、合計において単位の問題が予測されることはない。また一方、丸められた変換値の第１のブロックおよび離散値の第２のブロックは共に、例えば、単位がないことを考慮すると、任意の単位の標準化が、丸められた変換値の第１のブロックおよび／または離散値の第２のブロックを用いて行われてもよいことは、当業者にとって明らかである。
【００９０】
合計値の第２のブロックは、変換値の第２のブロックを得るために、合計値の第２のブロックを第２の変換規則を使用して処理するための手段１０８に供給される。手段１０２において使用される変換規則が、例えば時間周波数変換規則であるならば、ブロック１０８において使用される第２の変換規則は、例えば、周波数時間変換規則である。しかしながら、これらの関係は逆になってもよく、離散値の第１および第２のブロックは、例えばスペクトル値であり、これにより、変換規則の下での処理のために時間値が手段１０２によって取得され、逆変換規則による処理のための手段、すなわち手段１０８によってスペクトル値が再び取得される。よって、第１および第２の変換規則は、順方向または逆方向変換規則てあってもよく、そして、逆変換規則は、逆方向変換規則または順方向変換規則である。
【００９１】
変換値の第２のブロックは、図１０ａに示すように、丸められた変換値の第２のブロックを得るために、丸めるための手段１１０に与えられる。丸められた変換値は、最終的には、第１の入力１０８ａを介して供給された離散値の第１のブロックから、丸められた変換値の第２のブロックを減算して、出力１１４において出力される変換表現の整数出力値のブロックを得るために、減算するための手段１１２に与えられる。手段１０２においても使用されるか、またはこれとは異なる任意の第３の変換規則を使用して、変換表現の整数出力値のブロックを処理して、その後、丸められた変換出力値のブロックを取得するために、変換出力値のブロックを丸めて、その後、丸められた変換出力値のブロックと、合計値の第２のブロックとを合計することによって、出力１１４に整数出力値のブロックと共に離散値の第１および第２のブロックの完全な変換表現がてきようされたならば変換表現の整数出力値のさらなるブロックが得られてもよい。
【００９２】
しかしながら、出力１１４における変換表現の整数出力値のブロックが使用される、処理、丸め、および合計という処理の最後の３つの工程がなくても、変換表現全体の一部が、すなわち、例えば、逆変換を受ける場合に、離散値の第１および第２のブロックの逆計算を許容する前半部分が既に取得されてもよい。
【００９３】
この点において注意すべきは、変換規則によっては、第１、第２、および第３の変換規則がもしあれば、それらは同一であってもよいということである。例えば、ＤＣＴ−ＩＶの場合がその場合である。第１の変換規則としてＦＦＴが使用された場合、ＦＦＴとは同一でないＩＦＦＴが、第２の（逆）変換規則として使用されることができる。
【００９４】
計算手段については、変換規則を行列の形式で提供するのが好ましく、第１のブロックの離散値の数が第２のブロックの離散値の数と等しい場合であって、第１のブロックの離散値の数および第２のブロックの離散値の数がそれぞれＮである場合には、この行列は、２次のＮ×Ｎ行列である。
【００９５】
一実施形態において、丸めるための手段１０４および１１０は、図１０ａに示す機能を行うコンピュータに固有の機械精度よりも精度が低い丸め結果を与える丸め関数に従って丸めるように形成されている。丸め関数に関して注意すべきなのは、丸め関数は、整数ではないものを、好ましい一実施形態のみにおける次に大きいまたは小さい整数にマッピングすることである。丸め関数は、丸め関数が丸めるべき数の精度を減少させる限り、他の整数、すなわち数値１７．７を数値１０または数値２０に対してマッピングしてもよい。上記例において、丸められていない数値は、コンマの後ろの１桁の数値であり、丸められた値は、コンマの後ろの桁をもはや有しない数値である。
【００９６】
図１０ａにおいて、第１の変換規則を使用して処理するための手段１０２および第２の変換規則を使用して処理するための手段１０８は、別個の手段として示されているが、注意すべきなのは、具体的な一実施形態においては、たった１つの変換関数だけがあってもよく、変換関数は、特殊なフロー制御器に制御されて、まず離散値の第１のブロックを変換し、その後、アルゴリズムの対応時間における合計値の第２のブロックを逆変換する。この場合、第１および第２の変換規則が等しい。同じことが、丸めるための２つの手段１０４および１１０についても当てはまる。これらは、別個の手段として提供される必要はなく、アルゴリズムの要件によっては、１つの丸め機能部によって実施されてもよい。丸め機能部は、同じくフロー制御器によって制御されて、まず変換値の第１のブロックを丸め、その後に変換値の第２のブロックを丸める。
【００９７】
一実施形態において、離散値の第１のブロックおよび離散値の第２のブロックは、図３におけるブロック２８の出力で取得されるので、整数窓掛けされたサンプルである。図３のブロック１４における整数ＤＣＴは、その後、図１に示す整数アルゴリズムによって実施され、この実施は、図３が関連する音声信号の例における変換表現が、図３に示す装置の出力３０における整数スペクトル値を表すように行われる。
【００９８】
続いて、図１０ａに対応する逆変換のための手段が、図１０ｂに関連して示される。図１０ｂにおいて、図１０ａのブロック１１２の出力における整数出力値のブロックに加えて、図１０ａの手段１０６の出力における合計値の第２のブロックも使用される。図１１に関して、より詳細に以下に説明するが、これは、ブロック１５０および１３０のみが存在し、変換ブロック１２４ではない場合に対応している。
【００９９】
図１０ｂは、図１０ａの出力１１４において取得されたような、変換表現の整数出力値のブロックと、合計値の第２のブロックとを逆変換するための装置を示す。合計値の第２のブロックは、図１０ｂに示す逆変換のための装置の入力１２０に与えられる。変換表現の出力値のブロックは、逆変換のための装置のさらなる入力１２２に与えられる。
【０１００】
符号化の最後に使用された変換規則が第２の変換規則である場合には、合計値の第２のブロックは、第２の変換規則を使用してこのブロックを処理するための手段１３０に与えられる。手段１３０は、出力側において変換値の第１のブロックを与え、丸めるための手段１３２に供給されて、その次に、出力側において丸められた変換値の第１のブロックを生成する。丸められた変換値の第１のブロックは、その後、図１０ｂの装置の第１の出力１４９において、離散値の第１のブロックを得るために、手段１３４によって、変換表現の出力値のブロックから減算される。
【０１０１】
離散値の第１のブロックは、手段１５０の出力において、変換値の第２のブロックを得るために、第１の変換規則を使用してこのブロックを処理するための手段１５０に供給される。この変換された減算値の第２のブロックは、その次に、丸められた変換値の第２のブロックを得るために、手段１５２において丸められる。この丸められた変換値の第２のブロックは、出力側の出力１３６において、離散値の第２のブロックを得るために、入力１２０を介して入力された、入力側に与えられた合計値の第２のブロックから減算される。
【０１０２】
第１、第２、および第３の変換規則の関係、ならびに、図１０ｂの個別の機能ブロックの共通機能部および対応するフロー制御器／ラッチングによる特殊な実施に関しては、図１０ａに関してなされた説明を参照されたい。
【０１０３】
続いて、図１０ａに概略を示す変換表現への変換のための装置の好ましい一実施形態が、図１０ｃに関連して説明される。図１０ａにおける実施形態は、図１０ａと比べると、合計値の第２のブロックから整数出力値のさらなるブロックを生成するためのさらなる変換／丸めを含む。
【０１０４】
第１の入力１００ａは、離散値の第１のブロックのＮ個の値を入力するためのＮ本の入力線ｘ₀，…，ｘ_N-1を含む。また、第２の入力１００ｂは、離散値の第２のブロックのＮ個の値ｘ_N，…，ｘ_2N-1を入力するためのＮ本の入力線を含む。図１０ａの手段１０２は、図１０ｃにおけるＤＣＴ−ＩＶ変換器として描かれている。ＤＣＴ変換器１０２は、Ｎ個の入力値からＮ個の出力値を生成するように形成され、各出力値は、その後、図１０ｃにおける手段１０４によって示されるような、「［．］」で示す丸め規則によって丸められる。合計のための手段１０６は、値に関する合計があるように示されている。これは、指標０を伴う手段１０２が、指標Ｎを有する離散値の第２のブロックの第１の値と合計されることを意味する。よって、一般的に、順序数ｉを伴う丸め手段１０４の出力における丸められた変換値の第１のブロックの値は、順序数Ｎ＋ｉを伴う出力値の第２のブロックの離散値と個別に合計される。ここで、ｉは、０からＮ−１に渡る実行指標である。
【０１０５】
第２の変換規則を使用して処理するための手段１０８も、ＤＣＴ−ＩＶ変換器として描かれている。図１０ｃに示す好ましい実施形態において、減算のための手段１１２も、値に関する減算を行うように形成されており、すなわち、丸め器１１０の出力値、すなわち、丸められた変換値の第２のブロックの値が、離散値の第１のブロックから個別に減算されるように行われる。図１０ｃに示す実施形態において、順序数Ｎ＋ｉを伴う第２のブロックの値が、順序数ｉを伴う第１のブロックの値から減算されるように、対応の減算を行うのが好ましく、ここで、ｉは、同じく０からＮ−１の範囲である。また一方、代わりに、逆変換においても対応して考慮されるならば、他の合計／減算があってもよく、例えば、Ｎ−１の順序数を伴うブロックの値が、順序数Ｎを伴う他のブロックの値から減算されるようなものであってもよい。
【０１０６】
減算のための手段１１２は、出力側における変換表現の整数出力値のブロック、すなわち、変換表現の整数出力値ｙ₀からｙ_N-1を、既に与えている。変換表現の残りの整数出力値、すなわち、さらなるブロックｙ_Nからｙ_2N-1をも取得するためには、任意に希望するのであれば、出力１１４に与えられた変換表現の整数出力値のブロックは、順方向変換器１４０によって、第３の変換規則を使用する変換を受ける。ここで、同出力値は、丸め手段１４２によって示すように、再び丸められ、図１０ｃの参照番号１４４に示すように、合計器１０６の出力において、これらの値を合計値の第２のブロックと加算することが行われる。合計器１４４の出力値は、その後、ｙ_Nからｙ_2N-1で示す変換表現の整数出力値のさらなるブロック１４６を表す。
【０１０７】
続いて、一実施形態に係る変換表現の逆変換のための装置を図１１に関連して説明する。図１０ｃに示す装置によって行われる動作は、図１１に示す装置によって可逆で逆に行われることに注意すべきである。図１１は、図１０ｂに対応するが、例外は、合計値の第２のブロックを生成するための追加的な変換／丸め段があり、合計値の第２のブロックは、変換出力値のさらなるブロックから、図１０ｂに示す実施形態における入力１２０へ与えられる。加算の機能は、減算の機能によってそれぞれ逆になることに注意すべきである。さらに注意すべきなのは、加算器／減算器の対（図１０ｃの１４４および図１１の１２８）は、符号が反転された入力量が与えられてもよく、入力量の群が負の符号を与えられている場合に、図示の場合と比較して、加算器１４４は、その後実際には減算動作を行い、対応部（図１１の１２８）においてもこれが考慮されるならば、対応部は実際には加算動作を行うことになる。
【０１０８】
図１１に示す減算器１２８、加算器１３４、およびさらなる減算器１５４は、同様に、値に関する個別の加算／減算を行うように形成され、ここで、同様に、図１０ｃに関連して説明したのと同じ順序数処理が使用される。図示のものとは異なる順序数を図１０ｃにおいて用いた場合には、このことは、図１１に対応して考慮されることになる。
【０１０９】
減算器１３４の出力において、ｘ₀，…，ｘ_N-1で示す離散値の第１のブロック１３６が既に存在する。残りの逆変換表現を取得するために、離散値の第１のブロックは、第１の変換規則で動作する変換器１５０に供給され、出力側のその値は、丸め器１５２によって丸められ、最後にまた、ｘ_N，…，ｘ_2N-1で示す離散値の第２のブロック１５６を取得するために、減算器１２８の出力において、減算値の第２のブロックから減算される。
【０１１０】
続いて、図１０ａ，１０ｂ，１０ｃおよび１１に関連して説明したような装置についての数学的背景が、図１２から１５に関連して説明される。変換および／または逆変換のための図示の装置によって、禁じエラーが減少する可逆音声符号化のための整数変換方法が提供される。加えて、計算の取り組みも考慮されており、その基本は、リフティングスキームを各ギブンズ回転に適用するという既知の取り組みではもはやなくなっており、ここにおいて、自明の合計差バタフライ演算が常に生じる。これにより、コピーされるべき変換の元の整数でないものに比べて、計算の取り組みを非常に増加させる。
【０１１１】
通常、ギブンズ回転の反転できる整数近似を得るために、リフティングスキームが使用される。

この整数近似は、各加算の後に、すなわち各リフティング工程の後に、丸め関数を使用することによって実現される。
【０１１２】
リフティングスキームが、ある変倍動作の反転できる整数近似について使用されてもよい。専門家用の刊行物である、Ｒ．ガイガー（Ｇｅｉｇｅｒ）およびＧ．シュラー（Ｓｈｕｌｌｅｒ）著、「整数低遅延およびＭＤＣＴフィルタバンク（ＩｎｔｅｇｅｒｌｏｗｄｅｌａｙａｎｄＭＤＣＴｆｉｌｔｅｒｂａｎｋｓ）」、信号、システムおよびコンピュータに関するアシロマ会議（ＡｓｉｌｏｍａｒＣｏｎｆ．ｏｎＳｉｇｎａｌｓ，ＳｙｓｔｅｍｓａｎｄＣｏｍｐｕｔｅｒｓ）会報、２００２年において、１に等しい行列式を伴う２×２の変倍行列の以下のリフティング分解が検討および説明されている。

このリフティング分解は、１次元であり、すなわち、２×２の変倍行列に関連するのみであり、多次元の場合に拡張される。特に、上記式からの全ての値は、ｎ×ｎの行列に置き換えられ、ｎ、すなわちブロックの離散値の数は、２より大きいかまたは等しい。よって、その結果、任意のｎ×ｎの行列Ｔに関して、好ましくは可逆的であるべきで、２ｎ×２ｎのブロック行列への以下の分解が可能であり、ここで、Ｅ_nは、ｎ×ｎの単位行列である。

置換または−１による乗算などの単純な演算に加えて、この分解の３つのブロックは全て、以下の一般的な構造を有する。

この２ｎ×２ｎブロック行列について、後で多次元リフティングとも称される一般化されたリフティングスキームを使用してもよい。
【０１１３】
値ｘ＝（ｘ₀，…，ｘ_2n-1）のベクトルについて、このブロック行列を適用すると、以下の式が与えられる。

上記式の右側において、大きさ、すなわち線数が２ｎに等しいベクトルがある。最初のｎ個の成分、すなわち、０からｎ−１の成分は、ｘ₀，…，ｘ_n-1に対応する。第２番目のｎ個の成分、すなわち、上記式の右側に生じるベクトルの後半は、離散値の第２のブロックの合計、すなわちｘ_n，…，ｘ_2n-1に等しいが、図１０ａ，１０ｂ，１０ｃおよび１１の変換行列に対応する行列Ａの乗算、ならびに離散値ｘ₀，…，ｘ_n-1の第１のブロックと合計される。変換行列は、第１、第２、および第３の変換規則をそれぞれ表す。
【０１１４】
以下の形式の２×２の行列を伴う共通のリフティングスキームと同様に、

このような２ｎ×２ｎの行列が、以下のように変換Ｔの反転できる整数近似のために使用されてもよい。整数入力値（ｘ₀，…，ｘ_2n-1）について、浮動小数点出力値（ｙ₀，…，ｙ_n-1）＝Ａ・（ｘ₀，…，ｘ_n-1）が、丸められ、すなわち整数値とされて、その後に、整数値（ｘ_n，…，ｘ_2n-1）に加算される。ブロック行列の逆は、以下のようになる。

よって、この処理は、同じ行列Ａおよび同じ丸め関数を単に使用して、順方向処理における加算の代わりに結果値を減算することによって、エラーなく反転されてもよい。順方向処理が図１３に示され、逆方向処理が図１４に示される。注意すべきなのは、図１３の変換行列は、図１４の変換行列と同一であり、これは、実施を簡素化するのに好ましい。
【０１１５】
値（ｘ₀，…，ｘ_n-1）は、図１３に示す順方向工程においては変形されないので、逆の工程、すなわち図１４における逆方向工程のためにまだ存在する。行列Ａについて特に制限はないことに注意すべきである。したがって、必ずしも可逆的でなくてもよい。
【０１１６】
既知のＭＤＣＴの可逆的な整数近似を得るためには、ＭＤＣＴは、ウィンドウ段である第１の段と、後続のＤＣＴ−ＩＶ段とでギブンズ回転に分解される。この分解は、図３において説明されており、以下でも説明するが、詳細は独国特許出願公開第１０１２９２４０号に記載されている。
【０１１７】
ＤＣＴ−ＩＶがギブンズ回転のいくつかの段に分解される先行技術とは対照的に、変換自体は変化しないままで、その後に丸められる。
【０１１８】
ＤＣＴ−ＩＶの整数近似が、リフティングを基本としたギブンズ回転のいくつかの段によって行われることは知られている。ギブンズ回転の数は、使用された基礎となる高速アルゴリズムによって決定される。よって、ギブンズ回転の数は、長さＮの変換についてのＯ（ＮｌｏｇＮ）によって与えられる。各ＭＤＣＴ分解のウィンドウ段は、Ｎ／２個のギブンズ回転または３Ｎ／２個の丸め工程からのみ構成される。よって、特に音声符号化の応用例において使用されるような高い変換長（例えば、１，０２４）の場合、ＤＣＴ−ＩＶの整数近似が、近似エラーの主な原因となる。
【０１１９】
取り組みは、上述の多次元リフティングスキームを使用する。よって、ＤＣＴＩＶにおける丸め工程の数は、３Ｎ／２に減少し、すなわち、従来のリフティングを基本とする取り組みにおける２Ｎｌｏｇ₂ Ｎについてと比較して、ウィンドウ工程における丸め工程の数と等しくなる。
【０１２０】
ＤＣＴ−ＩＶは、同時に信号の２つのブロックに適用される。これの１つの可能性を、図１２に示す。ここでは、例えば、サンプルの２つの時間的に連続するブロックに対してＤＣＴ−ＩＶが単に施される。しかしながら、２つの変換が単に施される２つのブロックは、マルチチャンネル信号の２つのチャンネルのサンプルであってもよい。
【０１２１】
上述の多次元リフティング式からの分解は、Ｎ×Ｎ行列とみなしてもよい変換規則に適用される。特にＤＣＴ−ＩＶについて、逆はやはりＤＣＴ−ＩＶであり、その結果、図１２に示す考え方に対して、以下の分解となる。

−１による乗算の置き換えを、別個のブロック行列に展開してもよく、結果は以下となる。

よって、信号の２つのブロック、すなわち離散値の２つのブロックへの変換の適用は、好ましくは３つの多次元リフティング工程で得られてもよい。

上記式は、一実施形態に基づく図１０ｃに図式的に示されている。逆変換も、上述のように、対応して図１１に示されている。
【０１２２】
この取り組みにより、長さＮの２つのＤＣＴ−ＩＶ変換が、可逆的なやり方で実現されてもよく、ここで、３Ｎ個の丸め工程、すなわち変換毎に３Ｎ／２個の丸め工程のみが必要である。
【０１２３】
３つの多次元リフティング工程におけるＤＣＴ−ＩＶは、任意の実施を有してもよく、例えば、浮動小数点を基本とした、または固定小数点を基本とした実施でもよい。これは、可逆的である必要さえない。順方向および逆方向処理が全く同じように行われればよい。その結果、この考え方は、１，０２４のような高い変換長に適している。それらは、現状の音声符号化アプリケーションにおいて使用されている。
【０１２４】
計算全体の複雑さは、２つのＤＣＴ−ＩＶ変換の整数でないものによる実施の計算の複雑さの１．５倍に等しい。それでも、この計算の複雑さは、従来のＤＣＴ−ＩＶの約２倍複雑な、従来のリフティングを基本とした整数による実施に対して極めて低い。なぜならば、このような実施は、エネルギーの保全を達成するために、使用するリフティングスキームに基づく自明の正／負バタフライ演算を使用しなければならないからである。このことは、Ｒ．ガイガー（Ｇｅｉｇｅｒ）、Ｔ．スポラー（Ｓｐｏｒｅｒ）、Ｊ．カラー（Ｋｏｌｌｅｒ）、およびＫ．ブランデンブルグ（Ｂｒａｎｄｅｎｂｕｒｇ）著、「整数変換に基づく音声符号化（ＡｕｄｉｏＣｏｄｉｎｇｂａｓｅｄｏｎＩｎｔｅｇｅｒＴｒａｎｓｆｏｒｍｓ）」、第１１１回音声技術協会大会（ＡＥＳＣｏｎｖｅｎｔｉｏｎ）、ニューヨーク、２００１年に記載されているとおりである。
【０１２５】
図示の取り組みでは、少なくとも２つのＤＣＴ−ＩＶ変換を同時に計算することになり、いわば、すなわち、１つの変換で計算する。これは、例えば、音声信号の２つの連続するブロックまたは画像信号の２つの連続する画像について、ＤＣＴ−ＩＶ変換を計算することによって実現されてもよい。２チャンネルステレオ信号の場合には、変換動作および／または逆変換動作において、左および右チャンネルのＤＣＴ−ＩＶを計算することによって、これを実現してもよい。第１のバージョンは、システムに１ブロックのさらなる遅延を生じさせる。第２のバージョンは、ステレオチャンネルについて可能であり、および／または、一般的に言えば、マルチチャンネル信号について可能である。
【０１２６】
代わりに、両方の選択肢とも望ましくないがＮ個の値の通常のブロック処理長を維持すべきである場合、長さＮのＤＣＴ−ＩＶは、長さＮ／２の２つのＤＣＴ−ＩＶ変換に分解されてもよい。これに関連して、本分解が説明されている、Ｙ．ゼン（Ｚｅｎｇ）、Ｇ．ビ（Ｂｉ）、Ｚ．リン（Ｌｉｎ）著、「リフティング因数分解に基づく整数正弦波変換（Ｉｎｔｅｇｅｒｓｉｎｕｏｓｉｄａｌｔｒａｎｓｆｏｒｍｓｂａｓｅｄｏｎｌｉｆｔｉｎｇｆａｃｔｏｒｉｚａｔｉｏｎ）」、国際音響スピーチおよび信号処理学会（ＩＣＡＳＳＰ）会報’０１、２００１年５月、１，１８１〜１，１８４頁を参照されたい。長さＮ／２の２つのＤＣＴ−ＩＶ変換に加えて、ギブンズ回転のいくつかの追加的な段階が必要である。このアルゴリズムにおいて、さらに適用されるブロック行列がある。

すなわち、Ｎ／２の正／負バタフライ演算と、Ｎ／２個のギブンズ回転を伴うブロック対角行列と、さらなる何らかの置換行列である。Ｎ／２個のギブンズ回転のこれらの追加的な段階を使用して、多次元リフティングの取り組みが、長さＮのただ１つのＤＣＴ−ＩＶの計算のために使用されてもよい。このアルゴリズムの基本構成が、図１５に示される。ここで、長さがＮ／２の２つのＤＣＴ−ＩＶ変換が使用される実際の変換段階に加えて、離散値の第１および第２のブロックを計算するためのバタフライ演算段階がまずあるが、離散値は、Ｎ／２の長さを有するだけである。さらに与えられているのは、変換表現の出力値のブロックおよび変換表現の出力値のさらなるブロックからの出力値ｙ₀，…，ｙ_N-1を得るための出力側の回転段階であるが、出力値は、Ｎ／２の長さを有するだけであり、ここで、前者は、図１５および図１２の入力側および出力側の指標と比べて明らかになるように、図１２のＤＣＴ−ＩＶ動作の出力値に等しい。
【０１２７】
ここまで、以下の形式のブロック行列への多次元リフティングの適用のみを説明した。

また一方、他のブロック行列を多次元リフティング工程に分解することも可能である。例えば、以下の分解を使用される。正規化された正／負バタフライ演算を伴う段階と、多次元リフティングの３つの工程によるＤＣＴ−ＩＶ変換の２つのブロックとの組合せを実現してもよい。

上記式から、上記式の左側の括弧において使用される第１の変換規則と、上記式の中央の括弧において使用される第２の変換規則と、上記式の最後の括弧において使用される第３の変換規則とは、同一である必要はないことが明らかになる。さらに、上記式から、主要な対角要素のみが塞がっているブロック行列が分解されてもよいだけでなく、完全に塞がっている行列が処理されてもよいことが明らかになる。さらに注意すべきは、変換表現への変換に使用される変換規則は、互いに同一である必要性という制限、または、例えば第２の変換規則は第１の変換規則の逆方向変換規則であるというような、互いに何らかの関係を有する必要性という制限さえない。基本的には、逆表現が考慮される限り、３つの互いに異なる変換規則が使用されてもよい。
【０１２８】
これに関連して、図１０ｃおよび１１を再び参照する。変換表現への離散値の変換において、手段１０２は、任意の変換規則１を実施するように形成されてもよい。さらに、手段１０８は、変換規則２と称される任意の他の、または同一の変換規則を使用するように形成されてもよい。さらに、手段１４０は、任意の変換規則３を一般的に使用するように形成されてもよく、変換規則３は、必ずしも第１または第２の変換規則と同一である必要はない。
【０１２９】
また一方、変換表現の逆変換において、変換のための第１の手段１２４は図１０ｃのブロック１４０で実行された変換規則３以外はどの変換規則も実行しないというような、図１０ｃで説明した変換規則１から３の適応があることがわからなければならない。これに対応して、図１１の手段１３０は、図１０ｃにおいてブロック１０８によって実行された変換規則２を実行しなければならない。最後に、図１１の手段１５０は、可逆逆変換を得るために、図１０ｃの手段１０２によって実行された変換規則１を実行しなければならない。
【０１３０】
図１６は、図１０ｃにおいて説明した考え方の一変形を示す。特に、順方向変換のための要素１０４，１１０，１４２または逆方向変換のための要素１２６，１３２，１５２における丸めは、もはやサンプル的には実行されないが、丸めエラーのスペクトル整形がある。
【０１３１】
図１０ｃから図１６までを比較すると、ブロック１０４のみをブロック２０４ａに置き換え、丸めブロック１１０の代わりにブロック２０４ｂを使用するのが好ましいことが明らかである。そうであるのは、スペクトル整形が行われない場合には丸めエラーのホワイトノイズが問題となる周波数範囲への後続の変換がある場合には、この考え方が特に有利だからである。丸め１４２の後には周波数変換がないので、ブロック１４２のスペクトル整形は、もはや利点を含まない。また一方、ブロック２０４ａについては上記の場合となる。なぜなら、ブロック１０８における変換によって周波数変換が再びあるからである。よって、ブロック２０４ｂにおける進歩的なスペクトル整形は、まだ利点がある。なぜならば、最後のブロック１４０による変換が再びあるからである。しかしながら、図１６に関連して明らかなように、ノイズ整形された丸めエラーは、既に出力ブロック１１４に入力されており、よって、ブロック２０４ｂにおいて、丸めエラーのスペクトル整形の代わりに、図１０ｃにおけるブロック１１０によって示すように、共通の丸めが既に行われている可能性がある。
【０１３２】
第２の変換端、すなわち変換１０８において、スペクトル整形丸めがあるか、それともホワイトスペクトル分散を有する丸めエラーを有する共通の丸めがあるかは、個別の適用例に左右される。
【０１３３】
本発明によれば、例えばｋ個という所定の数の値の個別の丸めが、スペクトル整形を伴う丸めに置き換えられる。スペクトル整形を伴う丸めは、「従属丸め」とも称されてもよい。
【０１３４】
丸めエラーのスペクトル整形が、ＩｎｔＭＤＣＴに必要な整数ＤＣＴにおいて使用されてもよいことは、図１６に関連して上述から明らかになる。しかしながら、ここで考慮しなければならないのは、上述のように、エラーフィードバックによるスペクトル整形は、丸めるべき値がさらなる変換工程によって周波数領域に転送される時間信号である場合に特に利点を有するに過ぎないということである。したがって、図１６の多次元リフティングに関連して示すように、スペクトル整形は、最初の２つの工程においては利点があるが、第３の工程においては、もはや必ずしも利点があるわけではない。
【０１３５】
図１６は、本発明に係る図１０ｃに対応する符号器における場合を示すことに注意すべきである。図１６に対応する復号器における場合は、図１６および図１１の比較から直接帰着する。図１６に直接対応する復号器は、２つの丸めブロック１３２および１５２以外の全てのブロックが同一に動作するという点で、図１１から生じる。図１１において、これら２つの丸めブロックは、個別の丸めブロックとして動作し、進歩的な復号器においては、従属的な丸めブロック２０４ａおよび２０４ｂに置き換わることになり、これらのブロックは、全て、例えば図２ｃに関連して示す構成を有する。特に、符号器におけるのと全く同一のスペクトル整形丸めアルゴリズムが復号器において使用されることになっていることに注意すべきである。
【０１３６】
さらに、図２ｂおよび２ｃに示す考え方、特に、Ｈ（ｚ）＝「−１」は、丸めエラーの削減および、特に整数変換における丸めエラーの削減を使用するのに特に適している。丸めエラーのそのような削減は、２つの浮動小数点を丸めて異なる値の代わりに同一の値に加算する毎に可能である。そのような状況例を、図１７に示す。ここで、まず、リフティング関与値ｘ₁およびｘ₃間の下−上−下のシーケンスを伴う第１のリフティング工程がある。さらに、下−上−下のシーケンスであるが、今度はリフティング関与値ｘ₂およびｘ₃である第２のリフティング工程がある。特に、図１７から明らかなように、第１のリフティング動作において得られた値ｘ₃は、第２のリフティング工程における追加の値として機能するために使用される。繰り返すが、矢印が水平線に到達した場合、これは加算を表すことに注意すべきである。言い換えれば、それゆえに、丸められたばかりの値は、水平線に対応する値に加算される。
【０１３７】
特定的には、図１７に示す例において、値ｘ₁は、まず重み付けされ（ブロック２５０）、その後、個別に丸められる（ブロック２５２）。ブロック２５２の出力信号は、ｘ₃に加算される（ブロック２５４）。その後、加算２５４の結果は、再び重み付けされ（ブロック２５６）、再び丸められる（ブロック２５８）。この丸め２５８の結果は、ｘ₁に加算される（２６０）。加算２６０の結果は、再び重み付けされ（ブロック２６２）、丸められて（ブロック２６４）、ｘ₃の現在の値に加算される（ブロック２６６へ）。対応するように、値ｘ₂は、ブロック２７０によって重み付けされて、その後、ブロック２７２によって丸められる。ブロック２７２の結果は、ｘ₃の現在の値に加算される（２７４）。その後、再び、重み付け（２７６）および丸め（２７８）があって、ブロック２７８の結果は、ｘ₂の現在の値に再び加算される（２８０）。この加算２８０の結果は、再び重み付けされ（ブロック２８２）、重み付けされた結果は丸められて（ブロック２８４）、その後、丸めブロック２８４の結果は、現在の値であるｘ₃に再び加算される（ブロック２８６）。図１７から明らかなのは、まず、第１の値、すなわち、ブロック２６２の結果が丸められて、その後、ｘ₃に加算されるということである。加えて、第２の値、すなわち、ブロック２７０の結果も丸められて（ブロック２７２）、その後、値ｘ₃に加算される（加算器２７４）。そのように、２つの浮動小数点値が次々と丸められて、異なる値の代わりに同一の値に加算されるという状況がある。図１７に示す例において、第３および第４のリフティング工程の結果は、同一の値、すなわち、ｘ₃に加算されるので、加算は丸め関数［．］で行われる。

［ｘ₁・ｃｓ₁］＋［ｘ₂・ｃｓ₂］

丸めにおける第３のリフティング工程のエラーが第４のリフティング工程に与えられる場合には、第３の工程のエラーがこの場合は使用されてもよく、２つの丸めエラーの代わりに、１つの丸めエラーだけが生成される。計算に関して、これは、以下から生じる。

［ｘ₁・ｃｓ₁］＋［ｘ₂・ｃｓ₂＋（ｘ₁・ｃｓ₁−［ｘ₁・ｃｓ₁］）］＝
［ｘ₁・ｃｓ₁］＋［ｘ₂・ｃｓ₂＋ｘ₁・ｃｓ₁］−［ｘ₁・ｃｓ₁］＝
［ｘ₂・ｃｓ₂＋［ｘ₁・ｃｓ₁］

よって、計算に関して、丸めエラーを次の丸め工程に与えることは、この場合、値を加算して後続の丸めを行うことと同一である。この状況が、図１８に示される。図１８は図１７に対応しているものの、２つの別個の丸めブロック２６４，２７２および２つの別個の加算器２６６，２７４が、上記式を実施するために形成されたブロック２６８に置き換えられている。したがって、２つのブロック２６２，２７０の結果が、まず、丸められていない形式で加算されて、その後、丸められる。よって、好ましい場合では、丸めエラーは半分までとなる。ブロック２６８の出力において、加算器２６９によってｘ₃に加算される１つの単一の値のみが生じる。
【０１３８】
例えば、図１９に示すように、ギブンズ回転の組みと多次元リフティング工程とが互いに引き続いて生じる場合には、丸めエラーの削減および整形の組合せが生じてもよい。ここで、ほんの一例として、いくつかの値についての下−上−下のシーケンスの最後の工程が、値ｘ₁からｘ₄、すなわち、例えば、図９の下ステップ３１ｃに行われる。これらの値は、対応の値に加算されることになっており、対応の値に対しては、図１６における丸められた値、すなわち、ブロック２０４ａの出力における値も加算されることになっている。この場合、好ましくは、丸められていない値を、すなわち、図１９に示される加算器２０３によってまず加算して、その後、加算された値を図１９のブロック２０４で丸めると同時に、ノイズ整形を施して、単純な丸めエラーのみを取得して、加算器１０６による加算後の出力値があまりエラーを含まないようにする。よって、図１９の状況は、図９が図１６の左側に置いた場合に置かれ、特に、Ｎ個の値ＤＣＴ−ＩＶの代わりにＮ／２値ＤＣＴ−ＩＶが使用される場合に生じる。
【０１３９】
したがって、本発明によれば、丸めエラーの削減を丸めエラーの整形と組み合わせるのが好ましい。よって、丸めエラーの削減の場合には、いくつかの入力値がまとめて処理され、かつ丸められ、丸められた値は１つの値に加算されるのに対し、丸めエラーのスペクトル整形の場合には、丸められた値はそれぞれ独立して丸められ、いくつかのそれぞれ異なる他の値に加算される。
【０１４０】
さらに注意すべきなのは、図１５に示すように、Ｎ／２のＤＣＴが使用される場合にも、図１９の状況が生じてもよいことである。ここで、変換段階の前に、すなわち、２つのＤＣＴブロックの前に、図１５においてバタフライ段階と称される段階が存在し、そこにおいて、入力値ｘ₀からｘ_N/2-1が対応するように重み付けがされ、かつ丸められて、その後、ＤＣＴ−ＩＶ段階の値が加算されるのと同一の値に加算される。さらに注意すべきなのは、図１５における変換段階は、模式的に示しているに過ぎないということである。図１６において、ｘ_N-1の代わりにｘ_N/2-1が書き込まれ、ｘ_N/2の代わりに書き込まれ、ｘ_N/2-1の代わりにｘ_N-1が書き込まれる場合には、図１５に模式的に示す２つのＤＣＴ−ＩＶブロックは、特定の一実施においては、図１６に示す構成要素に置き換えられてもよい。
【０１４１】
よって、図１９は、特に単一のアプリケーションのための、すなわちＮ／２のＤＣＴ−ＩＶが使用されるべき場合についての好ましい一実施を示す。
【０１４２】
状況によっては、離散値のシーケンスを有する信号を処理するための進歩的な方法は、ハードウェアまたはソフトウェアにおいて実施されてもよい。その実施は、デジタル記憶媒体、特にフロッピー（登録商標）ディスクまたはＣＤ上に、電子的に読み出しうる制御信号と共に行われてもよく、当該方法が行うために、プログラム可能なコンピュータシステムと協働してもよい。よって、一般的に、本発明は、コンピュータ上で実行される場合に、機械読み取り可能なキャリア上に記憶された進歩的な方法を行うためのプログラムコードを伴うコンピュータプログラム製品にもある。よって、言い換えれば、本発明は、コンピュータ上で実行される場合に、当該方法を行うためのプログラムコードを伴うコンピュータプログラムでもある。
【図面の簡単な説明】
【０１４３】
【図１】離散値のシーケンスを有する信号を処理するための進歩的な考え方のブロック回路図を示す。
【図２ａ】量子化エラーを高域スペクトル整形するための既知の考え方を示す。
【図２ｂ】本発明に係る丸めエラーを低域整形するための考え方を示す。
【図２ｃ】スペクトル整形／丸めブロックについての、本発明の好ましい一実施形態に係るブロック回路図である。
【図３】整数スペクトル値を決定するであろう整数値を取得するために時間離散音声サンプルを処理するための好ましい手段のブロック回路図である。
【図４】ＭＤＣＴおよび逆ＭＤＣＴをギブンズ回転および２つのＤＣＴ−ＩＶ動作へ分解することについての概略図である。
【図５】５０％重複のあるＭＤＣＴを回転およびＤＣＴ−ＩＶ動作へ分解することを示すための図である。
【図６ａ】ＭＤＣＴおよび５０％重複を使用する既知の符号器の概略ブロック回路図を示す。
【図６ｂ】図１０ａによって生成された値を復号化するための既知の復号器のブロック回路図を示す。
【図７】図３に係る窓掛けにおけるリフティングの図である。
【図８】実際の変換前に窓掛けするための、図７のリフティングの「再分類された」図である。
【図９】図３，７および８に係る窓掛けのための、本発明の一応用を示す。
【図１０ａ】本発明の好ましい一実施形態に係る変換のための装置のブロック回路図を示す。
【図１０ｂ】本発明の好ましい一実施形態に係る変換のための装置のブロック回路図を示す。
【図１０ｃ】本発明の好ましい一実施形態に係る変換のための装置のブロック回路図を示す。
【図１１】本発明の好ましい一実施形態に係る逆変換のための装置を示す。
【図１２】本発明のために使用可能な、値の２つの後続ブロックの変換の図である。
【図１３】順方向変換行列を使用する多次元リフティング工程の詳細図である。
【図１４】逆方向変換行列を使用する多次元逆リフティング工程の図である。
【図１５】長さＮのＤＣＴ−ＩＶを長さＮ／２の２つのＤＣＴ−ＩＶに分解するための本発明の図である。
【図１６】図１０の多次元リフティングを使用する変換内での進歩的な考え方の一応用を示す。
【図１７】２つの連続リフティング工程の図である。
【図１８】図１７の２つの連続リフティング工程における丸めエラーを減少させるための考え方の図である。
【図１９】図１６の考え方を使用する図１８の考え方の逆の組合せを示す。

【特許請求の範囲】
【請求項１】
離散値のシーケンスを有する信号を処理するための装置であって、信号が高いエネルギーを有する第１の周波数範囲が存在し、信号が低いエネルギーを有する第２の周波数範囲が存在し、
処理値のうちの少なくとも１つは整数でないように、処理値のシーケンスを得るために、離散値のシーケンスを処理する手段（２０２）と、
丸められた処理値のシーケンスを得るために、処理値のシーケンスを丸めるための手段（２０４）とを備え、丸めるための手段（２０４）は、スペクトル整形された丸めエラーが第２の周波数範囲におけるよりも高いエネルギーを第１の周波数範囲において有するように、生成された丸めエラーのスペクトル整形を生じさせるように形成される、装置。
【請求項２】
信号は時間信号であり、離散値は時間離散値であり、
少なくとも丸められた処理値のシーケンスまたは丸められた処理値のシーケンスから派生したシーケンスを、第１の周波数範囲において丸めエラーを第２の周波数範囲におけるよりも多く含むスペクトル係数を伴うスペクトル表現に変換するための手段（２０８）と、
スペクトル表現を符号化するための手段（２０８）とをさらに備える、請求項１に記載の装置。
【請求項３】
第１の周波数範囲は低周波数の範囲であり、第２の周波数範囲は高周波数の範囲であり、丸めるための手段（２０４）は、与えられた戻りエラーｅ（ｎ）を選別するための低域通過特性を使用してスペクトル整形が生じるように形成される、請求項１または請求項２に記載の装置。
【請求項４】
丸めるための手段（２０４）は、第１の離散値を丸め（２１８）、離散値を丸める際に生じた丸めエラーを判別し（２１４）、丸めエラーを評価し（２２０）、評価された丸めエラーを、シーケンス内の第１の離散値に隣接する第２の離散値に結合して結合値を得（２１０）、結合値を丸めて第２の値の丸めたものを得る（２１８）ように形成される、請求項１ないし請求項３のいずれかに記載の装置。
【請求項５】
丸めるための手段（２０４）は、伝達関数が「−１」に等しい丸め関数で丸めエラーを評価するために形成される、請求項１ないし請求項４のいずれかに記載の装置。
【請求項６】
離散値は、整数値である、請求項１ないし請求項５のいずれかに記載の装置。
【請求項７】
丸めるための手段（２０４）は、処理値よりも低い精度を有する丸められた値を生成するために形成される、請求項１ないし請求項６のいずれかに記載の装置。
【請求項８】
整数窓掛けまたは整数逆窓掛けを処理として行うように形成された装置であって、
信号は、２Ｎ個の離散値のブロックからのＮ／２個の離散値を含み、
処理するための手段（２０２ａ）は、各Ｎ／２個の離散値を第１のリフティング工程によって決定された値で重み付けをするように形成され、
装置は、加算値の第１のシーケンスを得るために、２Ｎ個の離散値のブロックのさらなるＮ／２個の離散値に対する、丸められた処理値のシーケンスの値的な加算を行うとする第１の加算器（２０５ａ）をさらに備え、
装置は、加算値の第１のシーケンスの各値を第２のリフティング工程によって決定された値で重み付けをして、処理値のさらなるシーケンスを得るために処理するためのさらなる手段（２０２ｂ）をさらに備え、
装置は、丸めを行って丸められた処理値のさらなるシーケンスを得るためのさらなる手段（２０４ｂ）を備え、
装置は、値的な加算を行って加算値の第２のシーケンスを得るための第２の加算器（２０５ｂ）を備え、
装置は、加算値の第２のシーケンスの各値を第３のリフティング工程によって決定された値で重み付けをして、処理値のさらに他のシーケンスを得るために処理するためのさらに他の手段（２０２ｃ）を備え、
装置は、丸められた処理値のさらに他のシーケンスを得るための、さらに他の丸め手段（２０４ｃ）をさらに含み、
装置は、加算値の第３のシーケンスを得るための第３の加算器（２０５ｃ）をさらに含み、
処理値のさらに他のシーケンスは、Ｎ／２個の窓掛けされた値または逆窓掛けされた値であり、
加算値の第３のシーケンスは、さらなるＮ／２個の窓掛けされた値または逆窓掛けされた値である、請求項１ないし請求項７のいずれかに記載の装置。
【請求項９】
処理するための手段は、以下の係数をＮ／２個の値についての重み付け係数として使用するように形成され、

ＧＦ_k＝（ｃｏｓα−１）／ｓｉｎα

ＧＦｋは順序指数ｋを伴う値についての重み付け係数であり、αは以下の式が当てはまる角度であり、

α＝ａｒｃｔａｎ［ｗ（Ｎ／２−１−ｋ）／ｗ（Ｎ／２＋ｋ）］

ｋは０からＮ／２−１までの範囲であり、ｗはウィンドウ関数を表す、請求項８に記載の装置。
【請求項１０】
処理するための手段は、以下の係数をＮ／２個の値についての重み付け係数として使用するように形成され、

ＧＦ_k＝ｓｉｎα

ＧＦ_kは順序指数ｋを伴う値についての重み付け係数であり、αは以下の式が当てはまる角度であり、

α＝ａｒｃｔａｎ［ｗ（Ｎ／２−１−ｋ）／ｗ（Ｎ／２＋ｋ）］

ｋは０からＮ／２−１までの範囲であり、ｗはウィンドウ関数を表す、請求項９に記載の装置。
【請求項１１】
処理するためのさらなる手段は、以下の係数をＮ／２個の値についての重み付け係数として使用するために形成され、

ＧＦ_k＝（ｃｏｓα−１）／ｓｉｎα

ＧＦ_kは順序指数ｋを伴う値についての重み付け係数であり、αは以下の式が当てはまる角度であり、

α＝ａｒｃｔａｎ［ｗ（Ｎ／２−１−ｋ）／ｗ（Ｎ／２＋ｋ）］

ｋは０からＮ／２−１までの範囲であり、ｗはウィンドウ関数を表す、請求項８，９，または１０のいずれかに記載の装置。
【請求項１２】
窓掛けのために形成され、変換するための手段（２０６）が後置されるか、逆窓掛けのために形成され、スペクトル領域から時間領域へ逆変換するための手段が前置される、請求項８ないし請求項１１のいずれかに記載の装置。
【請求項１３】
逆変換するための手段または変換するための手段は、ＤＣＴ−ＩＶ手段を含む、請求項１２に記載の装置。
【請求項１４】
処理するための手段（２０２）は、変換規則を使用して処理を行って、整数でない離散値のシーケンスに対応する変換値のブロックを得るための手段（１０２，１０８，１３０，１５０）である、請求項１ないし請求項１３のいずれかに記載の装置。
【請求項１５】
処理するための装置（２０２）は、ＤＣＴ−ＩＶアルゴリズムを実行するための手段である、請求項１４に記載の装置。
【請求項１６】
元信号から符号化された表現を生成するための符号器の一部か、符号化された信号から復号化された表現を生成するための復号器の一部である、請求項１ないし請求項１５のいずれかに記載の装置。
【請求項１７】
符号器および復号器は、共に可逆符号化手法を表す、請求項１６に記載の装置。
【請求項１８】
離散値のシーケンスを有する信号を処理するための方法であって、信号が高いエネルギーを有する第１の周波数範囲が存在し、信号が低いエネルギーを有する第２の周波数範囲が存在し、
処理値のシーケンスを得るために、処理値のうちの少なくとも１つは整数でないように、離散値のシーケンスを処理する工程（２０２）と、
丸められた処理値のシーケンスを得るために処理値のシーケンスを丸める工程（２０４）とを備え、丸めるための手段（２０４）は、スペクトル整形された丸めエラーが第２の周波数範囲におけるよりも高いエネルギーを第１の周波数範囲において有するように、生成された丸めエラーのスペクトル整形を生じさせるように形成される、方法。
【請求項１９】
プログラムは、コンピュータ上で動作する際の請求項１８に記載の方法を実行するためのプログラムコードを伴うコンピュータプログラム。

【図１】

【図２ａ】

【図２ｂ】

【図２ｃ】

【図３】

【図４】

【図５】

【図６ａ】

【図６ｂ】

【図７】

【図８】

【図９】

【図１０ａ】

【図１０ｂ】

【図１０ｃ】

【図１１】

【図１２】

【図１３】

【図１４】

【図１５】

【図１６】

【図１７】

【図１８】

【図１９】

【公表番号】特表２００７−５１０１６７（Ｐ２００７−５１０１６７Ａ）
【公表日】平成１９年４月１９日（２００７．４．１９）
【国際特許分類】

【出願番号】特願２００６−５３００３３（Ｐ２００６−５３００３３）
【出願日】平成１６年９月２８日（２００４．９．２８）
【国際出願番号】ＰＣＴ／ＥＰ２００４／０１０８５４
【国際公開番号】ＷＯ２００５／０３４０８８
【国際公開日】平成１７年４月１４日（２００５．４．１４）
【出願人】（５９１０３７２１４）フラウンホッファー−ゲゼルシャフト　ツァ　フェルダールング　デァ　アンゲヴァンテン　フォアシュンク　エー．ファオ (259)
【Ｆターム（参考）】

ＴＶ信号の圧縮、符号化方式 (95,325)

[ Back to top ]

離散値のシーケンスを有する信号を処理するための装置および方法

メニュー

スポンサーリンク

次の公報 »

« 前の公報

離散値のシーケンスを有する信号を処理するための装置および方法

メニュー

スポンサー リンク

次の公報 »

« 前の公報

スポンサーリンク