説明

カスケードフィルタバンクにおけるエイリアシングを削減する方法および装置

【課題】カスケードフィルタバンクにおいて近接するサブバンド間のエイリアシングを削減する方法および装置を提供する。
【解決手段】エイリアス削減フィルタバンクは、第一ステージフィルタバンクのMサブバンドからの一連のMサブバンドからの信号をフィルタリングし、加える。次に続く分析フィルタバンクによりエイリアス削減ステージ後に高周波解像度が得られる。これらのサブバンドの信号は最初にエイリアス削減フィルタバンクに供給され、エイリアシングを減じる。第一ステージフィルタバンクがMバンドを有する変調均一フィルタバンクであり、エイリアス削減のステージがMバンドを有し、エイリアスキャンセルが可能となる場合、エイリアス削減フィルタバンクは、M/Mのサンプリングレート比率により基準化された周波数を有するが、第一ステージの合成フィルタバンクと類似する周波数応答を有していなくてはならない。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は一般的にカスケードフィルタバンクに関するものであり、さらに詳しくいうと、カスケードフィルタバンクにおけるエイリアシングを削減する方法および装置に関する。
【背景技術】
【0002】
本発明は次に記載する米国特許出願に関連するものである。すなわち、米国特許出願における発明の名称、「分離無関係性削減および冗長削減を用いる音声信号の知覚コーディング」(“Perceptual Coding of Audio Signal Using Separated Irrelevancy Resolution and Redundancy Reduction”)(代理人登録番号Edler 1−4)、米国特許出願における発明の名称、「知覚オーディオコーダにおいてマスクされたしきい値を表す方法および装置」(“Method and Apparatus for Representing Masked Threshold in a Perceptual Audio Coder”) (代理人登録番号Edler 2−2−6)、米国特許出願における発明の名称、「異なるスペクトル/時間解像度により無関係性削減と冗長削減を実行するカスケードフィルタバンクを用いる音声信号の知覚コーディング」(“Perceptual Coding of Audio Signals Using Cascaded Filterbanks for Performing Irrelevancy Reduction and Redundancy Reduction With Different Spectral/Temporal Resolution”) (代理人登録番号Edler 3−4)、および、米国特許出願における発明の名称、「ノイズ状信号コンポーネントを検出する方法および装置」(“Method and Apparatus for Detecting Noise-Like Signal Components”) (代理人登録番号Fink Faller 3)であり、これらは同時期に請求権申請がなされ、本発明の譲受人に譲渡されたものであり、ここに参考までに記載を行う。
【0003】
信号圧縮アプリケーションにおいて、非均等バンド分割によるフィルタバンクはしばしば最大コード利得を得ることが望まれる。音声コーディングアプリケーションにおいて、例えば、バンド分割は、信号が検出された後の量子化雑音の時間と周波数形状がどのように音響心理学可聴しきい値にマッチされるかも決定する。例えば、参考までに引用すると、D. Sinha等により、1998年、CRCプレス(デジタルオーディオ、セクション42、42−1から42−18)に発表された「知覚オーディオコーダ」(“Perceptual Audio Coder”) を参照にされたい。
【0004】
このような非均等バンド分割を得るために木構造がしばしば使われる。例えば、木構造は、M.VetterliとJ.Kovacevicにより、1995年、Prenticeホールに発表された「ウェーブレットおよびサブバンドコーディング」(“Wavelets and Subband Coding”)に記載がなされているようなウェーブレット変換を実行するであろう。ここで、図1に示すように、低周波バンド120のような1つあるいはそれ以上の周波数バンド120、130が、追加のサブバンド140−1から140−3にさらに分割される。他のアプローチとして、1997年、H.S.Malvarにより、アコースティクス、スピーチ、および信号処理に関する国際コンファレンス(ドイツ、ミュンヘン)2421−2424において発表された「削減されたブロッキングおよびリンギングアーティファクトによるコーディング変換のためのラップされた陪直交変換」(“Lapped Biorthogonal Transform for Transform Coding with Reduced Blocking and Ringing Artifacts”)に記載がなされているように、均一フィルタバンクを用いていくつかのサブバンドを1つのより広いバンドに合わせてバンド幅を増やす。他のアプローチでは、1995年、J.PrincenとJ.D.Johnstonにより、ICASSP(ミシガン州、デトロイト)3071−3074において発表された「信号適用フィルタバンクによる音声コーディング」(“Audio Coding with Signal Adaptive Filterbanks”)に記載がなされているように、遷移フィルタを用いていくつかの異なる均一フィルタバンクを合わせる。
【0005】
図1に示すカスケードフィルタバンク100のようなカスケードフィルタバンクは、互いに続いた異なるフィルタバンク110、160を有し、異なる周波数と時間解像度を得る。カスケードフィルタバンク100の問題は、フィルタは完全ではないため、各サブバンドフィルタ後のダウンサンプリングはエイリアシングとなることである。フィルタ通過バンド外のエネルギーを有する信号がフィルタの通過バンド内に「反映される」時にエイリアシングが生じる。
【0006】
このミラー信号が次フィルタの通過バンド内にある場合、信号の減衰はカスケードの第一フィルタによってのみ決定される。これにより、コンバインされたフィルタバンクの周波数選択性はあまりよくない。図2は、第一ステージの全サブバンドが分割される場合、第一ステージで128バンド、かつ次のステージで8バンド、合計で1024バンドを有するカスケードから成るフィルタバンクのある特定のバンドの振幅反応200を表したものである。振幅反応200においてエイリアシングは、部分的に10dB以下の減衰により、メインローブ以外に高ピーク時に現れる。比較のため、図3において所望する振幅反応300を示しており、ここで1024バンド均一フィルタバンクの特定のバンドを示している。
【0007】
MadisettiおよびD.B.Williamsにより、1997年、CRCプレス、IEEEプレス(フロリダ州、Boca Raton)に発表の「デジタル信号処理ハンドブック」(“Digital Signal Processing Handbook”)において記載されているように(参考までにここに引用する)、このタイプのエイリアシングを削減するアプローチがMPEG−1/Layer3オーディオコーダに取り込まれてきた。MPEG−1/Layer3オーディオコーダは、第一ステージで32バンド、第二ステージで6バンドあるいは18バンド(変換可能)を有するカスケードフィルタを用いる。この特別のタイプのフィルタバンク用に、バタフライ状構造が第二ステージの出力時に使用され、近接バンド間のエイリアシングを削減する。例えば、参考までに記載すると、B.Edlerにより、1992年6月、エレクトロニクスレター第28巻、No.12の1104ページから1105ページに発表された「デシメーションによるカスケードフィルタバンクのサブバンドにおけるエイリアシング削減」(“Aliasing Reduction in Subbands of Cascaded Filter Banks with Decimation”)を参照にされたい。
【発明の概要】
【発明が解決しようとする課題】
【0008】
MPEG−1/Layer3オーディオコーダに取り込まれたエイリアス削減技術は近接するバンドにおけるエイリアシングを削減するよう働くが、1つの近接からだけのエイリアシング削減、かつ、特定のフィルタバンクのみのエイリアシング削減を行うにとどまる。ここで、近接するバンドのエイリアシングは180度の位相シフトを有する。よって、1近接バンドよりもさらに多くの近接するバンド間のエイリアシングを削減し、これに一定の位相関係が必要とされないような方法および装置が求められる。
【課題を解決するための手段】
【0009】
一般的に、カスケードフィルタバンクにおける近接サブバンド間のエイリアシングを削減するための方法および装置を開示する。本発明により、高周波解像度が一連のサブバンドより得られる。これらのサブバンドの信号は最初にエイリアス削減フィルタバンクに供給されエイリアシングを削減する。第一ステージフィルタバンクがMバンドを有する変調均一フィルタバンクであり、かつ、エイリアス削減フィルタバンクがMバンドを有し、エイリアスキャンセルが可能となる場合、エイリアス削減フィルタバンクは、サンプリングレートM/Mの比率により基準化された周波数を有するが、第一ステージの合成フィルタバンクと同じ周波数応答を有していなくてはならない。エイリアス削減フィルタステージの後に、高周波解像度を得るために分析フィルタバンクが次に続く。
【0010】
本発明のさらなる態様に基づいて、第一ステージ分析フィルタバンクの合成フィルタバンクは、M/M番目サブストラクチャごとにのみ保有することにより「間引きされる」ことが出来る。開示した一方法において、エイリアシングが削減された4バンド合成フィルタバンクから2バンドエイリアス削減フィルタが生成される。結果の2バンドフィルタバンクは、4バンドフィルタバンクと類似する周波数応答(スケーリングまで)を有することから、これによりエイリアス削減に使用出来る。
【0011】
本発明のより完全な理解および本発明のさらなるフューチャと効果が、次に記載する発明の実施の形態、および図面を参照することによってより明らかとなろう。
【図面の簡単な説明】
【0012】
【図1】異なる周波数と時間解像度を得るため、互いに続いた異なるフィルタバンクを有する従来のカスケードフィルタバンクを示す図である。
【図2】従来のフィルタバンクの特定のバンドの振幅反応におけるエイリアシングを示す図である。
【図3】均一非カスケードフィルタバンクにおいてカスケードにすることからエイリアシングのない振幅反応を示す図である。
【図4】本発明によるカスケードフィルタバンクを示す図である。
【図5】図4のカスケードフィルタバンクにおける使用に適した4バンド分析フィルタバンクを示す図である。
【図6】エイリアシングが削減された4バンド合成フィルタバンクを示す図である。
【図7】本発明に基づいて、図6の4バンド合成フィルタバンクから生成した4バンド合成フィルタバンクを示す図である。
【発明を実施するための形態】
【0013】
図4は、本発明によるカスケードフィルタバンク400を示したものである。本発明の1つのフューチャに基づいて、カスケードフィルタバンク400は第一分析フィルタバンク410のエイリアス削減フィルタバンク420を含む。以下に詳細な記載を行うように、エイリアス削減フィルタバンク420は、適するフィルタ設計により異なるフィルタ間のエイリアシング構成要素をキャンセルし、かつ、合成フィルタバンクの出力ステージで全信号を加えることによりエイリアシングの削減を可能にする。
【0014】
本発明による技術は、近接するサブバンド間のエイリアシングをキャンセルするか、あるいは削減することに使用可能である。一連のサブバンドから高周波解像度を得る目的で、エイリアシングを削減するためにエイリアス削減フィルタバンク420のようなエイリアス削減フィルタバンクにこれらのサブバンドの信号が最初に供給される。第一ステージフィルタバンク410がMバンドを有する変調均一フィルタバンクであり、エイリアス削減フィルタバンク420がMバンドを有し、エイリアスがキャンセルされる場合、サンプリングレートM/Mの比率により基準化された周波数を有するが、エイリアス削減フィルタバンク420は第一ステージの合成フィルタバンク(図示せず)と同様の周波数応答を有していなくてはならない。言い換えると、第二ステージエイリアス削減フィルタバンク420は、第一ステージの合成のプロトタイプの低周波部分(図示せず)と同様の周波数応答を有する窓関数あるいはベースバンドプロトタイプフィルタを有していなくてはならない。エイリアシング削減のためのエイリアス削減フィルタバンク420の後に、図4に示すように高周波解像度を得るための分析フィルタバンク430が続く。
【0015】
一般的に、エイリアス削減フィルタバンク420の振幅反応および位相は第一ステージフィルタバンク410における合成フィルタバンク(図示せず)の振幅反応に類似していなくてはならない。
【0016】
参考までに引用すると、Trans. on Signal Processingの第4巻、No.3においてG.SchullerとT.Karpにより発表された「任意システム遅延による変調フィルタバンク:効果的実行および時間変化ケース」(“Modulated Filter Bank with Arbitrary System Delay: Efficient Implementation and the Time-Varying Case”)に記載がなされているように、コサイン変調フィルタバンクはゼロ遅延マトリクスおよび最大遅延マトリクスを用いる公式により表されることを注記する。これは、ネストされた2つのバンドサブストラクチャから成る構造となる。
【0017】
図5は4バンドフィルタバンク500の例を示したものである。また、図6は、エイリアシングが削減された、一致する4バンド合成フィルタバンク600を示したものである。Tはこの場合、サイズ4・4を有するM・M離散コサイン変換タイプ4であり、T―1はこの場合、サイズ4・4を有するM・M逆離散コサイン変換タイプ4である。上記引用のG.SchullerとT.Karpによる論文を参照にされたい。
【0018】
最初に第一ステージフィルタが設計されると、エイリアシングが減じられたその一致する合成フィルタバンクの構造は、M/M番目サブストラクチャごとにのみ保有することにより「間引きされる」ことが出来る。例えば図7は、図6の4バンド合成フィルタバンク600から生成した2バンドエイリアスリダクションフィルタ700を示したものである。図7において、Tは2・2離散コサイン変換である。結果の2バンドフィルタバンクは同様の周波数応答を有することから(スケーリングまで)、エイリアス削減に使用出来る。
【0019】
構造の値lは結果の窓関数あるいはフィルタバンクのベースバンドプロトタイプを決定する。このより小さいフィルタバンクは構造をダウンサンプリングすることから得られるため、その窓関数は一定の方法により第一ステージフィルタバンクの窓関数をダウンサンプリングすることによって得られる。サブストラクチャは、長さMのブロック中央あたりで対称であることから、窓関数の結果のダウンサンプリングはアナログ方式で現れ、窓関数の長さMのダウンサンプリング各インターバルは各インターバル中央あたりで対称である。例えば、第一ステージフィルタバンクは4バンド(Mは4に等しい)を有すると仮定すると、その窓関数は次のフォームを有する。
1,2,3,4,4,3,2,1
【0020】
エイリアスキャンセルのための第二ステージは2バンドを有することである場合、第二ステージの窓関数は、次のように4サンプルの各ブロックにおける対称ダウンサンプリングから得られる。
2,3,3,2
【0021】
構造的公式はエイリアシングが減じられた全てのコサイン変調フィルタバンクに有効であることから、このダウンサンプリングルールもまたこれらのタイプのフィルタバンクに有効である。言い換えると、フィルタバンクおよび窓関数が第一ステージ対し与えられると、この非均一対称ダウンサンプリングにより得られる窓関数は自動的に、エイリアシングが減じられたフィルタバンクとなる。かつ、第一ステージ後にそれはエイリアシングを削減する。
【0022】
この方法を次の例により説明する。この例示における目的は、第一ステージにて128(均一)バンドの解像度と、最終ステージにおいて1024バンドの解像度を得ることである。図3は、カスケードにすることなく、均一1024バンドフィルタバンクの特定のバンドを拡大したものである。スタック化カスケードフィルタバンクにより、目的は最終ステージ後にこれに類似する周波数応答を得ることである。図2は、第一ステージにおいて128バンド、そして次ステージにおける各サブバンドにおいて次に続く8バンドを有する、従来のカスケードフィルタバンクであるが同一のチャネルを拡大したものである。エイリアシングはメインローブ以外に高ピーク時に容易に見られる。
【0023】
エイリアシングを削減するため、128バンドエイリアス削減フィルタバンクの構造が「ダウンサンプルされ」て、8近接バンドを横断するエイリアシングを削減するために8バンドエイリアス削減フィルタバンクが得られる。このダウンサンプリングは、第一ステージにおいて128バンド分析フィルタバンクを有する構造となる。次に、第二ステージにおいてエイリアス削減のため8バンドエイリアス削減フィルタバンクが続き、次に最終ステージで64バンド分析フィルタバンクが続く。この構造の全体エイリアス削減フィルタバンクは逆のステップをも含む。
【0024】
以上、本発明の実施形態を詳細に説明したが、本発明の範囲を逸脱することなく他の方法でも具体化できることは当業者にとって明らかである。

【特許請求の範囲】
【請求項1】
カスケードフィルタバンクにおいて近接するサブバンド間のエイリアシングを低減させる方法であって、
信号をフィルタリングして、第一のフィルタバンクにおける複数のサブバンドを用い複数の周波数コンポーネントを生成するステップと、
該第1のフィルタバンクにおける該サブバンドの出力のところでエイリアス削減フィルタバンクを用いて該周波数コンポーネントを加えるステップと、
第2のフィルタバンクにおける複数のサブバンドを用いて該加えられた周波数コンポーネントをフィルターするステップと、を含むことを特徴とする方法。
【請求項2】
前記エイリアス削減フィルタバンクの振幅応答は第一のフィルタバンクの合成フィルタバンクの振幅応答とほぼ等しいことを特徴とする請求項1に記載の方法。
【請求項3】
前記エイリアス削減フィルタバンクの位相特性が、第一のフィルタバンクの合成フィルタバンクの振幅応答とほぼ等しいことを特徴とする請求項1に記載の方法。
【請求項4】
前記第一のフィルタバンクにおける複数のサブバンドがMバンドから成り、前記エイリアス削減フィルタバンクがMバンドを有し、かつ前記エイリアス削減フィルタバンクが、M/Mの比率で基準化された、前記第一のフィルタバンクにおける合成フィルタバンクの周波性応答とほぼ等しいことを特徴とする請求項1に記載の方法。
【請求項5】
前記エイリアス削減フィルタバンクがコサイン変調フィルタバンクであり、M/M番目のサブストラクチャごとにのみ含むことを特徴とする請求項1に記載の方法。
【請求項6】
カスケードフィルタバンクであって、
信号を複数の周波数コンポーネントにフィルタするための複数のサブバンドから成る第1のフィルタバンクと、
該第1のフィルタバンクの出力のところに配置され、該周波数コンポーネントを加えるエイリアス削減フィルタバンクと、
該エイリアス削減フィルタに接続され、該エイリアス削減フィルタバンクにより生成された周波数コンポーネントをフィルタするための複数のサブバンドと、を備えることを特徴とするカスケードフィルタバンク。
【請求項7】
前記エイリアス削減フィルタバンクが、第一のフィルタバンクの合成フィルタバンクの振幅応答とほぼ等しいことを特徴とする請求項6に記載のカスケードフィルタバンク。
【請求項8】
前記エイリアス削減フィルタバンクの位相特性が、第一のフィルタバンクの合成フィルタバンクの振幅応答にほぼ等しいことを特徴とする請求項6に記載のカスケードフィルタバンク。
【請求項9】
前記第一のフィルタバンクにおける複数のサブバンドが、Mバンドから成り、前記エイリアス削減フィルタバンクがMバンドを有し、かつ前記エイリアス削減フィルタバンクが、M/Mの比率で基準化された、前記第一のフィルタバンクにおける合成フィルタバンクの周波性応答とほぼ等しいことを特徴とする請求項6に記載のカスケードフィルタバンク。
【請求項10】
前記エイリアス削減フィルタバンクが、コサイン変調フィルタバンクであり、M/M番目のサブストラクチャごとにのみ含むことを特徴とする請求項6に記載のカスケードフィルタバンク。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate


【公開番号】特開2011−176829(P2011−176829A)
【公開日】平成23年9月8日(2011.9.8)
【国際特許分類】
【出願番号】特願2011−41786(P2011−41786)
【出願日】平成23年2月28日(2011.2.28)
【分割の表示】特願2001−166291(P2001−166291)の分割
【原出願日】平成13年6月1日(2001.6.1)
【出願人】(301030605)アギア システムズ ガーディアン コーポレーション (15)
【氏名又は名称原語表記】Agere Systems Guardian Corporation