ルートｉ（√ｉ）演算の保持を特徴とする基数８固定小数点ＦＦＴ論理回路

【課題】高速フーリエ変換(FFT)演算の丸め誤差を軽減させること。
【解決手段】バタフライ演算（８ｐ）に含まれる複素平面上の回転因子のうちで、無理数（√、平方根）として現れるデータを意図的に計算することなく、多段にパイプライン化されているFFTの複数の段のうちの１つの段に設けられているメモリに保持(preserve)しておき、後段において再度現れたきたら、2つの回転因子を掛け合わせる演算を行う。このことによって、基数8 (radix-8)のバタフライ演算8p中の丸め誤差を無くすることができる。基数2 (radix-s)または基数4 (radix-4)のバタフライ演算によって、さらなる段を被せるように応用することもできる。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、高速フーリエ変換(FFT)処理の技術に関する。
【背景技術】
【０００２】
通信の広帯域化に伴い、より多くの情報に対する複雑な信号処理が必要となっている。例として、OFDM(Orthogonal Frequency Division Multiplexing: 直交周波数分割多重方式)や、FDE(Frequency Domain Equalization: 周波数領域等価)があり、これらの実現にはハードウエアを用いた高スループットのFFTが必要となる。
【０００３】
高スループットのFFTのハードウエア実装には、多量のハードウエアリソースが必要となる。また、このFFTの入出力にはADC、DACが用いられるが、広帯域化にともなう動作速度の向上によってADC、DACの有効ビット数ENoB(Effective number of bits)に限りがある。現状求められるFFTの次数、スループット、ADC/DAC のENoB数を記す。
【０００４】
・ 512-point（次数Ｎ＝５１２）FFT for IEEE802.15.3c ( mmWave )
・ 2.5G symbol per second
・ 8-bit ADC/DAC for 2.5G sps
【０００５】
上記の要求を満たし、かつ、回路規模を抑えたFFTの実装を可能とするためには、従来用いられている基数2や基数4より高い基数の基数8 (radix-8)を用いつつ、さらに、演算は固定小数点（ｊビット、ｊは自然数）で実装するといった工夫が必要となる。しかし、固定小数点 FFT は演算の際の丸め誤差が増加してしまう問題がある。
【０００６】
特許文献１では、その背景に、ローパワー＆安価な実装を目的として固定小数点のFFTを考えた場合、量子化誤差が生じることがある。その量子化誤差は、FFT内部でのrotationによって局所的に大きくなり、その大きくなった誤差が時間領域でのOFDM のCyclic Prefex部分に現れた場合は、送受信したい符号のノイズ元にはなりずらいが、逆にそれ以外の部分に乗るとノイズ元となる。
【０００７】
この特許文献１では、周波数領域においては、DC成分にこの誤差が乗った場合エラーが大きくなるが、サブキャリア側であればエラーの影響は少ない。そこで、IFFTしたのちにシンボルをシフトして、量子化誤差の生まれる場所をずらすことで、送受信したい符号へのエラーの影響を少なくする技術を開示している。
【０００８】
これに対して、本願発明は、FFT, IFFT内部での量子化誤差を下げる方法であるので、特許文献１の技術とは異なっている。
【０００９】
特許文献２では、その背景に、FFTの次数が増えるにつれて、SQNR( signal to quantization noise ratio)が下がって悪影響を及ぼすことがある。悪影響を減らすためには、高次のFFTでは、FFT内部の演算ビット数として長い word長が必要になる。また、FFT processor では、隣接する複数の入力データの値の有効桁を、隣接する値間で共通の有効桁となるように、隣接する複数のデータ全体で一つの有効桁を持つように実装するblock-floating point が使われる。
【００１０】
この特許文献２では、block-floating point を用いて複素乗算回路を減らすために、radix-8 を３ステージに分割（実質 radix-2に展開) してパイプライン動作させる方法を開示している。このことにより回路量は減るが、演算に要するレイテンシは３倍に伸びる。さらに、prefetch buffer と呼ばれる値をキャッシュするバッファを用いて、乗算回数をへらすように（3rd stage) スケジューリングをする方法を開示し、このprefetch buffer を生かして block-floating の正規化を効率よく実装している。
【００１１】
しかし、radix-8 での４５度回転部分を保持するといった本願発明に相当する技術的思想は無い。
【００１２】
特許文献３は、FFTの内部バタフライ演算単位で出力値をオーバーフローしない程度に最大の値を持つようにスケールさせる方法について開示している。比較的一般的な方法と思われるが、本願発明の方式とは異なる部分に関するものである。
【００１３】
特許文献４は、UWB用１28ビットFFT の演算を行うハードウエアアーキテクチャであって、butterfly-2のユニットと、radix-8を3-stage化(実質radix-2の組み合わせ)により実現したアーキテクチャが開示されている。非常に特定されたアーキテクチャの開示であって、本願発明の技術的思想は含まれていない。
【００１４】
特許文献５は、基数2のバタフライ演算を内部に有する FFT のパイプライン型FFTのアーキテクチャとその動作に関して開示されている。本願発明の基数8に関する特徴とはまったく異なるものである。
【００１５】
非特許文献１は、FFTアルゴリズムの代表的なものとして、Cooley-Tukey FFTとして知られているものである。
【先行技術文献】
【特許文献】
【００１６】
【特許文献１】WO 2009/142563 A1 METHOD FOR MOVING QUANTIZATION NOISE INTRODUCED IN FIXED-POINT CALCULATION OF FAST FOURIER TRANSFORMS （国際公開公報）
【特許文献２】US 2005/0289207 A1 FAST FOURIER TRANSFORM PROCESSOR, DYNAMIC SCALING METHOD AND FAST FOURIER TRANSFORM WITH RADIX-8 ALGORITHM （米国特許公開公報）
【特許文献３】US 2004/0111227 A1 METHOD AND SYSTEM FOR FIXED POINT FAST FOURIER TRANSFORM WITH IMPROVED SNR （米国特許公開公報）
【特許文献４】US 2006/0282764 A1 HIGH-THROUGHPUT PIPELINED FFT PROCESSOR （米国特許公開公報）
【特許文献５】WO 2007/115329 A2 FFT ARCHITECTURE AND METHOD （国際公開公報）（日本国への国内段階移行後の（日本語による）国内公表特表2009-535678号公報パイプラインＦＦＴのアーキテクチャおよび方法）
【非特許文献】
【００１７】
【非特許文献１】Cooley, James W., and John W. Tukey, “An algorithm for the machine calculation of complex Fourier series,” Math. Comput. 19, 297?301, 1965
【発明の概要】
【発明が解決しようとする課題】
【００１８】
本発明の目的は、ＦＦＴ演算の丸め誤差を軽減させることにある。
【課題を解決するための手段】
【００１９】
基数8 (radix-8)のFFT において、バタフライ演算に含まれる回転の項
【数１】

と
【数２】

を分離し、この数２に含まれる
【数３】

の項をFFT内部で保持して演算を回避することによって、限られた回路で演算誤差を軽減する演算方式および回路構成を実現する。
【００２０】
FFT/IFFT の演算の際に入出力間でのpowerの均等化が必要となる状況で、FFTの次数が2の奇数乗
【数４】

の場合には均等化のために
【数５】

倍という演算が必要になる。このFFT/IFFT の振幅変更の際のこの√２（ルート２）倍の演算を本願発明の構成を用いて誤差を軽減して求める。
【００２１】
上記の演算方式を用いることによって４５度の座標回転の演算や振幅を√２（ルート２）倍にする演算の誤差を軽減可能となるため、その特徴を生かし、通常軸上の constellation として出力する点を、45度回転して振幅を√２倍することで、座標平面を効率的に利用する。
【発明の効果】
【００２２】
本発明により、ＦＦＴ演算の丸め誤差が軽減される。
【図面の簡単な説明】
【００２３】
【図１】図１は、基数2、次数N=8の場合のFFTのバタフライ演算の様子を示す図である。
【図２】図２は、基数8のバタフライ演算(8pと記述)がFFT全体でどのような順番で処理されるかを図示したものである。
【図３】図３は、kが奇数となる回転因子の演算を保持(preserve)する場合の、基数8のバタフライ演算式を示す図である。
【図４】図４は図３で示した式が具体的にどのように構成されるかを示した図である。
【図５】図５は、軸上のシンボルの回転と振幅変更による ADC/DAC無変更での振幅拡大例を示す図である。
【図６】図６は、誤差のヒストグラムを示す図である。
【図７】図７は、S/N比を示す図である。
【発明を実施するための形態】
【００２４】
［ＦＦＴとＤＦＴの計算誤差］
高速フーリエ変換（FFT： Fast Fourier Transform)とは、離散フーリエ変換(DFT： Discrete Fourier Transform)を高速に演算するアルゴリズムである。次数NのDFTは、
入力を、
【数６】

出力を
【数７】

とした場合、次の数８で表される。
【数８】

【００２５】
この数８のうちの
【数９】

は「回転因子」であり、次数Nの離散フーリエ変換では、入力と回転因子の複素乗算をN回行い、それらN個の複素加算を行う。
【００２６】
DFTの計算誤差は、この複素乗算と複素加算によって生じる。Xkを計算するためには、DFTの式をそのまま演算した場合、N回の複素乗算とN回の複素加算が必要となる。
【００２７】
浮動小数点演算でDFTを求める場合、仮数部の有効桁数によって乗算、加算のいずれの場合でも丸めによる計算誤差が発生する。固定小数点演算でも同様で、有効桁より小さな値は丸められ、また、有効桁を越える演算結果となった場合はオーバーフローとなり演算結果は最大値に固定され正確な値は得られない。この丸め誤差の最大値は、演算結果を再度演算に用いる回数に比例して増加する。
【００２８】
［基数２(radix-2)のＦＦＴおよび計算誤差］
FFTアルゴリズムの代表的なものとしてCooley-Tukey FFT（非特許文献１）が知られており。それは次数NのDFTを
【数１０】

の演算量で行う高速化アルゴリズムである。次数の大きなFFTを計算する際に、演算をいくつかの集合に分割して行う方法がとられ、演算の際の集合の入出力数を「基数」と呼び、共通な演算部分を適切に選ぶことで演算の効率化が可能となる。
【００２９】
例として、基数2の場合はFFTの演算対象のある2点
【数１１】

に対し、数１４で示されるバタフライ演算を
【数１２】

の段数にわたって繰り返し行うことで演算が行われる。
【００３０】
図１は、基数2、次数N=8の場合のFFTのバタフライ演算の様子を示す図である。
【００３１】
図の網掛けの部分が以下の数１４であらわされるバタフライ演算部であり共通の演算である。
【００３２】
バタフライ演算間に現れる
【数１３】

は「回転因子」と呼ばれ、入力値を複素平面上で回転する演算を表す。
【数１４】

【００３３】
FFTの計算誤差は、このバタフライ演算の複素加算と乗算、および回転因子による回転によって生じる。FFTの次数がNの基数2のFFTの場合、あるXk の計算には数１１で表した回数のバタフライ演算、および回転因子の回転が行われる。これらの演算は複素加減算、乗算であるため、固定小数点の場合、演算のたびに計算誤差や有効桁操作による丸めが生じる。
【００３４】
［基数８(radix-8)のFFTおよび計算誤差］
FFT内部での演算回数（とくに乗算）を減らす方法として、基数をより大きなものにする方法が一般的に知られている。例として、基数8の場合のバタフライ演算に相当する演算を次の数１５に示す。基数8のため、一度の演算に扱う入出力は8次元となり、バタフライ演算はマトリックスに回転因子を含むものとして表示される。
【数１５】

【００３５】
図２は、基数8のバタフライ演算(8pと記述)がFFT全体でどのような順番で処理されるかを図示したものである。図２はFFTの次数 N=512 の場合について図示しており、左側の x がFFTへの入力であり、右側のX が出力である。8pは基数8の演算であるため、配列の次数Ｎが８のべき乗であり、パイプライン化された配列に、多段の
【数１６】

が割り当てられている場合には、ｋ回の8pの演算を行う必要がある。よって、次数N=512のFFTを行うためには、図２のようにある入力xに対して8pが3回適用される。8p演算の間の rotation & bit swap は、回転因子とビットの置換部分である。
【００３６】
ここで、8p演算の中の
【数１７】

は複素平面上の回転であり、特にkが奇数の場合は無理数となるため丸めの誤差が生じる。N=512 の例では3回の8p演算が行われるため、3回の演算の丸めの誤差が累積することになる。
【００３７】
［ルートi（√ｉ）演算保持基数8(radix-8)固定小数点FFT］
本願発明では、この基数8のバタフライ演算の丸め誤差を軽減する方法を開示する。前節において、
【数１８】

のkが奇数の場合に無理数となり丸め誤差が生じると述べた。ここでnを整数とした場合、無理数となる数１８は
【数１９】

で表すことができる。ここで、別の無理数となる数１８として
【数２０】

を考える。
【００３８】
この奇数同士の回転因子の乗算は、次の数２１のように変形できる。
【数２１】

この数２１は、
【数２２】

のいずれかの値となり、この演算においては丸め誤差を生じない。
【００３９】
この特性を利用して、kが奇数となる数１８を意図的に計算せず、FFTの後段で再度kが奇数となる数１８が現れた段階でこれら2つの回転因子を掛け合わせて演算を行うことによって、基数8のバタフライ演算8p中の丸め誤差を無くすというのが、本願発明の方法である。
【００４０】
図３は、kが奇数となる回転因子の演算を保持(preserve)する場合の、基数8のバタフライ演算式を示す図である。
【数２３】

はkが偶数となる数１８（回転因子）によって構成され、
【数２４】

はkが奇数となる数１８（回転因子）によって構成されている。
【００４１】
この数２３、数２４(保持しておくもの)が基数8のバタフライ演算のたびに交互に作用し値を交換することで演算が行われる。
【００４２】
次に示す、数２５、数２６のように表現される。
【数２５】

【数２６】

【００４３】
図４は図３で示した式が具体的にどのように構成されるかを示した図である。
【００４４】
数２３、数２４が並列に配置され入力値をそれぞれ処理し、後段へと値を伝播させる。図４の最後にある merged output は、数２４はkが奇数となる数１８が未処理のまま保持された値を出力しているため、merged output 部分でその未処理の演算を行って数２３と適切に足し合わせることにより、最終的なFFTの演算結果を得る。
【００４５】
このような構成は、コンピュータに実行させるシステムまたは方法として実現されるが、ハードウエア資源としてのメモリが、または、ハードウエア資源とソフトウエア資源とが協働するソフトウエアとしての配列要素の（仮想）メモリが、「保持」しておくことに利用することができる。
【００４６】
［本願発明の応用例（その１）］
本願発明は、基数8のFFTの丸め誤差を減らすものであるが、この構成の特徴を生かす応用例も考えられる。
【００４７】
一つ目の応用例として、FFT/IFFT のpowerの均等化がある。FFT/IFFT では、以下の数３０のPerseval’s law で示されるような入出力のpower の関係が成り立つ。以下の数３０は、入出力の power を均等化する場合、FFTの演算結果の振幅を次数のルートで割る必要があることを意味している。N=512 の場合は、
【数２７】

となる。
【数２８】

の除算は無理数の演算となるため、通常の演算ではここでも丸め誤差が生じる。
【００４８】
本手法ではkが奇数となる数１８（回転因子）を保持した構成となっていると述べた。kが奇数の数１８（回転因子）は具体的には、実部、虚部がそれぞれ
【数２９】

の複素乗算が未処理で保持していることを意味する。
【００４９】
よって、上記の power の均等化を行う場合、本方式の数２４の出力はすでに無理数√２で序されていることになる。すなわち、√２の除算を省くことが可能となり、通常のFFT実装に比べ、丸め誤差を軽減できることとなる。
【数３０】

【００５０】
［本願発明の応用例（その２）］
二つ目の応用例として、BPSKやQPSK等の変調でシンボルを実軸、虚軸に出力する送受信器を考えた場合、意図的にシンボルを45度回転し、振幅を√２倍することによって、ADC/DACの変更無しにシンボルの振幅を大きくすることが出来る。
【００５１】
図５は、軸上のシンボルの回転と振幅変更による ADC/DAC無変更での振幅拡大例を示す図である。
【００５２】
図５の左の図が軸上にシンボルが配置された場合を表し、ADC・DACの領域の最大間隔Lにシンボルは置かれている。右側は45度回転し振幅を√２（ルート２）倍したものである。振幅が√２倍になっているが ADC/DAC の領域内部にシンボルは配置されている。
【００５３】
この45度回転、および振幅√２倍の演算は、第一の例で述べたものと同じ理由から、本手法を用いることによって、回転と振幅√２倍の計算を省くことができる項がある。
【００５４】
以上のように、本手法を用いることによって、FFT内部の丸め誤差を軽減するだけではなく、FFTの入出力に関連する45度回転や振幅の√２倍といった演算を除外することができる場合があり、その際の計算誤差を軽減することが可能となる。
【００５５】
［本願発明の応用例（その３）］
たとえ次数Nが増えた場合であっても、次数N=512の場合の本願発明を基本に含めれば、基数2(radix-2)のバタフライ演算、または基数4(radix-4)のバタフライ演算を、以下のように被せる形にして応用することができる。
N=1024の場合は、radix-8 - radix-8 - radix-8 - radix-2 の４段構成
N=2048の場合は、radix-8 - radix-8 - radix-8 - radix-2 - radix-2 の５段構成
N=2048の場合は、radix-8 - radix-8 - radix-8 - radix-4 の４段構成
N=4096の場合は、radix-8 - radix-8 - radix-8 - radix-8 の４段構成
すなわち、次数Ｎが、２のべき乗であるが８のべき乗ではないという場合であっても、演算処理ができる。
【００５６】
［本願発明による効果］
本願発明を適用することで、どの程度丸め誤差が軽減されるかに関して検証を行った。比較対象は、十分な精度をもつ浮動小数点演算でFFTを行った場合とし、固定小数点（8ビット）でFFTした場合に生じる誤差に関して、そのヒストグラムとS/N比を求めた。
【００５７】
図６は、誤差のヒストグラムを示す図である。
【００５８】
図７は、S/N比を示す図である。
【００５９】
図６のヒストグラムの横軸は、期待値に対する誤差のベクトル距離であり、例として、期待値が(127,127)に対して得られた値が(130,131) のように誤差を持つ場合、そのベクトル距離は
【数３１】

となる。
【００６０】
縦軸は、実験により得られた誤差の頻度が全体の何% を占めるかを取ったものである。これらの結果から、本特許を用いない通常の基数8のFFT（図２）では、誤差のベクトル距離の最大が１2であるのに比べ、本願発明を用いた場合は５となっていることがわかる。図７はこの結果をS/N比で表したものであり、本願発明を用いることで約6dBの改善が得られる。

【特許請求の範囲】
【請求項１】
配列の次数Ｎが８のべき乗である、パイプライン化された配列に、多段の
【数１】

段が割り当てられており、多段のうちの１つの段において処理結果を保持しておくメモリが設けられており、メモリの入力値を基数８（ｒａｄｉｘ−８）のＤＦＴで演算を行い出力値を得て、入力値および出力値の各々が固定小数点型（ｊビット、ｊは自然数）で表現されている、離散フーリエ変換（ＤＦＴ）論理の処理をする計算システムであって、
パイプライン化された配列中の所定の段において、８つの入力（ｘ０〜ｘ７）から処理されるバタフライ演算（８ｐ）に含まれる（複素平面上の）回転因子のうちで無理数として現れるデータを、多段のうちの１つの段に設けられているメモリに保持しておくステップと、
パイプライン化された配列中の（１つの段よりも）後の段において、８つの入力（ｘ０〜ｘ７）から処理されるバタフライ演算（８ｐ）に含まれる（複素平面上の）回転因子のうちで無理数として現れるデータを、前記メモリに保持しておいたデータと掛け合わせることによって、無理数でない（有理数としての）計算データを得るステップとを
コンピュータに実行させる、
前記システム。
【請求項２】
前記無理数が、√（平方根）であることを特徴とする
請求項１に記載のシステム。
【請求項３】
基数８のバタフライ演算（８ｐ）に含まれる複素平面上の回転因子が、
【数２】

であって、ｋが奇数の場合である
請求項１に記載のシステム。
【請求項４】
前記バタフライ演算（８ｐ）が、
【数３】

である、
請求項１に記載のシステム。
【請求項５】
次数Ｎが、２のべき乗であるが８のべき乗ではない場合に、さらに基数２（ｒａｄｉｘ−２）または基数４（ｒａｄｉｘ−４）のバタフライ演算による段が被せられる、
請求項１に記載のシステム。
【請求項６】
配列の次数Ｎが８のべき乗である、パイプライン化された配列に、多段の
【数４】

段が割り当てられており、多段のうちの１つの段において処理結果を保持しておくメモリが設けられており、メモリの入力値を基数８（ｒａｄｉｘ−８）のＤＦＴで演算を行い出力値を得て、入力値および出力値の各々が固定小数点型（ｊビット、ｊは自然数）で表現されている、離散フーリエ変換（ＤＦＴ）論理の処理をする計算の方法であって、
パイプライン化された配列中の所定の段において、８つの入力（ｘ０〜ｘ７）から処理されるバタフライ演算（８ｐ）に含まれる（複素平面上の）回転因子のうちで無理数として現れるデータを、多段のうちの１つの段に設けられているメモリに保持しておくステップと、
パイプライン化された配列中の（１つの段よりも）後の段において、８つの入力（ｘ０〜ｘ７）から処理されるバタフライ演算（８ｐ）に含まれる（複素平面上の）回転因子のうちで無理数として現れるデータを、前記メモリに保持しておいたデータと掛け合わせることによって、無理数でない（有理数としての）計算データを得るステップとを
コンピュータに実行させる、
前記方法。
【請求項７】
前記無理数が、√（平方根）であることを特徴とする
請求項６に記載の方法。
【請求項８】
基数８のバタフライ演算（８ｐ）に含まれる複素平面上の回転因子が、
【数５】

であって、ｋが奇数の場合である
請求項６に記載の方法。
【請求項９】
前記バタフライ演算（８ｐ）が、
【数６】

である、
請求項６に記載の方法。
【請求項１０】
次数Ｎが、２のべき乗であるが８のべき乗ではない場合に、さらに基数２（ｒａｄｉｘ−２）または基数４（ｒａｄｉｘ−４）のバタフライ演算による段が被せられる、
請求項６に記載の方法。

【図４】

【図６】

【図７】

【図１】

【図２】

【図３】

【図５】

【公開番号】特開２０１２−１２３５６１（Ｐ２０１２−１２３５６１Ａ）
【公開日】平成２４年６月２８日（２０１２．６．２８）
【国際特許分類】

物理学 (1,541,580)
- 計算；計数 (381,677)
  - 電気的デジタルデータ処理 (228,215)
    - 取扱うデータの順序または内容を操作してデータを処理するための方... (915)

【出願番号】特願２０１０−２７２９４７（Ｐ２０１０−２７２９４７）
【出願日】平成２２年１２月７日（２０１０．１２．７）
【出願人】（３９０００９５３１）インターナショナル・ビジネス・マシーンズ・コーポレーション (4,084)
【氏名又は名称原語表記】ＩＮＴＥＲＮＡＴＩＯＮＡＬ　ＢＵＳＩＮＥＳＳ　ＭＡＳＣＨＩＮＥＳ　ＣＯＲＰＯＲＡＴＩＯＮ
【Ｆターム（参考）】

演算装置一般 (814)

[ Back to top ]

ルートｉ（√ｉ）演算の保持を特徴とする基数８固定小数点ＦＦＴ論理回路

メニュー

スポンサーリンク

次の公報 »

« 前の公報

ルートｉ（√ｉ）演算の保持を特徴とする基数８固定小数点ＦＦＴ論理回路

メニュー

スポンサー リンク

次の公報 »

« 前の公報

スポンサーリンク