演算回路、演算処理装置、及び演算回路の制御方法

【課題】固定精度浮動小数点数の組を多倍長や可変長の１つの浮動小数点の表現形式に効率的に変換する際に量子化演算を効率的に実行する演算方式を提供する。
【解決手段】量子化演算回路は、Ｎ進法による浮動小数点数の仮数部と指数部とを含む被量子化データを保持するレジスタと、被量子化データに対する量子化目標の指数を表す量子化目標指数を保持するレジスタと、量子化目標指数に対する補正値を指示する指示手段と、量子化目標指数から、指数補正値を減算した量子化後の指数を表す量子化指数部を算出する指数生成部と、量子化目標指数から、指数部と指数補正値とを減算したシフト量を算出するシフト量生成部と、仮数部を、上記算出されたシフト量だけシフトした量子化後の仮数を表す量子化仮数部を算出するシフト部と、上記算出された量子化指数部と上記算出された量子化仮数部とを含む量子化データを保持する出力レジスタを有する。

【発明の詳細な説明】
【技術分野】
【０００１】
本願開示は、演算回路、演算処理装置、及び演算回路の制御方法に関する。
【背景技術】
【０００２】
銀行等において勘定処理を行なう勘定系や、一部の科学技術計算などでは、数値表現や演算における誤差を小さくするために、多倍長、または、可変長の数値表現形式が採用されることがある。このような場合、符号と指数とをひとつの整数で表現し、仮数については、ひとつの整数で表現した符号と指数とは別の整数の列で表現することが多い。また、このような数値表現を採用した場合には、整数演算を利用して数値同士の計算が実現されることも多くあった。
【０００３】
それに対し、多倍長や可変長の浮動小数点演算を、固定精度の浮動小数点演算を用いて実現する方法が提案されている。固定精度の浮動小数点演算については、ハードウエアによる処理手段を提供している場合が多いため、そのようなハードウエア処理手段を用いることで、全ての処理をソフトウェアに行なわせる場合よりも処理の高速化をはかることができる。例えば、多倍長の２進浮動小数点演算を、２倍長の浮動小数点演算を用いて行うライブラリも存在する。
【０００４】
これらの方法では、固定精度浮動小数点数の組（要素同士の足し算を実行せずに組のまま用いることから「未評価の和」とも呼ばれる）によりひとつの数を表現し、その組同士の算術を適切に実行することで、大きな精度の算術（四則演算）を実現している。
【０００５】
四則演算に関しては、このように、効率良く実行できる手段がすでに存在する。しかし、整数演算を用いて計算することを前提に設計された計算システム（ソフトウエア）にこのような方法を適用する際には、四則演算の実行だけでなく、データ表現の変換にかかわる問題が生じる。
【０００６】
整数演算を前提とする計算システムにおいて、システムの互換性維持のために数値表現形式をそのままで変えないとすると、まず、整数の列で表現された数を、固定精度浮動小数点数の組に変換する必要がある。また、固定精度浮動小数点数の組同士の計算の後に、計算結果をメモリ上に格納する際には、元の整数列の形式に逆変換する必要がある。このような逆変換のためには、後述するように量子化演算が利用できる。そして、固定精度浮動小数点数の組を多倍長や可変長の１つの浮動小数点の表現形式に効率的に変換する際には、この量子化演算を効率的に実行することが望ましい。
【先行技術文献】
【非特許文献】
【０００７】
【非特許文献１】T. Dekker, A Floating-Point Technique for Extending the Available Precision, Numer. Math. vol. 18, pp.224-242, 1971.
【非特許文献２】D. Priest, Appendix A: Algorithms for Arbitrary Precision Floating Point Arithmetic, pp.111-124, On Property of Floating Point Arithmetics: Numerical Stability and the Cost of Accurate Computations, PhD thesis, University of California, Berkeley, November 1992.
【非特許文献３】Yozo Hida, Xiaoye S. Li, David H. Bailey, Library for Double-Double and Quad-Double Arithmetic, 29 December 2007.
【発明の概要】
【発明が解決しようとする課題】
【０００８】
以上を鑑みると、固定精度浮動小数点数の組を多倍長や可変長の１つの浮動小数点の表現形式に効率的に変換する際に量子化演算を効率的に実行する演算方式が望まれる。
【課題を解決するための手段】
【０００９】
被量子化データの量子化を行なう演算回路は、Ｎ進法（Ｎは２以上の整数）による任意精度浮動小数点数の仮数部と、前記仮数部に対する指数を表す指数部を含む第１の形式の被量子化データを保持する第１の入力レジスタと、前記被量子化データに対する量子化目標の指数を表す量子化目標指数を保持する第２の入力レジスタと、前記量子化目標指数に対する指数補正値を指示する指数補正値指示手段と、前記量子化目標指数から前記指数補正値を減算した量子化後の指数を表す量子化指数部を算出する指数生成部と、前記量子化目標指数から前記指数部と前記指数補正値とを減算したシフト量を算出するシフト量生成部と、前記仮数部を、前記シフト量生成部が算出したシフト量だけシフトした量子化後の仮数を表す量子化仮数部を算出するシフト部と、前記指数生成部が算出した量子化指数部と、前記シフト部が算出した量子化仮数部を含む量子化データとを保持する第１の出力レジスタを有することを特徴とする。
【００１０】
量子化を行なう演算回路と、前記演算回路の量子化を制御する量子化演算命令をデコードする命令制御部とを有する演算処理装置において、前記演算回路は、Ｎ進法（Ｎは２以上の整数）による任意精度浮動小数点数の仮数部と、前記仮数部に対する指数を表す１つの指数部を含む第１の形式の被量子化データを保持する第１の入力レジスタと、前記被量子化データに対する量子化目標の指数を表す量子化目標指数を保持する第２の入力レジスタと、前記量子化目標指数に対する補正値を指示する指数補正値指示手段と、前記命令制御部による前記量子化演算命令のデコード結果に基づき、前記量子化目標指数から、前記指数補正値を減算した量子化後の指数を表す量子化指数部を算出する指数生成部と、前記量子化目標指数から、前記指数部と前記指数補正値とを減算したシフト量を算出するシフト量生成部と、前記命令制御部による前記量子化演算命令のデコード結果に基づき、前記仮数部を、前記シフト量生成部が算出したシフト量だけシフトした量子化後の仮数を表す量子化仮数部を算出するシフト部と、前記指数生成部が算出した量子化指数部と、前記シフト部が算出した量子化仮数部を含む量子化データとを保持する第１の出力レジスタを有することを特徴とする。
【００１１】
Ｎ進法（Ｎは２以上の整数）による任意精度浮動小数点数の仮数部と、前記仮数部に対する指数を表す１つの指数部を含む第１の形式の被量子化データを保持する第１の入力レジスタと、前記被量子化データに対する量子化目標の指数を表す量子化目標指数を保持する第２の入力レジスタと、前記量子化目標指数に対する補正値を表す指数補正値を保持する指数補正値レジスタとを有するとともに、量子化を行なう演算回路の制御方法は、前記演算回路が有する指数生成部が、前記量子化目標指数から前記指数補正値を減算した量子化後の指数を表す量子化指数部を算出し、前記演算回路が有するシフト量生成部が、前記量子化目標指数から、前記指数部と前記指数補正値とを減算したシフト量を算出し、前記演算回路が有するシフト部が、前記仮数部を、前記シフト量生成部が算出したシフト量だけシフトした量子化後の仮数を表す量子化仮数部を算出することを特徴とする。
【発明の効果】
【００１２】
本願開示の少なくとも１つの実施例によれば、固定精度浮動小数点数の組を多倍長や可変長の１つの浮動小数点の表現形式に効率的に変換する際に、量子化演算を効率的に実行することができる。
【図面の簡単な説明】
【００１３】
【図１】多倍長の浮動小数点の数値表現形式の一例を示す図である。
【図２】多倍長浮動小数点数を複数の固定精度浮動小数点数に分割する例を示す図である。
【図３】２つの固定精度浮動小数点数の各バイトの値を示した図である。
【図４】２つの固定精度浮動小数点数の和により表現される多倍長浮動小数点数の各バイトの値を示した図である。
【図５】固定精度浮動小数点数の組から多倍長浮動小数点数を求める際の問題点について説明するための図である。
【図６】ｑｕａｎｔｉｚｅ演算の一例を示す図である。
【図７】ｑｕａｎｔｉｚｅ演算の一例を示す図である。
【図８】後続ゼロを適切なコードで置き換える例を示す図である。
【図９】後続ゼロを適切なコードで置き換える例を示す図である。
【図１０】Ｏｒａｃｌｅ−ｎｕｍｂｅｒの具体例の表を示す図である。
【図１１】コンピュータシステムの構成の一例を示す図である。
【図１２】ｏｒａｃｌｅｎｕｍ６４の構成を示す図である。
【図１３】長さが９バイトのｏｒａｃｌｅｎｕｍ６４の構成を示す図である。
【図１４】ｏｒａｃｌｅｎｕｍ６４を直接演算対象とできる演算器の構成の一例である。
【図１５】指数仮数演算回路の構成の一例を示す図である。
【図１６】正規化回路の構成の一例を示す図である。
【図１７】先行ゼロ計数回路の構成の一例を示す図である。
【図１８】内部形式変換回路の構成の一例を示す図である。
【図１９】外部形式変換回路の構成の一例を示す図である。
【図２０】固定精度浮動小数点数加算の具体例を示す図である。
【図２１】固定精度浮動小数点数加算の別の具体例を示す図である。
【図２２】２１バイト長のＯｒａｃｌｅ−ｎｕｍｂｅｒを３つの部分に分ける方法を示す図である。
【図２３】分割された３つの仮数部にそれぞれ対応するｏｒａｃｌｅｎｕｍ６４数を生成する方法を示す図である。
【図２４】ｇｅｔ＿ｚ演算を実現する回路の構成の一例を示す図である。
【図２５】ｇｅｔ＿ｚ演算の具体例を示す図である。
【図２６】ｇｅｔ＿ｚ演算の別の具体例を示す図である。
【図２７】ｇｅｔ＿ｚ演算の更に別の具体例を示す図である。
【図２８】２つの入力値の絶対値がフォーマットの桁数以上離れている場合の加算演算の例を示す図である。
【図２９】ｇｅｔ＿ｚｚ演算を実現する回路の構成の一例を示す図である。
【図３０】ｇｅｔ＿ｚｚ演算の具体例を示す図である。
【図３１】ｇｅｔ＿ｚｚ演算の別の具体例を示す図である。
【図３２】ｇｅｔ＿ｚｚ演算の更に別の具体例を示す図である。
【図３３】ｔｗｏ＿ｓｕｍの回路図シンボルを示す図である。
【図３４】ｔｒｉｐｌｅ−ｏｒａｃｌｅｎｕｍ６４とｏｒａｃｌｅｎｕｍ６４の和を求める回路の一例を示す図である。
【図３５】ｔｒｉｐｌｅ−ｏｒａｃｌｅｎｕｍ６４同士の和を求めるアルゴリズムを示す図である。
【図３６】オーバーラップを除去するための３つのｔｗｏ＿ｓｕｍ演算子の接続を示す図である。
【図３７】符号の揃ったＰｒｉｅｓｔの再正規化の例を示す図である。
【図３８】符号の揃ったＰｒｉｅｓｔの再正規化された数の組から強い正規化された数の組を得る計算の一例を示す図である。
【図３９】量子化のためのｓｃａｌｅ＿ｎｅｘｔ（Ｘ，Ｙ）演算を実現する回路構成の一例を示す図である。
【図４０】仮数部を内部形式に変換せずにｓｃａｌｅ＿ｎｅｘｔ演算を行う回路の構成の一例を示す図である。
【図４１】Ｏｒａｃｌｅ−ＤａｔａｂａｓｅにおけるＮＵＭＢＥＲ型の３種類の精度指定方法を示す表である。
【図４２】四捨五入が発生する桁位置のみ５があるような数を生成するアルゴリズムの例を示す図である。
【図４３】ｇｅｔ＿ｃｏｍｍａ５演算を実現する回路構成の一例を示す図である。
【図４４】ｔｒｕｎｃａｔｅ演算を実現する回路構成の一例を示す図である。
【図４５】マスク値生成回路の構成の一例を示す図である。
【図４６】ｐ＿ｄ及びｐ＿ｓの絶対値大小比較エラー判定回路の構成の一例を示す図である。
【図４７】符号演算器の回路構成の一例を示す図である。
【図４８】Ｏｒａｃｌｅ−ｎｕｍｂｅｒの長さを求める演算の一例を示す図である。
【図４９】ｅｘｐａｎｄ演算を実現する回路の構成の一例を示す図である。
【図５０】後続ゼロ計数回路の構成の一例を示す図である。
【図５１】桁セレクト演算回路の構成の一例を示す図である。
【図５２】固定精度浮動小数点加減算器の構成の一例を示す図である。
【図５３】指数仮数マスク演算回路の構成の一例を示す図である。
【発明を実施するための形態】
【００１４】
まず固定精度浮動小数点数の組と多倍長や可変長の１つの浮動小数点の表現形式との間の変換について、詳細に説明する。
【００１５】
図１は、多倍長の浮動小数点の数値表現形式の一例を示す図である。図１に示す多倍長浮動小数点１０は、符号と指数を含む１つの整数である第１バイト、及び、仮数部を示す整数列である第２乃至第Ｎバイトとを含む。仮数部のバイト数が任意のバイト数の表現形式である場合、多倍長且つ可変長である浮動小数点の数が得られることになる。多倍長かつ可変長の浮動小数点の具体的な表現形式としては、ＢＣＤ（Binary Coded-Decimal：２進化１０進数）やＯｒａｃｌｅ−Ｄａｔａｂａｓｅ（商標）形式など様々な形式があり得る。ここでは、所定の表現形式が用いられるとして、その表現形式に変更を加えることなく、ハードウエアによる演算を実現したい場合について考える。
【００１６】
多倍長浮動小数点数の演算を、固定精度浮動小数点演算を用いて実現するには、多倍長の数を複数の部分に分割し、固定精度浮動小数点数の組で表現する。このためには、表現したい多倍長浮動小数点数の仮数部を、固定精度浮動小数点数の仮数部桁数に等しい桁の複数の部分に分割し、各部をそれぞれ一つの固定精度浮動小数点数として表現する。
【００１７】
図２は、多倍長浮動小数点数を複数の固定精度浮動小数点数に分割する例を示す図である。この例では、符号及び指数部である第１バイトと、仮数部である第２乃至第２１バイトとを含む多倍長浮動小数点数１１が、３つの固定精度浮動小数点数に分割されている。仮数部の各バイトは、例えばＢＣＤ形式で表現された２桁の１０進数を示す。
【００１８】
まず仮数部の第２乃至第８バイトの７バイト（１４桁）に、元の符号及び指数部である第１バイトを付加して、第１の固定精度浮動小数点数１２が得られる。また仮数部の第９乃至第１５バイトの７バイト（１４桁）に、元の指数から１４を減じた指数と元の符号とを示すバイトを付加して、第２の固定精度浮動小数点数１３が得られる。ここで、第２の固定精度浮動小数点数１３において、第１の固定精度浮動小数点数１２の指数から１４を減じた指数となっているのは、仮数部の桁位置が１４桁ずれているからである。更に、仮数部の第１６乃至第２１バイトの６バイト（１２桁）に、元の指数から２８を減じた指数と元の符号とを示すバイトを付加して、第３の固定精度浮動小数点数１４が得られる。なお第３の固定精度浮動小数点数１４では、仮数部の最後に"００"を付加して７バイトの仮数部としてもよい。
【００１９】
このように、多倍長浮動小数点数１１を３つの固定精度浮動小数点数１２乃至１４に分割すると、多倍長浮動小数点数１１の値Ｓは、固定精度浮動小数点数１２乃至１４のそれぞれの値ａ０，ａ１，ａ２を用いて、以下のように表わすことができる。
【００２０】
Ｓ＝ａ０＋ａ１＋ａ２
この際、元の数Ｓの指数をＥとすると、ａ０，ａ１，ａ２の指数Ｅ０，Ｅ１，Ｅ２はそれぞれ、
Ｅ０＝Ｅ
Ｅ１＝Ｅ−ｔ
Ｅ２＝Ｅ−２ｔ
となる。
【００２１】
複数の固定精度浮動小数点数の組で表現された数に対する算術は、例えば非特許文献１乃至３に記載される方法等を用いて実現できる。このような算術により得られた計算結果を示す固定精度浮動小数点数の組を、元の多倍長浮動小数点数の表現形式によりメモリに格納する際には、以下に説明するような問題が発生する。
【００２２】
非特許文献２及び３の方法で計算された固定精度浮動小数点数の組は、算術演算のあとに再正規化(ｒｅｎｏｒｍａｌｉｚａｔｉｏｎ)されている。再正規化された組の各構成要素は、絶対値の順に並んでおり、且つ、互いにオーバーラップしていない。オーバーラップが解消されていないと、元の多倍長表現に戻すことを考えたときに、仮数部の各桁の数字が確定しないという問題がある。しかし再正規化によりオーバーラップが解消されているので、各要素の仮数部を適切に連結することにより、元の多倍長表現に戻すことが可能である。しかし、再正規化された組の各要素は、互いの大小関係とオーバーラップしていないということしかわからないので、各要素の指数を確認しなければ、各要素の仮数部同士が隙間なく隣り合うように、適切に各要素を連結することができない。
【００２３】
この問題を具体的な例を用いて以下に説明する。ここで、多倍長数表現は、第１バイトが仮数及び指数を表わし、第２バイト以降の各バイトが１０進数の２桁を表現しているものとする。２つの固定精度浮動小数点数を例えば、ａ０＝１２３４及びａ１＝４．５６７ｅ−２４とする。これは再正規化された組の条件を満たしており、再正規化された計算結果はこのような形になり得る。
【００２４】
図３は、２つの固定精度浮動小数点数の各バイトの値を示した図である。図３に示すように、ａ０は固定精度浮動小数点数１５に示すような３バイトの数となり、ａ１は固定精度浮動小数点数１６に示すような３バイトの数となる。
【００２５】
図４は、２つの固定精度浮動小数点数の和により表現される多倍長浮動小数点数の各バイトの値を示した図である。図３に示す固定精度浮動小数点数ａ０及びａ１の和により表現される多倍長浮動小数点数Ｓは、図４に示す多倍長浮動小数点数１７に示すような１７バイトの数となる。ここで、図３に示すａ０及びａ１の表現から、図４に示すＳ（多倍長浮動小数点数１７）の表現へ変換する際には、以下に説明するような問題が生じる。
【００２６】
図５は、固定精度浮動小数点数の組から多倍長浮動小数点数を求める際の問題点について説明するための図である。図５において、ａ０の符号及び指数部並びに仮数部に対応する３つのバイト２１は、多倍長浮動小数点数１７の先頭部分（最上位ビット部分）に配置される。また多倍長浮動小数点数１７中のａ１の仮数部に対応するバイト２２の位置は、ａ０及びａ１の指数を基に計算される。即ち、ａ０の指数は３であり、ａ１の指数は−２４であるので、ａ１の仮数部の最初の桁の値"４"の位置は、多倍長浮動小数点数１７の仮数部における３−（−２４）＋１＝２８桁目の位置となる。このように、ａ１を格納すべきメモリ上アドレスは、ａ０及びａ１の両方の指数を参照して計算する必要がある。
【００２７】
また更に、図３に示すａ１の浮動小数点の仮数部の表現と、図５に示す対応するバイト２２の表現とでは、桁とバイトとの対応関係が異なっており、これを考慮して処理する必要がある。また更に、ａ０に対応するバイト２１とａ１に対応するバイト２２との間のギャップを、０の値を有するバイト列２３により埋めることが必要になる。
【００２８】
上記の問題点を解決するために、本願開示の演算方式では、非特許文献２及び３に示される再正規化の条件に、さらに強い条件を課す。そして更に、強い再正規化を計算するためのハードウエア及び専用の命令を追加する。
【００２９】
固定精度浮動小数点数の精度をｔ桁とすると、強い再正規化された組（ｂ０，ｂ１，・・・）は、以下の条件を満たす。
１）全要素の符号が等しい
２）Ｅｉ＝Ｅ（ｉ＋１）＋ｔ
ここでＥｉは要素ｂｉの指数部の値である。この条件により、組の各要素（各固定精度浮動小数点数）は、元の多倍長数の仮数部の各桁に、上位から順にすき間なく割り当てられることになる。即ち、図２に示す分割されたａ０，ａ１，ａ２のような形になる。これにより、強い正規化された組は、容易に元の多倍長表現に纏めることができる。
【００３０】
強い正規化の条件を満たすためには、再正規化の際に、第２番目以降の要素を適切に量子化する必要がある。この量子化には、ＩＥＥＥ７５４−２００８に定義されるｑｕａｎｔｉｚｅ演算（量子化演算）を利用することができる。
【００３１】
ｑｕａｎｔｉｚｅ演算（量子化演算）は、入力Ｘ及びＹが与えられたときに、そのＸの数としての値は変えずに、Ｘの指数をＹの指数と同じ値にする演算である。即ち、Ｘの指数をＹの指数に等しくするとともに、Ｘの指数とＹの指数との差に等しい数だけＸの仮数を右または左にシフトすることにより、Ｘの数としての値を変えずに表現のみを変換し、出力ｚを生成する。但し、右シフトによってシフトアウトが発生する場合は、設定されている丸めモードに従って丸め操作が行われる。左シフトによってシフトアウトが発生する場合は、invalid operationの例外が報告される。
【００３２】
図６及び図７は、ｑｕａｎｔｉｚｅ演算の一例を示す図である。図６には、入力Ｘの指数ＥＸが、入力Ｙの指数ＥＹよりも大きい場合（例えば、ＥＸ＝２，ＥＹ＝０の場合）が示される。指数部ＥＸ＝２である入力Ｘの仮数部３１に対して、ｑｕａｎｔｉｚｅ演算の出力ｚでは指数部ＥｚがＥＹに等しい値である０となり、出力ｚの仮数部３２は入力Ｘの仮数部３１の内容が左に２ビットシフトされたものとなる。図７には、入力Ｘの指数ＥＸが、入力Ｙの指数ＥＹよりも小さい場合（具体的にはＥＸ＝−１，ＥＹ＝０の場合）が示される。指数部ＥＸ＝−１である入力Ｘの仮数部３３に対して、ｑｕａｎｔｉｚｅ演算の出力ｚでは指数部ＥｚがＥＹに等しい値である０となり、出力ｚの仮数部３４は入力Ｘの仮数部３１の内容が右に１ビットシフトされたものとなる。図７で示される例では、設定されている丸めモードは四捨五入であり、右シフトによって発生した"５"のシフトアウトに応じて、シフト後の最下位ビットが＋１されている。
【００３３】
上に説明したようなｑｕａｎｔｉｚｅ演算を用いて、強い正規化のための量子化を実現すると、以下のようになる。βは浮動小数点数の基数である。ただし、丸め処理は全て切り捨て処理とする。（ａ０，ａ１）は非特許文献２及び３の意味で再正規化された組であり、（ｂ０，ｂ１，ｂ２）は強い再正規化された組である。
【００３４】
b0 = a0
Ｙ1 = a0 * β^(-t)
b1 = quantize(a1, Ｙ1)
tmp = a1 - b1
Ｙ2 = Ｙ1 * β^(-t)
b2 = quantize(tmp, Ｙ2)
即ち、まずａ０をｔ桁だけずらした数Ｙ１を生成し、更に、Ｙ１の指数に等しい指数を有するようにａ１を表現し直すことにより数ｂ１を生成する。ａ１とｂ１との差ｔｍｐは、切り捨てのためにｂ１で表現しきれなかったａ１の残り部分に相当する。Ｙ１をｔ桁だけずらした数Ｙ２を生成し、更に、Ｙ２の指数に等しい指数を有するようにａ１の残り部分ｔｍｐを表現し直すことにより数ｂ２を生成する。
【００３５】
しかし上記の方法では、ｑｕａｎｔｉｚｅ演算の第２引数を求めるための乗算（β^(-t)の乗算）とｑｕａｎｔｉｚｅ演算との計２ステップが、１要素を量子化するために必要である。しかし、量子化に必要な指数情報は、本質的には、ひとつ前の要素に完全に含まれるので、この量子化を専用命令化し、１命令で実行することで、必要な演算回数を減らすことができる。即ち、以下の計算で、強い正規化のための量子化を実現することができる。
【００３６】
b0 = a0
b1 = scale_next(a1, b0)
tmp = a1 - b1
b2 = scale_next(tmp, b1)
ここでｓｃａｌｅ＿ｎｅｘｔ（Ｘ，Ｙ）は、ｑｕａｎｔｉｚｅ（Ｘ，Ｙ＊β＾（−ｔ））と同じ処理を１命令で実行する演算命令である。この演算を実行する回路の構成例については、後述の実施例において説明する。この回路は、β＾（−ｔ）を求めるための乗算とｑｕａｎｔｉｚｅ演算との２つの処理を逐次的に実行するよりも高速に、同等の処理を実行する。上に示す演算において、強い正規化のために量子化された各要素は、次の要素を量子化するために参照される。従って、量子化の結果が０になる場合にも、符号及び指数部には量子化の結果が反映されていることが望ましい。
【００３７】
強い正規化によって、固定精度浮動小数点数の組は、元の多倍長表現にもどすことが容易になる。しかし、各要素をメモリ上に書き込む際に、以下に説明するように、更に別の問題が発生する場合がある。
【００３８】
固定精度浮動小数点表現において、有意な値に先行するゼロ値である先行ゼロ（leading zero）を特定するビット表現と有意な値に後続するゼロ値である後続ゼロ（tailing zero）を特定するビット表現とで異なるビット表現が採用されている場合に、問題が発生する。例えばＯｒａｃｌｅ−ｄａｔａｂａｓｅで用いられる数表現では、仮数部の途中に出現する０は、メモリ上の表現では０Ｘ０１や０Ｘ６５の値をとる（何れの値になるのかは数の符号に依存する）。一方で、後続ゼロは許されていないので、仮数が短い場合、あまりの部分には何も書き込まれない。このことによるギャップを埋める必要がある。このためには、後続ゼロを意図的に生成する命令があると便利である。
【００３９】
図８及び図９は、後続ゼロを適切なコードで置き換える例を示す図である。図８に示す例では、後続ゼロを０Ｘ０１で置き換えている。また図９に示す例では、有意な値の終端を表すターミネータ０Ｘ６６とそれに続くゼロを、０Ｘ６５で置き換えている。
【００４０】
以下に、本発明の実施例を添付の図面を用いて詳細に説明する。なお各図面において、同一又は対応する構成要素は同一又は対応する名称又は番号で参照し、その説明は適宜省略する。
【００４１】
以下に説明する実施例では、オラクルデータベースで用いられる数値型であるＯｒａｃｌｅ−ｎｕｍｂｅｒ（商標）を高速に計算するハードウエアが提供される。まず、Ｏｒａｃｌｅ−ｎｕｍｂｅｒの表現形式について述べる。ここで述べる事柄は、オラクルデータベースのＳＱＬインタプリタ（ＳｔｒｕｃｔｕｒｅｄＱｕｅｒｙＬａｎｇｕａｇｅｉｎｔｅｒｐｒｅｔｅｒ）上で確認することができる。
【００４２】
Ｏｒａｃｌｅ−ｎｕｍｂｅｒは、最大２１バイトの可変長データ形式である。第１バイトに符号及び指数が格納され、後続バイトに仮数が格納される。仮数部は最大で２０バイトである。
【００４３】
Ｏｒａｃｌｅ−ｎｕｍｂｅｒは、１０進浮動小数点数を表現するためのデータ形式である。主にメモリ使用効率上の理由から、仮数部は、１バイトあたり１０進２桁分のデータを保持する。またそれにあわせて、指数部は、基数１００に対する指数が格納される。Ｏｒａｃｌｅ−ｎｕｍｂｅｒで表現される数は、以下の形式で表すことができる。
【００４４】
number = ± （M00 . M01 M02 ...) * 100^(exp)
ここでＭ００、Ｍ０１、Ｍ０２、・・・は、最大２０バイトで表現される仮数部における第１バイト、第２バイト、第３バイト、・・・の各バイトの格納データを示す。仮数部は１０進２桁毎に区切られているため、１００進２０桁とみなすこともできる。Ｏｒａｃｌｅ−ｎｕｍｂｅｒは、この１００進表現でみなしたときに必ず正規化されており、Ｍ００部（仮数部第１バイト）が０になることはない。
【００４５】
Ｏｒａｃｌｅ−ｎｕｍｂｅｒ表現の第１バイト（全体の第１バイト）は、符号及び指数部であり、次のように符号化される。
【００４６】
number > 0 の場合：第１バイト = exp + 193
number == 0 の場合：第１バイト = 128
それ以外の場合：第１バイト = 62 - exp
第２バイト以降の仮数部は、バイト毎にＭ００、Ｍ０１、・・・を保持する。各バイトにおいては、表現する数値の符号に応じて、以下に示すように異なった符号化がもちいられる。
【００４７】
number > 0 の場合：仮数部の第ｎバイト = M(n-1) + 1
number == 0 の場合：仮数部はない
それ以外の場合：仮数部の第ｎバイト = 101 - M(n-1)
上記の符号化において、Ｍｎは０以上且つ９９以下であるので、仮数部バイトの値に０Ｘ００が出現することがない。表現対象の数が短い仮数部で表現可能な場合には、Ｏｒａｃｌｅ−ｎｕｍｂｅｒは２１バイトよりも短く切り詰められる。即ち、Ｏｒａｃｌｅ−ｎｕｍｂｅｒの仮数部には後続ゼロは許されていない。なお負数の表現においては、仮数部が２０バイトよりも短い場合には、仮数の終端を示すため、最後のバイトにターミネータとして１０２（０Ｘ６６）が格納される。
【００４８】
Ｏｒａｃｌｅ−ｎｕｍｂｅｒでは、上記のような符号化方式を採用することで、バイト列としてみたときの大小関係、即ちＣ標準関数ｍｅｍｃｍｐによる比較に基づく大小関係と、Ｏｒａｃｌｅ−ｎｕｍｂｅｒの数値としての大小関係とが等しくなる。
【００４９】
図１０は、Ｏｒａｃｌｅ−ｎｕｍｂｅｒの具体例の表を示す図である。例えば１０Ｅ＋０（＝１０×１００^０）の表現において、指数部は１９３（＝０＋１９３）であり、仮数部は１１（＝１０＋１）である。また例えば１０Ｅ＋１（＝１×１００^１）の表現において、指数部は１９４（＝１＋１９３）であり、仮数部は２（＝１＋１）である。また例えば負の数−１０Ｅ−１３０（＝−１０×１００^−６５）の表現において、指数部は１２７（＝６２−（−６５））であり、仮数部は９１（＝１０１−１０）である。また例えば負の数−１０Ｅ−１２９（＝−１×１００^−６４）の表現において、指数部は１２６（＝６２−（−６４））であり、仮数部は１００（＝１０１−１）である。なお負の数には、最後のバイトにターミネータとして１０２が付加されている。更に、正の無限大Ｉｎｆ及び負の無限大−Ｉｎｆには、表中に示すような特別なバイト列が割り当てられている。
【００５０】
図１１は、コンピュータシステムの構成の一例を示す図である。図１１に示すコンピュータシステムは、プロセッサ１１０及びメモリ１１１を含む。演算処理装置としてのプロセッサ１１０は、２次キャッシュ部１１２、１次キャッシュ部１１３、制御部１１４、及び演算部１１５を含む。１次キャッシュ部１１３は、命令キャッシュ１１３Ａ及びデータキャッシュ１１３Ｂを含む。演算部１１５は、レジスタ１１６、演算制御部１１７、及び演算器１１８を含む。演算器１１８には演算回路１１９が含まれる。なお図２及び以降の同様の図において、各ボックスで示される各機能ブロックと他の機能ブロックとの境界は、基本的には機能的な境界を示すものであり、物理的な位置の分離、電気的な信号の分離、制御論理的な分離等に対応するとは限らない。各機能ブロックは、他のブロックと物理的にある程度分離された１つのハードウェアモジュールであってもよいし、或いは他のブロックと物理的に一体となったハードウェアモジュール中の１つの機能を示したものであってもよい。各機能ブロックは、他のブロックと論理的にある程度分離された１つのモジュールであってもよいし、或いは他のブロックと論理的に一体となったモジュール中の１つの機能を示したものであってもよい。
【００５１】
上記コンピュータシステムはＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）を用いた情報処理装置を模式化したものであり、このコンピュータシステムによりＯｒａｃｌｅ−ｎｕｍｂｅｒを演算するハードウエアを実現する。その際、システム構成を大幅に変更することなく、前述のｓｃａｌｅ＿ｎｅｘｔ（Ｘ，Ｙ）等の新機能を演算部１１５の機能として追加することが望まれる。そこで、新機能追加による変更部分が可能な限り少なくなるような実現方法をめざす。例えば、上記のＣＰＵにおいては、演算器の入出力は、通常２オペランド入力且つ１出力の形であり、各オペランドのデータ幅は８バイト（６４ビット）幅である。ハードウエアの変更量を小さく抑えるためには、この構造を大きく変えないことが望まれる。
【００５２】
プロセッサ１１０では、１次キャッシュ部１１３及び２次キャッシュ部１１２を設けることにより、キャッシュメモリを多階層化した構成となっている。具体的には、１次キャッシュ部１１３と主記憶（メモリ１１１）との間に、主記憶よりも高速にアクセスできる２次キャッシュ部１１２を設けている。これにより、１次キャッシュ部１１３においてキャッシュミスが発生した場合に、主記憶にアクセスが必要になる頻度を低くして、キャッシュミス・ペナルティーを軽減することができる。
【００５３】
制御部１１４は、命令フェッチアドレスと命令フェッチリクエストとを１次命令キャッシュ４０に発行し、この命令フェッチアドレスから命令をフェッチする。制御部１１４は、フェッチした命令をデコードした結果に従い演算部１１５を制御して、フェッチされた命令を実行する。演算制御部１１７は、制御部１１４の制御下で動作し、演算対象のレジスタ１１６からのデータを演算器１１８に供給したり、演算結果のデータを指定されたレジスタ１１６に格納したりする。また演算制御部１１７は、演算器１１８が実行する演算のタイプを指定する。更に演算制御部１１７は、アクセス先のアドレスを指定し、１次キャッシュ部１１３の当該アドレスに対してロード命令やストア命令を実行する。ロード命令により、指定アドレスから読み出されたデータは、指定されたレジスタ１１６に格納される。またストア命令により、指定されたレジスタ１１６のデータが、指定されたアドレスに書き込まれる。
【００５４】
まず、Ｏｒａｃｌｅ−ｎｕｍｂｅｒのサブセットであるｏｒａｃｌｅｎｕｍ６４を定義する。ｏｒａｃｌｅｎｕｍ６４は有効な仮数部の長さが７バイト以下であるようなＯｒａｃｌｅ−ｎｕｍｂｅｒである。
【００５５】
図１２は、ｏｒａｃｌｅｎｕｍ６４の構成を示す図である。ｏｒａｃｌｅｎｕｍ６４の数を表現するデータ１２１は、８バイト長のレジスタに格納することができる。なお、符号及び指数部を含めた長さが８バイトに満たないＯｒａｃｌｅ−ｎｕｍｂｅｒをｏｒａｃｌｅｎｕｍ６４としてレジスタに格納する際には、図１２にバイト１２２として示すようにデータを左詰めにして格納する。そして右側の余りの部分には、０Ｘ００の値を有するバイト１２３を余りのバイト数に等しい数だけ格納する。
【００５６】
図１３は、長さが９バイトのｏｒａｃｌｅｎｕｍ６４の構成を示す図である。図１３に示すように、長さが９バイトである負のＯｒａｃｌｅ−ｎｕｍｂｅｒのデータ１２５は、７バイト長の仮数部１２６に続いて最後のバイト（第９バイト）にターミネータ１２７（０Ｘ６６）が付加されている。このＯｒａｃｌｅ−ｎｕｍｂｅｒは、有効な仮数部１２６の長さが７バイトであるので、ｏｒａｃｌｅｎｕｍ６４である。このことはｏｒａｃｌｅｎｕｍ６４を符号反転した数が必ずｏｒａｃｌｅｎｕｍ６４となるために必要である。
【００５７】
図１４は、ｏｒａｃｌｅｎｕｍ６４を直接演算対象とできる演算器の構成の一例である。図１４の演算器は、図１１の演算回路１１９の一部分に相当する。図１４に示す演算器は、入力Ｘレジスタ１３１、入力Ｙレジスタ１３２、内部形式変換回路１３３及び１３４、指数仮数演算回路１３５、セレクタ１３６及び１３７、シフタ１３８及び１３９、指数加算器１４０、及び絶対値加算器１４１を含む。演算器は更に、正規化回路１４２、丸め回路１４３、外部形式変換回路１４４、及び出力Ｚレジスタ１４５を含む。内部形式変換回路１３３及び１３４と外部形式変換回路１４４とを工夫することで、例えばｏｒａｃｌｅｎｕｍ６４とＩＥＥＥ７５４−ｄｅｃｉｍａｌ６４との両方に対応させることも可能である。図１４において、入力と出力は同形式同精度の浮動小数点数とする。入力データは正規化されていなくてもよい。出力データは正規化される。入力データはｏｒａｃｌｅｎｕｍ６４フォーマットとし、正規化されていないデータも解釈可能である。出力データはｏｒａｃｌｅｎｕｍ６４フォーマットの通りに出力される。
【００５８】
内部形式変換回路１３３及び１３４により、入力を符号部、指数部、及び仮数部に分割し、入力の値表現を内部形式に変換する。入力Ｘの符号、指数、仮数をそれぞれ符号Ｘ、指数Ｘ、仮数Ｘとする。入力Ｙの符号、指数、仮数をそれぞれ符号Ｙ、指数Ｙ、仮数Ｙとする。
【００５９】
指数仮数演算回路１３５が、指数Ｘ及び指数Ｙと、仮数Ｘ及び仮数Ｙとを受け取る。指数仮数演算回路１３５は、指数Ｘと指数Ｙの大小比較をする。大小比較の結果に基づいて、指数仮数演算回路１３５は、指数の大きい側の仮数（第１の仮数）がシフタ１３８に入力され、且つ、指数の小さい側の仮数（第２の仮数）がシフタ１３９に入力されるように、セレクト信号を生成する。指数仮数演算回路１３５は、指数Ｘと指数Ｙとの差の絶対値と第１の仮数の先行ゼロ計数値とを比較し、指数Ｘと指数Ｙとの差の絶対値の方が大きい場合は、第１の仮数の先行ゼロ計数値をシフタ１３８の左シフト量として出力する。指数Ｘと指数Ｙとの差の絶対値の方が小さい場合は、指数仮数演算回路１３５は、指数Ｘと指数Ｙとの差の絶対値をシフタ１３８の左シフト量として出力する。ここで、先行ゼロ計数値とは、仮数部の最上位桁から連続するゼロを計数した値をいう。
【００６０】
指数仮数演算回路１３５は、指数Ｘと指数Ｙとの差の絶対値と第１の仮数の先行ゼロ計数値とを比較し、指数Ｘと指数Ｙとの差の絶対値の方が大きい場合は、指数Ｘと指数Ｙとの差の絶対値から第１の仮数の先行ゼロ計数値を減算した値をシフタ１３９の右シフト量として出力する。指数Ｘと指数Ｙとの差の絶対値の方が小さい場合は、指数仮数演算回路１３５は、ゼロをシフタ１３９の右シフト量として出力する。指数仮数演算回路１３５は更に、指数の小さい側に上述の右シフト量を加算した値を指数として出力する。
【００６１】
シフタ１３８は、入力されたシフト量に基づき、入力された仮数を左シフトする。シフタ１３９は、入力されたシフト量に基づき、入力された仮数を右シフトする。各シフタのシフト結果は絶対値加算器１４１に入力される。
【００６２】
減算の場合は、片方の仮数が反転され、絶対値加算器１４１にキャリーが入力される。絶対値加算器１４１による加算の結果桁あふれが生じた場合は、１桁右にシフトした値が出力される。同時に、絶対値加算器１４１から指数加算器１４０にキャリーが送られ、送られたキャリーが指数に加算される。
【００６３】
絶対値加算器１４１による加算の結果桁落ちが生じた場合は、１桁左にシフトした値が出力される。同時に、絶対値加算器１４１から指数加算器１４０に桁落ちを示す信号が送られ、指数から減算される。乗算や除算の場合は、加算結果を再利用するループ演算回路を用いてもよい。
【００６４】
正規化回路１４２が加算結果を受け取り、正規化演算結果を出力する。丸め回路１４３が、正規化演算結果を丸める。外部形式変換回路１４４は、丸め処理後の正規化演算結果を外部形式に変換し、出力Ｚレジスタ１４５に出力する。
【００６５】
図１５は、指数仮数演算回路の構成の一例を示す図である。図１５に示す指数仮数演算回路１３５は、比較回路１５１、絶対値加算器１５２、セレクタ１５３及び１５４、加算器１５５、先行ゼロ計数回路１５６、セレクタ１５７及び１５８、及び加算器１５９を含む。
【００６６】
比較回路１５１は、指数Ｘと指数Ｙとの大小比較をし、指数の大きい側の仮数（第1の仮数）がシフタ１３８に入力され、指数の小さい側の仮数（第２の仮数）がシフタ１３９に入力されるように、セレクト信号を生成する。絶対値加算器１５２は、指数Ｘと指数Ｙの差の絶対値を計算する。先行ゼロ計数回路１５６は、セレクトされた仮数の先行ゼロを計数する。加算器１５５は、指数Ｘと指数Ｙとの差の絶対値とセレクトされた仮数の先行ゼロ計数値とを比較し、比較結果に応じたセレクト信号を出力する。セレクタ１５８は、差の絶対値の方が大きい場合、先行ゼロ計数値をシフタ１３８の左シフト量として出力する。セレクタ１５８は、差の絶対値の方が小さい場合、差の絶対値をシフタ１３８の左シフト量として出力する。
【００６７】
セレクタ１５７は、差の絶対値の方が大きい場合、差の絶対値から先行ゼロ計数値を減算した値をシフタ１３９の右シフト量として出力する。セレクタ１５７は、差の絶対値の方が小さい場合、ゼロをシフタ１３９の右シフト量として出力する。
【００６８】
加算器１５９は、セレクタ１５３から小さい側の指数を受け取る。加算器１５９は、受け取った小さい側の指数に上述の右シフト量を加算して求めた値を、指数として出力する。
【００６９】
図１６は、正規化回路の構成の一例を示す図である。図１６に示す正規化回路１４２は、先行ゼロ計数回路１６０、シフト量補正回路１６１、左シフタ１６２、指数演算器１６３、ビットシフタ１６４及び１６５、及びセレクタ１６６を含む。
【００７０】
仮数は桁あふれを考慮する場合は最上位側が１桁多い幅で入力される。先行ゼロ計数回路１６０は、最上位桁の１つ上の桁を除いた仮数を受け取り、先行ゼロを計数することにより得られた計数値を出力する。シフト量補正回路１６１は、先行ゼロ計数値と指数の最下位ビットとを受け取る。先行ゼロ計数値の最下位ビット（偶奇を表す）と指数の最下位ビットとをＸＯＲ（排他的論理和）した値が１の場合、シフト量補正回路１６１は、先行ゼロ計数値から1を減じた値を左シフト量として出力する。また上記ＸＯＲ値が０の場合、シフト量補正回路１６１は、先行ゼロ計数値を左シフト量として出力する。
【００７１】
左シフタ１６２は、最上位桁の１つ上の桁を除いた仮数とシフト量とを受け取り、指定されたシフト量だけ仮数を左シフトした値を出力する。セレクタ１６６は、入力の最上位桁の１つ上の桁が０の場合、左シフタ１６２が出力する左シフトした結果を選択する。またセレクタ１６６は、入力の最上位桁の１つ上の桁が１であり且つ指数の最下位ビットが０の場合、最上位桁の１つ上の桁を含む入力仮数を２桁右シフトした値を選択する。またセレクタ１６６は、入力の最上位桁の１つ上の桁が１であり且つ指数の最下位ビットが１の場合、最上位桁の１つ上の桁を含む入力仮数を1桁右シフトした値を選択する。セレクタ１６６の選択した値は、仮数として出力される。
【００７２】
指数演算器１６３は、指数、シフト量、及び入力仮数の最上位桁を受け取る。入力仮数の最上位桁が０の場合、指数演算器１６３は、指数からシフト量を減算した結果を指数として出力する。入力仮数の最上位桁が１であり且つ指数の最下位ビットが０の場合、指数演算器１６３は、指数に２を加算した結果を指数として出力する。入力仮数の最上位桁が１であり且つ指数の最下位ビットが１の場合、指数演算器１６３は、指数に１を加算した結果を指数として出力する。
【００７３】
図１７は、先行ゼロ計数回路の構成の一例を示す図である。図１７（ａ）に示すように、先行ゼロ計数回路は、変換回路１６０を含む。変換回路１６０は仮数を入力データとして受け取り、図１７（ｂ）に示すテーブルに従い入力データから出力データを生成する。この出力データが先行ゼロ計数値であり、２進数により計数値が表わされる。テーブルでは、一番左側のＸはゼロ以外の値を表し、それ以外のＸはドントケアを表す。０は計数対象となるゼロを表す。
【００７４】
図１８は、内部形式変換回路の構成の一例を示す図である。図１８に示す内部形式変換回路１３３又は１３４は、セレクタ１７０乃至１７４、加算器１７５及び１７６、及び２進１０進変換回路１７７及び１７８を含む。
【００７５】
入力されたデータは、符号部Ｓ、指数部ＥＸＰ、仮数部Ｍ０１、Ｍ０２、・・・に分割される。符号部Ｓは1ビットであり、符号としてそのまま出力される。符号は１の場合に正を表す。
【００７６】
指数部ＥＸＰは７ビットである。セレクタ１７０は、符号が１の場合、指数部ＥＸＰをそのまま指数として出力する。またセレクタ１７０は、符号が０の場合、指数部ＥＸＰを反転した値を指数として出力する。
【００７７】
仮数部Ｍ０１、Ｍ０２、・・・の各々は、８ビット長のデータである。セレクタ１７１は、符号が１の場合は仮数を選択し、符号が０の場合は仮数の反転値を選択する。この選択値が加算器１７５の一方の入力となる。またセレクタ１７２は、符号が１の場合は−１を選択し、符号が０の場合は＋１０１を選択する。この選択値が加算器１７５のもう一方の入力となる。また、符号が０の場合には、加算器１７５にキャリーが入力される。セレクタ１７３及び１７４並びに加算器１７６についても同様である。
【００７８】
加算器１７５及び１７６の出力が、それぞれ、２進１０進変換回路１７７及び１７８により２進形式からＢＣＤ形式の値に変換され、ＢＣＤ変換後の値が仮数として出力される。ただし、加算器からのＣＯが０の場合には、変換後のＢＣＤ値は強制的にゼロとなる。
【００７９】
図１９は、外部形式変換回路の構成の一例を示す図である。図１９に示す外部形式変換回路１４４は、デコーダ１８０、１０進２進変換回路１８１及び１８２、セレクタ１８３乃至１８７、及び加算器１８８及び１８９を含む。図１９では、２つの仮数部ＢＣＤ０１、ＢＣＤ０２のみに対する回路部分が明示的に示されるが、仮数部の数が２以上の場合には、同様の回路部分がそれらの仮数部に対して設けられる。
【００８０】
入力された１ビットの符号部は、そのまま符号として出力される。符号は１の場合に正を表す。指数部の入出力は７ビットである。セレクタ値１８３により、符号が１の場合は入力指数がそのまま出力指数となり、符号が０の場合は入力指数の反転値が出力指数となる。仮数部ＢＣＤ０１、ＢＣＤ０２、・・・は、１つの入力ＢＣＤあたり８ビットであり、１０進２進変換回路１８１、１８２、・・・によりＢＣＤから２進数に変換される。
【００８１】
ターミネータ選択信号を受け取るデコーダ１８０は、終端の桁を現すターミネータ桁を選択するターミネータ桁セレクト信号を生成する。このターミネータ桁セレクト信号は、後段のセレクタ１８４、１８５、・・・に分配される。
【００８２】
加算器１８８、１８９、・・・の各々において、一方の入力には、符号が１の場合は仮数がそのまま入力され、符号が０の場合は仮数の反転値が入力される。但し、ターミネータ桁セレクト信号が１の場合は、ゼロが選択されて入力される。もう一方の入力には、符号が１の場合は＋１が入力され、符号が０の場合は＋１０１が入力される。但し、ターミネータ桁セレクト信号が１の場合は、＋１０１が選択されて入力される。ここで実際に加算したい値は＋１０２であるが、＋１０１にキャリーインが加算されることで、＋１０２を加算することと同等になる。また、符号が０の場合には加算器にキャリーインが入力される。加算器１８８、１８９、・・・の出力が、各桁の仮数として出力される。
【００８３】
図２０は、固定精度浮動小数点数加算の具体例を示す図である。図２０において、入力Ｘの指数をＥｘ、入力Ｙの指数をＥｙ、入力Ｘの先行ゼロ計数値をＬｘ、入力Ｙの先行ゼロ計数値をＬｙとする。また出力Ｚの指数をＥｚとする。可能な限り高い演算精度を保持するとき、指数値の大きい側を左シフトして桁合わせを行う。但し、先行ゼロの桁数より多く左シフトすることは、上位桁が欠落してしまうため、桁合わせに必要な左シフト量Ｅｘ−Ｅｙが先行ゼロの桁数を上回る場合は、指数値の小さい側を右シフトすることで、桁合わせを行う。このためにEｘ−Eｙを計算し、Lｘと比較する。図２０に示す具体例ではLｘのほうが大きい。即ち、左シフト量Ｅｘ−Ｅｙが先行ゼロの数内に収まるので、入力Ｘの仮数１９１のみ左シフトされる。入力Ｙの仮数１９２は右シフトされない。左シフト量はEｘ−Eｙであり、右シフト量は０である。
【００８４】
このようにして桁合わせされた数同士、即ち仮数１９１を左シフトして得られた仮数１９３と仮数１９２とを加算する。更に、加算結果１９４を正規化し、先行ゼロ計数値が１以上の場合はその分だけ左シフトを行い、桁あふれがある場合には１桁分の右シフトを行う。但し、左シフトした結果指数が奇数になる場合は、左シフト量を１減らす。または右シフトした結果指数が奇数になる場合は、右シフト量を１増やす。指数は、左右シフト量に合わせて調整する。左シフトした場合は左シフト量を指数から減算し、右シフトした場合は右シフト量を指数に加算する。本具体例では１桁左シフトが必要だが、指数が０から１となり奇数になるので、左シフト量は１減らされて０となり、指数は０のままである。その結果、正規化により加算結果は変化せず、そのまま演算結果の仮数１９４及び対応する指数Ｅｚを含む演算結果として出力される。
【００８５】
図２１は、固定精度浮動小数点数加算の別の具体例を示す図である。この具体例では必要な左シフト量Ｅｘ−ＥｙよりもＬｘのほうが小さい。この場合、必要な左シフト量Ｅｘ−Ｅｙが先行ゼロ計数値の数内に収まらないので、入力Ｘの仮数２０１をLｘ分だけ左シフトし、左シフトしきれなかった分だけ入力Ｙの仮数２０２を右シフトする。即ち、左シフト量はＬｘであり、右シフト量は（Ｅｘ−Ｅｙ）−Ｌｘである。
【００８６】
このようにして桁合わせされた数同士、即ち仮数２０１を左シフトして得られた仮数２０３と仮数２０２を右シフトして得られた仮数２０４とを加算する。このとき、右シフトによって溢れた桁も保持する。更に、加算結果２０５を正規化し、先行ゼロ計数値が１以上の場合はその分だけ左シフトを行い、桁あふれがある場合には１桁分の右シフトを行う。但し、左シフトした結果指数が奇数になる場合は、左シフト量を１減らす。または右シフトした結果指数が奇数になる場合は、右シフト量を１増やす。指数は、左右シフト量に合わせて調整する。左シフトした場合は左シフト量を指数から減算し、右シフトした場合は右シフト量を指数に加算する。本具体例では１桁右シフトが必要だが、指数Ｅｚが２から３となり奇数になるので、右シフト量は１増やされて２となり、指数Ｅｚは２から４となる。
【００８７】
その後、正規化した結果２０６に対して丸め処理を実行する。この例においては右にはみ出した桁を四捨五入することにより実行される。このようにして丸められた結果が、丸め結果の仮数２０７及び対応する指数Ｅｚを含む演算結果として出力される。
【００８８】
以下に、１つのＯｒａｃｌｅ−ｎｕｍｂｅｒを複数のｏｒａｃｌｅｎｕｍ６４を含む組により表現する方法について説明する。
【００８９】
最大で２１バイト長のＯｒａｃｌｅ−ｎｕｍｂｅｒの計算を、ｏｒａｃｌｅｎｕｍ６４演算ハードウエアを用いて実現するためには、Ｏｒａｃｌｅ−ｎｕｍｂｅｒを複数のｏｒａｃｌｅｎｕｍ６４を含む組で表現する必要がある。
【００９０】
図２２は、２１バイト長のＯｒａｃｌｅ−ｎｕｍｂｅｒを３つの部分に分ける方法を示す図である。図２２に示されるように、最大２０バイト長の仮数部２１０は、７バイトの仮数部２１１、７バイトの仮数部２１２、及び６バイトの仮数部２１３に分割される。
【００９１】
図２３は、分割された３つの仮数部にそれぞれ対応するｏｒａｃｌｅｎｕｍ６４数を生成する方法を示す図である。ａ０については、元のＯｒａｃｌｅ−ｎｕｍｂｅｒの先頭８バイト部分（１バイトの符号及び指数部２１４＋７バイトの仮数部２１１）を切り出してくるだけで、ｏｒａｃｌｅｎｕｍ６４形式の数が得られる。ａ１及びａ２については、元のＯｒａｃｌｅ−ｎｕｍｂｅｒの第１バイト（符号及び指数部２１４）を加工する必要がある。具体的には、元のＯｒａｃｌｅ−ｎｕｍｂｅｒの基数１０での指数をＥとして、ａ１の指数Ｅ１＝Ｅ−１４とすることで、ａ１についての１バイトの符号及び指数部２１５を生成する。この符号及び指数部２１５に７バイトの仮数部２１２を付加して、ａ１に相当するｏｒａｃｌｅｎｕｍ６４形式の数が得られる。またａ２の指数Ｅ２＝Ｅ−２８とすることで、ａ２についての１バイトの符号及び指数部２１６を生成する。この符号及び指数部２１６に６バイトの仮数部２１３及び１バイトの"０"を付加して、ａ２に相当するｏｒａｃｌｅｎｕｍ６４形式の数が得られる。このようにして得られた３つのｏｒａｃｌｅｎｕｍ６４の組を、以下においてｔｒｉｐｌｅ−ｏｒａｃｌｅｎｕｍ６４と呼ぶ。
【００９２】
以下に、ｔｒｉｐｌｅ−ｏｒａｃｌｅｎｕｍ６４形式に対する四則演算をｏｒａｃｌｅｎｕｍ６４演算器により実行する構成について説明する。まず、最も基本となる、ｏｒａｃｌｅｎｕｍ６４の数同士の正確な和を求める演算について説明する。以下に示すｔｗｏ−ｓｕｍ（２数の和）は、非特許文献１にｆｏｒｍｕｌａ（４．１６）として示されているものであり、同様のものが非特許文献２のｐ．１８、及び、非特許文献３のａｌｇｏｒｉｔｈｍ４に示されている。
【００９３】
Two_sum(Ｘ, Ｙ)
z = fl(Ｘ + Ｙ)
w = fl(z - Ｘ)
v = fl(z - w)
z1 = fl(Ｙ - w)
z2 = fl(v - Ｘ)
zz = fl(z1 - z2)
return(z, zz)
ここでｆｌ（Ｘ＋Ｙ）は、Ｘ＋Ｙの真の値を、浮動小数点数にマッピングした結果、即ち浮動小数点形式の限られた精度内で表現した結果を示す。上記のＴｗｏ＿ｓｕｍによって得られる２数ｚ及びｚｚは、正確な意味においてｚ＋ｚｚ＝Ｘ＋Ｙを満たす。ｚはＸ＋Ｙの最重要部（most significant part）を固定精度浮動小数点の精度内で表現した値であり、ｚｚは固定精度浮動小数点の精度で表現しきれなかった残余分を表す。
【００９４】
マッピング時に発生する丸め処理方法として、１０進数で代表的な丸め方法である四捨五入を例に取り説明する。簡単のために固定精度浮動小数点数の精度は１０進２桁とする。この場合、２００００と−１との２数の和は、上記のＴｗｏ＿ｓｕｍにより以下のように計算される。
【００９５】
Ｘ = 20000
Ｙ = -1
ｚ = fl(Ｘ＋Ｙ) = 20000
ｗ = fl(ｚ−Ｘ) = 0
ｖ = fl(ｚ−ｗ) = 20000
ｚ１ = fl(Ｙ−ｗ) = -1
ｚ２ = fl(ｖ−Ｘ) = 0
ｚｚ = fl(ｚ１−ｚ２) = -1
この例のように、一般に、ｔｗｏ＿ｓｕｍの結果であるｚとｚｚは異符合となり得る。一方、丸め方法を切り捨てとした場合は、ＸとＹとで有効桁がオーバーラップしない場合には、以下の例のようにｚ＋ｚｚがＸ＋Ｙと等しくならない場合がある。
【００９６】
Ｘ = 20000
Ｙ = -1
ｚ = fl(Ｘ＋Ｙ) = 19000
ｗ = fl(ｚ−Ｘ) = -1000
ｖ = fl(ｚ−ｗ) = 20000
ｚ１ = fl(Ｙ−ｗ) = 990
ｚ２ = fl(ｖ−Ｘ) = 0
ｚｚ = fl(ｚ１−ｚ２) = 990
ここで、Ｘの絶対値がＹの絶対値より大きいか等しいと仮定し、更に以下のような新たな丸め処理を行うことにより、ｚｚの算出が容易になることを示す。
【００９７】
（１）ＸとＹとの間で有効桁のオーバーラップが無い場合は四捨五入する
（２）ＸとＹとの間で有効桁のオーバーラップがある場合は切り捨てる
但し、ＸとＹとの間で有効桁がオーバーラップしていない場合であっても、ＸとＹとの間で有効桁が連続している場合は（２）に含めることにする。
【００９８】
具体的な例を用いて、上記のような丸め処理を適用することの効果を説明する。前述の場合と同様に固定精度浮動小数点数の精度は１０進２桁である。また、ＸとＹとの間で有効桁が連続している場合の例を示す。まず上記の特殊な丸め処理ではなく、ｆｌが常に四捨五入の丸め処理を行なう場合には、以下のようになる。
【００９９】
Ｘ = 2000
Ｙ = 52
z = 2100
w = 100
v = 2000
z1 = -48
z2 = 0
zz = -48
それに対して、上記の新たな丸め処理を用いる場合は、以下のようになる。
【０１００】
Ｘ = 2000
Ｙ = 52
z = 2000
w = 0
v = 2000
z1 = 52
z2 = 0
zz = 52
上記の新たな丸め処理を用いることにより、以下の効果が得られる。まず（１）の場合には、オーバーラップがないので、Ｘ＋Ｙを行った後の四捨五入による丸め処理や、四捨五入によって発生したｗを補正するために必要であったｚ１を求める演算処理がなくなる。また（２）の場合には、Ｘ＋Ｙの精度は有効桁数の２倍以下であることが保証され、丸め処理が切り捨てのみとなるため、演算を実行するハードウエアの実現が容易となる。
【０１０１】
以上のことから、２つの入力値の絶対値を比較して、その比較結果に応じて上記の（１）又は（２）の場合分けを行ない、新たな丸め処理を実行すれば、ｚｚの算出が容易となる。また更に、ｚ，ｚｚを求める演算ｇｅｔ＿ｚ（ｘ，ｙ），ｇｅｔ＿ｚｚ（ｘ，ｙ）をハードウエアで実行する回路を設ければ、以下に示すように、ｔｗｏ＿ｓｕｍを高速に処理することが可能となる。
【０１０２】
Two_sum_fast(x, y)
z = get_z(x, y)
zz = get_zz(x, y)
return(z, zz)
図２４は、ｇｅｔ＿ｚ演算を実現する回路の構成の一例を示す図である。図２４の演算器は、図１１の演算回路１１９の一部分に相当する。図２４に示す演算器は、入力Ｘレジスタ２２１、入力Ｙレジスタ２２２、内部形式変換回路２２３及び２２４、指数仮数演算回路２２５、セレクタ２２６及び２２７、シフタ２２８及び２２９、指数加算器２３０、及び絶対値加算器２３１を含む。演算器は更に、セレクタ２３２及び２３３、正規化回路２３４、外部形式変換回路２３５、及び出力Ｚレジスタ２３６を含む。図２４において、図１４に示す回路と同一又は対応する構成要素は同一又は対応する名称で参照する。図２４において、入力と出力は同形式同精度の浮動小数点数とする。入力データは正規化されていなくてもよい。出力データは正規化される。入力データはｏｒａｃｌｅｎｕｍ６４フォーマットとし、正規化されていないデータも解釈可能である。出力データはｏｒａｃｌｅｎｕｍ６４フォーマットの通りに出力される。
【０１０３】
内部形式変換回路２２３及び２２４により、入力を符号部、指数部、及び仮数部に分割し、入力の値表現を内部形式に変換する。入力Ｘの符号、指数、仮数をそれぞれ符号Ｘ、指数Ｘ、仮数Ｘとする。入力Ｙの符号、指数、仮数をそれぞれ符号Ｙ、指数Ｙ、仮数Ｙとする。
【０１０４】
指数仮数演算回路２２５が、指数Ｘ及び指数Ｙと、仮数Ｘ及び仮数Ｙとを受け取る。指数仮数演算回路２２５は、指数Ｘと指数Ｙの大小比較をする。大小比較の結果に基づいて、指数仮数演算回路２２５は、指数の大きい側の仮数（第１の仮数）がシフタ２２８に入力され、且つ、指数の小さい側の仮数（第２の仮数）がシフタ２２９に入力されるように、セレクト信号を生成する。指数仮数演算回路２２５は、指数Ｘと指数Ｙとの差の絶対値と第１の仮数の先行ゼロ計数値とを比較し、前者の方が大きい場合は、後者をシフタ２２８の左シフト量として出力する。前者の方が小さい場合は、指数仮数演算回路２２５は、前者をシフタ２２８の左シフト量として出力する。
【０１０５】
指数仮数演算回路２２５は、指数Ｘと指数Ｙとの差の絶対値と第１の仮数の先行ゼロ計数値とを比較し、指数Ｘと指数Ｙとの差の絶対値の方が大きい場合は、指数Ｘと指数Ｙとの差の絶対値から第１の仮数の先行ゼロ計数値を減算した値をシフタ２２９の右シフト量として出力する。指数Ｘと指数Ｙとの差の絶対値の方が小さい場合は、指数仮数演算回路２２５は、ゼロをシフタ２２９の右シフト量として出力する。指数仮数演算回路２２５は更に、指数の小さい側に上述の右シフト量を加算した値を指数として出力する。
【０１０６】
指数仮数演算回路２２５は更に、（指数Ｘ−仮数Ｘの先行ゼロ計数値）−（指数Ｙ−仮数Ｙの先行ゼロ計数値）の絶対値が１４以上であるか否かを判定する。この絶対値が１４以上である場合、指数仮数演算回路２２５は、第１の仮数と第１の仮数に対応する指数とがセレクタ２３２及び２３３により選択されるように、セレクト信号を生成する。これにより、上記絶対値が１４以上である場合には、第１の仮数が、シフタ２２８及び絶対値加算器２３１をバイパスして、正規化回路２３４に入力されることになる。
【０１０７】
シフタ２２８は、入力されたシフト量に基づき、入力された仮数を左シフトする。シフタ２２９は、入力されたシフト量に基づき、入力された仮数を右シフトする。各シフタのシフト結果は絶対値加算器２３１に入力される。
【０１０８】
減算の場合は、片方の仮数が反転され、絶対値加算器２３１にキャリーが入力される。絶対値加算器２３１による加算の結果桁あふれが生じた場合は、１桁右にシフトした値が出力される。同時に、絶対値加算器２３１から指数加算器２３０にキャリーアウトが送られ、指数に加算される。
【０１０９】
絶対値加算器２３１による加算の結果桁落ちが生じた場合は、１桁左にシフトした値が出力される。同時に、絶対値加算器２３１から指数加算器２３０に桁落ちを示す信号が送られ、指数から減算される。
【０１１０】
セレクタ２３２及び２３３は、指数仮数演算回路２２５によって生成されたセレクト信号に応じて、加算結果の指数及び仮数、又は、第１の仮数及びそれに対応する指数を選択する。正規化回路２３４が、セレクタ２３２及び２３３により選択された指数及び仮数を受け取り、正規化演算結果を出力する。外部形式変換回路２３５は、正規化演算結果を外部形式に変換し、出力Ｚレジスタ２３６に出力する。
【０１１１】
図２５は、ｇｅｔ＿ｚ演算の具体例を示す図である。図２５において、入力Ｘの指数をＥｘ、入力Ｙの指数をＥｙ、入力Ｘの先行ゼロ計数値をＬｘ、出力Ｚの指数をＥｚとする。この例において実行する演算は、図２５に示すｇｅｔ＿ｚ演算２４０である。可能な限り高い演算精度を保持するとき、指数値の大きい側を左シフトして桁合わせを行う。但し、先行ゼロの桁数より多く左シフトすることは、上位桁が欠落してしまうために不可能であるので、桁合わせに必要な左シフト量Ｅｘ−Ｅｙが先行ゼロの桁数を上回る場合は、指数値の小さい側を右シフトすることで、桁合わせを行う。このためにEｘ−Eｙを計算し、Lｘと比較する。図２５に示す具体例ではLｘのほうが大きい。即ち、左シフト量Ｅｘ−Ｅｙが先行ゼロの数内に収まるので、入力Ｘの仮数２４１のみ左シフトされる。入力Ｙの仮数２４２は右シフトされない。左シフト量はEｘ−Eｙであり、右シフト量は０である。
【０１１２】
このようにして桁合わせされた数同士、即ち仮数２４１を左シフトして得られた仮数２４３と仮数２４２のままである仮数２４４とを加算する。更に、加算結果２４５を正規化し、先行ゼロ計数値が１以上の場合は先行ゼロ計数値だけ左シフトを行い、桁あふれがある場合には１桁分の右シフトを行う。但し、左シフトした結果指数が奇数になる場合は、左シフト量を１減らす。または右シフトした結果指数が奇数になる場合は、右シフト量を１増やす。指数は、左右シフト量に合わせて調整する。左シフトした場合は左シフト量を指数から減算し、右シフトした場合は右シフト量を指数に加算する。本具体例では１桁左シフトが必要だが、指数が０から１となり奇数になるので、左シフト量は１減らされて０となり、指数は０のままである。この例では、正規化による変化はない。更に正規化結果の仮数２４６の上位桁を選択する。例えば入力フォーマットの仮数が１４桁である場合は、最上位から１４桁を上位桁、最上位から１５桁目以降を下位桁とする。
【０１１３】
上記の演算の結果、仮数２４７及び対応する指数Ｅｚを含む演算結果が出力される。
【０１１４】
図２６は、ｇｅｔ＿ｚ演算の別の具体例を示す図である。この例において実行する演算は、図２６に示すｇｅｔ＿ｚ演算２５０である。可能な限り高い演算精度を保持するとき、指数値の大きい側を左シフトして桁合わせを行う。但し、先行ゼロの桁数より多く左シフトすることは、上位桁が欠落してしまうために不可能であるので、桁合わせに必要な左シフト量Ｅｘ−Ｅｙが先行ゼロの桁数を上回る場合は、指数値の小さい側を右シフトすることで、桁合わせを行う。このためにEｘ−Eｙを計算し、Lｘと比較する。図２６に示す具体例ではLｘのほうが小さい。即ち、左シフト量Ｅｘ−Ｅｙが先行ゼロの数内に収まらないので、入力Ｘの仮数２５１をＬｘ分だけ左シフトし、左シフトしきれなかった分だけ入力Ｙの仮数２５２を右シフトする。即ち、左シフト量はＬｘであり、右シフト量は（Ｅｘ−Ｅｙ）−Ｌｘである。
【０１１５】
このようにして桁合わせされた数同士、即ち仮数２５１を左シフトして得られた仮数２５３と仮数２５２を右シフトして得られた仮数２５４とを加算する。このとき、右シフトによって溢れた桁も保持する。更に、加算結果２５５を正規化し、先行ゼロが１以上の場合はその分だけ左シフトを行い、桁あふれがある場合には１桁分の右シフトを行う。但し、左シフトした結果指数が奇数になる場合は、左シフト量を１減らす。または右シフトした結果指数が奇数になる場合は、右シフト量を１増やす。指数は、左右シフト量に合わせて調整する。左シフトした場合は左シフト量を指数から減算し、右シフトした場合は右シフト量を指数に加算する。本具体例では１桁右シフトが必要だが、指数が２から３となり奇数になるので、右シフト量は１増やされて２となり、指数は２から４となる。このようにして得られた正規化の結果の仮数２５６の上位桁を選択する。例えば入力フォーマットの仮数が１４桁である場合は、最上位から１４桁を上位桁、最上位から１５桁目以降を下位桁とする。
【０１１６】
上記の演算の結果、演算結果の仮数２５７が出力されるとともに、対応する指数Ｅｚが演算結果の指数として出力される。
【０１１７】
図２７は、ｇｅｔ＿ｚ演算の更に別の具体例を示す図である。この例において実行する演算は、図２７に示すｇｅｔ＿ｚ演算２６０である。可能な限り高い演算精度を保持するとき、指数値の大きい側を左シフトして桁合わせを行う。但し、先行ゼロの桁数より多く左シフトすることは、上位桁が欠落してしまうため、桁合わせに必要な左シフト量Ｅｘ−Ｅｙが先行ゼロの桁数を上回る場合は、指数値の小さい側を右シフトすることで、桁合わせを行う。但し、桁合わせした結果、２つの入力の間に１４桁以上の差がある場合、即ち、重なりが全くない場合には、実際に演算処理を実行しなくとも演算結果を求めることが可能である。ｇｅｔ＿ｚは演算結果の上位側を求める演算であり、２入力の重なりがない場合には値の大きい側がそのまま上位側となるからである。
【０１１８】
この条件を満たすか否かを確認するため、（Ｅｘ−Ｌｘ）−（Ｅｙ−Ｌｙ）を計算し、計算結果が１４以上の場合には上記の場合に該当すると判定する。ここで値１４は、使用フォーマットにおける仮数の桁数である。この具体例では上記の場合に該当し、仮数２６１と仮数２６２との間に重なりが存在しない。この場合、仮数２６１がそのままバイパスされて加算結果として取り扱われる。
【０１１９】
更にバイパスされた結果２６３を正規化し、先行ゼロ計数値が１以上の場合は先行ゼロ計数値だけ左シフトを行い、桁あふれがある場合には１桁分の右シフトを行う。但し、左シフトした結果指数が奇数になる場合は、左シフト量を１減らす。または右シフトした結果指数が奇数になる場合は、右シフト量を１増やす。指数は、左右シフト量に合わせて調整する。左シフトした場合は左シフト量を指数から減算し、右シフトした場合は右シフト量を指数に加算する。本具体例では３桁左シフトが必要だが、指数が１６から１３となり奇数になるので、左シフト量は１減らされて２となり、指数は１６から１４となる。このようにして得られた正規化の結果が、そのまま演算結果の仮数２６４及び対応する指数Ｅｚを含む演算結果として出力される。
【０１２０】
なおｚｚは固定精度の範囲で表現しきれなかった加算演算の残余の部分を表すが、例えば乗算の場合にはｚｚを出力する命令は一般的である。乗算の場合、ｚとｚｚは互いの桁が連続した値である。しかし加算の場合は、２つの入力値の絶対値がフォーマットの桁数以上離れている場合は、zとｚｚは互いの桁が連続した値とならない。図２８（ａ）に、２つの入力値の絶対値がフォーマットの桁数以上離れている場合の加算演算の例を示す。この第１のケースにおいては、通常のフローで演算を行いｚｚを出力してもよいが、値の重なりが全くないことを利用すると、演算をしなくとも絶対値の小さい側をそのままｚｚとすることができ、ｚｚを容易に出力することが可能である。
【０１２１】
また乗算の場合は、入力の符号は演算結果の仮数の値には影響しないため、ｚｚを求める際に符号を考慮する必要がない。しかし加算の場合は、上記のように２つの入力値の絶対値が離れているとき、互いに異なる符号を有する２つの数の加算（同符号の数同士の減算）において特別な処理が必要である。図２８（ｂ）に、２つの入力値の絶対値が離れている場合における互いに異なる符号を有する２つの数の加算演算の例を示す。この第２のケースにおいては、通常のフローで演算を行うと、２つの入力の間のゼロで埋められていた桁に、図２８（ｂ）にＡとして示すように、桁下がりによってゼロ以外の値が発生する。その結果、ｚｚを表すために必要な精度が、離れた桁数分だけ増えてしまうことになる。従って、この第２のケースにおいては、通常のフローで演算を実行せずに、上記のケース１と同様の方法で絶対値の小さい側をそのままｚｚとして出力する必要がある。
【０１２２】
このように、加算におけるｚｚ出力は、乗算の場合には考慮する必要のないケースを考慮しなければならない。従って、実際の回路構成を考える際には、例えばバイパス回路を追加する等の変更が必要となる点が、乗算におけるｚｚ出力回路と異なる部分となる。
【０１２３】
図２９は、ｇｅｔ＿ｚｚ演算を実現する回路の構成の一例を示す図である。図２９の演算器は、図１１の演算回路１１９の一部分に相当する。図２９において、図２４と同一又は対応する構成要素は同一又は対応する番号で参照する。図２９に示す演算器は、入力Ｘレジスタ２２１、入力Ｙレジスタ２２２、内部形式変換回路２２３及び２２４、指数仮数演算回路２２５Ａ、セレクタ２２６及び２２７、シフタ２２８及び２２９、指数加算器２３０、及び絶対値加算器２３１を含む。演算器は更に、セレクタ２３２及び２３３、正規化回路２３４、外部形式変換回路２３５、出力Ｚレジスタ２３６、及び正規化回路２７０を含む。
【０１２４】
内部形式変換回路２２３及び２２４により、入力を符号部、指数部、及び仮数部に分割し、入力の値表現を内部形式に変換する。入力Ｘの符号、指数、仮数をそれぞれ符号Ｘ、指数Ｘ、仮数Ｘとする。入力Ｙの符号、指数、仮数をそれぞれ符号Ｙ、指数Ｙ、仮数Ｙとする。
【０１２５】
指数仮数演算回路２２５Ａが、指数Ｘ及び指数Ｙと、仮数Ｘ及び仮数Ｙとを受け取る。指数仮数演算回路２２５Ａは、指数Ｘと指数Ｙの大小比較をする。大小比較の結果に基づいて、指数仮数演算回路２２５Ａは、指数の大きい側の仮数（第１の仮数）がシフタ２２８に入力され、且つ、指数の小さい側の仮数（第２の仮数）がシフタ２２９に入力されるように、セレクト信号を生成する。指数仮数演算回路２２５Ａは、指数Ｘと指数Ｙとの差の絶対値と第１の仮数の先行ゼロ計数値とを比較し、指数Ｘと指数Ｙとの差の絶対値の方が大きい場合は、第１の仮数の先行ゼロ計数値をシフタ２２８の左シフト量として出力する。指数Ｘと指数Ｙとの差の絶対値の方が小さい場合は、指数仮数演算回路２２５Ａは、指数Ｘと指数Ｙとの差の絶対値をシフタ２２８の左シフト量として出力する。
【０１２６】
指数仮数演算回路２２５Ａは、指数Ｘと指数Ｙとの差の絶対値と第１の仮数の先行ゼロ計数値とを比較し指数Ｘと指数Ｙとの差の絶対値の方が大きい場合は、指数Ｘと指数Ｙとの差の絶対値から第１の仮数の先行ゼロ計数値を減算した値をシフタ２２９の右シフト量として出力する。第１の仮数の先行ゼロ計数値の方が小さい場合は、指数仮数演算回路２２５Ａは、ゼロをシフタ２２９の右シフト量として出力する。指数仮数演算回路２２５Ａは更に、指数の小さい側に上述の右シフト量を加算した値を指数として出力する。
【０１２７】
指数仮数演算回路２２５Ａは更に、（指数Ｘ−仮数Ｘの先行ゼロ計数値）−（指数Ｙ−仮数Ｙの先行ゼロ計数値）の絶対値が１４以上であるか否かを判定する。この絶対値が１４以上である場合、指数仮数演算回路２２５は、第２の仮数とそれに対応する指数がセレクタ２３２及び２３３により選択されるように、セレクト信号を生成する。これにより、上記（指数Ｘ−仮数Ｘの先行ゼロ計数値）−（指数Ｙ−仮数Ｙの先行ゼロ計数値）の絶対値がフォーマットの桁数である１４以上である場合には、第２の仮数が、シフタ２２８及び絶対値加算器２３１をバイパスして、正規化回路２３４に入力されることになる。
【０１２８】
シフタ２２８は、入力されたシフト量に基づき、入力された仮数を左シフトする。シフタ２２９は、入力されたシフト量に基づき、入力された仮数を右シフトする。各シフタのシフト結果は絶対値加算器２３１に入力される。
【０１２９】
減算の場合は、片方の仮数が反転され、絶対値加算器２３１にキャリーが入力される。絶対値加算器２３１による加算の結果桁あふれが生じた場合は、１桁右にシフトした値が出力される。同時に、絶対値加算器２３１から指数加算器２３０にキャリーが送られ、指数に加算される。
【０１３０】
絶対値加算器２３１による加算の結果桁落ちが生じた場合は、１桁左にシフトした値が出力される。同時に、絶対値加算器２３１から指数加算器２３０に桁落ちを示す信号が送られ、指数から減算される。
【０１３１】
正規化回路２７０が、加算結果と指数演算結果とを受け取り、正規化された指数部と仮数部とを出力する。
【０１３２】
セレクタ２３２及び２３３は、指数仮数演算回路２２５によって生成されたセレクト信号に応じて、正規化された指数及び仮数、又は、第２の仮数及びそれに対応する指数を選択する。正規化回路２３４が、セレクタ２３２及び２３３により選択された指数及び仮数を受け取り、正規化演算結果を出力する。外部形式変換回路２３５は、正規化演算結果を外部形式に変換し、出力Ｚレジスタ２３６に出力する。
【０１３３】
図３０は、ｇｅｔ＿ｚｚ演算の具体例を示す図である。図３０において、入力Ｘの指数をＥｘ、入力Ｙの指数をＥｙ、入力Ｘの先行ゼロ計数値をＬｘ、出力Ｚの指数をＥｚとする。この例において実行する演算は、図３０に示すｇｅｔ＿ｚｚ演算２８０である。可能な限り高い演算精度を保持するとき、指数値の大きい側を左シフトして桁合わせを行う。但し、先行ゼロの桁数より多く左シフトすることは、上位桁が欠落してしまうため、桁合わせに必要な左シフト量Ｅｘ−Ｅｙが先行ゼロの桁数を上回る場合は、指数値の小さい側を右シフトすることで、桁合わせを行う。このためにEｘ−Eｙを計算し、Lｘと比較する。図３０に示す具体例ではLｘのほうが大きい。即ち、左シフト量Ｅｘ−Ｅｙが先行ゼロの数内に収まるので、入力Ｘの仮数２８１のみ左シフトされる。入力Ｙの仮数２８２は右シフトされない。左シフト量はEｘ−Eｙであり、右シフト量は０である。
【０１３４】
このようにして桁合わせされた数同士、即ち仮数２８１を左シフトして得られた仮数２８３と仮数２８２のままである仮数２８４とを加算する。更に、加算結果２８５を正規化し、先行ゼロ計数値が１以上の場合はその分だけ左シフトを行い、桁あふれがある場合には１桁分の右シフトを行う。但し、左シフトした結果指数が奇数になる場合は、左シフト量を１減らす。または右シフトした結果指数が奇数になる場合は、右シフト量を１増やす。指数は、左右シフト量に合わせて調整する。左シフトした場合は左シフト量を指数から減算し、右シフトした場合は右シフト量を指数に加算する。本具体例では１桁左シフトが必要だが、指数が０から１となり奇数になるので、左シフト量は１減らされて０となり、指数は０のままである。
【０１３５】
次に、正規化結果の下位桁２８６を選択する。例えば入力フォーマットの仮数が１４桁である場合は、最上位から１４桁を上位桁、最上位から１５桁目以降を下位桁とする。下位桁選択に伴い、指数は−１４される。本具体例では、下位桁はゼロが選択される。
【０１３６】
更に、選択された下位桁２８７を正規化する。本具体例では対象データはゼロであるので、正規化前の仮数及び指数がそのまま正規化の結果として出力される。正規化された結果が、演算結果の仮数２８８及び対応する指数Ｅｚを含む演算結果として出力される。
【０１３７】
図３１は、ｇｅｔ＿ｚｚ演算の別の具体例を示す図である。この例において実行する演算は、図３１に示す加算２９０である。可能な限り高い演算精度を保持するとき、指数値の大きい側を左シフトして桁合わせを行う。但し、先行ゼロの桁数より多く左シフトすることは、上位桁が欠落してしまうために不可能であるので、桁合わせに必要な左シフト量Ｅｘ−Ｅｙが先行ゼロの桁数を上回る場合は、指数値の小さい側を右シフトすることで、桁合わせを行う。このためにEｘ−Eｙを計算し、Lｘと比較する。図３１に示す具体例ではLｘのほうが小さい。即ち、左シフト量Ｅｘ−Ｅｙが先行ゼロの数内に収まらないので、入力Ｘの仮数２９１をＬｘ分だけ左シフトし、左シフトしきれなかった分だけ入力Ｙの仮数２９２を右シフトする。即ち、左シフト量はＬｘであり、右シフト量は（Ｅｘ−Ｅｙ）−Ｌｘである。
【０１３８】
このようにして桁合わせされた数同士、即ち仮数２９１を左シフトして得られた仮数２９３と仮数２９２を右シフトして得られた仮数２９４とを加算する。このとき、右シフトによって溢れた桁も保持する。
【０１３９】
更に、加算結果２９５を正規化し、先行ゼロ計数値が１以上の場合はその分だけ左シフトを行い、桁あふれがある場合には１桁分の右シフトを行う。但し、左シフトした結果指数が奇数になる場合は、左シフト量を１減らす。または右シフトした結果指数が奇数になる場合は、右シフト量を１増やす。指数は、左右シフト量に合わせて調整する。左シフトした場合は左シフト量を指数から減算し、右シフトした場合は右シフト量を指数に加算する。本具体例では１桁右シフトが必要だが、指数が２から３となり奇数になるので、右シフト量は１増やされて４となり、指数は２から４となる。
【０１４０】
次に、正規化結果の下位桁２９６を選択する。例えば入力フォーマットの仮数が１４桁である場合は、最上位から１４桁を上位桁、最上位から１５桁目以降を下位桁とする。下位桁選択に伴い、指数は−１４される。
【０１４１】
更に、選択された下位桁２９７を正規化する。本具体例では、仮数は２桁左にシフトされ、指数は−１０から２が減算されて−１２となる。正規化された結果が、演算結果の仮数２９８及び対応する指数Ｅｚを含む演算結果として出力される。
【０１４２】
図３２は、ｇｅｔ＿ｚｚ演算の更に別の具体例を示す図である。この例において実行する演算は、図３２に示すｇｅｔ＿ｚｚ演算３００である。可能な限り高い演算精度を保持するとき、指数値の大きい側を左シフトして桁合わせを行う。但し、先行ゼロの桁数より多く左シフトすることは、上位桁が欠落してしまうため、桁合わせに必要な左シフト量Ｅｘ−Ｅｙが先行ゼロの桁数を上回る場合は、指数値の小さい側を右シフトすることで、桁合わせを行う。但し、桁合わせした結果、２つの入力の間に１４桁以上の差がある場合、即ち、重なりが全くない場合には、実際に演算処理を実行しなくとも演算結果を求めることが可能である。ｇｅｔ＿ｚｚは演算結果の下位側を求める演算であり、２入力の重なりがない場合には値の小さい側がそのまま下位側となるからである。
【０１４３】
この条件を満たすか否かを確認するため、（Ｅｘ−Ｌｘ）−（Ｅｙ−Ｌｙ）を計算し、計算結果が１４以上の場合には上記の場合に該当すると判定する。ここで値１４は、使用フォーマットにおける仮数の桁数である。この具体例では上記の場合に該当し、仮数３０１と仮数３０２との間に重なりが存在しない。この場合、仮数３０２がそのままバイパスされて加算結果として取り扱われる。
【０１４４】
更にバイパスされた結果３０３を正規化し、先行ゼロ計数値が１以上の場合はその分だけ左シフトを行い、桁あふれがある場合には１桁分の右シフトを行う。但し、左シフトした結果指数が奇数になる場合は、左シフト量を１減らす。または右シフトした結果指数が奇数になる場合は、右シフト量を１増やす。指数は、左右シフト量に合わせて調整する。左シフトした場合は左シフト量を指数から減算し、右シフトした場合は右シフト量を指数に加算する。本具体例では１桁左シフトが必要だが、指数が０から−１となり奇数になるので、左シフト量は１減らされて０となり、指数は０のままとなる。このようにして得られた正規化の結果が、そのまま演算結果の仮数３０４及び対応する指数Ｅｚを含む演算結果として出力される。
【０１４５】
図３３は、ｔｗｏ＿ｓｕｍの回路図シンボルを示す図である。上述したｔｗｏ＿ｓｕｍは、ｔｒｉｐｌｅ−ｏｒａｃｌｅｎｕｍ６４計算において頻繁に用いられる演算である。このｔｗｏ＿ｓｕｍ演算、即ちｘとｙとの正確な和を表現するｚとｚｚとを求める演算を、図３３に示すような演算子３１０で表わすものとする。
【０１４６】
図３４は、ｔｒｉｐｌｅ−ｏｒａｃｌｅｎｕｍ６４とｏｒａｃｌｅｎｕｍ６４の和を求める回路の一例を示す図である。図３４に示す回路は、３つのｔｗｏ＿ｓｕｍ演算子３１０と再正規化部３１１とを含む。入力ｂは１つのｏｒａｃｌｅｎｕｍ６４の数であり、入力ａ０，ａ１，ａ２はｔｒｉｐｌｅ−ｏｒａｃｌｅｎｕｍ６４である。また出力ｓ０，ｓ１，ｓ２もまたｔｒｉｐｌｅ−ｏｒａｃｌｅｎｕｍ６４である。図３４に示すような回路構成により、ｔｒｉｐｌｅ−ｏｒａｃｌｅｎｕｍ６４とｏｒａｃｌｅｎｕｍ６４の和を求めることができる。なお再正規化部３１１が実行する演算については、後述する。
【０１４７】
図３５は、ｔｒｉｐｌｅ−ｏｒａｃｌｅｎｕｍ６４同士の和を求めるアルゴリズムを示す図である。前述のｔｗｏ−ｓｕｍを用いて、ｔｒｉｐｌｅ−ｏｒａｃｌｅｎｕｍ６４同士の和を求めることができる。図３５に示すＴｒｉｐｌｅ＿Ａｄｄは、第１のｔｒｉｐｌｅ−ｏｒａｃｌｅｎｕｍ６４であるａ０，ａ１，ａ２と第２のｔｒｉｐｌｅ−ｏｒａｃｌｅｎｕｍ６４であるｂ０，ｂ１，ｂ２との和を求める。この演算は、非特許文献２のＡ．２節に開示されているものと同様である。また非特許文献３に開示されるａｌｇｏｒｉｔｈｍ１３，１４とも同様である。残りの四則演算についても、非特許文献１乃至３に開示の方法を用いて実現可能である。
【０１４８】
以下に、計算結果の再正規化について述べる。再正規化については、非特許文献２のｐ．１１６に述べられており、非特許文献３でもそれを参照している。ここでは、非特許文献２に記載される再正規化をＰｒｉｅｓｔの再正規化と呼ぶ。再正規化前の演算結果（Ｘ０，Ｘ１，Ｘ２，Ｘ３）は、概ね絶対値の大きい順に並んでいるが、一般に、一部の桁にオーバーラップがある。また、Ｘ０がＸ０＋Ｘ１＋Ｘ２＋Ｘ３の最重要（most significant）な部分を固定精度で表現した結果になっていない。
【０１４９】
計算結果（Ｘ０，Ｘ１，Ｘ２，Ｘ３）をＰｒｉｅｓｔの方法で再正規化した結果を（ａ０，ａ１，ａ２）とすると、ａ０＋ａ１＋ａ２は、Ｘ０＋Ｘ１＋Ｘ２＋Ｘ３とｔｒｉｐｌｅの範囲で等しく、且つ、以下を満たす。
【０１５０】
|a0| ≧|a1| ≧ |a2|
E(i+1) ≦ Ei - 14
ここで、Ｅｉは基数を１０とした場合の要素ａｉの指数である。ｏｒａｃｌｅｎｕｍ６４の精度は１０進で１４桁なので、上記の第２の条件は、要素がオーバーラップしていないことを表わす。
【０１５１】
Ｐｒｉｅｓｔの再正規化にも、前述のｔｗｏ＿ｓｕｍが用いられる。まず、オーバーラップを除去するために、図３６のように接続された３つのｔｗｏ＿ｓｕｍ演算子３１０を用いる。これにより得られる（ｔ０，ｔ１，ｔ２，ｔ３）は、オーバーラップしておらず、且つ、０でない要素については絶対値の大きいものから順に並んでいる。これらをｔ０から順に蓄積していったものを（ａ０，ａ１，ａ２）とすればよい。この蓄積を行なう演算ａｃｃｕｍｕｌａｔｅにもｔｗｏ＿ｓｕｍが用いられる。
【０１５２】
一般に再正規化前の演算結果（Ｘ０，Ｘ１，Ｘ２，Ｘ３）の符号は揃ってなく、前述のようにｔｗｏ＿ｓｕｍを繰り返した結果である（ａ０，ａ１，ａ２）の符号も揃っていない。そこでＰｒｉｅｓｔの再正規化を行った固定精度浮動小数点数の組に含まれる数の符号が全て同符号な場合を、符号の揃ったＰｒｉｅｓｔの再正規化と呼ぶ。
【０１５３】
本願では、Ｐｒｉｅｓｔの再正規化よりも条件の厳しい「強い正規化」を用いる。強い正規化された組（ｂ０，ｂ１，ｂ２）は、次の条件を満たす。なお強い正規化により、ｂ１＝０且つｂ２≠０となる場合が生じるため、｜ｂ０｜＞＝｜ｂ１｜＞＝｜ｂ２｜の条件は一般に成り立たない。
【０１５４】
E(i+1) = Ei - 14
b0,b1,b2：全て同符号
このような強い正規化により、各要素の指数の差と固定小数点数の精度（桁数）とが一致する。従って、強い正規化された組を元のＯｒａｃｌｅ−ｎｕｍｂｅｒ表現に戻すことは容易である。
【０１５５】
まず図３６で示されるオーバーラップが無く０以外の数は絶対値の大きいものから順に並んでいる数の組（ｔ０，ｔ１，ｔ２，・・・）から、符号の揃ったＰｒｉｅｓｔの再正規化された数の組（ａ０，ａ１，ａ２，・・・）を得るための処理を示す。ここでｆｌ＿ｔｒｕｎｃａｔｅ（Ｘ＋Ｙ）は、固定精度浮動小数点数ＸとＹとの和を有効桁で切り捨てる演算を表し、ｔｗｏ＿ｓｕｍ（Ｘ，Ｙ）は前述の通り有効桁に重なりの無い２数を求める演算とする。但しここではｔｗｏ＿ｓｕｍ内での演算は全て四捨五入で丸め処理されるものとする。
【０１５６】
a0 = fl_truncate(t0+t1)
(z0,zz0) = two_sum(t0,t1)
ｚｚ０＝０の場合、以下の様にｚｚ０≠０となるまでｔ２，ｔ３，・・・を順次ａｃｃｕｍｕｌａｔｅしていく。
【０１５７】
a0 = fl_truncate(a0+t2)
(z0,zz0) = two_sum(a0,t2)
入力された数の組(ｔ０，ｔ１，ｔ２，・・・)を全てａｃｃｕｍｕｌａｔｅされてもｚｚ０＝０な場合はそこで処理を終了する。以下ｚｚ０≠０となった後の処理を示す。
【０１５８】
w0 = fl_truncate(z0 - a0)
ここで、ｔｗｏ＿ｓｕｍの性質より、
t0+t1+...+ti = z0+zz0 = a0+w0+zz0
となる。但しｔ０，ｔ１，・・・，ｔｉはｚｚ０≠０となるまでａｃｃｕｍｕｌａｔｅされた数である。この時、以下の通りａ０と（ｗ０＋ｚｚ０）は同符号であり、且つ、ａ０と（ｗ０＋ｚｚ０）に有効桁の重なりは無いと言える。
【０１５９】
（ｉ）w０＝０の場合：ｚｚ０はｆｌ＿ｔｒｕｎｃａｔｅ（ｔ０+ｔ１+...+ｔｉ）によって切り捨てられた数に等しいため、ａ０と（ｗ０＋ｚｚ０）は同符号であり、且つ、ａ０と（ｗ０＋ｚｚ０）に有効桁の重なりは無い。
【０１６０】
(ｉｉ)w０≠０の場合：w０はa０と同符号でa０の有効桁最下位にのみ１が立つ数であり、ｚｚ０の絶対値はｗ０の絶対値よりも小さくｚｚ０とｗ０は異符号なため、ａ０と(ｗ０＋ｚｚ０)は同符号であり、且つ、ａ０と（ｗ０＋ｚｚ０）に有効桁の重なりは無い。
【０１６１】
次に、（ｗ０，ｚｚ０，ｔｉ＋１，...）に対して同様の処理を繰り返すことで、ａ１，ａ２，・・・を順次求めることができる。この際、上記（ｉ），（ｉｉ）によりａ１，ａ２，・・・は全て同符合となる。
【０１６２】
図３７は、符号の揃ったＰｒｉｅｓｔの再正規化の例を示す図である。この例においては、簡単のために固定精度浮動小数点数は１０進４桁とし、ｔｗｏ＿ｓｕｍでの丸め処理方法は四捨五入であるとする。図３７において、（ｔ０，ｔ１，ｔ２，ｔ３）はオーバーラップしておらず、且つ、０でない要素については絶対値の大きいものから順に並んでいる。これらをｔ０から順に蓄積していくことで、符号の揃ったＰｒｉｅｓｔの再正規化された数の組ａ０，ａ１，ａ２，ａ３が得られている。
【０１６３】
図３８は、符号の揃ったＰｒｉｅｓｔの再正規化された数の組から強い正規化された数の組を得る計算の一例を示す図である。強い正規化のためには、符号の揃ったＰｒｉｅｓｔの再正規化された数の組から第２要素以降を適切に量子化してやればよい。図３８に示す例では、簡単のために固定精度浮動小数点数は１０進４桁としてある。図３８に示されるように、符号の揃ったＰｒｉｅｓｔの再正規化された数の組（ａ０，ａ１，ａ２）から強い正規化が行われた数の組（ｂ０，ｂ１，ｂ２）が求められている。
【０１６４】
図３９は、量子化のためのｓｃａｌｅ＿ｎｅｘｔ（Ｘ，Ｙ）演算を実現する回路構成の一例を示す図である。図３９に示す回路は、指数補正値レジスタ３２０、入力Ｘレジスタ３２１、入力Ｙレジスタ３２２、内部形式変換回路３２３及び３２４、指数加算器３２５、シフト量演算回路３２６、右シフタ３２７、外部形式変換回路３２８、及び出力Ｚレジスタ３２９を含む。この回路の入力データは以下の条件を満たしていることを前提としている。
【０１６５】
指数Ｙ ≧ 指数Ｘ + t
ここでｔはｏｒａｃｌｅｎｕｍ６４の桁数である。本実施例では、ｔは例えば１４である。
【０１６６】
内部形式変換回路３２３及び３２４により、入力を指数部及び仮数部に分割し、入力の値表現を内部形式に変換する。入力Ｘの指数及び仮数をそれぞれ指数Ｘ及び仮数Ｘとする。入力Ｙの指数を指数Ｙとする。指数補正値レジスタ３２０には、予め決められた固定値ｔが格納される。レジスタ格納値として設定するのではなく、ハード的に固定値を設定してもよい。
【０１６７】
シフト量演算回路３２６が指数Ｘと指数Ｙと固定値ｔを受け取る。シフト量演算回路３２６は、指数Ｙ−指数Ｘ−ｔの演算結果をシフト量として出力する。右シフタ３２７は、このシフト量と仮数Ｘとを受け取り、仮数Ｘを当該シフト量だけ右シフトした結果を出力する。シフトアウトした桁は捨てられる。
【０１６８】
指数加算器３２５は、指数Ｙと固定値tとを受け取り、指数Ｙ−ｔの演算結果を出力する。外部形式変換回路３２８は、指数加算器３２５からの指数と右シフタ３２７からの仮数を外部形式に変換し、出力Ｚレジスタ３２９に出力する。
【０１６９】
図４０は、仮数部を内部形式に変換せずにｓｃａｌｅ＿ｎｅｘｔ演算を行う回路の構成の一例を示す図である。図４０において、図３９と同一の構成要素は同一の番号で参照し、その説明は適宜省略する。図４０では、内部形式変換回路３２３の代りに内部形式変換回路３２３Ａが設けられ、外部形式変換回路３２８の代りに外部形式変換回路３２８Ａが設けられている。入力データがｏｒａｃｌｅｎｕｍ６４形式の場合、右シフタはシフト量２につき８ビットシフトする。
【０１７０】
内部形式変換回路３２３Ａ及び３２４により、入力を指数部及び仮数部に分割し、入力の値表現を内部形式に変換する。入力Ｘの指数を指数Ｘとする。入力Ｙの指数を指数Ｙとする。指数補正値レジスタ３２０には、予め決められた固定値ｔが格納される。ここで指数補正値を指示する手段としては、この例のように格納値により補正値を設定するレジスタであってよいし、或いはハード的に固定値を設定する回路であってもよい。
【０１７１】
シフト量演算回路３２６が指数Ｘと指数Ｙと固定値ｔを受け取る。シフト量演算回路３２６は、指数Ｙ−指数Ｘ−ｔの演算結果をシフト量として出力する。右シフタ３２７は、このシフト量と仮数Ｘとを受け取り、仮数Ｘを当該シフト量だけ右シフトした結果を出力する。シフトアウトした桁は捨てられる。
【０１７２】
指数加算器３２５は、指数Ｙと固定値tとを受け取り、指数Ｙ−ｔの演算結果を出力する。外部形式変換回路３２８Ａは、指数加算器３２５からの指数を外部形式に変換し、出力Ｚレジスタ３２９に出力する。また右シフタ３２７の出力する右シフト後の仮数は、そのまま出力Ｚレジスタ３２９に出力される。
【０１７３】
以下に、ｔｒｉｐｌｅ−ｏｒａｃｌｅｎｕｍ６４形式に対する丸め処理を考える。ここでは、丸め処理対象であるｔｒｉｐｌｅ−ｏｒａｃｌｅｎｕｍ６４形式の数の組（ａ０，ａ１，ａ２）は再正規化されていることを前提とする。なおこの前提条件は、Ｐｒｉｅｓｔの再正規化及び強い正規化の何れであってもよい。
【０１７４】
図４１は、Ｏｒａｃｌｅ−ＤａｔａｂａｓｅにおけるＮＵＭＢＥＲ型の３種類の精度指定方法を示す表である。ここで、丸め方向は常に四捨五入である。例えば、計算結果が１２３４．５６だった場合に、ＮＵＭＢＥＲ（４）、ＮＵＭＢＥＲ（４，−２）、ＮＵＭＢＥＲ（４，１）のそれぞれの指定に対する丸め結果は、以下の通りとなる。
【０１７５】
ＮＵＭＢＥＲ（４）→１２３４
ＮＵＭＢＥＲ（４，−２）→１２００
ＮＵＭＢＥＲ（４，１）→エラー
最後の例でエラーとなるのは、計算結果である１２３４．５６を小数点１位まで表わすように丸めた結果である１２３４．６が、４桁の精度内に収まらないためである。
【０１７６】
ｔｒｉｐｌｅ−ｏｒａｃｌｅｎｕｍ６４形式においても、このような丸め処理を、エラー判定も含めて効率良く実現する必要がある。ここで用いることのできる演算器は、８バイト幅のオペランドを２つの入力として、１つの８バイト幅の数を出力する演算器である。丸め処理においても、このような演算器を前提とする。
【０１７７】
そこで、ｔｒｉｐｌｅ−ｏｒａｃｌｅｎｕｍ６４で表現された数の丸め処理を、以下の３ステップで実現することにする。
【０１７８】
１）四捨五入が発生する桁位置のみ５があるような数を生成する。
【０１７９】
２）ｔｒｉｐｌｅ−ｏｒａｃｌｅｎｕｍ６４形式の数に、上で生成した数を加える。
【０１８０】
３）適切な桁位置で切捨てを行う。
まず、第１ステップのアルゴリズムについて述べる。以降、丸め対象数のｔｒｉｐｌｅ−ｏｒａｃｌｅｎｕｍ６４表現を（ａ０，ａ１，ａ２）とする。また、この組の最重要要素ａ０の値は、
a0 = M * 100^e
で表わされるとする。また、上式のｅを求めるための演算をｅ（ａ０）と表すことにする。
【０１８１】
第１ステップは、精度指定方法により、生成アルゴリズムが異なる。精度指定がない場合（引数なしのＮＵＭＢＥＲ指定の場合）には、仮数部が２０バイト以下となるように丸めが行われる必要がある。
【０１８２】
精度指定時のアルゴリズムを記述するには、ａ０を１０進表記で表した方が都合がよい。そこで、
a0 = M' * 10^e'
の形で表す。また、仮数部が１０＞｜Ｍ'｜＞＝０を満たすように正規化されているものとする。また、前と同様に、ｅ'を求めるための演算をｅ'（ａ０）と表す。
【０１８３】
図４２は、四捨五入が発生する桁位置のみ５があるような数を生成するアルゴリズムの例を示す図である。図４２（ａ）及び（ｂ）には、１０進桁数による精度指定の場合のアルゴリズムが示される。これら２つのアルゴリズムは、いずれも２入力１出力型の演算器として実現可能である。図４２（ｃ）には、スケール（小数点からの相対位置）指定の場合のアルゴリズムが示される。小数点からの相対位置を指定するので、ａ０に依存しない計算となる。この図４２（ｃ）に示すアルゴリズムは、図示した通りの数式をそのままプログラム化してもよいが、ｎの各値に対応するテーブルを用意しておいて、ｎをキーにテーブルを引くようなプログラムを用意してもよい。
【０１８４】
スケール指定があった場合に、丸めた結果が指定精度に収まるか否かは、以下のように判定できる。ＮＵＭＢＥＲ（ｐ，ｓ）が指定された場合、まず、上述の精度指定の場合のアルゴリズムとスケール指定のアルゴリズムとを両方用いて、ｐ＿ｄ及びｐ＿ｓの２つの値を計算する。
【０１８５】
p_d = get_comma5(a0, digits=p)
p_s = get_comma5(scale=s)
このとき、｜ｐ＿ｄ｜＞｜ｐ＿ｓ｜となった場合、すなわちｐ＿ｄの絶対値がｐ＿ｓの絶対値よりも大きい場合には、スケール指定で丸められた結果を表現するためには、精度が不足していることがわかる。
【０１８６】
次に第２ステップでは、第１ステップで生成した数を、ｔｒｉｐｌｅ−ｏｒａｃｌｅｎｕｍ６４で表現された数に加える。この加算には、図３４に示したアルゴリズムが利用できる。
【０１８７】
第３ステップでは、適切な位置で切り捨てを行う。ここでも、第１ステップで生成した数ｐ（精度指定の方式に応じたｐ＿ｄまたはｐ＿ｓの何れかの値）を利用することができる。この数ｐは、四捨五入のために加算される数であり、丸めが発生する桁位置に関する情報を完全に含んでいる。そのため、ｔｒｉｐｌｅ−ｏｒａｃｌｅｎｕｍ６４の各要素とｐとの２つのオペランドを入力として、各要素を適切にｔｒｕｎｃａｔｅする演算を定義することができる。
【０１８８】
第２ステップの計算結果を（ｂ０，ｂ１，ｂ２）とすると、丸めの第３段階の結果（ｃ０，ｃ１，ｃ２）は、
c0 = truncate(b0, p)
c1 = truncate(b1, p)
c2 = truncate(b2, p)
となる。
【０１８９】
図４３は、ｇｅｔ＿ｃｏｍｍａ５（ｐｒｅｃｉｓｉｏｎ）を実現する回路構成の一例を示す図である。図４３に示す回路は、精度ｐレジスタ３３０、入力Ｘレジスタ３３１、内部形式変換回路３３２、先行ゼロ計数回路３３３、指数加算器３３４、レジスタ３３５及び３３６、セレクタ３３７、外部形式変換回路３３８、及び出力Ｚレジスタ３３９を含む。
【０１９０】
内部形式変換回路３３２により、入力を指数部及び仮数部に分割し、入力の値表現を内部形式に変換する。入力Ｘの指数と仮数をそれぞれ指数Ｘ、仮数Ｘとする。先行ゼロ計数回路３３３は、仮数Ｘを受け取り、仮数Ｘ中の先行ゼロの数を計数する。指数加算器３３４は、指数Ｘ＋１−精度ｐ−仮数Ｘの先行ゼロ計数値を計算する。セレクタ３３７は、指数加算器３３４の出力が奇数の場合にはレジスタ３３６の５０００−００を選択し、指数加算器３３４の出力が偶数の場合にはレジスタ３３５の０５００−００を選択する。
【０１９１】
指数加算器３３４から外部形式変換回路３３８へ供給される指数は、指数加算器３３４の出力が奇数の場合は当該指数の最下位ビットをゼロとし、指数加算器３３４の出力が偶数の場合はそのままとする。外部形式変換回路３３８は、内部形式変換回路３３２からの符号、指数加算器３３４からの指数、及びセレクタ３３７からの仮数を外部形式の数に変換して、変換結果を出力Ｚレジスタ３３９に出力する。
【０１９２】
図４４は、ｔｒｕｎｃａｔｅ演算を実現する回路構成の一例を示す図である。図４４の回路は、入力Ｘレジスタ３４０、ｃｏｍｍａ５レジスタ３４１、内部形式変換回路３４２及び３４３、先行ゼロ計数回路３４４、マスク値生成回路３４５、マスク回路３４６、外部形式変換回路３４７、及び出力Ｚレジスタ３４８を含む。
【０１９３】
内部形式変換回路３４２及び３４３により、入力を符号、指数部、及び仮数部に分割し、入力の値表現を内部形式に変換する。入力Ｘの符号、指数、及び仮数をそれぞれ符号Ｘ、指数Ｘ、及び仮数Ｘとする。入力ｃｏｍｍａ５の指数と仮数をそれぞれ指数c及び仮数cとする。
【０１９４】
先行ゼロ計数回路３４４は、仮数ｃを受け取り、仮数ｃ中の先行ゼロの数を計数する。マスク値生成回路３４５は、指数Ｘ、指数c、及び仮数cの先行ゼロ計数値を入力として受け取り、これらの入力に応じてマスクデータを生成する。マスク回路３４６は、仮数Ｘをマスクデータに応じてマスクし、マスク後の値を仮数として出力する。外部形式変換回路３４７は、内部形式変換回路３４２からの符号Ｘ及び指数Ｘ並びにマスク回路３４６からの仮数を外部形式の数に変換して、変換結果を出力Ｚレジスタ３４８に出力する。
【０１９５】
図４５は、マスク値生成回路の構成の一例を示す図である。図４５に示すマスク値生成回路３４５は、マスク桁演算回路３５０、デコーダ３５１、及びセレクタ３５２−１乃至３５２−１４を含む。マスク桁演算回路３５０は、指数Ｘ、指数ｃ、及び先行ゼロ計数値Ｌｃを受け取り、マスク桁を演算する。マスク桁は、使用フォーマットの仮数の桁数を１４とすると、１４＋（指数ｃ−Ｌｃ）−指数Ｘで求められる。この値は、マスクデータの最下位桁から何桁目までがゼロに設定されるかを示す。このように計算されたマスク桁演算結果に基づいて、デコーダ３５１が、桁ごとのセレクト信号を生成する。デコーダ３５１が生成したセレクト信号は、１４桁にそれぞれ対応するセレクタ３５２−１乃至３５２−１４に供給される。マスク桁演算結果がｎの場合、下位からｎ桁は００００側を選択するようにセレクト信号が生成される。マスク桁演算結果が０の場合は、全ての桁が１１１１側を選択するようにセレクト信号が生成される。このセレクト信号に応じて、セレクタ３５２−１乃至３５２−１４が、１１１１又は００００の何れかのビット列を選択し、選択したビット列をマスクデータとして出力する。
【０１９６】
図４６は、ｐ＿ｄ及びｐ＿ｓの絶対値大小比較エラー判定回路の構成の一例を示す図である。この回路は、ｐ＿ｓレジスタ３６０、ｐ＿ｄレジスタ３６１、内部形式変換回路３６２及び３６３、指数仮数演算回路３６４、セレクタ３６５及び３６６、シフタ３６７及び３６８、符号演算器３６９、加算器３７０、コンプリメンタ３７２、コンプリメンタ３７３、及びエラーフラグレジスタ３７１を含む。
【０１９７】
内部形式変換回路３６２及び３６３により、入力を指数部、及び仮数部に分割し、入力の値表現を内部形式に変換する。入力ｐ＿ｓの指数、仮数をそれぞれ指数Ｘ、仮数Ｘとする。入力ｐ＿ｄの指数、仮数をそれぞれ指数Ｙ、仮数Ｙとする。
【０１９８】
指数仮数演算回路３６４が、指数Ｘ及び指数Ｙと、仮数Ｘ及び仮数Ｙとを受け取る。指数仮数演算回路３６４は、指数Ｘと指数Ｙの大小比較をする。大小比較の結果に基づいて、指数仮数演算回路３６４は、指数の大きい側の仮数（第１の仮数）がシフタ３６７に入力され、且つ、指数の小さい側の仮数（第２の仮数）がシフタ３６８に入力されるように、セレクト信号を生成する。指数仮数演算回路３６４は、指数Ｘと指数Ｙとの差の絶対値と第１の仮数の先行ゼロ計数値とを比較し、前者の方が大きい場合は、後者をシフタ３６７の左シフト量として出力する。前者の方が小さい場合は、指数仮数演算回路３６４は、前者をシフタ３６７の左シフト量として出力する。
【０１９９】
指数仮数演算回路３６４は、指数Ｘと指数Ｙとの差の絶対値と第１の仮数の先行ゼロ計数値とを比較し、前者の方が大きい場合は、前者から後者を減算した値をシフタ３６８の右シフト量として出力する。前者の方が小さい場合は、指数仮数演算回路３６４は、ゼロをシフタ３６８の右シフト量として出力する。
【０２００】
シフタ３６７は、入力されたシフト量に基づき、入力された仮数を左シフトする。シフタ３６８は、入力されたシフト量に基づき、入力された仮数を右シフトする。各シフタのシフト結果はコンプリメンタ３７２、コンプリメンタ３７３に入力される。
【０２０１】
コンプリメンタ３７２は入力された前述のセレクト信号が反転された信号により入力された左シフトの出力をコンプリメントするＥＯＲ回路（排他的論理和回路）である。コンプリメンタ３７３は入力された前述のセレクト信号により入力された右シフトの出力をコンプリメントするＥＯＲ回路（排他的論理和回路）である。各コンプリメンタの結果は加算器３７０に入力される。
【０２０２】
加算器３７０にキャリーが入力される。加算器３７０による加算の結果桁あふれが生じた場合は、符号演算器３６９にキャリーアウトが供給される。
【０２０３】
符号演算器３６９は、加算器３７０からキャリーアウトを受け取る。符号演算器３６９は、キャリーアウトの反転値が１であるとき、エラーフラグを１にする。それ以外の場合において、エラーフラグは０である。符号演算器３６９が生成するエラーフラグは、エラーフラグレジスタ３７１に格納される。
【０２０４】
図４７は、上記の符号演算器の回路構成の一例を示す図である。図４７（ａ）に示す符号演算器は、インバータ３８０を含む。この回路により、キャリーアウトの反転値が１のとき、エラーフラグが１になる。図４７（ｂ）に示す表は、ｐ＿ｄとｐ＿ｓの絶対値大小比較エラー判定回路に入力されたｐ＿ｄとｐ＿ｓの絶対値の大小関係と、その場合に出力される各信号の対応表である。ここで｜ｐ＿ｄ｜はｐ＿ｄの絶対値である。ｐ＿ｓについても同様である。
【０２０５】
図４８は、Ｏｒａｃｌｅ−ｎｕｍｂｅｒの長さを求める演算の一例を示す図である。前述の演算の結果として得られたｔｒｉｐｌｅ−ｏｒａｃｅｌｎｕｍ６４形式の数を、１つのＯｒａｃｌｅ−ｎｕｍｂｅｒとしてメモリに書き込む際には、このＯｒａｃｌｅ−ｎｕｍｂｅｒの長さを求める必要がある。Ｏｒａｃｌｅ−ｎｕｍｂｅｒの長さを求めるには、図４８に示されるようにすればよい。但し、ｌｅｎｇｔｈ（ａＸ）は、ｏｒａｃｌｅｎｕｍ６４形式での有効桁数を求める演算とする。ａ２が０であればＯｒａｃｌｅ−ｎｕｍｂｅｒの長さは短くなるし、更にａ１が０であればＯｒａｃｌｅ−ｎｕｍｂｅｒの長さは更に短くなる。
【０２０６】
強い再正規化を施したｔｒｉｐｌｅ−ｏｒａｃｅｌｎｕｍ６４形式において、ａ０、ａ１、ａ２は、１つのＯｒａｃｌｅ−ｎｕｍｂｅｒの仮数部を７バイト、７バイト、６バイトの３つの部分に分割した各部を表現している。従って、基本的には、ａ０、ａ１、ａ２の仮数部を連結するだけで、Ｏｒａｃｌｅ−ｎｕｍｂｅｒ表現が得られる。但し、ａ０、ａ１の長さが短い場合には、後続ゼロを拡張してからメモリに格納する必要がある。
【０２０７】
図４９は、ｅｘｐａｎｄ演算を実現する回路の構成の一例を示す図である。図４９の回路は、入力Ｘレジスタ３９０、内部形式変換回路３９１、後続ゼロ計数回路３９２、桁セレクト演算回路３９３、及び出力Ｚレジスタ３９４を含む。
【０２０８】
内部形式変換回路３９１は、入力Ｘレジスタ３９０の格納値の仮数部を受け取り、内部形式の仮数部を出力する。後続ゼロ計数回路３９２は、内部形式の仮数部を受け取り、受け取った仮数部から後続ゼロの数を求め、後続ゼロの計数結果を基にした桁セレクトデータを出力する。桁セレクト演算回路３９３は、入力Ｘレジスタ３９０から格納値の符号部と仮数部とを受け取り、更に後続ゼロ計数回路３９２から桁セレクトデータを受け取る。符号と桁セレクトデータとに基づいて、桁セレクト演算回路３９３は、受け取った仮数又はｏｒａｃｌｅｎｕｍ６４のゼロ（０ｘ０１または０ｘ６５）の何れかを桁毎に選択して出力する。後続ゼロ計数回路３９２において後続ゼロの部分であると判断された桁においては、ゼロが選択されて出力される。出力されたデータは出力Ｚレジスタ３９４に格納される。
【０２０９】
図５０は、上記の後続ゼロ計数回路の構成の一例を示す図である。図５０（ａ）に示すように、後続ゼロ計数回路は、変換回路４００を含む。変換回路４００は仮数を入力データとして受け取り、図５０（ｂ）に示すテーブルに従い入力データから出力データを生成する。この出力データが後続ゼロ計数値であり、２進数により計数値が表わされる。テーブルでは、一番右側のＸはゼロ以外の値を表し、それ以外のＸはドントケアである。０は計数対象となるゼロを表わす。
【０２１０】
図５１は、桁セレクト演算回路の構成の一例を示す図である。図５１に示す桁セレクト演算回路３９３は、デコーダ４１０及びセレクタ４１１−１乃至４１１−１４を含む。デコーダ４１０は、符号と後続ゼロ計数値とを受け取り、桁毎の選択信号である桁セレクト信号を生成する。デコーダ４１０が生成した桁セレクト信号は、例えば１４桁にそれぞれ対応するセレクタ４１１−１乃至４１１−１４に供給される。後続ゼロ計数値がｎの場合、下位からｎ桁は０ｘ０１又は０ｘ６５側を選択するように桁セレクト信号が生成される。このとき、符号が正を表す１のときは０ｘ０１が選択され、符号が負を表す０のときは０ｘ６５が選択される。下位より数えてｎ＋１桁から上位の桁は、入力の仮数がそのまま選択される。このようにして桁毎に選択された入力仮数、０ｘ０１、又は０ｘ６５が、仮数データとして出力される。
【０２１１】
図５２は、固定精度浮動小数点加減算器の構成の一例を示す図である。図５２に示す固定精度浮動小数点加減算器は、図１４に示す固定精度浮動小数点加減算器に対して、ここまでに説明した種々の演算の機能を纏めて付加することにより得られる回路であり、図１１の演算回路１１９の一部分に相当する。ここで付加される種々の演算は、図２４のｇｅｔ＿ｚ演算、図２９のｇｅｔ＿ｚｚ演算、図３９のｓｃａｌｅ＿ｎｅｘｔ演算、図４３のｇｅｔ＿ｃｏｍｍａ５演算、図４４のｔｒｕｎｃａｔｅ演算、図４６のエラー判定、及び図４９のｅｘｐａｎｄ演算を含む。図５２に示す固定精度浮動小数点加減算器は、値レジスタ４５０、入力Ｘレジスタ４５１、入力Ｙレジスタ４５２、内部形式変換回路４５３及び４５４、後続ゼロ計数回路４５５、指数仮数マスク演算回路４５６、セレクタ４５７及び４５８を含む。図５２に示す固定精度浮動小数点加減算器は、更に、シフタ４５９及び４６０、桁セレクト演算回路４６１、マスク回路４６２、符号指数演算回路４６３、絶対値加算器４６４、正規化回路４６５、セレクタ４６６乃至４６８、正規化回路４６９を含む。図５２に示す固定精度浮動小数点加減算器は、更に、セレクタ４７０及び４７１、丸め回路４７２、外部形式変換回路４７３、セレクタ４７４及び４７５、エラーフラグレジスタ４７６、及び出力Ｚレジスタ４７７を含む。
【０２１２】
図５２に示す固定精度浮動小数点加減算器の各部は、前述の演算回路の対応する各部に相当する。例えば、後続ゼロ計数回路４５５及び桁セレクト演算回路４６１は、図４９のｅｘｐａｎｄ演算の後続ゼロ計数回路３９２及び桁セレクト演算回路３９３に相当する。また例えばマスク回路４６２は、図４４のｔｒｕｎｄａｔｅ演算のマスク回路３４６に相当する。また例えば正規化回路４６５は、図２９のｇｅｔ＿ｚｚ演算の正規化回路２７０に相当する。例えば正規化回路４６９は、図２４のｇｅｔ＿ｚ演算及び図２９のｇｅｔ＿ｚｚ演算の正規化回路２３４に相当する。また例えばセレクタ４６８は、図４３のｇｅｔ＿ｃｏｍｍａ５演算のセレクタ３３７に相当する。また指数仮数マスク演算回路４５６及び符号指数演算回路４６３は、各演算回路の対応する回路部を纏めたものに相当する。これら回路部分の動作については、前述の各演算回路の対応する回路部分の動作と同様である。なお丸め回路４７２を通す必要のない演算もあるが、セレクタの数を削減するために、この構成例では全ての演算結果を丸め回路４７２に通す形態としている。丸め処理の必要がない演算については、丸めモードを強制的にゼロ方向に設定することで、丸め回路４７２を通さなかった場合と同等の結果を得ることができる。
【０２１３】
図５３は、指数仮数マスク演算回路の構成の一例を示す図である。図５３に示す指数仮数マスク演算回路４５６は、比較回路４８０、絶対値加算器４８１、セレクタ４８２乃至４８６、先行ゼロ計数回路４８７及び４８８、加算器４９１及び４９２、及びマスク生成回路４９３を含む。図５３に示す指数仮数マスク演算回路４５６は更に、セレクタ４９４乃至４９６、及び加算器４９７を含む。
【０２１４】
比較回路４８０、絶対値加算器４８１、先行ゼロ計数回路４８７、セレクタ４９４及び４９６、及び加算器４９２は、図１５に示す比較回路１５１、絶対値加算器１５２、先行ゼロ計数回路１５６、セレクタ１５８及び１５７、及び加算器１５５に相当する。但し、絶対値加算器４８１は、指数Ｘ及び指数Ｙに加え、各演算機能に応じた値を受け取り、所定の加減算を実行する。絶対値加算器４８１は、ｇｅｔ＿ｚ演算やｇｅｔ＿ｚｚ演算の場合には、指数Ｘと指数Ｙの差の絶対値を計算する。また例えばｓｃａｌｅ＿ｎｅｘｔ演算の場合であれば、絶対値加算器４８１は、指数Ｙ−指数Ｘ−ｔ（ｏｒａｃｌｅｎｕｍ６４の桁数）の演算結果をシフト量として出力する。また加算器４９１は、図４５のマスク桁演算回路３５０の機能を実現し、指数Ｘ、指数ｃ（ｃｏｍｍａ５の指数）、及び先行ゼロ計数値Ｌｃを受け取り、マスク桁を演算する。マスク生成回路４９３は、図４５のデコーダ３５１及びセレクタ３５２−１乃至３５２−１４に相当し、上記マスク桁に応じてマスクデータを生成する。また加算器４９１は更に、図２４及び図２９の指数仮数演算回路の機能を実現し、（指数Ｘ−仮数Ｘの先行ゼロ計数値）−（指数Ｙ−仮数Ｙの先行ゼロ計数値）の絶対値が１４以上であるか否かを判定する。この絶対値が１４以上である場合、加算器４９１は、バイパス経路を選択するためのバイパスセレクト信号を生成する。
【０２１５】
以上、本発明を実施例に基づいて説明したが、本発明は上記実施例に限定されるものではなく、特許請求の範囲に記載の範囲内で様々な変形が可能である。
【符号の説明】
【０２１６】
１１０プロセッサ
１１１メモリ
１１２２次キャッシュ部
１１３１次キャッシュ部
１１４制御部
１１５演算部
１１６レジスタ
１１７演算制御部
１１８演算器
１１９演算回路

【特許請求の範囲】
【請求項１】
被量子化データの量子化を行なう演算回路において、
Ｎ進法（Ｎは２以上の整数）による任意精度浮動小数点数の仮数部と、前記仮数部に対する指数を表す指数部を含む第１の形式の被量子化データを保持する第１の入力レジスタと、
前記被量子化データに対する量子化目標の指数を表す量子化目標指数を保持する第２の入力レジスタと、
前記量子化目標指数に対する指数補正値を指示する指数補正値指示手段と、
前記量子化目標指数から前記指数補正値を減算した量子化後の指数を表す量子化指数部を算出する指数生成部と、
前記量子化目標指数から前記指数部と前記指数補正値とを減算したシフト量を算出するシフト量生成部と、
前記仮数部を、前記シフト量生成部が算出したシフト量だけシフトした量子化後の仮数を表す量子化仮数部を算出するシフト部と、
前記指数生成部が算出した量子化指数部と、前記シフト部が算出した量子化仮数部を含む量子化データとを保持する第１の出力レジスタを有することを特徴とする演算回路。
【請求項２】
前記演算回路はさらに、
前記第１の入力レジスタに保持された被量子化データを第２の形式による被量子化データに変換する第１の変換部と、
前記第２の入力レジスタに保持された量子化目標指数を第２の形式による量子化目標指数に変換する第２の変換部と、
を有し、
前記指数生成部は、前記第２の形式による量子化目標指数から、前記指数補正値を減算することにより、前記量子化指数を算出し、
前記シフト量生成部は、前記第２の形式による量子化目標指数から、前記第２の形式による被量子化データの指数と前記指数補正値とを減算することにより、前記シフト量を算出することを特徴とする請求項１記載の演算回路。
【請求項３】
前記演算回路において、
前記第２の形式は、２進化１０進法形式であることを特徴とする請求項２記載の演算回路。
【請求項４】
前記演算回路はさらに、
前記第１の出力レジスタに保持された量子化データを、前記第１の形式に変換する第３の変換部を有することを特徴とする請求項１乃至３のいずれか１項に記載の演算回路。
【請求項５】
前記演算回路において、
前記指数補正値は、前記仮数部の桁幅の値であることを特徴とする請求項１〜４のいずれか１項に記載の演算回路。
【請求項６】
前記演算回路はさらに、
前記量子化データの符号を表す符号部と、前記シフト部が算出した量子化仮数部を保持する第３の入力レジスタと、
前記第３の入力レジスタが保持した前記量子化仮数部の最下位ビットから連続する０値を計数する後続ゼロ計数部と、
前記後続ゼロ計数部が計数した０値の数と、前記第３の入力レジスタに保持された符号部に基づいて、前記第３の入力レジスタに保持された量子化仮数について、前記量子化仮数に含まれる仮数部又はゼロを表す所定値のいずれかを所定桁幅毎に選択することにより、ゼロ拡張仮数部を出力する選択部と、
前記量子化データの符号を表す符号部と、前記選択部が出力したゼロ拡張仮数部を保持する第２の出力レジスタを有することを特徴とする請求項１乃至５のいずれか１項に記載の演算回路。
【請求項７】
前記演算回路において、
前記第３の入力レジスタはさらに、前記指数生成部が算出した量子化指数部を保持し、
前記第２の出力レジスタはさらに、前記第３の入力レジスタに保持された量子化指数部を保持することを特徴とする請求項１乃至６のいずれか１項に記載の演算回路。
【請求項８】
量子化を行なう演算回路と、前記演算回路の量子化を制御する量子化演算命令をデコードする命令制御部とを有する演算処理装置において、
前記演算回路は、
Ｎ進法（Ｎは２以上の整数）による任意精度浮動小数点数の仮数部と、前記仮数部に対する指数を表す１つの指数部を含む第１の形式の被量子化データを保持する第１の入力レジスタと、
前記被量子化データに対する量子化目標の指数を表す量子化目標指数を保持する第２の入力レジスタと、
前記量子化目標指数に対する補正値を指示する指数補正値指示手段と、
前記命令制御部による前記量子化演算命令のデコード結果に基づき、前記量子化目標指数から、前記指数補正値を減算した量子化後の指数を表す量子化指数部を算出する指数生成部と、
前記量子化目標指数から、前記指数部と前記指数補正値とを減算したシフト量を算出するシフト量生成部と、
前記命令制御部による前記量子化演算命令のデコード結果に基づき、前記仮数部を、前記シフト量生成部が算出したシフト量だけシフトした量子化後の仮数を表す量子化仮数部を算出するシフト部と、
前記指数生成部が算出した量子化指数部と、前記シフト部が算出した量子化仮数部を含む量子化データとを保持する第１の出力レジスタを有することを特徴とする演算処理装置。
【請求項９】
前記演算処理装置の演算回路はさらに、
前記第１の入力レジスタに保持された被量子化データを第２の形式による被量子化データに変換する第１の変換部と、
前記第２の入力レジスタに保持された量子化目標指数を第２の形式による量子化目標指数に変換する第２の変換部と、
を有し、
前記指数生成部は、前記第２の形式による量子化目標指数から、前記指数補正値を減算することにより、前記量子化指数を算出し、
前記シフト量生成部は、前記第２の形式による量子化目標指数から、前記第２の形式による被量子化データの指数と前記指数補正値とを減算することにより、前記シフト量を算出することを特徴とする請求項８記載の演算処理装置。
【請求項１０】
前記演算処理装置の演算回路において、
前記第２の形式は、２進化１０進法形式であることを特徴とする請求項９記載の演算処理装置。
【請求項１１】
前記演算処理装置の演算回路はさらに、
前記第１の出力レジスタに保持された量子化データを、前記第１の量子化データに変換する第３の変換部を有することを特徴とする請求項８乃至１０のいずれか１項に記載の演算処理装置。
【請求項１２】
前記演算処理装置の演算回路において、
前記指数補正値は、前記仮数部の桁幅の値であることを特徴とする請求項１１記載の演算処理装置。
【請求項１３】
前記演算処理装置の命令制御部はさらに、
前記演算回路の演算結果を、前記演算処理装置に接続された主記憶装置に書く場合の形式に変換するゼロ拡張演算命令をデコードし、
前記演算処理装置の演算回路はさらに、
前記量子化データの符号を表す符号部と、前記シフト部が算出した量子化仮数を保持する第３の入力レジスタと、
前記命令制御部による前記ゼロ拡張演算命令のデコード結果に基づき、前記第３の入力レジスタが保持した前記量子化仮数部の最下位ビットから連続する０値を計数する後続ゼロ計数部と、
前記命令制御部による前記ゼロ拡張演算命令のデコード結果に基づき、前記後続ゼロ計数部が計数した０値の数と、前記第３の入力レジスタに保持された符号部に基づいて、前記第３の入力レジスタに保持された量子化仮数について、前記量子化仮数に含まれる仮数部又はゼロを表す所定値のいずれかを所定桁幅毎に選択することにより、ゼロ拡張仮数部を出力する選択部と、
前記量子化データの符号を表す符号部と、前記選択部が出力したゼロ拡張仮数部を保持する第２の出力レジスタを有することを特徴とする請求項８乃至１２のいずれか１項に記載の演算処理装置。
【請求項１４】
前記演算処理装置の演算回路において、
前記第３の入力レジスタはさらに、前記指数生成部が算出した量子化指数部を保持し、
前記第２の出力レジスタはさらに、前記第３の入力レジスタに保持された量子化指数部を保持することを特徴とする請求項８乃至１３のいずれか１項に記載の演算処理装置。
【請求項１５】
Ｎ進法（Ｎは２以上の整数）による任意精度浮動小数点数の仮数部と、前記仮数部に対する指数を表す１つの指数部を含む第１の形式の被量子化データを保持する第１の入力レジスタと、前記被量子化データに対する量子化目標の指数を表す量子化目標指数を保持する第２の入力レジスタと、前記量子化目標指数に対する補正値を表す指数補正値を保持する指数補正値レジスタとを有するとともに、量子化を行なう演算回路の制御方法において、
前記演算回路が有する指数生成部が、前記量子化目標指数から前記指数補正値を減算した量子化後の指数を表す量子化指数部を算出し、
前記演算回路が有するシフト量生成部が、前記量子化目標指数から、前記指数部と前記指数補正値とを減算したシフト量を算出し、
前記演算回路が有するシフト部が、前記仮数部を、前記シフト量生成部が算出したシフト量だけシフトした量子化後の仮数を表す量子化仮数部を算出することを特徴とする演算回路の制御方法。
【請求項１６】
前記演算回路はさらに、
前記量子化データの符号を表す符号部と、前記シフト部が算出した量子化仮数を保持する第３の入力レジスタを有し、
前記演算回路の制御方法はさらに、
前記演算回路が有する後続ゼロ計数部が、前記第３の入力レジスタが保持した前記量子化仮数部の最下位ビットから連続する０値を計数し、
前記演算回路が有する選択部が、前記後続ゼロ計数部が計数した０値の数と、前記第３の入力レジスタに保持された符号部に基づいて、前記第３の入力レジスタに保持された量子化仮数について、前記量子化仮数に含まれる仮数部又はゼロを表す所定値のいずれかを所定桁幅毎に選択することにより、ゼロ拡張仮数部を出力することを特徴とする請求項１５記載の演算回路の制御方法。

【図１】