説明

Nベースタイプの演算式の最適化

【課題】意味論的に同等な数学的表現をより少ない計算スタック空間を使用して実行することができるように、プログラム表現を変える。
【解決手段】演算式最適化の方法は、第1のベースを有する第1のプロセッサのために形成された、演算子と少なくとも1つのオペランドとを含む第1の命令(80)を受け取る段階、全てのオペランドが潜在的な桁あふれ(82)を伴っていないか、又は、演算子が桁あふれに対して敏感でない場合、第1のベースよりも小さい第2のベースを有する第2のプロセッサのために最適化された第2の命令(88)に第1の命令(80)を変換する段階、及び、少なくとも1つのオペランドが桁あふれの可能性になっており、かつ、演算子が桁あふれに対して敏感な場合、桁あふれの源である第3の命令(86)をより広いベースに変換する段階を含む。

【発明の詳細な説明】
【技術分野】
【0001】
関連出願への相互参照
本出願は、以下の特許に関連する:
スッサー及びシュウェーブによる「リソース限定型装置のためのオブジェクト志向命令セット」という名称の1999年2月2日出願の米国特許出願、及び
レビ及びシュウェーブによる「確実に配分されたバイトコード照合を有する仮想計算機」という名称の1997年4月15日出願の米国特許出願。
本発明は、コンピュータシステムに関する。より具体的には、本発明は、nベースタイプの演算式の最適化に関する。
【背景技術】
【0002】
コンピュータプログラムの準備が図1に示されている。ユーザは、プログラムを高級プログラム言語10で書く。高級プログラム言語10で書かれたプログラムは、目標とする計算機によって実行することができる低級機械言語12にコンパイルされる。例えば、高級Java(登録商標)プログラム言語で書かれたプログラムは、低級バイトコード命令にコンパイルされる。バイトコード命令とは、「Java(登録商標)仮想計算機」のための機械言語である。「Java(登録商標)機械言語仕様」は、アジソン・ウェスレーから1999年に出版のリンドホルム他著「Java(登録商標)機械言語仕様」第2版に説明されている。
【0003】
一般的な高級プログラム言語は、演算式をサポートする。演算式は、1つ又はそれ以上のオペランドに作用する算術演算子によって形成される。一般的にサポートされる演算子は、加算、引き算、乗算、割り算、剰余、ネゲート、桁送り、ビット式論理和、ビット式論理積、及び、ビット式排他的論理和を含む。中間的な値は、1つ又はそれ以上の算術演算の結果である。高級言語はまた、一般的に多重又はnベースの整数タイプをサポートし、算術演算がオーバ・ロードされる。オーバ・ロードは、演算子が混合タイプを有するオペランドを受け入れることを可能にする。例えば、Java(登録商標)プログラム言語は、4つのベースの整数タイプ、すなわち、byte、short、int、及び、longをサポートする。これらのタイプは、各々、8、16、32、及び、64ビット値をサポートする。「+」演算子のような演算子は、これらの整数タイプのいずれのオペランドも受け入れるであろう。以下の3つの例は、混合ベースタイプを有するオペランドの演算のための「+」演算子のオーバ・ロードを示している。
int a、b;
a+b;
short a、b;
a+b;
byte a、b;
a+b;
【0004】
このオーバ・ロードは、一般的に、値をより広いベースタイプに広げ、次に、算術演算を実行することによって行われる。例えば、「C」及びJava(登録商標)コンパイラは、通常、タイプbyte及びshortの値をタイプintに広げる。Java(登録商標)言語において、タイプintは、いつも32ビットである。すなわち、タイプshortの16ビット値とタイプbyteの8ビット値とは、算術演算を実行する前に、32ビットのタイプintまで広げられる。Java(登録商標)言語においては、上記で列挙した3つの例の各々に対して、以下のバイトコードが発生される。
iload a
iload b
iadd
【0005】
iload命令は、8、16、又は、32ビット変数のいずれかをロードし、そのスタック上に32ビットオペランドを置く。iadd命令は、スタックから2つの32ビットオペランドを取り出し、それらを加え合わせ、32ビットの結果をスタック上に戻して置く。
Java(登録商標)と違って、いくつかの高級言語は、整数タイプ間の関係のみを規定し、各タイプのサイズは規定しない。例えば、「C」コンパイラの販売業者の1つは、byte、short、及び、intのタイプのビットサイズを、各々、8、16、及び、32ビットであると規定してもよい。しかし、別の「C」コンパイラの販売業者は、同じタイプのサイズを、各々、16、32、及び、64ビットであると規定するであろう。更に別のコンパイラは、そのビットサイズを、各々、16、32、及び、32ビットであると規定してもよい。全ての場合において、各タイプのサイズ間の関係は維持されるが(タイプbyteで表される値の数<タイプshortで表される値の数、タイプshortで表される値の数<タイプintで表される値の数)、各タイプを表すのに使用される実際のビット数は異なってもよい。しかし、Java(登録商標)のように、「C」は、特定の各コンパイラによって規定されるintタイプのサイズで算術演算を実行する。これには、より小さいベースタイプを有する値をタイプintまで広げることが必要である。
【0006】
このタイプ拡大手法は、機械命令の数を減らし、従って、目標とする計算機の複雑さを低減する。しかし、このタイプ拡大は、一般的により大きな計算スタック空間を必要とする。例えば、タイプshortの2つの16ビット値をそれらが32ビットタイプに拡大された後で加え合わせることは、図2A及び図2Bに示す通り、タイプintの2つの32ビット値を加え合わせるスタック空間と同じ量を使用する。
【0007】
ここで図2Aを参照すると、Java(登録商標)言語のタイプshortの2つの16ビット値を加え合わせる時のスタック使用法を示す流れ図が示されている。参照番号20において、第1の16ビットオペランドがロードされ、オペランドスタック上に押し付けられる。この時点のオペランドスタックは、参照番号30で示されている。参照番号22において、第1の16ビットオペランドは、32ビットに拡大される。参照番号24において、第2の16ビットオペランドがロードされ、オペランドスタック上に押し付けられる。参照番号26において、第2の16ビットオペランドが32ビットに拡大される。この時点で、オペランドスタックは、4x16=64ビットを占有する。参照番号28において、この2つの32ビットオペランドは、32ビットadd演算子を使用して加え合わされる。
【0008】
ここで図3Aを参照すると、タイプintの2つの32ビット値を加え合わせる時のスタック使用法を示す流れ図が表されている。参照番号40において、第1の32ビットオペランドがロードされ、オペランドスタック上に押し付けられる。このオペランドスタックは、図3Bで示されている。参照番号42において、第2の32ビットオペランドがロードされ、オペランドスタック上に押し付けられる。参照番号44において、この2つの32ビットオペランドは、32ビットadd演算子を使用して加え合わされる。すなわち、上述の16ビット加算及び32ビット加算例の両方において、2つの32ビットオペランドは、スタックから取り出されて32ビットの加算演算を使用して加え合わされる前に、スタック上に押し付けられる。
【0009】
プログラム実行が進行する間、スタックの大きさは、入れ子プロシージャの呼び出しのレベル、計算された式の複雑さ、及び、局所的に表された変数の数などの要素のためにサイズが変動する場合がある。スマートカードなどのリソース限定型装置においては、一般的に、タイプ拡大が行われるような計算を実行するのに利用できるメモリが不十分である。
リソース限定型装置は、一般的なデスクトップコンピュータなどと比べた場合、一般的に、メモリ、及び/又は、計算能力又は速度が比較的制限されているものであると考えられている。一例として、他のリソース限定型装置には、セルラー電話機、境界用走査装置、野外用プログラム可能装置、携帯情報端末(PDA)、及び、ポケットベルや他の小型又は小さな衛星電波使用装置が含まれる。
【0010】
賢い携帯用データ携行カードとしても知られるスマートカードは、一般的に、プラスチック又は金属から作られ、プログラムを実行するための内蔵マイクロプロセッサ又はマイクロコントローラとプログラム及びデータを記憶するメモリとを含む電子集積回路を有する。ほぼクレジットカードのサイズが可能なその様な装置は、8ビット又は16ビットのアーキテクチャを備えたコンピュータ集積回路を有する。更に、これらの装置は、一般的に制限された記憶容量を有する。例えば、スマートカードのいくつかは、1キロバイト(1K)未満のランダムアクセスメモリ(RAM)のほか、限られたロム(ROM)、及び/又は、電気的消去可能ロム(EEPROM)のような不揮発性メモリを有する。
【0011】
更に、8ビット又は16ビットアーキテクチャを有するスマートカードは、一般的に、内蔵8ビット又は16ビット算術演算を各々有する。従って、スマートカードは、通常、32ビット演算よりも効率的に8ビット又は16ビット演算を実行することができる。32ビットに拡大されたデータに対して32ビット演算を実行することは、特に非効率的である。すなわち、スマートカードなどのリソース限定型装置の限られたアーキテクチャ及びメモリは、値がより大きな整数タイプに拡大されたプログラムを実行することを非実用的又は不可能にする。
【0012】
「Java(登録商標)機械言語」命令セットは、byte、short、及び、intの整数タイプの値を処理するための算術命令セットを形成する。タイプbyte及びshortの変数は、編集中に整数タイプintまで拡大される。反対に、「Java Card(登録商標)(Java(登録商標)プログラム言語をサポートするスマートカード)仮想計算機」は、整数タイプintの変数を処理する命令セットに加えて、タイプbyte及びshortの変数を処理する別の命令セットを形成する。ほとんどの「Java Card(登録商標)」アプリケーションは、タイプshort又はbyteのデータ値に対して演算する。
【発明の概要】
【発明が解決しようとする課題】
【0013】
コンピュータ産業においては、同じプログラムをリソース限定型装置で実行することができ、従って縦のプラットフォームに亘る相互運用性が達成されるように、比較的メモリが豊富なデスクトップコンピュータ上で実行するように意図された高級コンピュータ言語をサポートする傾向が増加している。この縦のプラットフォームに亘る相互運用性には、高級プログラム言語で書かれたプログラムがリソース限定型装置で実行された時、それらが仮に比較的メモリが豊富な装置で実行された場合にもたらすであろう同じ結果を示すことが必要である。例えば、Java(登録商標)プログラム言語で書かれたプログラムの実行を、スマートカードプラットフォーム、手持式装置、消費者電気器具、デスクトップコンピュータ、及び、スーパーコンピュータを含む、様々なプラットフォーム上でサポートすることが必要である。
従って、意味論的に同等な数学的表現をより少ない計算スタック空間を使用して実行することができるように、プログラム表現を変える必要性が存在する。更に、実行速度が増加するようにそのような変形を行う必要性が従来技術において存在する。
【課題を解決するための手段】
【0014】
演算式最適化の方法は、第1のベースを有する第1のプロセッサのために形成された、演算子と少なくとも1つのオペランドとを含む第1の命令を受け取る段階、全てのオペランドが潜在的な桁あふれを伴っていないか、又は、演算子が桁あふれに対して敏感でない場合、第1のベースよりも小さい第2のベースを有する第2のプロセッサのために最適化された第2の命令に第1の命令を変換する段階、及び、少なくとも1つのオペランドが桁あふれの可能性になっており、かつ、演算子が桁あふれに対して敏感な場合、桁あふれの源である第3の命令をより広いベースに変換する段階を含む。演算式最適化の装置は、プログラム命令を有する少なくとも1つのメモリ、及び、第1のベースを有する第1のプロセッサに対して形成された第1の命令を受信し、少なくとも1つのオペランドのいずれもが潜在的な桁あふれを伴っていないか、又は、演算子が桁あふれに敏感でない場合には、その第1の命令を第1のベースよりも小さい第2のベースを有する第2のプロセッサに対して最適化された第2の命令に変換し、少なくとも1つのオペランドが桁あふれの可能性になっており、かつ、演算子が桁あふれに対して敏感な場合には、桁あふれの源である第3の命令をより広いベースに変換するために、プログラム命令を使用するように形成された少なくとも1つのプロセッサを含む。
【図面の簡単な説明】
【0015】
【図1】高級言語で書かれたプログラムをコンパイルする方法を示すブロック図である。
【図2】32ビットに拡大された2つの16ビットオペランドを加え合わせるためのスタックの使用法を示す流れ図である。
【図3】2つの32ビットオペランドを加え合わせるためのスタックの使用法を示す流れ図である。
【図4A】本発明の一実施形態に従って、リソース限定型計算機上での実行のために演算式を変換する方法を示すブロック図である。
【図4B】本発明の一実施形態に従って、Java(登録商標)の部類に属するファイルを変換する段階を示すブロック図である。
【図5A】デスクトップコンピュータ上での2つのタイプshortの値の加算を説明するコード見本を示す図である。
【図5B】リソース限定型コンピュータ上での2つのタイプshortの値の加算を説明するコード見本を示す図である。
【図6A】2つのタイプshortの値の加算、及び、その結果を直ちにデスクトップコンピュータ上で型に入れることを説明するコード見本を示す図である。
【図6B】リソース限定型コンピュータ上に桁あふれを持ち込む可能性のある、演算の結果の直ぐの型入れを説明するコード見本を示す図である。
【図7A】3つのタイプshortの値の加算、及び、その結果を直ちにデスクトップコンピュータ上で型に入れることを説明するコード見本を示す図である。
【図7B】リソース限定型コンピュータ上に桁あふれをもたらす可能性がある演算によるオペランド上の桁あふれによって影響されない演算の実行を説明するコード見本を示す図である。
【図8A】2つのタイプshortの値の加算、及び、その結果をデスクトップコンピュータ上のタイプshortの値で割り算することを説明するコード見本を示す図である。
【図8B】リソース限定型コンピュータ上に桁あふれをもたらす可能性がある演算によって作り出されたオペランド上の桁あふれによって影響された演算の実行を説明するコード見本を示す図である。
【図9】本発明の一実施形態によるnベースタイプの演算式最適化の方法を示す流れ図である。
【図10】本発明の一実施形態によるnベースタイプの演算式最適化の方法を示す詳細な流れ図である。
【図11】本発明の一実施形態による命令を変換する段階を示す流れ図である。
【図12A】本発明の一実施形態によるターゲット命令を変換する方法を示す流れ図である。
【図12B】本発明の一実施形態による初期値命令を変換する方法を示す流れ図である。
【図13】本発明の一実施形態によるタイプ変換命令を変換する方法を示す流れ図である。
【図14】本発明の一実施形態によるスタック操作命令を変換する方法を示す流れ図である。
【図15】本発明の一実施形態による演算式を変換する方法を示す流れ図である。
【図16】本発明の一実施形態による最適化された命令のタイプを判断する方法を示す流れ図である。
【図17】本発明の一実施形態による、結果のタイプ及び結果の桁あふれを判断する方法を示す流れ図である。
【図18】本発明の一実施形態によるロールバックポイントを記録する方法を示す流れ図である。
【図19】本発明の一実施形態による変換処理をロールバックする方法を示す流れ図である。
【図20】本発明の一実施形態による命令最適化の結果を伝達する段階を示す流れ図である。
【図21】本発明の一実施形態による異なる制御経路からの変換情報を結合する段階を示す流れ図である。
【図22A】本発明の一実施形態による命令変換を示すブロック図である。
【図22B】本発明の一実施形態による命令変換を示すブロック図である。
【発明を実施するための形態】
【0016】
当業者は、本発明の以下の記述が単に例示的であることを理解するであろうし、本発明の開示の恩恵を受けるような当業者に対しては、本発明の他の実施形態が容易に示唆されるであろう。
本発明は、コンピュータシステムに関する。より具体的には、本発明は、nベースタイプの演算式の最適化に関する。本発明は、更に、(1)本発明のレイアウトパラメータ、及び/又は、(2)コンピュータ上で演算を実行する際に本発明を使用するためのプログラム命令、を記憶した機械読取可能媒体に関する。そのような媒体には、例として挙げると、磁気テープ、磁気ディスク、CD・ROMのような光学的読取可能媒体、及び、PCMCIAカードのような半導体メモリが含まれる。この媒体はまた、小さなディスク、ディスケット、又は、カセットのような携帯用品目の形態を取ってもよい。この媒体はまた、ハードディスクドライブやコンピュータRAMのようなより大きな又は固定式品目の形態を取ってもよい。
【0017】
リソース限定型装置は、通常のデスクトップコンピュータなどと比べた場合、一般的に、メモリ、及び/又は、計算能力又は速度が比較的制限されているものであると考えられている。以下で検討する特定の実施例はスマートカードに関して説明されるが、本発明は、他のリソース限定型装置と共に使用することができ、それらには、以下に限定されないが、セルラー電話機、境界用走査装置、野外用プログラム可能装置、携帯情報端末(PDA)、及び、ポケットベルのほか、他の小型又は小さな衛星電波使用装置が含まれる。本発明はまた、非リソース限定型装置上でも使用することができる。
本発明を開示する目的上、「プロセッサ」という用語は、物理的なコンピュータ又は仮想計算機を意味するように用いられる場合がある。
【0018】
ここで図4Aを参照すると、本発明の一実施形態に従ってリソース限定型計算機上で実行するための演算式を変換する段階を説明するブロック図が示されている。コンパイラは、高級言語62で書かれた演算式60を取り、そのオペランドをより大きな整数タイプに拡大し、一般的なデスクトップ計算機66上で実行するためのより大きなベースタイプの命令64を作り出す。このより大きなベースタイプ命令64は、リソース限定型計算機70上で実行するための意味論的に同等なより小さなベースタイプ命令68に最適化される。例えば、shortタイプの加算命令は、shortタイプのオペランドに対して演算するのに使用され、その結果は、タイプshortである。
【0019】
本発明の別の実施形態によると、意味論的に同等なより小さなベースタイプ命令への最適化は、ジャスト・イン・タイム・コード発生装置の一部である。命令セットが初めて実行される少し前に、最適化されていない命令は、リソース限定型計算機上で実行するための意味論的に同等なより小さなベースタイプ命令に最適化される。同じ命令セットのその後の実行は、その最適化された命令セットを使用する。
本発明の別の実施形態によると、算術命令の意味を保存するためにより大きなタイプ命令64が必要であり、かつ、より大きなタイプ命令が目標とするプロセッサによってサポートされていない場合、その演算式は、サポートされていないとして拒絶される。
【0020】
ここで図4Bを参照すると、本発明の一実施形態による命令を変換する段階を説明するブロック図が示されている。32ビットオペランドを有する命令を含むJava(登録商標)の部類のファイル72は、「Java Card(登録商標)」の部類のファイル変換器74によって受け取られる。この変換器74は、リソース限定型装置上で実行するために最適化された命令76を発生する。この最適化は、例として挙げると、より少ないスタック使用量、より小さなプログラムサイズ、及び、より高速の実行を準備する段階を含む。
【0021】
目標とする計算機は、nタイプの算術演算をサポートするであろう。「Java(登録商標)仮想計算機」は、タイプint演算子をサポートするが、「Java Card(登録商標)仮想計算機」は、タイプshort演算子をサポートし、オプションでタイプint演算子をサポートする。他の装置は、byteタイプの算術演算子のみ、又は、byte、short、及び、intタイプの演算の全てをサポートしてもよい。一般的に、8ビット又は16ビットプロセッサ上で16ビットの算術を実行するために比較的少ない時間を要し、同じプロセッサ上で32ビットの算術を実行するためには、比較的多くの時間が必要である。
【0022】
算術演算に使用される実際の値は最適化時には未知であるから、最適化は、各オペランドに対して最悪の場合の値を仮定する必要がある。オペランドに対する最悪の場合の値は、入力オペランドタイプに基づいて判断される。小さいタイプの演算は、大きいタイプの表示又はより大きなタイプへの桁あふれを必要とする結果を有する可能性がある。すなわち、本発明によると、算術演算子は、桁あふれによって影響される演算子と桁あふれを引き起こす可能性を有する演算子とに分類される。本発明を開示する目的上、桁あふれは、負の値の下位桁あふれを含む。小さいタイプの演算の結果は、その結果を作り出すのに用いられた演算子が大きいタイプの表示への桁あふれを引き起こす可能性を有する演算子のグループに属する場合、潜在的桁あふれを伴うと言われる。中間的な値は、その中間的な値が桁あふれに影響される演算子のグループに属する演算子のためのオペランドとして使用されない限り、潜在的桁あふれを伴うことを許される。
【0023】
桁あふれを引き起こす可能性を有する演算子は、加算、引き算、乗算、割り算、ネゲート、及び、左側桁送りを含む。これらの演算子に対するJava(登録商標)バイトコードは、表1に示されている。
【0024】
(表1)潜在的桁あふれを伴う演算

【0025】
桁あふれに影響される演算子は、表2に示されている。桁あふれに影響される算術演算子は、割り算、剰余、ネゲート、右側桁送り、及び、符号なしの右側桁送りを含む。また、桁あふれに影響される非算術演算子は、アレー演算、スイッチ演算、及び、比較演算を含む。
【0026】
(表2)桁あふれに影響される演算

【0027】
表1の演算をより小さなタイプに最適化する時、結果は、より大きなタイプの中に桁あふれする場合がある。表2の演算子のうちの1つを用いる表現の結果は、表現中のオペランドのうちの1つが中間的な値であり、潜在的な桁あふれデータを含む場合、精度を失うであろう。最適化を可能にし、高級ソースコードの意味を保存するために、潜在的桁あふれは、結果が表2の演算のうちの1つに入力される場合、その結果のタイプに対する明白なソースレベルの型を用いて是正する必要がある。
【0028】
表2の演算のいずれかに対する入力オペランドが表1の演算の結果であり、明白な高級ソースコードの型がない場合、最適化は起こることができない。そのような誤った最適化は、意味論的に同等な結果を保証しないであろう。換言すれば、リソース限定型装置上で実行するために発生された最適化コードは、結果をデスクトップコンピュータ用に発生された最適化なしのコードとは異なるようにすることができるであろう。例えば、桁あふれデータは、オペランドのJava(登録商標)32ビット表示で与えることができるが、「Java Card(登録商標)」16ビット表示ではできないであろう。
【0029】
表1に列挙された演算子を用いる演算の結果は、より小さなタイプを有する演算子が適用された場合、桁あふれを生じる場合がある。デスクトップコンピュータ・プラットフォームを目標とする命令をリソース限定型コンピュータ・プラットフォームを目標とする命令に最適化する段階に付随するこれらの問題の例は、図5A〜図8Bに与えられている。これらの例は、デスクトップコンピュータが32ビットアーキテクチャに基づいており、比較的メモリが豊富であることを仮定している。リソース限定型コンピュータは、比較的少ないメモリを有する16ビットアーキテクチャに基づくと仮定されている。当業者は、本発明が様々なアーキテクチャを有する演算プラットフォームに適用されることを認めるであろう。
図5A〜図8Bはまた、符号を有する値を使用する。当業者はまた、値の符号の有無に関わらず桁あふれが起こり得ることを認めるであろう。
【0030】
ここで図5Aを参照すると、デスクトップコンピュータ上での2つのタイプshortの値の加算を説明するコード見本が示されている。値「a」は、16ビットの符号付きshortタイプで表すことができる最大値を含む。上記の通り、たとえ値が16ビットshortの値であっても、intタイプの加算が用いられる。すなわち、16ビット範囲から32ビット範囲への桁あふれが結果の値の中に存在し、桁あふれの効果は、より大きな正の32ビット数を作り出すことである。
【0031】
ここで図5Bを参照すると、リソース限定型コンピュータ上で図5Aにおけるのと同じ値を加算する段階を説明するコード見本が示されている。実行は、リソース限定型コンピュータ上で行われており、両方の値が16ビットshortタイプであるから、命令はshortタイプの加算を用いて最適化され、従ってより少ないスタック空間を使用する。しかし、32ビット加算の代わりに16ビット加算が用いられるために、加算は符号ビットに桁あふれを引き起こす。デスクトップコンピュータは、32、768という値を計算したのに対し、リソース限定型コンピュータの例で計算された結果は、−32、768という負の数である。この結果は、それがデスクトップコンピュータの結果と異なり、多様なコンピュータ・プラットフォームに亘る相互運用性を妨げる理由から、受け入れられないものである。
【0032】
ここで図6Aを参照すると、2つのタイプshortの値の加算とその結果を直ちに型に入れる段階とを説明するコード見本が示されている。この例は、加算結果がタイプshortに型入れされる点を除いて、図5Aのものと同じである。タイプをshortに型入れする段階は、最も有意な16ビットをshort値に切り落とし、符号が32ビット値に広がる。潜在的に桁あふれを伴う演算(add演算)の結果は、タイプshortに型入れされ、それによっていかなる潜在的桁あふれの問題も排除する。図6Bは、リソース限定型コンピュータ上で16ビット値として表された、図6Aにおけるのと同じ値を加算する段階を示す。デスクトップコンピュータ及びリソース限定型コンピュータの両方に対する結果の値は同じである。
【0033】
ここで図7Aを参照すると、デスクトップコンピュータ上での3つのタイプshortの値の加算を説明するコード見本が示されている。この例においては、intタイプの加算が、16ビットshort値「a」及び「b」を加え、その結果を「c」に加えるために用いられている。最終結果は、shortタイプに型入れされる。
ここで図7Bを参照すると、リソース限定型コンピュータ上に潜在的に桁あふれを伴う演算によって引き起こされたオペランドの桁あふれに影響されない演算を実行する段階を説明するコード見本が示されている。この例の全ての値は16ビットのshortタイプであるから、全ての中間的な加算に対してshortタイプの加算が用いられる。表1に示す通り、加算演算子は、潜在的に桁あふれを引き起こすが、桁あふれに影響されない。すなわち、「a」と「b」を加えることは、潜在的に桁あふれを伴う値を作り出す。この値が「c」に加えられ、潜在的に桁あふれを伴う別の値を作り出す。第2のadd演算は、潜在的に桁あふれ(a+bの結果)を伴う1つのオペランドを含むが、add演算は、桁あふれを伴うオペランドに影響されない。最終結果は、タイプshortに型入れされ、加算演算から潜在的な桁あふれを取り除く。すなわち、デスクトップコンピュータ及びリソース限定型コンピュータの両方に対する結果の値は同じである。
【0034】
ここで図8Aを参照すると、デスクトップコンピュータ上での2つのタイプshortの値の加算とその結果をタイプshortの値で割り算する段階とを説明するコード見本が示されている。実行はデスクトップコンピュータ上で行われているので、intタイプの演算が用いられる。「a」及び「b」の値がintタイプのaddを用いて互いに加えられ、この中間的な値は、「c]で割り算される。
ここで図8Bを参照すると、リソース限定型コンピュータ上で潜在的に桁あふれを伴う演算によって引き起こされたオペランドの桁あふれに影響される演算を実行する段階を説明するコード見本が示されている。実行はリソース限定型コンピュータ上で行われているので、shortタイプの演算が用いられる。「a」及び「b」の値は、shortタイプのaddを用いて互いに加えられる。この加算は、16ビット範囲から桁あふれする中間的な値を作り出す。この中間的な値は、「c」で割り算される。図7Bで用いられた加算演算子と異なり、割り算演算子は、表2に示す通り桁あふれに影響される。高いビットに値が入っているので、この16ビット値は、負であると見なされる。すなわち、デスクトップコンピュータ及びリソース限定型コンピュータの例は、図6A〜図7Bにおけるようなプログラムで表されたタイプ変換で訂正されていない、異なる結果をもたらす。
【0035】
本発明によると、演算式は、オペランドのタイプに応じて最適であるタイプの命令を用いて最適化される。最適化処理は、潜在的桁あふれの問題に遭遇するまで進行される。その時点で、演算式の入力オペランドに立ち戻り、それを次のより大きなタイプ命令に変換する。この処理は、演算式が最適化された命令セットを用いてデスクトップコンピュータとリソース限定型装置とで同じ結果を示すような、命令の適切なタイプが選択されるまで繰り返される。
【0036】
変換処理の間は、いくつかの関係が維持される。これらの関係は、命令と、その命令を目標とする計算機上で実行する時に生じることになる値とに関する。関係データには、値に対する実際のタイプ及びターゲットタイプが含まれる。関係データはまた、命令が目標とする計算機上で一旦実行されると目標とする計算機上で値を生み出すことになるソース命令を含む。各命令はまた、そのオペランド関係データにリンクされる。更に、結果に関する関係データは、その結果を消費する命令にリンクされる。各関係データはまた、命令が目標とする計算機上で実行された場合に潜在的桁あふれを生じることになる命令(もしあれば)にリンクされる。この命令は、ロールバックポイントと呼ばれる。潜在的桁あふれを伴う値が桁あふれに敏感な演算子によって消費された場合、誤った最終結果が生み出されることがあるので、生み出されることになる値の各々を桁あふれを引き起こした命令とリンクさせることは、変換処理を先に進めることができない時に桁あふれ問題を引き起こした命令にロールバックする方法を与える。
【0037】
中間的な値は、後続の命令においてオペランドとして更に消費することができる。中間的な値が潜在的に桁あふれを伴う場合、ロールバック命令もまた、結果内を伝達される。これは、表現を変換する過程で繰り返される。このロールバック作用は、常に中間的な値(又は、オペランド)に作用し、再変換が必要とされる命令までロールバックする。ロールバック命令を判断する方法及び最適化の他の詳細は、以下で検討される。
【0038】
ここで図9を参照すると、本発明の一実施形態によるnベースタイプの演算式最適化を説明する流れ図が示されている。参照番号80で、変換される命令が受け取られる。参照番号82で、入力オペランドのいずれかが潜在的桁あふれを伴うか否かに関して判断が為される。少なくとも1つのオペランドが潜在的桁あふれを伴う場合、変換される命令が桁あふれに敏感であるか否かに関する判断が参照番号84で為される。これらに関するJava(登録商標)バイトコードが表2に列挙されている。当業者は、桁あふれに影響される演算子のリストが異なる高級言語に関して変動し得ること、及び、本発明がこれらの他の言語にも同様に適用し得ることを認めるであろう。
【0039】
変換される命令が桁あふれに敏感である場合、変換処理は、参照番号86において問題の源である命令にロールバックされ、その命令は、より広いベースを有するタイプを用いて変換される。例えば、8ビットのバイトタイプは、16ビットのワードタイプに拡大され、16ビットのワードタイプは、32ビットのワードタイプに拡大されるであろう。オペランドをより大きなタイプに拡大することにより、オペランドのその後の命令変換がより大きなタイプに結合された命令を使用することが必要になる。
【0040】
変換される命令が桁あふれに敏感でない場合、又は、どの入力オペランドも潜在的桁あふれを伴わない場合、その命令は、参照番号88で、リソース限定型装置上での実行に対して最も最適なタイプに変換される。参照番号90で、変換される命令がまだ残っているか否かに関する判断が為される。更なる命令が残っている場合、参照番号80で次の命令の変換が始まる。最後の命令が変換されると、参照番号92で変換処理が終了する。
【0041】
ここで図10を参照すると、本発明の一実施形態によるnベースタイプの演算式最適化を説明する詳細な流れ図が示されている。参照番号100で、変換が完了していないという指示が作られる。参照番号102で、第1の命令の変換を実行すべきであるという指示が作られる。参照番号104で、命令変換が完了したか否かが判断される。命令変換が完了した場合、実行は参照番号106で終了する。変換が完了していない場合、変換が完了したという指示が参照番号108で作られる。参照番号110で、第1の命令が得られる。参照番号112で、その命令が変換されるべきか否かの判断が為される。
【0042】
命令を変換する必要がある場合、変換が未完了であるという指示、及び、現在の命令を再度変換すべきではないという指示が、参照番号114及び116で各々作られる。参照番号118で、命令は、より小さなベースタイプを有する、目標とする計算機のために最適化された別の命令に変換される。参照番号120で、ロールバックが参照番号118における変換によってトリガされたか否かに関する判断が為される。ロールバックがトリガされていた場合、ロールバックポイントでの命令が参照番号122で得られ、ロールバックポイントでの命令の変換が参照番号104で再度開始される。ロールバックがトリガされない場合、結果のタイプ及びターゲットタイプが参照番号124で照合される。参照番号126で、変換情報は、各制御経路の後続命令に伝達される。
参照番号128で、更なる命令が残っているか否かに関する判断が為される。更なる命令が残っている場合、次の命令が参照番号130で取得され、参照番号112で実行が継続される。変換処理は、最後の命令が変換されると終了する。
【0043】
ここで図11を参照すると、本発明の一実施形態による命令を変換する段階を説明する流れ図が示されている。参照番号140で、現在の命令が算術命令か否かが判断される。命令が算術命令である場合、それは、参照番号142で変換される。同様に、スタック操作命令、ターゲット命令、タイプ変換命令、及び、初期値変換命令は、参照番号146、150、154、及び、158で各々変換される。命令が図11の算術命令、スタック操作命令、タイプ変換命令、又は、初期値命令か否かによる命令の分類は、単に例示的な目的で示されている。当業者は、本発明が他の多くの命令の種類又は分類に対しても同様に適用し得ることを認めるであろう。
【0044】
ここで図12Aを参照すると、本発明の一実施形態によるターゲット命令を変換する方法を説明する流れ図が示されている。「Java(登録商標)仮想計算機」命令セットにおいては、ターゲット命令は、分岐、スイッチ、アレーアクセス、アレー作成、及び、様々な記憶/保管命令(store/put命令)を含むほか、スタック操作命令、タイプ変換命令、初期値命令、又は、演算式ではない、コンピュータ言語におけるタイプに敏感な他のいかなる非算術命令をも含む。
【0045】
参照番号160で、命令オペランドに対するターゲットタイプが判断される。参照番号162で、ターゲット命令が消費するオペランドがそのターゲット命令のターゲットタイプよりも小さいタイプを有するか否かに関する判断が為される。そのオペランドが目標とするものよりも小さなタイプを有する場合、変換処理は、参照番号164で、その小さなタイプのオペランドを用いてロールバックされる。オペランドが目標とするものよりも小さなタイプを持たない場合、そのオペランドが潜在的桁あふれを伴うか否かに関する判断が参照番号166で為される。オペランドは、それが表1に記載されたオペランドのうちの1つで作り出されたか、又は、オペランド内で桁あふれを伝達する演算子によって作り出された場合、潜在的桁あふれを伴うことがある。桁あふれを伝達する演算子には、例として挙げると、「and」、「or」、及び、排他的「or」(xor)演算子が含まれる。どのオペランドも潜在的桁あふれを伴わない場合、命令は、参照番号167で最適化される。オペランドの少なくとも1つが潜在的に桁あふれを伴っている場合、変換処理は、参照番号164で、より小さなオペランドを用いてロールバックされる。
【0046】
ここで図12Bを参照すると、本発明の一実施形態による初期値命令を変換する方法を説明する流れ図が示されている。初期値命令の例には、獲得/ロード命令(get/load命令)、及び、変数をロードする他の命令が含まれる。初期値命令はまた、方法の結果を戻す、方法呼出し命令を含む。更に、初期値命令は、ロード定数命令を含む。これらの命令は、命令が生み出す値が中間的な計算の結果ではないことから、「初期値」命令と呼ばれる。参照番号168で、変数、戻り値、又は、定数のタイプが受け取られる。参照番号169で、初期値命令は、変数又は定数のタイプに従って最適化される。例えば、shortタイプのローカル変数をロードするために、iload命令はsloadに最適化される。
【0047】
ここで図13を参照すると、本発明の一実施形態によるタイプ変換命令を変換する方法を説明する流れ図が示されている。タイプ変換命令は、オペランドをより大きなタイプ又はより小さなタイプに変換してもよい。例えば、32ビットのintタイプを16ビットのshortタイプに型入れする段階は、オペランドをより小さなタイプに変換する。同様に、8ビットのbyteタイプを32ビットのintタイプに型入れする段階は、オペランドをより大きなタイプに変換する。後者の場合、byteタイプは、オペランドタイプと呼ばれ、intタイプは、ターゲットタイプと呼ばれる。
【0048】
参照番号170で、命令が受け取られる。オペランドタイプ及びターゲットタイプは、各々、参照番号172及び174において決められる。オペランドタイプがターゲットタイプよりも大きい場合、オペランドタイプは、参照番号178でターゲットタイプまで狭められる。オペランドタイプがターゲットタイプよりも小さい場合、オペランドが潜在的に桁あふれを伴っているか否かに関する判断が参照番号180で為される。オペランドが潜在的に桁あふれを伴う場合、変換処理は、タイプを訂正するために参照番号182でロールバックされる。オペランドタイプが潜在的桁あふれを伴わない場合、オペランドは、参照番号184でターゲットタイプまで広げられる。
【0049】
ここで図14を参照すると、本発明の一実施形態によるスタック操作命令を変換する方法を説明する流れ図が示されている。「Java(登録商標)仮想計算機」命令セットにおいては、スタック操作命令は、「dup(複製する)」、「swap(交換する)」、及び、「pop(ポップする)」命令を含む。参照番号190で、命令が受け取られる。参照番号192で、その命令がdup命令か否かに関する判断が為される。命令がdup命令である場合、参照番号194で、元のスタックエントリに対するロールバックポイントが存在するか否かに関する判断が為される。元のスタックエントリがロールバックポイントを有する場合、複製されたスタックエントリのロールバックポイントは、参照番号196で、元のスタックエントリのロールバックポイントに設定される。元のスタックエントリがロールバックポイントを持たない場合、複製されたスタックエントリのロールバックポイントは、参照番号198で、元のスタックエントリのソース命令に設定される。参照番号200で、命令が変換される。
【0050】
ここで図15を参照すると、本発明の一実施形態による演算式を変換する方法を説明する流れ図が示されている。参照番号210で、オペランドが潜在的桁あふれを伴っているか否かに関する判断が為される。オペランドが潜在的桁あふれを伴わない場合、参照番号212で、オペランドが潜在的桁あふれを持たないという指示が作られる。オペランドが潜在的桁あふれを伴う場合、参照番号214で、命令が桁あふれに影響されるか否かに関する判断が為される。命令が桁あふれに影響されない場合、参照番号216で、オペランドが潜在的桁あふれを有するという指示が作られる。命令が桁あふれに影響される場合、この変換は、参照番号218で、桁あふれを有する第1のオペランドにロールバックされる。変換がロールバックされない場合、最適化された命令タイプが参照番号220で決められ、命令が参照番号222で最適化され、結果のタイプと結果の桁あふれが参照番号224で判断される。
【0051】
ここで図16を参照すると、本発明の一実施形態による最適化された命令タイプを判断する方法を説明する流れ図が示されている。参照番号230で、少なくとも1つのオペランドが受け取られる。参照番号232で、目標とする命令タイプは、そのオペランドに付随する最も大きいタイプに設定される。参照番号234で、オペランドのいずれかが目標とする命令タイプよりも小さいタイプを有するか否かに関する判断が為される。少なくとも1つのオペランドが目標とするタイプよりも小さいタイプを有する場合、その小さいオペランドは、タイプを訂正するために参照番号236でロールバックされる。
【0052】
ここで図17を参照すると、本発明の一実施形態による結果のタイプ及び結果の桁あふれを判断する方法を説明する流れ図が示されている。参照番号240で、結果のタイプは、命令タイプに設定される。「Java Card(登録商標)」の戻された結果タイプ及び桁あふれ指示は、以下の表3から表10にまとめられている。これらの表は、命令のタイプによって構成されている。各表は、1つ又は2つのオペランドのタイプに基づいて、結果タイプと桁あふれ指示とを示している
【0053】
(表3)加算、乗算、及び、引き算

【0054】
(表4)割り算

【0055】
(表5)左側桁送り

【0056】
(表6)右側桁送り

【0057】
(表7)ネゲート

【0058】
(表8)符号なしの右側桁送り

【0059】
(表9)剰余

【0060】
(表10)and、or、及び、xor

【0061】
図17における「Java Card(登録商標)」の結果タイプ及び桁あふれ指示の使用は、単に例証目的のためである。当業者は、本発明が他のタイプを有する他の高級言語に対しても適用可能であることを認めるであろう。
参照番号244で、結果がより最適化された命令を用いることで生じた桁あふれを潜在的に伴うか否かに関する判断が為される。結果が潜在的桁あふれを伴わない場合、参照番号246で、オペランドのいずれかが桁あふれを伝達するか否かに関する判断が為される。少なくとも1つのオペランドが桁あふれを伝達するか、又は、結果が潜在的に桁あふれを伴う場合、その結果のロールバックポイントが参照番号248で記録され、結果が潜在的桁あふれを有するという指示が参照番号250で作られる。
【0062】
ここで図18を参照すると、本発明の一実施形態によるロールバックポイントを記録する方法を説明する流れ図が示されている。参照番号260で、第1のオペランドがそれに付随するロールバックポイントを有するか否かに関する判断が為される。第1のオペランドがそれに付随するロールバックポイントを有する場合、現在の命令のロールバックポイントは、参照番号262で、第1のオペランドのロールバックポイントに設定される。第1のオペランドがそれに付随する桁あふれを持たない場合、参照番号264で、第2のオペランドがそれに付随する桁あふれを有するか否かに関する判断が為される。第2のオペランドがそれに付随するロールバックポイントを有する場合、命令のロールバックポイントは、参照番号266で、第2のオペランドのロールバックポイントに設定される。どちらのオペランドもそれに付随するロールバックポイントを持たない場合、命令のロールバックポイントは、参照番号268で、第1のオペランドに対するソース命令に設定される。
【0063】
本発明の特定の実施形態によると、図18に示す通り、「第1のオペランド」は、第1に作り出されたオペランドを意味する。ロールバックポイントをより古いオペランドに対するソース命令に設定することは、より古いオペランドに付随するタイプを訂正することによって、より新しいオペランドがその後に使用するタイプを訂正し得るので、より新しいオペランドに対する追加のロールバック演算を実行する必要性を除外するであろう。
【0064】
ここで図19を参照すると、本発明の一実施形態による変換処理をロールバックする方法を設定する流れ図が示されている。参照番号270で、現在の命令の変換が割り込まれる。参照番号272で、オペランドがロールバックポイントを有するか否かに関する判断が為される。オペランドがロールバックポイントを持たない場合、ロールバック命令は、参照番号276で、そのオペランドを作り出したソース命令に設定される。オペランドがロールバックポイントを有する場合、ロールバック命令は、参照番号274で、その同じロールバックポイントに設定される。参照番号278で、ロールバック命令の目標とするタイプが広げられる。参照番号280で、ロールバック命令を変換すべきであるという指示が作られる。変換処理は、参照番号282において、ロールバック命令で再開される。参照番号284で、ロールバック命令は、新しい目標とするタイプに従って変換される。
【0065】
ここで図20を参照すると、本発明の一実施形態による命令最適化の結果を伝達する段階を説明する流れ図が示されている。参照番号290で、後続命令が取得される。後続命令とは、現在の命令と同じ制御経路にあって、現在の命令の直ぐ後に発生する命令である。当業者は、1つの命令が多くの制御経路の一部であってもよいことを認めるであろう。
参照番号292で、後続命令が変換処理において以前に訪問されたか否かに関する判断が為される。後続命令が以前に訪問されていない場合、後続命令に関する変換情報は、参照番号294で現在の命令に関する変換情報と等しいように設定され、参照番号296で後続命令を変換すべきであるという指示が作られる。変換情報は、現在の変換点におけるランタイム状態を含んでもよい。例えば、まだ消費されていない現在又は以前の命令によって、それらの値が作り出される。これらの値は、制御経路の後続命令に対してオペランドとして使用されることになる。各値に対して、タイプ、ソース命令、及び、ロールバックポイントが記録される。後続命令が以前に訪問されていた場合、後続命令において以前に記録された変換情報は、参照番号298で現在の変換情報と結合される。参照番号300で、結合された情報の中の値が変更されたか否かに関する判断が為される。値が変更されていた場合、後続命令を変換すべきであるという指示が参照番号296で作られる。この処理は、各後続命令に対して繰り返される。
【0066】
ここで図21を参照すると、本発明の一実施形態による異なる制御経路からの変換情報を結合する段階を説明する流れ図が示されている。参照番号310で、両方の制御経路の対応する入力が比較される。参照番号312で、対応する入力のタイプが異なっているか否かに関する判断が為される。タイプが異なる場合、より小さなタイプを有する入力は、参照番号314でロールバックされる。この処理は、各オペランドに対して繰り返される。
【0067】
ここで図22Aを参照すると、本発明の一実施形態による命令変換を説明するブロック図が示されている。これは、最適化が可能な演算式への本発明の応用法を示している。図22Aは、値a、b、及び、cをタイプshortとする時の以下のJava(登録商標)表現に対する変換処理を説明している。
short c=(short)((short)(a+b)/c)
この式のJava(登録商標)バイトコードシーケンスは、参照番号316で示されている。
【0068】
命令変換は、iload-a命令で始まる。第1のより小さなタイプに付随する命令が、load及びadd命令に対して用いられる。表1に明記した通り、add命令は潜在的桁あふれを引き起こすが、ソースレベルにおけるタイプshortへの明確な型入れが、桁あふれの可能性を取り除く。div330の命令は、表2に示す通り、桁あふれに影響される。しかし、明確な型入れのために、潜在的桁あふれは何も存在しない。従って、より大きなタイプを作り出すために加算演算に「ロールバック」する必要性は起こらない。
本発明の理解を更に助けるために、上記で検討した例は、図10から図21に関連して以下で更に詳細に説明される。
【0069】
iload命令は、ソース命令である。参照番号160において、「a」オペランドに対する目標とするタイプはタイプshortである。参照番号162において、オペランド「a」はタイプshortである。オペランドは、それらが直接ロードされ、従って、桁あふれを引き起こす演算によって作り出されたのではないために、参照番号166で潜在的桁あふれを伴わない。従って、参照番号167でiload命令をsload-a命令に変換するのに、shortの気味のある命令が使用される。同様に、iload-b命令は、sload-b命令に変換される。
【0070】
次に、iadd命令が処理される。iaddは桁あふれを引き起こすことがある命令であるから、そのオペランドが潜在的桁あふれを伴うか否かを判断する検査が参照番号210で行われる。両方のオペランドは、それらが潜在的桁あふれを伴わないように、直接ロードされる。従って、最適化された結果タイプは、参照番号220で判断される。参照番号232で、命令タイプは、最大のオペランドタイプに設定される。この例では、この最大オペランドタイプは、オペランド「a」及びオペランド「b」の両方がタイプshortであるために、タイプshortである。両方のオペランドが命令タイプと同じタイプであるから、参照番号238で、タイプshortが、命令タイプとして戻される。
【0071】
次に、参照番号222で、命令が最適化される。命令タイプがタイプshortであるから、最適化された命令は、「sadd」である。次に、結果タイプ及び桁あふれ指示が、参照番号224で判断される。参照番号240で、結果タイプは、命令タイプであるタイプshortに設定される。更に、結果が潜在的桁あふれを有するという指示が表3に従って作られる。結果が潜在的桁あふれを含むので、(a+b)の結果に対するロールバックポイントは、参照番号248で記録される。いずれのオペランドもロールバックポイントを持たないので、結果に対するロールバックポイントは、参照番号268で、オペランド「a」(第1のオペランド)に対するソース命令に設定される。参照番号250で、結果が潜在的桁あふれを有するという指示が作られる。
【0072】
次に、i2s命令が処理される。このi2s命令は、タイプ変換命令である。参照番号176で、オペランドタイプ(short)は、ターゲットタイプ(short)と比較される。両方のタイプは同じであるから、参照番号178でタイプがタイプshortまで狭められ、潜在的桁あふれを取り除く。
次に、iload-c命令が処理される。値a及びbのように、cはタイプshortであり、iload-c命令は、sload-c命令に変換される。次に、idiv命令が処理される。表2に明記した通り、idivは、桁あふれに影響されてもよい命令である。「a+b」オペランドは、shortへの明確なソースレベルの型入れのために潜在的桁あふれを伴わず、従って、最適化された割り算命令タイプは、参照番号232でタイプshortであると判断され、結果タイプは、参照番号240でタイプshortに設定される。
【0073】
次に、i2s命令が処理される。参照番号176で、オペランドタイプ(short)は、ターゲットタイプ(short)と比較される。両方のタイプは同じであるから、このタイプは、参照番号178でタイプshortまで狭められ、潜在的桁あふれを取り除く。
最後に、istore-c命令が処理される。目標とするタイプがタイプshortであり、オペランドが桁あふれを伴わないから、istore-c命令は、参照番号167で、sstore-c命令に最適化される。変換されたバイトコードは、参照番号318で示されている。
【0074】
ここで図22Bを参照すると、本発明の一実施形態による命令変換を説明するブロック図が示されている。これは、最適化不可能な演算式への本発明の応用法を示している。それにもかかわらず、変換されたコードは、未変換コードとの意味論的同等性を維持している。図22Bは、値a、b、及び、cをタイプshortとする時の以下のJava(登録商標)表現に対する変換処理を説明している。
short c=(short)((a+b)/c)
この式に対するJava(登録商標)バイトコードシーケンスは、参照番号320で示されている。
【0075】
命令変換は、参照番号322で表されたiload-a命令で始まる。第1のより小さなタイプに付随する命令が、load322及び324とadd326との命令に対して使用される。表1で明記した通り、add命令326は、桁あふれの可能性を引き起こすが、第2のより大きなタイプの使用を必要としない。しかし、div330の命令は、桁あふれに影響される。これは、表2で示されている。すなわち、桁あふれの問題を引き起こす命令は、訂正されなければならない。この問題は、参照番号322まで「ロールバック」して、オペランド「a」に対して第2の大きなタイプの命令を使用することによって訂正される。
【0076】
命令変換がオペランド「b」もまたより大きなタイプに変換されるべきであると判断され、2度目のロールバックを必要とするまで、命令変換は、参照番号332で2度目を続行する。命令変換は、次に、オペランド「c」に対する命令がより大きなタイプの使用を必要とすると命令変換が判断されるまで、参照番号334で3度目を続行する。3度目のロールバックが実行され、オペランド「c」のタイプが訂正されて、変換処理は、参照番号336で4度目の変換処理が続行された後で完了する。
本発明の理解を更に助けるために、上記で検討した図22Bの例は、図10から図21を参照して以下で更に詳細に説明される。
【0077】
iload-a命令、iload-b命令、及び、iadd命令の最初の変換は、前記の例で説明したように進行する。次に、iload-c命令は、参照番号167で、sload-c命令に変換される。次に、idiv命令が処理される。表2で明記した通り、idivは、桁あふれに影響され得る命令である。「a+b」オペランドは、それが「+」演算子によって作り出され、その演算子が表1で示したように桁あふれを引き起こすことがあるので、桁あふれの可能性となる。少なくとも1つのオペランドが桁あふれの可能性となっているので、桁あふれを有する第1のオペランドへのロールバックが参照番号218で実行される。
【0078】
参照番号270で、現在の命令の変換が割り込まれる。参照番号274で、桁あふれがa+bオペランドと結び付けられ、そのために、ロールバックポイントは、a+bオペランドに対するロールバックポイントに設定される。参照番号278で、ロールバック命令の目標とするタイプは、タイプshortからタイプintに広げられる。参照番号280で、ロールバックされる行き先の命令を変換する指示が作られる。参照番号282で、変換処理は、以前にsload-a命令に変換されたiload-a命令において再開される。このiload-a命令は、参照番号284で変換される。
【0079】
ロールバックの結果として、iload-a命令は、参照番号338で処理される。参照番号124で、結果のタイプと目標とするタイプとが照合される。結果のタイプがshortで、目標とするタイプがintであるから、そのタイプは一致しない。すなわち、shortをintに上げるために、S2I命令が作り出される。処理は、iload-b命令及びiadd命令を用いて続行される。iadd命令に対するオペランドは、参照番号210において潜在的桁あふれを伴わず、従って、最適化された結果タイプが参照番号220で判断される。参照番号234で、オペランドのタイプが比較される。「a」オペランドが今はタイプintであり、「b」オペランドがまだタイプshortであるから、「b」オペランドに対してロールバックが実行される。参照番号276で、ロールバック命令は、iload-b命令340に設定される。また、参照番号278で、目標とするタイプはintに設定される。参照番号280で、現在の命令を変換する指示が作られる。参照番号282及び284で、変換がiload-b命令において再開され、命令が変換される。
参照番号124で、結果のタイプと目標とするタイプとが照合される。結果のタイプがshortで、目標とするタイプがintであるから、そのタイプは一致しない。すなわち、shortをintに上げるために、S2I命令が作り出される。
【0080】
次に、iadd命令が処理される。2度ロールバックした後では、いずれのオペランドも桁あふれの可能性を持っていない。従って、参照番号210で、オペランドが潜在的桁あふれを伴わないという指示が作られ、最適化された命令タイプが参照番号220で決められる。参照番号232で、命令タイプは、最大のオペランドタイプに設定される。「a+b」オペランドがタイプintであり、「c」オペランドがタイプshortであるから、命令タイプはintに設定される。「c」オペランドのタイプが命令タイプと異なるので、参照番号236で、「c」オペランドに対してロールバックが実行される。参照番号276で、ロールバック命令は、iload-c命令に設定される。参照番号278で、ロールバック命令の目標とするタイプは、タイプshortからタイプintに広げられる。変換処理は、iload-c命令342において再開される。
【0081】
参照番号124で、結果のタイプと目標とするタイプとが照合される。結果のタイプがshortで、目標とするタイプがintであるから、そのタイプは一致しない。すなわち、shortをintに上げるために、S2I命令が作り出される。
次に、idiv命令が処理される。参照番号238において、両方のオペランドがタイプintであるから、最適化された命令タイプはintに設定される。参照番号222で、intの気味のある命令(idiv)が選択される。最後の命令シーケンスは、図22の参照番号344で表されている。
【0082】
本発明は、整数タイプに関して説明されたが、当業者は、本発明が浮動小数点演算式に対しても同様に適用し得ることを認めるであろう。更に、本発明は、「Java Card(登録商標)」技術に関して説明されたが、当業者は、本発明が他の多くのプラットフォームに対しても同様に適用可能であることを認めるであろう。これらのプラットフォームには、例として挙げると、K仮想計算機(KVM)技術が含まれる。KVM技術は、1999年6月8日にサン・マイクロシステムズ・インコーポレーテッドから出版された「K仮想計算機(KVM)・白書」で説明されている。
本発明は、ソフトウエア又はハードウエアにおいて実施されるであろう。本発明は、他のプロセッサにおいて実施されてもよく、同様に、プログラム可能ゲートアレー装置、「特定用途向け集積回路(ASIC)」、及び、他のハードウエアにおいて実施されてもよい。
【0083】
演算式の適応最適化に関する新しい方法が以上のように説明された。同一タイプの命令は、リソース限定型計算機上で実行するために、第2のより小さな(より小さなビット数を有する)整数タイプのための意味論的同等タイプの命令に変換され、従って、比較的効率的なスタック利用と実行速度の増加とをもたらす。本発明の実施形態及び応用例が示され説明されたが、本発明の開示の恩恵を受ける当業者には、本明細書の革新的概念から逸脱することなく、上述のもの以外に更に多くの変更が可能であることが明らかであろう。従って、本発明は、特許請求の範囲の精神において限定されるが、それ以外では限定されないものとする。

【特許請求の範囲】
【請求項1】
第1のベースを有する第1のプロセッサのために形成され、演算子と少なくとも1つのオペランドとを含む第1の命令を受け取る段階と、
前記少なくとも1つのオペランドが前記第1のベースよりも小さい第2のベースを超える潜在的桁あふれを伴わない時、又は、前記演算子が桁あふれに敏感でない時、前記第1の命令を、前記第2のベースを有する第2のプロセッサに対して最適化された第2の命令に変換する段階と、
前記少なくとも1つのオペランドが前記第2のベースを超える桁あふれの可能性を伴う時、及び、前記演算子が桁あふれに敏感である時、前記少なくとも1つのオペランドに付随する潜在的桁あふれの源であり、以前に最適化されている第3の命令を、前記第2のベースよりも大きく前記第1のベースよりも小さいか又は等しいより広いベースに変換する段階と、
を含むことを特徴とする、演算式最適化の方法。
【請求項2】
より広いベースへの前記変換段階は、前記第3の命令の以前の変換結果を、より広いベースへの前記変換段階の前に廃棄する段階を更に含むことを特徴とする請求項1に記載の方法。
【請求項3】
前記第2のプロセッサ上でより小さなベースに最適化することができない表現を拒否する段階を更に含むことを特徴とする請求項1に記載の方法。
【請求項4】
より広いベースへの前記変換段階は、より広い前記ベースが前記第2のプロセッサによってサポートされない時は前記第1の命令を拒否する段階を更に含むことを特徴とする請求項1に記載の方法。
【請求項5】
前記第1の命令は、算術であることを特徴とする請求項1に記載の方法。
【請求項6】
前記第1の命令は、タイプに敏感な非算術命令を含むことを特徴とする請求項1に記載の方法。
【請求項7】
前記第1の命令の前記変換段階の後で、前記第1のプロセッサのために形成された全ての命令が変換されるまで、前記第1の命令を受け取る段階に戻る段階を更に含むことを特徴とする請求項5に記載の方法。
【請求項8】
全ての制御経路において、各命令を後続命令にリンクする段階を更に含むことを特徴とする請求項7に記載の方法。
【請求項9】
前記第1の命令の前記変換段階は、
命令の結果の各々を、前記結果を消費する全ての命令にリンクする段階と、
前記変換段階が値を作り出す段階を含む場合、前記値を生み出した命令に前記値をリンクする段階と、
前記値が桁あふれの可能性を伴う場合、前記桁あふれを最初に引き起こした命令に前記値をリンクする段階と、
を更に含む、ことを特徴とする請求項8に記載の方法。
【請求項10】
前記第1のプロセッサは、「Java(登録商標)仮想計算機」を含み、
前記第2のプロセッサは、「Java Card(登録商標)仮想計算機」を含む、
ことを特徴とする請求項1に記載の方法。
【請求項11】
前記第1のベースは、前記第1のベースのサイズよりも小さいサイズを有する少なくとも1つのデータタイプ上で算術演算を実行するために、前記第1のプロセッサによって使用され、
前記少なくとも1つのデータタイプのサイズに等しいサイズを有する前記第2のベースは、前記少なくとも1つのデータタイプ上で算術演算を実行するために、前記第2のプロセッサによって使用される、
ことを特徴とする請求項1に記載の方法。
【請求項12】
前記第1のプロセッサは、32ビットのプロセッサを含み、
前記第2のプロセッサは、リソース限定型16ビットのプロセッサを含む、
ことを特徴とする請求項1に記載の方法。
【請求項13】
前記第1のベースは、前記第1のベースのサイズよりも小さいサイズを有する少なくとも1つのデータタイプ上で算術演算を実行するために、前記第1のプロセッサによって使用され、
前記少なくとも1つのデータタイプのサイズよりも大きいサイズを有する前記第2のベースは、前記少なくとも1つのデータタイプ上で算術演算を実行するために、前記第2のプロセッサによって使用される、
ことを特徴とする請求項9に記載の方法。
【請求項14】
前記第1のプロセッサは、32ビットのプロセッサを含み、
前記第2のプロセッサは、リソース限定型16ビットのプロセッサを含む、
ことを特徴とする請求項13に記載の方法。
【請求項15】
第1のベースを有する第1のプロセッサのために形成され、演算子と少なくとも1つのオペランドとを含む第1の命令を受け取る段階と、 前記少なくとも1つのオペランドが前記第1のベースよりも小さい第2のベースを超える潜在的桁あふれを伴わない時、又は、前記演算子が桁あふれに敏感でない時、前記第1の命令を、前記第2のベースを有する第2のプロセッサに対して最適化された第2の命令に変換する段階と、
前記少なくとも1つのオペランドが前記第2のベースを超える桁あふれの可能性を伴う時、及び、前記演算子が桁あふれに敏感である時、前記少なくとも1つのオペランドに付随する潜在的桁あふれの源であり、以前に最適化されている第3の命令を、前記第2のベースよりも大きく前記第1のベースよりも小さいか又は等しいより広いベースに変換する段階と、
を含む演算式最適化を実行する、計算機が実行可能な命令プログラムを包含することを特徴とする、計算機が読取可能なプログラム記憶装置。
【請求項16】
より広いベースへの前記変換段階は、前記第3の命令の以前の変換結果を、より広いベースへの前記変換段階の前に破棄する段階を更に含むことを特徴とする請求項15に記載のプログラム記憶装置。
【請求項17】
前記第2のプロセッサ上でより小さなベースに最適化することができない表現を拒否する段階を更に含むことを特徴とする請求項15に記載のプログラム記憶装置。
【請求項18】
より広いベースへの前記変換段階は、より広い前記ベースが前記第2のプロセッサによってサポートされない時は前記第1の命令を拒否する段階を更に含むことを特徴とする請求項15に記載のプログラム記憶装置。
【請求項19】
前記第1の命令は、算術であることを特徴とする請求項15に記載のプログラム記憶装置。
【請求項20】
前記第1の命令は、タイプに敏感な非算術命令を含むことを特徴とする請求項15に記載のプログラム記憶装置。
【請求項21】
前記第1の命令の前記変換段階の後で、前記第1のプロセッサのために形成された全ての命令が変換されるまで、前記第1の命令を受け取る段階に戻る段階を更に含むことを特徴とする請求項19に記載のプログラム記憶装置。
【請求項22】
全ての制御経路において、各命令を後続命令にリンクする段階を更に含むことを特徴とする請求項21に記載のプログラム記憶装置。
【請求項23】
前記第1の命令の前記変換段階は、
命令の結果の各々を、前記結果を消費する全ての命令にリンクする段階と、
前記変換段階が値を作り出す段階を含む場合、前記値を生み出した命令に前記値をリンクする段階と、
前記値が桁あふれの可能性を伴う場合、前記桁あふれを最初に引き起こした命令に前記値をリンクする段階と、
を更に含む、ことを特徴とする請求項22に記載のプログラム記憶装置。
【請求項24】
前記第1のプロセッサは、「Java(登録商標)仮想計算機」を含み、
前記第2のプロセッサは、「Java Card(登録商標)仮想計算機」を含む、
ことを特徴とする請求項15に記載のプログラム記憶装置。
【請求項25】
前記第1のベースは、前記第1のベースのサイズよりも小さいサイズを有する少なくとも1つのデータタイプ上で算術演算を実行するために、前記第1のプロセッサによって使用され、
前記少なくとも1つのデータタイプのサイズに等しいサイズを有する前記第2のベースは、前記少なくとも1つのデータタイプ上で算術演算を実行するために、前記第2のプロセッサによって使用される、
ことを特徴とする請求項15に記載のプログラム記憶装置。
【請求項26】
前記第1のプロセッサは、32ビットのプロセッサを含み、
前記第2のプロセッサは、リソース限定型16ビットのプロセッサを含む、
ことを特徴とする請求項15に記載のプログラム記憶装置。
【請求項27】
前記第1のベースは、前記第1のベースのサイズよりも小さいサイズを有する少なくとも1つのデータタイプ上で算術演算を実行するために、前記第1のプロセッサによって使用され、
前記少なくとも1つのデータタイプのサイズよりも大きいサイズを有する前記第2のベースは、前記少なくとも1つのデータタイプ上で算術演算を実行するために、前記第2のプロセッサによって使用される、
ことを特徴とする請求項23に記載のプログラム記憶装置。
【請求項28】
プログラム命令を有する少なくとも1つのメモリと、
第1のベースを有する第1のプロセッサのために形成され、演算子と少なくとも1つのオペランドとを含む第1の命令を受け取り、
前記少なくとも1つのオペランドが前記第1のベースよりも小さい第2のベースを超える潜在的桁あふれを伴わない時、又は、前記演算子が桁あふれに敏感でない時、前記第1の命令を、前記第2のベースを有する第2のプロセッサに対して最適化された第2の命令に変換し、
前記少なくとも1つのオペランドが前記第2のベースを超える桁あふれの可能性を伴う時、及び、前記演算子が桁あふれに敏感である時、前記少なくとも1つのオペランドに付随する潜在的桁あふれの源であり、以前に最適化されている第3の命令を、前記第2のベースよりも大きく前記第1のベースよりも小さいか又は等しいより広いベースに変換する、
ために前記プログラム命令を使用するように形成された少なくとも1つのプロセッサと、
を含むことを特徴とする、演算式最適化のための装置。
【請求項29】
前記少なくとも1つのプロセッサは、より広いベースに変換する段階の前に、前記プログラム命令を使用して前記第3の命令の以前の変換結果を破棄するように更に形成されることを特徴とする請求項28に記載の装置。
【請求項30】
第1のベースを有する第1のプロセッサのために形成され、演算子と少なくとも1つのオペランドとを含む第1の命令を受け取る手段と、 前記少なくとも1つのオペランドが前記第1のベースよりも小さい第2のベースを超える潜在的桁あふれを伴わない時、又は、前記演算子が桁あふれに敏感でない時、前記第1の命令を、前記第2のベースを有する第2のプロセッサに対して最適化された第2の命令に変換する手段と、
前記少なくとも1つのオペランドが前記第2のベースを超える桁あふれの可能性を伴う時、及び、前記演算子が桁あふれに敏感である時、前記少なくとも1つのオペランドに付随する潜在的桁あふれの源であり、以前に最適化されている第3の命令を、前記第2のベースよりも大きく前記第1のベースよりも小さいか又は等しいより広いベースに変換する手段と、
を含むことを特徴とする、演算式最適化のための装置。
【請求項31】
より広いベースに変換する前記手段は、より広いベースに変換する前記段階の前に、前記第3の命令の以前の変換結果を破棄する手段を更に含むことを特徴とする請求項30に記載の装置。
【請求項32】
全ての制御経路において、各命令を後続命令にリンクする手段を更に含むことを特徴とする請求項30に記載の装置。
【請求項33】
第1のベースを有するプロセッサを目標とする少なくとも1つの命令の演算式最適化を含むアプリケーションソフトウエアプログラムを使用する方法であって、
ソフトウエアプログラムをプロセッサ上に受け取る段階と、
命令のシーケンスを前記プロセッサ上で実行する段階と、
を含むことを特徴とする方法。
【請求項34】
前記少なくとも1つの命令をリソース限定型装置上に記憶する段階を更に含むことを特徴とする請求項33に記載の方法。
【請求項35】
マイクロ制御装置によって実行される仮想計算機、
を含み、
前記仮想計算機は、複数の予め最適化された命令から成るソフトウエアアプリケーションを実行し、
前記仮想計算機は、リソース限定型装置上で実行するために予め最適化されている最適化された命令を受け取る手段と前記命令を実行する手段とを含む、
ことを特徴とする、マイクロ制御装置が組み込まれたスマートカード。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4A】
image rotate

【図4B】
image rotate

【図5A】
image rotate

【図5B】
image rotate

【図6A】
image rotate

【図6B】
image rotate

【図7A】
image rotate

【図7B】
image rotate

【図8A】
image rotate

【図8B】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12A】
image rotate

【図12B】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate

【図21】
image rotate

【図22A】
image rotate

【図22B】
image rotate


【公開番号】特開2011−150727(P2011−150727A)
【公開日】平成23年8月4日(2011.8.4)
【国際特許分類】
【出願番号】特願2011−92259(P2011−92259)
【出願日】平成23年4月18日(2011.4.18)
【分割の表示】特願2001−536669(P2001−536669)の分割
【原出願日】平成12年11月10日(2000.11.10)
【出願人】(597004720)オラクル・アメリカ・インコーポレイテッド (23)
【Fターム(参考)】