可変長命令の固定数を持つ命令キャッシュ

【課題】可変長命令の存在のもとで命令キャッシュアクセスを改善する。
【解決手段】可変長命令の固定数が、命令キャッシュの各ライン２００，２６０に記憶される。可変長命令Ｉ１〜Ｉ８は予め定められた境界に沿って整列される。ラインの各命令の長さ、従って命令が占めるメモリのスパンが知られていないので、次に続く命令のアドレス２４０，３００が計算され、キャッシュラインで記憶される。命令境界を確認し、命令を整列させ、次のフェッチアドレスを計算することは、キャッシュに命令を置く前にプレデコーダで行なわれる。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は一般にプロセッサの分野に係り、特に可変長命令の固定数を記憶する命令キャッシュを持つプロセッサに関する。
【背景技術】
【０００２】
マイクロプロセッサは、携帯用電子機器を含む種々様々のアプリケーションにおいて計算上のタスクを行なう。多くの場合、プロセッサの性能を最大限にすることは、補助機能と特徴が携帯用電子機器および他のアプリケーションで実施されることを可能にするために主な設計目標である。さらに、電力消費は、制限されたバッテリー容量を持つ携帯用電子機器において特別の関係である。従って、性能を増加させて、電力消費を減少させるプロセッサ設計は望ましい。
【０００３】
最も現代のプロセッサは１つ以上の命令実行パイプラインを使用し、多くのマルチステップの逐次命令の実行が全面的なプロセッサの性能を改善するために重複される。ほとんどのプログラムの空間的かつ時間的局所参照性特例を利用して、最近、実行される命令が実行パイプラインによって即座のアクセスのために、キャッシュ（高速、通常オンチップ・メモリ）に記憶される。
【０００４】
多くのプロセッサの命令セット・アーキテクチャ（ＩＳＡ）が可変長命令を含んでいる。すなわち、メモリから読み出された命令オペレーションコードは、必ずしもすべて同じ量のスペースを占めない。これは、算術または論理命令を用いたオペランドの包含、非常に長い命令語（ＶＬＩＷ）への多重オペレーションの融合、あるいは他のアーキテクチャの特徴に起因するかもしれない。可変長命令にとって１つの不利は、命令キャッシュから命令を取り込む際、プロセッサは各命令の境界を確認しなければならないということであり、その計算上のタスクは電力を消費し、性能を減少させる。
【０００５】
可変長命令の存在のもとで命令キャッシュアクセスを改善することへの技術における既知のアプローチは、キャッシュにそれらを記憶する前に命令を「プレデコード」し、さらに、命令と共にキャッシュラインにおけるある命令境界情報を記憶することである。これは、デコードタスクに置かれる命令境界を確認する付加的な計算上の負担を減少させるが、しかし除去しない。
【０００６】
また、同じコンパクトな形式のキャッシュにそれらがメモリから読み出される命令を詰め込むことによって、命令は１つのキャッシュラインの終わりに命令の一部が記憶され、残りが連続したキャッシュラインの初めに記憶されることによって、時々誤整列される。この命令を取り込むことは２つのキャッシュアクセスを必要とし、特に２つのアクセスが命令実行するごとに必要とされるので、さらに性能を減少し、電力消費を増加させる。
【０００７】
図１は可変長命令（Ｉ１−Ｉ９）を記憶する先行技術命令キャッシュの２つのライン１００、１４０の代表的な図を示す。この代表的な例において、各キャッシュラインは１６バイトを含み、３２ビットの語長が仮定される。ほとんどの命令は一語幅、即ち４バイトである。いくつかの命令は２バイトを含む半語幅である。第1のキャッシュライン１００および関連するタグフィールド１２０は、命令Ｉ１ないしＩ４、および命令Ｉ５の半分を含んでいる。関連するタグフィールド１６０を有する第２のキャッシュライン１４０は、命令Ｉ５の後半および命令Ｉ６ないしＩ９を含んでいる。命令長とそれらのアドレスは次の表で要約される：
【表１】

【０００８】
キャッシュライン１００、１４０からこれらの命令を読み出すために、プロセッサは、命令境界を決定する付加的な計算上の労力（電力消費と遅れを犠牲にして）を消費しなければならない。命令をプレデコードし、かつキャッシュライン１００、１４０中の、またはそれに関係した境界情報を記憶することにより、このタスクが支援されてもよいが、補足計算は除去されない。さらに、命令Ｉ５の取り込みは２つのキャッシュアクセスを要求するだろう。キャッシュから誤整列された命令を取り込むこの２重のアクセスは付加的な電力消費およびプロセッサ遅れを引き起こす。
【発明の概要】
【０００９】
可変長命令の固定数が命令キャッシュの各ラインに記憶される。可変長命令は予め定められた境界に沿って整列される。ラインにおける各命令の長さ、従って命令が占めるメモリのスパンが知られていないので、次に続く命令のアドレスが計算され、キャッシュラインで記憶される。命令境界を確認し、命令を整列させて、次のフェッチアドレスを計算することは、キャッシュに命令を置く前にプレデコーダで行なわれる。
【００１０】
一実施例では、可変命令長を持つプロセッサにおいてキャッシュ管理の方法はキャッシュラインごとに命令の固定数を記憶することを含む。
【００１１】
別の実施例では、プロセッサは、可変長の命令を実行するように作動する命令実行パイプラインと、キャッシュラインごとに可変長命令の固定数を記憶するように作動する命令キャッシュを含んでいる。プロセッサはさらに、キャッシュラインに命令を書き込む前に予め定められた境界に沿って可変長命令を整列させるように作動するプレデコーダを含んでいる。
【図面の簡単な説明】
【００１２】
【図１】可変長命令を記憶する先行技術命令キャッシュの図である。
【図２】プロセッサの機能ブロック図である。
【図３】予め定められた境界に沿って整列された可変長命令の固定数を記憶する命令キャッシュの図である。
【発明を実施するための形態】
【００１３】
図２は、パイプラインアーキテクチャと階層的記憶構造の両方を使用する、代表的なプロセッサ１０の機能ブロック図を示す。プロセッサ１０は制御論理１４にしたがって命令実行パイプライン１２で命令を実行する。パイプラインはパイプ段階に組織化された様々なレジスタあるいはラッチ１６、および１つ以上の論理演算装置（ＡＬＵ）１８を含んでいる。多目的レジスタ（ＧＰＲ）ファイル２０は、記憶階層のトップを含むレジスタを提供する。
【００１４】
パイプラインは命令側変換索引バッファ（ＩＴＬＢ）２４によって管理されたメモリアドレッシングとパーミッションで命令キャッシュ（Ｉ-キャッシュ）２２から命令を取り込む。プレデコーダ２１は、Ｉ-キャッシュ２２にそれらを記憶する前にメモリから取り込まれた命令を検査する。下に議論されるように、プレデコーダ２１は命令境界を確認し、命令を整列させて、命令をＩ-キャッシュ２２に記憶する次のフェッチアドレスを計算する。
【００１５】
データは主変換索引バッファ（ＴＬＢ）２８によって管理されたメモリアドレッシングとパーミッションでデータキャッシュ２６からアクセスされる。様々な実施例では、ＩＴＬＢ２４はＴＬＢ２８の一部のコピーを含んでもよい。代わりに、ＩＴＬＢ２４およびＴＬＢ２８は統合されてもよい。同様に、プロセッサ１０の様々な実施例では、Ｉ-キャッシュ２２およびＤ-キャッシュ２６は統合、即ち一体にされてもよい。Ｉ-キャッシュ２２および/またはＤ-キャッシュ２６におけるミスは、メモリインタフェース３０の制御の下で、主（オフチップ）メモリ３２へのアクセスを引き起こす。
【００１６】
プロセッサ１０は様々な周辺機器３６へのアクセスを制御する、入力／出力（Ｉ／Ｏ）インターフェース３４を含んでいてもよい。当業者はプロセッサ１０の多くの変形が可能であることを認識するだろう。例えば、プロセッサ１０はＩおよびＤ-キャッシュ２２、２６のいずれかあるいは両方について第２のレベル（Ｌ２）キャッシュを含んでいてもよい。さらに、プロセッサ１０で示された機能ブロックの１つ以上は、特別の実施例から省略されてもよい。
【００１７】
ここに示された１つ以上の実施例によれば、プロセッサ１０は各キャッシュラインに可変長命令の固定数を記憶する。その命令は、好ましくは、例えば語境界のような予め定められた境界に沿って整列される。これは、命令境界を計算し、高速演算を可能にし、したがってプロセッサの性能を改善する必要から、デコードパイプ段階を緩和する。Ｉ-キャッシュ２２にこのように命令を記憶することは、また命令長検査および一度整列動作を行なうことにより電力消費を減少させる。Ｉ-キャッシュ２２のヒット率が一般に高い９０％であるので、毎回命令がＩ-キャッシュ２２から実行される命令境界を確認する必要の除去により、相当な省電力が実現され得る。
【００１８】
プレデコーダ２１は主メモリ３２およびＩ-キャッシュ２２間のパス中に挿入された論理を含む。プレデコーダ２１の論理は、メモリから検索されたデータを検査し、命令の数および長さを確認する。プレデコーダは、キャッシュラインに記憶されるキャッシュへの整列された命令を渡す前に、予め定められた、例えば語、境界に沿って命令を整列させる。
【００１９】
図３は、図１からの可変長命令の固定数をそれぞれ含んでいる、Ｉ-キャッシュ２２の２つの代表的ライン２００および２６０を示す（この例において、４つの命令が各キャッシュライン２００、２６０に記憶される）。キャッシュライン２００および２６０は１６バイトである。語境界が破線によって示される；半語境界は点線によって示される。命令は語境界に沿って整列される（即ち、各命令は語アドレスから開始する）。命令がパイプライン１２によってＩ-キャッシュ２２から取り込まれる場合、デコードパイプ段階は、キャッシュライン２００、２６０から適切な語を単に多重化し、直ちにオペレーションコードをデコードし始める。半語命令（例えばＩ３とＩ８）の場合には、キャッシュライン２００、２６０中のスペースの半語はそれぞれ未使用であり、図３で陰影により示される。
【００２０】
図１で示された先行技術キャッシュと比較して、図３のキャッシュ２２は２つのキャッシュラインに、９つではなく、８つの命令しか記憶しないことに注意を要す。Ｉ９の長さに対応する語スペース（オフセット０×０Ａおよび０×１Ｅにおける半語）は利用されない。キャッシュ２２に命令を記憶する効率のこの減少は、図３で示されたキャッシュ利用の単純性、改善されたプロセッサ・パワーおよびより低い電力消費の代償である。
【００２１】
さらに、キャッシュライン２００、２６０に可変長命令の固定数を割り当て、予め定められた境界に沿って命令を整列させることによって、命令は図１のＩ５のように、キャッシュラインを横切って誤整列されて記憶されない。したがって、単一命令を検索するため２つのキャッシュ２２のアクセスによって起される性能ペナルティおよび過大電力消費は、完全に除去される。
【００２２】
既知の全体長さ（キャッシュラインの長さ）を持つ命令の可変数ではなく、可変長命令の固定数が記憶されるので、次の逐次命令のアドレスはキャッシュライン２００のメモリサイズによって、１つのキャッシュライン２００のタグ２２０を単にインクリメントすることによって確認することができない。従って、一実施例では、命令が整列されるとき（Ｉ-キャッシュ２２にそれらを記憶する前に）、次のフェッチアドレスがプレデコーダ２１によって計算され、次のフェッチアドレスはキャッシュライン２００と共にフィールド２４０に記憶される。
【００２３】
次のフェッチアドレスの計算および記憶の代わりとして、一実施例によれば、タグ２２０からのオフセットが計算され、オフセットフィールド２４０におけるようにキャッシュライン２００と共に記憶される。したがって、次のフェッチアドレスはタグアドレスにオフセットを加えることにより容易に計算され得る。この実施例は、連続のアドレスフェッチがキャッシュラインを横切るたびごとにこの加算を行なうため処理遅延および電力消費を招く。他の実施例では、次のフェッチアドレスの計算を助けるために他の情報が記憶されてもよい。例えば、キャッシュライン２４０中の命令の固定数と等しい一組のビットが、例えば、全語長命令を示す１と半語長命令を示す０が対応する命令「スロット」に記憶されることにより、記憶されてもよい。メモリ中の命令のアドレス、従って次の逐次命令のアドレスは、その後この情報から計算されてもよい。当業者は、追加の次のアドレス計算援助が次の命令フェッチアドレスを計算するために工夫され記憶されることを容易に認識するだろう。
【００２４】
様々な実施例が、語および半語命令長を含む代表的なＩＳＡに関してここに詳説されたが、本発明はこれらの実施例に制限されていない。一般に、どんな可変長命令も予め定められた境界に沿って整列され、命令キャッシュ２２に固定数で有利に記憶され得る。さらに、ここに示されたそれとは異なっているサイズのキャッシュライン２４０、３００が様々な実施例の実行において利用されてもよい。
【００２５】
本発明の実施例は、ここに特別の特徴、その態様および実施例に関して記述されたが、多数の変形、修正および他の実施例が本発明の広い範囲内で可能であることは明白であり、従って、すべての変形、修正および実施例は発明の範囲内であると見なされるべきである。それ故、本実施例は例証され限定的でないものとしてすべての態様で解釈され得、添付請求項の意味および均等範囲内に入るすべての変更は、そこに包含されるように意図される。

【特許請求の範囲】
【請求項１】
キャッシュラインごとに命令の固定数を記憶することを含む、可変命令長を持つプロセッサにおけるキャッシュ管理の方法。
【請求項２】
それらの長さを決定する命令を検査し、キャッシュにそれらを置く前に予め定められた境界に沿って命令を整列させることをさらに含む請求項１の方法。
【請求項３】
各キャッシュラインを用いて次のフェッチアドレスを記憶することをさらに含む請求項１の方法。
【請求項４】
キャッシュに命令を置く前に次のフェッチアドレスを決定することをさらに含む請求項３の方法。
【請求項５】
各キャッシュラインを用いてオフセットを記憶し、オフセットはキャッシュライン・タグに加えられた時、次のフェッチアドレスを生じることをさらに含む請求項１の方法。
【請求項６】
可変長の命令を実行するように作動する命令実行パイプラインと、
キャッシュラインごとに可変長命令の固定数を記憶するように作動する命令キャッシュと、
キャッシュラインに命令を書き込む前に予め定められた境界に沿って可変長命令を整列させるように作動するプレデコーダを含むプロセッサ。
【請求項７】
各キャッシュラインに関連した次のフェッチアドレスフィールドをさらに含む請求項６のプロセッサ。
【請求項８】
プレデコーダがキャッシュラインに書き込まれた最後の命令に従う命令のアドレスを計算し、かつキャッシュラインの次のフェッチアドレスフィールドにアドレスを記憶するように作動する、請求項７のプロセッサ。

【図１】

【図２】

【図３】

【公開番号】特開２０１２−７４０４６（Ｐ２０１２−７４０４６Ａ）
【公開日】平成２４年４月１２日（２０１２．４．１２）
【国際特許分類】

物理学 (1,541,580)
- 計算；計数 (381,677)
  - 電気的デジタルデータ処理 (228,215)
    - メモリ・システムまたはアーキテクチャ内でのアクセシング，アドレ... (20,382)
      - アドレシングまたはアロケーション；リロケーション (4,708)
        
        階層構造のメモリ・システム，例．仮想メモリ・システム，における... (2,277)

【外国語出願】
【出願番号】特願２０１１−２３７３１３（Ｐ２０１１−２３７３１３）
【出願日】平成２３年１０月２８日（２０１１．１０．２８）
【分割の表示】特願２００８−５２４２１６（Ｐ２００８−５２４２１６）の分割
【原出願日】平成１８年７月２６日（２００６．７．２６）
【出願人】（５９５０２０６４３）クゥアルコム・インコーポレイテッド (7,166)
【氏名又は名称原語表記】ＱＵＡＬＣＯＭＭ　ＩＮＣＯＲＰＯＲＡＴＥＤ
【Ｆターム（参考）】

階層構造のメモリシステム (9,317)

[ Back to top ]

可変長命令の固定数を持つ命令キャッシュ

メニュー

スポンサーリンク

次の公報 »

« 前の公報

可変長命令の固定数を持つ命令キャッシュ

メニュー

スポンサー リンク

次の公報 »

« 前の公報

スポンサーリンク