説明

Fターム[5B013AA02]の内容

先行制御 (1,991) | 先行制御 (774) | 命令先取、命令バッファ (334) | オペランド先取、オペランドバッファ (58)

Fターム[5B013AA02]に分類される特許

41 - 58 / 58


制御スペキュレーションの性能を向上するメカニズムが開示されている。そのメカニズムは、スペキュレーティブロードを実行するステップと、そのスペキュレーティブロードがキャッシュでヒットしたとき、前記スペキュレーティブロードによりターゲットとされたレジスタのデータ値を返すステップと、前記スペキュレーティブロードが前記キャッシュでミスしたとき、遅延トークンを前記スペキュレーティブロードと関連づけるステップとを有する。前記スペキュレーティブロードが後で制御フローパスにあると決定されたとき、リカバリーコードの実行を速めるために、キャッシュミスにプリフェッチを発行する。
(もっと読む)


プリフェッチングシステム(400)は、シーケンシャルなプロセスにおいてデータをプリフェッチする(130)ために用いられるストライド値(412)の決定及び変更のヒステリシスを含む。いったんストライド値が決定されると、断続的なストライド非一貫性は無視され(322〜330)、ストライド値はその前の値を保持する。ストライド非一貫性が頻繁になる場合(322〜330)、ストライド値は変更される(230)。変更されたストライド値が繰り返すようになると、上記システムはこの値をストライドとして採用し、後続のストライド非一貫性は再び無視され、その後に保持されるストライド値は、非一貫性が頻繁になるまで、現在の値である。
(もっと読む)


少なくとも1つのマイクロプロセッサ(90)および少なくとも1つの補助演算ユニット(40)を有するデータ処理デバイス(100、100’)、およびデータ処理デバイス(100、100’)によって少なくとも1つの特定の計算を実行する方法を開発して、マイクロプロセッサ(90)による介入なしに複数の計算を順次に実行できるようにするため、少なくとも1つの周辺メモリ(10)、たとえば、少なくとも1つのRAM(ランダム・アクセス・メモリ)、少なくとも1つのROM(読み出し専用メモリ)、または少なくとも1つのEEPROM(電気的に消去可能およびプログラム可能な読み出し専用メモリ)からレジスタをロード可能にすることが提案される。
(もっと読む)


【課題】データエントリをバッファから廃棄するか否かを決定するシステムを提供する。
【解決手段】システムは、データエントリを受信するように構成されたバッファ425と、事前復号論理装置450と、廃棄論理装置435とを含む。事前復号論理装置450は、データエントリに対する第1のセットの廃棄条件に対応する第1の情報を受信し、第1の情報に基づいてデータエントリに対する事前復号された廃棄情報を発生するように構成される。廃棄論理装置435は、事前復号された廃棄情報と、データエントリに対する第2のセットの廃棄条件に対応する第2の情報とを受信し、事前復号された廃棄情報及び第2の情報に基づいてデータエントリを廃棄するか否かを決定するように構成される。 (もっと読む)


【課題】投機フェッチの実行が結果的にメモリアクセスのレーテンシを悪化させることを防ぐこと。
【解決手段】ビジー制御部450が、BUS−SC3−MAC1710の負荷状態を管理し、高負荷になった場合に、投機フェッチ発行部440にBUS−SC3−MAC1710が高負荷であることを通知し、投機フェッチ発行部440が、BUS−SC3−MAC1710が高負荷である場合に、投機フェッチの発行を抑止する。また、投機フェッチの応答データの転送先や待ち合わせ場所を指定して投機フェッチを実行する。 (もっと読む)


【課題】1つの弱いメモリ順序モデルを有するプロセサにおける複数の順序付きメモリ操作の性能改善。
【解決手段】1つの第1メモリ操作に対応する操作順序キュー内の第1エントリに対応する1つの第1順序ベクトルを発生する工程と、第1メモリ操作が完了するまで、1つの後のメモリ操作を完了させないようにする工程とを含む。この方法では、操作順序キューを、例えば1つのロードキューまたは1つのストアキューとすることができる。同様に、1つの第1操作順序キューの1つのエントリに対する順序ベクトルを、1つの第2操作順序キュー内の複数のエントリに基づいて発生できる。更に、このような1つのエントリは、第2操作順序キュー内の1つのエントリを識別する1つの領域を含むことができる。1つの結合バッファを第1操作順序キューに結合でき、複数のあらゆる先の書き込みが視認可能になった時に結合バッファは1つの信号を発生できる。 (もっと読む)


【課題】主記憶装置のデータに対する参照を効率的に制御することができること。
【解決手段】中央処理装置10は、命令の実行順序を変換して処理するアウトオブオーダ処理に基づいて、ロード命令とストア命令とプリフェッチ命令とを少なくとも実行し、有効MIB検出部1041aは、主記憶装置30のデータに対する一次キャッシュ1034の参照要求が保持された一次キャッシュMIB1036の数を検出し、MIB制御部1041cは、検出されたキャッシュバッファの数が所定の数に達した場合に、ロード命令またはストア命令による参照要求をプリフェッチ命令による参照要求に優先して一次キャッシュMIB1036に保持するよう制御する。 (もっと読む)


CPUによってアクセス可能な内部メモリ(5)と外部メモリ(25,26)との間のデータ転送を高速化、高効率化するために、CPUによる特定の命令実行に応答してブロック転送制御部(12)にブロック転送を起動可能にする。特定の命令はそのアドレス指定フィールドで指定されたアドレスが内部メモリにマッピングされたアドレスであるとき当該論理アドレスをデータブロック転送の転送元又は転送先の一方のアドレスとする命令である。内部メモリは仮想アドレス空間の一部に割り付けられ、他方のアドレスとされる外部メモリが割り付けられる物理アドレス空間との対応は、MMUオンの場合にはTLBを用いて、MMUオフの場合には所定のレジスタにより行う。
(もっと読む)


【課題】計算機システムにおいてプロセッサの一時記憶装置に対しデータの先読みを制御する先読み制御装置、方法およびプログラムを提供し、安定かつ効果的な性能向上に寄与すること。
【解決手段】データの先読みを指示する先読み制御装置において、主記憶装置に対するデータアクセスの間隔を表すアクセスヒント情報を取得する手段と、バスアクセス装置によるバスを介したデータの転送における転送遅延時間を表すシステム情報を取得する手段と、アクセス情報が表すデータアクセスの間隔と、システム情報が表す転送遅延時間とに基づいて、先読み単位数を計算する手段と、計算された先読み単位数のデータを当該データについてのデータアクセスに先行して主記憶装置から読み出すとともに一時記憶装置に転送するよう、バスアクセス装置に指示する手段と、を具備する。 (もっと読む)


【課題】
高いクロック速度及び大型の且つ複雑なプロセッサをサポートするプロセッサ設計技法を提供する。
【解決手段】
プロセッサは、異なるアクセス待ち時間を有する複数レベルのレジスタを有する。レジスタの比較的小さいセットが比較的速い高レベルのレジスタ・バンクに含まれ、レジスタの大きい完全なセットが比較的遅い低レベルのレジスタ・バンクに含まれる。物理的には、高レベルのレジスタ・バンクが、そのレジスタから入力を受ける機能的ロジックに近接して設けられる。望ましくは、低レベルのレジスタ・バンクがすべてのプロセッサ・レジスタの完全なセットを含み、高レベルのレジスタ・バンクがレジスタの小さいサブセットを含み、低レベルのバンクにおける情報を複製する。高レベルのバンクは単一のクロック・サイクルでアクセス可能であることが望ましい。 (もっと読む)


ロードオペレーションの投機的な結果をレジスタ値にリンクするためのシステムおよび方法。システム(100)は、第1のアドレス指定パターン(206)および第1のタグ(208)を記憶するように構成されたエントリ(220)含むメモリファイル(132)を有する。メモリファイル(132)は、第1のアドレス指定パターン(206)を、ロードオペレーションの第2のアドレス指定パターン(206)と比較して、一致した場合に、第1のタグ(208)によって識別されるデータ値をロードオペレーションの投機的な結果にリンクするように構成されている。システム(100)は、メモリファイル(132)に結合され、ロードオペレーションに依存する第2のオペレーションを実行する際に、この投機的な結果にアクセスするように構成された実行コア(124)と、メモリファイル(132)に結合され、1つ以上のアドレスの比較を実行することによって、データ値と、ロードオペレーションの投機的な結果とのリンクを検証するように構成された機能ユニット(126)とをさらに有する。
(もっと読む)


明示的ソフトウェア制御がデータスペキュレーションに使用される。明示的ソフトウェア制御(140)は、データスペキュレーションを実行するためのハードウェアの必要性を排除しながら、データスペキュレーションの利益を与えるために、コンピュータプログラムの選択された位置において適用される。コンピュータベースの方法は、第1に、明示的ソフトウェア制御により、アイテム、変数、ポインタ、アドレス、等に対するデータスペキュレーションが必要とされるかどうか判断する(310)。アイテムに対するデータスペキュレーションが必要とされると判断されると、明示的ソフトウェア制御のもとでデータスペキュレーションが実行される(320)。逆に、明示的ソフトウェア制御が、データスペキュレーションが必要でないと判断し、例えば、待ち時間の長い命令の実行により通常得られるアイテムの値が入手できる場合には、アイテムの実際の値を使用してオリジナルコードセグメントが実行される(330)。
(もっと読む)


ヘルパーサブスレッド(140)を伴う単一スレッドコードシーケンスにおけるソフトウェアインストラクションがコンピュータシステム(100)のプロセッサ(170)において実行される。これを実行すると、コンピュータシステム(100)は、例えば、(i)レイテンシの長いインストラクションに関連した情報が入手できるかどうか判断し(310)、そしてデータが入手できないときに、(ii)コンピュータシステムの状態のスナップショットを撮って、そのスナップショットの状態へロールバックするための能力を維持し(321)、(iii)ヘルパーサブスレッドにおけるヘルパーインストラクションを実行し(322)、そして(iv)ヘルパーサブスレッドにおけるヘルパーインストラクションの実行が完了したときにスナップショット状態へロールバックして(323)、実行を継続する(324)ようにさせる。ヘルパーサブスレッドは、例えば、レイテンシの長いインストラクションの完了を待機している間にデータをプリフェッチする。
(もっと読む)


データ処理装置および方法はレジスタとメモリとの間でデータを移動する。データ処理装置は、データ要素を記憶する複数のレジスタを有するレジスタデータ記憶装置を具備する。プロセッサは、レジスタの少なくとも1つにおいてアクセスされる複数のデータ要素について並列にデータ処理操作を実行する。アクセスロジックは、単一のアクセス命令に応答して、指定されたレジスタと、構造体フォーマットを有する構造体の配列としてデータ要素が記憶されるメモリの連続ブロックとの間で複数のデータ要素を移動し、構造体フォーマットは複数の要素を有する。単一のアクセス命令は、構造体フォーマットにおける要素の数を識別し、かつアクセスロジックは、さらに、メモリにおいて構造体の配列としてデータ要素が記憶され、各々の指定されたレジスタが1つの要素のデータ要素を記憶するように複数のデータ要素が移動されるときに複数のデータ要素を再整理する。
(もっと読む)


一実施形態の場合には、データ処理システム(10)は、第1のマスタと、第1のマスタ(12)が使用するために第1のマスタ(12)と結合している記憶回路(35)と、第1のプリフェッチ制限(60)を記憶する第1の制御記憶回路(38)と、プリフェッチ・バッファ(42)と、第1の制御記憶回路、プリフェッチ・バッファ、および記憶回路と結合しているプリフェッチ回路(40)とを含む。一実施形態の場合には、プリフェッチ回路(40)は、第1のプリフェッチ制限が表示する値に最初に設定されたプリフェッチ・カウンタが期限切れになっているかどうかに基づいて、記憶回路からプリフェッチ・バッファ(42)に、所定数のラインを選択的にプリフェッチする。一実施形態の場合には、それ故、第1のプリフェッチ制限を、プリフェッチ・バッファ内のミスの間に発生するプリフェッチの数を制御するために使用することができる。
(もっと読む)


全てのポインタ・ベースのアクセスは、最初にポインタ・レジスタ(200a,200b,200c,200d)に格納されている値が読み出され、次にその値がランダム・アクセス・メモリ(RAM)(104)内の適切な領域のアドレスとして使用されることを必要とする。今日、実施されているように、これは2つのメモリ読み出しアクセス・サイクルを必要とするが、その各々は少なくとも1クロック・サイクルかかり、そのため、この実施は単一サイクル操作を可能にしない。本発明の一実施形態によれば、ポインタの内容を読み出すためにポインタ・メモリ(103a,103b,103c,103d)へのアクセスが実行されるとき、実際に読まれ、ポインタ値を返すのは、シャドウ・メモリである。シャドウ・メモリはポインタ・レジスタ(200a,200b,200c,200d)から構築されるので、読み出しアクセスは、これらのポインタ・レジスタ(200a,200b,200c,200d)からポインタ・アドレス用の適切なデータを1つ選択して、目標ポインタ・アドレスを形成することが必要である。レジスタ・アクセスは純粋に組み合わせ的であり、RAM(104)へのアクセスが必要とするようには、クロック位相関連のタイミングを必要としないので、この目標ポインタ・アドレスはその後、クロックのオーバヘッドなしにRAM(104)にアクセスするためのアドレスとして使用される。
(もっと読む)


計算ユニット、および計算ユニットに結合されるデータ先取りユニットを含む再構成可能なプロセッサであって、データ先取りユニットはメモリからデータを検索し、そのデータをメモリおよびデータアクセスユニットを介して計算ユニットへ供給し、データ先取りユニット、メモリ、およびデータアクセスユニットはプログラムによって構成される。さらに、共通メモリ、および共通メモリに結合される1つ以上の再構成可能なプロセッサを含む再構成可能なハードウェアシステムであって、再構成可能なプロセッサの少なくとも1つはユニットと共通メモリとの間でデータを読み書きするためにデータ先取りユニットを含み、データ先取りユニットはシステム上で実行されるプログラムによって構成される。さらに、再構成可能なプロセッサにおいてメモリとデータ先取りユニットとの間でデータを転送することと、計算ユニットとデータ先取りユニットとの間でそのデータを転送することとを含む、データを転送する方法である。 (もっと読む)


マイクロプロセッサ(100)が、オペレーションを発行するように構成されたスケジューラ(118)を含み、このスケジューラ(118)によって発行されたメモリオペレーションを実行するよう構成された読み出し/書き込みユニット(126C)を含み得る。読み出し/書き込みユニット(126C)は、読み出し/書き込みユニット(126C)に発行されたメモリオペレーションを識別する情報を記録するよう構成される。発行されたメモリオペレーションの1つに関するデータ推測の誤りの検出に応じて読み出し/書き込みユニット(126C)は、スケジューラ(118)に指示を与えることによって、発行されたメモリオペレーションの少なくとも1つをリプレイするよう構成される。スケジューラ(118)は、読み出し/書き込みユニット(126C)によって識別されたメモリオペレーションを応答可能なように再発行するよう構成される。
(もっと読む)


41 - 58 / 58