説明

情報処理装置及び情報処理方法

【課題】キャッシュメモリが無効な状態でキャッシュライン中の複数の要素データをアクセスするロード命令に関し、実行性能を向上させる。
【解決手段】
情報処理装置400は、プロセッサ410、主記憶420、ネットワーク430を備え、主記憶420に記憶された要素データのうち、命令で指定された複数の要素データを1命令でアクセスできるメモリアクセス命令を命令セットに含む。プロセッサ410は、メモリアクセス命令に従って主記憶420にアクセスする場合に、メモリアクセス命令ごとに指定されたキャッシュラインの有効/無効と、当該キャッシュライン中における要素データの有効な数又は位置の少なくとも1つと、に基づいてアクセス対象バンクへの最適なアクセス単位を判定し、当該判定したアクセス単位でメモリアクセスリクエストを生成し、発行するメモリアクセスリクエスト生成発行手段440を備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置及び情報処理方法に関する。
【背景技術】
【0002】
情報処理装置の一種に、キャッシュメモリを有するプロセッサと、1以上のメモリバンクで構成された主記憶と、プロセッサと主記憶とを接続するネットワークと、を備え、メモリアクセス命令として、ベクトルロード命令やベクトルギャザー命令などのベクトル命令を命令セットに含むものがある。
【0003】
ベクトルロード命令は、命令コードと、書き込みベクトルレジスタと、開始アドレスと、ディスタンス(要素間距離)と、を備えて構成され、キャッシュメモリ又は主記憶に記憶された要素データのうち、要素間距離で指定したアドレス間隔で記憶された複数の要素データを、1命令でロードできるようになっている。
【0004】
ベクトルギャザー命令は、命令コードと、書き込みベクトルレジスタと、各要素のアドレスと、を備えて構成され、キャッシュメモリ又は主記憶に記憶された要素データのうち、各要素のアドレスに記憶された複数の要素データを、1命令でロードできるようになっている。
【0005】
プロセッサの命令発行制御部がベクトル命令をデコードすると、アクセス対象となる要素データごとに1つのメモリアクセスリクエストを生成し、発行する。その際、複数のポートから同時に発行することでバンド幅を稼ぐ方法が知られているが、同一メモリバンクへと向かう複数のメモリアクセスリクエストが競合して、性能が低下する可能性がある。こういった同一メモリバンクへ向かうメモリアクセスリクエストの競合を回避するために、同一バンクへ向かうメモリアクセスリクエストを圧縮して発行する方法がとられている(例えば特許文献1参照)。
【0006】
また、通常、キャッシュメモリを備えた情報処理装置では、キャッシュライン単位でメモリバンクごとにメモリインターリーブされており、一般的に、キャッシュライン単位でロードを行うメモリアクセスリクエストを発行する。なぜなら、局所性の原理のために、必要なデータの近傍のデータをまとめてロードしキャッシュメモリに記憶することで、次の命令を処理する際のキャッシュヒットを期待するからである。
【0007】
この仕組みはキャッシュヒット率を向上させるメリットが得られる一方で、キャッシュメモリに記憶しない命令を発行する際には、不要なデータまで読み出すデメリットを抱えている。この問題を解決するために、キャッシュメモリが無効なときには、ワード単位のキャッシュバイパスリクエストを発行する方法がとられている(例えば特許文献2参照)。
【先行技術文献】
【特許文献】
【0008】
【特許文献1】特開2010−218350号公報
【特許文献2】特開2001−154914号公報
【発明の概要】
【発明が解決しようとする課題】
【0009】
上述した特許文献1に例示されるように、キャッシュライン中の複数の要素データをアクセスする命令の実行性能を向上する方法として、同一メモリバンクをアクセスするメモリアクセスリクエストを圧縮して、キャッシュライン単位のメモリアクセスリクエストを発行する方法がある。
【0010】
しかしながら、この方法では、キャッシュメモリが無効な状態でキャッシュライン中の有効要素数が少ないときには、多くの不要なデータを読み出してしまい、ロード実行性能を圧迫する。
【0011】
一方で、上述した特許文献2に例示されるように、キャッシュメモリが無効なときの不要なデータの読み出しを避けるために、ワード単位のキャッシュバイパスリクエストを発行する方法がある。
【0012】
しかしながら、この方法では同一メモリバンクへのアクセスが競合し、効率的ではない。
【0013】
そこで本発明の目的は、これらの問題を解決し、キャッシュメモリが無効な状態でキャッシュライン中の複数の要素データをアクセスするロード命令に関して、その実行性能を向上できる情報処理装置及び情報処理方法を提供することである。
【課題を解決するための手段】
【0014】
本発明の第一の態様に係る情報処理装置は、キャッシュメモリを有するプロセッサと、1以上のメモリバンクで構成された主記憶と、前記プロセッサと前記主記憶とを接続するネットワークとを備え、前記主記憶に記憶された要素データのうち、命令で指定された複数の要素データを1命令でアクセスできるメモリアクセス命令を命令セットに含み、前記プロセッサは、前記メモリアクセス命令に従って前記主記憶にアクセスする場合に、前記メモリアクセス命令ごとに指定されたキャッシュラインの有効/無効と、当該キャッシュライン中における要素データの有効な数又は位置の少なくとも1つと、に基づいてアクセス対象バンクへの最適なアクセス単位を判定し、当該判定したアクセス単位でメモリアクセスリクエストを生成し、発行するメモリアクセスリクエスト生成発行手段を備えることを特徴とするものである。
【0015】
これにより、最適なメモリアクセス単位を判定し、メモリアクセス単位を切り替えてメモリアクセスリクエストを生成・発行することで、キャッシュメモリが無効な状態でキャッシュライン中の複数の要素データをアクセスするロード命令に関して、その実行性能を向上できる。
【0016】
本発明の第二の態様に係る情報処理方法は、情報処理装置における情報処理方法であって、前記情報処理装置は、キャッシュメモリを有するプロセッサと、1以上のメモリバンクで構成された主記憶と、前記プロセッサと前記主記憶とを接続するネットワークとを備え、前記主記憶に記憶された要素データのうち、命令で指定された複数の要素データを1命令でアクセスできるメモリアクセス命令を命令セットに含み、前記プロセッサは、前記メモリアクセス命令に従って前記主記憶にアクセスする場合に、前記メモリアクセス命令ごとに指定されたキャッシュラインの有効/無効を判定するステップと、前記キャッシュライン中における要素データの有効な数又は位置の少なくとも1つと、に基づいてアクセス対象バンクへの最適なアクセス単位を判定するステップと、前記判定したアクセス単位でメモリアクセスリクエストを生成し、発行するステップと、を有することを特徴とするものである。
【0017】
これにより、最適なメモリアクセス単位を判定し、メモリアクセス単位を切り替えてメモリアクセスリクエストを生成・発行することで、キャッシュメモリが無効な状態でキャッシュライン中の複数の要素データをアクセスするロード命令に関して、その実行性能を向上できる。
【発明の効果】
【0018】
本発明によれば、キャッシュメモリが無効な状態でキャッシュライン中の複数の要素データをアクセスするロード命令に関して、その実行性能を向上できる情報処理装置及び情報処理方法を提供することができる。
【図面の簡単な説明】
【0019】
【図1】実施の形態1に係る情報処理装置の構成図である。
【図2】実施の形態1に係る命令発行制御部の動作を示すフローチャートである。
【図3】実施の形態1に係るメモリアクセス単位判定部の動作を示すフローチャートである。
【図4】実施の形態1に係るメモリアクセス単位の判定方法の具体例を示す図である。
【図5】実施の形態1に係るメモリアクセス単位判定部の動作を示すフローチャートである。
【図6】実施の形態1に係るメモリアクセス単位の判定方法の具体例を示す図である。
【図7】本発明の原理を説明するための図である。
【発明を実施するための形態】
【0020】
本発明の実施の形態について説明するのに先立ち、図7を参照して本発明の原理について説明する。
【0021】
図に示すように、情報処理装置400は、キャッシュメモリを有するプロセッサ410と、1以上のメモリバンクで構成された主記憶420と、プロセッサ410と主記憶420とを接続するネットワーク430とを備える。また、情報処理装置400は、主記憶420に記憶された要素データのうち、命令で指定された複数の要素データを1命令でアクセスできるメモリアクセス命令を命令セットに含む。
【0022】
プロセッサ410は、メモリアクセス命令に従って主記憶420にアクセスする場合に、メモリアクセス命令ごとに指定されたキャッシュラインの有効/無効と、そのキャッシュライン中における要素データの有効な数又は位置の少なくとも1つと、に基づいてアクセス対象バンクへの最適なアクセス単位を判定し、その判定したアクセス単位でメモリアクセスリクエストを生成し、発行するメモリアクセスリクエスト生成発行手段440を備えることを特徴とする。
【0023】
これにより、最適なメモリアクセス単位を判定し、メモリアクセス単位を切り替えてメモリアクセスリクエストを生成・発行することで、キャッシュメモリが無効な状態でキャッシュライン中の複数の要素データをアクセスするロード命令に関して、その実行性能を向上できる。
【0024】
実施の形態1.
以下、図面を参照して本発明の実施の形態について説明する。
図1は、本実施の形態に係る情報処理装置の構成を示す図である。
図に示す様に、情報処理装置1は、プロセッサ100と、ネットワーク200と、主記憶300と、を備えて構成されている。
【0025】
本実施の形態に係る情報処理装置1は、メモリアクセス命令を含む命令セットを有している。メモリアクセス命令は、複数の要素データを1命令でアクセスできるものであり、例えば、ベクトルロード命令やベクトルギャザー命令などである。また、情報処理装置1は、キャッシュメモリの有効/無効を、ソフトウェアを用いて指示する仕組みを備えている。
【0026】
プロセッサ100は、演算部110と、命令発行制御部120と、複数のリクエストポート130と、複数のリプライポート140と、キャッシュメモリ(不図示)と、を備えている。本実施の形態では、キャッシュメモリのラインサイズは64Byteとする。
【0027】
演算部110は、レジスタ111に格納されたデータを用いて演算を行う。
【0028】
命令発行制御部120は、プログラム(不図示)の命令を実行順にデコードして、実行に必要な信号を発行する仕組みを備えている。また、命令発行制御部120は、圧縮可否判定部121と、メモリアクセスリクエスト生成発行部122と、を備えている。
【0029】
圧縮可否判定部121は、デコードされた命令がベクトルロード命令などのメモリアクセス命令であった場合に、メモリバンク320のメモリインターリーブ幅内の複数の要素データをアクセスするか否か、を判定する手段である。
【0030】
メモリアクセスリクエスト生成発行部122は、メモリバンク320の幅単位でメモリアクセスリクエストを生成し、リクエストポート130へと発行する部分である。メモリアクセスリクエスト生成発行部122は、アドレス計算部123と、ゾーン情報生成部124と、メモリアクセス単位判定部125と、リクエストパケット生成部126と、を備えている。
【0031】
アドレス計算部123は、デコードされた命令に基づき、アクセス対象となるメモリバンク320について、そのバンクの先頭アドレスを算出する部分である。
【0032】
ゾーン情報生成部124は、デコードされた命令に基づき、ゾーン情報を生成する部分である。ゾーン情報は、バンク内のアクセス対象とする要素データを指定する情報であり、メモリインターリーブ幅内に含まれる要素データに1対1に対応している。
【0033】
メモリアクセス単位判定部125は、キャッシュの有効/無効指示と、ゾーン情報生成部123にて生成したゾーン情報と、に基づいて、各メモリアクセスリクエストの最適なメモリアクセス単位を判定する部分である。メモリアクセス単位判定部125は、各メモリアクセスリクエストがアクセスするメモリバンク320中の要素データについて、その要素データの有効な数または位置を、ゾーン情報を参照して調べ、その結果に応じて、最適なメモリアクセス単位を判定する。
【0034】
リクエストパケット生成部126は、命令種別とメモリアクセス単位判定部125の判定結果に基づいて、各メモリバンク320をアクセスするリクエストコマンドを生成する機能を有する。また、リクエストパケット生成部126は、生成したコマンドに加えて、リクエスト識別に必要な情報と、ゾーン情報生成部124にて生成したゾーン情報と、アドレス計算部123にて算出した先頭アドレスと、を合わせて、各メモリアクセスリクエストに対応したリクエストパケットを生成する部分である。
【0035】
リプライポート140は、ネットワーク200を通して主記憶300から転送されたリプライデータを受け取り、レジスタ111へと転送する部分である。
【0036】
ネットワーク200は、プロセッサ100と主記憶300との間を接続するクロスバスイッチなどを用いて構成されている。ネットワーク200は、プロセッサ100から発行されたメモリアクセスリクエストを、そのリクエストパケット内のアドレスを参照して、該当するメモリバンク320に対応するメモリポート310へと転送する機能や、主記憶300から読み出したデータをリプライポート140へと転送する機能を備えている。
【0037】
主記憶300は、バンク0からバンクNまでの複数のメモリバンク320と、各メモリバンク320に対応するメモリポート310と、を備えて構成されている。本実施の形態では、メモリアクセスの最小単位である要素データのサイズは8Byte、各メモリバンク320に対応するメモリインターリーブ幅はキャッシュラインと同じ64Byteである。また、メモリインターリーブを行うために、複数のメモリバンク320に対して、連続したアドレスを交互に割り当てている(例えば、アドレス0〜63をバンク0に割り当て、アドレス64〜127をバンク1に割り当てる。)。主記憶300は、受け取ったリクエストパケットを参照して、メモリバンク320からデータを読み出し、ネットワーク200を通して、リプライポート140にデータを送信する機能を有する。
【0038】
次に、図2乃至図6を参照して、本実施の形態に係る情報処理装置の動作を説明する。
図2は、プロセッサ100の命令発行制御部120の動作を示すフローチャートである。命令発行制御部120は、図2に示す処理を命令ごとに実行する。
【0039】
まず、命令発行制御部120は、命令のデコードを行う(S101)。デコードした命令がメモリアクセス命令以外の命令である場合(S102でNO)、命令発行制御部120は、メモリアクセス命令以外のその命令に対して、通常と同様の処理を行う(S103)。
【0040】
デコードした命令がメモリアクセス命令である場合(S102でYES)、圧縮可否判定部121は判定を行う(S104)。そして、ゾーン情報生成部124は、各メモリバンク320内のゾーン情報を生成する(S105)。
【0041】
メモリアクセス単位判定部125は、キャッシュメモリの有効/無効指示と、ゾーン情報生成部124が生成したゾーン情報と、に基づいて、各メモリバンク320への最適なメモリアクセス単位を判定する(S106)。
【0042】
ここで、メモリアクセス単位を判定する方法についてより詳細に説明する。メモリアクセス単位を判定する方法としては、有効要素の数に基づいてメモリアクセス単位を判定する方法と、有効要素の位置に基づいてメモリアクセス単位を判定する方法の、いずれか1つを少なくとも採用することができる。
【0043】
まず、図3及び図4を参照して、有効要素数に基づいてメモリアクセス単位を判定する方法を説明する。
図3に示すように、メモリアクセス単位判定部125は、まず、キャッシュメモリの有効/無効の指示を受け、キャッシュメモリが有効であり、キャッシュメモリに格納する場合には(S201でYES)、ラインサイズである64Byteをメモリアクセス単位と判定する(S202)。
【0044】
キャッシュメモリに格納されない場合には(S201でNO)、メモリアクセス単位判定部125は、ゾーン情報に基づいてキャッシュライン中の有効要素の数を調べる。そして、メモリアクセス単位判定部125は、調べた有効要素数が閾値THより大きいか否かを判定する(S203)。閾値THは、ワードサイズ単位で主記憶300から読み出すよりも、ラインサイズ単位で主記憶300から読み出すほうが高効率となる要素数の閾値であり、所定の値が設定される。
【0045】
有効要素数がTHよりも大きな場合(S203でYES)、メモリアクセス単位判定部125は、ラインサイズである64Byteを、メモリアクセス単位と判定する(S204)。有効要素数がTHよりも小さい場合(S203でNO)、メモリアクセス単位判定部125は、ワードサイズである8Byteをメモリアクセス単位と判定する(S205)。
【0046】
図4に、有効要素数に基づくメモリアクセス単位の判定方法についての具体例を示す。
図4では、閾値TH=3となる主記憶300を備えた情報処理装置1が、キャッシュメモリが無効なベクトルギャザー命令を実行する際に、有効要素の数に基づいて最適なメモリアクセス単位を判定し、各メモリポート320へとリクエストを発行するようすを示している。
【0047】
次に、図5及び図6を参照して、有効要素位置に基づいてメモリアクセス単位を判定する方法を説明する。
図5に示すように、メモリアクセス単位判定部125は、まず、キャッシュメモリの有効/無効の指示を受け、キャッシュメモリが有効であり、キャッシュメモリに格納する場合には(S301でYES)、ラインサイズである64Byteをメモリアクセス単位と判定する(S302)。
【0048】
キャッシュメモリに格納されない場合には(S301でNO)、メモリアクセス単位判定部125は、ゾーン情報に基づいてキャッシュライン中の有効要素の位置を調べる。そして、メモリアクセス単位判定部125は、調べた有効要素の位置がゾーン情報の前半に収まっているか否かを判定する(S303)。
【0049】
有効要素がゾーン情報の前半に収まっている場合(S303でYES)、メモリアクセス単位判定部125は、メモリインターリーブ幅の前半をアクセスする32Byteを、メモリアクセス単位と判定する(S304)。
【0050】
有効要素の位置がゾーン情報の前半に収まっていない場合には(S303でNO)、メモリアクセス単位判定部125は、有効要素の位置がゾーン情報の後半に収まっているか否かを調べる(S305)。
【0051】
有効要素がゾーン情報の後半に収まっている場合(S305でYES)、メモリアクセス単位判定部125は、メモリインターリーブ幅の後半をアクセスする32Byteを、メモリアクセス単位と判定する(S306)。有効要素がゾーン情報の後半にも収まっていない場合には(S305でNO)、メモリアクセス単位判定部125は、ラインサイズ単位をメモリアクセス単位と判定する(S307)。
【0052】
図6に、有効要素位置に基づくメモリアクセス単位の判定方法についての具体例を示す。
図6では、閾値TH=3となる主記憶300を備えた情報処理装置1が、キャッシュメモリが無効なベクトルギャザー命令を実行する際に、有効要素の位置に基づいて最適なメモリアクセス単位を判定し、各メモリポート320へとリクエストを発行するようすを示している。
【0053】
図2に戻って説明を続ける。
リクエストパケット生成部126は、メモリアクセス単位判定部125の判定結果を受けて、各メモリバンク320をアクセスするリクエストコマンドを生成する。そして、リクエストパケット生成部126は、アドレス計算部123が算出したアドレスと、ゾーン情報生成部124が生成したゾーン情報と、その他リクエスト識別のための情報などと、をまとめて、対応するメモリバンク向けのリクエストパケットを生成する(S107)。
【0054】
メモリアクセスリクエスト生成発行部122は、リクエストポート130を通して、リクエストパケットをネットワーク200へと発行する。
【0055】
メモリアクセスリクエスト生成発行部122は、これらS105〜S107にかけての処理を、ベクトル長だけ処理できるまでの間、繰り返す。
【0056】
ネットワーク200は、発行されたメモリアクセスリクエストを、そのリクエスト内のアドレスに基づいて特定されるメモリバンク320のメモリポート310へと転送する。
【0057】
主記憶300は、リクエストパケットで指定されたデータを、メモリバンク320から読み出し、ネットワーク200へと転送する。
【0058】
ネットワーク200は、リクエストパケットで指定されたデータを、対応するリプライポート140へと転送する。
【0059】
プロセッサ100は、必要なリプライを受け取ってレジスタ111に格納し、処理を終了する。
【0060】
以上説明したように、本実施の形態によれば、キャッシュライン単位でメモリバンクごとにメモリインターリーブされる情報処理装置1について、キャッシュメモリが無効な状態においてキャッシュライン中の複数の要素データにアクセスするロード命令に関して、命令がメモリインターリーブ幅内の要素データをいくつアクセスするか、または、そのメモリインターリーブ幅内のアクセスする位置を判定することで、該当バンクへの最適なアクセス単位を判定し、そのアクセス単位でメモリアクセスリクエストを生成して発行することで、実行性能を向上することができる。
【0061】
なお、本発明は上記実施の形態に限られたものではなく、趣旨を逸脱しない範囲で適宜変更することが可能である。
例えば、上述した実施の形態では、有効要素数に基づいてメモリアクセス単位を判定する方法と、有効要素位置に基づいてメモリアクセス単位を判定する方法のいずれか1つの方法を採用することができるとして説明したが、本発明はこれに限定されず、両方の方法を採用することもできる。
【0062】
例えば、メモリアクセス単位を判定する方法として、まずは有効要素の位置を判定し、有効要素の位置が前半にも後半にも収まっていない場合には、有効要素数の判定をさらに行う等の方法を採用することもできる。
【0063】
また、有効要素位置に基づいてメモリアクセス単位を判定する方法に関して、上述した実施の形態では、位置の判定基準を前半/後半として、ラインサイズの半分単位に基づいて判定しているが、本発明はこれに限定されず、4分の1単位など、より細かく判定することもできる。
【0064】
また、上述した実施の形態では、キャッシュメモリの有効/無効をソフトウェア指示として説明したが、本発明はこれに限定されず、ページバイパス属性などのHW処理に基づいて判定して行うことも可能である。
【0065】
また、メモリインターリーブ幅はキャッシュライン単位に限定されず、ワード単位よりも大きなブロックサイズでロードを行う装置であれば、本発明と同様の仕組みを実施できる。
【0066】
また、実装の形態として、マルチコアのプロセッサや、メモリコントローラがプロセッサ内に組み込まれた構成であっても、本発明と同様の仕組みを実施することが可能である。
【符号の説明】
【0067】
1 情報処理装置、
100 プロセッサ、
110 演算部、
111 レジスタ、
120 命令発行制御部、
121 圧縮可否判定部、
122 メモリアクセスリクエスト生成発行部、
123 アドレス計算部、
124 ゾーン情報生成部、
125 メモリアクセス単位判定部、
126 リクエストパケット生成部、
130 リクエストポート、
140 リプライポート、
200 ネットワーク、
300 主記憶、
310 メモリポート、
320 メモリバンク
400 情報処理装置、
410 プロセッサ、
420 主記憶、
430 ネットワーク、
440 メモリアクセスリクエスト生成発行手段

【特許請求の範囲】
【請求項1】
キャッシュメモリを有するプロセッサと、
1以上のメモリバンクで構成された主記憶と、
前記プロセッサと前記主記憶とを接続するネットワークとを備え、
前記主記憶に記憶された要素データのうち、命令で指定された複数の要素データを1命令でアクセスできるメモリアクセス命令を命令セットに含み、
前記プロセッサは、
前記メモリアクセス命令に従って前記主記憶にアクセスする場合に、前記メモリアクセス命令ごとに指定されたキャッシュラインの有効/無効と、当該キャッシュライン中における要素データの有効な数又は位置の少なくとも1つと、に基づいてアクセス対象バンクへの最適なアクセス単位を判定し、当該判定したアクセス単位でメモリアクセスリクエストを生成し、発行するメモリアクセスリクエスト生成発行手段を備える
ことを特徴とする情報処理装置。
【請求項2】
前記メモリアクセスリクエスト生成手段は、
前記メモリアクセス命令ごとに指定されたキャッシュラインが無効である場合に、当該キャッシュライン中における要素データの有効な数と所定の閾値との比較結果に応じて、前記アクセス単位を判定する
ことを特徴とする請求項1に記載の情報処理装置。
【請求項3】
前記メモリアクセスリクエスト生成手段は、
前記メモリアクセス命令ごとに指定されたキャッシュラインが無効である場合に、当該キャッシュライン中における要素データの有効な位置に応じて、前記アクセス単位を判定する
ことを特徴とする請求項1又は2に記載の情報処理装置。
【請求項4】
前記メモリアクセスリクエスト生成手段は、前記メモリアクセス命令に基づき、バンク内のアクセス対象とする要素データを指定する情報であって、メモリインターリーブ幅内に含まれる要素データに1対1に対応するゾーン情報を生成し、当該生成したゾーン情報を参照することで、前記キャッシュライン中における要素データの有効な数又は位置を調べる
ことを特徴とする請求項1乃至3いずれか1項に記載の情報処理装置。
【請求項5】
前記メモリアクセス命令は、
ベクトルロード命令又はベクトルギャザー命令の少なくとも1を含む
ことを特徴とする請求項1乃至4いずれか1項に記載の情報処理装置。
【請求項6】
情報処理装置における情報処理方法であって、
前記情報処理装置は、
キャッシュメモリを有するプロセッサと、
1以上のメモリバンクで構成された主記憶と、
前記プロセッサと前記主記憶とを接続するネットワークとを備え、
前記主記憶に記憶された要素データのうち、命令で指定された複数の要素データを1命令でアクセスできるメモリアクセス命令を命令セットに含み、
前記プロセッサは、
前記メモリアクセス命令に従って前記主記憶にアクセスする場合に、前記メモリアクセス命令ごとに指定されたキャッシュラインの有効/無効を判定するステップと、
前記キャッシュライン中における要素データの有効な数又は位置の少なくとも1つと、に基づいてアクセス対象バンクへの最適なアクセス単位を判定するステップと、
前記判定したアクセス単位でメモリアクセスリクエストを生成し、発行するステップと、を有する
ことを特徴とする情報処理方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate