説明

Fターム[5B045GG12]の内容

マルチプロセッサ (2,696) | プログラム、命令の実行処理 (212) | 並列処理 (89) | アレイプロセッサ、行列配置によるもの (29)

Fターム[5B045GG12]の下位に属するFターム

Fターム[5B045GG12]に分類される特許

1 - 20 / 22


【課題】n次元の(トーラスまたはメッシュ)ネットワークを構成している複数のノード(プロセッサ)間において、全対全通信(A2A:all-to-all communication)を含む複数の計算処理を、最適にスケジューリングすること。
【解決手段】ネットワークを構成している複数のノード(プロセッサ)を、第1の部分グループに含まれる複数のノード間のみについての全対全通信に要する通信(計算処理)フェーズ(A2A−L)と、第2の部分グループに含まれる複数のノード間のみについての全対全通信に要する通信(計算処理)フェーズ(A2A−Pとに分け、複数のスレッド(スレッド1、スレッド2、スレッド3、スレッド4)にわたって、それぞれのフェーズをオーバーラップさせて並列処理する。FFT(Fast Fourier Transform)(高速フーリエ変換)やT(transpose)((内部:internal)転置)という複数の計算処理についてもあわせて、並列処理することができる。 (もっと読む)


【課題】容易にカスタマイズ対応可能な半導体集積回路装置を提供する。
【解決手段】アレイ型プロセッサ部(300)は、プロセッサエレメント(330)とプログラマブルスイッチ(320)とを備えるプロセッサユニット(310)をマトリクス状に配置する。プロセッサエレメント(330)は、複数ビット幅の第1演算器(332)と複数ビット幅より狭い所定のビット幅の第2演算器(333)とを有する。第1演算器(332)および第2演算器(333)の接続構成は構成情報メモリ(340)に設定される構成情報に基づいて変更可能である。プログラマブルスイッチ(320)は、配線からプロセッサエレメントに複数ビット幅のデータおよび所定のビット幅のデータを構成情報に基づいて入出力する。制御回路(200)は、内部バス(180)に接続され、アレイ型プロセッサ部(300)の動作を制御し、内部バス(180)を介してデータを授受する。 (もっと読む)


【課題】故障した計算ノードがネットワークに混在する場合にも、シミュレーション対象を分割した各領域を適切な位置関係を有する計算ノードにマッピングする。
【解決手段】並列計算機10は、互いに接続された複数の計算ノードをそれぞれ備える複数の計算ユニット11〜22を有し、各計算ユニット11〜22にそれぞれ含まれる計算ノードを一対一に接続する複数の経路を有するリンクを有する。また、制御装置30は、並列計算機10が有する複数の計算ノードから故障が発生した故障ノードを検出する。また、制御装置30は、並列計算機10が有する複数の計算ノードから検出された故障ノードを除いて、プログラムを実行させる実行ノードを選択する。また、制御装置30は、選択された実行ノードを含む複数の計算ユニットにおいて、隣り合う2つの計算ユニットをそれぞれ接続する複数の経路のうち、故障ノードに接続された経路以外の経路を選択する。 (もっと読む)


【課題】プロセッサの並列アレイ内の処理エレメント間に高度の接続性を提供し、同時に、処理エレメントを相互接続するために必要な配線を最小限化し、かつPE間通信が遭遇する通信待ち時間を最小限化することが可能な重プロセッサアレイのアーキテクチャを提供する。
【解決手段】マニフォルドアレイトポロジは、クラスタ内に配列された処理エレメント、ノード、メモリ等を含む。クラスタは、処理エレメントを物理的に再配列することなく、組織の有利な変更を可能にするクラスタスイッチ配置構成986Aによって接続される。既存アレイ用の相互接続部の一般的な個数をかなり減少させることも達成される。容易なスケーラビリティの追加利益を伴い、高速、効率的、かつコストの点でも効果的な処理および通信が得られる。 (もっと読む)


【課題】粒子相互作用を計算するための並行計算アーキテクチャを提供する。
【解決手段】粒子相互作用を計算するためのアーキテクチャは種々の並行処理を用いる。並行処理は、シミュレーション体積の幾何学的パーティション分割に応じて配列された複数の計算ノードを含む。ノードのそれぞれは、シミュレーション体積の1領域内の粒子に対する粒子データ用の記憶装置を備える。通信システムは、計算ノードを相互接続するリンクを含む。ノードのそれぞれはプロセッサ・サブシステムを含む。分散方式で計算ノードを一緒にまとめたプロセッサ・サブシステムは、粒子相互作用の計算を調整する。 (もっと読む)


マルチコアプロセッサのオンチップネットワークにおける高信頼通信のための技法が提供される。パケットに、パケットについての信頼性要件を定義するタグが付けられる。パケットは信頼性要件に従って経路指定される。信頼性要件および信頼性要件を使用した経路指定は、オンチップネットワークにおける高信頼通信を保証することができる。 (もっと読む)


一般に、分散型プロセッサアーキテクチャにおけるデータマルチキャスティングに関する方法、手順、装置、コンピュータプログラム、コンピュータアクセス可能媒体、処理構成、およびシステムが説明される。様々な実装形態は、ソースから第1のメッセージを受信するように構成された複数のターゲット命令を識別することと、ターゲット命令によって一般に共有される選択された情報を含めて、ターゲット命令のそれぞれに関して第1のメッセージにターゲットルーティング命令を提供することと、識別されたターゲット命令のうちの2つがルータに対して互いに異なる方向に配置されているとき、第1のメッセージを複製して、複製されたメッセージを、識別されたターゲット命令のそれぞれに対して異なる方向にルーティングすることを含むことが可能である。ターゲットルーティング命令を提供することは、ターゲット命令によって一般に共有され、左オペランド、右オペランド、またはプレディケートオペランドとして識別されているビットのサブセットを利用する、選択された情報をさらに含むことが可能であり、ターゲット命令の複数の複数命令サブセットのうちの1つの選択を含むことが可能である。 (もっと読む)


本開示は、概して、マルチノードネットワーク上でデータをルーティングするためのシステムに関する。例示的なシステムは、複数のノードを有するマルチノード配列およびそれらのノードを接続する複数の物理的な通信チャネルを含む。物理的な通信チャネルのうちの少なくとも1つは、データを、第1のノードから複数のノードのうちの2つ以上のその他の送信先ノードにルーティングするように構成され得る。本開示は、概して、マルチノードネットワーク上でデータをルーティングするための方法、ならびにマルチノードネットワーク上でデータをルーティングするための手法を実行するためのコンピュータが実行可能な命令を記憶するコンピュータがアクセス可能な媒体にも関する。
(もっと読む)


【課題】 マルチコア処理アレイの1つ又は複数のコアに、データを効率的にルーティングすること。
【解決手段】
本開示は、マルチコア処理ネットワークにわたりデータをルーティングするためのシステムに関する。このシステムは、複数の処理コアを有するマルチコア処理アレイと、モデル化されるオブジェクトに関連するデータであって、座標システム内のオブジェクトに関連する座標情報に関連付けられたデータを格納するためのメモリと、データが関連付けられた座標情報に基づいてメモリからマルチコア処理アレイの複数の処理コアの1つ又は複数にデータをルーティングするためのコントローラとを含む。本開示はまた、マルチコア処理ネットワークにわたりデータをルーティングするための方法及びマルチコア処理ネットワークにわたりデータをルーティングする手順を実行するためのコンピュータ実行可能命令を格納するコンピュータアクセス可能媒体に関する。 (もっと読む)


【課題】n次元トーラス型分散処理システムにおける転送時間、転送回数を少なくする。
【解決手段】2次元方向に配列された複数のプロセスが、自己が所持するデータの少なくとも一部を、第1方向に隣接するプロセスに順次転送して予め所持していた元データを、第1方向に並ぶ全プロセスに所持させ(S12〜S16)、また、第2方向に隣接するプロセスに自己が所持しているデータの少なくとも一部を順次転送して、直前に行われたデータ転送処理の後に自己が所持していたデータの少なくとも一部を、第2方向に並ぶ全プロセスに所持させる(S18〜S22)。これにより、システム上でのデータ衝突による転送待ち時間の発生を無くすことができる。この場合、n次元(n>2)であっても、前記2方向以外に方向を異ならせながら同様のデータ転送を(n−1)回繰り返すことにより、同様のデータ転送が可能である。 (もっと読む)


- 再設定可能なハードウェアプラットフォームと、- DNA言語として定義されるプログラミング言語のプログラムを実施することで、システムの自己組織化および自己維持を実現するためにプログラミングされるように構成されるセルとして定義される、複数のハードウェアユニットとを備え、各セルは、システム内の他のセルと通信し、システムは、DNA言語からのキーワードを、バイナリDNAコードに変換するコンバータプログラムをさらに含み、自己組織化は、DNAコードが、セルに送信され、セルは、システム内でのその機能を決定することを含み、第1のセルで欠陥が発生し、第1のセルがその機能を停止する場合、システムが、第1のセルがその機能を停止したという情報をセルに送信し、その後、第2のセルが第1のセルの機能を引き受けるために、自己組織化が再び実行されることで、自己維持が実行されるシステムが開示される。
(もっと読む)


【課題】プロセッサの並列アレイ内の処理エレメント間に高度の接続性を提供し、同時に、処理エレメントを相互接続するために必要な配線を最小限化し、かつPE間通信が遭遇する通信待ち時間を最小限化する。
【解決手段】マニフォルドアレイトポロジは、クラスタ52内に配列された処理エレメント、ノード、メモリ等を含む。クラスタは、処理エレメントを物理的に再配列することなく、組織の有利な変更を可能にするクラスタスイッチ配置構成986Aによって接続される。既存アレイ用の相互接続部の一般的な個数をかなり減少させることも達成される。容易なスケーラビリティの追加利益を伴い、高速、効率的、かつコストの点でも効果的な処理および通信が得られる。 (もっと読む)


【課題】個人用に使える安価で高性能な大規模演算用のコンピュータを提供する。
【解決手段】演算対象について所定の演算を行うアプリケーション・プログラムを記憶するメモリと、演算対象の各々の問題領域に対応して隣接する演算装置間で直接データ通信可能に接続されて配置され、またアプリケーション・プログラムの実行に用いられ各々の問題領域に対応した演算を行う演算回路が再構成され、隣接する演算装置間で問題領域についての演算結果データを送受信する複数の演算装置からなる演算装置アレイ40と、アプリケーション・プログラムを実行し、演算装置アレイ40を構成する各演算装置から各問題領域についての演算結果データを取得し、演算対象について演算結果を算出するホストプロセッサと、メモリ、ホストプロセッサおよび演算装置アレイ40との間で、データを通信するバスを備える。 (もっと読む)


実行エンジンは、デジタルデータ処理装置用の新たな機構であり、細粒度構造並列計算の超並列実行に適している。アプリケーションとしては、多くの種類のデジタル信号処理計算、例えばフィルタリング、畳込み及び逆畳込みの計算と、多くの種類線形代数演算、例えば反復及び直接ソルバ、特異値分解及び制約条件最適化の演算とが考えられる。本発明は、通常のデータフロー又はノイマン形コンピュータと比較して、これらの並列構造演算におけるエネルギ効率を改善する。
(もっと読む)


【課題】機械可読媒体において具体化されるデザイン構造を提供する。
【解決手段】このデザイン構造の実施態様はネットワーク・オン・チップ(‘NOC’)を含み、該NOCは、統合プロセッサ(‘IP’)ブロックと、ルータと、メモリ通信コントローラと、ネットワーク・インターフェース・コントローラとを含み、各IPブロックはメモリ通信コントローラとネットワーク・インターフェース・コントローラとを通してルータに適合させられ、各メモリ通信コントローラはIPブロックとメモリとの間の通信を制御し、各ネットワーク・インターフェース・コントローラはルータを通してIPブロック間通信を制御し、該ネットワークはパーティションに組織され、各パーティションは少なくとも1つのIPブロックを含み、各パーティションに1つの独自の物理メモリ・アドレス空間への排他的アクセスが割り当てられ、1つ以上のアプリケーションが該パーティションのうちの1つ以上のパーティション上で実行する。 (もっと読む)


【課題】CNN演算等の、空間的な配置関係に基く階層的な演算処理を、入力データの分割を行うことなく、少ないメモリで実現可能にする。
【解決手段】入力データに演算を施して演算結果を生成する複数の処理ノードが階層的に接続されたネットワーク演算を実行する演算処理装置は、ネットワーク演算を実現するための、前記複数の処理ノードの各々が実行する所定の処理単位の演算の実行順序を規定したシーケンス情報に基づいて、演算処理を実行すべき処理ノードを順次に指定し、指定された処理ノードによる演算処理を上記処理単位で実行して演算結果を得る。そして、演算処理装置は、複数の処理ノードの各々に対してメモリの部分領域をリングバッファとして割り当て、上記処理単位の演算結果の量に対応したメモリ領域を単位としてデータの書き込み先を循環させながら、上記演算結果をメモリに書き込む。 (もっと読む)


処理装置は、各々が1つのインストラクションを実行するよう構成された複数のプロセッサ12と、該プロセッサ間においてデータトークンとコントロールトークンを伝送するためのバス20とを備える。各プロセッサ12は、バスを介してコントロールトークンを受け取ると、そのインストラクションを実行し、インストラクションを実行する際にデータに対して演算を行い、そのデータ対象プロセッサとなるプロセッサ12を特定し、該特定されたデータ対象プロセッサに対して出力データを送信したり、また、コントロール対象プロセッサプロセッサを特定し、該特定されたコントロール対象プロセッサにコントロールトークンを伝達するように配置されている。
(もっと読む)


【課題】複数の演算装置を用いて行列の積を求める並列演算システムで、演算装置間のネットワークの通信路の数を少なくし、経済的なネットワークを構築することを、本発明の目的とする。
【解決手段】本発明の並列演算システムでは、行列Aのm行n列目の成分amn(mは1〜Mの整数、nは1〜Nの整数)の演算を行う演算装置は、成分a(m−1)n(ただし、m−1=0の場合はaMn)、成分a(m+1)n(ただし、m+1=M+1の場合はa1n)、成分am(n−1)(ただし、n−1=0の場合はamN)、または成分am(n+1)(ただし、n+1=N+1の場合はan1)の演算を行う演算装置としか通信しない。したがって、これらの通信路を確保するネットワークを構築する。 (もっと読む)


【課題】マルチプロセッサ環境内のプロセッサ間の通信遅延を最小化し、ベクトル化が単一のプロセッサにもたらすものをマルチプロセッサにもたらす。それは、計算速度を速めるため従来用いられてきた通信の速度を速める類似のツール、即ち、壁時計時間に関してそれらの性能を増すことができるアーキテクチャについて最適な通信アルゴリズムをプログラミングする能力を与える。
【解決手段】論理演算ユニット及び算術演算ユニットの通常の補足に加えて、各プロセッサは、トラフィックをネットワークと、近隣のプロセッサの中の同等のレジスタと直接通信するレジスタとの間で調整するプログラム可能な通信ユニットを含む。これらのレジスタに含まれる通信タスクが、ベクトル・ユニプロセッサ上での通信タスクと同様に実行される。アーキテクチャが均衡化され、そしてハードウエア/ソフトウエアの組み合わせが、任意の数のプロセッサに対してスケーラブルである。 (もっと読む)


【課題】 並列計算機システム全体としてのシステムの拡張性に優れるとともに、システムの拡張に対応させて性能の高速化を実現することが容易な演算処理ユニットを提供すること。
【解決手段】 本発明に係る演算処理ユニット1は、結合網3を介して受信した情報の演算処理を行う演算手段2が結合網3によって互いに等間隔を保ちつつ連結されてトーラス状の結合網3を形成する。結合網3には、隣設された他の演算処理ユニットの結合網と連結してトーラス状の大型結合網を構成することが可能な結合手段4が設けられている。結合手段4は、大型結合網においても演算手段2の間隔を等距離に保つことが可能な位置に配設される。 (もっと読む)


1 - 20 / 22