説明

Fターム[5B013DD01]の内容

先行制御 (1,991) | 並列処理 (600) | 同種複数処理機構 (135)

Fターム[5B013DD01]に分類される特許

61 - 80 / 135


【課題】コスト及び消費電力を低減しつつ、並列処理の性能を向上する。
【解決手段】並列プロセッサは、繰り返し指定付きの複合演算命令と同期命令とを有するプロセッサ命令を保持するフェッチユニット20と、プロセッサ命令をデコードするデコーダユニット40と、複合演算命令に基づいて並列に演算を実行し、同期命令に応じてパイプライン接続が制御される複数のパイプライン演算器pipeA、pipeBと、フェッチユニットとデコーダユニットとの間に設けられ、同期命令に応じてパイプライン演算器のパイプライン接続の実行開始タイミングを制御する同期制御ユニット30とを具備する。 (もっと読む)


【課題】複数の処理に要する全体の処理時間を短縮可能な演算処理装置を提供する。
【解決手段】各タスクに属するプロセス毎に、再構成可能回路で使用するエリアが異なる複数のフロアプランレイアウトを記憶しておく。そして、プライオリティが高いタスクの実行対象プロセスから順に、使用エリア数が全分割エリア数を超えるまでプロセスをセットする(S54〜S66)。続いて、セットされたプロセスに対して、使用エリアが重複しないフロアプランレイアウトを選択し(S68〜S74)、対応するコンフィグデータで再構成可能回路を再構成する。 (もっと読む)


【課題】データを右方向パラレルマージシフトする方法を提供する。
【解決手段】右方向シフトマージ演算する方法であって、シフトカウントMを有する右方向シフトマージ命令を受け、指定された第1ソースレジスタから、L個のデータ要素を有する第1オペランドを(L−M)個のデータ要素だけ左にシフトし、第1オペランドのシフトとパラレルに、右方向シフトマージ命令により指定されたセカンダリデータストレージから、L個のデータ要素の第2オペランドをM個のデータ要素だけ右にシフトし、前記シフトされた第1データ要素セットのM個のデータ要素と前記シフトされた第2データ要素セットの(L−M)個のデータ要素を有した結果を生成するため、第1データ要素セットと第2データ要素セットとをマージする。シフトされた第1データ要素セットのM個のデータ要素は、シフトされた第2データ要素セットの(L−M)個のデータ要素と重複しない方法。 (もっと読む)


【課題】レジスタ、演算部などを備えたデータ処理部において、効率的なデータ処理および実装面積の削減を実現した構成を提供する。
【解決手段】レジスタ、演算部などを備えたデータ処理部において、複数の命令テーブルの切り替えや命令の多重化により効率的に命令を実行し、またダブルバッファ構成とした入出力レジスタを利用したデータ格納制御により入出力のオーバーヘッドや命令のレイテンシの解消を図り処理の高速化を実現した。本構成により、命令の圧縮・伸長によるバスバンド幅、外部IO、メモリ容量の小型化が実現され、データ処理部を構成するLSIの論理回路の実装面積の削減、さらに消費電力の低減が実現される。 (もっと読む)


【課題】フロントエンド計算機にFPGA等搭載ボードをPCIバス等で接続して特定方程式の高速計算を実現する。また、計算実行に当たっては、多くの人々が利用しているFortran等から容易に利用可能な仕組みを提供することにより利便性を向上を併せて可能にすることにある。
【解決手段】FPGA等、素子の並列処理機能を利用し、方程式解法に特化・最適化した論理回路を事前編成(n段のパイプラインをM本並列動作可能な状態を準備)させることによって、アプリケーションプログラムから与えられた計算コードの高速計算実現を図る。また、C言語等の高級言語から引数を伴ったサブルーチンコールを実現することにより利便性を高める。 (もっと読む)


【課題】マクロブロックごとの処理を並列に行う複数のプロセシングエレメントがマクロブロックの依存関係に応じた処理を行うことを可能にする。
【解決手段】検出部31がデータ処理部20から処理を終了したマクロブロックのIDを受け取るごとに、選択部32は、マクロブロックの依存関係を示す参照フラグに基づいて、プロセシングエレメント22が処理できる可能性のあるマクロブロックを選択する。
判定部34は、選択されたマクロブロックが未処理の状態であって、かつ、4個の隣接マクロブロックの状態が(1)選択されたマクロブロックによってその隣接マクロブロックの処理結果が参照されない、または(2)その隣接マクロブロックの処理状態が終了である、または(3)その隣接マクロブロックの処理状態が仮処理の状態であって終了としてみなされる、のいずれかであるとき、選択されたマクロブロックは処理できると判定する。 (もっと読む)


【課題】製造コストと消費電力を増大させることなく、しかも演算を効率よく行える半導体装置を提供する。
【解決手段】サイクルごとに第1の演算を行い、前記第1の演算の結果を示す第1のデータと、第1のバリッド信号とを前記サイクルごとに出力する第1の演算エンジン11A〜Eと、前記サイクルごとに第2の演算を行い、前記第2の演算の結果を示す第2のデータと、第2のバリッド信号とを前記サイクルごとに出力する第2の演算エンジン11A〜Eと、前記演算エンジン11A〜E間で前記第1のデータ及び前記第2のデータを受け渡すために用いられ、前記第1のバリッド信号又は前記第2のバリッド信号が第1の値ならば、前記第1のデータ又は前記第2のデータの書込みが可能であり、前記第1のバリッド信号又は前記第2のバリッド信号が第2の値ならば、前記第1のデータ又は前記第2データの書込みを禁止する演算エンジン間バッファ12とを具備する。 (もっと読む)


MIDIボイスのデジタル波形の生成用にスペシャライズされた機械コード命令の組を使用して電子楽器デジタルインターフェース(MIDI)ボイスのデジタル波形を生成すること。例えば、プロセッサは、MIDIボイスのデジタル波形を生成するソフトウェアプログラムを実行することができる。ソフトウェアプログラムの命令は、MIDIボイスのデジタル波形の生成用にスペシャライズされた命令セットからの機械コード命令とすることができる。
(もっと読む)


【課題】負荷を平均化して信頼性寿命を向上出来るプロセッサ及びプロセッサシステムを提供する。
【解決手段】サイクル毎に複数の演算命令を発行可能な演算命令発行部10と、各々が、前記サイクルに応じたパイプライン動作を行う複数の演算ユニット31と、前記サイクル毎にいずれかの前記演算ユニット31を選択し、選択した前記演算ユニット31に対して、前記演算命令発行部10で発行された前記演算命令を割り当てる演算ユニット選択部20とを具備し、前記演算ユニット31は、前記演算ユニット選択部20によって割り当てられた前記演算命令に応じた演算処理を行い、前記演算ユニット選択部20は、直前の前記サイクルにおいて非選択であった前記演算ユニット31を選択する。 (もっと読む)


【課題】
高い計算集約性のワークロードを処理するために、複数のコアレットを結合して単一のマイクロプロセッサ・コアにする構成可能なマイクロプロセッサを提供する。
【解決手段】
上記単一のマイクロプロセッサを形成する手法では、先ず、複数のコアレットにおける2つまたはそれ以上のコアレットを選択し、2つまたはそれ以上のコアレットの資源を結合して結合された資源を形成する。各結合された資源は、個々の各コアレットが利用可能なものより多くの資源を構成する。次に、結合された資源を単一のマイクロプロセッサ・コアに割り当てることによって2つまたはそれ以上のコアレットから単一のマイクロプロセッサ・コアを形成する。なお、結合された資源は単一のマイクロプロセッサ・コアにその専用のものであり、単一のマイクロプロセッサ・コアは専用の結合された資源を用いて命令を処理する。 (もっと読む)


【課題】汎用レジスタを用いないプロセッサを提供すること。
【解決手段】複数のCo−CPUが互いに接続され、複数のCo−CPUが別個の演算を並列に実行するプロセッサが提供される。複数のCo−CPUのそれぞれは、コマンドデコーダ22と、ALU21と、複数のセレクタ23〜36とを含む。コマンドデコーダ22は、コマンドコードをデコードする。セレクタ23〜28は、隣接する複数のCo−CPUからの出力およびMRAMからの出力を受け、少なくとも1つを選択的に出力する。ALU21は、セレクタ27および28からの出力に対してコマンドデコーダ22によるデコード結果に応じた演算を行なう。セレクタ31〜32は、ALU21による演算結果および隣接する複数のCo−CPUからの出力を受け、隣接する他の複数のCo−CPUに選択的に出力する。したがって、汎用レジスタを用いないプロセッサを提供することが可能になる。 (もっと読む)


【課題】共有リソースである演算回路を簡単な手続によって優先的に利用可能にする。
【解決手段】中央処理装置(CPU0,CPU1)と複数の演算回路(FPU0,FPU1)を備え、中央処理装置はフェッチした一の命令に基づいて一の演算回路にコマンドを与え、フェッチした他の命令に基づいて他の演算回路にコマンドを与えることが可能なデータプロセッサ(DPRCS1)に、どの演算回路がコマンドを実行中であるかを示す第1情報と、演算回路にどの中央処理装置から次のコマンドの実行が予約されているかを示す第2情報の格納に利用される記憶回路(BREG,RREG)を設ける。既にコマンド実行中であるときは記憶回路の第2情報を用いて次の演算コマンドの実行を予約することにより、実行終了後、速やかに当該演算回路に演算コマンドを振り当てて実行させることができる。 (もっと読む)


【課題】分岐命令、ループ命令を含む各種計算処理の性能向上を図る。
【解決手段】本発明の例に係る計算機システムは、他と共有しないローカルメモリ110,210,310を有する複数の計算主体100,200,300と、複数の計算主体100,200,300により共有される共有メモリ30とを備える。複数の計算主体100,200,300の各々は、ローカルメモリ110,210,310から共有メモリ30へのデータ更新を一時的に禁止する機能を持つストア制御機構120,220,320を備える。 (もっと読む)


【課題】複数の命令を1のサイクルにおいて実行するプロセッサにおいて、並列処理を行う場合に、実行サイクル数を削減することができるプロセッサ及びコンパイル装置を提供する。
【解決手段】レジスタR0〜R31は、それぞれ上位32ビットの領域と下位32ビットの領域に分かれている。レジスタ書込制御部431は、1のサイクルで発行された各命令における書き込むレジスタと書き込み位置(上位又は下位のいずれか)を示す情報をセレクタ4321、4322へ出力する。セレクタ4321、4322は、それぞれ、第1演算部44、第2演算部45又は第3演算部46から出力される各データのうちいずれか1のデータを選択し、選択したデータをいずれか1のレジスタの上位及び下位へそれぞれ書き込む。 (もっと読む)


【課題】演算処理部の内部処理を動作させる前に入力するパラメータデータを分類することで、効率よく演算処理ができるようにする演算処理装置とその方法を提供する。
【解決手段】演算処理を実行するためのパラメータデータを格納するデータベースからパラメータデータを取得し、タグ値のアドレスに基づいてパラメータデータを分類し、分類により区分けされた区画ごとにパラメータデータを振り分けてデータベースの対象の区画の末尾に追加して格納する分類処理をし、データベースからパラメータデータを取得し、データとタグ値に基づいて予め決められた演算処理をする演算処理方法である。 (もっと読む)


【課題】分岐命令を含むプログラムであって、プログラムの実行期間中の各パスの実行頻度が一定でない場合でも、各プロセッサエレメントの効率的な利用を図ることができるプログラムを提供する。
【解決手段】実行プログラム130の並列実行制御部131は、実行プログラム130が実行されることにより更新されるメモリ300に記憶された実行履歴情報301と総実行回数情報302とに基づき、全パスの総実行回数に対する各パスの実行回数が、パス選択用閾値より大きいパスについての個別パスコードを選択し、ターゲットハードウェアにおいて使用可能なプロセッサエレメント数に応じて、補償パスココード132と選択した個別パスコードとにプロセッサエレメントを割り当て、並列実行させるよう制御し、また、全パスの総実行回数が所定の回数毎に補償パスコードと並列実行させる各個別パスコードの見直しを行う。 (もっと読む)


本発明の方法は、一部の実施形態においては、スレッドを生成する要求を受信する段階と、少なくとも受信した要求に応答してキューに要求を供給する段階とを有する。その方法は、キューに供給された要求の少なくとも一部に応答して複数の命令をフェッチする段階と、複数の命令の少なくとも1つの命令を実行する段階とを更に有する。本発明の装置は、一部の実施形態においては、機械が実行するときにその方法をもたらす命令を記憶している記憶媒体を有する。本発明の装置は、一部の実施形態においては、スレッドを生成する要求を受信し、少なくとも受信した要求に応答してスレッドを生成する要求をキューに供給する回路を有する。本発明のシステムは、一部の実施形態においては、スレッドを生成する要求を受信し、少なくとも受信した要求応答してスレッドを生成する要求をキューに供給する回路と、スレッドについての少なくとも1つの命令を記憶するメモリユニットとを有する。
(もっと読む)


【課題】パックドデータおよび非パックドデータに選択演算を実行する命令の提供。
【解決手段】プロセッサに結合されるメモリ中に、ソースオペランド内の第1のパックドデータと、デスティネーションオペランド内の第2のパックドデータが格納される。プロセッサは、ソースオペランドの制御ビットが「1」に設定される場合に第1のパックドデータを選択し、そのデータをデスティネーションオペランド内に格納する。制御ビットが「1」に設定されない場合、プロセッサはデスティネーションオペランド内のデータを保持する。デスティネーションオペランドの最終値がメモリ内に格納される。 (もっと読む)


【課題】演算処理に要する時間を短縮することでスループットを向上させる。
【解決手段】SIMD演算処理装置は、2つの単位プロセッサ演算ブロックX,Yを備える。制御部1は、プログラムメモリ2に格納される汎用関数を読み出して演算ブロックX,Yに設定する。これと共に、制御部1は、データメモリ3に格納される引数1(0),引数2(0),引数3(0)を演算ブロックXに,引数1(1),引数2(1),引数3(1)を演算ブロックYにそれぞれ供給する。演算ブロックX,Yは、上記汎用関数に基づいて上記供給されたデータに対する演算を並列に実行する。 (もっと読む)


【課題】本発明は、通信回数を増やすことなく、演算装置間のネットワークの通信路の数を少なくすることを目的とする。
【解決手段】本発明の並列演算方法は、N個の演算装置がバラバラに記録しているK次元のベクトルの和を、リング状のネットワークを利用して計算し、結果をN個の演算装置で共有する。具体的には、K個の成分をN個のグループに分け、各演算装置は、1つのグループの成分を隣の演算装置に渡す。受け取った演算装置は自分が保有する当該グループの成分との和を求め、その結果を次の演算装置に渡す。この作業をN−1回行い、N回目からは受け取った演算装置は、当該グループの成分の和として記録すると共に、そのデータを次の演算装置に渡す。この作業を2N−2回目まで行う。 (もっと読む)


61 - 80 / 135