説明

Fターム[5B013DD01]の内容

先行制御 (1,991) | 並列処理 (600) | 同種複数処理機構 (135)

Fターム[5B013DD01]に分類される特許

41 - 60 / 135


SIMD積和演算動作を行うための装置及び方法は、制御信号に応答して多数のデータ要素に対してデータ処理動作を並列に行うSIMDデータ処理回路を含む。命令デコーダ回路は、SIMDデータ処理回路と結合され、プログラム命令に応答して要求される制御信号を生成する。命令デコーダ回路は、入力オペランドとして入力データ要素の第1ベクトル、係数データ要素の第2ベクトル、及び要求される複数の反復を示すスカラー値を有する単一の命令(本明細書では、繰返し積和演算命令と呼ぶ)に応答して、SIMD処理回路を制御する制御信号を生成し、これらの制御信号に応答して、SIMDデータ処理回路は積和演算プロセスの複数の反復を行い、各反復は、N個の積和演算データ要素をもたらすために並列なN個の積和演算動作の遂行を含む。各反復について、SIMDデータ処理回路は、前記第1ベクトルからN個の入力データ要素と、N個の入力データ要素の各々と乗算されるべき第2ベクトルから単一係数データ要素とを求める。積和演算プロセスの最後の反復においてもたらされたN個の積和演算データ要素は、次いで、N個の積和演算結果をもたらすために用いられる。この機構は、例えばFIRフィルタプロセスに要求されるような、SIMD積和演算動作を行うための特にエネルギー効率の良い機構を提供する。
(もっと読む)


【課題】 SIMD型アクセラレータにおいてレジスタ・リネーミングによる性能向上が困難であるという課題を解決する。
【解決手段】 SIMD型アクセラレータを有するプロセッサであって、演算器102と、演算器102にクロスバースイッチ104を介して接続するレジスタファイル101と、演算器の演算結果を格納し、クロスバースイッチを介して演算結果をレジスタファイル101に書き戻すと共に、クロスバースイッチをバイパスするパスを介して演算器に格納データを出力するリネーミングレジスタファイル103を備え、レジスタファイル101の複数のエントリを、リネーミングレジスタファイル103の1つのエントリに同時に割り当て可能とした。 (もっと読む)


【課題】ストールを低減することができる、ベクトル命令を実行するための装置を提供する。
【解決手段】プロセッサは、多数の命令の発行グループを実行するための複数のパイプライン実行ユニット(P0、P1、P2、P3)を有する第1および第2のプロセッサ・コア114と、スケジューリング論理とを有する。スケジューリング論理は、プロセッサが第1の動作モードにある場合、第1の命令発行グループを第1のプロセッサ・コア114に発行して実行させ、第2の命令発行グループを第2のプロセッサ・コア114に発行して実行させる。プロセッサが第2の動作モードにある場合、第1および第2のプロセッサ・コア114に1つ以上のベクトル命令を発行して、同時に実行させる。 (もっと読む)


【課題】SIMDアレイプロセッサの各処理要素(PE)中で条件付き実行をサポートさせる。
【解決手段】汎用フラグ(ACF)(571又は561)は、階層1,2または3ビットエンコーディングを使用して定義され、エンコードされる。加えられた各ビットは、前の機能性のスーパーセットを提供する。ACFの生成(578又は568)は、プログラマによって指定することができる。プログラマが、条件を転送するための処理要素の間の通信インターフェースを使用して、異なるプロセッサ中で生成された条件に基づいて1つのプロセッサ中の条件付き実行を指定することを可能にして、多数のPEは、条件情報を同時に生成することができる。多数のプロセッサアレイ中の各プロセッサは、異なるユニットをそれらのACFに基づいて条件付きで独立に動作させることができる。 (もっと読む)


【課題】Dekkerの方法をSIMD方式の演算において高速に実行すること。
【解決手段】演算処理装置は、加算誤差を使用するプログラムをコンパイルするコンパイラと、コンパイラからの複数の命令を格納する記憶手段と、記憶手段から読み出した命令に基づき、複数の演算を単一の命令(SIMD)で実行する演算器とを有し、演算器は、複数のレジスタからなる第1のレジスタ群及び第2のレジスタ群を有するSIMD用レジスタと、第1のレジスタ群及び第2のレジスタ群から入力される2つの入力値をSIMD方式に基づいて演算する演算手段とを有し、演算手段は、2つの入力値の絶対値を比較し、絶対値の大きい値又は等しい値を第1の値として出力する第1の演算手段と、2つの入力値の絶対値を比較し、絶対値の小さい値又は等しい値を第2の値として出力する第2の演算手段と、第1の値及び第2の値を使用した加減算を実行する第3の演算手段とを有する。 (もっと読む)


【課題】隣接するプロセッサエレメントとのデータ通信が可能なSIMD型マイクロプロセッサにおいて適切なフォワディング制御を行うことができるSIMD型マイクロプロセッサおよび演算方法を提供する。
【解決手段】SIMD型マイクロプロセッサ1のPE3に、自PE内のAレジスタ3hのデータをフォワディング経路に加えて、隣接するPE間でもAレジスタのデータをフォワディングする経路と、それらの経路をGP部2からの制御により選択する第3PEシフト3eと、を設け、GP部2のSCU内の制御回路が先行命令の書き込み先PEと後続命令の読み出し先PEとの距離に応じてフォワディング経路を第3PEシフト3eに選択させる。 (もっと読む)


【課題】リアルタイムな信号処理及び更新のためのマイクロプロセッサ技術
【解決手段】発明は、様々なプログラムアプリケーションのためのソフトウェア計算命令に適応するための柔軟なデータパイプライン構造であって、プロセッサに予めロードされたアプリケーションプログラム内の命令シーケンスに基づいて順番及び長さをクロックサイクルごとの速さで変化させる内部パイプラインステージを伴うプログラマブル埋め込みプロセッサを有するデータパイプライン構造にあり、プロセッサは、上記命令に応じて複数の数学的実行ユニットとメモリユニットとを選択的に且つ柔軟に相互に接続するデータスイッチマトリックスを含み、実行ユニットは、マルチビットの算術演算及び論理演算を異なる精度で且つマルチレベル階層型アーキテクチャ構造で実施するように設定可能である。 (もっと読む)


【課題】動作速度を向上出来る演算器及び半導体集積回路装置を提供すること。
【解決手段】複数ビットを一つのデータ単位S0〜S3とするSIMD命令を、複数の処理サイクルPS1、PS2により実行する演算器10であって、前記データ単位S0〜S3間でのビットの移動を伴うことなく、それぞれ前記データ単位S0〜S3毎に第1演算を行う複数の第1演算部11−0〜11−3と、前記データ単位S0〜S3間でのビットの移動を伴う第2演算を行う第2演算部12とを具備し、前記第1演算と前記第2演算とにより前記SIMD命令が実行され、且つ前記第1演算と前記第2演算とは、互いに1処理サイクル以上のレイテンシを有して実行される。 (もっと読む)


【課題】コンディションコードの数による制限を受けずに条件付きストア命令を実行できるプロセサを提供すること。
【解決手段】条件データを浮動小数点レジスタそのものに格納し、該条件データに基づいて、ストアデータをキャッシュにストアするか否かを判定する条件付き浮動小数点ストア命令を演算部が実行する。 (もっと読む)


【課題】例えばSIMD浮動小数点積和演算等における各種演算組み合わせを少ない命令種別コード数で実現する。
【解決手段】演算装置1が、一の命令における一以上の未使用ビットに、該一の命令によって実行される通常処理とは異なる拡張処理の実行指示をレジスタ11と演算器12b,12eとの少なくとも一方に対して行なう拡張指示情報を設定する設定部20を有する。 (もっと読む)


【課題】本発明は、例えば車両のパワートレーン制御のようなシーケンシャルな演算処理が必要な処理に対しても、処理を分割して高速化できるマルチコアプロセッサ及びこれを用いたエンジン制御装置を提供することを目的とする。
【解決手段】2つのコア61、62を有するマルチコアプロセッサ100であって、
前記コアの前半の演算内容が、取得したデジタルデータのみから演算できる演算内容であり、後半の演算内容が、過去の演算結果も使用する演算内容に分割されていることを特徴とする。 (もっと読む)


【課題】 プロセッサから行列要素を1個ずつしか受け取れない状況でも、行列乗算処理を高速実行可能な行列演算コプロセッサを提供する。
【解決手段】 制御部140は、行列A、Bの乗算結果である行列Qの要素を行毎に順次得るための制御を行う。行列要素レジスタ120は、行列Bの要素を記憶する。制御部140は、行列Qの1行分の要素を累算器111〜114から得るため、累算器111〜114を初期化し、行列Aの1行分の要素をCPU200から1個ずつ受け取る都度、受け取った要素を乗算器101〜104に送るとともに、当該要素を共通の乗算相手とする1行分の要素を行列要素レジスタ120から乗算器101〜104に送って乗算を行わせ、各乗算結果の累算を累算器111〜114に各々行わせる。 (もっと読む)


【課題】 コンフィグにおける全てのコンポーネントのリソース量が少ない場合でも多い場合でも極力コンパイルできるようにする。
【解決手段】 コンフィグで使用される各コンポーネントのリソースを予め想定された割当パターンにより複数の信号処理部へ割り当てる通常アルゴリズムと、該通常アルゴリズムによるコンパイルに失敗した場合に実行され、コンフィグで使用される各コンポーネントのリソースを複数の信号処理部へ最適化して割り当てる最適化アルゴリズムとをコンパイル手段が有している。 (もっと読む)


【課題】SIMD構成と比べて画素値転送量を削減でき、しかも、RCSA構成の問題(H.264のブロック分割に起因するサイクル数の増加)も回避可能な、画像処理装置を得る。
【解決手段】複数の演算素子PEが行列状に配設されたアレイを備え、アレイは、それぞれが所定数の演算素子PEを含む複数のサブブロックSBSAに分割されており、複数のサブブロックSBSAの各々は、自サブブロックと、自サブブロックに隣接する隣接サブブロックとを接続するか否かを選択可能なマルチプレクサ10A,11Aを有しており、処理すべき画像のサイズに応じてマルチプレクサ10A,11Aの設定を切り換えることによって、アレイ内に、一又は複数のサブブロックSBSAを含む一又は複数のブロックを設定可能である。 (もっと読む)


【課題】低開発費、大規模計算用カスタムメイド計算機の提供。
【解決手段】演算部11と、RAM群20,30と、RAM群20,30に対するデータリード/ライト制御を行うRAMIF部12,13とから成る演算基本構成部100によってハードウェア処理化する。各演算部はパイプライン構造を成す。メモリから演算部の周波数で1クロック毎に演算データが入力され、パイプライン通過後の演算結果が1クロック毎に出力される。、RAMIF部12,13は予め決められた所定のスケジュールに従って演算データをRAM群からリードすると共に複数のRAMに分散させながら且つ次段の演算部が演算データを読み込む順序を考慮して複数のRAMに分散してライトする。演算基本構成部を複数組み合わせて大規模な装置を構成するようにしたことにより、専用ボードを開発することなしに大規模計算用カスタムメイド計算機を、低開発費・短期間に開発することができる。 (もっと読む)


【課題】ハードウェアアクセラレータと同期を取る場合に、命令の実行の実時間を最短サイクルで保障することを可能とすることができる演算処理装置を提供する。
【解決手段】本発明のプロセッサは、同時実行可能な命令からなる命令グループを構成する命令を同時に発行し実行するプロセッサであって、前記プロセッサは、特定命令を含むプログラムを実行し、前記特定命令は、前記特定命令を含む命令グループから前記特定命令に後続する命令を除外することと、前記特定命令の発行直後の所定サイクル期間だけ後続する命令の発行を停止することとを指示する。 (もっと読む)


【課題】Out-of-order実行時においてもWAWハザードを効果的に解消することが可能な並列処理機能を有するデータ処理装置を得る。
【解決手段】調停回路1は実行予定書き込み命令の実行順序を示すタイムスタンプ情報決定値TMDを出力する。Sバッファ部5は実行予定書き込み命令の書き込み対象領域において直近に実行された書き込み命令のタイムスタンプ情報決定値を比較用タイムスタンプ情報値TMCとして格納する。タイムスタンプ比較部3は上述したタイムスタンプ情報決定値TMD及び比較用タイムスタンプ情報値TMCを比較し、TMD>TMCの場合、WAWハザードは生じないと判断して書き込み許可を指示する制御信号S3を出力し、TMD<TMCの場合、WAWハザードが生じると判断して書き込み不許可を指示する制御信号S3を出力する。 (もっと読む)


【課題】ベクトルマスク処理命令を高速に処理すること。
【解決手段】本発明に係るベクトル処理装置100は、命令の制御を行う命令制御部2と、情報を保持しておく主記憶部3と、複数のベクトルレジスタ4、複数の演算器5、該演算器5とベクトルレジスタ間を接続する複数のクロスバ6、及びベクトルマスク情報を格納しベクトルマスク処理命令を処理するベクトルマスク情報部7を有する複数のベクトルパイプライン処理部1と、ベクトルパイプライン処理部1間を接続して処理を行うベクトルパイプラインクロスバ9とを備え、ベクトルマスク情報の更新命令の際に、ベクトルマスク情報の内の各部分のベクトルマスク情報について、複数のベクトルパイプライン処理部1がそれぞれベクトルマスク処理を先行して実行し、該部分処理結果を格納し、格納された部分処理結果を用いて、ベクトルマスク情報を処理するものである。 (もっと読む)


本開示は、第1スレッドに関連付けられた第1レジスタファイルと、第2スレッドに関連付けられた第2レジスタファイルとを含むマルチスレッドプロセッサを含む。少なくとも1つのハードウェアリソースは、第1及び第2レジスタファイルによって共有される。さらに、第1スレッドは、第2スレッドにシーケンシャルでないパイプラインアクセス位置を有し得る。複数のレジスタファイルにアクセスする方法も開示される。方法は、第2レジスタファイルからデータを読むことと同時に、第1レジスタファイルからデータを読むことを含む。第1レジスタファイルは第1命令ストリーム関連付けられ、第2レジスタファイルは第2命令ストリームに関連付けられる。第1命令ストリームは、プロセッサの実行パイプライン内の第2命令ストリームにシーケンシャルであり、第1レジスタファイルは第2レジスタファイルに対して隣接しない位置にある。 (もっと読む)


【課題】コスト及び消費電力を低減しつつ、並列処理の性能を向上する。
【解決手段】並列プロセッサは、繰り返し指定付きの複合演算命令と同期命令とを有するプロセッサ命令を保持するフェッチユニット20と、プロセッサ命令をデコードするデコーダユニット40と、複合演算命令に基づいて並列に演算を実行し、同期命令に応じてパイプライン接続が制御される複数のパイプライン演算器pipeA、pipeBと、フェッチユニットとデコーダユニットとの間に設けられ、同期命令に応じてパイプライン演算器のパイプライン接続の実行開始タイミングを制御する同期制御ユニット30とを具備する。 (もっと読む)


41 - 60 / 135