説明

マルチチッププロセッサ

【課題】
プロセッサコア数を可変とすることによるスケーラブルな演算性能、および自由度が高く再構成可能なプロセッサコア間結合トポロジを特徴とする、組み込み向け低コストマルチプロセッサを実現する。
【解決手段】
少なくともプロセッサコアとメモリとを有するユニットチップを複数積層して構成されるマルチプロセッサであって、前記ユニットチップは、複数のプロセッサコアと、複数のメモリと、前記プロセッサコアと前記メモリとチップ外部との接続関係を設定する構成制御部と、前記プロセッサあるいは前記メモリあるいは前記構成制御部と、積層接続される他のユニットチップとのトランザクションを伝送するチップ接続部とを有する構成とし、前記チップ接続部は当該ユニットチップの辺部に回転対称に配設され、積層構成される前記ユニットチップのいずれかのユニットチップが回転接続されるようにした。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、複数のプロセッサを相互接続したマルチチッププロセッサに関し、特にプロセッサ全体を、機能および接続が変更可能な基本ユニットに分割し、所望のトポロジを備えるプロセッサを実現するように複数の基本ユニットを再構成することを特徴とする。
【背景技術】
【0002】
情報処理プラットフォームとしてのパーソナルコンピュータや各種ディジタル機器の普及にともない、処理対象となるマルチメディアデータの容量爆発が深刻化している。それらのプラットフォームを実現する主要な構成要素であるマイクロプロセッサや組み込みプロセッサに要求される演算性能も飛躍的に高まっている。これに対し、プロセッサ供給元各社は、長らく製造プロセスの微細化によるスケーリング効果を主として動作周波数向上に振り向けることにより、高性能だが消費電力の大きいハイエンドプロセッサを順次市場に投入してきた。
【0003】
ところが、ユーザの環境意識向上、機器に課される省電力技術要件の引き上げといった社会的潮流や、プロセッサチップの熱密度増加にともなう機器の熱設計上の技術制約などにより、近年プロセッサの消費電力が演算性能の向上を律速する傾向が顕著になってきた。
【0004】
このため、現在の高性能化手法は、比較的少数の演算要素(プロセッサコア)を高速で駆動する「高周波数化」から多数のプロセッサコアを低速で並列駆動する「マルチコア化」に移行しつつある。それにともない、消費電力あたりの演算性能(性能電力比)が高く、性能スケーラブルなコンピューティング環境を実現するための要素技術が求められている。
【0005】
ところでプロセッサ、メモリ、各種入出力インタフェースなどの要素回路を多数集積してプロセッサをマルチコア化する手段として、プロセッサ全体を1チップに集積するのではなく、例えば要素回路ごとに独立した複数のチップをパッケージ封止時に配線接続することでシステムを実現するマルチチップモジュール(MCM)技術が一般的に利用されるようになってきた。
【0006】
マルチコア化したプロセッサ技術の一例として、特許文献1がある。
【0007】
【特許文献1】特開2004−164455号公報
【発明の開示】
【発明が解決しようとする課題】
【0008】
上記のマルチチップモジュール技術では、特に小ロットのシステムLSIを低コストに実現する際に有効であるが、性能スケーラビリティやシステム再構成の観点で利用することについてはこれまで試みられていない。
【0009】
本発明は、プロセッサコア数を可変とすることによるスケーラブルな演算性能、および自由度が高く再構成可能なプロセッサコア間結合トポロジを特徴とする組み込み向けマルチプロセッサシステムを、低コストかつ短TATで実現することを目的とする。
【課題を解決するための手段】
【0010】
上記課題を解決するために、本発明のマルチチッププロセッサは、少なくともプロセッサコアとメモリとを有するユニットチップを複数積層して構成されるマルチプロセッサであって、前記ユニットチップは、複数のプロセッサコアと、複数のメモリと、前記プロセッサコアと前記メモリとチップ外部との接続関係を設定する構成制御部と、前記プロセッサあるいは前記メモリあるいは前記構成制御部と、積層接続される他のユニットチップとのトランザクションを伝送するチップ接続部とを有する構成とし、前記チップ接続部は当該ユニットチップの辺部に回転対称に配設され、積層構成される前記ユニットチップのいずれかのユニットチップが回転接続されるようにした。
【0011】
さらに詳しく言えば、前記チップ接続部は、前記プロセッサコアあるい前記メモリとチップ外部とのトランザクションを伝送する第1の接続部と、前記構成制御部とチップ外部とのトランザクションを伝送する第2の接続部とから構成されるようにし、前記第1の接続部は、前記プロセッサコアと前記メモリユニットチップのいずれかとトランザクションを伝送するように、それぞれの辺部に配設され、前記第2の接続部は、前記構成制御部との同じトランザクションを伝送するように、辺部に配設されるようにした。
【発明の効果】
【0012】
本発明によれば、プロセッサの演算機能の選択およびプロセッサコア間接続の再構成が可能な基本ユニットチップを所望のトポロジとなるよう三次元積層することにより、スケーラブルな組み込み向けマルチプロセッサシステムを実現する。この際、システム全体を再設計する必要がないため、低コストかつ短TATという効果が得られる。
【発明を実施するための最良の形態】
【0013】
以下、本発明に係るマルチプロセッサシステムおよびその構成方法の好適な実施の形態について、添付図面を参照しながら説明する。特に制限されないが、本実施例におけるマルチプロセッサシステムを構成する基本ユニットチップは、公知のCMOSトランジスタやバイポーラトランジスタ等の半導体集積回路技術によって、単結晶シリコンもしくはシリコンオンインシュレータ(SOI)のような半導体基板上に形成されている。
【0014】
まず、実施例のマルチプロセッサのシステム構成を説明する。
図8は、マルチプロセッサシステム600(MPS)を概念的に示す。マルチプロセッサシステム600は、プログラムに従い所定の演算処理を実行するプロセッサ群100−1〜100−n(PROC)、プログラムおよび/またはデータが格納された、もしくはシステム外部との入出力を制御する主記憶/入出力群500−1〜500−m(MS/IO)、それぞれ接続インタフェース200−1〜200−n、400−1〜400−mを介して前記プロセッサ群100−1〜100−n、主記憶/入出力群500−1〜500−mの間の相互接続を制御するインタコネクト300(INTC)から構成される。
【0015】
図9、図10には、それぞれインタコネクト300(INTC)の第1および第2の構成例を示す。
図9では、トランザクション流を制御する結合点制御回路310−1〜310−8(NCNT)が接続インタフェース311−1〜311−8を介してリング状に相互接続されている。結合点制御回路310−1〜310−8は、所定のフォーマットをもつトランザクション入力に応答し、当該トランザクションの宛先を識別し、宛先ごとに適切な接続インタフェースを介して当該トランザクションを出力する。
【0016】
図10では、同様にトランザクション流を制御する結合点制御回路312−1〜312−7(NCNT)が接続インタフェース313−1〜313−6を介して二分木状に相互接続されている。一般に、インタコネクトのトポロジは、マルチプロセッサシステム上で主として実行されるアプリケーションの処理性能を最大化するよう固定的に最適化される。
【0017】
図1に、本発明による基本ユニット700(FU)の実施例を示す。基本ユニット700は、プログラムおよび構成信号759に従い所定の処理を実行するプロセッサ要素720、721(PE0、PE1)、それぞれ固有のアドレス空間をもち、プログラムおよび/またはデータが格納されるローカルメモリ740、741(LM0、LM1)、プロセッサ要素720、721とローカルメモリ740、741とを相互接続する内部バス758(IBUS)、構成信号759に従い内部バス758上、および内部バス758と基本ユニット外部との間で発生するトランザクションを調停するとともに、基本ユニット外部、プロセッサ要素720、721およびローカルメモリ740、741との間でトランザクションの伝送を行うバス調停部730、731(ARB0、ARB1)、構成信号759を出力する構成制御部710からなる。
【0018】
プロセッサ要素720、721は、内部接続インタフェース757により直接接続されるほか、それぞれ外部接続インタフェース753、754を介して基本ユニット外部との間で相互にトランザクションを伝送する。バス調停部730、731についても、プロセッサ要素と同様外部接続インタフェース755、756を備え、基本ユニット内外のトランザクションの伝送を行う。
【0019】
構成制御部710は、本実施例における最も特徴的な構成要素である。この構成制御部710は、基本ユニット外部との構成インタフェース751−1〜751−4、752−1〜752−4から入力される所定の構成制御信号に応答し、プロセッサ要素720、721、バス調停部730、731の動作内容を規定する構成信号759を生成する。
【0020】
なお、特に制限されないが、構成制御部710は、構成信号759を一意に決定する1個以上の構成語を内部に保持するための手段を備える。さらに、特に制限されないが、構成インタフェース751−1〜751−4、752−1〜752−4はそれぞれ基本ユニットを実現する半導体チップの四辺および表裏の所定の領域に並列接続される。
【0021】
つぎに、基本ユニット700の主要構成要素および物理実装の詳細について説明する。
図2に、前記構成制御部710内に保持される構成語CFG_WORDのフォーマット、ならびに設定値と動作内容の定義例を示す。構成語CFG_WORDは、それぞれ値を独立に設定可能な2ビットのサブ領域CFG_PE0、CFG_PE1、CFG_ARB0、CFG_ARB1からなる。
【0022】
サブ領域CFG_PE0は、プロセッサ要素720(PE0)の動作内容を定義する。設定値が“00”または“01”の場合、当該プロセッサ要素はローカルメモリ740(LM0)または741(LM1)に格納されたOSやユーザプログラムなど所定の処理を実行(通常動作)し、必要に応じてプロセッサ要素間のトランザクション伝送(通信)の有無を明示することも可能である。設定値が“10”または“11”の場合、当該プロセッサ要素は通常動作を行うのではなく、それぞれ内部接続インタフェース757および外部接続インタフェース755と外部接続インタフェース753との間でトランザクションのバイパスを実行する。
【0023】
サブ領域CFG_PE1は、プロセッサ要素721(PE1)の動作内容を定義する。設定値が“00”または“01”の場合、当該プロセッサ要素はローカルメモリ740(LM0)または741(LM1)に格納されたOSやユーザプログラムなど所定の処理を実行(通常動作)し、必要に応じてプロセッサ要素間のトランザクション伝送(通信)の有無を明示することも可能である。設定値が“10”または“11”の場合、当該プロセッサ要素は通常動作を行うのではなく、それぞれ内部接続インタフェース757および外部接続インタフェース756と外部接続インタフェース754との間でトランザクションのバイパスを実行する。
【0024】
サブ領域CFG_ARB0は、バス調停部730(ARB0)の動作内容を定義する。設定値が“00”、“01”の場合、外部接続インタフェース755からのトランザクションをそれぞれローカルメモリ740(LM0)、741(LM1)へ転送するとともに、ローカルメモリ側で生成されるレスポンストランザクションを外部接続インタフェース755へ転送する。設定値が“10”、“11”の場合、外部接続インタフェース755からのトランザクションをそれぞれプロセッサ要素720(PE0)、721(PE1)へ転送するとともに、プロセッサ要素側で生成されるレスポンストランザクションを外部接続インタフェース755へ転送する。なお、内部バス758上のトランザクションの調停動作は設定値によらず実行される。
【0025】
サブ領域CFG_ARB1は、バス調停部731(ARB1)の動作内容を定義する。設定値が“00”、“01”の場合、外部接続インタフェース756からのトランザクションをそれぞれローカルメモリ740(LM0)、741(LM1)へ転送するとともに、ローカルメモリ側で生成されるレスポンストランザクションを外部接続インタフェース756へ転送する。設定値が“10”、“11”の場合、外部接続インタフェース756からのトランザクションをそれぞれプロセッサ要素720(PE0)、721(PE1)へ転送するとともに、プロセッサ要素側で生成されるレスポンストランザクションを該接続インタフェース756へ転送する。なお、内部バス758上のトランザクションの調停動作は設定値によらず実行される。
【0026】
図3に、代表的な構成語CFG_WORDの設定と、それぞれの設定値に対応する基本ユニット700(FU)の機能を模式的に示す。
【0027】
図4に、基本ユニット700(FU)を半導体基板上に形成した基本ユニットチップのレイアウトを模式的に示す。特に制限されないが、基本ユニットチップは正方形もしくは正方形に近い形状をもち、プロセッサ要素720、721をはじめとする図1に示す基本ユニットの主要構成要素は、基本ユニットチップ中央部の同一符号をもつ領域に形成されているものとする。
【0028】
チップの各辺の周辺部には、90度単位の回転対称となるようレイアウトされチップ間接続を実現する接続領域が形成され、複数チップを90度単位に回転しつつ積層させることができる。特に制限されないが、各接続領域は、基本ユニット外部への論理的インタフェースを実現するレベル変換回路、駆動回路、誘導結合回路など、所定の特性を備えるアナログまたはディジタル回路を含む。
【0029】
接続領域761−1〜761−4、763−1〜763−4は、それぞれ基本ユニットの構成インタフェース752−1〜752−4、751−1〜751−4を論理的にインタフェースする1以上の入出力接続手段を含む。これらの接続領域はすべて並列接続されており、相対的に回転した複数チップ間においても構成制御信号の伝送が可能となるよう、入出力接続手段の配置が決定されている。
【0030】
接続領域762−1〜762−4、764−1〜764−4は、それぞれチップ表面、裏面において基本ユニットの外部接続インタフェース755、756、754、753を論理的にインタフェースする1以上の入力接続手段、出力接続手段を含む。相対的に回転した複数チップ間においてもトランザクションの伝送が可能となるよう、各接続領域内の入力接続手段、出力接続手段の配置が決定されている。
【0031】
図5に、基本ユニットチップの第1の辺における接続領域の第1の実施例を示す。本実施例では、前記接続手段として金属蒸着によるPADの利用を想定している。
【0032】
CIO0、CIO1はともに構成制御信号を伝達する入出力接続手段であり、表面側761−1および裏面側763−1の接続手段は、図示した貫通ビアを介して、もしくは図示しないが当該接続手段をインタフェースする駆動回路765−1(CDRVP)内で論理的に、並列接続される。
【0033】
DO0およびDO1、DUI0およびDUI1、DLI0およびDLI1は、それぞれトランザクションを伝達するチップからの出力接続手段、表面からチップへの入力接続手段、裏面からチップへの入力接続手段であり、表面側762−1および裏面側764−1の出力接続手段は、図示した貫通ビアを介して、もしくは図示しないが当該接続手段をインタフェースする駆動回路766−1(DDRVP)内で論理的に、並列接続される。
【0034】
図6にはさらに、基本ユニットチップの第1の辺における接続領域の第2の実施例を示す。本実施例では、前記接続手段として金属配線により形成された誘導コイルによる磁気結合の利用を想定している。ただし、磁気結合は容易にチップの表裏を貫通するため、接続手段としての誘導コイルはチップ表面にのみ形成されているものとする。
【0035】
CIO0、CIO1はともに構成制御信号を伝達する入出力接続手段であり、駆動回路767−1(CDRVI)によりインタフェースされる。DIO0、DIO1、DIO2、DIO3はトランザクションを伝達する入出力接続手段であり、駆動回路768−1(DDRVI)によりインタフェースされる。
【0036】
ただし、磁気結合を利用した通信においては、磁界の及ぶ限りにおいて、複数チップ上に形成され同軸上に配列された全ての誘導コイルに対するトランザクションのブロードキャストが発生する。このため、前記駆動回路768−1内に複数チップ間での調停手段を設ける、もしくは必要に応じてチップ間に磁気結合を遮断するための磁気シールド手段を挿入することが望ましい。
【0037】
図7に、複数の基本ユニットチップを含むマルチプロセッサシステムの構成例を示す。マルチプロセッサシステムは、ベースチップ800の上に相互に90度ごとに回転した向きにある単一種の基本ユニットチップ900−1〜900−4を三次元積層したものである。
【0038】
ベースチップ800は、基本ユニットチップ群の構成を制御する主構成制御部810、ベースチップ外部との接続を制御する外部インタフェース820、それらを第1の基本ユニットチップ900−1へ接続するための接続領域830、840を含む。
【0039】
以上のように、本発明によれば処理内容および接続関係を適切に構成した単一種の基本ユニットチップを組み合わせることにより、所望の演算性能および接続トポロジを備える組み込み向けマルチプロセッサシステムを再設計することなく低コストかつ短TATで実現できる。
【図面の簡単な説明】
【0040】
【図1】本発明の実施例による基本ユニット(FU)の構成を示す図である。
【図2】構成語のフォーマットおよび動作内容の定義の一例を示す図である。
【図3】基本ユニット(FU)の機能構成例を示す図である。
【図4】基本ユニット(FU)のチップレイアウト例を示す図である。
【図5】接続領域の構成を示す図である。
【図6】接続領域の別の構成を示す図である。
【図7】マルチプロセッサシステムの構成例を示す図である。
【図8】マルチプロセッサシステムの概念を示す図である。
【図9】インタコネクトの構成例を示す図である。
【図10】インタコネクトの他の構成例を示す図である。
【符号の説明】
【0041】
100−1〜100−n:プロセッサ(PROC)、300:インタコネクト(INTC)、500−1〜500−m:主記憶/入出力(MS/IO)、600:マルチプロセッサシステム(MPS)、700:基本ユニット(FU)、710:構成制御部(CFG)、720、721:プロセッサ要素(PE0、PE1)、730、731:バス調停部(ARB0、ARB1)、740、741:ローカルメモリ(LM0、LM1)、800:ベースチップ、810:主構成制御部(CFGC)、820:外部インタフェース(EXIF)、900−1〜900−4:基本ユニットチップ

【特許請求の範囲】
【請求項1】
少なくともプロセッサコアとメモリとを有するユニットチップを複数積層して構成されるマルチプロセッサであって、
前記ユニットチップは、複数のプロセッサコアと、複数のメモリと、前記プロセッサコアと前記メモリとチップ外部との接続関係を設定する構成制御部と、前記プロセッサあるいは前記メモリあるいは前記構成制御部と、積層接続される他のユニットチップとのトランザクションを伝送するチップ接続部と、を有し、
前記チップ接続部は当該ユニットチップの辺部に回転対称に配設され、
積層構成される前記ユニットチップのいずれかのユニットチップが回転接続されることを特徴とするマルチチッププロセッサ。
【請求項2】
請求項1に記載のマルチチッププロセッサであって、
前記チップ接続部は、前記プロセッサコアあるいは前記メモリとチップ外部とのトランザクションを伝送する第1の接続部と、前記構成制御部とチップ外部とのトランザクションを伝送する第2の接続部とから成り、
前記第1の接続部は、前記プロセッサコアと前記メモリユニットチップのいずれかとトランザクションを伝送するように、それぞれの辺部に配設され、
前記第2の接続部は、前記構成制御部との同じトランザクションを伝送するように、辺部に配設されることを特徴とするマルチチッププロセッサ。
【請求項3】
請求項2に記載のマルチチッププロセッサであって、さらに、
前記ユニットチップの構成制御部に接続されて、複数のユニットチップの構成制御をおこなう主構成制御部と、
前記主構成制御部と前記複数のユニットチップとのトランザクションを前記第2の接続部を介してする伝送するチップ接続部と、から成るベースチップを有し、
前記ベースチップに前記ユニットチップが積層されることを特徴とするマルチチッププロセッサ。
【請求項4】
請求項1に記載のマルチチッププロセッサにおいて、
前記チップ接続部は誘導結合回路を含むことを特徴とするマルチチッププロセッサ。
【請求項5】
請求項4に記載のマルチチッププロセッサであって、
前記チップ接続部は積層される他のユニットチップのチップ接続部との結合を遮断するためにシールド部をもつことを特徴とするマルチチッププロセッサ。
【請求項6】
処理要素となる少なくとも一種の半導体チップを複数積層することにより全体もしくは一部を構成するマルチチッププロセッサであって、
前記半導体チップは、チップ間の相互通信を実現する接続手段と、構成情報を保持する構成制御部と、前記構成制御部が出力する構成情報に従い動作内容を設定可能なプロセッサ要素およびバス調停部を備え、
前記チップ間接続手段は、前記半導体チップ上で回転対称なる態様で配置されていることを特徴とするマルチチッププロセッサ。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate


【公開番号】特開2010−108204(P2010−108204A)
【公開日】平成22年5月13日(2010.5.13)
【国際特許分類】
【出願番号】特願2008−279059(P2008−279059)
【出願日】平成20年10月30日(2008.10.30)
【出願人】(000005108)株式会社日立製作所 (27,607)
【Fターム(参考)】