説明

コンピュータシステム装置における全光高速分散アービトレーション

本発明の種々の実施形態は、コンピュータシステム装置においてフォトニック相互接続を介して通信可能に結合されたコンピュータシステムの構成要素(1801-1804)に対する全光分散アービトレーションのためのシステム及び方法に向けられている。コンピュータシステムにおける光アービトレーションの実施形態は、固定された優先順位(2000)及び非固定の優先順位(1830,2200)を有するアービトレーション方式を提供する。非固定の優先順位方式の実施形態は、アービトレーションに公平さをもたらすことができる。いくつかの実施形態では、光パワーの配送とアービトレーションが結合される(1830,2001)。

【発明の詳細な説明】
【技術分野】
【0001】
本発明の実施形態は、コンピュータシステム装置内のリソースに対するアービトレーションに関し、特に、コンピュータシステム装置内のコンピュータシステムの構成要素間の通信を提供するフォトニック相互接続(光相互接続ともいう)における光チャンネルに対するアービトレーションに関する。
【背景技術】
【0002】
1960年代中頃、半導体メーカーは、集積回路上に作製されるトランジスタなどの回路の密度がおよそ18ヶ月毎に2倍になることに気付いた。この傾向はその後も継続し、現在、「ムーアの法則」と呼ばれている。トランジスタの密度は、コンピュータの処理能力(これは、データ処理速度に対応する)の大まかな尺度と見なされている。ムーアの法則は、元々は、観察から得られたものであるが、時が経つにつれて、コンピュータ処理能力を高める根本的な推進力として半導体業界によって広く受け入れられるようになってきた。結果として、半導体メーカーは、チップ構成要素のサイズをマイクロスケール、さらには、ナノスケールの寸法にまで小さくするための技術を開発してきた。コンピュータシステム(いくつかの例は、メモリモジュールシステム、単一のコアプロセッサデバイス、マルチコアプロセッサデバイスである)のコンピュータシステムアーキテクチャは、ムーアの法則に遅れずについて行こうとする一方で、いくつかの制約に遭遇している。
【0003】
マルチコアシステムの例は、遭遇した問題のいくつかを例示する。近年、半導体業界は、「コアズ(cores)」と呼ばれる2つ以上のサブプロセッサからなるプロセッサを開発した。たとえば、デュアルコアプロセッサは2つのコアを含み、クワッドコアプロセッサは4つのコアを含んでいる。典型的には、それらのコアは、一体化されており、システムの残りの部分への同じ相互接続を共用し、独立して動作することができる。半導体メーカーは、単一コアのトランジスタ密度を大きくすることができるが、電力消費の効率が悪いために、半導体メーカーは、その方向には向かっていない。他の選択肢は、単一のダイにパッケージ化されるコアの数を増やすことである。ダイは、半導体材料の単一の層であり、該層の上に集積回路(「チップ」)が作製される。しかしながら、オンチップ(チップ上)とオフチップ(チップ外)との通信が、これらのマルチコアチップが必要とされる、要求がきびしく、データ集約型の用途に対して性能の向上を持続することに対する重大な問題として現れてきた。計算(またはコンピュータ)帯域幅は、コアの数の増加に対して直線的に大きくなるが、最上級の金属線を用いてマルチコアチップを横断して通信することができるデータレート(データ転送速度)の向上のペースはそれよりはるかに遅い。さらに、チップエッジに沿って配置されたピンを通じてチップ外へデータを通信することができるデータレートの高速化のペースは計算帯域幅の拡大のペースよりも遅く、オンチップとオフチップの通信のエネルギーコストは、利用可能な帯域幅を大きく制限する。その結果、コンピュータアーキテクチャは今や交差路にあり、物理学者やエンジニアは、オンチップとオフチップとの通信用に金属線を使用することに代わるものを探し求めている。
【0004】
チップ上のコアなどのコンピュータシステムの構成要素は、共通の相互接続を介して互いに通信し、及び、リソース(資源)を共用している。衝突を回避するための1つのメカニズムは、アービトレーションメカニズム(または調停機構)を使用することであり、該メカニズムによって、それらの構成要素は、任意の所与の時間にどの構成要素がリソースにアクセスできるかを決定することができる。
【発明の概要】
【発明が解決しようとする課題】
【0005】
共用されているリソース に対するアービトレーションは、多くのシステムの性能にとって重要であるが、それにもかかわらず、リソースに対する多くの要求者間の効率的なアービトレーションは、プロセッサのクロックサイクルに比べて非常に遅い場合が多い。さらに、プロセッサのクロック周波数が高い場合に、中程度に複雑な電気的実施では、アービトレーションは大量の電力を消費する可能性がある。
【0006】
唯一のセンダー(送信側)を各出力ポートに割り当てるためにN入力、N出力のクロスバーを制御することは、コンピュータネットワーキングの標準的な問題である。通常のハードウエアソリューションは、仮想出力キュー(VOQ)を有するシステム用に設計されており、この場合、各センダーは、1つの受信機に1つのVOQを有している。可能性のある最良のソリューションを、2つの部分に分かれたグラフの最大マッチングを求めるHopcroft-KarpアルゴリズムによるO(N2.5)時間のオフライン順序アルゴリズム(またはオフライン逐次型アルゴリズム)によって計算することができるが、これは、クロスバーアービトレーション方式として使用するにはあまりに遅すぎる。代わりに、電子制御式ネットワークスイッチファブリックに対して、オンライン−並列−繰り返し方式が用いられる。多数回の繰り返しプロセスの各回において、センダーは、受信機に送信する権利を要求し、アービター(調停手段)は、これらの要求のうちのいくつかに応答して(要求された権利の)認可を送信し戻し、これらの認可のいくつかが受け取られる。最大マッチングはO(log2(N))回で達成される。必要な時間は、典型的には、数十マイクロ秒である。
【0007】
システムと同じ速度でタスクを実行できるアービトレーション方式であって、該システム内でボトルネックになることを回避するように動作し、かつ、電力が小さいアービトレーション方式が望ましい。複雑度が低いこともアービトレーションシステムにとって望ましい特徴である。
【課題を解決するための手段】
【0008】
本発明の種々の実施形態は、コンピュータシステム装置においてフォトニック相互接続を介して通信可能に結合されたコンピュータシステムの構成要素に対する全光分散アービトレーションのためのシステム及び方法に向けられている。コンピュータシステムにおける光アービトレーションの実施形態は、アービトレーション方式に、固定された優先順位と固定されていない優先順位を提供する。固定されていない優先順位方式による実施形態は、アービトレーションに公平さをもたらすことができる。いくつかの実施形態では、光パワーの配送とアービトレーションが組み合わされる。
【図面の簡単な説明】
【0009】
【図1】本発明の実施形態にしたがうスタックされた(積み重ねられた)コンピュータ装置の断面図である。
【図2】本発明の実施形態にしたがうコンピュータ装置の構成要素の略図である。
【図3】本発明の実施形態にしたがう、図1に示すコンピュータ装置の4つのダイ層の組立分解等角図である。
【図4A】本発明の実施形態にしたがうプロセッサダイのクラスター(集団)を示す。
【図4B】本発明の実施形態にしたがう、タイル状に区切られたメモリダイを示す。
【図5】本発明の実施形態にしたがう、図4Aに示すクラスターの構成要素と図4Bに示すタイルの構成要素との間の相互作用を表す略図である。
【図6】本発明の実施形態にしたがう、図1に示すコンピュータ装置の4つのダイ層の拡大組立分解等角図である。
【図7A】本発明の実施形態にしたがう光学(optical die)ダイの略図である。
【図7B】本発明の実施形態にしたがう、図7Aに示す光学ダイのある領域の拡大図である。
【図7C】本発明の実施形態にしたがう、図7Bに示す線7C−7Cに沿ったオンチップリッジ導波路の一部の断面図である。
【図7D】本発明の実施形態にしたがう、2つのほぼ平行なフォトニック結晶導波路の一部の上面図である。
【図8】本発明の実施形態にしたがう電磁放射源の略図である。
【図9A】本発明の実施形態にしたがう2つの光電子変換器の一方の略図である。
【図9B】本発明の実施形態にしたがう2つの光電子変換器の他方の略図である。
【図10】本発明の実施形態にしたがう光電子変換器の変換器ブロックの構成要素の略図である。
【図11】本発明の実施形態にしたがう光電子変換器のデータ/制御ブロックの略図である。
【図12】発明の実施形態にしたがう3つのデータ/制御ブロックの略図である。
【図13】発明の実施形態にしたがう、拡張されて束にされた導波路変調器/検出器の略図である。
【図14】発明の実施形態にしたがうオフチップ通信ハブを示す。
【図15】発明の実施形態にしたがう同報通信(一斉送信)を示す。
【図16A】本発明の実施形態にしたがう、符号化されていないチャンネルのデータを符号化するために使用される導波路−マイクロリングシステムを示す。
【図16B】本発明の実施形態にしたがう、導波路から符号化されたチャンネルを抽出するために使用される導波路−マイクロリングシステムを示す。
【図17】本発明の実施形態にしたがうマイクロリングの略図である。
【図18A】本発明の実施形態にしたがう、例示的な4クラスタ型のスタックされたコンピュータ装置の略図である。
【図18B】本発明の実施形態にしたがう、図18Aに示すアービトレーションシステムの略図である。
【図19】本発明の実施形態にしたがうアービトレーションシステムを示す。
【図20A】優先準位付け方式が固定された(公平ではない)本発明の別の実施形態にしたがう全光アービトレーションシステムの略図である。
【図20B】アービトレーションシステムの実施形態の別の変形形態であって、データ転送などのフォトニック相互接続の別の機能部への光パワーの配送がアービトレーションと結合されるか組み合わされる変形形態を示す。
【図21】アービトレーション方式を利用できるアービトレーションシステムの略図であり、このアービトレーション方式は、使用される導波路の数を増やすことなく、複数のコンピュータシステムの構成要素に、複数の受信構成要素へのアクセスを与えることができる。
【図22】本発明の1実施形態にしたがう別のアービトレーションシステムの略図である。
【発明を実施するための形態】
【0010】
本発明の種々の実施形態は、コンピュータシステムの構成要素間に通信を提供するフォトニック相互接続という面において全光アービトレーションシステム及びその方法に向けられている。これらのフォトニック相互接続は、電気的な対応物よりも高速であるので、アービトレーションシステムがボトルネックとなる必要がない。全光アービトレーションシステムは、通信速度と同等の(または同じ)速度でアービトレーションを実行できるのが望ましい。例示を目的として、コンピュータシステム装置の実施形態は、本発明のアービトレーションシステムの種々の側面を例示するためのコンテキスト(場面や状況など)を提供するために記述される。しかしながら、本発明にしたがう全光アービトレーションシステムは、記述されているフォトニック相互接続の実施形態の特定の細部には限定されない。
【0011】
フォトニック相互接続
これらのフォトニック相互接続は、コンピュータシステムの構成要素(たとえば、コア、クラスター、メモリコントローラ)間のオンチップフォトニック相互接続を提供する。さらに、フォトニック相互接続のいくつかの実施形態は、外部の装置(またはデバイス)にあるコンピュータシステムの構成要素に対するオフチップフォトニック相互接続も提供する。本発明のいくつかの実施形態は、典型的には、寸法が、1波長より小さい、または、1ミクロンより小さい構成要素を含むナノフォトニック構成要素を有するフォトニック相互接続も含む。
【0012】
これらのフォトニック相互接続は、チップエッジに沿って配置された従来のピンよりも速い速度でオフチップ(すなわちチップ外)とのデータ通信を行うことができ、より大きな計算帯域幅を提供でき、従来の金属線よりも低いエネルギーコストでオンチップ及びオフチップ通信を提供でき、及び、追加の構成要素(たとえば、任意の数のコアを有するプロセッサ)を収容するために拡張または縮小されることができる。フォトニック相互接続のアーキテクチャを、無閉塞で待ち時間の短い再構成可能なナノフォトニックマイクロリングで実施することができ、高帯域幅、適度な待ち時間、及び、非常に小さな電力消費を(計算帯域幅が最大のときにおいても)提供することができる。さらに、全てのメモリがメモリコントローラまたはプロセッサに近接するように、コンピュータシステム装置のアーキテクチャを構成することができる。本発明の実施形態にしたがって構成された光学ダイを利用するマルチコアベースのコンピュータ装置は、約20テラバイト/秒で動作することができる。
【0013】
以下の説明では、「フォトニック」及び「フォトニック的に」という用語は、電磁スペクトルの可視部分だけに限定されない波長を有する古典及び/または量子化ERで動作する装置を指している。下記の種々のフォトニックスイッチ及びスイッチ構成の実施形態では、同じ材料から構成されるいくつかの構造的に類似した構成要素には同じ参照番号が付されており、簡潔にするために、それらの構造及び機能の説明は繰り返されない。
【0014】
マルチコア型スタック構成コンピュータ装置
図1は、本発明の実施形態にしたがう、フォトニック相互接続を利用するマルチコア型スタック構成のコンピュータ装置である例示的なコンピュータシステム装置(「コンピュータ装置」)100の断面図である。コンピュータ装置100は、プロセッサダイ102、メモリコントローラ/ディレクトリ/L2ダイ(「メモリコントローラダイ」)104、アナログ電子ダイ106、光学ダイ108、及び、パッケージ116内にスタックされた(すなわち、積み重ねられた)4つのスタック構成メモリダイ110〜113を備える。スタック構成メモリダイ110〜113を、ダイナミックランダムアクセスメモリ(「DRAM」)などの揮発性メモリ、または、不揮発性メモリ、または、揮発性メモリと不揮発性メモリの任意の組み合わせとすることができる。具体的には、スタック構成メモリダイ110〜113を8ギガバイト(GB)DRAMとすることができる。コンピュータ装置100はまた、プロセッサダイ102の上面に配置されたヒートシンク118、及び、4つのスルーバイア(through via:貫通ビア)120〜123によって表されている多数(たとえば数百個の)バイアを有し、これらのバイアは、メモリコントローラダイ104からアナログ電子ダイ106及び光学ダイ108を通って4つのメモリダイ110〜113まで延在する。
【0015】
ダイ102、104、106、108、110〜113の厚さは、約25ミクロン〜約50ミクロンの範囲をとることができる。ヒートシンク118は、プロセッサダイ102の計算(または演算)処理によって生成される熱を消散し、スルーバイア120〜123を、メモリダイ内のメモリコントローラを4つのメモリダイ110〜113の各々に電気的に相互接続する、金属製の(または金属で被膜された)バイアまたはシリコンが充填されたバイアとすることができる。メモリコントローラダイ104内に配置されたメモリコントローラは、メモリダイ110〜113に対して出入りするデータの流れと外部装置(不図示)に対して出入りするデータの流れを管理する。光学ダイ108は、外部フォトニック相互接続124及び126などの外部フォトニック相互接続を含むようにするために他のダイよりも大きい。この外部フォトニック相互接続は、データ符号化された電磁放射をコンピュータ装置100へと及びコンピュータ100から送信するために使用されることができる。光学ダイを約24mm×24mmのサイズとすることができるが、これらの寸法を実施例に応じて変更することができる。光学ダイ108の底面とメモリダイ110の上面との間にダイヤモンド層130を含めることもできる。ダイヤモンド層130を、約1〜10μm(マイクロメートル)の厚さとすることができ、プロセッサダイ102及びメモリコントローラダイ104によって生成される熱を拡散して消散するために使用することができる。
【0016】
図1に示す3次元ダイスタック構成は、光学ダイ108を電子ダイ102及び104に密接に結合(または密結合)することができ、短い待ち時間でのメモリダイ110〜113のアクセスを提供し、クラスターロジック及びメモリをスタックされた隣接するダイ102、104、及び110〜113上に広く分布させることにより、クラスター内の電気配線が従来の装置(またはデバイス)よりも短くなる。具体的には、メモリダイをメモリコントローラに近接してスタックし、及び、メモリ層を貫通するバイアを使用することによって、従来のメモリをメモリコントローラに接続するために使用される長さがかなり長く、抵抗がかなり高い相互接続よりも、長さが短く抵抗が小さい相互接続が提供される。その結果、コンピュータ装置100のダイ間で電気信号を伝送するために必要な電力、すなわち負荷が、従来のメモリ−メモリコントローラが必要とする電力よりも大幅に小さい。
【0017】
図2は、本発明の実施形態にしたがって相互接続されたコンピュータ装置100のダイ102、104、108の構成要素の略図である。プロセッサダイ102はマルチコアプロセッサであり、それらのコアを、クラスター202〜204によって表されているように、各々が4つのコアからなるクラスター(集団)に配置することができる。各々のコアは、図4を参照して後述する、専用の第1レベル(「L1」)命令キャッシュ(不図示)と専用のL1データキャッシュ(不図示)を有する。クラスター202〜204の各々は、L2キャッシュ206〜208によって表されている専用の共用の第2レベル(「L2」)キャッシュと、メモリコントローラ210〜212によって表されている関連するメモリコントローラを有する。メモリコントローラ210〜212は、それぞれ、クラスター202〜204へのデータの流れ及びクラスター202〜204からのデータの流れを制御する。L2キャッシュ及びメモリコントローラは、プロセッサダイ102に隣接するメモリコントローラダイ104に配置されている。図2に示すように、光学ダイ108のフォトニック相互接続214は、クラスター202〜204に関連するL2キャッシュ206〜208が、互いに、及び、メモリコントローラ210〜212とフォトニック的に通信(すなわちフォトニック通信。光子通信または光通信ともいう)できるようにするフォトニック相互接続を提供する。図2は、また、メモリコントローラ210〜211が、オフチップ(すなわちチップ外)のデュアルインラインメモリモジュール(「DIMM」)216〜218などの外部のメモリモジュールとフォトニック通信できることを明らかにしている。クラスター202〜204は、それぞれ、DIMM216〜218と電子的通信またはフォトニック通信を行うことができる。
【0018】
プロセッサダイ102の各クラスターは、メモリコントローラダイ104に配置された対応するメモリコントローラを有しており、各メモリコントローラは、スタック構成のメモリダイ110〜113にインターフェース(または接続)するか、または、オフチップメモリへのフォトニック接続を駆動して、プロセッサダイ102の性能に応じて拡大または縮小する帯域幅を提供する。クラスターはまた、光学ダイ108を介して互いにフォトニック的に結合(すなわちフォトニック結合)し、高帯域幅、適度な(またはそれほど長くない)待ち時間、及び、非常に小さな電力消費を提供する。したがって、自由に使えるスタック構成コンピュータ装置100を有するプログラマーは、並列処理を高レベルで表現することができ、局在性の問題によって悩まされることはなく、これによって、並列プログラム開発の難しさが大きく軽減される。さらに、コンピュータ装置100のアーキテクチャは、フロップ(浮動小数点演算)毎に1バイトの帯域幅をDRAMに提供することができる。
【0019】
メモリダイ110〜113の各々に対して8GB(ギガバイト)DRAMが選択された場合には、オンスタックメモリは32ギガバイトのDRAMを提供し、該DRAMは、該DRAMを貫通するバイア120〜123などの複数のバイアを介してメモリコントローラに直接接続される。DRAMは、4つのメモリスタック層によって提供され、バイアの負荷(ローディング)を最小にするために、すなわち、バイアを使用するために必要な電力量を最小にするために、約25〜50ミクロンの薄さにされる。DRAMスタックの各層は、上にあるプロセッサダイ102内のクラスターにマッピングする(位置付けられる)64のほぼ同じ領域を含む。各DRAM領域を、行アクセス時間(row access time)を短くする複数のバンクにさらに細かく分割することができ、複数の同時アクセスを可能にする。たとえば、20nmDRAM技術を用いて、各領域が、誤り訂正符号によって保護された1Gビット(ギガビット)の記憶装置を提供することができ、これにより、メモリ−コントローラダイ104内の各メモリコントローラは、05Gバイト(ギガバイト)のメモリに電子的に接続する。複数のチャンネルによってメモリへの帯域幅が大きくなる。帯域幅を大きくすることによって、DRAM内のバンクコンフリクト(バンク衝突)が低減される。各メモリチャンネルは、72のデータビットと、約30のアドレス及び制御ビットとからなる。25ミクロンピッチ(間隔)のスルーバイアを使用すると、各メモリコントローラに4チャンネルがある場合には、スルーバイアの面積オーバーヘッドをメモリ層の3%より少なくすることができる。ピッチが微小なスルーバイア(ファインピッチのスルーバイア)は、単一の行アクセスから1つのキャッシュライン全体を供給するようにDRAMを構成することを可能にする。
【0020】
512GB(ギガバイト)のDRAMが所望されるときには、該DRAMを64個の光学的に接続された個別のメモリモジュール(「OCM」)をなすように配列することができる。OCMは、上述した8GBDRAMと同じ基本技術を利用する。光学ダイ108は2つの機能を実行する。第1に、光学ダイ108は、外部フォトニック相互接続124及び126などの光ファイバー接続へのインターフェースを提供する。第2に、光学ダイ108は、DRAMのスタックに対して低電力のグローバル相互接続を提供する。OCMとプロセッサは光ファイバーを介して接続され、これによって、コマンドや他のアプリケーション固有のデータ交換に使用することができる48ものチャンネルが提供される。
【0021】
マルチコア型スタック構成コンピュータ装置の全体動作
簡単にするために、本発明のフォトニック相互接続の実施形態を、プロセッサダイ102が64個のクワッドコアクラスターからなるコンピュータ装置100を参照して説明する。本発明のフォトニック相互接続の実施形態がそのような装置に限定されないこと、及び、種々の配列をなす任意の数のコアを具備する任意の数のクラスターを有するマルチコア型コンピュータ装置にフォトニック相互接続を提供するために、これらの実施形態を変更して実施できることは当業者には明らかであろう。
【0022】
図3は、本発明の実施形態にしたがう、フォトニックダイ102、メモリコントローラダイ104、アナログ電子ダイ106、及び光学ダイ108の組立分解等角図である。図3に示すように、プロセッサダイ102とメモリコントローラダイ104は64個のタイルに分割されている。プロセッサダイ102内の各タイルは、「クラスター」と呼ばれる4つのコアを表しており、メモリコントローラダイ104内の各タイルは、L2キャッシュ、ハブ、メモリコントローラ、及び、プロセッサダイ102においてほぼ真上に配置された対応するクラスターと電子的に通信する他の装置を表している。たとえば、メモリコントローラダイ104のタイル302は、L2キャッシュ、ハブ、メモリコントローラ、及び、関連するクラスター304の真下(または下方)に配置されて、該クラスター304と電子的に通信する他の装置を表している。クラスター及びタイルは約3mm×3mmのサイズとすることができるが、実施例に応じてより大きくまたはより小さくすることができる。本発明の実施形態は4つのコアを有するクラスターには限定されない。他の実施形態では、クラスターを、2つ、3つ、4つ、または5つ以上のコアから構成することができる。クラスター及びタイルの例については図4A及び4Bを参照して後述する。光学ダイ108は、光電子変換器306などの、ほぼ一定間隔で配置された16個の光電子変換器と、ストリップ308によって表されている蛇行構成を有する270の個別のほぼ平行な(交差しない)導波路であって、一定間隔で配置された光電子変換器の各々を通って曲がりくねって進む導波路と、ほぼ平行な8個の導波路からなる16個のバンドル(束)を備える。各バンドルは、対応する光電子変換器から生じ、たとえば、バンドル310は光電子変換器306から生じている。270個の蛇行する導波路は、「オンチップ導波路」と呼ばれ、光電子変換器間にフォトニック通信を提供する。導波路の16個のバンドルからなる導波路は、「オフチップ導波路」と呼ばれ、コンピュータ装置100の外部に配置された装置とのフォトニック通信を提供する。16個の光電子変換器の各々は、4つの光電子変換器ブロック(不図示)から構成される。光電子変換器ブロックの各々(「変換器ブロック」)は、メモリコントローラダイ104内の4つの関連するタイルのうちの1つと電子通信を行う。変換器ブロックについては、図6及び図7を参照してより詳細に後述する。アナログ電子ダイ106は16個のパッチを含み、各パッチは、メモリコントローラダイ104内の4つのタイルと光学ダイ108内の光電子変換器との間に配置されている。各パッチは、複数の金属製の(または金属皮膜された)スルーバイアまたはシリコンが充填されたスルーバイアを備え、該スルーバイアは、メモリコントローラダイ104内の4つのタイルと対応する光電子変換器との間のアナログ電子通信を提供する。データは、電子アナログ信号(「電気信号」)の形態でパッチを通って伝送される。というのは、アナログ信号を生成することは、通常、ディジタル電気信号を生成することよりも電力の消費が大幅に小さいからである。
【0023】
以下の説明は、光学ダイ108を使用して、プロセッサダイ102上のクラスター間でデータを伝送する方法、及び、クラスターと外部装置との間でデータを伝送する方法の概説である。プロセッサダイ102のクラスター(クラスター304など)によって生成されたデータ、または、メモリコントローラダイ104のタイル(タイル302など)から抽出されたデータは、データ符号化された電気信号としてパッチ312内のバイアを通って、光電子変換器306の対応する変換器ブロック(不図示)に伝送される。変換器ブロックは、この電気信号を、オンチップ導波路308のうちの1つ以上の導波路内を伝搬する「チャンネル」と呼ばれる、電磁放射の1つ以上の波長に符号化する。変調されていないチャンネルへのデータの符号化は、チャンネルの強度を変調することによって実施することができるが、これについては、図14を参照してさらに詳細に後述する。データを運搬するチャンネルは、「符号化されたチャンネル」と呼ばれる。符号化されたチャンネルを、(1)同じ光電子変換器306とも電子通信を行う近傍クラスター314、または、(2)プロセッサダイ102内の他の場所に配置されたクラスター(クラスター315など)、または、(3)外部装置(不図示)、に向けて送ることができる。符号化されたチャンネルが近傍クラスター314に向けて送られると、光電子変換器306内に配置された対応する変換器ブロックが、その符号化されたチャンネルを受け取って、該チャンネルを、パッチ312を通ってクラスター314に送り戻される符号化された電気信号に変換し戻す。データ符号化されたチャンネルがクラスター315に向けて送られると、符号化されたチャンネルは、適切なオンチップ導波路に沿って、光電子変換器316と共に配置されたクラスター315に対応する変換器ブロックへと送られる。符号化されたチャンネルは、パッチ318を通ってクラスター315に送られる符号化された電気信号に変換し戻される。符号化されたチャンネルが外部装置に向けて送られると、光電子変換器306の変換器ブロックは、その符号化されたチャンネルをバンドル310のオフチップ導波路に配置し(オフチップ導波路に入力し)、該導波路において、該符号化されたチャンネルは光学ダイ108を出る。外部装置が4つのクラスター314のうちの1つに向けて送られる符号化されたチャンネルを生成すると、この符号化されたチャンネルを、バンドル310内のオフチップ導波路に沿って光電子変換器306に送ることができ、該変換器306において、この符号化されたチャンネルは、処理のために、パッチ312を通って4つのクラスター314に送られる符号化された電気信号に変換される。光学ダイ108の動作及び構成要素については、図7を参照してより詳細に後述する。
【0024】
クラスター及びメモリコントローラ
図4Aは、本発明の実施形態にしたがうプロセッサダイ102のクラスター402を示す。クラスター402は4つのコアを備える。各コアは、L1命令キャッシュ及びL1データキャッシュと電気通信を行う。L1命令キャッシュ及びL1データキャッシュは、頻繁にまたは最近アクセスされた命令及びデータを一次的に格納する高速ランダムアクセスメモリである。図4Bは、本発明の実施形態にしたがうメモリコントローラダイ104のタイル404を示す。タイル404は、L2キャッシュ、並びに、ハブ、メモリコントローラ、ディレクトリ、ネットワークインターフェース、マイクロスバー接続(自身のクロスバー接続)、ピアクロスバー接続(相手方とのクロスバー接続)を含む構成要素領域406を備える。これらのクロスバー接続を、光電子変換器の対応する部分とインターフェースするように構成することができる。L2キャッシュは、クラスター402の4つのコアによって共用される。L1−L2インターフェース408は、クラスター402とタイル404のほぼ中央に配置されて、クラスター402とタイル404との間の電子通信を提供する。
【0025】
小さく、電力効率の良いコア及びキャッシュは、エネルギーの単位あたり、ほぼ最適な可能な性能を達成する。したがって、本発明用に選択されたコアは5GHz(ギガヘルツ)クロックを使用することができ、該コアを、dual-issue(2命令同時発行)、in-order(インオーダー)、及び、マルチスレッド対応のものとすることができ、及び、4つの乗累算演算及び4ワード幅のロード/ストア(記憶)演算が可能なシングル・インストラクション・マルチ・データ(「SIMD」)命令を提供するように構成することができる。SIMDを、浮動小数点演算性能を向上させるために設計された低レベル機能の集合とすることができる。SIMDプロセスは、1つの命令によって、複数のデータに対して同じ関数(または機能)を実行することができ、これによって、データを操作するために必要なループの回数を少なくすることができる。図3を参照して上述した、5GHzクロックにしたがって動作するちょうど64個のクワッドクラスターの場合は、コンピュータ装置100の計算帯域幅はたとえば10TFLOP/S(テラフロップス)である。各クラスターは、「エポック(epochs)」と呼ばれる24クロックサイクルの間に、少なくとも1つのキャッシュライン(たとえば64バイト〜128バイト)を送ることができる。
【0026】
図5は、本発明の実施形態にしたがう、図4A及び図4Bに示すクラスターとタイルの構成要素間の相互作用を示す略図である。ハブ502は、符号化された電気信号を、L2キャッシュ504、ディレクトリ506、メモリコントローラ508、及びネットワークインターフェース510に配信する。ハブ502は、図3を参照して上述したように、符号化された電気信号を、光学ダイ108の光電子変換器へと及び該光電子変換器から送信する役目もある。ネットワークインターフェース510は外部ネットワークへの接続を提供し、メモリコントローラ508は、L2キャッシュ504、図1に示すメモリ110〜113、及び、図2に示すDIMM216〜218などの外部メモリへと向かう、及び、それらから出てくるデータの流れを管理(または制御)する。
【0027】
図6は、本発明の実施形態にしたがって配列された、プロセッサダイ102の4つのクラスター602、メモリコントローラダイ104の4つの対応するタイル604、アナログ電子ダイ106のパッチ606、及び、光学ダイ108の光電子変換器608の拡大組立分解等角図である。図6に示すように、光電子変換器608は、4つの個別の光電子変換器ブロック610〜613から構成される。各変換器ブロックは、パッチ606を介して4つのタイル604の1つと電子通信を行う。具体的には、タイル615は変換器ブロック610と電子通信を行い、タイル616は変換器ブロック611と電子通信を行い、タイル617は変換器ブロック612と電子通信を行い、タイル618は変換器ブロック613と電子通信を行う。変換器ブロック610〜613は、タイル615〜618から出力された符号化された電気信号を、それぞれ、符号化されたチャンネルに変換する。この符号化されたチャンネルを、他のクラスターによる処理のためにオンチップ導波路308の一部で伝送することができ、または、処理のために、導波路620のバンドルで外部装置へと伝送することができる。変換器ブロック610〜613はまた、バンドル620及びオンチップ導波路308内を伝送された符号化されたチャンネルを、4つのクラスター602によって別々に処理できる符号化された電気信号に変換する。
【0028】
光学ダイ
図7Aは、本発明の実施形態にしたがう光学ダイ108の略図である。図7Aに示すように、及び、図3を参照して上述したように、光学ダイ108は、270個の個別のほぼ平行で交差しないオンチップ導波路308と、16個のほぼ一定間隔で配置された光電子変換器と、各々が8個のオフチップ導波路からなる16個のバンドルを備える。オンチップ導波路308を蛇行構造をなすように配置して、270個の全てのオンチップ導波路308が、16個の光電子変換器の各々にフォトニック結合できるようにすることができる。図7Aは、光電子変換器の各々が4つの変換器ブロックから構成されることを明らかにしている。すなわち、光学ダイ108は、各々の変換器ブロックが、メモリコントローラダイ104の64個のタイルの1つと通信するところの64個の変換器ブロックを備える。図7Aはまた、蛇行するオンチップ導波路308の対向する端部に配置された2つの実質的に(またはほぼ)同一のチャンネルソース702及び704を明らかにしている。これらのソース702と704は、それぞれ、64個の異なるチャンネルからなる同じ組をオンチップ導波路の各々において反対方向に出力するように構成されている。方向を示す矢印706は、ソース702から出力されたチャンネルが伝送される方向を表し、方向を示す矢印708は、ソース704から出力されたチャンネルが伝送される方向を表す。蛇行するオンチップ導波路308の幅は約1900μmである。
【0029】
本発明の実施形態は、図7Aに示す蛇行形状を有するオンチップ導波路には限定されない。オンチップ導波路の構成(または構造)は任意の適切な形状を取ることができ、これらの形状は、光電子変換器の数、光電子変換器のレイアウト(構成や配置)、及び、光学ダイ上で利用可能な空間の大きさに依存しうる。
【0030】
図7Bは、本発明の実施形態にしたがう、光学ダイ108の図7Aに示す領域710の拡大図である。図を簡潔にするために、図7Bに示すように、270個の蛇行するオンチップ導波路308のうちの8個だけを表示している。図7Bは、導波路は、導波路714と716のように、交差せず、ほぼ平行であることを明らかにしている。
【0031】
オンチップ導波路308を、断面積が約0.25〜約0.5ミクロンの範囲であるリッジ導波路またはフォトニック結晶導波路とすることができる。図7Cは、本発明の実施形態にしたがう、図7Bに示す線7C−7Cに沿ったオンチップリッジ導波路308の一部分である718の断面図である。図を簡潔にするために、オンチップリッジ導波路の一部718は、光学ダイ108の表面に配置された270個のオンチップリッジ導波路のうちの20個を示している。図7Cに示すように、リッジ導波路はバンドル(束)をなして配置されており、各バンドルは、バンドル720などのように、4個の導波路を有する。
【0032】
図7Dは、本発明の実施形態にしたがう、2つのほぼ平行なフォトニック結晶導波路の一部の上面図である。図7Dにおいて、円722などの円は、光学ダイ108の誘電体層または半導体基板層内の規則的格子(regular lattice)をなす開口を表している。開口部のない領域は、フォトニック結晶導波路724及び726である。開口部を、空気、または、基板層の屈折率よりも小さい屈折率を有する適切な誘電体材料で充填することができる。規則的格子をなす開口部は、導波路724及び726を囲む2次元ブラッグ格子を形成する。この2次元ブラッグ格子は、適切な波長のERを導波路724及び726に閉じこめる。フォトニック結晶導波路は周知であり、「Fundamentals of Optical Waveguides」(KatsunariOkamoto著、Elsevier Inc. 2005)、「OpticalWaveguide Theory」(Snyder and Love著, Chapman and Hall, London, 1983)、「PhotonicCrystals」(Jean_Michel Lourtioz著、Springer-Verlag, Berlin, 2005)は、この分野における多くの文献のうちのわずか3つの教本である。
【0033】
図8は、本発明の実施形態にしたがうソース702の略図である。ソース702は、1つのレーザー802と、2つのスターカプラ804及び806を備える。レーザー802を、変調されていない電磁放射の64個の異なる波長を放射するレーストラック型のモードロック式レーザーとすることができる。各波長すなわち「チャンネル」は、λ、λ、λ、…、λ64によって表され、各チャンネルは、比較的一定の強度(または輝度)を有する。スターカブラ804及び806の各々は、図8に示すように、64個のチャンネルを270個のオンチップ導波路308のうちの258個の導波路の各々に配置する木構造をなすように構成されたビームスプリッタを備える。本発明のいくつかの実施形態では、レーザー802を、(M+1)個のレーザー波長を生成するハイブリッドIII−V半導体/Siモードロック式レーザーとすることができる(たとえば、A. W. Fang 他による「Integrated AlGalnAs-silicon evanescent race track laser and photodetectors」(Optics Express 15,2315 (2007))参照)。
【0034】
光学ダイ108は、24クロックサイクルのエポックにおいて同期して動作する。利用可能な符号化されていないチャンネルは、単一のエポックにおいて、キャッシュライン、または同報メッセージ、または、制御メッセージのいずれかを送信することができる論理チャンネルにグループ化(またはグループ分け)される。1つの論理チャンネルは、1エポックにおいて、1つのキャッシュラインまたは制御メッセージをやりとりすることができる。チャンネルの論理チャンネルへのグループ化は、クラスターが、4つのクロックサイクル(24クロックサイクル/6チャンネル)毎に1つのキャッシュラインまでを受信し及び送信して、全部で10テラバイト/秒(64クラスター×(128バイト/4クロック)×5GHz)の帯域幅を生じることができるようにするやり方で行われる。
【0035】
光電子変換器
図9A及び図9Bは、本発明の実施形態にしたがう2つのタイプの光電子変換器の略図である。図9Aにおいて、第1の光電子変換器900は、4つのオフチップ通信ハブ905〜908にフォトニック結合された4つの変換器ブロック901〜904を備える。通信ハブ905〜908の各々はバンドル911〜914にフォトニック結合され、各バンドルは8個のオフチップ導波路から構成される。図9Bにおいて、第2の光電子変換器920は、単一のデバイス(または装置)922にグループ化されたオフチップ通信ハブにフォトニック結合された同じ4つの変換器ブロック901〜904を備える。バンドル911〜914は、シリアライゼーション(または直列化)/デシリアライゼーション(または非直列化)装置924を介してデバイス922にフォトニック結合されている。
【0036】
図10は、本発明の実施形態にしたがう変換器ブロック1000の構成要素の略図である。変換器ブロック1000は、同報システム1002、データ/制御ブロック1004、アービトレーションシステム1006、及び、オフチップ通信ハブ1008を備える。アービトレーションシステム1006の動作及びアーキテクチャについては、図18及び図19を参照してより詳細に後述する。同報システム1002は、関連するクラスターが、ほぼ同時に、他の全てのクラスターにデータを送ることができるようにする。データ/制御ブロック1004は、メモリコントローラダイ104の特定のタイル専用のものであって、符号化されたチャンネルを該特定のタイルに送られる符号化された電気信号に変換し、及び、該タイルから出力された符号化された電気信号を、コンピュータ装置内の他のクラスターに送られる符号化されたチャンネルに変換する。データ/制御ブロック1004のアーキテクチャの(構造的な)実施形態については、図11〜図13を参照してより詳細に後述する。アービトレーションシステム1006は、所与のエポックにおいて、クラスターに、クラスターまたは導波路のバンドルを使用する権利を付与する。図10に示すように、270個のオンチップ導波路308のうちの2つは同報システム1002専用であり、オンチップ導波路308のうちの12個はアービトレーションシステム1006専用であり、オンチップ導波路308のうちの256個はデータ/制御ブロック1004専用である。256個のオンチップ導波路は64個のバンドルに配列される。64個のバンドルの各々は、メモリダイ102内の特定のタイル専用の4個のオンチップ導波路から構成される。
【0037】
図10はまた、変換器ブロック1000の構成要素の寸法を表すパラメータw、w、w、w、及びwを含んでいる。いくつかの実施形態では、wは、約2100〜2400μmの範囲をとることができ、wは、約1700〜2100μmの範囲をとることができ、wは、約32〜44μmの範囲をとることができ、wは、約80〜120μmの範囲をとることができ、wは、約500〜600μmの範囲をとることができる。好ましくは、wを約2290μmとすることができ、wを約1900μmとすることができ、wを約38μmとすることができ、wを約100μmとすることができ、wを約530μmとすることができるが、これらの寸法及び範囲を実施例に応じて変更することができる。
【0038】
図11は、本発明の実施形態にしたがうデータ/制御ブロック1100の略図である。データ/制御ブロック1100は、光学ダイ108内の64個のデータ/制御ブロックのN番目のブロックを表す。水平線1101〜1109は、64個のデータ/制御ブロックの各々に関連付けられている、各々が4個のオンチップ導波路からなる64個のバンドルのうちの9個のみを表している(残りの55個のバンドルは図示されていない)。バンドルにはまた一番上から順に一番下まで1〜64のラベルが付されており、各ラベルは、特定のデータ/制御ブロックに対応する。各データ/制御ブロックは、他の63個のデータ/制御ブロックからの符号化されたチャンネル出力を受け取るために特定のバンドルを使用する。残りの63個のバンドルは、符号化されたチャンネルを該他の63個のデータ/制御ブロックに送るために、該データ/制御ブロックによって使用される。たとえば、図11に示すように、データ/制御ブロック1100は、バンドル1〜N−1、及び、バンドルN+1〜64にフォトニック結合された63個の束ねられた(すなわちバンドルにされた)導波路変調器(たとえば、束ねられた導波路変調器1110)を有する。データ/制御ブロック1100はまた、N番目のバンドル1105にフォトニック結合された2つの束ねられた導波路検出器1112及び1114を有する。データ/制御ブロック1100は、1番目〜N−1番目のバンドル、及び、N+1番目から64番目のバンドルのオンチップ導波路の各々において、64個の符号化されていない(すなわち、変調されていない)チャンネルをソース702及び704から受け取る。
【0039】
図11に示すように、データ/制御ブロック1100は、ソース702によって提供された符号化されていないチャンネルを使用して、データ/制御ブロックのN+1番目〜64番目に向けて送られる符号化されたチャンネルを生成し、及び、ソース704によって提供された符号化されていないチャンネルを使用して、データ/制御ブロックの1〜N−1番目に向けて送られる符号化されたチャンネルを生成するように構成されている。たとえば、図11に示すように、データ/制御ブロック1100は、方向を示す矢印1116〜1120によって示すように、ソース704起源のバンドル1101〜1104において符号化されていないチャンネルを受け取り、バンドル1101〜1104にフォトニック結合された、束ねられた(以下、「束ねられた」を「バンドル化された」という)導波路変調器を用いて、データ/制御ブロックの1〜N−1に向けて送られるこれらの符号化されていないチャンネル1116〜1120内のデータを符号化する。一方、データ/制御ブロック1100はまた、方向を示す矢印1121〜1125によって示すように、ソース702起源のバンドル1106〜1109において符号化されていないチャンネルを受け取り、バンドル1106〜1109にフォトニック結合された、バンドル化された導波路変調器を用いて、データ/制御ブロックのN+1〜64に向けて送られる符号化されていないチャンネル1112〜1125内のデータを符号化する。データ/制御ブロック1100は、バンドル化された導波路検出器1112及び1114を用いて、他の63個のデータ/制御ブロックによって送られた符号化されたチャンネル1120及び1121を受け取る。
【0040】
図12は、本発明の実施形態にしたがう3つのデータ/制御ブロックの略図である。図12に示すように、2番目のデータ/制御ブロック1202は、2番目のバンドル1102で符号化されたチャンネルを受け取るように構成されており、63番目のデータ/制御ブロック1204は、63番目のバンドル1108で符号化されたチャンネルを受け取るように構成されている。データ/制御ブロック1100及び1204、及び、図示されていない他のデータ/制御ブロックは、バンドル1102を使用して、符号化されたチャンネルを2番目のデータ/制御ブロック1202に送る。これらの符号化されたチャンネルは、それらの間に配置されているデータ/制御ブロックを邪魔されずに(そのまま)通過する。データ/制御ブロック1100及び1202、及び、図示されていない他のデータ/制御ブロックは、バンドル1108を用いて、符号化されたチャンネルを63番目のデータ/制御ブロック1204に送る。これらの符号化されたチャンネルは、それらの間に配置されているデータ/制御ブロックを邪魔されずに(そのまま)通過する。バンドル化された導波路変調器及び検出器のアーキテクチャ及び動作については、図13及び図14を参照してより詳細に後述する。
【0041】
本発明の他の実施形態では、データ/制御ブロック1100を、ソース702によって提供された符号化されていないチャンネルを用いて、データ/制御ブロック1〜N−1に向けて送られる符号化されたチャンネルを生成し、ソース704によって提供された符号化されていないチャンネルを用いて、データ/制御ブロックN+1〜64に向けて送られる符号化されたチャンネルを生成するように構成することができるということに留意されたい。
【0042】
バンドル化された導波路変調器とバンドル化された導波路検出器はほぼ同じように構成された装置である。図13は、本発明の実施形態にしたがうバンドル化された変調器/検出器1300を拡大したものの略図である。図11及び図12を参照して上述したように、バンドル化された導波路変調器/検出器1300は、4つのオンチップ導波路1301〜1304からなるバンドルにおいてチャンネルを受け取る。バンドル化された導波路変調器/検出器1300は4つの導波路−マイクロリングシステム(たとえば、導波路−マイクロリングシステム1306)を備える。4つの導波路−マイクロリングシステムは、ほぼ平行な導波路1301〜1304を含んでいるが、導波路1301〜1304の間の分離距離は、約10〜14μmの範囲をとることができ、この距離は、バンドル化された導波路変調器/検出器1300の外部にあるバンドル化された導波路1301〜1304の間の分離距離よりも大きい。導波路−マイクロリングシステムの各々は64個のマイクロリング(たとえばマイクロリング1308)を含む。64個のマイクロリングは、各導波路の両側に長さ方向に沿って隣接して分布している。マイクロリングの各々は、フォトニック結合された導波路に沿って伝送される64個のチャンネルの1つと共鳴(または共振)するように構成されている。マイクロリングの構成については、図17を参照して後述する。
【0043】
図13はまた、導波路−マイクロリングシステム1300の構成要素の寸法を表すパラメータt、t、t、及びtを含んでいる。いくつかの実施形態では、tは約45〜65μmの範囲をとることができ、tは約200〜300μmの範囲をとることができ、tは約0.5〜5μmの範囲をとることができ、tは約1〜10μmの範囲をとることができる。好ましくは、tを約57.5μmとすることができ、tを約255μmとすることができ、tを約2μmとすることができ、tを約5μmとすることができるが、本発明は、これらの寸法や寸法の範囲には限定されない。これらの寸法及び寸法の範囲を実施例に応じて変更することができる。
【0044】
図14は、本発明の実施形態にしたがうオフチップ通信ハブ1400を示す。オフチップ通信ハブ1400は、オフチップ導波路変調器1401とオフチップ導波路検出器1402を備え、全体の寸法が、約200〜300μm×約100〜200μmであるが、これらの寸法を実施例に応じて変更することができる。オフチップ導波路変調器1401は4つの導波路−マイクロリングシステム1403〜1406から構成される。導波路−マイクロリングシステム1403〜1406の各々は、1つのオフチップ導波路及び64個のマイクロリングの一部を含んでいる。導波路−マイクロリングシステム1403〜1406の導波路は、それぞれ、4つのビームスプリッタ1408〜1411を介してオンチップ導波路1407にフォトニック結合されている。導波路1407は64個の符号化されていないチャンネルを伝送し、これらのチャンネルは、ビームスプリッタ1408〜1411によって導波路−マイクロリングシステム1403〜1406に配置され、次に、該導波路−マイクロリングシステム1403〜1406を用いて、図15Aを参照して後述するように、4つの対応するタイルによって生成された64個の符号化されていないチャンネルにデータを符号化する。オフチップ導波路検出器1402は、符号化されたチャンネルをオフチップメモリ(チップ外のメモリ)などの外部装置から受け取るための4つのオフチップ導波路をさらに含む4つの導波路−マイクロリングシステム1412〜1415を備える。導波路−マイクロリングシステム1412〜1415を用いて、符号化されたチャンネルを、4つの電子的に結合されたタイルに伝送される、対応する符号化された電気信号に変換する。
【0045】
図15は、本発明の実施形態にしたがう同報システム1500を示す。同報システム1500は、約400〜600μm×20〜40μmの面積寸法を有する、同報変調器1502及び同報検出器1504を備えるが、これらの寸法を実施例に応じて変更することができる。同報変調器1502は、2つのオンチップ導波路1510及び1512にそれぞれフォトニック結合された2つの導波路−マイクロリングシステム1506及び1508を備える。同報検出器1504は、ビームスプリッタ1518及び1520を介して、導波路1510と1512にそれぞれフォトニック結合された2つの導波路−マイクロリングシステム1514と1516を備える。同報システム1500は、他の全てのクラスターに対してほぼ同時にデータを送受信するために使用される。
【0046】
本発明の光電子変換器の実施形態を、64個のクラスターを備えるコンピュータ装置について図9〜図15を参照して説明したが、本発明の実施形態はそれらには限定されないということに留意されたい。任意の数のクラスターを有するコンピュータ装置を収容するために、これらの実施形態のスケールアップ(大きくする)やスケールダウン(小さくする)ができることは当業者には直ちに理解されよう。
【0047】
導波路−マイクロリングシステムの動作
図16Aは、本発明の実施形態にしたがう、64個の符号化されていないチャンネル内のデータを符号化するために使用することができる導波路−マイクロリングシステムを示す。図16Aにおいて、64個の符号化されていない(すなわち、変調されていない)チャンネルλ、λ、λ…、λ64は導波路1602によって伝送される。64個のマイクロリングの各々は、これらのチャンネルのうちの1つと共鳴(または共振)するように構成されており、これによって、各チャンネルを、関連付けられた隣接するマイクロリングへのエバネセント結合(または一時的な結合)によって取り出すことができる。たとえば、マイクロリング1604はチャンネルλと共鳴するように構成されている。チャンネルλは導波路1602に沿って伝送されるので、チャンネルλの大部分はマイクロリング1604にエバネセント結合(または一時的に結合)される。「オン」電圧と「オフ」電圧のパターンをマイクロリングに印加することによって、情報をチャンネルの強度で符号化することができる。この電圧は、マイクロリングの屈折率を変化させ、その結果、導波路1602に沿って伝送されるチャンネルの強度を変調する。電圧のパターンを、メモリコントローラダイ104の対応するタイルから出力されるデータ列に対応付けることができる。たとえば、メモリコントローラダイ104の1つのタイルによって生成された適切な「オン」電圧を2進数の「1」に対応付け、「オフ」電圧を2進数の「0」に対応付けることができる。「オン」電圧がマイクロリングに印加されると、マイクロリングの共鳴(または共振)がシフト(または変化)して、隣接する導波路に沿って伝送される対応するチャンネルはマイクロリングにはエバネセント結合されない(または一時的な結合を生じない)。換言すれば、「オン」電圧が印加されている間、チャンネルの強度は、チャンネルがマイクロリングを通過するときに比較的変化のない状態を維持する。しかしながら、電圧が「オフ」になるやいなや、該チャンネルはマイクロリングにエバネセント結合(または一時的に結合)され、該マイクロリングを通過するチャンネルの強度は小さくなる。その結果、「オン」と「オフ」の電圧パターンで符号化された同じデータをチャンネルの強度で符号化することができ、この場合、相対的に大きな強度が2進数の「1」に対応し、相対的に小さな強度が2進数の「0」に対応する。
【0048】
図16Bは、本発明の実施形態にしたがう、64個の符号化されたチャンネルを導波路から取り出すために使用することができる導波路−マイクロリングシステムを示す。図16Bにおいて、64個の符号化されたチャンネル
【数1】


が、検出器ブロックの導波路1606に入力される。64個のマイクロリングの各々は64個のチャンネルのうちの1つと共鳴(または共振)するように構成されており、これによって、各チャンネルを、隣接するマイクロリングへのエバネセント結合(または一時的に結合)によって取り出すことができる。たとえば、符号化されたチャンネル
【数2】


が導波路1606に沿って伝送されるときに、該チャンネル
【数3】


に関連付けられた高と低の強度がマイクロリング1608にエバネセント結合(または一時的に結合)される。チャンネル
【数4】


に関連付けられた相対的に高い強度と相対的に低い強度のパターンは、マイクロリング1608(の両端)に、対応する高電圧と低電圧のパターンを生成する。次に、この電圧パターンは、同じ情報を符号化する電気信号としてメモリ−コントローラダイ104内の関連するタイルに送られる。
【0049】
マイクロリング
図17は、本発明の実施形態にしたがうマイクロリング1700の略図である。マイクロリング1700は導波路1702に近接して配置されている。いくつかの実施形態では、マイクロリング1700は、該マイクロリング1700内部の半導体基板に形成されたp型半導体領域1704と、該マイクロリング1700の外側を囲み、導波路1702の反対側にある半導体基板に形成されたn型半導体領域1706を有する真性半導体から構成される。領域1704、1706、及び、マイクロリング1700は、図16を参照して説明したように、フォトダイオードまたは変調器として使用できるp−i−n接合を形成する。導波路1702を、図13〜図15を参照して説明したように、オンチップ導波路またはオフチップ導波路とすることができる。導波路1702の伝送能力はチャンネル導波路に影響を受けやすい場合があり、チャンネルがマイクロリング1700と共鳴しているときには、大幅に低減する場合がある。これは、該チャンネルがマイクロリング1700にエバネセント結合(または一時的に結合)するからである。適切な電圧または電流を領域1704及び1706に印加することによって、マイクロリング1700の共鳴(または共振)を電子的に変調することができる。マイクロリング1700を、該マイクロリングに電圧または電流が印加されていないときには、特定のチャンネルが、マイクロリング1700と共鳴(または共振)して、該マイクロリング1700にエバネセント結合(または一時的に結合)するように構成することができる。適切な電圧または電流がマイクロリング1700に印加されているときは、マイクロリング1700の共鳴(または共振)は変化(シフト)して、同じチャンネルが、邪魔されずに導波路1702を通って伝搬する。一方、マイクロリング1700を、ある電圧または電流がマイクロリング1700に印加されているときに、特定のチャンネルがマイクロリング1700と共鳴(または共振)して、該マイクロリング1700にエバネセント結合(または一時的に結合)するように構成することもできる。電圧または電流が「オフ」になると、マイクロリング1700の共鳴(または共振)が変化(シフト)して、同じチャンネルが、邪魔されずに導波路1702を通って伝搬する。マイクロリング変調器の例については、Q. Xu他による「12.5 Gbit/s carrier-injection-based silicon microringsilicon modulators」(Optics Express 15, 430 (2007))を参照されたい。
【0050】
アービトレーション(調停)
クラスターは、リソースとしてだけではなく、他のリソースへのリクエスタ(要求者)としても動作することができる。しかしながら、2つ以上のクラスターが、特定のクラスターなどの同じリソースに、同じエポック中にアクセスを要求する場合がありうる。本発明のクラスターの各々は、これらの種類の衝突を回避するために対応するアービトレーションシステムに電気的に結合されている。簡潔かつ単純にするために、以下では、アービトレーションの実行を、本発明の実施形態にしたがうクラスターのうち4つだけを備える例示的なコンピュータ装置の略図を用いて説明する。その後で、アービトレーションシステムの実施形態を図19を参照して説明する。
【0051】
図18Aは、本発明の実施形態にしたがう、例示的な4クラスター及びスタック構成のコンピュータ装置1800の略図である。コンピュータ装置1800は、4つのクラスター1801〜1804を備え、これらのクラスターは、4つの対応するデータ/制御ブロック1805〜1808と電子通信を行う。コンピュータ装置1800はまた、第1のソース1810と第2のソース1812を備える。図8を参照して説明した64個の符号化されていないチャンネルλ、λ、λ、…、λ64を、導波路の4つのバンドル1814〜1817の各導波路に放出するように、ソース1810及び1812を構成することができる。データ/制御ブロックの各々は、特定のバンドルにおいてデータ及び制御チャンネルを受け取り、残りのチャンネルを用いて、データ及び制御チャンネルを他のクラスターに送る。たとえば、データ/制御ブロック1806は、1つのバンドル化された導波路復調器1820と、図11及び図12を参照して説明したように構成されて動作する3つのバンドル化された導波路変調器1821〜1823を備える。クラスター1801〜1804の各々は、アービトレーションシステム1830と電子通信を行う。
【0052】
図18Bは、本発明の実施形態にしたがうアービトレーションシステム1830の略図である。アービトレーションシステム1830は、ソース1834にフォトニック結合された電力導波路1832、該電力導波路1832とフォトニック通信を行うループ導波路1836、及び、この実施形態では波長選択要素1837〜1840である4つの光ダイバーター(または光分流加減器)を備える、この例示的な説明では、波長選択要素はマイクロリングとして実施される。ソース1834は光源である。光源の例には、レーザー光源、光ダイオード(または発光ダイオード)、別のシステムから受光された光などがある。アービトレーションシステム1830はまた、ループ導波路1836内に配置された、各グループが4つの内部マイクロリングからなる4つのグループ1841〜1844を含む。ソース1834は、4つの変調されていないチャンネルλ'、λ'、λ'、及びλ'を電力導波路1832に放出する。マイクロリングのグループ1841〜1844の各々は、4つのクラスター1801〜1804のうちの1つと電子通信を行う。具体的には、マイクロリングのグループ1841のマイクロリングはクラスター1(1801)と電子通信を行い、マイクロリングのグループ1842のマイクロリングはクラスター2(1802)と電子通信を行い、マイクロリングのグループ1843のマイクロリングはクラスター3(1803)と電子通信を行い、マイクロリングのグループ1844のマイクロリングはクラスター4(1804)と電子通信を行う。内部マイクロリングは、図17を参照して説明したように、p−i−n接合フォトダイオードとして構成されている。図19を参照して後述するように、64クラスターコンピュータ装置100の場合は、別個のソース1834は必要ではないということに留意されたい。
【0053】
図18Bに示すように、4つのマイクロリング1837〜1840及び内部マイクロリング1841〜1844の各々には、チャンネル名λ'、λ'、λ'、及びλ'がラベル付けされている。これらのチャンネル名は、各マイクロリングが、共鳴(または共振)を行い、かつ、エバネセント結合(または一時的に結合)することができる隣接する導波路からのチャンネルを識別する。たとえが、マイクロリング1837〜1844の各々は、チャンネルλ'、λ'、λ'、及びλ'のうちの1つだけとそれぞれ共鳴(または共振)をするように個別に構成されている。具体的には、マイクロリング1837〜1840は、電力導波路1832における時計回り方向1846から、ループ導波路1836における反時計回り方向1848へと、チャンネルλ'、λ'、λ'、λ'とそれぞれエバネセント結合(または一時的に結合)する。
【0054】
同じ様にして、内部マイクロリング1841〜1844もまた、ループ導波路1836からの特定のチャンネルとエバネセント結合(または一時的に結合)する。しかし、これらの内部マイクロリングは、対応するクラスターによって活性化、すなわち「オン」にされなければならない。たとえば、マイクロリング1841を全て、チャンネルλ'、λ'、λ'、λ'の共鳴(または共振)周波数から1/2だけモードずれるように構成することができる。その結果、チャンネルλ'、λ'、λ'、λ'は、ループ導波路1836に沿って邪魔さらずに(そのまま)マイクロリング1841を通過する。しかしながら、対応するクラスター1(1801)は、適切な電流を送ることにより、特定のマイクロリングをシフト(変化)させて該マイクロリングを関連するチャンネルと共鳴(または共振)させることができる。次にこのマイクロリングは、このチャンネルをループ導波路1836からエバネセント結合(または一時的に結合)して該マイクロリング内で共鳴(または共振)することができる。たとえば、クラスター1(1801)はマイクロリング1850を「オン」にすることができ、これによって、チャンネルλ'をループ導波路1836からエバネセント結合(または一時的に結合)して該マイクロリング1850内で共振させることができる。グループ1841内の他のマイクロリングが「オン」にされていない場合には、チャンネルλ'、λ'、λ'は、邪魔されずに(そのまま)通過する。
【0055】
次に、アービトレーションシステム1830を用いて4つのクラスター1801〜1804のうちの1つがデータの受信に利用可能か否かを判定する方法を、図18A及び図18Bを参照して説明する。各エポックの直前に、各クラスターはソース1834から放出された4つのチャンネルの1つに割り当てられ、クラスター1801〜1804はクラスター対チャンネルの割り当て状態を知っている。これらの割り当ては、ランダムなものとすることができ、または、クラスターの公平な利用を確保する方法に基づくものとすることができ、かつ、新たなエポックが始まる前のエポック中(例示的な実施例ではエポックの1/3の期間中)に行うことができる。これらのクラスター対チャンネル割り当てはクラスターによって使用されて、さらなる処理のためにどのクラスターがデータの受信に利用できるかが決定される。1実施形態では、エポック毎のチャンネル割り当てを最初に予め決定して、各クラスターにおいてアクセスできるルックアップテーブルに格納することができ、コンピュータロジックを用いて、あるスキーム(計画または方式)にしたがってエポック毎のクラスター対チャンネル割り当てを更新することができる。そのようなスキームの例はラウンドロビン方式である。
【0056】
1実施形態では、アービター(調停器)はいくつかのダイにわたって存在する。メモリコントローラダイ104におけるxバー(クロスバー)接続は、アービターから要求すべきものを決定する。この要求はアナログダイ106を通って、リング変調器と導波路が存在する光学ダイ108に伝達される。光学ダイ108においてチャンネルをダイバート、すなわち、チャンネルの進路を変えようとする試みがなされ、そのチャンネルは、ダイバートされてすなわち進路を変更されて検出されるか、あるいは、ダイバートされずすなわち進路は変更されずに検出されない。結果として生じた電気信号はxバー接続まで戻り、該xバー接続は、次のエポックでデータを変調器に送ることによって論理チャンネルを使用するのに有用なものとしてまたは有用ではないものとして電気信号を解釈する。
【0057】
たとえば、あるエポックが始まる前の表Iに示すクラスター対チャンネル割り当てについて検討する。
【0058】
【表1】

【0059】
表Iに示されているように、クラスター1(1801)はチャンネルλ’に割り当てられており、クラスター2(1802)はチャンネルλ’に割り当てられており、以下同様である。クラスター1(1801)及びクラスター4(1804)が両方とも、データを処理するためにクラスター3(1803)を使用することを望んでいると仮定する。図18Bに戻って、クラスター1(1801)はマイクロリング1850を「オン」にし、クラスター4(1804)はマイクロリング1852をオンにする。チャンネルλ'は、マイクロリング1839を介して電力導波路1832からループ導波路1836にエバネセント結合(または一時的に結合)され、次に、チャンネルλ'は、マイクロリング1839の直後にあるループ導波路1836に沿って反時計方向1848に伝搬する。マイクロリング1850は、チャンネルλ'がマイクロリング1852に到達できる前に、ループ導波路1836からチャンネルλ'を取り出す。マイクロリング1850と共鳴(または共振)しているチャンネルλ'は、クラスター1(1801)に送られる電気信号を生成する。図18Aに戻って、この電気信号がある閾値を超えると、該信号はクラスター1(1801)において検出される。クラスター1(1801)は、この信号を検出すると、続くエポックの間にデータを変調器1856に送り、該変調器1856は、該データを符号化してソース1810から出力される変調されていないチャンネルに入れる。図12を参照して説明したように、これらの符号化された(すなわち変調された)チャンネルは次に、バンドル1816に沿って検出器1858へと伝送されて、クラスター3(1803)によって処理される。この特定のエポックにおいて、クラスター1(1801)はクラスター3(1803)へのアクセス権を取得するので、クラスター4(1804)は、次のエポックを待たなければならない。
【0060】
ここで、クラスター1(1801)及びクラスター4(1804)が両方とも、データを処理するためにこの場合もクラスター3(1803)を使用することを望んでいると仮定する。しかしながら、この場合には、あるエポックの開始前におけるクラスター対チャンネル割り当ては表IIに示されるものであると仮定する。
【0061】
【表2】

【0062】
表IIに示すように、クラスター3(1803)は現在チャンネルλ'に割り当てられている。図18Bに戻って、クラスター1(1801)はマイクロリング1860を「オン」にし、クラスター4(1804)はマイクロリング1862を「オン」にする。チャンネルλ'は、マイクロリング1840を介して電力導波路1832からループ導波路1836にエバネセント結合(または一時的に結合)され、次に、チャンネルλ'は、マイクロリング1840の直後にあるループ導波路1836に沿って反時計方向1848に伝搬する。しかしながら、このエポックの前に、マイクロリング1862は、チャンネルλ'がマイクロリング1860に到達できる前に、ループ導波路1836からチャンネルλ'を取り出す。チャンネルλ'は、マイクロリング1862において共鳴(または共振)して、クラスター4(1804)に送られる電気信号を生成する。ここで、図18Aに戻って、この電気信号がある閾値を超えると、クラスター4(1804)がこの信号を検出する。クラスター4(1804)は、この信号を検出すると、上述したように、処理のために続くエポックの間にデータをクラスター3(1803)に送る。この特定のエポックにおいて、クラスター4(1804)はクラスター3(1803)へのアクセス権を取得するので、クラスター1(1801)は、次のエポックを待たなければならない。
【0063】
図19は、本発明の実施形態にしたがう、関連するクラスターNに対応するアービトレーションシステム1900を示す。このアービトレーションシステムは8個のアービター1901〜1908を備える。アービターの各々は、導波路−マイクロリングシステムと、4つの中央導波路1911〜1914の1つにフォトニック結合された1つのマイクロリングを備える。たとえば、アービター1901は、1つの導波路−マイクロリングシステム1916と、中央導波路1911にフォトニック結合された1つのマイクロリング1918を備える。アービター1901をクラスターNによって用いて、要求されたクラスターMがデータを受信するのに利用できるか否かを決定することができ、同じ導波路1920に接続された他のアービター(不図示)も、それらに関連するクラスターについて同じことを行うことができる。
【0064】
単純にするために、アービトレーションシステム1900は、コンピュータ装置100の64個のアービトレーションシステムのうちの1つ(たとえば、図10に示すアービトレーションシステム1006)を表すものとする。64個の全てのクラスターが、導波路1920に接続されたアービターを用いて、どのクラスターがデータを受信するのに利用できるかを決定するものとする。ソース702または704などのソースが、64個のチャンネルλ、λ、λ、…、λ64を導波路1911に1922で示す方向に配置する。アービターの各々は、マイクロリング1918などのマイクロリングを有し、該マイクロリングは、電力導波路1911からチャンネルλ、λ、λ、…、λ64の1つを取り出して、導波路1920に対応するチャンネルを配置して、1924で示す方向に伝送する。たとえば、マイクロリング1918を、電力導波路1911からチャンネルλを取り出すように構成することができる。導波路−マイクロリングシステム1916の64個のマイクロリングの各々は、適切な電流が印加されると、導波路1920によって伝送される64個の変調されていないチャンネルλ、λ、λ、…、λ64のうちの1つを取り出すように構成されている。ここで、クラスターNが、次のエポック中に処理されることになるデータをクラスターMに送ることを望んでいるとする。前のエポックの最後の1/3の期間の間に、クラスターNは、クラスター対チャンネル割り当てにおいてクラスターMにチャンネルλ63が割り当てられたということを決定(判定)する。クラスターNは、マイクロリング1922を「オン」にすることによって応答する。マイクロリング1918はチャンネルλだけを取り出すように構成されているので、チャンネルλ63は、導波路1920に接続された異なるアービター(不図示)によって電力導波路1911から取り出され、チャンネルλ63は、導波路1920に沿って1924で示される方向に送られる。チャンネルλ63が、データを処理するためにクラスターMを使用することを望んでいるかもしれないクラスターのアービターによって妨害されないと仮定すると、チャンネルλ63は、閾値を超える電気信号を生成するマイクロリング1922へのエバネセント結合(または一時的に結合)によって取り出される。クラスターNは、図12を参照して説明したように、クラスターMにデータを送ることによって応答する。チャンネルλ63がマイクロリング1922に到達する前に、該チャンネルλ63が別のクラスターKによって取り出される場合には、クラスターKは、処理のためにデータをクラスターMに送ることができ、クラスターNは、次のクラスター対チャンネル割り当て及び次のエポックを待つ。
【0065】
8個のアービター1901〜1908の1つの動作を説明したが、いくつかの他のアービターを用いて、他のクラスターが利用できるか否か、及び、外部装置(または外部デバイス)が利用できるか否か、を決定できることに留意されたい。ある1つのエポック中のそれぞれの時刻でこれらの決定を行うことができる。
【0066】
上述したように、例示したマルチコアコンピュータ装置に加えて、フォトニック相互接続及びアービトレーションシステムの実施形態を、3次元スタック構成及び複数のメモリコントローラを有することができる他のコンピュータシステム装置(たとえば、メモリシステム装置)において実施することができる。
【0067】
図18A〜図19に関連して説明した全光アービトレーションシステムの実施形態は、アービトレーション(調停)を電力配送と組み合わせたシステムを例示しており、また、異なるリソース(たとえば、コンピュータシステム装置内のクラスター)に関連する論理光チャンネルの割り当てが変更されること、または、該割り当てが固定されていないことを例示している。上述したように、これは公平さをもたらす。
【0068】
図20Aは、本発明の別の実施形態にしたがう、優先順位付け方式が固定された(すなわち公平ではない)全光アービトレーションシステムの略図である。アービトレーションシステム2000を、フォトニック相互接続の一部とすることができ、または、光相互接続の全部分に適用することができる。例示的なアービトレーション光学部2002が、データ経路光学部2004と共に図示されており、データ経路光学部2004は、受信側のコンピュータシステムの構成要素(該構成要素に対して、データがある時間期間のウインドウ(たとえばエポック)で送られるように要求される)に関連付けられている光受信機2016の相対的な位置を示すためにも図示されている。この例では、データ部分はそれ自体の光入力を有しており、該光入力は、アービトレーションで勝利を収めた関連するコンピュータシステムの構成要素から216に関連する所望の受信構成要素に送られるデータで変調されることになる。光入力2003を、レーザー光源2006によって生成された信号から進路を変更された光の一部、または、レーザー光源2006から生成された信号から分離された光の一部とすることができ、この場合、該光入力は変調されていない(場合がある)。しかしながら。データ経路光学部2004に対する光パワー(または光出力)2003は、受け取られないか、または、アービトレーションシステムに関連する光ダイバータ(たとえば、「0a」または「1a」または「2a」)からは送られない。
【0069】
レーザー光源2006は、電力導波路2008に沿って光として電力を提供する。光ダイバータ0a、1a、1bの各々は、あるアービトレーション方式またはプロトコルにしたがって許可されたときに電力導波路2008からの光と結合する。この例では、ゼロ番目の光ダイバータ0aがレーザー光源2006からの光路に一番近く、1番目の光ダイバータ1aがレーザー光源2006の光路に次に近く、2番目の光ダイバータ2aがレーザー光源2006から光学的に一番遠い。アービトレーションシステム2000は、光ダイバータ0a、1a、及び2a、並びに、それぞれの検出器を含むアービトレーション部2002によって表されている。該検出器は、ゼロ番目の光ダイバータ0aとアービター0ロジックとの間に結合されたゼロ番目の検出器2018、1番目の光ダイバータ1aとアービター1ロジックとの間に結合された1番目の検出器2022、2番目の光ダイバータ2aとアービター2ロジックとの間に結合された2番目の検出器2026を含む。アービターロジックユニットの各々は、コンピュータシステム装置のコンピュータシステム構成要素に関連付けられている。1実施形態では、光ダイバータ(0a、1a、2a)を、それぞれの光検出器(2018、2022、2026)が任意のダイバートされた(すなわち、進路を変えられ、または、分岐された)光を受け取るために結合されている、受動性の光タップまたは受動性の光スプリッタとすることができる。
【0070】
光ダイバータの各々を、上記のマルチコアの例のように、リング変調器などの波長選択要素として実施することもできる。追加の検出器2018,2022、2026は、光ダイバータリング変調器が、それ自体の電気通知信号を生成できるときには必要でない場合がある。光ダイバータ0a、1a、及び2aに関連するコンピュータシステムの構成要素のいずれかが、受信機216に関連する構成要素に信号を送る要求を有している場合には、関連するコンピュータシステムの構成要素のアービターロジック(0、1、2)が、活性化信号(または起動信号)を、それのそれぞれのリング変調器光ダイバータ0a、1a、及び2aに送る。図示の例では、アービター1が光ダイバータ1aを起動し、該光ダイバータ1aは、レーザー光源2006からの光を第1の検出器2022にダイバートし、該第1の検出器2022は、ダイバータ1aが電力導波路2008からの光を正常にダイバートしたこと、及び、構成要素1が、それのデータを次の指定された時間期間(たとえばエポック)で、光受信機2016に関連する構成要素に送ることができることを、アービター1ロジックに知らせる電気信号を送る。使用可能な他のタイプの変調器はチャンネルアジャイル(agile)変調器である。
【0071】
アービター1ロジックは、要求している構成要素(たとえば、メモリコントローラまたはコアまたはネットワークインターフェース)に、それの要求を次に満たすことができることを知らせることができる。アービター1ロジックは、変調器1bを起動して、その要求または要求されたデータを光入力2003の光信号に符号化して、光受信機2016によって受信されることができる論理チャンネルを構成可能な1つ以上の波長チャンネル(または波長チャネル)でデータ導波路2030に送ることができる。この例では、レーザーソース2006がアービトレーションシステム部2002の外部の電力源として使用されないので、レーザーソース2006からの光を変調することができる(たとえば、アービトレーションに勝利したことを通知することができる)。電力の配送がアービトレーション光源と結合していない独立型のアービトレーションは、1つのアービトレーションが、使用されている複数の導波路または論理チャンネルをもたらすことができる場合をサポートすることができる。アービトレーション信号用に使用される1つまたは複数の特定の導波路は、論理チャンネルが利用可能であることを表しているが、受信構成要素が、同じそれらの特定の導波路において通信する必要があることは表していない。
【0072】
この例では、コンピュータシステムの構成要素1がアービトレーションに勝利している(すなわち、アービトレーションにおいて優先権を獲得した)。光ダイバータ1aによる光のダイバート(すなわち進路変更)によって、レーザー光源2006からの光が光ダイバータ2aに到達するのが阻止される。アービター2ロジックは、それが依然としてアクセス権を付与されていないので、それのデータを送るためには少なくとも次の指定された時間期間を待たなければならないことを決定する。この例は、アービトレーションシステム2000が、固定された優先順位付けアービトレーション方式を有していて、構成要素0が構成要素1よりも常に優先し、そしてまた、光受信機2016に関連する構成要素へのアクセス権が与えられる際に、構成要素1が構成要素2よりも常に優先するという点で必ずしも公平ではないということを例証している。
【0073】
図20A(及び後述する図20B)は、光アービトレーションモジュールを含むアービトレーションモジュールの3つの例を示す。アービトレーションモジュールの各々は、アービターロジックユニット(アービター0、1、2)及び関連する光アービトレーションモジュールを備え、これらのアービターロジックユニットを通じて、一組のコンピュータシステムの構成要素は、フォトニック相互接続へのアクセスに影響を及ぼすことができ、該関連する光アービトレーションモジュールは、電力導波路2008からの光をダイバートして(すなわち、該光の進行方向を変えて、あるいは、該光を分岐させて)、アービトレーション方式にしたがってアクセスが認められたことを示すことができる。
【0074】
図20Bは、アービトレーションシステムの実施形態の別のバージョン2001を示しており、該実施形態では、データ転送などのフォトニック相互接続の別の機能部への光パワーの配送が、アービトレーションと結合または組み合わされる。この実施形態では、変調器「0b」、「1b」、「2b」は、光ダイバータ0a、1a、2aによってそれぞれ配送される、レーザー2006からの変調されていない光パワーを受け取るように位置決めされている。アクセスが認められたコンピュータシステムの構成要素からのデータまたは要求は、導波路2030に対するアービトレーションに勝利した1または複数の割り当て済みのフォトニック相互接続データチャンネルにおける伝送のために、変調されていない光上に符号化される。
【0075】
説明を簡単にするために、1つまたは複数のアービトレーションチャンネルは、フォトニック相互接続のデータチャンネル部からの個別の導波路を横断するものとして図示されている。しかしながら、アービトレーションチャンネル及びデータチャンネルを構成する波長を、波長分割多重することができ、及び、同じ光導波路によって伝送することができる。
【0076】
図21は、アービトレーション方式を利用することができるアービトレーションシステム2001の略図であり、該システムは、使用する導波路の数を増やすことなく、コンピュータシステムの複数の構成要素に複数の受信構成要素へのアクセスを付与することができる。
【0077】
この例では、レーザー光源2006は、図20Bに関して説明したように変調されていない光パワーを配送するだけでなく、波長分割多重(WDM)された、または、高密度波長分割多重(DWDM)された個別の波長の変調されていない光を出力する。ゼロ番目の光ダイバータ0a、1番目の光ダイバータ1a、2番目の光ダイバータ2aの各々を、調整可能な変調器(たとえば、チャンネルアジャイル変調器)、または、列状に配列された固定式変調器(fixed modulator)(たとえば、リング変調器)で実施することができる。同様に、ゼロ番目の変調器0b、1番目の変調器1b、2番目の変調器2bの各々を、調整可能な変調器または列状に配列された固定式変調器で実施することができる。受信機2016は好ましくは固定周波数受信機である。
【0078】
この例で、ある構成要素が特定の受信機との通信を望んでいる場合には、それぞれのアービターロジックが、該アービターロジックのぞれぞれのダイバータと変調器とを、速度が重要であれば同時(または並列)に、あるいは、電力または信頼性に制約がある場合には逐次的に、該受信機に対応する波長に合うように調整する(または同調させる)。この方式は、導波路の数を増やすことなく、構成要素が、複数の受信機に対するアービトレーション(調停)を行うことを可能にする。
【0079】
この例をより詳細に説明すると、ゼロ番目の光ダイバータ0aは、電力導波路2008からのゼロ番目の波長の変調されていない光2102をダイバートし、1番目の光ダイバータ1aは、1番目の波長の変調されていない光2104をダイバートする。ゼロ番目の検出器2018及び1番目の検出器2022は、それらのそれぞれの関連する構成要素に対するアービトレーションを正常に検出する。ゼロ番目の変調器0b及び1番目の変調器1bは、それぞれ、ゼロ番目の波長の変調されていない光2102と1番目の波長の変調されていない光2104を受け取り、それぞれ、ゼロ番目の波長の変調された光2106と1番目の波長の変調された光2108をデータ導波路2030へと出力することができる。
【0080】
図22は、本発明の1実施形態にしたがう別のアービトレーションシステム2200の略図である。アービトレーションプロトコルは、トレードオフ及び最適化を行うことができるいくつかの特性(たとえば、単純さ、速度、集中か分散か、公平さ、及び優先順位付け)を有している。図20Aに関して説明したように、図20Aのアービトレーションシステム2000は、固定された優先順位を有し、それゆえ、公平ではない。
【0081】
アービトレーションシステムは、光学的に実施されるトークンプロトコルを提供する。この例では、単一のリソースに対するアービトレーションを行うことを試みる10個のモジュール0〜9がある。トークンの概念は、それらのモジュールが、電力導波路2204からの光をアービトレーション導波路2206にダイバートする能力を有し、それらのモジュールのうちのどの1つのモジュールが光をダイバートするかをアービトレーション毎に変更することができる、という事実によって表される。優先順位を毎回変更することによって、モジュールのどれもが、同じ平均優先順位を有し、これによって、公平なアービトレーションメカニズムが得られるにように、アービトレーションが行われる。
【0082】
アービトレーションシステム2200において、1番目のモジュール2208は、「1a」で示されている1番目の光ダイバータ2210を用いて電力導波路2204からの光をアービトレーション導波路2206へとダイバートする。1番目の光ダイバータ2210をリング変調器で実施することができる。アービトレーション導波路2206に対するアービトレーションは、図20Aに関して説明したのと同様のやり方で行われる。
【0083】
この例では、3番目のモジュール2212、4番目のモジュール2214、7番目のモジュール2216、8番目のモジュール2218が、それぞれ、モジュール3、4、7、8として示されており、アービトレーション導波路2206からの光をダイバートすることを試みる。8番目のモジュール2218は、その光が最初に該モジュールのそばを通るので、該光を正常にダイバートして検出し、これによって、アービトレーションに勝利してリソースを使用するための権利を得る。1番目、3番目、4番目、7番目、及び8番目という表記は、電力導波路2204を駆動するレーザー光源2220に対するモジュール2202の近接度を表しており、番号が小さいほど、レーザー光源2220に光学的に近い。
【0084】
次のアービトレーション段階の始めに、1番目のモジュール2208(すなわちモジュール1)以外のモジュールが、その光をアービトレーション導波路2206にダイバートし、これによって、その回の優先順位が変化することになる。次にどのモジュールがその光をダイバートするかは所望のプロトコルに依存する。1つの可能性のあるアービトレーション方式は、最高の優先順位が単に各モジュールを順に巡回する単純なラウンドロビン方式である。
【0085】
ラウンドロビン方式では、次の段階において、モジュール2として示されている2番目のモジュール2222がその光をダイバートし、その次の段階で、3番目のモジュール2212が続き、以下同様である。複数の波長が電力導波路2206に多重化されると、各モジュールにおいて、特定の波長または波長のグループを同様にラウンドロビン方式でダイバートすることができる。たとえば、10個の波長が存在する場合には、第1の波長を、最初の1番目のエポックでモジュール0aによってダイバートすることができる。次のエポックでは、モジュール2208(1a)だけがそれの光ダイバータを起動して、その第1の波長をダイバートすることができる。各モジュールは、同期クロック信号を経由したのはどのエポックであるかを知っているだけでよく、それらのエポック中に、アービターロジックによって局所的に記憶することができる異なる波長にアクセスすることができるので、この場合も、アービトレーションを分配することができる。アービトレーションモジュールは、前にどのモジュールにアクセス権が付与されていたかを知っている必要はなく、したがって、コンピュータシステム装置内のグローバルな通信を要求するのではなく、アービトレーションが分散された状態を維持する。このように毎回優先順位を変更することによって、図20Aのアービトレーションシステム2000に関して説明した固定された優先順位方式に比べて公平さを大幅に改善することができる。アービトレーションシステム2200用の別のアービトレーション方式は、リソースの現在の保持者(リソースを現在保持しているモジュール)が次のアービトレーションサイクルでは優先順位が一番低いモジュールになるように優先順位を割り当てることを含むことができる。しかしながら、これは、グローバルな(すなわちシステム全体におよぶ)情報交換要件を導入する。
【0086】
光は瞬時には伝わらないため、これらの方式において考慮しなければならないタイミングに関する事項がある。新しい段階が始まると、新たなダイバータは、光が電力導波路に到着するのを待たなければならない場合がある。さらに、あるモジュールは、前の段階からの使い残しの光ではなく、現在のダイバータからの光を該モジュールが使用することを確保しておく必要がある。
【0087】
各段階において、次のより番号が大きいモジュールがダイバータになる(及び、一番大きな番号のモジュールから0の番号のモジュールに戻る)ラウンドロビン方式では、モジュールは、光が電力導波路2204上を次のダイバータに伝わるのを待たなければならず、その後、(アービトレーションの)勝利者が該ダイバータから最大限遠くに離れている場合には、リング全体を1回通過する時間(またはリングを完全に一巡する時間)待たなければならない。リング全体の1回の通過時間は、モジュール2202の各々が、前の段階ではなく新たな段階からの光を確実に認識するのに必要な時間量でもある。
【0088】
(レプリケーションまたはWDMによって実施される)N個のモジュールとN個のアービターがあり、かつ、すべての段階において、全てのN個のモジュールが、均一かつランダムに分配されるように選択される受信機に送信することを望む場合には、この方式は、Nが大きくなるにつれて、1−e−1(約0.632)の利用度に近付くであろう。我々は、アービトレーションを数回(すなわち数ラウンド)実行することによってこの利用度を改善することができるが、この場合、各回において、前回の敗者間でアービトレーションが行われる。R個の回数(ラウンド)がある場合には、利用度はNが増えるにしたがい1−e−Rに近づくだろう。
【0089】
上述したように、トークンプロトコルは、電力配送とアービトレーションを組み合わせない。電力導波路2204とアービトレーション導波路2206の間の中間にある別の組の変調器及び別の導波路を追加することによって、かかる組み合わせを行うことができる。図22のアービトレーション導波路2206が、図20Bの電力導波路2008として機能し、図20Bのデータ導波路2030に光を伝送するための各検出器を伴うリング変調器がある場合には、かかる組み合わせは、電力配送とトークンアービトレーションを組み合わせたプロトコルを生じるであろう。
【0090】
これらのアービトレーションプロトコルを実施するために必要な光パワーを、電気的に実施する場合、特に、長い距離にわたって行われる場合または非常に速い速度で行われる場合、に比べて大幅に小さくすることができるであろう。さらに、アービトレーション導波路2206のリングのサイズに依存して、このソリューションは、非常に短い時間で決定を下す可能性を有している。オンチップリングは、わずか数ナノ秒で決定を下すことができるが、これに比べて、電気的ソリューションは多くの場合10倍以上遅い。
【0091】
以上の記述は、説明のためのものであり、本発明を十分に理解できるようにするために特定の用語を使用した。しかしながら、当業者には、本発明を実施するために特定の細部は必要ではないことは明らかであろう。本発明の特定の実施形態についての上記記述は例示と説明のために提示されたものである。上記記述は、本発明を網羅することも、本発明を開示した形態そのものに限定することも意図していない。上記の教示に照らして多くの変更及び変形が可能であることは明らかである。それらの実施形態は、本発明の原理及びその実際の適用を最もよく説明し、これによって、当業者が、検討している特定の用途に適した種々の変更を加えて本発明及び種々の実施形態を最大限利用することができるようにするために、図示及び説明されている。本発明の範囲は、特許請求の範囲及びそれの等価物によって画定されることが意図されている。

【特許請求の範囲】
【請求項1】
コンピュータシステムにおける通信を提供するフォトニック相互接続と共に使用する光アービトレーションシステム(1830、2001)であって、
第1の導波路(1832、2008)と、
前記第1の導波路(1832、2001)で光を送るための光源(1834,2006)と、
前記光をダイバートするために前記第1の導波路に結合された第1の光ダイバータ(1837、1838、1839、1840、2010、2012、2014)と、
前記光を検出するために前記第1の光ダイバータに結合された第1の検出器(1841、1842、1843、1844、2018、2022、2026)と、
前記第1の検出器による前記光の検出に応答してデータを伝送するために光を変調するための第1の変調器(1841、1842、1843、1844、0b、1b、2b)と、
前記変調された光を伝送するために前記第1の変調器に結合されたデータ導波路(1814、1815、1816、1817、2030)
を備えるシステム。
【請求項2】
前記第1の導波路が、変調されていない光を伝送する電力導波路(1832、2008)であり、前記第1の変調器が、前記変調されていない光を変調するために前記第1の検出器に結合される、請求項1のシステム。
【請求項3】
前記第1の光ダイバータがリング変調器(1700)を備える、請求項1のシステム。
【請求項4】
前記電力導波路(1832、2008)に結合された第2の光ダイバータ(1838、2012)をさらに備え、前記第1の光ダイバータ(1837、2010)が、前記光源と前記第2の光ダイバータの間にある、請求項2のシステム。
【請求項5】
前記光源(1834、2006)が第1の波長の変調されていない光と第2の波長の変調されていない光を送るためのものであり、
前記第1の光ダイバータ(1837、2010)が、前記第1の波長の変調されていない光をダイバートするためのものであり、
さらに、前記第2の波長の変調されていない光をダイバートするために前記電力導波路に結合された第2の光ダイバータ(1838、2012)を備える、請求項1のシステム。
【請求項6】
前記システムが、優先順位が固定されたアービトレーション方式(2000)を提供する、請求項1の光アービトレーションシステム。
【請求項7】
前記システムが、優先順位が固定されていないアービトレーション方式(1830、2200)を提供する、請求項1の光アービトレーションシステム。


【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4A】
image rotate

【図4B】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7A】
image rotate

【図7B】
image rotate

【図7C】
image rotate

【図7D】
image rotate

【図8】
image rotate

【図9A】
image rotate

【図9B】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16A】
image rotate

【図16B】
image rotate

【図17】
image rotate

【図18A】
image rotate

【図18B】
image rotate

【図19】
image rotate

【図20A】
image rotate

【図20B】
image rotate

【図21】
image rotate

【図22】
image rotate


【公表番号】特表2011−501617(P2011−501617A)
【公表日】平成23年1月6日(2011.1.6)
【国際特許分類】
【出願番号】特願2010−531049(P2010−531049)
【出願日】平成20年10月23日(2008.10.23)
【国際出願番号】PCT/US2008/012119
【国際公開番号】WO2009/055032
【国際公開日】平成21年4月30日(2009.4.30)
【出願人】(503003854)ヒューレット−パッカード デベロップメント カンパニー エル.ピー. (1,145)
【Fターム(参考)】