説明

3次元メモリモジュールアーキテクチャ

本発明の様々な実施形態は、スタックされたメモリモジュールに向けられている。本発明の一実施形態において、メモリモジュール(100,600,1200,1400)は、少なくとも1つのメモリ層がスタックされた少なくとも1つのメモリコントローラ層(102,602,1204,1402)を備える。ファインピッチのスルー複数バイア(例えば、スルーシリコン複数バイア)(114,116)が、前記少なくとも1つのメモリコントローラ(401〜404)と、前記少なくとも1つのメモリ層との間の電気的な伝達を提供する前記スタックを通じて、前記少なくとも1つのメモリコントローラの表面に対してほぼ垂直に延在する。追加的には、前記メモリコントローラ層は、前記メモリモジュールに対して双方向にデータを伝達するよう構成された少なくとも1つの外部インターフェースを含む。更にまた、前記メモリモジュールには、光学層(602,1202)を含めることができる。該光学層を、前記スタック内に含めることができ、及び、該光学層は、前記少なくとも1つのメモリコントローラに対して双方向にデータを伝達するバス導波路を有する。前記外部インターフェースは、前記光学層とインターフェースする光学的な外部インターフェースとすることができる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明の実施形態は、積み重ねられた(スタックされた)3次元のメモリモジュールに関する。
【背景技術】
【0002】
関連特許出願の相互参照
本特許出願には、以下の特許出願(1)及び(2)に関連した内容を含めることができ、それらの全てが、参照により本明細書内に組み込まれる。すなわち、(1)代理人整理番号200704210-1を有した、発明者であるRaymond G. Beausoleil、Marco Fiorentino、Norman Paul Jouppi、Qianfan Xu、Robert Samuel Schreiber、及びNathan Lorenzo Binkertによる、「PHOTONIC INTERCONNECTS FOR COMPUTER SYSTEM DEVICES」と題する米国特許出願、及び(2)代理人整理番号200701582-1を有した、発明者であるNathan Lorenzo Binkert、Norman Paul Jouppi、Alan Lynn Davis 、及びRaymond G. Beausoleilによる、「THREE DIMENSIONAL DIE STACKS WITH INTER-DEVICE AND INTRA-DEVICE OPTICAL INTERCONNECT」と題する米国特許出願である。
【0003】
背景
全てのコンピュータシステムによって共有された本質的な問題は、エネルギー消費か又はコストに相応して高められること無く、高められるメインメモリシステム性能の必要性である。電気的な通信アーキテクチャは、電子システムにおいて必要とされる高められる性能と、一方で、より低い電力消費、より小型のフォームファクタ、及びより低い電磁放射に対処することとの二分性のバランスを取ることに苦闘している。コンピュータシステム内において電力消費を低減させながら、スケーラビリティに対処するより良い解決法が望ましい。しかしながら、これらの問題に対する典型的な電気的な解決法は、増加させられたピン数及び/又はチップ(ダイ)領域か、或いは増加させられた電力消費のいずれかの理由により、頻繁に、メモリモジュールのコストを増加させ、それらの主要な原因は、長いワイヤ上において伝達(通信)を行う必要性である。
【0004】
コンピュータシステム内のメインメモリシステムの典型的な実施例は、1つか又は複数のデュアルインラインメモリモジュール(「DIMMs」)を用いて実現され得るというものである。DIMMは、システム基板上に1つか又は複数のチャンネルを形成する電気的な相互接続を用いてメモリコントローラに接続された多くのディスクリートなダイナミックランダムアクセスメモリ(「DRAM」)チップを含む小型の回路基板である。容量を増加させるか、チャンネル数を増加させるか、DRAMバンク又はランクの数を増加させるか、帯域幅を改善するか、レイテンシを減少させるか、或いはこれらのやり方の幾つかの組み合わせなどの、メインメモリ性能を高めるための多くのやり方が存在する。しかしながら、これらの問題に対する典型的な電気的な解決法は、増加させられたピン数及び/又はチップ(ダイ)領域か、或いは増加させられた電力消費のいずれかの理由により、頻繁に、メモリモジュールのコストを増加させる。上述のように、増加させられた電力消費の主要な原因は、長いワイヤ上において伝達(通信)を行う必要性である。フロントサイドバス速度の増加もまた、インターフェースの電力消費における線形な増加を生じさせる。増加させられたフロントサイドバス速度における、DIMMランクの数を増加させることによる追加的な相互接続問題は、信号のタイミングとノイズとの両方が、複数のDIMMsを接続するマルチドロップワイヤ内において問題であるということである。これは、「スタブ・エレクトロニクス」問題と呼ばれ、この問題によって、DRAMsとインターフェースする追加的な外部バッファを必要とするポイント・ツー・ポイントメモリチャンネルによりメモリバスが置換される状態に至ることとなる。しかしながら、大抵のDRAMへの取り組みは、DIMMの置換よりもむしろ、電気的なDIMMからプロセッサチップへの相互接続を有した、より高い密度のメモリデバイスの生成に、焦点があてられてきた。
【発明の概要】
【発明が解決しようとする課題】
【0005】
望まれていることは、追加ピン及び長いワイヤの電力及びコストを考慮することなく、高速な、広い帯域幅の相互接続を提供し、且つ、信号の完全性も維持する、メモリモジュールアーキテクチャである。
【課題を解決するための手段】
【0006】
概要
本発明の様々な実施形態は、積み重ねられた(スタックされた)メモリモジュールに向けられたものである。本発明の一実施形態において、メモリモジュールは、少なくとも1つのメモリコントローラを含むメモリコントローラ層を備える。該メモリモジュールは、スタック状態における少なくとも1つのメモリ層を、該メモリコントローラ層と共に含む。少なくとも1セットのスルー複数バイア(複数のスルーホール)が、前記スタックを通じて、前記少なくとも1つのメモリコントローラの表面に対してほぼ垂直に延在する。該複数バイアは、前記少なくとも1つのメモリコントローラと、前記少なくとも1つのメモリ層のうちの1つとの間の電気的な伝達(通信)を提供する。追加的には、前記スルー複数バイアは、前記スタックの層内の1つか又は複数の要素に一致したピッチとすることができる。そのような要素の幾つかの例は、メモリ層内における、ビット線、センスアンプ、及び入力/出力バッファとすることができる。
【0007】
本発明による、別の実施形態において、前記メモリモジュールは、光学層を更に備える。一実施形態において、該光学層は、該メモリモジュールのスタック内の層であり、該光学層はまた、前記少なくとも1つのメモリコントローラ層に対して双方向にデータを伝達するよう構成された少なくとも1つのバス導波路を含む。追加的には、該光学層を、前記メモリコントローラ層と、前記少なくとも1つのメモリ層との間に配置することができ、前記スルー複数バイアが、該光学層を通じて延在する。
【図面の簡単な説明】
【0008】
【図1】本発明の実施形態による、第1の3次元の電子メモリモジュールの断面図を示す図である。
【図2A】本発明の実施形態による、図1内において示されたメモリモジュールのメモリ層のアーキテクチャを示す図である。
【図2B】本発明の実施形態による、様々な要素のピッチを一致させることによってワイヤの長さを最短化するための、ビット線、センス増幅器、入力/出力ドライバ、及びスルー複数バイア(複数のスルーホール)の構成の概略表現を示す図である。
【図3A】本発明の実施形態による、4つのバンクと、2つのデータスルーバイアと、アドレス及びコントロールスルーバイアとが配置され得る、2つの実現可能なやり方のうちの一方を示す図である。
【図3B】本発明の実施形態による、4つのバンクと、2つのデータスルー複数バイアと、アドレス及びコントロールスルー複数バイアとが配置され得る、2つの実現可能なやり方のうちの他方を示す図である。
【図4】本発明の実施形態による、図1内に示されたメモリモジュールのメモリコントローラ層のアーキテクチャを示す図である。
【図5】本発明の実施形態による、図1内に示されたメモリモジュールの分解等角図を示す図である。
【図6】本発明の実施形態による、第2の3次元の光学メモリモジュールの断面図を示す図である。
【図7】本発明の実施形態による、図6内において示されたメモリモジュールの光学層のアーキテクチャを示す図である。
【図8】本発明の実施形態による、図6内において示されたメモリモジュールのメモリコントローラ層のアーキテクチャを示す図である。
【図9】本発明の実施形態による、図6内に示されたメモリモジュールの分解等角図を示す図である。
【図10A】本発明の実施形態による、光学層における、バス導波路と、4つの電気−光学インターフェースとが配置され得る、2つの例のうちの一方を示す図である。
【図10B】本発明の実施形態による、光学層における、バス導波路と、4つの電気−光学インターフェースとが配置され得る、2つの例のうちの他方を示す図である。
【図11A】本発明の実施形態による、2つの離隔したバス導波路と共に実現された3次元のメモリモジュールの光学層を示す図である。
【図11B】本発明の実施形態による、複数の枝分かれした(分岐した)バス導波路と共に実現された3次元のメモリモジュールの光学層を示す図である。
【図12】本発明の実施形態による、第3の3次元の電子メモリモジュールの断面図を示す図である。
【図13】本発明の実施形態による、光学層の上面図を示す図である。
【図14】本発明の実施形態による、第4の3次元の電子メモリモジュールの断面図を示す図である。
【実施例】
【0009】
詳細な説明
本発明の実施形態は、内部相互接続遅延を低減させるための複数の内部データバスを含んだ積み重ねられた(スタックされた)3次元のメモリモジュールに向けられたものである。該複数の内部データバスは、スルーシリコン複数バイアを用いて実現され、該メモリモジュールが、多くの小さな、広帯域幅のサブブロックとして編成されることを可能にし、それにより、アクセス時間が低減され且つ電力消費が低減されることとなる。
【0010】
図1は、本発明の実施形態による、3次元の電子メモリモジュール(「メモリモジュール」)100の断面図を示す。示された例において、メモリモジュール100は、パッケージ本体104の上面の上に配置されたメモリコントローラ層102と、該メモリコントローラ層102の上面の上に配置された8つの個別のメモリ層105〜112のスタックと、を備える。該メモリ層105〜112は、DRAMなどの揮発性メモリ層とすることができるか、不揮発性メモリ層とすることができるか、或いは揮発性メモリ層と不揮発性メモリ層との組み合わせとすることができる。メモリコントローラ層102及びメモリ層105〜112は、金属化されたか又はスルーシリコン複数バイアのようなスルー複数バイア(ス複数のスルーホール)によって接続された相補型金属酸化膜半導体(「CMOS」)シリコンデバイスであり、該スルー複数バイアは、該メモリコントローラ層102に対してほぼ垂直である。図1は、メモリコントローラ層102の上面から、メモリ層105〜122の各々を通じてほぼ垂直に延在する2つの複数のスルー複数バイア114及び116を明示している。これらのスルー複数バイアは、バスであり、該バスによって、アドレス、コントロール、及びデータの電気信号が、メモリ層105〜112と、メモリコントロール層102との間において伝達されることが可能になる。該メモリコントロール層102は、メモリモジュール100とプロセッサ(図示せず)との間においてデータを伝達する少なくとも1つの高速な外部電子インターフェース(図示せず)を含む。好適には、各層は、約25〜50ミクロンの間にわたる範囲の厚みを有したチップ(ダイ)層である。
【0011】
図2Aは、本発明の実施形態による、メモリモジュール100のメモリ層105のアーキテクチャを示す。メモリ層105は、16バンクと、8セットのデータスルー複数バイアと、4セットのアドレス及びコントロールスルー複数バイアとを備える。メモリ層105はまた、残りのメモリ層106〜112の構造上の床平面図を表す。メモリ層105内には示されていないが、各バンクは、メモリアレイ、行デコーダ、列デコーダ、及びセンス増幅器(「センスアンプ(SA)」)を備える。該メモリ層の該バンクは、複数のメモリセルを含み、該複数のメモリセルは、行と列とをなしており、及び、各メモリセルは、1つのビット線と、1つのワード線とにより提供されたデータを格納する。メモリ層105の前記16バンクは、4つの領域内へと配置される。一領域は、データスルー複数バイアの1つか又は複数のセットと、並びに、アドレス及びコントロールスルー複数バイアの1つか又は複数のセットと、電気的な連絡状態にある多くのバンクである。データスルー複数バイアの各セットと、アドレス及びコントロールスルー複数バイアの各セットとが、メモリ層105のサブ領域の範囲に制限される(領域付けられる)。例えば、4つのバンク204〜207と、2セットのデータスルー複数バイア208及び209と、1セットのアドレス及びコントロールスルー複数バイア210とを含むメモリ層105の領域を、ダッシュ線の四角形202が特定する。バンク204及び205は、データスルー複数バイア208と電気的に連絡しており、バンク206及び207は、データスルー複数バイア209と電気的に連絡している。データスルー複数バイア208は、2つのバンク204及び205と、メモリコントローラ(図示せず)との間においてデータ伝達を提供し、データスルー複数バイア209は、2つのバンク206及び207と、同じ該メモリコントローラ(図示せず)との間においてデータ伝達を提供する。更にまた、バンク204〜207内に格納されたデータの物理アドレスを伝達するために、メモリコントローラに対してコマンドを送受するために、及び、該バンクから、(メモリコントローラが、バンク204〜207内のメモリからデータを読み出していたか、又は、バンク204〜207内のメモリへとデータを書き込んでいたかどうかを示す信号などの)ステータス信号を得るために、領域202の全ての4つのバンク204〜207は、アドレス及びコントロールスルー複数バイア210と電気的に連絡している。
【0012】
バンクと、データスルー複数バイアバスとの間の相互接続距離を最短化するために、該データスルー複数バイアは、センスアンプと、該バンクに対して双方向にデータを転送する入力/出力論理(図示せず)と共に、ライン(線)内において配置され得るということを留意されたい。データバス幅を広げるために、及び、その結果として、任意の個々のバンクに対して双方向に利用可能な帯域幅を広げるために、スルー複数バイアのピッチを選択することができる。用語「ピッチ」は、スルー複数バイアの中心から中心までの間隔を指し、ここで、該スルー複数バイアは、ほぼ規則正しいパターンにおいて配置され得る。あるファインピッチが推奨される。約50ミクロンよりも狭いピッチを使用することができるか、或いは、好適には、約25ミクロンのピッチを使用することができる。約25ミクロンのピッチは、約0.1ミクロンである可能性がある典型的なバンクビット線のピッチよりも広い。結果として、ある実施形態において、メモリ層アーキテクチャは、多くのビット線が、同じスルー複数バイアを共有するように構成され得る。例えば、DRAMメモリ層は、256のビット線が、同じスルー複数バイアを共有するように構成され得る。従って、ビット線のブロックは、約25.6ミクロン幅である。該スルー複数バイアが、該ビット線に一致させられたピッチとなるように、該スルー複数バイアは、約25.6ミクロンで隔置され得る。2つか又はそれよりも多くの様々なタイプの物体が同じピッチにおいて配置される場合の時には、それらの間の配線が最短化されることとなるように、及び、その配線パターンが同一となり及び繰り返されることとなるように、一致させられる(マッチングとられる)ピッチを考えることができる。他の実施形態において、約12ミクロンの、より微細なピッチ(ファインナーピッチ)でさえも、結果として、バンクのエッジに沿って配置された2倍の多くのスルー複数バイアをもたらすことができ、そのことは、メモリからメモリコントローラへのメモリ帯域幅を2倍にすることとなる。メモリ層105における4つのサブ領域の各々の中における、4つのバンクと、2セットのデータスルー複数バイアと、アドレス及びコントロールスルー複数バイアのセットとの配置が、バッファのセンスアンプと、データスルー複数バイアとの間の相互接続距離を最短化する。例えば、バンク204及び205は、センスアンプ(SA)212及び214と、データスルー複数バイア208との間の相互接続距離が、最短なものとなるように構成される。
【0013】
図2Bは、本発明の実施形態による、様々な要素のピッチを一致させることによってワイヤの長さを最短化する、ビット線、センスアンプ、入力/出力ドライバ、及びスルーシリコン複数バイアの配置(構成)の概略表現を示す。各ビット線は、センスアンプに接続されている。例えば、ビット線220〜225が、センスアンプ230〜235に接続されている。該センスアンプの各々は、時間遅延と電力消費とを低減させることを助けるビット線からのビットに関連付けられた電圧を増幅させる。該センスアンプからの出力は、次いで、対応するマルチプレクサに伝達され、該マルチプレクサは、該センスアンプからの出力を、単一の選択されたデータ出力に組み合わせる。センスアンプ230〜235からの出力は、例えば、マルチプレクサ240に伝達されて、選択されたデータ出力242内へと組み合わされる。各マルチプレクサからの選択されたデータ出力は、入力/出力バッファ244のような、対応する入力/出力バッファによって、バッファリングされて、対応するメモリコントローラに、(スルー複数バイア246のような)接続されたスルー複数バイアを介して伝達される。ビット線、センスアンプ、入力/出力バッファ、及びスルー複数バイアのシリコン上の物理レイアウトは、各々のピッチが、複数のその他のものとほぼ等しいこととなるようにか、或いは、配線のパターンが、メモリアレイにおける全てのデータスルー複数バイアにわたって規則正しく繰り返すこととなるように、配置され得る。
【0014】
光学レイアウトのために、ビット線と、スルー複数バイアとの間のピッチを一致させることに加えて、該ビット線の帯域幅と、該スルー複数バイアとの間のマッチングをとることがあり得る。例えば、図2B内に示されたビット線の概略表現が、マット250内に512行のビット線を含み、且つ、該ビット線は、200MHzのメモリクロック速度で信号が送られるということを仮定する。該マット250はまた、2つのスルー複数バイア246及び248を含み、該2つのスルー複数バイア246及び248は、約3.2GHzのより高速なデータクロック速度で信号が送られる。データクロックと、メモリクロックとの間での、信号伝達速度におけるその16:1の比率のため、マット250からの複数ビットが、各データクロックに関して、スルー複数バイア246及び248上において時分割多重され得る。各データクロックサイクルごとに、32ビットが、マット250から読み出されて、各スルー複数バイア上において16ビットが読み出される。従って、キャッシュ線全体は、16データクロックサイクル内においてマット250から読み出され得る。このアプローチの利益は、マット250からの読み出された全てのビットが使用されるので、かなりの量の電力が節約されるということである。しかしながら、従来のDRAMでは、複数のマットがアクセスされて、典型的には、それらの内容を、4096ビット行バッファへと駆動することとなるが、特定のDRAM構成要素に対する任意の列アクセスに関して、所与のデータ転送中に、チップ出力に対してこれら4096ビットのうちの8つだけが駆動される。複数のデータ転送サイクルを、所与の列アクセスに関連付けることができる。例えば、列サイズが16バイト(128ビット)であり、且つ、典型的なDRAMチャンネルサイズが64ビットだった場合には、2つのデータ転送サイクルが、各列アドレスコマンドをフォローすることとなる。この例において、キャッシュ線サイズが、64バイト(512ビット)であり、且つ、列サイズが(上記のように)16バイトである場合には、単一キャッシュ線に配送するために、4つの列アクセスコマンド(又は8つのデータ転送サイクル)が必要となることとなる。本発明において、キャッシュ線全体をアクセスすることは、単一コマンドだけが必要とされることとなり、これにより、制御オーバヘッドとレイテンシとが低減される。更に、本発明は、ごく一部ではなく、行バッファ内へと読み出された全てのビットを利用することとなる(64ビットは、結果として、かなりの省電力化をもたらす)。
【0015】
図2内に示されたメモリ層105内の4つの領域内におけるバンクと、データスルー複数バイアと、アドレス及びコントロールスルー複数バイアとの配置は、これらのデバイスの最適な配置(構成)を表しているが、同じデバイスにおける他の配置(構成)も可能である。図3A〜3Bは、本発明の実施形態による、4つのバンク204〜207と、2つのデータスルー複数バイア208及び209と、アドレス及びコントロールスルー複数バイア210とが、配置され得る、わずかに2つの実現可能なやり方のみを示す。他の実施形態において、ある領域を含む、バンクと、データスルー複数バイアと、アドレス及びコントロールスルー複数バイアとが、任意の数の様々な適合可能な配置(構成)を有することができる。更に、メモリ層の領域は、4つのバンクと、2セットのデータスルー複数バイアと、1セットのアドレス及びコントロールスルー複数バイアとに制限されない。他の実施形態において、任意の数のデータスルー複数バイアと、任意の数のセットのアドレス及びコントロールスルー複数バイアとに電気的に連絡している任意の数のバンクを、ある領域が有することができる。他の実施形態において、メモリ層は、1つか、2つか、3つか、5つか、9つか、16か、又は任意の数の領域と共に構成され得り、各領域は、任意の適合可能な数のバンク、データスルー複数バイアのセット、並びに、アドレス及びコントロールスルー複数バイアのセットを有する。該領域は、(図2内に示されるような)四角形にか、長方形にか、(横並びの)列にか、或いは、任意の他の適合可能な領域配置へと配置され得る。他の実施形態において、メモリモジュール100のメモリ層の数を、必要に応じて低減させるか又は増加させることができる。
【0016】
図4は、本発明の実施形態による、メモリモジュール100のメモリコントローラ層102のアーキテクチャを示す。メモリコントローラ層102は、4つのメモリコントローラ401〜404を含む。各メモリコントローラは、2セットのデータスルー複数バイアと、1セットのアドレス及びコントロールスルー複数バイアとに電気的に連絡しており、それらが、更に、メモリ層105〜112の各々の中のある特定領域の4つのバンクに電気的に連絡している。例えば、メモリコントローラ402は、データスルー複数バイア208及び209と、アドレス及びコントロールスルー複数バイア210とに電気的に連絡している。
【0017】
図5は、本発明の実施形態による、メモリモジュール100の分解等角図をを示す。メモリ層105〜112の領域との、メモリコントローラ層102のメモリコントローラ401〜404のアライメントを明らかに示すために、メモリ層105と、メモリコントローラ層102とが、残りのメモリ層106〜112から分離されて示されている。図5はまた、データスルー複数バイアのセットと、アドレス及びコントロールスルー複数バイアのセットとが、メモリ層105〜112を通じて、メモリコントローラ401〜404に対してほぼ垂直に延在する複数バスであるということを明示している。各メモリ層内における各領域の複数バンクは、2セットのデータスルー複数バイアと、1セットのアドレス及びコントロールスルー複数バイアとを経由して、4つのメモリコントローラのうちの1つと電気的に連絡している。例えば、図5内に示されているように、メモリコントローラ402は、データスルー複数バイア208及び209とアドレス及びコントロールスルー複数バイア210とを介して、領域202のバンク204〜207と電気的に連絡している状態とすることができ、及び、該メモリコントローラ402は、同じ該データスルー複数バイア208及び209と、同じ該アドレス及びコントロールスルー複数バイア210とを介して、メモリ層112の領域506の4つのバンク501〜504と電気的に連絡している状態とすることができる。各メモリコントローラは、各メモリコントローラ上に位置付けられた各領域の電気的に結合されたバンクに対する双方向のデータの流れを調整する。例えば、メモリコントローラ402は、領域202のバンク204〜207に対する双方向のデータの流れと、メモリ層112の領域506のバンク501〜504に対する双方向のデータの流れと、領域202と506との間のメモリ層106〜111の領域に対する双方向のデータの流れとを調整する。
【0018】
メモリコントローラ層102内におけるメモリコントローラの数と配置とが、メモリ層の各々の中における領域の配置の数によって決定される。例えば、追加的な5つの領域が含まれるように、メモリ層105〜112の各々を拡張することは、追加的な5つのメモリコントローラが含まれるようにメモリコントローラ層102を拡張する結果になることとなる。
【0019】
メモリモジュール100の内部アーキテクチャは、従来の積み重ねられたメモリのアーキテクチャを越える多くの利点を提供する。第1に、メモリモジュール100のアーキテクチャは、メモリ層と、メモリコントローラ102との間において、複数バスとして動作する内部スルー複数バイアを経由して、電気的な伝達(通信)を実施するため、メモリ層及びメモリコントローラの周囲上に配置される結合バッドの必要性と、メモリ層をメモリコントローラ層に相互接続するために機械的に取り付けられる結合リード線の必要性とが、排除される。第2に、メモリ層をメモリコントローラに積み重ねることと、バンクとメモリコントローラとの間に電気的な伝達(通信)複数バスを提供する複数バイアを含めることとが、データ交換を行うためにバンク及びメモリコントローラに対して必要とされる距離と、電力と、アクセス時間とを低減させる。追加的には、集積(統合)されたスルー複数バイア(例えば、TSVs)は、より微細なピッチ(ファインナーピッチ)接続であり、該接続によって、バンクとメモリコントローラとの間におけるより多くの数の電気信号経路が実現可能となり、それにより、帯域幅が広げられる。追加的には、複数のスルー複数バイアバスによって、複数のメモリコントローラが、メモリに対して並列にアクセスすることが可能となる。メモリに対する複数のアクセスポイントが存在する。
【0020】
本発明の他の実施形態は、メモリコントローラ層と、メモリ層のスタックとの間において、光相互接続層(「光学層」)を含む。この光学層は、該メモリコントローラ層とプロセッサとの間における外部の電気的接続の必要性を排除する。その結果として、光学層は、従来の外部の電気的接続を上まわる多くの利点を提供する。該利点には、電力消費を低減させることと、高密度波分割多重(「DWDM」)に起因してより広い帯域幅を提供することと、単一ケーブルトラックと複数のモジュール挿入ポイントとに起因してコストを低減させることと、ブロードキャストのスタブ・エレクトロニクス問題を排除することとが含まれる。
【0021】
図6は、本発明の実施形態による、3次元の光学メモリモジュール600の断面図を示す。該メモリモジュール600は、メモリコントローラ層102内に含まれる、外部の電気的な接続が、底のメモリ層105とメモリコントローラ層604との間に配置された完全に分離された光学層602によって置き換えられていることを除いて、メモリモジュール100と全く同一である。更に、データスルー複数バイアのセットと、アドレス及びコントロールスルー複数バイアのセットとが、スルー複数バイア114及び116によって表されており、該スルー複数バイア114及び116は、該光学層602を通過し、且つ、メモリコントローラ層602にほぼ垂直である。光学層602は、高速なデータ速度、DWDM光学リンクを実現する。該DWDM光学リンク上において、メモリモジュール600が、コマンド、書き込みデータを受け取り、及び、データか又は肯定応答(acknowledges)データパケットで応答する。DWDMは、単一光ファイバ内におけるか又は導波路内における多重化を提供する。異なる波長の光に各チャンネルが対応する状態での単一導波路上において、光における分離された並列チャンネルが伝達され得る。プロセッサのような他のデバイスに対する外部光学インターフェースを、光ファイバ606のような1つか又は複数の光ファイバを用いて達成することができ、該光ファイバは、光学層602上の光導波路に光学的に結合される。
【0022】
図7は、本発明の実施形態による、メモリモジュール600の光学層602のアーキテクチャを示す。光学層602は、バス導波路702と、4つの電気―光学インターフェース704〜707と、メモリ層105〜112とメモリコントロール層604との間を通るスルーバイアのセット(例えばTSVs)の専用の(データスルー複数バイア208及び209、及びアドレス及びコントロールスルー複数バイア210のような)サブ領域とを含む。バス導波路702は、1つか又は複数の波長を搬送するために、様々な構成において実現され得る。例えば、それは、単一波長による単一導波路とすることができるか、1つか又は複数の波長を各々が搬送する(好適には交差しない)複数の導波路とすることができるか、或いは、複数の波長を搬送する単一導波路とすることができる。バス導波路702は、シリコン基板708上に配置された適合可能な誘電材料とすることができる。バス導波路702は、電気−光学インターフェース704〜707と光学的に連絡している状態とすることができる。該電気−光学インターフェース704〜707は、シリコンナノフォトニクスのようなナノフォトニクスを用いて実現される。(レーザ源710のように)光学層602上に実装されているレーザ源によってか、或いは、光ファイバ606のような外部光学インターフェース通じて光電力が受け取られる、メモリモジュール上には実装されていない外部の光源からか、のいずれかのレーザ源のような光源によって、光電力が提供され得る。例えば、プロセッサシステムのような外部システムによって生成された光学信号は、光学的な接続606を介して受け取られ得る。
【0023】
レーザ源はまた、集積されたモード同期レーザとすることもできる。レーザにおける1つの波長だけが、アクティブに安定化させられるために必要となるため、レーザ源の出力波長を、電気−光学インターフェース704〜707の検出器の波長にチューニングするタスクが、簡単化される。残りのチャンネルの波長は、モード同調周波数の整数倍だけ基準波長とは異なるものとすることができ、受動か又は能動の何れかのモード同期を用いることができる。共振器にウェハーボンディングされたIII−V半導体ゲイン領域を有したバス導波路702と同じ材料を用いてレーザ源のレーザキャビティが組み立てられる時には、従って、メモリモジュール600と同じボード上にレーザ源が配置されている限り、波分割多重化されたチャンネル及びレーザ基準波長が、その環境内の周囲の温度変化を粗く追跡して、能動安定化システムを簡単化させる。
【0024】
図8は、本発明の実施形態による、メモリモジュール600のメモリコントローラ層604のアーキテクチャを示す。メモリコントローラは、メモリコントローラ層604が、同等の電気−光学インターフェース704〜707を含むことを除いて、図4内に示されたメモリコントローラ層102と全く同一である。該電気−光学インターフェース704〜707はまた、それぞれ、メモリコントローラ401〜404に電気的に結合される。該電気−光学インターフェース704〜707は、バス導波路702内において伝達された光学チャンネルを、電気信号へと変換し、該電気信号は、該電気−光学インターフェース704〜707を介して該メモリコントローラ401〜404に電気的に伝達される。
【0025】
図9は、本発明の実施形態による、メモリモジュール600の分解等角図を示す。メモリ層105〜112の領域との、電気−光学インターフェース704〜707及びメモリコントローラ401〜404のアライメントを明らかに示すために、底のメモリ層105、光学層602、及びメモリコントローラ層604が、互いに分離されて、及び、残りのメモリ層106〜112から分離されて示されている。図9は、データスルー複数バイアのセットと、アドレス及びコントロールスルー複数バイアのセットとが、メモリ層105〜112と光学層602とを通じて、メモリコントローラ401〜404に対してほぼ垂直に延在する複数バスであるということを明示している。各メモリ層内における各領域の複数バンクは、図5に関連して上記に説明したように、4つのメモリコントローラ401〜404のうちの1つと電気的に連絡している。電気−光学インターフェース704〜707は、メモリコントローラ層604から、光学層602内へと延在し、メモリコントローラ402〜404と電気的に連絡しており、及び、バス導波路702と光学的に連絡している。例えば、電気−光学インターフェース705は、メモリコントローラ層604のメモリコントローラ402と電気的に連絡しており、及び、光学層602のバス導波路702と光学的に連絡している。電気−光学インターフェース704〜707内における検出器が、バス導波路702から光学信号を受け取り、該光学信号を電気信号へと変換し、該電気信号が、電気的に結合されたメモリコントローラ401〜404に、それぞれ電気的に伝達される。バス導波路702上への応答データの出力信号を、電気−光学インターフェース704〜707の各々によって、バス導波路702に沿って伝達されるチャンネルの強度を変調させることより、達成することができる。
【0026】
動作中、メモリモジュール600は、光ファイバ606上のコマンドを受け取って、メモリ層105〜112のバンクからデータブロックを読み出し、及び、メモリ層105〜112のバンクへとデータブロックを書き込む。該データブロックは、典型的には、プロセッサキャッシュ線のサイズである。例えば、データブロックは、64バイトか、又は128バイトとすることができる。メモリモジュール100とメモリモジュール600とに関連して上記に説明した個々のメモリコントローラの各々は、アドレス範囲における異なるセクションに応答する。該アドレス範囲は、モジュール内において連続している状態である。該メモリコントローラは、従って、その対応するコントロール、アドレス、及びデータスルー複数バイアに関して、読み出し動作か又は書き込み動作を開始する。該メモリコントローラは、読み出し又は書き込みメモリリクエストをアサートし、該メモリリクエストが、複数の積み重ねられたメモリ層のうちのどのメモリ層がアクセスされているかを識別(特定)する。該メモリリクエストはまた、メモリ層の複数バンクが、同じデータスルー複数バイアを共有する場合のケースにおいて、メモリ層内における特定バンクを識別(特定)する。個々のメモリリクエストの各々は、従って、単一メモリ層上の単一バンクによって処理される。メモリコントローラはまた、リフレッシュ及び誤り訂正符号のような全ての他の機能に対する責任を負う。メモリコントローラ当り4チャンネルと仮定すると、約25ミクロンピッチを有した複数バイアを用いることによって、スルー複数バイアの領域オーバーヘッドは、メモリ層の3%未満とすることができる。約50ミクロン未満のピッチを有したスルー複数バイアによって、メモリ層が、単一行アクセスからのキャッシュ線全体を提供するために構成されることを可能にすることができる。
【0027】
図7〜図9内に示された、バス導波路702の構成と、電気−光学インターフェースの配置は、多くの様々な構成のうちのただ1つのみを表している。他の実施形態において、バス導波路702の長さを、増加させることができ、及び、図10A内において示されているように、全ての電気−光学インターフェースが光学層602の外側(端)に配置されることとなるように、2つの電気−光学インターフェースを、光学層602上において再配置することができる。更に他の実施形態において、バス導波路702の長さを、低減させることができ、及び、図10B内において示されているように、全ての電気−光学インターフェースが光学層602の内側に配置されることとなるように、2つの電気−光学インターフェースを、光学層602上に再配置することができる。他の実施形態では、バンク及びスルー複数バイアを、図3に関連して上記に説明したように、再配置することができ、及び、電気−光学インターフェースの数を、用いられる領域の数に一致させるよう変更することができる。
【0028】
本発明の実施形態は、単一バス導波路702に制限されない。他の実施形態において、単一バス導波路を、様々なバス導波路によって置き換えることができ、各々のバス導波路は、電気−光学インターフェースのサブセットに対するアクセスを有する。例えば、図11Aは、本発明の実施形態による、2つの離隔したバス導波路1102及び1104と共に実現された光学層602を示す。他の実施形態において、該バス導波路を、枝分かれした(分岐した)導波路、及び、2つか又はそれよりも多くのバス導波路が含まれるよう再構成することができ、該バス導波路は、電気−光学インターフェースの様々な適合可能な配置にアクセスするために用いられ得る。例えば、図11Bは、本発明の実施形態による、2つの枝分かれしたバス導波路1106及び1108と共に実現された光学層602を示す。光帯域幅を広げるために、バス導波路702、1002、1004、1102、及び1104を、2つか又はそれよりも多くのほぼ並列なバス導波路によって、各々置き換えることができ、ここで、2つか又はそれよりも多くのほぼ並列なバス導波路を、異なる電気−光学インターフェースに対して光学的に結合させることもできる。プロセッサと、メモリコントローラ層のメモリコントローラとの間においてDWDM光学伝達(通信)を利用することによって、複数のチャンネルが、一度に使用されることが可能となる。更には、本発明において用いられる電気的なメモリチャンネルは、メモリ層のスタック内に含まれており、このことは、メモリコントローラに対して追加されるコストが、全ての電気的なメモリデバイスにおいて上昇することとなるよりも、光学的な接続と共により緩やかに上昇するということを意味している。
【0029】
本発明は、特定の実施形態に関して説明されてきたが、本発明が、これらの実施形態に制限されることは意図されていない。本発明の原理内における修正が、当業者にとって明らかとなるであろう。例えば、本発明の他の実施形態において、スタック内のデバイス層の順序及び配向は、図1及び図6内に示された層の順序に制限されない。他の実施形態において、デバイス層は、任意の適合可能な順序を有することができる。例えば、図6に関連した上述の光学層とメモリコントローラ層とを、切り替えることができる。図12は、本発明の実施形態による、3次元の電子メモリモジュール1200の断面図を示す。メモリモジュール600とは異なり、メモリモジュール1200は、パッケージ本体104の上面の上に配置された光学層1202と、該光学層1202の上面の上に配置されたメモリコントローラ層1204とを含む。メモリモジュール1200は、図6に関連して上記に説明したようなデータ、コントロール、及びアドレススルー複数バイアを、光学層を通じて延在させる必要性を排除する。図13は、本発明の実施形態による、光学層1202の上面図を示す。この実施形態において、光学層1202は、データ、コントロール、及びアドレススルー複数バイアが無いことを除いて、光学層602と全く同一である。本発明の他の実施形態において、高速な外部の電気的インターフェースを光学インターフェースに置き換えることによって、メモリモジュール100を変更することができる。図14は、本発明の実施形態による、メモリモジュール1400の断面図を示す。メモリコントローラ層1402が、光学層1404の電気−光学インターフェースに電気的に結合されており、該電気−光学インターフェースは、光ファイバ1406に光学的に結合されている。他の実施形態において、メモリモジュール600及び1200には、全て、光学層とメモリコントローラ層との間に配置された分離したアナログ層を含めることができる。メモリコントローラからのディジタル信号を、変調器か又は光学層上の他のデバイスを制御するために必要とされるアナログ信号に変換するためにか、光検出器のアナログ出力を、メモリコントローラに入力されることとなるディジタル信号に変換するためにか、或いは、他の利用のために、このようなアナログ層が使用され得る。
【0030】
上述のアーキテクチャは、3つの主要領域において、すなわち、アクセス時間、帯域幅、及び電力において、既存の及び提案されたメモリモジュール設計を上まわる多くの利点を有する。典型的なDRAMデバイスでは、複数バンク間の接続は、グローバルな入力/出力配線を通じて実施されており、該配線は、提示している発明の光学メモリモジュールと比べれば、該DRAMデバイスを横切って電気的にデータを伝達させるために、かなりの量の時間がかかる。光学メモリモジュール実施形態において、グローバルな入力/出力機能は、光学層によって効果的に実施され、該光学層において、バッファ及びリピータが無くても、データが伝達され得る。光学メモリモジュールのアーキテクチャによって、より多数のより小さなバンクが使用されることも可能となる。このことは、2つのやり方で、アクセス時間を改善させる。第1に、個々のバンクによるアクセス時間が、より高速になり、第2に、バンク衝突(バンクコンフリクト)の確率が低減される。以前のリクエストをまだ処理中のメモリバンク上にメモリアクセスが発生した時に、バンク衝突(バンクコンフリクト)は発生し、これにより、先行するリクエストが完了するまで、前者のアクセスが、後者のアクセスをブロックさせ、第2のアクセスのための実効アクセス時間が増加させられる。
【0031】
DWDM光学相互接続の利用が、メモリモジュールに対する、より広い帯域幅の接続を可能にする。類似の電気的接続が実現され得るが、その結果、制限された入力/出力ピンに起因して帯域幅が狭められるか、或いは、より多数の入力/出力ピンを用いることに起因してコストがかなり増加するかのいずれかとなる可能性がある。電気信号を伝達するオプションの別の不利な点は、この入力/出力を高速で駆動するために必要とされる超過電力である可能性がある。更に、ワイヤのための、ビット当りの伝達エネルギー要件が、所与のワイヤ特性セットのためのワイヤ長によって、本質的に、線形にスケール変更される。光学的な伝達のための該エネルギー要件は、送り側(電気から光への変換)と、受け側(光から電気への変換)とによって支配され、コンピュータメモリシステムのための対象となるスケールについての長さとは効果的に独立している。光学的に接続されたメモリモジュールのために必要とされる電気的な入力/出力だけが、電力供給された信号、アース信号、及び低速制御及び監視信号とすることができる。光学インターフェース上においてDWDMを利用することは、メモリモジュールをオン及びオフにする光学信号を伝達するために、少数のファイバだけが、おそらくは単一ファイバだけが、必要とされるということを意味する。プロセッサ及び/又はマザーボードと、メインメモリとの間の光学的な伝達(通信)は、信号完全性及び同期に関してかなりの利点を有する。電気的な解決法は、ジッタ、反射、及びクロストークに悩まされる。これらの問題の全てが、光学領域(分野)においてかなり低減される。
【0032】
多くのやり方において、メモリモジュールの電力消費が低減される。第1に、小さなメモリ領域の使用は、ビット及びワード線の静電容量がより少なくなるので、個々の領域のアクセス電力を低減させる。第2は、複数の領域が、キャッシュ線に寄与する場合には、メモリリクエストのために必要とされる、センス増幅器内へと且つ後続せずに読み出されるデータ量が、極めて低減されるので、キャッシュ線全体を提供する単一領域が、モジュール編成と比較してデバイスアクセス電力を低減させるという事実である。以前に述べたように、入力/出力構造がまた、外部の接続性と、メモリグローバル機能との両方についての光相互接続の利用を通じて、極めて少ない電力を消費する。本アーキテクチャの更なる利点は、上述のように、極めてスケーラブルであるということとすることができる。任意の積み重ねられた(スタックされた)構成に対してデバイスを追加する時に、制限する要因のうちの1つが電力である。光学的に接続されたメモリモジュールのケースでは、追加的なメモリ層が、電力の必要性を極めて高めることは無い。入力/出力電力はまた、ほぼ一定のままであり、メモリ層の数が増加するとリフレッシュ電力のみがスケール変更される。
【0033】
説明を目的とした上述の記載には、本発明の完全な理解を提供するために、特定の専門用語が使用された。しかしながら、本発明を実践するために特定の詳細事項は必要とされないということは、当業者にとって明らかであろう。本発明の特定の実施形態の上述の記載は、図示すること及び説明することの目的のために提示されている。それらは、網羅的であるようには意図されておらず、或いは、開示した厳密な形態に本発明を限定するようには意図されていない。上記教示を考慮して、明らかに、多くの修正と変形形態とが実現可能である。本発明の原理とその実際的な用途(アプリケーション)の最良の説明を行うために、そしてそれにより、他の当業者が、本発明及び様々な実施形態を、予期される特定の使用に対して適切とされるような様々な修正によって、最良に利用することを可能にするために、実施形態が示され且つ説明されている。本発明の範囲は、以下の特許請求の範囲及びそれらの等価物によって画定されることが意図されている。

【特許請求の範囲】
【請求項1】
メモリモジュール(100、600、1200、1400)であって、
少なくとも1つのメモリコントローラを含むメモリコントローラ層(102、602、1204、1402)と、
前記メモリコントローラ層と共にスタック状態にある、少なくとも1つのメモリ層(105〜112)と、
前記スタックを通じて、前記少なくとも1つのメモリコントローラ(401〜404)の表面に対してほぼ垂直に延在する、少なくとも1セットのスルー複数バイア(114、116、208、210)
とを備え、
少なくとも1つのスルー複数バイアの、前記少なくとも1セットが、前記少なくとも1つのメモリコントローラと、前記少なくとも1つのメモリ層のうちの1つとの間において電気的な伝達を提供することからなる、メモリモジュール。
【請求項2】
前記少なくとも1セットのスルー複数バイアが、
データスルー複数バイア(208)であって、該データスルー複数バイアを通じて、データが、前記少なくとも1つのメモリ層に対して、双方向に伝達されることからなる、データスルー複数バイアと、
アドレススルー複数バイア(210)であって、該アドレススルー複数バイアを通じて、前記少なくとも1つのメモリ層内に格納されたデータの物理アドレスが、前記少なくとも1つのメモリ層に伝達されることからなる、アドレススルー複数バイアと、
コントロールスルー複数バイア(210)であって、該コントロールスルー複数バイアを通じて、コマンド及びステータス信号が、前記少なくとも1つのメモリ層に対して双方向に伝達されることからなる、コントロールスルー複数バイア
とのうちの1つか又は複数を含むことからなる、請求項1に記載のメモリモジュール。
【請求項3】
前記1つのメモリ層と、前記メモリコントロール層との間において、電気的な伝達を提供する前記少なくとも1セットのスルー複数バイアが、前記少なくとも1つのメモリ層の少なくとも1つのメモリバンクに電気的に結合され、且つ前記メモリコントローラ層の前記少なくとも1つのメモリコントローラに電気的に結合された、前記少なくとも1セットのスルー複数バイアを更に含むことからなる、請求項1に記載のメモリモジュール。
【請求項4】
外部インターフェースが、
外部の電気的インターフェースか、又は、
外部の光学的インターフェース(1404)
のうちの1つを更に含むことからなる、請求項1に記載のメモリモジュール。
【請求項5】
前記少なくとも1つのメモリ層と前記メモリコントローラ層と共に、前記スタック内に光学層(602、1202)を更に備え、
前記少なくとも1つのメモリコントローラ層に対してデータを双方向に伝達するよう構成された少なくとも1つのバス導波路を、前記光学層が含むことからなる、請求項1に記載のメモリモジュール。
【請求項6】
前記光学層が、
前記メモリコントローラ層と前記少なくとも1つのメモリ層との間に配置された前記光学層と、前記光学層を通じて延在する前記スルー複数バイアと、
前記少なくとも1つのバス導波路と光学的に連絡しており、且つ、前記少なくとも1つのメモリコントローラと電気的に連絡していることからなる、前記少なくとも1つの電気−光学インターフェース(704〜707)と、
前記少なくとも1つのバス導波路の第1の端部に光学的に結合された集積されたモード同期レーザ(710)
とを更に含むことからなる、請求項5に記載のメモリモジュール。
【請求項7】
基板上に配置され、且つ、前記少なくとも1セットのスルー複数バイアの近傍に位置付けられた、少なくとも1つのバンク(204〜207)を、前記少なくとも1つのメモリ層が更に含むことからなる、請求項1に記載のメモリモジュール。
【請求項8】
前記基板上に配置され、且つ、前記少なくとも1セットのスルー複数バイアの近傍に位置付けられた、前記少なくとも1つのバンクが、
前記少なくとも1つのバンクにおける多くのビット線(220〜225)であって、ピッチが、前記スルー複数バイアに一致させられており、前記スルー複数バイアのセットのうちのあるスルーバイアと電気的に連絡していることからなる、ビット線と、
前記少なくとも1セットのスルー複数バイアの近傍の前記バンクの端部の付近に配置された多くのセンス増幅器(230〜235)であって、該センス増幅器の各々が、あるビット線に電気的に結合されていることからなる、センス増幅器
とを更に含み、
前記ビット線の帯域幅と、前記スルー複数バイアの帯域幅とを一致させることを更に含むことからなる、請求項7に記載のメモリモジュール。
【請求項9】
前記多くのビット線に電気的に結合され、且つ、前記スルーバイアに電気的に結合されたマルチプレクサ(240)を、前記スルーバイアと電気的に連絡している前記多くのビット線が更に含み、
前記マルチプレクサが、前記ビット線からの出力を、前記スルーバイア上の単一の選択されたデータ出力内へと組み合わせることからなる、請求項8に記載のメモリモジュール。
【請求項10】
前記スルー複数バイアが、
金属化された複数バイアか、又は、
スルーシリコン複数バイア
のうちの1つを更に含むことからなる、請求項1に記載のメモリモジュール。

【図1】
image rotate

【図2A】
image rotate

【図2B】
image rotate

【図3A】
image rotate

【図3B】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10A】
image rotate

【図10B】
image rotate

【図11A】
image rotate

【図11B】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate


【公表番号】特表2011−503760(P2011−503760A)
【公表日】平成23年1月27日(2011.1.27)
【国際特許分類】
【出願番号】特願2010−531048(P2010−531048)
【出願日】平成20年10月23日(2008.10.23)
【国際出願番号】PCT/US2008/012118
【国際公開番号】WO2009/055031
【国際公開日】平成21年4月30日(2009.4.30)
【出願人】(503003854)ヒューレット−パッカード デベロップメント カンパニー エル.ピー. (1,145)
【Fターム(参考)】