説明

IC(集積回路)

【課題】本発明は、計算機のグラフィックおよびビデオ表示システムにおいて、表示プロセッサとメモリ間に大規模なバスを設けることにより、インターフェース処理速度の高速化を実現し、またチップ内の消費電力を制御、抑制することにより、グラフィックおよびビデオ表示において高速化を実現する。
【解決手段】グラフィック画素データとビデオ画素データの少なくとも1つを記憶するダイナミックランダムアクセスメモリ(DRAM)と、画素データを処理するための画素データユニット(PDU)とから構成され、DRAMと同じ集積回路(IC)チップに集積される。また更に、該ICチップは、DRAMからPDUに同時に画素データのブロックを転送するパラレルバスを含み、PDUは処理された画素データを表示するために画素データブロックを処理する。

【発明の詳細な説明】
【技術分野】
【0001】
この発明は、ビットマップメモリーを利用した計算機端末表示に対する計算機モニター表示制御装置、特にフレームバッファメモリシステムと、それからの信号入力の前に計算機モニターに対して画素データを処理するフレームバッファメモリに接続した画素論理回路に関連する。
【背景技術】
【0002】
よく知られている通り、画素は、いくつかの色を表示する計算機表示装置上の画像の構成要素である。各論理的画素は実際には、赤、緑、青の3つの画素から定義されるデータからなり、それらは、視覚的に混ぜられ、表示装置上の点に色をつける。本願において、「画素」という言葉は、1つの論理画素、即ち、データにより定義される赤、緑、青の組を意味する。
【0003】
フレームバッファは、表示装置に表示される全画素数からなるフレームを含むメモリ(記憶領域)である。VGAモニターは640x480画素の大きさのフレームの表示装置を有し、それゆえVGAフレームバッファは640x480あるいは307,200画素を保持することができるメモリである。
【0004】
画素は任意の数のビットをデジタル信号で記憶され、標準的な「原色」表示装置は1画素当り24ビットを使用し、各画素の赤、緑、青色に対し、8ビットを使用する。もう1つの標準は、画素あたり8ビットのものである。
【発明の概要】
【発明が解決しようとする課題】
【0005】
計算機の表示装置を制御するための多くのシステムが存在するが、多くのシステムはグラフィック(図形)プロセッサ、フレームバッファ、画素論理動作に対し別々の集積回路を持つ。グラフィックプロセッサは、1つのチップあるいは必要な処理機能を実行するために内部で接続された複数のチップでありうる。フレームバッファは、メモリ制御チップ並びに複数のビデオランダムアクセスメモリ(VRAM)あるいはダイナミックランダムアクセスメモリ(DRAM)チップからなる。画素論理回路は通常、複数の高速論理回路、高速スタティックランダムアクセスメモリ(SRAM)チップおよび3重ランダムアクセスメモリ−デジタル/アナログ変換チップ(RAMDAC)から構成される。
【0006】
表示制御システムの限界処理の1つは、できるだけ早くグラフィック(図形)処理を行うことである。問題点はシステムの最大速度を決定する。グラフィックシステムにおいて大きな問題点の1つは、グラフィックプロセッサとフレームバッファメモリのインターフェース処理速度である。これら2つのシステム間のバス幅はシステムが画素を処理する速度(1秒間に処理される画素数)に比例する。最近のシステムは16ビットあるいは32ビットインターフェースを持ち、最も強力なシステムでは64ビットのインターフェースを持つ。
【0007】
もう1つの大きな問題点はグラフィックプロセッサとRAMDACの間に存在する。これら2つのインターフェースの容量負荷の駆動において消費される電力は、グラフィックシステム全対の電力の相当の部分を占める。
【課題を解決するための手段】
【0008】
本発明は実質的にパーソナルコンピュータあるいはワークステーションのグラフィックまたは/あるいはビデオ表示システムの高速化を上記問題点を取り除くことにより実現する。表示プロセッサのメモリと画素プロセッサ間の大規模パラレルバスを与えることにより実現される。全画素線のデータ、フレームもしくはフレームの一部は、画素プロセッサが同時に処理された他のビットと共に各ビットを処理することにより、メモリと画素プロセッサ間で同時に伝送される。例えば、バスは、上記の従来技術のように最大64ビットの代わりに、5128本の差動バス線から構成されることができる。大規模パラレルバスを与えるために、表示プロセッサのDRAMメモリのアーキテクチャが改変される。さらに、速度利得を実現するために、制御回路のような補助回路と同様に、メモリ、表示プロセッサ、デコーダ等が同じ集積回路に集積される。
【0009】
回路の大規模な並列処理により、回路は、システム電源からの突然の大容量の電力の需要の衝撃を最小にし、集積された表示プロセッサにおいて電力消費を最小にする具体化の中に含まれる。
【0010】
RAMDAC機能はまた、図形処理の実行において、制限要因として図形制御−RAMDACバスを除外することにより同一チップ上で集積される。
【0011】
本発明において、メモリ制御、基本的な画素プロセッサないしRAMDACを含む画素論理システムを含むフレームバッファシステム全体は、1つの集積回路チップに集積される。これは1つの独立したICとして実現されるか、もしくはグラフィックプロセッサが同じICに集積されることができる。本発明のフレームバッファはDRAMとして実現され、現状のDRAMプロセス(必要とされるバッファの大きさにに対する適当な次元と共に)を使用して製作される。画素プロセッサは、DRAMフレームバッファに対し強く結合した1ブロックの論理回路として実現される。出力画素論理回路はむしろ高速論理回路、多数の高速SRAMないし3つの高速DACで実現される。
【0012】
本発明は、Windows(登録商標) 3.1、Chicago(Windows 4)、Windows NT(登録商標)のようなビットマップ画素グラフィックシステムを使用する任意の表示装置を制御するために使用することができる。後述する本発明の説明により、設計が任意の表示の大きさに対しサポートできることが理解できる。ここで説明する実施例は、1280x1024画素の表示サイズに対し行われている。また、実施例は640x480画素のVGA表示に対する原色(1画素当たり24ビット)をサポートするために使用することができる。これらのチップの中の3つを1組として、1280x1024画素まですべてのビット配置画面に対する原色をサポートするために同時に動作させることができる。
【0013】
1つのチップ上で8ビットフレームバッファにより1280x1024をサポートするため、10メガビットのDRAMがチップに集積されなければならない。チップの停止を考慮した時、16メガビットDRAM過程において実現されなければならない。しかしながら、例えばより小さい表示のサポートに対するより小さいチップは他の技術を使用することにより実現できる。
【0014】
前述したように、シングルチップグラフィックシステムは、新規のアーキテクチャの中で大規模パラレルバスを使用する。これは、フレームバッファメモリと画素プロセッサ(画素データユニットPDU、最も基本的なしかし最も頻繁に使用されるグラフィックコマンドのいくつかを実現する基本グラフィックプロセッサ)間の最大の幅を持つインターフェースを与える。ここで述べられている実施例において、インターフェースバスは5128ビット幅であり、最も強力な以前のシステムにおいて最大幅のバス(64ビット)より大きい大きさである。PDUは32ビットバスを使用しグラフィックプロセッサの残りの部分にインターフェースされる。
【0015】
本発明は、多くの異なる動作モードで使用できる。例えば、任意の大きさの1つのグラフィックウィンドウの表示に使用できる。また、任意の数のグラフィックウィンドウに対して使用できる。それにより、これらの中の任意の1つのウィンドウはリアルタイムビデオを表示することができる。本発明はまた種々のビデオ入力間のレート変換を実現し、それらを画素レートに同期させる。それはまた、動画ビデオウィンドウが表示全体をカバーすることを可能とする。それにより、動画ビデオが、GREY8、RGB332、RGB565、RGB555、ARGB8888、LUT8、RGB888、YUV411、YUV422、YUV420等のようなフォーマットを含む種々の異なるフォーマットで入力される。
【0016】
本発明において、さらに、ミラーリングのような、さらなるビデオ機能がサポートされる。ビデオは表示装置上に正しい方向で表示されるか、もしくは水平方向に鏡のように写し出される。これにより、ユーザが鏡に写した自分自身を見れるビデオ会議モードのサポートを可能とする。
【0017】
ここで使用される新規のアーキテクチャと回路はまた、回路が1つのICで5128ビットで同時に動作しなければならないようなシステムにおいて必要な多大な電力の浪費を避けるために、増大を抑制する電力を供給する。
【0018】
本発明の実施例において、画素データを処理するための画素データユニット(PDU)はDRAMと同じ集積回路(IC)内に集積され、ICチップはさらに画素データのブロックを同時にDRAMからPDUに転送するための大規模パラレルバスを含み、PDUは処理された画素データを結果として表示するために画素データのブロックを処理できるような、シングルチップ表示プロセッサはグラフィック(図形)画素データとビデオ画素データの少なくともどちらか1つを記憶するダイナミックランダムアクセスメモリ(DRAM)から構成される。
【0019】
本発明のもう1つの実施例において、画素データを表示システムに供給する方法は、フレームバッファへの画素データの記憶と、グラフィック出力シフトレジスタの対応する並列入力へ送信される画素ビットと同じ数のバス線を有する大規模パラレルバス経由のフレームバッファの1行からの画素データの並列送信と、シフトレジスタから表示回路へのデータの順次的読み込みとから構成される。
【図面の簡単な説明】
【0020】
【図1】従来技術に基づいた基本的パーソナルコンピュータのアーキテクチャーのブロック構成図。
【図2】本発明におけるパーソナルコンピュータの表示プロセッサの一部分のブロック構成図。
【図3】本発明における実施例のフレームバッファと画素出力経路サブシステムのブロック構成図。
【図4】フレームバッファサブシステムの一部分を形成するために使用される1つのフレームバッファブロックのブロック構成図。
【図5】1つのフレームバッファのDRAMの詳細なブロック構成図。
【図6】行、列、センスアンプ、データバス線およびY選択線の位置を示すDRAMの部分的に概略図を部分的にブロック構成を表す図。
【図7】画素データユニット(PDU)のブロック構成図。
【図8】図7の画素データユニット(PDU)を構成するものと同等の1ビットPDUのブロック構成図。
【図9】図8の1ビットPDUの中で使用されている、ソースレジスタ、行き先レジスタ、ブラシレジスタあるいはプロセッサのレジスタの概略図。
【図10】マスクレジスターの概略図。
【図11】ROP4プロセッサーのブロック構成図。
【図12】8対1マルチプレクサの実現概略図。
【図13】2対1マルチプレクサの実現概略図
【図14】図8に示されたデータバスインターフェースの構成概略図。
【図15】図8に示されたシステムバスインターフェースの構成概略図。
【図16】図4に関連した任意の2つの320ビットシフトレジスタのブロック構成図。
【図17】図16に関連した1つの320ビットシフトレジスタのブロック構成図。
【図18】図17で説明されている320ビットシフトレジスタの中で使用される1つの32ビットシフトレジスタのブロック構成図。
【図19】図3で示されている出力経路サブシステムのブロック構成図。
【図20】本発明における、大規模パラレルデータバスの中で使用される電源パワーを最小にするための回路図。
【発明を実施するための形態】
【0021】
図1は基本的なパーソナルコンピュータのアーキテクチャを示す。中央演算処理装置(CPU)1は一般的にISAバスとして知られている標準バス3にインターフェースされる。CPUはバス3を介して、立ち上げ時プログラムを記憶した読みだし専用メモリ(ROM)、および計算機で使用されるプログラム、ファイル、データを格納するランダムアクセスメモリ(RAM)7と通信する。CPU1はまたプログラム、ファイル、データを不揮発的に記憶したハードディスク装置9、プリンター10、キーボード11および指示装置12(マウスやトラックボールのようなもの)とバス3を介して通信する。
【0022】
より旧式なコンピュータにおいて、表示装置13はISAバスに接続された表示プロセッサを介してバスにインターフェースされている。近年、速度に対する計算機の要求は、例えばビデオや他のマルチメディアアプリケーションを操作するためのいくつかの変更を必要としてきた。計算機の1つの重大な速度の問題点は、マルチメディアに含まれる信号を充分な速度で処理できなかったISAバスの速度であった。それゆえ、ローカルバスあるいはVESAバスのような、図1においてISAバスよりずっと高速で動作しバッファ17を介して計算機システムCPU1にインターフェースするシステムバス15のような新しいバスが作られた。ビデオインターフェース回路19は、グラフィックプロセッサ21と補助回路と同様にバス15に接続される。グラフィックプロセッサ21からのデジタル出力信号は、各画素の色が取り出される参照テーブル(LUT:Look Up Table)23に与えられ、LUTの出力信号は、表示装置に与えられるためにアナログの赤、緑、青色信号に変換するデジタルアナログ変換器に与えられる。
【0023】
一般的に知られているように、グラフィックプロセッサ21は描画装置27、表示プロセッサ28、およびCRT制御装置29から構成される。グラフィックプロセッサ21は表示画素データを、フレームバッファと呼ばれるVRAM(ビデオランダムアクセスメモリ)のようなメモリ31の中に記憶する。ここで、画素データは描画装置27によって生成または修正され、表示プロセッサ28によってVRAM31の中に再記憶され、CRT制御装置29により表示のためにLUT23に出力される。
【0024】
グラフィックプロセッサ21はバス33を介してVRAM31に接続され、そのサイズはシステムバスと、表示プロセッサ28により操作されるバスサイズによって決定されてきた。以前から知られているように、このバスは16ビットあるいは32ビットの幅を持ち、もっとも強力な最近の計算機のみ64ビットバスを持つ。グラフィックプロセッサ21の速度は、VRAM31に対しデータを伝送する速度によって制限されるシステムが画素を処理することができる速度に比例する。この速度はバス33の幅によって制限されてきた。
【0025】
図2において、従来技術のシステムバスに接続された構成要素は、本発明のシングルチップ表示プロセッサにより取って代わられた。具体例については後述する。
【0026】
図1のシステムのグラフィックプロセッサ21の代わりに、表示プロセッサ40は、32ビットバス41を介してシステムバス15と制御入力(図示していない)に接続されており、4ビットバス42を介してデジタル化されたビデオ信号を受信する。表示プロセッサ40は1つの集積回路において、DRAM44、画素プロセッサ46、画素論理システム45、および3重RAMDAC49から構成される。後述するように、これは更に、画素フレームバッファサブシステム、画素出力経路サブシステム、ビデオ入力フォーマッタ48、およびフレームバッファ制御を説明している。これらは、グラフィックアクセラレータの機能を与えるため内部で接続されている。
【0027】
描画装置47は、後段の処理のためにメモリ44に格納されたグラフィックデータをバス41を介して生成するためにシステムバスに接続されている。あるいは、描画装置47は、後述するように本発明により描画機能が与えられるため、主計算プロセッサから画素プロセッサに対するプログラム命令において実現される。この説明において、各画素は8ビットで記述されている。
【0028】
図3において、本発明の実施例を構成するフレームバッファと画素出力経路サブシステムを示す。1画素当り8ビットのバッファサブシステムは実施例の最大のサブシステムを形成し、8つの別々のフレームバッファブロック50からなる。これらの各ブロックは、8ビット画素によって定義される全体のフレームの各画素の1ビットを保持する。この構成により、シングルフレームバッファブロック内で、全画素が1ビットずつ互いに画素間で処理するスピードとバンド幅を促進するような相互作用が起こる。
【0029】
32ビットバス52(図2のバス41に対応)は各フレームバッファサブシステムをシステムグラフィックプロセッサに接続する。システムは1サイクル32ビットで読みだす。しかしながら、書き込みサイクルの間、システムは全ての8つのバッファブロック50に対しデータを送信し、256(32x8)ビットの有効書き込み幅を許可する。しかし、システムバス幅は、必要なシリコン領域とバス幅に比例して増加するスループットの間で決定される。システムバスが2のべき乗の数となる任意の数の伝導体を持つことが可能であることは認めなければならない。
【0030】
2番目の重要なサブシステムは、画素出力経路サブシステム54である。画素出力経路サブシステム54はグラフィック画素入力ポートとビデオ画素入力ポート(図中、「グラフィック入力」と「ビデオ入力」)からなり、それらのいずれも32ビット(4画素)幅からなり、それらはそれぞれフレームバッファのグラフィック出力ポートとビデオ出力ポートに接続される。画素出力経路サブシステム54は各出力サイクルに対する唯一の画素に対するデータを必要とする。グラフィック出力とビデオ出力に対する4画素幅入力により、フレームバッファ出力動作において、1/4の出力サイクルスピードでの動作が可能となる。しかしながら、これら入力の他の幅(ビット容量)は、フレームバッファ(後述)の出力レジスタが他のスピードで動作することを可能とするため使用される。例えば、8個のグラフィック出力とビデオ出力に対する入力画素幅は、フレームバッファ出力レジスタが1/8の出力周波数で動作することを可能にする。
【0031】
画素出力経路サブシステム54は、グラフィック入力とビデオ入力上の画素データを受信し、これらの画素を入力し、赤、緑、青のアナログ信号(図2のRGB)をモニター上の表示装置に対して出力する。画素出力経路サブシステム54の詳細な動作については、図18に関連して以下に説明する。
【0032】
フレームバッファ制御56は、フレームバッファブロック50に接続され、「フレームバッファ制御」バス上の制御データをシステムプロセッサから受信し、またDRAMの制御、画素データユニットの動作のようなフレームバッファの機能、ビデオ入力、ビデオ出力、グラフィック出力動作からなるフレームバッファの動作を制御する。
【0033】
ビデオ入力フォーマッタ58中のビデオデータは、16ビットバス「ビデオ入力」上のビデオ画素の入力を受信し、これらの画素を効果的に記憶するためにビデオ画素を再フォーマットする。
【0034】
図4は、図3に説明されたものと同一のフレームバッファブロック50のブロック構成図であり、それは1280x1024を形成する1ビット画素フレームバッファブロックである。これは2560行と544列からなる表示画素を記憶するDRAM58を使用することにより実現される。
【0035】
表示装置によく似たメモリを構成するのは有利である。例えば、表示画素の1つの行をメモリの1つの行に記憶すべきである。画素が表示画面上に表示された時、同時に1つの画素が表示される。最初に1つの行が走査され、それから行間を再トレースし、次の行が走査される。それゆえ、1つの行の全ての画素が、次の行の画素を読む前に読み出される。このように、DRAMは、ファーストページモードに似た方法で読み出される。この動作は、行に対するアクセスがその行からのビットをアクセスするよりも長い時間がかかるという理由から従来のランダムアクセスより速い速度で動作する。またそれは、行サイクルが行からのビットを読みだすよりもずっと大きい電力を使用するという理由からずっと少ない電力で使用できる。
【0036】
2560列幅に選ばれた各DRAMバッファブロックのサイズは、DRAMバッファブロックのアスペクトレシオの最適化と、1つのワード線(行)が最大2500列を持つ(容量と速度の考慮に従う)という事実の、2つの要因に基づいている。それゆえ、1280x1028画素のシステムによってサポートされる最大表示画面サイズに対して、2行の画素はDRAMバッファブロックの1つの行に適合する。それゆえ表示装置の1024行をサポートするため、DRAMは512行が必要である。DRAMの32行の特別行がプロトタイプシステムの各バッファブロックに追加され、それは、グラフィックプロセッサに対するメモ書き用メモリのように、PDUレジスタに対する画素の色やパターンを記憶し、テキストに対するフォントを記憶し、ビデオを記憶する等種々の目的に利用される。メモリの別々の領域において、動画ビデオに対する画素データを記憶することは、実際の表示メモリ領域に記憶するよりは、しばしば有利であり、それにより、ビデオデータをグラフィックデータとは異なるフォーマットで記憶でき、多くの高度な表示機能が処理できる。それゆえ、DRAMの特別な32行(あるいはそれに等価な表示画素の64行)はこれらの項目を記憶するのに使用される。
【0037】
もちろん、もし、表示装置が最大1280x1024画素でなかったら、動画ビデオデータを含み高解像度のビデオデータの記憶を可能にするこれらの機能に対してより多くの線が利用できる。本発明は、DRAMの32行の特別行を使用することで制限されるものではない、より少ないあるいはより多い数の特別行を使用してもよい。
【0038】
2560行、564列のDRAMバッファブロックサイズはもう1つのよい選択である。これは8ビット画素モードにおいて1280x1024画素表示のサポート、および原色モードにおいて(画素あたり24ビット)、800x600(SVGA)表示をサポートをする。
【0039】
一般的に、本発明は最も重要と考えられる要因に依存する任意の効果的なサイズのDRAMアレイを使用する時に利用される。
【0040】
各フレームバッファブロック50はまたビデオ入力シフトレジスタ60、ビデオ出力シフトレジスタ62、グラフィック出力シフトレジスタ64の3つのシフトレジスタからなり、メモリ制御66に接続された制御入力を持つ。ビデオ出力シフトレジスタはビデオ出力ポート「ビデオ出力」を有し、グラフィック出力シフトレジスタはグラフィック出力ポート「グラフィック出力」を有し、該グラフィック出力ポートは「ビデオ入力」と画素出力経路サブシステム54の入力ポートの(図3)「グラフィック入力」に対する入力となる。これらの3つのシフトレジスタ60、62、64は外部のソースからのビデオ画素データを入力、および表示装置への伝送に対する画素出力経路サブシステム54へのビデオ画素データとグラフィック画素データの出力のために使用される。入力および出力される画素は同時に1つの画素に伝送され、これらシフトレジスタは、VRAM(ビデオランダムアクセスメモリ)と同様に行に沿って連続的に構成される。上記シフトレジスタは640ビット幅(後述する320ビットレジスタ2個より構成される。)である。
【0041】
これらのシフトレジスタはDRAMバッファブロックと等しいピッチ間隔であるべきである、すなわち、各レジスタビット記憶構造が、集積回路においてDRAMバッファブロックの4列と等しい物理的な幅であるということは重要なことである。
【0042】
シフトレジスタが1280ビット幅のピッチ間隔の等しいシフトレジスタから構成された時、これは640ビット形式の2倍の集積回路の領域を必要とするが、シフトレジスタへ1280画素の全ての線を記憶することができる。一般的にここで説明された機能的な方法によって、ピッチ間隔の等しいシフトレジスタの有効な幅が利用される。
【0043】
それぞれのシフトレジスタは類似の方法で動作するので、グラフィック出力シフトレジスタ64の動作についてのみ、以下に説明する。
【0044】
表示装置がインターバルを再トレースする間、システムプロセッサは新しい画素の行を表示装置に出力するよう要求する。DRAMフレームバッファ65の中の1つのワード線は論理レベルが「HIGH」になり、DRAMの行が読み出される。この行の320ビットは、データバス68を介して1つのサイクルの中で、グラフィック出力シフトレジスタ64に伝送される。システムが最初の画素に対して要求した時、グラフィック出力シフトレジスタ64はデータを順次シフトし出力し始める。これら320画素に対するシフトアウト期間の間はいつでも、システムは次の320画素の組を要求できる。次にDRAMバッファブロックは次の320画素を含んだ行を読みだし、これらを2番目の320ビットグラフィック出力レジスタに書き込む(グラフィック出力レジスタは2つの320ビットレジスタから構成されることに注意する)。
【0045】
最初の320画素の組が順次読みだされると即座に、2番目のグラフィック出力レジスタ64が読みだされ始める。次に、2番目のグラフィック出力レジスタ64が読みだされている間はいつでも、その次の320画素が最初の320ビットレジスタにロードされる。この過程は線を構成する最後のデータが読みだされるまで続く(すなわち、最大で、1280画素幅の最大画面の4倍まで)。
【0046】
この実施例において並列に動作する8つのフレームバッファ50が存在し、グラフィック画素は1画素当り8ビットで格納され、1画素あたり1ビットのみが各グラフィック出力レジスタ64から必要とされる。しかしながら、シフトレジスタのサイクル時間が、同時に1ビットが出力される場合よりも4倍遅くなるように4ビットが並列に出力される。約70Hzのリフレッシュレートで動作する1280x1024画素の画面サイズの場合、出力画素レートは135MHzである。並列な4ビットの出力では、シフトレジスタは34MHzでの動作のみが必要であり、これにより実現が容易となる。
【0047】
ビデオ出力シフトレジスタ62はグラフィック出力シフトレジスタ64と類似の方法で動作すべきである。該ビデオ出力シフトレジスタ62はビデオウィンドウに遭遇した時に使用される。システムは、該ビデオ出力シフトレジスタ62がフレームバッファブロック65からの更なる320ビットのデータをロードされるタイミングを決定する。このデータはグラフィック出力レジスタ64に対し出力される。
【0048】
ビデオ入力シフトレジスタ60は4ビットバスで示され、ビデオデータストリームを転送するための「ビデオ入力」バスを有する。シフトレジスタ60は、それの320ビットレジスタの1つがいっぱいになるまでビデオデータを計算し、またフレームバッファにこのデータをダウンロードする。この入力ビデオデータストリームは、図2の入力42に示されているように、VESA(ビデオ電子標準協会)のメディアチャンネルのようなチップ外部のソースからから発生する。それゆえ、デジタル化されたビデオデータは、画素あたり32ビットモードでおいてでさえ、4ビットバスに入力され相対的に遅い速度で実行される。
【0049】
画素データユニット(PDU)70は、各フレームバッファブロック65とピッチ間隔が等しく、メモリ制御66と同様に大規模パラレルバス68に接続されている。各PDUは、画素の処理に対して異なった機能を利用しながら640画素が同時に処理されるように640ビットを処理する。一般的に、PDUに対して任意のビット幅が使用される。しかしながら、640の幅が、この回路がDRAM65とピッチ間隔を等しくするためには望ましい(1PDUビットは各4DRAM列に対応する)。
【0050】
シフトレジスタに関して、必要とされる集積回路のチップの領域を最小化は、より大きなスループットとPDU幅のビット数の最大化の間の関係で決定される。例えば、320ビット幅は、同様の動作を許すために、集積回路の1/2の領域のみを必要とするが、2倍のサイクル数を必要とする。しかしながら、任意のPDUのビットサイズが選ばれても、それはDRAMに対してピッチ間隔が等しくなければならない。
【0051】
ビットマップ画素において実行されるために必要な一般的な動作は、1ビットブロック転送である、すなわち、任意の画素ブロックを論理動作を同時に実行する表示画面上の新しい位置(フレームバッファDRAMの一部分からまた別の部分へ)へ移動することである。8つのフレームバッファブロックのそれぞれが、フレーム全体の各画素の1ビットを保持するため、これら転送機能は各フレームバッファブロックに対して全く局所的であり、8ブロック全てにおいて同時に起こりうる。垂直方向に移動するために、DRAMは1つの行にアクセスし、これをセンスアンプあるいはPDUレジスタの中に記憶する、次にこれを別の行に書き戻す。水平方向に移動するために、システムはPDUレジスタに対して32ビットワードでアクセスすることができるため(本実施例において)、任意の画素が、システムバスを使用し、32ビットまでのブロック内を同時に32の倍数ごとに、水平方向に移動される。高解像度の移動なために、システムバスを介して各PDUとメモリ制御66にそれぞれ接続されたバレルシフター72が利用される。
【0052】
各フレームバッファブロックに対するメモリ制御66はDRAMを制御するために標準メモリ制御回路を含む。またそれは、PDU70の動作に対する命令デコーダとPDU70、バレルシフター72のアドレス指定と制御を行う回路を含む。
【0053】
メモリ制御66は領域デコーダを含むべきである。通常、デコーダは入力の組の1つを選択する。例えば、20個の32ビット幅PDU回路に対して、通常のデコーダは20個のPDUの中のただ1つのみのアクセスを許可する。領域デコーダは1つのPDU、20個すべての2つの隣接したアドレスを持つPDU、あるいは隣接したアドレスを持つ制限数(すなわち20)までの任意の数のPDUにアクセスすることを許す。これにより、多くの異なる幅のデータがシステムによりPDUに書き込まれる。例えば、それにより、システムがシングルサイクルの中で全ての幅のPDUレジスタを消去することが許される。
【0054】
部分的な領域デコード機能が実行される。これは、20個のPDUから1個か、20個か、あるいは2個か4個かまたは8個のグループのPDUを選択するようないくつかの領域デコード機能を許す。このデコーダを使用する利点は標準的なプリでコードアドレスにより実行されることである。1ビットの各プリデコードバスを1に設定することを許可することだけでなく、各バス上の任意の数のビットを1に設定できる。これは、密度の高い等しいピッチ間隔を持つ回路において、さらなる領域を必要とせず、レジスタへの書き込みに対してずっと高い自由度を与える。
【0055】
全領域あるいは部分的な領域デコードはPDUに対してのみだけではなく、シフトレジスタとDRAMそれ自身に対しても利用される。シフトレジスタにおいて各320ビットレジスタの1部分がロードされ、あるいはメモリに対して書き込まれる。DRAMにおいて、複数のワード線が「HIGH」になることが許される。これはメモリのフラッシュ消去またはメモリのサブセクションのフラッシュ消去ないしメモリのラージセクションへのパターンのロードを許可する。
【0056】
図5は2560x544ビットのDRAMの詳細なブロック構成図である。DRAMブロックサイズは、ビット線の容量とセル容量の比率が妥当な値(10のオーダー)のままであるように272行に制限される(制限されたブロックは構成要素74に示されている)。センスアンプ76の行は、標準的なDRAMのようにDRAMセル読みだしないし再記録するためのアレイの各サイドに沿って配置される。本発明においてビット線センスアンプは、関連するメモリアレイがアクセスされていない時にPDUの動作に対する一時的データレジスタのような追加の機能を持つことができる。本実施例において、Xデコーダ78A、78Bに対するアドレスは、「Xアドレス」入力線を経由する。これらの中で1つのデコーダアレイのみが、ある1つの時間において可能状態となる、すなわち最も重要な「Xアドレス」ビットが、Xデコーダ78Aに対し反転しないで使用され、Xデコーダ78Bの可能状態に対して反転して使用される。
【0057】
本発明で使用されているDRAM74と標準的なDRAMの大きな違いは、広域なデータバス構造である。標準的なDRAMにおいて1つのワード線は、1行のセンスアンプにより1行のセルのアクセスないし読みだしを許す。次にこれらのセンスアンプの小さいサブセットはY選択信号により可能状態となり、該サブセットによりセル内に記憶されたデータをデータバス上に出力する。データバスは、4ビットあるいは可能であれば8ビット幅でしかなく、センスアンプ上を行とワード線に対して平行に走っている。Y選択線は、列とビット線に対して平行に複数のDRAMアレイとセンスアンプの行の上を走っている。
【0058】
本発明において、データバスとY選択線の位置は図6に示されているように物理的に交換される。この図において、よく知られているようにワード線(行)81はビット線(列)82と直交しその交点に隣接して、ビット記憶セル83は、ワード線を介してセル行が可能状態にされた時に、該行上のセルに記憶された電荷がビット線に出力されるように接続される。センスアンプの行はビット線に接続される。よく知られているように各センスアンプはビット線ポート、データバスポートないしY選択ポートを有する。
【0059】
前述したように従来技術においては、各センスアンプのデータバスポートに並列に接続されたデータバスはワード線に平行に走り、Y選択線はビット線に平行に走っている。しかしながら、本発明においては、データバス線86はビット線に平行に走り、1組は2つのセンスアンプのデータバスポートに接続されている。このように、4ビット線ごとに1つのデータバスの組があり多くのデータバスの組により大規模パラレルバス68が構成される。
【0060】
一方、Y選択線はセンスアンプ84に対しページモードで作用し、それゆえ、複数のセンスアンプが同時に選択される。このようにY選択線は多数のセンスアンプのY選択ポートに接続されている。Y選択線は、ワード線に平行に走り、各データバスに接続された2つのセンスアンプ84から1つを選択するために2本の線のみが必要とされる。
【0061】
図6はさらに、レジスタ64の代表的な1つおよびPDU70に対する大規模データバス線の拡張を示す。
【0062】
前述したように、センスアンプ84はY選択ポートを経由してアドレス指定され、データを同時にレジスタ64、PDU70等に対して送信するためにデータをデータバス線に出力する。
【0063】
本実施例の640ビット幅のデータバスにより、データバス上のデータの同時の使用に対してセンスアンプの1/2が選択される。前述したように、2つのY選択線87はワード線の行に平行に走る。640ビット幅のPDUに対して走るデータバス線は1サイクル中での完全なロードと読みだしの実行を許可する。この方法は任意の数のデータバス線に対して利用される。例えば、1280データバスはすべての行のセンスアンプがデータバスに同時にアクセスできるようにビット線に対して平行に走る。
【0064】
図7は、20個の32ビットPDUユニット90からなる640ビットPDUを示す。各32ビットPDUは32個の同一の1ビットPDUから構成される。32ビットPDUユニットのそれぞれは、PDUアドレスとバッファグローバル信号をデコードする専用PDUデコーダ91によって制御される。前述したように、PDUはDRAMと1つのPDUに対して4列という間隔の整合性をもつ。DRAM集積回路のレイアウトにおいて、金属のワード線がポリシリコンのワード線に接続されているセル間でギャップが設けられている。このギャップはPDUデコーダ91を位置付けるPDUおよびDRAMに対する追加の電源線において使用される。
【0065】
図8は、1ビットPDUのブロック構成図である。1ビットPDUは、ソースレジスタ93、行き先レジスタ94、ブラシレジスタ(Brush Register)95、ROP4レジスタ96およびマスクレジスタ97、システムバスインターフェース99、ないしROP4(4入力ラスター動作)回路98から構成される。これらの回路のすべてはデータバスインターフェース100を経由して大規模パラレルデータバス68に接続される。
【0066】
1ビットPDUは、4入力ラスター動作機能を使用する標準的なビットブロック伝送(BitBlt)コマンドを実行するために必要な最小の回路である。BitBltはもっともよく使われるグラフィックコマンドであるため、より速くより効果的にこのコマンドが実行されるほど、グラフィックプロセッサはより強力になりうる。本発明により、BitBltコマンドを1サイクルで実行でき、640画素(5128ビット)かそれ以上を同時に処理できる。
【0067】
知られている通り、4入力BitBltコマンドは基本的に表示装置上の1つの位置(ソース)から表示装置上の2番目の位置(行き先)へのソースと行き先の画素の間で定義された論理的動作を伴った画素ブロックのコピーである。例えば、ソース画素は書き込みが行われる行き先画素との間で、ANDか、ORか、もしくはXORされる。さらに、ブラシ変数は、さらなる可能な機能のためにソースと行き先画素に対して論理的に動作する。本構成において、3つの変数に対する任意の論理的動作はソース、行き先、ブラシの間で出力をマスクする4番目の1ビット変数と共に許される。3つの変数において256の可能な論理動作が存在するため、各PDUはすべての動作の実行と出力のマスキングを行う。
【0068】
図8に示された例において、3つの変数はソース、行き先、ブラシレジスタ93、94、95の中で保持され、マスクビットがマスクレジスタ97の中で保持される。ROP4プロセッサ98は実際の動作を実行し、ROP4レジスタはROP4プロセッサの出力データを保持する。
【0069】
すべてのPDUユニットのレジスタは2つのレジスタバスRB0とRB1に対して2つのポートを持ち、メモリ(大規模パラレルバス68を通して)、システムバス(システムインターフェース99を介しシステムバスSBを通して)、あるいは他の任意のPDUレジスタによってアクセスされうる。すべてのレジスタは同時にROP4プロセッサ98に1つのサイクルで動作が完遂するように接続されうる。
【0070】
1ビットPDUのレイアウトは図8に示されたレイアウトに従う。レジスタとROP4プロセッサは列上にありDRAMに対しておよび互いにピッチ間隔が等しくされている。2つの異なった金属のバス(1つのバスはデータバスとシステムインターフェースへ延び、1つのバスはROP4プロセッサ98とレジスタを接続している)はこの回路上を走り、それぞれすべてのレジスタに接続されているが、1つはROP4プロセッサ98上で接続が切れている。
【0071】
PDUのRB0インターフェースが直接的に大規模パラレルデータバスにインターフェースするため、DRAMのセンスアンプがPDUの動作に対して一時的記憶レジスタとして使用することができる。
【0072】
PDUとシフトレジスタから構成される集積回路の高い集積度のために、追加の要素を作り、誤りの発見された要素に取って代わるようなリダンダンシー(余分な構成要素)を利用することが好ましい。DRAMに対しては、よく知られている修復技術を使用して、使用されていないDRAMセルの追加の列とセンスアンプが誤りの見つかったものに取って代わるような列のリダンダンシーが使用されるべきである。
【0073】
図9は、ソース、行き先、ブラシ、およびROP4レジスタに対して使用される回路の概略図である。レジスタをできるだけ小さくするために、それらが4列のDRAMと等しいピッチ間隔であるため、レジスタは交差した1対のインバータ102から構成されるべきであることが望ましい。この回路にアクセスするために、2組のNMOS型電界効果トランジスタ(FET)が使用されるのが好ましい、各組のトランジスタはそれぞれのゲートを1ビットPDUに対するRB0_ACCとRB1_ACC線入力に接続され、それぞれのソースは互いに接続され、インバータ102のそれぞれのポートの1つに接続されており、1組のそれぞれのドレインはRB0とRB1のリード線に接続される(前述)、他の組のドレインは2つのバスの位相が反転したRB0_、RB1_のリード線に接続されている。相互結合された1組のインバータの反対の極性を持った共通ソースはそれぞれ1ビットPDUに対するPRとPR_リード線入力に接続されている。
【0074】
PDUのレイアウトのために、2ポートレジスタが使用される。また、すべてのレジスタをROP4プロセッサに接続するためにバスが使用される。2ポートの各PDUレジスタによって、レジスタにアクセスするための最大の柔軟性が得られ、これらのレジスタはすべて同じ設計であるため、1つのレジスタに対してのみ実施されればよい。
【0075】
このレジスタの設計は多くの点でDRAMのセンスアンプに類似しているということが理解できる。このように、このレジスタがインバータ102に対し過剰電圧をかけることにより書き込まれた場合、5128個のレジスタに同時に書き込む時に多大な電力が消費される。それゆえ、インバータは、不当な力による過剰な電圧が各ビットにかからないような方法で書き込まれるのが好ましい。
【0076】
書き込みにおいて、相互結合されたインバータは、最大電圧(VDD)電源(以下、電源と称す)と接地(VSS)に接続されるよりも、PR線とPS_線に接続される。書き込みは、PR線とPS_線を1/2VDDに等しくすることにより始まる。次に入力データがレジスタバスに与えられる。選択線RB0_ACCあるいはRB1_ACCは論理的に「HIGH」になり、最終的にPRとPS_線は過度に速い立ち上げ時間を伴わず徐々にそれぞれVDDとVSSになる。
【0077】
FETにアクセスするNMOSはVDDを通過させないが、VDD−Vtの値は通過させるということに注意すべきである。ここでVtはFETの動作しきい電圧値である。レジスタを読み込む時のこの問題を解決するため2つの方法がある。
【0078】
最初の方法において、レジスタバスに対して、読み込み動作前にあらかじめVDDの電圧が加えられる。しかしながら、この動作に対する5128個の別々のバス上のVSSに対する相互結合の適当な側を落とすために必要な電源電圧は非常に高いので、以下に述べる第2の方法が好ましい。
【0079】
第2の方法において、電圧VPPを供給することができる電源が、レジスタをアクセスするために使用される。VPPはチップ内あるいはチップ外で生成され、VDDよりも高いVt電圧よりもわずかに高い電圧である。レジスタをアクセスするため、RB0_ACCとRB1_ACCの電圧が上げられた時、それらはVPPとなるまで電圧を上げられまた、結果としてRB0とRB1バスの上の電圧はVDDになる。VPP電源は5128レジスタを同時にアクセスするために十分に強力でなくてはならない。これを可能とするために、RB0_ACCとRB1_ACCは最初のVDDまでの引上のタイミングを合わし、次にVPP電圧電源がこれらの線をVDDからVPPへ引き上げる。
【0080】
図10は、マスクレジスタを示したものである。このレジスタは図9に示したレジスタ構成と、3番目のポート、DATA、ないしROP4プロセッサに直接接続されるDATA_を含むことを除けば同じものである。
【0081】
図11は、ROP4プロセッサのブロック構成図である。命令(例えば、入力バスROP3上において、3入力上で256の論理動作を指示する)は、8対1マルチプレクサ106を使用することにより実行される。ROP3バスは8ビットバスであり、即ち命令はマルチプレクサ106に対する入力データとして使用される8ビットである。3つのレジスタ93、94、95からの3つの値(マルチプレクサ106のそれぞれの入力に対応するSRC,SRC_,BRUSH,BRUSH_,DEST,DEST_線によって伝送される)はマルチプレクサに対する線を選択する時に使用される。2対1マルチプレクサ108に対するマスクレジスタ入力、MASK、MASK_は、ROP4の出力線OUT、OUT_上への出力に対するマルチプレクサ106の出力の選択か、あるいはDESTと名付けられたポートに接続する経路を介して行き先値をそれ自身に戻す古い行き先値の書き込みを決定する。
【0082】
図12は、8対1マルチプレクサの概略図である。ここで複数(8)のパラレル線(1つの線がROP3バスの1つの線を形成する)上のFET110は、それらのソースをドレイン回路に直列に接続され、前述した選択方法に従い、ゲートはソース、行き先、ブラシレジスタに接続された線に接続されている。パラレル線の反対の端は1つにまとめて接続され、またマルチプレクサの出力に接続される。集積回路のレイアウトを小さく保つために、NMOS通過トランジスタが、以前に説明した実現において使用される一方で、標準的なCMOSロジックあるいはCMOS伝送ゲートを使用することにより、マルチプレクサの他の実現が使用される。
【0083】
図13は、2対1マルチプレクサ実現の概略図である。NMOS型FET112A、112Bの組のゲートはそれぞれ2ビットバスROP4の線(図11のMASK、MASK_のリード線に対応した)に接続される。FET112Aのドレインは、ROP3_OUT線を介して8対1マルチプレクサ106の出力に接続され、FET112BのドレインはDESTポートに接続される。FET112A、112Bは共に出力ポートOUT、インバータ114の入力、出力ポートOUT_に接続される出力に接続される。
【0084】
NMOS型FETがVDD−Vtのみを通過させるということから、2対1マルチプレクサにおいてインバータ114を通してしきい損失が存在するということに注意すべきである。それゆえ、2対1マルチプレクサにおいてインバータのしきい値は(VDD−Vt)/2に設定されるべきである。それゆえ、もしOUTリード線が論理的に「HIGH」レベルになった時、それは、VDD−Vtの電圧になる。しかしながら、ROP4レジスタが上述したタイプであるので、この電圧と接地の差を容易に検出できる。それゆえ、最大のVDD値は、ROP4制御装置の出力データが保存された時、そのレジスタに再記憶される。
【0085】
図14はデータバスインターフェース100の構成概略図である。DRAMデータバス(DB、DB_)とPDUレジスタバス(RB、RB_)間のインターフェースは図8に示されている。この回路はDRAMのセンスアンプにアクセスするビット線に対する回路に類似している。ACCESS線を介して可能状態にされるゲートを持つ2つのNMOS型FET180A、180Bは、ソース・ドレイン回路を通して、データバスDB、DB_がレジスタバスRB、RB_を駆動、あるいはレジスタバスがデータバスを駆動するのを許可する。
【0086】
FET181、182A、182Bにおいて、それらのゲートはEQU線に接続されており、ソース・ドレイン回路はそれぞれ、(DB、DB_)、(VBLP、DB)、(VBLP、DB_)にアクセスし、EQU線に制御信号が現われた時、ソース・ドレイン回路を通して、データバスを共通電圧VBLPに等しくする。このように電圧を等しくすることは、センスアンプあるいはレジスタバスがデータバスDB、DB_に書き込む前に必要である。VBLPはVDD/2に等しく、レジスタバスが書き込む前に、データバスに対するこの中間電圧でのプリチャージを許す。もし、データバスがレジスタ線に書き込む場合、レジスタバスはVDD/2にプリチャージされなければならない、また上記回路は、システムバスインターフェース99の中にある(図8)。
【0087】
DRAMへの書き込みに対しては、以下の順序に従うi)システムバスインターフェース99を使用してレジスタバスがVBLP=VDD/2にプリチャージされる。
ii)PDUの1つのレジスタが、レジスタの電圧値までレジスタバスを駆動するように、レジスタバスに対して可能状態にされる。同時にデータバスはデータバスインターフェース100を使用してVDD/2にプリチャージされる。
iii)レジスタバスがレジスタを駆動するために、DB_ACCESS信号が「HIGH]になる。同時にアドレス指定されたDRAMのセンスアンプはVDD/2にプリチャージされる。
iv)センスアンプが、データバスがセンスアンプに対して書き込みができるように、データバスに対して可能状態にされる。同時にビット線はVDD/2にプリチャージされる。
v)センスアンプが、センスアンプの電圧値までビット線を駆動するように、ビット線に対して可能状態にされる。同時にワード線は、ビット線がアクセスしたセルに書き込みができるように論理的に「HIGH」レベルになる。メモリの読みだしは逆の順序になる。
【0088】
図15は図8に示されたシステムバスインターフェース99の概略図である。該システムバスインターフェース99は、レジスタバス線RB、RB_をプリチャージし、VBLB、EQU、ないしRBおよびRB_に接続され、図14(図14のDB、DB_線に対してRB、RB_バス線に入れ替える)の回路の中のFET181、182、182Bと類似の方法で動作する3つのNMOS型FET184、185A、185Bからなる。
【0089】
図15の回路はまた、SB線からのRB、RB_線の間において、3状態反転バッファ188、189からなる単一終了3状態バスインターフェースに対する微分を含み、バッファ188はSB入力線上の信号を反転し、バッファ188、189からの微分出力を生じるインバータ190と直列に接続されている。バッファ188、189はRW_ACCバスを介して可能状態にされる。
【0090】
3状態バッファ191はバッファ189に対して逆の平行な方向で接続され、RB_バス線からのSB線を駆動し、RW_ACCを介して可能状態にされる。
【0091】
上述した回路は、微分レジスタバスRB、RB_が単一終了SBバスに対する読みだしまたは書き込みを可能とする。
【0092】
図16は、図4に関連した2x320ビットシフトレジスタを説明したブロック構成図である。シフトレジスタは制御バスを介して制御回路118に接続された2つの同一の320ビットシフトレジスタセグメント116からなる。各シフトレジスタセグメント116は2ポートが好ましく、大容量パラレルデータバス68を介してDRAMに接続した320ビット読みだし/書き込みパラレルポートDB、DB_と、データをシフトイン/アウトするための4ビット読みだし/書き込みシリアルポートSH_DATA、SH_DATA_を持つ。
【0093】
制御回路118は、シフトレジスタに対して、2つのアドレスをプリデコードする(各ポートに対して1つ)。プリデコードアドレスは最終デコーダに対し必要とされる回路を制限するために使用され、またパラレルポートに対し領域デコーダを実現する。
【0094】
図17は図16に関連した320ビットシフトレジスタを説明したブロック構成図である。それは、それぞれ専用のデコーダとイネーブル回路122を伴った10個の32ビットシフトレジスタユニット120からなる。前述したように、データバスは領域デコーダあるいは改変された領域デコーダを使用して32ビットでアクセスされる。それゆえ、単一サイクルの中で、1つの32ビットブロックがアクセスされるか、10個の32ビットブロック全てがアクセスされるか、あるいはこれらのブロックのいくつかがアクセスされる。シリアルポートが4ビットアクセスに制限されているため、この実施例において、1つの32ビットシフトレジスタのみが上記アクセスにより可能状態にされる。
【0095】
PDUに関して言えば、128列ごとに1つのデコーダが存在する。それゆえに、デコーダとイネーブル回路122は、集積回路の中のDRAMセル間のワード線のストラップがあるレジスタ間の空き領域に配置される。
【0096】
図18は図17に関連した320ビットシフトレジスタにおいて使用されるシングル32ビットシフトレジスタユニットを説明したブロック構成図である。図示されたように直列に接続された8つの4ビットレジスタ124から構成され、NANDゲート125からなるシリアルポートデコーダは制御回路118(図16)に接続された入力を持ち、その出力はインバータ126の入力に接続され、該インバータの出力はレジスタ124のアクセスポートに接続されている。レジスタ124は、等しいピッチ間隔で、非常に小さくなければならなく、2つのポートを持ち、同じクロックタイミングで動作するというPDUレジスタに対するものと同じ制限を持っている。それゆえ、各レジスタは、PDU中にあるものと同じものである。
【0097】
図19は図3に示された出力経路サブシステム54のブロック構成図である。このサブシステムは、画素のフォーマットおよび制御のよく知られた機能、参照テーブルを使用した色に対する論理画素の翻訳、ないし表示装置への出力に対するデジタルの色信号のアナログ値への変換を実現する。しかしながら、従来技術との比較においては、フレームバッファと同様、同じチップ内に集積されており、またそのためにDRAMプロセスの中で設計される。
【0098】
グラフィック画素データとビデオ画素データは、「グラフィック」と「ビデオ」バス上でフレームバッファの中のシフトレジスタから4つの8ビット画素を同時に受信し、グラフィックフォーマッタ130とビデオフォーマッタ131へ出力される。該フォーマッタにおいて、画素は、1サイクル1画素のデータ流れを可能にするためにフォーマットされ、再度タイミングが合わされる。最終的なビデオ信号は、YUVのようなフォーマットのビデオ信号がRGBに変換される色領域変換器33に与えられる。
【0099】
フォーマットされたグラフィックデータはグラフィックフォーマッタ130からグラフィックデータ参照テーブル135へ出力され、そこでは、論理8ビット画素値が3つの8ビット値に変換される。色領域変換器の出力はビデオ参照テーブル137に与えられる。ビデオ信号がすでにRGBの形式であるため、該テーブル137は画素の色のガンマ補正に対してのみ使用される。これらの参照テーブルは256x24ビットSRAMによって実現される。
【0100】
上記参照テーブル135、137の出力は、以下のように、表示装置への出力に対してグラフィックあるいはビデオ信号の2つのうちの1つを選択するマルチプレクサ39の入力に与えられる。
【0101】
フレームバッファグラフィック領域内で、特別な8ビットの値は、他の値がそうするように画素の色を示すのではなく、ビデオウィンドウの端を示す。この画素値は表示装置にグラフィックデータではなくビデオデータが送られることを示す。これを実現するために、ビデオキーカラーレジスタ141は、システムバスSYSから受信した特別なビット値を記憶する。グラフィックフォーマッタ130の出力からのグラフィック画素はコンパレータ(比較器)143の入力の1つに与えられる、すなわち、レジスタ141に記憶された特別なビット値がコンパレータ143のもう一方の入力に与えられる。コンパレータ143は特別ビット値のグラフィックデータを比較し、またフレームバッファからのビデオウィンドウのビット値の端はコンパレータによって検出され、出力制御回路145に対し信号を出力する。出力制御は、ビデオ入力信号をグラフィック入力信号の代わりにその出力に渡すことにより、マルチプレクサ39にスイッチ信号を出す。出力信号はマルチプレクサ147に与えられる。ビデオウィンドウの反対の端は、リーディング端と類似の方法で検出される。
【0102】
カーソル定義データはスタティックランダムメモリ(SRAM)149に記憶され、読み出し出力が制御信号145を出力するために「カーソル」入力に与えられる。システムプロセッサは、カーソルがある位置を検出し、それはカーソルアドレス回路151をアドレスCUR_ROWによって可能状態にし、SRAM149にアドレスを与える。SRAMから受信したデータから、出力制御145は、カーソル前景色(カーソル前景色レジスタ153によって記憶されシステムバスSYSから受信したデータを定義する)、後景色(カーソル後景色レジスタ155によって記憶されシステムバスSYSから受信したデータを定義する)、グラフィック参照テーブル135からのグラフィック画素、ビデオ参照テーブル137からのビデオ画素もしくは、グラフィック画素またはビデオ画素(もしカーソルが反転ビデオモードであれば)の反転の中のどれを表示装置に送信するか、もしくは上記回路からのその入力が出力に渡されるものを制御するためにマルチプレクサ147に制御信号を与えるかを決定する。
【0103】
マルチプレクサ147からの出力データは3つの8ビットデジタルアナログ変換器157に与えられ、データはそれぞれ赤、緑、青のRGB信号に変換されビデオモニターの使用に対し、赤、緑、青のポートに出力される。
【0104】
本発明により消費される電力は、電力を浪費する多数の回路が同時に動作するために最小であるべきであるということに注意すべきである。例えば、5128までPDUは同時に動作する。本発明において電力の浪費を最小にする特別な技術の1つはここで説明されたようなレジスタの構成、構造、動作を使用することである。この方法において、バスはVSSの振れに対する最大のVDDより小さい値をもち、データはさらに検出され最大論理値で記憶される。
【0105】
本発明の2番目の高い電力利用部分は大容量で広域なデータバスである。5128までデータバスは同時にアクセスされる。もしVSS電圧の振れに対する最大のVDDがすべてのこれらのデータバス上で許されれば、大量の電力が必要とされるであろう。
【0106】
図20はこれらのデータバスにおいて使用された電力を最小化するための回路を示す。データバス電圧を制限する回路自己時間は最大VDDよりずっと小さい値までゆれる。
【0107】
相互結合インバータ159A、159Bはそれぞれセンスアンプの送信と受信を形成する。アクセスFET161を介してデータバスリード線の対DBとDB_に連結されている。電源入力はPR_TとPS_Tリード線にそれぞれ接続されアクセスFET161のゲートはセンスアンプの送信のためのDB_SEL_Tリード線とセンスアンプの受信のためのDB_SEL_Rリード線にそれぞれ接続されている。これらは、同時に動作する639個の同一のセンスアンプに沿ってフレームバッファの中に位置する。
【0108】
ダミーデータバス、DDB、DDB_とそれに接続する以下に述べる他の回路が、本当のデータバス上の電圧がセンスアンプを読み出すためにそれの受信を可能にするために十分に分割される時を決定するために使用される。これらの他の回路はメモリ制御の中に位置する。
【0109】
FET164は保護ダイオードのように動作する。データバスに対するレジスタ転送を実行する前に、データバスは最初に、VDD/2のような所定のプリチャージ電圧にEQU信号を出力することにより、プリチャージされなければならない。本当のデータバスDB、DB_とダミーデータバスDB、DB_はプリチャージ回路169、170を介して前述した方法でプリチャージされる。データが転送される各レジスタビットは、DB_SEL_R制御信号が、プリチャージされたデータバスがレジスタノートに対しプリチャージ電圧までチャージすることを可能にすることにより、もしくは、示されたように同時にPS_RとPR_R制御線を指定した時に、各レジスタビットにおいて各々のプリチャージトランジスタを使用することにより、プリチャージされなければならない。
【0110】
データバスのプリチャージとレジスタのプリチャージができなくなった後、送信センスアンプ159Aは最初に電荷をデータバスDBとDB_に出力するように可能状態にされる。受信センスアンプはこの間、PR_RとPS_Rリード線を強制的にVDD/2の電圧にすることにより均一にされる。データバスがチャージされる時、ダミーデータバスも、FET165を通してダミーデータバスDDB、DDB_にアクセスするFET163を介して同時にチャージされる。FET163、165は、センスアンプ159Aの中のFETと同じサイズでありまたそれぞれFET161にアクセスするべきである。
【0111】
差動アンプ167はダミーデータバスに接続されており、該データバスはダミーデータバス(ここでは本当のデータバス)が読み出し可能である時を検出する大きさに作られる。その大きさは、マージンが任意の2つのデータバスの差をカバーするように含まれるように作られなければならない。
【0112】
ダミーデータバスが常に既知の方向に移動することより、作動アンプは所定のオフセットで設計される。DDB電圧はDDB_がVSSまで変化する間VDDまで変化する。オフセットの設定の1つの方法は、例えば、トランジスタ168とトランジスタ169を等しく、しかし200mVから500mVのオフセットを設定するためにトランジスタ170の長さに対する幅の割合い(W/L)を171より小さくすることである。
【0113】
差動アンプが読み出し可能信号を検出した時、DB_OKリード線上のデータバスOK信号が活動状態にされる。この信号は送信センスアンプ159Aを不可能状態にし、受信センスアンプ159Bを可能状態にするために使用される。
【0114】
プリチャージ回路172はセンスアンプ159Bをプリチャージするために回路169の代わりに選択的に使用され、FET161とセンスアンプ159Bのインターフェースに接続される。プリチャージ回路172は、使用されている時は、プリチャージ回路169と類似の方法でVBLP電圧線とEQU可能線に接続される。
【0115】
この方法において、データバス電圧はデータの正確な読み出しに必要な電圧以上に上昇しないよう制限される、それはほとんど常にVDDより小さく、結果としてかなりの電圧が節約でき浪費を防げる。
【0116】
本発明において、当業者は、前述した実施例の別の構成、具体例、あるいはバリエーションを考えることができる。請求の範囲で記載されていることは、すべて本発明の一部分として考えられる。
【符号の説明】
【0117】
1 CPU、3 ISAバス、5 ROM、7 RAM、9 ディスク、10 プリンター、11 キーボード、12 指示装置、13 表示装置、15 システムバス、17 バッファ、19 ビデオインターフェース、21 グラフィックプロセッサ、23 参照テーブル(LUT)、27,47 描画装置、28,40 表示プロセッサ、29 CRT制御装置、31 VRAM、33 データバス、39,106,147 マルチプレクサ、41,42,52 バス、44 DRAM、45 画素論理システム、46 画素プロセッサ、48,58 ビデオ入力フォーマッタ、49 RAMDAC、50 フレームバッファ、54 画素出力経路サブシステム、56 フレームバッファ制御、60 ビデオ入力シフトレジスタ、62 ビデオ出力シフトレジスタ、64 グラフィック出力シフトレジスタ、65 DRAM、66 メモリ制御、68 大規模パラレルバス、70,90 画素データユニット(PDU)、72 バレルシフター、74 DRAM、76,84 センスアンプ、78A,78B Xデコーダ、79,190 インバータ、81 ワード線(行)、82 ビット線(列)、83 ビット記憶セル、86 データバス、87 Y選択線、91 PDUデコーダ、93 ソースレジスタ、94 行き先レジスタ、95 ブラシレジスタ、96 ROP4レジスタ、97 マスクレジスタ、98 ROP4、99 システムバスインターフェース、100 データバスインターフェース、102,114,126 インバータ、104,110,112A,112B,161,163,164,165,180A,180B,181,182A,182B,184,185A,185B 電界効果トランジスタ(FET)、108 2対1(2to1)マルチプレクサ、116 シフトレジスタ、118 制御回路、120 320ビットシフトレジスタ、122 イネーブル回路、124 4ビットシフトレジスタ、125 NANDゲート、130 グラフィックフォーマッタ、131 ビデオフォーマッタ、133 色領域(カラースペース)変換器、135 グラフィック参照テーブル、137 ビデオ参照テーブル、141 ビデオキーカラーレジスタ、143 コンパレータ(比較器)、145 出力制御、151 カーソルアドレス回路、153 カーソル前景色レジスタ、155 カーソル後景色レジスタ、157 デジタル・アナログ(D/A)変換器、159A 送信センスアンプ、159B 受信センスアンプ、167 差動アンプ、169,170,172 プリチャージ回路、188,189,191 3状態反転バッファ

【特許請求の範囲】
【請求項1】
IC(集積回路)において、
(a)第1の方向を向くビット線と、前記第1の方向と直交する第2の方向を向くワード線とを有する複数のメモリアレイと、センスアンプの複数の行とを含み、前記センスアンプの各行が少なくとも1つの前記複数のメモリアレイ内のビット線に接続される、データを記憶するDRAM(ダイナミックランダムアクセスメモリ)と、
(b)ソフトウェアによって要求される指示に応じてデータを処理するプロセッサと、
(c)大規模パラレルバスと、を含み、
前記大規模パラレルバスは、
前記複数のメモリアレイと、前記センスアンプの複数の行にわたって前記第1の方向に走り、
センスアンプの行の1つに選択的に接続可能であり、
前記DRAMから前記プロセッサへと、処理のためにデータのブロックを並列に転送するためのものであり、
前記プロセッサから前記DRAMへと、処理されたデータを並列に転送するためのものである、
ことを特徴とするIC(集積回路)。
【請求項2】
前記DRAMが、少なくとも1つのグラフィックおよびビデオ画素データを記憶するフレームバッファであり、前記プロセッサが、グラフィックプロセッサである、
ことを特徴とする、請求項1に記載のIC。
【請求項3】
各アレイのビット線の半分が、アレイの第1の側に隣接したセンスアンプの行に接続され、ビット線の他の半分が、アレイの第1の側と反対の第2の側に隣接したセンスアンプの行に接続される、
ことを特徴とする、請求項1に記載のIC。
【請求項4】
2つのアレイの間に位置する1行のセンスアンプが前記2つのアレイによって分けられている、
ことを特徴とする、請求項3に記載のIC。
【請求項5】
前記大規模パラレルバスが複数の双方向バス線を含み、各双方向バス線が、DRAMからプロセッサへデータを転送し、処理されたデータをプロセッサからDRAMへ転送するためのものである、
ことを特徴とする、請求項1に記載のIC。
【請求項6】
前記大規模パラレルバスが複数のバス線の組を含み、前記複数のバス線の各組が、データの1ビットを差動的に転送するためのものである、
ことを特徴とする、請求項5に記載のIC。
【請求項7】
前記大規模パラレルバスが複数のバス線の組を含み、前記複数のバス線の各組が、データの1ビットを差動的に転送するためのものである、
ことを特徴とする、請求項1に記載のIC。
【請求項8】
前記センスアンプが、通過トランジスタを介して大規模パラレルバスに接続される、
ことを特徴とする、請求項1に記載のIC。
【請求項9】
前記センスアンプが、nチャンネル通過トランジスタを介して大規模パラレルバスに接続される、
ことを特徴とする、請求項8に記載のIC。
【請求項10】
前記センスアンプの各行が、それぞれ1つの前記メモリアレイ内のビット線に接続される、
ことを特徴とする、請求項1に記載のIC。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate


【公開番号】特開2010−266871(P2010−266871A)
【公開日】平成22年11月25日(2010.11.25)
【国際特許分類】
【出願番号】特願2010−132490(P2010−132490)
【出願日】平成22年6月9日(2010.6.9)
【分割の表示】特願2008−23690(P2008−23690)の分割
【原出願日】平成7年6月1日(1995.6.1)
【出願人】(595078840)アクセラリックス・リミテッド (2)
【氏名又は名称原語表記】Accelerix Limited
【Fターム(参考)】