実験データを効率的に収集して記憶するための方法およびシステム
【課題】細胞データを解析、操作して保管でき、柔軟で拡張可能な細胞データの倉庫を提供し、細胞の集合体に適用された新たな薬物化合物の識別、選択、妥当性確認、スクリーニングを向上させ、また、新たなバイオインフォマティクス技術を提供し、複数のデジタル写真画像を含む実験データを効率的に収集記憶する方法及びシステムを提供する。
【解決手段】典型的なデータ記憶システム10は、クライアントコンピュータ18に接続された解析機器12と、共有データベース24と、コンピュータネットワーク40を備えたデータ記憶アーカイブ30とを有し、解析機器12は、ヌクレオチドや細胞等の実験データを収集可能な任意の走査器と、実験データを解析することができる任意の解析機器とを有し、さらに、共有データベース24は、解析機器12からのデータを記憶するマルチユーザ及びマルチビューのリレーショナルデータベースを構成する。
【解決手段】典型的なデータ記憶システム10は、クライアントコンピュータ18に接続された解析機器12と、共有データベース24と、コンピュータネットワーク40を備えたデータ記憶アーカイブ30とを有し、解析機器12は、ヌクレオチドや細胞等の実験データを収集可能な任意の走査器と、実験データを解析することができる任意の解析機器とを有し、さらに、共有データベース24は、解析機器12からのデータを記憶するマルチユーザ及びマルチビューのリレーショナルデータベースを構成する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、実験データを収集して記憶することに関する。具体的には、この本発明は、自動多機能高スループット実験データ収集システムからの実験データを効率良く収集して記憶するための方法およびシステムに関する。
【背景技術】
【0002】
この出願は、1998年11月13日に出願された米国仮出願第60/108,291号、1998年12月1日に出願された米国仮出願第60/110,643号、1999年6月21日に出願された米国仮出願第60/140,240号、1999年7月6日に出願された米国仮出願第60/142,375号、1999年7月6日に出願された米国仮出願第60/142,646号に基づく優先権を主張している。
【0003】
歴史的に、新薬の発見および開発は、多額の費用と長い時間を要する非効率的な工程である。1つの薬物を市場に出すためには、約8〜12年の歳月を要し、また、約3億5千万ドル〜5億ドルの費用がかかるため、薬剤研究開発市場は、薬物の発見工程を簡素化できる新たな技術を必要としている。薬剤研究開発市場における会社は、新薬を開発するための研究開発サイクルの短縮を図るため、すさまじい圧力下に晒されている。一方、同時に、新規な薬物の発見スクリーニング計測技術が開発されており、莫大な量の実験データが得られている。
【0004】
生物製剤のための自動スクリーニングシステムの革新および他の研究によって、莫大な量のデータを産み出すことができる。これらのシステムによって多量の機能豊富なデータが形成され、データからの情報を有効に管理して使用するために、非常にやりがいのある問題が生じた。この技術分野において知られるように、「機能豊富」なデータは、対象物(例えば、細胞)の1または複数の個々の特徴が収集され得るデータを有している。スクリーニング計測を産み出す多量のデータからのデータの可能性(潜在能力)を十分に活用するためには、情報科学的且つ情報生物学的な道具が必要である。
【0005】
新薬化合物の識別、選択、妥当性確認、スクリーニングは、しばしば、デオキシリボ核酸(DNA)、リボ核酸(RNA)、あるいは他のヌクレオチドの配列を使用したヌクレオチドレベルで行われる。「遺伝子」はDNAの領域であり、「タンパク質」は遺伝子の生成物である。一般に、タンパク質分子の存在および濃度は、所定の状態で遺伝子が「発現されている」か「抑制されている」かを決定する助けとなる。天然および人工の化合物に対する遺伝子の応答は、一般に、既存の薬物を改良して新薬を開発するために使用される。しかしながら、ヌクレオチドレベルではなく、細胞レベルで新たな化合物の作用を決定することが適切な場合もある。
【0006】
細胞は、生命の基本単位であり、DNA、RNA、タンパク質、代謝産物、イオン、他の細胞化合物からの情報を統合している。ヌクレオチドレベルで期待できると思われる新たな化合物は、細胞レベルで有毒な場合がある。イオン濃度、膜電位、酵素活性、遺伝子発現を決定するとともに、代謝産物、タンパク質、脂質、糖質(炭水化物)、および他の細胞化合物の存在を決定するために、蛍光を基本とした試薬を細胞に適用することができる。
【0007】
一般に使用される細胞スクリーニング法には2つのタイプがある。すなわち、(1)固定細胞スクリーニング、および、(2)生細胞スクリーニングである。固定細胞スクリーニングにおいては、検査される実験化合物を用いて、当初生きている細胞が処理される。所望の化合物を適用した後は、細胞の環境制御を行わない。そして、細胞は、スクリーニング中に死んでしまうかもしれない。生細胞スクリーニングは、所望の化合物を適用した後、細胞の環境制御(例えば、温度、湿度、ガス等)が必要であり、スクリーニング中において、細胞は、活動状態に維持される。固定細胞分析によれば、空間的な測定結果を得ることができできるが、時間的には測定結果を1点でしか得られない。生細胞分析によれば、空間的および時間的な両方で、測定結果を得ることができる。
【0008】
細胞内に存在する化学的および分子的な情報の空間的および時間的な頻度は、細胞集合体から機能豊富な細胞情報を抽出することを可能にする。例えば、複数の分子的および生化学的な相互作用、細胞動態、サブ細胞の分布の変化、細胞形態の変化、混合集合体における個々の細胞の特殊型の変化、サブ細胞の分子活性の変化、細胞の情報伝達の変化、および、他のタイプの細胞情報を得ることができる。
【0009】
蛍光基部を有する試薬を使用した、生化学的および分子的なタイプの細胞ベースの分析は、急速に広まっている。細胞ベースの分析の増大するリストから得られる別個の情報を自動的に抽出することが必要であることから、多機能細胞分析スクリーニングのためのオートメーションプラットフォームの開発が可能となった。例えば、ペンシルバニア州のピッツバーグにあるセロミクス社(Cellomics,Inc.)のアレースキャンシステム(ArrayScan System)は、そのような多機能細胞スクリーニングシステムの1つである。カリフォルニア州のサニーベールにあるモレキュラー・デバイス社(Molecular Devices,Inc.)のFLIPR、カリフォルニア州のフォスターシティーにあるPEバイオシステムズ(PE Biosystems)のFMAT、現在、メリーランド州のゲーサーズバーグにあるパーキンエルマー・ライフサイセンス(Perkin-Elmer Life Sciences)の子会社であるEG&Gウォーレス(EG&G Wallac)のViewLux等のような細胞を基本とするシステムは、多量のデータおよび写真画像を形成し、効率的なデータ管理の問題を解決できる。一般に、写真画像はデジタルカメラを使用して収集される。後述するように、1つの写真画像は、512キロバイト(KB)以上の記憶スペースを占める場合がある。多量の写真画像を収集して記憶すると、高スループットのシステムを使用した場合に生じるデータの問題が付加される。蛍光ベースのシステムの詳細な情報に関しては、1999年5月/6月に発刊されたModern Drug Discovery第2(3)刊の61頁〜71頁にあるRandy Wedinによる「Bright ideas for high-throughput screening-One-step Fluorescence HTS assays are getting faster,cheaper,smaller,and more sensitive」を参照のこと。 この技術分野で知られているそのような自動多機能細胞スクリーニングシステムおよび他のシステムは、一般に、ミクロプレート走査ハードウェアと、細胞の蛍光励起と、蛍光専用発光光学系と、カメラを有する写真顕微鏡と、データ収集と、データ記憶およびデータ表示能力とを含んでいる。多機能細胞スクリーニングの更なる情報に関しては、1997年冬に発刊されたISSN(国際規格一連番号)1087-0571の雑誌、Biomolecular Screening第2刊第4号の249頁〜259頁にあるKenneth A.Guilianoらによる「High content fluorescence-based screening」、1999年4月に発刊されたISSN1087-0571の雑誌、Biomolecular Screening第4刊第2号の75頁〜68頁にあるBruce R.Conwayらによる「PTH receptor internalization」、1998年3月に発刊されたISSN0167-7799のTrends in Biotechnology(TIBTECH)第16刊第3号の99頁〜146頁にあるKenneth A.GuilianoおよびD.Lansing Taylorによる「Fluorescect-protein biosensors:new tools for drug discovery」を参照すること。これらの全ては、参照することによって本願に組み込まれる。
【0010】
自動多機能細胞スクリーニングシステムは、一般に、複数のウェルを有するミクロプレートを自動的に走査して、所定の空間分解能で、1または複数の時間に、細胞の多色蛍光データを取得する。自動多機能細胞スクリーンシステムは、一般に、複数の蛍光のチャネルをサポートして、異なる波長で多色蛍光データを収集するとともに、細胞のサイズや形状といった特徴および細胞内の細胞小器官のサブ細胞の測定値を有する細胞特徴情報を個々の細胞毎に収集することができる。
【0011】
高スループットスクリーニングシステムによってデータを収集すると、非常に多くのデータが形成され、多くのバイオインフォマティクスな問題が与えられる。この技術分野で知られているように、「バイオインフォマティクス」技術は、細胞情報を含む生物学的情報の収集、処理、記憶、検索、解析に関連する問題を扱うために使用される。バイオインフォマティクスは、情報を体系的に開発して適用する技術として、また、生物学的工程に関する観察するために実験、モデリング、データベース検索、計測によって得られるデータを収集、解析、表示するためのデータ処理技術として定義付けられる。データを効率良く管理するために必要なものは、多機能細胞スクリーニングシステムや細胞を基本とする配列に限らない。高スループットスクリーニング(HTS)分析を実行する任意の器具もまた多量のデータを形成すると言える。例えば、DNA配列、バイオチップ、顕微鏡法、ミクロアレー、ゲル分析のような他のデータ収集技術の使用が増えるにつれて、写真画像データを含むデータの収集量も急激に増大している。この技術分野で知られるように、「バイオチップ」は、数百もしくは数千の吸収性ミクロゲルが表面に固定された層である。単一のバイオチップは、10,000個以上のミクロゲルを有しているかもしれない。分析テストを行う場合には、バイオチップ上の各ミクロゲルは、マイクロ試験管あるいはミクロプレート内のウェルと同様である。バイオチップは、知られた生物学的サンプルおよび知られていない生物学的サンプル(例えば、ヌクレオチド)を自動高スループットスクリーニングシステム内で解析するための媒体を提供する。
【0012】
多種多様のデータ収集技術を使用することができるが、細胞を基本とする高スループットスクリーニングシステムは、一例として、高スループットスクリーニングシステムの略全てに生じ得る幾つかの対応するデータ管理問題を明らかにするために使用される。機能豊富な細胞データの収集に関する1つの問題は、多機能スクリーニングのために使用されるミクロプレートが96〜1536個のウェルを有しているという点である。この技術分野で知られているように、「ミクロプレート」は、解析のための複数のサンプルを記憶する平坦で奥行きのない皿である。「ウェル」は、解析のための個々のサンプルを収容するために使用されるミクロプレート内の小さな領域である。各ウェルは、複数のフィールドに分割されても良い。「フィールド」は、写真顕微鏡における視野(すなわち、ズームレベル)を示すウェルのサブ領域である。各ウェルは、一般に、1〜16個のフィールドに分割される。一般に、各フィールドは、それについて撮られた1つの写真画像と6つの写真画像との間に有しており、異なる光フィルタを使用して、所望の細胞構成要素の異なる蛍光反応における光の異なる波長をとらえる。各フィールドにおいては、所定数の細胞が解析のために選択される。細胞の数は変化する(例えば、10〜100)。各細胞に関して、複数の細胞特徴が収集される。細胞特徴は、細胞のサイズや形状等の特徴を含んでいても良い。すなわち、一般に、1つのミクロプレート上のたった1つのウェルに関して、非常に多くの量のデータが収集される。
【0013】
データ量の観点から、1つのウェルに関して保存されるデータは、収集される細胞特徴の記録数および収集される画像数によって見積もることができる。収集される画像数は、一般に、(ウェルの数×フィールドの数×1フィールド当たりの画像)によって見積もることができる。現在の画像ファイルのサイズは、圧縮されていないデータで、約512キロバイト(KB)である。この技術分野で知られているように、1バイトは8ビットデータである。細胞特徴の記録数は、一般に、(ウェルの数×フィールドの数×1フィールド当たりの細胞×1細胞当たりの特徴)によって見積もることができる。ミクロプレート上の複数のウェルから収集されたデータは、一般に、コンピュータシステム上でフォーマットされて記憶される。収集されたデータは、ビジュアルプレゼンテーションアプリケーションに使用でき且つバイオインフォマティクス技術を使用してデータを採取、ファイル保管することができるフォーマット内で記憶される。
【0014】
例えば、典型的なシナリオとして、1ウェル当たり4つのフィールドを使用し、1フィールド当たり3つの画像を使用し、1画像当たり512キロバイトの画像サイズを使用して、96個のウェルを有する1つの低密度ミクロプレートを走査すると、約1152個の画像および576メガバイト(MB)の画像データ(すなわち、(96×4×3×512×(1KB=1024バイト)/(1MB=(1024バイト×1024バイト))=576MB)が形成される。この技術分野で知られているように、メガバイトは、220すなわち1,048,576バイトであり、一般に「100万バイト」として解釈されている。
【0015】
1フィールド当たり100個の細胞を選択して、細胞当たり10個の特徴が演算されるとした場合、そのような走査により、(96×4×100×10)=288,000個の細胞特徴の記録が形成され、そのデータサイズは、収集される細胞特徴の量に伴って変化する。これにより、96個のウェルを有するミクロプレートを1日に20時間、1週間に5日間走査すると、1日当たり約12,000MBのデータが形成され、1週間当たり約60,000MBのデータが形成される。
【0016】
現在の多機能細胞スクリーニングシステムに基づく高データ量のシナリオにおいては、1ウェル当たり16個のフィールドを使用し、1フィールド当たり4つの画像を使用し、1フィールド当たり100個の細胞を使用し、1細胞当たり10個の特徴を使用し、1画像当たり512キロバイトの画像サイズを使用して、384個のウェルを有する1つの高密度ミクロプレートを走査すると、約24,576個の画像すなわち12,288MBの画像データおよび約6,14,4000個の細胞特徴の記録が形成される。これにより、384個のウェルを有するミクロプレートを1日に24時間、1週間に7日間走査すると、1日当たり約14,400MBのデータが形成され、1週間当たり約100,800MBのデータが形成される。
【0017】
複数のミクロプレートを平行に走査することができ、また、複数の自動多機能細胞スクリーニングシステムを1日に24時間、1週間に7日間、1年に365日動作させることができるため、収集される実験データは、一般的なコンピュータネットワークの物理的な記憶限界を簡単に超えてしまう。例えば、一般的なコンピュータネットワークのディスク記憶は、約10ギガバイト(GB)〜約100GBの範囲である。この技術分野で知られているように、ギガバイトは、230すなわち1024MBバイトであり、一般に「10億バイト」として解釈されている。
【0018】
連続的なベーシスで使用される従来のコンピュータネットワークにおいて、多機能細胞スクリーニングを使用するために必要なデータ記憶(必要メモリ)は、現在のデータ記憶技術では非常に高価となるテラバイト(TB)の記憶スペースを簡単に超えてしまう。この技術分野で知られているように、テラバイトは、240であり、一般に「1兆バイト」として解釈されている。すなわち、自動多機能細胞スクリーニングシステムによってデータを収集して記憶する場合、従来のコンピュータネットワークの動作や記憶装置に悪影響を与えてしまう。
【0019】
多機能細胞スクリーニングシステムに関する他の問題は、たとえ多量の細胞データを収集した場合であっても、視覚的表示に使用できるのは、収集された全ての細胞特徴データおよび画像データのうちのほんの僅かな割合だけであるという点である。それにもかかわらず、新たな化合物に関して統計的に関連がある情報を集めるために、形成された全ての細胞データは、一般に、ローカルハードディスクに記憶されて、解析のために利用される。これもまた、ローカルハードディスクに悪影響を与えてしまう。
【0020】
更なる他の問題は、ミクロプレートを走査すると、1つのミクロプレートに関する情報が、1プレート当たり約1,000データベースレコードを簡単に超えてしまい、細胞特徴データおよび画像データが、1プレート当たり約6000000データベースレコードを簡単に超えてしまうという点である。パーソナルコンピュータ上で使用される従来の殆どのデータベースは、データのそのような多くの記録数を簡単に記憶して操作することができない。また、データに問い合わせたり表示したりするために、従来のパーソナルコンピュータ上でそのような大きなデータベースを開くには、比較的長い時間またなければならず、これは、ネットワークの性能に悪影響を与えるとともに、ユーザのフラストレーションすなわち不満を急速に高める。
【0021】
したがって、連続的なベーシスで多機能スクリーニングに使用できるデータ記憶システムを提供することが望ましい。そのようなデータ記憶システムは、容易に管理でき且つデータを解析、操作して保管(アーカイブ)することできる柔軟で拡張可能な細胞データの倉庫を提供しなければならない。
【発明の概要】
【0022】
本発明の好ましい実施形態によれば、機能豊富な実験データを収集して記憶することに伴う幾つかの問題が解決される。実験データを効率的に収集して記憶するための方法およびシステムが提供される。
【0023】
本発明の1つの態様は、実験データを収集するための方法を含んでいる。この方法は、コンテナ内の所望のサブコンテナから画像および特徴データを収集する。画像および特徴データは、複数の画像および特徴データベース内に記憶される。所望のサブコンテナおよびコンテナに関して演算されるサマリーデータは、サブコンテナデータベースおよびコンテナデータベース内に記憶される。
【0024】
本発明の別の態様は、コンピュータシステム上に実験データを記憶するための方法を含んでいる。この方法は、コンテナ内の所望のサブコンテナから画像データおよび特徴データを収集する。画像および特徴データは、複数のデータベーステーブルから成る複数の第3のデータベース内に記憶される。所望のサブコンテナおよびコンテナに関して演算されるサマリーデータは、複数のデータベーステーブルから成る第2のデータベース内に記憶される。パススルーデータベースである第1のデータベースが形成される。第1のデータベースは、第2のデータベースに向かう複数のリンクと複数の第3のデータベースに向かう複数のリンクとを有するパススルーデータベーステーブルを備えているが、コンテナから収集されるデータを全く有していない。
【0025】
本発明の別の態様は、実験データを、データを収集するデバイスから、複数の異なる離れた記憶場所へスプーリングするための方法を含んでいる。第2のデータベースおよび複数の第3のデータベースの新たな場所を示すために、第1のデータベースのパススルーデータベーステーブル内のリストが更新される。
【0026】
本発明の別の態様は、実験データを階層管理するための方法を含んでいる。所定の記憶移動手段が、データベース内のデータベースファイルに適用される。任意のデータベースファイルが所定の記憶移動手段に適合する場合には、データベースファイルが、多層の階層記憶管理システム内の層にコピーされる。最初のデータベースファイルは、階層記憶管理システムの層内の最初のデータベースファイルに向かうリンクを有するプレイスホルダファイルに取って代えられる。
【0027】
本発明の別の態様は、ディスプレイアプリケーションからの実験データをコンピュータ上に与えることを含んでいる。ディスプレイアプリケーションによって与えられたデータは、コンピュータから離れた複数の場所から得られる複数のデータベースから取得される。表示されたデータは、離れた場所からではなく、コンピュータの局部記憶装置のデータベースから得られるように見える。
【0028】
本発明の別の態様は、ほぼ無制限量のデータ記憶のための「仮想」ディスクスペースを、収集される実験データを記憶するための複数の局部の記憶場所および離れた記憶場所に与えるデータ記憶システムを含んでいる。
【0029】
これらの方法およびシステムによれば、高スループットのデータ収集システムからの実験データを効率的に収集して、記憶し、管理して、表示することができる。例えば、この方法およびシステムは、複数のウェルすなわち実験的な化合物が細胞の集合体に適用される複数のミクロゲルを含むバイオチップを有するミクロプレートから収集された細胞画像データおよび細胞特徴データを記憶管理して表示するために使用できるが、これに限定されるものではない。
【0030】
この方法およびシステムは、容易に管理でき且つデータを解析、操作して保管することできる柔軟で拡張可能な細胞データの倉庫を提供することができる。また、この方法およびシステムは、新たな実験化合物(例えば、薬物化合物)の識別、選択、妥当性確認、スクリーニングを向上させることができる。また、この方法およびシステムは、実験データに関する観察に使用される新たなバイオインフォマティクス技術を提供するために使用できる。
【0031】
本発明の好ましい実施形態の前述した特徴および他の特徴は、以下の詳細な説明から更に容易に認識することができる。以下、添付図面を参照しながら詳細に説明する。
【図面の簡単な説明】
【0032】
【図1A】典型的な実験データ記憶システムを示すブロック図である。
【図1B】典型的な実験データ記憶システムを示すブロック図である。
【図2】典型的なアレー走査モジュールアーキテクチャを示すブロック図である。
【図3A】実験データを収集するための方法を示すフローチャートである。
【図3B】実験データを収集するための方法を示すフローチャートである。
【図4】実験データを記憶するための方法を示すフローチャートである。
【図5】図4に記載の方法のための典型的なデータベースシステムを示すブロック図である。
【図6】図5に記載のアプリケーションデータベースの典型的なデータベーステーブルのレイアウトを示すブロック図である。
【図7】図5に記載のシステムデータベースの典型的なデータベーステーブルを示すブロック図である。
【図8】図5に記載の画像および特徴データベースの典型的なデータベーステーブルを示すブロック図である。
【図9】実験データをスプーリングするための方法を示すフローチャートである。
【図10】実験データを階層管理するための方法を示すフローチャートである。
【図11】実験データを与えるための方法を示すフローチャートである。
【図12】実験データをグラフィック表示するためのスクリーンディスプレイを示すブロック図である。
【発明を実施するための形態】
【0033】
典型的なデータ記憶システム
図1Aは、本発明の好ましい実施形態に係る典型的なデータ記憶システム10を示している。典型的なデータ記憶システム10は、クライアントコンピュータ18に接続された解析機器12と、共有データベース24と、コンピュータネットワーク40を備えたデータ記憶アーカイブ30とを有している。解析機器12は、ヌクレオチドや細胞のような機能豊富な実験データや他の実験データを収集可能な任意の走査器と、機能豊富な実験データを解析することができる任意の解析機器とを有している。この技術分野において知られているように、「機能豊富な」データは、対象物(例えば細胞)の1または複数の個々の特徴が収集され得るデータを有している。クライアントコンピュータ18は、科学者や実験技術者がデータ解析するために使用するディスプレイアプリケーションを有する任意の従来のコンピュータである。共有データベース24は、解析機器12からのデータを記憶するマルチユーザ及びマルチビューのリレーショナルデータベースである。データアーカイブ30は、ほぼ無限の量の「仮想」ディスクスペースを多層の階層的記憶管理システムに提供するために使用される。コンピュータネットワーク40は、高速の任意のローカルエリアネットワーク(LAN)(例えば、1秒間に100メガビット以上のデータ転送速度を有する)である。しかしながら、本発明は、この実施形態に限定されるものではなく、これよりも多い或いは少ない同種の構成要素を使用することも可能である。データ記憶システム10は、生物学的な実験装置および非生物学的な実験装置からの機能豊富な実験データを収集したり解析したりすることができる実質的に任意のシステムのために使用することができる。
【0034】
図1Bは、特定の構成要素を備えた本発明の好ましい一実施形態に係る典型的なデータ記憶システム10'を示している。しかしながら、本発明はこの1つの実施形態に限定されるものではなく、これよりも多い或いは少ない同種の構成要素を使用することも可能である。データ記憶システム10'は、機能豊富な実験データを収集したり解析したりするための1または複数の解析機器12,14,16と、1または複数のデータ記憶クライアントコンピュータ18,20,22と、共有データベース24と、データ記憶サーバ26と、共有データベースファイルサーバ28とを有している。データ記憶アーカイブ30は、任意のディスクアーカイブ32と、光学ジュークボックス34あるいはテープドライブ36とを有している。データ記憶アーカイブ30は、後述するように記憶されて収集される実験データに使用される任意のデータベースのデザインを変更することなく、ほぼ無限の量の「仮想」ディスクスペースを多層の階層的記憶管理システムに提供するために使用できる。データ記憶ア−カイブ30は、オプショナルデータアーカイブサーバ38によって管理することができる。しかしながら、これよりも多い或いは少ないデータ記憶要素を使用することも可能であり、本発明は、図1Bに示されるデータ記憶システム10'の構成要素に限定されるものではない。
【0035】
本発明の典型的な1つの好ましい実施形態において、データ記憶システム10'は、以下の特定の構成要素を有している。しかしながら、本発明はこれらの特定の構成要素に限定されるものではなく、他の類似もしくは等価な構成要素を使用することもできる。解析機器12,14,16は、ミクロプレート、DNA配列や他のチップ状あるいはバイオチップ状の配列からの細胞の実験データのような実験データを収集、および/または解析することができる多機能アレー走査システムを備えている。バイオチップは、イリノイ州にあるショウンバーグのモトローラ株式会社(Motorola Corporation)や、コネチカット州のメリデンにあるパッカード・バイオサイエンス社(Packard BioScience Co.)の関連会社であるパッカード・インスツルメント(Packard Instrument)、あるいは、テキサス州にあるウッドランドのジェノメトリックス社(Genometrix,Inc.)などによって提供される任意のものである。
【0036】
解析機器12,14,16は、ペンシルバニア州のピッツバーグにあるセロミクス社(Cellomics,Inc.)や、カリフォルニア州のサンディエゴにあるオーロラ・バイオサイエンシズ・コーポレーション(Aurora Biosciences Corporation)、カリフォルニア州のサニーベールのモレキュラー・デバイス社(Molecular Devices,Inc.)、カリフォルニア州のフォスターシティーのPEバイオシステム(PE Biosystems)、メリーランド州のゲーサーズバーグのパーキンエルマー・ライフサイセンス(Perkin-Elmer Life Sciences)などによって提供される任意のものを含んでいる。1または複数のデータ記憶クライアントコンピュータ18,20,22は、ローカルハードディスク、共有データベース24、データ記憶サーバ26やデータ記憶アーカイブ30にグラフィカルユーザインターフェース(GUI)を提供するディスプレイアプリケーションを有する従来のパーソナルコンピュータである。GUIディスプレイアプリケーションは、科学者や実験技術者が標準的な解析を行うために使用され、顧客および問い合わせビューイング能力をサポートする。また、ディスプレイアプリケーションGUIは、表計算ソフト、グラフィックスパッケージ、ワードプロセッサといった標準的なデスクトップツールに転送されたデータをサポートする。
【0037】
データ記憶クライアントコンピュータ18,20,22は、ネットワーク40にわたるOpen Data Base Connectivity(OBDC)接続を介して、記憶サーバ26に接続している。本発明の一実施形態において、コンピュータネットワーク40は、1秒間に100メガビット(Mbit)以上の速度のイーサネット(登録商標)、ローカルエリアネットワーク(LAN)である。しかしながら、他のタイプのLANを使用することも可能である(例えば、光ケーブルもしくは同軸ケーブルのネットワーク)。また、本発明はこれらの特定の構成要素に限定されるものではなく、他の類似の構成要素を使用することもできる。
【0038】
この技術分野で知られているように、OBDCは、コンピュータネットワーク上のデータベースにアクセスするためのアプリケーションにおける共通の言語を提供するインターフェースである。記憶サーバ26は、記憶を基本とする機能に加えて内在するデータベース管理システム(DBMS)を制御する。
【0039】
共有データベース24は、1または複数の解析機器12,14,16からのサマリーデータを記憶するマルチユーザ及びマルチビューのリレーショナルデータベースである。共有データベース24は、標準的なリレーショナルデータベースツールおよび構造を使用している。データ記憶アーカイブ30は、画像および特徴データベースファイルのライブラリである。データ記憶アーカイブ30は、階層的記憶管理(HSM)技術を使用して、解析機器12,14,16のディスクスペースを自動的に管理するとともに、多層の階層的記憶管理システムを提供する。HSM技術については後述する。
【0040】
本発明の好ましい実施形態に係るデータ記憶システム10,10'の構成要素のための動作環境は、1または複数の高速中央演算処理装置(CPU)およびメモリを有する処理システムを備えている。コンピュータプログラミングの当業者の慣行にしたがって、本発明の処理システムによって実行される動作や命令の作用および記号表示に関しては後述する。そのような作用や動作あるいは命令は、「コンピュータ実行」あるいは「CPU実行」と称される。
【0041】
作用や記号的に示された動作あるいは命令が、CPUによる電気的な信号の操作を含んでいることは言うまでもない。電気システムは、結果として生じる電気信号の変化や減少および記憶システム内の記憶場所にあるデータビットのメンテナンスを引き起こすことによってCPUの動作と他の信号処理とを再構成もしくは変更するデータビットを表わしている。データビットが維持される記憶場所は、データビットに対応する特定の電気的、磁気的、光学的、有機的特性を有する物理的な場所である。
【0042】
また、データビットは、磁気ディスク、光ディスク、有機メモリを含むコンピュータ読み取り可能媒体上や、CPUによって読むことができる他の任意の揮発性(ランダムアクセスメモリ(RAM))もしくは非揮発性(リードオンリーメモリ(ROM))の大容量記憶システムにおいて維持されていても良い。コンピュータ読み取り可能媒体は、処理システムにだけ存在する媒体、あるいは、その処理システムから離れた複数の相互に接続された処理システム間もしくは相互に接続された複数のローカルな処理システム間で分配される媒体であって、協働する或いは相互に接続されたコンピュータで読むことができる媒体を含んでいる。
【0043】
アレー走査モジュールアーキテクチャ
図2は、典型的なアレー走査モジュール42のアーキテクチャを示したブロック図である。アレー走査モジュール42は、例えば解析機器12,14,16(図1B)に関連付けられたモジュールであり、4つの機能群すなわち4つのモジュールに分割されたソフトウェア/ハードウェアを有している。しかしながら、それより多い或いは少ない機能モジュールを使用することも可能であり、本発明は4つの機能モジュールに限定されない。取得モジュール44は、ロボット顕微鏡およびデジタルカメラを制御して画像を取得するとともに、その画像をアッセイモジュール46に送る。アッセイモジュール46は、画像を読み取ってグラフィックオーバーレイを形成するとともに、画像収集特徴データを解釈して、画像から抽出された特徴データおよび新たな画像を取得モジュール44に戻す。取得モジュール44は、画像および解釈された特徴データをデータベース記憶モジュール48に送る。データベース記憶モジュール48は、画像および特徴情報を、画像ファイルおよびリレーショナルデータベースの記録と組み合せて保存する。記憶クライアントコンピュータ18,20,22は、データベース記憶モジュール48を使用して、プレゼンテーションモジュール50によるプレゼンテーションおよびデータ解析のための特徴データおよび画像にアクセスする。プレゼンテーションモジュール50は、前述したように、GUIを有するディスプレイアプリケーションを備えている。
【0044】
実験データの収集
図3Aおよび図3Bは、実験データを収集するための方法52を示すフローチャートである。図3Aのステップ54では、構成情報を使用して、複数のサブコンテナを有するコンテナが初期化される。ステップ56では、コンテナのために使用された構成情報がコンテナデータベース内に記憶される。ステップ58では、コンテナ内の所望のサブコンテナのための繰り返しステップ60,62,64,66,68,70および72にループが入力される。ステップ60では、コンテナ内の1つのサブコンテナが選択される。本発明の好ましい実施形態においては、コンテナ内の全てのサブコンテナが解析される。本発明の別の実施形態においては、コンテナ内の全てのサブコンテナが解析されない。そのような実施形態において、ユーザは、解析のために、コンテナ内のサブコンテナの所望のサブセットを選択することができる。ステップ62では、サブコンテナから画像データが収集される。ステップ64では、画像データが画像データベース内に記憶される。ステップ66では、特徴データが画像データから収集される。
【0045】
図3Bのステップ68では、特徴データが特徴データベース内に記憶される。本発明の一実施形態において、画像データベースおよび特徴データベースは、画像および特徴データを有する複数の表から成る1つのデータベースに組み合わされる。本発明の他の実施形態において、画像データベースおよび特徴データベースは、別個のデータベースとして維持される。
【0046】
ステップ70では、サブコンテナのサマリーデータが演算される。ステップ72では、サブコンテナのサマリーデータがサブコンテナデータベース内に記憶される。本発明の一実施形態において、サブコンテナデータベースおよびコンテナデータベースは、サブコンテナおよびコンテナサマリーデータを有する複数の表から成る1つのデータベースに組み合わされる。本発明の別の実施形態において、サブコンテナデータベースおよびコンテナデータベースは、別個のデータベースとして維持される。コンテナ内の所望のサブコンテナが解析されるまで、ステップ58(図3A)のループは続く。コンテナ内で所望のサブコンテナが処理された後、ステップ58のループは終了する。
【0047】
図3Bのステップ74では、サブコンテナデータベースからのサブコンテナサマリーデータを使用して、コンテナサマリーデータが演算される。ステップ76では、コンテナサマリーデータがコンテナデータベース内に記憶される。
【0048】
本発明の一般的な使用においては、ステップ66で、画像をベースとする任意の解析システムからの特徴を使用することができる。1または複数のオブジェクト(例えば細胞)を含むデジタル化された画像が与えられると、一般に、画像を解析する段階および特徴データを特徴の大きさとして抽出する段階の2つの段階が存在する。第1の段階は、一般に、「画像の細分化」もしくは「オブジェクトの分離」と呼ばれる。この段階では、所望のオブジェクトが残りの画像から分離される。第2の段階は、一般に、「特徴抽出」と呼ばれる。この段階では、オブジェクトの大きさが演算される。「特徴」は、一般に、1または複数の大きさの関数であり、オブジェクトの重要な特性を定量化するように演算される。一般的なオブジェクトの大きさは、サイズ、形状、強度、テクスチャ、位置等を含んでいる。
【0049】
各大きさにおいて、複数の特徴は、一般に、大きさを反映するために使用される。オブジェクトの「サイズ」は、その面積、周の長さ、境界線、鮮明度、長さ、幅等によって表わすことができる。オブジェクトの「形状」は、その矩形度(例えば、長さと幅のアスペクト比)、真円度(例えば、周の長さの平方を面積で割ったもの、境界ボックス等)、慣性モーメント、差異チェーンコード、フーリエ記述子等によって表わすことができる。オブジェクトの「強度」は、オブジェクト内のピクセルのグレーレベルの総計平均、最大、あるいは最小によって表わすことができる。オブジェクトの「テクスチャ」は、オブジェクト内でグレーレベルの変化の特性を定量化し、標準偏差、変動、歪み、尖度を含む統計的な特徴およびスペクトル構造特徴等によって表わすことができる。オブジェクトの「位置」は、所定のグリッド方式に関し、オブジェクトの質量中心、水平および垂直度等によって表わすことができる。デジタル画像特徴の大きさについての更なる情報に関しては、1996年にKenneth R.Castleman、Prentice-Hallによって書かれたISBN-0132114674の「Digital Image Processing」、1994年に、G.A.Baxes,Wileyによって書かれたISBN-0471009490の「デジタル画像処理:原理と応用(Digital Image Processing:Principle and Applications)」、1991年にWilliam K.Pratt,Wiley and Sonsによって書かれたISBN-0471857661の「デジタル画像処理(Digital Image Processing)」、または1991年にJohn C.Russによって書かれたCRC PressのISBN-0849325161である「画像処理ハンドブック(The Image Processing Handbook)-第2版」を参照すること。これらの内容の全ては、参照することによって本願に組み込まれる。 本発明の1つの典型的な好ましい実施形態において、方法52は、「ミクロプレート」のウェルから細胞の画像データおよび細胞の特徴データを収集するために使用される。本発明の別の好ましい実施形態において、方法52は、バイオチップ内のミクロゲルから細胞の画像データおよび細胞の特徴データを収集するために使用される。この技術分野で知られているように、「ミクロプレート」は、解析のための複数のサンプルを記憶し且つ一般に96〜1536個の個々のウェルを有する平坦で奥行きのない皿である。「ウェル」は、解析のための個々のサンプルを収容するために使用されるミクロプレート内の小さな領域である。各ウェルは、複数のフィールドに分割されても良い。「フィールド」は、写真顕微鏡における視野(すなわち、ズームレベル)を示すウェルのサブ領域である。一般に、各ウェルは、それについて撮られた1つの写真画像と6つの写真画像との間に有しており、異なる光フィルタを使用して、所望の細胞構成要素の異なる蛍光反応における光の異なる波長をとらえる。しかしながら、本発明はそのような実施形態に限定されるものではなく、他のコンテナ(例えば、DNAチップのような様々な生物学的チップ、ミクロアレー、複数のサブコンテナを有する他のコンテナ)やサブコンテナを使用して細胞以外から画像データおよび特徴データを収集することもできる。
【0050】
ミクロプレート内のウェルから細胞データを収集する実施形態において、ステップ54では、構成情報を使用して、複数のウェルを有するミクロプレートが初期化される。ステップ56では、ミクロプレートのために使用された構成情報がミクロプレートデータベース内に記憶される。ステップ58では、ミクロプレート内の所望のウェルに関してステップ60,62,64,66,68,70および72を繰り返すためにループが入力される。ステップ60では、ミクロプレート内の1つのウェルが選択される。ステップ62では、細胞の画像データがウェルから収集される。本発明の1つの好ましい実施形態において、細胞の画像データは、ロボット顕微鏡に取り付けられたデジタルカメラを用いて収集されたデジタル写真画像を含んでいる。しかしながら、他のタイプのカメラを使用することも可能であり、他のタイプの画像データを収集することもできる。ステップ64では、細胞の画像データが画像データベース内に記憶される。本発明の他の典型的な好ましい実施形態において、画像データベースは、バイナリフォーマット(例えば、タグ付き画像ファイルフォーマット(TIFF)、デバイスインディペンデントビットマップ(DIB)等)内に記憶された個々の画像ファイルの山である。個々の画像ファイルの山は、フォーマルデータベースフレームワークを含んでいてもいなくても良い。個々の画像ファイルは、他のデータベース(例えば、パススルーデータベース)からアクセス可能な特定のディレクトリ内に、個々の画像ファイルの山として存在していても良い。
【0051】
ステップ66では、細胞の特徴データは、細胞の画像データから収集される。本発明の1つの好ましい実施形態において、ステップ66は、表1に示される細胞の任意の特徴データを収集することを含んでいる。しかしながら、他の特徴データや他の細胞の特徴を収集することもでき、本発明は、表1に示される細胞の特徴データに限定されるものではない。実質的に、任意の特徴データを画像データから収集することができる。
【0052】
【表1】
図3Bのステップ68では、細胞の特徴データが細胞特徴データベース内に記憶される。本発明の一実施形態において、画像データベースおよび細胞特徴データベースは、細胞の画像および細胞の特徴データを有する複数の表から成る1つのデータベースに組み合わされる。本発明の他の実施形態において、画像データベース(すなわち、画像ファイル)および特徴データベースは、別個のデータベースとして維持される。
【0053】
図3Bのステップ70では、ウェルから収集された画像データおよび特徴データを使用して、ウェルのサマリーデータが演算される。本発明の1つの好ましい実施形態において、ステップ72で演算されたウェルのサマリーデータは、表2に示された任意のウェルのサマリーデータを演算することを含んでいる。しかしながら、本発明は表2に示されたウェルのサマリーデータに限定されるものではなく、他のサブコンテナおよび他のサブコンテナサマリーデータを演算することもできる。実質的に、所望のサブコンテナに関して任意のサブコンテナサマリーデータを演算することが可能である。表2において、「SPOT(スポット)」は、生物活性の尺度として蛍光反応強度のブロックを示している。
【0054】
【表2】
図3Bのステップ72では、ウェルのサマリーデータがウェルデータベース内に記憶される。本発明の一実施形態において、ウェルデータベースおよびミクロプレートデータベースは、ウェルおよびミクロプレートデータを有する複数の表から成る1つのデータベースに組み合わされる。本発明の別の実施形態において、ウェルデータベースおよびミクロプレートデータベースは、別個のデータベースとして維持される。ミクロプレート内の所望のサブウェルが解析されるまで、ステップ58(図3A)のループは続く。
【0055】
ミクロプレート内で所望のウェルが処理された後、ステップ58のループは終了する。図3Bのステップ74では、ミクロプレートデータベースからのウェルサマリーデータを使用して、サマリーデータが演算される。ステップ76では、ミクロプレートサマリーデータがウェルデータベース内に記憶される。
【0056】
本発明の1つの好ましい実施形態において、ステップ74で演算されたミクロプレートサマリーデータは、表3に示される任意のミクロプレートサマリーデータを演算することを含んでいる。しかしながら、本発明は表3に示されるミクロプレートサマリーデータに限定されるものではなく、他のコンテナおよび他のコンテナサマリーデータを演算することもできる。実質的に、任意のコンテナサマリーデータをコンテナに関して演算することができる。表3において、「MEAN」は、統計学的な平均を示しており、「STDEV」は、この技術分野で知られた統計学的な標準偏差を示しており、「SPOT(スポット)」は、生物活性の尺度として蛍光反応強度のブロックを示している。
【0057】
【表3】
本発明の1つの典型的な好ましい実施形態において、細胞分析(検定)は、表1〜表3から選択されたエントリーを使用して形成される。本発明の好ましい実施形態において、「細胞分析」は、画像を解析し且つ検査される生物学的工程に関連する結果を戻すために使用される画像処理方法の特別な実施形態である。特定の生物学的工程に向けられた細胞分析で使用される画像処理方法に関する更なる情報は、本願と同じ譲受人に譲渡され且これを参照することによって本願に組み込まれる係属中の出願09/031,217号および09/352,171を参照すること。 本発明の1つの典型的な好ましい実施形態において、ミクロプレートデータベースおよびウェルデータベースは、「SYSTEM.MDB」と呼ばれる複数の表からなる1つのデータベース内に記憶される。各ウェルにおける画像および特徴データは、フォーマット「ID.MDB」内の別個のデータベース内に記憶される。ここで、IDとは、特定の走査における固有の識別子のことである。しかしながら、本発明はこの実施形態に限定されるものではなく、他のタイプのデータベースや、これよりも多い或いは少ないデータベースを使用することもできる。 実験データの記憶 図4は、収集された実験データを記憶する方法78を示すフローチャートである。ステップ80では、コンテナ(例えば、図3の方法52におけるコンテナ)内の所望のサブコンテナから画像データおよび特徴データが収集される。ステップ82では、第1のデータベースが形成される。第1のデータベースは、他のデータベースに向かう複数のリンクを有しているが、コンテナから収集されたデータを全く有していない。コンテナから収集されたデータを見るために、第1のデータベースは、「パススルー」データベースとして、ディスプレイアプリケーションによって使用される。ステップ84では、第1のデータベースで第1のエントリーが形成され、第1のデータベースが第2のデータベースにリンクされる。第2のデータベースは、コンテナからデータを収集するために使用される構成データと、所望のサブコンテナから演算されたコンテナに関するサマリーデータと、画像および特徴データから演算されたコンテナ内の所望のサブコンテナに関するサマリーデータとを有している。情報は、第2のデータベース内の複数のデータベーステーブルに分類
される。ステップ86では、第1のデータベースで複数の第2のエントリーが形成され、第1のデータベースが複数の第3のデータベースにリンクされる。複数の第3のデータベースは、コンテナ内の所望のサブコンテナから収集された画像データおよび特徴データを有している。データは、第3のデータベース内の複数のデータベーステーブルに分類される。
【0058】
本発明の1つの典型的な好ましい実施形態において、ステップ80では、図3の方法52を使用して、ミクロプレート内の所望のウェルから、画像データおよび特徴データが収集される。しかしながら、本発明は、方法52を使用して実験データを収集することに限定されるものではなく、他の方法を使用することもできる。また、本発明はミクロプレート内のウェルから画像データおよび特徴データを収集することに限定されるものではなく、他のサブコンテナおよびコンテナを使用することもできる(例えば、複数のミクロゲルを有するバイオチップ)。
【0059】
ステップ82では、本発明の1つの典型的な好ましい実施形態において、アプリケーションデータベースは、他のデータベースへ向かう複数のリンクを有しているが、ミクロプレートから収集されたデータを全く有していない。ミクロプレートから収集されたデータを見るために、アプリケーションデータベースは、ディスプレイアプリケーションによって使用される。本発明の他の実施形態において、アプリケーションデータベースは、実際のデータを有していても良い。
【0060】
図5は、図4の方法78における典型的なデータベースシステム88を示すブロック図である。データベースシステム88は、アプリケーションデータベース90と、システムデータベース92と、複数の画像および特徴データベース94,96,98,100とを有している。図5には、1〜Nの番号が付された4つの画像および特徴データベースのみが示されている。しかしながら、本発明は、4つの画像および特徴データベースに限定されるものではなく、一般には、数百ないし数千の個々の画像および特徴データベースが実際に使用される。また、本発明は、図5に示されるデータベースあるいはデータベース名に限定されるものではなく、これよりも多い或いは少ないデータベースや他のデータベース名を使用することもできる。
【0061】
本発明の1つの典型的な好ましい実施形態において、アプリケーションデータベース90は、「APP.MDB.」と呼ばれている。しかしながら、他の名称はまた、データベースシステムにおけるアプリケーションデータベースに使用されることもでき、本発明は、記載される名称に限定されない。
【0062】
本発明の1つの典型的な好ましい実施形態において、収集された実験データを表示して解析するために使用されるディスプレイアプリケーションは、一度に2〜3千個のレコードにわたってアクセスしない。これは、ミクロプレートを横切るミクロプレートの詳細なデータ情報(例えば、画像または細胞特徴データベースのデータ)を評価する際に不要だからである。サマリーミクロプレート情報は、ミクロプレート内、ウェル内、ミクロプレート特徴およびウェル特徴サマリーテーブル内に記憶されて、ミクロプレートを横切って比較される。個々の細胞に関する詳細な情報は、1つのミクロプレートテストを評価する段階においてアクセスされる。これにより、ディスプレイアプリケーションは、アプリケーションンデータベース90内のパススルーテーブルを使用することができる。
【0063】
本発明の好ましい実施形態において、アプリケーションデータベース90は、実施のデータを全く有していないが、実際のデータを有するパススルーデータベースもしくは他のデータベースとして使用される。この技術分野で知られるように、パススルーデータベースは、他のデータベースに向かう複数のリンクを有しているが、一般に、パススルーデータベースは、実際のデータベースデータを全く有していない。そのような実施形態において、アプリケーションデータベース90は、システムデータベース92および複数の画像および特徴データベース94,96,98,100へ向かうリンクを使用して、アプリケーションデータベース90へのデータ要求をこれらのデータベースに通過させる。本発明の他の典型的な好ましい実施形態において、アプリケーションデータベース90は、収集された幾つかの実際のデータ、あるいは、実際のデータのサマリーを有していても良い。本発明の1つの典型的な好ましい実施形態において、アプリケーションデータベース90は、ワシントン州のレッドモンドにあるマイクロソフト(Microsoft)の、マイクロソフトアクセスデータベース、マイクロソフト構造化問い合わせ言語データベース、あるいは、マイクロソフトSQLサーバである。しかしながら、カリフォルニア州のマウンテンビューにあるオラクル(Oracle)のオラクルデータベースのような他のデータベースをアプリケーションデータベース90として使用することも可能であり、本発明はマイクロソフトデータベースに限定されるものではない。
【0064】
本発明の別の好ましい実施形態においては、第1のパススルーデータベースが全く使用されない。そのような実施形態において、第1のパススルーデータベースは、第1のパススルーデータベースを形成もしくは使用することなく第2および第3のデータベースまで/から動的に「直接に」問い合わせを行うコンピュータソフトウェアに取って代えられる。
【0065】
図6は、図5のアプリケーションデータベース90における典型的なデータベーステーブルのレイアウト102を示すブロック図である。図6のデータベーステーブルのレイアウト102は、アプリケーションデータベース90をシステムデータベース92にリンクさせる第1のパススルーデータベースエントリー104を有している。また、データベーステーブルのレイアウトは、アプリケーションデータベースを複数の画像および特徴データベース94,96,98,100にリンクさせる複数の第2のパススルーデータベースエントリー106,108,110,112を有している。しかしながら、これよりも多い或いは少ないタイプのデータベースエントリーをアプリケーションデータベースに使用することも可能であり、本発明はこれら2つのタイプのパススルーデータベースエントリーに限定されるものではない。本発明の他の実施形態において、アプリケーションデータベース92は、実験データ(図6には図示されていない)を有していても良い。
【0066】
図4のステップ84では、アプリケーションデータベース90で第1のエントリーが形成され、アプリケーションデータベース90がシステムデータベース92にリンクされる(例えば、図6のボックス104)。システムデータベース92は、ミクロプレートからデータを収集するために使用される構成データと、所望のウェルから演算されたミクロプレートに関するサマリーデータと、画像データおよび特徴データから演算されたミクロプレート内の選択されたウェブに関するサマリーデータとを有している。この情報は、システムデータベース92内の複数のテーブルに分類される。
【0067】
本発明の1つの典型的な好ましい実施形態において、システムデータベース92は、「SYSTEM.MDB」と称される。しかしながら、他の名を使用することも可能であり、本発明はこの名に限定されるものではない。また、システムデータベース92は、マイクロプレート構成およびミクロプレートサマリーデータを有する他のデータベースにリンクされていても良く、アプリケーションデータベースに関して前述したようにパススルー形態で使用される。本発明の他の典型的な好ましい実施形態において、システムデータベース92は、他のデータベースにリンクされておらず、その代わり、実際のミクロプレート構成およびミクロプレートサマリーデータを複数の内部テーブル内に有している。
【0068】
しかしながら、いずれにしても、本発明の1つの好ましい実施形態において、システムデータベース92の名前は、ミクロプレート同士間で変更されない。本発明の他の好ましい実施形態において、システムデータベース92の名前は、ミクロプレート同士間で変更される。ディスプレイアプリケーションは、ミクロプレート構成およびミクロプレートサマリーデータに関して割り当てられた名前(例えば、SYSTEM.MDB)を使用して、システムデータベース92を検索する。システムデータベース92内に記憶されたデータをリンクされたデータベース内に記憶して、システムデータベース92にアクセスするディスプレイアプリケーションを変更することなく、実際のミクロプレートコンテナ構成およびミクロプレートサマリーデータを移動させることができるようにしても良い。また、システムデータベース92にアクセスするディスプレイアプリケーションを修正することなく、実際のデータベースエンジンを、マイクロソフトSQLやオラクル(Oracle)のオラクルデータベース等のような他のデータベースタイプに変更することもできる。
【0069】
図7は、図5のシステムデータベース92における典型的なデータベーステーブル114を示すブロック図である。図7のデータベーステーブル114は、使用されるプレートのリストを含むプレートテーブル116を有している。プレートテーブル116は、プロトコルテーブル118と、形状係数テーブル122と、プレート特徴テーブル124と、ウェルテーブル126とにリンクされている。プロトコルテーブル118はプロトコル情報を有している。本発明の好ましい実施形態において、プロトコルは、実験データを収集するために使用される生物学的なマーカ細胞識別パラメータおよび他のパラメータを測定するために使用される解析機器、分析、色素のタイプを含む一連のシステムセッティングを指定する。分析については後述する。形状係数テーブル122は、ミクロプレートのレイアウトの幾何学的構成を含んでいる。例えば、標準的な96個のウェルを有するミクロプレートは、総計で96個となるように、1〜12のラベルが付された12個のウェルの縦列と、A〜Hのラベルが付された8個のウェルの横列とを有している。プレート特徴テーブル124は、ミクロプレートに対する特徴のマッピングを有している。形状係数テーブル122は、製造者テーブル120にリンクされている。製造者テーブル120は、ミクロプレート製造者リストおよび関連するミクロプレート情報を有している。ウェルテーブル126は、ウェルの詳細を含んでいる。本発明の好ましい実施形態において、ウェルは、解析のための細胞サンプルを収容するために使用されるミクロプレート内の小さな領域(例えば、円形領域)である。
【0070】
プロトコルテーブル118は、プロトコル分析パラメータテーブル128にリンクされている。本発明の好ましい実施形態において、「分析」は、画像を解析し且つ検査される生物学的工程に関連付けられた結果を戻すために使用される画像処理方法の特定の実施形態である。プロトコル分析パラメータテーブル128は、分析パラメータテーブル130にリンクされている。分析パラメータテーブル130は、使用される分析のためのパラメータを有している。
【0071】
また、プロトコルテーブル118は、プロトコルチャネルテーブル132にリンクされている。一般に、分析は、2つ以上のチャネルを有している。「チャネル」は、光フィルタおよびチャネル固有のパラメータの特定の構成であり、画像を取得するために使用される。一般的な分析においては、異なる細胞構造をラベル付けするために、異なる蛍光色素が使用される。蛍光色素は、異なる波長で光を発する。チャネルは、異なる色素の放出波長において写真画像を取得するために使用される。プロトコルチャネルテーブル132は、プロトコルチャネル拒絶パラメータテーブル134にリンクされている。プロトコルチャネル拒絶パラメータテーブル134は、所望のチャネルパラメータを満たさない画像を拒絶するために使用されるチャネルパラメータを有している。
【0072】
また、プロトコルテーブル118は、プロトコル走査領域テーブル136にリンクされている。プロトコル走査領域テーブル136は、ウェルを走査するために使用される方法を含んでいる。プロトコル走査領域テーブル136はシステムテーブル138にリンクされている。システムテーブル138は、実験データを収集するために使用される情報構成の情報および他の情報を含んでいる。
【0073】
ウェルテーブル126はウェル特徴テーブル140にリンクされている。ウェル特徴テーブル140は、ウェルに対する特徴のマッピングを有している。ウェル特徴テーブル140は特徴タイプテーブル142にリンクされている。特徴タイプテーブル142は、収集される特徴(例えば、細胞の特徴)のリストを有している。しかしながら、これよりも多い或いは少ないテーブルを使用することも可能であり、また、テーブル同士をリンクするためにこれよりも多い或いは少ないリンクを使用することも可能であり、本発明は、システムテーブル92に関して前述したテーブルに限定されるものではない。
【0074】
図4のステップ86では、アプリケーションデータベース92で複数の第2のエントリー(図6の例えばボックス106,108,110,112)が形成され、アプリケーションデータベース92が複数の画像および特徴データベース94,96,98,100にリンクされる。複数の画像および特徴データベースは、ミクロプレート内の所望のウェブから収集された画像データおよび特徴データを有している。データは、画像および特徴データベース内の複数のデータベーステーブルに分類される。
【0075】
本発明の1つの典型的な好ましい実施形態において、実際の画像および特徴データを有する画像および特徴データベース94,96,98,100の名前は、ミクロプレート同士間で動的に変更される。画像および特徴データは多くの個々のデータベースを含んでいるため、個々の画像および特徴データベースは、ミクロプレートのレコードが形成された時(例えば、システムデータベース92(図5)のプレートテーブル116(図7))に形成される。ミクロプレートのレコードは、プレートフィールド値を取って最後に「MDB」を加えることにより形成される名前を有する(例えば、「1234569803220001」のフィールド識別子を有するプレートテーブル116のレコードは、「1234569803220001.MDB」という名前で画像および特徴データベース内に記憶されるデータを有する)。しかしながら、また、画像および特徴データベースに関して他の名前を使用することもでき、本発明は、プレートテーブル116からのフィールド識別子を使用した名付けスキームに限定されるものではない。
【0076】
図8は、図5の画像および特徴データベース94,96,98,100における典型的なデータベーステーブル144を示すブロック図である。本発明の1つの好ましい実施形態において、ミクロプレートにおける画像および特徴データベースは、システムデータベース92において使用される製造者テーブル120およびシステムテーブル138を除くテーブル116〜142(図7)のコピーおよび画像および特徴データを保持するテーブルを有している。本発明の他の実施形態において、画像および特徴データベース94,96,98,100は、テーブル116〜142(図7)のコピーもしくはテーブル116〜142の全てを有している。本発明の他の実施形態において、画像および特徴データベース94,96,98,100は、システムデータベース92において使用されるテーブル116〜142(図7)のコピーを有していない。しかしながら、画像および特徴データベース内にシステムデータベース92のテーブルのコピーを有していれば、個々の画像および特徴データベースを、後に再検索して分析の助けとなるように、ファイル保管することができ且つ他のデータ記憶システムにコピーすることができる。
【0077】
画像および特徴データベース94,96,98,100のテーブル144は、ウェル内のフィールドに関する情報を記憶するためのウェルフィールドテーブル146を有している。ウェルフィールドテーブル146は、ウェルから収集された特徴のリスト情報を有するウェル特徴テーブル148にリンクされている。また、ウェルフィールドテーブル146は、ウェルから収集された画像リストを有する特徴画像テーブル150と、細胞に関して収集される情報を有する細胞テーブル152とにリンクされている。細胞テーブル152は、細胞から収集される特徴リストを有する細胞特徴テーブル154にリンクされている。しかしながら、それよりも多い或いは少ない特徴テーブルを使用することも可能であり、また、それよりも多い或いは少ないリンクを使用してテーブル同士をリンクさせることも可能であり、本発明は、画像および特徴データベースにおいて前述したテーブルに限定されるものではない。
【0078】
実験データのスプーリング
前述したように、解析機器モジュール12,14,16は、サブコンテナおよびコンテナにおけるサマリーデータ、画像データ、特徴データを含む多量のデータを形成する。未加工の特徴データ値は、前述した複数のテーブル(例えば図8)を有するデータベースファイルとして記憶される。解析機器12,14,16や記憶クライアントコンピュータ18,20,22がファイル空間から流出することを防止するため、データベースファイルは、階層データ管理システムを使用して管理される。
【0079】
図9は、実験データを巻き取るための方法156を示すフローチャートである。ステップ158では、第2のデータベースが、解析機器から共有データベースへとコピーされる。第2のデータベースは、コンテナからデータを収集するために使用される構成データと、コンテナ内の1または複数のサブコンテナから演算されたコンテナに関するサマリーデータと、所望のサブコンテナから収集された画像データおよび特徴データから演算されたコンテナ内のサブコンテナに関するサマリーデータとを有している。第2のデータベース内のデータは、1または複数のデータベーステーブルに分類される。ステップ160では、複数の第3のデータベースが共有データベースファイルサーバにコピーされる。複数の第3のデータベースは、コンテナ内の所望のサブコンテナから収集された画像データおよび特徴データを有している。第3のデータベース内のデータは、1または複数のデータベーステーブルに分類される。ステップ162では、共有データベースの第2のデータベースおよび共有データベースファイルサーバの1または複数の第3のデータベースのための新たな記憶場所を示すために、第2のデータベースおよび1または複数の第3のデータベースの場所が解析機器の第1のデータベース内で更新される。第1のデータベースは、第2のデータベースおよび1または複数の第3のデータベースに向かう複数のリンクを有しているが、コンテナから収集されたデータを全く有していない。第1のデータベースは、コンテナから収集されたデータを見るために、ディスプレイアプリケーションによって使用される。
【0080】
本発明の他の好ましい実施形態において、方法156では、更に、第1のデータベースが、解析機器12,14,16から記憶クライアントコンピュータ18,20,22へとコピーされる。そのような実施形態によれば、記憶クライアントコンピュータ18,20,22のディスプレイアプリケーションは、クライアントコンピュータ18,20,22の局部記憶装置にコピーされた第1のデータベースを使用して、コンテナから収集されたデータを見ることができる。
【0081】
本発明の他の好ましい実施形態において、方法156では、更に、分析器12,14,16上における第1のデータベースの位置が、クライアントコンピュータ18,20,22によって示される。このような実施形態により、記憶クライアントコンピュータ18,20,22のディスプレイアプリケーションは、記憶クライアントコンピュータ18,20,22から離れた典型的なデータ記憶システム10'上の場所で、コンテナから収集されたデータを見ることができる。
【0082】
共有データベース24の第2のデータベースからのコンテナおよびサブコンテナと、共有データベースファイルサーバ28の複数の第3のデータベースからの画像および特徴データを検索することにより、収集されたデータを、記憶クライアントコンピュータ18,20,22のディスプレイアプリケーションから見ることができる。
【0083】
本発明の1つの典型的な好ましい実施形態において、ステップ158では、システムデータベース92(図5)が、解析機器12,14,16から共有データベース24へとコピーされる。前述したように、システムデータベース92は、ミクロプレートからデータを収集するために使用される構成と、ミクロプレート内の1または複数のウェルから演算されたミクロプレートに関するサマリーデータ(例えば、表3)と、所望のウェルから収集され画像データおよび特徴データ(例えば、表1)から演算されたミクロプレート内のウェルに関するサマリーデータ(例えば、表2)とを有している。システムデータベース92内のデータは、1または複数のデータベーステーブル(例えば図7)に分類される。
【0084】
ステップ160では、1または複数の画像および特徴データベース94,96,98,100が共有データベースファイルサーバ28にコピーされる。1または複数の画像および特徴データベース94,96,98,100は、ミクロプレート内の所望のウェルから収集された画像データおよび特徴データを有している。1または複数の画像および特徴データベース内のデータは、1または複数のデータベーステーブルに分類される(例えば、図8)。
【0085】
ステップ162では、記憶データベース24のシステムデータベース92および記憶アーカイブ28の1または複数の画像および特徴データベース94,96,98,100のための新たな記憶場所を示すために、システムデータベース92および1または複数の画像および特徴データベース94,96,98,100の場所が解析機器12,14,16のアプリケーションデータベース90(図6)内で更新される。
【0086】
本発明の1つの好ましい実施形態において、アプリケーションデータベース90は、パススルーデータベースであり、システムデータベース92および1または複数の画像および特徴データベース94,96,98,100に向かう複数のリンク(例えば、図6)を有しているが、ミクロプレートから収集されたデータを全く有していない。本発明の他の実施形態において、アプリケーションデータベース90は、ミクロプレートからのデータを有している。アプリケーションデータベース92は、マクロプレートから収集されたデータを見るために、ディスプレイアプリケーションによって使用される。しかしながら、本発明はこの実施形態に限定されるものではなく、他のコンテナ、サブコンテナ(例えば、複数のミクロゲルを有するバイオチップ)、データベースを使用することもできる。
【0087】
実験データの階層的管理
図10は、実験データの階層的管理を行うための方法164を示すフローチャートである。ステップ166では、記憶移動手段を用いて、所定の階層記憶マネージャが初期化される。ステップ168において、階層記憶マネージャは、データベース内のデータベースファイルに所定の記憶移動手段を適用する。ステップ170では、データベースの任意のデータベースファイルが所定の記憶移動手段に適合しているか否かを決定するためのテストが行われる。データベースの任意のデータベースファイルが所定の記憶移動手段に適合している場合には、ステップ172において、データベースファイルが、データベースから階層記憶管理システム内の層へとコピーされる。ステップ174では、データベース内のデータベースファイルがプレイスホルダファイルに取って代えられる。プレイスホルダファイルは、階層記憶管理システム内の層にコピーされる実際のデータベースファイルに向かう複数のリンクを有している。データベースのデータベースファイルが所定の記憶移動手段に適合していない場合には、ステップ176において、データベースファイルは、データベースから階層記憶管理システム内の層へとコピーされない。
【0088】
本発明の1つの典型的な好ましい実施形態において、所定の記憶移動手段は、表4に示される1または複数の規則を有している。しかしながら、それよりも多い或いは少ない記憶移動手段の規則を使用することも可能であり、本発明は、表4に示される記憶移動手段の規則に限定されるものではない。
【0089】
【表4】
方法164は、データ記憶システム10'のほぼ無限量の「仮想」ディスクスペースにオンラインアクセスすることができる方法を与えるHSMステップを有している。仮想ディスクスペースには、多層の階層記憶管理システムが設けられている。仮想ディスクスペースは、任意のデータベースのレイアウトを変更することなく設けられ、ユーザが視認できない。
【0090】
本発明の1つの典型的な好ましい実施形態において、方法164のHSMステップは、ディスクアーカイブ32と光学ジュークボックス34とテープドライブ36とを有する3層の記憶階層を実行するアーカイブ法を提供する。しかしながら、それよりも多い或いは少ない記憶層を使用することもでき、本発明は、3層記憶のHSM技術に限定されるものではない。記憶階層においては、任意のデータベースのレイアウトや階層記憶マネージャの機能性を変更することなく、必要に応じて、別個の記憶層が付加される。階層記憶マネージャは、修正することなく、N層の記憶階層中の層にデータベースフィルタをコピーすることができる。
【0091】
また、光ディスクやテープといった記憶媒体がデータで満たされた際には、光学ジュークボックス34から書き換え可能な光ディスクを周期的に移動させたり、テープドライブ36からテープを周期的に移動させることにより、ほぼ無限量の「仮想」ディスクスペースに、3層の階層記憶管理システムを設けることができる。書き換え可能な光ディスクやテープは、その後のアクセスのために、データライブラリ内に記憶される。本発明の他の好ましい実施形態において、データライブラリは、コンピュータネットワーク40から直接にアクセス可能である。
【0092】
本発明の好ましい実施形態において、方法164は、少なくとも2つのデータベースファイル保管をサポートする。しかしながら、それよりも多い或いは少ないデータファイル保管モードを使用することも可能であり、本発明はこの2つのモードに限定されるものではない。
【0093】
第1のモードにおいて、記憶サーバ26は、個々の解析機器12,141,6上にデータベースファイルを保持する。この場合、データベースファイルは予め形成されている。記憶サーバ26は、方法164を使用して、解析機器12,14,16のディスクの空き領域を自動的に管理し、3段記憶管理システム内の層にファイルを移動させる。エンドユーザに対しては、ファイルは、それらが初めに記憶されたと同じディレクトリ内にあるように見える。しかしながら、実際には、ディスクアーカイブ32、光学ジュークボックス34,あるいは、デジタルリニアテープ(DLT)ライブラリ上にファイルを記憶しても良い。
【0094】
第2のモードにおいて、記憶サーバ26は、データベースファイルを、解析機器12,14,16から、共有データベース24および共有データベースファイルサーバ30へと巻き取る。次に、記憶サーバ26は、方法164を使用して、共有データベースファイルサーバ30のデータベースファイルを管理する。また、第2のモードにおいて、ファイルは、ディスクアーカイブ32、光学ジュークボックス34,あるいは、DLTライブラリ上に記憶されても良い。
【0095】
実験データプレゼンテーション
前述したように、解析機器12,14,16は多量の実験データを形成することができる。役に立つように、実験データは、科学者や解析技術者に視覚的に示されなければならない。
【0096】
図11は、実験データを示すための方法178を示すフローチャートである。ステップ180では、コンピュータのディスプレイアプリケーションからの第1のデータベースを使用して、1または複数のコンテナを有するリストが表示される。コンテナは複数のサブコンテナを有している。画像データおよび特徴データは、1または複数のコンテナから収集された。第1のデータベースは、実験データを有する他のデータベースに向かうリンクを備えたパススルーデータベースである。ステップ182では、第1のコンテナに関し、第1の選択入力が、ディスプレイアプリケーション上でリストから受けられる。ステップ184では、第1のコンテナに関し、第2のデータベースが、離れた第1の記憶場所から得られる。離れた第1の記憶場所は、ディスプレイアプリケーションを実行するコンピュータから離れている。第2のデータベースは、第1のコンテナからデータを収集するために使用される構成データと、第1のコンテナ内のサブコンテナから演算された第1のコンテナに関するサマリーデータと、所望のサブコンテナから収集された画像データおよび特徴データから演算された第1のコンテナ内の所望のサブコンテナに関するサマリーデータとを有している。ステップ186では、第1のコンテナ内の1または複数のサブコンテナに関し、第2の選択入力が、ディスプレイアプリケーション上で受けられる。ステップ188では、複数の第3のデータベースが、離れた第2の記憶場所から得られる。複数の第3のデータベースは、第1のコンテナ内の1または複数のサブコンテナから収集された画像データおよび特徴データを有している。ステップ190では、第2のデータベースからのコンテナデータおよびサブコンテナデータと、1または複数のサブコンテナから収集された複数の第3のデータベースからの画像データおよび特徴データとを有するディスプレイアプリケーションから、グラフィックディスプレイが形成される。グラフィックディスプレイ上に表示されたデータは、離れた第1の記憶場所や第2の記憶場所ではなく、コンピュータ上の局部記憶装置から得られたように見える。
【0097】
本発明の1つの典型的な好ましい実施形態において、方法178は、複数のウェルを有するミクロプレートから収集された実験データを表示するために使用される。しかしながら、本発明は、この実施形態に限定されるものではなく、複数のウェルを有するミクロプレート以外に、他のコンテナやサブコンテナ(例えば、複数のミクロゲルを有するバイオチップ)のために使用することができる。
【0098】
そのような典型的な実施形態において、ステップ180では、複数のミクロプレートを含むリストが、コンピュータのディスプレイアプリケーションによって表示される。ミクロプレートは複数のウェルを有している。細胞の画像データおよび細胞の特徴データは、複数のミクロプレートから収集される。ディスプレイアプリケーションは、実験データを有する他のデータベースの場所を見つけるために、アプリケーションデータベース90を使用する。
【0099】
本発明の1つの好ましい典型的な実施形態において、アプリケーションデータベース90は、ディスプレイアプリケーションを有するコンピュータから離れた場所で、典型的なデータ記憶システム10'に配置される。アプリケーションデータベース90を、典型的なデータ記憶システム10'上の離れた場所からコピーすることなく、アプリケーションデータベース90は、ディスプレイアプリケーションを有するコンピュータから使用される。
【0100】
本発明の別の典型的な好ましい実施形態において、アプリケーションデータベース90は、典型的なデータ記憶システム10'上の場所から、ディスプレイアプリケーションを有するコンピュータの局部記憶装置へとコピーされる。そのような実施形態において、アプリケーションデータベース90は、ディスプレイアプリケーションを有するコンピュータにコピーされて、そのコンピュータ上に存在する。
【0101】
ステップ182では、第1のミクロプレートに関し、第1の選択入力が、ディスプレイアプリケーション上でリストから受けられる。ステップ184では、第1のミクロプレートに関し、システムデータベース92が、離れた第1の記憶場所から得られる。離れた第1の記憶場所は、ディスプレイアプリケーションを実行するコンピュータから離れている。システムデータベース92は、第1のミクロプレートからデータを収集するために使用される構成データと、第1のミクロプレート内のウェルから演算された第1のミクロプレートに関するサマリーデータと、所望のウェルから収集された画像データおよび特徴データから演算された第1のミクロプレート内の所望のウェルに関するサマリーデータとを有している。
【0102】
ステップ186では、第1のミクロプレート内の1または複数のウェルに関し、第2の選択入力が、ディスプレイアプリケーション上で受けられる。ステップ188では、複数の画像および特徴データベース94,96,98,100が、離れた第2の記憶場所から得られる。複数の画像および特徴データベース94,96,98,100は、第1のミクロプレート内の1または複数のウェルから収集された画像データおよび特徴データを有している。ステップ190では、システムデータベース92からのミクロプレートおよびウェルのサマリーデータと、1または複数のウェルから収集された複数の画像および特徴データベース94,96,98,100からの画像データおよび特徴データとを有するディスプレイアプリケーションから、グラフィックディスプレイが形成される。グラフィックディスプレイ上に表示されたデータは、離れた第1の記憶場所や第2の記憶場所ではなく、コンピュータ上の局部記憶装置から得られたように見える。
【0103】
図12は、ディスプレイアプリケーションからの実験データを視覚的に表示するための典型的なスクリーンディスプレイ192を示すブロック図である。スクリーンディスプレイ192は、複数のサブコンテナの表示194をコンテナ196内に有している。コンテナ196は384個のサブコンテナ(数字1〜24×文字A〜P、すなわち、24×16=384)を有している。また、スクリーンディスプレイ192は、コンテナサマリーデータ198と、サブコンテナサマリーデータ200と、画像データ202と、特徴データ204とを有している。スクリーンディスプレイ192は、ユーザの好みに応じて、グラフィックフォーマットおよびテキストフォーマットの両方でデータを表示することができる。ユーザは、ディスプレイアプリケーションによって形成されたメニュー(図12には図示されていない)から自分の好みの表示を選択することができる。スクリーンディスプレイ192は、コンテナ196内の黒く塗りつぶされたサブコンテナ206によって示されるサブコンテナに関する実験データA−3を示す。コンテナから収集された実験データは、解析のため、複数の離れた場所から、複数のデータベースに向かう複数のリンクを有するパススルーデータベースを備えたスクリーンディスプレイ192と方法178とを使用して、科学者や実験技術者に対して視覚的に示される。
【0104】
本発明の1つの典型的な好ましい実施形態においては、ここに述べられている方法およびシステムにアクセスしてこれらを使用するために、記憶アプリケーションプログラミングインターフェース(API)が設けられる。この技術分野において知られるように、APIは、所望のタスクを行う一組の機能にアクセスするためにアプリケーションプログラムによって使用されるインターフェースルーチンのセットである。
【0105】
本発明の1つの特定の好ましい実施形態において、記憶APIは、マイクロソフト(Microsoft)のウインドウズ95/98/NT/2000オペレーティングシステムを用いて使用されるダイナミックリンクライブラリ(DLL)内に記憶される。DLLは「mvPlateData.DLL」と称される。しかしながら、本発明はWindows(登録商標)のDLL内にAPIを記憶することやDLLの先の名称を使用することに限定されるものではなく、他の方法や名称を使用してAPIを記憶、使用することもできる。この技術分野において知られているように、DLLは、アプリケーションによって必要な場合にだけ、実行可能なルーチンを記憶してロードすることができるライブラリである。DLL内の記憶APIは、ウインドウズの「REGSVR32.EXE」アプリケーションを用いて登録され、他のアプリケーションが使用できるようにされる。記憶APIは、プレート、ウェル画像、細胞特徴情報に対するインターフェースによるアクセスを提供するとともに、収集される所望のウェル特徴情報を入力し易くする。
【0106】
ここに述べられたこれらの方法およびシステムによれば、高スループットのデータ収集/解析システムからの実験データを効率的に収集して、記憶し、管理して、表示することができる。この方法およびシステムは、複数のウェルすなわち実験的な化合物が細胞の集合体に適用される複数のミクロゲルを含むバイオチップを有するミクロプレートから収集された細胞画像データおよび細胞特徴データを記憶管理して表示するために使用できるが、これに限定されるものではない。バイオチップが使用される場合には、ここに述べられたミクロプレートに対する任意の言及をバイオチップに取って代えることができるとともに、ミクロプレート内のウェルに対する言及をバイオチップ上のミクロゲルに取って代えることができ、前述した方法およびシステムとともに使用することができる。
【0107】
この方法およびシステムは、容易に管理でき且つ細胞データを解析、操作して保管することできる柔軟で拡張可能な細胞データの倉庫を提供することができる。また、この方法およびシステムは、細胞の集合体に適用された新たな実験化合物の識別、選択、妥当性確認、スクリーニングを向上させることができる。また、この方法およびシステムは、細胞データに関する観察に使用されるバイオインフォマティクス技術を提供するために使用できる。
【0108】
言うまでもなく、ここに述べられたプログラム、工程、方法、システムは、任意の特定のタイプのコンピュータやネットワークシステム(ハードウェアやソフトウェア)に関するものではなく、また、これらに限定されるものではない。ここに述べられた教示内容とともに様々なタイプの汎用あるいは特定のコンピュータシステムを使用することができ、あるいは、ここに述べられた教示内容にしたがって、様々なタイプの汎用あるいは特定のコンピュータシステムの動作を行うことができる。
【0109】
本発明の原理を適用することができる多種多様な実施形態を考慮すれば分かるように、先に示された実施形態は、単なる一例であって、本発明の範囲を制限するものと解釈してはならない。例えば、フローチャートのステップは、先に述べられたものと異なる配列で行われても良く、また、それよりも多い或いは少ない要素がブロック図内で使用されても良い。好ましい実施形態の様々な要素がソフトウェア内で実行されるように説明してきたが、他の実施形態においては、ハードウェアやファームウェアにおいて選択的に実行されても良い。 特許請求は、その作用に述べられていない場合には、記載されている順番や要素に限定して解釈されるべきではない。したがって、以下の特許請求の範囲や思想の範囲内にある全ての実施形態およびこれらと等価なものは、本発明として請求される。
【技術分野】
【0001】
本発明は、実験データを収集して記憶することに関する。具体的には、この本発明は、自動多機能高スループット実験データ収集システムからの実験データを効率良く収集して記憶するための方法およびシステムに関する。
【背景技術】
【0002】
この出願は、1998年11月13日に出願された米国仮出願第60/108,291号、1998年12月1日に出願された米国仮出願第60/110,643号、1999年6月21日に出願された米国仮出願第60/140,240号、1999年7月6日に出願された米国仮出願第60/142,375号、1999年7月6日に出願された米国仮出願第60/142,646号に基づく優先権を主張している。
【0003】
歴史的に、新薬の発見および開発は、多額の費用と長い時間を要する非効率的な工程である。1つの薬物を市場に出すためには、約8〜12年の歳月を要し、また、約3億5千万ドル〜5億ドルの費用がかかるため、薬剤研究開発市場は、薬物の発見工程を簡素化できる新たな技術を必要としている。薬剤研究開発市場における会社は、新薬を開発するための研究開発サイクルの短縮を図るため、すさまじい圧力下に晒されている。一方、同時に、新規な薬物の発見スクリーニング計測技術が開発されており、莫大な量の実験データが得られている。
【0004】
生物製剤のための自動スクリーニングシステムの革新および他の研究によって、莫大な量のデータを産み出すことができる。これらのシステムによって多量の機能豊富なデータが形成され、データからの情報を有効に管理して使用するために、非常にやりがいのある問題が生じた。この技術分野において知られるように、「機能豊富」なデータは、対象物(例えば、細胞)の1または複数の個々の特徴が収集され得るデータを有している。スクリーニング計測を産み出す多量のデータからのデータの可能性(潜在能力)を十分に活用するためには、情報科学的且つ情報生物学的な道具が必要である。
【0005】
新薬化合物の識別、選択、妥当性確認、スクリーニングは、しばしば、デオキシリボ核酸(DNA)、リボ核酸(RNA)、あるいは他のヌクレオチドの配列を使用したヌクレオチドレベルで行われる。「遺伝子」はDNAの領域であり、「タンパク質」は遺伝子の生成物である。一般に、タンパク質分子の存在および濃度は、所定の状態で遺伝子が「発現されている」か「抑制されている」かを決定する助けとなる。天然および人工の化合物に対する遺伝子の応答は、一般に、既存の薬物を改良して新薬を開発するために使用される。しかしながら、ヌクレオチドレベルではなく、細胞レベルで新たな化合物の作用を決定することが適切な場合もある。
【0006】
細胞は、生命の基本単位であり、DNA、RNA、タンパク質、代謝産物、イオン、他の細胞化合物からの情報を統合している。ヌクレオチドレベルで期待できると思われる新たな化合物は、細胞レベルで有毒な場合がある。イオン濃度、膜電位、酵素活性、遺伝子発現を決定するとともに、代謝産物、タンパク質、脂質、糖質(炭水化物)、および他の細胞化合物の存在を決定するために、蛍光を基本とした試薬を細胞に適用することができる。
【0007】
一般に使用される細胞スクリーニング法には2つのタイプがある。すなわち、(1)固定細胞スクリーニング、および、(2)生細胞スクリーニングである。固定細胞スクリーニングにおいては、検査される実験化合物を用いて、当初生きている細胞が処理される。所望の化合物を適用した後は、細胞の環境制御を行わない。そして、細胞は、スクリーニング中に死んでしまうかもしれない。生細胞スクリーニングは、所望の化合物を適用した後、細胞の環境制御(例えば、温度、湿度、ガス等)が必要であり、スクリーニング中において、細胞は、活動状態に維持される。固定細胞分析によれば、空間的な測定結果を得ることができできるが、時間的には測定結果を1点でしか得られない。生細胞分析によれば、空間的および時間的な両方で、測定結果を得ることができる。
【0008】
細胞内に存在する化学的および分子的な情報の空間的および時間的な頻度は、細胞集合体から機能豊富な細胞情報を抽出することを可能にする。例えば、複数の分子的および生化学的な相互作用、細胞動態、サブ細胞の分布の変化、細胞形態の変化、混合集合体における個々の細胞の特殊型の変化、サブ細胞の分子活性の変化、細胞の情報伝達の変化、および、他のタイプの細胞情報を得ることができる。
【0009】
蛍光基部を有する試薬を使用した、生化学的および分子的なタイプの細胞ベースの分析は、急速に広まっている。細胞ベースの分析の増大するリストから得られる別個の情報を自動的に抽出することが必要であることから、多機能細胞分析スクリーニングのためのオートメーションプラットフォームの開発が可能となった。例えば、ペンシルバニア州のピッツバーグにあるセロミクス社(Cellomics,Inc.)のアレースキャンシステム(ArrayScan System)は、そのような多機能細胞スクリーニングシステムの1つである。カリフォルニア州のサニーベールにあるモレキュラー・デバイス社(Molecular Devices,Inc.)のFLIPR、カリフォルニア州のフォスターシティーにあるPEバイオシステムズ(PE Biosystems)のFMAT、現在、メリーランド州のゲーサーズバーグにあるパーキンエルマー・ライフサイセンス(Perkin-Elmer Life Sciences)の子会社であるEG&Gウォーレス(EG&G Wallac)のViewLux等のような細胞を基本とするシステムは、多量のデータおよび写真画像を形成し、効率的なデータ管理の問題を解決できる。一般に、写真画像はデジタルカメラを使用して収集される。後述するように、1つの写真画像は、512キロバイト(KB)以上の記憶スペースを占める場合がある。多量の写真画像を収集して記憶すると、高スループットのシステムを使用した場合に生じるデータの問題が付加される。蛍光ベースのシステムの詳細な情報に関しては、1999年5月/6月に発刊されたModern Drug Discovery第2(3)刊の61頁〜71頁にあるRandy Wedinによる「Bright ideas for high-throughput screening-One-step Fluorescence HTS assays are getting faster,cheaper,smaller,and more sensitive」を参照のこと。 この技術分野で知られているそのような自動多機能細胞スクリーニングシステムおよび他のシステムは、一般に、ミクロプレート走査ハードウェアと、細胞の蛍光励起と、蛍光専用発光光学系と、カメラを有する写真顕微鏡と、データ収集と、データ記憶およびデータ表示能力とを含んでいる。多機能細胞スクリーニングの更なる情報に関しては、1997年冬に発刊されたISSN(国際規格一連番号)1087-0571の雑誌、Biomolecular Screening第2刊第4号の249頁〜259頁にあるKenneth A.Guilianoらによる「High content fluorescence-based screening」、1999年4月に発刊されたISSN1087-0571の雑誌、Biomolecular Screening第4刊第2号の75頁〜68頁にあるBruce R.Conwayらによる「PTH receptor internalization」、1998年3月に発刊されたISSN0167-7799のTrends in Biotechnology(TIBTECH)第16刊第3号の99頁〜146頁にあるKenneth A.GuilianoおよびD.Lansing Taylorによる「Fluorescect-protein biosensors:new tools for drug discovery」を参照すること。これらの全ては、参照することによって本願に組み込まれる。
【0010】
自動多機能細胞スクリーニングシステムは、一般に、複数のウェルを有するミクロプレートを自動的に走査して、所定の空間分解能で、1または複数の時間に、細胞の多色蛍光データを取得する。自動多機能細胞スクリーンシステムは、一般に、複数の蛍光のチャネルをサポートして、異なる波長で多色蛍光データを収集するとともに、細胞のサイズや形状といった特徴および細胞内の細胞小器官のサブ細胞の測定値を有する細胞特徴情報を個々の細胞毎に収集することができる。
【0011】
高スループットスクリーニングシステムによってデータを収集すると、非常に多くのデータが形成され、多くのバイオインフォマティクスな問題が与えられる。この技術分野で知られているように、「バイオインフォマティクス」技術は、細胞情報を含む生物学的情報の収集、処理、記憶、検索、解析に関連する問題を扱うために使用される。バイオインフォマティクスは、情報を体系的に開発して適用する技術として、また、生物学的工程に関する観察するために実験、モデリング、データベース検索、計測によって得られるデータを収集、解析、表示するためのデータ処理技術として定義付けられる。データを効率良く管理するために必要なものは、多機能細胞スクリーニングシステムや細胞を基本とする配列に限らない。高スループットスクリーニング(HTS)分析を実行する任意の器具もまた多量のデータを形成すると言える。例えば、DNA配列、バイオチップ、顕微鏡法、ミクロアレー、ゲル分析のような他のデータ収集技術の使用が増えるにつれて、写真画像データを含むデータの収集量も急激に増大している。この技術分野で知られるように、「バイオチップ」は、数百もしくは数千の吸収性ミクロゲルが表面に固定された層である。単一のバイオチップは、10,000個以上のミクロゲルを有しているかもしれない。分析テストを行う場合には、バイオチップ上の各ミクロゲルは、マイクロ試験管あるいはミクロプレート内のウェルと同様である。バイオチップは、知られた生物学的サンプルおよび知られていない生物学的サンプル(例えば、ヌクレオチド)を自動高スループットスクリーニングシステム内で解析するための媒体を提供する。
【0012】
多種多様のデータ収集技術を使用することができるが、細胞を基本とする高スループットスクリーニングシステムは、一例として、高スループットスクリーニングシステムの略全てに生じ得る幾つかの対応するデータ管理問題を明らかにするために使用される。機能豊富な細胞データの収集に関する1つの問題は、多機能スクリーニングのために使用されるミクロプレートが96〜1536個のウェルを有しているという点である。この技術分野で知られているように、「ミクロプレート」は、解析のための複数のサンプルを記憶する平坦で奥行きのない皿である。「ウェル」は、解析のための個々のサンプルを収容するために使用されるミクロプレート内の小さな領域である。各ウェルは、複数のフィールドに分割されても良い。「フィールド」は、写真顕微鏡における視野(すなわち、ズームレベル)を示すウェルのサブ領域である。各ウェルは、一般に、1〜16個のフィールドに分割される。一般に、各フィールドは、それについて撮られた1つの写真画像と6つの写真画像との間に有しており、異なる光フィルタを使用して、所望の細胞構成要素の異なる蛍光反応における光の異なる波長をとらえる。各フィールドにおいては、所定数の細胞が解析のために選択される。細胞の数は変化する(例えば、10〜100)。各細胞に関して、複数の細胞特徴が収集される。細胞特徴は、細胞のサイズや形状等の特徴を含んでいても良い。すなわち、一般に、1つのミクロプレート上のたった1つのウェルに関して、非常に多くの量のデータが収集される。
【0013】
データ量の観点から、1つのウェルに関して保存されるデータは、収集される細胞特徴の記録数および収集される画像数によって見積もることができる。収集される画像数は、一般に、(ウェルの数×フィールドの数×1フィールド当たりの画像)によって見積もることができる。現在の画像ファイルのサイズは、圧縮されていないデータで、約512キロバイト(KB)である。この技術分野で知られているように、1バイトは8ビットデータである。細胞特徴の記録数は、一般に、(ウェルの数×フィールドの数×1フィールド当たりの細胞×1細胞当たりの特徴)によって見積もることができる。ミクロプレート上の複数のウェルから収集されたデータは、一般に、コンピュータシステム上でフォーマットされて記憶される。収集されたデータは、ビジュアルプレゼンテーションアプリケーションに使用でき且つバイオインフォマティクス技術を使用してデータを採取、ファイル保管することができるフォーマット内で記憶される。
【0014】
例えば、典型的なシナリオとして、1ウェル当たり4つのフィールドを使用し、1フィールド当たり3つの画像を使用し、1画像当たり512キロバイトの画像サイズを使用して、96個のウェルを有する1つの低密度ミクロプレートを走査すると、約1152個の画像および576メガバイト(MB)の画像データ(すなわち、(96×4×3×512×(1KB=1024バイト)/(1MB=(1024バイト×1024バイト))=576MB)が形成される。この技術分野で知られているように、メガバイトは、220すなわち1,048,576バイトであり、一般に「100万バイト」として解釈されている。
【0015】
1フィールド当たり100個の細胞を選択して、細胞当たり10個の特徴が演算されるとした場合、そのような走査により、(96×4×100×10)=288,000個の細胞特徴の記録が形成され、そのデータサイズは、収集される細胞特徴の量に伴って変化する。これにより、96個のウェルを有するミクロプレートを1日に20時間、1週間に5日間走査すると、1日当たり約12,000MBのデータが形成され、1週間当たり約60,000MBのデータが形成される。
【0016】
現在の多機能細胞スクリーニングシステムに基づく高データ量のシナリオにおいては、1ウェル当たり16個のフィールドを使用し、1フィールド当たり4つの画像を使用し、1フィールド当たり100個の細胞を使用し、1細胞当たり10個の特徴を使用し、1画像当たり512キロバイトの画像サイズを使用して、384個のウェルを有する1つの高密度ミクロプレートを走査すると、約24,576個の画像すなわち12,288MBの画像データおよび約6,14,4000個の細胞特徴の記録が形成される。これにより、384個のウェルを有するミクロプレートを1日に24時間、1週間に7日間走査すると、1日当たり約14,400MBのデータが形成され、1週間当たり約100,800MBのデータが形成される。
【0017】
複数のミクロプレートを平行に走査することができ、また、複数の自動多機能細胞スクリーニングシステムを1日に24時間、1週間に7日間、1年に365日動作させることができるため、収集される実験データは、一般的なコンピュータネットワークの物理的な記憶限界を簡単に超えてしまう。例えば、一般的なコンピュータネットワークのディスク記憶は、約10ギガバイト(GB)〜約100GBの範囲である。この技術分野で知られているように、ギガバイトは、230すなわち1024MBバイトであり、一般に「10億バイト」として解釈されている。
【0018】
連続的なベーシスで使用される従来のコンピュータネットワークにおいて、多機能細胞スクリーニングを使用するために必要なデータ記憶(必要メモリ)は、現在のデータ記憶技術では非常に高価となるテラバイト(TB)の記憶スペースを簡単に超えてしまう。この技術分野で知られているように、テラバイトは、240であり、一般に「1兆バイト」として解釈されている。すなわち、自動多機能細胞スクリーニングシステムによってデータを収集して記憶する場合、従来のコンピュータネットワークの動作や記憶装置に悪影響を与えてしまう。
【0019】
多機能細胞スクリーニングシステムに関する他の問題は、たとえ多量の細胞データを収集した場合であっても、視覚的表示に使用できるのは、収集された全ての細胞特徴データおよび画像データのうちのほんの僅かな割合だけであるという点である。それにもかかわらず、新たな化合物に関して統計的に関連がある情報を集めるために、形成された全ての細胞データは、一般に、ローカルハードディスクに記憶されて、解析のために利用される。これもまた、ローカルハードディスクに悪影響を与えてしまう。
【0020】
更なる他の問題は、ミクロプレートを走査すると、1つのミクロプレートに関する情報が、1プレート当たり約1,000データベースレコードを簡単に超えてしまい、細胞特徴データおよび画像データが、1プレート当たり約6000000データベースレコードを簡単に超えてしまうという点である。パーソナルコンピュータ上で使用される従来の殆どのデータベースは、データのそのような多くの記録数を簡単に記憶して操作することができない。また、データに問い合わせたり表示したりするために、従来のパーソナルコンピュータ上でそのような大きなデータベースを開くには、比較的長い時間またなければならず、これは、ネットワークの性能に悪影響を与えるとともに、ユーザのフラストレーションすなわち不満を急速に高める。
【0021】
したがって、連続的なベーシスで多機能スクリーニングに使用できるデータ記憶システムを提供することが望ましい。そのようなデータ記憶システムは、容易に管理でき且つデータを解析、操作して保管(アーカイブ)することできる柔軟で拡張可能な細胞データの倉庫を提供しなければならない。
【発明の概要】
【0022】
本発明の好ましい実施形態によれば、機能豊富な実験データを収集して記憶することに伴う幾つかの問題が解決される。実験データを効率的に収集して記憶するための方法およびシステムが提供される。
【0023】
本発明の1つの態様は、実験データを収集するための方法を含んでいる。この方法は、コンテナ内の所望のサブコンテナから画像および特徴データを収集する。画像および特徴データは、複数の画像および特徴データベース内に記憶される。所望のサブコンテナおよびコンテナに関して演算されるサマリーデータは、サブコンテナデータベースおよびコンテナデータベース内に記憶される。
【0024】
本発明の別の態様は、コンピュータシステム上に実験データを記憶するための方法を含んでいる。この方法は、コンテナ内の所望のサブコンテナから画像データおよび特徴データを収集する。画像および特徴データは、複数のデータベーステーブルから成る複数の第3のデータベース内に記憶される。所望のサブコンテナおよびコンテナに関して演算されるサマリーデータは、複数のデータベーステーブルから成る第2のデータベース内に記憶される。パススルーデータベースである第1のデータベースが形成される。第1のデータベースは、第2のデータベースに向かう複数のリンクと複数の第3のデータベースに向かう複数のリンクとを有するパススルーデータベーステーブルを備えているが、コンテナから収集されるデータを全く有していない。
【0025】
本発明の別の態様は、実験データを、データを収集するデバイスから、複数の異なる離れた記憶場所へスプーリングするための方法を含んでいる。第2のデータベースおよび複数の第3のデータベースの新たな場所を示すために、第1のデータベースのパススルーデータベーステーブル内のリストが更新される。
【0026】
本発明の別の態様は、実験データを階層管理するための方法を含んでいる。所定の記憶移動手段が、データベース内のデータベースファイルに適用される。任意のデータベースファイルが所定の記憶移動手段に適合する場合には、データベースファイルが、多層の階層記憶管理システム内の層にコピーされる。最初のデータベースファイルは、階層記憶管理システムの層内の最初のデータベースファイルに向かうリンクを有するプレイスホルダファイルに取って代えられる。
【0027】
本発明の別の態様は、ディスプレイアプリケーションからの実験データをコンピュータ上に与えることを含んでいる。ディスプレイアプリケーションによって与えられたデータは、コンピュータから離れた複数の場所から得られる複数のデータベースから取得される。表示されたデータは、離れた場所からではなく、コンピュータの局部記憶装置のデータベースから得られるように見える。
【0028】
本発明の別の態様は、ほぼ無制限量のデータ記憶のための「仮想」ディスクスペースを、収集される実験データを記憶するための複数の局部の記憶場所および離れた記憶場所に与えるデータ記憶システムを含んでいる。
【0029】
これらの方法およびシステムによれば、高スループットのデータ収集システムからの実験データを効率的に収集して、記憶し、管理して、表示することができる。例えば、この方法およびシステムは、複数のウェルすなわち実験的な化合物が細胞の集合体に適用される複数のミクロゲルを含むバイオチップを有するミクロプレートから収集された細胞画像データおよび細胞特徴データを記憶管理して表示するために使用できるが、これに限定されるものではない。
【0030】
この方法およびシステムは、容易に管理でき且つデータを解析、操作して保管することできる柔軟で拡張可能な細胞データの倉庫を提供することができる。また、この方法およびシステムは、新たな実験化合物(例えば、薬物化合物)の識別、選択、妥当性確認、スクリーニングを向上させることができる。また、この方法およびシステムは、実験データに関する観察に使用される新たなバイオインフォマティクス技術を提供するために使用できる。
【0031】
本発明の好ましい実施形態の前述した特徴および他の特徴は、以下の詳細な説明から更に容易に認識することができる。以下、添付図面を参照しながら詳細に説明する。
【図面の簡単な説明】
【0032】
【図1A】典型的な実験データ記憶システムを示すブロック図である。
【図1B】典型的な実験データ記憶システムを示すブロック図である。
【図2】典型的なアレー走査モジュールアーキテクチャを示すブロック図である。
【図3A】実験データを収集するための方法を示すフローチャートである。
【図3B】実験データを収集するための方法を示すフローチャートである。
【図4】実験データを記憶するための方法を示すフローチャートである。
【図5】図4に記載の方法のための典型的なデータベースシステムを示すブロック図である。
【図6】図5に記載のアプリケーションデータベースの典型的なデータベーステーブルのレイアウトを示すブロック図である。
【図7】図5に記載のシステムデータベースの典型的なデータベーステーブルを示すブロック図である。
【図8】図5に記載の画像および特徴データベースの典型的なデータベーステーブルを示すブロック図である。
【図9】実験データをスプーリングするための方法を示すフローチャートである。
【図10】実験データを階層管理するための方法を示すフローチャートである。
【図11】実験データを与えるための方法を示すフローチャートである。
【図12】実験データをグラフィック表示するためのスクリーンディスプレイを示すブロック図である。
【発明を実施するための形態】
【0033】
典型的なデータ記憶システム
図1Aは、本発明の好ましい実施形態に係る典型的なデータ記憶システム10を示している。典型的なデータ記憶システム10は、クライアントコンピュータ18に接続された解析機器12と、共有データベース24と、コンピュータネットワーク40を備えたデータ記憶アーカイブ30とを有している。解析機器12は、ヌクレオチドや細胞のような機能豊富な実験データや他の実験データを収集可能な任意の走査器と、機能豊富な実験データを解析することができる任意の解析機器とを有している。この技術分野において知られているように、「機能豊富な」データは、対象物(例えば細胞)の1または複数の個々の特徴が収集され得るデータを有している。クライアントコンピュータ18は、科学者や実験技術者がデータ解析するために使用するディスプレイアプリケーションを有する任意の従来のコンピュータである。共有データベース24は、解析機器12からのデータを記憶するマルチユーザ及びマルチビューのリレーショナルデータベースである。データアーカイブ30は、ほぼ無限の量の「仮想」ディスクスペースを多層の階層的記憶管理システムに提供するために使用される。コンピュータネットワーク40は、高速の任意のローカルエリアネットワーク(LAN)(例えば、1秒間に100メガビット以上のデータ転送速度を有する)である。しかしながら、本発明は、この実施形態に限定されるものではなく、これよりも多い或いは少ない同種の構成要素を使用することも可能である。データ記憶システム10は、生物学的な実験装置および非生物学的な実験装置からの機能豊富な実験データを収集したり解析したりすることができる実質的に任意のシステムのために使用することができる。
【0034】
図1Bは、特定の構成要素を備えた本発明の好ましい一実施形態に係る典型的なデータ記憶システム10'を示している。しかしながら、本発明はこの1つの実施形態に限定されるものではなく、これよりも多い或いは少ない同種の構成要素を使用することも可能である。データ記憶システム10'は、機能豊富な実験データを収集したり解析したりするための1または複数の解析機器12,14,16と、1または複数のデータ記憶クライアントコンピュータ18,20,22と、共有データベース24と、データ記憶サーバ26と、共有データベースファイルサーバ28とを有している。データ記憶アーカイブ30は、任意のディスクアーカイブ32と、光学ジュークボックス34あるいはテープドライブ36とを有している。データ記憶アーカイブ30は、後述するように記憶されて収集される実験データに使用される任意のデータベースのデザインを変更することなく、ほぼ無限の量の「仮想」ディスクスペースを多層の階層的記憶管理システムに提供するために使用できる。データ記憶ア−カイブ30は、オプショナルデータアーカイブサーバ38によって管理することができる。しかしながら、これよりも多い或いは少ないデータ記憶要素を使用することも可能であり、本発明は、図1Bに示されるデータ記憶システム10'の構成要素に限定されるものではない。
【0035】
本発明の典型的な1つの好ましい実施形態において、データ記憶システム10'は、以下の特定の構成要素を有している。しかしながら、本発明はこれらの特定の構成要素に限定されるものではなく、他の類似もしくは等価な構成要素を使用することもできる。解析機器12,14,16は、ミクロプレート、DNA配列や他のチップ状あるいはバイオチップ状の配列からの細胞の実験データのような実験データを収集、および/または解析することができる多機能アレー走査システムを備えている。バイオチップは、イリノイ州にあるショウンバーグのモトローラ株式会社(Motorola Corporation)や、コネチカット州のメリデンにあるパッカード・バイオサイエンス社(Packard BioScience Co.)の関連会社であるパッカード・インスツルメント(Packard Instrument)、あるいは、テキサス州にあるウッドランドのジェノメトリックス社(Genometrix,Inc.)などによって提供される任意のものである。
【0036】
解析機器12,14,16は、ペンシルバニア州のピッツバーグにあるセロミクス社(Cellomics,Inc.)や、カリフォルニア州のサンディエゴにあるオーロラ・バイオサイエンシズ・コーポレーション(Aurora Biosciences Corporation)、カリフォルニア州のサニーベールのモレキュラー・デバイス社(Molecular Devices,Inc.)、カリフォルニア州のフォスターシティーのPEバイオシステム(PE Biosystems)、メリーランド州のゲーサーズバーグのパーキンエルマー・ライフサイセンス(Perkin-Elmer Life Sciences)などによって提供される任意のものを含んでいる。1または複数のデータ記憶クライアントコンピュータ18,20,22は、ローカルハードディスク、共有データベース24、データ記憶サーバ26やデータ記憶アーカイブ30にグラフィカルユーザインターフェース(GUI)を提供するディスプレイアプリケーションを有する従来のパーソナルコンピュータである。GUIディスプレイアプリケーションは、科学者や実験技術者が標準的な解析を行うために使用され、顧客および問い合わせビューイング能力をサポートする。また、ディスプレイアプリケーションGUIは、表計算ソフト、グラフィックスパッケージ、ワードプロセッサといった標準的なデスクトップツールに転送されたデータをサポートする。
【0037】
データ記憶クライアントコンピュータ18,20,22は、ネットワーク40にわたるOpen Data Base Connectivity(OBDC)接続を介して、記憶サーバ26に接続している。本発明の一実施形態において、コンピュータネットワーク40は、1秒間に100メガビット(Mbit)以上の速度のイーサネット(登録商標)、ローカルエリアネットワーク(LAN)である。しかしながら、他のタイプのLANを使用することも可能である(例えば、光ケーブルもしくは同軸ケーブルのネットワーク)。また、本発明はこれらの特定の構成要素に限定されるものではなく、他の類似の構成要素を使用することもできる。
【0038】
この技術分野で知られているように、OBDCは、コンピュータネットワーク上のデータベースにアクセスするためのアプリケーションにおける共通の言語を提供するインターフェースである。記憶サーバ26は、記憶を基本とする機能に加えて内在するデータベース管理システム(DBMS)を制御する。
【0039】
共有データベース24は、1または複数の解析機器12,14,16からのサマリーデータを記憶するマルチユーザ及びマルチビューのリレーショナルデータベースである。共有データベース24は、標準的なリレーショナルデータベースツールおよび構造を使用している。データ記憶アーカイブ30は、画像および特徴データベースファイルのライブラリである。データ記憶アーカイブ30は、階層的記憶管理(HSM)技術を使用して、解析機器12,14,16のディスクスペースを自動的に管理するとともに、多層の階層的記憶管理システムを提供する。HSM技術については後述する。
【0040】
本発明の好ましい実施形態に係るデータ記憶システム10,10'の構成要素のための動作環境は、1または複数の高速中央演算処理装置(CPU)およびメモリを有する処理システムを備えている。コンピュータプログラミングの当業者の慣行にしたがって、本発明の処理システムによって実行される動作や命令の作用および記号表示に関しては後述する。そのような作用や動作あるいは命令は、「コンピュータ実行」あるいは「CPU実行」と称される。
【0041】
作用や記号的に示された動作あるいは命令が、CPUによる電気的な信号の操作を含んでいることは言うまでもない。電気システムは、結果として生じる電気信号の変化や減少および記憶システム内の記憶場所にあるデータビットのメンテナンスを引き起こすことによってCPUの動作と他の信号処理とを再構成もしくは変更するデータビットを表わしている。データビットが維持される記憶場所は、データビットに対応する特定の電気的、磁気的、光学的、有機的特性を有する物理的な場所である。
【0042】
また、データビットは、磁気ディスク、光ディスク、有機メモリを含むコンピュータ読み取り可能媒体上や、CPUによって読むことができる他の任意の揮発性(ランダムアクセスメモリ(RAM))もしくは非揮発性(リードオンリーメモリ(ROM))の大容量記憶システムにおいて維持されていても良い。コンピュータ読み取り可能媒体は、処理システムにだけ存在する媒体、あるいは、その処理システムから離れた複数の相互に接続された処理システム間もしくは相互に接続された複数のローカルな処理システム間で分配される媒体であって、協働する或いは相互に接続されたコンピュータで読むことができる媒体を含んでいる。
【0043】
アレー走査モジュールアーキテクチャ
図2は、典型的なアレー走査モジュール42のアーキテクチャを示したブロック図である。アレー走査モジュール42は、例えば解析機器12,14,16(図1B)に関連付けられたモジュールであり、4つの機能群すなわち4つのモジュールに分割されたソフトウェア/ハードウェアを有している。しかしながら、それより多い或いは少ない機能モジュールを使用することも可能であり、本発明は4つの機能モジュールに限定されない。取得モジュール44は、ロボット顕微鏡およびデジタルカメラを制御して画像を取得するとともに、その画像をアッセイモジュール46に送る。アッセイモジュール46は、画像を読み取ってグラフィックオーバーレイを形成するとともに、画像収集特徴データを解釈して、画像から抽出された特徴データおよび新たな画像を取得モジュール44に戻す。取得モジュール44は、画像および解釈された特徴データをデータベース記憶モジュール48に送る。データベース記憶モジュール48は、画像および特徴情報を、画像ファイルおよびリレーショナルデータベースの記録と組み合せて保存する。記憶クライアントコンピュータ18,20,22は、データベース記憶モジュール48を使用して、プレゼンテーションモジュール50によるプレゼンテーションおよびデータ解析のための特徴データおよび画像にアクセスする。プレゼンテーションモジュール50は、前述したように、GUIを有するディスプレイアプリケーションを備えている。
【0044】
実験データの収集
図3Aおよび図3Bは、実験データを収集するための方法52を示すフローチャートである。図3Aのステップ54では、構成情報を使用して、複数のサブコンテナを有するコンテナが初期化される。ステップ56では、コンテナのために使用された構成情報がコンテナデータベース内に記憶される。ステップ58では、コンテナ内の所望のサブコンテナのための繰り返しステップ60,62,64,66,68,70および72にループが入力される。ステップ60では、コンテナ内の1つのサブコンテナが選択される。本発明の好ましい実施形態においては、コンテナ内の全てのサブコンテナが解析される。本発明の別の実施形態においては、コンテナ内の全てのサブコンテナが解析されない。そのような実施形態において、ユーザは、解析のために、コンテナ内のサブコンテナの所望のサブセットを選択することができる。ステップ62では、サブコンテナから画像データが収集される。ステップ64では、画像データが画像データベース内に記憶される。ステップ66では、特徴データが画像データから収集される。
【0045】
図3Bのステップ68では、特徴データが特徴データベース内に記憶される。本発明の一実施形態において、画像データベースおよび特徴データベースは、画像および特徴データを有する複数の表から成る1つのデータベースに組み合わされる。本発明の他の実施形態において、画像データベースおよび特徴データベースは、別個のデータベースとして維持される。
【0046】
ステップ70では、サブコンテナのサマリーデータが演算される。ステップ72では、サブコンテナのサマリーデータがサブコンテナデータベース内に記憶される。本発明の一実施形態において、サブコンテナデータベースおよびコンテナデータベースは、サブコンテナおよびコンテナサマリーデータを有する複数の表から成る1つのデータベースに組み合わされる。本発明の別の実施形態において、サブコンテナデータベースおよびコンテナデータベースは、別個のデータベースとして維持される。コンテナ内の所望のサブコンテナが解析されるまで、ステップ58(図3A)のループは続く。コンテナ内で所望のサブコンテナが処理された後、ステップ58のループは終了する。
【0047】
図3Bのステップ74では、サブコンテナデータベースからのサブコンテナサマリーデータを使用して、コンテナサマリーデータが演算される。ステップ76では、コンテナサマリーデータがコンテナデータベース内に記憶される。
【0048】
本発明の一般的な使用においては、ステップ66で、画像をベースとする任意の解析システムからの特徴を使用することができる。1または複数のオブジェクト(例えば細胞)を含むデジタル化された画像が与えられると、一般に、画像を解析する段階および特徴データを特徴の大きさとして抽出する段階の2つの段階が存在する。第1の段階は、一般に、「画像の細分化」もしくは「オブジェクトの分離」と呼ばれる。この段階では、所望のオブジェクトが残りの画像から分離される。第2の段階は、一般に、「特徴抽出」と呼ばれる。この段階では、オブジェクトの大きさが演算される。「特徴」は、一般に、1または複数の大きさの関数であり、オブジェクトの重要な特性を定量化するように演算される。一般的なオブジェクトの大きさは、サイズ、形状、強度、テクスチャ、位置等を含んでいる。
【0049】
各大きさにおいて、複数の特徴は、一般に、大きさを反映するために使用される。オブジェクトの「サイズ」は、その面積、周の長さ、境界線、鮮明度、長さ、幅等によって表わすことができる。オブジェクトの「形状」は、その矩形度(例えば、長さと幅のアスペクト比)、真円度(例えば、周の長さの平方を面積で割ったもの、境界ボックス等)、慣性モーメント、差異チェーンコード、フーリエ記述子等によって表わすことができる。オブジェクトの「強度」は、オブジェクト内のピクセルのグレーレベルの総計平均、最大、あるいは最小によって表わすことができる。オブジェクトの「テクスチャ」は、オブジェクト内でグレーレベルの変化の特性を定量化し、標準偏差、変動、歪み、尖度を含む統計的な特徴およびスペクトル構造特徴等によって表わすことができる。オブジェクトの「位置」は、所定のグリッド方式に関し、オブジェクトの質量中心、水平および垂直度等によって表わすことができる。デジタル画像特徴の大きさについての更なる情報に関しては、1996年にKenneth R.Castleman、Prentice-Hallによって書かれたISBN-0132114674の「Digital Image Processing」、1994年に、G.A.Baxes,Wileyによって書かれたISBN-0471009490の「デジタル画像処理:原理と応用(Digital Image Processing:Principle and Applications)」、1991年にWilliam K.Pratt,Wiley and Sonsによって書かれたISBN-0471857661の「デジタル画像処理(Digital Image Processing)」、または1991年にJohn C.Russによって書かれたCRC PressのISBN-0849325161である「画像処理ハンドブック(The Image Processing Handbook)-第2版」を参照すること。これらの内容の全ては、参照することによって本願に組み込まれる。 本発明の1つの典型的な好ましい実施形態において、方法52は、「ミクロプレート」のウェルから細胞の画像データおよび細胞の特徴データを収集するために使用される。本発明の別の好ましい実施形態において、方法52は、バイオチップ内のミクロゲルから細胞の画像データおよび細胞の特徴データを収集するために使用される。この技術分野で知られているように、「ミクロプレート」は、解析のための複数のサンプルを記憶し且つ一般に96〜1536個の個々のウェルを有する平坦で奥行きのない皿である。「ウェル」は、解析のための個々のサンプルを収容するために使用されるミクロプレート内の小さな領域である。各ウェルは、複数のフィールドに分割されても良い。「フィールド」は、写真顕微鏡における視野(すなわち、ズームレベル)を示すウェルのサブ領域である。一般に、各ウェルは、それについて撮られた1つの写真画像と6つの写真画像との間に有しており、異なる光フィルタを使用して、所望の細胞構成要素の異なる蛍光反応における光の異なる波長をとらえる。しかしながら、本発明はそのような実施形態に限定されるものではなく、他のコンテナ(例えば、DNAチップのような様々な生物学的チップ、ミクロアレー、複数のサブコンテナを有する他のコンテナ)やサブコンテナを使用して細胞以外から画像データおよび特徴データを収集することもできる。
【0050】
ミクロプレート内のウェルから細胞データを収集する実施形態において、ステップ54では、構成情報を使用して、複数のウェルを有するミクロプレートが初期化される。ステップ56では、ミクロプレートのために使用された構成情報がミクロプレートデータベース内に記憶される。ステップ58では、ミクロプレート内の所望のウェルに関してステップ60,62,64,66,68,70および72を繰り返すためにループが入力される。ステップ60では、ミクロプレート内の1つのウェルが選択される。ステップ62では、細胞の画像データがウェルから収集される。本発明の1つの好ましい実施形態において、細胞の画像データは、ロボット顕微鏡に取り付けられたデジタルカメラを用いて収集されたデジタル写真画像を含んでいる。しかしながら、他のタイプのカメラを使用することも可能であり、他のタイプの画像データを収集することもできる。ステップ64では、細胞の画像データが画像データベース内に記憶される。本発明の他の典型的な好ましい実施形態において、画像データベースは、バイナリフォーマット(例えば、タグ付き画像ファイルフォーマット(TIFF)、デバイスインディペンデントビットマップ(DIB)等)内に記憶された個々の画像ファイルの山である。個々の画像ファイルの山は、フォーマルデータベースフレームワークを含んでいてもいなくても良い。個々の画像ファイルは、他のデータベース(例えば、パススルーデータベース)からアクセス可能な特定のディレクトリ内に、個々の画像ファイルの山として存在していても良い。
【0051】
ステップ66では、細胞の特徴データは、細胞の画像データから収集される。本発明の1つの好ましい実施形態において、ステップ66は、表1に示される細胞の任意の特徴データを収集することを含んでいる。しかしながら、他の特徴データや他の細胞の特徴を収集することもでき、本発明は、表1に示される細胞の特徴データに限定されるものではない。実質的に、任意の特徴データを画像データから収集することができる。
【0052】
【表1】
図3Bのステップ68では、細胞の特徴データが細胞特徴データベース内に記憶される。本発明の一実施形態において、画像データベースおよび細胞特徴データベースは、細胞の画像および細胞の特徴データを有する複数の表から成る1つのデータベースに組み合わされる。本発明の他の実施形態において、画像データベース(すなわち、画像ファイル)および特徴データベースは、別個のデータベースとして維持される。
【0053】
図3Bのステップ70では、ウェルから収集された画像データおよび特徴データを使用して、ウェルのサマリーデータが演算される。本発明の1つの好ましい実施形態において、ステップ72で演算されたウェルのサマリーデータは、表2に示された任意のウェルのサマリーデータを演算することを含んでいる。しかしながら、本発明は表2に示されたウェルのサマリーデータに限定されるものではなく、他のサブコンテナおよび他のサブコンテナサマリーデータを演算することもできる。実質的に、所望のサブコンテナに関して任意のサブコンテナサマリーデータを演算することが可能である。表2において、「SPOT(スポット)」は、生物活性の尺度として蛍光反応強度のブロックを示している。
【0054】
【表2】
図3Bのステップ72では、ウェルのサマリーデータがウェルデータベース内に記憶される。本発明の一実施形態において、ウェルデータベースおよびミクロプレートデータベースは、ウェルおよびミクロプレートデータを有する複数の表から成る1つのデータベースに組み合わされる。本発明の別の実施形態において、ウェルデータベースおよびミクロプレートデータベースは、別個のデータベースとして維持される。ミクロプレート内の所望のサブウェルが解析されるまで、ステップ58(図3A)のループは続く。
【0055】
ミクロプレート内で所望のウェルが処理された後、ステップ58のループは終了する。図3Bのステップ74では、ミクロプレートデータベースからのウェルサマリーデータを使用して、サマリーデータが演算される。ステップ76では、ミクロプレートサマリーデータがウェルデータベース内に記憶される。
【0056】
本発明の1つの好ましい実施形態において、ステップ74で演算されたミクロプレートサマリーデータは、表3に示される任意のミクロプレートサマリーデータを演算することを含んでいる。しかしながら、本発明は表3に示されるミクロプレートサマリーデータに限定されるものではなく、他のコンテナおよび他のコンテナサマリーデータを演算することもできる。実質的に、任意のコンテナサマリーデータをコンテナに関して演算することができる。表3において、「MEAN」は、統計学的な平均を示しており、「STDEV」は、この技術分野で知られた統計学的な標準偏差を示しており、「SPOT(スポット)」は、生物活性の尺度として蛍光反応強度のブロックを示している。
【0057】
【表3】
本発明の1つの典型的な好ましい実施形態において、細胞分析(検定)は、表1〜表3から選択されたエントリーを使用して形成される。本発明の好ましい実施形態において、「細胞分析」は、画像を解析し且つ検査される生物学的工程に関連する結果を戻すために使用される画像処理方法の特別な実施形態である。特定の生物学的工程に向けられた細胞分析で使用される画像処理方法に関する更なる情報は、本願と同じ譲受人に譲渡され且これを参照することによって本願に組み込まれる係属中の出願09/031,217号および09/352,171を参照すること。 本発明の1つの典型的な好ましい実施形態において、ミクロプレートデータベースおよびウェルデータベースは、「SYSTEM.MDB」と呼ばれる複数の表からなる1つのデータベース内に記憶される。各ウェルにおける画像および特徴データは、フォーマット「ID.MDB」内の別個のデータベース内に記憶される。ここで、IDとは、特定の走査における固有の識別子のことである。しかしながら、本発明はこの実施形態に限定されるものではなく、他のタイプのデータベースや、これよりも多い或いは少ないデータベースを使用することもできる。 実験データの記憶 図4は、収集された実験データを記憶する方法78を示すフローチャートである。ステップ80では、コンテナ(例えば、図3の方法52におけるコンテナ)内の所望のサブコンテナから画像データおよび特徴データが収集される。ステップ82では、第1のデータベースが形成される。第1のデータベースは、他のデータベースに向かう複数のリンクを有しているが、コンテナから収集されたデータを全く有していない。コンテナから収集されたデータを見るために、第1のデータベースは、「パススルー」データベースとして、ディスプレイアプリケーションによって使用される。ステップ84では、第1のデータベースで第1のエントリーが形成され、第1のデータベースが第2のデータベースにリンクされる。第2のデータベースは、コンテナからデータを収集するために使用される構成データと、所望のサブコンテナから演算されたコンテナに関するサマリーデータと、画像および特徴データから演算されたコンテナ内の所望のサブコンテナに関するサマリーデータとを有している。情報は、第2のデータベース内の複数のデータベーステーブルに分類
される。ステップ86では、第1のデータベースで複数の第2のエントリーが形成され、第1のデータベースが複数の第3のデータベースにリンクされる。複数の第3のデータベースは、コンテナ内の所望のサブコンテナから収集された画像データおよび特徴データを有している。データは、第3のデータベース内の複数のデータベーステーブルに分類される。
【0058】
本発明の1つの典型的な好ましい実施形態において、ステップ80では、図3の方法52を使用して、ミクロプレート内の所望のウェルから、画像データおよび特徴データが収集される。しかしながら、本発明は、方法52を使用して実験データを収集することに限定されるものではなく、他の方法を使用することもできる。また、本発明はミクロプレート内のウェルから画像データおよび特徴データを収集することに限定されるものではなく、他のサブコンテナおよびコンテナを使用することもできる(例えば、複数のミクロゲルを有するバイオチップ)。
【0059】
ステップ82では、本発明の1つの典型的な好ましい実施形態において、アプリケーションデータベースは、他のデータベースへ向かう複数のリンクを有しているが、ミクロプレートから収集されたデータを全く有していない。ミクロプレートから収集されたデータを見るために、アプリケーションデータベースは、ディスプレイアプリケーションによって使用される。本発明の他の実施形態において、アプリケーションデータベースは、実際のデータを有していても良い。
【0060】
図5は、図4の方法78における典型的なデータベースシステム88を示すブロック図である。データベースシステム88は、アプリケーションデータベース90と、システムデータベース92と、複数の画像および特徴データベース94,96,98,100とを有している。図5には、1〜Nの番号が付された4つの画像および特徴データベースのみが示されている。しかしながら、本発明は、4つの画像および特徴データベースに限定されるものではなく、一般には、数百ないし数千の個々の画像および特徴データベースが実際に使用される。また、本発明は、図5に示されるデータベースあるいはデータベース名に限定されるものではなく、これよりも多い或いは少ないデータベースや他のデータベース名を使用することもできる。
【0061】
本発明の1つの典型的な好ましい実施形態において、アプリケーションデータベース90は、「APP.MDB.」と呼ばれている。しかしながら、他の名称はまた、データベースシステムにおけるアプリケーションデータベースに使用されることもでき、本発明は、記載される名称に限定されない。
【0062】
本発明の1つの典型的な好ましい実施形態において、収集された実験データを表示して解析するために使用されるディスプレイアプリケーションは、一度に2〜3千個のレコードにわたってアクセスしない。これは、ミクロプレートを横切るミクロプレートの詳細なデータ情報(例えば、画像または細胞特徴データベースのデータ)を評価する際に不要だからである。サマリーミクロプレート情報は、ミクロプレート内、ウェル内、ミクロプレート特徴およびウェル特徴サマリーテーブル内に記憶されて、ミクロプレートを横切って比較される。個々の細胞に関する詳細な情報は、1つのミクロプレートテストを評価する段階においてアクセスされる。これにより、ディスプレイアプリケーションは、アプリケーションンデータベース90内のパススルーテーブルを使用することができる。
【0063】
本発明の好ましい実施形態において、アプリケーションデータベース90は、実施のデータを全く有していないが、実際のデータを有するパススルーデータベースもしくは他のデータベースとして使用される。この技術分野で知られるように、パススルーデータベースは、他のデータベースに向かう複数のリンクを有しているが、一般に、パススルーデータベースは、実際のデータベースデータを全く有していない。そのような実施形態において、アプリケーションデータベース90は、システムデータベース92および複数の画像および特徴データベース94,96,98,100へ向かうリンクを使用して、アプリケーションデータベース90へのデータ要求をこれらのデータベースに通過させる。本発明の他の典型的な好ましい実施形態において、アプリケーションデータベース90は、収集された幾つかの実際のデータ、あるいは、実際のデータのサマリーを有していても良い。本発明の1つの典型的な好ましい実施形態において、アプリケーションデータベース90は、ワシントン州のレッドモンドにあるマイクロソフト(Microsoft)の、マイクロソフトアクセスデータベース、マイクロソフト構造化問い合わせ言語データベース、あるいは、マイクロソフトSQLサーバである。しかしながら、カリフォルニア州のマウンテンビューにあるオラクル(Oracle)のオラクルデータベースのような他のデータベースをアプリケーションデータベース90として使用することも可能であり、本発明はマイクロソフトデータベースに限定されるものではない。
【0064】
本発明の別の好ましい実施形態においては、第1のパススルーデータベースが全く使用されない。そのような実施形態において、第1のパススルーデータベースは、第1のパススルーデータベースを形成もしくは使用することなく第2および第3のデータベースまで/から動的に「直接に」問い合わせを行うコンピュータソフトウェアに取って代えられる。
【0065】
図6は、図5のアプリケーションデータベース90における典型的なデータベーステーブルのレイアウト102を示すブロック図である。図6のデータベーステーブルのレイアウト102は、アプリケーションデータベース90をシステムデータベース92にリンクさせる第1のパススルーデータベースエントリー104を有している。また、データベーステーブルのレイアウトは、アプリケーションデータベースを複数の画像および特徴データベース94,96,98,100にリンクさせる複数の第2のパススルーデータベースエントリー106,108,110,112を有している。しかしながら、これよりも多い或いは少ないタイプのデータベースエントリーをアプリケーションデータベースに使用することも可能であり、本発明はこれら2つのタイプのパススルーデータベースエントリーに限定されるものではない。本発明の他の実施形態において、アプリケーションデータベース92は、実験データ(図6には図示されていない)を有していても良い。
【0066】
図4のステップ84では、アプリケーションデータベース90で第1のエントリーが形成され、アプリケーションデータベース90がシステムデータベース92にリンクされる(例えば、図6のボックス104)。システムデータベース92は、ミクロプレートからデータを収集するために使用される構成データと、所望のウェルから演算されたミクロプレートに関するサマリーデータと、画像データおよび特徴データから演算されたミクロプレート内の選択されたウェブに関するサマリーデータとを有している。この情報は、システムデータベース92内の複数のテーブルに分類される。
【0067】
本発明の1つの典型的な好ましい実施形態において、システムデータベース92は、「SYSTEM.MDB」と称される。しかしながら、他の名を使用することも可能であり、本発明はこの名に限定されるものではない。また、システムデータベース92は、マイクロプレート構成およびミクロプレートサマリーデータを有する他のデータベースにリンクされていても良く、アプリケーションデータベースに関して前述したようにパススルー形態で使用される。本発明の他の典型的な好ましい実施形態において、システムデータベース92は、他のデータベースにリンクされておらず、その代わり、実際のミクロプレート構成およびミクロプレートサマリーデータを複数の内部テーブル内に有している。
【0068】
しかしながら、いずれにしても、本発明の1つの好ましい実施形態において、システムデータベース92の名前は、ミクロプレート同士間で変更されない。本発明の他の好ましい実施形態において、システムデータベース92の名前は、ミクロプレート同士間で変更される。ディスプレイアプリケーションは、ミクロプレート構成およびミクロプレートサマリーデータに関して割り当てられた名前(例えば、SYSTEM.MDB)を使用して、システムデータベース92を検索する。システムデータベース92内に記憶されたデータをリンクされたデータベース内に記憶して、システムデータベース92にアクセスするディスプレイアプリケーションを変更することなく、実際のミクロプレートコンテナ構成およびミクロプレートサマリーデータを移動させることができるようにしても良い。また、システムデータベース92にアクセスするディスプレイアプリケーションを修正することなく、実際のデータベースエンジンを、マイクロソフトSQLやオラクル(Oracle)のオラクルデータベース等のような他のデータベースタイプに変更することもできる。
【0069】
図7は、図5のシステムデータベース92における典型的なデータベーステーブル114を示すブロック図である。図7のデータベーステーブル114は、使用されるプレートのリストを含むプレートテーブル116を有している。プレートテーブル116は、プロトコルテーブル118と、形状係数テーブル122と、プレート特徴テーブル124と、ウェルテーブル126とにリンクされている。プロトコルテーブル118はプロトコル情報を有している。本発明の好ましい実施形態において、プロトコルは、実験データを収集するために使用される生物学的なマーカ細胞識別パラメータおよび他のパラメータを測定するために使用される解析機器、分析、色素のタイプを含む一連のシステムセッティングを指定する。分析については後述する。形状係数テーブル122は、ミクロプレートのレイアウトの幾何学的構成を含んでいる。例えば、標準的な96個のウェルを有するミクロプレートは、総計で96個となるように、1〜12のラベルが付された12個のウェルの縦列と、A〜Hのラベルが付された8個のウェルの横列とを有している。プレート特徴テーブル124は、ミクロプレートに対する特徴のマッピングを有している。形状係数テーブル122は、製造者テーブル120にリンクされている。製造者テーブル120は、ミクロプレート製造者リストおよび関連するミクロプレート情報を有している。ウェルテーブル126は、ウェルの詳細を含んでいる。本発明の好ましい実施形態において、ウェルは、解析のための細胞サンプルを収容するために使用されるミクロプレート内の小さな領域(例えば、円形領域)である。
【0070】
プロトコルテーブル118は、プロトコル分析パラメータテーブル128にリンクされている。本発明の好ましい実施形態において、「分析」は、画像を解析し且つ検査される生物学的工程に関連付けられた結果を戻すために使用される画像処理方法の特定の実施形態である。プロトコル分析パラメータテーブル128は、分析パラメータテーブル130にリンクされている。分析パラメータテーブル130は、使用される分析のためのパラメータを有している。
【0071】
また、プロトコルテーブル118は、プロトコルチャネルテーブル132にリンクされている。一般に、分析は、2つ以上のチャネルを有している。「チャネル」は、光フィルタおよびチャネル固有のパラメータの特定の構成であり、画像を取得するために使用される。一般的な分析においては、異なる細胞構造をラベル付けするために、異なる蛍光色素が使用される。蛍光色素は、異なる波長で光を発する。チャネルは、異なる色素の放出波長において写真画像を取得するために使用される。プロトコルチャネルテーブル132は、プロトコルチャネル拒絶パラメータテーブル134にリンクされている。プロトコルチャネル拒絶パラメータテーブル134は、所望のチャネルパラメータを満たさない画像を拒絶するために使用されるチャネルパラメータを有している。
【0072】
また、プロトコルテーブル118は、プロトコル走査領域テーブル136にリンクされている。プロトコル走査領域テーブル136は、ウェルを走査するために使用される方法を含んでいる。プロトコル走査領域テーブル136はシステムテーブル138にリンクされている。システムテーブル138は、実験データを収集するために使用される情報構成の情報および他の情報を含んでいる。
【0073】
ウェルテーブル126はウェル特徴テーブル140にリンクされている。ウェル特徴テーブル140は、ウェルに対する特徴のマッピングを有している。ウェル特徴テーブル140は特徴タイプテーブル142にリンクされている。特徴タイプテーブル142は、収集される特徴(例えば、細胞の特徴)のリストを有している。しかしながら、これよりも多い或いは少ないテーブルを使用することも可能であり、また、テーブル同士をリンクするためにこれよりも多い或いは少ないリンクを使用することも可能であり、本発明は、システムテーブル92に関して前述したテーブルに限定されるものではない。
【0074】
図4のステップ86では、アプリケーションデータベース92で複数の第2のエントリー(図6の例えばボックス106,108,110,112)が形成され、アプリケーションデータベース92が複数の画像および特徴データベース94,96,98,100にリンクされる。複数の画像および特徴データベースは、ミクロプレート内の所望のウェブから収集された画像データおよび特徴データを有している。データは、画像および特徴データベース内の複数のデータベーステーブルに分類される。
【0075】
本発明の1つの典型的な好ましい実施形態において、実際の画像および特徴データを有する画像および特徴データベース94,96,98,100の名前は、ミクロプレート同士間で動的に変更される。画像および特徴データは多くの個々のデータベースを含んでいるため、個々の画像および特徴データベースは、ミクロプレートのレコードが形成された時(例えば、システムデータベース92(図5)のプレートテーブル116(図7))に形成される。ミクロプレートのレコードは、プレートフィールド値を取って最後に「MDB」を加えることにより形成される名前を有する(例えば、「1234569803220001」のフィールド識別子を有するプレートテーブル116のレコードは、「1234569803220001.MDB」という名前で画像および特徴データベース内に記憶されるデータを有する)。しかしながら、また、画像および特徴データベースに関して他の名前を使用することもでき、本発明は、プレートテーブル116からのフィールド識別子を使用した名付けスキームに限定されるものではない。
【0076】
図8は、図5の画像および特徴データベース94,96,98,100における典型的なデータベーステーブル144を示すブロック図である。本発明の1つの好ましい実施形態において、ミクロプレートにおける画像および特徴データベースは、システムデータベース92において使用される製造者テーブル120およびシステムテーブル138を除くテーブル116〜142(図7)のコピーおよび画像および特徴データを保持するテーブルを有している。本発明の他の実施形態において、画像および特徴データベース94,96,98,100は、テーブル116〜142(図7)のコピーもしくはテーブル116〜142の全てを有している。本発明の他の実施形態において、画像および特徴データベース94,96,98,100は、システムデータベース92において使用されるテーブル116〜142(図7)のコピーを有していない。しかしながら、画像および特徴データベース内にシステムデータベース92のテーブルのコピーを有していれば、個々の画像および特徴データベースを、後に再検索して分析の助けとなるように、ファイル保管することができ且つ他のデータ記憶システムにコピーすることができる。
【0077】
画像および特徴データベース94,96,98,100のテーブル144は、ウェル内のフィールドに関する情報を記憶するためのウェルフィールドテーブル146を有している。ウェルフィールドテーブル146は、ウェルから収集された特徴のリスト情報を有するウェル特徴テーブル148にリンクされている。また、ウェルフィールドテーブル146は、ウェルから収集された画像リストを有する特徴画像テーブル150と、細胞に関して収集される情報を有する細胞テーブル152とにリンクされている。細胞テーブル152は、細胞から収集される特徴リストを有する細胞特徴テーブル154にリンクされている。しかしながら、それよりも多い或いは少ない特徴テーブルを使用することも可能であり、また、それよりも多い或いは少ないリンクを使用してテーブル同士をリンクさせることも可能であり、本発明は、画像および特徴データベースにおいて前述したテーブルに限定されるものではない。
【0078】
実験データのスプーリング
前述したように、解析機器モジュール12,14,16は、サブコンテナおよびコンテナにおけるサマリーデータ、画像データ、特徴データを含む多量のデータを形成する。未加工の特徴データ値は、前述した複数のテーブル(例えば図8)を有するデータベースファイルとして記憶される。解析機器12,14,16や記憶クライアントコンピュータ18,20,22がファイル空間から流出することを防止するため、データベースファイルは、階層データ管理システムを使用して管理される。
【0079】
図9は、実験データを巻き取るための方法156を示すフローチャートである。ステップ158では、第2のデータベースが、解析機器から共有データベースへとコピーされる。第2のデータベースは、コンテナからデータを収集するために使用される構成データと、コンテナ内の1または複数のサブコンテナから演算されたコンテナに関するサマリーデータと、所望のサブコンテナから収集された画像データおよび特徴データから演算されたコンテナ内のサブコンテナに関するサマリーデータとを有している。第2のデータベース内のデータは、1または複数のデータベーステーブルに分類される。ステップ160では、複数の第3のデータベースが共有データベースファイルサーバにコピーされる。複数の第3のデータベースは、コンテナ内の所望のサブコンテナから収集された画像データおよび特徴データを有している。第3のデータベース内のデータは、1または複数のデータベーステーブルに分類される。ステップ162では、共有データベースの第2のデータベースおよび共有データベースファイルサーバの1または複数の第3のデータベースのための新たな記憶場所を示すために、第2のデータベースおよび1または複数の第3のデータベースの場所が解析機器の第1のデータベース内で更新される。第1のデータベースは、第2のデータベースおよび1または複数の第3のデータベースに向かう複数のリンクを有しているが、コンテナから収集されたデータを全く有していない。第1のデータベースは、コンテナから収集されたデータを見るために、ディスプレイアプリケーションによって使用される。
【0080】
本発明の他の好ましい実施形態において、方法156では、更に、第1のデータベースが、解析機器12,14,16から記憶クライアントコンピュータ18,20,22へとコピーされる。そのような実施形態によれば、記憶クライアントコンピュータ18,20,22のディスプレイアプリケーションは、クライアントコンピュータ18,20,22の局部記憶装置にコピーされた第1のデータベースを使用して、コンテナから収集されたデータを見ることができる。
【0081】
本発明の他の好ましい実施形態において、方法156では、更に、分析器12,14,16上における第1のデータベースの位置が、クライアントコンピュータ18,20,22によって示される。このような実施形態により、記憶クライアントコンピュータ18,20,22のディスプレイアプリケーションは、記憶クライアントコンピュータ18,20,22から離れた典型的なデータ記憶システム10'上の場所で、コンテナから収集されたデータを見ることができる。
【0082】
共有データベース24の第2のデータベースからのコンテナおよびサブコンテナと、共有データベースファイルサーバ28の複数の第3のデータベースからの画像および特徴データを検索することにより、収集されたデータを、記憶クライアントコンピュータ18,20,22のディスプレイアプリケーションから見ることができる。
【0083】
本発明の1つの典型的な好ましい実施形態において、ステップ158では、システムデータベース92(図5)が、解析機器12,14,16から共有データベース24へとコピーされる。前述したように、システムデータベース92は、ミクロプレートからデータを収集するために使用される構成と、ミクロプレート内の1または複数のウェルから演算されたミクロプレートに関するサマリーデータ(例えば、表3)と、所望のウェルから収集され画像データおよび特徴データ(例えば、表1)から演算されたミクロプレート内のウェルに関するサマリーデータ(例えば、表2)とを有している。システムデータベース92内のデータは、1または複数のデータベーステーブル(例えば図7)に分類される。
【0084】
ステップ160では、1または複数の画像および特徴データベース94,96,98,100が共有データベースファイルサーバ28にコピーされる。1または複数の画像および特徴データベース94,96,98,100は、ミクロプレート内の所望のウェルから収集された画像データおよび特徴データを有している。1または複数の画像および特徴データベース内のデータは、1または複数のデータベーステーブルに分類される(例えば、図8)。
【0085】
ステップ162では、記憶データベース24のシステムデータベース92および記憶アーカイブ28の1または複数の画像および特徴データベース94,96,98,100のための新たな記憶場所を示すために、システムデータベース92および1または複数の画像および特徴データベース94,96,98,100の場所が解析機器12,14,16のアプリケーションデータベース90(図6)内で更新される。
【0086】
本発明の1つの好ましい実施形態において、アプリケーションデータベース90は、パススルーデータベースであり、システムデータベース92および1または複数の画像および特徴データベース94,96,98,100に向かう複数のリンク(例えば、図6)を有しているが、ミクロプレートから収集されたデータを全く有していない。本発明の他の実施形態において、アプリケーションデータベース90は、ミクロプレートからのデータを有している。アプリケーションデータベース92は、マクロプレートから収集されたデータを見るために、ディスプレイアプリケーションによって使用される。しかしながら、本発明はこの実施形態に限定されるものではなく、他のコンテナ、サブコンテナ(例えば、複数のミクロゲルを有するバイオチップ)、データベースを使用することもできる。
【0087】
実験データの階層的管理
図10は、実験データの階層的管理を行うための方法164を示すフローチャートである。ステップ166では、記憶移動手段を用いて、所定の階層記憶マネージャが初期化される。ステップ168において、階層記憶マネージャは、データベース内のデータベースファイルに所定の記憶移動手段を適用する。ステップ170では、データベースの任意のデータベースファイルが所定の記憶移動手段に適合しているか否かを決定するためのテストが行われる。データベースの任意のデータベースファイルが所定の記憶移動手段に適合している場合には、ステップ172において、データベースファイルが、データベースから階層記憶管理システム内の層へとコピーされる。ステップ174では、データベース内のデータベースファイルがプレイスホルダファイルに取って代えられる。プレイスホルダファイルは、階層記憶管理システム内の層にコピーされる実際のデータベースファイルに向かう複数のリンクを有している。データベースのデータベースファイルが所定の記憶移動手段に適合していない場合には、ステップ176において、データベースファイルは、データベースから階層記憶管理システム内の層へとコピーされない。
【0088】
本発明の1つの典型的な好ましい実施形態において、所定の記憶移動手段は、表4に示される1または複数の規則を有している。しかしながら、それよりも多い或いは少ない記憶移動手段の規則を使用することも可能であり、本発明は、表4に示される記憶移動手段の規則に限定されるものではない。
【0089】
【表4】
方法164は、データ記憶システム10'のほぼ無限量の「仮想」ディスクスペースにオンラインアクセスすることができる方法を与えるHSMステップを有している。仮想ディスクスペースには、多層の階層記憶管理システムが設けられている。仮想ディスクスペースは、任意のデータベースのレイアウトを変更することなく設けられ、ユーザが視認できない。
【0090】
本発明の1つの典型的な好ましい実施形態において、方法164のHSMステップは、ディスクアーカイブ32と光学ジュークボックス34とテープドライブ36とを有する3層の記憶階層を実行するアーカイブ法を提供する。しかしながら、それよりも多い或いは少ない記憶層を使用することもでき、本発明は、3層記憶のHSM技術に限定されるものではない。記憶階層においては、任意のデータベースのレイアウトや階層記憶マネージャの機能性を変更することなく、必要に応じて、別個の記憶層が付加される。階層記憶マネージャは、修正することなく、N層の記憶階層中の層にデータベースフィルタをコピーすることができる。
【0091】
また、光ディスクやテープといった記憶媒体がデータで満たされた際には、光学ジュークボックス34から書き換え可能な光ディスクを周期的に移動させたり、テープドライブ36からテープを周期的に移動させることにより、ほぼ無限量の「仮想」ディスクスペースに、3層の階層記憶管理システムを設けることができる。書き換え可能な光ディスクやテープは、その後のアクセスのために、データライブラリ内に記憶される。本発明の他の好ましい実施形態において、データライブラリは、コンピュータネットワーク40から直接にアクセス可能である。
【0092】
本発明の好ましい実施形態において、方法164は、少なくとも2つのデータベースファイル保管をサポートする。しかしながら、それよりも多い或いは少ないデータファイル保管モードを使用することも可能であり、本発明はこの2つのモードに限定されるものではない。
【0093】
第1のモードにおいて、記憶サーバ26は、個々の解析機器12,141,6上にデータベースファイルを保持する。この場合、データベースファイルは予め形成されている。記憶サーバ26は、方法164を使用して、解析機器12,14,16のディスクの空き領域を自動的に管理し、3段記憶管理システム内の層にファイルを移動させる。エンドユーザに対しては、ファイルは、それらが初めに記憶されたと同じディレクトリ内にあるように見える。しかしながら、実際には、ディスクアーカイブ32、光学ジュークボックス34,あるいは、デジタルリニアテープ(DLT)ライブラリ上にファイルを記憶しても良い。
【0094】
第2のモードにおいて、記憶サーバ26は、データベースファイルを、解析機器12,14,16から、共有データベース24および共有データベースファイルサーバ30へと巻き取る。次に、記憶サーバ26は、方法164を使用して、共有データベースファイルサーバ30のデータベースファイルを管理する。また、第2のモードにおいて、ファイルは、ディスクアーカイブ32、光学ジュークボックス34,あるいは、DLTライブラリ上に記憶されても良い。
【0095】
実験データプレゼンテーション
前述したように、解析機器12,14,16は多量の実験データを形成することができる。役に立つように、実験データは、科学者や解析技術者に視覚的に示されなければならない。
【0096】
図11は、実験データを示すための方法178を示すフローチャートである。ステップ180では、コンピュータのディスプレイアプリケーションからの第1のデータベースを使用して、1または複数のコンテナを有するリストが表示される。コンテナは複数のサブコンテナを有している。画像データおよび特徴データは、1または複数のコンテナから収集された。第1のデータベースは、実験データを有する他のデータベースに向かうリンクを備えたパススルーデータベースである。ステップ182では、第1のコンテナに関し、第1の選択入力が、ディスプレイアプリケーション上でリストから受けられる。ステップ184では、第1のコンテナに関し、第2のデータベースが、離れた第1の記憶場所から得られる。離れた第1の記憶場所は、ディスプレイアプリケーションを実行するコンピュータから離れている。第2のデータベースは、第1のコンテナからデータを収集するために使用される構成データと、第1のコンテナ内のサブコンテナから演算された第1のコンテナに関するサマリーデータと、所望のサブコンテナから収集された画像データおよび特徴データから演算された第1のコンテナ内の所望のサブコンテナに関するサマリーデータとを有している。ステップ186では、第1のコンテナ内の1または複数のサブコンテナに関し、第2の選択入力が、ディスプレイアプリケーション上で受けられる。ステップ188では、複数の第3のデータベースが、離れた第2の記憶場所から得られる。複数の第3のデータベースは、第1のコンテナ内の1または複数のサブコンテナから収集された画像データおよび特徴データを有している。ステップ190では、第2のデータベースからのコンテナデータおよびサブコンテナデータと、1または複数のサブコンテナから収集された複数の第3のデータベースからの画像データおよび特徴データとを有するディスプレイアプリケーションから、グラフィックディスプレイが形成される。グラフィックディスプレイ上に表示されたデータは、離れた第1の記憶場所や第2の記憶場所ではなく、コンピュータ上の局部記憶装置から得られたように見える。
【0097】
本発明の1つの典型的な好ましい実施形態において、方法178は、複数のウェルを有するミクロプレートから収集された実験データを表示するために使用される。しかしながら、本発明は、この実施形態に限定されるものではなく、複数のウェルを有するミクロプレート以外に、他のコンテナやサブコンテナ(例えば、複数のミクロゲルを有するバイオチップ)のために使用することができる。
【0098】
そのような典型的な実施形態において、ステップ180では、複数のミクロプレートを含むリストが、コンピュータのディスプレイアプリケーションによって表示される。ミクロプレートは複数のウェルを有している。細胞の画像データおよび細胞の特徴データは、複数のミクロプレートから収集される。ディスプレイアプリケーションは、実験データを有する他のデータベースの場所を見つけるために、アプリケーションデータベース90を使用する。
【0099】
本発明の1つの好ましい典型的な実施形態において、アプリケーションデータベース90は、ディスプレイアプリケーションを有するコンピュータから離れた場所で、典型的なデータ記憶システム10'に配置される。アプリケーションデータベース90を、典型的なデータ記憶システム10'上の離れた場所からコピーすることなく、アプリケーションデータベース90は、ディスプレイアプリケーションを有するコンピュータから使用される。
【0100】
本発明の別の典型的な好ましい実施形態において、アプリケーションデータベース90は、典型的なデータ記憶システム10'上の場所から、ディスプレイアプリケーションを有するコンピュータの局部記憶装置へとコピーされる。そのような実施形態において、アプリケーションデータベース90は、ディスプレイアプリケーションを有するコンピュータにコピーされて、そのコンピュータ上に存在する。
【0101】
ステップ182では、第1のミクロプレートに関し、第1の選択入力が、ディスプレイアプリケーション上でリストから受けられる。ステップ184では、第1のミクロプレートに関し、システムデータベース92が、離れた第1の記憶場所から得られる。離れた第1の記憶場所は、ディスプレイアプリケーションを実行するコンピュータから離れている。システムデータベース92は、第1のミクロプレートからデータを収集するために使用される構成データと、第1のミクロプレート内のウェルから演算された第1のミクロプレートに関するサマリーデータと、所望のウェルから収集された画像データおよび特徴データから演算された第1のミクロプレート内の所望のウェルに関するサマリーデータとを有している。
【0102】
ステップ186では、第1のミクロプレート内の1または複数のウェルに関し、第2の選択入力が、ディスプレイアプリケーション上で受けられる。ステップ188では、複数の画像および特徴データベース94,96,98,100が、離れた第2の記憶場所から得られる。複数の画像および特徴データベース94,96,98,100は、第1のミクロプレート内の1または複数のウェルから収集された画像データおよび特徴データを有している。ステップ190では、システムデータベース92からのミクロプレートおよびウェルのサマリーデータと、1または複数のウェルから収集された複数の画像および特徴データベース94,96,98,100からの画像データおよび特徴データとを有するディスプレイアプリケーションから、グラフィックディスプレイが形成される。グラフィックディスプレイ上に表示されたデータは、離れた第1の記憶場所や第2の記憶場所ではなく、コンピュータ上の局部記憶装置から得られたように見える。
【0103】
図12は、ディスプレイアプリケーションからの実験データを視覚的に表示するための典型的なスクリーンディスプレイ192を示すブロック図である。スクリーンディスプレイ192は、複数のサブコンテナの表示194をコンテナ196内に有している。コンテナ196は384個のサブコンテナ(数字1〜24×文字A〜P、すなわち、24×16=384)を有している。また、スクリーンディスプレイ192は、コンテナサマリーデータ198と、サブコンテナサマリーデータ200と、画像データ202と、特徴データ204とを有している。スクリーンディスプレイ192は、ユーザの好みに応じて、グラフィックフォーマットおよびテキストフォーマットの両方でデータを表示することができる。ユーザは、ディスプレイアプリケーションによって形成されたメニュー(図12には図示されていない)から自分の好みの表示を選択することができる。スクリーンディスプレイ192は、コンテナ196内の黒く塗りつぶされたサブコンテナ206によって示されるサブコンテナに関する実験データA−3を示す。コンテナから収集された実験データは、解析のため、複数の離れた場所から、複数のデータベースに向かう複数のリンクを有するパススルーデータベースを備えたスクリーンディスプレイ192と方法178とを使用して、科学者や実験技術者に対して視覚的に示される。
【0104】
本発明の1つの典型的な好ましい実施形態においては、ここに述べられている方法およびシステムにアクセスしてこれらを使用するために、記憶アプリケーションプログラミングインターフェース(API)が設けられる。この技術分野において知られるように、APIは、所望のタスクを行う一組の機能にアクセスするためにアプリケーションプログラムによって使用されるインターフェースルーチンのセットである。
【0105】
本発明の1つの特定の好ましい実施形態において、記憶APIは、マイクロソフト(Microsoft)のウインドウズ95/98/NT/2000オペレーティングシステムを用いて使用されるダイナミックリンクライブラリ(DLL)内に記憶される。DLLは「mvPlateData.DLL」と称される。しかしながら、本発明はWindows(登録商標)のDLL内にAPIを記憶することやDLLの先の名称を使用することに限定されるものではなく、他の方法や名称を使用してAPIを記憶、使用することもできる。この技術分野において知られているように、DLLは、アプリケーションによって必要な場合にだけ、実行可能なルーチンを記憶してロードすることができるライブラリである。DLL内の記憶APIは、ウインドウズの「REGSVR32.EXE」アプリケーションを用いて登録され、他のアプリケーションが使用できるようにされる。記憶APIは、プレート、ウェル画像、細胞特徴情報に対するインターフェースによるアクセスを提供するとともに、収集される所望のウェル特徴情報を入力し易くする。
【0106】
ここに述べられたこれらの方法およびシステムによれば、高スループットのデータ収集/解析システムからの実験データを効率的に収集して、記憶し、管理して、表示することができる。この方法およびシステムは、複数のウェルすなわち実験的な化合物が細胞の集合体に適用される複数のミクロゲルを含むバイオチップを有するミクロプレートから収集された細胞画像データおよび細胞特徴データを記憶管理して表示するために使用できるが、これに限定されるものではない。バイオチップが使用される場合には、ここに述べられたミクロプレートに対する任意の言及をバイオチップに取って代えることができるとともに、ミクロプレート内のウェルに対する言及をバイオチップ上のミクロゲルに取って代えることができ、前述した方法およびシステムとともに使用することができる。
【0107】
この方法およびシステムは、容易に管理でき且つ細胞データを解析、操作して保管することできる柔軟で拡張可能な細胞データの倉庫を提供することができる。また、この方法およびシステムは、細胞の集合体に適用された新たな実験化合物の識別、選択、妥当性確認、スクリーニングを向上させることができる。また、この方法およびシステムは、細胞データに関する観察に使用されるバイオインフォマティクス技術を提供するために使用できる。
【0108】
言うまでもなく、ここに述べられたプログラム、工程、方法、システムは、任意の特定のタイプのコンピュータやネットワークシステム(ハードウェアやソフトウェア)に関するものではなく、また、これらに限定されるものではない。ここに述べられた教示内容とともに様々なタイプの汎用あるいは特定のコンピュータシステムを使用することができ、あるいは、ここに述べられた教示内容にしたがって、様々なタイプの汎用あるいは特定のコンピュータシステムの動作を行うことができる。
【0109】
本発明の原理を適用することができる多種多様な実施形態を考慮すれば分かるように、先に示された実施形態は、単なる一例であって、本発明の範囲を制限するものと解釈してはならない。例えば、フローチャートのステップは、先に述べられたものと異なる配列で行われても良く、また、それよりも多い或いは少ない要素がブロック図内で使用されても良い。好ましい実施形態の様々な要素がソフトウェア内で実行されるように説明してきたが、他の実施形態においては、ハードウェアやファームウェアにおいて選択的に実行されても良い。 特許請求は、その作用に述べられていない場合には、記載されている順番や要素に限定して解釈されるべきではない。したがって、以下の特許請求の範囲や思想の範囲内にある全ての実施形態およびこれらと等価なものは、本発明として請求される。
【特許請求の範囲】
【請求項1】
複数のサブコンテナから構成するコンテナの構成情報を有するデータベースから当該構成情報を使用して、コンテナを自動初期化するステップと、
前記コンテナに関して使用された初期化情報をコンテナデータベース内に記憶させるステップと、
前記コンテナ内の所望のサブコンテナに関して以下のステップ(a)〜(g)を繰り返すステップと、
(a)前記コンテナ内の個々のサブコンテナを選択するステップ、
(b)前記サブコンテナから複数の画像データを収集するステップ、
(c)外部データ記憶システムに前記複数画像データを収集するために用いた1つもしくは1つ以上の画像に対する複数のリファレンスをデータベース内に記憶させるステップ、
(d)前記画像データから複数の特徴データを収集するステップ、
(e)前記複数の特徴データを特徴データベース内に記憶させるステップ、
(f)前記サブコンテナから収集された前記複数の画像データおよび前記複数の特徴データを使用して、複数のサブコンテナサマリーデータを演算するステップ、
(g)前記複数のサブコンテナサマリーデータを前記データベース内に記憶させるステップ、
(h)前記データベースからの前記サブコンテナサマリーデータを使用して、複数のコンテナサマリーデータを演算するステップ、
(i)前記複数のコンテナサマリーデータを前記データベース内に記憶させるステップ、
(j)データベースとデータ記憶装置システムと間の複数のリンクであって、コンテナとそのコンテナにある複数サブコンテナとに対して収集し演算したデータをディスプレイアプリケーションによって素早く表示するために使われるその複数のリンクを前記データベースに形成するステップ、
とを備えていることを特徴とする実験データをコンピュータシステム上で収集するための方法。
【請求項2】
請求項1に記載の前記方法を1つもしくは1つ以上の演算処理装置に実行させるための指示を内部に記憶していることを特徴とするコンピュータ読み取り可能媒体。
【請求項3】
前記複数のサブコンテナは、実験化合物を用いて処理される複数の細胞を有していることを特徴とする請求項1に記載の方法。
【請求項4】
前記コンテナはミクロプレートを含み、前記複数のサブコンテナはミクロプレート内の複数のウェルを含んでいることを特徴とする請求項1に記載の方法。
【請求項5】
前記データベースはミクロプレートデータ、ウェルデータ、写真画像データ、細胞特徴データを有していることを特徴とする請求項1に記載の方法。
【請求項6】
前記画像データから複数の特徴データを収集する前記ステップは、画像データによって同定された細胞に関し、サイズ、形状、強度、構造、位置、面積、周の長さ、形状係数、等価直径、長さ、幅、総合蛍光強度、平均蛍光強度、変動、歪み、尖度、最小蛍光強度、最大蛍光強度、幾何学的中心、幾何学的中心のX座標、幾何学的中心のY座標のうちのいずれかを収集することを特徴とする請求項1に記載の方法。
【請求項7】
複数のサブコンテナサマリーデータを演算する前記ステップは、サイズ、形状、強度、構造、位置、細胞核面積、スポットカウント、総計スポット面積、平均スポット面積、最小スポット面積、最大スポット面積、総計スポット強度、平均スポット強度、最小スポット強度、最大スポット強度、正規化平均スポット強度、正規化スポットカウント、細胞核数、細胞核総計強度、色素面積、色素総計強度、細胞核強度、細胞質強度、細胞核強度と細胞質強度との間の差、細胞核面積、細胞カウント、細胞核ボックスフィル比、細胞核周長平方面積、細胞核高さ/幅比のうちのいずれかを演算することを特徴とする請求項1に記載の方法。
【請求項8】
複数のコンテナサマリーデータを演算する前記ステップは、平均サイズ、平均形状、平均強度、平均構造、細胞の位置、細胞の数、有効フィールド数、細胞核面積の標準偏差、平均スポットカウント、スポットカウントの標準偏差、平均総計スポット面積、総計スポット面積の標準偏差、統計学的平均の平均スポット面積、平均スポット面積の標準偏差、平均細胞核面積、平均細胞核総計強度、細胞核強度の標準偏差、平均色素面積、色素面積の標準偏差、平均色素総計強度、総計色素強度の標準偏差、最小スポット面積の平均、最小スポット面積の標準偏差、最大スポット面積の平均、最大スポット面積の標準偏差、平均総計スポット強度、総計スポット強度の標準偏差、統計学的平均の平均スポット強度、細胞核強度、細胞質強度、細胞核強度と細胞質強度との間の差、細胞核面積、細胞核ボックスフィル比、細胞核周長平方面積、細胞核高さ/幅比、ウェル細胞カウントのうちのいずれかを演算することを特徴とする請求項1に記載の方法。
【請求項9】
前記コンテナがバイオチップを含み、前記複数のサブコンテナが前記バイオチップ内の選択されたミクロゲルを含むことを特徴とする請求項1に記載の方法。
【請求項10】
前記データベースあるサマリーデータに対し、コンテナとそのコンテナにある複数サブコンテナとに対して演算したサマリーデータをディスプレイアプリケーションによって素早く表示するために使われるその複数のリンクをテーブルに形成するステップ、
をさらに具備することを特徴とする請求項1に記載の方法。
【請求項11】
前記複数の特徴データは、前記サブコンテナ内の複数の細胞に関する複数の細胞特徴データを含み、前記複数の画像データは、サブコンテナ内の前記複数の細胞から収集された複数の写真画像を含むことを特徴とする請求項1に記載の方法。
【請求項12】
前記データベースは実験データと情報とを有し、その情報は、プレート、プロトコル、プロトコル分析パラメータ、プロトコル走査領域、分析パラメータ、プロトコルチャネル、プロトコルチャネル拒絶パラメータ、製造者、形状係数、プレート特徴、ウェル、ウェル特徴、システムのうちのいずれかを含む複数のデータベーステーブルから成ることを特徴とする請求項1に記載の方法。
【請求項13】
前記データベースは、ウェル、ウェル特徴、特徴タイプウェルフィールド、ウェルフィールド特徴、ウェルフィールド特徴画像、細胞のいずれかを含む複数のデータベーステーブルからなるプレート情報を含むことを特徴とする請求項1に記載の方法。
【請求項14】
前記データベースは、プレート、プロトコル、プロトコル分析パラメータ、プロトコル走査領域、分析パラメータ、プロトコルチャネル、プロトコルチャネル拒絶パラメータ、製造者、形状係数、プレート特徴、ウェルシステム、あるいは、特徴タイプデータベーステーブルのうちのいずれかを更に含み、そのデータベーステーブルは、前記全体データベースを他のコンピュータシステムにコピーすることなく、再検索のために、独立にファイルとして保管され、他のコンピュータシステムにコピーされることができることを特徴とする請求項13に記載の方法。
【請求項15】
前記データベースが、パーソナルコンピュータに、データベースサーバーにあるいは共有のデータベースファイルサーバーに記憶されることを特徴とする請求項1に記載の方法。
【請求項16】
コンテナ内の複数のサブコンテナから複数の画像データおよび複数の特徴データを収集する前記ステップは、実験化合物における所定の分析のため、ミクロプレート内の複数のウェルから、複数の細胞に関する複数の細胞特徴データおよび複数の写真画像データを収集することを特徴とする請求項1に記載の方法。
【請求項17】
ディスプレイアプリケーション上に、前記データベースを用いて表示するためにコンテナ、サブコンテナデータ、画像、及び、特徴データとを検索することによって収集されたデータを示すステップ、
を更に備えていることを特徴とする請求項1に記載の方法。
【請求項18】
コンピュータ上のディスプレイアプリケーションから、複数のコンテナを有するリストを表示するステップにおいて、前記コンテナは複数のサブコンテナを有し、複数の画像データおよび複数の特徴データは、前記複数のコンテナから収集されるステップと、
複数のコンテナを有する前記リストから、第1の選択入力を、第1のコンテナに関し、前記ディスプレイアプリケーション上で受けるステップと、
前記データベースから前記第1のコンテナに関するデータを得るステップにおいて、前記データベースは、前記第1のコンテナからデータを収集するために使用される初期データと、前記第1のコンテナ内の複数のサブコンテナから演算される前記第1のコンテナに関するサマリーデータと、所望のサブコンテナから収集される複数の画像データおよび複数の特徴データから演算される前記第1のコンテナ内の所望のサブコンテナに関するサマリーデータとを有するステップと、
前記第1のコンテナ内の1または複数のサブコンテナに関し、第2の選択入力を、前記ディスプレイアプリケーション上で受けるステップと、
前記第1のコンテナ内の前記1または複数のサブコンテナから収集される複数の画像データおよび複数の特徴データを得るステップと、
前記ディスプレイアプリケーションによって、前記1または複数のサブコンテナから収集されるコンテナおよびサブコンテナデータ、画像データおよび特徴データからなるグラフィックディスプレイを形成するステップと、
を更に備えていることを特徴とする請求項1に記載の方法。
【請求項19】
前記グラフィックディスプレイが、コンテナの実際の外観及び複数サブコンテナの実際の外観を表すグラフィックによる外観を含む複数のサブコンテナを有する1または複数のコンテナのグラフィックディスプレイを含むことを特徴とする請求項18に記載の方法。
【請求項20】
前記グラフィックディスプレイが、コンテナの実際の外観及び複数サブコンテナの実際の外観
に関連した前記特徴データ及び画像を表すグラフィックプロット(graphical plot), 表計算ソフトウェア(spreadsheet)及び画像ディスプレイを含む複数のサブコンテナを有する1または複数のコンテナに関連した前記特徴データ及び画像のグラフィックディスプレイを含むことを特徴とする請求項18に記載の方法。
【請求項1】
複数のサブコンテナから構成するコンテナの構成情報を有するデータベースから当該構成情報を使用して、コンテナを自動初期化するステップと、
前記コンテナに関して使用された初期化情報をコンテナデータベース内に記憶させるステップと、
前記コンテナ内の所望のサブコンテナに関して以下のステップ(a)〜(g)を繰り返すステップと、
(a)前記コンテナ内の個々のサブコンテナを選択するステップ、
(b)前記サブコンテナから複数の画像データを収集するステップ、
(c)外部データ記憶システムに前記複数画像データを収集するために用いた1つもしくは1つ以上の画像に対する複数のリファレンスをデータベース内に記憶させるステップ、
(d)前記画像データから複数の特徴データを収集するステップ、
(e)前記複数の特徴データを特徴データベース内に記憶させるステップ、
(f)前記サブコンテナから収集された前記複数の画像データおよび前記複数の特徴データを使用して、複数のサブコンテナサマリーデータを演算するステップ、
(g)前記複数のサブコンテナサマリーデータを前記データベース内に記憶させるステップ、
(h)前記データベースからの前記サブコンテナサマリーデータを使用して、複数のコンテナサマリーデータを演算するステップ、
(i)前記複数のコンテナサマリーデータを前記データベース内に記憶させるステップ、
(j)データベースとデータ記憶装置システムと間の複数のリンクであって、コンテナとそのコンテナにある複数サブコンテナとに対して収集し演算したデータをディスプレイアプリケーションによって素早く表示するために使われるその複数のリンクを前記データベースに形成するステップ、
とを備えていることを特徴とする実験データをコンピュータシステム上で収集するための方法。
【請求項2】
請求項1に記載の前記方法を1つもしくは1つ以上の演算処理装置に実行させるための指示を内部に記憶していることを特徴とするコンピュータ読み取り可能媒体。
【請求項3】
前記複数のサブコンテナは、実験化合物を用いて処理される複数の細胞を有していることを特徴とする請求項1に記載の方法。
【請求項4】
前記コンテナはミクロプレートを含み、前記複数のサブコンテナはミクロプレート内の複数のウェルを含んでいることを特徴とする請求項1に記載の方法。
【請求項5】
前記データベースはミクロプレートデータ、ウェルデータ、写真画像データ、細胞特徴データを有していることを特徴とする請求項1に記載の方法。
【請求項6】
前記画像データから複数の特徴データを収集する前記ステップは、画像データによって同定された細胞に関し、サイズ、形状、強度、構造、位置、面積、周の長さ、形状係数、等価直径、長さ、幅、総合蛍光強度、平均蛍光強度、変動、歪み、尖度、最小蛍光強度、最大蛍光強度、幾何学的中心、幾何学的中心のX座標、幾何学的中心のY座標のうちのいずれかを収集することを特徴とする請求項1に記載の方法。
【請求項7】
複数のサブコンテナサマリーデータを演算する前記ステップは、サイズ、形状、強度、構造、位置、細胞核面積、スポットカウント、総計スポット面積、平均スポット面積、最小スポット面積、最大スポット面積、総計スポット強度、平均スポット強度、最小スポット強度、最大スポット強度、正規化平均スポット強度、正規化スポットカウント、細胞核数、細胞核総計強度、色素面積、色素総計強度、細胞核強度、細胞質強度、細胞核強度と細胞質強度との間の差、細胞核面積、細胞カウント、細胞核ボックスフィル比、細胞核周長平方面積、細胞核高さ/幅比のうちのいずれかを演算することを特徴とする請求項1に記載の方法。
【請求項8】
複数のコンテナサマリーデータを演算する前記ステップは、平均サイズ、平均形状、平均強度、平均構造、細胞の位置、細胞の数、有効フィールド数、細胞核面積の標準偏差、平均スポットカウント、スポットカウントの標準偏差、平均総計スポット面積、総計スポット面積の標準偏差、統計学的平均の平均スポット面積、平均スポット面積の標準偏差、平均細胞核面積、平均細胞核総計強度、細胞核強度の標準偏差、平均色素面積、色素面積の標準偏差、平均色素総計強度、総計色素強度の標準偏差、最小スポット面積の平均、最小スポット面積の標準偏差、最大スポット面積の平均、最大スポット面積の標準偏差、平均総計スポット強度、総計スポット強度の標準偏差、統計学的平均の平均スポット強度、細胞核強度、細胞質強度、細胞核強度と細胞質強度との間の差、細胞核面積、細胞核ボックスフィル比、細胞核周長平方面積、細胞核高さ/幅比、ウェル細胞カウントのうちのいずれかを演算することを特徴とする請求項1に記載の方法。
【請求項9】
前記コンテナがバイオチップを含み、前記複数のサブコンテナが前記バイオチップ内の選択されたミクロゲルを含むことを特徴とする請求項1に記載の方法。
【請求項10】
前記データベースあるサマリーデータに対し、コンテナとそのコンテナにある複数サブコンテナとに対して演算したサマリーデータをディスプレイアプリケーションによって素早く表示するために使われるその複数のリンクをテーブルに形成するステップ、
をさらに具備することを特徴とする請求項1に記載の方法。
【請求項11】
前記複数の特徴データは、前記サブコンテナ内の複数の細胞に関する複数の細胞特徴データを含み、前記複数の画像データは、サブコンテナ内の前記複数の細胞から収集された複数の写真画像を含むことを特徴とする請求項1に記載の方法。
【請求項12】
前記データベースは実験データと情報とを有し、その情報は、プレート、プロトコル、プロトコル分析パラメータ、プロトコル走査領域、分析パラメータ、プロトコルチャネル、プロトコルチャネル拒絶パラメータ、製造者、形状係数、プレート特徴、ウェル、ウェル特徴、システムのうちのいずれかを含む複数のデータベーステーブルから成ることを特徴とする請求項1に記載の方法。
【請求項13】
前記データベースは、ウェル、ウェル特徴、特徴タイプウェルフィールド、ウェルフィールド特徴、ウェルフィールド特徴画像、細胞のいずれかを含む複数のデータベーステーブルからなるプレート情報を含むことを特徴とする請求項1に記載の方法。
【請求項14】
前記データベースは、プレート、プロトコル、プロトコル分析パラメータ、プロトコル走査領域、分析パラメータ、プロトコルチャネル、プロトコルチャネル拒絶パラメータ、製造者、形状係数、プレート特徴、ウェルシステム、あるいは、特徴タイプデータベーステーブルのうちのいずれかを更に含み、そのデータベーステーブルは、前記全体データベースを他のコンピュータシステムにコピーすることなく、再検索のために、独立にファイルとして保管され、他のコンピュータシステムにコピーされることができることを特徴とする請求項13に記載の方法。
【請求項15】
前記データベースが、パーソナルコンピュータに、データベースサーバーにあるいは共有のデータベースファイルサーバーに記憶されることを特徴とする請求項1に記載の方法。
【請求項16】
コンテナ内の複数のサブコンテナから複数の画像データおよび複数の特徴データを収集する前記ステップは、実験化合物における所定の分析のため、ミクロプレート内の複数のウェルから、複数の細胞に関する複数の細胞特徴データおよび複数の写真画像データを収集することを特徴とする請求項1に記載の方法。
【請求項17】
ディスプレイアプリケーション上に、前記データベースを用いて表示するためにコンテナ、サブコンテナデータ、画像、及び、特徴データとを検索することによって収集されたデータを示すステップ、
を更に備えていることを特徴とする請求項1に記載の方法。
【請求項18】
コンピュータ上のディスプレイアプリケーションから、複数のコンテナを有するリストを表示するステップにおいて、前記コンテナは複数のサブコンテナを有し、複数の画像データおよび複数の特徴データは、前記複数のコンテナから収集されるステップと、
複数のコンテナを有する前記リストから、第1の選択入力を、第1のコンテナに関し、前記ディスプレイアプリケーション上で受けるステップと、
前記データベースから前記第1のコンテナに関するデータを得るステップにおいて、前記データベースは、前記第1のコンテナからデータを収集するために使用される初期データと、前記第1のコンテナ内の複数のサブコンテナから演算される前記第1のコンテナに関するサマリーデータと、所望のサブコンテナから収集される複数の画像データおよび複数の特徴データから演算される前記第1のコンテナ内の所望のサブコンテナに関するサマリーデータとを有するステップと、
前記第1のコンテナ内の1または複数のサブコンテナに関し、第2の選択入力を、前記ディスプレイアプリケーション上で受けるステップと、
前記第1のコンテナ内の前記1または複数のサブコンテナから収集される複数の画像データおよび複数の特徴データを得るステップと、
前記ディスプレイアプリケーションによって、前記1または複数のサブコンテナから収集されるコンテナおよびサブコンテナデータ、画像データおよび特徴データからなるグラフィックディスプレイを形成するステップと、
を更に備えていることを特徴とする請求項1に記載の方法。
【請求項19】
前記グラフィックディスプレイが、コンテナの実際の外観及び複数サブコンテナの実際の外観を表すグラフィックによる外観を含む複数のサブコンテナを有する1または複数のコンテナのグラフィックディスプレイを含むことを特徴とする請求項18に記載の方法。
【請求項20】
前記グラフィックディスプレイが、コンテナの実際の外観及び複数サブコンテナの実際の外観
に関連した前記特徴データ及び画像を表すグラフィックプロット(graphical plot), 表計算ソフトウェア(spreadsheet)及び画像ディスプレイを含む複数のサブコンテナを有する1または複数のコンテナに関連した前記特徴データ及び画像のグラフィックディスプレイを含むことを特徴とする請求項18に記載の方法。
【図1A】
【図1B】
【図2】
【図3A】
【図3B】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図1B】
【図2】
【図3A】
【図3B】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【公開番号】特開2010−20789(P2010−20789A)
【公開日】平成22年1月28日(2010.1.28)
【国際特許分類】
【出願番号】特願2009−209367(P2009−209367)
【出願日】平成21年9月10日(2009.9.10)
【分割の表示】特願2005−259850(P2005−259850)の分割
【原出願日】平成11年11月10日(1999.11.10)
【出願人】(500476912)セロミックス インコーポレイテッド (3)
【氏名又は名称原語表記】Cellomics, Inc.
【Fターム(参考)】
【公開日】平成22年1月28日(2010.1.28)
【国際特許分類】
【出願日】平成21年9月10日(2009.9.10)
【分割の表示】特願2005−259850(P2005−259850)の分割
【原出願日】平成11年11月10日(1999.11.10)
【出願人】(500476912)セロミックス インコーポレイテッド (3)
【氏名又は名称原語表記】Cellomics, Inc.
【Fターム(参考)】
[ Back to top ]