説明

生物学的特徴を検出するためのシステムおよび方法

メモリを有するコンピュータが、データを受け取るための命令を記憶している。このデータは、ある1つの種の試験生物内または前記種の生物の試験生体標本内で測定された複数の細胞成分のうちのそれぞれの細胞成分の1つまたは複数の特性を含む。このメモリはさらに、複数のモデルのうちのある1つのモデルを演算するための命令を記憶しており、このモデルは、前記試験生物内または前記試験生体標本内の生物学的特徴の存在の有無を表すモデルスコアによって特性づけられる。このモデルの演算は、前記複数の細胞成分のうちの1つまたは複数の細胞成分の1つまたは複数の特性を使用して前記モデルスコアを決定することを含む。このメモリはさらに、演算するための前記命令を1回または数回繰り返すための命令を記憶しており、それによって前記複数のモデルが演算される。このメモリはさらに、演算されたモデルスコアを通信するための命令を記憶している。

【発明の詳細な説明】
【技術分野】
【0001】
本出願は、米国特許法119条(e)のもとで、その全体が参照によって本明細書に組み込まれる2004年6月5日出願の米国特許仮出願第60/577,416号の恩典を主張するものである。本出願はまた、米国特許法119条(e)のもとで、その全体が参照によって本明細書に組み込まれる2003年9月29日出願の米国特許仮出願第60/507,381号の恩典を主張するものである。本出願はまた、米国特許法119条(e)のもとで、その全体が参照によって本明細書に組み込まれる2003年9月29日出願の米国特許仮出願第60/507,445号の恩典を主張するものである。本出願は、その全体が参照によって本明細書に組み込まれる2004年6月4日出願の米国特許出願第10/861,216号の一部継続出願である。本出願はまた、その全体が参照によって本明細書に組み込まれる2004年6月4日出願の米国特許出願第10/861,177号の一部継続出願である。
【0002】
本発明の分野は、生体標本内の生物学的特徴、例えば病気を識別するためのコンピュータシステムおよび方法に関する。
【背景技術】
【0003】
病気を合理的に治療する第一歩は、ある1つの病気分類に照らして患者を評価することであり、その結果は、患者の持つ病気の種類を決定し、さまざまな治療に対する患者の反応を予測するのに使用される。この過程の有効性はその分類の質に左右される。少なくとも癌の場合には、癌細胞の分類を洗練し向上させるために、腫瘍細胞のDNA、RNAまたはタンパク質を解析するマイクロアレイ法の使用が始まっている。例えばGolub et al., 1999, Science 286, p. 531を参照されたい。
【0004】
さらに、van't Veer et al., 2002, Nature 415, p. 530は、このような「分子プロファイリング」が癌分類をどのように向上させているかを例示している。van't Veer et al.は、外科的に除去された後に実施された乳房腫瘍の遺伝子発現プロファイリングの結果を使用して、どの患者が臨床的転移(他の部位への腫瘍の広がり。そこで2次的な腫瘍が発生する)を持つようになるのかを予測することができることを示している。個々の乳癌患者に対する治療法は、腫瘍の広がりの程度(腫瘍サイズを決定することを含む)、癌細胞が副(auxiliary)リンパ節に広がっているかどうか、どのくらいの数のリンパ節が含まれるか、遠隔臨床転移が存在するどうかなど、さまざまな基準に従って選択される。転移の形跡のない女性において、乳癌の治癒を目指す治療の主柱は腫瘍の除去および放射線治療である。残念なことにこれらの患者の一部は後に臨床的転移を発症する。したがって、手術後に、原発腫瘍からすでに広がっているかもしれない癌細胞の顕微的沈着に対する追加の療法(「補助(adjuvant)」療法)が必要な女性を識別することが求められている。例えば、Caldas and Aparicio, 2002, Nature 415, p. 484およびGoldhirsch et al. 1998, J. Natl. Cancer Inst. 90, p. 1601を参照されたい。
【0005】
補助療法は、例えば血流によって癌細胞に到達するエストロゲンモジュレータ、細胞傷害性薬物などの薬剤を使用する。このような治療はしばしば有毒な副作用を有する。このような治療が必要かもしれない女性の識別は伝統的に、さまざまな臨床的および組織病理学的な指標(例えば、患者の年齢、癌細胞が正常細胞に似ている程度、「腫瘍グレード(tumor grade)」、および癌細胞がエストロゲンレセプタを発現しているかどうか)に依拠してきた。しかし、これらを全て合わせてみても、これらの指標は予測因子として不十分である。そのため、かなりとはいえ小さなパーセンテージの生命を救うために、手術および放射線治療のみによって治癒したと考えられる多くの患者がその後に不必要で有毒な補助治療を受けている。
【0006】
van't Veer et al., 2002, Nature 415, p. 530および他の研究の結果が、患者の生体標本(例えば腫瘍)を複数の生物学的サンプルクラス(例えば補助療法が必要な乳癌と補助療法の必要のない乳癌)に特性づけるようとする分類体系において使用され始めている。the Avon Foundation、Millennium Pharmaceuticals、the European Organization for Research and Treatment of Cancer、the National Cancer Instituteなどの企業および機関による資金助成を受けて、このような分類体系を見い出しその妥当性を確認するためのいくつかの臨床試験が現在進行中である。例えばBranca, 2003, Science 300, p. 238を参照されたい。
【0007】
乳癌に対してはいくつかの生物学的分類体系が使用可能である。例えば Ramaswamy et al., 2003, Nature Genetics 33, p. 49は、転移性腺癌から原発性腺癌を識別する遺伝子発現サイン(signature)を提供している。Su et al., 2001, Cancer Research 61, p. 7388には、大規模RNAプロファイリングおよび教師あり機械学習(supervised machine-learning)アルゴリズムを使用して、前立腺、乳房、肺、卵巣、結腸直腸、腎臓、膵臓、膀胱/尿管および胃食道の癌を識別するための第一世代の分子分類体系を構築することが記載されている。Su et al.の分子分類体系は、原発腫瘍の起源が決定されていない転移癌を診断する際に有用である。Wilson et al., 2002, American Journal of Pathology 161は、節陽性(node-positive)乳癌患者の生存の低減と相関したHER2/neu陽性組織の発現サイン特性を提供している。Richer et al., 2002, The Journal of Biological Chemistry 277, p. 5209は、プロゲステロンレセプタ-A(PR-A)を過剰発現しているヒト乳癌細胞の遺伝子サイン、およびプロゲステロンレセプタ-B(PR-B)を過剰発現しているヒト乳癌細胞の遺伝子サインを提供している。Richer et al., 2002によって指摘されているとおり、これらのPRアイソフォーム(isoform)のどちらか一方の過剰は、これらの2つのPRアイソフォームの等モル濃度を有する腫瘍とは異なる予後兆候およびホルモン応答プロファイルを有する腫瘍を生じることがある。Gruvberger et al., 2001, Cancer Research 61, p. 5979は、エストロゲンレセプタの状態に基づいて腫瘍を識別することができる、DNAマイクロアレイデータに基づく分子分類を提供している。
【0008】
以上に概説した生物学的分類体系は、乳癌に対して使用可能な多くの生物学的分類体系の一部に過ぎない。また、乳癌は、関心の多くの生物学的分類の1つを表すに過ぎない。他の代表的な生物学的分類には癌一般の診断が含まれ、より一般的には病気の診断が含まれる。これらの生物学的分類体系の1つの課題は、これらの体系がそれぞれ、専用の入力(例えば形式化されたマイクロアレイデータ)を必要とすることである。したがって、生体標本を特性づける際には、それぞれの生物学的分類体系の専用の入力および出力を解読しなければならない。このような障害のため、一般に医療専門家は、このような生物学的分類体系のうちの限られた一部を使用するだけにとどまっている。
【発明の開示】
【発明が解決しようとする課題】
【0009】
したがって、以上の背景を考慮すると、当技術分野において求められているのは、標本を生物学的クラスに分類する目的に使用可能な生物学的分類体系を構築するための改良された方法である。
【0010】
本明細書におけるある参考文献の議論または引用をもって、その参考文献が本発明の先行技術であることを本明細書が認めたものと解釈してはならない。
【課題を解決するための手段】
【0011】
本発明の第1の実施形態は、中央処理装置とこの中央処理装置に結合されたメモリとを有するコンピュータを提供する。このメモリは、データを受け取るための命令を記憶しており、このデータは、ある1つの種の試験生物内または前記種の生物の試験生体標本内で測定された複数の細胞成分のうちのそれぞれの細胞成分の1つまたは複数の特性を含む。このメモリはさらに、複数のモデルのうちのある1つのモデルを演算するための命令を記憶しており、このモデルは、前記試験生物内または前記試験生体標本内の生物学的特徴の存在の有無を表すモデルスコアによって特性づけられる。このモデルの演算は、前記複数の細胞成分のうちの1つまたは複数の細胞成分の1つまたは複数の特性を使用して前記モデルスコアを決定することを含む。このメモリはさらに、演算するための前記命令を1回または数回繰り返すための命令を記憶しており、それによって前記複数のモデルが演算される。このメモリにはさらに、演算されたそれぞれの前記モデルスコアを通信するための命令が記憶されている。
【0012】
いくつかの実施形態では、通信するための前記命令によって2つ以上のモデルスコアが通信され、これらの2つ以上のモデルスコアのうちのそれぞれのモデルスコアが前記複数のモデルのうちの異なるモデルに対応する。いくつかの実施形態では、通信するための前記命令によって5つ以上のモデルスコアが通信され、これらの5つ以上のモデルスコアのうちのそれぞれのモデルスコアが前記複数のモデルのうちの異なるモデルに対応する。
【0013】
いくつかの実施形態では、データを受け取るための前記命令が、前記データをリモートコンピュータから、インターネットなどのワイドエリアネットワークを介して受け取るための命令を含む。いくつかの実施形態では、通信するための前記命令が、それぞれの前記モデルスコアをリモートコンピュータに、インターネットなどのワイドエリアネットワークを介して伝送するための命令を含む。
【0014】
いくつかの実施形態では、前記試験生物または前記試験生体標本が、前記モデルスコアが第1の値範囲にあるときに、前記複数のモデルのうちのある1つのモデルによって表される前記生物学的特徴を持つとみなされ、前記モデルスコアが第2の値範囲にあるときに、前記モデルによって表される前記生物学的特徴を持たないとみなされる。いくつかの実施形態では、前記生物学的特徴が、癌(例えば乳癌、肺癌、前立腺癌、結腸直腸癌、卵巣癌、膀胱癌、胃癌、直腸癌など)などの病気である。
【0015】
いくつかの実施形態では、前記複数のモデルが、第1のモデルスコアによって特性づけられる第1のモデルと、第2のモデルスコアによって特性づけられる第2のモデルとを含み、前記第1のモデルスコアを演算するためにその1つまたは複数の特性が使用される細胞成分の識別が、前記第2のモデルスコアを演算するためにその1つまたは複数の特性が使用される細胞成分の識別とは異なる。
【0016】
いくつかの実施形態では、前記複数のモデルのうちのある1つのモデルの前記モデルスコアを決定するために使用される1つまたは複数の細胞成分の前記1つまたは複数の特性のうちの1つの特性が、前記種の前記試験生物内または前記種の生物の前記試験生体標本内の前記1つまたは複数の細胞成分の存在量を含む。いくつかの事例では、前記種がヒトである。いくつかの事例では、前記試験生体標本が、腫瘍、血液、骨、乳房、肺、前立腺、結腸直腸、卵巣、膀胱、胃または直腸の生検材料または他の形態の試料である。
【0017】
いくつかの実施形態では、前記1つまたは複数の特性が細胞成分存在量を含み、前記データが、前記種の前記試験生物内または前記種の前記生物の前記試験生体標本内の少なくとも100個、少なくとも500個、少なくとも5,000個、または1,000から20,000個の細胞成分の細胞成分存在量を含む。いくつかの実施形態では、前記複数の細胞成分のうちの1つの細胞成分がmRNA、cRNAまたはcDNAである。
【0018】
本発明のいくつかの実施形態では、前記1つまたは複数の細胞成分のうちの1つの細胞成分が核酸またはリボ核酸であり、前記細胞成分の前記1つまたは複数の特性のうちの1つの特性が、前記試験生物内または前記試験生体標本内の前記細胞成分の全部または一部の転写状態を測定することによって得られる。いくつかの実施形態では、前記1つまたは複数の細胞成分のうちの1つの細胞成分がタンパク質であり、前記細胞成分の前記1つまたは複数の特性のうちの1つの特性が、前記試験生物内または前記試験生体標本内の前記細胞成分の翻訳状態を測定することによって得られる。いくつかの実施形態では、前記複数の細胞成分のうちの1つの細胞成分の前記1つまたは複数の特性のうちの1つの特性が、前記試験生物から得られた試料または前記試験生体標本を使用した前記細胞成分の同位体コード付け親和性標識付けおよびその後のタンデム質量分析を使用して決定される。いくつかの実施形態では、前記複数の細胞成分のうちの1つの細胞成分の前記1つまたは複数の特性のうちの1つの特性が、前記試験生物から得られた試料内または前記試験生体標本内の前記細胞成分の活性または翻訳後修飾を測定することによって決定される。
【0019】
いくつかの実施形態では、前記生物学的特徴が薬物に対する感受性である。いくつかの実施形態では、演算するための前記命令の事例によってそれらのモデルスコアが演算される前記複数のモデルが集合的に、2つ以上のそれぞれの生物学的特徴の存在の有無を表す。いくつかの実施形態では、前記2つ以上の生物学的特徴のうちのそれぞれの生物学的特徴が癌の起源である。いくつかの実施形態では、前記2つ以上の生物学的特徴が第1の病気および第2の病気を含む。
【0020】
いくつかの実施形態では、演算するための前記命令の事例によってそれらのモデルスコアが演算される前記複数のモデルが集合的に、5つ以上のそれぞれの生物学的特徴の存在の有無を表す。いくつかの事例では、前記5つ以上の生物学的特徴がそれぞれ、異なる癌起源を表す。いくつかの事例では、前記5つ以上の生物学的特徴が第1の病気および第2の病気を含む。
【0021】
いくつかの実施形態では、演算するための前記命令の事例によってそれらのモデルスコアが演算される前記複数のモデルが集合的に、2つから20個の生物学的特徴の存在の有無を表す。いくつかの実施形態では、前記2つから20個の生物学的特徴のうちのそれぞれの生物学的特徴が癌の起源である。いくつかの実施形態では、前記2つから20個の生物学的特徴が第1の病気および第2の病気を含む。
【0022】
本発明の他の態様は、中央処理装置とこの中央処理装置に結合されたメモリとを有するコンピュータを含む。このメモリは、データを受け取るための命令を記憶しており、このデータは、ある1つの種の試験生物内または前記種の生物の試験生体標本内で測定された複数の細胞成分のうちのそれぞれの細胞成分の1つまたは複数の特性を含む。このメモリはさらに、(ii)複数のモデルを演算するための命令を記憶しており、前記複数のモデルのうちのそれぞれのモデルは、前記試験生物内または前記試験生体標本内の生物学的特徴の存在の有無を表すモデルスコアによって特性づけられる。前記複数のモデルのうちのそれぞれのモデルの演算は、前記複数の細胞成分のうちの1つまたは複数の細胞成分の1つまたは複数の特性を使用して前記それぞれのモデルに関連した前記モデルスコアを決定することを含む。このメモリはさらに、演算するための前記命令の事例において演算されたそれぞれのモデルスコアを通信するための命令を記憶している。
【0023】
本発明の他の態様は、コンピュータシステムとともに使用されるコンピュータプログラム製品を含む。このコンピュータプログラム製品は、コンピュータ可読記憶媒体と、その中に埋め込まれたコンピュータプログラム機構とを含む。このコンピュータプログラム機構はデータを受け取るための命令を含む。このデータは、ある1つの種の試験生物内または前記種の生物の試験生体標本内で測定された複数の細胞成分のうちのそれぞれの細胞成分の1つまたは複数の特性を含む。このコンピュータプログラム機構はさらに、複数のモデルのうちのある1つのモデルを演算するための命令を含む。このモデルは、前記試験生物内または前記試験生体標本内の生物学的特徴の存在の有無を表すモデルスコアによって特性づけられ、このモデルの演算は、前記複数の細胞成分のうちの1つまたは複数の細胞成分の1つまたは複数の特性を使用して前記モデルスコアを決定することを含む。このコンピュータプログラム製品はさらに、演算するための前記命令を1回または数回繰り返すための命令を含み、それによって前記複数のモデルが演算される。このコンピュータプログラム製品はさらに、演算するための前記命令の事例において演算されたそれぞれのモデルスコアを通信するための命令を含む。
【0024】
本発明の他の態様は、コンピュータシステムとともに使用されるコンピュータプログラム製品を含む。このコンピュータプログラム製品は、コンピュータ可読記憶媒体と、その中に埋め込まれたコンピュータプログラム機構とを含む。このコンピュータプログラム機構はデータを受け取るための命令を含む。このデータは、ある1つの種の試験生物内または前記種の生物の試験生体標本内で測定された複数の細胞成分のうちのそれぞれの細胞成分の1つまたは複数の特性を含む。このコンピュータプログラム機構はさらに、複数のモデルを演算するための命令を含む。前記複数のモデルのうちのそれぞれのモデルは、前記試験生物内または前記試験生体標本内の生物学的特徴の存在の有無を表すモデルスコアによって特性づけられ、前記複数のモデルのうちのそれぞれのモデルの演算は、前記複数の細胞成分のうちの1つまたは複数の細胞成分の1つまたは複数の特性を使用して前記それぞれのモデルに関連した前記モデルスコアを決定することを含む。このコンピュータプログラム機構はさらに、演算するための前記命令の事例において演算されたそれぞれのモデルスコアを通信するための命令を含む。
【0025】
本発明の他の態様は、データが得られる方法を含む。このデータは、ある1つの種の試験生物内または前記種の生物の試験生体標本内で測定された複数の細胞成分のうちのそれぞれの細胞成分の1つまたは複数の特性を含む。この方法はさらに、複数のモデルのうちのある1つのモデルを演算するステップを含む。このモデルは、前記試験生物内または前記試験生体標本内の生物学的特徴の存在の有無を表すモデルスコアによって特性づけられる。前記モデルの演算は、前記複数の細胞成分のうちの1つまたは複数の細胞成分の1つまたは複数の特性を使用して前記モデルスコアを決定することを含む。この方法はさらに、前記演算を1回または数回繰り返すステップであって、それによって前記複数のモデルを演算するステップを含む。この方法はさらに、前記演算の事例において演算されたそれぞれのモデルスコアを通信するステップを含む。
【0026】
本発明の他の態様はデータを受け取るステップを含む。このデータは、ある1つの種の試験生物内または前記種の生物の試験生体標本内で測定された複数の細胞成分のうちのそれぞれの細胞成分の1つまたは複数の特性を含む。複数のモデルが演算される。前記複数のモデルのうちのそれぞれのモデルは、前記試験生物内または前記試験生体標本内の生物学的特徴の存在の有無を表すモデルスコアによって特性づけられ、前記複数のモデルのうちのそれぞれのモデルの演算は、前記複数の細胞成分のうちの1つまたは複数の細胞成分の1つまたは複数の特性を使用して前記それぞれのモデルに関連した前記モデルスコアを決定することを含む。次いで、演算の事例において演算されたそれぞれのモデルスコアが通信される。
【0027】
本発明の他の態様は、中央処理装置とこの中央処理装置に結合されたメモリとを有するコンピュータを提供する。このメモリは、データを送るための命令を記憶している。このデータは、ある1つの種の試験生物内または前記種の生物の試験生体標本内で測定された複数の細胞成分のうちのそれぞれの細胞成分の1つまたは複数の特性を含む。このメモリはさらに、複数のモデルスコアを受け取るための命令を記憶している。それぞれのモデルスコアは複数のモデルのうちの1つのモデルに対応する。前記複数のモデルのうちのそれぞれのモデルは、前記試験生物内または前記試験生体標本内の生物学的特徴の存在の有無を表すモデルスコアによって特性づけられ、前記モデルの演算は、前記複数の細胞成分のうちの1つまたは複数の細胞成分の1つまたは複数の特性を使用して前記モデルスコアを決定することを含む。
【0028】
本発明の他の態様は、中央処理装置とこの中央処理装置に結合されたメモリとを有するコンピュータを提供する。このメモリはデータを受け取るために命令を記憶しており、このデータは、ある1つの種の試験生物内または前記種の生物の試験生体標本内で測定された複数の細胞成分のうちのそれぞれの細胞成分の生物学的状態の1つまたは複数の態様を含む。このメモリはさらに、複数のモデルのうちのある1つのモデルを演算するための命令を記憶している。演算するための前記命令は、前記種の前記試験生物または前記種の前記生物の前記試験生体標本が生物学的サンプルクラスのメンバであるかどうかを指示する前記モデルのモデル特性付けを生み出す。前記モデルを演算するための前記命令は、前記複数の細胞成分のうちの1つまたは複数の細胞成分の生物学的状態の1つまたは複数の態様を使用して前記モデルを特性づけることを含む。このメモリはさらに、演算するための前記命令を1回または数回繰り返すための命令を記憶しており、それによって前記複数のモデルが演算される。このメモリはさらに、演算するための前記命令の事例において演算されたそれぞれのモデル特性付けを通信するための命令を記憶している。いくつかの実施形態では、データを受け取るための前記命令が、前記データをリモートコンピュータから、インターネットなどのワイドエリアネットワークを介して受け取るための命令を含む。いくつかの実施形態では、前記生物学的サンプルクラスが癌などの病気である。
【0029】
本発明の他の態様は、中央処理装置とこの中央処理装置に結合されたメモリとを有するコンピュータを提供する。このメモリはデータを受け取るための命令を記憶している。このデータは、ある1つの種の試験生物内または前記種の生物の試験生体標本内で測定された複数の細胞成分のうちのそれぞれの細胞成分の生物学的状態の1つまたは複数の態様を含む。このメモリはさらに、複数のモデルを演算するための命令を記憶している。この演算は、前記種の前記試験生物または前記種の前記生物の前記試験生体標本が生物学的サンプルクラスのメンバであるかどうかを指示する前記複数のモデルのうちのそれぞれのモデルのモデル特性付けを生み出す。前記演算は、前記複数の細胞成分のうちの1つまたは複数の細胞成分の生物学的状態の1つまたは複数の態様を使用して前記複数のモデルのうちのそれぞれのモデルを特性づけることを含む。このメモリはさらに、演算するための前記命令によって演算されたそれぞれのモデル特性付けを通信するための命令を記憶している。
【0030】
本発明の他の態様は、コンピュータシステムとともに使用されるコンピュータプログラム製品を提供する。このコンピュータプログラム製品は、コンピュータ可読記憶媒体と、その中に埋め込まれたコンピュータプログラム機構とを含む。このコンピュータプログラム機構はさらに、データを受け取るための命令を含む。このようなデータは、ある1つの種の試験生物内または前記種の生物の試験生体標本内で測定された複数の細胞成分のうちのそれぞれの細胞成分の生物学的状態の1つまたは複数の態様を含む。このコンピュータプログラム機構はさらに、複数のモデルのうちのある1つのモデルを演算するための命令を含む。このような演算は、前記種の前記試験生物または前記種の前記生物の前記試験生体標本が生物学的サンプルクラスのメンバであるかどうかを指示する前記モデルのモデル特性付けを生み出す。前記モデルの前記演算は、前記複数の細胞成分のうちの1つまたは複数の細胞成分の生物学的状態の1つまたは複数の態様を使用して前記モデルを特性づけることを含む。このコンピュータプログラム機構はさらに、演算するための前記命令を1回または数回繰り返すための命令であって、それによって前記複数のモデルを演算する命令を含む。このコンピュータプログラム機構はさらに、演算するための前記命令の事例において演算されたそれぞれのモデル特性付けを通信するための命令を含む。
【0031】
本発明の他の態様は、コンピュータシステムとともに使用されるコンピュータプログラム製品を含む。このコンピュータプログラム製品は、コンピュータ可読記憶媒体と、その中に埋め込まれたコンピュータプログラム機構とを含む。このコンピュータプログラム機構は、データを受け取るための命令を含む。このデータは、ある1つの種の試験生物内または前記種の生物の試験生体標本内で測定された複数の細胞成分のうちのそれぞれの細胞成分の生物学的状態の1つまたは複数の態様を含む。このコンピュータプログラム機構はさらに、複数のモデルを演算するための命令を含む。前記演算は、前記種の前記試験生物または前記種の前記生物の前記試験生体標本が生物学的サンプルクラスのメンバであるかどうかを指示する前記複数のモデルのうちのそれぞれのモデルのモデル特性付けを生み出す。前記演算は、前記複数の細胞成分のうちの1つまたは複数の細胞成分の生物学的状態の1つまたは複数の態様を使用して前記複数のモデルのうちのそれぞれのモデルを特性づけることを含む。このコンピュータプログラム機構はさらに、演算するための前記命令によって演算されたそれぞれのモデル特性付けを通信するための命令を含む。
【0032】
本発明の他の態様は、データを受け取るステップを含む方法を提供する。このようなデータは、ある1つの種の試験生物内または前記種の生物の試験生体標本内で測定された複数の細胞成分のうちのそれぞれの細胞成分の生物学的状態の1つまたは複数の態様を含む。複数のモデルのうちのある1つのモデルが演算される。前記演算は、前記種の前記試験生物または前記種の前記生物の前記試験生体標本が生物学的サンプルクラスのメンバであるかどうかを指示する前記モデルのモデル特性付けを生み出す。前記モデルの前記演算は、前記複数の細胞成分のうちの1つまたは複数の細胞成分の生物学的状態の1つまたは複数の態様を使用して前記モデルを特性づけることを含む。前記演算は1回または数回繰り返され、それによって前記複数のモデルが演算される。次いで、前記演算の事例において演算されたそれぞれの前記モデル特性付けが通信される。
【0033】
本発明の他の態様は、データを受け取るステップを含む。このデータは、ある1つの種の試験生物内または前記種の生物の試験生体標本内で測定された複数の細胞成分のうちのそれぞれの細胞成分の生物学的状態の1つまたは複数の態様を含む。複数のモデルが演算される。このような演算は、前記種の前記試験生物または前記種の前記生物の前記試験生体標本が生物学的サンプルクラスのメンバであるかどうかを指示する前記複数のモデルのうちのそれぞれのモデルのモデル特性付けを生み出す。前記演算は、前記複数の細胞成分のうちの1つまたは複数の細胞成分の生物学的状態の1つまたは複数の態様を使用して前記複数のモデルのうちのそれぞれのモデルを特性づける。演算されたそれぞれのモデル特性付けは通信される。
【0034】
全図面を通じて同様の参照符号は同様の部分を指す。
【発明を実施するための最良の形態】
【0035】
図1は、本発明の一実施形態に従って操作されるシステム10を示す。図3は、本発明で使用されるデータを記憶するのに有用なデータ構造を示す。図2は、複数のモデルを試験するために使用される本発明の一実施形態に基づく処理ステップを示す。このようなモデルは、図2に概略的に示した処理ステップを使用して、標本が1つまたは複数の生物学的特徴を有するかどうかを判定することができる。このセクションではこれらの図を参照して本発明の利点および特徴を開示する。代表的な生物学的特徴はセクション5.4で開示される。
【0036】
システム10は、少なくとも1つのコンピュータ20(図1)を含む。コンピュータ20は、中央処理装置22、プログラムモジュールおよびデータ構造を記憶するためのメモリ24、ユーザ入出力装置26、通信ネットワーク(図示せず)を介してコンピュータ20をシステム10の他のコンピュータまたはその他のコンピュータに結合するためのネットワークインタフェースカード28、ならびにこれらのコンポーネントを相互接続する1つまたは複数のバス33を含む標準コンポーネントを含む。ユーザ入出力装置26は、マウス36、ディスプレイ38、キーボード34などの1つまたは複数のユーザ入出力コンポーネントを含む。コンピュータ20はさらに、ディスクコントローラ30によって制御されたディスク32を含む。メモリ24とディスク32は協力して、本発明で使用されるプログラムモジュールおよびデータ構造を記憶する。
【0037】
メモリ24は、本発明に従って使用されるいくつかのモジュールおよびデータ構造を含む。このシステムの動作中の任意の時点において、メモリ24に記憶されるモジュールおよび/またはデータ構造の一部はランダムアクセスメモリに記憶され、モジュールおよび/またはデータ構造の他の部分は不揮発性記憶装置32に記憶されることを理解されたい。一般的な一実施形態では、メモリ24がオペレーティングシステム50を含む。オペレーティングシステム50は、さまざまな基本システムサービスを処理するための手続き、およびハードウェア依存タスクを実行するための手続きを含む。メモリ24はさらに、ファイル管理のためのファイルシステム(図示せず)を含む。いくつかの実施形態ではこのファイルシステムがオペレーティングシステム50の一コンポーネントである。
【0038】
本発明に基づく例示的なコンピュータシステムの概要に続いて、次のセクション5.1では、本発明の一実施形態に従って使用される例示的なデータ構造の概要を示す。セクション5.2では、このような例示的なデータ構造を使用して複数のモデルを試験するための処理ステップを詳細に説明する。セクション5.3では、本発明によって提供された結果の例を提示する。
【0039】
5.1. 例示的なデータ構造
本発明の一実施形態において使用される例示的なデータ構造を図1に示す。モデル試験アプリケーション52はランタイムデータベース120を使用する。ランタイムデータベース120は、ランタイム解析スキーマ(schema)300およびランタイムモデルスキーマ200を含むようにモデル化されている。これらのスキーマは、ランタイムデータベース120内の異なるいくつかのタイプのテーブルの編成を記述する。好ましい実施形態ではデータベース120が任意の形態のデータ記憶装置であり、これには、フラットファイル、リレーショナルデータベース(SQL)およびOLAPデータベース(MDXおよび/またはその異形)が含まれる。ただしこれらに限定されるわけではない。特定のいくつかの実施形態ではデータベース120が階層型OLAPキューブ(cube)である。特定のいくつかの実施形態ではデータベース120が、キューブとして記憶されるのではなしに、階層を定義するディメンションテーブル(dimension table)を有するスター(star)スキーマを含む。さらに、いくつかの実施形態ではデータベース120が、その下のデータベースまたはデータベーススキーマにおいては明示的に分割されていない(例えばディメンションテーブルが階層的に配置されていない)階層を有する。。いくつかの実施形態ではデータベース120が、Oracle、MS Access 95/97/2000またはこれらの改良物、Informix、Sybase、Interbase、IBM DB2、Paradox、dBase、SQL Anywhere、Ingres、MsSQL、MS SQL server、ANSI Level 2、PostgreSQLなどのフォーマットのデータベースである。いくつかの実施形態ではランタイムデータベース120がランタイムモデルスキーマ200およびランタイム解析スキーマ300を含む。
【0040】
ランタイムモデルスキーマ200によって指定される基本テーブルタイプはモデル202である。モデル202の目的は、生体標本(例えば腫瘍)が生物学的特徴(例えば乳癌、肺癌など)を有する可能性を判定することを試みることである。そのため、モデル202はそれぞれ生物学的特徴に関連づけられている。本明細書では生物学的特徴が、1つまたは複数の生体標本が提示する識別可能な表現型である。例えば本発明の一応用では生物学的特徴がそれぞれ、起源ないし原発腫瘍タイプを指す。癌と診断された患者の約4パーセントが、原発腫瘍の起源が確定されていない転移性腫瘍を有すると推定されている。例えばHillen, 200, Postgrad. Med. J. 76, p. 690を参照されたい。病理分析後も転移性腫瘍の原発部位がはっきりしないこともある。したがって、これらのいくつかの癌の起源の原発腫瘍部位を予測することは臨床上の重要な目的である。原発起源が不明の腫瘍の場合、代表的な生物学的サンプルクラスには、前立腺、乳房、結腸直腸、肺(腺癌および扁平上皮癌)、肝臓、胃食道、膵臓、卵巣、腎臓および膀胱/尿管の癌腫が含まれ、米国ではこれらを合わせると全ての癌関連死の約70パーセントを占める。例えばGreenlee et al., 2001, CA Cancer J. Clin. 51, p. 15を参照されたい。セクション5.4では、本発明に基づく生物学的サンプルクラスの追加の例を示す。
【0041】
モデル202を使用して、生体標本が生物学的サンプルクラスのメンバ(member)である可能性を判定する方法を例示するため、ある生物学的サンプルが肺癌を有する可能性を表す特定のモデル202のケースを考える。この肺癌モデルは生体標本に適用され、試験の結果は、生体標本が肺癌を有する可能性が高いことを指示すると仮定する。いくつかの実施形態では、ランタイムデータベース120内のそれぞれのモデル202が、それぞれのモデルを一意的に識別するモデル識別子110を含む。さらに、それぞれのモデル202は1つまたは複数の計算(calculation)204(試験とも呼ぶ)を指定する。いくつかの実施形態では1つのモデル202が2つから1000個の計算を指定する。より好ましい実施形態では、それぞれのモデル202が3つから500個、3つから100個または3つから50個の計算を指定する。
【0042】
モデル202のそれぞれの計算204は、ある細胞成分(cellular constituent)の識別を指定する。例えば一例では、それぞれの計算204が、第1の細胞成分および第2の細胞成分を指定する。例示のため、モデル202が、表1に示す4つの計算204を含むケースを考える。
【表1】

【0043】
計算1は第1の細胞成分AAAおよび第2の細胞成分DDDを指定する。以下同様である。
【0044】
計算204の指定に加え、それぞれのモデル202は、そのモデルのそれぞれの計算204を適用するために使用される計算アルゴリズム212を指定する。計算アルゴリズム212は、モデル202の計算204を演算するときの細胞成分存在量(アバンダンス:abundance)値間の演算関係を指定する。細胞成分存在量値は、モデル202が分類する生体標本から測定される。
【0045】
計算アルゴリズム212の一例は、生体標本の第1の細胞成分の存在量によって分子が決まり、生体標本の第2の細胞成分の存在量によって分母が決まる比である。この場合、計算アルゴリズム212は、これらの2つの細胞成分存在量値間の比をとることを指定し、計算204は、計算アルゴリズム212に従って計算204を演算するときに使用される試験生体標本中の細胞成分の実際の識別を指定する。例えば1つの計算アルゴリズム212は、第1の細胞成分の存在量(分子)と第2の細胞成分の存在量(分母)の比をとることを指定する。この計算アルゴリズム212は、例示的なモデル202のそれぞれの計算204で使用される。表1の計算番号1の場合、例示的な計算アルゴリズム212は、遺伝子AAAと遺伝子DDDの比をとることを指定し、計算番号2の場合、計算アルゴリズム212は遺伝子CCCと遺伝子DDDの比をとることを指定する。以下同様である。
【0046】
本発明は、第1の細胞成分と第2の細胞成分の比にとどまらず、広範囲の計算アルゴリズム212を包含する。例えばいくつかの実施形態では、計算アルゴリズム212が、第1の細胞成分の存在量値に第2の細胞成分の存在量値を乗じる(A×B)ことを指定することができる。実際、計算アルゴリズム212は、最初の2つの細胞成分の存在量値の積に第3の細胞成分の存在量値を乗じる(A×B×C)ことを指定することができる。あるいは計算アルゴリズム212は、最初の2つの細胞成分の存在量値の積を第3の細胞成分の存在量値で除する[(A×B)/C)]ことを指定することもできる。これらの例が示すとおり、計算アルゴリズムは、任意の組合せの細胞成分の任意の数値演算(例えば乗算、除算、対数など)または数値演算の集合である。計算アルゴリズム212は、所与の計算204を演算するために使用される細胞成分の実際の識別を指示しない。一方、計算204は一組の細胞成分を指定するが、計算204を演算するために使用される細胞成分間の演算関係を指示しない。計算アルゴリズム212を計算204に適用することによって、計算204を、本発明の方法に従って演算することができる。
【0047】
いくつかの実施形態では、それぞれの計算204が、その計算が属するモデル202を指定するモデル識別子110を含む。さらに、計算がそれぞれしきい値114を含む。例えば、いくつかの実施形態では、それぞれの計算204が下しきい値および上しきい値を含む。このような実施形態では、モデル202の計算アルゴリズム212を前述のようにそれぞれの計算に適用することによって、モデル202のそれぞれの計算204が演算される。演算された計算204が下しきい値よりも小さいとき、その計算は陰性と特性づけられる。演算された計算204が上しきい値よりも大きいとき、その計算は陽性と特性づけられる。演算された計算204が下しきい値と上しきい値の間にあるとき、その計算は不確定と特性づけられる。このようなしきい値を演算する方法についての追加の情報、モデルのより詳細な例および本発明に基づくそれらの使用については、「Systems and Methods for Analyzing Gene Expression Data For Clinical Diagnostics」という名称のAndersonの同時係属米国特許出願第60/507,381号、ならびに2004年6月4日出願の「Systems and Methods for Analyzing Gene Expression Data for Clinical Diagnostics」という名称のMoraledaおよびAndersonの米国特許出願(番号未定)を参照されたい。
【0048】
上および下しきい値が使用される計算(試験)を例示するため、生体標本中の遺伝子AAAの存在量([AAA])が1000、DDDの存在量([DDD])が100である場合の表1の計算1を考える。さらに、計算1は下しきい値0.8を指定し、上比しきい値は5である。計算1を含むモデル202の計算アルゴリズム212は、第1の遺伝子と第2の遺伝子の比をとることを指示する。この計算アルゴリズム212を計算204に適用すると、演算された計算(比[AAA]/[DDD])は値10(1000/100)を有する。この比は上比しきい値よりも大きいので、計算204は「陽性」と特性づけられる。
【0049】
他の例では、ある生体標本の[AAA]が値70を有し、[DDD]が値100を有する。さらに、計算1は下しきい値0.8および上しきい値5を指定する。このような例では比[AAA]/[DDD]が値0.7(70/100)を有する。この比は下しきい値よりも小さいので、この計算は「陰性」と特性づけられる。
【0050】
他の例では、ある生体標本の[AAA]が値120を有し、[DDD]が値100を有する。さらに、計算1は下しきい値0.8および上しきい値5を指定する。このような例では比[AAA]/[DDD]が値1.2(120/100)を有する。この比は下しきい値よりも大きく、上しきい値よりも小さいので、この計算は「不確定」と特性づけられる。
【0051】
計算アルゴリズム212の他に、モデル202はそれぞれ、所与のモデル202を特性づける(演算する)ためにそのモデル202の計算204をどのように組み合わせるかを指定する集約(aggregation)アルゴリズム214を含む。集約アルゴリズム214の一例は、演算したときにモデル202の中の陽性の計算の数が陰性の計算の数よりも多い場合にそのモデル202が高い確率または可能性を有すると特性づけられる投票方式(voting scheme)である。例えば、上表1の計算に計算アルゴリズム212が適用され、計算1および2が陽性、計算3が不確定、計算4が陰性であるケースを考える。これが結果のとき、表1の計算からなるモデルを使用して試験された生物は、このモデルに関連づけられた生物学的特徴を有する可能性を有すると特性づけられる。
【0052】
任意選択でモデル202はそれぞれモデル前提条件116を含む。モデル前提条件116は、そのモデルの計算204に計算アルゴリズム212が適用される前に満たされていなければならない要件を指定する。モデル前提条件116の一例は、前提条件116に関連づけられたモデル202の計算204が演算される前に所定の別のモデル202の計算204が演算される必要があることである。例えば、肺癌のためのモデル202および肺腺癌のための他のモデル202があるケースを考える。肺癌のためのモデルは、特定の腫瘍が肺癌に関して陽性かどうかを判定するために使用される。この場合、肺腺癌のためのモデル202は、肺腺癌のためのモデルが実行される前に肺癌のためのモデルが実行される必要があるという前提条件116を有することができる。前提条件116はさらに、肺癌試験のためのモデルが陽性の場合に肺腺癌のためのモデルを実行することを要求することができる。
【0053】
ランタイムモデルスキーマ200は、モデル202テーブルタイプの他に、階層的な別のテーブルを指定する。この階層の最上位には手続きタイプ220がある。手続きタイプ220はそれぞれ、計算アルゴリズム212および集約アルゴリズム214を指定する。さらに、それぞれの手続きタイプ220は任意選択で手続き識別子221を含む。
【0054】
1つまたは複数のモデル202を手続きタイプ220に関連づけることができる。モデル202が手続きタイプ220に関連づけられているとき、そのモデルは、手続きタイプ220によって指定された計算アルゴリズム212および集約アルゴリズム214を使用する。一例では、モデル202が、そのモデルが使用する手続き220の手続き識別子221を含む。このような例では、モデル202は、そのモデルが使用する計算アルゴリズム212および集約アルゴリズム214についての明示の情報を含む必要がない。このような情報は、モデル202の手続き識別子フィールド221によって指定された手続き220から得ることができるからである。
【0055】
図1に例示し先に論じたとおり、モデル202はそれぞれ1つまたは複数の計算204を含む。実際、いくつかの実施形態では、それぞれの計算204が、ランタイムモデルスキーマ200の中の他の形態のテーブルに記憶される。計算204はそれぞれ、1つまたは複数の細胞成分存在量値(図示せず)を指定する。さらに、それぞれの計算204は任意選択で、その計算204が関連づけられたモデル202を識別するモデル識別子110を含むことができる。例えばモデル識別子110は、計算204-1がモデル202-1に関連づけられていることを指示することができる。さらに、計算204はそれぞれ、計算識別子112およびしきい値114を有することができる。それぞれの計算204がモデル識別子110を含むケースでは、ランタイムデータベース120のモデル202は、このようなモデルの一部分である計算204を明示的に記述する必要がない。所与のモデル202に対する計算204が欲しい場合、このような計算204は、ランタイムデータベース120内の計算204の中からその所与のモデルに合致するモデル識別子110を有する計算を見つけ出すことによって識別することができる。
【0056】
図1に例示し先に論じたとおり、モデル202はそれぞれ1つまたは複数のモデル前提条件224を含む。実際、それぞれのモデル前提条件224は、ランタイムモデルスキーマ200の中の他の形態のデータ構造である。前提条件224はそれぞれ、その前提条件に関連づけられたモデルが実行される前に満たされる前提条件116を指定する。さらに、それぞれのモデル前提条件224は任意選択で、その前提条件が関連づけられたモデル202を識別するモデル識別子110を含むことができる。例えばモデル識別子110は、前提条件224-1がモデル202-1に関連づけられていることを指示することができる。それぞれの前提条件224がモデル識別子110を含むケースでは、ランタイムデータベース120のモデル202は、このようなモデルの一部分である前提条件224を明示的に記述する必要がない。このような例では、所与のモデル202にどの前提条件224を適用するのかを決定するため、ランタイムデータベース120内の前提条件の中からその所与のモデルに合致するモデル識別子110を有する前提条件を見つけ出す探索が実施される。
【0057】
5.2. 例示的な処理ステップ
セクション5.1では本発明の一実施形態に基づく例示的なデータ構造を紹介した。このセクションでは、このような新規のデータ構造を使用して複数のモデル202を試験する方法を説明する。セクション5.3ではこのような計算の結果が説明される。
【0058】
ステップ402
ステップ402では細胞成分特性データを得る。細胞成分特性データは一般に、遠隔地の臨床医によって提出された細胞成分存在量データファイルの形態をとる。いくつかの事例では、このデータファイルが提出されると、コンピュータ20はネットワークインタフェースカード28を介してこのファイルを受け取る。一般的な実施形態では、リモートコンピュータがこのデータを、インターネットなどのワイドエリアネットワーク(WAN)を介してコンピュータ20に伝送する。
【0059】
細胞成分特性データファイルは一般に、複数の細胞成分のうちのそれぞれの細胞成分の生物学的状態の態様(特性とも呼ぶ)を含む。例えばいくつかの実施形態では、細胞成分特性ファイルが、所与の生体標本または生物内のいくつかの細胞成分の存在量データを含む。細胞成分存在量データファイルは、所与の生体標本内の100個を超える細胞成分のデータを含むことができる。実際、細胞成分存在量データファイルは、所与の生体標本内の500個超、1000個超、10,000個超または15,000個超の細胞成分のデータを含むことができる。いくつかの実施形態では、1つの細胞成分存在量データファイルが複数の生体標本のデータを含む。このような実施形態では、このデータファイルが、ファイル内にあるそれぞれの細胞成分存在量レベルにどの生体標本が関連しているのかを明確に指示する。
【0060】
いくつかの実施形態では、細胞成分特性データファイルのフォーマットが、Affymetrix社(米カリフォルニア州Santa Clara)のGeneChipプローブアレイ用に設計されたフォーマット(例えばAffymetrix MAS4.0ソフトウェアおよびU95AまたはU133遺伝子チップを使用して生成されたCHPエクステンション付きのAffymetrixチップファイル)、Agilent社(米カリフォルニア州Palo Alto)のDNAマイクロアレイ用に設計されたフォーマット、Amersham社(英Little Chalfont)のCodeLinkマイクロアレイ用に設計されたフォーマット、Imaging Research社(カナダSt. Catharines)によるArrayVisionファイルフォーマット、Axon社(米カリフォルニア州Union City)のGenePixファイルフォーマット、BioDiscovery社(米カリフォルニア州Marina del Rey)のImaGeneファイルフォーマット、Rosetta社(米ワシントン州Kirkland)の遺伝子発現マークアップ言語(GEML)ファイルフォーマット、Incyte社(米カリフォルニア州Palo Alto)のGEMマイクロアレイ用に設計されたフォーマット、またはMolecular Dynamics社(米カリフォルニア州Sunnyvale)のcDNAマイクロアレイ用に開発されたフォーマットである。
【0061】
いくつかの実施形態では、細胞成分特性ファイルが、生体標本の処理済みのマイクロアレイ画像を含む。例えばこのような実施形態ではこのファイルが、アレイ上に表示されたそれぞれの細胞成分の細胞成分存在量情報、任意選択の背景信号情報、およびそれぞれの細胞成分に対して使用されるプローブを記述した任意選択の関連注釈情報を含む。いくつかの実施形態では、細胞成分存在量測定値が、セクション5.5で説明する転写状態測定値である。
【0062】
本発明のいくつかの実施形態では、翻訳状態、活性状態などの転写状態以外の生物学的状態の態様(特性)または生物学的状態の態様の混合物が、細胞成分特性ファイルの中に表現される。例えばセクション5.6を参照されたい。例えばいくつかの実施形態では、細胞成分特性ファイルが、調査対象の生体標本内のさまざまなタンパク質のタンパク質レベルを含む。特定のいくつかの実施形態では、細胞成分特性ファイルが、調査対象の生体標本の組織内の細胞成分の量または濃度、生体標本の1つまたは複数の組織内の細胞成分の活性レベル、あるいは生体標本の1つまたは複数の細胞成分の修飾(例えばリン酸化)状態を含む。
【0063】
本発明の一態様では生体標本内の遺伝子の発現レベルが、調査対象の生体標本の1つまたは複数の細胞内のその遺伝子に対応する少なくとも1つの細胞成分の量を測定することによって決定される。一実施形態では、測定される少なくとも1つの細胞成分の量が、生体標本の1つまたは複数の細胞内に存在する少なくとも1つのRNA種の存在量を含む。このような存在量は、遺伝子転写産物アレイ(gene transcript array)を、その生物の1つまたは複数の細胞のRNAまたはそれから得られたcDNAと接触させることを含む方法によって測定することができる。遺伝子転写産物アレイは、核酸または核酸ミミック(mimic)を付着させた表面を含む。これらの核酸または核酸ミミックは、RNA種またはそのRNA種から得られたcDNAとハイブリッドを形成する能力を有する。特定の一実施形態ではRNAの存在量が、遺伝子転写産物アレイを、調査対象の生物の1つまたは複数の細胞のRNAあるいはそのRNAから得られた核酸と接触させることによって測定され、この遺伝子転写産物アレイは、核酸または核酸ミミックを付着させた、位置によってアドレス指定可能な表面を含み、この核酸または核酸ミミックは、RNA種またはそのRNA種から得られた核酸とハイブリッドを形成する能力を有する。
【0064】
いくつかの実施形態では、細胞成分特性ファイルが、複数の遺伝子(またはそれらの複数の遺伝子に対応する細胞成分)の遺伝子発現データを含む。一実施形態では、それらの複数の遺伝子が少なくとも5つの遺伝子を含む。他の実施形態ではそれらの複数の遺伝子が、少なくとも100個、少なくとも1,000個または少なくとも20,000個の遺伝子を含み、あるいは30,000個超の遺伝子を含む。いくつかの実施形態ではそれらの複数の遺伝子が5,000個から20,000個の遺伝子を含む。
【0065】
ステップ402のいくつかの実施態様では存在量データが前処理される。いくつかの実施形態では、この前処理が、所与の生体標本の全ての細胞成分特性値を、その生体標本に対して測定されたメジアン細胞成分存在量値で除する標準化を含む。いくつかの実施形態では、所与の生体標本または生物の全ての細胞成分存在量値を、その生体標本に対して測定された細胞成分存在量値の第25百分位数(percentile)と第75百分位数の平均で除する。
【0066】
細胞成分存在量測定値の起源がマイクロアレイである場合には、ミスマッチプローブ測度が完全マッチプローブよりも大きいときに負の細胞成分存在量値が得られる。これは一般に、(細胞成分を表す)1次遺伝子が低レベルで発現されたときに起こる。代表的ないくつかのケースでは、所与の細胞成分の存在量ファイル中の存在量値の30パーセント程度が負である。本発明の前処理のいくつかの例では、0以下の値を有する全ての細胞成分の存在量値をある固定値に置き換える。細胞成分存在量測定値の起源がAffymetrix GeneChip MAS 5.0である場合、いくつかの実施形態では、負の細胞成分存在量値を20、100などの固定値に置き換えることができる。より一般には、いくつかの実施形態では、0以下の値を有する全ての細胞成分存在量値を、所与の生体標本のメジアン細胞成分存在量値の0.001から0.5までの間の固定値(例えば0.1または0.01)に置き換える。いくつかの実施形態では、全ての細胞成分の存在量値を、置き換えられている細胞成分存在量値の絶対値に反比例してメジアンと0の間を変化する値の変換によって置き換える。いくつかの実施形態では、0未満の値を有する全ての細胞成分存在量値を、それらの最初の負値の絶対値の関数に基づいて決定される値に置き換える。いくつかの例ではこの関数がS字形関数である。
【0067】
いくつかの実施形態では、コンピュータ20上のウェブページまたはコンピュータ20によってアドレス指定可能なウェブページによってステップ402が容易になる。このウェブページは、どのモデルを実行するかをリモートユーザが選択することを可能にし、遠隔地からコンピュータ20への細胞成分データファイルの転送を容易にする。いくつかの実施形態では、このウェブページが以下の任意の情報の転送を可能にする:
1つまたは複数のモデルの計算を要求している研究室の所在地、
細胞成分特性データファイルを使用して実行する1つまたは複数のモデル(モデルの組)の識別、
提出された標本を識別する一意の標本識別子、
細胞成分特性データを測定するために使用したマイクロアレイフォーマットを識別する識別子、
細胞成分特性データファイルが表す患者を識別する識別子、
細胞成分特性ファイルの細胞成分特性データを得た生体標本の説明、および/または
生体標本に対してモデルを実行するよう指示した医師または他の保健専門家の識別。
【0068】
いくつかの実施形態では、ウェブページベースのインタフェースを使用する代わりに、またはウェブページベースのインタフェースを使用する他に、起源リモートコンピュータ上でソフトウェアモジュール(図示せず)が実行される。このソフトウェアモジュールは、ファイル転送プロトコル、インターネットプロトコルまたは他のタイプのファイル共有技法を使用して、遠隔の臨床医が必要なデータをコンピュータ20にアップロードすることを可能にする。いくつかの実施形態では、秘密鍵暗号法、ハッシュ、メッセージダイジェストおよび/または公開鍵アルゴリズムなどの当技術分野で知られている暗号化アルゴリズムを使用して、ステップ402(およびステップ424)のコンピュータ20間の全ての通信が暗号化される。このような技法は例えば、それぞれその全体が参照によって本明細書に組み込まれるKaufman, Network Security, 1995, Prentice-Hall, New JerseyおよびSchneier, Applied Cryptography: Protocols, Algorithms, and Source Code in C, Second Edition, John-Wiley & Sons, Inc.に含まれている。
【0069】
ステップ404および406
ステップ404では、どのモデル202を実行(演算)するのかについての決定がなされる。例えば、いくつかのケースでは、ランタイムデータベース120内のモデル202が、複数のモデルの組に分割される。一例では、原発不明癌の試験のための一組のモデルがあり、肺癌の試験のために特に設計された他の一組のモデルがある。以下同様である。それぞれのモデル202の組は1つまたは複数のモデルを含む。したがっていくつかの事例では、ステップ404が、ユーザによって要求されたモデル202の組を決定することを含む。ステップ406では、ステップ404で選択された一組のモデルの中から1つのモデルが選択される。
【0070】
ステップ408
ステップ408は任意である。いくつかの実施形態では、ステップ408が実行されず、ステップ402でリモートユーザによって指定された全てのモデル(例えば選択された一組のモデルの中の全てのモデル)が実行される。任意選択のステップ408では、ステップ406で選択されたモデル202のモデル前提条件116が満たされているかどうかについての判定が実施される。例えば、いくつかの実施形態では、モデル前提条件116が、ステップ406の最後の事例で選択されたモデルよりも広い生物学的サンプルクラス(例えばより一般的な表現型)を示すモデル202を、相対的に狭い生物学的サンプルクラスを示すあるモデル202が実行される前に実行しなければならないことを指定することができる。例えば、特定の形態の肺癌を指示する第1のモデル202のモデル前提条件116は、第1のモデルを実行する前に、肺癌一般を指示する第2のモデル202が陽性と評価されることを要求することができる。さらに、この第2のモデル202は、このモデルを実行する前に、癌を指示する第3のモデルが陽性と評価されることを要求するモデル前提条件116を有することができる。いくつかの実施形態では、モデル前提条件116が、選択されたモデルを試験する前に複数のモデルの中の他のモデルが陰性、陽性または不確定と識別される要件を含む。前提条件116を使用してモデル202を階層に配置する方法の追加の2、3の例を以下に示す。
【0071】
第1の例では、モデルBの前提条件が、モデルBが実行される前にモデルAが特定の結果を有することを要求する。例えば、モデルAが実行されたが、モデルAが、モデルBが要求する特定の結果を与えなかったケースが考えられる。この場合、モデルBは実行されない。しかし、モデルAが実行され、モデルAが、モデルBが要求する特定の結果を与えた場合、モデルBは実行される。この例は以下のように表すことができる。
【0072】
if (A=結果), then Bを実行することができる。
【0073】
第2の例では、モデルCの前提条件116が、モデルCを実行する前に、モデルAが特定の結果を有するか、またはモデルBが特定の結果を有することを要求する。
【0074】
この例は以下のように表すことができる。
【0075】
if ((A=第1の結果) or (B=第2の結果)), then Cを実行することができる。
【0076】
例えば、モデルCは、モデルCが実行される前に、モデルAが実行され、モデルAが癌に対して陽性と評価されるか、またはモデルBが実行され、モデルBが肺癌に対して陽性と評価されることを要求することができる。あるいは、モデルCの前提条件116は、モデルAとモデルBの両方が特定の結果を達成することを要求することができる。
【0077】
if ((A=第1の結果) and (B=第2の結果)), then Cを実行することができる。
【0078】
他の例では、モデルDの前提条件116が、モデルDが実行される前にモデルCが特定の結果を有することを要求する。モデルCの前提条件116は、モデルCが実行される前に、モデルAが第1の結果を有し、モデルBが第2の結果を有することを要求する。この例は以下のように表すことができる。
【0079】
If ((A=第1の結果) and (B=第2の結果)), then Cを実行することができる。
【0080】
If (C=第3の結果), then Dを実行することができる。
【0081】
これらの例はモデル前提条件116が提供する利点を示す。本発明のこれらの新規の前提条件116のため、モデル202を、特定のモデル202が実行されてから他のモデル202が実行される階層構造として配置することができる。最初に実行されるモデル202はしばしば、広い生体標本クラス(例えば広い表現型)に生体標本を分類するように設計される。生物学的サンプルが広く分類された後、後続のモデル202が実行されて、この予備的な分類が、より狭い生物学的サンプルクラス(例えばより具体的な生物学的サンプルクラス)に再分類される。
【0082】
ステップ406で選択されたモデル202のモデル前提条件116が満たされると(408-Yes)、プロセス制御はステップ410に移る。モデル202のモデル前提条件116が満たされないと(408-No)、プロセス制御はステップ406に戻り、ステップ404で識別された一組のモデルの中から別のモデル202が選択される。
【0083】
ステップ410
ステップ410ではこのモデルの計算204が選択される。計算204は、調査対象の生体標本内でそれらの特性(細胞成分の生物学的状態の態様)が試験される2つ以上の細胞成分を識別する。例えば計算204は、遺伝子AAAおよびBBBの細胞成分存在量値を指定することができる。いくつかの実施形態では、計算が、ステップ406の最後の事例で選択されたモデル202によって表される生物学的特徴を有する標本内において、モデル202によって表される生物学的特徴を持たない生体標本内および/または異なる生物学的特徴を有する生体標本内に比べてアップレギュレートまたはダウンレギュレートされる少なくとも1つの細胞成分を指定する。
【0084】
ある生物学的特徴を有する標本内において他の生物学的特徴を有する標本内に比べてアップレギュレートまたはダウンレギュレートされる細胞成分は、ルーチンの実験によって、または発表された参考文献から得ることができる。例えばSu et al. 2001, Cancer Research 61, p. 7388は、(i)特定の原発性腫瘍タイプにおいてアップレギュレートされ、(ii)このような腫瘍タイプを予測する遺伝子の名称を提供している。Su et al.は、前立腺腫瘍で、表2に記載された細胞成分の発現を識別した。
【表2】

【0085】
いくつかの実施形態では、その生物学的特徴を有する生体標本内のその細胞成分の存在量が、複数の細胞成分存在量測定が実施されたその生物学的特徴を有する生体標本内の細胞成分の少なくとも60パーセント、少なくとも70パーセント、少なくとも80のパーセントまたは少なくとも90のパーセントの存在量よりも大きいときに、その細胞成分は、生物学的特徴を有する標本内においてアップレギュレートされているとみなされる。いくつかの実施形態では、その生物学的特徴を有する生体標本内のその細胞成分の存在量が平均して、その生物学的特徴を持たない生体標本内のその細胞成分の存在量よりも高いときに、その細胞成分は、その生物学的特徴を有する標本においてその生物学的特徴を持たない生体標本に比べてアップレギュレートされているとみなされる。いくつかの実施形態では、その生物学的特徴を有する生体標本内のその細胞成分の存在量が、複数の細胞成分存在量測定が実施されたその生物学的特徴を有する生体標本内の細胞成分の少なくとも40パーセント、少なくとも30パーセント、少なくとも20のパーセントまたは少なくとも10のパーセントの存在量よりも小さいときに、その細胞成分は、その生物学的特徴を有する標本においてダウンレギュレートされているとみなされる。いくつかの実施形態では、その生物学的特徴を有する生体標本内のその細胞成分の存在量が平均して、その生物学的特徴を持たない生体標本内のその細胞成分の存在量よりも低いときに、その細胞成分は、その生物学的サンプルまたは生物において、その生物学的特徴を持たない生物学的サンプルまたは生物に比べてダウンレギュレートされているとみなされる。
【0086】
いくつかの実施形態では、計算204の中に指定された細胞成分がそれぞれ核酸またはリボ核酸であり、生体標本内のこれらの細胞成分の存在量が、生体標本内の第1の細胞成分および第2の細胞成分の全部または一部の転写状態を測定することによって得られる。いくつかの実施形態では、計算204によって指定された細胞成分がそれぞれ独立に、mRNA、cRNAまたはcDNAの全体または断片である。いくつかの実施形態では、計算204によって指定された細胞成分がそれぞれタンパク質であり、これらの細胞成分の存在量が、細胞成分の全部または一部の翻訳状態を測定することによって得られる。いくつかの実施形態では、計算204によって指定された細胞成分の存在量が、細胞成分の活性または翻訳後修飾を測定することによって決定される。
【0087】
ステップ412
ステップ412では、ステップ410の最後の事例で選択された計算204の中に指定された細胞成分特性値を、ステップ402で提出された細胞成分特性から得る。したがって、計算204が遺伝子AAAおよび遺伝子BBBを指定する例では、遺伝子AAAおよび遺伝子BBBに対する細胞成分存在量値(または計算によって指定された他のいくつかの特性)を、細胞成分存在量ファイルから得る。
【0088】
ステップ414
ステップ414では、ステップ410の最後の事例において選択された計算204を、そのモデルの中に指定された計算アルゴリズム212に従って演算する。例えばこの計算アルゴリズムは、例示的な計算204の中に指定された第1の細胞成分の存在量値と例示的な計算204の中に指定された第2の細胞成分の存在量値との比をとることを指定することができる。計算アルゴリズム214に従って計算204を演算する追加の例は先のセクション5.1で説明した。これらの例は、計算204が演算された後で、演算されたこの計算の値に基づいて、この計算のしきい値に関して対して計算204を特性づける方法を説明する。例えば、演算された計算204は、その計算の真の最小値よりも大きい値を有する場合、演算された計算204は陽性と特性づけられる。
【0089】
ステップ416
ステップ416では、最後の計算204の演算の結果を記憶する。いくつかの実施形態では、この記憶が、計算204が実行されたモデル202を識別するモデル識別子、モデル202のどのバージョンが実行されたのかを指示するモデルバージョン識別子、計算204を演算するために使用された細胞成分特性値を供給した細胞成分特性データファイルを識別する発現データファイル識別子、計算204に関連付けられた計算識別子112 (図1)、および計算結果コード(例えば「可能性が極めて高い(extremely likely)」、「可能性が低い(not likely)」など)の記憶を含む。
【0090】
ステップ418
ステップ418では、モデル202の全ての計算204がそのモデルの計算アルゴリズム212に従って演算されたかどうかについての判定が実施される。まだ演算されていない場合(418-No)、プロセス制御はステップ410に戻り、そのモデル202の別の計算(試験)202が演算のために選択される。全て演算された場合(418-Yes)、ネットワーク制御はステップ420に移る。
【0091】
ステップ420
ステップ420では、ステップ406の最後の事例で選択されたモデルに関して実行された全ての計算(試験) 204を、モデル202によって指定された集約アルゴリズム214に従って集約する。このような集約によって、そのモデルのモデル特性付け(model characterization)が得られる。このモデル特性付けは、その種の試験生物またはその種のその生物の試験生体標本が生物学的サンプルクラスのメンバであるかどうかを指示する。
【0092】
一実施形態では、ステップ406の最後の事例で選択されたモデル202のモデル識別子と一致したモデル識別子を有するテーブル318の中のそれぞれの行の結果コードが集められる。例えばモデル202が5つの計算204を含むケースを考える。それぞれの計算204はステップ414の事例で演算されており、その結果は記憶されている。しきい値がそれぞれの計算204に関連づけられている場合、計算の結果は、その計算が陽性か、陰性かまたは不確定かに関する指示である。
【0093】
モデル202が5つの計算(試験)204を含むケースを考える。計算結果テーブル318には、5つのそれぞれの計算204に対して1つ、合計5つの行がある。これらの5つの行はそれぞれ結果コードを含む。このユーザケースシナリオでは、それぞれの結果コードが陽性、陰性または不確定である。次に、このモデル202に関連付けられた集約アルゴリズムが、このモデル202を特性づけるためにこれらの5つの結果コードをどのように組み合わせるのかを指定する。例えばこの集約アルゴリズムは、5つの結果コードを投票方式で組み合わせるよう指定することができ、その場合には、このモデルの演算された陽性の計算の数が陰性の計算の数よりも多い場合にモデル202は陽性とみなされる(陽性として特性づけられる)。
【0094】
集約アルゴリズム214の一例は、演算されたときにモデルの中の陽性の計算の数が陰性の計算の数よりも多い場合にモデル202が陽性として特性づけられる投票方式である。例えば、上表1の計算に計算アルゴリズム212が適用され、計算1および2が陽性、計算3が不確定、計算4が陰性であるケースを考える。これが結果のとき、表1の中の計算からなるモデルは陽性として特性づけられる。しかし、本発明のいくつかの実施形態では、モデルのそれぞれの陽性の計算に、そのモデルのそれぞれの陰性の計算とは異なる重みを与える重み付け方式を使用することができる。例えば、モデルの陽性の計算にはそれぞれ重み3.0を与えることができ、モデルの陰性の計算にはそれぞれ重み1.0を与えることができる。この重み付け方式では、モデルが1つの陽性の計算と2つの陰性の計算からなるときでも、そのモデルは陽性として特性づけられる。
【0095】
好ましい実施形態では、特性づけられたそれぞれのモデルが、生体標本または生物がそのモデルによって表される生物学的特徴を有する可能性を与える。この可能性は、演算されたモデルのモデルスコア(model score)を表す。言い換えると、特性づけられたそれぞれのモデルは、種の試験生物または種のその生物の試験生体標本が生物学的サンプルクラスのメンバであるかどうかを指示するモデル特性付け(例えばモデルスコア)を生み出す。いくつかの実施形態では、モデルスコアが高いほど、モデルを演算するためにそれらの細胞成分値が使用された生体標本または生物が、(i)そのモデルによって表される生物学的特徴を有し、または(ii)そのモデルによって表される生物学的サンプルクラスのメンバである可能性が高い。いくつかの実施形態では、モデルが、生体標本または生物が、そのモデルに関連した生物学的特徴を有し、またはその試験によって表される生物学的サンプルクラスのメンバである可能性が極めて高く(extremely likely)、可能性が高く(likely)、不確定(indeterminate)であり、可能性が低く(not likely)、または可能性が非常に低い(very unlikely)と判定する。いくつかの実施形態では、モデルによって表される生物学的特徴が、療法の組合せに対する感受性および/または抵抗性である。いくつかの実施形態では、モデルによって表される生物学的特徴が、生物における特定の病気の転移の可能性および/またはその病気の再発の可能性である。いくつかの実施形態では、モデルによって表される生物学的サンプルクラスが、癌および/またはセクション5.4で示される例示的な生物学的特徴である。病気の再発の可能性を追跡する実施形態では、モデルスコアを「感受性」、「低リスク」または「高リスク」などとすることができる。病気の転移の可能性を追跡する実施形態では、モデルスコアを「悪性」、「不確定」、または「非悪性」などとすることができる。病気の攻撃性を評価する実施形態では、モデルスコアを「攻撃的」、「不確定」または「不活性」などとすることができる。
【0096】
ステップ422および424
ステップ422では、所与の細胞成分存在量ファイル上の実行(演算)しなければならない一組のモデルの全てのモデルが実行されたかどうかについての判定が実施される。実行されていない場合(422-No)、プロセス制御はステップ406に戻り、別のモデル202が選択される。全てのモデルが実行された場合には、その結果が報告される(ステップ424)。いくつかの実施形態では、報告される結果が、複数のモデルの中のそれぞれのモデルの特性付けである。
【0097】
一般的な実施形態では、報告される結果が、実行された一組のモデルのそれぞれのモデル202の特性付けである。実行されたモデル202はそれぞれ、そのモデルのそれぞれの集約アルゴリズム214に従って特性づけられる。一般的な実施形態では、おおもとの細胞成分存在量ファイルを提出したリモートクライアントコンピュータに結果が報告される。ステップ424で実施される例示的な報告がセクション5.3において説明される。
【0098】
5.3. 例示的な結果
いくつかの実施形態では、ステップ424で作成された報告が、コンピュータ20から、図2のステップ402で細胞成分特性データファイルを提供したリモートコンピュータへ送られる。いくつかの実施形態ではこの報告が、以下の情報を提供するヘッダを有する。
【0099】
1つまたは複数のモデルの演算を要求した研究室の所在地、
この要求の一意の発注識別子、
提出された標本を識別する一意の標本識別子、
細胞成分特性データを測定するために使用したマイクロアレイフォーマットを識別する識別子、
ステップ402で細胞成分特性データファイルがコンピュータ20に提出された日付、
ステップ424の報告が作成された日付、
細胞成分特性データファイルが表す患者を識別する識別子、
細胞成分特性ファイルの細胞成分特性データを得た生体標本の説明、および/または
生体標本に対してモデルを実行するよう指示した医師または他の保健専門家の識別。
【0100】
下表3および4は集合的に、一組の前立腺モデルセットに対して提供された報告の一例を表す。表3および4の行はそれぞれ異なるモデルを表す。表3では、報告されたそれぞれのモデルが、そのモデルが試験するものを指示する臨床試験名、そのモデルを試験するための細胞成分を選択する際の科学的基礎を提供する研究論文(または他の形態の臨床試験)への1つまたは複数の参照、モデル結果およびモデル結果の臨床的説明を有する。表3は、(i)患者が前立腺癌の再発を被る可能性の程度または(ii)特定の形態の治療に対する患者の感受性を指示するモデルを提供する。表4は表3とは異なり、それぞれの行(モデル)が、患者が前立腺癌を有するか否かを確認する確認試験を表す。
【表3】

【表4】

【0101】
表5および6は、本発明の他の事例においてステップ424で送られた他のタイプの報告に見られた化学感受性モデルを説明する。
【表5】

【表6】

【0102】
表7および8は、本発明の他の事例においてステップ424で送られた他のタイプの報告に見られた結腸直腸モデルを説明する。
【表7】

【表8】

【0103】
表9は、本発明の他の実施形態においてステップ424で送られた他のタイプの報告に見られた一組の起源部位モデルセットを説明する。
【表9】

【0104】
5.4. 例示的な生物学的特徴
本発明を使用して、複数の生物学的特徴のうちのいずれかを生体標本が有するかどうかを判定するモデルを開発することができる。言い換えると、本発明を使用して、ある1つの種の試験生物またはある1つの種の生物の試験生体標本が生物学的サンプルクラスのメンバであるかどうかを指示するモデルを開発することができる。幅広い生物学的特徴(例えば生物学的サンプルクラス)のアレイが企図される。一例では、2つのそれぞれの生物学的特徴が、(i)野生型(wild type)状態と(ii)病気(diseased)状態である。他の例では、2つのそれぞれの生物学的特徴が、(i)第1の病気態と第2の病気状態である。他の例では、2つのそれぞれの生物学的特徴が、(i)薬物反応(drug respondent)状態と(ii)薬物非反応(drug non-respondent)状態である。このような事例では、第1のモデル202が、第1の生物学的サンプル特徴の存在の有無を試験し、第2のモデル202が、第2の生物学的サンプル特徴の存在の有無を試験する。本発明は、2つの生物学的特徴の存在の有無に関してサンプルを試験する事例に限定されない。実際、本発明の方法、本発明のコンピュータおよび本発明のコンピュータプログラム製品を使用して、任意の数の生物学的特徴(例えば1つの生物学的特徴、2つ以上の生物学的特徴、3つから10個の生物学的特徴、5つから20個の生物学的特徴、25個超の生物学的特徴など)を試験することができる。このような事例では一般に、このようなそれぞれの生物学的特徴の存在の有無を試験する(例えば、その標本が、その生物学的特徴の存在によって特性づけられる生物学的サンプルクラスのメンバであるのか、またはその生物学的特徴の不在によって特性づけられる生物学的サンプルクラスのメンバであるのかを判定する)ために、それぞれ異なるモデル202が使用される。いくつかの実施形態では、同じ生物学的特徴の存在の有無を複数のモデルが試験する。言い換えると、ある生物学的サンプルが特定の生物学的サンプルクラスのメンバであるかどうかを複数のモデルが試験する。このセクションでは例示的な生物学的特徴を説明する。所与の生物学的特徴を有する生物は、対応する生物学的サンプルクラスのメンバであるとみなすことができる。
【0105】
5.4.1 乳癌
Pusztai et al. 乳癌の治療においては異なるいくつかの補助的化学治療法(adjuvant chemotherapy regimen)が使用される。全ての治療方法が、全ての患者に対して等しく有効であるとは限らない。現在、特定の個人に対して最も有効な治療方法を選択することは不可能である。乳癌における化学療法後の再発のない長期生存の代用として受け入れられている1つのものは、新補助療法に対する完全病理学的反応(complete pathologic response:pCR)である。Pusztai et al., ASCO 2003 abstract 1は、週1回のパクシタキセル-FAC逐次新補助化学療法(T/FAC)後のpCRを予測する遺伝子発現プロファイルの発見を報告している。Pusztai et al.の予測マーカは、24例の早期乳癌の微細針吸引液から生成された。24人の患者のうち6人がpCRを達成した(25パーセント)。Pusztai el al.では、それぞれのサンプルからのRNAを、30,000のヒト転写産物からcDNAマイクロアレイ上でプロファイリングした。pCR群と残存病気(residual disease:RD)群との間で差別的に発現された遺伝子を、信号対雑音比によって選択した。リーブワンアウトクロスバリデーション(leave-one out cross validation)を使用して、最良のクラス予測アルゴリズムおよび結果予測に必要な最適な遺伝子数を定義するために、いくつかの教師あり学習法が評価された。5つの遺伝子(3つのEST、核性因子11Aおよびヒストンアセチルトランスフェラーゼ)を使用したサポートベクターマシン(support vector machine)が、推定される最大の正確さを与えた。この予測マーカセットを、T/FAC新補助療法を受けた独立の症例に対して試験した。Pusztai et al.は、バリデーションの中に含まれる21人の患者に対する結果を報告した。遺伝子発現プロファイルに基づくPusztai et al.の反応予測の正確さは全体で81パーセントであった。無病正診率は全体で93パーセントであった。有病正診率は50パーセントであった(6例のpCRのうち3例がRDとして誤分類された)。Pusztai et al.は、T/FAC手術前化学療法に対してpCRを達成すると予測された患者がpCRを経験する可能性は75パーセントであり、それに対して選択されなかった患者ではその可能性が25〜30パーセントと予想されることを見い出した。このPusztai et al.の所見を使用して、T/FAC補助的化学療法の利益を得る可能性が最も高い個々の患者を医師が選択するのを助けるモデル202を構築することができる。
【0106】
Cobleigh et al. 10個以上の陽性節(positive node)を有する乳癌患者は予後不良をきたすが、一部は長期生存する。Cobleigh et al., ASCO 2003 abstract 3415は、この高リスク患者群のディスタントディジーズフリーサバイバル(distant disease-free survival:DDFS)の予測因子を識別しようとした。1979年から1999年に診断された浸潤性の乳癌および10以上の陽性節を持つ患者が識別された。3つの10ミクロン切片からRNAを抽出し、7つの基準遺伝子および185の癌関連遺伝子の発現をRT-PCRを使用して定量化した。これらの遺伝子は、発表文献およびマイクロアレイ実験の結果に基づいて選択した。合計79人の患者が調べられた。患者の54パーセントはホルモン療法を受け、80パーセントは化学療法を受けた。メジアンフォローアップは15.1年であった。2002年8月現在、患者の77のパーセントは遠隔再発または乳癌死を経験した。臨床的変量の一変量Cox生存率分析によれば、含まれる節の数はDDFSと有意に関連していた(p=0.02)。Cobleigh et al.は、年齢、腫瘍サイズ、含まれる節、腫瘍等級、補助ホルモン療法および化学療法を含む多変量モデルを適用し、それは、DDFS時間の分散の13のパーセントを説明した。185の癌関連遺伝子の一変量Cox生存率分析によれば、いくつかの遺伝子がDDFSと関連していた(5つの遺伝子はp<0.01、16個の遺伝子はp<0.05)。HER2アダプタGrb7およびマクロファージマーカCD68に関して、より高い発現はより短いDDFSと関連していた(p<0.01)。TP53BP2(腫瘍タンパク質p53結合タンパク質2)、PrおよびBc12に関しては、より高い発現はより長いDDFSと関連していた(p<0.01)。5つの遺伝子を含む多変量モデルは、DDFS時間の分散の45のパーセントを説明した。多変量解析はさらに、遺伝子発現は、臨床的変量に対する制御後の有意な予測因子であることを指示した。このCobleigh et al.の所見を使用して、どの患者がDDFSと関連している可能性が高く、どの患者がDDFSと関連している可能性が低いのかを判定する助けとして使用することができるモデル202を構築することができる。
【0107】
van't Veer. 同じ病期の乳癌患者が、著しく異なる治療反応および全体的な予後を示すことがある。転移(予後不良)の予測因子、例えばリンパ節状態や組織学的等級は、それらの臨床的挙動に従って乳房腫瘍を正確に分類することができない。この欠点に対処するため、van't Veer 2002, Nature 415, 530-535は、117人の患者の原発性乳房腫瘍に対してDNA微量分析を使用し、教師あり分類を適用して、診断において局所リンパ節に腫瘍細胞のない(リンパ節陰性の)患者の遠隔転移までの短い間隔を強力に予測する遺伝子発現サイン(「予後不良」のサイン)を識別した。さらにvan't Veerは、BRCA1キャリヤの腫瘍を識別するサインを確立した。これらのvan't Veerの所見を使用して、患者予後を判定する助けとして使用することができるモデル202を構築することができる。
【0108】
他の参考文献 乳癌検出用のモデル202の構築に使用することができる追加の乳癌研究の代表的な例には、Soule et al., ASCO 2003 abstract 3466、Ikeda et al., ASCO 2003 abstract 34、Schneider et al., 2003, British Journal of Cancer 88, p. 96、Long et al. ASCO 2003 abstract 3410およびChang et al., 2002, PeerView Press, Abstract 1700, "Gene Expression Profiles for Docetaxel Chemosensitivity"が含まれる。ただしこれらに限定されるわけではない。
【0109】
5.4.2 肺癌
Rosell-Costa et al. ERCC1 mRNAレベルは、DNA修復能力(DNA repair capacity:DRC)およびシスプラチンに対する臨床的抵抗性と相関する。ゲムシタビン損傷後のDNA修復中にリボヌクレオチドレダクターゼ(RR)のM1またはM2サブユニットの酵素活性および遺伝子発現の変化が観察される。Rosell-Costa et al., ASCO 2003 abstract 2590は、gem/cis対gem/cis/vrb対gem/vrbおよびvrb/ifosに対してランダム化される570人の患者の試験(Alberola et al, ASCO 2001 abstract 1229)に含まれる100人のステージIV (NSCLC)患者の腫瘍生検材料から分離されたRNAの定量的PCRによって、ERCC1およびRRM1 mRNAレベルを評価した。81人の患者のERCC1およびRRM1データが使用可能であった。これらの81人の患者に対する全体反応速度、進行までの時間(time to progression:TTP)およびメジアン生存(MS)は、570人の全患者に対する結果と同様であった。ERCC1レベルとRRM1レベルの間の強い相関が見られた(P=0.00001)。gem/cisアームではERCC1およびRRM1レベルに基づく予後の有意な差が見られたが、他のアームでは見られなかった。gem/cisアームにおいて、TTPは、低いERCC1を有する患者では8.3カ月、高いERCC1を有する患者では5.1カ月であり(P=0.07)、低いRRM1を有する患者では8.3カ月、高いRRM1を有する患者では2.7カ月であり(P=0.01)、低いERCC1およびRRM1を有する患者にでは10カ月、高いERCC1およびRRM1を有する患者では4.1カ月であった(P=0.009)。MSは、低いERCC1を有する患者では13.7カ月、高いERCC1を有する患者では9.5カ月であり(P=0.19)、低いRRM1を有する患者では13.7カ月、高いRRM1を有する患者では3.6カ月であり(P=0.009)、低いERCC1およびRRM1を有する患者では到達せず、高いERCC1およびRRM1を有する患者では6.8カ月であった(P=0.004)。低いDRCを指示する低いERCC1およびRRM1レベルを有する患者は、gem/cisに対する理想的な候補であり、高いERCC1およびRRM1レベルを有する患者はより不良な予後を有する。したがって、ERCC1およびRRM1を含む比を使用して、肺癌患者にどの種類の療法を与えるべきかを決定するモデル202を構築することができる。
【0110】
Hayes et al. 肺癌の高い有病率にもかかわらず、予後および治療反応による患者のロバストな層化(stratification)は依然としてわかりにくい。肺癌遺伝子発現アレイの初期の研究は、以前には認められていない腺癌のサブクラスが存在するかもしれないことを示唆した。これらの研究は繰り返されておらず、臨床的予後とサブクラスの関連は依然として不完全である。最も大きな3つのケース系列によって示唆されるサブクラスを比較するため、Hayes et al., ASCO 2003 abstract 2526によって、366の腫瘍および正常組織サンプルを含むそれらの遺伝子発現アレイが、プールされたデータセットで解析された。共通の発現データセットをリスケールし、遺伝子フィルタリングを使用して、全てのサンプルにわたって複製対間で整合した可変の発現を有する遺伝子のサブセットを選択した。この共通データセットに対して階層クラスタリングを実行し、結果として生じたクラスタを、原著の著者によって提案されたクラスタと比較した。原分類方式と直接に比較するため、分類機構を構築し、366腫瘍のプールからのバリデーションサンプルに適用した。それぞれの解析ステップで、このバリデーションと最初に発表されたクラスとの間のクラスタリングの一致は統計的に有意だった。追加のバリデーションステップでは、最初に発表されたサブクラスを記述している遺伝子のリストが分類方式にわたって比較された。再び、腺癌サブタイプを記述するために使用される遺伝子のリストには統計学的に有意の重なりがあった。最後に、生存曲線は、一貫して低減する生存を有する腺癌の1つのサブタイプを証明した。Hayes et al.の解析は、mRNA発現プロファイリングに基づいて再生可能な腺癌サブタイプを記述することができることを確立するのを助ける。したがって、Hayes et al.の結果を使用して、腺癌サブタイプを識別するために使用することができるモデル202を構築することができる。
【0111】
5.4.3 前立腺癌
Li et al. タキソテール(Taxotere)は、前立腺癌を含む充実性腫瘍に対して抗腫瘍活性を示す。しかし、タキソテールの作用の分子機構は完全には解明されていない。ホルモン非感受性(PC3)および感受性(LNCaP)の前立腺癌細胞でのタキソテールの分子作用機構を確立するため、Affymetrix Human Genome U133Aアレイを使用することによって、包括的な遺伝子発現プロファイルが得られた。Li et al. ASCO 2003 abstract 1677を参照されたい。無処理の細胞ならびに2nMタキソテールで6、36および72時間処理した細胞の全RNAをマイクロアレイ解析にかけ、Microarray Suite and Data Mining、Cluster and TreeViewならびにOnto-expressソフトウェアを使用してデータを解析した。6時間という早い時期に遺伝子の発現のオルタネーション(alternation)が観察され、より多くの遺伝子がより長い処理で変更された。さらに、タキソテールは、LNCaP細胞とPC3細胞の間で、遺伝子発現プロファイル対する差動効果(differential effect)を示した。6、36および72時間後にPC3細胞ではそれぞれ合計166、365および1785の遺伝子が、57、823および964遺伝子のLNCaP細胞に比べて>2倍の変化を示した。Li et al.は、アンドロゲン受容体に対する効果を認めなかったが、ステロイド独立のAR活性化に関与するいくつかの遺伝子(IGFBP2、FGF13、EGF8など)のアップレギュレーションがLNCaP細胞では観察された。クラスタリング解析は、両方の細胞系統で、細胞増殖および細胞周期(サイクリンおよびCDK、Ki-67など)、信号変換(IMPA2、ERBB2IPなど)、転写因子(HMG-2、NFYB、TRIP13、PIRなど)、および腫瘍形成(STK15、CHK1、サバイビン(Survivin)など)に対する遺伝子のダウンレギュレーションを示した。対照的に、タキソテールは、アポトーシスの誘導(GADD45A、FasApo-1など)、細胞周期停止(p21CIPI、p27KIP1など)および腫瘍抑制に関係した遺伝子をダウンレギュレートした。これらの結果から、Li et al.は、タキソテールは、多数の遺伝子の変化を引き起こし、それらの多くが、タキソテールが前立腺癌細胞に影響を及ぼす分子機構に寄与する可能性があると結論づけた。この情報をさらに利用して、転移性前立腺癌の治療に対するタキソテールの治療効果を最適化する戦略を考案することができる。
【0112】
このセクションで説明した結果を使用すると、タキソテールおよび関連治療方法に対してさまざまな程度の反応(例えばタキソテールに非常に反応する第1の生物学的特徴、タキソテールに反応しない第2の生物学的特徴など)を有する群に患者を層化するモデル202を開発することができる。他の方法では、ステージD2前立腺癌において生存予測因子としての役目を果たすために、Cox-2発現に部分的に基づいて生物学的特徴を開発することができる。
【0113】
5.4.4 結腸直腸癌
Kwan et al. 結腸直腸発癌現象の発生に関与する一組の遺伝子を識別するため、Kwon et al. ASCO 2003 abstract 1104は、対応する非癌性結腸上皮を有する12の腫瘍からの結腸直腸癌細胞の遺伝子発現プロファイルを、4,608の遺伝子を表すcDNAマイクロアレイによって解析した。Kwan et al.は、2方向クラスタリング解析によってサンプルと遺伝子の両方を分類し、癌組織と非癌組織の間で差別的に発現された遺伝子を識別した。逆トランスクリプターゼPCR (RT-PCR)によって、選択された遺伝子の遺伝子発現レベルの変化が確認された。リンパ節転移に基づく遺伝子発現プロファイルが、教師あり学習法を用いて評価された。腫瘍の75パーセント超で、122の遺伝子、すなわち77のアップレギュレートされた遺伝子および45個のダウンレギュレートされた伝子について発現変化が観察された。最も頻繁に変化した遺伝子は、信号変換(19パーセント)、代謝(17パーセント)、細胞構造/運動性(14パーセント)、細胞周期( 13のパーセント)および遺伝子タンパク質発現(13のパーセント)の機能カテゴリに属した。ランダムに選択された遺伝子のRT-PCR解析は、cDNAマイクロアレイ中のそれと矛盾しない所見を示した。Kwon et al.は、クロスバリデーションループを用いて12人の患者のうちの10人の患者のリンパ節転移を予測することができた。これらのKwon et al.の結果を使用して、患者が結腸直腸癌を有するかどうかを判定するためのモデル202を開発することができる。さらに、Kwon et al.の結果を使用して、結腸直腸癌のサブクラスを識別するように拡張することもできる。
【0114】
結腸直腸癌用のモデル202(結腸直腸癌を有する生体標本を識別するモデルおよび結腸直腸癌のサブグループを予測する追加のモデルを含む)の開発に使用することができる追加の研究には、COX-2の高い発現が腫瘍誘導および進行に関連していることを見つけた研究が要約されたNasir et al., 2002, In Vivo. 16, p. 501、Longley et at., 2003 Clin. Colorectal Cancer. 2, p. 223、McDermott et al., 2002, Ann Oncol. 13, p. 235およびLongley et al., 2002, Pharmacogenomics J. 2, p. 209が含まれる。ただしこれらに限定されるわけではない。
【0115】
5.4.5 卵巣癌
Spentzos et al. 上皮性卵巣癌(EOC)における臨床的予後に関連した発現プロファイルを識別するため、Spentzos et al. ASCO 2003 abstract 1800は、最前線の白金/タキサンベースの化学療法を受けたEOCの患者の38の腫瘍サンプルを評価した。RNAプローブは、逆転写され、蛍光標識され、12675のヒト遺伝子および発現された配列タグを含むオリゴヌクレオチドアレイにハイブリッド形成された。化学感受性、無病生存(disease-free survival:DFS)および全体生存(overall survival:OS)を予測するサインに関して発現データを解析した。ベイズモデルを使用して、異なる化学感受性および生存の腫瘍間の差動発現の確率に従って遺伝子をソートした。異なる予後を有する腫瘍サブグループ間で差別的に発現される最も高い確率を有する遺伝子がそれぞれのサインには含まれた。Spentzos et al.は、化学療法抵抗性腫瘍の中で過剰発現された一組の遺伝子、および化学療法感受性腫瘍の中で過剰発現された別の一組の遺伝子を見い出した。Spentzos et al.は、短い無病生存(DFS)に関連した腫瘍内で過剰発現された45の遺伝子、および長いDFSに関連した腫瘍内で過剰発現された18の遺伝子を見つけた。これらの遺伝子は、メジアンDFS7.5カ月と30.5カ月(p<0.00001)の2つの群に患者母集団を分けた。Spentzos et al.は、短い全体生存(OS)を有する腫瘍内で過剰発現された20の遺伝子、および長いOSを有する遺伝子内で過剰発現された29の遺伝子を見つけた(メジアンOSは2カ月および40カ月、p=0.00008)。Spentzos et al.によって識別された過剰発現された遺伝子を使用して、生体標本を、化学療法抵抗性卵巣癌、化学療法感受性卵巣癌、短DFS卵巣癌、長DFS卵巣癌、短OS卵巣癌、長OS卵巣癌などの生物学的クラスに分類するモデル202を構築することができる。
【0116】
卵巣癌用のモデル202の開発に使用することができる追加の研究には、Presneau et al., 2003, Oncogene 13, p. 1568およびTakano et al. ASCO 2003 abstract 1856が含まれる。ただしこれらに限定されるわけではない。
【0117】
5.4.6 膀胱癌
Wulfing et al. アラキドン酸代謝に関与する誘導酵素Cox-2は、さまざまなヒト癌の中で一般的に過剰発現されることが示されている。最近の研究によれば、Cox-2発現は、ある腫瘍実体に対する放射線または化学療法を受けている患者において予後値(prognostic value)を有する。膀胱癌では、Cox-2発現が、生存データとあまり相関していない。これに対処するため、Wulfing et al. ASCO 2003 abstract 1621は、浸潤性膀胱癌の根治的膀胱切除を受けた157人の患者を調べた。これらのうち、61人の患者は、補助セッティングにおいてまたは転移性の病気のためにシスプラチンを含む化学療法を受けていた。モノクローナルCox-2抗体を適用しているパラフィン埋込み組織ブロックに標準免疫組織化学を実行した。半定量的結果は、臨床的および病理的データ、長期生存率(3〜177カ月)および化学療法上の詳細と相関した。26ケース(16.6パーセント)がCox-2陰性であった。全ての陽性ケース(n=131、83.4パーセント)のうち、59ケース(37.6パーセント)は低いCox-2発現を示し、53ケース(33.8パーセント)は中程度のCox-2発現を示し、19ケース(12.1パーセント)は強いCox-2発現を示した。発現は、TNMステージングおよび組織学的グレーディングとは独立していた。Cox-2発現は、腫瘍の組織学的タイプと有意に相関した(尿路上皮癌対扁平上皮癌、P=0.01)。調べた全てのケースで、カプラン-マイヤー(Kaplan-Meier)解析は、全体生存および無病生存に対する統計的な相関を示さなかった。しかし、シスプラチンを含む化学療法を受けた患者のサブグループ解析によって、Cox-2発現は、不良な全体生存期間と有意に関係していた(P=0.03)。Wulfing et al.によれば、Cox-2の免疫組織化学過剰発現は膀胱癌において非常に一般的な事象である。化学療法を受けている患者は、腫瘍内でCox-2を過剰発現するときにより悪い生存率を有するようである。したがってWulfing et al.は、Cox-2発現は、シスプラチンベースの化学療方法を用いて治療された膀胱癌の患者に対する追加の予後情報を提供することができ、これを、個々の患者における
より攻撃的な療法または選択的Cox-2阻害薬を使用したリスク適応標的療法(risk-adapted targeted therapy)の基礎とすることができることを論証した。Wulfing et al.の結果を使用して、膀胱癌母集団を治療群に層化するモデル202を開発することができる。
【0118】
5.4.7 胃癌
Terashima et al. ヒトの胃癌の化学療法抵抗性関連遺伝子を検出するため、Terashima et al., ASCO 2003 abstract 1161は、DNAマイクロアレイを使用して遺伝子発現プロファイルを調べ、結果をin vitro薬物感受性と比較した。合計16人の胃癌患者から新鮮な腫瘍組織を得、次いで、12,000のヒト遺伝子およびEST配列を含むGeneChip Human U95Av2アレイ(Affymetrix、米カリフォルニア州Santa Clara)を使用して遺伝子発現プロファイルを調べた。その所見を、ATPアッセイによって決定されたin vitro薬物感受性の結果と比較した。調べた薬物および薬物濃度は、シスプラチン(CDDP)、ドキソルビシン(DOX)、マイトマイシンC(MMC)、エトポシド(ETP)、イリノテカン(CPT、SN-38として)、5-フルオロウラシル(5-FU)、ドキシフルリジン(5'-DFUR)、パクシタキセル(TXL)およびドセタキセル(TXT)である。薬物は、それぞれの薬物のCmaxの濃度で72時間加えた。薬物感受性は、薬物処理群のATP含量と対照群のATP含量の比(T/Cパーセント)として表した。相対的な遺伝子発現量とT/Cパーセントの間のピアソン相関を評価し、さらに、この相関によって選択された遺伝子を使用してクラスタリング解析を実行した。これらの解析から、CDDPで51遺伝子、DOXで34遺伝子、MMCで26遺伝子、ETPで52遺伝子、CPTで51遺伝子、5-FUで85遺伝子、5'-DFURで42遺伝子、TXLで11遺伝子およびTXTで32遺伝子が薬物抵抗性腫瘍内でアップレギュレートされた。これらの遺伝子の大部分は、細胞成長、細胞周期調節、アポトーシス、熱ショックタンパク質またはユビキチン-プロテアソーム経路に関係した。しかし、リボソームタンパク質、CD44および伸長因子αなどのいくつかの遺伝子は、それぞれの薬剤抵抗性腫瘍内で特異的にアップレギュレートされた。Terashima et al.によって識別されたアップレギュレートされたこれらの遺伝子を使用して、胃癌の患者を診断するだけでなく、患者が薬剤抵抗性胃部腫瘍を有するかどうかの指示、および薬剤抵抗性胃部腫瘍を有する場合にはその種類を与えるモデル202を開発することができる。
【0119】
胃癌用のモデル202の開発に使用することができる追加の参考文献には、Kim et al. ASCO 2003 abstract 560、Arch-Ferrer et al. ASCO 2003 abstract 1101、Hobday ASCO 2003 abstract 1078、Song et al. ASCO 2003 abstract 1056(Rb遺伝子の過剰発現は、再発のない生存を予測する独立の予後因子である)、Leichman el al., ASCO 2003 abstract 1054 (食道癌/胃癌のケモベネフィット(chemobenefit)予測因子としてのチミジル酸シンターゼ発現)が含まれる。ただしこれらに限定されるわけではない。
【0120】
5.4.8 直腸癌
Lenz et al. 局所再発は、直腸癌の患者の臨床上の重大問題である。Lenz el al. ASCO 2003 abstract 1185は、補助的化学放射線で治療した直腸癌の患者の骨盤再発(pelvic recurrence)を予測する遺伝子プロファイルを確立することを追求した。1991〜2000年に、局所的に進んだ直腸癌を有するメジアン年齢52.1才の女性25人、男性48人、合計73人の患者を治療した。組織学的ステージングは22人の患者をステージT2として、51人の患者をステージT3として分類した。合計35人の患者はリンパ節陰性であり、38人の患者は1つまたは複数のリンパ節転移を有した。全ての患者は、癌切除を受け、その後に5-FU+骨盤放射線治療を受けた。ホルマリン固定され、パラフィンで包埋され、レーザキャプチャマイクロ切開された(laser-capture-microdissected) 組織からRNAを抽出した。Lenz et al.は、腫瘍および隣接する正常組織の5FU経路(TS、DPD)、脈管形成(VEGF)およびDNA修復(ERCC1、RAD51)に関与する遺伝子のmRNAレベルを定量的RT-PCR (Taqman)によって決定した。Lenz et al.は、局所腫瘍再発と隣接する正常組織内でのERCC1およびTSのより高いmRNA発現レベルとの間の有意な関連が、5-FU経路ならびにDNA修復および脈管形成の標的遺伝子の遺伝子発現レベルが、骨盤再発の危険性がある患者を識別するのに有用である可能性があることを示唆していることを発見した。これらのLenz et al.の結果を使用して、骨盤再発の危険性がある患者を識別するモデル202を開発することができる。
【0121】
5.4.9 追加の例示的な生物学的特徴
代表的な追加の生物学的特徴には、アクネ、先端巨大症、急性胆嚢炎、アジソン病、腺筋症、成人性成長ホルモン欠損症、成人性軟部組織肉腫、アルコール依存症、アレルギー性鼻炎、アレルギー、脱毛症、アルツハイマー病、羊水穿刺、心不全における貧血、貧血、狭心症、強直性脊椎炎、不安障害、卵巣男性胚細胞腫、不整脈、関節炎、関節炎に関係した眼の問題、喘息、アテローム性動脈硬化症、アトピー性湿疹、萎縮性膣炎、注意欠陥障害、注意障害、自己免疫疾患、亀頭包皮炎、禿頭症、バルトリン膿瘍、出生時欠損、出血障害、骨癌、脳および脊髄腫瘍、脳幹神経膠腫、脳腫瘍、乳癌、乳癌発癌リスク、乳房疾患、癌、腎臓癌、心筋症、頚動脈疾患、頚動脈内膜切除、手根管症候群、脳性麻痺、子宮頚癌、軟性下疳、水痘、小児期ネフローゼ症候群、クラミジア、慢性下痢、慢性心不全、跛行、結腸、大腸または直腸癌、結腸直腸癌、感冒、コンジローム(性器いぼ)、先天性甲状腺腫、うっ血性心不全、結膜炎、角膜疾患、角膜潰瘍、冠状動脈性心疾患、クリプトスポリジウム症、クッシング症候群、嚢胞性線維症、膀胱炎、膀胱鏡検査または尿管鏡検査、ドケルヴァン病、痴呆、うつ病、躁病、糖尿病、尿崩症、真性糖尿病、糖尿病性網膜症、ダウン症候群、青年期月経困難症、性交疼痛症、耳アレルギー、耳感染症、摂食障害、湿疹、気腫、心内膜炎、子宮内膜癌、子宮内膜症、小児期遺尿症、精巣上体炎、癲癇、会陰切開、勃起性機能不全、眼癌、致死性精神集中(fatal abstraction)、便失禁、女性性機能障害、胎児奇形、胎児性アルコール症候群、線維筋痛症、インフルエンザ、毛包炎、真菌感染、ガードネレラバジナリス(gardnerella vaginalis)、性器カンジダ症、陰部ヘルペス、妊娠糖尿病、緑内障、糸球体の病気、淋病、痛風および偽痛風、成長障害、ゴム病(gum disease)、毛髪の疾患、口臭、ハンブルゲル病(Hamburger disease)、血友病、肝炎、B型肝炎、遺伝性大腸癌、ヘルペス感染、ヒト胎盤性ラクトゲン、副甲状腺機能亢進症、高血圧症、甲状腺機能亢進症、低血糖症、性腺機能低下症、尿道下裂、甲状腺機能低下症、子宮摘出、インポテンス、不妊症、炎症性腸疾患、鼠径ヘルニア、遺伝性臓不整、眼内黒色腫、過敏性腸症候群、カポージ肉腫、白血病、肝臓癌、肺癌、肺疾患、マラリア、躁うつ病、麻疹、記憶喪失、小児期髄膜炎、月経過多、中皮腫、ミクロアルブミン、片頭痛、中間痛、口腔癌、運動障害、耳下腺炎、ナーボト嚢胞、ナルコレプシー、鼻アレルギー、鼻腔および副鼻腔癌、神経芽細胞腫、神経線維腫症、神経障害、新生児黄疸、肥満症、強迫性障害、精巣炎または精巣上体炎、口腔顔面筋機能障害、変形性関節症、骨粗鬆症、骨粗鬆症、骨肉腫、卵巣癌、卵巣嚢胞、膵臓癌、嵌頓包茎、パーキンソン病、部分癲癇、骨盤腹膜炎、消化性潰瘍、産褥性心筋症、ペーロニー病、多嚢胞性卵巣症候群、子癇前症、プレグナンジオール、月経前症候群、有痛性持続勃起症、プロラクチノーマ、前立腺癌、乾癬、リウマチ熱、唾液腺癌、SARS、性病、性腸感染症、性感染症、シーハン症候群、副鼻腔炎、皮膚癌、睡眠障害、痘瘡、嗅覚障害、いびき、社会恐怖、二分脊椎、胃癌、梅毒、精巣癌、甲状腺癌、甲状腺疾患、扁桃炎、歯の疾患、トリコモナス症、結核、腫瘍、II型糖尿病、潰瘍性大腸炎、尿路感染症、泌尿器癌、子宮フィブロイド、膣癌、膣嚢胞、外陰部痛および外陰膣炎が含まれる。ただしこれらに限定されるわけではない。
【0122】
5.5 転写状態の測定
このセクションでは、細胞成分の一型である遺伝子発現レベルを測定するための例示的ないくつかの方法を提供する。複数の生物のうちのそれぞれの生物の遺伝子発現レベルを測定する以下の特定の方法に本発明が限定されないことを当業者は理解されたい。
【0123】
5.5.1 マイクロアレイを使用した転写産物アッセイ
このセクションで説明される技法は、複数の遺伝子の発現レベルの同時決定を提供するために使用することができるポリヌクレオチドプローブアレイの提供を含む。これらの技法はさらに、このようなポリヌクレオチドプローブアレイを設計し製作するための方法を提供する。
【0124】
遺伝子内のヌクレオチド配列の発現レベルは任意の高スループット技法によって測定することができる。どのように測定されるにせよ、結果は、存在量または存在量比を表す値を含む、転写産物または反応データの絶対量または相対量である。発現プロファイルの測定は、このサブセクションで説明される転写産物アレイへのハイブリッド形成によって実施されることが好ましい。一実施形態では、「転写産物アレイ」または「プロファイリングアレイ」が使用される。転写産物アレイを使用して、細胞サンプルの発現プロファイルを解析し、特に、特定の組織タイプまたは発達状態の細胞サンプルの発現プロファイルを測定し、あるいは関心の薬物に暴露した細胞サンプルの発現プロファイルを測定することができる。
【0125】
一実施形態では、発現プロファイルが、細胞内に存在するmRNA転写産物のヌクレオチド配列を表す検出可能に標識されたポリヌクレオチド(例えば全細胞mRNAから合成された蛍光標識されたcDNA)をマイクロアレイとハイブリッド形成させることによって得られる。マイクロアレイは、細胞または生物のゲノム中のヌクレオチド配列の多く、好ましくはほとんどの遺伝子またはほぼ全ての遺伝子を表す、位置によってアドレス指定可能な支持体上の結合(例えばハイブリッド形成)部位のアレイである。このような結合部位はそれぞれ、支持体上の所定の領域に結合されたポリヌクレオチドプローブからなる。マイクロアレイはいくつかの方法で製作することができ、そのうちのいくつかを後に説明する。どのように製作されるにせよ、マイクロアレイはある特性を共有する。マイクロアレイは再生産可能であり、所与のアレイの複数のコピーを製作し、互いを容易に比較することができる。マイクロアレイは、結合(例えば核酸ハイブリッド形成)条件下で安定な材料から製作されることが好ましい。マイクロアレイは小さいことが好ましく、例えば1cm2から25cm2、好ましくは1から3cm2であることが好ましい。しかし、これよりも大きなアレイおよびこれよりも小さなアレイも企図され、これらは例えば、非常に多数のまたは非常に少数の異なるプローブを同時に評価するのに好ましい。
【0126】
マイクロアレイ内の所与の結合部位または一意の結合部位セットは、細胞または生物の単一の遺伝子内のヌクレオチド配列(例えば特定のmRNAまたはそれから得られた特定のcDNAのエキソン)と特異的に結合する(例えばハイブリッドを形成する)ことが好ましい。
【0127】
使用されるマイクロアレイは、1つまたは複数の試験プローブを含むことができ、それらはそれぞれ、検出するRNAまたはDNAの部分配列に相補的なポリヌクレオチド配列を有する。それぞれのプローブは一般に異なる核酸配列を有し、アレイの固体表面上のそれぞれのプローブの位置は通常、既知である。実際、マイクロアレイはアドレス指定可能なアレイであることが好ましく、位置によってアドレス指定可能なアレイであることがより好ましい。アレイ(例えば支持体または表面)上のそれぞれのプローブの位置からそれぞれのプローブの識別(例えば配列)を決定することができるように、アレイのそれぞれのプローブは、固体支持体上の所定の既知の位置に位置することが好ましい。いくつかの実施形態ではアレイが順序付きアレイ(ordered array)である。
【0128】
マイクロアレイまたは一組のマイクロアレイ上のプローブの密度は、異なる(例えば同一でない)プローブが1cm2あたり100個以上ある密度であることが好ましい。より好ましくは、本発明の方法で使用されるマイクロアレイが1cm2あたり少なくとも550個、1cm2あたり少なくとも1,000個、1cm2あたり少なくとも1,500個、1cm2あたり少なくとも2,000個、1cm2あたり少なくとも8,000個または1cm2あたり少なくとも15,000個のプローブを有し、あるいは1cm2あたり15,000個超のプローブを有する。したがって、本発明で使用されるマイクロアレイは、異なる(例えば同一でない)プローブを、少なくとも25,000個、少なくとも50,000個、少なくとも100,000個、少なくとも150,000個、少なくとも200,000個、少なくとも250,000個、少なくとも500,000個または少なくとも550,000個含むことが好ましい。
【0129】
一実施形態ではマイクロアレイが、アレイのそれぞれの位置が、遺伝子によってコードされた転写産物のヌクレオチド配列(例えばmRNAまたはそれから得られたcDNAのエキソン)が結合するための別個の結合部位を表すアレイ(例えばマトリックス)である。マイクロアレイ上の結合部位の集合は、複数の遺伝子のための結合部位のセットを含む。例えば、さまざまな実施形態では本発明のマイクロアレイが、生物のゲノム中の50パーセント未満の遺伝子によってコードされた産物が結合するための結合部位を含むことができる。あるいは、本発明のマイクロアレイは、生物のゲノム中の少なくとも50パーセント、少なくとも75パーセント、少なくとも85パーセント、少なくとも90パーセント、少なくとも95パーセント、少なくとも99パーセントまたは100パーセントの遺伝子によってコードされた産物が結合するための結合部位を有することができる。他の実施形態では、本発明のマイクロアレイが、生物の細胞によって発現される50パーセント未満、少なくとも50パーセント、少なくとも75パーセント、少なくとも85パーセント、少なくとも90パーセント、少なくとも95パーセント、少なくとも99パーセントまたは100パーセントの遺伝子によってコードされた産物が結合するための結合部位を有することができる。結合部位は、特定のRNAがそれと特異的にハイブリッドを形成することができるDNAまたはDNA類似体とすることができる。DNAまたはDNA類似体は例えば合成オリゴマーまたは遺伝子断片、例えばエキソンに対応する合成オリゴマーまたは遺伝子断片とすることができる。
【0130】
本発明のいくつかの実施形態では、遺伝子またはエキソンの異なる配列セグメントに相補的な異なるポリヌクレオチドを有するプローブを含む一組の結合部位によって、遺伝子または遺伝子内のエキソンがプロファイリングアレイの中に表現される。このようなポリヌクレオチドの長さは好ましくは15から200塩基、より好ましくは20から100塩基、最も好ましくは40〜60塩基である。プローブ配列はそれぞれ、その標的配列に相補的な配列に加えてリンカー配列をさらに含むことができる。本明細書で使用されるとき、リンカー配列は、その標的配列に相補的な配列と支持体の表面との間の配列である。例えば、好ましい実施形態では、本発明のプロファイリングアレイが、それぞれの標的遺伝子またはエキソンに特異的な1つのプローブを含む。しかし、所望ならば、プロファイリングアレイは、いくつかの標的遺伝子またはエキソンに特異的な少なくとも2つ、5つ、10個、100個または1000個のプローブを含み、あるいは1000個を超えるプローブを含むことができる。例えばこのアレイは、1つの遺伝子の最も長いmRNAアイソフォームの配列を横切って一塩基ステップで配置されたプローブを含むことができる。
【0131】
本発明の特定の実施形態では、エキソンが選択的にスプライシングされた複数の変異体(variant)を有するとき、エキソンプロファイリングアレイの中に、エキソンの最も長い変異体を含むゲノム領域を横切るオーバラップした連続配列、すなわちタイルドシーケンス(tiled sequence)からなる一組のポリヌクレオチドプローブを含めることができる。この一組のポリヌクレオチドプローブは、所定の塩基間隔で、例えば1、5または10塩基間隔で、オーバラップした連続配列を含むことができ、または最も長い変異体を含むmRNAにまたがることができ、または最も長い変異体を含むmRNAを横切ってタイリングされる(tiled)。したがってこのようなプローブのセットを使用して、エキソンの全ての変異体を含むゲノム領域を走査し、エキソンの発現された1つまたは複数の変異体を決定し、エキソンの発現された1つまたは複数の変形を決定することができる。あるいは、またはこれに加えて、エキソン特異プローブおよび/または変異体結合プローブ(variant junction probe)を含む一組のポリヌクレオチドプローブを、エキソンプロファイリングアレイに含めることができる。本明細書で使用されるとき、変異体結合プローブは、特定のエキソン変異体と近隣のエキソンの接合領域に特異的なプローブを指す。いくつかのケースでは、このプローブセットが、エキソンの全ての異なるそれぞれのスプライス部位配列と特異的にハイブリッド形成可能な変異体結合プローブを含む。他のケースでは、このプローブセットが、エキソンの全ての異なる変異体の中の共通配列と特異的にハイブリッドを形成することができるエキソン特異プローブ、および/またはエキソンの全ての異なるスプライス部位配列と特異的にハイブリッドを形成することができる変異体結合プローブを含む。
【0132】
いくつかのケースでは、完全長エキソンに相補的なポリヌクレオチドを含むプローブによって、エキソンプロファイリングアレイの中にエキソンが表現される。このような事例では、エキソンが、プロファイリングアレイ上の単一の結合部位によって表現される。好ましいいくつかのケースでは、エキソンが、プロファイリングアレイ上の1つまたは複数の結合部位によって表現され、結合部位はそれぞれ、標的エキソンのかなりの部分であるRNA断片に相補的なポリヌクレオチド配列を有するプローブを含む。このようなプローブの長さは通常15〜600塩基であり、好ましくは20〜200塩基、より好ましくは30〜100塩基、最も好ましくは40〜80塩基である。エキソンの平均長は約200塩基である(例えばLewin, Genes V, Oxford University Press, Oxford, 1994を参照されたい)。長さ40〜80のプローブは、これよりも短いプローブよりも特異的なエキソンの結合を可能にし、それによって標的エキソンに対するプローブの特異性を増大させる。ある種の遺伝子では、1つまたは複数の標的エキソンが、40〜80塩基よりも短い配列を有する。このようなケースでは、標的エキソンよりも長い配列を有するプローブを使用する場合、プローブ配列がmRNA内の対応する配列セグメントに相補的であるように、構成的にスプライシングされた(constitutively spliced)隣接する1つまたは複数のエキソンからの配列が両側に位置する標的エキソン全体を含む配列を含むプローブを設計することが望ましい。ゲノムフランキング配列、すなわちイントロン配列ではなく、構成的にスプライシングされた隣接する1つまたは複数のエキソンからのフランキング配列を使用することは、同じ長さの他のプローブとの比較可能なハイブリッド形成ストリンジェンシー(stringency)を可能にする。使用されるフランキング配列は、オルタナティブ経路(alternative pathway)に含まれていない構成的にスプライシングされた隣接する1つまたは複数のエキソンからのフランキング配列であることが好ましい。交差ハイブリッド形成を最小限に抑えることができるように、使用されるフランキング配列は、隣接する1つまたは複数のエキソンの配列のかなりの部分を含まないことがより好ましい。いくつかの実施形態では、所望のプローブ長よりも短い標的エキソンが選択的スプライシングに含まれるときに、選択的にスプライシングされた異なるmRNAの中のフランキング配列を含むプローブが、選択的にスプライシングされた異なるmRNAの中で発現されたエキソンの発現レベルを測定できるように設計される。
【0133】
いくつかの事例では、選択的スプライシング経路および/または別個の遺伝子内のエキソン複製が区別されるとき、DNAアレイまたはアレイセットはさらに、2つの隣接するエキソンの接合領域をまたぐ配列に相補的なプローブを含むことができる。交差ハイブリッド形成を最小限に抑えることができるように、このようなプローブが、それぞれの個々のエキソンに対するプローブと実質的にオーバラップされていない2つのエキソンからの配列を含むことが好ましい。2つ以上のエキソンからの配列を含むプローブは、1つまたは複数の選択的にスプライシングされたmRNAおよび/あるいは複製されたエキソンを含む1つまたは複数の分離された遺伝子内にそれらのエキソンがあり、他の選択的にスプライシングされたmRNAおよび/または複製されたエキソンを含む他の遺伝子の中にエキソンがない場合に、選択的スプライシング経路および/または別個の遺伝子内の複製されたエキソンの発現を区別するのに有用である。あるいは、別個の遺伝子の複製エキソンに関して、異なる遺伝子からのエキソンが配列相同性のかなりの差を示す場合には、異なる遺伝子からのエキソンを区別できるように異なるプローブを含むことが好ましい。
【0134】
複数の遺伝子の発現プロファイルをより正確に決定できるように、上記の任意のプローブ構成を組み合わせて、同じプロファイリングアレイ上および/または同じプロファイリングアレイセット内の異なるアレイ上に配置することができることは当業者には明白である。プロファイリングの異なるレベルの正確さに対してこれらの異なるプローブ構成を使用できることも当業者には明白であろう。例えば、それぞれのエキソンに対する小さなプローブセットを含むプロファイリングアレイまたはアレイセットを使用して、関連遺伝子および/またはある特定の条件下でのRNAスプライシング経路を決定することができる。次いで、関心のエキソンに対するより大きなプローブセットを含むアレイまたはアレイセットを使用して、このような特定の条件下でのエキソン発現プロファイルをより正確に決定する。異なるプローブ構成のより有利な使用を可能にする他のDNAアレイ戦略も包含される。
【0135】
本発明で使用されるマイクロアレイは、関心の薬物の作用に関連する、あるいは関心の生物学的経路中の1つまたは複数の遺伝子のエキソンのセットに対する結合部位(すなわちプローブ)を有することが好ましい。以前に論じたとおり、「遺伝子」は、RNAポリメラーゼによって転写されたDNAの一部として識別され、5非翻訳領域(「UTR」)、イントロン、エキソンおよび3UTRを含む。ゲノム内の遺伝子の数は、細胞または生物によって発現されるmRNAの数から推定し、またはゲノムのよく特性づけされた部分の外挿によって推定することができる。関心の生物のゲノムが配列決定されると、ORFの数を決定し、そのDNA配列の解析によってmRNAコード領域を識別することができる。例えば、Saccharomyces cerevisiaeのゲノムは完全に配列決定されており、それは、99アミノ酸残基よりも長い配列をコードする約6275のORFを有すると報告されている。これらのORFの解析は、タンパク質生成物をコードしそうな5,885のORFがあることを指示する(Goffeau et al., 1996, Science 274: 546-567)。対照的に、ヒトゲノムは、約30,000から130,000の遺伝子を含むと推定されている(Crollius et al., 2000, Nature Genetics 25:235-238、Ewing et al., 2000, Nature Genetics 25:232-234を参照されたい)。キイロショウジョウバエ(Drosophila)、C. elegans、植物、例えばイネおよびシロイヌナズナ(Arabidopsis)、ならびに哺乳類、例えばマウスおよびヒトを含む他の生物のゲノム配列も完成またはほとんど完成されている。したがって、本発明の好ましい実施形態では、生物のゲノム内の既知のまたは予測される全てのエキソンに対するプローブを全体で含むアレイセットが提供される。非限定的な例として、本発明は、ヒトゲノム中のそれぞれの既知のまたは予測されるエキソンに対する1つまたは2つのプローブを含むアレイセットを提供する。
【0136】
細胞のRNAに相補的なcDNAが製作され、適当なハイブリッド形成条件下でマイクロアレイにハイブリッド形成されているとき、任意の特定の遺伝子のエキソンに対応するアレイ内の部位に対するハイブリッド形成レベルは、その遺伝子から転写されたエキソンを含む1つまたは複数のmRNAのその細胞における有病率(prevalence)を反映することを理解されたい。例えば、全細胞mRNAに相補的な検出可能に標識された(例えば蛍光団を有する) cDNAがマイクロアレイにハイブリッド形成されたとき、転写されずまたは細胞のRNAスプライシング中に除去された遺伝子のエキソンに対応する(例えば遺伝子発現の1つまたは複数の産物と特異的に結合する能力を有する)アレイ上の部位は、信号(例えば蛍光信号)をほとんどまたは全く発せず、エキソンを発現しているコードされたmRNAが優勢である遺伝子のエキソンは比較的に強い信号を発する。次いで、選択的スプライシングによって同じ遺伝子から生み出された異なるmRNAの相対的な存在量が、その遺伝子に対する監視されたエキソンの完全セットを横切る信号強度パターンによって決定される。
【0137】
一実施形態では、2つの異なる条件に由来する細胞サンプルのcDNAが、2色プロトコルを使用してマイクロアレイの結合部位にハイブリッド形成される。薬物反応の場合、1つの細胞サンプルが薬物に暴露され、同じタイプの他の細胞サンプルは薬物に暴露されない。経路反応の場合、1つの細胞が経路摂動(perturbation)に暴露され、同じタイプの他の細胞サンプルは経路摂動に暴露されない。これらの2つのそれぞれの細胞タイプから得られたcDNAは、互いに区別できるように異なる方法で(例えばCy3およびCy5で)標識される。一実施形態では、例えば、薬物で処理された(または経路摂動に暴露された)細胞に由来するcDNAが、フルオレセインで標識されたdNTPを使用して合成され、薬物に暴露されていない第2の細胞からのcDNAが、ローダミンで標識されたdNTPを使用して合成される。これらの2つのcDNAが混合され、マイクロアレイにハイブリッド形成されると、それぞれのcDNAセットからの相対的な信号強度が、アレイ上のそれぞれの部位に関して決定され、特定のエキソンの存在量の相対的な差が検出される。
【0138】
先に説明した例では、薬物処理した(経路摂動に暴露した)細胞からのcDNAは蛍光団が刺激されたときに緑の蛍光を発し、無処理の細胞からのcDNAは赤い蛍光を発する。その結果、細胞内の特定の遺伝子の転写および/または転写後スプライシングに対して薬物処理が直接または間接の効果を持たないとき、両方の細胞のエキソン発現パターンは区別できず、逆転写後、赤く標識されたcDNAと緑に標識されたcDNAは等しく優勢である。マイクロアレイにハイブリッド形成されると、そのRNA種に対する結合部位は両方の蛍光団に特徴的な波長を発する。対照的に、薬物暴露された細胞が、細胞内の特定の遺伝子の転写および/または転写後スプライシングを直接または間接に変化させる薬物で処理されるとき、それぞれのエキソン結合部位に対する緑と赤の蛍光の比によって表現されるエキソン発現パターンが変化する。薬物がmRNAの有病率を増大させるとき、そのmRNAの中で発現されるそれぞれのエキソンに対するこれらの比は増大し、薬物がmRNAの有病率を低下させるとき、そのmRNAの中で発現されるそれぞれのエキソンに対するこれらの比は低下する。
【0139】
2色蛍光標識/検出方式を使用して遺伝子発現の変化を定義することは、mRNAの検出に関して、例えばあらゆる目的のためにその全体が参照によって組み込まれるSchena et al., 1995, Quantitative monitoring of gene expression patterns with a complementary DNA microarray, Science 270:467-470に記載されている。この方式は、エキソンの標識化および検出に等しく適用可能である。2つの異なる蛍光団で標識されたcDNAを使用する利点は、2つの細胞状態にあるそれぞれの遺伝子に対応するmRNAまたはエキソン発現レベルの内部的に制御された直接比較を実施でき、実験条件(例えばハイブリッド形成条件)の小さな違いに起因する変動が以降の解析に影響を及ぼさないことである。しかし、単一の細胞からのcDNAを使用し、例えば薬物処理または経路摂動を与えた細胞と未処理の細胞とで例えば特定のエキソンの絶対量を比較することもできることを理解されたい。さらに本発明では3色以上を用いた標識化も企図される。本発明のいくつかの実施形態では、異なる色の少なくとも5、10、20または100種の染料を標識化に使用することができる。このような標識化は、区別可能に標識されたcDNA母集団の同じアレイへの同時ハイブリッド形成を可能にし、したがって3つ以上のサンプルから得られたmRNA分子の発現レベルを測定し、任意選択で比較することを可能にする。使用することができる染料には、フルオレセインおよびその誘導体、ローダミンおよびその誘導体、テキサスレッド(texas red)、5カルボキシフルオレセイン(「FMA」)、2,7-ジメトキシ-4,5-ジクロロ-6-カルボキシフルオレセイン(「JOE」)、N,N,N',N'-テトラメチル-6-カルボキシローダミン(「TAMRA」)、6カルボキシ-X-ローダミン(「ROX」)、HEX、TET、IRD40およびIRD41、Cy3、Cy3.5およびCy5を含むシアニン染料、BODIPY-FL、BODIPY-TR、BODIPY-TMR、BODIPY-630/650およびBODIPY-650/670を含むBODIPY染料、ALEXA-488、ALEXA-532、ALEXA-546、ALEXA-568およびALEXA-594を含むALEXA染料、ならびに当業者に知られている他の蛍光染料が含まれる。ただしこれらに限定されるわけではない。
【0140】
本発明のいくつかの実施形態では、ハイブリッド形成レベルの平衡状態への漸進的変化を決定できるように、ハイブリッド形成データが、異なる複数のハイブリッド形成時刻に測定される。このような実施形態では、混合物が平衡状態に近く、ハイブリッドが、拡散ではなく親和力および存在量に依存した濃度にあるように、ハイブリッド形成レベルが、時刻ゼロから標識されたポリヌクレオチドによって結合されたポリヌクレオチド(すなわち1つまたは複数のプローブ)のサンプリングの必要な時間を十分に越える時刻までの範囲にまたがるハイブリッド形成時刻に測定されることが最も好ましい。しかし、標識されたポリヌクレオチドとプローブおよび/または表面との間の不可逆的な結合相互作用が起こらず、または少なくとも限定されるように、ハイブリッド形成時間は十分に短いことが好ましい。例えば、ポリヌクレオチドアレイを使用して、断片化されたポリヌクレオチドの複雑な混合物を精査する実施形態では、一般的なハイブリッド形成時間が約0〜72時間である。他の実施形態のための適当なハイブリッド形成時間は、使用される特定のポリヌクレオチド配列およびプローブに依存し、当業者はこの時間を決定することができる (例えばSambrook et al., Eds., 1989, Molecular Cloning: A Laboratory Manual, 2nd ed., Vol. 1-3, Cold Spring Harbor Laboratory, Cold Spring Harbor, New Yorkを参照されたい)。
【0141】
一実施形態では、異なるハイブリッド形成時刻のハイブリッド形成レベルが、異なる全く同じマイクロアレイ上で別々に測定される。このようなそれぞれの測定では、ハイブリッド形成レベルが測定されるときに、マイクロアレイが、好ましくは室温で、高濃度から中濃度の塩濃度(例えば0.5から3M塩濃度)を有する水溶液中で、結合されまたはハイブリッド形成された全てのポリヌクレオチドを保持し、結合していない全てのポリヌクレオチドを除去する条件下で、簡単に洗浄される。次いで、それぞれのプローブ上のハイブリッド形成された残存ポリヌクレオチド分子上の検出可能な標識を、使用される特定の標識化法に対して適当な方法によって測定する。次いで結果として生じたハイブリッド形成レベルを組み合わせてハイブリッド形成曲線を形成する。他の実施形態では、ハイブリッド形成レベルが単一のマイクロアレイを使用してリアルタイムで測定される。この実施形態では、このマイクロアレイを中断なしにサンプルにハイブリッド形成させることができ、このマイクロアレイは、それぞれのハイブリッド形成時刻に非侵襲的に問い合わされる。他の実施形態では、1つのアレイを使用し、短い時間ハイブリッド形成させ、洗浄し、ハイブリッド形成レベルを測定し、同じサンプルに戻り、別の期間ハイブリッド形成し、洗浄し、再び測定して、ハイブリッド形成時刻曲線を得ることができる。
【0142】
2つの異なるハイブリッド形成時刻の少なくとも2つのハイブリッド形成レベル、すなわち交差ハイブリッド形成平衡のタイムスケールに近いハイブリッド形成時刻における第1のハイブリッド形成レベルと、第1の時刻よりも長いハイブリッド形成時刻において測定される第2のハイブリッド形成レベルが測定されることが好ましい。交差ハイブリッド形成平衡のタイムスケールはとりわけサンプル構成およびプローブ配列に依存し、当業者はこれを決定することができる。好ましい実施形態では、第1のハイブリッド形成レベルが1時間から10時間までの間に測定され、第2のハイブリッド形成レベルが、第1のハイブリッド形成時間の2、4、6、10、12、16、18、48または72倍の時間で測定される。
【0143】
5.5.1.1 マイクロアレイ用のプローブの調製
先に述べたとおり、エキソンなどの特定のポリヌクレオチド分子が特異的にハイブリッドを形成する本発明に基づく「プローブ」は相補的なポリヌクレオチド配列である。それぞれの標的エキソンに対して1つまたは複数のプローブが選択されることが好ましい。例えば、エキソンの検出のために最低限の数のプローブが使用されるとき、プローブは通常、40塩基よりも長いヌクレオチド配列を含む。あるいは、エキソンに対して大きな冗長プローブセットが使用されるとき、プローブは通常、40〜60塩基のヌクレオチド配列を含む。プローブはさらに、完全長エキソンに相補的な配列を含むことができる。エキソンの長さは50塩基未満から200塩基超の範囲をとる。したがって、エキソンよりも長いプローブが使用されるときには、プローブ配列が標的エキソンを含む連続mRNA断片に相補的となるように、構成的にスプライシングされた隣接するエキソン配列でエキソン配列を増大させることが好ましい。これは、エキソンプロファイリングアレイのプローブの中で比較可能なハイブリッド形成ストリンジェンシーを可能にする。プローブ配列はそれぞれ、その標的配列に相補的な配列に加えてリンカー配列をさらに含むことができることを理解されたい。
【0144】
プローブは、生物のゲノム内のそれぞれの遺伝子のそれぞれのエキソンの一部に対応するDNAまたはDNA「ミミック」(例えば誘導体および類似体)を含むことができる。一実施形態では、マイクロアレイのプローブが相補RNAまたはRNAミミックである。DNAミミックは、DNAと特異的にワトソン-クリック型のハイブリッドを形成することができ、またはRNAと特異的にハイブリッドを形成することができるサブユニットからなるポリマーである。核酸は、塩基部分、糖部分またはリン酸主鎖で修飾されることができる。例示的なDNAミミックは例えばホスホロチオアートを含む。DNAは例えば、ゲノムDNA、cDNA(例えばRT-PCRによる)またはクローン配列からのエキソンセグメントのポリメラーゼ連鎖反応(PCR)増幅によって得ることができる。PCRプライマーは、固有の断片(例えばマイクロアレイ上の他の断片と、連続した全く同じ配列を10塩基を超えて共有しない断片)の増幅を与えるエキソンまたはcDNAの既知の配列に基づいて選択されることが好ましい。Oligo version 5.0(National Biosciences)などの当技術分野ではよく知られているコンピュータプログラムは、必要な特異性および最適の増幅特性を有するプライマーの設計において有用である。マイクロアレイ上のそれぞれのプローブの長さは一般に20塩基から600塩基であり、通常は30から200塩基である。PCR法は当技術分野ではよく知られており、例えばInnis et al., eds., 1990, PCR Protocols: A Guide to Methods and Applications, Academic Press Inc., San Diego, CA.に記載されている。制御されたロボットシステムが、核酸を分離し増幅するために有用であることは当業者には明白である。
【0145】
マイクロアレイのポリヌクレオチドプローブを生成する好ましい代替手段は、例えばN-ホスホナートまたはホスホルアミダイト(phosphoramidite)ケミストリを使用した合成ポリヌクレオチドまたはオリゴヌクレオチドの合成である(Froehler et al., 1986, Nucleic Acid Res. 14: 5399-5407、McBride et al., 1983, Tetrahedron Lett. 24:246-248)。合成配列の長さは一般に15から600塩基、より一般的には20から100塩基、最も好ましくは40から70塩基である。いくつかの実施形態では合成核酸が、イノシンなどの非天然塩基を含む。ただしイノシンに限定されるわけではない。先に述べたとおり、ハイブリッド形成のための結合部位として核酸類似体を使用することができる。適当な核酸類似体の例はペプチド核酸である (例えばEgholm et al., 1993, Nature 363:566-568および米国特許第5,539,083号を参照されたい)。
【0146】
代替実施形態では、ハイブリッド形成部位(すなわちプローブ)が、遺伝子、cDNA(例えば発現された配列タグ)またはそれに由来する挿入断片のプラスミドまたはファージクローンから作られる(Nguyen et al., 1995, Genomics 29:207-209)。
【0147】
5.5.1.2. 固体表面への核酸の付着
前もって形成されたポリヌクレオチドプローブを支持体上に付着させてアレイを形成することができる。あるいは、支持体上でポリヌクレオチドプローブを直接に合成してアレイを形成することもできる。プローブは固体支持体または表面に付着され、固体支持体または表面は、例えばガラス、プラスチック(例えばポリプロピレン、ナイロン)、ポリアクリルアミド、ニトロセルロース、ゲルあるいは他の多孔質または非多孔質材料から製作することができる。
【0148】
表面に核酸を付着させる好ましい1つの方法は、Schena et al., 1995, Science 270:467-470に全般的に説明されている、ガラス板上にプリントする方法である。この方法は、cDNAのマイクロアレイを調製するのに特に有用である(DeRisi et al, 1996, Nature Genetics 14:457-460、Shalon et al., 1996, Genome Res. 6: 639-645およびSchena et al., 1995, Proc. Natl. Acad. Sci. U.S.A. 93:10539-11286も参照されたい)。
【0149】
マイクロアレイを製作する好ましい第2の方法は、高密度ポリヌクレオチドアレイを製作する方法である。in situ合成のためのフォトリソグラフィ技法 (Fodor et al., 1991, Science 251:767-773、Lockhart et al., 1996, Nature Biotechnology 14:1675、米国特許第5,578,832号、5,556,752号および5,510,270号参照) または定義されたオリゴヌクレオチドの急速合成および付着のための他の方法(Blanchard et al., Biosensors & Bioelectronics 11:687-690)を使用して、定義された配列に相補的な数千個のオリゴヌクレオチドを含むアレイを表面上の定義された位置に製作する技法は知られている。これらの方法が使用されるときには、誘導体化されたガラススライドなどの表面に、既知の配列のオリゴヌクレオチド(例えば60量体)が直接に合成される。生み出されるアレイは、エキソンごとにいくつかのポリヌクレオチド分子を有する冗長アレイとすることができる。
【0150】
マスキング(Maskos and Southern, 1992, Nucl. Acids. Res. 20: 1679-1684)など、マイクロアレイを製作する他の方法を使用することもできる。原則として、先に述べたとおり、任意のタイプのアレイ、例えばナイロンハイブリッド形成膜上のドットブロット(前掲Sambrook et al.参照)を使用することができる。しかし、当業者には理解されるように、ハイブリッド形成体積がより小さくなるので、非常に小さなアレイがしばしば好ましい。
【0151】
特に好ましい一実施形態では、オリゴヌクレオチド合成用のインクジェットプリンティング装置によって本発明のマイクロアレイが製造され、これには例えば1998年9月24日公開のBlanchardの国際特許公開番号WO 98/41531、Blanchard et al., 1996, Biosensors and Bioelectronics 11:687-690、Blanchard, 1998, in Synthetic DNA Arrays in Genetic Engineering, Vol. 20, J.K. Setlow, Ed., Plenum Press, New York at pages 111-123およびBlanchardの米国特許第6,028,189号に記載された方法およびシステムが使用される。具体的には、このようなマイクロアレイ上のポリヌクレオチドプローブが、炭酸プロピレンなどの高表面張力溶媒の「微小液滴(microdroplet)」中の個々のヌクレオチド塩基を順次付着させることによって、例えばガラススライド上のアレイとして合成されることが好ましい。微小液滴は小さな体積(例えば100pl以下、より好ましくは50pl以下)を有し、(例えば疎水性ドメインによって)マイクロアレイ上で互いから分離されて、アレイ要素(例えば異なるプローブ)の位置を画定する円形の表面張力ウェル(well)を形成する。ポリヌクレオチドプローブは通常、ポリヌクレオチドの3末端での共有結合によって表面に付着される。あるいは、ポリヌクレオチドの5'末端での共有結合によってポリヌクレオチドプローブを表面に付着させることもできる (例えばBlanchard, 1998, in Synthetic DNA Arrays in Genetic Engineering 20, Setlow, Ed., Plenum Press, New York at pages 111-123を参照されたい)。
【0152】
5.5.1.3. 標的ポリヌクレオチド分子
本発明の方法および構成によって解析することができる標的ポリヌクレオチドには、メッセンジャーRNA(mRNA)分子、リボソームRNA(rRNA)分子、cRNA分子(すなわち体内(in vivo)で転写されたcDNA分子から調製されたRNA分子)およびこれらの断片などのRNA分子が含まれる。ただし解析することができるRNA分子はこれらに限定されるわけではない。本発明の方法および構成によって解析することができる標的ポリヌクレオチドにはさらに、ゲノムDNA分子などのDNA分子、cDNA分子、オリゴヌクレオチド、およびEST、STSなどを含むこれらの断片が含まれる。ただしこれに限定されるわけではない。
【0153】
標的ポリヌクレオチドは任意の起源のポリヌクレオチドとすることができる。標的ポリヌクレオチド分子は例えば、生物から分離されたゲノムDNAまたはゲノム外DNA分子、生物から分離されたmRNA分子などのRNA分子などの天然核酸分子とすることができる。あるいは標的ポリヌクレオチド分子は、例えば酵素によって体内(in vivo)または対外(in vitro)で合成されたcDNA分子などの核酸分子、またはPCRによって合成されたポリヌクレオチド分子、体外(in vitro)転写によって合成されたRNA分子などを含む合成ポリヌクレオチド分子とすることもできる。標的ポリヌクレオチドのサンプルは、DNA分子、RNA分子またはDNAとRNAの共重合体分子を含むことができる。好ましい実施形態では、本発明の標的ポリヌクレオチドが、特定の遺伝子または特定の遺伝子転写産物(細胞内で発現された特定のmRNA配列またはこのようなmRNA配列から得られた特定のcDNA配列)に対応する。しかし多くの実施形態、特にポリヌクレオチド分子が哺乳類の細胞から得られる実施形態では、標的ポリヌクレオチドが、遺伝子転写産物の特定の断片に対応することができる。例えば標的ポリヌクレオチドは、例えばその遺伝子の異なるスプライス変異体を検出し、かつ/または解析することができるように、同じ遺伝子の異なるエキソンに対応することができる。
【0154】
好ましい実施形態では、解析される標的ポリヌクレオチドが、細胞から抽出された核酸から体外(in vitro)で調製される。例えば一実施形態では、細胞からRNA(例えば全細胞RNA、poly(A)+メッセンジャーRNAまたはこれらの部分)が抽出され、メッセンジャーRNAが、抽出された全RNAから精製される。全RNAおよびpoly(A)+ RNAを調製する方法は当技術分野でよく知られており、例えば前掲Sambrook et al.に全般的に説明されている。一実施形態では、RNAが、本発明の関心のさまざまなタイプの細胞から、グアニジニウムチオシアナート溶解ならびにその後のCsCl遠心処理およびオリゴdt精製(Chirgwin et al., 1979, Biochemistry 18:5294-5299)を使用して抽出される。他の実施形態では、RNAが、グアニジニウムチオシアナート溶解およびその後のRNeasyカラム(Qiagen)上での精製を使用して細胞から抽出される。次いで、精製されたmRNAから、例えばoligo-dTまたはランダムプライマーを使用してcDNAが合成される。好ましい実施形態では、標的ポリヌクレオチドが、細胞から抽出され精製されたメッセンジャーRNAから調製されたcRNAである。本明細書ではcRNAが、起源RNAに相補的なRNAと定義される。抽出されたRNAは、RNAポリメラーゼプロモータに結合されたプライマーを使用してRNAから2本鎖cDNAが、アンチセンスRNAの転写を導くことができる方向に合成されるプロセスを使用して増幅される。次いで、RNAポリメラーゼを使用して、この2本鎖cDNAの第2の鎖からアンチセンスRNAまたはcRNAが転写される(例えば米国特許第5,891,636号、5,716,785号、5,545,522号および6,132,997号、さらに米国特許第6,271,002号、ならびにZiman他によって2000年11月28日に出願された米国仮特許出願番号60/253,641を参照されたい)。RNAポリメラーゼプロモータまたはその補体を含む、オリゴdTプライマー(米国特許第5,545,522号および6,132,997号)またはランダムプライマー(Ziman他によって2000年11月28日に出願された米国仮特許出願番号60/253,641)を使用することができる。標的ポリヌクレオチドは、細胞の本来の核酸母集団を表す短くかつ/または断片化されたポリヌクレオチド分子であることが好ましい。
【0155】
本発明の方法および構成によって解析される標的ポリヌクレオチドは検出可能に標識されることが好ましい。例えばcDNAは、例えばヌクレオチド類似体を用いて直接に標識し、または例えば第1の鎖をテンプレートとして使用して標識された第2のcDNA鎖を合成することによって間接的に標識することができる。あるいは、2本鎖cDNAをcRNAに転写し、標識することもできる。
【0156】
検出可能な標識は、例えばヌクレオチド類似体の取込みによる蛍光標識であることが好ましい。本発明で使用するのに適した他の標識には、ビオチン、イミノビオチン、抗原、補因子、ジニトロフェノール、リポ酸、オレフィン化合物、検出可能なポリペプチド、高電子分子、基質に対する作用によって検出可能な信号を生成することができる酵素、および放射性同位元素が含まれる。ただしこれらに限定されるわけではない。好ましい放射性同位元素には32P、35S、14C、15Nおよび125Iが含まれる。本発明に適した蛍光分子には、フルオレセインおよびその誘導体、ローダミンおよびその誘導体、テキサスレッド、5カルボキシフルオレセイン(FMA」)、2,7-ジメトキシ-4,5-ジクロロ-6-カルボキシフルオレセイン(「JOE」)、N,N,N',N'-テトラメチル-6-カルボキシローダミン(「TAMRA」)、6カルボキシ-X-ローダミン(「ROX」)、HEX、TET、IRD40およびIRD41が含まれる。ただしこれらに限定されるわけではない。本発明に適した蛍光分子にはさらに、Cy3、Cy3.5およびCy5を含むシアミン染料、BODIPY-FL、BODIPY-TR、BODIPY-TMR、BODIPY-630/650およびBODIPY-650/670を含むBODIPY染料; ALEXA-488、ALEXA-532、ALEXA-546、ALEXA-568およびALEXA-594を含むALEXA染料、ならびに当業者に知られている他の蛍光染料が含まれる。ただしこれらに限定されるわけではない。本発明に適した高電子インジケータ分子には、フェリチン、ヘモシアニンおよびコロイド金が含まれる。ただしこれらに限定されるわけではない。あるいは、より好ましくない実施形態では、標的ポリヌクレオチドを第1の基で特異的に錯体化することによって標的ポリヌクレオチドを標識することもできる。第1の基に対して親和性を有し、インジケータ分子に共有結合した第2の基を使用して、標的ポリヌクレオチドを間接的に検出することができる。このような一実施形態では、第1の基として使用するのに適した化合物に、ビオチンおよびイミノビオチンが含まれる。ただしこれらに限定されるわけではない。第2の基として使用するのに適した化合物にはアビジンおよびストレプトアビジンが含まれる。た
だしこれらに限定されるわけではない。
【0157】
5.5.1.4. マイクロアレイとのハイブリッド形成(ハイブリダイゼイション)
前述のとおり、核酸ハイブリッド形成条件および洗浄条件は、本発明によって解析されるポリヌクレオチド分子(本明細書では「標的ポリヌクレオチド分子」と呼ぶ)が、アレイの相補ポリヌクレオチド配列、好ましくはその相補DNAが位置する特定のアレイ部位に特異的に結合し、またはこれと特異的にハイブリダイズするように選択される。
【0158】
2本鎖プローブDNAをその表面に含むアレイは、標的ポリヌクレオチド分子と接触させる前にDNAを1本鎖にするために、変性条件にかけることが好ましい。1本鎖プローブDNA(例えば合成オリゴデオキシリボ核酸)を含むアレイは、例えば自己相補列に起因して形成するヘアピンまたはダイマーを除去するために、標的ポリヌクレオチド分子と接触させる前に変性させる必要がある場合がある。
【0159】
最適なハイブリッド形成条件は、プローブおよび標的核酸の長さ(例えばオリゴマーおよび200塩基超のポリヌクレオチド)およびタイプ(例えばRNAまたはDNA)に依存する。核酸に対する特異的な(すなわちストリンジェントな)ハイブリッド形成条件のための一般的なパラメータは、Sambrook et al.(前掲)およびAusubel et al., 1987, Current Protocols in Molecular Biology, Greene Publishing and Wiley-Interscience, New Yorkに記載されている。Schena et al.のcDNAマイクロアレイが使用されるとき、一般的なハイブリッド形成条件は、65℃の5 X SSC+0.2%SDS中で4時間ハイブリッド形成させ、次いで25℃の低ストリンジェンシー洗浄緩衝液(1 X SSC+0.2%SDS)中で洗浄し、次いで25℃の高ストリンジェンシー洗浄緩衝液(0.1 X SSC+0.2%SDS)中で10分間洗浄する条件である(Schena et al., 1996, Proc. Natl. Acad. Sci. U.S.A. 93:10614)。有用なハイブリッド形成条件は、例えばTijessen, 1993, Hybridization With Nucleic Acid Probes, Elsevier Science Publishers B.V.およびKricka, 1992, Nonisotopic DNA Probe Techniques, Academic Press, San Diego, CA.にも出ている。
【0160】
本発明のスクリーニングおよび/またはシグナリングチップとともに使用される特に好ましいハイブリッド形成条件は、プローブの平均融解温度またはその付近(例えば5℃C以内、より好ましくは2℃以内)の温度の1M NaCl、50mM MES緩衝液(pH6.5)、0.5%ナトリウムサルコシンおよび30パーセントホルムアミド中でのハイブリッド形成を含む。
【0161】
5.5.1.5. 信号検出およびデータ解析
細胞のRNAに相補的な標的配列、例えばcDNAまたはcRNAが製作され、適当なハイブリッド形成条件下でマイクロアレイにハイブリッド形成されているとき、任意の特定の遺伝子のエキソンに対応するアレイ内の部位に対するハイブリッド形成レベルは、その遺伝子から転写されたエキソンを含む1つまたは複数のmRNAのその細胞における有病率を反映することを理解されたい。例えば、全細胞mRNAに相補的な検出可能に標識された(例えば蛍光団を有する) cDNAがマイクロアレイにハイブリッド形成されたとき、転写されずまたは細胞のRNAスプライシング中に除去された遺伝子のエキソンに対応する(すなわち遺伝子発現の1つまたは複数の産物と特異的に結合する能力を有する)アレイ上の部位は、信号(例えば蛍光信号)をほとんどまたは全く発せず、エキソンを発現しているコードされたmRNAが優勢である遺伝子のエキソンは比較的に強い信号を発する。次いで、選択的スプライシングによって同じ遺伝子から生み出された異なるmRNAの相対的な存在量が、その遺伝子に対する監視されたエキソンの完全セットを横切る信号強度パターンによって決定される。
【0162】
好ましい実施形態では、2つの異なる細胞からの標的配列、例えばcDNAまたはcRNAが、マイクロアレイの結合部位にハイブリッド形成される。薬物反応の場合、1つの細胞サンプルが薬物に暴露され、同じタイプの他の細胞サンプルは薬物に暴露されない。経路反応の場合、1つの細胞が経路摂動(perturbation)に暴露され、同じタイプの他の細胞サンプルは経路摂動に暴露されない。これらの2つのそれぞれの細胞タイプから得られたcDNAまたはcRNAは、互いに区別できるように異なる方法で標識される。一実施形態では、例えば、薬物で処理された(または経路摂動に暴露された)細胞に由来するcDNAが、フルオレセインで標識されたdNTPを使用して合成され、薬物に暴露されていない第2の細胞からのcDNAが、ローダミンで標識されたdNTPを使用して合成される。これらの2つのcDNAが混合され、マイクロアレイにハイブリッド形成されると、それぞれのcDNAセットからの相対的な信号強度が、アレイ上のそれぞれの部位に関して決定され、特定のエキソンの存在量の相対的な差が検出される。
【0163】
先に説明した例では、薬物処理した(経路摂動に暴露した)細胞からのcDNAは蛍光団が刺激されたときに緑の蛍光を発し、無処理の細胞からのcDNAは赤い蛍光を発する。その結果、細胞内の特定の遺伝子の転写および/または転写後スプライシングに対して薬物処理が直接または間接の効果を持たないとき、両方の細胞のエキソン発現パターンは区別できず、逆転写後、赤く標識されたcDNAと緑に標識されたcDNAは等しく優勢である。マイクロアレイにハイブリッド形成されると、そのRNA種に対する結合部位は両方の蛍光団に特徴的な波長を発する。対照的に、薬物暴露された細胞が、細胞内の特定の遺伝子の転写および/または転写後スプライシングを直接または間接に変化させる薬物で処理されるとき、それぞれのエキソン結合部位に対する緑と赤の蛍光の比によって表現されるエキソン発現パターンが変化する。薬物がmRNAの有病率を増大させるとき、そのmRNAの中で発現されるそれぞれのエキソンに対するこれらの比は増大し、薬物がmRNAの有病率を低下させるとき、そのmRNAの中で発現されるそれぞれのエキソンに対するこれらの比は低下する。
【0164】
2色蛍光標識/検出方式を使用して遺伝子発現の変化を定義することは、mRNAの検出に関して、例えばあらゆる目的のためにその全体が参照によって組み込まれるSchena et al., 1995, Science 270:467-470に記載されている。この方式は、エキソンの標識化および検出に等しく適用可能である。2つの異なる蛍光団で標識された標的配列、例えばcDNAまたはcRNAを使用する利点は、2つの細胞状態にあるそれぞれの遺伝子に対応するmRNAまたはエキソン発現レベルの内部的に制御された直接比較を実施でき、実験条件(例えばハイブリッド形成条件)の小さな違いに起因する変動が以降の解析に影響を及ぼさないことである。しかし、単一の細胞からのcDNAを使用し、例えば薬物処理または経路摂動を与えた細胞と未処理の細胞とで例えば特定のエキソンの絶対量を比較することもできることを理解されたい。
【0165】
蛍光標識されたプローブが使用される場合、転写産物アレイのそれぞれの部位での蛍光放射は、走査共焦点レーザ顕微鏡によって検出することができる。一実施形態では、使用される2つのそれぞれの蛍光団に対して、適当な励起線を使用した別個の走査が実施される。あるいは、2つの蛍光団に特異的な波長の同時標本照射を可能にするレーザを使用することもでき、2つの蛍光団からの放射を同時に解析することができる(Shalon et al., 1996, Genome Res, 6:639-645参照)。好ましい一実施形態では、コンピュータ制御のX-Yステージおよび顕微鏡対物レンズを有するレーザ蛍光スキャナでアレイが走査される。これらの2つの蛍光団の順次励起が、マルチライン混合ガスレーザによって達成され、放出光は波長によって分割され、2つの光電子増倍管で検出される。このような蛍光レーザ走査装置は例えばSchena et al., 1996, Genome Res. 6: 639-645に記載されている。あるいは、Ferguson et al., 1996, Nature Biotech. 14:1681-1684によって記述されている光ファイバ束を使用して、多数の部位でmRNA存在量レベルを同時に監視することもできる。
【0166】
信号は記録され、好ましい一実施形態では、信号が、例えば12ビットアナログ-ディジタルボードを使用してコンピュータによって解析される。一実施形態では、走査画像が、グラフィックスプログラム(例えばHijaak Graphics Suite)を使用してスペックル除去(despeckling)され、走査画像は次いで、それぞれの部位のそれぞれの波長の平均ハイブリッド形成のスプレッドシートを作成する画像グリド(image gridding)プログラムを使用して解析される。必要ならば、2つの蛍光体のチャネル間の「クロストーク」(またはオーバラップ)の実験的に決定された補正を実施することができる。転写産物アレイ上の任意の特定のハイブリッド形成部位に関して、これらの2つの蛍光団の放出光の比を計算することができる。この比は、同種(cognate)遺伝子の絶対発現レベルから独立しているが、薬物投与、遺伝子欠失または他の任意の試験事象によって発現が相当に調整された遺伝子に対して有用である。
【0167】
本発明の方法によれば、2つの細胞または細胞系統内のmRNAおよび/またはmRNA内で発現されたエキソンの相対存在量が、摂動(すなわち試験されたmRNAの2つの起源において存在量が異なる)と記録され、または非摂動 (すなわち相対存在量が同じ)と記録される。本明細書では、RNAの2つの起源間の差が、少なくとも25パーセント(例えば一方の起源のRNAの存在量が他方の起源のそれよりも25高い)、通常は50パーセント、しばしば2倍(例えば存在量が2倍)、3倍(存在量が3倍)または5倍(存在量が5倍)であると摂動と記録される。現行の検出方法は1.5倍から3倍程度の差の信頼できる検出が可能である。
【0168】
しかし、2つの細胞または2つの細胞系統内のmRNAおよび/またはmRNAの中に発現されたエキソンの存在量の相対的な差の絶対値を決定することも有利である。先に述べたとおり、これは、差動標識化のために使用される2つの蛍光団の放出光の比を計算することによって、または当業者に容易に明らかな類似の方法によって実施することができる。
【0169】
5.5.2 転写状態の他の測定方法
細胞の転写状態は、当技術分野で知られている他の遺伝子発現技術によっても測定することができる。2重制限酵素消化をフェージングプライマー(phasing primer)と組み合わせる方法(例えばZabeau他によって1992年9月24日に出願された欧州特許第534858 A1号を参照されたい)、定義されたmRNA末端に最も近い部位を有する制限断片を選択する方法(例えばPrashar et al., 1996, Proc. Natl. Acad. Sci. USA 93:659-663を参照されたい)など、このようないくつかの技術は、電気泳動解析に対する限定された複雑さの制限断片のプールを生み出す。他の方法は、例えば、複数のそれぞれのcDNAの中の十分な塩基(例えば20〜50塩基)を配列決定してそれぞれのcDNAを識別することによって、または定義されたmRNA末端に対して既知の位置に生成された短いタグ(例えば9〜10塩基)を配列決定することによって(例えばVelculescu, 1995, Science 270:484-487を参照されたい)、cDNAプールを統計学的にサンプリングする。
【0170】
細胞の転写状態は、逆転写ポリメラーゼ連鎖反応(RT-PCR)によって測定することもできる。RT-PCRはmRNAの検出および定量化のための技法である。RT-PCRは、単一の細胞からのRNAの定量化を可能にする十分な感度を有する。例えばPfaffl and Hageleit, 2001, Biotechnology Letters 23, 275-282、Tadesse et al., 2003, Mol Genet Genomics 269, p. 789-796およびKabir and Shimizu, 2003, J. Biotech. 9, p. 105を参照されたい。
【0171】
5.6 生物学的状態の他の態様の測定
本発明のさまざまな実施形態では、翻訳状態、活性状態、混合態様などの転写状態以外の生物学的状態の態様を測定することができる。したがって、このような実施形態では、細胞成分の存在量データが、翻訳状態の測定値またはタンパク質発現の測定値を含むことができる。このセクションでは、転写状態以外の生物学的状態の態様の詳細を説明する。
【0172】
5.6.1 翻訳状態の測定
翻訳状態の測定はいくつかの方法によって実行することができる。例えば、結合部位が、細胞ゲノムによってコードされた複数のタンパク質種に特異的な固定された抗体、好ましくはモノクローナル抗体を含むマイクロアレイを構築することによって、タンパク質の全ゲノムモニタリング(例えば「プロテオーム」)を実施することができる。コードされたタンパク質のかなりの部分に対して、または少なくとも関心の薬物の作用に関連するタンパク質に対して抗体が存在することが好ましい。モノクローナル抗体を産生するための方法はよく知られている (例えばあらゆる目的のためにその全体が本明細書に組み込まれるHarlow and Lane, 1988, Antibodies: A Laboratory Manual, Cold Spring Harbor, New Yorkを参照されたい)。一実施形態では、モノクローナル抗体が、細胞のゲノム配列に基づいて設計された合成ペプチド断片に対して生み出される。このような抗体アレイを用いて、その細胞のタンパク質をアレイに接触させ、当技術分野で知られているアッセイでそれらの結合を分析する。
【0173】
あるいは、2次元ゲル電気泳動系によってタンパク質を分離することもできる。2次元ゲル電気泳動法は当技術分野ではよく知られており、一般に、第1の次元に沿った等電点電気泳動、およびその後の第2の次元に沿ったSDS-PAGE電気泳動を含む。例えばFlames el al., 1990, Gel Electrophoresis of Proteins: A Practical Approach, IRL Press, New York、Shevchenko et al., 1996, Proc. Natl. Acad. Sci. USA 93:1440-1445、Sagliocco et al., 1996, Yeast 12:1519-1533、Lander, 1996, Science 274:536-539を参照されたい。その結果得られる電気泳動図は、質量分析法、ポリクローナルおよびモノクローナル抗体を使用したウェスタンブロット法および免疫ブロット解析、ならびに内部およびN末端マイクロシークエンシングを含む多数の技法によって解析することができる。これらの技法を使用して、薬物に暴露された細胞(例えば酵母)内あるいは例えば特定の遺伝子の欠失または過剰発現によって修飾された細胞内を含む所与の生理的条件下で産生された全てのタンパク質のかなりの部分を識別することができる。
【0174】
5.6.2 他のタイプの細胞成分存在量測定
本発明の方法は、監視することができる任意の細胞成分に適用可能である。例えば、タンパク質の活性を測定できる場合、本発明の実施形態はこのような測定を使用することができる。活性の測定は、特性付けようとする特定の活性に対して適当な任意の機能的、生化学的または物理的手段によって実行することができる。活性が化学変化(chemical transformation)を含む場合、細胞タンパク質を天然の基質と接触させ、化学変化の速度を測定することができる。活性が、マルチマー単位(multimeric unit)におけるアソシエーション(association)、例えばDNAとの活性化されたDNA結合複合体のアソシエーションを含む場合には、アソシエートされたタンパク質の量、または転写されたmRNAの量などのその会合の2次的な結果を測定することができる。さらに、機能的活性、例えば細胞周期制御の機能的活性だけが知られている場合、その機能の性能を観察することができる。どのように知られ、測定されるにせよ、タンパク質活性の変化は、本発明の上記の方法によって解析される反応データを形成する。
【0175】
本発明のいくつかの実施形態では、細胞表現型技法から細胞成分の測定が得られる。このような1つの細胞表現型技法は、汎用リポータとして細胞呼吸を使用する。一実施形態では、それぞれのウェル(well)が固有の化学的性質(chemistry)を含む96ウェルマイクロタイタープレートが提供される。それぞれの固有の化学的性質は、特定の表現型を試験するように設計されている。関心の生物からの細胞がそれぞれのウェルの中へピペットで移される。細胞が適当な表現型を示す場合、細胞は呼吸し、テトラゾリウム染料を活発に還元し、強い紫色を形成する。弱い表現型はより明るい色を形成する。無色は、細胞がその特定の表現型を持たないことを意味する。色変化は1時間に数回記録することができる。1回のインキュベーションの間に5,000超の表現型を試験することができる。例えばBochner et al., 2001, Genome Research 11, p. 1246を参照されたい。
【0176】
本発明のいくつかの実施形態では、細胞表現型技法から細胞成分の測定が得られる。このような1つの細胞表現型技法は、汎用リポータとして細胞呼吸を使用する。一実施形態では、それぞれのウェルが固有の化学的性質を含む96ウェルマイクロタイタープレートが提供される。それぞれの固有の化学的性質は、特定の表現型を試験するように設計されている。関心の生体標本からの細胞がそれぞれのウェルの中へピペットで移される。細胞が適当な表現型を示す場合、細胞は呼吸し、テトラゾリウム染料を活発に還元し、強い紫色を形成する。弱い表現型はより明るい色を形成する。無色は、細胞がその特定の表現型を持たないことを意味する。色変化は1時間に数回記録することができる。1回のインキュベーションの間に5,000超の表現型を試験することができる。例えばBochner et al., 2001, Genome Research 11, p. 1246-55を参照されたい。
【0177】
本発明のいくつかの実施形態では、測定される細胞成分が代謝産物である。代謝産物にはアミノ酸、金属、可溶性糖、糖リン酸および複合糖質が含まれる。ただしこれらに限定されるわけではない。このような代謝産物は、例えば熱分解質量分析(Irwin, 1982, Analytical Pyrolysis: A Comprehensive Guide, Marcel Dekker, New York、Meuzelaar et al., 1982, Pyrolysis Mass Spectrometry of Recent and Fossil Biomaterials, Elsevier, Amsterdam)、フーリエ変換赤外分光分析 (Griffiths and de Haseth,1986, Fourier transform infrared spectrometry, John Wiley, New York、Helm et al., 1991, J. Gen. Microbiol. 137, 69-79、Naumann et al., 1991, Nature 351, 81-82、Naumann et al., 1991, In: Modern techniques for rapid microbiological analysis, 43-96, Nelson, W.H., ed., VCH Publishers, New York)、ラマン分光法、ガスクロマトグラフィー-質量分析法(GC-MS) (Fiehn et al., 2000, Nature Biotechnology 18, 1157-1161, capillary electrophoresis (CE)/MS, high pressure liquid chromatography/mass spectroscopy (HPLC/MS))ならびに液体クロマトグラフィー(LC)-エレクトロスプレーおよびキャップ-LC-タンデムエレクトロスプレー質量分析法などの方法を使用して全細胞レベルで測定することができる。密接に関連した複数のサンプルを区別するために、このような方法を、人工神経ネットワークおよび遺伝子プログラミングを利用する確立されたケモメトリック(chemometric)法と組み合わせることができる。
【0178】
5.7 解析キット
一実施形態では、生物学的分類機構を開発し使用するためのキットを使用することによって本発明の方法を実現することができる。このようなキットは、以前のサブセクションで説明したものなどのマイクロアレイを含む。このようなキットの中に含まれるマイクロアレイは、固相、例えば表面を含み、この固相の既知の位置にはプローブがハイブリッド形成されまたは結合されている。これらのプローブは、既知の異なる配列の核酸からなり、これらの核酸はそれぞれRNA種またはRNA種から得られたcDNA種とハイブリッドを形成する能力を有することが好ましい。特定の一実施形態では、本発明のキットに含まれるプローブが、関心の生物から集められた細胞内のRNA種から得られた核酸配列と特異的にハイブリッドを形成する能力を有する核酸である。
【0179】
好ましい一実施形態では、本発明のキットがさらに、図1〜3に示して以前に説明した、コンピュータ可読媒体上にコードされた1つまたは複数のデータ構造および/またはソフトウェアモジュール、ならびに/あるいはネットワーク化されたリモートコンピュータから前述のデータベースを使用するためのアクセス許可を含む。
【0180】
好ましい他の実施形態では、本発明のキットが、図1に示した前述のコンピュータシステムなどのコンピュータシステムのメモリにロードすることができるソフトウェアを含む。本発明のキットに含まれるソフトウェアは、図1に関して先に説明したソフトウェアと本質的に同じものである。
【0181】
本発明の解析方法を実現するための代替キットは当業者には明白であり、これらも添付の請求項の範囲に含まれる。
【0182】
6. 引用文献
本明細書に引用された全ての参考文献は、それぞれの個々の出版物または特許または特許出願があたかも、あらゆる目的のためにその全体が参照によって本明細書に組み込まれると明確かつ個別に指示されているのと同じ程度に、あらゆる目的のためにその全体が参照によって本明細書に組み込まれる。
【0183】
本発明は、コンピュータ可読記憶媒体に埋め込まれたコンピュータプログラム機構を含むコンピュータプログラム製品として実現することができる。例えばこのコンピュータプログラム製品は、図1に示したプログラムモジュールおよび/または図2および3に示したデータベーススキーマを含むことができる。これらのプログラムモジュールは、CD-ROM、磁気ディスク記憶製品、あるいは他のコンピュータ可読データまたはプログラム記憶製品上に記憶することができる。コンピュータプログラム製品中のソフトウェアモジュールはさらに、搬送波上の(その中にソフトウェアモジュールが埋め込まれた)コンピュータデータ信号の伝送によって、インターネットなどを介して電子的に配布することができる。
【0184】
本発明の趣旨および範囲から逸脱することなく本発明の多くの修正および変更を実施することができることは当業者には明白である。本明細書に記載された具体的な実施形態は単に例示のために提供されたものであり、本発明は、添付の請求項の用語およびこのような請求項が資格を与える同等物の完全な範囲のみによって限定される。
【図面の簡単な説明】
【0185】
【図1】生体標本を分類するための本発明の一実施形態に基づくコンピュータシステムを示す図である。
【図2】複数の分類機構を使用して標本を分類するための本発明の一実施形態に基づく処理ステップを示す図である。
【図3】複数のモデル(分類機構)を記憶する本発明の一実施形態に基づくデータ構造を示す図である。

【特許請求の範囲】
【請求項1】
中央処理装置と、
前記中央処理装置に結合されたメモリと
を備え、前記メモリが、
(i)データを受け取るための命令であって、前記データが、ある1つの種の試験生物内または前記種の生物の試験生体標本内で測定された複数の細胞成分のうちのそれぞれの細胞成分の1つまたは複数の特性を含む命令と、
(ii)複数のモデルのうちのある1つのモデルを演算するための命令であって、前記モデルが、前記試験生物内または前記試験生体標本内の生物学的特徴の可能性を表すモデルスコアによって特性づけられ、前記モデルの前記演算が、前記複数の細胞成分のうちの1つまたは複数の細胞成分の1つまたは複数の特性を使用して前記モデルスコアを決定することを含む命令と、
(iii)演算するための前記命令を1回または数回繰り返すための命令であって、それによって前記複数のモデルを演算する命令と、
(iv)演算するための前記命令の事例において演算されたそれぞれの前記モデルスコアを通信するための命令と
を記憶した
コンピュータ。
【請求項2】
通信するための前記命令によって2つ以上のモデルスコアが通信され、前記2つ以上のモデルスコアのうちのそれぞれのモデルスコアが前記複数のモデルのうちの異なるモデルに対応する、請求項1に記載のコンピュータ。
【請求項3】
通信するための前記命令によって5つ以上のモデルスコアが通信され、前記5つ以上のモデルスコアのうちのそれぞれのモデルスコアが前記複数のモデルのうちの異なるモデルに対応する、請求項1に記載のコンピュータ。
【請求項4】
データを受け取るための前記命令が、前記データをリモートコンピュータからワイドエリアネットワークを介して受け取るための命令を含む、請求項1に記載のコンピュータ。
【請求項5】
前記ワイドエリアネットワークがインターネットである、請求項4に記載のコンピュータ。
【請求項6】
通信するための前記命令が、それぞれの前記モデルスコアをリモートコンピュータにワイドエリアネットワークを介して伝送するための命令を含む、請求項1に記載のコンピュータ。
【請求項7】
前記ワイドエリアネットワークがインターネットである、請求項6に記載のコンピュータ。
【請求項8】
前記試験生物または前記試験生体標本は、前記モデルスコアが第1の値範囲にあるときに、前記複数のモデルのうちのある1つのモデルによって表される前記生物学的特徴を持つとみなされ、
前記試験生物または前記試験生体標本は、前記モデルスコアが第2の値範囲にあるときに、前記モデルによって表される前記生物学的特徴を持たないとみなされる、
請求項1に記載のコンピュータ。
【請求項9】
前記生物学的特徴が病気である、請求項1に記載のコンピュータ。
【請求項10】
前記病気が癌である、請求項9に記載のコンピュータ。
【請求項11】
前記病気が、乳癌、肺癌、前立腺癌、結腸直腸癌、卵巣癌、膀胱癌、胃癌または直腸癌である、請求項9に記載のコンピュータ。
【請求項12】
前記複数のモデルが、第1のモデルスコアによって特性づけられる第1のモデルと、第2のモデルスコアによって特性づけられる第2のモデルとを含み、
前記第1のモデルスコアを演算するためにその1つまたは複数の特性が使用される細胞成分の識別が、前記第2のモデルスコアを演算するためにその1つまたは複数の特性が使用される細胞成分の識別とは異なる、
請求項1に記載のコンピュータ。
【請求項13】
前記複数のモデルのうちのある1つのモデルの前記モデルスコアを決定するために使用される1つまたは複数の細胞成分の前記1つまたは複数の特性のうちの1つの特性が、前記種の前記試験生物内または前記種の生物の前記試験生体標本内の前記1つまたは複数の細胞成分の存在量を含む、請求項1に記載のコンピュータ。
【請求項14】
前記種がヒトである、請求項1に記載のコンピュータ。
【請求項15】
前記試験生体標本が、腫瘍、血液、骨、乳房、肺、前立腺、結腸直腸、卵巣、膀胱、胃または直腸の生検材料または他の形態の試料である、請求項1に記載のコンピュータ。
【請求項16】
前記1つまたは複数の特性が細胞成分存在量を含み、前記データが、前記種の前記試験生物内または前記種の前記生物の前記試験生体標本内の少なくとも100個の細胞成分の細胞成分存在量を含む、請求項1に記載のコンピュータ。
【請求項17】
前記1つまたは複数の特性が細胞成分存在量を含み、前記データが、前記種の前記試験生物内または前記種の前記生物の前記試験生体標本内の少なくとも500個の細胞成分の細胞成分存在量を含む、請求項1に記載のコンピュータ。
【請求項18】
前記1つまたは複数の特性が細胞成分存在量を含み、前記データが、前記種の前記試験生物内または前記種の前記生物の前記試験生体標本内の少なくとも5,000個の細胞成分の細胞成分存在量を含む、請求項1に記載のコンピュータ。
【請求項19】
前記1つまたは複数の特性が細胞成分存在量を含み、前記データが、前記種の前記試験生物内または前記種の前記生物の前記試験生体標本内1,000から20,000個の細胞成分の細胞成分存在量を含む、請求項1に記載のコンピュータ。
【請求項20】
前記複数の細胞成分のうちの1つの細胞成分がmRNA、cRNAまたはcDNAである、請求項1に記載のコンピュータ。
【請求項21】
前記1つまたは複数の細胞成分のうちの1つの細胞成分が核酸またはリボ核酸であり、前記細胞成分の前記1つまたは複数の特性のうちの1つの特性が、前記試験生物内または前記試験生体標本内の前記細胞成分の全部または一部の転写状態を測定することによって得られる、請求項1に記載のコンピュータ。
【請求項22】
前記1つまたは複数の細胞成分のうちの1つの細胞成分がタンパク質であり、前記細胞成分の前記1つまたは複数の特性のうちの1つの特性が、前記試験生物内または前記試験生体標本内の前記細胞成分の翻訳状態を測定することによって得られる、請求項1に記載のコンピュータ。
【請求項23】
前記複数の細胞成分のうちの1つの細胞成分の前記1つまたは複数の特性のうちの1つの特性が、前記試験生物から得られた試料または前記試験生体標本を使用した前記細胞成分の同位体コード付け親和性標識付け(isotope-coded affinity tagging)およびその後のタンデム質量分析(tandem mass spectrometry analysis)を使用して決定される、請求項1に記載のコンピュータ。
【請求項24】
前記複数の細胞成分のうちの1つの細胞成分の前記1つまたは複数の特性のうちの1つの特性が、前記試験生物から得られた試料内または前記試験生体標本内の前記細胞成分の活性または翻訳後修飾を測定することによって決定される、請求項1に記載のコンピュータ。
【請求項25】
前記生物学的特徴が薬物に対する感受性である、請求項1に記載のコンピュータ。
【請求項26】
演算するための前記命令の事例によってそれらのモデルスコアが演算される前記複数のモデルが集合的に、2つ以上のそれぞれの生物学的特徴の可能性を表す、請求項1に記載のコンピュータ。
【請求項27】
前記2つ以上の生物学的特徴のうちのそれぞれの生物学的特徴が癌の起源である、請求項26に記載のコンピュータ。
【請求項28】
前記2つ以上の生物学的特徴が第1の病気および第2の病気を含む、請求項26に記載のコンピュータ。
【請求項29】
演算するための前記命令の事例によってそれらのモデルスコアが演算される前記複数のモデルが集合的に、5つ以上のそれぞれの生物学的特徴の可能性を表す、請求項1に記載のコンピュータ。
【請求項30】
前記5つ以上の生物学的特徴のうちのそれぞれの生物学的特徴が癌の起源である、請求項29に記載のコンピュータ。
【請求項31】
前記5つ以上の生物学的特徴が第1の病気および第2の病気を含む、請求項29に記載のコンピュータ。
【請求項32】
演算するための前記命令の事例によってそれらのモデルスコアが演算される前記複数のモデルが集合的に、2つから20個の生物学的特徴の独立した可能性を表す、請求項1に記載のコンピュータ。
【請求項33】
前記2つから20個の生物学的特徴のうちのそれぞれの生物学的特徴が癌の起源である、請求項32に記載のコンピュータ。
【請求項34】
前記2つから20個の生物学的特徴が第1の病気および第2の病気を含む、請求項32に記載のコンピュータ。
【請求項35】
中央処理装置と、
前記中央処理装置に結合されたメモリと
を備え、前記メモリが、
(i)データを受け取るための命令であって、前記データが、ある1つの種の試験生物内または前記種の生物の試験生体標本内で測定された複数の細胞成分のうちのそれぞれの細胞成分の1つまたは複数の特性を含む命令と、
(ii)複数のモデルを演算するための命令であって、前記複数のモデルのうちのそれぞれのモデルが、前記試験生物内または前記試験生体標本内の生物学的特徴の可能性を表すモデルスコアによって特性づけられ、前記複数のモデルのうちのそれぞれのモデルの演算が、前記複数の細胞成分のうちの1つまたは複数の細胞成分の1つまたは複数の特性を使用して前記それぞれのモデルに関連した前記モデルスコアを決定することを含む命令と、
(iii)演算するための前記命令によって演算されたそれぞれの前記モデルスコアを通信するための命令と
を記憶した
コンピュータ。
【請求項36】
コンピュータシステムとともに使用されるコンピュータプログラム製品であって、コンピュータ可読記憶媒体と、その中に埋め込まれたコンピュータプログラム機構とを含み、前記コンピュータプログラム機構が、
(i)データを受け取るための命令であって、前記データが、ある1つの種の試験生物内または前記種の生物の試験生体標本内で測定された複数の細胞成分のうちのそれぞれの細胞成分の1つまたは複数の特性を含む命令と、
(ii)複数のモデルのうちのある1つのモデルを演算するための命令であって、前記モデルが、前記試験生物内または前記試験生体標本内の生物学的特徴の可能性を表すモデルスコアによって特性づけられ、前記モデルの前記演算が、前記複数の細胞成分のうちの1つまたは複数の細胞成分の1つまたは複数の特性を使用して前記モデルスコアを決定することを含む命令と、
(iii)演算するための前記命令を1回または数回繰り返すための命令であって、それによって前記複数のモデルを演算する命令と、
(iv)演算するための前記命令の事例において演算されたそれぞれの前記モデルスコアを通信するための命令と
を含む
コンピュータプログラム製品。
【請求項37】
通信するための前記命令によって2つ以上のモデルスコアが通信され、前記2つ以上のモデルスコアのうちのそれぞれのモデルスコアが前記複数のモデルのうちの異なるモデルに対応する、請求項36に記載のコンピュータプログラム製品。
【請求項38】
通信するための前記命令によって5つ以上のモデルスコアが通信され、前記5つ以上のモデルスコアのうちのそれぞれのモデルスコアが前記複数のモデルのうちの異なるモデルに対応する、請求項36に記載のコンピュータプログラム製品。
【請求項39】
前記試験生物または前記試験生体標本は、前記モデルスコアが第1の値範囲にあるときに、前記複数のモデルのうちのある1つのモデルによって表される前記生物学的特徴を持つとみなされ、
前記試験生物または前記試験生体標本は、前記モデルスコアが第2の値範囲にあるときに、前記モデルによって表される前記生物学的特徴を持たないとみなされる、
請求項36に記載のコンピュータプログラム製品。
【請求項40】
前記生物学的特徴が病気である、請求項36に記載のコンピュータプログラム製品。
【請求項41】
前記病気が癌である、請求項40に記載のコンピュータプログラム製品。
【請求項42】
前記病気が、乳癌、肺癌、前立腺癌、結腸直腸癌、卵巣癌、膀胱癌、胃癌または直腸癌である、請求項40に記載のコンピュータプログラム製品。
【請求項43】
前記複数のモデルが、第1のモデルスコアによって特性づけられる第1のモデルと、第2のモデルスコアによって特性づけられる第2のモデルとを含み、
前記第1のモデルスコアを演算するためにその1つまたは複数の特性が使用される細胞成分の識別が、前記第2のモデルスコアを演算するためにその1つまたは複数の特性が使用される細胞成分の識別とは異なる、
請求項36に記載のコンピュータプログラム製品。
【請求項44】
前記複数のモデルのうちのある1つのモデルの前記モデルスコアを決定するために使用される1つまたは複数の細胞成分の前記1つまたは複数の特性のうちの1つの特性が、前記種の前記試験生物内または前記種の生物の前記試験生体標本内の前記1つまたは複数の細胞成分の存在量を含む、請求項36に記載のコンピュータプログラム製品。
【請求項45】
前記種がヒトである、請求項36に記載のコンピュータプログラム製品。
【請求項46】
前記試験生体標本が、腫瘍、血液、骨、乳房、肺、前立腺、結腸直腸、卵巣、膀胱、胃または直腸の生検材料または他の形態の試料である、請求項36に記載のコンピュータプログラム製品。
【請求項47】
前記1つまたは複数の特性が細胞成分存在量を含み、前記データが、前記種の前記試験生物内または前記種の前記生物の前記試験生体標本内の少なくとも100個の細胞成分の細胞成分存在量を含む、請求項36に記載のコンピュータプログラム製品。
【請求項48】
前記1つまたは複数の特性が細胞成分存在量を含み、前記データが、前記種の前記試験生物内または前記種の前記生物の前記試験生体標本内の少なくとも500個の細胞成分の細胞成分存在量を含む、請求項36に記載のコンピュータプログラム製品。
【請求項49】
前記1つまたは複数の特性が細胞成分存在量を含み、前記データが、前記種の前記試験生物内または前記種の前記生物の前記試験生体標本内の少なくとも5,000個の細胞成分の細胞成分存在量を含む、請求項36に記載のコンピュータプログラム製品。
【請求項50】
前記1つまたは複数の特性が細胞成分存在量を含み、前記データが、前記種の前記試験生物内または前記種の前記生物の前記試験生体標本内1,000から20,000個の細胞成分の細胞成分存在量を含む、請求項36に記載のコンピュータプログラム製品。
【請求項51】
前記複数の細胞成分のうちの1つの細胞成分がmRNA、cRNAまたはcDNAである、請求項36に記載のコンピュータプログラム製品。
【請求項52】
前記1つまたは複数の細胞成分のうちの1つの細胞成分が核酸またはリボ核酸であり、前記細胞成分の前記1つまたは複数の特性のうちの1つの特性が、前記試験生物内または前記試験生体標本内の前記細胞成分の全部または一部の転写状態を測定することによって得られる、請求項36に記載のコンピュータプログラム製品。
【請求項53】
前記1つまたは複数の細胞成分のうちの1つの細胞成分がタンパク質であり、前記細胞成分の前記1つまたは複数の特性のうちの1つの特性が、前記試験生物内または前記試験生体標本内の前記細胞成分の翻訳状態を測定することによって得られる、請求項36に記載のコンピュータプログラム製品。
【請求項54】
前記複数の細胞成分のうちの1つの細胞成分の前記1つまたは複数の特性のうちの1つの特性が、前記試験生物から得られた試料または前記試験生体標本を使用した前記細胞成分の同位体コード付け親和性標識付けおよびその後のタンデム質量分析を使用して決定される、請求項36に記載のコンピュータプログラム製品。
【請求項55】
前記複数の細胞成分のうちの1つの細胞成分の前記1つまたは複数の特性のうちの1つの特性が、前記試験生物から得られた試料内または前記試験生体標本内の前記細胞成分の活性または翻訳後修飾を測定することによって決定される、請求項36に記載のコンピュータプログラム製品。
【請求項56】
前記生物学的特徴が薬物に対する感受性である、請求項36に記載のコンピュータプログラム製品。
【請求項57】
コンピュータシステムとともに使用されるコンピュータプログラム製品であって、コンピュータ可読記憶媒体と、その中に埋め込まれたコンピュータプログラム機構とを含み、前記コンピュータプログラム機構が、
(i)データを受け取るための命令であって、前記データが、ある1つの種の試験生物内または前記種の生物の試験生体標本内で測定された複数の細胞成分のうちのそれぞれの細胞成分の1つまたは複数の特性を含む命令と、
(ii)複数のモデルを演算するための命令であって、前記複数のモデルのうちのそれぞれのモデルが、前記試験生物内または前記試験生体標本内の生物学的特徴の可能性を表すモデルスコアによって特性づけられ、前記複数のモデルのうちのそれぞれのモデルの演算が、前記複数の細胞成分のうちの1つまたは複数の細胞成分の1つまたは複数の特性を使用して前記それぞれのモデルに関連した前記モデルスコアを決定することを含む命令と、
(iii)演算するための前記命令の事例において演算されたそれぞれの前記モデルスコアを通信するための命令と
を含む
コンピュータプログラム製品。
【請求項58】
データを受け取るステップであって、前記データが、ある1つの種の試験生物内または前記種の生物の試験生体標本内で測定された複数の細胞成分のうちのそれぞれの細胞成分の1つまたは複数の特性を含むステップと、
複数のモデルのうちのある1つのモデルを演算するステップであって、前記モデルが、前記試験生物内または前記試験生体標本内の生物学的特徴の可能性を表すモデルスコアによって特性づけられ、前記モデルの前記演算が、前記複数の細胞成分のうちの1つまたは複数の細胞成分の1つまたは複数の特性を使用して前記モデルスコアを決定することを含むステップと、
前記演算を1回または数回繰り返すステップであって、それによって前記複数のモデルを演算するステップと、
前記演算の事例において演算されたそれぞれの前記モデルスコアを通信するステップと
を含む方法。
【請求項59】
前記通信ステップによって2つ以上のモデルスコアが通信され、前記2つ以上のモデルスコアのうちのそれぞれのモデルスコアが前記複数のモデルのうちの異なるモデルに対応する、請求項58に記載の方法。
【請求項60】
前記通信ステップによって5つ以上のモデルスコアが通信され、前記5つ以上のモデルスコアのうちのそれぞれのモデルスコアが前記複数のモデルのうちの異なるモデルに対応する、請求項58に記載の方法。
【請求項61】
前記試験生物または前記試験生体標本は、前記モデルスコアが第1の値範囲にあるときに、前記複数のモデルのうちのある1つのモデルによって表される前記生物学的特徴を持つとみなされ、
前記試験生物または前記試験生体標本は、前記モデルスコアが第2の値範囲にあるときに、前記モデルによって表される前記生物学的特徴を持たないとみなされる、
請求項58に記載の方法。
【請求項62】
前記生物学的特徴が病気である、請求項58に記載の方法。
【請求項63】
前記病気が癌である、請求項62に記載の方法。
【請求項64】
前記病気が、乳癌、肺癌、前立腺癌、結腸直腸癌、卵巣癌、膀胱癌、胃癌または直腸癌である、請求項62に記載の方法。
【請求項65】
前記複数のモデルが、第1のモデルスコアによって特性づけられる第1のモデルと、第2のモデルスコアによって特性づけられる第2のモデルとを含み、
前記第1のモデルスコアを演算するためにその1つまたは複数の特性が使用される細胞成分の識別が、前記第2のモデルスコアを演算するためにその1つまたは複数の特性が使用される細胞成分の識別とは異なる、
請求項58に記載の方法。
【請求項66】
前記複数のモデルのうちのある1つのモデルの前記モデルスコアを決定するために使用される1つまたは複数の細胞成分の前記1つまたは複数の特性のうちの1つの特性が、前記種の前記試験生物内または前記種の生物の前記試験生体標本内の前記1つまたは複数の細胞成分の存在量を含む、請求項58に記載の方法。
【請求項67】
前記種がヒトである、請求項58に記載の方法。
【請求項68】
前記試験生体標本が、腫瘍、血液、骨、乳房、肺、前立腺、結腸直腸、卵巣、膀胱、胃または直腸からの生検材料または他の形態の試料である、請求項58に記載の方法。
【請求項69】
前記1つまたは複数の特性が細胞成分存在量を含み、前記データが、前記種の前記試験生物内または前記種の前記生物の前記試験生体標本内の少なくとも100個の細胞成分の細胞成分存在量を含む、請求項58に記載の方法。
【請求項70】
前記1つまたは複数の特性が細胞成分存在量を含み、前記データが、前記種の前記試験生物内または前記種の前記生物の前記試験生体標本内の少なくとも500個の細胞成分の細胞成分存在量を含む、請求項58に記載の方法。
【請求項71】
前記1つまたは複数の特性が細胞成分存在量を含み、前記データが、前記種の前記試験生物内または前記種の前記生物の前記試験生体標本内の少なくとも5,000個の細胞成分の細胞成分存在量を含む、請求項58に記載の方法。
【請求項72】
前記1つまたは複数の特性が細胞成分存在量を含み、前記データが、前記種の前記試験生物内または前記種の前記生物の前記試験生体標本内1,000から20,000個の細胞成分の細胞成分存在量を含む、請求項58に記載の方法。
【請求項73】
前記複数の細胞成分のうちの1つの細胞成分がmRNA、cRNAまたはcDNAである、請求項58に記載の方法。
【請求項74】
前記1つまたは複数の細胞成分のうちの1つの細胞成分が核酸またはリボ核酸であり、前記細胞成分の前記1つまたは複数の特性のうちの1つの特性が、前記試験生物内または前記試験生体標本内の前記細胞成分の全部または一部の転写状態を測定することによって得られる、請求項58に記載の方法。
【請求項75】
前記1つまたは複数の細胞成分のうちの1つの細胞成分がタンパク質であり、前記細胞成分の前記1つまたは複数の特性のうちの1つの特性が、前記試験生物内または前記試験生体標本内の前記細胞成分の翻訳状態を測定することによって得られる、請求項58に記載の方法。
【請求項76】
前記複数の細胞成分のうちの1つの細胞成分の前記1つまたは複数の特性のうちの1つの特性が、前記試験生物から得られた試料または前記試験生体標本を使用した前記細胞成分の同位体コード付け親和性標識付けおよびその後のタンデム質量分析を使用して決定される、請求項58に記載の方法。
【請求項77】
前記複数の細胞成分のうちの1つの細胞成分の前記1つまたは複数の特性のうちの1つの特性が、前記試験生物から得られた試料内または前記試験生体標本内の前記細胞成分の活性または翻訳後修飾を測定することによって決定される、請求項58に記載の方法。
【請求項78】
前記生物学的特徴が薬物に対する感受性である、請求項58に記載の方法。
【請求項79】
前記演算の事例によってそれらのモデルスコアが演算される前記複数のモデルが集合的に、2つ以上のそれぞれの生物学的特徴の可能性を表す、請求項58に記載の方法。
【請求項80】
前記2つ以上の生物学的特徴のうちのそれぞれの生物学的特徴が癌の起源である、請求項79に記載の方法。
【請求項81】
前記2つ以上の生物学的特徴が第1の病気および第2の病気を含む、請求項79に記載の方法。
【請求項82】
前記演算の事例によってそれらのモデルスコアが演算される前記複数のモデルが集合的に、5つ以上のそれぞれの生物学的特徴の可能性を表す、請求項58に記載の方法。
【請求項83】
前記5つ以上の生物学的特徴のうちのそれぞれの生物学的特徴が癌の起源である、請求項82に記載の方法。
【請求項84】
前記5つ以上の生物学的特徴が第1の病気および第2の病気を含む、請求項82に記載の方法。
【請求項85】
前記演算の事例によってそれらのモデルスコアが演算される前記複数のモデルが集合的に、2つから20個の生物学的特徴の独立した可能性を表す、請求項58に記載の方法。
【請求項86】
前記2つから20個の生物学的特徴のうちのそれぞれの生物学的特徴が癌の起源である、請求項85に記載の方法。
【請求項87】
前記2つから20個の生物学的特徴が第1の病気および第2の病気を含む、請求項85に記載の方法。
【請求項88】
データを受け取るステップであって、前記データが、ある1つの種の試験生物内または前記種の生物の試験生体標本内で測定された複数の細胞成分のうちのそれぞれの細胞成分の1つまたは複数の特性を含むステップと、
複数のモデルを演算するステップであって、前記複数のモデルのうちのそれぞれのモデルが、前記試験生物内または前記試験生体標本内の生物学的特徴の可能性を表すモデルスコアによって特性づけられ、前記複数のモデルのうちのそれぞれのモデルの演算が、前記複数の細胞成分のうちの1つまたは複数の細胞成分の1つまたは複数の特性を使用して前記それぞれのモデルに関連した前記モデルスコアを決定することを含むステップと、
前記演算の事例において演算されたそれぞれの前記モデルスコアを通信するステップと
を含む方法。
【請求項89】
中央処理装置と、
前記中央処理装置に結合されたメモリと
を備え、前記メモリが、
(i)データを送るための命令であって、前記データが、ある1つの種の試験生物内または前記種の生物の試験生体標本内で測定された複数の細胞成分のうちのそれぞれの細胞成分の1つまたは複数の特性を含む命令と、
(ii)複数のモデルスコアを受け取るための命令であって、それぞれのモデルスコアが複数のモデルのうちの1つのモデルに対応し、前記複数のモデルのうちのそれぞれのモデルが、前記試験生物内または前記試験生体標本内の生物学的特徴の可能性を表すモデルスコアによって特性づけられ、前記モデルの前記演算が、前記複数の細胞成分のうちの1つまたは複数の細胞成分の1つまたは複数の特性を使用して前記モデルスコアを決定することを含む命令と
を記憶した
コンピュータ。
【請求項90】
前記複数のモデルスコアが2つ以上のモデルスコアからなり、前記2つ以上のモデルスコアのうちのそれぞれのモデルスコアが前記複数のモデルのうちの異なるモデルに対応する、請求項89に記載のコンピュータ。
【請求項91】
前記複数のモデルスコアが5つ以上のモデルスコアからなり、前記5つ以上のモデルスコアのうちのそれぞれのモデルスコアが前記複数のモデルのうちの異なるモデルに対応する、請求項89に記載のコンピュータ。
【請求項92】
データを送るための前記命令が、前記データをリモートコンピュータへワイドエリアネットワークを介して送るための命令を含む、請求項89に記載のコンピュータ。
【請求項93】
前記ワイドエリアネットワークがインターネットである、請求項92に記載のコンピュータ。
【請求項94】
受け取るための前記命令が、前記複数のモデルスコアをリモートコンピュータからワイドエリアネットワークを介して受け取るための命令を含む、請求項89に記載のコンピュータ。
【請求項95】
前記ワイドエリアネットワークがインターネットである、請求項94に記載のコンピュータ。
【請求項96】
前記試験生物または前記試験生体標本は、前記モデルスコアが第1の値範囲にあるときに、前記複数のモデルのうちのある1つのモデルによって表される前記生物学的特徴を持つとみなされ、
前記試験生物または前記試験生体標本は、前記モデルスコアが第2の値範囲にあるときに、前記モデルによって表される前記生物学的特徴を持たないとみなされる、
請求項89に記載のコンピュータ。
【請求項97】
前記生物学的特徴が病気である、請求項89に記載のコンピュータ。
【請求項98】
前記病気が癌である、請求項97に記載のコンピュータ。
【請求項99】
前記病気が、乳癌、肺癌、前立腺癌、結腸直腸癌、卵巣癌、膀胱癌、胃癌または直腸癌である、請求項97に記載のコンピュータ。
【請求項100】
前記複数のモデルが、第1のモデルスコアによって特性づけられる第1のモデルと、第2のモデルスコアによって特性づけられる第2のモデルとを含み、
前記第1のモデルスコアを演算するためにその1つまたは複数の特性が使用される細胞成分の識別が、前記第2のモデルスコアを演算するためにその1つまたは複数の特性が使用される細胞成分の識別とは異なる、
請求項89に記載のコンピュータ。
【請求項101】
前記複数のモデルのうちのある1つのモデルの前記モデルスコアを決定するために使用される1つまたは複数の細胞成分の前記1つまたは複数の特性のうちの1つの特性が、前記種の前記試験生物内または前記種の生物の前記試験生体標本内の前記1つまたは複数の細胞成分の存在量を含む、請求項89に記載のコンピュータ。
【請求項102】
前記種がヒトである、請求項89に記載のコンピュータ。
【請求項103】
前記試験生体標本が、腫瘍、血液、骨、乳房、肺、前立腺、結腸直腸、卵巣、膀胱、胃または直腸からの生検材料または他の形態の試料である、請求項89に記載のコンピュータ。
【請求項104】
前記1つまたは複数の特性が細胞成分存在量を含み、前記データが、前記種の前記試験生物内または前記種の前記生物の前記試験生体標本内の少なくとも100個の細胞成分の細胞成分存在量を含む、請求項89に記載のコンピュータ。
【請求項105】
前記1つまたは複数の特性が細胞成分存在量を含み、前記データが、前記種の前記試験生物内または前記種の前記生物の前記試験生体標本内の少なくとも500個の細胞成分の細胞成分存在量を含む、請求項89に記載のコンピュータ。
【請求項106】
前記1つまたは複数の特性が細胞成分存在量を含み、前記データが、前記種の前記試験生物内または前記種の前記生物の前記試験生体標本内の少なくとも5,000個の細胞成分の細胞成分存在量を含む、請求項89に記載のコンピュータ。
【請求項107】
前記1つまたは複数の特性が細胞成分存在量を含み、前記データが、前記種の前記試験生物内または前記種の前記生物の前記試験生体標本内1,000から20,000個の細胞成分の細胞成分存在量を含む、請求項89に記載のコンピュータ。
【請求項108】
前記複数の細胞成分のうちの1つの細胞成分がmRNA、cRNAまたはcDNAである、請求項89に記載のコンピュータ。
【請求項109】
前記1つまたは複数の細胞成分のうちの1つの細胞成分が核酸またはリボ核酸であり、前記細胞成分の前記1つまたは複数の特性のうちの1つの特性が、前記試験生物内または前記試験生体標本内の前記細胞成分の全部または一部の転写状態を測定することによって得られる、請求項89に記載のコンピュータ。
【請求項110】
前記1つまたは複数の細胞成分のうちの1つの細胞成分がタンパク質であり、前記細胞成分の前記1つまたは複数の特性のうちの1つの特性が、前記試験生物内または前記試験生体標本内の前記細胞成分の翻訳状態を測定することによって得られる、請求項89に記載のコンピュータ。
【請求項111】
前記複数の細胞成分のうちの1つの細胞成分の前記1つまたは複数の特性のうちの1つの特性が、前記試験生物から得られた試料または前記試験生体標本を使用した前記細胞成分の同位体コード付け親和性標識付けおよびその後のタンデム質量分析を使用して決定される、請求項89に記載のコンピュータ。
【請求項112】
前記複数の細胞成分のうちの1つの細胞成分の前記1つまたは複数の特性のうちの1つの特性が、前記試験生物から得られた試料内または前記試験生体標本内の前記細胞成分の活性または翻訳後修飾を測定することによって決定される、請求項89に記載のコンピュータ。
【請求項113】
前記生物学的特徴が薬物に対する感受性である、請求項89に記載のコンピュータ。
【請求項114】
前記複数のモデルが集合的に、2つ以上のそれぞれの生物学的特徴の可能性を表す、請求項89に記載のコンピュータ。
【請求項115】
前記2つ以上の生物学的特徴のうちのそれぞれの生物学的特徴が癌の起源である、請求項114に記載のコンピュータ。
【請求項116】
前記2つ以上の生物学的特徴が第1の病気および第2の病気を含む、請求項114に記載のコンピュータ。
【請求項117】
前記複数のモデルが集合的に、5つ以上のそれぞれの生物学的特徴の可能性を表す、請求項89に記載のコンピュータ。
【請求項118】
前記5つ以上の生物学的特徴のうちのそれぞれの生物学的特徴が癌の起源である、請求項117に記載のコンピュータ。
【請求項119】
前記5つ以上の生物学的特徴が第1の病気および第2の病気を含む、請求項117に記載のコンピュータ。
【請求項120】
演算するための前記命令の事例によってそれらのモデルスコアが演算される前記複数のモデルが集合的に、2つから20個の生物学的特徴の独立した可能性を表す、請求項89に記載のコンピュータ。
【請求項121】
前記2つから20個の生物学的特徴のうちのそれぞれの生物学的特徴が癌の起源である、請求項120に記載のコンピュータ。
【請求項122】
前記2つから20個の生物学的特徴が第1の病気および第2の病気を含む、請求項120に記載のコンピュータ。
【請求項123】
コンピュータシステムとともに使用されるコンピュータプログラム製品であって、コンピュータ可読記憶媒体と、その中に埋め込まれたコンピュータプログラム機構とを含み、前記コンピュータプログラム機構が、
(i)データを送るための命令であって、前記データが、ある1つの種の試験生物内または前記種の生物の試験生体標本内で測定された複数の細胞成分のうちのそれぞれの細胞成分の1つまたは複数の特性を含む命令と、
(ii)複数のモデルスコアを受け取るための命令であって、それぞれのモデルスコアが複数のモデルのうちの1つのモデルに対応し、前記複数のモデルのうちのそれぞれのモデルが、前記試験生物内または前記試験生体標本内の生物学的特徴の可能性を表すモデルスコアによって特性づけられ、前記モデルの前記演算が、前記複数の細胞成分のうちの1つまたは複数の細胞成分の1つまたは複数の特性を使用して前記モデルスコアを決定することを含む命令と
を含む
コンピュータプログラム製品。
【請求項124】
(i)データを送るステップであって、前記データが、ある1つの種の試験生物内または前記種の生物の試験生体標本内で測定された複数の細胞成分のうちのそれぞれの細胞成分の1つまたは複数の特性を含むステップと、
(ii)複数のモデルスコアを受け取るステップであって、それぞれのモデルスコアが複数のモデルのうちの1つのモデルに対応し、前記複数のモデルのうちのそれぞれのモデルが、前記試験生物内または前記試験生体標本内の生物学的特徴の可能性を表すモデルスコアによって特性づけられ、前記モデルの前記演算が、前記複数の細胞成分のうちの1つまたは複数の細胞成分の1つまたは複数の特性を使用して前記モデルスコアを決定することを含むステップと
を含む方法。
【請求項125】
前記生物学的特徴が療法に対する感受性または抵抗性を含む、請求項58に記載の方法。
【請求項126】
前記療法が薬物の投与である、請求項125に記載の方法。
【請求項127】
前記生物学的特徴が療法の組合せに対する感受性または抵抗性を含む、請求項58に記載の方法。
【請求項128】
前記療法の組合せが薬物の組合せの投与である、請求項127に記載の方法。
【請求項129】
前記生物学的特徴が、病気可能性または再発の転移可能性を含む、請求項58に記載の方法。
【請求項130】
中央処理装置と、
前記中央処理装置に結合されたメモリと
を備え、前記メモリが、
(i)データを受け取るための命令であって、前記データが、ある1つの種の試験生物内または前記種の生物の試験生体標本内で測定された複数の細胞成分のうちのそれぞれの細胞成分の生物学的状態の1つまたは複数の態様を含む命令と、
(ii)複数のモデルのうちのある1つのモデルを演算するための命令であって、前記演算が、前記種の前記試験生物または前記種の前記生物の前記試験生体標本が生物学的サンプルクラスのメンバであるかどうかを指示する前記モデルのモデル特性付けを生み出し、前記モデルの前記演算が、前記複数の細胞成分のうちの1つまたは複数の細胞成分の生物学的状態の1つまたは複数の態様を使用して前記モデルを特性づけることを含む命令と、
(iii)演算するための前記命令を1回または数回繰り返すための命令であって、それによって前記複数のモデルを演算する命令と、
(iv)演算するための前記命令の事例において演算されたそれぞれの前記モデル特性付けを通信するための命令と
を記憶した
コンピュータ。
【請求項131】
データを受け取るための前記命令が、前記データをリモートコンピュータからワイドエリアネットワークを介して受け取るための命令を含む、請求項130に記載のコンピュータ。
【請求項132】
前記ワイドエリアネットワークがインターネットである、請求項131に記載のコンピュータ。
【請求項133】
前記生物学的サンプルクラスが病気である、請求項130に記載のコンピュータ。
【請求項134】
前記病気が癌である、請求項133に記載のコンピュータ。
【請求項135】
中央処理装置と、
前記中央処理装置に結合されたメモリと
を備え、前記メモリが、
(i)データを受け取るための命令であって、前記データが、ある1つの種の試験生物内または前記種の生物の試験生体標本内で測定された複数の細胞成分のうちのそれぞれの細胞成分の生物学的状態の1つまたは複数の態様を含む命令と、
(ii)複数のモデルを演算するための命令であって、前記演算が、前記種の前記試験生物または前記種の前記生物の前記試験生体標本が生物学的サンプルクラスのメンバであるかどうかを指示する前記複数のモデルのうちのそれぞれのモデルのモデル特性付けを生み出し、前記演算が、前記複数の細胞成分のうちの1つまたは複数の細胞成分の生物学的状態の1つまたは複数の態様を使用して前記複数のモデルのうちのそれぞれの前記モデルを特性づけることを含む命令と、
(iii)演算するための前記命令によって演算されたそれぞれの前記モデル特性付けを通信するための命令と
を記憶した
コンピュータ。
【請求項136】
コンピュータシステムとともに使用されるコンピュータプログラム製品であって、コンピュータ可読記憶媒体と、その中に埋め込まれたコンピュータプログラム機構とを含み、前記コンピュータプログラム機構が、
(i)データを受け取るための命令であって、前記データが、ある1つの種の試験生物内または前記種の生物の試験生体標本内で測定された複数の細胞成分のうちのそれぞれの細胞成分の生物学的状態の1つまたは複数の態様を含む命令と、
(ii)複数のモデルのうちのある1つのモデルを演算するための命令であって、前記演算が、前記種の前記試験生物または前記種の前記生物の前記試験生体標本が生物学的サンプルクラスのメンバであるかどうかを指示する前記モデルのモデル特性付けを生み出し、前記モデルの前記演算が、前記複数の細胞成分のうちの1つまたは複数の細胞成分の生物学的状態の1つまたは複数の態様を使用して前記モデルを特性づけることを含む命令と、
(iii)演算するための前記命令を1回または数回繰り返すための命令であって、それによって前記複数のモデルを演算する命令と、
(iv)演算するための前記命令の事例において演算されたそれぞれの前記モデル特性付けを通信するための命令と
を含む
コンピュータプログラム製品。
【請求項137】
コンピュータシステムとともに使用されるコンピュータプログラム製品であって、コンピュータ可読記憶媒体と、その中に埋め込まれたコンピュータプログラム機構とを含み、前記コンピュータプログラム機構が、
(i)データを受け取るための命令であって、前記データが、ある1つの種の試験生物内または前記種の生物の試験生体標本内で測定された複数の細胞成分のうちのそれぞれの細胞成分の生物学的状態の1つまたは複数の態様を含む命令と、
(ii)複数のモデルを演算するための命令であって、前記演算が、前記種の前記試験生物または前記種の前記生物の前記試験生体標本が生物学的サンプルクラスのメンバであるかどうかを指示する前記複数のモデルのうちのそれぞれのモデルのモデル特性付けを生み出し、前記演算が、前記複数の細胞成分のうちの1つまたは複数の細胞成分の生物学的状態の1つまたは複数の態様を使用して前記複数のモデルのうちのそれぞれの前記モデルを特性づけることを含む命令と、
(iii)演算するための前記命令によって演算されたそれぞれの前記モデル特性付けを通信するための命令と
を含む
コンピュータプログラム製品。
【請求項138】
データを受け取るステップであって、前記データが、ある1つの種の試験生物内または前記種の生物の試験生体標本内で測定された複数の細胞成分のうちのそれぞれの細胞成分の生物学的状態の1つまたは複数の態様を含むステップと、
複数のモデルのうちのある1つのモデルを演算するステップであって、前記演算が、前記種の前記試験生物または前記種の前記生物の前記試験生体標本が生物学的サンプルクラスのメンバであるかどうかを指示する前記モデルのモデル特性付けを生み出し、前記モデルの前記演算が、前記複数の細胞成分のうちの1つまたは複数の細胞成分の生物学的状態の1つまたは複数の態様を使用して前記モデルを特性づけることを含むステップと、
前記演算を1回または数回繰り返すステップであって、それによって前記複数のモデルを演算するステップと、
前記演算の事例において演算されたそれぞれの前記モデル特性付けを通信するステップと
を含む方法。
【請求項139】
データを受け取るステップであって、前記データが、ある1つの種の試験生物内または前記種の生物の試験生体標本内で測定された複数の細胞成分のうちのそれぞれの細胞成分の生物学的状態の1つまたは複数の態様を含むステップと、
複数のモデルを演算するステップであって、前記演算が、前記種の前記試験生物または前記種の前記生物の前記試験生体標本が生物学的サンプルクラスのメンバであるかどうかを指示する前記複数のモデルのうちのそれぞれのモデルのモデル特性付けを生み出し、前記演算が、前記複数の細胞成分のうちの1つまたは複数の細胞成分の生物学的状態の1つまたは複数の態様を使用して前記複数のモデルのうちのそれぞれの前記モデルを特性づけることを含むステップと、
演算されたそれぞれの前記モデル特性付けを通信するステップと
を含む方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate


【公表番号】特表2007−507770(P2007−507770A)
【公表日】平成19年3月29日(2007.3.29)
【国際特許分類】
【出願番号】特願2006−528327(P2006−528327)
【出願日】平成16年9月29日(2004.9.29)
【国際出願番号】PCT/US2004/032006
【国際公開番号】WO2005/042760
【国際公開日】平成17年5月12日(2005.5.12)
【出願人】(506103795)パスワーク インフォーマティクス,インコーポレーテッド (1)
【Fターム(参考)】