説明

腫瘍特性及びマーカーセットの同定のための方法、腫瘍分類、並びに癌のマーカーセット

腫瘍特性を同定するための方法であり、対象とする特性をそれぞれ予測する3つの異なるマーカーセットを得るステップと、腫瘍細胞から試料遺伝子発現シグナルを得るステップと、レポーターを加えて試料の変化に影響を及ぼし、腫瘍中の対象とする遺伝子発現シグナルの評価を可能にするステップと、遺伝子発現シグナルをレポーターと組み合わせるステップと、抽出された遺伝子発現シグナルを、3つの異なるマーカーセットと相関させるステップと、以下のランク付け:3つすべての予測遺伝子発現シグナルセットの相関が、腫瘍が関心対象の特性を有すると予測する場合、腫瘍は、悪性腫瘍と指定される、3つすべての予測遺伝子発現シグナルセットの相関が、腫瘍が関心対象の特性を欠いていると予測する場合、腫瘍は、良性腫瘍と指定される、3つすべての予測遺伝子発現シグナルセットの相関が、同じ臨床転帰の予測をもたらさない場合、腫瘍は、「中間」と指定されるに従って、抽出された遺伝子発現シグナルに指定を割り当てるステップと、前記指定を出力するステップとを含む。

【発明の詳細な説明】
【発明の分野】
【0001】
本発明は、癌バイオマーカー、並びに癌バイオマーカーの同定及び使用のための方法の分野に関する。
【発明の背景】
【0002】
癌についてより多くを理解するほど、より有効に癌を治療することができる。例えば、ほとんどの癌患者には、手術が行われる。しかし、一部の患者について、追加の治療を用いてさらなる利益が可能となり得る。術後の追加の療法(化学療法など)が有益である癌患者を判定するための満足のゆく手法は、現在のところ存在しない。予後予測のために使用することができる、癌細胞に特異的な遺伝子及びタンパク質の同定は、この点において役立つ。手術とその後の典型的な標準治療によってのみ治療される場合、回復についての予後不良に関連する腫瘍を同定するこれらの遺伝子/タンパク質は、予後不良バイオマーカーと呼ばれる。これらのバイオマーカーは、癌を診断した後の生存率を予測するため、術後の化学療法及び/又は放射線療法を行わずに、又は術後の典型的な標準治療処置のみを用いて、患者の経過が同様、又はより良好であるような、再発のリスクが十分に低い患者を識別するため、並びに最良の転帰を得るのに腫瘍学者が癌を治療するためにとるべき方法を誘導するための有益なツールとして使用することができる。
【0003】
同様に、薬物反応において役割を果たす、癌において発現される遺伝子が存在する。臨床的な決定をする際、予測された薬物反応に対する情報を有することは有用である。
【0004】
臨床的に興味を引く、十分な精度を有するスクリーニングツールを提供するために、好ましくは、1つのタイプの癌について複数のマーカーを考慮するべきである。1つの遺伝子マーカーは、十分なレベルの特異性及び感度をもたらさない。例として、25,000を超える遺伝子を同時に測定することができるマイクロアレイ技術は、複数のマーカーを見出すために有用なツールを提供する。
【0005】
本発明の目的は、対象とする腫瘍特性を同定するのに使用するためのマーカーのセット、並びにこれらのマーカーセットの同定及び使用のための方法を提供することである。
【発明の概要】
【0006】
一実施形態における本発明は、遺伝子のグループに基づいて、「良性」と「悪性」の腫瘍を区別するための、遺伝子発現プロファイルの利用を教示する。本明細書で使用する場合、予測因子及び患者生存率を参照する際、用語「良性腫瘍」は、化学療法又は放射線療法を用いずに(これが典型的な標準治療の一部であっても)、手術及び単に典型的な標準治療によって治癒する見込みのある腫瘍を指す。本明細書で使用する場合、用語「悪性腫瘍」は、手術、及び化学療法又は放射線療法を含む、単に典型的な標準治療によって治癒する見込みのない腫瘍を指す。本明細書で使用する場合、患者が、手術をして5年又は10年以内に、腫瘍の再発(又は腫瘍の転移)を経験していない場合、腫瘍は「治癒」している。
【0007】
発現プロファイルが「良性」と「悪性」の腫瘍を区別することができる遺伝子のセットを同定することが可能である。先行技術により、5つのそのような遺伝子発現シグナルセットが開示されており、これらは、乳癌試料についてのバイオマーカーとして開発された。各遺伝子発現シグナルセットは、一連の乳房腫瘍試料から得られた。しかし、これらの5つのバイオマーカーセットは、交差使用(cross−used)ができない。具体的には、先行技術のいわゆる「乳癌バイオマーカー」は、別のセットの乳房腫瘍試料において使用される場合、予後を一貫して予測するものとして認められていない。他のタイプの癌についてのバイオマーカーも、同じ問題を有する。癌は、非常に不均質である。しばしば、1つのタイプの癌について、いくつかのサブタイプが見出される場合がある。以前に開示されたマーカーセットは、これらのサブタイプについて十分に万能でない。
【0008】
これらの問題、及びデータセット(試料)利用可能性の制限を克服するために、バイオマーカーのセットを見つけ、使用するための新しい手法が開発された。
【0009】
本発明の一実施形態では、バイオマーカーの強力なセットを見出すため、患者の遺伝子発現プロファイル及び臨床情報が含まれていた、公開されている癌データセットからランダムトレーニングデータセットが生成された。ランダムトレーニングデータセットの遺伝子発現プロファイルは、患者生存状態及びスクリーニングバイオマーカーと相関させた。
【0010】
本発明の一実施形態では、バイオマーカーを同定する方法であって、
現在利用可能なデータセット(腫瘍マイクロアレイプロファイリング+癌患者の臨床情報)からランダムトレーニングデータセットを生成するステップと、
予後についての予測力を有する遺伝子発現シグナルセットを同定するために、ランダムトレーニングデータセットについて遺伝子発現シグナルセットをスクリーニングするステップと、
遺伝子が、良好な予測力を有する遺伝子発現シグナルセットにおいて出現した頻度に基づいて(直前のステップのスクリーニングによって)遺伝子をランク付けし、それによってバイオマーカーセットを構築するステップと、
予測のための、3〜6のバイオマーカーセットの組み合わせ利用(即ち、試料Aが、3つすべてのバイオマーカーセットによって、「良性腫瘍」として予測される場合、本発明者らは、試料Aは、「良性腫瘍」(低リスク)であるとし、すべてのバイオマーカーセットが「悪性」とする場合、本発明者らは、試料Aは、「悪性」(高リスク)であるとし、そうでなければ、本発明者らは、試料Aは中間リスクのものであるとする)ステップと、
他の独立したデータセットを使用してマーカーを検証するステップと
を含む方法が提供される。
【0011】
「遺伝子発現シグナル」は、mRNA又はタンパク質などの遺伝子の発現の有形の指標である。
【0012】
本発明の一実施形態では、腫瘍特性を同定するための方法であって、以下のステップ、 1)対象とする特性をそれぞれ予測する3つの異なるマーカーセットを得るステップと、
2)腫瘍細胞から遺伝子発現シグナルを抽出するステップと、
3)抽出された遺伝子発現シグナルを、3つの異なるマーカーセットと相関させるステップと、
4)以下の、
a.3つすべての予測遺伝子発現シグナルセットの相関が、腫瘍が関心対象の特性を有すると予測する場合、腫瘍は悪性腫瘍と指定される、
b.3つすべての予測遺伝子発現シグナルセットの相関が、腫瘍が関心対象の特性を欠いていると予測する場合、腫瘍は、良性腫瘍と指定される、
c.3つすべての予測遺伝子発現シグナルセットの相関が、同じ臨床転帰予測をもたらさない場合、腫瘍は、「中間」と指定される
というランク付けに従って、抽出された遺伝子発現シグナルに値を割り当てるステップと
を含む方法が提供される。
【0013】
いくつかの場合では、関心対象の特性は、転移、炎症、細胞周期、免疫応答遺伝子、薬剤耐性遺伝子、及び多剤耐性遺伝子のうちの1つ又は複数に関係する。いくつかの場合では、腫瘍特性によって、特定の治療又は治療の組合せが決定する。
【0014】
いくつかの場合では、腫瘍特性は、術後の患者生存率不良をもたらす傾向である。
【0015】
いくつかの場合では、腫瘍特性は、患者の生存率に関係し、上記方法のステップ4は、以下の、
a.3つすべての予測遺伝子発現シグナルセットの相関が、腫瘍を悪性腫瘍であると予測する場合、腫瘍は、悪性腫瘍と指定され、典型的な標準治療よりも積極的な治療が推奨される、
b.3つすべての予測遺伝子発現シグナルセットの相関が、腫瘍を良性腫瘍であると予測する場合、標準治療の範囲を超える治療は推奨されず、術後の化学療法も放射線療法も推奨されない、
c.3つすべての予測遺伝子発現シグナルセットの相関が、同じ予後をもたらさない場合、腫瘍は、「中間」と指定され、化学療法及び/又は放射線療法を含む、完全な典型的な標準治療処置が推奨される、
というランク付けに従って、抽出された遺伝子発現シグナルに値を割り当てるステップを含む。
【0016】
癌が複数のサブタイプを有する場合には、
a)検査される腫瘍サブタイプを同定するステップ、
b)その腫瘍サブタイプに特異的なマーカーセットを選択するステップ
という予備ステップを含むことが望ましい場合がある。
【0017】
いくつかの場合では、対象とする腫瘍特性は、腫瘍が化学療法剤又は放射線などの特定の治療に応答する傾向である。そのような場合では、遺伝子発現シグナルは、トレーニングセットを開発するプロセスにおいて、腫瘍薬物反応と相関する。特定の薬物に対する「良性」の腫瘍の応答は、治療後に、平均未満の腫瘍生存率となり、「悪性」の応答は、治療後に、平均を超える腫瘍生存率となることが理解されるであろう。この手法を使用して、元の腫瘍に関して利用可能な詳細、及びトレーニングセットを開発するのに使用される臨床的データに応じて、個々の薬物又は治療に対する応答についてだけでなく、治療の組合せに対する応答のマーカーを開発することが可能である(これを可能にするのに、元の情報源に十分なデータが存在する場合)。
【0018】
本発明の一実施形態では、上述した方法において有用なタイプの予測遺伝子発現シグナルセットを決定するための方法であって、以下のステップ、
1)対象とする癌について既知の腫瘍集団に関する対象とする特性についての、遺伝子発現シグナル情報及び患者の臨床情報を得るステップと、
2)遺伝子発現シグナルを、対象とする特性に関する臨床患者情報と相関させて、臨床転帰についての予測力を有する遺伝子を同定するステップと、
3)ステップ1から少なくとも30のランダムトレーニングデータセットを作るステップと、
4)ステップ3の同定された遺伝子発現シグナルを、癌において活性な既知の遺伝子のリストと比較するステップと、
5)既知の癌遺伝子のリスト上の遺伝子発現シグナルに対応する、同定された遺伝子発現シグナルを選択するステップと、
6)生物学的プロセスにおけるその役割によって、選択された、同定された遺伝子発現シグナルをグループ化するステップと、
7)ステップ6の選択された遺伝子発現シグナルグループから、少なくとも25遺伝子のランダム遺伝子発現シグナルセットを生成するステップと、
8)ランダム遺伝子発現シグナルセットを、ステップ3のランダムトレーニングデータセットと相関させるステップと、
9)ステップ7の各遺伝子発現シグナルセットについての相関から、生存率スクリーニング(survival screening)についてのP値を得るステップと、
10)遺伝子発現シグナルセットのP値が、ランダムトレーニングデータセットの90%超について0.05未満である場合、この遺伝子発現シグナルセットを確保するステップと、
11)セット内の遺伝子出現の頻度に基づいて、ステップ10において確保されたランダム遺伝子発現シグナルセットをランク付けするステップと、
12)可能性のある候補マーカーとして、少なくとも上位26遺伝子を選択するステップと、
13)ステップ7〜12を繰り返し、別の独立した、少なくとも26遺伝子のランクセットを作製するステップと、
14)ステップ12及びステップ13からの上位遺伝子を比較するステップと、
15)25を超える遺伝子が同じである場合、この上位遺伝子がマーカーセットとして確保されるステップと、
16)ステップ7〜15を2回繰り返して、3つの異なるマーカーセットを得るステップと、
を含む方法が提供される。
【0019】
本発明の一実施形態では、典型的な標準治療よりも積極的、又は消極的な治療を必要とする患者を識別する方法であって、
「遺伝子発現シグナル」は、mRNAなどの遺伝子の発現の有形の指標である(理論上、そうすることが技術的に実現可能である場合、代わりにタンパク質発現を測定することができるか?他に何かあるか?)
1.腫瘍情報及び臨床患者情報を含む情報源が、個々に試験される。どの遺伝子が、その個々の情報源内で予後についての予測力を有するかを識別するために、細胞内のすべての報告された遺伝子発現シグナルが、患者の生存率(5年及び10年)と相関される。患者の生存率と有意に相関すると見出された遺伝子発現シグナルが、さらなる検査のために同定される。
2.ステップ1において同定された遺伝子発現シグナルは、既知の癌遺伝子のリストと比較され、癌において役割を有することが知られている既知の遺伝子に対応する遺伝子発現シグナルが、さらなる分析のために選択される。(これは、一般には、数百〜数千の遺伝子発現シグナルのリストを生じさせることになる)
3.少なくとも30(一般に30〜40の間)のランダムトレーニングデータセットが、ステップ1の情報源から作製される。同じ個々の遺伝子発現シグナルが、複数のランダムトレーニングデータセット中に出現する場合がある。
4.ステップ2において選択された遺伝子発現シグナルは、生物学的プロセスにおけるその役割に従ってグループ化される(例えば、細胞周期遺伝子、細胞死遺伝子、免疫応答遺伝子、炎症遺伝子などGO解析)。
5.ランダム遺伝子発現シグナルセット(一般に、約百万)が生成され、それぞれは、ステップ3において作製された1つのグループからランダムに選択された約30の遺伝子を含有する。
6.各ランダムトレーニングデータセットに対する、ステップ4の各ランダム遺伝子発現シグナルセットの生存率スクリーニングについてのP値が得られる。もう少しこの相関について記述してもらえないか?
7.P値が、ランダムデータセットの90%超について0.05未満である場合、このランダム遺伝子セットは確保される。
8.ステップ7からの確保されたランダム遺伝子発現シグナルセットは、これらにおいて出現する遺伝子の頻度に基づいてランク付けされる。
9.ステップ8において決定された、最高の予測値を有する上位30遺伝子(ステップ8でランク付けされた)が、可能性のある候補として選択される。
10.ステップ5〜9が繰り返され、ステップ3において形成された各グループからランダム遺伝子発現シグナルセットを生成することから開始して、可能性のある候補である上位30遺伝子の別の、独立したランク付けされたセットを作製する。
11.ステップ10において生じた上位30遺伝子が、ステップ9からの上位30遺伝子と比較される。30のうち25以上が同じである場合、これは、「安定なサイン」と呼ばれ、患者試料のスクリーニングに有用である。25/30未満が同じである場合、データは破棄される(両セットの可能性のある候補から)。少なくとも25が必要であり、したがって、潜在的な候補の第1又は第2のセットを使用することができる。
12.ステップ5〜11が、遺伝子発現シグナルの2つの他のグループ(ステップ3の)のために、さらに2回繰り返される。したがって、ステップ3からの異なるグループにそれぞれ関係する、3つのセットの安定なサインが存在することになる。
13.患者からの癌細胞を検査して、その遺伝子発現活性、及び3つの安定なサイン中の遺伝子発現シグナルとのその活性の相関を評価する。典型的に、安定なサインは、転移の見込みの暗示となり、したがって、そのサインに整合する高い患者発現は、「悪性」腫瘍を示すことになる。しかし、安定なサインは、アポトーシス遺伝子などの発現されている保護遺伝子を示す場合があることもあり得、この場合、そのサインについて、こうした遺伝子発現サインの高い患者発現量は、「良性」腫瘍を示す。いずれの場合においても、各安定なサインは、患者試料と比較され、「良性」腫瘍又は「悪性」腫瘍の予測は、各安定なサインによって個々に行われる。1つの安定なサインからの「悪性」又は「良性」の暗示についての境界は何か?例えば、サイン中に見出される遺伝子の50%超が、試料中に発現される場合、「悪性」か?サイン中に見出される遺伝子の50%超が、対応する非癌組織における正常な基礎レベルを超えて発現される場合、「悪性」か?
14.患者試料に関する遺伝子発現シグナルの3つのセットのそれぞれの予測を合わせ、以下、
(a)3つすべての遺伝子発現シグナルセット(サイン)が、腫瘍を悪性腫瘍であると予測する場合、腫瘍は、悪性腫瘍と指定され、患者は、典型的な標準治療よりも積極的な治療が提供されるべきであり、
(b)3つすべてのデータセットが、腫瘍を良性腫瘍であると予測する場合、患者は、標準治療以外の治療を受けるべきでなく、術後の化学療法も放射線療法も受けるべきでなく、
(c)3つすべてのセットの遺伝子発現産物が、同じ予後をもたらさない場合、腫瘍は、「中間」と指定され、患者は、化学療法及び/又は放射線療法を含む、完全な典型的な標準治療処置を受けるべきであるように腫瘍に値を割り当てるステップ
を含む方法が提供される。
【0020】
いくつかの場合では、この方法について、生物学的プロセスにおけるその役割によって、遺伝子オントロジー(Gene Ontology)分析を使用して、選択された、同定された遺伝子発現シグナルをグループ化することが望ましいであろう。
【0021】
30〜50の間のランダムトレーニングセットが作られることが好ましい。30〜40の間のトレーニングセットが作られることがより好ましい。
【0022】
転移、細胞増殖、腫瘍血管新生、及び薬物反応に関与する遺伝子のグループから、癌において活性であることが知られている遺伝子を選択することが、時には望ましいであろう。
【0023】
上述した方法を伴う本発明のいくつかの実施形態では、ステップ7において、約750,000〜1,250,000の間、又は約900,000〜1,100,000の間、又は約100万のランダム遺伝子発現シグナルセットが生成される。上記方法において記載されたような本発明のいくつかの実施形態では、ステップ7において、生成されたランダム遺伝子発現シグナルセットは、約25〜50の間、又は28〜32、又は約30の遺伝子を含有する。
【0024】
上記方法において記載されたような本発明の一実施形態では、ステップ12において、上位26〜50、又は28〜32、又は約30の遺伝子が選択される。
【0025】
いくつかの場合では、患者生存率に関係する腫瘍特性を考慮する場合、NRC−1、NRC−2、NRC−3、NRC−4、NRC−5、NRC−6、NRC−7、NRC−8、及びNRC−9から本質的になるリストから選択される少なくとも1つの癌バイオマーカーセットを使用することが望ましいであろう。
【0026】
本発明の一実施形態では、対象とする腫瘍特性を同定するために、上述した方法を実施するための少なくとも3つのマーカーセット及び使用説明書を含むキットが提供される。いくつかの場合では、キットは、表1A又は1B中に列挙された少なくとも10の遺伝子発現シグナルを含むことになる。いくつかの場合では、キットは、上述した方法に従って同定された、少なくとも30の核酸バイオマーカーを含むことになる。
【0027】
本発明の一実施形態では、対象とする1つ又は複数の腫瘍特性の同定における、表1A又は1B中の遺伝子発現シグナルのいずれかの使用が提供される。いくつかの場合では、少なくとも3つの異なるマーカーセットが使用され、いくつかの場合では、少なくとも1、2、又は3つのマーカーセットは表1A又は1B中に見出される遺伝子発現シグナルの少なくとも1、5、10、20、又は25を含む。いくつかの場合では、各マーカーセットは、表1A又は1B中に見出される遺伝子発現シグナルの少なくとも1、5、10、20、又は25を含有する。
【0028】
本発明の一実施形態では、癌バイオマーカーは乳癌バイオマーカーであり、第1のサブタイプの試料はER+試料である。
【0029】
本発明の一実施形態では、上述した方法において、ランダムトレーニングセットは、選ばれる方のセットと同じ「良性」腫瘍と「悪性」腫瘍の比を維持しながら、試料をランダムに選ぶことによって生成される。
【0030】
いくつかの場合では、対象とする腫瘍特性(複数可)は、患者生存率(例えば、手術及び典型的な標準治療後の)に関係することになり、そのような場合では、本方法を典型的な標準治療よりも積極的又は消極的な治療を必要とする患者を識別するためにしようすることができる。(化学療法及び放射線療法は、それ自体では危険である。したがって、これらの療法を必要としない患者に、そのような治療を提供するのを回避することが最良である。)
【0031】
いくつかの場合では、遺伝子発現シグナル(例えば、mRNA、タンパク質)を抽出し、対象とする遺伝子発現シグナルに特異的なレポーターを使用して、対象とする遺伝子発現シグナルの存在(いくつかの場合では、レベル)をアッセイすることによって、患者の腫瘍組織を試験することが望ましいであろう。これは、複数の遺伝子発現シグナルの検査を本質的に同時に可能にするマイクロアレイ形式で行うことができる。レポーターは、対象とする核酸配列に結合するプローブ、対象とするタンパク質に特異的な抗体、又は任意の他のそのような物質とすることができる(多くのそのようなレポーターは、当技術分野において公知であり、日常的に使用される)。レポーターは、試料の変化を生じさせ、対象とする遺伝子発現シグナルの評価を可能にする。いくつかの場合では、生じる変化は、試料の光学的側面の変化である場合があり、他の場合では、変化は、試料の放射性特性又は蛍光特性などの試料の別のアッセイ可能な側面の変化である場合がある。
【0032】
特定のタイプの癌が、1つ以上のサブタイプ(例えば、ER+及びER−乳癌)を有する状況では、患者の癌をサブタイプによって最初にグループ化し、次いでグループ化されたサブタイプに関連して作製されたマーカーを使用することが好ましいであろう。
【0033】
いくつかの場合では、対象とする腫瘍特性(複数可)は、特定の治療(複数可)に対する腫瘍の応答に関係し、そのような場合では、本方法は、腫瘍を有する患者にとって有望な治療手法(1つ若しくは複数の化学療法、又は治療の組合せ)を特定するために使用することできる。
【0034】
本明細書で使用する場合、「腫瘍」は、患者において破壊又は中和することが望ましい任意の癌細胞を含む。例えば、腫瘍は、固形腫瘍、骨髄腫、リンパ腫、及び白血病において見出される癌細胞を含むことができる。
【0035】
腫瘍は一般に、哺乳動物又はトリの腫瘍であり、ヒト、類人猿、ネコ、イヌ、ブタ、ウシ、ヒツジ、ヤギ、ウサギ、マウス、ラット、モルモット、ハムスター、アレチネズミ、ニワトリ、アヒル、又はガチョウの腫瘍であってもよい。
【0036】
遺伝子発現シグナルの3つの独立したセットを組み合わせて使用することは、本明細書に記載される手法によって作製される遺伝子発現シグナルに限定されず、商業的に販売され、又は文献に報告されている癌バイオマーカーデータセットに適用することもできることが明らかとなるであろう。(最終的なスクリーニング結果の信頼性は、使用されるセットのロバスト性にある程度依存することになるが、したがって、強力な癌バイオマーカーデータセットを使用することが推奨される)。場合によっては、異なる生物学的プロセスに関与する遺伝子を含む癌バイオマーカーデータセット(例えば、1つのデータセットは、炎症に関係することができ、別のデータセットは、細胞周期に関係してもよく、第3のデータセットは転移に関係してもよい)を選択することが望ましいであろう。
【0037】
本方法は、一般的であり、任意のタイプの癌に適用することができる。例えば、本方法は、表4に列挙された癌タイプに関して有用である。
【0038】
本発明の一実施形態では、本方法は、乳癌患者を、手術後にどれぐらい積極的に治療すべきかを判定するのに適用される。
【0039】
本方法の一実施形態を、実施例1の説明と並行して以下に提供する:
【0040】
ステップ1:癌細胞遺伝子マイクロアレイデータ、及び腫瘍患者の生存率情報を使用して、自動生存率スクリーニング法を開発するステップ。(非限定例として、公開されている乳癌データセット(295試料、Changら、PNAS 102:3738、2005)をスクリーニングするために、表面タンパク質及び分泌タンパク質が、JM01細胞株(マウス乳癌細胞株、インハウス細胞株及びデータ)のマイクロアレイデータから同定された)。用語「生存率スクリーニング」は、Cox−Mantelログランク検定を実行することにより、Kaplan−Meier分析を実施することによる、各1つの遺伝子発現値と患者の生存状態(「良い」又は「悪い」)の間の相関の統計的有意性の検査として定義される(Cuiら、Molecular Systems Biology、3:152、2007)。このスクリーニングから、それぞれ単独で「良性」腫瘍及び「悪性」腫瘍を区別することができる7つのタンパク質が得られた。例として、実施例1の一部において、元の細胞株において実験的検証するために、タンパク質(MMP9)が選択された。MMP9抗体を細胞株に適用する場合、癌進行における上皮間葉移行が遮断された。この結果は、本方法は、転移関連遺伝子を見出すのに適していることを示す。
【0041】
ステップ2:発現値が乳癌患者生存率と相関する遺伝子のゲノム全体での生存率スクリーニングを行うステップが行われた。(実施例1において、データセット1(78試料、van’t Veerら、Nature、2002)、及びデータセット2(286試料、Wangら、Lancet、365:671、2005)として定義された2つのトレーニングデータセットが使用された)。得られる遺伝子発現シグナルリストはそれぞれ、S1、及びS2と呼ばれる。これらの2つのリストの全遺伝子は、St遺伝子発現シグナルリスト(St=S1+S2)と呼ばれる。
【0042】
ステップ3:対象とする癌が複数のサブタイプを有する場合、第1のサブタイプのマーカーが生成される。(例えば、実施例1において、ER+及びER−マーカーが生成された)。実施例1において、ER+腫瘍マーカーは、上記データセットからすべてのER+試料を抽出することによって生成され、それぞれ、S1−ER+セット(データセット1から抽出された)及びS2−ER+セット(データセット2から抽出された)と定義された。S2−ER+セットからN個の試料(N=60)をランダムに選ぶことによって、35個のランダムトレーニングセットが生成される。「良性」腫瘍と「悪性」腫瘍の比は、S2−ER+セットにおける比と本質的に同じに保存される。上述した35のランダムトレーニングセットにS1−ER+を加えることによって、36のトレーニングセットが得られる。
【0043】
ステップ4:ステップ2の繰り返しを含むが、第1の腫瘍サブタイプについてのサブセット、例えば、実施例1におけるS1−ER+セット及びS2−ER+セットのデータセットを使用する、ゲノム全体での生存率スクリーニングによって、遺伝子発現シグナルリスト(実施例1において、St−ER+遺伝子発現シグナルリスト)を得るステップ。St−ER+遺伝子発現シグナルリストを使用して、遺伝子オントロジー(GO)分析(GOアノテーションソフトウェア、David、http://david.abcc.ncifcrf.gov/を使用して)が実施され、癌に関連することが知られているGOターム、例えば、細胞周期、細胞死などに属する遺伝子のみが、さらなるマーカースクリーニングのために使用される。
【0044】
ステップ5:100万の異なるランダム遺伝子セット(各ランダム遺伝子セットは、30遺伝子を含有する)が、各選択されたGOタームでアノテートされた遺伝子(1つのGOタームでアノテートされた遺伝子から30遺伝子をランダムに選ぶことによって、1GOターム当たり通常約60〜80遺伝子)から生成される。
【0045】
ステップ6及び7:好ましくは、すべての第1の腫瘍サブタイプトレーニングセット(例えば、実施例1において、36のER+トレーニングセット)(ステップ3で生成された)に対して100万のランダム遺伝子セットを使用して、さらなる生存率スクリーニングが行われる。各トレーニングセットについて、各ランダム遺伝子セット(30遺伝子)の発現値と患者の生存状態(「良い」又は「悪い」)の間の相関の統計的有意性が、例えば、Cox−Mantelログランク検定を実行することにより、Kaplan−Meier分析を実施することによって検査される。1つのトレーニングセットに対して1つのランダム遺伝子セットを使用する生存率スクリーニングについて、P値が0.05未満である場合、そのランダム遺伝子セットは、そのトレーニングセットに合格したと言われる。
【0046】
ステップ7:すべての第1のサブタイプ(例えば、36のER+)トレーニングセットが、2,000超のランダム遺伝子セットを合格させ、又は0.05超のP値が、ランダムトレーニングデータセットの90%超について得られた場合、これらの合格したランダム遺伝子セットは確保される。
【0047】
ステップ8:ステップ7に記載の確保されたランダム遺伝子セット中の遺伝子が、合格したランダム遺伝子セット中の出現頻度に基づいてランク付けされる。
【0048】
ステップ9:上位30遺伝子(可能性のあるマーカーセットとして定義される)が、可能性のあるマーカーセットとして選ばれる。30遺伝子が好適であるが、20〜40の間、より好ましくは25〜35の間、又はより好ましくは27〜33の間を使用することができることに留意すべきである。場合によっては、25〜30の個々の遺伝子発現シグナルが、スクリーニング目的のために使用される各セットにおいて望まれ、したがって、様々な入力数を、この出力を生じさせるのに使用することができる。
【0049】
ステップ10:ステップ5で最初に使用された同じGOタームを使用してステップ5が繰り返され、別の100万の異なるランダム遺伝子セットが生成され、これらは、ステップ6及び7を繰り返すのに使用される。
【0050】
ステップ11:上位30の遺伝子メンバーが、可能性のあるマーカーセット(ステップ9)中のメンバーと実質的に同じである場合、この可能性のあるマーカーセットは安定であり、実際の癌バイオマーカーセットとして使用することができることを意味する。この可能性のあるマーカーセットは、マーカーセットとして指定され(このマーカーセットは、この時点で患者に使用することができる)。2つの可能性のあるマーカーセットについての遺伝子発現シグナルが実質的に同じでない場合、これらのGOターム遺伝子は、バイオマーカーセットを見つけるのに不適当であるという暗示であり、この可能性のあるマーカーセットは、さらなる分析から外される。いくつかの場合では、可能性のあるマーカーセットをマーカーセットとして指定する前に、2つの潜在的なマーカー中で、30の遺伝子発現シグナルのうち少なくとも25が同じであることが望ましいであろう。いくつかの場合では、2つの可能性のあるマーカーセット中で、遺伝子発現シグナルの26、27、28、29、又は30が同じであることが望ましいであろう。
【0051】
ステップ12:遺伝子発現シグナルの2つの他のグループ(ステップ3の)について、ステップ5〜11がさらに2回繰り返される。したがって、3つの安定なサインセットが存在することになり、それぞれは、ステップ3からの異なるグループに関係する。
【0052】
実施例1において、3セットのマーカー(それぞれ、NRC−1、NRC−2、及びNRC−3と呼ばれ、各セットは30遺伝子を含有する。表1を参照。)が得られ、ER+トレーニングセット(S1−ER+及びS2−ER+)において試験された。試験プロセスが例示されている。各トレーニングセット中の試料は、3つのグループ、即ち、低リスクグループ、中間リスクグループ及び高リスクグループに分割することができる。
【0053】
任意選択のステップ12b:実施例1で実施された任意選択のステップとして、高リスクグループをさらに階層化するためにバイオマーカーセットをさらに分析することが有用となり得る。このステップでは、高リスクグループから試料を採取し(これは、実施例1において、トレーニングセット、S2−ER+のNRC−1、NRC−2、及びNRC−3によって階層化された)、ステップ3、4、5、6、7、及び8を繰り返すことを含む。
【0054】
実施例1において、別の3セットのマーカー(それぞれ、NRC−4、NRC−5、及びNRC−6と呼ばれる)が得られた。各セットは、30遺伝子を含有した(表1を参照)。これらのセットは、NRC−1、NRC−2、及びNRC−3によって階層化された高リスクグループを対象とした。
【0055】
ステップ12c:実験1で行われた任意選択のステップとして、第2のサブタイプの腫瘍(実施例1において、ER−腫瘍)のバイオマーカーを得るために、データセット1及び2中のすべての第2のサブタイプ試料が抽出される(例えば、それぞれ、データセット1及び2からのER−試料であり、それぞれ、S1−ER−(データセット1から抽出した)セット及びS2−ER−(データセット2から抽出した)セットと定義される)。35のランダムトレーニングセットは、データセット2、サブタイプ2セット(例えば、S2−ER−セット)からN試料(N=40)をランダムに選ぶことによって生成される。「良性」腫瘍と「悪性」腫瘍の比は、全体的なデータセット2、サブタイプ2セット(S2−ER−セット)における比と同様に維持される。トレーニングセットは、上述した35のランダムトレーニングセットに、データセット1、タイプ2(例えば、S1−ER−)を加えることによって得られる(実施例1において36)。データセット1、サブタイプ2(例えば、S1−ER−)及びデータセット2、サブタイプ2(例えば、S2−ER−)セットを使用してステップ4が繰り返されることによって、組み合わされたデータセット、サブタイプ2(例えば、St−ER−)遺伝子発現シグナルリストが得られ、次いでGO分析が実施される。次いで、ステップ5、6、7、及び8が繰り返される。
【0056】
実施例1において、別の3セットのマーカー(それぞれ、NRC−7、NRC−8、及びNRC−9と呼ばれる。各セットは、30遺伝子を含有する。表1を参照。)が得られた。これらのセットは、ER−試料のために使用された。
【0057】
試験プロセス
【0058】
一般的な概要、実施例1:実施例1において、各マーカーセットについて、ニアレストシュランケンセントロイド(nearest shrunken centroid)分類、及びリーブワンアウト方法を使用した。次いで、本発明者らは、各試料の再発を予測するために、3つのマーカーセットを一緒に組み合わせて使用した。
【0059】
n試料を含有する所与のデータセットについて、実施例1において使用した試験プロセスは、以下(ステップごとに)のものであった。
【0060】
ステップ13:対象とされる試験試料について、本発明者らは、マーカーセットの遺伝子発現プロファイルを抽出した。各遺伝子発現値について、本発明者らは、そのマーカーファクターを乗じ、試験試料の修正された遺伝子発現プロファイルを得る。本発明者らは、PAM方法(Tibshiraniら、PNAS、99:6567、2002)を使用して、マーカーセットについてのn−1試料から、「良性」クラス及び「悪性」クラスの両方について標準化されたセントロイドを計算した。各遺伝子のマーカーファクターをクラスセントロイドに乗じ、マーカーセットの修正されたクラスセントロイドを得る。
【0061】
マーカーセットを使用して対象とされる試験試料の再発を予測するために、本発明者らは、試料の修正された遺伝子発現プロファイルを、これらの修正されたクラスセントロイドのそれぞれと比較する。二乗距離において、セントロイドが最も近いクラスが、その試料について予測されるクラスである。試料が「良性」腫瘍と予測される場合、試料は0と表され、そうでなければ、試料は1と表される。
【0062】
ステップ14:ER+試料について、試料が、3つすべてのマーカーセットについて0として予測した場合、本発明者らは、この試料を低リスクグループに割り当て、試料が、3つすべてのマーカーセットについて1として予測した場合、本発明者らは、この試料を高リスクグループに割り当て、試料が、低リスクグループにも高リスクグループにも割り当てられない場合、本発明者らは、この試料を中間リスクグループに割り当てる。ER−試料について、試料が、3つすべてのマーカーセットについて0として予測した場合、本発明者らは、この試料を低リスクグループに割り当て、その他の場合では、本発明者らは、この試料を、高リスクグループに割り当てる。これは、不明瞭な試料を中間グループに割り当てる常套手段の修正である。侵襲性の強い癌のサブタイプの場合では、明らかに低リスクでないすべての癌を高リスクとして分類し、この癌を、通常の標準治療を超えて積極的に治療することが望ましい場合がある。
【0063】
3つの試験データセットにおけるマーカーセットの検証
【0064】
マーカーセットのロバスト性及び予測精度を試験するために、本発明者らは、これらの刊行物(Koeら、Cancer Cell、2006;Changら、PNAS 102:3738、2005、及びSotiriou Cら、J.Natl Cancer Inst、98:262、2006)からの3つの独立した乳癌データセットにおいてマーカーセットを試験し、合計で644試料を試験した。
【0065】
ER+試料について、各データセットにおいて、試料を、低リスクグループ(LG)、中間リスクグループ(MG)、及び高リスクグループ(HG)に階層化するために、本発明者らはまず、NRC−1、NRC−2、及びNRC−3マーカーセット(上述した3つの乳癌データセットからの)をした。高リスクグループの試料が10未満であった場合、本発明者らは、MGグループとHGグループを混合し、混合したグループを中間リスクグループと呼んだ。そうでなければ、本発明者らは、NRC−4、NRC−5、及びNRC−6マーカーセットを使用して、HGグループを低リスクグループ(NLG)、中間リスクグループ(NMG)、及び高リスクグループ(NHG)の3つの新しいグループに階層化した。本発明者らは、NLGとMGを混合し、これを中間リスクグループと呼び、NMGとNHGを混合して、これを高リスクグループと呼んだ。LGは、低リスクグループである。本発明者らは、低リスクグループについて高い予測可能性精度(非再発患者について約90%)を伴う非常に良好な結果を得て、3つすべての試験データセットにおいて3つのグループをうまく分類した(表2を参照)。
【0066】
ER−試料について、各データセットにおいて、試料を低い(LG)、及び高い(HG)リスクグループに階層化するため、本発明者らは、NRC−7、NRC−8、及びNRC−9マーカーセットを使用した。本発明者らは、これについても高い予測可能性精度(非再発患者について約92〜100%)を伴う非常に良好な結果を得、3つすべての試験データセットにおいて2つのグループをうまく分類した(表2を参照)。
【0067】
マーカーセットを組み合わせて利用することにより、予測精度が改善される
【0068】
ER+試料について、NRC−1、NRC−2、及びNRC−3がすべて、試料を「良性」腫瘍として予測することに一致している場合、精度は、1つのマーカーセット、例えば、NRC−1、NRC−2、又はNRC−3などを使用するより有意に改善された(表3)。NRC−7、NRC−8、及びNRC−9がすべて、ER−試料について試料を「良性」腫瘍として予測するのに一致している場合、同じ結果が得られた(表3)。一般に、3つのマーカーセットの統合的な利用は、1つのセットを使用することに対して、予測精度が改善されることが見出される。本発明の一実施形態では、精度は、約70%から約90%に改善された。本発明の一実施形態では、精度は少なくとも90%である。別の実施形態では、精度は少なくとも95%である。
【0069】
したがって、バイオマーカーの強力なセット、及びその使用が本明細書で提供される。
【0070】
癌のタイプ、及び患者の状態に応じて、異なる遺伝子プロファイルが「悪性」とみなされる場合があることが理解されるであろう。転移は、癌を有する患者の治療方法を決定する際に重要な要因であると一般に考えられ、例えば、本明細書に開示されるようなバイオマーカーセットのセットは、その目的に有用である。さらに、バイオマーカーセットは、1つ又は複数の特定の薬物に十分に(又は不十分に)反応する見込みのある癌細胞タイプを同定するのに使用することができる。「良性」又は「悪性」とみなされる正確な要因に関わらず、「良性」遺伝子及び「悪性」遺伝子の両方を含有するトレーニングセットS1及びS2からこの方法を開始することが通常望ましい。高度に発現された標的はしばしば、良好な薬物標的になるため、遺伝子発現のレベルを、良好な薬物標的を同定する場合に考慮することができる。
【0071】
一般に、低リスクグループ(「良好な予後のサイン」を有する)は、治療に進まないが、高リスクグループ(「不良の予後のサイン」を有する)は、手術に加えて治療を受けるべきである。一般に、中間リスクグループも同様に、手術に加えて治療を受けることになるが、これは、そのタイプの腫瘍についての典型的な標準治療に依存する。
【0072】
本明細書に開示されるバイオマーカーセットのそれぞれは単独に、追加の治療の必要性を予測するのに有用であるが、全体的な予測精度は、複数のバイオマーカーセットを使用することによって、著しく改善することができる。
【0073】
例えば、患者試料が、NRC_1、NRC_2、及びNRC_3に対してスクリーニングされ、3つすべてのセットが、「良好な」予後を示す場合、患者は低リスクであるとみなされる。すべてが「悪性の」予後を示す場合、試料は高リスクであるとみなされる。1つ又は2つのセットが「悪性」を示し、他のセット(複数可)が「良性」を示す場合、癌は、中間リスクであるとみなされる。
【0074】
本発明の一実施形態では、患者試料が、任意の1つのバイオマーカーセット(例えば、NRC_1)に関して「良性」又は「悪性」であるかを判定するために、バイオマーカーセットは、多数の患者に由来する試料を代表する2つのバンク(bank)の癌細胞を独立にスクリーニングするのに使用される。第1のバンクは、「良性」癌細胞(転移などの関心対象の挙動又は特性を示さない既知の病歴を持つ)を代表し、第2のバンクは、「悪性」癌細胞(関心対象の挙動又は特性を示す既知の病歴を持つ)を代表す。「良性」バンク及び「悪性」バンクのそれぞれは、各バイオマーカーセットについて、それぞれ、遺伝子発現サイン(「良性」腫瘍及び「悪性」腫瘍について、標準的な「良性」及び「悪性」遺伝子発現サイン)を生じさせる。患者試料について、患者試料のバイオマーカーセットの遺伝子発現サインは、そのバイオマーカーセットの標準的な「良性」及び「悪性」遺伝子発現サインと比較される。そのバイオマーカーセットの標準的な「悪性」サインと最も密接に類似する患者試料は、「悪性」とみなされ、そのバイオマーカーセットの標準的な「良性」サインと最も密接に類似する患者試料は、「良性」とみなされる。
【0075】
本方法は、いくつかの場合では、以下の癌バイオマーカーセット、即ち、NRC−1、NRC−2、NRC−3、NRC−4、NRC−5、NRC−6、NRC−7、NRC−8、NRC−9のうちの1つ又は複数を組み合わせて使用することを含む。
【0076】
サブタイプが同定された場合(この例ではER+/ER−)の本方法の使用についての1つの可能な手法の例:
癌細胞の腫瘍試料についてER状態が判断される。(これは、臨床の場において行われることが多い)
ER+試料について、試料が、3つすべてのマーカーセット(NRC−1、NRC−2、及びNRC−3)について「良性」と予測された場合、試料は、低リスクグループに割り当てられ、試料が、3つすべてのマーカーセットについて「悪性」と予測された場合、試料は、高リスクグループに割り当てられ、試料が、低リスクグループにも、高リスクグループにも割り当てられない場合、試料は、中間リスクグループに割り当てられる。
マーカーセット(NRC−1、NRC−2、及びNRC−3)によって定義されるER+高リスクグループについては、マーカーセット(NRC−4、NRC−5、及びNRC−6)を使用して再び予測される。試料が、3つすべてのマーカーセットについて「悪性」であると予測された場合、試料は、高リスクグループに割り当てられる。そうでなければ、試料は、NRC−1、NRC−2、及びNRC−3によって定義される中間リスクグループに割り当てられる。
ER−試料について、試料は、3つすべてのマーカーセット(NRC−7、NRC−8、及びNRC−9)について「良性」と予測された場合、低リスクグループに割り当てられ、そうでなければ、試料は、高リスクグループに割り当てられる。
【0077】
本発明の一実施形態では、手術に加えて追加の癌治療が有益である患者の見込みを評価する方法が提供され、該方法は、
マイクロアレイ遺伝子チップ上にマーカーセットの遺伝子プローブをプリントするステップと、
腫瘍試料からメッセンジャーRNAを抽出するステップと、
マイクロアレイ遺伝子チップ上にこのメッセンジャーRNAをハイブリダイズするステップと、
ハイブリダイズされたマイクロアレイチップを走査することによって、試料のマーカー遺伝子のすべての読み取り値を得るステップと、
読み取り値を正規化するステップと、
試料の各マーカーセットの遺伝子発現プロファイルを構築するステップと、
予測を行うために各マーカーセットの遺伝子発現プロファイルを、標準的な(「良性」及び「悪性」として知られる)腫瘍試料の遺伝子発現プロファイルと相関させるステップと
を含む。
【0078】
マイクロアレイ遺伝子チップの作製、走査及びアレイデータの正規化に関する詳細な情報は、Agilent社のウェブサイト:http://www.chem.agilent.com/en−US/products/instruments/dnamicroarrays/pages/default.aspx.、及び公的に利用可能な文献に見出すことができる。
【0079】
【表1−1】


【表1−2】


【表1−3】


【表1−4】


【表1−5】


【表1−6】


【表1−7】


【表1−8】

【0080】
注:この表に列挙された各遺伝子についてのメッセンジャーRNA配列は、この文書の最後に添付されている。表1中の各遺伝子についてのすべてのメッセンジャーRNA配列は、公開データベースであるNational Center for Biotechnology Information(NCBI)から抽出される。
【0081】
配列の形式は、FASTA形式である。FASTA形式における配列は、1行の説明から始まり、その後に配列データの行が続く。説明行は、第1列の超(「>」)記号によって、配列データと区別される。
【0082】
FASTAにおける配列の例:
【0083】
【化1】

【0084】
説明の行において、第1の項目である6019は、NCBI EntrezGene IDであり、これは、表1の第1列中のIDであり、記号(「|」)の後の別の項目は、NCBI参照メッセンジャーRNA配列IDである。1つのEntrezGene IDは、いくつかの参照メッセンジャーRNA配列を有することができることに留意すべきである。この場合、1つのEntrezGene IDに対するすべてのメッセンジャーRNA配列が列挙される。各配列は、1つの参照メッセンジャーRNA配列を表す。
【0085】
【表2−1】


【表2−2】


【表2−3】


【表2−4】


【表2−5】


【表2−6】


【表2−7】

【0086】
【表3】

【0087】
注:元の試験セット1中に295試料が存在する。しかし、このセットは、van’t Veer ら、Nature、415:530、2002からのものである76試料を含む。本発明者らは、トレーニングセットとしてvan’t Veerのデータセット(van’t Veerら、Nature、415:530、2002)を使用したので、次いで、295試料からこれらの76試料を除いた。したがって、試験セット1は、219試料を含有する。
【0088】
1.Nは、試料数を表す
2.Rは、グループ中の試料数と試験セットの合計試料数との比を表す
3.R1は、非再発を有する試料の百分率(精度)を表す
4.R2は、再発を有する試料の百分率(精度)を表す
5.試験セット1は、Changら、PNAS、2005からのものである
6.試験セット2は、Koeら、Cancer Cell、2006からのものである
7.試験セット3は、Sotiriouら、J.Natl Cancer Inst、98:262、2006からのものである
【0089】
【表4】

【0090】
注:使用したデータセットは、表2中のデータセットと同じである。
【0091】
【表5−1】


【表5−2】


【表5−3】


【表5−4】


【表5−5】


【表5−6】


【特許請求の範囲】
【請求項1】
腫瘍特性を同定するための方法であって、以下のステップ、
1)対象とする特性をそれぞれ予測する3つの異なるマーカーセットを得るステップと、
2)腫瘍細胞から試料遺伝子発現シグナルを得るステップと、
3)レポーターを加えて試料の変化に影響を及ぼし、腫瘍中の対象とする遺伝子発現シグナルの評価を可能にするステップと、
4)前記遺伝子発現シグナルを前記レポーターと組み合わせるステップと、
5)抽出された遺伝子発現シグナルを、前記3つの異なるマーカーセットと相関させるステップと、
6)以下の、
a.3つすべての予測遺伝子発現シグナルセットの相関が、腫瘍が関心対象の特性を有すると予測する場合、腫瘍は、悪性腫瘍と指定される、
b.3つすべての予測遺伝子発現シグナルセットの相関が、腫瘍が関心対象の特性を欠いていると予測する場合、腫瘍は、良性腫瘍と指定される、
c.3つすべての予測遺伝子発現シグナルセットの相関が、同じ臨床転帰の予測をもたらさない場合、腫瘍は、「中間」と指定される
というランク付けに従って、抽出された遺伝子発現シグナルに指定を割り当てるステップと、
7)前記指定を出力するステップと
を含む方法。
【請求項2】
関心対象の特性が、転移、炎症、細胞周期、免疫応答遺伝子、薬剤耐性遺伝子、及び多剤耐性遺伝子の1つ又は複数に関係する、請求項1に記載の方法。
【請求項3】
腫瘍特性が、術後の患者生存率不良をもたらす傾向である、請求項1に記載の方法。
【請求項4】
ステップ4が、以下の、
a.3つすべての予測遺伝子発現シグナルセットの相関が、腫瘍を悪性腫瘍であると予測する場合、腫瘍は、悪性腫瘍と指定され、典型的な標準治療よりも積極的な治療が推奨される、
b.3つすべての予測遺伝子発現シグナルセットの相関が、腫瘍を良性腫瘍であると予測する場合、標準治療の範囲を超える治療は推奨されず、術後の化学療法も放射線療法も推奨されない、
c.3つすべての予測遺伝子発現シグナルセットの相関が、同じ予後をもたらさない場合、腫瘍は、「中間」と指定され、化学療法及び/又は放射線療法を含む、完全な典型的な標準治療処置が推奨される、
というランク付けに従って、抽出された遺伝子発現シグナルに値を割り当てるステップを含む、請求項3に記載の方法。
【請求項5】
ステップ1の前に、
a)検査される腫瘍サブタイプを同定するステップ、
b)その腫瘍サブタイプに特異的なマーカーセットを選択するステップ
という予備ステップを含む、請求項1に記載の方法。
【請求項6】
請求項1において使用されるタイプの予測遺伝子発現シグナルセットを決定するための方法であって、以下のステップ、
1)対象とする癌について既知の腫瘍集団に関する対象とする特性についての、遺伝子発現シグナル情報及び患者の臨床情報を得るステップと、
2)遺伝子発現シグナルを、対象とする特性に関する臨床患者情報と相関させて、臨床転帰についての予測力を有する遺伝子を同定するステップと、
3)同定された遺伝子発現シグナルから少なくとも30のランダムトレーニングデータセットを作るステップと、
4)ステップ1の同定された遺伝子発現シグナルを、癌において活性な既知の遺伝子のリストと比較するステップと、
5)既知の癌遺伝子のリスト上の遺伝子発現シグナルに対応する、同定された遺伝子発現シグナルを選択するステップと、
6)生物学的プロセスにおけるその役割によって、選択された、同定された遺伝子発現シグナルをグループ化するステップと、
7)ステップ6の選択された遺伝子発現シグナルグループから少なくとも25遺伝子のランダム遺伝子発現シグナルセットを生成するステップと、
8)ランダム遺伝子発現シグナルセットを、ステップ3で得られたランダムトレーニングデータセットと相関させるステップと、
9)ステップ7の各遺伝子発現シグナルセットについての相関から、生存率スクリーニングについてのP値を得るステップと、
10)遺伝子発現シグナルセットのP値が、ランダムトレーニングデータセットの90%超について0.05未満である場合、該遺伝子発現シグナルセットを確保するステップと、
11)セット内の遺伝子出現の頻度に基づいて、ステップ10において確保されたランダム遺伝子発現シグナルセットをランク付けするステップと、
12)可能性のある候補マーカーとして、少なくとも上位26遺伝子を選択するステップと、
13)ステップ7〜12を繰り返し、別の独立した、少なくとも26遺伝子のランクセットを作製するステップと、
14)ステップ12及びステップ13の上位遺伝子を比較するステップと、
15)25を超える遺伝子が同じである場合、上位遺伝子がマーカーセットとして確保されるステップと、
16)ステップ7〜15を2回繰り返して、3つの異なるマーカーセットを得るステップと
17)前記3つの異なるマーカーセットを出力するステップと
を含む方法。
【請求項7】
生物学的プロセスにおけるその役割によって、選択された、同定された遺伝子発現シグナルをグループ化するステップが、遺伝子オントロジー分析を使用して行われる、請求項6に記載の方法。
【請求項8】
ステップ3において、30〜50の間のランダムトレーニングセットが作られる、請求項6に記載の方法。
【請求項9】
30〜40の間のトレーニングセットが作られる、請求項8に記載の方法。
【請求項10】
ステップ4において、癌において活性であると知られている遺伝子が、転移、細胞増殖、腫瘍血管新生、及び薬物反応に関与する遺伝子のグループから選択される、請求項6に記載の方法。
【請求項11】
ステップ7において、約750,000〜1,250,000の間のランダム遺伝子発現シグナルセットが生成される、請求項6に記載の方法。
【請求項12】
ステップ7において、約900,000〜1,100,000の間のランダム遺伝子発現シグナルセットが生成される、請求項6に記載の方法。
【請求項13】
ステップ7において、約1,000,000のランダム遺伝子発現シグナルセットが生成される、請求項6に記載の方法。
【請求項14】
ステップ7において、生成されるランダム遺伝子発現シグナルセットが、約25〜50の間の遺伝子を含有する、請求項6に記載の方法。
【請求項15】
ステップ7において、生成されるランダム遺伝子発現シグナルセットが、約28〜32の間の遺伝子を含有する、請求項6に記載の方法。
【請求項16】
ステップ12において、上位26〜50遺伝子が選択される、請求項6に記載の方法。
【請求項17】
ステップ12において、上位28〜32遺伝子が選択される、請求項6に記載の方法。
【請求項18】
腫瘍が哺乳動物の腫瘍である、請求項1に記載の方法。
【請求項19】
腫瘍が、ヒト、類人猿、ネコ、イヌ、ブタ、ウシ、ヒツジ、ヤギ、ウサギ、マウス、ラット、モルモット、ハムスター、又はアレチネズミのうちの1つの腫瘍である、請求項18に記載の方法。
【請求項20】
少なくとも1つの癌バイオマーカーセットが、NRC−1、NRC−2、NRC−3、NRC−4、NRC−5、NRC−6、NRC−7、NRC−8、及びNRC−9から本質的になるリストから選択される、請求項4に記載の方法。
【請求項21】
請求項1に記載の方法を実施するための、少なくとも3つのマーカーセット及び使用説明書を含むキット。
【請求項22】
表1A又は1Bに列挙された少なくとも10の遺伝子発現シグナルを含む、請求項21に記載のキット。
【請求項23】
請求項6に記載の方法によって同定された少なくとも30の核酸バイオマーカーを含有する、請求項21に記載のキット。
【請求項24】
対象とする1つ又は複数の腫瘍特性の同定における、表1A又は1B中の配列のいずれかの使用。
【請求項25】
少なくとも3つの異なるマーカーセットが使用される、請求項23に記載の使用。
【請求項26】
癌バイオマーカーが乳癌バイオマーカーであり、第1のサブタイプの試料が、ER+試料である、請求項5に記載の方法。
【請求項27】
ランダムトレーニングセットが、選ばれる方のセットと同じ「良性」腫瘍と「悪性」腫瘍の比を維持しながら、試料をランダムに選ぶことによって生成される、請求項5に記載の方法。
【請求項28】
悪性腫瘍と指定されるすべての遺伝子発現値がグループ化され、以下のステップ、
1)同定された遺伝子発現シグナルから、少なくとも30のランダムトレーニングデータセットを作るステップと、
2)新しいグループの同定された遺伝子発現シグナルを、癌において活性な既知の遺伝子のリストと比較するステップと、
3)既知の癌遺伝子のリスト上の遺伝子発現シグナルに対応する、同定された遺伝子発現シグナルを選択するステップと
4)生物学的プロセスにおけるその役割によって、選択された、同定された遺伝子発現シグナルをグループ化するステップと、
5)ステップ4の選択された遺伝子発現シグナルグループから少なくとも25遺伝子のランダム遺伝子発現シグナルセットを生成するステップと、
6)ランダム遺伝子発現シグナルセットを、ステップ1で得られたランダムトレーニングデータセットと相関させるステップと、
7)ステップ6の各遺伝子発現シグナルセットについての相関から、生存率スクリーニングについてのP値を得るステップと、
8)遺伝子発現シグナルセットのP値が、ランダムトレーニングデータセットの90%超について0.05未満である場合、該遺伝子発現シグナルセットを確保するステップと、
9)セット内の遺伝子出現の頻度に基づいて、ステップ8において確保されたランダム遺伝子発現シグナルセットをランク付けするステップと
10)可能性のある候補マーカーとして、少なくとも上位26遺伝子を選択するステップと、
11)ステップ5〜10を繰り返し、別の独立した、少なくとも26遺伝子のランクセットを作製するステップと、
12)ステップ10及びステップ11の上位遺伝子を比較するステップと、
13)25を超える遺伝子が同じである場合、上位遺伝子がマーカーセットとして確保されるステップと
14)ステップ5〜13を2回繰り返して、3つの新しい異なるマーカーセットを得るステップと
15)前記3つの異なる新しいマーカーセットを出力するステップと
が実施される、請求項1に記載の方法。

【公表番号】特表2012−525818(P2012−525818A)
【公表日】平成24年10月25日(2012.10.25)
【国際特許分類】
【出願番号】特願2012−505007(P2012−505007)
【出願日】平成22年4月16日(2010.4.16)
【国際出願番号】PCT/CA2010/000565
【国際公開番号】WO2010/118520
【国際公開日】平成22年10月21日(2010.10.21)
【出願人】(595006223)ナショナル リサーチ カウンシル オブ カナダ (25)
【Fターム(参考)】