説明

乳癌分類に関する材料および方法

発明者らは、ノッティンガム予後指数(NPI)と相関する乳房腫瘍のための予後マーカーとして使用するための遺伝子セットを同定することを目指した。当初、発明者らは、その発現がNPIと相関する単一の遺伝子セットを同定することはできなかった。しかしながら、データセットを分子サブカテゴリー(エストロゲン受容体陽性、エストロゲン受容体陰性およびErbB2陽性)に分離した後、発明者らは、異なる予後の腫瘍において差次的に発現される62個の遺伝子セットを同定した。予後を判定するための方法および機器が提供される。治療前後に予測遺伝子セットの発現レベルを比較することを含む化学療法に対する腫瘍の反応を判定する方法も提供される。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、乳癌の分類に関する材料および方法に関する。特に、本発明は、乳癌の予後の判定に関する。
【背景技術】
【0002】
特に腫瘍学および医薬の分野では、生物学的分類のための遺伝子発現データの使用に強い関心がもたれてきた。このアプローチの刺激的側面の1つは、より伝統的な光学顕微鏡によるアプローチをこれまでは逃れてきた臨床的に関連する癌のサブタイプを明確にするその能力であった。この可能性にもかかわらず、臨床診断のための遺伝子発現データの使用が現実になる前に、多くの問題が解決されなければならない。例えば、正確な分類を行うことに加え、予測の信頼性を正確に判定することもできるアルゴリズムが実施される必要がある。このことは、分類がその後の治療経過に影響する場合には特に重要であり、そのような情報が提供された場合、治療を行う医師は、予測の信頼性を特定の介入の潜在的罹患率と比較検討し、情報に基づいた臨床的選択を行うことができる。
【0003】
ノッティンガム予後指数(NPI)は、腫瘍サイズ、組織学的グレード、およびリンパ節ステータスに基づく分類システムであり、乳房腫瘍の予後を割り当てるためにヨーロッパおよび英国において広く使用されている(1-5)。その有用性にもかかわらず、腫瘍グレードおよび細胞形態などの従来の組織病理学的パラメーターの使用もある種の限界を伴っていることが認められている。これらの変数(例えば、グレード)の多くは、標準化の試みがあっても著しい観察者間変動の影響を受けやすい(6)。NPIスケールは、2および8の値間に広がる。測定されているパラメーターがNPIなどの連続的な値域にわたって点数化される場合(7)、適切なカットオフポイントを規定することが困難であることが多い。
【0004】
したがって、指数は、一連の主観的基準に左右され、割り当てられた予後において観察者間の矛盾をもたらすことがある。
【0005】
NPIは、値の尺度であり、通常、別の患者よりも低いNPI値を有する患者は、他の患者の予後よりも良好な予後を有する。通常、予後は、特定の時間尺度にわたる生存の確率および/または特定に時間尺度内の遠隔転移の確率(生存については、必ずしも同じ時間尺度でなくてもよいが)などの要素を用いて定義される。したがって、一般的に言えば、患者の前途は、NPI値が増加するにつれて減少する。
【0006】
患者の予後を判定することは、患者のために治療のタイプおよび範囲を決定する際の重要な要素である。将来の治療プログラムは予後と関連していることがあるため、割り当てられた予後の正確度は重要である。例えば、van't Veer他(10)は、乳房腫瘍の無病生存(DFS)ステータスを予測する70個の遺伝子「予後発現シグネチャ(prognosis expression signature)」(DFS)を同定している。
【特許文献1】PCT/GB03/000755
【発明の開示】
【課題を解決するための手段】
【0007】
本発明者らは、一連の乳房腫瘍について発現データを研究したが、当初、それらの発現がNPIと相関している遺伝子セットを同定することはできなかった。発明者らは、サブタイプ間の遺伝子発現には有意差(「サブタイプ間差」)があり、これが、サブタイプ内のよりわずかな変動パターン(「サブタイプ内差」)を分かりにくくしている可能性があるという仮説を立てた。乳房腫瘍における内因性の遺伝子発現変動のかなりの割合は、ER+およびER-(ERは、「エストロゲン受容体」である)などの異なる「分子サブタイプ」に属する異なる腫瘍に起因していることが提唱されてきた(8-9、14)。
【0008】
非監視下の(unsupervised)クラスタリング技法を用い、データセットをそれぞれの分子サブカテゴリー(ER+、ER-、ERBB2+)に分離した。各分子サブタイプを独立したデータセットとして処理した。各サブタイプ内の腫瘍を独立して解析し、それらの発現レベルがNPIと相関している遺伝子セットを明らかにした。
【0009】
通常、臨床医は、NPIスケールを3つのカテゴリー、すなわち「良好な」予後、「中等度の」予後および「不良な」予後に分ける。カテゴリー境界を規定する値は、臨床医によって異なる。典型的な境界セットの例は、良好な予後NPI<3.4、中等度の予後3.4=<NPI=<5.4、および不良な予後NPI>5.4である。当業者には当然のことながら、これらの境界は異なることがある。
【0010】
本発明者らは、異なる予後の腫瘍において差次的に発現される、例えば、低NPIの腫瘍(したがって、良好な予後)に比べて、高NPIの腫瘍(したがって、不良な予後)において差次的に発現される62個の遺伝子セットを同定している。
【0011】
この遺伝子セットは、それらのNPIに従ってサンプルを分類した後に同定されたが、これらの遺伝子の発現レベルを用いて腫瘍サンプルを分類することは、予後の他の尺度(例えば、無病生存)と相関することも判明した。
【0012】
したがって、腫瘍サンプルにおけるこれらの遺伝子の発現レベルは、サンプルが得られた患者の予後および治療にとって重大な医学的意味を有する。特に、発現レベルを用い、患者の予後の指標として腫瘍サンプルを分類することができる。
【0013】
NPIスケールで3.8から4.6までの値を「良好な」予後と「悪い」予後の間のカットオフポイントとして使用し、各カットオフ値を用いて62個の差次的に発現される同じ遺伝子セットを同定した。
【0014】
このことは、NPIは2から8までの値の連続する範囲をカバーしているが、62個の遺伝子セットからの遺伝子の発現レベルは、腫瘍サンプルを別個のカテゴリーに分類することができることを示している。したがって、組織病理学的パラメーターに基づく連続したNPI値を示すサンプルを、分子レベルで別個のカテゴリーへ分離可能になるかもしれない。
【0015】
さらに、(i)本発明の方法および(ii)臨床的技法(通常は、組織病理学的技法)を用いて乳房腫瘍患者に割り当てられる予後の比較は、DFSおよびカプラン-マイヤー生存曲線などの患者データに基づき、本発明の方法が、組織病理学的技法より正確な予後を提供できることを示している。
【0016】
62個の遺伝子は、表S6において同定される。以下の記述は、用語「発現プロファイル」を利用するものとする。この用語は、サンプルにおける遺伝子セットについての発現レベルを指す。文脈上他の意味に解すべき場合を除き、遺伝子セットには、表S6において同定された62個の遺伝子のいくつかおよびすべてが含まれるものとする。
【0017】
本発明において同定された62個の遺伝子は、van't Veer他(10)のPESにおいて同定された遺伝子と1個の遺伝子(DC13すなわちHs.6879)のみが重複する。PESは、231個のRossetta遺伝子の拡張遺伝子セットの最初の70個の遺伝子(様々な無病生存率を示す群間で発現において最も顕著な差を示す遺伝子)である(10)。表S6の62個の遺伝子と231個のRosetta遺伝子に共通する8個の遺伝子があり、8個の遺伝子を表S13に列挙する。
【0018】
表S6中の2個の遺伝子は、低NPI腫瘍において高度に発現され(「陰性遺伝子」)、一方、遺伝子のうち60個は、高NPI腫瘍において高度に発現される(「陽性遺伝子」)。
【0019】
したがって、最も一般的に、本発明は、差次的に発現される遺伝子セットを得るための方法を提供する。また、本発明は、乳房腫瘍サンプルに対する予後の分類および/または割り当てのための方法およびアッセイを提供する。本発明は、遺伝子セットを同定し、サンプルが得られた患者に予後を割り当てる際の乳房腫瘍サンプルにおけるこれらの遺伝子のいくつかまたはすべての発現レベルの使用を提供する。
【発明を実施するための最良の形態】
【0020】
第1の態様において、本発明は、乳癌患者の予後を判定するための方法を提供し、その方法は、前記患者の乳房腫瘍における遺伝子セット(今後は、「予後判定セット」と呼ぶ)の発現レベルに基づいて患者に予後を割り当てることを含み、ここで、予後判定セットは、表S6からの複数個の遺伝子を含む。
【0021】
さらに本発明は、乳癌患者の予後を判定する際の予後判定セットの使用を提供する。本発明は、乳房腫瘍患者の予後を判定する際の発現プロファイルの使用を提供し、その発現プロファイルは、予後判定セットの遺伝子の腫瘍における発現レベルを表すことが好ましい。
【0022】
「予後」は、その最も一般的な意味であることを意図しており、定量的または定性的であってよい。予後は、「良好な」予後または「悪い」予後などの一般用語で、かつ/または無病生存(DFS)期間、定義済み期間の生存の可能性、および/または定義済み期間内の遠隔転移の確率などの起こり得る臨床帰結の点から表すことができる。通常、予後の定量的尺度は、確率的であろう。その上あるいは別法として、開業医に、または開業医間で予後を伝える場合は特に、予後は、NPIスケールなどの別の予後指標の点から表すことができる。
【0023】
一般に、「良好な予後」の腫瘍患者は、おそらく従来の治療計画で治療されるであろう。「不良な予後」の腫瘍患者は、代替の、またはより攻撃的な計画で治療されるかもしれない。通常、「不良な予後」の患者は、より攻撃的な計画へ移行する前に従来の治療計画が失敗するのを待つ必要がないであろう。さらに、疾患の起こり得る臨床経過を理解していることは、癌治療の重要な社会的側面である将来についての実際的な計画を患者に用意させる。
【0024】
誤解を避けるため、用語「判定すること」は、予後における絶対的な確実性を意味する必要はない。むしろ、腫瘍における予後判定セットの発現レベルは通常、患者の起こり得る予後を示すものとする。
【0025】
通常、発現レベルは、数値的に表されるはずである。したがって、発現プロファイルには、通常、一連の数字が含まれ、各数字は、予後判定セットの遺伝子の発現レベルを表す。
【0026】
本発明の第1の態様による方法は、
予後判定セットの遺伝子の腫瘍における発現レベルを表す発現プロファイルを提供するステップと、
発現プロファイルに基づいて患者に予後を割り当てるステップとを含む。
【0027】
提供するステップには、既存のデータセットから、予後判定セットの遺伝子の発現レベルに関する情報を抽出することが含まれてよく、それらには、他の発現レベル(例えば、腫瘍における他の遺伝子の発現レベルを表すデータ)が含まれてもよい。別法として、提供するステップには、発現レベルを実験的に決定することが含まれてよい。
【0028】
判定するステップには、
(a)患者から乳房腫瘍サンプルを得るステップと、
(b)予後判定セットの遺伝子のサンプルにおける発現レベルを測定するステップとが含まれてよい。
【0029】
遺伝子の発現レベルの測定、特に発現プロファイルにおけるその表現は、絶対的であるか、あるいは別の遺伝子の発現、またはサンプル中、またはサンプル群全体の遺伝子群(予後判定セット外の遺伝子が好ましいが、おそらく予後判定セットの遺伝子を含む)の発現レベルの平均、中央値もしくはモードなどであるがそれらに限定されない他の要素と相対的であってよい。例えば、遺伝子の発現は、サンプル中の複数個の遺伝子の多様な、あるいはわずかな平均的発現として測定または表現することができる。発現プロファイルでは、発現を陽性または陰性として表し、平均値と比べた発現の増加または減少を示すことが好ましい。
【0030】
好ましくない実施形態において、数値セットの形態である発現プロファイル情報は、予後判定セットの遺伝子のランク付けされたリストに変換され、ここで、遺伝子は、発現レベル順にランク付けされた後、個々の遺伝子のランク順は、解析におけるパラメーターとして(遺伝子の発現値の代わりに)使用される。
【0031】
ステップ(b)は、サンプルから得られる前記発現産物を、予後判定セットの遺伝子の発現を示す発現産物と結合する能力のある複数個の結合メンバーと接触させることを含み、そのような結合を測定できることが好ましい。
【0032】
通常、結合メンバーは、発現産物の存在ばかりでなく、その相対存在量(すなわち、利用可能な産物の量)も検出することができる。発現プロファイルは、予後判定セットの発現産物、例えばcDNAもしくはcRNAに対応するmRNAまたは発現タンパク質と結合することができる結合メンバーを用いて決定することができる。発現産物かそれとも結合メンバーを標識することにより、発現産物の相対量または割合を確認し、予後判定セットの発現プロファイルを決定することが可能である。結合メンバーは、相補的核酸配列または特異的抗体であってよい。
【0033】
予後を割り当てるステップは、テスト中の発現プロファイルを、既知予後に関係する他の以前に得られたプロファイルおよび/または以前に決定された特定の1種または複数の予後に特有の1種または複数の「標準」プロファイルと比較することによって行うことができる。特定の予後についての標準プロファイルは、その予後の複数個の腫瘍からの発現プロファイルから作成することができる。
【0034】
通常、比較は、コンピューターによるか、あるいはコンピューターを用いて行うものとする。
【0035】
発現プロファイルは、異なる既知予後の既知または標準プロファイル(好ましくは、標準プロファイル)と比較されることが好ましい。患者に割り当てられる予後は、テスト中の発現プロファイルが最もよく似ている既知または標準プロファイルの予後である。
【0036】
比較は、2種の異なる予後、例えば、「良好な」および「悪い」、または高NPIおよび低NPI(3.8と4.6の間のカットオフによることが好ましい)にカテゴリー化される既知または標準プロファイル(好ましくは、標準プロファイル)とであることが好ましい。既知または標準プロファイルは、既知予後のサンプルから作成されていなければならず、任意の便利な方法で、すなわちサンプルの摘出後の患者にとっての実際の臨床帰結によるかそれとも他の予後判定技法、例えば、NPIスケールを用いる組織病理学的技法によって決定することができる。
【0037】
比較は、統計的技法に基づき、予後に起因する信頼水準の評価に関わってよい。通常、標準プロファイルは、それらを得た特定の材料および方法(例えば、マイクロアレイ)に特異的である。新たな材料および/または方法(例えば、新しいタイプのマイクロアレイ)が採用される場合、既知予後の標準プロファイルは、この場合も、予後判定セットを用いて得られることが好ましい。
【0038】
本発明の第1の態様による方法は、例えば、高NPIかそれとも低NPIであるか、または良好な予後かそれとも悪い予後であるとして乳房腫瘍のサンプルを分類することが含んでよい。
【0039】
前述のように、予後を割り当てるステップは、テスト中の乳房腫瘍サンプルからの発現プロファイルを、以前に得られたプロファイルおよび/または以前に決定された特定の予後、例えば「良好な」予後および/または「不良な」予後および/または少なくとも1つのNPI値および/または少なくとも1つのNPI値域に特有の「標準」プロファイルと比較することによって行うことができる。以前に得られたプロファイルは、プロファイルのデータベースとして保存することができる。
【0040】
データベースは、特定の予後に特有の遺伝子発現プロファイルを含むことが好ましい。遺伝子発現プロファイルは、本発明の第1の態様の予後判定セットと同じ予後判定セット(表S6の遺伝子のサブセット)または発現レベルの比較にとって統計的に有意なベースを提供するように第1の態様の予後判定セットと十分に重複している予後判定セット(上記とは異なるサブセットの可能性がある)から作成されることが好ましい。コンピューターは、テスト中のプロファイルと1種または複数の標準プロファイルとの間で統計的類似性を報告し、予後を割り当てることができるようにプログラムすることができる。
【0041】
有利には、予後を割り当てるための遺伝子発現プロファイルの使用は、腫瘍サンプルに予後を割り当てるために使用される臨床手順の主観的性質を減じるか、あるいはなくすことさえある。この方法は、分子レベルの、好ましくは定量的な発現産物の評価を必要とするため、この方法は、より客観的であるためにより信頼のおける可能性がある予後の割り当て方法を提供する。前述のように、この予後判定セットは、乳房腫瘍サンプルを個別のカテゴリーに分離し、臨床的予後割り当ての主観的分析を減じるか、あるいはなくすことさえできる。さらに、信頼性を予測に割り当てることができるため、予後の「強度」に応じて、患者の治療に関する情報に基づいた選択を行うことができる。
【0042】
予後判定セットの発現プロファイルは、類似した予後の独立したサンプル間でわずかに異なることがある。しかしながら、発明者らは、併用した場合、予後判定セットを構成する特定の遺伝子の発現プロファイルは、腫瘍サンプルにおける発現のパターン(発現プロファイル)を提供し、そのパターンは、腫瘍の予後に特有であることに気が付いた。
【0043】
発明者らは、この予後判定セットが、腫瘍サンプルを高NPIおよび低NPIクラスに分解することができることを見いだした。高NPIは、好ましくは少なくとも3.4、好ましくは少なくとも3.5、より好ましくは少なくとも3.6、より好ましくは少なくとも3.7、より好ましくは少なくとも3.8、より好ましくは少なくとも3.9、最も好ましくは少なくとも4.0のNPIを意味する。高NPIは、少なくとも4.1、少なくとも4.2、少なくとも4.3、少なくとも4.4、少なくとも4.5、または少なくとも4.6であってよい。高NPIと低NPIの間の好ましいカットオフ値は、3.8と4.6の間である。
【0044】
歴史的に、NPIの「良好な」、「中等度の」および「悪い」/「不良な」カテゴリーは、これらの異なる群に属する患者が、全生存期間における統計的有意差を示す大規模な臨床試験を用いて決定された。例えば、良好な予後の患者は、約83%の10年生存率を有し、「中等度の」予後の患者は、約52%の10年生存率を有し、「不良な」または「悪い」予後の患者は、約13%の10年生存率を有することがある(4)。
【0045】
特に、この予後判定セットは、エストロゲン受容体陽性腫瘍(ER+)における腫瘍予後(NPIに反映される)と最も強く相関するように見える。
【0046】
乳房腫瘍をエストロゲン受容体陽性(ER+)および陰性(ER-)サブタイプに分類することは、乳癌の治療における重要な区別である。一般に、ER-腫瘍は、それらのER+対応物よりも臨床的に攻撃的であり、ER+腫瘍は、タモキシフェンなどの抗ホルモン療法を用いてルーチンに治療される(21)。乳房腫瘍は、組織学的技法(例えば、受容体に特異的な抗体による)を用いるか、あるいは遺伝子発現技法を用いてER+またはER-として分類することができる。現在、腫瘍のERステータスは、ERに対する抗体を用いる免疫組織化学(IHC)または免疫ブロッティングによってルーチンに決定される。
【0047】
本発明の第1の態様は、腫瘍サンプルのERステータスを決定するステップを含むことが好ましい。ERステータスは、遺伝子発現解析を用いるか、あるいは組織病理学的技法を用いることによって決定することができる。さらに、本発明の第1の態様は、最初のステップのように、腫瘍サンプルのERステータスを決定し、ステータスがER+である場合にのみ進めることを含むことが好ましい。
【0048】
腫瘍サンプルのERステータスは、我々の同時係属出願PCT/GB03/000755に記載の遺伝子発現プロファイリングを用いて決定されることが好ましい。遺伝子発現プロファイリングは、高い信頼性で乳房腫瘍をER+またはER-として分類することができる。しかしながら、有意な統計的確実性でER+またはER-として分類することができない可能性のある腫瘍の第3のカテゴリーも存在する(「低信頼性」腫瘍)。ERBB2+のアップレギュレーションは、低信頼性腫瘍に伴うことが多い。高い信頼性で同定されるER+腫瘍(PCT/GB03/000755の方法を用いて判定されるように、0.4を超える規模の予測強度でER+として分類されることが好ましい)のみが、本発明の第1の態様による方法を用いて評価されることが好ましい。
【0049】
乳房腫瘍サンプルに予後を割り当てるステップは、監視下の学習技法である加重投票(WV)(13)などの統計的および/または確率的技法の使用を含んでよい。WVでは、2値分類を行うことができる。すなわち、この技法を用い、2種のクラスのうち一方にサンプルを割り当てることができる。乳房腫瘍サンプルの予後判定セットにおける各遺伝子の発現レベルは、様々なクラス全体のその遺伝子の平均発現レベルと比較される。例えば、平均は、割り当てられた予後を有する発現プロファイル、例えば、「既知」予後の発現プロファイルのデータベースから算出することができる。
【0050】
発現レベルとクラス全体の平均遺伝子発現との間の差は、重み付けされ、特定のクラスについてのその遺伝子への「投票」および他のクラスに対するその遺伝子への等しいが反対の投票に対応する。特定の腫瘍の場合、遺伝子すべてについての投票(賛成および反対)を各クラスについて合計し、各クラスについての合計を出す。腫瘍は、最も高い(賛成)合計を有するクラスに割り当てられる。次いで、勝ったクラスの票差を、予測強度として表すことができる。
【0051】
発現レベルの差は、2つのクラスの各々における遺伝子の発現レベルの平均および標準偏差を含む式を用いて重み付けされる。一般に、各クラスについての平均および標準偏差は、特定の予後、例えば、高NPIおよび低NPIを有するか、あるいはそれらを表す発現プロファイルから算出される。
【0052】
その上あるいは別法として、予後を割り当てるステップは、特に、腫瘍サンプルにおける発現レベルが、「既知」予後の発現プロファイル、またはサンプル発現プロファイルが比較される1種または複数の標準プロファイルを決定するために使用される材料および/または方法からの様々な材料および/または方法を用いて決定されている場合には、階層的クラスタリングの使用を含んでよい。
【0053】
割り当てられた予後は、確立したリーブワンアウト交差検証(LOOCV)アッセイ(実施例を参照)を用いて検証することができる。ステップ(c)は、コンピューターを用いて行うことができる。
【0054】
階層的クラスタリングにおいて、各発現プロファイルは、n個の遺伝子からなるベクトルとして表すことができ、ここで、(g1、g2..gn)は、遺伝子の発現レベルを表す。次いで、各ベクトルは、解析において他のすべてのプロファイルについてのベクトルと比較され、お互いと最も高い相関を有する2つのベクトルは、解析において可能な限り多くのプロファイルがペアになるまでペアを組まれる。
【0055】
当技術分野では、ピアソンの相関係数(22)などの相関を計算するための多くの方法が知られている。次のステップにおいて、複合ベクトルは、各ペアから得られ(平均連鎖(average-linkage)クラスタリングでは、通常、複合ベクトルは、両プロファイルの平均である)、次いで、ペアリングの過程が繰り返される。この過程は、すべてのベクトルがペアを組まれるまで続き、プロファイルすべてを表す「ツリー」を組み立てる。この過程は、下部(個々のプロファイル)から始めて積み上げることから「階層的」である。本発明において、個々のプロファイルは、好ましくは2種の複合ベクトルを積み上げ、各ベクトルは、あるクラス(すなわち、良好な予後または悪い予後)を表す。未知クラスの新たなサンプルの場合、サンプルは、標準プロファイル/サンプルによりクラスター化される。「未知」サンプルのクラスは、ペアリングの反復ラウンドが終わった時にどのクラスター/ベクトルに属するかに基づいて決定されるはずである。
【0056】
1種または複数の「既知」または割り当てられた予後の発現プロファイルは、予後が割り当てられているか、あるいは得られている発現プロファイルを意味する。予後は、遺伝子発現データから算出され、ソースサンプルについて行われる臨床技法(例えば、組織病理学的技法)から得られるか、あるいは、発現プロファイルが得られた患者における実際の疾患進行/帰結に基づいて遡及的に割り当てられている可能性がある。3番目の選択肢が最も好ましいのは、正確な予後(サンプルが得られた時点について)が、患者についてのその後の帰結に基づき、患者の診療記録から割り当てることができるからである。そのような遡及的割り当てにおいて、あとになっての判断は、正確性を提供する。
【0057】
本発明の方法を用い、乳癌患者の治療の有効性を評価することができる。患者の予後を、治療の前か、あるいは治療の初期段階で割り当て、治療後に(または、治療の最終段階に)患者に割り当てられる予後と比較することができる。治療前および/または治療後の予後は、本発明による方法を用いて割り当てられることが好ましい。治療が複数の段階を含む場合、発現プロファイルを各段階後に決定し、治療の進行をプロットすることができる。治療後の予後の改善は、成功した治療か、あるいは少なくとも部分的に成功した治療を示す。治療は、化学療法であってよい。
【0058】
本発明の方法には、治療の前後に乳房腫瘍サンプルにおける予後判定セットの発現レベルを比較し、予後の改善または予後の悪化を示す発現プロファイルにおける変化を検出することが含まれてよい。
【0059】
この方法には、「アップレギュレートされる」表S6に示す予後判定セットにおける遺伝子のダウンレギュレーションおよび/または「ダウンレギュレートされる」表S6に示す予後判定セットにおける遺伝子のアップレギュレーションを検出することが含まれてよい。前記遺伝子は、標準値(例えば、異なる予後の一連のサンプル全体の平均発現レベル)に比べて、かつ/または以前の値、例えば、「不良な」予後を示すか、あるいは「不良な」予後に特有の標準プロファイルに比べて、ダウンレギュレート/アップレギュレートされることがある。「アップレギュレートされた」遺伝子のダウンレギュレーションおよび/または「ダウンレギュレートされた」遺伝子のアップレギュレーションは、良好な予後または中等度の予後を示す。レギュレーションにおける変化の程度は、治療の有効性を示すことがある。
【0060】
発明者らは、良好な予後の腫瘍の発現プロファイルに向かう発現プロファイルにおける変化が、成功した治療を示すことを見いだした。発現プロファイルにおいてそのような変化を示す腫瘍は、最良の予後(例えば、最良の生存率、最良の無病生存率)を有する。治療前および治療後段階における腫瘍の発現プロファイルは、既知予後の標準プロファイルと比較することができる。
【0061】
したがって、この方法は、良好な予後クラスかそれとも悪い予後クラス(または、高NPIクラスもしくは低NPIクラス)に乳房腫瘍の発現プロファイルを割り当てること、および治療の後期において前記腫瘍から決定される2番目の発現プロファイルを良好な予後クラスかそれとも悪い予後クラス(または、高NPIクラスもしくは低NPIクラス)に割り当てること、およびクラスにおける変化を検出することを含むことができ、ここで、悪い予後から良好な予後への(または、高NPIから低NPIへの)変化は有効な治療を示す。その上、あるいは別法として、良好な予後クラスまたは悪い予後クラス(または、高NPIクラスもしくは低NPIクラス)の割付の統計的信頼水準における変化は、治療の有効性を示すことがある。不良な予後を示すクラスの割り当ての信頼性の低下は、成功した治療か、あるいは少なくとも部分的に成功した治療を示すことがある。
【0062】
治療の有効性を評価する方法には、腫瘍のERステータスを決定するステップが含まれてよい。しかしながら、有効性を評価する前記方法は、ER+、ER-およびERBB2+腫瘍の治療有効性を評価するのに有効であり、すなわち、腫瘍のERステータスとは無関係である。
【0063】
発現プロファイルは、腫瘍における遺伝子群の発現レベルを表す。各発現プロファイルの遺伝子は、同一である必要はないが、発現プロファイルの比較および群化を可能にするため、各発現プロファイルの遺伝子間で十分に重複していなければならない。
【0064】
結合メンバーは、当技術分野において知られている標準手順を用い、検出目的のために標識することができる。別法として、発現産物は、テスト中のサンプルからの単離後に標識することができる。検出の好ましい手段は、光度計によって検出することができる蛍光標識を用いることである。検出の代替手段には、電気的シグナリングが含まれる。例えば、Motorola (Pasadena、California)e-センサーシステムは、2つのプローブ、すなわち、自由に浮遊している「捕捉プローブ」、および電極表面として二重になっている固体表面に接続されている「シグナリングプローブ」を有する。両プローブは、発現産物に対する結合メンバーとして機能する。結合が生じた場合、両プローブは、お互いに近接近し、検出することができる電気シグナルの発生をもたらす。
【0065】
しかしながら、定量のために「無標識」技法を利用する多くの最新技術、例えば、Xagros (Mountain View、California)によって生み出された技術が最近出現している。プライマーおよび/または増幅された核酸は、標識を欠いてもよい。定量は、標的発現産物上への2つのプライマーのドッキング、および引き続くポリメラーゼによる伸長の結果としての電気抵抗における変化を測定することによって評価することができる。
【0066】
上記のように、結合メンバーは、遺伝子識別子の発現産物の数を特異的に増幅するためにPCR(例えば、多重PCR)において使用するためのオリゴヌクレオチドプライマーであってよい。次いで、産物は、ゲル上で分析されるであろう。しかしながら、結合メンバーは、固体支持体に固定された単一核酸プローブまたは抗体であることが好ましい。次いで、発現産物を固体支持体に通し、それによって発現産物を結合メンバーと接触させることができる。固体支持体は、ガラス表面、例えば、顕微鏡用スライド、ビーズ(Lynx)、または光ファイバーであってよい。ビーズの場合、各結合メンバーを個々のビーズに固定することができ、次いで、溶液中の発現産物と接触させる。
【0067】
特定の遺伝子セットについて発現プロファイルを決定するための様々な方法が当技術分野には存在し、それらを本発明に適用することができる。例えば、ビーズをベースとしたアプローチ(Lynx)または分子バーコード(Surromed)は、既知技法である。これらの場合、各結合メンバーは、発現産物と接触しやすい個々に読み取り可能で自由に浮遊しているビーズまたは「バーコード」に接続される。結合メンバーの発現産物(標的)との結合が溶液中で行われた後、タグ付きビーズまたはバーコードは、装置(例えば、フローサイトメーター)に通されて読み取られる。
【0068】
発現プロファイルを決定する他の既知方法は、Illumina (San Diego、California)によって開発された器具、すなわち光ファイバーである。この場合、各結合メンバーは、光ファイバーケーブルの末端で特定の「アドレス」に接続される。発現産物の結合メンバーとの結合は、光ファイバーケーブルのもう一方の端で装置によって読み取り可能である蛍光変化を引き起こすことができる。
【0069】
本発明者らは、固体支持体に固定された複数個の核酸配列を含む核酸マイクロアレイを使用することに成功した。発現遺伝子に相当する核酸配列、例えばcDNAをマイクロアレイに通すことにより、発明者らは、特定の予後の腫瘍サンプル、特に、良好な予後の腫瘍サンプルもしくは悪い予後の腫瘍サンプル、または高NPIの腫瘍サンプルもしくは低NPIの腫瘍サンプルからの発現産物に特有の結合プロファイルを作成することができた。
【0070】
第2の態様において、本発明は、乳房腫瘍サンプルに予後を割り当てるための機器、好ましくはマイクロアレイを提供し、この機器は、複数個の結合メンバーが接続されている固体支持体を含み、各結合メンバーは、予後判定セットの遺伝子の発現産物と特異的に結合することができる。固体支持体に接続されている結合メンバーは、表S6において同定されている少なくとも5個の遺伝子、より好ましくは、少なくとも10個の遺伝子または少なくとも15個の遺伝子、最も好ましくは少なくとも20または30個の遺伝子の発現産物と特異的かつ独立して結合することができることが好ましい。固体支持体に接続されている結合メンバーは、表S6において同定されている20〜30個の遺伝子の発現産物と特異的に結合することができてよい。
【0071】
一実施形態において、表S6において同定されているすべての遺伝子の発現産物と特異的かつ独立して結合することができる結合メンバーが固体支持体に接続される。支持体は、表S6において同定されている遺伝子、またはそれに由来する予後判定セットの発現産物と特異的かつ独立して結合することができる結合メンバーのみを接続したかもしれない。
【0072】
機器は、予後判定セットからの発現産物、または複数個のその遺伝子と特異的に結合することができる結合メンバーを含むことが好ましく、U133Aマイクロアレイ上に提示される不完全な遺伝子サブセットのみの発現産物と特異的に結合することができる結合メンバーが含まれてよい(U133Aマイクロアレイ上に提示されない他の遺伝子に対する結合メンバーも含まれてもよいが)。U133Aマイクロアレイは、約14397個の異なる遺伝子を提示すると考えられる。したがって、機器は、U133Aマイクロアレイ上の14396個以下の遺伝子に対する結合メンバーを含むことが好ましい。機器には、U133Aマイクロアレイ上の90%以下の遺伝子の発現産物と特異的に結合することができる結合メンバーが含まれてよい。機器には、U133Aマイクロアレイ上の80%以下または70%以下または50%以下または40%以下または30%以下または20%以下または10%以下または5%以下の遺伝子の発現産物と特異的に結合することができる結合メンバーが含まれてよい。
【0073】
その上あるいは別法として、固体支持体は、14000個以下、または10000個以下、または5000個以下、または3000個以下、または1000個以下、または500個以下、または400個以下、または300個以下、または200個以下、または100個以下、または90個以下、または80個以下、または70個以下、または60個以下、または50個以下、または40個以下、または30個以下、または20個以下、または10個以下、または5個以下の異なる遺伝子についての結合メンバーを収納してよい。
【0074】
結合メンバーは、核酸配列であり、機器は、核酸マイクロアレイであることが好ましい。
【0075】
表S6の遺伝子は、UnigeneデータベースのBuild 160に対応するそれらのUnigeneアクセッション番号と共に列挙されている。したがって、各遺伝子の配列は、National Institute of Health (NIH)におけるUnigeneデータベース: (http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=unigene)から検索することができる。
【0076】
さらに、すべての遺伝子について、Affymetrix (Santa Clara、California) (www.affymetrix.com)は、プローブセットの例を提供しており、固体支持体上で使用される場合、遺伝子の発現を検出することができるプローブの配列(すなわち、オリゴヌクレオチド配列の形態をした結合メンバー)を含んでいる。プローブの詳細は、標的遺伝子のUnigene IDを用いてAffymetrixウエブサイトのU133Aセクションからアクセス可能である。
【0077】
将来、表に列挙されているUnigene IDの1つが、新たなIDに併合されるか、あるいは2つ以上のIDに分けられるか(例えば、データベースの新たな構築で)、あるいはすっかり削除される場合、遺伝子の配列は、本発明者らが意図するように、UnigeneのBuild 160にアクセスすることによって検索される。
【0078】
通常、高密度核酸配列、通常cDNAまたはオリゴヌクレオチドは、固体支持体の極めて小さな不連続領域またはスポット上に固定される。固体支持体は、基質(すなわち、「チップ」)でコーティングされている顕微鏡用サイドガラス(glass side)またはメンブランフィルターであることが多い。核酸配列は、通常はロボットシステムにより、コーティングされた固体支持体上に運ばれ(またはプリントされ)、次いで、支持体に固定化または固定される。
【0079】
好ましい実施形態において、サンプルから得られる発現産物は、通常は蛍光標識を用いて標識され、次いで、固定化された核酸配列に接触される。ハイブリダイゼーション後、蛍光マーカーは、高分解能レーザースキャナーなどの検出器を用いて検出される。代替法において、発現産物は、非蛍光標識、例えばビオチンでタグ付けしてもよい。ハイブリダイゼーション後、マイクロアレイを、最初の非蛍光標識と結合する(bind)/結合する(bond)蛍光色素(例えば、ビオチンと結合する蛍光標識されたストレパビジン(strepavidin))で「染色する」ことができる。しかしながら、発現産物は、上記のように、無標識であってよい。
【0080】
遺伝子発現のパターン(発現パターンまたはプロファイル)を示す結合プロファイルは、デジタル画像ソフトウエアで各々の不連続スポットから放射されるシグナルを解析することによって得られる。次いで、実験サンプルの遺伝子発現のパターンを、差分解析のために標準プロファイル(すなわち、例えば、既知の良好な予後もしくは悪い予後、または既知のNPI値もしくは既知のNPI値域の組織サンプルからの発現プロファイル)のパターンと比較することができる。
【0081】
標準は、特定の予後、例えば、「不良な」予後もしくは「良好な」予後および/または高NPIおよび/または低NPIなどの特定のNPI範囲に特有であり、かつ/または1つまたは複数のNPI値もしくは1つまたは複数の値域に特有であると以前に判断された1つまたは複数の発現プロファイルから得ることができる。標準は、特定のNPI値または値域(または、予後尺度上の他の規定値)に特有であると以前に判断された1つまたは複数の発現プロファイルから得ることができる。標準には、正常サンプルに特有の発現プロファイルが含まれてよい。これらの/この標準発現プロファイルは、データベースの一部としてデータキャリア上へ検索可能に保存することができる。
【0082】
大部分のマイクロアレイは、1種かそれとも2種のフルオロフォアを利用する。2色アレイの場合、最も一般的に使用されるフルオロフォアは、Cy3 (緑色チャンネル励起)およびCy5 (赤色チャンネル励起)である。マイクロアレイ画像解析の目的は、各発現産物からハイブリダイゼーションシグナルを抽出することである。1色アレイの場合、シグナルは、ある標的についての絶対強度として測定される(基本的に、単一サンプルとハイブリダイズされたアレイの場合)。2色アレイの場合、シグナルは、異なる蛍光標識により、2つの発現産物(例えば、サンプルおよびコントロール(さもなければ、コントロールは、「リファレンス」として知られている))の比として測定される。
【0083】
本発明による機器は、複数個の不連続スポットを含むことが好ましく、各スポットは、1種または複数のオリゴヌクレオチドを含み、各スポットは、表S6から選択される遺伝子の発現産物のための異なる結合メンバーを提示する。一実施形態において、マイクロアレイは、表S6において提供される遺伝子の各々についてのスポットを含むものとする。各スポットは、複数個の同一オリゴヌクレオチドを含み、各々は、提示している表S6の遺伝子の発現産物、例えば、mRNAまたはcDNAと結合することができることとする。各遺伝子は、複数個の異なるオリゴヌクレオチド、好ましくは遺伝子用のAffymetrix U133Aプローブセットによって提示されることが好ましい。
【0084】
本発明の第3の態様では、乳癌患者に予後を割り当てるためのキットが提供され、前記キットは、予後判定セットの遺伝子の発現産物と特異的に結合することができる複数個の結合メンバー、および検出試薬を含む。このキットには、データ解析ツールが、好ましくはコンピュータープログラムの形態で含まれてよい。データ解析ツールは、異なる予後の腫瘍の発現プロファイルを識別するように適合されているアルゴリズムを含むことが好ましい。アルゴリズムは、「良好な」予後と「不良な」予後を識別するように適合されていることが好ましく、高NPI腫瘍と低NPI腫瘍を識別するように適合されていることが最も好ましい。アルゴリズムは、上述のように、加重投票アルゴリズムであることが好ましい。
【0085】
一実施形態において、キットは、本発明の第2の態様の機器を含む。
【0086】
キットには、既知予後の乳房腫瘍サンプル(上記のような)からの発現プロファイル、および/または特定の予後(上記のような)に特有の遺伝子発現プロファイルが含まれてよく、データキャリアまたは他の記憶装置上に保存されることが好ましい。プロファイルは、統計的に解析またはグループ化された、例えば、平均発現レベルおよび/または算出された遺伝子重み付けであるかもしれない。
【0087】
キット中の1つまたは複数の結合メンバー(抗体結合ドメインまたは核酸配列、例えばオリゴヌクレオチド)は、1つまたは複数の固体支持体、例えば、マイクロアレイもしくは光ファイバーアッセイのための単一支持体、またはビーズなどの複数支持体に固定されていることが好ましい。検出手段は、テスト中のサンプルの発現産物を標識するための標識(放射性または色素、例えば、蛍光)であることが好ましい。また、キットは、テスト中の発現産物の結合プロファイルを検出および分析するための試薬を含んでもよい。
【0088】
別法として、結合メンバーは、PCRにおいて増幅することができるように、表S6において同定されている遺伝子の発現産物と結合することができるヌクレオチドプライマーであってよい。さらに、プライマーは、検出手段、すなわち、他の増幅配列に対して増幅配列およびそれらの存在量を確認するのに使用することができる標識を含んでもよい。
【0089】
乳房腫瘍サンプルは、乳房切除生検または細針吸引物として得ることができる。
【0090】
各々が予後を割り当てられている多くの腫瘍サンプルから、好ましくは予後スケールに基づき、予後判定セットの多くの発現プロファイルを作成することにより、良好な予後および悪い予後についてのプロファイルのライブラリーを作成することが可能である。発現プロファイル数が多ければ多いほど、予後判定アッセイにおいて標準として使用することができる信頼のおける特徴的な発現プロファイル標準(すなわち、統計的変動を含む)を作成することが容易になる。したがって、標準プロファイルは、複数個の個別発現プロファイルから考案され、例えば、「良好な」予後もしくは「不良な」予後、または高NPIもしくは低NPIを表すように統計的変動内で考案された標準プロファイルであってよい。
【0091】
第4の態様では、乳房腫瘍サンプルのための核酸発現プロファイルを作成する方法であって、
(a)前記乳房腫瘍サンプルから発現産物を単離するステップと、
(b)予後判定遺伝子セットの発現レベルを確認するステップと、
(c)前記乳房腫瘍サンプルについての発現プロファイルを発現レベルから作成するステップとを含む方法が提供される。
【0092】
発現プロファイルは、遺伝子発現プロファイルデータベースに加えることができる。さらに、この方法は、発現プロファイルを第2の発現プロファイル(または、複数個の第2の発現プロファイル)と比較するステップを含んでもよい。第2の発現プロファイル(または、複数のプロファイル)は、実質的に同じ予後判定セットを用いて第2の乳房腫瘍サンプル(または、複数のサンプル)から作成することができ、ここで、予後は、第2のサンプル(または、複数のサンプル)に割り当てられているか、あるいはそれらに対して決定されている。第2の発現プロファイル(または、複数のプロファイル)は、特定の予後、例えば、「良好な」予後もしくは「不良な」予後、または高NPIもしくは低NPI、または少なくとも1つの特定のNPI値もしくは少なくとも1つのNPI値域に特有の標準プロファイル(または、複数のプロファイル)であってよい。
【0093】
予後は、予後尺度の形態であり、好ましくはNPIなどの臨床的に許容できる予後分類システムであることが好ましい。この場合も、予後は、遺伝子発現データから予測され、組織病理学的技法などの臨床技法から得られるか、あるいは、第2のプロファイルが得られた1つまたは複数のサンプルを提供した1名または複数の患者の疾患帰結に基づき、第2の発現プロファイルへ遡及的に割り当てることができる。
【0094】
予後判定セットの知識により、特定のテストサンプルにおいて遺伝子の発現パターンまたはプロファイルを決定するための多くの方法を考案することが可能である。例えば、発現した核酸(RNA、mRNA)は、標準的な分子生物学的技法を用いてサンプルから単離することができる。次いで、表S6に示される遺伝子識別子の遺伝子メンバーに対応する発現した核酸配列を、発現した配列に特異的な核酸プライマーを用い、PCRで増幅することができる。単離された発現核酸がmRNAである場合、これを、標準的方法を用い、PCR反応のためのcDNAに変換することができる。
【0095】
プライマーは、確認ができるように、増幅された核酸中に標識を導入することができる。標識は、増幅イベント後に存在する核酸配列の相対量または割合を示し、元のテストサンプル中に存在する相対量または割合を反映することが理想的である。例えば、標識が蛍光性または放射性である場合、シグナルの強度は、発現した配列の相対量/割合または絶対量さえも示すはずである。各遺伝子識別子の発現産物の相対量または割合は、テストサンプルについての特定の発現プロファイルを確立するはずである。
【0096】
本発明の第4の態様による方法は、
(a)第1の乳房腫瘍サンプルから発現産物を単離し、前記発現産物を、予後判定セットの発現産物と特異的かつ独立して結合することができる複数個の結合メンバーと接触させ、腫瘍サンプルにおける予後判定セットの発現レベルから第1の発現プロファイルを作成するステップと、
(b)既知予後(以前に定義したような)の第2の乳房腫瘍サンプルから発現産物を単離し、前記発現産物を、ステップ(a)の予後判定セットの発現産物と特異的かつ独立して結合することができる複数個の結合メンバーと接触させ、乳房腫瘍サンプルの同等な第2の発現プロファイルを作成するステップと、
(c)第1の発現プロファイルと第2の発現プロファイルを比較して、第1の乳房腫瘍サンプルの予後を判定するステップとを含んでよい。
【0097】
本発明の第5の態様では、乳房腫瘍サンプルの複数個の遺伝子発現プロファイルを含む発現プロファイルデータベースが提供され、ここで、遺伝子発現プロファイルは、予後判定遺伝子セットの発現レベルから得られ、データベースは、データキャリア上へ検索可能に保持される。データベースは、本発明の第4の態様による方法によって作成されることが好ましい。
【0098】
発現プロファイルは、核酸発現プロファイルであることが好ましい。核酸発現プロファイルの決定は、コンピューター処理され、特定の以前に設定されたパラメーター内で行われ、偽陽性および偽陰性を避けることができる。
【0099】
データベースには、良好な予後もしくは悪い予後などの特定の予後、または特定の予後判定値、好ましくはNPI値(例えば、高NPI、低NPI、または特定の定性値もしくは値域)に特有の発現プロファイルが含まれてよい。発現プロファイルは、ソース腫瘍のERステータス(すなわち、ER+またはER-)に従ってカテゴリー化することができる。次いで、データベースを、最終的に、(i)データベース中の各発現プロファイルに対応する数値データ、(ii)特定の予後割り当て(例えば、良好な予後もしくは悪い予後、または、好ましくはNPIからの値もしくは値域)についての標準的なプロファイルとして機能する「標準」プロファイル、および(iii)「標準」プロファイルに対する個々のプロファイルの実測された統計的変動を表すデータを含むように処理および解析することができる。
【0100】
次いで、コンピューターは、特定の予後、例えば、良好な予後および/または悪い予後および/または高NPIおよび/または低NPIの乳房腫瘍に特有の発現プロファイル標準を提供することができる。前述のように、次いで、決定された発現プロファイルを用い、好ましくは識別アルゴリズム、最も好ましくは上記の加重投票アルゴリズムを用いて乳房組織サンプルに予後を割り当てることができる。
【0101】
発現プロファイルの分類は、テストされる遺伝子発現レベルの数が多いほどより信頼できる。既知のマイクロアレイおよび遺伝子チップ技術は、多数の結合メンバーの利用を可能にする。したがって、より好ましい方法は、表S6のすべての遺伝子に相当する結合メンバーを用いることであろう。しかし、当業者には当然のことながら、これらの遺伝子の割合を省略することができ、依然として、この方法を、信頼がおけてかつ統計的に正確な方法で行うことができる。
【0102】
本発明の任意の態様における予後判定セットは、表S6からの遺伝子のすべて、もしくは実質的にすべて、または陽性遺伝子のすべて、もしくは実質的にすべておよび/または陰性遺伝子のすべてを含むか、あるいはそれらからなってよい。予後判定遺伝子セットは、本発明の態様間で独立して、内容および数が異なってもよい。
【0103】
予後判定セットには、表S6の遺伝子のうち、少なくとも5個、10個、20個、30個、40個、50個、60個またはすべてが含まれてよい。
【0104】
前記予後判定セットは、表S6からの陽性遺伝子約60個または約50個または約40個または約30個または約20個または約10個または約5個を含むか、あるいはそれらからなる。表S6からの陽性遺伝子は、遺伝子が重要性の順序でランク付けされているため、表S6における陽性遺伝子のリストの上部、好ましくは上半分から選択されることが好ましい。
【0105】
予後判定セットは、表S6からの陰性遺伝子の1つまたは双方を含むか、陰性遺伝子の双方からなってよい。
【0106】
遺伝子の数および選択は、良好な予後の腫瘍と悪い予後の腫瘍(または、高NPIの腫瘍と低NPIの腫瘍)を区別することが少なくともできる予後判定セットを提供するように選択される。
【0107】
予後判定セットには、表S6のうち60個以下の遺伝子が含まれてよい。予後判定セットは、表S6のうち50個以下の遺伝子を含んでよい。予後判定セットには、表S6のうち40個以下の遺伝子が含まれてよい。予後判定セットには、表S6のうち30個以下の遺伝子が含まれてよい。予後判定セットには、表S6のうち20個以下の遺伝子が含まれてよい。予後判定セットには、表S6のうち10個以下の遺伝子が含まれてよい。予後判定セットには、表S6のうち5個以下の遺伝子が含まれてよい。
【0108】
予後判定セットは、表S6の5〜60個の遺伝子を含むか、あるいは基本的にそれらからなってよい。予後判定セットは、表S6の10〜40個の遺伝子を含むか、あるいは基本的にそれらからなってよい。予後判定セットは、表S6の10〜30個の遺伝子を含むか、あるいは基本的にそれらからなってよい。予後判定セットは、表S6の10〜20個の遺伝子、または表S6の20〜30個の遺伝子、好ましくは表S6の30〜40個の遺伝子を含むか、あるいは基本的にそれらからなってよい。
【0109】
予後判定セット、好ましくは約10個または約20個または約30個の遺伝子は、表S6の最初の約40個、または約30個、または約20個の遺伝子から選択することができる。約10個の遺伝子は、表S6の最初の約15個の遺伝子から選択することができる。約10個の遺伝子は、表S6の最初の10個の遺伝子であってよい。
【0110】
予後判定セットは、表S6の陽性遺伝子の最初の約40個または約30個または約20個または約10個の遺伝子からなる群から選択される約40個または約30個または約20個または約10個の遺伝子、場合により表S6の陰性遺伝子の一方または双方を含むか、あるいは基本的にそれらからなってよい。予後判定セットは、表S6の最初の約30個または約40個の陽性遺伝子からなる群から選択される約30個の遺伝子、場合により表S6の一方または双方の陰性遺伝子を含むか、あるいは基本的にそれらからなってよい。
【0111】
U133Aマイクロアレイと共通する予後判定セットにおける遺伝子数は、上述のように制限されることが好ましい。
【0112】
用語「約」は、記述された遺伝子数(記述された遺伝子数の10%または1個の遺伝子のうち大きい方を意味することが好ましい。
【0113】
予後判定セットの提供は、診断ツール、例えば、核酸マイクロアレイを特注して使用し、腫瘍を予測、診断またはサブタイプ化するのを可能にする。さらに、そのような診断ツールは、診断ツール(例えば、マイクロアレイ)を用いて得られる発現プロファイルを決定し、それを、上記のように、「標準」発現プロファイルまたは「既知」予後の発現プロファイルのデータベースと比較するようにプログラムされたコンピューターとつないで使用することができる。その際に、コンピューターは、患者における腫瘍の存在またはタイプを診断するのに使用することができる情報を使用者に提供するばかりでなく、同時に、コンピューターは、「標準」発現プロファイルを決定し、それ自体のデータベースをアップデートすることができる他の発現プロファイルを得る。
【0114】
したがって、本発明は、初めて、予後判定セットに対応するプローブを含む特殊チップ(マイクロアレイ)の製造を可能にする。アレイの正確な物理的構造は、二次元固体基材に接続されたオリゴヌクレオチドプローブから、独特の標識、例えば「バーコード」により個々にタグ付けされた自由浮遊プローブまで異なり、かつ及ぶことがある。
【0115】
既知予後の発現プロファイルのデータベースへのクエリーを実行することは、直接法または間接法で行うことができる。「直接」法は、患者の発現プロファイルが、データベース中の他の個別発現プロファイルと直接比較され、どのプロファイルが(したがって、どの予後が)最適マッチを与えるかを決定する場合である。別法として、クエリングは、より「間接的」に行うことができ、例えば、患者発現プロファイルを、単に、特定の予後割り当て、例えば、「悪い」、または好ましくはNPI、例えば高NPIからの予後値もしくは値域についてのデータベース中の「標準」プロファイルに対して比較してもよい。間接アプローチの利点は、「標準」プロファイルが、多くの個別プロファイルの集合体であるため、それほどデータ集約型でなく、本発明によるキットの一部(すなわち、マイクロアレイと共同して)を形成することがある比較的安価なデータキャリアまたは他の記憶装置上に保存できることである。
【0116】
直接アプローチでは、多くの個別ファイルを保存しなければならないため、データキャリアがかなり大きなスケール(例えば、コンピューターサーバー)になる可能性がある。
【0117】
患者発現プロファイルを、標準プロファイル(間接アプローチ)および集合における所定の統計的変動と比較することにより、上記のように、患者発現プロファイルが「標準」カノニカルプロファイルとどの程度密接にマッチしているかに関して「信頼値」を与えることも可能である。この値は、予後の信頼性、例えば、解析を繰り返すべきか否かに関する情報を臨床医に提供するはずである。
【0118】
上述のように、データベース上に患者発現プロファイルを保存することも可能であり、それらを、いつでも使用してデータベースをアップデートすることができる。
【0119】
第6の態様において、本発明は、腫瘍群内で差次的に発現される遺伝子セットを同定するための方法を提供し、この方法は、その群の複数個の腫瘍の各々から発現プロファイルを提供すること、腫瘍の分子サブタイプに従ってプロファイルを分類すること、およびサブタイプ内で発現プロファイルを解析して遺伝子セット(ここで、その遺伝子は、そのサブタイプ内で差次的に発現される)を同定することを含む。
【0120】
この方法は、van't Veerらにおける散発性のリンパ節陰性乳房腫瘍の初期選択が、分子レベルにおけるサブタイピングよりむしろ臨床的評価によるサブタイピングを含んでいたという点でvan't Veerら(10)の方法とは異なる。
【0121】
言うまでもなく、本発明のこの態様および以下の態様は、前記の態様と密接に関連している。したがって、文脈上他の意味に解すべき場合を除き、前記態様について開示されている好ましい特徴は、この態様および以下の態様にも適用することができる。
【0122】
本発明の第6、第7および第8の態様との関連において、用語「発現プロファイル」は、予後判定セットの遺伝子に限定されない。むしろ、その用語は、一般的にその群の腫瘍における遺伝子の発現レベルを指し、分子サブタイプ内で差次的に発現される遺伝子の発現レベル(必ずしもそれのみではないが)が含まれる。
【0123】
本発明の第6の態様によって得られる遺伝子セット(以後、「識別セット」)の差次的発現は、その群の腫瘍について特定の表現型または遺伝子型を示すか、あるいはそれらに特有なことがある。この方法は、識別セットの差次的発現を特定の表現型および/または遺伝子型と関連付けるステップを含むことが好ましい。異なるが既知の表現型および/または遺伝子型の多くのサンプルにおける識別セットの発現プロファイルを決定し、識別セットの特定の遺伝子発現プロファイルと特定の表現型および/または遺伝子型との間の相関を確立することができる。
【0124】
差次的発現は、腫瘍のある患者の療法または診断の一部として腫瘍に割り当てられた臨床的パラメーターまたは医学的クラス、例えば、NPI値またはNPIクラスなどの予後の尺度に特有であってよい。識別セットの差次的発現は、腫瘍サンプルを、少なくとも2つの異なる遺伝子型または表現型クラスのうち1つに割り当てることを可能にする。
【0125】
さらに、本発明の第6の態様の方法には、患者からの腫瘍サンプルにクラスを割り当てるためのステップが含まれてよく、ここで、識別セットの遺伝子の差次的発現は、そのクラスに特有であり、そのステップは、識別セットのサンプルにおける発現レベルを提供すること、および発現レベルに基づいて腫瘍にクラスを割り当てることを含む。
【0126】
クラスを割り当てるステップは、前記のように、加重投票、サポートベクトルマシンまたは階層的クラスタリングなどであるが、それらに限定されない統計的技法の使用を含んでよい。この方法は、腫瘍サンプルの分子サブタイプを同定し、そのサブタイプに特異的な識別セットを用いるステップを含むことが好ましい。
【0127】
その上あるいは別法として、本発明の第6の態様の方法には、腫瘍サンプルにおける識別セットの発現レベルを決定するステップと、発現レベルから発現プロファイルを決定するステップと、そのプロファイルをデータベースに加えるステップとが含まれてよい。腫瘍サンプルの分子サブタイプも同定されることが好ましく、データベースに加えられることが好ましい。
【0128】
特定のクラスに特有の標準プロファイルは、既知クラスの少なくとも2つの発現プロファイルから得ることができ、ここで、それらの発現プロファイルは、識別セットの遺伝子から得られる。標準プロファイルは、クラスおよび分子サブタイプに対して特異的であることが好ましい。その上あるいは別法として、既知クラス(場合によりサブタイプ)の発現プロファイルは、データベースに加えられる。
【0129】
その上、あるいは別法として、第6の方法には、治療中の腫瘍のクラスにおける変化についてチェックするためのステップがさらに含まれてよい。一実施形態において、発現プロファイルは、治療の異なる段階(例えば、治療の始まりおよび治療の終わり)において腫瘍から提供され、クラスにおける変化を決定するために比較され、ここで、発現プロファイルは、識別セットの遺伝子の発現レベルから得られる。発現プロファイルは、標準および/または既知プロファイルと比較され、クラスを決定することが好ましい。
【0130】
分子サブタイプによる分類は、病理組織学的(例えば、免疫学的)技法または腫瘍サンプルにおける遺伝子発現産物のレベルを直接測定する遺伝子発現技法などの技法を用いて行われることが好ましい。遺伝子発現技法が最も好ましい。しかしながら、分子サブタイプを正確に識別することができる臨床的技法も使用することができる。
【0131】
腫瘍は、乳房腫瘍であることが好ましく、分子サブタイプは、腫瘍のER (エストロゲン受容体)ステータス(例えば、ER+)に対応していることが好ましい。しかしながら、この方法は、他の腫瘍群(例えば、肺腫瘍、卵巣腫瘍およびリンパ腫)および/または他の分子サブタイプ(例えば、びまん性大細胞型 B 細胞リンパ腫における胚中心様および活性化B細胞様)に適用することができる。差次的に発現される遺伝子を決定するために発現プロファイルのクラスに対して行われる解析には、その発現レベルが、比較中にサンプル間で有意に変化する遺伝子を同定するマイクロアレイ有意性解析(SAM、ref.12)が含まれることが好ましい。解析は、統計解析、例えば、加重投票、サポートベクトルマシンおよび/または階層的クラスタリングを用いることを含むことが好ましい(これらの技法の説明については以下を参照)。
【0132】
本発明の第7の態様では、本発明の第6の態様によって得られる遺伝子セットが提供される。
【0133】
本発明の第8の態様では、腫瘍サンプルを特定のクラスに割り当てる際の識別セットの使用が提供される。
【0134】
次に、本発明の態様および実施形態を、例示として、添付の図を参照して説明する。他の態様および実施形態は、当業者には明らかであろう。このテキストに記載のすべての文書は、参照により本明細書に組み込まれる。
【0135】
材料および方法
乳房組織および臨床情報
ヒト乳房組織は、NCC保管および倫理委員会からの適切な承認後にNCC組織保管所から得た。腫瘍ステータス、ならびにエストロゲン受容体(ER)およびERBB2の免疫組織化学的ステータスの組織学的確認事項は、シンガポール総合病院の病理部によって与えられた(臨床情報の補足情報を参照)。サンプルは少なくとも50%の腫瘍固形物を含んでいた。NPIステータスは以下のように計算した:腫瘍の大きさ(cm)×0.2+グレード+リンパ節ポイント(陰性リンパ節=1ポイント;陽性リンパ節、1〜3個陽性=2ポイント;陽性リンパ節、4個以上=3ポイント)。Stanfordのデータセット中の腫瘍の大きさを、CATシステムを使用して画定したので、我々はそれぞれのCATグレードに関する近似値を割り当てた(すなわち、T1=2cm、T2=3.5、T3=5、T4=3.5)。
【0136】
サンプル調製およびマイクロアレイハイブリダイゼーション
RNAはトリゾール試薬を使用して組織から抽出し、製造者の教示書に従いU133A Genechipを使用するAffymetrix Genechipハイブリダイゼーション用に処理した。
【0137】
データ処理および分析
Raw GenechipスキャンはGenedata Refinerを使用して品質管理し、いずれのサンプルでもその発現が無かった遺伝子(すなわち「A」と呼ぶ)を除去することによって選別した。発現の値にはlog2変換を施し、それぞれのサンプルによって残りの遺伝子すべてを中央値に近づけることによって標準化した。データ分析は、Genedata Expressionistまたは従来のスプレッドシートアプリケーションを使用して行った。非管理型データセット(図1、a〜b)は、すべての十分に測定したサンプル中で1.5を超える標準偏差(SD)を示す遺伝子を含む。遺伝子選択用に使用した変量フィルターをわずかに変えることによっても、非常に類似した結果を得た(P.Tan、非公開データ)。同じ遺伝子の全く同じプローブは分析から除外し、1遺伝子当たり1つのプローブを残した。群平均法による階層的クラスタリングはCLUSTERを使用することによって行い、TREEVIEWを使用することによって示した。マイクロアレイの有意性解析(SAM)(12)を実施して、特異的に制御される遺伝子を同定した。「誤り発見率」は図1Cに関しては0.1%であり、図2に関しては15%であった。加重投票(WV)、リーブワンアウト交差検証(LOOCV)アッセイ、および予測強度(PS)は、Golub et al(13)(補足情報)中と同様に計算した。カプラン-メイヤーの生存曲線はSPSSを使用して作製し、対数順位検定を使用して生存曲線間の差の統計的有意性を計算した。遺伝子発現と臨床的変数の間の統計的関係は、カイ二乗分析によって決定した。
【0138】
加重投票(WV)およびリーブワンアウト交差検証(LOOCV)アッセイの記載
加重投票(WV):加重投票アルゴリズムは、信号対雑音(S2N)メトリックを使用して二進法分類を行う。予測セットに属するそれぞれの遺伝子に、分類するサンプル中の遺伝子発現レベルと平均群の平均発現レベルの間の加重差として表される「投票値」を割り当てる。重み付けは相関メトリックを使用して決定する:
【0139】
【数1】

【0140】
(μおよびσは、2群のそれぞれの遺伝子の発現レベルの平均値および標準偏差を示す)。個々の階級割り当ての最終的な投票値は、階級識別において使用したそれぞれの遺伝子によるすべての加重投票値を合計することによって計算する。「予測強度」(PS)は、
【0141】
【数2】

【0142】
として定義し、上式でYWINおよびVLOSEはそれぞれ、獲得および損失階級の投票値の合計である。PSは獲得の相対的マージンを表し、したがって予測確実性の定量的影響を与える。
リーブワンアウト交差検証(LOOCV):我々は標準的なリーブワンアウト交差検証(LOOCV)手法を使用して、訓練セット中の分類精度を評価した。LOOCVでは、訓練セット中の1個のサンプルを最初に「抜き取り」、分類操作(例えば、遺伝子選択および分類訓練)を残りのサンプルに行う。次いで「抜き取り」サンプルを、訓練アルゴリズムを使用して分類し、次いでこのプロセスを訓練セット中のすべてのサンプルに繰り返す。
【0143】
結果および考察
非管理型クラスタリングを使用する乳癌の分子亜型の定義
乳癌における固有の遺伝子の発現の違いの大部分は、別個の「分子亜型」(例えばER+およびER-腫瘍)に属する異なる腫瘍に原因がある可能性があることが述べられてきている(8〜9、14)。亜型と無関係に腫瘍を処理した最初の分析では、我々はNPIと関係がある発現シグネチャを納得がいくように確認することはできなかった。これは亜型間の遺伝子発現の劇的な差(亜型内の差)によるものである可能性があり、亜型内のさらに微妙な型の違い(亜型内の差)を覆い隠す可能性があると、我々は仮定した。この問題を回避するために、それぞれの分子亜型を独立したデータセットとして処理した方法を、我々は実施した。簡単に言うと、さまざまな非管理型クラスタリング技法を最初に使用して、そのそれぞれの「分子亜型」範疇に従い1セットの乳癌発現プロファイルを広く分類した。第2に、それぞれの亜型内の腫瘍を次いで個別に分析して、NPIまたはその構成要素と関係がある可能性がある発現シグネチャを定義した。
【0144】
Affymetrix U133A Genechipを使用して、我々の地域的な主に中国人である患者群由来の98個の散発性乳房腫瘍に関する発現プロファイルを、我々は作成した。データを標準化および前処理した後、我々は標準偏差フィルタリングを施して、腫瘍系中で高度の遺伝子の発現の違いを示す367の遺伝子セットを同定し、この遺伝子セットを使用して、非管理型階層クラスタリングを使用してそれらの全体的な類似性に基づいて腫瘍の発現プロファイルをグループ分けした。これらの乳房腫瘍は、それぞれER+、ER-、およびERBB2+と呼ばれる3つの主な亜群に自己分離した(図1a)。この分離型は、主成分分析(PCA)、独立分析技法(図1b)を使用して確認し、これらは非常に類似した結果をもたらした。これらのグループ分けを確かに確認するために、我々はSAM(12)を使用して、これらの亜型間で特異的に発現された遺伝子を同定した。0.1%のFDR(「誤り発見率」)で、亜型特異的な形式で有意に制御された409個の遺伝子を、我々は同定した(図1c)。
【0145】
表S5のリストは、それぞれの分子亜型(ER+、ER-、ERBB2+)において有意に制御されたとSAMによって同定した、上位50個の遺伝子を表す。異なる群中で観察された発現の混乱の程度を表すそれらのS2N相関比によって、遺伝子を順位付けする。これらの遺伝子と他の試験(参照8〜11)によって報告された同様のリストの間には、十分な重複がある。
【0146】
LIV1、TFF1およびMYBなどのエストロゲン受容体遺伝子ESR1およびエストロゲン制御型遺伝子を含めた、409の遺伝子セットの約69%がER+亜群において増大した発現を示した(補足情報)。他の試験と一致して、GATA3、HNF3a、アネキシンA9、およびXBP1の高い発現レベルも、この亜型で観察した(8〜9、11)。ER-亜群は、基礎的な哺乳動物上皮マーカー(ケラチン5および17)、基底膜タンパク質ラジニン1、不良な疾患予後と関係している(15)セリンプロテアーゼKLK5、およびセリンプロテアーゼ阻害剤マスピン、ERと逆の形式で発現されることが以前に報告された(16)タモキシフェン誘導性遺伝子の高発現と関係があった。最後に、ERBB2+亜型はERBB2受容体、およびDNA増幅の存在を示唆するGRB7およびPMNT(14)などの17q遺伝子座と物理的に結合した他の遺伝子の高い発現レベルと関係があった。しかしながら、ERBB2+亜型で特異的に増大した発現を示す大部分の遺伝子は、17q遺伝子座に限られず、S100カルシウム結合ファミリーのメンバー(S100A8、A9)などゲノム中で見られる。まとめて考えると我々の結果は、大部分の乳房腫瘍はそれらの全体的な遺伝子発現プロファイルに基づいて、異なる分子亜型に実際、さらに分けることができるという、以前の報告を実証し確認する。
【0147】
ER+腫瘍においてNPIと関係がある予後セットの同定
我々はER+分子亜型に属する34の腫瘍に焦点を当て、その発現がNPIステータスと関係がある可能性がある、この亜型内の遺伝子を同定することを試みた。古典的に乳癌患者は、NPIによって3つの主な群、「良好な」予後(NPI<3.4)、「中等度の」予後(NPI3.4〜5.4)、および「不良な」予後(NPI>5.4)に典型的に分類される(2)。異なる評価をする病理学者中の違いの影響がおそらく表されるので、他の試験はこれらの群を定義する区分値に関してわずかに異なる値を示した(17)。適切なNPI区分値を測定する際の、いかなる考えられる偏見も回避するために、2.3〜7.8で安定して増大したNPI閾値によってER+腫瘍を一連の二群に分けた、変動閾値分析を我々は行った。それぞれの閾値において、二群間で発現の有意な変化を示す遺伝子を同定した。我々は3.8〜4.6のNPI区分値を使用することによって、62個の特異的に発現された遺伝子の遺伝子セットが生じ(図2a)、その大部分が高NPIを有するER+サンプル中で増大した発現を示したことを見出した(図2b)。我々はこの62メンバーの遺伝子セットを、表S6中に示す「NPI発現シグネチャ」またはNPI-ESと呼ぶ。NPI発現シグネチャに属する遺伝子は、DNA複製および細胞分裂(APRT、MCM4、KNSL1、CDC2)、細胞シグナル(ケモカインリガンド1、Met、ShC)、アポトーシス(サービビン、CD27結合タンパク質)、および細胞接着(ディスク状の大きな相同体7、テトラスパン1)を含めた、腫瘍形成と関係があるさまざまな細胞機能と関係がある。個々のNPI要素(腫瘍の大きさ、腫瘍のグレード、リンパ節状態)の中では、腫瘍のグレードがNPI-ESの分子構成に対する主な貢献要素であるようである(補足情報)。
【0148】
NPI-ESによる腫瘍の分類によって、2つの別個の分子群が定義される
腫瘍を分類するために分子プロファイルを使用する際の1つの示された利点は、分類が後の治療行程に影響を与える場合に特に重要である、分類の信頼レベルを数学的に定量化する能力である(11)。このようなシナリオでは、治療を行う医師は、特異的介入による考えられる罹患率に対する予測の信頼レベルを重み付けすることがしたがって可能である。特に、我々のデータセット中のER+サンプルは、連続的な範囲の古典的なNPI値(2〜8)と関係があったが、NPI-ESを使用するクラスタリング分析は、ER+腫瘍を2つの明らかに別個の群に分離したようであり(図2b)、組織病理学的パラメータに基づいて連続的な値を示すサンプルは、やはり分子レベルで別個の範疇に分離することができるという可能性が生じた。
【0149】
この2つのクラスを確かに区別するNPI-ESの能力をより良く定義するために、我々は加重投票(13)、管理型学習アルゴリズムを使用して、高発現のNPI-ESと低発現のNPI-ESを示す腫瘍を区別し、確立されたリーブワンアウト交差検証(LOOCV)アッセイを使用して訓練アルゴリズムの分類精度を試験した。分類精度以外に、定量的メトリック(予測強度、PS)もGolub et al(13)中に記載されたのと同様に計算して、予測信頼の評価値を与えた(図2c)。WV分析によって、NPI-ESは3つの誤分類で91%のLOOCV分類精度をもたらしたことが明らかになった。誤って分類された3サンプルの中では、2サンプルが低い予測強度(PS<0.3)と関係があり、したがって「低信頼度」または「不正確な」分類を表す。実際、(34個中)29個のER+腫瘍が「高信頼度」分類と関係があり(PS>0.3)、1個のサンプルのみが誤って分類された。これらの結果は、NPI-ESを使用して、我々のデータセット中の大部分のER+腫瘍を、高い信頼度で別個の群に分類することができることを示唆する。
【0150】
亜型と無関係にすべての腫瘍を使用する、NPI発現シグネチャの導出
我々は2ステップの方法を使用してNPI-ESを定義した。最初に、非管理型クラスタリングを使用して、そのそれぞれの「分子亜型」(すなわちER+、ER-、ERBB2+)に従い腫瘍を群にした。それぞれの亜型内の腫瘍は、NPIと関係がある可能性がある発現シグネチャに関して分析した。ここで我々は、最初のステップ(異なる分子亜型の定義)を実施することは、NPI-ESの同定において重要であることを示す。
【0151】
我々は分子亜型と無関係に全79の腫瘍からなるデータセットを構築し、変動するNPI閾値の分析を実施して、前と同様に「適切な」NPI閾値を定義した(図2a参照)。我々は4のNPI閾値を使用することによって、合計44の特異的に発現された遺伝子が生じたことを見出した。この44の遺伝子セットの中では、16個(35%)が(ER+サンプルに由来した)NPI-ESにも属する。
【0152】
我々は加重投票(WV)および交差検証(LOOCV)アッセイを使用して、腫瘍サンプルを別個の群に確かに分類する、この44の遺伝子セットの能力を評価した。図S3中に見ることができるように、低信頼度(PS<0.3、赤い領域)サンプルの数、および誤分類率(44の遺伝子セットに関して9%)はいずれも、図2cと比較して有意に増大する。この結果は、全79の腫瘍に基づく44の遺伝子セットは、腫瘍のNPIステータスを予測する際にER+腫瘍のNPI-ESより有効性が低いことを示す。
【0153】
図S3では、それらのNPI値(X軸)によってサンプルを選別する。加重投票を使用してサンプルを分類し、それぞれのサンプルの予測強度(Y軸)はGolub et al(13)に基づいて計算した。予測強度<0.3でのサンプル分類は、「不正確」または「低信頼度」であると見なす(グレーの領域)。図2cと比較して、より多数の「不正確な」(低PS)サンプル、および誤分類サンプルが観察される。
【0154】
亜型と無関係にすべての腫瘍由来の44の遺伝子セットも、独立したデータセット中のNPIステータスを予測する際に、NPI-ESほど有効ではない。盲験セットとしてRosettaのデータセットを使用して、我々はこの44の遺伝子セットを、Rosettaのデータセット中に見られた49のER+腫瘍に施用して、スチューデントのt-検定を使用して、高レベルの44の遺伝子セットを発現するER+腫瘍と高NPIを有するER+腫瘍の間の関係の有意性を決定した。我々は44の遺伝子セットに関して0.29のp値を得て、これはNPI-ESに関する0.0004のp値と比較してはるかに有意性が低かった。
【0155】
興味深いことに、ER+腫瘍の分析から導出したにもかかわらずNPI-ESは、Rosettaのデータセット中の全78の腫瘍を施用した時でさえ44の遺伝子セットより優れている。このことを示すために、78のRosetta腫瘍を、それぞれNPI<3.4(良い予後)および>3.4(適度な予後)の2群に分けた。次いで加重投票を使用して、NPI-ESまたは44の遺伝子セットによってRosetta腫瘍を分類した。表S3中に見ることができるように、70%の分類精度をもたらした44の遺伝子セットと比較して、NPI-ESは80%の分類精度をもたらした。
【0156】
組織的グレード(1および2対3)と関係がある遺伝子
古典的なNPIは腫瘍のグレード、腫瘍の大きさ、およびリンパ節状態から導出される複合的なメトリックであるので、我々はこれらの個々の要素のそれぞれによってなされたNPI-ESの分子構成に対する貢献を定義した。3つの組織病理学的変数のそれぞれと関係がある遺伝子を同定するためのSAMを使用して、その発現が腫瘍の大きさまたはリンパ節状態のいずれかと有意に関係があった遺伝子を、我々は納得がいくように確認することはできなかった。対照的に、組織的グレードの場合、相当数の遺伝子がグレード1または2およびグレード3の腫瘍間で特異的に発現されたことが見出され、このグレード関連遺伝子セット中の遺伝子はNPI-ESと相当な重複(66%)を示した(表S6)。これらの結果は、異なる組織的グレードを示す腫瘍は生物学的に異なる可能性があり、腫瘍のグレードはNPIの発現シグネチャに対する重要な貢献要素であり、残り2つのパラメータ(腫瘍の大きさおよびリンパ節状態)は比較的低い貢献をしたことを示唆する。
【0157】
多数の独立した乳癌発現データセットへのNPI-ESの適用
一連の盲検法の「試験セット」におけるNPIステータスおよび疾患予後を予測する、NPI-ESの能力を試験するために、我々は公に入手可能であった2つの独立した乳癌データセットを使用した。第1のデータセット(Rosettaのデータセットと呼ぶ)は、オリゴヌクレオチドベースのマイクロアレイを使用して概略を決定した78のリンパ節陰性乳房腫瘍からなり、それぞれの患者の「無病生存」(DFS)期間(最初の腫瘍診断から新たな遠隔転移の出現までの時間)も含む(10)。重要なことに、いくつかの試験は、リンパ節陰性乳癌(18、19)においてさえも予後値であるNPIを以前に示している。第2のデータセットは、cDNAマイクロアレイおよび全患者の生存情報を使用して概略を決定した78の乳癌からなる(Stanfordのデータセットと呼ぶ)(14)。これらのデータセットの有用性によって、我々はNPI-ESの予測能力を個別に試験することができた、なぜならRosettaおよびStanfordのデータセットは、I)患者群、II)サンプル処理プロトコル、III)記録する病理学者、およびIV)アレイ技術およびプローブセットの選択(RosettaおよびStanfordのデータセットでは2色、および我々のデータセットでは1色)を含めた多数の点で、我々のデータセットと異なるからである。
【0158】
Rosettaの乳癌データセット:ER+、ER-、およびERBB2+亜型を定義するSAM分析によって同定した409の遺伝子の中で、276の遺伝子(67%)がRosettaマイクロアレイに見られた。我々はこの遺伝子セットを78のRosetta腫瘍プロファイルに施用して、ER+分子亜型に属する49の腫瘍を同定し、NPIESに属する62遺伝子中46の遺伝子もRosettaマイクロアレイに存在したことを判定した。Rosettaのデータセットは我々のものとは異なるアレイ技術に基づくので、我々のデータセットに関して開発した訓練型加重投票モデルを直接施用して、Rosetta腫瘍を分類することはできない。
【0159】
しかしながら、異なるアレイ技術間の遺伝子セットの比較に関してRamaswamy et al(20)中に記載された戦略に従い、我々は階層クラスタリングを使用して、重複する46のNPI-ES遺伝子セットを使用して49個のER+Rosetta腫瘍をグループ分けした。クラスタリング分析によって49個のER+Rosetta腫瘍を、それぞれ「高い」および「低い」発現レベルのNPI-ESを示す24個と25個の腫瘍からなる2つのグループに分けた(図S9参照)。
【0160】
我々はこの2つの亜群中の腫瘍を比較して、腫瘍はそれらのNPI値の違いと関係があったかどうかを決定した。連続勾配(スチューデントのt-検定)として、あるいは2つの別個の群(カイ二乗分析、3.4という古典的NPI区分値を使用する)として腫瘍のNPI値を処理する、2つの異なる統計手法を使用すると、NPI-ESの高い発現を示す腫瘍は、低レベルのNPI-ESを示す腫瘍と比較して、有意に高いNPI値を絶えず示した(連続分析に関してp=0.0004、二進法分析に関してp=0.0087)(表1a)。この分析は、異なるアレイ技術によって作製した独立したデータセットにおいてさえも、NPI-ESの発現はER+腫瘍における古典的NPIステータスと有意に関係があることを示す。
【0161】
NPI-ESの予後判定能力と古典的NPI系のグレード評価を比較するために、オッズ比の計算を実施した(表1b)。高レベルのNPI-ESを発現するER+腫瘍を有する患者は、低レベルのNPI-ESを発現するER+腫瘍と比較して、5年以内の遠隔転移に関して10.3のオッズ比を有していた(95%CI、2.4〜44.0、p<0.001)。対照的に、古典的NPI指数>3.4を有するER+腫瘍(「中等度の」予後)を有する患者は、NPI指数<3.4を有するER+腫瘍(「良好な」予後)と比較して、遠隔転移に関して6.1の低いオッズ比を有していた(95%CI、1.6〜23.4、p=0.06)。我々はカプラン-メイヤーの生存分析を使用して、NPI-ESとNPIの予後判定性も比較した(図3)。他の試験と一致して、低いNPI(<3.4)の腫瘍を有する患者は、高いNPI(>3.4)の患者と比較して良いDFSを示した(p=0.007、図3a)。この同じ群をNPI-ESによって再度分類すると、NPI-ESの高発現を示す腫瘍を有する患者は、低レベルのNPI-ESを発現する腫瘍を有する患者と比較して、より良い無再発の生存を示した(p=0.0007)。まとめて考えると、このデータはER+腫瘍に関して、NPI発現シグネチャの予後判定能力は、古典的NPI系のグレード評価より優れている可能性があることを示唆する。
【0162】
Stanfordのデータセット:類似の手法を使用して、Stanfordのデータセットに関するNPI-ESを試験した(図S10参照)。ER+、ER-、およびERBB2+亜型を定義するために使用したSAM-409の遺伝子セットの中で、136の遺伝子がStanfordマイクロアレイで見られ(http://genorne-www5.stanford.edu/MicroArray/SMD/)、これらの遺伝子を使用してStanford腫瘍を群にして、(おそらく汚染された非悪性組織の存在によるものである、6個の腫瘍の正常様の腫瘍亜群を排除した後に72個の腫瘍から)ER+分子亜型に属する46個の腫瘍を同定した。
【0163】
これら46個の腫瘍は、NPI-ES(Stanfordマイクロアレイ上で31の整合)を使用して、「高NPI-ES」(13個の腫瘍)と「低NPI-ES」群(33個の腫瘍)に次いで分類した(図S11参照)。再度、スチューデントのt-検定によって、高および低発現NPI-ES亜群と古典的NPIステータスの間の、有意な関係(p=0.001)が明らかになった(表1a)。さらにKM生存分析も、高NPI-ES発現腫瘍を有する患者と比較した、低NPI-ES発現腫瘍を有する患者の有意な(p=0.0493)全体的な生存の利点を実証した(図3d)。
【0164】
興味深いことに、高レベルのNPI-ESを発現するER+腫瘍と、Sorlie et al(14)において同定された「LuminalC」分子亜型の間には強い相関関係があるようであるが、NPI-ESに属する62個の遺伝子のいずれも、後者において発現されることは報告されていない。興味深いことにSorlie et al(ref.14)は、「固有の」500個の遺伝子のセットに基づいて「LuminalC」亜型を同定したことを以前に報告した。「LuminalC」腫瘍と高レベルのNPI-ESを発現する腫瘍の間には、十分な重複(96%)があるようであるが、前述のように、NPI-ESに属する62個の遺伝子の中でこの「固有の」セット中に見られるものはない。これは表S11中に例示する。
【0165】
NPI-ESの予後判定能力は、乳癌に関して以前に記載された「予後シグネチャ」に匹敵する
Van Veer et al(10)による同じ試験において筆者は、乳房腫瘍のDFSステータスを予測した70遺伝子の「予後」発現シグネチャ(PES)も同定した。興味深いことに、NPI-ESに属する遺伝子とPESに属する遺伝子の間には最小限の重複がある、なぜなら1つの遺伝子のみがこの2つの間に共通して見られるからである。RosettaのER+腫瘍におけるNPI-ESおよびPESの予後判定性を比較するために、我々はKM生存分析を使用して、NPI-ES(図3b)またはPES(図3c)によって分類した患者のDFSを比較した。NPI-ES(p=0.0007)と比較して、わずかに良い性能をPESに関して観察した(p=0.0001)。PESに関するわずかな改善は、しかしながら予想外のことではなかった、なぜなら、PESの確認はこれらの同一の腫瘍の発現プロファイルおよび臨床情報に直接基づくからである。このように、Rosetta腫瘍はPESに対して「無関係」ではないが、一方NPI-ESの場合、Rosetta腫瘍は真の独立した試験セットとなる。実際、PESおよびNPI-ESをStanford ER+腫瘍に施すと、両方の分子シグネチャが5年以内の再発に関して、非常に類似したオッズ比(PESに関して3.9およびNPI-ESに関して4.17)をもたらした(表1c)。したがってこれらの結果は、NPI-ESとPESの予後判定能力は比較的類似していることを示唆する。
【0166】
NPI-ES分子シグネチャの発現によって化学療法に対する応答性が予測される
この分析では、我々は化学療法の前後に対の乳房腫瘍サンプルにおいて、NPI-ES分子シグネチャの発現を調べ、このシグネチャの発現と最終的な臨床応答を関連付けた。
【0167】
20対のサンプルからなる、公に入手可能な乳癌データセット(「Stanford」)を使用して、14週のドキソルビシン処理で「Before」および「After」を得た(8)。NPI-ESにおいて見られた62個の遺伝子のうち、31個の遺伝子はStanfordマイクロアレイでも見られ、31の遺伝子セットの発現は対のサンプルにおいて調べた。
【0168】
20個の「Before」サンプルのうち、10個のサンプルは高レベルのNPT-ES発現(H)を示し、10個のサンプルは低レベルの発現(L)を示した。図S13中に示すように、前者10個のサンプルのうち、6個のサンプルが化学療法後に高レベルの発現を保ち(H->H、赤色で示す)、一方4個のサンプルは処理後に低レベルの発現を示した(H->L、黄色で示す)。表S12中に示すように、死亡数(5年後)をそれぞれの群に関して次いで表にした。
【0169】
カプラン-メイヤーの無再発生存分析を次いで行った、これは図S14中に示す。'H->L'腫瘍は他の群と比較して最良の生存結果(p=0.022)を有しており、一方'H->H腫瘍は予後がさらに不良であることを、我々は見出した。この結果は、高発現NPI-ES腫瘍におけるNPI-ESの下方制御は、化学療法に対する応答性の指標として考えることができることを示唆する。
【0170】
要約すると我々は、NPIに関して分子の代用としておそらく働くことができる、62の遺伝子発現シグネチャを同定している。異なる施設によって作製された2つの独立したセットの腫瘍に関する、NPIステータスと疾患予後の両方をそれが予測することができたことを示すことによって、NPI-ESの確かさの信頼性を得た。この試験から生じる1つの興味深い概念は、組織病理学的レベルで外見上連続的な変数を示すサンプルは、やはり分子レベルで別個の範疇に分離することができるということである。これによって癌の組織病理学における主な難題、すなわち記録するパラメータが連続性であるときに、臨床上適切な区分値を定義する難しさに対処することができる。NPI-ESの臨床的有用性を完全に評価することができる前に、さらに多くの作業を行う必要があることを認めることによって、我々は結論に至る。第1に、NPI-ESの予後判定能力を、さらに大きな腫瘍群に対して試験する必要があることは明らかである。
【0171】
第2に、我々はER+分子亜型におけるNPI-ESの適用性を実証してきているが、NPI-ESの発現は他の分子亜型(ER-、ERBB2+)と関係があるNPI値とはそれほど関係はないようである(補足情報)。
【0172】
サンプルデータ
表S14は、異なるNPI値のサンプル中の予後判定セット(またはNPI-ES)の発現データを示す。これらのデータはAffymetrix U133A遺伝子チップに特異的であり、データは前処理してある。予後判定セットの遺伝子の発現プロファイルは訓練データとして使用して、予測モデル(例えばWVおよびSVM)を構築することができ、次いで未知の腫瘍のNPIクラスを割り当てることができる。
【0173】
これらのデータはタブ区切り形式であり、以下の形式を有する:
縦列:
第1の縦列:予後判定セットの遺伝子のプローブ_ID
第2の縦列:遺伝子の名称
第3の縦列および他の縦列:遺伝子の発現データ
横行:
第1の横行:サンプルのID(35サンプル)
第2の横行:NPI指数
第3の横行および他の横行:遺伝子の発現データ
【0174】
遺伝子の発現データは、「サンプル調製およびマイクロアレイハイブリダイゼーション」ならびに「データの前処理」中に記載したのと同様に誘導する(物質および方法の項を参照)。特に、生の遺伝子の発現データ値は、マイクロアレイ(通常はマイクロアレイスキャナー、例えばAffymetrix)を測定するために使用した装置によって計算する。
【0175】
表S15は、各クラスの予後判定セットの各遺伝子に関する加重投票アルゴリズムにおいて使用するための、平均値(()および標準偏差(()のパラメーターを示す。これらのデータを使用して、予後判定セットの遺伝子に関する一組の発現レベルが与えられれば、未知乳房腫瘍サンプルの予後を割り当てることができよう。このデータは、Affymetrix U133A遺伝子チップからの発現データに施す加重投票技法に特異的である。
【0176】
(参考文献)
【0177】
【表1】

【0178】
【表2】

【0179】
【表3】

【0180】
【表4】


【0181】
表S3、70%の分類精度をもたらした44の遺伝子セットと比較して、NPI-ESは80%の分類精度をもたらした。
【0182】
【表5】

【0183】
【表6】





【0184】
【表7】




【0185】
【表8】


【0186】
【表9】

【0187】
【表10】

【0188】
【表11】

【0189】
【表12】







【0190】
【表13】



【0191】
【表14】


【図面の簡単な説明】
【0192】
【図1a】グローバルな発現プロファイルによる散発性乳房腫瘍のクラスタリングを示す図である。a)遺伝子発現において最高の変動を示す上位376個の遺伝子を用いる98の乳房腫瘍についての非監視下の階層的クラスタリング。
【図1b】グローバルな発現プロファイルによる散発性乳房腫瘍のクラスタリングを示す図である。b)376個の遺伝子セットを用いる主成分分析(PCA)。類似の分子グループ化は、a)と同様に観察される。
【図1c】グローバルな発現プロファイルによる散発性乳房腫瘍のクラスタリングを示す図である。c)腫瘍サブタイプ間で有意に調節される遺伝子からなるSAM-409遺伝子セットを用いるサンプルの階層的クラスタリング。SAM-409遺伝子セットにおける約2/3の遺伝子は、ER+腫瘍において発現の増加を示す。
【図2a】NPIと相関する発現シグネチャ(NPI-ES)の同定を示す図である。a)移動NPI閾値を用いる差次的に発現される遺伝子の決定。有意な差次的発現を示す遺伝子(y-軸)は、各閾値(x-軸)において同定された。4の閾値を用いることは、差次的に調節される遺伝子の最多数を与える。
【図2b】NPIと相関する発現シグネチャ(NPI-ES)の同定を示す図である。b)NPI-ESを用いるER+サンプルの階層的クラスタリング。赤色のバーは、低NPI (<4)のサンプルを示し、一方、青色のバーは、高NPIのサンプルを示す。
【図2c】NPIと相関する発現シグネチャ(NPI-ES)の同定を示す図である。c)NPI-ESを用いるER+腫瘍サンプルの分類および予測信頼性。サンプルは、それらのNPI値(x-軸)によってソートされる。加重投票を用いてサンプルを分類し、各サンプルの予測強度(y-軸)を、Golubら(13)に基づいて算出した。予測強度が<0.3であるサンプル分類は、「不確実」または「低信頼性」(灰色の領域)と見なされる。
【図3a】ER+腫瘍について様々な分類スキームの予後強度を比較するKM生存率分析を示す図である。緑色の線は、(a)低NPI、(b)低NPIES発現レベル、または(c)低「予後」シグネチャ(PES)発現レベルを表し、一方、桃色の線は、高レベルを表す。(a)古典的NPIにより「良好な」予後(NPI<3.4) (35の腫瘍)および「中等度の」予後(NPI>3.4) (14の腫瘍)に層別化された49のRosetta ER+腫瘍。
【図3b】ER+腫瘍について様々な分類スキームの予後強度を比較するKM生存率分析を示す図である。緑色の線は、(a)低NPI、(b)低NPIES発現レベル、または(c)低「予後」シグネチャ(PES)発現レベルを表し、一方、桃色の線は、高レベルを表す。 (b)NPI-ESにより高レベル(24の腫瘍)対低レベル(25の腫瘍)のNPI-ESを発現する群に層別化された同じ49のRosetta ER+腫瘍。
【図3c】ER+腫瘍について様々な分類スキームの予後強度を比較するKM生存率分析を示す図である。緑色の線は、(a)低NPI、(b)低NPIES発現レベル、または(c)低「予後」シグネチャ(PES)発現レベルを表し、一方、桃色の線は、高レベルを表す。(c)70-遺伝子「予後」シグネチャにより、それぞれ「良好な予後」群(27の腫瘍)対「不良な予後」群(22の腫瘍)に層別化された同じ49のRosetta ER+腫瘍。
【図3d】ER+腫瘍について様々な分類スキームの予後強度を比較するKM生存率分析を示す図である。緑色の線は、(a)低NPI、(b)低NPIES発現レベル、または(c)低「予後」シグネチャ(PES)発現レベルを表し、一方、桃色の線は、高レベルを表す。(d)NPI-ESにより高レベル(13の腫瘍)対低レベル(33の腫瘍)のNPI-ESを発現する群に層別化された46のStanford ER+腫瘍。
【図S3】サブタイプとは無関係にすべての腫瘍に基づく44-遺伝子セットを用いる腫瘍サンプルの分類および予測信頼性を示す図である。
【図S8】Rosettaデータセットからの遺伝子発現データの階層的クラスタリングを示す図である。上部)腫瘍間の類似性を表示する系統樹。色分けされたバーは、対応する遺伝子シグネチャに対するサブタイプを示した。左)3つの異なる遺伝子クラスターによる276の遺伝子フルクラスター。ここで留意すべきは、一部のERBB2腫瘍は、ER+腫瘍(赤色のバー)と分離するように見えたが、ERBB2+関連遺伝子の発現の厳重な検査(クラスターグラムのズームアップ)によりERBB2+として同定された。これは、ERBB2サブタイプよりかなり多数のER+サブタイプに関連する遺伝子を有するRosettaマイクロアレイに起因している。
【図S9】NPI-ESの発現レベルに基づくRosetta ER+サンプル(49)の階層的クラスタリングを示す図である(62個の遺伝子からRosettaデータにおいて見いだされた46のマッチ)。カラーバーは、図2bにおいて定義した通りである。
【図S10】Stanford乳房腫瘍の階層的クラスタリングを示す図である。上部)腫瘍間の類似性を表示する系統樹。色分けされたバーは、対応する遺伝子シグネチャに対するサブタイプを示した。左)3つの異なる遺伝子クラスターによる136個の遺伝子のフルクラスター。
【図S11】NPI-ESを用いるStanford 46 ER+サンプルの階層的クラスタリングを示す図である(62個の遺伝子からRosettaデータにおいて見いだされた31個のマッチ)。カラーバーは、図2b)において定義した通りである。
【図S12】ER-およびERBB2+分子サブタイプにおけるNPI-ES発現とNPIステータスの間の関係を示す図である。一般に、ER-およびERBB2腫瘍のNPIステータスは、ER+腫瘍よりも高い。ER+腫瘍の場合と異なり、我々は、ER-およびERBB2+サブタイプについて、高NPI腫瘍対低NPI腫瘍において差次的に調節されるSAM遺伝子を同定することができなかった。また、NPI-ESは、他の分子サブタイプと関係のあるNPI値と相関しているように見えない。
【図S13】14週のドキソルビシン治療「前」および「後」に得られた20対のサンプルを示す図である(Perouら、2000)。20の「前」サンプルのうち、10サンプルは、高レベルのNPI-ES発現(H)を示し、10のサンプルは、低レベルの発現(L)を示した。前者の10サンプルのうち、6つは、化学療法後も高レベルの発現を維持し(H ->H、赤色で示す)、一方、4つは、治療後に低レベルの発現を示した(H ->L、黄色で示す)。
【図S14】図S13の20のサンプルを提供した患者を用いるカプラン-マイヤー無再発生存率分析を示す図である。
【図1(a)】


【特許請求の範囲】
【請求項1】
乳癌患者の予後を判定するための方法であって、予後判定遺伝子セットの前記患者の乳房腫瘍における発現レベルに基づいて患者に予後を割り当てることを含み、予後判定セットは、表S6からの少なくとも5個の遺伝子を含む方法。
【請求項2】
予後判定セットは、表S6の遺伝子のうち少なくとも10個、20個、30個、40個、50個、60個またはすべてを含む請求項1に記載の方法。
【請求項3】
腫瘍サンプルのエストロゲン受容体(ER)ステータスを決定するステップをさらに含む請求項1または請求項2に記載の方法。
【請求項4】
腫瘍サンプルのErbB2ステータスを決定することをさらに含む請求項3に記載の方法。
【請求項5】
(a)患者から乳房腫瘍サンプルを得るステップと、
(b)予後判定セットの遺伝子のサンプルにおいて発現レベルを測定するステップとを含む請求項1から4のいずれか一項に記載の方法。
【請求項6】
ステップ(b)は、サンプルから得られる前記発現産物を、予後判定セットの遺伝子の発現を示す発現産物と結合することができる複数個の結合メンバーと接触させることを含み、そのような結合を測定することができる請求項5に記載の方法。
【請求項7】
結合メンバーは、相補的核酸配列または特異的抗体である請求項6に記載の方法。
【請求項8】
高NPIかそれとも低NPIであるとして、または良好な予後かそれとも悪い予後であるとして乳房腫瘍のサンプルを分類することを含む請求項1から7のいずれか一項に記載の方法。
【請求項9】
予後を割り当てるステップは、テスト中の乳房腫瘍サンプルからの発現プロファイルを、以前に得られたプロファイルおよび/または特定の予後に特有の以前に決定された標準プロファイルと比較することによって行われる請求項1から8のいずれか一項に記載の方法。
【請求項10】
以前に得られたプロファイルは、プロファイルのデータベースとして保存される請求項9に記載の方法。
【請求項11】
治療の前後に乳房腫瘍サンプルにおける予後判定セットの発現レベルを比較し、予後の改善または予後の悪化を示す発現プロファイルにおける変化を検出することをさらに含む請求項1から10のいずれか一項に記載の方法。
【請求項12】
乳房腫瘍サンプルに予後を割り当てるための機器であって、複数個の結合メンバーが接続している固体支持体を含み、各結合メンバーは、予後判定遺伝子セットのうち1つの発現産物と特異的かつ独立して結合することができ、予後判定セットは、表S6からの少なくとも5個の遺伝子を含む機器。
【請求項13】
予後判定セットは、表S6の遺伝子のうち少なくとも5個、10個、20個、30個、40個、50個、60個またはすべてを含む請求項12に記載の機器。
【請求項14】
固体支持体は、表S6において同定されている遺伝子の発現産物と特異的かつ独立して結合することができる結合メンバーのみと接続されている請求項12または請求項13に記載の機器。
【請求項15】
核酸マイクロアレイを含み、結合メンバーは、核酸配列である請求項12から14のいずれか一項に記載の機器。
【請求項16】
乳癌患者に予後を割り当てるためのキットであって、予後判定遺伝子セットの遺伝子の発現産物と特異的に結合することができる複数個の結合メンバーおよび検出試薬を含み、予後判定セットは、表S6からの少なくとも5個の遺伝子を含むキット。
【請求項17】
予後判定セットは、表S6の遺伝子のうち少なくとも10個、20個、30個、40個、50個、60個またはすべてを含む請求項16に記載のキット。
【請求項18】
データ解析ツールをさらに含み、データ解析ツールは、コンピュータープログラムである請求項16または請求項17に記載のキット。
【請求項19】
データ解析ツールは、異なる予後の腫瘍の発現プロファイルを識別するように適合されているアルゴリズムを含む請求項18に記載のキット。
【請求項20】
既知予後の乳房腫瘍サンプルからの発現プロファイルおよび/または特定の予後に特有の発現プロファイルを含む請求項16から19のいずれか一項に記載のキット。
【請求項21】
請求項12から15のいずれか一項に記載の機器を含む請求項16から20のいずれか一項に記載のキット。
【請求項22】
PCRにおいて増幅できるように、予後判定セットの遺伝子の発現産物と結合することができるヌクレオチドプライマーを含む請求項16から20のいずれか一項に記載のキット。
【請求項23】
乳房腫瘍サンプルについて核酸発現プロファイルを作成する方法であって、
(a)前記乳房腫瘍サンプルから発現産物を単離するステップと、
(b)予後判定遺伝子セットの発現レベルを同定するステップと(ここで、予後判定遺伝子セットは、表S6からの少なくとも5個の遺伝子を含む)、
(c)前記乳房腫瘍サンプルについての発現プロファイルを発現レベルから作成するステップとを含む方法。
【請求項24】
予後判定セットは、表S6の遺伝子のうち少なくとも10個、20個、30個、40個、50個、60個またはすべてを含む請求項23に記載の方法。
【請求項25】
発現プロファイルを、遺伝子発現プロファイルデータベースに加えることを含む請求項23または請求項24に記載の方法。
【請求項26】
発現プロファイルを、特定の予後に特有の第2の発現プロファイルまたは複数個の第2の発現プロファイルと比較することをさらに含む請求項23から25のいずれか一項に記載の方法。
【請求項27】
(a)第1の乳房腫瘍サンプルから発現産物を単離し、前記発現産物を、予後判定セットの発現産物と特異的かつ独立して結合することができる複数個の結合メンバーと接触させ、腫瘍サンプルにおける予後判定セットの発現レベルから第1の発現プロファイルを作成するステップと、
(b) 既知予後の第2の乳房腫瘍サンプルから発現産物を単離し、前記発現産物を、ステップ(a)の予後判定セットの発現産物と特異的かつ独立して結合することができる複数個の結合メンバーと接触させ、乳房腫瘍サンプルの同等な第2の発現プロファイルを作成するステップと、
(c)第1の発現プロファイルと第2の発現プロファイルを比較して、第1の乳房腫瘍サンプルの予後を判定するステップとを含む請求項26に記載の方法。
【請求項28】
乳房腫瘍サンプルの複数個の遺伝子発現プロファイルを含む発現プロファイルデータベースであって、遺伝子発現プロファイルは、予後判定遺伝子セットの発現レベルから得られ、予後判定遺伝子セットは、表S6からの少なくとも5個の遺伝子を含み、データキャリア上に検索可能に保持される発現プロファイルデータベース。
【請求項29】
予後判定セットは、表S6の遺伝子のうち少なくとも10個、20個、30個、40個、50個、60個またはすべてを含む請求項28に記載の発現プロファイルデータベース。
【請求項30】
発現プロファイルは、核酸発現プロファイルである請求項28または請求項29に記載の発現プロファイルデータベース。
【請求項31】
発現プロファイルは、ソース腫瘍のERステータスに従ってカテゴリー化される請求項28から30のいずれか一項に記載の発現プロファイルデータベース。
【請求項32】
腫瘍群内で差次的に発現される遺伝子セットを同定するための方法であって、群の複数個の腫瘍の各々から発現プロファイルを提供すること、腫瘍の分子サブタイプに従ってプロファイルを分類すること、およびサブタイプ内で発現プロファイルを解析して識別遺伝子セットを同定すること(ここで、識別セットの遺伝子は、サブタイプ内で差次的に発現される)を含む方法。
【請求項33】
患者からの腫瘍サンプルにクラスを割り当てるためのステップであって、識別セットの遺伝子の差次的発現は、クラスに特有であり、識別セットのサンプルにおける発現レベルを提供すること、および発現レベルに基づいて腫瘍にクラスを割り当てることを含むステップをさらに含む請求項32に記載の方法。
【請求項34】
腫瘍サンプルにおいて識別セットの遺伝子の発現レベルを決定するステップと、発現レベルから発現プロファイルを決定するステップと、データベースにプロファイルを加えるステップとを含む請求項32または請求項33に記載の方法。
【請求項35】
腫瘍サンプルの分子サブタイプも同定されてデータベースに加えられる請求項32から34のいずれか一項に記載の方法。
【請求項36】
治療の異なる段階において腫瘍からの発現プロファイルを提供すること、および前記発現プロファイルを比較して予後クラスにおける変化を決定することを含み、発現プロファイルは、識別セットの遺伝子の発現レベルから得られる請求項32から35のいずれか一項に記載の方法。
【請求項37】
腫瘍は、乳房腫瘍であり、分子サブタイプは、腫瘍のERステータスに対応している請求項32から36のいずれか一項に記載の方法。

【図1b】
image rotate

【図1(c)】
image rotate

【図2a】
image rotate

【図2(b)】
image rotate

【図2c】
image rotate

【図3a】
image rotate

【図3b】
image rotate

【図3c】
image rotate

【図3d】
image rotate

【図S3】
image rotate

【図S8】
image rotate

【図S9】
image rotate

【図S10】
image rotate

【図S11】
image rotate

【図S12】
image rotate

【図S13】
image rotate

【図S14】
image rotate


【公表番号】特表2007−508812(P2007−508812A)
【公表日】平成19年4月12日(2007.4.12)
【国際特許分類】
【出願番号】特願2006−530583(P2006−530583)
【出願日】平成16年10月1日(2004.10.1)
【国際出願番号】PCT/GB2004/004195
【国際公開番号】WO2005/033699
【国際公開日】平成17年4月14日(2005.4.14)
【出願人】(506110575)エヌシーシー・テクノロジー・ベンチャーズ・ピーティーイー・リミテッド (2)
【Fターム(参考)】