乳癌の予後診断
【課題】患者の生体サンプルの遺伝子発現プロファイルに基づいた乳癌患者の予後診断を提供すること。
【解決手段】一群の遺伝子の発現を分析して乳癌の予後診断をする方法。マイクロアレイなどの様々な媒体での遺伝子発現プロファイルが、このような媒体を含むキットに含められる。
【解決手段】一群の遺伝子の発現を分析して乳癌の予後診断をする方法。マイクロアレイなどの様々な媒体での遺伝子発現プロファイルが、このような媒体を含むキットに含められる。
【発明の詳細な説明】
【開示の内容】
【0001】
〔発明の分野〕
本発明は、患者の生体サンプルの遺伝子発現プロファイルに基づいた乳癌患者の予後診断に関連する。
【0002】
〔発明の背景技術〕
リンパ節陰性(LNN)乳癌患者の約60%〜70%は、局所(local)または局部(regional)療法のみで治癒している。ランセット(Lancet)(1998年)およびランセット(Lancet)(1998年)。医師が補助的療法を受けるべき患者を選択する際の助けとなるガイドラインが作成された。最も一般的に用いられている推奨は、ザンクトガレン基準(St. Gallen criteria)(ゴールドハーシュ(Goldhirsch)ら著(2003年))および国立衛生研究所(NIH:National Institutes of Health)合意基準である。エイフェル(Eifel)ら著(2001年)。これらのガイドラインは、LNN患者の85%〜90%が補助的全身療法の候補であると示唆している。
【0003】
患者が適切な治療を確実に受けるために患者の病気が再発するリスクを具体的に特定する必要がある。現在、潜在的に危険な状態にある患者を特定できる診断器具は殆ど存在しない。遺伝子発現パターンを用いて、乳癌を臨床的に適切な異なるサブタイプに分類する。ペロウ(Perou)ら著(2000年)、ソルリー(Sorlie)ら著(2001年)、ソルリー(Sorlie)ら著(2003年)、グルーバーガー(Gruvberger)ら著(2001年)、バン・ビール(van't Veer)ら著(2002年)、ファン・デ・ビジュデール(van de Vijver)ら著(2002年)、アー(Ahr)ら著(2002年)、フアング(Huang)ら著(2003年)、ソティリオウ(Sotiriou)ら著(2003年)、ヲルフェル(Woelfle)ら著(2003年)、マ(Ma)ら著(2003年)、ラマズワミー(Ramaswamy)ら著(2003年)、チャン(Chang)ら著(2003年)、ソティリオウ(Sotiriou)ら著(2003年)、およびヘデンフォーク(Hedenfalk)ら著(2001年)。
【0004】
現在、LNN患者では、原発腫瘍を外科的に切除した後に補助的療法を行うべきか、およびどのタイプ(内分泌療法および/または化学療法)にするかの決定は、患者の年齢、閉経状態、腫瘍の大きさ、腫瘍の進行具合、およびステロイドホルモン受容体の状態に大きく依存する。これらの因子は、ザンクトガレン基準および国立衛生研究所(NIH)合意基準などのガイドラインに説明されている。これらの基準に基づくと、85%〜90%を超えるLNN患者が、補助的全身療法を受けるべき候補である。治療法を選択する際のガイドとして、より良い予後診断因子を特定する必要があることは明らかである。
【0005】
〔発明の概要〕
疾患の進行の複雑さを考慮して、広く利用できる予後マーカーを特定するために包括的なゲノムワイドな遺伝子発現の評価をここに報告する。テゥザニ(Ntzani)ら著(2003年)、およびワン(Wang)ら著(2004年)。
【0006】
本発明は、乳癌の状態を評価する方法を包含する。この方法は、乳癌患者から生体サンプルを得るステップ、および配列番号1‐111に一致するmRNA、または表10に示されている配列番号1‐111に一致するpsidsからなる群から選択されるプローブセットによって認識されるmRNAをコード化する遺伝子から選択される遺伝子のサンプルにおける発現レベルを測定するステップによって行われる。この方法において、所定のカットオフレベルよりも高いまたは低い遺伝子発現レベルは、乳癌の状態を示唆する。
【0007】
本発明は、乳癌のステージを決定する方法を包含する。この方法は、乳癌患者から生体サンプルを得るステップ、および配列番号1‐111に一致するmRNA、または表10に示されている配列番号1‐111に一致するpsidsからなる群から選択されるプローブセットによって認識されるmRNAをコード化する遺伝子から選択される遺伝子のサンプルにおける発現レベルを測定するステップを含む。この方法では、所定のカットオフレベルよりも高いまたは低い遺伝子発現レベルは、乳癌のステージを示している。
【0008】
本発明は、乳癌患者の治療プロトコルを決定する方法を包含する。この方法は、乳癌患者から生体サンプルを得るステップと、配列番号1‐111に一致するmRNA、または表10に示されている配列番号1‐111に一致するpsidsから選択されるプローブセットによって認識されるmRNAをコード化する遺伝子から選択される遺伝子のサンプルにおける発現レベルを測定するステップを含む。この方法では、所定のカットオフレベルよりも高いまたは低い遺伝子発現レベルは、再発を防止するために推奨される治療の程度および種類を医師が決定できる程度に再発のリスクを十分に示唆している。
【0009】
本発明は、乳癌患者を治療する方法を包含する。この方法は、乳癌患者から生体サンプルを得るステップと、配列番号1‐111に一致するmRNA、または表10に示されている配列番号1‐111に一致するpsidsから選択されるプローブセットによって認識されるmRNAをコード化する遺伝子から選択される遺伝子のサンプルにおける発現レベルを測定するステップを含む。この方法では、所定のカットオフレベルよりも高いまたは低い遺伝子発現レベルは、高い再発リスクを示唆し、患者のリスクが高い場合は、補助的療法で治療するステップを含む。
【0010】
本発明は、乳癌患者の予後診断遺伝子発現プロファイルを交差検証する方法を包含する。この方法は、統計的に有意な数の患者の生体サンプルから遺伝子発現データを得るステップ(a)、サンプルの順序をランダムにするステップ(b)、サンプルの約10%〜50%のデータを除外するステップ(c)、残りのサンプルに対して、全ての変数に対して目的の因子を計算して、p値カットオフ(p)を満たす変数を選択するステップ(d)、前方検索を用いて予測モデルに適合する変数を選択して、所定の誤差率になるまでトレーニング誤差(training error)を評価するステップ(e)、除外された10%〜50%のサンプルに対して予測モデルを試験するステップ(f)、除外した新しいサンプルのセットでステップ(c)‐(f)を繰り返すステップ(g)、サンプルの100%の試験が終わるまでステップ(c)‐(g)を繰り返して、分類結果を記録するステップ(h)を含む。
【0011】
本発明は、乳癌患者の予後診断遺伝子発現プロファイルを単独で検証する方法を包含する。この方法は、統計的に有意な数の患者の生体サンプルから遺伝子発現データを得るステップ(a)と、この遺伝子発現データにおける供給源によるばらつき(source variabilities)を標準化するステップ(b)と、既に選択されている全ての変数に対して目的の因子を計算するステップ(c)と、サンプルに対して予測モデルを試験して分類結果を記録するステップ(d)を含む。
【0012】
本発明は、乳癌患者の予後診断を可能にする再発ハザードスコアを生成する方法を包含する。この方法は、統計的に有意な数の患者の生体サンプルから遺伝子発現データを得るステップ(a)と、このデータに対してコックスの単変量回帰分析(univariate Cox's regression analysis)を適用して選択遺伝子を得るステップ(b)と、標準コックス係数(standard Cox's coefficients)を用いて選択遺伝子に重み付けした発現レベルを適用して、再発ハザードスコア(Relapse Hazard Score)として適用されうる予測モデルを得るステップを含む。
【0013】
本発明は、乳癌予後診断患者レポートを作成する方法を包含する。この方法は、患者から生体サンプルを得るステップ(a)、このサンプルの遺伝子発現を測定するステップ(b)、このステップ(b)の結果に対して再発ハザードスコアを適用するステップ(c)、このステップ(c)で得た結果を用いてレポートを作成して、それにより患者レポートを作成するステップ(d)を含む。
【0014】
本発明は、配列番号1‐111、または表10に示されている配列番号1‐111に一致するpsids、から選択される少なくとも1つのプローブセットの組成物を包含する。
【0015】
本発明は、生体サンプルにおいて乳癌の予後診断を決定するアッセイを行うためのキットを含む。このキットは、配列番号1‐111に一致するmRNA、または表10に示されている配列番号1‐111に一致するpsidsから選択されるプローブセットによって認識されるmRNAをコード化する遺伝子から選択される遺伝子の組合せの、単離された核酸配列、それらの補完物(complement)、またはそれらの一部を検出するための物質を含む。
【0016】
本発明は、乳癌の状態を評価するための物品を包含する。この物品は、配列番号1‐111に一致するmRNA、または表10に示されている配列番号1‐111に一致するpsidsから選択されるプローブセットによって認識されるmRNAをコード化する遺伝子から選択される遺伝子の組合せの、単離された核酸配列、それらの補完物、またはそれらの一部を検出するための物質を含む。
【0017】
本発明は、診断/予後診断のポートフォリオを包含する。このポートフォリオは、配列番号1‐111に一致するmRNA、または表10に示されている配列番号1‐111に一致するpsidsから選択されるプローブセットによって認識されるmRNAをコード化する遺伝子から選択される遺伝子の組合せの、単離された核酸配列、それらの補完物、またはその一部を含み、この組み合わせは、生体サンプルにおける乳癌の状態、または再発のリスクを特徴付けるのに十分である。
【0018】
〔詳細な説明〕
本発明は、乳癌の状態を評価する方法を包含する。乳癌患者から生体サンプルを得るステップと、配列番号1‐111に一致するmRNA、または表10に示されている配列番号1‐111に一致するpsidsからなる群から選択されるプローブセットによって認識されるmRNAをコード化する遺伝子から選択される遺伝子のサンプルにおける発現レベルを測定するステップを含む。この方法では、所定のカットオフレベルよりも高いまたは低い遺伝子発現レベルは、乳癌の状態を示唆する。
【0019】
本発明は、乳癌のステージを決定する方法を包含する。この方法は、乳癌患者から生体サンプルを得るステップと、配列番号1‐111に一致するmRNA、または表10に示されている配列番号1‐111に一致するpsidsからなる群から選択されるプローブセットによって認識されるmRNAをコード化する遺伝子から選択される遺伝子のサンプルにおける発現レベルを測定するステップを含む。この方法では、所定のカットオフレベルよりも高いまたは低い遺伝子発現レベルは、乳癌のステージを示している。この方法は、対癌米国合同委員会のTNMシステム(TNM system American Joint Committee on Cancer)(www.cancerstaging.org)、および類似の遺伝子発現プロファイルを有する患者に一致するステージの比較を含め、当分野で周知のあらゆる分類方法を利用する。
【0020】
本発明は、乳癌患者の治療プロトコルを決定する方法を包含する。この方法は、乳癌患者から生体サンプルを得るステップと、配列番号1‐111に一致するmRNA、または表10に示されている配列番号1‐111に一致するpsidsから選択されるプローブセットによって認識されるmRNAをコード化する遺伝子から選択される遺伝子のサンプルにおける発現レベルを測定するステップを含む。この方法では、所定のカットオフレベルよりも高いまたは低い遺伝子発現レベルは、再発を防止するために推奨される治療の程度および種類を医師が決定できる程度に再発のリスクを十分に示唆している。
【0021】
本発明は、乳癌患者を治療する方法を包含する。この方法は、乳癌患者から生体サンプルを得るステップと、配列番号1‐111に一致するmRNA、または表10に示されている配列番号1‐111に一致するpsidsから選択されるプローブセットによって認識されるmRNAをコード化する遺伝子から選択される遺伝子のサンプルにおける発現レベルを測定するステップを含む。この方法では、所定のカットオフレベルよりも高いまたは低い遺伝子発現レベルは、高い再発リスクを示唆し、患者のリスクが高い場合は、補助的療法で治療するステップを含む。
【0022】
前記した方法はいずれも、配列番号を、1‐35、36‐95、96‐111、または36‐111とすることができる。好ましくは、エストロゲン受容体(ER)陽性患者に対しては配列番号を36‐95とし、ER陰性患者に対しては配列番号を96‐111とする。
【0023】
サンプルは、バルク組織の用意およびレーザー・キャプチャー・マイクロダイセクションを含む、当分野で周知のあらゆる方法によって用意することができる。バルク組織は、生検または外科的試料から用意することができる。
【0024】
上記した方法は、配列番号112‐132に一致するmRNA、または表10に示されている配列番号112‐132に一致するpsidsから選択されるプローブセットによって認識されたmRNAをコード化する少なくとも1つの遺伝子の発現レベルを測定することを含むことができる。上記した方法は、サンプル内で構成的に発現される少なくとも1つの遺伝子の発現レベルを測定することも含むことができる。
【0025】
上記した方法は、サンプルのエストロゲン受容体(ER)の状態を決定することも含むことができる。ERの状態は、ERの状態を示す少なくとも1つの遺伝子の発現レベルを測定すること、サンプル中のERの存在を測定すること、および免疫組織化学的に測定することを含め、当分野で周知のあらゆる方法で測定することができる。
【0026】
上記した方法は、あらゆる生体源から得たサンプルと共に用いることができる。このサンプルは、原発腫瘍から得るのが好ましい。
【0027】
上記した方法は、少なくとも40%の特異性および少なくとも90%の感受性を有するのが好ましい。
【0028】
上記した方法は、遺伝子の発現パターンを、再発患者を示す遺伝子発現パターンと比較する場合に用いることができる。この比較は、パターン認識法を用いた遺伝子発現パターンの比較を含め、当分野で周知のあらゆる方法で行うことができる。パターン認識法は、コックスの比例ハザード分析(Cox's proportional hazards analysis)を含む当分野で周知のあらゆる方法とすることができる。
【0029】
上記した方法は、所定のカットオフレベルが、サンプル中の発現が良性細胞または正常組織に対して少なくとも1.5倍以上の過剰発現または1.5倍少ない過少発現である場合に用いることができる。所定のカットオフレベルは、転移性細胞を有するサンプルにおいて、良性細胞または正常組織に対して少なくとも統計的に有意なp値の過剰発現を有するのが好ましい。より好ましくは、p値は0.05未満である。
【0030】
上記した方法は、遺伝子発現がマイクロアレイまたは遺伝子チップで測定される場合に使用することができる。ここで使用するのに適した遺伝子チップおよびマイクロアレイも、本発明に包含される。このようなマイクロアレイは、cDNAアレイまたはオリゴヌクレオチドアレイとすることができ、1または複数の内部コントロール試薬をさらに含むことができる。
【0031】
上記した方法は、サンプルから抽出したRNAのポリメラーゼ連鎖反応(PCR)による核酸増幅によって遺伝子発現を決定する場合に使用することができる。このPCRは、逆転写ポリメラーゼ連鎖反応(RT‐PCR)とすることもできる。RT‐PCRは、1または複数の内部コントロール試薬をさらに含むことができる。
【0032】
上記した方法は、遺伝子発現を、その遺伝子によってコード化されるタンパク質を測定または検出することによって検知する場合に用いることができる。そのタンパク質に特異的な抗体による検出および遺伝子の特性の測定を含め、当分野で周知のあらゆる方法を用いることができる。適当な特徴には、限定するものではないが、DNA増幅、メチル化、突然変異、および対立遺伝子変異が含まれる。
【0033】
本発明は、乳癌患者の予後診断遺伝子発現プロファイルを交差検証する方法を包含する。この方法は、統計的に有意な数の患者の生体サンプルから遺伝子発現データを得るステップ(a)、サンプルの順序をランダムにするステップ(b)、サンプルの約10%〜50%のデータを除外するステップ(c)、残りのサンプルに対して、全ての変数に対して目的の因子を計算して、p値カットオフ(p)を満たす変数を選択するステップ(d)、前方検索を用いて予測モデルに適合する変数を選択して、所定の誤差率になるまでトレーニング誤差(training error)を評価するステップ(e)、除外された10%〜50%のサンプルに対して予測モデルを試験するステップ(f)、除外した新しいサンプルのセットでステップ(c)‐(f)を繰り返すステップ(g)、サンプルの100%の試験が終わるまでステップ(c)‐(g)を繰り返して、分類結果を記録するステップ(h)を含む。
【0034】
交差検証法は、ステップ(h)で得た遺伝子発現データが、配列番号3、4、10、18、37、40、42、43、45、55、58、64、67、72‐74、76、81、85‐86、89、97、100‐101、110‐111、125、および132‐442、または2、3、5、12、20、25、36、37、39、40、41、42、43、45、46、51、52、53、54、55、57、58、59、60、61、62、63、64、66、67、69、70、72、73、74、76、80、81、83、84、85、86、87、88、89、90、94、97、98、101、102、104、107、110、111、132、139、142、150、151、153、154、158、161、163、167、170、171、173、175、181、182、183、186、188、190、192、204、206、207、212、215、218、221、223、225、228、231、232、236、238、239、240、241、242、243、246、248、249、255、257、267、269、270、271、273、280、281、282、288、290、291、299、301、304、306、311、314、315、318、327、328、338、342、346、348、354、366、368、371、375、385、388、391、395、397、402、405、409、422、424、428、429、435、436、440、651、および443‐650に一致するmRMA、または表10に示されている配列番号3、4、10、18、37、40、42、43、45、55、58、64、67、72‐74、76、81、85‐86、89、97、100‐101、110‐111、125、および132‐442、または2、3、5、12、20、25、36、37、39、40、41、42、43、45、46、51、52、53、54、55、57、58、59、60、61、62、63、64、66、67、69、70、72、73、74、76、80、81、83、84、85、86、87、88、89、90、94、97、98、101、102、104、107、110、111、132、139、142、150、151、153、154、158、161、163、167、170、171、173、175、181、182、183、186、188、190、192、204、206、207、212、215、218、221、223、225、228、231、232、236、238、239、240、241、242、243、246、248、249、255、257、267、269、270、271、273、280、281、282、288、290、291、299、301、304、306、311、314、315、318、327、328、338、342、346、348、354、366、368、371、375、385、388、391、395、397、402、405、409、422、424、428、429、435、436、440、651、および443‐650に一致するpsidsからなる群から選択されるプローブセットによって認識されるmRNAをコード化する遺伝子から選択される遺伝子によって表される場合に用いることができる。
【0035】
本発明は、乳癌患者の予後診断遺伝子発現プロファイルを単独で検証する方法を包含する。この方法は、統計的に有意な数の患者の生体サンプルから遺伝子発現データを得るステップ(a)と、この遺伝子発現データにおける供給源によるばらつき(source variabilities)を標準化するステップ(b)と、既に選択されている全ての変数に対して目的の因子を計算するステップ(c)と、サンプルに対して予測モデルを試験して分類結果を記録するステップ(d)を含む。
【0036】
この単独の検証法は、ステップ(d)で得た遺伝子発現データが、配列番号3、4、10、18、37、40、42、43、45、55、58、64、67、72‐74、76、81、85‐86、89、97、100‐101、110‐111、125、および132‐442、または2、3、5、12、20、25、36、37、39、40、41、42、43、45、46、51、52、53、54、55、57、58、59、60、61、62、63、64、66、67、69、70、72、73、74、76、80、81、83、84、85、86、87、88、89、90、94、97、98、101、102、104、107、110、111、132、139、142、150、151、153、154、158、161、163、167、170、171、173、175、181、182、183、186、188、190、192、204、206、207、212、215、218、221、223、225、228、231、232、236、238、239、240、241、242、243、246、248、249、255、257、267、269、270、271、273、280、281、282、288、290、291、299、301、304、306、311、314、315、318、327、328、338、342、346、348、354、366、368、371、375、385、388、391、395、397、402、405、409、422、424、428、429、435、436、440、651、および443‐650に一致するmRNA、または表10に示されている配列番号3、4、10、18、37、40、42、43、45、55、58、64、67、72‐74、76、81、85‐86、89、97、100‐101、110‐111、125、および132‐442、または2、3、5、12、20、25、36、37、39、40、41、42、43、45、46、51、52、53、54、55、57、58、59、60、61、62、63、64、66、67、69、70、72、73、74、76、80、81、83、84、85、86、87、88、89、90、94、97、98、101、102、104、107、110、111、132、139、142、150、151、153、154、158、161、163、167、170、171、173、175、181、182、183、186、188、190、192、204、206、207、212、215、218、221、223、225、228、231、232、236、238、239、240、241、242、243、246、248、249、255、257、267、269、270、271、273、280、281、282、288、290、291、299、301、304、306、311、314、315、318、327、328、338、342、346、348、354、366、368、371、375、385、388、391、395、397、402、405、409、422、424、428、429、435、436、440、651、および443‐650に一致するpsidsからなる群から選択されるプローブセットによって認識される:mRNAをコード化する遺伝子から選択される遺伝子によって表される場合に用いることができる。
【0037】
本発明は、乳癌患者の予後診断を可能にする再発ハザードスコアを生成する方法を包含する。この方法は、統計的に有意な数の患者の生体サンプルから遺伝子発現データを得るステップ(a)と、このデータに対してコックスの単変量回帰分析(univariate Cox's regression analysis)を適用して選択遺伝子を得るステップ(b)と、標準コックス係数(standard Cox's coefficients)を用いて選択遺伝子に重み付けした発現レベルを適用して、再発ハザードスコア(Relapse Hazard Score)として適用されうる予測モデルを得るステップを含む。
【0038】
再発ハザードスコアは、以下の式で求めることができる。
【数1】
この式において、
I=1(X遺伝子レベル>10の場合)または0(X遺伝子レベル≦10の場合)、
AおよびBは、定数、
wiは、X遺伝子+マーカーに対する標準化されたコックスの回帰係数、
xiは、ER+マーカーの発現値(log2のスケール)、
wjは、X遺伝子−マーカーに対する標準化されたコックスの回帰係数、
xjは、ER−マーカーの発現値(log2のスケール)、
X遺伝子は、(i)配列番号1‐111に一致する;または(ii)表10に示されている配列番号1‐111に一致するpsidsからなる群から選択されるプローブセットによって認識される:mRNAをコード化する遺伝子からなる群から選択される。
【0039】
本発明は、乳癌予後診断患者レポートを作成する方法を包含する。この方法は、患者から生体サンプルを得るステップ(a)、このサンプルの遺伝子発現を測定するステップ(b)、このステップ(b)の結果に対して再発ハザードスコアを適用するステップ(c)、このステップ(c)で得た結果を用いてレポートを作成して、これにより患者レポートを作成するステップ(d)を含む。このレポートは、患者集団に対するリスクの可能性および/または患者の結果の評価を含みうる。
【0040】
本発明は、配列番号1‐111、または表10に示されている配列番号1‐111に一致するpsids、から選択される少なくとも1つのプローブセットの組成物を包含する。この組成物は、配列番号36‐95、96‐111、または36‐111から選択される少なくとも1つのプローブセットを含むことができる。この組成物は、マクロアレイ分析を行うための試薬と、これらの核酸配列、それらの補完物、またはそれらの一部をアッセイする媒体をさらに含むことができる。
【0041】
本発明は、生体サンプルにおいて乳癌の予後診断を決定するアッセイを行うためのキットを含む。このキットは、配列番号1‐111に一致するmRNA、表10に示されている配列番号1‐111に一致するpsidsから選択されるプローブセットによって認識されるmRNAをコード化する遺伝子から選択される遺伝子の組合せの、単離された核酸配列、それらの補完物、またはそれらの一部を検出するための物質を含む。このキットは、マイクロアレイ分析を行うための試薬と、これらの核酸配列、それらの補完物、またはその一部をアッセイする媒体をさらに含むことができる。
【0042】
本発明は、乳癌の状態を評価するための物品を包含する。この物品は、配列番号1‐111に一致するmRNA、または表10に示されている配列番号1‐111に一致するpsidsから選択されるプローブセットによって認識されるmRNAをコード化する遺伝子から選択される遺伝子の組合せの、単離された核酸配列、それらの補完物、またはそれらの一部を検出するための物質を含む。この物品は、マイクロアレイ分析を行うための試薬と、これらの核酸配列、それらの補完物、またはその一部をアッセイする媒体をさらに含むことができる。
【0043】
ここで用いるマイクロアレイは、配列番号1‐111に一致するmRNA、または表10に示されている配列番号1‐111に一致するpsidsから選択されるプローブセットによって認識されるmRNAをコードする遺伝子から選択される遺伝子の組合せの、単離された核酸配列、それらの補完物、またはその一部を含むことができる。この遺伝子の組合せは、生体サンプルにおける乳癌の状態または再発のリスクを特徴付けるのに十分である。
【0044】
マイクロアレイの測定または特徴付けは、少なくとも1.5倍の過剰発現または1.5倍少ない過少発現であるのが好ましい。マイクロアレイは、良性細胞または正常組織に対して、サンプル中で少なくとも1.5倍の過剰発現または1.5倍少ない過少発現である所定のカットオフレベルを検出できる。この所定のカットオフレベルは、良性細胞または正常組織に対して、転移性細胞を有するサンプルで少なくとも統計的に有意なp値の過剰発現を有するのが好ましい。より好ましくは、p値は0.05未満である。
【0045】
本発明は、診断/予後診断のポートフォリオを包含する。このポートフォリオは、配列番号1‐111に一致するmRNA、または表10に示されている配列番号1‐111に一致するpsidsから選択されるプローブセットによって認識されるmRNAをコード化する遺伝子から選択される遺伝子の組合せの、単離された核酸配列、それらの補完物、またはその一部を含む。この遺伝子の組合せは、生体サンプルにおける乳癌の状態または再発のリスクを特徴付けるのに十分である。このポートフォリオは、良性細胞または正常組織に対して、サンプル中で少なくとも1.5倍の過剰発現または1.5倍少ない過少発現(under-expression)である所定のカットオフレベルを検出できる。この所定のカットオフレベルは、良性細胞または正常組織に対して、転移性細胞を有するサンプルで少なくとも統計的に有意なp値の過剰発現を有するのが好ましい。より好ましくは、p値は0.05未満である。
【0046】
配列番号1‐650を表10に要約した。各配列番号1‐650において、マーカーは、psidまたはアフィメトリックス・ジーン・チップ・デシグネーション(Affymetrix GeneChip Designation)によって識別され、所定の配列番号に一致するあらゆる変位体または対立遺伝子などをコード化する遺伝子を表している。このマーカーは、所定のpsidに一致するプローブによって認識されるmRNAをコード化する遺伝子としても定義される。特定のマーカーを、以下に詳細に説明する。
【0047】
配列番号45のM83は、米国特許出願公開第20020110547号、同第20040009491号、および同第20030236392号、ならびに、PCT国際公開WO0149716号、同WO0170979号、同WO03025138号、同WO03042661号、同WO03016475号、同WO2004063355号、同WO2004047728号、および同WO2004030615号に記載されている。
【0048】
配列番号43のABLIM‐sは、米国特許出願公開第20020131971号、同第20030087818号、同第20030166064号、同第20030236392号、および同第20040005560号、ならびに、PCT国際公開WO0036107号、同WO0159063号、同WO0160860号、同WO0174405号、同WO0177288号、同WO02059271号、同WO0212328号、同WO0224956号、同WO0229086号、同WO03025138号、同WO2004024097号、同WO2004037996号、同WO2004039956号、同WO2004043361号、および同WO2004047728号に記載されている。
【0049】
配列番号54のATAD2は、米国特許出願公開第20020064872号、同第20020085998号、同第20020150581号、同第20020156011号、同第20020192678号、同第20030069180号、同第20030073623号、同第20030104366号、同第20040005560号、同第20040013663号、および同第20040058340号、ならびに、PCT国際公開WO0060076号、同WO0142467号、同WO0155322号、同WO0160860号、同WO0170979号、同WO0179286号、同WO0196388号、同WO02057414号、同WO02059377号、同WO02060317号、同WO02086443号、同WO0231198号、同WO0250279号、同WO03004989号、同WO03025138号、同WO03042661号、同WO03062379号、同WO2004047728号、同WO2004048938号、同WO2004048938号、同WO2004063355号、および同WO9938972号に記載されている。
【0050】
配列番号48のC11ORF9は、米国特許出願公開第20030065157号および同第20030073623号、ならびに、PCT国際公開WO0056880号、同WO0058473号、同WO0159063号、同WO0174405号、同WO02059260号、同WO0229086号、同WO03101283号、同WO2004031413号、および同WO2004060270号に記載されている。
【0051】
配列番号46のC3は、米国特許出願公開第20040005560号および同第20040058340号、ならびに、PCT国際公開WO9101999号、同WO0055350号、同WO0160860号、同WO0175067号、同WO0188088号、同WO0224956号、同WO0294629号、同WO03078572号、同WO2004028479号、同WO2004030615号、同WO2004041170号、および同WO2004060270号に記載されている。
【0052】
配列番号65のCGI‐41は、米国特許出願公開第20030073623号および同第20030096982号、ならびに、PCT国際公開WO9514772号、同WO9940100号、同WO0154472号、同WO0157188号、同WO03046152号、および同WO2004060270号に記載されている。
【0053】
配列番号36に記載のCLN8は、欧州特許第1104808B1号、米国特許出願第20030073623号および同第20040009491号、ならびに、PCT国際公開WO9845437号、同WO9935158号、同WO0142451号、同WO0190304号、同WO02090526号、同WO02095010号、同WO02102993号、同WO02102994号、同WO03004622号、同WO04024892号、および同WO04041170号に記載されている。
【0054】
配列番号60に記載のCNK1は、米国特許出願公開第20040058340号、ならびに、PCT国際公開WO9938972号および同WO2004037996号に記載されている。
【0055】
配列番号57のDUSP4は、米国特許出願公開第20030073623号、同第20030194704号、同第20040058340号、および同第20040110194号、ならびに、PCT国際公開WO0100828号、同WO0204514号、同WO02059377号、同WO02103320号、同WO0224956号、同WO03004989号、同WO2004018641号、同WO2004023973号、同WO2004037996号、同WO2004039956号、同WO2004043361号、同WO2004047728号、同WO2004048938号、および同WO9423039号に記載されている。
【0056】
配列番号62のFEN1は、米国特許第5874283号、米国特許出願公開第20020156011号、同第20030069180号、同第20030073623号、および同第20030194704号、ならびに、PCT国際公開WO0196388号、同WO03016475号、同WO03016500号、同WO03072035号、同WO03101283号、同WO2004022059号、同WO2004030615号、同WO2004039956号、同WO2004043361号、同WO2004047728号、同WO2004048938号、同WO2004060270号、および同WO2004079014号に記載されている。
【0057】
配列番号63のFKBP2は、米国特許出願公開第20030073623号、ならびに、PCT国際公開WO02059377号、同WO02070737号、同WO02081731号、同WO02083898号、同WO0224956号、同WO03016475号、同WO03054152号、同WO2004039956号、同WO2004043361号、および同WO9219745号に記載されている。
【0058】
配列番号37のGP73は、米国特許出願公開第20030022239号、同第20030073623号、同第20030236392号、同第20040009478号、同第20040034196号、および同第20040058340号、ならびに、PCT国際公開WO0012708号、同WO0061610号、同WO0078961号、同WO0140466号、同WO0160860号、同WO0177168号、同WO0194629号、同WO02059260号、同WO02083876号、同WO0224956号、同WO03004989号、同WO2004024892号、同WO2004031414号、および同WO2004053081号に記載されている。
【0059】
配列番号61のH4FHは、米国特許出願公開第20020151681号、ならびに、PCT国際公開WO0055174号、同WO0175067号、同WO0224956号、同WO03016476号、および同WO2004039943号に記載されている。
【0060】
配列番号39のIL‐18は、米国特許第6060283号、米国特許出願公開第20040115636号、ならびに、PCT国際公開WO0194629号、同WO02057414号、同WO0224956号、同WO0229086号、同WO03025138号、同WO03042661号、および同WO9724441号に記載されている。
【0061】
配列番号56のKIAA0748は、PCT国際公開WO0021991号、同WO02094988号、および同WO2004003162号に記載されている。
【0062】
配列番号64のKPNA2は、米国特許出願公開第20020151681号、同第20020156011号、同第20030069180号、および同第20040058340号、ならびに、PCT国際公開WO9712967号、同WO9964576号、同WO0055174号、同WO0146697号、同WO0170979号、同WO0196388号、同WO02057414号、同WO02059377号、同WO02086443号、同WO02102235号、同WO0224956号、同WO03010336号、同WO03025138号、同WO03027285号、同WO03042661号、同WO2004024097号、同WO2004024892号、同WO2004028479号、同WO2004037996号、同WO2004039956号、同WO2004043361号、同WO2004047728号、および同WO2004063355号に記載されている。
【0063】
配列番号66のMGC11335は、米国特許出願公開第20030073623号、同第20030219744号、および同第20030236392号、ならびに、PCT国際公開WO0144448号、同WO0153312号、同WO0157182号、同WO0188088号、同WO2004030615号に記載されている。
【0064】
配列番号52のOR12D2は、PCT国際公開WO0127158号、同WO02068652号、同WO02081498号、同WO02081517号、同WO030000735号、および同WO03091388号に記載されている。
【0065】
配列番号53のORC3は、米国特許出願公開第20040013663号、ならびに、PCT国際公開WO9810067号、同WO9958642号、同WO0060078号、同WO0175067号、同WO02059377号、同WO02070737号、同WO02102235号、および同WO03042661号に記載されている。
【0066】
配列番号59のPLK1は、ドイツ特許第4329177号、米国特許出願公開第20020081659号、同第20020151681号、ならびに、PCT国際公開WO0055174号、同WO0055320号、同WO02070737号、同WO02086443号、同WO0224956号、同WO03003906号、同WO03016476号、同WO03018807号、同WO03025138号、同WO03042661号、同WO2004030615号、同WO2004037996号、同WO2004042022号、同WO2004047728号、同WO2004048938号、同WO2004063355号、および同WO2004070062号に記載されている。
【0067】
配列番号42のPPP1CCは、米国特許出願公開第20030073623号、同第20040013663号、ならびに、PCT国際公開WO03016476号、同WO0063438号、同WO0170979号、同WO0202623号、同WO02036766号、同WO02074237号、同WO0228999号、同WO03016475号、および同WO2004030615号に記載されている。
【0068】
配列番号55のSMC4は、米国特許出願公開第20020123619号、同第20020168637号、および同第20040058340号、ならびに、PCT国際公開WO9938972号、同WO9964576号、同WO0175067号、同WO0190154号、同WO0204514号、同WO02059377号、同WO02074237号、同WO02086443号、同WO02102235号、同WO03003906号、同WO03016475号、同WO03025138号、同WO03042661号、同WO2003094848号、同WO2004024892号、同WO2004047728号、同WO2004048938号、同WO2004063355号、および同WO2004074301号に記載されている。
【0069】
配列番号44のTRDL‐1は、米国特許第6171787号および同第6440694号、米国特許出願公開第20020055474号、同第20020072089号、同第20020081659号、同第20030065157号、同第20030073623号、および同第20030219767号、ならびに、PCT国際公開WO9733902号、同WO9912965号、同WO9926976号、同WO9928462号、同WO9933980号、同WO9935170号、同WO9950416号、同WO9954460号、同WO0026244号、同WO0032776号、同WO0055320号、同WO0125256号、同WO0177291号、同WO2004020593号、同WO2004024892号、同WO2004033637号、および同WO04037996号に記載されている。
【0070】
配列番号38のYiflpは、米国特許出願公開第20020131971号、同第20030166064号、および同第20040037842号、ならびに、PCT国際公開WO9933981号、同WO9947540号、同WO0173027号、同WO02060317号、同WO02070737号、同WO02076488号、同WO02095010号、同WO0224956号、同WO03004622号、同WO03038063号、同WO03042661号、同WO03054152号、同WO03064589号、同WO2004024892号、同WO2004037996号、同WO2004047728号、および同WO2004048938号に記載されている。
【0071】
アフィメトリックス・ヒューマンU133a・ジーンチップ(Affymetrix Human U133a GeneChip)を利用し、補助的全身療法を受けなかった286人のリンパ節陰性(LNN)乳癌患者から得た凍結腫瘍サンプルの全RNAを用いて22,000の転写物の発現を分析した。ゲノムワイドの遺伝子発現の測定により、腫瘍をサブクラスに分類でき、かつリンパ節陰性乳癌患者の個々人のリスク評価をする改善された手段をもたらす遺伝子活性のパターンを識別できることが分かった。
【0072】
115の腫瘍のトレーニングセットにおいて、ER陽性患者の60の遺伝子とER陰性患者の16の遺伝子で構成される76‐遺伝子シグネチャ(76-gene signature)を同定した。このシグネチャは、続く171人のLNN患者の個々の試験セットにおいて、93%の感受性および48%の特異性を示した。遺伝子プロファイルは、5年以内に遠隔転移が起きた患者(ハザード率(HR):5.67、95%の信頼区間(CI):2.59〜12.4)を特定する際に、たとえ多変量分析における従来の予後診断因子を修正した場合(HR:5.55、CI:2.46〜12.5)でも、非常に有益である。76‐遺伝子プロファイルはまた、84人の閉経前患者(HR:9.60、p=1.6×10-4)、87人の閉経後患者(HR:4.04、p=1.7×10-3)、および10mm〜20mmの大きさの腫瘍を有する79人の患者(HR:14.1、p=2.3×10-6)のサブグループ、および疾患の予後診断が特に困難な患者のグループにおいて、転移発生についての強力な予後診断因子を表した。
【0073】
この実験で、全ての年齢および全ての大きさの腫瘍のグループの286人のLNN乳癌患者からの原発腫瘍の分析結果を得た。患者は、補助的全身療法を受けていないため、第1の多重遺伝子の予後診断の評価が、全身治療に関連した予測因子による寄与を混乱させる恐れがなく、個別の試験セットによって適切に確認され、腫瘍の大きさおよび年齢に制限されない。上記したアルゴリズムに基づいた遺伝子発現は、LNN患者において、遠隔での再発の可能性を高い信頼性で予測することができる。
【0074】
組織サンプルにおける特定の核酸配列の単なる存在の有無は、診断または予後診断の値を得るために極まれに検出されるだけである。他方、様々なタンパク質、ペプチド、またはmRNAの発現についての情報は、ますます重要とみなされるようになってきた。そのゲノム内で単独でタンパク質、ペプチド、またはmRNA(遺伝子と呼ばれるような配列)を発現する可能性のある核酸配列の単なる存在は、所定の細胞内でタンパク質、ペプチド、またはmRNAが発現するか否かを決定するものではない。タンパク質、ペプチド、またはmRNAを発現できる所定の遺伝子がこれらを発現するか否か、および発現する場合にこのような発現が起こる程度は、様々な複合因子によって決まる。このような因子の理解および評価における困難さに関係なく、遺伝子発現のアッセイは、腫瘍発生、転移、アポトーシス、および他の臨床的に関連する現象などの重要な事象の発生について有用な情報を提供する。どの程度遺伝子が活性または不活性であるかの相対指標は、遺伝子発現プロファイルで確認できる。本発明の遺伝子発現プロファイルを用いて予後診断を行って、乳癌患者を治療することができる。
【0075】
サンプルの用意では、患者サンプルを収集する必要がある。本発明の方法に用いる患者サンプルは、乳房サンプルの原発腫瘍から採取した上皮細胞などの病変細胞を含むと思われる患者サンプルである。また、サージカルマージンから得たサンプルも好ましい。しかしながら、最も好ましいのは、乳癌の外科手術で得たリンパ節から採取したサンプルである。レーザー・キャプチャー・マイクロダイセクション(LCM:Laser Capture Microdissection)技術は、試験する細胞を選択する1つの方法であり、細胞の種類の不均一性によって起こるばらつきを最小限にする。この結果、正常な細胞と癌性細胞との間の遺伝子発現の緩やかな変化または小さな変化を容易に検出することができる。サンプルには、抹消血から抽出した循環上皮細胞も含むことができる。このようなサンプルは、様々な方法によって得ることができるが、最も好ましい方法は、米国特許第6,136,182号に開示されている磁気分離技術である。目的の細胞を含むサンプルが得られたら、RNAを抽出し、そのRNAを増幅し、適当なポートフォリオの遺伝子について、好ましくはマイクロアレイによって遺伝子発現プロファイルを作成する。
【0076】
遺伝子発現プロファイルを作成する好適な方法では、タンパク質またはペプチドをコード化できる遺伝子によって産生されたRNAの量を決定するステップを含む。これは、逆転写PCR(RT‐PCR)、競合RT‐PCR、リアルタイムRT‐PCR、ディファレンシャルディスプレイRT‐PCR、ノーザンブロット分析、および他の関連した検査によって行うことができる。別個のPCR反応を用いてこれらの技術を行うことができるが、mRNAから産生された相補的DNA(cDNA)または相補的RNA(cRNA)を増幅し、これをマイクロアレイで分析するのが最も良い。様々な異なるアレイ構造およびその製造方法は、当業者に周知であり、米国特許第5,445,934号、同第5,532,128号、同第5,556,752号、同第5,242,974号、同第5,384,261号、同第5,405,783号、同第5,412,087号、同第5,424,186号、同第5,429,807号、同第5,436,327号、同第5,472,672号、同第5,527,681号、同第5,529,756号、同第5,545,531号、同第5,554,501号、同第5,561,071号、同第5,571,639号、同第5,593,839号、同第5,599,695号、同第5,624,711号、同第5,658,734号、および同第5,700,637号に記載されている。
【0077】
マイクロアレイ技術により、数千の遺伝子の安定状態のmRNAレベルを同時に測定して、これにより、制御されていない細胞増殖の開始、停止、または調節などの影響を特定するための強力なツールを提供することができる。現在、2つのマイクロアレイ技術が広く用いられている。第1の技術は、cDNAアレイであり、第2の技術は、オリゴヌクレオチドアレイである。これらのチップの構造において相違が存在するが、実質的に全てのダウンストリームデータ解析および出力は同じである。このような解析の産物は、通常は、マイクロアレイ上の既知の位置で、ある核酸配列にハイブリダイズするサンプル中のcDNA配列を検出するために用いる標識プローブから受け取る信号の強度の測定である。通常は、信号の強度は、サンプルの細胞中で発現されるcDNA、従ってmRNAの量に比例する。このような様々な技術は、利用することができ、かつ有用である。遺伝子発現を決定するための好適な方法は、米国特許第6,271,002号、同第6,218,122号、同第6,218,114号、および同第6,004,755号に記載されている。
【0078】
発現レベルの解析は、信号強度の比較によって行う。これは、試験サンプル中の遺伝子の発現強度の、コントロールサンプル中の発現強度に対する比率マトリックス(ratio matrix)を作成して行うのが最も良い。例えば、病変細胞の遺伝子発現強度を、同じ種類の正常な組織から得た発現強度と比較することができる(例えば、病変乳房組織サンプル 対 正常な乳房組織サンプル)。これらの発現強度の比率は、試験サンプルとコントロールサンプルとの間の遺伝子発現における倍数変化を示している。
【0079】
また、遺伝子発現プロファイルは、様々な方法で表示することができる。最も一般的な方法では、未加工の蛍光強度または比率マトリックスを、列が試験サンプルで行が遺伝子を示すグラフィカル・デンドグラム(graphical dendogram)に配列させる。データは、類似の発現プロファイルを有する遺伝子が互いに近接するように配列する。各遺伝子の発現率は、カラーで表示する。例えば、1未満の比率(ダウンレギュレーションを示す)は、スペクトルの青の部分で表し、1より大きい比率(アップレギュレーションを示す)は、スペクトルの赤の部分で表す。市販のコンピュータソフトウエアプログラムを利用して、アジレント・テクノロジーズ社(Agilent Technologies)のGeneSpring、およびPartek(登録商標)のPartek Discover(商標)およびPartek Infer(商標)ソフトウエアを含め、このようなデータを表示することができる。
【0080】
本発明の方法に用いる変調遺伝子(modulated genes)は、以下の例の部分で説明する。異なって発現する遺伝子は、乳癌が再発していない患者に比べて、乳癌が再発した患者でアップレギュレートまたはダウンレギュレートされている。アップレギュレーションおよびダウンレギュレーションは、検出可能な差異(これを測定するために用いるシステムにおけるノイズ部分を超えた)が、ある種のベースラインに対して遺伝子の発現量で見られることを指す相対語である。この場合、このベースラインは、非再発患者の測定された遺伝子発現である。次に、同じ測定方法を用いて、病変細胞(再発患者の)における目的の遺伝子が、ベースラインレベルに対してアップレギュレートまたはダウンレギュレートされる。この文脈における病変は、細胞の無制限増殖で起こる体の機能の適切な能力を妨げるまたは妨害する、或いは妨害する可能性のある体の状態の変化を指す。ある人の遺伝子型または表現型のある点が疾患の存在と一致する場合、その人は疾患であると診断される。しかしながら、診断または予後診断を行う行為には、再発の可能性の決定などの疾患/病態の問題の決定や治療のモニタリングが含まれる。治療のモニタリングでは、遺伝子の発現を時間経過と共に比較して、遺伝子発現プロファイルが正常な組織に、より一致するパターンに変化したか、または変化しつつあるかを決定して、所定の治療のコースの影響について臨床的に判断する。
【0081】
アップレギュレーションおよびダウンレギュレーションのレベルは、ハイブリダイズしたマイクロアレイのプローブの強度測定の倍数変化に基づいて区別するのが好ましい。2.0倍の差は、このような区別に好ましい(または、p値が0.05未満)。すなわち、ある遺伝子が、正常/非再発細胞に対して病変/再発細胞で異なって発現すると考えられる前に、病変細胞が、正常な細胞よりも少なくとも2倍の強度または2倍少ない強度を生成することが分かった。倍数の差が大きければ大きいほど、遺伝子は、診断または予後診断のツールとして使用するのが好ましい。本発明の遺伝子発現プロファイルのために選択する遺伝子は、臨床用実験器具を用いたバックグランドを超える量によって正常すなわち非変調遺伝子(no-modulated genes)が生成する信号と区別できる信号を生成する発現レベルを有する。
【0082】
統計値を用いて、非変調遺伝子およびノイズと変調遺伝子を明確に区別することができる。統計的検定により、多様なサンプルのグループ間で最も著しく異なっている遺伝子を見出した。スチューデントのT検定は、2つのグループ間の著しい差を見出すために用いることができる統計的ロバスト検定の一例である。p値が小さければ小さいほど、遺伝子が異なるグループ間で差を示している有力な証拠となる。それにもかかわらず、マイクロアレイが、一度に2つ以上の遺伝子を測定できるため、何万もの統計的検定を一度に実施することができる。このため、偶然に小さいp値を目にする可能性が低く、シダックの補正(Sidak correction)およびランダム化/順列実験を用いて、この調整を行うことができる。スチューデントのT検定による0.05未満のp値は、遺伝子が著しく異なるという証拠である。より有力な証拠は、シダックの補正を行った後の0.05未満のp値である。各グループに多数のサンプルがある場合、ランダム化/順列検定の後の0.05未満のp値は、著しい差の最も有力な証拠である。
【0083】
非変調遺伝子またはノイズの信号よりも大きい信号を生成する遺伝子を選択するために用いることができる別のパラメータは、絶対信号の差の測定値の使用である。変調遺伝子発現によって生成される信号は、正常すなわち非変調遺伝子発現によって生成される信号とは少なくとも20%異なるのが好ましい(絶対ベース)。このような遺伝子は、正常すなわち非変調遺伝子の発現パターンとは少なくとも30%異なる発現パターンを生成するのがさらに好ましい。
【0084】
グループ中の遺伝子セットについて得た情報が、診断、予後診断、または治療の選択などの臨床的に適切な判断を行うための信頼できる基準を提供するように、遺伝子をグループに分けることができる。このような遺伝子セットは、本発明のポートフォリオを構成する。この場合、このポートフォリオによってサポートされる判断には、乳癌およびその再発の可能性が含まれる。大部分の診断的マーカーと同様に、正確な医療判断を十分に行うことができる最少数のマーカーを用いるのが望ましい。こうすることにより、別の分析を遅延させる治療の遅れや、時間と資源の無駄使いを防止することができる。
【0085】
ポートフォリオ中の遺伝子の組合せが、個々の遺伝子またはランダムに選択された遺伝子の組合せに対して改善された感受性および特性を示すように、ポートフォリオを作成するのが好ましい。本発明との関連で、ポートフォリオの感受性は、正常な状態に対して病変状態で起こる遺伝子発現によって示される倍数差に反映されうる。特異性は、目的の状態と遺伝子発現の信号伝達との相関関係の統計的測定値に反映されうる。例えば、標準偏差を、このような測定値として用いることができる。ある遺伝子のグループをポートフォリオに入れるかの考慮では、発現の測定値における小さい標準偏差が、より大きな特異性に相関する。相関係数などの他のばらつきの測定値も用いることができる。
【0086】
遺伝子発現ポートフォリオを作成するある方法では、株のポートフォリオの作成に広く用いられている平均分散アルゴリズムなどの最適化アルゴリズムを用いている。この方法は、米国特許出願公開第20030194734号に詳細が記載されている。本質的に、この方法では、この方法の使用者が受け取るリターン(例えば、生成される信号)のばらつきを最小限にすると共に、リターンを最適化するインプット(金融用途では株、ここでは、強度によって測定される発現)のセットを作成する必要がある。このような操作を行う場合、多くの市販のソフトウエアプログラムを利用することができる。本明細書では「ワグナー・ソフトウエア(Wagner Software)」と呼ばれる「ワグナー・アソシエイツ・平均分散最適化アプリケーション(Wagner Associates Mean-Variance Optimization Application)」が好ましい。このソフトウエアは、「ワグナー・アソシエイツ・平均分散最適化ライブラリー(Wagner Associates Mean-Variance Optimization Library)」の機能を用いて、マーコウイッツ・センス(Markowitz sense)における効率的なフロンティアおよび最適なポートフォリオを決定するのが好ましい。このタイプのソフトウエアを使用する際は、このソフトウエアが対象とする金融分析目的に使用される場合に株のリターンおよびリスクの測定が使用される要領で、マイクロアレイデータがインプットとして扱うことができるようにこのマイクロアレイデータを変換する必要がある。
【0087】
ポートフォリオを選択するプロセスは、発見的ルールの適用を含むこともできる。このようなルールは、臨床結果を得るために用いる技術の理解および生物学に基づいて構築されるのが好ましい。発見的ルールは、最適化法からのアウトプットに用いるのがさらに好ましい。例えば、ポートフォリオ選択の平均分散法は、乳癌患者で異なって発現した多数の遺伝子について、マイクロアレイデータに利用することができる。最適化法からのアウトプットは、末梢血および病変組織で発現するある種の遺伝子を含みうる最適化された遺伝子セットとすることができる。この試験方法に用いられるサンプルを末梢血から採取し、乳癌の場合に異なって発現するある種の遺伝子が、末梢血で異なって発現する場合、発見的ルールを用いることができ、ポートフォリオが、末梢血で異なって発現する遺伝子を除く効率的なフロンティアから選択される。もちろん、このルールは、例えばこのルールをデータの事前選択の際に利用して効率的なフロンティアの形成前に利用することもできる。
【0088】
当生物学に必ずしも関連しなくてもよい他の発見的ルールを用いることもできる。例えば、ポートフォリオの所定パーセントのみを特定の遺伝子または遺伝子のグループによって表すことができるルールを適用することもできる。ワグナー・ソフトウエア(Wagner Software)などの市販のソフトウエアは、これらのタイプの発見的ルールに対応している。これは、例えば、1または複数の遺伝子を含むことのディザイラビリティに、正確さや精度以外の因子(例えば、予想ライセンス料)が影響を与える場合に有用であろう。
【0089】
本発明の1つの方法では、様々な遺伝子について遺伝子発現プロファイル(またはポートフォリオ)を比較して予後診断を作成するステップを含む。ポートフォリオを含む各遺伝子の遺伝子発現プロファイルは、コンピュータ可読メディアなどのメディアに保存される。これは、様々な形態で行うことができる。例えば、疾患を示す信号(例えば、強度測定値)の範囲を入力する表を作成することができる。次に、実際の患者のデータをこの表の値と比較して、患者のサンプルが正常か、または病的であるかを決定することができる。より高度な実施形態では、発現信号(例えば、蛍光強度)のパターンをデジタル処理でまたはグラフに記録する。
【0090】
次に、患者のサンプルと共に使用する遺伝子ポートフォリオからの遺伝子発現パターンを、この遺伝子発現パターンと比較する。次に、パターン比較ソフトウエアを用いて、患者のサンプルが疾患の再発を示すパターンを有しているか否かを決定することができる。もちろん、このような比較を用いて、患者が疾患を再発しそうにないか否かを決定することもできる。次に、サンプルの発現プロファイルを、対照細胞のポートフォリオと比較する。サンプルの発現パターンが乳癌の再発の発現パターンに一致している場合は(対抗する医療上の問題が存在しない)、再発患者を治療するように患者を治療する。サンプルの発現パターンが、正常/コントロール細胞からの発現パターンと一致している場合は、患者は、乳癌に対して陰性と診断される。
【0091】
本発明の好適なポートフォリオは、配列番号1〜35の遺伝子でできた35‐遺伝子ポートフォリオ、ER陽性患者を予見するのに最もよく使用される配列番号36〜95の遺伝子でできた60‐遺伝子ポートフォリオ、およびER陰性患者を予見するのに最もよく使用される配列番号96〜111の遺伝子でできた16‐遺伝子ポートフォリオである。配列番号36〜111の遺伝子でできたポートフォリオが最も好ましい。この最も好適なポートフォリオは、ERの状態にかかわらず、再発リスクの高い乳癌患者を、そうではない患者と区別するのに最適である。再発リスクの高い乳癌患者を特定したら、これらの患者に補助的療法を施すことができる。
【0092】
本発明では、患者の遺伝子発現パターンを分析して乳癌患者の予後診断を決定するための最も好ましい方法は、コックスのハザード分析プログラム(Cox's hazards analysis program)を用いる。最も好ましくは、この分析は、S‐Plusソフトウエア(インサイトフル・コーポレーション(Insightful Corporation)が販売)を用いて行う。このような方法を用いて、遺伝子発現プロファイルを、確実に再発を表すプロファイル(すなわち、プロファイル中の遺伝子の組合せの発現レベルが再発を示している)と比較する。閾値が設定されたコックスのハザードモデル(Cox's hazards model)を用いて、2つのプロファイル(既知の再発 対 患者)の類似性を比較し、患者のプロファイルが閾値を超えているか否かを決定する。患者のプロファイルが閾値を超えている場合は、その患者を再発するであろう患者に分類し、補助的療法などの治療を受けさせる。患者のプロファイルが閾値を超えていない場合は、その患者を非再発患者に分類する。線形識別分析、ロジスティック回帰、およびニューラルネットワークアプローチなどの他の分析ツールを用いて、同じ質問に答えることができる。
【0093】
様々な既知のパターン認識法を利用することができる。以下に示す文献に例が記載されている。
・「加重投票(Weighted Voting)」、ゴルブ(Golub)ら著(1999年)
・「サポートベクターマシン(Support Vector Machines)」、スウ(Su)ら著(2001年)、ラマズワミー(Ramaswamy)ら著(2001年)
・「Kに最隣接(K-nearest Neighbors)」、ラマズワミー(Ramaswamy)ら著(2001年)
・「相関係数(Correlation Coefficients)」、バン・ビール(van't Veer)ら著(2002年)
【0094】
本発明の遺伝子発現プロファイルは、癌の診断、予後診断、または治療のモニタリングに有用な他の非遺伝子診断法と共に用いることができる。例えば、場合によっては、上記した遺伝子発現に基づいた方法の診断力を、血清タンパク質マーカーなどの従来のマーカー(例えば、キャンサー・アンチゲン27.29(Cancer Antigen 27.29)(「CA 27.29」))のデータと組み合わせると有利である。CA 27.29のような分析物を含むこのようなマーカーの範囲が存在する。このような1つの方法では、血液を、治療を受けた患者から定期的に採取し、上記した血清マーカーの1つを用いてエンザイムイムノアッセイを行う。マーカーの濃度が、腫瘍の再発または治療の失敗を示唆する場合、遺伝子発現分析を行うことができるサンプル源を採取する。疑わしい腫瘤(mass)が存在する場合、細針吸引(FNA)を行って、腫瘤から採取した細胞の遺伝子発現プロファイルを上記したように分析する。別法では、組織サンプルを、腫瘍を以前に除去した組織に近接した部分から採取することができる。この方法は、他の試験方法の結果が曖昧な場合に特に有用であろう。
【0095】
本発明の物品には、治療、診断、予見、および他の疾患の評価に有用な遺伝子発現プロファイルの表現が含まれる。このようなプロファイルの表現は、装置によって自動的に読み取ることができるコンピュータ可読メディア(磁気的に、光学的に、など)などのメディアに圧縮することができる。この物品は、このようなメディアに圧縮された遺伝子発現プロファイルを評価するための取扱説明書も含むことができる。例えば、この物品は、上記した遺伝子のポートフォリオの遺伝子発現プロファイルを比較するためのコンピュータ取扱説明書を有するCD ROMを含むことができる。この物品はまた、患者のサンプルの遺伝子発現データと比較できるように、内部にデジタル記録された遺伝子発現プロファイルも含むことができる。別法では、このようなプロファイルは、異なる表現形態に記録することができる。このような形態の1つにグラフ記録がある。上記したPartek(登録商標)のPartek Discover(商標)およびPartek Infer(商標)ソフトウエアに含まれているようなクラスター化アルゴリズムが、このようなデータの視覚化に最も役立つであろう。
【0096】
本発明に従って製造される異なるタイプの物品は、遺伝子発現プロファイルを明らかにするために用いるメディアまたは定様式アッセイ(formatted assays)である。これらの物品は、例えば、相補的な配列またはプローブをマトリックスに結合するマイクロアレイを含むことができる。このマトリックスに、目的の遺伝子を示唆する配列が結合して、その存在を読み取ることのできる決定因子を作り出す。別法では、本発明に従った物品は、ハイブリダイゼーションを行うため、増幅を行うため、、および乳癌検出のために目的の遺伝子の発現レベルを示す信号の生成を行うため、の試薬キットにすることができる。
【0097】
本発明に従って作られたキットは、遺伝子発現プロファイルを決定するための定様式アッセイを含む。このようなキットは、アッセイを行うために必要な試薬や取扱説明書などの全てまたは一部の構成要素を含むことができる。
【0098】
限定目的ではない以下に示す例によって、本発明をさらに例示する。本明細書に言及する全ての文献は、参照することを以って本明細書の一部とする。
【0099】
例
本発明に従って分析された遺伝子は、通常は、タンパク質またはペプチドの産生をコードする完全長の核酸配列に関連する。当業者であれば、完全長の配列の同定が、解析の観点から必ずしも必要でないことを理解できよう。すなわち、配列の一部すなわちESTは、対応する遺伝子の遺伝子発現を評価するようにプローブをデザインできる既知の原理に従って選択することができる。
【0100】
例1
サンプルの取扱およびマイクロアレイ作業
1980年〜1995年の間に治療を受け、全身ネオアジュバント療法を受けていないLNN患者から得た凍結腫瘍検体を、エラスムス・メディカル・センター(Erasmus Medical Center)(オランダのロッテルダムに所在)にある腫瘍バンクから選択した。全ての腫瘍サンプルは、ステロイドホルモン受容体測定のために25の地域の病院から関連研究所に送られた。主な治療のガイドラインは、全ての病院で類似している。偏らないように腫瘍を選択した。品質管理の理由から、5年で25%〜30%、腫瘍が実質的に減少すると仮定して、436の浸潤性腫瘍サンプルを処理した。不良な臨床結果、中程度の臨床結果、および良好な臨床結果の患者が含まれている。サンプルは、不十分な腫瘍量(53)、RNAの品質不良(77)、またはチップの品質不良(20)に基づいて除かれ、さらなる分析に用いることができる286のサンプルが残った。
【0101】
実験プロトコルは、施設内医療倫理委員会(institutional medical ethics committee)(MEC番号02.953)によって承認された。外科手術時の患者(乳房温存外科手術:219人、非定型的乳房切除術:67人)の平均年齢は52歳だった(26歳〜83歳の範囲)。施設内プロトコルに従って、248人(87%)の患者に放射線療法を行った。乳房温存療法および放射線療法を受けた患者の比率は、LNN患者にとって標準的である。この実験は、特定のタイプの外科手術または補助的放射線療法の潜在効果を試験することが目的ではないため、放射線療法を受けた、受けないにかかわらず患者を含めた。さらに、実験により、放射線療法が遠隔の再発に対して明確な効果がないことが示された。初期乳癌被験者(Early Breast Cancer Trialists)(1995年)。リンパ節陰性は、地域の病理学者によって病理検査に基づいている。フォーケンス(Foekens)ら(1989年)。
【0102】
含める前に、286全ての腫瘍サンプルに対して、十分な腫瘍(>70%)、およびH&Eで着色した5μmの凍結切片における腫瘍の均一な関与を有するかを確認した。ER(およびPgR)レベルを、リガンド結合アッセイまたはエンザイムイムノアッセイ(EIA)(フォーケンス(Foekens)ら(1989年))によって、または免疫組織化学によって測定した(9の腫瘍で)。ERおよびPRについて患者を陽性または陰性に分類するために用いるカットオフ値は、10fmol/mgタンパク質または10%陽性腫瘍細胞とした。術後のフォローアップには、最初の2年間の3ヵ月毎の検査、3年〜5年目の6ヶ月毎の検査、5年目以降の12ヶ月毎の検査が含まれる。転移の診断の日付は、患者によって症状が報告された後の転移を確認した日、臨床サインを検出した日、または通常のフォローアップの日と定義した。生存患者(n=198)の平均フォローアップ期間は、101ヶ月だった(20ヶ月から171ヶ月の範囲)。この286人の患者には、5年以内の遠隔転移の証拠を示す93人(33%)が含まれ、この93人は、無遠隔転移生存者(DMFS)の分析で失敗としてカウントした。5人(2%)の患者は、疾患の証拠がなく死亡し、最後のフォローアップで検閲された。83人(29%)の患者は、以前の再発の後に死亡した。したがって、全生存者(OS)の分析で、合計で88人(31%)の患者が失敗だった。
【0103】
例2
例1で得たデータの遺伝子発現解析
全RNAを、RNAzol B(カンプロ・サイエンティフィック社(Campro Scientific)、オランダのフェーネンダール(Veenendaal, Netherlands)に所在)を用いて、30μmの厚みの20〜40のクリオスタット切片(50〜100mg)から単離した。ビオチン標識ターゲットを、公開されている方法(アフィメトリックス(Affymetrix)社、カリフォルニア州、リプシュッツ(Lipshutz)ら(1999年))を用いて用意し、アフィメトリックス・オリゴヌクレオチド・マイクロアレイU133a・ジーンチップ(Affymetrix oligonucleotide microarray U133a GeneChip)にハイブリダイズさせた。標準アフィメトリックス・プロトコルを用いてアレイをスキャンした。各プローブセットを、別個の遺伝子として扱った。発現値を、アフィメトリックス・ジーンチップ解析ソフトウエアMAS5.0(Affymetrix GeneChip analysis software MAS 5.0)を用いて求めた。平均強度が40未満の場合、またはバックグランド信号が100超の場合は、チップを取り除いた。チップの信号を標準化するために、プローブセットを目標強度である600に合わせ、スケールマスクファイルを選択しなかった。
【0104】
例3
例2で同定した遺伝子の統計解析
遺伝子発現データをフィルタリングして、2つ以上のサンプルで「存在する」と言われる遺伝子を含めた。17,819の遺伝子がこのフィルタを通過し、これらを階層クラスター化に用いた。クラスター化する前に、各遺伝子の発現レベルを、患者の平均発現レベルで除した。この標準化ステップは、遺伝子の発現の大きさの影響を制限し、これらの遺伝子をクラスター化分析において類似の発現パターンと同じグループに分類した。患者のサブグループを同定するために、これらの遺伝子とサンプルの両方について、ジーン・スプリング6.0(GeneSpring 6.0)を用いて平均関連階層クラスター化を行った。
【0105】
遠隔転移を発症した患者と5年間に亘って転移のない患者を区別する遺伝子を同定するために、2つの監視クラス予測法を用いた。第1の方法では、286人の患者を、80人の患者のトレーニングセットおよび206人の患者の試験セットにそれぞれランダムに割り当てた。トレーニングセットと試験セットのランダムな選択によって著しい差および偏りが生じないように、これらの2つのセットに対するカプラン‐マイヤー生存曲線(Kaplan-Meier survival curves)(カプラン(Kaplan)ら(1958年))を調べた。第2の方法では、患者を、ERの状態によって階層化される2つのサブグループの一方に割り当てた(図1)。
【0106】
各患者のサブグループは、マーカーを選択するために別々に分析した。ER陽性サブグループの患者は、80人の患者のトレーニングセットと、129人の患者の試験セットにそれぞれランダムに割り当てた。ER陰性サブグループの患者は、35人の患者のトレーニングセットと、42人の患者の試験セットにそれぞれランダムに分けた。各サブグループのトレーニングセットから選択したマーカーを組み合わせて1つのシグネチャを形成し、続く単独の検証でER陽性患者およびER陰性患者の両方について腫瘍の転移を予測した。
【0107】
統計的に信頼できるレベルとなるように、トレーニングセットのサンプルの大きさを再サンプリング法で決定した。簡単に述べると、トレーニングセットの患者の数を15人で開始し、5つのステップで増大させた。所定の大きさのサンプルの場合、ランダムに選択された10人の患者のトレーニングセットを作成した。遺伝子シグネチャを、各トレーニングセットから作成し、5年以内の遠隔転移を定義点とした受信者動作特性(ROC)曲線の分析によって、特定の患者の試験セットで試験した。所定の大きさのサンプルに対するこの曲線の下側の領域(AUC)の平均および変動係数(CV)を算出した。トレーニングセットに必要な最少数の患者を、平均AUCが水平域に達して10のAUCのCVが5%よりも低い点で選択した。
【0108】
遺伝子は、以下のように選択した。まず、コックスの単変量比例ハザード回帰(univariate Cox's proportional hazards regression)を用いて、発現(log2のスケール)がDMFSの長さに相関する遺伝子を同定した。複数の試験の影響を軽減し、そして選択した遺伝子の強さを試験するために、コックスのモデル(Cox's model)を、トレーニングセットの患者のブートストラッピングで作成した。エフロン(Efron)ら(1981年)。簡単に述べると、それぞれが復元ランダム抽出された80人の患者を有するように、トレーニングセットの400のブートストラップサンプルを作成した。コックスのモデルを、各ブートストラップサンプルに対して実行した。p値の上位5%と下位5%を除き、残りのブートストラップのp値の逆数を平均して、各遺伝子についてのブートストラップスコアを作成した。このスコアを用いて、遺伝子をランク分けした。複数の遺伝子シグネチャを作成するために、遺伝子マーカーの組合せを、ランク順に従って1回に1つの遺伝子を追加して調べた。定義点として5年以内の遠隔転移を用いるROC解析を実施して、最大AUC値に達するまで遺伝子の数を増大させて各シグネチャに対してAUCの下側の領域を求めた。
【0109】
再発スコア(RS)を用いて、各患者の遠隔転移のリスクを算出した。このスコアを、標準化されたコックスの回帰係数を重みとして重み付けされた発現信号の線形の組合せとして定義した。
【数2】
この式において、
I=1(ERレベル>10fmol/mgタンパク質の場合)または0(ERレベル≦10fmol/mgタンパク質の場合)、
AおよびBは、定数、
wiは、ER+マーカーの標準化されたコックスの回帰係数、
xiは、ER+マーカーの発現値(log2のスケール)、
wjは、ER−マーカーの標準化されたコックスの回帰係数、
xjは、ER−マーカーの発現値(log2のスケール)である。
【0110】
100%の感受性および最も高い特異性が得られるように、トレーニングセットのROC曲線から閾値を決定した。313.5の定数Aおよび280の定数Bの値は、ER陽性患者およびER陰性患者の両方に対してRSの閾値が0になるように選択した。RSスコアが正の患者は、不良な予後診断のグループに分類し、RSスコアが負の患者は、良好な予後診断のグループに分類した。遺伝子シグネチャおよびカットオフを、試験セットで検証した。カプラン‐マイヤー生存プロット(Kaplan-Meier survival plots)およびログランク検定(log-rank tests)を用いて、予測した高リスクグループと低リスクグループが遠隔転移になるまでの時間の差を評価した。オッズ比(OR)を、再発すると予測される患者と再発しないと予測される患者との間の遠隔転移のオッズの比として計算した。
【0111】
コックスの比例ハザード回帰を用いた単変量分析および多変量分析を、遺伝子シグネチャを有するまたは有しない個々の臨床変数に対して実施した。この結果から、HRおよびその95%の信頼区間(CI)が得られた。全ての統計解析を、S‐Plus6.1ソフトウエア(インサイトフル(Insightful)社、バージニア州)を用いて実施した。
【0112】
例4
例3で同定された遺伝子の経路分析
機能クラスを、予後診断シグネチャ遺伝子の各遺伝子に割り当てた。経路分析は、Ingenuity 1.0ソフトウエア(インジェニュイティ・システムズ社(Ingenuity Systems)、カリフォルニア州)を用いて実施した。アフィメトリックスプローブ(Affymetrix probes)をインプットとして用いて、ソフトウエアによって構築した生物学ネットワークを検索した。プログラムによって見出された生物学ネットワークを、GO(Gene Ontology)オントロジー分類によって一般的な機能クラスに照らして評価した。予後診断シグネチャに2つ以上の遺伝子を有する経路を選択して評価した。
【0113】
例5
例1〜4の結果
患者および腫瘍の特徴
286人の患者の臨床的および病理学的特徴を表1に要約する。
【表1】
【0114】
年齢または閉経状態に差はなかった。ER陰性トレーニンググループは、より大きな腫瘍の比率が僅かに高く、そして予想していたように、ER陽性トレーニンググループよりもグレードが不良の腫瘍が多かった。171人の患者(129人のER陽性患者と42人のER陰性患者)の検証グループは、患者または腫瘍の特性の全てにおいて、合計286人の患者のグループと差がなかった。
【0115】
2つの方法を用いて、疾患の再発を示すマーカーを同定した。まず、286人の患者(ER陽性とER陰性の組合せ)の全てをトレーニングセットと試験セットにランダムに分けた。35の遺伝子を、トレーニングセットの80人の患者から選択し、遠隔転移の発症を予測するコックスのモデルを作成した。中程度の予後診断値が確認された。表2を参照されたい。監視されていないクラスター化分析によって、腫瘍ER状態に高い相関性を有する2つの顕著なサブグループが示された(カイ2乗検定 p<0.0001)。図1Bは、まず患者を、ER状態に基づいてサブグループに分類する第2の方法を示している。
【表2】
【0116】
マーカーを選択するために各サブグループを分析した。76の遺伝子を、トレーニングセットの患者から選択した(60がER陽性グループから、16がER陰性グループから)(図2Aの左のグラフを参照)。選択した遺伝子とER状態を総合して、癌の再発を予測するコックスのモデルを、全てのLNN患者に対して作成した。171人の患者の試験セットにおける76‐遺伝子予測因子(76-gene predictor)の検証により、AUC値が0.694、感受性が93%(52/56)、そして特異性が48%(55/115)のROCが得られた(図2Aの右のグラフを参照)。再発スコアが予後診断シグネチャの閾値よりも高い患者は、5年以内の遠隔転移の発症に対して11.9倍のOR(95%CI:4.04〜35.1、p<0.0001)を有する。対照として、ランダムに選択した76の遺伝子セットを作成した。これらは、試験グループにおいて平均AUC値が0.515、感受性が91%、そして特異性が12%のROCを生成した。このような遺伝子セットによって階層化された患者は、転移の発症についてオッズ比1.3(0.50〜3.90、p=0.8)を有し、ランダムな分類を示している。加えて、76‐遺伝子シグネチャの関数としての全体の生存(OS)および無遠隔転移生存(DMFS)に対するカプラン‐マイヤー解析により、良好な予後を予測するグループと不良な予後を予測するグループとの間に、転移するまでに大きな有意な時間差が示された(図2を参照)。60ヶ月および80ヶ月において、良好な予後のグループと不良な予後のグループとの間のDMFSの絶対差はそれぞれ、40%(93%対53%)および39%(88%対49%)、そしてOSの絶対差はそれぞれ、27%(97%対70%)および32%(95%対63%)であった。
【0117】
76‐遺伝子プロファイルは、84人の閉経前患者(HR:9.60)のサブグループ、87人の閉経後患者(HR:4.04)のサブグループ、および腫瘍の大きさが10mm〜20mmの範囲79人の患者(HR:14.1)のサブグループにおいて、遠隔転移の発症の強力な予後診断因子も表している(図3を参照されたい)。
【0118】
コックスの単変量および多変量回帰分析を下の表3に要約した。
【表3】
【0119】
76‐遺伝子シグネチャ以外に、単変量分析でグレードのみが顕著であり、中程度/良好の差は、好ましいDMFSに関連していた。5年以内の腫瘍転移の発生についてのHRの多変量回帰推定は、5.55(p<0.0001)であり、76‐遺伝子セットが、腫瘍転移の高リスクに強く関連した独立した予後診断シグネチャを表していることを示す。ER陽性患者およびER陰性患者に対して単変量分析および多変量分析を別々に行い、76‐遺伝子シグネチャが、ER状態によって階層化されたサブグループにおける独立した予後診断変数であった。
【0120】
予後診断シグネチャにおける76の遺伝子の機能(表4)を分析して、これらの遺伝子と生物学的経路を関連付けた。
【表4−1】
【表4−2】
【0121】
76の遺伝子の内の18の遺伝子は機能が未知であるが、細胞死、細胞周期、細胞増殖、DNA複製、DNA修復、および免疫応答などによって明確に表されるいくつかの経路または生化学活性が同定された(表5を参照)。
【表5】
【0122】
カルパイン2、起源認識タンパク質(origin recognition protein)、二重特異性ホスファターゼ、Rho‐GDP解離阻害剤、TNFスーパーファミリータンパク質、補体成分3、微小管関連タンパク質、プロテインホスファターゼ1、およびアポトーシス制御因子BCL‐Gを含め、疾患の進行に関係する遺伝子を見出した。さらに、サイクリンE2(キオマルシ(Keyomarsi)ら(2002年))およびCD44(ヘレラ‐ガイオル(Herrera-Gayol)ら(1999年))などの既に特徴付けられている予後診断遺伝子は、遺伝子シグネチャに含まれている。
【0123】
例6
例1〜5の考察
あらゆる年齢およびあらゆる腫瘍の大きさのリンパ節陰性乳癌患者286人からの原発腫瘍の分析の結果を提供する。患者は、補助的全身療法を受けていないため、予後診断の多遺伝子評価は、混乱させる可能性のある全身治療に関連した予測因子による影響を受けない。
【0124】
この実験は、遠隔腫瘍再発を正確に予測する76‐遺伝子シグネチャを明らかにした。このシグネチャは、年齢、腫瘍の大きさ、グレード、およびERの状態に関係なく、全てのLNN乳房患者に利用することができる。DMFSについてのコックスの多変量分析では、76‐遺伝子シグネチャは、グレードを含む臨床変数よりも優れた唯1つの顕著な変数である。5年後、76‐遺伝子シグネチャが良好な患者と76‐遺伝子シグネチャが不良な患者との間のDMFSおよびOSにおける絶対差はそれぞれ、40%および27%であった。予後診断シグネチャが良好な患者の場合、5年以内に7%が遠隔転移を発症し、3%が死亡した。さらに検証される場合、LNN患者の再発率が25%とすると、この予後診断シグネチャは、37%の陽性予測値および95%の陰性予測値を生成するであろう。特に、このシグネチャは、T1腫瘍(2cm未満)の増大率に対する再発のリスクを決定する際に有効であろう。ザンクトガレン(St Gallen)ガイドラインおよびNIHガイドラインとの比較は有益である。同じ数の高リスク患者が必要な治療を受けるようにすべきであるが、我々の76‐遺伝子シグネチャは、低リスク患者の52%のみに補助的全身化学療法を推奨し、ザンクトガレン(St Gallen)ガイドラインは、低リスク患者の90%、NIHガイドラインは、低リスク患者の89%に推奨する(表6を参照)。
【表6】
【0125】
したがって、76‐遺伝子シグネチャは、不必要な補助的全身療法を薦められる低リスクLNN患者の人数を減少させることができる。
【0126】
予後診断シグネチャにおける76の遺伝子は、多数の機能クラスに属するため、異なる経路が疾患の進行につながるであろうことを示唆している。このシグネチャは、十分に特徴付けられた遺伝子および18の未知の遺伝子を含んでいる。この発見は、他の予後診断因子と比べてこのシグネチャが優れた性能を有する説明となる。細胞死、細胞増殖、および転写調節に関与する遺伝子が、ERの状態によって階層化された両方の患者グループで見つかっているが、ER陽性グループで選択された60の遺伝子とER陰性グループで選択された16の遺伝子は、重複していない。この結果は、疾患の進行の根源的な機構および不均一性の程度が、乳癌患者の2つのERに基づいたサブグループで異なるという考えをサポートする。
【0127】
我々の結果とファン・デ・ビジュデール(van de Vijver)ら(2002年)による研究結果の比較は、用いた患者、技術、および物質が異なるため困難である。ファン・デ・ビジュデール(van de Vijver)らは、補助的全身療法を受けた、または受けていないリンパ節陰性および陽性の53歳未満の女性患者のみを含む。さらに、この研究に用いたマイクロアレイプラットフォームは、アフィメトリックス(Affymetrix)とアジレント(Agilent)と異なっている。バン・ビール(van't Veer)(2002年)の研究の70の遺伝子の場合、48の遺伝子のみがアフィメトリックスU133aアレイ(Affymetrix U133a array)に存在し、我々の場合は、76の遺伝子の内の38の遺伝子のみがアジレントアレイ(Agilent array)に存在する。2つのシグネチャの間に3‐遺伝子の重複が存在する(サイクリンE2、起源認識複合体、およびTNFスーパーファミリータンパク質)。明白な違いにもかかわらず、両方のシグネチャは、腫瘍の再発に関与しうるいくつかの共通経路を同定する遺伝子を含む。この発見は、遺伝子要素には余剰が存在しうるが、有効なシグネチャが、特定の経路の表現を含む必要があるという考えをサポートする。
【0128】
ファン・デ・ビジュデール(van de Vijver)ら(2002年)の研究に比べて我々の研究が優れている点は、未治療のLNN患者の数が多く(141人に対して286人)、我々の76‐遺伝子シグネチャが年齢、閉経状態、および腫瘍の大きさに関係ないことである。我々の患者の検証セットは、他のレポート(ランソホフ(Ransohoff)(2004年))の90%に対して、トレーニングセットとの重複が一切ない。結論として、未治療LNN患者の約30〜40%しか腫瘍を再発しないため、予後診断シグネチャは、低リスクの患者を識別して相当数の患者における過剰医療を防止する強力なツールを提供することができる。原発乳癌患者の補助的全身療法の推奨は、将来は、この予後診断シグネチャが指針になるであろう。全身療法の様々な方式の有効性に対する我々の遺伝子シグネチャの予測値を、補助療法として、または転移疾患患者において試験することができる。
【0129】
例7
ステージI/IIの乳癌のバルク組織とレーザー・キャプチャー・マイクロダイセクションから得た乳癌遺伝子プロファイルの比較
遺伝子発現プロファイルは、様々な種類の癌において強力な診断および予後診断ツールであることが示されてきた。殆ど例外なく、バルク腫瘍RNAを用いてチップ上でハイブリダイゼーションさせる。ホルモン依存性腫瘍の発症および成長において、エストロゲンが重要な役割を果たしている。
【0130】
約75%の乳癌が、タモキシフェン療法(補助的)の指標であり、かつ患者の結果に関係するエストロゲン受容体(ER)を発現する。
【0131】
乳房上皮細胞およびこれに関連した腫瘍形成においてエストロゲンによって引き起こされる機構を洞察するために、レーザー・キャプチャー・マイクロダイセクション(LCM)を用いて、29人の早期原発乳房腫瘍の患者から腫瘍細胞の組織学的に均一な集団を採取し、ジーンチップ(GeneChip)発現分析を行った。これらの29人の患者の内、腫瘍のサイトゾルに対する量的リガンド結合またはエンザイムイムノアッセイに基づき、11人がER陰性、17人がER陽性であった。比較のために、同じ29人の患者のグループから単離したバルク組織RNAを用いて、遺伝子発現プロファイルも得た。
【0132】
新鮮凍結組織サンプルは、乳房腫瘍の外科的治療を受けたが、ネオアジュバント全身療法を受けていない29人のリンパ節陰性乳癌患者(腫瘍の特徴、表2)から採取されたものである。各患者の組織サンプルに対して、我々はまず、H&Eスライドを用いて細胞形態を評価した。クリオスタット部分に対してLCM(PALM)を行って得た腫瘍細胞と、全クリオスタット部分すなわち同じ腫瘍のバルク組織の両方からRNAを単離した。RNAサンプルの質を、アジレント・バイオアナライザー(Agilent BioAnalyzer)で分析した。このRNAサンプルを、約22,000のプローブセットを含むアフィメトリックス・ヒューマンU113Aチップ(Affymetrix human U133A chip)にハイブリダイズさせた。蛍光発光を定量して、強度を標準化した。クラスター化分析(Clustering Analysis)および主成分分析(Principal Component Analysis)を用いて、類似の遺伝子発現プロファイルで患者をグループ分けした。ER陽性サンプルとER陰性サンプルとの間で異なって発現する遺伝子を選択した。
【0133】
標的の調製において、LCMで採取した乳癌細胞から単離した全RNAは、T7を用いた増幅を2回行ったが、バルク組織RNAは1回しか増幅を行わなかった。21のコントロール遺伝子(表7)の発現レベルをLCMデータセットとバルク組織セットとの間で比較して、線形増幅の忠実性を実証した。
【表7】
得られた結果は、表8および図4〜図9に示した。
【表8】
【0134】
図4は、5121の遺伝子に基づいた階層クラスター化であり、LCMおよびバルク組織サンプルがグローバルRNA発現プロファイルに基づいて完全に分けられていることを示している。図5は、LCMサンプルおよびバルク組織から単離されたRNAにおける21のコントロール遺伝子(表6)の発現レベルを示す棒グラフであり、LCMによって得られたRNAに用いた追加の回の線形増幅がコントロール遺伝子の異なった発現を引き起こさなかったことを示している。図6は、データ分析経路であり、図7は、フィルタリングされた遺伝子セットを用いたPCA分析を示している。図8は、ER状態を用いて患者のサブグループを割り当てた円グラフである。LCMサンプルおよびバルク組織サンプルの両方において、ER陽性サブクラスターとER陰性サブクラスターとの間で異なって発現される遺伝子を、スチューデントのT検定で決定した。図9は、LCMサンプルのERだけ、バルク組織のERだけ、およびLCMおよびバルク組織の両方に共通のERに関連した遺伝子についてのジーンオントロジー(Gene Ontology)による経路分析の結果を示している一連の棒グラフである。
【0135】
簡単に述べると、得られた結果は、いくつかの重要な結論を示している。第1に、細胞増殖およびエネルギー代謝に関連した遺伝子は、バルク組織データセットとLCMデータセットの両方におけるER陰性/ER陽性患者で異なって発現することが分かった。第2に、LCMによる乳癌細胞の質が高まったため、細胞表面受容体連鎖シグナル伝達、RASシグナル伝達、JAK‐STATシグナル伝達、およびアポトーシスに関与する遺伝子がERの状態に関係することが分かった。これらの遺伝子は、バルクデータセットでは同定されなかった。第3に、マイクロダイセクションにより、上皮腫瘍細胞を検査する高感度法が可能になり、エストロゲン受容体に関連したシグナル伝達経路の洞察が可能となった。したがって、ここに記載する遺伝子発現プロファイルをLCM単離腫瘍細胞に利用することが、異なるバルク組織で得られる結果に見合っていることが明らかである。
【0136】
例8
乳癌における76‐遺伝子予後診断シグネチャの検証および経路分析
この例8では、76‐遺伝子シグネチャを用いて4つの異なる供給源から得た132人の患者の結果を予測する検証検査の結果を報告する。
【0137】
加えて、この遺伝子シグネチャのロバスト性を評価するために、この例8は、このシグネチャの代替可能な構成要素を同定し、このような代替物がいかに有効なシグネチャにおける重要な経路の同定につながるかを記載する。
【0138】
新鮮な凍結組織サンプルは、乳房腫瘍の外科的治療を受けたが、補助的全身療法を受けていない132人の患者から採取されたものである。使用する患者サンプルは、1980年〜1996年に採取されたものである(図10)。各患者の組織サンプルについて、H&Eスライドを用いて細胞形態を評価した。次に、全RNAサンプルを調製し、このサンプルの質を、アジレント・バイオアナライザー(Agilent BioAnalyzer)で分析した。このRNAサンプルは、マイクロアレイ分析でも分析した。蛍光発光を定量して、その強度を標準化した。再発ハザードスコアを、76‐遺伝子発現シグネチャの発現レベルに基づいて各患者について算出した。これらの患者を、結果が良好なグループと不良なグループに分けた。図11および図12を参照されたい。
【0139】
この遺伝子シグネチャのロバスト性を評価するために、2つの統計分析をデザインして使用した。図13を参照されたい。第1に、遺伝子の選択、そして76‐遺伝子シグネチャを見出すために用いたシグネチャ構築法を繰り返した。表8に示されているように、115人の患者の10のトレーニングセットはそれぞれ、合計286人の患者からランダムに選択した。残りの患者は、試験セットに利用した。
【0140】
第2に、トレーニングセットの患者の数は、286人の患者の80%に増大し、残りの20%の患者を試験セットに用いた。この選択法を10回繰り返した。両方の方法で、カプラン‐マイヤー生存曲線(Kaplan-Meier survival curves)を用いて、トレーニングセットと試験セットとの間には無疾患生存に有意差がないことを確認した。コックスの比例ハザード回帰を用いて、トレーニングセットのそれぞれから遺伝子を選択し、シグネチャを構築した。各シグネチャは、一致する試験セットで確認した。さらに、76‐遺伝子予後診断シグネチャを、GOオントロジー分類で複数の機能グループに割り当てた。このシグネチャの相当数の遺伝子を含む経路を選択した(p値<0.05、>2ヒット)。また、選択した経路は、異なるトレーニングセットに由来する全ての予後診断シグネチャで評価した。
【0141】
表9において、Aは、115人の患者のトレーニングセットを用いた10シグネチャからの結果を含み、Bは、患者の80%のトレーニングセットを用いた10シグネチャからの結果を含む。
【表9】
【0142】
この例から得た結果は以下のとおりである。
・76‐遺伝子シグネチャは、132人の別個の患者で検証に成功し、4つの異なる供給源からの132人のLNN乳癌患者で0.757のAUC値が得られた。このシグネチャは、88%の感受性、41%の特異性を示している。
・代替シグネチャの平均AUCは0.64(95%CI:0.53〜0.72)である。この結果は、76‐遺伝子予測因子の結果(AUC:0.69)と一致している。76‐遺伝子シグネチャで過度に表現された21の経路が、全ての他の予後診断シグネチャでも見出され、共通の生物学的経路が腫瘍の再発に関与していることを示唆している。
・これらの結果は、遺伝子発現プロファイルが患者の結果のリスク評価を行うための強力な方法を提供できることを示唆している。このデータは、患者の腫瘍再発を量的に測定する分子予後診断アッセイの実現性を明らかにしている。
【0143】
本発明は、理解し易いように例示および例を用いて詳細に説明してきたが、この説明および例は、本発明の範囲を限定すると解釈すべきではない。
【表10−1】
【表10−2】
【表10−3】
【表10−4】
【表10−5】
【表10−6】
【表10−7】
【表10−8】
【表10−9】
【表10−10】
【表10−11】
【表10−12】
【表11】
【0144】
参照文献
・アー(Ahr)ら著、「遺伝子発現プロファイリングによる高リスク乳癌患者の識別(Identification of high risk breast-cancer patients by gene-expression profiling)」、ランセット(Lancet)、2002年、359:131‐132
・チャン(Chang)ら著、「乳癌患者でドセタキセルに応答する治療薬の予測のための遺伝子発現プロファイリング(Gene expression profiling for the prediction of therapeutic response to docetaxel in patients with breast cancer)」、ランセット(Lancet)、2003年、362:362‐9
・早期乳癌被験者の共同研究グループ著、「早期乳癌の放射線治療および外科手術の効果:ランダムトライアルの概要(Effects of radiotherapy and surgery in early breast cancer: An overview of the randomized trials」」、ニューイングランド・ジャーナル・オブ・メディスン(N Engl J Med)、1995年、333:1444‐1455
・早期乳癌被験者の共同研究グループ著、「早期乳癌患者に対する多剤併用化学療法:無作為被験者の概要(Polychemotherapy for early breast cancer: an overview of the randomized trials)」、ランセット(Lancet)、1998年、352:930‐942
・早期乳癌被験者の共同研究グループ著、「早期乳癌患者に対するタモキシフェン:無作為被験者の概要(Tamoxifen for early breast cancer: an overview of randomized trials)」、ランセット(Lancet)、1998年、351:1451‐1467
・エフロン(Efron)著、「確認したデータおよびブートストラップ(Censored data and the bootstrap)」、ジャーナル・オブ・ザ・アメリカン・メディカル・アソシエーション(J Am Stat Assoc)、1981年、76:312‐319
・エイフェル(Eifel)ら著、「米国国立衛生研究所合意形成声明:乳癌患者に対する補助的療法、2000年、11月1〜3日(National Institutes of Health Consensus Development Conference Statement: adjuvant therapy for breast cancer, November 1-3,2000」」、ジャーナル・オブ・ザ・ナショナル・カンサー・インスティテュート(J Natl Cancer Inst)、2001年、93:979‐989
・フォーケンス(Foekens)ら著、「ヒト乳房腫瘍のサイトゾルでのエンザイムイムノアッセイによるエストロゲンおよびプロゲステロン受容体の予後診断値(Prognostic value of estrogen and progesterone receptors measured by enzyme immunoassays in human breast tumor cytosols)」、カンサー・リサーチ(Cancer Res)、1989年、49:5823‐5828
・フォーケンス(Foekens)ら著、「ヒト乳癌におけるインスリン様成長因子1、ソマトスタチン、および表皮成長因子の受容体の予後診断値(Prognostic value of receptors for insulin-like growth factor 1, somatostatin, and epidermal growth factor in human breast cancer)」、カンサー・リサーチ(Cancer Res)、1989年、49:7002‐7009
・ゴールドハーシュ(Goldhirsch)ら著、「会議のハイライト:早期乳癌の主治療に対する最新の各国専門家の合意(Meeting highlights: Updated International Expert Consensus on the Primary Therapy of Early Breast Cancer)」、ジャーナル・オブ・クリニカル・オンコロジー(J Clin Oncol)、2003年、21:3357‐3365
・ゴルブ(Golub)ら著、「癌の分子分類:遺伝子発現のモニタリングによるクラスの発見およびクラスの予測(Molecular classification of cancer: class discovery and class prediction by gene expression monitoring)」、サイエンス(Science)、1999年、286:531‐537
・グルーバーガー(Gruvberger)ら著、「乳癌のエストロゲン受容体の状態が顕著に異なる遺伝子発現パターンに関係している(Estrogen receptor status in breast cancer is associated with remarkably distinct gene expression patterns)」、カンサー・リサーチ(Cancer Res)、2001年、61:5979‐5984
・ヘデンフォーク(Hedenfalk)ら著、「遺伝性乳癌の遺伝子発現プロファイル(Gene-expression profiles in hereditary breast cancer)」、ニューイングランド・ジャーナル・オブ・メディスン(N Engl J Med)、2001年、344:539‐548
・ヘレラ‐ガイオル(Herrera-Gayol)ら著、「乳癌の生物学における接着タンパク質:CD44の寄与(Adhesion proteins in the biology of breast cancer: contribution of CD44)」、エクスペリメンタル・アンド・モレキュラー・パソロジー(Exp Mol Pathol)、1999年、66:149‐156
・フアング(Huang)ら著、「乳癌結果の遺伝子発現予測因子(Gene expression predictors of breast cancer outcomes)」、ランセット(Lancet)、2003年、361:1590‐1596
・カプラン(Kaplan)ら著、「不完全な観察の非パラメータ推定(Non-parametric estimation of incomplete observations)」、ジャーナル・オブ・ザ・アメリカン・メディカル・アソシエーション(J Am Stat Assoc)、1958年、53:457‐481
・キオマルシ(Keyomarsi)ら著、「乳癌患者におけるサイクリンEおよび生存(Cyclin E and survival in patients with breast cancer)」、ニューイングランド・ジャーナル・オブ・メディスン(N Engl J Med)、2002年、347:1566‐1575
・リプシュッツ(Lipshutz)ら著、「高密度合成オリゴヌクレオチドアレイ(High density synthetic oligonucleotide arrays)」、ネイチャー・ジェネティックス(Nat Genet)、1999年、21:20‐24
・マ(Ma)ら著、「ヒト乳癌進行の遺伝子発現プロファイル(Gene expression profiles of human breast cancer progression)」、プロシーディングス・オブ・ザ・ナショナル・アカデミー・オブ・サイエンシーズ・オブ・ザ・ユナイテッド・ステイツ・オブ・アメリカ(Proc Natl Acad Sci USA)、2003年、100:5974‐5979
・テゥザニ(Ntzani)ら著、「DNAマイクロアレイの癌の結果および相関性を予測する能力:経験的評価(Predictive ability of DNA microarrays for cancer outcomes and correlates: an empirical assessment)」、ランセット(Lancet)、2003年、362:1439‐1444
・ペロウ(Perou)ら著、「ヒト乳房腫瘍の分子ポートレート(Molecular portraits of human breast tumors)」、ネイチャー(Nature)、2000年、406:747‐752
・ラマズワミー(Ramaswamy)ら著、「腫瘍遺伝子発現シグネチャを用いたマルチクラス癌診断(Multiclass cancer diagnosis using tumor gene expression signatures)」、プロシーディングス・オブ・ザ・ナショナル・アカデミー・オブ・サイエンシーズ・オブ・ザ・ユナイテッド・ステイツ・オブ・アメリカ(Proc Natl Acad Sci USA)、2001年、98:15149‐15154
・ラマズワミー(Ramaswamy)ら著、「原発固形腫瘍の転移の分子シグネチャ(A molecular signature of metastasis in primary solid tumors)」、ネイチャー・ジェネティックス(Nat Genet)、2003年、33:1‐6
・ランソホフ(Ransohoff)著、「癌分子マーカーの発見および検証のための証拠法則(Rules of evidence for cancer molecular-marker discovery and validation)」、ネイチャー・リビュー・カンサー(Nat Rev Cancer)、2004年、4:309‐314
・ソーリー(Sorlie)ら著、「乳癌の遺伝子発現パターンが臨床上の意義で腫瘍をサブクラスに分類する(Gene expression patterns of breast carcinomas distinguish tumor subclasses with clinical implications)」、プロシーディングス・オブ・ザ・ナショナル・アカデミー・オブ・サイエンシーズ・オブ・ザ・ユナイテッド・ステイツ・オブ・アメリカ(Proc Natl Acad Sci USA)、2001年、98:10869‐10874
・ソーリー(Sorlie)ら著、「別個の遺伝子発現データセットで乳房腫瘍のサブタイプの反復観察(Repeated observation of breast tumor subtypes in independent gene expression data sets)」、プロシーディングス・オブ・ザ・ナショナル・アカデミー・オブ・サイエンシーズ・オブ・ザ・ユナイテッド・ステイツ・オブ・アメリカ(Proc Natl Acad Sci USA)、2003年、100:8418‐8423
・ソティリオウ(Sotiriou)ら著、「細針吸引に由来する遺伝子発現プロファイルは乳癌における全身化学療法に対する応答に相関する(Gene expression profiles derived from fine needle aspiration correlate with response to systemic chemotherapy in breast cancer)」、ブレスト・カンサー・リサーチ(Breast Cancer Res)、2003年、4:R3
・ソティリオウ(Sotiriou)ら著、「集団を用いた研究で得た遺伝子発現プロファイルに基づいた乳癌の分類および予後診断(Breast cancer classification and prognosis based on gene expression profiles from a population-based study)」、プロシーディングス・オブ・ザ・ナショナル・アカデミー・オブ・サイエンシーズ・オブ・ザ・ユナイテッド・ステイツ・オブ・アメリカ(Proc Natl Acad Sci USA)、2003年、100:10393‐10398
・スウ(Su)ら著、「遺伝子発現シグネチャを用いたヒト癌腫の分子分類(Molecular classification of human carcinomas by use of gene expression signatures)」、カンサー・リサーチ(Cancer Res)、2001年、61:7388‐7393
・ファン・デ・ビジュデール(van de Vijver)ら著、「乳癌における生存の予測因子としての遺伝子発現シグネチャ(A gene expression signature as a predictor of survival in breast cancer)」、ニューイングランド・ジャーナル・オブ・メディスン(N Engl J Med)、2002年、347:1999‐2009
・バン・ビール(van't Veer)ら著、「遺伝子発現プロファイルが乳癌の臨床結果を予測する(Gene expression profiling predicts clinical outcome of breast cancer)」、ネイチャー(Nature)、2002年、415:530‐536
・ワン(Wang)ら著、「デュークスB結腸癌の再発を予測する遺伝子発現プロファイルおよび分子マーカー(Gene expression profiles and molecular markers to predict recurrence of Dukes'B colon cancer)」、ジャーナル・オブ・クリニカル・オンコロジー(J Clin Oncol)、2004年、22:1564‐1571
・ヲルフェル(Woelfle)ら著、「ヒト乳癌における骨髄微小転移に関連した分子シグネチャ(Molecular signature associated with bone marrow micrometastasis in human breast cancer)」、カンサー・リサーチ(Cancer Res)、2003年、63:5679‐5684
【0145】
〔実施の態様〕
(1)乳癌の状態を評価するための方法において、
(a)乳癌患者から生体サンプルを得るステップと、
(b)(i)配列番号1‐111に一致する、または、
(ii)表10に示されている配列番号1‐111に一致するpsidsからなる群から選択されるプローブセットによって認識される、
mRNAをコード化する遺伝子からなる群から選択される遺伝子の前記サンプルにおける発現レベルを測定するステップと、
を含み、
所定のカットオフレベルよりも高いまたは低い前記遺伝子発現レベルが、乳癌の状態を示唆している、
方法。
(2)乳癌患者のステージを求めるための方法において、
(a)乳癌患者から生体サンプルを得るステップと、
(b)(i)配列番号1‐111に一致する、または、
(ii)表10に示されている配列番号1‐111に一致するpsidsからなる群から選択されるプローブセットによって認識される、
mRNAをコード化する遺伝子からなる群から選択される遺伝子の前記サンプルにおける発現レベルを測定するステップと、
を含み、
所定のカットオフレベルよりも高いまたは低い前記遺伝子発現レベルが、乳癌のステージを示唆している、
方法。
(3)実施態様(2)に記載の方法において、
前記ステージが、TNMシステムによる分類に一致する、方法。
(4)実施態様(2)に記載の方法において、
前記ステージが、類似の遺伝子発現プロファイルを有する患者に一致する、方法。
(5)乳癌患者の治療プロトコルを決定するための方法において、
(a)乳癌患者から生体サンプルを得るステップと、
(b)(i)配列番号1‐111に一致する、または、
(ii)表10に示されている配列番号1‐111に一致するpsidsからなる群から選択されるプローブセットによって認識される、
mRNAをコード化する遺伝子からなる群から選択される遺伝子の前記サンプルにおける発現レベルを測定するステップと、
を含み、
所定のカットオフレベルよりも高いまたは低い前記遺伝子発現レベルが、再発を防止するために推奨される療法の程度および種類を医師が決定できるように再発のリスクを十分に示唆している、
方法。
【0146】
(6)乳癌患者を治療するための方法において、
(a)乳癌患者から生体サンプルを得るステップと、
(b)(i)配列番号1‐111に一致する、または、
(ii)表10に示されている配列番号1‐111に一致するpsidsからなる群から選択されるプローブセットによって認識される、
mRNAをコード化する遺伝子からなる群から選択される遺伝子の前記サンプルにおける発現レベルを測定するステップと、
を含み、
所定のカットオフレベルよりも高いまたは低い前記遺伝子発現レベルが、再発の高いリスクを示唆している、
方法。
(7)実施態様(1)、(2)、(5)、または(6)に記載の方法において、
前記配列番号が1‐35である、方法。
(8)実施態様(1)、(2)、(5)、または(6)に記載の方法において、
前記配列番号が36‐95である、方法。
(9)ER陽性患者に予後診断を提供するために用いる実施態様(8)に記載の方法。
(10)実施態様(1)、(2)、(5)、または(6)に記載の方法において、
前記配列番号が96‐111である、方法。
【0147】
(11)ER陰性患者に予後診断を提供するために用いる実施態様(10)に記載の方法。
(12)実施態様(1)、(2)、(5)、または(6)に記載の方法において、
前記配列番号が36‐111である、方法。
(13)実施態様(1)、(2)、(5)、または(6)に記載の方法において、
前記サンプルを、バルク組織の用意およびレーザー・キャプチャー・マイクロダイセクションからなる群から選択される方法によって用意する、方法。
(14)実施態様(13)に記載の方法において、
前記バルク組織の用意を、生検または外科的試料から行う、方法。
(15)実施態様(1)、(2)、(5)、または(6)に記載の方法において、
(i)配列番号112‐132に一致する、または、
(ii)表10に示されている配列番号112‐132に一致するpsidsからなる群から選択されるプローブセットによって認識される、
mRNAをコード化する少なくとも1つの遺伝子の発現レベルを測定するステップをさらに含む、
方法。
【0148】
(16)実施態様(1)、(2)、(5)、または(6)に記載の方法において、
前記サンプルで構成的に発現している少なくとも1つの遺伝子の発現ベルを測定するステップをさらに含む、方法。
(17)実施態様(1)、(2)、(5)、または(6)に記載の方法において、
前記サンプルのエストロゲン受容体(ER)の状態を決定するステップをさらに含む、方法。
(18)実施態様(17)に記載の方法において、
前記ERの状態を、ERの状態を示唆する少なくとも1つの遺伝子の発現レベルの測定によって決定する、方法。
(19)実施態様(17)に記載の方法において、
前記ERの状態を、前記サンプルにおけるERの存在の測定によって決定する、方法。
(20)実施態様(19)に記載の方法において、
前記ERの存在を、免疫組織化学的に測定する、方法。
【0149】
(21)実施態様(1)、(2)、(5)、または(6)に記載の方法において、
前記サンプルを原発腫瘍から得る、方法。
(22)実施態様(1)、(2)、(5)、または(6)に記載の方法において、
特異性が、少なくとも約40%である、方法。
(23)実施態様(1)、(2)、(5)、または(6)に記載の方法において、
感受性が、少なくとも約90%である、方法。
(24)実施態様(1)、(2)、(5)、または(6)に記載の方法において、
前記遺伝子の発現パターンを、再発患者を示唆する発現パターンと比較する、方法。
(25)実施態様(24)に記載の方法において、
前記発現パターンの比較を、パターン認識法を用いて行う、方法。
【0150】
(26)実施態様(25)に記載の方法において、
前記パターン認識法が、コックスの比例ハザード分析(Cox's proportional hazards analysis)の使用を含む、方法。
(27)実施態様(1)、(2)、(5)、または(6)に記載の方法において、
前記所定のカットオフレベルが、良性細胞または正常組織に対して、前記サンプルで少なくとも1.5倍多い、または1.5倍少ない発現である、方法。
(28)実施態様(1)、(2)、(5)、または(6)に記載の方法において、
前記所定のカットオフレベルが、良性細胞または正常組織に対して、転移細胞を有する前記サンプルで少なくとも統計的に有意なp値の過剰発現を有する、方法。
(29)実施態様(28)に記載の方法において、
前記p値が0.05未満である、方法。
(30)実施態様(1)、(2)、(5)、または(6)に記載の方法において、
遺伝子発現を、マイクロアレイまたは遺伝子チップ上で測定する、方法。
【0151】
(31)実施態様(21)に記載の方法において、
前記マイクロアレイが、cDNAアレイまたはオリゴヌクレオチドアレイである、方法。
(32)実施態様(21)に記載の方法において、
前記マイクロアレイまたは遺伝子チップが、1または複数の内部コントロール試薬をさらに含む、方法。
(33)実施態様(1)、(2)、(5)、または(6)に記載の方法において、
遺伝子発現を、前記サンプルから抽出したRNAのポリメラーゼ連鎖反応(PCR)による核酸増幅によって決定する、方法。
(34)実施態様(33)に記載の方法において、
前記PCRが、逆転写ポリメラーゼ連鎖反応(RT‐PCR)である、方法。
(35)実施態様(34)に記載の方法において、
前記RT‐PCRが、1または複数の内部コントロール試薬をさらに含む、方法。
【0152】
(36)実施態様(1)、(2)、(5)、または(6)に記載の方法において、
遺伝子発現を、前記遺伝子によってコード化されるタンパク質の測定または検出によって検知する、方法。
(37)実施態様(36)に記載の方法において、
前記タンパク質を、前記タンパク質に特異的な抗体によって検出する、方法。
(38)実施態様(1)、(2)、(5)、または(6)に記載の方法において、
遺伝子発現を、前記遺伝子の特徴を測定して検出する、方法。
(39)実施態様(38)に記載の方法において、
測定する前記特徴を、DNA増幅、メチル化、突然変異、および対立遺伝子変異体からなる群から選択する、方法。
(40)乳癌患者の予後診断遺伝子発現プロファイルを交差検証するための方法において、
(a)統計的に有意な数の患者の生体サンプルから遺伝子発現データを得るステップと、
(b)サンプルの順番をランダムにするステップと、
(c)10%〜50%のサンプルからのデータを除外するステップと、
(d)残りのサンプルに対して、全ての変数について目的の因子を計算して、p値カットオフ(p)を満たす変数を選択するステップと、
(e)前方検索を用いて予測モデルに適合する変数を選択し、所定の誤差率になるまでトレーニング誤差(training error)を評価するステップと、
(f)残りの10%〜50%のサンプルに対して前記予測モデルを試験するステップと、
(g)除外したサンプルの新しいセットでステップ(c)‐(f)を繰り返すステップと、
(h)サンプルの100%の試験が終わるまでステップ(c)‐(g)を繰り返して、分類結果を記録するステップと、
を含む、方法。
【0153】
(41)実施態様(40)に記載の方法において、
前記ステップ(h)で得た前記遺伝子発現データが、
(i)配列番号3、4、10、18、37、40、42、43、45、55、58、64、67、72‐74、76、81、85‐86、89、97、100‐101、110‐111、125、および132‐442、または2、3、5、12、20、25、36、37、39、40、41、42、43、45、46、51、52、53、54、55、57、58、59、60、61、62、63、64、66、67、69、70、72、73、74、76、80、81、83、84、85、86、87、88、89、90、94、97、98、101、102、104、107、110、111、132、139、142、150、151、153、154、158、161、163、167、170、171、173、175、181、182、183、186、188、190、192、204、206、207、212、215、218、221、223、225、228、231、232、236、238、239、240、241、242、243、246、248、249、255、257、267、269、270、271、273、280、281、282、288、290、291、299、301、304、306、311、314、315、318、327、328、338、342、346、348、354、366、368、371、375、385、388、391、395、397、402、405、409、422、424、428、429、435、436、440、651、および443‐650に一致する、
または(ii)表10に示されている配列番号3、4、10、18、37、40、42、43、45、55、58、64、67、72‐74、76、81、85‐86、89、97、100‐101、110‐111、125、および132‐442、または2、3、5、12、20、25、36、37、39、40、41、42、43、45、46、51、52、53、54、55、57、58、59、60、61、62、63、64、66、67、69、70、72、73、74、76、80、81、83、84、85、86、87、88、89、90、94、97、98、101、102、104、107、110、111、132、139、142、150、151、153、154、158、161、163、167、170、171、173、175、181、182、183、186、188、190、192、204、206、207、212、215、218、221、223、225、228、231、232、236、238、239、240、241、242、243、246、248、249、255、257、267、269、270、271、273、280、281、282、288、290、291、299、301、304、306、311、314、315、318、327、328、338、342、346、348、354、366、368、371、375、385、388、391、395、397、402、405、409、422、424、428、429、435、436、440、651、および443‐650に一致するpsidsからなる群から選択されるプローブセットによって認識される、
mRNAをコード化する遺伝子からなる群から選択される遺伝子によって表される、
方法。
(42)乳癌患者の予後診断遺伝子発現プロファイルを単独で検証する方法において、
(a)統計的に有意な数の患者の生体サンプルから遺伝子発現データを得るステップと、
(b)前記遺伝子発現データにおける供給源によるばらつき(source variabilities)を標準化するステップと、
(c)既に選択されている全ての変数について目的の因子を計算するステップと、
(d)前記サンプルに対して予測モデルを試験して分類結果を記録するステップと、
を含む、方法。
(43)実施態様(42)に記載の方法において、
前記ステップ(d)で得た遺伝子データが、
(i)配列番号3、4、10、18、37、40、42、43、45、55、58、64、67、72‐74、76、81、85‐86、89、97、100‐101、110‐111、125、および132‐442、または2、3、5、12、20、25、36、37、39、40、41、42、43、45、46、51、52、53、54、55、57、58、59、60、61、62、63、64、66、67、69、70、72、73、74、76、80、81、83、84、85、86、87、88、89、90、94、97、98、101、102、104、107、110、111、132、139、142、150、151、153、154、158、161、163、167、170、171、173、175、181、182、183、186、188、190、192、204、206、207、212、215、218、221、223、225、228、231、232、236、238、239、240、241、242、243、246、248、249、255、257、267、269、270、271、273、280、281、282、288、290、291、299、301、304、306、311、314、315、318、327、328、338、342、346、348、354、366、368、371、375、385、388、391、395、397、402、405、409、422、424、428、429、435、436、440、651、および443‐650に一致する、
または(ii)表10に示されている配列番号3、4、10、18、37、40、42、43、45、55、58、64、67、72‐74、76、81、85‐86、89、97、100‐101、110‐111、125、および132‐442、または2、3、5、12、20、25、36、37、39、40、41、42、43、45、46、51、52、53、54、55、57、58、59、60、61、62、63、64、66、67、69、70、72、73、74、76、80、81、83、84、85、86、87、88、89、90、94、97、98、101、102、104、107、110、111、132、139、142、150、151、153、154、158、161、163、167、170、171、173、175、181、182、183、186、188、190、192、204、206、207、212、215、218、221、223、225、228、231、232、236、238、239、240、241、242、243、246、248、249、255、257、267、269、270、271、273、280、281、282、288、290、291、299、301、304、306、311、314、315、318、327、328、338、342、346、348、354、366、368、371、375、385、388、391、395、397、402、405、409、422、424、428、429、435、436、440、651、および443‐650に一致するpsidsからなる群から選択されるプローブセットによって認識される、
mRNAをコード化する遺伝子からなる群から選択される遺伝子によって表される、
方法。
(44)実施態様(42)または(43)に記載の方法によって得る遺伝子プロファイル。
(45)乳癌患者の予後診断を可能にする再発ハザードスコア(Relapse Hazard Score)を生成する方法において、
(a)統計的に有意な数の患者の生体サンプルから遺伝子発現データを得るステップと、
(b)前記データに対してコックスの単変量回帰分析(univariate Cox's regression analysis)を適用して選択遺伝子を得るステップと、
(c)標準コックス係数(standard Cox's coefficients)を用いて前記選択遺伝子に重み付けした発現レベルを適用して、再発ハザードスコアとして適用されうる予測モデルを得るステップと、
を含む、方法。
【0154】
(46)実施態様(38)に記載の方法において、
前記再発ハザードスコアを以下の式を用いて求める、方法。
【数3】
但し、
I=1(X遺伝子レベル>10fmol/mgタンパク質の場合)または0(X遺伝子レベル≦10fmol/mgタンパク質の場合)、
AおよびBは定数、
wiは、X遺伝子+マーカーに対する標準化されたコックスの回帰係数、
xiは、ER+マーカーの発現値(log2のスケール)、
wjは、X遺伝子−マーカーに対する標準化されたコックスの回帰係数、
xjは、ER−マーカーの発現値(log2のスケール)、
X遺伝子は、
(i)配列番号1‐111に一致する、または、
(ii)表10に示されている配列番号1‐111に一致するpsidsからなる群から選択されるプローブセットによって認識される、
mRNAをコード化する遺伝子からなる群から選択される。
(47)乳癌予後診断患者レポートを作成する方法において、
(a)患者から生体サンプルを得るステップと、
(b)前記サンプルの遺伝子発現を測定するステップと、
(c)前記ステップ(b)の結果に対して再発ハザードスコア(Relapse Hazard Score)を適用するステップと、
(d)前記ステップ(c)で得た前記結果を用いて前記レポートを作成するステップと、
を含む、方法。
(48)実施態様(47)に記載の方法において、
前記レポートが、患者集団に対するリスクの可能性および/または患者の結果の評価を含む、方法。
(49)実施態様(47)に記載の方法で作成される患者レポート。
(50)組成物において、
(i)配列番号1‐111、または、
(ii)表10に示されている配列番号1‐111に一致するpsids、
からなる群から選択される少なくとも1つのプローブセットを含む、
組成物。
【0155】
(51)生体サンプルにおいて乳癌の予後診断を決定するアッセイを行うためのキットにおいて、
(i)配列番号1‐111に一致する、または、
(ii)表10に示されている配列番号1‐111に一致するpsidsからなる群から選択されるプローブセットによって認識される、
mRNAをコード化する遺伝子からなる群から選択される遺伝子の組合せの単離された核酸配列、それら核酸配列の補完物、またはそれら核酸配列の一部を検出するための物質、
を含む、キット。
(52)実施態様(51)に記載のキットにおいて、
前記配列番号が36‐95である、キット。
(53)実施態様(51)に記載のキットにおいて、
前記配列番号が96‐111である、キット。
(54)実施態様(51)に記載のキットにおいて、
前記配列番号が36‐111である、キット。
(55)実施態様(51)に記載のキットにおいて、
マイクロアレイ分析を行うための試薬をさらに含む、キット。
【0156】
(56)実施態様(51)に記載のキットにおいて、
前記核酸配列、それら核酸配列の補完物、またはそれら核酸配列の一部をアッセイする媒体をさらに含む、方法。
(57)乳癌の状態を評価するための物品において、
(i)配列番号1‐111に一致する、または、
(ii)表10に示されている配列番号1‐111に一致するpsidsからなる群から選択されるプローブセットによって認識される、
mRNAをコード化する遺伝子からなる群から選択される遺伝子の組合せの単離された核酸配列、それら核酸配列の補完物、またはそれら核酸配列の一部を検出するための物質、
を含む、物品。
(58)実施態様(57)に記載の物品において、
前記配列番号が36‐95である、物品。
(59)実施態様(57)に記載の物品において、
前記配列番号が96‐111である、物品。
(60)実施態様(57)に記載の物品において、
前記配列番号が36‐111である、物品。
【0157】
(61)実施態様(57)に記載の物品において、
マイクロアレイ分析を行うための試薬をさらに含む、物品。
(62)実施態様(57)に記載の物品において、
前記核酸配列、それら核酸配列の補完物、またはそれら核酸配列の一部をアッセイする媒体をさらに含む、物品。
(63)実施態様(1)、(2)、(5)、または(6)に記載の方法を実施するためのマイクロアレイまたは遺伝子チップ。
(64)実施態様(63)に記載のマイクロアレイにおいて、
(i)配列番号1‐111に一致する、または、
(ii)表10に示されている配列番号1‐111に一致するpsidsからなる群から選択されるプローブセットによって認識される、
mRNAをコード化する遺伝子からなる群から選択される遺伝子の組合せの単離された核酸配列、それら核酸配列の補完物、またはそれら核酸配列の一部、
を含み、
前記遺伝子の組合せが、生体サンプルにおける乳癌の状態または再発のリスクを特徴付けるのに十分である、
マイクロアレイ。
(65)実施態様(63)に記載のマイクロアレイにおいて、
測定または特徴付けが、少なくとも1.5倍の過剰発現または1.5倍少ない過少発現である、マイクロアレイ。
【0158】
(66)実施態様(63)に記載のマイクロアレイにおいて、
測定により、統計的に有意なp値の過剰発現または過少発現が得られる、マイクロアレイ。
(67)実施態様(63)に記載のマイクロアレイにおいて、
前記p値が0.05未満である、マイクロアレイ。
(68)実施態様(63)に記載のマイクロアレイにおいて、
cDNAアレイまたはオリゴヌクレオチドアレイを含む、マイクロアレイ。
(69)実施態様(63)に記載のマイクロアレイにおいて、
1または複数の内部コントロール試薬をさらに含む、マイクロアレイ。
(70)診断/予後診断ポートフォリオにおいて、
(i)配列番号1‐111に一致する、または、
(ii)表10に示されている配列番号1‐111に一致するpsidsからなる群から選択されるプローブセットによって認識される、
mRNAをコード化する遺伝子からなる群から選択される遺伝子の組合せの単離された核酸配列、それら核酸配列の相補配列、またはそれら核酸配列の一部、
を含み、
前記遺伝子の組合せが、生体サンプルにおける乳癌の状態または再発のリスクを特徴付けるのに十分である、
診断/予後診断ポートフォリオ。
【0159】
(71)実施態様(70)に記載のポートフォリオにおいて、
測定または特徴付けが、少なくとも1.5倍の過剰発現または1.5倍少ない過少発現である、ポートフォリオ。
(72)実施態様(70)に記載のポートフォリオにおいて、
測定により、統計的に有意なp値の過剰発現または過少発現が得られる、ポートフォリオ。
(73)実施態様(70)に記載のポートフォリオにおいて、
前記p値が0.05未満である、ポートフォリオ。
【図面の簡単な説明】
【0160】
【図1】分析のためのサンプルの選択の外観図、および286人のリンパ節陰性(LNN)乳癌患者の遺伝子発現データの監視されていないクラスター化分析を示している。Aは、分析のための患者のサンプルの選択のフローチャートである。ERの状態を用いて、患者のサブグループを特定した。次に、各サブグループは、マーカーを選択するために別々に分析した。サブグループの患者に、トレーニングセットまたは試験セットを割り当てた。各サブグループから選択されたマーカーを結合して、1つのシグネチャを形成し、全体として試験セットの全ての患者の腫瘍再発を予測する。Bは、286人のLNN乳癌患者の遺伝子発現データの監視されていないクラスター化分析である。左側のグラフは、17,819の情報価値のある遺伝子を示している。赤は、高い相対発現を示し、緑は、低い相対発現を示している。各列はサンプルであり、各行は遺伝子である。右のグラフは、2つの患者のサブグループ間で著しく異なって発現する、左のグラフから同定された2つの優勢な遺伝子クラスターの拡大図を示している。上側の遺伝子クラスターは、ER陽性サブグループで282のダウンレギュレートされた遺伝子のグループを有する。下側の遺伝子クラスターは、ER陽性サブグループで339のアップレギュレートされた遺伝子のグループによって表される。各樹状図の下部のラベルバーは、通常のアッセイによって測定される患者のERの状態を示唆している。
【図2】76‐遺伝子プロファイルの樹立、および無遠隔転移(DMFS)および全生存(OS)に対するカプランマイヤー分析を示すグラフである。Aは、予後診断シグネチャの遺伝子の選択を示している。ER陽性グループおよびER陰性グループに対する遺伝子マーカーを、ROC分析を用いて2つのトレーニングセットから選択した。60の遺伝子がER陽性グループから、16の遺伝子がER陰性グループからであり(左側のグラフ)、試験セットの171人の患者の分析から得た76‐遺伝子シグネチャのROC曲線である(右側のグラフ)。Bは、171人のLNN患者の検証セットにおけるDMFS分析(左側のグラフ)およびOS分析(右側のグラフ)を示している。各患者の失敗のリスクは、76‐遺伝子シグネチャに基づいて評価し、閾値は、トレーニングセットによって決定した。差を調べるためにログランク検定を用いた。
【図3】LNN患者のサブグループにおけるDMFS分析およびOS分析を示している。84人の閉経前の患者(A)、87人の閉経後の患者(B)、腫瘍の大きさが10〜20mmの79人の患者(C)におけるDMFS分析(左側のグラフ)およびOS分析(右側のグラフ)を示している。結果は、検証セットの個々の患者からである。各患者の再発リスクは、76‐遺伝子シグネチャに基づいて評価し、閾値は、トレーニングセットによって決定した。差を調べるためにログランク検定を用いた。
【図4】5121の遺伝子に基づいた階層クラスター化を示すグラフである。
【図5】21のコントロール遺伝子(表7を参照)の発現レベルを示す棒グラフである。
【図6】データ分析のフローチャートである。
【図7】フィルタリングされた遺伝子セットを用いたPCA分析を示すグラフである。
【図8】患者をサブグループに割り当てるために用いるERの状態を表す円グラフである。LCMおよびバルク組織サンプルの両方でER陽性サブクラスターとER陰性サブクラスターとの間で異なって発現される遺伝子をスチューデントのT検定で決定した。
【図9】LCMサンプルだけ、バルク組織だけ、およびLCMとバルク組織の両方に共通である、ERに関連した遺伝子についてのジーンオントロジー(Gene Ontology)による経路分析の結果を示している一連の棒グラフである。
【図10】独立した検証の結果を示すフローチャートである。このフローチャートは、132人の患者が4つの異なる供給源で集められたことを示している。再発ハザードスコアを、76‐遺伝子シグネチャの発現レベルに基づいて各患者に対して計算した。患者を、良好な結果のグループと不良な結果のグループに分類した。
【図11】検証検査のための患者および患者の腫瘍の臨床的および病理的特徴を示す表(A)と、検証検査における76‐遺伝子シグネチャのROC曲線を示すグラフ(B)である。
【図12】検証検査における132人の患者の分類結果を示す表(A)およびグラフ(B)である。予測された良好な結果のグループと不良な結果のグループに対するカプランマイヤー生存曲線およびログランク検定をグラフ(B)に示している。
【図13】経路分析の結果を示すフローチャートである。このフローチャートは、統計的分析のためにサンプルを選択するために用いる方法を示している。Aでは、286人の患者を115人の患者のトレーニングセットおよび試験セットにランダムに分けている。Bでは、286人の患者を、患者の80%をトレーニングセット、患者の20%を試験セットにランダムに分けている。トレーニングセットは、遺伝子マーカーの選択および予後診断シグネチャの作成に用いた。試験セットは、検証に用いた。両方の手順を10回繰り返した。
【図14】GOオントロジー分析の概要を示すグラフである。各バーは、76‐遺伝子シグネチャで有意に過剰に表された経路を示している(p<0.05)。代替のシグネチャの結果から標準偏差を計算した。Aは、115人の患者のトレーニングセットを用いた10のシグネチャからの結果を示している。Bは、患者の80%のトレーニングセットを用いた10のシグネチャからの結果を示している。
【開示の内容】
【0001】
〔発明の分野〕
本発明は、患者の生体サンプルの遺伝子発現プロファイルに基づいた乳癌患者の予後診断に関連する。
【0002】
〔発明の背景技術〕
リンパ節陰性(LNN)乳癌患者の約60%〜70%は、局所(local)または局部(regional)療法のみで治癒している。ランセット(Lancet)(1998年)およびランセット(Lancet)(1998年)。医師が補助的療法を受けるべき患者を選択する際の助けとなるガイドラインが作成された。最も一般的に用いられている推奨は、ザンクトガレン基準(St. Gallen criteria)(ゴールドハーシュ(Goldhirsch)ら著(2003年))および国立衛生研究所(NIH:National Institutes of Health)合意基準である。エイフェル(Eifel)ら著(2001年)。これらのガイドラインは、LNN患者の85%〜90%が補助的全身療法の候補であると示唆している。
【0003】
患者が適切な治療を確実に受けるために患者の病気が再発するリスクを具体的に特定する必要がある。現在、潜在的に危険な状態にある患者を特定できる診断器具は殆ど存在しない。遺伝子発現パターンを用いて、乳癌を臨床的に適切な異なるサブタイプに分類する。ペロウ(Perou)ら著(2000年)、ソルリー(Sorlie)ら著(2001年)、ソルリー(Sorlie)ら著(2003年)、グルーバーガー(Gruvberger)ら著(2001年)、バン・ビール(van't Veer)ら著(2002年)、ファン・デ・ビジュデール(van de Vijver)ら著(2002年)、アー(Ahr)ら著(2002年)、フアング(Huang)ら著(2003年)、ソティリオウ(Sotiriou)ら著(2003年)、ヲルフェル(Woelfle)ら著(2003年)、マ(Ma)ら著(2003年)、ラマズワミー(Ramaswamy)ら著(2003年)、チャン(Chang)ら著(2003年)、ソティリオウ(Sotiriou)ら著(2003年)、およびヘデンフォーク(Hedenfalk)ら著(2001年)。
【0004】
現在、LNN患者では、原発腫瘍を外科的に切除した後に補助的療法を行うべきか、およびどのタイプ(内分泌療法および/または化学療法)にするかの決定は、患者の年齢、閉経状態、腫瘍の大きさ、腫瘍の進行具合、およびステロイドホルモン受容体の状態に大きく依存する。これらの因子は、ザンクトガレン基準および国立衛生研究所(NIH)合意基準などのガイドラインに説明されている。これらの基準に基づくと、85%〜90%を超えるLNN患者が、補助的全身療法を受けるべき候補である。治療法を選択する際のガイドとして、より良い予後診断因子を特定する必要があることは明らかである。
【0005】
〔発明の概要〕
疾患の進行の複雑さを考慮して、広く利用できる予後マーカーを特定するために包括的なゲノムワイドな遺伝子発現の評価をここに報告する。テゥザニ(Ntzani)ら著(2003年)、およびワン(Wang)ら著(2004年)。
【0006】
本発明は、乳癌の状態を評価する方法を包含する。この方法は、乳癌患者から生体サンプルを得るステップ、および配列番号1‐111に一致するmRNA、または表10に示されている配列番号1‐111に一致するpsidsからなる群から選択されるプローブセットによって認識されるmRNAをコード化する遺伝子から選択される遺伝子のサンプルにおける発現レベルを測定するステップによって行われる。この方法において、所定のカットオフレベルよりも高いまたは低い遺伝子発現レベルは、乳癌の状態を示唆する。
【0007】
本発明は、乳癌のステージを決定する方法を包含する。この方法は、乳癌患者から生体サンプルを得るステップ、および配列番号1‐111に一致するmRNA、または表10に示されている配列番号1‐111に一致するpsidsからなる群から選択されるプローブセットによって認識されるmRNAをコード化する遺伝子から選択される遺伝子のサンプルにおける発現レベルを測定するステップを含む。この方法では、所定のカットオフレベルよりも高いまたは低い遺伝子発現レベルは、乳癌のステージを示している。
【0008】
本発明は、乳癌患者の治療プロトコルを決定する方法を包含する。この方法は、乳癌患者から生体サンプルを得るステップと、配列番号1‐111に一致するmRNA、または表10に示されている配列番号1‐111に一致するpsidsから選択されるプローブセットによって認識されるmRNAをコード化する遺伝子から選択される遺伝子のサンプルにおける発現レベルを測定するステップを含む。この方法では、所定のカットオフレベルよりも高いまたは低い遺伝子発現レベルは、再発を防止するために推奨される治療の程度および種類を医師が決定できる程度に再発のリスクを十分に示唆している。
【0009】
本発明は、乳癌患者を治療する方法を包含する。この方法は、乳癌患者から生体サンプルを得るステップと、配列番号1‐111に一致するmRNA、または表10に示されている配列番号1‐111に一致するpsidsから選択されるプローブセットによって認識されるmRNAをコード化する遺伝子から選択される遺伝子のサンプルにおける発現レベルを測定するステップを含む。この方法では、所定のカットオフレベルよりも高いまたは低い遺伝子発現レベルは、高い再発リスクを示唆し、患者のリスクが高い場合は、補助的療法で治療するステップを含む。
【0010】
本発明は、乳癌患者の予後診断遺伝子発現プロファイルを交差検証する方法を包含する。この方法は、統計的に有意な数の患者の生体サンプルから遺伝子発現データを得るステップ(a)、サンプルの順序をランダムにするステップ(b)、サンプルの約10%〜50%のデータを除外するステップ(c)、残りのサンプルに対して、全ての変数に対して目的の因子を計算して、p値カットオフ(p)を満たす変数を選択するステップ(d)、前方検索を用いて予測モデルに適合する変数を選択して、所定の誤差率になるまでトレーニング誤差(training error)を評価するステップ(e)、除外された10%〜50%のサンプルに対して予測モデルを試験するステップ(f)、除外した新しいサンプルのセットでステップ(c)‐(f)を繰り返すステップ(g)、サンプルの100%の試験が終わるまでステップ(c)‐(g)を繰り返して、分類結果を記録するステップ(h)を含む。
【0011】
本発明は、乳癌患者の予後診断遺伝子発現プロファイルを単独で検証する方法を包含する。この方法は、統計的に有意な数の患者の生体サンプルから遺伝子発現データを得るステップ(a)と、この遺伝子発現データにおける供給源によるばらつき(source variabilities)を標準化するステップ(b)と、既に選択されている全ての変数に対して目的の因子を計算するステップ(c)と、サンプルに対して予測モデルを試験して分類結果を記録するステップ(d)を含む。
【0012】
本発明は、乳癌患者の予後診断を可能にする再発ハザードスコアを生成する方法を包含する。この方法は、統計的に有意な数の患者の生体サンプルから遺伝子発現データを得るステップ(a)と、このデータに対してコックスの単変量回帰分析(univariate Cox's regression analysis)を適用して選択遺伝子を得るステップ(b)と、標準コックス係数(standard Cox's coefficients)を用いて選択遺伝子に重み付けした発現レベルを適用して、再発ハザードスコア(Relapse Hazard Score)として適用されうる予測モデルを得るステップを含む。
【0013】
本発明は、乳癌予後診断患者レポートを作成する方法を包含する。この方法は、患者から生体サンプルを得るステップ(a)、このサンプルの遺伝子発現を測定するステップ(b)、このステップ(b)の結果に対して再発ハザードスコアを適用するステップ(c)、このステップ(c)で得た結果を用いてレポートを作成して、それにより患者レポートを作成するステップ(d)を含む。
【0014】
本発明は、配列番号1‐111、または表10に示されている配列番号1‐111に一致するpsids、から選択される少なくとも1つのプローブセットの組成物を包含する。
【0015】
本発明は、生体サンプルにおいて乳癌の予後診断を決定するアッセイを行うためのキットを含む。このキットは、配列番号1‐111に一致するmRNA、または表10に示されている配列番号1‐111に一致するpsidsから選択されるプローブセットによって認識されるmRNAをコード化する遺伝子から選択される遺伝子の組合せの、単離された核酸配列、それらの補完物(complement)、またはそれらの一部を検出するための物質を含む。
【0016】
本発明は、乳癌の状態を評価するための物品を包含する。この物品は、配列番号1‐111に一致するmRNA、または表10に示されている配列番号1‐111に一致するpsidsから選択されるプローブセットによって認識されるmRNAをコード化する遺伝子から選択される遺伝子の組合せの、単離された核酸配列、それらの補完物、またはそれらの一部を検出するための物質を含む。
【0017】
本発明は、診断/予後診断のポートフォリオを包含する。このポートフォリオは、配列番号1‐111に一致するmRNA、または表10に示されている配列番号1‐111に一致するpsidsから選択されるプローブセットによって認識されるmRNAをコード化する遺伝子から選択される遺伝子の組合せの、単離された核酸配列、それらの補完物、またはその一部を含み、この組み合わせは、生体サンプルにおける乳癌の状態、または再発のリスクを特徴付けるのに十分である。
【0018】
〔詳細な説明〕
本発明は、乳癌の状態を評価する方法を包含する。乳癌患者から生体サンプルを得るステップと、配列番号1‐111に一致するmRNA、または表10に示されている配列番号1‐111に一致するpsidsからなる群から選択されるプローブセットによって認識されるmRNAをコード化する遺伝子から選択される遺伝子のサンプルにおける発現レベルを測定するステップを含む。この方法では、所定のカットオフレベルよりも高いまたは低い遺伝子発現レベルは、乳癌の状態を示唆する。
【0019】
本発明は、乳癌のステージを決定する方法を包含する。この方法は、乳癌患者から生体サンプルを得るステップと、配列番号1‐111に一致するmRNA、または表10に示されている配列番号1‐111に一致するpsidsからなる群から選択されるプローブセットによって認識されるmRNAをコード化する遺伝子から選択される遺伝子のサンプルにおける発現レベルを測定するステップを含む。この方法では、所定のカットオフレベルよりも高いまたは低い遺伝子発現レベルは、乳癌のステージを示している。この方法は、対癌米国合同委員会のTNMシステム(TNM system American Joint Committee on Cancer)(www.cancerstaging.org)、および類似の遺伝子発現プロファイルを有する患者に一致するステージの比較を含め、当分野で周知のあらゆる分類方法を利用する。
【0020】
本発明は、乳癌患者の治療プロトコルを決定する方法を包含する。この方法は、乳癌患者から生体サンプルを得るステップと、配列番号1‐111に一致するmRNA、または表10に示されている配列番号1‐111に一致するpsidsから選択されるプローブセットによって認識されるmRNAをコード化する遺伝子から選択される遺伝子のサンプルにおける発現レベルを測定するステップを含む。この方法では、所定のカットオフレベルよりも高いまたは低い遺伝子発現レベルは、再発を防止するために推奨される治療の程度および種類を医師が決定できる程度に再発のリスクを十分に示唆している。
【0021】
本発明は、乳癌患者を治療する方法を包含する。この方法は、乳癌患者から生体サンプルを得るステップと、配列番号1‐111に一致するmRNA、または表10に示されている配列番号1‐111に一致するpsidsから選択されるプローブセットによって認識されるmRNAをコード化する遺伝子から選択される遺伝子のサンプルにおける発現レベルを測定するステップを含む。この方法では、所定のカットオフレベルよりも高いまたは低い遺伝子発現レベルは、高い再発リスクを示唆し、患者のリスクが高い場合は、補助的療法で治療するステップを含む。
【0022】
前記した方法はいずれも、配列番号を、1‐35、36‐95、96‐111、または36‐111とすることができる。好ましくは、エストロゲン受容体(ER)陽性患者に対しては配列番号を36‐95とし、ER陰性患者に対しては配列番号を96‐111とする。
【0023】
サンプルは、バルク組織の用意およびレーザー・キャプチャー・マイクロダイセクションを含む、当分野で周知のあらゆる方法によって用意することができる。バルク組織は、生検または外科的試料から用意することができる。
【0024】
上記した方法は、配列番号112‐132に一致するmRNA、または表10に示されている配列番号112‐132に一致するpsidsから選択されるプローブセットによって認識されたmRNAをコード化する少なくとも1つの遺伝子の発現レベルを測定することを含むことができる。上記した方法は、サンプル内で構成的に発現される少なくとも1つの遺伝子の発現レベルを測定することも含むことができる。
【0025】
上記した方法は、サンプルのエストロゲン受容体(ER)の状態を決定することも含むことができる。ERの状態は、ERの状態を示す少なくとも1つの遺伝子の発現レベルを測定すること、サンプル中のERの存在を測定すること、および免疫組織化学的に測定することを含め、当分野で周知のあらゆる方法で測定することができる。
【0026】
上記した方法は、あらゆる生体源から得たサンプルと共に用いることができる。このサンプルは、原発腫瘍から得るのが好ましい。
【0027】
上記した方法は、少なくとも40%の特異性および少なくとも90%の感受性を有するのが好ましい。
【0028】
上記した方法は、遺伝子の発現パターンを、再発患者を示す遺伝子発現パターンと比較する場合に用いることができる。この比較は、パターン認識法を用いた遺伝子発現パターンの比較を含め、当分野で周知のあらゆる方法で行うことができる。パターン認識法は、コックスの比例ハザード分析(Cox's proportional hazards analysis)を含む当分野で周知のあらゆる方法とすることができる。
【0029】
上記した方法は、所定のカットオフレベルが、サンプル中の発現が良性細胞または正常組織に対して少なくとも1.5倍以上の過剰発現または1.5倍少ない過少発現である場合に用いることができる。所定のカットオフレベルは、転移性細胞を有するサンプルにおいて、良性細胞または正常組織に対して少なくとも統計的に有意なp値の過剰発現を有するのが好ましい。より好ましくは、p値は0.05未満である。
【0030】
上記した方法は、遺伝子発現がマイクロアレイまたは遺伝子チップで測定される場合に使用することができる。ここで使用するのに適した遺伝子チップおよびマイクロアレイも、本発明に包含される。このようなマイクロアレイは、cDNAアレイまたはオリゴヌクレオチドアレイとすることができ、1または複数の内部コントロール試薬をさらに含むことができる。
【0031】
上記した方法は、サンプルから抽出したRNAのポリメラーゼ連鎖反応(PCR)による核酸増幅によって遺伝子発現を決定する場合に使用することができる。このPCRは、逆転写ポリメラーゼ連鎖反応(RT‐PCR)とすることもできる。RT‐PCRは、1または複数の内部コントロール試薬をさらに含むことができる。
【0032】
上記した方法は、遺伝子発現を、その遺伝子によってコード化されるタンパク質を測定または検出することによって検知する場合に用いることができる。そのタンパク質に特異的な抗体による検出および遺伝子の特性の測定を含め、当分野で周知のあらゆる方法を用いることができる。適当な特徴には、限定するものではないが、DNA増幅、メチル化、突然変異、および対立遺伝子変異が含まれる。
【0033】
本発明は、乳癌患者の予後診断遺伝子発現プロファイルを交差検証する方法を包含する。この方法は、統計的に有意な数の患者の生体サンプルから遺伝子発現データを得るステップ(a)、サンプルの順序をランダムにするステップ(b)、サンプルの約10%〜50%のデータを除外するステップ(c)、残りのサンプルに対して、全ての変数に対して目的の因子を計算して、p値カットオフ(p)を満たす変数を選択するステップ(d)、前方検索を用いて予測モデルに適合する変数を選択して、所定の誤差率になるまでトレーニング誤差(training error)を評価するステップ(e)、除外された10%〜50%のサンプルに対して予測モデルを試験するステップ(f)、除外した新しいサンプルのセットでステップ(c)‐(f)を繰り返すステップ(g)、サンプルの100%の試験が終わるまでステップ(c)‐(g)を繰り返して、分類結果を記録するステップ(h)を含む。
【0034】
交差検証法は、ステップ(h)で得た遺伝子発現データが、配列番号3、4、10、18、37、40、42、43、45、55、58、64、67、72‐74、76、81、85‐86、89、97、100‐101、110‐111、125、および132‐442、または2、3、5、12、20、25、36、37、39、40、41、42、43、45、46、51、52、53、54、55、57、58、59、60、61、62、63、64、66、67、69、70、72、73、74、76、80、81、83、84、85、86、87、88、89、90、94、97、98、101、102、104、107、110、111、132、139、142、150、151、153、154、158、161、163、167、170、171、173、175、181、182、183、186、188、190、192、204、206、207、212、215、218、221、223、225、228、231、232、236、238、239、240、241、242、243、246、248、249、255、257、267、269、270、271、273、280、281、282、288、290、291、299、301、304、306、311、314、315、318、327、328、338、342、346、348、354、366、368、371、375、385、388、391、395、397、402、405、409、422、424、428、429、435、436、440、651、および443‐650に一致するmRMA、または表10に示されている配列番号3、4、10、18、37、40、42、43、45、55、58、64、67、72‐74、76、81、85‐86、89、97、100‐101、110‐111、125、および132‐442、または2、3、5、12、20、25、36、37、39、40、41、42、43、45、46、51、52、53、54、55、57、58、59、60、61、62、63、64、66、67、69、70、72、73、74、76、80、81、83、84、85、86、87、88、89、90、94、97、98、101、102、104、107、110、111、132、139、142、150、151、153、154、158、161、163、167、170、171、173、175、181、182、183、186、188、190、192、204、206、207、212、215、218、221、223、225、228、231、232、236、238、239、240、241、242、243、246、248、249、255、257、267、269、270、271、273、280、281、282、288、290、291、299、301、304、306、311、314、315、318、327、328、338、342、346、348、354、366、368、371、375、385、388、391、395、397、402、405、409、422、424、428、429、435、436、440、651、および443‐650に一致するpsidsからなる群から選択されるプローブセットによって認識されるmRNAをコード化する遺伝子から選択される遺伝子によって表される場合に用いることができる。
【0035】
本発明は、乳癌患者の予後診断遺伝子発現プロファイルを単独で検証する方法を包含する。この方法は、統計的に有意な数の患者の生体サンプルから遺伝子発現データを得るステップ(a)と、この遺伝子発現データにおける供給源によるばらつき(source variabilities)を標準化するステップ(b)と、既に選択されている全ての変数に対して目的の因子を計算するステップ(c)と、サンプルに対して予測モデルを試験して分類結果を記録するステップ(d)を含む。
【0036】
この単独の検証法は、ステップ(d)で得た遺伝子発現データが、配列番号3、4、10、18、37、40、42、43、45、55、58、64、67、72‐74、76、81、85‐86、89、97、100‐101、110‐111、125、および132‐442、または2、3、5、12、20、25、36、37、39、40、41、42、43、45、46、51、52、53、54、55、57、58、59、60、61、62、63、64、66、67、69、70、72、73、74、76、80、81、83、84、85、86、87、88、89、90、94、97、98、101、102、104、107、110、111、132、139、142、150、151、153、154、158、161、163、167、170、171、173、175、181、182、183、186、188、190、192、204、206、207、212、215、218、221、223、225、228、231、232、236、238、239、240、241、242、243、246、248、249、255、257、267、269、270、271、273、280、281、282、288、290、291、299、301、304、306、311、314、315、318、327、328、338、342、346、348、354、366、368、371、375、385、388、391、395、397、402、405、409、422、424、428、429、435、436、440、651、および443‐650に一致するmRNA、または表10に示されている配列番号3、4、10、18、37、40、42、43、45、55、58、64、67、72‐74、76、81、85‐86、89、97、100‐101、110‐111、125、および132‐442、または2、3、5、12、20、25、36、37、39、40、41、42、43、45、46、51、52、53、54、55、57、58、59、60、61、62、63、64、66、67、69、70、72、73、74、76、80、81、83、84、85、86、87、88、89、90、94、97、98、101、102、104、107、110、111、132、139、142、150、151、153、154、158、161、163、167、170、171、173、175、181、182、183、186、188、190、192、204、206、207、212、215、218、221、223、225、228、231、232、236、238、239、240、241、242、243、246、248、249、255、257、267、269、270、271、273、280、281、282、288、290、291、299、301、304、306、311、314、315、318、327、328、338、342、346、348、354、366、368、371、375、385、388、391、395、397、402、405、409、422、424、428、429、435、436、440、651、および443‐650に一致するpsidsからなる群から選択されるプローブセットによって認識される:mRNAをコード化する遺伝子から選択される遺伝子によって表される場合に用いることができる。
【0037】
本発明は、乳癌患者の予後診断を可能にする再発ハザードスコアを生成する方法を包含する。この方法は、統計的に有意な数の患者の生体サンプルから遺伝子発現データを得るステップ(a)と、このデータに対してコックスの単変量回帰分析(univariate Cox's regression analysis)を適用して選択遺伝子を得るステップ(b)と、標準コックス係数(standard Cox's coefficients)を用いて選択遺伝子に重み付けした発現レベルを適用して、再発ハザードスコア(Relapse Hazard Score)として適用されうる予測モデルを得るステップを含む。
【0038】
再発ハザードスコアは、以下の式で求めることができる。
【数1】
この式において、
I=1(X遺伝子レベル>10の場合)または0(X遺伝子レベル≦10の場合)、
AおよびBは、定数、
wiは、X遺伝子+マーカーに対する標準化されたコックスの回帰係数、
xiは、ER+マーカーの発現値(log2のスケール)、
wjは、X遺伝子−マーカーに対する標準化されたコックスの回帰係数、
xjは、ER−マーカーの発現値(log2のスケール)、
X遺伝子は、(i)配列番号1‐111に一致する;または(ii)表10に示されている配列番号1‐111に一致するpsidsからなる群から選択されるプローブセットによって認識される:mRNAをコード化する遺伝子からなる群から選択される。
【0039】
本発明は、乳癌予後診断患者レポートを作成する方法を包含する。この方法は、患者から生体サンプルを得るステップ(a)、このサンプルの遺伝子発現を測定するステップ(b)、このステップ(b)の結果に対して再発ハザードスコアを適用するステップ(c)、このステップ(c)で得た結果を用いてレポートを作成して、これにより患者レポートを作成するステップ(d)を含む。このレポートは、患者集団に対するリスクの可能性および/または患者の結果の評価を含みうる。
【0040】
本発明は、配列番号1‐111、または表10に示されている配列番号1‐111に一致するpsids、から選択される少なくとも1つのプローブセットの組成物を包含する。この組成物は、配列番号36‐95、96‐111、または36‐111から選択される少なくとも1つのプローブセットを含むことができる。この組成物は、マクロアレイ分析を行うための試薬と、これらの核酸配列、それらの補完物、またはそれらの一部をアッセイする媒体をさらに含むことができる。
【0041】
本発明は、生体サンプルにおいて乳癌の予後診断を決定するアッセイを行うためのキットを含む。このキットは、配列番号1‐111に一致するmRNA、表10に示されている配列番号1‐111に一致するpsidsから選択されるプローブセットによって認識されるmRNAをコード化する遺伝子から選択される遺伝子の組合せの、単離された核酸配列、それらの補完物、またはそれらの一部を検出するための物質を含む。このキットは、マイクロアレイ分析を行うための試薬と、これらの核酸配列、それらの補完物、またはその一部をアッセイする媒体をさらに含むことができる。
【0042】
本発明は、乳癌の状態を評価するための物品を包含する。この物品は、配列番号1‐111に一致するmRNA、または表10に示されている配列番号1‐111に一致するpsidsから選択されるプローブセットによって認識されるmRNAをコード化する遺伝子から選択される遺伝子の組合せの、単離された核酸配列、それらの補完物、またはそれらの一部を検出するための物質を含む。この物品は、マイクロアレイ分析を行うための試薬と、これらの核酸配列、それらの補完物、またはその一部をアッセイする媒体をさらに含むことができる。
【0043】
ここで用いるマイクロアレイは、配列番号1‐111に一致するmRNA、または表10に示されている配列番号1‐111に一致するpsidsから選択されるプローブセットによって認識されるmRNAをコードする遺伝子から選択される遺伝子の組合せの、単離された核酸配列、それらの補完物、またはその一部を含むことができる。この遺伝子の組合せは、生体サンプルにおける乳癌の状態または再発のリスクを特徴付けるのに十分である。
【0044】
マイクロアレイの測定または特徴付けは、少なくとも1.5倍の過剰発現または1.5倍少ない過少発現であるのが好ましい。マイクロアレイは、良性細胞または正常組織に対して、サンプル中で少なくとも1.5倍の過剰発現または1.5倍少ない過少発現である所定のカットオフレベルを検出できる。この所定のカットオフレベルは、良性細胞または正常組織に対して、転移性細胞を有するサンプルで少なくとも統計的に有意なp値の過剰発現を有するのが好ましい。より好ましくは、p値は0.05未満である。
【0045】
本発明は、診断/予後診断のポートフォリオを包含する。このポートフォリオは、配列番号1‐111に一致するmRNA、または表10に示されている配列番号1‐111に一致するpsidsから選択されるプローブセットによって認識されるmRNAをコード化する遺伝子から選択される遺伝子の組合せの、単離された核酸配列、それらの補完物、またはその一部を含む。この遺伝子の組合せは、生体サンプルにおける乳癌の状態または再発のリスクを特徴付けるのに十分である。このポートフォリオは、良性細胞または正常組織に対して、サンプル中で少なくとも1.5倍の過剰発現または1.5倍少ない過少発現(under-expression)である所定のカットオフレベルを検出できる。この所定のカットオフレベルは、良性細胞または正常組織に対して、転移性細胞を有するサンプルで少なくとも統計的に有意なp値の過剰発現を有するのが好ましい。より好ましくは、p値は0.05未満である。
【0046】
配列番号1‐650を表10に要約した。各配列番号1‐650において、マーカーは、psidまたはアフィメトリックス・ジーン・チップ・デシグネーション(Affymetrix GeneChip Designation)によって識別され、所定の配列番号に一致するあらゆる変位体または対立遺伝子などをコード化する遺伝子を表している。このマーカーは、所定のpsidに一致するプローブによって認識されるmRNAをコード化する遺伝子としても定義される。特定のマーカーを、以下に詳細に説明する。
【0047】
配列番号45のM83は、米国特許出願公開第20020110547号、同第20040009491号、および同第20030236392号、ならびに、PCT国際公開WO0149716号、同WO0170979号、同WO03025138号、同WO03042661号、同WO03016475号、同WO2004063355号、同WO2004047728号、および同WO2004030615号に記載されている。
【0048】
配列番号43のABLIM‐sは、米国特許出願公開第20020131971号、同第20030087818号、同第20030166064号、同第20030236392号、および同第20040005560号、ならびに、PCT国際公開WO0036107号、同WO0159063号、同WO0160860号、同WO0174405号、同WO0177288号、同WO02059271号、同WO0212328号、同WO0224956号、同WO0229086号、同WO03025138号、同WO2004024097号、同WO2004037996号、同WO2004039956号、同WO2004043361号、および同WO2004047728号に記載されている。
【0049】
配列番号54のATAD2は、米国特許出願公開第20020064872号、同第20020085998号、同第20020150581号、同第20020156011号、同第20020192678号、同第20030069180号、同第20030073623号、同第20030104366号、同第20040005560号、同第20040013663号、および同第20040058340号、ならびに、PCT国際公開WO0060076号、同WO0142467号、同WO0155322号、同WO0160860号、同WO0170979号、同WO0179286号、同WO0196388号、同WO02057414号、同WO02059377号、同WO02060317号、同WO02086443号、同WO0231198号、同WO0250279号、同WO03004989号、同WO03025138号、同WO03042661号、同WO03062379号、同WO2004047728号、同WO2004048938号、同WO2004048938号、同WO2004063355号、および同WO9938972号に記載されている。
【0050】
配列番号48のC11ORF9は、米国特許出願公開第20030065157号および同第20030073623号、ならびに、PCT国際公開WO0056880号、同WO0058473号、同WO0159063号、同WO0174405号、同WO02059260号、同WO0229086号、同WO03101283号、同WO2004031413号、および同WO2004060270号に記載されている。
【0051】
配列番号46のC3は、米国特許出願公開第20040005560号および同第20040058340号、ならびに、PCT国際公開WO9101999号、同WO0055350号、同WO0160860号、同WO0175067号、同WO0188088号、同WO0224956号、同WO0294629号、同WO03078572号、同WO2004028479号、同WO2004030615号、同WO2004041170号、および同WO2004060270号に記載されている。
【0052】
配列番号65のCGI‐41は、米国特許出願公開第20030073623号および同第20030096982号、ならびに、PCT国際公開WO9514772号、同WO9940100号、同WO0154472号、同WO0157188号、同WO03046152号、および同WO2004060270号に記載されている。
【0053】
配列番号36に記載のCLN8は、欧州特許第1104808B1号、米国特許出願第20030073623号および同第20040009491号、ならびに、PCT国際公開WO9845437号、同WO9935158号、同WO0142451号、同WO0190304号、同WO02090526号、同WO02095010号、同WO02102993号、同WO02102994号、同WO03004622号、同WO04024892号、および同WO04041170号に記載されている。
【0054】
配列番号60に記載のCNK1は、米国特許出願公開第20040058340号、ならびに、PCT国際公開WO9938972号および同WO2004037996号に記載されている。
【0055】
配列番号57のDUSP4は、米国特許出願公開第20030073623号、同第20030194704号、同第20040058340号、および同第20040110194号、ならびに、PCT国際公開WO0100828号、同WO0204514号、同WO02059377号、同WO02103320号、同WO0224956号、同WO03004989号、同WO2004018641号、同WO2004023973号、同WO2004037996号、同WO2004039956号、同WO2004043361号、同WO2004047728号、同WO2004048938号、および同WO9423039号に記載されている。
【0056】
配列番号62のFEN1は、米国特許第5874283号、米国特許出願公開第20020156011号、同第20030069180号、同第20030073623号、および同第20030194704号、ならびに、PCT国際公開WO0196388号、同WO03016475号、同WO03016500号、同WO03072035号、同WO03101283号、同WO2004022059号、同WO2004030615号、同WO2004039956号、同WO2004043361号、同WO2004047728号、同WO2004048938号、同WO2004060270号、および同WO2004079014号に記載されている。
【0057】
配列番号63のFKBP2は、米国特許出願公開第20030073623号、ならびに、PCT国際公開WO02059377号、同WO02070737号、同WO02081731号、同WO02083898号、同WO0224956号、同WO03016475号、同WO03054152号、同WO2004039956号、同WO2004043361号、および同WO9219745号に記載されている。
【0058】
配列番号37のGP73は、米国特許出願公開第20030022239号、同第20030073623号、同第20030236392号、同第20040009478号、同第20040034196号、および同第20040058340号、ならびに、PCT国際公開WO0012708号、同WO0061610号、同WO0078961号、同WO0140466号、同WO0160860号、同WO0177168号、同WO0194629号、同WO02059260号、同WO02083876号、同WO0224956号、同WO03004989号、同WO2004024892号、同WO2004031414号、および同WO2004053081号に記載されている。
【0059】
配列番号61のH4FHは、米国特許出願公開第20020151681号、ならびに、PCT国際公開WO0055174号、同WO0175067号、同WO0224956号、同WO03016476号、および同WO2004039943号に記載されている。
【0060】
配列番号39のIL‐18は、米国特許第6060283号、米国特許出願公開第20040115636号、ならびに、PCT国際公開WO0194629号、同WO02057414号、同WO0224956号、同WO0229086号、同WO03025138号、同WO03042661号、および同WO9724441号に記載されている。
【0061】
配列番号56のKIAA0748は、PCT国際公開WO0021991号、同WO02094988号、および同WO2004003162号に記載されている。
【0062】
配列番号64のKPNA2は、米国特許出願公開第20020151681号、同第20020156011号、同第20030069180号、および同第20040058340号、ならびに、PCT国際公開WO9712967号、同WO9964576号、同WO0055174号、同WO0146697号、同WO0170979号、同WO0196388号、同WO02057414号、同WO02059377号、同WO02086443号、同WO02102235号、同WO0224956号、同WO03010336号、同WO03025138号、同WO03027285号、同WO03042661号、同WO2004024097号、同WO2004024892号、同WO2004028479号、同WO2004037996号、同WO2004039956号、同WO2004043361号、同WO2004047728号、および同WO2004063355号に記載されている。
【0063】
配列番号66のMGC11335は、米国特許出願公開第20030073623号、同第20030219744号、および同第20030236392号、ならびに、PCT国際公開WO0144448号、同WO0153312号、同WO0157182号、同WO0188088号、同WO2004030615号に記載されている。
【0064】
配列番号52のOR12D2は、PCT国際公開WO0127158号、同WO02068652号、同WO02081498号、同WO02081517号、同WO030000735号、および同WO03091388号に記載されている。
【0065】
配列番号53のORC3は、米国特許出願公開第20040013663号、ならびに、PCT国際公開WO9810067号、同WO9958642号、同WO0060078号、同WO0175067号、同WO02059377号、同WO02070737号、同WO02102235号、および同WO03042661号に記載されている。
【0066】
配列番号59のPLK1は、ドイツ特許第4329177号、米国特許出願公開第20020081659号、同第20020151681号、ならびに、PCT国際公開WO0055174号、同WO0055320号、同WO02070737号、同WO02086443号、同WO0224956号、同WO03003906号、同WO03016476号、同WO03018807号、同WO03025138号、同WO03042661号、同WO2004030615号、同WO2004037996号、同WO2004042022号、同WO2004047728号、同WO2004048938号、同WO2004063355号、および同WO2004070062号に記載されている。
【0067】
配列番号42のPPP1CCは、米国特許出願公開第20030073623号、同第20040013663号、ならびに、PCT国際公開WO03016476号、同WO0063438号、同WO0170979号、同WO0202623号、同WO02036766号、同WO02074237号、同WO0228999号、同WO03016475号、および同WO2004030615号に記載されている。
【0068】
配列番号55のSMC4は、米国特許出願公開第20020123619号、同第20020168637号、および同第20040058340号、ならびに、PCT国際公開WO9938972号、同WO9964576号、同WO0175067号、同WO0190154号、同WO0204514号、同WO02059377号、同WO02074237号、同WO02086443号、同WO02102235号、同WO03003906号、同WO03016475号、同WO03025138号、同WO03042661号、同WO2003094848号、同WO2004024892号、同WO2004047728号、同WO2004048938号、同WO2004063355号、および同WO2004074301号に記載されている。
【0069】
配列番号44のTRDL‐1は、米国特許第6171787号および同第6440694号、米国特許出願公開第20020055474号、同第20020072089号、同第20020081659号、同第20030065157号、同第20030073623号、および同第20030219767号、ならびに、PCT国際公開WO9733902号、同WO9912965号、同WO9926976号、同WO9928462号、同WO9933980号、同WO9935170号、同WO9950416号、同WO9954460号、同WO0026244号、同WO0032776号、同WO0055320号、同WO0125256号、同WO0177291号、同WO2004020593号、同WO2004024892号、同WO2004033637号、および同WO04037996号に記載されている。
【0070】
配列番号38のYiflpは、米国特許出願公開第20020131971号、同第20030166064号、および同第20040037842号、ならびに、PCT国際公開WO9933981号、同WO9947540号、同WO0173027号、同WO02060317号、同WO02070737号、同WO02076488号、同WO02095010号、同WO0224956号、同WO03004622号、同WO03038063号、同WO03042661号、同WO03054152号、同WO03064589号、同WO2004024892号、同WO2004037996号、同WO2004047728号、および同WO2004048938号に記載されている。
【0071】
アフィメトリックス・ヒューマンU133a・ジーンチップ(Affymetrix Human U133a GeneChip)を利用し、補助的全身療法を受けなかった286人のリンパ節陰性(LNN)乳癌患者から得た凍結腫瘍サンプルの全RNAを用いて22,000の転写物の発現を分析した。ゲノムワイドの遺伝子発現の測定により、腫瘍をサブクラスに分類でき、かつリンパ節陰性乳癌患者の個々人のリスク評価をする改善された手段をもたらす遺伝子活性のパターンを識別できることが分かった。
【0072】
115の腫瘍のトレーニングセットにおいて、ER陽性患者の60の遺伝子とER陰性患者の16の遺伝子で構成される76‐遺伝子シグネチャ(76-gene signature)を同定した。このシグネチャは、続く171人のLNN患者の個々の試験セットにおいて、93%の感受性および48%の特異性を示した。遺伝子プロファイルは、5年以内に遠隔転移が起きた患者(ハザード率(HR):5.67、95%の信頼区間(CI):2.59〜12.4)を特定する際に、たとえ多変量分析における従来の予後診断因子を修正した場合(HR:5.55、CI:2.46〜12.5)でも、非常に有益である。76‐遺伝子プロファイルはまた、84人の閉経前患者(HR:9.60、p=1.6×10-4)、87人の閉経後患者(HR:4.04、p=1.7×10-3)、および10mm〜20mmの大きさの腫瘍を有する79人の患者(HR:14.1、p=2.3×10-6)のサブグループ、および疾患の予後診断が特に困難な患者のグループにおいて、転移発生についての強力な予後診断因子を表した。
【0073】
この実験で、全ての年齢および全ての大きさの腫瘍のグループの286人のLNN乳癌患者からの原発腫瘍の分析結果を得た。患者は、補助的全身療法を受けていないため、第1の多重遺伝子の予後診断の評価が、全身治療に関連した予測因子による寄与を混乱させる恐れがなく、個別の試験セットによって適切に確認され、腫瘍の大きさおよび年齢に制限されない。上記したアルゴリズムに基づいた遺伝子発現は、LNN患者において、遠隔での再発の可能性を高い信頼性で予測することができる。
【0074】
組織サンプルにおける特定の核酸配列の単なる存在の有無は、診断または予後診断の値を得るために極まれに検出されるだけである。他方、様々なタンパク質、ペプチド、またはmRNAの発現についての情報は、ますます重要とみなされるようになってきた。そのゲノム内で単独でタンパク質、ペプチド、またはmRNA(遺伝子と呼ばれるような配列)を発現する可能性のある核酸配列の単なる存在は、所定の細胞内でタンパク質、ペプチド、またはmRNAが発現するか否かを決定するものではない。タンパク質、ペプチド、またはmRNAを発現できる所定の遺伝子がこれらを発現するか否か、および発現する場合にこのような発現が起こる程度は、様々な複合因子によって決まる。このような因子の理解および評価における困難さに関係なく、遺伝子発現のアッセイは、腫瘍発生、転移、アポトーシス、および他の臨床的に関連する現象などの重要な事象の発生について有用な情報を提供する。どの程度遺伝子が活性または不活性であるかの相対指標は、遺伝子発現プロファイルで確認できる。本発明の遺伝子発現プロファイルを用いて予後診断を行って、乳癌患者を治療することができる。
【0075】
サンプルの用意では、患者サンプルを収集する必要がある。本発明の方法に用いる患者サンプルは、乳房サンプルの原発腫瘍から採取した上皮細胞などの病変細胞を含むと思われる患者サンプルである。また、サージカルマージンから得たサンプルも好ましい。しかしながら、最も好ましいのは、乳癌の外科手術で得たリンパ節から採取したサンプルである。レーザー・キャプチャー・マイクロダイセクション(LCM:Laser Capture Microdissection)技術は、試験する細胞を選択する1つの方法であり、細胞の種類の不均一性によって起こるばらつきを最小限にする。この結果、正常な細胞と癌性細胞との間の遺伝子発現の緩やかな変化または小さな変化を容易に検出することができる。サンプルには、抹消血から抽出した循環上皮細胞も含むことができる。このようなサンプルは、様々な方法によって得ることができるが、最も好ましい方法は、米国特許第6,136,182号に開示されている磁気分離技術である。目的の細胞を含むサンプルが得られたら、RNAを抽出し、そのRNAを増幅し、適当なポートフォリオの遺伝子について、好ましくはマイクロアレイによって遺伝子発現プロファイルを作成する。
【0076】
遺伝子発現プロファイルを作成する好適な方法では、タンパク質またはペプチドをコード化できる遺伝子によって産生されたRNAの量を決定するステップを含む。これは、逆転写PCR(RT‐PCR)、競合RT‐PCR、リアルタイムRT‐PCR、ディファレンシャルディスプレイRT‐PCR、ノーザンブロット分析、および他の関連した検査によって行うことができる。別個のPCR反応を用いてこれらの技術を行うことができるが、mRNAから産生された相補的DNA(cDNA)または相補的RNA(cRNA)を増幅し、これをマイクロアレイで分析するのが最も良い。様々な異なるアレイ構造およびその製造方法は、当業者に周知であり、米国特許第5,445,934号、同第5,532,128号、同第5,556,752号、同第5,242,974号、同第5,384,261号、同第5,405,783号、同第5,412,087号、同第5,424,186号、同第5,429,807号、同第5,436,327号、同第5,472,672号、同第5,527,681号、同第5,529,756号、同第5,545,531号、同第5,554,501号、同第5,561,071号、同第5,571,639号、同第5,593,839号、同第5,599,695号、同第5,624,711号、同第5,658,734号、および同第5,700,637号に記載されている。
【0077】
マイクロアレイ技術により、数千の遺伝子の安定状態のmRNAレベルを同時に測定して、これにより、制御されていない細胞増殖の開始、停止、または調節などの影響を特定するための強力なツールを提供することができる。現在、2つのマイクロアレイ技術が広く用いられている。第1の技術は、cDNAアレイであり、第2の技術は、オリゴヌクレオチドアレイである。これらのチップの構造において相違が存在するが、実質的に全てのダウンストリームデータ解析および出力は同じである。このような解析の産物は、通常は、マイクロアレイ上の既知の位置で、ある核酸配列にハイブリダイズするサンプル中のcDNA配列を検出するために用いる標識プローブから受け取る信号の強度の測定である。通常は、信号の強度は、サンプルの細胞中で発現されるcDNA、従ってmRNAの量に比例する。このような様々な技術は、利用することができ、かつ有用である。遺伝子発現を決定するための好適な方法は、米国特許第6,271,002号、同第6,218,122号、同第6,218,114号、および同第6,004,755号に記載されている。
【0078】
発現レベルの解析は、信号強度の比較によって行う。これは、試験サンプル中の遺伝子の発現強度の、コントロールサンプル中の発現強度に対する比率マトリックス(ratio matrix)を作成して行うのが最も良い。例えば、病変細胞の遺伝子発現強度を、同じ種類の正常な組織から得た発現強度と比較することができる(例えば、病変乳房組織サンプル 対 正常な乳房組織サンプル)。これらの発現強度の比率は、試験サンプルとコントロールサンプルとの間の遺伝子発現における倍数変化を示している。
【0079】
また、遺伝子発現プロファイルは、様々な方法で表示することができる。最も一般的な方法では、未加工の蛍光強度または比率マトリックスを、列が試験サンプルで行が遺伝子を示すグラフィカル・デンドグラム(graphical dendogram)に配列させる。データは、類似の発現プロファイルを有する遺伝子が互いに近接するように配列する。各遺伝子の発現率は、カラーで表示する。例えば、1未満の比率(ダウンレギュレーションを示す)は、スペクトルの青の部分で表し、1より大きい比率(アップレギュレーションを示す)は、スペクトルの赤の部分で表す。市販のコンピュータソフトウエアプログラムを利用して、アジレント・テクノロジーズ社(Agilent Technologies)のGeneSpring、およびPartek(登録商標)のPartek Discover(商標)およびPartek Infer(商標)ソフトウエアを含め、このようなデータを表示することができる。
【0080】
本発明の方法に用いる変調遺伝子(modulated genes)は、以下の例の部分で説明する。異なって発現する遺伝子は、乳癌が再発していない患者に比べて、乳癌が再発した患者でアップレギュレートまたはダウンレギュレートされている。アップレギュレーションおよびダウンレギュレーションは、検出可能な差異(これを測定するために用いるシステムにおけるノイズ部分を超えた)が、ある種のベースラインに対して遺伝子の発現量で見られることを指す相対語である。この場合、このベースラインは、非再発患者の測定された遺伝子発現である。次に、同じ測定方法を用いて、病変細胞(再発患者の)における目的の遺伝子が、ベースラインレベルに対してアップレギュレートまたはダウンレギュレートされる。この文脈における病変は、細胞の無制限増殖で起こる体の機能の適切な能力を妨げるまたは妨害する、或いは妨害する可能性のある体の状態の変化を指す。ある人の遺伝子型または表現型のある点が疾患の存在と一致する場合、その人は疾患であると診断される。しかしながら、診断または予後診断を行う行為には、再発の可能性の決定などの疾患/病態の問題の決定や治療のモニタリングが含まれる。治療のモニタリングでは、遺伝子の発現を時間経過と共に比較して、遺伝子発現プロファイルが正常な組織に、より一致するパターンに変化したか、または変化しつつあるかを決定して、所定の治療のコースの影響について臨床的に判断する。
【0081】
アップレギュレーションおよびダウンレギュレーションのレベルは、ハイブリダイズしたマイクロアレイのプローブの強度測定の倍数変化に基づいて区別するのが好ましい。2.0倍の差は、このような区別に好ましい(または、p値が0.05未満)。すなわち、ある遺伝子が、正常/非再発細胞に対して病変/再発細胞で異なって発現すると考えられる前に、病変細胞が、正常な細胞よりも少なくとも2倍の強度または2倍少ない強度を生成することが分かった。倍数の差が大きければ大きいほど、遺伝子は、診断または予後診断のツールとして使用するのが好ましい。本発明の遺伝子発現プロファイルのために選択する遺伝子は、臨床用実験器具を用いたバックグランドを超える量によって正常すなわち非変調遺伝子(no-modulated genes)が生成する信号と区別できる信号を生成する発現レベルを有する。
【0082】
統計値を用いて、非変調遺伝子およびノイズと変調遺伝子を明確に区別することができる。統計的検定により、多様なサンプルのグループ間で最も著しく異なっている遺伝子を見出した。スチューデントのT検定は、2つのグループ間の著しい差を見出すために用いることができる統計的ロバスト検定の一例である。p値が小さければ小さいほど、遺伝子が異なるグループ間で差を示している有力な証拠となる。それにもかかわらず、マイクロアレイが、一度に2つ以上の遺伝子を測定できるため、何万もの統計的検定を一度に実施することができる。このため、偶然に小さいp値を目にする可能性が低く、シダックの補正(Sidak correction)およびランダム化/順列実験を用いて、この調整を行うことができる。スチューデントのT検定による0.05未満のp値は、遺伝子が著しく異なるという証拠である。より有力な証拠は、シダックの補正を行った後の0.05未満のp値である。各グループに多数のサンプルがある場合、ランダム化/順列検定の後の0.05未満のp値は、著しい差の最も有力な証拠である。
【0083】
非変調遺伝子またはノイズの信号よりも大きい信号を生成する遺伝子を選択するために用いることができる別のパラメータは、絶対信号の差の測定値の使用である。変調遺伝子発現によって生成される信号は、正常すなわち非変調遺伝子発現によって生成される信号とは少なくとも20%異なるのが好ましい(絶対ベース)。このような遺伝子は、正常すなわち非変調遺伝子の発現パターンとは少なくとも30%異なる発現パターンを生成するのがさらに好ましい。
【0084】
グループ中の遺伝子セットについて得た情報が、診断、予後診断、または治療の選択などの臨床的に適切な判断を行うための信頼できる基準を提供するように、遺伝子をグループに分けることができる。このような遺伝子セットは、本発明のポートフォリオを構成する。この場合、このポートフォリオによってサポートされる判断には、乳癌およびその再発の可能性が含まれる。大部分の診断的マーカーと同様に、正確な医療判断を十分に行うことができる最少数のマーカーを用いるのが望ましい。こうすることにより、別の分析を遅延させる治療の遅れや、時間と資源の無駄使いを防止することができる。
【0085】
ポートフォリオ中の遺伝子の組合せが、個々の遺伝子またはランダムに選択された遺伝子の組合せに対して改善された感受性および特性を示すように、ポートフォリオを作成するのが好ましい。本発明との関連で、ポートフォリオの感受性は、正常な状態に対して病変状態で起こる遺伝子発現によって示される倍数差に反映されうる。特異性は、目的の状態と遺伝子発現の信号伝達との相関関係の統計的測定値に反映されうる。例えば、標準偏差を、このような測定値として用いることができる。ある遺伝子のグループをポートフォリオに入れるかの考慮では、発現の測定値における小さい標準偏差が、より大きな特異性に相関する。相関係数などの他のばらつきの測定値も用いることができる。
【0086】
遺伝子発現ポートフォリオを作成するある方法では、株のポートフォリオの作成に広く用いられている平均分散アルゴリズムなどの最適化アルゴリズムを用いている。この方法は、米国特許出願公開第20030194734号に詳細が記載されている。本質的に、この方法では、この方法の使用者が受け取るリターン(例えば、生成される信号)のばらつきを最小限にすると共に、リターンを最適化するインプット(金融用途では株、ここでは、強度によって測定される発現)のセットを作成する必要がある。このような操作を行う場合、多くの市販のソフトウエアプログラムを利用することができる。本明細書では「ワグナー・ソフトウエア(Wagner Software)」と呼ばれる「ワグナー・アソシエイツ・平均分散最適化アプリケーション(Wagner Associates Mean-Variance Optimization Application)」が好ましい。このソフトウエアは、「ワグナー・アソシエイツ・平均分散最適化ライブラリー(Wagner Associates Mean-Variance Optimization Library)」の機能を用いて、マーコウイッツ・センス(Markowitz sense)における効率的なフロンティアおよび最適なポートフォリオを決定するのが好ましい。このタイプのソフトウエアを使用する際は、このソフトウエアが対象とする金融分析目的に使用される場合に株のリターンおよびリスクの測定が使用される要領で、マイクロアレイデータがインプットとして扱うことができるようにこのマイクロアレイデータを変換する必要がある。
【0087】
ポートフォリオを選択するプロセスは、発見的ルールの適用を含むこともできる。このようなルールは、臨床結果を得るために用いる技術の理解および生物学に基づいて構築されるのが好ましい。発見的ルールは、最適化法からのアウトプットに用いるのがさらに好ましい。例えば、ポートフォリオ選択の平均分散法は、乳癌患者で異なって発現した多数の遺伝子について、マイクロアレイデータに利用することができる。最適化法からのアウトプットは、末梢血および病変組織で発現するある種の遺伝子を含みうる最適化された遺伝子セットとすることができる。この試験方法に用いられるサンプルを末梢血から採取し、乳癌の場合に異なって発現するある種の遺伝子が、末梢血で異なって発現する場合、発見的ルールを用いることができ、ポートフォリオが、末梢血で異なって発現する遺伝子を除く効率的なフロンティアから選択される。もちろん、このルールは、例えばこのルールをデータの事前選択の際に利用して効率的なフロンティアの形成前に利用することもできる。
【0088】
当生物学に必ずしも関連しなくてもよい他の発見的ルールを用いることもできる。例えば、ポートフォリオの所定パーセントのみを特定の遺伝子または遺伝子のグループによって表すことができるルールを適用することもできる。ワグナー・ソフトウエア(Wagner Software)などの市販のソフトウエアは、これらのタイプの発見的ルールに対応している。これは、例えば、1または複数の遺伝子を含むことのディザイラビリティに、正確さや精度以外の因子(例えば、予想ライセンス料)が影響を与える場合に有用であろう。
【0089】
本発明の1つの方法では、様々な遺伝子について遺伝子発現プロファイル(またはポートフォリオ)を比較して予後診断を作成するステップを含む。ポートフォリオを含む各遺伝子の遺伝子発現プロファイルは、コンピュータ可読メディアなどのメディアに保存される。これは、様々な形態で行うことができる。例えば、疾患を示す信号(例えば、強度測定値)の範囲を入力する表を作成することができる。次に、実際の患者のデータをこの表の値と比較して、患者のサンプルが正常か、または病的であるかを決定することができる。より高度な実施形態では、発現信号(例えば、蛍光強度)のパターンをデジタル処理でまたはグラフに記録する。
【0090】
次に、患者のサンプルと共に使用する遺伝子ポートフォリオからの遺伝子発現パターンを、この遺伝子発現パターンと比較する。次に、パターン比較ソフトウエアを用いて、患者のサンプルが疾患の再発を示すパターンを有しているか否かを決定することができる。もちろん、このような比較を用いて、患者が疾患を再発しそうにないか否かを決定することもできる。次に、サンプルの発現プロファイルを、対照細胞のポートフォリオと比較する。サンプルの発現パターンが乳癌の再発の発現パターンに一致している場合は(対抗する医療上の問題が存在しない)、再発患者を治療するように患者を治療する。サンプルの発現パターンが、正常/コントロール細胞からの発現パターンと一致している場合は、患者は、乳癌に対して陰性と診断される。
【0091】
本発明の好適なポートフォリオは、配列番号1〜35の遺伝子でできた35‐遺伝子ポートフォリオ、ER陽性患者を予見するのに最もよく使用される配列番号36〜95の遺伝子でできた60‐遺伝子ポートフォリオ、およびER陰性患者を予見するのに最もよく使用される配列番号96〜111の遺伝子でできた16‐遺伝子ポートフォリオである。配列番号36〜111の遺伝子でできたポートフォリオが最も好ましい。この最も好適なポートフォリオは、ERの状態にかかわらず、再発リスクの高い乳癌患者を、そうではない患者と区別するのに最適である。再発リスクの高い乳癌患者を特定したら、これらの患者に補助的療法を施すことができる。
【0092】
本発明では、患者の遺伝子発現パターンを分析して乳癌患者の予後診断を決定するための最も好ましい方法は、コックスのハザード分析プログラム(Cox's hazards analysis program)を用いる。最も好ましくは、この分析は、S‐Plusソフトウエア(インサイトフル・コーポレーション(Insightful Corporation)が販売)を用いて行う。このような方法を用いて、遺伝子発現プロファイルを、確実に再発を表すプロファイル(すなわち、プロファイル中の遺伝子の組合せの発現レベルが再発を示している)と比較する。閾値が設定されたコックスのハザードモデル(Cox's hazards model)を用いて、2つのプロファイル(既知の再発 対 患者)の類似性を比較し、患者のプロファイルが閾値を超えているか否かを決定する。患者のプロファイルが閾値を超えている場合は、その患者を再発するであろう患者に分類し、補助的療法などの治療を受けさせる。患者のプロファイルが閾値を超えていない場合は、その患者を非再発患者に分類する。線形識別分析、ロジスティック回帰、およびニューラルネットワークアプローチなどの他の分析ツールを用いて、同じ質問に答えることができる。
【0093】
様々な既知のパターン認識法を利用することができる。以下に示す文献に例が記載されている。
・「加重投票(Weighted Voting)」、ゴルブ(Golub)ら著(1999年)
・「サポートベクターマシン(Support Vector Machines)」、スウ(Su)ら著(2001年)、ラマズワミー(Ramaswamy)ら著(2001年)
・「Kに最隣接(K-nearest Neighbors)」、ラマズワミー(Ramaswamy)ら著(2001年)
・「相関係数(Correlation Coefficients)」、バン・ビール(van't Veer)ら著(2002年)
【0094】
本発明の遺伝子発現プロファイルは、癌の診断、予後診断、または治療のモニタリングに有用な他の非遺伝子診断法と共に用いることができる。例えば、場合によっては、上記した遺伝子発現に基づいた方法の診断力を、血清タンパク質マーカーなどの従来のマーカー(例えば、キャンサー・アンチゲン27.29(Cancer Antigen 27.29)(「CA 27.29」))のデータと組み合わせると有利である。CA 27.29のような分析物を含むこのようなマーカーの範囲が存在する。このような1つの方法では、血液を、治療を受けた患者から定期的に採取し、上記した血清マーカーの1つを用いてエンザイムイムノアッセイを行う。マーカーの濃度が、腫瘍の再発または治療の失敗を示唆する場合、遺伝子発現分析を行うことができるサンプル源を採取する。疑わしい腫瘤(mass)が存在する場合、細針吸引(FNA)を行って、腫瘤から採取した細胞の遺伝子発現プロファイルを上記したように分析する。別法では、組織サンプルを、腫瘍を以前に除去した組織に近接した部分から採取することができる。この方法は、他の試験方法の結果が曖昧な場合に特に有用であろう。
【0095】
本発明の物品には、治療、診断、予見、および他の疾患の評価に有用な遺伝子発現プロファイルの表現が含まれる。このようなプロファイルの表現は、装置によって自動的に読み取ることができるコンピュータ可読メディア(磁気的に、光学的に、など)などのメディアに圧縮することができる。この物品は、このようなメディアに圧縮された遺伝子発現プロファイルを評価するための取扱説明書も含むことができる。例えば、この物品は、上記した遺伝子のポートフォリオの遺伝子発現プロファイルを比較するためのコンピュータ取扱説明書を有するCD ROMを含むことができる。この物品はまた、患者のサンプルの遺伝子発現データと比較できるように、内部にデジタル記録された遺伝子発現プロファイルも含むことができる。別法では、このようなプロファイルは、異なる表現形態に記録することができる。このような形態の1つにグラフ記録がある。上記したPartek(登録商標)のPartek Discover(商標)およびPartek Infer(商標)ソフトウエアに含まれているようなクラスター化アルゴリズムが、このようなデータの視覚化に最も役立つであろう。
【0096】
本発明に従って製造される異なるタイプの物品は、遺伝子発現プロファイルを明らかにするために用いるメディアまたは定様式アッセイ(formatted assays)である。これらの物品は、例えば、相補的な配列またはプローブをマトリックスに結合するマイクロアレイを含むことができる。このマトリックスに、目的の遺伝子を示唆する配列が結合して、その存在を読み取ることのできる決定因子を作り出す。別法では、本発明に従った物品は、ハイブリダイゼーションを行うため、増幅を行うため、、および乳癌検出のために目的の遺伝子の発現レベルを示す信号の生成を行うため、の試薬キットにすることができる。
【0097】
本発明に従って作られたキットは、遺伝子発現プロファイルを決定するための定様式アッセイを含む。このようなキットは、アッセイを行うために必要な試薬や取扱説明書などの全てまたは一部の構成要素を含むことができる。
【0098】
限定目的ではない以下に示す例によって、本発明をさらに例示する。本明細書に言及する全ての文献は、参照することを以って本明細書の一部とする。
【0099】
例
本発明に従って分析された遺伝子は、通常は、タンパク質またはペプチドの産生をコードする完全長の核酸配列に関連する。当業者であれば、完全長の配列の同定が、解析の観点から必ずしも必要でないことを理解できよう。すなわち、配列の一部すなわちESTは、対応する遺伝子の遺伝子発現を評価するようにプローブをデザインできる既知の原理に従って選択することができる。
【0100】
例1
サンプルの取扱およびマイクロアレイ作業
1980年〜1995年の間に治療を受け、全身ネオアジュバント療法を受けていないLNN患者から得た凍結腫瘍検体を、エラスムス・メディカル・センター(Erasmus Medical Center)(オランダのロッテルダムに所在)にある腫瘍バンクから選択した。全ての腫瘍サンプルは、ステロイドホルモン受容体測定のために25の地域の病院から関連研究所に送られた。主な治療のガイドラインは、全ての病院で類似している。偏らないように腫瘍を選択した。品質管理の理由から、5年で25%〜30%、腫瘍が実質的に減少すると仮定して、436の浸潤性腫瘍サンプルを処理した。不良な臨床結果、中程度の臨床結果、および良好な臨床結果の患者が含まれている。サンプルは、不十分な腫瘍量(53)、RNAの品質不良(77)、またはチップの品質不良(20)に基づいて除かれ、さらなる分析に用いることができる286のサンプルが残った。
【0101】
実験プロトコルは、施設内医療倫理委員会(institutional medical ethics committee)(MEC番号02.953)によって承認された。外科手術時の患者(乳房温存外科手術:219人、非定型的乳房切除術:67人)の平均年齢は52歳だった(26歳〜83歳の範囲)。施設内プロトコルに従って、248人(87%)の患者に放射線療法を行った。乳房温存療法および放射線療法を受けた患者の比率は、LNN患者にとって標準的である。この実験は、特定のタイプの外科手術または補助的放射線療法の潜在効果を試験することが目的ではないため、放射線療法を受けた、受けないにかかわらず患者を含めた。さらに、実験により、放射線療法が遠隔の再発に対して明確な効果がないことが示された。初期乳癌被験者(Early Breast Cancer Trialists)(1995年)。リンパ節陰性は、地域の病理学者によって病理検査に基づいている。フォーケンス(Foekens)ら(1989年)。
【0102】
含める前に、286全ての腫瘍サンプルに対して、十分な腫瘍(>70%)、およびH&Eで着色した5μmの凍結切片における腫瘍の均一な関与を有するかを確認した。ER(およびPgR)レベルを、リガンド結合アッセイまたはエンザイムイムノアッセイ(EIA)(フォーケンス(Foekens)ら(1989年))によって、または免疫組織化学によって測定した(9の腫瘍で)。ERおよびPRについて患者を陽性または陰性に分類するために用いるカットオフ値は、10fmol/mgタンパク質または10%陽性腫瘍細胞とした。術後のフォローアップには、最初の2年間の3ヵ月毎の検査、3年〜5年目の6ヶ月毎の検査、5年目以降の12ヶ月毎の検査が含まれる。転移の診断の日付は、患者によって症状が報告された後の転移を確認した日、臨床サインを検出した日、または通常のフォローアップの日と定義した。生存患者(n=198)の平均フォローアップ期間は、101ヶ月だった(20ヶ月から171ヶ月の範囲)。この286人の患者には、5年以内の遠隔転移の証拠を示す93人(33%)が含まれ、この93人は、無遠隔転移生存者(DMFS)の分析で失敗としてカウントした。5人(2%)の患者は、疾患の証拠がなく死亡し、最後のフォローアップで検閲された。83人(29%)の患者は、以前の再発の後に死亡した。したがって、全生存者(OS)の分析で、合計で88人(31%)の患者が失敗だった。
【0103】
例2
例1で得たデータの遺伝子発現解析
全RNAを、RNAzol B(カンプロ・サイエンティフィック社(Campro Scientific)、オランダのフェーネンダール(Veenendaal, Netherlands)に所在)を用いて、30μmの厚みの20〜40のクリオスタット切片(50〜100mg)から単離した。ビオチン標識ターゲットを、公開されている方法(アフィメトリックス(Affymetrix)社、カリフォルニア州、リプシュッツ(Lipshutz)ら(1999年))を用いて用意し、アフィメトリックス・オリゴヌクレオチド・マイクロアレイU133a・ジーンチップ(Affymetrix oligonucleotide microarray U133a GeneChip)にハイブリダイズさせた。標準アフィメトリックス・プロトコルを用いてアレイをスキャンした。各プローブセットを、別個の遺伝子として扱った。発現値を、アフィメトリックス・ジーンチップ解析ソフトウエアMAS5.0(Affymetrix GeneChip analysis software MAS 5.0)を用いて求めた。平均強度が40未満の場合、またはバックグランド信号が100超の場合は、チップを取り除いた。チップの信号を標準化するために、プローブセットを目標強度である600に合わせ、スケールマスクファイルを選択しなかった。
【0104】
例3
例2で同定した遺伝子の統計解析
遺伝子発現データをフィルタリングして、2つ以上のサンプルで「存在する」と言われる遺伝子を含めた。17,819の遺伝子がこのフィルタを通過し、これらを階層クラスター化に用いた。クラスター化する前に、各遺伝子の発現レベルを、患者の平均発現レベルで除した。この標準化ステップは、遺伝子の発現の大きさの影響を制限し、これらの遺伝子をクラスター化分析において類似の発現パターンと同じグループに分類した。患者のサブグループを同定するために、これらの遺伝子とサンプルの両方について、ジーン・スプリング6.0(GeneSpring 6.0)を用いて平均関連階層クラスター化を行った。
【0105】
遠隔転移を発症した患者と5年間に亘って転移のない患者を区別する遺伝子を同定するために、2つの監視クラス予測法を用いた。第1の方法では、286人の患者を、80人の患者のトレーニングセットおよび206人の患者の試験セットにそれぞれランダムに割り当てた。トレーニングセットと試験セットのランダムな選択によって著しい差および偏りが生じないように、これらの2つのセットに対するカプラン‐マイヤー生存曲線(Kaplan-Meier survival curves)(カプラン(Kaplan)ら(1958年))を調べた。第2の方法では、患者を、ERの状態によって階層化される2つのサブグループの一方に割り当てた(図1)。
【0106】
各患者のサブグループは、マーカーを選択するために別々に分析した。ER陽性サブグループの患者は、80人の患者のトレーニングセットと、129人の患者の試験セットにそれぞれランダムに割り当てた。ER陰性サブグループの患者は、35人の患者のトレーニングセットと、42人の患者の試験セットにそれぞれランダムに分けた。各サブグループのトレーニングセットから選択したマーカーを組み合わせて1つのシグネチャを形成し、続く単独の検証でER陽性患者およびER陰性患者の両方について腫瘍の転移を予測した。
【0107】
統計的に信頼できるレベルとなるように、トレーニングセットのサンプルの大きさを再サンプリング法で決定した。簡単に述べると、トレーニングセットの患者の数を15人で開始し、5つのステップで増大させた。所定の大きさのサンプルの場合、ランダムに選択された10人の患者のトレーニングセットを作成した。遺伝子シグネチャを、各トレーニングセットから作成し、5年以内の遠隔転移を定義点とした受信者動作特性(ROC)曲線の分析によって、特定の患者の試験セットで試験した。所定の大きさのサンプルに対するこの曲線の下側の領域(AUC)の平均および変動係数(CV)を算出した。トレーニングセットに必要な最少数の患者を、平均AUCが水平域に達して10のAUCのCVが5%よりも低い点で選択した。
【0108】
遺伝子は、以下のように選択した。まず、コックスの単変量比例ハザード回帰(univariate Cox's proportional hazards regression)を用いて、発現(log2のスケール)がDMFSの長さに相関する遺伝子を同定した。複数の試験の影響を軽減し、そして選択した遺伝子の強さを試験するために、コックスのモデル(Cox's model)を、トレーニングセットの患者のブートストラッピングで作成した。エフロン(Efron)ら(1981年)。簡単に述べると、それぞれが復元ランダム抽出された80人の患者を有するように、トレーニングセットの400のブートストラップサンプルを作成した。コックスのモデルを、各ブートストラップサンプルに対して実行した。p値の上位5%と下位5%を除き、残りのブートストラップのp値の逆数を平均して、各遺伝子についてのブートストラップスコアを作成した。このスコアを用いて、遺伝子をランク分けした。複数の遺伝子シグネチャを作成するために、遺伝子マーカーの組合せを、ランク順に従って1回に1つの遺伝子を追加して調べた。定義点として5年以内の遠隔転移を用いるROC解析を実施して、最大AUC値に達するまで遺伝子の数を増大させて各シグネチャに対してAUCの下側の領域を求めた。
【0109】
再発スコア(RS)を用いて、各患者の遠隔転移のリスクを算出した。このスコアを、標準化されたコックスの回帰係数を重みとして重み付けされた発現信号の線形の組合せとして定義した。
【数2】
この式において、
I=1(ERレベル>10fmol/mgタンパク質の場合)または0(ERレベル≦10fmol/mgタンパク質の場合)、
AおよびBは、定数、
wiは、ER+マーカーの標準化されたコックスの回帰係数、
xiは、ER+マーカーの発現値(log2のスケール)、
wjは、ER−マーカーの標準化されたコックスの回帰係数、
xjは、ER−マーカーの発現値(log2のスケール)である。
【0110】
100%の感受性および最も高い特異性が得られるように、トレーニングセットのROC曲線から閾値を決定した。313.5の定数Aおよび280の定数Bの値は、ER陽性患者およびER陰性患者の両方に対してRSの閾値が0になるように選択した。RSスコアが正の患者は、不良な予後診断のグループに分類し、RSスコアが負の患者は、良好な予後診断のグループに分類した。遺伝子シグネチャおよびカットオフを、試験セットで検証した。カプラン‐マイヤー生存プロット(Kaplan-Meier survival plots)およびログランク検定(log-rank tests)を用いて、予測した高リスクグループと低リスクグループが遠隔転移になるまでの時間の差を評価した。オッズ比(OR)を、再発すると予測される患者と再発しないと予測される患者との間の遠隔転移のオッズの比として計算した。
【0111】
コックスの比例ハザード回帰を用いた単変量分析および多変量分析を、遺伝子シグネチャを有するまたは有しない個々の臨床変数に対して実施した。この結果から、HRおよびその95%の信頼区間(CI)が得られた。全ての統計解析を、S‐Plus6.1ソフトウエア(インサイトフル(Insightful)社、バージニア州)を用いて実施した。
【0112】
例4
例3で同定された遺伝子の経路分析
機能クラスを、予後診断シグネチャ遺伝子の各遺伝子に割り当てた。経路分析は、Ingenuity 1.0ソフトウエア(インジェニュイティ・システムズ社(Ingenuity Systems)、カリフォルニア州)を用いて実施した。アフィメトリックスプローブ(Affymetrix probes)をインプットとして用いて、ソフトウエアによって構築した生物学ネットワークを検索した。プログラムによって見出された生物学ネットワークを、GO(Gene Ontology)オントロジー分類によって一般的な機能クラスに照らして評価した。予後診断シグネチャに2つ以上の遺伝子を有する経路を選択して評価した。
【0113】
例5
例1〜4の結果
患者および腫瘍の特徴
286人の患者の臨床的および病理学的特徴を表1に要約する。
【表1】
【0114】
年齢または閉経状態に差はなかった。ER陰性トレーニンググループは、より大きな腫瘍の比率が僅かに高く、そして予想していたように、ER陽性トレーニンググループよりもグレードが不良の腫瘍が多かった。171人の患者(129人のER陽性患者と42人のER陰性患者)の検証グループは、患者または腫瘍の特性の全てにおいて、合計286人の患者のグループと差がなかった。
【0115】
2つの方法を用いて、疾患の再発を示すマーカーを同定した。まず、286人の患者(ER陽性とER陰性の組合せ)の全てをトレーニングセットと試験セットにランダムに分けた。35の遺伝子を、トレーニングセットの80人の患者から選択し、遠隔転移の発症を予測するコックスのモデルを作成した。中程度の予後診断値が確認された。表2を参照されたい。監視されていないクラスター化分析によって、腫瘍ER状態に高い相関性を有する2つの顕著なサブグループが示された(カイ2乗検定 p<0.0001)。図1Bは、まず患者を、ER状態に基づいてサブグループに分類する第2の方法を示している。
【表2】
【0116】
マーカーを選択するために各サブグループを分析した。76の遺伝子を、トレーニングセットの患者から選択した(60がER陽性グループから、16がER陰性グループから)(図2Aの左のグラフを参照)。選択した遺伝子とER状態を総合して、癌の再発を予測するコックスのモデルを、全てのLNN患者に対して作成した。171人の患者の試験セットにおける76‐遺伝子予測因子(76-gene predictor)の検証により、AUC値が0.694、感受性が93%(52/56)、そして特異性が48%(55/115)のROCが得られた(図2Aの右のグラフを参照)。再発スコアが予後診断シグネチャの閾値よりも高い患者は、5年以内の遠隔転移の発症に対して11.9倍のOR(95%CI:4.04〜35.1、p<0.0001)を有する。対照として、ランダムに選択した76の遺伝子セットを作成した。これらは、試験グループにおいて平均AUC値が0.515、感受性が91%、そして特異性が12%のROCを生成した。このような遺伝子セットによって階層化された患者は、転移の発症についてオッズ比1.3(0.50〜3.90、p=0.8)を有し、ランダムな分類を示している。加えて、76‐遺伝子シグネチャの関数としての全体の生存(OS)および無遠隔転移生存(DMFS)に対するカプラン‐マイヤー解析により、良好な予後を予測するグループと不良な予後を予測するグループとの間に、転移するまでに大きな有意な時間差が示された(図2を参照)。60ヶ月および80ヶ月において、良好な予後のグループと不良な予後のグループとの間のDMFSの絶対差はそれぞれ、40%(93%対53%)および39%(88%対49%)、そしてOSの絶対差はそれぞれ、27%(97%対70%)および32%(95%対63%)であった。
【0117】
76‐遺伝子プロファイルは、84人の閉経前患者(HR:9.60)のサブグループ、87人の閉経後患者(HR:4.04)のサブグループ、および腫瘍の大きさが10mm〜20mmの範囲79人の患者(HR:14.1)のサブグループにおいて、遠隔転移の発症の強力な予後診断因子も表している(図3を参照されたい)。
【0118】
コックスの単変量および多変量回帰分析を下の表3に要約した。
【表3】
【0119】
76‐遺伝子シグネチャ以外に、単変量分析でグレードのみが顕著であり、中程度/良好の差は、好ましいDMFSに関連していた。5年以内の腫瘍転移の発生についてのHRの多変量回帰推定は、5.55(p<0.0001)であり、76‐遺伝子セットが、腫瘍転移の高リスクに強く関連した独立した予後診断シグネチャを表していることを示す。ER陽性患者およびER陰性患者に対して単変量分析および多変量分析を別々に行い、76‐遺伝子シグネチャが、ER状態によって階層化されたサブグループにおける独立した予後診断変数であった。
【0120】
予後診断シグネチャにおける76の遺伝子の機能(表4)を分析して、これらの遺伝子と生物学的経路を関連付けた。
【表4−1】
【表4−2】
【0121】
76の遺伝子の内の18の遺伝子は機能が未知であるが、細胞死、細胞周期、細胞増殖、DNA複製、DNA修復、および免疫応答などによって明確に表されるいくつかの経路または生化学活性が同定された(表5を参照)。
【表5】
【0122】
カルパイン2、起源認識タンパク質(origin recognition protein)、二重特異性ホスファターゼ、Rho‐GDP解離阻害剤、TNFスーパーファミリータンパク質、補体成分3、微小管関連タンパク質、プロテインホスファターゼ1、およびアポトーシス制御因子BCL‐Gを含め、疾患の進行に関係する遺伝子を見出した。さらに、サイクリンE2(キオマルシ(Keyomarsi)ら(2002年))およびCD44(ヘレラ‐ガイオル(Herrera-Gayol)ら(1999年))などの既に特徴付けられている予後診断遺伝子は、遺伝子シグネチャに含まれている。
【0123】
例6
例1〜5の考察
あらゆる年齢およびあらゆる腫瘍の大きさのリンパ節陰性乳癌患者286人からの原発腫瘍の分析の結果を提供する。患者は、補助的全身療法を受けていないため、予後診断の多遺伝子評価は、混乱させる可能性のある全身治療に関連した予測因子による影響を受けない。
【0124】
この実験は、遠隔腫瘍再発を正確に予測する76‐遺伝子シグネチャを明らかにした。このシグネチャは、年齢、腫瘍の大きさ、グレード、およびERの状態に関係なく、全てのLNN乳房患者に利用することができる。DMFSについてのコックスの多変量分析では、76‐遺伝子シグネチャは、グレードを含む臨床変数よりも優れた唯1つの顕著な変数である。5年後、76‐遺伝子シグネチャが良好な患者と76‐遺伝子シグネチャが不良な患者との間のDMFSおよびOSにおける絶対差はそれぞれ、40%および27%であった。予後診断シグネチャが良好な患者の場合、5年以内に7%が遠隔転移を発症し、3%が死亡した。さらに検証される場合、LNN患者の再発率が25%とすると、この予後診断シグネチャは、37%の陽性予測値および95%の陰性予測値を生成するであろう。特に、このシグネチャは、T1腫瘍(2cm未満)の増大率に対する再発のリスクを決定する際に有効であろう。ザンクトガレン(St Gallen)ガイドラインおよびNIHガイドラインとの比較は有益である。同じ数の高リスク患者が必要な治療を受けるようにすべきであるが、我々の76‐遺伝子シグネチャは、低リスク患者の52%のみに補助的全身化学療法を推奨し、ザンクトガレン(St Gallen)ガイドラインは、低リスク患者の90%、NIHガイドラインは、低リスク患者の89%に推奨する(表6を参照)。
【表6】
【0125】
したがって、76‐遺伝子シグネチャは、不必要な補助的全身療法を薦められる低リスクLNN患者の人数を減少させることができる。
【0126】
予後診断シグネチャにおける76の遺伝子は、多数の機能クラスに属するため、異なる経路が疾患の進行につながるであろうことを示唆している。このシグネチャは、十分に特徴付けられた遺伝子および18の未知の遺伝子を含んでいる。この発見は、他の予後診断因子と比べてこのシグネチャが優れた性能を有する説明となる。細胞死、細胞増殖、および転写調節に関与する遺伝子が、ERの状態によって階層化された両方の患者グループで見つかっているが、ER陽性グループで選択された60の遺伝子とER陰性グループで選択された16の遺伝子は、重複していない。この結果は、疾患の進行の根源的な機構および不均一性の程度が、乳癌患者の2つのERに基づいたサブグループで異なるという考えをサポートする。
【0127】
我々の結果とファン・デ・ビジュデール(van de Vijver)ら(2002年)による研究結果の比較は、用いた患者、技術、および物質が異なるため困難である。ファン・デ・ビジュデール(van de Vijver)らは、補助的全身療法を受けた、または受けていないリンパ節陰性および陽性の53歳未満の女性患者のみを含む。さらに、この研究に用いたマイクロアレイプラットフォームは、アフィメトリックス(Affymetrix)とアジレント(Agilent)と異なっている。バン・ビール(van't Veer)(2002年)の研究の70の遺伝子の場合、48の遺伝子のみがアフィメトリックスU133aアレイ(Affymetrix U133a array)に存在し、我々の場合は、76の遺伝子の内の38の遺伝子のみがアジレントアレイ(Agilent array)に存在する。2つのシグネチャの間に3‐遺伝子の重複が存在する(サイクリンE2、起源認識複合体、およびTNFスーパーファミリータンパク質)。明白な違いにもかかわらず、両方のシグネチャは、腫瘍の再発に関与しうるいくつかの共通経路を同定する遺伝子を含む。この発見は、遺伝子要素には余剰が存在しうるが、有効なシグネチャが、特定の経路の表現を含む必要があるという考えをサポートする。
【0128】
ファン・デ・ビジュデール(van de Vijver)ら(2002年)の研究に比べて我々の研究が優れている点は、未治療のLNN患者の数が多く(141人に対して286人)、我々の76‐遺伝子シグネチャが年齢、閉経状態、および腫瘍の大きさに関係ないことである。我々の患者の検証セットは、他のレポート(ランソホフ(Ransohoff)(2004年))の90%に対して、トレーニングセットとの重複が一切ない。結論として、未治療LNN患者の約30〜40%しか腫瘍を再発しないため、予後診断シグネチャは、低リスクの患者を識別して相当数の患者における過剰医療を防止する強力なツールを提供することができる。原発乳癌患者の補助的全身療法の推奨は、将来は、この予後診断シグネチャが指針になるであろう。全身療法の様々な方式の有効性に対する我々の遺伝子シグネチャの予測値を、補助療法として、または転移疾患患者において試験することができる。
【0129】
例7
ステージI/IIの乳癌のバルク組織とレーザー・キャプチャー・マイクロダイセクションから得た乳癌遺伝子プロファイルの比較
遺伝子発現プロファイルは、様々な種類の癌において強力な診断および予後診断ツールであることが示されてきた。殆ど例外なく、バルク腫瘍RNAを用いてチップ上でハイブリダイゼーションさせる。ホルモン依存性腫瘍の発症および成長において、エストロゲンが重要な役割を果たしている。
【0130】
約75%の乳癌が、タモキシフェン療法(補助的)の指標であり、かつ患者の結果に関係するエストロゲン受容体(ER)を発現する。
【0131】
乳房上皮細胞およびこれに関連した腫瘍形成においてエストロゲンによって引き起こされる機構を洞察するために、レーザー・キャプチャー・マイクロダイセクション(LCM)を用いて、29人の早期原発乳房腫瘍の患者から腫瘍細胞の組織学的に均一な集団を採取し、ジーンチップ(GeneChip)発現分析を行った。これらの29人の患者の内、腫瘍のサイトゾルに対する量的リガンド結合またはエンザイムイムノアッセイに基づき、11人がER陰性、17人がER陽性であった。比較のために、同じ29人の患者のグループから単離したバルク組織RNAを用いて、遺伝子発現プロファイルも得た。
【0132】
新鮮凍結組織サンプルは、乳房腫瘍の外科的治療を受けたが、ネオアジュバント全身療法を受けていない29人のリンパ節陰性乳癌患者(腫瘍の特徴、表2)から採取されたものである。各患者の組織サンプルに対して、我々はまず、H&Eスライドを用いて細胞形態を評価した。クリオスタット部分に対してLCM(PALM)を行って得た腫瘍細胞と、全クリオスタット部分すなわち同じ腫瘍のバルク組織の両方からRNAを単離した。RNAサンプルの質を、アジレント・バイオアナライザー(Agilent BioAnalyzer)で分析した。このRNAサンプルを、約22,000のプローブセットを含むアフィメトリックス・ヒューマンU113Aチップ(Affymetrix human U133A chip)にハイブリダイズさせた。蛍光発光を定量して、強度を標準化した。クラスター化分析(Clustering Analysis)および主成分分析(Principal Component Analysis)を用いて、類似の遺伝子発現プロファイルで患者をグループ分けした。ER陽性サンプルとER陰性サンプルとの間で異なって発現する遺伝子を選択した。
【0133】
標的の調製において、LCMで採取した乳癌細胞から単離した全RNAは、T7を用いた増幅を2回行ったが、バルク組織RNAは1回しか増幅を行わなかった。21のコントロール遺伝子(表7)の発現レベルをLCMデータセットとバルク組織セットとの間で比較して、線形増幅の忠実性を実証した。
【表7】
得られた結果は、表8および図4〜図9に示した。
【表8】
【0134】
図4は、5121の遺伝子に基づいた階層クラスター化であり、LCMおよびバルク組織サンプルがグローバルRNA発現プロファイルに基づいて完全に分けられていることを示している。図5は、LCMサンプルおよびバルク組織から単離されたRNAにおける21のコントロール遺伝子(表6)の発現レベルを示す棒グラフであり、LCMによって得られたRNAに用いた追加の回の線形増幅がコントロール遺伝子の異なった発現を引き起こさなかったことを示している。図6は、データ分析経路であり、図7は、フィルタリングされた遺伝子セットを用いたPCA分析を示している。図8は、ER状態を用いて患者のサブグループを割り当てた円グラフである。LCMサンプルおよびバルク組織サンプルの両方において、ER陽性サブクラスターとER陰性サブクラスターとの間で異なって発現される遺伝子を、スチューデントのT検定で決定した。図9は、LCMサンプルのERだけ、バルク組織のERだけ、およびLCMおよびバルク組織の両方に共通のERに関連した遺伝子についてのジーンオントロジー(Gene Ontology)による経路分析の結果を示している一連の棒グラフである。
【0135】
簡単に述べると、得られた結果は、いくつかの重要な結論を示している。第1に、細胞増殖およびエネルギー代謝に関連した遺伝子は、バルク組織データセットとLCMデータセットの両方におけるER陰性/ER陽性患者で異なって発現することが分かった。第2に、LCMによる乳癌細胞の質が高まったため、細胞表面受容体連鎖シグナル伝達、RASシグナル伝達、JAK‐STATシグナル伝達、およびアポトーシスに関与する遺伝子がERの状態に関係することが分かった。これらの遺伝子は、バルクデータセットでは同定されなかった。第3に、マイクロダイセクションにより、上皮腫瘍細胞を検査する高感度法が可能になり、エストロゲン受容体に関連したシグナル伝達経路の洞察が可能となった。したがって、ここに記載する遺伝子発現プロファイルをLCM単離腫瘍細胞に利用することが、異なるバルク組織で得られる結果に見合っていることが明らかである。
【0136】
例8
乳癌における76‐遺伝子予後診断シグネチャの検証および経路分析
この例8では、76‐遺伝子シグネチャを用いて4つの異なる供給源から得た132人の患者の結果を予測する検証検査の結果を報告する。
【0137】
加えて、この遺伝子シグネチャのロバスト性を評価するために、この例8は、このシグネチャの代替可能な構成要素を同定し、このような代替物がいかに有効なシグネチャにおける重要な経路の同定につながるかを記載する。
【0138】
新鮮な凍結組織サンプルは、乳房腫瘍の外科的治療を受けたが、補助的全身療法を受けていない132人の患者から採取されたものである。使用する患者サンプルは、1980年〜1996年に採取されたものである(図10)。各患者の組織サンプルについて、H&Eスライドを用いて細胞形態を評価した。次に、全RNAサンプルを調製し、このサンプルの質を、アジレント・バイオアナライザー(Agilent BioAnalyzer)で分析した。このRNAサンプルは、マイクロアレイ分析でも分析した。蛍光発光を定量して、その強度を標準化した。再発ハザードスコアを、76‐遺伝子発現シグネチャの発現レベルに基づいて各患者について算出した。これらの患者を、結果が良好なグループと不良なグループに分けた。図11および図12を参照されたい。
【0139】
この遺伝子シグネチャのロバスト性を評価するために、2つの統計分析をデザインして使用した。図13を参照されたい。第1に、遺伝子の選択、そして76‐遺伝子シグネチャを見出すために用いたシグネチャ構築法を繰り返した。表8に示されているように、115人の患者の10のトレーニングセットはそれぞれ、合計286人の患者からランダムに選択した。残りの患者は、試験セットに利用した。
【0140】
第2に、トレーニングセットの患者の数は、286人の患者の80%に増大し、残りの20%の患者を試験セットに用いた。この選択法を10回繰り返した。両方の方法で、カプラン‐マイヤー生存曲線(Kaplan-Meier survival curves)を用いて、トレーニングセットと試験セットとの間には無疾患生存に有意差がないことを確認した。コックスの比例ハザード回帰を用いて、トレーニングセットのそれぞれから遺伝子を選択し、シグネチャを構築した。各シグネチャは、一致する試験セットで確認した。さらに、76‐遺伝子予後診断シグネチャを、GOオントロジー分類で複数の機能グループに割り当てた。このシグネチャの相当数の遺伝子を含む経路を選択した(p値<0.05、>2ヒット)。また、選択した経路は、異なるトレーニングセットに由来する全ての予後診断シグネチャで評価した。
【0141】
表9において、Aは、115人の患者のトレーニングセットを用いた10シグネチャからの結果を含み、Bは、患者の80%のトレーニングセットを用いた10シグネチャからの結果を含む。
【表9】
【0142】
この例から得た結果は以下のとおりである。
・76‐遺伝子シグネチャは、132人の別個の患者で検証に成功し、4つの異なる供給源からの132人のLNN乳癌患者で0.757のAUC値が得られた。このシグネチャは、88%の感受性、41%の特異性を示している。
・代替シグネチャの平均AUCは0.64(95%CI:0.53〜0.72)である。この結果は、76‐遺伝子予測因子の結果(AUC:0.69)と一致している。76‐遺伝子シグネチャで過度に表現された21の経路が、全ての他の予後診断シグネチャでも見出され、共通の生物学的経路が腫瘍の再発に関与していることを示唆している。
・これらの結果は、遺伝子発現プロファイルが患者の結果のリスク評価を行うための強力な方法を提供できることを示唆している。このデータは、患者の腫瘍再発を量的に測定する分子予後診断アッセイの実現性を明らかにしている。
【0143】
本発明は、理解し易いように例示および例を用いて詳細に説明してきたが、この説明および例は、本発明の範囲を限定すると解釈すべきではない。
【表10−1】
【表10−2】
【表10−3】
【表10−4】
【表10−5】
【表10−6】
【表10−7】
【表10−8】
【表10−9】
【表10−10】
【表10−11】
【表10−12】
【表11】
【0144】
参照文献
・アー(Ahr)ら著、「遺伝子発現プロファイリングによる高リスク乳癌患者の識別(Identification of high risk breast-cancer patients by gene-expression profiling)」、ランセット(Lancet)、2002年、359:131‐132
・チャン(Chang)ら著、「乳癌患者でドセタキセルに応答する治療薬の予測のための遺伝子発現プロファイリング(Gene expression profiling for the prediction of therapeutic response to docetaxel in patients with breast cancer)」、ランセット(Lancet)、2003年、362:362‐9
・早期乳癌被験者の共同研究グループ著、「早期乳癌の放射線治療および外科手術の効果:ランダムトライアルの概要(Effects of radiotherapy and surgery in early breast cancer: An overview of the randomized trials」」、ニューイングランド・ジャーナル・オブ・メディスン(N Engl J Med)、1995年、333:1444‐1455
・早期乳癌被験者の共同研究グループ著、「早期乳癌患者に対する多剤併用化学療法:無作為被験者の概要(Polychemotherapy for early breast cancer: an overview of the randomized trials)」、ランセット(Lancet)、1998年、352:930‐942
・早期乳癌被験者の共同研究グループ著、「早期乳癌患者に対するタモキシフェン:無作為被験者の概要(Tamoxifen for early breast cancer: an overview of randomized trials)」、ランセット(Lancet)、1998年、351:1451‐1467
・エフロン(Efron)著、「確認したデータおよびブートストラップ(Censored data and the bootstrap)」、ジャーナル・オブ・ザ・アメリカン・メディカル・アソシエーション(J Am Stat Assoc)、1981年、76:312‐319
・エイフェル(Eifel)ら著、「米国国立衛生研究所合意形成声明:乳癌患者に対する補助的療法、2000年、11月1〜3日(National Institutes of Health Consensus Development Conference Statement: adjuvant therapy for breast cancer, November 1-3,2000」」、ジャーナル・オブ・ザ・ナショナル・カンサー・インスティテュート(J Natl Cancer Inst)、2001年、93:979‐989
・フォーケンス(Foekens)ら著、「ヒト乳房腫瘍のサイトゾルでのエンザイムイムノアッセイによるエストロゲンおよびプロゲステロン受容体の予後診断値(Prognostic value of estrogen and progesterone receptors measured by enzyme immunoassays in human breast tumor cytosols)」、カンサー・リサーチ(Cancer Res)、1989年、49:5823‐5828
・フォーケンス(Foekens)ら著、「ヒト乳癌におけるインスリン様成長因子1、ソマトスタチン、および表皮成長因子の受容体の予後診断値(Prognostic value of receptors for insulin-like growth factor 1, somatostatin, and epidermal growth factor in human breast cancer)」、カンサー・リサーチ(Cancer Res)、1989年、49:7002‐7009
・ゴールドハーシュ(Goldhirsch)ら著、「会議のハイライト:早期乳癌の主治療に対する最新の各国専門家の合意(Meeting highlights: Updated International Expert Consensus on the Primary Therapy of Early Breast Cancer)」、ジャーナル・オブ・クリニカル・オンコロジー(J Clin Oncol)、2003年、21:3357‐3365
・ゴルブ(Golub)ら著、「癌の分子分類:遺伝子発現のモニタリングによるクラスの発見およびクラスの予測(Molecular classification of cancer: class discovery and class prediction by gene expression monitoring)」、サイエンス(Science)、1999年、286:531‐537
・グルーバーガー(Gruvberger)ら著、「乳癌のエストロゲン受容体の状態が顕著に異なる遺伝子発現パターンに関係している(Estrogen receptor status in breast cancer is associated with remarkably distinct gene expression patterns)」、カンサー・リサーチ(Cancer Res)、2001年、61:5979‐5984
・ヘデンフォーク(Hedenfalk)ら著、「遺伝性乳癌の遺伝子発現プロファイル(Gene-expression profiles in hereditary breast cancer)」、ニューイングランド・ジャーナル・オブ・メディスン(N Engl J Med)、2001年、344:539‐548
・ヘレラ‐ガイオル(Herrera-Gayol)ら著、「乳癌の生物学における接着タンパク質:CD44の寄与(Adhesion proteins in the biology of breast cancer: contribution of CD44)」、エクスペリメンタル・アンド・モレキュラー・パソロジー(Exp Mol Pathol)、1999年、66:149‐156
・フアング(Huang)ら著、「乳癌結果の遺伝子発現予測因子(Gene expression predictors of breast cancer outcomes)」、ランセット(Lancet)、2003年、361:1590‐1596
・カプラン(Kaplan)ら著、「不完全な観察の非パラメータ推定(Non-parametric estimation of incomplete observations)」、ジャーナル・オブ・ザ・アメリカン・メディカル・アソシエーション(J Am Stat Assoc)、1958年、53:457‐481
・キオマルシ(Keyomarsi)ら著、「乳癌患者におけるサイクリンEおよび生存(Cyclin E and survival in patients with breast cancer)」、ニューイングランド・ジャーナル・オブ・メディスン(N Engl J Med)、2002年、347:1566‐1575
・リプシュッツ(Lipshutz)ら著、「高密度合成オリゴヌクレオチドアレイ(High density synthetic oligonucleotide arrays)」、ネイチャー・ジェネティックス(Nat Genet)、1999年、21:20‐24
・マ(Ma)ら著、「ヒト乳癌進行の遺伝子発現プロファイル(Gene expression profiles of human breast cancer progression)」、プロシーディングス・オブ・ザ・ナショナル・アカデミー・オブ・サイエンシーズ・オブ・ザ・ユナイテッド・ステイツ・オブ・アメリカ(Proc Natl Acad Sci USA)、2003年、100:5974‐5979
・テゥザニ(Ntzani)ら著、「DNAマイクロアレイの癌の結果および相関性を予測する能力:経験的評価(Predictive ability of DNA microarrays for cancer outcomes and correlates: an empirical assessment)」、ランセット(Lancet)、2003年、362:1439‐1444
・ペロウ(Perou)ら著、「ヒト乳房腫瘍の分子ポートレート(Molecular portraits of human breast tumors)」、ネイチャー(Nature)、2000年、406:747‐752
・ラマズワミー(Ramaswamy)ら著、「腫瘍遺伝子発現シグネチャを用いたマルチクラス癌診断(Multiclass cancer diagnosis using tumor gene expression signatures)」、プロシーディングス・オブ・ザ・ナショナル・アカデミー・オブ・サイエンシーズ・オブ・ザ・ユナイテッド・ステイツ・オブ・アメリカ(Proc Natl Acad Sci USA)、2001年、98:15149‐15154
・ラマズワミー(Ramaswamy)ら著、「原発固形腫瘍の転移の分子シグネチャ(A molecular signature of metastasis in primary solid tumors)」、ネイチャー・ジェネティックス(Nat Genet)、2003年、33:1‐6
・ランソホフ(Ransohoff)著、「癌分子マーカーの発見および検証のための証拠法則(Rules of evidence for cancer molecular-marker discovery and validation)」、ネイチャー・リビュー・カンサー(Nat Rev Cancer)、2004年、4:309‐314
・ソーリー(Sorlie)ら著、「乳癌の遺伝子発現パターンが臨床上の意義で腫瘍をサブクラスに分類する(Gene expression patterns of breast carcinomas distinguish tumor subclasses with clinical implications)」、プロシーディングス・オブ・ザ・ナショナル・アカデミー・オブ・サイエンシーズ・オブ・ザ・ユナイテッド・ステイツ・オブ・アメリカ(Proc Natl Acad Sci USA)、2001年、98:10869‐10874
・ソーリー(Sorlie)ら著、「別個の遺伝子発現データセットで乳房腫瘍のサブタイプの反復観察(Repeated observation of breast tumor subtypes in independent gene expression data sets)」、プロシーディングス・オブ・ザ・ナショナル・アカデミー・オブ・サイエンシーズ・オブ・ザ・ユナイテッド・ステイツ・オブ・アメリカ(Proc Natl Acad Sci USA)、2003年、100:8418‐8423
・ソティリオウ(Sotiriou)ら著、「細針吸引に由来する遺伝子発現プロファイルは乳癌における全身化学療法に対する応答に相関する(Gene expression profiles derived from fine needle aspiration correlate with response to systemic chemotherapy in breast cancer)」、ブレスト・カンサー・リサーチ(Breast Cancer Res)、2003年、4:R3
・ソティリオウ(Sotiriou)ら著、「集団を用いた研究で得た遺伝子発現プロファイルに基づいた乳癌の分類および予後診断(Breast cancer classification and prognosis based on gene expression profiles from a population-based study)」、プロシーディングス・オブ・ザ・ナショナル・アカデミー・オブ・サイエンシーズ・オブ・ザ・ユナイテッド・ステイツ・オブ・アメリカ(Proc Natl Acad Sci USA)、2003年、100:10393‐10398
・スウ(Su)ら著、「遺伝子発現シグネチャを用いたヒト癌腫の分子分類(Molecular classification of human carcinomas by use of gene expression signatures)」、カンサー・リサーチ(Cancer Res)、2001年、61:7388‐7393
・ファン・デ・ビジュデール(van de Vijver)ら著、「乳癌における生存の予測因子としての遺伝子発現シグネチャ(A gene expression signature as a predictor of survival in breast cancer)」、ニューイングランド・ジャーナル・オブ・メディスン(N Engl J Med)、2002年、347:1999‐2009
・バン・ビール(van't Veer)ら著、「遺伝子発現プロファイルが乳癌の臨床結果を予測する(Gene expression profiling predicts clinical outcome of breast cancer)」、ネイチャー(Nature)、2002年、415:530‐536
・ワン(Wang)ら著、「デュークスB結腸癌の再発を予測する遺伝子発現プロファイルおよび分子マーカー(Gene expression profiles and molecular markers to predict recurrence of Dukes'B colon cancer)」、ジャーナル・オブ・クリニカル・オンコロジー(J Clin Oncol)、2004年、22:1564‐1571
・ヲルフェル(Woelfle)ら著、「ヒト乳癌における骨髄微小転移に関連した分子シグネチャ(Molecular signature associated with bone marrow micrometastasis in human breast cancer)」、カンサー・リサーチ(Cancer Res)、2003年、63:5679‐5684
【0145】
〔実施の態様〕
(1)乳癌の状態を評価するための方法において、
(a)乳癌患者から生体サンプルを得るステップと、
(b)(i)配列番号1‐111に一致する、または、
(ii)表10に示されている配列番号1‐111に一致するpsidsからなる群から選択されるプローブセットによって認識される、
mRNAをコード化する遺伝子からなる群から選択される遺伝子の前記サンプルにおける発現レベルを測定するステップと、
を含み、
所定のカットオフレベルよりも高いまたは低い前記遺伝子発現レベルが、乳癌の状態を示唆している、
方法。
(2)乳癌患者のステージを求めるための方法において、
(a)乳癌患者から生体サンプルを得るステップと、
(b)(i)配列番号1‐111に一致する、または、
(ii)表10に示されている配列番号1‐111に一致するpsidsからなる群から選択されるプローブセットによって認識される、
mRNAをコード化する遺伝子からなる群から選択される遺伝子の前記サンプルにおける発現レベルを測定するステップと、
を含み、
所定のカットオフレベルよりも高いまたは低い前記遺伝子発現レベルが、乳癌のステージを示唆している、
方法。
(3)実施態様(2)に記載の方法において、
前記ステージが、TNMシステムによる分類に一致する、方法。
(4)実施態様(2)に記載の方法において、
前記ステージが、類似の遺伝子発現プロファイルを有する患者に一致する、方法。
(5)乳癌患者の治療プロトコルを決定するための方法において、
(a)乳癌患者から生体サンプルを得るステップと、
(b)(i)配列番号1‐111に一致する、または、
(ii)表10に示されている配列番号1‐111に一致するpsidsからなる群から選択されるプローブセットによって認識される、
mRNAをコード化する遺伝子からなる群から選択される遺伝子の前記サンプルにおける発現レベルを測定するステップと、
を含み、
所定のカットオフレベルよりも高いまたは低い前記遺伝子発現レベルが、再発を防止するために推奨される療法の程度および種類を医師が決定できるように再発のリスクを十分に示唆している、
方法。
【0146】
(6)乳癌患者を治療するための方法において、
(a)乳癌患者から生体サンプルを得るステップと、
(b)(i)配列番号1‐111に一致する、または、
(ii)表10に示されている配列番号1‐111に一致するpsidsからなる群から選択されるプローブセットによって認識される、
mRNAをコード化する遺伝子からなる群から選択される遺伝子の前記サンプルにおける発現レベルを測定するステップと、
を含み、
所定のカットオフレベルよりも高いまたは低い前記遺伝子発現レベルが、再発の高いリスクを示唆している、
方法。
(7)実施態様(1)、(2)、(5)、または(6)に記載の方法において、
前記配列番号が1‐35である、方法。
(8)実施態様(1)、(2)、(5)、または(6)に記載の方法において、
前記配列番号が36‐95である、方法。
(9)ER陽性患者に予後診断を提供するために用いる実施態様(8)に記載の方法。
(10)実施態様(1)、(2)、(5)、または(6)に記載の方法において、
前記配列番号が96‐111である、方法。
【0147】
(11)ER陰性患者に予後診断を提供するために用いる実施態様(10)に記載の方法。
(12)実施態様(1)、(2)、(5)、または(6)に記載の方法において、
前記配列番号が36‐111である、方法。
(13)実施態様(1)、(2)、(5)、または(6)に記載の方法において、
前記サンプルを、バルク組織の用意およびレーザー・キャプチャー・マイクロダイセクションからなる群から選択される方法によって用意する、方法。
(14)実施態様(13)に記載の方法において、
前記バルク組織の用意を、生検または外科的試料から行う、方法。
(15)実施態様(1)、(2)、(5)、または(6)に記載の方法において、
(i)配列番号112‐132に一致する、または、
(ii)表10に示されている配列番号112‐132に一致するpsidsからなる群から選択されるプローブセットによって認識される、
mRNAをコード化する少なくとも1つの遺伝子の発現レベルを測定するステップをさらに含む、
方法。
【0148】
(16)実施態様(1)、(2)、(5)、または(6)に記載の方法において、
前記サンプルで構成的に発現している少なくとも1つの遺伝子の発現ベルを測定するステップをさらに含む、方法。
(17)実施態様(1)、(2)、(5)、または(6)に記載の方法において、
前記サンプルのエストロゲン受容体(ER)の状態を決定するステップをさらに含む、方法。
(18)実施態様(17)に記載の方法において、
前記ERの状態を、ERの状態を示唆する少なくとも1つの遺伝子の発現レベルの測定によって決定する、方法。
(19)実施態様(17)に記載の方法において、
前記ERの状態を、前記サンプルにおけるERの存在の測定によって決定する、方法。
(20)実施態様(19)に記載の方法において、
前記ERの存在を、免疫組織化学的に測定する、方法。
【0149】
(21)実施態様(1)、(2)、(5)、または(6)に記載の方法において、
前記サンプルを原発腫瘍から得る、方法。
(22)実施態様(1)、(2)、(5)、または(6)に記載の方法において、
特異性が、少なくとも約40%である、方法。
(23)実施態様(1)、(2)、(5)、または(6)に記載の方法において、
感受性が、少なくとも約90%である、方法。
(24)実施態様(1)、(2)、(5)、または(6)に記載の方法において、
前記遺伝子の発現パターンを、再発患者を示唆する発現パターンと比較する、方法。
(25)実施態様(24)に記載の方法において、
前記発現パターンの比較を、パターン認識法を用いて行う、方法。
【0150】
(26)実施態様(25)に記載の方法において、
前記パターン認識法が、コックスの比例ハザード分析(Cox's proportional hazards analysis)の使用を含む、方法。
(27)実施態様(1)、(2)、(5)、または(6)に記載の方法において、
前記所定のカットオフレベルが、良性細胞または正常組織に対して、前記サンプルで少なくとも1.5倍多い、または1.5倍少ない発現である、方法。
(28)実施態様(1)、(2)、(5)、または(6)に記載の方法において、
前記所定のカットオフレベルが、良性細胞または正常組織に対して、転移細胞を有する前記サンプルで少なくとも統計的に有意なp値の過剰発現を有する、方法。
(29)実施態様(28)に記載の方法において、
前記p値が0.05未満である、方法。
(30)実施態様(1)、(2)、(5)、または(6)に記載の方法において、
遺伝子発現を、マイクロアレイまたは遺伝子チップ上で測定する、方法。
【0151】
(31)実施態様(21)に記載の方法において、
前記マイクロアレイが、cDNAアレイまたはオリゴヌクレオチドアレイである、方法。
(32)実施態様(21)に記載の方法において、
前記マイクロアレイまたは遺伝子チップが、1または複数の内部コントロール試薬をさらに含む、方法。
(33)実施態様(1)、(2)、(5)、または(6)に記載の方法において、
遺伝子発現を、前記サンプルから抽出したRNAのポリメラーゼ連鎖反応(PCR)による核酸増幅によって決定する、方法。
(34)実施態様(33)に記載の方法において、
前記PCRが、逆転写ポリメラーゼ連鎖反応(RT‐PCR)である、方法。
(35)実施態様(34)に記載の方法において、
前記RT‐PCRが、1または複数の内部コントロール試薬をさらに含む、方法。
【0152】
(36)実施態様(1)、(2)、(5)、または(6)に記載の方法において、
遺伝子発現を、前記遺伝子によってコード化されるタンパク質の測定または検出によって検知する、方法。
(37)実施態様(36)に記載の方法において、
前記タンパク質を、前記タンパク質に特異的な抗体によって検出する、方法。
(38)実施態様(1)、(2)、(5)、または(6)に記載の方法において、
遺伝子発現を、前記遺伝子の特徴を測定して検出する、方法。
(39)実施態様(38)に記載の方法において、
測定する前記特徴を、DNA増幅、メチル化、突然変異、および対立遺伝子変異体からなる群から選択する、方法。
(40)乳癌患者の予後診断遺伝子発現プロファイルを交差検証するための方法において、
(a)統計的に有意な数の患者の生体サンプルから遺伝子発現データを得るステップと、
(b)サンプルの順番をランダムにするステップと、
(c)10%〜50%のサンプルからのデータを除外するステップと、
(d)残りのサンプルに対して、全ての変数について目的の因子を計算して、p値カットオフ(p)を満たす変数を選択するステップと、
(e)前方検索を用いて予測モデルに適合する変数を選択し、所定の誤差率になるまでトレーニング誤差(training error)を評価するステップと、
(f)残りの10%〜50%のサンプルに対して前記予測モデルを試験するステップと、
(g)除外したサンプルの新しいセットでステップ(c)‐(f)を繰り返すステップと、
(h)サンプルの100%の試験が終わるまでステップ(c)‐(g)を繰り返して、分類結果を記録するステップと、
を含む、方法。
【0153】
(41)実施態様(40)に記載の方法において、
前記ステップ(h)で得た前記遺伝子発現データが、
(i)配列番号3、4、10、18、37、40、42、43、45、55、58、64、67、72‐74、76、81、85‐86、89、97、100‐101、110‐111、125、および132‐442、または2、3、5、12、20、25、36、37、39、40、41、42、43、45、46、51、52、53、54、55、57、58、59、60、61、62、63、64、66、67、69、70、72、73、74、76、80、81、83、84、85、86、87、88、89、90、94、97、98、101、102、104、107、110、111、132、139、142、150、151、153、154、158、161、163、167、170、171、173、175、181、182、183、186、188、190、192、204、206、207、212、215、218、221、223、225、228、231、232、236、238、239、240、241、242、243、246、248、249、255、257、267、269、270、271、273、280、281、282、288、290、291、299、301、304、306、311、314、315、318、327、328、338、342、346、348、354、366、368、371、375、385、388、391、395、397、402、405、409、422、424、428、429、435、436、440、651、および443‐650に一致する、
または(ii)表10に示されている配列番号3、4、10、18、37、40、42、43、45、55、58、64、67、72‐74、76、81、85‐86、89、97、100‐101、110‐111、125、および132‐442、または2、3、5、12、20、25、36、37、39、40、41、42、43、45、46、51、52、53、54、55、57、58、59、60、61、62、63、64、66、67、69、70、72、73、74、76、80、81、83、84、85、86、87、88、89、90、94、97、98、101、102、104、107、110、111、132、139、142、150、151、153、154、158、161、163、167、170、171、173、175、181、182、183、186、188、190、192、204、206、207、212、215、218、221、223、225、228、231、232、236、238、239、240、241、242、243、246、248、249、255、257、267、269、270、271、273、280、281、282、288、290、291、299、301、304、306、311、314、315、318、327、328、338、342、346、348、354、366、368、371、375、385、388、391、395、397、402、405、409、422、424、428、429、435、436、440、651、および443‐650に一致するpsidsからなる群から選択されるプローブセットによって認識される、
mRNAをコード化する遺伝子からなる群から選択される遺伝子によって表される、
方法。
(42)乳癌患者の予後診断遺伝子発現プロファイルを単独で検証する方法において、
(a)統計的に有意な数の患者の生体サンプルから遺伝子発現データを得るステップと、
(b)前記遺伝子発現データにおける供給源によるばらつき(source variabilities)を標準化するステップと、
(c)既に選択されている全ての変数について目的の因子を計算するステップと、
(d)前記サンプルに対して予測モデルを試験して分類結果を記録するステップと、
を含む、方法。
(43)実施態様(42)に記載の方法において、
前記ステップ(d)で得た遺伝子データが、
(i)配列番号3、4、10、18、37、40、42、43、45、55、58、64、67、72‐74、76、81、85‐86、89、97、100‐101、110‐111、125、および132‐442、または2、3、5、12、20、25、36、37、39、40、41、42、43、45、46、51、52、53、54、55、57、58、59、60、61、62、63、64、66、67、69、70、72、73、74、76、80、81、83、84、85、86、87、88、89、90、94、97、98、101、102、104、107、110、111、132、139、142、150、151、153、154、158、161、163、167、170、171、173、175、181、182、183、186、188、190、192、204、206、207、212、215、218、221、223、225、228、231、232、236、238、239、240、241、242、243、246、248、249、255、257、267、269、270、271、273、280、281、282、288、290、291、299、301、304、306、311、314、315、318、327、328、338、342、346、348、354、366、368、371、375、385、388、391、395、397、402、405、409、422、424、428、429、435、436、440、651、および443‐650に一致する、
または(ii)表10に示されている配列番号3、4、10、18、37、40、42、43、45、55、58、64、67、72‐74、76、81、85‐86、89、97、100‐101、110‐111、125、および132‐442、または2、3、5、12、20、25、36、37、39、40、41、42、43、45、46、51、52、53、54、55、57、58、59、60、61、62、63、64、66、67、69、70、72、73、74、76、80、81、83、84、85、86、87、88、89、90、94、97、98、101、102、104、107、110、111、132、139、142、150、151、153、154、158、161、163、167、170、171、173、175、181、182、183、186、188、190、192、204、206、207、212、215、218、221、223、225、228、231、232、236、238、239、240、241、242、243、246、248、249、255、257、267、269、270、271、273、280、281、282、288、290、291、299、301、304、306、311、314、315、318、327、328、338、342、346、348、354、366、368、371、375、385、388、391、395、397、402、405、409、422、424、428、429、435、436、440、651、および443‐650に一致するpsidsからなる群から選択されるプローブセットによって認識される、
mRNAをコード化する遺伝子からなる群から選択される遺伝子によって表される、
方法。
(44)実施態様(42)または(43)に記載の方法によって得る遺伝子プロファイル。
(45)乳癌患者の予後診断を可能にする再発ハザードスコア(Relapse Hazard Score)を生成する方法において、
(a)統計的に有意な数の患者の生体サンプルから遺伝子発現データを得るステップと、
(b)前記データに対してコックスの単変量回帰分析(univariate Cox's regression analysis)を適用して選択遺伝子を得るステップと、
(c)標準コックス係数(standard Cox's coefficients)を用いて前記選択遺伝子に重み付けした発現レベルを適用して、再発ハザードスコアとして適用されうる予測モデルを得るステップと、
を含む、方法。
【0154】
(46)実施態様(38)に記載の方法において、
前記再発ハザードスコアを以下の式を用いて求める、方法。
【数3】
但し、
I=1(X遺伝子レベル>10fmol/mgタンパク質の場合)または0(X遺伝子レベル≦10fmol/mgタンパク質の場合)、
AおよびBは定数、
wiは、X遺伝子+マーカーに対する標準化されたコックスの回帰係数、
xiは、ER+マーカーの発現値(log2のスケール)、
wjは、X遺伝子−マーカーに対する標準化されたコックスの回帰係数、
xjは、ER−マーカーの発現値(log2のスケール)、
X遺伝子は、
(i)配列番号1‐111に一致する、または、
(ii)表10に示されている配列番号1‐111に一致するpsidsからなる群から選択されるプローブセットによって認識される、
mRNAをコード化する遺伝子からなる群から選択される。
(47)乳癌予後診断患者レポートを作成する方法において、
(a)患者から生体サンプルを得るステップと、
(b)前記サンプルの遺伝子発現を測定するステップと、
(c)前記ステップ(b)の結果に対して再発ハザードスコア(Relapse Hazard Score)を適用するステップと、
(d)前記ステップ(c)で得た前記結果を用いて前記レポートを作成するステップと、
を含む、方法。
(48)実施態様(47)に記載の方法において、
前記レポートが、患者集団に対するリスクの可能性および/または患者の結果の評価を含む、方法。
(49)実施態様(47)に記載の方法で作成される患者レポート。
(50)組成物において、
(i)配列番号1‐111、または、
(ii)表10に示されている配列番号1‐111に一致するpsids、
からなる群から選択される少なくとも1つのプローブセットを含む、
組成物。
【0155】
(51)生体サンプルにおいて乳癌の予後診断を決定するアッセイを行うためのキットにおいて、
(i)配列番号1‐111に一致する、または、
(ii)表10に示されている配列番号1‐111に一致するpsidsからなる群から選択されるプローブセットによって認識される、
mRNAをコード化する遺伝子からなる群から選択される遺伝子の組合せの単離された核酸配列、それら核酸配列の補完物、またはそれら核酸配列の一部を検出するための物質、
を含む、キット。
(52)実施態様(51)に記載のキットにおいて、
前記配列番号が36‐95である、キット。
(53)実施態様(51)に記載のキットにおいて、
前記配列番号が96‐111である、キット。
(54)実施態様(51)に記載のキットにおいて、
前記配列番号が36‐111である、キット。
(55)実施態様(51)に記載のキットにおいて、
マイクロアレイ分析を行うための試薬をさらに含む、キット。
【0156】
(56)実施態様(51)に記載のキットにおいて、
前記核酸配列、それら核酸配列の補完物、またはそれら核酸配列の一部をアッセイする媒体をさらに含む、方法。
(57)乳癌の状態を評価するための物品において、
(i)配列番号1‐111に一致する、または、
(ii)表10に示されている配列番号1‐111に一致するpsidsからなる群から選択されるプローブセットによって認識される、
mRNAをコード化する遺伝子からなる群から選択される遺伝子の組合せの単離された核酸配列、それら核酸配列の補完物、またはそれら核酸配列の一部を検出するための物質、
を含む、物品。
(58)実施態様(57)に記載の物品において、
前記配列番号が36‐95である、物品。
(59)実施態様(57)に記載の物品において、
前記配列番号が96‐111である、物品。
(60)実施態様(57)に記載の物品において、
前記配列番号が36‐111である、物品。
【0157】
(61)実施態様(57)に記載の物品において、
マイクロアレイ分析を行うための試薬をさらに含む、物品。
(62)実施態様(57)に記載の物品において、
前記核酸配列、それら核酸配列の補完物、またはそれら核酸配列の一部をアッセイする媒体をさらに含む、物品。
(63)実施態様(1)、(2)、(5)、または(6)に記載の方法を実施するためのマイクロアレイまたは遺伝子チップ。
(64)実施態様(63)に記載のマイクロアレイにおいて、
(i)配列番号1‐111に一致する、または、
(ii)表10に示されている配列番号1‐111に一致するpsidsからなる群から選択されるプローブセットによって認識される、
mRNAをコード化する遺伝子からなる群から選択される遺伝子の組合せの単離された核酸配列、それら核酸配列の補完物、またはそれら核酸配列の一部、
を含み、
前記遺伝子の組合せが、生体サンプルにおける乳癌の状態または再発のリスクを特徴付けるのに十分である、
マイクロアレイ。
(65)実施態様(63)に記載のマイクロアレイにおいて、
測定または特徴付けが、少なくとも1.5倍の過剰発現または1.5倍少ない過少発現である、マイクロアレイ。
【0158】
(66)実施態様(63)に記載のマイクロアレイにおいて、
測定により、統計的に有意なp値の過剰発現または過少発現が得られる、マイクロアレイ。
(67)実施態様(63)に記載のマイクロアレイにおいて、
前記p値が0.05未満である、マイクロアレイ。
(68)実施態様(63)に記載のマイクロアレイにおいて、
cDNAアレイまたはオリゴヌクレオチドアレイを含む、マイクロアレイ。
(69)実施態様(63)に記載のマイクロアレイにおいて、
1または複数の内部コントロール試薬をさらに含む、マイクロアレイ。
(70)診断/予後診断ポートフォリオにおいて、
(i)配列番号1‐111に一致する、または、
(ii)表10に示されている配列番号1‐111に一致するpsidsからなる群から選択されるプローブセットによって認識される、
mRNAをコード化する遺伝子からなる群から選択される遺伝子の組合せの単離された核酸配列、それら核酸配列の相補配列、またはそれら核酸配列の一部、
を含み、
前記遺伝子の組合せが、生体サンプルにおける乳癌の状態または再発のリスクを特徴付けるのに十分である、
診断/予後診断ポートフォリオ。
【0159】
(71)実施態様(70)に記載のポートフォリオにおいて、
測定または特徴付けが、少なくとも1.5倍の過剰発現または1.5倍少ない過少発現である、ポートフォリオ。
(72)実施態様(70)に記載のポートフォリオにおいて、
測定により、統計的に有意なp値の過剰発現または過少発現が得られる、ポートフォリオ。
(73)実施態様(70)に記載のポートフォリオにおいて、
前記p値が0.05未満である、ポートフォリオ。
【図面の簡単な説明】
【0160】
【図1】分析のためのサンプルの選択の外観図、および286人のリンパ節陰性(LNN)乳癌患者の遺伝子発現データの監視されていないクラスター化分析を示している。Aは、分析のための患者のサンプルの選択のフローチャートである。ERの状態を用いて、患者のサブグループを特定した。次に、各サブグループは、マーカーを選択するために別々に分析した。サブグループの患者に、トレーニングセットまたは試験セットを割り当てた。各サブグループから選択されたマーカーを結合して、1つのシグネチャを形成し、全体として試験セットの全ての患者の腫瘍再発を予測する。Bは、286人のLNN乳癌患者の遺伝子発現データの監視されていないクラスター化分析である。左側のグラフは、17,819の情報価値のある遺伝子を示している。赤は、高い相対発現を示し、緑は、低い相対発現を示している。各列はサンプルであり、各行は遺伝子である。右のグラフは、2つの患者のサブグループ間で著しく異なって発現する、左のグラフから同定された2つの優勢な遺伝子クラスターの拡大図を示している。上側の遺伝子クラスターは、ER陽性サブグループで282のダウンレギュレートされた遺伝子のグループを有する。下側の遺伝子クラスターは、ER陽性サブグループで339のアップレギュレートされた遺伝子のグループによって表される。各樹状図の下部のラベルバーは、通常のアッセイによって測定される患者のERの状態を示唆している。
【図2】76‐遺伝子プロファイルの樹立、および無遠隔転移(DMFS)および全生存(OS)に対するカプランマイヤー分析を示すグラフである。Aは、予後診断シグネチャの遺伝子の選択を示している。ER陽性グループおよびER陰性グループに対する遺伝子マーカーを、ROC分析を用いて2つのトレーニングセットから選択した。60の遺伝子がER陽性グループから、16の遺伝子がER陰性グループからであり(左側のグラフ)、試験セットの171人の患者の分析から得た76‐遺伝子シグネチャのROC曲線である(右側のグラフ)。Bは、171人のLNN患者の検証セットにおけるDMFS分析(左側のグラフ)およびOS分析(右側のグラフ)を示している。各患者の失敗のリスクは、76‐遺伝子シグネチャに基づいて評価し、閾値は、トレーニングセットによって決定した。差を調べるためにログランク検定を用いた。
【図3】LNN患者のサブグループにおけるDMFS分析およびOS分析を示している。84人の閉経前の患者(A)、87人の閉経後の患者(B)、腫瘍の大きさが10〜20mmの79人の患者(C)におけるDMFS分析(左側のグラフ)およびOS分析(右側のグラフ)を示している。結果は、検証セットの個々の患者からである。各患者の再発リスクは、76‐遺伝子シグネチャに基づいて評価し、閾値は、トレーニングセットによって決定した。差を調べるためにログランク検定を用いた。
【図4】5121の遺伝子に基づいた階層クラスター化を示すグラフである。
【図5】21のコントロール遺伝子(表7を参照)の発現レベルを示す棒グラフである。
【図6】データ分析のフローチャートである。
【図7】フィルタリングされた遺伝子セットを用いたPCA分析を示すグラフである。
【図8】患者をサブグループに割り当てるために用いるERの状態を表す円グラフである。LCMおよびバルク組織サンプルの両方でER陽性サブクラスターとER陰性サブクラスターとの間で異なって発現される遺伝子をスチューデントのT検定で決定した。
【図9】LCMサンプルだけ、バルク組織だけ、およびLCMとバルク組織の両方に共通である、ERに関連した遺伝子についてのジーンオントロジー(Gene Ontology)による経路分析の結果を示している一連の棒グラフである。
【図10】独立した検証の結果を示すフローチャートである。このフローチャートは、132人の患者が4つの異なる供給源で集められたことを示している。再発ハザードスコアを、76‐遺伝子シグネチャの発現レベルに基づいて各患者に対して計算した。患者を、良好な結果のグループと不良な結果のグループに分類した。
【図11】検証検査のための患者および患者の腫瘍の臨床的および病理的特徴を示す表(A)と、検証検査における76‐遺伝子シグネチャのROC曲線を示すグラフ(B)である。
【図12】検証検査における132人の患者の分類結果を示す表(A)およびグラフ(B)である。予測された良好な結果のグループと不良な結果のグループに対するカプランマイヤー生存曲線およびログランク検定をグラフ(B)に示している。
【図13】経路分析の結果を示すフローチャートである。このフローチャートは、統計的分析のためにサンプルを選択するために用いる方法を示している。Aでは、286人の患者を115人の患者のトレーニングセットおよび試験セットにランダムに分けている。Bでは、286人の患者を、患者の80%をトレーニングセット、患者の20%を試験セットにランダムに分けている。トレーニングセットは、遺伝子マーカーの選択および予後診断シグネチャの作成に用いた。試験セットは、検証に用いた。両方の手順を10回繰り返した。
【図14】GOオントロジー分析の概要を示すグラフである。各バーは、76‐遺伝子シグネチャで有意に過剰に表された経路を示している(p<0.05)。代替のシグネチャの結果から標準偏差を計算した。Aは、115人の患者のトレーニングセットを用いた10のシグネチャからの結果を示している。Bは、患者の80%のトレーニングセットを用いた10のシグネチャからの結果を示している。
【特許請求の範囲】
【請求項1】
乳癌の状態を評価するための方法において、
(a)乳癌患者から生体サンプルを得るステップと、
(b)(i)配列番号1‐111に一致する、または、
(ii)表10に示されている配列番号1‐111に一致するpsidsからなる群から選択されるプローブセットによって認識される、
mRNAをコード化する遺伝子からなる群から選択される遺伝子の前記サンプルにおける発現レベルを測定するステップと、
を含み、
所定のカットオフレベルよりも高いまたは低い前記遺伝子発現レベルが、乳癌の状態を示唆している、
方法。
【請求項2】
乳癌患者のステージを求めるための方法において、
(a)乳癌患者から生体サンプルを得るステップと、
(b)(i)配列番号1‐111に一致する、または、
(ii)表10に示されている配列番号1‐111に一致するpsidsからなる群から選択されるプローブセットによって認識される、
mRNAをコード化する遺伝子からなる群から選択される遺伝子の前記サンプルにおける発現レベルを測定するステップと、
を含み、
所定のカットオフレベルよりも高いまたは低い前記遺伝子発現レベルが、乳癌のステージを示唆している、
方法。
【請求項3】
乳癌患者の治療プロトコルを決定するための方法において、
(a)乳癌患者から生体サンプルを得るステップと、
(b)(i)配列番号1‐111に一致する、または、
(ii)表10に示されている配列番号1‐111に一致するpsidsからなる群から選択されるプローブセットによって認識される、
mRNAをコード化する遺伝子からなる群から選択される遺伝子の前記サンプルにおける発現レベルを測定するステップと、
を含み、
所定のカットオフレベルよりも高いまたは低い前記遺伝子発現レベルが、再発を防止するために推奨される療法の程度および種類を医師が決定できるように再発のリスクを十分に示唆している、
方法。
【請求項4】
乳癌患者を治療するための方法において、
(a)乳癌患者から生体サンプルを得るステップと、
(b)(i)配列番号1‐111に一致する、または、
(ii)表10に示されている配列番号1‐111に一致するpsidsからなる群から選択されるプローブセットによって認識される、
mRNAをコード化する遺伝子からなる群から選択される遺伝子の前記サンプルにおける発現レベルを測定するステップと、
を含み、
所定のカットオフレベルよりも高いまたは低い前記遺伝子発現レベルが、再発の高いリスクを示唆している、
方法。
【請求項5】
乳癌患者の予後診断遺伝子発現プロファイルを交差検証するための方法において、
(a)統計的に有意な数の患者の生体サンプルから遺伝子発現データを得るステップと、
(b)サンプルの順番をランダムにするステップと、
(c)10%〜50%のサンプルからのデータを除外するステップと、
(d)残りのサンプルに対して、全ての変数について目的の因子を計算して、p値カットオフ(p)を満たす変数を選択するステップと、
(e)前方検索を用いて予測モデルに適合する変数を選択し、所定の誤差率になるまでトレーニング誤差(training error)を評価するステップと、
(f)残りの10%〜50%のサンプルに対して前記予測モデルを試験するステップと、
(g)除外したサンプルの新しいセットでステップ(c)‐(f)を繰り返すステップと、
(h)サンプルの100%の試験が終わるまでステップ(c)‐(g)を繰り返して、分類結果を記録するステップと、
を含む、方法。
【請求項6】
乳癌患者の予後診断遺伝子発現プロファイルを単独で検証する方法において、
(a)統計的に有意な数の患者の生体サンプルから遺伝子発現データを得るステップと、
(b)前記遺伝子発現データにおける供給元によるばらつき(source variabilities)を標準化するステップと、
(c)既に選択されている全ての変数について目的の因子を計算するステップと、
(d)前記サンプルに対して予測モデルを試験して分類結果を記録するステップと、
を含む、方法。
【請求項7】
乳癌患者の予後診断を可能にする再発ハザードスコア(Relapse Hazard Score)を生成する方法において、
(a)統計的に有意な数の患者の生体サンプルから遺伝子発現データを得るステップと、
(b)前記データに対してコックスの単変量回帰分析(univariate Cox's regression analysis)を適用して選択遺伝子を得るステップと、
(c)標準コックス係数(standard Cox's coefficients)を用いて前記選択遺伝子に重み付けした発現レベルを適用して、再発ハザードスコアとして適用されうる予測モデルを得るステップと、
を含む、方法。
【請求項8】
乳癌予後診断患者レポートを作成する方法において、
(a)患者から生体サンプルを得るステップと、
(b)前記サンプルの遺伝子発現を測定するステップと、
(c)前記ステップ(b)の結果に対して再発ハザードスコア(Relapse Hazard Score)を適用するステップと、
(d)前記ステップ(c)で得た前記結果を用いて前記レポート作成するステップと、
を含む、方法。
【請求項9】
組成物において、
(i)配列番号1‐111、または、
(ii)表10に示されている配列番号1‐111に一致するpsids、
からなる群から選択される少なくとも1つのプローブセットを含む、
組成物。
【請求項10】
生体サンプルにおいて乳癌の予後診断を決定するアッセイを行うためのキットにおいて、
(i)配列番号1‐111に一致する、または、
(ii)表10に示されている配列番号1‐111に一致するpsidsからなる群から選択されるプローブセットによって認識される、
mRNAをコード化する遺伝子からなる群から選択される遺伝子の組合せの単離された核酸配列、それら核酸配列の補完物、またはそれら核酸配列の一部を検出するための物質、
を含む、キット。
【請求項11】
請求項10に記載のキットにおいて、
前記配列番号が36‐95である、キット。
【請求項12】
請求項10に記載のキットにおいて、
前記配列番号が96‐111である、キット。
【請求項13】
請求項10に記載のキットにおいて、
前記配列番号が36‐111である、キット。
【請求項14】
請求項10に記載のキットにおいて、
マイクロアレイ分析を行うための試薬をさらに含む、キット。
【請求項15】
請求項10に記載のキットにおいて、
前記核酸配列、それら核酸配列の補完物、またはそれら核酸配列の一部をアッセイする媒体をさらに含む、方法。
【請求項16】
乳癌の状態を評価するための物品において、
(i)配列番号1‐111に一致する、または、
(ii)表10に示されている配列番号1‐111に一致するpsidsからなる群から選択されるプローブセットによって認識される、
mRNAをコード化する遺伝子からなる群から選択される遺伝子の組合せの単離された核酸配列、それら核酸配列の補完物、またはそれら核酸配列の一部を検出するための物質、
を含む、物品。
【請求項17】
請求項16に記載の物品において、
前記配列番号が36‐95である、物品。
【請求項18】
請求項16に記載の物品において、
前記配列番号が96‐111である、物品。
【請求項19】
請求項16に記載の物品において、
前記配列番号が36‐111である、物品。
【請求項20】
請求項16に記載の物品において、
マイクロアレイ分析を行うための試薬をさらに含む、物品。
【請求項21】
請求項16に記載の物品において、
前記核酸配列、それら核酸配列の補完物、またはそれら核酸配列の一部をアッセイする媒体をさらに含む、物品。
【請求項22】
請求項1、2、3、または4に記載の方法を実施するためのマイクロアレイまたは遺伝子チップ。
【請求項23】
請求項22に記載のマイクロアレイにおいて、
(i)配列番号1‐111に一致する、または、
(ii)表10に示されている配列番号1‐111に一致するpsidsからなる群から選択されるプローブセットによって認識される、
mRNAをコード化する遺伝子からなる群から選択される遺伝子の組合せの単離された核酸配列、それら核酸配列の補完物、またはそれら核酸配列の一部、
を含み、
前記遺伝子の組合せが、生体サンプルにおける乳癌の状態または再発のリスクを特徴付けるのに十分である、
マイクロアレイ。
【請求項24】
請求項22に記載のマイクロアレイにおいて、
測定または特徴付けが、少なくとも1.5倍の過剰発現または1.5倍少ない過少発現である、マイクロアレイ。
【請求項25】
請求項22に記載のマイクロアレイにおいて、
測定により、統計的に有意なp値の過剰発現または過少発現が得られる、マイクロアレイ。
【請求項26】
請求項22に記載のマイクロアレイにおいて、
前記p値が0.05未満である、マイクロアレイ。
【請求項27】
請求項22に記載のマイクロアレイにおいて、
cDNAアレイまたはオリゴヌクレオチドアレイを含む、マイクロアレイ。
【請求項28】
請求項22に記載のマイクロアレイにおいて、
1または複数の内部コントロール試薬をさらに含む、マイクロアレイ。
【請求項29】
診断/予後診断ポートフォリオにおいて、
(i)配列番号1‐111に一致する、または、
(ii)表10に示されている配列番号1‐111に一致するpsidsからなる群から選択されるプローブセットによって認識される、
mRNAをコード化する遺伝子からなる群から選択される遺伝子の組合せの単離された核酸配列、それら核酸配列の補完物、またはそれら核酸配列の一部、
を含み、
前記遺伝子の組合せが、生体サンプルにおける乳癌の状態または再発のリスクを特徴付けるのに十分である、
診断/予後診断ポートフォリオ。
【請求項30】
請求項29に記載のポートフォリオにおいて、
測定または特徴付けが、少なくとも1.5倍の過剰発現または1.5倍少ない過少発現である、ポートフォリオ。
【請求項31】
請求項29に記載のポートフォリオにおいて、
測定により、統計的に有意なp値の過剰発現または過少発現が得られる、ポートフォリオ。
【請求項32】
請求項29に記載のポートフォリオにおいて、
前記p値が0.05未満である、ポートフォリオ。
【請求項1】
乳癌の状態を評価するための方法において、
(a)乳癌患者から生体サンプルを得るステップと、
(b)(i)配列番号1‐111に一致する、または、
(ii)表10に示されている配列番号1‐111に一致するpsidsからなる群から選択されるプローブセットによって認識される、
mRNAをコード化する遺伝子からなる群から選択される遺伝子の前記サンプルにおける発現レベルを測定するステップと、
を含み、
所定のカットオフレベルよりも高いまたは低い前記遺伝子発現レベルが、乳癌の状態を示唆している、
方法。
【請求項2】
乳癌患者のステージを求めるための方法において、
(a)乳癌患者から生体サンプルを得るステップと、
(b)(i)配列番号1‐111に一致する、または、
(ii)表10に示されている配列番号1‐111に一致するpsidsからなる群から選択されるプローブセットによって認識される、
mRNAをコード化する遺伝子からなる群から選択される遺伝子の前記サンプルにおける発現レベルを測定するステップと、
を含み、
所定のカットオフレベルよりも高いまたは低い前記遺伝子発現レベルが、乳癌のステージを示唆している、
方法。
【請求項3】
乳癌患者の治療プロトコルを決定するための方法において、
(a)乳癌患者から生体サンプルを得るステップと、
(b)(i)配列番号1‐111に一致する、または、
(ii)表10に示されている配列番号1‐111に一致するpsidsからなる群から選択されるプローブセットによって認識される、
mRNAをコード化する遺伝子からなる群から選択される遺伝子の前記サンプルにおける発現レベルを測定するステップと、
を含み、
所定のカットオフレベルよりも高いまたは低い前記遺伝子発現レベルが、再発を防止するために推奨される療法の程度および種類を医師が決定できるように再発のリスクを十分に示唆している、
方法。
【請求項4】
乳癌患者を治療するための方法において、
(a)乳癌患者から生体サンプルを得るステップと、
(b)(i)配列番号1‐111に一致する、または、
(ii)表10に示されている配列番号1‐111に一致するpsidsからなる群から選択されるプローブセットによって認識される、
mRNAをコード化する遺伝子からなる群から選択される遺伝子の前記サンプルにおける発現レベルを測定するステップと、
を含み、
所定のカットオフレベルよりも高いまたは低い前記遺伝子発現レベルが、再発の高いリスクを示唆している、
方法。
【請求項5】
乳癌患者の予後診断遺伝子発現プロファイルを交差検証するための方法において、
(a)統計的に有意な数の患者の生体サンプルから遺伝子発現データを得るステップと、
(b)サンプルの順番をランダムにするステップと、
(c)10%〜50%のサンプルからのデータを除外するステップと、
(d)残りのサンプルに対して、全ての変数について目的の因子を計算して、p値カットオフ(p)を満たす変数を選択するステップと、
(e)前方検索を用いて予測モデルに適合する変数を選択し、所定の誤差率になるまでトレーニング誤差(training error)を評価するステップと、
(f)残りの10%〜50%のサンプルに対して前記予測モデルを試験するステップと、
(g)除外したサンプルの新しいセットでステップ(c)‐(f)を繰り返すステップと、
(h)サンプルの100%の試験が終わるまでステップ(c)‐(g)を繰り返して、分類結果を記録するステップと、
を含む、方法。
【請求項6】
乳癌患者の予後診断遺伝子発現プロファイルを単独で検証する方法において、
(a)統計的に有意な数の患者の生体サンプルから遺伝子発現データを得るステップと、
(b)前記遺伝子発現データにおける供給元によるばらつき(source variabilities)を標準化するステップと、
(c)既に選択されている全ての変数について目的の因子を計算するステップと、
(d)前記サンプルに対して予測モデルを試験して分類結果を記録するステップと、
を含む、方法。
【請求項7】
乳癌患者の予後診断を可能にする再発ハザードスコア(Relapse Hazard Score)を生成する方法において、
(a)統計的に有意な数の患者の生体サンプルから遺伝子発現データを得るステップと、
(b)前記データに対してコックスの単変量回帰分析(univariate Cox's regression analysis)を適用して選択遺伝子を得るステップと、
(c)標準コックス係数(standard Cox's coefficients)を用いて前記選択遺伝子に重み付けした発現レベルを適用して、再発ハザードスコアとして適用されうる予測モデルを得るステップと、
を含む、方法。
【請求項8】
乳癌予後診断患者レポートを作成する方法において、
(a)患者から生体サンプルを得るステップと、
(b)前記サンプルの遺伝子発現を測定するステップと、
(c)前記ステップ(b)の結果に対して再発ハザードスコア(Relapse Hazard Score)を適用するステップと、
(d)前記ステップ(c)で得た前記結果を用いて前記レポート作成するステップと、
を含む、方法。
【請求項9】
組成物において、
(i)配列番号1‐111、または、
(ii)表10に示されている配列番号1‐111に一致するpsids、
からなる群から選択される少なくとも1つのプローブセットを含む、
組成物。
【請求項10】
生体サンプルにおいて乳癌の予後診断を決定するアッセイを行うためのキットにおいて、
(i)配列番号1‐111に一致する、または、
(ii)表10に示されている配列番号1‐111に一致するpsidsからなる群から選択されるプローブセットによって認識される、
mRNAをコード化する遺伝子からなる群から選択される遺伝子の組合せの単離された核酸配列、それら核酸配列の補完物、またはそれら核酸配列の一部を検出するための物質、
を含む、キット。
【請求項11】
請求項10に記載のキットにおいて、
前記配列番号が36‐95である、キット。
【請求項12】
請求項10に記載のキットにおいて、
前記配列番号が96‐111である、キット。
【請求項13】
請求項10に記載のキットにおいて、
前記配列番号が36‐111である、キット。
【請求項14】
請求項10に記載のキットにおいて、
マイクロアレイ分析を行うための試薬をさらに含む、キット。
【請求項15】
請求項10に記載のキットにおいて、
前記核酸配列、それら核酸配列の補完物、またはそれら核酸配列の一部をアッセイする媒体をさらに含む、方法。
【請求項16】
乳癌の状態を評価するための物品において、
(i)配列番号1‐111に一致する、または、
(ii)表10に示されている配列番号1‐111に一致するpsidsからなる群から選択されるプローブセットによって認識される、
mRNAをコード化する遺伝子からなる群から選択される遺伝子の組合せの単離された核酸配列、それら核酸配列の補完物、またはそれら核酸配列の一部を検出するための物質、
を含む、物品。
【請求項17】
請求項16に記載の物品において、
前記配列番号が36‐95である、物品。
【請求項18】
請求項16に記載の物品において、
前記配列番号が96‐111である、物品。
【請求項19】
請求項16に記載の物品において、
前記配列番号が36‐111である、物品。
【請求項20】
請求項16に記載の物品において、
マイクロアレイ分析を行うための試薬をさらに含む、物品。
【請求項21】
請求項16に記載の物品において、
前記核酸配列、それら核酸配列の補完物、またはそれら核酸配列の一部をアッセイする媒体をさらに含む、物品。
【請求項22】
請求項1、2、3、または4に記載の方法を実施するためのマイクロアレイまたは遺伝子チップ。
【請求項23】
請求項22に記載のマイクロアレイにおいて、
(i)配列番号1‐111に一致する、または、
(ii)表10に示されている配列番号1‐111に一致するpsidsからなる群から選択されるプローブセットによって認識される、
mRNAをコード化する遺伝子からなる群から選択される遺伝子の組合せの単離された核酸配列、それら核酸配列の補完物、またはそれら核酸配列の一部、
を含み、
前記遺伝子の組合せが、生体サンプルにおける乳癌の状態または再発のリスクを特徴付けるのに十分である、
マイクロアレイ。
【請求項24】
請求項22に記載のマイクロアレイにおいて、
測定または特徴付けが、少なくとも1.5倍の過剰発現または1.5倍少ない過少発現である、マイクロアレイ。
【請求項25】
請求項22に記載のマイクロアレイにおいて、
測定により、統計的に有意なp値の過剰発現または過少発現が得られる、マイクロアレイ。
【請求項26】
請求項22に記載のマイクロアレイにおいて、
前記p値が0.05未満である、マイクロアレイ。
【請求項27】
請求項22に記載のマイクロアレイにおいて、
cDNAアレイまたはオリゴヌクレオチドアレイを含む、マイクロアレイ。
【請求項28】
請求項22に記載のマイクロアレイにおいて、
1または複数の内部コントロール試薬をさらに含む、マイクロアレイ。
【請求項29】
診断/予後診断ポートフォリオにおいて、
(i)配列番号1‐111に一致する、または、
(ii)表10に示されている配列番号1‐111に一致するpsidsからなる群から選択されるプローブセットによって認識される、
mRNAをコード化する遺伝子からなる群から選択される遺伝子の組合せの単離された核酸配列、それら核酸配列の補完物、またはそれら核酸配列の一部、
を含み、
前記遺伝子の組合せが、生体サンプルにおける乳癌の状態または再発のリスクを特徴付けるのに十分である、
診断/予後診断ポートフォリオ。
【請求項30】
請求項29に記載のポートフォリオにおいて、
測定または特徴付けが、少なくとも1.5倍の過剰発現または1.5倍少ない過少発現である、ポートフォリオ。
【請求項31】
請求項29に記載のポートフォリオにおいて、
測定により、統計的に有意なp値の過剰発現または過少発現が得られる、ポートフォリオ。
【請求項32】
請求項29に記載のポートフォリオにおいて、
前記p値が0.05未満である、ポートフォリオ。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【公表番号】特表2007−528218(P2007−528218A)
【公表日】平成19年10月11日(2007.10.11)
【国際特許分類】
【出願番号】特願2006−554314(P2006−554314)
【出願日】平成17年2月18日(2005.2.18)
【国際出願番号】PCT/US2005/005711
【国際公開番号】WO2005/083429
【国際公開日】平成17年9月9日(2005.9.9)
【出願人】(505060347)ベリデックス・エルエルシー (43)
【氏名又は名称原語表記】Veridex,LLC
【住所又は居所原語表記】33 Technology Drive,Warren,NJ 07059,U.S.A.
【Fターム(参考)】
【公表日】平成19年10月11日(2007.10.11)
【国際特許分類】
【出願日】平成17年2月18日(2005.2.18)
【国際出願番号】PCT/US2005/005711
【国際公開番号】WO2005/083429
【国際公開日】平成17年9月9日(2005.9.9)
【出願人】(505060347)ベリデックス・エルエルシー (43)
【氏名又は名称原語表記】Veridex,LLC
【住所又は居所原語表記】33 Technology Drive,Warren,NJ 07059,U.S.A.
【Fターム(参考)】
[ Back to top ]