説明

生物学的経路の遺伝子発現分析を用いたリンパ節陰性の原発性乳がんの遠隔転移を予測する方法

本発明は、リンパ節陰性の原発性乳がんの遠隔転移を予測するための方法であって、乳がん細胞を入手すること、その細胞から、核酸および/またはタンパク質を単離すること、表2中の経路から選択されるバイオマーカーの存在、発現レベル、または、状態を決定するために、その核酸および/またはタンパク質を分析することによる方法を提供する。

【発明の詳細な説明】
【開示の内容】
【0001】
〔連邦支援の研究または開発についての宣言〕
本発明のために、政府資金を全く使用していない。
【0002】
〔配列表またはコンピュータプログラム一覧の添付コンパクトディスクへの言及〕
コンパクトディスクで提出した添付の「配列表」、表、または、コンピュータプログラム一覧への言及、および、複製物を含むコンパクトディスク中の素材の参照により組み入れるもの、ならびに、各コンパクトディスク中のファイルは、規定のものである。
【0003】
〔発明の背景〕
マイクロアレイ技術は、乳がん患者を、サブタイプ、再発および非再発、再発の種類、反応者および非反応者に分類するための一般的なツールになっている(3〜11参照)。遺伝子発現プロファイリングを適用することについての関心は、遺伝子リストの特性としての安定性である(12参照)。多くの遺伝子、特に同じ生物学的プロセスに関与する遺伝子が、チップ上で相関して発現することを考慮すると、患者の異なった訓練セットを用いる場合に、異なった特性に異なった遺伝子が存在するかもしれない可能性は十分にある。患者を異なったリスク群に分けるためのこれまでの遺伝子特性は、その生物学的プロセスまたは機能に関わらず、個々の遺伝子の性能に基づいて導き出されたものであった。個々の遺伝子よりむしろ、生物学的テーマについての遺伝子リストを問い合わせることが、より適切かもしれないということが示唆されている(1、2、8、13〜19参照)。
【0004】
〔発明の概要〕
本発明は、リンパ節陰性の原発性乳がんの遠隔転移を予測するための方法であって、乳がん細胞を入手すること、その細胞から、核酸および/またはタンパク質を単離すること、表2中の経路から選択されるバイオマーカーの存在、発現レベル、または、状態を決定するために、その核酸および/またはタンパク質を分析することによる方法を提供する。
【0005】
〔図面の簡単な説明〕
図1:500個の遺伝子特性の評価。訓練セット中で無作為選択した80個の腫瘍についての100個の遺伝子特性のそれぞれを、対応する試験セット中の再発患者を予測するために用いた。その性能を、ROC分析のAUCにより測定した。(a)試験セット中のER陽性患者についての遺伝子特性の性能、(b)試験セット中のER陰性患者についての遺伝子特性の性能である。図4に示したフローチャートに従って導き出されるような500個の予後特性に対するAUCの分布(左パネル)、500個の無作為遺伝子リストに対するAUCの分布(右パネル)である。対照としての遺伝子リストを作るために、ER陽性患者またはER陰性患者についての臨床情報を無作為に並べ替え、チップデータに再び割り当てた。
【0006】
図2:選択した過剰提示経路についての、個々の遺伝子の発現のDMFS時間との関連。グローバルテストプログラムにおけるGeneplot関数(1、2参照)を適用し、選択した各経路における個々の遺伝子の貢献度をプロットした。X軸の数は、ER陽性腫瘍またはER陰性腫瘍におけるそれぞれの経路での遺伝子数を示している。Y軸の値は、選択した経路における個々の各遺伝子の、DMFSへの貢献度(影響)を示している。負の値は、遺伝子発現とDMFSとの間に全く関連がないことを示している。棒(影響)中の細い水平線それぞれは、基準点から離れた1標準偏差を示し、棒中の2つ以上の水平線は、対応する遺伝子のDMFSとの関連が統計的に有意であることを示している。緑色の棒は、DMFSと正に関連する遺伝子を反映しており、転移能のない腫瘍でより高く発現することを示している。赤色の棒は、DMFSと負に関連する遺伝子を反映しており、転移能を有する腫瘍でより高く発現することを示している。(a)ER陽性腫瘍で282個の遺伝子から成る“アポトーシス”経路、(b)ER陰性腫瘍で58個の遺伝子から成る“細胞増殖の調節”経路、(c)ER陽性腫瘍で228個の遺伝子から成る“細胞周期の調節”経路、(d)ER陰性腫瘍で327個の遺伝子から成る“細胞接着”経路、(e)ER陽性腫瘍で379個の遺伝子から成る“免疫応答”経路、(f)ER陰性腫瘍で20個の遺伝子から成る“Gタンパク質共役受容体(G-coupled receptor)シグナル伝達の調節”経路、(g)ER陽性腫瘍で100個の遺伝子から成る“有糸分裂”経路、(h)ER陰性腫瘍で105個の遺伝子から成る“骨格の発達”経路である。
【0007】
図3:ER陽性腫瘍およびER陰性腫瘍の両方について最も顕著な2つの経路における顕著な最適遺伝子から構築された、経路に基づいた乳がん分類器の検証である。最近公開されたデータセットであって、サンプルがAffymetrix U133Aチップ(21参照)にハイブリダイゼーションしたものを用いた。それには、生存情報がある189個の浸潤性乳がん腫が含まれる。それらのうち、153個の腫瘍がリンパ節陰性の患者由来であった。手術後15日で亡くなった1人の患者を除いた後、残りの152人の患者を、特性を検証するために用いた。152人の患者セットは、チップにおけるER遺伝子の発現レベルに基づいて、125個のER陽性腫瘍および27個のER陰性腫瘍から構成されていた。(a)ER陽性腫瘍についての38個の遺伝子特性の受信者操作特性(ROC)分析、(b)その38個の遺伝子特性に応じた、ER陽性腫瘍を持つ患者のカプラン・マイヤー分析である。60月および120月でのDMFS確率(および、それらの95%信頼区間)はそれぞれ、良好な特性曲線について92.7%(86.0%〜99.9%)または74.5%(62.0%〜89.5%)、不良な特性曲線について59.9%(49.0%〜73.2%)または48.5%(36.8%〜63.9%)であった。(c)ER陰性腫瘍についての12個の遺伝子特性のROC分析、(d)その12個の遺伝子特性に応じた、ER陰性腫瘍を持つ患者のカプラン・マイヤー分析である。60月および120月でのDMFS確率(および、それらの95%信頼区間)は、良好な特性曲線について両方とも94.1%(83.6%〜100%)、不良な特性曲線について40.0%(18.7%〜85.5%)または26.7%(8.9%〜80.3%)であった。(e)ER陽性腫瘍およびER陰性腫瘍について組み合わせた50個の遺伝子特性のROC分析、(f)その50個の遺伝子特性に応じた、152人の乳がん患者のカプラン・マイヤー分析である。60月および120月でのDMFS確率(および、それらの95%信頼区間)は、良好な特性曲線について93.0%(87.3%〜99.1%)または79.3%(69.2%〜91.0%)、不良な特性曲線について57.2%(46.9%〜69.7%)または45.4%(34.6%〜59.7%)であった。
【0008】
図4は、データ分析のワークフローを示す。
【0009】
図5は、選択した過剰提示経路についての、個々の遺伝子の発現のDMFS時間との関連から入手した、ER陽性腫瘍における上位20個の予後経路を示す。グローバルテストプログラムにおけるGeneplot関数(1、2参照)を適用し、選択した各経路における個々の遺伝子の貢献度をプロットした。X軸の数は、ER陽性腫瘍におけるそれぞれの経路での遺伝子数を示している。Y軸の値は、選択した経路における個々の各遺伝子の、DMFSへの貢献度(影響)を示している。負の値は、遺伝子発現とDMFSとの間に全く関連がないことを示している。棒(影響)中の細い水平線は、基準点から離れた1標準偏差を示し、棒中の2つ以上の水平線は、対応する遺伝子のDMFSとの関連が統計的に有意であることを示している。緑色の棒は、DMFSと正に関連する遺伝子を反映しており、転移能のない腫瘍でより高く発現することを示している。赤色の棒は、DMFSと負に関係する遺伝子を反映しており、転移能を有する腫瘍でより高く発現することを示している。
【0010】
〔発明の詳細な説明〕
本発明は、リンパ節陰性の原発性乳がんの遠隔転移を予測するための方法であって、乳がん細胞を入手すること、その細胞から、核酸および/またはタンパク質を単離すること、表2中の経路から選択されるバイオマーカーの存在、発現レベル、または、状態を決定するために、その核酸および/またはタンパク質を分析することによる方法を提供する。
【0011】
バイオマーカーは、指示されたマーカーの核酸/タンパク質の任意の兆候である。核酸は、本分野で既知の任意のものでありうるし、核、ミトコンドリア(ホモプラスミー(homeoplasmy)、ヘテロプラスミー)、ウイルス、細菌、真菌、マイコプラズマのもの等が含まれるが、これに限定されない。兆候は、直接的または間接的でありうるし、生理学的パラメーターを考慮して、また、内部標準、プラシーボ、正常組織または別のがんと比較して、遺伝子の過剰発現、もしくは、過小発現を測定しうる。バイオマーカーには、核酸、および、タンパク質(過剰発現および過小発現、ならびに、直接および間接ともに)が含まれるが、これに限定されない。核酸をバイオマーカーとして用いることには、本分野で既知の任意の方法が含まれうるし、DNA増幅、欠失、挿入、重複、RNA、マイクロRNA(miRNA)、ヘテロ接合性欠失(LOH)、一塩基多型(SNPs;Brookes (1999)参照)、直接的にまたはゲノム増幅のいずれかによるコピー数多型(CNPs)、マイクロサテライトDNA、エピジェネティックな変化(例えば、DNAハイポメチル化、DNAハイパーメチル化)、および、FISHを測定することが含まれるが、これに限定されない。タンパク質をバイオマーカーとして用いることには、本分野で既知の任意の方法が含まれ、量、活性、修飾(例えば、グリコシル化、リン酸化、ADPリボシル化、ユビキチン化等)または免疫組織化学(imunohistochemistry)(IHC)、および、ターンオーバーを測定することが含まれるが、これに限定されない。他のバイオマーカーには、画像化、分子プロファイリング、細胞計数、および、アポトーシスマーカーが含まれる。
【0012】
“原発巣(tissue of origin)”において言及される「起源(Origin)」は、特定の医療環境に応じて、組織型(肺、結腸等)または組織学型(腺がん、扁平上皮がん等)のいずれかを意味しており、本分野の当業者はそのことを理解するだろう。
【0013】
マーカー遺伝子は、配列番号により指定された配列を含む場合、その配列に対応する。遺伝子断片またはフラグメントは、参照配列またはその相補配列の一部を、その遺伝子配列であると識別できるほど十分に含む場合、このような遺伝子配列に対応する。遺伝子発現産物は、そのRNA、mRNA、もしくは、cDNAがこのような配列を持つ組成物(例えば、プローブ)とハイブリダイゼーションする場合、または、ペプチドもしくはタンパク質ならば、このようなmRNAによりコードされる場合、このような配列に対応する。遺伝子発現産物の断片またはフラグメントは、参照遺伝子発現産物またはその相補物の一部を、その遺伝子配列または遺伝子発現産物であると識別できるほど十分に含む場合、このような遺伝子配列または遺伝子発現産物に対応する。
【0014】
本明細書で説明し、特許請求の範囲に記載した発明の方法、組成物、物品、キットには、1つ以上のマーカー遺伝子が含まれる。「マーカー」または「マーカー遺伝子」は、本明細書を通じて、過剰発現または過小発現が指標または組織型と関連する任意の遺伝子と対応するような遺伝子および遺伝子発現産物を言うために用いられる。
【0015】
遺伝子発現プロファイルを確立するための好ましい方法には、タンパク質またはペプチドをコードする可能性のある遺伝子によって産生されるRNAの量を決定することが含まれる。このことは、逆転写PCR(RT-PCR)、競合RT-PCR、リアルタイムRT-PCR、ディファレンシャルディスプレイRT-PCR、ノザンブロット分析、他の関連する検査により達成される。個々のPCR反応を用いてこれらの技術を実施することが可能であるが、最もよいのは、mRNAから産生された相補的DNA(cDNA)または相補的RNA(cRNA)を増幅し、マイクロアレイを通じて分析することである。多くの異なるアレイ配置、および、それらの製造方法が、本分野の当業者に既知であり、例えば、米国特許第5445934号、同第5532128号、同第5556752号、同第5242974号、同第5384261号、同第5405783号、同第5412087号、同第5424186号、同第5429807号、同第5436327号、同第5472672号、同第5527681号、同第5529756号、同第5545531号、同第5554501号、同第5561071号、同第5571639号、同第5593839号、同第5599695号、同第5624711号、同第5658734号、同第5700637号で説明されている。
【0016】
マイクロアレイ技術は、何千もの遺伝子の定常状態のmRNAレベルを同時に測定することを可能にし、それゆえ、制御されていない細胞増殖の開始、停止、または、調節といった効果を同定するための強力なツールを提示する。2つのマイクロアレイ技術が現在広く使用されている。1つ目は、cDNAアレイであり、2つ目は、オリゴヌクレオチドアレイである。これらのチップの構成には違いがあるが、本質的にすべての下流のデータ分析および出力は、同じものである。これらの分析の産物は一般的に、標識プローブから受信されるシグナルの強度を測定することであり、その標識プローブは、マイクロアレイ上の既知の場所の核酸配列にハイブリダイゼーションするサンプル由来のcDNA配列を検出するために用いられる。一般的に、シグナルの強度は、cDNA、すなわち、サンプル細胞中で発現するmRNAの量に比例する。多くのこのような技術が利用可能であり、有用である。遺伝子発現を決定するための好ましい方法は、米国特許第6271002号、同第6218122号、同第6218114号、同第6004755号で見出すことができる。
【0017】
発現レベルの分析は、このようなシグナル強度を比較することにより実施される。試験サンプルにおける遺伝子の発現強度の、対照サンプルにおける発現強度に対する比率行列を生成することによりなされるのが、最もよい。例えば、病変組織由来の遺伝子発現強度を、同じ種類の良性組織または正常組織から生成される発現強度と比較することができる。これらの発現強度の比率は、試験サンプルと対照サンプルとの間の遺伝子発現が、倍数的に変化することを示している。
【0018】
選択は、統計的検定に基づくことができる。この統計的検定により、ランク付けしたリストを作り出し、このランク付けしたリストは、腫瘍の起源の元の部位と関係した因子間で、各遺伝子が異なる発現をすることに関する有意性の証拠に関係する。このような検定の例には、ANOVAおよびクラスカル・ウォリス検定が含まれる。1つのクラスが別のクラスよりも有利になる証拠の優越として、このような重みの合計をカットオフまで解釈するように設計されたモデルにおいて、このランキングを重み付けとして用いることができる。また、文献に記載された従来の証拠をも、その重み付けを調整するために用いてもよい。
【0019】
好ましい実施態様は、安定な対照セットを同定し、このセットをすべてのサンプルのゼロ分散に設定することによって、各測定を正規化することである。解析における系統誤差により影響され、この誤差と独立に変化することが知られていない任意の単一の内因性転写産物、または、内因性転写産物のセットとして、この対照セットを規定する。すべてのマーカーが、対照セットの任意の記述的統計値(例えば、平均値または中央値)についてのゼロ分散、または、直接測定についてのゼロ分散を生ずるサンプル特異的な因子により調整される。あるいは、統計誤差にのみ関係する対照の分散についての前提は真ではないのだが、正規化が実行されると結果的な分類誤差がより小さくなる場合、対照セットはなお、述べられたとおり用いられるだろう。非内因性スパイクコントロールも役立つ可能性はあるが、好ましくない。
【0020】
遺伝子発現プロファイルを、多くの方法で表示することができる。最も一般的な方法は、生の蛍光強度または比率行列を、縦軸が試験サンプル、横軸が遺伝子を指す図形的な系統樹に配置することである。同様の発現プロファイルを有する遺伝子が互いに近くにあるように、データを配置する。各遺伝子の発現率は、色として視覚化される。例えば、1より低い発現率(ダウンレギュレーション)は、スペクトルの青色部分に現れ、1より高い発現率(アップレギュレーション)は、スペクトルの赤色部分に現れる。市販のコンピュータソフトウェアプログラムが、このようなデータを表示するために利用でき、それらには、“Genespring”(Silicon Genetics, Inc.)、ならびに、“Discovery”および“Infer”(Partek, Inc.)が含まれる。
【0021】
遺伝子発現を決定するためにタンパク質レベルを測定する場合、結果的に適当な特異度と感度をもたらすならば、本分野で既知の任意の方法が適している。例えば、タンパク質レベルは、タンパク質に特異的な抗体または抗体フラグメントに結合し、抗体結合タンパク質の量を測定することにより、測定することができる。検出を容易にするために、放射性試薬、蛍光試薬、または、他の検出可能な試薬で、抗体を標識することができる。検出方法には、酵素免疫測定法(ELISA)、イムノブロット技術が含まれるが、これに限定されない。
【0022】
本発明の方法で用いる調節された遺伝子については、実施例で説明する。異なる起源由来のがんを有する患者に対して、特定の起源のがんを有する患者では、異なって発現する遺伝子が、アップレギュレーションされるか、またはダウンレギュレーションされるかのいずれかである。アップレギュレーションおよびダウンレギュレーションとは、遺伝子の発現量に関して、いくつかの基準と比較して(測定に用いられたシステムにおけるノイズの寄与よりも)検出可能な違いが見られることを意味する、相対的な用語である。この場合、基準をアルゴリズムに基づいて決定する。そのため、病変細胞における目的の遺伝子は、同じ測定方法を用いた基準レベルと比較して、アップレギュレーションされるか、またはダウンレギュレーションされるかのいずれかである。このような情況において、“病変の(Diseased)”とは、制御されない細胞増殖とともに起こるような、身体機能の適切な作動を中断または阻害するか、あるいは阻害する可能性のある身体の状態変化を言う。ある人の遺伝子型または表現型のいくつかの観点が、疾患の存在と一致する場合、その疾患に罹っていると診断される。しかしながら、診断または予後を実施するという行為には、再発の可能性、治療の種類、治療観察を決定するといった疾患/病状に関する課題の決定が含まれていてもよい。治療観察では、遺伝子発現プロファイルが、正常組織とより矛盾のないパターンに変化したかどうか、または変化しているかどうかを決定するために、経時的に遺伝子発現を比較することで、与えられた一連の治療効果について臨床判断がなされる。
【0023】
遺伝子はグループ分けされ、グループ中の遺伝子セットについて得られた情報が、臨床上関連がある判断(例えば、診断、予後、または、処置選択)をするための重要な基礎を提供する。これらの遺伝子セットは、発明のポートフォリオを作り出す。最も診断的なマーカーと同様に、正しい医療判断をするために十分な最少の数のマーカーを用いることがしばしば望まれる。このことは、時間と資源の非生産的な使用を予防するのと同様に、更なる分析の間の治療の遅延を予防する。
【0024】
遺伝子発現ポートフォリオを確立する1つの方法は、最適化アルゴリズム(例えば、株式ポートフォリオを確立する際に広く用いられる、平均分散アルゴリズム)を使用することを通じたものである。この方法は、米国特許出願公開第20030194734号に詳細に説明されている。本質的に、その方法は、入力セット(金融上の適用では株式、本願では、強度により測定されるような発現)の確立を要求する。その入力セットは、リターン(例えば、生成されるシグナル)の変動を最小にする一方で、それを用いることで受けるリターンを最適化するであろうものである。多くの商用ソフトウェアプログラムが、このような操作を実施するために利用できる。“Wagner Associates Mean-Variance Optimization Application”は、本明細書全体にわたり“Wagner Software”と呼ばれ、好ましいものである。このソフトウェアは、有効フロンティアを決定するために、“Wagner Associates Mean-Variance Optimization Library”の関数を用い、また、マーコウィッツの意味(Markowitz sense)における最適ポートフォリオが好ましい。Markowitz (1952)参照。この種類のソフトウェアを用いるには、マイクロアレイデータを変換することが必要となり、このため、ソフトウェアを意図された金融分析のために用いる場合に株式リターンとリスク測定が用いられる方法で、マイクロアレイデータを入力として処理することが可能となる。
【0025】
また、ポートフォリオを選択するプロセスに、ヒューリスティックなルールの適用をも含むことができる。好ましくは、生物学と、臨床結果を生むために用いられる技術に対する理解とに基づいて、このようなルールを処方する。より好ましくは、それらを最適化法からの出力に適用する。例えば、ポートフォリオ選択の平均分散法を、がん患者において異なった発現をする多くの遺伝子についてのマイクロアレイデータに適用することができる。その方法からの出力は、病変組織と同様に末梢血でも発現するいくつかの遺伝子を含む可能性のある、最適化した遺伝子セットであるだろう。もし、検査方法で用いるサンプルが末梢血から入手され、がんの症例で異なって発現する特定の遺伝子が、末梢血でも異なって発現しうるならば、ヒューリスティックなルールを適用することができる。そのヒューリスティックなルールでは、ポートフォリオは、末梢血で異なって発現するものを除いて有効フロンティアから選択される。もちろん、例えば、データの事前選択中にそのルールを適用することによって、有効フロンティア形成より前にそのルールを適用することができる。
【0026】
必ずしも問題となる生物学と関係する必要のない、他のヒューリスティックなルールが適用されうる。例えば、所定の割合のポートフォリオのみが、特定の遺伝子または遺伝子群により表されることができるというルールを適用することができる。市販のソフトウェア(例えば、Wagner Software)は、容易にこれらの種類のヒューリスティクスに適応する。このことは、例えば、確度および精度とは別の因子(例えば、期待されるライセンス料)が、1つ以上の遺伝子を含むことの望ましさに影響を与える場合に有用である可能性がある。
【0027】
また、本発明の遺伝子発現プロファイルを、がんの診断、予後、または治療観察に有用な、他の非遺伝的な診断方法とあわせて用いることができる。例えば、ある状況では、上記の方法に基づいた遺伝子発現の診断力を、例えば、血清タンパク質マーカー[例えば、がん抗原27.29(“CA27.29”)]のような従来のマーカーからのデータと組み合わせることが有用である。このようなマーカーの範囲は、CA27.29のような分析対象を含んで存在する。1つのこのような方法において、血液を処置患者から定期的に採取し、その後、上記の血清マーカーのうちの1つについて酵素免疫測定を行う。マーカーの濃度が腫瘍の再発、または、治療の失敗を示唆している場合、遺伝子発現分析を受けることができるサンプル源を採用する。疑わしい塊が存在する場合、細針吸引(FNA)を用い、その後、塊から採取した細胞の遺伝子発現プロファイルを、上記のように分析する。あるいは、組織サンプルを、以前に腫瘍を除去した組織の近傍領域から採取してもよい。特に、このアプローチは、他の試験があいまいな結果を示す場合に有用である。
【0028】
本発明は、指標に特異的な細胞の存在について、生物標本を分析するための方法であって、(a)標本由来の細胞を濃縮すること、(b)その細胞から、核酸および/またはタンパク質を単離すること、ならびに(c)指標に特異的なバイオマーカーの存在、発現レベル、または、状態を決定するために、その核酸および/またはタンパク質を分析することによる方法を提供する。
【0029】
生物標本は、本分野で既知の任意のものでありうるし、尿、血液、血清、血漿、リンパ液、痰、精液、唾液、涙、胸水、肺水、気管支洗浄、滑液、腹水、腹水貯留、羊水、骨髄、骨髄穿刺液、脳脊髄液、組織可溶化液もしくは組織破砕物、または、細胞ペレットが含まれるが、これに限定されない。例えば、米国特許出願公開第20030219842号を参照のこと。
【0030】
指標は、本分野で既知の任意のものを含んでよく、がん、遺伝性の遺伝的素因のリスクアセスメント、がん細胞の原発巣の同定(例えば、CTC;米国特許仮出願第60/887,625号参照)、遺伝疾患における突然変異の同定、病状(病期決定)、予後、診断、観察、処置に対する反応、(薬理学的な)処置選択、(ウイルス、細菌、マイコプラズマ、真菌による)感染、化学療法感受性(米国特許第7112415号参照)、薬剤感受性、転移能、または、遺伝疾患における突然変異の同定が含まれるが、これに限定されない。
【0031】
細胞濃縮は、本分野で既知の任意のものによりうるし、抗体/磁気分離(Immunicon, Miltenyi, Dynal;米国特許第6602422号、同第5200048号参照)、蛍光活性化細胞分離(FACs;米国特許第7018804号)、ろ過、または、手動によるものが含まれるが、これに限定されない。手動による濃縮は、例えば、前立腺マッサージによることができる。Goesslらの(2001) Urol 58:335〜338参照。
【0032】
核酸は、本分野で既知の任意のものでありうるし、核、ミトコンドリア(ホモプラスミー、ヘテロプラスミー)、ウイルス、細菌、真菌、または、マイコプラズマのものが含まれるが、これに限定されない。
【0033】
核酸およびタンパク質を単離する方法は、本分野で周知のものである。例えば、米国特許第6992182号、RNA www.ambion.com/techlib/basics/rnaisol/index.html、および米国特許出願公開第20070054287号を参照のこと。
【0034】
DNA分析は、本分野で既知の任意のものでありうるし、遺伝的構成を検出するための、メチル化、脱メチル化、核型分析、倍数関係(異数性、倍数性)、(ゲルまたは分光光度法で評価される)DNAの完全性、転座、突然変異、遺伝子融合、活性化−不活性化、一塩基多型(SNPs)、コピー数、または、全ゲノム増幅が含まれるが、これに限定されない。RNA分析は、本分野で既知の任意のものを含み、q-RT-PCR、miRNA、または、転写後修飾が含まれるが、これに限定されない。タンパク質分析は、本分野で既知の任意のものを含み、抗体検出、翻訳後修飾、または、ターンオーバーが含まれるが、これに限定されない。タンパク質は、細胞表面マーカーでありうるし、好ましくは、上皮、内皮、ウイルス、または、細胞型のものである。バイオマーカーは、ウイルス/細菌による感染、傷害、または、抗原発現に関係しうる。
【0035】
特許請求の範囲に記載した発明を、例えば、細胞から核酸および/またはタンパク質を単離すること、ならびに、転移能に特異的なバイオマーカーの存在、発現レベル、または、状態を決定するためにその核酸および/またはタンパク質を分析することにより、生物標本由来の細胞の転移能を決定するために用いることができる。
【0036】
特許請求の範囲に記載した発明の細胞を、例えば、細胞から核酸および/またはタンパク質を単離すること、ならびに、遺伝疾患に特異的なバイオマーカーの存在、発現レベル、または、状態を決定するためにその核酸および/またはタンパク質を単離することにより、生物標本由来の遺伝疾患細胞における突然変異を同定するために用いることができる。
【0037】
特許請求の範囲に記載した発明の細胞を、例えば、細胞性材料およびその構成部分(例えば、核酸および/またはタンパク質)を入手し、保存するために用いることができる。構成部分を、例えば、腫瘍細胞ワクチンを造るために、または、免疫細胞治療において、用いることができる。米国特許出願公開第20060093612号、同第20050249711号参照。
【0038】
本発明によって作られたキットには、遺伝子発現プロファイルを決定するため定型化した解析(formatted assays)が含まれる。これらには、バイオマーカーを解析する試薬、使用説明書、媒体のような、解析を実施するために必要とされるすべての材料、または、いくつかの材料が含まれることができる。
【0039】
本発明の物品には、疾患を処置し、診断し、予後し、それでなければ評価するために有用な遺伝子発現プロファイルの説明が含まれる。これらのプロファイルの説明を、コンピュータで読み取り可能な媒体(磁気的、光学的、および、同様の媒体)のような、機械によって自動的に読むことができる媒体へ変換する。また、物品には、このような媒体で遺伝子発現プロファイルを評価するための使用説明書も含むことができる。例えば、物品は、上記の遺伝子ポートフォリオの遺伝子発現プロファイルを比較するためのコンピュータの使用説明書を有するCD-ROMを備えてもよい。また、物品は、デジタル的に記録された遺伝子発現プロファイルを有していてもよく、それにより、患者サンプルの遺伝子発現データと比較することができる。あるいは、プロファイルを異なる表現フォーマットで記録することができる。図形的な記録は、このようなフォーマットの1つである。例えば、前記のPartek, Inc.からの“DISCOVERY”および“INFER”ソフトウェアに組み込まれているクラスタリングアルゴリズムは、このようなデータの視覚化の際に、最もよく役立つ。
【0040】
本発明によって製造される異なる種類の物品は、遺伝子発現プロファイルを明らかにするために用いられる媒体、または、定型化された解析である。これらは、例えば、マイクロアレイを含むことができ、そのマイクロアレイでは、相補配列またはプローブがマトリックスに付着し、マトリックスに目的の遺伝子を示す配列が結合して、読み取り可能なそれらの存在を決定する因子を生成するものである。あるいは、本発明による物品を、がんを検出するための目的の遺伝子の発現レベルを示すハイブリダイゼーション、増幅、シグナル生成を実施するための試薬キットへと作り上げることができる。
【0041】
本発明は、末梢血のバックグラウンド中で、単一の循環乳房腫瘍細胞を検出することを特徴としている特異的なマーカーポートフォリオを規定する。分子特徴づけマルチプレックス解析ポートフォリオを、QRT-PCRマルチプレックス解析として使用するために最適化した。ここで、分子特徴づけマルチプレックスには、2つの原発巣マーカー、1つの上皮マーカー、および、ハウスキーピングマーカーが含まれる。分子特徴づけマルチプレックス解析のために、QRT-PCRをSmartcycler IIで実行するだろう。分子特徴づけシングレックス解析ポートフォリオを、QRT-PCR解析として使用するために最適化した。ここで、各マーカーを、3つのがん状態マーカー、1つの上皮マーカー、および、ハウスキーピングマーカーを利用する単一の反応中で実行する。RPAマルチプレックス解析とは異なり、Applied Biosystems(ABI)7900HTで、分子特徴づけシングレックス解析を実行し、384穴プレートをプラットフォームとして用いるだろう。分子特徴づけマルチプレックス解析およびシングレックス解析ポートフォリオは、単一の循環上皮細胞を正確に検出するものであり、それにより、臨床医が再発を予測することができる。分子特徴づけマルチプレックス解析では、サーマス・サーモフィラス(TTH)DNAポリメラーゼを利用する。これは、単一反応中で、逆転写連鎖反応とポリメラーゼ連鎖反応をともに実行できるためである。一方、分子特徴づけシングレックス解析では、逆転写のためのMMLVと、PCRのためのTaqポリメラーゼとを組み入れた2つの酵素反応であるApplied Biosystems一工程マスターミックスを利用する。ゲノムDNAが効率的に増幅せず検出されないようエキソン−イントロンジャンクション(exon-intron junction)を組み込むことにより、解析設計はRNAに特異的である。
【0042】
疾患の理解のためには、生物学的プロセスの知識が、異なった発現をする遺伝子についての情報よりもより関連があるかもしれない。我々は、リンパ節陰性の原発性乳房腫瘍の転移能と関連した別個の生物学的経路を調査した。500個の異なる訓練セットを作り出し、エストロゲン受容体(ER)陽性腫瘍およびER陰性腫瘍について対応する遺伝子特性を導き出すために、再サンプリング法を用いた。患者転帰と関係した過剰提示経路を同定するために、構築した遺伝子特性を、遺伝子オントロジー生物学的プロセス(GOBP)にマッピングした。これらの生物学的経路が転移の進行と関連していることを確認するために、グローバルテストプログラム(1、2参照)を用いた。更に、60個を超える遺伝子を有する公開された4つの予後遺伝子特性を、上位20個の経路にマッピングすることによって、同一遺伝子が最小限重複しているにもかかわらず、上位の別個の経路のうちの19個に、それぞれをマッピングすることができる。我々の研究は、乳がん進行のメカニズムを理解し、かつ経路に基づいた予後のための特性を導き出すための新規の方法を提供する。
【0043】
我々は、根本的な生物学的経路を理解する目的で、異なった患者群に由来する様々な予後遺伝子特性を調査した。乳房腫瘍のERサブグループの遺伝子発現パターンは、非常に異なっているため(3〜6、8、20参照)、遺伝子特性およびその後の経路分析を導き出すためのデータ分析を、別々に実施した(8参照)。ER陽性患者またはER陰性患者のいずれについても、80個のサンプルを訓練セットとして無作為に選択し、上位100個の遺伝子を、残りのER陽性患者またはER陰性患者についての腫瘍再発を予測するための特性として用いた(図4参照)。定義点である5年以内の遠隔転移について、受信者操作特性(ROC)分析の濃度曲線下面積(AUC)を、対応する試験セットにおける特性の性能測定として用いた。上記の手順を500回くり返した。試験セットにおける500個の特性の平均AUCは、0.70であったが、500個の対照遺伝子リストの平均AUCは、無作為の予測を示す0.50であった(図1a参照)。ER陰性データセットについて、これらの値は、それぞれ0.67および0.51であった(図1b参照)。個々の特性における遺伝子を置換することができる一方で、複数の遺伝子特性を同様の性能により同定することができるだろう。ER陽性腫瘍またはER陰性腫瘍についての500個の特性における頻度によりランク付けした上位20個の遺伝子が、表1に示されている。最も高頻度で存在する遺伝子はそれぞれ、ER陽性腫瘍についてはKIAA0241 protein(KIAA0241)、ER陰性腫瘍については、zinc finger protein multitype 2(ZFPM2)であったが、2つの主要遺伝子リストの遺伝子間に重複は見られなかった。配列番号については、配列表を参照のこと。
【表1】

【0044】
表1では、ER陽性腫瘍およびER陰性腫瘍についての100個の遺伝子の500個の特性における頻度により、上位20個の遺伝子をランク付けする(詳しくは図4を参照のこと)。
【0045】
生物学的経路は、ER陽性腫瘍およびER陰性腫瘍について、別個のものである。ER陽性腫瘍については、2つの免疫関連経路に加えて、細胞分裂に関係する多くの経路が上位20個の過剰提示経路に存在する(表4参照)。
【表2】

【0046】
グローバルテストプログラムにより、20個の経路すべてが、無遠隔転移生存(DMFS)と顕著に関係していた。上位2つの最も顕著なものは、“アポトーシス”および“細胞周期の調節”である(表2参照)。ER陰性腫瘍について、上位20個の経路の多くが、RNAプロセシング、輸送、シグナル伝達に関係している(表4参照)。上位20個の経路のうちの18個が、DMFSと顕著な関係を示し、最も顕著な2つが、“細胞増殖の調節”、および、“Gタンパク質共役受容体シグナル伝達の調節”であった(表2参照)。
【表3】

【0047】
表2では、ER陽性腫瘍およびER陰性腫瘍の500個の特性において最も高頻度である上位20個の過剰提示経路のそれぞれ(表5を参照のこと)について、グローバルテストプログラム(1、2参照)を行った。グローバルテストは、特異的な臨床パラメーター(本件ではDMFS)に対して、総じて遺伝子群の関連を試験し、経路についての漸近理論P値を求める(1、2参照)。その経路を、腫瘍のERサブグループそれぞれにおけるP値によりランク付けする。
【0048】
DMFSとの関連への、上位の過剰提示経路における個々の遺伝子の貢献度、および、それらの顕著さを、ER陽性腫瘍(図5、表5オンライン参照)およびER陰性腫瘍(図6オンライン、表6参照)について、決定した。これらの経路では、複数の遺伝子がDMFSと正に関連し、転移能のない腫瘍でより高い発現を示しているが、他の遺伝子は負の関連を示し、転移性腫瘍でより高い発現を示している。ER陽性腫瘍においては、混合した関連のあるこのような経路には、上位2つの顕著な経路、“アポトーシス”(図2a)および“細胞周期の調整”(図2c)が含まれた。また、DMFSとドミナントポジティブまたは負に相関した多数の経路が存在した。例えば、GOBPの“免疫応答”は、379個のプローブセットを含むが、ほとんどがDMFSと正の相関を示した(図2e参照)。“細胞防御応答”および“走化性”においても同様に、ほとんどの遺伝子が、DMFSと強い正の相関を示した(図5オンライン参照)。他方、“有糸分裂”(図2g参照)、“有糸分裂染色体分離”、および、“細胞周期”における遺伝子は、DMFSとドミナントネガティブな相関を示した(図5参照)。このように、概して、細胞分裂と関係する経路には、生存時間とドミナントネガティブな相関があるが、免疫と関係する経路には、ドミナントポジティブな相関がある。このことは、転移能を有するER陽性腫瘍には、より高い細胞分裂率があり、宿主の身体から、より低い免疫活性を誘導する傾向があることを示している。
【表4−1】

【表4−2】

【表4−3】

【表4−4】

【表4−5】

【表4−6】

【表4−7】

【表4−8】

【表4−9】

【表4−10】

【表4−11】

【表4−12】

【表5−1】

【表5−2】

【表5−3】

【表5−4】

【表5−5】

【表5−6】

【表5−7】

【表5−8】

【表5−9】

【0049】
ER陰性腫瘍においては、DMFSと正または負の相関がある遺伝子を有する経路の例には、最も顕著な経路(表2参照)である“細胞増殖の調節”(図2b参照)および“細胞接着”(図2d参照)が含まれる。ER陰性腫瘍における上位20個の経路のうち、DMFSとドミナントポジティブな関連を示すものは全くなかったが、いくつかはドミナントネガティブな相関を示し(図6オンライン参照)、それらには、“Gタンパク質共益受容体シグナル伝達の調節”(図2f参照)、“骨格の発達”(図2h参照)、および、顕著な上位3つにランク付けされた経路(表2参照)が含まれる。上位20個の主要経路のうちの4つが、ER陽性腫瘍およびER陰性腫瘍間で重複していた。すなわち、“細胞周期の調節”、“タンパク質アミノ酸リン酸化”、“タンパク質生合成”、および、“細胞周期”である(表2参照)。
【0050】
遠隔転移を予測するために、最も顕著な生物学的プロセスにおける遺伝子発現プロファイルを用いることを試みる際に、我々は、遠隔再発の予測のための遺伝子特性を構築するために、ER陽性腫瘍およびER陰性腫瘍での上位2つの顕著な経路の遺伝子を用いた(表7参照)。上位2つのER陽性経路由来の38個の遺伝子と、上位2つのER陰性経路由来の12個の遺伝子とを組み合わせて、50個の遺伝子特性を構築した。追跡調査情報を有する最近公開された乳房腫瘍セットについてのAffymetrix U133Aデータ(21参照)を、特性を検証するための独立した試験セットとして用いた。152人の患者の検証セットは、125個のER陽性腫瘍と27個のER陰性腫瘍と、から構成された。38個の遺伝子特性をER陽性腫瘍に適用する場合、ROC分析ではAUC=0.782であり(図3a参照)、DMFSについてのカプラン・マイヤー分析では、リスク群で明らかな分離を示した(HR=3.36)(図3b参照)。ER陰性腫瘍の12個の遺伝子特性については、AUC=0.872(図3c参照)、HR=19.8(図3d参照)が得られた。ER陽性腫瘍およびER陰性腫瘍について組み合わされた50個の遺伝子特性では、AUC=0.795(図3e参照)、HR=4.44(図3f参照)であった。したがって、統計的方法と生物学的な知識とを組み合わせることにより、遺伝子特性を導き出すことができる。本発明は、がんの予後のための遺伝子特性を導き出す新しい方法のみならず、腫瘍のサブグループ間の別個の生物学的プロセスに対する洞察をも提供する。
【表6】

【表7】

【表8】

【表9】

*SD=標準偏差;†DMFS=無遠隔転移生存;+=DMFSと正の相関、−=DMFSと負の相関
【0051】
乳がんについての様々な予後特性により遺伝子を比較するために、5つの公開された遺伝子特性を選択した(6、8、21〜23参照)。我々はまず、遺伝子特性の対それぞれの間の遺伝子配列相同性を比較した。期待されるとおり、重複している遺伝子がほとんど見られなかった(表8参照)。97個の遺伝子を含む遺伝子発現グレードインデックスは、ほとんどが細胞周期調節および増殖に関連するものである(21参照)が、Genomic Health社の16個の遺伝子(22参照)のうちの5つから、Yuの62個の遺伝子(23参照)のうちの10個までの範囲の様々な特性間で、重複している遺伝子の数が最も多くなることが示された。他の4つの遺伝子特性は、対比較において、1つの遺伝子の重複のみが示され、すべての特性について共通した遺伝子はなかった。異なるプラットフォームおよびバイオインフォマティクス分析を使用し、また、異なる群の患者を分析したせいで、特性を通じて重複している遺伝子数が少ないにもかかわらず、我々は、様々な特性における共通の経路の提示が、それらの個々の予後値(8参照)の根底になっているかもしれないことを見出した。したがって、我々は5つの特性における上位20個の主要な経路の提示(表2参照)を試験し、特性における遺伝子をGOBPにマッピングした。10個の別個の主要経路にマッピングされたGenomic Health社の16個の遺伝子特性を除いて、62個以上の遺伝子を有する他の4個の特性それぞれが、19個の別個の主要な予後経路にマッピングされた(表3参照)。これらの19個の経路のうちの8つの経路(すなわち、“有糸分裂”、“アポトーシス”、“細胞周期の調節”、“DNA修復”、“細胞周期”、“タンパク質アミノ酸リン酸化”、“細胞内シグナル伝達カスケード”、および“細胞接着”)が、4つの特性すべてについて同一であった。他の11個の経路は、特性のうち1、2、または、3つのいずれかに存在したが、すべてではなかった(表3参照)。最近の研究では、異なる遺伝子特性の予後性能を比較することで、転帰予測における一致が同様に見出される(24参照)。しかしながら、我々の現在のアプローチに対して、根底となる経路は調べられていないし、単一の患者コホート、結節状態に関する異質性、および、アジュバント全身療法(25参照)における様々な遺伝子特性が単に比較されたのみである(24参照)。しかしながら、重要なことは、様々な特性において同様の経路が提示されているが、経路において、個々の遺伝子が等しく、同じ方向に貢献することを必ずしも意味しないことに着目することである。特異的な経路における遺伝子は、腫瘍の攻撃性に正または負に関連しているかもしれず、異なる貢献度や顕著な水準を有するかもしれない(図5および図6、ならびに、表5および表6参照)。
【表10】

【表11】

【0052】
a研究した、公開された遺伝子特性には、Wangらによる76個の遺伝子特性(8参照)、van't Veerらによる70個の遺伝子特性(6参照)、Paikらによる16個の遺伝子特性(22参照)、Yuらによる62個の遺伝子特性(23参照)、および、Sotiriouらによる97個の遺伝子特性(21参照)が含まれる。各特性における個々の遺伝子を、ER陽性腫瘍およびER陰性腫瘍についての上位20個の主要経路にマッピングした。
【0053】
結論的に、我々は、統計的方法と生物学的な知識とを組み合わせることにより、遺伝子特性を導き出すことができるということを示した。我々の研究は初めて、乳がんの患者転帰に関係する生物学的経路を体系的に評価するような方法を適用し、同様の転帰予測を提供する公開された様々な予後遺伝子特性が、共通の生物学的プロセスの提示に基づいているという、生物学的な証拠を提供している。鍵となる生物学的プロセスの同定は、個々の遺伝子に基づいた特性の評価よりもむしろ、将来的な薬物開発のための標的を提供する。
【0054】
以下の実施例は、特許請求の範囲に記載した発明を例示するために提示するが、発明を限定するものではない。本明細書で引用したすべての参照文献は、参照により本明細書に組み入れる。
【0055】
〔実施例1〕
≪方法≫
<患者集団>
本研究は、Erasmus MC(オランダ・ロッテルダム)の医薬品倫理委員会(MEC 02.953)に承認され、オランダの医科学学会連盟(Federation of Medical Scientific Societies)(www.fmwv.nl)の行動規範にしたがって実行されたものである。本研究では、Erasmus Medical Center(オランダ・ロッテルダム)の腫瘍バンク由来の344個の乳房腫瘍サンプルのコホートを用いた。これらのサンプルすべてが、リンパ節陰性乳がんを有する患者からのものであり、その患者はいかなるアジュバント全身療法も受けておらず、70%を超える腫瘍内容物を含んでいた。そのうちの286個のサンプルを、遠隔転移を予測するための76個の遺伝子特性を導き出すために用いた(8参照)。実行した分析で、このサブグループにおける数を増やすために、追加の58個のER陰性症例が含まれた。本研究では、患者についてのER状態を、チップのER遺伝子の発現レベルに基づいて決定した。ER発現レベルが、チップの平均強度を計測後1000よりも大きく、600までであるならば、患者はER陽性と見なされる。そうでなければ、患者はER陰性である(26参照)。結果的に、344人の患者集団において、ER陽性患者は221人、ER陰性患者は123人であった。患者の平均年齢は、53歳(中央値52歳、範囲は26〜83歳)、175人(51%)が閉経前であり、169人(49%)が閉経後であった。T1腫瘍(2 cm以下)が168人の患者(49%)に、T2腫瘍(2 cmより大きく5 cm以下)が163人の患者(47%)に、T3/4腫瘍(5 cmより大きい)が12人の患者(3%)に存在し、1人の患者の腫瘍病期が不明であった。以前に説明されたとおり(27参照)、局所病理学者が病理試験を行い、184人の患者が(54%)が不良、45人の患者(13%)が中性、7人の患者(2%)が良性、108人の患者(31%)が不明と、組織学的悪性度がコード付けされた。追跡調査中、103人の患者が5年以内の再発を示し、DMFSについての分析における失敗としてカウントされた。82人の患者が、それまでの再発後に死亡した。いまだ生存している患者の追跡調査時間の中央値は、101月(範囲は61〜171月)であった。
【0056】
<RNA単離とハイブリダイゼーション>
厚さ30μmのクリオスタット切片20〜40個から、全RNAを、RNAzol B(オランダ・フェーネンダールのCampro Scientific)により抽出した。ビオチン化後、説明されたとおり(8参照)、標的をAffymetrix HG-U133Aチップにハイブリダイゼーションした。遺伝子発現シグナルを、Affymetrix GeneChip分析ソフトウェアMAS 5.0を用いて計算した。40未満の平均強度、または、100より高いバックグラウンドを有するチップを取り除いた。チップの平均のシグナル強度を、データ分析前の600の目標にもたらすために、グローバルスケーリングを実行した。
【0057】
検証データセット(21参照)について、分位点正規化(quantile normalization)を実行し、異なるサンプル調製方法、RNA抽出方法、異なるハイブリダイゼーションプロトコルおよびスキャナー由来のバッチ効果を除くために、ANOVAを用いた。
【0058】
<複数の遺伝子特性>
ER陽性乳房腫瘍の遺伝子発現パターンは、ER陰性乳房腫瘍の発現パターンと非常に異なっているので、遺伝子特性を導き出すためのデータ分析、および、その後の経路分析を、別々に実施した。ER陽性患者またはER陰性患者のいずれについても、80個のサンプルを訓練セットとして無作為に選択した。訓練セットについて、患者の無遠隔転移生存(DMFS)時間と最も相関した発現パターンを有する遺伝子を同定するために、単変量Cox比例ハザード回帰を実行した。我々のこれまでの分析により、80人の患者が、安定した性能の予後遺伝子特性を生み出すための訓練セットの最小の大きさを提示するということが示唆された(8参照)。試験セットとしての残りの独立した患者について、腫瘍再発を予測するための特性として、上位100個の遺伝子を用いた。定義点である5年以内の遠隔転移による受信者操作特性(ROC)分析を実施した。濃度曲線下面積(AUC)を、試験セットにおける特性の性能測定として用いた。上記の手順を500回くり返した(図4参照)。このように、100個の各遺伝子の500個の特性が得られた。500個の特性における選択した遺伝子の頻度を計算し、その頻度に基づいて遺伝子をランク付けした。
【0059】
対照として、ER陽性患者またはER陰性患者についての患者臨床情報を無作為に並べ替え、チップデータに再び割り当てた。上記に説明したとおり、訓練セットとして、80個のチップをその後無作為に選択し、並べ替えた臨床情報に基づくCoxモデリングを用いて、上位100個の遺伝子を選択した。上位100個の遺伝子を、残りの患者における再発を予測するための特性として、その後用いた。臨床情報を10回並べ替えた。臨床情報の並べ替えそれぞれについて、80人の患者の50個の様々な訓練セットを作り出した。各訓練セットについて、Coxモデリングに基づいた対照遺伝子リストとして、上位100個の遺伝子を入手した。このように、全体で500個の対照特性を得た。100個の遺伝子の予測性能を、残りの患者で試験した。ROC分析を実施し、試験セットでAUCを計算した。
【0060】
<GOBPへのマッピング>
特性における生物学的経路のうち、過剰提示されたものを同定するために、Affymetrix HG-U133Aチップ上の遺伝子をwww.affymetrix.comからダウンロードした注釈表に基づいて、GOBPカテゴリーにマッピングした。HG-U133Aチップから少なくとも10個のプローブセットを含むカテゴリーを、その後の経路分析のために保持した。各特性の100個の遺伝子をGOBPにマッピングした。GOBPカテゴリーについての超幾何分布確率を、各遺伝子特性について計算した。超幾何分布確率0.05未満であり、100個の遺伝子から2つ以上の遺伝子がヒットした経路を、特性において過剰提示された経路と見なした。500個の特性中に現れた経路の全数を、過剰提示されたものの頻度と見なした。
【0061】
<グローバルテストプログラム>
経路と臨床転帰との関係を評価するために、500個の特性において最も高い頻度を有する上位20個の過剰提示経路それぞれに、グローバルテストプログラム(1、2参照)を行った。グローバルテストは、DMFSのような特異的な臨床パラメーターに対して、全体の遺伝子群の関連を試験するものである。上位の過剰提示経路における個々の遺伝子の関連に対する貢献度をも評価し、顕著な貢献因子を、その後の分析のために選択した。
【0062】
遠隔転移を予測するための特性として、特異的な経路における遺伝子を用いることの可能性を探索するために、過剰提示されたものの頻度に基づいた上位20個のリスト中に存在し、グローバルテストプログラムで最も小さいP値を有するER陽性腫瘍またはER陰性腫瘍についての上位2つの経路を、遺伝子特性を構築するために選んだ。まず、グローバルテストプログラムにより、そのZ値が1.95より高いならば、経路中の遺伝子を選択した。1.95より高いZ値は、遺伝子発現のDMFS時間との関連が有意である(P<0.5)ことを示している(1、2参照)。再発スコアは、負に相関する遺伝子についての重み付けされた発現シグナルと、正に相関する遺伝子についての重み付けされた発現シグナルとの違いである。特性における遺伝子の最適数を決定するために、訓練セットにおける様々な数の遺伝子の特性を用いて、ROC分析を実行した。選択した遺伝子特性の性能を、独立の患者群におけるカプラン・マイヤー生存分析により評価した(21参照)。
【0063】
<複数の遺伝子特性の比較>
乳がんについての様々な予後特性の遺伝子を比較するために、5つの遺伝子の特性を選択した(6、8、21〜23参照)。特性間の遺伝子の相同性を、BLASTプログラムにより決定した。特性における上位20個の経路の提示を試験するために、各特性における遺伝子を、GOBPにマッピングした。
【0064】
<データ利用可能性>
本明細書で分析したマイクロアレイデータを、NCBI/Genbank GEOデータベースに提出した。独立した検証試験セット分析のために用いたマイクロアレイデータおよび臨床データを、アクセッションコードGSE2990によりGene Expression Omnibusデータベース(http://www.ncbi.nlm.nih.gov/geo)から入手した。
【0065】
<統計的方法>
統計分析を、Rシステム(バージョン2.2.1;http://www.r-project.org)を用いて実施した。各訓練セットにおけるDMFSと高い相関を有する遺伝子を同定するために、Cox比例ハザード回帰モデル分析を実行した。Rシステムに含まれる生存パッケージを、生存分析のために用いた。ハザード比率(HR)および95%信頼区間(CI)を、階層Cox回帰分析を用いて推定した。超幾何分布確率分析を、500個の特性それぞれにおける過剰提示経路を同定するために実行した。DMFSに関係する上位の過剰提示経路を評価するために、グローバルテスト(バージョン3.1.1)を用い、経路中の個々の遺伝子の貢献度を視覚化するための方法が提供された。
【0066】
上記の発明を、理解を明確にする目的で、例示および実施例の方法で幾分か詳しく説明してきたが、発明の範囲を限定するものとして、説明および実施例を解釈するべきではない。
【0067】
〔参照文献〕






【0068】
【表12−1】

【表12−2】

【表12−3】

【表12−4】

【表12−5】

【表12−6】

【表12−7】

【表12−8】

【表12−9】

【表12−10】

【表12−11】

【表12−12】

【表12−13】

【表12−14】

【0069】
〔追加配列〕


















【図面の簡単な説明】
【0070】
【図1】500個の遺伝子特性の評価である。
【図2】選択した過剰提示経路についての、個々の遺伝子の発現のDMFS時間との関連である。
【図3】ER陽性腫瘍およびER陰性腫瘍の両方について最も顕著な2つの経路における顕著な最適遺伝子から構築された、経路に基づいた乳がん分類器の検証である。
【図4】データ分析のワークフローを示す。
【図5−1】ER陽性腫瘍における“アポトーシス”経路を示す。
【図5−2】ER陽性腫瘍における“細胞周期の調節”経路を示す。
【図5−3】ER陽性腫瘍における“タンパク質アミノ酸リン酸化”経路を示す。
【図5−4】ER陽性腫瘍における“細胞質分裂”経路を示す。
【図5−5】ER陽性腫瘍における“細胞運動性”経路を示す。
【図5−6】ER陽性腫瘍における“細胞周期”経路を示す。
【図5−7】ER陽性腫瘍における“有糸分裂”経路を示す。
【図5−8】ER陽性腫瘍における“細胞内タンパク質輸送”経路を示す。
【図5−9】ER陽性腫瘍における“有糸分裂染色体分離”経路を示す。
【図5−10】ER陽性腫瘍における“DNA修復”経路を示す。
【図5−11】ER陽性腫瘍における経路を示す。
【図5−12】ER陽性腫瘍における“免疫応答”経路を示す。
【図5−13】ER陽性腫瘍における経路を示す。
【図5−14】ER陽性腫瘍における“DNA複製”経路を示す。
【図5−15】ER陽性腫瘍における経路を示す。
【図5−16】ER陽性腫瘍における“代謝”経路を示す。
【図5−17】ER陽性腫瘍における経路を示す。
【図5−18】ER陽性腫瘍における“走化性”経路を示す。
【図5−19】ER陽性腫瘍における“細胞防御応答”経路を示す。
【図5−20】ER陰性腫瘍における“細胞増殖の調節”経路を示す。
【図5−21】ER陰性腫瘍における“Gタンパク質共役受容体シグナル伝達の調節”経路を示す。
【図5−22】ER陰性腫瘍における“タンパク質アミノ酸リン酸化”経路を示す。
【図5−23】ER陰性腫瘍における経路を示す。
【図5−24】ER陰性腫瘍における“糖代謝”経路を示す。
【図5−25】ER陰性腫瘍における経路を示す。
【図5−26】ER陰性腫瘍における“シグナル伝達”経路を示す。
【図5−27】ER陰性腫瘍における経路を示す。
【図5−28】ER陰性腫瘍における“カルシウムイオン輸送”経路を示す。
【図5−29】ER陰性腫瘍における経路を示す。
【図5−30】ER陰性腫瘍における“細胞内シグナル伝達カスケード”経路を示す。
【図5−31】ER陰性腫瘍における経路を示す。
【図5−32】ER陰性腫瘍における“RNAスプライシング”経路を示す。
【図5−33】ER陰性腫瘍における経路を示す。
【図5−34】ER陰性腫瘍における“Pol IIプロモーターからの転写の調節”経路を示す。
【図5−35】ER陰性腫瘍における経路を示す。
【図5−36】ER陰性腫瘍における“タンパク質複合体集合”経路を示す。
【図5−37】ER陰性腫瘍における経路を示す。
【図5−38】ER陰性腫瘍における“タンパク質生合成”経路を示す。

【特許請求の範囲】
【請求項1】
リンパ節陰性の原発性乳がんの遠隔転移を予測するための方法において、
(a)乳がん細胞を入手する工程と、
(b)前記細胞から、核酸および/またはタンパク質を単離する工程と、
(c)表4中の経路から選択されるバイオマーカーの存在、発現レベル、または、状態を決定するために、前記核酸および/またはタンパク質を分析する工程と、
を含む、方法。
【請求項2】
請求項1に記載の方法において、
遺伝子発現が、表1、表5、または、表6に列挙されたバイオマーカーに対応する前記バイオマーカーの発現を決定することにより、分析される、方法。
【請求項3】
組成物において、
表1、表5、または、表6に列挙されたマーカーに関連するオリゴヌクレオチドを含む、組成物。
【請求項4】
キットにおいて、
請求項1に記載の方法を実施するための、バイオマーカー検出剤を含む、キット。
【請求項5】
物品において、
請求項1に記載の方法を実施するための、バイオマーカー検出剤を含む、物品。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5−1】
image rotate

【図5−2】
image rotate

【図5−3】
image rotate

【図5−4】
image rotate

【図5−5】
image rotate

【図5−6】
image rotate

【図5−7】
image rotate

【図5−8】
image rotate

【図5−9】
image rotate

【図5−10】
image rotate

【図5−11】
image rotate

【図5−12】
image rotate

【図5−13】
image rotate

【図5−14】
image rotate

【図5−15】
image rotate

【図5−16】
image rotate

【図5−17】
image rotate

【図5−18】
image rotate

【図5−19】
image rotate

【図5−20】
image rotate

【図5−21】
image rotate

【図5−22】
image rotate

【図5−23】
image rotate

【図5−24】
image rotate

【図5−25】
image rotate

【図5−26】
image rotate

【図5−27】
image rotate

【図5−28】
image rotate

【図5−29】
image rotate

【図5−30】
image rotate

【図5−31】
image rotate

【図5−32】
image rotate

【図5−33】
image rotate

【図5−34】
image rotate

【図5−35】
image rotate

【図5−36】
image rotate

【図5−37】
image rotate

【図5−38】
image rotate


【公表番号】特表2010−502227(P2010−502227A)
【公表日】平成22年1月28日(2010.1.28)
【国際特許分類】
【出願番号】特願2009−527533(P2009−527533)
【出願日】平成19年9月5日(2007.9.5)
【国際出願番号】PCT/US2007/077593
【国際公開番号】WO2008/030845
【国際公開日】平成20年3月13日(2008.3.13)
【出願人】(505060347)ベリデックス・エルエルシー (43)
【氏名又は名称原語表記】Veridex,LLC
【住所又は居所原語表記】33 Technology Drive,Warren,NJ 07059,U.S.A.
【Fターム(参考)】