説明

結腸直腸癌の再発および化学療法に対する応答の可能性における遺伝子発現プロファイルアルゴリズムおよび試験

癌患者から得られる生物学的試料に由来する予後および/または予測遺伝子、またはその共発現遺伝子の発現レベルの測定、ならびに測定された発現レベルの分析を含み、患者における結腸直腸癌の再発の可能性および/または化学療法に対する有益な応答の可能性に関する情報を提供する、アルゴリズムに基づく分子アッセイが、本明細書中に提供される。予後および/または予測遺伝子の遺伝子発現値を分析する方法、ならびに遺伝子発現−腫瘍領域比、腫瘍関連間質表面積、および遺伝子クリーク、すなわち有効なバイオマーカーとともに共発現することから、アッセイにおいてバイオマーカーと代用されうる遺伝子、を同定する方法もまた、提供される。

【発明の詳細な説明】
【技術分野】
【0001】
関連出願に対する相互参照
本願は、2009年5月1日に出願された米国仮特許出願第61/174,890号明細書および2009年9月2日に出願された米国仮特許出願第61/239,420号明細書の優先権の便益性を主張し、それらの各々は、その全体が参照により本明細書中に援用される。
【0002】
本開示は、結腸直腸癌患者における化学療法に対する応答の予後および予測に関する情報を提供する分子診断アッセイに関する。本開示はまた、1つ以上のバイオマーカー遺伝子とともに共発現する遺伝子を同定する方法を提供する。
【背景技術】
【0003】
結腸直腸癌は、世界的に3番目に一般的な悪性新生物であり、かつ米国および欧州連合における癌関連死亡率の2番目の主因である。下記に考察されるように、米国において毎年診断される新症例は約150,000となり、ここでこれらの約65%は、ステージII/III結腸直腸癌と診断されていると想定される。
【0004】
結腸直腸癌の臨床診断は、一般に、標準的分類基準を用いて癌の進行状況を評価することを含む。2つの分類システム、すなわち、修正されたDuke(またはAstler−Coller)ステージングシステムと、より最近ではAmerican Joint Committee on Cancerによって開発されたTNMステージングが、結腸直腸癌において広く用いられている。結腸直腸癌における再発リスクの推定値および治療決定は、現在、主に腫瘍ステージに基づいている。
【0005】
1980年代にわたって実施された一連の試験によると、フルオロウラシル(「5−FU」)およびレバミゾールまたはロイコボリン(「LV」)を用いた術後アジュバント療法により、結腸癌患者において有意な生存恩恵(survival benefit)がもたらされることが示された。しかし、アジュバント療法の恩恵は、すべての患者によって等しく享受されるわけではない。例えば、アジュバント5−FU/LV化学療法が、比較的少ない(約3%)が統計的に有意な、ステージII結腸癌を有する患者のサブセットに恩恵を与えることが示されている一方、オキサリプラチンの追加により、ステージII疾患の場合、生存恩恵が全く認められないDFS全体が有意に改善された(R.Grayら、Lancet 370:2020−29頁(2007年)、T.Andreら、N Engl J Med(2004年)、J.Kueblerら、J Clin Oncol(2007年)を参照)。さらに、有意な神経毒性およびGI毒性は一般的であり、中毒死(公表された試験において0.5%)については、他の無作為化試験において十分に文書化されている。
【発明の概要】
【発明が解決しようとする課題】
【0006】
これらの結果は、個別の患者における、その再発の可能性および/またはアジュバント化学療法から想定可能な恩恵の規模をよりよく規定する予後および予測試験を同定することの重要性を強調している。現行の指針の下では、手術によって治療されるであろう多数の患者が不要にもアジュバント療法を受ける一方、かかる治療から恩恵を受けるであろう他の患者はそれを受けることがない。
【課題を解決するための手段】
【0007】
癌患者から得られる生物学的試料に由来する予後および/または予測遺伝子またはそれと共発現される遺伝子の発現レベルの測定、ならびに、測定された発現レベルの分析により、患者における結腸直腸癌の再発の可能性(再発スコアまたはRS)および/または化学療法に対する有益な応答の可能性(処置スコアまたはTS)に関する情報を提供すること、を含むアルゴリズムに基づく分子アッセイが、本明細書中に提供される。予後および/または予測遺伝子の遺伝子発現値を分析する方法、ならびに遺伝子クリーク(gene clique)、すなわち有効なバイオマーカーとともに共発現しかつ有効なバイオマーカーとの発現の相関を示すことから、アッセイにおいてそのバイオマーカーと代用されうる遺伝子、を同定する方法もまた提供される。当業者であれば、かかる代用が、アルゴリズム、例えばリスクプロファイルに影響を与え、かつ遺伝子群の重み付けが調整される必要がありうることを理解するであろう。
【0008】
典型的な実施形態では、間質群および細胞周期群を含む遺伝子サブセットに由来する遺伝子の発現レベルを使用し、再発スコア(RS)を計算することが可能である。間質群は、次のもの、すなわち、BGN、FAP、INHBA、または、BGN、FAP、もしくはINHBAとともに共発現する遺伝子、のうちの少なくとも1つを含む。細胞周期群は、次のもの、すなわち、MYBL2、Ki−67、cMYC、MAD2L1、または、MYBL2、Ki−67、cMYC、もしくはMAD2L1とともに共発現する遺伝子、のうちの少なくとも1つを含む。他の典型的な実施形態では、間質遺伝子はBGNであり、かつ細胞周期遺伝子はKi−67である。
【0009】
典型的な実施形態では、追加的な遺伝子サブセットに由来する1つ以上の遺伝子の遺伝子発現レベルを測定し、使用し、細胞シグナル伝達群、および血管新生群、および/またはアポトーシス群を含むRSを計算することが可能である。細胞シグナル伝達群は、GADD45BおよびGADD45Bとともに共発現する遺伝子を含む。アポトーシス群は、BIKおよびBIKとともに共発現する遺伝子を含む。血管新生群は、EFNB2およびEFNB2とともに共発現する遺伝子を含む。計算は、RSアルゴリズムを実行するようにプログラムされたコンピュータ上で行うことが可能である。
【0010】
典型的な実施形態では、本方法は、患者から得られる腫瘍試料中での予測遺伝子の発現レベルを測定するステップと、測定された遺伝子発現レベルを用い、患者における処置スコア(TS)を計算するステップと、をさらに含んでもよく、ここでTSは、測定された発現レベルをTSアルゴリズムの遺伝子サブセットに代入することによって計算され、ここで遺伝子サブセットは、各々、MSI群、アポトーシス群、および間質群に由来する少なくとも1つの遺伝子を含む。TSの計算は、TSアルゴリズムを実行するようにプログラムされたコンピュータ上で行うことが可能である。典型的な実施形態では、患者における恩恵スコアは、RSおよびTSに基づいて計算可能である。典型的な実施形態では、MSI群は、AXIN2およびAXIN2とともに共発現する遺伝子を含んでもよい。典型的な実施形態では、アポトーシス群は、BIKおよびBIKとともに共発現する遺伝子を含んでもよい。典型的な実施形態では、間質群は、EFNB2およびEFNB2とともに共発現する遺伝子を含んでもよい。典型的な実施形態では、遺伝子サブセットは、転写因子群をさらに含んでもよく、ここで例えば転写因子群は、RUNX1およびRUNX1とともに共発現する遺伝子を含む。典型的な実施形態では、遺伝子サブセットは、細胞周期群をさらに含んでもよく、ここで例えば細胞周期群は、MAD2L1およびHSPE1、ならびにMAD2L1およびHSPE1とともに共発現する遺伝子を含む。典型的な実施形態では、遺伝子サブセットに由来する少なくとも1つの遺伝子は、RANBP2、BUB1、TOP2A、C20_ORF1、CENPF、STK15、AURKB、HIF1A、UBE2C、およびMSH2、ならびに、RANBP2、BUB1、TOP2A、C20_ORF1、CENPF、STK15、AURKB、HIF1A、UBE2C、およびMSH2とともに共発現する遺伝子からなる群に由来する代用遺伝子によって置き換えてもよい。
【0011】
典型的な実施形態では、各遺伝子サブセットにおける発現レベルは、遺伝子サブセットの再発リスクおよび/または化学療法に対する応答への寄与に基づいて重み付けてもよい。
【0012】
本開示は、腫瘍の特定の領域内での特定の遺伝子サブセットの発現の変動性を考慮して遺伝子発現を分析するための方法を提供する。典型的な実施形態では、本方法は、RSアルゴリズムに組み込まれうる。例えば、間質群における遺伝子発現レベルは、結腸直腸腫瘍の間質単位面積あたりの間質遺伝子発現値の比として計算することが可能である。同様に、細胞周期群における遺伝子発現レベルは、結腸直腸腫瘍の上皮単位面積あたりの細胞周期発現値の比として計算することが可能である。
【0013】
本開示は、患者から得られる結腸腫瘍試料中の腫瘍関連間質の表面積の測定値の分析に基づいて結腸癌再発の可能性を評価するための方法を提供する。典型的な実施形態では、本方法は、RSアルゴリズムに組み込まれうる。
【0014】
本開示は、アルゴリズムに基づく遺伝子発現分析において用いられる発現値における閾値を使用するための方法であって、患者から得られる組織切片中の遺伝子の発現レベルを測定するステップと、測定された発現レベルを前記遺伝子における閾値と比較するステップと、を含み、ここで、閾値が前記遺伝子の発現レベルより小さい場合、発現値は発現アルゴリズムにおいて用いられ、またここで、前記遺伝子の発現レベルが閾値より大きいかもしくはそれに等しい場合、発現レベルは発現アルゴリズムにおいて用いられる、方法を提供する。
【0015】
典型的な実施形態では、閾値は、C値に基づく。閾値は、例えば、表3中に列挙される閾値からの1つ以上であってもよい。
【0016】
本開示は、標的遺伝子とともに共発現される遺伝子を同定するための遺伝子発現分析方法であって、アレイプローブに基づき、癌試料におけるマイクロアレイ遺伝子発現データを正規化するステップと、すべての固有のアレイプローブ対における遺伝子発現レベルに基づき、相関係数を計算するステップと、有意なプローブ対を判定するステップと、を含み、ここで、有意なプローブ対は、有意な閾値より大きい相関係数を有する、標的遺伝子プローブおよびアレイプローブであり、標的遺伝子をその対応する標的遺伝子プローブにマッピングするステップと、候補プローブセットを選択するステップと、ここで各候補プローブは、有意なプローブ対の一部であり、各候補プローブに関連した遺伝子を同定するステップと、ここで各候補プローブに関連した前記遺伝子は、共発現遺伝子である、を含む、方法を提供する。
【0017】
本開示はまた、遺伝子発現を評価する方法であって、患者から得られる癌試料中での遺伝子の正規化発現レベルを測定するステップと、結腸直腸試料中での組織単位面積に対する遺伝子の正規化発現の比を計算するステップと、ここで組織単位面積は、腫瘍関連間質単位面積または腫瘍上皮単位面積であり、比を用いて患者における再発スコア(RS)または処置スコア(TS)を計算するステップと、を含む、方法を提供する。関連する実施形態では、遺伝子は、間質群遺伝子である。関連する実施形態では、組織単位面積は、腫瘍関連間質単位面積である。さらに関連する実施形態では、遺伝子は、細胞周期群遺伝子である。関連する実施形態では、組織単位面積は、腫瘍上皮単位面積である。
【0018】
本開示は、癌患者における予後を判定する方法であって、癌患者から得られる腫瘍試料の間質面積を測定し、間質リスクスコア(Stromal Risk Score)を得るステップと、ここで腫瘍試料の間質面積の増大は、前記癌患者における癌の再発リスクの増大と正に相関する、間質リスクスコアに基づく報告を生成するステップと、を含む、方法を提供する。関連する実施形態では、腫瘍試料は、結腸直腸癌である。
【図面の簡単な説明】
【0019】
【図1】NSABP C−01/02患者およびCCF患者における無再発期間(RFI)の一変量コックスPH回帰モデルからの、両試験におけるRFIに有意に関連した65の遺伝子に対する遺伝子発現におけるハザード比推定値および95%信頼区間を提供するグラフのセットである。
【図2】C−01/02/04/06およびCCF患者におけるRFIの一変量コックスPH回帰モデルからの、手術単独および手術+FUに基づく化学療法の双方におけるRFIに有意に関連する48の遺伝子に対する遺伝子発現におけるハザード比推定値および95%信頼区間を提供する一連のグラフである。
【図3a】再発スコアの三分位による、手術単独で処置されたステージII患者の無再発期間のカプラン・マイヤー推定値を図示するグラフである。
【図3b】再発スコアの三分位による、手術単独で処置されたステージIII患者の無再発期間のカプラン・マイヤー推定値を図示するグラフである。
【図4a】ステージII結腸癌患者における再発のリスクプロファイルおよび再発スコア(RS)を図示するグラフおよび表を提供する。
【図4b】手術単独でのステージIII結腸癌患者における再発のリスクプロファイルおよび再発スコア(RS)を図示するグラフおよび表を提供する。
【図5】ステージII患者における化学療法恩恵のプロットを提供するグラフである。
【図6】BGN、FAPおよびINHBAにおける閾値分析を図示するグラフ群を提供する。
【図7】cMYC、Ki−67およびMYBL2における閾値分析を図示するグラフ群を提供する。
【図8】GADD45Bにおける閾値分析を図示するグラフ群を提供する。
【図9】EFNB2、RUNX1およびBIKにおける閾値分析を図示するグラフ群を提供する。
【図10】MAD2L1、HSPE1およびAXIN2における閾値分析を図示するグラフ群を提供する。
【図11】遺伝子クリークの播種(seeding)を図示する略図である。
【図12】手術単独で処置されたQUASARステージII結腸癌患者からの群リスクを示すカプラン・マイヤー曲線である。
【図13】5年再発リスクおよび再発スコアにおける(カプラン・マイヤー曲線による)リスクプロファイルプロットである。
【図14】腫瘍関連間質および腫瘍内腔面積における間質群スコア(SGS)および細胞周期群スコア(CCGS)を示すグラフである。
【図15】患者6名に対する腫瘍関連間質における間質群スコアの分析結果を示すグラフである。
【図16】患者11名のブロックから採取された腫瘍切片間での間質群および細胞周期群スコア、GADD45B、およびRSの変動性の分析結果を示すグラフである。
【図17】すべての結腸癌試験を通じた多重遺伝子再発スコアモデルにおける性能の範囲を示すグラフである。
【図18】間質群遺伝子(BGN)および細胞周期群遺伝子(Ki−67)を含む2遺伝子モデルの性能。
【図19】間質群遺伝子(BGN)、細胞周期群遺伝子(Ki−67)およびアポトーシス群遺伝子(BIK)を含む3遺伝子モデルの性能。
【図20】QUASAR試験からの手術単独患者における10遺伝子予後モデル(RS2)対7遺伝子予後モデル(RS)の比較性能。
【図21】結腸癌患者444名における間質面積の自然対数に対する変動性プロットである。
【図22】間質リスク群によって分類されるステージII結腸癌患者におけるカプラン・マイヤープロットである。
【図23】間質リスク群によって分類されるステージIII結腸癌患者におけるカプラン・マイヤープロットである。
【図24】間質リスク群および再発スコアリスク群によって分類されるステージII結腸癌患者におけるカプラン・マイヤー推定値を提供する。
【図25】間質リスク群および再発スコアリスク群によって分類されるステージIII結腸癌患者におけるカプラン・マイヤー生存曲線を提供する。
【図26】Ki−67の(非正規化)遺伝子発現(C)測定値に対する希釈RNA濃度の効果を示すグラフである。
【発明を実施するための形態】
【0020】
定義
他に定義されない限り、本明細書で使用される科学技術用語は、本発明に属する当業者によって共通に理解される場合と同じ意味を有する。Singletonら、「Dictionary of Microbiology and Molecular Biology」、第2版、J.Wiley & Sons(New York、NY、1994年)、およびMarch、「Advanced Organic Chemistry Reactions,Mechanisms and Structure」、第4版、John Wiley & Sons(New York、NY、1992年)は、当業者に、用語の多くが本願で使用される一般的指針を提供する。
【0021】
当業者は、本発明の実施において使用できると思われる多くの方法および材料(本明細書中に記載されるものに類似または匹敵する)を理解するであろう。事実、本発明は、決して本明細書中に記載の方法および材料に限定されることはない。本発明の目的のため、次の用語が以下に定義される。
【0022】
用語「腫瘍」および「病変」は、本明細書で使用される場合、すべての新生物細胞の成長および増殖(悪性または良性のいずれか)、ならびにすべての前癌性および癌性の細胞および組織を示す。
【0023】
用語「癌」および「癌性」は、典型的には無秩序な細胞成長によって特徴づけられる、哺乳類における生理学的状態を示すかまたは説明する。本開示における癌の例として、胃腸管の癌、例えば侵襲性結腸直腸癌またはDukes B(ステージII)またはDukes C(ステージIII)結腸直腸癌が挙げられる。
【0024】
癌の「病理」は、患者の健康を損なわせるすべての現象を含む。これは、限定はされないが、異常もしくは制御不能な細胞成長、転移、近隣細胞の正常な機能との干渉、異常レベルでのサイトカインもしくは他の分泌産物の放出、炎症もしくは免疫応答の抑制もしくは悪化、新形成、前悪性、悪性、周囲もしくは遠隔の組織もしくは器官、例えばリンパ節への浸潤などを含む。
【0025】
用語「結腸癌」および「結腸直腸癌」は、本明細書で使用される場合、交換可能にまた最も広義に使用され、かつ、(1)大腸および/または直腸の上皮細胞から生じる癌のすべてのステージおよびすべての形態、ならびに/あるいは(2)大腸および/または直腸の内膜に作用する癌のすべてのステージおよびすべての形態、を示す。結腸直腸癌の分類に用いられるステージングシステムにおいては、結腸および直腸は、1つの器官として処置される。
【0026】
結腸直腸癌の様々なステージが、American Joint Committee on Cancer(AJCC)の腫瘍、結節、転移(TNM)ステージングシステム(Greeneら(編)、「AJCC Cancer Staging Manual」、第6版、New York、NY:Springer;2002年)に従い、以下のように定義される。
【0027】
腫瘍:Tl:腫瘍が粘膜下に浸潤する T2:腫瘍が筋固有層に浸潤する;T3:腫瘍が筋固有層を貫通して漿膜下組織または結腸周囲もしくは直腸周囲組織に浸潤する;T4:腫瘍が他の器官または構造に直接浸潤し、および/または穿孔する。
【0028】
結節:N0:領域リンパ節転移なし;N1:領域リンパ節転移が1〜3つ;N2:領域リンパ節転移が4つ以上。
【0029】
転移:M0:mp遠隔転移;M1:遠隔転移あり
【0030】
ステージ分類:ステージI:T1 NO MO;T2 NO MO;ステージII:T3 NO MO;T4 NO MO;ステージIII:任意のT、N1−2;MO;ステージIV:任意のT、任意のN、M1。
【0031】
修正されたDuke Staging Systemによると、結腸直腸癌の様々なステージは、以下のように定義される。
【0032】
ステージA:腫瘍が腸壁の粘膜に浸潤するが、それ以上に浸潤しない;ステージB:腫瘍が腸壁の筋固有層に浸潤し、それを貫通する;ステージC:腫瘍が腸壁の筋固有層に浸潤するが、それを貫通せず、リンパ節内に結腸直腸癌の病理学的証拠が認められる;または腫瘍が腸壁の筋固有層に浸潤し、それを貫通し、リンパ節内に癌の病理学的証拠が認められる;ステージD:腫瘍がリンパ節の境界を超え、他の器官、例えば肝臓、肺または骨に拡散している。
【0033】
予後因子は、結腸直腸癌の自然な経過に関連する変数であり、それは、一旦患者が結腸直腸癌を発症していると、その再発率および転帰に影響を与える。予後の悪化に関連している臨床パラメータは、例えば、リンパ節関与、および高グレードの腫瘍を含む。予後因子を用い、患者が異なるベースライン再発リスクを有する亜群に分類されることが多い。
【0034】
用語「予後」は、癌患者が、新生物疾患、例えば結腸癌の再発、転移拡散、および薬剤耐性を含む、癌に起因する死亡または進行を有する可能性の予測を示すように本明細書中で使用される。
【0035】
用語「予後遺伝子」は、発現が標準治療で処置された癌患者における癌再発の可能性と正または負に相関する遺伝子を示すように本明細書で使用される。遺伝子は、遺伝子発現レベルと対応するエンドポイントとの相関に依存する、予後および予測遺伝子の双方であってもよい。例えば、コックス比例ハザードモデルを用い、遺伝子が予後に限られる場合、そのハザード比(HR)は、標準治療で処置された患者または新しい介入で処置された患者において測定される場合、変化しない。
【0036】
用語「予測」は、癌患者が、原発性腫瘍の外科的除去後の処置に対して特定の臨床応答(陽性(「有益な応答」)または陰性のいずれか)を有する可能性を示すように本明細書で使用される。例えば、処置であれば、化学療法を含んでもよい。
【0037】
本発明の予測方法を臨床的に用い、任意の特定の患者に対して最適な治療法を選択することにより、治療決定を下してもよい。本開示の予測方法は、患者が、治療計画、例えば化学療法、手術介入、またはその両方に対して好ましく応答する(「有益な応答」)可能性が高いか否かを予測する上で貴重なツールである。予測は、予後因子を含んでもよい。
【0038】
用語「予測遺伝子」および「応答インジケーター遺伝子(response indicator gene)」は、発現レベルが化学療法での処置に対する有益な応答の可能性と正または負に相関する遺伝子を示すように本明細書で交換可能に使用される。遺伝子は、遺伝子発現レベルと対応するエンドポイント(例えば、再発を伴わない生存の可能性、化学療法に対する有益な応答の可能性)との相関に依存する、予後および予測遺伝子の双方(およびその逆)であってもよい。予測遺伝子は、コックス比例ハザードモデルを用いて同定し、処置Aで処置された患者からの遺伝子発現レベルと処置Aを受けていない(但し、標準治療、例えば処置Bを受けている場合がある)患者の場合との間の相互作用効果を試験してもよい。予測遺伝子におけるハザード比(HR)は、未処置/標準治療患者において測定される場合、処置Aで処置された患者に対して変化することになる。
【0039】
遺伝子に対して適用される用語「発現レベル」は、本明細書で使用される場合、遺伝子産物の正規化レベル、例えば遺伝子のRNA発現レベルまたは遺伝子のポリペプチド発現レベルに対して判定された正規化値を示す。
【0040】
用語「遺伝子産物」または「発現産物」は、mRNAを含む遺伝子のRNA転写産物、およびかかるRNA転写産物のポリペプチド翻訳産物を示すように本明細書で使用される。遺伝子産物は、例えば、未スプライス化RNA、mRNA、スプライス変異体mRNA、マイクロRNA、断片化RNA、ポリペプチド、翻訳後修飾ポリペプチド、スプライス変異体ポリペプチドなどであってもよい。
【0041】
用語「RNA転写産物」は、本明細書で使用される場合、例えば、mRNA、未スプライス化RNA、スプライス変異体mRNA、マイクロRNA、および断片化RNAを含む、遺伝子のRNA転写産物を示す。
【0042】
他に指示されない限り、本明細書で使用される各遺伝子名称は、本願の出願日時点での、遺伝子に割り付けられ、かつEntrez Gene(URL:www.ncbi.nlm.nih.gov/sites/entrez)によって提供される形式記号(Official Symbol)に対応する。
【0043】
用語「相関した」および「関連した」は、2つの測定値(または測定された実体)の間の関連性の強さを示すように本明細書で交換可能に使用される。本開示は、発現レベルが、例えば遺伝子の発現レベルと、薬剤での処置に対する有益な応答の可能性またはマイクロサテライト不安定性(microsatellite instability)(MSI)表現型状態(status)との間の特定の転帰尺度(outcome measure)に関連した、遺伝子および遺伝子サブセットを提供する。例えば、遺伝子の発現レベルの増大は、患者における良好な臨床転帰の可能性の増大、例えば癌の再発を伴わない長期生存および/または化学療法に対する有益な応答の可能性の増大などと正に相関する(正に関連する)場合がある。かかる正の相関は、様々な方法で、例えば低いハザード比により、統計的に実証可能である。別の例では、遺伝子の発現レベルの増大は、患者における良好な臨床転帰の可能性の増大と負に相関する(負に関連する)場合がある。その場合、例えば、患者は、癌の再発を伴わない長期生存および/または化学療法に対する有益な応答の可能性の低下などを有する場合がある。かかる負の相関は、患者が予後の不良を有する可能性が高いかまたは化学療法に対する応答が不良となることを示し、またこれは、様々な方法で、例えば高いハザード比により、統計的に実証可能である。「相関した」はまた、2つの異なる遺伝子の発現レベルの間の関連性の、第1の遺伝子の発現レベルが、第2の遺伝子の発現レベルと、それらの発現の相関を踏まえた所与のアルゴリズムにおいて、代用されうるような強さで示すように本明細書で使用される。アルゴリズムにおいて代用されうる2つの遺伝子のかかる「相関した発現」は、通常は、互いに正に相関する遺伝子発現レベルを示し、例えば、第1の遺伝子の発現の増大が転帰(例えば良好な臨床転帰の可能性の増大)と正に相関する場合、共発現されかつ第1の遺伝子と相関した発現を示す第2の遺伝子はまた、同じ転帰と正に相関する。
【0044】
「正の臨床転帰」および「有益な応答」は、限定はされないが、(1)減速および完全な成長停止を含む、腫瘍成長のある程度の阻害;(2)腫瘍細胞の数の減少;(3)腫瘍サイズの減少;(4)隣接する末梢器官および/または組織への腫瘍細胞浸潤の阻害(すなわち、低下、減速または完全な停止);(5)転移の阻害;(6)腫瘍の退縮または拒絶をもたらす可能性がある、抗腫瘍免疫応答の促進;(7)腫瘍に関連した1つ以上の症状の、ある程度の軽減;(8)処置後の生存期間の延長;および/または(9)処置後の所与の時点での死亡率の低下、を含む、患者に対する恩恵を示す任意のエンドポイントを用いて評価してもよい。正の臨床転帰はまた、臨床転帰の様々な尺度の観点で表してもよい。正の臨床転帰はまた、個体の転帰の、それに匹敵する臨床診断を有する患者の集団の転帰との関連で考慮してもよく、かつ、例えば、無再発期間(RFI)の期間の増大、集団内での全生存(OS)に対する生存期間の増大、無疾患生存(DFS)の期間の増大、遠隔無再発期間(DRFI)の期間の増大などの様々なエンドポイントを用いて評価してもよい。正の臨床転帰の可能性の増大は、癌再発の可能性の低下に対応する。
【0045】
用語「リスク分類」は、対象が特定の臨床転帰を経験することになるリスクのレベル(または可能性)を意味する。対象は、リスク群に分類されるか、または本開示の方法に基づくリスクのレベル、例えば、高、中等度、もしくは低リスクで分類されうる。「リスク群」は、特定の臨床転帰における類似レベルのリスクを有する対象または個体の群である。
【0046】
用語「長期」生存は、特定の期間、例えば、少なくとも3年間、より好ましくは少なくとも5年間の生存を示すように本明細書で使用される。
【0047】
用語「無再発期間(RFI)」は、無作為化から最初の結腸癌再発または結腸直腸癌の再発に起因する死亡にかけての期間(数年)を示すように本明細書で使用される。
【0048】
用語「全生存(OS)」は、無作為化から任意の原因に起因する死亡にかけての期間(数年)を示すように本明細書で使用される。
【0049】
用語「無疾患生存(DFS)」は、無作為化から最初の結腸癌再発または任意の原因に起因する死亡にかけての期間(数年)を示すように本明細書で使用される。
【0050】
用語「遠隔無再発期間(DRFI)」は、手術から解剖学的に遠隔での最初の癌再発にかけての期間(数年)を示すように本明細書で使用される。
【0051】
上掲の尺度の計算は事実上、打ち切り扱いされるべきかまたは考慮されるべきでないイベントの定義により、試験間で変動しうる。
【0052】
用語「腫瘍関連間質単位面積」(または「sua」)は、腫瘍周囲の腫瘍関連間質面積の測定値を示すように本明細書で使用される。間質は、血管、結合組織およびリンパ球様細胞などの成分を含む上皮に対する支持体を提供する器官の枠組みまたはマトリックスである。結腸においては、腫瘍関連間質は、正常な間質、上皮、平滑筋および悪性上皮細胞の間に介在する。
【0053】
用語「腫瘍上皮単位面積」(または「cua」)は、癌性(例えば悪性)上皮細胞を含む腫瘍の上皮面積の測定値を示すように本明細書で使用される。結腸においては、腫瘍関連上皮細胞は、形状が腺であり、ゲノム的にクローン性であり、かつ腺癌と称される。
【0054】
用語「間質面積」は、本明細書で使用される場合、患者試料から得られる生物学的試料中での結腸腫瘍関連間質の表面積を示す。間質面積は、任意の好適な方法、例えばマイクロメーター、またはヘマトキシリンおよびエオシン(H&E)切片の標準的もしくはデジタル微視的評価によって測定してもよい。
【0055】
用語「間質リスク」は、本明細書で使用される場合、間質面積に基づく、結腸癌を有する患者の再発リスクの推定値を示す。患者から得られる結腸癌内の間質面積の量は、その患者における結腸癌の再発リスクに関連している。存在する間質面積の量の増加に伴い、結腸癌再発のリスクが増大する。この推定値は、例えば、結腸癌患者が再発を有する可能性を示す間質リスクスコアまたはグループの形式、例えば、数値範囲、記述的カテゴリ(低、中等度、高)などで提供されうる。
【0056】
用語「マイクロアレイ」は、基質上の、ハイブリダイズ可能なアレイ要素、例えばオリゴヌクレオチドまたはポリヌクレオチドプローブの秩序正しい配列を示す。
【0057】
用語「ポリヌクレオチド」は、単数または複数で使用される場合、一般に任意のポリリボヌクレオチドまたはポリデオキシリボヌクレオチドを示し、それは未修飾RNAもしくはDNAまたは修飾RNAもしくはDNAであってもよい。したがって、例えば、ポリヌクレオチドは、本明細書で定義される場合、限定はされないが、一本鎖および二本鎖DNA、一本鎖および二本鎖領域を含むDNA、一本鎖および二本鎖RNA、ならびに一本鎖および二本鎖領域を含むRNA、一本鎖もしくはより典型的には二本鎖であるかまたは一本鎖および二本鎖領域を含みうるDNAおよびRNAを含むハイブリッド分子、を含む。さらに、用語「ポリヌクレオチド」は、本明細書で使用される場合、RNAもしくはDNAまたはRNAおよびDNAの双方を含む三本鎖領域を示す。かかる領域内の鎖は、同じ分子または異なる分子に由来する場合がある。同領域は、1つ以上の分子のすべてを含みうるが、より典型的には分子の一部の領域のみを含みうる。三重らせん領域の分子の1つは、オリゴヌクレオチドであることが多い。用語「ポリヌクレオチド」は、詳細にはcDNAを含む。同用語は、1つ以上の修飾塩基を有する(cDNAを含む)DNAおよびRNAを含む。したがって、骨格が安定性または他の理由のために修飾された、DNAまたはRNAは、同用語が本明細書中で意図される場合の「ポリヌクレオチド」である。さらに、通常と異なる塩基、例えばイノシン、または修飾塩基、例えばトリチウム化(tritiated)塩基を含むDNAまたはRNAは、本明細書で定義される用語「ポリヌクレオチド」の範囲内に含まれる。一般に、用語「ポリヌクレオチド」は、未修飾ポリヌクレオチドのすべての化学的、酵素的および/または代謝的修飾形態、ならびにウイルスおよび細胞(単純および複合細胞を含む)に特徴的なDNAおよびRNAの化学的形態を包含する。
【0058】
用語「オリゴヌクレオチド」は、限定はされないが、一本鎖デオキシリボヌクレオチド、一本鎖または二本鎖リボヌクレオチド、RNArDNAハイブリッドおよび二本鎖DNAを含む、比較的短いポリヌクレオチドを示す。オリゴヌクレオチド、例えば一本鎖DNAプローブオリゴヌクレオチドは、化学的方法により、例えば市販されている自動化オリゴヌクレオチドシンセサイザーを使用して合成されることが多い。しかし、オリゴヌクレオチドは、インビトロ組換えDNA媒介技術を含む種々の他の方法により、また細胞および生物におけるDNAの発現により、作成可能である。
【0059】
遺伝子に適用される用語「発現レベル」は、本明細書で使用される場合、遺伝子の発現産物のレベル、例えば遺伝子のRNA発現産物または遺伝子のポリペプチド発現レベルに対して決定される正規化値を示す。
【0060】
用語「C」は、本明細書で使用される場合、反応中に生じる蛍光が規定の閾値、すなわち反応中に十分な数のアンプリコンが規定の閾値に達するまで蓄積されているポイント、を十分に超える定量ポリメラーゼ連鎖反応(qPCR)におけるサイクル数である閾値サイクルを示す。
【0061】
用語「閾値(threshold)」または「閾値化(thresholding)」は、遺伝子発現測定値と臨床応答との間の非線形的関係を明らかにし、さらに報告される患者スコアにおける変動を低減するために用いられる手順を示す。閾値化が適用される場合、閾値より小さいかまたは大きいすべての測定値は、その閾値に設定される。遺伝子発現と転帰との間の非線形的関係であれば、スムーザーまたは三次スプラインを用いて試験し、無再発期間に対するコックスPH回帰または再発状態に対するロジスティック回帰における遺伝子発現をモデル化することが可能である。報告される患者スコアにおける変動の場合、特定の遺伝子における定量および/または検出の限界での遺伝子発現における変動性の関数として試験することが可能である。
【0062】
用語「アンプリコン」は、本明細書で使用される場合、増幅技術、例えばポリメラーゼ連鎖反応(PCR)およびリガーゼ連鎖反応を用いて合成されているDNAの断片を示す。
【0063】
ハイブリダイゼーション反応の「ストリンジェンシー」は、当業者によって容易に判定可能であり、一般に、プローブ長、洗浄温度、および塩濃度に依存する経験的計算値である。一般に、プローブの伸長には、適切なアニーリングのための高温化が必要である一方、プローブの短縮には、低温化が必要である。ハイブリダイゼーションは、一般に、相補鎖がその融解温度より低い環境下で存在する場合での、変性DNAが再アニールする能力に依存する。プローブとハイブリダイズ可能な配列との間の所望される相同性の程度が高まると、使用可能な相対温度が高くなる。結果として、相対温度が高くなる場合、反応条件のストリンジェンシーが高まる一方、低温化する場合、それが低下する傾向があることになる。ハイブリダイゼーション反応のストリンジェンシーのさらなる詳細および説明については、Ausubelら、「Current Protocols in Molecular Biology」、Wiley Interscience Publishers(1995年)を参照のこと。
【0064】
「ストリンジェントな条件」または「高いストリンジェンシー条件」では、本明細書で定義される場合、典型的には、(1)洗浄のために低いイオン強度および高温、例えば、50℃で、0.015M塩化ナトリウム/0.0015Mクエン酸ナトリウム/0.1%ドデシル硫酸ナトリウムが使用されるか、(2)ハイブリダイゼーションの間、変性剤、例えばホルムアミド、例えば、42℃で、pH6.5(750mM塩化ナトリウム、75mMクエン酸ナトリウムによる)で、0.1%ウシ血清アルブミン/0.1%フィコル/0.1%ポリビニルピロリドン/50mMリン酸ナトリウム緩衝液を有する50%(v/v)ホルムアミドが使用されるか、あるいは(3)42℃で、50%ホルムアミド、5×SSC(0.75M NaCl、0.075Mクエン酸ナトリウム)、50mMリン酸ナトリウム(pH6.8)、0.1%ピロリン酸ナトリウム、5×デンハルト溶液、超音波処理されたサケ精子DNA(50μg/ml)、0.1%SDS、および10%硫酸デキストランが使用され、それに伴い、42℃、0.2×SSC(塩化ナトリウム/クエン酸ナトリウム)および50%ホルムアミドで洗浄後、55℃でEDTAを含有する0.1×SSCからなる高ストリンジェンシー洗浄がなされる。
【0065】
「中等度のストリンジェントな条件」は、Sambrookら、「Molecular Cloning:A Laboratory Manual」、New York:Cold Spring Harbor Press、1989年に記載のように同定し、かつ、上記の場合よりもストリンジェンシーが低い洗浄溶液およびハイブリダイゼーション条件(例えば、温度、イオン強度および%SDS)の使用を含んでもよい。中等度のストリンジェントな条件の例が、20%ホルムアミド、5×SSC(150mM NaCl、15mMクエン酸三ナトリウム)、50mMリン酸ナトリウム(pH7.6)、5×デンハルト溶液、10%硫酸デキストラン、および20mg/mlの変性、せん断サケ精子DNAを含有する溶液中、37℃で一晩のインキュベーション、それに続くフィルタの約37〜50℃の1×SSCでの洗浄である。当業者は、プローブ長などの要素に対応する必要性から、温度、イオン強度などをいかに調節するかを理解するであろう。
【0066】
用語「スプライシング」および「RNAスプライシング」は、交換可能に使用され、イントロンを除去し、エクソンを結合させ、連続コード配列を有する成熟mRNA(真核細胞の細胞質に移動する)を生成するRNAプロセシングを示す。
【0067】
用語「エクソン」は、本明細書で使用される場合、成熟RNA産物中に現れる分断遺伝子の任意のセグメントを示す。用語「イントロン」は、本明細書で使用される場合、転写されても、そのいずれかの一側面でエクソンとともにスプライシングすることにより、転写産物内部から除去されるDNAの任意のセグメントを示す。「イントロンRNA」は、DNAのイントロン領域に由来するmRNAを示す。操作により、エクソン配列は、参照配列番号によって規定される遺伝子のmRNA配列内に生じる。操作により、イントロン配列は、遺伝子のゲノムDNA内部の介在配列である。
【0068】
用語「共発現される」は、本明細書で使用される場合、ある遺伝子の発現レベルと別の遺伝子の発現レベルとの間の統計的相関を示す。ペアワイズ共発現は、当該技術分野で既知の様々な方法により、例えばピアソン相関係数またはスピアマン相関係数を計算することにより、計算可能である。また、共発現遺伝子クリークは、グラフ理論を用いて同定されうる。共発現の分析については、正規化発現データを用いて計算されうる。
【0069】
「コンピュータに基づくシステム」は、情報の分析に使用されるハードウェア、ソフトウェア、およびデータ記憶媒体のシステムを示す。患者用のコンピュータに基づくシステムの最低限のハードウェアは、中央処理装置(CPU)、ならびにデータ入力、データ出力(例えばディスプレイ)、およびデータ記憶のためのハードウェアを含む。当業者は、任意の現在使用可能なコンピュータに基づくシステムおよび/またはその部品が本開示の方法に関連した用途に適することを容易に理解することができる。データ記憶媒体は、上記の本情報の記録を含む任意の製品、またはかかる製品にアクセス可能なメモリアクセス装置を含んでもよい。
【0070】
コンピュータで読み取り可能な媒体上のデータ、プログラミングまたは他の情報を「記録する」ことは、当該技術分野で既知の任意のかかる方法を用いて情報を格納するためのプロセスを示す。任意の便利なデータ記憶構成は、格納された情報へのアクセスに用いられる手段に基づいて選択してもよい。種々のデータプロセッサのプログラムおよびフォーマット、例えばワープロ用テキストファイル、データベースフォーマットなどは、記憶のために使用してもよい。
【0071】
「プロセッサ」または「演算手段」は、それに要求される機能を実行することになる任意のハードウェアおよび/またはソフトウェアの組み合わせを示す。例えば、好適なプロセッサは、例えば電子制御装置、メインフレーム、サーバまたはパーソナルコンピュータ(デスクトップまたは携帯型)の形態で利用可能である、プログラム可能なデジタルマイクロプロセッサであってもよい。プロセッサがプログラム可能である場合、好適なプログラミングは、遠隔位置からプロセッサにかけて通信可能であるか、またはコンピュータプログラム製品(磁気的、光学的または固体デバイスのいずれかに基づく、携帯型または固定型コンピュータで読み取り可能な記憶媒体など)内に予め保存可能である。例えば、磁気媒体または光学的ディスクは、プログラミングを有する場合があり、かつ、その対応するステーションで各プロセッサと通信する好適なリーダによって読み取り可能である。
【0072】
用語「手術」は、本明細書で使用される場合、切除(resection)、開腹、結腸切除(リンパ節切除を伴う場合または伴わない場合)、切除治療、内視鏡的除去、切除(excision)、解剖、および腫瘍生検/除去を含む、癌組織の除去のために行われる外科的手技に適用される。遺伝子発現分析のために使用される腫瘍組織または切片は、場合により、これらの方法のいずれかから得られている。
【0073】
「グラフ理論」は、本明細書で使用される場合、状況が点とそれらの点の一部に接続する線のセットを有する図形によって表されるコンピュータ科学および数学における研究の分野を示す。図形は、「グラフ」と称され、点および線は、グラフの「頂点(vertex)」および「エッジ(edge)」と称される。遺伝子共発現分析の観点では、遺伝子(またはそれに等価な識別子、例えばアレイプローブ)は、グラフにおけるノードまたは頂点として表されうる。2つの遺伝子間の類似性の尺度(例えば、相関係数、相互情報、交替条件付き期待値(alternating conditional expectation))が有意な閾値より高くなる場合、2つの遺伝子は共発現されているといわれ、エッジがグラフ内に引かれることになる。所与の試験におけるすべての有望な遺伝子対に対する共発現されたエッジが引かれている場合、すべての最大クリークが算出される。得られた最大クリークは、遺伝子クリークとして定義される。遺伝子クリークは、既定の基準を満たす算出された共発現遺伝子群である。
【0074】
用語「遺伝子クリーク」および「クリーク」は、本明細書で使用される場合、すべての頂点が、エッジにより、部分グラフのすべての他の頂点に接続されたグラフの部分グラフを示す。
【0075】
「最大クリーク」は、本明細書で使用される場合、他に頂点が加えられなくてもクリークでありうる場合のクリークである。
【0076】
5−フルオロウラシル(5−FU)に関する「応答の予測のためのマーカー」およびそれに類する表現への言及は、それらの意味の範囲内で、単独療法として、または他の作用剤との併用において、またはプロドラッグとして、または手術および放射線などの局所療法と併せて、またはアジュバントもしくはネオアジュバント化学療法として、または新生物疾患の処置に対する多様なアプローチの一部として、5−FUを含む処置に対する応答を包含する。
【0077】
用語「5−FUに基づく治療」、「5−FUに基づく処置」、および「5−FU療法」は、本明細書で使用される場合、5−FUまたはそのプロドラッグの投与を包含し、5−FU併用の投与または5−FU併用療法をさらに包含することを示すように交換可能に使用される。
【0078】
「5−FU併用」または「5−FU併用療法」は、5−FUと別の作用剤との併用を示す。多数の作用剤が、5−FUと組み合わされ、生化学的調節を通じて細胞毒性活性を促進している。5−ホルミル−テトラヒドロ葉酸(ロイコボリン)の形態での外因性葉酸塩の添加は、チミジル酸シンターゼの阻害を維持する。メトトレキサートは、プリン合成を阻害し、かつ特定の基質の細胞プールにおける5−FUとの反応性を増強することにより、5−FUの活性化を促進する。シスプラチンと5−FUとの併用は、5−FUの抗腫瘍活性を増強する。オキサリプラチンは、結腸直腸癌を処置するため、一般に5−FUおよびロイコボリンと併用され、またそれは、おそらくはジヒドロピリミジンデヒドロゲナーゼ(5−FUの異化に関与する酵素)を阻害することにより、5−FUの異化を阻害可能であり、さらにチミジル酸シンターゼの発現を阻害可能である。5−FUとイリノテカン、トポイソメラーゼ−1阻害剤との併用は、5−FUを異なる作用機序を有する作用剤と併用する処置である。ジヒドロピリミジンデヒドロゲナーゼの不活性化剤であるエニルウラシルは、5−FUの有効性を改善するための別の方法をもたらす。
【0079】
「5−FUプロドラッグ」は、患者への投与後、5−FUの活性をもたらす薬剤を示す。多数の5−FUプロドラッグが開発されている。例えば、カペシタビン(N4−ペントキシカルボニル(pentoxycarbonyl)−5’−デオキシ−5−フルオロシチジン)は、結腸直腸癌を含む特定の処置に対して、FDAによって認可されている経口投与剤である。5−FUにおけるプロドラッグとして作用する別のフルオロピリミジンは、フロラフール(florafur)である。
【0080】
アルゴリズムに基づく方法および遺伝子サブセット
本開示は、想定される臨床転帰(予後)および/または癌を有する患者が化学療法に対する臨床的に有益な応答を有する可能性(予測)を判定するための、アルゴリズムに基づく分子診断アッセイを提供する。例えば、予後遺伝子の発現レベルを用い、結腸直腸癌再発の可能性を計算することが可能である。予測遺伝子、場合によっては予測および予後遺伝子の発現レベルを用い、結腸直腸癌を有する患者が化学療法に対する臨床的に有益な応答を有する可能性を計算することが可能である。癌は、例えばステージIIおよび/またはステージIII結腸直腸癌であってもよい。化学療法は、例えば5−FUに基づく化学療法であってもよい。
【0081】
本開示は、患者における癌再発の可能性に基づいて腫瘍を分類するための方法を提供する。再発の可能性は、特定の遺伝子サブセット由来の予後遺伝子の発現レベルに基づいて計算され、ここで遺伝子サブセットは、各々が間質群および細胞周期群に由来する少なくとも1つの遺伝子を含む。予後遺伝子サブセットはまた、細胞シグナル伝達群、アポトーシス群、および/または転写因子群に由来する少なくとも1つの遺伝子を含んでもよい。
【0082】
本開示は、癌を有する患者が、予測遺伝子の発現レベルに基づいた、化学療法に対する有益な応答を有する可能性に従い、腫瘍を分類する方法を提供する。有益な応答の可能性は、特定の遺伝子サブセットに由来する予測遺伝子の発現レベルに基づいて計算され、ここで遺伝子サブセットは、間質群、アポトーシス群、およびMSI群の各々に由来する少なくとも1つの遺伝子を含む。予測遺伝子サブセットはまた、転写因子群および/または細胞周期群に由来する少なくとも1つの遺伝子を含んでもよい。
【0083】
「間質群」として本明細書で同定される遺伝子サブセットは、主に間質細胞によって合成されかつ間質応答に関与する遺伝子、および間質群遺伝子とともに共発現する遺伝子、を含む。「間質細胞」は、生物学的組織の支持構造を形成する結合組織細胞として本明細書で定義される。間質細胞は、線維芽細胞、免疫細胞、周皮細胞、内皮細胞、および炎症細胞を含む。「間質応答」は、原発性腫瘍または浸潤の部位での宿主組織の線維形成応答を示す。例えば、E.Rubin、J.Farber、Pathology、985−986頁(第2版、1994年)を参照のこと。間質群は、例えば、BGN、FAP、INHBA、およびBGN、FAP、またはINHBAとともに共発現される遺伝子を含み、ここで遺伝子は、遺伝子の発現レベルが0.6より大きいかもしくはそれに等しいピアソン相関係数を示す場合、間質遺伝子とともに共発現されるといわれている。例えば、間質群は、(特許請求の範囲の直前の明細書中に提供される)表4、5および6に示される遺伝子および/または遺伝子クリークを含む。間質群中から使用される遺伝子の組み合わせは、発現が評価されるべきである場合の分析の方法に応じて変更されうる。例えば、結腸直腸癌再発の可能性に従って腫瘍を分類する対象の間質群は、BGN、FAPおよびINHBAを含む。本明細書中で「細胞周期群」として同定される遺伝子サブセットは、細胞周期機能に関与する遺伝子、および細胞周期群遺伝子とともに共発現する遺伝子、を含む。「細胞周期機能」は、細胞増殖および細胞周期制御、例えばチェックポイント/G1からS相への遷移として本明細書で定義される。したがって、細胞周期群は、(1)細胞周期機能に関連した生物学的経路に関与し、かつ(2)0.4より大きいかもしくはそれに等しいピアソン相関係数で、Ki−67、cMYC、MYBL2、MAD2L1、またはHSPE1とともに共発現する、遺伝子を含む。Ki−67、cMYC、MYBL2、MAD2L1、およびHSPE1における典型的な共発現遺伝子および/または遺伝子クリークは、表5および6において提供される。細胞周期群中から使用される遺伝子の組み合わせは、発現が評価されるべきである場合の分析の方法に応じて変更されうる。例えば、結腸直腸癌再発の可能性に従って腫瘍を分類するための細胞周期群は、Ki−67、cMYC、MYBL2、MAD2L1、およびHSPE1を含む。患者が化学療法に対する有益な応答を有する可能性に従って腫瘍を分類する対象の細胞周期群は、MAD2L1およびHSPE1を含む。
【0084】
本明細書は、腫瘍の間質に関連した遺伝子が、再発リスクの増大に関連する一方、細胞周期遺伝子が再発リスクの低下と相関することを示すデータを開示する。さらに、本開示は、特定の遺伝子における発現レベルが腫瘍の領域に対して変動するという観察を踏まえた予後および予測方法を提供する。
【0085】
詳細には、本開示は、(1)腫瘍関連間質内の間質遺伝子、および(2)腫瘍の内腔部内の細胞周期遺伝子、の発現レベルが高まるという証拠を提供する。発現レベル対腫瘍領域面積の比は、患者間で変動する。腫瘍関連間質と腫瘍の内腔部との間でのこの発現の比は、本明細書で開示される予後および予測方法において用いてもよい。
【0086】
典型的な実施形態では、間質遺伝子の発現値は、間質単位面積あたりの間質遺伝子発現を用いて計算可能であり、かつ細胞周期遺伝子の発現値は、上皮単位面積あたりの細胞周期遺伝子発現を用いて計算可能である。したがって、治療に対する応答のRFI予測および予測の再現性および正確性を高めるため、予後および予測アルゴリズムにより、腫瘍関連間質の面積および腫瘍内腔領域の面積を考慮に入れてもよい。当業者であれば、パーセント間質およびパーセント上皮を得るために利用可能な従来の方法が多数あることを理解するであろう。例えば、かかる比の場合、分析されるべき組織切片に直接隣接したH&Eスライドを試験することによって得られうる。この場合、病理学者(肉眼的測定値を得るため)またはデジタル画像解析(より正確な測定値を得るため)のいずれかによって実行可能である。
【0087】
さらに、本開示は、間質面積の測定値が結腸癌患者に対する予後値を有するという証拠を提供する。詳細には、腫瘍の腫瘍関連間質領域の間質表面積は、再発リスクの増大と正に相関する。この再発リスクは、間質リスクスコアの形式で報告するか、または他のソース、例えば再発スコアから得られるリスク情報と組み合わせてもよい。
【0088】
本明細書で「血管新生群」として同定される遺伝子サブセットは、新しい毛細血管の形成を調節するかまたはそうでなければ「創傷治癒」に関与する遺伝子を含む。血管新生群は、(1)創傷治癒機能に関連した生物学的経路に関与し、かつ(2)0.6より大きいかもしくはそれに等しいピアソン相関係数で、EFNB2とともに共発現する、遺伝子を含む。
【0089】
本明細書で「アポトーシス群」として定義される遺伝子サブセットは、アポトーシス機能に関与する遺伝子およびアポトーシス群遺伝子とともに共発現する遺伝子を含む。「アポトーシス機能」は、アポトーシスまたはプログラム化された細胞死を正または負に誘発することが意図された一連の細胞シグナル伝達として本明細書で定義される。アポトーシス群は、BIKと、0.6より大きいかもしくはそれに等しいピアソン相関係数の場合にBIKとともに共発現する遺伝子と、を含む。本明細書で「細胞シグナル伝達群」として定義される遺伝子サブセットは、細胞成長およびアポトーシスに作用するシグナル伝達経路に関与する遺伝子、ならびに細胞シグナル伝達群遺伝子とともに共発現する遺伝子を含む。細胞シグナル伝達群は、GADD45Bと、0.6より大きいかもしくはそれに等しいピアソン相関係数で、GADD45Bとともに共発現する遺伝子と、を含む。GADD45Bとともに共発現する典型的な遺伝子が、表4および5中に提供される。表4は、発現が(ランクおよびピアソン共発現係数により)有効な予後および/または予測遺伝子と高度に相関する場合の遺伝子を提供する。表5は、有効な遺伝子バイオマーカーの遺伝子モジュール/クリーク分析による遺伝子の同定の結果を提供する。
【0090】
本明細書で「転写因子群」として定義される遺伝子サブセットは、転写因子機能に関与する遺伝子および転写因子群遺伝子とともに共発現する遺伝子を含む。「転写因子機能」は、単独でまたは複合体の一部として、DNAのRNAへの転写を促進するための特定のDNA配列への結合として本明細書で定義される。転写因子群は、RUNX1と、0.6より大きいかもしくはそれに等しいピアソン相関係数で、RUNX1とともに共発現する遺伝子と、を含む。転写因子群によって包含される典型的な共発現遺伝子および/または遺伝子クリークは、表5および6中に提供される。
【0091】
本明細書で「MSI群」として定義される遺伝子サブセットは、マイクロサテライト不安定性が高い(MSI−H)状態と統計的に有意な相関を有することが知られる遺伝子およびMSI群遺伝子とともに共発現する遺伝子を含む。診療指針は、MSI−H組織学が、結腸直腸癌患者における癌スクリーニングの推奨を作成する上で考慮すべき1つの要素であることを示す(例えば、「NCCN Practice Guidelines in Oncology」、第2版、2008年を参照)。MSI群は、AXIN2と、(1)MSI−H状態に有意に関連するか、または(2)0.4より大きいかもしくはそれに等しい相関係数で、AXIN2とともに共発現する、遺伝子と、を含む。MSI群によって包含される典型的な共発現遺伝子および/または遺伝子クリークは、表5中に提供される。
【0092】
本開示はまた、特定の遺伝子における閾値発現レベルを判定するための方法を提供する。閾値発現レベルは、予後または予測遺伝子において計算可能である。遺伝子における閾値発現レベルは、正規化発現レベルに基づく場合がある。一例では、C閾値発現レベルは、ロジスティック回帰を用いて関数形式を評価することによって計算可能である。
【0093】
本開示は、定量RT−PCR(qRT−PCR)によって同定される特定の標的遺伝子とともに共発現する遺伝子、例えば特定のタイプの癌に関連する有効なバイオマーカーを判定するための方法をさらに提供する。共発現遺伝子は、それ自体で有用なバイオマーカーである。共発現遺伝子は、それが共発現する相手の予後または予測遺伝子マーカーと代用されうる。本方法は、マイクロアレイデータから遺伝子クリークを同定するステップと、マイクロアレイデータを正規化するステップと、アレイプローブにおけるペアワイズスピアマン相関行列を算出するステップと、異なる試験を通じて有意な共発現プローブを濾過除去するステップと、グラフを作成するステップと、プローブを遺伝子にマッピングするステップと、遺伝子クリークの報告を生成するステップと、を含んでもよい。例えば、予後および/または予測遺伝子クリークの1つ以上の遺伝子の発現レベルを用い、結腸直腸癌を有する患者が、再発を経験し、および/または化学療法に対して応答する可能性を計算することが可能である。「予後遺伝子クリーク」は、本明細書で使用される場合、予後遺伝子を含む遺伝子クリークを示す。「予測遺伝子クリーク」は、本明細書で使用される場合、予測遺伝子を含む遺伝子クリークを示す。
【0094】
限定はされないが、RT−PCR、マイクロアレイ、ハイスループット配列決定、遺伝子発現の連続分析(SAGE)およびデジタル遺伝子発現(DGE)を含む、開示される遺伝子の発現レベルを判定するための様々な技術的アプローチは、本明細書中に示され、以下に詳細に考察されることになる。特定の態様では、各遺伝子の発現レベルは、エクソン、イントロン、タンパク質エピトープおよびタンパク質活性を含む、遺伝子の発現産物の様々な特徴に関連して判定されうる。1つ以上の予後および/または予測遺伝子、またはそれらの発現産物は、マイクロサテライト不安定性(MSI)状態について分析されうる。
【0095】
予後および/または予測遺伝子の発現レベルは、腫瘍組織内で測定してもよい。例えば、腫瘍組織は、腫瘍の外科的除去または切除時に、または腫瘍生検によって得られる。予後および/または予測遺伝子の発現レベルはまた、腫瘍からの遠隔部位、例えば循環腫瘍細胞、体液(例えば、尿、血液、血液画分など)から回収される腫瘍細胞内で測定してもよい。
【0096】
アッセイされる発現産物は、例えば、RNAまたはポリペプチドであってもよい。発現産物は、断片化されていてもよい。例えば、アッセイでは、発現産物の標的配列に相補的なプライマーを使用してもよく、その場合、全転写産物および標的配列を有する断片化発現産物を測定可能である。さらに、情報は、(特許請求の範囲に先立つ明細書中に挿入される)表AおよびB中に提供される。
【0097】
RNA発現産物は、直接に、またはPCRに基づく増幅方法、例えば定量逆転写ポリメラーゼ連鎖反応(qRT−PCR)から得られるcDNA産物の検出により、アッセイ可能である(例えば、米国特許公開第2006−0008809A1号明細書を参照)。ポリペプチド発現産物は、免疫組織化学(IHC)を用いてアッセイ可能である。さらに、RNAおよびポリペプチド発現産物の双方はまた、マイクロアレイを用いてアッセイ可能である。
【0098】
臨床的有用性
本明細書で開示される方法の実施によって提供される、アルゴリズムに基づくアッセイおよびそれに関連する情報により、医師はより十分な情報に基づく治療決定を行うことが容易になり、また、個別の患者の需要に応じた結腸直腸癌の処置がカスタマイズされ、それにより、処置恩恵が最大化され、かつ、有意な恩恵を提供することがほぼ皆無であり、また毒性副作用に起因する重篤なリスクを有することが多い不要な処置への患者の暴露が最小化される。
【0099】
多重分析物遺伝子発現試験を用い、いくつかの関連する生理学的プロセスまたは細胞成分(component cellular)特性の各々に関与する1つ以上の遺伝子の発現レベルを測定することが可能である。
【0100】
本明細書で開示される方法でかかるスコアを計算するために使用されるアルゴリズムにより、遺伝子の発現レベル値を分類することが可能である。遺伝子の分類は、例えば上で考察された群内での、生理的機能または細胞成分特性による遺伝子の寄与に関する知識に基づき、少なくとも部分的に行ってもよい。さらに、群の形成により、様々な発現レベルの再発および/または処置スコアへの寄与の数学的重み付けが容易になる。生理的プロセスまたは細胞成分特性を表す遺伝子群の重み付けは、そのプロセスまたは特性の、癌の病理および臨床転帰への寄与に反映しうる。したがって、本開示は、本明細書で開示される方法において使用するための、本明細書で同定される予後および予測遺伝子のサブセットを提供する。
【0101】
再発および/または処置スコアの決定に基づき、患者は、再発および/または処置スコアの選択される値に基づき、亜群(例えば、三分位または四分位)に区分化可能であり、そこでは、所与の範囲内の値を有するすべての患者が、特定のリスク群または処置恩恵群に属するものとして分類されうる。したがって、選択される値は、患者の亜群をそれぞれ、リスクが増大もしくは低下する場合および/または恩恵が増大もしくは低下する場合で規定することになる。
【0102】
結腸直腸癌の転帰および/または化学療法に対する応答を予測する場合での遺伝子マーカーの有用性は、そのマーカーに特有でない場合がある。選択されるマーカー遺伝子の場合と同様の発現パターンを有する代替マーカーは、試験マーカーと代用してもよく、またはそれと併用してもよい。かかる遺伝子の共発現により、発現レベル値の代用の場合、試験の全体的な予後および/または予測の有用性に対してほとんど影響を有しない必要がある。2つの遺伝子の酷似する発現パターンは、結腸腫瘍細胞内での同じプロセスおよび/または共通の調節制御下での両遺伝子の関与から生じうる。したがって、本開示では、かかる共発現遺伝子または遺伝子セットに対する、本開示の予後および/または予測方法での代用、またはそれとの併用について検討される。
【0103】
本方法は、術後に再発する可能性が高く、またアジュバント化学療法から恩恵を受けることになる、結腸直腸癌患者の同定を提供しうる。かかる方法は、単独で使用するか、または患者の分類のための他の臨床的方法、例えば病理学(腫瘍グレードおよび組織学)または分子マーカー(例えば、チミジンシンターゼ、チミジンホスホリラーゼ(TP)、ジヒドロピリミジンデヒドロゲナーゼ(DPD)、またはマイクロサテライト不安定性(MSI)状態などの遺伝子の発現レベル)と併用してもよい。
【0104】
結腸および/または直腸のステージIIおよび/またはステージIII癌における臨床転帰を予測するための、本明細書で開示される方法によって提供されるアルゴリズムに基づく分子アッセイおよびそれに関連する情報は、結腸および/または直腸のステージIIおよび/またはステージIII癌を処置し、臨床試験への参加(またはそれからの除外)として癌患者を分類し、患者および医師が治療決定を行うように援助することを目的とする、多数の領域、例えば薬剤の開発および適切な使用において有用性を有し、個人化されたゲノムプロファイルに基づく処置を標的にすることなどによって経済的利益を提供する。例えば、再発スコアを、臨床試験における患者から採取される試料に対して用い、試験の結果を、患者の亜群が新しい薬剤への応答を示す可能性が全群または他の亜群より高いか低いかを判定するため、患者転帰と併用してもよい。さらに、かかる方法を用い、治療から恩恵を受けうる患者のサブセットを臨床データから同定可能である。さらに、患者は、試験の結果が、患者が手術単独で処置される場合に臨床転帰の不良を有する可能性が高まることを示す場合、臨床試験に含められる可能性が高くなり、また、患者は、試験の結果が、患者が手術単独で処置される場合に臨床転帰の不良を有する可能性が低下することを示す場合、臨床試験に含められる可能性が低くなる。
【0105】
直腸腫瘍のステージングは、結腸腫瘍ステージングに関する類似基準に基づいて行ってもよいが、例えば流入領域リンパ節の配置における差異に起因するいくらかの差異が存在する。結果として、ステージII/III直腸腫瘍は、それらの進行状態に関して、ステージII/III結腸腫瘍と合理的な相関を有する。上記のように、局所再発の速度および予後の他の局面は、直腸癌と結腸癌との間で異なり、またこれらの差異は、直腸腫瘍の全切除を行う上での困難さから生じうる。にもかかわらず、結腸癌と直腸癌との間に、各腫瘍の分子特性に関して差異があるという強力な証拠は全くない。直腸癌患者における化学療法処置上の恩恵を予測可能な試験は、結腸癌試験において挙げられるような性質において同様の有用性を有し、同じマーカーであれば、両方の癌タイプにおいて有用性を有するのも理解できる。
【0106】
標準治療に応答しない可能性がより高い患者を同定する試験は、薬剤の開発、例えば代替薬剤の有効性を試験する臨床試験への参加について患者を同定することにおいて有用である。例えば、ステージIII結腸癌患者の30〜35%は、腫瘍の外科的切除後にフルオロウラシルに基づく化学療法で処置される場合、5年生存することができない。新しいステージIII結腸癌処置のための臨床試験にこれらの患者が優先的に参加する場合、効率を実質的に改善し、かつかかる臨床試験のコストを低減することができる。
【0107】
遺伝子産物の発現レベルをアッセイする方法
本開示の方法および組成物では、他に指示されない限り、分子生物学(組換え技術を含む)、微生物学、細胞生物学、および生化学の従来の技術(それらは当業者の範囲内である)が用いられることになる。典型的な技術は、文献、例えば「Molecular Cloning:A Laboratory Manual」、第2版(Sambrookら、1989年);「Oligonucleotide Synthesis」(M.J.Gaitら、1984年);「Animal Cell Culture」(R.I.Freshneyら、1987年);「Methods in Enzymology」(Academic Press,Inc.);「Handbook of Experimental Immunology」、第4版(D.M.WeirおよびC.C.Blackwell編、Blackwell Science Inc.、1987年);「Gene Transfer Vectors for Mammalian Cells」(J.M.MillerおよびM.P.Calos編、1987年);「Current Protocols in Molecular Biology」(F.M.Ausubelら編、1987年);および「PCR:The Polymerase Chain Reaction」、(Mullisら編、1994年)の中で十分に説明されている。
【0108】
遺伝子発現プロファイリングの方法は、ポリヌクレオチドのハイブリダイゼーション分析に基づく方法、ポリヌクレオチドの配列決定に基づく方法、およびプロテオミクスに基づく方法を含む。試料中でのmRNA発現の定量についての当該技術分野で既知の典型的な方法は、ノーザンブロッティングおよびインサイチュハイブリダイゼーション(ParkerおよびBarnes、「Methods in Molecular Biology」 106:247−283頁(1999年));RNアーゼ保護アッセイ(Hod、Biotechniques 13:852−854頁(1992年));ならびにPCRに基づく方法、例えば逆転写PCT(RT−PCR)(Weisら、「Trends in Genetics」 8:263−264頁(1992年))を含む。DNA二本鎖、RNA二本鎖、およびDNA−RNAハイブリッド二本鎖またはDNA−タンパク質二本鎖を含む配列特異的二本鎖を認識可能な抗体を使用してもよい。配列決定に基づく遺伝子発現分析における代表的方法は、遺伝子発現の連続分析(SAGE)、および大規模並列シグネチャー配列決定(massively parallel signature sequencing)(MPSS)による遺伝子発現分析を含む。
【0109】
逆転写酵素PCR(RT−PCR)
典型的には、mRNAは、試験試料から単離される。出発材料は、典型的にはヒト腫瘍、通常は原発性腫瘍から単離される全RNAである。場合により、同じ患者に由来する正常な組織は、内部対照として使用してもよい。mRNAは、組織試料、例えば、新しい凍結した(例えば新鮮冷凍)、またはパラフィン包埋および固定(例えばホルマリン固定)がなされた試料から抽出してもよい。
【0110】
mRNAを抽出するための一般的方法は、当該技術分野で周知であり、Ausubelら、「Current Protocols of Molecular Biology」、John Wiley and Sons(1997年)を含む、分子生物学の標準的教科書において開示されている。パラフィン包埋組織からRNAを抽出するための方法は、例えば、RuppおよびLocker、Lab Invest.56:A67(1987年)、およびDe Andresら、BioTechniques 18:42044頁(1995年)に開示されている。特に、RNA単離は、精製キット、緩衝液セットおよびプロテアーゼ(商業製造業者、例えばQiagen製)を使用し、製造業者の使用説明書に従って行ってもよい。例えば、培養物中の細胞由来の全RNAは、Qiagen RNeasyミニカラムを使用して単離してもよい。他の市販のRNA単離キットは、MasterPure(商標)Complete DNAおよびRNA Purification Kit(EPICENTRE(登録商標)(Madison,WI))、およびParaffin Block RNA Isolation Kit(Ambion,Inc.)を含む。組織試料に由来する全RNAは、RNA Stat−60(Tel−Test)を使用して単離してもよい。腫瘍から調製されるRNAは、例えば塩化セシウム密度勾配遠心分離によって単離してもよい。
【0111】
次いで、RNAを含有する試料に対し、逆転写がなされ、RNA鋳型からcDNAを生成した後、PCR反応における指数的増幅が行われる。2つの最も一般的に使用される逆転写酵素は、トリ骨髄芽球症ウイルス逆転写酵素(AMV−RT)およびモロニーネズミ白血病ウイルス逆転写酵素(MMLV−RT)である。逆転写ステップは、典型的には、発現プロファイリングの環境および目標に応じて、特異的プライマー、ランダムヘキサマー、またはオリゴ−dTプライマーを使用してプライミングされる。例えば、抽出RNAは、GeneAmp RNA PCRキット(Perkin Elmer(CA,USA))を使用し、製造業者の使用説明書に従って逆転写してもよい。次いで、得られたcDNAは、後続するPCR反応における鋳型として使用してもよい。
【0112】
PCRに基づく方法では、熱安定性DNA依存性DNAポリメラーゼ、例えばTaq DNAポリメラーゼが使用される。例えば、TaqMan(登録商標)PCRでは、典型的には、TaqもしくはTthポリメラーゼの5’−ヌクレアーゼ活性を用い、ハイブリダイゼーションプローブ(その標的アンプリコンに結合)が加水分解されるが、等しい5’ヌクレアーゼ活性を有する任意の酵素を使用してもよい。2つのオリゴヌクレオチドプライマーを使用し、PCR反応産物に典型的なアンプリコンが生成される。第3のオリゴヌクレオチド、またはプローブは、ハイブリダイゼーション部位と2つのPCRプライマーとの間に位置するアンプリコンのヌクレオチド配列の検出を容易にするように設計してもよい。プローブは、例えばレポーター色素で検出可能に標識してもよく、さらに、Taqman(登録商標)プローブ構成などの場合、蛍光色素、およびクエンチャー蛍光色素の双方を設けてもよい。Taqman(登録商標)プローブが使用される場合、増幅反応の間、Taq DNAポリメラーゼ酵素は、鋳型に依存する様式でプローブを切断する。得られたプローブ断片は、溶液中で解離し、放出されたレポーター色素からのシグナルは、第2のフルオロフォアのクエンチング効果を受けない。レポーター色素の1つの分子は、合成される新しい各分子に対して遊離され、かつ急冷されていないレポーター色素の検出により、データの定量解釈における基盤が提供される。
【0113】
TaqMan(登録商標)RT−PCRは、市販の機器、例えば、ABI PRISM 7700(商標)Sequence Detection System(商標)(Perkin−Elmer−Applied Biosystems(Foster City,CA,USA))、またはLightcycler(Roche Molecular Biochemicals(Mannheim,Germany))などを使用して実施してもよい。好ましい実施形態では、5’ヌクレアーゼ法は、ABI PRISM7700(商標)Sequence Detection System(商標)などのリアルタイム定量PCR装置上で実行される。同システムは、サーモサイクラー、レーザー、電荷結合デバイス(CCD)、カメラおよびコンピュータから構成される。同システムは、サーモサイクラー上で、384ウェルフォーマットで試料を増幅する。RT−PCRは、10μLの反応容量あたり2ngに相当するRNAインプットを用い、3通りのウェル内で実行してもよい。増幅の間、レーザー誘導蛍光シグナルは、すべてのウェルに対し、光ファイバケーブルを通じてリアルタイムに収集され、CCDで検出される。同システムは、機器を実行しかつデータを分析するためのソフトウェアを含む。
【0114】
5’−ヌクレアーゼアッセイデータは、最初に閾値サイクル(「C」)として表される。蛍光値は、すべてのサイクルの間に記録され、増幅反応中にそのポイントまで増幅される産物の量を示す。閾値サイクル(C)は、一般に、蛍光シグナルが統計的に有意なものとして最初に記録される場合のポイントとして説明される。
【0115】
誤差および試料間変動の効果を最小化するため、RT−PCRは通常、内部標準を用いて実行される。理想的な内部標準遺伝子(参照遺伝子とも称される)は、同じ起源の癌性および非癌性組織内での一定レベル(すなわち、正常および癌性組織内で有意に異ならないレベル)で発現され、かつ実験的処置によって有意に影響されない(すなわち、化学療法への暴露の結果として、関連組織内で発現レベルにおける有意な差異を示さない)。例えば、本明細書で開示される方法において有用な参照遺伝子であれば、癌性結腸において、正常な結腸組織に対して有意に異なる発現レベルを示さない必要がある。遺伝子発現のパターンを正規化するために最も頻繁に使用されるRNAは、ハウスキーピング遺伝子のグリセルアルデヒド−3−リン酸−デヒドロゲナーゼ(GAPDH)およびβ−アクチンにおけるmRNAである。正規化に使用される典型的な参照遺伝子は、次の遺伝子、すなわち、ATP5E、GPX1、PGK1、UBB、およびVDAC2のうち1つ以上を含む。遺伝子発現測定値は、1つ以上の(例えば、2、3、4、5、もしくはそれより多くの)参照遺伝子の平均に対して正規化されうる。参照−正規化発現測定値は、0〜15の範囲でありうる(1単位の増加が一般にRNA量の2倍の増加を反映する場合)。
【0116】
リアルタイムPCRは、定量競合PCR(各標的配列における内部競争者が正規化のために使用される場合)と、試料内部に含有される正規化遺伝子、またはRT−PCR用のハウスキーピング遺伝子を使用する定量比較PCRとの双方に匹敵する。さらなる詳細については、例えば、Heldら、Genome Research 6:986−994頁(1996年)を参照のこと。
【0117】
本開示の方法において用いられる代表的プロトコルのステップでは、RNA源として固定パラフィン包埋組織が使用される。mRNA単離、精製、プライマー伸長および増幅は、当該技術分野で利用可能な方法に従って予備成形してもよい(例えば、Godfreyら、J.Molec.Diagnostics 2:84−91頁(2000年);Spechtら、Am.J.Pathol.158:419−29頁(2001年))。つまり、代表的プロセスは、パラフィン包埋腫瘍組織試料の約10μm厚切片への切断から開始する。次いで、RNAは抽出され、またタンパク質およびDNAはRNA含有試料から除去される。RNA濃度の分析後、RNAは遺伝子特異的プライマーを使用して逆転写された後、RT−PCRにより、cDNA増幅産物がもたらされる。
【0118】
イントロンに基づくPCRプライマーおよびプローブの設計
PCRプライマーおよびプローブは、目的の遺伝子のmRNA転写産物中に存在するエクソンまたはイントロン配列に基づいて設計可能である。プライマー/プローブ設計は、公的に入手可能なソフトウェア、例えば、Kent W.J.、Genome Res.12(4):656−64頁(2002年)によって開発されたDNA BLATソフトウェアを使用するか、またはBLASTソフトウェア(そのバリエーションを含む)により、行ってもよい。
【0119】
標的配列の反復配列は、必要であるかまたは所望される場合、マスクされ、非特異的シグナルを緩和することが可能である。これを行うための典型的なツールは、Baylor College of Medicineを通じてオンラインで利用可能なRepeat Maskerプログラムを含み、それは反復配列のライブラリーに対してDNA配列をスクリーニングし、かつ反復配列がマスクされたクエリー配列を戻す。次いで、マスクされたイントロン配列を使用し、任意の市販されているかまたはそうでなければ公的に利用可能なプライマー/プローブ設計パッケージ、例えばPrimer Express(Applied Biosystems);MGB assay−by−design(Applied Biosystems);Primer3(Steve RozenおよびHelen J.Skaletsky(2000年) 「Primer3 on the WWW for general users and for biologist programmers.」 In:Rrawetz S.Misener S.(編) 「Bioinformatics Methods and Protocols:Methods in Molecular Biology.」 Humana Press(Totowa,NJ)、365−386頁)を使用し、プライマーおよびプローブ配列を設計することが可能である。
【0120】
PCRプライマー設計に影響を与えうる他の要素は、プライマー長、融解温度(Tm)、およびG/C含量、特異性、相補的プライマー配列、および3’末端配列を含む。一般に、最適なPCRプライマーは、一般に、17〜30塩基長であり、かつ約20〜80%、例えば約50〜60%のG+C塩基などを有し、また50〜80℃の間、例えば約50〜70℃のTmを示す。
【0121】
PCRプライマーおよびプローブ設計におけるさらなる指針については、例えば、Dieffenbach C.W.ら、「General Concepts for PCR Primer Design in:PCR Primer,A Laboratory Manual」、Cold Spring Harbor Laboratory Press、New York、1995年、133−155頁;InnisおよびGelfand、「Optimization of PCRs in:PCR Protocol,A Guide to Methods and Applications」、CRC Press、London、1994年、5−11頁;およびPlasterer T.N. 「Primerselect:Primer and Probe design.」 Methods Mol.Biol.70:520−527頁(1997年)(これらの全開示内容は、参照により本明細書中に明示的に援用される)を参照のこと。
【0122】
表AおよびBは、本明細書で開示される実施例に関連したプライマー、プローブ、およびアンプリコン配列に関するさらなる情報を提供する。
【0123】
MassARRAY(登録商標)システム
MassARRAYに基づく方法、例えば、Sequenom,Inc.(San Diego,CA)によって開発された典型的な方法では、RNAの単離および逆転写後に得られるcDNAは、単一の塩基を除くすべての位置での標的化cDNA領域に一致し、かつ内部標準としての役割を果たす、合成DNA分子(競争者)でスパイクされる。cDNA/競争者混合物は、PCR増幅され、PCR後のエビアルカリホスファターゼ(SAP)酵素処理を受け、結果として、残存するヌクレオチドの脱リン酸化が生じる。アルカリホスファターゼの不活性化後、競争者およびcDNAに由来するPCR産物は、プライマー伸長を受け、競争者およびcDNAに由来するPCR産物に対する明確な質量シグナルを生成する。精製後、これらの産物は、マトリックス支援レーザー脱離イオン化飛行時間型質量分析(MALDI−TOF MS)分析での分析にとって必要とされる成分が予備負荷されたチップアレイ上に分注される。次いで、反応物中に存在するcDNAは、生成される質量スペクトルにおけるピーク面積の比を分析することによって定量される。さらなる詳細については、例えば、DingおよびCantor、Proc.Natl.Acad.Sci.USA 100:3059−3064頁(2003年)を参照のこと。
【0124】
他のPCRに基づく方法
さらに、本明細書で開示される方法における用途が見出されうるPCRに基づく技術は、例えば、BeadArray(登録商標)技術(Illumina(San Diego,CA);Oliphantら、「Discovery of Markers for Disease(Supplement to Biotechniques)」、2002年6月;Fergusonら、Analytical Chemistry 72:5618頁(2000年));遺伝子発現のための迅速アッセイにおいて、市販のLuminex100 LabMAP(登録商標)システムおよび複数の色分けされたミクロスフェア(Luminex Corp.(Austin,TX))を使用する、Gene Expression(登録商標)を検出するためのBeadsArray(BADGE)(Yangら、Genome Res.11:1888−1898頁(2001年));ならびに広範囲発現プロファイリング(HiCEP)分析(Fukumuraら、Nucl.Acids.Res.31(16)e94(2003年)を含む。
【0125】
マイクロアレイ
目的の遺伝子の発現レベルはまた、マイクロアレイ技術を用いて評価してもよい。本方法では、(cDNAおよびオリゴヌクレオチドを含む)目的のポリヌクレオチド配列は、基質上にアレイ化される。次いで、アレイ化配列は、試験試料のmRNAから生成される検出可能に標識されたcDNAと、特異的ハイブリダイゼーションに適した条件下で接触される。RT−PCR法などの場合、mRNA源は、典型的には、腫瘍試料から、また場合によって内部対照または細胞系と同じ患者の正常組織から単離された全RNAである。mRNAは、例えば、凍結またはアーカイブされたパラフィン包埋および固定(例えばホルマリン固定)組織試料から抽出してもよい。
【0126】
例えば、アッセイされるべき遺伝子のcDNAクローンのPCR増幅挿入物は、高密度アレイ内の基質に適用される。通常は、少なくとも10,000のヌクレオチド配列が、基質に適用される。例えば、各々10,000の配列でマイクロチップ上に固定化されたマイクロアレイ化遺伝子は、ストリンジェントな条件下でのハイブリダイゼーションに適する。蛍光標識cDNAプローブは、目的の組織から抽出されたRNAの逆転写による蛍光ヌクレオチドの組み込みを通じて生成してもよい。チップに適用された標識cDNAプローブは、アレイ上のDNAの各スポットに特異的にハイブリダイズする。非特異的結合プローブを除去するためのストリンジェントな条件下での洗浄後、チップは、共焦点レーザー顕微鏡または別の検出方法、例えばCCDカメラによって走査される。各アレイ化配列のハイブリダイゼーションの定量は、対応するmRNAの存在度の評価を可能にする。
【0127】
二色蛍光の場合、2つのRNA源から生成される別々に標識されたcDNAプローブは、アレイに対でハイブリダイズされる。したがって、各特異的遺伝子に対応する2つの供給源に由来する転写産物の相対存在度は、同時に測定される。小型化された規模のハイブリダイゼーションは、多数の遺伝子における発現パターンの便利でかつ迅速な評価を可能にする。かかる方法は、1細胞あたり数コピーで発現される希少な転写産物を検出するのに要求される感度を有し、かつ発現レベルにおける少なくとも約2倍の差異を再現可能に検出することが示されている(Schenaら、Proc.Natl.Acad.ScL USA 93(2):106−149頁(1996年))。マイクロアレイ分析は、市販の機器により、例えばAffymetrix GenChip(登録商標)技術またはIncyteのマイクロアレイ技術の使用により、製造業者のプロトコルに従って行ってもよい。
【0128】
遺伝子発現の連続分析(SAGE)
遺伝子発現の連続分析(SAGE)は、各転写産物に対して個別のハイブリダイゼーションプローブを提供する必要性のない、多数の遺伝子転写産物の同時および定量分析を可能にする方法である。まず、転写産物を固有に同定するのに十分な情報を有する短い配列タグ(約10〜14bp)が、タグが各転写産物内部の固有の位置から得られるという条件で生成される。次いで、多数の転写産物が互いに結合され、長い連続分子が形成され(それは配列決定可能である)、それによって複数のタグの同一性が同時に示される。転写産物の任意の集団の発現パターンは、個別のタグの存在度を判定し、かつ各タグに対応する遺伝子を同定することにより、定量的に評価してもよい。より詳細には、例えば、Velculescuら、Science 270:484−487頁(1995年);およびVelculescuら、Cell 88:243−51頁(1997年)を参照のこと。
【0129】
核酸配列決定による遺伝子発現分析
核酸配列決定技術は、遺伝子発現の分析に適した方法である。これらの方法の基礎となる原理は、cDNA配列が試料中で検出される回数がその配列に対応するmRNAの相対的発現に直接関連することである。これらの方法は、得られるデータの個別の数値的特性を反映する、Digital Gene Expression(DGE)という用語で称される場合がある。本原理を適用する初期の方法は、遺伝子発現の連続分析(SAGE)および大規模並列シグネチャー配列決定(MPSS)であった。例えば、S.Brennerら、Nature Biotechnology 18(6):630−634頁(2000年)を参照のこと。より最近では、「次世代」配列決定技術の出現により、DGEが、より簡易に、より高いスループットに、またより安価になっている。結果として、より多くの研究室が、DGEを利用し、以前に可能であった場合より多くの個別の患者試料中でより多くの遺伝子の発現をスクリーニングすることができる。例えば、J.Marioni、Genome Research 18(9):1509−1517頁(2008年);R.Morin、Genome Research 18(4):610−621頁(2008年);A.Mortazavi、Nature Methods 5(7):621−628頁(2008年);N.Cloonan、Nature Methods 5(7):613−619頁(2008年)を参照のこと。
【0130】
体液からのRNAの単離
血液、血漿および血清(例えば、Tsui N.B.ら(2002年)48、1647−53頁と、その中に引用される参考文献を参照)ならびに尿(例えば、Boom R.ら(1990年) J Clin Microbiol.28、495−503頁と、その中に引用される参考文献を参照)に由来する発現分析用のRNAを単離する方法について記載がなされている。
【0131】
免疫組織化学
免疫組織化学法もまた、遺伝子の発現レベルの検出に適しており、本明細書で開示される方法に適用される。目的の遺伝子の遺伝子産物に特異的に結合する抗体(例えばモノクローナル抗体)は、かかる方法において使用してもよい。抗体は、例えば、放射性標識、蛍光標識、ハプテン標識、例えばビオチン、または西洋わさびペルオキシダーゼもしくはアルカリホスファターゼなどの酵素を用いる、抗体自体の直接標識によって検出してもよい。あるいは、未標識一次抗体は、一次抗体に特異的な標識二次抗体と併用してもよい。免疫組織化学プロトコルおよびキットは、当該技術分野で周知であり、市販されている。
【0132】
プロテオミクス
用語「プロテオーム」は、特定の時点での試料(例えば、組織、生物、または細胞培養物)中に存在するタンパク質の全体として定義される。プロテオミクスは、特に、試料中でのタンパク質発現の広範囲の変化の試験(「発現プロテオミクス」とも称される)を含む。プロテオミクスは、典型的には、次のステップ、(1)試料中の個別のタンパク質の2−Dゲル電気泳動(2−D PAGE)による分離;(2)ゲルから回収される個別のタンパク質の例えば質量分析またはN末端配列決定による同定、および(3)バイオインフォマティクスを用いるデータの分析、を含む。
【0133】
mRNA単離、精製および増幅の一般的説明
mRNAの単離、精製、プライマー伸長および増幅を含む、RNA源として固定パラフィン包埋組織を用いる、遺伝子発現プロファイリング用の代表的プロトコルのステップは、様々な公表された雑誌記事の中に提供される(例えば、T.E.Godfreyら、J.Molec.Diagnostics 2:84−91頁(2000年);K.Spechtら、Am.J.Pathol.158:419−29頁(2001年)、M.Croninら、Am J Pathol 164:35−42頁(2004年)を参照)。つまり、代表的プロセスは、組織試料切片(例えば、パラフィン包埋腫瘍組織試料の約10μm厚切片)を切断することから開始する。次いで、RNAは抽出され、タンパク質およびDNAは除去される。RNA濃度の分析後、必要に応じてRNA修復がなされる。次いで、試料に対し、例えば遺伝子に特異的なプロモーターを用いる逆転写、その後のRT−PCRによる分析を行ってもよい。
【0134】
予後および/または予測方法における使用を目的としたマーカー遺伝子の同定における遺伝子発現レベルの統計分析
当業者は、目的の転帰(例えば、生存の可能性、化学療法に対する応答の可能性)と本明細書中に記載のマーカー遺伝子の発現レベルとの間に有意に関係があるか否かを判定するのに利用可能な統計的方法が多数存在することを理解するであろう。この関係は連続的な再発スコア(RS)として提示でき、または患者はリスク群(例えば、低い、中等度、高い)に分類できる。例えば、コックス比例ハザード回帰モデルは、特定の臨床エンドポイント(例えば、RFI、DFS、OS)に適合しうる。コックス比例ハザード回帰モデルの1つの仮定は、比例ハザード仮定、すなわち効果パラメータが基本的なハザードを増加させるという仮定である。限定はされないがマルチンゲール残差の累積合計の試験を含む、モデルの適合性の評価を行ってもよい。当業者であれば、対数累積ハザード関数の自然スプライン平滑化を伴うハザードスケールおよびワイブル分布を用いるフレキシブルなパラメトリックモデルを、時間依存性を可能にした、処置(化学療法または観察)およびRSに対する効果に適合させるのに利用可能な統計的方法が極めて多数存在すること(例えば、RoystonおよびParmer(2002年)、平滑化スプラインなど)を理解するであろう(P.Royston、M.Parmer、「Statistics in Medicine」、21(15:2175−2197頁(2002年)を参照)。再発リスクと、(1)再発リスク群;および(2)臨床的/病理学的共変量(例えば、試験される結節の数、病理学的Tステージ、腫瘍グレード、MSI状態、リンパ管もしくは血管浸潤など)との関係についても、有意性について試験可能である。
【0135】
多数の統計的方法を用い、予測遺伝子の発現レベルと処置に対する有益な応答(「処置恩恵」)との間に有意な相互作用が存在するか否かについて判定可能である。例えば、この関係は、連続的な処置スコア(TS)として提示でき、または患者は恩恵群(例えば、低い、中等度、高い)に分類できる。試験される相互作用は、例えば標準治療に対する新しい処置、または手術単独に対する術後の化学療法において変動しうる。例えば、コックス比例ハザード回帰を使用する場合、フォローアップデータ(すなわち、患者に対する無作為化後の特定の時点(例えば3年)での時間対再発を打ち切り扱いにする。但し患者は無作為化時以前に再発を経験していない。)をモデル化し、TSが化学療法恩恵の規模に関連するか否かを判定することが可能である。優度比試験(likelihood ratio test)を用いる場合、RS、TSおよび処置の主要効果を伴う不完全モデルを、RS、TS、処置の主要効果、および処置とTSの相互作用を含む完全モデルと比較することができる。所定のp値カットオフ(例えば、p<0.05)を使用し、有意性を判定することが可能である。
【0136】
あるいは、RoystonおよびParmerの方法(2002年)を用い、対数累積ハザード関数の自然スプライン平滑化を伴うハザードスケールおよびワイブル分布を用いるフレキシブルなパラメトリックモデルを、処置(化学療法または観察)、RS、TSおよびTSと処置との相互作用に対する効果に適合させ、それにより、RS、TSおよびTSと処置との相互作用の効果を時間依存的にすることができる。恩恵群全体での相対的な化学療法恩恵を評価するため、RSおよびTSにおける既定のカットポイントを用い、低、中等度、および高化学療法恩恵群を規定することが可能である。処置と、(1)恩恵群;および(2)臨床的/病理学的共変量との関係についても、有意性について試験可能である。例えば、当業者であれば、手術単独または術後の化学療法群における、低、中等度、および高化学療法恩恵群全体を通じて、3年後の再発に対する絶対的な化学療法恩恵における有意な傾向を同定することができる。高化学療法恩恵群における少なくとも3〜6%の絶対的恩恵の場合、臨床的に有意であると考えられることになる。
【0137】
典型的な実施形態では、単一の非バイナリ共変量を伴うコックス比例ハザードモデルにおけるパワー計算が、F.HsiehおよびP.Lavori、Control Clin Trials 21:552−560頁(2000年)によって提起された方法(PASS2008において実施されたもの)を用いて行われた。
【0138】
共発現分析
本開示は、再発および/または処置恩恵に対して有意な相関を有するものとして同定されている特定の予後および/または予測遺伝子とともに共発現する遺伝子を提供する。特定の生物学的プロセスを実施するため、遺伝子は、協調的方法で共同して働くことが多い、すなわちそれらは共発現される。癌のような疾患プロセスにおいて同定される共発現遺伝子群は、疾患進行および処置に対する応答におけるバイオマーカーとしての役割を果たしうる。かかる共発現遺伝子は、それらが共発現される相手である予後および/または予測遺伝子のアッセイの代わりにまたはそれに加えてアッセイしてもよい。
【0139】
当業者は、現在知られているかまたは後に開発される多数の共発現分析方法が、本発明の範囲および精神の範囲内に含まれることになることを理解するであろう。これらの方法は、例えば、相関係数、共発現ネットワーク分析、クリーク分析などを組み込み、また、RT−PCR、マイクロアレイ、配列決定、および他の類似の技術から得られる発現データに基づく場合がある。例えば、遺伝子発現クラスタは、ピアソンまたはスピアマン相関係数に基づく相関のペアワイズ分析を用いて同定可能である(例えば、Pearson K.およびLee A.、Biometrika 2、357(1902年);C.Spearman、Amer.J.Psychol 15:72−101頁(1904年);J.Myers、A.Well、「Research Design and Statistical Analysis」、508頁(第2版、2003年)を参照)。一般に、0.3に等しいかもしくはそれより大きい相関係数は、少なくとも20の試料サイズ中で統計的に有意であると考えられる(例えば、G.Norman、D.Streiner、「Biostatistics:The Bare Essentials」、137−138頁(第3版、2007年)を参照)。
【0140】
典型的な実施形態の一般的説明
本開示は、患者の癌再発を経験する可能性を、患者から得られる腫瘍試料に由来する特定の予後遺伝子の発現レベルをアッセイすることによって判定するための方法を提供する。かかる方法は、遺伝子産物の類似機能に基づいて生成される遺伝子サブセットの使用を含む。例えば、本明細書で開示される予後方法は、間質群および細胞周期群の各々に由来する少なくとも1つの各遺伝子を含む遺伝子サブセットの発現レベルをアッセイするステップと、患者における再発スコア(RS)を、遺伝子サブセットの各々の発現レベルをそれら各々の癌再発への寄与によって重み付けすることによって計算するステップと、を含む。重み付けは、各遺伝子サブセットに対して異なってもよく、かつ正または負のいずれであってもよい。例えば、間質群スコアであれば0.15の倍数、細胞周期群スコアであれば−0.3の倍数、細胞シグナル伝達群スコアであれば0.15の倍数を掛けることなどにより、重み付け可能である。かかる予後方法における遺伝子サブセットは、細胞シグナル伝達群、アポトーシス群、または転写因子群に由来する少なくとも1つの遺伝子をさらに含んでもよい。
【0141】
例えば、典型的な実施形態において各遺伝子サブセットに代入される重みは、以下に示される。
RS1= W×間質群スコア
+W×血管新生群スコア
−Wcc×細胞周期群スコア
+Wcs×細胞シグナル伝達群スコア
−W×アポトーシス群スコア
(式中、
間質群スコア=(SG1+…SGn)/n(SG=間質遺伝子正規化発現レベル(NEL))
細胞周期群スコア=(CCG1+…CCGn)/n(CCG=細胞周期遺伝子NEL)
細胞シグナル伝達群スコア=(CSG1+…CSGn)(CSG=細胞シグナル伝達遺伝子NEL)
アポトーシス群スコア=(AG1+…AGn)/n(AG=アポトーシス遺伝子)
血管新生群スコア=(AgG1+…AgGn)/n(AgG=血管新生遺伝子)
=各遺伝子サブセットにおける重み係数
【0142】
あるいは、各遺伝子サブセット内の遺伝子は、個別に重み付けしてもよい。標準化発現を仮定すると、典型的な実施形態における各遺伝子サブセットに代入される重みは、以下に示される。
間質群スコア=+BGNスコア+FAPスコア+INHBAスコア
細胞周期群スコア=−2[Ki−67スコア+MAD2L1スコア+.75(cMYCスコア)+.25(MYBL2スコア)]
アポトーシス群スコア=−2(BIKスコア)
細胞シグナル伝達群スコア=+.33(GADD45Bスコア)
血管新生群スコア=+EFNB2スコア
【0143】
RS2モデルを非標準化発現に翻訳するため、重みは、遺伝子の標準偏差によって分類してもよい。例えば、非標準化発現を仮定すると、典型的な実施形態において各遺伝子サブセットに代入される重みは、以下に示される。
間質群スコアns=+1.06(BGNスコア)+1.38(FAPスコア)+1.14(INHBAスコア)
血管新生群スコアns=+1.34(EFNB2)
細胞シグナル伝達群スコアns=+0.44GADD45B
細胞周期群スコアns=−2[1.85(Ki−67スコア)+1.32(MAD2L1+0.83(cMYCスコア)+0.45(MYBL2スコア)]
アポトーシス群スコアns=−2(BIKスコア)
【0144】
典型的な実施形態では、RSは、BGN、FAP、INHBA、EFNB2、MYBL2、Ki−67、cMYC、MAD2L1、HSPE1、GADD45B、BIK、およびRUNX1のうちの1つ以上の発現レベルを用いて計算される。本開示は、代用予後遺伝子を提供し、ここでその発現レベルを同様に使用し、RSを計算することが可能である。これらの代用予測遺伝子は、BGN、FAP、INHBA、EFNB2、MYBL2、Ki−67、cMYC、MAD2L1、HSPE1、GADD45B、BIK、またはRUNX1とともに共発現する遺伝子を含む。
【0145】
RS(スケーリングされていない再発スコア)は、例えば0〜100の間になるように再スケーリングしてもよい。より詳細には、RSは、次のように再スケーリングしてもよい。
【数1】

RSを用い、各患者に対する再発リスク群を判定可能である。例えば、再発スコアは、既定のカットポイントを用い、3つのリスク分類群に分類できる。低、中等度、および高再発リスク群の間のカットポイントは、例えば表1などで規定されうる。
【0146】
【表1】

【0147】
RSは、再発リスク群を規定するカットポイントが適用される前に、直近の整数に丸めてもよい。
【0148】
本開示はまた、結腸直腸癌を有する患者が化学療法に対する有益な応答を有する可能性を判定するための方法であって、予測遺伝子の発現レベルをアッセイするステップと、患者における処置スコア(TS)を、遺伝子サブセットの各々の発現レベルをそれら各々の化学療法に対する応答への寄与によって重み付けすることによって計算するステップと、を含み、ここで発現レベルは、成長因子受容体群、アポトーシス群、およびMSI群に各々由来する少なくとも1つの遺伝子を含む遺伝子サブセットに基づくアルゴリズム中で用いられる、方法を提供する。重み付けは、各遺伝子サブセットに対して異なってもよく、かつ正または負のいずれであってもよい。例えば、間質群であれば−0.3の倍数、転写因子であれば−0.04の倍数、アポトーシス群であれば0.3の倍数、細胞周期群であれば0.1の倍数、またMSI群であれば0.1の倍数を掛けることにより、重み付け可能である。遺伝子サブセットは、転写因子群および/または細胞周期群に由来する少なくとも1つの遺伝子をさらに含んでもよい。
【0149】
典型的な実施形態では、各遺伝子サブセットに代入される重みは、以下に示される。
【0150】
【表2】

【0151】
典型的な実施形態では、TSは、AXIN2、BIK、EFNB2、HSPE1、MAD2L1、およびRUNX1における発現レベルを用いて計算される。
【0152】
本開示は、他の予測遺伝子を提供し、その発現レベルを同様に用い、TSを計算することが可能である。これらの代用予測遺伝子は、RANBP2、BUB1、TOP2A、C20_ORF1、CENPF、STK15、AURKB、HIF1A、UBE2C、およびMSH2、ならびに、少なくとも0.60のピアソン相関係数で、前記代用予測遺伝子とともに共発現する遺伝子を含む。
【0153】
TS(スケーリングされていない処置スコア)は、再スケーリングしてもよく、例えば0〜100の間になるように再スケーリングしてもよい。より詳細には、TSは、次のように再スケーリングしてもよい。
【数2】

【0154】
さらに、TSを用い、各患者に対する「恩恵スコア」を判定可能である。例えば、患者は、化学療法から低、中等度、または高恩恵を有することが想定される者として分類可能である。特定例では、RS、TS、および既定のカットポイントを用い、各患者に対する恩恵スコアを判定可能である。低、中等度、および高恩恵スコアまたは群は、表2などで規定されうる。
【0155】
【表3】

【0156】
データ集約
発現データは、集約してもよい。データ集約の目的は、個別遺伝子に対し、複製qRT−PCRウェル全体で情報を組み合わせることである。例えば、qRT−PCRの間、3通りのウェルに対し、各遺伝子および試料について実行してもよい。各遺伝子に対する有効な3通りのウェルは、単一の重み付けされた平均C値に集約してもよい。得られた重み付けされた平均Cは、観測異常値の影響に対し、有効に重みを減少させる。データ集約モジュールは、各遺伝子および試料に対し、次のステップ、すなわち、
(1)計算されたC値および状態データを検索するステップと、
(2)プレートレベルでの統計を集約し、プロセシングのモジュールバージョン、日付および時間を記録するステップと、
(3)各遺伝子に対するC値を集約し、すべてのウェルを用いて統計を保存する(有効および無効)ステップと、
(4)遺伝子の有効性を有効なウェルの数に基づいて算出するステップと、
(5)各遺伝子に対する有効なウェルの重み付けされた平均を算出するステップと、
を含んでもよい。
【0157】
発現レベルの正規化
本明細書で開示される方法において使用される発現データは、正規化してもよい。正規化は、例えば、アッセイされるRNAの量における差異および使用されるRNAの品質における変動性について訂正し(正規化除去し(normalize away))、C測定値における不要な系統的変動源などを除去するためのプロセスを示す。アーカイブされた固定パラフィン包埋組織試料を含むRT−PCR実験に関しては、系統的変動源は、患者試料の年数に関連するRNA分解の程度および試料の保存に使用される固定液の種類を含むことが知られている。他の系統的変動源は、実験室の処理条件に起因する。
【0158】
アッセイでは、特定の正規化遺伝子の発現を組み込むことによって正規化を提供することが可能であり、ここで遺伝子は、関連条件下で発現レベルが有意に異ならない。典型的な正規化遺伝子は、PGK1およびUBBなどのハウスキーピング遺伝子を含む(例えば、E.Eisenbergら、「Trends in Genetics」 19(7):362−365頁(2003年)を参照)。正規化は、アッセイされる遺伝子のすべてまたはその大きいサブセットの平均または中央値シグナル(C)に基づきうる(グローバルな正規化アプローチ)。一般に、正規化遺伝子(参照遺伝子とも称される)は、結腸直腸癌において、非癌性結腸直腸組織に対して有意に異なる発現を示さないことが知られ、また様々な試料およびプロセス条件によって有意に影響を受けず、それ故に外部効果の正規化除去をもたらす遺伝子である必要がある。
【0159】
特に断りのない限り、各mRNA/試験される腫瘍/患者における正規化発現レベルは、参照セットにおいて測定される発現レベルの百分率として表されることになる。腫瘍の十分に大きい数(例えば40)の参照セットは、各mRNA種の正規化レベルの分布をもたらす。分析されるべき特定の腫瘍試料中で測定されるレベルは、この範囲内のいくつかのパーセンタイル値に該当し、それは当該技術分野で周知の方法によって測定可能である。
【0160】
典型的な実施形態では、次の遺伝子、すなわち、ATP5E、GPX1、PGK1、UBB、およびVDAC2のうち1つ以上は、参照として使用される(それにより、発現データが正規化される)。予後および予測遺伝子の各々に対して較正され、重み付けされた平均C測定値は、5つ以上の参照遺伝子の平均に対して正規化されうる。
【0161】
当業者は、正規化が極めて多数の方法で行うことができ、また上記の技術は、あくまで例示的であり、網羅的でないことが意図されていることを理解するであろう。
【0162】
発現の測定値と較正の橋渡し
オリゴヌクレオチドセットは、プライマーおよびプローブ(P3)プールならびに遺伝子特異的プライマー(GSP)プールを作成するのに使用されるフォワードプライマー、リバースプライマー、およびプローブを示す。RT−PCRサイクル閾値(C)測定値における系統的差異は、オリゴヌクレオチド合成における固有の変動に起因し、異なるオリゴヌクレオチドセット間に生じうる。例えば、オリゴヌクレオチドセットにおける差異は、開発、生成(検証用に使用される)、および将来生成される(future production)ヌクレオチドセットの間に存在しうる。したがって、RSおよびTSの計算に用いられる遺伝子の係数(gene coefficient)における、翻訳をもたらすオリゴヌクレオチドセットにおける系統的差異を調整するための統計的較正手順の使用が望ましい場合がある。例えば、アルゴリズム中での使用を意図してアッセイされる遺伝子の各々においては、オリゴヌクレオチドセット生成のためのC測定値に対する、異なるオリゴヌクレオチドセットにおいて使用される対応する試料から得られるC測定値の散布図(scatterplot)を用い、ランダム効果としてロット間の差異の効果を扱う線形回帰モデルを作成することができる。かかるプロットの試験は、C測定値の分散が平均Cの関数として指数的に増加することを示すことになる。ランダム効果の線形回帰モデルを、対数−線形分散で評価し、線形較正方程式を得ることが可能である。スコアにおける計算された平均二乗誤差(MSE)は、較正スキームが全く使用されない場合、MSEと比較可能である。
【0163】
もう一つの例として、Cの潜在的な可変測定値(例えば第1の主要素)は、様々なオリゴヌクレオチドセットから誘導されうる。潜在的変数は、「真の」基礎的なC測定の合理的尺度である。上記の方法と同様、線形回帰モデルは、ランダム効果としての差異の効果、および較正されたCに対して調整された重み付けされた平均C値を処理する試料対に適合されうる。
【0164】
中心化およびデータ圧縮/スケーリング
分析または試料の差異に起因する、患者のRSおよびTSの分布における系統的差異は、初期発症、臨床的検証および商用試料の間に存在しうる。一定の中心化したチューニングパラメータを、アルゴリズム中で使用し、かかる差異を明らかにすることが可能である。
【0165】
データ圧縮は、アッセイの定量限界(LOQ)を超える、観察された正規化C値における変動性を低減するために用いられる手順である。詳細には、結腸癌アッセイでの遺伝子の各々においては、C測定値における分散は、遺伝子における正規化CがアッセイのLOQより大きくなるにつれて指数的に増加する。かかる変動を低減するため、各遺伝子における正規化C値は、アッセイのLOQに向けて圧縮してもよい。さらに、正規化C値は、再スケーリングしてもよい。例えば、予後、予測、および参照遺伝子の正規化C値は、1単位の増加が一般にRNA量の2倍の増加を示す場合、0〜15の範囲まで再スケーリングしてもよい。
【0166】
閾値
本発明では、癌関連遺伝子の発現における閾値を判定するための方法であって、癌患者から得られる腫瘍切片中での遺伝子またはその発現産物の発現レベルを測定するステップと、発現レベルを正規化し、正規化発現レベルを得るステップと、正規化発現レベルにおける閾値を計算するステップと、再発または処置に対する臨床的に有益な応答の可能性に基づいてスコアを判定するステップと、を含む、方法が記載され、ここで、正規化発現レベルが閾値より小さい場合、閾値を用いてスコアが判定され、またここで、正規化発現レベルが閾値より大きいかもしくはそれに等しい場合、正規化発現レベルを用いてスコアが判定される。
【0167】
例えば、各癌関連遺伝子における閾値は、遺伝子発現と転帰との間の関係の関数形式についての試験を通じて判定してもよい。かかる分析の例が、遺伝子発現が自然スプラインを用いてモデル化される場合における無再発期間に対するコックスPH回帰や、遺伝子発現がlowessスムーザーを用いてモデル化される場合における再発状態に対するロジスティック回帰として示される(例えば、図6〜10を参照)。
【0168】
各々の予後、予測、および参照遺伝子における閾値化(Thresholded)C値を用い、RSおよびTSを計算することが可能である。本明細書中に記載の18遺伝子アッセイにおける典型的な閾値化C値は、表3中に示される。
【0169】
【表4】

【0170】
閾値化の目的が遺伝子発現測定値に対する非線形関数形式に対応することであることは、当業者によって理解されるであろう。しかし、閾値化以外の他の非線形変換を用い、同じ効果が得られうることは、容易に理解されるであろう。
【0171】
有効なバイオマーカーからの遺伝子クリークの構築
本開示では、本明細書で開示される予後および/または予測遺伝子の代わりとして、またはそれらによる分析を目的として、予後および/または予測遺伝子に関連して同定される共発現遺伝子および/または遺伝子クリークを使用することが検討される。標的遺伝子(すなわち目的の遺伝子)とともに共発現する遺伝子クリークを分析するために開示される1つの方法は、アレイプローブに基づき、癌試料におけるマイクロアレイ遺伝子発現データを正規化するステップと、すべての固有のアレイプローブ対における遺伝子発現レベルに基づき、(例えば、スピアマンまたはピアソン相関係数を使用して)相関係数を計算するステップと、有意な閾値より大きい相関係数(例えば、スピアマン相関係数≧0.5)の場合における標的遺伝子プローブおよびアレイプローブである有意なプローブ対を判定するステップと、標的遺伝子をその対応する標的遺伝子プローブにマッピングするステップと、候補プローブセットを選択するステップと、ここで各候補プローブは有意なプローブ対の一部である、各候補プローブに対する正式な遺伝子記号(例えば、Entrez Gene Symbol)を同定するステップと、を含む。例えば、表6は、FAP、INHBA、Ki−67、HSPE1、MAD2L1、およびRUNX1に関連した遺伝子クリークを列挙する。
【0172】
本発明のキット
本発明の方法において使用される材料は、周知の手順に従って生成されるキットの調製に適している。したがって、本開示は、予後転帰または処置に対する応答を予測するために本開示の遺伝子の発現を定量することを意図した、遺伝子特異的または遺伝子選択的プローブおよび/またはプライマーを含みうる、作用剤を含むキットを提供する。かかるキットは、場合により、腫瘍試料、特に固定パラフィン包埋組織試料からRNAを抽出するための試薬、および/またはRNA増幅用の試薬を有してもよい。さらに、キットは、場合により、試薬とともに、識別説明(identifying description)またはラベルまたは本発明の方法におけるそれらの使用に関する説明書を含んでもよい。キットは、(本方法の自動化された実施における使用に適したマイクロリットルプレート(microliter plate)を含む)容器とともに、それぞれが、例えば、予備製造された(pre−fabricated)マイクロアレイ、緩衝液、適切なヌクレオチド三リン酸(例えば、dATP、dCTP、dGTPおよびdTTP;またはrATP、rCTP、rGTPおよびUTP)、逆転写酵素、DNAポリメラーゼ、RNAポリメラーゼ、ならびに本発明の1つ以上のプローブおよびプライマー(例えば、RNAポリメラーゼと反応性を示すプロモーターに連結された適切な長さのポリ(T)またはランダムプライマー)を含む、本方法において使用される様々な試薬(典型的には濃縮形態である)の1つ以上を含んでもよい。予後または予測情報の評価または定量に用いられる数学的アルゴリズムもまた、適切に潜在的なキットの構成要素である。
【0173】
報告
本発明の方法は、商業的な診断目的で実施される場合、一般に、本明細書中に記載の方法から得られる情報に関する報告またはサマリーを生成する。例えば、報告は、予後および/または予測遺伝子の発現レベル、特定の患者における予測される臨床転帰または化学療法に対する応答の予測、あるいは遺伝子クリークまたは閾値、に関する情報を含んでもよい。本発明の方法および報告は、報告をデータベース内に格納することをさらに含んでもよい。本方法では、対象に対してデータベース内に記録を作成し、またその記録をデータに追加してもよい。報告は、紙による報告、音声による(auditory)報告、または電子的記録であってもよい。報告は、コンピュータデバイス(例えば、ハンドヘルドデバイス、デスクトップコンピュータ、スマートデバイス、ウェブサイトなど)上に表示し、および/または格納してもよい。報告が医師および/または患者に提供されることが検討される。報告の受信は、データおよび報告を含むサーバーコンピュータへのネットワーク接続を確立することと、データおよび報告をサーバーコンピュータから要求することと、をさらに含んでもよい。
【0174】
コンピュータプログラム
上記のアッセイからの値、例えば発現データ、再発スコア、処置スコアおよび/または恩恵スコアは、マニュアルで計算し、格納してもよい。あるいは、上記のステップは、コンピュータプログラム製品により、完全にまたは部分的に実施してもよい。したがって、本発明は、コンピュータで読み取り可能な記憶媒体(その上に格納されたコンピュータプログラムを有する)を含むコンピュータプログラム製品を提供する。プログラムは、コンピュータによって読み取られる場合、個体由来の1つ以上の生物学的試料の分析から得られる値に基づく関連する計算(例えば、遺伝子発現レベル、正規化、閾値化、ならびに、アッセイから得られる値の、再発/化学療法に対する応答の可能性、遺伝子共発現またはクリーク分析のスコアおよび/またはグラフィカル表現への変換など)を行うことができる。コンピュータプログラム製品は、計算を行うため、コンピュータプログラムをその中に格納している。
【0175】
本開示は、上記のプログラムを実行するためのシステムであって、一般に、a)中央コンピューティング環境(central computing environment);b)患者データを受診するための、コンピューティング環境に作動可能に接続された入力デバイス、ここで患者データは、上で詳述されるように、例えば、患者由来の生物学的試料を使用するアッセイから得られる発現レベルまたは他の値、またはマイクロアレイデータを含んでもよい;c)情報を利用者(例えば医療関係者)に提供するための、コンピューティング環境に接続された出力デバイス;ならびにd)中央コンピューティング環境(例えばプロセッサ)によって実行されるアルゴリズム、ここでアルゴリズムは、入力デバイスによって受信されるデータに基づいて実行され、またここでアルゴリズムは、RS、TS、リスクまたは恩恵群分類、遺伝子共発現分析、閾値化、または本明細書中に記載の他の関数を計算する、を含む、システムを提供する。本発明によって提供される方法はまた、全体的または部分的に自動化してもよい。
【0176】
本発明のあらゆる態様はまた、開示される遺伝子とともに共発現される追加的な遺伝子の限定された数が、例えば統計的に有意なピアソンおよび/またはスピアマン相関係数から明らかなように、開示される遺伝子に加え、および/またはその代わりに、予後または予測試験に含められるように、実施してもよい。
【0177】
本発明について記述してきたが、同じことが、例示として提供され、決して本発明を限定するように意図されていない以下の実施例への言及を通じて、より容易に理解されるであろう。
【実施例】
【0178】
実施例1:結腸癌再発における遺伝子発現分析
方法および材料:
患者および試料
手術単独で処置されたステージIIまたはステージIII結腸癌を有する患者の2つのコホートに由来する腫瘍組織試料は、本報における基礎を形成する。NSABPプロトコルC−01、C−02、C−03、およびC−04についてのさらなる詳細は、C.Allegra、J Clin Oncology 21(2):241−250頁(2003年)およびそれに関連する米国特許出願第11/653,102号明細書および米国特許出願第12/075,813号明細書(それらの内容は参照により本明細書中に援用される)において入手可能である。
【0179】
第1のコホートは、NSABPプロトコルC−01またはC−02からの入手可能な患者試料をプールしたものであり、ここで患者は、結腸切除単独または切除+バチルス・カルメット・ゲラン(bacillus Calmette−Guerin)(「BCG」)免疫療法のいずれかを受けるように無作為に割り付けた。第2のコホート(CCF)は、1981年〜2000年の間にCCFでの手術単独で処置されたステージIIおよびステージIII結腸癌患者を含んだ。いずれの群においても、アジュバント化学療法を受けた患者は皆無であった。両コホートにおいて、遺伝子発現測定値は、アーカイブされたホルマリン固定パラフィン包埋(FPE)結腸腫瘍組織から得た。
【0180】
発現差データ
評価可能なFPEブロックの最終的な数は、NSABPコホートにおいて270であり、CCFコホートにおいて765であった(n=1035)。除外の主な理由は、最小RNA収率(NSABPでは試料の10%およびCCFでは8%)を満たせず、またRT−qPCRにおける品質管理基準(NSABPでは7%およびCCFでは2%)を満たせなかった点である。
【0181】
両試験における主な分析では、761の遺伝子の発現とRFIの間の関係を検討した。この分析で同定された65の遺伝子は、両試験において名目上有意であることが見出された(図1を参照)。両試験において、RFIに有意に関連する、65のうち63(97%)の遺伝子における一変量ハザード比の間に高レベルの一致が認められた。いずれかの試験においてRFIに有意に関連することが見出された遺伝子のうちの大部分がまた、同じ試験の中で、DFSおよびOSの双方に関連していた。
【0182】
両コホートにおいて、各遺伝子の発現とRFIとの間の関係について検討し、試験およびベースライン特性について調節した。RFIと少なくとも適度の関連性(p<0.2)を有する、ベースライン臨床特性または試験設計特性のいずれかを、多変量分析に含めた。NSABPコホートにおける一変量分析において有意な143のうち61(43%)の遺伝子が、結節状態、腫瘍位置、腫瘍グレード、粘液性腫瘍タイプ、試験プロトコル(C−01対C−02)、処置割り当て(treatment assignment)(BCG対なし)、および手術年について調節後、統計的に有意であった。CCFコホートにおける一変量分析において有意な119のうち88(74%)の遺伝子が、年齢、結節状態、試験されるリンパ節の数、腫瘍グレード、粘液性腫瘍タイプ、固定液、手術年およびTステージについて調節後、有意性を保持した。両試験において、RFIに有意に関連する、65の遺伝子における多変量ハザード比の間に一致が認められた。ハザード比は、65のうち63の遺伝子において一致した。一変量および多変量コックス回帰分析から得られたハザード比推定値の一致は、これらの遺伝子の発現レベルが、従来の臨床予測因子と相対的に独立した予後情報を提供することを示す。
【0183】
これらの65の遺伝子は、結腸癌再発における重要性が予想されることになる経路を示す。共発現された遺伝子と、それに基づいて考えられる同じ機能遺伝子ファミリーのメンバを同定するため、階層的クラスタ分析およびフォレストプロットを、その試験においてRFIと有意に関連した遺伝子(ここでは示さない)を使用し、また両試験においてRFIに有意に関連する遺伝子に対して作成した。クラスタ分析により、予後遺伝子の大部分(48)が、2つの相対的に異なる遺伝子群:間質遺伝子群(いくつかの亜群を有する)と細胞周期遺伝子群とに分類されることが同定された。間質群は、高度に発現される場合、転帰の悪化および再発の可能性の増大に関連する遺伝子、例えばBGN、FAP、INHBA、およびEFNB2を有した。細胞周期群は、高度に発現される場合、転帰の改善および再発の可能性の低下に関連する遺伝子、例えばcMYC、MYBL2、Ki−67、MAD2L1、およびHSPE1を有した。
【0184】
実施例2:予後および予測遺伝子における遺伝子発現分析
手術および5FU/LVで処置されたステージIIまたはIII結腸癌を有する患者から得られる腫瘍試料中での遺伝子発現レベルをアッセイし、かつ、手術単独で処置された患者における個別の再発リスク(予後)と5−FU/LVアジュバント化学療法での個別の処置恩恵(予測)との双方を定量化する、遺伝子を同定するための4つの独立した試験を通じて分析を行う、といった試験を実施した。さらに、これらの試験についての情報は、それに関する米国特許出願第11/653,102号明細書および米国特許出願第12/075,813号明細書(これらの内容は参照により本明細書中に援用される)において見出されうる。
【0185】
方法および材料
患者および試料
組織試料は、手術および5FU/LVで処置されたステージIIまたはステージIII結腸癌を有する患者の2つのコホートから得られた。第1のコホートは、患者が、5FU/LV、5FU+レバミゾールまたは5FU/LV+レバミゾールのいずれかを受けるように無作為に割り付けられた、NSABP試験C−04の5FU/LVアームから入手可能な患者試料を含んだ(N.Wolmarkら、J Clin Oncol 17:3553−3559頁(1999年)を参照。第2のコホートは、患者が、5FU/LVまたは経口ウラシル/テガフール+ロイコボリンを受けるように無作為に割り付けられた、NSABP試験C−06の5FU/LVアームから入手可能な患者試料を含んだ(B.Lemberskyら、J Clin Oncol 24:2059−2064頁(2006年)を参照。5FU/LVレジメンは、両試験において同じであった。両コホートにおいては、遺伝子発現測定値は、アーカイブされたホルマリン固定パラフィン包埋(FPE)結腸腫瘍組織から得られた。
【0186】
元のNSABP試験における処置割り当ておよび適格性に基づき、C−04患者691名およびC−06患者792名を本試験における対象とした。C−04(n=360)およびC−06(n=573)に登録した患者を対象に入手可能なホルマリン固定パラフィン包埋(FPE)ブロックについてアッセイした。既定の除外基準を適用後、評価可能な患者の最終数は、C−04コホートにおいて308名であり、C−06コホートにおいて508名であった。除外における主な理由は、病理学上の要件(C−04において8.6%およびC−06において1.7%)を満たせず、かつ臨床上の適格性基準(C−04において1.7%およびC−06において7.5%)を満たせないことであった。
【0187】
分析方法
両試験における主な分析では、各遺伝子の発現とRFIとの間の関係を検討した。この分析により、RFIに有意に関連するものとして、C−06コホートにおいては375のうち169(45%)の遺伝子が同定されたのに対し、C−04コホートにおいては761のうち143(19%)の遺伝子が同定された。75の遺伝子が、両試験において名目上有意であることが見出された。ハザード比は、これら75のうち73(97%)の遺伝子において一致した(すなわち同様の方向で)。いずれかの試験においてRFIに有意に関連することが見出された遺伝子のうちの大部分がまた、同じ試験の範囲内でDFSおよびOSの双方と関連していた。C−04試験における一変量分析においてRFIに有意に関連した143のうち71(50%)の遺伝子が、結節状態および年齢に対する調節後、統計的に有意であった。C−06試験における一変量分析において有意である169のうち137(81%)の遺伝子が、結節関与および粘液性腫瘍タイプに対する調節後、統計的に有意であった。両試験においてRFIに有意に関連する遺伝子における一変量および多変量ハザード比の間に、高レベルの一致が認められた。
【0188】
4つの結腸発生試験を通じて予後遺伝子を同定するため、予後遺伝子が、標準治療で処置された患者または新しい介入で処置された患者において測定される場合、転帰と同様の関係(すなわちHRの場合と同様の方向および規模)を有することが想定されることから、手術単独(実施例1に記載のC−01/C−02およびCCF試験)および手術+5FU/LV処置(C−04およびC−06)患者の双方においてRFIに有意にかつ一貫して関連する遺伝子に着目した。4つ全部の発生試験において試験した全部で375のうち48(13%)の遺伝子が、手術単独試験および少なくとも1つの手術+5FU/LV試験の双方において、RFIに有意に(p<0.05)に関連した。タイプIIの誤差を考慮することにより、遺伝子は、4つ全部の試験において有意である必要がなかった。4つの結腸発生試験の各々における48の遺伝子に対する一変量ハザード比およびそれに関連する信頼区間を図2に示す。クラスタ分析では、48の予後遺伝子中での2つの相対的に異なる遺伝子群、すなわち間質活性化遺伝子群(いくつかの亜群を有する)および細胞周期遺伝子群が同定された。間質群は、高度に発現される場合、転帰の悪化および再発の可能性の増大に関連する遺伝子、例えばBGN、FAP、INHBA、およびEFNB2を有した。細胞周期群は、高度に発現される場合、転帰の改善および再発の可能性の低下に関連する遺伝子、例えばcMYC、MYBL2、Ki−67、MAD2L1、およびHSPE1を有した。
【0189】
予後遺伝子に対し、予測遺伝子は、手術単独で処置された患者における転帰と、手術+5FU/LVで処置された患者の場合に対し、異なる関係(すなわち異なるHR)を示すことが想定される。予測遺伝子を同定するため、多変量コックス比例ハザードモデル、例えば4つの結腸発生試験を通じてデータをプールし、375の遺伝子の各々における、遺伝子および処置の主要効果ならびに遺伝子および処置の相互作用について試験した。4つ全部の発生試験において試験した全部で375のうち66(18%)の遺伝子は、0.10レベルで有意な、遺伝子発現および処置の相互作用を有した。これら66のうち4つの遺伝子のみが、2つの独立した手術単独試験および少なくとも1つの手術+5FU/LV試験(すなわち48の予後遺伝子セット中に含められた)において、RFIと有意な関連性を有し、それはごく少数の予測遺伝子が予後および予測の双方であることを示した。66のうち59の遺伝子が、両方の手術単独試験においてRFIに関連せず、それは大部分の予測遺伝子がさらに予後遺伝子でないことを示した。
【0190】
これらの66の遺伝子は、化学療法への応答における重要性が予想されることになる経路を示す。クラスタ分析により、66の潜在的な予測遺伝子の中で2つの相対的に異なる遺伝子群が同定された。第1の群は、セントロメアなどの多数の細胞周期関連遺伝子およびスピンドル関連タンパク質(CENPA、KIFC1、KIF22、STK15、MAD2L1、AURKB)、チェックポイント調節(CDC2、BUB1)、およびDNAトポイソメラーゼ(TOP2A)を有する。第2の群は、いくつかの異なる生物学的経路を示す遺伝子、例えば間質活性化遺伝子の厳密(tight)群(BGN、SPARC、COL1A1、CDH11、MMP2、およびTIMP1)、およびアポトーシスに関連した遺伝子(BIK)、5FU代謝(UPP)、およびB−カテニン/wntシグナル伝達(AXIN2、LEF)を含む。2つのミスマッチ修復遺伝子(MSH2およびMSH3)およびいくつかの低酸素/ストレス応答遺伝子(NR4A1、RhoB、HIF1A、CREBBP、PKR2、EPAS1)についても、5−FU/LV化学療法への応答に関連したことは注目される。
【0191】
予備予後モデルを、48の予後遺伝子のサブセットを用いて構築した。10の予後遺伝子を有する代表的モデルから得られた結果を、手術単独(C−01/C−02およびCCFコホート)で処置した、ステージIIおよびステージIII患者にそれぞれ対応する図3aおよび3b中に示す。患者を、計算された再発スコアに基づいて、3つの等しいサイズの群に分類した。このモデルでは、ステージII患者628名を、低、中等度および高再発リスクを有する群に分類し、最低の三分位が5%(95%CI3%、9%)、それに対し、中間および最高の三分位がそれぞれ14%(10%、20%)および22%(16%、28%)の3年再発リスクを有した(図4aを参照)。ステージIII患者395名においては、2つの最低の三分位が26%(19%、35%)および26%(19%、34%)、それに対し、最高の三分位が47%(39%、56%)の3年再発リスクを有した(図4bを参照)。比較のため、ステージIIおよびステージIII患者の3年再発リスク全体はそれぞれ、13%および33%であった。ブートストラップを適用する場合、ステージII患者における3年再発率の平均カプラン・マイヤー推定値(およびそれに関連する95%信頼区間)は、第1、第2および第3の三分位に対してそれぞれ、5%(2%、9%)、12%(8%、17%)および22%(18%、27%)であった。ステージIII患者においては、対応する推定値はそれぞれ、23%(16%、30%)、28%(19%、37%)および48%(40%、56%)であった。
【0192】
実施例3:アルゴリズムに基づく分子診断アッセイの検証
65の予後および66の予測遺伝子候補が同定された後、遺伝子を、一変量および多変量コックス比例ハザードモデルを用いた4つの結腸発生試験を通じて、遺伝子発現とRFIとの間の関連性における一致(予後)および処置患者と未処置患者におけるRFIとの関係上の差異(予測)についてさらに試験した。関連の生物学的経路の表現、遺伝子発現の分布、遺伝子発現間の関係の関数形式、ならびに個別の遺伝子のRFIおよび分析性能についても考慮に入れた。
【0193】
(閾値化後の)予測遺伝子におけるフォレストプロットをレビューし、遺伝子に対し、(1)ステージIIおよびステージIIIの双方、またはステージIIIのみの結腸直腸癌のいずれかにおける予測効果を示し、(2)遺伝子(n=9)または中央値C<4(n=2)のモデルにおける処置相互作用による有意な(例えばp<0.10)遺伝子を有し、かつ、(3)RSおよびTRTをモデルに投入した後、処置相互作用による有意な(p<0.10)遺伝子を有することが同定された。一変量ハザード比(HR)が一致した遺伝子が好ましかった。さらに、予測遺伝子におけるフォレストプロットを定量的に試験し、ステージIIおよびステージIIIの双方またはステージIIIのみの結腸直腸癌のいずれかにおける予測効果を示す遺伝子が同定された。この分析を通じて、(最終アルゴリズムにおける6つの予測遺伝子に加えて)次の追加的な10の予測遺伝子候補、すなわち、RANBP2、BUB1、TOP2A、C20_ORF1、CENPF、STK15、AURKB、HIF1A、UBE2C、およびMSH2が同定された。これらの結果に基づき、多重遺伝子モデルを、4つ全部の試験を通じて設計し、分析した。それらの分析を、各候補遺伝子の分析性能の系統的評価と併せることにより、再発リスクおよび5FU/Lからの処置恩恵を予測するように、多重遺伝子RT−PCRに基づく臨床アッセイの設計を行った。遺伝子は、結腸癌において重要な生物学的カテゴリ、すなわち、間質群(BGN、FAP、INHBA、EFNB2)、細胞周期群(Ki−67、MYBL2、cMYC、MAD2L1、HSPE1)、細胞シグナル伝達群(GADD45B)、アポトーシス群(BIK)、転写因子群(RUNX1)、およびMSI群(AXIN2)、ならびに遺伝子発現の正規化のための5つの参照遺伝子(ATP5E、GPX1、PGK1、UBB、VDAC2)を示す。
【0194】
方法および材料
患者および試料
開発されたアルゴリズムは、QUASAR試験から得られた試料を用いて検証してもよい。QUASAR Collaborative Group試験は、ステージII結腸癌が切除された患者における観察対アジュバント化学療法に関して報告された最大の単一無作為化試験である(Lancet 370:2020−2029頁(2007年)を参照)。その試験では、ステージIIおよびIIIの結腸および直腸癌が切除された患者を、医師を試験の2つのうち1つのアームに仕向けることにより、アジュバント療法の「確定」または「未確定」のいずれかの適応に基づいて割り付けた。「確定」アームにおいては、すべての患者(n=4320)が、レバミゾールを伴う場合または伴わない場合に、アジュバント5−FU/ロイコボリン(LV)化学療法を受けた。「未確定」アームにおいては、患者(n=3239)を、観察(n=1617)またはアジュバント5−FU/LV化学療法(n=1622)のいずれかに無作為化した。想定どおり、「確定」アームでは、主にステージIII患者(70%)が登録され、また「未確定」アームでは、高い割合のステージII患者(91%のステージII、71%の結腸癌)が登録された。
【0195】
QUASARから得られたこれらの結果は、アジュバント5−FU/LV処置により、少なくても有意なステージII結腸癌患者のサブセットが得られることを示す(例えば図5を参照)。にもかかわらず、ステージII結腸癌を管理する医師は、依然として、かかる患者の大部分が手術単独で治療され、またアジュバント5−FU/LV化学療法が白血球減少、口内炎、および下痢の潜在的毒性を有するという事実を含む相当な困難に直面している。明らかに、アジュバント5−FU/LV化学療法を施すという決定であれば、1)手術単独で治療される可能性が高い患者、および2)術後に実質的な再発リスクがありかつアジュバント治療での有意な臨床恩恵の可能性を有する患者、を確実に同定する能力によって大きく支援されることになる。後者に関しては、患者および腫瘍学者における臨床的に関連のある情報が、ベースライン再発リスクの規模だけでなく、アジュバント5−FU/LV処置に関連した潜在的恩恵(すなわち絶対的な臨床恩恵)の規模も含むことは強調するに値する。
【0196】
検証試験は、QUASARで試験された結腸癌患者に由来するアーカイブされたパラフィン包埋腫瘍組織標本に適用される、既定のRT−PCRに基づく18遺伝子臨床アッセイ(表3中に挙げられる遺伝子を参照)の使用を包含した。試験では、(1)手術単独に無作為化された患者における連続的RSおよび再発リスクと、(臨床的および病理学的共変量の同時予後効果について制御する)術後のアジュバント5−FU/LV化学療法に無作為化された患者のそれらとの比較と;(2)手術単独または術後のアジュバント5−FU/LV化学療法に無作為化された患者における連続的TSおよび化学療法恩恵と、の間の関係について検討した。試験では、高および低再発リスク群の間の再発リスクを、RSにおける既定のカットポイントに基づいて比較した。高再発リスク群における3年再発リスクが低再発リスク群の場合より2倍高いことが、臨床的に有意であると考えられた。RFI、DFSおよびOSを含む他の臨床エンドポイントについて検討した。試験ではまた、(1)低、中等度、および高化学療法恩恵群の全体を通じた、3年後の再発に対する絶対的な化学療法恩恵における有意な傾向;(2)RFI、OSおよびDFSを含む他の臨床エンドポイントに関連する、連続的TSと処置との間での有意な相互作用;(3)連続的RSおよび予後共変量の予後効果についての制御後における、MMR状態と処置との間での有意な相互作用、について検討した。
【0197】
ステージII結腸癌を有する、QUASARからの約1,500名の患者に由来する固定パラフィン包埋結腸腫瘍組織。RNAを、腫瘍組織から抽出し、RT−PCR分析を行い、13の癌関連遺伝子および5つの参照遺伝子の発現レベルを判定した(表3)。プロスペクティブに定義されたアルゴリズムを使用し、各患者におけるRSおよびTSを計算した。患者を、RSおよび既定のカットポイントを用い、低、中等度、および高再発リスク群に分類した(表1)。同様に、患者を、RSおよびTSの組み合わせと既定のカットポイントに基づき、低、中等度、および高化学療法恩恵群に分類した(表2)。これらのカットポイントは、低恩恵群と中等度恩恵群の間、および中等度恩恵群と高恩恵群の間での境界を画定する。
【0198】
標本をまた、腫瘍タイプ、腫瘍グレード、リンパ管および/または血管浸潤の存在、試験される結節の数、浸潤の深さ(病理学的Tステージ)、MMR状態、および他のQC基準を判定するため、病理学によって評価した。この情報を用い、再発リスクと個別の病理学的共変量との間に有意な関係があるか否かを判定した。
【0199】
RSおよびTSの計算において使用される13の癌関連遺伝子の発現レベルを、RT−PCRアッセイからの値として報告した。遺伝子発現測定値を、5つの参照遺伝子(ATP5E、GPX1、PGK1、UBB、VDAC2)の平均に対して正規化した。各癌関連遺伝子においては、RT−PCRによってサイクル閾値(C)測定値を得、次いで5つの参照遺伝子のセットに対して正規化した。参照正規化発現測定値は、1単位の増加が一般にRNA量における2倍の増加を示す場合、典型的には0〜15の範囲である。
【0200】
分析方法:
特に明記しない限り、すべての有意性試験を0.05の有意性レベルで行ったことから、両側p値および信頼区間が報告されることになる。0.05の有意性レベルでの主要目的を試験するためのファミリーワイズエラーレート(family−wise error rate)全体を保護するため、分析に条件付き固定逐次試験を適用した。コックス比例ハザード回帰モデルを、手術単独に無作為化した患者における臨床エンドポイントRFIに適合させ、優度比試験を用い、RSが再発リスクに有意に関連するか否か(すなわちRSに関連するハザード比が1と有意に異なるか否か)を判定した。
【0201】
コックス比例ハザード回帰を用い、フォローアップデータの最初の3年、すなわち、無作為化時までに再発を経験していない患者に対する無作為化の3年後の再発までの打ち切り時間をモデル化し、TSが化学療法恩恵の規模に関連するか否かを判定した。優度比試験を用い、RS、TSおよび処置の主要な効果を伴う簡略化(reduced)モデルを、RS、TS、処置の主要な効果、および処置とTSの相互作用を含む完全モデルと比較した。さらに、RoystonおよびParmar(2002年)の方法を用い、フレキシブルなパラメトリックモデルをRFIに、すべての利用可能なフォローアップデータを用いて適合させることになる。本方法は、対数累積ハザード関数の自然スプライン平滑化を伴うワイブル分布を用いる再発のハザードを、処置(化学療法または観察)、RS、TSおよびTSと処置の相互作用における効果を用いてモデル化することになり、それにより、処置、RS、TSおよびTSと処置との相互作用の効果を時間依存的にすることができる。TSの関数としての化学療法の予測される効果は、2、3、および5年後のフォローアップ時に評価されることになる。
【0202】
パワー計算を、PASS2008において実行された、HsiehおよびLavori(2000年)によって提起された方法を用い、単一の非バイナリ共変量を伴うコックス比例ハザードモデルにおいて行った。当業者であれば、0.01〜0.05αのαでのパワーがタイプIの誤差を制御するのに十分となることを理解するであろう。
【0203】
例えば、遺伝子発現および処置の簡略化コックス比例ハザード回帰モデルを、遺伝子発現、処置および遺伝子発現と処置との相互作用を有する完全モデルと比較する試験では、化学療法恩恵とRUNX1の発現との関連性が示された(p=0.030、相互作用HR=0.59、HR95%CI(0.37、0.95)およびFAP(p=0.065、相互作用HR=0.66、HR95%CI(0.42、1.03)。
【0204】
手術単独患者における遺伝子発現と再発リスクの関連性を、13の癌関連遺伝子について試験した。多変量コックス比例ハザード回帰モデルは、臨床的共変量の特定の分布について調節された再発リスクの評価を可能にする。再発リスク推定値は、臨床的共変量の分布、様々な試験集団(存在する場合)における分布の差異、およびベースライン生存について調節したこの多変量モデルから生成された。
【0205】
表8は、RFIに対する遺伝子発現の一変量コックス比例ハザード回帰モデルの結果を示す。図12は、3年再発リスクおよび再発スコア(間質および細胞周期群遺伝子を含む)に基づく、術後のステージII結腸癌患者における(カプラン・マイヤー曲線による)群リスクを示す。図13は、5年再発リスク(QUASAR−手術単独)および再発スコア(間質、細胞周期、および(RS2における)アポトーシス遺伝子を含む)における(カプラン・マイヤー曲線による)リスクプロファイルプロットを示す。
【0206】
さらに、4つの結腸発生試験およびQUASAR検証試験から得られる結果を組み合わせて分析を行い、3000名を超える患者全体を通じた13の癌関連遺伝子の性能について評価した。2つの異なる分析方法、すなわち、(1)DerSimonianおよびKacker(2007年)によって実行されたPauleおよびMandelの方法(1982年)を用いて試験間変動を無作為に処理するメタ分析;および(2)試験、ステージおよび処置によって分類されるコックス比例ハザード回帰モデルを適用し、試験全体を通じた結果を組み合わせた。表9は、これらの分析の結果を示す。表中に認められうるように、AXIN以外のすべては、結腸癌における再発リスクに関連することが示された(すなわち95%CIは1を含まなかった)(例えば、R.Paule、J.Mandel、「Journal of Research of the National Bureau of Standards」 87:377−385頁(1982年);R.der Simonian and R.Kacker、Cotemp.Clin Trials 28:105−144頁(2007年)(いずれも参照により本明細書中に援用される)を参照)。
【0207】
実施例4:他のアルゴリズムに基づくアッセイ
上の実施例に概説される試験から得られるデータのさらなる分析によると、追加的な遺伝子を再発スコアの遺伝子パネルに組み入れることで、改善された性能が得られうることが示唆された。例えば、BIKおよびEFNB2は、手術単独および5FU処置患者の双方において再発リスクに有意に関連した。統計的モデリングを行い、いくつかの多重遺伝子モジュールと結腸癌の再発との関連性の強度について検討した。表10および図17〜19は、選択された多重遺伝子モデルの予後性能の比較を示す。
【0208】
【表5】

【0209】
統計的モデリングに基づき、BGNおよびKi−67、またはBGN、Ki−67およびBIKを用いる多重遺伝子モデルが、結腸癌患者に対して最低限の予後情報を提供しうることが示された(図18〜19を参照)。しかし、10の予後遺伝子(BGN、FAP、INHBA、EFNB2、GADD45B、Ki−67、MAD2L1、BIK、cMYC、MYBL2)に加えて参照遺伝子(「RS2」)からなるモデルは、結腸癌における再発リスクの極めて正確な評価をもたらした(図20を参照)。
【0210】
実施例5:共発現遺伝子および遺伝子クリークの同定
有効な予後および予測遺伝子とともに共発現する遺伝子クリークを表4〜6に示す。これらの遺伝子クリークは、本明細書中に記載の方法を用いて同定された。
【0211】
材料および方法:
結腸腫瘍試料におけるマイクロアレイデータは、対内的に得るか、または公的データベース、例えばGene Expression Omnibus(GEO)から得てもよい。マイクロアレイデータを正規化し、すべてのアレイプローブに対してペアワイズスピアマン相関行列を算出した。異なる試験を通じた有意な共発現プローブを濾過除去し、グラフを作成し、プローブクリークを算出し、プローブを遺伝子にマッピングし、遺伝子クリークを生成した。
【0212】
結腸癌マイクロアレイデータセットのダウンロード
Gene Expression Omnibus(GEO)データベースから得た5つのデータセットを用い、結腸クリークを算出した。これらのデータセットを、Affymetrix(登録商標)HG−U133Aマイクロアレイチップ(Affymetrix Inc.(Santa Clara,CA))を使用し、結腸腫瘍発現実験として同定した。詳細な情報については、GEOウェブサイトhttp://www.ncbi.nlm.nih.gov/geo/にて見出すことが可能である。表7は、GEOデータセットの登録番号および各データセットにおける腫瘍試料の数を提供する。
【0213】
アレイデータの正規化
GEOからのアレイデータは、適切なソフトウェア、例えばAffymetrix MAS5.0、またはバイオコンダクターパッケージのようなオープンソースのRMAソフトウェア(例えば、http://rafalab.jhsph.edu/を参照)を用いて正規化してもよい。
【0214】
試料アレイデータがMAS5.0タイプである場合、それらは次のステップで正規化される。
1.値が<10である場合、発現レベルが「10」に変えられる
2.次いで、発現レベルが対数変換される
3.全アレイプローブにおいて、対数変換値に対する中央値が算出される
4.各プローブ値から中央値を引き、得られた値は正規化値として規定されることになる
【0215】
試料アレイデータがRMAタイプである場合、それは次のステップで正規化される。
1.全アレイプローブにおいて、生成されたRMA値に対する中央値が算出される
2.各プローブ値から中央値を引き、得られた値は正規化値として規定されることになる
【0216】
アレイプローブ共発現対の生成
スピアマンのランク相関係数(r)を、データセットにおけるすべての固有のプローブ対(各データセットにおいて、22283のプローブは248、254、903の固有の対をもたらす)に対して計算した。次いで、これらの対を有意な閾値Tによって濾過し、r>=Tを有する任意のプローブ対が有意であると考えられた。有意な相関対(閾値を超えるスピアマン相関値を有した)を、各GEOデータセットに対して生成した。所与の播種遺伝子プローブについては、播種プローブまたはそれに直接結合されたプローブを含む有意な対が、5つ全部のGEOデータセット全体を通じて存在する場合、それらをグラフ内に配置し、最大クリークを計算するように使用した。
【0217】
アレイプローブクリークの生成
Broen−Kerboschアルゴリズムを用い、上記ステップから生成される有意なプローブ対のグラフから最大クリークを生成した。まず、ノードの3つの「セット」を作成した。第1のセットのcompsubは、バックトラックツリーの分岐に沿って移動するとともに、拡張または縮小されるセットであった。第2のセットのcandidatesは、compsubに加えられることになる全ポイントのセットであった。第3のセットnotは、compsubに既に加えられたノードのセットであった。クリークを生成するための再帰的機構は以下のとおりである。
1.候補ノードを選択する
2.選択された候補ノードをcompsubに追加する
3.選択された候補に結合されていないすべてのノードを取り出し、古いセットを無傷に保つことにより、古いセットからcandidatesおよびnotの新しいセットを作成する
4.拡張オペレーター(extention operator)を呼び出し、形成されたばかりのセットに対して操作する
5.再帰時、compsubから選択された候補を取り出し、古いセットnotにそれを追加する
【0218】
拡張オペレーターの後、candidatesおよびnotのセットが空であった場合、compsub上のノードはクリークであり、機構は新しい候補ノードから再開する(図11を参照)。
【0219】
遺伝子クリークの報告
プローブクリークが算出されてから、クリークにおける各プローブを、Entrez Gene Symbol(Official Gene Symbol)によって同定された遺伝子にマッピングした。表6は、FAP、INHBA、Ki−67、HSPE1、MAD2L1、およびRUNX1に関連するクリークに対する報告を列挙する。
【0220】
特定のプローブは、遺伝子への複数のマッピングを有する。それらは、SeedingGeneの中の同じAffyProbeIDとして列挙されるが、Official Genes(CliquedGeneカラムとして列挙)に対する複数の不明瞭なマップを有する。特定のCliquedGeneは、表6中で「−−−」として列挙される。それは、AffyProbeがいずれの現行のOfficial Genesにもマッピングしないことを意味する。重みカラムでは、クリークを統合した際に重みを記入する(list out)。それは本質的に、クリークの播種遺伝子との共発現における証拠の数である。
【0221】
実施例6:閾値化の使用
閾値化を用い、遺伝子発現測定値がアッセイの定量限界(LOQ)に接近する際における精度の有意な低下を明らかにすることにより、再発スコア(RS)および処置スコア(TS)を報告する場合での再現性を改善することが可能である。アッセイのLOQは、RNAの最低濃度を示し、その場合での結果は、確実に報告可能であり、18の結腸癌遺伝子の各々について推定がなされている。
【0222】
例として、図26は、Ki−67の(非正規化)遺伝子発現(C)測定値に対する希釈RNA濃度の効果を示す。C測定値における分散は、RNA濃度が低下すると、明らかに増加する。事実、C測定値における対数分散が遺伝子におけるC測定値の平均にほぼ比例することが示されうる。結果として、RSおよびTSにおける変動性は、遺伝子発現測定値をLOQもしくはその近傍で切り捨て、それにより、ノイズがRSおよびTSの推定に導入されている可能性を低減することにより、さらに低下されうる。
【0223】
実施例7:遺伝子発現:腫瘍領域比の計算
上記のステージII/III結腸癌における臨床発生試験によると、間質に関連することの多い遺伝子が再発リスクの増大と相関する一方、細胞周期遺伝子が再発リスクの低下と相関することが明らかになった。この事実は、RS/TSスコアの変動性を説明でき、また、本明細書中に記載のアルゴリズムにおいて、間質および内腔面積の量、ならびにこれらの領域内での局在化された遺伝子発現が考慮される場合、考慮してもよい。例えば、間質面積単位あたりの間質遺伝子発現値と上皮面積単位あたりの細胞周期遺伝子発現値の比を考慮するアルゴリズムの場合、所与の患者における腫瘍ブロック内部の異質性が低下することにより、再発リスク予測の精度および再現性が増大することになる。
【0224】
再発リスクに対する変数である腫瘍領域面積および間質/細胞周期遺伝子発現の影響を解明するための試験を実施した。RNAは、結腸腫瘍の異なる領域(腫瘍の内腔部および腫瘍関連間質)から抽出した。図14は、腫瘍関連間質内での間質遺伝子の発現レベルが高まり、腫瘍の内腔部内での細胞周期遺伝子の発現レベルが高まることを示す。したがって、間質が間質群スコア(SGまたはSGS)に有意に寄与しており、かつ上皮が細胞周期遺伝子スコア(CCGまたはCCGS)に有意に寄与している可能性が高い。これらの仮説を仮定すると、試料内部の間質の面積は、(ブロックの内部および間での)SGの変動性、ひいてはスコアに寄与する。同様に、分析される試料内部の上皮の面積であれば、(ブロックの内部および間での)CCGの変動性、ひいてはスコアに寄与しうる。
【0225】
腫瘍上皮細胞および間質内部での遺伝子発現は、患者間で変動する。例えば、図15は、一部の患者が、それらの腫瘍関連間質内で、それら以外の患者の場合に対し、間質遺伝子における遺伝子発現レベルの上昇を有しうることを示す。したがって、活性が低いが大量の間質を有しうる患者もあれば、活性が高いがより少量の間質を有しうる患者もある。さらに、同じ患者における遺伝子発現レベルは、(例えば腫瘍ブロックの内部および間での)腫瘍の位置に応じて変動しうる。この変動性は、患者における再発および処置スコアの再現性に影響しうる。例えば、図16は、間質群スコア(SG)、細胞周期群スコアCCG)、細胞シグナル伝達群(CSGまたはGADD45B)、および再発スコア(RS)の、同じ腫瘍ブロックの組織切片による変動性を示す。この分析は、同じ腫瘍ブロックに由来する複数の切片に対して行い、患者11名からのデータを含んだ。
【0226】
したがって、RSアルゴリズムの計算およびTSアルゴリズムの計算において、腫瘍関連間質の面積および腫瘍内腔領域の面積を考慮することにより、RSおよびTSの再現性がそれぞれ高まり、それにより再発リスク予測の精度の向上につながる可能性がある。
【0227】
例えば、間質群遺伝子の発現レベルは、アッセイされる、腫瘍関連間質単位面積(「sua」)に対する1つ以上の間質群遺伝子の発現レベルの比として提供されうる。別の例では、細胞周期群遺伝子の発現レベルは、アッセイされる、腫瘍上皮単位面積(「cua」)に対する1つ以上の細胞周期群遺伝子の発現レベルの比として提供されうる。RSアルゴリズムの場合、次の形式、すなわち、RS=[(SG×sua係数)±(CCG×sua係数)]+[(SG×cua係数)±(CCG×cua係数)]±(他の遺伝子群、例えば、CSG、AG、および/またはTFGにおける反復分析)で修正されうる。同様に、TSアルゴリズムの場合、次の形式、すなわち、TS=[(SG×sua係数)±(CCG×sua係数)]+[(SG×cua係数)±(CCG×cua係数)]±(他の遺伝子群、例えば、AG、TFG、および/またはMGにおける反復分析)で修正されうる。
【0228】
さらに、次の典型的なアルゴリズムは、ブロックの異なる部分における遺伝子発現に関連した変動性を分析し、除去するための方法を提供する。例えば、腫瘍ブロックの異なる部分における細胞周期および間質遺伝子発現の場合、SGSij=SGi+SBij(対象iブロックjにおける間質遺伝子群値は、遺伝子効果とブロック効果の合計である)と、CCGSij=CCGi+CCBij(対象iブロックjにおける細胞周期遺伝子群値は、遺伝子効果とブロック効果の合計である)と、を計算可能である。
【0229】
SGSおよびCCGSは、対象全体を通じて相関がない、すなわち、SGSおよびCCGSの変動性は、ほとんどの場合、SGおよびCCGから生じ、遺伝子発現因子とこれらは、相関がない。
【0230】
SGSおよびCCGSは、対象の範囲内で相関がある、すなわち、CCBおよびSBには、共通の効果が内在する。次を計算する。
SGSrij=SGSij−SGSi=SBij−SBi
CCGSrij=CCGSij−CCGSi=CCBij−CCBi
【0231】
SGSrijとCCGSrijとの間の相関は、対象全体を通じてプールされた対象内相関(within subjects correlation)、すなわち患者内相関平均(average within patient correlation)と考えられうる。(Yij,Xij)〜N((μyi,μxi)、[σy,ρyx//ρyx,σx])におけるρを推定するための非公式アプローチ。あるいは、Yij=αi+βXij+εijと仮定してもよい。
【0232】
%間質が対象内のSGSと相関する場合、RSおよび/またはTS値におけるこの変動源を除去する手段が提供されうる。
【0233】
実施例8:間質リスク分析
方法および材料
実施例1に記載のCleveland Clinic Foundation(CCF)コホートのサブセット由来の患者444名を含む試験を実施し、結腸癌試料中での腫瘍関連間質の量(「間質面積」)が、ステージII/III結腸癌患者における再発リスク(「間質リスク」)にいかに影響するかを解明した。詳細には、CCFコホートからの全部で148の再発を含むCCFコホートのサブセット(コホートサンプリング試験設計)および多数(すなわち296)の非再発の約2倍の無作為試料を使用し、結腸の切除によって処置された患者444名が得られた。
【0234】
参加基準は、以下を含んだ。
・ステージIIまたはステージIII結腸癌患者のいずれか
・1981〜2000年の期間、CCFで、結腸切除(手術)で処置された患者
【0235】
除外基準は、以下を含んだ。
・CCFアーカイブ内に、初期診断から入手可能な腫瘍ブロックがない
・CCFおよびGenomic Health PathologistによるH&Eスライドの試験によって評価される場合、ブロック内で腫瘍がないかまたは腫瘍が極めて少ない(侵襲性癌細胞によって占められる面積は他の上皮要素、例えば正常な上皮、もしくはリンパ管によって占められる面積に対して<5%)
・ステージIIまたはステージIIIの印環状(signet ring)結腸癌(WHO分類)と診断された患者
・RT−PCR分析にとって不十分なRNA(<586ng)
・5つの参照遺伝子における平均非正規化CT≧35
【0236】
完全なCCFコホートは、全部で886のFPE腫瘍組織ブロックを含んだ。これらのうちの108を、下記の病理学および/または実験室における要件を満たさないことから除外した。実験室、病理学および臨床データを統合した後、さらに患者13名を、すべての試験での参加および除外基準を満たせないことから除外し、評価可能な患者765名を残した。Genomic Healthの病理学者による初期組織学的評価は、スライドを腫瘍の量について評価し、必要ならば、マニュアル顕微解剖用にマークし、腫瘍領域を豊富にすることであった。この初期の病理学的レビューでは、8つの症例が不十分な腫瘍組織(<5%の腫瘍組織)を有することが見出されたことから、初期の病理学的レビューができなかった。次いで、試料に対し、完全な組織学的レビューを行った。グレードを、CCFおよびGenomic Healthの病理学者によって取得し、各病理学的読み取りについて、別々に分析した(すなわち、「組み合わされた」病理学的スコアを作成する試みを一切しなかった)。さらに11の症例で、50%を超える侵襲成分を含む印環形態の存在、十分な侵襲性腫瘍組織の欠如(<5%の癌細胞)または結腸以外の組織タイプにより、この完全な病理学的レビューができなかった。CCF試験からの患者および試料の傾向については、表11にまとめる。
【0237】
【表6】

【0238】
全部で444の評価可能な試料に対し、標準的およびデジタル式病理学的評価の双方を行った。120のスライドに対応可能なScanScope XTシステムを使用し、すべての試験用H&Eスライドの自動化走査を20倍の走査倍率で行うとともに、バーコードデータでの患者識別フィールドの自動取り込み(autopopulation)を、スペクトル(Spectrum)情報管理システムを使用して行った。20倍の走査倍率を、この倍率が画像品質および走査速度の最適化を高めることから、選択した。
【0239】
デジタルH&E走査が、Aperio(登録商標)Digital Pathology Systemから得られた。2つの異なるソフトウェアシステム−Aperio(登録商標) Genie Digital Pathology Image AnalysisソフトウェアおよびDefiniens(登録商標) Digital Pathology Image Analysisソフトウェアを使用し、デジタルH&E測定値を生成した。Definiens画像解析ソフトウェアは、Definiens Cognition Network Technology(登録商標)に基づき、コンテクスト内の画素について試験し、画像を反復的に作成し、画素群をオブジェクトとして認識する。
【0240】
病理学者および助手は、画像解析アプリケーションの訓練を受け、目的の領域(例えば、ムチン、腫瘍腺および腫瘍間質)を、富化された全腫瘍部分の予め撮られたデジタル画像を使用して検出した。これらの訓練用のスライド(training slide)は、Aperioシステムによって評価されるべきスライドとして代表的なものであった。2つの画像解析アルゴリズムのいくつかのバリエーションが、低および高グレード癌と粘液癌のために開発された。これらは、目的の領域を同定し、次いで訓練用のスライドから「学ぶ(learn)」のプログラムを有することによって開発された。得られたアルゴリズムを全患者コホートに適用し、患者試料の富化された腫瘍部分を分析した。患者試料を、3つのデジタル試験セット(すなわち、低グレード、高グレードおよび粘液癌)にバッチ処理し(GHIの病理学者によって判定された)、すべての画像を、バッチ処理を用いて処理した。
【0241】
成果および統計分析
腫瘍関連間質の表面積は、患者間で変動する。例えば、図21は、無再発期間状態によって分類された試験下での、患者444名における、Aperio digital pathology systemによって測定された、間質面積の自然対数に対する変動性プロットを提供する。
【0242】
統計分析を行い、間質面積と無再発期間(RFI)との間に有意な関係があるか否かを判定した。詳細には、腫瘍ステージ(ステージIIおよびステージIII)の主要効果に基づく、RFIに対する(簡略化)重み付けコックス比例ハザードモデルを、腫瘍ステージおよび間質面積の主要効果に基づく、RFIに対する(完全)重み付けコックス比例ハザードモデルと比較した(Aperioデジタル画像解析システムによって測定)。重み付け擬似部分尤度(Weighted Pseudo Partial Likelihood)アプローチを用い、症例−コホートサンプリング試験設計の利用に対応した。間質面積におけるハザード比が1であるという仮説に対するハザード比が1でないという両側の代替仮説についてのWald試験を実施した。得られたWaldχ=15.64(1自由度)が両側p値<0.001をもたらし、それは、間質面積が、結腸切除で処置された結腸癌患者における(腫瘍ステージ単独を超える)疾患再発の予後であることを示す。得られた間質面積における標準化ハザード比は1.45であり、それは、間質面積における各標準偏差の増加に対して疾患再発における相対リスクが45%増加することを示す。
【0243】
【表7】

【0244】
間質面積が疾患再発の予後であるか否かを試験することに加え、統計分析を行い、間質面積が、ステージおよび再発スコアの双方を超える追加的な予後情報を提供するか否かを判定した。詳細には、ステージ(ステージIIおよびステージIII)および再発スコアの主要効果に基づく、RFIに対する(簡略化)重み付けコックス比例ハザードモデルを、腫瘍ステージ、再発スコアおよび間質面積の主要効果に基づく、RFIに対する(完全)重み付けコックス比例ハザードモデルと比較した(Aperioデジタル画像解析システムによって測定)。間質面積におけるハザード比が1であるという仮説に対するハザード比が1でないという両側の代替仮説についてのWald試験を実施した。得られたWald比χ=13.17(1自由度)が両側p値<0.001をもたらし、それは、間質面積が、腫瘍ステージおよび再発スコアを超える疾患再発の予後であることを示す。得られた間質面積における標準化ハザード比は1.41であり、それは、間質面積における各標準偏差の増加に対して疾患再発における相対リスクが41%増加することを示す。
【0245】
【表8】

【0246】
同様の分析を行い、間質面積が、ステージおよびRS2の双方を超える追加的な予後情報を提供するか否かを試験した。詳細には、ステージ(ステージIIおよびステージIII)およびRS2の主要効果に基づく、RFIに対する(簡略化)重み付けコックス比例ハザードモデルを、腫瘍ステージ、RS2および間質面積の主要効果に基づく、RFIに対する(完全)重み付けコックス比例ハザードモデルと比較した(Aperioデジタル画像解析システムによって測定)。間質面積におけるハザード比が1であるという仮説に対するハザード比が1でないという両側の代替仮説についてのWald試験を実施した。得られたWald比χ=14.86(1自由度)が両側p値<0.001をもたらし、それは、間質面積が、腫瘍ステージおよびRS2を超える疾患再発の予後であることを示す。得られた間質面積における標準化ハザード比は1.44であり、それは、間質面積における各標準偏差の増加に対して疾患再発における相対リスクが44%増加することを示す。
【0247】
【表9】

【0248】
分析を目的として、間質面積は、低および高間質リスク群に分類されうる。詳細には、間質スコア=(間質面積−平均)/標準偏差の場合、低リスク(間質スコア≦0)および高リスク(間質スコア>0)を規定する。間質リスク群によって分類されるステージIIおよびステージIII患者におけるカプラン・マイヤープロット(それぞれ図22および23に提供される)は、リスク群間での分離を明示する(Logrank p値<0.01)。同様に、間質リスク群および再発スコアリスク群の双方によって分類されるステージIIおよびステージIII患者におけるカプラン・マイヤープロット(それぞれ図24および25に提供される)は、リスク群間での分離がさらに拡大することを示す(Logrank p値<0.01)。
【0249】
結論
これらの分析は、間質面積が、独立に、ステージIIおよびステージIII患者における疾患再発の予後であり、かつ、RS、間質面積、および結節状態のすべてが、ステージIIおよびIII結腸癌における重要な予後情報を提供することを示す。それが、再発リスクに最も強く関連した腫瘍関連間質の表面積、さらには腫瘍領域の比例測定値であるという発見は、本試験の想定外の結果であった。
【0250】
【表10】

【0251】
【表11】

【0252】
【表12】

【0253】
【表13】

【0254】
【表14】

【0255】
【表15】

【0256】
【表16】

【0257】
【表17】

【0258】
【表18】

【0259】
【表19】

【0260】
【表20】

【0261】
【表21】

【0262】
【表22】

【0263】
【表23】

【0264】
【表24】

【0265】
【表25】

【0266】
【表26】

【0267】
【表27】

【0268】
【表28】

【0269】
【表29】

【0270】
【表30】

【0271】
【表31】

【0272】
【表32】

【0273】
【表33】

【0274】
【表34】

【0275】
【表35】

【0276】
【表36】

【0277】
【表37】

【0278】
【表38】

【0279】
【表39】

【0280】
【表40】

【表41】

【0281】
【表42】

【0282】
【表43】

【0283】
【表44】

【0284】
【表45】

【0285】
【表46】

【0286】
【表47】

【0287】
【表48】

【0288】
【表49】

【0289】
【表50】

【0290】
【表51】

【0291】
【表52】

【0292】
【表53】

【0293】
【表54】

【0294】
【表55】

【0295】
【表56】

【0296】
【表57】

【0297】
【表58】

【0298】
【表59】

【0299】
【表60】

【0300】
【表61】

【0301】
【表62】

【0302】
【表63】

【0303】
【表64】

【0304】
【表65】

【0305】
【表66】

【0306】
【表67】

【0307】
【表68】

【0308】
【表69】

【0309】
【表70】

【0310】
【表71】

【0311】
【表72】

【0312】
【表73】

【0313】
【表74】

【0314】
【表75】

【0315】
【表76】

【0316】
【表77】

【0317】
【表78】

【0318】
【表79】

【0319】
【表80】

【0320】
【表81】

【0321】
【表82】

【0322】
【表83】

【0323】
【表84】

【0324】
【表85】

【0325】
【表86】

【0326】
【表87】

【0327】
【表88】

【0328】
【表89】

【0329】
【表90】

【0330】
【表91】

【0331】
【表92】

【0332】
【表93】

【0333】
【表94】

【0334】
【表95】

【0335】
【表96】

【0336】
【表97】

【0337】
【表98】

【0338】
【表99】

【0339】
【表100】

【0340】
【表101】

【0341】
【表102】

【0342】
【表103】

【0343】
【表104】

【0344】
【表105】

【0345】
【表106】

【0346】
【表107】

【0347】
【表108】

【0348】
【表109】

【0349】
【表110】

【0350】
【表111】

【0351】
【表112】

【0352】
【表113】

【0353】
【表114】

【0354】
【表115】

【0355】
【表116】

【0356】
【表117】

【0357】
【表118】

【0358】
【表119】

【0359】
【表120】

【図1−i】

【図1−ii】

【図2−i】

【図2−ii】


【特許請求の範囲】
【請求項1】
結腸直腸癌を有する患者における術後の癌再発の可能性を判定するための方法であって、
前記患者から得られる腫瘍試料中での予後遺伝子の発現レベルを測定するステップと、
前記患者における再発スコア(RS)を、前記測定された遺伝子発現レベルを用いて計算するステップであって、ここで前記RSは、前記測定された発現レベルをRSアルゴリズムの遺伝子サブセットに代入することによって計算され、
ここで前記遺伝子サブセットは、各々が間質群および細胞周期群に由来する少なくとも1つの遺伝子を含むステップと、
前記RSに基づいて報告を生成するステップと、
を含む、方法。
【請求項2】
各遺伝子サブセットの前記発現レベルは、その遺伝子サブセットの癌再発への寄与に基づいて重み付けされる、請求項1に記載の方法。
【請求項3】
各遺伝子サブセットの前記発現レベルは、発現レベル対腫瘍領域の比としてさらに計算され、ここで前記比は、腫瘍関連間質単位面積または腫瘍上皮単位面積を含む、請求項1に記載の方法。
【請求項4】
間質リスクスコア(Stromal Risk Score)を得るため、前記腫瘍試料の間質面積を測定するステップ
をさらに含み、
ここで間質面積の増大は、前記患者における癌の再発リスクの増大と正に相関し、
ここで前記報告は、前記間質リスクスコアに基づく、
請求項1に記載の方法。
【請求項5】
前記間質群は、BGN、FAP、INHBA、および、BGN、FAP、またはINHBAとともに共発現する遺伝子を含む、請求項1に記載の方法。
【請求項6】
前記細胞周期群は、MYBL2、Ki−67、cMYC、MAD2L1、および、MYBL2、Ki−67、cMYC、またはMAD2L1とともに共発現する遺伝子を含む、請求項1に記載の方法。
【請求項7】
前記遺伝子サブセットは、GADD45B、および
GADD45Bとともに共発現する遺伝子
を含む細胞シグナル伝達群をさらに含む、請求項1に記載の方法。
【請求項8】
前記遺伝子サブセットは、
9BIK、およびBIKとともに共発現する遺伝子
を含むアポトーシス群をさらに含む、請求項1に記載の方法。
【請求項9】
前記遺伝子サブセットは、
EFNB2、およびEFNB2とともに共発現する遺伝子
を含む血管新生群をさらに含む、請求項1に記載の方法。
【請求項10】
結腸直腸癌を有する患者が化学療法に対する有益な応答を有する可能性を判定する方法であって、
前記患者から得られる腫瘍試料中での予測遺伝子の発現レベルを測定するステップと、
前記患者における処置スコア(TS)を、前記測定された遺伝子発現レベルを用いて計算するステップであって、ここで前記TSは、前記測定された発現レベルをTSアルゴリズムの遺伝子サブセットに代入することによって計算され、
ここで前記遺伝子サブセットは、各々がMSI群、アポトーシス群、および間質群に由来する少なくとも1つの遺伝子を含むステップと、
前記TSに基づいて報告を生成するステップと、
を含む、方法。
【請求項11】
各遺伝子サブセットにおける前記発現レベルは、前記遺伝子サブセットの化学療法に対する応答への寄与に基づいて重み付けされる、請求項10に記載の方法。
【請求項12】
前記MSI群は、AXIN2、およびAXIN2とともに共発現する遺伝子を含む、請求項10に記載の方法。
【請求項13】
前記アポトーシス群は、BIK、およびBIKとともに共発現する遺伝子を含む、請求項10に記載の方法。
【請求項14】
前記間質群は、EFNB2、およびEFNB2とともに共発現する遺伝子を含む、請求項10に記載の方法。
【請求項15】
前記遺伝子サブセットは、
RUNX1、およびRUNX1とともに共発現する遺伝子
を含む転写因子群をさらに含む、請求項10に記載の方法。
【請求項16】
前記遺伝子サブセットは、
MAD2L1およびHSPE1、ならびにMAD2L1およびHSPE1とともに共発現する遺伝子
を含む細胞周期群をさらに含む、請求項10に記載の方法。
【請求項17】
前記遺伝子サブセットに由来する少なくとも1つの遺伝子は、RANBP2、BUB1、TOP2A、C20_ORF1、CENPF、STK15、AURKB、HIF1A、UBE2C、およびMSH2、ならびに、RANBP2、BUB1、TOP2A、C20_ORF1、CENPF、STK15、AURKB、HIF1A、UBE2C、およびMSH2とともに共発現する遺伝子からなる群に由来する代用遺伝子によって置き換えられうる、請求項10に記載の方法。
【請求項18】
アルゴリズムに基づく遺伝子発現分析において用いられる発現値における閾値を使用するための方法であって、
患者から得られる組織切片中での遺伝子の発現レベルを測定するステップと、
前記測定された発現レベルを前記遺伝子における閾値と比較するステップと、
を含み、
ここで前記閾値が前記遺伝子の前記発現レベルより小さい場合、前記発現値は、発現アルゴリズムにおいて用いられ、かつ
ここで前記遺伝子の前記発現レベルが前記閾値より大きいかまたはそれに等しい場合、前記発現レベルは、発現アルゴリズムにおいて用いられる、方法。
【請求項19】
前記閾値は、C値に基づく、請求項18に記載の方法。
【請求項20】
前記閾値は、表3中に列挙される閾値のうちの1つ以上である、請求項18に記載の方法。
【請求項21】
標的遺伝子とともに共発現される遺伝子を同定するための遺伝子発現分析方法であって、
アレイプローブに基づき、癌試料におけるマイクロアレイ遺伝子発現データを正規化するステップと、
すべての固有のアレイプローブ対における遺伝子発現レベルに基づいて相関係数を計算するステップと、
有意なプローブ対を判定するステップであって、ここで有意なプローブ対は、有意な閾値より大きい相関係数を有する、標的遺伝子プローブおよびアレイプローブであるステップと、
前記標的遺伝子をその対応する標的遺伝子プローブにマッピングするステップと、
候補プローブセットを選択するステップであって、ここで各候補プローブは、有意なプローブ対の一部であるステップと、
各候補プローブに関連した遺伝子を同定するステップであって、
ここで各候補プローブに関連した前記遺伝子は、共発現遺伝子であるステップと、
を含む、遺伝子発現分析方法。
【請求項22】
遺伝子発現を評価する方法であって、
患者から得られる癌試料中での遺伝子の正規化発現レベルを測定するステップと、
前記結腸直腸試料中での組織単位面積に対する前記遺伝子の正規化発現の比を計算するステップであって、ここで前記組織単位面積は、腫瘍関連間質単位面積または腫瘍上皮単位面積であるステップと、
前記比を用いて、前記患者における再発スコア(RS)または処置スコア(TS)を計算するステップと、
を含む、方法。
【請求項23】
前記遺伝子は、間質群遺伝子である、請求項22に記載の方法。
【請求項24】
前記組織単位面積は、腫瘍関連間質単位面積である、請求項23に記載の方法。
【請求項25】
前記遺伝子は、細胞周期群遺伝子である、請求項22に記載の方法。
【請求項26】
前記遺伝子は、アポトーシス群遺伝子である、請求項22に記載の方法。
【請求項27】
前記組織単位面積は、腫瘍上皮単位面積である、請求項22に記載の方法。
【請求項28】
癌患者における予後を判定する方法であって、
前記癌患者から得られる腫瘍試料の間質面積を測定し、間質リスクスコアを得るステップであって、ここで前記腫瘍試料の間質面積の増大は、前記癌患者における癌の再発リスクの増大と正に相関するステップと、前記間質リスクスコアに基づいて報告を生成するステップと、
を含む、方法。
【請求項29】
前記腫瘍試料は、結腸直腸癌である、請求項28に記載の方法。

【図3a】
image rotate

【図3b】
image rotate

【図4a】
image rotate

【図4b】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate

【図21】
image rotate

【図22】
image rotate

【図23】
image rotate

【図24】
image rotate

【図25】
image rotate

【図26】
image rotate


【公表番号】特表2012−525159(P2012−525159A)
【公表日】平成24年10月22日(2012.10.22)
【国際特許分類】
【出願番号】特願2012−508805(P2012−508805)
【出願日】平成22年4月30日(2010.4.30)
【国際出願番号】PCT/US2010/033303
【国際公開番号】WO2010/127322
【国際公開日】平成22年11月4日(2010.11.4)
【出願人】(504345126)ジェノミック ヘルス, インコーポレイテッド (17)
【Fターム(参考)】