説明

EGFR阻害因子治療のための予測マーカー

本発明は、癌患者におけるEGFR阻害因子の臨床的利益を予測するバイオマーカーを提供する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、癌患者におけるEGFR阻害因子治療の臨床的利益の予測のためのバイオマーカーを提供する。
【背景技術】
【0002】
多くのヒトの悪性疾患は、上皮増殖因子受容体(EGFR)の異常又は過剰発現に関連する。EGF、形質転換増殖因子−α(TGF−α)、及びその他多くのリガンドは、受容体の細胞内チロシンキナーゼドメインの自己リン酸化を刺激するEGFRに結合する。その後、様々な細胞内経路が活性化され、これらの下流事象はインビトロ(in vitro)での腫瘍細胞増殖をもたらす。EGFRを介する腫瘍細胞の刺激が、インビボ(in vivo)における腫瘍増殖及び腫瘍生存の双方にとって重要であると考えられている。
【0003】
EGFRチロシンキナーゼの阻害因子であるタルセバ(Tarceva(商標))(エルロチニブ)の初期の臨床データは、当該化合物が、目標有効濃度(前臨床データにより決定される)(前臨床データにより決定される)を提供する用量で、安全且つ一般的に十分耐性であることを示唆している。進行疾患に罹患する患者における、第I相及びII相臨床試験では、タルセバ(商標)が、様々な上皮腫瘍において臨床活性を有する見込みが実証されている。実際、タルセバ(商標)は、頭部及び頸部の癌、及びNSCLC(非小細胞肺癌)に罹患する事前の治療された患者において、確立された二次化学療法と類似するオーダーで耐久性のある部分寛解を誘導できるが、化学療法より良好な安全プロファイル及び利便性の向上(静脈[i.v.]投与の代わりにタブレット)という追加的利益を有することが示されている。近年完了した無作為二重盲検プラセボ対照試験(BR.21)から、進行疾患のため標準的療法が失敗したNSCLC患者の生存が、タルセバ(商標)単剤により顕著に延長及び向上させたことが示されている。
【0004】
タルセバ(商標)(エルロチニブ)は、化学小分子で経口活性があり、EGFRチロシンキナーゼ(EGFR−TKI)の強力な選択的阻害因子である。
【0005】
肺癌は、北米や欧州において癌関連死亡の主要原因である。米国においては、肺癌による死亡者が、第二(結腸)、第三(乳房)、及び第四(前立腺)がもたらす複合した癌死亡原因による複合した総死者を超える。全肺癌の約75%〜80%はNSCLCであり、患者のおよそ40%は、局所的に進行且つ/又は切除不能な疾患症状を呈する。典型的にこの群には、悪性胸膜浸潤のない、バルキーな病期IIIA及びIIIBに罹患する者が含まれる。
【0006】
欧州にける肺癌のおおよその罹患率は年間100,000人当たり52.5人であり、死亡率は48. 7人である。当該率は、男性においてはそれぞれ79.3人及び78.3人であり、女性においては21.6人及び20.5人である。NSCLCは、全ての肺癌患者の80%を占めている。肺癌致死率は、男性で約90%、女性では80%であり、これは喫煙に起因する。
【0007】
米国癌協会によると、米国では2004年に新規の肺癌患者がおよそ173,800人おり(男性で93,100人、及び女性で807,000人)、全新規癌の約13%を占めた。大半の患者は、診断から2年以内にその疾患の結果死亡した。多くのNSCLC患者にとって、成功する治療は依然として不明である。進行した腫瘍は、多くの場合外科手術に適さず、放射線療法及び化学療法の耐容用量に対して耐性となることもある。無作為試験において、現在最も盛んな組み合わせ化学療法では、応答比率がおよそ30%〜40%であり、1年生存率が35%から40%に達した。これは対処療法のみの治療で観察される、1年生存率10%と比較すると非常に大きな進歩である(Shepherd 1999)。
【0008】
これまで、後に再発する再発患者のための療法の選択肢は、最良の対処療法又は寛解に限定されていた。ドセタキセル(タキソテール)と、最良の対処療法を比較した最近の試験では、NSCLCに罹患する患者は、シスプラチンベースの一次治療計画失敗後、二次化学療法から利益を受けられることが示された。ECOGパフォーマンスステータスが0、1、又は2である全年齢の患者は、ドセタキセルによる生存率の向上が実証され、プラチナベースの以前の治療が無効であった者でも同様であった。療法から利益が得られなかった患者には、10%の体重減少、高レベルの乳酸脱水素酵素、多臓器併発、又は肝臓併発を示す者がいた。さらに、ドセタキセルの単剤療法の利益は、二次以上の設定には及ばなかった。ドセタキセルを三次又はそれ以上の療法で受ける患者は、生存の延長を示さなかった。単剤ドセタキセルは、NSCLCのための標準的な二次療法となった。最近、NSCLCの二次療法における別の無作為第III相試験で、ペメトレキセド(アリムタ(Alimta(登録商標)))をドセタキセルと比較した。ペメトレキセドでの治療の結果は、臨床的に同等の有効性であったが、ドセタキセルと比較して副作用が有意に少なかった。
【0009】
個別の癌治療法の開発の必要性が長年認識されている。標的とする癌治療の開発に関して、腫瘍標的の分子プロファイルを提供できる方法論(即ち、臨床的利益に対する予測となるようなもの)が特に注目されている。癌における遺伝子発現プロファイリング原理の論証は、現在の形態学的及び免疫組織化学的試験に基づくと不明な腫瘍タイプの分子分類において、既に確立されている。2つの別個の疾患は、遺伝子発現プロファイリングを用いる広範性巨大B細胞リンパ腫の現在唯一の分類とは異なる予後診断によって区別される。
【発明の概要】
【0010】
従って、癌患者におけるEGFR阻害因子の臨床的利益を予測する発現バイオマーカーを提供することが、本発明の目的である。
【0011】
第一の目的において本発明は、EGFR阻害因子での治療に対する応答において、癌患者の臨床的利益を予測するインビトロ方法を提供する。当該方法は、患者の腫瘍サンプルにおける表3から選択される少なくとも1つの遺伝子の発現レベルを決定するステップ、及び前記少なくとも1つの遺伝子の発現レベルを、治療から臨床的利益を受けない患者群の腫瘍における当該少なくとも1つの遺伝子の発現レベルの代表値と比較するステップ、を含んでなり、ここで当該患者の腫瘍サンプルにおける当該少なくとも1つの遺伝子の発現差異レベルは、当該治療から臨床的利益を受けることになる患者のための指標となる。
【図面の簡単な説明】
【0012】
【図1】図1は、試験計画を示す。
【図2】図2は、サンプルプロセスのスキームを示す。
【発明を実施するための形態】
【0013】
「治療から臨床的利益を受けない患者群の腫瘍における少なくとも1つの遺伝子の発現レベルの代表値」なる用語は、当該治療から臨床的利益を受けない患者群の腫瘍におけるマーカー遺伝子の、平均発現レベルの推定値のことを言う。臨床的利益は、客観的応答があること、又は≧12週の疾患安定であることとして定義された。
【0014】
さらに好ましい実施態様によれば、少なくとも2つの遺伝子の発現レベルを決定する。
別の好ましい実施態様によれば、少なくとも3つの遺伝子の発現レベルを決定する。
【0015】
さらに好ましい実施態様によれば、遺伝子は、ATP6V0E1、MAPRE1、PSMA5、ACSL3、RAP1A、SLC2A3、CHMP2B、RFK、CTGF、HSPA8、AKAP12、LOX、SLMO2、NOMO3、APOOからなる群から選択され、且つ当該遺伝子が患者の腫瘍サンプルにおいて、EGFR阻害因子治療から臨床的利益を受けない患者群の腫瘍における少なくとも1つの遺伝子の発現レベルの代表値と比較して、より低い発現レベルを示す。
【0016】
さらに好ましい実施態様によれば、遺伝子は、SDC1、CEBPA、ST6GALNAC2、PLA2G6、PMS2L11、C19orf7、DDX17、SFPQ、PMS2L3、SLC35E2、PMSL2、URG4、PPP1R13B、NRCAM、FLJ10916、FLJ13197、GPR172B、ZNF506、ARHGAP8、CELSR1、LYK5からなる群から選択され、且つ当該遺伝子が患者の腫瘍サンプルにおいて、EGFR阻害因子治療から臨床的利益を受けない患者群の腫瘍における少なくとも1つの遺伝子の発現レベルの代表値と比較して、より高い発現レベルを示す。
【0017】
好ましい実施態様によれば、少なくとも1つの遺伝子の発現レベルは、マイクロアレイ技術により決定される。遺伝子チップの構成及び使用は、当業界で周知であり、米国特許第5,202,231号、第5,445,934号、第5,525,464号、第5,695,940号、第5,744,305号、第5,795, 716号及び第1 5,800,992号を参照されたい。また、Johnston, M. Curr. Biol. 8:R171-174 (1998); Iyer VR et al., Science 283:83-87 (1999)も参照されたい。当然、この遺伝子発現レベルは、例えば、ノーザンブロット、RT−PCR、リアルタイム定量PCR、プライマー伸長、RNase保護、RNA発現プロファイリング等の当業界で既知のその他の方法により決定することができる。
【0018】
本発明の遺伝子は、バイオマーカーセットと組み合わせることができる。バイオマーカーセットは、表3に列挙されるバイオマーカーの任意の組み合わせから構築でき、癌患者におけるEGFR阻害因子の有効性についての予測が可能となる。本明細書に記載の様々なバイオマーカー及びバイオマーカーセットは、例えば癌に罹患する患者が、EGFR阻害因子による治療介入に対してどのような応答をするかを予測するために使用できる。
【0019】
本明細書で使用される「遺伝子」なる用語は、その遺伝子の変異体を含んでなる。「変異体」なる用語は、GenBank受託番号を与えられる核酸配列と実質的に相同な核酸配列に関する。「実質的に相同な」なる用語は当業者に十分理解される。特に、遺伝子変異体は、ヒト群における最も一般的な対立遺伝子の核酸配列と比較して、ヌクレオチド交換を示す対立遺伝子であってもよい。好ましくは、かかる実質的に相同な核酸配列は、最も一般的な対立遺伝子と、少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%の配列相同性を有する。
【0020】
EGFR阻害因子は、ゲフィチニブ、エルロチニブ、PKI−166、EKB−569、GW2016、CI−1033及び抗−erbB抗体、例えばトラスツズマブ及びセツキシマブ等からなる群から選択できる。
【0021】
別の実施態様によれば、EGFR阻害因子はエルロチニブである。
【0022】
さらに別の実施態様によれば、癌はNSCLCである。
【0023】
本発明により記載される遺伝子の遺伝子発現の検出のための技術には、限定するものではないが、ノーザンブロット、RT−PCR、リアルタイム定量PCR、プライマー伸長、RNase保護、RNA発現プロファイリング及び関連技術がある。当該技術は、当業界で周知であり、例えば、Sambrook J et al., Molecular Cloning: A Laboratory Manual, Third Edition (Cold Spring Harbor Press, Cold Spring Harbor, 2000)を参照されたい。
【0024】
本発明により記載されるそれぞれの遺伝子のタンパク質発現の検出のための技術には、限定するものではないが、免疫組織化学(IHC)がある。
【0025】
本発明によれば、患者の組織サンプル、例えば腫瘍又は癌の生検由来の細胞を評価し、1又は複数のバイオマーカーの発現パターンを決定することができる。癌治療の成功又は失敗を、1又は複数のバイオマーカーの対照セットの発現パターンと比較で類似するか又は異なるとして、被検組織由来の細胞(被検細胞)、例えば腫瘍又は癌の生検のバイオマーカー発現パターンに基づいて決定できる。本発明では、表3に列挙される遺伝子は、EGFR阻害因子治療から臨床的利益を受けなかった患者と比較して、EGFR阻害因子治療からの利益を受けた患者の腫瘍における発現差異があり、より高い又は低い発現レベルを示すことがわかった。すなわち、この被検細胞が、癌治療に応答した患者のものに相当するバイオマーカー発現プロファイルを示す場合、その個体の癌又は腫瘍は、EGFR阻害因子での治療に順調に応答する可能性が高いか、又はそうであると予測される。反対に、この被検細胞が、癌治療に応答しなかった患者のものに相当するバイオマーカー発現パターンを示す場合、その個体の癌又は腫瘍は、EGFR阻害因子での治療に応答しない可能性が高いか、又はそうであると予測される。
【0026】
本発明のバイオマーカー、すなわち表3に列挙される遺伝子は、癌に罹患する患者、特に難治性NSCLCに罹患する患者に対する個別療法への第一歩である。この個別療法により、治療する医師は、特にNSCLCにおける癌療法のために存在する薬物の中から最も適切な剤を選択することが可能となるであろう。将来の各患者のための個別療法の利益により、利益を受ける患者の応答速度/数が増加し、非有効治療による副作用のリスクを低減するであろう。
【0027】
さらなる目的によれば本発明は、本発明のインビトロ方法により確認される患者を治療する、治療方法を提供する。前記治療方法は、表3に列挙する少なくとも1つの遺伝子の発現パターン予測に基づき治療が選択された患者に、EGFR阻害因子を投与することを含んでなる。好ましいEGFR阻害因子はエルロチニブであり、治療される好ましい癌は、NSCLCである。
【0028】
実験
試験及び試験設計の原理
近年、NSCLC患者のサブセットの腫瘍組織におけるEGFR遺伝子内の変異、及びエルロチニブ及びゲフィチニブに対する感受性と当該変異との関連が報告された(Pao W, et al. 2004; Lynch et al. 2004; Paez et al. 2004)。2つの試験から組み合わせた患者について、変異EGFRは、ゲフィチニブに応答した14人中13人において観察され、応答しなかった11人のゲフィチニブ治療患者では一人も観察されなかった。報告された当該変異の有病率は、非選択NSCLC患者において8%(25人中2人)であった。当該変異は、腺癌(21%)、女性の腫瘍(20%)、及び日本人患者の腫瘍(26%)においてより頻繁に発見された。当該変異は、EGFRのインビトロ活性を増加させ、ゲフィチニブに対する感受性を増加させる。この変異と、安定疾患期間又は生存期間の延長との関連は、予め評価されていなかった。
【0029】
BR.21の研究による診査解析に基づくと、客観的反応を有する患者が解析から除外されても有意な生存利益が維持されるため(社内資料)、観察された生存利益は、EGFR変異のみに起因する可能性は低いようである。当該効果には、その他の分子メカニズムも寄与することになる。
【0030】
タルセバ(商標)治療に対する応答/利益の予測となる遺伝子発現レベルにおいて変化があるという仮定に基づき、これらの変化を検出するためにマイクロアレイ解析を使用した。
【0031】
この目的のために、一次療法の失敗後にタルセバ(商標)単剤療法で治療した、明確に規定される対象母集団が必要であった。BR.21試験の経験に基づき、利益群とは、客観的反応を有するか、≧12週疾患安定であることとして規定した。臨床及びマイクロアレイのデータセットを、既定の統計計画に従って解析した。
【0032】
本技術の応用には、新鮮凍結組織(fresh frozen tissu(FFT))が必要である。従って、必須の生体検査は処置の開始前に行わなければならなかった。回収した物質を、液体窒素(N2)中で凍結させた。
【0033】
第二の腫瘍サンプルは、同時に回収しパラフィンに保存した(ホルマリン固定パラフィン包埋(formalin fixed paraffin embedded、FFPE)。このサンプルを、EGFRシグナル伝達経路における変化について解析した。
【0034】
この試験のためには、気管支鏡検査を用いて腫瘍の生体検査を行うことができなければならい。気管支鏡検査は、肺癌の診断を確認するための標準的方法である。一般的には安全であるが、依然として併発症、即ち出血のリスクがある。
【0035】
この試験は、難治性NSCLCに罹患する患者に対する個別療法の第一歩であった。この個別療法により、治療する医師は、この適応症のために存在する薬物の中から最も適切な剤を選択することが可能となるであろう。
【0036】
個別療法が利用可能となれば、将来の患者各々のための利益は、現在の試験において患者が取らなければならないリスクを上回り、利益を受ける患者の応答速度/数を増加させ、非有効治療による副作用のリスクを低減させるだろう。
【0037】
投薬量選択の原理
タルセバ(商標)は、疾患進行、不耐性毒性、又は死亡まで、150 mgの用量で1日に1回経口で投与した。この用量の選択は、薬物動態的パラメータに基づいているとともに、この用量の安全性及び耐性プロファイルは、事前に重度の処置をされた進行癌に罹患する患者における、第I、II及びIII相治験において観察された。150 mg/日投与される癌患者の血漿中に見られる薬物レベルは、臨床的有効性の目標である平均血漿濃度500 ng/mlを常に超えていた。BR.21はこの用量で生存利益を示した。
【0038】
試験の目的
一次目的は、タルセバ(商標)治療の臨床的利益(CR、PR又はSD≧12週)を予測する、遺伝子の発現差異の確認であった。タルセバ(商標)治療に対して「応答」(CR、PR)を予測する遺伝子の発現差異の確認は、重要なもう一つの目的であった。
二次目的は、治療からの利益に関するEGFRシグナル経路伝達経路における変化を評価することであった。
【0039】
試験計画
試験設計及び用量計画の概説
これは、非盲検、予測マーカー特定の第II相試験であった。試験は、約12カ国のおよそ26箇所で行われた。少なくとも1回の事前の化学療法計画に失敗した後、進行NSCLCに罹患する264人の患者が、12ヶ月間にわたって登録された。タルセバ(商標)の経口連続投与を、150 mg/日の用量で投与した。臨床的及び実験的なパラメータを、疾患制御及び毒性の評価として判断した。疾患の進行、受容不能な毒性又は死亡まで治療を継続した。この試験計画を図1に示す。
【0040】
腫瘍組織及び血液サンプルは、タルセバ(商標)の有効性を評価するため、及び療法から利益を受ける患者のサブグループを特定するための分子解析用として入手した。
【0041】
予測マーカー評価
治療の開始から2週間以内に腫瘍の生検を採取した。2つの異なるサンプルを回収した。
第一のサンプルは、常に液体N2中で速やかに凍結させた。
第二のサンプルは、ホルマリンで固定化し、パラフィンに包埋させた。
本研究においては、急速凍結(snap frozen)組織の優先度が最も高い。
図2には、サンプル処理のスキームを示す。
【0042】
マイクロアレイ解析
急速凍結サンプルを、腫瘍サンプルのレーザー・キャプチャ・マイクロダイゼクション(LCM)のために使用し、腫瘍周辺組織から腫瘍RNAとRNAを抽出した。RNAを、Affymetrixマイクロアレイチップス(HG-U133A)で解析し、患者の腫瘍遺伝子の発現プロファイルを確立した。統計比較に対し十分な品質のサンプルを選択するために、Affymetrixチップスの品質管理を使用した。
【0043】
ホルマリン固定パラフィン包埋組織での単一バイオマーカー解析
第二の腫瘍生検、FFPEサンプルを、以下に記載のDNA変異、IHC及びISH解析を行うために使用した。同様の解析を、第一の診断で回収した組織で行った。
EGFRをコードする遺伝子のDNA変異状態及びEGFRシグナル伝達経路に関与するその他の分子を、DNA配列解析により解析した。EGFR及び関連遺伝子の遺伝子増幅を、FISHにより調べた。
タンパク質発現解析には、EGFR及びEGFRシグナル伝達経路内でのその他のタンパク質の免疫組織化学(IHC)解析がある。
【0044】
応答評価
応答を評価するために、RECIST(単次元の腫瘍測定(Uni-dimensional))基準を使用した。当該基準は、以下のリンク(http://www.eortc.be/recist/)で見ることができる。
CR又はPRの状態にするために、腫瘍における変化の測定は、治療期間中の少なくとも4週間の間隔を置いた任意の時点で評価を繰り返すことにより確認すべきである。
SDについては、最低6週間の間隔で試験開始後少なくとも1回、追跡測定をSD基準に適合させるべきである。
維持SDについては、少なくとも12週の維持期間中、試験開始後少なくとも1回、追跡測定をSD基準に適合させるべきである。
【0045】
生存評価
患者の来院又は電話により、3ヶ月ごとに通常状態の確認を行った。死亡は全例記録した。試験の最後に、生存の最終的な確認を患者に要請した。
【0046】
方法
RNAサンプル調製及びRNAサンプルの品質管理
全ての生検サンプル処理は、病理参照研究所で処理された。新鮮凍結組織サンプルは、調査部門からRoche Baselにおける臨床サンプル操作設備(Clinical Sample Operations facility)に輸送され、さらなる処理のためにそこから病理研究室に輸送された。周囲の組織から腫瘍細胞を選択するために、レーザー・キャプチャ・マイクロディセクションを使用した。
【0047】
LCM後に、RNAを富化腫瘍物質から精製した。その後、病理研究室では、RNAの濃度及び品質の推定値を作成するための多数の工程を行った。
RNaseは、RNA分解酵素であり、あらゆる場所に存在するため、RNAを使用する場合は、RNA分解を最小限にするよう厳密に制御されるべきである。多くのmRNA種それ自身の半減期はかなり短いため、非常に不安定であると考えられている。従って、任意のアッセイの前に、RNA完全性チェックと定量を行うことは重要である。
【0048】
RNA濃度及び品質プロファイルは、Agilent(Agilent Technologies, Inc., Palo Alto, CA)製の2100 Bioanalyzer(登録商標)と呼ばれる装置を用いて評価することができる。この装置ソフトウェアは、RNA完全数(RIN)、定量推定値(Schroeder, A., et al., The RIN: an RNA integrity number for assigning integrity values to RNA measurements. BMC Mol Biol, 2006. 7: p. 3)を出し、総RNAサンプルのリボソーム比率を計算する。RNAサンプルの全ての電気泳動バンドからRINを決定するが、ここには分解産物の存在物又は非存在物が含まれる。
【0049】
RNA品質は、2100 Bioanalyzer(登録商標)により解析した。添加したpoly−Iノイズと十分なRNAを超える少なくとも1つのrRNAピークを有するサンプルだけを、Affymetrix プラットフォームでのさらなる解析のために選択した。精製RNAは、マイクロアレイによる解析のため、Roche Centre for Medical Genomics (RCMG; Basel, Switzerland)に送られた。この病理研究室から受け取った122個のRNAサンプルをさらに処理した。
【0050】
組織RNAサンプルの標的標識
Affymetrix (Affymetrix, Santa Clara, California)製の2サイクル標的標識増幅プロトコル(Two-Cycle Target Labeling Amplification Protocol)を用い、製品の指示書に従い標的標識を行った。
方法は、標準Eberwine線形増幅方法に基づくが、マイクロアレイに十分なハイブリダイゼーション用の標識cRNAを作製するため、この方法のうち2つのサイクルを用いる。
標識反応で使用される総RNA投入量は、10 ng以上のRNAが利用できるようなサンプルでは10 ngであり、利用できる量がこの量より少ないか、あるいは(RNA濃度が非常に低いことにより)利用できる定量データがない場合、総サンプルの半分を当該反応に使用した。標識反応から得られる産物は、cRNAが20〜180μgの範囲であった。全サンプルについて、cRNAを15μg使用した場合のハイブリダイゼーションレベルで、工程の標準化を行った。
【0051】
ヒト参照RNA(Human Reference RNA)(Stratagene, Carlsbad, CA, USA)を、各サンプルバッチのワークフローにおいて、対照サンプルとして使用した。標識及びハイブリダイゼーション試薬が期待通りに機能しているかを確認するため、試験サンプルと同時に、この10 ngのRNAを投入物として使用した。
【0052】
マイクロアレイハイブリダイゼーション
Affymetrix HG-U133Aマイクロアレイには、およそ18,400個の転写物、及び約14,500個の十分に特徴付けられた遺伝子を表す変種を標的とする、22,000個以上のプローブセットが含まれる。
全サンプルのハイブリダイゼーションは、Affymetrix指示書(Affymetrix Inc., Expression Analysis Technical Manual, 2004)に従って行った。簡潔に述べると、各サンプルに、15μgのビオチン標識cRNAを、二価カチオンの存在下断片化し、加熱し、Affymetrix HG-U133A全長ゲノムオリゴヌクレオチドアレイとハイブリダイズさせた。後日、アレイをストレプトアビジン−フィコエリトリン(Molecular Probes; Eugene, OR)を用い、製品の指示書に従って染色した。その後、GeneChipスキャナー3000(Affymetrix)を用いてアレイをスキャンし、GeneChipオペレーションソフトウェア(GCOS)バージョン1.4(Affymetrix)を用いて、シグナル強度を自動的に計算した。
【0053】
統計解析
Affymetrix(商標)データの解析は、5つの主要なステップから構成された。
ステップ1は、品質管理であった。目的は、標準以下品質のプロファイルのアレイデータ解析を特定し、排除することであった。
ステップ2は、前処理及び標準化であった。目的は、チップ間の比較に適する、標準化及びスケール化(scaled)した「解析データセット」を作製することであった。これには、背景ノイズの推定と除去、プローブの要約及びスケーリング(scaling)が含まれる。
ステップ3は、調査及び記述であった。目的は、変動性の潜在的な偏り及び原因を特定することであった。これは、多変量及び一変量の記述解析技術を、影響共変量を特定するために適用することから成った。
ステップ4は、モデリング及び検査であった。目的は、「臨床的利益のある」患者と「臨床的利益のない」患者との間の平均発現レベルにおける差異の、統計的評価に基づく、候補マーカーのリストを特定することであった。これは、統計的に十分なモデルを各プローブセットに適合させること、及び統計的有意性の測定値を導出することから成った。
ステップ5は、ロバスト性解析であった。目的は、前処理方法及び統計的仮定に多く依存しない、候補マーカーの定量化リストを作成することであった。これは、異なる方法論的アプローチを有する解析を反復し、その候補リストを交差させることであった。
全ての解析は、Rソフトウェアパッケージを用いて行われた。
【0054】
ステップ1:品質管理
データ品質の評価は、複数のパラメータのチェックを基にした。当該パラメータには、標準Affymetrix GeneChip(商標)品質パラメータ、特に、倍率(Scaling Factor)、存在コールと平均背景の割合(Percentage of Present Call and Average Background)が含まれた。本ステップには、局在化ハイブリダイゼーション問題を検出するための、バーチャルチップ画像の視覚的調査、及び平均的挙動からの任意の異常な解離を検出するための、平均的バーチャルチップと各チップとの比較も含まれた。チップ間の相関分析は、異常値サンプルを検出するためにも行われた。さらに、Agilent Bioanalyzer(商標)2100による、RNAサンプルの解析から得られたRNA品質の補助的な測定値を考慮に入れた。
これらのパラメータに基づき、20アレイから得られたデータを解析から除外した。すなわち、102人の患者に相当する計102アレイから得られたデータを解析した。当該102個のサンプルセットの臨床記述を表1で報告する。
【0055】
表1:解析に含まれる患者の臨床的特徴の記述
【0056】
【表1】

【0057】
ステップ2:データの前処理及び標準化
前処理及び標準化のために、rmaアルゴリズム(Irizarry, R.A., et al., Summaries of Affymetrix GeneChip probe level data. Nucl. Acids Res., 2003. 31(4): p. e15)を使用した。この個々のプローブセットのための検出コールを作成するために、mas5アルゴリズム(AFFYMETRIX, GeneChip(登録商標) Expression: Data Analysis Fundamentals. 2004, AFFYMETRIX)を使用した。全サンプル中、「absent」又は「marginal」とコールされたプローブセットをさらなる解析から除外したため、この基準により5930個のプローブセットが除外された。従って、解析データセットは、102人の患者において、16353個(22283個中)を有するマトリクスから構成された。
【0058】
ステップ3:データの記述及び調査
変動性の潜在的な偏りと主要な原因を特定するために、記述的調査解析を行った。遺伝子発現プロファイルに与える潜在的影響を有する共変量のセットをスクリーニングした。ここには、技術的及び臨床的変動性の双方が含まれていた。技術的共変量には、RNA処理(バッチとして後述する)、RIN(Schroeder, A., et al., The RIN: an RNA integrity number for assigning integrity values to RNA measurements. BMC Mol Biol, 2006. 7: p. 3)(RNA品質/完全性の測定値として)、サンプル回収の操作者及びセンターがあった。臨床的共変量には、組織構造型、喫煙状況、腫瘍悪性度、行動スコア(Oken, M.M., et al., Toxicity and response criteria of the Eastern Cooperative Oncology Group. Am J Clin Oncol, 1982. 5(6): p. 649-55)、人口データ、応答状況及び臨床的利益状況があった。
この解析ツールには、単変量ANOVA及び主成分分析がある。前記の共変量の各々については、各プローブセットに対し、独立に単変量ANOVAを適用した。
【0059】
バッチ変数の有意な効果を特定した。実際には、バッチ変数は、サンプル処理のデータとAffymetrixチップのロットとの間の差異をとらえた。バッチ変数が注目の変数からほぼ独立していることを確認後、Johnson, W.E., C. Li, and A. Rabinovic, Adjusting batch effects in microarray expression data using empirical Bayes methods. Biostat, 2007. 8(1): p. 118-127に記載の方法を用いて、バッチ効果を補正した。
【0060】
バッチ効果補正後の標準化データセットは、その後の解析における解析データセットとして用いた。
組織構造及びRINは、記述解析により強調される、追加的な2つの重要変数であった。
【0061】
ステップ4:データのモデリング及び検査
各プローブセットに対し、線形モデルを個別に適合させた。モデルに含まれる変数を表2で報告する。モデルパラメータを、最大尤度技術により推定した。「臨床的利益」変数(X1)に相当するパラメータを、臨床的利益のある患者群と、臨床的利益のない患者群との間の発現レベルにおける差異を調べるために用いた。
【0062】
表2:線形モデルに含まれる変数の記述
【0063】
【表2】

【0064】
各プローブセットiについて、統計的検定の目的は、表2に列挙されるその他の調整共変量を考慮すると、臨床的利益のある患者と、臨床的利益のない患者における平均発現レベルが等しいという仮定を否定することであった。形式に則り、両側検定で行う対立仮説(alternative)について、等しさの帰無仮説を検定した。対応するp値を表3で報告する。
線形モデルの選択の理由は、以下の2つにより動機付けされた。第一に、線形モデリングは、汎用的で、十分に特徴付けられ、且つ堅実なアプローチであり、注目の変数の影響を推定する場合、交絡変数の調整を可能とする。第二に、102個というサンプルサイズ、及びデータセットの標準化とスケーリングの場合、正規分布の仮定は、合理的且つ正当である。各プローブセットについて、残差モデルに基づくFligner Killeen検定を用いて等分散性の仮説を評価した。この解析は3つのステップから構成された。
1.残差変数の等分散性に対して、各々のカテゴリカル変数を検定する。
2.最小のp値を有する変数Vに留意する。
3.この最小のp値が0.001未満の場合、当該モデルへの再適合により、異なるレベルの変数Vに異なる分散を持たせる。
【0065】
ステップ5:ロバスト性
ロバスト性解析の目的は、解析の結果が人為的になる危険性、及び前処理ステップ又は仮説が統計解析の基礎となるという結果を低減させることであった。以下の3つの態様が考慮された。a)品質管理ステップでの少数の追加チップの包含と排除、b)前処理及び標準化アルゴリズム、c)統計的仮説及び検査アプローチ。
【0066】
候補マーカーのリストは、異なる解析設定での有意性として、一貫して認定される遺伝子のサブセットとして規定された。異なる応用解析の選択肢は以下の通りである。
a)8つのチップの追加サブセットは、より厳格な品質管理基準に基づいて特定された。「縮小(reduced)データセット」は、当該8つのチップを排除して規定した。
b)MAS5は、前処理及び標準化のためのrmaに対する代替として特定された。MAS5は、背景推定、プローブ要約及び標準化のために異なる方法を用いる。
c)2つの追加の統計的検定を用いた。当該2つの追加の検定は、統計的仮定の基礎となる異なるセットに依存する。
a.臨床的利益と非臨床的利益との間の差異についてのウィルコクスン検定、及び
b.臨床的利益が、応答変数及び共変量としての遺伝子発現とされる場合のロジスティック回帰モデルを検定する、尤度比検定(LRT)。各プローブセットについて、LRTは、以下の自由度1でのカイ二乗であった。
【0067】
要約すると、2つのサンプルセット(「完全な」データセットと、「縮小」データセット)、及び2つの前処理アルゴリズム(mas5及びrma)を考慮し、この結果、4つの異なる解析データセットが得られた。当該4つのデータセットの各々について、3つの異なる統計的検定を適用した。従って、各プローブセットに対し、3つのp値が算出された。各解析データセットにおいて、別々に制御された遺伝子のリストを特定するため、複合基準を適用した。この基準は、最大p値が0.05未満であり、p値の幾何平均が0.01未満であると規定した。
マーカー特定のために基準2を用いるロバスト性解析の結果、36個の異なる遺伝子に対応する、36個のプローブセットのリストが得られた。これらのマーカーを表3で報告する。
【0068】
表3:複合基準適用後のロバスト性解析に基づく臨床的利益の遺伝子マーカー。
第一カラムは、プローブセットのAffymetrix識別子である。第二カラムは、対応する遺伝子配列のGenBank受託番号である。第三カラムは、対応する公式な遺伝子名である。第四カラムは、線形モデルで推定した、臨床利益のある患者と臨床利益のない患者との間の発現レベルにおける、対応する調整平均倍率変化(fold change)である。第五カラムは、線形モデルから誘導された、臨床利益のある患者と臨床利益のない患者との間の発現レベルにおける差異についての検定のp値である。
【0069】
【表3】

【0070】
【表4】

【0071】
【表5】

【0072】
考察
高密度オリゴヌクレオチドマイクロアレイ技術で組織サンプルを解析し、データに統計的モデリングを適用することにより、発現レベルが、エルロチニブでの処理から臨床的利益を受ける患者を予測できる遺伝子を特定することができた。
有意性複合基準(上で規定)を適用し、35個の既知の遺伝子を表す36個のプローブセットのリスト(表3を参照)が得られた。これらの遺伝子の機能は複雑であり、必ずしも十分に特徴付けられ、あるいは十分に理解されているわけではない。
表3における遺伝子の機能アノテーションは、Ingenuityソフトウェア(Ingenuity(登録商標) Systems, www.ingenuity.com)を用いて解析した。このソフトウェアは、科学的文献に基づき収集及び定期的にアップデートされる遺伝子アノテーションの専有知識基盤にインターフェースを提供する。
この広範囲な解析により、特にEGFR阻害因子エルロチニブへの応答に関して、表3が異なる腫瘍分類を識別するために有用な遺伝子を含むことが示される。
【0073】
表4:本発明のマーカー遺伝子のリスト
第一カラムは、ヒト遺伝子配列のGenBank受託番号であり、第二カラムは、対応する公式な遺伝子名であり、第三カラムは本出願において使用されるヒトヌクレオチド配列の配列番号である。特定の遺伝子について、複数の遺伝子へ変異体がGenBankに登録されるため、表4は1以上の配列番号を含む。
【0074】
【表6】

【0075】
【表7】

【0076】
【表8】


【特許請求の範囲】
【請求項1】
EGFR阻害因子での治療に対する癌患者の応答をインビトロ(in vitro)で予測する方法であって;
患者の腫瘍サンプルにおける表3から選択される少なくとも1つの遺伝子の発現レベルを決定するステップ、及び前記少なくとも1つの遺伝子の発現レベルを、EGFR阻害因子治療から臨床的利益を受けない患者群の腫瘍における当該少なくとも1つの遺伝子の発現レベルの代表値と比較するステップ、を含んでなり、ここで当該患者の腫瘍サンプルにおける当該少なくとも1つの遺伝子の発現差異レベルは、当該治療から臨床的利益を受けることになる患者のための指標となる、方法。
【請求項2】
前記発現レベルがマイクロアレイ技術により決定される、請求項1に記載の方法。
【請求項3】
2つの遺伝子の発現レベルが決定される、請求項1又は2に記載の方法。
【請求項4】
3つの遺伝子の発現レベルが決定される、請求項1〜3のいずれか1項に記載の方法。
【請求項5】
前記遺伝子が、ATP6V0E1、MAPRE1、PSMA5、ACSL3、RAP1A、SLC2A3、CHMP2B、RFK、CTGF、HSPA8、AKAP12、LOX、SLMO2、NOMO3、及びAPOOからなる群から選択され、且つ当該遺伝子が患者の腫瘍サンプルにおいて、EGFR阻害因子治療から臨床的利益を受けない患者群の腫瘍における少なくとも1つの遺伝子の発現レベルの代表値と比較して、より低い発現レベルを示す、請求項1〜4のいずれか1項に記載の方法。
【請求項6】
前記遺伝子が、SDC1、CEBPA、ST6GALNAC2、PLA2G6、PMS2L11、C19orf7、DDX17、SFPQ、PMS2L3、SLC35E2、PMSL2、URG4、PPP1R13B、NRCAM、FLJ10916、FLJ13197、GPR172B、ZNF506、ARHGAP8、CELSR1、及びLYK5からなる群から選択され、且つ当該遺伝子が患者の腫瘍サンプルにおいて、EGFR阻害因子治療から臨床的利益を受けない患者群の腫瘍における少なくとも1つの遺伝子の発現レベルの代表値と比較して、より高い発現レベルを示す、請求項1〜4のいずれか1項に記載の方法。
【請求項7】
前記EGFR阻害因子がエルロチニブである、請求項1〜6のいずれか1項に記載の方法。
【請求項8】
前記癌がNSCLCである、請求項1〜7のいずれか1項に記載の方法。
【請求項9】
EGFR阻害因子治療に対する癌患者の応答を予測するための、表3に列挙される遺伝子の使用。
【請求項10】
前記癌がNSCLCである、請求項9に記載の使用。
【請求項11】
前記EGFR阻害因子がエルロチニブである、請求項9又は10に記載の使用。
【請求項12】
EGFR阻害因子を患者に投与することを含んでなる、請求項1〜8のいずれか1項に記載の方法により特定される癌患者を治療する方法。
【請求項13】
前記EGFR阻害因子がエルロチニブである、請求項12に記載の方法。
【請求項14】
前記癌がNSCLCである、請求項12又は13に記載の方法。

【図1】
image rotate

【図2】
image rotate


【公表番号】特表2010−535517(P2010−535517A)
【公表日】平成22年11月25日(2010.11.25)
【国際特許分類】
【出願番号】特願2010−520464(P2010−520464)
【出願日】平成20年8月7日(2008.8.7)
【国際出願番号】PCT/EP2008/006513
【国際公開番号】WO2009/021674
【国際公開日】平成21年2月19日(2009.2.19)
【出願人】(591003013)エフ.ホフマン−ラ ロシュ アーゲー (1,754)
【氏名又は名称原語表記】F. HOFFMANN−LA ROCHE AKTIENGESELLSCHAFT
【Fターム(参考)】