説明

乳癌疾患の解析方法

乳癌疾患の解析方法であって、配列番号1ないし10および/または配列番号50ないし60に従う配列の群から選択される配列における一つまたは複数のCpGジヌクレオチドのゲノム・メチル化状態を判別することを含む、方法。任意的にさらに、以下のステップ、すなわち、前記メチル化状態試験からの一つまたは複数の結果が、診断多変量モデルから得られる分類器に入力され、試料が正常組織からのものか乳癌組織からのものかについて確からしさを計算し、予測の信頼性についての関連するp値を計算するステップとが実行される。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は生物学および化学の分野であり、より詳細には分子生物学およびヒト遺伝学の分野である。本発明は、ヒトDNAにおけるメチル化部位、特にメチル化されたときに乳癌を示すある種の定義された配列におけるメチル化された部位を識別する分野に関する。
【背景技術】
【0002】
世界中で、乳癌は癌による死の5番目に一般的な原因である(1位から4位は肺癌、胃癌、肝臓癌および結腸癌)。2005年における乳癌による死亡は世界中で502,000件に上る(癌による死亡の7%;あらゆる死因のうちほぼ1%)。世界中の女性の間で、乳癌は最も一般的な癌であり、最も一般的な癌による死因である。
【0003】
米国では、乳癌は癌による死亡の3番目に最も一般的な原因である(1位と2位は肺癌および結腸癌)。2007年には、米国で、乳癌は40,910件の死亡を引き起こすと予想されている(癌による死亡の7%;あらゆる死因のうちほぼ2%)。米国の女性の間で、乳癌は最も一般的な癌であり、2番目に最も一般的な癌による死因である(1位は肺癌)。米国の女性は、浸潤性の乳癌を発達させる生涯確率が8分の1であり、乳癌が死因となる確率が33分の1である。
【0004】
乳癌は、外科的に除去された乳房組織の病理学的(顕微鏡的)検査によって診断される。組織学的または細胞学的検査のための最終的な処置に先立っていくつかの手順が組織または細胞を取得することができる。そのような手順は細針吸引、乳頭吸引液、乳管洗浄、コア針生検および局所的な外科的切除生検を含む。これらの診断ステップは、放射線撮像と組み合わされるとき、通例、胸部病変を癌として診断することにおいて正確である。時折、細針吸引のような手術前の手順は、診断を下すのに十分な組織を与えない、あるいは癌を完全に外すことがありうる。撮像試験が転移を検出するために時々使われ、これは胸部X線、骨スキャン、CT、MRIおよびPETスキャンを含む。撮像研究は、転移性疾患の存在を判別することに有用であるが、それ自身として、またそれ自身で癌を診断するものではない。生検試料の顕微鏡的な評価のみが癌診断を与えることができる。Ca15.3(carbohydrate antigen 15.3[糖鎖抗原15.3]、上皮ムチン)は、血中で判別される腫瘍マーカーで、最終的な治療後に時間を通じた疾病活動を追うために使うことができる。血液腫瘍マーカー試験は、乳癌検診のために日常的に実施されるのではなく、この目的のためには性能特性が貧弱である。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】米国特許出願公開US2006/0292564A1
【特許文献2】米国特許第5,744,305号
【特許文献3】米国特許第5,837,832号
【特許文献4】米国特許第6,265,171号
【非特許文献】
【0006】
【非特許文献1】Rein,T.、DePamphilis,M.L.、Zorbas,H.、「Nucleic Acids Res.」、1998年、26巻、2255
【非特許文献2】Mei R et al.、「Proc. Natl. Acad. Sci.」、米国、2003年9月30日、100(20)、11237-42
【非特許文献3】Grdiner-Garden,M. and M.Frommer、「CpG islands in vertebrate genomes」、J Mol Biol、196(2):261-82、1987年
【非特許文献4】Lucito,R.、J.Healy, et al.、「Representational oligonucleotide microarray analysis: a high-resolution method to detect genome copy number variation」、Genome Res、13(10):2291-305、2003年
【非特許文献5】Bolstad,B.M.、R.A.Irizarry, et al.、「A comparison of normalization methods for high density oligonucleotide array data based on variance and bias」、Bioinformatics、19(2):185-93、2003年
【非特許文献6】Benjamini and Hotchberg、「False Discovery Rate」、1995年
【非特許文献7】Lin,C.-C.C.a.C.-J.,「LIBSVM: a library for support vector machines」、2001年
【発明の概要】
【発明が解決しようとする課題】
【0007】
したがって、乳癌疾患(breast cancer disorders)の解析方法であって、迅速で、信頼でき、理想的には訓練されていない人員によって実行できるものを有することが有利であろう。そのような方法は理想的には訓練された医師による解析を必要としないであろう。
【課題を解決するための手段】
【0008】
本発明は、乳癌疾患の解析方法であって、配列番号1ないし100の群から選択される配列中の一つまたは複数のCpGジヌクレオチドのゲノム・メチル化(genomic methylation)状態を判別するおよび/または、特に、配列番号1ないし10および/または配列番号50ないし配列番号60に従う配列の一つまたは複数のCpGジヌクレオチドのゲノム・メチル化状態を判別することを含む方法を教示する。
【0009】
関心のある領域は、表1Aおよび表B(「開始」および「終了」)において指定されている。
【0010】
CpG島は、DNAのバックボーンにおいて互いに隣接する(すなわちリン酸ジエステル結合によって結合されている)多数のシトシンおよびグアニンがある領域である。CpG島は哺乳類の遺伝子のプロモーターの約40%近くにある(ヒトのプロモーターでは約70%)。CpGという記法の「p」はシトシンとグアニンの間のリン酸ジエステル結合を表している。
【0011】
CpG島の長さは典型的には300〜3000塩基対である。これらの領域は、統計的に期待される割合(〜6%)に等しいまたはそれ以上のCpGジヌクレオチド含有量によって特徴付けられ、一方、ゲノムの残りの部分はずっと低いCpG頻度をもつ。これはCG抑制と呼ばれる現象である。遺伝子のコード領域におけるCpG部位と違って、たいていの場合、プロモーターのCpG島におけるCpG部位は、遺伝子が発現されるならばメチル化されていない。この観察は、遺伝子のプロモーター中のCpG部位のメチル化が遺伝子の発現を禁止することがありうるという予測につながった。メチル化は、ヒストン修飾と並んでインプリンティング(imprinting)にとって中心的である。CpG島の通常の形式的定義は、少なくとも200bpをもち、50%より高いGC割合(percentage)をもち、0.6より高い観察/期待されるCpG比(ratio)をもつ領域である。
【0012】
本稿では、CpGジヌクレオチドは、特にヒトにおいて、生体環境中で(in vivo)メチル化されたおよびメチル化されていない状態で見出されうるCpGジヌクレオチドである。
【0013】
本発明は、本願において開示される一つまたは複数の配列のメチル化パターンを使って原発性癌が検出され、また得られたメチル化パターンが乳癌の治療に対する治療応答を予測するために使われる方法に関する。
【0014】
本稿では、被験体は、病理的な変化を示しているか否かに関わりなく、あらゆる人、患者、動物であると理解される。本発明の意味では、細胞、組織、器官、生物体などから収集された任意の試料が診断されるべき患者の試料でありうる。ある好ましい実施形態では、本発明に基づく患者はヒトである。本発明のあるさらなる実施形態では、患者は、原発性乳癌、二次性乳癌、表面上皮間質腫瘍、性索間質腫瘍、生殖細胞腫瘍の群から選択される疾患をもつと疑われるヒトである。
【0015】
本発明は、たとえば乳房細胞増殖性疾患の諸サブクラスの識別およびそれらの間の区別の改善ならびに前記疾患に対する遺伝的素質を可能にすることによる、乳房細胞増殖性疾患の改善された診断、治療およびモニタリングにおける使用のためである。本発明は、乳房細胞増殖性疾患の高度に特異的な分類を可能にし、それにより患者の改善されたかつ情報に基づく治療を許容するという意味で現状技術に対する改善を提示する。
【0016】
本稿では、特許請求される配列は、指定されている配列に対する逆の相補配列である(are reverse complement)配列をも包含する。
【図面の簡単な説明】
【0017】
【図1】ゲノムの、異なる仕方でメチル化された領域の判別のための方法を示す図である。これは〈例〉においてより詳細に述べる。
【図2】メチル化位置(横列)に対してクラスターされた試料(縦列)を示す図である。メチル化のシグネチャが腫瘍(上部のバーの左の部分)と正常組織(上部のバーの右の部分)との間の区別をすることができる。
【図3】本発明を構築するためのクラスタリング方法およびその顕著な特徴を示す図である。患者からの試料が収集され、特定の諸配列のそのメチル化が、好ましい実施形態のいずれかによって判別される。次いで、その結果がサポート・ベクトル・マシンのような分類器に入力される。分類器が腫瘍試料または正常な試料としての分類およびp値を与える。
【発明を実施するための形態】
【0018】
本発明者らは、驚くべきことに、DNA配列の小さな選択部が乳癌疾患を解析するために使用されうることを見出した。これは、本願で開示される塩基配列のいずれかまたはその逆の相補配列における一つまたは複数のCpGジヌクレオチドのゲノム・メチル化状態を判別することによってなされる。そのような解析に適した約900の配列が同定された。100の配列が特に好適であることが判明した。
【0019】
表1Aまたは表1Bからの上位10個の特徴(features)のようなほんの10個の配列に基づいて(p値0.000.1)、94%の分類精度に到達することが可能である(実施された全予測に対する、所与の試料が乳房腫瘍からのものであるか否かの問題に関する正しい全予測は49/52)。腫瘍検出に対する感度は92.5%(37/40)であった。腫瘍検出に対する特異性=100%。特徴物サイズを50個に増すと、分類率(classification rate)は96%(50/52が正しく分類)となる。
【0020】
遺伝子内では、配列は下記の表1Aに見られるように見出されうる。
【0021】
【表1A】



遺伝子間領域では、配列は下記の表1Bに見られるように見出されうる。
【0022】
【表1B】



本発明の基礎をなす遺伝子は好ましくは「遺伝子パネル(gene panel)」、すなわち本発明の特定の遺伝配列および/またはそれぞれの情報を与えるメチル化部位を有する集合(collection)を形成するために使われる。遺伝子パネルの形成は、乳癌の特定の諸側面の迅速かつ特異的な解析を許容する。本発明において記載され用いられる遺伝子パネル(単数または複数)は、乳房細胞増殖性疾患の診断、治療およびモニタリングおよび前記疾患に対する素質の解析のために、だが特に乳房腫瘍の検出のために、驚くほど高い効率をもって使用できる。
【0023】
加えて、遺伝子の多様なアレイからの複数のCpG部位の使用は、単一遺伝子の診断および検出ツールに比べて、比較的高い感度および特異性を許容する。
【0024】
本発明は、乳癌疾患の解析のための方法であって、配列番号1ないし10および/または配列番号50ないし60に従う配列の群から選択される配列における一つまたは複数のCpGジヌクレオチドのゲノム・メチル化状態を判別することを含む方法に関する。
【0025】
ある実施形態では、配列番号1ないし100に従う配列の一つまたは複数のメチル化状態が判別されることが好ましい。ここで、前記配列は、表1Aまたは表1Bにおいて指定されるように、ここで決定されるところの、1E-4(0.0001)より小さいp値を有する。
【0026】
本発明に基づく方法のある実施形態では、解析は被験体における乳癌の検出であり、以下のステップが実行される。(a)解析されるべき被験体からの試料を提供する、(b)配列番号1ないし配列番号10および/または配列番号50ないし配列番号60に従う配列の群から選択される配列における一つまたは複数のCpGジヌクレオチドのメチル化状態を判別する。
【0027】
CpG島のメチル化状態は乳癌の指標となる。しかしながら、好ましくは、メチル化状態は各CpGについて決定され、差別的なメチル化パターンが決定される。というのも、すべてのCpG島が必ずしもメチル化される必要はないからである。
【0028】
任意的に、追加的に以下のステップが実行される。(a)前記メチル化状態試験からの一つまたは複数の結果が、診断多変量モデル(Diagnostic Multi Variate Model)から得られる分類器に入力される、(b)試料が正常組織からのものか乳癌組織からのものかについて可能性が計算される、および/または(c)予測(prediction)の信頼性についての関連するp値が計算される。
【0029】
たとえば、患者からのあらかじめ定義された組織のセットに基づいて腫瘍または正常試料の重要な特徴を「学習する」ために、サポート・ベクトル・マシン分類器を使う。アルゴリズムは今や分類器(使用される特徴のセットからのメチル化比を変数とする式)を出力する。新しい患者試料からのメチル化比が次いでこの分類器に入れられる。結果は1または0であることができる。境界平面(marginal plane)からの距離がp値を与えるために使用される。
【0030】
メチル化状態は、配列番号1ないし10および/または配列番号50ないし60に従う配列のうち少なくとも4つについて判別されることが好ましい。さらに、追加的に、メチル化状態が配列番号11ないし49および/または配列番号61ないし100に従う配列のうちからの一つまたは複数について判別されることが好ましい。
【0031】
ある実施形態では、メチル化状態は、配列番号1ないし100に従う配列のうちからの少なくとも10個の配列、20個の配列、30個の配列、40個の配列または40より多い配列について判別される。配列番号1ないし配列番号100に従う配列の全部についてメチル化状態が判別されることが特に好ましい。
【0032】
ある実施形態では、メチル化状態は、配列番号1ないし配列番号10および配列番号50ないし配列番号60に従う配列について判別される。原理的には、本発明はまた、配列番号1ないし配列番号100に従う配列のうちからのただ一つのメチル化状態を判別することにも関する。
【0033】
DNA分子のメチル化状態を判別するためには数多くの方法がある。メチル化状態の判別は、亜硫酸水素塩配列決定(bisulfite sequencing)、パイロシークエンス(pyrosequencing)、メチル化感受性一本鎖配座解析(MS-SSCA: methylation-sensitive single-strand conformation analysis)、高解像度融解解析(HRM: high resolution melting analysis)、メチル化感受性単一ヌクレオチド・プライマー伸張(MS-SnuPE: methylation-sensitive single nucleotide primer extension)、塩基特異的切断(base-specific cleavage)/MALDI-TOF、メチル化特異的PCR(MSP: methylation-specific PCR)、マイクロアレイに基づく諸方法、mspI切断の群から選択される方法のうちの一つまたは複数によって行われることが好ましい。5−メチルシトシンを検出するさらなる既知の諸方法の概観は、非特許文献1から集められうる。さらなる諸方法は特許文献1に開示されている。
【0034】
ある好ましい実施形態では、メチル化状態はmspI切断、アダプター(adaptors)のライゲーション(ligation)、McrBC消化、PCR増幅、ラベリングおよびその後のハイブリダイゼーションによって判別される。
【0035】
解析すべき試料が、解析すべき組織からの組織生検、膣組織、舌、膵臓、肝臓、脾臓、卵巣、筋肉、関節組織、神経組織、胃腸組織、腫瘍組織、体液、血液、血清、唾液および尿のような組織の群から選択される組織型からであることが好ましい。
【0036】
ある好ましい実施形態では、原発性癌が検出される。
【0037】
本発明に基づく方法のある実施形態では、得られたメチル化パターンが、乳癌の治療に対する治療応答を予測するために使われる。
【0038】
本発明は、上CpG部位(up CpG sites)の領域にあるオリゴヌクレオチドのようなプローブに関する。本発明に基づくオリゴマーは、通常、いわゆる「セット(sets)」において使用される。セットは、配列番号1ないし配列番号100内のCpGジヌクレオチドのそれぞれについて、あるいはそれらの配列のうち少なくとも10個の、好ましくは20個の、より好ましくは30個の、最も好ましくは50個より多いものについて、少なくとも一つのオリゴヌクレオチドを含む。本発明はまた、CpG部位の領域にあるオリゴヌクレオチドの逆の相補配列にも関する。
【0039】
そのような解析のために使用されるべきプローブは、次の基準のうち一つまたは複数に基づいて定義される。(1)プローブ配列が、ヒト・ゲノムにおいて一度だけ現れる;(2)C/Gヌクレオチドのプローブ密度が30%から70%までの間である;(3)ハイブリダイゼーションの融解特性および他の基準は非特許文献2のとおりである。
【0040】
ある非常に好ましい実施形態では、本言及は、配列番号1ないし10および/または配列番号50ないし60または配列番号50ないし60に従う配列について特異的である、オリゴヌクレオチドのセットに関する。本発明に基づくオリゴヌクレオチドは、生体環境中に現れる際の配列に特異的であってもよいし、亜硫酸水素塩処理された配列に特異的であってもよい。そのようなプローブは、10ないし80ヌクレオチドの間の長さ、より好ましくは15ないし40ヌクレオチドの間の長さである。
【0041】
本発明に基づくオリゴヌクレオチドの諸セットの場合、少なくとも一つのオリゴヌクレオチドが固相に束縛されている(bound)ことが好ましい。一つのセットのオリゴヌクレオチド全部が固相に束縛されていることがさらに好ましい。
【0042】
本発明はさらに、前記配列(配列番号1ないし配列番号100に従う配列およびそれに相補的な配列)または前記配列の処理されたバージョンの解析によって、ゲノムDNAのシトシン・メチル化状態を検出するために使われる少なくとも10個のプローブ(オリゴヌクレオチドおよび/またはPNAオリゴマー)のセットに関する。
【0043】
これらのプローブは、乳房細胞増殖性疾患の改善された検出、診断、治療およびモニタリングを可能にする。
【0044】
オリゴヌクレオチドのセットは、配列番号1ないし配列番号100の一つに従う前記配列または前記配列の処理されたバージョンの解析によって、一塩基多形(SNP: single nucleotide polymorphism)を検出するためにも使用されてもよい。
【0045】
本発明によれば、本発明によって利用可能にされる種々のオリゴヌクレオチドおよび/またはPNAオリゴマーを配置したもの(いわゆる「アレイ(array)」)が、同様に固相に束縛された仕方で存在することが好ましい。
【0046】
種々のオリゴヌクレオチドおよび/またはPNAオリゴマーの配列のこのアレイは、長方形または六角形格子の形で固相上に配置されることにおいて特徴付けられることができる。固相表面は好ましくは、シリコン、ガラス、ポリスチレン、アルミニウム、スチール、鉄、銅、ニッケル、銀または金から構成される。しかしながら、ペレットの形で、あるいはまた樹脂マトリクスとして存在できるニトロセルロースやナイロンのようなプラスチックは好適な代替物である。
【0047】
したがって、本発明のさらなる主題は、乳房細胞増殖性疾患の改善された検出、診断、治療およびモニタリングおよび/または乳房細胞増殖性疾患に対する素質の検出のための担体材料に固定されたアレイを製造する方法である。当該方法において、本発明に基づく少なくとも一つのオリゴヌクレオチドが固相に結合される。そのようなアレイを製造する諸方法は、たとえば固相化学および感光性保護基による特許文献2から既知である。本発明のさらなる主題は、乳房細胞増殖性疾患の改善された検出、診断、治療およびモニタリングのためのDNAチップに関する。さらに、DNAチップは、乳房細胞増殖性疾患に対する素質の検出を可能にする。
【0048】
DNAチップは、本発明に基づく少なくとも一つの核酸および/またはオリゴヌクレオチドを含む。DNAチップは、たとえば特許文献3から既知である。
【0049】
本発明はまた、配列番号1ないし100に従う配列のうちの少なくとも10個と同一である配列をもつ核酸を含む組成物またはアレイであって、高々100個の異なる核酸分子を含むものにも関する。
【0050】
本発明は、累積p値が0.001未満、好ましくは0.0001未満である少なくとも5つの配列を有する組成物またはアレイに関する。
【0051】
さらに、本発明の主題は、たとえば亜硫酸水素塩含有試薬、配列番号1ないし配列番号100において指定されている塩基配列の少なくとも15塩基対の長さのセグメントに対応するまたはそのようなセグメントと相補的な配列をもつ少なくとも二つのオリゴヌクレオチドを含むオリゴヌクレオチドのプライマーのセットからなりうるキットである。プライマーは、配列番号1ないし10および/または配列番号50ないし配列番号60についてであることが好ましい。
【0052】
〈例〉
〈試料〉
患者試料は、ノルウェー国オスロのノルウェー・ラジウム病院および国立癌研究所の協同ヒト組織ネットワーク(CHTN: Cooperative Human Tissue Network)から得られた。法的要件に則って患者の同意は得ている。
【0053】
〈CpG島〉
注釈付けされたCpG島がUCSCゲノム・ブラウザーから得られた。これらの島は、公開されているガーディナー‐ガーデン定義(非特許文献3)を使って予測された。これは次の基準に関わる:長さ≧200bp、%GC≧50%、観察/期待されるCpG≧0.6。ゲノム中、200bpないし2000bpの範囲内に〜26219個のCpG島がある。これらの島は、MsP I制限フラグメンテーションによってよくカバーされる。
【0054】
アレイは、Nimblegen Systems社によって、次の仕様で390Kフォーマットを使って製造された。ヒト・ゲノム・ビルド(build)33(hg17)からのCpG島注釈が、50マーのタイリング・アレイをデザインするために使用された。その50マーは、その島を均等に分布させるために、島配列座標のいずれかの側にシフトされた。390Kフォーマットは、367,658個の利用可能な特徴をもち、これは50マーのタイリングをもつ全部の島にフィットしないであろう。したがって、200b-2000bのサイズのCpG島のみが検定されるよう、表現されるべき島に対してサイズに基づいてカットオフを設けた。バックグラウンド信号を表現するためにコントロール・プローブがデザインされた。試料調製:表現は以前に記載されている(非特許文献4)が、以下の変更がある。使用された主要な制限エンドヌクレアーゼはMspIである。消化後、次のリンカーがライゲーションされた(MspI24merおよびMSPI12mer)。12マーはリン酸化されておらず、ライゲーションしない。ライゲーション後、材料はフェノール・クロロホルムによって洗浄され、沈殿させられ、遠心分離され、再び懸濁された。材料は二つに分けられ、半分がエンドヌクレアーゼMcrBCによって消化され、残り半分が擬似消化された(mock digested)。表現の増幅のための各試料対について、たった4本の250μl管が使われた。それぞれが100μlの体積反応をもつ。サイクル条件は95°Cで1分間、72°Cで3分間を15サイクル、次いで72°Cで10分間の伸張である。各対についての管の内容は、完了時にプールされた。表現は、フェノール:クロロホルム抽出によって洗浄され、沈殿させられ、再び懸濁され、濃度決定された。DNAは軽微な変更はあるが非特許文献4に記載されているようにラベル付けされた。手短かにいうと、2μgのDNAテンプレートが0.2mLのPCR管内に入れられた(pH8でTE中に溶解)。5μlのランダム九量体(nonomers)(Sigma Genosys社)が加えられ、dH2Oで25μLに引き上げられ、混合された。管は100°Cで5分間、テトラッド(Tetrad)内に置かれ、次いで氷の上に5分間置かれた。これに対して、5μlのNEB Buffer2、5μLのdNTP(0.6nm dCTP、1.2nm dATP、dTTP、dGTP)、5μlのGE Healthcareからのラベル(Cy3-dCTPまたはCy5-dCTP)、2μlのNEB Klenowフラグメントおよび2μlのdH2Oが加えられた。ハイブリダイゼーションおよび洗浄の手順は、ハイブリダイゼーションのためのオーブン温度を50°Cに上げた点を除いては、以前に報告されたのに従った(非特許文献4)。アレイは、Axon GenePix 4000Bスキャナ・セットでピクセル・サイズ5μmでスキャンされた。GenePix Pro 4.0ソフトウェアを使って、アレイについての強度を定量した。アレイ・データはさらなる解析のためにS-PLUSにインポートされた。
【0055】
〈データ解析〉
マイクロアレイ画像はGenePix 4000Bスキャナでスキャンされ、データはNimblescanソフトウェア(Nimblegen Systems社)を使って抽出された。各プローブについて、McrBcおよびコントロールの処理された試料の比の幾何平均(GeoMeanRatio)が、各実験およびその関連する色素交換(dye swap)について計算された。データセット中の全試料のGeoMeanRatioは次いで、分位規格化法(quantile normalization method)(非特許文献5)を使って規格化された。各実験についての規格化された比は、次いで、メジアン・ポリッシュ・モデル(median polish model)を使って各MspIフラグメント中の全プローブについて一つの値を得るために圧縮された(collapsed)。圧縮されたデータは次いでさらなる解析のために使用された。
【0056】
最も有意ないくつかの島を識別するために分散(variance)の解析が使用された。腫瘍と正常な試料の間のメチル化において最も一貫して起こっている変化を判別するために、我々は、t試験アプローチを使った。複数回試験についての補正(非特許文献6)後に0.001のp値カットオフを使って、差別的なメチル化を示す916個のMspIフラグメントのリストを得た。差別的なメチル化は、遺伝子との関連付けに基づいてこれらの916個のフラグメントから導出されるものである。
【0057】
監督された学習:我々は、腫瘍の試料を正常試料から区別するために必要とされる特徴の数(the number of features)を識別するために、監督された機械学習分類器を使った。一つ除去法(leave one out method)(非特許文献7)を使って分類精度を得るため、公に利用可能なサポート・ベクトル・マシン(SVM: support vector machine)・ライブラリ(LibSVM Ver2.8)を使った。分類のためのメチル化特徴をまずトレーニング・データのみのうちでt試験を使って選択した。次いで、放射基底関数(RBF: radial basis function)カーネルを使って上位10、50および100個の特徴でSVMをトレーニングした。
【0058】
N個の試料について、メチル化比における有意な差をもつフラグメントを識別するために、(N−1)個の試料についてt試験を実行した。胸データセットについては、これは全52の胸試料について、t試験計算の間に各試料が一回除外されるよう、52回実行された。次いで(N−1)個の試料からの上位10個のフラグメント特徴のメチル化比がSVMをトレーニングするために使われ、一つのトレーニングされていない試料からの比が試験のために使われた。たった10個の特徴に基づいて、94%の分類精度に到達できる(全正しい予測/全予測は49/52)。腫瘍検出に対する感度は92.5%(37/40)であった。腫瘍検出に対する特異性=100%。特徴サイズを50個に増すと、分類率(classification rate)は96%(50/52が正しく分類)となる。興味深いことに、この解析で正常と分類された二つの腫瘍試料は、遺伝子発現およびROMA解析の両方において正常に最も近いものでもあった。
【0059】
〈メチル化された部位の検出〉
ある好ましい実施形態では、本方法は、以下のステップを含む:本方法の第一のステップでは、ゲノムDNA試料が細胞系(cell lines)、組織または血液試料のようなソースから単離される必要がある。抽出は、当業者にとっては標準的である手段によってもよい。それには、洗剤溶解物(detergent lysates)、超音波照射(sonification)およびガラス・ビーズを用いたボルテックス攪拌(vortexing with glass beads)の使用が含まれる。ひとたび核酸が抽出されたら、ゲノムの二本鎖のDNAが解析において使用される。
【0060】
ある好ましい実施形態では、本方法の次のステップに先立ってDNAが切断されてもよい。これは、当技術分野で標準的ないかなる手段によってもよく、特に、これに限られないが、制限エンドヌクレアーゼを用いてでもよい。
【0061】
本方法の第二のステップでは、ゲノムDNA試料が、5′位でメチル化されていないシトシン塩基がウラシル、チミンまたはハイブリダイゼーション挙動の面でシトシンと似ていない別の塩基に変換されるような仕方で処理される。これは、以下では「前処理」として理解されることになる。
【0062】
ゲノムDNAの上記の処理は、好ましくは、亜硫酸水素塩(bisulfite)(亜硫酸塩(sulfite)、重亜硫酸塩(disulfite))およびその後のアルカリ加水分解を用いて実行される。この結果、メチル化されていないシトシンの核酸塩基がウラシルまたは塩基バイリン挙動(base vairine behaviour)の面でシトシンに似ていない他の塩基に変換される。亜硫酸水素塩溶液が反応のために使われる場合、メチル化されていないシトシン塩基のところで付加が起こる。さらに、ラジカル捕捉体(radical interceptor)のほか変性試薬または溶剤が存在している必要がある。するとその後のアルカリ加水分解がメチル化されていないシトシン核酸塩基のウラシルへの変換を生じさせる。変換されたDNAは次いで、メチル化されたシトシンの検出のために使用される。
【0063】
フラグメントは増幅される。統計的および実用的な考慮のため、好ましくは、100〜2000塩基対の長さをもつ10個より多い異なるフラグメントが増幅される。いくつかのDNAセグメントの増幅は、同一の反応容器内で同時に実行できる。通例、増幅はポリメラーゼ連鎖反応(PCR: polymerase chain reaction)によって実行される。そのようなプライマーの設計は、当業者には自明である。これらのプライマーは、各配列が付録において指定されている塩基配列(配列番号1ないし配列番号100)の少なくとも15塩基対の長さのセグメントと逆に相補的であるまたは同一である少なくとも二つのオリゴヌクレオチドを含むべきである。前記プライマー・オリゴヌクレオチドは好ましくは、CpGジヌクレオチドを全く含まないことにおいて特徴付けられる。本方法の特に好ましいある実施形態では、前記プライマー・オリゴヌクレオチドの配列は、関心のある乳房細胞固有DNAのみに選択的にアニーリングし、これを増幅し、それによりバックグラウンドまたは有意でないDNAの増幅を最小限にするよう設計される。本発明のコンテキストでは、バックグラウンドDNAは、有意な組織に特異的なメチル化パターンをもたないゲノムDNAを意味するものと解釈される。この場合、有意な組織は、健全なものと疾病のあるものを両方含め、乳房細胞である。
【0064】
本発明によれば、少なくとも一つのプライマー・オリゴヌクレオチドが増幅の間、固相に束縛されることが好ましい。種々のオリゴヌクレオチドおよび/またはPNAオリゴマー配列は、長方形または六角形格子の形で平面状の固相上に配置されることができる。固相表面は好ましくは、シリコン、ガラス、ポリスチレン、アルミニウム、スチール、鉄、銅、ニッケル、銀または金であるが、ニトロセルロースやプラスチックのような他の物質を使うことも可能である。増幅によって得られたフラグメントは、直接的にまたは間接的に検出可能なラベルを担持しうる。好ましいのは、蛍光ラベル、放射性核種または質量分析計で検出できる典型的な質量をもつ分離可能な(detachable)分子フラグメントの形のラベルであり、生成されるフラグメントは、質量分析計におけるよりよい検出可能性のために単一の正または負の正味の電荷をもつことが好ましい。検出は、マトリクス支援レーザー脱離イオン化質量分析(MALDI)によって、あるいは電子スプレー質量分析(ESI)を使って実行および可視化されうる。
【0065】
次のステップにおいて、処理に先立ってゲノムDNAのメチル化状態を決定するために、核酸増幅産物〔アンプリコン〕が解析される。
【0066】
核酸の処理後解析(post treatment analysis)が、代替的な諸方法を使って実行されてもよい。処理された核酸のメチル化状態特異的解析についてのいくつかの方法が知られている。他の代替的な諸方法が当業者には明らかであろう。
【0067】
当技術分野で既知のいくつかの方法を使って、解析は、本方法の増幅ステップの間に実行されうる。そのような一つの実施形態では、配列番号1ないし配列番号100を有する核酸内の事前に選択されたCpG位置のメチル化状態が、メチル化特異的なプライマー・オリゴヌクレオチドの使用によって検出されうる。この技法は、特許文献4に記載されている。

【特許請求の範囲】
【請求項1】
乳癌疾患の解析方法であって、配列番号1ないし10および/または配列番号50ないし60に従う配列の群から選択される配列における一つまたは複数のCpGジヌクレオチドのゲノム・メチル化状態を判別することを含む、方法。
【請求項2】
前記解析は被験体における乳癌の検出であり、以下のステップ、すなわち、
a.解析されるべき被験体からの試料を提供するステップと、
b.配列番号1ないし10および/または配列番号50ないし配列番号60に従う配列の群から選択される配列における一つまたは複数のCpGジヌクレオチドのメチル化状態を判別するステップとが実行される、
請求項1記載の方法。
【請求項3】
追加的に以下のステップ、すなわち、
a.前記メチル化状態試験からの一つまたは複数の結果が、診断多変量モデルから得られる分類器に入力されるステップ、
b.試料が正常組織からのものか乳癌組織からのものかについて確からしさを計算するステップ、および/または
c.予測の信頼性についての関連するp値を計算するステップが実行される、
請求項1または2記載の方法。
【請求項4】
メチル化状態が、配列番号1ないし10および/または配列番号50ないし配列番号60に従う配列のうちの少なくとも4つについて判別される、請求項1ないし3のうちいずれか一項記載の方法。
【請求項5】
メチル化状態が、追加的に、配列番号11ないし49および/または61ないし100に従う配列のうちの一つまたは複数について判別される、請求項1ないし4のうちいずれか一項記載の方法。
【請求項6】
メチル化状態が、配列番号1ないし100に従う少なくとも20の配列について判別される、請求項1ないし5のうちいずれか一項記載の方法。
【請求項7】
メチル化状態が、配列番号1ないし10および配列番号50ないし60に従う配列について判別される、請求項1ないし6のうちいずれか一項記載の方法。
【請求項8】
メチル化状態の判別が、
a.亜硫酸水素塩配列決定、
b.パイロシークエンス、
c.メチル化感受性一本鎖配座解析(MS-SSCA)、
d.高解像度融解解析(HRM)、
e.メチル化感受性単一ヌクレオチド・プライマー伸張(MS-SnuPE)、
f.塩基特異的切断/MALDI-TOF、
g.メチル化特異的PCR(MSP)、
h.マイクロアレイに基づく諸方法および
i.mspI切断
の群から選択される方法のうちの一つまたは複数によって行われる、請求項1ないし7のうちいずれか一項記載の方法。
【請求項9】
解析すべき試料が、解析すべき組織からの組織生検、膣組織、舌、膵臓、肝臓、脾臓、卵巣、筋肉、関節組織、神経組織、胃腸組織、腫瘍組織、体液、血液、血清、唾液および尿のような組織の群から選択される組織型からである、請求項1ないし8のうちいずれか一項記載の方法。
【請求項10】
原発性癌が検出される、請求項2ないし9のうちいずれか一項記載の方法。
【請求項11】
得られたメチル化パターンが、乳癌の治療に対する治療応答を予測するために使われる、請求項1ないし10のうちいずれか一項記載の方法。
【請求項12】
配列番号1ないし100に従う配列のうちの少なくとも10個と同一の配列をもつ核酸を含む組成物またはアレイであって、高々100の異なる核酸分子を含む組成物またはアレイ。
【請求項13】
累積的なp値が0.001未満、好ましくは0.0001未満である少なくとも5つの配列を含む、請求項12記載の組成物またはアレイ。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate


【公表番号】特表2010−538638(P2010−538638A)
【公表日】平成22年12月16日(2010.12.16)
【国際特許分類】
【出願番号】特願2010−524620(P2010−524620)
【出願日】平成20年9月16日(2008.9.16)
【国際出願番号】PCT/IB2008/053745
【国際公開番号】WO2009/037635
【国際公開日】平成21年3月26日(2009.3.26)
【出願人】(590000248)コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ (12,071)
【出願人】(510048048)
【Fターム(参考)】