説明

遺伝子メチル化および発現

本発明は、全ゲノムの全部または一部のメチル化状態を分析する方法を提供する。さらに、本発明は、メチル化を受けやすいDNAを含有する生体細胞を特徴付ける方法および試薬を特徴とする。そのような方法は、がん、例えば、乳がんを診断する方法を含む。

【発明の詳細な説明】
【技術分野】
【0001】
技術分野
本発明は後成的な遺伝子制御に関し、より詳細にはDNAメチル化および遺伝子発現に及ぼすその影響、ならびに特定の細胞型および/または病状のマーカーとしてのその使用に関する。
【0002】
関連出願の相互参照
本出願は、2005年5月27日付で出願された米国特許仮出願第60/685,104号の優先権を主張する。先行出願の全内容はその全体が参照により本明細書に組み入れられる。
【0003】
連邦政府による資金提供を受けた研究の記載
本出願において記述される研究は、一部分において、米国立衛生研究所の国立がん研究所の助成金(番号CA89393およびCA94074)、ならびに米国防総省の助成金(番号DAMD 17-02-1-0692およびW8IXWH-04-1-0452)により支援を受けた。したがって、米国政府は本発明において一定の権利を有する。
【背景技術】
【0004】
背景
後成的変化(例えば、DNAメチル化のレベルの変化)、および遺伝子変化をがん細胞および腫瘍内の間質細胞において検出することができる。より識別力のある診断方法およびより効果的な治療方法を開発するためには、これらの後成的影響を規定し、特徴付けることが重要である。
【発明の開示】
【0005】
概要
本発明者らはゲノムの全部、または一部においてメチル化のレベルを評価する方法を開発した。本発明者らはこの方法をメチル化特異的なデジタル核型分析(MSDK)と呼ぶ。MSDK法は、関心対象の試験細胞に対する試験ゲノムのメチル化プロファイルを確立するよう適合させることができる。試験プロファイルを規定の細胞型で得られた対照プロファイルと比較することにより、試験細胞を特定することができる。MSDK法は同様に、対応する対照細胞(例えば、がん細胞と同じ組織の正常細胞)に比べて、メチル化が変化している(増加しているまたは減少している)試験細胞(例えば、がん細胞)における遺伝子を同定するために使用することができる。この情報は、関心対象の試験細胞が(a) 対照細胞(例えば、正常細胞)と同じであるか、(b) 対照細胞と異なるが、例えば、がん細胞などの病的細胞であるかどうかを識別する方法の根拠となる。そのような方法は、例えば、関心対象の遺伝子のDNAメチル化のレベルもしくは発現のレベル、または試験細胞における特定の染色体領域中のDNAメチル化のレベルを評価する段階、およびその結果を対照細胞で得られた結果と比較する段階を含む。
【0006】
より具体的には、本発明はメチル化特異的なデジタル核型分析(MSDK)ライブラリーを作製する方法を特徴とする。この方法は、以下の段階を含む:
試験細胞のゲノムDNAの全部または一部を提供する段階; DNAをメチル化感受性マッピング制限酵素(MMRE)に曝露して、複数の第1の断片を作出する段階;
親和性対の第1のメンバーを含む結合成分を、第1の断片のそれぞれの一方の末端にまたは両方の末端に結合させ、この結合によって複数の第2の断片をもたらす段階;
複数の第2の断片を断片化用の制限酵素(FRE)に曝露して、親和性対の第1のメンバーを一方の末端におよびFREの5'切断配列またはFREの3'切断配列を他方の末端にそれぞれが含んだ、複数の第3の断片を作出する段階;
複数の第3の断片を、複数の親和性対の第2のメンバーが結合されている不溶性基材と接触させ、この接触によってそれぞれが、不溶性基材に親和性対の第1および第2のメンバーを介して結合した第3の断片である、複数の結合した第3の断片をもたらす段階;
放出用の制限酵素(RRE)認識配列および、RREの認識配列の3'側に、FREの5'切断配列またはFREの3'切断配列のいずれかを含んだ放出用の成分を、結合した第3の断片の遊離末端に結合させ、この結合によってそれぞれが、(i) RREの認識配列を一方の末端に含んだ、ならびに(ii) 他方の末端の親和性対の第1のメンバーおよび親和性対の第2のメンバーを介して不溶性基材に結合した、複数の結合した第4の断片をもたらす段階; および
結合した第4の断片をRREに曝露し、この曝露によってそれぞれが、ゲノムDNAの複数の塩基対からなるMSDKタグおよび放出用の成分を含んだ、複数の第5の断片を含むMSDKライブラリーの、不溶性基材からの放出をもたらす段階。したがって、この方法は、複数のMSDKタグの産生をもたらす。
【0007】
この方法において、MMREは、例えば、AscIとすることができ、FREは、例えば、NlaIIIとすることができ、RREは、例えば、MmeIとすることができる。結合成分はMMREの5'または3'切断配列をさらに含むことができる。結合成分は同様に、MMREの5'または3'認識配列と親和性対の第1のメンバーとの間に、複数の塩基対を含むリンカー核酸配列をさらに含むことができる。放出用の成分は、RRE認識配列の5'側に、複数の塩基対を含む伸長用核酸配列をさらに含むことができる。試験細胞は脊椎動物細胞とすることができ、脊椎動物試験細胞は哺乳動物試験細胞、例えば、ヒト試験細胞とすることができる。さらに、試験細胞は正常細胞または、例えば、がん細胞、例えば、乳がん細胞とすることができる。親和性対の第1のメンバーは、ビオチン、イミノビオチン、アビジンもしくはアビジンの機能的断片、抗原、ハプテン決定基、一本鎖ヌクレオチド配列、ホルモン、接着受容体のリガンド、接着リガンドの受容体、レクチンのリガンド、レクチン、免疫グロブリンFc領域の全部もしくは一部を含んだ分子、細菌のプロテインA、または細菌のプロテインGとすることができる。不溶性基材は磁気ビーズを含んでもよく、または磁気ビーズであってもよい。
【0008】
本発明によって同様に提供されるのは、MSDKライブラリーを分析する方法である。この方法は、以下の段階を含む: 上記の方法によって作製されるMSDKライブラリーを提供する段階; および1つのタグ、複数のタグ、または全てのタグのヌクレオチド配列を同定する段階。複数のタグのヌクレオチド配列を同定する段階は、以下の段階を含むことができる: ともに連結された2つの第5の断片をそれぞれが含んだ、複数のジタグ(ditag)を作製する段階; それぞれのジタグ断片が2つのMSDKタグを含む、複数のジタグまたはジタグ断片を含んだ鎖状体を形成させる段階; 鎖状体のヌクレオチド配列を決定する段階; および鎖状体のヌクレオチド配列から、鎖状体が含むMSDKタグの1つまたは複数のヌクレオチド配列を推定する段階。ジタグ断片は、ジタグをFREに曝露することにより作製することができる。この方法は、複数のジタグを作製した後におよび鎖状体を形成させる前に、個々のジタグの数(存在量)をPCRによって増大させる段階をさらに含むことができる。この方法は、タグの一部または全部の相対頻度を判定する段階をさらに含むことができる。
【0009】
本発明の別の局面は、MSDKライブラリーを分析するさらなる方法である。この方法は、以下の段階を含む: 上記の方法によって作製されるMSDKライブラリーを提供する段階; ライブラリーから選択されたタグの配列に対応する染色体部位を同定する段階。この方法は、同定された染色体部位に最も近いMMREの非メチル化全認識配列の、試験細胞のゲノムにおける、染色体位置を判定する段階をさらに含むことができる。これらの2つの段階は、複数のMMRE非メチル化認識配列の染色体位置を判定するため、ライブラリーから得られる複数のタグで繰り返すことができる。染色体部位の同定および染色体位置の判定は、ゲノムまたはゲノムの一部のヌクレオチド配列、MMREの全認識配列のヌクレオチド配列、FREの全認識配列のヌクレオチド配列、およびRREの全認識配列をRRE切断部位から分離するヌクレオチド数を用いて作出された仮想タグライブラリーと、選択されたタグのヌクレオチド配列を比較する段階を含む過程によって行うことができる。
【0010】
別の局面では、本発明は生体細胞を分類する方法を提供する。この方法は、以下の段階を含む: (a) 上記のように作製されたMSDKライブラリー中の1つのタグ、複数のタグ、または全てのタグのヌクレオチド配列を同定する段階およびタグの一部または全部の相対頻度を判定する段階、それにより試験細胞に対する試験MSDKプロファイルを得る段階; (b) 試験MSDKプロファイルを、1つまたは複数の対照の細胞型に対する別の対照MSDK発現プロファイルと比較する段階; (c) 試験MSDKプロファイルに最も酷似している対照MSDKプロファイルを選択する段階; ならびに(d) 段階(c)で選択された対照MSDKプロファイルの細胞型に適合する細胞型を試験細胞に割り当てる段階。試験および対照細胞は、脊椎動物細胞、例えば、ヒト細胞などの哺乳動物細胞とすることができる。対照の細胞型は、対照の正常細胞および正常細胞と同じ組織の対照のがん細胞を含むことができる。対照の正常細胞および対照のがん細胞は、乳房細胞または結腸、肺、前立腺、および膵臓から選択される組織のものとすることができる。試験細胞は、乳房細胞または結腸、肺、前立腺、および膵臓から選択される組織のものとすることができる。対照の細胞型は単一組織のがんのうちの異なる部類の細胞を含むことができ、単一組織のがんのうちの異なる部類は、例えば、非浸潤性乳管がん(breast ductal carcinoma in situ; DCIS)細胞および浸潤性乳がん細胞を含むことができる。単一組織のがんのうちの異なる部類は、または、例えば、以下の2つもしくはそれ以上を含むことができる: 高悪性度DCIS細胞、中悪性度DCIS細胞; および低悪性度DCIS細胞。対照の細胞型は、以下の2つまたはそれ以上を含むことができる: 肺がん細胞; 乳がん細胞; 結腸がん細胞; 前立腺がん細胞; および膵臓がん。さらに、対照の細胞型は、非がん組織から得られた上皮細胞および非がん組織から得られた筋上皮細胞を含むことができる。さらに、対照細胞は同様に、同じ組織型の幹細胞およびそれに由来する分化細胞(例えば、上皮細胞または筋上皮細胞)を含むことができる。対照の幹細胞およびそれに由来する分化細胞は、乳房組織のもの、または結腸、肺、前立腺、および膵臓から選択される組織のものとすることができる。対照の幹細胞およびそれに由来する分化細胞は、正常もしくはがん細胞(例えば、乳がん細胞)とすることができ、またはがん組織(例えば、乳がん)から得ることができる。
【0011】
本発明の別の態様は診断方法である。この方法は、以下の段階: (a) 試験乳房上皮細胞を提供する段階; (b) DNA (例えば、遺伝子)が、表5に列挙されているMSDKタグによって同定されるAscI部位から選択され、1つまたは複数のC残基がCpG配列中のC残基である、試験細胞におけるDNA配列中の(例えば、遺伝子中の)1つまたは複数のC残基のメチル化の程度を判定する段階; および(c) 1つまたは複数の残基のメチル化の程度を、非がん性の乳房組織から得られた対照の上皮細胞における対応する遺伝子中の対応する1つまたは複数のC残基のメチル化の程度と比較する段階を含み、対照の上皮細胞と比較して試験上皮細胞における1つまたは複数のC残基のメチル化の程度の変化は、試験上皮細胞ががん細胞であるという徴候である。メチル化の程度の変化は、より低いメチル化の程度またはより高いメチル化の程度とすることができる。メチル化の程度の変化は、遺伝子のプロモーター領域中、遺伝子のエクソン中、遺伝子のイントロン中、または遺伝子の外側の領域中(例えば、遺伝子間の領域中)とすることができる。遺伝子は、例えば、PRDM14またはZCCHC14とすることができる。
【0012】
本発明は別の診断方法を提供する。この方法は、以下の段階: (a) 試験結腸上皮細胞を提供する段階; (b) DNA配列(例えば、遺伝子)が、表2に列挙されているMSDKタグによって同定されるものから選択され、1つまたは複数のC残基がCpG配列中のC残基である、試験細胞におけるDNA配列中の(例えば、遺伝子中の)1つまたは複数のC残基のメチル化の程度を判定する段階; および(c) 1つまたは複数の残基のメチル化の程度を、非がん性の結腸組織から得られた対照の上皮細胞における対応する遺伝子中の対応する1つまたは複数のC残基のメチル化の程度と比較する段階を含み、対照の上皮細胞と比較して試験上皮細胞における1つまたは複数のC残基のメチル化の程度の変化は、試験上皮細胞ががん細胞であるという徴候である。メチル化の程度の変化は、より低いメチル化の程度またはより高いメチル化の程度とすることができる。さらに、メチル化の程度の変化は、遺伝子のプロモーター領域中、遺伝子のエクソン中、遺伝子のイントロン中、または遺伝子の外側の領域中(例えば、遺伝子間の領域中)とすることができる。遺伝子は、例えば、LHX3、TCF7L1、またはLMX-1Aとすることができる。
【0013】
本発明によって特徴付けられる別の診断方法は、以下の段階: (a) 試験乳房組織から得られる試験筋上皮細胞を提供する段階; (b) DNA配列(例えば、遺伝子)が、表10に列挙されているMSDKタグによって同定されるものから選択され、1つまたは複数のC残基がCpG配列中のC残基である、試験細胞におけるDNA配列中の(例えば、遺伝子中の)1つまたは複数のC残基のメチル化の程度を判定する段階; および(c) 1つまたは複数の残基のメチル化の程度を、非がん性の乳房組織から得られた対照の筋上皮細胞における対応する遺伝子中の対応する1つまたは複数のC残基のメチル化の程度と比較する段階を含み、対照の筋上皮細胞と比較して試験筋上皮細胞における1つまたは複数のC残基のメチル化の程度の変化は、試験乳房組織ががん組織であるという徴候である。メチル化の程度の変化は、より低いメチル化の程度またはより高いメチル化の程度とすることができる。さらに、メチル化の程度の変化は、遺伝子のプロモーター領域中、遺伝子のエクソン中、遺伝子のイントロン中、または遺伝子の外側の領域中(例えば、遺伝子間の領域中)とすることができる。遺伝子は、例えば、HOXD4、SLC9A3R1、またはCDC42EP5とすることができる。
【0014】
本発明によって具現される別の診断方法は、以下の段階: (a) 試験乳房組織から得られる試験線維芽細胞を提供する段階; (b) DNA配列(例えば、遺伝子)が、表7および8に列挙されているMSDKタグによって同定されるものから選択され、1つまたは複数のC残基がCpG配列中のC残基である、試験細胞におけるDNA配列中の(例えば、遺伝子中の)1つまたは複数のC残基のメチル化の程度を判定する段階; および(c) 1つまたは複数の残基のメチル化の程度を、非がん性の乳房組織から得られた対照の線維芽細胞における対応する遺伝子中の対応する1つまたは複数のC残基のメチル化の程度と比較する段階を含み、対照の線維芽細胞と比較して試験線維芽細胞における1つまたは複数のC残基のメチル化の程度の変化は、試験乳房組織ががん組織であるという徴候である。メチル化の程度の変化は、より低いメチル化の程度またはより高いメチル化の程度とすることができる。さらに、メチル化の程度の変化は、遺伝子のプロモーター領域中、遺伝子のエクソン中、遺伝子のイントロン中、または遺伝子の外側の領域中(例えば、遺伝子間の領域中)とすることができる。遺伝子は、例えば、Cxorf12とすることができる。
【0015】
別の局面では、本発明は、細胞が上皮細胞または筋上皮細胞である可能性を判定する方法を含む。この方法は、以下の段階: (a) 試験細胞を提供する段階; (b) DNA配列(例えば、遺伝子)が、表12に列挙されているMSDKタグによって同定されるものから選択され、1つまたは複数のC残基がCpG配列中のC残基である、試験細胞におけるDNA配列中の(例えば、遺伝子中の)1つまたは複数のC残基のメチル化の程度を判定する段階; ならびに(c) 1つまたは複数の残基のメチル化の程度を、対照の筋上皮細胞における対応する遺伝子中の対応する1つまたは複数のC残基のメチル化の程度とおよび対照の上皮細胞における対応する遺伝子中の対応する1つまたは複数のC残基のメチル化の程度と比較する段階を含み、試験細胞は、(i) 試験サンプルにおけるメチル化の程度が対照の筋上皮細胞におけるメチル化の程度にいっそう酷似しているなら、筋上皮細胞である可能性がいっそう高く; または(ii) 試験サンプルにおけるメチル化の程度が対照の上皮細胞におけるメチル化の程度にいっそう酷似しているなら、上皮細胞である可能性がいっそう高い。C残基は、遺伝子のプロモーター領域中、遺伝子のエクソン中、遺伝子のイントロン中、または遺伝子の外側の領域中(例えば、遺伝子間の領域中)とすることができる。遺伝子は、例えば、LOC389333またはCDC42EP5とすることができる。
【0016】
別の局面では、本発明は、細胞が幹細胞、分化内腔上皮細胞または筋上皮細胞である可能性を判定する方法を含む。この方法は、以下の段階: (a) 試験細胞を提供する段階; (b) DNA配列(例えば、遺伝子)が、表15または16に列挙されているMSDKタグによって同定されるものから選択され、1つまたは複数のC残基がCpG配列中のC残基である、試験細胞におけるDNA配列中の(例えば、遺伝子中の)1つまたは複数のC残基のメチル化の程度を判定する段階; ならびに(c) 1つまたは複数の残基のメチル化の程度を、対照の幹細胞における対応する遺伝子中の対応する1つまたは複数のC残基のメチル化の程度と、対照の分化内腔上皮細胞における対応する遺伝子中の対応する1つまたは複数のC残基のメチル化の程度と、および対照の筋上皮細胞における対応する遺伝子中の対応する1つまたは複数のC残基のメチル化の程度と比較する段階を含み、試験細胞は、(i) 試験サンプルにおけるメチル化の程度が対照の幹細胞におけるメチル化の程度にいっそう酷似しているなら、幹細胞である可能性がいっそう高く; (ii) 試験サンプルにおけるメチル化の程度が対照の上皮細胞におけるメチル化の程度にいっそう酷似しているなら、分化内腔上皮細胞である可能性がいっそう高く; または(iii) 試験サンプルにおけるメチル化の程度が対照の筋上皮細胞におけるメチル化の程度にいっそう酷似しているなら、筋上皮細胞である可能性がいっそう高い。C残基は、遺伝子のプロモーター領域中、遺伝子のエクソン中、遺伝子のイントロン中、または遺伝子の外側の領域中(例えば、遺伝子間の領域中)とすることができる。遺伝子は、例えば、SOX13、SLC9A3R1、FNDC1、FOXC1、PACAP、DDN、CDC42EP5、LHX1、およびHOXA10とすることができる。
【0017】
本発明は同様に、以下の段階: (a) 試験組織から試験細胞を提供する段階; (b) 1つまたは複数のC残基がCpG配列中のC残基である、試験細胞におけるPRDM14遺伝子中の1つまたは複数のC残基のメチル化の程度を判定する段階; および(c) 1つまたは複数の残基のメチル化の程度を、試験細胞と同じ組織の非がん組織から得られた対照細胞におけるPRDM14遺伝子中の対応する1つまたは複数のC残基のメチル化の程度と比較する段階を含み、対照細胞と比較して試験細胞における1つまたは複数のC残基のメチル化の程度の変化は、試験細胞ががん細胞であるという徴候である、診断方法を特徴とする。メチル化の程度の変化は、より低いメチル化の程度またはより高いメチル化の程度とすることができる。さらに、メチル化の程度の変化は、遺伝子のプロモーター領域中、遺伝子のエクソン中、遺伝子のイントロン中、または遺伝子の外側の領域中(例えば、遺伝子間の領域中)とすることができる。試験および対照細胞は、乳房細胞または結腸、肺、前立腺、および膵臓から選択される組織のものとすることができる。
【0018】
本発明の別の態様は、以下の段階: (a) 試験上皮細胞を含む乳房組織の試験サンプルを提供する段階; (b) 遺伝子が正常な乳房上皮細胞と比較して、実質的に変化しているレベルで乳がん上皮細胞において発現される遺伝子である、表5に列挙されているものから選択される遺伝子の試験上皮細胞中での発現レベルを判定する段階; および(c) (i) 試験細胞における遺伝子の発現レベルが、正常な乳房上皮細胞の対照の発現レベルと比較して実質的に変化していないなら、正常な乳房上皮細胞と; または(ii) 試験細胞における遺伝子の発現レベルが、正常な乳房上皮細胞の対照の発現レベルと比較して実質的に変化しているなら、乳がん上皮細胞と試験細胞を分類する段階を含む、診断方法である。遺伝子は、例えば、PRDM14またはZCCHC14とすることができる。発現レベルの変化は、発現レベルの増加または発現レベルの減少とすることができる。
【0019】
本発明の別の態様は、以下の段階: (a) 試験上皮細胞を含む乳房組織の試験サンプルを提供する段階; (b) 遺伝子が正常な乳房上皮細胞と比較して、実質的に変化しているレベルで乳がん上皮細胞において発現される遺伝子である、表2に列挙されているものから選択される遺伝子の試験上皮細胞中での発現レベルを判定する段階; および(c) (i) 試験細胞における遺伝子の発現レベルが、正常な結腸上皮細胞の対照の発現レベルと比較して実質的に変化していないなら、正常な結腸上皮細胞と; または(ii) 試験細胞における遺伝子の発現レベルが、正常な結腸上皮細胞の対照の発現レベルと比較して実質的に変化しているなら、結腸がん上皮細胞と試験細胞を分類する段階を含む、診断方法である。遺伝子は、例えば、LHX3、TCF7L1、またはLMX-1Aとすることができる。発現レベルの変化は、発現レベルの増加または発現レベルの減少とすることができる。
【0020】
本発明に含まれる別の診断方法は、以下の段階を含む: (a) 試験間質細胞を含む乳房組織の試験サンプルを提供する段階; (b) 遺伝子が正常な乳房組織に存在する場合よりも乳がん組織に存在する場合に実質的に変化しているレベルで、試験間質細胞と同じ型の細胞において発現される遺伝子である、表7、8、および10に列挙されているものから選択される遺伝子の間質細胞中での発現レベルを判定する段階; ならびに(c) (i) 試験間質細胞における遺伝子の発現レベルが、正常な乳房組織中の試験間質細胞と同じ型の対照細胞の対照発現レベルと比較して実質的に変化していないなら、正常な乳房組織と; または(ii) 試験間質細胞における遺伝子の発現レベルが、正常な乳房組織中の試験間質細胞と同じ型の対照細胞の対照発現レベルと比較して実質的に変化しているなら、乳がん組織と試験サンプルを分類する段階。試験および対照間質細胞は筋上皮細胞とすることができ、遺伝子は表10に列挙されているもの、例えば、HOXD4、SLC9A3R1、またはCDC32EP5とすることができる。または、試験および対照間質細胞は線維芽細胞とすることができ、遺伝子は表7および8に列挙されているもの、例えば、Cxorf1とすることができる。発現レベルの変化は、発現レベルの増加または発現レベルの減少とすることができる。
【0021】
別の局面では、本発明は、細胞が上皮細胞または筋上皮細胞である可能性を判定する方法を含む。この方法は、以下の段階を含む: (a) 試験細胞を提供する段階; (b) 表12に列挙されているMSDKタグによって同定されるものからなる群より選択される遺伝子の試験サンプル中での発現レベルを判定する段階; (c) 試験サンプルにおける選択遺伝子の発現レベルが(i) 対照の筋上皮細胞または(ii) 対照の上皮細胞における選択遺伝子の発現レベルにいっそう酷似しているかどうかを判定する段階; および(d) (i) 試験細胞における遺伝子の発現レベルが対照の筋上皮細胞における遺伝子の発現レベルにいっそう酷似しているなら、筋上皮細胞である可能性が高いと; または(ii) 試験細胞における遺伝子の発現レベルが対照の上皮細胞における遺伝子の発現レベルにいっそう酷似しているなら、上皮細胞である可能性が高いと試験細胞を分類する段階。遺伝子は、例えば、LOC389333またはCDC42EP5とすることができる。
【0022】
別の局面では、本発明は、細胞が幹細胞、分化内腔上皮細胞、または筋上皮細胞である可能性を判定する方法を含む。この方法は、以下の段階を含む: (a) 試験細胞を提供する段階; (b) 表15または16に列挙されているMSDKタグによって同定されるものからなる群より選択される遺伝子の試験サンプル中での発現レベルを判定する段階; (c) 試験サンプルにおける選択遺伝子の発現レベルが(i) 対照の幹細胞、(ii) 対照の分化内腔上皮細胞、または(iii) 対照の筋上皮細胞における選択遺伝子の発現レベルにいっそう酷似しているかどうかを判定する段階; および(d) (i) 試験細胞における遺伝子の発現レベルが対照の幹細胞における遺伝子の発現レベルにいっそう酷似しているなら、幹細胞である可能性が高いと; (ii) 試験細胞における遺伝子の発現レベルが対照の分化内腔上皮細胞における遺伝子の発現レベルにいっそう酷似しているなら、分化内腔上皮細胞である可能性が高いと; または(iii) 試験細胞における遺伝子の発現レベルが対照の筋上皮細胞における遺伝子の発現レベルにいっそう酷似しているなら、筋上皮細胞である可能性が高いと試験細胞を分類する段階。遺伝子は、例えば、SOX13、SLC9A3R1、FNDC1、FOXC1、PACAP、DDN、CDC42EP5、LHX1、およびHOXA10とすることができる。
【0023】
本発明によって同様に具現されるのは、以下の段階: (a) 試験細胞を提供する段階; (b) PRDM14遺伝子の試験細胞における発現レベルを判定する段階; および(c) (i) 試験細胞における遺伝子の発現レベルが、試験細胞と同じ組織の対照の正常細胞に対する対照の発現レベルと比較して実質的に変化していないなら、正常細胞と; または(ii) 試験細胞における遺伝子の発現レベルが、試験細胞と同じ組織の対照の正常細胞に対する対照の発現レベルと比較して実質的に変化しているなら、がん細胞と試験細胞を分類する段階を含む、診断方法である。発現レベルの変化は、発現レベルの増加または発現レベルの減少とすることができる。試験および対照細胞は、乳房細胞または結腸、肺、前立腺、および膵臓から選択される組織のものとすることができる。
【0024】
本発明は同様に、(a) 表2、5、7、8、10、12、15および16に列挙されているものから選択されるタグのヌクレオチド配列; (b) ヌクレオチド配列の相補体; または(c) 表2、5、7、8、10、12、15、および16に列挙されているMSDKタグによって同定されるAscI部位を含む、一本鎖核酸プローブを提供する。
【0025】
別の局面では、それぞれのアドレスがその上に、(a) 表2、5、7、8、10、12、15および16に列挙されているものから選択されるタグヌクレオチド配列からなる核酸配列; (b) 核酸配列の相補体; または(c) 表2、5、7、8、10、12、15、および16に列挙されているMSDKタグによって同定されるAscI部位を含む捕捉プローブを配置した、少なくとも10、25、50、100、200、500、または1,000個のアドレスを有する基材を含んだアレイを提供する。
【0026】
本発明は同様に、それぞれのプローブが以下: (a) 表2、5、7、8、10、12、15および16に列挙されているものから選択されるタグヌクレオチド配列を含む核酸配列; (b) 核酸配列の相補体; (c) 表2、5、7、8、10、12、15、および16に列挙されているMSDKタグによって同定されるAscI部位を含んだ、少なくとも10、25、50、100、200、500、または1,000個のプローブを含むキットを特徴とする。
【0027】
本発明の別の局面は、抗体のそれぞれが、表2、5、7、8、10、12、15および16に列挙されているタグからなる群より選択されるタグによって同定される遺伝子によりコードされる異なるタンパク質に特異的である、少なくとも10、25、50、100、200、500、または1,000種の抗体を含んだキットである。
【0028】
本明細書において用いられる場合、「親和性対」とは、相互に結合するという固有の能力を有する分子の任意の対である。したがって、親和性対は、非限定的に、任意の受容体/リガンドの対、例えば、ビタミン(例えば、ビオチン)/ビタミン結合タンパク質(例えば、アビジンまたはストレプトアビジン); サイトカイン(例えば、インターロイキン-2)/サイトカイン(例えば、インターロイキン-2)受容体; ホルモン(例えば、ステロイドホルモン)/ホルモン受容体(例えば、ステロイドホルモン受容体); シグナル伝達リガンド/シグナル伝達受容体; 接着リガンド/接着受容体; デスドメイン分子結合リガンド/デスドメイン分子; レクチン(例えば、ヤマゴボウマイトジェン、エンドウマメレクチン、コンカナバリンA、レンチルレクチン、インゲンマメ(Phaseolus vulgaris)由来のフィトヘムアグルチニン(PHA)、ピーナッツ凝集素、ダイズ凝集素、ハリエニシダ(Ulex europaeus)凝集素-I、ヒマラヤフジマメ(Dolichos biflorus)凝集素、ビロードクサフジ(Vicia villosa)凝集素およびエンジュ(Sophora japonica)凝集素/レクチン受容体(例えば、糖質のレクチン受容体); 抗原またはハプテン(例えば、トリニトロフェノールまたはビオチン)/抗体(例えば、トリニトロフェノールまたはビオチンに特異的な抗体); 免疫グロブリンFc断片/免疫グロブリンFc断片結合タンパク質(例えば、細菌のプロテインAまたはプロテインG)を含む。リガンドは親和性対の第1または第2のメンバーとして機能することができ、受容体も同様である。リガンドを親和性対の第1のメンバーとして使用する場合、対応する受容体を親和性対の第2のメンバーとして使用し、受容体を親和性対の第1のメンバーとして使用する場合、対応する受容体を親和性対の第2のメンバーとして使用する。親和性対のポリペプチドの第1および第2のメンバーの機能的断片は、完全長の、成熟した第1または第2のメンバーの断片であり、これは完全長の、成熟した第1または第2のメンバーよりも短いが、完全長の、成熟した第1または第2のメンバーの、それぞれ、対応する第2または第1のメンバーとの結合能の少なくとも25% (例えば、少なくとも: 30%; 40%; 50%; 60%; 70%; 80%; 90%; 95%; 98%; 99%; 99.5%; 100%; または場合によりそれ以上)を有する。
【0029】
表2、5、7、8、10、12、15および16中の同定された全ての遺伝子のヌクレオチド配列は、公の遺伝子データベース(例えば、GeneBank)で利用できる。これらの配列は参照により本明細書に組み入れられる。
【0030】
本明細書において用いられる場合、第2の細胞(または第2の組織)と比較して第1の細胞(または第1の組織)での「実質的に変化している」遺伝子発現レベルとは、少なくとも2倍(例えば、少なくとも: 2倍; 3倍; 4倍; 5倍; 6倍; 7倍; 8倍; 9倍; 10倍; 15倍; 20倍; 30倍; 40倍; 50倍; 75倍; 100倍; 200倍; 500倍; 1,000倍; 2000倍; 5,000倍; または10,000倍)変化している遺伝子発現レベルである。変化は増加または減少とできることが理解されると考えられる。
【0031】
本明細書において用いられる場合、乳房「間質細胞」とは、上皮細胞以外の乳房細胞である。
【0032】
他に特記しない限り、本明細書において使用される技術用語および科学用語は全て、本発明が属する分野の当業者によって一般的に理解されるのと同じ意味を有する。矛盾がある場合には、定義を含む、本明細書が適用されるものとする。好ましい方法および材料を以下に記述するが、本明細書において記述されるものと類似したまたは等価な方法および材料を本発明の実践または試験において使用することができる。本明細書において言及される刊行物、特許出願、特許およびその他の参考文献は全て、その全体が参照により組み入れられる。本明細書において開示される材料、方法、および例は、単なる例示であり、限定であるとは意図されない。
【0033】
本発明のその他の特徴および利点、例えば、全ゲノムのメチル化の評価は、以下の記述から、図面からおよび特許請求の範囲から明らかであると思われる。
【0034】
詳細な説明
本発明のさまざまな局面を以下に記述する。
【0035】
メチル化特異的なデジタル核型分析(MSDK)
MSDKは関心対象の細胞の、ゲノム全部、またはゲノムの一部のメチル化の相対的レベルを評価する方法である。細胞はメチル化を受けやすいDNAを含んだ任意の生体細胞、例えば、原核細胞(例えば、細菌)または真核細胞(例えば、酵母細胞、原生動物細胞、無脊椎動物細胞、もしくは脊椎動物(例えば、哺乳動物)細胞)とすることができる。
【0036】
脊椎動物細胞は任意の脊椎動物種、例えば、爬虫類(例えば、ヘビ、ワニ、およびトカゲ)、両生類(例えば、カエルおよびヒキガエル)、魚類(例えば、サケ、サメ、もしくはマス)、鳥類(例えば、ニワトリ、シチメンチョウ、ワシ、もしくはダチョウ)、または哺乳類由来とすることができる。哺乳類としては、例えば、ヒト、ヒト以外の霊長類(例えば、サル、ヒヒ、もしくはチンパンジー)、ウマ、ウシ亜科の動物(例えば、雌ウシ、雄ウシ、もしくは種ウシ)、クジラ、イルカ、ネズミイルカ、ブタ、ヒツジ、ヤギ、ネコ、イヌ、ウサギ、スナネズミ、モルモット、ハムスター、ラット、またはマウスが挙げられる。脊椎動物および哺乳動物の細胞は関心対象の任意の有核細胞、例えば、上皮細胞(例えば、角化細胞)、筋上皮細胞、内皮細胞、線維芽細胞、メラニン細胞(melanococytes)、血液細胞(例えば、マクロファージ、単球、顆粒球、Tリンパ球(例えば、CD4+およびCD8+リンパ球)、Bリンパ球、ナチュラルキラー(NK)細胞、相互連結性樹状細胞)、神経細胞(例えば、ニューロン、シュワン細胞、グリア細胞、星状細胞もしくは乏突起膠細胞)、筋細胞(平滑筋細胞および横紋筋細胞)、軟骨細胞、骨細胞とすることができる。幹細胞、前駆細胞、および上記の細胞のいずれかの前駆細胞も関心対象である。さらに、該方法は、本明細書において掲載された細胞のいずれかの悪性型に適用することができる。
【0037】
細胞は任意の組織または臓器、例えば、皮膚、眼、末梢神経系(PNS; 例えば、迷走神経)、中枢神経系(CNS; 例えば、脳または脊髄)、骨格筋、心臓、動脈、静脈、リンパ管、乳房、肺、脾臓、肝臓、膵臓、リンパ節、骨、軟骨、関節、腱、靱帯、胃腸組織(例えば、口、食道、胃、小腸、大腸(例えば、結腸または直腸))、泌尿生殖器系(例えば、腎臓、膀胱、子宮、膣、卵巣、尿管、尿道、前立腺、陰茎、精巣、または陰嚢)のものとすることができる。がん細胞は、これらの臓器および組織のいずれかのものとすることができ、非限定的に、乳がん(本明細書において列挙されたタイプおよび悪性度のいずれか)、結腸がん、前立腺がん、肺がん、膵臓がん、黒色腫を含む。
【0038】
MSDKは細胞のゲノム全部、例えば、細胞全部または細胞の核から抽出された全DNAにて行うことができる。または、それは細胞の一部に対して、例えば、ゲノムの一部を欠いた変異細胞からのDNAの抽出、染色体顕微切断、もしくはサブトラクティブ/ディファレンシャル・ハイブリダイゼーションにより行われてもよい。該方法は二本鎖DNAにて行われ、特に明記しない限り、MSDKについて記述する際、「DNA」という用語は二本鎖DNAをいう。
【0039】
MSDKライブラリーを作製する方法
MSDKの第1段階では、ゲノムDNAをメチル化感受性マッピング制限酵素(MMRE)に曝露する。メチル化感受性マッピング制限酵素は、関連のMMREに対する認識配列を有する部位でDNAを切断する。MMREは任意のMMREとすることができる。真核細胞では、メチル化は一般に、DNA中のCpGジヌクレオチド配列のCヌクレオチドの位置で起こる。「CpG」という用語は、DNA中に生じるジヌクレオチド配列であって、CヌクレオチドおよびCヌクレオチドのすぐ3'側のGヌクレオチドからなるジヌクレオチド配列をいう。「CpG」中の「p」は、CpGジヌクレオチド配列中のCとGヌクレオシド残基間に生じるリン酸基を意味する。
【0040】
MMRE認識配列は、メチル化を受けやすい1つ、2つ、3つ、または4つのC残基を含むことができる。MMRE認識配列中のC残基の1つ(または複数)がメチル化されるなら、MMREは関連のMMRE認識配列の位置でDNAを切断しない。有用なMMREの例としては、非限定的に、AscI、AatII、AciI、AfeI、AgeI、AsisI AvaI、BceAI、BssHI、ClaI、EagI、Hpy99I、MluI、NarI、NotI、SacII、またはZraAIが挙げられる。AscI認識配列はGGCGCGCCであり、したがって2つのメチル化部位(CpG配列)を含む。どちらか一方または両方がメチル化されるなら、その認識配列はAscIによって切断されない。ヒトゲノムあたりおよそ5,000のAscI認識部位が存在する。
【0041】
MMREへのゲノムDNAの曝露は複数の第1の断片をもたらすが、その絶対数は、メチル化されるMMRE認識部位の相対数に依存すると考えられる。メチル化されることが多いほど、それだけ少ない第1の断片が生じると考えられる。第1の断片の大部分はMMRE 5'切断配列(以下の定義を参照のこと)を一方の末端におよびMMRE 3'切断配列(以下の定義を参照のこと)を他方の末端に有すると考えられる。各染色体の場合、一方の末端だけにMMRE切断配列を有する2つの断片が作出されるはずであり、これらの第1の断片は本明細書において末端の第1の断片と呼ばれる。このような、末端の第1の断片の一方が染色体の5'末端を一方の末端におよびMMRE 3'切断配列を他方の末端に含み、他方の、末端の断片が染色体の3'末端を一方の末端におよびMMRE 5'切断配列を他方の末端に含む。
【0042】
本明細書において用いられる場合、制限酵素の認識配列内でDNAを切断する制限酵素の「5'切断配列」は、制限酵素によるDNAの切断によって作出される制限酵素認識配列の3'末端を含有する断片の、5'末端の制限酵素の認識配列の部分である。本明細書において用いられる場合、制限酵素の認識配列内でDNAを切断する制限酵素の「3'切断配列」は、制限酵素によるDNAの切断によって作出される制限酵素認識配列の5'末端を含有する断片の、3'末端の制限酵素の認識配列の部分である。5'および3'切断制限酵素の切断配列は図1に示されている。
【0043】
第1の断片の末端に親和性対の第1のメンバー(概要部の定義を参照のこと)、例えば、ビオチンまたはイミノビオチンを結合させる。これは、例えば、MMRE 5'および3'切断配列を含む末端に結合成分を連結させることで達成することができる。この結合成分は、MMRE 5'切断配列またはMMRE 3'切断配列のいずれかに(例えば、共有結合またはMSDK法の比較的穏やかな化学的条件に耐えうるその他任意の適当な化学結合、例えば、配位結合により)結合された親和性対の第1のメンバーを含む。親和性対の第1のメンバーの、この方法による付着から生じる断片(本明細書において第2の断片と呼ばれる)の大部分は、その両端に親和性対の第1のメンバーが結合していると考えられる。末端の第1の断片から生じる第2の断片はもちろん、一方の末端にだけ親和性対の第1のメンバーを有する、すなわち、MMRE切断配列を含んだ末端を有すると考えられる。
【0044】
結合成分は、任意で、いずれか都合の良い長さ、例えば、1〜100塩基対(bp)、3〜80 bp、5〜70 bp、7〜60 bp、9〜50、または10〜40 bpのリンカー(またはスペーサー)ヌクレオチド配列を含んでもよい。リンカー(またはスペーサー)は、例えば、30、31、32、33、34、35、26、37、38、または40 bp長とすることができる。明らかなように、リンカーは断片化用の制限酵素(以下参照)認識配列を含んではならない。
【0045】
第1の断片の末端に親和性対の第1のメンバーを付着させるために上述の結合成分を使用する代わりに、付着は、当技術分野において公知のさまざまな化学的手段のいずれかによって行うことができる。この場合には、親和性対の第1のメンバーは任意で、第1の断片の末端との親和性対の第1のメンバーの結合を促進する化学官能基を含んでもよい。この「化学的方法」を使うことで、末端の第1の断片の両端に親和性対の第1のメンバーを付着させることが可能であることを理解されたい。当然ながら、化学的方法を使用することで、上述のリンカー(またはスペーサー)ヌクレオチド配列を含めることも可能である。化学官能基が親和性対の第1のメンバーに付着される場合、リンカー(またはスペーサー)ヌクレオチド配列は親和性対の第1のメンバーと化学官能基との間に位置する。
【0046】
第2の断片を次いで、断片化用の制限酵素(FRE)に曝露する。FREは、関心対象のゲノムDNAの中に比較的頻繁に認識配列が現れる任意の制限酵素とすることができる。したがって、4ヌクレオチドの認識配列を有する制限酵素は、FREとして特に望ましい。さらに、FREはメチル化に感受性であるべきではなく、すなわち、少なくとも真核生物DNA中の、その認識配列はCpGジヌクレオチド配列を含むべきではない。好ましくは、FRE認識配列はゲノム中に、MMRE認識配列が現れるよりも少なくとも10倍(例えば、少なくとも20倍; 50倍; 100倍; 500倍; 1,000倍; 2,000倍; 5,000倍; 10,000倍; 25,000倍; 50,000倍; 100,000倍; 200,000倍; 500,000倍; 106倍; または107倍)頻繁に現れるべきである。認識配列が4ヌクレオチドからなる有用なFREの例としては、非限定的に、AluI、BfaI、CviAII、FatI、HpyCH4V、MseI、NlaIII、またはTsp509Iが挙げられる。NlaIIIの認識配列はCATGである。FREへの第2の断片の曝露は多数の断片をもたらすが、その大部分はFRE切断配列をその末端の両方に有し、FRE切断配列(5'または3')を一方の末端におよび親和性対の第1のメンバー(MMRE切断配列に対応する)を他方の末端に有するものは比較的少ないと考えられる。後者の断片は本明細書において第3の断片と呼ばれる。
【0047】
第3の断片を次いで、第3の断片における親和性対の第1のメンバーに対応する親和性対の第2のメンバー(例えば、アビジン、ストレプトアビジン、またはどちらかの機能的断片; その他の有用な第2のメンバーの例としては概要部を参照のこと)が結合された固体基材に曝露する。第3の断片は、親和性対の第1と第2のメンバーとの間の物理的相互作用により、固体基材に結合する。固体基材は、第3の断片が結合でき、したがってその断片を、親和性対の第1のメンバーを含んでいない断片から分離できる、プラスチック(例えば、プラスチック・マイクロタイターウェルもしくはペトリ皿の底)、金属(例えば、磁性金属ビーズ)、アガロース(例えば、アガロースビーズ)、あるいはガラス(例えば、ガラスビーズまたはガラスビーカー、試験管、もしくはフラスコなどのガラス容器の底)などの、任意の不溶性物質とすることができる。
【0048】
固体基材に結合していない断片を混合物から除去する。固体基材は非特異的に結合した任意の材料がないよう任意でリンスされてもまたは洗浄されてもよい。固体基材に結合した第3の断片は、結合した第3の断片と呼ばれる。
【0049】
固体基材に結合していない、結合した第3の断片の末端(本明細書において遊離末端と呼ばれる)を次いで、放出用の制限酵素(RRE) (本明細書においてタグ化酵素と呼ばれることもある)認識配列に結合させる。これは、例えば、遊離末端(FRE 5'または3'切断配列を含む)に、FRE 5'または3'切断配列および、切断配列の5'側に、RRE認識配列を含む放出用の成分を連結させることで達成することができる。RREとして有用な制限酵素は、認識配列から特異的な距離(特定のIIs型制限酵素に依る)でDNAを切断するもの、例えば、非限定的に、IIs型およびII型のものである。有用なRREの例は、以下の非回文構造の認識配列: 5'-TCCPuAC、3'-AGGPyTG (Pu、プリン; Py、ピリミジン)を有しかつTCCPuAc配列下流の20番目のヌクレオチドの後ろでDNAを切断するMmeIである[Boyd et al. (1986) Nucleic Acids Res. 14(13): 5255-5274]。その他の有用なIIs型制限酵素としては、非限定的に、BsnfI、FokI、およびAlwIが挙げられ、有用なIIB型制限酵素としては、非限定的に、BsaXI、CspCI、AloI、PpiI、およびTengsら[(2004) Nucleic Acids Research 32(15):e21(pages1-9)]に掲載されたその他のものが挙げられ、この文献の開示はその全体が参照により本明細書に組み入れられる。
【0050】
放出用の成分は任意で、RRE認識配列のすぐ5'側に、伸長用の配列としてさらなるヌクレオチドを含んでもよい。伸長用の配列はいずれか都合の良い長さ、例えば、1〜100 bp、3〜80 bp、5〜70 bp、7〜60 bp、9〜50、または10〜40 bpのものとすることができる。伸長用の配列は、例えば、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、26、37、38、または40 bp長とすることができる。
【0051】
結合した第3の断片の遊離末端へのRRE認識配列の結合により、結合した第4の断片をもたらす。この断片は(a) RRE認識配列をその遊離末端に有し、および(b) 固体基材に親和性対の第1および第2のメンバーによって結合している。結合した第4の断片を次いでRREに曝露する。これは関連のRREに特有の位置で、結合した第4の断片を切断する。MmeI RREの場合、結合した第4の断片はTCCPuAC認識配列の末端C残基後の20番目のヌクレオチドの下流側で切断される。この曝露は第5の断片のライブラリーの、固体基材からの放出をもたらす。第5の断片の各々は、非メチル化MMRE認識配列に最も近いFRE認識配列を含めて、RRE認識配列(および使われた場合には伸長用の配列)および試験ゲノムDNAの複数のbpを含む。第5の断片における試験ゲノムDNAのこれらのbpの絶対数は、あるRREから他のRREまでさまざまであり、MmeIの場合、20ヌクレオチドである。第5の断片におけるゲノムDNAの配列(しかしFRE認識配列がない)は、本明細書においてMSDKタグと呼ばれる。MmeIおよびNlaIII認識配列は1ヌクレオチドだけ重複するので、MmeIをRREとしておよびNlaIIIをFREとして用い作出されるタグは、17ヌクレオチド長である。
【0052】
RRE認識配列とRREの切断部位との間のbpの数が多くなるほど、それだけMSDKタグは長くなると考えられる。MSDKタグが長くなるほど、関心対象のゲノムにおけるタグ配列の複数の発生による重複性の変化はそれだけ低くなると考えられる。さらに、関心対象のゲノムDNAにおけるFRE認識配列と対応するMMRE認識配列との間のbpの数は、RRE認識配列とRRE切断部位との間のbpの数よりも大きくなるのが最適であることを理解されたい。しかしながら、この判定基準が満たされないことで生じる問題は、親和性対の第1のメンバーを第1の断片の末端に付着させ、適切な長さのリンカー(またはスペーサー)ヌクレオチド配列を結合成分の中に含有させる結合成分法(上記参照)を使用することで未然に防ぐことができる; 分析されるゲノムにおける所与のFRE認識配列と対応するMMRE認識配列との間の距離が短くなるほど、リンカー(またはスペーサー)ヌクレオチド配列はそれだけ長くなる必要があると考えられる。
【0053】
MSDKタグライブラリーを使用する方法
上記のように作出されたMSDKライブラリーは、さまざまな目的に使用することができる。
【0054】
そのような方法の大部分における第1の段階は、ライブラリーの作製で得られた可能な限り多くのMSDKタグのヌクレオチド配列を少なくとも同定することである。これを行うことができる方法は数多く存在しており、それらは当業者に明らかであると思われる。例えば、アレイ技術またはMPSS (大量並行特徴配列決定; massively parallel signature sequencing)法をこの目的に利用することができると考えられる。または、MSDKタグを含んだ第5の断片(上記参照)を配列決定用のベクター(例えば、プラスミド)にクローニングし、標準的な配列決定技術、好ましくは自動配列決定技術によって配列決定してもよい。
【0055】
本発明者らは、遺伝子発現の逐次分析(SAGE)技術[Porter et al. (2001) Cancer Res. 61:5697-5702; Krop et al. (2001) Proc. Natl. Acad. Sci. U.S.A 98:9796-9801; Lal et al. (1999) Cancer Res. 59:5403-5407; およびBoon. et al. (2002) Proc. Natl. Acad. Sci. U.S.A. 99:11287-11292]から適合されたMSDKタグ配列の同定のための技術を使用した(以下の実施例1を参照のこと)。この適合された技術は以下の段階を含む:
(a) DNAリガーゼ酵素を第5の断片のライブラリーに加え、それによりRRE由来の付着末端を有する第5の断片の対を一緒に連結させて、第5の断片の二量体(本明細書において「ジタグ」とも呼ばれる)を形成させる段階;
(b) 放出用の成分に由来する伸長用配列(上記参照)におけるヌクレオチド配列に配列が対応するプライマーを用いたPCRにより、個々のジタグの数を増大させる段階;
(c) PCR増幅されたジタグを、MSDKライブラリーを作出するのに使われたFREで消化し、それによってRRE部位および伸長用配列(使われた場合)を欠く消化されたジタグを作出する段階;
(d) リガーゼ酵素(例えば、T4リガーゼ)を用いジタグを重合させて、ジタグ多量体を作製する段階;
(e) ジタグ多量体を配列決定用のベクターにクローニングし、挿入断片を(例えば、自動配列決定法により)配列決定する段階; ならびに
(f) 個々のMSDKタグの配列をジタグ多量体の配列から推定する段階。
【0056】
当業者は自身の特定の要件に対して上記のタグ同定手順を改変し、適合させる方法を当然ながら承知していると思われる。例えば、1つまたは複数の段階(例えば、段階(b)、つまりジタグ増幅段階または段階(c)、つまり使われたRRE認識部位および任意の伸長用配列を除去する段階)を除外することができると考えられる。
【0057】
MSDKタグの一部または全部の配列が得られたら、遂行できる分析がいくつか存在する。
【0058】
MSDKタグの計数
MSDKライブラリーにおける各タグ、またはタグの部分群の数をコンピュータで計算することができる。ひいては、例えば、得られたクローンタグ配列の総数に対して各々の数を任意で規準化してもよく、得られたMSDKプロファイル(MSDKタグのリストおよび各MSDKタグの存在量(数)からなる)を、関心対象の他の細胞で得られた対応のMSDKプロファイルと比べることができる。個々のMSDKタグの総数をコンピュータで計算する際に、ジタグがPCRによって増幅されている(上記段階(b))場合、ジタグ複製物を分析から取り除く。上記段階(a)の結果としていずれか1つのジタグの組み合わせが何度も生じる見込みは極端に低いと思われるので、複製したジタグはPCR増幅手順による可能性が高いと思われる。個々のタグ配列の数を推定する方法は、タグ配列を同定するための上記の同一法を含む。
【0059】
得られる所与のMSDKタグの相対存在量(数)は、所与のタグと関係するFRE認識配列に最も近いMMRE認識配列がメチル化されていない相対頻度の目安になる。得られるMSDKタグの数が大きくなるほど、MMRE認識配列がメチル化されていない頻度は高くなる。この方法の性質により、所与のMMRE認識配列はその上流の一番近くのFRE認識配列と、およびその下流の一番近くのFRE認識配列と相関するので、任意の2つのMMRE認識部位がそれらの間の適切なFRE認識部位なしで現れるなら、MMRE認識部位の両方のメチル化状態(メチル化されるまたはメチル化されず)を識別することが常に可能であると考えられる。その一方で、3つのMMRE認識部位が第1および第3の部位の間のFRE認識配列なしで現れるなら、中央のMMRE認識配列のメチル化状態を識別することは可能ではない場合がある。しかしながら、選択のMMREよりもはるかに高い頻度で関心対象のゲノムDNAに現れる認識配列を有するFREを選択することにより、この発生の機会を本質的にゼロにまで減らすことができる。実際、分析の前に、関心対象のゲノムの配列は一般に公知であるので、この潜在的な解決を損なう事態を前もって検証し、ゲノムのヌクレオチド配列を調べることで克服することが可能であり、必要なら、代替的なMMRE-FREの組み合わせが選択されてもよく、またはいくつかの異なるMMRE-FREの組み合わせを用いて複数回の分析が行われてもよい。
【0060】
MSDKタグプロファイルはMSDK分析で得られる全てのタグ配列で構成されており、好ましくは(しかし必ずというわけではない)全てのMSDKタグの相対数を、その他の細胞型で得られる対応のプロファイルと比較することができる。対応のプロファイルは、もちろん、同じMMRE、FRE、およびRREを用いて作出されるものであり、関連ゲノムの、同一部分ではないにせよ、少なくとも重複部内であると考えられる。そのような比較は、例えば、関心対象の試験細胞を特定するために使用することができる。例えば、試験細胞はx型、y型、またはz型の細胞とすることができると考えられる。試験細胞で得られたMSDKプロファイルを、x型、y型、およびz型の対照細胞から得られた対照の対応MSDKプロファイルと比較することができる。試験細胞は、試験細胞のプロファイルが最も酷似している対照細胞(x型、y型、またはz型)のそのMSDKプロファイルと同じ型のものであるか、または少なくとも最も密接に関連する可能性が高いと考えられる。または、試験細胞のMSDKプロファイルは単一の対照細胞のものと比較することができ、試験細胞のプロファイルが対照細胞のプロファイルのものとはかなり異なっているなら、対照の細胞型とは異なる型のものである可能性が高い。上記の分析を行うための統計的方法は当業者に公知である。
【0061】
所与のMSDKタグプロファイルにおけるMSDKタグ種の数は、利用可能な数およびその相対識別能に応じて大きく異なる。実際に、特定のMSDKタグが関心対象の2つの細胞型の間で特異的に識別可能である場合、MSDKタグプロファイルはそれを単独で含んでもよい。したがって、MSDKタグプロファイルはわずか1つのMSDKタグを含んでもよい。しかしながら、それらは複数の異なるMSDKタグ、例えば、少なくとも2; 3; 4; 5; 6; 7; 8; 9, 10; 12; 15; 20; 25; 30; 35; 40; 50; 60; 75; 85; 100; 120; 140; 160; 180; 200; 250; 300; 350; 400; 450; 500; 600; 700; 800; 900; 1,000; 2,000; 5,000; 10,000; または場合によりそれ以上のタグ種を一般に含むと考えられる。
【0062】
上記の分析において比較できる「細胞型」の範囲は、もちろん、非常に大きい。したがって、例えば、試験細菌のMSDKプロファイルを、(その属は公知であるが、その種が規定されなければならないなら)試験細菌と同じ属のさまざまな種の細菌の対照MSDKプロファイルと、(その種は公知であるが、その菌株が規定されなければならないなら)試験細菌と同じ種のさまざまな菌株の細菌の対照MSDKプロファイルと、または場合により(試験細菌の菌株は公知であるが、その生態学的起源が公知でないなら)試験細菌と同じ菌株の、しかし、例えば、さまざまな生態的ニッチ由来のさまざまな分離株の細菌の対照MSDKプロファイルと比較することができる。同じ原理を任意の生体細胞におよび生体細胞の任意の種分化レベルに適用することができる。同様に、真核生物の(例えば、哺乳動物の)試験細胞のMSDKプロファイルをさまざまな組織の、さまざまな発生期の、およびさまざまな系統の対照試験細胞の対応MSDKプロファイルと比較することができる。さらに、試験脊椎動物細胞のMSDKプロファイルを、試験細胞が悪性細胞であるかどうかを判定する(診断する)ため、正常または悪性である(例えば、試験細胞と同じ組織の)細胞の1つまたは複数の対照MSDKプロファイルと比較することができる。さらに、がん試験細胞のMSDKプロファイルを、試験細胞の組織起源を規定するため、さまざまな組織のがんの1つまたは複数の対照MSDKプロファイルと比較することができる。さらに、試験細胞のMSDKプロファイルを、試験細胞と同一でありうる、または試験細胞と同類でありうるあるいは場合により試験細胞と異なりうるが、多数の実験的または自然的影響のいずれか、例えば、薬物、サイトカイン、増殖因子、ホルモン、またはその他任意の薬剤もしくは生物剤、物理的影響(例えば、上昇したおよび/もしくは低下した温度もしくは圧力)、または環境条件(例えば、日照りもしくはモンスーン条件)に曝露されたまたは供された対照試験細胞のものと比較することができる。したがって、「細胞型」という用語は多種多様な細胞を網羅することや、任意の特定の分析において使用または規定されるものは、行われる分析の性質に依ることを理解されたい。当業者は関心対象の分析に適した対照細胞型を選択することができると考えられる。
【0063】
対照の試験プロファイルとして有用なMSDKプロファイルの例が本明細書において示されている。したがって、例えば、ヒト被験者由来の試験乳房細胞(例えば、上皮細胞、筋上皮細胞、または線維芽細胞)のMSDKプロファイルを、試験乳房細胞が得られた試験乳房組織ががん性の乳房組織であるかどうかを確定するため、対照の健常被験者および対照の乳がん(例えば、DCISまたは浸潤性乳がん)被験者の両者由来の乳房上皮細胞、筋上皮細胞、および線維芽細胞を多く含む間質細胞のMSDKプロファイルと比較することができると考えられる。さらに、試験がん細胞のMSDKプロファイルを分析の一環として対照の乳房、前立腺、結腸、肺、および膵臓がん細胞のものと比較して、試験がん細胞の組織を確定することができる。さらに、上皮または筋上皮細胞のいずれかであると疑われる細胞のMSDKプロファイルを、試験細胞が上皮または筋上皮細胞であるかどうかを確定するため、対照の正常の(および/またはがんの、試験細胞が正常であるか、がんであるか、または正常もしくはがんであることが確定されていないかどうかによるが)上皮および筋上皮細胞のものと比較することができる。
【0064】
MMRE認識配列のマッピング
あるいは、またはMSDKタグの計数化に加えて、MSDK分析によって得られるタグが同定されたら、関心対象のゲノム(またはゲノムの一部)のヌクレオチド配列とのタグ配列の比較によって、タグに対応する関心対象のゲノムでの位置(本明細書において「ゲノムタグ配列」と呼ばれる)を確定することができる。これは手動で行われてもよいが、コンピュータで行われることが好ましい。関連するゲノム配列情報は媒体(例えば、フロッピーディスク、CD ROM、もしくはDVD)からコンピュータにロードされてもよく、またはその情報は公的に入手可能なインターネットデータベースからダウンロードされてもよい。
【0065】
ゲノムタグ配列を同定できる方法の1つは、以下の情報: (a) 関心対象のゲノム(またはゲノムの一部)のヌクレオチド配列; (b) MMRE認識配列のヌクレオチド配列; (c) FRE認識配列のヌクレオチド配列; および(d) RRE認識配列をRRE切断部位から分離するヌクレオチド数を用いて「仮想」タグライブラリーを最初に作製することによるものである。固有ではない(すなわち、複数の遺伝子座からMSDKライブラリーに現れうる)仮想タグ配列は、仮想MSDKライブラリーから取り除かれることが最適である。試験MSDK分析において得られたタグの配列を仮想タグライブラリーと比較することにより、関心対象のMSDKタグの、例えば、分析により得られたタグ全てのまたはそのようなタグの1つもしくは複数のゲノム遺伝子座を判定することが可能である。
【0066】
ゲノムタグ配列のゲノム遺伝子座が得られたら、ゲノムタグ配列が位置する、または近くに位置する遺伝子を同定するのは簡単なことである。この段階は手動で行うことができるが、コンピュータで行うこともできる。そのような遺伝子をさらなる分析、例えば、下記の分析の対象とすることができる。
【0067】
DNAメチル化のレベルを判定する方法
本発明は、関心対象のゲノム領域(例えば、遺伝子または遺伝子の小領域)のメチル化のレベルを評価する方法を特徴とする。この方法は、上記のMSDK分析によって同定されたまたはその他任意の基準で、例えば、関心対象の2つの細胞型(例えば、正常細胞および正常細胞と同じ組織のがん細胞)における遺伝子の差次的発現の観測で選択されたゲノム領域に適用することができる。
【0068】
該方法はがんの診断において特に関心対象である。大まかには、がん細胞のゲノムは、対応する正常細胞に比べて低メチル化されていることが主張されている[Feinberg et al. (1983) Nature 301:89-92]。さらに、遺伝子の高メチル化は関連遺伝子の発現低下と関係することが多い。しかしながら、個々の遺伝子レベルでは、これらの一般化は当てはまらない。したがって、例えば、遺伝子のなかにはがん細胞において対応の正常細胞と比較して高メチル化されうるものもあり、一部の遺伝子の高メチル化は発現増加と関係しており、一部の遺伝子の低メチル化は関連遺伝子の発現低下と関係している。興味深いことに、以下の例のなかで、1つの遺伝子(Cxorf12)のプロモーター領域の高メチル化は遺伝子の発現低下と関係しているが、その他3つの遺伝子(PRDM14、HOXD4、およびCDC42EP5)のエクソンおよび/またはイントロンの高メチル化は遺伝子の発現増加と関係していることが認められた。
【0069】
本明細書において用いられる場合、「遺伝子」という用語は、転写開始部位の5'側10 kb (キロベース)で始まり、ゲノム領域内のコード配列と関係するポリAシグナルの3'側2 kbで終わるゲノム領域をいう。別の遺伝子のポリAシグナルが関心対象の遺伝子の転写開始部位の5'側10 kb未満に位置する場合、本発明の目的のため、関心対象の遺伝子は他の遺伝子のポリAシグナル直後の最初のヌクレオチドで始まると見なされる。さらに、別の遺伝子の転写開始部位が関心対象の遺伝子のポリAシグナルの3'側2 kb未満にある場合、本発明の目的のため、関心対象の遺伝子は他の遺伝子の転写開始部位の直前のヌクレオチドで終わる。これらの定義から、本明細書において用いられる場合、プロモーター領域および隣接遺伝子のポリAシグナルの3'側領域は重複しうることを理解されたい。
【0070】
本明細書において用いられる場合、遺伝子の「プロモーター領域」とは、転写開始部位の5'側10 kbで始まり、転写開始部位のすぐ5'側のヌクレオチドで終わるゲノム領域をいう。別の遺伝子のポリAシグナルが関心対象の遺伝子の転写開始部位の5'側10 kb未満に位置する場合、本発明の目的のため、関心対象の遺伝子のプロモーター領域は他の遺伝子のポリAシグナル直後の最初のヌクレオチドで始まる。
【0071】
本明細書において用いられる場合、「エクソン」および「イントロン」という用語は、遺伝子の転写開始部位とポリA配列の開始点との間に存在する、それぞれ、アミノ酸をコードするヌクレオチド配列およびアミノ酸をコードしないヌクレオチド配列をいう。
【0072】
本明細書において用いられる場合、「CpG島」とは、CpGジヌクレオチド配列の数が関連ゲノムにおけるその平均的頻度よりもかなり高い、ゲノムDNAの配列である。一般に、CpG島は2,000 bp長よりも大きくはない(例えば、1,900; 1,800; 1,700; 1,600; 1,500; 1,400; 1,300; 1,200; 1,100; 1,000; 900; 800; 700; 600; 500; 400; 300; 200; 100; 75; 50; 25; または15 bp長よりも大きくはない)。それらは一般に、DNA配列中において100 bpごとに(例えば、90; 80; 70; 60; 50; 40; 35; 30; 25; 20; 15; 10; または5 bpごとに) 1つ以上のCpG配列を含むと考えられる。CpG島は少なくとも20 (すなわち、少なくとも20; 35; 50; 60; 80; 100; 150; 200; 250; 300; 350; または500) bpのゲノムDNAによって分離されうる。
【0073】
本発明の方法では、試験細胞の遺伝子中の(CpG配列中の) 1つまたは複数のC残基のメチル化の程度を判定する。このメチル化の程度を次いで、1つまたは複数(例えば、2、3、4、5、6、7、8、9、10、11、12、15、18、20、25、30、35、40、50、75、100、200、またはそれ以上)の対照細胞でのものと比べることができる。
【0074】
試験細胞におけるメチル化のレベルが、例えば、対照細胞のものと比べて変化しているなら、試験細胞は対照細胞とは異なる可能性が高い。例えば、試験細胞は本明細書において列挙されている脊椎動物組織のいずれか由来の細胞とすることができ、対照細胞はその組織の正常のものとすることができ、遺伝子は正常組織に対してがん組織の細胞において差次的にメチル化されるいずれか1つ(例えば、表2、5、7、8、10、12および15に列挙されている遺伝子のいずれか)とすることができる。試験細胞における遺伝子のメチル化の程度が正常細胞でのものと異なるなら、試験細胞はがん細胞である可能性が高い。
【0075】
または、試験細胞におけるメチル化のレベルを2つより以上(上記参照)の対照細胞でのものと比較してもよい。この細胞は、メチル化の程度が試験細胞のものと同じであるか、または最も酷似している対照細胞と同じであるか、または最も近縁の種であると考えられる。
【0076】
遺伝子の全部または遺伝子の一部(例えば、プロモーター領域、転写領域、翻訳領域、エクソン、イントロン、および/またはCpG島)を分析することができる。
【0077】
試験および対照細胞は、MSDKの項のなかで先に挙げられたものと同じとすることができる。分析できる遺伝子は、関心対象の2つまたはそれ以上の細胞型において差次的にメチル化される任意の遺伝子とすることができる。本発明の方法では、関心対象の試験細胞を特徴付けるため、任意の数の遺伝子を分析することができる。したがって、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、22、25、28、30、35、40、45、50、60、70、80、80、100、200、500、または場合によりそれ以上の遺伝子を分析することができる。遺伝子は、例えば、表2、5、7、8、10、12、15、および16に列挙されているDNA配列(例えば、遺伝子)のいずれかとすることができる。全遺伝子または遺伝子の1つより以上の小領域(例えば、プロモーター領域の全部または一部、転写領域の全部または一部、エクソン、イントロン、およびポリAシグナルの3'側領域)を分析することができる。
【0078】
関心対象の特異的遺伝子としては、例えば、LMX-14、COL5A、LHX3、TCF7L1、PRDM14、ZCCHC14、HOXD4、SLC9A3R1、CDC42EP5、Cxorf12、LOC389333、SOX13、SLC9A3R1、FNDC1、FOXC1、PACAP、DDN、CDC42EP5、LHX1、およびHOXA10遺伝子が挙げられる。
【0079】
例えば、乳房組織由来の試験上皮細胞が正常またはがん性の上皮細胞(例えば、DCIS(高、中、もしくは低悪性度)細胞または浸潤性乳がん細胞)であるかどうかを判定するため、これらのDNA配列(例えば、遺伝子)の1つまたは複数のメチル化レベルを使用することができる。そのような判定に特に有用なのはPRDM14およびZCCHC14遺伝子である。例えば、PRDM14遺伝子に関して、これらの細胞型を識別するため、SEQ ID NO:1 (図6A)の全部もしくは一部であるまたはそれらを含む遺伝子セグメントを分析することができる。この目的で特に関心対象となるのは、SEQ ID NO:1のヌクレオチド番号8〜17; 341〜392; 371〜426; または391〜405を含むヌクレオチド配列である。例えば、膵臓、肺、または前立腺由来の試験細胞ががん細胞または正常細胞であるかどうかを判定するため、PRDM14のメチル化を同様に使用することができる。さらに、ZCCHC14遺伝子に関して、これらの細胞型を識別するため、SEQ ID NO:2 (図17)の全部もしくは一部であるまたはそれらを含む遺伝子セグメントを分析することができる。この目的で特に関心対象となるのは、SEQ ID NO:2のヌクレオチド番号154〜236; 154〜279; 154〜293; または154〜299を含むヌクレオチド配列である。これらの遺伝子の高メチル化、および特にそれらのコード領域の高メチル化は、関連する試験細胞ががん細胞であることを示唆すると考えられる。
【0080】
さらに、例えば、結腸組織由来の試験上皮細胞が正常またはがん性の上皮細胞であるかどうかを判定するため、上記の遺伝子の1つまたは複数のメチル化レベルを使用することができる。そのような判定に特に有用なのはLHX3、TCF7L1、およびLMX-1A遺伝子である。例えば、LHX3遺伝子に関して、これらの細胞型を識別するため、SEQ ID NO:3 (図6A)の全部もしくは一部であるまたはそれらを含む遺伝子セグメントを分析することができる。この目的で特に関心対象となるのは、SEQ ID NO:3のヌクレオチド番号667〜778; 739〜788; 918〜931; または885〜903を含むヌクレオチド配列である。さらに、例えば、TCF7L1遺伝子に関して、これらの細胞型を識別するため、SEQ ID NO:4 (図8A)の全部もしくは一部であるまたはそれらを含む遺伝子セグメントを分析することができる。この目的で特に関心対象となるのは、SEQ ID NO:4のヌクレオチド番号708〜737; 761〜780; 807〜864; または914〜929を含むヌクレオチド配列である。さらに、例えば、LMX-1A遺伝子に関して、これらの細胞型を識別するため、SEQ ID NO:5 (図7A)の全部もしくは一部であるまたはそれらを含む遺伝子セグメントを分析することができる。この目的で特に関心対象となるのは、SEQ ID NO:5のヌクレオチド番号849〜878; 898〜940; 948〜999; または1,020〜1039を含むヌクレオチド配列である。これらの遺伝子の高メチル化は、試験細胞ががん性の結腸上皮細胞であることを示唆すると考えられる。
【0081】
さらに、例えば、試験筋上皮細胞が得られる乳房組織が正常またはがん性の乳房組織であるかどうかを判定するため、上記の遺伝子のメチル化レベルを分析することができる。そのような判定に特に有用なのはHOXD4、SLC9A3R1、およびCDC42EP5遺伝子である。例えば、HOXD4遺伝子に関して、これらの細胞型を識別するため、SEQ ID NO:6 (図18A)の全部もしくは一部であるまたはそれらを含む遺伝子セグメントを分析することができる。この目的で特に関心対象となるのは、SEQ ID NO:6のヌクレオチド番号185〜255; 288〜313; 312〜362; または328〜362を含むヌクレオチド配列である。さらに、例えば、SLC9A3R1遺伝子に関して、これらの細胞型を識別するため、SEQ ID NO:7 (図19A)の全部もしくは一部であるまたはそれらを含む遺伝子セグメントを分析することができる。この目的で特に関心対象となるのは、SEQ ID NO:7のヌクレオチド番号104〜126; 104〜247; 104〜283; または246〜283を含むヌクレオチド配列である。さらに、例えば、CDC42EP5遺伝子に関して、これらの細胞型を識別するため、SEQ ID NO:8 (図21A)の全部もしくは一部であるまたはそれらを含む遺伝子セグメントを分析することができる。この目的で特に関心対象となるのは、SEQ ID NO:8のヌクレオチド番号181〜247; 282〜328; 336〜359; または336〜390を含むヌクレオチド配列である。これらの遺伝子、および特にそれらのコード領域の高メチル化は、試験筋上皮細胞ががん性の乳房組織由来であることを示唆すると考えられる。
【0082】
例えば、試験線維芽細胞が得られる乳房組織が正常またはがん性の乳房組織であるかどうかを判定するため、上記の遺伝子のメチル化レベルを分析することもできる。そのような判定に特に有用なのはCxorf12遺伝子である。例えば、これらの遺伝子のどちらかに関して、これらの細胞型を識別するため、SEQ ID NO:9 (図22A)の全部もしくは一部であるまたはそれらを含む遺伝子セグメントを分析することができる。この目的で特に関心対象となるのは、SEQ ID NO:9のヌクレオチド番号120〜134; 159〜201; 206〜247; または293〜313を含むヌクレオチド配列である。これらの遺伝子、および特にそれらのプロモーター領域の高メチル化は、試験線維芽細胞ががん性の乳房組織由来であることを示唆すると考えられる。
【0083】
さらに、例えば、試験細胞が上皮細胞または筋上皮細胞であるかどうかを判定するため、上記の遺伝子のメチル化レベルを分析することもできる。そのようなアッセイ法を正常細胞にもがん性細胞にも適用することができる。そのような判定に特に有用なのはLOC389333およびCDC42EP5遺伝子である。例えば、LOC389333遺伝子に関して、これらの細胞型を識別するため、SEQ ID NO:10 (図20A)の全部もしくは一部であるまたはそれらを含む遺伝子セグメントを分析することができる。この目的で特に関心対象となるのは、SEQ ID NO:10のヌクレオチド番号306〜330; 334〜361; 373〜407; または415〜484を含むヌクレオチド配列である。CDC42EP5遺伝子に関して、分析できる遺伝子セグメントの例は、試験筋上皮細胞が得られた組織が正常またはがん性かどうかを識別するための上記のものが挙げられる。これらの遺伝子のメチル化のレベルがかなり高いことで、試験細胞が筋上皮細胞ではなく上皮細胞であることが示唆されると考えられる。
【0084】
さらに、例えば、試験細胞が幹細胞、または上皮細胞もしくは筋上皮細胞などの、それに由来する分化細胞であるかどうかを判定するため、上記の遺伝子のメチル化レベルを分析することもできる。そのようなアッセイ法を正常細胞にもがん性細胞にも適用することができる。そのような判定に特に有用なのはSOX13、SLC9A3R1、FNDC1、FOXC1、PACAP、DDN、CDC42EP5、LHX1、およびHOXA10遺伝子である。例えば、FOXC1遺伝子に関して、これらの細胞型を識別するため、SEQ ID NO:12 (図27A)の全部もしくは一部であるまたはそれらを含む遺伝子セグメントを分析することができる。場合によっては、これらの遺伝子のいくつかのメチル化のレベルがかなり高いことで、試験細胞が幹細胞に由来する分化細胞(例えば、上皮細胞または筋上皮細胞)ではなく幹細胞であることが示唆されると考えられる。
【0085】
関心対象のC残基のメチル化のレベルは、定量的な、半定量的な、または定性的な形式で評価され表現されてもよい。したがって、それらは、例えば、不連続的な値として測定され表現されてもよい。または、それらは当技術分野において公知のさまざまな半定量系/定性系のいずれかを用いて評価され表現されてもよい。したがって、それらは、例えば、(a) 「非常に高い」、「高い」、「平均」、「適度」、「低い」および/または「非常に低い」の1つまたは複数として; (b) 「++++」、「+++」、「++」、「+」、「+/-」、および/または「-」の1つまたは複数として; (c) メチル化されているまたはメチル化されていないとして(すなわち、デジタル形式で); (d) 「0%〜10%」、「11%〜20%」、「21%〜30%」、「31%〜40%」などのような範囲(または好都合な任意の範囲間隔)として; (e) グラフで、例えば、円グラフで表現されてもよい。
【0086】
CpG配列におけるC残基のメチル化の程度を測定する方法は、当技術分野において公知である。そのような方法論は重亜硫酸ナトリウム処理DNAの配列決定およびメチル化特異的PCRを含み、以下の実施例に記述されている。
【0087】
関心対象の細胞型を識別するメチル化アッセイ法の標準化には、当業者にとってすっかり普通のおよび日常的な実験が必要になる。例えば、1人または複数人の患者から得られた関心対象のがん細胞サンプルにおける、および健常人由来のまたは同じ患者由来の対応する正常細胞における遺伝子Qのメチル化状態を評価することができる。このような実験から、遺伝子Qのメチル化の「正常レベル」の範囲およびメチル化の「がんレベル」の範囲を確立することが可能であると考えられる。または、各患者のがん細胞における遺伝子Qのメチル化状態が、同じ患者から得られた(がん細胞に対応する)正常細胞における遺伝子Qのメチル化状態と比較されてもよい。このようなアッセイ法では、わずか1個のシトシン残基のメチル化によってがん細胞と非がん細胞を識別できる可能性がある。
【0088】
DNAのメチル化を定量化するその他の方法は、当技術分野において公知である。そのような方法は(a) 1つまたは複数のメチル化CpG部位を含む配列をメチル化感受性制限酵素が切断できないこと[Issa et al. (1994) Nat. Genet. 7:536-540; Singer-Sam et al. (1990) Mol. Cell. Biol. 10:4987-4989; Razin et al. (1991) Microbiol. Rev. 55:451-458; Stoger et al. (1993) Cell 73:61-71]; ならびに(b) シトシンをウラシルに変換する重亜硫酸塩の能力およびメチル化シトシンに対する重亜硫酸塩のこの能力の欠如[Frommer et al. (1992) Proc. Natl. Acad. Sci. USA 89:1827-1831; Myohanen et al. (1994) DNA Sequence 5:1-8; Herman et al. (1996) Proc. Natl. Acad. Sci. USA 93:9821-9826; Gonzalgo et al. (1997) Nucleic Acids Res. 25:2529-2531; Sadri et al. (1996) Nucleic Acids Res. 24:5058-5059; Xiong et al. (1997) Nucleic Acids Res. 25:2532-2534]に基づいている。
【0089】
遺伝子発現アッセイ法
本明細書の実施例に記述されている実験から、遺伝子のメチル化が第2の細胞に比べて変化する(増加するまたは減少する)第1の細胞では、第1の細胞における遺伝子の発現も第2の細胞に比べて変化することが明らかである。さらに、以前の所見および実施例のデータから、ある種の遺伝子の、メチル化状態の変化、よって同様に結果的な発現変化が細胞の表現型の変化と相関することが示唆される。これらの所見によって、2つまたはそれ以上の細胞型を識別するアッセイ法(例えば、診断アッセイ法)の根拠が得られる。
【0090】
本発明の方法では、試験細胞の遺伝子の発現レベルを判定する。この発現レベルを次いで、1つまたは複数(例えば、2、3、4、5、6、7、8、9、10、11、12、15、18、20、25、30、35、40、50、75、100、200、またはそれ以上)の対照細胞でのものと比較することができる。
【0091】
試験細胞における発現のレベルが、例えば、対照細胞のものと比べて変化しているなら、試験細胞は対照細胞とは異なる可能性が高い。例えば、試験細胞は本明細書において列挙されている脊椎動物組織のいずれか由来の細胞とすることができ、対照細胞はその組織の正常細胞とすることができ、遺伝子はがん組織および正常組織由来の細胞において差次的にメチル化されることが明らかなもの(例えば、表2、5、7、8、10、12、15および16に列挙されている遺伝子のいずれか)とすることができる。試験細胞における遺伝子の発現のレベルが正常細胞でのものと異なるなら、試験細胞はがん細胞である可能性が高い。
【0092】
または、試験細胞における発現のレベルを2つより以上(上記参照)の対照細胞でのものと比較してもよい。この細胞は、発現のレベルが試験細胞のものと同じであるか、または最も酷似している対照細胞と同じであるか、または最も近縁の種であると考えられる。
【0093】
試験および対照細胞は、MSDKの項のなかで先に挙げられたもののいずれかとすることができる。発現のレベルを判定できる遺伝子は、関心対象の2つより以上の細胞型において差次的にメチル化される任意の遺伝子とすることができる。これは、例えば、表2、5、7、8、10、12、15、および16に列挙されている遺伝子のいずれかとすることができる。
【0094】
関心対象の特異的遺伝子としては、LMX-14、COL5A、LHX3、TCF7L1、PRDM14、ZCCHC14、HOXD4、SOX13、SLC9A3R1、CDC42EP5、Cxorf12、およびLOC389333遺伝子が挙げられる。
【0095】
例えば、乳房組織由来の試験上皮細胞が正常またはがん性の上皮細胞(例えば、DCIS(高、中、もしくは低悪性度)細胞または浸潤性乳がん細胞)であるかどうかを判定するため、これらの遺伝子の1つまたは複数の発現レベルを分析することができる。そのような判定に特に有用なのはPRDM14およびZCCHC14遺伝子である。さらに、前立腺、膵臓、または肺組織由来の試験細胞ががん細胞であるかどうかを試験するため、PRDM14の発現を使用することができる。したがって、例えば、対照の正常な乳房上皮細胞と比較して試験乳房上皮細胞における、PRDM14遺伝子の発現の増強、またはZCCHC14遺伝子の発現の変化は、試験上皮細胞ががん細胞であるという徴候になると考えられる。
【0096】
さらに、例えば、結腸組織由来の試験上皮細胞が正常またはがん性の上皮細胞であるかどうかを判定するため、上記の遺伝子の1つまたは複数の発現レベルを分析することができる。そのような判定に特に有用なのはLHX3、TCF7L1、およびLMX-1A遺伝子である。対照の正常な結腸上皮細胞と比較して試験結腸上皮細胞におけるこれらの遺伝子の発現の変化は、試験結腸上皮細胞ががん細胞であるという徴候になると考えられる。
【0097】
例えば、試験筋上皮細胞が得られた乳房組織が正常またはがん性の乳房組織であるかどうかを判定するため、試験筋上皮細胞における上記の遺伝子の1つまたは複数の発現レベルを分析することができる。そのような判定に特に有用なのはHOXD4、SLC9A3R1、およびCDC42EP5遺伝子である。例えば、対照の正常な乳房組織由来の対照の筋上皮細胞と比較して試験筋上皮細胞における、HOXD4およびCSD42EP5遺伝子の発現の増強、またはSLC9A3R1遺伝子の発現の変化は、試験乳房組織ががん性の乳房組織であることを示唆すると考えられる。
【0098】
例えば、試験線維芽細胞が得られた乳房組織が正常またはがん性の乳房組織であるかどうかを判定するため、試験線維芽細胞における上記の遺伝子の1つまたは複数の発現レベルを分析することもできる。そのような判定に特に有用なのはCxorf12遺伝子である。例えば、対照の正常な乳房組織由来の対照の線維芽細胞においてと同等以上のレベルでのこの遺伝子の発現は、乳房組織ががん性の乳房組織ではないことを示唆すると考えられる。
【0099】
さらに、例えば、試験細胞が上皮細胞または筋上皮細胞であるかどうかを判定するため、上記の遺伝子の1つまたは複数の発現レベルを分析することもできる。そのようなアッセイ法を正常細胞にもがん性細胞にも適用することができる。そのような判定に特に有用なのはLOC389333およびCDC42EP5遺伝子である。対照の筋上皮細胞のものと同じまたは類似したレベルでの試験細胞におけるこれらの遺伝子の発現は、試験細胞が筋上皮細胞であるという徴候になると考えられる。その一方で、対照の上皮細胞のものと同じまたは類似したレベルでの試験細胞におけるこれらの遺伝子の発現は、試験細胞が上皮細胞であるという徴候になると考えられる。
【0100】
関心対象の遺伝子の発現のレベルは、定量的な、半定量的な、または定性的な形式で評価され表現されてもよい。したがって、それらは、例えば、不連続的な値として測定され表現されてもよい。または、それらは当技術分野において公知のさまざまな半定量系/定性系のいずれかを用いて評価され表現されてもよい。したがって、それらは、例えば、(a) 「非常に高い」、「高い」、「平均」、「適度」、「低い」および/もしくは「非常に低い」の1つもしくは複数として; (b) 「++++」、「+++」、「++」、「+」、「+/-」、および/もしくは「-」の1つもしくは複数として; (c) 発現されているもしくは発現されていないとして(すなわち、デジタル形式で); (d) 「0%〜10%」、「11%〜20%」、「21%〜30%」、「31%〜40%」などのような範囲(もしくは好都合な任意の範囲間隔)として; または(e) グラフで、例えば、円グラフで表現されてもよい。
【0101】
以下の記述のなかで、「遺伝子X」とは表2、5、7、8、10、および12に列挙されている遺伝子のいずれかを表し; 遺伝子Xから転写されるmRNAを「mRNA X」と呼び; 遺伝子Xによりコードされるタンパク質を「タンパク質X」と呼び; ならびにmRNA Xから産生されるcDNAを「cDNA X」と呼ぶ。特に明記しない限り、これらの用語を含む記述は、表2、5、7、8、10、12、15および16に列挙されている遺伝子のいずれか、このような遺伝子から転写されるmRNA、このような遺伝子によりコードされるタンパク質、またはそれらのmRNAから産生されるcDNAに当てはまることが理解されると考えられる。
【0102】
本発明のアッセイ法では、(1) 細胞中のタンパク質XもしくはmRNA Xの存在を試験するまたは細胞中のそのレベルを評価するか、(2) 体液(例えば、尿、唾液、精液、血液、または血液から得られる血清もしくは血漿)などの液体サンプル、乳管洗浄液、肺洗浄液、胃洗浄液、直腸もしくは結腸洗浄液、または膣洗浄液などの洗浄液、乳頭吸引液などの吸引液、あるいは細胞培養液由来の上清などの流体の中のタンパク質Xのレベルを評価するかのいずれかである。細胞中のmRNA Xの存在を試験するため、またはそのレベルを測定するため、細胞を溶解することができ、当技術分野において公知のさまざまな方法のいずれかにより溶解物から総RNAを精製または半精製することができる。特定のmRNA転写産物のレベルを検出するまたは測定する方法は同様に、当業者によく知られている。そのようなアッセイ法には、非限定的に、検出可能に標識されたmRNA X特異的なDNAまたはRNAプローブを用いたハイブリダイゼーションアッセイ法、ならびに適切なmRNA XおよびcDNA X特異的なオリゴヌクレオチドプライマーを利用した定量的または半定量的RT-PCR法が含まれる。細胞溶解物中のmRNAを定量化するためのさらなる方法には、RNA保護アッセイ法および遺伝子発現の逐次分析(SAGE)が含まれる。あるいは、例えば、組織切片または非溶解細胞の懸濁液、および検出可能に(例えば、蛍光的にまたは酵素)標識されたDNAまたはRNAプローブを用いて、定性的、定量的、または半定量的インサイチュー・ハイブリダイゼーションアッセイ法が行われてもよい。
【0103】
細胞中の関心対象のタンパク質のレベルを検出するまたは測定する方法は、当技術分野において公知である。そのような方法の多くでは、タンパク質に特異的に結合する抗体(例えば、ポリクローナル抗体またはモノクローナル抗体(mAb))を利用する。そのようなアッセイ法では、抗体それ自体またはその抗体に結合する二次抗体を検出可能に標識することができる。または、抗体にビオチンを結合してもよく、検出可能に標識されたアビジン(ビオチンに結合するタンパク質)を用いて、ビオチン化抗体の存在を検出してもよい。当業者によく知られているこれらの手法(「多層」アッセイ法を含む)の組み合わせを用いて、アッセイの感度を増強させることができる。これらのアッセイ法(例えば、免疫組織学的方法または蛍光フローサイトメトリー)のいくつかを組織切片または非溶解細胞の懸濁液に適用することができる。液体サンプル中のタンパク質Xを検出するための下記の方法を用いて、細胞溶解物中のタンパク質Xを検出することもできる。
【0104】
液体サンプル(上記参照)中のタンパク質Xを検出する方法は基本的に、タンパク質Xに結合する抗体と関心対象のサンプルを接触させる段階およびサンプルの成分との抗体の結合を試験する段階を含む。そのようなアッセイ法では、抗体は検出可能に標識される必要がなく、タンパク質Xに結合する第2の抗体なしに使用することができる。例えば、表面プラズモン共鳴の現象の活用により、適切な固体基材に結合されたタンパク質X特異的抗体をサンプルに曝露する。固体基材の抗体とのタンパク質Xの結合は表面プラズモン共鳴の強度の変化をもたらし、これを適切な機器、例えば、Biacore装置(Biacore International AB, Rapsgatan, Sweden)によって定性的にまたは定量的に検出することができる。
【0105】
さらに、液体サンプル中のタンパク質Xの検出アッセイ法は、例えば、(a) 検出可能に標識されている単一のタンパク質X特異的抗体; (b) 標識されていないタンパク質X特異的抗体および検出可能に標識されている二次抗体; または(c) ビオチン化されているタンパク質X特異的抗体および検出可能に標識されているアビジンの使用を含むことができる。さらに、細胞中のタンパク質の検出について先に述べたように、当業者によく知られているこれらの手法(「多層」アッセイ法を含む)の組み合わせを用いて、アッセイの感度を増強させることができる。これらのアッセイ法では、タンパク質Xを含有するのではないかと疑われるサンプルまたは(サンプルの一定分量)を、例えば、液体サンプルの一定分量の「スポッティング」により、またはサンプルもしくはサンプルの一定分量が電気泳動分離に供された電気泳動ゲルのブロッティングにより、ナイロンまたはニトロセルロース膜などの固体基材に固定化することができる。固体基材上のタンパク質Xの存在または量を次に、タンパク質X特異的抗体の上記形態のいずれかおよび、必要に応じて、適切な、検出可能に標識された二次抗体またはアビジンを用いてアッセイする。
【0106】
本発明は同様に、「サンドイッチ」アッセイ法を特徴とする。これらのサンドイッチアッセイ法では、上記の方法によって固体基材にサンプルを固定化する代わり、固体基材をサンプルに曝露する前に、当技術分野において公知のさまざまな方法のいずれかによって固体基材にタンパク質X特異的な第2の(「捕捉」)抗体(ポリクローナル抗体またはmAb)を結合させることで、サンプル中に存在しうる任意のタンパク質Xを固体基材に固定化することができる。タンパク質X特異的な第2の抗体が結合されている固体基材にサンプルを曝露する際に、サンプル(またはサンプルの一定分量)中の任意のタンパク質Xは、固体基材上のタンパク質X特異的な第2の抗体に結合すると考えられる。結合されているタンパク質X特異的な第2の抗体に結合したタンパク質Xの存在または量を次に、単一のタンパク質X特異的抗体を用いている上記のものと本質的に同じ方法により、タンパク質X特異的な「検出」抗体を用いてアッセイする。これらのサンドイッチアッセイ法では、捕捉抗体は検出抗体と同じエピトープ(またはポリクローナル抗体の場合には一連のエピトープ)に結合するべきではないことが理解されると考えられる。したがって、mAbが捕捉抗体として使用されるなら、検出抗体は、(a) 捕捉mAbが結合するエピトープとは物理的に全く分離しているか、そのエピトープと部分的にだけ重複しているかのいずれかのエピトープに結合する別のmAb; または(b) 捕捉mAbが結合するエピトープ以外のもしくはそのエピトープに加えてのエピトープに結合するポリクローナル抗体のいずれかとすることができる。その一方で、ポリクローナル抗体が捕捉抗体として使用されるなら、検出抗体は、(a) 捕捉ポリクローナル抗体が結合するエピトープのいずれかとは物理的に全く分離しているか、それらのエピトープと部分的に重複しているかのいずれかのエピトープに結合するmAb; または(b) 捕捉ポリクローナル抗体が結合するエピトープ以外のもしくはそのエピトープに加えてのエピトープに結合するポリクローナル抗体のいずれかとすることができる。捕捉および検出抗体の使用を含むアッセイ法としては、サンドイッチELISA法、サンドイッチ・ウエスタンブロッティングアッセイ法、およびサンドイッチ免疫磁性検出アッセイ法が挙げられる。
【0107】
捕捉抗体が結合されうる適当な固体基材は、非限定的に、マイクロタイタープレートのウェルのプラスチックの底面および側面、ナイロンまたはニトロセルロース膜などの膜、重合体(例えば、非限定的に、アガロース、セルロース、またはポリアクリルアミド)のビーズまたは粒子を含む。そのようなビーズまたは粒子に結合したタンパク質X特異的抗体を同様に、タンパク質Xの免疫アフィニティー精製に使用できることに留意されたい。
【0108】
検出可能な標識を検出または定量化する方法は、標識の性質に依存しており、当技術分野において公知である。適切な標識は、非限定的に、放射性核種(例えば、125I、131I、35S、3H、32P、33P、もしくは14C)、蛍光成分(例えば、フルオレセイン、ローダミン、もしくはフィコエリスリン)、発光成分(例えば、Quantum Dot Corporation, Palo Alto, CAによって供給されるQdot (商標)ナノ粒子)、規定の波長の光を吸収する化合物、または酵素(例えば、アルカリホスファターゼもしくは西洋ワサビペルオキシダーゼ)を含む。適切な酵素によって触媒される反応の生成物は、非限定的に、蛍光性、発光性、もしくは放射性とすることができ、またはそれらは可視光もしくは紫外光を吸収してもよい。検出器の例としては、非限定的に、x線フィルム、放射能カウンタ、シンチレーションカウンタ、分光光度計、比色計、蛍光光度計、発光光度計、および濃度計が挙げられる。
【0109】
例えば、乳がんを診断するアッセイ法では、例えば、乳がんを有するのではないかと疑われる、または乳がんを有する危険性がある患者由来の血清(もしくは乳房細胞)中のタンパク質Xのレベルを、対照の被験者(例えば、乳がんを有していない被験者)由来の血清(もしくは乳房細胞)中のタンパク質Xのレベルまたは対照の被験者(例えば、乳がんを有していない被験者)群由来の血清(もしくは乳房細胞)中のタンパク質Xの平均レベルと比較する。対照群の血清(もしくは乳房細胞)中の平均レベルに比べて患者の血清(もしくは乳房細胞)中のタンパク質Xの有意に高いレベル、または低いレベル(関心対象の遺伝子が乳がんまたは関連する間質細胞においてより高いレベルで発現されるかまたはより低いレベルで発現されるかに依る)から、患者が乳がんを有することが示唆されると考えられる。
【0110】
または、患者が乳がんを明らかに有していなかった先の期日に得られた被験者の血清(もしくは乳房細胞)のサンプルを利用できるなら、試験血清(もしくは乳房細胞)サンプル中のタンパク質のレベルを、先に得られたサンプル中のレベルと比較することができる。試験血清(もしくは乳房細胞)サンプル中の、より高いレベル、またはより低いレベル(関心対象の遺伝子が乳がんまたは関連する間質細胞においてより高いレベルで発現されるかまたはより低いレベルで発現されるかに依る)は、患者が乳がんを有するという徴候になると考えられる。
【0111】
さらに、試験細胞(または組織)における遺伝子の試験発現プロファイルを、規定の部類(例えば、DCIS悪性度、乳がん病期、または分化の状態)のものであることが先に確立されている、対照細胞(または組織)の対照発現プロファイルと比較することができる。試験細胞(または組織)の部類は、試験細胞(または組織)の発現プロファイルが最も酷似している対照細胞(または組織)の部類になると考えられる。正常乳房組織のいずれかを、本明細書において列挙されている乳がんのいずれかの病期および/もしくは悪性度と比較するためならびに/または乳がんの悪性度および病期を比較するため、これらの発現プロファイルの比較アッセイ法を使用することができる。分析される遺伝子は、表2、5、7、8、10、12、15、および16に列挙されているもののいずれかとすることができ、分析される遺伝子の数は任意の数、すなわち、1つまたは複数とすることができる。一般に、少なくとも2つ(例えば、少なくとも2; 3; 4; 5; 6; 7; 8; 9; 10; 11; 12; 13; 14; 15; 17; 18; 20; 23; 25; 30; 35; 40; 45; 50; 60; 70; 80; 90; 100; 120; 150; 200; 250; 300; 350; 400; 450; 500; またはそれ以上)の遺伝子を分析することができる。分析される遺伝子は、本明細書において列挙されているものの少なくとも1つを含むが、本明細書において列挙されていない他のものを含むこともできることが理解されると考えられる。
【0112】
この記述から、類似した「試験レベル」対「対照レベル」の比較を他の試験サンプルと本明細書に記述の対照サンプルとの間でいかにして行うことができるかを当業者は理解すると思われる。
【0113】
上記の患者および対照被験者がヒト患者である必要はないことに留意されたい。それらは例えば、ヒト以外の霊長類(例えば、サル)、ウマ、ヒツジ、ウシ、ヤギ、ブタ、イヌ、モルモット、ハムスター、ラット、ウサギまたはマウスとすることができる。
【0114】
アレイおよびキットならびにその使用
本発明は、複数のアドレスを有する基材を含んだアレイを特徴とする。複数のアドレスの少なくとも1つは、表2、5、7、8、10、12、15、および16に列挙されているMSDKタグのいずれか、核酸X (例えば、表2、5、7、8、10、12、15、および16に列挙されているMSDKタグの位置によって規定されるDNA配列(AscI部位))、またはタンパク質Xに特異的に結合する捕捉プローブを含む。アレイは、少なくとも10、20、50、100、200、500、700、1,000、2,000、5,000もしくは10,000またはそれ以上の、またはそれら未満のアドレス/cm2の密度を有することができ、およびこれらの範囲に及ぶ。好ましい態様では、複数のアドレスは少なくとも10、100、500、1,000、5,000、10,000、50,000のアドレスを含む。好ましい態様では、複数のアドレスは10、100、500、1,000、5,000、10,000、または50,000以下のアドレスを含む。この基材はスライドガラス、ウエハー(例えば、シリカもしくはプラスチック)、質量分析プレートなどの二次元基材、またはゲルパッドなどの三次元基材とすることができる。複数のアドレスの他にも、アドレスをアレイ上に配置することができる。
【0115】
アレイはさまざまな方法のいずれかによって作出することができる。適切な方法としては、例えば、光リソグラフィー法(例えば、米国特許第5,143,854号; 同第5,510,270号; および同第5,527,681号を参照のこと)、機械的方法(例えば、米国特許第5,384,261号に記述されているような定向流(directed-flow)法)、ピンに基づく方法(例えば、米国特許第5,288,514号に記述されているような)、ならびにビーズに基づく技術(例えば、PCT US/93/04145に記述されているような)が挙げられる。
【0116】
1つの態様では、複数のアドレスの少なくとも1つは、表2、5、7、8、10、12、15、および16に列挙されているMSDKタグのいずれかに、例えば、タグ配列のセンスまたはアンチセンス(相補)鎖に特異的にハイブリダイズする核酸捕捉プローブを含む。サブセットの各アドレスは、MSDKタグの異なる領域にハイブリダイズする捕捉プローブを含むことができる。そのようなアレイは、例えば、サンプル、例えば、MSDKタグライブラリーにおける表2、5、7、8、10、12、15、および16に列挙されているMSDKタグ(またはその相補体)の1つまたは複数の存在を検出するのにならびに、任意で、その相対数を評価するのに有用とすることができる。
【0117】
別の態様では、複数のアドレスの少なくとも1つは、核酸X、例えば、センスまたはアンチセンス鎖に特異的にハイブリダイズする核酸捕捉プローブを含む。関心対象の核酸は、非限定的に、表2、5、7、8、10、12、15、および16に列挙されているタグによって同定される遺伝子のいずれかの全部もしくは一部、このような遺伝子から転写されるmRNAの全部もしくは一部、またはこのようなmRNAから産生されるcDNAの全部もしくは一部を含む。サブセットの各アドレスは、核酸の異なる領域にハイブリダイズする捕捉プローブを含むことができる。サブセットの各アドレスは遺伝子Xの異なる変異体(例えば、対立遺伝子変異体、またはあらゆる可能な仮想的変異体)に特異的、重複的および相補的である。アレイは、例えば、ハイブリダイゼーションにより遺伝子X、mRNA X、もしくはcDNA Xを配列決定するために(例えば、米国特許第5,695,940号を参照のこと)または遺伝子Xの発現のレベルを評価するために使用することができる。
【0118】
別の態様では、複数のアドレスの少なくとも1つは、タンパク質Xまたはその断片に特異的に結合するポリペプチド捕捉プローブを含む。ポリペプチドはタンパク質Xの天然の相互作用パートナー、例えば、タンパク質Xが受容体である場合にはタンパク質Xに対するリガンドまたはタンパク質Xがリガンドである場合にはタンパク質Xに対する受容体とすることができる。好ましくは、ポリペプチドは抗体、例えば、ポリクローナル抗体、モノクローナル抗体、または一本鎖抗体などの、タンパク質Xに特異的な抗体である。
【0119】
抗体はポリクローナルまたはモノクローナル抗体とすることができ、両タイプの抗体を産生する方法は当技術分野において公知である。抗体はいずれかのクラス(例えば、IgM、IgG、IgA、IgD、またはIgE)のものとすることができ、本明細書において列挙されている種のいずれかにおいて作出することができる。それらはIgG抗体であることが好ましい。ヒトとヒト以外の両部分を含むキメラおよびヒト化モノクローナル抗体などの、組換え抗体を本発明の方法で使用することもできる。そのようなキメラおよびヒト化モノクローナル抗体は、当技術分野において公知の組換えDNA技術により、例えば、Robinsonら、国際特許公報であるPCT/US86/02269; Akiraら、欧州特許出願第184,187号; Taniguchi、欧州特許出願第171,496号; Morrisonら、欧州特許出願第173,494号; Neubergerら、PCT出願WO 86/01533; Cabillyら、米国特許第4,816,567号; Cabillyら、欧州特許出願第125,023号; Better et al. (1988) Science 240, 1041-43; Liu et al. (1987) J. Immunol. 139, 3521-26; Sun et al. (1987) PNAS 84, 214-18; Nishimura et al. (1987) Canc. Res. 47, 999-1005; Wood et al. (1985) Nature 314, 446-49; Shaw et al. (1988) J. Natl. Cancer Inst. 80, 1553-59; Morrison, (1985) Science 229, 1202-07; Oi et al. (1986) BioTechniques 4, 214; Winter、米国特許第5,225,539号; Jones et al. (1986) Nature 321, 552-25; Veroeyan et al. (1988) Science 239, 1534; およびBeidler et al. (1988) J. Immunol. 141, 4053-60に記述されている方法を用いて産生することができる。
【0120】
同様に本発明のアレイに有用なのは、抗体の抗原結合ドメインの少なくとも機能的部分を含んだ抗体断片および誘導体である。分子の結合ドメインを含む抗体断片は、公知の技術によって作出することができる。そのような断片は以下を含むが、それらに限定されることはない: 抗体分子のペプシン消化によって産生できるF(ab')2断片; F(ab')2断片のジスルフィド架橋の還元によって作出できるFab断片; ならびにパパインおよび還元剤で抗体分子を処理することによって作出できるFab断片。例えば、米国立衛生研究所(National Institutes of Health), 1 Current Protocols In Immunology, Coligan et al., ed. 2.8, 2.10 (Wiley Interscience, 1991)を参照されたい。抗体断片は同様に、Fv断片、すなわち、定常領域のアミノ酸残基がほとんどまたは全く存在しない抗体産物を含む。一本鎖Fv断片(scFv)は、scFvが由来する抗体の重鎖および軽鎖の両可変領域を含んだ単一のポリペプチド鎖である。そのような断片は、例えば、米国特許第4,642,334号に記述されているように産生することができ、この特許はその全体が参照により本明細書に組み入れられる。ヒト被験者の場合、抗体は、異なる種において元は作製されたモノクローナル抗体の「ヒト化」型とすることができる。
【0121】
別の局面では、本発明は遺伝子Xの発現を分析する方法を特徴とする。この方法は、上記のアレイを提供する段階; アレイをサンプルと接触させる段階およびアレイとの核酸Xまたはタンパク質Xの結合を検出する段階を含む。1つの態様では、アレイは核酸アレイである。任意で、この方法はさらに、アレイとの接触の前にまたはその間にサンプルから核酸を増幅させる段階を含んでもよい。
【0122】
別の態様では、組織中での遺伝子発現をアッセイしてアレイ中の遺伝子の組織特異性、特に遺伝子Xの発現を確認するため、アレイを使用することができる。十分な数の多様なサンプルが分析されるなら、遺伝子Xと同時制御される他の遺伝子を同定するため、クラスタ分析(例えば、階層的クラスタ分析、k-平均法によるクラスタ分析、ベイズ(Bayesian)クラスタ分析など)を使用することができる。例えば、アレイは複数遺伝子の発現の定量化に使用することができる。したがって、組織特異性だけでなく、組織中の一連の遺伝子の発現レベルも確認される。遺伝子をその組織発現それ自体およびその組織中での発現レベルに基づいて分類する(例えば、クラスタ化する)ため、定量的データを使用することができる。
【0123】
例えば、1つまたは複数の細胞型(上記参照)における遺伝子X発現を評価するため、遺伝子発現のアレイ分析を使用することができる。
【0124】
別の態様では、時間に対するアレイ中の1つまたは複数の遺伝子の発現をモニターするため、アレイを使用することができる。例えば、異なる時点より得られたサンプルをアレイによってプローブすることができる。そのような分析では、遺伝子X関連の疾患または障害(例えば、浸潤性乳がんなどの乳がん)の発生; および遺伝子X関連の疾患または障害と関係する細胞形質転換などの、過程を特定するおよび/または特徴付けることができる。この方法では同様に、遺伝子X関連の疾患または障害の処置および/または進行を評価することができる。
【0125】
アレイは同様に、正常および異常(例えば、悪性)細胞における1つまたは複数の遺伝子の差次的発現様式を確認するのに有用である。これにより、診断または治療的介入の分子標的として役立ちうる一連の遺伝子(例えば、遺伝子Xを含む)が得られる。
【0126】
別の局面では、本発明は複数のプローブを分析する方法を特徴とする。この方法は、例えば、遺伝子発現を分析するのに有用である。この方法は、以下の段階を含む: (複数の)アドレスのそれぞれが、固有の捕捉プローブを有する(複数の)相互のアドレスと位置的に識別可能であって、例えば、その際に捕捉プローブは、遺伝子Xを発現する細胞もしくは被験者由来であるか、遺伝子X媒介性の反応が、例えば、核酸Xもしくはタンパク質Xとの細胞の接触によって、または核酸Xもしくはタンパク質Xの細胞もしくは被験者への投与によって誘発されている細胞もしくは被験者由来である、複数のアドレスを有する第1の二次元アレイを提供する段階; 複数のアドレスのそれぞれが複数の相互のアドレスと位置的に識別可能であり、かつ複数のアドレスのそれぞれが固有の捕捉プローブを有し、例えば、その際に捕捉プローブは、遺伝子Xを発現しない(または第1のアレイに対する上記の細胞もしくは被験者の場合のように高度に発現しない)細胞もしくは被験者由来であるか、遺伝子X媒介性の反応が誘発されていない(または第1のサンプルにおけるよりも少ない程度まで誘発されている)細胞もしくは被験者由来である、複数のアドレスを有する第2の二次元アレイを提供する段階; 第1および第2のアレイを1つまたは複数の問い合わせプローブ(これは核酸X、タンパク質X、またはタンパク質Xに特異的な抗体以外であることが好ましい)と接触させ、それにより複数の捕捉プローブを評価する段階。複数のアドレスでの捕捉プローブとの結合、例えば、核酸の場合、ハイブリダイゼーションは、例えば、核酸、ポリペプチド、または抗体に付着された標識から生成されるシグナルにより検出される。
【0127】
本発明は同様に、複数のプローブまたはサンプルを分析する方法を特徴とする。この方法は、例えば、遺伝子発現を分析するのに有用である。この方法は、以下の段階を含む: 複数のアドレスのそれぞれが、固有の捕捉プローブを有する複数の相互のアドレスと位置的に識別可能である、複数のアドレスを有する第1の二次元アレイを提供する段階、遺伝子Xを発現するもしくは誤発現する細胞もしくは被験者由来の、あるいは遺伝子X媒介性の反応が、例えば、核酸Xもしくはタンパク質Xとの細胞の接触によって、または核酸Xもしくはタンパク質Xの細胞もしくは被験者への投与によって誘発されている細胞もしくは被験者由来の第1のサンプルとアレイを接触させる段階; 複数のアドレスのそれぞれが複数の相互のアドレスと位置的に識別可能であり、かつ複数のアドレスのそれぞれが固有の捕捉プローブを持つ、複数のアドレスを有する第2の二次元アレイを提供する段階、および遺伝子Xを発現しない(または第1のアレイに対して記述の細胞もしくは被験者の場合のように高度に発現しない)細胞もしくは被験者由来の、あるいは遺伝子X媒介性の反応が誘発されていない(または第1のサンプルにおけるよりも少ない程度まで誘発されている)細胞もしくは被験者由来の第2のサンプルとアレイを接触させる段階; ならびに第1のサンプルの結合を第2のサンプルの結合と比較する段階。複数のアドレスでの捕捉プローブとの結合、例えば、核酸の場合、ハイブリダイゼーションは、例えば、核酸、ポリペプチド、または抗体に付着された標識から生成されるシグナルにより検出される。同じアレイが両サンプルに使用されてもよく、または異なるアレイが使用されてもよい。異なるアレイが使用されるなら、捕捉プローブを有する同じ複数のアドレスが両アレイに存在するべきである。
【0128】
アレイに有用な上記の捕捉プローブは全て、任意で包装材料を含んでもよい、キットまたは製品の形態で提供することもできる。そのようなキットまたは製品では、捕捉プローブは前もって作られた、すなわち、上記のように適切な基材に付着されたアレイとして提供することができる。またはそれらは付着されていない形態で提供されてもよい。
【0129】
捕捉プローブは、任意の数の付着されていない形態で供給することができる。さらに、キットまたは製品中の各捕捉プローブは別個の容器(例えば、ボトル、バイアル、もしくは包装)に入れて提供することができ、捕捉プローブは全て同じ容器内に混合してもよく、または捕捉プローブの複数のプールを提供し、各プールを別個の容器内で提供してもよい。キットまたは製品の中には、任意で、アレイまたは付着されていない捕捉プローブの使用法に関する、例えば、本明細書において記述されている方法のいずれかの実行法に関する(例えば、包装材料上のまたは添付文書中の)使用説明書が存在してもよい。
【0130】
以下の例は本発明を限定するのではなく、例証するよう意図される。
【0131】
実施例
実施例1. 材料と方法
組織標本および初代細胞培養
ヒト乳房腫瘍および新鮮な、凍結された、またはホルマリン固定された、パラフィン包埋された腫瘍標本は、ブリガム女性病院(Brigham and Women's Hospital) (Boston, MA)、コロンビア大学(Columbia University) (New York, NY)、ケンブリッジ大学(University of Cambridge) (Cambridge, UK)、デューク大学(Duke University) (Durham, NC)、ザグレブ大学病院(University Hospital Zagreb) (Zagreb, Croatia)、国立疾病研究互助組織(National Disease Research Interchange) (Philadelphia, PA)、およびリエージュ大学の乳房腫瘍バンク(Breast Tumor Bank of the University of Liege) (Liege, Belgium)から得られた。ヒト組織は全て、機関審査委員会により承認されたプロトコルを用い、患者識別番号なしで集められた。適合組織サンプル(すなわち、同じ個体から得られた正常および腫瘍組織サンプル)の場合、腫瘍に対応する正常組織は、腫瘍から数センチメートル離れた同側の乳房から得られた。新鮮な組織サンプルを免疫磁性精製に向けてすぐに処理し、細胞サブセットを既報[Allinen et al. (2004) Cancer Cell 6:17-32および同時係属中の米国特許出願であるPCT/US2004/08866、これらの開示はその全体が参照により本明細書に組み入れられる]のように精製した。精製手順の後、場合によっては、各細胞集団の純度をRT-PCRにより確認し、異なる細胞型の初代培養を開始した。初代間質線維芽細胞を溶解ならびにDNAおよびRNA単離の前に、10%鉄強化ウシ血清(Hyclone, Logan, UT)を補充したDMEM培地中で培養した。ヒト胚幹細胞は、確立されたプロトコルを用い、支持細胞層上で培養された(例えば、REF参照)。DNAおよびRNAは、前培養なしで他の細胞型から単離された。
【0132】
RNAおよびゲノムDNA単離、ならびにcDNA合成
RNA (総RNAおよびポリA RNA)の単離は、少数の細胞からはμMACS(商標)キット(Miltenyi Biotec, Auburn, CA)を用いて行い、その一方、大きな組織サンプル、初代培養物および細胞株からは、グアニジウム/セシウム法[Allinen et al. (2004)、前記]を用いて総RNAを単離した。カラム素通り画分(μMACS(商標)法における)および沈殿しなかった可溶性物質(グアニジウム/セシウム法)をSDS/プロテイナーゼK消化と、その後のフェノール-クロロホルム抽出およびイソプロパノール沈殿によるゲノムDNAの精製に使用した。cDNA合成は、Qiagen (Valencia, CA)のOMNI-SCRIPT(商標)キットを用い、製造元の使用説明書にしたがって行われた。
【0133】
MSDK(メチル化特異的なデジタル核型分析)ライブラリーの作出および分析
MSDKライブラリーはデジタル核型分析プロトコル[Wang et al. (2002) Proc. Natl. Acad. Sci USA 16156-16161]の変更によって作出された。各サンプルに対し、ゲノムDNA 1〜5 μgをメチル化感受性酵素AscIで逐次的に消化し、得られた断片をその5'および3'末端でビオチン化リンカー

に連結した。ビオチン化された断片を次に、断片化用の制限酵素としてNlaIIIで消化した。ビオチン化リンカーをその末端に有する、得られたDNA断片をストレプトアビジン結合磁気ビーズ(Dynal, Oslo, Norway)に固定化した。
【0134】
残りの段階は、わずかな変更を加えたが、LongSAGEに記述のものと本質的に同じであった[Allinen et al. (2004) 前記; Saha et al. (2002) Nat. Biotechnol. 20:508-512]。手短に言えば、IIs型制限酵素MmeI認識部位を含んだリンカーを単離DNA断片に連結し、ビーズ結合断片をMmeI酵素により、その制限酵素部位から21塩基対離れた位置で切断し、MmeI認識部位、リンカーおよび試験ゲノムDNAの21塩基対を含んだタグを周辺溶液中にビーズから放出させた。このタグを連結して、5'および3' MmeI消化(切断)部位(ビーズに結合された関連の断片が非メチル化AscI部位の5'または3'側のNlaIII部位に由来するかどうかに依る)を含んだ単一のタグ間で形成されるジタグを形成させた。ジタグをPCRにより増大し、単離し、連結して鎖状体を形成し、これをpZero 1.0ベクター(Invitrogen, Carlsbad, CA)にクローニングし、配列決定した。SAGE 2002ソフトウェアを用いて、21 bpのタグを抽出し、複製ジタグ(PCR増大の段階に起因して生じる)を除去した。ポアソンに基づくアルゴリズムを用いて、ライブラリー間のペアワイズ比較に基づきp値を計算した[Cai et al. (2004) Genome Biol. 5:R51; Allinen et al. (2004) 上記]。補正なしのタグ数をライブラリーの比較およびp値の計算に使用したが、その後、不均等な総タグ数/ライブラリーを制御するため、タグ数を規準化した(平均総タグ数28,456個/ライブラリー)。
【0135】
各ライブラリーにおいて一度だけしか現れなかったタグは、その染色体位置を判定するため、フィルタリング除去し、ヒトゲノム配列に由来する仮想AscIライブラリーに適合させた。ヒトゲノム配列およびマッピング情報(Jul. 2003, hg16)はUCSCのゲノムバイオインフォマティクスサイトからダウンロードした。仮想AscIタグライブラリーは次の通り、ゲノム配列に基づいて構築した: 予想されたAscI部位をゲノム配列中に位置付け、AscI部位に両方向で最も近いNlaIII部位を同定し、対応する仮想MSDK配列タグを得た。データの明確なマッピングを確実にするため、ゲノム中にて固有ではなかった仮想タグは全て除去した。メチル化が発現に及ぼす影響を判定するため、AscI部位に隣接する遺伝子も同定した。
【0136】
MSDKのアラインメント、SAGE、および全ゲノム中のCpG島
AscI消化の頻度は、2つまたはそれ以上の未処理のタグ数を各予想AscI部位で有するサンプル(N-EPI-I7、I-EPI-7、N-MYOEP-4、D-MYOEP-6、N-STR-I7、I-STR-7、N-STR-I17、I-STR-17)の割合として計算した。対応するサンプル(N-EPI-1に加えてN-EPI-2、I-EPI-7、N-MYOEP-1、D-MYOEP-6、D-MYOEP-7、N-STR-1、N-STR-I17、I-STR-7)のSAGE数は、200,000個あたりのタグに対して規準化した。遺伝子およびCpG島の位置情報は、UCSCのゲノムバイオインフォマティクスサイト(ヒトゲノム配列およびマッピング情報、JuI. 2003, hg16)からダウンロードした。AscI部位はゲノム配列から予想し(上述のように)、AscI部位の頻度、SAGE数、およびCpG島の位置を全ての染色体に沿って結び付けた。
【0137】
重亜硫酸塩を用いた配列決定(Bisulfite sequencing)、定量的なメチル化特異的PCR (qMSP)、および定量的RT-PCR (qRT-PCR)
メチル化シトシンの位置を判定するため、既報のように[Herman et al. (1996) Proc. Natl. Acad. Sci. USA 93:9821-0826]ゲノムDNAを重亜硫酸塩で処理し、精製し、PCR反応を行った。PCR産物は「平滑末端」であり、pZERO1.0 (Invitrogen)にサブクローニングし、各PCR産物について4〜13個の独立したコロニーを配列決定した。
【0138】
上記の配列分析に基づき、メチル化または非メチル化DNAの増幅のためqMSP PCRプライマーをデザインした。定量的MSPおよびRT-PCR増幅は以下のように行った。鋳型(重亜硫酸塩で処理したゲノムDNA 2〜5 ngまたはcDNA 1 μl)およびプライマーを25 μlの容量中にて2×SYBR Greenマスターミックス(ABI, CA)と混合し、反応をABI 7500リアルタイムPCRシステムにて行った(50℃、20秒; 95℃、10分; 95℃、15秒、60℃、1分(40サイクル); 95℃、15秒; 60℃、20秒; 95℃、15秒)。三回通り行い、平均Ct値を計算した。Ct値(サイクル閾値)は、正確な定量化を可能とするよう指数増幅期(増幅プロファイルに基づく)において設定される閾値を超える蛍光強度に、反応が到達するPCRサイクル数である。qMSPの場合、サンプルのメチル化をβ-アクチン(ACTB)遺伝子のメチル化非依存性の増幅に対して規準化した: %ACTB=100×2(CtACTB-Ct遺伝子)。サンプルのqRT-PCR発現の場合には、RPL39 (リボソームタンパク質L39)遺伝子のものに対して規準化した: %RPL39=10×2(CtRPL39-Ct遺伝子)。リボソームタンパク質L19 (RPL19)およびリボソームタンパク質S13 (RPS13)遺伝子の発現に対する規準化も行って、本質的に同じ結果を得た。リボソームタンパク質mRNAの存在量は非常に高いので、特異的遺伝子の場合に比べて、これらのPCR反応ではcDNAを10倍希釈した。メチル化の閾値を正常サンプルの相対的メチル化の中央値+2×標準偏差値として設定することにより、正常および腫瘍サンプルにおけるPRDM14遺伝子のメチル化の頻度を計算した(ある外れ事例を除く; 以下参照)。この値(10.66)を超えるサンプルを、メチル化されていると定義した。
【0139】
実施例2. メチル化特異的なデジタル核型分析(MSDK)
下記の実験で使用されたMSDKプロトコルは、図2に図式的に描かれている。
【0140】
MSDKは、DNAコピー数をゲノム規模で定量的に分析するために最近開発されたデジタル核型分析(DK)技術[Wang et al. (2002) 上記]の改変技術である。DKは次の2つの考え方に基づく: (i) 短い(例えば、21塩基対の)配列タグはヒトゲノム中の特定の位置に由来しうる; および(ii) これらの配列タグはヒトゲノム配列に直接的に適合されうる。本来のDKプロトコルでは、SacIをマッピング用の酵素としておよびNlaIIIを断片化用の酵素として使用している。この酵素の組み合わせを用いて、SacI部位に最も近い2つの(5'および3'側両方の)NlaIII部位からタグを得ている。
【0141】
MSDK法では、SacIの代わりに、DNAメチル化に感受性を示すマッピング用の酵素を使用した。AscIを選択した。これは、その認識配列(GGCGCGCC)が2つのCpG (潜在的なメチル化)部位を有しており、反復要素よりも転写遺伝子と関係するCpG島において選択的に見出され[Dai et al. (2002) Genome Res. 12:1591-1598]、AscIがレアカッター酵素(予想部位およそ5,000箇所/ヒトゲノム)であるため、妥当な配列決定の難解さ(タグ20,000〜50,000個/ライブラリー)で異なるライブラリー中に極めて統計的に有意に異なって存在するタグの同定が可能になるからである。AscI認識配列における一方または両方のメチル化部位のメチル化により、AscIによる切断が阻止される。それぞれ、ヒトゲノムDNAで、マッピング用および断片化用の酵素として、それぞれ、AscIおよびNlaIIIを使用することで、合計7,205個の仮想タグ(AscIおよびNlaIII部位の予想位置に基づきヒトゲノムに一意的に適合され、得られうる可能なタグと定義される)が得られると予測される。AscIは非メチル化DNAだけを切断するので、MSDKライブラリー中のタグの存在からは、対応するAscI部位がメチル化されていないことが示唆される一方で、仮想タグがないことではメチル化が示唆される。
【0142】
エピゲノムプロファイリングに対するMSDK法の実行可能性を実証するため、野生型HCT116ヒト結腸がん細胞株(HCT WT)およびDNMT1とDNMT3bの両DNAメチルトランスフェラーゼ遺伝子がホモ接合性で欠失されているその派生株(HCT DKO) [Rhee et al. (2002) Nature 416, 552-556]から単離されたゲノムDNAより、MSDKライブラリーを作出した。これらの2つのDNAメチルトランスフェラーゼの欠失のため、HCT DKO細胞におけるゲノムDNAのメチル化は、HCT WT細胞に比べて95%を超えるまでに低下している。したがって、HCT WTおよびHCT DKO細胞より作出されたMSDKライブラリーは、DNAメチル化の劇的な相違を描き出すものと期待された。21,278個および24,775個のゲノムタグが、それぞれ、WTおよびDKO細胞から得られた。これらのタグを、実施例1に記述のように作出された仮想AscIタグライブラリーに適合させた。固有のタグ(WT細胞由来の7,126個のタグおよびDKO細胞由来の7,964個のタグ)を比較し、219個が2つのライブラリーにおいて統計的に有意に(p<0.05)異なって存在していると同定された(表1)。これらのタグのうち137個および82個が、それぞれ、DKOおよびWTライブラリーにいっそう豊富に存在していた。DKO細胞のゲノムの全体的な低メチル化と相関して、137個のタグのほぼ全てがDKOライブラリーでは少なくとも10倍豊富に存在していたのに対し、82個のタグのほとんど全てが2つのライブラリー間で2〜5倍の相違しか示さなかった。
【0143】
(表1)HCT116 WTおよびDKO MSDKライブラリーにおけるMSDKタグの頻度の分析および染色体位置

Chr, 染色体。
仮想タグ, 表示の染色体に対し予想されるMSDKタグ種の数。
観測されたタグ, 表示の染色体に対し両MSDKライブラリーで観測された異なる固有のタグ種の数。
多様性, 表示の染色体およびMSDKライブラリーに対する異なる固有のタグ種の数。
コピー, 表示の染色体およびMSDKライブラリーに対し観測された固有のタグ全ての存在量(総数)。
タグ多様性比, 表示の2つのライブラリーにおいて検出された、表示の染色体に対する固有のタグ種の数の比率。
タグコピー比, 表示の2つのライブラリーにおいて検出された、表示の染色体に対する固有のタグ全ての存在量(総数)の比率。
差次的タグ(P< 0.05), 一方の表示のMSDKライブラリーにおいて、他方の表示のMSDKライブラリーにおいてよりも高い(P< 0.050)存在量で存在していた、表示の染色体に対し観測された固有のタグ種の数。
【0144】
MSDKライブラリーの作出に用いたDNAサンプルの単一ヌクレオチド多型(SNP)アッセイ分析から、それら2つの細胞株がこの技術によっては識別不能であり、MSDKタグ数の観測の相違が、根底にある明白なDNAコピー数の変化に起因する可能性の低いことが実証された。ゲノムに対するタグのマッピングから、差次的にメチル化されるAscI部位の多くがCpG島に、ならびに多数のホメオ遺伝子を含めて発生および分化に関与する遺伝子のプロモーター領域に位置することが明らかになった(表2)。これらの結果と一致して、これらの遺伝子の2つ、LMX-1AおよびCOL5AがHCT116 WTとDKO細胞との間で差次的にメチル化されることが以前認められており、同様に原発性結腸直腸がんおよび結腸がん細胞株において高い頻度でメチル化されている[Paz et al. (2003) Hum. Mol. Genet. 12:2209-2210]。同様に、複数のがん種において高い頻度でメチル化されている遺伝子SCGB3A1/HIN-1 [Shigematsu et al. (2005) Int. J. Cancer 113:600-604; Krop et al. (2004) Mol. Cancer Res. 2:489-494; Krop et al. (2001) Proc. Natl. Acad. Sci. USA 98:9796-9801]は、最も高度に有意に差次的に存在するタグの1つと同定された(表2)。
【0145】
(表2)HCT116 WTおよびDKO MSDKライブラリーにおいて有意に(p<0.050)差次的に存在するMSDKタグならびにMSDKタグと関係する遺伝子









DKOおよびWT, DKOおよびWTライブラリーにおいて観測された補正なしの表示のMSDKの存在量(総数)。
DKO/WT比, DKOおよびWTライブラリーにおいて規準化された表示のタグの存在量(総数)の比(マイナス記号は表示の数値がDKO/WT比の逆数であることを示す)。
P値, 2つのライブラリー間における関連MSDKタグの補正なしの存在量の相違の有意性。
Chr, MSDKタグ配列が位置する染色体。
遺伝子, 表示のMSDKタグが関連付けられた遺伝子。
記述, 関連遺伝子の産物の記述。
遺伝子の転写開始部位に対する表示のタグによって同定されたAscI部位(認識配列)の位置および転写開始部位からのAscI部位(認識配列)の距離が示されている。
【0146】
MSDK技術をさらに検証するため、3つの高度に差次的に存在するタグをHCTライブラリーから選択し、対応するゲノム遺伝子座(LHX3、LMX-1A、およびTCF7L1遺伝子に対応する)を同定し、重亜硫酸塩処理ゲノムDNA (MSDKライブラリーの作出に使われたものと同じ)の配列決定を行った。3つの場合の全てにおいて、関連するAscI部位はWT細胞では完全にメチル化されており、DKO細胞ではメチル化されていなかった(図3〜5)。さらに、ほぼ全てのその他周辺のCpGで同じメチル化/非メチル化様式が示された。図6〜8には、記述のメチル化検出配列分析に供された、そのうちのこれら3つの遺伝子セグメントの領域のヌクレオチド配列が示されている。これらの結果から、MSDK法がメチル化様式のゲノム規模の分析および差次的にメチル化される部位の特定に適していることが示唆された。
【0147】
実施例3. 正常およびがん性乳房組織から単離された細胞集団由来のMSDKライブラリーの分析
正常乳房組織、上皮内乳がん(DCIS-非浸潤性乳管がん)組織、および浸潤性乳がん組織から単離された上皮細胞、筋上皮細胞、および線維芽細胞を多く含む間質細胞からMSDKライブラリーを作出した。サンプルの詳述は表3にある。
【0148】
(表3)メチル化分析に使われた乳房組織サンプルの一覧

組織サンプル名の末尾の数字は、組織サンプルが得られた患者を示す。
年齢は特定の患者の年齢である。
LNは、関連の患者において、がんが1つまたは複数のリンパ節に転移していたかどうかを示す。
ERは、関連のがん細胞がエストロゲン受容体を発現していたかどうかを示す。
PRは、関連のがん細胞がプロゲステロン受容体を発現していたかどうかを示す。
Her2は、関連のがん細胞がHer2/Neuを発現していたかどうかを示す。
悪性度(Grade)は組織学的悪性度である。
【0149】
年齢、ならびに生殖状態および疾患状態による後成的差異の可能性を制御するため、可能な限り、正常および腫瘍組織を同じ患者から得た。線維芽細胞を多く含む間質細胞は、上皮細胞、筋上皮細胞、白血球、および内皮細胞の除去後に残った細胞であり、80%を超える線維芽細胞からなる。明白なDNAコピー数の変化の可能性を除外するため、DNAサンプルを同様にSNPアレイで分析した。
【0150】
MSDKライブラリーのペアワイズ比較および統計的分析から、高度に(10倍を超える相違で)差次的に存在するタグの最大の分画は正常および腫瘍上皮細胞の間で生じ、公知の全体的ながんゲノムの低メチル化[Feinberg et al. (1983) Nature 301: 89-92]と一致して、これらのタグの大部分は腫瘍細胞において豊富にあることが明らかになった(表4および5)。
【0151】
(表4)I-EPI-7およびN-EIP-I7 MSDKライブラリーにおけるMSDKタグの頻度の分析および染色体位置

欄見出しは表1に示されている通りである。
【0152】
(表5)N-EPI-I7およびI-EPI-7 MSDKライブラリーにおいて有意に(p<0.050)差次的に存在するMSDKタグならびにMSDKタグと関係する遺伝子









比較されるMSDKライブラリーがN-EPI-I7およびI-EPI-7ライブラリーであることを除いて、欄見出しは表2の通りである(これらのライブラリーが作製された組織の詳細については表3を参照のこと)。
【0153】
統計的に有意な相違が観測されたが、さらに類似した様式が正常および腫瘍線維芽細胞を多く含む間質細胞の比較において観測された(表6〜8)。
【0154】
(表6)I-STR-I7およびI-STR-7 MSDKライブラリーにおけるMSDKタグの頻度の分析および染色体位置

欄見出しは表1に示されている通りである。
【0155】
(表7)N-STR-I7およびI-STR-7 MSDKライブラリーにおいて有意に(p<0.050)差次的に存在するMSDKタグならびにMSDKタグと関係する遺伝子


















比較されるMSDKライブラリーがN-STR-I7およびI-STR-7 MSDKライブラリーであることを除いて、欄見出しは表2の通りである(これらのライブラリーが作製された組織の詳細については表3を参照のこと)。
【0156】
(表8)N-STR-I17およびI-STR-17 MSDKライブラリーにおいて有意に(p<0.050)差次的に存在するMSDKタグならびにMSDKタグと関係する遺伝子




比較されるMSDKライブラリーがN-STR-I17およびI-STR-17 MSDKライブラリーであることを除いて、欄見出しは表2の通りである(ライブラリーが作製された組織の詳細については表3を参照のこと)。
【0157】
正常乳房組織から単離された筋上皮細胞の、上皮内がん(DCIS)から単離されたものとの比較から、いくらかの劇的な相違が明らかにされ、DCIS筋上皮細胞の相対的高メチル化が示唆された(表9および10)。
【0158】
(表9)N-MYOEP-4およびD-MYOEP-6 MSDKライブラリーにおけるMSDKタグの頻度の分析および染色体位置

欄見出しは表1に示されている通りである。
【0159】
(表10)N-MYOEP-4およびD-MYOEP-6 MSDKライブラリーにおいて有意に(p<0.050)差次的に存在するMSDKタグならびにMSDKタグと関係する遺伝子



MSDKライブラリーがN-MYOEP-4およびD-MYOEP-6 MSDKライブラリーであることを除いて、欄見出しは表2の通りである(ライブラリーが作製された組織の詳細については表3を参照のこと)。
【0160】
正常および腫瘍組織間の後成的な相違を同定する以外に、メチル化様式の細胞型特異的な相違が、正常上皮細胞および正常筋上皮細胞から作出されたMSDKライブラリーの比較によって認められた(表11および12)。上皮および筋上皮細胞は、共通の両性能の前駆細胞が起源であると考えられている[Bocker et al. (2002) Lab. Invest. 82:737-746]。これらの2つの細胞型の間で観測されたメチル化差異は、それらの異なるクローン起源または系統特異的な分化の間の細胞の後成的再プログラミングの可能性を提起している。実際、胚発生の間に、後成的変化が細胞系統特異的に起こり、分化に影響を及ぼすことが知られている[Kremenskoy et al. (2003) Biochem. Biophys. Res. Commun. 311:884-890]。
【0161】
(表11)N-MYOEP-4およびN-EPI-I7 MSDKライブラリーにおけるMSDKタグの頻度の分析および染色体位置

欄見出しは表1に示されている通りである。
【0162】
(表12)N-MYOEP4およびN-EPI-I7 MSDKライブラリーにおいて有意に(p<0.050)差次的に存在するMSDKタグならびにMSDKタグと関係する遺伝子








比較されるMSDKライブラリーがN-MYOEP-4およびN-EPI-I7 MSDKライブラリーであることを除いて、欄見出しは表2の通りである(これらのライブラリーが作製された組織の詳細については表3を参照のこと)。
【0163】
MSDKライブラリーのペアワイズ比較に加えて、メチル化および遺伝子発現様式のゲノム規模の分析を、各乳房細胞型のMSDKおよびSAGE (遺伝子発現の逐次分析)データを組み合わせることにより行った。AscI切断頻度を判定し、SAGEタグ計数を重ね合わせた(実施例1の詳細)。それらを次いで、予想される全てのCpG島およびAscI部位と一緒にヒトゲノムにマッピングした。複合的および細胞型特異的なMSDKおよびSAGE分析に基づき、高度に発現される遺伝子が遺伝子密集域に選択的に位置していること[Caron et al. (2001) Science 291:1289-1292]およびこれらの領域が最も高い頻度で切断される(したがってメチル化されていない)AscI部位の位置と相関していることが分かった。興味深いことに、全ての試験細胞について平均化された観測および予測MSDKタグ比が大部分の染色体にて同程度であったのに対し、X染色体および第17染色体は全サンプルにおいて、それぞれ、より低いおよびより高い観測/予測タグ比を有していたことから、これらの特定の染色体での全体的な高メチル化および低メチル化が示唆された(表1、2、および4〜12)。
【0164】
実施例4. 配列決定研究によるMSDKの結果の確認
MSDKの結果を確認するため、各ペアワイズ比較からいくつかの高度に差次的にメチル化された遺伝子を選択し、MSDKに使われた同じサンプル由来のおよび同様に個別の患者から得られたさらなるサンプル由来の重亜硫酸塩処理ゲノムDNAの配列分析を行うことで、そのメチル化を分析した。これらの遺伝子にはPRDM14かつZCCHC14 (腫瘍上皮細胞において高メチル化される)、HOXD4かつSLC9A3R1 (DCIS筋上皮細胞において高メチル化される)およびLOC389333 (上皮細胞においてよりも筋上皮細胞においていっそうメチル化される)、CDC42EP5 (DCIS筋上皮細胞において高メチル化されており、正常上皮細胞と筋上皮細胞との間でも異なる)、ならびにCxorf12 (正常のものと比較して腫瘍間質において高メチル化される) (図9〜15)が含まれた。興味深いことに、PRDM14およびHOXD4は同様に、HCT 116 WTとDKO細胞(DKOではメチル化されない)との間で差次的にメチル化されていたことから、複数の腫瘍型に関与するまたは後成的修飾を起こしやすい染色体域に位置するその可能性が示唆された。これらの場合の全てで、重亜硫酸塩を用いた配列分析から、メチル化の絶対頻度はサンプル間で幾分ばらつきがあったものの、MSDKの結果が確認された。
【0165】
図16A〜22Bには上記のメチル化検出配列分析に供された遺伝子領域のヌクレオチド配列が示されている。
【0166】
実施例5. 定量的なメチル化特異的PCR (qMSP)によるメチル化差異の頻度および一貫性の判定
これらの選択遺伝子におけるメチル化差異がどのくらいの頻度および一貫性で起こるのかを判定するため、定量的なメチル化特異的PCR (qMSP)アッセイ法を遺伝子のいくつかに向けて開発し、より大きなサンプルセットにおけるおよび複数の細胞型におけるそのメチル化状態を分析した。このアッセイ法は、少なくとも1つのCpG配列を含んだDNAのセグメントを標的化する2本のPCRプライマーのセットの、重亜硫酸塩処理DNAにアニールする、およびプライマーがまたぐ配列の増幅を引き起こす相対能に依存する。一方のプライマーセットは、DNA中の標的配列がメチル化されていなければ、配列を効率的に標的化して、相対的に素早い増幅を引き起こすようデザインし、他方のプライマー対は、DNA中の標的配列がメチル化されていれば、同様に作用するようデザインする。
【0167】
この分析によって、最初のMSDKデータおよび重亜硫酸塩を用いた配列決定の結果が確認されただけでなく、正常および腫瘍の両組織での3つ全ての細胞型における各遺伝子のメチル化状態も明らかにされた(図23A〜E)。PRDM14のメチル化の頻度を正常乳房組織(精製オルガノイド)、良性乳房腫瘍(線維腺腫、線維嚢胞性疾患、および乳頭腫)、ならびに乳がんのパネルにおいてさらに分析した(図24)。乳がんの大部分ではPRDM14の高メチル化が実証されたのに対し、正常乳房組織10サンプルのうちの1つだけ、および2、3個の良性腫瘍が低レベルのメチル化を有していた。これらのデータに基づくと、PRDM14は浸潤性腫瘍の90%においておよび正常乳房組織のわずか10%においてメチル化されているので、これは乳がん診断の候補生物マーカーである。
【0168】
さらに、さまざまな膵臓がん、前立腺がん、肺がん、および乳がんサンプル由来のゲノムDNAのMSP分析から、PRDM14遺伝子が幅広いがんにおいて高メチル化されていることが示唆された(表13)。種々のがんおよび正常組織由来の重亜硫酸塩処理DNAを(a) メチル化されている標的配列にだけ効果的にアニールし、検出可能なPCR産物の産生を引き起こすPCRプライマーの対; および(b) メチル化されていない標的配列にだけ効果的にアニールし、検出可能なPCR産物の産生を引き起こすプライマーの対で増幅した。
【0169】
(表13)膵臓がん、前立腺がん、肺がん、および乳がんにおけるPRDM14遺伝子のメチル化

N, 健常(がん患者ではない)人由来の正常組織。
CA中のN, がん組織に隣接する正常組織。
CA, がん組織。
異種移植片, ヌードマウス中で増殖されたがん組織。
U, PCR産物は非メチル化標的特異的なPCRプライマーを用いたPCRにおいてのみ(電気泳動ゲルにて)検出可能であった。
WM (弱メチル化), PCR産物はメチル化および非メチル化標的特異的な両PCRプライマーを用いたPCRにおいて(電気泳動ゲルにて)検出可能であったが、メチル化プライマー特異的なPCRがその他のサンプルと比較して弱かった。
M、WM、M、および合計の欄の中の数は、試験された異なるサンプルの数である。
【0170】
実施例6. 定量的RT-PCR (qRT-PCR)による遺伝子発現の分析
遺伝子発現に及ぼすメチル化変化の影響をさらに特徴付けるため、正常乳房組織、ならびに非浸潤性および浸潤性乳がんから精製された細胞における選択遺伝子の発現をRT-PCRによって分析した(図25A〜D)。メチル化および遺伝子発現の両方について分析された4つの遺伝子のうち、1つ(Cxorf12)だけは、差次的にメチル化されている部位が予測のプロモーター域に位置していたが、その他3つの遺伝子(PRDM14、HOXD4、およびCDC42EP5)では、差次的にメチル化されているAscIおよび周辺のCpG部位がイントロンまたは遠位のエクソンに位置していた。これらの所見と一致して、Cxorf12の相対的発現はメチル化と正の相関を示したが、その他3つの遺伝子のものはメチル化と逆の相関を示した。このように、全ての場合において、遺伝子の差次的メチル化とその差次的発現との間に強い相関関係が認められたが、プロモーター域におけるメチル化だけが発現の下方制御と関係しており、その他の領域では、メチル化はより高いmRNAレベルと相関を示した。これらの結果は、非中核(すなわち、プロモーターの外側の)領域におけるメチル化が転写に負の影響を与えないことを示した以前の報告[Ushijima (2005) Nat. Rev. Cancer 5:223-231]と一致しており、場合によっては(例えば、H19/IGF2、刷り込み遺伝子)、イントロンでのDNAメチル化が遺伝子発現の増大を引き起こすこともある[Feinberg et al. (2004) Nat. Rev. Cancer 4:143-153; Bell et al. (2000) Nature 405, 482-485]。IGF2の刷り込みはH19遺伝子内のエンハンサー遮断要素とのCTCF結合に依存しており、そのメチル化がCTCF結合を阻害し、刷り込みの消失(LOI)を引き起こす[Feiber et al. (2004) 前記; Bell et al. (2000) 前記]。興味深いことに、PRDM14およびCDC42EP5遺伝子において同定された差次的にメチル化される領域(上記参照)は、CTCF結合部位を有すると思われる[Bell et al. (2000) 前記]。したがって、本明細書において同定された遺伝子のいくつかは、刷り込みを受けやすい可能性があり、上記に示された結果から、細胞型および腫瘍病期特異的に起こりうる刷り込みの消失が示唆される。
【0171】
要約すれば、ゲノム規模のメチル化プロファイルの分析のための新規の、配列に基づく方法(メチル化特異的なデジタル核型分析; MSDK)が提供される。正常乳房組織ならびに非浸潤性および浸潤性乳がん由来の3つの細胞型(上皮および筋上皮細胞ならびに間質線維芽細胞)のMSDK分析から、異なる後成的変化が乳がん形成の間に3つ全ての細胞型において起こることが明らかになった。間質細胞および筋上皮細胞における変化はしたがって、異常な腫瘍内微小環境の確立に関与し、腫瘍進行に寄与する可能性が高い。
【0172】
本発明のいくつかの態様が記述されている。それでもなお、本発明の趣旨および範囲から逸脱することなく、さまざまな変更を行うことができると理解されると考えられる。したがって、その他の態様は以下の特許請求の範囲内である。
【0173】
実施例7. 幹細胞およびその分化子孫の包括的なDNAメチル化の判定
推定上の正常乳腺上皮幹細胞およびその分化子孫の包括的なメチル化プロファイルを判定するため、公知の細胞型特異的な細胞表面マーカーを用い正常ヒト乳房組織から細胞を精製した(図26A参照)。乳腺上皮幹細胞を系統-/CD24-/low/CD44+細胞として同定し、その一方で、分化内腔上皮細胞を抗MUC1抗体および抗CD24抗体によって精製し、筋上皮細胞を抗CD10抗体によって単離した。以後、推定上の正常乳腺上皮幹細胞をCD44+細胞と、内腔上皮細胞をMUC1+またはCD24+細胞と、および筋上皮細胞をCD10+細胞と呼ぶ。細胞の純度および分化状態は、半定量的RT-PCRによって公知の分化(例えば、MUC1、MME)マーカーおよび乳腺幹細胞(例えば、IGFBP7、LRP1)マーカーの発現を分析することで確認した(図26B参照)。SAGE (遺伝子発現の逐次分析)ライブラリーを同様に、各細胞分画から作出して、その包括的な発現プロファイルを分析した。SAGEデータによってさらに、CD44+細胞が幹細胞に相当し、その一方でMUC1+、CD24+、およびCD10+細胞が委任細胞の分化系統に相当するという仮説が確認された。これは、公知の内腔のおよび筋上皮の系統特異的マーカーならびに幹細胞マーカーが各SAGEライブラリーにおいて相互に排他的に見出されたからである。
【0174】
実施例8. 単離幹細胞およびその分化子孫から得られたMSDKデータの分析
上記のように精製されたCD44+、CD24+、MUC1+、およびCD10+細胞(図26Aおよび26B参照)から単離されたゲノムDNAを用いてMSDKライブラリーを作出した。各ライブラリーにおいて得られたMSDKタグの実数をMSDKタグの予想数または予測数と比較することにより、正常乳腺上皮幹細胞(CD44+)が内腔上皮(CD24+またはMUC1+)細胞および筋上皮(CD10+)細胞と比較して低メチル化されることが分かった(表14参照)。表15には、4つのMSDKライブラリーにおいて統計的に有意に(p<0.05)差次的に存在するタグが記載されている。
【0175】
(表14)幹細胞および分化細胞におけるMSDKタグの頻度の分析および染色体位置

欄見出しは表1に、表示の精製細胞集団に、CD10、CD24、CD44、およびMUC1に示されている通りである。
【0176】
(表15)4つの幹細胞および分化細胞MSDKライブラリーにおいて統計的に有意に(p<0.05)差次的に存在するタグの一覧表











P値, 4つのライブラリー間における関連MSDKタグの補正なしの存在量の相違の有意性。
SEQ ID NO:, 各MSDKタグヌクレオチド配列に割り当てられた配列識別番号をいう。
CD10、CD24、CD44、MUC1, MSDK分析に使用された異なる細胞集団をいう。
AscI位置, AscI部位が位置する対応の染色体内のbp位置をいう。
Chr, MSDKタグ配列が位置する染色体。
上流遺伝子(UpGene), AscI部位に最も近い5'側遺伝子をいう。
下流遺伝子(DnGene), AscI部位に最も近い3'側遺伝子をいう。
【0177】
さらに、CD10+およびMUC1+細胞がCD24+細胞と比較して低メチル化されることも分かった。この後者の観測結果から、CD24+細胞はほとんどが、最終分化した内腔上皮細胞であるのに対し、CD10+およびMUC1+細胞は、それぞれ、最終分化した筋上皮細胞および内腔上皮細胞と、その系統拘束された前駆細胞との混合物に相当しうるという仮説(これらの細胞に関するSAGEデータによっても示唆される)が提起された。幹細胞または特異的系統の分化(内腔もしくは筋上皮)細胞において特異的にメチル化される遺伝子座を同定するため、MSDKライブラリーのペアワイズ比較および複合比較を行った。統計的に有意な(p<0.05)相違が、これらの比較のそれぞれで認められ、分化(内腔または筋上皮)細胞において特異的にメチル化されたタグの同定につながった(図26C参照)。興味深いことに、CD44+細胞において低メチル化される遺伝子の多くがホメオ遺伝子、ポリコーム(polycomb) (クロモドメイン含有)タンパク質、または幹細胞機能に重要であることが知られている経路に関与するタンパク質をコードする。これらの遺伝子の詳細な要約を表16に示す。
【0178】
(表16)CD44+およびCD24+ライブラリーにおける選択の差次的にメチル化される遺伝子


P値, 4つのライブラリー間における関連MSDKタグの補正なしの存在量の相違の有意性。
SEQ ID NO:, 各MSDKタグヌクレオチド配列に割り当てられた配列識別番号をいう。
CD24およびCD44, MSDK分析に使用された異なる細胞集団(例えば、幹細胞および分化細胞集団)をいう。
Chr, MSDKタグ配列が位置する染色体。
遺伝子, AscI部位に最も近い遺伝子をいう。
位置, 関連遺伝子内(すなわち、上流(5')または内側(遺伝子のイントロン部分もしくはエクソン部分内))のAscI部位の位置をいう。
距離, 関連遺伝子に対する転写開始部位からのAscI部位の距離をいう。
機能, 各AscI部位の近くに位置する各遺伝子と関係する推定機能をいう。
【0179】
実施例9. 重亜硫酸塩を用いた配列決定分析による幹細胞および分化細胞MSDKの結果の確認
MSDKの結果を確認するため、各比較から、統計的に有意に差次的にメチル化される遺伝子のセットを選択し、そのメチル化状態を、MSDKに使われた同じサンプル由来の重亜硫酸塩処理ゲノムDNAの配列分析によって分析した。これらの遺伝子にはFNDC1およびFOXC1 (その他全てと比較してCD44+細胞において低メチル化される)、PACAP (その他と比較してCD44+およびCD10+細胞において低メチル化される)、SLC9A3R1 (CD44+細胞と比較してCD24+ MUC1+およびCD10+細胞において低メチル化される)、DDN1 (CD10+細胞と比較してCD44+細胞において低メチル化される)、ならびにDTX1およびCDC42EP5 (CD44+細胞と比較してCD10+細胞において低メチル化される)が含まれた。これらの場合の全てで、重亜硫酸塩を用いた配列決定分析から、MSDKの結果が確認された(図27A参照)。
【0180】
実施例10. qMSPによる幹細胞と分化細胞との間のメチル化差異の頻度および一貫性の判定
図27Aの選択遺伝子が複数の個別の女性由来の幹細胞および分化細胞において、どのくらいの一貫性で差次的にメチル化されるのかを判定するため、定量的なメチル化特異的PCR (qMSP)アッセイ法(上記)を利用して、より大きなサンプルセットでのメチル化を分析した。メチル化の程度に幾分ばらつきが認められたものの、qMSPは、MSDKおよび重亜硫酸塩を用いた配列決定のデータを追認し、異なる年齢(18〜58歳)および出産歴の女性に由来するサンプル間で、細胞系統特異的なメチル化が一致することを実証した(図27B参照)。
【0181】
実施例11. qRT-PCRによる幹細胞および分化細胞において差次的にメチル化される選択遺伝子の遺伝子発現の分析
遺伝子発現に及ぼすメチル化変化の影響を特徴付けるため、選択遺伝子の発現を実施例10においてqMSPにより分析された同一細胞での定量的RT-PCRによって分析した。図28はCD44+、CD10+、MUC1+、およびCD24+細胞のサブセットにおいて差次的にメチル化される選択遺伝子の相対的発現を示す。全体的に、メチル化状態と遺伝子の発現との間の関連性が認められた。しかしながら、メチル化は全遺伝子の発現に同じ影響を有してはいなかった。FNDC1、DDN、LHX1、およびHOXA10の発現はメチル化サンプルにおいて低かったのに対し、PACAPおよびCDC42EP5は高メチル化の細胞においていっそう高いレベルで発現された。CD44+、MUC1+、およびCD24+サンプルでのFOXC1およびSOX13の場合には、メチル化と遺伝子発現との間に逆相関が認められたが、FOXC1はメチル化されていたにもかかわらずCD10+細胞において発現されており、SOX13は低メチル化されていたにもかかわらずCD10+細胞において高度に発現されていなかった。CD10+細胞の機能が筋上皮前駆細胞と委任筋上皮細胞の混合物であり、したがって、前駆細胞と分化細胞の両特性を有するならば、これらのばらつきが起こりうると考えられる。
【0182】
実施例12. 乳がんの臨床病理学的特性とのメチル化状態の相関関係
最も高度に細胞系統特異的にメチル化される遺伝子のメチル化が乳がんの臨床病理学的特性と相関するかどうかを判定するため、PACAP、FOXC1 (MUC1、CD24+およびCD10+細胞と比較してCD44+細胞においてともにメチル化されない)、およびSLC9A3R1 (その他3つの細胞型全てと比較してCD44+細胞において高メチル化される)のメチル化を149例の散発性浸潤性腺管がん、11例のBRCA1+腫瘍、21例のBRCA2+腫瘍、および14例の葉状腫瘍において分析した。この分析に基づき、PACAPおよびFOXC1のメチル化が腫瘍のホルモン受容体(エストロゲン受容体-ER、プロゲステロン受容体-PR)およびHER2の状態とならびに腫瘍サブタイプと統計的に有意に関連していることが分かった。基底細胞様腫瘍(ER-/PR-/HER2-と定義される)およびBRCA1腫瘍は正常CD44+幹細胞と同じメチル化プロファイルを示したのに対し、ER+およびHER2+腫瘍は分化細胞にいっそう類似していた。これらの結果から、(a) 異なる腫瘍サブタイプが別個の起始細胞を有するか、または(b) 異なる腫瘍中のがん幹細胞が異なる分化能を有するかのいずれかであるという仮説が支持された。
【0183】
これらの2つの仮説を評価するため、推定がん幹(lin-/CD24-/low/CD44+/EPCR+)細胞および分化(CD24+)細胞のqMSP分析を、正常乳房組織において高度に細胞型特異的にメチル化されていた遺伝子を用いて行った(図29A参照)。この分析により、腫瘍幹細胞(CD44+)およびCD24+細胞のDNAメチル化プロファイルがその対応する正常対照物と同じであることが実証されたことから、腫瘍サブタイプにかかわらず、がん幹細胞は同一腫瘍由来のいっそう分化した(CD24+)細胞に対してよりも相互に対しておよび正常幹細胞に対していっそう類似している可能性の高いことが示唆された。
【0184】
実施例13. 乳がんの臨床病理学的特性とのメチル化状態の相関関係
がん幹細胞が腫瘍の転移拡散および再発に関与しているという仮説に基づくと、がん幹細胞の数は原発腫瘍と比較して遠隔転移においていっそう高いことが予想されると考えられる。この仮説を検証するため、原発腫瘍および対応の遠隔転移(同じ患者から回収された)における最も高度に細胞型特異的にメチル化される遺伝子のうち4つのメチル化状態を分析した。予想外に、HOXA10、FOXC1、およびLHX1のメチル化は原発腫瘍と比較して遠隔転移においていっそう高く、分化CD24+細胞において検出されたレベルに接近するか、または場合によりそのレベルを超えていたが、PACAPの場合には明確な様式が認められなかった(図29B参照)。このことから、CD24+細胞の数が遠隔転移において増大される、つまり幹細胞および分化細胞マーカーを用いたこれらのサンプルの免疫組織化学分析によって裏付けられた所見が示唆された。これらの結果のもっともらしい幾つかの説明のうち、最も可能性が高いのは、細胞可塑性ならびに原発腫瘍および遠隔転移における異なる選択条件である。実際に、Eカドヘリンのメチル化および発現の分析から、細胞分化が動的過程であり、転移進行の間に起こりうることが実証された。したがって、CD44+がん幹細胞は転移する細胞であったが、それらは転移の部位で分化する可能性がある。原発腫瘍および対応の転移における単一細胞レベルでのCD24+およびCD44+細胞の遺伝的組成の分析は、この疑問を解明するのに必要であると考えられる。
【0185】
要約すれば、ヒトの推定上の乳腺上皮幹細胞ならびに分化した内腔および筋上皮細胞のゲノム規模のDNAメチル化プロファイルを判定した。細胞型特異的にメチル化されることが分かった遺伝子は、がん幹細胞および分化細胞が後成的に異なっており、相互に対してよりもその対応する正常対照物に対していっそう類似しており、選択遺伝子のメチル化状態によって乳がんが細胞サブタイプに分類されることを実証した。
【図面の簡単な説明】
【0186】
(図1)制限酵素の認識配列でDNAを制限酵素が切断することによる、制限酵素の5'切断配列および3'切断配列の作出の図表表示である。図中には、認識配列を構成するヌクレオチドのそれぞれがNと表示されている制限酵素認識配列を含む、二本鎖DNAセグメントの2本の鎖が示されている。図中の例示的な制限酵素認識配列は6塩基対の認識配列であり、特定の制限酵素による切断で3'側の2個のヌクレオチド突出部が生じる。制限酵素認識配列ならびに制限酵素の3'および5'切断配列を構成するN含有配列は、枠で囲まれており、適切に名前が付けられている。利用可能な複数の制限酵素によって作出される5'および3'末端は、(ヌクレオチド含量が、付着末端が作出されるかどうかが、ならびに、付着末端が作出されるなら、突出部のヌクレオチドの性質および数が)大きく異なることを当業者は理解すると思われる。それでもやはり、制限酵素の、その認識配列の位置で切断する作用によって産生される全ての末端(5'および3'切断配列)が、関連する制限酵素認識配列に由来するヌクレオチドからなるという意味において、5'および3'の制限酵素切断配列は、質的特徴を共有しており、これらのヌクレオチドが5'と3'の切断配列の間でどのように分配されるかだけが異なっている。
(図2)実施例1および2に記述されているMSDK手順の図示的描写である。
(図3〜5)図6〜8に、それぞれ、示されているLHX3遺伝子領域(図3; SEQ ID NO:3)、LMX-1A遺伝子領域(図4; SEQ ID NO:5)、およびTCF7L1遺伝子領域(図5; SEQ ID NO:4)のセグメントのメチル化検出配列分析の結果の図表表示である。円はSEQ ID NO:3、5、および4の分析セグメントにおける潜在的なメチル化部位(CpG)を表す。円の順序(円列の左側から始まる)は、SEQ ID NO:3、5および4の分析セグメントにおけるCpGジヌクレオチドの順序(分析セグメントのヌクレオチド配列の5'末端から始まる)である。分析は、野生型HCT116ヒト結腸がん細胞(「WT」)およびそのDNTM1とDNMT3bメチルトランスフェラーゼ遺伝子の両対立遺伝子が「ノックアウト」(「DKO」)されているHCT116細胞由来のDNAにて行われた。各円は、関連の潜在的なメチル化部位がメチル化されると判明した頻度(0%〜100%)を陰影の量が示している円グラフである。円下部の上線は、関連の遺伝子転写産物の直線描写であり、エクソン(影付きボックス)およびイントロン(影付きボックス間の線)を含んでおり、円下部の最下線は、遺伝子が位置する染色体の直線描写である。染色体描写には、関連のAscI認識配列の位置を示したMSDKタグ配列の位置が示されており、AscI認識配列の位置も示されている。最下線の付番は染色体上の塩基対(bp)番号を示しており、上線の付番は転写開始部位および終結部位の、染色体中での、bp番号を示す。転写開始部位および転写の方向も示されている。
(図6A)関連するAscI認識配列(大文字および下線の)ならびに複数のCpGジヌクレオチド(影付き)を同定したMSDKタグ配列(太字および下線)を含むLHX3遺伝子の領域のヌクレオチド配列(SEQ ID NO:3)の描写である。メチル化検出配列分析に供されるSEQ ID NO:3のセグメントは、配列決定分析に使われるフォワードPCRプライマー標的配列(斜字体および下線で示されている)の3'末端後のヌクレオチドで始まり、リバースPCRプライマー標的配列(斜字体および下線で示されている)の3'末端前のヌクレオチドで終わる。配列決定されるセグメントは、(LHX3遺伝子転写開始部位に対して)上流のbp番号196 (bp -196)から下流のbp番号172 (bp +172)に及び、したがって配列決定されるセグメント中の最後の23個のCpGがプロモーター領域内にあり、最初の26個のCpGが第1エクソン内にある。
(図6B)関連するAscI部位(太字および下線)ならびに複数のCpGジヌクレオチド(影付き)を含むSEQ ID NO:3内のLHX3遺伝子の領域のヌクレオチド配列(SEQ ID NO:1545)の描写である。
(図7A)関連するAscI認識配列(大文字および下線の)ならびに複数のCpGジヌクレオチド(影付き)を同定したMSDKタグ配列(太字および下線)を含むLMX-1A遺伝子の領域のヌクレオチド配列(SEQ ID NO:5)の描写である。メチル化検出配列分析に供されるSEQ ID NO:5のセグメントは、配列決定分析に使われるフォワードPCRプライマー標的配列(斜字体および下線で示されている)の3'末端後のヌクレオチドで始まり、リバースPCRプライマー標的配列(斜字体および下線で示されている)の3'末端前のヌクレオチドで終わる。配列決定されるセグメントは、(LMX-1A遺伝子転写開始部位に対して)上流のbp番号842 (bp -842)から上流のbp番号609 (bp -609)に及び、したがって配列決定されるセグメント全体がプロモーター領域内にある。
(図7B)関連するAscI認識配列(大字および下線の)ならびに複数のCpGジヌクレオチド(影付き)を含むSEQ ID NO:5内のLMX-1A遺伝子の領域のヌクレオチド配列(SEQ ID NO:1546)の描写である。
(図8A)関連するAscI認識配列(大文字および下線の)ならびに複数のCpGジヌクレオチド(影付き)を同定したMSDKタグ配列(太字および下線)を含むTCF7L1遺伝子の領域のヌクレオチド配列(SEQ ID NO:4)の描写である。メチル化検出配列分析に供されるSEQ ID NO:4のセグメントは、配列決定分析に使われるフォワードPCRプライマー標的配列(斜字体および下線で示されている)の3'末端後のヌクレオチドで始まり、リバースPCRプライマー標的配列(斜字体および下線で示されている)の3'末端前のヌクレオチドで終わる。配列決定されるセグメントは、(TCF7L1遺伝子転写開始部位に対して)下流のbp番号782 (bp +782)から下流のbp番号1003 (bp +1003)に及び、したがって配列決定されるセグメント中の最初の6個のCpGが第1エクソン内にあり、最後の19個のCpGが第3〜4イントロン中にある。
(図8B)関連するAscI認識配列(大字および下線の)ならびに複数のCpGジヌクレオチド(影付き)を含むSEQ ID NO:4内のTCF7L1遺伝子の領域のヌクレオチド配列(SEQ ID NO:1547)の描写である。
(図9〜15)図16A〜22Aに、それぞれ、示されているPRDM14遺伝子領域(図9; SEQ ID NO:1)、ZCCHC14遺伝子領域(図10; SEQ ID NO:2)、HOXD4遺伝子領域(図11; SEQ ID NO:6)、SLC9A3R1遺伝子領域(図12; SEQ ID NO:7)、LOC38933遺伝子領域(図13; SEQ ID NO:10)、CDC42EP5遺伝子領域(図14; SEQ ID NO:8)、およびCxorf12遺伝子領域(図15; SEQ ID NO:9)それぞれの、セグメントのメチル化検出配列分析の結果の図表表示である。円は分析セグメントにおける潜在的なメチル化部位(CpG)を表す。円の順序(円列の左側から始まる)は、分析セグメントにおけるCpGジヌクレオチドの順序(分析セグメントのヌクレオチド配列の5'末端から始まる)である。分析は、表示のサンプルから得られた表示の細胞由来のDNAにて行われた(表3参照)。MSDKライブラリーの作出に使われたサンプルには、星印が付けられている。各円は、関連の潜在的なメチル化部位がメチル化されると判明した頻度(0%〜100%)を陰影の量が示している円グラフである。円下部の上(太)線は、関連の遺伝子転写産物の直線描写であり、エクソン(影付きボックス)およびイントロン(影付きボックス間の線)を含んでおり、円下部の最下線は、遺伝子が位置する染色体の直線描写である。染色体描写には、関連のAscI認識配列の位置を示したMSDKタグ配列の位置が示されており、AscI認識配列の位置も示されている。最下線の付番は染色体に対するbp番号を示しており、上線の付番は転写開始部位および終結部位の、染色体中での、bp番号を示す。転写開始部位および転写の方向も示されている。図15はHCFC1遺伝子およびCxorf12遺伝子に関する上記の情報を示す。図に示されるように、これら2つの遺伝子はX染色体上で比較的すぐ近くに位置している。
(図16A)関連するAscI認識配列(大文字および下線の)ならびに複数のCpGジヌクレオチド(影付き)を含むPRDM14遺伝子の領域のヌクレオチド配列(SEQ ID NO:1)の描写である。メチル化検出配列分析に供されるSEQ ID NO:1のセグメントは、配列決定分析に使われるフォワードPCRプライマー標的配列(斜字体および下線で示されている)の3'末端後のヌクレオチドで始まり、リバースPCRプライマー標的配列(斜字体および下線で示されている)の3'末端前のヌクレオチドで終わる。配列決定されるセグメントは、(PRDM14遺伝子転写開始部位に対して)下流のbp番号666 (bp +666)から下流のbp番号839 (bp +839)に及び、したがって配列決定されるセグメント全体が第1〜2イントロン内にある。
(図16B)関連するAscI認識配列(大字および下線の)ならびに複数のCpGジヌクレオチド(影付き)を含むSEQ ID NO:1内のPRDM14遺伝子の領域のヌクレオチド配列(SEQ ID NO:1548)の描写である。
(図17A)関連するAscI認識配列(大文字および下線の)ならびに複数のCpGジヌクレオチド(影付き)を含むZCCHC14遺伝子の領域のヌクレオチド配列(SEQ ID NO:2)の描写である。メチル化検出配列分析に供されるSEQ ID NO:2のセグメントは、配列決定分析に使われるフォワードPCRプライマー標的配列(斜字体および下線で示されている)の3'末端後のヌクレオチドで始まり、リバースPCRプライマー標的配列(斜字体および下線で示されている)の3'末端前のヌクレオチドで終わる。配列決定されるセグメントは、(ZCCHC14遺伝子転写開始部位に対して)下流のbp番号79 (bp +79)から下流のbp番号292 (bp +292)に及び、したがって配列決定されるセグメント中の最後の14個のCpGが第1エクソン内にあり、最初の7個のCpGが第1〜2イントロン中にある。
(図17B)関連するAscI認識配列(大字および下線の)ならびに複数のCpGジヌクレオチド(影付き)を含むSEQ ID NO:2内のZCCHC14遺伝子の領域のヌクレオチド配列(SEQ ID NO:1549)の描写である。
(図18A)関連するAscI認識配列(大文字および下線の)ならびに複数のCpGジヌクレオチド(影付き)を含むHOXD4遺伝子の領域のヌクレオチド配列(SEQ ID NO:6)の描写である。メチル化検出配列分析に供されるSEQ ID NO:6のセグメントは、配列決定分析に使われるフォワードPCRプライマー標的配列(斜字体および下線で示されている)の3'末端後のヌクレオチドで始まり、リバースPCRプライマー標的配列(斜字体および下線で示されている)の3'末端前のヌクレオチドで終わる。配列決定されるセグメントは、(HOXD4遺伝子転写開始部位に対して)下流のbp番号986 (bp +986)から下流のbp番号1,189 (bp +1,189)に及び、したがって配列決定されるセグメント全体が第1〜2イントロン内にある。
(図18B)関連するAscI認識配列(大字および下線の)ならびに複数のCpGジヌクレオチド(影付き)を含むSEQ ID NO:6内のHOXD4遺伝子の領域のヌクレオチド配列(SEQ ID NO:1550)の描写である。
(図19A)関連するAscI認識配列(大文字および下線の)ならびに複数のCpGジヌクレオチド(影付き)を含むSLC9A3R1遺伝子の領域のヌクレオチド配列(SEQ ID NO:7)の描写である。メチル化検出配列分析に供されるSEQ ID NO:7のセグメントは、配列決定分析に使われるフォワードPCRプライマー標的配列(斜字体および下線で示されている)の3'末端後のヌクレオチドで始まり、リバースPCRプライマー標的配列(斜字体および下線で示されている)の3'末端前のヌクレオチドで終わる。配列決定されるセグメントは、(SLC9A3R1遺伝子転写開始部位に対して)下流のbp番号11,713 (bp +11,713)から下流のbp番号11,978 (bp +11,978)に及び、したがって配列決定されるセグメント全体が第1〜2イントロン内にある。
(図19B)関連するAscI認識配列(大字および下線の)ならびに複数のCpGジヌクレオチド(影付き)を含むSEQ ID NO:7内のSLC9A3R1遺伝子の領域のヌクレオチド配列(SEQ ID NO:1551)の描写である。
(図20A)関連するAscI認識配列(大文字および下線の)ならびに複数のCpGジヌクレオチド(影付き)を含むLOC389333遺伝子の領域のヌクレオチド配列(SEQ ID NO:10)の描写である。メチル化検出配列分析に供されるSEQ ID NO:10のセグメントは、配列決定分析に使われるフォワードPCRプライマー標的配列(斜字体および下線で示されている)の3'末端後のヌクレオチドで始まり、リバースPCRプライマー標的配列(斜字体および下線で示されている)の3'末端前のヌクレオチドで終わる。配列決定されるセグメントは、(LOC389333遺伝子転写開始部位に対して)下流のbp番号518 (bp +518)から下流のbp番号762 (bp +762)に及び、したがって配列決定されるセグメント中の最後の10個のCpGが第1エクソン内にあり、最初の21個のCpGが第1〜2イントロン内にある。
(図20B)関連するAscI認識配列(大字および下線の)ならびに複数のCpGジヌクレオチド(影付き)を含むSEQ ID NO:10内のLOC389333遺伝子の領域のヌクレオチド配列(SEQ ID NO:1552)の描写である。
(図21A)関連するAscI認識配列(大文字および下線の)ならびに複数のCpGジヌクレオチド(影付き)を含むCDC42EP5遺伝子の領域のヌクレオチド配列(SEQ ID NO:8)の描写である。メチル化検出配列分析に供されるSEQ ID NO:8のセグメントは、配列決定分析に使われるフォワードPCRプライマー標的配列(斜字体および下線で示されている)の3'末端後のヌクレオチドで始まり、リバースPCRプライマー標的配列(斜字体および下線で示されている)の3'末端前のヌクレオチドで終わる。配列決定されるセグメントは、(CDC42EP5遺伝子転写開始部位に対して)下流のbp番号7,991 (bp +7,991)から下流のbp番号8,193 (bp +8,193)に及び、したがって配列決定されるセグメント全体が第3エクソン内にある。
(図21B)関連するAscI認識配列(大字および下線の)ならびに複数のCpGジヌクレオチド(影付き)を含むSEQ ID NO:8内のCDC42EP5遺伝子の領域のヌクレオチド配列(SEQ ID NO:1553)の描写である。
(図22A)関連するAscI認識配列(大文字および下線の)ならびに複数のCpGジヌクレオチド(影付き)を同定したMSDKタグ配列(太字および下線)を含むCxorf12遺伝子の領域のヌクレオチド配列(SEQ ID NO:9)の描写である。メチル化検出配列分析に供されるSEQ ID NO:9のセグメントは、配列決定分析に使われるフォワードPCRプライマー標的配列(斜字体および下線で示されている)の3'末端後のヌクレオチドで始まり、リバースPCRプライマー標的配列(斜字体および下線で示されている)の3'末端前のヌクレオチドで終わる。配列決定されるセグメントは、(Cxorf12遺伝子転写開始部位に対して)上流のbp番号838 (bp -838)から上流のbp番号639 (bp -639)に及び、したがって配列決定されるセグメント全体がプロモーター領域内にある。
(図22B)関連するAscI認識配列(大文字および下線の)ならびに複数のCpGジヌクレオチド(影付き)を同定したMSDKタグ配列(太字および下線)を含むSEQ ID NO:9内のCxorf12遺伝子の領域のヌクレオチド配列(SEQ ID NO:1555)の描写である。
(図23A〜F)表示の正常乳房組織および乳がんサンプルから単離された上皮細胞(正常および腫瘍細胞の横棒の左側の組)、筋上皮細胞(正常および腫瘍細胞の横棒の中央の組)、ならびに線維芽細胞を多く含む間質細胞(正常および腫瘍細胞の右側の組)におけるPRDM14 (図23A)、HOXD4 (図23B)、SLC9A3R1 (図23C)、CDC42EP5 (図23D)、LOC389333 (図23E)、およびCxorf12 (図23F)遺伝子の定量的なメチル化特異的PCR (qMSP)分析の結果を示す一連の棒グラフである。各遺伝子に対する平均Ct値をACTB値に対して規準化した(実施例1参照)。データ(「相対的メチル化(%)」)はACTB値に対する割合である。MSDKライブラリーの作出に使われたサンプルは、星印によって示されている。PRDM14遺伝子は腫瘍上皮細胞においてほぼ例外なくメチル化されており、LOC389333遺伝子はその他の細胞型と比較して上皮細胞において(腫瘍細胞と正常細胞の両方で)選択的にメチル化されている。HOXD4、SLC9A3R1、およびCDC42EP5遺伝子は、正常およびDCISおよび筋上皮細胞の間で差次的にメチル化されていることに加えて、その他の細胞型でもメチル化されている。HOXD4遺伝子は正常および腫瘍上皮細胞の間で差次的にメチル化されており、間質の線維芽細胞において高い頻度でメチル化されており、その一方でSLC9A3R1およびCDC43EP5遺伝子は間質の線維芽細胞において高い頻度で、および上皮細胞においてまれにメチル化されている。Cxorf12遺伝子は同じ型の正常細胞と比較して、腫瘍線維芽細胞を多く含む間質細胞において高メチル化されており、上皮細胞の一部分においてもメチル化されている。
(図24)正常乳房組織、良性乳房腫瘍(線維腺腫、乳頭腫、および線維嚢胞性疾患)、ならびに乳がんのパネルにおけるPRDM14遺伝子のqMSP分析の結果を示す棒グラフである。データを図23に記述の通りコンピュータで計算した。500%を相対的メチル化の上限値として設定したが、数個のサンプルではこの閾値を超える相違が示された。
(図25A〜D)正常乳房かつ乳がん(腫瘍)上皮細胞、線維芽細胞を多く含む間質細胞(間質)、および筋上皮細胞において、ならびに浸潤性乳がん細胞の筋線維芽細胞においてPRDM14 (図25A)、Cxorf12 (図25B)、CDC42EP5 (図25C)、およびHOXD4 (図25D)遺伝子の発現分析の結果を示す一連の棒グラフである。各遺伝子に対する平均Ct値をRPL39値に対して規準化した(実施例1参照)。データ(「相対的メチル化(%)」)はRPL39値に対する割合である。規準化のためRPL19およびRPS13値を用いることで、本質的に同じ結果が得られた。PRDM14遺伝子は浸潤性乳がんの上皮細胞において相対的に過剰発現されていた。Corf12遺伝子は腫瘍線維芽細胞を多く含む間質細胞におけるよりも正常のものにおいて相対的に高いレベルで発現されていた。CDC42EP5およびHOXD4遺伝子は正常筋上皮細胞と比較して、同様に、CDC42EP5遺伝子の場合には、正常上皮細胞と比較して、DCIS筋上皮細胞および浸潤性乳がんの筋上皮細胞において高い発現を示した。
(図26A)正常乳房組織からの各種細胞型の組織分画および精製に使われた手順の図示的表示である。図によって示されている通り、細胞を抗体結合磁気ビーズによって捕捉した。
(図26B)正常乳房組織から単離された精製済み細胞分画由来の選択遺伝子の半定量的RT-PCR分析の臭化エチジウム染色済み電気泳動ゲルの一連の写真である。PPIAを負荷(loading)対照として使用した。三角形はPCRサイクル数の増大(25回、30回、および35回)を示す。
(図26C)正常乳腺組織から単離された異なる細胞型において差次的にメチル化される、MSDKにより作出された、統計的に有意(p<0.05)なタグの比率および位置を示す一連のグラフである。さらなる検証のために選択された遺伝子に対応する点が円で囲われている。X軸は各比較において表示のライブラリーから規準化されたタグの比率を表す。CD44/Allは全ての分化細胞(CD10+、CD24+、およびMUC1+)に対する乳腺幹細胞(CD44+)の比較を示す。
(図27A)SLC9A3R1遺伝子領域、FNDC1遺伝子領域、FOXC1遺伝子領域、PACAP遺伝子領域、DDN遺伝子領域、CDC42EP5遺伝子領域、LHX1遺伝子領域、SOX13遺伝子領域、およびDTX遺伝子領域のセグメントのメチル化検出配列分析の結果の一連の図表表示である。円はSEQ ID NO:7、8、および11〜18の分析セグメントにおける潜在的なメチル化部位(CpG)を表す。円の順序(円列の左側から始まる)は、SEQ ID NO:7、8、および11〜18の分析セグメントにおけるCpGジヌクレオチドの順序(分析セグメントのヌクレオチド配列の5'末端から始まる)である。分析は、CD44+、CD24+、MUC1+、およびCD10+細胞集団から単離されたDNAにて行われた。各円は、関連の潜在的なメチル化部位がメチル化されると判明した頻度(0〜100%)を陰影の量が示している円グラフである。円下部の上線は、関連の遺伝子転写産物の直線描写であり、エクソン(影付きボックス)およびイントロン(影付きボックス間の線)を含んでおり、円下部の最下線は、遺伝子が位置する染色体の直線描写である。染色体描写には、関連のAscI認識配列の位置を示したMSDKタグ配列の位置が示されており、AscI認識配列の位置も示されている。最下線の付番は染色体上の塩基対(bp)番号を示しており、上線の付番は転写開始部位および終結部位の、染色体中での、bp番号を示す。転写開始部位および転写の方向も示されている。
(図27B)異なる年齢(18〜58歳)および出産歴の女性由来のCD44+、CD10+、MUC1+、およびCD24+細胞集団におけるSLC9A3R1、FNDC1、FOXC1、PACAP、DDN、CDC42EP5、LHX1、およびHOXA10遺伝子の定量的なメチル化特異的PCR (qMSP)分析の結果を示す一連の棒グラフである。各遺伝子に対する平均Ct値をACTB値に対して規準化した。データ(「相対的発現(%)」)はRPL39値に対する割合である。
(図28)正常乳房組織から単離されたCD44+、CD10+、MUC1+、およびCD24+細胞におけるSLC9A3R1、FNDC1、FOXC1、PACAP、DDN、CDC42EP5、LHX1、およびHOXA10遺伝子の発現分析の結果を示す一連の棒グラフである。各遺伝子に対する平均Ct値をRPL39値に対して規準化した。データ(「相対的発現(%)」)はRPL39値に対する割合である。
(図29)(A) 推定上の乳がん幹細胞(T-EPCR+)および同じ腫瘍由来のより分化した表現型を有する細胞(T-CD24+)でのSLC9A3R1、FNDC1、FOXC1、PACAP、LHX1、およびHOXA10遺伝子、ならびに(B) 適合原発腫瘍(星で示されている)および異なる臓器から回収された遠隔転移(DM)のHOXA10、FOXC1、PACAP、およびLHX1遺伝子由来のDNAの定量的なメチル化特異的PCR (qMSP)分析の結果を描く一連の棒グラフである。各遺伝子に対する平均Ct値をRPL39値に対して規準化した(実施例1参照)。データ(「相対的発現(%)」)はRPL39値に対する割合である。
(図30)関連するAscI認識配列(大字および下線の)ならびに複数のCpGジヌクレオチド(影付き)を含むFNDC1遺伝子の領域のヌクレオチド配列(SEQ ID NO:11)の描写である。配列決定されるセグメントは、(FNDC1遺伝子転写開始部位に対して)上流のbp番号285 (bp -285)から上流のbp番号614 (bp -614)に及び、したがって配列決定されるセグメント全体がプロモーター領域内にある。
(図31)関連するAscI認識配列(大字および下線の)ならびに複数のCpGジヌクレオチド(影付き)を含むFOXC1遺伝子の領域のヌクレオチド配列(SEQ ID NO:12)の描写である。配列決定されるセグメントは、(FOXC1遺伝子転写開始部位に対して) bp番号5250 (bp 5250)からbp番号4976 (bp 4976)に及び、したがって配列決定されるセグメント全体がプロモーター領域内にある。
(図32)関連するAscI認識配列(大字および下線の)ならびに複数のCpGジヌクレオチド(影付き)を含むPACAP遺伝子の領域のヌクレオチド配列(SEQ ID NO:13)の描写である。配列決定されるセグメントは、(PACAP遺伝子転写開始部位に対して) bp番号4404 (bp 4404)からbp番号4736 (bp 4736)に及び、したがって配列決定されるセグメント全体がプロモーター領域内にある。
(図33)関連するAscI認識配列(大字および下線の)ならびに複数のCpGジヌクレオチド(影付き)を含むDDN遺伝子の領域のヌクレオチド配列(SEQ ID NO:14)の描写である。配列決定されるセグメントは、(PACAP遺伝子転写開始部位に対して) bp番号2108 (bp 2108)からbp番号2290 (bp 2290)に及び、したがって配列決定されるセグメント全体が第2エクソン内にある。
(図34)関連するAscI認識配列(大字および下線の)ならびに複数のCpGジヌクレオチド(影付き)を含むLHX1遺伝子の領域のヌクレオチド配列(SEQ ID NO:15)の描写である。配列決定されるセグメントは、(LHX1遺伝子転写開始部位に対して) bp番号3600 (bp 3600)からbp番号3810 (bp 3810)に及び、したがって配列決定されるセグメント全体が第3〜4イントロン内にある。
(図35)関連するAscI認識配列(大字および下線の)ならびに複数のCpGジヌクレオチド(影付き)を含むSOX13遺伝子の領域のヌクレオチド配列(SEQ ID NO:16)の描写である。配列決定されるセグメントは、(SOX13遺伝子転写開始部位に対して) bp番号669 (bp 669)からbp番号374 (bp 374)に及び、したがって配列決定されるセグメント全体がプロモーター領域内にある。
(図36)関連するAscI認識配列(大字および下線の)ならびに複数のCpGジヌクレオチド(影付き)を含むDTX遺伝子の領域のヌクレオチド配列(SEQ ID NO:17)の描写である。配列決定されるセグメントは、(DTX遺伝子転写開始部位に対して) bp番号228 (bp 228)からbp番号551 (bp 551)に及び、したがって配列決定されるセグメント全体がプロモーター領域内にある。
(図37)関連するAscI認識配列(大字および下線の)ならびに複数のCpGジヌクレオチド(影付き)を含むHOXA10遺伝子の領域のヌクレオチド配列(SEQ ID NO:18)の描写である。配列決定されるセグメントは、(HOXA10遺伝子転写開始部位に対して) bp番号4270 (bp 4270)からbp番号4634 (bp 4634)に及び、したがって配列決定されるセグメント全体がプロモーター領域内にある。
(図38)関連するAscI認識配列(大字および下線の)ならびに複数のCpGジヌクレオチド(影付き)を含むSLC9A3R1遺伝子の領域のヌクレオチド配列(SEQ ID NO:1543)の描写である。配列決定されるセグメントは、(SLC9A3R1遺伝子転写開始部位に対して) bp番号11713 (bp 11713)からbp番号11978 (bp 11978)に及び、したがって配列決定されるセグメント全体が第1〜2イントロン内にある。
(図39)関連するAscI認識配列(大字および下線の)ならびに複数のCpGジヌクレオチド(影付き)を含むCDC42Ep5遺伝子の領域のヌクレオチド配列(SEQ ID NO:11544)の描写である。配列決定されるセグメントは、(CDC42Ep5遺伝子転写開始部位に対して) bp番号7855 (bp 7855)からbp番号8058 (bp 8058)に及び、したがって配列決定されるセグメント全体が第3エクソン内にある。
【図1】

【図2】

【図3】

【図4】

【図5】

【図6A】

【図6B】

【図7A】

【図7B】

【図8A】

【図8B】

【図9】

【図10】

【図11】

【図12】

【図13】

【図14】

【図15】

【図16A】

【図16B】

【図17A】

【図17B】

【図18A】

【図18B】

【図19A】

【図19B】

【図20A】

【図20B】

【図21A】

【図21B】

【図22A】

【図22B】

【図23A】

【図23B】

【図23C】

【図23D】

【図23E】

【図23F】

【図24】

【図25A】

【図25B】

【図25C】

【図25D】

【図26A】

【図26B】

【図26C】

【図27A】

【図27B】

【図28】

【図29A】

【図29B】

【図30】

【図31】

【図32】

【図33】

【図34】

【図35】

【図36】

【図37】

【図38】

【図39】


【特許請求の範囲】
【請求項1】
メチル化特異的なデジタル核型分析(MSDK)ライブラリーを作製する方法であって、以下の段階を含む方法:
試験細胞のゲノムDNAの全部または一部を提供する段階;
DNAをメチル化感受性マッピング制限酵素(MMRE)に曝露して、複数の第1の断片を作出する段階;
親和性対の第1のメンバーを含む結合成分を、第1の断片のそれぞれの一方の末端にまたは両方の末端に結合させ、この結合によって複数の第2の断片をもたらす段階;
複数の第2の断片を断片化用の制限酵素(FRE)に曝露して、親和性対の第1のメンバーを一方の末端におよびFREの5'切断配列またはFREの3'切断配列を他方の末端にそれぞれが含んだ、複数の第3の断片を作出する段階;
複数の第3の断片を、複数の親和性対の第2のメンバーが結合されている不溶性基材と接触させ、該接触によってそれぞれが、不溶性基材に親和性対の第1および第2のメンバーを介して結合した第3の断片である、複数の結合した第3の断片をもたらす段階;
放出用の制限酵素(RRE)認識配列および、RREの認識配列の3'側に、FREの5'切断配列またはFREの3'切断配列のいずれかを含んだ放出用の成分を、結合した第3の断片の遊離末端に結合させ、この結合によってそれぞれが、(i) RREの認識配列を一方の末端に含んだ、ならびに(ii) 他方の末端の親和性対の第1のメンバーおよび親和性対の第2のメンバーを介して不溶性基材に結合した、複数の結合した第4の断片をもたらす段階; および
結合した第4の断片をRREに曝露し、この曝露によってそれぞれが、ゲノムDNAの複数の塩基対からなるMSDKタグおよび放出用の成分を含んだ、複数の第5の断片を含むMSDKライブラリーの、不溶性基材からの放出をもたらす段階。
【請求項2】
MMREがAscIである、請求項1記載の方法。
【請求項3】
FREがNlaIIIである、請求項1記載の方法。
【請求項4】
RREがMmeIである、請求項1記載の方法。
【請求項5】
結合成分がMMREの5'または3'切断配列をさらに含む、請求項1記載の方法。
【請求項6】
結合成分がMMREの5'または3'認識配列と親和性対の第1のメンバーとの間に、複数の塩基対を含むリンカー核酸配列をさらに含む、請求項1記載の方法。
【請求項7】
放出用の成分がRRE認識配列の5'側に、複数の塩基対を含む伸長用核酸配列をさらに含む、請求項1記載の方法。
【請求項8】
MSDKライブラリーを分析する方法であって、以下の段階を含む方法:
請求項1記載の方法によって作製されるMSDKライブラリーを提供する段階;
1つのタグ、複数のタグ、または全てのタグのヌクレオチド配列を同定する段階。
【請求項9】
複数のタグのヌクレオチド配列を同定する段階が以下の段階を含む、請求項8記載の方法:
ともに連結された2つの第5の断片をそれぞれが含んだ、複数のジタグ(ditag)を作製する段階;
それぞれのジタグ断片が2つのMSDKタグを含む、複数のジタグまたはジタグ断片を含んだ鎖状体を形成させる段階;
鎖状体のヌクレオチド配列を決定する段階; および
鎖状体のヌクレオチド配列から、鎖状体が含むMSDKタグの1つまたは複数のヌクレオチド配列を推定する段階。
【請求項10】
ジタグ断片がジタグをFREに曝露することにより作製される、請求項9記載の方法。
【請求項11】
複数のジタグを作製した後におよび鎖状体を形成させる前に、ジタグの数をPCRによって増大させる段階をさらに含む、請求項9記載の方法。
【請求項12】
タグの一部または全部の相対頻度を判定する段階をさらに含む、請求項8記載の方法。
【請求項13】
MSDKライブラリーを分析する方法であって、以下の段階を含む方法:
請求項1記載の方法によって作製されるMSDKライブラリーを提供する段階; および
ライブラリーから選択されたタグの配列に対応する染色体部位を同定する段階。
【請求項14】
同定された染色体部位に最も近いMMREの非メチル化全認識配列の、試験細胞のゲノムにおける、染色体位置を判定する段階をさらに含む、請求項9記載の方法。
【請求項15】
染色体部位の同定および染色体位置の判定が、ゲノムまたはゲノムの一部のヌクレオチド配列、MMREの全認識配列のヌクレオチド配列、FREの全認識配列のヌクレオチド配列、およびRREの全認識配列をRRE切断部位から分離するヌクレオチド数を用いて作出された仮想タグライブラリーと、選択されたタグのヌクレオチド配列を比較する段階を含む過程によって行われる、請求項13記載の方法。
【請求項16】
複数のMMRE非メチル化認識配列の染色体位置を判定する方法であって、請求項14記載の方法を、ライブラリーから得られる複数のタグで繰り返す段階を含む方法。
【請求項17】
試験細胞が脊椎動物細胞である、請求項1記載の方法。
【請求項18】
試験細胞が哺乳動物試験細胞である、請求項1記載の方法。
【請求項19】
哺乳動物試験細胞がヒト試験細胞である、請求項18記載の方法。
【請求項20】
試験細胞が正常細胞である、請求項18記載の方法。
【請求項21】
試験細胞ががん細胞である、請求項18記載の方法。
【請求項22】
がん細胞が乳がん細胞である、請求項21記載の方法。
【請求項23】
親和性対の第1のメンバーがビオチンまたはイミノビオチンである、請求項1記載の方法。
【請求項24】
親和性対の第1のメンバーが抗原、ハプテン決定基、一本鎖ヌクレオチド配列、ホルモン、接着受容体のリガンド、接着リガンドの受容体、レクチンのリガンド、レクチン、免疫グロブリンFc領域の全部もしくは一部を含んだ分子、細菌のプロテインA、または細菌のプロテインGである、請求項1記載の方法。
【請求項25】
不溶性基材が磁気ビーズを含む、請求項1記載の方法。
【請求項26】
生体細胞を分類する方法であって、以下の段階を含む方法:
(a) 請求項12記載の方法を行う段階、それにより試験細胞に対する試験MSDKプロファイルを得る段階;
(b) 試験MSDKプロファイルを、1つまたは複数の対照の細胞型に対する別の対照MSDK発現プロファイルと比較する段階;
(c) 試験MSDKプロファイルに最も酷似している対照MSDKプロファイルを選択する段階; ならびに
(d) 段階(c)で選択された対照MSDKプロファイルの細胞型に適合する細胞型を試験細胞に割り当てる段階。
【請求項27】
試験および対照細胞が脊椎動物細胞である、請求項26記載の方法。
【請求項28】
試験および対照細胞が哺乳動物細胞である、請求項27記載の方法。
【請求項29】
試験および対照細胞がヒト細胞である、請求項28記載の方法。
【請求項30】
対照の細胞型が、対照の正常細胞および正常細胞と同じ組織の対照のがん細胞を含む、請求項28記載の方法。
【請求項31】
対照の正常細胞および対照のがん細胞が乳房細胞である、請求項30記載の方法。
【請求項32】
対照の正常細胞および対照のがん細胞が結腸、肺、前立腺、および膵臓からなる群より選択される組織のものである、請求項30記載の方法。
【請求項33】
試験細胞が乳房細胞である、請求項30記載の方法。
【請求項34】
試験細胞が結腸、肺、前立腺、および膵臓からなる群より選択される組織のものである、請求項30記載の方法。
【請求項35】
対照の細胞型が単一組織のがんのうちの異なる部類の細胞を含む、請求項26記載の方法。
【請求項36】
単一組織のがんのうちの異なる部類が非浸潤性乳管がん(DCIS)細胞および浸潤性乳がん細胞を含む、請求項35記載の方法。
【請求項37】
単一組織のがんのうちの異なる部類が、以下: 高悪性度DCIS細胞、中悪性度DCIS細胞; および低悪性度DCIS細胞の2つまたはそれ以上を含む、請求項35記載の方法。
【請求項38】
対照の細胞型が以下: 肺がん細胞; 乳がん細胞; 結腸がん細胞; 前立腺がん細胞; および膵臓がん細胞の2つまたはそれ以上を含む、請求項28記載の方法。
【請求項39】
対照の細胞型が、非がん組織から得られた上皮細胞および非がん組織から得られた筋上皮細胞を含む、請求項26記載の方法。
【請求項40】
診断方法であって、以下の段階:
(a) 試験乳房上皮細胞を提供する段階;
(b) 遺伝子が、表5に列挙されているMSDKタグによって同定されるものから選択され、1つまたは複数のC残基がCpG配列中のC残基である、試験細胞における遺伝子中の1つまたは複数のC残基のメチル化の程度を判定する段階; および
(c) 1つまたは複数の残基のメチル化の程度を、非がん性の乳房組織から得られた対照の上皮細胞における対応する遺伝子中の対応する1つまたは複数のC残基のメチル化の程度と比較する段階を含み、
対照の上皮細胞と比較して試験上皮細胞における1つまたは複数のC残基のメチル化の程度の変化は、試験上皮細胞ががん細胞であるという徴候である、方法。
【請求項41】
メチル化の程度の変化が、より低いメチル化の程度である、請求項40記載の方法。
【請求項42】
メチル化の程度の変化が、より高いメチル化の程度である、請求項40記載の方法。
【請求項43】
メチル化の程度の変化が、遺伝子のプロモーター領域中である、請求項40記載の方法。
【請求項44】
メチル化の程度の変化が、遺伝子のエクソン中または遺伝子のイントロン中である、請求項40記載の方法。
【請求項45】
遺伝子がPRDM14およびZCCHC14からなる群より選択される、請求項40記載の方法。
【請求項46】
診断方法であって、以下の段階:
(a) 試験結腸上皮細胞を提供する段階;
(b) 遺伝子が、表2に列挙されているMSDKタグによって同定されるものから選択され、1つまたは複数のC残基がCpG配列中のC残基である、試験細胞における遺伝子中の1つまたは複数のC残基のメチル化の程度を判定する段階; および
(c) 1つまたは複数の残基のメチル化の程度を、非がん性の結腸組織から得られた対照の上皮細胞における対応する遺伝子中の対応する1つまたは複数のC残基のメチル化の程度と比較する段階を含み、
対照の上皮細胞と比較して試験上皮細胞における1つまたは複数のC残基のメチル化の程度の変化は、試験上皮細胞ががん細胞であるという徴候である、方法。
【請求項47】
メチル化の程度の変化が、より低いメチル化の程度である、請求項46記載の方法。
【請求項48】
メチル化の程度の変化が、より高いメチル化の程度である、請求項46記載の方法。
【請求項49】
メチル化の程度の変化が、遺伝子のプロモーター領域中である、請求項46記載の方法。
【請求項50】
メチル化の程度の変化が、遺伝子のエクソン中または遺伝子のイントロン中である、請求項46記載の方法。
【請求項51】
遺伝子がLHX3、TCF7L1、およびLMX-1Aからなる群より選択される、請求項46記載の方法。
【請求項52】
診断方法であって、以下の段階:
(a) 試験乳房組織から得られる試験筋上皮細胞を提供する段階;
(b) 遺伝子が、表10に列挙されているMSDKタグによって同定されるものから選択され、1つまたは複数のC残基がCpG配列中のC残基である、試験細胞における遺伝子中の1つまたは複数のC残基のメチル化の程度を判定する段階; および
(c) 1つまたは複数の残基のメチル化の程度を、非がん性の乳房組織から得られた対照の筋上皮細胞における対応する遺伝子中の対応する1つまたは複数のC残基のメチル化の程度と比較する段階を含み、
対照の筋上皮細胞と比較して試験筋上皮細胞における1つまたは複数のC残基のメチル化の程度の変化は、試験乳房組織ががん組織であるという徴候である、方法。
【請求項53】
メチル化の程度の変化が、より低いメチル化の程度である、請求項52記載の方法。
【請求項54】
メチル化の程度の変化が、より高いメチル化の程度である、請求項52記載の方法。
【請求項55】
メチル化の程度の変化が、遺伝子のプロモーター領域中である、請求項52記載の方法。
【請求項56】
メチル化の程度の変化が、遺伝子のエクソン中または遺伝子のイントロン中である、請求項52記載の方法。
【請求項57】
遺伝子がHOXD4、SLC9A3R1、およびCDC42EP5からなる群より選択される、請求項52記載の方法。
【請求項58】
診断方法であって、以下の段階:
(a) 試験乳房組織から得られる試験線維芽細胞を提供する段階;
(b) 遺伝子が、表7および8に列挙されているMSDKタグによって同定されるものから選択され、1つまたは複数のC残基がCpG配列中のC残基である、試験細胞における遺伝子中の1つまたは複数のC残基のメチル化の程度を判定する段階; および
(c) 1つまたは複数の残基のメチル化の程度を、非がん性の乳房組織から得られた対照の線維芽細胞における対応する遺伝子中の対応する1つまたは複数のC残基のメチル化の程度と比較する段階を含み、
対照の線維芽細胞と比較して試験線維芽細胞における1つまたは複数のC残基のメチル化の程度の変化は、試験乳房組織ががん組織であるという徴候である、方法。
【請求項59】
メチル化の程度の変化が、より低いメチル化の程度である、請求項58記載の方法。
【請求項60】
メチル化の程度の変化が、より高いメチル化の程度である、請求項58記載の方法。
【請求項61】
メチル化の程度の変化が、遺伝子のプロモーター領域中である、請求項58記載の方法。
【請求項62】
メチル化の程度の変化が、遺伝子のエクソン中または遺伝子のイントロン中である、請求項58記載の方法。
【請求項63】
遺伝子がCxorf12である、請求項58記載の方法。
【請求項64】
細胞が上皮細胞または筋上皮細胞である可能性を判定する方法であって、以下の段階:
(a) 試験細胞を提供する段階;
(b) 遺伝子が、表12に列挙されているMSDKタグによって同定されるものから選択され、1つまたは複数のC残基がCpG配列中のC残基である、試験細胞における遺伝子中の1つまたは複数のC残基のメチル化の程度を判定する段階; ならびに
(c) 1つまたは複数の残基のメチル化の程度を、対照の筋上皮細胞における対応する遺伝子中の対応する1つまたは複数のC残基のメチル化の程度とおよび対照の上皮細胞における対応する遺伝子中の対応する1つまたは複数のC残基のメチル化の程度と比較する段階を含み、
試験細胞は、(i) 試験サンプルにおけるメチル化の程度が対照の筋上皮細胞におけるメチル化の程度にいっそう酷似しているなら、筋上皮細胞である可能性がいっそう高く; または(ii) 試験サンプルにおけるメチル化の程度が対照の上皮細胞におけるメチル化の程度にいっそう酷似しているなら、上皮細胞である可能性がいっそう高い、方法。
【請求項65】
C残基が、遺伝子のプロモーター領域中である、請求項64記載の方法。
【請求項66】
C残基が、遺伝子のエクソン中または遺伝子のイントロン中である、請求項64記載の方法。
【請求項67】
遺伝子がLOC389333およびCDC42EP5からなる群より選択される、請求項64記載の方法。
【請求項68】
診断方法であって、以下の段階:
(a) 試験組織から試験細胞を提供する段階;
(b) 1つまたは複数のC残基がCpG配列中のC残基である、試験細胞におけるPRDM14遺伝子中の1つまたは複数のC残基のメチル化の程度を判定する段階; および
(c) 1つまたは複数の残基のメチル化の程度を、試験細胞と同じ組織の非がん組織から得られた対照細胞におけるPRDM14遺伝子中の対応する1つまたは複数のC残基のメチル化の程度と比較する段階を含み、対照細胞と比較して試験細胞における1つまたは複数のC残基のメチル化の程度の変化は、試験細胞ががん細胞であるという徴候である、方法。
【請求項69】
メチル化の程度の変化が、より低いメチル化の程度である、請求項68記載の方法。
【請求項70】
メチル化の程度の変化が、より高いメチル化の程度である、請求項68記載の方法。
【請求項71】
メチル化の程度の変化が、遺伝子のプロモーター領域中である、請求項68記載の方法。
【請求項72】
メチル化の程度の変化が、遺伝子のエクソン中または遺伝子のイントロン中である、請求項68記載の方法。
【請求項73】
試験および対照細胞が乳房細胞である、請求項68記載の方法。
【請求項74】
試験および対照細胞が結腸、肺、前立腺、および膵臓からなる群より選択される組織のものである、請求項68記載の方法。
【請求項75】
以下の段階を含む、診断方法:
(a) 試験上皮細胞を含む乳房組織の試験サンプルを提供する段階;
(b) 遺伝子が正常な乳房上皮細胞と比較して、実質的に変化しているレベルで乳がん上皮細胞において発現される遺伝子である、表5に列挙されているものから選択される遺伝子の試験上皮細胞中での発現レベルを判定する段階; および
(c) (i) 試験細胞における遺伝子の発現レベルが、正常な乳房上皮細胞の対照の発現レベルと比較して実質的に変化していないなら、正常な乳房上皮細胞と; または(ii) 試験細胞における遺伝子の発現レベルが、正常な乳房上皮細胞の対照の発現レベルと比較して実質的に変化しているなら、乳がん上皮細胞と試験細胞を分類する段階。
【請求項76】
遺伝子がPRDM14およびZCCHC14からなる群より選択される、請求項75記載の方法。
【請求項77】
発現レベルの変化が発現レベルの増加である、請求項75記載の方法。
【請求項78】
発現レベルの変化が発現レベルの減少である、請求項75記載の方法。
【請求項79】
以下の段階を含む、診断方法:
(a) 試験上皮細胞を含む結腸組織の試験サンプルを提供する段階;
(b) 遺伝子が正常な結腸上皮細胞と比較して、実質的に変化しているレベルで結腸上皮細胞において発現される遺伝子である、表2に列挙されているものから選択される遺伝子の試験上皮細胞中での発現レベルを判定する段階; および
(c) (i) 試験細胞における遺伝子の発現レベルが、正常な結腸上皮細胞の対照の発現レベルと比較して実質的に変化していないなら、正常な結腸上皮細胞と; または(ii) 試験細胞における遺伝子の発現レベルが、正常な結腸上皮細胞の対照の発現レベルと比較して実質的に変化しているなら、結腸がん上皮細胞と試験細胞を分類する段階。
【請求項80】
遺伝子がLHX3、TCF7L1、およびLMX-1Aからなる群より選択される、請求項79記載の方法。
【請求項81】
発現レベルの変化が発現レベルの増加である、請求項79記載の方法。
【請求項82】
発現レベルの変化が発現レベルの減少である、請求項79記載の方法。
【請求項83】
以下の段階を含む、診断方法:
(a) 試験間質細胞を含む乳房組織の試験サンプルを提供する段階;
(b) 遺伝子が正常な乳房組織に存在する場合よりも乳がん組織に存在する場合に実質的に変化しているレベルで、試験間質細胞と同じ型の細胞において発現される遺伝子である、表7、8、および10に列挙されているものから選択される遺伝子の間質細胞中での発現レベルを判定する段階; ならびに
(c) (i) 試験間質細胞における遺伝子の発現レベルが、正常な乳房組織中の試験間質細胞と同じ型の対照細胞の対照発現レベルと比較して実質的に変化していないなら、正常な乳房組織と; または(ii) 試験間質細胞における遺伝子の発現レベルが、正常な乳房組織中の試験間質細胞と同じ型の対照細胞の対照発現レベルと比較して実質的に変化しているなら、乳がん組織と試験サンプルを分類する段階。
【請求項84】
試験および対照間質細胞が筋上皮細胞であり、遺伝子が表10に列挙されているものから選択される、請求項83記載の方法。
【請求項85】
遺伝子がHOXD4、SLC9A3R1、およびCDC32EP5からなる群より選択される、請求項83記載の方法。
【請求項86】
試験および対照間質細胞が線維芽細胞であり、遺伝子が表7および8に列挙されているものから選択される、請求項83記載の方法。
【請求項87】
遺伝子がCxorf12である、請求項83記載の方法。
【請求項88】
発現レベルの変化が発現レベルの増加である、請求項83記載の方法。
【請求項89】
発現レベルの変化が発現レベルの減少である、請求項83記載の方法。
【請求項90】
細胞が上皮細胞または筋上皮細胞である可能性を判定する方法であって、以下の段階を含む方法:
(a) 試験細胞を提供する段階;
(b) 表12に列挙されているMSDKタグによって同定されるものからなる群より選択される遺伝子の試験サンプル中での発現レベルを判定する段階;
(c) 試験サンプルにおける選択遺伝子の発現レベルが(i) 対照の筋上皮細胞または(ii) 対照の上皮細胞における選択遺伝子の発現レベルにいっそう酷似しているかどうかを判定する段階; および
(d) (i) 試験細胞における遺伝子の発現レベルが対照の筋上皮細胞における遺伝子の発現レベルにいっそう酷似しているなら、筋上皮細胞である可能性が高いと; または(ii) 試験細胞における遺伝子の発現レベルが対照の上皮細胞における遺伝子の発現レベルにいっそう酷似しているなら、上皮細胞である可能性が高いと試験細胞を分類する段階。
【請求項91】
遺伝子がLOC389333およびCDC42EP5からなる群より選択される、請求項90記載の方法。
【請求項92】
以下の段階を含む、診断方法:
(a) 試験細胞を提供する段階;
(b) PRDM14遺伝子の試験細胞における発現レベルを判定する段階; および
(c) (i) 試験細胞における遺伝子の発現レベルが、試験細胞と同じ組織の対照の正常細胞に対する対照の発現レベルと比較して実質的に変化していないなら、正常細胞と; または(ii) 試験細胞における遺伝子の発現レベルが、試験細胞と同じ組織の対照の正常細胞に対する対照の発現レベルと比較して実質的に変化しているなら、がん細胞と試験細胞を分類する段階。
【請求項93】
発現レベルの変化が発現レベルの増加である、請求項92記載の方法。
【請求項94】
発現レベルの変化が発現レベルの減少である、請求項92記載の方法。
【請求項95】
試験および対照細胞が乳房細胞である、請求項92記載の方法。
【請求項96】
試験および対照細胞が結腸、肺、前立腺、および膵臓からなる群より選択される組織のものである、請求項92記載の方法。
【請求項97】
以下を含む、一本鎖核酸プローブ:
(a) 表2、5、7、8、10、12、15、および16に列挙されているものから選択されるタグのヌクレオチド配列; または
(b) ヌクレオチド配列の相補体。
【請求項98】
それぞれのアドレスがその上に:
(a) 表2、5、7、8、10、12、15および16に列挙されているものから選択されるタグヌクレオチド配列からなる核酸配列; または
(b) 核酸配列の相補体
を含む捕捉プローブを配置した、少なくとも10個のアドレスを有する基材を含んだアレイ。
【請求項99】
それぞれのプローブが、以下:
(a) 表2、5、7、8、10、12、15および16に列挙されているものから選択されるタグヌクレオチド配列を含む核酸配列; または
(b) 核酸配列の相補体
を含んだ、少なくとも10個のプローブを含むキット。
【請求項100】
抗体のそれぞれが、表2、5、7、8、10、12、15、および16に列挙されているタグからなる群より選択されるタグによって同定される遺伝子によりコードされる異なるタンパク質に特異的である、少なくとも10種の抗体を含んだキット。
【請求項101】
細胞が幹細胞、分化内腔上皮細胞または筋上皮細胞である可能性を判定する方法であって、以下の段階:
(a) 試験細胞を提供する段階;
(b) 遺伝子が、表15または16に列挙されているMSDKタグによって同定されるものから選択され、1つまたは複数のC残基がCpG配列中のC残基である、試験細胞における遺伝子中の1つまたは複数のC残基のメチル化の程度を判定する段階; ならびに
(c) 1つまたは複数の残基のメチル化の程度を、対照の幹細胞における対応する遺伝子中の対応する1つまたは複数のC残基のメチル化の程度と、対照の幹細胞における対応する遺伝子中の対応する1つまたは複数のC残基のメチル化の程度と、および対照の分化内腔上皮細胞における対応する遺伝子中の対応する1つまたは複数のC残基のメチル化の程度と、および対照の筋上皮細胞における対応する遺伝子中の対応する1つまたは複数のC残基のメチル化の程度と比較する段階を含み、試験細胞は、(i) 試験細胞におけるメチル化の程度が対照の幹細胞におけるメチル化の程度にいっそう酷似しているなら、幹細胞である可能性がいっそう高く; (ii) 試験細胞におけるメチル化の程度が対照の分化内腔上皮細胞におけるメチル化の程度にいっそう酷似しているなら、分化内腔上皮細胞である可能性がいっそう高く; または(iii) 試験細胞におけるメチル化の程度が対照の筋上皮細胞におけるメチル化の程度にいっそう酷似しているなら、筋上皮細胞である可能性がいっそう高い、方法。
【請求項102】
C残基が、遺伝子のプロモーター領域中である、請求項101記載の方法。
【請求項103】
C残基が、遺伝子のエクソン中または遺伝子のイントロン中である、請求項101記載の方法。
【請求項104】
遺伝子がSOX13、SLC9A3R1、FNDC1、FOXC1、PACAP、DDN、CDC42EP5、LHX1、およびHOXA10からなる群より選択される、請求項101記載の方法。
【請求項105】
細胞が幹細胞、分化内腔上皮細胞、または筋上皮細胞である可能性を判定する方法であって、以下の段階を含む方法:
(a) 試験細胞を提供する段階;
(b) 表15または16に列挙されているMSDKタグによって同定されるものからなる群より選択される遺伝子の試験サンプル中での発現レベルを判定する段階;
(c) 試験サンプルにおける選択遺伝子の発現レベルが(i) 対照の幹細胞、(ii) 対照の分化内腔上皮細胞、または(ii) 対照の筋上皮細胞における選択遺伝子の発現レベルにいっそう酷似しているかどうかを判定する段階; および
(d) (i) 試験細胞における遺伝子の発現レベルが対照の幹細胞における遺伝子の発現レベルにいっそう酷似しているなら、幹細胞である可能性が高いと; (ii) 試験細胞における遺伝子の発現レベルが対照の上皮細胞における遺伝子の発現レベルにいっそう酷似しているなら、分化内腔上皮細胞である可能性が高いと; または(iii) 試験細胞における遺伝子の発現レベルが対照の筋上皮細胞における遺伝子の発現レベルにいっそう酷似しているなら、筋上皮細胞である可能性が高いと試験細胞を分類する段階。
【請求項106】
対照細胞が乳房細胞である、請求項105記載の方法。
【請求項107】
乳房細胞が乳がん細胞である、請求項106記載の方法。
【請求項108】
遺伝子がSOX13、SLC9A3R1、FNDC1、FOXC1、PACAP、DDN、CDC42EP5、LHX1、およびHOXA10からなる群より選択される、請求項105〜107のいずれか記載の方法。

【公表番号】特表2008−545417(P2008−545417A)
【公表日】平成20年12月18日(2008.12.18)
【国際特許分類】
【出願番号】特願2008−513818(P2008−513818)
【出願日】平成18年5月30日(2006.5.30)
【国際出願番号】PCT/US2006/020843
【国際公開番号】WO2006/128140
【国際公開日】平成18年11月30日(2006.11.30)
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.フロッピー
【出願人】(399052796)ダナ−ファーバー キャンサー インスティテュート インク. (36)
【Fターム(参考)】