BRCA1における一塩基多型および癌のリスク
本発明は、マイクロRNA(miRNA)の結合効力を修正する、乳癌および卵巣癌関連遺伝子内の突然変異(例えば、一塩基多型(SNP))を同定するための方法を提供する。好ましい実施形態では、本発明の方法は、少なくとも1つのmiRNAの結合効力を増加または減少させることによって、BRCA1遺伝子の発現を減少させるSNPを同定する。miRNA結合部位内にSNPを導入することによるBRCA1に結合するmiRNAの改変は、BRCA1発現を調節するかまたは減少させ、最終的には、乳癌細胞または卵巣癌細胞の制御されない細胞増殖をもたらす。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願
この出願は、2009年6月25日に出願された仮出願USSN61/220,342号(この内容は、その全体が参考として本明細書に援用される)に関する。
【0002】
政府の援助
本発明は、共にNational Institutes of Healthによって付与された助成金第CA124484号および第CA131301−01A1号の下、政府の支援を受けてなされた。政府は、本発明に一定の権利を有する。
【0003】
発明の分野
一般的に、本発明は、癌および分子生物学の分野に関する。本発明は、癌を発症するリスクの増加を予測するための組成物および方法を提供する。
【背景技術】
【0004】
癌検出の分野における進歩があるにもかかわらず、当技術分野では、臨床応用に容易に使用することができる様々な癌のための新規な遺伝子マーカーを同定する必要がある。これまで、癌を発症するリスクを予測するのに使用可能な選択肢は、比較的少ない。
【発明の概要】
【0005】
本発明の方法は、miRNAの標的への結合能力を修正する可能性のある乳癌遺伝子および卵巣癌遺伝子における多型を同定するだけでなく、標的遺伝子調節に対するこれらのSNPの影響ならびに乳癌および卵巣癌のリスクを評価するための手段を提供する。これらの方法は、従来は認識されていなかった、乳癌および卵巣癌のリスクが増加している患者を同定するために使用される。本発明の方法を使用して、BRCA1遺伝子もしくはそのメッセンジャーRNA(mRNA)転写産物周辺の領域内またはこれらを含む領域内で生じるSNPを同定することおよび特性評価することに特に関連する。
【0006】
本発明は、マイクロRNA(miRNA)の結合能力を修正する可能性のある乳癌および卵巣癌関連遺伝子の3’非翻訳領域(UTR)における一塩基多型(SNP)を同定するための方法を提供する。好ましい実施形態では、乳癌および卵巣癌関連遺伝子は、BRCA1遺伝子それ自体、ゲノム内の周辺領域、BRCA1調節エレメントおよび/またはそれらのメッセンジャーRNA(mRNA)転写産物を含むBRCA1である。HapMap(The International HapMap Project.Nature,2003.426,789−96)、dbSNP(Sherry,S.Tら、Genome Res 1999.9,677−9)および(http://www.ensembl.orgで利用可能な)Ensembl Project databaseなどの当該技術分野において承認されているいくつかのデータベースが目的のSNPをコンピュータで同定するのに使用されるほか、PicTar(Landi,D.ら、DNA Cell Biol(2007))、TargetScan(Lewis,B.P.ら、Cell 2005.120,15−20)、miRanda(John,B.ら、PLoS Biol 2004.2,e363)、miRNA.org(Betel,D.ら、Nucleic Acids Res 2008.36,D149−53)およびMicroInspector(Rusinov,V.ら、Nucleic Acids Res 2005.33,W696−700)などの特殊アルゴリズムもmiRNA結合部位を同定するのに使用されるが、これらに限定されない。
【0007】
本発明は、miRNA相補的(complimentary)部位における配列変異を評価するための、乳房腫瘍および卵巣腫瘍、隣接正常組織(使用可能な場合)ならびに正常組織試料を同定するための方法もまた提供する。この方法の好ましい実施形態では、BRCA1遺伝子またはそのmRNA転写産物は、miRNA相補的(complimentary)部位を含む。本発明のある実施形態では、変異が生殖系列SNPである場合、隣接する正常組織は確認するのに使用される。あるいはまたはさらに、生殖系列ではない3’UTR変異もまた、臨床的重要性について分析される。
【0008】
また、本発明は、インビトロにおける標的遺伝子調節に対する同定されたSNPの影響を評価する方法を提供する。この方法の好ましい形態では、同定されたSNPは、BRCA1遺伝子内またはそのmRNA転写産物内に含まれる。この方法の別の好ましい形態では、同定されたSNPは、BRCA1mRNAの3’UTR内に含まれる。本発明のある形態では、発現レベルを測定するための細胞培養系およびルシフェラーゼアッセイ(Chin,L.J.ら、Cancer Res 2008.68,8535−40;Johnson,S.M.ら、Cell 2005.120,635−47)を使用して、SNPが評価される。野生型3’UTRを作製するために、ポリメラーゼ連鎖反応(PCR)が、細胞株からヒトゲノムDNAを増幅するのに使用される。変異体配列を構築するために、部位特異的突然変異誘発法が使用される(Johnson,S.M.ら、Cell 2005.120,635−47)。次いで、これらの構築物は、ルシフェラーゼレポーターにクローニングされる。最後に、GraphPad Prism(Chin,L.J.ら、Cancer Res 2008.68,8535−40)を使用して、レポーター発現が定量される。
【0009】
本発明は、乳癌または卵巣癌を発症するリスクを評価する方法をさらに提供する。この方法の一形態では、目的のSNPの保有率(prevalence)は、世界集団(world population)における予測保有率に関して、試料癌集団内で比較される。この方法の好ましい実施形態では、目的のSNPは、BRCA1遺伝子内またはそのmRNA転写産物内に含まれる。新規のSNPに関して、世界集団と比較する前に、TaqMan PCRアッセイ(Applied Biosystems)が対立遺伝子の識別のために行われ得る。本明細書において提供される方法の他の実施形態では、一般集団およびSNPを保有しない個体に関して、乳癌および/または卵巣癌を発症するSNPに関連したリスクの増加を決定するために、目的のSNPは、乳癌症例対照および卵巣癌症例対照と比較される。
【0010】
具体的には、本発明は、少なくとも1つの一塩基多型(SNP)を含む単離および精製されたBRCA1ハプロタイプであって、SNPの存在が被験体の乳癌または卵巣癌を発症するリスクを増加させる、BRCA1ハプロタイプを提供する。本発明のハプロタイプは、単離および精製されたゲノム配列またはcDNA配列である。また、ハプロタイプは、単離、精製、そして場合により増幅された配列である。ハプロタイプ配列が単離されるゲノムDNA配列およびcDNA配列は、体液および組織などの生物試料から得られる。最も一般的には、ハプロタイプが由来するDNA配列は、例えば、正常な被験体もしくは試験被験体から収集した血液試料または腫瘍試料から単離される。このハプロタイプの一形態では、SNPのそれぞれは、1つ以上のmiRNAの活性を変化させる。このハプロタイプの別の形態では、SNPのそれぞれは、1つ以上のmiRNAの活性を増加または減少させる。ある形態では、SNPは、1つ以上のmiRNAのmiRNA結合部位への結合効力を増加または減少させる。miRNA結合効力の変化は、BRCA1の発現を増加または減少させ、好ましい実施形態では、miRNA結合効力の変化は、BRCA1発現を減少させる。SNPは、BRCA1遺伝子の非コード領域またはコード領域、周辺遺伝子、およびBRCA1発現を調節、変化、増加もしくは減少させるゲノムの遺伝子間配列または遺伝子内配列に位置してもよい。BRCA1遺伝子の非コード領域およびコード領域に位置するSNPは、miRNA結合部位に位置し、その結果として、1つ以上のmiRNAの活性を阻害する。このハプロタイプのある実施形態では、SNPは、rs9911630、rs12516、rs8176318、rs3092995、rs1060915、rs799912、rs9908805およびrs17599948からなる群から選択される。好ましい実施形態では、SNPは、rs12516、rs8176318、rs3092995、rs1060915およびrs799912からなる群から選択される。最も選択的な実施形態では、ハプロタイプは、rs8176318およびrs1060915を含む。あるいは、SNPは、rs8176318であるかまたはrs1060915である。
【0011】
本明細書において記載されるハプロタイプは、被験体の乳癌または卵巣癌を発症するリスクを増加させる。乳癌および卵巣癌のすべてのサブタイプが本発明によって包含されるが、通常検討される乳癌の具体的なサブタイプは、トリプルネガティブ(TN)(ER/PR/HER2ネガティブ)、エストロゲン受容体ポジティブ(ER+)、エストロゲン受容体およびプロゲステロン受容体ポジティブ(ER+/PR+)ならびにヒト上皮成長因子受容体2ポジティブ(HER2+)である。好ましい実施形態では、本明細書において記載される珍しいハプロタイプは、最も高い頻度でTN乳癌と関連する。学説に縛られることなく、本明細書において列挙されるホルモン受容体特異的乳癌サブタイプの中で、乳癌は、最も低い頻度で散発性の原因に関連し、したがって、遺伝性である可能性が最も高い。TN乳癌もまた、特にアフリカ系アメリカ人被験体においてrs8176318 SNPおよび/またはrs1060915を含むハプロタイプに確実に関連する。
【0012】
本発明は、すべての開示されるハプロタイプを包含する。好ましいハプロタイプとしては、本明細書において記載される「珍しい」ハプロタイプが挙げられる:GGACGCTA(配列番号6)、GGCCGCTA(配列番号9)、GGCCGCTG(配列番号10)、GGACGCTG(配列番号21)またはGAACGTTG(配列番号26)。
【0013】
本発明は、乳癌または卵巣癌を発症するリスクの増加を示すBRCA1多型シグネチャーであって、以下の一塩基多型(SNP)rs8176318およびrs1060915の存在または非存在の決定を含み、これらのSNPの存在が乳癌または卵巣癌を発症するリスクの増加を示す、シグネチャーをさらに提供する。ある実施形態では、シグネチャーは、rs12516、rs3092995およびrs799912からなる群から選択される少なくとも1つのSNPの存在または非存在の決定をさらに含む。あるいはまたはさらに、シグネチャーは、rs9911630、rs9908805およびrs17599948からなる群から選択される少なくとも1つのSNPの存在または非存在の決定を含む。このシグネチャーの一形態では、rs8176318、rs1060915、rs12516、rs3092995、rs799912、rs9911630、rs9908805またはrs17599948は、少なくとも1つのマイクロRNA(miRNA)結合効力を変化させる。あるいは、rs8176318、rs1060915、rs12516、rs3092995、rs799912、rs9911630、rs9908805およびrs17599948は、少なくとも1つのマイクロRNA(miRNA)結合効力を増加または減少させる。少なくとも1つのmiRNAは、例えば、(http://www.mirbase.org/において公的に利用可能な)miRBaseによって提供されるあらゆるヒトmiRNAである。ある実施形態では、miRNAは、miR−19a、miR−18b、miR−19b、miR−146−5p、miR−18a、miR−365、miR−210、miR−7、miR−151−3p、miR−1180である。好ましくは、miRNAは、miR−7である。
【0014】
他の実施形態では、このシグネチャーは、1つ以上のマイクロRNAの結合効力を減少させるBRCA1遺伝子における少なくとも1つのSNPの存在または非存在の同定をさらに含む。少なくとも1つのSNPは、コード領域内または非コード領域内に生じてもよい。例示的な非コード領域としては、3’非翻訳領域(UTR)、イントロン、遺伝子間領域、シス調節エレメント、プロモーターエレメント、エンハンサーエレメントまたは5’非翻訳領域(UTR)が挙げられるが、これらに限定されない。限定されないコード領域の例は、エクソンである。
【0015】
本明細書において記載されるシグネチャーは、被験体の乳癌または卵巣癌を発症するリスクを決定する。乳癌および卵巣癌のすべてのサブタイプが本発明によって包含されるが、通常企図される乳癌の具体的なサブタイプは、トリプルネガティブ(TN)(ER/PR/HER2ネガティブ)、エストロゲン受容体ポジティブ(ER+)、エストロゲン受容体およびプロゲステロン受容体ポジティブ(ER+/PR+)ならびにヒト上皮成長因子受容体2ポジティブ(HER2+)である。好ましい実施形態では、本明細書において記載されるシグネチャーは、特にアフリカ系アメリカ人被験体におけるTN乳癌を発症するリスクを決定するのに使用される。
【0016】
本発明は、(a)試験被験体から試料を得る工程;(b)対照試料を得る工程;(c)試験試料由来のDNA配列内の少なくとも1つのmiRNA結合部位におけるSNPの存在または非存在を決定する工程;および(d)SNPを含む少なくとも1つのmiRNA結合部位への少なくとも1つのmiRNAの結合効力を、対照試料由来の対応するDNA配列における同じmiRNA結合部位への該miRNAの結合効力と比較して、評価する工程を含む、BRCA1遺伝子の発現を減少させ、かつ被験体の乳癌または卵巣癌を発症するリスクを増加させるSNPを同定する方法であって、対照試料と試験試料との間の、対応する結合部位への少なくとも1つのmiRNAの結合効力における統計的に有意な変化の存在が、SNPの存在または非存在がmiRNA介在性の防御を阻害するかまたはmiRNA介在性のBRCA1遺伝子発現の抑制を増大させることを示し、それによって、被験体の乳癌または卵巣癌を発症するリスクもまた増加させるSNPを同定する、方法をさらに提供する。対照試料と試験試料との間の、対応する結合部位への少なくとも1つのmiRNAの結合効力における統計的に有意な増加または減少の存在は、SNPの存在または非存在がmiRNA介在性の防御を阻害するかまたはBRCA1遺伝子発現の抑制を増大させることを示す。この方法のある実施形態では、試験被験体は、乳癌または卵巣癌と診断されている。対照的に、対照試料は、いかなる癌も有するとは診断されていない被験体から得られる。また、対照試料は、データベースまたは臨床研究から検索される対照値ともなり得る。試験試料または対照試料由来のDNA配列における結合部位へのmiRNAの結合効力は、インビボ、インビトロまたはエクスビボで評価される。
【0017】
本発明は、(a)試験被験体から試料を得る工程;(b)試験試料由来のDNA配列中の少なくとも1つのmiRNA結合部位におけるSNPの存在または非存在を決定する工程;および(c)1つ以上の世界集団におけるSNPの予測保有率に関して、乳癌集団または卵巣癌集団内のSNPの保有率を評価する工程を含む、BRCA1遺伝子の発現を減少させ、かつ被験体の乳癌または卵巣癌を発症するリスクを増加させるSNPを同定する方法であって、1つ以上の世界集団と比較した腫瘍試料中のSNPの存在または非存在における統計的に有意な増加が、SNPが乳癌または卵巣癌を発症するリスクの増加に陽性に関連することを示し、BRCA1の発現を減少させる少なくとも1つのmiRNA結合部位内のSNPの存在または非存在が、SNPの存在または非存在がmiRNA介在性の防御を阻害するかまたはmiRNA介在性のBRCA1遺伝子発現の抑制を増大させることを示し、それによって、被験体の乳癌または卵巣癌を発症するリスクもまた増加させるSNPを同定する、方法を提供する。この方法のある実施形態では、試験被験体は、乳癌または卵巣癌と診断されている。対照的に、対照試料は、いかなる癌も有するとは診断されていない被験体から得られる。また、対照試料は、データベースまたは臨床研究から検索される対照値ともなり得る。世界集団は、地理的集団(ヨーロッパ人もしくはアフリカ系アメリカ人)または民族的集団(アシュケナージ系ユダヤ人)であり、身体的理由または文化的理由に関する構成員は、類似の遺伝的背景を共有することが予想される。
【0018】
SNPを同定する方法に関して、miRNA結合部位は、実験的に決定され、データベースで同定され、またはアルゴリズムを使用して予測される。また、SNPの存在または非存在は、実験的に決定され、データベースで同定され、またはアルゴリズムを使用して予測される。
【0019】
また、本発明は、(a)試験被験体からDNA試料を得る工程;および(b)試料由来の少なくとも1つのDNA配列において、rs12516、rs8176318、rs3092995およびrs799912からなる群から選択される少なくとも1つのSNPの存在を決定する工程を含む、乳癌または卵巣癌を発症するリスクを有する被験体を同定する方法であって、少なくとも1つのDNA配列における少なくとも1つのSNPの存在が、被験体の乳癌または卵巣癌を発症するリスクを、正常な被験体と比較して10倍増加させる、方法を提供する。好ましい実施形態では、方法は、rs1060915の存在を決定する工程をさらに含み、少なくとも1つのDNA配列におけるrs1060915ならびにrs12516、rs8176318、rs3092995およびrs799912からなる群から選択される少なくとも1つのSNPの合わせた存在が、被験体の乳癌または卵巣癌を発症するリスクを、正常な被験体と比較して100倍増加させる。正常な被験体は、rs12516、rs8176318、rs3092995、rs799912またはrs1060915を有する一般的な対立遺伝子を保有しない被験体である。
【0020】
本発明は、(a)試験被験体からDNA試料を得る工程;および(b)試料由来の少なくとも1つのDNA配列において、rs8176318またはrs1060915の存在を決定する工程を含む、トリプルネガティブ(TN)乳癌を発症するリスクを有する被験体を同定する方法であって、少なくとも1つのDNA配列におけるrs8176318またはrs1060915の存在が、被験体のTN乳癌を発症するリスクを、正常な被験体と比較して増加させる、方法もまた提供する。好ましい実施形態では、この方法は、rs8176318およびrs1060915の存在を決定する工程を含み、少なくとも1つのDNA配列におけるrs8176318およびrs1060915の合わせた存在が、被験体のTN乳癌を発症するリスクをさらに増加させる。正常な被験体は、rs8176318またはrs1060915を保有しない被験体である。試験被験体は、好ましくは、アフリカ系アメリカ人である。
【0021】
本明細書におけるハプロタイプ、シグネチャーおよび方法によって記載されるように、乳癌は、散発性または遺伝性である。また、卵巣癌は、散発性または遺伝性である。
【図面の簡単な説明】
【0022】
【図1】図1は、miRNAの生合成の略図である。
【図2−1】図2は、BRCA1 3’UTRの注釈である。
【図2−2】図2は、BRCA1 3’UTRの注釈である。
【図3−1】図3は、癌集団におけるBRCA1 3’UTRの図式的な比較である。図は、124 個の癌DNA試料および14個のエール大学対照DNA試料に由来するBRCA1 3’UTR全体の増幅の配列決定結果に基づく。
【図3−2】図3は、癌集団におけるBRCA1 3’UTRの図式的な比較である。図は、124 個の癌DNA試料および14個のエール大学対照DNA試料に由来するBRCA1 3’UTR全体の増幅の配列決定結果に基づく。
【図4A】図4は、2,472人の個体を含む46個の世界集団由来の3個のSNP部位で遺伝子型決定しているBRCA1 3’UTRの説明である。
【図4B】図4は、2,472人の個体を含む46個の世界集団由来の3個のSNP部位で遺伝子型決定しているBRCA1 3’UTRの説明である。
【図5】図5は、7個の癌集団および1個のエール大学対照集団由来の3個のSNP部位で遺伝子型決定しているBRCA1 3’UTRのグラフ表示であり、384人の個体が、これらの8個の集団に含まれる。
【図6】図6は、系統を推測するとともに、ゲノムのBRCA1領域のハプロタイプ解析を遂行するのに使用した8個のSNPの説明である。BRCA1遺伝子内で見られたSNPとしては、rs12516、rs8176318、rs3092995、rs1060915およびrs799912が挙げられる。BRCA1周辺のSNPとしては、rs991630、rs9908805およびrs17599948が挙げられる。
【図7】図7は、BRCA1ハプロタイプの進化案の説明である。10個の最も一般的なハプロタイプがここに示されている。各ハプロタイプは、祖先ハプロタイプ(GGCCACTA、配列番号8)への変異の蓄積によって説明することができる。直接的に認められたハプロタイプの大部分は、順序付けることができ、1個の派生ヌクレオチド変化によって相違している。枠で囲まれた2個のハプロタイプのうちどちらが、採用されたSNPを有する系統において最初に生じたかということに関しては未解決であった。AGCCATTA(配列番号2)ハプロタイプは、現在のところ、世界中で最も一般的に認められるハプロタイプである。「あらゆる所に存在している」と表示された2個のハプロタイプは、世界のすべての地域に存在している(GAACAGATA(配列番号17)およびGAACGCTC(配列番号18))。組換えハプロタイプ(AGCC−GCTG、配列番号19)は、(南アメリカ、中央アメリカおよび北アメリカの地域を示す)新世界においてのみ見られる。
【図8】図8は、世界中の46個の集団(2,472人の個体)からのBRCA1地域ハプロタイプデータの説明である。
【図9】図9は、7個の癌集団および1個のエール大学対照群(384人の個体)に関する、BRCA1地域ハプロタイプデータの説明である。集団サイズ:対照:29人、乳房/卵巣:17、子宮:55、卵巣:77、ER/PR+:44、HER2+:47、MP:39、TN:76。
【図10】図10は、BRCA1の民族性内訳の説明である。
【図11】図11は、コード領域突然変異状態によるBRCA1ハプロタイプデータの説明である。ハプロタイプによって、110人の患者をBRCA1検査および分析した。
【図12】図12は、民族性データによって分けた、TNおよびエール大学対照を有するBRCA1地域ハプロタイプ頻度を示す略図である。
【図13】図13は、民族性および年齢によって分けた、TN乳癌群におけるBRCA1地域ハプロタイプ頻度を示す略図である。
【図14】図14は、選択した各集団における遺伝子型決定した各SNP(rs12516対立遺伝子A、rs8176318対立遺伝子Aおよびrs3092995対立遺伝子G)での派生対立遺伝子に関する、対立遺伝子頻度を示すグラフである。388人の個体(ヨーロッパ系アメリカ人およびアフリカ系アメリカ人対照)ならびに乳癌集団(左から右に示されるTN、HER2+およびER+/PR+)において、SNPを調査した。
【図15】図15は、診断年齢ごとの、乳癌患者の間の珍しいBRCA1ハプロタイプ頻度を示すグラフである。珍しいBRCA1ハプロタイプ頻度に関して、診断年齢が知られているすべての乳癌患者を評価した。診断時に、乳癌患者を、52歳以下または52歳超のいずれかにグループ分けした。乳癌患者では一般的だが、対照の間では珍しい5個のハプロタイプが示されている。
【図16A】図16Aは、乳癌患者の間の珍しいBRCA1ハプロタイプ頻度を示すグラフである。乳癌患者では一般的だが、大域的対照集団の間ではめったに見られないハプロタイプに関して、乳癌患者を評価した。5個の珍しいハプロタイプ頻度は、Y軸に沿って示されている。
【図16B】図16Bは、民族性ごとの、乳癌の間のBRCA1ハプロタイプ頻度を示す図式的なダイアグラムである。ハプロタイプ頻度に関して、ヨーロッパ系およびアフリカ系アメリカ人乳癌患者を評価した。ヨーロッパ系アメリカ人およびアフリカ系アメリカ人を対照として追加した。9個の一般的なハプロタイプが示されている。乳癌患者では一般的だが、対照の間ではめったにない5個のさらなるハプロタイプが示されている(これらの珍しいハプロタイプは、番号付けされ、アスタリスクで印を付けられ、そして枠で囲まれている)。ゼロではない評価の残りのハプロタイプ頻度は、残りのクラスに合算されている。3個の3’UTR多型は、(1位の部位を左端のヌクレオチドとし、8位の部位を右端のヌクレオチドとする場合、8個のヌクレオチド部位の2位の部位、3位の部位および4位の部位にある)太字フォントで示されており、3’UTR内の派生対立遺伝子は、下線が引かれている。
【図17】図17Aは、サブタイプごとの、乳癌患者の間の珍しいBRCA1ハプロタイプ頻度を示すグラフである。サブタイプごとに、乳癌患者をグループ分けし、そして、乳癌患者では一般的だが、大域的対照集団の間ではめったに見られないハプロタイプに関して、評価した。5個の珍しいハプロタイプ頻度は、Y軸に沿って示されている。図17Bは、乳癌サブタイプおよび民族性ごとの、珍しいハプロタイプ頻度を示すグラフである。乳房腫瘍サブタイプごとに、ヨーロッパ系およびアフリカ系アメリカ人乳癌患者をさらにグループ分けし、そして、珍しいハプロタイプ頻度に関して、評価した。ヨーロッパ系アメリカ人およびアフリカ系アメリカ人を対照として追加した。乳癌患者では一般的だが、対照の間では珍しい5個のハプロタイプが示されている。
【図18】図18AおよびBは、野生型(WT、rs1060915G)、またはルシフェラーゼレポーターに融合した突然変異BRCA1 mRNA(re1060915A変異型対立遺伝子を含むBRCA1遺伝子)エレメントのいずれかで、TN乳癌細胞(示されるMDA MB231細胞)をトランスフェクションした後の、ルシフェラーゼレポーター構築物の転写抑制を示す一組のグラフである。WTまたは変異型BRCA1 mRNAエレメントのいずれかを含むルシフェラーゼレポーター(25ng)を、細胞にトランスフェクトした。トランスフェクションの24時間後、トランスフェクト細胞を溶解し、デュアルルシフェラーゼ活性に関して、アッセイした。祖先対立遺伝子(G)に対して、変異型対立遺伝子(A)を正規化した。スチューデントの両側t検定によって、統計的有意性を決定した。結果は、すべての細胞株(試験した9個の細胞株)にわたって、WTと変異型BRCA1エレメントとの間で、ルシフェラーゼ活性の1.85倍の変化を示した。したがって、rs1060915Aは、BRCA1遺伝子内の調節エレメントである。rs1060915が存在すると、miRNAは効果的に(十分にまたは強固に)結合し得ないか、または異なるmiRNAがBRCA1に結合し、翻訳の調節変化が可能になる。
【図19】図19は、BRCA1遺伝子内のrs1060915周辺の部位を標的とするmiRNAの略図である。4個の候補miRNAは、rs1060915の祖先対立遺伝子または変異型対立遺伝子のいずれかに結合するが、代替SNP対立遺伝子には結合しないと予測される。多くの他のものは、あまり強くない相互作用または変化で結合すると予測される。BRCA1 rs1060915、61位から94位の部位5’−AACAGCUACCCUUCCAUCAUAAGUGACUCUUCUG−3’(配列番号28)。Hsa−miR−7、5’−UGGAAGACUAGUGAUUUUGUUGU−3’(配列番号29)。BRCA1 rs1060915、79位から105位の部位5’−AUAAGUGACUCCUCUGCCCUUGAGGAC−3’(配列番号30)。Hsa−miR−129−5P、5’−CUUUUUGCGGUCUGGGCUUGC−3’(配列番号31)。BRCA1 rs1060915、45位から93位の部位5’−UGGGAGCCAGCCUUCUAACAGCUACCCUUCCAUCAUAAGUGACUCUUCU−3’(配列番号32)。Hsa−miR−185、5’−UGGAGAGAAAGGCAGUUCCUGA−3’(配列番号33)。BRCA1 rs1060915、44位から96位の部位5’−AUGGGAGCCAGCCUUCUAACAGCUACCCUUCCAUCAUAAGUGACUCUUCU−3’(配列番号34)。Hsa−miR−298、5’−AGCAGAAGCAGGGAGGUUCUCCCA−3’(配列番号35)。
【図20】図20Aは、珍しいハプロタイプを持たない癌患者と比較した、珍しいBRCA1ハプロタイプ腫瘍における著しく高いレベルのmiR−7発現を示すグラフである(p=0.04)。miR−7発現は、乳癌サブタイプよりむしろハプロタイプと相互に関連していると考えられる。図20Bは、TN乳癌患者における、miRNAの機能としてのmiRNA発現頻度を示すグラフである。miR−7、miR−28およびmiR−342は、BRCA1腫瘍において高発現している。例えば、miR−7は、TN乳癌腫瘍において高発現している。他の乳癌サブタイプは試験しなかったが、珍しいBRCA1ハプロタイプが存在する他のサブタイプもまた、高いレベルのmiR−7発現を示すであろうと考えられる。
【図21】図21は、野生型(WT)BRCA1(AA)およびrs1060915 SNPを含むBRCA1(GG)に対する、miR−7の結合効力を示すグラフである。miR−7結合は、rs1060915 SNPの存在により変化する。祖先配列または変異型配列(rs1060915 SNPを含むBRCA1)でトランスフェクトしたHCC1937+/+細胞:(0.5nM)。スクランブル対照ではなくmiR−7が、WT BRCA1配列に結合している、すなわち、miR−7は、BRCA発現を特異的に変化させている。注目すべきは、このモデルでは、発現が変化すると、ルシフェラーゼ発現が増大することが明らかにされているということである。miR−7もスクランブル対照も、変異型BRCA1の発現を変化させていないが、このことは予測していた;変異型対立遺伝子内には予測結合部位が存在しないからである(変異型対立遺伝子は、miR−7結合部位を破壊するが、miR−7結合部位は、そうでなければWT BRCA1に存在し、おそらくBRCA1を保護し、より高いレベルのmRNAまたはタンパク質をもたらす)。
【発明を実施するための形態】
【0023】
現在、乳癌は、最も多く診断される癌であり、女性における癌による死亡の主な原因のひとつである。臨床的分類および分子的分類は、乳癌をサブグループにうまく分類しており、予後的に重要であるカテゴリーにおいて固有の遺伝子発現を示している。カテゴリーの中で、エストロゲン受容体(ER)またはプロゲステロン受容体(PR)ポジティブ、HER2受容体遺伝子増幅腫瘍およびトリプルネガティブ([TN]ER/PR/HER2腫瘍)が、これらの研究から生じている。ER/PR+腫瘍およびHER2+腫瘍はともに最も一般的(80%)であり、基底様腫瘍またはTN腫瘍は、乳癌の約15〜20%の割合を占めている(Irvin WJ,Jr.およびCarey LA.Eur J Cancer 2008;44(18):2799−805)。TN表現型は、積極的に解明されているが不明なところが多い癌のサブクラスを表し、これは、若い女性の間およびアフリカ系アメリカ人女性で最も一般的である。
【0024】
BRCA1コード配列変異は、乳癌に関する周知のリスクファクターであるが、しかしながら、これらの変異は、すべての乳癌症例の5%未満の割合を毎年占めている。全体として、BRCA1変異の結果として生じる乳房腫瘍は、TN(57%)(Atchley DPら、J Clin Oncol 2008;26(26):4282−8)またはER+乳癌(34%)(TungNら、Breast Cancer Res;12(1):R12.)が最も多く、HER2+乳癌(約3%)(Lakhani SRら、J Clin Oncol 2002;20(9):2310−8.)はほとんどない。BRCA1変異は極めてまれであるため、TN腫瘍は、BRCA1の低発現によってしばしば特徴付けられる(Turner N,Tutt A,Ashworth A.Nature reviews 2004;4(10):814−9)。BRCA1変異は、TN腫瘍の約10〜20%の割合を占めるのみである(Young SRら、BMC cancer 2009;9:86;Malone KEら、Cancer research 2006;66(16):8297−308;Nanda Rら、JAMA 2005;294(15):1925−33)。これらの結果は、個体を乳癌にかかりやすくするBRCA1誤発現に関連するさらなる遺伝因子が存在する可能性があることを示唆している。
【0025】
ハプロタイプは、いくつかのSNPのパターンであり、これは、DNAの遺伝子内またはセグメント内で互いに連鎖不均衡(LD)にあり、したがって、一つの単位として遺伝で受け継がれる。ハプロタイプは、集団内のすべての測定および不測定対立遺伝子に関するマーカーとして働くので、目的の領域のハプロタイプ研究により、原因SNPの調査を絞り込むことができる。BRCA1ハプロタイプと乳癌との関連性の過去の研究は、矛盾する結果をもたらしてきた。Coxらは、4個の標識SNPによって予測される5個の一般的なハプロタイプ(5%以上)を同定した。これらのSNPの検査によって、ハプロタイプの1つが、看護師健康調査において白人女性における散発性乳癌の20%のリスクの増加(オッズ比1.18、95%信頼区間1.02〜1.37)を予測したことが示された(Cox DGら、Breast Cancer Res 2005;7(2):R171−5)。このハプロタイプ、家族歴陽性および乳癌リスクの間で、相互作用が有意に(p=0.05)認められた(Cox DGら、Breast Cancer Res 2005;7(2):R171−5)。一方、Freedmanらは、多民族的コホート研究から、コホートおいてBRCA1遺伝子座にわたる一般的な変異を検査した。このグループは、BRCA1における一般的な変異が、散発性乳癌リスクに実質的に影響を与えることを示すことができなかった(Freedman MLら、Cancer research 2005;65(16):7516−22)。これらのハプロタイプ研究は、BRCA1のコード領域およびイントロン領域におけるSNPを有する変異に主に焦点を合わせていた(Dunning AMら、Human molecular genetics 1997;6(2):285−9;Bau DTら、Cancer research 2004;64(14):5013−9)。
【0026】
miRNAは、進化的に保存され、ほぼすべての癌で異常に発現している22個のヌクレオチド非コードRNAのクラスであり、それらは、癌抑制遺伝子または腫瘍抑制因子の新規なクラスとして機能する。 miRNAが3’UTRにおいてメッセンジャー(mRNA)に結合する能力は、mRNAレベルおよびタンパク質発現を調節するために重要であり、結合は、一塩基多型の影響を受け得る。最近のデータは、癌遺伝子の3’UTRにおける変異体が、癌リスクの強力な遺伝子マーカーであることを示している(Chin LJら、Cancer research 2008;68(20):8535−40;Landi Dら、Carcinogenesis 2008;29(3):579−84;Pongsavee Mら、Genetic testing and molecular biomarkers 2009;13(3):307−17)。
【0027】
最近、BRCA1 3’UTRは、このようなmiRNA結合部位SNPに関して研究されており、rs12516およびrs8176318を有する派生(および低頻度)対立遺伝子は、タイ人女性において、家族性乳癌および家族性卵巣癌と明らかな関連性を示した。研究によって、両方のSNP部位における派生対立遺伝子Aに関するホモ接合性が、影響を受けないタイ人において見られる頻度の3倍で、癌患者に存在することが明らかになり、重要な癌関連性をもたらした(p=0.007)。機能分析によって、同じ染色体上に、すなわちシスに存在する場合に、両部位を有する派生対立遺伝子のBRCA1機能の活性が減少することが示され、最も大きな減少がrs8176318を有する派生対立遺伝子で見られることを示された(Pongsavee Mら、Genetic testing and molecular biomarkers 2009;13(3):307−17)。本研究は、3’UTR変異体が既知のBRCA1変異に関連しなかったことを明らかにした。さらに、1998年における研究は、BRCA1 3’UTRにおける3番目のSNP、すなわちrs3092995を有する対立遺伝子が、アフリカ系アメリカ人女性において乳癌のリスクの増加に関連することを報告した。より珍しい派生G対立遺伝子は、アフリカ系アメリカ人対照よりもアフリカ系アメリカ人乳癌症例においてより多いことが明らかになった。アフリカ系アメリカ人女性の間の乳癌およびG対立遺伝子に関する年齢調整ORは、3.5(95%CI、1.2−10)であった(Newman Bら、JAMA 1998;279(12):915−21)。
【0028】
本発明は、機能的3’UTR変異体を含むハプロタイプ研究が、乳癌リスクに関連するBRCA1ハプロタイプをよりうまく同定するはずであるという理解に一部基づく。さらに、BRCA1機能不全は乳癌サブタイプによって異なるので、乳癌サブタイプによって、これらのハプロタイプを評価した。その結果、乳癌患者において、3’UTR SNPを同定したところ、これらの1個は個々に重要であった。続いて、ハプロタイプと乳癌の関連性を決定するために、これらの変異体およびBRCA1 3’UTR周辺の5個のSNPを用いて、ハプロタイプ解析を実施した。本研究によって、乳癌患者では通常共有するが非癌集団ではほとんど共有しない5個のハプロタイプを、さらに同定した。これらの珍しいBRCA1ハプロタイプは、乳癌リスクに関連するBRCA1機能不全の新規な遺伝子マーカーを表す。
【0029】
癌は、制御されない細胞増殖および損傷細胞の生存によって起こる多面的な疾患であり、これにより腫瘍形成が生じる。細胞分裂、細胞分化および細胞死が一生を通じて必ず適切に起こるようにするためのいくつかの安全装置を、細胞は発達させている。多くの調節因子は、細胞増殖および細胞分化を導く遺伝子をオンまたはオフにする(Esquela−Kerscher,A.&Slack,F.J.Nat Rev Cancer,2006,6:259−69)。これらの腫瘍抑制遺伝子および癌遺伝子への損傷は、癌で選択される。ほとんどの腫瘍抑制遺伝子および癌遺伝子は、最初に転写され、次いでタンパク質に翻訳されて、それらの影響を発現する。最近のデータは、マイクロRNA(miRNA)と称されるタンパク質非コードRNA低分子もまた腫瘍抑制因子または癌遺伝子のいずれかとして機能し得ることを示している(Medina,P.P.およびSlack,F.J.Cell Cycle 2008.7,2485−92)。ヒトの疾患の中で、miRNAが、癌において異常に発現または変異していることが示されており、このことは、それらが、より正確にはオンコmir(oncomir)と称される癌遺伝子または腫瘍抑制遺伝子の新規なクラスとしての役割を果たすことを示唆している(Iorio,M.Vら、Cancer Res 2005.65,7065−70)。
【0030】
miRNAは、進化的に保存された、短い、タンパク質非コード一本鎖RNAであり、これは、転写後遺伝子調節因子の新規クラスの代表的なものである。研究によって、腫瘍組織と正常組織との間で、異なるmiRNA発現プロファイルが示され(Medina,P.P.およびSlack,F.J.Cell Cycle 2008.7,2485−92)、miRNAは、研究された実質的にすべての癌サブタイプにおいて異常なレベルである(Esquela−Kerscher,A.&Slack,F.J.Nat Rev Cancer 2006.6,259−69)。miRNAは、それらの標的遺伝子の3’非翻訳領域(UTR)に結合し、それぞれ何百もの異なる標的転写産物を調節するが、このことは、miRNAがヒトゲノムにおけるタンパク質コード遺伝子の30%を上方制御し得ることを示唆している(Chen,Kら、Carcinogenesis 2008.29,1306−11)。したがって、機能不全なmiRNAの効果は多面的である可能性があり、それらの異常発現は、細胞恒常性の平衡を潜在的に失わせて、癌などの疾患の一因となる可能性がある。
【0031】
miRNAのメッセンジャーRNA(mRNA)への結合能力は、mRNAレベルおよびタンパク質発現を調節するのに重要である。しかしながら、miRNA標的部位に内在し、存在する結合部位を消去するかまたは誤った結合部位を作り出し得る一塩基多型(SNP)によって、この結合は影響を受け得る(Chen,K.ら、Carcinogenesis 2008.29,1306−11)。癌などの疾患におけるmiRNA標的部位SNPの役割は、まさに定義され始めたばかりである。
【0032】
miRNA
miRNAは、タンパク質コード遺伝子のmRNAと対合することによって転写後遺伝子調節において機能する約22ヌクレオチド長のタンパク質非コードRNA低分子の広いクラスである。最近、生存経路において重要であることが知られているタンパク質をmiRNAが調節するという証拠によって、miRNAがヒト癌遺伝子座で役割を果たすことが示された(Esquela−Kerscher,A.&Slack,F.J.Nat Rev Cancer 2006,6:259−69;Ambros,V.Cell 2001,107:823−6;Slack,F.J.およびWeidhaas,J.B.Future Oncol 2006,2:73−82)。miRNAは多くの下流の標的を制御するので、それらは、癌の処置に関する新規な標的として作用し得る。
【0033】
miRNAの基本的な合成および成熟は、図1において描かれ得る(Esquela−Kerscher,A.およびSlack,F.J.Nat Rev Cancer 2006.6,259−69)。つまり、miRNAは、RNAポリメラーゼIIによって核においてmiRNA遺伝子から転写されて、長い一次RNA(pri−miRNA)転写物を形成し、これらは、キャップ化およびポリアデニル化される(Esquela−Kerscher,A.およびSlack,F.J.Nat Rev Cancer 2006.6,259−69;Lee,Y.ら、Embo J 2002.21,4663−70)。これらのpri−miRNAは、数キロ塩基長であり得、リボヌクレアーゼIII(RNAaseIII)酵素ドローシャ(Drosha)およびその補因子、すなわちパーシャ(Pasha)によって核においてプロセシングされて、約70ヌクレオチドのステムループ構造を有するmiRNA前駆体(pre−miRNA)を放出する。pre−miRNAは、エクスポーチン5によってRan‐グアノシン三リン酸(GTP)依存的に核から細胞質に搬出され、そこで、次いでそれらは、ダイサー、すなわちリボヌクレアーゼIII(RNAaseIII)酵素によってプロセシングされる。これは、約22塩基ヌクレオチドの二本鎖miRNA:RNA誘導型サイレンシング複合体(miRISC)に組み込まれるmiRNA二本鎖の放出を引き起こす。この時点で、複合体は今やその標的遺伝子を調節することができる。
【0034】
図1は、miRNAとその標的との間の相補性(complimentarity)の程度に依存する2つの方法のうち1つによって、遺伝子発現の調節がどのように起こり得るかを示す。不完全な相補性(complimentarity)を有するmRNA標的に結合するmiRNAは、タンパク質翻訳のレベルで標的遺伝子発現を阻害する。一般的に、このメカニズムを使用するmiRNAのための相補的(complimentary)部位は、標的mRNA遺伝子の3’UTRにおいて発見される。完全な相補性(complimentarity)を有するmRNA標的に結合するmiRNAは、標的mRNAの切断を誘導する。このメカニズムを使用するmiRNAは、mRNA標的のコード配列またはオープンリーディングフレーム(ORF)において一般的に見られるmiRNA相補的(complimentary)部位に結合する。
【0035】
哺乳動物では、miRNAは、研究された実質的にすべての癌サブタイプにおいて異常なレベルで見られる遺伝子調節因子である。標的遺伝子に結合する適切なmiRNAは、mRNAレベルおよびタンパク質発現を調節するのに重要である。しかしながら、miRNA結合部位に内在し、存在する結合部位をなくすかまたは非正統的な結合部位を作り出し得る多型によって、良好な結合は影響を受け得る。したがって、miRNA結合部位における多型は、遺伝子およびタンパク質発現への広範囲に及ぶ影響を有し、癌などのヒト疾患のリスクに影響を与え得る遺伝的変異性の別の原因を示し得る。疾患におけるmiRNA結合部位SNPの役割は、まさに定義され始めたばかりであり、miRNAの結合能力を修正し、それによって、標的遺伝子調節ならびに乳癌および/または卵巣癌のリスクに影響を与える乳癌遺伝子におけるSNPの同定は、乳癌および/または卵巣癌リスクの増加を有する患者を認識するための新規な方法を同定するのに役立つ可能性がある。
【0036】
miRNAは、標的mRNAおよび標的遺伝子の非コード領域だけでなく、タンパク質コード領域も標的とする。miRNAのメカニズム:標的認識は、非コード領域とコード領域との間で異なる可能性がある。miRNAがタンパク質コード領域内の結合部位を認識する場合、miRNA結合の転写サイレンシング効果は、非コード領域におけるmiRNA認識およびmiRNA結合の結果と比較して、減少する可能性がある。また、タンパク質コード領域内に位置するmiRNA結合部位シード領域は、非コード領域に位置する結合部位のシード領域よりも多数のmiRNAに結合したヌクレオチドを必要とする可能性がある。SNPは、コード領域内に位置するmiRNA結合部位においても生じ、その結果として、1つ以上のmiRNAの標的遺伝子の発現を調節する能力に影響を与える可能性がある。
【0037】
コード領域において生じ、miRNAの活性に影響を与えるSNPは、標的タンパク質の発現に対して、定量的にまたは定性的に類似する効果を有する可能性があると考えられる。あるいは、コード領域において生じ、miRNAの活性に影響を与えるSNPは、標的タンパク質の発現に対して、定量的にまたは定性的に異なる効果を有する可能性がある。非コード領域およびコード領域においてSNPが同時に存在する場合に、これら両方のSNPは、1つ以上のmiRNAが(これらの個々のSNPが相乗的に作用する)それらの各結合部位に結合する結合能力に影響を与えて、標的転写産物または標的タンパク質の発現に影響を与えるとさらに考えられる。
【0038】
miRNA活性は、細胞周期によってさらに影響を受ける。細胞周期停止中、あるmiRNAは、翻訳を活性化するかまたは標的mRNAの上方制御を誘導することを示している(Vasudevan S.ら、Science,2007.318(5858):1931−4)。したがって、miRNAの活性は、細胞周期の、例えば成長(G1およびG2)期中および合成(S1)期中の転写抑制と、細胞周期停止(G0)中の転写活性化との間で揺れる可能性がある。学説に縛られることなく、癌細胞は、不適切な時期にまたは不適切な頻度で細胞周期に入り細胞周期を終える。また、癌細胞は、BRCA1などのDNA修復タンパク質の機能的または適切なレベルの安全装置を有さずに、細胞周期をしばしば終える。非癌性の正常細胞は、BRCA1に結合したmiRNAが腫瘍抑制タンパク質の発現を上方制御するG0期の状態である可能性があるが、癌細胞は、miRNAがタンパク質発現を転写段階で抑制する成長期の状態にあることが最も多い。本発明は、少なくとも1つのmiRNAの活性または結合に影響を与える非コード領域および/またはコード領域におけるSNPの存在が、例えばBRCA1の上方制御を阻害する可能性があり、これが、正常細胞が細胞周期に入るのを誘導し、該細胞周期中で、さらなるmiRNAがBRCA1および/または他の腫瘍抑制遺伝子の発現をさらに抑制する可能性があると考える。
【0039】
一塩基多型(SNP)
一塩基多型(SNP)は、DNA配列変異であり、これは、ゲノム(または他の共有配列)中の一塩基が、種の構成員の間で(または個体における一組の染色体の間で)異なる場合に生じる。SNPは、遺伝子のコード配列内、遺伝子の非コード領域内または遺伝子の間の遺伝子間領域に含まれてもよい。遺伝子コードの縮重性のために、コード配列内のSNPは、産生されるタンパク質のアミノ酸配列を必ずしも変化させないだろう。同じポリペプチド配列をコードする新しいDNA配列をもたらすSNP変異は、シノニマス(synonymous)と名付けられる(サイレント変異とも称される。)。反対に、異なるポリペプチド配列をコードする新しいDNA配列をもたらすSNP変異は、非シノニマス(non−synonymous)と名付けられる。タンパク質コード領域に存在しないSNPは、それでもやはり、遺伝子スプライシング、転写因子結合または非コードRNAの配列に影響を与える可能性がある。
【0040】
本発明の方法に関して、非コードRNA領域は、miRNA分子に相補的であり他の調節因子との相互作用に必要とされる調節配列を含むので、それらの領域内に生じるSNPは特に重要である。ゲノム配列内に生じるSNPは、分解または翻訳サイレンシングのためのmiRNA分子によって標的とされるmRNA転写産物に転写される。ゲノム配列または遺伝子のmRNAの3’非翻訳領域(UTR)内に生じるSNPは、本発明の方法に特に重要である。
【0041】
BRCA1
BRCA1(若年性乳癌1(BReast CAncer 1,early onset))は、ヒト腫瘍抑制遺伝子である。BRCA1は、乳癌に最もよく関連するが、BRCA1遺伝子は、体のあらゆる細胞において存在している。腫瘍抑制遺伝子として、BRCA1は、細胞増殖をネガティブに調節し、損傷DNAを修復することによってまたはDNAがあまりにも損傷しているために修復できない細胞に関する細胞の自滅プログラムを開始することによって、変異が導入されることを防ぐ。
【0042】
BRCA1のような腫瘍抑制遺伝子が変異または誤調節され、次いでその機能が阻害される場合、細胞は、不完全に複製されたDNAで増殖が進む可能性がある。また、細胞は、あまりにも頻繁に細胞周期に入る可能性がある。このような状況において、腫瘍は形成する。良性腫瘍とは対照的な癌性腫瘍は、隣接組織の制御されない増殖、浸潤および破壊、ならびにリンパ液または血液を介した体内の他の部位への転移を示す。
【0043】
具体的には、相同的組換え、すなわち、相同的で無傷のヌクレオチド配列が、2本の類似または同一DNA鎖(例えば、姉妹染色分体、相同染色体または(細胞周期の段階に依存する)鋳型である同じ染色体に由来する配列)の間で交換される過程によって、BRCA1は、DNAにおける二本鎖の損傷を修復する。しかしながら、BRCA1タンパク質は、単独で機能しない。BRCA1は、他の腫瘍抑制タンパク質、DNA損傷センサーおよびシグナル伝達物質と結合して、BRCA1結合ゲノムサーベイランス(surveillance)複合体(BASC)として知られる大きな多サブユニットタンパク質複合体を形成する。
【0044】
BRCA1タンパク質は複合体を形成して、細胞機能を実行することができるという事実にもかかわらず、BRCA1遺伝子における変異は、細胞修復プログラムおよび細胞増殖プログラムの規制を撤廃するのに十分である。重要なことに、本発明は、一塩基多型(SNP)、ハプロタイプ、1つ以上のmiRNAがBRCA1遺伝子のコード領域もしくは非コード領域に結合する機能を抑制または阻害するSNPを同定するための方法、および、本明細書において記載される少なくとも1つの多型を検出することによって癌を発症するリスクの増加を予測するための方法を提供する。
【0045】
本発明は、BRCA1内のSNPを同定または特性評価するための方法を提供する。学説に縛られることなく、本明細書において開示されるSNP、および本明細書において開示される方法を使用して同定されたSNPは、miRNA結合部位内で生じるか、またはそうでなければmiRNA活性に影響を与え、1つ以上のmiRNAとBRCA1との間の「より強固な」miRNA相互作用もしくは結合を引き起こすか、または「より弱い」miRNA相互作用もしくはこれらの相互作用の喪失を引き起こす場合もあると考えられる。3’UTRにおけるこれらのmiRNAの結合効力または結合活性の増加は、BRCA1の転写の減少をもたらし、全体的には、細胞におけるBRCA1タンパク質のより低いレベルをもたらす。エクソン内で結合を失う可能性もまた、BRCA1のより低いレベルをもたらす可能性がある。したがって、本明細書において同定されるSNPは、BRCA1腫瘍抑制遺伝子を抑制し、細胞修復メカニズムおよび細胞増殖メカニズムがBRCA1による監視なしで進行することを可能にする。上記のように、制御されない細胞増殖は、癌を発症するリスクの増加をもたらす。
【0046】
典型的なBRCA1遺伝子およびBRCA1転写産物は、以下に提供される。(NCBIアクセッション番号によって提供される)すべてのGenBankの記録は、参照により本明細書に組み込まれる。
【0047】
転写産物変異体1であるヒトBRCA1は、NCBIアクセッション番号NM_007294および配列番号11の核酸配列によってコードされる。
【0048】
【化1−1】
【0049】
【化1−2】
【0050】
【化1−3】
転写産物変異体2であるヒトBRCA1は、NCBIアクセッション番号NM_007300および配列番号12の核酸配列によってコードされる。
【0051】
【化2−1】
【0052】
【化2−2】
【0053】
【化2−3】
転写産物変異体3であるヒトBRCA1は、NCBIアクセッション番号NM_007297および配列番号13の核酸配列によってコードされる。
【0054】
【化3−1】
【0055】
【化3−2】
【0056】
【化3−3】
転写産物変異体4であるヒトBRCA1は、NCBIアクセッション番号NM_007298および配列番号14の核酸配列によってコードされる。
【0057】
【化4−1】
【0058】
【化4−2】
転写産物変異体5であるヒトBRCA1は、NCBIアクセッション番号NM_007299および配列番号15の核酸配列によってコードされる。
【0059】
【化5−1】
【0060】
【化5−2】
転写産物変異体6であるヒトBRCA1は、NCBIアクセッション番号NR_027676および配列番号16の核酸配列によってコードされる。
【0061】
【化6−1】
【0062】
【化6−2】
【0063】
【化6−3】
BRCA1:miRNA相互作用
著しく過剰発現したmiRNAは、腫瘍抑制遺伝子をネガティブに調節することによって腫瘍成長を促進する癌遺伝子として示唆されている。腫瘍抑制遺伝子として、BRCA1の機能の1つは、1つ以上のmiRNAの発現を抑制している可能性がある。例えば、miR−7は、BRCA1によって抑制され、BRCA1が欠損した細胞において過剰発現している(表1)。図20は、乳癌において、具体的にはトリプルネガティブ(TN)サブタイプ内でmiR−7が高発現していることをさらに明示している。本明細書において提供される研究は、TN乳癌を発症する患者が、rs1060915 SNPを含む珍しいハプロタイプをしばしば保有することを明示している。したがって、このSNPの存在は、miR−7がBRCA1に結合することを妨げる(図21)。
【0064】
miR−7は、乳癌から守ってくれる可能性がある。miRNAが遺伝子発現を抑制するという概念に対して、メカニズムは直観的に反しているようだが、miR−7結合部位が無傷でありmiR−7がBRCA1に結合する場合に、BRCA1の発現はより高くなり、したがって、BRCA1を含む細胞は、より機能的なタンパク質を含む。エクソン内におけるmiRNA結合は、このような効果を有すると報告されている。rs1060915 SNPがBRCA1において存在する場合、miR−7は結合することを阻害され、BRCA1の発現レベルは下がり、そしてその結果として、細胞が有する機能的なタンパク質は少ない。したがって、発現のrs1060915調節エレメントは、BRCA1遺伝子内に含まれる(図18AからB)。
【0065】
利用可能または機能的なBRCA1タンパク質が少なければ、DNA合成エラーおよび制御されない増殖から細胞を保護するDNA修復経路が害される。したがって、癌を発症するリスクが増加する。
【0066】
【表1】
miR−7は、BRCA1によって抑制されている。
野生型BRCA1または対照ベクターのいずれかでHCC1937細胞をトランスフェクションした後、細胞mRNAの発現レベルを分析した。
BRCA1を欠損している細胞において、リストに記載されたmiRNAのすべてをより高いレベルで発現させた。
【0067】
単離された核酸分子
本発明は、1つ以上のSNPを含む単離された核酸分子を提供する。本明細書において開示される1つ以上のSNPを含む単離された核酸分子は、本文を通して相互変換可能に、「SNP含有核酸分子」と称してもよい。単離された核酸分子は、場合により全長改変タンパク質またはその断片をコードし得る。本発明の単離された核酸分子はまた、(「SNP検出試薬」と題された以下の節により詳細に記載される)プローブおよびプライマーを含み、これらは、開示されたSNP、および単離された全長遺伝子、転写産物、cDNA分子、ならびにそれらの断片をアッセイするために使用され得、これらは、コードされたタンパク質を発現させる目的で使用され得る。
【0068】
本明細書において使用される場合、「単離された核酸分子」は、一般的に、本発明のSNPを含む核酸分子、またはこのような分子(例えば、相補的配列を有する核酸)にハイブリダイズする核酸分子を含み、そして、核酸分子の天然供給源に存在するほとんどの他の核酸から分離される。さらに、「単離された」核酸分子(例えば、本発明のSNPを含むcDNA分子)は、他の細胞物質、または組換え技術によって産生される場合、培養培地、または化学合成される場合、化学的前駆物質もしくは他の化学物質を、実質的に含み得ない。核酸分子は、他のコード配列または調節配列に融合され得、それでもなお、「単離された」と考えられ得る。非ヒトトランスジェニック動物に存在する核酸分子は、動物には、天然には存在しないが、これも「単離された」と考えられる。例えば、ベクター中に含まれる組換えDNA分子は、「単離された」と考えられる。「単離された」DNA分子のさらなる例としては、異種宿主細胞内で維持される組換えDNA分子、および溶液中の(部分的に、または実質的に)精製されたDNA分子が挙げられる。単離されたRNA分子はとしては、本発明の単離されたSNP含有DNA分子のインビボRNA転写産物またはインビトロRNA転写産物が挙げられる。本発明に従う単離された核酸分子としては、さらに、合成により生成されたこのような分子が挙げられる。
【0069】
一般的に、単離されたSNP含有核酸分子は、本発明によって開示される1つ以上のSNP位置を含み、それらのSNP位置の両側の隣接ヌクレオチド配列を有する。隣接配列は、上記SNP部位と天然で結合しているヌクレオチド残基および/または非相同ヌクレオチド配列を含み得る。好ましくは、上記隣接配列は、特に上記SNP含有核酸分子が、タンパク質またはタンパク質断片を産生するために使用される場合、SNP位置の両側の約500ヌクレオチド、約300ヌクレオチド、約100ヌクレオチド、約60ヌクレオチド、約50ヌクレオチド、約30ヌクレオチド、約25ヌクレオチド、約20ヌクレオチド、約15ヌクレオチド、約10ヌクレオチド、約8ヌクレオチドまたは約4ヌクレオチド(もしくはこれらの間の任意の他の長さ)、あるいは全長遺伝子、全タンパク質コード配列もしくは非コード配列(または、エクソン、イントロンまたは5’もしくは3’非翻訳領域のようなその任意の一部分)までである。
【0070】
全長遺伝子および全タンパク質コード配列について、SNP隣接配列は、例えば、SNPの両側の約5KB、約4KB、約3KB、約2KBまたは約1KBまでである。さらに、この場合には、単離された核酸分子は、エクソンの配列を含む(タンパク質をコードするエクソン配列および/または非コードエクソン配列を含む)が、イントロンの配列および非翻訳調節配列も含み得る。したがって、任意のタンパク質コード配列は、隣接しているか、またはイントロンによって分離され得る。重要な点は、核酸が、遠く離れかつ重要ではない隣接配列から単離され、そして適切な長さであり、その結果、特定の処置または組換えタンパク質の発現、SNP位置をアッセイするためのプローブおよびプライマーの調製、およびSNP含有核酸配列特異的な他の用途のような本明細書において所望される用途に供され得る。
【0071】
単離されたSNP含有核酸分子は、例えば、ゲノムDNAから単離された遺伝子(例えば、クローニングまたはPCR増幅による)、cDNA分子、またはmRNA転写分子のような全長遺伝子または転写産物を含み得る。さらに、本明細書において開示される1つ以上のSNPを含むこのような全長遺伝子および転写産物の断片もまた、本発明に包含される。
【0072】
したがって、本発明はまた、核酸配列およびその相補体の断片も含む。断片は典型的に、少なくとも約8以上のヌクレオチド、より好ましくは少なくとも約10以上のヌクレオチド、そしてさらにより好ましくは、少なくとも約16以上のヌクレオチチドの隣接したヌクレオチド配列を含む。さらに、断片は、少なくとも約18ヌクレオチド、約20ヌクレオチド、約21ヌクレオチド、約22ヌクレオチド、約25ヌクレオチド、約30ヌクレオチド、約40ヌクレオチド、約50ヌクレオチド、約60ヌクレオチド、約100ヌクレオチド、約250ヌクレオチド、または約500ヌクレオチド(またはこれらの間のあらゆる他の数)の長さを含み得る。断片の長さは、意図される用途に基づく。このような断片は、ポリヌクレオチドプローブの合成用のヌクレオチド配列(例えば、限定されないが、配列番号11から16)を使用して単離され得る。次いで、例えば、cDNAライブラリー、ゲノムDNAライブラリー、またはmRNAをスクリーニングするのに標識されたプローブを使用して、目的の領域に対応する核酸を単離し得る。さらに、プライマーが、1つ以上のSNP部位をアッセイする目的で、または遺伝子の特定領域をクローニングするために、増幅反応において使用され得る。
【0073】
本発明の単離された核酸分子はさらに、核酸サンプル中の目的のポリヌクレオチドのコピー数を増加するために使用される種々の核酸増幅方法のうちの1つの産物である、SNP含有ポリヌクレオチドをさらに含む。このような増幅方法は、当該分野において周知であり、そしてこれらとしては、ポリメラーゼ連鎖反応(PCR)(米国特許第4,683,195号;および米国特許第4,683,202号;PCR Technology:Principles and Applications for DNA Amplification,ed.H.A.Erlich,Freeman Press,NY,N.Y.,1992)、リガーゼ連鎖反応(LCR)(Wu およびWallace,Genomics 4:560,1989;Landegrenら、Science 241:1077,1988)、鎖置換増幅(SDA)(米国特許第5,270,184号;および米国特許第5,422,252号)、転写媒介性増幅(TMA)(米国特許出願第5,399,491号)、連鎖直線増幅(linked linear amplification)(LLA)(米国特許第6,027,923号)など、ならびに等温増幅方法、例えば、核酸配列ベースの増幅(NASBA)ならびに自己維持配列複製(self−sustained sequence replication)(Guatelliら、Proc.Natl.Acad.Sci.USA 87:1874,1990)が挙げられるがこれらに限定されない。このような方法論に基づいて、当業者は、本明細書において開示されるSNPの5’側および3’側の任意の適切な領域にプライマーを容易に設計し得る。このようなプライマーは、その配列中に目的のSNPを含む限り任意の長さのDNAを増幅するために使用され得る。
【0074】
本明細書において使用される場合、本発明の「増幅された核酸分子」は、SNP含有核酸分子であり、その量は、試験サンプル中のその開始量と比較した場合、インビトロで実施された任意の核酸増幅方法によって少なくとも2倍に増加している。他の好ましい実施形態では、増幅された核酸分子は、試験サンプル中のその開始量と比較した場合、少なくとも10倍、50倍、100倍、1,000倍、またはさらに10,000倍の増加の結果である。典型的なPCR増幅において、目的のポリヌクレオチドは、増幅していないゲノムDNAの少なくとも50,000倍の量を上回ってしばしば増幅されるが、アッセイのために必要とされる増幅の正確な量は、その後使用される検出方法の感度に依存する。
【0075】
一般的に、増幅されたポリヌクレオチドは、少なくとも約10ヌクレオチドの長さである。より典型的には、増幅されたポリヌクレオチドは、少なくとも約16ヌクレオチドの長さである。本発明の好ましい実施形態では、増幅されたポリヌクレオチドは、少なくとも約20ヌクレオチドの長さである。本発明のより好ましい実施形態では、増幅されたポリヌクレオチドは、少なくとも約21ヌクレオチド,約22ヌクレオチド,約23ヌクレオチド,約24ヌクレオチド,約25ヌクレオチド,約30ヌクレオチド,35ヌクレオチド、約40ヌクレオチド、約45ヌクレオチド、約50ヌクレオチド、または約60ヌクレオチドの長さである。本発明のさらに別の好ましい実施形態では、増幅されたポリヌクレオチドは、少なくとも約100ヌクレオチド、約200ヌクレオチドまたは約300ヌクレオチドの長さである。本発明の増幅されたポリヌクレオチドの全長は、目的のSNPが存在するエクソン、イントロン、5’UTR、3’UTRまたは遺伝子全体程度の長さであり得るが、増幅産物は、典型的には約1,000ヌクレオチド以下の長さである(しかし、特定の増幅方法は、1000ヌクレオチドの長さよりも長い増幅産物を生じ得る)。より好ましくは、増幅されたポリヌクレオチドは、約600ヌクレオチド以下の長さである。増幅されたポリヌクレオチドの長さに関わらず、目的のSNPは、その配列に沿って至る所に位置し得ることが理解される。
【0076】
このような産物は、その5’末端もしくは3’末端またはその両方に付加的な配列を有し得る。別の実施形態では、増幅産物は、約101ヌクレオチドの長さであり、そして本明細書において開示されるSNPを含む。好ましくは、そのSNPは、増幅産物の中央に位置する(例えば、201ヌクレオチドの長さである増幅産物において101位、または101ヌクレオチドの長さである増幅産物において51位)か、または増幅産物の中央から1ヌクレオチド、2ヌクレオチド、3ヌクレオチド、4ヌクレオチド、5ヌクレオチド、6ヌクレオチド、7ヌクレオチド、8ヌクレオチド、9ヌクレオチド、10ヌクレオチド、12ヌクレオチド、15ヌクレオチド、もしくは20ヌクレオチド以内に位置する(しかし、上に示したように、目的のSNPは、増幅産物の長さに沿って至る所に位置し得る)。
【0077】
本発明は、本明細書において開示される1つ以上のSNP、その相補体およびそのSNP含有断片を含む、1つ以上のポリヌクレオチド配列を含むか、このポリヌクレオチドからなるか、またはこのポリヌクレオチドから本質的に構成される単離された核酸分子を提供する。
【0078】
ヌクレオチド配列がこの核酸分子の全長ヌクレオチド配列である場合、核酸分子は、そのヌクレオチド配列からなる。
【0079】
核酸分子は、そのヌクレオチド配列が、最終の核酸分子において少数の付加的なヌクレオチド残基しか伴わずに存在する場合、そのようなヌクレオチド配列から本質的になる。
【0080】
ヌクレオチド配列がその核酸分子の最終のヌクレオチド配列の少なくとも一部である場合、核酸分子は、そのヌクレオチド配列を含む。このような様式において、その核酸分子は、ヌクレオチド配列のみであっても、付加的なヌクレオチド残基(例えば、天然にそれに関係する残基)を有しても、異種ヌクレオチド配列を有してもよい。このような核酸分子は、1個から少数の付加的なヌクレオチドを有しても、さらに多くの付加的なヌクレオチドを含んでもよい。種々の型のこれら核酸分子がどのようにして容易に作製され得、そして単離され得るのかの簡単な説明を、以下に提供する。そしてこのような技術は、当業者にとって周知である(SambrookおよびRussell,2000,Molecular Cloning:A Laboratory Manual,Cold Spring Harbor Press,NY)。
【0081】
単離された核酸分子としては、ペプチドのみをコードする配列を有する核酸分子、成熟ペプチドをコードする配列およびさらなるコード配列(例えば、リーダー配列または分泌配列(例えば、プレ−プロタンパク質配列またはプロタンパク質配列))を有する核酸分子、付加的なコード配列を有する成熟ペプチドをコードする配列または付加的なコード配列を有さない成熟ペプチドをコードする配列に加えて、付加的な非コード配列(例えば、転写、mRNAプロセッシング(スプライシングシグナルおよびポリアデニル化シグナルを含む)、リボソーム結合、および/または、mRNAの安定性において一定の役割を果たす、転写されるが翻訳されない配列のような、例えば、イントロンおよび非コード5’配列および非コード3’配列)、が挙げられるが、これらに限定されない。さらに、核酸分子は、例えば、精製を容易にするペプチドをコードする異種マーカー配列へ融合され得る。
【0082】
単離された核酸分子は、mRNAのようなRNAの形態、またはcDNAおよびゲノムDNAを含むDNA形態であり得、例えば、分子クローニングによって得られ得るかまたは化学合成技術による産生またはその組み合わせにより産生され得る(SambrookおよびRussell,2000,Molecular Cloning:A Laboratory Manual,Cold Spring Harbor Press,NY)。さらに、単離された核酸分子(特にプローブおよびプライマーのようなSNP検出試薬)はまた、部分的または全体的に、ペプチド核酸(PNA)のような1つ以上の型の核酸アナログ形態(米国特許第5,539,082号;米国特許第5,527,675号;米国特許第5,623,049号;米国特許第5,714,331号)であり得る。核酸、特にDNAは、二本鎖であってもまたは一本鎖であってもよい。一本鎖核酸は、コード鎖(センス鎖)または相補的非コード鎖(アンチセンス鎖)であり得る。DNAセグメント、RNAセグメント、またはPNAセグメントは、例えば、ヒトゲノムの断片(DNAまたはRNAの場合)、または単一のヌクレオチド、短いオリゴヌクレオチドリンカーから、あるいは一連のオリゴヌクレオチドから構築され、合成核酸分子を提供し得る。核酸分子は、参考として本明細書において提供される配列を使用して容易に合成され得、オリゴヌクレオチドおよびPNAオリゴマーの合成技術は、当該分野で周知である(例えば、Corey,“Peptide nucleic acids:expanding the scope of nucleic acid recognition”,Trends Biotechnol.1997 June;15(6):224−9,およびHyrupら、“Peptide nucleic acids(PNA):synthesis,properties and potential applications”,Bioorg Med Chem.1996 January;4(1):5−23参照)。さらに、大規模な自動化オリゴヌクレオチド/PNA合成(アレイまたはビーズ表面または他の固体支持体上での合成を含む)が、市販の核酸合成機(例えば、Applied Biosystems(Foster City,Calif.)3900 High−Throughput DNA SynthesizerまたはExpedite 8909 Nucleic Acid Synthesis System)、および本明細書において提供される配列情報を使用して容易に達成され得る。
【0083】
本発明は、当該分野で公知の改変されたヌクレオチド、合成ヌクレオチド、もしくは天然に生じないヌクレオチド、または改変された構造エレメント、合成の構造エレメント、もしくは天然に生じない構造エレメント、または他の代替的な/改変された核酸化学を含む、核酸アナログを含む。このような核酸アナログは、例えば、配列番号21、26および27において同定される1つ以上のSNPを検出するための検出試薬(例えば、プライマー/プローブ)として有用である。さらに、これらアナログを含むキット/システム(例えば、ビーズ、アレイなど)もまた、本発明に含まれる。例えば、具体的には、本発明の多型配列に基づくPNAオリゴマーが企図される。PNAオリゴマーは、DNAのアナログであり、そのリン酸骨格は、ペプチド様骨格で置換されている(Lagriffoulら、Bioorganic&Medicinal Chemistry Letters,4:1081−1082(1994),Petersenら、Bioorganic&Medicinal Chemistry Letters,6:793−796(1996),Kumarら、Organic Letters 3(9):1269−1272(2001),WO96/04000)。PNAは、従来のオリゴヌクレオチドおよびオリゴヌクレオチドアナログよりも、高い親和性および特異性で、相補的なRNAまたはDNAとハイブリダイズする。このPNAの特性は、従来のオリゴヌクレオチドおよびペプチドを用いては達成し得ない新規な分子生物学および生化学の用途を可能とする。
【0084】
核酸の結合特性および/または安定性を改善する核酸改変のさらなる例は、イノシンのような塩基アナログ、インターカレーター(米国特許第4,835,263号)および副溝の結合体(米国特許第5,801,115号)の使用を含む。したがって、核酸分子、SNP含有核酸分子、SNP検出試薬(例えば、プローブおよびプライマー)、オリゴヌクレオチド/ポリヌクレオチドに対する本明細書における言及は、PNAオリゴマーおよび他の核酸アナログを含む。当該分野で公知の核酸アナログおよび選択的核酸化学/改変核酸化学の他の例は、Current Protocols in Nucleic Acid Chemistry,John Wiley&Sons,N.Y.(2002)に記載される。
【0085】
さらに、天然に存在する対立遺伝子変異型(ならびにオルソログおよびパラログ)ならびに変異誘発技術によって産生される合成変異体のような、核酸分子の変異体(例えば、限定されないが、配列番号11から16として同定されたもの)は、当該分野において周知の方法を使用して同定および/または産生され得る。さらにこのような変異体は、配列番号11から16として開示される核酸配列(またはその断片)と少なくとも、70%から80%、80%から85%、85%から90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%の配列同一性を共有し、かつ新規SNP対立遺伝子を含む、ヌクレオチド配列を含み得る。したがって、本発明は、配列番号11から16の配列と比較した場合ある程度の配列変異を有するが、新規SNP対立遺伝子を含む、単離された核酸分子を具体的に企図する。
【0086】
2つの配列間の配列の比較および同一性のパーセントの決定は、数学的アルゴリズムを用いて達成され得る。(Computational Molecular Biology,Lesk,A.M.,ed.,Oxford University Press,New York,1988;Biocomputing:Informatics and Genome Projects,Smith,D.W.,ed.,Academic Press,New York,1993;Computer Analysis of Sequence Data,Part 1,Griffin,A.M.,およびGriffin,H.G.,eds.,Humana Press,New Jersey,1994;Sequence Analysis in Molecular Biology,von Heinje,G.,Academic Press,1987;およびSequence Analysis Primer,Gribskov,M.およびDevereux,J.,eds.,M Stockton Press,New York,1991)。好ましい実施形態では、2つのアミノ酸配列間の同一性のパーセントは、Blossom 62マトリックスまたはPAM250マトリックスのいずれか、ギャップウェート(gap weight)16、14、12、10、8、6または4、長さウェート(length weight)1、2、3、4、5または6)を使用して、NeedlemanおよびWunschのアルゴリズム(J.Mol.Biol.(48):444−453(1970))を用いて決定され、これは、GCGソフトウェアパッケージ内のGAPプログラムへ組み込まれている。
【0087】
さらに別の好ましい実施形態では、2つのヌクレオチド配列間の同一性のパーセントは、NWSgapdna.CMPマトリックスならびにギャップウェート(40、50、60、70、または80)および長さウェート(1、2、3、4、5、または6)を使用してGCGソフトウェアパッケージ内のGAPプログラム(Devereux,J.ら、Nucleic Acids Res.12(1):387(1984))を用いて決定される。別の実施形態では、2つのアミノ酸配列または2つのヌクレオチド配列の間の同一性のパーセントは、PAM120ウェート残基表、ギャップ長ペナルティー12およびギャップペナルティー4を用いて、ALIGNプログラム(バージョン2.0)へ組み込まれているE.MyersおよびW.Millerのアルゴリズム(CABIOS,4:11−17(1989))を使用して決定される。
【0088】
本発明のヌクレオチド配列およびアミノ酸配列は、さらに「照会配列」として使用され、例えば、他のファミリーメンバーまたは関連配列を同定するために、配列データベースに対して検索を実施し得る。このような検索は、Altschulら、(J.Mol.Biol.215:403−10(1990))のNBLASTプログラムおよびXBLASTプログラム(バージョン2.0)を使用して実施し得る。BLASTヌクレオチド検索は、NBLASTプログラム(スコア=100、ワード長(wordlength)=12)を用いて実施し、本発明の核酸分子に相同なヌクレオチド配列を得ることが可能である。BLASTのタンパク質検索は、XBLASTプログラム(スコア=50、ワード長=3)を用いて実施し、本発明のタンパク質に相同なアミノ酸配列を得ることが可能である。比較目的のためにギャップを入れたアライメントを得るために、Gapped BLASTが、Altschulら、(Nucleic Acids Res.25(17):3389−3402(1997))に記載されるように利用され得る。BLASTおよびgapped BLASTプログラムを利用した場合、それぞれのプログラム(例えば、XBLASTおよびNBLAST)のデフォルトパラメーターが、使用され得る。BLASTに加えて、当該分野で使用される他の検索プログラムおよび配列比較プログラムの例としては、FASTA(Pearson,Methods Mol.Biol.25,365−389(1994))およびKERR(Dufresneら、Nat Biotechnol 2002 December;20(12):1269−71)が挙げられるが、これらに限定されない。生命情報科学技術に関するさらなる情報については、Current Protocols in Bioinformatics,John Wiley&Sons,Inc.,N.Y.参照。
【0089】
SNP検出試薬
本発明の具体的な形態では、本明細書において開示される配列は、SNP検出試薬の設計のために使用され得る。好ましい実施形態では、配列番号11から16の配列が、SNP検出試薬の設計のために使用される。本明細書において使用される場合、「SNP検出試薬」は、本明細書において開示される特定の標的SNP位置を特異的に検出し、好ましくは、標的SNP位置の特定のヌクレオチド(対立遺伝子)に対して特異的である(すなわち、検出試薬は、好ましくは、標的SNP位置にある異なる選択的ヌクレオチドを区別し得、これによって標的SNP位置に存在するヌクレオチドの正体を決定することを可能とする)。典型的に、このような検出試薬は、標的SNP含有核酸分子に対して配列特異的な様式の相補的な塩基対合によってハイブリダイズし、試験サンプル中において当該分野で公知の形態のような他の核酸配列から標的変異体の配列を区別する。好ましい実施形態では、このようなプローブは、同一の標的SNP位置において異なるヌクレオチドを有する他の核酸から標的SNP位置で特定のヌクレオチド(対立遺伝子)を有する核酸を区別し得る。さらに、検出試薬は、SNP位置に対して5’側および/または3’側にある特定の領域、特に3’UTRに対応する領域にハイブリダイズし得る。検出試薬の別の例は、標的ポリヌクレオチドの相補鎖に沿うヌクレオチドの伸長の開始点として作用するプライマーである。本明細書において提供されるSNP配列の情報はまた、本発明の任意のSNPを(例えば、PCRを使用して)増幅するためのプライマー(例えば、対立遺伝子特異的プライマー)を設計するためにも有用である。
【0090】
本発明の好ましい一実施形態では、SNP検出試薬は、単離もしくは合成されたDNAまたはRNAのポリヌクレオチドプローブ、またはプライマー、またはPNAオリゴマー、またはDNA、RNAおよび/もしくはPNAの組み合わせであり、LCS内に位置するSNPを含む標的核酸分子のセグメントに対してハイブリダイズする。ポリヌクレオチドの形態の検出試薬は場合により、改変塩基アナログ、インターカレート剤、または副溝の結合体を含み得る。プローブのような複数の検出試薬は、SNP検出キットを形成するために、例えば、固体支持体(例えば、アレイもしくはビーズ)に付着させられるか、または溶液中にて供給され得る(例えば、PCR、RT−PCR、TaqManアッセイ、もしくはプライマー伸長反応のような酵素反応のためのプローブ/プライマーセット)。
【0091】
プローブまたはプライマーは、典型的には、精製されたオリゴヌクレオチドまたはPNAオリゴマーである。このようなオリゴヌクレオチドは、典型的に、ストリンジェントな条件下で、標的核酸分子における少なくとも約8個、約10個、約12個、約16個、約18個、約20個、約21個、約22個、約25個、約30個、約40個、約50個、約60個、約100個(またはこれらの間のあらゆる他の数)のまたはこれ以上の連続するヌクレオチドに対してハイブリダイズする、相補的なヌクレオチド配列の領域を含む。特定のアッセイに依存して、その連続するヌクレオチドは、標的SNP位置を含み得るか、あるいは所望されるアッセイを実施するためにSNP位置に十分に近い、5’側および/または3’側の特定の領域であり得るかのいずれかである。
【0092】
このようなプライマーおよびプローブが、本発明のSNPの遺伝子型決定のための試薬として直接的に有用であり、任意のキット/システム形態へ組込まれ得ることは、当業者に明らかになるであろう。
【0093】
標的SNP含有配列に特異的なプローブまたはプライマーを作製するために、目的のSNP周辺の遺伝子配列/転写産物配列および/またはコンテキスト配列が典型的には、そのヌクレオチド配列の5’末端または3’末端において開始する、コンピュータアルゴリズムを使用して調べられる。次いで典型的なアルゴリズムは、その遺伝子配列/SNPコンテキスト配列に特有である、規定された長さのオリゴマーを同定し、このオリゴマーは、ハイブリダイゼーションのために適切な範囲内のGC含量を有し、ハイブリダイゼーションを妨げ得る推定二次構造を有さず、そして/または所望される他の特性を保有するか、あるいは、所望されない他の特質を欠く。
【0094】
本発明のプライマーまたはプローブは、典型的には、少なくとも約8ヌクレオチドの長さである。本発明の一実施形態では、プライマーまたはプローブは、少なくとも約10ヌクレオチドの長さである。好ましい実施形態では、プライマーまたはプローブは、少なくとも約12ヌクレオチドの長さである。より好ましい実施形態では、プライマーまたはプローブは、少なくとも約16ヌクレオチド、少なくとも約17ヌクレオチド、少なくとも約18ヌクレオチド、少なくとも約19ヌクレオチド、少なくとも約20ヌクレオチド、少なくとも約21ヌクレオチド、少なくとも約22ヌクレオチド、少なくとも約23ヌクレオチド、少なくとも約24ヌクレオチド、または少なくとも約25ヌクレオチドの長さである。プローブの最大長は、そのプローブが使用されるアッセイの型に依存して、検出される標的配列と同じ程度までの長さであり得るが、典型的には、約50ヌクレオチド未満、約60ヌクレオチド未満、約65ヌクレオチド未満、または約70ヌクレオチド未満の長さである。プライマーの場合には、その最大長は、典型的には、約30ヌクレオチド未満の長さである。本発明の具体的な好ましい実施形態では、プライマーまたはプローブは、約18ヌクレオチドから約28ヌクレオチドの長さの範囲内にある。しかし、他の実施形態(例えば、核酸アレイ、およびプローブが基材に付着する他の実施形態)において、上記プローブは、より長い(例えば、30から70ヌクレオチド、75ヌクレオチド、80ヌクレオチド、90ヌクレオチド、100ヌクレオチド以上の長さ)ものであり得る(以下の「SNP検出キットおよびシステム」と題する節参照)。
【0095】
SNPを解析するために、選択的SNP対立遺伝子に特異的なオリゴヌクレオチドを使用することが、適切であり得る。標的配列における単一ヌクレオチド変化を検出するそのようなオリゴヌクレオチドは、「対立遺伝子特異的オリゴヌクレオチド」、「対立遺伝子特異的プローブ」または「対立遺伝子特異的プライマー」のような用語によって呼ばれ得る。多型を解析するための対立遺伝子特異的プローブの設計および使用は、例えば、Mutation Detection A Practical Approach,ed.Cottonら、Oxford University Press,1998;Saikiら、Nature 324,163−166(1986);Dattagupta,EP235,726;およびSaiki,WO89/11548に記載される。
【0096】
各々の対立遺伝子特異的プライマーまたは対立遺伝子特異的プローブの設計は、変数(例えば、標的核酸分子中のSNP位置に隣接するヌクレオチド配列の正確な組成、ならびにそのプライマーまたはプローブの長さ)に依存するが、プライマーおよびプローブの使用における別の要因は、そのプローブまたはプライマーと、標的配列との間のハイブリダイゼーションが実施される条件のストリンジェンシーである。より高いストリンジェンシー条件は、より低いイオン強度および/またはより高い反応温度の緩衝液を利用し、そして安定な二重鎖を形成するためには、プローブ/プライマーと標的配列との間のより完全な一致を必要とする傾向がある。しかし、そのストリンジェンシーが高すぎる場合、ハイブリダイゼーションは、全く生じない場合がある。対照的に、より低いストリンジェンシー条件は、より高いイオン強度および/またはより低い反応温度の緩衝液を利用し、そしてプローブ/プライマーと標的配列との間のよりミスマッチした塩基による安定な二重鎖の形成を可能にする。例としてであって限定としてではないが、対立遺伝子特異的プローブを使用する高ストリンジェンシーハイブリダイゼーション条件についての例示的な条件は、以下の通りである:5倍標準的生理食塩水リン酸EDTA(SSPE)、0.5%NaDodSO.sub.4(SDS)を含む溶液を用いる55℃でのプレハイブリダイゼーション;同じ溶液中にある標的核酸分子とともに同じ温度でプローブをインキュベートすること、その後、2倍SSPEおよび0.1%SDSを含む溶液を用いて55℃または室温で洗浄すること。
【0097】
中程度のストリンジェンシーのハイブリダイゼーション条件が、例えば、約50mM KClを含む溶液を用いて、約46℃にて、対立遺伝子特異的プライマー伸長反応のために使用され得る。あるいは、上記反応は、高温(例えば、60℃)にて実行され得る。別の実施形態では、オリゴヌクレオチド連結アッセイ(OLA)反応(この反応において、2つのプローブが標的配列と完全に相補的な場合に、これら2つのプローブが連結される)のために適切な中程度にストリンジェントなハイブリダイゼーション条件は、約100mM KClの溶液を、温度46℃にて利用し得る。
【0098】
ハイブリダイゼーションベースのアッセイにおいて、ある個体由来の標的DNAのセグメントにハイブリダイズするが、別の個体由来の対応するセグメントには、その2つの個体由来の個々のDNAセグメントにおける異なる多型形態(例えば、選択的SNP対立遺伝子/ヌクレオチド)の存在に起因してハイブリダイズしない、対立遺伝子特異的プローブが、設計され得る。ハイブリダイゼーション条件は、対立遺伝子間のハイブリダイゼーション強度における検出可能な有意な差異が存在し、好ましくは、本質的には二元の応答が存在し、それによって、プローブが対立遺伝子のうちの一方のみにハイブリダイズするかまたは一方の対立遺伝子に対して有意により強くハイブリダイズするのに充分に、ストリンジェントであるべきである。プローブは、SNP部位を含む標的配列にハイブリダイズしてそのSNP部位がそのプローブの配列に沿ったどこかに整列するように設計され得るが、そのプローブは、好ましくは、標的配列のセグメントにハイブリダイズして、そのSNP部位が、そのプローブの中心位置(例えば、そのプローブのいずれかの末端から少なくとも3ヌクレオチド離れているそのプローブ内の位置)と整列するように設計される。このプローブ設計は、一般的には、異なる対立遺伝子形態間でのハイブリダイゼーションにおける良好な識別を達成する。
【0099】
別の実施形態では、プローブまたはプライマーは、標的DNAのセグメントにハイブリダイズして、そのSNPがそのプローブまたはプライマーの最も5’側の末端または最も3’側の末端のいずれかと整列するように、設計され得る。オリゴヌクレオチド連結アッセイ(米国特許第4,988,617号)における使用のために特に適切な具体的な好ましい実施形態では、上記プローブの最も3’側のヌクレオチドは、その標的配列中のSNP位置と整列する。
【0100】
オリゴヌクレオチドプローブおよびオリゴヌクレオチドプライマーは、当該分野で周知の方法によって調製され得る。化学合成方法としては、Narangら、1979,Methods in Enzymology 68:90により記載されるホスホトリエステル法;Brownら、1979,Methods in Enzymology 68:109により記載されるホスホジエステル法;Beaucageら、1981,Tetrahedron Letters 22:1859により記載されるジエチルホスホアミデート法;および米国特許第4,458,066号に記載される固体支持体法が挙げられるが、これらに限定されない。
【0101】
対立遺伝子特異的プローブは、しばしば、対の状態で(または、より一般的ではないが、3個または4個の組の状態で(例えば、SNP位置がそれぞれ3個または4個の対立遺伝子を有することが公知である場合、あるいは、標的SNP対立遺伝子の核酸分子の両方の鎖をアッセイするために))使用され、そのような対は、そのSNP位置で対立遺伝子変異型を示す1ヌクレオチドミスマッチ以外は同一であり得る。
一般的に、1つの対のうちの一方のメンバーは、より一般的なSNP対立遺伝子(すなわち、標的集団中においてより頻繁である対立遺伝子)を有する標的配列参照形態と完全に一致し、その対のうちのもう一方のメンバーは、より一般的ではないSNP対立遺伝子(すなわち、その標的集団において稀な対立遺伝子)を有する標的配列形態と完全に一致する。アレイの場合には、複数のプローブ対が、複数の異なる多型を同時に解析するために同じ支持体上に固定され得る。
【0102】
ある型のPCRベースのアッセイにおいて、対立遺伝子特異的プライマーは、SNP位置と重複し、そのプライマーが完全相補性を示す対立遺伝子形態の増幅のみをプライミングする、標的核酸分子上の領域にハイブリダイズする(Gibbs,1989,Nucleic Acid Res.17 2427−2448)。典型的には、それらのプライマーの最も3’側のヌクレオチドは、その標的核酸分子のSNP位置と整列し、かつそのSNP位置と相補的である。このプライマーは、遠位部位にてハイブリダイズする第2のプライマーと整列の結合に使用される。増幅は、これらの2つのプライマーから進行し、どの対立遺伝子形態が試験サンプル中に存在するかを示す検出可能な産物を生じる。コントロールが、通常、第2のプライマー対を用いて実施される。この第2のプライマー対のうちの一方は、その多型部位で一塩基ミスマッチを示し、この第2のプライマー対のうちのもう一方は、遠位部位に対して完全相補性を示す。この一塩基ミスマッチは、増幅を防止するかまたは増幅効率を実質的に減少させ、その結果、検出可能な産物が形成されないか、または検出可能な産物がより低量もしくはより低速度で形成される。上記の方法は、一般的には、そのミスマッチがそのオリゴヌクレオチドの最も3’側の位置にある(すなわち、そのオリゴヌクレオチドの最も3’側の位置が、標的SNP位置と整列する)場合に、最も効率的に作用する。なぜなら、この位置は、上記プライマーからの伸長に対して最も不安定であるからである(例えば、WO93/22456参照)。このPCRベースのアッセイは、下記のTaqManアッセイの一部として利用され得る。
【0103】
本発明の具体的実施形態では、本発明のプライマーは、標的SNPを含む核酸分子のセグメントに対して実質的に相補的な配列を含み、但し、そのプライマーは、そのプライマーの最も3’側の末端にある3つのヌクレオチド位置のうちの1つにおいてミスマッチヌクレオチドを有し、その結果、そのミスマッチヌクレオチドは、そのSNP部位において特定の対立遺伝子と塩基対形成しない。好ましい実施形態では、上記プライマー中のミスマッチヌクレオチドは、そのプライマーの最も3’側の位置にある最後のヌクレオチドから2番目にある。より好ましい実施形態では、上記プライマー中のミスマッチヌクレオチドは、そのプライマーの最も3’側の位置にある最後のヌクレオチドである。
【0104】
本発明の別の実施形態では、本発明のSNP検出試薬は、検出可能なシグナルを発する蛍光発生レポーター色素で標識される。好ましいレポーター色素は、蛍光色素であるが、検出試薬(例えば、オリゴヌクレオチドプローブまたはオリゴヌクレオチドプライマー)に結合され得る任意のレポーター色素が、本発明における使用のために適切である。そのような色素としては、アクリジン、AMCA、BODIPY、カスケードブルー、Cy2、Cy3、Cy5、Cy7、ダブシル、エダンス、エオシン、エリスロシン、フルオレセイン、6−Fam、Tet、Joe、Hex、オレゴングリーン、ローダミン、Rhodol Green、Tamra、Rox、およびテキサスレッドが挙げられるが、これらに限定されない。
【0105】
本発明のなお別の実施形態では、その検出試薬は、特に、その試薬が自己クエンチングプローブ(例えば、TaqMan)(米国特許第5,210,015号および米国特許第5,538,848号)または分子ビーコンプローブ(米国特許第5,118,801号および米国特許第5,312,728号)または他のステムレスプローブもしくは直鎖状ビーコンプローブ(Livakら、1995,PCR Method Appl.4:357−362;Tyagiら、1996,Nature Biotechnology 14:303−308;Nazarenkoら、1997,Nucl.Acids Res.25:2516−2521;米国特許第5,866,336号および米国特許第6,117,635号)として使用される場合に、クエンチャー色素(例えば、Tamra)でさらに標識され得る。
【0106】
本発明の検出試薬はまた、他の標識(ストレプトアビジン結合のためのビオチン、抗体結合のためのハプテン、および別の相補的オリゴヌクレオチド(例えば、ジップコードの対)に結合するためのオリゴヌクレオチドが挙げられるが、これらに限定されない)を含み得る。
【0107】
本発明はまた、本明細書において同定されたSNPヌクレオチドを含まない(またはそのSNPヌクレオチドと相補的である)が、本明細書において開示される1つ以上のSNPをアッセイするために使用される、試薬も企図する。例えば、本明細書において提供される標的SNP位置に隣接はするが直接的にはハイブリダイズしないプライマーが、それらのプライマーが、その標的SNP位置と近接する(すなわち、その標的SNP部位から1ヌクレオチド以上の範囲内にある)領域にハイブリダイズするプライマー伸長反応において、有用である。そのプライマー伸長反応の間に、プライマーは、典型的には、特定のヌクレオチド(対立遺伝子)が標的SNP部位に存在する場合にはその標的SNP部位を過ぎては伸長できず、そのプライマー伸長産物は、どのSNP対立遺伝子がその標的SNP部位に存在するかを決定するために容易に検出され得る。例えば、特定のddNTPが、一旦ddNTPが上記伸長産物(その最も3’側の末端にddNTPを含み、そのddNTPが本明細書において開示されるSNPに対応する、プライマー伸長産物は、本発明により包含される組成物である)に組み込まれるとプライマー伸長を終結させるために、上記プライマー伸長反応において使用される。したがって、SNP部位に近接する領域中の核酸分子に結合する試薬は、結合した配列はそのSNP部位自体を必ずしも含まないけれども、これもまた本発明によって包含される。
【0108】
SNP検出キットおよびSNP検出システム
当業者は、本明細書において開示されるSNPおよび関連する配列情報に基づいて、検出試薬が、本発明の任意のSNPを個別にかまたは組み合わせてアッセイするために開発および使用され得、そのような検出試薬は、当該分野で周知である確立されたキット形態またはシステム形態のうちの1つに容易に組み込まれ得ることを、認識するであろう。用語「キット」および「システム」とは、本明細書においてSNP検出試薬の文脈で使用される場合、複数のSNP検出試薬の組み合わせ、または1つ以上の他の型のエレメントまたは構成要素(例えば、他の型の生化学試薬、容器、パッケージ(例えば、市販用に意図されるパッケージング)、SNP検出試薬が結合している基材、電子ハードウェア構成要素など)と組み合わせた1種以上のSNP検出試薬のようなものを指す。したがって、本発明は、SNP検出キットおよびSNP検出システム(パッケージされたプローブとプライマーとの組(例えば、TaqManプローブ/プライマーの組)、核酸分子のアレイ/マイクロアレイ、および本発明の1種以上のSNPを検出するための1種以上のプローブ、プライマー、または他の検出試薬を含むビーズが挙げられるが、これらに限定されない)をさらに提供する。上記キット/システムは、種々の電子ハードウェア構成要素を場合により含み得る。例えば、種々の製造業者により提供されるアレイ(「DNAチップ」)および微小流体システム(「ラボ・オン・ア・チップ(lab−on−a−chip)」システム)は、典型的には、ハードウェア構成要素を含む。上記キット/システム(例えば、プローブ/プライマーの組)は、電子ハードウェア構成要素を含まないかもしれないが、例えば、1つ以上の容器中にパッケージングされた1種以上のSNP検出試薬を(場合により、他の生化学試薬とともに)含み得る。
【0109】
いくつかの実施形態では、SNP検出キットは、典型的には、1種以上の検出試薬と、アッセイまたは反応(例えば、SNP含有核酸分子の増幅および/または検出)を実行するための必要な他の構成要素(例えば、緩衝液、酵素(例えば、DNAポリメラーゼもしくはリガーゼ)、鎖伸長ヌクレオチド(例えば、デオキシヌクレオチド三リン酸)、Sanger型DNA配列決定反応の場合には鎖終結ヌクレオチド、ポジティブコントロール配列、ネガティブコントロール配列など)を含む。キットは、標的核酸の量を決定するための手段、およびその量を標準物と比較するための手段をさらに含み得る。キットは、そのキットを使用して目的のSNP含有核酸分子を検出するための指示書を含み得る。本発明の一実施形態では、1種以上のアッセイを実行して本明細書において開示される1種以上のSNPを検出するための必要試薬を含むキットが、提供される。本発明の好ましい実施形態では、SNP検出キット/システムは、核酸アレイの形態、または区画分けされたキット(微小流体システム/ラボ・オン・ア・チップ(lab−on−a−chip)システムを含む)の形態である。
【0110】
SNP検出キット/システムは、例えば、各標的SNP位置またはその付近にある核酸分子にハイブリダイズする1つ以上のプローブまたはプローブ対を含み得る。複数の対立遺伝子特異的プローブ対が、多数のSNPを同時にアッセイするためにこのキット/システム中に含まれ得る。上記多数のSNPのうちの少なくとも1つは、本発明のSNPである。いくつかのキット/システムにおいて、上記対立遺伝子特異的プローブは、基材(例えば、アレイまたはビーズ)に固定される。
【0111】
用語「アレイ」、「マイクロアレイ」、および「DNAチップ」とは、基材(例えば、ガラス、プラスチック、紙、ナイロン、または他の型の膜、フィルター、チップ、もしくは他の適切な固体支持体)に付着された、別個のポリヌクレオチド群を指すために本明細書において互換可能に使用される。上記ポリヌクレオチドは、上記基材上で直接合成され得るか、または上記基材とは別個に合成された後で上記基材に付着され得る。一実施形態では、上記マイクロアレイは、米国特許第5,837,832号、Cheeら、PCT出願WO95/11995(Cheeら),Lockhart,D.Jら、(1996;Nat.Biotech.14:1675−1680)およびSchena,M.ら、(1996;Proc.Natl.Acad.Sci.93:10614−10619(これらすべては、その全体が参照により本明細書に組み込まれる)に記載される方法にしたがって、調製されそして使用される。他の実施形態では、このようなアレイは、Brownら、米国特許第5,807,522号により記載される方法により生成される。
【0112】
核酸アレイは、以下の参考文献中に概説されている:Zammatteoら、“New chips for molecular biology and diagnostics”,Biotechnol Annu Rev.2002;8:85−101;Sosnowskiら、“Active microelectronic array system for DNA hybridization,genotyping and pharmacogenomic applications”,Psychiatr Genet.2002 December;12(4):181−92;Heller,“DNA microarray technology:devices,systems,and applications”,Annu Rev Biomed Eng.2002;4:129−53.Epub 2002 Mar.22;Kolchinskyら、“Analysis of SNPs and other genomic variations using gel−based chips”,Hum Mutat.2002 April;19(4):343−60;およびMcGallら、“High−density genechip oligonucleotide probe arrays”,Adv Biochem Eng Biotechnol.2002;77:21−42。
【0113】
多数のプローブ(例えば、対立遺伝子特異的プローブ)が、アレイにおいて実施され得、各プローブまたはプローブ対は、異なるSNP位置にハイブリダイズし得る。ポリヌクレオチドプローブの場合、これらのプローブは、光指向性化学プロセスを使用して、基材上の指定領域で合成され得る(かまたは、別個に合成され得、その後、指定領域に付着され得る)。各DNAチップは、格子様パターンで整列され(例えば、10セント銀貨の大きさまで)小型化された、例えば、数千から数億個の個々の合成ポリヌクレオチドプローブを含み得る。好ましくは、プローブは、順序立ったアドレス指定可能なアレイ状に固体支持体に付着される。
【0114】
マイクロアレイは、固体支持体に付着した多数の独特の一本鎖ポリヌクレオチド(通常は、合成アンチセンスポリヌクレオチドまたはcDNA断片のいずれか)から構成され得る。典型的なポリヌクレオチドは、好ましくは、約6ヌクレオチドから60ヌクレオチド、より好ましくは約15ヌクレオチドから30ヌクレオチド、最も好ましくは約18ヌクレオチドから25ヌクレオチドの長さである。特定の型のマイクロアレイまたは他の検出キット/システムについて、ほんの約7ヌクレオチドから20ヌクレオチドの長さであるオリゴヌクレオチドを使用することが、好ましくあり得る。他の型のアレイ(例えば、化学発光検出技術と組み合わせて使用されるアレイ)において、好ましいプローブの長さは、例えば、約15ヌクレオチドから80ヌクレオチドの長さ、好ましくは約50ヌクレオチドから70ヌクレオチドの長さ、より好ましくは約55ヌクレオチドから65ヌクレオチドの長さ、最も好ましくは約60ヌクレオチドの長さであり得る。このマイクロアレイまたは検出キットは、遺伝子/転写産物または標的SNP部位の既知の5’配列または3’配列を網羅するポリヌクレオチド;遺伝子/転写産物の全長配列を網羅する連続するポリヌクレオチド;または標的遺伝子/転写産物配列の長さに沿った特定の領域(特に、1つ以上のSNPに対応する領域)から選択される独特のポリヌクレオチドを含み得る。上記マイクロアレイまたは検出キットにおいて使用されるポリヌクレオチドは、目的のSNPに対して特異的(例えば、標的SNP部位の特定のSNP対立遺伝子に対して特異的、または複数の異なるSNP部位にある特定のSNP対立遺伝子に対して特異的)であり得るか、あるいは目的の多型遺伝子/転写産物に対して特異的であり得る。
【0115】
ポリヌクレオチドアレイに基づくハイブリダイゼーションアッセイは、完全に一致する標的配列変異体およびミスマッチ標的配列変異体に対する、上記プローブのハイブリダイゼーション安定性の差異に依存する。SNP遺伝子型決定のために、ハイブリダイゼーションアッセイにおいて使用されるストリンジェンシー条件は、1SNP位置程度にしか互いと異ならない核酸分子が区別され得るのに充分に高いことが、一般的には好ましい(例えば、典型的SNPハイブリダイゼーションアッセイが、1つの特定のヌクレオチドがSNP位置に存在する場合にかぎりハイブリダイゼーションが生じるが、代替的ヌクレオチドがそのSNP位置に存在する場合にはハイブリダイゼーションは生じないように、設計される)。そのような高いストリンジェンシーの条件は、例えば、SNP検出のために対立遺伝子特異的プローブの核酸アレイを使用する場合に、好ましくあり得る。そのような高いストリンジェンシーの条件は、先の節において記載されており、当業者にとって周知であり、そして例えば、Current Protocols in Molecular Biology,John Wiley&Sons,N.Y.(1989),6.3.1−6.3.6において見出され得る。
【0116】
他の実施形態では、上記アレイは、化学発光検出技術と組み合わせて使用される。以下の特許および特許出願(これらはすべて、本明細書により参考として援用される)は、化学発光検出に関するさらなる情報を提供する:米国特許出願10/620332および同10/620333は、マイクロアレイ検出のための化学発光アプローチを記載し、米国特許第6124478号、米国特許第6107024号、米国特許第5994073号、米国特許第5981768号、米国特許第5871938号、米国特許第5843681号、米国特許第5800999号、および米国特許第5773628号は、化学発光検出を実施するためのジオキセタンの方法および組成物を記載し;公開された米国出願US2002/0110828は、マイクロアレイコントロールのための方法および組成物を開示する。
【0117】
本発明の一実施形態では、核酸アレイは、約15ヌクレオチドから25ヌクレオチドの長さのプローブのアレイを含み得る。さらなる実施形態では、核酸アレイは、多数のプローブを含み得、ここで、少なくとも1つのプローブは、SNPを検出可能であり、かつ/または少なくとも1つのプローブは、配列表に開示される配列、それらに相補的な配列、および、少なくとも約8個連続するヌクレオチド、好ましくは、10個、12個、15個、16個、18個、20個、より好ましくは22個、25個、30個、40個、47個、50個、55個、60個、65個、70個、80個、90個、100個またはそれ以上の連続するヌクレオチド(またはこれらの間のあらゆる他の数)を含み、かつ新規なSNP対立遺伝子を含むそれらの断片からなる群より選択される配列のうちの1つの断片を含む。いくつかの実施形態では、上記SNP部位に対して相補的なヌクレオチドは、上記プローブの中心から5ヌクレオチド内、4ヌクレオチド内、3ヌクレオチド内、2ヌクレオチド内、または1ヌクレオチド内、より好ましくは上記プローブの中心にある。
【0118】
ポリヌクレオチドプローブは、PCT出願WO95/251116(Baldeschweilerら)(これは、その全体が参照により本明細書に組み込まれる)に記載されるように、化学カップリング手順およびインクジェット適用装置を使用することによって、基材表面上で合成され得る。別の形態では、ドット(またはスロット)ブロットと類似する「格子状」アレイが、真空系、熱的結合手順、UV結合手順、機械的結合手順、または化学結合手順を使用して、基材表面にcDNA断片またはオリゴヌクレオチドを整列させて結合するために使用され得る。アレイ(例えば、上記のアレイ)は、手によってか、あるいは利用可能なデバイス(スロットブロット装置またはドットブロット装置)、材料(適切な任意の固体支持体)、および機器(ロボット機器を含む)を使用することによって、生成され得、そして8個、24個、96個、384個、1536個、6144個以上のポリヌクレオチド、または市販の機器の効率的な使用のために適する他の任意の数のポリヌクレオチドを含み得る。
【0119】
そのようなアレイまたは他のキット/システムを使用して、本発明は、試験サンプル中にある本明細書において開示されるSNPを同定するための方法を提供する。そのような方法は、典型的には、試験核酸サンプルを、本発明の少なくとも1つのSNP位置に対応する1つ以上のプローブを含むアレイとともにインキュベートする工程、ならびに上記試験サンプル由来の核酸と上記プローブのうちの1つ以上との結合についてアッセイする工程を包含する。SNP検出試薬(またはそのような1種以上のSNP検出試薬を使用する、キット/システム)を、インキュベーション条件は、上記アッセイにおいて使用される形式、使用される検出方法、ならびに上記アッセイにおいて使用される検出試薬の型および性質に依存する。当業者は、市販のハイブリダイゼーション形式、増幅形式、およびアレイアッセイ形式のうちのいずれか1つが、本明細書において開示されるSNPを検出するために容易に適合され得ることを、認識する。
【0120】
本発明のSNP検出キット/システムは、SNP含有核酸分子の後の増幅および/または検出のために、試験サンプルから核酸を調製するために使用される構成要素を含み得る。そのようなサンプル調製構成要素は、任意の体液(例えば、血液、血清、血漿、尿、唾液、粘液質、胃液、精液、涙、汗など)、皮膚、毛髪、細胞(特に、有核細胞)、生検、口腔スワブまたは組織標本からの、核酸抽出物(DNAおよび/またはRNAを含む)、タンパク質抽出物もしくは膜抽出物を生成するために使用され得る。上記の方法において使用される試験サンプルは、上記アッセイ形式、上記検出方法の性質、およびアッセイされるべき試験サンプルとして使用される具体的な組織、細胞、または抽出物に基づいて、変化するであろう。核酸抽出物、タンパク質抽出物、および細胞抽出物を調製する方法は、当該分野で周知であり、利用されるシステムと適合するサンプルを得るために容易に適合され得る。試験サンプルから核酸を抽出するための自動サンプル調製システムは、市販されており、その例は、QiagenのBioRobot 9600、Applied BiosystemsのPRISM 6700、およびRoche Molecular SystemsのCOBAS AmpliPrep Systemである。
【0121】
本発明により企図される別の形態のキットは、区画分けされたキットである。区画分けされたキットは、試薬が別個の容器中に含まれる任意のキットを包含する。そのような容器としては、例えば、小さいガラス容器、プラスチック容器、プラスチック片、ガラス片、または紙片、またはアレイ形成材料(例えば、シリカ)が挙げられる。そのような容器によって、試験サンプルおよび試薬が相互混入しないようにある区画から別の区画へと試薬を効率的に移動することが可能であるか、またはある区画からそのキット中に含まれない別の容器に移動することが可能であり、各容器の薬剤または溶液は、ある区画から別の区画または別の容器へと、定量的様式で添加され得る。そのような容器としては、例えば、試験サンプルを受容する1つ以上の容器、本発明の1つ以上のSNPを検出するための少なくとも1つのプローブまたは他のSNP検出試薬を含む1つ以上の容器、洗浄試薬(例えば、リン酸緩衝化生理食塩水、Tris緩衝液など)を含む1つ以上の容器、および結合したプローブまたは他のSNP検出試薬の存在を明らかにするために使用される試薬を含む1つ以上の容器が、挙げられ得る。上記キットは、例えば、核酸増幅反応または他の酵素反応(例えば、プライマー伸長反応)、ハイブリダイゼーション、ライゲーション、電気泳動(好ましくは、キャピラリー電気泳動)、質量分析法、および/またはレーザー誘導蛍光検出のための、区画および/もしくは試薬を場合によりさらに含み得る。上記キットはまた、そのキットを使用するための指示書を備え得る。例示的な区画分けされたキットとしては、当該分野で公知の微小流体デバイス(例えば、Weiglら、“Lab−on−a−chip for drug development”,Adv Drug Deliv Rev.2003 Feb.24;55(3):349−77参照)が挙げられる。そのような微小流体デバイスにおいて、上記容器は、例えば、微小流体「容器」、微小流体「チャンバ」、または微小流体「チャネル」と呼ばれ得る。
【0122】
マイクロ流体デバイスは、「ラボ・オン・ア・チップ(lab−on−a−chip)」システムとも称され得、生物医学的なマイクロ電気機械システム(bioMEM)または多構成要素一体型システムは、SNPを解析するための本発明の典型的なキット/システムである。このようなシステムは、単一の機能性デバイスにおいてプローブ/標的ハイブリダイゼーション、核酸増幅、およびキャピラリー電気泳動法の反応のような過程を縮小化および分画化する。このようなマイクロ流体デバイスは典型的に、システムの少なくとも1つの形態において検出試薬を利用し、そしてこのような検出試薬は使用され、本発明の1つ以上のSNPを検出し得る。マイクロ流体システムの1つの例は、米国特許第5,589,136号に開示され、この開示はチップにおいてPCR増幅の統合およびキャピラリー電気泳動が記載される。典型的なマイクロ流体システムは、マイクロチップ上に含まれるガラス、シリコン、石英、またはプラスチックのウエハ上に設計されるマイクロチャネルのパターンを含む。サンプルの移動は、電気、電気浸透性、または流体静力学の力によって制御され得、この力は、機能的顕微鏡バルブおよび可動部分を伴わないポンプを作成するためにマイクロチップの異なる範囲にわたって適用される。電圧の変化は、マイクロ機械加工されたチャネル間の交点で液体の流動を制御する方法およびマイクロチップの異なるセクションにわたりポンプ注入するための液体流量を変化させるための方法として使用され得る。例えば、米国特許第6,153,073号(Dubrowら)および米国特許第6,156,181号(Parceら)参照。
【0123】
SNPを遺伝子型決定するために、典型的なマイクロ流動システムは、例えば、核酸増幅、プライマー伸長、キャピラリー電気泳動、およびレーザー光誘導蛍光検出のような検出方法を統合し得る。このような例示的なシステムを使用するための例示的なプロセスの最初の工程において、核酸サンプルは、好ましくはPCRによって増幅される。次いで、増幅産物は、ddNTP(各ddNTPに対して特異的な蛍光)および適切なオリゴヌクレオチドプライマーを使用する自動プライマー伸長反応に供され標的SNPのちょうど上流にハイブリダイズするプライマー伸長反応を実施する。3’末端において伸長が一旦完了すると、このプライマーは、キャピラリー電気泳動によって組込まれていない蛍光ddNTPから分離される。キャピラリー電気泳動に使用される分離培地は、例えば、ポリアクリルアミド、ポリエチレングリコールまたはデキストランであり得る。単一のヌクレオチドプライマーの伸長産物中に組込まれたddNTPは、レーザー光誘導蛍光検出によって同定される。このような例示的なマイクロチップが、使用され例えば、少なくとも96サンプルから384サンプル、またはそれ以上が同時に処理され得る。
核酸分子の使用
本発明の核酸分子は、特に障害を発症するリスクの評価において種々の用途を有する。典型的な障害としては、炎症性、変性、代謝、増殖性、循環、認知、生殖および行動の障害が挙げられるが、これに限定されない。本発明の好ましい実施形態では、障害は癌である。例えば、核酸分子は、ハイブリダイゼーションプローブとして、例えば、メッセンジャーRNA、転写産物、cDNA、ゲノムDNA、増幅されたDNAまたは他の核酸分子においてSNPを遺伝子型決定するために、ならびに全長cDNAおよびゲノムクローンを単離するために有用である。
【0124】
プローブは、LCS含有核酸分子の全長に沿って任意のヌクレオチド配列にハイブリダイズし得る。好ましくは、プローブは、配列特異的な様式でSNP含有標的配列にハイブリダイズし、その結果、標的配列を、どのヌクレオチドがSNP部位に存在するかによってのみ、標的配列と異なる他のヌクレオチド配列とを識別する。このようなプローブは、試験サンプル中のSNP含有核酸の存在を検出するために、またはどのヌクレオチド(対立遺伝子)が、特定のSNP部位に存在するかを決定する(すなわち、SNP部位を遺伝子型決定する)ために特に有用である。
【0125】
核酸のハイブリダイゼーションプローブは、核酸発現の存在、レベル、形態、および/または分布を決定するために使用され得る。レベルが決定される核酸は、DNAまたはRNAであり得る。したがって、本明細書において記載されるSNPに特異的なプローブが、使用され所定の細胞、組織、または生物において存在、発現および/または遺伝子のコピー数を調べ得る。これらの用途は、正常なレベルに対する遺伝子発現の増加または減少に関連する障害の診断に関連する。mRNA検出のためのインビトロ技術としては、例えば、ノーザンブロットハイブリダイゼーションおよびインサイチュハイブリダイゼーションが挙げられる。DNAを検出するためのインビトロ技術としては、サザンブロットハイブリダイゼーションおよびインサイチュハイブリダイゼーションが挙げられる(SambrookおよびRussell,2000,Molecular Cloning:A Laboratory Manual,Cold Spring Harbor Press,Cold Spring Harbor,N.Y.)。
【0126】
したがって、本発明の核酸分子は、ハイブリダイゼーションプローブとして使用され本明細書において開示されるSNPを検出し得、それによって多型を有する個体が、障害を発症するリスクを有するか否かを決定し得る。疾患の表現型に関連するSNPの検出は、活性な疾患および/または疾患に対する遺伝的な素因についての予測ツールを提供する。
【0127】
本発明の核酸分子はまた、本明細書において記載されるSNP含有核酸分子に由来する発現されたmRNA分子の全体または一部分に対応するリボザイムを設計するのにも有用である。
【0128】
本発明の核酸分子はまた、核酸分子および改変ペプチドの全体または一部分を発現するトランスジェニック動物を構築するためにも有用である。本明細書において開示されるSNPを含む核酸分子を有する組換え細胞およびトランスジェニック動物の産生は、例えば、処置化合物および投薬レジメンの効果的な臨床設計を可能とする。
【0129】
SNP遺伝子決定方法
どの特定のヌクレオチド(すなわち対立遺伝子)が、1つ以上のSNP位置の各々に存在するかを決定するプロセスは、SNP遺伝子型決定と称される。本発明は、種々の障害についてのスクリーニングまたはその素因の決定、または処置形態に対する応答性の決定、または予後診断、またはゲノムマッピングまたはSNP関連性解析などの用途のための、SNP遺伝子型決定の方法を提供する。
【0130】
核酸サンプルは、当該分野において周知の方法によって遺伝子型決定され、どの対立遺伝子が、目的の任意の所定遺伝子領域(例えば、SNP位置)に存在するかを決定し得る。隣接する配列が、オリゴヌクレオチドプローブのようなSNP検出試薬を設計するために使用され得、このプローブは場合によりキットの形式で与えられ得る。例示的なSNP遺伝子型決定方法は、Chenら、“Single nucleotide polymorphism genotyping:biochemistry,protocol,cost and throughput”,Pharmacogenomics J.2003;3(2):77−96;Kwokら、“Detection of single nucleotide polymorphisms”,Curr Issues Mol.Biol.2003 April;5(2):43−60;Shi,“Technologies for individual genotyping:detection of genetic polymorphisms in drug targets and disease genes”,Am J Pharmacogenomics.2002;2(3):197−205;およびKwok,“Methods for genotyping single nucleotide polymorphisms”,Annu Rev Genomics Hum Genet 2001;2:235−58に記載される。ハイスループットのSNP遺伝子型決定についての例示的技術は、Marnellos,“High−throughput SNP analysis for genetic association studies”,Curr Opin Drug Discov Devel.2003 May;6(3):317−21に記載される。一般的なSNP遺伝子型決定方法としては、TaqManアッセイ、分子ビーコンアッセイ、核酸アレイ、対立遺伝子特異的なプライマー伸長、対立遺伝子特異的PCR、配列されたプライマー伸長、均質なプライマーの伸長アッセイ、質量分析法による検出を伴うプライマー伸長、高熱配列決定(pyrosequencing)、遺伝子アレイで選別される複合プライマーの伸長、周期的ローリングサークルを伴うライゲーション、均質なライゲーション、OLA(米国特許第4,988,167号)、遺伝子アレイで選別される複合ライゲーション反応、制限断片長の多型、一塩基の伸長タグアッセイおよびインベーダーアッセイが挙げられるが、これらに限定されない。このような方法は、例えば、発光または化学発光の検出、蛍光検出、時間分解型蛍光検出、蛍光共鳴エネルギー伝達、蛍光偏光、質量分析、および電気検出のような検出メカニズムと組み合わせて用いられ得る。
【0131】
多型を検出するための種々の方法としては、切断因子からの保護がRNA/RNA二重鎖またはRNA/DNA二重鎖においてミスマッチの塩基を検出するために使用される方法(Myersら、Science 230:1242(1985);Cottonら、PNAS 85:4397(1988);およびSaleebaら、Meth.Enzymol.217:286−295(1992))、変異体および野生型の核酸分子の電気泳動の移動度の比較(Oritaら、PNAS 86:2766(1989);Cottonら、Mutat.Res.285:125−144(1993);およびHayashiら、Genet.Anal.Tech.Appl.9:73−79(1992))ならびに変性勾配ゲル電気泳動(DGGE)を用いて変性剤の勾配を含むポリアクリルアミドゲルにおいて多型断片または野生型断片の移動をアッセイすること(Myersら、Nature 313:495(1985))が挙げられるが、これらに限定されない。特定の位置での配列の変化はまた、RNase保護およびS1保護のような、ヌクレアーゼ保護アッセイまたは化学切断法によっても評価され得る。
【0132】
好ましい実施形態では、SNP遺伝子型決定は、5’ヌクレアーゼアッセイとしても公知であるTaqManアッセイを用いて実施される(米国特許第5,210,015号および米国特許第5,538,848号)。TaqManアッセイは、PCRの間に特定の増幅産物の蓄積を検出する。TaqManアッセイは、蛍光レポーター色素およびクエンチャー色素を用いて標識されたオリゴヌクレオチドプローブを利用する。レポーター色素は、適切な波長での放射線照射によって励起され、蛍光共鳴エネルギー伝達(FRET)と呼ばれるプロセスを介して同一のプローブ中のクエンチャー色素へエネルギーを伝達する。このプローブへ取り付けられた場合、励起されたレポーター色素は、シグナルを放射しない。インタクトなプローブにおけるクエンチャー色素とレポーター色素との近さは、レポーターについての減少した蛍光を維持する。レポーター色素およびクエンチャー色素は、それぞれ最も5’側の末端および最も3’側の末端に有っても、その逆であってもよい。あるいは、レポーター色素は、最も5’側の末端または最も3’側の末端にあり得、一方で、クエンチャー色素は、内部のヌクレオチドに結合される(またはこの逆もあり得る)。さらに別の実施形態では、レポーターおよびクエンチャーの両方が、互いに間隔を空けて内部のヌクレオチドへ結合され得、その結果レポーターの蛍光は、減少される。
【0133】
PCRの間、DNAポリメラーゼの5’ヌクレアーゼ活性がプローブを切断し、それによってレポーター色素とクエンチャー色素とを分離し、そして結果として、レポーターの蛍光の上昇を生じる。PCR産物の蓄積は、レポーター色素の蛍光の上昇をモニタリングすることにより直接検出される。DNAポリメラーゼは、プローブがPCRの間に増幅される標的SNP含有鋳型にハイブリダイズする場合にのみ、レポーター色素とクエンチャー色素との間のプローブを切断し、かつプローブは、特定のSNP対立遺伝子が存在する場合にのみ、標的SNP部位にハイブリダイズするように設計されている。
【0134】
好ましいTaqManプライマーおよびTaqManプローブの配列は、本明細書において提供されるSNPおよび関連する核酸配列情報を用いて、容易に決定され得る。Primer Express(Applied Biosystems、Foster City、Calif.)のようなコンピュータプログラムの多くは、最適なプライマー/プローブのセットを迅速に得るために使用され得る。本発明のSNPを検出するためのこのようなプライマーおよびプローブが、癌などの種々の障害のための予測アッセイにおいて有用であり、かつキット形式に容易に組み込まれることが、当業者に明らかとなるであろう。本発明はまた、Molecular Beaconプローブ(米国特許第5,118,801号および米国特許第5,312,728号)ならびに他の改変形式(米国特許第5,866,336号および米国特許第6,117,635号)の使用のような、当該分野において周知のTaqmanアッセイの改変を含む。
【0135】
多型の同一性はまた、限定されるわけではないが、リボプローブ(Winterら、Proc.Natl.Acad Sci.USA 82:7575,1985;Meyersら、Science 230:1242,1985)およびヌクレオチド誤対合を認識するタンパク質、例えば大腸菌(E.coli)mutSタンパク質(Modrich,P.Ann.Rev.Genet.25:229−253,1991)を用いたリボヌクレアーゼ保護方法を含む誤対合検出技術を用いても決定され得る。別法として、変異型対立遺伝子は、1本鎖立体配座多型(SSCP)解析(Oritaら、Genomics 5:874−879,1989;Humphriesら、in Molecular Diagnosis of Genetic Diseases,R.Elles,ed.,pp.321−340,1996)または変性勾配ゲル電気泳動(DGGE)(Wartellら、Nuci.Acids Res.18:2699−2706,1990;Sheffieldら、Proc.Nati.Acad.Sci.USA 86:232−236,1989)により同定され得る。
【0136】
ポリメラーゼ介在プライマー伸長法もまた、多型の同定に使用され得る。幾つかの上記方法は、特許および科学文献に記載されており、「遺伝ビット解析」方法(国際公開第92/15712号)およびリガーゼ/ポリメラーゼ介在遺伝ビット解析(米国特許第5,679,524号)を含む。関連方法は、WO91/02087,WO90/09455,WO95/17676,米国特許第5,302,509号および米国特許第5,945,283号に開示されている。多型を含む伸長プライマーは、米国特許第5,605,798号に記載された質量分析法により検出され得る。別のプライマー伸長方法は、対立遺伝子特異的PCR(Ruanoら、Nucl.Acids Res.17:8392,1989;Ruanoら、Nucl.Acids Res.19,6877−6882,1991;WO93/22456;Turkiら、J Clin.Invest.95:1635−1641,1995)である。さらに、多数の多型部位は、Wallaceら、(WO89/10414)に記載された対立遺伝子特異的プライマーのセットを用いて多数の核酸領域を同時に増幅することにより調査され得る。
【0137】
本発明のSNPの遺伝型を決定するための別の好ましい方法は、OLAにおける2つのオリゴヌクレオチドプローブの使用である(例えば、米国特許第4,988,617号参照)。この方法において、1つのプローブは、その最も3’末端にSNP部位が整列した、標的核酸のセグメントにハイブリダイズする。第2のプローブは、標的核酸分子の第1のプローブのすぐ3’に隣接するセグメントにハイブリダイズする。2つの並列したプローブは、標的核酸分子にハイブリダイズし、そして、もし第1のプローブの最も3’のヌクレオチドとSNP部位との間に完全な相補性があれば、リガーゼのような結合剤の存在下で連結される。ミスマッチがある場合、連結は起こらない。反応後、連結されたプローブは、標的核酸分子から分離され、そしてSNPの存在の指標として検出される。
【0138】
以下の特許、特許出願、および公開されている国際特許出願は、すべて、本明細書で参考により援用され、種々の形式のOLAを実施するための技術に関するさらなる情報を提供する:米国特許第6,027,889号、米国特許第6,268,148号、米国特許第5494810号、米国特許第5830711号、および米国特許第6054564号は、SNP検出を実施するためのOLAストラテジーを記載する;WO97/31256およびWO00/56927は、ユニバーサルアレイを用いたSNP検出を実施するためのOLAストラテジーを記載し、ここで、ジップコード配列は、ハイブリダイゼーションプローブの1つに導入され得、かつ結果として生じた産物(もしくは増幅産物)は、ユニバーサルジップコードアレイにハイブリダイズし得る;米国特許出願US01/17329(および09/584,905)は、OLA(もしくはLDR)、続いてPCRを記載し、ここで、ジップコードはOLAプローブに組み込まれ、かつ増幅されたPCR産物は、電気泳動もしくはユニバーサルジップコードアレイ読み出し装置により決定される;米国特許出願60/427,818、同60/445,636および同60/445,494は、SNPlex法およびOLAに続くPCRを用いた多重SNP検出のためのソフトウェアを記載し、ここで、ジップコードは、OLAプローブに組み込まれ、かつ増幅されたPCR産物は、ジップシュート(zipchute)試薬とハイブリダイズし、かつSNPの同定は、ジップシュートの電気泳動読み出し装置により決定される。いくつかの実施形態では、OLAは、PCR(もしくは別の核酸増幅方法)の前に実施される。他の実施形態では、PCR(もしくは他の核酸増幅方法)は、OLAの前に実施される。
【0139】
SNPを遺伝子型決定するための別の方法は、質量分析に基づく。質量分析は、DNAの4種のヌクレオチドの各々の固有の質量を利用する。SNPは、代替的なSNP対立遺伝子を有する核酸の質量の差異を測定することにより、質量分析によって明白に遺伝子型決定され得る。MALDI−TOF(Matrix Assisted Laser Desorption Ionization−Time of Flight)質量分析技術が、SNPのような分子質量のきわめて正確な決定のために好ましい。SNP解析に対する数多くのアプローチが、質量分析に基づいて開発されている。好ましい質量分析に基づくSNPを遺伝子型決定する方法は、プライマー伸長アッセイを含み、これも、従来のゲルに基づく形式およびマイクロアレイのような他の適用と組み合わせて利用され得る。
【0140】
典型的に、プライマー伸長アッセイは、標的SNP部位から(5’)上流の鋳型PCRアプリコンに対する、プライマーの設計およびアニールを含む。ジデオキシヌクレオチド三リン酸(ddNTP)および/もしくはデオキシヌクレオチド三リン酸(dNTP)の混合物を、鋳型(例えば、PCRなどにより典型的に増幅されている、SNP含有核酸分子)、プライマー、およびDNAポリメラーゼを含む反応混合物に添加する。プライマーの伸長は、混合物中のddNTPのうちの1つに対して相補的なヌクレオチドが生じる鋳型中の最初の部位で、終結する。プライマーは、SNP部位に直接隣接する(すなわち、プライマーの3’末端のヌクレオチドは、標的SNP部位の隣のヌクレオチドにハイブリダイズする)か、もしくはSNP部位から2つ以上のヌクレオチド離れているかのどちらかであり得る。プライマーが、標的SNP部位から数ヌクレオチド離れている場合、唯一の制限は、プライマーの3’末端とSNP部位との間の鋳型配列が、検出されるべきものと同じ型のヌクレオチドを含まないこと、またはこのことが、伸長プライマーの未完成な終結を引き起こすことである。あるいは、すべての4種のddNTPのみが、dNTPなしで反応混合物に添加される場合、プライマーは常に、標的SNP位置に対応するただ1つのヌクレオチドにより伸長される。この場合、プライマーは、SNP位置より1つ上流のヌクレオチドに結合するために設計される(すなわち、プライマーの3’末端のヌクレオチドは、標的SNP部位の5’側で標的SNP部位に直接隣接するヌクレオチドにハイブリダイズする)。ただ1つのヌクレオチドによる伸長は、伸長されるプライマーの全体の質量を最小にし、それにより、代替的なSNPヌクレオチドの間の質量の差異の分解能を上昇させるので、ただ1つのヌクレオチドによる伸長が好ましい。さらに、非改変ddNTPの代わりに、プライマー伸長反応には、質量標識されたddNTPが用いられ得る。このことは、これらのddNTPにより伸長されたプライマーの間の質量の差異を上昇させ、それにより、上昇する感度および精度を提供し、そして特に、ヘテロ接合の塩基位置を決定するために有用である。質量標識はまた、集中的なサンプル調製手順の必要性を軽減し、そして質量分析の必要とされる分解能を低下させる。
【0141】
伸長されたプライマーは、次に精製され得、そして、標的SNP部位に存在しているヌクレオチドの同一性を決定するために、MALDI−TOF質量分析により分析され得る。分析の1つの方法において、プライマー伸長反応からの生成物は、マトリックスを形成する光吸収結晶と組み合わせられる。次に、このマトリックスは、核酸分子をイオン化し、そして気体相に脱着するために、レーザーのようなエネルギー源により打ち付けられる。次に、イオン化された分子は、飛行管内に放射され、そして加速されて検出器に向かってこの管を下る。レーザーパルスのようなイオン化現象と分子が検出器と衝突する間の時間は、その分子の飛行時間である。飛行時間は、イオン化された分子の電荷に対する質量比(m/z)と正確に相関する。より小さいm/zを有するイオンは、より大きいm/zを有するイオンよりも早くこの管を下って進行し、そしてそのため、このより軽いイオンは、より重いイオンの前に検出器に到達する。したがって、飛行時間は、対応する、かつ非常に正確なm/zに変換される。この様式で、SNPは、一塩基部分に異なるヌクレオチドを有する核酸分子において固有の、質量のわずかな差異、および対応する飛行時間の差異に基づいて同定され得る。SNP遺伝子型決定のための、MALDI−TOF質量分析と関連するプライマー伸長反応アッセイの使用に関するさらなる情報については、例えば、Wiseら、“A standard protocol for single nucleotide primer extension in the human genome using matrix−assisted laser desorption/ionization time−of−flight mass spectrometry”,Rapid Commun Mass Spectrom.2003;17(11):1195−202参照。
【0142】
以下の参考は、SNP遺伝子型決定のための質量分析に基づく方法を記載する、さらなる情報を提供する:Bocker,“SNP and mutation discovery using base−specific cleavage and MALDI−TOF mass spectrometry”,Bioinformatics.2003 July;19 Suppl 1:144−153;Stormら、“MALDI−TOF mass spectrometry−based SNP genotyping”,Methods Mol.Biol.2003;212:241−62;Jurinkeら、“The use of MassARRAY technology for high throughput genotyping”,Adv Biochem Eng Biotechnol.2002;77:57−74;およびJurinkeら、“Automated genotyping using the DNA MassArray technology”,Methods Mol.Biol.2002;187:179−92。
【0143】
SNPはまた、直接のDNA配列決定によっても評価され得る。種々の自動化配列決定手順が利用され得((1995)Biotechniques 19:448)、これらとしては、質量分析による配列決定が挙げられる(例えば、PCT国際公開番号WO94/16101;Cohenら、Adv.Chromatogr.36:127−162(1996);およびGriffinら、Appl.Biochem.Biotechnol.38:147−159(1993)参照)。本発明の核酸配列は、当業者がこのような自動化配列決定手順のための配列決定プライマーを容易に設計することを可能にする。Applied Biosystems 377,3100,3700,3730,and 3730.times.1 DNA Analyzers(Foster City,Calif.)のような商業的な機器が、自動化配列決定のために、当該分野において一般的に使用される。
【0144】
本発明のSNPの遺伝子型を決定するために使用され得る他の方法としては、一本鎖高次構造多型(SSCP)および変性勾配ゲル電気泳動(DGGE)が挙げられる(Myersら、Nature 313:495(1985))。SSCPは、Oritaら、Proc.Nat.Acad.に記載のように、一本鎖PCR産物の電気泳動移動度の変化により、塩基の差異を識別する。一本鎖PCR産物は、二本鎖PCR産物を加熱するか、もしくはそれ以外で変性させることにより生成され得る。一本鎖核酸は、塩基配列に部分的に依存する二次構造を、再び折りたたむか、もしくは形成し得る。一本鎖増幅産物の異なる電気泳動移動度は、SNP位置の塩基配列の差異に関連する。DGGEは、多型DNAに固有の異なる配列依存的安定性および融解特性、ならびに変性勾配ゲルにおける電気泳動移動度パターンの対応する差異に基づいて、SNP対立遺伝子を識別する(Erlich,ed.,PCR Technology,Principles and Applications for DNA Amplification,W.H.FreemanおよびCo,New York,1992,Chapter 7)。
【0145】
配列特異的リボザイム(米国特許第5,498,531号)がまた、リボザイム切断部位の発生もしくは消失に基づいてSNPを評価するために、使用され得る。完全にマッチする配列は、ヌクレアーゼ切断消化アッセイによるか、もしくは融解温度の差異により、ミスマッチ配列と区別され得る。SNPが制限酵素切断部位に影響する場合、SNPは、制限酵素消化パターンの変化、およびゲル電気泳動により決定される核酸断片の長さの対応する変化により確認され得る。
【0146】
SNP遺伝子型決定は、例えば、ヒト被験体から生体試料(例えば、組織、細胞、流体、分泌物などのサンプル)を収集する工程、サンプルの細胞から核酸(例えば、ゲノムDNA、mRNAもしくは両方)を単離する工程、標的核酸領域のハイブリダイゼーションおよび増幅が生じるような条件下で、標的SNPを含む単離された核酸の領域に特異的にハイブリダイズする1つ以上のプライマーに、核酸を接触させる工程、そして、目的のSNP位置に存在するヌクレオチドを決定する工程、または、いくつかのアッセイにおいては、増幅産物の存在もしくは非存在を検出する工程(アッセイは、特定のSNP対立遺伝子が存在するか、もしくは存在しない場合にのみ、ハイブリダイゼーションおよび/もしくは増幅が生じるように設計され得る)を包含し得る。いくつかのアッセイにおいて、増幅産物の大きさは、検出され、そしてコントロールサンプルの長さと比較される;例えば、欠損および挿入は、正常な遺伝子型と比較した増幅産物の大きさの変化により検出され得る。
【0147】
SNP遺伝子型決定は、以下に記載のような数多くの実用的な適用のために有用である。このような適用の例としては、SNP−疾患関連性解析、疾患素因スクリーニング、疾患診断、疾患予後判断、疾患経過モニタリング、個体の遺伝子型に基づく治療ストラテジーの決定(薬理ゲノミクス)、疾患もしくは薬物に対する応答の見込みに関連したSNP遺伝子型に基づく治療剤の開発、処置レジメンについての臨床試験のための患者母集団の層化、ならびに個体が治療剤により有害な副作用を経験する可能性の予測が挙げられるが、これらに限定されない。
【0148】
疾患スクリーニングアッセイ
遺伝子型と疾患に関連する表現型との間の関連性/相関に関する情報は、いくつかの方法で活用され得る。例えば、1つ以上のSNPと、処置が利用可能な疾患に対する素因との間に高度に統計的に有意な関連性がある場合は、個体におけるこのような遺伝子型パターンの検出は、処置の即時実行、または、少なくとも、個体の定期的なモニタリングの制度を正当化し得る。SNPとヒトの疾患との間の、弱いが、なお統計学的に有意な関連の場合、即時の治療的介入またはモニタリングは、感受性対立遺伝子またはSNPを検出した後に正当化されないこともある。それにもかかわらず、被験体は、単純なライフスタイルの変化(例えば、食事、運動、禁煙、モニタリング/調査の強化)を始めることを動機付けされ得、このライフスタイルの変化は、個体がほとんど、または全く費用をかけずに達成され得るが、個体が感受性対立遺伝子を有することによってリスクが増加し得る、病態を発症するリスクを減少するという、強力な利点を与え得る。
【0149】
一形態では、本発明は、細胞増殖性障害(例えば、癌)などの疾患を発症するリスク、感受性または確率を増加させるSNPを同定する方法を提供する。さらなる形態では、本発明は、疾患を発症するリスクを有する被験体を同定する、予後疾患を決定する、または疾患の発病を予測するための方法を提供する。例えば、被験体の細胞増殖性疾患を発症するリスク、疾患を持つ個体の予後、または細胞増殖性疾患の発病の予測は、BRCA1の3’非翻訳領域(UTR)における突然変異を検出することによって決定される。突然変異の同定は、細胞増殖性障害を発症するリスクの増加、予後不良、または細胞増殖性障害を発症する初期段階を示す。
【0150】
突然変異は、例えば、欠失、挿入、逆位、置換、フレームシフトまたは組換えである。突然変異は、miRNAの結合効力を調節する(例えば、増加または減少させる)。「結合効力」は、miRNAが標的遺伝子または転写産物に結合する能力を意味し、したがって、それぞれ標的遺伝子もしくは転写産物の転写または翻訳を鎮め、減少させ、抑制し、阻害し、または妨げる。結合効力は、miRNAがタンパク質産生を阻害するか、またはレポータータンパク質産生を阻害する能力によって決定される。あるいはまたはさらに、結合効力は、結合エネルギーとして定義され、最小自由エネルギー(mfe)(キロカロリー/モル)で測定される。
【0151】
本発明の文脈における「リスク」は、特定の期間にわたってある事象が起こるであろうという確率に関し、被験体の「絶対」リスクまたは「相対」リスクを意味し得る。絶対リスクは、関連時間集団に関する実際の測定後観測結果を参照して、または、関連時間期間の間追跡調査された統計的に有効な歴史的集団から作成される指標値を参照して、測定され得る。相対リスクは、低リスク集団の絶対リスクまたは平均集団リスクのいずれかと比較した、被験体の絶対リスクの比を指すが、これは、臨床的リスクファクターをどのように評価するかによって変化し得る。オッズ比(所定の検査結果に関する、否定的な事象に対する肯定的な事象の割合)もまた、無変換(no−conversion)に通常使用される(オッズ比は、式p/(1−p)にしたがう(式中、pは事象の確率であり、(1−p)は)事象が起こらない確率である)。
【0152】
本発明の文脈における「リスク評価」または「リスクの評価」は、事象もしくは疾患状態が起こり得る確率、オッズまたは可能性(事象もしくはある疾患状態から別のものへの変換が起こる割合、すなわち、原発腫瘍から転移性腫瘍へ、もしくは転移を発症するリスクがあるものへ、または第一の転移性の事象のリスクから第ニの転移性の事象へ、またはある種の原発腫瘍を発症するリスクから1つ以上の異なる種類の原発腫瘍を発症することへ)の予測を行うことを包含する。リスク評価はまた、過去に測定した集団を参照して、絶対期間または相対期間で、将来の臨床パラメーター、従来の臨床リスクファクター値または他の癌の指標を予測することを含み得る。
【0153】
「リスクの増加」は、BRCA1内にSNPを保有する個体が、SNPを保有しない個体と比較して、少なくとも1つの様々な障害(例えば、癌)を発症するであろう確率の増加を表すことを意味する。ある実施形態では、SNP保有者は、SNPを保有しない個体よりも、1.5倍、2倍、2.5倍、3倍、3.5倍、4倍、4.5倍、5倍、5.5倍、6倍、6.5倍、7倍、7.5倍、8倍、8.5倍、9倍、9.5倍、10倍、20倍、30倍、40倍、50倍、60倍、70倍、80倍、90倍、または100倍以上少なくとも1つの種類の癌を発症する可能性がある。また、1つの癌を発症したBRCA1内SNPの保有者は、第二の癌を発症する可能性が高い。ある実施形態では、非保有者が少なくとも1つの第二の癌を発症する平均年齢の1、2、5、7、10、12、15、17、20、22、25、27または30年前に、BRCA1 SNPは、少なくとも1つの第二の癌を発症する。
【0154】
細胞増殖性障害としては、細胞分裂が制御されていない様々な病状が挙げられる。例示的な細胞増殖性障害としては、新生物、良性腫瘍、悪性腫瘍、前癌期病状、インサイチュー腫瘍、被包性腫瘍、転移性腫瘍、液性腫瘍、固形腫瘍、免疫学的腫瘍、血液系腫瘍、癌、癌腫、白血病、リンパ腫、肉腫および急速に分裂する細胞が挙げられるが、これらに限定されない。本明細書において使用される用語「急速に分裂する細胞」は、同じ組織内の隣接細胞もしくは近隣細胞の間で予想もしくは観察されるものを超えるまたは上回る速度で分裂するあらゆる細胞として定義される。癌としては、乳癌および卵巣癌が挙げられるが、これらに限定されない。
【0155】
被験体は、好ましくは、哺乳動物である。哺乳動物は、ヒト、非ヒト霊長類、マウス、ラット、イヌ、ネコ、ウマまたはウシであり得るが、これらの例に限定されない。ヒト以外の哺乳動物は、特定の疾患の動物モデルを表す被験体として有利に使用され得る。被験体は、男性または女性であり得る。被験体は、疾患を有すると過去に診断または同定され、場合によっては、疾患に関する治療的介入を既に受けたか、または現に受けている者であり得る。または、被験体は、疾患を有すると過去に診断されなかった者でもあり得る。例えば、被験体は、疾患に関する1つ以上のリスクファクターを示す者であり得る。
【0156】
生体試料は、核酸を含むあらゆる組織または体液であり得る。様々な実施形態は、パラフィン包埋組織、凍結組織、外科的細針吸引、皮膚の細胞、筋肉、肺、頭部および首、食道、腎臓、膵臓、口、咽喉、咽頭(pharynx)、喉頭(larynx)、食道、顔面、脳、前立腺、乳房、子宮内膜、小腸、血液細胞、肝臓、精巣、卵巣、子宮、頸部、大腸、胃、脾臓、リンパ節または骨髄を含む。他の実施形態は、体液試料、例えば、気管支ブラシ、気管支洗浄液、気管支肺胞洗浄液(bronchial ravage)、末梢血リンパ球、リンパ液、腹水、漿液、胸水、唾液、脳脊髄液、涙液、食道洗浄液、ならびに排泄物または尿試料(例えば、膀胱洗浄液および尿)を含む。
【0157】
連鎖不平衡(LD)とは、所定の集団における各対立遺伝子の存在の別個の頻度から予測されるものよりも多い頻度での、2つ以上の異なるSNP部位における対立遺伝子の同時遺伝(例えば、選択的なヌクレオチド)をいう。独立して遺伝される2つの対立遺伝子の同時遺伝の予測される頻度は、第1の対立遺伝子の頻度に第2の対立遺伝子の頻度を乗じたものである。予測された頻度で同時に生じる対立遺伝子は、「連鎖平衡」であると言われる。対照的に、LDは、2つ以上の異なるSNP部位における対立遺伝子の間の任意の非ランダムな遺伝的関連をいい、この遺伝的関連は一般的に、染色体に沿う2つの遺伝子座の物理的な近接性に起因する。LDは、2つ以上のSNP部位が、所定の染色体上で互いに密接に物理的に近接している場合に生じ得、したがって、これらのSNP部位における対立遺伝子は、1つのSNP部位における特定のヌクレオチド(対立遺伝子)が、近くに位置する異なるSNP部位における特定のヌクレオチド(対立遺伝子)と非ランダムな関連を示す結果のために、複数の世代について分離されていないままである傾向がある。したがって、SNP部位の1つを遺伝子型決定することにより、LDであるもう一方のSNPを遺伝子型決定したものとほとんど同じ情報が生じる。
【0158】
遺伝的障害(例えば、予後またはリスク)目的のために個体をスクリーニングすることに関して、特定のSNP部位が障害をスクリーニングするのに有用であることが分かった場合、当業者であれば、このSNP部位を有するLD内に存在する他のSNP部位もまた、病状をスクリーニングするのに有用であることを認識するであろう。種々の程度のLDが、いくつかのSNPが他よりもより密接に関連している(すなわち、より強いLDである)という結果を有する2つ以上のSNPの間で遭遇され得る。さらに、染色体に沿ってLDが延びる物理的な距離は、ゲノムの異なる領域間で異なり、したがって、LDが生じるために必要とされる2つ以上のSNP部位の間の物理的分離の程度は、ゲノムの異なる領域の間で異なり得る。
【0159】
スクリーニング適用に関して、実際に疾患を生じる(原因となる)多型ではないが、このような原因となる多型とLDである多型(例えば、SNPおよび/またはハプロタイプ)がまた、有用である。このような場合、原因となる多型とLDである多型の遺伝子型は、原因となる多型の遺伝子型の予測となり、したがって、原因となるSNPにより影響を受ける表現型(例えば、疾患)の予測となる。したがって、原因となる多型とLDである多型マーカーは、マーカーとして有用であり、そして、実際の原因となる多型が未知である場合、特に有用である。
【0160】
ヒトのゲノムにおける連鎖不平衡は、以下で総説されている:Wallら、“Haplotype blocks and linkage disequilibrium in the human genome”,Nat Rev Genet.2003 August;4(8):587−97;Gamerら、“On selecting markers for association studies:patterns of linkage disequilibrium between two and three diallelic loci”,Genet Epidemiol.2003 January;24(1):57−67;Ardlieら、“Patterns of linkage disequilibrium in the human genome”,Nat Rev Genet.2002 April;3(4):299−309(erratum in Nat Rev Genet 2002 July;3(7):566);およびRemmら、“High−density genotyping and linkage disequilibrium in the human genome using chromosome 22 as a model”;Curr Opin Chem Biol.2002 February;6(1):24−30。
【0161】
疾患の表現型(例えば、癌)を有する特定のSNPおよび/またはSNPハプロタイプの寄与または関連は、本発明のSNPを使用して、その遺伝子型を有さない個体と比較して、特定の遺伝子型の結果として検出可能な形質(例えば、癌)を発現する個体、または、その後に、検出可能な形質を発現するリスクを増加もしくは減少してその遺伝子型を配置する個体を同定し得る、優れた試験を開発し得る。本明細書において記載されるように、スクリーニングは、単一のSNPまたは一群のSNPに基づき得る。素因/リスクのスクリーニングの精度を高めるために、本発明のSNPの解析は、疾患の他の多型もしくは他の危険因子(例えば、疾患の症状、病理学的特徴、家族歴、食事、環境因子またはライフスタイル因子)の解析と組み合わせられ得る。
【0162】
本発明のスクリーニング技術は、種々の方法論(例えば、ハプロタイプ決定のための個体の染色体の解析を可能にする方法、家族研究、単一精子DNA解析または体細胞ハイブリッドが挙げられる)を採用して、検出可能な形質を発症するリスクの増加もしくは減少に関連するSNPもしくはSNPパターンを試験被験体が有するかどうか、または、個体が特定の多型/変異の結果として検出可能な形質を罹患するかどうかを決定し得る。本発明の診断を用いて解析された形質は、アルツハイマー病に関連する病理および傷害において通常観察される、任意の検出可能な形質であり得る。
【実施例】
【0163】
実施例1:miRNAの結合効力を潜在的に修正し得る乳癌および卵巣癌関連遺伝子におけるSNPの同定
臨床的分類および分子的分類は、乳癌を、生物学的な重要性を有するサブグループにうまく分類している。サブグループのカテゴリーは、1)ER+および/またはPR+腫瘍、2)HER2+腫瘍、ならびに3)トリプルネガティブ(TN)腫瘍である(Perou,C.Mら、Nature 2000.406,747−52)。ER+および/またはPR+腫瘍ならびにHER2+腫瘍はともに、最も一般的(75%)であり、トリプルネガティブ腫瘍は、乳癌の約25%の割合を占めている。残念ながら、トリプルネガティブ表現型は、積極的に解明されているが不明なところが多い乳癌のサブクラスの代表的なものであり、これは、若いアフリカ系アメリカ人女性で最も蔓延している(40未満)。このサブクラスは、5年生存率が他のサブタイプよりも悪い(72%対85%)。
【0164】
本研究のためにエール大学から提供された355人の癌症例および29人の対照個体の原発腫瘍から、DNAを採取した。これらのDNA試料の中で、206個が乳房由来である。加えて、乳癌および卵巣癌を有する患者から、77個の卵巣癌DNA試料、55個の子宮癌DNA試料、17個のDNA試料を採取した。また、ニューヘーブン、コネティカット州の症例対照群を代表する29個の非癌性DNA試料も採取した。本研究に参加しているこれらの患者各人に関して、重要な医療情報(例えば、臨床情報および病理情報、家族歴、民族性ならびに生存率)は知られている。本研究に使用した試料のライブラリーは、培養され続けている。
【0165】
BRCA1遺伝子は、乳癌および卵巣癌のリスクの増加に関連しており、本研究の中心となっている。(http://genome.ucsc.eduで公的に利用可能な)カリフォルニア大学サンタクルーズ校のゲノムブラウザにしたがって、BRCA1の3’UTRを選択した。3’UTRは、各遺伝子の停止コドンから最後のエクソンの末端までの配列として定義される。それぞれ(例えば、PicTar,TargetScan,miRanda,miRNA.orgおよびMicroInspector)の初期設定パラメーターを使用した特殊アルゴリズムの方法によって、BRCA1遺伝子の3’UTR内の推定miRNA結合部位を同定した。(http://www.ncbi.nlm.nih.gov/projects/SNPで公的に利用可能な)dbSNPおよび(http://www.ensembl.org/index.htmlで公的に利用可能な)Ensembl databaseを検索することによって、miRNA結合部位に存在するSNPを同定した。
【0166】
DNA癌試料および細胞株から、BRCA1の3’UTRのPCR増幅を行った。PCR突然変異頻度を最小化するために、Ultra high fidelity KOD hot start DNA polymerase(EMD)を使用した。使用した熱サイクルプログラムは、95℃2分で1サイクル、95℃20秒、64℃10秒および72℃40秒で40サイクルを含んでいた。次いで、配列決定するために、エール大学のケック生命工学資源研究室(http://keck.med.yale.edu/)に、PCR単位複製配列を送った。新規SNPおよび既知SNPの両方の存在に関して、配列をスクリーニングした。同定したすべてのSNPを記録した。
【0167】
BRCA1に関する十分な配列決定結果を得るとすぐに、時間効率のより良い方法のハイスループット遺伝子型決定法を使用した。したがって、適切な多型専用に設計されたTaqMan PCRアッセイ(Applied Biosystems)を採用した。1個が各対立遺伝子に対するものである2個のTaqMan蛍光標識プローブを使用して、遺伝子型決定を実施した。ABI PRISM 7900HT配列検出システムおよびSDS 2.2ソフトウェア(Applied Biosystems)を使用して、分析を実施した。以下の熱サイクルプログラム:95℃10分で1サイクル、93℃15秒および60℃1分で50サイクルを使用して、癌試料上およびDNA試料の世界ライブラリー上で、TaqMan反応を行った。BRCA1用プローブのアッセイIDは、以下の通りである。
【0168】
BRCA1:
C_3178665_10(rs9911630)、
C_29356_10(rs12516)、
C_3178688_10(rs8176318)、
特注のRS3092995−0001(rs3092995)、
C_3178676_10_rs1060915)、
C_2615180_10(rs799912)、
C_3178692_10(rs9908805)、
およびC_9270454_10(rs17599948)(図6、表2)。
【0169】
研究参加者のDNA試料を保存するために、TaqMan PreAmp Master Mix Kit(Applied Biosystems)を使用した。前増幅(pre−amplification)の手順はゲノム全体を増幅しないが、その代わり、本発明者らは、目的のプローブのすべてからなる「アッセイプール」を作る。したがって、5個の異なる染色体および7個の異なる遺伝子から、18個のプローブをプールした。100個超の試料をうまく前増幅した。この方法は、すべての関連プローブを一緒にプールし、目的のゲノム領域を増幅する手段を提供する。基本的なプロトコールは、極めて低いDNA濃度で前増幅PCRを行うためのものである(結果は、わずか1.5μgの0.5ng/μlDNAから信頼性の高い結果を収集できることを示している)。次いで、前増幅産物を1:40に希釈する。そうすると、試料は、TaqMan遺伝子型決定(上記の手順)に使用できる状態になる。
【0170】
【表2】
太字の多型は、被験体の乳癌を発症するリスクを予測するのに必要な最適なSNPのセットを含む。
Taqman SNP遺伝子型決定アッセイを使用して、2個の遺伝子および約267kbに及ぶ8個のSNPを研究した。
【0171】
【表3】
*数字は、8個の異なるSNPに関して遺伝子型決定した患者の数を表す。
BRCA1では、次いで、配列決定したすべての患者を遺伝子型決定もした。
いくつかのサブタイプ、特にMPに関して直接的に配列決定できる多数の試料は、多くのまたはすべてのFFPE試料だからとは限られない。
【0172】
実施例2:乳房腫瘍および卵巣腫瘍に由来する組織試料、隣接正常組織試料ならびに正常組織試料を使用した、BRCA1内のmiRNA相補的部位における配列変異の評価
BRCA1は、1381個のヌクレオチドの高度に保存された3’UTRを有する。3’UTRは、16個の既知SNPを有する。これらのSNPの中の9個は、予測miRNA結合部位に位置し、これらの9個の中の4個は、予測シード領域結合部位に位置する。しかしながら、これまでは、これらの16個のSNPの中で、3個のSNP(rs3092995、rs8176318およびrs12516)だけが、配列決定されたDNA試料において発見されている。加えて、予測miRNA結合部位に存在する1個の新規SNP(SNP1)が同定されている。注目すべきことに、このSNPだけが、1人の患者において、腫瘍組織および隣接正常組織の両方で発見されている。結果は再現性がある(図2および3)。配列決定によって同定されており、予測miRNA結合部位を有する4個のSNPの中で、これらの2個(rs3092995およびrs12516)が、予測miRNA結合部位のシード領域に位置する(図3)。本発明者らが同定したSNPのいずれも、高度に保存された予測miRNA結合部位に位置しない。
【0173】
より具体的には、rs3092995は、あまり保存されていない2個の以下のmiRNA:hsa−miR−99bおよびhas−miR−635が結合すると予測される部位に位置する。rs3092995は、has−miR635のシード領域に位置すると予測される。rs8176318は、hsa−miR−758が結合すると予測される部位に位置する。SNP1は、hsa−miR−654およびhsa−miR−516−3pの両方が結合すると予測される部位に位置する。最後に、rs12516は、hsa−miR−637、hsa−miR−324−3pおよびhsa−miR−412が結合すると予測される部位に位置する。rs12516は、hsa−miR−637の予測シード領域に収まる(図3)。
【0174】
研究癌集団においてBRCA1 3’UTRをマッピングするとすぐに、癌DNA試料を遺伝子型決定するよりハイスループットな方法を使用した。これを達成するために、本発明者らの癌集団を配列決定する間中、3個の主要な位置するSNP専用に設計されたTaqMan PCRアッセイ(Applied Biosystems)を使用した。1個が各対立遺伝子に対するものである2個のTaqMan蛍光標識プローブを使用して、遺伝子型決定を実施した。ABI PRISM 7900HT配列検出システムおよびSDS 2.2ソフトウェア(Applied Biosystems)を使用して、分析を実施した。本発明者らの癌試料および世界DNA試料上で、TaqMan反応を実行した。
【0175】
実施例3:地域集団対世界集団におけるBRCA1 SNPの保有率
図4は、2,472人の個体を含む46個の世界集団の世界ライブラリーに由来するBRCA1 3’UTRに関する遺伝子型決定結果を示している。図4に示されるように、rs8176318およびrs12516は、一般集団において、ほとんどの場合、一緒に遺伝で受け継がれている。アフリカの民族性を除いて、それらは、それぞれ集団の31.6%および31.7%において見られる。加えて、rs3092995は、世界の大部分を通じて極めて珍しい。アフリカの民族性を除いて、rs3092995は、平均すると集団において見られない。しかしながら、これらの2つの興味深い傾向は、アフリカの集団には当てはまらない。アフリカの集団(グラフの左端のビアカピグミーからエチオピア系ユダヤ人まで、10個ある)内では、rs3092995は、集団の10.2%において見られ、rs8176318およびrs12516は、一緒に遺伝で受け継がれている可能性は低い。rs8176318およびrs12516が一緒に遺伝で受け継がれていない場合、rs12516は、rs8176318よりも常に高い保有率にあるようである(それぞれ27.8%および16.3%)。
【0176】
同時に、BRCA1 3’UTRにおける3個の同じSNPに関して、7個の癌集団およびエール大学対照の1個の集団から、384人の個体を分析した(図5)。興味深いことに、世界集団において認められた傾向(図4)は、研究癌集団を反映していない。しかしながら、類似点がいくつかある。例えば、rs3092995は、研究癌集団およびエール大学対照群の1.6%の割合で見られる。また、エール大学対照群内では、rs8176318およびrs12516は、非アフリカの世界集団と同じ傾向を示している。すなわち、非アフリカの世界集団内では、これらの2個のSNPは、集団の約31%に存在しており、本発明者らのエール大学集団内では、それらは、集団の約28%に存在しており、通常一緒に遺伝で受け継がれている。しかしながら、rs8176318およびrs12516が一緒に遺伝で受け継がれる可能性が低い様々な癌集団において認められる著しい違いがある。この傾向は、アフリカの集団において見られるものと類似する。しかしながら、この傾向をさらにより興味深くするものは、アフリカの集団内では、SNP rs12516が、集団においてrs8176318よりも高い頻度にあることである(それぞれ27.8%および16.3%)。しかし、研究癌集団では、rs8176318は、本発明者らの(HER2+を除く)乳癌集団においてrs12516よりも高い頻度にある(それぞれ26.9%および21.3%)。
【0177】
過去の結果に対応して、より参考になるSNPを用いて、17番染色体のこの領域を満たした。本発明者らの動機は2つ、すなわち、領域の系統進化を解決すること、およびハプロタイプ解析を行うことであった。これを達成するために、BRCA1を包含する5個のさらなる参考SNPを加えた(図6)。BRCA1は逆鎖上に存在するので、これらのSNPは、染色体の下端から上(3’から5’)に順序付けられる。これらの8個のSNPは、2個の遺伝子(BRCA1およびNBR1)にまたがり、約267kbに及ぶ。この大きな染色体領域によって、ハプロタイプ解析のために認められる強い連鎖不均衡にもかかわらず、本発明者らは、遺伝的変異性を観察することができる(Gu,S.,Pakstis,A.J.およびKidd,K.K.Bioinformatics 2005.21,3938−9)。ハプロタイプ解析は、目的の遺伝子におけるSNPの影響を解析するための強力な方法である。ハプロタイプ解析を行うことの背後にある理論は、疾患遺伝子がネガティブな選択圧を受けた場合、疾患を保有する染色体における連鎖変異は、集団内でより低頻度にある可能性があるということである。
【0178】
BRCA1にまたがるこれらの8個のSNPの進化を決定した(図7)。図6において、各SNPは、ハプロタイプ位置(1から8)に割り当てられる。これらの位置は、図7において認められる「偽の」ハプロタイプと相互に関連している。例えば、祖先配列は、8文字「GGCCACTA(配列番号8)」であり、各文字は、(左から右に)番号付けされた位置と相互に関連している。SNPの祖先状態を決定するために、本発明者らのヒト試料で使用される同じTaqManアッセイを採用したが、しかしながら、非ヒト霊長類に由来するゲノムDNAを遺伝子型決定するのにこれらのアッセイを使用した。10個の最も一般的なハプロタイプは、祖先ハプロタイプへの変異の蓄積によって説明することができる。直接的に認められたハプロタイプの大部分は、順序付けることができ、1個の派生ヌクレオチド変化によって相違している。より具体的には、図7において、枠で囲まれた2個のハプロタイプのうちどちらが、採用されたSNPを有する系統において最初に生じたかということに関しては未解決であった。AGCCATTA(配列番号2)ハプロタイプは、現在のところ、世界で最も一般的に認められるハプロタイプである。GAACGCTA(配列番号3)およびGAACGCTG(配列番号4)の2個のハプロタイプは、世界のすべての地域に存在している。AGCC−GCTG(配列番号19)ハプロタイプは、新世界(これは、南アメリカ、中央アメリカおよび北アメリカの地域を示す(集団の詳細に関しては、ALFRED:http://alfred.med.yale.edu/参照))においてのみ見られる。
【0179】
世界集団および研究癌集団の間で、ハプロタイプ保有率を比較した。この比較よって、2個の群の間で認められたハプロタイプの間でも、乳癌および/または卵巣癌に対するリスクの増加に関連する1つ以上のハプロタイプの間でも、著しい違いが明らかになった。
【0180】
2,472人の個体を含む46個の世界集団における8個のSNP(図8)を遺伝子型決定した。ハプロタイプ進化のデータに基づいて、図8におけるハプロタイプのデータを予測した。より具体的には、認められた祖先ハプロタイプであるGGCCACTA(配列番号8)は、アフリカの民族性においてのみ見られた。最も一般的なハプロタイプであるAGCCATTA(配列番号2)は、世界中で高いレベルで見られた。GAACGCTA(配列番号3)およびGAACGCTG(配列番号4)の2個のハプロタイプも同様に、世界中で見られた。(ハプロタイプ進化で予測されたように)組換えハプロタイプであるAGCC−GCTG(配列番号19)は、新世界においてのみ実際に見られた。このグラフは、BRCA1 3’UTRを遺伝子型決定する際に見られたパターン(図4)を連想させる。図4を論じた際に言及したように、アフリカの集団は、極めて異なるパターンを示す。この観察結果は、ここでも当てはまる。図8において、最初の10個の民族性は、アフリカの家系(ビアカピグミーからエチオピア系ユダヤ人まで)からなり、固有のハプロタイプパターンを示している。例えば、以下のハプロタイプ、GGCCACCA(配列番号7)、GACGACTA(配列番号5)、GACCACTA(配列番号20)およびAGCCACTA(配列番号1)は、アフリカ人に全く固有である。最後に、配列標識された「残り」は、集団においてまれな頻度で存在する多様なハプロタイプを表す可能性が最も高い。46個の集団は、サイズがわずか26人の個体(マサイ族(Masia))から222人もの個体(ラオス人)まである。各集団は、平均して、示される96.6人の個体を有する。
【0181】
図9は、合計で384人の個体となる7個の癌集団および1個のエール大学対照群からの、本発明者らのハプロタイプのデータを示す。重要なことに、一般的な世界ハプロタイプの傾向と図9の比較に関して、多くの同じハプロタイプが認められた。例えば、AGCCATTA(配列番号2)ハプロタイプは、今もなお最も一般的に認められるものであった。加えて、GAACGCTA(配列番号3)およびGAACGCTG(配列番号4)の2個のハプロタイプは、世界中で見られ、図9において示されるどの集団でも見られた。図8におけるアフリカの集団の中で一般的であったGGCCACCA(配列番号7)ハプロタイプは、図9においてもしばしば認められた。これは、GGCCACCA(配列番号7)ハプロタイプが認められたすべての集団において、アフリカ系アメリカ人がいるからかもしれない。GGCCACCA(配列番号7)ハプロタイプが認められなかった図9における集団だけが、乳房/卵巣集団であり、この群は、白人だけから構成されていた(民族性データに関する図10参照)。しかしながら、注目すべきことに、乳癌のTNサブタイプ内で認められたハプロタイプは、世界集団だけでなく、他の癌集団およびエール大学対照群とも極めて著しく異なっていた(図9)。特に興味深い3個のハプロタイプがある。これらのハプロタイプは、GGACGCTA(配列番号6)、GGCCGCTA(配列番号9)およびGGCCGCTG(配列番号10)である(図9および表4)。これらの3個の固有ハプロタイプは、TN癌群において認められたハプロタイプの12%を構成しており、(おそらく、残りを除く)世界ハプロタイプにおいては表れなかった。GGCCGCTA(配列番号9)ハプロタイプは、7個の癌群すべてにおいて見られるので、特に興味深い。加えて、TN乳癌群は、ハプロタイプの約18%を構成する残りのハプロタイプの最も大きい集団を有する(図9)。残りのハプロタイプに関する基準は、すべてのカテゴリーにわたるすべての試料の1%未満である。TN内では、残りは、ハプロタイプ「GGACGCTG」(配列番号21)である。このハプロタイプは、TNハプロタイプの4%を構成している。しかしながら、それは、他のカテゴリーにおいてはめったに認められないので、残りとして分類される(それは、卵巣において1回、および子宮癌群において1回認められる。)。表4は、これらの固有で興味深いハプロタイプ内にある影響されたSNPのより厳密な分析を示す。祖先ハプロタイプであるGGCCACTA(配列番号8)、および最も一般的なハプロタイプであるAGCCATTA(配列番号2)は、比較する目的で示されている。SNP rs8176318、rs1060915およびrs17599948は、固有ハプロタイプをもたらす典型的な変異部位である。rs8176318は、BRCA1の3’UTRに位置しており、予測miRNA結合部位にも位置しているので、重要である。rs1060915もまた、BRCA1のコード領域のエクソン12に位置しているので、重要である。コード領域もまた、miRNAに関する標的部位である。
【0182】
【表4】
下線が引かれたdbSNP#は、乳癌または卵巣癌を発症するリスクの予測に関する、多型の本質的な部位を表す。
rs1060915 SNP:変異型対立遺伝子(A)がホモ接合であり、異なる民族群においてこの突然変異の影響を研究する場合、アフリカ系アメリカ人の乳癌対対照の関連性は、統計的に有意である(p=0.01)。アフリカ系アメリカ人のトリプルネガティブ(TN)乳癌対対照へと関連性をさらに詳細化すると、結果はより有意である(p=0.005)。
【0183】
これらの癌群をさらに分析するために、SNPデータを他の既知TN乳癌リスクファクターに関連付けた。図11は、コード領域突然変異状態ごとのBRCA1ハプロタイプデータを表す。本研究において、110人の患者をハプロタイプごとにBRCA1検査し、分析した。BRCA1突然変異は、TN乳癌において一般的であるので、GGCCGCTA(配列番号9)およびGGCCGCTG(配列番号10)の2個の固有ハプロタイプが、集団の8%を構成するBRCA1突然変異保有者の間に見られることが予想された。
TN乳癌が固有のSNPシグネチャーを有し、アフリカの集団の多様性の結果ではないことを確認するために、図12および13を作成した。実際、アフリカ系アメリカ人および白人の民族性によってエール大学対照群およびTN群を比較すると、TNアフリカ系アメリカ人は、対照民族性およびTN白人の両方とも異なっていたことを、図12は確認している。特に、GGACGCTA(配列番号6)およびGGCCGCTA(配列番号9)のハプロタイプは、TNアフリカ系アメリカ人において多く見られる。TN乳癌は、若いアフリカ系アメリカ人女性(すなわち、40歳(yo)未満)の間で最もよく見られ、興味深いので、このことは予想されていた。図13において、エール大学対照群およびTN乳癌群内で、異なる民族性を年齢ごとにさらに比較した。年齢ごとに比較すると、GGACGCTA(配列番号6)ハプロタイプがアフリカ系アメリカ人集団内でのみ見られ、GGCCGCTA(配列番号9)ハプロタイプが白人に限られていたことは明白である。GGCCGCTA(配列番号9)ハプロタイプは、若い集団(51歳以下)において主に見られたが、しかしながら、年長のアフリカ系アメリカ人においても見られた。最後に、TNアフリカ系アメリカ人(AA)集団内では、祖先ハプロタイプは、より年長のTN AA群において極めてより多く見られる。より若いTN AA群においては、GGCCACCA(配列番号7)ハプロタイプは、より多く見られる。これは、系統データに合っている(図7)。
【0184】
実施例4:乳癌リスクに関連する珍しいBRCA1ハプロタイプ
乳癌を発症するリスクの増加を有する女性を同定する遺伝子マーカーは存在するが、受け継いだリスクの大部分は、分かりにくいままである。多数のBRCA1コード配列突然変異が乳癌リスクに関連するが、マイクロRNA(miRNA)結合を破壊するBRCA1多型における突然変異は、機能的であり得、癌リスクの遺伝子マーカーとして作用し得る。したがって、BRCA1の3’UTRにおけるこのような多型、およびこれらの機能的な多型を含むハプロタイプが、乳癌リスクに関連する可能性があるという仮説を検証した。配列決定および遺伝子型決定を通じて、乳癌集団で多型性であるBRCA1において、3個の3’UTR変異体を同定したところ、該変異体の1個(ホモ接合性の変異型対立遺伝子Aであるrs8176318)は、アフリカ系アメリカ人女性に関して重要な癌関連性を示し、アフリカ系アメリカ人女性に関するトリプルネガティブ乳癌を発症するリスクを特異的に予測する(それぞれp=0.04およびp=0.02)。ハプロタイプ解析を通じて、乳癌患者(n=221)が、対照集団では通常見られない(すべての乳癌染色体の9.50%および対照染色体の0.11%、p=0.0001)これらの3’UTR変異体を含む5個の珍しいハプロタイプを持っている、ということが見出された。5個の珍しいハプロタイプの中の3個は、rs8176318 BRCA1 3’UTR機能的対立遺伝子を含む。さらに、これらのハプロタイプは、BRCA1突然変異乳癌患者においてめったに見られないので(1/129=0.78%;1/129患者または1/258染色体)、BRCA1コード領域突然変異のバイオマーカーではない。これらの珍しいBRCA1ハプロタイプは、乳癌リスクの増加の新しい遺伝子マーカーの代表的なものである。
【0185】
材料と方法
研究集団
エール大学のヒューマン・インベスティゲーション・コミッティー(Human Investigation Committee)の承認後、HICプロトコール#0805003789に基づいて、エール大学/ニューヘーブン病院(ニューヘーブン、コネティカット州)で処置を受けている乳癌患者由来の試料を、合計221人の承諾者から採取したところ、試料は、180個の腫瘍FFPEおよび41個の生殖系列DNA供給源(それぞれ81.4%および18.6%)からなった。22個の血液および19個の唾液供給源(それぞれ53.7%および46.3%)から、生殖系列DNA試料を採取した。年齢、民族性および癌の家族歴などの患者データを収集した。病理学的分類によって、乳癌サブタイプを規定した。エール大学/ニューヘーブン病院から対照を採用し、非黒色腫皮膚癌を除く癌のあらゆる経歴を持たない者を対照に入れた。すべての試料は唾液試料であった。年齢、民族性および家族歴などの情報を記録した。遺伝子型および癌関連性のBRCA1 3’UTR分析のために、194個の生殖系列DNA対照を使用し(92人のヨーロッパ系アメリカ人および102人のアフリカ系アメリカ人)、そして、既知の腫瘍サブタイプおよび民族性を持つ乳癌患者由来の205個の腫瘍FFPEならびに生殖系列DNA試料を使用した。ロッテルダム家族性癌診療所を通じてエラスムス大学医療センターで、129人の非血縁BRCA1突然変異保有者を突き止め、後述のように末梢血試料からDNAを単離した。
【0186】
世界集団に関して、本発明者らは、エール大学における本発明者らの資源(世界中からの46個の集団を代表する2,250人の非血縁個体)を使用した。この資源は、遺伝学研究(Chin LJら、Cancer research 2008;68(20):8535−40;Speed WCら、The pharmacogenomics journal 2009;9(4):283−90;Speed WCら、Am J Med Genet B Neuropsychiatr Genet 2008;147B(4):463−6;Yamtich Jら、DNA repair 2009;8(5):579−84.)の中でよく記録されている。本研究で示された46個の集団は、10人のアフリカ人(ビアカピグミー(Biaka Pygmy)、ムブティピグミー(Mbuti Pygmies)、ヨルバ族、イボ族、ハウサ族、チャガ族、マサイ族、サンダウェ族、アフリカ系アメリカ人およびエチオピア系ユダヤ人)、3人の南西アジア人(イエメン系ユダヤ人、ドルーズ人およびサマリア人)、10人のヨーロッパ人(アシュケナージ系ユダヤ人、アディゲ人、チュバシュ人、ハンガリー人、アーケインジェル系ロシア人(Archangel Russian)、ボログダ系ロシア人、フィンランド人、デーン族、アイルランド人およびヨーロッパ系アメリカ人)、2人の北西アジア人(コミジリエーン(Komi Zyriane)およびハンティ族)、1人の南アジア人(南インドのケララの住民)、1人の北東シベリア人(ヤクート族)、2人の太平洋諸島出身者(ナシオイ系メラネシア人およびミクロネシア人)、9人の東アジア人(ラオス人、カンボジア人、サンフランシスコ出身の中国人、台湾漢民族、客家、韓国人、日本人、アミ族およびアタルヤ族)、4人の北アメリカ人(シャイアン、アリゾナ出身のピマ族、メキシコ出身のピマ族、マヤ人)ならびに4人の南アメリカ人(ケチュア族、ティクナ族、ロンドニア系スルイ族、カリチアーナ族)を含む。それぞれの集団試料に関係するヒト被験体研究を管理する委員会によって承認されたプロトコールの下で、すべての被験体がインフォームドコンセントに同意した。試料の説明および試料のサイズは、Allele Frequency Database(http://alfred.med.yale.edu)で集団名を検索することによって、および過去の刊行物(Cheung KHら、Nucleic acids research 2000;28(1):361−3)で見ることができる。樹立および/または生育されたリンパ芽球様細胞株から、DNA試料を抽出した。形質転換、細胞培養およびDNA増幅の方法は、記載されている(Anderson MA およびGusella JF.In vitro 1984;20(11):856−8)。すべての志願者は明らかに健康であり、そのほかの点では、すべての関連する施設内倫理委員会によって承認された手続きの下で適切なインフォームドコンセントを得た後、成人正常な被験体男性試料または成人正常な被験体女性試料を採取した。
【0187】
3’UTR配列の進化
RecoverAll Total Nucleic Acid Isolation Kit(Ambion)を使用して、凍結されたFFPE腫瘍乳房組織からDNAを単離し、そしてDNeasy Blood and Tissue kit(Qiagen)を使用して、血液および唾液からDNAを単離した。KOD Hot Start DNA polymerase(Novagen)ならびにこの配列に特異的なDNAプライマー:BRCA1:5’−GAGCTGGACACCTACCTGAT−3’(配列番号22)および5’−GAGAAAGTCGGCTGGCCTA−3’(配列番号23)を使用して、BRCA1の3’UTR全体を増幅した。QIAquick PCR purification kit 161(Quiagen)を使用してPCR産物を精製し、ネスト化プライマー:BRCA1:5’−CCTACCTGATACCCCAGATC−3’(配列番号24)および5’−GGCCTAAGTCTCAAGAACAGTC−3’(配列番号25)を使用して配列決定した。
【0188】
マーカータイピング
ハイスループット遺伝子型決定に関して、各SNP位置にある対立遺伝子を同定するために、TaqMan 5’ヌクレアーゼアッセイ(Applied Biosystems)を特別に設計した。非ヒト霊長類−3匹のボノボ(Pan paniscus)、3匹のチンパンジー(Pan troglodytes)、3匹のテナガザル(Hylobates)、3匹のゴリラ(Gorilla gorilla)および3匹のオランウータン(Pongo pygmaeus)に関するゲノムDNAを遺伝子型決定するための同じTaqManアッセイを使用することによって、本発明者らは、採用した8個のSNPの祖先状態を決定した。
【0189】
統計
関連性およびフィッシャー直接確率検定のカイ二乗検定を使用して、集団全体の遺伝子型頻度を比較した。関連性のカイ二乗検定を使用して、ハプロタイプデータの有意性を評価した。p>0.05の場合、p値は統計的に有意であると考えた。各民族集団内の対照の間で、ハプロタイプ内のすべての部位は、ハーディワインベルグ平衡にしたがっている。本発明者らは、PHASE(集団データに基づく、ハプロタイプ再構成および組換え率推定のためのソフトウェア)を使用して、部分母集団の情報なしで、患者および対照個体(30、31)のハプロタイプを推測した。PHASEソフトウェアは、ハプロタイプ配置の確実性の評価を提供する。BRCA1遺伝子の非常に単純なハプロタイプ構造を考慮すると、PHASEアルゴリズムは極めて正確であった。評価する必要がなかったハプロタイプの中で、PHASEは、99%の確実性で本発明者らの集団を評価した。
【0190】
結果
BRCA1 3’UTRにおけるSNPの同定
多数の既知のBRCA1 3’UTR SNPがある(表5)。乳癌患者において、これらの既知の多型頻度を同定するために、および/または、新規SNPを同定するために、本発明者らは、3個の既知の乳癌サブタイプを持つ乳癌患者(TN=7、HER2+=18およびER/PR+/HER2−=14)において、BRCA1の3’UTR全体を配列決定した。これらの患者におけるBRCA1 3’UTR全体の最初のスクリーニングによって、過去に報告された3個の機能的なSNP:rs12516、rs8176318およびrs3092995だけに存在する変異を同定した(表5)。加えて、本発明者らは、BRCA1 3’UTRにおいて、新規SNPを同定した。BRCA1における新規SNPは、6824G/Aまたは5711+1113G/Aである。これまでに見られなかったA対立遺伝子に関して、61歳のアフリカ系アメリカ人HER2+患者において、このSNPをヘテロ接合として同定した。集団全体に存在するこれらの変異体の頻度をよりよく評価するために、本発明者らは、46個の世界的な集団を構成する2,250人の非癌性個体において、集団特異的な遺伝子型決定を実施した(図4A)。rs12516、rs8176318およびrs3092995の同定した3個のBRCA1 3’UTR SNPは、集団において強い連鎖不均衡にあり、民族性によって異なる。
【0191】
【表5】
コード鎖上に存在する既知のBRCA1 3’UTR SNPのリスト。多型の位置は、dbSNPビルド130に基づいている。
*研究した3個のSNP。
†これらはポリAの変異体である。本発明者らは、それらをSTRPまたは短い縦列反復配列の多型として分類した。チンパンジー、オランウータン(orangatan)およびヒトの参照配列に基づくと、STRPは複合体である:A16−19G2A3−4。
【0192】
【表6】
39人の乳癌患者からBRCA1 3’UTR全体を配列決定した。認められた遺伝子型は、G/G−C/C−C/C、A/G−A/C−C/C、A/A−A/A−C/CおよびG/G−A/C−G/Cであった。位置は、それぞれrs12516、rs8176318およびrs3092995である。対立遺伝子Aは、位置rs12516およびrs8176318における派生対立遺伝子である。対立遺伝子Gは、rs3092995における派生対立遺伝子である。
【0193】
対照集団における民族性ごとに同定した3’UTR SNPにおいて重要な変異が認められたので、続いて、異なる民族性の乳癌患者におけるこれらのSNPの変異を決定した。130人の乳癌ヨーロッパ系アメリカ人患者および38人の乳癌アフリカ系アメリカ人患者において、これらのSNPを遺伝子型決定したところ、これらの群全体に変異を認められた(図4B)。これらのSNPと腫瘍リスクとの関連性を決定するために、乳癌患者および民族性対応対照の間で、これらのSNPの頻度を比較した。rs8176318においてホモ接合型(A/A)である珍しい変異体が、アフリカ系アメリカ人に関する乳癌と非常に関連する207であることを決定した[オッズ比(OR)、9.48;95%信頼区間(CI)、1.01−88.80;p=0.04]。乳癌のヨーロッパ系アメリカ人とrs8176318 SNPとの間に、腫瘍関連性は認められなかった(表7)。
【0194】
【表7】
無条件ロジスティック回帰モデルにおいて、乳癌(BC)サブタイプならびに人種[ヨーロッパ系アメリカ人(EA)およびアフリカ系アメリカ人(AA)]による、オッズ比(OR)および95%信頼区間(CI)を調整した。太字の値は、統計的な腫瘍関連性を示す。丸括弧内の数字は、各群の患者数を指す(第一列目)。
【0195】
BRCA1機能不全は乳癌サブタイプの間で異なるので、次いで、民族性および乳癌サブタイプごとに、3個の3’UTR SNPを評価した(図14)。rs8176318のホモ接合変異型が、アフリカ系アメリカ人女性の間で、TN乳癌のリスクと非常に関連することを決定した[OR、12.19;95%CI、1.29−115.21、p=0.02)。あらゆる他のSNPに関して、または、ER/PR+もしくはHER2+乳癌サブタイプに関して、関連性は認められなかった(表10)。
【0196】
【表10】
無条件ロジスティック回帰モデルにおいて、乳癌(BC)サブタイプならびに人種[ヨーロッパ系アメリカ人(EA)およびアフリカ系アメリカ人(AA)]による、オッズ比(OR)および95%信頼区間(CI)を調整した。太字の値は、統計的な腫瘍関連性を示す。丸括弧内の数字は、各群の患者数を指す(第一列目)。ここで、NAは、腫瘍サブタイプにおける遺伝型の表示がなかった場合に使用され、これは、群を構成する患者数が少ない結果である可能性が高い。
【0197】
BRCA1ハプロタイプ進化および頻度
BRCA1領域をよりよく評価するために、本発明者らは、本発明者らの乳癌患者において本発明者らが同定した3個の3’UTR SNPを囲んでいる過去に報告された5個のさらなるタグ付きSNP(Kidd JRら、(abstract/program#58).the 53rd Annual Meeting of The American Society of Human Genetics,November 4−8th,2003,Los Angeles,California 2003に出席)を加えた。合計8個のSNPは、267 kbに及ぶ(表2)。この領域全体は高いLDを有し、本発明者らのハプロタイプを構成する8個のSNPすべての間のヘテロ接合性は、一般的に高い(30から50%)(http://alfred.med.yale.edu)(Cheung KHら、Nucleic acids research 2000;28(1):361−3;Kidd JRら、(abstract/program #58).the 53rd Annual Meeting of The American Society of Human Genetics,November 4−8th,2003,Los Angeles,California 2003に出席)。
【0198】
これらの8個のSNPを使用して、世界ハプロタイプ頻度を作製した(図8)。認められた一般的なハプロタイプのすべては、祖先ハプロタイプへの変異の蓄積によって説明することができる(図7)。直接的に認められたハプロタイプの大部分は、順序付けることができ、1個の派生ヌクレオチド変化によって相違している;ある事例では、2個の変化が必要とされ、別の事例では、組換えが認められる。合計で、これらは3本の枝をつくり、それぞれは、祖先ハプロタイプに由来する単一のヌクレオチド変化に端を発する。注目すべきことに、(3から5個のハプロタイプを持つ)アフリカ以外に対して、(6から9個の示されるハプロタイプを持つ)アフリカにおいて、ハプロタイプ多様性がかなり高いことが見出された。祖先ハプロタイプGGCCACTA(配列番号8)は、ほとんどアフリカにおいてのみ見られる。世界的に見られる最も一般的なハプロタイプであるAGCCATTA(配列番号2)は、アフリカ以外のすべての集団において非常に多い。
【0199】
乳癌患者におけるBRCA1ハプロタイプ
乳癌患者におけるこれらの8個のSNPからなるハプロタイプをさらに研究して、非癌性患者と乳癌患者との間でこれらのBRCA1ハプロタイプに違いがあったかどうかを決定した。本発明者らの乳癌集団では極めて豊富だが(42/442すべての評価した乳癌染色体)、世界対照集団では非常に珍しい5個のハプロタイプ(GGCCGCTA[配列番号9、#1]、GGCCGCTG[配列番号10、#2]、GGACGCTA[配列番号6、#3]、GGACGCTG[配列番号21、#4]およびGAACGTTG[配列番号26、#5])を同定した。4500個の非癌性染色体の世界試料では、GGACGCTA(配列番号6)ハプロタイプ(#3)が3番染色体上で認められ、GGACGCTG(配列番号21)ハプロタイプ(#4)が2番染色体上に存在したが、GGCCGCTA(配列番号9)(#1)、GGCCGCTG(配列番号10)(#2)およびGAACGTTG(配列番号26)(#5)ハプロタイプは見られなかった(0.1%未満)。これは、非癌性対照におけるこれらのハプロタイプに関する0.1%の全体的な世界頻度対乳癌患者染色体に関する9.50%の頻度を示している(p<0.0001)(図16A)。2個のハプロタイプ(それぞれ#3および#4)は、SNP rs8176318を有する3’UTR内の派生対立遺伝子Aによって特徴付けられる。3番目の珍しいハプロタイプ(GAACGTTG(配列番号26)、#5)は、rs8176318およびrs12516という2個の3’UTR多型を有する派生対立遺伝子(A)を有する。
【0200】
研究結果によって、これらのハプロタイプが民族性によって異なっていたことが実証されたので、これらの珍しい乳癌ハプロタイプを適切な民族集団とよりよく比較するために、乳癌患者および対応対照を、民族性ごとにさらに評価した。民族性対応対照は、合計194人の個体(エール大学対照の白人のアメリカ人およびアフリカ系アメリカ人の集団を含む、102人のアフリカ系アメリカ人ならびに92人のヨーロッパ系アメリカ人)から構成された。白人のアメリカ人乳癌患者の8.84%およびアフリカ系アメリカ人乳癌患者の11.84%が、珍しいハプロタイプを含んでおり、そしてやはり、これらのハプロタイプは、民族性対応対照においてはめったに見られず、GGACGCTA(配列番号6)ハプロタイプ(#3)だけが、1個のヨーロッパ系アメリカ人対照染色体上に見られることが見出された(0.26%、1/388染色体、p<0.0001、図16B、表8)。
【0201】
【表8−1】
【0202】
【表8−2】
5個の珍しいハプロタイプを有する、乳癌患者および対照のリスト。発症年齢および民族性は、可能であれば、リストに記載される。NK=情報が利用不可であるか不明である。試料は、正常組織および腫瘍の両方に由来する。
【0203】
乳癌サブタイプごとの、乳癌患者におけるBRCA1ハプロタイプ
既知のBRCA1コード配列突然変異は乳癌サブタイプによって異なるので、次いで、珍しいハプロタイプがどのようにして、乳癌サブタイプの間に分布したかを決定した。珍しいハプロタイプは、TN、ER/PR+とHER2+サブタイプとの間で著しく異なり、TNサブグループは、これらの珍しいハプロタイプを最も高い割合14.85%(30/202染色体、他のものと比較してp=0.014)で有し、次いで、ER/PR+乳癌サブタイプでは8.09%(11/136 ER/PR+染色体)であり、HER2+サブタイプでは最も低い1%(1/104)である(図17A、表9)。GGACGCTG(配列番号21)ハプロタイプ(#4)だけが、TN腫瘍と関連しており、他の腫瘍サブタイプと関連していなかった。次いで、民族性および乳房腫瘍サブタイプの両方で、珍しいハプロタイプを評価した(図17B)。2個のハプロタイプ(それぞれ#2および#5)は、乳癌ヨーロッパ系アメリカ人に固有であった。興味深いことに、TNサブグループが、残りのハプロタイプの最も高い割合を占めている(9.9%)。残りは、研究したすべての集団において1%未満の頻度を有するすべてのハプロタイプの合計として定義される。これらの知見は、乳癌のTNサブタイプが、この領域全体を通じて最大量の変動性を有し、珍しいハプロタイプと最も強く関連していることを示している。
【0204】
【表9】
ハプロタイプ頻度のばらつきに関して、民族性対応対照と比較して、ヨーロッパ系およびアフリカ系アメリカ人乳癌患者を評価した。9個の一般的なハプロタイプが示されている。乳癌患者では一般的だが、対照の間では珍しい5個のさらなるハプロタイプもまたリストに記載されている。ゼロではない評価の残りのハプロタイプは合算され、残りとしてリストに記載されている。p<0.05であれば、値は、有意であると考えられる。*この表における「残り」のハプロタイプは、具体的に名付けられていないゼロではないハプロタイプの累積評価を表しており、したがって、単一配列を表していないので、配列識別子を割り当てなかった。
【0205】
年齢およびBRCA突然変異状態ごとのBRCA1ハプロタイプ
年齢ごとに珍しいハプロタイプを評価して、より若い(閉経前の)女性が、閉経後の女性と比較して、これらの珍しいハプロタイプのより高い割合を占めるかどうかを決定した。珍しいハプロタイプは、52歳未満の乳癌患者においてより多く見られる;しかしながら、この傾向は、統計的に有意ではなかった(図15)。
【0206】
珍しいBRCA1ハプロタイプが、BRCA1コード配列突然変異と関連しているかどうかもまた決定したが、本研究で検査した患者に関して、BRCA1突然変異状態は不明であった。したがって、129人の非血縁の別の集団
本発明者らの珍しいBRCA1ハプロタイプの存在に関して、BRCA1コード領域突然変異がヘテロ接合であるヨーロッパ人の乳癌患者を検査した。BRCA1コード配列突然変異の患者1人だけが、珍しいハプロタイプ(0.8%、GAACGTTG(配列番号26)、#5)を有していた。残りの4個の珍しいハプロタイプは、この患者の集団において見られず、このことは、これらの珍しいBRCA1ハプロタイプは、一般的なBRCA1コード配列突然変異の代理マーカーではなく、むしろこれらの珍しいBRCA1ハプロタイプは、乳癌に関連するBRCA1変異に固有の新規バイオマーカーであるということを示唆している。
【0207】
考察
本研究によって、299人の乳癌患者が、対照集団では通常見られない5個の珍しいBRCA1ハプロタイプを持つことが見出された。これらのハプロタイプは、BRCA1 3’UTR SNPを含んでおり、その中の1個(rs8176318)は、アフリカ系アメリカ人の間で重要な癌関連性を示し(p=0.04)、そしてさらに、民族性対応対照と比較すると、アフリカ系アメリカ人の間でトリプルネガティブ乳癌に関するリスクファクターである(p=0.02)。これらのハプロタイプは、一般的なBRCA1コード領域突然変異と関連していない。これらの知見は、珍しいBRCA1ハプロタイプが、乳癌を発症するリスクの増加の新しい遺伝子マーカーの代表的なものであるとともに、BRCA1機能に影響を与え、乳癌リスクの増加をもたらす、BRCA1における非コード配列変異の代表的なものでもあることを明示している。
【0208】
これまでに、BRCA1領域におけるハプロタイプ解析を実施して、散在性乳癌との関連性を決定する研究があったが、しかしながら、これらの従来の研究者らは、ほとんど成果がなかった(Cox DGら、Breast Cancer Res 2005;7(2):R171−5;Freedman MLら、Cancer research 2005;65(16):7516−22)。
【0209】
本研究は、ハプロタイプ解析の一部として、BRCA1の3’UTR非コード調節領域において珍しい機能的な変異体を含む散在性乳癌の、最初のBRCA1ハプロタイプ研究である。3’UTR内の変異体が遺伝子発現制御を通じて癌に対する感受性を増加させるという仮説は、急速に、証拠によって裏付けることができるようになってきている(Chin LJら、Cancer research 2008;68(20):8535−40;Landi Dら、Carcinogenesis 2008;29(3):579−84)。珍しいハプロタイプにおいて、乳癌リスクの増加が、ハプロタイプ内の1個の単一変異体であるかまたは対立遺伝子の組み合わせであるかを、本発明者らは決定することができないが、各ハプロタイプを含む機能的な3’UTR変異体と他の変異体の組み合わせが、重要なBRCA1機能不全を予測するとの仮説が立てられている。
【0210】
本発明者らのハプロタイプ解析において、サブタイプごとに散在性乳癌をさらに分析した。BRCA1突然変異の結果として生じる乳癌は、TN(57%)(Atchley DPら、J Clin Oncol 2008;26(26):4282−8)およびER+乳癌(34%)(Tung Nら、Breast Cancer Res;12(1):R12)と最も高い頻度で関連しており、そして、HER2+乳癌(約 3%)(Lakhani SRら、J Clin Oncol 2002;20(9):2310−8)においてめったに見られないので、珍しいハプロタイプがTNおよびER+乳癌において主に存在するという本発明者らの知見は、それらが真のBRCA1機能不全に関連しているという本発明者らの仮説を、さらに裏付けている。
【0211】
これからの研究は、本発明者らのBRCA1ハプロタイプ内の個々のSNPのいくつかに焦点を合わせるであろう。BRCA1シノニマスエクソン突然変異であるタグ付きSNP rs1060915が特に興味深く、これは、5個の珍しいハプロタイプのすべてにおいて、派生対立遺伝子Gを伴っている。rs1060915は、意義不明の変異体(VUS)である。乳癌インフォメーションコア(Breast Cancer Information Core)(BIC)は、野生型配列との比較に基づき導かれるmRNAおよびタンパク質レベルに基づいて、このVUSを、中立または臨床上ほとんど重要ではないと分類している(http://research.nhgri.nih.gov/bic/)。このSNPは、高リスクの患者集団において通常見られることから、Myriad Genetics,Inc.,は、それを高リスクの女性と関連付け、それを多型性に分類しているが、本研究とは対照的に、彼らは、乳癌または卵巣癌を発症するリスクの増加のバイオマーカーとしての役割を、このSNPに割り当てていない。具体的には、Myriadは、rs1060915が、被験体の乳癌のTNサブタイプを発症するリスクの重要な予測因子であることを示していない。
【0212】
最近、BRCA1における類似のコード配列SNPが、miRNA結合部位に位置しており、腫瘍感受性に影響を与え得ることが示された(Nicoloso MSら、Cancer research;70(7):2789−98)。miRNA結合に影響を与えるエクソンSNPと組み合わせた、miRNAの崩壊をもたらす3’UTR SNPは、珍しいハプロタイプにおいて乳癌リスクの増加をもたらす1個のメカニズムである。
【0213】
乳癌のTNサブタイプにおける珍しいハプロタイプの豊富さは、とりわけ特筆すべきである。このサブタイプだけが、対照と比較して、本発明者らの珍しいハプロタイプと統計的に関連しているのではなく(p<0.0001)、TN乳癌もまた、本発明者らの珍しいハプロタイプと関連している最も一般的なサブタイプである。TN腫瘍はエストロゲン刺激(未経産、肥満、ホルモン補充療法)と関連していないので、TN乳癌に関するリスクファクターは、乳癌の他の形態とは異なっている。TNとエストロゲン刺激の非関連性は、さらなる遺伝子的原因が存在することを強く示唆している。TN乳癌は最悪の結果を出すので、乳癌のこのサブタイプを発症するリスクを有する者を同定することが、おそらく最も重要である。
【0214】
本発明者らの研究の欠点としては、珍しいハプロタイプを持つ患者が少数であることが挙げられ、このことは、未対応の年齢および人種との潜在的に重要な関連性を妨げているかもしれない。加えて、BRCA1コード領域突然変異に関してヘテロ接合であるヨーロッパ人の乳癌患者の集団は、ほとんどが西ヨーロッパの白人であり、混血ヨーロッパ人の家系はおそらくわずかな割合である。民族的に限られた群は、BRCA1突然変異保有者の間の珍しいハプロタイプの知見を限定するかもしれない。しかしながら、珍しいハプロタイプと乳癌の密接な関連性は、これらの知見を、さらにより強く統計的に重要にする。本研究は、これらの珍しいハプロタイプが、乳癌を発症するリスクの増加の遺伝子マーカーとして使用できるという証拠を提供し、そして、より大きなサンプルサイズで結果を有効なものにするとともに、これらのハプロタイプの生物学的機能およびそれらの乳癌リスクの増加のメカニズムをさらに解明するという今後の活動を支援する。
【0215】
他の実施形態
本発明は、その詳細な説明に関連して説明してきたが、前述の説明は、添付の特許請求の範囲によって定義される本発明の範囲を例証することを意図しており、制限することを意図していない。他の形態、利点、および改変は、以下の特許請求の範囲内に含まれる。
【0216】
本明細書において参照した特許および科学論文は、当業者が利用できる知識を確立している。本明細書において引用されるすべての米国特許および公開されたまたは未公開の米国特許出願は、参照により本明細書に組み込まれる。本明細書において引用された公開されたすべての外国特許および特許出願は、参照により本明細書に組み込まれる。本明細書において引用されるアクセッション番号によって示されるGenbenkおよびNCBI提出物は、参照により本明細書に組み込まれる。本明細書において引用される他のすべての公表された参考文献、文書、原稿、および科学論文は、参照により本明細書に組み込まれる。
【0217】
本発明は、その好ましい実施形態を参照して特に示され、記述されてきたが、形態および詳細に様々な変化を行ってもよく、それらも添付の特許請求の範囲によって包含される本発明の範囲から逸脱しないことは、当業者によって理解されるであろう。
【技術分野】
【0001】
関連出願
この出願は、2009年6月25日に出願された仮出願USSN61/220,342号(この内容は、その全体が参考として本明細書に援用される)に関する。
【0002】
政府の援助
本発明は、共にNational Institutes of Healthによって付与された助成金第CA124484号および第CA131301−01A1号の下、政府の支援を受けてなされた。政府は、本発明に一定の権利を有する。
【0003】
発明の分野
一般的に、本発明は、癌および分子生物学の分野に関する。本発明は、癌を発症するリスクの増加を予測するための組成物および方法を提供する。
【背景技術】
【0004】
癌検出の分野における進歩があるにもかかわらず、当技術分野では、臨床応用に容易に使用することができる様々な癌のための新規な遺伝子マーカーを同定する必要がある。これまで、癌を発症するリスクを予測するのに使用可能な選択肢は、比較的少ない。
【発明の概要】
【0005】
本発明の方法は、miRNAの標的への結合能力を修正する可能性のある乳癌遺伝子および卵巣癌遺伝子における多型を同定するだけでなく、標的遺伝子調節に対するこれらのSNPの影響ならびに乳癌および卵巣癌のリスクを評価するための手段を提供する。これらの方法は、従来は認識されていなかった、乳癌および卵巣癌のリスクが増加している患者を同定するために使用される。本発明の方法を使用して、BRCA1遺伝子もしくはそのメッセンジャーRNA(mRNA)転写産物周辺の領域内またはこれらを含む領域内で生じるSNPを同定することおよび特性評価することに特に関連する。
【0006】
本発明は、マイクロRNA(miRNA)の結合能力を修正する可能性のある乳癌および卵巣癌関連遺伝子の3’非翻訳領域(UTR)における一塩基多型(SNP)を同定するための方法を提供する。好ましい実施形態では、乳癌および卵巣癌関連遺伝子は、BRCA1遺伝子それ自体、ゲノム内の周辺領域、BRCA1調節エレメントおよび/またはそれらのメッセンジャーRNA(mRNA)転写産物を含むBRCA1である。HapMap(The International HapMap Project.Nature,2003.426,789−96)、dbSNP(Sherry,S.Tら、Genome Res 1999.9,677−9)および(http://www.ensembl.orgで利用可能な)Ensembl Project databaseなどの当該技術分野において承認されているいくつかのデータベースが目的のSNPをコンピュータで同定するのに使用されるほか、PicTar(Landi,D.ら、DNA Cell Biol(2007))、TargetScan(Lewis,B.P.ら、Cell 2005.120,15−20)、miRanda(John,B.ら、PLoS Biol 2004.2,e363)、miRNA.org(Betel,D.ら、Nucleic Acids Res 2008.36,D149−53)およびMicroInspector(Rusinov,V.ら、Nucleic Acids Res 2005.33,W696−700)などの特殊アルゴリズムもmiRNA結合部位を同定するのに使用されるが、これらに限定されない。
【0007】
本発明は、miRNA相補的(complimentary)部位における配列変異を評価するための、乳房腫瘍および卵巣腫瘍、隣接正常組織(使用可能な場合)ならびに正常組織試料を同定するための方法もまた提供する。この方法の好ましい実施形態では、BRCA1遺伝子またはそのmRNA転写産物は、miRNA相補的(complimentary)部位を含む。本発明のある実施形態では、変異が生殖系列SNPである場合、隣接する正常組織は確認するのに使用される。あるいはまたはさらに、生殖系列ではない3’UTR変異もまた、臨床的重要性について分析される。
【0008】
また、本発明は、インビトロにおける標的遺伝子調節に対する同定されたSNPの影響を評価する方法を提供する。この方法の好ましい形態では、同定されたSNPは、BRCA1遺伝子内またはそのmRNA転写産物内に含まれる。この方法の別の好ましい形態では、同定されたSNPは、BRCA1mRNAの3’UTR内に含まれる。本発明のある形態では、発現レベルを測定するための細胞培養系およびルシフェラーゼアッセイ(Chin,L.J.ら、Cancer Res 2008.68,8535−40;Johnson,S.M.ら、Cell 2005.120,635−47)を使用して、SNPが評価される。野生型3’UTRを作製するために、ポリメラーゼ連鎖反応(PCR)が、細胞株からヒトゲノムDNAを増幅するのに使用される。変異体配列を構築するために、部位特異的突然変異誘発法が使用される(Johnson,S.M.ら、Cell 2005.120,635−47)。次いで、これらの構築物は、ルシフェラーゼレポーターにクローニングされる。最後に、GraphPad Prism(Chin,L.J.ら、Cancer Res 2008.68,8535−40)を使用して、レポーター発現が定量される。
【0009】
本発明は、乳癌または卵巣癌を発症するリスクを評価する方法をさらに提供する。この方法の一形態では、目的のSNPの保有率(prevalence)は、世界集団(world population)における予測保有率に関して、試料癌集団内で比較される。この方法の好ましい実施形態では、目的のSNPは、BRCA1遺伝子内またはそのmRNA転写産物内に含まれる。新規のSNPに関して、世界集団と比較する前に、TaqMan PCRアッセイ(Applied Biosystems)が対立遺伝子の識別のために行われ得る。本明細書において提供される方法の他の実施形態では、一般集団およびSNPを保有しない個体に関して、乳癌および/または卵巣癌を発症するSNPに関連したリスクの増加を決定するために、目的のSNPは、乳癌症例対照および卵巣癌症例対照と比較される。
【0010】
具体的には、本発明は、少なくとも1つの一塩基多型(SNP)を含む単離および精製されたBRCA1ハプロタイプであって、SNPの存在が被験体の乳癌または卵巣癌を発症するリスクを増加させる、BRCA1ハプロタイプを提供する。本発明のハプロタイプは、単離および精製されたゲノム配列またはcDNA配列である。また、ハプロタイプは、単離、精製、そして場合により増幅された配列である。ハプロタイプ配列が単離されるゲノムDNA配列およびcDNA配列は、体液および組織などの生物試料から得られる。最も一般的には、ハプロタイプが由来するDNA配列は、例えば、正常な被験体もしくは試験被験体から収集した血液試料または腫瘍試料から単離される。このハプロタイプの一形態では、SNPのそれぞれは、1つ以上のmiRNAの活性を変化させる。このハプロタイプの別の形態では、SNPのそれぞれは、1つ以上のmiRNAの活性を増加または減少させる。ある形態では、SNPは、1つ以上のmiRNAのmiRNA結合部位への結合効力を増加または減少させる。miRNA結合効力の変化は、BRCA1の発現を増加または減少させ、好ましい実施形態では、miRNA結合効力の変化は、BRCA1発現を減少させる。SNPは、BRCA1遺伝子の非コード領域またはコード領域、周辺遺伝子、およびBRCA1発現を調節、変化、増加もしくは減少させるゲノムの遺伝子間配列または遺伝子内配列に位置してもよい。BRCA1遺伝子の非コード領域およびコード領域に位置するSNPは、miRNA結合部位に位置し、その結果として、1つ以上のmiRNAの活性を阻害する。このハプロタイプのある実施形態では、SNPは、rs9911630、rs12516、rs8176318、rs3092995、rs1060915、rs799912、rs9908805およびrs17599948からなる群から選択される。好ましい実施形態では、SNPは、rs12516、rs8176318、rs3092995、rs1060915およびrs799912からなる群から選択される。最も選択的な実施形態では、ハプロタイプは、rs8176318およびrs1060915を含む。あるいは、SNPは、rs8176318であるかまたはrs1060915である。
【0011】
本明細書において記載されるハプロタイプは、被験体の乳癌または卵巣癌を発症するリスクを増加させる。乳癌および卵巣癌のすべてのサブタイプが本発明によって包含されるが、通常検討される乳癌の具体的なサブタイプは、トリプルネガティブ(TN)(ER/PR/HER2ネガティブ)、エストロゲン受容体ポジティブ(ER+)、エストロゲン受容体およびプロゲステロン受容体ポジティブ(ER+/PR+)ならびにヒト上皮成長因子受容体2ポジティブ(HER2+)である。好ましい実施形態では、本明細書において記載される珍しいハプロタイプは、最も高い頻度でTN乳癌と関連する。学説に縛られることなく、本明細書において列挙されるホルモン受容体特異的乳癌サブタイプの中で、乳癌は、最も低い頻度で散発性の原因に関連し、したがって、遺伝性である可能性が最も高い。TN乳癌もまた、特にアフリカ系アメリカ人被験体においてrs8176318 SNPおよび/またはrs1060915を含むハプロタイプに確実に関連する。
【0012】
本発明は、すべての開示されるハプロタイプを包含する。好ましいハプロタイプとしては、本明細書において記載される「珍しい」ハプロタイプが挙げられる:GGACGCTA(配列番号6)、GGCCGCTA(配列番号9)、GGCCGCTG(配列番号10)、GGACGCTG(配列番号21)またはGAACGTTG(配列番号26)。
【0013】
本発明は、乳癌または卵巣癌を発症するリスクの増加を示すBRCA1多型シグネチャーであって、以下の一塩基多型(SNP)rs8176318およびrs1060915の存在または非存在の決定を含み、これらのSNPの存在が乳癌または卵巣癌を発症するリスクの増加を示す、シグネチャーをさらに提供する。ある実施形態では、シグネチャーは、rs12516、rs3092995およびrs799912からなる群から選択される少なくとも1つのSNPの存在または非存在の決定をさらに含む。あるいはまたはさらに、シグネチャーは、rs9911630、rs9908805およびrs17599948からなる群から選択される少なくとも1つのSNPの存在または非存在の決定を含む。このシグネチャーの一形態では、rs8176318、rs1060915、rs12516、rs3092995、rs799912、rs9911630、rs9908805またはrs17599948は、少なくとも1つのマイクロRNA(miRNA)結合効力を変化させる。あるいは、rs8176318、rs1060915、rs12516、rs3092995、rs799912、rs9911630、rs9908805およびrs17599948は、少なくとも1つのマイクロRNA(miRNA)結合効力を増加または減少させる。少なくとも1つのmiRNAは、例えば、(http://www.mirbase.org/において公的に利用可能な)miRBaseによって提供されるあらゆるヒトmiRNAである。ある実施形態では、miRNAは、miR−19a、miR−18b、miR−19b、miR−146−5p、miR−18a、miR−365、miR−210、miR−7、miR−151−3p、miR−1180である。好ましくは、miRNAは、miR−7である。
【0014】
他の実施形態では、このシグネチャーは、1つ以上のマイクロRNAの結合効力を減少させるBRCA1遺伝子における少なくとも1つのSNPの存在または非存在の同定をさらに含む。少なくとも1つのSNPは、コード領域内または非コード領域内に生じてもよい。例示的な非コード領域としては、3’非翻訳領域(UTR)、イントロン、遺伝子間領域、シス調節エレメント、プロモーターエレメント、エンハンサーエレメントまたは5’非翻訳領域(UTR)が挙げられるが、これらに限定されない。限定されないコード領域の例は、エクソンである。
【0015】
本明細書において記載されるシグネチャーは、被験体の乳癌または卵巣癌を発症するリスクを決定する。乳癌および卵巣癌のすべてのサブタイプが本発明によって包含されるが、通常企図される乳癌の具体的なサブタイプは、トリプルネガティブ(TN)(ER/PR/HER2ネガティブ)、エストロゲン受容体ポジティブ(ER+)、エストロゲン受容体およびプロゲステロン受容体ポジティブ(ER+/PR+)ならびにヒト上皮成長因子受容体2ポジティブ(HER2+)である。好ましい実施形態では、本明細書において記載されるシグネチャーは、特にアフリカ系アメリカ人被験体におけるTN乳癌を発症するリスクを決定するのに使用される。
【0016】
本発明は、(a)試験被験体から試料を得る工程;(b)対照試料を得る工程;(c)試験試料由来のDNA配列内の少なくとも1つのmiRNA結合部位におけるSNPの存在または非存在を決定する工程;および(d)SNPを含む少なくとも1つのmiRNA結合部位への少なくとも1つのmiRNAの結合効力を、対照試料由来の対応するDNA配列における同じmiRNA結合部位への該miRNAの結合効力と比較して、評価する工程を含む、BRCA1遺伝子の発現を減少させ、かつ被験体の乳癌または卵巣癌を発症するリスクを増加させるSNPを同定する方法であって、対照試料と試験試料との間の、対応する結合部位への少なくとも1つのmiRNAの結合効力における統計的に有意な変化の存在が、SNPの存在または非存在がmiRNA介在性の防御を阻害するかまたはmiRNA介在性のBRCA1遺伝子発現の抑制を増大させることを示し、それによって、被験体の乳癌または卵巣癌を発症するリスクもまた増加させるSNPを同定する、方法をさらに提供する。対照試料と試験試料との間の、対応する結合部位への少なくとも1つのmiRNAの結合効力における統計的に有意な増加または減少の存在は、SNPの存在または非存在がmiRNA介在性の防御を阻害するかまたはBRCA1遺伝子発現の抑制を増大させることを示す。この方法のある実施形態では、試験被験体は、乳癌または卵巣癌と診断されている。対照的に、対照試料は、いかなる癌も有するとは診断されていない被験体から得られる。また、対照試料は、データベースまたは臨床研究から検索される対照値ともなり得る。試験試料または対照試料由来のDNA配列における結合部位へのmiRNAの結合効力は、インビボ、インビトロまたはエクスビボで評価される。
【0017】
本発明は、(a)試験被験体から試料を得る工程;(b)試験試料由来のDNA配列中の少なくとも1つのmiRNA結合部位におけるSNPの存在または非存在を決定する工程;および(c)1つ以上の世界集団におけるSNPの予測保有率に関して、乳癌集団または卵巣癌集団内のSNPの保有率を評価する工程を含む、BRCA1遺伝子の発現を減少させ、かつ被験体の乳癌または卵巣癌を発症するリスクを増加させるSNPを同定する方法であって、1つ以上の世界集団と比較した腫瘍試料中のSNPの存在または非存在における統計的に有意な増加が、SNPが乳癌または卵巣癌を発症するリスクの増加に陽性に関連することを示し、BRCA1の発現を減少させる少なくとも1つのmiRNA結合部位内のSNPの存在または非存在が、SNPの存在または非存在がmiRNA介在性の防御を阻害するかまたはmiRNA介在性のBRCA1遺伝子発現の抑制を増大させることを示し、それによって、被験体の乳癌または卵巣癌を発症するリスクもまた増加させるSNPを同定する、方法を提供する。この方法のある実施形態では、試験被験体は、乳癌または卵巣癌と診断されている。対照的に、対照試料は、いかなる癌も有するとは診断されていない被験体から得られる。また、対照試料は、データベースまたは臨床研究から検索される対照値ともなり得る。世界集団は、地理的集団(ヨーロッパ人もしくはアフリカ系アメリカ人)または民族的集団(アシュケナージ系ユダヤ人)であり、身体的理由または文化的理由に関する構成員は、類似の遺伝的背景を共有することが予想される。
【0018】
SNPを同定する方法に関して、miRNA結合部位は、実験的に決定され、データベースで同定され、またはアルゴリズムを使用して予測される。また、SNPの存在または非存在は、実験的に決定され、データベースで同定され、またはアルゴリズムを使用して予測される。
【0019】
また、本発明は、(a)試験被験体からDNA試料を得る工程;および(b)試料由来の少なくとも1つのDNA配列において、rs12516、rs8176318、rs3092995およびrs799912からなる群から選択される少なくとも1つのSNPの存在を決定する工程を含む、乳癌または卵巣癌を発症するリスクを有する被験体を同定する方法であって、少なくとも1つのDNA配列における少なくとも1つのSNPの存在が、被験体の乳癌または卵巣癌を発症するリスクを、正常な被験体と比較して10倍増加させる、方法を提供する。好ましい実施形態では、方法は、rs1060915の存在を決定する工程をさらに含み、少なくとも1つのDNA配列におけるrs1060915ならびにrs12516、rs8176318、rs3092995およびrs799912からなる群から選択される少なくとも1つのSNPの合わせた存在が、被験体の乳癌または卵巣癌を発症するリスクを、正常な被験体と比較して100倍増加させる。正常な被験体は、rs12516、rs8176318、rs3092995、rs799912またはrs1060915を有する一般的な対立遺伝子を保有しない被験体である。
【0020】
本発明は、(a)試験被験体からDNA試料を得る工程;および(b)試料由来の少なくとも1つのDNA配列において、rs8176318またはrs1060915の存在を決定する工程を含む、トリプルネガティブ(TN)乳癌を発症するリスクを有する被験体を同定する方法であって、少なくとも1つのDNA配列におけるrs8176318またはrs1060915の存在が、被験体のTN乳癌を発症するリスクを、正常な被験体と比較して増加させる、方法もまた提供する。好ましい実施形態では、この方法は、rs8176318およびrs1060915の存在を決定する工程を含み、少なくとも1つのDNA配列におけるrs8176318およびrs1060915の合わせた存在が、被験体のTN乳癌を発症するリスクをさらに増加させる。正常な被験体は、rs8176318またはrs1060915を保有しない被験体である。試験被験体は、好ましくは、アフリカ系アメリカ人である。
【0021】
本明細書におけるハプロタイプ、シグネチャーおよび方法によって記載されるように、乳癌は、散発性または遺伝性である。また、卵巣癌は、散発性または遺伝性である。
【図面の簡単な説明】
【0022】
【図1】図1は、miRNAの生合成の略図である。
【図2−1】図2は、BRCA1 3’UTRの注釈である。
【図2−2】図2は、BRCA1 3’UTRの注釈である。
【図3−1】図3は、癌集団におけるBRCA1 3’UTRの図式的な比較である。図は、124 個の癌DNA試料および14個のエール大学対照DNA試料に由来するBRCA1 3’UTR全体の増幅の配列決定結果に基づく。
【図3−2】図3は、癌集団におけるBRCA1 3’UTRの図式的な比較である。図は、124 個の癌DNA試料および14個のエール大学対照DNA試料に由来するBRCA1 3’UTR全体の増幅の配列決定結果に基づく。
【図4A】図4は、2,472人の個体を含む46個の世界集団由来の3個のSNP部位で遺伝子型決定しているBRCA1 3’UTRの説明である。
【図4B】図4は、2,472人の個体を含む46個の世界集団由来の3個のSNP部位で遺伝子型決定しているBRCA1 3’UTRの説明である。
【図5】図5は、7個の癌集団および1個のエール大学対照集団由来の3個のSNP部位で遺伝子型決定しているBRCA1 3’UTRのグラフ表示であり、384人の個体が、これらの8個の集団に含まれる。
【図6】図6は、系統を推測するとともに、ゲノムのBRCA1領域のハプロタイプ解析を遂行するのに使用した8個のSNPの説明である。BRCA1遺伝子内で見られたSNPとしては、rs12516、rs8176318、rs3092995、rs1060915およびrs799912が挙げられる。BRCA1周辺のSNPとしては、rs991630、rs9908805およびrs17599948が挙げられる。
【図7】図7は、BRCA1ハプロタイプの進化案の説明である。10個の最も一般的なハプロタイプがここに示されている。各ハプロタイプは、祖先ハプロタイプ(GGCCACTA、配列番号8)への変異の蓄積によって説明することができる。直接的に認められたハプロタイプの大部分は、順序付けることができ、1個の派生ヌクレオチド変化によって相違している。枠で囲まれた2個のハプロタイプのうちどちらが、採用されたSNPを有する系統において最初に生じたかということに関しては未解決であった。AGCCATTA(配列番号2)ハプロタイプは、現在のところ、世界中で最も一般的に認められるハプロタイプである。「あらゆる所に存在している」と表示された2個のハプロタイプは、世界のすべての地域に存在している(GAACAGATA(配列番号17)およびGAACGCTC(配列番号18))。組換えハプロタイプ(AGCC−GCTG、配列番号19)は、(南アメリカ、中央アメリカおよび北アメリカの地域を示す)新世界においてのみ見られる。
【図8】図8は、世界中の46個の集団(2,472人の個体)からのBRCA1地域ハプロタイプデータの説明である。
【図9】図9は、7個の癌集団および1個のエール大学対照群(384人の個体)に関する、BRCA1地域ハプロタイプデータの説明である。集団サイズ:対照:29人、乳房/卵巣:17、子宮:55、卵巣:77、ER/PR+:44、HER2+:47、MP:39、TN:76。
【図10】図10は、BRCA1の民族性内訳の説明である。
【図11】図11は、コード領域突然変異状態によるBRCA1ハプロタイプデータの説明である。ハプロタイプによって、110人の患者をBRCA1検査および分析した。
【図12】図12は、民族性データによって分けた、TNおよびエール大学対照を有するBRCA1地域ハプロタイプ頻度を示す略図である。
【図13】図13は、民族性および年齢によって分けた、TN乳癌群におけるBRCA1地域ハプロタイプ頻度を示す略図である。
【図14】図14は、選択した各集団における遺伝子型決定した各SNP(rs12516対立遺伝子A、rs8176318対立遺伝子Aおよびrs3092995対立遺伝子G)での派生対立遺伝子に関する、対立遺伝子頻度を示すグラフである。388人の個体(ヨーロッパ系アメリカ人およびアフリカ系アメリカ人対照)ならびに乳癌集団(左から右に示されるTN、HER2+およびER+/PR+)において、SNPを調査した。
【図15】図15は、診断年齢ごとの、乳癌患者の間の珍しいBRCA1ハプロタイプ頻度を示すグラフである。珍しいBRCA1ハプロタイプ頻度に関して、診断年齢が知られているすべての乳癌患者を評価した。診断時に、乳癌患者を、52歳以下または52歳超のいずれかにグループ分けした。乳癌患者では一般的だが、対照の間では珍しい5個のハプロタイプが示されている。
【図16A】図16Aは、乳癌患者の間の珍しいBRCA1ハプロタイプ頻度を示すグラフである。乳癌患者では一般的だが、大域的対照集団の間ではめったに見られないハプロタイプに関して、乳癌患者を評価した。5個の珍しいハプロタイプ頻度は、Y軸に沿って示されている。
【図16B】図16Bは、民族性ごとの、乳癌の間のBRCA1ハプロタイプ頻度を示す図式的なダイアグラムである。ハプロタイプ頻度に関して、ヨーロッパ系およびアフリカ系アメリカ人乳癌患者を評価した。ヨーロッパ系アメリカ人およびアフリカ系アメリカ人を対照として追加した。9個の一般的なハプロタイプが示されている。乳癌患者では一般的だが、対照の間ではめったにない5個のさらなるハプロタイプが示されている(これらの珍しいハプロタイプは、番号付けされ、アスタリスクで印を付けられ、そして枠で囲まれている)。ゼロではない評価の残りのハプロタイプ頻度は、残りのクラスに合算されている。3個の3’UTR多型は、(1位の部位を左端のヌクレオチドとし、8位の部位を右端のヌクレオチドとする場合、8個のヌクレオチド部位の2位の部位、3位の部位および4位の部位にある)太字フォントで示されており、3’UTR内の派生対立遺伝子は、下線が引かれている。
【図17】図17Aは、サブタイプごとの、乳癌患者の間の珍しいBRCA1ハプロタイプ頻度を示すグラフである。サブタイプごとに、乳癌患者をグループ分けし、そして、乳癌患者では一般的だが、大域的対照集団の間ではめったに見られないハプロタイプに関して、評価した。5個の珍しいハプロタイプ頻度は、Y軸に沿って示されている。図17Bは、乳癌サブタイプおよび民族性ごとの、珍しいハプロタイプ頻度を示すグラフである。乳房腫瘍サブタイプごとに、ヨーロッパ系およびアフリカ系アメリカ人乳癌患者をさらにグループ分けし、そして、珍しいハプロタイプ頻度に関して、評価した。ヨーロッパ系アメリカ人およびアフリカ系アメリカ人を対照として追加した。乳癌患者では一般的だが、対照の間では珍しい5個のハプロタイプが示されている。
【図18】図18AおよびBは、野生型(WT、rs1060915G)、またはルシフェラーゼレポーターに融合した突然変異BRCA1 mRNA(re1060915A変異型対立遺伝子を含むBRCA1遺伝子)エレメントのいずれかで、TN乳癌細胞(示されるMDA MB231細胞)をトランスフェクションした後の、ルシフェラーゼレポーター構築物の転写抑制を示す一組のグラフである。WTまたは変異型BRCA1 mRNAエレメントのいずれかを含むルシフェラーゼレポーター(25ng)を、細胞にトランスフェクトした。トランスフェクションの24時間後、トランスフェクト細胞を溶解し、デュアルルシフェラーゼ活性に関して、アッセイした。祖先対立遺伝子(G)に対して、変異型対立遺伝子(A)を正規化した。スチューデントの両側t検定によって、統計的有意性を決定した。結果は、すべての細胞株(試験した9個の細胞株)にわたって、WTと変異型BRCA1エレメントとの間で、ルシフェラーゼ活性の1.85倍の変化を示した。したがって、rs1060915Aは、BRCA1遺伝子内の調節エレメントである。rs1060915が存在すると、miRNAは効果的に(十分にまたは強固に)結合し得ないか、または異なるmiRNAがBRCA1に結合し、翻訳の調節変化が可能になる。
【図19】図19は、BRCA1遺伝子内のrs1060915周辺の部位を標的とするmiRNAの略図である。4個の候補miRNAは、rs1060915の祖先対立遺伝子または変異型対立遺伝子のいずれかに結合するが、代替SNP対立遺伝子には結合しないと予測される。多くの他のものは、あまり強くない相互作用または変化で結合すると予測される。BRCA1 rs1060915、61位から94位の部位5’−AACAGCUACCCUUCCAUCAUAAGUGACUCUUCUG−3’(配列番号28)。Hsa−miR−7、5’−UGGAAGACUAGUGAUUUUGUUGU−3’(配列番号29)。BRCA1 rs1060915、79位から105位の部位5’−AUAAGUGACUCCUCUGCCCUUGAGGAC−3’(配列番号30)。Hsa−miR−129−5P、5’−CUUUUUGCGGUCUGGGCUUGC−3’(配列番号31)。BRCA1 rs1060915、45位から93位の部位5’−UGGGAGCCAGCCUUCUAACAGCUACCCUUCCAUCAUAAGUGACUCUUCU−3’(配列番号32)。Hsa−miR−185、5’−UGGAGAGAAAGGCAGUUCCUGA−3’(配列番号33)。BRCA1 rs1060915、44位から96位の部位5’−AUGGGAGCCAGCCUUCUAACAGCUACCCUUCCAUCAUAAGUGACUCUUCU−3’(配列番号34)。Hsa−miR−298、5’−AGCAGAAGCAGGGAGGUUCUCCCA−3’(配列番号35)。
【図20】図20Aは、珍しいハプロタイプを持たない癌患者と比較した、珍しいBRCA1ハプロタイプ腫瘍における著しく高いレベルのmiR−7発現を示すグラフである(p=0.04)。miR−7発現は、乳癌サブタイプよりむしろハプロタイプと相互に関連していると考えられる。図20Bは、TN乳癌患者における、miRNAの機能としてのmiRNA発現頻度を示すグラフである。miR−7、miR−28およびmiR−342は、BRCA1腫瘍において高発現している。例えば、miR−7は、TN乳癌腫瘍において高発現している。他の乳癌サブタイプは試験しなかったが、珍しいBRCA1ハプロタイプが存在する他のサブタイプもまた、高いレベルのmiR−7発現を示すであろうと考えられる。
【図21】図21は、野生型(WT)BRCA1(AA)およびrs1060915 SNPを含むBRCA1(GG)に対する、miR−7の結合効力を示すグラフである。miR−7結合は、rs1060915 SNPの存在により変化する。祖先配列または変異型配列(rs1060915 SNPを含むBRCA1)でトランスフェクトしたHCC1937+/+細胞:(0.5nM)。スクランブル対照ではなくmiR−7が、WT BRCA1配列に結合している、すなわち、miR−7は、BRCA発現を特異的に変化させている。注目すべきは、このモデルでは、発現が変化すると、ルシフェラーゼ発現が増大することが明らかにされているということである。miR−7もスクランブル対照も、変異型BRCA1の発現を変化させていないが、このことは予測していた;変異型対立遺伝子内には予測結合部位が存在しないからである(変異型対立遺伝子は、miR−7結合部位を破壊するが、miR−7結合部位は、そうでなければWT BRCA1に存在し、おそらくBRCA1を保護し、より高いレベルのmRNAまたはタンパク質をもたらす)。
【発明を実施するための形態】
【0023】
現在、乳癌は、最も多く診断される癌であり、女性における癌による死亡の主な原因のひとつである。臨床的分類および分子的分類は、乳癌をサブグループにうまく分類しており、予後的に重要であるカテゴリーにおいて固有の遺伝子発現を示している。カテゴリーの中で、エストロゲン受容体(ER)またはプロゲステロン受容体(PR)ポジティブ、HER2受容体遺伝子増幅腫瘍およびトリプルネガティブ([TN]ER/PR/HER2腫瘍)が、これらの研究から生じている。ER/PR+腫瘍およびHER2+腫瘍はともに最も一般的(80%)であり、基底様腫瘍またはTN腫瘍は、乳癌の約15〜20%の割合を占めている(Irvin WJ,Jr.およびCarey LA.Eur J Cancer 2008;44(18):2799−805)。TN表現型は、積極的に解明されているが不明なところが多い癌のサブクラスを表し、これは、若い女性の間およびアフリカ系アメリカ人女性で最も一般的である。
【0024】
BRCA1コード配列変異は、乳癌に関する周知のリスクファクターであるが、しかしながら、これらの変異は、すべての乳癌症例の5%未満の割合を毎年占めている。全体として、BRCA1変異の結果として生じる乳房腫瘍は、TN(57%)(Atchley DPら、J Clin Oncol 2008;26(26):4282−8)またはER+乳癌(34%)(TungNら、Breast Cancer Res;12(1):R12.)が最も多く、HER2+乳癌(約3%)(Lakhani SRら、J Clin Oncol 2002;20(9):2310−8.)はほとんどない。BRCA1変異は極めてまれであるため、TN腫瘍は、BRCA1の低発現によってしばしば特徴付けられる(Turner N,Tutt A,Ashworth A.Nature reviews 2004;4(10):814−9)。BRCA1変異は、TN腫瘍の約10〜20%の割合を占めるのみである(Young SRら、BMC cancer 2009;9:86;Malone KEら、Cancer research 2006;66(16):8297−308;Nanda Rら、JAMA 2005;294(15):1925−33)。これらの結果は、個体を乳癌にかかりやすくするBRCA1誤発現に関連するさらなる遺伝因子が存在する可能性があることを示唆している。
【0025】
ハプロタイプは、いくつかのSNPのパターンであり、これは、DNAの遺伝子内またはセグメント内で互いに連鎖不均衡(LD)にあり、したがって、一つの単位として遺伝で受け継がれる。ハプロタイプは、集団内のすべての測定および不測定対立遺伝子に関するマーカーとして働くので、目的の領域のハプロタイプ研究により、原因SNPの調査を絞り込むことができる。BRCA1ハプロタイプと乳癌との関連性の過去の研究は、矛盾する結果をもたらしてきた。Coxらは、4個の標識SNPによって予測される5個の一般的なハプロタイプ(5%以上)を同定した。これらのSNPの検査によって、ハプロタイプの1つが、看護師健康調査において白人女性における散発性乳癌の20%のリスクの増加(オッズ比1.18、95%信頼区間1.02〜1.37)を予測したことが示された(Cox DGら、Breast Cancer Res 2005;7(2):R171−5)。このハプロタイプ、家族歴陽性および乳癌リスクの間で、相互作用が有意に(p=0.05)認められた(Cox DGら、Breast Cancer Res 2005;7(2):R171−5)。一方、Freedmanらは、多民族的コホート研究から、コホートおいてBRCA1遺伝子座にわたる一般的な変異を検査した。このグループは、BRCA1における一般的な変異が、散発性乳癌リスクに実質的に影響を与えることを示すことができなかった(Freedman MLら、Cancer research 2005;65(16):7516−22)。これらのハプロタイプ研究は、BRCA1のコード領域およびイントロン領域におけるSNPを有する変異に主に焦点を合わせていた(Dunning AMら、Human molecular genetics 1997;6(2):285−9;Bau DTら、Cancer research 2004;64(14):5013−9)。
【0026】
miRNAは、進化的に保存され、ほぼすべての癌で異常に発現している22個のヌクレオチド非コードRNAのクラスであり、それらは、癌抑制遺伝子または腫瘍抑制因子の新規なクラスとして機能する。 miRNAが3’UTRにおいてメッセンジャー(mRNA)に結合する能力は、mRNAレベルおよびタンパク質発現を調節するために重要であり、結合は、一塩基多型の影響を受け得る。最近のデータは、癌遺伝子の3’UTRにおける変異体が、癌リスクの強力な遺伝子マーカーであることを示している(Chin LJら、Cancer research 2008;68(20):8535−40;Landi Dら、Carcinogenesis 2008;29(3):579−84;Pongsavee Mら、Genetic testing and molecular biomarkers 2009;13(3):307−17)。
【0027】
最近、BRCA1 3’UTRは、このようなmiRNA結合部位SNPに関して研究されており、rs12516およびrs8176318を有する派生(および低頻度)対立遺伝子は、タイ人女性において、家族性乳癌および家族性卵巣癌と明らかな関連性を示した。研究によって、両方のSNP部位における派生対立遺伝子Aに関するホモ接合性が、影響を受けないタイ人において見られる頻度の3倍で、癌患者に存在することが明らかになり、重要な癌関連性をもたらした(p=0.007)。機能分析によって、同じ染色体上に、すなわちシスに存在する場合に、両部位を有する派生対立遺伝子のBRCA1機能の活性が減少することが示され、最も大きな減少がrs8176318を有する派生対立遺伝子で見られることを示された(Pongsavee Mら、Genetic testing and molecular biomarkers 2009;13(3):307−17)。本研究は、3’UTR変異体が既知のBRCA1変異に関連しなかったことを明らかにした。さらに、1998年における研究は、BRCA1 3’UTRにおける3番目のSNP、すなわちrs3092995を有する対立遺伝子が、アフリカ系アメリカ人女性において乳癌のリスクの増加に関連することを報告した。より珍しい派生G対立遺伝子は、アフリカ系アメリカ人対照よりもアフリカ系アメリカ人乳癌症例においてより多いことが明らかになった。アフリカ系アメリカ人女性の間の乳癌およびG対立遺伝子に関する年齢調整ORは、3.5(95%CI、1.2−10)であった(Newman Bら、JAMA 1998;279(12):915−21)。
【0028】
本発明は、機能的3’UTR変異体を含むハプロタイプ研究が、乳癌リスクに関連するBRCA1ハプロタイプをよりうまく同定するはずであるという理解に一部基づく。さらに、BRCA1機能不全は乳癌サブタイプによって異なるので、乳癌サブタイプによって、これらのハプロタイプを評価した。その結果、乳癌患者において、3’UTR SNPを同定したところ、これらの1個は個々に重要であった。続いて、ハプロタイプと乳癌の関連性を決定するために、これらの変異体およびBRCA1 3’UTR周辺の5個のSNPを用いて、ハプロタイプ解析を実施した。本研究によって、乳癌患者では通常共有するが非癌集団ではほとんど共有しない5個のハプロタイプを、さらに同定した。これらの珍しいBRCA1ハプロタイプは、乳癌リスクに関連するBRCA1機能不全の新規な遺伝子マーカーを表す。
【0029】
癌は、制御されない細胞増殖および損傷細胞の生存によって起こる多面的な疾患であり、これにより腫瘍形成が生じる。細胞分裂、細胞分化および細胞死が一生を通じて必ず適切に起こるようにするためのいくつかの安全装置を、細胞は発達させている。多くの調節因子は、細胞増殖および細胞分化を導く遺伝子をオンまたはオフにする(Esquela−Kerscher,A.&Slack,F.J.Nat Rev Cancer,2006,6:259−69)。これらの腫瘍抑制遺伝子および癌遺伝子への損傷は、癌で選択される。ほとんどの腫瘍抑制遺伝子および癌遺伝子は、最初に転写され、次いでタンパク質に翻訳されて、それらの影響を発現する。最近のデータは、マイクロRNA(miRNA)と称されるタンパク質非コードRNA低分子もまた腫瘍抑制因子または癌遺伝子のいずれかとして機能し得ることを示している(Medina,P.P.およびSlack,F.J.Cell Cycle 2008.7,2485−92)。ヒトの疾患の中で、miRNAが、癌において異常に発現または変異していることが示されており、このことは、それらが、より正確にはオンコmir(oncomir)と称される癌遺伝子または腫瘍抑制遺伝子の新規なクラスとしての役割を果たすことを示唆している(Iorio,M.Vら、Cancer Res 2005.65,7065−70)。
【0030】
miRNAは、進化的に保存された、短い、タンパク質非コード一本鎖RNAであり、これは、転写後遺伝子調節因子の新規クラスの代表的なものである。研究によって、腫瘍組織と正常組織との間で、異なるmiRNA発現プロファイルが示され(Medina,P.P.およびSlack,F.J.Cell Cycle 2008.7,2485−92)、miRNAは、研究された実質的にすべての癌サブタイプにおいて異常なレベルである(Esquela−Kerscher,A.&Slack,F.J.Nat Rev Cancer 2006.6,259−69)。miRNAは、それらの標的遺伝子の3’非翻訳領域(UTR)に結合し、それぞれ何百もの異なる標的転写産物を調節するが、このことは、miRNAがヒトゲノムにおけるタンパク質コード遺伝子の30%を上方制御し得ることを示唆している(Chen,Kら、Carcinogenesis 2008.29,1306−11)。したがって、機能不全なmiRNAの効果は多面的である可能性があり、それらの異常発現は、細胞恒常性の平衡を潜在的に失わせて、癌などの疾患の一因となる可能性がある。
【0031】
miRNAのメッセンジャーRNA(mRNA)への結合能力は、mRNAレベルおよびタンパク質発現を調節するのに重要である。しかしながら、miRNA標的部位に内在し、存在する結合部位を消去するかまたは誤った結合部位を作り出し得る一塩基多型(SNP)によって、この結合は影響を受け得る(Chen,K.ら、Carcinogenesis 2008.29,1306−11)。癌などの疾患におけるmiRNA標的部位SNPの役割は、まさに定義され始めたばかりである。
【0032】
miRNA
miRNAは、タンパク質コード遺伝子のmRNAと対合することによって転写後遺伝子調節において機能する約22ヌクレオチド長のタンパク質非コードRNA低分子の広いクラスである。最近、生存経路において重要であることが知られているタンパク質をmiRNAが調節するという証拠によって、miRNAがヒト癌遺伝子座で役割を果たすことが示された(Esquela−Kerscher,A.&Slack,F.J.Nat Rev Cancer 2006,6:259−69;Ambros,V.Cell 2001,107:823−6;Slack,F.J.およびWeidhaas,J.B.Future Oncol 2006,2:73−82)。miRNAは多くの下流の標的を制御するので、それらは、癌の処置に関する新規な標的として作用し得る。
【0033】
miRNAの基本的な合成および成熟は、図1において描かれ得る(Esquela−Kerscher,A.およびSlack,F.J.Nat Rev Cancer 2006.6,259−69)。つまり、miRNAは、RNAポリメラーゼIIによって核においてmiRNA遺伝子から転写されて、長い一次RNA(pri−miRNA)転写物を形成し、これらは、キャップ化およびポリアデニル化される(Esquela−Kerscher,A.およびSlack,F.J.Nat Rev Cancer 2006.6,259−69;Lee,Y.ら、Embo J 2002.21,4663−70)。これらのpri−miRNAは、数キロ塩基長であり得、リボヌクレアーゼIII(RNAaseIII)酵素ドローシャ(Drosha)およびその補因子、すなわちパーシャ(Pasha)によって核においてプロセシングされて、約70ヌクレオチドのステムループ構造を有するmiRNA前駆体(pre−miRNA)を放出する。pre−miRNAは、エクスポーチン5によってRan‐グアノシン三リン酸(GTP)依存的に核から細胞質に搬出され、そこで、次いでそれらは、ダイサー、すなわちリボヌクレアーゼIII(RNAaseIII)酵素によってプロセシングされる。これは、約22塩基ヌクレオチドの二本鎖miRNA:RNA誘導型サイレンシング複合体(miRISC)に組み込まれるmiRNA二本鎖の放出を引き起こす。この時点で、複合体は今やその標的遺伝子を調節することができる。
【0034】
図1は、miRNAとその標的との間の相補性(complimentarity)の程度に依存する2つの方法のうち1つによって、遺伝子発現の調節がどのように起こり得るかを示す。不完全な相補性(complimentarity)を有するmRNA標的に結合するmiRNAは、タンパク質翻訳のレベルで標的遺伝子発現を阻害する。一般的に、このメカニズムを使用するmiRNAのための相補的(complimentary)部位は、標的mRNA遺伝子の3’UTRにおいて発見される。完全な相補性(complimentarity)を有するmRNA標的に結合するmiRNAは、標的mRNAの切断を誘導する。このメカニズムを使用するmiRNAは、mRNA標的のコード配列またはオープンリーディングフレーム(ORF)において一般的に見られるmiRNA相補的(complimentary)部位に結合する。
【0035】
哺乳動物では、miRNAは、研究された実質的にすべての癌サブタイプにおいて異常なレベルで見られる遺伝子調節因子である。標的遺伝子に結合する適切なmiRNAは、mRNAレベルおよびタンパク質発現を調節するのに重要である。しかしながら、miRNA結合部位に内在し、存在する結合部位をなくすかまたは非正統的な結合部位を作り出し得る多型によって、良好な結合は影響を受け得る。したがって、miRNA結合部位における多型は、遺伝子およびタンパク質発現への広範囲に及ぶ影響を有し、癌などのヒト疾患のリスクに影響を与え得る遺伝的変異性の別の原因を示し得る。疾患におけるmiRNA結合部位SNPの役割は、まさに定義され始めたばかりであり、miRNAの結合能力を修正し、それによって、標的遺伝子調節ならびに乳癌および/または卵巣癌のリスクに影響を与える乳癌遺伝子におけるSNPの同定は、乳癌および/または卵巣癌リスクの増加を有する患者を認識するための新規な方法を同定するのに役立つ可能性がある。
【0036】
miRNAは、標的mRNAおよび標的遺伝子の非コード領域だけでなく、タンパク質コード領域も標的とする。miRNAのメカニズム:標的認識は、非コード領域とコード領域との間で異なる可能性がある。miRNAがタンパク質コード領域内の結合部位を認識する場合、miRNA結合の転写サイレンシング効果は、非コード領域におけるmiRNA認識およびmiRNA結合の結果と比較して、減少する可能性がある。また、タンパク質コード領域内に位置するmiRNA結合部位シード領域は、非コード領域に位置する結合部位のシード領域よりも多数のmiRNAに結合したヌクレオチドを必要とする可能性がある。SNPは、コード領域内に位置するmiRNA結合部位においても生じ、その結果として、1つ以上のmiRNAの標的遺伝子の発現を調節する能力に影響を与える可能性がある。
【0037】
コード領域において生じ、miRNAの活性に影響を与えるSNPは、標的タンパク質の発現に対して、定量的にまたは定性的に類似する効果を有する可能性があると考えられる。あるいは、コード領域において生じ、miRNAの活性に影響を与えるSNPは、標的タンパク質の発現に対して、定量的にまたは定性的に異なる効果を有する可能性がある。非コード領域およびコード領域においてSNPが同時に存在する場合に、これら両方のSNPは、1つ以上のmiRNAが(これらの個々のSNPが相乗的に作用する)それらの各結合部位に結合する結合能力に影響を与えて、標的転写産物または標的タンパク質の発現に影響を与えるとさらに考えられる。
【0038】
miRNA活性は、細胞周期によってさらに影響を受ける。細胞周期停止中、あるmiRNAは、翻訳を活性化するかまたは標的mRNAの上方制御を誘導することを示している(Vasudevan S.ら、Science,2007.318(5858):1931−4)。したがって、miRNAの活性は、細胞周期の、例えば成長(G1およびG2)期中および合成(S1)期中の転写抑制と、細胞周期停止(G0)中の転写活性化との間で揺れる可能性がある。学説に縛られることなく、癌細胞は、不適切な時期にまたは不適切な頻度で細胞周期に入り細胞周期を終える。また、癌細胞は、BRCA1などのDNA修復タンパク質の機能的または適切なレベルの安全装置を有さずに、細胞周期をしばしば終える。非癌性の正常細胞は、BRCA1に結合したmiRNAが腫瘍抑制タンパク質の発現を上方制御するG0期の状態である可能性があるが、癌細胞は、miRNAがタンパク質発現を転写段階で抑制する成長期の状態にあることが最も多い。本発明は、少なくとも1つのmiRNAの活性または結合に影響を与える非コード領域および/またはコード領域におけるSNPの存在が、例えばBRCA1の上方制御を阻害する可能性があり、これが、正常細胞が細胞周期に入るのを誘導し、該細胞周期中で、さらなるmiRNAがBRCA1および/または他の腫瘍抑制遺伝子の発現をさらに抑制する可能性があると考える。
【0039】
一塩基多型(SNP)
一塩基多型(SNP)は、DNA配列変異であり、これは、ゲノム(または他の共有配列)中の一塩基が、種の構成員の間で(または個体における一組の染色体の間で)異なる場合に生じる。SNPは、遺伝子のコード配列内、遺伝子の非コード領域内または遺伝子の間の遺伝子間領域に含まれてもよい。遺伝子コードの縮重性のために、コード配列内のSNPは、産生されるタンパク質のアミノ酸配列を必ずしも変化させないだろう。同じポリペプチド配列をコードする新しいDNA配列をもたらすSNP変異は、シノニマス(synonymous)と名付けられる(サイレント変異とも称される。)。反対に、異なるポリペプチド配列をコードする新しいDNA配列をもたらすSNP変異は、非シノニマス(non−synonymous)と名付けられる。タンパク質コード領域に存在しないSNPは、それでもやはり、遺伝子スプライシング、転写因子結合または非コードRNAの配列に影響を与える可能性がある。
【0040】
本発明の方法に関して、非コードRNA領域は、miRNA分子に相補的であり他の調節因子との相互作用に必要とされる調節配列を含むので、それらの領域内に生じるSNPは特に重要である。ゲノム配列内に生じるSNPは、分解または翻訳サイレンシングのためのmiRNA分子によって標的とされるmRNA転写産物に転写される。ゲノム配列または遺伝子のmRNAの3’非翻訳領域(UTR)内に生じるSNPは、本発明の方法に特に重要である。
【0041】
BRCA1
BRCA1(若年性乳癌1(BReast CAncer 1,early onset))は、ヒト腫瘍抑制遺伝子である。BRCA1は、乳癌に最もよく関連するが、BRCA1遺伝子は、体のあらゆる細胞において存在している。腫瘍抑制遺伝子として、BRCA1は、細胞増殖をネガティブに調節し、損傷DNAを修復することによってまたはDNAがあまりにも損傷しているために修復できない細胞に関する細胞の自滅プログラムを開始することによって、変異が導入されることを防ぐ。
【0042】
BRCA1のような腫瘍抑制遺伝子が変異または誤調節され、次いでその機能が阻害される場合、細胞は、不完全に複製されたDNAで増殖が進む可能性がある。また、細胞は、あまりにも頻繁に細胞周期に入る可能性がある。このような状況において、腫瘍は形成する。良性腫瘍とは対照的な癌性腫瘍は、隣接組織の制御されない増殖、浸潤および破壊、ならびにリンパ液または血液を介した体内の他の部位への転移を示す。
【0043】
具体的には、相同的組換え、すなわち、相同的で無傷のヌクレオチド配列が、2本の類似または同一DNA鎖(例えば、姉妹染色分体、相同染色体または(細胞周期の段階に依存する)鋳型である同じ染色体に由来する配列)の間で交換される過程によって、BRCA1は、DNAにおける二本鎖の損傷を修復する。しかしながら、BRCA1タンパク質は、単独で機能しない。BRCA1は、他の腫瘍抑制タンパク質、DNA損傷センサーおよびシグナル伝達物質と結合して、BRCA1結合ゲノムサーベイランス(surveillance)複合体(BASC)として知られる大きな多サブユニットタンパク質複合体を形成する。
【0044】
BRCA1タンパク質は複合体を形成して、細胞機能を実行することができるという事実にもかかわらず、BRCA1遺伝子における変異は、細胞修復プログラムおよび細胞増殖プログラムの規制を撤廃するのに十分である。重要なことに、本発明は、一塩基多型(SNP)、ハプロタイプ、1つ以上のmiRNAがBRCA1遺伝子のコード領域もしくは非コード領域に結合する機能を抑制または阻害するSNPを同定するための方法、および、本明細書において記載される少なくとも1つの多型を検出することによって癌を発症するリスクの増加を予測するための方法を提供する。
【0045】
本発明は、BRCA1内のSNPを同定または特性評価するための方法を提供する。学説に縛られることなく、本明細書において開示されるSNP、および本明細書において開示される方法を使用して同定されたSNPは、miRNA結合部位内で生じるか、またはそうでなければmiRNA活性に影響を与え、1つ以上のmiRNAとBRCA1との間の「より強固な」miRNA相互作用もしくは結合を引き起こすか、または「より弱い」miRNA相互作用もしくはこれらの相互作用の喪失を引き起こす場合もあると考えられる。3’UTRにおけるこれらのmiRNAの結合効力または結合活性の増加は、BRCA1の転写の減少をもたらし、全体的には、細胞におけるBRCA1タンパク質のより低いレベルをもたらす。エクソン内で結合を失う可能性もまた、BRCA1のより低いレベルをもたらす可能性がある。したがって、本明細書において同定されるSNPは、BRCA1腫瘍抑制遺伝子を抑制し、細胞修復メカニズムおよび細胞増殖メカニズムがBRCA1による監視なしで進行することを可能にする。上記のように、制御されない細胞増殖は、癌を発症するリスクの増加をもたらす。
【0046】
典型的なBRCA1遺伝子およびBRCA1転写産物は、以下に提供される。(NCBIアクセッション番号によって提供される)すべてのGenBankの記録は、参照により本明細書に組み込まれる。
【0047】
転写産物変異体1であるヒトBRCA1は、NCBIアクセッション番号NM_007294および配列番号11の核酸配列によってコードされる。
【0048】
【化1−1】
【0049】
【化1−2】
【0050】
【化1−3】
転写産物変異体2であるヒトBRCA1は、NCBIアクセッション番号NM_007300および配列番号12の核酸配列によってコードされる。
【0051】
【化2−1】
【0052】
【化2−2】
【0053】
【化2−3】
転写産物変異体3であるヒトBRCA1は、NCBIアクセッション番号NM_007297および配列番号13の核酸配列によってコードされる。
【0054】
【化3−1】
【0055】
【化3−2】
【0056】
【化3−3】
転写産物変異体4であるヒトBRCA1は、NCBIアクセッション番号NM_007298および配列番号14の核酸配列によってコードされる。
【0057】
【化4−1】
【0058】
【化4−2】
転写産物変異体5であるヒトBRCA1は、NCBIアクセッション番号NM_007299および配列番号15の核酸配列によってコードされる。
【0059】
【化5−1】
【0060】
【化5−2】
転写産物変異体6であるヒトBRCA1は、NCBIアクセッション番号NR_027676および配列番号16の核酸配列によってコードされる。
【0061】
【化6−1】
【0062】
【化6−2】
【0063】
【化6−3】
BRCA1:miRNA相互作用
著しく過剰発現したmiRNAは、腫瘍抑制遺伝子をネガティブに調節することによって腫瘍成長を促進する癌遺伝子として示唆されている。腫瘍抑制遺伝子として、BRCA1の機能の1つは、1つ以上のmiRNAの発現を抑制している可能性がある。例えば、miR−7は、BRCA1によって抑制され、BRCA1が欠損した細胞において過剰発現している(表1)。図20は、乳癌において、具体的にはトリプルネガティブ(TN)サブタイプ内でmiR−7が高発現していることをさらに明示している。本明細書において提供される研究は、TN乳癌を発症する患者が、rs1060915 SNPを含む珍しいハプロタイプをしばしば保有することを明示している。したがって、このSNPの存在は、miR−7がBRCA1に結合することを妨げる(図21)。
【0064】
miR−7は、乳癌から守ってくれる可能性がある。miRNAが遺伝子発現を抑制するという概念に対して、メカニズムは直観的に反しているようだが、miR−7結合部位が無傷でありmiR−7がBRCA1に結合する場合に、BRCA1の発現はより高くなり、したがって、BRCA1を含む細胞は、より機能的なタンパク質を含む。エクソン内におけるmiRNA結合は、このような効果を有すると報告されている。rs1060915 SNPがBRCA1において存在する場合、miR−7は結合することを阻害され、BRCA1の発現レベルは下がり、そしてその結果として、細胞が有する機能的なタンパク質は少ない。したがって、発現のrs1060915調節エレメントは、BRCA1遺伝子内に含まれる(図18AからB)。
【0065】
利用可能または機能的なBRCA1タンパク質が少なければ、DNA合成エラーおよび制御されない増殖から細胞を保護するDNA修復経路が害される。したがって、癌を発症するリスクが増加する。
【0066】
【表1】
miR−7は、BRCA1によって抑制されている。
野生型BRCA1または対照ベクターのいずれかでHCC1937細胞をトランスフェクションした後、細胞mRNAの発現レベルを分析した。
BRCA1を欠損している細胞において、リストに記載されたmiRNAのすべてをより高いレベルで発現させた。
【0067】
単離された核酸分子
本発明は、1つ以上のSNPを含む単離された核酸分子を提供する。本明細書において開示される1つ以上のSNPを含む単離された核酸分子は、本文を通して相互変換可能に、「SNP含有核酸分子」と称してもよい。単離された核酸分子は、場合により全長改変タンパク質またはその断片をコードし得る。本発明の単離された核酸分子はまた、(「SNP検出試薬」と題された以下の節により詳細に記載される)プローブおよびプライマーを含み、これらは、開示されたSNP、および単離された全長遺伝子、転写産物、cDNA分子、ならびにそれらの断片をアッセイするために使用され得、これらは、コードされたタンパク質を発現させる目的で使用され得る。
【0068】
本明細書において使用される場合、「単離された核酸分子」は、一般的に、本発明のSNPを含む核酸分子、またはこのような分子(例えば、相補的配列を有する核酸)にハイブリダイズする核酸分子を含み、そして、核酸分子の天然供給源に存在するほとんどの他の核酸から分離される。さらに、「単離された」核酸分子(例えば、本発明のSNPを含むcDNA分子)は、他の細胞物質、または組換え技術によって産生される場合、培養培地、または化学合成される場合、化学的前駆物質もしくは他の化学物質を、実質的に含み得ない。核酸分子は、他のコード配列または調節配列に融合され得、それでもなお、「単離された」と考えられ得る。非ヒトトランスジェニック動物に存在する核酸分子は、動物には、天然には存在しないが、これも「単離された」と考えられる。例えば、ベクター中に含まれる組換えDNA分子は、「単離された」と考えられる。「単離された」DNA分子のさらなる例としては、異種宿主細胞内で維持される組換えDNA分子、および溶液中の(部分的に、または実質的に)精製されたDNA分子が挙げられる。単離されたRNA分子はとしては、本発明の単離されたSNP含有DNA分子のインビボRNA転写産物またはインビトロRNA転写産物が挙げられる。本発明に従う単離された核酸分子としては、さらに、合成により生成されたこのような分子が挙げられる。
【0069】
一般的に、単離されたSNP含有核酸分子は、本発明によって開示される1つ以上のSNP位置を含み、それらのSNP位置の両側の隣接ヌクレオチド配列を有する。隣接配列は、上記SNP部位と天然で結合しているヌクレオチド残基および/または非相同ヌクレオチド配列を含み得る。好ましくは、上記隣接配列は、特に上記SNP含有核酸分子が、タンパク質またはタンパク質断片を産生するために使用される場合、SNP位置の両側の約500ヌクレオチド、約300ヌクレオチド、約100ヌクレオチド、約60ヌクレオチド、約50ヌクレオチド、約30ヌクレオチド、約25ヌクレオチド、約20ヌクレオチド、約15ヌクレオチド、約10ヌクレオチド、約8ヌクレオチドまたは約4ヌクレオチド(もしくはこれらの間の任意の他の長さ)、あるいは全長遺伝子、全タンパク質コード配列もしくは非コード配列(または、エクソン、イントロンまたは5’もしくは3’非翻訳領域のようなその任意の一部分)までである。
【0070】
全長遺伝子および全タンパク質コード配列について、SNP隣接配列は、例えば、SNPの両側の約5KB、約4KB、約3KB、約2KBまたは約1KBまでである。さらに、この場合には、単離された核酸分子は、エクソンの配列を含む(タンパク質をコードするエクソン配列および/または非コードエクソン配列を含む)が、イントロンの配列および非翻訳調節配列も含み得る。したがって、任意のタンパク質コード配列は、隣接しているか、またはイントロンによって分離され得る。重要な点は、核酸が、遠く離れかつ重要ではない隣接配列から単離され、そして適切な長さであり、その結果、特定の処置または組換えタンパク質の発現、SNP位置をアッセイするためのプローブおよびプライマーの調製、およびSNP含有核酸配列特異的な他の用途のような本明細書において所望される用途に供され得る。
【0071】
単離されたSNP含有核酸分子は、例えば、ゲノムDNAから単離された遺伝子(例えば、クローニングまたはPCR増幅による)、cDNA分子、またはmRNA転写分子のような全長遺伝子または転写産物を含み得る。さらに、本明細書において開示される1つ以上のSNPを含むこのような全長遺伝子および転写産物の断片もまた、本発明に包含される。
【0072】
したがって、本発明はまた、核酸配列およびその相補体の断片も含む。断片は典型的に、少なくとも約8以上のヌクレオチド、より好ましくは少なくとも約10以上のヌクレオチド、そしてさらにより好ましくは、少なくとも約16以上のヌクレオチチドの隣接したヌクレオチド配列を含む。さらに、断片は、少なくとも約18ヌクレオチド、約20ヌクレオチド、約21ヌクレオチド、約22ヌクレオチド、約25ヌクレオチド、約30ヌクレオチド、約40ヌクレオチド、約50ヌクレオチド、約60ヌクレオチド、約100ヌクレオチド、約250ヌクレオチド、または約500ヌクレオチド(またはこれらの間のあらゆる他の数)の長さを含み得る。断片の長さは、意図される用途に基づく。このような断片は、ポリヌクレオチドプローブの合成用のヌクレオチド配列(例えば、限定されないが、配列番号11から16)を使用して単離され得る。次いで、例えば、cDNAライブラリー、ゲノムDNAライブラリー、またはmRNAをスクリーニングするのに標識されたプローブを使用して、目的の領域に対応する核酸を単離し得る。さらに、プライマーが、1つ以上のSNP部位をアッセイする目的で、または遺伝子の特定領域をクローニングするために、増幅反応において使用され得る。
【0073】
本発明の単離された核酸分子はさらに、核酸サンプル中の目的のポリヌクレオチドのコピー数を増加するために使用される種々の核酸増幅方法のうちの1つの産物である、SNP含有ポリヌクレオチドをさらに含む。このような増幅方法は、当該分野において周知であり、そしてこれらとしては、ポリメラーゼ連鎖反応(PCR)(米国特許第4,683,195号;および米国特許第4,683,202号;PCR Technology:Principles and Applications for DNA Amplification,ed.H.A.Erlich,Freeman Press,NY,N.Y.,1992)、リガーゼ連鎖反応(LCR)(Wu およびWallace,Genomics 4:560,1989;Landegrenら、Science 241:1077,1988)、鎖置換増幅(SDA)(米国特許第5,270,184号;および米国特許第5,422,252号)、転写媒介性増幅(TMA)(米国特許出願第5,399,491号)、連鎖直線増幅(linked linear amplification)(LLA)(米国特許第6,027,923号)など、ならびに等温増幅方法、例えば、核酸配列ベースの増幅(NASBA)ならびに自己維持配列複製(self−sustained sequence replication)(Guatelliら、Proc.Natl.Acad.Sci.USA 87:1874,1990)が挙げられるがこれらに限定されない。このような方法論に基づいて、当業者は、本明細書において開示されるSNPの5’側および3’側の任意の適切な領域にプライマーを容易に設計し得る。このようなプライマーは、その配列中に目的のSNPを含む限り任意の長さのDNAを増幅するために使用され得る。
【0074】
本明細書において使用される場合、本発明の「増幅された核酸分子」は、SNP含有核酸分子であり、その量は、試験サンプル中のその開始量と比較した場合、インビトロで実施された任意の核酸増幅方法によって少なくとも2倍に増加している。他の好ましい実施形態では、増幅された核酸分子は、試験サンプル中のその開始量と比較した場合、少なくとも10倍、50倍、100倍、1,000倍、またはさらに10,000倍の増加の結果である。典型的なPCR増幅において、目的のポリヌクレオチドは、増幅していないゲノムDNAの少なくとも50,000倍の量を上回ってしばしば増幅されるが、アッセイのために必要とされる増幅の正確な量は、その後使用される検出方法の感度に依存する。
【0075】
一般的に、増幅されたポリヌクレオチドは、少なくとも約10ヌクレオチドの長さである。より典型的には、増幅されたポリヌクレオチドは、少なくとも約16ヌクレオチドの長さである。本発明の好ましい実施形態では、増幅されたポリヌクレオチドは、少なくとも約20ヌクレオチドの長さである。本発明のより好ましい実施形態では、増幅されたポリヌクレオチドは、少なくとも約21ヌクレオチド,約22ヌクレオチド,約23ヌクレオチド,約24ヌクレオチド,約25ヌクレオチド,約30ヌクレオチド,35ヌクレオチド、約40ヌクレオチド、約45ヌクレオチド、約50ヌクレオチド、または約60ヌクレオチドの長さである。本発明のさらに別の好ましい実施形態では、増幅されたポリヌクレオチドは、少なくとも約100ヌクレオチド、約200ヌクレオチドまたは約300ヌクレオチドの長さである。本発明の増幅されたポリヌクレオチドの全長は、目的のSNPが存在するエクソン、イントロン、5’UTR、3’UTRまたは遺伝子全体程度の長さであり得るが、増幅産物は、典型的には約1,000ヌクレオチド以下の長さである(しかし、特定の増幅方法は、1000ヌクレオチドの長さよりも長い増幅産物を生じ得る)。より好ましくは、増幅されたポリヌクレオチドは、約600ヌクレオチド以下の長さである。増幅されたポリヌクレオチドの長さに関わらず、目的のSNPは、その配列に沿って至る所に位置し得ることが理解される。
【0076】
このような産物は、その5’末端もしくは3’末端またはその両方に付加的な配列を有し得る。別の実施形態では、増幅産物は、約101ヌクレオチドの長さであり、そして本明細書において開示されるSNPを含む。好ましくは、そのSNPは、増幅産物の中央に位置する(例えば、201ヌクレオチドの長さである増幅産物において101位、または101ヌクレオチドの長さである増幅産物において51位)か、または増幅産物の中央から1ヌクレオチド、2ヌクレオチド、3ヌクレオチド、4ヌクレオチド、5ヌクレオチド、6ヌクレオチド、7ヌクレオチド、8ヌクレオチド、9ヌクレオチド、10ヌクレオチド、12ヌクレオチド、15ヌクレオチド、もしくは20ヌクレオチド以内に位置する(しかし、上に示したように、目的のSNPは、増幅産物の長さに沿って至る所に位置し得る)。
【0077】
本発明は、本明細書において開示される1つ以上のSNP、その相補体およびそのSNP含有断片を含む、1つ以上のポリヌクレオチド配列を含むか、このポリヌクレオチドからなるか、またはこのポリヌクレオチドから本質的に構成される単離された核酸分子を提供する。
【0078】
ヌクレオチド配列がこの核酸分子の全長ヌクレオチド配列である場合、核酸分子は、そのヌクレオチド配列からなる。
【0079】
核酸分子は、そのヌクレオチド配列が、最終の核酸分子において少数の付加的なヌクレオチド残基しか伴わずに存在する場合、そのようなヌクレオチド配列から本質的になる。
【0080】
ヌクレオチド配列がその核酸分子の最終のヌクレオチド配列の少なくとも一部である場合、核酸分子は、そのヌクレオチド配列を含む。このような様式において、その核酸分子は、ヌクレオチド配列のみであっても、付加的なヌクレオチド残基(例えば、天然にそれに関係する残基)を有しても、異種ヌクレオチド配列を有してもよい。このような核酸分子は、1個から少数の付加的なヌクレオチドを有しても、さらに多くの付加的なヌクレオチドを含んでもよい。種々の型のこれら核酸分子がどのようにして容易に作製され得、そして単離され得るのかの簡単な説明を、以下に提供する。そしてこのような技術は、当業者にとって周知である(SambrookおよびRussell,2000,Molecular Cloning:A Laboratory Manual,Cold Spring Harbor Press,NY)。
【0081】
単離された核酸分子としては、ペプチドのみをコードする配列を有する核酸分子、成熟ペプチドをコードする配列およびさらなるコード配列(例えば、リーダー配列または分泌配列(例えば、プレ−プロタンパク質配列またはプロタンパク質配列))を有する核酸分子、付加的なコード配列を有する成熟ペプチドをコードする配列または付加的なコード配列を有さない成熟ペプチドをコードする配列に加えて、付加的な非コード配列(例えば、転写、mRNAプロセッシング(スプライシングシグナルおよびポリアデニル化シグナルを含む)、リボソーム結合、および/または、mRNAの安定性において一定の役割を果たす、転写されるが翻訳されない配列のような、例えば、イントロンおよび非コード5’配列および非コード3’配列)、が挙げられるが、これらに限定されない。さらに、核酸分子は、例えば、精製を容易にするペプチドをコードする異種マーカー配列へ融合され得る。
【0082】
単離された核酸分子は、mRNAのようなRNAの形態、またはcDNAおよびゲノムDNAを含むDNA形態であり得、例えば、分子クローニングによって得られ得るかまたは化学合成技術による産生またはその組み合わせにより産生され得る(SambrookおよびRussell,2000,Molecular Cloning:A Laboratory Manual,Cold Spring Harbor Press,NY)。さらに、単離された核酸分子(特にプローブおよびプライマーのようなSNP検出試薬)はまた、部分的または全体的に、ペプチド核酸(PNA)のような1つ以上の型の核酸アナログ形態(米国特許第5,539,082号;米国特許第5,527,675号;米国特許第5,623,049号;米国特許第5,714,331号)であり得る。核酸、特にDNAは、二本鎖であってもまたは一本鎖であってもよい。一本鎖核酸は、コード鎖(センス鎖)または相補的非コード鎖(アンチセンス鎖)であり得る。DNAセグメント、RNAセグメント、またはPNAセグメントは、例えば、ヒトゲノムの断片(DNAまたはRNAの場合)、または単一のヌクレオチド、短いオリゴヌクレオチドリンカーから、あるいは一連のオリゴヌクレオチドから構築され、合成核酸分子を提供し得る。核酸分子は、参考として本明細書において提供される配列を使用して容易に合成され得、オリゴヌクレオチドおよびPNAオリゴマーの合成技術は、当該分野で周知である(例えば、Corey,“Peptide nucleic acids:expanding the scope of nucleic acid recognition”,Trends Biotechnol.1997 June;15(6):224−9,およびHyrupら、“Peptide nucleic acids(PNA):synthesis,properties and potential applications”,Bioorg Med Chem.1996 January;4(1):5−23参照)。さらに、大規模な自動化オリゴヌクレオチド/PNA合成(アレイまたはビーズ表面または他の固体支持体上での合成を含む)が、市販の核酸合成機(例えば、Applied Biosystems(Foster City,Calif.)3900 High−Throughput DNA SynthesizerまたはExpedite 8909 Nucleic Acid Synthesis System)、および本明細書において提供される配列情報を使用して容易に達成され得る。
【0083】
本発明は、当該分野で公知の改変されたヌクレオチド、合成ヌクレオチド、もしくは天然に生じないヌクレオチド、または改変された構造エレメント、合成の構造エレメント、もしくは天然に生じない構造エレメント、または他の代替的な/改変された核酸化学を含む、核酸アナログを含む。このような核酸アナログは、例えば、配列番号21、26および27において同定される1つ以上のSNPを検出するための検出試薬(例えば、プライマー/プローブ)として有用である。さらに、これらアナログを含むキット/システム(例えば、ビーズ、アレイなど)もまた、本発明に含まれる。例えば、具体的には、本発明の多型配列に基づくPNAオリゴマーが企図される。PNAオリゴマーは、DNAのアナログであり、そのリン酸骨格は、ペプチド様骨格で置換されている(Lagriffoulら、Bioorganic&Medicinal Chemistry Letters,4:1081−1082(1994),Petersenら、Bioorganic&Medicinal Chemistry Letters,6:793−796(1996),Kumarら、Organic Letters 3(9):1269−1272(2001),WO96/04000)。PNAは、従来のオリゴヌクレオチドおよびオリゴヌクレオチドアナログよりも、高い親和性および特異性で、相補的なRNAまたはDNAとハイブリダイズする。このPNAの特性は、従来のオリゴヌクレオチドおよびペプチドを用いては達成し得ない新規な分子生物学および生化学の用途を可能とする。
【0084】
核酸の結合特性および/または安定性を改善する核酸改変のさらなる例は、イノシンのような塩基アナログ、インターカレーター(米国特許第4,835,263号)および副溝の結合体(米国特許第5,801,115号)の使用を含む。したがって、核酸分子、SNP含有核酸分子、SNP検出試薬(例えば、プローブおよびプライマー)、オリゴヌクレオチド/ポリヌクレオチドに対する本明細書における言及は、PNAオリゴマーおよび他の核酸アナログを含む。当該分野で公知の核酸アナログおよび選択的核酸化学/改変核酸化学の他の例は、Current Protocols in Nucleic Acid Chemistry,John Wiley&Sons,N.Y.(2002)に記載される。
【0085】
さらに、天然に存在する対立遺伝子変異型(ならびにオルソログおよびパラログ)ならびに変異誘発技術によって産生される合成変異体のような、核酸分子の変異体(例えば、限定されないが、配列番号11から16として同定されたもの)は、当該分野において周知の方法を使用して同定および/または産生され得る。さらにこのような変異体は、配列番号11から16として開示される核酸配列(またはその断片)と少なくとも、70%から80%、80%から85%、85%から90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%の配列同一性を共有し、かつ新規SNP対立遺伝子を含む、ヌクレオチド配列を含み得る。したがって、本発明は、配列番号11から16の配列と比較した場合ある程度の配列変異を有するが、新規SNP対立遺伝子を含む、単離された核酸分子を具体的に企図する。
【0086】
2つの配列間の配列の比較および同一性のパーセントの決定は、数学的アルゴリズムを用いて達成され得る。(Computational Molecular Biology,Lesk,A.M.,ed.,Oxford University Press,New York,1988;Biocomputing:Informatics and Genome Projects,Smith,D.W.,ed.,Academic Press,New York,1993;Computer Analysis of Sequence Data,Part 1,Griffin,A.M.,およびGriffin,H.G.,eds.,Humana Press,New Jersey,1994;Sequence Analysis in Molecular Biology,von Heinje,G.,Academic Press,1987;およびSequence Analysis Primer,Gribskov,M.およびDevereux,J.,eds.,M Stockton Press,New York,1991)。好ましい実施形態では、2つのアミノ酸配列間の同一性のパーセントは、Blossom 62マトリックスまたはPAM250マトリックスのいずれか、ギャップウェート(gap weight)16、14、12、10、8、6または4、長さウェート(length weight)1、2、3、4、5または6)を使用して、NeedlemanおよびWunschのアルゴリズム(J.Mol.Biol.(48):444−453(1970))を用いて決定され、これは、GCGソフトウェアパッケージ内のGAPプログラムへ組み込まれている。
【0087】
さらに別の好ましい実施形態では、2つのヌクレオチド配列間の同一性のパーセントは、NWSgapdna.CMPマトリックスならびにギャップウェート(40、50、60、70、または80)および長さウェート(1、2、3、4、5、または6)を使用してGCGソフトウェアパッケージ内のGAPプログラム(Devereux,J.ら、Nucleic Acids Res.12(1):387(1984))を用いて決定される。別の実施形態では、2つのアミノ酸配列または2つのヌクレオチド配列の間の同一性のパーセントは、PAM120ウェート残基表、ギャップ長ペナルティー12およびギャップペナルティー4を用いて、ALIGNプログラム(バージョン2.0)へ組み込まれているE.MyersおよびW.Millerのアルゴリズム(CABIOS,4:11−17(1989))を使用して決定される。
【0088】
本発明のヌクレオチド配列およびアミノ酸配列は、さらに「照会配列」として使用され、例えば、他のファミリーメンバーまたは関連配列を同定するために、配列データベースに対して検索を実施し得る。このような検索は、Altschulら、(J.Mol.Biol.215:403−10(1990))のNBLASTプログラムおよびXBLASTプログラム(バージョン2.0)を使用して実施し得る。BLASTヌクレオチド検索は、NBLASTプログラム(スコア=100、ワード長(wordlength)=12)を用いて実施し、本発明の核酸分子に相同なヌクレオチド配列を得ることが可能である。BLASTのタンパク質検索は、XBLASTプログラム(スコア=50、ワード長=3)を用いて実施し、本発明のタンパク質に相同なアミノ酸配列を得ることが可能である。比較目的のためにギャップを入れたアライメントを得るために、Gapped BLASTが、Altschulら、(Nucleic Acids Res.25(17):3389−3402(1997))に記載されるように利用され得る。BLASTおよびgapped BLASTプログラムを利用した場合、それぞれのプログラム(例えば、XBLASTおよびNBLAST)のデフォルトパラメーターが、使用され得る。BLASTに加えて、当該分野で使用される他の検索プログラムおよび配列比較プログラムの例としては、FASTA(Pearson,Methods Mol.Biol.25,365−389(1994))およびKERR(Dufresneら、Nat Biotechnol 2002 December;20(12):1269−71)が挙げられるが、これらに限定されない。生命情報科学技術に関するさらなる情報については、Current Protocols in Bioinformatics,John Wiley&Sons,Inc.,N.Y.参照。
【0089】
SNP検出試薬
本発明の具体的な形態では、本明細書において開示される配列は、SNP検出試薬の設計のために使用され得る。好ましい実施形態では、配列番号11から16の配列が、SNP検出試薬の設計のために使用される。本明細書において使用される場合、「SNP検出試薬」は、本明細書において開示される特定の標的SNP位置を特異的に検出し、好ましくは、標的SNP位置の特定のヌクレオチド(対立遺伝子)に対して特異的である(すなわち、検出試薬は、好ましくは、標的SNP位置にある異なる選択的ヌクレオチドを区別し得、これによって標的SNP位置に存在するヌクレオチドの正体を決定することを可能とする)。典型的に、このような検出試薬は、標的SNP含有核酸分子に対して配列特異的な様式の相補的な塩基対合によってハイブリダイズし、試験サンプル中において当該分野で公知の形態のような他の核酸配列から標的変異体の配列を区別する。好ましい実施形態では、このようなプローブは、同一の標的SNP位置において異なるヌクレオチドを有する他の核酸から標的SNP位置で特定のヌクレオチド(対立遺伝子)を有する核酸を区別し得る。さらに、検出試薬は、SNP位置に対して5’側および/または3’側にある特定の領域、特に3’UTRに対応する領域にハイブリダイズし得る。検出試薬の別の例は、標的ポリヌクレオチドの相補鎖に沿うヌクレオチドの伸長の開始点として作用するプライマーである。本明細書において提供されるSNP配列の情報はまた、本発明の任意のSNPを(例えば、PCRを使用して)増幅するためのプライマー(例えば、対立遺伝子特異的プライマー)を設計するためにも有用である。
【0090】
本発明の好ましい一実施形態では、SNP検出試薬は、単離もしくは合成されたDNAまたはRNAのポリヌクレオチドプローブ、またはプライマー、またはPNAオリゴマー、またはDNA、RNAおよび/もしくはPNAの組み合わせであり、LCS内に位置するSNPを含む標的核酸分子のセグメントに対してハイブリダイズする。ポリヌクレオチドの形態の検出試薬は場合により、改変塩基アナログ、インターカレート剤、または副溝の結合体を含み得る。プローブのような複数の検出試薬は、SNP検出キットを形成するために、例えば、固体支持体(例えば、アレイもしくはビーズ)に付着させられるか、または溶液中にて供給され得る(例えば、PCR、RT−PCR、TaqManアッセイ、もしくはプライマー伸長反応のような酵素反応のためのプローブ/プライマーセット)。
【0091】
プローブまたはプライマーは、典型的には、精製されたオリゴヌクレオチドまたはPNAオリゴマーである。このようなオリゴヌクレオチドは、典型的に、ストリンジェントな条件下で、標的核酸分子における少なくとも約8個、約10個、約12個、約16個、約18個、約20個、約21個、約22個、約25個、約30個、約40個、約50個、約60個、約100個(またはこれらの間のあらゆる他の数)のまたはこれ以上の連続するヌクレオチドに対してハイブリダイズする、相補的なヌクレオチド配列の領域を含む。特定のアッセイに依存して、その連続するヌクレオチドは、標的SNP位置を含み得るか、あるいは所望されるアッセイを実施するためにSNP位置に十分に近い、5’側および/または3’側の特定の領域であり得るかのいずれかである。
【0092】
このようなプライマーおよびプローブが、本発明のSNPの遺伝子型決定のための試薬として直接的に有用であり、任意のキット/システム形態へ組込まれ得ることは、当業者に明らかになるであろう。
【0093】
標的SNP含有配列に特異的なプローブまたはプライマーを作製するために、目的のSNP周辺の遺伝子配列/転写産物配列および/またはコンテキスト配列が典型的には、そのヌクレオチド配列の5’末端または3’末端において開始する、コンピュータアルゴリズムを使用して調べられる。次いで典型的なアルゴリズムは、その遺伝子配列/SNPコンテキスト配列に特有である、規定された長さのオリゴマーを同定し、このオリゴマーは、ハイブリダイゼーションのために適切な範囲内のGC含量を有し、ハイブリダイゼーションを妨げ得る推定二次構造を有さず、そして/または所望される他の特性を保有するか、あるいは、所望されない他の特質を欠く。
【0094】
本発明のプライマーまたはプローブは、典型的には、少なくとも約8ヌクレオチドの長さである。本発明の一実施形態では、プライマーまたはプローブは、少なくとも約10ヌクレオチドの長さである。好ましい実施形態では、プライマーまたはプローブは、少なくとも約12ヌクレオチドの長さである。より好ましい実施形態では、プライマーまたはプローブは、少なくとも約16ヌクレオチド、少なくとも約17ヌクレオチド、少なくとも約18ヌクレオチド、少なくとも約19ヌクレオチド、少なくとも約20ヌクレオチド、少なくとも約21ヌクレオチド、少なくとも約22ヌクレオチド、少なくとも約23ヌクレオチド、少なくとも約24ヌクレオチド、または少なくとも約25ヌクレオチドの長さである。プローブの最大長は、そのプローブが使用されるアッセイの型に依存して、検出される標的配列と同じ程度までの長さであり得るが、典型的には、約50ヌクレオチド未満、約60ヌクレオチド未満、約65ヌクレオチド未満、または約70ヌクレオチド未満の長さである。プライマーの場合には、その最大長は、典型的には、約30ヌクレオチド未満の長さである。本発明の具体的な好ましい実施形態では、プライマーまたはプローブは、約18ヌクレオチドから約28ヌクレオチドの長さの範囲内にある。しかし、他の実施形態(例えば、核酸アレイ、およびプローブが基材に付着する他の実施形態)において、上記プローブは、より長い(例えば、30から70ヌクレオチド、75ヌクレオチド、80ヌクレオチド、90ヌクレオチド、100ヌクレオチド以上の長さ)ものであり得る(以下の「SNP検出キットおよびシステム」と題する節参照)。
【0095】
SNPを解析するために、選択的SNP対立遺伝子に特異的なオリゴヌクレオチドを使用することが、適切であり得る。標的配列における単一ヌクレオチド変化を検出するそのようなオリゴヌクレオチドは、「対立遺伝子特異的オリゴヌクレオチド」、「対立遺伝子特異的プローブ」または「対立遺伝子特異的プライマー」のような用語によって呼ばれ得る。多型を解析するための対立遺伝子特異的プローブの設計および使用は、例えば、Mutation Detection A Practical Approach,ed.Cottonら、Oxford University Press,1998;Saikiら、Nature 324,163−166(1986);Dattagupta,EP235,726;およびSaiki,WO89/11548に記載される。
【0096】
各々の対立遺伝子特異的プライマーまたは対立遺伝子特異的プローブの設計は、変数(例えば、標的核酸分子中のSNP位置に隣接するヌクレオチド配列の正確な組成、ならびにそのプライマーまたはプローブの長さ)に依存するが、プライマーおよびプローブの使用における別の要因は、そのプローブまたはプライマーと、標的配列との間のハイブリダイゼーションが実施される条件のストリンジェンシーである。より高いストリンジェンシー条件は、より低いイオン強度および/またはより高い反応温度の緩衝液を利用し、そして安定な二重鎖を形成するためには、プローブ/プライマーと標的配列との間のより完全な一致を必要とする傾向がある。しかし、そのストリンジェンシーが高すぎる場合、ハイブリダイゼーションは、全く生じない場合がある。対照的に、より低いストリンジェンシー条件は、より高いイオン強度および/またはより低い反応温度の緩衝液を利用し、そしてプローブ/プライマーと標的配列との間のよりミスマッチした塩基による安定な二重鎖の形成を可能にする。例としてであって限定としてではないが、対立遺伝子特異的プローブを使用する高ストリンジェンシーハイブリダイゼーション条件についての例示的な条件は、以下の通りである:5倍標準的生理食塩水リン酸EDTA(SSPE)、0.5%NaDodSO.sub.4(SDS)を含む溶液を用いる55℃でのプレハイブリダイゼーション;同じ溶液中にある標的核酸分子とともに同じ温度でプローブをインキュベートすること、その後、2倍SSPEおよび0.1%SDSを含む溶液を用いて55℃または室温で洗浄すること。
【0097】
中程度のストリンジェンシーのハイブリダイゼーション条件が、例えば、約50mM KClを含む溶液を用いて、約46℃にて、対立遺伝子特異的プライマー伸長反応のために使用され得る。あるいは、上記反応は、高温(例えば、60℃)にて実行され得る。別の実施形態では、オリゴヌクレオチド連結アッセイ(OLA)反応(この反応において、2つのプローブが標的配列と完全に相補的な場合に、これら2つのプローブが連結される)のために適切な中程度にストリンジェントなハイブリダイゼーション条件は、約100mM KClの溶液を、温度46℃にて利用し得る。
【0098】
ハイブリダイゼーションベースのアッセイにおいて、ある個体由来の標的DNAのセグメントにハイブリダイズするが、別の個体由来の対応するセグメントには、その2つの個体由来の個々のDNAセグメントにおける異なる多型形態(例えば、選択的SNP対立遺伝子/ヌクレオチド)の存在に起因してハイブリダイズしない、対立遺伝子特異的プローブが、設計され得る。ハイブリダイゼーション条件は、対立遺伝子間のハイブリダイゼーション強度における検出可能な有意な差異が存在し、好ましくは、本質的には二元の応答が存在し、それによって、プローブが対立遺伝子のうちの一方のみにハイブリダイズするかまたは一方の対立遺伝子に対して有意により強くハイブリダイズするのに充分に、ストリンジェントであるべきである。プローブは、SNP部位を含む標的配列にハイブリダイズしてそのSNP部位がそのプローブの配列に沿ったどこかに整列するように設計され得るが、そのプローブは、好ましくは、標的配列のセグメントにハイブリダイズして、そのSNP部位が、そのプローブの中心位置(例えば、そのプローブのいずれかの末端から少なくとも3ヌクレオチド離れているそのプローブ内の位置)と整列するように設計される。このプローブ設計は、一般的には、異なる対立遺伝子形態間でのハイブリダイゼーションにおける良好な識別を達成する。
【0099】
別の実施形態では、プローブまたはプライマーは、標的DNAのセグメントにハイブリダイズして、そのSNPがそのプローブまたはプライマーの最も5’側の末端または最も3’側の末端のいずれかと整列するように、設計され得る。オリゴヌクレオチド連結アッセイ(米国特許第4,988,617号)における使用のために特に適切な具体的な好ましい実施形態では、上記プローブの最も3’側のヌクレオチドは、その標的配列中のSNP位置と整列する。
【0100】
オリゴヌクレオチドプローブおよびオリゴヌクレオチドプライマーは、当該分野で周知の方法によって調製され得る。化学合成方法としては、Narangら、1979,Methods in Enzymology 68:90により記載されるホスホトリエステル法;Brownら、1979,Methods in Enzymology 68:109により記載されるホスホジエステル法;Beaucageら、1981,Tetrahedron Letters 22:1859により記載されるジエチルホスホアミデート法;および米国特許第4,458,066号に記載される固体支持体法が挙げられるが、これらに限定されない。
【0101】
対立遺伝子特異的プローブは、しばしば、対の状態で(または、より一般的ではないが、3個または4個の組の状態で(例えば、SNP位置がそれぞれ3個または4個の対立遺伝子を有することが公知である場合、あるいは、標的SNP対立遺伝子の核酸分子の両方の鎖をアッセイするために))使用され、そのような対は、そのSNP位置で対立遺伝子変異型を示す1ヌクレオチドミスマッチ以外は同一であり得る。
一般的に、1つの対のうちの一方のメンバーは、より一般的なSNP対立遺伝子(すなわち、標的集団中においてより頻繁である対立遺伝子)を有する標的配列参照形態と完全に一致し、その対のうちのもう一方のメンバーは、より一般的ではないSNP対立遺伝子(すなわち、その標的集団において稀な対立遺伝子)を有する標的配列形態と完全に一致する。アレイの場合には、複数のプローブ対が、複数の異なる多型を同時に解析するために同じ支持体上に固定され得る。
【0102】
ある型のPCRベースのアッセイにおいて、対立遺伝子特異的プライマーは、SNP位置と重複し、そのプライマーが完全相補性を示す対立遺伝子形態の増幅のみをプライミングする、標的核酸分子上の領域にハイブリダイズする(Gibbs,1989,Nucleic Acid Res.17 2427−2448)。典型的には、それらのプライマーの最も3’側のヌクレオチドは、その標的核酸分子のSNP位置と整列し、かつそのSNP位置と相補的である。このプライマーは、遠位部位にてハイブリダイズする第2のプライマーと整列の結合に使用される。増幅は、これらの2つのプライマーから進行し、どの対立遺伝子形態が試験サンプル中に存在するかを示す検出可能な産物を生じる。コントロールが、通常、第2のプライマー対を用いて実施される。この第2のプライマー対のうちの一方は、その多型部位で一塩基ミスマッチを示し、この第2のプライマー対のうちのもう一方は、遠位部位に対して完全相補性を示す。この一塩基ミスマッチは、増幅を防止するかまたは増幅効率を実質的に減少させ、その結果、検出可能な産物が形成されないか、または検出可能な産物がより低量もしくはより低速度で形成される。上記の方法は、一般的には、そのミスマッチがそのオリゴヌクレオチドの最も3’側の位置にある(すなわち、そのオリゴヌクレオチドの最も3’側の位置が、標的SNP位置と整列する)場合に、最も効率的に作用する。なぜなら、この位置は、上記プライマーからの伸長に対して最も不安定であるからである(例えば、WO93/22456参照)。このPCRベースのアッセイは、下記のTaqManアッセイの一部として利用され得る。
【0103】
本発明の具体的実施形態では、本発明のプライマーは、標的SNPを含む核酸分子のセグメントに対して実質的に相補的な配列を含み、但し、そのプライマーは、そのプライマーの最も3’側の末端にある3つのヌクレオチド位置のうちの1つにおいてミスマッチヌクレオチドを有し、その結果、そのミスマッチヌクレオチドは、そのSNP部位において特定の対立遺伝子と塩基対形成しない。好ましい実施形態では、上記プライマー中のミスマッチヌクレオチドは、そのプライマーの最も3’側の位置にある最後のヌクレオチドから2番目にある。より好ましい実施形態では、上記プライマー中のミスマッチヌクレオチドは、そのプライマーの最も3’側の位置にある最後のヌクレオチドである。
【0104】
本発明の別の実施形態では、本発明のSNP検出試薬は、検出可能なシグナルを発する蛍光発生レポーター色素で標識される。好ましいレポーター色素は、蛍光色素であるが、検出試薬(例えば、オリゴヌクレオチドプローブまたはオリゴヌクレオチドプライマー)に結合され得る任意のレポーター色素が、本発明における使用のために適切である。そのような色素としては、アクリジン、AMCA、BODIPY、カスケードブルー、Cy2、Cy3、Cy5、Cy7、ダブシル、エダンス、エオシン、エリスロシン、フルオレセイン、6−Fam、Tet、Joe、Hex、オレゴングリーン、ローダミン、Rhodol Green、Tamra、Rox、およびテキサスレッドが挙げられるが、これらに限定されない。
【0105】
本発明のなお別の実施形態では、その検出試薬は、特に、その試薬が自己クエンチングプローブ(例えば、TaqMan)(米国特許第5,210,015号および米国特許第5,538,848号)または分子ビーコンプローブ(米国特許第5,118,801号および米国特許第5,312,728号)または他のステムレスプローブもしくは直鎖状ビーコンプローブ(Livakら、1995,PCR Method Appl.4:357−362;Tyagiら、1996,Nature Biotechnology 14:303−308;Nazarenkoら、1997,Nucl.Acids Res.25:2516−2521;米国特許第5,866,336号および米国特許第6,117,635号)として使用される場合に、クエンチャー色素(例えば、Tamra)でさらに標識され得る。
【0106】
本発明の検出試薬はまた、他の標識(ストレプトアビジン結合のためのビオチン、抗体結合のためのハプテン、および別の相補的オリゴヌクレオチド(例えば、ジップコードの対)に結合するためのオリゴヌクレオチドが挙げられるが、これらに限定されない)を含み得る。
【0107】
本発明はまた、本明細書において同定されたSNPヌクレオチドを含まない(またはそのSNPヌクレオチドと相補的である)が、本明細書において開示される1つ以上のSNPをアッセイするために使用される、試薬も企図する。例えば、本明細書において提供される標的SNP位置に隣接はするが直接的にはハイブリダイズしないプライマーが、それらのプライマーが、その標的SNP位置と近接する(すなわち、その標的SNP部位から1ヌクレオチド以上の範囲内にある)領域にハイブリダイズするプライマー伸長反応において、有用である。そのプライマー伸長反応の間に、プライマーは、典型的には、特定のヌクレオチド(対立遺伝子)が標的SNP部位に存在する場合にはその標的SNP部位を過ぎては伸長できず、そのプライマー伸長産物は、どのSNP対立遺伝子がその標的SNP部位に存在するかを決定するために容易に検出され得る。例えば、特定のddNTPが、一旦ddNTPが上記伸長産物(その最も3’側の末端にddNTPを含み、そのddNTPが本明細書において開示されるSNPに対応する、プライマー伸長産物は、本発明により包含される組成物である)に組み込まれるとプライマー伸長を終結させるために、上記プライマー伸長反応において使用される。したがって、SNP部位に近接する領域中の核酸分子に結合する試薬は、結合した配列はそのSNP部位自体を必ずしも含まないけれども、これもまた本発明によって包含される。
【0108】
SNP検出キットおよびSNP検出システム
当業者は、本明細書において開示されるSNPおよび関連する配列情報に基づいて、検出試薬が、本発明の任意のSNPを個別にかまたは組み合わせてアッセイするために開発および使用され得、そのような検出試薬は、当該分野で周知である確立されたキット形態またはシステム形態のうちの1つに容易に組み込まれ得ることを、認識するであろう。用語「キット」および「システム」とは、本明細書においてSNP検出試薬の文脈で使用される場合、複数のSNP検出試薬の組み合わせ、または1つ以上の他の型のエレメントまたは構成要素(例えば、他の型の生化学試薬、容器、パッケージ(例えば、市販用に意図されるパッケージング)、SNP検出試薬が結合している基材、電子ハードウェア構成要素など)と組み合わせた1種以上のSNP検出試薬のようなものを指す。したがって、本発明は、SNP検出キットおよびSNP検出システム(パッケージされたプローブとプライマーとの組(例えば、TaqManプローブ/プライマーの組)、核酸分子のアレイ/マイクロアレイ、および本発明の1種以上のSNPを検出するための1種以上のプローブ、プライマー、または他の検出試薬を含むビーズが挙げられるが、これらに限定されない)をさらに提供する。上記キット/システムは、種々の電子ハードウェア構成要素を場合により含み得る。例えば、種々の製造業者により提供されるアレイ(「DNAチップ」)および微小流体システム(「ラボ・オン・ア・チップ(lab−on−a−chip)」システム)は、典型的には、ハードウェア構成要素を含む。上記キット/システム(例えば、プローブ/プライマーの組)は、電子ハードウェア構成要素を含まないかもしれないが、例えば、1つ以上の容器中にパッケージングされた1種以上のSNP検出試薬を(場合により、他の生化学試薬とともに)含み得る。
【0109】
いくつかの実施形態では、SNP検出キットは、典型的には、1種以上の検出試薬と、アッセイまたは反応(例えば、SNP含有核酸分子の増幅および/または検出)を実行するための必要な他の構成要素(例えば、緩衝液、酵素(例えば、DNAポリメラーゼもしくはリガーゼ)、鎖伸長ヌクレオチド(例えば、デオキシヌクレオチド三リン酸)、Sanger型DNA配列決定反応の場合には鎖終結ヌクレオチド、ポジティブコントロール配列、ネガティブコントロール配列など)を含む。キットは、標的核酸の量を決定するための手段、およびその量を標準物と比較するための手段をさらに含み得る。キットは、そのキットを使用して目的のSNP含有核酸分子を検出するための指示書を含み得る。本発明の一実施形態では、1種以上のアッセイを実行して本明細書において開示される1種以上のSNPを検出するための必要試薬を含むキットが、提供される。本発明の好ましい実施形態では、SNP検出キット/システムは、核酸アレイの形態、または区画分けされたキット(微小流体システム/ラボ・オン・ア・チップ(lab−on−a−chip)システムを含む)の形態である。
【0110】
SNP検出キット/システムは、例えば、各標的SNP位置またはその付近にある核酸分子にハイブリダイズする1つ以上のプローブまたはプローブ対を含み得る。複数の対立遺伝子特異的プローブ対が、多数のSNPを同時にアッセイするためにこのキット/システム中に含まれ得る。上記多数のSNPのうちの少なくとも1つは、本発明のSNPである。いくつかのキット/システムにおいて、上記対立遺伝子特異的プローブは、基材(例えば、アレイまたはビーズ)に固定される。
【0111】
用語「アレイ」、「マイクロアレイ」、および「DNAチップ」とは、基材(例えば、ガラス、プラスチック、紙、ナイロン、または他の型の膜、フィルター、チップ、もしくは他の適切な固体支持体)に付着された、別個のポリヌクレオチド群を指すために本明細書において互換可能に使用される。上記ポリヌクレオチドは、上記基材上で直接合成され得るか、または上記基材とは別個に合成された後で上記基材に付着され得る。一実施形態では、上記マイクロアレイは、米国特許第5,837,832号、Cheeら、PCT出願WO95/11995(Cheeら),Lockhart,D.Jら、(1996;Nat.Biotech.14:1675−1680)およびSchena,M.ら、(1996;Proc.Natl.Acad.Sci.93:10614−10619(これらすべては、その全体が参照により本明細書に組み込まれる)に記載される方法にしたがって、調製されそして使用される。他の実施形態では、このようなアレイは、Brownら、米国特許第5,807,522号により記載される方法により生成される。
【0112】
核酸アレイは、以下の参考文献中に概説されている:Zammatteoら、“New chips for molecular biology and diagnostics”,Biotechnol Annu Rev.2002;8:85−101;Sosnowskiら、“Active microelectronic array system for DNA hybridization,genotyping and pharmacogenomic applications”,Psychiatr Genet.2002 December;12(4):181−92;Heller,“DNA microarray technology:devices,systems,and applications”,Annu Rev Biomed Eng.2002;4:129−53.Epub 2002 Mar.22;Kolchinskyら、“Analysis of SNPs and other genomic variations using gel−based chips”,Hum Mutat.2002 April;19(4):343−60;およびMcGallら、“High−density genechip oligonucleotide probe arrays”,Adv Biochem Eng Biotechnol.2002;77:21−42。
【0113】
多数のプローブ(例えば、対立遺伝子特異的プローブ)が、アレイにおいて実施され得、各プローブまたはプローブ対は、異なるSNP位置にハイブリダイズし得る。ポリヌクレオチドプローブの場合、これらのプローブは、光指向性化学プロセスを使用して、基材上の指定領域で合成され得る(かまたは、別個に合成され得、その後、指定領域に付着され得る)。各DNAチップは、格子様パターンで整列され(例えば、10セント銀貨の大きさまで)小型化された、例えば、数千から数億個の個々の合成ポリヌクレオチドプローブを含み得る。好ましくは、プローブは、順序立ったアドレス指定可能なアレイ状に固体支持体に付着される。
【0114】
マイクロアレイは、固体支持体に付着した多数の独特の一本鎖ポリヌクレオチド(通常は、合成アンチセンスポリヌクレオチドまたはcDNA断片のいずれか)から構成され得る。典型的なポリヌクレオチドは、好ましくは、約6ヌクレオチドから60ヌクレオチド、より好ましくは約15ヌクレオチドから30ヌクレオチド、最も好ましくは約18ヌクレオチドから25ヌクレオチドの長さである。特定の型のマイクロアレイまたは他の検出キット/システムについて、ほんの約7ヌクレオチドから20ヌクレオチドの長さであるオリゴヌクレオチドを使用することが、好ましくあり得る。他の型のアレイ(例えば、化学発光検出技術と組み合わせて使用されるアレイ)において、好ましいプローブの長さは、例えば、約15ヌクレオチドから80ヌクレオチドの長さ、好ましくは約50ヌクレオチドから70ヌクレオチドの長さ、より好ましくは約55ヌクレオチドから65ヌクレオチドの長さ、最も好ましくは約60ヌクレオチドの長さであり得る。このマイクロアレイまたは検出キットは、遺伝子/転写産物または標的SNP部位の既知の5’配列または3’配列を網羅するポリヌクレオチド;遺伝子/転写産物の全長配列を網羅する連続するポリヌクレオチド;または標的遺伝子/転写産物配列の長さに沿った特定の領域(特に、1つ以上のSNPに対応する領域)から選択される独特のポリヌクレオチドを含み得る。上記マイクロアレイまたは検出キットにおいて使用されるポリヌクレオチドは、目的のSNPに対して特異的(例えば、標的SNP部位の特定のSNP対立遺伝子に対して特異的、または複数の異なるSNP部位にある特定のSNP対立遺伝子に対して特異的)であり得るか、あるいは目的の多型遺伝子/転写産物に対して特異的であり得る。
【0115】
ポリヌクレオチドアレイに基づくハイブリダイゼーションアッセイは、完全に一致する標的配列変異体およびミスマッチ標的配列変異体に対する、上記プローブのハイブリダイゼーション安定性の差異に依存する。SNP遺伝子型決定のために、ハイブリダイゼーションアッセイにおいて使用されるストリンジェンシー条件は、1SNP位置程度にしか互いと異ならない核酸分子が区別され得るのに充分に高いことが、一般的には好ましい(例えば、典型的SNPハイブリダイゼーションアッセイが、1つの特定のヌクレオチドがSNP位置に存在する場合にかぎりハイブリダイゼーションが生じるが、代替的ヌクレオチドがそのSNP位置に存在する場合にはハイブリダイゼーションは生じないように、設計される)。そのような高いストリンジェンシーの条件は、例えば、SNP検出のために対立遺伝子特異的プローブの核酸アレイを使用する場合に、好ましくあり得る。そのような高いストリンジェンシーの条件は、先の節において記載されており、当業者にとって周知であり、そして例えば、Current Protocols in Molecular Biology,John Wiley&Sons,N.Y.(1989),6.3.1−6.3.6において見出され得る。
【0116】
他の実施形態では、上記アレイは、化学発光検出技術と組み合わせて使用される。以下の特許および特許出願(これらはすべて、本明細書により参考として援用される)は、化学発光検出に関するさらなる情報を提供する:米国特許出願10/620332および同10/620333は、マイクロアレイ検出のための化学発光アプローチを記載し、米国特許第6124478号、米国特許第6107024号、米国特許第5994073号、米国特許第5981768号、米国特許第5871938号、米国特許第5843681号、米国特許第5800999号、および米国特許第5773628号は、化学発光検出を実施するためのジオキセタンの方法および組成物を記載し;公開された米国出願US2002/0110828は、マイクロアレイコントロールのための方法および組成物を開示する。
【0117】
本発明の一実施形態では、核酸アレイは、約15ヌクレオチドから25ヌクレオチドの長さのプローブのアレイを含み得る。さらなる実施形態では、核酸アレイは、多数のプローブを含み得、ここで、少なくとも1つのプローブは、SNPを検出可能であり、かつ/または少なくとも1つのプローブは、配列表に開示される配列、それらに相補的な配列、および、少なくとも約8個連続するヌクレオチド、好ましくは、10個、12個、15個、16個、18個、20個、より好ましくは22個、25個、30個、40個、47個、50個、55個、60個、65個、70個、80個、90個、100個またはそれ以上の連続するヌクレオチド(またはこれらの間のあらゆる他の数)を含み、かつ新規なSNP対立遺伝子を含むそれらの断片からなる群より選択される配列のうちの1つの断片を含む。いくつかの実施形態では、上記SNP部位に対して相補的なヌクレオチドは、上記プローブの中心から5ヌクレオチド内、4ヌクレオチド内、3ヌクレオチド内、2ヌクレオチド内、または1ヌクレオチド内、より好ましくは上記プローブの中心にある。
【0118】
ポリヌクレオチドプローブは、PCT出願WO95/251116(Baldeschweilerら)(これは、その全体が参照により本明細書に組み込まれる)に記載されるように、化学カップリング手順およびインクジェット適用装置を使用することによって、基材表面上で合成され得る。別の形態では、ドット(またはスロット)ブロットと類似する「格子状」アレイが、真空系、熱的結合手順、UV結合手順、機械的結合手順、または化学結合手順を使用して、基材表面にcDNA断片またはオリゴヌクレオチドを整列させて結合するために使用され得る。アレイ(例えば、上記のアレイ)は、手によってか、あるいは利用可能なデバイス(スロットブロット装置またはドットブロット装置)、材料(適切な任意の固体支持体)、および機器(ロボット機器を含む)を使用することによって、生成され得、そして8個、24個、96個、384個、1536個、6144個以上のポリヌクレオチド、または市販の機器の効率的な使用のために適する他の任意の数のポリヌクレオチドを含み得る。
【0119】
そのようなアレイまたは他のキット/システムを使用して、本発明は、試験サンプル中にある本明細書において開示されるSNPを同定するための方法を提供する。そのような方法は、典型的には、試験核酸サンプルを、本発明の少なくとも1つのSNP位置に対応する1つ以上のプローブを含むアレイとともにインキュベートする工程、ならびに上記試験サンプル由来の核酸と上記プローブのうちの1つ以上との結合についてアッセイする工程を包含する。SNP検出試薬(またはそのような1種以上のSNP検出試薬を使用する、キット/システム)を、インキュベーション条件は、上記アッセイにおいて使用される形式、使用される検出方法、ならびに上記アッセイにおいて使用される検出試薬の型および性質に依存する。当業者は、市販のハイブリダイゼーション形式、増幅形式、およびアレイアッセイ形式のうちのいずれか1つが、本明細書において開示されるSNPを検出するために容易に適合され得ることを、認識する。
【0120】
本発明のSNP検出キット/システムは、SNP含有核酸分子の後の増幅および/または検出のために、試験サンプルから核酸を調製するために使用される構成要素を含み得る。そのようなサンプル調製構成要素は、任意の体液(例えば、血液、血清、血漿、尿、唾液、粘液質、胃液、精液、涙、汗など)、皮膚、毛髪、細胞(特に、有核細胞)、生検、口腔スワブまたは組織標本からの、核酸抽出物(DNAおよび/またはRNAを含む)、タンパク質抽出物もしくは膜抽出物を生成するために使用され得る。上記の方法において使用される試験サンプルは、上記アッセイ形式、上記検出方法の性質、およびアッセイされるべき試験サンプルとして使用される具体的な組織、細胞、または抽出物に基づいて、変化するであろう。核酸抽出物、タンパク質抽出物、および細胞抽出物を調製する方法は、当該分野で周知であり、利用されるシステムと適合するサンプルを得るために容易に適合され得る。試験サンプルから核酸を抽出するための自動サンプル調製システムは、市販されており、その例は、QiagenのBioRobot 9600、Applied BiosystemsのPRISM 6700、およびRoche Molecular SystemsのCOBAS AmpliPrep Systemである。
【0121】
本発明により企図される別の形態のキットは、区画分けされたキットである。区画分けされたキットは、試薬が別個の容器中に含まれる任意のキットを包含する。そのような容器としては、例えば、小さいガラス容器、プラスチック容器、プラスチック片、ガラス片、または紙片、またはアレイ形成材料(例えば、シリカ)が挙げられる。そのような容器によって、試験サンプルおよび試薬が相互混入しないようにある区画から別の区画へと試薬を効率的に移動することが可能であるか、またはある区画からそのキット中に含まれない別の容器に移動することが可能であり、各容器の薬剤または溶液は、ある区画から別の区画または別の容器へと、定量的様式で添加され得る。そのような容器としては、例えば、試験サンプルを受容する1つ以上の容器、本発明の1つ以上のSNPを検出するための少なくとも1つのプローブまたは他のSNP検出試薬を含む1つ以上の容器、洗浄試薬(例えば、リン酸緩衝化生理食塩水、Tris緩衝液など)を含む1つ以上の容器、および結合したプローブまたは他のSNP検出試薬の存在を明らかにするために使用される試薬を含む1つ以上の容器が、挙げられ得る。上記キットは、例えば、核酸増幅反応または他の酵素反応(例えば、プライマー伸長反応)、ハイブリダイゼーション、ライゲーション、電気泳動(好ましくは、キャピラリー電気泳動)、質量分析法、および/またはレーザー誘導蛍光検出のための、区画および/もしくは試薬を場合によりさらに含み得る。上記キットはまた、そのキットを使用するための指示書を備え得る。例示的な区画分けされたキットとしては、当該分野で公知の微小流体デバイス(例えば、Weiglら、“Lab−on−a−chip for drug development”,Adv Drug Deliv Rev.2003 Feb.24;55(3):349−77参照)が挙げられる。そのような微小流体デバイスにおいて、上記容器は、例えば、微小流体「容器」、微小流体「チャンバ」、または微小流体「チャネル」と呼ばれ得る。
【0122】
マイクロ流体デバイスは、「ラボ・オン・ア・チップ(lab−on−a−chip)」システムとも称され得、生物医学的なマイクロ電気機械システム(bioMEM)または多構成要素一体型システムは、SNPを解析するための本発明の典型的なキット/システムである。このようなシステムは、単一の機能性デバイスにおいてプローブ/標的ハイブリダイゼーション、核酸増幅、およびキャピラリー電気泳動法の反応のような過程を縮小化および分画化する。このようなマイクロ流体デバイスは典型的に、システムの少なくとも1つの形態において検出試薬を利用し、そしてこのような検出試薬は使用され、本発明の1つ以上のSNPを検出し得る。マイクロ流体システムの1つの例は、米国特許第5,589,136号に開示され、この開示はチップにおいてPCR増幅の統合およびキャピラリー電気泳動が記載される。典型的なマイクロ流体システムは、マイクロチップ上に含まれるガラス、シリコン、石英、またはプラスチックのウエハ上に設計されるマイクロチャネルのパターンを含む。サンプルの移動は、電気、電気浸透性、または流体静力学の力によって制御され得、この力は、機能的顕微鏡バルブおよび可動部分を伴わないポンプを作成するためにマイクロチップの異なる範囲にわたって適用される。電圧の変化は、マイクロ機械加工されたチャネル間の交点で液体の流動を制御する方法およびマイクロチップの異なるセクションにわたりポンプ注入するための液体流量を変化させるための方法として使用され得る。例えば、米国特許第6,153,073号(Dubrowら)および米国特許第6,156,181号(Parceら)参照。
【0123】
SNPを遺伝子型決定するために、典型的なマイクロ流動システムは、例えば、核酸増幅、プライマー伸長、キャピラリー電気泳動、およびレーザー光誘導蛍光検出のような検出方法を統合し得る。このような例示的なシステムを使用するための例示的なプロセスの最初の工程において、核酸サンプルは、好ましくはPCRによって増幅される。次いで、増幅産物は、ddNTP(各ddNTPに対して特異的な蛍光)および適切なオリゴヌクレオチドプライマーを使用する自動プライマー伸長反応に供され標的SNPのちょうど上流にハイブリダイズするプライマー伸長反応を実施する。3’末端において伸長が一旦完了すると、このプライマーは、キャピラリー電気泳動によって組込まれていない蛍光ddNTPから分離される。キャピラリー電気泳動に使用される分離培地は、例えば、ポリアクリルアミド、ポリエチレングリコールまたはデキストランであり得る。単一のヌクレオチドプライマーの伸長産物中に組込まれたddNTPは、レーザー光誘導蛍光検出によって同定される。このような例示的なマイクロチップが、使用され例えば、少なくとも96サンプルから384サンプル、またはそれ以上が同時に処理され得る。
核酸分子の使用
本発明の核酸分子は、特に障害を発症するリスクの評価において種々の用途を有する。典型的な障害としては、炎症性、変性、代謝、増殖性、循環、認知、生殖および行動の障害が挙げられるが、これに限定されない。本発明の好ましい実施形態では、障害は癌である。例えば、核酸分子は、ハイブリダイゼーションプローブとして、例えば、メッセンジャーRNA、転写産物、cDNA、ゲノムDNA、増幅されたDNAまたは他の核酸分子においてSNPを遺伝子型決定するために、ならびに全長cDNAおよびゲノムクローンを単離するために有用である。
【0124】
プローブは、LCS含有核酸分子の全長に沿って任意のヌクレオチド配列にハイブリダイズし得る。好ましくは、プローブは、配列特異的な様式でSNP含有標的配列にハイブリダイズし、その結果、標的配列を、どのヌクレオチドがSNP部位に存在するかによってのみ、標的配列と異なる他のヌクレオチド配列とを識別する。このようなプローブは、試験サンプル中のSNP含有核酸の存在を検出するために、またはどのヌクレオチド(対立遺伝子)が、特定のSNP部位に存在するかを決定する(すなわち、SNP部位を遺伝子型決定する)ために特に有用である。
【0125】
核酸のハイブリダイゼーションプローブは、核酸発現の存在、レベル、形態、および/または分布を決定するために使用され得る。レベルが決定される核酸は、DNAまたはRNAであり得る。したがって、本明細書において記載されるSNPに特異的なプローブが、使用され所定の細胞、組織、または生物において存在、発現および/または遺伝子のコピー数を調べ得る。これらの用途は、正常なレベルに対する遺伝子発現の増加または減少に関連する障害の診断に関連する。mRNA検出のためのインビトロ技術としては、例えば、ノーザンブロットハイブリダイゼーションおよびインサイチュハイブリダイゼーションが挙げられる。DNAを検出するためのインビトロ技術としては、サザンブロットハイブリダイゼーションおよびインサイチュハイブリダイゼーションが挙げられる(SambrookおよびRussell,2000,Molecular Cloning:A Laboratory Manual,Cold Spring Harbor Press,Cold Spring Harbor,N.Y.)。
【0126】
したがって、本発明の核酸分子は、ハイブリダイゼーションプローブとして使用され本明細書において開示されるSNPを検出し得、それによって多型を有する個体が、障害を発症するリスクを有するか否かを決定し得る。疾患の表現型に関連するSNPの検出は、活性な疾患および/または疾患に対する遺伝的な素因についての予測ツールを提供する。
【0127】
本発明の核酸分子はまた、本明細書において記載されるSNP含有核酸分子に由来する発現されたmRNA分子の全体または一部分に対応するリボザイムを設計するのにも有用である。
【0128】
本発明の核酸分子はまた、核酸分子および改変ペプチドの全体または一部分を発現するトランスジェニック動物を構築するためにも有用である。本明細書において開示されるSNPを含む核酸分子を有する組換え細胞およびトランスジェニック動物の産生は、例えば、処置化合物および投薬レジメンの効果的な臨床設計を可能とする。
【0129】
SNP遺伝子決定方法
どの特定のヌクレオチド(すなわち対立遺伝子)が、1つ以上のSNP位置の各々に存在するかを決定するプロセスは、SNP遺伝子型決定と称される。本発明は、種々の障害についてのスクリーニングまたはその素因の決定、または処置形態に対する応答性の決定、または予後診断、またはゲノムマッピングまたはSNP関連性解析などの用途のための、SNP遺伝子型決定の方法を提供する。
【0130】
核酸サンプルは、当該分野において周知の方法によって遺伝子型決定され、どの対立遺伝子が、目的の任意の所定遺伝子領域(例えば、SNP位置)に存在するかを決定し得る。隣接する配列が、オリゴヌクレオチドプローブのようなSNP検出試薬を設計するために使用され得、このプローブは場合によりキットの形式で与えられ得る。例示的なSNP遺伝子型決定方法は、Chenら、“Single nucleotide polymorphism genotyping:biochemistry,protocol,cost and throughput”,Pharmacogenomics J.2003;3(2):77−96;Kwokら、“Detection of single nucleotide polymorphisms”,Curr Issues Mol.Biol.2003 April;5(2):43−60;Shi,“Technologies for individual genotyping:detection of genetic polymorphisms in drug targets and disease genes”,Am J Pharmacogenomics.2002;2(3):197−205;およびKwok,“Methods for genotyping single nucleotide polymorphisms”,Annu Rev Genomics Hum Genet 2001;2:235−58に記載される。ハイスループットのSNP遺伝子型決定についての例示的技術は、Marnellos,“High−throughput SNP analysis for genetic association studies”,Curr Opin Drug Discov Devel.2003 May;6(3):317−21に記載される。一般的なSNP遺伝子型決定方法としては、TaqManアッセイ、分子ビーコンアッセイ、核酸アレイ、対立遺伝子特異的なプライマー伸長、対立遺伝子特異的PCR、配列されたプライマー伸長、均質なプライマーの伸長アッセイ、質量分析法による検出を伴うプライマー伸長、高熱配列決定(pyrosequencing)、遺伝子アレイで選別される複合プライマーの伸長、周期的ローリングサークルを伴うライゲーション、均質なライゲーション、OLA(米国特許第4,988,167号)、遺伝子アレイで選別される複合ライゲーション反応、制限断片長の多型、一塩基の伸長タグアッセイおよびインベーダーアッセイが挙げられるが、これらに限定されない。このような方法は、例えば、発光または化学発光の検出、蛍光検出、時間分解型蛍光検出、蛍光共鳴エネルギー伝達、蛍光偏光、質量分析、および電気検出のような検出メカニズムと組み合わせて用いられ得る。
【0131】
多型を検出するための種々の方法としては、切断因子からの保護がRNA/RNA二重鎖またはRNA/DNA二重鎖においてミスマッチの塩基を検出するために使用される方法(Myersら、Science 230:1242(1985);Cottonら、PNAS 85:4397(1988);およびSaleebaら、Meth.Enzymol.217:286−295(1992))、変異体および野生型の核酸分子の電気泳動の移動度の比較(Oritaら、PNAS 86:2766(1989);Cottonら、Mutat.Res.285:125−144(1993);およびHayashiら、Genet.Anal.Tech.Appl.9:73−79(1992))ならびに変性勾配ゲル電気泳動(DGGE)を用いて変性剤の勾配を含むポリアクリルアミドゲルにおいて多型断片または野生型断片の移動をアッセイすること(Myersら、Nature 313:495(1985))が挙げられるが、これらに限定されない。特定の位置での配列の変化はまた、RNase保護およびS1保護のような、ヌクレアーゼ保護アッセイまたは化学切断法によっても評価され得る。
【0132】
好ましい実施形態では、SNP遺伝子型決定は、5’ヌクレアーゼアッセイとしても公知であるTaqManアッセイを用いて実施される(米国特許第5,210,015号および米国特許第5,538,848号)。TaqManアッセイは、PCRの間に特定の増幅産物の蓄積を検出する。TaqManアッセイは、蛍光レポーター色素およびクエンチャー色素を用いて標識されたオリゴヌクレオチドプローブを利用する。レポーター色素は、適切な波長での放射線照射によって励起され、蛍光共鳴エネルギー伝達(FRET)と呼ばれるプロセスを介して同一のプローブ中のクエンチャー色素へエネルギーを伝達する。このプローブへ取り付けられた場合、励起されたレポーター色素は、シグナルを放射しない。インタクトなプローブにおけるクエンチャー色素とレポーター色素との近さは、レポーターについての減少した蛍光を維持する。レポーター色素およびクエンチャー色素は、それぞれ最も5’側の末端および最も3’側の末端に有っても、その逆であってもよい。あるいは、レポーター色素は、最も5’側の末端または最も3’側の末端にあり得、一方で、クエンチャー色素は、内部のヌクレオチドに結合される(またはこの逆もあり得る)。さらに別の実施形態では、レポーターおよびクエンチャーの両方が、互いに間隔を空けて内部のヌクレオチドへ結合され得、その結果レポーターの蛍光は、減少される。
【0133】
PCRの間、DNAポリメラーゼの5’ヌクレアーゼ活性がプローブを切断し、それによってレポーター色素とクエンチャー色素とを分離し、そして結果として、レポーターの蛍光の上昇を生じる。PCR産物の蓄積は、レポーター色素の蛍光の上昇をモニタリングすることにより直接検出される。DNAポリメラーゼは、プローブがPCRの間に増幅される標的SNP含有鋳型にハイブリダイズする場合にのみ、レポーター色素とクエンチャー色素との間のプローブを切断し、かつプローブは、特定のSNP対立遺伝子が存在する場合にのみ、標的SNP部位にハイブリダイズするように設計されている。
【0134】
好ましいTaqManプライマーおよびTaqManプローブの配列は、本明細書において提供されるSNPおよび関連する核酸配列情報を用いて、容易に決定され得る。Primer Express(Applied Biosystems、Foster City、Calif.)のようなコンピュータプログラムの多くは、最適なプライマー/プローブのセットを迅速に得るために使用され得る。本発明のSNPを検出するためのこのようなプライマーおよびプローブが、癌などの種々の障害のための予測アッセイにおいて有用であり、かつキット形式に容易に組み込まれることが、当業者に明らかとなるであろう。本発明はまた、Molecular Beaconプローブ(米国特許第5,118,801号および米国特許第5,312,728号)ならびに他の改変形式(米国特許第5,866,336号および米国特許第6,117,635号)の使用のような、当該分野において周知のTaqmanアッセイの改変を含む。
【0135】
多型の同一性はまた、限定されるわけではないが、リボプローブ(Winterら、Proc.Natl.Acad Sci.USA 82:7575,1985;Meyersら、Science 230:1242,1985)およびヌクレオチド誤対合を認識するタンパク質、例えば大腸菌(E.coli)mutSタンパク質(Modrich,P.Ann.Rev.Genet.25:229−253,1991)を用いたリボヌクレアーゼ保護方法を含む誤対合検出技術を用いても決定され得る。別法として、変異型対立遺伝子は、1本鎖立体配座多型(SSCP)解析(Oritaら、Genomics 5:874−879,1989;Humphriesら、in Molecular Diagnosis of Genetic Diseases,R.Elles,ed.,pp.321−340,1996)または変性勾配ゲル電気泳動(DGGE)(Wartellら、Nuci.Acids Res.18:2699−2706,1990;Sheffieldら、Proc.Nati.Acad.Sci.USA 86:232−236,1989)により同定され得る。
【0136】
ポリメラーゼ介在プライマー伸長法もまた、多型の同定に使用され得る。幾つかの上記方法は、特許および科学文献に記載されており、「遺伝ビット解析」方法(国際公開第92/15712号)およびリガーゼ/ポリメラーゼ介在遺伝ビット解析(米国特許第5,679,524号)を含む。関連方法は、WO91/02087,WO90/09455,WO95/17676,米国特許第5,302,509号および米国特許第5,945,283号に開示されている。多型を含む伸長プライマーは、米国特許第5,605,798号に記載された質量分析法により検出され得る。別のプライマー伸長方法は、対立遺伝子特異的PCR(Ruanoら、Nucl.Acids Res.17:8392,1989;Ruanoら、Nucl.Acids Res.19,6877−6882,1991;WO93/22456;Turkiら、J Clin.Invest.95:1635−1641,1995)である。さらに、多数の多型部位は、Wallaceら、(WO89/10414)に記載された対立遺伝子特異的プライマーのセットを用いて多数の核酸領域を同時に増幅することにより調査され得る。
【0137】
本発明のSNPの遺伝型を決定するための別の好ましい方法は、OLAにおける2つのオリゴヌクレオチドプローブの使用である(例えば、米国特許第4,988,617号参照)。この方法において、1つのプローブは、その最も3’末端にSNP部位が整列した、標的核酸のセグメントにハイブリダイズする。第2のプローブは、標的核酸分子の第1のプローブのすぐ3’に隣接するセグメントにハイブリダイズする。2つの並列したプローブは、標的核酸分子にハイブリダイズし、そして、もし第1のプローブの最も3’のヌクレオチドとSNP部位との間に完全な相補性があれば、リガーゼのような結合剤の存在下で連結される。ミスマッチがある場合、連結は起こらない。反応後、連結されたプローブは、標的核酸分子から分離され、そしてSNPの存在の指標として検出される。
【0138】
以下の特許、特許出願、および公開されている国際特許出願は、すべて、本明細書で参考により援用され、種々の形式のOLAを実施するための技術に関するさらなる情報を提供する:米国特許第6,027,889号、米国特許第6,268,148号、米国特許第5494810号、米国特許第5830711号、および米国特許第6054564号は、SNP検出を実施するためのOLAストラテジーを記載する;WO97/31256およびWO00/56927は、ユニバーサルアレイを用いたSNP検出を実施するためのOLAストラテジーを記載し、ここで、ジップコード配列は、ハイブリダイゼーションプローブの1つに導入され得、かつ結果として生じた産物(もしくは増幅産物)は、ユニバーサルジップコードアレイにハイブリダイズし得る;米国特許出願US01/17329(および09/584,905)は、OLA(もしくはLDR)、続いてPCRを記載し、ここで、ジップコードはOLAプローブに組み込まれ、かつ増幅されたPCR産物は、電気泳動もしくはユニバーサルジップコードアレイ読み出し装置により決定される;米国特許出願60/427,818、同60/445,636および同60/445,494は、SNPlex法およびOLAに続くPCRを用いた多重SNP検出のためのソフトウェアを記載し、ここで、ジップコードは、OLAプローブに組み込まれ、かつ増幅されたPCR産物は、ジップシュート(zipchute)試薬とハイブリダイズし、かつSNPの同定は、ジップシュートの電気泳動読み出し装置により決定される。いくつかの実施形態では、OLAは、PCR(もしくは別の核酸増幅方法)の前に実施される。他の実施形態では、PCR(もしくは他の核酸増幅方法)は、OLAの前に実施される。
【0139】
SNPを遺伝子型決定するための別の方法は、質量分析に基づく。質量分析は、DNAの4種のヌクレオチドの各々の固有の質量を利用する。SNPは、代替的なSNP対立遺伝子を有する核酸の質量の差異を測定することにより、質量分析によって明白に遺伝子型決定され得る。MALDI−TOF(Matrix Assisted Laser Desorption Ionization−Time of Flight)質量分析技術が、SNPのような分子質量のきわめて正確な決定のために好ましい。SNP解析に対する数多くのアプローチが、質量分析に基づいて開発されている。好ましい質量分析に基づくSNPを遺伝子型決定する方法は、プライマー伸長アッセイを含み、これも、従来のゲルに基づく形式およびマイクロアレイのような他の適用と組み合わせて利用され得る。
【0140】
典型的に、プライマー伸長アッセイは、標的SNP部位から(5’)上流の鋳型PCRアプリコンに対する、プライマーの設計およびアニールを含む。ジデオキシヌクレオチド三リン酸(ddNTP)および/もしくはデオキシヌクレオチド三リン酸(dNTP)の混合物を、鋳型(例えば、PCRなどにより典型的に増幅されている、SNP含有核酸分子)、プライマー、およびDNAポリメラーゼを含む反応混合物に添加する。プライマーの伸長は、混合物中のddNTPのうちの1つに対して相補的なヌクレオチドが生じる鋳型中の最初の部位で、終結する。プライマーは、SNP部位に直接隣接する(すなわち、プライマーの3’末端のヌクレオチドは、標的SNP部位の隣のヌクレオチドにハイブリダイズする)か、もしくはSNP部位から2つ以上のヌクレオチド離れているかのどちらかであり得る。プライマーが、標的SNP部位から数ヌクレオチド離れている場合、唯一の制限は、プライマーの3’末端とSNP部位との間の鋳型配列が、検出されるべきものと同じ型のヌクレオチドを含まないこと、またはこのことが、伸長プライマーの未完成な終結を引き起こすことである。あるいは、すべての4種のddNTPのみが、dNTPなしで反応混合物に添加される場合、プライマーは常に、標的SNP位置に対応するただ1つのヌクレオチドにより伸長される。この場合、プライマーは、SNP位置より1つ上流のヌクレオチドに結合するために設計される(すなわち、プライマーの3’末端のヌクレオチドは、標的SNP部位の5’側で標的SNP部位に直接隣接するヌクレオチドにハイブリダイズする)。ただ1つのヌクレオチドによる伸長は、伸長されるプライマーの全体の質量を最小にし、それにより、代替的なSNPヌクレオチドの間の質量の差異の分解能を上昇させるので、ただ1つのヌクレオチドによる伸長が好ましい。さらに、非改変ddNTPの代わりに、プライマー伸長反応には、質量標識されたddNTPが用いられ得る。このことは、これらのddNTPにより伸長されたプライマーの間の質量の差異を上昇させ、それにより、上昇する感度および精度を提供し、そして特に、ヘテロ接合の塩基位置を決定するために有用である。質量標識はまた、集中的なサンプル調製手順の必要性を軽減し、そして質量分析の必要とされる分解能を低下させる。
【0141】
伸長されたプライマーは、次に精製され得、そして、標的SNP部位に存在しているヌクレオチドの同一性を決定するために、MALDI−TOF質量分析により分析され得る。分析の1つの方法において、プライマー伸長反応からの生成物は、マトリックスを形成する光吸収結晶と組み合わせられる。次に、このマトリックスは、核酸分子をイオン化し、そして気体相に脱着するために、レーザーのようなエネルギー源により打ち付けられる。次に、イオン化された分子は、飛行管内に放射され、そして加速されて検出器に向かってこの管を下る。レーザーパルスのようなイオン化現象と分子が検出器と衝突する間の時間は、その分子の飛行時間である。飛行時間は、イオン化された分子の電荷に対する質量比(m/z)と正確に相関する。より小さいm/zを有するイオンは、より大きいm/zを有するイオンよりも早くこの管を下って進行し、そしてそのため、このより軽いイオンは、より重いイオンの前に検出器に到達する。したがって、飛行時間は、対応する、かつ非常に正確なm/zに変換される。この様式で、SNPは、一塩基部分に異なるヌクレオチドを有する核酸分子において固有の、質量のわずかな差異、および対応する飛行時間の差異に基づいて同定され得る。SNP遺伝子型決定のための、MALDI−TOF質量分析と関連するプライマー伸長反応アッセイの使用に関するさらなる情報については、例えば、Wiseら、“A standard protocol for single nucleotide primer extension in the human genome using matrix−assisted laser desorption/ionization time−of−flight mass spectrometry”,Rapid Commun Mass Spectrom.2003;17(11):1195−202参照。
【0142】
以下の参考は、SNP遺伝子型決定のための質量分析に基づく方法を記載する、さらなる情報を提供する:Bocker,“SNP and mutation discovery using base−specific cleavage and MALDI−TOF mass spectrometry”,Bioinformatics.2003 July;19 Suppl 1:144−153;Stormら、“MALDI−TOF mass spectrometry−based SNP genotyping”,Methods Mol.Biol.2003;212:241−62;Jurinkeら、“The use of MassARRAY technology for high throughput genotyping”,Adv Biochem Eng Biotechnol.2002;77:57−74;およびJurinkeら、“Automated genotyping using the DNA MassArray technology”,Methods Mol.Biol.2002;187:179−92。
【0143】
SNPはまた、直接のDNA配列決定によっても評価され得る。種々の自動化配列決定手順が利用され得((1995)Biotechniques 19:448)、これらとしては、質量分析による配列決定が挙げられる(例えば、PCT国際公開番号WO94/16101;Cohenら、Adv.Chromatogr.36:127−162(1996);およびGriffinら、Appl.Biochem.Biotechnol.38:147−159(1993)参照)。本発明の核酸配列は、当業者がこのような自動化配列決定手順のための配列決定プライマーを容易に設計することを可能にする。Applied Biosystems 377,3100,3700,3730,and 3730.times.1 DNA Analyzers(Foster City,Calif.)のような商業的な機器が、自動化配列決定のために、当該分野において一般的に使用される。
【0144】
本発明のSNPの遺伝子型を決定するために使用され得る他の方法としては、一本鎖高次構造多型(SSCP)および変性勾配ゲル電気泳動(DGGE)が挙げられる(Myersら、Nature 313:495(1985))。SSCPは、Oritaら、Proc.Nat.Acad.に記載のように、一本鎖PCR産物の電気泳動移動度の変化により、塩基の差異を識別する。一本鎖PCR産物は、二本鎖PCR産物を加熱するか、もしくはそれ以外で変性させることにより生成され得る。一本鎖核酸は、塩基配列に部分的に依存する二次構造を、再び折りたたむか、もしくは形成し得る。一本鎖増幅産物の異なる電気泳動移動度は、SNP位置の塩基配列の差異に関連する。DGGEは、多型DNAに固有の異なる配列依存的安定性および融解特性、ならびに変性勾配ゲルにおける電気泳動移動度パターンの対応する差異に基づいて、SNP対立遺伝子を識別する(Erlich,ed.,PCR Technology,Principles and Applications for DNA Amplification,W.H.FreemanおよびCo,New York,1992,Chapter 7)。
【0145】
配列特異的リボザイム(米国特許第5,498,531号)がまた、リボザイム切断部位の発生もしくは消失に基づいてSNPを評価するために、使用され得る。完全にマッチする配列は、ヌクレアーゼ切断消化アッセイによるか、もしくは融解温度の差異により、ミスマッチ配列と区別され得る。SNPが制限酵素切断部位に影響する場合、SNPは、制限酵素消化パターンの変化、およびゲル電気泳動により決定される核酸断片の長さの対応する変化により確認され得る。
【0146】
SNP遺伝子型決定は、例えば、ヒト被験体から生体試料(例えば、組織、細胞、流体、分泌物などのサンプル)を収集する工程、サンプルの細胞から核酸(例えば、ゲノムDNA、mRNAもしくは両方)を単離する工程、標的核酸領域のハイブリダイゼーションおよび増幅が生じるような条件下で、標的SNPを含む単離された核酸の領域に特異的にハイブリダイズする1つ以上のプライマーに、核酸を接触させる工程、そして、目的のSNP位置に存在するヌクレオチドを決定する工程、または、いくつかのアッセイにおいては、増幅産物の存在もしくは非存在を検出する工程(アッセイは、特定のSNP対立遺伝子が存在するか、もしくは存在しない場合にのみ、ハイブリダイゼーションおよび/もしくは増幅が生じるように設計され得る)を包含し得る。いくつかのアッセイにおいて、増幅産物の大きさは、検出され、そしてコントロールサンプルの長さと比較される;例えば、欠損および挿入は、正常な遺伝子型と比較した増幅産物の大きさの変化により検出され得る。
【0147】
SNP遺伝子型決定は、以下に記載のような数多くの実用的な適用のために有用である。このような適用の例としては、SNP−疾患関連性解析、疾患素因スクリーニング、疾患診断、疾患予後判断、疾患経過モニタリング、個体の遺伝子型に基づく治療ストラテジーの決定(薬理ゲノミクス)、疾患もしくは薬物に対する応答の見込みに関連したSNP遺伝子型に基づく治療剤の開発、処置レジメンについての臨床試験のための患者母集団の層化、ならびに個体が治療剤により有害な副作用を経験する可能性の予測が挙げられるが、これらに限定されない。
【0148】
疾患スクリーニングアッセイ
遺伝子型と疾患に関連する表現型との間の関連性/相関に関する情報は、いくつかの方法で活用され得る。例えば、1つ以上のSNPと、処置が利用可能な疾患に対する素因との間に高度に統計的に有意な関連性がある場合は、個体におけるこのような遺伝子型パターンの検出は、処置の即時実行、または、少なくとも、個体の定期的なモニタリングの制度を正当化し得る。SNPとヒトの疾患との間の、弱いが、なお統計学的に有意な関連の場合、即時の治療的介入またはモニタリングは、感受性対立遺伝子またはSNPを検出した後に正当化されないこともある。それにもかかわらず、被験体は、単純なライフスタイルの変化(例えば、食事、運動、禁煙、モニタリング/調査の強化)を始めることを動機付けされ得、このライフスタイルの変化は、個体がほとんど、または全く費用をかけずに達成され得るが、個体が感受性対立遺伝子を有することによってリスクが増加し得る、病態を発症するリスクを減少するという、強力な利点を与え得る。
【0149】
一形態では、本発明は、細胞増殖性障害(例えば、癌)などの疾患を発症するリスク、感受性または確率を増加させるSNPを同定する方法を提供する。さらなる形態では、本発明は、疾患を発症するリスクを有する被験体を同定する、予後疾患を決定する、または疾患の発病を予測するための方法を提供する。例えば、被験体の細胞増殖性疾患を発症するリスク、疾患を持つ個体の予後、または細胞増殖性疾患の発病の予測は、BRCA1の3’非翻訳領域(UTR)における突然変異を検出することによって決定される。突然変異の同定は、細胞増殖性障害を発症するリスクの増加、予後不良、または細胞増殖性障害を発症する初期段階を示す。
【0150】
突然変異は、例えば、欠失、挿入、逆位、置換、フレームシフトまたは組換えである。突然変異は、miRNAの結合効力を調節する(例えば、増加または減少させる)。「結合効力」は、miRNAが標的遺伝子または転写産物に結合する能力を意味し、したがって、それぞれ標的遺伝子もしくは転写産物の転写または翻訳を鎮め、減少させ、抑制し、阻害し、または妨げる。結合効力は、miRNAがタンパク質産生を阻害するか、またはレポータータンパク質産生を阻害する能力によって決定される。あるいはまたはさらに、結合効力は、結合エネルギーとして定義され、最小自由エネルギー(mfe)(キロカロリー/モル)で測定される。
【0151】
本発明の文脈における「リスク」は、特定の期間にわたってある事象が起こるであろうという確率に関し、被験体の「絶対」リスクまたは「相対」リスクを意味し得る。絶対リスクは、関連時間集団に関する実際の測定後観測結果を参照して、または、関連時間期間の間追跡調査された統計的に有効な歴史的集団から作成される指標値を参照して、測定され得る。相対リスクは、低リスク集団の絶対リスクまたは平均集団リスクのいずれかと比較した、被験体の絶対リスクの比を指すが、これは、臨床的リスクファクターをどのように評価するかによって変化し得る。オッズ比(所定の検査結果に関する、否定的な事象に対する肯定的な事象の割合)もまた、無変換(no−conversion)に通常使用される(オッズ比は、式p/(1−p)にしたがう(式中、pは事象の確率であり、(1−p)は)事象が起こらない確率である)。
【0152】
本発明の文脈における「リスク評価」または「リスクの評価」は、事象もしくは疾患状態が起こり得る確率、オッズまたは可能性(事象もしくはある疾患状態から別のものへの変換が起こる割合、すなわち、原発腫瘍から転移性腫瘍へ、もしくは転移を発症するリスクがあるものへ、または第一の転移性の事象のリスクから第ニの転移性の事象へ、またはある種の原発腫瘍を発症するリスクから1つ以上の異なる種類の原発腫瘍を発症することへ)の予測を行うことを包含する。リスク評価はまた、過去に測定した集団を参照して、絶対期間または相対期間で、将来の臨床パラメーター、従来の臨床リスクファクター値または他の癌の指標を予測することを含み得る。
【0153】
「リスクの増加」は、BRCA1内にSNPを保有する個体が、SNPを保有しない個体と比較して、少なくとも1つの様々な障害(例えば、癌)を発症するであろう確率の増加を表すことを意味する。ある実施形態では、SNP保有者は、SNPを保有しない個体よりも、1.5倍、2倍、2.5倍、3倍、3.5倍、4倍、4.5倍、5倍、5.5倍、6倍、6.5倍、7倍、7.5倍、8倍、8.5倍、9倍、9.5倍、10倍、20倍、30倍、40倍、50倍、60倍、70倍、80倍、90倍、または100倍以上少なくとも1つの種類の癌を発症する可能性がある。また、1つの癌を発症したBRCA1内SNPの保有者は、第二の癌を発症する可能性が高い。ある実施形態では、非保有者が少なくとも1つの第二の癌を発症する平均年齢の1、2、5、7、10、12、15、17、20、22、25、27または30年前に、BRCA1 SNPは、少なくとも1つの第二の癌を発症する。
【0154】
細胞増殖性障害としては、細胞分裂が制御されていない様々な病状が挙げられる。例示的な細胞増殖性障害としては、新生物、良性腫瘍、悪性腫瘍、前癌期病状、インサイチュー腫瘍、被包性腫瘍、転移性腫瘍、液性腫瘍、固形腫瘍、免疫学的腫瘍、血液系腫瘍、癌、癌腫、白血病、リンパ腫、肉腫および急速に分裂する細胞が挙げられるが、これらに限定されない。本明細書において使用される用語「急速に分裂する細胞」は、同じ組織内の隣接細胞もしくは近隣細胞の間で予想もしくは観察されるものを超えるまたは上回る速度で分裂するあらゆる細胞として定義される。癌としては、乳癌および卵巣癌が挙げられるが、これらに限定されない。
【0155】
被験体は、好ましくは、哺乳動物である。哺乳動物は、ヒト、非ヒト霊長類、マウス、ラット、イヌ、ネコ、ウマまたはウシであり得るが、これらの例に限定されない。ヒト以外の哺乳動物は、特定の疾患の動物モデルを表す被験体として有利に使用され得る。被験体は、男性または女性であり得る。被験体は、疾患を有すると過去に診断または同定され、場合によっては、疾患に関する治療的介入を既に受けたか、または現に受けている者であり得る。または、被験体は、疾患を有すると過去に診断されなかった者でもあり得る。例えば、被験体は、疾患に関する1つ以上のリスクファクターを示す者であり得る。
【0156】
生体試料は、核酸を含むあらゆる組織または体液であり得る。様々な実施形態は、パラフィン包埋組織、凍結組織、外科的細針吸引、皮膚の細胞、筋肉、肺、頭部および首、食道、腎臓、膵臓、口、咽喉、咽頭(pharynx)、喉頭(larynx)、食道、顔面、脳、前立腺、乳房、子宮内膜、小腸、血液細胞、肝臓、精巣、卵巣、子宮、頸部、大腸、胃、脾臓、リンパ節または骨髄を含む。他の実施形態は、体液試料、例えば、気管支ブラシ、気管支洗浄液、気管支肺胞洗浄液(bronchial ravage)、末梢血リンパ球、リンパ液、腹水、漿液、胸水、唾液、脳脊髄液、涙液、食道洗浄液、ならびに排泄物または尿試料(例えば、膀胱洗浄液および尿)を含む。
【0157】
連鎖不平衡(LD)とは、所定の集団における各対立遺伝子の存在の別個の頻度から予測されるものよりも多い頻度での、2つ以上の異なるSNP部位における対立遺伝子の同時遺伝(例えば、選択的なヌクレオチド)をいう。独立して遺伝される2つの対立遺伝子の同時遺伝の予測される頻度は、第1の対立遺伝子の頻度に第2の対立遺伝子の頻度を乗じたものである。予測された頻度で同時に生じる対立遺伝子は、「連鎖平衡」であると言われる。対照的に、LDは、2つ以上の異なるSNP部位における対立遺伝子の間の任意の非ランダムな遺伝的関連をいい、この遺伝的関連は一般的に、染色体に沿う2つの遺伝子座の物理的な近接性に起因する。LDは、2つ以上のSNP部位が、所定の染色体上で互いに密接に物理的に近接している場合に生じ得、したがって、これらのSNP部位における対立遺伝子は、1つのSNP部位における特定のヌクレオチド(対立遺伝子)が、近くに位置する異なるSNP部位における特定のヌクレオチド(対立遺伝子)と非ランダムな関連を示す結果のために、複数の世代について分離されていないままである傾向がある。したがって、SNP部位の1つを遺伝子型決定することにより、LDであるもう一方のSNPを遺伝子型決定したものとほとんど同じ情報が生じる。
【0158】
遺伝的障害(例えば、予後またはリスク)目的のために個体をスクリーニングすることに関して、特定のSNP部位が障害をスクリーニングするのに有用であることが分かった場合、当業者であれば、このSNP部位を有するLD内に存在する他のSNP部位もまた、病状をスクリーニングするのに有用であることを認識するであろう。種々の程度のLDが、いくつかのSNPが他よりもより密接に関連している(すなわち、より強いLDである)という結果を有する2つ以上のSNPの間で遭遇され得る。さらに、染色体に沿ってLDが延びる物理的な距離は、ゲノムの異なる領域間で異なり、したがって、LDが生じるために必要とされる2つ以上のSNP部位の間の物理的分離の程度は、ゲノムの異なる領域の間で異なり得る。
【0159】
スクリーニング適用に関して、実際に疾患を生じる(原因となる)多型ではないが、このような原因となる多型とLDである多型(例えば、SNPおよび/またはハプロタイプ)がまた、有用である。このような場合、原因となる多型とLDである多型の遺伝子型は、原因となる多型の遺伝子型の予測となり、したがって、原因となるSNPにより影響を受ける表現型(例えば、疾患)の予測となる。したがって、原因となる多型とLDである多型マーカーは、マーカーとして有用であり、そして、実際の原因となる多型が未知である場合、特に有用である。
【0160】
ヒトのゲノムにおける連鎖不平衡は、以下で総説されている:Wallら、“Haplotype blocks and linkage disequilibrium in the human genome”,Nat Rev Genet.2003 August;4(8):587−97;Gamerら、“On selecting markers for association studies:patterns of linkage disequilibrium between two and three diallelic loci”,Genet Epidemiol.2003 January;24(1):57−67;Ardlieら、“Patterns of linkage disequilibrium in the human genome”,Nat Rev Genet.2002 April;3(4):299−309(erratum in Nat Rev Genet 2002 July;3(7):566);およびRemmら、“High−density genotyping and linkage disequilibrium in the human genome using chromosome 22 as a model”;Curr Opin Chem Biol.2002 February;6(1):24−30。
【0161】
疾患の表現型(例えば、癌)を有する特定のSNPおよび/またはSNPハプロタイプの寄与または関連は、本発明のSNPを使用して、その遺伝子型を有さない個体と比較して、特定の遺伝子型の結果として検出可能な形質(例えば、癌)を発現する個体、または、その後に、検出可能な形質を発現するリスクを増加もしくは減少してその遺伝子型を配置する個体を同定し得る、優れた試験を開発し得る。本明細書において記載されるように、スクリーニングは、単一のSNPまたは一群のSNPに基づき得る。素因/リスクのスクリーニングの精度を高めるために、本発明のSNPの解析は、疾患の他の多型もしくは他の危険因子(例えば、疾患の症状、病理学的特徴、家族歴、食事、環境因子またはライフスタイル因子)の解析と組み合わせられ得る。
【0162】
本発明のスクリーニング技術は、種々の方法論(例えば、ハプロタイプ決定のための個体の染色体の解析を可能にする方法、家族研究、単一精子DNA解析または体細胞ハイブリッドが挙げられる)を採用して、検出可能な形質を発症するリスクの増加もしくは減少に関連するSNPもしくはSNPパターンを試験被験体が有するかどうか、または、個体が特定の多型/変異の結果として検出可能な形質を罹患するかどうかを決定し得る。本発明の診断を用いて解析された形質は、アルツハイマー病に関連する病理および傷害において通常観察される、任意の検出可能な形質であり得る。
【実施例】
【0163】
実施例1:miRNAの結合効力を潜在的に修正し得る乳癌および卵巣癌関連遺伝子におけるSNPの同定
臨床的分類および分子的分類は、乳癌を、生物学的な重要性を有するサブグループにうまく分類している。サブグループのカテゴリーは、1)ER+および/またはPR+腫瘍、2)HER2+腫瘍、ならびに3)トリプルネガティブ(TN)腫瘍である(Perou,C.Mら、Nature 2000.406,747−52)。ER+および/またはPR+腫瘍ならびにHER2+腫瘍はともに、最も一般的(75%)であり、トリプルネガティブ腫瘍は、乳癌の約25%の割合を占めている。残念ながら、トリプルネガティブ表現型は、積極的に解明されているが不明なところが多い乳癌のサブクラスの代表的なものであり、これは、若いアフリカ系アメリカ人女性で最も蔓延している(40未満)。このサブクラスは、5年生存率が他のサブタイプよりも悪い(72%対85%)。
【0164】
本研究のためにエール大学から提供された355人の癌症例および29人の対照個体の原発腫瘍から、DNAを採取した。これらのDNA試料の中で、206個が乳房由来である。加えて、乳癌および卵巣癌を有する患者から、77個の卵巣癌DNA試料、55個の子宮癌DNA試料、17個のDNA試料を採取した。また、ニューヘーブン、コネティカット州の症例対照群を代表する29個の非癌性DNA試料も採取した。本研究に参加しているこれらの患者各人に関して、重要な医療情報(例えば、臨床情報および病理情報、家族歴、民族性ならびに生存率)は知られている。本研究に使用した試料のライブラリーは、培養され続けている。
【0165】
BRCA1遺伝子は、乳癌および卵巣癌のリスクの増加に関連しており、本研究の中心となっている。(http://genome.ucsc.eduで公的に利用可能な)カリフォルニア大学サンタクルーズ校のゲノムブラウザにしたがって、BRCA1の3’UTRを選択した。3’UTRは、各遺伝子の停止コドンから最後のエクソンの末端までの配列として定義される。それぞれ(例えば、PicTar,TargetScan,miRanda,miRNA.orgおよびMicroInspector)の初期設定パラメーターを使用した特殊アルゴリズムの方法によって、BRCA1遺伝子の3’UTR内の推定miRNA結合部位を同定した。(http://www.ncbi.nlm.nih.gov/projects/SNPで公的に利用可能な)dbSNPおよび(http://www.ensembl.org/index.htmlで公的に利用可能な)Ensembl databaseを検索することによって、miRNA結合部位に存在するSNPを同定した。
【0166】
DNA癌試料および細胞株から、BRCA1の3’UTRのPCR増幅を行った。PCR突然変異頻度を最小化するために、Ultra high fidelity KOD hot start DNA polymerase(EMD)を使用した。使用した熱サイクルプログラムは、95℃2分で1サイクル、95℃20秒、64℃10秒および72℃40秒で40サイクルを含んでいた。次いで、配列決定するために、エール大学のケック生命工学資源研究室(http://keck.med.yale.edu/)に、PCR単位複製配列を送った。新規SNPおよび既知SNPの両方の存在に関して、配列をスクリーニングした。同定したすべてのSNPを記録した。
【0167】
BRCA1に関する十分な配列決定結果を得るとすぐに、時間効率のより良い方法のハイスループット遺伝子型決定法を使用した。したがって、適切な多型専用に設計されたTaqMan PCRアッセイ(Applied Biosystems)を採用した。1個が各対立遺伝子に対するものである2個のTaqMan蛍光標識プローブを使用して、遺伝子型決定を実施した。ABI PRISM 7900HT配列検出システムおよびSDS 2.2ソフトウェア(Applied Biosystems)を使用して、分析を実施した。以下の熱サイクルプログラム:95℃10分で1サイクル、93℃15秒および60℃1分で50サイクルを使用して、癌試料上およびDNA試料の世界ライブラリー上で、TaqMan反応を行った。BRCA1用プローブのアッセイIDは、以下の通りである。
【0168】
BRCA1:
C_3178665_10(rs9911630)、
C_29356_10(rs12516)、
C_3178688_10(rs8176318)、
特注のRS3092995−0001(rs3092995)、
C_3178676_10_rs1060915)、
C_2615180_10(rs799912)、
C_3178692_10(rs9908805)、
およびC_9270454_10(rs17599948)(図6、表2)。
【0169】
研究参加者のDNA試料を保存するために、TaqMan PreAmp Master Mix Kit(Applied Biosystems)を使用した。前増幅(pre−amplification)の手順はゲノム全体を増幅しないが、その代わり、本発明者らは、目的のプローブのすべてからなる「アッセイプール」を作る。したがって、5個の異なる染色体および7個の異なる遺伝子から、18個のプローブをプールした。100個超の試料をうまく前増幅した。この方法は、すべての関連プローブを一緒にプールし、目的のゲノム領域を増幅する手段を提供する。基本的なプロトコールは、極めて低いDNA濃度で前増幅PCRを行うためのものである(結果は、わずか1.5μgの0.5ng/μlDNAから信頼性の高い結果を収集できることを示している)。次いで、前増幅産物を1:40に希釈する。そうすると、試料は、TaqMan遺伝子型決定(上記の手順)に使用できる状態になる。
【0170】
【表2】
太字の多型は、被験体の乳癌を発症するリスクを予測するのに必要な最適なSNPのセットを含む。
Taqman SNP遺伝子型決定アッセイを使用して、2個の遺伝子および約267kbに及ぶ8個のSNPを研究した。
【0171】
【表3】
*数字は、8個の異なるSNPに関して遺伝子型決定した患者の数を表す。
BRCA1では、次いで、配列決定したすべての患者を遺伝子型決定もした。
いくつかのサブタイプ、特にMPに関して直接的に配列決定できる多数の試料は、多くのまたはすべてのFFPE試料だからとは限られない。
【0172】
実施例2:乳房腫瘍および卵巣腫瘍に由来する組織試料、隣接正常組織試料ならびに正常組織試料を使用した、BRCA1内のmiRNA相補的部位における配列変異の評価
BRCA1は、1381個のヌクレオチドの高度に保存された3’UTRを有する。3’UTRは、16個の既知SNPを有する。これらのSNPの中の9個は、予測miRNA結合部位に位置し、これらの9個の中の4個は、予測シード領域結合部位に位置する。しかしながら、これまでは、これらの16個のSNPの中で、3個のSNP(rs3092995、rs8176318およびrs12516)だけが、配列決定されたDNA試料において発見されている。加えて、予測miRNA結合部位に存在する1個の新規SNP(SNP1)が同定されている。注目すべきことに、このSNPだけが、1人の患者において、腫瘍組織および隣接正常組織の両方で発見されている。結果は再現性がある(図2および3)。配列決定によって同定されており、予測miRNA結合部位を有する4個のSNPの中で、これらの2個(rs3092995およびrs12516)が、予測miRNA結合部位のシード領域に位置する(図3)。本発明者らが同定したSNPのいずれも、高度に保存された予測miRNA結合部位に位置しない。
【0173】
より具体的には、rs3092995は、あまり保存されていない2個の以下のmiRNA:hsa−miR−99bおよびhas−miR−635が結合すると予測される部位に位置する。rs3092995は、has−miR635のシード領域に位置すると予測される。rs8176318は、hsa−miR−758が結合すると予測される部位に位置する。SNP1は、hsa−miR−654およびhsa−miR−516−3pの両方が結合すると予測される部位に位置する。最後に、rs12516は、hsa−miR−637、hsa−miR−324−3pおよびhsa−miR−412が結合すると予測される部位に位置する。rs12516は、hsa−miR−637の予測シード領域に収まる(図3)。
【0174】
研究癌集団においてBRCA1 3’UTRをマッピングするとすぐに、癌DNA試料を遺伝子型決定するよりハイスループットな方法を使用した。これを達成するために、本発明者らの癌集団を配列決定する間中、3個の主要な位置するSNP専用に設計されたTaqMan PCRアッセイ(Applied Biosystems)を使用した。1個が各対立遺伝子に対するものである2個のTaqMan蛍光標識プローブを使用して、遺伝子型決定を実施した。ABI PRISM 7900HT配列検出システムおよびSDS 2.2ソフトウェア(Applied Biosystems)を使用して、分析を実施した。本発明者らの癌試料および世界DNA試料上で、TaqMan反応を実行した。
【0175】
実施例3:地域集団対世界集団におけるBRCA1 SNPの保有率
図4は、2,472人の個体を含む46個の世界集団の世界ライブラリーに由来するBRCA1 3’UTRに関する遺伝子型決定結果を示している。図4に示されるように、rs8176318およびrs12516は、一般集団において、ほとんどの場合、一緒に遺伝で受け継がれている。アフリカの民族性を除いて、それらは、それぞれ集団の31.6%および31.7%において見られる。加えて、rs3092995は、世界の大部分を通じて極めて珍しい。アフリカの民族性を除いて、rs3092995は、平均すると集団において見られない。しかしながら、これらの2つの興味深い傾向は、アフリカの集団には当てはまらない。アフリカの集団(グラフの左端のビアカピグミーからエチオピア系ユダヤ人まで、10個ある)内では、rs3092995は、集団の10.2%において見られ、rs8176318およびrs12516は、一緒に遺伝で受け継がれている可能性は低い。rs8176318およびrs12516が一緒に遺伝で受け継がれていない場合、rs12516は、rs8176318よりも常に高い保有率にあるようである(それぞれ27.8%および16.3%)。
【0176】
同時に、BRCA1 3’UTRにおける3個の同じSNPに関して、7個の癌集団およびエール大学対照の1個の集団から、384人の個体を分析した(図5)。興味深いことに、世界集団において認められた傾向(図4)は、研究癌集団を反映していない。しかしながら、類似点がいくつかある。例えば、rs3092995は、研究癌集団およびエール大学対照群の1.6%の割合で見られる。また、エール大学対照群内では、rs8176318およびrs12516は、非アフリカの世界集団と同じ傾向を示している。すなわち、非アフリカの世界集団内では、これらの2個のSNPは、集団の約31%に存在しており、本発明者らのエール大学集団内では、それらは、集団の約28%に存在しており、通常一緒に遺伝で受け継がれている。しかしながら、rs8176318およびrs12516が一緒に遺伝で受け継がれる可能性が低い様々な癌集団において認められる著しい違いがある。この傾向は、アフリカの集団において見られるものと類似する。しかしながら、この傾向をさらにより興味深くするものは、アフリカの集団内では、SNP rs12516が、集団においてrs8176318よりも高い頻度にあることである(それぞれ27.8%および16.3%)。しかし、研究癌集団では、rs8176318は、本発明者らの(HER2+を除く)乳癌集団においてrs12516よりも高い頻度にある(それぞれ26.9%および21.3%)。
【0177】
過去の結果に対応して、より参考になるSNPを用いて、17番染色体のこの領域を満たした。本発明者らの動機は2つ、すなわち、領域の系統進化を解決すること、およびハプロタイプ解析を行うことであった。これを達成するために、BRCA1を包含する5個のさらなる参考SNPを加えた(図6)。BRCA1は逆鎖上に存在するので、これらのSNPは、染色体の下端から上(3’から5’)に順序付けられる。これらの8個のSNPは、2個の遺伝子(BRCA1およびNBR1)にまたがり、約267kbに及ぶ。この大きな染色体領域によって、ハプロタイプ解析のために認められる強い連鎖不均衡にもかかわらず、本発明者らは、遺伝的変異性を観察することができる(Gu,S.,Pakstis,A.J.およびKidd,K.K.Bioinformatics 2005.21,3938−9)。ハプロタイプ解析は、目的の遺伝子におけるSNPの影響を解析するための強力な方法である。ハプロタイプ解析を行うことの背後にある理論は、疾患遺伝子がネガティブな選択圧を受けた場合、疾患を保有する染色体における連鎖変異は、集団内でより低頻度にある可能性があるということである。
【0178】
BRCA1にまたがるこれらの8個のSNPの進化を決定した(図7)。図6において、各SNPは、ハプロタイプ位置(1から8)に割り当てられる。これらの位置は、図7において認められる「偽の」ハプロタイプと相互に関連している。例えば、祖先配列は、8文字「GGCCACTA(配列番号8)」であり、各文字は、(左から右に)番号付けされた位置と相互に関連している。SNPの祖先状態を決定するために、本発明者らのヒト試料で使用される同じTaqManアッセイを採用したが、しかしながら、非ヒト霊長類に由来するゲノムDNAを遺伝子型決定するのにこれらのアッセイを使用した。10個の最も一般的なハプロタイプは、祖先ハプロタイプへの変異の蓄積によって説明することができる。直接的に認められたハプロタイプの大部分は、順序付けることができ、1個の派生ヌクレオチド変化によって相違している。より具体的には、図7において、枠で囲まれた2個のハプロタイプのうちどちらが、採用されたSNPを有する系統において最初に生じたかということに関しては未解決であった。AGCCATTA(配列番号2)ハプロタイプは、現在のところ、世界で最も一般的に認められるハプロタイプである。GAACGCTA(配列番号3)およびGAACGCTG(配列番号4)の2個のハプロタイプは、世界のすべての地域に存在している。AGCC−GCTG(配列番号19)ハプロタイプは、新世界(これは、南アメリカ、中央アメリカおよび北アメリカの地域を示す(集団の詳細に関しては、ALFRED:http://alfred.med.yale.edu/参照))においてのみ見られる。
【0179】
世界集団および研究癌集団の間で、ハプロタイプ保有率を比較した。この比較よって、2個の群の間で認められたハプロタイプの間でも、乳癌および/または卵巣癌に対するリスクの増加に関連する1つ以上のハプロタイプの間でも、著しい違いが明らかになった。
【0180】
2,472人の個体を含む46個の世界集団における8個のSNP(図8)を遺伝子型決定した。ハプロタイプ進化のデータに基づいて、図8におけるハプロタイプのデータを予測した。より具体的には、認められた祖先ハプロタイプであるGGCCACTA(配列番号8)は、アフリカの民族性においてのみ見られた。最も一般的なハプロタイプであるAGCCATTA(配列番号2)は、世界中で高いレベルで見られた。GAACGCTA(配列番号3)およびGAACGCTG(配列番号4)の2個のハプロタイプも同様に、世界中で見られた。(ハプロタイプ進化で予測されたように)組換えハプロタイプであるAGCC−GCTG(配列番号19)は、新世界においてのみ実際に見られた。このグラフは、BRCA1 3’UTRを遺伝子型決定する際に見られたパターン(図4)を連想させる。図4を論じた際に言及したように、アフリカの集団は、極めて異なるパターンを示す。この観察結果は、ここでも当てはまる。図8において、最初の10個の民族性は、アフリカの家系(ビアカピグミーからエチオピア系ユダヤ人まで)からなり、固有のハプロタイプパターンを示している。例えば、以下のハプロタイプ、GGCCACCA(配列番号7)、GACGACTA(配列番号5)、GACCACTA(配列番号20)およびAGCCACTA(配列番号1)は、アフリカ人に全く固有である。最後に、配列標識された「残り」は、集団においてまれな頻度で存在する多様なハプロタイプを表す可能性が最も高い。46個の集団は、サイズがわずか26人の個体(マサイ族(Masia))から222人もの個体(ラオス人)まである。各集団は、平均して、示される96.6人の個体を有する。
【0181】
図9は、合計で384人の個体となる7個の癌集団および1個のエール大学対照群からの、本発明者らのハプロタイプのデータを示す。重要なことに、一般的な世界ハプロタイプの傾向と図9の比較に関して、多くの同じハプロタイプが認められた。例えば、AGCCATTA(配列番号2)ハプロタイプは、今もなお最も一般的に認められるものであった。加えて、GAACGCTA(配列番号3)およびGAACGCTG(配列番号4)の2個のハプロタイプは、世界中で見られ、図9において示されるどの集団でも見られた。図8におけるアフリカの集団の中で一般的であったGGCCACCA(配列番号7)ハプロタイプは、図9においてもしばしば認められた。これは、GGCCACCA(配列番号7)ハプロタイプが認められたすべての集団において、アフリカ系アメリカ人がいるからかもしれない。GGCCACCA(配列番号7)ハプロタイプが認められなかった図9における集団だけが、乳房/卵巣集団であり、この群は、白人だけから構成されていた(民族性データに関する図10参照)。しかしながら、注目すべきことに、乳癌のTNサブタイプ内で認められたハプロタイプは、世界集団だけでなく、他の癌集団およびエール大学対照群とも極めて著しく異なっていた(図9)。特に興味深い3個のハプロタイプがある。これらのハプロタイプは、GGACGCTA(配列番号6)、GGCCGCTA(配列番号9)およびGGCCGCTG(配列番号10)である(図9および表4)。これらの3個の固有ハプロタイプは、TN癌群において認められたハプロタイプの12%を構成しており、(おそらく、残りを除く)世界ハプロタイプにおいては表れなかった。GGCCGCTA(配列番号9)ハプロタイプは、7個の癌群すべてにおいて見られるので、特に興味深い。加えて、TN乳癌群は、ハプロタイプの約18%を構成する残りのハプロタイプの最も大きい集団を有する(図9)。残りのハプロタイプに関する基準は、すべてのカテゴリーにわたるすべての試料の1%未満である。TN内では、残りは、ハプロタイプ「GGACGCTG」(配列番号21)である。このハプロタイプは、TNハプロタイプの4%を構成している。しかしながら、それは、他のカテゴリーにおいてはめったに認められないので、残りとして分類される(それは、卵巣において1回、および子宮癌群において1回認められる。)。表4は、これらの固有で興味深いハプロタイプ内にある影響されたSNPのより厳密な分析を示す。祖先ハプロタイプであるGGCCACTA(配列番号8)、および最も一般的なハプロタイプであるAGCCATTA(配列番号2)は、比較する目的で示されている。SNP rs8176318、rs1060915およびrs17599948は、固有ハプロタイプをもたらす典型的な変異部位である。rs8176318は、BRCA1の3’UTRに位置しており、予測miRNA結合部位にも位置しているので、重要である。rs1060915もまた、BRCA1のコード領域のエクソン12に位置しているので、重要である。コード領域もまた、miRNAに関する標的部位である。
【0182】
【表4】
下線が引かれたdbSNP#は、乳癌または卵巣癌を発症するリスクの予測に関する、多型の本質的な部位を表す。
rs1060915 SNP:変異型対立遺伝子(A)がホモ接合であり、異なる民族群においてこの突然変異の影響を研究する場合、アフリカ系アメリカ人の乳癌対対照の関連性は、統計的に有意である(p=0.01)。アフリカ系アメリカ人のトリプルネガティブ(TN)乳癌対対照へと関連性をさらに詳細化すると、結果はより有意である(p=0.005)。
【0183】
これらの癌群をさらに分析するために、SNPデータを他の既知TN乳癌リスクファクターに関連付けた。図11は、コード領域突然変異状態ごとのBRCA1ハプロタイプデータを表す。本研究において、110人の患者をハプロタイプごとにBRCA1検査し、分析した。BRCA1突然変異は、TN乳癌において一般的であるので、GGCCGCTA(配列番号9)およびGGCCGCTG(配列番号10)の2個の固有ハプロタイプが、集団の8%を構成するBRCA1突然変異保有者の間に見られることが予想された。
TN乳癌が固有のSNPシグネチャーを有し、アフリカの集団の多様性の結果ではないことを確認するために、図12および13を作成した。実際、アフリカ系アメリカ人および白人の民族性によってエール大学対照群およびTN群を比較すると、TNアフリカ系アメリカ人は、対照民族性およびTN白人の両方とも異なっていたことを、図12は確認している。特に、GGACGCTA(配列番号6)およびGGCCGCTA(配列番号9)のハプロタイプは、TNアフリカ系アメリカ人において多く見られる。TN乳癌は、若いアフリカ系アメリカ人女性(すなわち、40歳(yo)未満)の間で最もよく見られ、興味深いので、このことは予想されていた。図13において、エール大学対照群およびTN乳癌群内で、異なる民族性を年齢ごとにさらに比較した。年齢ごとに比較すると、GGACGCTA(配列番号6)ハプロタイプがアフリカ系アメリカ人集団内でのみ見られ、GGCCGCTA(配列番号9)ハプロタイプが白人に限られていたことは明白である。GGCCGCTA(配列番号9)ハプロタイプは、若い集団(51歳以下)において主に見られたが、しかしながら、年長のアフリカ系アメリカ人においても見られた。最後に、TNアフリカ系アメリカ人(AA)集団内では、祖先ハプロタイプは、より年長のTN AA群において極めてより多く見られる。より若いTN AA群においては、GGCCACCA(配列番号7)ハプロタイプは、より多く見られる。これは、系統データに合っている(図7)。
【0184】
実施例4:乳癌リスクに関連する珍しいBRCA1ハプロタイプ
乳癌を発症するリスクの増加を有する女性を同定する遺伝子マーカーは存在するが、受け継いだリスクの大部分は、分かりにくいままである。多数のBRCA1コード配列突然変異が乳癌リスクに関連するが、マイクロRNA(miRNA)結合を破壊するBRCA1多型における突然変異は、機能的であり得、癌リスクの遺伝子マーカーとして作用し得る。したがって、BRCA1の3’UTRにおけるこのような多型、およびこれらの機能的な多型を含むハプロタイプが、乳癌リスクに関連する可能性があるという仮説を検証した。配列決定および遺伝子型決定を通じて、乳癌集団で多型性であるBRCA1において、3個の3’UTR変異体を同定したところ、該変異体の1個(ホモ接合性の変異型対立遺伝子Aであるrs8176318)は、アフリカ系アメリカ人女性に関して重要な癌関連性を示し、アフリカ系アメリカ人女性に関するトリプルネガティブ乳癌を発症するリスクを特異的に予測する(それぞれp=0.04およびp=0.02)。ハプロタイプ解析を通じて、乳癌患者(n=221)が、対照集団では通常見られない(すべての乳癌染色体の9.50%および対照染色体の0.11%、p=0.0001)これらの3’UTR変異体を含む5個の珍しいハプロタイプを持っている、ということが見出された。5個の珍しいハプロタイプの中の3個は、rs8176318 BRCA1 3’UTR機能的対立遺伝子を含む。さらに、これらのハプロタイプは、BRCA1突然変異乳癌患者においてめったに見られないので(1/129=0.78%;1/129患者または1/258染色体)、BRCA1コード領域突然変異のバイオマーカーではない。これらの珍しいBRCA1ハプロタイプは、乳癌リスクの増加の新しい遺伝子マーカーの代表的なものである。
【0185】
材料と方法
研究集団
エール大学のヒューマン・インベスティゲーション・コミッティー(Human Investigation Committee)の承認後、HICプロトコール#0805003789に基づいて、エール大学/ニューヘーブン病院(ニューヘーブン、コネティカット州)で処置を受けている乳癌患者由来の試料を、合計221人の承諾者から採取したところ、試料は、180個の腫瘍FFPEおよび41個の生殖系列DNA供給源(それぞれ81.4%および18.6%)からなった。22個の血液および19個の唾液供給源(それぞれ53.7%および46.3%)から、生殖系列DNA試料を採取した。年齢、民族性および癌の家族歴などの患者データを収集した。病理学的分類によって、乳癌サブタイプを規定した。エール大学/ニューヘーブン病院から対照を採用し、非黒色腫皮膚癌を除く癌のあらゆる経歴を持たない者を対照に入れた。すべての試料は唾液試料であった。年齢、民族性および家族歴などの情報を記録した。遺伝子型および癌関連性のBRCA1 3’UTR分析のために、194個の生殖系列DNA対照を使用し(92人のヨーロッパ系アメリカ人および102人のアフリカ系アメリカ人)、そして、既知の腫瘍サブタイプおよび民族性を持つ乳癌患者由来の205個の腫瘍FFPEならびに生殖系列DNA試料を使用した。ロッテルダム家族性癌診療所を通じてエラスムス大学医療センターで、129人の非血縁BRCA1突然変異保有者を突き止め、後述のように末梢血試料からDNAを単離した。
【0186】
世界集団に関して、本発明者らは、エール大学における本発明者らの資源(世界中からの46個の集団を代表する2,250人の非血縁個体)を使用した。この資源は、遺伝学研究(Chin LJら、Cancer research 2008;68(20):8535−40;Speed WCら、The pharmacogenomics journal 2009;9(4):283−90;Speed WCら、Am J Med Genet B Neuropsychiatr Genet 2008;147B(4):463−6;Yamtich Jら、DNA repair 2009;8(5):579−84.)の中でよく記録されている。本研究で示された46個の集団は、10人のアフリカ人(ビアカピグミー(Biaka Pygmy)、ムブティピグミー(Mbuti Pygmies)、ヨルバ族、イボ族、ハウサ族、チャガ族、マサイ族、サンダウェ族、アフリカ系アメリカ人およびエチオピア系ユダヤ人)、3人の南西アジア人(イエメン系ユダヤ人、ドルーズ人およびサマリア人)、10人のヨーロッパ人(アシュケナージ系ユダヤ人、アディゲ人、チュバシュ人、ハンガリー人、アーケインジェル系ロシア人(Archangel Russian)、ボログダ系ロシア人、フィンランド人、デーン族、アイルランド人およびヨーロッパ系アメリカ人)、2人の北西アジア人(コミジリエーン(Komi Zyriane)およびハンティ族)、1人の南アジア人(南インドのケララの住民)、1人の北東シベリア人(ヤクート族)、2人の太平洋諸島出身者(ナシオイ系メラネシア人およびミクロネシア人)、9人の東アジア人(ラオス人、カンボジア人、サンフランシスコ出身の中国人、台湾漢民族、客家、韓国人、日本人、アミ族およびアタルヤ族)、4人の北アメリカ人(シャイアン、アリゾナ出身のピマ族、メキシコ出身のピマ族、マヤ人)ならびに4人の南アメリカ人(ケチュア族、ティクナ族、ロンドニア系スルイ族、カリチアーナ族)を含む。それぞれの集団試料に関係するヒト被験体研究を管理する委員会によって承認されたプロトコールの下で、すべての被験体がインフォームドコンセントに同意した。試料の説明および試料のサイズは、Allele Frequency Database(http://alfred.med.yale.edu)で集団名を検索することによって、および過去の刊行物(Cheung KHら、Nucleic acids research 2000;28(1):361−3)で見ることができる。樹立および/または生育されたリンパ芽球様細胞株から、DNA試料を抽出した。形質転換、細胞培養およびDNA増幅の方法は、記載されている(Anderson MA およびGusella JF.In vitro 1984;20(11):856−8)。すべての志願者は明らかに健康であり、そのほかの点では、すべての関連する施設内倫理委員会によって承認された手続きの下で適切なインフォームドコンセントを得た後、成人正常な被験体男性試料または成人正常な被験体女性試料を採取した。
【0187】
3’UTR配列の進化
RecoverAll Total Nucleic Acid Isolation Kit(Ambion)を使用して、凍結されたFFPE腫瘍乳房組織からDNAを単離し、そしてDNeasy Blood and Tissue kit(Qiagen)を使用して、血液および唾液からDNAを単離した。KOD Hot Start DNA polymerase(Novagen)ならびにこの配列に特異的なDNAプライマー:BRCA1:5’−GAGCTGGACACCTACCTGAT−3’(配列番号22)および5’−GAGAAAGTCGGCTGGCCTA−3’(配列番号23)を使用して、BRCA1の3’UTR全体を増幅した。QIAquick PCR purification kit 161(Quiagen)を使用してPCR産物を精製し、ネスト化プライマー:BRCA1:5’−CCTACCTGATACCCCAGATC−3’(配列番号24)および5’−GGCCTAAGTCTCAAGAACAGTC−3’(配列番号25)を使用して配列決定した。
【0188】
マーカータイピング
ハイスループット遺伝子型決定に関して、各SNP位置にある対立遺伝子を同定するために、TaqMan 5’ヌクレアーゼアッセイ(Applied Biosystems)を特別に設計した。非ヒト霊長類−3匹のボノボ(Pan paniscus)、3匹のチンパンジー(Pan troglodytes)、3匹のテナガザル(Hylobates)、3匹のゴリラ(Gorilla gorilla)および3匹のオランウータン(Pongo pygmaeus)に関するゲノムDNAを遺伝子型決定するための同じTaqManアッセイを使用することによって、本発明者らは、採用した8個のSNPの祖先状態を決定した。
【0189】
統計
関連性およびフィッシャー直接確率検定のカイ二乗検定を使用して、集団全体の遺伝子型頻度を比較した。関連性のカイ二乗検定を使用して、ハプロタイプデータの有意性を評価した。p>0.05の場合、p値は統計的に有意であると考えた。各民族集団内の対照の間で、ハプロタイプ内のすべての部位は、ハーディワインベルグ平衡にしたがっている。本発明者らは、PHASE(集団データに基づく、ハプロタイプ再構成および組換え率推定のためのソフトウェア)を使用して、部分母集団の情報なしで、患者および対照個体(30、31)のハプロタイプを推測した。PHASEソフトウェアは、ハプロタイプ配置の確実性の評価を提供する。BRCA1遺伝子の非常に単純なハプロタイプ構造を考慮すると、PHASEアルゴリズムは極めて正確であった。評価する必要がなかったハプロタイプの中で、PHASEは、99%の確実性で本発明者らの集団を評価した。
【0190】
結果
BRCA1 3’UTRにおけるSNPの同定
多数の既知のBRCA1 3’UTR SNPがある(表5)。乳癌患者において、これらの既知の多型頻度を同定するために、および/または、新規SNPを同定するために、本発明者らは、3個の既知の乳癌サブタイプを持つ乳癌患者(TN=7、HER2+=18およびER/PR+/HER2−=14)において、BRCA1の3’UTR全体を配列決定した。これらの患者におけるBRCA1 3’UTR全体の最初のスクリーニングによって、過去に報告された3個の機能的なSNP:rs12516、rs8176318およびrs3092995だけに存在する変異を同定した(表5)。加えて、本発明者らは、BRCA1 3’UTRにおいて、新規SNPを同定した。BRCA1における新規SNPは、6824G/Aまたは5711+1113G/Aである。これまでに見られなかったA対立遺伝子に関して、61歳のアフリカ系アメリカ人HER2+患者において、このSNPをヘテロ接合として同定した。集団全体に存在するこれらの変異体の頻度をよりよく評価するために、本発明者らは、46個の世界的な集団を構成する2,250人の非癌性個体において、集団特異的な遺伝子型決定を実施した(図4A)。rs12516、rs8176318およびrs3092995の同定した3個のBRCA1 3’UTR SNPは、集団において強い連鎖不均衡にあり、民族性によって異なる。
【0191】
【表5】
コード鎖上に存在する既知のBRCA1 3’UTR SNPのリスト。多型の位置は、dbSNPビルド130に基づいている。
*研究した3個のSNP。
†これらはポリAの変異体である。本発明者らは、それらをSTRPまたは短い縦列反復配列の多型として分類した。チンパンジー、オランウータン(orangatan)およびヒトの参照配列に基づくと、STRPは複合体である:A16−19G2A3−4。
【0192】
【表6】
39人の乳癌患者からBRCA1 3’UTR全体を配列決定した。認められた遺伝子型は、G/G−C/C−C/C、A/G−A/C−C/C、A/A−A/A−C/CおよびG/G−A/C−G/Cであった。位置は、それぞれrs12516、rs8176318およびrs3092995である。対立遺伝子Aは、位置rs12516およびrs8176318における派生対立遺伝子である。対立遺伝子Gは、rs3092995における派生対立遺伝子である。
【0193】
対照集団における民族性ごとに同定した3’UTR SNPにおいて重要な変異が認められたので、続いて、異なる民族性の乳癌患者におけるこれらのSNPの変異を決定した。130人の乳癌ヨーロッパ系アメリカ人患者および38人の乳癌アフリカ系アメリカ人患者において、これらのSNPを遺伝子型決定したところ、これらの群全体に変異を認められた(図4B)。これらのSNPと腫瘍リスクとの関連性を決定するために、乳癌患者および民族性対応対照の間で、これらのSNPの頻度を比較した。rs8176318においてホモ接合型(A/A)である珍しい変異体が、アフリカ系アメリカ人に関する乳癌と非常に関連する207であることを決定した[オッズ比(OR)、9.48;95%信頼区間(CI)、1.01−88.80;p=0.04]。乳癌のヨーロッパ系アメリカ人とrs8176318 SNPとの間に、腫瘍関連性は認められなかった(表7)。
【0194】
【表7】
無条件ロジスティック回帰モデルにおいて、乳癌(BC)サブタイプならびに人種[ヨーロッパ系アメリカ人(EA)およびアフリカ系アメリカ人(AA)]による、オッズ比(OR)および95%信頼区間(CI)を調整した。太字の値は、統計的な腫瘍関連性を示す。丸括弧内の数字は、各群の患者数を指す(第一列目)。
【0195】
BRCA1機能不全は乳癌サブタイプの間で異なるので、次いで、民族性および乳癌サブタイプごとに、3個の3’UTR SNPを評価した(図14)。rs8176318のホモ接合変異型が、アフリカ系アメリカ人女性の間で、TN乳癌のリスクと非常に関連することを決定した[OR、12.19;95%CI、1.29−115.21、p=0.02)。あらゆる他のSNPに関して、または、ER/PR+もしくはHER2+乳癌サブタイプに関して、関連性は認められなかった(表10)。
【0196】
【表10】
無条件ロジスティック回帰モデルにおいて、乳癌(BC)サブタイプならびに人種[ヨーロッパ系アメリカ人(EA)およびアフリカ系アメリカ人(AA)]による、オッズ比(OR)および95%信頼区間(CI)を調整した。太字の値は、統計的な腫瘍関連性を示す。丸括弧内の数字は、各群の患者数を指す(第一列目)。ここで、NAは、腫瘍サブタイプにおける遺伝型の表示がなかった場合に使用され、これは、群を構成する患者数が少ない結果である可能性が高い。
【0197】
BRCA1ハプロタイプ進化および頻度
BRCA1領域をよりよく評価するために、本発明者らは、本発明者らの乳癌患者において本発明者らが同定した3個の3’UTR SNPを囲んでいる過去に報告された5個のさらなるタグ付きSNP(Kidd JRら、(abstract/program#58).the 53rd Annual Meeting of The American Society of Human Genetics,November 4−8th,2003,Los Angeles,California 2003に出席)を加えた。合計8個のSNPは、267 kbに及ぶ(表2)。この領域全体は高いLDを有し、本発明者らのハプロタイプを構成する8個のSNPすべての間のヘテロ接合性は、一般的に高い(30から50%)(http://alfred.med.yale.edu)(Cheung KHら、Nucleic acids research 2000;28(1):361−3;Kidd JRら、(abstract/program #58).the 53rd Annual Meeting of The American Society of Human Genetics,November 4−8th,2003,Los Angeles,California 2003に出席)。
【0198】
これらの8個のSNPを使用して、世界ハプロタイプ頻度を作製した(図8)。認められた一般的なハプロタイプのすべては、祖先ハプロタイプへの変異の蓄積によって説明することができる(図7)。直接的に認められたハプロタイプの大部分は、順序付けることができ、1個の派生ヌクレオチド変化によって相違している;ある事例では、2個の変化が必要とされ、別の事例では、組換えが認められる。合計で、これらは3本の枝をつくり、それぞれは、祖先ハプロタイプに由来する単一のヌクレオチド変化に端を発する。注目すべきことに、(3から5個のハプロタイプを持つ)アフリカ以外に対して、(6から9個の示されるハプロタイプを持つ)アフリカにおいて、ハプロタイプ多様性がかなり高いことが見出された。祖先ハプロタイプGGCCACTA(配列番号8)は、ほとんどアフリカにおいてのみ見られる。世界的に見られる最も一般的なハプロタイプであるAGCCATTA(配列番号2)は、アフリカ以外のすべての集団において非常に多い。
【0199】
乳癌患者におけるBRCA1ハプロタイプ
乳癌患者におけるこれらの8個のSNPからなるハプロタイプをさらに研究して、非癌性患者と乳癌患者との間でこれらのBRCA1ハプロタイプに違いがあったかどうかを決定した。本発明者らの乳癌集団では極めて豊富だが(42/442すべての評価した乳癌染色体)、世界対照集団では非常に珍しい5個のハプロタイプ(GGCCGCTA[配列番号9、#1]、GGCCGCTG[配列番号10、#2]、GGACGCTA[配列番号6、#3]、GGACGCTG[配列番号21、#4]およびGAACGTTG[配列番号26、#5])を同定した。4500個の非癌性染色体の世界試料では、GGACGCTA(配列番号6)ハプロタイプ(#3)が3番染色体上で認められ、GGACGCTG(配列番号21)ハプロタイプ(#4)が2番染色体上に存在したが、GGCCGCTA(配列番号9)(#1)、GGCCGCTG(配列番号10)(#2)およびGAACGTTG(配列番号26)(#5)ハプロタイプは見られなかった(0.1%未満)。これは、非癌性対照におけるこれらのハプロタイプに関する0.1%の全体的な世界頻度対乳癌患者染色体に関する9.50%の頻度を示している(p<0.0001)(図16A)。2個のハプロタイプ(それぞれ#3および#4)は、SNP rs8176318を有する3’UTR内の派生対立遺伝子Aによって特徴付けられる。3番目の珍しいハプロタイプ(GAACGTTG(配列番号26)、#5)は、rs8176318およびrs12516という2個の3’UTR多型を有する派生対立遺伝子(A)を有する。
【0200】
研究結果によって、これらのハプロタイプが民族性によって異なっていたことが実証されたので、これらの珍しい乳癌ハプロタイプを適切な民族集団とよりよく比較するために、乳癌患者および対応対照を、民族性ごとにさらに評価した。民族性対応対照は、合計194人の個体(エール大学対照の白人のアメリカ人およびアフリカ系アメリカ人の集団を含む、102人のアフリカ系アメリカ人ならびに92人のヨーロッパ系アメリカ人)から構成された。白人のアメリカ人乳癌患者の8.84%およびアフリカ系アメリカ人乳癌患者の11.84%が、珍しいハプロタイプを含んでおり、そしてやはり、これらのハプロタイプは、民族性対応対照においてはめったに見られず、GGACGCTA(配列番号6)ハプロタイプ(#3)だけが、1個のヨーロッパ系アメリカ人対照染色体上に見られることが見出された(0.26%、1/388染色体、p<0.0001、図16B、表8)。
【0201】
【表8−1】
【0202】
【表8−2】
5個の珍しいハプロタイプを有する、乳癌患者および対照のリスト。発症年齢および民族性は、可能であれば、リストに記載される。NK=情報が利用不可であるか不明である。試料は、正常組織および腫瘍の両方に由来する。
【0203】
乳癌サブタイプごとの、乳癌患者におけるBRCA1ハプロタイプ
既知のBRCA1コード配列突然変異は乳癌サブタイプによって異なるので、次いで、珍しいハプロタイプがどのようにして、乳癌サブタイプの間に分布したかを決定した。珍しいハプロタイプは、TN、ER/PR+とHER2+サブタイプとの間で著しく異なり、TNサブグループは、これらの珍しいハプロタイプを最も高い割合14.85%(30/202染色体、他のものと比較してp=0.014)で有し、次いで、ER/PR+乳癌サブタイプでは8.09%(11/136 ER/PR+染色体)であり、HER2+サブタイプでは最も低い1%(1/104)である(図17A、表9)。GGACGCTG(配列番号21)ハプロタイプ(#4)だけが、TN腫瘍と関連しており、他の腫瘍サブタイプと関連していなかった。次いで、民族性および乳房腫瘍サブタイプの両方で、珍しいハプロタイプを評価した(図17B)。2個のハプロタイプ(それぞれ#2および#5)は、乳癌ヨーロッパ系アメリカ人に固有であった。興味深いことに、TNサブグループが、残りのハプロタイプの最も高い割合を占めている(9.9%)。残りは、研究したすべての集団において1%未満の頻度を有するすべてのハプロタイプの合計として定義される。これらの知見は、乳癌のTNサブタイプが、この領域全体を通じて最大量の変動性を有し、珍しいハプロタイプと最も強く関連していることを示している。
【0204】
【表9】
ハプロタイプ頻度のばらつきに関して、民族性対応対照と比較して、ヨーロッパ系およびアフリカ系アメリカ人乳癌患者を評価した。9個の一般的なハプロタイプが示されている。乳癌患者では一般的だが、対照の間では珍しい5個のさらなるハプロタイプもまたリストに記載されている。ゼロではない評価の残りのハプロタイプは合算され、残りとしてリストに記載されている。p<0.05であれば、値は、有意であると考えられる。*この表における「残り」のハプロタイプは、具体的に名付けられていないゼロではないハプロタイプの累積評価を表しており、したがって、単一配列を表していないので、配列識別子を割り当てなかった。
【0205】
年齢およびBRCA突然変異状態ごとのBRCA1ハプロタイプ
年齢ごとに珍しいハプロタイプを評価して、より若い(閉経前の)女性が、閉経後の女性と比較して、これらの珍しいハプロタイプのより高い割合を占めるかどうかを決定した。珍しいハプロタイプは、52歳未満の乳癌患者においてより多く見られる;しかしながら、この傾向は、統計的に有意ではなかった(図15)。
【0206】
珍しいBRCA1ハプロタイプが、BRCA1コード配列突然変異と関連しているかどうかもまた決定したが、本研究で検査した患者に関して、BRCA1突然変異状態は不明であった。したがって、129人の非血縁の別の集団
本発明者らの珍しいBRCA1ハプロタイプの存在に関して、BRCA1コード領域突然変異がヘテロ接合であるヨーロッパ人の乳癌患者を検査した。BRCA1コード配列突然変異の患者1人だけが、珍しいハプロタイプ(0.8%、GAACGTTG(配列番号26)、#5)を有していた。残りの4個の珍しいハプロタイプは、この患者の集団において見られず、このことは、これらの珍しいBRCA1ハプロタイプは、一般的なBRCA1コード配列突然変異の代理マーカーではなく、むしろこれらの珍しいBRCA1ハプロタイプは、乳癌に関連するBRCA1変異に固有の新規バイオマーカーであるということを示唆している。
【0207】
考察
本研究によって、299人の乳癌患者が、対照集団では通常見られない5個の珍しいBRCA1ハプロタイプを持つことが見出された。これらのハプロタイプは、BRCA1 3’UTR SNPを含んでおり、その中の1個(rs8176318)は、アフリカ系アメリカ人の間で重要な癌関連性を示し(p=0.04)、そしてさらに、民族性対応対照と比較すると、アフリカ系アメリカ人の間でトリプルネガティブ乳癌に関するリスクファクターである(p=0.02)。これらのハプロタイプは、一般的なBRCA1コード領域突然変異と関連していない。これらの知見は、珍しいBRCA1ハプロタイプが、乳癌を発症するリスクの増加の新しい遺伝子マーカーの代表的なものであるとともに、BRCA1機能に影響を与え、乳癌リスクの増加をもたらす、BRCA1における非コード配列変異の代表的なものでもあることを明示している。
【0208】
これまでに、BRCA1領域におけるハプロタイプ解析を実施して、散在性乳癌との関連性を決定する研究があったが、しかしながら、これらの従来の研究者らは、ほとんど成果がなかった(Cox DGら、Breast Cancer Res 2005;7(2):R171−5;Freedman MLら、Cancer research 2005;65(16):7516−22)。
【0209】
本研究は、ハプロタイプ解析の一部として、BRCA1の3’UTR非コード調節領域において珍しい機能的な変異体を含む散在性乳癌の、最初のBRCA1ハプロタイプ研究である。3’UTR内の変異体が遺伝子発現制御を通じて癌に対する感受性を増加させるという仮説は、急速に、証拠によって裏付けることができるようになってきている(Chin LJら、Cancer research 2008;68(20):8535−40;Landi Dら、Carcinogenesis 2008;29(3):579−84)。珍しいハプロタイプにおいて、乳癌リスクの増加が、ハプロタイプ内の1個の単一変異体であるかまたは対立遺伝子の組み合わせであるかを、本発明者らは決定することができないが、各ハプロタイプを含む機能的な3’UTR変異体と他の変異体の組み合わせが、重要なBRCA1機能不全を予測するとの仮説が立てられている。
【0210】
本発明者らのハプロタイプ解析において、サブタイプごとに散在性乳癌をさらに分析した。BRCA1突然変異の結果として生じる乳癌は、TN(57%)(Atchley DPら、J Clin Oncol 2008;26(26):4282−8)およびER+乳癌(34%)(Tung Nら、Breast Cancer Res;12(1):R12)と最も高い頻度で関連しており、そして、HER2+乳癌(約 3%)(Lakhani SRら、J Clin Oncol 2002;20(9):2310−8)においてめったに見られないので、珍しいハプロタイプがTNおよびER+乳癌において主に存在するという本発明者らの知見は、それらが真のBRCA1機能不全に関連しているという本発明者らの仮説を、さらに裏付けている。
【0211】
これからの研究は、本発明者らのBRCA1ハプロタイプ内の個々のSNPのいくつかに焦点を合わせるであろう。BRCA1シノニマスエクソン突然変異であるタグ付きSNP rs1060915が特に興味深く、これは、5個の珍しいハプロタイプのすべてにおいて、派生対立遺伝子Gを伴っている。rs1060915は、意義不明の変異体(VUS)である。乳癌インフォメーションコア(Breast Cancer Information Core)(BIC)は、野生型配列との比較に基づき導かれるmRNAおよびタンパク質レベルに基づいて、このVUSを、中立または臨床上ほとんど重要ではないと分類している(http://research.nhgri.nih.gov/bic/)。このSNPは、高リスクの患者集団において通常見られることから、Myriad Genetics,Inc.,は、それを高リスクの女性と関連付け、それを多型性に分類しているが、本研究とは対照的に、彼らは、乳癌または卵巣癌を発症するリスクの増加のバイオマーカーとしての役割を、このSNPに割り当てていない。具体的には、Myriadは、rs1060915が、被験体の乳癌のTNサブタイプを発症するリスクの重要な予測因子であることを示していない。
【0212】
最近、BRCA1における類似のコード配列SNPが、miRNA結合部位に位置しており、腫瘍感受性に影響を与え得ることが示された(Nicoloso MSら、Cancer research;70(7):2789−98)。miRNA結合に影響を与えるエクソンSNPと組み合わせた、miRNAの崩壊をもたらす3’UTR SNPは、珍しいハプロタイプにおいて乳癌リスクの増加をもたらす1個のメカニズムである。
【0213】
乳癌のTNサブタイプにおける珍しいハプロタイプの豊富さは、とりわけ特筆すべきである。このサブタイプだけが、対照と比較して、本発明者らの珍しいハプロタイプと統計的に関連しているのではなく(p<0.0001)、TN乳癌もまた、本発明者らの珍しいハプロタイプと関連している最も一般的なサブタイプである。TN腫瘍はエストロゲン刺激(未経産、肥満、ホルモン補充療法)と関連していないので、TN乳癌に関するリスクファクターは、乳癌の他の形態とは異なっている。TNとエストロゲン刺激の非関連性は、さらなる遺伝子的原因が存在することを強く示唆している。TN乳癌は最悪の結果を出すので、乳癌のこのサブタイプを発症するリスクを有する者を同定することが、おそらく最も重要である。
【0214】
本発明者らの研究の欠点としては、珍しいハプロタイプを持つ患者が少数であることが挙げられ、このことは、未対応の年齢および人種との潜在的に重要な関連性を妨げているかもしれない。加えて、BRCA1コード領域突然変異に関してヘテロ接合であるヨーロッパ人の乳癌患者の集団は、ほとんどが西ヨーロッパの白人であり、混血ヨーロッパ人の家系はおそらくわずかな割合である。民族的に限られた群は、BRCA1突然変異保有者の間の珍しいハプロタイプの知見を限定するかもしれない。しかしながら、珍しいハプロタイプと乳癌の密接な関連性は、これらの知見を、さらにより強く統計的に重要にする。本研究は、これらの珍しいハプロタイプが、乳癌を発症するリスクの増加の遺伝子マーカーとして使用できるという証拠を提供し、そして、より大きなサンプルサイズで結果を有効なものにするとともに、これらのハプロタイプの生物学的機能およびそれらの乳癌リスクの増加のメカニズムをさらに解明するという今後の活動を支援する。
【0215】
他の実施形態
本発明は、その詳細な説明に関連して説明してきたが、前述の説明は、添付の特許請求の範囲によって定義される本発明の範囲を例証することを意図しており、制限することを意図していない。他の形態、利点、および改変は、以下の特許請求の範囲内に含まれる。
【0216】
本明細書において参照した特許および科学論文は、当業者が利用できる知識を確立している。本明細書において引用されるすべての米国特許および公開されたまたは未公開の米国特許出願は、参照により本明細書に組み込まれる。本明細書において引用された公開されたすべての外国特許および特許出願は、参照により本明細書に組み込まれる。本明細書において引用されるアクセッション番号によって示されるGenbenkおよびNCBI提出物は、参照により本明細書に組み込まれる。本明細書において引用される他のすべての公表された参考文献、文書、原稿、および科学論文は、参照により本明細書に組み込まれる。
【0217】
本発明は、その好ましい実施形態を参照して特に示され、記述されてきたが、形態および詳細に様々な変化を行ってもよく、それらも添付の特許請求の範囲によって包含される本発明の範囲から逸脱しないことは、当業者によって理解されるであろう。
【特許請求の範囲】
【請求項1】
少なくとも1つの一塩基多型(SNP)を含むBRCA1ハプロタイプであって、該SNPの存在が被験体の乳癌または卵巣癌を発症するリスクを増加させる、BRCA1ハプロタイプ。
【請求項2】
前記SNPのそれぞれが、1つ以上のmiRNAの活性を変化させる、請求項1記載のハプロタイプ。
【請求項3】
前記SNPが、BRCA1遺伝子の非コード領域またはコード領域に位置する、請求項1記載のハプロタイプ。
【請求項4】
前記SNPが、BRCA1遺伝子の非コード領域またはコード領域に位置する、請求項2記載のハプロタイプ。
【請求項5】
前記SNPが、ra9911630、rsl2516、rs8176318、rs3092995、rsl060915、rs799912、rs9908805およびrsl7599948からなる群から選択される、請求項1または4記載のハプロタイプ。
【請求項6】
前記SNPが、rsl2516、rs8176318、rs3092995、rsl060915およびrs799912からなる群から選択される、請求項1記載のハプロタイプ。
【請求項7】
前記SNPが、rs8176318またはrsl060915である、請求項1記載のハプロタイプ。
【請求項8】
rs8176318およびrsl060915を含む、請求項1記載のハプロタイプ。
【請求項9】
前記SNPの存在が、被験体のトリプルネガティブ(TN)乳癌を発症するリスクを増加させる、請求項1記載のハプロタイプ。
【請求項10】
GGACGCTA(配列番号6)、GGCCGCTA(配列番号9)、GGCCGCTG(配列番号10)、GGACGCTG(配列番号21)またはGAACGTTG(配列番号26)のヌクレオチド配列を含む、請求項1記載のハプロタイプ。
【請求項11】
乳癌または卵巣癌を発症するリスクの増加を示すBRCA1多型シグネチャーであって、一塩基多型(SNP)rs8176318およびrsl060915の存在または非存在の決定を含み、これらのSNPの存在が乳癌または卵巣癌を発症するリスクの増加を示す、シグネチャー。
【請求項12】
rsl2516、rs3092995およびrs799912からなる群から選択される少なくとも1つのSNPの存在または非存在の決定をさらに含む、請求項11記載のシグネチャー。
【請求項13】
rs9911630、rs9908805およびrsl7599948からなる群から選択される少なくとも1つのSNPの存在または非存在の決定をさらに含む、請求項11または12記載のシグネチャー。
【請求項14】
rs8176318およびrs1060915が、少なくとも1つのマイクロRNA(miRNA)の結合効力を変化させる、請求項11記載のシグネチャー。
【請求項15】
rsl2516、rs3092995、rs799912、rs9911630、rs9908805またはrs17599948が、少なくとも1つのmiRNAの結合効力を変化させる、請求項12または13記載のシグネチャー。
【請求項16】
前記少なくとも1つのmiRNAがmiR−7である、請求項11記載のシグネチャー。
【請求項17】
1つ以上のマイクロRNAの結合効力を変化させるBRCA1遺伝子におけるSNPの存在または非存在の同定をさらに含む、請求項1記載のシグネチャー。
【請求項18】
前記SNPが、コード領域または非コード領域内に存在する、請求項17記載のシグネチャー。
【請求項19】
前記非コード領域が、3’非翻訳領域(UTR)、イントロン、遺伝子間領域、シス調節エレメント、プロモーターエレメント、エンハンサーエレメントまたは5’非翻訳領域(UTR)である、請求項18記載のシグネチャー。
【請求項20】
前記コード領域がエクソンである、請求項18記載のシグネチャー。
【請求項21】
前記乳癌がトリプルネガティブ乳癌である、請求項11記載のシグネチャー。
【請求項22】
BRCA1遺伝子の発現を減少させ、かつ被験体の乳癌または卵巣癌を発症するリスクを増加させるSNPを同定する方法であって、該方法は:
(a)試験被験体から試料を得る工程;
(b)対照試料を得る工程;
(c)該試験試料由来のDNA配列内の少なくとも1つのmiRNA結合部位におけるSNPの存在または非存在を決定する工程;および
(d)該SNPを含む該少なくとも1つのmiRNA結合部位への少なくとも1つのmiRNAの結合効力を、該対照試料由来の対応するDNA配列における同じmiRNA結合部位への該miRNAの結合効力と比較して、評価する工程
を含み、ここで、
該対照試料と該試験試料との間の、該対応する結合部位への該少なくとも1つのmiRNAの結合効力における統計的に有意な変化の存在が、該SNPの存在または非存在がmiRNA介在性の防御を阻害するかまたはmiRNA介在性のBRCA1遺伝子発現の抑制を増大させることを示し、それによって、被験体の乳癌または卵巣癌を発症するリスクもまた増加させるSNPを同定する、方法。
【請求項23】
BRCA1遺伝子の発現を減少させ、かつ被験体の乳癌または卵巣癌を発症するリスクを増加させるSNPを同定する方法であって、該方法は:
(a)試験被験体から試料を得る工程;
(b)該試験試料由来のDNA配列中の少なくとも1つのmiRNA結合部位におけるSNPの存在または非存在を決定する工程;および
(c)1つ以上の世界集団における該SNPの予測保有率に関して、乳癌集団または卵巣癌集団内の該SNPの保有率を評価する工程
を含み、
該1つ以上の世界集団と比較した、腫瘍試料中の該SNPの存在または非存在における統計的に有意な増加が、該SNPが乳癌または卵巣癌を発症するリスクの増加に陽性に関連することを示し、BRCA1の発現を減少させる少なくとも1つのmiRNA結合部位内の該SNPの存在または非存在が、該SNPの存在または非存在がmiRNA介在性の防御を阻害するかまたはmiRNA介在性のBRCA1遺伝子発現の抑制を増大させることを示し、それによって、被験体の乳癌または卵巣癌を発症するリスクもまた増加させるSNPを同定する、方法。
【請求項24】
前記試験被験体が、乳癌または卵巣癌と診断されている、請求項22または23記載の方法。
【請求項25】
前記対照試料が、いかなる癌も有するとは診断されていない被験体から得られる、請求項22記載の方法。
【請求項26】
前記miRNA結合部位が、実験的に決定されるか、データベースで同定されるか、またはアルゴリズムを使用して予測される、請求項22または23記載の方法。
【請求項27】
前記SNPの存在または非存在が、実験的に決定されるか、データベースで同定されるか、またはアルゴリズムを使用して予測される、請求項22または23記載の方法。
【請求項28】
前記結合効力が、インビトロまたはエクスビボで評価される、請求項22記載の方法。
【請求項29】
前記乳癌が、散発性または遺伝性である、請求項22または23記載の方法。
【請求項30】
前記卵巣癌が、散発性または遺伝性である、請求項22または23記載の方法。
【請求項31】
乳癌または卵巣癌を発症するリスクを有する被験体を同定する方法であって、該方法は:
(a)試験被験体からDNA試料を得る工程;および
(b)該試料由来の少なくとも1つのDNA配列において、rs12516、rs8176318、rs3092995およびrs799912からなる群から選択される少なくとも1つのSNPの存在を決定する工程
を含み、ここで、
該少なくとも1つのDNA配列における該少なくとも1つのSNPの存在が、該被験体の乳癌または卵巣癌を発症するリスクを、正常な被験体と比較して10倍増加させる、方法。
【請求項32】
rs1060915の存在を決定する工程をさらに含み、前記少なくとも1つのDNA配列におけるrs1060915ならびにrsl2516、rs8176318、rs3092995およびrs799912からなる群から選択される少なくとも1つのSNPの合わせた存在が、前記被験体の乳癌または卵巣癌を発症するリスクを、正常な被験体と比較して100倍増加させる、請求項31記載の方法。
【請求項33】
正常な被験体が、rsl2516、rs8176318、rs3092995、rs799912またはrsl060915を保有しない被験体である、請求項31記載の方法。
【請求項34】
前記乳癌が、散発性または遺伝性である、請求項31記載の方法。
【請求項35】
前記卵巣癌が、散発性または遺伝性である、請求項31記載の方法。
【請求項36】
トリプルネガティブ(TN)乳癌を発症するリスクを有する被験体を同定する方法であって、該方法は:
(a)試験被験体からDNA試料を得る工程;および
(b)該試料由来の少なくとも1つのDNA配列において、rs8176318またはrs1060915の存在を決定する工程
を含み、ここで、
該少なくとも1つのDNA配列におけるrs8176318またはrs1060915の存在が、該被験体のTN乳癌を発症するリスクを、正常な被験体と比較して増加させる、方法。
【請求項37】
rs8176318およびrs1060915の存在を決定する工程を含み、前記少なくとも1つのDNA配列におけるrs1060915およびrs8176318の合わせた存在が、前記被験体のTN乳癌を発症するリスクをさらに増加させる、請求項36記載の方法。
【請求項38】
前記乳癌が、散発性または遺伝性である、請求項36または37記載の方法。
【請求項39】
前記卵巣癌が、散発性または遺伝性である、請求項36または37記載の方法。
【請求項40】
前記試験被験体がアフリカ系アメリカ人である、請求項36または37記載の方法。
【請求項1】
少なくとも1つの一塩基多型(SNP)を含むBRCA1ハプロタイプであって、該SNPの存在が被験体の乳癌または卵巣癌を発症するリスクを増加させる、BRCA1ハプロタイプ。
【請求項2】
前記SNPのそれぞれが、1つ以上のmiRNAの活性を変化させる、請求項1記載のハプロタイプ。
【請求項3】
前記SNPが、BRCA1遺伝子の非コード領域またはコード領域に位置する、請求項1記載のハプロタイプ。
【請求項4】
前記SNPが、BRCA1遺伝子の非コード領域またはコード領域に位置する、請求項2記載のハプロタイプ。
【請求項5】
前記SNPが、ra9911630、rsl2516、rs8176318、rs3092995、rsl060915、rs799912、rs9908805およびrsl7599948からなる群から選択される、請求項1または4記載のハプロタイプ。
【請求項6】
前記SNPが、rsl2516、rs8176318、rs3092995、rsl060915およびrs799912からなる群から選択される、請求項1記載のハプロタイプ。
【請求項7】
前記SNPが、rs8176318またはrsl060915である、請求項1記載のハプロタイプ。
【請求項8】
rs8176318およびrsl060915を含む、請求項1記載のハプロタイプ。
【請求項9】
前記SNPの存在が、被験体のトリプルネガティブ(TN)乳癌を発症するリスクを増加させる、請求項1記載のハプロタイプ。
【請求項10】
GGACGCTA(配列番号6)、GGCCGCTA(配列番号9)、GGCCGCTG(配列番号10)、GGACGCTG(配列番号21)またはGAACGTTG(配列番号26)のヌクレオチド配列を含む、請求項1記載のハプロタイプ。
【請求項11】
乳癌または卵巣癌を発症するリスクの増加を示すBRCA1多型シグネチャーであって、一塩基多型(SNP)rs8176318およびrsl060915の存在または非存在の決定を含み、これらのSNPの存在が乳癌または卵巣癌を発症するリスクの増加を示す、シグネチャー。
【請求項12】
rsl2516、rs3092995およびrs799912からなる群から選択される少なくとも1つのSNPの存在または非存在の決定をさらに含む、請求項11記載のシグネチャー。
【請求項13】
rs9911630、rs9908805およびrsl7599948からなる群から選択される少なくとも1つのSNPの存在または非存在の決定をさらに含む、請求項11または12記載のシグネチャー。
【請求項14】
rs8176318およびrs1060915が、少なくとも1つのマイクロRNA(miRNA)の結合効力を変化させる、請求項11記載のシグネチャー。
【請求項15】
rsl2516、rs3092995、rs799912、rs9911630、rs9908805またはrs17599948が、少なくとも1つのmiRNAの結合効力を変化させる、請求項12または13記載のシグネチャー。
【請求項16】
前記少なくとも1つのmiRNAがmiR−7である、請求項11記載のシグネチャー。
【請求項17】
1つ以上のマイクロRNAの結合効力を変化させるBRCA1遺伝子におけるSNPの存在または非存在の同定をさらに含む、請求項1記載のシグネチャー。
【請求項18】
前記SNPが、コード領域または非コード領域内に存在する、請求項17記載のシグネチャー。
【請求項19】
前記非コード領域が、3’非翻訳領域(UTR)、イントロン、遺伝子間領域、シス調節エレメント、プロモーターエレメント、エンハンサーエレメントまたは5’非翻訳領域(UTR)である、請求項18記載のシグネチャー。
【請求項20】
前記コード領域がエクソンである、請求項18記載のシグネチャー。
【請求項21】
前記乳癌がトリプルネガティブ乳癌である、請求項11記載のシグネチャー。
【請求項22】
BRCA1遺伝子の発現を減少させ、かつ被験体の乳癌または卵巣癌を発症するリスクを増加させるSNPを同定する方法であって、該方法は:
(a)試験被験体から試料を得る工程;
(b)対照試料を得る工程;
(c)該試験試料由来のDNA配列内の少なくとも1つのmiRNA結合部位におけるSNPの存在または非存在を決定する工程;および
(d)該SNPを含む該少なくとも1つのmiRNA結合部位への少なくとも1つのmiRNAの結合効力を、該対照試料由来の対応するDNA配列における同じmiRNA結合部位への該miRNAの結合効力と比較して、評価する工程
を含み、ここで、
該対照試料と該試験試料との間の、該対応する結合部位への該少なくとも1つのmiRNAの結合効力における統計的に有意な変化の存在が、該SNPの存在または非存在がmiRNA介在性の防御を阻害するかまたはmiRNA介在性のBRCA1遺伝子発現の抑制を増大させることを示し、それによって、被験体の乳癌または卵巣癌を発症するリスクもまた増加させるSNPを同定する、方法。
【請求項23】
BRCA1遺伝子の発現を減少させ、かつ被験体の乳癌または卵巣癌を発症するリスクを増加させるSNPを同定する方法であって、該方法は:
(a)試験被験体から試料を得る工程;
(b)該試験試料由来のDNA配列中の少なくとも1つのmiRNA結合部位におけるSNPの存在または非存在を決定する工程;および
(c)1つ以上の世界集団における該SNPの予測保有率に関して、乳癌集団または卵巣癌集団内の該SNPの保有率を評価する工程
を含み、
該1つ以上の世界集団と比較した、腫瘍試料中の該SNPの存在または非存在における統計的に有意な増加が、該SNPが乳癌または卵巣癌を発症するリスクの増加に陽性に関連することを示し、BRCA1の発現を減少させる少なくとも1つのmiRNA結合部位内の該SNPの存在または非存在が、該SNPの存在または非存在がmiRNA介在性の防御を阻害するかまたはmiRNA介在性のBRCA1遺伝子発現の抑制を増大させることを示し、それによって、被験体の乳癌または卵巣癌を発症するリスクもまた増加させるSNPを同定する、方法。
【請求項24】
前記試験被験体が、乳癌または卵巣癌と診断されている、請求項22または23記載の方法。
【請求項25】
前記対照試料が、いかなる癌も有するとは診断されていない被験体から得られる、請求項22記載の方法。
【請求項26】
前記miRNA結合部位が、実験的に決定されるか、データベースで同定されるか、またはアルゴリズムを使用して予測される、請求項22または23記載の方法。
【請求項27】
前記SNPの存在または非存在が、実験的に決定されるか、データベースで同定されるか、またはアルゴリズムを使用して予測される、請求項22または23記載の方法。
【請求項28】
前記結合効力が、インビトロまたはエクスビボで評価される、請求項22記載の方法。
【請求項29】
前記乳癌が、散発性または遺伝性である、請求項22または23記載の方法。
【請求項30】
前記卵巣癌が、散発性または遺伝性である、請求項22または23記載の方法。
【請求項31】
乳癌または卵巣癌を発症するリスクを有する被験体を同定する方法であって、該方法は:
(a)試験被験体からDNA試料を得る工程;および
(b)該試料由来の少なくとも1つのDNA配列において、rs12516、rs8176318、rs3092995およびrs799912からなる群から選択される少なくとも1つのSNPの存在を決定する工程
を含み、ここで、
該少なくとも1つのDNA配列における該少なくとも1つのSNPの存在が、該被験体の乳癌または卵巣癌を発症するリスクを、正常な被験体と比較して10倍増加させる、方法。
【請求項32】
rs1060915の存在を決定する工程をさらに含み、前記少なくとも1つのDNA配列におけるrs1060915ならびにrsl2516、rs8176318、rs3092995およびrs799912からなる群から選択される少なくとも1つのSNPの合わせた存在が、前記被験体の乳癌または卵巣癌を発症するリスクを、正常な被験体と比較して100倍増加させる、請求項31記載の方法。
【請求項33】
正常な被験体が、rsl2516、rs8176318、rs3092995、rs799912またはrsl060915を保有しない被験体である、請求項31記載の方法。
【請求項34】
前記乳癌が、散発性または遺伝性である、請求項31記載の方法。
【請求項35】
前記卵巣癌が、散発性または遺伝性である、請求項31記載の方法。
【請求項36】
トリプルネガティブ(TN)乳癌を発症するリスクを有する被験体を同定する方法であって、該方法は:
(a)試験被験体からDNA試料を得る工程;および
(b)該試料由来の少なくとも1つのDNA配列において、rs8176318またはrs1060915の存在を決定する工程
を含み、ここで、
該少なくとも1つのDNA配列におけるrs8176318またはrs1060915の存在が、該被験体のTN乳癌を発症するリスクを、正常な被験体と比較して増加させる、方法。
【請求項37】
rs8176318およびrs1060915の存在を決定する工程を含み、前記少なくとも1つのDNA配列におけるrs1060915およびrs8176318の合わせた存在が、前記被験体のTN乳癌を発症するリスクをさらに増加させる、請求項36記載の方法。
【請求項38】
前記乳癌が、散発性または遺伝性である、請求項36または37記載の方法。
【請求項39】
前記卵巣癌が、散発性または遺伝性である、請求項36または37記載の方法。
【請求項40】
前記試験被験体がアフリカ系アメリカ人である、請求項36または37記載の方法。
【図1】
【図4B】
【図5】
【図6】
【図7】
【図18】
【図19】
【図20】
【図21】
【図2−1】
【図2−2】
【図3−1】
【図3−2】
【図4A】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16A】
【図16B】
【図17】
【図4B】
【図5】
【図6】
【図7】
【図18】
【図19】
【図20】
【図21】
【図2−1】
【図2−2】
【図3−1】
【図3−2】
【図4A】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16A】
【図16B】
【図17】
【公表番号】特表2012−531210(P2012−531210A)
【公表日】平成24年12月10日(2012.12.10)
【国際特許分類】
【出願番号】特願2012−517803(P2012−517803)
【出願日】平成22年6月25日(2010.6.25)
【国際出願番号】PCT/US2010/040105
【国際公開番号】WO2010/151841
【国際公開日】平成22年12月29日(2010.12.29)
【出願人】(593152720)
【氏名又は名称原語表記】Yale University
【Fターム(参考)】
【公表日】平成24年12月10日(2012.12.10)
【国際特許分類】
【出願日】平成22年6月25日(2010.6.25)
【国際出願番号】PCT/US2010/040105
【国際公開番号】WO2010/151841
【国際公開日】平成22年12月29日(2010.12.29)
【出願人】(593152720)
【氏名又は名称原語表記】Yale University
【Fターム(参考)】
[ Back to top ]