説明

制限断片に基づく分子マーカーのハイスループットな検出

本発明は、分子マーカーをハイスループットで同定及び検出する方法であって、制限断片が生成し、且つ(試料特異的)識別子を含む好適なアダプタがライゲートする、方法に関する。アダプタとライゲートした制限断片は、その3’末端に選択ヌクレオチドを保有するアダプタ適合プライマーを用いて選択的に増幅され得る。増幅したアダプタとライゲートした制限断片は、少なくとも一部がハイスループットシークエンシング法を使用してシークエンスされ、制限断片の配列部分は、試料特異的識別子と共に、分子マーカーとして機能する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、分子生物学及びバイオテクノロジーの分野に関する。特に、本発明は、核酸の検出及び同定の分野に関する。より詳細には、本発明は、マーカー、特に分子マーカーを検出及び同定する方法に関する。本発明は、分子マーカーをハイスループットで検出及び同定する方法の条件に関係する。本発明はさらに、広範な遺伝的形質、遺伝子、ハプロタイプ及びそれらの組合せに関するヌクレオチド配列の同定、検出の少なくとも一方における方法の適用に関する。本発明は、植物、動物、ヒト、人工物その他、任意の起源に由来する分子マーカーのハイスループットな検出及び同定の分野で使用され得る。
【背景技術】
【0002】
ゲノムDNAの調査は、科学界、特に医学界によって長く望まれてきた。ゲノムDNAは、癌及びアルツハイマー病等の疾患の同定、診断、及び治療の鍵を握る。ゲノムDNAの調査は、疾患の同定及び治療に加えて、植物及び動物の品種改良事業において著しい利点を提供し得るので、世界中の食糧栄養問題に対する解決策が得られる可能性がある。
【0003】
多くの疾患が、特異的な遺伝要素、特に特異的な遺伝子の多型に関連することが知られている。ゲノム等の大きな試料における多型の同定は、現在、困難な且つ多くの時間を要する課業である。しかしながら、かかる同定は、生物医学研究、医薬品の開発、組織適合試験、遺伝子型決定、及び集団研究等の領域に対して非常に価値がある。
【0004】
マーカー、具体的には遺伝子マーカーは、非常に長い間、遺伝子型同定法として、即ち、表現型形質をDNA(遺伝子)の特定部分の有無又は量と結び付けるために使用されてきた。最も用途の広い遺伝子型同定技術の1つが、既に何十年にもわたって知られており、任意の生物体に広く適用可能なAFLPである(概説に関しては、Savelkoul et al. J. Clin. Microbiol, 1999, 37(10), 3083-3091; Bensch et al. Molecular Ecology, 2005, 14, 2899-2914を参照されたい)。
【0005】
AFLP技術(Zabeau & Vos, 1993; Vos et al., 1995)は1990年代初頭の発明以来、植物の品種改良及び他の分野において普及してきた。これはAFLPの幾つかの特性に起因するが、中でも最も重要なのは、事前の配列情報を必要とせずに、再現可能な様式で多数の遺伝子マーカーが生成されることである。また、AFLPの要である選択的増幅の原理は、増幅断片の数が、ゲノムサイズ又は起源とは無関係に検出システムの分解能と調和し得ることを保証する。
【0006】
AFLP断片の検出は一般にスラブゲル上での電気泳動(Vos et al., 1995)又はキャピラリ電気泳動(van der Meulen et al., 2002)によって実行される。こうしてスコアリングされるAFLPマーカーの大部分は、AFLP鋳型調製に使用される制限酵素認識部位又は選択的AFLPプライマーによって覆われるそれらのフランキングヌクレオチドのいずれかで生じる(一塩基)多型を表す。残りのAFLPマーカーは、制限断片の内部配列で生じる挿入/欠失多型、及び小さな制限断片(<およそ100bp)で生じる一塩基置換における非常に小さな画分であり、これらの断片に対し、電気泳動で観察し得る両アレル間での再現可能な移動度の変動を引き起こす。これらのAFLPマーカーはバンド強度に依存する必要なしに、共優性としてスコアリングされ得る。
【0007】
それゆえ、典型的なAFLPフィンガープリント法において、AFLPマーカーは増幅断片の少数(50%未満であるが、20%未満であることが多い)を構成する一方、残りは一般に定常(constant)AFLP断片と称される。にもかかわらず、後者がゲルスコアリング手順で有用であるのは、それらがAFLPマーカーの断片移動度を算出するためのアンカーポイントとして機能し、共優性スコアリングのためのマーカーを定量する際の助けとなるからである。現在は、AFLPマーカーの共優性スコアリング(ホモ接合性又はヘテロ接合性に対するスコアリング)は、分離集団をフィンガープリントするという状況に制限されている。関連のない系統のパネルでは、優性スコアリングのみが可能である。
【0008】
増幅工程及び検出工程における高い多重レベルのために、AFLPのスループットは非常に高いが、律速段階は電気泳動の分解能である。電気泳動により、制限酵素の組合せ(EC)、プライマーの組合せ(PC)及び移動度の組合せに基づく、増幅断片の大部分の一意的な同定が可能となるが、電気泳動は、移動度の差異に基づき増幅断片を区別することが可能であるに過ぎない。同様の移動度を有する断片は、いわゆる「積層(stacked)バンド」として見出されることが多く、電気泳動では、いわゆる「定常バンド」、即ち、比較種間で異ならないように見える増幅制限断片に含有される情報に注目することができない。さらに、典型的なゲル系システム又はMegaBACE等のキャピラリシステムでは、試料を並行して流す必要があり、ゲル上の1レーン当たり、又は1キャピラリ当たり約100個〜150個のバンドしか分析することができない。こうした制限もスループットを妨害する。
【0009】
理想的には、検出システムは増幅断片の全配列を求めて、すべての増幅制限断片を捕捉可能であるべきである。しかしながら、ほとんどのハイスループットシークエンシング技術は、依然として典型的には長さ100bp〜500bpのAFLP断片全体を包含するシークエンシング読取りを提供することができない。
【0010】
今のところ、シークエンシングによるAFLPマーカー/配列の検出は、数ある制限の中でも、Sangerのジデオキシシークエンシング技術及び他の従来のシークエンシング技術のコスト的な制限により経済的に実現不可能となっている。
【0011】
移動度決定の代わりにシークエンシングによる検出を行うと、スループットが増大する。理由:
1)内部配列に位置する多型は、ほとんどの(又はすべての)増幅断片中に検出される。これによりPC毎のマーカー数がかなり増大する。
2)AFLPマーカー及び定常バンドの共遊走(co−migration)によるAFLPマーカーの減少がない。
3)共優性スコアリングはバンド強度の定量化に依存せず、且つフィンガープリントされる個体の関連性から独立している。
【0012】
しかしながら、制限断片全体のシークエンシングによる検出は、依然として比較的不経済である。さらに、例えば本明細書中の他の部分で開示される、現行技術水準のシークエンシング技術(454 Life Sciences、www.454.com及びSolexa、www. solexa.comによる)は、その圧倒的なシークエンシング能にも関わらず、制限長断片のシークエンシングしか提供できない。また、現行方法は1回の操作で多くの試料を同時に処理することができない。
【0013】
定義
以下の説明及び実施例において、多くの用語が使用される。かかる用語に与えられる範囲を含む、明細書及び特許請求の範囲についての明確な且つ一貫した理解を提供するために、以下の定義が提供される。本明細書中で特に規定しない限り、使用されるすべての技術用語及び科学用語は、本発明が属する技術分野の当業者によって共通に理解されるものと同一の意味を有する。すべての刊行物、特許出願、特許及び他の参考文献の開示内容全体が、参照により本明細書中に援用される。
【0014】
核酸:本発明に記載の核酸は、ピリミジン塩基及びプリン塩基、好ましくはシトシン、チミン及びウラシル、並びにアデニン及びグアニンの任意のポリマー又はオリゴマーをそれぞれ含み得る(Albert L. Lehninger著「生化学の原理(Principles of Biochemistry)」、793-800(Worth Pub. 1982)(この全体がすべての目的のために参照により本明細書中に援用される)を参照されたい)。本発明では、任意のデオキシリボヌクレオチド、リボヌクレオチド又はペプチド核酸成分、及びそれらの任意の化学的な変形(例えばこれらの塩基のメチル化された形式、ヒドロキシメチル化された形式又はグリコシル化された形式)等が考えられる。ポリマー又はオリゴマーは、組成物中で不均質でも均質でもよく、天然の供給源から単離してもよく、人為的又は合成的に生成してもよい。また核酸は、DNA若しくはRNA、又はそれらの混合物であってもよく、恒久的に又は一時的に、一本鎖形態、又はホモ二重鎖、ヘテロ二重鎖、及びハイブリッド状態を含む、二本鎖形態で存在してもよい。
【0015】
AFLP:AFLPとは、1つ又は複数の制限エンドヌクレアーゼにより核酸を消化して制限断片を生成すること、アダプタを制限断片にライゲートすること、及びアダプタと(一部)相補的であり、制限エンドヌクレアーゼの残部と(一部)相補的であり、A、C、T又はG(又は場合によってはU)の中からランダムに選択される少なくとも1つのヌクレオチドをさらに含有する少なくとも1つのプライマーを用いて、アダプタとライゲートした制限断片を増幅することに基づく核酸の選択的増幅法を指す。AFLPには事前配列情報は全く必要なく、AFLPは任意の開始DNAで実施し得る。概してAFLPは、
(a)核酸、特にDNA又はcDNAを1つ又は複数の特異的な制限エンドヌクレアーゼで消化する工程であって、対応する一連の制限断片へとDNAを断片化する、消化工程と、
(b)こうして得られた制限断片を、一端が制限断片の一端又は両端と適合する二本鎖合成オリゴヌクレオチドアダプタとライゲートする工程であって、それによりアダプタとライゲートした(好ましくは、タグ付けした)開始DNAの制限断片を生成する、ライゲート工程と、
(c)アダプタとライゲートした(好ましくは、タグ付けした)制限断片を、ハイブリダイズする条件下で、その3’−末端に選択ヌクレオチドを含有する1つ又は複数のオリゴヌクレオチドプライマーと接触させる工程と、
(d)プライマーとハイブリダイズした、アダプタとライゲートした(好ましくは、タグ付けした)制限断片を、PCR又は同様の技法によって増幅する工程であって、プライマーがハイブリダイズする開始DNAの制限断片に沿ってハイブリダイズしたプライマーのさらなる伸長を引き起こす、増幅工程と、
(e)こうして得られた増幅又は伸長したDNA断片を、検出、同定、又は回収する工程とを含む。
【0016】
したがって、AFLPはアダプタとライゲートした断片の再現可能なサブセットを提供する。AFLPは欧州特許第534858号、米国特許第6045994号、及びVos et al.に記載されている。AFLPに関するさらなる詳細に関しては、これらの刊行物が参照される。AFLPは複雑度低減技法及びDNAフィンガープリント技術として一般に使用される。AFLPをフィンガープリント技術として使用する状況の中で、AFLPマーカーの概念が発展してきた。
【0017】
AFLPマーカー:AFLPマーカーは、同一のプライマーの組を使用して、AFLPを使用して増幅した(フィンガープリントした)2つの試料間で異なる、増幅したアダプタとライゲートした制限断片である。したがって、この増幅したアダプタとライゲートした制限断片の有無は、形質又は表現型と連鎖するマーカーとして使用され得る。従来のゲル技術において、AFLPマーカーは、ゲル中に或る特定の移動度で位置するバンドとして現れる。キャピラリ電気泳動等の他の電気泳動技法は、これをバンドと称し得ないが概念は同一のままであり、即ち、核酸が或る特定の長さ及び移動度を有する。バンドの有無は表現型の有無を示唆(又はそれと関連)し得る。典型的には、AFLPマーカーはエンドヌクレアーゼの制限部位内の又は選択ヌクレオチド内のSNPを包含する。時として、AFLPマーカーは制限断片内のインデルを包含し得る。
【0018】
定常バンド:AFLP技術における定常バンドは、試料間で比較的不変の、増幅したアダプタとライゲートした制限断片である。したがって、AFLP技術における定常バンドは、様々な試料にわたって、ゲル中のほぼ同一位置に現れ、即ち、同一の長さ/移動度を有する。従来のAFLPにおいて、これらは典型的には、ゲル上の試料に対応するレーン又はキャピラリ電気泳動によって検出される複数のAFLP試料の電気泳動図をアンカーする(anchor)のに使用される。典型的には、定常バンドはAFLPマーカーよりも情報不足である。にもかかわらず、AFLPマーカーが通例(customary)選択ヌクレオチド又は制限部位内にSNPを包含するのと同様に、定常バンドは制限断片自体にSNPを含む可能性があり、定常バンドはAFLPマーカーと相補的な遺伝情報の興味深い代替供給源となる。
【0019】
選択塩基:選択塩基は、アダプタと相補的な部分、及び制限部位の残部と相補的な部分を含有するプライマーの3’末端に位置し、A、C、T又はGの中からランダムに選択される。選択塩基を用いてプライマーを伸長することにより、続く増幅ではアダプタとライゲートした制限断片の再現可能なサブセットのみ、即ち、選択塩基を保有するプライマーを使用して増幅し得る断片のみが生成される。選択ヌクレオチドは1個〜10個の数でプライマーの3’末端に付加され得る。典型的には、1個〜4個で十分である。両プライマーは様々な数の選択塩基を含有し得る。それぞれ付加された選択塩基に応じて、サブセットはサブセット中の増幅したアダプタとライゲートした制限断片の量を約4分の1に低減させる。典型的には、AFLPで使用される選択塩基の数は+N+Mで示される(この場合、1つのプライマーがN個の選択ヌクレオチドを保有し、且つ他のプライマーがM個の選択ヌクレオチドを保有する)。したがって、Eco/Mse +1/+2 AFLPとは、開始DNAのEcoRI及びMseIによる消化、適切なアダプタのライゲーション、並びに1つの選択塩基を保有するEcoRI制限位置を対象とする1つのプライマー、及び2つの選択ヌクレオチドを保有するMseI制限部位を対象とするもう1つのプライマーを用いる増幅の省略表現である。 少なくとも1つの選択ヌクレオチドをその3’末端に保有する、AFLPで使用されるプライマーもAFLPプライマーとして描写される。選択ヌクレオチドをその3’末端に保有せず、且つ実際はアダプタ及び制限部位の残部と相補的なプライマーは、AFLP+0プライマーとして示されることもある。
【0020】
クラスタリング:「クラスタリング」という用語は、短く又は長く続く同一又は類似のヌクレオチドの存在に基づいて、2つ以上のヌクレオチド配列を比較することを意味する。以下でさらに説明するように、幾つかのヌクレオチド配列のアライメント方法が当該技術分野において既知である。「アセンブリ」又は「アライメント」という用語は、同義語として使用されることもある。
【0021】
識別子:アダプタ又はプライマーに付加され得るか、その配列内に含まれ得るか、そうでなければ標識として使用されて一意の識別子を提供し得る短い配列。かかる配列識別子は、特異的な核酸試料を同定するために一意的に使用される、多様であるが規定された長さを有する一意の塩基配列であり得る。例えば、4bpのタグにより、4=256個の異なるタグができる。典型例は、ハイブリダイゼーションによる一意的な検出に一般に使用されるタグとして当該技術分野において既知のZIP配列である(Iannone et al. Cytometry 39:131-140, 2000)。かかる識別子を使用することによって、さらなる処理時にPCR試料の起源が求められ得る。異なる核酸試料に由来する処理産物を組み合わせる場合には、概して、異なる核酸試料は異なる識別子を使用して同定される。
【0022】
シークエンシング:「シークエンシング」という用語は、核酸試料、例えばDNA又はRNA中のヌクレオチド(塩基配列)の順番を決定することを指す。
【0023】
ハイスループットスクリーニング:
HTSと略されることの多いハイスループットスクリーニングは、特に生物学及び化学の分野に関連した科学実験用の方法である。現代のロボット工学及び他の専門化した実験ハードウェアの組合せによって、研究者は大量の試料を同時に効率的にスクリーニングすることが可能となる。
【0024】
制限エンドヌクレアーゼ:制限エンドヌクレアーゼ又は制限酵素は、二本鎖DNA分子中の特異的なヌクレオチド配列(標的部位)を認識し、すべての標的部位又はその近くでDNA分子の両鎖を切断する酵素である。
【0025】
制限断片:制限エンドヌクレアーゼによる消化によって生成するDNA分子は制限断片と称される。任意の所定のゲノム(又はその起源に関わらず核酸)は、特定の制限エンドヌクレアーゼによって制限断片の別個の組へと消化される。制限エンドヌクレアーゼ切断に由来するDNA断片は、多様な技法でさらに使用することができ、例えばゲル電気泳動によって検出することができる。
【0026】
ゲル電気泳動:制限断片を検出するために、サイズに基づいてDNA分子を分画する分析法が必要となり得る。かかる分画を達成するために最も一般に使用される技法は、(キャピラリ)ゲル電気泳動である。かかるゲル中でDNA断片が移動する速度は、その分子量に依存するので、断片長が増加するにつれて移動距離は減少する。ゲル電気泳動によって分画されたDNA断片は、パターンの中に含まれた断片数が十分に少ない場合には、染色手順、例えば、銀染色又はエチジウムブロマイドを使用する染色によって直接可視化することができる。代替的には、DNA断片のさらなる処理により、好ましくはAFLP産物の1つの鎖を標識するのに使用される蛍光体(fluorophore:フルオロフォア)又は放射性標識等の検出可能な標識を断片に組み込み得る。
【0027】
ライゲーション:2つの二本鎖DNA分子を相互に共有結合で結合させるリガーゼ酵素によって触媒される酵素反応は、ライゲーションと称される。概して、両方のDNA鎖は相互に共有結合で結合するが、鎖の末端の1つの化学的修飾又は酵素的修飾を通じて、2つの鎖のうちの1つの鎖のライゲーションを防ぐことも可能である。その場合には、共有結合が2つのDNA鎖のうち1つのみで生じる。
【0028】
合成オリゴヌクレオチド:化学的に合成することができる、好ましくは約10塩基〜約50塩基を有する一本鎖DNA分子は、合成オリゴヌクレオチドと称される。概して、これらの合成DNA分子は、一意又は所望のヌクレオチド配列を有するように設計されるが、関連配列を有し、且つヌクレオチド配列内の特定位置に異なるヌクレオチド組成を有する分子のファミリーを合成することが可能である。「合成オリゴヌクレオチド」という用語は、設計した又は所望のヌクレオチド配列を有するDNA分子を指すために使用される。
【0029】
アダプタ:制限断片末端にライゲーションすることができるように設計されている、限られた数の塩基対、例えば約10塩基対長〜約30塩基対長を有する短い二本鎖DNA分子。アダプタは概して、互いに一部相補的なヌクレオチド配列を有する2つの合成オリゴヌクレオチドから構成される。適切な条件下、溶液中で2つの合成オリゴヌクレオチドを混合すると、これらは互いにアニーリングして二本鎖構造を形成する。アニーリング後、アダプタ分子の一端は、制限断片の末端と適合し、それとライゲートできるように設計される。アダプタの他端は、ライゲートできないように設計することができるが、そうである必要はない(二重にライゲートしたアダプタ)。
【0030】
アダプタとライゲートした制限断片:アダプタでキャッピングした制限断片。
【0031】
プライマー:概して、「プライマー」という用語は、DNAの合成をプライムすることができるDNA鎖を指す。DNAポリメラーゼは、プライマーなしではDNAをデ ノボ(de novo)合成することができない。即ち、アセンブリするヌクレオチドの順番を指示するための鋳型として相補鎖が使用される反応において、DNAポリメラーゼは既存のDNA鎖しか伸長することができない。本発明者らは、プライマーとして、ポリメラーゼ連鎖反応(PCR)で使用される合成オリゴヌクレオチド分子を指す。
【0032】
DNAの増幅:「DNAの増幅」という用語は、典型的には、PCRを使用する二本鎖DNA分子のイン ビトロ(in vitro)合成を指し示すために使用される。他の増幅方法が存在し、それらが趣旨を逸脱することなく、本発明で使用され得ることに留意されたい。
【発明の開示】
【課題を解決するための手段】
【0033】
本発明者らは、(AFLP)マーカー技術の多用性及び適用性を、現行技術水準のハイスループットシークエンシング技術の多用性及び適用性と組み合わせることができる汎用方法を考案することによって、上記課題及び当該技術分野における他の課題を克服できることを見出した。
【0034】
したがって、本発明者らは、アダプタとライゲートした制限断片に試料特異的識別子を組み込むこと及び/又は制限断片の配列の一部のみを求めることによって、既存技術の非常に効率的且つ確実な改善が得られることを見出した。試料特異的識別子を組み込むことによって、複数の試料を一回の操作でシークエンスすることができ、制限断片の一部のみをシークエンスするだけで、制限断片の十分な同定を達成できることが見出された。
【発明を実施するための最良の形態】
【0035】
一態様において、本発明は、試料中の制限断片を同定する方法であって、
(a)試料核酸を提供する工程と、
(b)試料核酸を、少なくとも1つの制限エンドヌクレアーゼで消化する工程であって、制限断片の組が得られる、消化工程と、
(c)二本鎖合成アダプタを提供する工程であって、
5’プライマー適合配列と、
試料特異的識別子区間と、
制限エンドヌクレアーゼの認識配列の残部と相補的な区間とを含む、二本鎖合成アダプタを提供する工程と、
(d)二本鎖合成アダプタを、組になった制限断片にライゲートする工程であって、アダプタとライゲートした制限断片の組が得られる、ライゲート工程と、
(e)以下の:
試料特異的識別子区間、及び
制限エンドヌクレアーゼの認識配列の残部と相補的な区間、
と少なくとも相補的な1つ又は複数のプライマーを用いて、アダプタとライゲートした制限断片の組を増幅する工程であって、増幅したアダプタとライゲートした制限断片(アンプリコン(単位複製配列))が得られる、増幅工程と、
(f)少なくとも試料特異的識別子区間の配列、制限エンドヌクレアーゼの認識配列の残部、及びそれに隣接して位置する、増幅したアダプタとライゲートした制限断片(の一部)の制限断片の配列の一部を求める工程と、
(g)試料中の増幅したアダプタとライゲートした制限断片の有無を同定する工程とを含む、試料中の制限断片を同定する方法に関する。
【0036】
このように試料核酸を処理することによって、シークエンスされる試料毎に、増幅制限断片の組が得られる。すべての制限断片は、各試料で異なる試料特異的識別子によって、或る特定の試料に起源を有するものとして同定することができる。増幅したアダプタとライゲートした制限断片のシークエンシングにより、アダプタとライゲートした制限断片の少なくとも一部に対する配列情報が得られる。アダプタ由来部分に含有される情報は、断片が得られる試料に関する情報を含有する一方、制限断片自体からの配列情報により、制限断片に関する情報が得られ、制限断片の同定が可能となる。制限断片に関する本配列情報を使用して、求めるヌクレオチド数、及び増幅したアダプタとライゲートした制限断片の組になった制限断片数に応じて決まる精度で制限断片を同定する。
【0037】
複数の断片の組に含有されるシークエンシングによって分子マーカーを同定する精度に影響を及ぼすサンプリング変動の課題に対する解決法を提供するために、本発明者らは、シークエンシングを介したマーカーの検出が、好ましくは少なくとも1回すべての増幅断片をサンプリングするのに十分な重複(深度)で実施され、呼び出される遺伝子型の精度に比したサンプリング変動の課題を扱う統計的手段を伴うことも見出した。さらに、AFLPスコアリングとちょうど同じように、分離集団の状況において、一実験での親個体の同時スコアリングは統計的閾値を求める助けとなる。
【0038】
したがって、或る特定の実施形態において、タグ付けした増幅したアダプタとライゲートした制限断片の重複は少なくとも6、好ましくは少なくとも7、より好ましくは少なくとも8、最も好ましくは少なくとも9である。或る特定の実施形態において、各アダプタとライゲートした制限断片の配列は少なくとも6倍、好ましくは少なくとも7倍、より好ましくは少なくとも8倍、最も好ましくは少なくとも9倍求められる。或る特定の実施形態において、重複は、遺伝子座をホモ接合として正確に同定する可能性が全体で50/50であると仮定して、遺伝子座を正確に同定する可能性が95%、96%、97%、98%、99%、99.5%より高くなるように選択される。
【0039】
この点において、以下の計算は例示であり得る。本明細書中の他の部分で記載されるSolexaのシークエンシング技術は、それぞれ約25bpの40000000個の読取りを提供し、一回の操作では合計でなんと100万bpにも達する。サンプリングにおける重複を10回と仮定すると、4000000個の一意の断片を1回の操作で評価することができる。100個の試料を組み合わせると、各試料に対して40000個の断片がシークエンスされることが可能となる。AFLPの観点から見ると、これは、160個のプライマーをそれぞれ250個の断片と組み合わせることに相当する。
【0040】
本方法により、電気泳動に基づく従来のマーカー検出とは異なる方法で制限断片の同定が可能となる。
【0041】
制限断片を同定する方法の第1の工程において、試料核酸が提供される。試料中の核酸は通常DNAの形態である。しかしながら、試料中に含有されるヌクレオチド配列情報は、例えば、RNA、ポリA+ RNA、cDNA、ゲノムDNA、ミトコンドリアDNA若しくは葉緑体DNA等のオルガネラDNA、合成核酸、DNAライブラリ(BACライブラリ/プールしたBACクローン等)、クローンバンク、又はそれらの任意の選択若しくは組合せを含む、核酸の任意の供給源由来であり得る。核酸試料中のDNAは二本鎖、一本鎖、及び一本鎖DNAに変性した二本鎖DNAであり得る。DNA試料は、植物、動物、合成品、又はヒトであれ、任意の生物体由来であり得る。
【0042】
核酸試料は、少なくとも1つの制限エンドヌクレアーゼで制限(又は消化)されて、制限断片の組を提供する。或る特定の実施形態では、2つ以上のエンドヌクレアーゼを使用して、制限断片を得ることができる。エンドヌクレアーゼは、フリークエントカッター(frequent cutter)(認識配列3bp〜5bp、例えばMseI)又はレアカッター(認識配列>5bp、例えばEcoRI)であり得る。或る特定の好ましい実施形態では、レアカッター及びフリークエントカッターの組合せが好ましい。或る特定の実施形態では、特に試料が比較的大きなゲノムを含有するか、又はそれに由来する場合、第3の酵素(レアカッター又はフリークエントカッター)を使用して、より短いサイズの制限断片のより大きな組を得ることが好ましい可能性がある。
【0043】
制限エンドヌクレアーゼとしては、任意のエンドヌクレアーゼで十分である。典型的には、EcoRI、MseI、PstI等のII型エンドヌクレアーゼが好ましい。或る特定の実施形態では、IIs型エンドヌクレアーゼ、即ち、認識配列が制限部位の遠位に位置するエンドヌクレアーゼ、即ち、AceIII、AlwI、AlwXI、Alw26I、BbvI、BbvII、BbsI、BccI、Bce83I、BcefI、BcgI、BinI、BsaI、BsgI、BsmAI、BsmFI(BsmFl)、BspMI、EarI、EciI、Eco31I(Eco3lI)、Eco57I、Esp3I、FauI、FokI、GsuI、HgaI、HinGUII、HphI、Ksp632I、MboII、MmeI、MnlI、NgoVIII、PleI、RleAI、SapI、SfaNI、TaqJI及びTth111II(Zthll lII)等が使用され得る。この種の制限エンドヌクレアーゼの使用が、本明細書の他の部分で記載する方法への或る特定の適応につながる。
【0044】
使用するエンドヌクレアーゼに応じて、制限断片は平滑末端化されるか、又は突出末端を有し得る。これらの末端にアダプタがライゲートし得る。典型的には、本発明で使用されるアダプタには特別な設計がある。本発明で使用されるアダプタは、5’−プライマー適合配列を含み得る。これは任意選択であり、引き続くプライマーアニーリング用の十分な長さのアダプタを提供することができ、その後に、4ヌクレオチド〜16ヌクレオチドを含み得る試料特異的識別子区間が続く。好ましくは、試料特異的識別子は、シークエンシング工程中の読み過しを防ぐために、2つ以上の連続同一塩基を含有しない。さらに、場合によっては、2つ以上の試料を組み合わせ、複数の試料特異的識別子を使用して、試料の起源を区別する。好ましくは、試料特異的識別子間の差異は少なくとも2bp、好ましくは3bpである。これにより、試料を集めたプール内の異なる試料特異的識別子間の判別の改善が可能となる。アダプタの3’末端には、制限エンドヌクレアーゼの認識配列の残部と相補的な区間が位置する。例えば、EcoRIは、5’−GAATTC−3’を認識し、GとAATTCとの間で切断する。EcoRIに関して、制限エンドヌクレアーゼの認識配列の残部と相補的な区間アダプタは、したがってC−ヌクレオチドである。
【0045】
アダプタは、制限断片の片側又は両側とライゲート(共有結合的に連結)する。消化が2つ以上のエンドヌクレアーゼを用いて実施される場合、アダプタとライゲートした制限断片の異なる組を生成する異なるアダプタが使用され得る。
【0046】
アダプタとライゲートした制限断片は続けて、1つ又は複数のプライマーの組で増幅される。プライマーはアダプタのみと相補的であり、即ち、非選択的増幅であり得る。好ましくはプライマーは、試料特異的識別子と相補的な区間、及び制限エンドヌクレアーゼの認識配列の残部と相補的な区間を含有する。或る特定の実施形態において、プライマーは、その3’末端に1つ又は複数の選択ヌクレオチドを含有して、増幅したアダプタとライゲートした制限断片のサブセットを提供し得る。プライマーはまた、その5’末端にさらなるヌクレオチドを含有して、プライマーがアダプタとライゲートした制限断片にアンカーする手助けをし得る。或る特定の実施形態において、プライマーは、LNA又はPNA等の、改善したハイブリダイゼーション特性を発現するヌクレオチドを含有し得る。プールに集めた試料からアダプタとライゲートした制限断片を増幅するために、縮重したプライマーの組、即ち、各試料に対して、対応する試料識別子がプライマーに組み込まれるプライマーの組を使用することが可能である。或る特定の実施形態では、識別子区間が完全に(又は少なくともかなりの程度)縮重している、即ち、ヌクレオチドの(ほとんど)すべての組合せが試料識別子区間内に提供される、プライマーの組を使用することが可能である。増幅におけるストリンジェントなハイブリダイゼーション条件と、LNA型ヌクレオチド又はPNA型ヌクレオチドの任意選択での使用とを組み合わせて、ハイブリダイゼーション特性を増大させると、これは、非常に効率的な増幅につながり得る。
【0047】
アダプタとライゲートした制限断片の増幅により、増幅したアダプタとライゲートした制限断片(単位複製配列と称されることもある)の組が生じる。
【0048】
単位複製配列(又はその少なくとも一部)は、少なくとも、試料特異的識別子の配列を求めて、断片の起源、及び制限断片の配列の一部の起源を求めることを含む工程に付される。実際には、これも、例えば制限エンドヌクレアーゼの認識配列の残部の間に位置する区間を求めることに相当する。アダプタに由来する配列と隣接して位置する断片の一部を組み合わせて試料特異的な識別子をシークエンスすることによって、制限断片を一意的に同定することが可能である。表現型の有無と相関がある場合、これら一意的に同定した制限断片は分子マーカーとして使用することができる。これにより、新世代のマーカーの確定が可能となり、したがって多用性の実証されたAFLP技術を用いた新規マーカー技術となるが、これはハイスループット技術に好適であり、且つ概して任意種の生物体又は核酸に適用可能である。試料中の制限断片を、本方法でそれらの配列の一部を求めることによって一意的に同定することは、複数の試料に対して繰り返すことができる。試料中の描写配列を有する制限断片の有無は、表現型の有無を示す。
【0049】
AFLPとハイスループットシークエンシングとの組合せに基づく本発明のマーカー技術のさらなる利点は、従来のAFLP技術と比較して得ることができるさらなる情報である。AFLPにおいて、AFLPマーカーとして指定される単位複製配列は、典型的には認識部位、制限部位、又は任意選択で選択ヌクレオチドに多型を含有する。さらに制限断片中に位置する多型は、典型的には、(おそらくインデル多型とは別の)AFLPマーカーとは見なされない。本シークエンシング工程では、任意選択の選択ヌクレオチドに隣接するヌクレオチドも求められ、これは、数の増加した分子マーカーの同定、及び既存のマーカー技術における改善につながる。
【0050】
本発明で使用されるハイスループットシークエンシングは、特に生物学及び化学の分野に関連した科学実験用の方法である。現代のロボット工学及び他の専門化した実験ハードウェアの組合せによって、研究者は大量の試料を同時に効率的にスクリーニングすることが可能となる。
【0051】
シークエンシングは、国際公開第WO03/004690号、同第WO03/054142号、同第WO2004/069849号、同第WO2004/070005号、同第WO2004/070007号、及び同第WO2005/003375(すべて454 Life Sciences名義)、Seo et al.(2004)による、Proc. Natl. Acad. Sci. USA 101:5488-93、並びにHelios、Solexa、US Genomics等の技術(これらは参照により本明細書中に援用される)で開示されている方法等のハイスループットシークエンシング法を使用して実施されることが好ましい。
【0052】
454 Life Sciences技術
或る特定の実施形態において、シークエンシングは、国際公開第WO03/004690号、同第WO03/054142号、同第WO2004/069849号、同第WO2004/070005号、同第WO2004/070007号、及び同第WO2005/003375号(すべて454 Life Sciences名義)(これらは参照により本明細書中に援用される)に開示されている装置及び/又は方法を使用して実施されることが好ましい。記載されている技術は、1回の操作での4000万塩基のシークエンシングを可能にし、競合技術よりも100倍速く、且つ安価である。シークエンシング技術は、大まかには5工程:1)一本鎖DNA(ssDNA)のライブラリを作製するための、DNAの断片化及び特異的なアダプタのライゲーション、2)ssDNAのビーズへのアニーリング、油中水型マイクロリアクタにおけるビーズの乳化、及び個々のssDNA分子をビース上で増幅するためのエマルジョンPCRの実施、3)表面上に増幅したssDNA分子を含有するビーズの選択/濃縮、4)PicoTiter(商標)プレートにおける、DNA担持ビーズの沈着、及び5)ピロリン酸光シグナルの生成による100000ウェルでの同時シークエンシングから構成される。以下、本方法をより詳細に説明する。
【0053】
好ましい実施形態において、シークエンシングは、
(a)アダプタと結合した断片をビーズにアニーリングする(各ビーズは単一のアダプタと結合した断片とアニーリングする)工程と、
(b)ビーズを油中水型マイクロリアクタ中で乳化させる(各油中水型マイクロリアクタは単一のビーズを含む)工程と、
(c)ビーズをウェルに充填する(各ウェルは単一のビーズを含む)工程と、ピロリン酸シグナルを生成する工程とを含む。
【0054】
第1の工程(a)において、シークエンシングアダプタは、組合せライブラリ内で断片とライゲートする。上記シークエンシングアダプタは、少なくともビーズにアニーリングするための「鍵」領域、シークエンシングプライマー領域、及びPCRプライマー領域を含む。したがって、アダプタと結合した断片が得られる。第1の工程では、アダプタと結合した断片をビーズにアニーリングする(各ビーズは単一のアダプタと結合した断片とアニーリングする)。アダプタと結合した断片のプールに過剰のビーズを加えることにより、大部分のビーズに関して、ビーズ毎に単一のアダプタと結合した断片のアニーリングが保証される(ポワソン分布)。
【0055】
次の工程では、ビーズを油中水型マイクロリアクタ中で乳化させる(各油中水型マイクロリアクタは単一のビーズを含む)。PCR試薬が油中水型マイクロリアクタ内に存在することにより、PCR反応がマイクロリアクタ内部で起こることが可能となる。続いて、マイクロリアクタを破壊して、DNAを含むビーズ(DNAポジティブビーズ)を濃縮する。
【0056】
続く工程では、ビーズをウェルに充填する(各ウェルは単一のビーズを含む)。ウェルは、好ましくは大量の断片の同時シークエンシングを可能にするPicoTiter(商標)プレートの一部である。
【0057】
酵素担持ビーズの添加後、ピロシークエンシングを使用して断片の配列を求める。引き続く工程では、従来のシークエンシング試薬存在下、PicoTiter(商標)プレート並びにその中のビーズ及び酵素ビーズを異なるデオキシリボヌクレオチドに曝し、デオキシリボヌクレオチドを取り込む際に、記録される光シグナルが生成される。正確なヌクレオチドの取込みにより、検出し得るピロシークエンシングシグナルが生成される。
【0058】
ピロシークエンシング自体は当該技術分野において既知であり、とりわけwww.biotagebio.com; www.pyrosequencing.comの技術欄に記載されている。本技術は、例えば、国際公開第WO03/004690号、同第WO03/054142号、同第WO2004/069849号、同第WO2004/070005号、同第WO2004/070007号、同第WO2005/003375号(すべて454 Life Sciences名義)(これらは参照により本明細書中に援用される)でさらに適用される。
【0059】
本発明において、ビーズは好ましくは、場合によっては、単位複製配列と結合することが可能なプライマー(結合)配列又はその一部を備える。他の実施形態において、増幅で使用されるプライマーは、続くエマルジョン重合、その後のシークエンシングを可能にするために、例えばその5’末端に単位複製配列をビーズに結合させる配列を備える。代替的には、単位複製配列は、ビーズ又は表面とのライゲーション前にシークエンシングアダプタとライゲートし得る。単位複製配列をシークエンスすることにより、識別子の同一性、ひいては試料中の制限断片の有無の同一性が明らかになる。
【0060】
Solexa技術
ハイスループットシークエンシング法の1つは、Solexa(英国)(www.solexa.co.uk)が利用可能であり、とりわけ、国際公開第WO0006770号、同第WO0027521号、同第WO0058507号、同第WO0123610号、同第WO0157248号、同第WO0157249号、同第WO02061127号、同第WO03016565号、同第WO03048387号、同第WO2004018497号、同第WO2004018493号、同第WO2004050915号、同第WO2004076692号、同第WO2005021786号、同第WO2005047301号、同第WO2005065814号、同第WO2005068656号、同第WO2005068089号、同第WO2005078130号に記載されている。本質的に、本方法はゲノムDNAのアダプタとライゲートした断片で開始する。アダプタとライゲートしたDNAは、典型的にはフローセルで、固体表面と結合したプライマーの濃密な叢(lawn)とランダムに結合する。アダプタとライゲートした断片の他端は、表面上で相補的なプライマーとハイブリダイズする。いわゆる固相架橋増幅において、ヌクレオチド及びポリメラーゼの存在下でプライマーを伸長することにより、二本鎖の断片が得られる。本固相架橋増幅は選択的増幅であり得る。変性及び固相架橋増幅の反復の結果、増幅した断片の濃密なクラスタが表面全体に分布して生成する。4つの異なる標識をした可逆性終止ヌクレオチド、プライマー及びポリメラーゼをフローセルに加えることによって、シークエンシングを開始する。プライマー伸長の第1のラウンド後、標識を検出し、第1の取込み塩基の同一性を記録し、ブロックした3’末端及び蛍光体を取込み塩基から除去する。その後、同様に、第2の塩基の同一性を判定し、そのようにシークエンシングが継続する。
【0061】
本発明において、アダプタとライゲートした制限断片又は単位複製配列は、プライマー結合配列又はプライマー配列を介して表面と結合する。識別子配列及び制限断片(の一部)を含む配列は概説したように求められる。現在利用可能なSolexa技術により、約25塩基対の断片のシークエンシングが可能である。アダプタ及び表面に結合したプライマーの経済的設計によって、シークエンシング工程は、試料識別子、制限エンドヌクレアーゼの認識配列の残部、及びいずれかの任意選択の選択塩基を読み過ごす。6bpの試料識別子を使用すると、残部はレアカッターEcoRI由来であり(AACCT)、2つの選択塩基を使用すると、12bpの制限断片の内部配列が生成し、これを使用して、試料中の制限断片を一意的に同定することができる。
【0062】
上記Solexaシークエンシング技術に基づく、好ましい実施形態において、アダプタとライゲートした制限断片の増幅は、その3’末端に最大で1つの選択ヌクレオチドを含有するプライマー、好ましくはその3’末端に選択ヌクレオチドを含有しないプライマー(即ち、プライマーがアダプタのみと相補的である)(+0プライマー)を用いて実施される。
【0063】
本明細書中に記載されるシークエンシング法を対象とする代替的な実施形態において、増幅で使用されるプライマーは、(本明細書中に記載されるプライマー又はプライマー結合配列の代用として)特異的区間を含有し得る。これは、次のシークエンシング工程で使用されて、アダプタでキャッピングした制限断片又は単位複製配列を表面に結合させる。これらは、概して鍵領域又は5’−プライマー適合配列として描写される。
【0064】
本発明の一実施形態において、核酸試料は少なくとも1つの制限酵素で消化され、IIs型制限エンドヌクレアーゼに対する認識配列を含む少なくとも1つのアダプタがライゲートされる。続いてのIIs型制限エンドヌクレアーゼによるアダプタとライゲートした制限断片の消化により、IIs型酵素の認識部位と制限部位間との距離は比較的短い(最大約30ヌクレオチド)ので、IIs制限部位適合アダプタがライゲートすることができる短めの制限断片及び長めの制限断片が生成する。典型的には、突出部で縮重したアダプタの組を使用し得るようなIIs制限部位の突出部は知られていない。(選択的)増幅後、単位複製配列をシークエンスすることができる。本実施形態におけるアダプタ配列は概して、5’−プライマー結合部位−−−試料識別子配列−−−縮重IIs型付着末端配列−3’である。関連PCRプライマーは概して、プライマー配列−−−試料識別子配列−−−縮重IIs型付着末端配列−−−選択ヌクレオチド−3’である。次に、合成によるシークエンシングの開始に使用されるプライマーは、概して、5’−プライマー結合部位−3’という構造を有する。サイズ選択工程は、IIs酵素で消化して小さめの断片を除去した後が好ましい可能性がある。本実施形態において、制限部位の残部は、本型の酵素では、典型的には2bp〜4bp程度であるので、この結果、15bp〜17bpの制限断片のシークエンシングにおいて6bpの試料識別子を組み合わせることとなる。
【0065】
さらなる態様において、本発明は、キット自体の従来の構成成分の他に、本方法で使用するための1つ若しくは複数のプライマー及び/又は1つ若しくは複数のアダプタを含む、キットに関する。さらに本発明により、用途、とりわけ、遺伝子型同定、バルクセグレガント分析、遺伝子マッピング、マーカー利用戻し交配、量的形質遺伝子座のマッピング、連鎖不平衡マッピング目的での、分子マーカーを同定する方法の使用が見出される。
【0066】
[実施例]
DNAを、従来法を使用して2つの親及び88個の子孫から単離した。親(2×)及び子孫(=4×)を異なる指標で二重化して、再現性を試験した。試料を互いに見分けるのに使用されるタグはそれぞれ、実験で使用される任意の他のタグとは少なくとも2ヌクレオチド異なった。アガロースゲル及びPAAゲルを使用して、各種工程全体にわたって品質を試験している。
【0067】
[実施例1]
各DNA試料に対して、制限−ライゲーション工程を、酵素としてEcoRI及びMseIを使用して実施する。アダプタは、Solexaハイスループットシークエンシングシステムの表面上に位置するハイブリダイズする配列に基づき、より詳細には、EcoRIアダプタはP5配列(シークエンスプライマー部分)を含有し、MseIアダプタはP7配列(架橋PCRプライマー配列)を含有する。EcoRIアダプタはさらに試料識別タグを含有する。96個の異なるEcoRIアダプタ及び1個のMseIアダプタを使用する。縮重したEcoRIアダプタを使用することが可能である。鋳型調製は、制限(EcoRI+MseI)工程後であるが、アダプタライゲーション工程前に、80℃で10分間、混合物をインキュベートすることによるサイズ選択工程を含む。130ntよりも小さな断片を除去する(トウモロコシ試料において)。
【0068】
混合物の複雑度を、+1プライマー(即ち、3’末端に1個のランダムな選択ヌクレオチドを含有する)を使用する選択的前増幅、96個のEcoRI+1プライマー及び1個のMseI+1プライマー(又は1個のタグが縮重したEcoRI+1プライマー及び1個のMseI+1プライマー)を使用する選択的前増幅によって低減させる。
【0069】
混合物の複雑度を所望のサイズに低減させるための選択的増幅を、EcoRI+2プライマー(=P5側)及びMseI+3(=P7側)プライマーを使用して実施し、これには96個のEcoRI+2プライマー及び1個のMseI+3プライマーの使用が必要となる。テールPCRを、P5架橋PCRプライマー配列をテールとして含む、EcoRIプライマーを使用して実施する。産物をSephadex(商標)カラムを使用して精製する。濃度を求め、標準化し、プールを作製する。プールを、架橋PCR増幅及びシークエンシング、その後のデータ解析を含むSolexa技術に基づく超並列処理シークエンシングに付して、親及び子孫の遺伝子型を求める。
【0070】
代替的なシナリオでは、テールPCRを使用しないが、リン酸化EcoRI+2プライマーを利用する。元々のアダプタとのミスマッチに起因して、増幅プロファイルにおけるアニーリング温度は3℃低くして、タッチダウンの13サイクル(62℃〜53℃)、その後の23サイクル(53℃)を実施する。P5架橋PCR配列とのアダプタのライゲーション後、P5架橋PCRプライマー及びP7架橋PCRプライマーを用いて、PCRを実施する。
【0071】
第2の代替的なシナリオは、先に本明細書中で概説したような標準的な鋳型調製、複雑度を低減させるための選択的(前)増幅に基づく。選択的増幅は、再構成したEcoRI及びMseI制限部位を含有するプライマーを用いて実施する。これがシークエンシング前のアダプタ配列の除去を可能にすることにより、分析すべきデータ量が低減される。Sephadex(商標)カラムで産物を精製することにより、Taq DNAポリメラーゼの残部を除去する。ここで、(再構成部位)アダプタ配列を、10倍増のEcoRIアダプタ及びEcoRI酵素を使用するSolexaアダプタで置換して、ゲノムDNAと比較して増加したEcoRI部位数を補償する。SolexaのEcoRIアダプタもタグを含有するので、96個のタグ付けしたSolexaのEcoRIアダプタが必要である。アダプタの下鎖の3’末端をブロックして(この場合、3’アミノによる)、ポリメラーゼによる伸長をブロックする。PCRを、P5架橋PCRプライマー及びP7架橋PCRプライマーを用いて実施する。産物をQiagenカラムで精製する。
【0072】
[実施例2]
AFLP断片のシークエンス系検出を、Solexaのクローナル単分子アレイ(CSMATM)技術、1回のシークエンス操作で最大4000万個の個々の断片を分析することが可能な、合成によるシークエンシングプラットフォームを使用して実施した。
【0073】
実験シークエンスは、AFLP鋳型調製、選択的(AFLP)増幅、単分子架橋増幅、及びAFLP断片の1つの制限酵素末端からの何百万のシークエンスタグのシークエンシングを包含する。トウモロコシ親系統B73及びMo17並びに87個の組換え自植系統(RIL)を使用し、890万個のEcoRI AFLP断片末端にわたってシークエンスすることにより、シークエンス系AFLP検出に対する原理証明を得た。
【0074】
親系統B73及びMo17並びに87個のRILを選択した。AFLP鋳型を、制限酵素の組合せEcoRI/MseIを使用して調製した。+2/+3 AFLPプライマーを使用して、選択的増幅を実施した。
【0075】
SolexaのCSMA架橋増幅に対する鋳型断片を、一意の5bpの試料識別(ID)タグ配列を含有するEcoRIアダプタを使用して第2の制限/ライゲーションを実施することによって調製した。異なる5bpの試料IDタグを使用する親系統及び3つのRIL試料を2回含めることにより、実験内での再現性を測定した。
【0076】
シークエンス系AFLPマーカーを、B73及びMo17において異なる頻度で観察される27bpのシークエンスタグを抽出することによって同定し、RIL子孫において分離した。
【0077】
シークエンス系AFLPマーカーデータを、4つの対応するEcoRI/MseI +3/+3プライマーの組合せの長さ系検出を使用する従来のAFLPフィンガープリント法によって得られるAFLPマーカースコアと比較した。
【0078】
シークエンス実行統計量(5フローセル)
生成したシークエンスタグ数 8941407
既知の試料IDを有するシークエンスタグ数 8029595
既知の試料IDを有する異なるシークエンスタグ数 206758
生成したMbp配列データ 241.4
頻度範囲 1試料当たりのシークエンスタグ合計数 55374〜112527
シークエンスタグAFLPマーカー数 125
頻度範囲 親のスコアリング表示におけるシークエンスタグAFLPマーカー数 90〜17218
シークエンスタグAFLPマーカーの確定及びスコアリング
1試料当たりのシークエンスタグ表現を一覧にする
未知の試料IDを有するシークエンスタグを除去する
1試料当たりの全シークエンスタグに基づいて試料表現を標準化する
2つの親で頻度差が2倍を超えるシークエンスタグを除去する
2つの親のタグ頻度を平均する
頻度P1/P2が閾値を越える場合、シークエンスタグAFLPマーカーを確定する
RIL子孫におけるシークエンスタグマーカーの有/無をスコアリングする
【0079】
AFLPマーカー分布(AFLP +3/+3:シークエンス/ゲル系)
【表1】

【0080】
シークエンスタグAFLPマーカーの再現性(2回、3つのRIL子孫)
スコアリングしたシークエンスタグAFLPマーカー数 125
比較した標本値群数(number of data-points) 375
2回で一致した標本値群数 372
2回の実験での一致度(%) 99.2%
【0081】
従来のスラブゲル検出:
【表2】

【0082】
Solexa系検出
【表3】

【0083】
SolexaのCSMA技術を使用することによって、シークエンス系AFLPマーカー検出の実行可能性が生じたことにより、多数のAFLPマーカーが、分解能(断片サイズ)の改善、及び少量の断片をも捕捉するシークエンシングの深度に起因して、従来のスラブゲルではなく、シークエンス系検出を使用してスコアリングされる。マーカーデータベクトル比較により、シークエンス系検出とスラブゲル検出の間で同様の分離パターンが明らかになる。一致度の証明からは、シークエンシングゲル系AFLPマーカーが待望される。
【図面の簡単な説明】
【0084】
【図1】AFLP検出ショートタグシークエンシングに関する正規のAFLP系手法で使用されるアダプタ構造を表す概略図である。EcoRI及びMseIによるDNA試料の消化に由来する典型的なAFLP断片、及び続いてのアダプタライゲーション、それからEcoRI部位に対する典型的なアダプタを示す。アダプタは、5’末端から3’末端に向かって、5’プライマー配列(任意選択であり、増幅プライマーをアンカーするため又はアダプタとライゲートした断片をビーズ又は表面にアンカーするために使用することができる)を含む。また、識別子(縮重形態のNNNNNNとして与えられる)、その後の制限酵素の認識配列の残部(本EcoRIでは、即ち、AATTC)を示す。識別子の最終ヌクレオチドは好ましくは、EcoRI制限部位を破壊するためにGを含まない。任意選択の5’プライマー配列、特異的プライマー(ACTGAC)の一例、認識部位の残部、及び3’末端に1つ又は複数の選択ヌクレオチドを含有し得る区間を含む、好適なプライマーが提供される。
【図2】IIs型制限エンドヌクレアーゼに対する認識配列がアダプタに組み込まれた実施形態を表す概略図である。IIs型酵素による制限の後、IIs型適合アダプタは、制限断片A及び制限断片Bの一方又は両方とライゲートすることができる。IIs型アダプタは、任意選択のプライマー結合(又はアンカー)配列、識別子、及びIIs制限部位の突出部とハイブリダイズするための(縮重)ヌクレオチド(NN)を含有する区間を含む。関連プライマーは、その3’末端に1つ又は複数の選択ヌクレオチド(XYZ)を含有し得る。

【特許請求の範囲】
【請求項1】
試料中の制限断片を同定する方法であって、
(h)試料核酸を提供する工程と、
(i)前記試料核酸を、少なくとも1つの制限エンドヌクレアーゼで消化する工程であって、制限断片の組が得られる、消化工程と、
(j)二本鎖合成アダプタを提供する工程であって、
5’プライマー適合配列と、
試料特異的識別子区間と、
前記制限エンドヌクレアーゼの前記認識配列の残部と相補的な区間とを含む、二本鎖合成アダプタを提供する工程と、
(k)前記二本鎖合成アダプタを、組になった前記制限断片にライゲートする工程であって、アダプタとライゲートした制限断片の組が得られる、ライゲート工程と、
(l)以下の:
前記試料特異的識別子区間、及び
前記制限エンドヌクレアーゼの前記認識配列の残部と相補的な前記区間、
と少なくとも相補的な1つ又は複数のプライマーを用いて、アダプタとライゲートした制限断片の前記組を増幅する工程であって、増幅したアダプタとライゲートした制限断片(アンプリコン)が得られる、増幅工程と、
(m)少なくとも前記試料特異的識別子区間の前記配列、前記制限エンドヌクレアーゼの前記認識配列の残部、及びそれに隣接して位置する、前記増幅したアダプタとライゲートした制限断片(の一部)の前記制限断片の前記配列の一部を求める工程と、
(n)前記試料中の増幅したアダプタとライゲートした制限断片の有無を同定する工程とを含む、試料中の制限断片を同定する方法。
【請求項2】
前記制限断片が分子マーカーである、請求項1に記載の方法。
【請求項3】
前記分子マーカーがAFLPマーカーである、請求項2に記載の方法。
【請求項4】
2つ以上の試料が制限断片、分子マーカーの少なくとも一方の有無に関して比較される、請求項1に記載の方法。
【請求項5】
2つ以上の試料が前記アダプタをライゲートする工程の後にプールに集められる、請求項1に記載の方法。
【請求項6】
前記プール中の各試料に対して、前記プール中の他の試料特異的識別子とは異なる試料特異的識別子が使用される、請求項5に記載の方法。
【請求項7】
前記プライマーが3’末端に1つ又は複数の選択ヌクレオチドを含有する、請求項1に記載の方法。
【請求項8】
前記制限エンドヌクレアーゼがII型制限エンドヌクレアーゼである、請求項1に記載の方法。
【請求項9】
前記制限エンドヌクレアーゼがIIs型制限エンドヌクレアーゼである、請求項1に記載の方法。
【請求項10】
2つ以上の制限エンドヌクレアーゼが使用される、請求項1に記載の方法。
【請求項11】
前記シークエンシングがハイスループットシークエンシングを用いて実行される、請求項1に記載の方法。
【請求項12】
前記ハイスループットシークエンシングが固体支持体上で実施される、請求項8に記載の方法。
【請求項13】
前記ハイスループットシークエンシングが合成によるシークエンシングに基づく、請求項8に記載の方法。
【請求項14】
前記ハイスループットシークエンシングが、
前記アンプリコン又は前記アダプタとライゲートした制限断片を、ビーズにアニーリングする(各ビーズは、単一のアダプタとライゲートした制限断片又はアンプリコンとアニーリングする)工程と、
前記ビーズを油中水型マイクロリアクタ中で乳化させる(各油中水型マイクロリアクタは単一のビーズを含む)工程と、
エマルジョンPCRを実施する工程であって、アダプタとライゲートした制限断片又はアンプリコンをビーズ表面上で増幅する、実施工程と、
任意選択で、増幅したアンプリコンを含有するビーズを選択/濃縮する工程と、
前記ビーズをウェルに充填する(各ウェルは単一のビーズを含む)工程と、
ピロリン酸シグナルの生成を使用して、前記アダプタとライゲートした制限断片又は前記増幅したアンプリコンの前記ヌクレオチド配列を求める工程とを含む、請求項8に記載の方法。
【請求項15】
前記ハイスループットシークエンシングが、
前記アダプタとライゲートした制限断片又は前記アンプリコンを、第1のプライマー及び第2のプライマー又は第1のプライマー結合配列及び第2のプライマー結合配列をそれぞれ含有する表面にアニーリングする工程と、
架橋増幅を実施する工程であって、増幅したアダプタとライゲートした制限断片又は増幅したアンプリコンのクラスタが得られる、実施工程と、
標識した可逆性終止ヌクレオチドを使用して、前記増幅したアダプタとライゲートした制限断片又は前記増幅したアンプリコンの前記ヌクレオチド配列を求める工程とを含む、請求項8に記載の方法。
【請求項16】
前記識別子が4bp〜16bp、好ましくは4bp〜10bp、より好ましくは4bp〜8bp、最も好ましくは4bp〜6bpである、請求項1に記載の方法。
【請求項17】
前記識別子が2つ以上の同一連続塩基を含有しない、請求項13に記載の方法。
【請求項18】
2つ以上の試料に対して、前記対応する識別子が少なくとも2つの異なるヌクレオチドを含有する、請求項13に記載の方法。
【請求項19】
遺伝子型同定、バルクセグレガント分析、遺伝子マッピング、マーカー利用戻し交配、量的形質遺伝子座のマッピング、連鎖不平衡マッピングのための、分子マーカーを同定する方法の使用。
【請求項20】
請求項1で規定した1つ又は複数のプライマーを含む、キット。
【請求項21】
請求項1で規定した1つ又は複数のアダプタを含む、キット。
【請求項22】
請求項1で規定したプライマー及びアダプタを含む、キット。

【図1】
image rotate

【図2】
image rotate


【公表番号】特表2009−536817(P2009−536817A)
【公表日】平成21年10月22日(2009.10.22)
【国際特許分類】
【出願番号】特願2009−504137(P2009−504137)
【出願日】平成19年4月4日(2007.4.4)
【国際出願番号】PCT/NL2007/000094
【国際公開番号】WO2007/114693
【国際公開日】平成19年10月11日(2007.10.11)
【出願人】(505464888)キージーン ナムローゼ フェンノートシャップ (11)
【Fターム(参考)】