説明

ハイスループットAFLP系多型検出法

本発明は、1つ又は複数のサンプルにおける1つ又は複数の遺伝子マーカーのハイスループットでの発見、検出、及び遺伝子型決定のための方法であって、DNAの制限エンドヌクレアーゼによる消化、アダプターライゲーション、任意選択の前増幅、選択的増幅、増幅産物のプーリング、十分な重複を有するライブラリーのシークエンシング、クラスタリング、その後のライブラリー内部、ライブラリー間の少なくとも一方での遺伝子マーカーの同定、並びに遺伝子マーカーの(共)優性遺伝子型の決定の各工程を含む方法に関する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、分子生物学及び遺伝学の分野に関する。本発明は、核酸サンプル内又は核酸サンプル間での多型の迅速な発見、検出、及び大規模な遺伝子型決定に関する。同定された多型は遺伝子マーカーとして使用され得る。
【背景技術】
【0002】
ゲノムDNAの調査は、科学関係者、特に医療関係者によって長く望まれてきた。ゲノムDNAは、癌及びアルツハイマー病のような疾患の同定、診断、及び治療の鍵を握る。ゲノムDNAの調査は、疾患の同定及び治療だけでなく、植物及び動物品種改良事業において著しい利点を提供し、食品栄養学の問題に対する答えを世界に示すかもしれない。
【0003】
多くの疾患が、特異的な遺伝的要素、特に特異的な遺伝子の多型に関連することが知られている。ゲノムのような大きなサンプルにおける多型の同定は、現在、困難且つ多くの時間を要する課題である。しかしながら、そのような同定は、生物医学研究、医薬品の開発、組織適合試験、遺伝子型決定、及び集団研究のような領域に対して非常に価値がある。
【0004】
マーカー、具体的には遺伝子マーカーは、非常に長い間、遺伝子型決定法として、即ち、表現型形質をDNA(遺伝子)の特定部分の有無又は量と結び付けるために使用されてきた。最も用途の広い遺伝子型決定技術の1つが、既に何十年にもわたって知られており、任意の生物体に広く適用可能なAFLPである(概説に関しては、Savelkoul他 J. Clin. Microbiol, 1999, 37(10), 3083-3091; Bensch他 Molecular Ecology, 2005, 14, 2899- 2914を参照)。
【0005】
AFLP技術(Zabeau & Vos, 1993; Vos他, 1995)は1990年代初頭の発明以来、植物の品種改良及び他の分野において普及してきた。これはAFLPの幾つかの特徴に起因するが、中でも最も重要なのは、事前の配列情報を必要とせずに、再現可能な様式で多数の遺伝子マーカーが生成されることである。また、AFLPの要である選択的増幅の原理は、増幅される断片の数が、ゲノムサイズ又は起源とは無関係に検出システムの分解能と調和し得ることを保証する。
【0006】
AFLP断片の検出は一般にスラブゲル上での電気泳動(Vos他, 1995)又はキャピラリー電気泳動(van der Meulen他, 2002)によって実施される。こうしてスコアリングされるAFLPマーカーの大部分は、AFLP鋳型調製に使用される制限酵素認識部位又は選択的AFLPプライマーによって覆われるそれらのフランキングヌクレオチドのいずれかで生じる(一塩基)多型を表す。残りのAFLPマーカーは、制限断片の内部配列で生じる挿入/欠失多型、及び小さな制限断片(<約100bp)で生じる一塩基置換における非常に小さな画分であり、これらの断片に対し、両対立遺伝子間での再現可能な移動度の変動を引き起こす。これらのAFLPマーカーはバンド強度に依存する必要なく、共優性としてスコアリングされ得る。
【0007】
それゆえ、典型的なAFLPフィンガープリントでは、AFLPマーカーは増幅される断片の少数(50%未満であるが、20%未満であることも多い)を構成する一方、残りは一般に定常(constant)AFLP断片と称される。にもかかわらず、後者がゲルスコアリング手順で有用であるのは、それらがAFLPマーカーの断片移動度を算出するためのアンカーポイントとして働き、共優性スコアリングのためのマーカーを定量する際の助けとなるからである。現在は、AFLPマーカーの共優性スコアリング(ホモ接合性又はヘテロ接合性に対するスコアリング)は、分離集団をフィンガープリントするという状況に制限されている。関連のない系統のパネルでは、優性スコアリングのみが可能である。
【0008】
増幅工程及び検出工程における高い多重レベルのために、AFLPのスループットは非常に高いが、律速段階は電気泳動の分解能である。電気泳動により、制限酵素の組合せ(EC)、プライマーの組合せ(PC)及び移動度の組合せに基づく、増幅された断片の大部分の一意的な同定が可能となるが、理想的には、検出システムは増幅された断片の配列全体を決定して、全ての多型を捕捉できるべきである。
【0009】
移動度決定の代わりにシークエンシングによる検出を行うと、スループットが増大する。理由:
1)内部配列に位置する多型は、殆どの(又は全ての)増幅された断片中に検出される。これによりPC毎のマーカー数がかなり増大する。
【0010】
2)AFLPマーカー及び定常バンドの共遊走によるAFLPマーカーの減少が無い。
【0011】
3)共優性スコアリングはバンド強度の定量化に依存せず、且つフィンガープリントされる個体の関連性から独立している。
【0012】
今のところ、シークエンシングによるAFLPマーカー/配列の検出は、数ある制限の中でも、Sangerのジデオキシシークエンシング技術及び他の従来のシークエンシング技術のコスト的な制限により経済的に実現不可能となっている。
【0013】
【特許文献1】欧州特許第0534858号
【特許文献2】米国特許第6045994号
【特許文献3】国際公開特許第WO03/012118号
【特許文献4】国際公開特許第WO00/24939号
【特許文献5】国際公開特許第WO90/008821号
【特許文献6】国際公開特許第WO00/23620号
【特許文献7】国際公開特許第WO03/004690号
【特許文献8】国際公開特許第WO03/054142号
【特許文献9】国際公開特許第WO2004/069849号
【特許文献10】国際公開特許第WO2004/070005号
【特許文献11】国際公開特許第WO2004/070007号
【特許文献12】国際公開特許第WO2005/003375号
【発明の開示】
【発明が解決しようとする課題】
【0014】
したがって、本発明の目標の1つは、シークエンシングに基づきAFLPマーカー又は他の遺伝子マーカー(SNPマーカー等)を検出するための経済的に実現可能な方法を提供することである。
【0015】
遺伝子型決定(即ち、診断)という目的のために、シークエンシングを通じて断片を含有するAFLP又はSNPの集合を検出することとさらに関連した重要な問題は、標本抽出変動(sample variation)の問題である。具体的には、マーカーの偽陰性のスコアリングにつながるので、断片の集合を解析して特別な断片が観察されない場合に、このことが関与する断片が断片混合物中に存在するにもかかわらず、検出工程で抽出されなかったという事実に起因しないことを確認しなければならないことを意味する。ゲル上での位置情報が利用可能であるので、この制限は電気泳動による検出には当てはまらない。
【0016】
したがって、本発明のさらなる目標の1つは、標本抽出変動の問題を解決する方法又は少なくとも標本抽出変動により引き起こされる誤差を許容可能な最小限度まで低減させる方法を提供することである。
【課題を解決するための手段】
【0017】
本発明者等は、ハイスループットシークエンシング用の或る特定の適合した手順においてAFLPを用いることにより、シークエンシングがAFLPマーカー及びSNPマーカーの検出に実行可能であることを見出した。したがって、本発明は、AFLPの能力及び一般的適用可能性を或る特定のハイスループットシークエンシング技術と結びつけて、一般的に適用可能な多型スコアリングシステムを確立する方法又は戦略を提供する。本戦略において、標本抽出変動という課題はまた、高精度での遺伝子型決定、及びデータセットの遺伝子型を決定できない(missing genotypes)数が最小となる可能性の最大化を保証するように扱われる。
【0018】
定義
以下の説明及び実施例において、多くの用語が使用される。そのような用語に与えられる範囲を含む、明細書及び特許請求の範囲についての明確で一貫した理解を提供するために、以下の定義が提供される。特別に本明細書において定義されないならば、使用される全ての技術的用語及び科学的用語は、本発明が属する当業者によって一般に理解されるものと同一の意味を有する。全ての出版物、特許出願、特許及び他の参考文献の開示は、参照によりそれら全体は本明細書において援用される。
【0019】
多型:多型は、集団中のヌクレオチド配列の2つ以上の変異型の存在を指す。多型は1つ又は複数の塩基変化、塩基挿入、塩基重複、又は塩基欠失を含んでもよい。多型は、例えば、単純重複配列(SSR)及び一塩基多型(SNP)を含み、それらはアデニン(A)、チミン(T)、シトシン(C)、又はグアニン(G)の単一のヌクレオチドが変わったときに生じる変異である。集団の通常少なくとも1%で変異が生じたものが、SNPと考えられる。SNPは、例えば全てのヒト遺伝的変異の90%を占め、ヒトゲノムにわたって100〜300塩基ごとに起こるものである。3つのSNP当たり2つのSNPでは、チミン(T)によってシトシン(C)が置換される。DNA塩基配列の変異は、例えば、ヒト又は植物がどのように疾患、細菌、ウイルス、化学薬品、薬剤等を扱うかに影響し得る。
【0020】
核酸:本発明に記載の核酸は、ピリミジン塩基及びプリン塩基の任意のポリマー又はオリゴマー、好ましくはシトシン、チミン及びウラシル、並びにアデニン及びグアニンをそれぞれ含んでもよい(Albert L. Lehninger著「生化学の原理(Principles of Biochemistry)」, 793-800 (Worth Pub. 1982)を参照、これは全ての目的のためにその全体を参照により本明細書において援用される)。本発明は、任意のデオキシリボヌクレオチド、リボヌクレオチド又はペプチド核酸成分、及びそれら任意の化学的な変異型(例えばこれらの塩基のメチル化された形式、ヒドロキシメチル化された形式又は糖鎖が付加した形式)を検討する。ポリマー又はオリゴマーは、組成物中で不均質また均質であってもよく、天然に存在するソースから単離するか又は人為的若しくは合成的に生成されてもよい。さらに核酸は、DNA又はRNA、又はそれらの混合物であってもよく、恒久的に又は一時的に、ホモ二本鎖、ヘテロ二本鎖、及びハイブリッド状態を含む、一本鎖型又は二本鎖型で存在してもよい。
【0021】
複雑度低減:用語「複雑度低減」は、サンプルのサブセットの生成によって、ゲノムDNAのような核酸サンプルの複雑度を減少させる方法を指し示すために使用する。このサブセットはサンプル全体(即ち複雑である)の代表になることができ、好ましくは再現可能なサブセットである。本状況において、再現可能は、同一の方法を使用して、同一のサンプルの複雑度が減少される場合、同じ又は少なくとも同程度のサブセットが得られることを意味する。複雑度低減のために使用される方法は、当該技術分野において既知である複雑度低減のための任意の方法であってもよい。複雑度低減のための方法の好ましい例は、例えば、AFLP(登録商標)(Keygene N.V.、オランダ;例えば特許文献1、特許文献2を参照)、Dongにより説明された方法(例えば、特許文献3、特許文献4を参照)、インデックスリンク(indexed linking)(Unrau他、以下参照)、リンカーPCR(特許文献5)、及びSALSA−PCR(特許文献6)Schouten他)等を含む。本発明で使用される複雑度低減方法は、それらが再現可能であることが共通である。同一のサンプルが同一の様式で複雑度が減少される場合に、サンプルの同一のサブセットが得られるという意味における再現性については、顕微解剖、又は選択された組織で転写されたゲノムの一部を表わし、その再現性については、組織の選択、単離時期等への依存があるmRNA(cDNA)の使用のような、よりランダムな複雑度低減に対立するものである。
【0022】
AFLP:AFLPとは、制限断片を生成するために1つ又は複数の制限エンドヌクレアーゼにより核酸を消化すること、アダプターを制限断片へライゲーションすること、及びアダプターと(一部)相補的であり、制限エンドヌクレアーゼの残りと(一部)相補的であり、少なくとも1つのA、C、T又はG(又は場合によってはU)の中からランダムに選択されるヌクレオチドをさらに含有する少なくとも1つのプライマーを用いてアダプターにライゲーションされた制限断片を増幅させることに基づくDNAの選択的増幅法を指す。AFLPには任意の事前配列情報は無く、任意の開始DNAで行なうことができる。一般にAFLPは、
(a)核酸、特にDNA又はcDNAを1つ又は複数の特異的な制限エンドヌクレアーゼで消化し、それにより対応する一連の制限断片へとDNAを断片化する、消化する工程と、
(b)このように得られた制限断片を、一末端が制限断片の一末端又は両末端と適合する二本鎖合成オリゴヌクレオチドアダプターとライゲーションし、それによりアダプターでライゲーションされた(好ましくは、タグ付けされた)開始DNAの制限断片を生成する、ライゲーションする工程と、
(c)アダプターでライゲーションされた(好ましくは、タグ付けされた)制限断片を、ハイブリダイズする条件下で、その3’−末端で選択ヌクレオチドを含む1つ又は複数のオリゴヌクレオチドプライマーと接触させる工程と、
(d)プライマーとハイブリダイズされたアダプターでライゲーションされた(好ましくは、タグ付けされた)制限断片を、プライマーがハイブリダイズする開始DNAの制限断片に沿ってハイブリダイズされたプライマーのさらなる伸長を引き起こすように、PCR又は同様の技術によって増幅する工程と、
(e)このように得られた増幅又は伸長したDNA断片を、検出、同定、又は回収する工程とを含む。
【0023】
したがって、AFLPはアダプターにライゲーションされた断片の再現可能なサブセットを提供する。AFLPは特許文献1、特許文献2及びVos他に記載されている。AFLPに関するさらなる詳細についてはこれらの出版物が参照される。AFLPは複雑度低減技法及びDNAフィンガープリント技術として汎用される。AFLPをフィンガープリント技術として使用する状況の中で、AFLPマーカーの概念が発展してきた。
【0024】
AFLPマーカー:AFLPマーカーは、同一のプライマーのセットを使用して、AFLPを使用して増幅された(フィンガープリントされた)2つのサンプル間で異なる、増幅されたアダプターにライゲーションされた制限断片である。したがって、この増幅されたアダプターにライゲーションされた制限断片の有無は、形質又は表現型と連結するマーカーとして使用され得る。従来のゲル技術では、AFLPマーカーは、ゲル中に或る特定の移動度で位置するバンドとして現れる。キャピラリー電気泳動法等の他の電気泳動技法は、これをバンドと称し得ないが概念は同一のままである、即ち、或る特定の長さ及び移動度を有する核酸である。バンドの有無は表現型の有無を示唆し得る(又は表現型の有無と関連し得る)。典型的には、AFLPマーカーはエンドヌクレアーゼの制限部位又は選択ヌクレオチド内のSNPを含む。時として、AFLPマーカーは制限断片内のインデルを含み得る。
【0025】
SNPマーカー:SNPマーカーは、或る特定の位置で同定された一塩基多型に基づくマーカーである。SNPマーカーは、AFLPマーカーと同一位置に位置し得るが、SNPマーカーは、制限断片自体にも位置し得る。したがって、SNPマーカー属はAFLPマーカー種をこうして包含する。
【0026】
定常バンド:AFLP技術における定常バンドは、サンプル間で比較的不変の、増幅されたアダプターにライゲーションされた制限断片である。したがって、AFLP技術における定常バンドは、サンプルの範囲を超えて、ゲル中のほぼ同一位置に現れる、即ち、同一の長さ/移動度を有する。従来のAFLPでは、これらは典型的には、ゲル上のサンプルに対応するレーン又はキャピラリー電気泳動によって検出される複数のAFLPサンプルの電気泳動図をアンカーする(anchor)のに使用される。典型的には、定常バンドはAFLPマーカーよりも情報不足である。にもかかわらず、AFLPマーカーが通例(customary)選択ヌクレオチド又は制限部位内にSNPを包含するのと同様に、定常バンドは制限断片自体にSNPを含む可能性があり、定常バンドはAFLPマーカーと相補的な遺伝情報の興味深い代替的なソースとなる。
【0027】
選択塩基:選択塩基は、アダプターに相補的な部分及び制限部位の残りに相補的な部分を含有するプライマーの3’末端に位置し、A、C、T又はGの中からランダムに選択される。選択塩基を用いてプライマーを伸長することにより、続く増幅ではアダプターにライゲーションされた制限断片の再現可能なサブセットのみ、即ち、選択塩基を担持するプライマーを使用して増幅され得る断片のみが生成される。選択ヌクレオチドは1〜10の数でプライマーの3’末端に付加され得る。典型的には、1〜4で十分である。両プライマーは様々な数の選択塩基を含有し得る。それぞれ付加された選択塩基に応じて、サブセットはサブセット中の増幅されたアダプターとライゲーションされた制限断片の量を約4分の1に低減させる。典型的には、AFLPにおいて使用される選択塩基の数は+N+Mで示される(式中、1つのプライマーがN個の選択ヌクレオチドを担持し、他のプライマーは、M個の選択ヌクレオチドを担持する)。したがって、Eco/Mse +1/+2 AFLPとは、開始DNAのEcoRI及びMseIによる消化、適切なアダプターのライゲーション、並びに1つの選択塩基を担持するEcoRI制限位置を対象とする1つのプライマー、及び2つの選択ヌクレオチドを担持するMseI制限部位を対象とするもう1つのプライマーを用いた増幅の省略表現である。
【0028】
クラスタリング:用語「クラスタリング」の意味は、同一または類似のヌクレオチドの短い又は長いストレッチの存在に基づいて、2つ以上のヌクレオチド配列を比較することである。以下でさらに説明するように、幾つかのヌクレオチド配列のアライメント方法が当該技術分野において既知である。用語「アセンブリー」又は「アライメント」が同義語として使用されることもある。
【0029】
タグ:プライマーに付加され得るか、その配列内に含まれ得るか、そうでなければラベルとして使用されて一意の識別子を提供し得る短い配列。かかる配列識別子は、特定の核酸サンプルを同定するために一意的に使用される、多様であるが規定された長さを有する一意の塩基配列であり得る。例えば、4bpのタグにより、4=256の異なるタグができる。典型的な例は、ハイブリダイゼーションによる一意的な検出に汎用されるタグとして当該技術分野において既知のZIP配列である(Iannone他 Cytometry 39:131-140, 2000)。かかるタグを使用することによって、さらなる処理時にPCRサンプルの起源が決定され得る。異なる核酸サンプルに由来する処理産物を組み合わせる場合には、概して、異なる核酸サンプルは異なるタグを使用して同定される。本発明の場合、一意的な配列タグを付加することにより、配列増幅産物のプーリングで個々の植物の座標が同定される。複数のタグが使用され得る。
【0030】
タグ付け:用語「タグ付け」は、核酸サンプルを第2の核酸サンプル又はさらなる核酸サンプルと区別することを可能にするために、核酸サンプルへタグを追加することを指す。タグ付けは、例えば、複雑度低減の間の配列識別子の追加により、又は当該技術分野において既知である任意の他の手段により行なうことができる。そのような配列識別子は、特異的な核酸サンプルの同定のために一意的に使用される、例えば多様であるが規定された長さの一意の塩基配列であり得る。その代表例は、例えばZIP配列である。そのようなタグを使用して、その後の処理に際して、サンプルの起源を決定することができる。異なる核酸サンプルに由来する処理産物を組み合わせる場合には、異なる核酸サンプルは異なるタグを使用して同定されるべきである。
【0031】
タグ付けされたライブラリー:用語「タグ付けされたライブラリー」は、タグ付けされた核酸のライブラリーを指す。
【0032】
シークエンシング:用語「シークエンシング」は、核酸サンプル、例えばDNA又はRNA中のヌクレオチド(塩基配列)の順番を決定することを指す。
【0033】
ハイスループットスクリーニング:HTSとしばしば略されるハイスループットスクリーニングは、特に生物学分野及び化学分野に関連する、科学的な実験のための方法である。最新のロボット工学と他の特殊な研究室ハードウェアとの組合せによって、研究者が効果的に同時に大量のサンプルをスクリーニングすることを可能にする。
【0034】
制限エンドヌクレアーゼ:制限エンドヌクレアーゼ又は制限酵素は、二本鎖DNA分子中の特異的なヌクレオチド配列(標的部位)を認識し、標的部位ごとにDNA分子の両鎖を切断する酵素である。
【0035】
制限断片:制限エンドヌクレアーゼによる消化により生成されたDNA分子は制限断片と称される。任意の所定のゲノム(又はその起源にかかわらず核酸)は、特定の制限エンドヌクレアーゼにより、制限断片の不連続なセットへと消化されるだろう。制限エンドヌクレアーゼ切断に由来するDNA断片は、様々な技法の中でさらに使用することができ、例えばゲル電気泳動法により検出することができる。
【0036】
ゲル電気泳動法:制限断片を検出するために、サイズに基づいて二本鎖DNA分子を画分するための解析方法が必要になる。そのような画分を達成するために、最も一般に用いられている技法は、(キャピラリー)ゲル電気泳動法である。DNA断片のそのようなゲル中での移動率は、DNA断片の分子量に依存する。したがって、断片長が増加するにつれて、移動距離は減少する。ゲル電気泳動法により画分されたDNA断片は、パターンの中に含まれた断片数が十分に少ない場合には、染色手順、例えば、銀染色法又はエチジウムブロマイドを使用する染色法により直接可視化することができる。代替的には、DNA断片のさらなる処理では、蛍光色素分子又は放射性ラベルのような、断片において検出可能なラベルを取り込んでもよい。
【0037】
ライゲーション:2つの二本鎖DNA分子を共有結合で共に連結させるリガーゼ酵素により触媒された酵素反応は、ライゲーションと称される。一般に、両方のDNA鎖は共有結合で共に連結されるが、鎖の1つの末端の化学的修飾又は酵素的修飾によって、2つの鎖のうちの1つの鎖のライゲーションを防ぐことも可能である。その場合には、共有結合が2つのDNA鎖のうちの1つだけにおいて起こるだろう。
【0038】
合成オリゴヌクレオチド:化学的に合成することができる、好ましくは約10〜約50塩基を有する一本鎖DNA分子は、合成オリゴヌクレオチドと称される。関連した配列を有する分子のファミリーを合成することは可能であり、それはヌクレオチド配列中の特異的な位置で異なるヌクレオチド組成を有しているが、一般に、これらの合成DNA分子は、一意のヌクレオチド配列又は所望のヌクレオチド配列を有するように設計される。用語「合成オリゴヌクレオチド」は、設計されたヌクレオチド配列又は所望のヌクレオチド配列を有するDNA分子を指すために使用されるだろう。
【0039】
アダプター:限られた数の塩基対、例えば約10〜約30塩基対長を有する短い二本鎖DNA分子は、制限断片末端にライゲーションすることができるように設計されている。アダプターは、通常互いに部分的に相補的なヌクレオチド配列を有する2つの合成オリゴヌクレオチドから成る。適切な条件下で溶液中で2つの合成オリゴヌクレオチドを混合した場合、それらは互いにアニーリングして、二本鎖構造を形成するだろう。アニーリング後、アダプター分子の一末端は制限断片の末端と適合し、ライゲーションすることができるように設計されている。アダプターの他の末端は、ライゲーションできないように設計することができるが、そうである必要はない(二重にライゲーションされたアダプター)。
【0040】
アダプターにライゲーションされた制限断片:アダプターによりキャッピングされた制限断片。
【0041】
プライマー:一般に、用語「プライマー」は、DNAの合成をプライミングすることができるDNA鎖を指す。DNAポリメラーゼは、プライマーなしではDNAをデノボ合成することができない。アセンブリーされるヌクレオチドの順序を指定するために、鋳型として相補的な鎖が用いられるような反応において、DNAポリメラーゼは既存のDNA鎖のみを伸長することができる。本発明者等は、プライマーとして、ポリメラーゼ連鎖反応(PCR)において用いられる合成オリゴヌクレオチド分子を指すだろう。
【0042】
DNAの増幅:用語「DNAの増幅」は、典型的には、PCRを用いた二本鎖DNA分子のin vitroの合成を指し示すために用いられるだろう。他の増幅方法が存在し、それらは主旨から外れずに、本発明において用いられてもよいことに留意されたい。
【0043】
選択的ハイブリダイゼーション:ストリンジェントなハイブリダイゼーション条件下、非標的核酸配列への、及び非標的核酸を実質的に排除したハイブリダイゼーションよりも検出可能な程度に多い(例えば、バックグラウンドに対して少なくとも2倍)特異的な核酸標的配列への核酸配列のハイブリダイゼーションに関する。用語「ストリンジェントな条件」又は「ストリンジェントなハイブリダイゼーション条件」は、プローブが、他の配列よりも検出可能な程度に多く(例えば、バックグラウンドに対して少なくとも2倍)、標的配列とハイブリダイズする条件への言及を含む。ストリンジェントな条件は配列依存性であり、場合によって異なる。ハイブリダイゼーション、洗浄条件の少なくとも一方のストリンジェンシーを制御することによって、プローブと100%相補的な標的配列を同定し得る(相同プロービング(homologous probing))。代替的に、ストリンジェンシー条件を調整することができ、配列中の幾つかのミスマッチを許容するとより低い類似度が検出される(非相同プロービング(heterologous probing))。概して、プローブは約100ヌクレオチド長未満、任意選択で50又は25ヌクレオチド長以下である。典型的には、ストリンジェントな条件は、塩濃度は、約1.5M未満のNaイオン、典型的には約0.01〜1.0MのNaイオン濃度(又は他の塩)、pHは7.0〜8.3、温度は、短いプローブ(例えば、10〜50ヌクレオチド)については少なくとも約30℃、長いプローブ(例えば、50ヌクレオチドより多い)については少なくとも約60℃である。ストリンジェントな条件は、ホルムアミド等の不安定物質を添加しても達成され得る。低ストリンジェンシー条件の例としては、37℃での30〜35%ホルムアミド、1M NaCl、1% SDS(ドデシル硫酸ナトリウム)の緩衝液を用いたハイブリダイゼーション及び50〜55℃での1×〜2×SSC(20×SSC=3.0M NaCl/0.3Mクエン酸三ナトリウム)における洗浄が挙げられる。中ストリンジェンシー条件の例としては、37℃での40〜45%ホルムアミド、1M NaCl、1% SDSにおけるハイブリダイゼーション及び55〜60℃での0.5×〜1×SSCにおける洗浄が挙げられる。高ストリンジェンシー条件の例としては、37℃での50%ホルムアミド、1M NaCl、1% SDSにおけるハイブリダイゼーション及び60〜65℃での0.1×SSCにおける洗浄が挙げられる。特異性は、典型的にはハイブリダイゼーション後洗浄の機能であり、重要な因子は最終洗浄溶液のイオン強度及び温度である。DNA−DNAハイブリッドに関しては、TmはMeinkoth and Wahl, Anal. Biochem. , 138:267-284 (1984)の等式:Tm=81.5℃+16.6(log M)+0.41(% GC)−0.61(% form)−500/Lにより近似され得る(式中、Mは一価陽イオンのモル濃度であり、% GCはDNA中のグアノシンヌクレオチド及びシトシンヌクレオチドの割合であり、% formはハイブリダイゼーション溶液中のホルムアミドの割合であり、Lは塩基対中でのハイブリッドの長さである)。Tmは、相補的な標的配列の50%が完全にマッチしたプローブとハイブリダイズする温度(規定のイオン強度及びpH下)である。ミスマッチ1%毎にTmは約1℃低下するので、Tm、ハイブリダイゼーション条件、洗浄条件の少なくとも一方を調整して、所望の同一性を有する配列とハイブリダイズし得る。例えば、90%を上回る同一性を有する配列を検索する場合、Tmは10℃低下し得る。概して、ストリンジェントな条件は規定のイオン強度及びpHでの特異的配列及びその相補体の熱融点(Tm)よりも約5℃低くなるように選択される。しかしながら、極めてストリンジェントな条件は熱融点(Tm)よりも1、2、3、又は4℃低い温度でのハイブリダイゼーション、洗浄の少なくとも一方を利用し得るし、中ストリンジェントな条件は、熱融点(Tm)よりも6、7、8、9、又は10℃低い温度でのハイブリダイゼーション、洗浄の少なくとも一方を利用し得るし、低ストリンジェンシー条件は熱融点(Tm)よりも11、12、13、14、15、又は20℃低い温度でのハイブリダイゼーション、洗浄の少なくとも一方を利用し得る。等式、ハイブリダイゼーション組成及び洗浄組成、並びに所望のTmを使用することによって、当業者はハイブリダイゼーション溶液、洗浄溶液の少なくとも一方のストリンジェンシーにおける変形形態が本質的に記載されていることを理解するだろう。所望のミスマッチ度により、45℃
(水溶液)又は32℃(ホルムアミド溶液)未満のTmとなる場合、より高温を使用し得るようにSSC濃度を増加させることが好ましい。核酸のハイブリダイゼーションに対しての広範な指針は、Tijssen著「生化学及び分子生物学における実験技法−核酸プローブを用いたハイブリダイゼーション(Laboratory Techniques in Biochemistry and Molecular Biology- Hybridisation with Nucleic Acid Probes)」、第1部、第2章「ハイブリダイゼーション原理の概要と核酸プローブ分析の戦略(Overview of principles of hybridisation and the strategy of nucleic acid probe assays)」、Elsevier, N. Y. (1993)、及び「分子生物学における現在のプロトコル(Current Protocols in Molecular Biology)」、第2章、Ausubel他編、Greene Publishing and Wiley-Interscience, New York (1995)に見出される。
【発明を実施するための最良の形態】
【0044】
第一の態様において、本発明は、1つ又は複数のサンプルにおける1つ又は複数の遺伝子マーカーのハイスループットでの発見、検出及び大規模な遺伝子型決定のための方法であって、
(a)1つ又は複数のサンプルに由来するDNAを提供する工程と、
(b)DNAを少なくとも1つの制限エンドヌクレアーゼを用いて制限し、それにより制限断片を生成する、制限工程と、
(c)アダプターに制限断片をライゲーションし、それによりアダプターにライゲーションされた制限断片を生成する、ライゲーション工程と、
(d)任意選択で、アダプターにライゲーションされた制限断片を少なくともアダプターと相補的なプライマー対を用いて増幅させ、それにより前増幅されたアダプターにライゲーションされた制限断片を生成する、増幅工程と、
(e)(任意選択で前増幅された)アダプターにライゲーションされた制限断片をプライマー対を用いて増幅させる工程であって、プライマーのうち少なくとも1つがプライマーの5’末端に識別子タグを含有し、それにより各サンプルに対して、アダプターにライゲーションされた制限断片の、タグ付けされた増幅されたサブセットのライブラリーを生成する、増幅工程と、
(f)任意選択で、複数のサンプルに由来するライブラリーをプーリングする工程と、
(g)ハイスループットシークエンシング技術を使用して、ライブラリーをシークエンシングする工程と、
(h)識別子タグを使用して、ライブラリー毎に配列をクラスタリングする工程と、
(i)ライブラリー内部、ライブラリー間の少なくとも一方でクラスタリングされた配列を比較することによって遺伝子マーカーを同定する(identify)工程と、
(j)好ましくは全てのサンプル及び全ての同定されたマーカーについて、1つ又は複数のライブラリーにおいて遺伝子マーカーの(共)優性遺伝子型を決定する工程を含む方法に関する。
【0045】
本方法は1つ又は複数のサンプルにおける1つ又は複数の遺伝子マーカーの発見、検出及び遺伝子型決定に関する。或る特定の実施形態において、本方法は対象とする遺伝子マーカーの有/無スコアリングに関する。或る特定の実施形態において、本方法は1つ又は複数の遺伝子マーカー用の1つ又は複数のサンプルについての(共)優性遺伝子型の決定に関する。これにはサンプル間でのマーカー配列又はマーカー対立遺伝子配列の観測数の標準化が必要とされ得る。
【0046】
本方法の第一工程(a)では、DNAが提供されるべきである。これ自体は当該技術分野で既知の方法によって為され得る。概して、DNAの単離は、集団の構成員からの組織採取、DNA抽出(例えば、Q-Biogene fast DNA kitを使用)、定量化及び標準化を行ってサンプル毎に等量のDNAを得る等、当該技術分野で一般的な方法を使用して達成される。DNAは各種ソース(ゲノム、RNA、cDNA、BAC、YAC等)及び生物体(ヒト、哺乳類、植物、微生物等)由来であり得る。単離されたDNAはプーリングされ得る。
【0047】
工程(b)で、DNAは少なくとも1つの制限エンドヌクレアーゼを使用して制限される。場合に応じて、即ち、ゲノムのサイズに応じて、複数のエンドヌクレアーゼが使用され得る。或る特定の実施形態において、2以上のエンドヌクレアーゼが使用され得る。殆どのゲノムでは、2つのエンドヌクレアーゼで十分であり、これがそのため最も好ましい。或る特定の実施形態において、特に、大きい又は複雑なゲノムについては、複数のエンドヌクレアーゼが使用され得る。好ましくは、エンドヌクレアーゼはほぼ250〜500bp程度の比較的短い制限断片を与えるが、これは必須ではない。典型的には、少なくとも1つの切断頻度の高いエンドヌクレアーゼ、即ち、4又は5塩基対認識配列を有するエンドヌクレアーゼが好ましい。1つのかかる酵素はMseIであるが、他に多くのものが市販されており、使用され得る。認識配列の外側で切断する酵素(IIs型)又は平滑末端化制限断片を与える酵素も使用され得る。好ましい組合せでは、1つのレアカッター(6以上の塩基対認識配列、例えばEcoRI)及び1つのフリークエントカッターが使用される。
【0048】
プーリングされたDNAの制限後、又はそれと同時に、アダプターが制限断片にライゲーションされて、アダプターにライゲーションされた制限断片を与える。1つ又は複数の異なるアダプターが使用され得る(例えば2つのアダプター、1つが正アダプター、1つが逆アダプター)。代替的には、1つのアダプターが全ての断片に使用され得るし、又は前選択工程を可能にし得るインデックスリンカーを提供するために、アダプターの突出端にヌクレオチドの置換を含有するアダプターのセットが使用され得る(Unrau他, Gene, 1994, 145, 163-169)。代替的には、平滑末端化制限断片の場合、平滑末端化アダプターが使用され得る。アダプターライゲーションは当該技術分野において既知であり、中でも、特許文献1に記載されている。AFLP技術の1つの有用な変形は選択ヌクレオチドを使用せず(即ち、+0/+0プライマー)、リンカーPCRと称されることもある。サルサPCRと同様に、選択工程が制限酵素を用いて提供され、異なる制限酵素が異なるサブセットを生成する。これはまた前増幅として示されることもあり、少なくともアダプターと相補的であり、任意選択で制限エンドヌクレアーゼの認識配列の残りの部分とも相補的であるプライマーが使用される。前増幅は、各サンプルからのDNA量を(さらに)標準化するように、又は全DNA量を増大させて、複数の解析(即ち、サンプルを分割する)を可能にし、シグナル−ノイズ比を増大させるように機能し得る。また、前増幅を使用して、選択的増幅の前にプーリングを可能にするタグを導入し得る。プライマーの5’末端にヌクレオチドタグ(例えば、4bp)を導入することによって、異なるサンプルに対する制限断片がタグ付けされ、処理の最後にタグを使用して回収され得る。
【0049】
アダプターにライゲーションされた制限断片は、任意選択の前増幅後、本発明の方法の工程(d)においてプライマー対を用いて増幅される。プライマーの1つはアダプターの少なくとも一部と相補的であり、エンドヌクレアーゼの認識配列の残りの部分とさらに相補的である可能性があり、3’末端に(ランダムに選択された)選択ヌクレオチドをさらに含有する可能性がある。これは特許文献1の記載と同様である。好ましくは、プライマーは、ストリンジェントなハイブリダイゼーション条件下で選択的にハイブリダイズすることが可能である。選択的増幅はまた、上記と同様、サンプルの起源を同定するための5’タグを担持するプライマーを用いて実施され得る。その結果が、増幅されたアダプターにライゲーションされた制限断片の(タグ付けされた)サブセットのライブラリーである。
【0050】
複数のサンプルから調製したライブラリーにおける選択的に増幅された断片は、この時点で任意選択でプーリングされ得る。これは或る特定のサンプル群(或る特定の表現型の特徴を共有するもの等)に対して特異的なマーカーを検索する場合に有用であり得る。プーリングされたサンプルのスクリーニングは一般に混合分離分析(bulked segregant analysis)(BSA;Michelmore, Paran and Kesseli, 1991)と称される。或る特定の実施形態において、プーリングはまたサンプリング段階のDNA抽出前に実施される可能性があり、DNA標本数を減少させる。DNAのプーリングはさらにPCR増幅前にDNAを標準化する機能があり、シークエンシング用ライブラリーにおいてより均一な表現が提供される。
【0051】
任意選択でプーリングされた、選択的に増幅されたアダプターにライゲーションされた制限断片のライブラリーは、ここでハイスループットシークエンシング技術を使用してシークエンシングされる。
【0052】
シークエンシングは、ダイデオキシ連鎖停止法(サンガーシークエンシング(Sanger sequencing))のような、当該技術分野において既知である任意の手段によって、原則としては行われてもよい。しかしながら、シークエンシングは、特許文献7、特許文献8、特許文献9、特許文献10、特許文献11及び特許文献12(Seo他 (2004) Proc. Natl. Acad. Sci. USA 101:5488-93)(全て454 Life Sciences名義)に記載された方法のようなハイスループットシークエンシング法、及びヘリオス(Helios)、ソレクサ(Solexa)、USゲノミクス(US Genomics)等の技術(これらは本明細書中に参照により援用される)を用いて行なわれることが好ましく、且つより有利である。シークエンシングは、特許文献7、特許文献8、特許文献9、特許文献10、特許文献11、及び特許文献12に(全て454 Life Sciences名義)記載された装置、方法の少なくとも一方を用いて行なわれることが最も好ましく、本明細書中に参照により援用される。これまで記述された技術は、一回の実行において4000万塩基のシークエンシングを可能にし、サンガーシークエンシングに基づくと共に、MegaBACE(GE Healthcare)又はABI3700(×1)(Applied Biosystems)のような、現在利用可能なキャピラリー電気泳動装置を使用する競合技術よりも100倍速く、より安い。これは、反応毎の読み取りの長さの増加、併発反応の数の増加の少なくとも一方に伴って増加する。シークエンシング技術は、1)DNAの断片化及び一本鎖DNA(ssDNA)のライブラリーを作成する、特異的なアダプターのライゲーションと、2)ビーズに対するssDNAのアニーリング、油中水滴型マイクロリアクター中のビーズの乳化、及びビーズ上で個々のssDNA分子を増幅するためのエマルジョンPCRの実施と、3)それらの表面上に増幅されたssDNA分子を含有するビーズの選択/濃縮と、4)PicoTiterPlate(登録商標)におけるDNAを担持するビーズの沈着と、5)ピロリン酸光シグナルの生成による100000ウェルの同時シークエンシングとのおおまかには5つの工程から成る。
【0053】
好ましい実施形態において、シークエンシングは、
(1)シークエンシングアダプターにライゲーションされた断片をビーズにアニーリングする(各ビーズは単一の断片とアニーリングする)工程と、
(2)ビーズを油中水滴型マイクロリアクター内で乳化させる(各油中水滴型マイクロリアクターは単一のビーズを含む)工程と、
(3)エマルジョンPCRを実施し、それによりビーズの表面上でアダプターにライゲーションされた断片を増幅させる、実施工程と、
(4)増幅されたアダプターにライゲーションされた断片を含有するビーズを選択/濃縮する工程と、
(5)ビーズをウェルに充填する(各ウェルは単一のビーズを含む)工程と、
(6)ピロリン酸シグナルを生成する工程を含む。
【0054】
上記第一工程(1)では、アダプターにライゲーションされた制限断片中に存在するアダプターをビーズにアニーリングする。本明細書中で先に概略を示したように、シークエンシングアダプターは、少なくともビーズにアニーリングするための「鍵」領域、シークエンシングプライマー領域及びPCRプライマー領域を含む。特に、増幅されたアダプターにライゲーションされた制限断片は、ここで一端に5’−配列プライマー結合部位−−−タグ−−−PCRプライマー配列−3’という配列を含有する一方、他端には5’−ビーズアニーリング配列−−−タグ−−−アダプター特異的配列−−−制限部位特異的配列(任意選択)−−−(ランダムな)選択配列(任意選択)−3’であり得る区域が存在する。配列プライマー結合部位とビーズアニーリング配列を交換してもよいことは明らかであり得る。ここで、このビーズアニーリング配列は、断片を、末端にヌクレオチド配列を担持するビーズにアニーリングするために使用され得る。
【0055】
したがって、適合した断片はビーズにアニーリングされる(各ビーズは単一の適合した断片とアニーリングする)。適合した断片のプールに過剰のビーズを添加することにより、大部分のビーズに関して、ビーズ毎に単一の適合した断片のアニーリングが保証される(ポワソン分布)。
【0056】
好ましい実施形態において、スクリーニングの効率をさらに増大させるために、PCR産物をシークエンシング用ビーズ上に一方向に増幅させることは有益である。これは、MseI(又は他の制限酵素)側にあるアダプターの一方の鎖が配列ビーズと共役したオリゴヌクレオチドと相補的である、アダプターの付いた(adaptor-tailed)PCRプライマーを用いたPCRを実施することで達成され得る。
【0057】
次の工程では、ビーズを油中水滴型マイクロリアクター内で乳化させる(各油中水滴型マイクロリアクターは単一のビーズを含む)。PCR試薬が油中水滴型マイクロリアクター内に存在することにより、PCR反応がマイクロリアクター内部で起こることが可能となる。続いて、マイクロリアクターを破壊して、DNAを含むビーズ(DNAポジティブビーズ)を濃縮する。
【0058】
続く工程では、ビーズをウェルに充填する(各ウェルは単一のビーズを含む)。ウェルは、好ましくは大量の断片の同時シークエンシングを可能にするPicoTiter(商標)プレートの一部である。
【0059】
酵素担持ビーズの添加後、ピロシークエンシングを使用して断片の配列を決定する。引き続く工程で、従来のシークエンシング試薬存在下、PicoTiter(商標)プレート並びにその中のビーズ及び酵素ビーズを異なるデオキシリボヌクレオチドに付し、デオキシリボヌクレオチドを取り込む際、記録される光シグナルが生成される。正確なヌクレオチドの取り込みにより、検出可能なピロシークエンシングシグナルが生成される。
【0060】
ピロシークエンシング自体は当該技術分野において既知であり、中でもwww.biotagebio.com; www.pyrosequencing.comの技術欄に記載されている。技術はさらに例えば、特許文献7、特許文献8、特許文献9、特許文献10、特許文献11及び特許文献12(全て454 Life Sciences名義)において利用されており、本明細書中に参照により援用される。
【0061】
シークエンシング後、シークエンシング工程から直接得られる断片の配列は、好ましくはin silicoでトリミングされて、任意のビーズアニーリング配列、シークエンシングプライマー、アダプター又はプライマーと関連した配列情報を除去し得る。
【0062】
典型的には、アライメント又はクラスタリングは任意の付加されたアダプター/プライマー配列に対してトリミングされた配列データ上で実施される。即ち、任意選択の識別子タグと共に、核酸サンプルに由来する断片からの配列データのみを使用する。
【0063】
比較目的のための配列のアライメントの方法は、当該技術分野において既知である。様々なプログラム及びアライメントアルゴリズムは、Smith及びWaterman (1981) Adv. Appl. Math. 2:482; Needleman及びWunsch (1970) J. Mol. Biol. 48:443; Pearson及びLipman (1988) Proc. Natl. Acad. Sci. USA 85:2444; Higgins及びSharp (1988) Gene 73:237-244; Higgins及びSharp (1989) CABIOS 5:151-153; Corpet他 (1988) Nucl. Acids Res. 16:10881-90; Huang他 (1992) Computer Appl. in the Biosci. 8:155-65;及びPearson他 (1994) Meth. Mol. Biol. 24:307-31において記載され、本明細書中に参照により援用される。Altschul他 (1994) Nature Genet. 6:119-29(本明細書中に参照により援用される)は、配列アラインメントの方法及び相同性の計算について詳細な考察を提供する。
【0064】
NCBIの基本的局所アライメント検索ツール(Basic Local Alignment Search Tool)(BLAST)(Altschul他, 1990)は、配列解析プログラムのblastp、blastn、blastx、tblastn、及びtblastxに関連する使用について、国立生体情報センター(National Center for Biological Information)(NCBI、メリーランド州ベテスダ)及びインターネット上を含むいくつかのソースから利用可能である。それは<http://www.ncbi.nlm.nih.gov/BLAST/>でアクセスすることができる。このプログラムを用いて、配列同一性を決定する方法の説明は、<http://www.ncbi.nlm.nih.gov/BLAST/blast_help.html>で利用可能である。データベースは、EST配列、対象となる種のゲノミック配列(genomic sequences)及びGenBankの非冗長配列データベースの少なくとも一方、又は類似の配列データベースを含むことが好ましい。
【0065】
Shendure他 Science, Vol 309, Issue 5741, 1728-1732に記載されているように、ハイスループットシークエンシング法が使用され得る。その例としては、マイクロ電気泳動シークエンシング、ハイブリダイゼーションシークエンシング/ハイブリダイゼーションによるシークエンシング(SBH)、増幅された分子上での環状アレイシークエンシング、単一分子上での環状アレイシークエンシング、ポリメラーゼシークエンシング、エキソヌクレアーゼシークエンシング、ナノポアシークエンシング等の非循環的、単一分子、実時間法が挙げられる。
【0066】
ライブラリー内部で遺伝子マーカーの存在、遺伝子マーカー用サンプルの遺伝子型の少なくとも一方がここで決定され得る。
【0067】
本発明の方法は、AFLPマーカーの同定、検出、及び遺伝子型決定だけでなく、定常バンドに含有されるSNPマーカーの同定、検出及び遺伝子型決定にも使用され得る。
【0068】
複数の断片のライブラリーに含有される対立遺伝子の(マーカー)断片をシークエンシングすることにより、遺伝子マーカーの遺伝子型決定の精度に影響を与える標本抽出変動の問題の解決法を提供するために、本発明者等はまた、好ましくはシークエンシングを介したAFLPマーカーの検出が、少なくとも1回全ての増幅された断片をサンプルするのに十分な重複(深度)で実施され、呼び出される遺伝子型の精度と関連した標本抽出変動の課題を扱う統計的手段を伴うことを見出した。さらに、AFLPスコアリングとちょうど同じように、分離集団の状況で、1つの実験における親の個体の同時スコアリングは統計的閾値を決定する際の助けとなる。なぜなら、サンプル中の全ての考えられる対立遺伝子は親1又は親2のいずれかでスコアリングされるからである。なお、親の個体を分離集団の個体よりも高い重複でサンプリングすることが示唆される。
【0069】
したがって、或る特定の実施形態において、タグ付けされ増幅されたアダプターにライゲーションされた制限断片の重複は少なくとも6、好ましくは少なくとも7、より好ましくは少なくとも8、及び最も好ましくは少なくとも9である。或る特定の実施形態において、各アダプターにライゲーションされた制限断片の配列は少なくとも6倍、好ましくは少なくとも7倍、より好ましくは少なくとも8倍、及び最も好ましくは少なくとも9倍測定される。或る特定の実施形態において、重複は、遺伝子座をホモ接合として正確に同定する可能性が全体で50/50であると仮定して、遺伝子座を正確に同定する可能性が95%、96%、97%、98%、99%、99.5%より高くなるように選択される。
【0070】
或る特定の実施形態において、サンプル数は1〜100000の間で変化し得る。これはまた主に、解析されるゲノムのサイズ及び選択的に増幅される断片の数に依存する。通常、利用されるシークエンシング技術の能力はこの点において最大の制限要因を与える。
【0071】
[実施例]
方法を以下のように例示する:
1)AFLP鋳型は、制限工程とライゲーション工程との間に80℃で20分間の熱変性工程を含む、Vos他のプロトコルの変更形態により調製される。80℃で20分間のインキュベーション後、制限酵素消化物は室温に冷却され、DNAリガーゼが添加される。変性工程により、アダプターが末端にライゲーションしないように120bpまでの制限断片の相補的な鎖が解離する。結果として、120bpよりも小さい断片は増幅されないので、サイズ選択が達成される。
【0072】
2)前増幅反応が利用可能である場合、従来のAFLPと同様に実施される。
【0073】
3)続く(選択的)増幅工程は、集団/実験における全てのサンプルに対する一意的な識別子タグを有するAFLPプライマーを使用して実施される(一意的な4bp識別子配列、KISを使用)。KISは選択的AFLPプライマーの5’末端に位置する。1つのさらなる選択ヌクレオチドは、電気泳動による従来のAFLP検出において使用される選択塩基の数との比較において使用される(例えば、コショウにおけるEcoRI/MseIフィンガープリントでは+4/+3(ゲル検出+3/+3)、トウモロコシにおけるEcoRI/MseIフィンガープリントでは+4/+4(ゲル検出+4/+3))。適用される選択ヌクレオチドの数は、実験的に決定される必要があり、ゲル検出に使用されるのと同様の選択ヌクレオチドの数が適用され得る。この数がさらに実験に含まれるサンプルの数に依存するのは、シークエンシング技術の現状では、配列トレースの数が200000で一定と仮定されるからであるが、これは増加し得るし、おそらく増加するだろう。好ましい開始点はサンプルライブラリー毎に10倍のAFLP断片のサンプリングを達成する。
【0074】
4)工程1〜工程4により調製されたサンプルの集合を454 Life Sciencesの技術によるシークエンシングに付す。これは、個々のAFLP断片をビーズ上でクローニングし、PCR増幅し、シークエンシングすることを意味する。100bp長の200000配列の結果が予想される。このことにより、100サンプルの集合について、2000配列トレース/サンプルの平均を均等化し、5’タグを通じてサンプル数が追跡可能となる。
【0075】
5)ゲル検出で使用される数と比較して1つのさらなる選択ヌクレオチドを使用する場合、PC毎に100個のAFLP断片の増幅を仮定すると、その90%が定常バンドであり、AFLP断片は断片毎に20倍の平均重複でサンプリングされる。しかしながら、シークエンシングは一方向性ではなく、殆どのバンドは>200bpであるので、シークエンシング重複は、各断片末端に対して10倍を僅かに上回る。
【0076】
6)KRSタグを使用してサンプル毎に全ての配列をクラスタリングした。サンプリングに対して10倍とすると、これはサンプル毎に200の異なる配列トレースが予想されることを意味し、200×100bp=20kb配列/サンプルを表す。これらの配列の10%がAFLPマーカー由来である(即ち、1つの対立遺伝子が増幅され、他はPCR反応中に存在しない)場合、配列の90%(18kb)は定常バンド由来である。
【0077】
7)2つの型の遺伝子マーカーがスコアリングされる:
A)AFLPマーカー:これらはサンプル中に観察されるものもあれば、存在しないものもある配列である。
【0078】
サンプルの集合における配列の頻度の検査によりこのカテゴリーは明らかとなる。優性スコアリングは全てのサンプルにおけるこれらの配列の有無の観察に応じて実施される。信頼性の高いAFLPマーカーのスコアリングには、他のAFLP配列が実験において観察される頻度に関して設定される統計的閾値が必要となる。即ち、AFLPマーカーは、AFLPマーカー配列がサンプル中に観察される場合には、有り(優性)としてスコアリングされ得るが、無しというスコアの信頼性は(定常)AFLP断片の(平均)頻度に依存する。統計的閾値のレベルは、特定の用途に必要な許容可能なレベルに応じて、有り/無しのスコアリングが好ましくは少なくとも99.5%の精度で実施されるように要求される。分離集団及びその親を解析する場合、これらのマーカーはおそらくマーカー配列の頻度カテゴリーを規定することによって共優性としてもスコアリングされ得る。後者は、実際はサンプル間で異なるAFLPマーカーの標本抽出変動の影響により複雑化され得る。
【0079】
B)定常AFLP断片における一塩基(SN)多型
これは、遺伝子マーカーの最も興味深い(そして豊かな)カテゴリーである。本質は定常AFLP断片の内部配列に含有されるSNPマーカーが共優性SNPマーカーとしてスコアリングされることである。また、好ましくは、これは統計的閾値レベルを対立遺伝子の有無の正確な呼び出しに適用することを必要とする。断片ライブラリーの10倍のシークエンシング重複は十分であると予想されるが、各対立遺伝子配列の観察数に応じたSNPマーカー遺伝子型の精度の決定に統計的解析法が必要とされる。理論的根拠は、定常バンドがSNPを含有し、1つの対立遺伝子が例えば5回観察される一方、他の対立遺伝子(を含有する配列)が観察されない場合、サンプルは観察される対立遺伝子に対してホモ接合である可能性が非常に高いことである。結果的に、両対立遺伝子が観察される場合、その頻度とは無関係に、サンプルはSNPマーカーに対してヘテロ接合とスコアリングされる。
【0080】
8)結果は、全てのマーカーの遺伝子型の正確性についての確率に沿った、(共)優性にスコアリングされたAFLPマーカー及び共優性にスコアリングされたSNPマーカーの遺伝子型を含有する遺伝子型決定表となる。代替的には、設定の統計的閾値レベルを超えた遺伝子型を含有するデータセットが生成される。
【0081】
アプローチでは、サンプル毎にAFLP断片のサンプリングに対して10倍を仮定し、18kbの定常配列/サンプル及び2kbのAFLPマーカー配列が生成される。
【0082】
観察される遺伝子マーカーの数は調査される生殖質中のSNP率に依存する。以下、20kbの配列をサンプリングする場合、異なる生殖質SNP率で遺伝子マーカーの数の推定が提示される。AFLPマーカー/断片の平均長を200bpと仮定する。
【0083】
【表1】

【0084】
表1に提示される数は平均であり、異なるプライマーの組合せにより異なり得ることに留意することが重要である。従来のAFLP決定法と同様、上部のプライマーの組合せ(PC)の同定により、PC毎により多数のマーカーが生成され得る。また、表1に存在する数は、要求精度レベルに到達するために必要なサンプリングの要求レベルに応じて変化し得る。
【0085】
遺伝子型の正確な分類の計算は以下の通りである:
P(correct)=P(aa)+P(AA)+P(Aa)×[1−0.5n−1
(式中、P(aa)は、遺伝子型aaを有する集団の分画である(同封のグラフ内、図9、0.25に設定)。P(AA)は遺伝子型AAを有する集団の分画である(0.25に設定)。P(Aa)は遺伝子型Aaを有する集団の分画である(図6及び下表、0.5に設定)。nは個体数に等しい。
【0086】
【表2】

【0087】
[実施例1 コショウ]
コショウ系統PSP−11及びPI201234由来のDNAが、AFLP鍵遺伝子認識部位特異的プライマーを用いてAFLP産物を生成するために使用された(これらのAFLPプライマーは、例えば、特許文献1に記載の従来のAFLPプライマーと本質的に同一であり、概して認識部位領域、定常領域、及び選択領域における1つ又は複数の選択ヌクレオチドを含有する。)。
【0088】
コショウ系統PSP−11又はPI201234から、DNA 150ngを37℃で1時間、制限エンドヌクレアーゼEcoRI(5U/反応)、及びMseI(2U/反応)を用いて消化した後、80℃で10分間不活化した。得られた制限断片を、一端がEcoRI、MseI制限断片の少なくとも一方の一端又は両端と適合性がある二本鎖合成オリゴヌクレオチドアダプターとライゲーションした。制限ライゲーション混合物を10倍に希釈し、5μl(マイクロリットル)の各々のサンプルは、EcoRI+1(A)及びMseI+1(C)プライマー(セットI)により前増幅された(2)。増幅後に、2つのコショウのサンプルの前増幅産物の品質を、1%アガロースゲル上でチェックした。前増幅産物を20倍に希釈した後、KRSEcoRI+1(A)及びKRSMseI+2(CA)AFLP前増幅を行なった。下記のプライマー配列番号1〜4の3’−末端で、KRS(識別子)区域には下線が引かれており、選択ヌクレオチドは太字とする。増幅後に、2つのコショウのサンプルの前増幅産物の品質を、1%アガロースゲル上で、並びにEcoRI+3(A)及びMseI+3(c) (3) AFLPフィンガープリント(4)によりチェックした。2つのコショウ系統の前増幅産物を、キアゲン(Qiagen)PCRカラムの上で別々に精製した(5)。サンプルの濃度をNanoDrop(登録商標)ND−1000分光光度計で測定した。合計5μgのPSP−11及び5μgのPI201234 PCR産物を混合し、シークエンシングした。
PSP−11の前増幅に用いられるプライマーセットI
【化1】

PI201234の前増幅に用いられるプライマーセットII
【化2】

【0089】
(1)EcoRI/MseI制限ライゲーション混合物
制限混合物(40ul/サンプル)
DNA 6μl(±300ng)
ECoRI(5U) 0.1μl
MseI(2U) 0.05μl
5×RL 8μl
MQ 25.85μl
合計(Totaal) 40μl
37℃における1時間のインキュベーション

ライゲーション混合物(10μl/サンプル)
10mM ATP 1μl
T4 DNAリガーゼ 1μl
ECoRIアダプター(5pmol/μl) 1μl
MseIアダプター(50pmol/μl) 1μl
5×RL 2μl
MQ 4μl
合計 10μl
の添加
37℃における3時間のインキュベーション
EcoRIアダプター
【化3】

MseIアダプター
【化4】

【0090】
(2)前増幅
前増幅(A/C):
RL混合物(10×) 5μl
EcoRIプライマー E01L(50ng/ul) 0.6μl
MseIプライマー M02K(50ng/ul) 0.6μl
dNTP(25mM) 0.16μl
Taqポリメラーゼ(5U) 0.08μl
10×PCR 2.0μl
MQ 11.56μl
1反応につき合計20μl
前増幅の温度プロファイル
選択的な前増幅を50μlの反応容量中で行なった。PCRをPE GeneAmp PCRシステム9700で行ない、20サイクルのプロファイルは、94℃30秒間の変性工程で開始した後、56℃、60秒間のアニーリング工程、及び72℃、60秒間の伸長工程を行なった。
【0091】
EcoRI+1(A)
【化5】

MseI+1(C)
【化6】

前増幅 A/CA:
PA+1/+1混合物(20×) :5μl
EcoRIプライマー :1.5μl
MseIプライマー :1.5μl
dNTP(25mM) :0.4μl
Taqポリメラーゼ(5U) :0.2μl
10×PCR :5μl
MQ :36.3μl
合計 :50μl
選択的な前増幅を50μlの反応容量中で行なった。PCRをPE GeneAmp PCRシステム9700で行ない、30サイクルのプロファイルは、94℃30秒間の変性工程で開始した後、56℃60秒間のアニーリング工程、及び72℃60秒間の伸長工程を行なった。
【0092】
(3)KRSEcoRI+1(A)及びKRSMseI+2(CA)
【化7】

太字の選択ヌクレオチド及び下線を引いたタグ(KRS)
サンプルPSP11 :E01LKRS1/M15KKRS1
サンプルPI120234 :E01LKRS2/M15KKRS2
【0093】
(4)AFLPのプロトコル
選択的な前増幅を20μlの反応容量中で行なった。PCRをPE GeneAmp PCRシステム9700で行なった。13サイクルのプロファイルは、94℃、30秒間の変性工程で開始した後、アニーリング温度が各々のサイクルにおいて0.7℃低下するタッチダウンフェーズを伴う、65℃、30秒間のアニーリング工程、及び72℃、60秒間の伸長工程を行なった。このプロファイルの後で、94℃、30秒間の変性工程、56℃、30秒間のアニーリング工程、及び72℃、60秒間の伸長工程を伴う、23サイクルのプロファイルを行なった。
EcoRI+3(AAC)及びMseI+3(CAG
【化8】

【0094】
(5)Qiagenカラム
QIAquick(登録商標)スピンハンドブック(07/2002)第18頁に従って、AFLP産物をQIAquick PCR精製キット(QIAGEN)を使用して精製した。濃度はNanoDrop(登録商標)ND−1000分光光度計を用いて測定した。+1/+2 PSP−11 AFLP産物5μg及び+1/+2 PI201234 AFLP産物5μgの全てを共に投入し、TE 23.3μlに溶解した。最終的に、+1/+2 AFLP産物の濃度430ng/μlでの混合物を得た。
【0095】
配列ライブラリーの調製及びハイスループットシークエンシング
両コショウ系統からの混合増幅産物を、Margulies他によって説明されるような、454 Life Sciencesシークエンシング技術を用いて、ハイスループットシークエンシングした(Margulies他, Nature 437, pp. 376-380及びオンライン上の補足)。具体的には、Margulies及び共同研究者等によって説明されるように、エマルジョンPCR増幅及び続く断片シークエンシングを促進するために、AFLP PCR産物を最初に末端を平滑にし、続いてアダプターにライゲーションした。454のアダプター配列、エマルジョンPCRプライマー、配列プライマー及び配列の実行条件は、全てMargulies及び共同研究者等によって記載されるものであった。図1Aに例示されるように、454シークエンシング過程におけるセファロースビーズ上で増幅されたエマルジョン−PCR断片中の機能要素の直線的な順序は、以下のとおりだった:
454PCRアダプター−454シークエンスアダプター−4bp AFLPプライマータグ1−選択ヌクレオチド(複数可)を含むAFLPプライマー配列1−AFLP断片内部配列−選択ヌクレオチド(複数可)を含むAFLPプライマー配列2、4bp AFLPプライマータグ2−454シークエンスアダプター−454PCRアダプター−セファロースビーズ
2つのハイスループット454シークエンスの実行は、454 Life Sciences(アメリカ合衆国コネチカット州ブランフォード)によって行なわれた。
【0096】
454シークエンス実行のデータ処理
1回の454シークエンスの実行に由来する配列データを、バイオインフォマティクスパイプライン(Keygene N.V.)を用いて処理した。具体的には、未処理の454ベースコールされた配列読み取りを、FASTAフォーマットで変換し、BLASTアルゴリズムを用いて、タグ付けされたAFLPアダプター配列の存在を検査した。既知のタグ付けされたAFLPプライマー配列への高い信頼性の一致に際して、配列をトリミングし、制限エンドヌクレアーゼ部位を回復し、適切なタグを割り当てた(それぞれ、サンプル1 EcoRI(ES1)、サンプル1 MseI(MS1)、サンプル2 EcoRI(ES2)、又はサンプル2 MseI(MS2))。次に、33塩基よりも長いトリミングされた配列の全てを、全体の配列相同性に基づくmegaBLAST手順を用いてクラスタリングした。次に、クラスターを、CAP3の多重アライメントアルゴリズムを用いて、1つのクラスター当たり1つ又は複数のコンティグ、シングルトンの少なくとも一方へアセンブリーした。1つ以上の配列を含むコンティグでは、推定上の多型を表わす配列ミスマッチを検査した。配列ミスマッチには、以下の基準に基づく品質スコアを割り当てた:
*コンティグ中の読み取りの数
*観察された対立遺伝子の分布
上の2つの基準は、各々の推定上のSNP/インデルに対応する、いわゆるQスコアのための根拠を成す。
【0097】
Qスコアは0〜1にわたる;
両対立遺伝子が少なくとも2度観察された場合にのみ、Qスコア0.3が達成される。
【0098】
*或る特定の長さのホモポリマー中の位置
(調整可能、3塩基以上のホモポリマーに位置する多型を回避するための初期設定)
*クラスター中のコンティグの数。
【0099】
*最近接配列ミスマッチへの距離
(調整可能、フランキング配列を調べる或る特定の型の遺伝子型決定分析にとって重要)
*サンプル1又はサンプル2で観察された対立遺伝子の関連のレベル;
推定上の多型並びにサンプル1及びサンプル2の対立遺伝子間で一貫して完全な関連が存在する場合には、多型(SNP)が推定上の「エリート」多型(SNP)として示される。エリート多型は、2つのホモ接合系統が発見過程で用いられた場合に、一意のゲノム配列又は低コピーのゲノム配列に位置する確率が高いと考えられる。反対に、サンプル起源との多型の弱い関連は、コンティグ中の非対立遺伝子配列のアライメントから生じる誤った多型を発見してしまうリスクが高い。
【0100】
SSRモチーフを含む配列は、MISA検索ツール(MIcroSAtellelite同定ツール;http://pgrc.ipk-gatersleben.de/misa/から利用可能。)を用いて同定された。
【0101】
実行の全体の統計を、以下の表で示す。
【0102】
【表3】

【0103】
推定上のエリート一塩基多型を含む複数のアライメントの一例を、図5に示す。
【0104】
[実施例2 トウモロコシ]
トウモロコシ系統のB73及びM017に由来するDNAを、AFLPの鍵遺伝子認識部位特異的プライマーの使用により、AFLP産物を生成するために用いた。(これらのAFLPプライマーは本質的に従来のAFLPプライマーと同じであり(例えば、特許文献1欧州特許第0534858号に記載されている)、認識部位領域、定常領域、及びその3’末端において1つ又は複数の選択なヌクレオチドを通常含むだろう。)。
【0105】
コショウ系統のB73又はM017に由来するDNAを、65℃で1時間制限エンドヌクレアーゼTaqI(1反応につき5U)で、及び37℃で1時間MseI(1反応につき2U)で消化した後、80℃で10分間不活性化を行なった。得られた制限断片を、1つの末端がTaqI、MseI制限断片の少なくとも一方の一末端又は両末端と適合する二本鎖合成オリゴヌクレオチドアダプターとライゲーションした。
【0106】
+1/+1 AFLPプライマーによるAFLP前増幅反応(1反応につき20μl)を、10倍に希釈した制限ライゲーション混合物で行なった。PCRプロファイル:20×(94℃で30秒+56℃で60秒+72℃で120秒)。異なる+2 TaqI及びMseI AFLP鍵遺伝子認識部位プライマーによる追加のAFLP反応(1反応につき50μl)が(下記の表、タグは太字とし、選択ヌクレオチドには下線が引かれている)、20倍に希釈した+1/+1 TaqI/MseI AFLP前増幅産物で行なわれた。PCRプロファイル:30×(94℃で30秒+56℃で60秒+72℃で120秒)。AFLP産物を、QIAquick(登録商標)スピンハンドブック(07/2002)の18ページに従って、QIAquick PCR精製キット(QIAGEN)を用いることによって精製し、濃度はNanoDrop(登録商標)ND−1000分光光度計により測定した。各々異なる1.25μgのB73 +2/+2 AFLP産物及び各々異なる1.25μgのM017 +2/+2 AFLP産物の合計を共にし、30μlのTE中で溶解した。最終的に、333ng/μlの濃度で+2/+2 AFLP産物の混合物が得られた。
【0107】
【表4】

【0108】
最終的に、4つのP1サンプル及び4つのP2サンプルがプーリング及び濃縮された。合計量25μlのDNA産物及び最終濃度400ng/ul(合計10μg)が得られた。中間の品質査定を図3に示す。
【0109】
454によるシークエンシング
本明細書において以前に記載されたように調製されたコショウ及びトウモロコシのAFLP断片サンプルは、以下に記載されるような454 Life Sciencesにより処理された(Margulies他, 2005「微細加工高密度ピコリッターリアクター中のゲノムシークエンシング(Genome sequencing in microfabricated high-density picolitre reactors)」Nature 437 (7057) :376-80. Epub July 31, 2005)。
【0110】
データ処理
処理パイプライン:
入力データ
未処理配列データが各々の実行に対して受け取られた:
−200000〜400000の読み取り
−ベースコール(塩基呼び出し)品質スコア
トリミング及びタグ付け
これらの配列データを、読み取りの始め及び末端で、鍵遺伝子認識部位(KRS)の存在について解析する。これらのKRS配列はAFLPアダプター及びサンプルラベル配列の両方から成り、或る特定のサンプルの或る特定のAFLPプライマーの組合せに対して特異的である。KRS配列は、BLASTによって同定そしてトリミングされ、制限部位が回復される。読み取りは、KRS起源の同定のためのタグでマークされる。トリミングされた配列は、その後の処理を行なうために、長さ(最低33ヌクレオチド)で選択される。
【0111】
クラスタリング及びアセンブリー
MegaBlast解析は、相同配列のクラスターを得るために全てのサイズ選択、且つトリミングされた読み取りで行なわれる。引き続いて全てのクラスターは、アセンブリーされたコンティグをもたらすために、CAP3によりアセンブリーされる。両工程からの、他の読み取りと一致しない一意の配列の読み取りが同定される。これらの読み取りはシングルトンとしてマークされる。本明細書において以前に記述された工程を行なう処理パイプラインを図4の(A)に示す。
【0112】
多型検索及び品質査定
アセンブリー解析からの最終的なコンティグは、多型検出の根拠を成す。各々のクラスターのアライメントにおける各々の「ミスマッチ」は、可能性のある多型である。選択基準を、品質スコアを得るために定義する:
−1つのコンティグ当たりの読み取りの数
−1つのサンプル当たりの「対立遺伝子」の頻度
−ホモポリマー配列の発生
−近接多型の発生
閾値を超えた品質スコアにより、SNP及びインデルは、推定上の多型として同定される。SSR抽出については、MISA(MIcroSAtellite同定)ツール(http://pgrc.ipk-gatersleben.de/misa)を用いる。このツールはジヌクレオチド、トリヌクレオチド及びテトラヌクレオチド及び化合物SSRモチーフをあらかじめ定められた基準により同定し、これらのSSRの発生を要約する。多型検索過程及び品質割当過程を図4の(B)に示す。
【0113】
結果
下記の表は、組み合わせたコショウのサンプルについて2回の454シークエンシングの実行、及び組み合わせたトウモロコシサンプルについて2回の実行から得られた配列を組み合わせた解析の結果を要約する。
【0114】
【表5】

【0115】
[実施例3 PCR増幅及びサンガーシークエンシングによるSNP妥当性の検証]
実施例1において同定された推定上のA/G SNPを検証するために、このSNPのためのタグ付き配列部位(STS)解析を、隣接するPCRプライマーを用いて設計した。PCRプライマー配列は以下のとおりであった:
【化9】

【0116】
プライマー1.2rが、5’末端でM13配列プライマー結合部位及び長さスタッファーを含むことに留意されたい。PCR増幅を、鋳型として、実施例4に記載されるように調製したPSP11及びPI210234の+A/+CA AFLP増幅産物を用いて行なった。PCR条件は以下のとおりであった:
1つのPCR反応に対して、下記成分を混合した:
5μl 1/10に希釈したAFLP混合物(app.10ng/μl)
5μl 1pmol/μlプライマー 1.2f(500μMストックから直接希釈したもの)
5μl 1pmol/μlプライマー 1.2r(500μMストックから直接希釈したもの)
5μl PCR混合物 2μl 10×PCR緩衝液
1μl 5mM dNTP
1.5μl 25mM MgCl
0.5μl H
5μl 酵素混合物 0.5μl 10×PCR緩衝液(Applied Biosystems)
0.1μl 5U/μl AmpliTaq DNAポリメラーゼ(Applied Biosystems)
4.4μl H
以下のPCRプロファイル:
サイクル1 2分間、94℃
サイクル2〜サイクル34 20秒間、94℃
30秒間、56℃
2分30秒間、72℃
サイクル35 7分間、72℃
∞、4℃
を使用した。
【0117】
PCR産物をTAクローニング法を用いてベクターpCR2.1(TAクローニングキット、Invitrogen)へクローニングし、INVαF’コンピテント大腸菌細胞へ形質転換させた。形質転換体を青/白のスクリーニングに付した。PSP11及びPI−201234について各々独立した白色の3つの形質転換体を選択し、プラスミド単離のための液体の選択培地中で、一晩、増殖させた。
【0118】
プラスミドをQIAprepスピンMiniprepキット(QIAGEN)を用いて単離した。続いて、これらのプラスミドのインサートを、以下のプロトコルに従ってシークエンシングし、MegaBACE 1000(Amersham)で溶解した。得られた配列をSNP対立遺伝子の存在について検査した。PI−201234インサートを含む独立した2つのプラスミド、及びPSP11インサートを含む1つのプラスミドは、SNPに隣接する期待されたコンセンサス配列を含んでいた。PSP11断片に由来する配列は期待されたA対立遺伝子(下線が引かれた)を含み、PI−201234断片に由来する配列は期待されたG対立遺伝子(二重下線が引かれた)を含んでいた:
PSP11(配列1):(5’−3’)
【化10】

PI−201234(配列1):(5’−3’)
【化11】

PI−201234(配列2):(5’−3’)
【化12】

【0119】
この結果は、推定上のコショウA/G SNPが、設計されたSTS解析を用いて検出可能な真の遺伝的多型を表わすことを示す。
【図面の簡単な説明】
【0120】
【図1A】ビーズ(「454ビーズ」)上にアニーリングされる本発明による断片、及び2つのコショウ系統の前増幅に使用されるプライマーの配列を示す図である。「DNA断片」は、制限エンドヌクレアーゼを用いた消化後に得られる断片を指し、「鍵遺伝子アダプター」は、ライブラリーを生成するのに使用される(リン酸化)オリゴヌクレオチドプライマー用のアニーリング部位を提供するアダプターを指し、「KRS」は、識別子配列(タグ)を指し、「454 SEQ.アダプター」は、シークエンシングアダプターを指し、「454PCRアダプター」は、DNA断片の乳化増幅を可能にするアダプターを指す。PCRアダプターは、ビーズとのアニーリング及び増幅を可能にすると共に、3’−T突出部を含有し得る。
【図1B】複雑度低減工程において使用されるプライマーの概略図である。概して、かかるプライマーは、(2)で示される認識部位領域、(1)で示されるタグ区域を含み得る定常領域、及びその3’−末端に(3)で示される選択領域内の1つ又は複数の選択ヌクレオチドを含む。
【図2】2%アガロースゲル−電気泳動を使用するDNA濃度推定を示す図である。S1はPSP11を指し、S2はPI201234を指す。50、100、250及び500ngはそれぞれ50ng、100ng、250ng及び500ngを指し、S1及びS2のDNA量を推定する。(C)及び(D)は、NanoDrop分光光度法を使用するDNA濃度決定を示す図である。
【図3】実施例3の中間体品質査定の結果を示す図である。
【図4】(A)は、配列データの処理パイプライン、即ち、トリミングとタグ付けで既知の配列情報を除去してトリミングされた配列データを生成し、コンティグ及びシングルトン(コンティグにアセンブリーできない断片)がクラスタリング及びアセンブリーされて、その後、推定上の多型が同定、評価され得るという工程を経由する、シークエンシングデータの生成から推定上のSNP、SSR、及びインデルを同定するまでの工程のフローチャート図である。(B)は、多型検索のプロセスをさらに詳述する図である。
【図5】推定上の一塩基多型(SNP)を含有する、コショウのAFLP断片配列の複数のアライメント「10037_CL989コンティグ2」を示す図である。なお、SNP(黒矢印で示される)は、上の2つの読み取りの名称欄に示されるMS1タグの存在によって指し示されるサンプル1(PSP11)の両読み取りに存在するA対立遺伝子、及び下の2つの読み取りの名称欄に示されるMS2タグの存在によって指し示されるサンプル2(PI201234)に存在するG対立遺伝子によって規定される。読み取りの名称欄を左側に示す。この複数のアライメントのコンセンサス配列は(5’−3’):TAACACGACTTTGAACAAACCCAAACTCCCCCAATCGATTTCAAACCTAGAACA[A/G]TGTTGGTTTTGGTGCTAACTTCAACCCCACTACTGTTTTGCTCTATTTTTGである。
【図6】遺伝子座毎の観察された読み取りの数に基づく遺伝子型の正確な分類の確率を示すグラフである。

【特許請求の範囲】
【請求項1】
1つ又は複数のサンプルにおける1つ又は複数の遺伝子マーカーのハイスループットでの発見、検出及び遺伝子型決定のための方法であって、
(a)1つ又は複数のサンプルに由来するDNAを提供する工程と、
(b)前記DNAを少なくとも1つの制限エンドヌクレアーゼを用いて制限し、それにより制限断片を製造する、制限工程と、
(c)前記制限断片にアダプターをライゲーションし、それによりアダプターにライゲーションされた制限断片を製造する、ライゲーション工程と、
(d)任意選択で、前記アダプターにライゲーションされた制限断片を前記アダプターと相補的なプライマー対を用いて増幅させ、それにより前増幅されたアダプターにライゲーションされた制限断片を製造する、増幅工程と、
(e)前記(任意選択で前増幅された)アダプターにライゲーションされた制限断片をプライマー対を用いて増幅させる工程であって、該プライマーのうち少なくとも1つが該プライマーの5’末端に識別子タグを含有し、それにより各サンプルに対して、アダプターにライゲーションされた制限断片の、タグ付けされた増幅されたサブセットのライブラリーを製造する、増幅工程と、
(f)任意選択で、前記ライブラリーをプーリングする工程と、
(g)ハイスループットシークエンシング技術を使用して、前記ライブラリーをシークエンシングする工程と、
(h)前記識別子タグを使用して、ライブラリー毎に前記配列をクラスタリングする工程と、
(i)前記ライブラリー内部、ライブラリー間の少なくとも一方で遺伝子マーカーを同定する工程と、
(j)1つ又は複数のライブラリーにおいて前記遺伝子マーカーの(共)優性遺伝子型をもとめる工程を含む方法。
【請求項2】
前記遺伝子マーカーがAFLPマーカー又はSNPマーカーである、請求項1に記載の方法。
【請求項3】
前記シークエンシングが合成によるシークエンシング、好ましくはピロシークエンシングに基づく、請求項1又は2に記載の方法。
【請求項4】
前記シークエンシングがビーズ等の固体支持体上で実施される、請求項1〜3のいずれか一項に記載の方法。
【請求項5】
前記シークエンシングが、
増幅されたアダプターにライゲーションされた制限断片をビーズにアニーリングする(各ビーズは単一のアダプターにライゲーションされた断片とアニーリングする)工程と、
前記ビーズを油中水滴型マイクロリアクター内で乳化させる(各油中水滴型マイクロリアクターは単一のビーズを含む)工程と、
エマルジョンPCRを実施し、それにより前記ビーズの表面上で前記アダプターにライゲーションされた制限断片を増幅させる、実施工程と、
前記ビーズをウェルに充填する(各ウェルは、単一のビーズを含む)工程と、
ピロリン酸シグナルを生成する工程を含む、請求項1〜4のいずれか一項に記載の方法。
【請求項6】
前記タグ付けされ増幅されたアダプターにライゲーションされた制限断片の平均重複が少なくとも6、好ましくは少なくとも7、より好ましくは少なくとも8、最も好ましくは少なくとも9である、請求項1〜4のいずれか一項に記載の方法。
【請求項7】
各アダプターにライゲーションされた制限断片の配列が少なくとも6倍、好ましくは少なくとも7倍、より好ましくは少なくとも8倍、及び最も好ましくは少なくとも9倍測定される、請求項1〜5のいずれか一項に記載の方法。
【請求項8】
エンドヌクレアーゼ制限とアダプターライゲーションとの間でサイズ選択が変性工程によって実施される、請求項1〜6のいずれか一項に記載の方法。
【請求項9】
前記DNAがゲノムDNA、RNA、cDNA、BAC、YAC、全ゲノム増幅DNA、PCR産物から成る群から選択される、請求項1〜8のいずれか一項に記載の方法。
【請求項10】
前記アダプターが、前記制限断片の一端又は両端と適合性がある一端を有する二本鎖合成オリゴヌクレオチドアダプターである、請求項1〜9のいずれか一項に記載の方法。
【請求項11】
前記DNAが2つ以上、好ましくは3つ以上の制限エンドヌクレアーゼを用いて制限される、請求項1〜10のいずれか一項に記載の方法。
【請求項12】
前記DNAが2つの制限エンドヌクレアーゼを用いて制限される、請求項1〜11のいずれか一項に記載の方法。
【請求項13】
前記制限エンドヌクレアーゼのうち少なくとも1つがレアカッターである、請求項1又は2に記載の方法。
【請求項14】
前記制限エンドヌクレアーゼのうち少なくとも1つがフリークエントカッターである、請求項1〜13のいずれか一項に記載の方法。
【請求項15】
前記プライマーが1〜10の(好ましくはA、C、T又はGの中からランダムに選択される)選択ヌクレオチド、より好ましくは1〜5のヌクレオチドを含有する、請求項1〜14のいずれか一項に記載の方法。
【請求項16】
前記DNAが3つ以上の制限エンドヌクレアーゼの組合せを使用して制限される、請求項1〜15のいずれか一項に記載の方法。
【請求項17】
AFLPマーカー配列、SNPマーカー配列の少なくとも一方の共優性スコアリングのための、請求項1〜16のいずれか一項に記載の方法の使用。
【請求項18】
請求項1〜17のいずれか一項に記載の方法における、多型検出のためのハイスループットシークエンシング方法の使用であって、遺伝子マッピング、QTLマッピング、遺伝子/形質の精細マッピング、連鎖不平衡(LD)マッピング、マーカー利用戻し交配、遺伝距離解析、形質又は表現型と繋がりのあるマーカーの発見、親サンプルの診断用遺伝子型決定等を含む遺伝子型決定目的での使用。

【図1A】
image rotate

【図1B】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate


【公表番号】特表2009−520497(P2009−520497A)
【公表日】平成21年5月28日(2009.5.28)
【国際特許分類】
【出願番号】特願2008−547127(P2008−547127)
【出願日】平成18年12月20日(2006.12.20)
【国際出願番号】PCT/NL2006/000648
【国際公開番号】WO2007/073165
【国際公開日】平成19年6月28日(2007.6.28)
【出願人】(505464888)キージーン ナムローゼ フェンノートシャップ (11)
【Fターム(参考)】