説明

トランスポゾンタギング集団のハイスループットスクリーニングおよび挿入部位の大規模並行配列特定のための方法

トランスポゾン集団中の遺伝子の同定のための方法であって、ゲノムDNAの単離、任意的なDNAのプーリング、酵素を用いたプール中のDNAの制限処理、アダプターのライゲーション、プライマーによるアダプター結合断片の増幅(ここにおいて、プライマーの1つは、幅広いトランスポゾン配列に相補的なプライマーである)、断片のハイスループットシーケンシング、断片とデータベース中の既知の配列とのアラインメント、およびそれによる遺伝子候補の同定を含む方法。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、分子生物学および遺伝学の分野に関する。本発明は、ハイスループット配列決定技術の使用に基づく、集団中の遺伝子の変異を同定するための改善された戦略に関する。
【背景技術】
【0002】
トランスポゾンタギング集団は、逆遺伝学アプローチにより農学的または一般的重要性の特性に影響する遺伝子を特定するために、現代的植物遺伝学研究において使用される。
【0003】
それらは遺伝子発見のための補完的手段を意味し、それは、トランスポゾン集団が、一般に、観察される表現型の原因となる遺伝子を同定するために使用される(いわゆる正遺伝学(forward genetics)アプローチ)ためである。これは、当該分野において逆遺伝学アプローチと区別され、当該アプローチでは、変異性の事象が関心ある配列(遺伝子)にて同定される。当該方法の律速段階は、関心ある遺伝子または配列における変異を保持する個体の同定に関連するスクリーニング作業である。以下に、トランスポゾン集団の原理およびスクリーニング方法をより詳細に記述し、遺伝子発見のためのこれらの手段の価値を増大させる、より効率的なスクリーニング方法を提示する。
【0004】
トランスポゾンは、ゲノム中において多コピーで天然にまたは人工的に生じる、転移性の遺伝因子である。ゲノムにおけるそれらの位置は、通常生活環の何れの所定の瞬間においても、切除および新しい部位への挿入により変化することができるため、それらは不安定である。トランスポゾン集団は遺伝子発見にとって価値があるが、それは、それらが遺伝子配列またはそれらの調節領域に挿入された場合に、遺伝子の機能を破壊するためである。作物育種で使用される多くのトランスポゾンの配列は既知であるが、一旦興味深い表現型を有する植物が観察されると、どの遺伝子がトランスポゾン挿入によって影響を受けたかわからない。一般に、トランスポゾンが表現型の原因となるのか、および、なるとすれば、どのトランスポゾンが表現型の原因となるのかということも未知である。生物およびトランスポゾンに依存して、トランスポゾン集団中のトランスポゾンコピー数は、植物につき数十から数百のトランスポゾンにわたる。
【0005】
トランスポゾン誘導性表現型変異配列の分析のための現代のスクリーニング法は、配列特異的トランスポゾン挿入部位の隣接配列を得るための、連鎖PCRに基づく方法(linked−PCR based methods)を含む。リンカーPCRの限界は、隣接配列の決定に、シーケンスゲルからのバンド切り出しが必要となることであり、これは、時間を消費し、自動化が困難であり、および、相対的にロースループット(数千ものバンドに容易に適用することができない)である。
【0006】
トランスポゾン集団のスクリーニングは、単純な方法が、ゲノムに挿入されたトランスポゾンの全てまたは少なくとも一部の隣接配列を収集するために利用できるようになることで、改善されると考えられる。
【発明の開示】
【0007】
[定義]
以下の説明および例において、多くの用語が使用される。そのような用語が与えられるべき範囲を含む、明細書および特許請求の範囲の明確でおよび一貫した理解を提供するために、以下の定義が提供される。本願中で特別定義される場合を除き、使用される全ての技術的および科学的用語は、本発明が属する分野の当業者が通常理解する意味と同一の意味を有する。全ての文献、特許出願、特許およびその他の参考文献の開示は、その全てが本願に援用される。
【0008】
トランスポゾン:トランスポゾンは、単一細胞のゲノム内の異なる位置を動き回る(いわゆるトランスポジション(transposition)の工程)ことができるDNAの配列である。当該工程において、これらは、変異を引き起こし、ゲノム中のDNAの量を変化させることができる。トランスポゾンはまた、「ジャンピング遺伝子」または「可動性遺伝因子」と呼ばれる。様々な可動性遺伝子因子が存在する:それらは、それらのトランスポジションの機構に基づいて分類できる。クラスI可動性遺伝因子、またはレトロトランスポゾンは、RNAに転写され、その後逆転写酵素によってDNAに戻されることによりゲノム中を移動する。一方、クラスII可動性遺伝因子は、ゲノム中においてそれらを「カット・アンド・ペースト」するトランスポザーゼを用いて、ゲノム内をある位置から別の位置へと直接移動する。トランスポジションは、転移因子の1コピーがドナー部位に残り、別のコピーが標的部位に挿入されるという複製的となることができ;または、トランスポジションは、転移因子が1部位から切り出され、別の部位に挿入されるというように、保存的に生じ得る。当該用語は、原核生物で見つかる転移因子(例えば、挿入配列(IS)、トランスポゾン(Tn))またはバクテリオファージで見つかる転移因子(MuおよびD108)を含むが、これらに限定されない。真核生物の転移因子は、D.メラノガスターで見つかるコピア因子;酵母で見つかるようなTY因子;シロイヌナズナで見つかるようなTa1およびTnt1転移因子;マウスで見つかるIAP;キンギョソウで見つかるようなTamまたはCin転移因子;およびトウモロコシで見つかるようなAC、Spm、Bs、Cin、Dtおよびミューテーター遺転移因子を含むが、これらに限定されない。当該用語は、また、自身を複製的または保存的の何れかによって宿主ゲノム内に挿入でき、そのゲノムからのトランスポジションまたは切り出しが人為的処置により調節できる、合成転移因子を含む。例えば、合成転移因子は、機能的なトランスポゼース(トランスポジションを仲介する酵素)を欠いているが、トランスポゼース遺伝子を誘導可能プロモーターに実施可能的につなぐことで、トランスで供給されるよう構築することができる。
【0009】
トランスポゾン集団:一生物(普通植物であるが、ショウジョウバエおよびマウスといったその他の生物もまた可能である)由来の個体の集団であって、それぞれがそのゲノム中に多数のトランスポゾンを保持し、トランスポゾンのそれぞれが1以上の遺伝子に影響を及ぼし、異なる表現がたもたらされる可能性がある集団。典型的に、トランスポゾン集団は、表現型の特性において不安定性を示す個体または変種から選択して得ることができる。トランスポゾン集団は、サイズにおいて広く異なってよく、特定の目的のために、本来の集団の90、80、70、60、50、40、30%またはわずか20%を含む、部分的集団を使用することができる。
【0010】
タグ:プライマーに付加でき若しくはその配列に含む得ることができ、またはさもなければラベルとして使用されユニークな識別子を提供できる短い配列。そのような配列識別子は、特異的核酸サンプルを同定するために一意的に使用される、異なるが定められた長さのユニークな塩基配列でありえる。例えば、4bpタグは4(exp4)=256通りの異なるタグをもたらし得る。典型例は、当該分野で既知のZIP配列である(Iannone et al. Cytometry 39:131−140, 2000)。そのようなタグを用いて、PCRサンプルの起源を、更なるプロセシングにおいて決定することができる。異なる核酸サンプルを由来とする処理を受けた産物を組み合わせる場合、異なる核酸サンプルは、異なるタグを用いて遺伝的に同定される。本発明の場合、ユニークな配列タグの付加は、配列増幅産物のプールにおける個々の植物の座標(co−ordinates)を同定することに役だつ。マルチプルタグが使用できる。
【0011】
タギング:第2のまたは更なる核酸から区別できるようにするために、タグまたはラベルを核酸に付加する工程を意味する。タギングは、例えば、タグ付加したプライマーの使用による増幅の際における配列識別子の付加により、または当該分野において既知の何れかのその他の方法により行うことができる。
【0012】
制限エンドヌクレアーゼ:制限エンドヌクレアーゼまたは制限酵素は、二本鎖DNA分子における特異的核酸配列(標的部位)を認識し、全ての標的部位においてDNA分子の両鎖を切断するであろう酵素である。
【0013】
制限断片:制限エンドヌクレアーゼでの消化によって作られるDNA分子は、制限断片と称される。何れかの所定のゲノム(または、その起源(origin)に関わらず、核酸)は、特定の制限エンドヌクレアーゼにより、制限断片の別々のセットに消化されるだろう。制限エンドヌクレアーゼ切断によるDNA断片は、さらに、様々な技術に使用でき、例えば、ゲル電気泳動によって検出できる。
【0014】
ライゲーション:2つの二本鎖DNA分子を互いに共有結合させる、ライゲース酵素により触媒される酵素反応は、ライゲーションと称される。一般に、両DNA鎖は互いに共有結合されるが、鎖の末端の1つの化学的または酵素的修飾によって、2つの鎖の1つのライゲーションを防止することも可能である。その場合、共有結合は、2つのDNA鎖の1つのみにて生じるだろう。
【0015】
合成オリゴヌクレオチド:化学的に合成できる、好ましくは約10から約50塩基を有する一本鎖DNA分子は、合成オリゴヌクレオチドと称される。一般に、これらの合成DNA分子は、ユニークまたは所望の核酸配列を有するよう設計されるが、関連した配列を有し、および核酸内の特異的位置で異なる核酸組成を有する分子のファミリーを合成することができる。合成オリゴヌクレオチドという用語は、設計されたまたは所望のヌクレオチド配列を有するDNA分子を意味するよう使用されるだろう。
【0016】
アダプター:制限断片の末端にライゲーションできるように設計された、限定された塩基対数(例えば約10から約30塩基対の長さ)の短い二本鎖DNA分子。アダプターは、一般に、互いに部分的に相補的なヌクレオチド配列を有する2つの合成オリゴヌクレオチドで構成される。適切な条件の下、溶液中で2つの合成オリゴヌクレオチドを混合したとき、それらは互いにアニールし、二本鎖構造を形成するだろう。アニーリングの後、アダプター分子の一端は、制限断片の末端に適合し、そこにライゲーションするように設計されている;アダプターの反対の末端は、ライゲーションできないよう設計できるが、これは必ずしもそうである必要はない(ダブル結合アダプター)。
【0017】
アダプター結合制限断片:アダプターでキャップされた制限断片。
【0018】
核酸:本発明による核酸は、ピリミジンおよびプリン塩基、好ましくはそれぞれシトシン、チミン、およびウラシル、並びにアデニンおよびグアニンの何れかのポリマーまたはオリゴマーを含んでよい(Albert L. Lehninger, Principles of Biochemistry, at 793−800 (Worth Pub. 1982)、当該文献は、全ての目的のために、その内容全てが本願に援用される)。本発明は、何れかのデオキシリボヌクレオチド、リボヌクレオチドまたはペプチド核酸構成成分、およびそれらの何れかの化学変種(例えば、これらの塩基のメチル化、ヒドロキシメチル化またはグリコシル化体)等が考慮される。ポリマーまたはオリゴマーは、組成物中で異種性または同種性であってよく、天然由来のソースから単離してよく、または人工的にもしくは合成的に製造してよい。さらに、核酸は、DNAもしくはRNAまたはそれらの混合物であってよく、および、永久にまたは一時的に、ホモ二重鎖、ヘテロ二重鎖および複合型状態を含む一本鎖または二本鎖形態で存在してよい。
【0019】
シーケンシング:シーケンシングという用語は、核酸サンプル(例えばDNAまたはRNA)において、ヌクレオチドの順番(塩基配列)を決定することを意味する。
【0020】
アライニングおよびアラインメント:「アライニング」および「アラインメント」という用語は、同一または類似のヌクレオチドの短いまたは長いストレッチの存在に基づく2以上のヌクレオチド配列の比較を意味する。核酸配列のアラインメントのための幾つかの方法は当該分野において既知であり、以下にて更に説明されるであろう。しばしば、「アッセンブリー」または「クラスタリング」という用語が同義語として使用される。
【0021】
ハイスループットスクリーニング:しばしばHTSと略されるハイスループットスクリーニングは、生物学および化学の分野に特に関係する科学的実験の方法である。現代的ロボット工学およびその他の特殊化研究室ハードウェアの組み合わせを通して、研究者が、効率的に大量のサンプルを同時にスクリーニングすることを可能にする。
【0022】
プライマー:一般に、プライマーという用語は、DNAの合成を開始させることができるDNA鎖を意味する。DNAポリメラーゼは、プライマーなしで新たにDNAを合成することはできない:それは、相補鎖が、構築しようとするヌクレオチドの順序を決めるためにテンプレートとして使用される反応において、現存のDNA鎖を伸長させることができるのみである。我々は、ポリメラーゼ連鎖反応法(PCR)にて使用される合成オリゴヌクレオチド分子をプライマーと称するだろう。
【0023】
親和性が増大したプライマー:PNAまたはLNAといった改変されたヌクレオチドを含むプライマーであり、熱的安定性が増大され、単一ヌクレオチド配列差異に基づいてより特異的な増幅が可能となる。これを達成する目的で、1または複数の改変されたヌクレオチドが、好ましくはプライマーの3’末端に、しばしば含まれる。
【0024】
DNA増幅:DNA増幅という用語は、典型的に、PCRを用いた二重鎖DNA分子のin vitro合成を意味するために使用されるだろう。その他の増幅方法が存在し、それらは、本発明の要旨から外れることなく、本発明に使用してもよいことに注目される。
【0025】
選択的ハイブリダイゼーション:厳密なハイブリダイゼーション条件におけるハイブリダイゼーションであって、核酸の特異的核酸標的配列に対する、非標的核酸配列へのハイブリダイゼーションよりも検出可能な程度に高い程度(例えば、好ましくは、少なくともバックグラウンドの2倍を越える程度)でのハイブリダイゼーション、および非標的核酸の実質的排除に関する。「厳密な条件」または「厳密なハイブリダイゼーション条件」という用語は、その他の配列よりも検出可能な程度に高い程度(例えば、好ましくは、少なくともバックグラウンドの2倍を越える程度)で、プローブがその標的配列にハイブリダイズするであろう条件に対する言及を含む。厳密性条件は配列依存的であり、異なる環境において異なるだろう。ハイブリダイゼーションおよび/または洗浄条件の厳密性の調節により、プローブに対して100%相補的な標的配列が同定できる(ホモロガスプロービング)。あるいは、厳密性条件は、配列における特定のミスマッチを許すよう調節でき、それによってより低い程度の類似性が検出される(ヘテロガスプロービング)。一般に、プローブは、約100ヌクレオチド未満の長さ、好ましくは50または25ヌクレオチド以下の長さである。典型的に、厳密な条件は、塩濃度は約1.5M未満のNaイオンであり、典型的に約7.0〜8.3のpHにおいて約0.01〜1.0MのNaイオン濃度(またはその他の塩)であり、温度は、典型的に、短いプローブ(例えば10〜50ヌクレオチド)では少なくとも約30℃であり、典型的に、長いプローブ(例えば50ヌクレオチドを越える場合)では少なくとも約60℃である、条件であるだろう。厳密な条件は、また、ホルムアミドといった不安定化剤の添加によって達成してよい。例示的な低厳密性条件は、30から35%ホルムアミド、1M NaCl、1%SDS(ドデシル硫酸ナトリウム)の緩衝液の37℃でのハイブリダイゼーション、および1から2SSC(20SSC=3.0M NaCl/0.3Mクエン酸三ナトリウム)による50から55℃での洗浄を含む。例示的な中等度の厳密性条件は、40〜45%ホルムアミド、1M NaCl、1%SDS中、37℃でのハイブリダイゼーション、および0.5から1SSC中、55から60℃での洗浄を含む。例示的な高い厳密性条件は、50%ホルムアミド、1M NaCl、1%SDS中、37℃でのハイブリダイゼーション、および0.1SSC中、60から65℃での洗浄を含む。特異性は、一般的にハイブリダイゼーション後の洗浄の関数であり、決定的な因子は、最後の洗浄溶液のイオン強度および温度である。DNA−DNAハイブリッドのために、TmはMeinkothおよびWahlによる文献(Anal. Biochem., 138:267−284 (1984))の式から概算できる:Tm=81.5℃.+16.6(logM)+0.41(%GC)−0.61(%form)−500/L;ここにおいて、Mは一価陽イオンのモル濃度であり、%GCは、DNA中のグアノシンおよびシトシンヌクレオチドのパーセンテージであり、%formは、ハイブリダイゼーション溶液中のホルムアミドのパーセンテージであり、およびLは塩基対のハイブリッドの長さである。Tmは、補完的な標的配列の50%が、完全にマッチしたプローブにハイブリダイズする温度(定義されたイオン強度およびpHの下で)である。Tmは、それぞれ1%のミスマッチングのために、約1℃下げらる;したがって、Tm、ハイブリダイゼーションおよび/または洗浄条件は、望ましい同一性の配列にハイブリダイズするよう調整できる。例えば、>90%の同一性による配列を探す場合、Tmは10℃下げることができる。通常、厳密な条件は、定義されたイオン強度およびpHにおける特異的配列およびその相補体(complement)の熱融点(Tm)よりも約5℃低く選択される。しかしながら、高度に厳密な条件は、熱融点(Tm)より1、2、3または4℃低いハイブリダイゼーションおよび/または洗浄が使用される;中程度の厳密な条件は、熱融点(Tm)より6、7、8、9または10℃低いハイブリダイゼーションおよび/または洗浄が使用される;低い厳密性条件は、熱融点(Tm)より11、12、13、14、15または20℃低いハイブリダイゼーションおよび/または洗浄が使用される。式、ハイブリダイゼーションおよび洗浄の組成、および望ましいTmを使用して、当業者は、ハイブリダイゼーションおよび/または洗浄溶液の厳密性における変化は本質的に記述されることを理解するだろう。望ましい程度のミスマッチングが、45℃(水溶液)または32℃(ホルムアミド溶液)よりも低いTmをもたらす場合、より高い温度が使用できるようにSSC濃度を増加させることが好ましい。核酸のハイブリダイゼーションの詳細な指針は、文献に見つかる(Tijssen, Laboratory Techniques in Biochemistry and Molecular Biology−Hybridisation with Nucleic Acid Probes, Part 1, Chapter 2 “Overview of principles of hybridisation and the strategy of nucleic acid probe assays”, Elsevier, N.Y. (1993);およびCurrent Protocols in Molecular Biology, Chapter 2, Ausubel, et al., Eds., Greene Publishing and Wiley−Interscience, New York (1995))。
【0026】
[発明の説明]
本発明者らは、ハイスループットシーケンシング戦略を用いて、前述の目的が達成でき、およびトランスポゾン集団、またはトランスポゾン挿入によって起こされる関心ある表現型を保持するメンバーを含む集団は、関心ある遺伝子への挿入の存在について効率的にスクリーニングされることを発見した。
【0027】
[発明の詳細な説明]
本発明は、以下の工程を含む、トランスポゾン集団のメンバーにおける関心ある遺伝子または配列に関連した挿入の同定のための方法に関する:
(a) 個々にまたはプール中にて、トランスポゾン集団のゲノムDNAを単離すること;
(b) 任意に、工程(a)で得られるDNAをプールすること;
(c) 1以上、好ましくは2以上、最も好ましくは2つの制限酵素(好ましくはその少なくとも1つが、トランスポゾンを切断しない高頻度切断制限エンドヌクレアーゼであり、好ましくは少なくとも1つが、トランスポゾンで切断する希少切断制限酵素である)を使用してDNAを制限処理し(restrict)、制限断片にアダプターを結合し(ligate)、それによってアダプター結合制限断片を作製すること;
(d) 一対の(任意に、ラベルした)プライマーを用いてアダプター結合制限断片を増幅すること、ここにおいて、プライマーの1つは、(既知の)トランスポゾン配列の一部に相補的(ハイブリダイズ可能)であるセクションを含み、更にシーケンスプライマー結合部位を含み、ここにおいて他方のプライマーは少なくともアダプターに相補的であり、ここにおいて一方または両方のプライマーはタグを含む;
(e) 任意に、工程(d)の増幅産物をプールし、増幅産物のライブラリーを構築すること;
(f) 任意に、ライブラリー中の増幅産物を断片化すること;
(g) ハイスループットシーケンシングを使用して、(d)、(e)または(f)の断片のヌクレオチド配列を決定すること;
(h) 任意に、in silicoで断片の配列を整え、それによって何れかのアダプターおよび/またはトランスポゾンに関連した配列情報を削除すること;
(i) データベースからのヌクレオチド配列をアライニングできる、工程(g)または(h)の1以上の断片を同定し、それによってデータベースからのヌクレオチド配列と関心ある表現型との相関関係を示すこと;
(j) 工程(i)の断片を含んでいるトランスポゾン集団のメンバーを同定すること;
(k) 任意に、工程(i)の断片に基づいてプローブまたはPCRプライマーペアを設計し、およびそれを使用して(j)で同定されたメンバーのゲノムの関心ある遺伝子におけるトランスポゾン挿入を確認すること。
【0028】
集団中のそれぞれのメンバーのDNAサンプルを提供するためのDNAの単離は、一般に、当該分野において一般的な方法を用いて達成され、例えば、集団のメンバーからの組織の採取、DNA抽出(例えば、Q−Biogene fast DNAキット)、サンプル当り等量のDNAを得るための定量化および標準化が使用される。例として、本発明は、1000の植物のトランスポゾン集団に基づいて例示される。典型的に、DNAは、関心ある表現型を発現する集団のそれぞれのメンバーのものが単離される。
【0029】
本発明による方法に関して、ゲノムDNAが少なくとも1つの転移因子タグ付加遺伝子を含む個々の生物は、関心ある変異型表現型の存在または非存在によって分離可能である。従って、生物からの遺伝配列の同定および単離に適した方法が提供され、ここにおいて、前記遺伝配列に隣接する転移因子による前記生物のゲノムDNAの破壊は、直接的にまたは間接的に、変異型表現型に関係している。
【0030】
生物の変異型表現型は、好ましくは、転移因子の挿入による単一遺伝子の破壊によって生じることが既知またはそう疑われるものであり、または、少なくとも、そのような挿入の事象が除外できないものである。実際には、このことは、生物の群は、変異型表現型の存在(または非存在)に基づいて分離されることを意味してよい。当業者は、分離しようとする生物のプールは、非遺伝的寄与(例えば、環境的影響)により生じる表現型の分離を避けるために、同様な条件のもとで生育または培養すべきであることを理解するだろう。本発明の方法は、野生型または変異型の何れかとして区別および分類できる、何れかの表現型に適用できる。そのような表現型は、視覚的、生化学的、農学的または形態学的手段によって検出可能である。当業者は、本願で使用される「野生型」および「変異型」という用語は、特定の表現型の存在または非存在によって生物を区別するために使用される任意の用語であると認識するであろう。本発明が適用できる生物は、真核生物または原核生物とすることができる。真核生物は、本発明による方法に使用する場合、一倍体または二倍体とすることができる。二倍体において、野生型表現型を発現する生物は、F1世代由来であってよいが、トランスポゾンタグ付加遺伝子に関係する変異型表現型は、より一般的に劣勢変異として現れるため、より一般的にF2世代にて現れる。従って、本発明の好ましい実施態様において、生物は、転移因子ドナー個体と、活性転移因子を有さないレシピエント純系個体との間の交雑によるF2世代由来であるだろう。好ましくは、本発明による方法は植物に適用されるだろう。特定の実施態様において、好ましい植物は、例えばイネ科の単子葉植物といった単子葉植物であり、例えばトウモロコシ種が含まれる。本発明の特定の実施態様において、転移因子を有する生物は、Mu−DR調節因子(Chomet et al. (1991) Genetics 122:447457)および高コピー数のMu因子を含むMuドナー個体と、活性Mu因子を有さないレシピエント純系個体との間の交雑によるF2世代に由来するトウモロコシ植物であるだろう。生物のゲノムDNAは、少なくとも1つの転移因子を有し、および好ましくは多数の転移因子、例えば少なくとも5、10、25、50または100の転移因子を有するだろう。ゲノム内における転移因子は、同一のまたは異なるタイプのものとすることができる。転移因子を含む生物は、当該分野において利用可能な方法にそって実験的に得ることができる。例えばChometの文献参照(The Maize Handbook, ed. Freeling and Walbot (Springer−Verlag, New York), pp. 243−248(1994))。好ましい実施態様において、転写性因子はミューテーター(Mu)である(Robertson (1978) Mutation Res. 51:21−28, Chandler and Hardeman (1992) Advances in Genetics 30:77−122)。Muを含む、多くの転移因子に存在する末端逆方向反復DNA(terminal−inverted−repeat DNA)(TIR)は、本発明によく適している。転移因子の挿入は、転移因子タグ付加DNA配列の内部またはその近くにて発生する可能性がある。本発明による方法によって同定しようとする転移因子タグ付加遺伝子は、遺伝子のコーディング配列内に挿入された転移因子を有しており、そのため遺伝子の正常な機能的産物の転写は阻害され、変異型表現型がもたらされる。あるいは、タグ付加遺伝子は、イントロン内に挿入された転移因子を有してよく、そのためRNAのスプライシングが影響を受け、その結果機能的遺伝子産物が阻害され、従って変異型表現型が作られる。更に、タグ付加遺伝子は、プロモーターまたはエンハンサー因子といった遺伝子調節領域内に挿入された転移因子を有することが可能であり、そのため遺伝子発現は増大または減少し、変異型表現型がもたらされる。本発明による方法が適用されるそれぞれの表現型のために、野生型表現型を有する少なくとも1つの生物および少なくとも1つの変異体が分離される。任意に、少なくとも2、4、5、10、15、または20の生物が分離された野生型集団に存在し、少なくとも2、4、5、10、15、または20が、変異型集団に存在する。
【0031】
単離されたDNAのプーリングは、例えば、3次元プーリングスキームを用いて達成できる(Vandenbussche et al, 2003, The Plant Cell, 15, 2680−2693)。プーリングは、好ましくは等量のDNAを用いて達成される。3Dプーリングスキームは、10x10x10を含んでよく、結果として、1プールあたり10x10=100の異なるDNAサンプルを含む30プール(10+10+10)を含む。様々なその他のプーリング戦略を本発明とともに使用することができ、その例は、多次元プーリング(3−Dプーリングを含む)またはカラム(column)、ロウ(row)またはプレート(plate)プーリングである。特定の実施例において、プーリングはサンプリング段階におけるDNA抽出の前に行い、DNA標本の数を1000ではなく30サンプルに減少させることもできる(本方法の工程(a))。
【0032】
プーリング段階は、典型的に、1回のPCRスクリーニング後、観察されるトランスポゾン挿入を含む植物を同定することに役立つ。DNAのプーリングは、更に、シーケンシングのためのライブラリーにおいてより均等な表示を提供するために、PCR増幅に先立ってDNAを標準化することに役立つ。
【0033】
プール中のDNAは、少なくとも1つの制限エンドヌクレアーゼを用いて制限処理される。場合によって、すなわちゲノムのサイズまたはトランスポゾンの数に依存して、更なるエンドヌクレアーゼが使用できる。特定の実施態様において、2以上のエンドヌクレアーゼが使用できる。大部分のゲノムにとって、2つエンドヌクレアーゼで十分であり、このことは、それゆえ、最も好ましい。特定の実施態様において、特に大きいまたは複雑なゲノムのために、更なるエンドヌクレアーゼが使用できる。好ましくは、エンドヌクレアーゼは、50−500bpのオーダーで、相対的に短い制限断片を提供するが、このことは必須ではない。典型的に、少なくとも1つの高頻度切断ヌクレアーゼが好ましく、例えば、4または5塩基対の認識配列を有するエンドヌクレアーゼが好ましい。そのような酵素の1つはMseIであるが、その他の多くのものが商業的に利用でき、使用することができる。また、認識配列の外側を切断する酵素を使用することができ(IIsタイプ)、または平滑末端制限断片を与える酵素を使用することができる。好ましい組み合わせでは、1つの希少切断(6塩基以上の認識配列)および1つの高頻度切断を行うものが使用される。
【0034】
プールされたDNAの制限処理の後にまたはそれと同時に、アダプターが制限断片に結合され、アダプター結合制限断片が得られる。1以上の異なるアダプターを使用してよく、例えば、2つのアダプター、1つのフォワード、1つのリバースアダプターを使用してよい。あるいは、1つのアダプターを全ての断片のために使用してよく、または、アダプターの突出末端にヌクレオチドの並べ替え(permutation)を含み、それによって、予備選択工程を可能とし得るインデックスリンカー(indexing linker)を提供するアダプターのセットを使用してよい(Unrau et al., Gene, 1994, 145, 163−169)。あるいは、平滑末端制限断片の場合には、平滑末端アダプターを使用することができる。アダプター結合は当該分野において周知であり、とりわけEP 534858に記載されている。アダプター結合の後、アダプター結合制限断片のプールは、アダプターに相補的なプライマーのセットを用いて(予備)増幅してよい。このことは、プール中のそれぞれの植物からのDNAの量の(更なる)標準化に役立ち、またはプール中のDNAの総量を増加させプールの多重分析(すなわち、サンプルの分割)を可能とし、およびシグナル対ノイズ比を増大させるのに役立つ。
【0035】
アダプター結合制限断片は、任意的な予備増幅の後、プライマーのペアを用いて、本発明による方法の工程(d)で増幅される。EP534858の記載と同様に、プライマーの1つは、アダプターの少なくとも1つに相補的であり、更に、エンドヌクレアーゼの認識配列の残りの部分に相補的であってよく、および更に、その3’末端にて(ランダムに選択された)選択的ヌクレオチドを含んでよい。プライマーのセットにおけるその他のプライマーは、トランスポゾン配列の境界(の一部)とアニーリング可能であるよう設計される。典型的に、プライマーはトランスポゾンの共通配列と重複し、および好ましくはその境界において重複する。
【0036】
好ましくは、プライマーは、厳密なハイブリダイゼーション条件の下、転移因子またはアダプターにそれぞれ選択的にハイブリダイズできる。あるいは、プライマーは、少なくとも50、60、70、80、85、90、95%で、トランスポゾンと重複(相補的)であってよい。約20bpのプライマーの平均長では、これは、約10から19塩基に達する。これは、生物中のトランスポゾンまたはトランスポゾンファミリーの共通配列または事実上既知の配列であってよい。植物の典型的なトランスポゾン配列は既知であり、例えば、De Keukeleireら(Chromosome Research, 2004, 12(2): 117−123)、Van den Broeck ら(The Plant Journal, 1998, 13(1), 121−129)、Geratsら(Plant Cell, 1990, 2, 1121−1128 describing the 284 bp dTph1 transposition system in petunia)による文献が参照される。これらの参考文献は、特にトランスポゾンの境界において、共通配列がトランスポゾンファミリーに知られていることを示す。これらの共通配列があれば、適切なプライマーの設計は容易に達成できる。たとえば、植物および動物におけるHatファミリー(Hobo、AcおよびTam3)である。転移因子は既知であり、並びに以下の文献にそれらの配列が記載される:Atkinson PW、Warren WD、O’Brochta DAによる文献(The hobo transposable element of Drosophila can be cross−mobilized in houseflies and excises like the Ac element of maize. Proc Natl Acad Sci USA 90: 9693−9697(1993));Capy P、Vitalis R、Langin T、Higuet D、Bazin Cによる文献(Relationships between transposable elements based upon the integrase−transposase domains: is there a common ancestor? J Mol Evol 42: 359−368(1996));Esposito T、Gianfrancesco F、Ciccodicola Aらによる文献(A novel pseudoautosomal human gene encodes a putative protein similar to Ac−like transposases. Hum Mol Genet 8: 61−67(1999));Grappin P、Audeon C、Chupeau MC、Grandbastien MAによる文献(Molecular and functional characterization of Slide, an Ac−like autonomous transposable element from tobacco. Mol Gen Genet 252: 386−397(1996));Handler AM、Gomez SPによる文献(The hobo transposable element excises and has related elements in tephridit species. Genetics 143: 1339−1347(1996));Hehl R、Nacken WK、Krause A、Saedler H、Sommer Hらによる文献(Structural analysis of Tam3, a transposable element from Antirrhinum majus, reveals homologies to the Ac element from maize. Plant Mol Biol 16: 369−371(1991));Huttley GA、McRae AF、Clegg MTらによる文献(Molecular evolution of the Ac/Ds transposable element family in pearl millet and other grasses. Genetics 139: 1411−1419(1995));Kempken F、Windhofer F(The hAT family: a versatile transposon group common to plants, fungi, animals, and man. Chromosoma 110: 1−9(2001));Warren WD、Atkinson PW、O’Brochta DA(The Australian bushfly Musca vetustissima contains a sequence related to transposons of the hobo, Ac and Tam3 family. Gene 154: 133−134(1995))。
【0037】
好ましくは、トランスポゾン指向プライマー(transposon directed primer)は、標的とするトランスポゾンの外向きにそれが面するように、方向付けられおよび設計される。特定の実施態様において、特異性を増大させるために、一方または両方のプライマー、好ましくはトランスポゾン指向プライマーが、結合親和性の増大したヌクレオチドを含んでよい。
【0038】
アダプター結合制限断片の一部またはセグメントは、一方または両方がラベル化されてよいタグ付加プライマーのペアを用いて増幅される。好ましくは、それぞれの次元のそれぞれのプールのために、異なるプライマーが使用される。上述の例示において、このことは、30のフォワードプライマーおよび単一のリバースプライマーが好ましいことを意味する。フォワードおよびリバースプライマーの1つは、アダプターに向かって方向付けられてよく、その他のリバースおよびフォワードプライマーは、標的となるトランスポゾンに向かって方向付けられてよい。
【0039】
好ましくは、プライマーのそれぞれのペア(アダプター指向プライマーおよびトランスポゾン指向プライマー)は、更に、依存的に、1以上の以下の因子を含んでよい:
(i)続くシーケンシング工程にて使用可能な位置に結合するシーケンスプライマー、
(ii)プライマー(および結果的に生じる増幅産物)と集団の本来のメンバーとを関連付けるのに役立つタグ、および
(iii)ハイスループットシーケンシング工程にて使用されるビーズへの結合を可能にするビーズ結合配列。
【0040】
典型的な実施態様において、トランスポゾン指向プライマーは、3’−5’方向および5’−3’方向の両方において以下の構造を有することができる:
シーケンスプライマー結合部位−−−任意的タグ−−−トランスポゾン特異的PCRプライマー配列、または
ビーズ結合部位−−−任意的タグ−−−トランスポゾン特異的PCRプライマー配列。
【0041】
典型的な実施態様において、アダプター指向プライマーは、3’−5’方向および5’−3’方向の両方において以下の構造を有することができる:
シーケンスプライマー結合部位−−−任意的タグ−−−アダプター特異的PCRプライマー配列、または
ビーズ結合部位−−−任意的タグ−−−アダプター特異的PCRプライマー配列。
【0042】
特定の実施態様において、トランスポゾン指向プライマーおよびアダプター指向プライマーの両方は、増幅に使用された場合にサブセットを提供する3’末端における1−10のランダムに選択されたヌクレオチドとともに提供され得る。図1参照。
【0043】
シーケンスプライマー結合部位およびトランスポゾン特異的PCRプライマー配列の長さは、一般的なPCR用途にて慣習的なものであり、すなわち、独立に、約10から約30bpであり、好ましくは15から25bpである。好ましくは、増幅されるアダプター結合配列の一部またはセグメントは、以下に記載されるハイスループットシーケンシング技術を用いて1回の実行で配列決定できる長さに相当する。特定の実施態様において、一部またはセグメントは、約50bpから約500bpの間の長さを有し、好ましくは、約75bpから約300bp、およびより好ましくは約90bpから約250bpの間の長さを有している。上記されるように、この長さは、使用されるシーケンス技術(まだなお開発段階のものを含む)によって変化してよい。
【0044】
このプライマーのセットによる増幅は、マルチプレックス(multiplex)にて標的とされるトランスポゾンの隣接配列の増幅されたアダプター結合制限断片(アンプリコン(amplicon))を提供するだろう。
【0045】
全てのプール次元(pool dimension)を代表するそれぞれのプライマーに固有なタグ配列を含むプライマー(フォワードおよび/またはリバース)を用いて、それぞれのタグ配列の特異的なプール起源がわかる。というのは、シーケンスプライマーがタグ上流にアニールし、結果として、タグ配列がそれぞれの増幅産物に存在するためである。
【0046】
特定の実施態様において、フォワードおよびリバースの両プライマーがタグ付加される。その他の実施態様において、フォワードまたはリバースプライマーの一方のみがタグ付加される。1または2つのタグの中での選択は、状況に依存し、ハイスループットシーケンシング反応のリード長(read−length)および/または独立したバリデーション(validation)の必要性に依存する。例えば一方向性で配列決定される100bpのPCR産物の場合、ただ1つのタグが必要とされる。200bpのPCR産物および100bpのリード長の場合、二重タギングは、二方向性配列決定との組み合わせにおいて、それが2倍の効率の向上をもたらすため有用である。それは更に、同一の工程における独立したバリデーションの可能性を提供する。100bpのPCR産物が2つのタグ付加プライマーにより二方向性で配列決定される場合、方向性(orientation)に関わらず、全ての痕跡は変異についての情報を提供するだろう。それゆえ、両プライマーは、植物がどのような変異を含むかについての「アドレス情報(address information)」を提供する。
【0047】
タグは何れかの数のヌクレオチドとすることができるが、好ましくは2、3、4または5ヌクレオチドを含む。4つのヌクレオチドが並べ替えられる場合、256個のタグが可能である一方で、3つのヌクレオチドが並べ替えられる場合、64個の異なるタグが提供される。使用される例証において、タグは、好ましくは>1塩基だけ異なり、それゆえ、好ましいタグは4bpの長さである。これらのプライマーを用いる増幅は、タグ付加された増幅産物のライブラリーをもたらす。
【0048】
特定の実施態様において、タグのシステムを使用することができ、ここにおいて、増幅工程は、以下の使用を含む:
(1) (a)5’−定常セクション、それに繋がる(b)縮重タグセクション(NNNN)、それに繋がる(c)トランスポゾンまたはアダプター特異的セクション−3’を含む長いプライマー、および
(2) (a)5’−定常セクション、それに繋がる(b)非縮重タグセクション−3’(すなわち、NNNNの中からの選択)から成る、引き続く増幅における短いプライマー。
【0049】
長いプライマーは好ましくは不十分な量(short measure)で使用され、短いプライマーは過剰に使用される。非縮重タグセクションは、それぞれのプールされたサンプルにユニークなものとすることができ、例えば、プールされたサンプル1ではACTGであり、プールされたサンプル2ではAATC等となる。短いプライマーは、長いプライマーのサブセットにアニールする。プライマーの定常セクションは、シーケンスプライマーとして使用できる。ライブラリーは、好ましくは、全ての増幅したプールからの等しい量のPCR産物を含む。例証となる例において、ライブラリーは、それぞれのトランスポゾン挿入部位のために決定される1000植物x100bp=100kb配列を含む。
【0050】
方法の工程(e)において、増幅産物は、好ましくは等量または標準化された量でプールされ、それによって増幅産物のライブラリーが作製されてよい。例示的に、ライブラリーの複雑性は、それぞれのトランスポゾン挿入部位について、1000植物x250−500bp=0.25−0.5Mbであるだろう。
【0051】
ライブラリー中の増幅産物はランダムに断片化され、その後断片が配列決定される。断片化は、物理的技術、例えば、剪断、超音波処理またはその他の断片化方法によって達成できる。
【0052】
工程(g)において、工程(d)または(f)の少なくとも一部しかし好ましくは全ての断片の、少なくとも一部しかし好ましくは全体のヌクレオチド配列が決定される。特定の実施態様において、増幅した産物の断片化工程は任意的である。例えば、シーケンシング技術のリード長およびPCR断片長がほぼ同一の場合、断片化の必要はない。より大きいPCR産物の場合もまた、増幅した産物の断片化は、それらの一部のみが配列決定されることが容認できるならば、必要であってもよい。例えば、500bpのPCR産物および100(それぞれの端から)のリード長の場合、シーケンシングに先立つ断片化が行われない場合300bpが配列決定されないまま残る。断片化の必要性は、シーケンシング技術のリード長が増加することで減少する。
【0053】
シーケンシングは、原則、当該分野において既知の何れかの手段によって行ってよく、例えば、ジデオキシ鎖停止法(dideoxy chain termination method)(サンガー配列決定法)を用いてよい。しかしながら、ハイスループットシーケンシング法を用いて行われるシーケンシングが好ましく且つより有利であり、そのような方法は、例えば、WO 03/004690、WO 03/054142、WO 2004/069849、WO 2004/070005、WO 2004/070007、およびWO 2005/003375(全て454 Life Sciencesの名において)、Seoらによる文献(Proc. Natl. Acad. Sci. USA 101:5488−93(2004))に開示され、およびHelios、Solexa、US Genomics等の技術である(これらは本願に援用される)。現在記述される技術は、1回の実行で4000万塩基までの配列決定が可能であり、競合する技術よりも100倍速くおよび安い。これは、反応当りのリード長の増加および/または並行反応の数の増加とともに増加するだろう。シーケンシング技術は、大まかに、5つの工程から成る:1)DNAの断片化および特異的アダプターのライゲーションにより、一本鎖DNA(ssDNA)のライブラリーを作成する;2)ssDNAのビーズへのアニーリング、油中水マイクロリアクター(water−in−oil microreactors)中でのビーズの乳化、およびエマルジョンPCRを行うことによるビーズ上での個々のssDNA分子の増幅;3)表面に増幅したssDNA分子を含むビーズの選択/濃縮;4)PicoTiterPlate(登録商標)によりDNA保持ビーズの析出;およびピロリン酸光シグナル(pyrophosphate light signal)の生成による、100,000ウェル中での同時シーケンシング。
【0054】
好ましい実施態様において、シーケンシングは以下の工程を含む:
(1)シーケンシング−アダプター−結合断片をビーズにアニーリングさせる、ここにおいて、それぞれのビーズは単一の断片とアニーリングする;
(2)油中水マイクロリアクター中でビーズを乳化する、ここにおいて、油中水マイクロリアクターは単一のビーズを含む;
(3)エマルジョンPCRを行い、ビーズの表面上でアダプター結合断片を増幅する;
(4)増幅したアダプター結合断片を含むビーズを選択/濃縮する;
(6)ウェルにビーズを充填する、ここにおいて、それぞれのウェルは単一のビーズを含む;および
(7)ピロリン酸シグナルを作る。
【0055】
最初の工程(1)において、アダプター結合制限断片に存在するアダプターはビーズにアニールされる。本願において以前に概要を述べたとおり、シーケンシングアダプターは、少なくとも、ビーズへのアニーリングのための「キー」領域、シーケンシングプライマー領域およびPCRプライマー領域を含む。特に、増幅したアダプター結合制限断片は、現在、末端の一方に、以下の配列を含み(5’−シーケンスプライマー結合部位−−−タグ−−−トランスポゾン特異的PCRプライマー配列−3’)、一方、その他の末端には、以下のようなものであってよいセグメントが存在する(5’−ビーズアニーリング配列−−−タグ−−−アダプター特異的配列−−−制限部位特異的配列(任意的)−−−(ランダム)選択的配列(任意的)−3’)。シーケンスプライマー結合部位およびビーズアニーリング配列は互換的であってよいことが明らかであってよい。このビーズアニーリング配列は、現在、ビーズへの断片のアニーリングのために使用でき、ここにおいてビーズは、その末端にヌクレオチド配列を保持する。
【0056】
従って、適用される断片はビーズにアニールされ、ここにおいてそれぞれのビーズは、単一の適用される断片にアニールされる。適用される断片のプールに対して、ビーズは過剰に添加され、過剰量のビーズに対して、ビーズ当り1つの単一の適用される断片のアニーリングが確実にされる(ポアソン分布)。
【0057】
好ましい実施態様において、トランスポゾンスクリーニングの効率を更に増大するために、シーケンシングのためのビーズにて直接的に、トランスポゾン誘導(transposed−derived)PCR産物を増幅することが有益である。これは、アダプター結合PCRプライマーを用いてトランスポゾンPCRを行うことで達成でき、当該プライマーのMseI(またはその他の制限酵素)側におけるアダプターの1つの鎖は、シーケンスビーズに結合したオリゴヌクレオチドに相補的である。それゆえ、シーケンシング反応は、トランスポゾン側から生じると考えられ(シーケンシングはビーズに向かって生じるため)、結果として、トランスポゾンから外側に向かって起こる配列がもたらされる。
【0058】
次の工程において、ビーズは油中水マイクロリアクターにて乳化されるが、それぞれの油中水マイクロリアクターは単一のビーズを含む。PCR試薬は、油中水マイクロリアクター中に存在しており、マイクロリアクター中で行われるPCR反応を可能とする。引き続いて、マイクロリアクターは壊され、DNAを含むビーズ(DNA陽性ビーズ)が濃縮される。
【0059】
続く工程において、ビーズはウェルに充填され、ここにおいて、それぞれのウェルは単一のビーズを含む。ウェルは好ましくはPicoTiter(商標)Plateの一部であり、大量の断片の同時配列決定を可能にする。
【0060】
酵素保持ビーズの添加の後、断片の配列はパイロシーケンシング(pyrosequencing)を用いて決定される。連続的な工程において、PicoTiter(商標)Plateおよびビーズならびにその中の酵素ビーズは、従来のシーケンシング試薬の存在下で異なるデオキシリボヌクレオチドにさらされ、デオキシリボヌクレオチドの取り込みにより、光シグナルが作られ記録される。正しいヌクレオチドの取り込みは、検出可能なパイロシーケンシングシグナルを作り出すだろう。
【0061】
Pyrosequencing自体は当該分野において既知であり、とりわけwww.biotagebio.com、www.pyrosequencing.com / section technologyに記載される。技術は更に、例えば、WO 03/004690、WO 03/054142、WO 2004/069849、WO 2004/070005、WO 2004/070007、およびWO 2005/003375(全て454 Life Sciencesの名において)に記載のものが適用され、これらは本願に援用される。
【0062】
シーケンシングの後、シーケンシング工程から直接得られる断片の配列は、好ましくはin cilicoで整理され、何れかのビーズアニーリング配列、シーケンシングプライマー、アダプターまたはトランスポゾン関連配列情報が除去される。これは、次の工程において、データベースからの既知の配列とのよりよいアラインメントをもたらし、何れかの考えられるヒットが同定される可能性がある。これをin silicoで行うために、タグから提供される情報は、分離したデータベースフィールドに保存され、それにより、後に、発見された変異遺伝子はDNAプール中のアドレスにつなげられる。
【0063】
典型的に、アラインメントまたはクラスター形成は、何れかの付加されたアダプター/プライマーおよび/または識別子配列のために整理された配列データに基づいて行われ、すなわち、核酸サンプルに由来する断片の配列データのみを用いて行われる。
【0064】
比較目的のための配列のアラインメント方法は当該分野において周知である。様々なプログラムおよびアラインメントアルゴリズムは以下の文献に記載されている:SmithおよびWaterman(Adv. Appl. Math. 2:482(1981));NeedlemanおよびWunsch(J. Mol. Biol. 48:443(1970));PearsonおよびLipman(Proc. Natl. Acad. Sci. USA 85:2444(1988));HigginsおよびSharp(Gene 73:237−244(1988));HigginsおよびSharp(CABIOS 5:151−153(1989));Corpetら(Nucl. Acids Res. 16:10881−90(1988));Huangら(Computer Appl. in the Biosci. 8:155−65(1992));およびPearsonら(Meth. Mol. Biol. 24:307−31(1994))(これらは本願に援用される)。Altschulらの文献(Nature Genet. 6:119−29(1994))(本願に援用される)は、配列アラインメント法および相同性計算法の詳細な考察を示している。
【0065】
NCBI Basic Local Alignment Search Tool (BLAST) (Altschulら、1990)は、National Center for Biological Information (NCBI、ベセズダ、Md.)およびインターネットを含む幾つかのソースから、配列分析プログラムblastp、blastn、blastx、tblastnおよびtblastxとの組み合わせにおける使用のために利用できる。それは、http://www.ncbi.nlm.nih.gov/BLAST/からアクセスできる。このプログラムを使用してどのように配列同一性を決定するかという記述は、http://www.ncbi.nlm.nih.gov/BLAST/blast_help.htmlにて利用できる。データベースは、好ましくは、EST配列、関心ある種のゲノム配列および/またはGenBankの非重複配列データベース、または同様の配列データベースを含む。
【0066】
ハイスループットシーケンシング法は、Shendureらによる文献(Science, Vol 309, Issue 5741, 1728−1732)に記載されるとおりに使用できる。その例は、微小電気泳動シーケンシング(microelectrophoretic sequencing)、ハイブリダイゼーションシーケンシング/ハイブリダイゼーション(SBH)によるシーケンシング、増幅された分子のサイクリック−アレイシーケンシング(cyclic−array sequencing)、単一分子のサイクリック−アレイシーケンシング、非周期的、単一分子、リアルタイム方法、例えば、ポリメラーゼシーケンシング、エキソヌクレアーゼシーケンシング、ナノポアシーケンシングである。
【0067】
最適な結果のために、断片または増幅した産物は十分な重複性(redundancy)で配列決定されることは興味深い。重複性は、シーケンシングのエラーと真のゲノム配列との間の区別を作ることができるものである。特定の実施態様において、シーケンシングの重複性は、好ましくは少なくとも4、より好ましくは少なくとも5であるが、例示からわかるように、6を越える、好ましくは8を越えるまたは10を越える重複性でさえ、発明の概念に必須ではないものの、有利であると考えられる。
【0068】
本方法の工程(i)において、データベース中でヒットし、それゆえ関心ある遺伝子または表現型とつなげられてよい断片が同定される。この情報に基づいて、タグは、プールおよび/または植物の同定のために使用できる。データベースでのヒットに基づいて、プローブは、関心ある遺伝子の同定を可能にするよう設計される。
【実施例】
【0069】
本発明は、原則の例証を提供する以下の例によって例証される。トランスポゾン集団のスクリーニングは、新規のハイスループットシーケンシング方法(例えば454 Life Sciencesのもの)を用いて進められる。現在の最高水準の技術で、454 Life Sciences技術は1回のシーケンシング行程で約最高40Mbの配列をもたらす。リード長の現在の限界は約100−200bp/リードである。平均200のトランスポゾンを有している3072の植物からなる集団をスクリーニングして、特定の遺伝子のトランスポゾンタギングを同定することを想定して、以下のアプローチがとられる:
1)トランスポゾン集団の3072の植物のゲノムDNAが単離される;
2)植物当りの等量のDNAの三次元プーリングスキームが設定され(例えば15x15x14)、3072/14=219または3072/15=205の異なるDNAサンプルを含む44のプール(15+15+14=44)がもたらされる(Vandenbusscheら、2003);このプーリング工程は、配列データからの直接の挿入を含む個々の植物の同定を可能とするのに役立つ。ゲノムDNAのプーリングは、更に、PCR増幅の前にDNAを標準化し、全てのDNAが配列ライブラリーにて等しく見受けられる可能性を増加させることに役立つ;
3)アダプター結合制限断片テンプレート(AFLPテンプレート、EP534858、Vos らNAR 1995, 23, 4407参照)は、250−500bpごとにゲノムを切断する単一の制限酵素を使用して(例えば4−または5カッターを使用して、例えばMseI)、全ての44のプールされたDNAから作られた;
4)一方向性PCR増幅を、トランスポゾン配列の境界に位置して外方向に向くPCRプライマーおよび非選択的アダプタープライマーを使用して実行し、マルチプレックスで全てのトランスポゾンの隣接配列を増幅する。200のトランスポゾンを含む植物につき、これは、境界側につき200×約250bp=50kbの隣接配列をもたらし、その20kbは、100bpリード長の場合に配列決定されるだろう。3072の植物のために、これは153Mb隣接配列に等しく、その61Mbが、100bpの配列リード長の場合に配列決定可能である;
5)全ての44ウェルからのPCR産物の等量は、プールされたPCR産物ライブラリーを構築するためにプールされる;
6)プールされたPCR産物ライブラリーは、PCR産物の更なる分画を行うことなく、454 Life Sciences合成による配列決定技術(sequencing−by−synthesis technology)を使用して、配列決定される。出力は、約200,000の100bp配列であり、3072の植物の全ての隣接配列の平均の0.33X(20/61Mb)被覆度(coverage)を意味する。それゆえ、少なくとも3回の配列決定行程が、全3072の植物の隣接配列の非常に大多数を標的とするために必要である;
7)結果として生じる配列をBLAST検索し、ESTまたはゲノム配列とのヒットを同定する;
8)関心ある遺伝子にトランスポゾン挿入を保持している植物をそれらのタグに基づいて同定し、任意にプローブまたはPCRプライマーを作製し確認する。
【0070】
例1:
1000ペチュニアW138植物の集団を、Vandenbusscheらの文献(2003)またはその他の文献の記載の通りに3次元戦略にそってサンプル取得し、3つの座標で集団全体の全ての個体を網羅する、30のプールされたサンプル(X1−X10、Y1−Y10およびZ1−Z10)を得た。これは、何れかの特定のPCR産物の起源を、集団内の起源の植物に突き止めることを可能にする。
【0071】
次に、トランスポゾン内で切断する酵素および隣接ゲノムDNAにて特異的であるがランダムな位置で切断する酵素によって、DNAサンプルを消化した。
【0072】
アダプターを結合させて、全ての設計された断片の引き続くPCR増幅を可能にした。ビオチン化アダプターは内部トランスポゾン部位に結合させた。
【0073】
次に、DNAサンプルを精製し、ストレプトアビジンビーズを添加しおよびマグネットを使用して、ビオチン化断片を回収した。
【0074】
全てのDNAプールに存在する全てのトランスポゾン挿入からの全ての隣接配列を、次に、改良したトランスポゾンディスプレイプロトコールを用いて増幅した(VandenBroeckら、1998)。
【0075】
サンプル中の全てのプールされたサンプル、X1−X10、Y1−Y10およびZ1−Z10のために、その5’末端(3D−タグ)において4ヌクレオチドとして相当するプール座標を取り込んで、異なるトランスポゾンプライマーを使用した。
【0076】
全てのPCR産物は、引き続いて、3つのスーパープール(それぞれの次元のために1つ)にプールし、当該分野にて記述される方法にそったサンプルの標準化を可能とした;この工程に伴い、全ての個体に存在しおよびそのため全てのサンプルに存在する断片は、発生率が減少する。このことは、配列決定しようとするサンプルにおける断片の過剰な提示を予防する。
【0077】
得られた一本鎖分子のコレクションを、MunIサイトを有する特異的プライマーを用いてPCR増幅を1回行うことにより、二本鎖分子に変換した。
【0078】
更なる増幅または直接454(G20)シーケンシングの何れかを可能とするアダプター配列の引き続くライゲーションを可能にするために、得られた産物をMunI/MseIを用いて消化した。
【0079】
3つのサンプルを、次に、1つのスーパープールにプールし、製造者により記載される通りにRoche GS20/454シーケンシング法に供した。
【0080】
トランスポゾンディスプレイによるトランスポゾン隣接配列の増幅および引き続く1000植物の集団からのハイスループットシーケンシングのために、プロトコールを開発した。
【0081】
方法の概要
方法の概要は以下の通りである:
DNA調製(3D様式で標本抽出される1000の植物、30のプールされたDNAに帰着する);
MunI/MseI消化(約5μgのプールされたDNA);
Bio−Mun及びMseアダプターライゲーション連結;
精製(PCR精製カラム、bio−Munアダプターおよび非常に小さい断片の除去);
ビーズ抽出(Mun/Mse断片の濃縮);
トランスポゾンディスプレイPCR増幅:
MunACAC及びMse+0プライマーによる予備増幅(トランスポゾン隣接配列の濃縮);
プールされた特異的なIR**outw及びMse+0プライマーによる選択的PCR(トランスポゾン隣接配列の増幅);
「ブロック(Block)」、「ロウ」および「カラム」プールへの第2のプーリング;
標準化;
二本鎖分子への転換;
MunI/MseI消化;
454−Mun−B及び454−Mse−Aアダプターライゲーション;
bio−AmpB及びAmpAプライマーによるPCR増幅;
1サンプルへの最終的なプーリング;
454シーケンシング。
【0082】
DNA調製
3D様式で標本抽出される1000の植物から、それぞれ100植物を代表する30のDNAサンプルがもたらされる;方法は、Vandenbusscheら、Plant Cell 15 (11): 2680−2693 (2003)による。
【0083】
MunI/MseI消化(約5μg)30サンプル
【表1】

【0084】
アダプターライゲーション
【表2】

【0085】
アダプター配列:
MunI(bio)アダプター:bio−5’−CTCGTAGACTGCGTACG−3’
3’−CTGACGCATGCTTAA−5’
MseIアダプター:5’−GACGATGAGTCCTGAG−3’
3’−TACTCAGGACTCAT−5’
【0086】
精製 30サンプル
QuiagenPCR増幅キットを用いたDNAの精製。55μlのEB緩衝液で溶出(1.5%アガロースゲル上で5μl)。
【0087】
ビーズ抽出 30サンプル
200μlSTEXにて25μlストレプトアビジンビーズ(約0.1mgMyOneビーズ、ストレプトアビジンC1)を1回洗浄、および100μl結合緩衝液に再懸濁。
【表3】

【0088】
100μlの希釈した(および洗浄した)ストレプトアビジンビーズを500μlの制限/ライゲーション混合物に添加、および60分間ローテーターで室温にてインキュベート。マグネットを用いてビーズを回収、および上清を除去。200μlSTEXでビーズを洗浄、および別のチューブに移す。200μlのSTEXでビーズを3回洗浄、および最終的に50μlのT01Eに再懸濁、別のチューブに移す(STEXウェルを除去)。
【表4】

【0089】
トランスポゾンディスプレイPCR増幅:予備増幅 30サンプル
2μlのテンプレートDNAを取り(ビーズウェルを混合、DNA断片をなお回収)および以下のミックスを混合、
【表5】

【0090】
および、以下のPCRプロファイルに従ってインキュベート(PE9600)
【表6】

【0091】
プライマー配列:
MunI+ACAC:5’−AGACTGTGTACGAATTGACAC−3’
MseI+0 :5’−GACGATGAGTCCTGAGTAA−3’
1.5%アガロースゲル上で5μlを分析、および水で10倍にサンプルを希釈、選択的PCR増幅を実行。
【0092】
トランスポゾンディスプレイPCR増幅:
選択的増幅 30サンプル
5μlのテンプレートDNAを取得、および以下のミックスを添加。
【表7】

【0093】
および、それらを以下のPCRプロファイルにそってインキュベート(PE9600)。
【表8】

【0094】
プライマー配列:
IRoutw 5’−CATATATTAANNNNGTAGCTCCGCCCCTG−3’
全てのプールされたサンプルは、NNNN位置で特定されるユニークなIRoutwプライマーで増幅する;これは、得られた配列を、それらの起源の座標に割り当てることを可能にする。
MseI+0: 5’−GACGATGAGTCCTGAGTAA−3’。
【0095】
第2のプーリング 30サンプルを3サンプルに
それぞれの次元由来の10サンプルからのPCR産物をプールし、3サンプルを作製:カラム/ロウ/ブロック。
【0096】
標準化
多くのまたは全ての個体に共有される断片の背景(backdrop)に対するユニークな断片の量を強化するために、第2のプールされたサンプルを、従来の既知の方法に基づいて標準化する。方法は、一本鎖分子を得るための、ハイブリダイゼーションおよび精製工程を含む。
【0097】
ハイブリダイゼーション (それぞれのサンプル当り約10μg) 3サンプル
プールされたサンプルのDNAの沈殿、および15−35μlに溶解
15μlのホルムアミドに添加(相対的量):
4.5μl TE
3 μl H
鉱油の下で80℃まで3分間加熱
添加 3μl 緩衝液A
4.5μl H
プローブO/Nを30℃でインキュベート
【表9】

【0098】
HAPクロマトグラフィーで精製 3サンプル
一本鎖分子を、de Fatima Bonaldoら、Genome Research, 6: 791−806 (1996)に記載されるとおりに、標準的HAPクロマトグラフィーにて選択し、引き続いて2本鎖分子に変換する。
【0099】
2本鎖分子への変換 3サンプル
「Mse+0およびMunサイト」プライマーにて1回PCRサイクル
50μlプライマーに以下のミックスを添加
【表10】

【0100】
プライマー配列:
MIBUS796:5’−CATATACAATTGGACGATGAGTCCTGAGTAA−3’
および、以下のプロファイルに従ってそれらをインキュベート(PE9600):
【表11】

【0101】
MunI/Mse消化 3サンプル
【表12】

【0102】
454アダプターライゲーション
【表13】

【0103】
アダプター配列
Mun IアダプターB:
MIBUS803
5’−CCTATCCCCTGTGTGCCTTGCCTATCCCCTGTTGCGTGTCTCAG−3’
MIBUS795
3’−AGGGGACACACGGAACGGATAGGGGACAACGCACAGAGTCTTAA−5’
MseIアダプターA:
MIBUS800
5’−CCATCTCATCCCTGCGTGTCCCATCTGTTCCCTCCCTGTCTCAG−3’
MIBUS801
3’−GAGTAGGGACGCACAGGGTAGACAAGGGAGGGACAGAGTCAT−5’。
【0104】
454配列のためのPCR増幅 3サンプル
増幅アダプタープライマーAおよびB:
MIBUS803 bio−5’−CCTATCCCCTGTGTGCCTTG−3’
MIBUS802 5’−CCATCTCATCCCTGCGTGTC−3’。
【0105】
最終プーリング 3サンプルを1サンプルに
ハイスループットシーケンシングに備えて、サンプルをプールし、1スーパープールを作製。
【0106】
454シーケンシング 1サンプル
挿入サイズ分布試験のためのpGEM−Tクローニング 1サンプル
標準化方法の効率を試験するため、我々は、サイズ分布の決定のためにランダムに22の断片を単離した。1μl PCRミックス(454シーケンシングのためのスーパープールサンプル由来)を取る
以下を添加
【表14】

【0107】
インキュベート:3時間、37℃
E.coli(DH5α細胞)へ形質転換
LBAmpプレートに100μlをまく
インキュベート:o/n、37℃
22コロニーをひろう
AmpA/AmpBプライマーを用いて、煮沸したプレップにてPCRを実行
および、2%アガロースゲルで泳動。
【0108】
結果:
平均102塩基対の318.000配列タグのデータベースを得た。230.000配列のサブセットは、3つのレベルに完全に並べられた:
1)トランスポゾンの逆方向反復に隣接する(CCGCCCCTGで終了する)、配列の配列同一性。同一の挿入を同定する全ての配列は1つのグループとみなされる。
2)それぞれのグループ内にて、配列を、それらの5’配列における異なる3Dタグに従って並べる。
【0109】
3)グループに属す配列のコピー数に従って。
データは、(全318.000配列の)230.000の並べられた配列由来の20%の分析に基づいて推定した。分析は、図1から9に示される。
【表15】

【図面の簡単な説明】
【0110】
【図1】ユニークなゲノム配列からなる(右から左)、dtph1トランスポゾン隣接配列、配列タグの一般的組み立ての分布分析における、トランスポゾン(逆方向反復)配列および3Dタグが記述される。100の植物の集団は、3D格子(10*10*10)によって組織化され、ここにおいて、各々の植物は、x、yおよびz軸に沿ってその位置を反映するユニークな3D座標(x,y,z)によって同定される。次元X1からX10は、配列タグ番号1から10に相当し、YおよびZも同様である。図中のタグコードは、配列名におけるタグ#に言い換えられ、例えば、AGACはtag07に相当する。画像は、プール座標(3、17、24)とともに、植物における3Dヒットを表す。
【図2】図2は、挿入隣接配列データベースに対する、特異的な遺伝子配列、ペチュニア転写制御因子NAM−like 3遺伝子(頂端分裂組織同類でない、gj|21105733|gb|AF509866.1)でのblast検索の結果を示す;挿入ヒットは、座標2、12、30で同定される。この結果は、特異的な相同的コード配列の挿入を追跡できることを実証する。
【図3】図3は、データベースに対する、特異的だが異種性の遺伝子配列(シロイヌナズナAGL62 MADSボックス遺伝子)のblast検索の結果を記述する;挿入ヒットは、植物9、17、29で同定される;このヒットは、ペチュニアにおいてこれまで未知の潜在的MADSボックス遺伝子およびその対応する変異体を指定する。この結果は、特異的な異種性コード配列の挿入が効率よく追跡されることを実証する。
【図4】図4は、配列分析を提供する。ここにおいて、利用できる318.000の配列のうちの230.000のサブセットは、3つのレベルによって完全に順序付けられる:1) 隣接配列の配列同一性(挿入部位に従って順序付けられる)。同じ挿入を同定する全ての配列は、1つの群と呼ばれる。
【0111】
2) 群内で、それらの異なる3D配列タグに従う。
【0112】
3) 群に属す配列のコピー数に従う。
【0113】
以下のグラフは、(合計318.000の配列の)230.000の順序付けられた配列から、20%の分析に基づいて推定された。これらのグラフの解釈を促進するため、配列の3群がこの図に示され、3つの独立したトランスポゾン挿入部位が表される。第1の例は、位置5−8にわたるそれぞれの3Dタグ、それに続く、位置22で終了するトランスポゾンの逆方向反復、それに続くゲノム遺伝子のストレッチとともに、4つの配列を同定する。座標6−20−29は、この配列を、集団のその特定の座標で植物に属すると定義する。Tag01からtag10:X次元、Tag11からtag20:Y次元、Tag21からtag30:Z次元。
【図5】図5は、相対的な次元分布対コピー数発生率の図示を提供する。
【図6】3つのコピーを有する3500の配列タグのうち294は3つのユニークな座標を有しており、このことは、これらが、これらの配列をそれらの起源の植物に遡って追跡できたことを意味する。その他のコピークラスのために、それらの数は4−コピークラスのための532;5−コピークラスのための622;6−コピークラスのための478;および残りのクラスのための1500であった。このことは、全体で、3000を越える配列タグが同定され(利用できる318.000のうちの230.000から)、それらの起源の植物に戻って関連があることを意味する。
【図7】図7は、3D 454トランスポゾンライブラリーの配列の全推定された3Dヒット番号および総数に対する、4つのコピー数クラスおよびそれらの相対的な寄与を表す。
【図8】図8は、#挿入部位の数(群)対コピー数(完全な範囲)を示す。配列タグ当りのコピー数の分析は、分析したサブセットの230.000のなかで、ほぼ16.000のユニークな断片が存在し;7500の断片は2コピーを有し;3500は3コピーを有し;2500は4コピーを有し;1500は5コピーを有し;1000は6コピーを有し;1350は7または8コピーを有し;1100は9−11コピーを有した;1400は12−20コピーを有し;950は21−40コピーを有し;一方で残余が残りのコピーを有することを示している。
【図9】図9は、一部の結果の図示を提供する。253.394の配列のサブセット(合計318.000)が分析され、配列の1%のみが、認識可能なタグを含まなかった(??で示す、右カラム)。230.000配列タグのサブセットの20%の分析は、集団の異なるプールされたサンプル上の配列タグの良好な分布を示し、および座標23の6000以上から座標15のほぼ30.000までにわたった;平均は約8500であった。断片の1%未満は、特異的な座標への割り当てができなかった。
【図10】図10は、タグおよびビーズアニーリング配列を保持するアダプター指向プライマーおよびトランスポゾン指向プライマーを使用する、MseI−ECORI制限断片にて標的とされるトランスポゾンの略図である。
【図11】図11は、ビーズアニーリング配列(B)を介して、ビーズにアニールした増幅されたアダプター結合断片の略図である。断片は、タグ(T1および/またはT2)、アダプター(AD)、制限部位(RE)の最終的な残り、断片自体の配列(SEQ)、トランスポゾン特異的プライマー配列(TR)およびシーケンシング工程の開始のために使用される、シーケンスプライマー結合部位(SPBS)を含む。

【特許請求の範囲】
【請求項1】
以下の工程を含む、トランスポゾン集団のメンバーにおける関心ある遺伝子または配列に関連した挿入の同定のための方法:
(a) 個々にまたはプール中にて、トランスポゾン集団のゲノムDNAを単離すること;
(b) 任意に、工程(a)で得られるDNAをプールすること;
(c) 1以上、好ましくは2以上、最も好ましくは2つの制限酵素(好ましくはその少なくとも1つが、トランスポゾンを切断しない高頻度切断制限エンドヌクレアーゼであり、好ましくは少なくとも1つが、トランスポゾンで切断する希少切断制限酵素である)を使用してDNAを制限処理し、制限断片にアダプターを結合し、それによってアダプター結合制限断片を作製すること;
(d) 一対の(任意に、ラベルした)プライマーを用いてアダプター結合制限断片を増幅すること、ここにおいて、プライマーの1つは、(既知の)トランスポゾン配列の一部に相補的(ハイブリダイズ可能)であるセクションを含み、更にシーケンスプライマー結合部位を含み、ここにおいて他方のプライマーは少なくともアダプターに相補的であり、ここにおいて一方または両方のプライマーはタグを含む;
(e) 任意に、工程(d)の増幅産物をプールし、増幅産物のライブラリーを構築すること;
(f) 任意に、ライブラリー中の増幅産物を断片化すること;
(g) ハイスループットシーケンシングを使用して、(d)、(e)または(f)の断片のヌクレオチド配列を決定すること;
(h) 任意に、in silicoで断片の配列を整え、それによって何れかのアダプターおよび/またはトランスポゾンに関連した配列情報を削除すること;
(i) データベースからヌクレオチド配列をアライニングできる、工程(g)または(h)の1以上の断片を同定し、それによってデータベースからのヌクレオチド配列と関心ある表現型との相関関係を示すこと;
(j) 工程(i)の断片を含んでいるトランスポゾン集団のメンバーを同定すること;
(k) 任意に、工程(i)の断片に基づいてプローブまたはPCRプライマーペアを設計し、およびそれを使用して(j)で同定されたメンバーのゲノムの関心ある遺伝子におけるトランスポゾン挿入を確認すること。
【請求項2】
請求項1に記載の方法であって、前記プーリングが3Dプーリング戦略である方法。
【請求項3】
請求項1または2に記載の方法であって、前記データベースが、EST配列、関心ある種のゲノム配列および/またはGenBankの非重複配列データベース、または同様の配列データベースを含む方法。
【請求項4】
請求項1から3の何れか1項に記載の方法であって、前記ハイスループットシーケンシングが、好ましくはキャピラリー電気泳動法による、サンガーシーケンシングに基づく方法。
【請求項5】
請求項1から3の何れか1項に記載の方法であって、前記ハイスループットシーケンシングは、合成による配列決定、好ましくはパイロシーケンシングである方法。
【請求項6】
請求項1から4の何れか1項に記載の方法であって、前記シーケンシングがビーズといった固体担体にて行われる方法。
【請求項7】
請求項6に記載の方法であって、前記シーケンシングが以下の工程を含む方法:
(1)シーケンシング−アダプター−結合断片をビーズにアニーリングさせる、ここにおいて、それぞれのビーズは単一の断片とアニーリングする;
(2)油中水マイクロリアクター中でビーズを乳化する、ここにおいて、油中水マイクロリアクターは単一のビーズを含む;
(3)エマルジョンPCRを行い、ビーズの表面上でアダプター結合断片を増幅する;
(4)増幅したアダプター結合断片を含むビーズを選択/濃縮する;
(6)ウェルにビーズを充填する、ここにおいて、それぞれのウェルは単一のビーズを含む;および
(7)ピロリン酸シグナルを作る。
【請求項8】
請求項1から7の何れか1項に記載の方法であって、前記プライマーの少なくとも1つが、1以上の結合親和性の増大したヌクレオチドを含む方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate


【公表番号】特表2009−515518(P2009−515518A)
【公表日】平成21年4月16日(2009.4.16)
【国際特許分類】
【出願番号】特願2008−539949(P2008−539949)
【出願日】平成18年11月8日(2006.11.8)
【国際出願番号】PCT/NL2006/000561
【国際公開番号】WO2007/055568
【国際公開日】平成19年5月18日(2007.5.18)
【出願人】(505477187)ケイヘーネ・エヌ・ブイ (10)
【Fターム(参考)】