トランスポゾンタギング集団のハイスループットスクリーニングおよび挿入部位の大規模並行配列特定のための方法

トランスポゾン集団中の遺伝子の同定のための方法であって、ゲノムＤＮＡの単離、任意的なＤＮＡのプーリング、酵素を用いたプール中のＤＮＡの制限処理、アダプターのライゲーション、プライマーによるアダプター結合断片の増幅（ここにおいて、プライマーの１つは、幅広いトランスポゾン配列に相補的なプライマーである）、断片のハイスループットシーケンシング、断片とデータベース中の既知の配列とのアラインメント、およびそれによる遺伝子候補の同定を含む方法。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、分子生物学および遺伝学の分野に関する。本発明は、ハイスループット配列決定技術の使用に基づく、集団中の遺伝子の変異を同定するための改善された戦略に関する。
【背景技術】
【０００２】
トランスポゾンタギング集団は、逆遺伝学アプローチにより農学的または一般的重要性の特性に影響する遺伝子を特定するために、現代的植物遺伝学研究において使用される。
【０００３】
それらは遺伝子発見のための補完的手段を意味し、それは、トランスポゾン集団が、一般に、観察される表現型の原因となる遺伝子を同定するために使用される（いわゆる正遺伝学（ｆｏｒｗａｒｄｇｅｎｅｔｉｃｓ）アプローチ）ためである。これは、当該分野において逆遺伝学アプローチと区別され、当該アプローチでは、変異性の事象が関心ある配列（遺伝子）にて同定される。当該方法の律速段階は、関心ある遺伝子または配列における変異を保持する個体の同定に関連するスクリーニング作業である。以下に、トランスポゾン集団の原理およびスクリーニング方法をより詳細に記述し、遺伝子発見のためのこれらの手段の価値を増大させる、より効率的なスクリーニング方法を提示する。
【０００４】
トランスポゾンは、ゲノム中において多コピーで天然にまたは人工的に生じる、転移性の遺伝因子である。ゲノムにおけるそれらの位置は、通常生活環の何れの所定の瞬間においても、切除および新しい部位への挿入により変化することができるため、それらは不安定である。トランスポゾン集団は遺伝子発見にとって価値があるが、それは、それらが遺伝子配列またはそれらの調節領域に挿入された場合に、遺伝子の機能を破壊するためである。作物育種で使用される多くのトランスポゾンの配列は既知であるが、一旦興味深い表現型を有する植物が観察されると、どの遺伝子がトランスポゾン挿入によって影響を受けたかわからない。一般に、トランスポゾンが表現型の原因となるのか、および、なるとすれば、どのトランスポゾンが表現型の原因となるのかということも未知である。生物およびトランスポゾンに依存して、トランスポゾン集団中のトランスポゾンコピー数は、植物につき数十から数百のトランスポゾンにわたる。
【０００５】
トランスポゾン誘導性表現型変異配列の分析のための現代のスクリーニング法は、配列特異的トランスポゾン挿入部位の隣接配列を得るための、連鎖ＰＣＲに基づく方法（ｌｉｎｋｅｄ−ＰＣＲｂａｓｅｄｍｅｔｈｏｄｓ）を含む。リンカーＰＣＲの限界は、隣接配列の決定に、シーケンスゲルからのバンド切り出しが必要となることであり、これは、時間を消費し、自動化が困難であり、および、相対的にロースループット（数千ものバンドに容易に適用することができない）である。
【０００６】
トランスポゾン集団のスクリーニングは、単純な方法が、ゲノムに挿入されたトランスポゾンの全てまたは少なくとも一部の隣接配列を収集するために利用できるようになることで、改善されると考えられる。
【発明の開示】
【０００７】
［定義］
以下の説明および例において、多くの用語が使用される。そのような用語が与えられるべき範囲を含む、明細書および特許請求の範囲の明確でおよび一貫した理解を提供するために、以下の定義が提供される。本願中で特別定義される場合を除き、使用される全ての技術的および科学的用語は、本発明が属する分野の当業者が通常理解する意味と同一の意味を有する。全ての文献、特許出願、特許およびその他の参考文献の開示は、その全てが本願に援用される。
【０００８】
トランスポゾン：トランスポゾンは、単一細胞のゲノム内の異なる位置を動き回る（いわゆるトランスポジション（ｔｒａｎｓｐｏｓｉｔｉｏｎ）の工程）ことができるＤＮＡの配列である。当該工程において、これらは、変異を引き起こし、ゲノム中のＤＮＡの量を変化させることができる。トランスポゾンはまた、「ジャンピング遺伝子」または「可動性遺伝因子」と呼ばれる。様々な可動性遺伝子因子が存在する：それらは、それらのトランスポジションの機構に基づいて分類できる。クラスＩ可動性遺伝因子、またはレトロトランスポゾンは、ＲＮＡに転写され、その後逆転写酵素によってＤＮＡに戻されることによりゲノム中を移動する。一方、クラスＩＩ可動性遺伝因子は、ゲノム中においてそれらを「カット・アンド・ペースト」するトランスポザーゼを用いて、ゲノム内をある位置から別の位置へと直接移動する。トランスポジションは、転移因子の１コピーがドナー部位に残り、別のコピーが標的部位に挿入されるという複製的となることができ；または、トランスポジションは、転移因子が１部位から切り出され、別の部位に挿入されるというように、保存的に生じ得る。当該用語は、原核生物で見つかる転移因子（例えば、挿入配列（ＩＳ）、トランスポゾン（Ｔｎ））またはバクテリオファージで見つかる転移因子（ＭｕおよびＤ１０８）を含むが、これらに限定されない。真核生物の転移因子は、Ｄ．メラノガスターで見つかるコピア因子；酵母で見つかるようなＴＹ因子；シロイヌナズナで見つかるようなＴａ１およびＴｎｔ１転移因子；マウスで見つかるＩＡＰ；キンギョソウで見つかるようなＴａｍまたはＣｉｎ転移因子；およびトウモロコシで見つかるようなＡＣ、Ｓｐｍ、Ｂｓ、Ｃｉｎ、Ｄｔおよびミューテーター遺転移因子を含むが、これらに限定されない。当該用語は、また、自身を複製的または保存的の何れかによって宿主ゲノム内に挿入でき、そのゲノムからのトランスポジションまたは切り出しが人為的処置により調節できる、合成転移因子を含む。例えば、合成転移因子は、機能的なトランスポゼース（トランスポジションを仲介する酵素）を欠いているが、トランスポゼース遺伝子を誘導可能プロモーターに実施可能的につなぐことで、トランスで供給されるよう構築することができる。
【０００９】
トランスポゾン集団：一生物（普通植物であるが、ショウジョウバエおよびマウスといったその他の生物もまた可能である）由来の個体の集団であって、それぞれがそのゲノム中に多数のトランスポゾンを保持し、トランスポゾンのそれぞれが１以上の遺伝子に影響を及ぼし、異なる表現がたもたらされる可能性がある集団。典型的に、トランスポゾン集団は、表現型の特性において不安定性を示す個体または変種から選択して得ることができる。トランスポゾン集団は、サイズにおいて広く異なってよく、特定の目的のために、本来の集団の９０、８０、７０、６０、５０、４０、３０％またはわずか２０％を含む、部分的集団を使用することができる。
【００１０】
タグ：プライマーに付加でき若しくはその配列に含む得ることができ、またはさもなければラベルとして使用されユニークな識別子を提供できる短い配列。そのような配列識別子は、特異的核酸サンプルを同定するために一意的に使用される、異なるが定められた長さのユニークな塩基配列でありえる。例えば、４ｂｐタグは４（ｅｘｐ４）＝２５６通りの異なるタグをもたらし得る。典型例は、当該分野で既知のＺＩＰ配列である（Ｉａｎｎｏｎｅｅｔａｌ．Ｃｙｔｏｍｅｔｒｙ３９：１３１−１４０，２０００）。そのようなタグを用いて、ＰＣＲサンプルの起源を、更なるプロセシングにおいて決定することができる。異なる核酸サンプルを由来とする処理を受けた産物を組み合わせる場合、異なる核酸サンプルは、異なるタグを用いて遺伝的に同定される。本発明の場合、ユニークな配列タグの付加は、配列増幅産物のプールにおける個々の植物の座標（ｃｏ−ｏｒｄｉｎａｔｅｓ）を同定することに役だつ。マルチプルタグが使用できる。
【００１１】
タギング：第２のまたは更なる核酸から区別できるようにするために、タグまたはラベルを核酸に付加する工程を意味する。タギングは、例えば、タグ付加したプライマーの使用による増幅の際における配列識別子の付加により、または当該分野において既知の何れかのその他の方法により行うことができる。
【００１２】
制限エンドヌクレアーゼ：制限エンドヌクレアーゼまたは制限酵素は、二本鎖ＤＮＡ分子における特異的核酸配列（標的部位）を認識し、全ての標的部位においてＤＮＡ分子の両鎖を切断するであろう酵素である。
【００１３】
制限断片：制限エンドヌクレアーゼでの消化によって作られるＤＮＡ分子は、制限断片と称される。何れかの所定のゲノム（または、その起源（ｏｒｉｇｉｎ）に関わらず、核酸）は、特定の制限エンドヌクレアーゼにより、制限断片の別々のセットに消化されるだろう。制限エンドヌクレアーゼ切断によるＤＮＡ断片は、さらに、様々な技術に使用でき、例えば、ゲル電気泳動によって検出できる。
【００１４】
ライゲーション：２つの二本鎖ＤＮＡ分子を互いに共有結合させる、ライゲース酵素により触媒される酵素反応は、ライゲーションと称される。一般に、両ＤＮＡ鎖は互いに共有結合されるが、鎖の末端の１つの化学的または酵素的修飾によって、２つの鎖の１つのライゲーションを防止することも可能である。その場合、共有結合は、２つのＤＮＡ鎖の１つのみにて生じるだろう。
【００１５】
合成オリゴヌクレオチド：化学的に合成できる、好ましくは約１０から約５０塩基を有する一本鎖ＤＮＡ分子は、合成オリゴヌクレオチドと称される。一般に、これらの合成ＤＮＡ分子は、ユニークまたは所望の核酸配列を有するよう設計されるが、関連した配列を有し、および核酸内の特異的位置で異なる核酸組成を有する分子のファミリーを合成することができる。合成オリゴヌクレオチドという用語は、設計されたまたは所望のヌクレオチド配列を有するＤＮＡ分子を意味するよう使用されるだろう。
【００１６】
アダプター：制限断片の末端にライゲーションできるように設計された、限定された塩基対数（例えば約１０から約３０塩基対の長さ）の短い二本鎖ＤＮＡ分子。アダプターは、一般に、互いに部分的に相補的なヌクレオチド配列を有する２つの合成オリゴヌクレオチドで構成される。適切な条件の下、溶液中で２つの合成オリゴヌクレオチドを混合したとき、それらは互いにアニールし、二本鎖構造を形成するだろう。アニーリングの後、アダプター分子の一端は、制限断片の末端に適合し、そこにライゲーションするように設計されている；アダプターの反対の末端は、ライゲーションできないよう設計できるが、これは必ずしもそうである必要はない（ダブル結合アダプター）。
【００１７】
アダプター結合制限断片：アダプターでキャップされた制限断片。
【００１８】
核酸：本発明による核酸は、ピリミジンおよびプリン塩基、好ましくはそれぞれシトシン、チミン、およびウラシル、並びにアデニンおよびグアニンの何れかのポリマーまたはオリゴマーを含んでよい（ＡｌｂｅｒｔＬ．Ｌｅｈｎｉｎｇｅｒ，ＰｒｉｎｃｉｐｌｅｓｏｆＢｉｏｃｈｅｍｉｓｔｒｙ，ａｔ７９３−８００（ＷｏｒｔｈＰｕｂ．１９８２）、当該文献は、全ての目的のために、その内容全てが本願に援用される）。本発明は、何れかのデオキシリボヌクレオチド、リボヌクレオチドまたはペプチド核酸構成成分、およびそれらの何れかの化学変種（例えば、これらの塩基のメチル化、ヒドロキシメチル化またはグリコシル化体）等が考慮される。ポリマーまたはオリゴマーは、組成物中で異種性または同種性であってよく、天然由来のソースから単離してよく、または人工的にもしくは合成的に製造してよい。さらに、核酸は、ＤＮＡもしくはＲＮＡまたはそれらの混合物であってよく、および、永久にまたは一時的に、ホモ二重鎖、ヘテロ二重鎖および複合型状態を含む一本鎖または二本鎖形態で存在してよい。
【００１９】
シーケンシング：シーケンシングという用語は、核酸サンプル（例えばＤＮＡまたはＲＮＡ）において、ヌクレオチドの順番（塩基配列）を決定することを意味する。
【００２０】
アライニングおよびアラインメント：「アライニング」および「アラインメント」という用語は、同一または類似のヌクレオチドの短いまたは長いストレッチの存在に基づく２以上のヌクレオチド配列の比較を意味する。核酸配列のアラインメントのための幾つかの方法は当該分野において既知であり、以下にて更に説明されるであろう。しばしば、「アッセンブリー」または「クラスタリング」という用語が同義語として使用される。
【００２１】
ハイスループットスクリーニング：しばしばＨＴＳと略されるハイスループットスクリーニングは、生物学および化学の分野に特に関係する科学的実験の方法である。現代的ロボット工学およびその他の特殊化研究室ハードウェアの組み合わせを通して、研究者が、効率的に大量のサンプルを同時にスクリーニングすることを可能にする。
【００２２】
プライマー：一般に、プライマーという用語は、ＤＮＡの合成を開始させることができるＤＮＡ鎖を意味する。ＤＮＡポリメラーゼは、プライマーなしで新たにＤＮＡを合成することはできない：それは、相補鎖が、構築しようとするヌクレオチドの順序を決めるためにテンプレートとして使用される反応において、現存のＤＮＡ鎖を伸長させることができるのみである。我々は、ポリメラーゼ連鎖反応法（ＰＣＲ）にて使用される合成オリゴヌクレオチド分子をプライマーと称するだろう。
【００２３】
親和性が増大したプライマー：ＰＮＡまたはＬＮＡといった改変されたヌクレオチドを含むプライマーであり、熱的安定性が増大され、単一ヌクレオチド配列差異に基づいてより特異的な増幅が可能となる。これを達成する目的で、１または複数の改変されたヌクレオチドが、好ましくはプライマーの３’末端に、しばしば含まれる。
【００２４】
ＤＮＡ増幅：ＤＮＡ増幅という用語は、典型的に、ＰＣＲを用いた二重鎖ＤＮＡ分子のｉｎｖｉｔｒｏ合成を意味するために使用されるだろう。その他の増幅方法が存在し、それらは、本発明の要旨から外れることなく、本発明に使用してもよいことに注目される。
【００２５】
選択的ハイブリダイゼーション：厳密なハイブリダイゼーション条件におけるハイブリダイゼーションであって、核酸の特異的核酸標的配列に対する、非標的核酸配列へのハイブリダイゼーションよりも検出可能な程度に高い程度（例えば、好ましくは、少なくともバックグラウンドの２倍を越える程度）でのハイブリダイゼーション、および非標的核酸の実質的排除に関する。「厳密な条件」または「厳密なハイブリダイゼーション条件」という用語は、その他の配列よりも検出可能な程度に高い程度（例えば、好ましくは、少なくともバックグラウンドの２倍を越える程度）で、プローブがその標的配列にハイブリダイズするであろう条件に対する言及を含む。厳密性条件は配列依存的であり、異なる環境において異なるだろう。ハイブリダイゼーションおよび／または洗浄条件の厳密性の調節により、プローブに対して１００％相補的な標的配列が同定できる（ホモロガスプロービング）。あるいは、厳密性条件は、配列における特定のミスマッチを許すよう調節でき、それによってより低い程度の類似性が検出される（ヘテロガスプロービング）。一般に、プローブは、約１００ヌクレオチド未満の長さ、好ましくは５０または２５ヌクレオチド以下の長さである。典型的に、厳密な条件は、塩濃度は約１．５Ｍ未満のＮａイオンであり、典型的に約７．０〜８．３のｐＨにおいて約０．０１〜１．０ＭのＮａイオン濃度（またはその他の塩）であり、温度は、典型的に、短いプローブ（例えば１０〜５０ヌクレオチド）では少なくとも約３０℃であり、典型的に、長いプローブ（例えば５０ヌクレオチドを越える場合）では少なくとも約６０℃である、条件であるだろう。厳密な条件は、また、ホルムアミドといった不安定化剤の添加によって達成してよい。例示的な低厳密性条件は、３０から３５％ホルムアミド、１ＭＮａＣｌ、１％ＳＤＳ（ドデシル硫酸ナトリウム）の緩衝液の３７℃でのハイブリダイゼーション、および１^＊から２^＊ＳＳＣ（２０^＊ＳＳＣ＝３．０ＭＮａＣｌ／０．３Ｍクエン酸三ナトリウム）による５０から５５℃での洗浄を含む。例示的な中等度の厳密性条件は、４０〜４５％ホルムアミド、１ＭＮａＣｌ、１％ＳＤＳ中、３７℃でのハイブリダイゼーション、および０．５^＊から１^＊ＳＳＣ中、５５から６０℃での洗浄を含む。例示的な高い厳密性条件は、５０％ホルムアミド、１ＭＮａＣｌ、１％ＳＤＳ中、３７℃でのハイブリダイゼーション、および０．１^＊ＳＳＣ中、６０から６５℃での洗浄を含む。特異性は、一般的にハイブリダイゼーション後の洗浄の関数であり、決定的な因子は、最後の洗浄溶液のイオン強度および温度である。ＤＮＡ−ＤＮＡハイブリッドのために、ＴｍはＭｅｉｎｋｏｔｈおよびＷａｈｌによる文献（Ａｎａｌ．Ｂｉｏｃｈｅｍ．，１３８：２６７−２８４（１９８４））の式から概算できる：Ｔｍ＝８１．５℃．＋１６．６（ｌｏｇＭ）＋０．４１（％ＧＣ）−０．６１（％ｆｏｒｍ）−５００／Ｌ；ここにおいて、Ｍは一価陽イオンのモル濃度であり、％ＧＣは、ＤＮＡ中のグアノシンおよびシトシンヌクレオチドのパーセンテージであり、％ｆｏｒｍは、ハイブリダイゼーション溶液中のホルムアミドのパーセンテージであり、およびＬは塩基対のハイブリッドの長さである。Ｔｍは、補完的な標的配列の５０％が、完全にマッチしたプローブにハイブリダイズする温度（定義されたイオン強度およびｐＨの下で）である。Ｔｍは、それぞれ１％のミスマッチングのために、約１℃下げらる；したがって、Ｔｍ、ハイブリダイゼーションおよび／または洗浄条件は、望ましい同一性の配列にハイブリダイズするよう調整できる。例えば、＞９０％の同一性による配列を探す場合、Ｔｍは１０℃下げることができる。通常、厳密な条件は、定義されたイオン強度およびｐＨにおける特異的配列およびその相補体（ｃｏｍｐｌｅｍｅｎｔ）の熱融点（Ｔｍ）よりも約５℃低く選択される。しかしながら、高度に厳密な条件は、熱融点（Ｔｍ）より１、２、３または４℃低いハイブリダイゼーションおよび／または洗浄が使用される；中程度の厳密な条件は、熱融点（Ｔｍ）より６、７、８、９または１０℃低いハイブリダイゼーションおよび／または洗浄が使用される；低い厳密性条件は、熱融点（Ｔｍ）より１１、１２、１３、１４、１５または２０℃低いハイブリダイゼーションおよび／または洗浄が使用される。式、ハイブリダイゼーションおよび洗浄の組成、および望ましいＴｍを使用して、当業者は、ハイブリダイゼーションおよび／または洗浄溶液の厳密性における変化は本質的に記述されることを理解するだろう。望ましい程度のミスマッチングが、４５℃（水溶液）または３２℃（ホルムアミド溶液）よりも低いＴｍをもたらす場合、より高い温度が使用できるようにＳＳＣ濃度を増加させることが好ましい。核酸のハイブリダイゼーションの詳細な指針は、文献に見つかる（Ｔｉｊｓｓｅｎ，ＬａｂｏｒａｔｏｒｙＴｅｃｈｎｉｑｕｅｓｉｎＢｉｏｃｈｅｍｉｓｔｒｙａｎｄＭｏｌｅｃｕｌａｒＢｉｏｌｏｇｙ−ＨｙｂｒｉｄｉｓａｔｉｏｎｗｉｔｈＮｕｃｌｅｉｃＡｃｉｄＰｒｏｂｅｓ，Ｐａｒｔ１，Ｃｈａｐｔｅｒ２ “Ｏｖｅｒｖｉｅｗｏｆｐｒｉｎｃｉｐｌｅｓｏｆｈｙｂｒｉｄｉｓａｔｉｏｎａｎｄｔｈｅｓｔｒａｔｅｇｙｏｆｎｕｃｌｅｉｃａｃｉｄｐｒｏｂｅａｓｓａｙｓ”，Ｅｌｓｅｖｉｅｒ，Ｎ．Ｙ．（１９９３）；およびＣｕｒｒｅｎｔＰｒｏｔｏｃｏｌｓｉｎＭｏｌｅｃｕｌａｒＢｉｏｌｏｇｙ，Ｃｈａｐｔｅｒ２，Ａｕｓｕｂｅｌ，ｅｔａｌ．，Ｅｄｓ．，ＧｒｅｅｎｅＰｕｂｌｉｓｈｉｎｇａｎｄＷｉｌｅｙ−Ｉｎｔｅｒｓｃｉｅｎｃｅ，ＮｅｗＹｏｒｋ（１９９５））。
【００２６】
［発明の説明］
本発明者らは、ハイスループットシーケンシング戦略を用いて、前述の目的が達成でき、およびトランスポゾン集団、またはトランスポゾン挿入によって起こされる関心ある表現型を保持するメンバーを含む集団は、関心ある遺伝子への挿入の存在について効率的にスクリーニングされることを発見した。
【００２７】
［発明の詳細な説明］
本発明は、以下の工程を含む、トランスポゾン集団のメンバーにおける関心ある遺伝子または配列に関連した挿入の同定のための方法に関する：
（ａ）個々にまたはプール中にて、トランスポゾン集団のゲノムＤＮＡを単離すること；
（ｂ）任意に、工程（ａ）で得られるＤＮＡをプールすること；
（ｃ）１以上、好ましくは２以上、最も好ましくは２つの制限酵素（好ましくはその少なくとも１つが、トランスポゾンを切断しない高頻度切断制限エンドヌクレアーゼであり、好ましくは少なくとも１つが、トランスポゾンで切断する希少切断制限酵素である）を使用してＤＮＡを制限処理し（ｒｅｓｔｒｉｃｔ）、制限断片にアダプターを結合し（ｌｉｇａｔｅ）、それによってアダプター結合制限断片を作製すること；
（ｄ）一対の（任意に、ラベルした）プライマーを用いてアダプター結合制限断片を増幅すること、ここにおいて、プライマーの１つは、（既知の）トランスポゾン配列の一部に相補的（ハイブリダイズ可能）であるセクションを含み、更にシーケンスプライマー結合部位を含み、ここにおいて他方のプライマーは少なくともアダプターに相補的であり、ここにおいて一方または両方のプライマーはタグを含む；
（ｅ）任意に、工程（ｄ）の増幅産物をプールし、増幅産物のライブラリーを構築すること；
（ｆ）任意に、ライブラリー中の増幅産物を断片化すること；
（ｇ）ハイスループットシーケンシングを使用して、（ｄ）、（ｅ）または（ｆ）の断片のヌクレオチド配列を決定すること；
（ｈ）任意に、ｉｎｓｉｌｉｃｏで断片の配列を整え、それによって何れかのアダプターおよび／またはトランスポゾンに関連した配列情報を削除すること；
（ｉ）データベースからのヌクレオチド配列をアライニングできる、工程（ｇ）または（ｈ）の１以上の断片を同定し、それによってデータベースからのヌクレオチド配列と関心ある表現型との相関関係を示すこと；
（ｊ）工程（ｉ）の断片を含んでいるトランスポゾン集団のメンバーを同定すること；
（ｋ）任意に、工程（ｉ）の断片に基づいてプローブまたはＰＣＲプライマーペアを設計し、およびそれを使用して（ｊ）で同定されたメンバーのゲノムの関心ある遺伝子におけるトランスポゾン挿入を確認すること。
【００２８】
集団中のそれぞれのメンバーのＤＮＡサンプルを提供するためのＤＮＡの単離は、一般に、当該分野において一般的な方法を用いて達成され、例えば、集団のメンバーからの組織の採取、ＤＮＡ抽出（例えば、Ｑ−ＢｉｏｇｅｎｅｆａｓｔＤＮＡキット）、サンプル当り等量のＤＮＡを得るための定量化および標準化が使用される。例として、本発明は、１０００の植物のトランスポゾン集団に基づいて例示される。典型的に、ＤＮＡは、関心ある表現型を発現する集団のそれぞれのメンバーのものが単離される。
【００２９】
本発明による方法に関して、ゲノムＤＮＡが少なくとも１つの転移因子タグ付加遺伝子を含む個々の生物は、関心ある変異型表現型の存在または非存在によって分離可能である。従って、生物からの遺伝配列の同定および単離に適した方法が提供され、ここにおいて、前記遺伝配列に隣接する転移因子による前記生物のゲノムＤＮＡの破壊は、直接的にまたは間接的に、変異型表現型に関係している。
【００３０】
生物の変異型表現型は、好ましくは、転移因子の挿入による単一遺伝子の破壊によって生じることが既知またはそう疑われるものであり、または、少なくとも、そのような挿入の事象が除外できないものである。実際には、このことは、生物の群は、変異型表現型の存在（または非存在）に基づいて分離されることを意味してよい。当業者は、分離しようとする生物のプールは、非遺伝的寄与（例えば、環境的影響）により生じる表現型の分離を避けるために、同様な条件のもとで生育または培養すべきであることを理解するだろう。本発明の方法は、野生型または変異型の何れかとして区別および分類できる、何れかの表現型に適用できる。そのような表現型は、視覚的、生化学的、農学的または形態学的手段によって検出可能である。当業者は、本願で使用される「野生型」および「変異型」という用語は、特定の表現型の存在または非存在によって生物を区別するために使用される任意の用語であると認識するであろう。本発明が適用できる生物は、真核生物または原核生物とすることができる。真核生物は、本発明による方法に使用する場合、一倍体または二倍体とすることができる。二倍体において、野生型表現型を発現する生物は、Ｆ１世代由来であってよいが、トランスポゾンタグ付加遺伝子に関係する変異型表現型は、より一般的に劣勢変異として現れるため、より一般的にＦ２世代にて現れる。従って、本発明の好ましい実施態様において、生物は、転移因子ドナー個体と、活性転移因子を有さないレシピエント純系個体との間の交雑によるＦ２世代由来であるだろう。好ましくは、本発明による方法は植物に適用されるだろう。特定の実施態様において、好ましい植物は、例えばイネ科の単子葉植物といった単子葉植物であり、例えばトウモロコシ種が含まれる。本発明の特定の実施態様において、転移因子を有する生物は、Ｍｕ−ＤＲ調節因子（Ｃｈｏｍｅｔｅｔａｌ．（１９９１）Ｇｅｎｅｔｉｃｓ１２２：４４７４５７）および高コピー数のＭｕ因子を含むＭｕドナー個体と、活性Ｍｕ因子を有さないレシピエント純系個体との間の交雑によるＦ２世代に由来するトウモロコシ植物であるだろう。生物のゲノムＤＮＡは、少なくとも１つの転移因子を有し、および好ましくは多数の転移因子、例えば少なくとも５、１０、２５、５０または１００の転移因子を有するだろう。ゲノム内における転移因子は、同一のまたは異なるタイプのものとすることができる。転移因子を含む生物は、当該分野において利用可能な方法にそって実験的に得ることができる。例えばＣｈｏｍｅｔの文献参照（ＴｈｅＭａｉｚｅＨａｎｄｂｏｏｋ，ｅｄ．ＦｒｅｅｌｉｎｇａｎｄＷａｌｂｏｔ（Ｓｐｒｉｎｇｅｒ−Ｖｅｒｌａｇ，ＮｅｗＹｏｒｋ），ｐｐ．２４３−２４８（１９９４））。好ましい実施態様において、転写性因子はミューテーター（Ｍｕ）である（Ｒｏｂｅｒｔｓｏｎ（１９７８）ＭｕｔａｔｉｏｎＲｅｓ．５１：２１−２８，ＣｈａｎｄｌｅｒａｎｄＨａｒｄｅｍａｎ（１９９２）ＡｄｖａｎｃｅｓｉｎＧｅｎｅｔｉｃｓ３０：７７−１２２）。Ｍｕを含む、多くの転移因子に存在する末端逆方向反復ＤＮＡ（ｔｅｒｍｉｎａｌ−ｉｎｖｅｒｔｅｄ−ｒｅｐｅａｔＤＮＡ）（ＴＩＲ）は、本発明によく適している。転移因子の挿入は、転移因子タグ付加ＤＮＡ配列の内部またはその近くにて発生する可能性がある。本発明による方法によって同定しようとする転移因子タグ付加遺伝子は、遺伝子のコーディング配列内に挿入された転移因子を有しており、そのため遺伝子の正常な機能的産物の転写は阻害され、変異型表現型がもたらされる。あるいは、タグ付加遺伝子は、イントロン内に挿入された転移因子を有してよく、そのためＲＮＡのスプライシングが影響を受け、その結果機能的遺伝子産物が阻害され、従って変異型表現型が作られる。更に、タグ付加遺伝子は、プロモーターまたはエンハンサー因子といった遺伝子調節領域内に挿入された転移因子を有することが可能であり、そのため遺伝子発現は増大または減少し、変異型表現型がもたらされる。本発明による方法が適用されるそれぞれの表現型のために、野生型表現型を有する少なくとも１つの生物および少なくとも１つの変異体が分離される。任意に、少なくとも２、４、５、１０、１５、または２０の生物が分離された野生型集団に存在し、少なくとも２、４、５、１０、１５、または２０が、変異型集団に存在する。
【００３１】
単離されたＤＮＡのプーリングは、例えば、３次元プーリングスキームを用いて達成できる（Ｖａｎｄｅｎｂｕｓｓｃｈｅｅｔａｌ，２００３，ＴｈｅＰｌａｎｔＣｅｌｌ，１５，２６８０−２６９３）。プーリングは、好ましくは等量のＤＮＡを用いて達成される。３Ｄプーリングスキームは、１０ｘ１０ｘ１０を含んでよく、結果として、１プールあたり１０ｘ１０＝１００の異なるＤＮＡサンプルを含む３０プール（１０＋１０＋１０）を含む。様々なその他のプーリング戦略を本発明とともに使用することができ、その例は、多次元プーリング（３−Ｄプーリングを含む）またはカラム（ｃｏｌｕｍｎ）、ロウ（ｒｏｗ）またはプレート（ｐｌａｔｅ）プーリングである。特定の実施例において、プーリングはサンプリング段階におけるＤＮＡ抽出の前に行い、ＤＮＡ標本の数を１０００ではなく３０サンプルに減少させることもできる（本方法の工程（ａ））。
【００３２】
プーリング段階は、典型的に、１回のＰＣＲスクリーニング後、観察されるトランスポゾン挿入を含む植物を同定することに役立つ。ＤＮＡのプーリングは、更に、シーケンシングのためのライブラリーにおいてより均等な表示を提供するために、ＰＣＲ増幅に先立ってＤＮＡを標準化することに役立つ。
【００３３】
プール中のＤＮＡは、少なくとも１つの制限エンドヌクレアーゼを用いて制限処理される。場合によって、すなわちゲノムのサイズまたはトランスポゾンの数に依存して、更なるエンドヌクレアーゼが使用できる。特定の実施態様において、２以上のエンドヌクレアーゼが使用できる。大部分のゲノムにとって、２つエンドヌクレアーゼで十分であり、このことは、それゆえ、最も好ましい。特定の実施態様において、特に大きいまたは複雑なゲノムのために、更なるエンドヌクレアーゼが使用できる。好ましくは、エンドヌクレアーゼは、５０−５００ｂｐのオーダーで、相対的に短い制限断片を提供するが、このことは必須ではない。典型的に、少なくとも１つの高頻度切断ヌクレアーゼが好ましく、例えば、４または５塩基対の認識配列を有するエンドヌクレアーゼが好ましい。そのような酵素の１つはＭｓｅＩであるが、その他の多くのものが商業的に利用でき、使用することができる。また、認識配列の外側を切断する酵素を使用することができ（ＩＩｓタイプ）、または平滑末端制限断片を与える酵素を使用することができる。好ましい組み合わせでは、１つの希少切断（６塩基以上の認識配列）および１つの高頻度切断を行うものが使用される。
【００３４】
プールされたＤＮＡの制限処理の後にまたはそれと同時に、アダプターが制限断片に結合され、アダプター結合制限断片が得られる。１以上の異なるアダプターを使用してよく、例えば、２つのアダプター、１つのフォワード、１つのリバースアダプターを使用してよい。あるいは、１つのアダプターを全ての断片のために使用してよく、または、アダプターの突出末端にヌクレオチドの並べ替え（ｐｅｒｍｕｔａｔｉｏｎ）を含み、それによって、予備選択工程を可能とし得るインデックスリンカー（ｉｎｄｅｘｉｎｇｌｉｎｋｅｒ）を提供するアダプターのセットを使用してよい（Ｕｎｒａｕｅｔａｌ．，Ｇｅｎｅ，１９９４，１４５，１６３−１６９）。あるいは、平滑末端制限断片の場合には、平滑末端アダプターを使用することができる。アダプター結合は当該分野において周知であり、とりわけＥＰ５３４８５８に記載されている。アダプター結合の後、アダプター結合制限断片のプールは、アダプターに相補的なプライマーのセットを用いて（予備）増幅してよい。このことは、プール中のそれぞれの植物からのＤＮＡの量の（更なる）標準化に役立ち、またはプール中のＤＮＡの総量を増加させプールの多重分析（すなわち、サンプルの分割）を可能とし、およびシグナル対ノイズ比を増大させるのに役立つ。
【００３５】
アダプター結合制限断片は、任意的な予備増幅の後、プライマーのペアを用いて、本発明による方法の工程（ｄ）で増幅される。ＥＰ５３４８５８の記載と同様に、プライマーの１つは、アダプターの少なくとも１つに相補的であり、更に、エンドヌクレアーゼの認識配列の残りの部分に相補的であってよく、および更に、その３’末端にて（ランダムに選択された）選択的ヌクレオチドを含んでよい。プライマーのセットにおけるその他のプライマーは、トランスポゾン配列の境界（の一部）とアニーリング可能であるよう設計される。典型的に、プライマーはトランスポゾンの共通配列と重複し、および好ましくはその境界において重複する。
【００３６】
好ましくは、プライマーは、厳密なハイブリダイゼーション条件の下、転移因子またはアダプターにそれぞれ選択的にハイブリダイズできる。あるいは、プライマーは、少なくとも５０、６０、７０、８０、８５、９０、９５％で、トランスポゾンと重複（相補的）であってよい。約２０ｂｐのプライマーの平均長では、これは、約１０から１９塩基に達する。これは、生物中のトランスポゾンまたはトランスポゾンファミリーの共通配列または事実上既知の配列であってよい。植物の典型的なトランスポゾン配列は既知であり、例えば、ＤｅＫｅｕｋｅｌｅｉｒｅら（ＣｈｒｏｍｏｓｏｍｅＲｅｓｅａｒｃｈ，２００４，１２（２）：１１７−１２３）、ＶａｎｄｅｎＢｒｏｅｃｋら（ＴｈｅＰｌａｎｔＪｏｕｒｎａｌ，１９９８，１３（１），１２１−１２９）、Ｇｅｒａｔｓら（ＰｌａｎｔＣｅｌｌ，１９９０，２，１１２１−１１２８ｄｅｓｃｒｉｂｉｎｇｔｈｅ２８４ｂｐｄＴｐｈ１ｔｒａｎｓｐｏｓｉｔｉｏｎｓｙｓｔｅｍｉｎｐｅｔｕｎｉａ）による文献が参照される。これらの参考文献は、特にトランスポゾンの境界において、共通配列がトランスポゾンファミリーに知られていることを示す。これらの共通配列があれば、適切なプライマーの設計は容易に達成できる。たとえば、植物および動物におけるＨａｔファミリー（Ｈｏｂｏ、ＡｃおよびＴａｍ３）である。転移因子は既知であり、並びに以下の文献にそれらの配列が記載される：ＡｔｋｉｎｓｏｎＰＷ、ＷａｒｒｅｎＷＤ、Ｏ’ＢｒｏｃｈｔａＤＡによる文献（ＴｈｅｈｏｂｏｔｒａｎｓｐｏｓａｂｌｅｅｌｅｍｅｎｔｏｆＤｒｏｓｏｐｈｉｌａｃａｎｂｅｃｒｏｓｓ−ｍｏｂｉｌｉｚｅｄｉｎｈｏｕｓｅｆｌｉｅｓａｎｄｅｘｃｉｓｅｓｌｉｋｅｔｈｅＡｃｅｌｅｍｅｎｔｏｆｍａｉｚｅ．ＰｒｏｃＮａｔｌＡｃａｄＳｃｉＵＳＡ９０：９６９３−９６９７（１９９３））；ＣａｐｙＰ、ＶｉｔａｌｉｓＲ、ＬａｎｇｉｎＴ、ＨｉｇｕｅｔＤ、ＢａｚｉｎＣによる文献（Ｒｅｌａｔｉｏｎｓｈｉｐｓｂｅｔｗｅｅｎｔｒａｎｓｐｏｓａｂｌｅｅｌｅｍｅｎｔｓｂａｓｅｄｕｐｏｎｔｈｅｉｎｔｅｇｒａｓｅ−ｔｒａｎｓｐｏｓａｓｅｄｏｍａｉｎｓ：ｉｓｔｈｅｒｅａｃｏｍｍｏｎａｎｃｅｓｔｏｒ？ＪＭｏｌＥｖｏｌ４２：３５９−３６８（１９９６））；ＥｓｐｏｓｉｔｏＴ、ＧｉａｎｆｒａｎｃｅｓｃｏＦ、ＣｉｃｃｏｄｉｃｏｌａＡらによる文献（ＡｎｏｖｅｌｐｓｅｕｄｏａｕｔｏｓｏｍａｌｈｕｍａｎｇｅｎｅｅｎｃｏｄｅｓａｐｕｔａｔｉｖｅｐｒｏｔｅｉｎｓｉｍｉｌａｒｔｏＡｃ−ｌｉｋｅｔｒａｎｓｐｏｓａｓｅｓ．ＨｕｍＭｏｌＧｅｎｅｔ８：６１−６７（１９９９））；ＧｒａｐｐｉｎＰ、ＡｕｄｅｏｎＣ、ＣｈｕｐｅａｕＭＣ、ＧｒａｎｄｂａｓｔｉｅｎＭＡによる文献（ＭｏｌｅｃｕｌａｒａｎｄｆｕｎｃｔｉｏｎａｌｃｈａｒａｃｔｅｒｉｚａｔｉｏｎｏｆＳｌｉｄｅ，ａｎＡｃ−ｌｉｋｅａｕｔｏｎｏｍｏｕｓｔｒａｎｓｐｏｓａｂｌｅｅｌｅｍｅｎｔｆｒｏｍｔｏｂａｃｃｏ．ＭｏｌＧｅｎＧｅｎｅｔ２５２：３８６−３９７（１９９６））；ＨａｎｄｌｅｒＡＭ、ＧｏｍｅｚＳＰによる文献（Ｔｈｅｈｏｂｏｔｒａｎｓｐｏｓａｂｌｅｅｌｅｍｅｎｔｅｘｃｉｓｅｓａｎｄｈａｓｒｅｌａｔｅｄｅｌｅｍｅｎｔｓｉｎｔｅｐｈｒｉｄｉｔｓｐｅｃｉｅｓ．Ｇｅｎｅｔｉｃｓ１４３：１３３９−１３４７（１９９６））；ＨｅｈｌＲ、ＮａｃｋｅｎＷＫ、ＫｒａｕｓｅＡ、ＳａｅｄｌｅｒＨ、ＳｏｍｍｅｒＨらによる文献（ＳｔｒｕｃｔｕｒａｌａｎａｌｙｓｉｓｏｆＴａｍ３，ａｔｒａｎｓｐｏｓａｂｌｅｅｌｅｍｅｎｔｆｒｏｍＡｎｔｉｒｒｈｉｎｕｍｍａｊｕｓ，ｒｅｖｅａｌｓｈｏｍｏｌｏｇｉｅｓｔｏｔｈｅＡｃｅｌｅｍｅｎｔｆｒｏｍｍａｉｚｅ．ＰｌａｎｔＭｏｌＢｉｏｌ１６：３６９−３７１（１９９１））；ＨｕｔｔｌｅｙＧＡ、ＭｃＲａｅＡＦ、ＣｌｅｇｇＭＴらによる文献（ＭｏｌｅｃｕｌａｒｅｖｏｌｕｔｉｏｎｏｆｔｈｅＡｃ／Ｄｓｔｒａｎｓｐｏｓａｂｌｅｅｌｅｍｅｎｔｆａｍｉｌｙｉｎｐｅａｒｌｍｉｌｌｅｔａｎｄｏｔｈｅｒｇｒａｓｓｅｓ．Ｇｅｎｅｔｉｃｓ１３９：１４１１−１４１９（１９９５））；ＫｅｍｐｋｅｎＦ、ＷｉｎｄｈｏｆｅｒＦ（ＴｈｅｈＡＴｆａｍｉｌｙ：ａｖｅｒｓａｔｉｌｅｔｒａｎｓｐｏｓｏｎｇｒｏｕｐｃｏｍｍｏｎｔｏｐｌａｎｔｓ，ｆｕｎｇｉ，ａｎｉｍａｌｓ，ａｎｄｍａｎ．Ｃｈｒｏｍｏｓｏｍａ１１０：１−９（２００１））；ＷａｒｒｅｎＷＤ、ＡｔｋｉｎｓｏｎＰＷ、Ｏ’ＢｒｏｃｈｔａＤＡ（ＴｈｅＡｕｓｔｒａｌｉａｎｂｕｓｈｆｌｙＭｕｓｃａｖｅｔｕｓｔｉｓｓｉｍａｃｏｎｔａｉｎｓａｓｅｑｕｅｎｃｅｒｅｌａｔｅｄｔｏｔｒａｎｓｐｏｓｏｎｓｏｆｔｈｅｈｏｂｏ，ＡｃａｎｄＴａｍ３ｆａｍｉｌｙ．Ｇｅｎｅ１５４：１３３−１３４（１９９５））。
【００３７】
好ましくは、トランスポゾン指向プライマー（ｔｒａｎｓｐｏｓｏｎｄｉｒｅｃｔｅｄｐｒｉｍｅｒ）は、標的とするトランスポゾンの外向きにそれが面するように、方向付けられおよび設計される。特定の実施態様において、特異性を増大させるために、一方または両方のプライマー、好ましくはトランスポゾン指向プライマーが、結合親和性の増大したヌクレオチドを含んでよい。
【００３８】
アダプター結合制限断片の一部またはセグメントは、一方または両方がラベル化されてよいタグ付加プライマーのペアを用いて増幅される。好ましくは、それぞれの次元のそれぞれのプールのために、異なるプライマーが使用される。上述の例示において、このことは、３０のフォワードプライマーおよび単一のリバースプライマーが好ましいことを意味する。フォワードおよびリバースプライマーの１つは、アダプターに向かって方向付けられてよく、その他のリバースおよびフォワードプライマーは、標的となるトランスポゾンに向かって方向付けられてよい。
【００３９】
好ましくは、プライマーのそれぞれのペア（アダプター指向プライマーおよびトランスポゾン指向プライマー）は、更に、依存的に、１以上の以下の因子を含んでよい：
（ｉ）続くシーケンシング工程にて使用可能な位置に結合するシーケンスプライマー、
（ｉｉ）プライマー（および結果的に生じる増幅産物）と集団の本来のメンバーとを関連付けるのに役立つタグ、および
（ｉｉｉ）ハイスループットシーケンシング工程にて使用されるビーズへの結合を可能にするビーズ結合配列。
【００４０】
典型的な実施態様において、トランスポゾン指向プライマーは、３’−５’方向および５’−３’方向の両方において以下の構造を有することができる：
シーケンスプライマー結合部位−−−任意的タグ−−−トランスポゾン特異的ＰＣＲプライマー配列、または
ビーズ結合部位−−−任意的タグ−−−トランスポゾン特異的ＰＣＲプライマー配列。
【００４１】
典型的な実施態様において、アダプター指向プライマーは、３’−５’方向および５’−３’方向の両方において以下の構造を有することができる：
シーケンスプライマー結合部位−−−任意的タグ−−−アダプター特異的ＰＣＲプライマー配列、または
ビーズ結合部位−−−任意的タグ−−−アダプター特異的ＰＣＲプライマー配列。
【００４２】
特定の実施態様において、トランスポゾン指向プライマーおよびアダプター指向プライマーの両方は、増幅に使用された場合にサブセットを提供する３’末端における１−１０のランダムに選択されたヌクレオチドとともに提供され得る。図１参照。
【００４３】
シーケンスプライマー結合部位およびトランスポゾン特異的ＰＣＲプライマー配列の長さは、一般的なＰＣＲ用途にて慣習的なものであり、すなわち、独立に、約１０から約３０ｂｐであり、好ましくは１５から２５ｂｐである。好ましくは、増幅されるアダプター結合配列の一部またはセグメントは、以下に記載されるハイスループットシーケンシング技術を用いて１回の実行で配列決定できる長さに相当する。特定の実施態様において、一部またはセグメントは、約５０ｂｐから約５００ｂｐの間の長さを有し、好ましくは、約７５ｂｐから約３００ｂｐ、およびより好ましくは約９０ｂｐから約２５０ｂｐの間の長さを有している。上記されるように、この長さは、使用されるシーケンス技術（まだなお開発段階のものを含む）によって変化してよい。
【００４４】
このプライマーのセットによる増幅は、マルチプレックス（ｍｕｌｔｉｐｌｅｘ）にて標的とされるトランスポゾンの隣接配列の増幅されたアダプター結合制限断片（アンプリコン（ａｍｐｌｉｃｏｎ））を提供するだろう。
【００４５】
全てのプール次元（ｐｏｏｌｄｉｍｅｎｓｉｏｎ）を代表するそれぞれのプライマーに固有なタグ配列を含むプライマー（フォワードおよび／またはリバース）を用いて、それぞれのタグ配列の特異的なプール起源がわかる。というのは、シーケンスプライマーがタグ上流にアニールし、結果として、タグ配列がそれぞれの増幅産物に存在するためである。
【００４６】
特定の実施態様において、フォワードおよびリバースの両プライマーがタグ付加される。その他の実施態様において、フォワードまたはリバースプライマーの一方のみがタグ付加される。１または２つのタグの中での選択は、状況に依存し、ハイスループットシーケンシング反応のリード長（ｒｅａｄ−ｌｅｎｇｔｈ）および／または独立したバリデーション（ｖａｌｉｄａｔｉｏｎ）の必要性に依存する。例えば一方向性で配列決定される１００ｂｐのＰＣＲ産物の場合、ただ１つのタグが必要とされる。２００ｂｐのＰＣＲ産物および１００ｂｐのリード長の場合、二重タギングは、二方向性配列決定との組み合わせにおいて、それが２倍の効率の向上をもたらすため有用である。それは更に、同一の工程における独立したバリデーションの可能性を提供する。１００ｂｐのＰＣＲ産物が２つのタグ付加プライマーにより二方向性で配列決定される場合、方向性（ｏｒｉｅｎｔａｔｉｏｎ）に関わらず、全ての痕跡は変異についての情報を提供するだろう。それゆえ、両プライマーは、植物がどのような変異を含むかについての「アドレス情報（ａｄｄｒｅｓｓｉｎｆｏｒｍａｔｉｏｎ）」を提供する。
【００４７】
タグは何れかの数のヌクレオチドとすることができるが、好ましくは２、３、４または５ヌクレオチドを含む。４つのヌクレオチドが並べ替えられる場合、２５６個のタグが可能である一方で、３つのヌクレオチドが並べ替えられる場合、６４個の異なるタグが提供される。使用される例証において、タグは、好ましくは＞１塩基だけ異なり、それゆえ、好ましいタグは４ｂｐの長さである。これらのプライマーを用いる増幅は、タグ付加された増幅産物のライブラリーをもたらす。
【００４８】
特定の実施態様において、タグのシステムを使用することができ、ここにおいて、増幅工程は、以下の使用を含む：
（１）（ａ）５’−定常セクション、それに繋がる（ｂ）縮重タグセクション（ＮＮＮＮ）、それに繋がる（ｃ）トランスポゾンまたはアダプター特異的セクション−３’を含む長いプライマー、および
（２）（ａ）５’−定常セクション、それに繋がる（ｂ）非縮重タグセクション−３’（すなわち、ＮＮＮＮの中からの選択）から成る、引き続く増幅における短いプライマー。
【００４９】
長いプライマーは好ましくは不十分な量（ｓｈｏｒｔｍｅａｓｕｒｅ）で使用され、短いプライマーは過剰に使用される。非縮重タグセクションは、それぞれのプールされたサンプルにユニークなものとすることができ、例えば、プールされたサンプル１ではＡＣＴＧであり、プールされたサンプル２ではＡＡＴＣ等となる。短いプライマーは、長いプライマーのサブセットにアニールする。プライマーの定常セクションは、シーケンスプライマーとして使用できる。ライブラリーは、好ましくは、全ての増幅したプールからの等しい量のＰＣＲ産物を含む。例証となる例において、ライブラリーは、それぞれのトランスポゾン挿入部位のために決定される１０００植物ｘ１００ｂｐ＝１００ｋｂ配列を含む。
【００５０】
方法の工程（ｅ）において、増幅産物は、好ましくは等量または標準化された量でプールされ、それによって増幅産物のライブラリーが作製されてよい。例示的に、ライブラリーの複雑性は、それぞれのトランスポゾン挿入部位について、１０００植物ｘ２５０−５００ｂｐ＝０．２５−０．５Ｍｂであるだろう。
【００５１】
ライブラリー中の増幅産物はランダムに断片化され、その後断片が配列決定される。断片化は、物理的技術、例えば、剪断、超音波処理またはその他の断片化方法によって達成できる。
【００５２】
工程（ｇ）において、工程（ｄ）または（ｆ）の少なくとも一部しかし好ましくは全ての断片の、少なくとも一部しかし好ましくは全体のヌクレオチド配列が決定される。特定の実施態様において、増幅した産物の断片化工程は任意的である。例えば、シーケンシング技術のリード長およびＰＣＲ断片長がほぼ同一の場合、断片化の必要はない。より大きいＰＣＲ産物の場合もまた、増幅した産物の断片化は、それらの一部のみが配列決定されることが容認できるならば、必要であってもよい。例えば、５００ｂｐのＰＣＲ産物および１００（それぞれの端から）のリード長の場合、シーケンシングに先立つ断片化が行われない場合３００ｂｐが配列決定されないまま残る。断片化の必要性は、シーケンシング技術のリード長が増加することで減少する。
【００５３】
シーケンシングは、原則、当該分野において既知の何れかの手段によって行ってよく、例えば、ジデオキシ鎖停止法（ｄｉｄｅｏｘｙｃｈａｉｎｔｅｒｍｉｎａｔｉｏｎｍｅｔｈｏｄ）（サンガー配列決定法）を用いてよい。しかしながら、ハイスループットシーケンシング法を用いて行われるシーケンシングが好ましく且つより有利であり、そのような方法は、例えば、ＷＯ０３／００４６９０、ＷＯ０３／０５４１４２、ＷＯ２００４／０６９８４９、ＷＯ２００４／０７０００５、ＷＯ２００４／０７０００７、およびＷＯ２００５／００３３７５（全て４５４ＬｉｆｅＳｃｉｅｎｃｅｓの名において）、Ｓｅｏらによる文献（Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ１０１：５４８８−９３（２００４））に開示され、およびＨｅｌｉｏｓ、Ｓｏｌｅｘａ、ＵＳＧｅｎｏｍｉｃｓ等の技術である（これらは本願に援用される）。現在記述される技術は、１回の実行で４０００万塩基までの配列決定が可能であり、競合する技術よりも１００倍速くおよび安い。これは、反応当りのリード長の増加および／または並行反応の数の増加とともに増加するだろう。シーケンシング技術は、大まかに、５つの工程から成る：１）ＤＮＡの断片化および特異的アダプターのライゲーションにより、一本鎖ＤＮＡ（ｓｓＤＮＡ）のライブラリーを作成する；２）ｓｓＤＮＡのビーズへのアニーリング、油中水マイクロリアクター（ｗａｔｅｒ−ｉｎ−ｏｉｌｍｉｃｒｏｒｅａｃｔｏｒｓ）中でのビーズの乳化、およびエマルジョンＰＣＲを行うことによるビーズ上での個々のｓｓＤＮＡ分子の増幅；３）表面に増幅したｓｓＤＮＡ分子を含むビーズの選択／濃縮；４）ＰｉｃｏＴｉｔｅｒＰｌａｔｅ（登録商標）によりＤＮＡ保持ビーズの析出；およびピロリン酸光シグナル（ｐｙｒｏｐｈｏｓｐｈａｔｅｌｉｇｈｔｓｉｇｎａｌ）の生成による、１００，０００ウェル中での同時シーケンシング。
【００５４】
好ましい実施態様において、シーケンシングは以下の工程を含む：
（１）シーケンシング−アダプター−結合断片をビーズにアニーリングさせる、ここにおいて、それぞれのビーズは単一の断片とアニーリングする；
（２）油中水マイクロリアクター中でビーズを乳化する、ここにおいて、油中水マイクロリアクターは単一のビーズを含む；
（３）エマルジョンＰＣＲを行い、ビーズの表面上でアダプター結合断片を増幅する；
（４）増幅したアダプター結合断片を含むビーズを選択／濃縮する；
（６）ウェルにビーズを充填する、ここにおいて、それぞれのウェルは単一のビーズを含む；および
（７）ピロリン酸シグナルを作る。
【００５５】
最初の工程（１）において、アダプター結合制限断片に存在するアダプターはビーズにアニールされる。本願において以前に概要を述べたとおり、シーケンシングアダプターは、少なくとも、ビーズへのアニーリングのための「キー」領域、シーケンシングプライマー領域およびＰＣＲプライマー領域を含む。特に、増幅したアダプター結合制限断片は、現在、末端の一方に、以下の配列を含み（５’−シーケンスプライマー結合部位−−−タグ−−−トランスポゾン特異的ＰＣＲプライマー配列−３’）、一方、その他の末端には、以下のようなものであってよいセグメントが存在する（５’−ビーズアニーリング配列−−−タグ−−−アダプター特異的配列−−−制限部位特異的配列（任意的）−−−（ランダム）選択的配列（任意的）−３’）。シーケンスプライマー結合部位およびビーズアニーリング配列は互換的であってよいことが明らかであってよい。このビーズアニーリング配列は、現在、ビーズへの断片のアニーリングのために使用でき、ここにおいてビーズは、その末端にヌクレオチド配列を保持する。
【００５６】
従って、適用される断片はビーズにアニールされ、ここにおいてそれぞれのビーズは、単一の適用される断片にアニールされる。適用される断片のプールに対して、ビーズは過剰に添加され、過剰量のビーズに対して、ビーズ当り１つの単一の適用される断片のアニーリングが確実にされる（ポアソン分布）。
【００５７】
好ましい実施態様において、トランスポゾンスクリーニングの効率を更に増大するために、シーケンシングのためのビーズにて直接的に、トランスポゾン誘導（ｔｒａｎｓｐｏｓｅｄ−ｄｅｒｉｖｅｄ）ＰＣＲ産物を増幅することが有益である。これは、アダプター結合ＰＣＲプライマーを用いてトランスポゾンＰＣＲを行うことで達成でき、当該プライマーのＭｓｅＩ（またはその他の制限酵素）側におけるアダプターの１つの鎖は、シーケンスビーズに結合したオリゴヌクレオチドに相補的である。それゆえ、シーケンシング反応は、トランスポゾン側から生じると考えられ（シーケンシングはビーズに向かって生じるため）、結果として、トランスポゾンから外側に向かって起こる配列がもたらされる。
【００５８】
次の工程において、ビーズは油中水マイクロリアクターにて乳化されるが、それぞれの油中水マイクロリアクターは単一のビーズを含む。ＰＣＲ試薬は、油中水マイクロリアクター中に存在しており、マイクロリアクター中で行われるＰＣＲ反応を可能とする。引き続いて、マイクロリアクターは壊され、ＤＮＡを含むビーズ（ＤＮＡ陽性ビーズ）が濃縮される。
【００５９】
続く工程において、ビーズはウェルに充填され、ここにおいて、それぞれのウェルは単一のビーズを含む。ウェルは好ましくはＰｉｃｏＴｉｔｅｒ（商標）Ｐｌａｔｅの一部であり、大量の断片の同時配列決定を可能にする。
【００６０】
酵素保持ビーズの添加の後、断片の配列はパイロシーケンシング（ｐｙｒｏｓｅｑｕｅｎｃｉｎｇ）を用いて決定される。連続的な工程において、ＰｉｃｏＴｉｔｅｒ（商標）Ｐｌａｔｅおよびビーズならびにその中の酵素ビーズは、従来のシーケンシング試薬の存在下で異なるデオキシリボヌクレオチドにさらされ、デオキシリボヌクレオチドの取り込みにより、光シグナルが作られ記録される。正しいヌクレオチドの取り込みは、検出可能なパイロシーケンシングシグナルを作り出すだろう。
【００６１】
Ｐｙｒｏｓｅｑｕｅｎｃｉｎｇ自体は当該分野において既知であり、とりわけｗｗｗ．ｂｉｏｔａｇｅｂｉｏ．ｃｏｍ、ｗｗｗ．ｐｙｒｏｓｅｑｕｅｎｃｉｎｇ．ｃｏｍ／ｓｅｃｔｉｏｎｔｅｃｈｎｏｌｏｇｙに記載される。技術は更に、例えば、ＷＯ０３／００４６９０、ＷＯ０３／０５４１４２、ＷＯ２００４／０６９８４９、ＷＯ２００４／０７０００５、ＷＯ２００４／０７０００７、およびＷＯ２００５／００３３７５（全て４５４ＬｉｆｅＳｃｉｅｎｃｅｓの名において）に記載のものが適用され、これらは本願に援用される。
【００６２】
シーケンシングの後、シーケンシング工程から直接得られる断片の配列は、好ましくはｉｎｃｉｌｉｃｏで整理され、何れかのビーズアニーリング配列、シーケンシングプライマー、アダプターまたはトランスポゾン関連配列情報が除去される。これは、次の工程において、データベースからの既知の配列とのよりよいアラインメントをもたらし、何れかの考えられるヒットが同定される可能性がある。これをｉｎｓｉｌｉｃｏで行うために、タグから提供される情報は、分離したデータベースフィールドに保存され、それにより、後に、発見された変異遺伝子はＤＮＡプール中のアドレスにつなげられる。
【００６３】
典型的に、アラインメントまたはクラスター形成は、何れかの付加されたアダプター／プライマーおよび／または識別子配列のために整理された配列データに基づいて行われ、すなわち、核酸サンプルに由来する断片の配列データのみを用いて行われる。
【００６４】
比較目的のための配列のアラインメント方法は当該分野において周知である。様々なプログラムおよびアラインメントアルゴリズムは以下の文献に記載されている：ＳｍｉｔｈおよびＷａｔｅｒｍａｎ（Ａｄｖ．Ａｐｐｌ．Ｍａｔｈ．２：４８２（１９８１））；ＮｅｅｄｌｅｍａｎおよびＷｕｎｓｃｈ（Ｊ．Ｍｏｌ．Ｂｉｏｌ．４８：４４３（１９７０））；ＰｅａｒｓｏｎおよびＬｉｐｍａｎ（Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ８５：２４４４（１９８８））；ＨｉｇｇｉｎｓおよびＳｈａｒｐ（Ｇｅｎｅ７３：２３７−２４４（１９８８））；ＨｉｇｇｉｎｓおよびＳｈａｒｐ（ＣＡＢＩＯＳ５：１５１−１５３（１９８９））；Ｃｏｒｐｅｔら（Ｎｕｃｌ．ＡｃｉｄｓＲｅｓ．１６：１０８８１−９０（１９８８））；Ｈｕａｎｇら（ＣｏｍｐｕｔｅｒＡｐｐｌ．ｉｎｔｈｅＢｉｏｓｃｉ．８：１５５−６５（１９９２））；およびＰｅａｒｓｏｎら（Ｍｅｔｈ．Ｍｏｌ．Ｂｉｏｌ．２４：３０７−３１（１９９４））（これらは本願に援用される）。Ａｌｔｓｃｈｕｌらの文献（ＮａｔｕｒｅＧｅｎｅｔ．６：１１９−２９（１９９４））（本願に援用される）は、配列アラインメント法および相同性計算法の詳細な考察を示している。
【００６５】
ＮＣＢＩＢａｓｉｃＬｏｃａｌＡｌｉｇｎｍｅｎｔＳｅａｒｃｈＴｏｏｌ（ＢＬＡＳＴ）（Ａｌｔｓｃｈｕｌら、１９９０）は、ＮａｔｉｏｎａｌＣｅｎｔｅｒｆｏｒＢｉｏｌｏｇｉｃａｌＩｎｆｏｒｍａｔｉｏｎ（ＮＣＢＩ、ベセズダ、Ｍｄ．）およびインターネットを含む幾つかのソースから、配列分析プログラムｂｌａｓｔｐ、ｂｌａｓｔｎ、ｂｌａｓｔｘ、ｔｂｌａｓｔｎおよびｔｂｌａｓｔｘとの組み合わせにおける使用のために利用できる。それは、ｈｔｔｐ：／／ｗｗｗ．ｎｃｂｉ．ｎｌｍ．ｎｉｈ．ｇｏｖ／ＢＬＡＳＴ／からアクセスできる。このプログラムを使用してどのように配列同一性を決定するかという記述は、ｈｔｔｐ：／／ｗｗｗ．ｎｃｂｉ．ｎｌｍ．ｎｉｈ．ｇｏｖ／ＢＬＡＳＴ／ｂｌａｓｔ＿ｈｅｌｐ．ｈｔｍｌにて利用できる。データベースは、好ましくは、ＥＳＴ配列、関心ある種のゲノム配列および／またはＧｅｎＢａｎｋの非重複配列データベース、または同様の配列データベースを含む。
【００６６】
ハイスループットシーケンシング法は、Ｓｈｅｎｄｕｒｅらによる文献（Ｓｃｉｅｎｃｅ，Ｖｏｌ３０９，Ｉｓｓｕｅ５７４１，１７２８−１７３２）に記載されるとおりに使用できる。その例は、微小電気泳動シーケンシング（ｍｉｃｒｏｅｌｅｃｔｒｏｐｈｏｒｅｔｉｃｓｅｑｕｅｎｃｉｎｇ）、ハイブリダイゼーションシーケンシング／ハイブリダイゼーション（ＳＢＨ）によるシーケンシング、増幅された分子のサイクリック−アレイシーケンシング（ｃｙｃｌｉｃ−ａｒｒａｙｓｅｑｕｅｎｃｉｎｇ）、単一分子のサイクリック−アレイシーケンシング、非周期的、単一分子、リアルタイム方法、例えば、ポリメラーゼシーケンシング、エキソヌクレアーゼシーケンシング、ナノポアシーケンシングである。
【００６７】
最適な結果のために、断片または増幅した産物は十分な重複性（ｒｅｄｕｎｄａｎｃｙ）で配列決定されることは興味深い。重複性は、シーケンシングのエラーと真のゲノム配列との間の区別を作ることができるものである。特定の実施態様において、シーケンシングの重複性は、好ましくは少なくとも４、より好ましくは少なくとも５であるが、例示からわかるように、６を越える、好ましくは８を越えるまたは１０を越える重複性でさえ、発明の概念に必須ではないものの、有利であると考えられる。
【００６８】
本方法の工程（ｉ）において、データベース中でヒットし、それゆえ関心ある遺伝子または表現型とつなげられてよい断片が同定される。この情報に基づいて、タグは、プールおよび／または植物の同定のために使用できる。データベースでのヒットに基づいて、プローブは、関心ある遺伝子の同定を可能にするよう設計される。
【実施例】
【００６９】
本発明は、原則の例証を提供する以下の例によって例証される。トランスポゾン集団のスクリーニングは、新規のハイスループットシーケンシング方法（例えば４５４ＬｉｆｅＳｃｉｅｎｃｅｓのもの）を用いて進められる。現在の最高水準の技術で、４５４ＬｉｆｅＳｃｉｅｎｃｅｓ技術は１回のシーケンシング行程で約最高４０Ｍｂの配列をもたらす。リード長の現在の限界は約１００−２００ｂｐ／リードである。平均２００のトランスポゾンを有している３０７２の植物からなる集団をスクリーニングして、特定の遺伝子のトランスポゾンタギングを同定することを想定して、以下のアプローチがとられる：
１）トランスポゾン集団の３０７２の植物のゲノムＤＮＡが単離される；
２）植物当りの等量のＤＮＡの三次元プーリングスキームが設定され（例えば１５ｘ１５ｘ１４）、３０７２／１４＝２１９または３０７２／１５＝２０５の異なるＤＮＡサンプルを含む４４のプール（１５＋１５＋１４＝４４）がもたらされる（Ｖａｎｄｅｎｂｕｓｓｃｈｅら、２００３）；このプーリング工程は、配列データからの直接の挿入を含む個々の植物の同定を可能とするのに役立つ。ゲノムＤＮＡのプーリングは、更に、ＰＣＲ増幅の前にＤＮＡを標準化し、全てのＤＮＡが配列ライブラリーにて等しく見受けられる可能性を増加させることに役立つ；
３）アダプター結合制限断片テンプレート（ＡＦＬＰテンプレート、ＥＰ５３４８５８、ＶｏｓらＮＡＲ１９９５，２３，４４０７参照）は、２５０−５００ｂｐごとにゲノムを切断する単一の制限酵素を使用して（例えば４−または５カッターを使用して、例えばＭｓｅＩ）、全ての４４のプールされたＤＮＡから作られた；
４）一方向性ＰＣＲ増幅を、トランスポゾン配列の境界に位置して外方向に向くＰＣＲプライマーおよび非選択的アダプタープライマーを使用して実行し、マルチプレックスで全てのトランスポゾンの隣接配列を増幅する。２００のトランスポゾンを含む植物につき、これは、境界側につき２００×約２５０ｂｐ＝５０ｋｂの隣接配列をもたらし、その２０ｋｂは、１００ｂｐリード長の場合に配列決定されるだろう。３０７２の植物のために、これは１５３Ｍｂ隣接配列に等しく、その６１Ｍｂが、１００ｂｐの配列リード長の場合に配列決定可能である；
５）全ての４４ウェルからのＰＣＲ産物の等量は、プールされたＰＣＲ産物ライブラリーを構築するためにプールされる；
６）プールされたＰＣＲ産物ライブラリーは、ＰＣＲ産物の更なる分画を行うことなく、４５４ＬｉｆｅＳｃｉｅｎｃｅｓ合成による配列決定技術（ｓｅｑｕｅｎｃｉｎｇ−ｂｙ−ｓｙｎｔｈｅｓｉｓｔｅｃｈｎｏｌｏｇｙ）を使用して、配列決定される。出力は、約２００，０００の１００ｂｐ配列であり、３０７２の植物の全ての隣接配列の平均の０．３３Ｘ（２０／６１Ｍｂ）被覆度（ｃｏｖｅｒａｇｅ）を意味する。それゆえ、少なくとも３回の配列決定行程が、全３０７２の植物の隣接配列の非常に大多数を標的とするために必要である；
７）結果として生じる配列をＢＬＡＳＴ検索し、ＥＳＴまたはゲノム配列とのヒットを同定する；
８）関心ある遺伝子にトランスポゾン挿入を保持している植物をそれらのタグに基づいて同定し、任意にプローブまたはＰＣＲプライマーを作製し確認する。
【００７０】
例１：
１０００ペチュニアＷ１３８植物の集団を、Ｖａｎｄｅｎｂｕｓｓｃｈｅらの文献（２００３）またはその他の文献の記載の通りに３次元戦略にそってサンプル取得し、３つの座標で集団全体の全ての個体を網羅する、３０のプールされたサンプル（Ｘ１−Ｘ１０、Ｙ１−Ｙ１０およびＺ１−Ｚ１０）を得た。これは、何れかの特定のＰＣＲ産物の起源を、集団内の起源の植物に突き止めることを可能にする。
【００７１】
次に、トランスポゾン内で切断する酵素および隣接ゲノムＤＮＡにて特異的であるがランダムな位置で切断する酵素によって、ＤＮＡサンプルを消化した。
【００７２】
アダプターを結合させて、全ての設計された断片の引き続くＰＣＲ増幅を可能にした。ビオチン化アダプターは内部トランスポゾン部位に結合させた。
【００７３】
次に、ＤＮＡサンプルを精製し、ストレプトアビジンビーズを添加しおよびマグネットを使用して、ビオチン化断片を回収した。
【００７４】
全てのＤＮＡプールに存在する全てのトランスポゾン挿入からの全ての隣接配列を、次に、改良したトランスポゾンディスプレイプロトコールを用いて増幅した（ＶａｎｄｅｎＢｒｏｅｃｋら、１９９８）。
【００７５】
サンプル中の全てのプールされたサンプル、Ｘ１−Ｘ１０、Ｙ１−Ｙ１０およびＺ１−Ｚ１０のために、その５’末端（３Ｄ−タグ）において４ヌクレオチドとして相当するプール座標を取り込んで、異なるトランスポゾンプライマーを使用した。
【００７６】
全てのＰＣＲ産物は、引き続いて、３つのスーパープール（それぞれの次元のために１つ）にプールし、当該分野にて記述される方法にそったサンプルの標準化を可能とした；この工程に伴い、全ての個体に存在しおよびそのため全てのサンプルに存在する断片は、発生率が減少する。このことは、配列決定しようとするサンプルにおける断片の過剰な提示を予防する。
【００７７】
得られた一本鎖分子のコレクションを、ＭｕｎＩサイトを有する特異的プライマーを用いてＰＣＲ増幅を１回行うことにより、二本鎖分子に変換した。
【００７８】
更なる増幅または直接４５４（Ｇ２０）シーケンシングの何れかを可能とするアダプター配列の引き続くライゲーションを可能にするために、得られた産物をＭｕｎＩ／ＭｓｅＩを用いて消化した。
【００７９】
３つのサンプルを、次に、１つのスーパープールにプールし、製造者により記載される通りにＲｏｃｈｅＧＳ２０／４５４シーケンシング法に供した。
【００８０】
トランスポゾンディスプレイによるトランスポゾン隣接配列の増幅および引き続く１０００植物の集団からのハイスループットシーケンシングのために、プロトコールを開発した。
【００８１】
方法の概要
方法の概要は以下の通りである：
ＤＮＡ調製（３Ｄ様式で標本抽出される１０００の植物、３０のプールされたＤＮＡに帰着する）；
ＭｕｎＩ／ＭｓｅＩ消化（約５μｇのプールされたＤＮＡ）；
Ｂｉｏ−Ｍｕｎ及びＭｓｅアダプターライゲーション連結；
精製（ＰＣＲ精製カラム、ｂｉｏ−Ｍｕｎアダプターおよび非常に小さい断片の除去）；
ビーズ抽出（Ｍｕｎ／Ｍｓｅ断片の濃縮）；
トランスポゾンディスプレイＰＣＲ増幅：
ＭｕｎＡＣＡＣ及びＭｓｅ＋０プライマーによる予備増幅（トランスポゾン隣接配列の濃縮）；
プールされた特異的なＩＲ^＊＊ｏｕｔｗ及びＭｓｅ＋０プライマーによる選択的ＰＣＲ（トランスポゾン隣接配列の増幅）；
「ブロック（Ｂｌｏｃｋ）」、「ロウ」および「カラム」プールへの第２のプーリング；
標準化；
二本鎖分子への転換；
ＭｕｎＩ／ＭｓｅＩ消化；
４５４−Ｍｕｎ−Ｂ及び４５４−Ｍｓｅ−Ａアダプターライゲーション；
ｂｉｏ−ＡｍｐＢ及びＡｍｐＡプライマーによるＰＣＲ増幅；
１サンプルへの最終的なプーリング；
４５４シーケンシング。
【００８２】
ＤＮＡ調製
３Ｄ様式で標本抽出される１０００の植物から、それぞれ１００植物を代表する３０のＤＮＡサンプルがもたらされる；方法は、Ｖａｎｄｅｎｂｕｓｓｃｈｅら、ＰｌａｎｔＣｅｌｌ１５（１１）：２６８０−２６９３（２００３）による。
【００８３】
ＭｕｎＩ／ＭｓｅＩ消化（約５μｇ）３０サンプル
【表１】

【００８４】
アダプターライゲーション
【表２】

【００８５】
アダプター配列：
ＭｕｎＩ（ｂｉｏ）アダプター：ｂｉｏ−５’−ＣＴＣＧＴＡＧＡＣＴＧＣＧＴＡＣＧ−３’
３’−ＣＴＧＡＣＧＣＡＴＧＣＴＴＡＡ−５’
ＭｓｅＩアダプター：５’−ＧＡＣＧＡＴＧＡＧＴＣＣＴＧＡＧ−３’
３’−ＴＡＣＴＣＡＧＧＡＣＴＣＡＴ−５’
【００８６】
精製３０サンプル
ＱｕｉａｇｅｎＰＣＲ増幅キットを用いたＤＮＡの精製。５５μｌのＥＢ緩衝液で溶出（１．５％アガロースゲル上で５μｌ）。
【００８７】
ビーズ抽出３０サンプル
２００μｌＳＴＥＸにて２５μｌストレプトアビジンビーズ（約０．１ｍｇＭｙＯｎｅビーズ、ストレプトアビジンＣ１）を１回洗浄、および１００μｌ結合緩衝液に再懸濁。
【表３】

【００８８】
１００μｌの希釈した（および洗浄した）ストレプトアビジンビーズを５００μｌの制限／ライゲーション混合物に添加、および６０分間ローテーターで室温にてインキュベート。マグネットを用いてビーズを回収、および上清を除去。２００μｌＳＴＥＸでビーズを洗浄、および別のチューブに移す。２００μｌのＳＴＥＸでビーズを３回洗浄、および最終的に５０μｌのＴ_０１Ｅに再懸濁、別のチューブに移す（ＳＴＥＸウェルを除去）。
【表４】

【００８９】
トランスポゾンディスプレイＰＣＲ増幅：予備増幅３０サンプル
２μｌのテンプレートＤＮＡを取り（ビーズウェルを混合、ＤＮＡ断片をなお回収）および以下のミックスを混合、
【表５】

【００９０】
および、以下のＰＣＲプロファイルに従ってインキュベート（ＰＥ９６００）
【表６】

【００９１】
プライマー配列：
ＭｕｎＩ＋ＡＣＡＣ：５’−ＡＧＡＣＴＧＴＧＴＡＣＧＡＡＴＴＧＡＣＡＣ−３’
ＭｓｅＩ＋０：５’−ＧＡＣＧＡＴＧＡＧＴＣＣＴＧＡＧＴＡＡ−３’
１．５％アガロースゲル上で５μｌを分析、および水で１０倍にサンプルを希釈、選択的ＰＣＲ増幅を実行。
【００９２】
トランスポゾンディスプレイＰＣＲ増幅：
選択的増幅３０サンプル
５μｌのテンプレートＤＮＡを取得、および以下のミックスを添加。
【表７】

【００９３】
および、それらを以下のＰＣＲプロファイルにそってインキュベート（ＰＥ９６００）。
【表８】

【００９４】
プライマー配列：
ＩＲ_ｏｕｔｗ：^＊５’−ＣＡＴＡＴＡＴＴＡＡＮＮＮＮＧＴＡＧＣＴＣＣＧＣＣＣＣＴＧ−３’
全てのプールされたサンプルは、ＮＮＮＮ位置で特定されるユニークなＩＲ_ｏｕｔｗプライマーで増幅する；これは、得られた配列を、それらの起源の座標に割り当てることを可能にする。
ＭｓｅＩ＋０：５’−ＧＡＣＧＡＴＧＡＧＴＣＣＴＧＡＧＴＡＡ−３’。
【００９５】
第２のプーリング３０サンプルを３サンプルに
それぞれの次元由来の１０サンプルからのＰＣＲ産物をプールし、３サンプルを作製：カラム／ロウ／ブロック。
【００９６】
標準化
多くのまたは全ての個体に共有される断片の背景（ｂａｃｋｄｒｏｐ）に対するユニークな断片の量を強化するために、第２のプールされたサンプルを、従来の既知の方法に基づいて標準化する。方法は、一本鎖分子を得るための、ハイブリダイゼーションおよび精製工程を含む。
【００９７】
ハイブリダイゼーション（それぞれのサンプル当り約１０μｇ）３サンプル
プールされたサンプルのＤＮＡの沈殿、および１５−３５μｌに溶解
１５μｌのホルムアミドに添加（相対的量）：
４．５μｌＴＥ
３ μｌＨ_２Ｏ
鉱油の下で８０℃まで３分間加熱
添加３μｌ緩衝液Ａ
４．５μｌＨ_２Ｏ
プローブＯ／Ｎを３０℃でインキュベート
【表９】

【００９８】
ＨＡＰクロマトグラフィーで精製３サンプル
一本鎖分子を、ｄｅＦａｔｉｍａＢｏｎａｌｄｏら、ＧｅｎｏｍｅＲｅｓｅａｒｃｈ，６：７９１−８０６（１９９６）に記載されるとおりに、標準的ＨＡＰクロマトグラフィーにて選択し、引き続いて２本鎖分子に変換する。
【００９９】
２本鎖分子への変換３サンプル
「Ｍｓｅ＋０およびＭｕｎサイト」プライマーにて１回ＰＣＲサイクル
５０μｌプライマーに以下のミックスを添加
【表１０】

【０１００】
プライマー配列：
ＭＩＢＵＳ７９６：５’−ＣＡＴＡＴＡＣＡＡＴＴＧＧＡＣＧＡＴＧＡＧＴＣＣＴＧＡＧＴＡＡ−３’
および、以下のプロファイルに従ってそれらをインキュベート（ＰＥ９６００）：
【表１１】

【０１０１】
ＭｕｎＩ／Ｍｓｅ消化３サンプル
【表１２】

【０１０２】
４５４アダプターライゲーション
【表１３】

【０１０３】
アダプター配列
ＭｕｎＩアダプターＢ：
ＭＩＢＵＳ８０３
５’−ＣＣＴＡＴＣＣＣＣＴＧＴＧＴＧＣＣＴＴＧＣＣＴＡＴＣＣＣＣＴＧＴＴＧＣＧＴＧＴＣＴＣＡＧ−３’
ＭＩＢＵＳ７９５
３’−ＡＧＧＧＧＡＣＡＣＡＣＧＧＡＡＣＧＧＡＴＡＧＧＧＧＡＣＡＡＣＧＣＡＣＡＧＡＧＴＣＴＴＡＡ−５’
ＭｓｅＩアダプターＡ：
ＭＩＢＵＳ８００
５’−ＣＣＡＴＣＴＣＡＴＣＣＣＴＧＣＧＴＧＴＣＣＣＡＴＣＴＧＴＴＣＣＣＴＣＣＣＴＧＴＣＴＣＡＧ−３’
ＭＩＢＵＳ８０１
３’−ＧＡＧＴＡＧＧＧＡＣＧＣＡＣＡＧＧＧＴＡＧＡＣＡＡＧＧＧＡＧＧＧＡＣＡＧＡＧＴＣＡＴ−５’。
【０１０４】
４５４配列のためのＰＣＲ増幅３サンプル
増幅アダプタープライマーＡおよびＢ：
ＭＩＢＵＳ８０３ｂｉｏ−５’−ＣＣＴＡＴＣＣＣＣＴＧＴＧＴＧＣＣＴＴＧ−３’
ＭＩＢＵＳ８０２５’−ＣＣＡＴＣＴＣＡＴＣＣＣＴＧＣＧＴＧＴＣ−３’。
【０１０５】
最終プーリング３サンプルを１サンプルに
ハイスループットシーケンシングに備えて、サンプルをプールし、１スーパープールを作製。
【０１０６】
４５４シーケンシング１サンプル
挿入サイズ分布試験のためのｐＧＥＭ−Ｔクローニング１サンプル
標準化方法の効率を試験するため、我々は、サイズ分布の決定のためにランダムに２２の断片を単離した。１μｌＰＣＲミックス（４５４シーケンシングのためのスーパープールサンプル由来）を取る
以下を添加
【表１４】

【０１０７】
インキュベート：３時間、３７℃
Ｅ．ｃｏｌｉ（ＤＨ５α細胞）へ形質転換
ＬＢ⁻Ａｍｐプレートに１００μｌをまく
インキュベート：ｏ／ｎ、３７℃
２２コロニーをひろう
ＡｍｐＡ／ＡｍｐＢプライマーを用いて、煮沸したプレップにてＰＣＲを実行
および、２％アガロースゲルで泳動。
【０１０８】
結果：
平均１０２塩基対の３１８．０００配列タグのデータベースを得た。２３０．０００配列のサブセットは、３つのレベルに完全に並べられた：
１）トランスポゾンの逆方向反復に隣接する（ＣＣＧＣＣＣＣＴＧで終了する）、配列の配列同一性。同一の挿入を同定する全ての配列は１つのグループとみなされる。
２）それぞれのグループ内にて、配列を、それらの５’配列における異なる３Ｄタグに従って並べる。
【０１０９】
３）グループに属す配列のコピー数に従って。
データは、（全３１８．０００配列の）２３０．０００の並べられた配列由来の２０％の分析に基づいて推定した。分析は、図１から９に示される。
【表１５】

【図面の簡単な説明】
【０１１０】
【図１】ユニークなゲノム配列からなる（右から左）、ｄｔｐｈ１トランスポゾン隣接配列、配列タグの一般的組み立ての分布分析における、トランスポゾン（逆方向反復）配列および３Ｄタグが記述される。１００の植物の集団は、３Ｄ格子（１０＊１０＊１０）によって組織化され、ここにおいて、各々の植物は、ｘ、ｙおよびｚ軸に沿ってその位置を反映するユニークな３Ｄ座標（ｘ，ｙ，ｚ）によって同定される。次元Ｘ１からＸ１０は、配列タグ番号１から１０に相当し、ＹおよびＺも同様である。図中のタグコードは、配列名におけるタグ＃に言い換えられ、例えば、ＡＧＡＣはｔａｇ０７に相当する。画像は、プール座標（３、１７、２４）とともに、植物における３Ｄヒットを表す。
【図２】図２は、挿入隣接配列データベースに対する、特異的な遺伝子配列、ペチュニア転写制御因子ＮＡＭ−ｌｉｋｅ３遺伝子（頂端分裂組織同類でない、ｇｊ｜２１１０５７３３｜ｇｂ｜ＡＦ５０９８６６．１）でのｂｌａｓｔ検索の結果を示す；挿入ヒットは、座標２、１２、３０で同定される。この結果は、特異的な相同的コード配列の挿入を追跡できることを実証する。
【図３】図３は、データベースに対する、特異的だが異種性の遺伝子配列（シロイヌナズナＡＧＬ６２ＭＡＤＳボックス遺伝子）のｂｌａｓｔ検索の結果を記述する；挿入ヒットは、植物９、１７、２９で同定される；このヒットは、ペチュニアにおいてこれまで未知の潜在的ＭＡＤＳボックス遺伝子およびその対応する変異体を指定する。この結果は、特異的な異種性コード配列の挿入が効率よく追跡されることを実証する。
【図４】図４は、配列分析を提供する。ここにおいて、利用できる３１８．０００の配列のうちの２３０．０００のサブセットは、３つのレベルによって完全に順序付けられる：１）隣接配列の配列同一性（挿入部位に従って順序付けられる）。同じ挿入を同定する全ての配列は、１つの群と呼ばれる。
【０１１１】
２）群内で、それらの異なる３Ｄ配列タグに従う。
【０１１２】
３）群に属す配列のコピー数に従う。
【０１１３】
以下のグラフは、（合計３１８．０００の配列の）２３０．０００の順序付けられた配列から、２０％の分析に基づいて推定された。これらのグラフの解釈を促進するため、配列の３群がこの図に示され、３つの独立したトランスポゾン挿入部位が表される。第１の例は、位置５−８にわたるそれぞれの３Ｄタグ、それに続く、位置２２で終了するトランスポゾンの逆方向反復、それに続くゲノム遺伝子のストレッチとともに、４つの配列を同定する。座標６−２０−２９は、この配列を、集団のその特定の座標で植物に属すると定義する。Ｔａｇ０１からｔａｇ１０：Ｘ次元、Ｔａｇ１１からｔａｇ２０：Ｙ次元、Ｔａｇ２１からｔａｇ３０：Ｚ次元。
【図５】図５は、相対的な次元分布対コピー数発生率の図示を提供する。
【図６】３つのコピーを有する３５００の配列タグのうち２９４は３つのユニークな座標を有しており、このことは、これらが、これらの配列をそれらの起源の植物に遡って追跡できたことを意味する。その他のコピークラスのために、それらの数は４−コピークラスのための５３２；５−コピークラスのための６２２；６−コピークラスのための４７８；および残りのクラスのための１５００であった。このことは、全体で、３０００を越える配列タグが同定され（利用できる３１８．０００のうちの２３０．０００から）、それらの起源の植物に戻って関連があることを意味する。
【図７】図７は、３Ｄ４５４トランスポゾンライブラリーの配列の全推定された３Ｄヒット番号および総数に対する、４つのコピー数クラスおよびそれらの相対的な寄与を表す。
【図８】図８は、＃挿入部位の数（群）対コピー数（完全な範囲）を示す。配列タグ当りのコピー数の分析は、分析したサブセットの２３０．０００のなかで、ほぼ１６．０００のユニークな断片が存在し；７５００の断片は２コピーを有し；３５００は３コピーを有し；２５００は４コピーを有し；１５００は５コピーを有し；１０００は６コピーを有し；１３５０は７または８コピーを有し；１１００は９−１１コピーを有した；１４００は１２−２０コピーを有し；９５０は２１−４０コピーを有し；一方で残余が残りのコピーを有することを示している。
【図９】図９は、一部の結果の図示を提供する。２５３．３９４の配列のサブセット（合計３１８．０００）が分析され、配列の１％のみが、認識可能なタグを含まなかった（？？で示す、右カラム）。２３０．０００配列タグのサブセットの２０％の分析は、集団の異なるプールされたサンプル上の配列タグの良好な分布を示し、および座標２３の６０００以上から座標１５のほぼ３０．０００までにわたった；平均は約８５００であった。断片の１％未満は、特異的な座標への割り当てができなかった。
【図１０】図１０は、タグおよびビーズアニーリング配列を保持するアダプター指向プライマーおよびトランスポゾン指向プライマーを使用する、ＭｓｅＩ−ＥＣＯＲＩ制限断片にて標的とされるトランスポゾンの略図である。
【図１１】図１１は、ビーズアニーリング配列（Ｂ）を介して、ビーズにアニールした増幅されたアダプター結合断片の略図である。断片は、タグ（Ｔ１および／またはＴ２）、アダプター（ＡＤ）、制限部位（ＲＥ）の最終的な残り、断片自体の配列（ＳＥＱ）、トランスポゾン特異的プライマー配列（ＴＲ）およびシーケンシング工程の開始のために使用される、シーケンスプライマー結合部位（ＳＰＢＳ）を含む。

【特許請求の範囲】
【請求項１】
以下の工程を含む、トランスポゾン集団のメンバーにおける関心ある遺伝子または配列に関連した挿入の同定のための方法：
（ａ）個々にまたはプール中にて、トランスポゾン集団のゲノムＤＮＡを単離すること；
（ｂ）任意に、工程（ａ）で得られるＤＮＡをプールすること；
（ｃ）１以上、好ましくは２以上、最も好ましくは２つの制限酵素（好ましくはその少なくとも１つが、トランスポゾンを切断しない高頻度切断制限エンドヌクレアーゼであり、好ましくは少なくとも１つが、トランスポゾンで切断する希少切断制限酵素である）を使用してＤＮＡを制限処理し、制限断片にアダプターを結合し、それによってアダプター結合制限断片を作製すること；
（ｄ）一対の（任意に、ラベルした）プライマーを用いてアダプター結合制限断片を増幅すること、ここにおいて、プライマーの１つは、（既知の）トランスポゾン配列の一部に相補的（ハイブリダイズ可能）であるセクションを含み、更にシーケンスプライマー結合部位を含み、ここにおいて他方のプライマーは少なくともアダプターに相補的であり、ここにおいて一方または両方のプライマーはタグを含む；
（ｅ）任意に、工程（ｄ）の増幅産物をプールし、増幅産物のライブラリーを構築すること；
（ｆ）任意に、ライブラリー中の増幅産物を断片化すること；
（ｇ）ハイスループットシーケンシングを使用して、（ｄ）、（ｅ）または（ｆ）の断片のヌクレオチド配列を決定すること；
（ｈ）任意に、ｉｎｓｉｌｉｃｏで断片の配列を整え、それによって何れかのアダプターおよび／またはトランスポゾンに関連した配列情報を削除すること；
（ｉ）データベースからヌクレオチド配列をアライニングできる、工程（ｇ）または（ｈ）の１以上の断片を同定し、それによってデータベースからのヌクレオチド配列と関心ある表現型との相関関係を示すこと；
（ｊ）工程（ｉ）の断片を含んでいるトランスポゾン集団のメンバーを同定すること；
（ｋ）任意に、工程（ｉ）の断片に基づいてプローブまたはＰＣＲプライマーペアを設計し、およびそれを使用して（ｊ）で同定されたメンバーのゲノムの関心ある遺伝子におけるトランスポゾン挿入を確認すること。
【請求項２】
請求項１に記載の方法であって、前記プーリングが３Ｄプーリング戦略である方法。
【請求項３】
請求項１または２に記載の方法であって、前記データベースが、ＥＳＴ配列、関心ある種のゲノム配列および／またはＧｅｎＢａｎｋの非重複配列データベース、または同様の配列データベースを含む方法。
【請求項４】
請求項１から３の何れか１項に記載の方法であって、前記ハイスループットシーケンシングが、好ましくはキャピラリー電気泳動法による、サンガーシーケンシングに基づく方法。
【請求項５】
請求項１から３の何れか１項に記載の方法であって、前記ハイスループットシーケンシングは、合成による配列決定、好ましくはパイロシーケンシングである方法。
【請求項６】
請求項１から４の何れか１項に記載の方法であって、前記シーケンシングがビーズといった固体担体にて行われる方法。
【請求項７】
請求項６に記載の方法であって、前記シーケンシングが以下の工程を含む方法：
（１）シーケンシング−アダプター−結合断片をビーズにアニーリングさせる、ここにおいて、それぞれのビーズは単一の断片とアニーリングする；
（２）油中水マイクロリアクター中でビーズを乳化する、ここにおいて、油中水マイクロリアクターは単一のビーズを含む；
（３）エマルジョンＰＣＲを行い、ビーズの表面上でアダプター結合断片を増幅する；
（４）増幅したアダプター結合断片を含むビーズを選択／濃縮する；
（６）ウェルにビーズを充填する、ここにおいて、それぞれのウェルは単一のビーズを含む；および
（７）ピロリン酸シグナルを作る。
【請求項８】
請求項１から７の何れか１項に記載の方法であって、前記プライマーの少なくとも１つが、１以上の結合親和性の増大したヌクレオチドを含む方法。

【図１】

【図２】

【図３】

【図４】

【図５】

【図６】

【図７】

【図８】

【図９】

【図１０】

【図１１】

【公表番号】特表２００９−５１５５１８（Ｐ２００９−５１５５１８Ａ）
【公表日】平成２１年４月１６日（２００９．４．１６）
【国際特許分類】

化学；冶金 (1,075,549)
- 生化学；ビール；酒精；ぶどう酒；酢；微生物学；酵素学；突然変異... (115,607)
  - 酵素または微生物を含む測定または試験方法そのための組成物または... (20,915)
    - 酵素または微生物を含む測定または試験方法；そのための組成物；そ... (20,907)
      - 核酸を含むもの (9,829)
  - 微生物または酵素；その組成物 (68,222)
    - 突然変異または遺伝子工学；遺伝子工学に関するＤＮＡまたはＲＮＡ... (28,831)
      - 組換えＤＮＡ技術 (27,772)

【出願番号】特願２００８−５３９９４９（Ｐ２００８−５３９９４９）
【出願日】平成１８年１１月８日（２００６．１１．８）
【国際出願番号】ＰＣＴ／ＮＬ２００６／０００５６１
【国際公開番号】ＷＯ２００７／０５５５６８
【国際公開日】平成１９年５月１８日（２００７．５．１８）
【出願人】（５０５４７７１８７）ケイヘーネ・エヌ・ブイ (10)
【Ｆターム（参考）】

[ Back to top ]

トランスポゾンタギング集団のハイスループットスクリーニングおよび挿入部位の大規模並行配列特定のための方法

メニュー

スポンサーリンク

次の公報 »

« 前の公報

トランスポゾンタギング集団のハイスループットスクリーニングおよび挿入部位の大規模並行配列特定のための方法

メニュー

スポンサー リンク

次の公報 »

« 前の公報

スポンサーリンク