説明

変異させた集団のハイスループットスクリーニング

変異させた集団のメンバーにおける遺伝子中の変異のハイスループット同定のために、効率的な方法が開示される。本方法は、DNA単離、プール、増幅、ライブラリーの作成、好ましくは合成によるシークエンシング技術によるライブラリーのハイスループットシークエンシング、変異の同定、並びに変異を保有する集団のメンバーの同定及びその変異の同定を含む。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、分子生物学及び遺伝学の分野において、ハイスループットシークエンシング技術の使用に基づいた、集団中の変異の同定のために改良されたストラテジーに関する。本発明は、更に、本方法に適用できるキットを提供する。
【背景技術】
【0002】
重要な形質に影響する遺伝子を逆遺伝学(reverse genetics:リバースジェネティクス)アプローチによって同定、識別するために、誘発された変異又は天然に存在する変異のいずれかを保有する個体の集団は、最新のゲノミクス研究において使用される。この研究は、農学的に重要な植物及び作物に対して特に適用可能であるが、これら個体の集団は、酵母、細菌等の他の生物にも有用である。動物、トリ、哺乳類等の他の生物も使用することができるが、典型的には、これらの集団の採取又は制御は、より煩わしい。それにもかかわらず、本明細書において記述される本発明が非常に一般的な性質のものであり、そのような生物にも適用することができることが観察される。
【0003】
変異させた集団(mutagenized populations)は、機能欠損変異に対する既知遺伝子のスクリーニング(assessing:選別)又は変異遺伝子を有する生物における表現型変化の評価のために一般に使用されるように、突然変異した集団は遺伝子の発見のための相補的なツールである。律速段階は、それぞれ、対象となる遺伝子中に変異を保有する生物の同定に関連したスクリーニング研究である。以下で、そのような集団の本質及びスクリーニング方法はより詳細に記述され、遺伝子の発見のためのこれらのツールの価値を増加させる、より効率的なスクリーニング方法が示される。
【0004】
変異させた集団を使用する技術は、エチルメタンスルフォネート(EMS)による処理によって、又は電離放射線(高速中性子照射)(Li et al.The Plant Journal, 2001, 27, 235-42)によって、ゲノムへの多数変異(ほとんどヌクレオチド置換)を無作為に導入することによるTILLING(ゲノム中の標的化誘発局所的損傷(Targeted Induced Local Lesions In Genomes))(McCallum et al., Nat. Biotechnol 2000, 18, 455-457, McCallum et al., Plant Physiology, 2000, 123, 439-442; Till et al.Genome Research 2003, 13, 524-530)として既知である。この集団中のすべての植物は、数百の(又は数千の)変異体を保有し、そのうちのいくつかは、正常な発生、形態に影響するか、そうでなければ、1つ又は複数の遺伝子若しくはその遺伝子の調節配列の機能欠損(ノックアウト、ノックダウン)による表現型を与える。TILLING集団は、一般に、複数の独立した変異体(1つの遺伝子当たり5〜20個)ですべての遺伝子をカバーするために、十分な数の植物を含んでいる。したがって、TILLINGにおいて使用される変異させた植物集団は、通常、3000〜10000の植物から成り、以下に示す2つの方法において使用することができる。
【0005】
逆遺伝学
「逆遺伝学」は、TILLING集団を使用する最も一般的な方法である。対象となる遺伝子は、例えば、転写プロファイリング又は候補遺伝子アプローチによって同定され、応答すべき問題は、この遺伝子が対象となる或る特定の表現型形質に影響するかどうかである。したがって課題は、この遺伝子の機能欠損変異を有する1つの(又はいくつかの)植物を同定することである。これは、典型的には、下記工程を含む多重工程のスクリーニング過程において一般に実行される:
1.TILLING集団の多数の(プールした)M2植物(例えば3072個)のゲノムDNAを単離する。
2.1つのプール当たり8〜32の植物からの等しい量のDNAのプールは、CEL Iスクリーニング系の感受性に依存するプールレベルで集められる(以下を参照)。これは3072の植物の場合には、合計96〜384のプールしたDNAサンプルをもたらす。
3.すべてのプールされたDNAからの遺伝子の部分を増幅するために、標識されたPCRプライマーを使用する。オーバーラップしたPCR断片を、遺伝子全体をカバーするために使用する(例えば、600bpである複数のPCR断片が1500bpである1個の遺伝子から3回増幅される)。
4.プールされたDNAサンプルから採取されたPCR産物のヘテロ二本鎖を調製し、単一のヌクレオチド配列のミスマッチを認識し切断するCEL I又は他の酵素(例えば、マングビーンヌクレアーゼ、S1ヌクレアーゼ及びサーベイヤー(Surveyor)等)と共にインキュベートし、処理されたサンプルを変性(シークエンシング)ゲル上で又はキャピラリー電気泳動法によって分離する。
5.遺伝子中の変異を保有する植物を含むプールは、CEL I処理に起因する消化産物のバンドを観察することにより同定される。
【0006】
変異を保有する植物を同定するために、陽性プールにおける植物の個別のDNAに対してPCRが反復して行われ、双方向サンガー法のシークエンシングが続いて行われる。
【0007】
変異と観察された表現型変化との間の因果関係を立証するために、変異を有する植物を成長させ、野生型に対して外部交配する。
【0008】
CEL Iスクリーニング(上記の工程の3〜5)の利点は、プールされたサンプルをあらかじめスクリーニングすることによって、サンガー法のシークエンシングで個別にすべての植物をシークエンシングすることに要する費用を低減できることである。
【0009】
しかしながら、CEL Iスクリーニングの限界は、すべての同定された変異が遺伝子機能に影響するとは限らない(例えば、サイレント置換)ということであり、陽性のプールにおける個別の植物のPCR産物がシークエンスされるまではこのことはわからない。それにもかかわらず、CEL Iを介したスクリーニング方法は、すべての植物のPCR産物の個別のシークエンシングと比較して、コストが削減される。
【0010】
別の限界は、CEL Iスクリーニングがゲルの泳動及びスコアリング(ゲルパターンが常に明瞭だとは限らないので、第2鎖からの変異の確認を必要とする比較的煩わしい過程)を含んでいるということである。
【0011】
第3の短所は、CEL Iスクリーニングでは、PCR産物の末端での変異の検出に対して比較的感度が悪く、結果的に、これらの変異は検出されにくいと云うことである。CEL Iのさらなる短所は、この酵素が塩濃度のような反応条件に対して非常に影響を受けやすいことが発見されたということである。このことは、酵素を限られた数のバッファーにおいてのみにしか使用することができず、その結果としてCEL Iの広範囲の使用を妨げる。CEL Iの適用に関連した別の実際的な短所は、ミスマッチしたすべてのヘテロ二本鎖を切断した場合、酵素は確実ではないということである。
【0012】
最終的に、CEL Iスクリーニングは、ミスセンス変異(それらは最も優勢なものである)とナンセンス変異とを区別することができず、対象となる変異を得ることなく、陽性プールに対して多くのスクリーニング研究が行なわれる原因となる。
【0013】
順遺伝学(Forward Genetics:フォワードジェネティクス)
変異させた集団の植物を成長させ、対象となる形質について表現型の分析を行なった。次に、対象となる表現型に連鎖していない変異を外部交配するために、対象となる表現型を有する植物を野生型の植物と交配する。最終的に、対象となる表現型に関連する原因変異遺伝子は、従来の遺伝学的マッピング集団(F2、RIL(組換え近交系統)等))におけるマッピングQTL(量的形質遺伝子座)と類似したポジショナルクローニング(遺伝的マーカーを使用して)によって同定される。理論上可能ではあるが、変異させた集団は、一般にはこのように使用されない。
【発明の開示】
【発明が解決しようとする課題】
【0014】
本発明は、変異させた集団のスクリーニングに対する既存のストラテジーを部分的に改良する。本発明は、変異の存在に対して多くの集団をスクリーニングする効率的な方法を提供し、遺伝子機能への影響に対する変異の効率的な評価を改良し、すなわち遺伝子機能の変更をもたらさない変異のスクリーニングに費やされる負担の量を減少させることを目的とする。本方法は、CEL I酵素又はその同等物の使用を回避するように設計された。
【課題を解決するための手段】
【0015】
本発明者は、ハイスループットシークエンシングストラテジーを使用して上述の目標が達成されることを見出した。また、TILLING集団のような変異させた集団、変異が(合成)変異原性オリゴヌクレオチド若しくはオリゴヌクレオチド損傷DNAを使用して、又はすなわち標的化ヌクレオチド交換(TNE)若しくは領域標的化変異誘発(RTM)によって導入されたことを特徴とする集団、又は一塩基多型(SNP)、小さな挿入及び欠失、並びにマイクロサテライト反復数における変化のような天然に存在する変異を含む集団については、対象となる変異の存在が効率的にスクリーニングすることができることも見出した。
【0016】
定義
以下の説明及び実施例において、多くの用語が使用される。そのような用語に与えられる範囲を含む、明細書及び特許請求の範囲についての明確で一貫した理解を提供するために、以下の定義が提供される。特別に本明細書において定義されないならば、使用される全ての技術的用語及び科学的用語は、本発明が属する技術分野における当業者によって一般に理解されるものと同じ意味を有する。全ての出版物、特許出願、特許及び他の参考文献の開示は、参照によりそれら全体は本明細書において援用される。
【0017】
「TILLING」即ち「ゲノム中の標的化誘発局所的損傷」は、対象となる領域中の点変異を同定するための一般的な逆遺伝学的ストラテジーであり、ここでは、PCRに基づいたスクリーニングと組み合わせた、無作為の化学的変異誘発又は物理的変異誘発によって誘発された(点)変異の対立遺伝子のシリーズを提供する。TILLINGスクリーニングにおいて、対象となる領域はPCRによって増幅される。野生型の断片と誘発変異を有する断片との間のヘテロ二本鎖は、PCR産物の変性及びアニーリングによって形成される。これらのヘテロ二本鎖はCEL Iによって切断され、切断された産物は分離される。スループットはプールすることによって増加することができる。プール中の配列差異を有するPCR産物の発見に続いて、プール中に含まれるPCR産物は個別のPCR産物のサンガー法のシークエンシングによって共通して再びスクリーニングされ、それによって変異体植物及び変異遺伝子中の厳密な配列差異を同定する。
【0018】
「変異させた集団」は、変異体のライブラリーを産出するために変異誘発(化学的又は物理的な)された生物の集団(通常は植物であるが、ショウジョウバエ及びマウスのような動物を含む他の生物を、変異させた集団を生成するために使用してもよい;Schimenti et al., 1998, Genome Research 8:698-710)を指す。TILLING集団は、サイズにおいて広く変化してもよく、或る特定の目的のためには、もとの集団の90%、80%、70%、60%、50%、40%、30%又は20%のみを含む部分的なTILLING集団を使用することができる。変異させた集団に対する代替物として、集団を変異させないが、一塩基多型(SNP)、小さな挿入及び欠失のような天然に存在する変異、並びにマイクロサテライト反復数における変化を含む亜集団から成ることを特徴とする集団を使用することができる。変異させた集団が容易に入手可能でない場合(ヒト)、又は前に大きい生殖質が既に入手可能な場合には、これらの集団は特に有利である。例えばComai et al., The Plant Journal, 2004, 37, 778-786を参照。そのような集団は「参照DNA」と組み合わせて使用することができる。
【0019】
「標的化ヌクレオチド交換」即ち「TNE」。標的化ヌクレオチド交換(TNE)は、特異的な部位で、染色体遺伝子又はエピゾーム遺伝子中の部位に部分的に相補的な合成オリゴヌクレオチドが、単一のヌクレオチドの反転を導く過程である。TNEは様々なオリゴヌクレオチド及び標的を使用して記述されてきた。報告されたオリゴヌクレオチドのうちのいくつかは、ヌクレアーゼ抵抗性を与えるための末端修飾を含むRNA/DNAキメラである。
【0020】
「領域標的化変異誘発」即ち「RTM」。領域標的化変異誘発は、ゲノムDNAのあらかじめ定められた標的部位での二本鎖切断が人工的に生成される過程であり、大半は切断の部位での変異に結びつくような、様々な利用可能な細胞の修復機構のうちの1つによる切断の修復をもたらす。二本鎖切断は、ジンクフィンガーヌクレアーゼ(例えば、Lloyd et al., 2005を参照)、I−Sce1のようなメガヌクレアーゼ(Epinat et al., 2003)、又は変異原性化学基に結合された三重鎖形成性オリゴヌクレオチド(Havre et al., 1993)の細胞核の中への導入によって生成されてもよい。
【0021】
「核酸」:核酸は、本明細書において使用されるように、ピリミジン塩基及びプリン塩基を有するヌクレオチド、好ましくはそれぞれシトシン、チミン(又はウラシル)、アデニン及びグアニンの任意のポリマー又はオリゴマーを含んでもよい(Lehninger、生化学の原理(Principles of Biochemistry)、793〜800ページ(ウォース出版(Worth Pub.)1982)を参照、すべての目的のために参照によりそれら全体は本明細書において援用される)。任意のデオキシリボヌクレオチド、リボヌクレオチド又はペプチド核酸の構成要素、及びこれらの塩基のメチル化型、ヒドロキシメチル化型又は糖鎖が付加した型を有するもの等のような、それらの任意の化学的な変形が含まれる。ポリマー又はオリゴマーは、組成において不均質又は均質であってもよく、天然に存在するソースから単離されるか又は人工若しくは合成で産生されてもよい。核酸は、DNA若しくはRNA、又はその混合物であってもよく、一本鎖形式又は、ホモ二重鎖状態、ヘテロ二重鎖状態、及びハイブリッド状態を含む二本鎖形式で永続的に又は一時的に存在してもよい。
【0022】
「タグ付け」(Tagging)は、核酸と第2の核酸又はさらなる核酸の区別を可能にするための、その核酸へのタグ又は標識の付加を指す。タグ付けは、例えばタグを付けたプライマーを使用して、増幅時の配列識別子の付加することにより、又は当該技術分野において既知の他の手段により実行することができる。そのような配列識別子は、特異的な核酸サンプルの同定のために独自に使用される、変化するが定義された長さのユニーク塩基配列になり得る。代表的な例はZIP配列である。そのようなタグを使用して、サンプルの起源を次の処理の際に決定することができる。異なる核酸サンプルから生じる処理された生成物の組み合わせの場合には、異なる核酸サンプルは異なるタグを使用して一般に同定される。
【0023】
「タグを付けたライブラリー」は、タグを付けた核酸のライブラリーを指す。
【0024】
「シークエンシング」は、核酸サンプル、例えば、DNA又はRNAにおいてヌクレオチド(塩基配列)の順序を決定することを指す。
【0025】
「アライメントさせること及びアライメント」は、同じヌクレオチド又は類似するヌクレオチドの短いストレッチ又は長いストレッチの存在に基づいた、2つ以上のヌクレオチド配列の比較を意味する。さらに以下で説明されるように、ヌクレオチド配列のアライメントのためのいくつかの方法は当該技術分野において既知である。時には、用語「アセンブリー」又は「クラスタリング」は、同義語として使用される。
【0026】
「ハイスループットスクリーニング」(HTS)は、特に生物学及び化学の分野に関連する科学的な実験の方法である。最新のロボット工学と他の特殊化した研究室ハードウェアとの組み合わせによって、HTSは、研究者が効果的に同時に(又は実質的に同時に)多数のサンプルをスクリーニングすることを可能にする。
【0027】
「プライマー」は、一般には、DNAの合成をプライミングするDNA鎖を指す。DNAポリメラーゼは、プライマーなしにはデノボでDNAを合成することができない。プライマーは、組み立てられるヌクレオチドの順序を指示するために、鋳型として相補鎖が使用される反応において、既存のDNA鎖のみを延長することができる。ポリメラーゼ連鎖反応(PCR)において使用される合成オリゴヌクレオチド分子は、本明細書においてプライマーと呼ばれる。
【0028】
「増加した親和性を有するプライマー」は、PNA又はLNAのような修飾されたヌクレオチドを有するプライマーであり、それらの熱安定性を増加させ、単一のヌクレオチド配列の差異に基づいた対立遺伝子特異的な増幅を可能にする。これを達成するために、1つ又は複数の修飾されたヌクレオチドが好ましくはプライマーの3’末端に、しばしば含まれる。
【0029】
「DNA増幅」は、典型的には、PCRを使用する二本鎖DNA分子の試験管内(in vitro)における合成を表わすために使用される。なお、他の増幅方法が存在し、それらは本発明において使用されてもよい。
【発明を実施するための最良の形態】
【0030】
1つの態様において、本発明は、
(a)変異させた集団の各メンバーのゲノムDNAを単離して、集団の各メンバーのDNAサンプルについて提供する工程と、
(b)工程(a)で採取されたDNAをプールする工程と、
(c)1組の(任意的に標識された)プライマーによりDNAプールから標的配列を増幅する工程と、
(d)工程(c)の増幅産物をプールして、増幅産物のライブラリーを作成する工程と、
(e)ライブラリー中の増幅産物を任意的に断片化する工程と、
(f)ハイスループットシークエンシングを使用して、産物及び/又は断片のヌクレオチド配列を決定する工程と、
(g)断片の配列をクラスタリングすること(アライメントさせること)によって変異を同定する工程と、
(h)標的配列の修飾された機能について同定された変異をスクリーニングする工程と、
(i)同定された変異へハイブリダイズするように向けられたプライマーを設計する工程と、
(j)工程(i)のプライマー、及び工程(c)のプライマーのうちの1つにより工程(d)のライブラリーを増幅する工程と、
(k)変異を保有するメンバー(複数可)を同定する工程と、
(l)任意で、工程(c)のプライマーを使用して工程(k)のメンバー(複数可)からの標的配列を増幅することによって変異を確認する工程及び増幅された産物の配列を決定する工程と
を含む、変異させた集団のメンバーの標的配列中の変異の検出のための方法へ向けられる。
【0031】
DNAの単離は、一般には、集団のメンバーからの組織の回収、DNA抽出(例えば、Q−バイオジーン高速DNAキット(Q-Biogene fast DNA kit)を使用して)、1つのサンプル当たり等しい量のDNAを採取するための定量化及び正規化のような当該技術分野における一般の方法を使用して達成される。実施例として、本発明は、3072の植物のTILLING集団及び1500bpの遺伝子に基づいて図示される。
【0032】
単離されたDNAのプーリングは、例えば三次元プーリングスキームを使用して達成できる(Vandenbussche et al., 2003, The Plant Cell, 15: 2680-93)。プーリングは、好ましくは等しい量のDNAを使用して達成される。3Dプーリングスキームは、15×15×14を含んでもよく、1つのプール当たり3072/14=219又は3072/15=205の異なるDNAサンプルを含む44プール(15+15+14)をもたらす。
【0033】
プールする工程は、典型的には、PCRスクリーニングの1回後に観察された変異を含む植物を同定する役目をする。DNAのプーリングはさらに、PCR増幅の前に、シークエンシングのためのライブラリーにおいてより等しい表示を提供するために、DNAを正規化する役目をする。DNAのプーリングのさらなる利点は、特にタグを付けたライブラリーが使用される場合には、すべての配列を別々に決定しなければならないのではなく、このプールは対象となる配列の迅速な同定を可能にすることである。これは、大きな集団又は複雑な集団のスクリーニングを特に容易にする。
【0034】
プールからの1組の任意に標識されたプライマーによる標的配列の増幅は、対象となる遺伝子を増幅するために設計した1セットのプライマーの使用によって、達成することができる。上で述べたように、プライマーは対象となる遺伝子の増幅産物を可視化するために標識されてもよい。
【0035】
増幅産物は、好ましくは、それによって増幅産物のライブラリーを作成するために、等しい量又は正規化された量でプールされる。例示的には、ライブラリーの複雑度は3072植物数×1500bp遺伝子配列=4.6Mb配列になるだろう。
【0036】
PCR産物の長さがシークエンストレースの平均長を上回った場合には、ライブラリー中の増幅産物は、断片のシークエンシングの前に無作為に断片化されてもよい。断片化は物理的な技術(すなわち、剪断、超音波処理又は他の無作為な断片化方法)により達成することができる。工程(f)において、ライブラリー中に含まれている少なくとも一部分、好ましくは、すべての断片の少なくとも一部分、更に好ましくは、ヌクレオチド配列の全体が決定される。或る特定の実施形態において、断片化の工程は任意である。例えば、シークエンシング技術で読み取られた長さとPCR断片の長さが、ほぼ同じである場合、断片化の必要はない。またPCR産物の一部のみがシークエンスされること、例えば1500bpのPCR産物であり、400bpの読み取り長さ(各サイドから)の場合には、700bpはシークエンスされないままであることが許容できるならば、より大きいPCR産物の場合においても、断片化は必要ではないかもしれない。
【0037】
シークエンシングは、ジデオキシチェーンターミネーション法(サンガー法のシークエンシング)のような、当該技術分野において既知の、原則として任意の手段によって行われてもよいが、決定すべき配列が多数であることを考えるとあまり好まれない。しかしながらシークエンシングが、国際公開特許第WO03/004690号、同第WO03/054142号、同第WO2004/069849号、同第WO2004/070005号、同第WO2004/070007号及び同第WO2005/003375号(すべては454 Life Sciencesの名称のもとに)、Seo et al.(2004) Proc. Natl. Acad. Sci. USA 101:5488-93による、及びHelios、Solexa、US Genomics等に開示された方法のような、ハイスループットシークエンシング方法を使用して実行されるときには、ジデオキシチェーンターミネーション法が好ましく有利であり、これらは、参照により本明細書に援用される。シークエンシングが、国際公開特許第WO03/004690号、同第WO03/054142号、同第WO2004/069849号、同第WO2004/070005号、同第WO2004/070007号及び同第WO2005/003375号(すべては454 Life Sciencesの名称のもとに)中に開示された装置及び/又は方法を使用して実行されることは最も好ましく、これらは、参照により本明細書に援用される。記述された技術は、単一の実行において4000万塩基のシークエンシングを可能にし、競合技術よりも100倍高速で安価である。シークエンシング技術はおよそ、1)DNAの断片化、及び一本鎖DNA(ssDNA)のライブラリーを作成するための特異的なアダプターのライゲーションと、2)ビーズへのssDNAのアニーリング、油中水滴型マイクロリアクター中のビーズの乳化、及びビーズに対して個別のssDNA分子を増幅するためのエマルジョンPCRの実行と、3)ビーズの表面上に増幅されたssDNA分子を含むビーズに対する濃縮の選別と、4)ピコタイタープレート(PicoTiterPlate)(登録商標)中のビーズを保有するDNAの沈着と、5)ピロリン酸光シグナルの生成による少なくとも100000のウェル中の同時シークエン
シングとの5工程から成る。方法はより詳細に以下で説明されるだろう。
【0038】
好ましい実施形態において、シークエンシングは、
(a)単一のアダプター化された断片が各々のビーズへアニールされている状態で、アダプター化された断片をビーズへアニールする工程と、
(b)各々の油中水滴型マイクロリアクターが単一のビーズを含む、油中水滴型マイクロリアクター中でビーズを乳化する工程と、
(c)各々のウェルが単一のビーズを含む、ウェル中にビーズを入れる工程と、
ピロリン酸シグナルを生成する工程とを含む。
【0039】
工程(a)において、シークエンシングアダプターは、ライブラリー中の断片へライゲーションされる。シークエンシングアダプターは、少なくともビーズへアニールするための「鍵となる」領域、シークエンシングプライマー領域及びPCRプライマー領域を含んでいる。このように、アダプター化された断片は得られる。
【0040】
第2の工程において、各々のビーズが単一のアダプター化された断片とアニーリングされる状態で、アダプター化された断片は、ビーズへアニールされる。大多数のビーズに対して1つのビーズ当たり1つの単一のアダプター化された断片のアニーリングを保証するように(ポアソン分布)、アダプター化された断片のプールへ、ビーズを過剰に追加する。
【0041】
次の工程において、各々の油中水滴型マイクロリアクターが単一のビーズを含む、油中水滴型マイクロリアクター中でビーズは、乳化される。PCR反応がマイクロリアクター内で行なわれることを可能にする油中水滴型マイクロリアクター中に、PCR試薬は存在する。続いて、マイクロリアクターは破壊され、DNAを含むビーズ(DNA陽性のビーズ)が濃縮される。
【0042】
以下の工程において、各々のウェルが単一のビーズを含むように、ウェル中にビーズが入れられる。ウェルは、好ましくは大量の断片の同時シークエンシングを可能にするピコタイター(商標)プレートの一部である。
【0043】
酵素を保有するビーズの追加後に、断片の配列は、ピロシークエンシングを使用して決定される。引き続く工程において、ピコタイター(商標)プレート及びビーズは、その中の酵素ビーズとともに、従来のシークエンシング試薬の存在下で異なるデオキシリボヌクレオチドにさらされ、デオキシリボヌクレオチドのとり込みに際して、記録される光シグナルが生成される。正確なヌクレオチドのとり込みは、検出可能なピロシークエンシングシグナルを生成するだろう。
【0044】
ピロシークエンシング自体は、当該技術分野において既知であり、www.biotagebio.com、www.pyrosequencing.comのtechnologyの項で特に詳しく記述されている。この技術は、例えば国際公開特許第WO03/004690号、同第WO03/054142号、同第WO2004/069849号、同第WO2004/070005号、同第WO2004/070007号及び同第WO2005/003375号(すべて454 Life Sciencesの名称のもとに)においてさらに適用されており、それらは参照により本明細書に援用される。
【0045】
変異は増幅されたライブラリー中のシークエンスされた断片のクラスタリングによって同定される。変異の同定は、ライブラリーの断片の決定された配列をアライメントさせることによって達成される。大多数の配列は野生型である(変異していない)が、誘発変異及び偶発的なシークエンシングエラーも観察される。増幅ライブラリーが複数倍の冗長度(典型的には約4〜5倍の冗長)でシークエンスされるので、同じ配列変化の複数の観察は、シークエンシングエラーというよりもむしろ変異を示す。図1を参照。
【0046】
クラスタリングは、増幅されたライブラリー中の断片のアライメントを提供する。ライブラリー中の各々のPCR産物についてはこの方法で、クラスターはシークエンスされた断片から生成される、すなわち、断片のコンティグは工程(e)における断片化から得られた様々な断片の配列のアライメントから構築される。
【0047】
比較目的のための配列のアライメントの方法は、当該技術分野において既知である。様々なプログラム及びアライメントアルゴリズムは、Smith and Waterman (1981) Adv. Appl. Math. 2:482、Needleman and Wunsch (1970) J. Mol. Biol. 48:443、Pearson and Lipman (1988) Proc. Natl. Acad. Sci. USA 85:2444、Higgins and Sharp (1988) Gene 73:237-244、Higgins and Sharp (1989) CABIOS 5:151-153、Corpet et al.(1988) Nucl. Acids Res. 16:10881-90、Huang et al.(1992) Computer Appl. in the Biosci. 8:155-65、及びPearson et al (1994) Meth. Mol. Biol. 24:307-31に記述されており、それらは、参照により本明細書に援用される。Altschul et al.(1994) Nature Genet. 6:119-29(参照により本明細書に援用される)は、配列アライメント方法及び相同性の計算の詳細な考察を提示する。
【0048】
NCBIの基本的局所アライメント検索ツール(Basic Local Alignment Search Tool)(BLAST)(Altschul et al., 1990)は、配列解析プログラムのblastp、blastn、blastx、tblastn及びtblastxに関連する使用について、国立生体情報センター(National Center for Biological Information)(NCBI、メリーランド州、ベテスダ)及びインターネット上を含むいくつかのソースから利用可能である。それは<http://www.ncbi.nlm.nih.gov/BLAST/>でアクセスすることができる。このプログラムを使用して、配列同一性を決定する方法の説明は<http://www.ncbi.nlm.nih.gov/BLAST/blast_help.html>で利用可能である。
【0049】
変異させた集団の分析において、変異が同定された後、同定された変異は、関連する遺伝子の修飾された機能(例えば終止コドンの導入)で評価される。この評価は、例えば6フレームでの翻訳によって配列自体に対して実行される。一旦対象となる変異が同定されたならば、集団の関連するメンバーを同定するために、変異は、さらに調べられる。
【0050】
対象となる変異として分類された各々の変異について、対象となる変異を標的とする対立遺伝子特異的なプライマーが設計される。したがって、次に対立遺伝子特異的なプライマーは、プールされたDNAサンプルの増幅において使用されるプライマーのうちの1つと組み合わせて使用される(リバースプライマー又はフォワードプライマーのいずれか)。1つのプライマー又は両方のプライマーが標識されてもよい。プライマーのセットは、DNAのプールを増幅するために使用される。陽性のプールは同定され、変異体植物が同定される。上述の3Dプーリングスキームにおいて、3DプールされたDNAサンプルプレートをスクリーニングするためのプライマーのセットによる対立遺伝子特異的なPCRは、3つの陽性プール(各々の次元において1つ)の同定をもたらし、変異体植物のライブラリーアドレスを規定する。
【0051】
或る特定の実施形態において、対立遺伝子特異的プライマーは、それらの特異性を増加するためにロックされた核酸(Locked Nucleic Acids)(LNA)又はペプチド核酸(PNA)のような代わりのヌクレオチドを含む。そのような核酸は、当該技術分野において広く既知であり、供給業者の選択から市販で入手可能である。
【0052】
変異の確認は、同定された変異体植物からの標的配列の増幅によって達成される。この増幅は、工程(c)からのプライマーにより実行される。増幅された産物のヌクレオチド配列は、決定され、コンセンサス配列による比較によって変異は同定される。シークエンシングは、好ましくは、サンガー法シークエンシングで実行される。
【0053】
1つの態様において、本発明は、
(a)集団における各々のメンバーのDNAサンプルを提供するために、変異させた集団の各々のメンバーのゲノムDNAを単離する工程と、
(b)工程(a)で得られたDNAをプールする工程と、
(c)好ましくはプライマーのうちの少なくとも1つが、遺伝子特異的セクション、タグ及びシークエンスプライマー結合部位を含む、1組のタグを付けた(任意で標識した)プライマーにより、DNAプールから標的配列の一部又はセグメントを増幅する工程と、
(d)増幅産物のライブラリーを作成するために工程(c)の増幅産物をプールする工程と、
(e)ハイスループットシークエンシングを使用して、増幅産物のヌクレオチド配列を決定する工程と、
(f)断片の配列をクラスタリングすること(アライメントさせること)によって変異を同定する工程と、
(g)タグを使用して、変異があるメンバー(複数可)を同定する工程と、
(h)任意で、工程(c)のプライマーを使用して工程(g)のメンバー(複数可)からの標的配列の増幅により変異を確認する工程、及び増幅された産物の配列を決定する工程と
を含む、変異させた集団のメンバーにおける標的配列中の変異の検出のための方法に関する。
【0054】
上で記述されるように、変異させた集団のメンバーのゲノムDNAの単離及び単離されたDNAのプーリングは、実質的に上記した手法で実行することができる。
【0055】
標的配列の一部又はセグメントは、標識されてもよい1組のタグを付けたプライマーを使用して増幅される。好ましくは、各々の次元の各々のプールのために異なるプライマーが使用される。このことは、上記した例の場合、44のフォワードプライマー及び44のリバースプライマーが好ましいことを意味する。好ましくは、フォワードプライマー及びリバースプライマーの各々は、
(i)次のシークエンシング工程で使用することができるシークエンスプライマー結合部位と、
(ii)プライマー(及び結果として生じる増幅産物)を集団のもとのメンバーに連結する役目をするタグと、
(iii)対象となる標的配列(すなわち遺伝子)にアニールすることができる遺伝子特異的配列とを含む。
【0056】
典型的な実施形態において、プライマーは、以下の順序を有する:
5’−シークエンスプライマー結合部位タグ遺伝子特異的PCRプライマー配列−3’
シークエンスプライマー結合部位及び遺伝子特異的なPCRプライマー配列の長さは、一般のPCR使用において通常の長さであり、すなわち、独立して約10bp〜約30bp、好ましくは15bp〜25bpである。好ましくは、増幅される配列の部分又はセグメントは、下記に述べられるハイスループットシークエンシング技術を使用して、1回の実行でシークエンスすることができる長さに相当する。或る特定の実施形態において、部分又はセグメントは、約50bp〜約500bpの間、好ましくは約75bp〜約300bp、及びより好ましくは約90bp〜約250bpの長さを有する。上で述べられたように、この長さは、今なお開発されている技術を含む使用されたシークエンシング技術に応じて変化してもよい。
【0057】
すべてのプール次元に相当するプライマーの各々に特有のタグ配列を含むプライマー(フォワード及び/又はリバース)を使用することによって、各々のタグ配列の特異的な植物起源は、タグの上流側にアニールされているシークエンスプライマーとして既知であり、このタグ配列は、各々の増幅産物中に存在する。或る特定の実施形態において、フォワードプライマー及びリバースプライマーの両方は、タグを付けられる。他の実施形態において、フォワードプライマー又はリバースプライマー上でのみタグが付けられる。1つ又は2つのタグの間の選択は、状況に依存し、ハイスループットシークエンシング反応の読み取られた長さ及び/又は独立した妥当性検証の必要性に依存する。例えば、一方向にシークエンスされる100bpのPCR産物の場合には、1つのタグのみが必要とされる。200bpのPCR産物及び100bpの読み取り長さの場合には、効率を2倍に改良するので、二重のタグ付けが双方向シークエンシングと組み合わせて有用である。それは、さらに同じ工程で独立した妥当性検証の可能性を提供する。100bpのPCR産物が、2つのタグを付けたプライマーにより二方向にシークエンスされるとき、すべてのトレースは、配向にかかわらず、変異についての情報を提供するだろう。したがって、両方のプライマーは、どの植物がどの変異を含んでいるかについての「アドレス情報」を提供する。
【0058】
タグは任意の数のヌクレオチドになり得るが、好ましくは2ヌクレオチド、3ヌクレオチド、4ヌクレオチド又は5ヌクレオチドを含む。4ヌクレオチドの並べ替えでは、256のタグが可能であるが、3ヌクレオチドの並べ替えは64の異なるタグを提供する。使用される実例において、タグは好ましくは、>1塩基で異なり、したがって、好ましいタグは4bpの長さである。これらのプライマーを使用する増幅は、タグを付けた増幅産物のライブラリーをもたらす。
【0059】
或る特定の実施形態において、増幅過程が、
(1)(a)5’−コンスタントセクションに連結された(b)縮重タグセクション(NNNN)に連結された(c)遺伝子特異的セクション−3’を含む、ロングPCRプライマー、及び
(2)(a)5’−コンタクトセクションに連結された(b)非縮重タグセクション−3’(すなわち、NNNNの中の選別)から成り、次に増幅されるショートPCRプライマーを含むことを特徴とするタグのシステムを使用することができる。非縮重タグセクションは、各々のサンプルに特有であり、例えば、サンプル1ではACTG、サンプル2ではAATC等である。ショートプライマーは、ロングプライマーのサブセットにアニールする。プライマーのコンスタントセクションは、シークエンスプライマーとして使用することができる。図3を参照。
【0060】
ライブラリーは、好ましくは、すべての増幅されたプールからの等しい量のPCR産物を含む。例示的な実施例において、ライブラリーは、決定される3072植物数×100bp=307kbの配列を含む。
【0061】
ライブラリー中のPCR産物は、上で開示されるようなシークエンシング過程にかけられる。特に、PCR産物は、ビーズに連結された配列に対応するシークエンスプライマー結合部位を使用して、ビーズに付けられている。したがって、本実施形態は、断片化及びアダプターライゲーションを必要としない。むしろ、この実施形態において、アダプターは、PCRプライマー設計を介してより早期に導入されてきた。このことは、本方法の信頼性を改良する。ビーズへのアニーリングに続いて、上で記述されるように、シークエンシングは、実行される、すなわち(1)油中水滴型マイクロリアクターにおけるビーズの乳化、(2)ビーズ上の個別のssDNA分子を増幅するエマルジョンPCR、(3)それらの表面上の増幅されたssDNA分子を含むビーズに対する濃縮の選別、(4)ピコタイタープレート(登録商標)にビーズを保有するDNAの移入及び(5)ピロリン酸光シグナルを生成する方法による100000のウェルにおける同時シークエンシングである。典型的なアウトプットは、ライブラリーにおけるすべてのPCR産物の66倍のカバー範囲を表わす約200.000×100〜200bp配列である。
【0062】
上で記述されるように、クラスタリング及びアライメントは、実質的に上記した手法で実行される。変異を含む個別の植物は、タグを使用して同定することができる。実施例において、3つのタグの組み合わせは、陽性のプール、したがってプールにおける個別の植物の座標位置(coordinate)を意味する。
【0063】
同定された変異体サンプルのPCR産物の再シークエンシングによる変異の確認は、上で記述された通りである。
【0064】
様々なプーリングストラテジーは、本発明と共に使用することができ、それらの例は、多次元のプーリング(3Dプーリングを含む)又は行プーリング、列プーリング若しくはプレートプーリングである。
【0065】
ここで使用することができるハイスループットシークエンシング方法は、例えばShendure et al., Science 309:1728-32中に記述されている。例は、微量電気泳動シークエンシング、ハイブリダイゼーションシークエンシング/ハイブリダイゼーションによるシークエンシング(SBH)、増幅された分子に対するサイクリックアレイシークエンシング、単一の分子に対するサイクリックアレイシークエンシング、ポリメラーゼシークエンシングのようなノンサイクリック方法、単一分子方法、リアルタイム方法、エキソヌクレアーゼシークエンシング、又はナノポアシークエンシングを含む。
【0066】
最適な結果を得るためには、断片又は増幅された産物は、十分な冗長度でシークエンスされるべきである。冗長度は、シークエンシングエラーと真の可能な変異との間の区別を可能にする。或る特定の実施形態において、シークエンシングの冗長度は、好ましくは少なくとも4、より好ましくは少なくとも5であるが、本発明のために必須でないが、実施例から理解できるように、10より多くの、好ましくは25より多くの、又はさらに50より多くの冗長度は有利であると考えられる。
【0067】
本発明の方法の利点は、とりわけ遺伝子機能へのそれらの影響についてコンピューター内で変異を評価することができるという事実にあり、選別が活性のある変異についてなされることを意味する。サイレント置換のみを与える変異に対して選択することができ、それによって全過程をより経済的及びより効率的にする。このことは、既知のCEL Iに基づいたTILLING技術に対して、大きな利点である。即ち、CEL Iに基づいたTILLING技術では、大多数のCEL I変異がC/GからT/Aへの転位であり、一般にそのうちの5%のみが終止コドンを生成するからである(Colbert et al.2001)。大部分は、関心の低いミスセンス変異である。集団における終止コドン変異を有するメンバーの効率的な認識は、過程を節約し、陽性のプールの個別のメンバーの補足スクリーニングのための必要性を回避する。
【0068】
特に全標的配列がスクリーニングされる場合、すべての変異は、PCR産物におけるそれらのポジションに関係なく等しい確率で見出すことができる。
【0069】
本方法は、CEL I消化(digestion)、ヘテロ二重鎖形成、及び、煩わしいゲルスコアリングの使用を避けることができる。したがって本発明は、CEL I技術に関連したプーリングの限界に対して影響を受けない。
【0070】
本発明は、さらに、特定の遺伝子又は形質に対する1つ又は複数の(標識された)プライマー、変異特異的なプライマー又は対立遺伝子特異的プライマーから成る群から選択された、1つ又は複数の化合物を含んでもよいキットに関する。本キットはさらに、ビーズ、シークエンシングプライマー、ソフトウェア、プーリングストラテジーのための説明及びキット自体について既知の他の構成要素を含んでもよい。或る特定の実施形態において、特異的変異(例えば、疾患に関連した変異)を発見する専用のキットが提供される。
【0071】
ここで本発明は本明細書において以下で図示される。
【実施例】
【0072】
TILLING集団のスクリーニングは、454 Life Sciencesのシークエンシング方法(Margulies et al., 2005)又はポロニーシークエンシング(Shendure et al., 2005)のような新規ハイスループットシークエンシング方法を使用することによって進めることができる。最新最先端技術である454 Life Sciences技術は、1回のシークエンシング実行においておよそ20Mbの配列をもたらす。読み取りの長さは、1回の読み取り当たりおよそ100bpである。1500bp遺伝子中の変異に対して3072の植物から成る集団のスクリーニングを想定して(上記の引用された参照の2章中に記述されているように)、2つのアプローチが意図され、より詳細に以下で記述される、すなわち
(1)1500bp遺伝子全体がEMS誘発変異の存在について調べられる場合のアプローチ及び
(1)1つ又は複数の100bpストレッチがEMS誘発変異の存在について調べられる場合のアプローチである。
実施例I
【0073】
1500bp領域全体のスクリーニング:
TILLING集団の3072の植物のゲノムDNAを単離する。1植物当たり等量のDNAの3Dプーリングスキームを構築し(例えば、15×15×14)、3072/14=219又は3072/15=205の異なるDNAサンプルを含む44プール(15+15+14=44)がもたらされる。(Vandenbussche et al.、上記)。
【0074】
このプーリング工程は、PCRスクリーニング(工程8)の1ラウンド後に、観察される変異を含む植物の同定を可能にする役目をする。ゲノムDNAのプーリングは、すべてのDNAが配列ライブラリー中で等しく表わされる可能性を増加させるために、PCR増幅に先立ってDNAを正規化する役目をさらにする。
【0075】
1500bp遺伝子は、1組の標識されていないPCRプライマーを使用して、プールされたDNAサンプルから増幅される。
【0076】
すべてのプールウェルからの等量のPCR産物は、プールされたPCR産物ライブラリーを作成するためにプールされる(複雑度3072植物×1500bp=4.6Mb配列)。
【0077】
PCR産物が、無作為に断片化され、個別のビーズ上で増幅され、ビーズ上でシークエンスされる、プールされたPCR産物ライブラリーは、従来技術(454 Life Sciencesにより提供される技術のような)を使用するショットガンシークエンシングにかけられる。アウトプットは、ライブラリー中のすべてのPCR産物の4倍〜5倍のカバー範囲を表わすおよそ200000の100bp配列である。
【0078】
すべての配列がクラスタリングされる。大多数の配列は野生型であるが、EMS誘発変異(及びシークエンスエラー)も観察される。PCR産物が4倍〜5倍の冗長度でシークエンスされるので、同じ配列変化の複数回の観察は、シークエンシングエラーというよりもむしろ変異を示す(図1)。
【0079】
変異は、終止コドンの導入のような遺伝子機能へのそれらの影響に対して評価される。
【0080】
対象となる変異を標的とする対立遺伝子特異的なプライマー(3’でロックされた核酸、LNA、又はペプチド核酸、PNAをともなう)は、3DプールされたDNAサンプルプレートをスクリーニングするために、工程3において使用されるフォワードプライマー又はリバースプライマーのいずれかと組み合わせて使用されるように設計される。対立遺伝子特異的なPCRは3つの陽性のプール(各々の次元のうちの1つ)をもたらし、それは変異体植物のライブラリーアドレスを規定する。
【0081】
工程3のプライマーを使用して1500bp遺伝子を増幅し、後続するサンガー法のシークエンシング(双方向)によって変異を確認した。
実施例II
【0082】
100bpストレッチのスクリーニング
(100bpは1回の454シークエンス実行の読み取りの長さである)
TILLING集団の3072の植物のゲノムDNAを単離する。1植物当たり等量のDNAの3Dプーリングスキームを構築し(例えば、15×15×14)、3072/14=219又は3072/15=205の異なるDNAサンプルを含む44プール(15+15+14=44)がもたらされる。(Vandenbussche et al.、上記)。
【0083】
このプーリング工程は、シークエンスデータから観察された変異を直接含む、植物の同定を可能にする役目をする。ゲノムDNAのプーリングは、すべてのDNAが配列ライブラリー中で等しく表わされる可能性を増加させるために、PCR増幅に先立ってDNAを正規化する役目をさらにする。
【0084】
遺伝子の100bp(又は200bp)領域を、タグを付けた標識されていないPCRプライマーを使用してPCRによってプールから増幅する。この増幅は、以下の配置を備えた44のフォワードプライマー及び44のリバースプライマー(各々の次元の各々のプールについて1つ)を必要とする:
5’−シークエンスプライマー結合部位4bpタグ遺伝子特異的プライマーシークエンス−3’。
【0085】
すべてのプール次元を表わす44のプライマーの各々に対して異なる4bp配列タグを含む、テーリングフォワードプライマー及びテーリングリバースプライマーの使用によって、各々の配列の特異的な植物起源は、タグの上流にアニールされたシークエンスプライマーとして既知である。したがって、タグ配列は、各々のシークエンストレース中に存在する。4bpタグは4=256の異なるタグを与える。3bpタグは、44タグを区別するのに十分な64の異なるタグ配列を可能にするが、1つより多い塩基で異なるタグ配列が好ましい。
【0086】
すべてのプールウェルからの等しい量のPCR産物は、プールされたPCR産物ライブラリーを作成するためにプールされる。(複雑度3072植物×100bp=307kb配列)。
【0087】
プールされたPCR産物ライブラリーは、シークエンシングのために454へ提供される、すなわち、PCR産物はビーズ上で増幅及びシークエンスされる。アウトプットは、ライブラリーにおけるすべてのPCR産物の66倍のカバー範囲を表わすおよそ200000の100bp配列である。
【0088】
すべての配列(いずれかの方向からの)がクラスタリングされ、大多数の配列は野生型配列であるが、EMS誘発変異(及びシークエンスエラー)が同様に観察される。PCR産物は、66倍の冗長度でシークエンスされるので、同じ配列変化の複数回の観察は、シークエンシングエラーというよりもむしろ変異を示す(図1)。
【0089】
変異を含む個別の植物の座標位置は、変異を有するシークエンストレースの生じる3つのタグ配列に特有の組み合わせに基づいて、直ちに識別されるだろう(図2)。
【0090】
この変異は、工程3にプライマーを使用して1500のbp遺伝子を増幅し、後続するサンガー法のシークエンシング(双方向)によって変異を確認した。
実施例III.トマトの変異体ライブラリー中の特異的突然変異の同定
【0091】
トマトの変異体ライブラリー
この実施例は、特異的な遺伝子座(標的遺伝子)中の点変異を同定するために、大量の並列のシークエンシングによるトマトの変異体ライブラリーのスクリーニングを記述する。使用される変異体ライブラリーは、EMS変異誘発処理に由来する、5075のM2ファミリーから成る近交系有限花序トマト栽培品種M82の同質遺伝子ライブラリーである。5075のM2ファミリーの各々の種子を10%の相対湿度及び7℃で保存した。ライブラリーの起源及び特性は、Menda et al.(Plant J. 38: 861-872, 2004)及びhttp://zamir.sgn.cornell.edu/mutants/index.html上のデータベース中に記述されている。
【0092】
DNA単離
葉の材料は、ライブラリーから無作為に選択され、3072のM2ファミリーの5つの個別の温室で栽培された植物から採取された。ライブラリー中で生じる任意の変異はM2子孫においてメンデルの法則の様式で分離するので、5つの個別のM2植物の葉材料のプーリングは、分離結果として、0.1%未満の任意の変異を見落とす可能性を減少させた。ゲノムDNAを、Stuart and Via (Biotechniques, 14: 748-750, 1993)によって記述された改変CTAB手順を使用して、プールされた葉の材料から単離した。DNAサンプルを、TE(10mMトリスHCl pH 8.0、1mM EDTA)中に100ng/μlの濃度で希釈し、96ウェルマイクロタイタープレート中で−20℃で保存した。
【0093】
DNAサンプルの3Dプーリング
単離されたDNAサンプルを、20ng/μlの濃度に正規化し、続いて4重にプールし、その結果8枚の96ウェルマイクロタイタープレート中に含まれる768のサンプルがもたらされた。続いてこれらの8枚のマイクロタイタープレートは、3Dプーリングストラテジーにかけられ、DNAの28プールがもたらされた。3Dプーリングストラテジーは3つの異なる様式ですべてのDNAを一緒にプールすることから成り、したがって、各々の単独の4重プールがX座標プールで一度のみ、Y座標プールで一度のみ、及びZ座標プールで一度のみ生じることを保証する。Xプールは、8枚のマイクロタイタープレートすべてから、8つのウェルの1つの段当たりのすべてのDNAサンプル(例えば、A1〜H1)を一緒にプールすることによって組み立てられ、12のXプールをもたらした。したがって各々のXプールは、8(段中のウェル)×8(プレート)=4重プールの64サンプル保有し、256のM2ファミリーを表わす。Yプールは、8枚のマイクロタイタープレートすべてから、12のウェルの1つの列当たりのすべてのDNAサンプル(例えば、A1〜A12)を一緒にプールすることによって組み立てられ、8つのYプールをもたらした。したがって各々のYプールは、12(列中のウェル)×8(プレート)=4重プールの96サンプルを保有し、384のM2ファミリーを表わす。Zプールは、マイクロタイタープレート全体から、すべてのDNAサンプルを一緒にプールすることによって組み立てられ、8つのZプールをもたらした。したがって各々のZプールは、12×8=4重のプールの96サンプルを保有し、384のM2ファミリーを表わす。
【0094】
標的遺伝子座
この実施例における標的遺伝子座は、真核生物開始因子4Eに対するトマト遺伝子の一部であった(eIF4E)。この遺伝子は、シロイヌナズナ(Duprat et al., Plant J. 32: 927-934, 2002)、レタス(Nicaise et al.Plant Physiol. 132: 1272-1282, 2003)及びナス科(Ruffel et al, Plant J. 32: 1067-1075, 2002; Mol Gen. Genomics 274: 346-353, 2005)中のポチウイルスの感染に対する感受性に関与することが示され、この遺伝子における特異的変異は劣性のポチウイルス抵抗性に関連する。この実施例で記述される変異スクリーニングは、トマトeIF4E遺伝子における付加的変異を、新しいポチウイルス抵抗性の可能性のあるソースとして同定することを目的とした。トマトeIF4Eについては、cDNA配列のみが既知である(NCBIアクセッション番号AY723733及びAY723734)。cDNA配列に基づいて設計されたプライマーを使用するPCRアプローチを使用して、トマト栽培品種マネーバーグ(Moneyberg)のeIF4E遺伝子座のゲノム配列の断片を増幅及びシークエンスした。この結果、トマトeIF4Eの大部分のゲノム遺伝子座の配列が得られた。この遺伝子座は、4つのエクソン及び3つのイントロンから成る。変異スクリーニングのために、上記遺伝子のエクソン1が標的配列として選ばれた(配列番号57)。
【0095】
配列番号57:トマトのマネーバーグeIF4Eのエクソン1の配列:
ATGGCAGCAGCTGAAATGGAGAGAACGATGTCGTTTGATGCAGCTGAGAAGTTGAAGGCCGCCG ATGGAGGAGGAGGAGAGGTAGACGATGAACTTGAAGAAGGTGAAATTGTTGAAGAATCAAATGA TACGGCATCGTATTTAGGGAAAGAAATCACAGTGAAGCATCCATTGGAGCATTCATGGACTTTT TGGTTTGATAACCCTACCACTAAATCTCGACAAACTGCTTGGGGAAGCTCACTTCGAAATGTCT ACACTTTCTCCACTGTTGAAAATTTTTGGGG
【0096】
標的遺伝子座増幅のためのプライマー設計
プライマーは、トマトeIF4Eのエクソン1のPCR増幅のために設計された。フォワードプライマーは、ATGの5’で4塩基のタグ配列をともない、エクソン1のオープンリーディングフレームのATG開始コドンに対応するように設計され、28のプールの各々のために特有の識別子を提供した。フォワードPCRプライマーの離れた5’末端で、5’−Cが追加された。すべてのプライマーは、続いて行なわれるアダプターのライゲーションを容易にするために、それらの5’末端でリン酸化された。28のフォワードプライマーの配列及び名称は、表1中にリストされる。タグ配列には、下線が引かれる。
【0097】
【表1】

【0098】
リバースプライマーは、非コード鎖中のエクソン1の塩基対ポジション267〜287に対応するように設計された。再び、5’プライミング部分の4塩基のタグ配列の同様のシリーズが含まれており、28プールの各々のために識別子を提供する。リバースPCRプライマーの離れた5’末端で、5’−Cは追加された。すべてのプライマーは、続いて行なわれるアダプターのライゲーションを容易にするために、それらの5’末端でリン酸化された。28のリバースプライマーの配列及び名称は表2中にリストされる。タグ配列には、下線が引かれる。
【0099】
【表2】

【0100】
標的遺伝子座増幅
標的遺伝子座のエクソン1を、上で記述されたフォワードプライマー及びリバースプライマーを使用して、3DプールされたDNAから増幅した。各々のPCR反応のために、フォワードプライマーとリバースプライマーとを同じタグと共に使用した。28の3Dプールの各々からのエクソン1の増幅のために、フォワードプライマー及びリバースプライマーの異なるセットを使用した。各々のサンプルのためのPCR増幅反応条件は、以下のとおりであった:25μl DNA(=50ng)、5μl RNase混合物、10μl 5×Herculase PCRバッファー、0.6μlの4種類のdNTPs(20mM)、1.25μlフォワードプライマー(50ng/μl)、1.25μlリバースプライマー(50ng/μl)、0.5μl Herculase DNAポリメラーゼ、28.9μlミリQ精製水。RNase混合物は、157.5μlミリQ精製水+17.5μl RNaseから成った。
【0101】
PCR増幅は、以下の条件を使用して、金ブロック又は銀ブロックを備えたPE9600サーモサイクラーで実行した:94℃2分のホットスタートに後続して、94℃で30秒、53℃で30秒、72℃で1分の35サイクル、及び4℃の最終定常温度。PCR増幅効率を、1%アガロースゲル上でのPCR産物の10μlの分析によってチェックした。図4は、同様なゲル上でラムダDNAの濃度範囲に対する比較における、28の3Dプールの各々からのエクソン1のPCR産物の効率的な増幅を示す。
【0102】
増幅に続いて、等しい量のPCR産物は、混合され、キアクイック(QIAquick)(登録商標)スピンのハンドブック(18ページ)に従って、キアクイックPCR精製キット(キアゲン社(QIAGEN))を使用して精製された。各々のカラムに最大100μlの産物を入れた。産物を10mMトリス−EDTAで溶出した。
【0103】
配列ライブラリー調製及びハイスループットシークエンシング
3Dプールからの混合増幅産物は、Margulies et al.(Nature 437: 376-380, 2005、及びオンライン追補)によって記述されるような、454 Life Sciencesシークエンシング技術を使用するGS20シークエンサー上で、ハイスループットシークエンシングにかけられた。具体的には、Margulies et al.によって記述されるようなエマルジョンPCR増幅、及び続いて行なわれる断片シークエンシングを容易にするために、PCR産物をアダプターへライゲーションした。454アダプター配列、エマルジョンPCRプライマー、シークエンスプライマー及びシークエンスの実行条件は、すべてMargulies et al.によって記述される。454シークエンシング過程においてセファロースビーズ上で増幅されたエマルジョンPCR断片中の機能的要素の直線状順序は、以下のとおりだった:454 PCRアダプター−454シークエンスアダプター−Cヌクレオチド−4bpタグ−標的増幅プライマー配列1−標的断片内部配列−標的増幅プライマー配列2−4bpタグ−Gヌクレオチド−454シークエンスアダプター−454PCRアダプター−セファロースビーズ。
【0104】
454シークエンス実行のデータ処理
マイクロタイタープレートの各々の領域に対して、454のソフトウェアによるベースコーリング(塩基呼び出し)後に、FASTAによりフォーマットされたシークエンスを備えたファイルが生成された。これらは1つのファイルへ連結された。このファイル内で、検索は、5ヌクレオチド(Cプラス4bpタグシークエンス)が挿入されたフォワードプライマーの100%マッチに対する正規表現により行なわれた。同様なことが、5ヌクレオチド(Cプラスタグシークエンス)により延長されたリバースプライマーで行なわれた。次にすべての配列を、個別のファイルにおいてそれらのタグ配列(プール識別子)によってグループ化した。各々のファイルはssahaSNPツールにより分析され、既知のエクソン1ヌクレオチド配列を参照とした。ssahaSNPツールは、すべての単一ヌクレオチド配列差異、及び454シークエンス対参照ゲノムの「インデル」(変異誘発又は誤ったベースコーリングのいずれかの結果としての単一の塩基挿入又は単一の塩基欠失)について報告した。これらの単一のヌクレオチド配列差異及びインデル統計はデータベース中に保存され、エラー率分析及び点変異同定のために使用された。
【0105】
454シークエンシングのエラー率
組み合わせた28のプールすべてに対するデータ処理から得られた正確な配列の総数は、247052であった。配列は、フォワードプライマー及びエクソン1のPCR産物(128594=52%)のコード鎖(5’末端)でアライメントさせた群、並びにリバースプライマー及びPCR産物(118458=48%)の相補鎖でアライメントさせた群の、2つの群に分割された。異なるプール及びアライメント群の各々から得られた配列の数は、69〜7269にわたった。平均では、3072のM2ファミリーの各々は、配列の全回収において80回及び各々の対立遺伝子で40回で表わされたものとする。
【0106】
フォワードプライマーに対応するアライメント群の内では、128594配列のうちの1338(1.2%)は、アライメントさせた標的配列の63塩基のストレッチに沿ったeIF4E参照配列に関して、1つ又は複数の単一のヌクレオチド配列差異を示した。リバースプライマー群については、118458配列のうちの743(0.6%)は、アライメントさせた標的配列の102塩基のストレッチに沿ったeIF4E参照配列に関して、1つ又は複数の単一のヌクレオチド配列差異を示した。したがって、両方を組み合わせた配列群に対する単一の塩基置換エラー率は、165塩基ストレッチに対して0.84%又は塩基位置当たり0.0051%(10000の塩基当たり0.5のエラー)に等しい。このエラー率は、テスト配列における個別の読み取られた置換エラーについては、Margulies et al.によって報告されたエラー率の0.004%に類似しているが、全ゲノム再シークエンシング(0.68%)に対するよりもはるかに低い。
【0107】
両方のアライメント群中のインデルの出現率の同様の分析は、合計247052の配列(165bpストレッチ中に3.1%である)中の3883(フォワードプライマー群)及び3829(リバースプライマー群)のインデル出現率を示した。したがって、インデル出現率は、塩基位置当たり0.01891%(10000塩基当たり1.89のインデル)と等しい。インデル率は、塩基置換エラー率よりも高い。組み合わせた両方のタイプのシークエンシングエラーは、平均で10000塩基当たり2.39の頻度で、又は塩基位置当たり0.024で生じる。このエラー率は、Margulies et al.によって報告されたよりもはるかに低く、eIF4eエクソン1配列中に長いホモポリマーストレッチが存在しないことによって説明されるだろう。
【0108】
標的遺伝子座中の変異の検出
このスクリーニングの目的が(EMS)誘導点変異(優先的にC→T変異及びG→A変異)の同定であるので、参照配列に対する比較においてインデルを表わす配列はすべて、この実施例における分析のために廃棄された。大部分の単一の塩基置換は、任意の与えられた3Dプールにおいて一度のみ生じ、いくつかは2回若しくは3回、又は稀により頻繁に生じる。これらの単一の塩基置換は、アライメントさせた配列のすべての位置で一様に、且つ、均一の頻度で塩基当たり0.005%で生じるので、それらは、シークエンシングエラーを表わし、変異体ライブラリー中に存在する特異的変異ではないと憶測された。しかしながら、スキャンされた配列中の少数の特異的塩基位置では、特異的な単一の塩基配列差異がはるかに高い発生で生じる。以下の基準が満たされる場合、そのような単一の塩基配列差異はライブラリー中の変異を示す:
1.単一の塩基配列差異はC→T又はG→Aの変異を表わす。
2.出現率は、3Dプール当たり10000配列読み取り当たり、20以上である。
3.単一の塩基配列差異が、正確に1つ及び多くて1つの、Xプール、Yプール及びZプールに生じる。
この実施例において、そのような変異の1つは、リバースプライマーに対応するアライメント群中にeIF4Eエクソン1配列の塩基位置221で発見された。G→A変異(相補的な鎖におけるC→Tに対応する)であるこの変異が、10000の配列当たり70の頻度でプールX12中に、10000配列当たり33の頻度でプールY3中に及び10000配列当たり62の頻度でプールZ6中に生じた。同様な位置でのこの同様な変異は、バックグラウンドエラーレイトにおいても生じず、他のプールのうちのいずれかにも生じなかった。
【0109】
3つのプールのみの中のこのG221A変異の特有の出現は、DNAのもとの4重プールの同定を可能にし、4つのM2ファミリーを表した。これらの4つのM2ファミリーの各々のDNAは、表1及び表2のフォワードプライマー及びリバースプライマーと同一のプライマー06F598及び06F599(しかし5’の5塩基配列タグなしの)により個別に増幅された。増幅されたPCR産物を通常のサンガー法のシークエンシングにかけた。4つのファミリーのうちの1つのeIF4E遺伝子の配列(「24」とコードされた)は、オーバーラップするG及びAに対応する位置221での2つのピークを示した。これは、対立遺伝子の半分は野生型で、他方の半分がG221A点変異を保有するM2ファミリープールを示す(図2)。塩基位置221付近の他のM2ファミリーの配列は、参照(野生型)に従うものだった。
【0110】
この変異は、アルギニンに対してグルタミン置換をもたらす。この特定のM2ファミリーの種子は、ホモ接合変異体個体について選択するために温室で植えられ、それは、表現型を示すために使用されるだろう。
【0111】
同様の様式で、2つの他の点変異が454配列読み取りにおいて同定された。したがって、M82トマト変異体ライブラリーの変異密度の推定は、165bpにスキャンされた配列当たり3つの変異又は3072のM2ファミリー中の1000塩基当たり18の変異と等しい。これは、シロイヌナズナ(Greene et al., Genetics 164: 731-740, 2003)に対して報告された変異密度に相当する。
参考
Colbert et. al., 2001. High-throughput screening for induced point mutations. Plant Physiology 126: 480-484.

Duprat et al., 2002. The Arabidopsis eukaryotic initiation factor (iso)4E is dispensable for plant growth but required for susceptibility to potyviruses. Plant J. 32: 927-934.

Epinat et al., 2003. A novel engineered meganuclease induces homologous recombination in yeast and mammalian cells. Nucleic Acids Research, 31(11): 2952-2962.

Havre et al., 1993. Targeted mutagenesis of DNA using triple helix-forming oligonucleotides linked to psoralen. Proc.Natl.Acad.Sci. USA 90: 7879-7883.

McCallum et al., 2000. Targeted screening for induced mutations. Nature Biotechnology 18: 455-457.

Greene et al., 2003. Spectrum of chemically induced mutations from a large-scale reverse-genetic screen in Arabidopsis. Genetics 164: 731-740.

Lloyd et al., 2005. Targeted mutagenesis using zinc-finger nucleases in Arabidopsis. Proc.Natl.Acad.Sci. USA 102: 2232-2237.

Margulies et al., 2005. Genome sequencing in microfabricated high-density picolitre reactions. Nature 437: 376-380.

Menda et al., 2004. In silico screening of a saturated mutation library of tomato. Plant J.38: 861-872.

Nicaise et al., 2003. The eukaryotic translation initiation factor 4E controls lettuce susceptibility to the p otyvirus lettuce mosaic virus 1. Plant Physiol. 132: 1272-1282.

Ruffel et al., 2002. A natural recessive resistance gene against potato virus Y in pepper corresponds to the eukaryotic initiation factor 4E (eIF4E). Plant J. 32: 1067-1075.

Ruffel et al., 2005. The recessive potyvirus resistance gene pot-1 is the tomato orthologue of the pepper pvr2-eIF4E gene. Mol. Gen. Genomics 274: 346-353.

Shendure et al., 2005. Accurate multiplex polony sequencing of an evolved bacterial genome. Scienceexpress Report, August 4.

Stuart and Via, 1993. A rapid CTAB DNA isolation technique useful for RAPD fingerprinting and other PCR applications. Biotechniques, 14: 748-750.

Vandenbussche et al., 2003. Toward the analysis of the petunia MADS box gene family by reverse and forward transposon insertion mutagenesis approaches: B, C, and D floral organ identity functions require SEP ALLAT A-like MADS box genes in petunia. The Plant Cell 15: 2680-2693.
【図面の簡単な説明】
【0112】
【図1】EMS誘発変異を同定するための遺伝子のショットガンシークエンシングからもたらされるクラスタリングされた配列の図式的な表示を示す図である。変異はより明るい色、シークエンスエラーはより暗い色で塗られた。シークエンスエラーは無作為に及び大抵の場合ただ一度のみ観察されることが予想される。
【図2】3Dプールされたライブラリーからの4bpタグを付けたPCRプライマーにより増幅された100bpの遺伝子領域からもたらされるクラスタリングされたタグを付けたシークエンシングの図式的な表示を示す図である。変異はより明るい色、シークエンスエラーはより暗い色で塗られた。植物識別情報は、3つのタグ(1、2、3)及び(4、5、6)により同定された変異で識別されるが、2つ未満のタグ(7、8)により同定された変異で識別されない。シークエンスエラーは無作為に及び大抵の場合ただ一度のみ観察されることが予想される。
【図3】配列のタグ付けにおいて使用する長いPCRプライマー及び短いPCRプライマーのシステムの図解を示す図である。
【図4】28の3Dプールの各々に対するeIF4Eエクソン1増幅のPCR増幅収率のアガロースゲル推定を示す図である。

【特許請求の範囲】
【請求項1】
変異させた集団のメンバーにおける標的配列中の変異の検出のための方法であって、
(a)前記変異させた集団の各々のメンバーのゲノムDNAを単離して、各々の集団メンバーのDNAサンプルを提供する工程と、
(b)工程(a)で得られた前記DNAをプールする工程と、
(c)前記DNAプールからの1組の(任意に標識された)プライマーにより前記標的配列を増幅する工程と、
(d)工程(c)の前記増幅産物をプールして増幅産物のライブラリーを作成する工程と、
(e)前記ライブラリー中の前記増幅産物を任意に断片化する工程と、
(f)ハイスループットシークエンシングを使用して、前記増幅産物又は断片の前記ヌクレオチド配列を決定する工程と、
(g)前記断片の前記配列をクラスタリング/アライメントすることによって変異を同定する工程と、
(h)前記標的配列の修飾された機能について前記同定された変異をスクリーニングする工程と、
(i)前記同定された変異に対してハイブリダイズするようなプライマーを設計する工程と、
(j)工程(i)の前記プライマー、及び工程(c)の前記プライマーのうちの1つにより工程(d)の前記ライブラリーを増幅する工程と、
(k)前記変異を保有する前記集団メンバーを同定する工程と、
(l)工程(c)の前記プライマーを使用して工程(k)のメンバーからの前記標的配列を任意に増幅することによって、前記変異を確認する工程、及び前記増幅された産物の前記配列を決定する工程と
を含む変異させた集団のメンバーにおける標的配列中の変異の検出のための方法。
【請求項2】
変異させた集団のメンバーにおける標的配列中の変異の検出のための方法であって、
(a)前記変異させた集団の各々のメンバーのゲノムDNAを単離して、各々の集団メンバーのDNAサンプルを提供する工程と、
(b)工程(a)で得られた前記DNAをプールする工程と、
(c)前記DNAプールからの1組のタグ付けされた(任意に標識された)プライマーにより標的配列部分を増幅すると共に、該プライマーのうち少なくとも1つが、好ましくは遺伝子特異的な部位、タグ及びシークエンスプライマー結合部位が含まれるようにする工程と、
(d)工程(c)の前記増幅産物をプールして、増幅産物のライブラリーを作成する工程と、
(e)ハイスループットシークエンシングを使用して、前記増幅産物の前記ヌクレオチド配列を決定する工程と、
(f)前記断片の前記配列をクラスタリング/アライメントさせることによって変異を同定する工程と、
(g)前記タグを使用して前記変異を保有する前記メンバーを同定する工程と、
(h)工程(c)の前記プライマーを使用して工程(g)の前記メンバー(複数可)からの前記標的配列を増幅することによって、前記変異を任意的に確認する工程、及び前記増幅された産物の前記配列を決定する工程と
を含む変異させた集団のメンバーにおける標的配列中の変異の検出のための方法。
【請求項3】
前記変異させた集団が、変異を誘導する化学物質、電離放射線、標的化ヌクレオチド交換又は領域標的化変異誘発から成る群から選択された1つ又は複数による前記ゲノムの処理によって得られる、請求項1又は2に記載の方法。
【請求項4】
前記集団が、変異していないが、天然に存在する変異を含む亜集団を含む、請求項1又は2に記載の方法。
【請求項5】
前記プールする工程が、3Dプーリングストラテジーによるものである、請求項1〜4のいずれか一項に記載の方法。
【請求項6】
前記ハイスループットシークエンシングが、合成、好ましくはピロシークエンシングによって実行される、請求項1〜5のいずれか一項に記載の方法。
【請求項7】
シークエンシングは、ビーズのような固体支持体上で実施される、請求項1〜6のいずれか一項に記載の方法。
【請求項8】
前記シークエンシングが、ハイスループットシークエンシング、好ましくは合成によるシークエンシング(Sequencing-by-Synthesis)に基づく、請求項1〜7のいずれか一項に記載の方法。
【請求項9】
前記シークエンシングが、合成によるシークエンシング、好ましくはピロシークエンシングによって実行される、請求項1〜7のいずれか一項に記載の方法。
【請求項10】
シークエンシングが、
(i)シークエンシングアダプターを、前記断片にライゲーションさせる工程と、
(ii)前記アダプターライゲーションされた断片をビーズへアニーリングさせる工程(各ビーズは、単一の断片とアニーリングする)と、
(iii)各マイクロリアクターは、単一のビーズを含むように油中水型マイクロリアクター中で前記ビーズを乳化させる工程と、
(iv)エマルジョンPCRを実行して、前記ビーズの表面上でアダプターライゲーションされた断片を増幅させる工程と、
(v)前記増幅されたアダプターライゲーションされた断片が付着しているビーズを選別/濃縮する工程と、
(vi)各ウェルが単一のビーズを含むようにウェル中に前記ビーズを配置する工程と、
(vii)ピロリン酸シグナルを生成する工程と
を含む、請求項6に記載の方法。
【請求項11】
工程(c)及び/又は工程(i)中の前記プライマーが、改良された結合親和性を有するヌクレオチドを含む、請求項1〜10のいずれか一項に記載の方法。
【請求項12】
工程(c)において増幅される前記標的配列の部分が、約80bp〜約400bpである、請求項2〜11のいずれか一項に記載の方法。
【請求項13】
工程(c)において増幅される前記標的配列の部分が、約90bp〜約300bpである、請求項12に記載の方法。
【請求項14】
工程(c)において増幅される前記標的配列の部分が、100bp〜約200bpである、請求項12に記載の方法。
【請求項15】
特定の遺伝子又は形質のための1つ又は複数の(標識された)プライマーを含むキット。
【請求項16】
変異特異的なプライマー又は対立遺伝子特異的プライマーをさらに含む、請求項15に記載のキット。
【請求項17】
ビーズ及び/又はシークエンシングプライマーをさらに含む、請求項15又は16に記載のキット。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate


【公表番号】特表2009−509527(P2009−509527A)
【公表日】平成21年3月12日(2009.3.12)
【国際特許分類】
【出願番号】特願2008−533267(P2008−533267)
【出願日】平成18年9月21日(2006.9.21)
【国際出願番号】PCT/NL2006/000467
【国際公開番号】WO2007/037678
【国際公開日】平成19年4月5日(2007.4.5)
【出願人】(505464888)キージーン ナムローゼ フェンノートシャップ (11)
【Fターム(参考)】