説明

改善されたバルク変異体分析

本発明は、生物の中で発現され、かつその生物の特定の表現型(特徴の形質)と因果関係がある核酸配列の特定、および任意の単離、のための新しい戦略に関する。本発明の方法を用いると、当該技術分野で公知の方法とは対照的に、ゲノムに関して情報が入手できないかまたは限られた情報しか入手できない、例えば(作物)植物のような生物において、遺伝子を効率的に濃縮し、特定し、単離し、および/またはクローニングすることが可能になった。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、生物の特徴に関連する発現された核酸配列の特定、および任意の単離のための方法に関する。
【背景技術】
【0002】
表現型によってのみ定められる生命体の形質に関与する遺伝子をクローニングすること(いわゆる順遺伝子クローニング(forward gene cloning))は、遺伝学およびバイオテクノロジーにおいて、積年の課題である。特に(作物)植物の分野では、順遺伝子クローニングのための迅速かつ経済的な方法が大いに求められている。現在の探索は、順遺伝子(forward gene)単離のスピードを高め、順遺伝子単離の費用を下げる方法を見出そうとしており、特に、遺伝子クローニングを実施することができる種の範囲を広げようとしている。遺伝子クローニングは、大量の反復するDNAを含有する大きいかまたは特徴づけされていないゲノムを有する種では、とりわけ煩わしい。このような種は、レタス、コショウ、タマネギ、ニラ、マメ、小麦、ライムギ、大麦、ほか多数である。
【0003】
順遺伝子クローニングの目的は、表現型からのみ知られ、分子情報が入手できないかもしくは非常に限られた分子情報しか入手できないかまたは配列情報が入手できない遺伝子の特定である。順遺伝学(forward genetics)における出発点は、例えば、天然に存在する表現型バリアントまたは人工的に誘導された変異体であることができる。
【0004】
実質的に、順遺伝子クローニングについて2つの群の方法が認識されている:地図作成(マッピング)戦略およびタグ化戦略。これらの戦略は補完的であり、互いがその固有の限界を有する。
【0005】
地図作成戦略では、表現型は、マーカー支援減数分裂期組換え地図作成によって、染色体の最小のセグメントまで突き止められる。地図に基づくクローニングは多くの時間と労力を要する手順であり、特に豊富なゲノム情報、好ましくは全ゲノムDNA配列、が入手できる小さい群のモデル種で用いられる。
【0006】
理論的には、地図に基づくクローニングは、生殖周期を通して繁殖するいずれの生物についても普遍的に適用できる手順である(非特許文献1)。しかしながら、実際は、根本的な生物学的な制約がある。最も重要なことであるが、地図に基づくクローニングは、注目する遺伝子の領域における減数分裂期組換えの良好な頻度に、決定的に依存する。第2に、地図に基づくクローニングは、例えばレタス、コショウ、タマネギ、ほか多数のような植物における特徴づけが不十分な大きいゲノムにおいてはますます困難になる。このようなゲノムでは、反復するDNAがゲノムの大部分を構成し、これがDNAマーカーの明確な地図作成および遺伝子間隔(genetic interval)に及ぶ大きい近接するDNA配列のアセンブリを妨げるからである。
【0007】
古典的なタグ化戦略では、十分に特徴づけられた生物学的挿入変異誘発因子(トランスポゾンまたはT−DNA挿入物)は、遺伝子をクローニングするための媒体として使用されてきた。転位因子を遺伝子の中へと挿入することは、その挿入が、例えば遺伝子のコード領域または非コード領域で起こったかどうかによって、機能喪失または機能獲得、発現パターンの変化を導くことができ、または遺伝子機能に影響を与えないことができる。いずれの新たに生じる表現型に関与する遺伝子も、当然その挿入エレメントの近傍に存在し、従って、ゲノムDNAの隣接片とともに挿入配列を読み出すことによりクローニングされる。
【0008】
挿入変異誘発因子を用いるタグ化は、遺伝子をクローニングするための理論的には好ましいアプローチである。なぜなら、そのようなタグ化は、速く、減数分裂期組換えからは独立であり、そして遺伝子地図または豊富な配列情報などのこれまでのゲノム資源を必要としないからである(非特許文献2を参照)。タグ化により変異遺伝子をクローニングすることは、反復するゲノム配列によってもまたはゲノムサイズによっても妨げられない。
【0009】
このタグ化アプローチは、自然の遺伝子タグ化(トランスポゾン)系が既知であったか、またはランダムに組み込むDNA(T−DNA)を用いて大量の個体を形質転換することができた小数のモデル生物では成功であった(例えばトウモロコシを使用する非特許文献3を参照)。この小さい群の種のほかでは、既知の挿入エレメントが存在しないことに起因するか、または集団サイズに対する物量面の制約に起因するかのいずれかによって、タグ化はまったく使用できないか、またはほとんど使用できない。物量面では、1ゲノムあたりの挿入配列の数は少ない(1〜200)ので、タグ化は、1つまたはいくつかの特定の変異体を見出すために数千もの個体の集団を必要とする。
【先行技術文献】
【非特許文献】
【0010】
【非特許文献1】Petersら、Trends in Plant Science、2003年、第8巻、第10号、484−491頁
【非特許文献2】Maesら、Trends Plant Sci.、1999年3月、第4巻、第3号、90−96頁
【非特許文献3】Settlesら、BMC Genomics、2007年、第8巻、116頁
【発明の概要】
【発明が解決しようとする課題】
【0011】
本発明の目的のうちの1つは、特定の表現型の顕在化に関わる核酸の効率的な特定を可能にする新しい方法、およびその使用を提供することである。当該方法は、対象の種の豊富な減数分裂期組換え地図作成および事前のゲノムDNA配列の知識を必要とせず、人工的に交雑し操作することができるいずれの(植物)種でも用いることができる。本発明の他の目的は、本発明の説明、実施形態および特許請求の範囲から明らかになるであろう。
【課題を解決するための手段】
【0012】
本発明は、生物の中で発現され、かつその生物の特定の表現型(特徴の形質)と因果関係がある核酸配列の特定、および任意の単離、のための新しい戦略に関する。本発明の方法を用いると、当該技術分野で公知の方法とは対照的に、ゲノムに関して情報が入手できないかまたは限られた情報しか入手できない、例えば(作物)植物のような生物において、遺伝子を効率的に濃縮し、特定し、単離し、および/またはクローニングすることが可能になった。
【図面の簡単な説明】
【0013】
【図1】本発明に係る方法(の実施形態)の概略図である。この概略図では、そして本願明細書に開示される本発明に当てはまるが、ホモ接合であるときに観察することができる表現型上の顕在化の根底にあり、かつ本発明に係る方法によって特定される対象の遺伝子である遺伝子に変異(黒丸)を保有する参照対立遺伝子についてヘテロ接合である単一の個体によって描かれる、同質遺伝子的な集団が示されている(図1A、左図)。変異原性処理の後に、この集団は、参照対立遺伝子の表現型上の効果がヘテロ接合性の喪失によって観察可能になるように、遺伝子機能を排除または損なう新規な対立遺伝子(図1A、右図、灰色の丸)を含有するであろう。図1Aでは、5つの独立の非同義の対立遺伝子が描かれている。図1Bは、ヘテロ接合性の喪失に関連づけられる表現型の顕在化についての群として選択されるこれらの5つの植物の対立遺伝子組成を示す。図1Bの左図では、選択された表現型上の顕在化に関連しない遺伝子について、これらの5つの植物の遺伝子型が1〜5として描かれており、父系のまたは母系の対立遺伝子が接辞「a」または「b」を用いて示されている。このような遺伝子が植物および両親の中で関連する多型を含有しないということが理解できる。対照的に、選択された表現型と因果関係がある選択された遺伝子(図1B、右図)は、すべての5つの同質遺伝子的な植物に共通でありかつ親のうちの一方(この場合、親「a」)にはない非同義の、または別の態様で遺伝子的に中立でない対立遺伝子を1つ含有する。加えて、この選択された遺伝子は、これら5つの表現型的に選択された植物の各々に、新規かつ異なる非同義の、または別の態様で遺伝子的に中立でない多形性を含有する。多形性のこのパターンは、非常に稀である必要があり、従って、選択された表現型によって規定される形質の根底にある核酸配列(遺伝子)を特定するために使用することができる。
【図2】表1。A)ヘテロ接合性の喪失によって赤色の花の色を獲得した3つの独立のペチュニア変異体のトランスクリプトームをシーケンシングした後の合わせた結果(参照トランスクリプトーム)の要約。B)本発明の工程に従って、ユニジーンにおける多形性パターンに基づく選択基準を適用した後に残るユニジーンの数。参照トランスクリプトームの中のユニジーンの総数の百分率として表される、選択後の濃縮係数(enrichment factor)も与えられている。C)本発明に係る方法に基づく、残る遺伝子のランク付けされた一覧。3つの遺伝子は、適用したすべての基準に完全に適合した。赤色の花の色の根底にあることが事前に知られていた遺伝子はアントシアニジン3−O−グルコシルトランスフェラーゼであり、これは、2つの他の遺伝子とランク1を共有する。
【発明を実施するための形態】
【0014】
定義
以下の説明および実施例では、いくつかの用語が使用される。そのような用語に与えられるべき範囲を含めて、本願明細書および特許請求の範囲の明快で一貫性のある理解を提供するために、以下の定義が与えられる。本願明細書中に特段の記載がない限り、使用されるすべての技術用語および科学用語は、本発明が属する技術分野の当業者が一般に理解する意味と同じ意味を有する。すべての刊行物、特許出願、特許および他の参考文献の開示は、参照によりその全体を本願明細書に援用したものとする。
【0015】
対立遺伝子:相同染色体上で同じ位置を有することができかつ別の形質に関与する、遺伝子の少なくとも2つの選択的形態のうちの1つ。非限定的な例は花卉の花の色についての遺伝子であり、− 1つの遺伝子が花弁の色をコントロールする可能性もあるが、その遺伝子のいくつかの異なるバージョンまたは対立遺伝子が存在する可能性がある。1つのバージョンは赤色の花弁を生じるかもしれないが、他方で、別のバージョンは白色の花弁を生じるかもしれない。個々の花卉の生じた色は、その花卉が遺伝子についてどちらの2つの対立遺伝子を保有するか、およびその2つがどのように相互作用するかによるであろう。
【0016】
特徴:生物の表現型の質に関する。特徴は、異なる形質で顕在化することができる。例えば、生物は、花の色を特徴として有する植物であることができ、赤色の花または白色の花がその特徴の形質AおよびBであることができる。本発明の範囲内では、特徴の第1の形質を有する生物のメンバーが、その特徴の第2の形質を有するその生物のメンバーから表現型的に区別することができる限りは、特徴(または形質)はいずれであってもよい。これは、生物の検査によって直接観察することができる差だけに限定されるわけではなく、その生物のさらなる分析の際に、例えば特定の状況に対する(例えば特定の疾患に対する)耐性の分析の際に、またはこのような生物における特定の代謝産物の存在の分析の際に明らかになりうる特徴/形質をも含む。
【0017】
本発明に関する範囲での「遺伝子の発現」または「発現された核酸」は、適切な調節領域に、特にプロモーターに作動可能に連結されているDNA領域が、生物活性がある、すなわち生物活性のあるタンパク質またはペプチドへと翻訳されうるか、またはそれ自体で活性であるRNAへと転写されるプロセスを指す。
【0018】
「遺伝子」は、好適な転写調節領域(例えばプロモーター)に作動可能に連結された、細胞の中でRNA分子(例えばmRNA)へと転写される領域(転写された領域)を含むDNA配列である。従って、遺伝子は、いくつかの作動可能に連結された配列、例えば、プロモーター、例えば翻訳開始に関わる配列を含む5’非翻訳リーダー配列(5’UTRとも呼ばれ、これは、翻訳開始コドンの上流の転写されるmRNA配列に対応する)、(タンパク質)コード領域(cDNAまたはゲノムDNA)ならびに例えば転写終結点およびポリアデニル化部位を含む3’非翻訳配列(3’非翻訳領域、または3’UTRとも呼ばれる)を含んでもよい。
【0019】
「同質遺伝子的な」は、遺伝子的に同一であることを意味する。同質遺伝子的な集団内の個々の細胞は、典型的には、単一の祖先の子孫であり、等しい遺伝子構成を有する。本発明の範囲内で、「同質遺伝子的な」は、cDNAのレベルで、個々のメンバーが、自然変異、または、本発明の好ましい実施形態では、変異原性処理の結果として生じる可能性があるいずれかの点変異を除いて95〜99%、さらには100%同一であると解釈されるものとする。実際、用語「同質遺伝子的な」は周知であり、当業者によって理解される。
【0020】
変異生成または変異原性処理:この用語は、本願明細書では、核酸、遺伝子、またはゲノムにおける変化の導入を導く処理に関し、例えば点変異および/または10までの連続するヌクレオチドの挿入もしくは欠失の導入を導く。
【0021】
核酸:本発明に係る核酸は、ピリミジンおよびプリン塩基、好ましくはそれぞれシトシン、チミン、およびウラシル、ならびにアデニンおよびグアニン、のいずれかのポリマーまたはオリゴマーを包含しうる(Albert L.Lehninger、「Principles of Biochemistry」、Worth Pub.、1982年、793−800頁を参照。この文献は、参照により、あらゆる目的のためにその全体を本願明細書に援用したものとする)。核酸は、DNA(cDNAを含む)、もしくはRNA、またはこれらの混合物であってもよく、持続的にまたは一過性に一本鎖のまたは二本鎖の形態(ホモ二本鎖、ヘテロ二本鎖、およびハイブリッド状態を含む)で存在してもよい。
【0022】
シーケンシング:用語「シーケンシング」は、核酸試料、例えばDNAまたはRNAの中のヌクレオチドの順序(塩基配列)を決定することを指す。
【0023】
形質:生物学では、形質は、同じ生物の(任意の)他の個々のメンバーと比較した、生物の個々のメンバーのいずれかの表現型上の特有の特徴に関する。本発明に関する範囲では、形質は、遺伝で受け継がれることができ、すなわちその生物の遺伝情報によって、その生物の次の世代に伝えることができる。形質の非限定的な例としては、例えば、視覚的に観察することができる形質または(例えば、代謝産物の存在またはレベルについての)分析によって観察することができる形質が挙げられる。
【0024】
「同じ特徴の形質」または「当該(前記)特徴の形質」:1つの特徴について存在する(または目に見えるようになる)少なくとも2つの形質の群のいずれか1つ。例えば、特徴「花の色」の場合には、表現型の顕在化は、青色、赤色、白色などを含んでもよい。上の例では、青色、赤色および白色は、すべて同じ特徴の異なる形質である。
【0025】
上記の目的は、驚くべきことに、添付の特許請求の範囲に記載される方法を提供することによって解決される。
【0026】
より具体的には、生物の特徴に関連する発現された核酸配列の特定、および任意の単離のための方法であって、
a)当該特徴の形質Aを有する当該生物の少なくとも2つのメンバーを準備する工程であって、この形質Aを有するメンバーは、形質Bを有する生物の同質遺伝子的なメンバー(複数可)に由来し、好ましくは独立に由来し、かつ形質Aおよび形質Bは異なる工程と、
b)この形質Aを有する工程a)のメンバーの各々からcDNAを得て、形質Aを有するメンバーから得られた個々のcDNAの、少なくとも一部分、好ましくは各々のヌクレオチド配列を決定する工程と、
c)形質Aを有する他のメンバーの対応するcDNAとの比較によって、形質Aを有するメンバーの各々の個々のcDNAの中の一塩基多型位置を決定する工程と、
d)形質Aを有するメンバーの少なくとも2つ、好ましくは形質Aを有するメンバーのすべて、が少なくとも1つの一塩基多型を含有する個々のcDNAを特定する工程であって、好ましくはこれらの一塩基多型は、この形質Aを有する少なくとも2つの、好ましくはすべてのメンバーについてのcDNAの中で異なる位置にある工程と、
e)任意に、工程d)で特定されたcDNAの各々について、それが、生物の特徴に関連することを検証する工程と
を含むことを特徴とする方法が提供される。
【0027】
任意におよび好ましくは、この方法は、形質Aを有する少なくとも2つの、好ましくはすべてのメンバーが少なくとも1つの非同義の一塩基多型を有するd)で特定されたcDNAの各々から個々のcDNAを特定する工程(f)を含むことができる。
【0028】
次に、好ましい実施形態では、この方法は、形質Aを有する少なくとも2つの、好ましくはすべてのメンバーは、正確に1つの非同義の一塩基多型を有する上記の工程(f)において特定されたcDNAの各々から個々のcDNAを特定する工程(g)を含んでもよい。
【0029】
また、当該方法は、実施された工程(d)、(f)および/または(g)において特定されたすべての個々のcDNAを列挙し、すべての個々のcDNAが適合する実施された工程(d)、(f)および/または(g)の数に従って(最も多い適合が最高のランクである)、すべての個々のcDNAをランク付けする工程(h)を含んでもよい。
【0030】
この方法は、好ましくは、この特定されたcDNAが由来する発現された核酸配列を特定し、任意に,その発現された核酸配列を含む遺伝子をクローニングする工程も含んでもよい。
【0031】
本発明は、現在の順クローニング戦略に関する上記の課題が、本発明に係る方法によって解決されうるということの実現に基づき、そして本発明は、いずれの生物にも適用でき、かつ1ゲノムあたり数千もの十分に検出可能な変異を生成して、物量面の集団の制約を可能な限り取り除く、非生物学的変異誘発因子を使用し、これを、ある表現型(形質A)を示す(少なくとも2つのメンバーの)変異体コレクションから得られるトランスクリプトーム(cDNA)をシーケンシングすることと組み合わせ、そしてそれらに基づいて、この変異体コレクションのメンバーの各々において(しかし、必ずしも当該遺伝子/cDNA内の同じ位置にある必要はない)、少なくとも1つの一塩基多型、好ましくは少なくとも1つの非同義の一塩基多型を有するいずれかの遺伝子を特定することにより、生物学的変異誘発因子を用いてタグ化することに基づく方法の限界を克服する。加えて、この変異体コレクションは自然変異から得ることができる。
【0032】
例えば変異誘発因子を用いた処理によって誘導された変異に加えて、さらなる同質遺伝子的な集団において発生する自然突然変異も使用することができる。換言すれば、形質Bを有する同質遺伝子的な集団において、(例えば自然突然変異に起因して)形質Aを有する少なくとも2つのメンバーが見出される場合、その特徴および形質に関与する遺伝子は、本願明細書に開示される方法を用いて特定することができる。
【0033】
いずれの生物における遺伝子も、点変異のような化学的に誘導された変異を用いてタグ化することができる(そして、これにより異なる表現型を顕在化させうる)ということが実現された。しかしながら、このような小さくかつランダムな変異(タグ)を全ゲノムの中でどのようにして検出するかという大きな問題が存在する。なぜなら、そのような変異は、特異的なPCR増幅のいずれの形態にも適していないからである。さらに、化学的に誘導された変異は、高頻度でランダムにゲノムに導入される。結果として、もとの種の遺伝子と比較して、多くの遺伝子が、変異を同時に含む可能性があり、観察される表現型に関与するか、または特定の形質を示すための遺伝子の正しい特定をさらに複雑にする。
【0034】
本発明者らは、解決策は、クローニングされる対象の遺伝子座(しかし、これはまだ知られていない)に独立かつ異なる変異体対立遺伝子のコレクションを作成し、次いでこのコレクションに由来するすべてのcDNAを複数回リシーケンシングすることから得ることができるということを実現した。このコレクションの中で(すべての)cDNA配列を比較するとき、変異体プールの中の1つのcDNAが一貫した変異を示すであろう。これは、その変異体表現型の根底にある遺伝子である可能性が極めて高い。
【0035】
換言すれば、および例えば、特定の形質B、例えば赤色の花、を顕在化させる同質遺伝子的な集団(の種子)を、ゲノムの中に点変異を誘導する変異誘発因子で処理することができる。この変異誘発因子を用いた処理の結果として、ランダムな変異が、各処理されたメンバーのゲノムに導入される。通常、処理後、処理されたメンバーのほとんどは、いまだ特定の形質Bを顕在化させるであろう。それらのメンバーでは、変異誘発因子を用いた処理によって導入された変異は、形質を変えなかった。換言すれば、これらのメンバーでは、その形質の特徴に関連する遺伝子は、当該形質が(例えば、形質Aへと、例えば、黄色の花であるように)変化するようには変異していない。しかしながら、いくつかのメンバーでは、この変異誘発因子は、それらのメンバーではもともとの形質Bはもはや顕在化されないが形質Aは顕在化されるというように、観察される形質の根底にある遺伝子において変異を誘導した可能性がある。
【0036】
変異誘発因子のランダムな特徴に起因して、および形質Aを有する少なくとも2つのメンバー、好ましくはより多くのメンバーが観察される場合、変異誘発因子によって導入され、かつ形質Bから形質Aへの変化に関与する変異は、同じ遺伝子に位置するが、当該遺伝子の中の同じ位置にはないという可能性が非常に高い。例えば、形質Aを有する第1のメンバーでは、変異はヌクレオチドRに位置してもよく、形質Aを有する第2のメンバーでは、変異はヌクレオチドSに位置してもよく、そして形質Aを有する第3、第4および第5のメンバーでは、変異は、それぞれ、位置T、U、およびVに位置してもよい(R、S、T、U、およびVはその遺伝子内の異なる位置である)。換言すれば、これらのメンバーは、すべて、互いに比較したとき、その関与する遺伝子の異なる位置に変異を示す。同時に、形質Aを示すメンバーはゲノム全体にわたって他の位置にも変異を保有するが、現在形質Aを示すメンバーの各々において別の発現された遺伝子が改変されている可能性は、事実上ゼロである。
【0037】
形質Aを有するメンバーから得られるcDNAをここで互いに比較することにより、形質Aを有するメンバーの各々において少なくとも1つのヌクレオチドの改変を保有し、かつこの改変は、当該メンバーのうちの少なくとも2つにおいて、当該cDNA内の異なる位置に位置するcDNAが、特定されうる。このcDNAは同じ特徴の観察される形質に関与する。
【0038】
本発明に係る方法では、(誘導された)対立遺伝子系列のほかの点では同質遺伝子的な遺伝的バックグラウンドの、(誘導された)対立遺伝子系列からプールが作製される。本発明に係る方法は、クローニングされる対象の遺伝子内に位置するSNPを検出する。
【0039】
当該方法は、コショウおよびタマネギなどの煩わしいと悪名高い作物を含めた人工的にハイブリダイズし変異化することができるすべての種に適用でき、遺伝子地図の存在とは独立しており、あらゆるサイズのおよび複雑度のゲノムにおいても機能するであろう。
【0040】
従って、本発明に係る方法を用いると、非常に多くの遺伝子の中から、観察される形質に関わるまたは関与することになる可能性のある候補である遺伝子を特定することが、ここで可能になった。実際、本発明に係る方法を適用するとき、可能性のある候補の群は、例えば10個、5個、3個、2個、またはさらには1個の候補遺伝子に迅速かつ確実に限定することができる。本発明に係る方法を用いると、特定の形質の顕在化に関与するかまたは関わる遺伝子の迅速な特定がここで可能になった。
【0041】
より詳細に言えば、本発明に係る方法では、特定の表現型を有する(または特定の形質Aを有する)生物の少なくとも2つの個々のメンバーが比較される。これらの少なくとも2つのメンバーは、(異なる)形質Bを有する同質遺伝子的な生物に由来する。
【0042】
本発明については、形質Aまたは形質Bを有する生物のメンバーが、(形質Aの場合には)(例えば変異誘発因子処理によって、もしくは自然突然変異によって)当該生物の同質遺伝子的なメンバーに由来するか、または(形質Bの場合には)当該生物の同質遺伝子的なメンバーであること、換言すれば、当該生物が同じ遺伝的バックグラウンドを有する(例えば、同じ近交系に由来する)ことが重要である。形質Aまたは形質Bを有する個々のメンバーは同質遺伝子的であり、すなわち、自然変異に起因して、または、本発明の好ましい実施形態では、変異原性処理に起因して遺伝子材料に導入された変化を除いて、同じ遺伝的バックグラウンドを有する。
【0043】
観察される表現型が含まれるのは、形質Aを有するメンバーと形質Bを有するメンバーとの間の、遺伝子材料におけるこれらの差異においてである。(形質Aから形質Bへの)特徴の観察される変化の結果として、形質Aを有するメンバーは、それらが、形質Bを有する当該生物のメンバーによって発現された核酸とは異なり、かつ当該生物(形質Aおよび形質Bはこの生物の表現型形態である)の特徴と関連する、少なくとも1つの核酸をここで発現するように改変される必要がある。
【0044】
好ましくは、形質Aを有するこの少なくとも2つのメンバーは、独立に、形質Bを有する当該生物の同質遺伝子的なメンバーに由来する。
【0045】
用語「独立に…に由来する」は、形質Aを有するこの少なくとも2つのメンバーが、例えば変異誘発因子処理の結果として、互いに独立に、当該形質Aを得たメンバーであるということを示す。当該生物が植物である場合、この少なくとも2つのメンバーは、各々、例えば植物が生育するもとになる種子の変異誘発因子処理の際に、形質Aを獲得したかもしれない。そのような例では、この形質は、形質Aを顕在化させるいずれかのさらなるメンバーから独立に第1のメンバーに導入される。換言すれば、好ましくは、形質Aを有するメンバーは、例えば、すでにこの形質Aを顕在化させる最後の3世代、4世代、5世代、6世代、7世代、8世代、9世代または10世代にわたって共通の先祖を共有しない。好ましくは、すべてのメンバーは、独立に、形質Bを有する当該生物の同質遺伝子的なメンバーに由来する。
【0046】
上記のように、2つの異なる形質の存在に顕在化されるように、形質Aを有するメンバーは、形質Bを有する他のメンバーによって発現された核酸とは異なり、かつ当該生物(形質Aおよび形質Bはこの生物の表現型形態である)の特徴と関連する少なくとも1つの核酸を発現する。
【0047】
このような(例えば点変異によって)タグ化された核酸を検出するために、本発明の方法では、形質Aを有する工程a)のメンバーの各々に由来するcDNA、好ましくは全cDNAが得られ、これらの個々のcDNAのヌクレオチド配列、好ましくはこの形質Aを有するメンバーから得られたcDNAの各々が決定される。換言すれば、形質Aを有するすべてのメンバーのこれらのトランスクリプトーム、好ましくは全トランスクリプトームは、独立に形質Aを獲得したすべての他のメンバーのトランスクリプトーム、好ましくは全トランスクリプトームと比較される。好ましくは、選択された組織の中のすべての発現された遺伝子の完全配列が比較される。
【0048】
これについて、cDNA、好ましくは全cDNA、は形質Aを有するこの少なくとも2つのメンバーから得られる。cDNA、好ましくは全cDNAの調製は、いずれかの好適な当業者に公知の方法によって行うことができる。例えばABgene、Ambion、Applied Biosystems、BioChain、Bio−Rad、Clontech、GE Healthcare、GeneChoice、Invitrogen、Novagen、Qiagen、Roche Applied Science、Stratageneなどから、cDNA合成のための多くの市販のキットを購入することができる。このような方法は、例えばSambrookら(Sambrook,J.、Fritsch,E.F.、およびManiatis,T.、「Molecular Cloning: A Laboratory Manual」、Cold Spring Harbor Laboratory Press、NY、第1、2、3巻(1989))に記載されている。当業者なら、cDNAは、例えば個々のcDNAの提示(representation)の差異を少なくするためのノーマライゼーション(normalisation)(Evrogenなど)によってさらに処理することができるということも理解するであろう。
【0049】
示したように、本発明に係る方法のためには、形質Aを有する少なくとも2つのメンバーのcDNA、好ましくは全cDNAが得られ、シーケンシングされ、そして互いに比較されることが必要とされる。形質Bを有するメンバーから得られるcDNAとの比較は、これまでに説明したように、必要とはされない。より好ましくは、各々が形質Aを有する当該生物の少なくとも3、4、5、6、7または8のメンバーが、本発明に係る方法で準備され/使用される。
【0050】
これまでに説明したように、本発明は、独立に表現型上の形質(形質A)を獲得した生物の(好ましくは全体の)トランスクリプトームの配列を比較することにより、特定の特徴(または形質)に関連する遺伝子の差異(genetic difference)を特定することができるということを実現したことに基づく。好ましい実施形態では、形質Aを有するメンバーは形質Bを有するメンバーのランダムな(化学的)変異生成処理によって生成されるので、このような処理された生物の遺伝子材料は、多くのおよびランダムな変異を含むであろうし、そしてそれらの変異のほとんどは観察される形質とは関連づけられないであろう。従って、形質Aを有する1つのメンバーのcDNA、好ましくは全cDNAを、形質Bを有する1つのメンバーのcDNA、好ましくは全cDNAと比較することで、観察される表現型と関連する核酸の特定は可能にはならないであろう。しかしながら、各々が好ましくは独立に当該形質Aを獲得した形質Aを有する少なくとも2つのメンバーが互いに比較されるとき、その特徴(または形質)に関与する(または関連づけられる)核酸を特定することが可能になるということが、本発明者らによって実現された。
【0051】
形質Aを有するメンバーは、(独立に)同じ同質遺伝子的な源に由来する。この同質遺伝子的な源の変異処理の結果として、変化がランダムに遺伝子材料に導入される。第1のメンバーにおいて誘導される変化は、第2のメンバーにおいて誘導される変化とは異なるであろう。しかしながら、これらの第1のメンバーおよび第2のメンバーの両方が、変異原性処理の結果として、ここである表現型を発現する、すなわち形質Aを有する場合、両方のメンバーにおいて同じcDNAが一塩基多型(SNP)を呈示するであろうという可能性が極めて高い。この変異処理のランダムなプロセスに起因して、このようなSNPは、そのようなcDNA内で同じ位置に位置する可能性は非常に低い。このcDNAは、ここで、検討対象の生物の特定の形質または特徴に関連づけられる発現された核酸に由来するcDNAとして特定されることができる。なぜなら、関連づけられないcDNAが、形質Aを有するその少なくとも2つのメンバーにおいてそのようなSNPを呈示するという可能性はゼロに近いからである。
【0052】
換言すれば、本発明は、例えば1つの遺伝子(形質A)における5つの対立遺伝子変異の「変異体プール」に由来するすべてのcDNAの配列において、互いに比較したときに一貫して配列における差を示している個々のcDNAはただ1つ存在するであろうということを実現したことに基づく。
【0053】
形質Aを有する各メンバーのcDNA、好ましくは全cDNA、を比較するために、形質Aを有するそのメンバーのcDNA、好ましくは全cDNAはシーケンシングされる必要がある。cDNAのシーケンシングは、当業者に公知のいずれの好適な方法によっても行うことができる。しかしながら、特にMargulies M.ら(http://www.454.com、「Genome sequencing in microfabricated high−density picolitre reactors(微細加工した高密度ピコリットル反応装置でのゲノム塩基配列決定)」、Nature、2005年、第437巻、376−80頁]によって記載されるもののような方法が非常に好ましく、この方法は、全トランスクリプトーム(すべてのcDNA)の迅速かつ効率的なシーケンシングを可能にする。例えば、および好ましい実施形態では、得られるcDNA断片のヌクレオチド配列は、例えば国際公開第03/004690号パンフレット、国際公開第03/054142号パンフレット,国際公開第2004/069849号パンフレット、国際公開第2004/070005号パンフレット、国際公開第2004/070007号パンフレット、および国際公開第2005/003375号パンフレット、Seoら、Proc.Natl.Acad.Sci.USA、2004年、第101巻、5488−93頁に開示されるもの、ならびにHelicos、Solexa、US Genomicsなどの技術(これらは、参照により本願明細書に援用したものとする)のような高スループットシーケンシング方法によって決定される。
【0054】
本発明に係る方法の次の工程では、cDNAにおける一塩基多型頻度を確立するために、形質Aを有するメンバーのcDNA、好ましくは全cDNAの得られる配列は、形質Aを有する他のメンバーのcDNA、好ましくは全cDNAと比較される。この判定は、当業者に公知のいずれの好適な方法によっても、および例えば後述する実施例に示される方法によって行うことができる。
【0055】
要するに、例えば、cDNA断片のヌクレオチド配列のアラインメントを使用して、同じ転写された遺伝子に由来する(しかし、形質Aを有する異なるメンバーに由来する)ヌクレオチド配列を集め、これらのヌクレオチド配列を比較してもよい。ヌクレオチド配列が同じ転写された遺伝子に由来するかどうかは、配列間の相同性に基づいて確立することができる。本発明の目的のために、ヌクレオチド配列が、少なくとも30、好ましくは少なくとも50、より好ましくは少なくとも90、なおより好ましくは少なくとも100、150、200ヌクレオチドの長さにわたって少なくとも95、96、97、98、99、100%相同的であるとき、それらのヌクレオチド配列は、同じ転写された遺伝子に由来するとみなされる。
【0056】
次の工程では、そして得られたデータに基づいて、増加したSNP頻度を有する形質Aを有するメンバーのcDNA、好ましくは全cDNAのコレクションの中のcDNAを特定することができる。本発明に係る方法では、形質Aを有するメンバーの少なくとも2つが少なくとも1つの一塩基多型を含有し、かつ好ましくはこれらの一塩基多型がcDNAの中の異なる位置にある、個々のcDNAが特定される。好ましくは、形質Aを有する分析されたメンバーの各々は、そのcDNAの中に、好ましくはcDNAの中の異なる位置に少なくとも1つの一塩基多型を含有する。例えば、形質Aを有する4つの植物が分析される場合、これら4つの植物の(同じ、すなわち、これらの植物の各々において同じ遺伝子に由来する)cDNAの中に、植物1、2、3、および4についてそれぞれ位置25、34、56および101にSNPを含有するcDNAが特定されてもよい。あるいは、このSNPは、いくつかの植物について同じ位置にあってもよいが、いくつかの他の植物についてはそうではなくてもよい。例えば、これらのSNPは、植物1、2、3、および4についてそれぞれ位置25、25、56および101、またはさらには25、25、101、および101にあってもよい。
【0057】
本発明に係る方法では、形質Aを有するメンバーの中のシーケンシングされるすべてのcDNAの中で、少なくとも1つの特定のcDNAが、形質Aを有する少なくとも2つのメンバー、しかし好ましくは形質Aを有するメンバーの各々、において少なくとも1つの遺伝子上の(好ましくは非同義の)一塩基多型(SNP)を保有するであろう。
【0058】
換言すれば、この特定のcDNAは、形質Aを有する分析されたメンバーの各々において(必ずしも対応するcDNAの同じ位置にではない)少なくとも1つのSNPを含むであろう。このようなcDNAは、観察される形質Aに関わるかまたは関与する遺伝子に由来するcDNAである可能性が高い候補であり、この情報は、その後、発現された核酸配列を特定し、当業者に公知の方法によって対応する遺伝子をクローニングするために使用することができる。
【0059】
任意におよび好ましくは、本発明に係る方法の次の工程では、形質Aを有する少なくとも2つの、好ましくはすべての、メンバーが少なくとも1つの非同義の一塩基多型を有する、これまでの工程で特定されたcDNAの各々からの個々のcDNAが、特定される。
【0060】
当業者なら理解するとおり、観察される表現型(形質A)に関わるか、またはそれに関連するかまたはその原因となるために、これまでの工程で特定されたcDNAにおいて見出される少なくとも1つのSNPは、コードされるタンパク質の中のアミノ酸の変化に関連づけされるに違いないという可能性が非常に高い。それゆえ、少なくとも1つの非同義のもの(コドンの変化を導き、コードされるアミノ酸の変化を導く)の存在を特定することが、本発明に係る方法をさらに改善し、観察される形質Aに関わる遺伝子のさらにより信頼できる特定を可能にする。
【0061】
実際、当業者は、本発明に関する用語「非同義(の)」を、塩基のトリプレットにおける少なくとも1つのヌクレオチドの変化に起因して、コドンの変化が発生し、この変化したコドンがもとのコドンと比較して異なるアミノ酸をコードするということを示すものとして理解する。
【0062】
形質Aを有する少なくとも2つの、好ましくはすべての、メンバーが少なくとも1つの非同義の一塩基多型を有するcDNAを特定するというこれまでの工程が実施される場合、任意に、しかし好ましくは、次の工程において、少なくとも2つの、しかし好ましくは形質Aを有するすべてのメンバーが1以下の非同義の一塩基多型しか有しない、これまでの工程のcDNAの各々から個々のcDNAが特定される。
【0063】
実際に、そのようなcDNAが、観察される表現型(形質A)に関与するかまたは観察される表現型(形質A)と因果関係がある遺伝子に由来する可能性が高い候補であり、従って、本発明に係る方法がさらに改善されることが、本発明者らによって見出された。
【0064】
本発明に係る方法のさらなる改善は、これまでの工程のいずれかで特定されたcDNAの各々から個々のcDNAを特定することを含むことができ、この特定において、少なくとも2つの、好ましくは形質Aを有するすべてのメンバーは進化上保存されたアミノ酸位置でアミノ酸変化を引き起こす非同義の一塩基多型を有し、好ましくはこれらの新しいアミノ酸は、もとの変異していないアミノ酸とは化学的に異なる(すなわち芳香族 対 非芳香族、極性 対 非極性、特定のpHにおいて陰性、陽性または中性、正または負の疎水性親水性指標(親水性または疎水性など)。
【0065】
本発明に係る方法で実施されるこれまでに開示された工程によっては、実施された工程(d)、(f)、(g)、および/または(h)で特定されたすべての個々のcDNAは、それらcDNAが適合する(実施された)工程d〜fの数に従ってランク付けすることができる。次の工程で、すべての工程(d)、(f)、(g)、および/または(h)に適合して、従って最高ランクにある発現された核酸配列を、観察される表現型に関わる、観察される表現型に関与するまたは観察される表現型と因果関係がある可能性が最も高い候補として特定することができる。
【0066】
上記の事柄に基づいて、発現された核酸配列を特定することができ、その遺伝子をクローニングすることができる。
【0067】
好ましい実施形態では、当該形質Aを有する生物のメンバーは形質Bを有する当該生物のメンバーの変異生成によって得られたものであり、この形質Bを有するメンバーはこの変異生成処理の前には同質遺伝子的であった、本発明に係る方法が提供される。
【0068】
本発明に係る方法の1つの実施形態では、異なる特徴の形質Aを有する少なくとも2つのメンバーは、自然変異の結果であることができ、すなわち以前に形質Bを顕在化させていた生物における核酸の自然のまたは自発的な変化に起因してもよい。このような遺伝情報における変異は、意図的なものではなく、その生物が(例えば、形質Bから形質Aへの)表現型における観察される変化に関与する遺伝情報を保有するということを明らかにする。
【0069】
しかしながら、好ましくは、本発明に係る方法は、このような意図的なものではなく制御できない遺伝情報のばらつきには依存しないが、代わりに、計画的な変異生成の結果である特定の形質を有する変異体に依存する。当業者は、例えば既知の変異誘発因子の使用によって任意の生物の遺伝情報を変異させることができる方法を理解する。このような変異誘発因子の使用によれば、変異は、生物のメンバーのゲノムにおいてランダムに発生することができる。換言すれば、遺伝子のような核酸は、(化学的に、生物学的にまたは放射線によって)誘導された変異(例えば、例えばメタンスルホン酸エチルによる点変異)を用いて、(変異していない核酸との比較によって)タグ化することができる。
【0070】
「照射による変異生成」の例としては、X線、γ線、UV光、または電離粒子が挙げられる。「生物学的変異生成」の例としては、例えば、例えばrecAのようなリコンビナーゼを使用する国際公開第0150847号パンフレットに記載されているもののような方法が挙げられる。本発明に係る方法で使用することができる「化学的変異誘発因子」の例としては、メタンスルホン酸エチル(EMS)、硫酸ジエチル(DES)、N−ニトロソ−N−エチル尿素(ENU)、ジエポキシブタン、2−アミノプリン、5−ブロモウラシル、臭化エチジウム、亜硝酸、ニトロソグアニジン、ヒドロキシルアミン、アジ化ナトリウム、またはホルムアルデヒドなどの特定の化学物質の使用が挙げられる。
【0071】
好ましくは、変異生成の方法は、ゲノムにおける点変異、または10までの連続するヌクレオチドの挿入、置換もしくは欠失を誘導する。
【0072】
当業者なら、この実施形態に関する範囲内で、形質Aを有するメンバーおよび形質Bを有するメンバーは、上記変異生成処理によって導入された変異を除いて、(これらはともに同じ遺伝的バックグラウンドに由来するので)同質遺伝子的であるということを理解するであろう。
【0073】
しかしながら、挿入変異を用いる旧来の地図作成およびタグ化戦略とは対照的に、このような小さくかつランダムな変異は、検出するのが困難である。なぜなら、そのような変異は、特異的なPCR増幅のいずれの形態にも適していないからである。しかしながら、上記の戦略を使用する妥当な理由がいくつかある。当該変異生成は、実質的にいずれの注目する種にも適用することができ、誘導された変異体の範囲は、タグ化アプローチを用いる場合よりも広く、変異生成は、通常、より効率的であり、かつ第二部位突然変異がより容易に得られる。
【0074】
実に様々な好適な変異生成方法を用いることができるが、変異誘発因子が、トランスポゾン挿入物またはT−DNA挿入物からなる群から選択される生物学的変異誘発因子ではないことが好ましい。好ましくは、使用される変異生成方法は、遺伝子材料に点変異を導入する。
【0075】
別の実施形態では、当該生物が植物であり、好ましくはトマト、コショウ、ナス、レタス、ニンジン、タマネギ、ニラ、チコリー、ダイコン、パセリ、ホウレンソウ、メロン、およびキュウリからなる群から選択される作物植物である、本発明に係る方法が提供される。
【0076】
本発明に供することができる生物は、細菌、原核生物および真核生物を含めたいずれの生物であることができる。しかしながら、好ましくはこの生物は、真核生物、特に植物、より特定すれば作物植物である。好ましくは、この植物は、トマト、コショウ、ナス、レタス、ニンジンを含めた重要な作物植物からなる群に属する植物であるが、当該方法は、実質的にすべての他の植物に適用することができる。
【0077】
特に、本発明は、当該技術分野で利用可能な地図作成およびタグ化技法が不可能であるかまたは煩わしいと判明している作物植物由来の、遺伝子のような核酸の特定およびクローニングを可能にする。
【0078】
さらなる実施形態では、当該生物が植物であり、かつ工程a)に先立って、劣性の形質Aをコードする対立遺伝子および優性の形質Bをコードする第2の対立遺伝子についてヘテロ接合であるF1ハイブリッド集団が作成され、かつこのF1ハイブリッド集団が変異生成に供され、かつ変異生成の後にこのF1集団から、形質Aを有するメンバーが選択される、本発明に係る方法が提供される。
【0079】
好ましくは、この対立遺伝子系列は、例えば、1つの遺伝子座で新しい対立遺伝子を選択するための標準的な遺伝子アプローチによって構築することができる。このアプローチは、1つの参照対立遺伝子(これは、この遺伝子座のこれまでに認識された劣性の表現型、すなわち形質Aを産生する)およびこの遺伝子座の形質Bを産生する1つの優性の対立遺伝子についてヘテロ接合であるF1集団を作成することからなる。F1の変異生成により、対立遺伝子Bにおいて有害な変異が起こるとき形質Aを産生する新しい対立遺伝子が明らかになるであろう。形質Aを有するこのような変異体F1植物はある頻度で現れるであろうが、一方で、F1集団の大部分は形質Bを示すであろう。1つの例では、(形質Bをコードする)遺伝子座の優性の対立遺伝子を保有する赤色の花をつける栽培品種の種子(または花粉、またはいずれかの他の組織)を変異化し、この材料を、(形質Aをコードする)当該遺伝子座の劣性の参照対立遺伝子を保有する突然変異を誘発されていない白色の花をつける栽培品種への交雑(sexual cross)のために使用することができる。得られたF1子孫では、形質Aを発現するように優性のB対立遺伝子において新しく誘導された、独立の変異を保有するいくつかの白色の個体を除いて、大多数の個体は赤色であろう。第2の例では、F1材料(例えば種子、またはいずれかの好適な組織)を直接変異化させて、突然変異を誘発された材料から成長する得られた個々の植物において、形質Aの発現について採点してもよい。例1および例2の優位点は、当該遺伝子座においてAおよびB対立遺伝子についてヘテロ接合のF1材料の使用によって、新しく生じる形質A対立遺伝子が、相対的な確からしさをもって、クローニングされる対象の遺伝子座に割り当てられるようになるということである。F1アプローチを用いなければ、例えば初代の突然変異を誘発された材料の自家受精によって誘導されるF2集団において、白色の花をつける変異体植物が、クローニングされる対象の遺伝子とは異なる遺伝子における変異の結果として生じるということが理論的には可能である。従って、これらの新しく生じる変異は非対立性である可能性があり、本発明に関しては混乱させるものとなるであろう。
【0080】
本発明に係る方法によって特定されることになる核酸は、その後単離し、(遺伝子を)クローニングし、または宿主細胞に導入し、または例えば、植物育種プログラムで使用することができる。
【0081】
要約すれば、本発明は、生物において発現され、かつその生物の特定の表現型(特徴の形質)に関連する核酸配列の特定、および任意の単離のための新しい戦略に関する。本発明の方法を用いると、当該技術分野で公知の方法とは対照的に、ゲノムに関して情報が入手できないかまたは限られた情報しか入手できない、例えば(作物)植物のような生物において、遺伝子を効率的に特定し、単離し、またはクローニングすることが可能になった。加えて、本発明では、例えばT−DNAまたはトランスポゾン系を使用することによるよりもはるかに高い変異頻度が生成され、これにより当該方法で必要とされる生物、例えば植物の量を減少させるので、点変異を誘導する化学物質を、変異化された集団を作成するための汎用性がある、広く適用できる方法として使用することを利用することが可能である。さらに、当該方法は注目する遺伝子における変化を直接検出するので、当該方法はゲノムにおけるマーカーの使用または存在に頼らない。
【実施例】
【0082】
ペチュニアにおける花の色素沈着についての遺伝子のDe novoクローニング
1つの花の色の遺伝子における変異体の生成
本発明に係る上記の方法を実証するために、本発明者らは、ペチュニアのこれまでに知られている花の色の遺伝子(RT)のde novo特定を意図した。赤紫色の花をつけるF1ハイブリッドのペチュニアを、近交系W5(rt::dTph3;StuurmanおよびKuhlemeier、Plant J.、2005年、第41巻、第6号、945−55頁)とM1(RT,Snowden KCおよびNapoli CA、「Psl: a novel Spm−like transposable element from Petunia hybrida」、Plant J.、1998年、第14巻、43−54頁)との間の交雑から生成し、これにより、UDPラムノース:アントシアニン−3−グルコシドラムノシルトランスフェラーゼをコードする遺伝子RTに劣性の対立遺伝子を保有する赤紫色の花をつけるヘテロ接合の遺伝子型を生じた。この実施例で使用した遺伝的バックグラウンドでは、RTのヌル変異体は、シアニジン−3−グルコシドの蓄積の結果として赤色の花を生成する(Kroonら、Plant J.、1994年、第5巻、第1号、69−80頁;Bruglieraら、Plant J.、1994年、第5巻、第1号、81−92頁)。メタンスルホン酸エチル(EMS)を用いたF1ハイブリッド種子の変異原性処理の後に、得られた植物のいくつかは、RTの野生型対立遺伝子において新規な変異を保有し、ヘテロ接合性の喪失および赤色の花冠の色の発現を生じるであろう。
【0083】
3600のF1植物の集団を、EMS処理した種子から生育させ、すべての個々の植物に対して花の色を視覚的に記録した。7つの赤色の花をつける変異体を観察した。赤色は劣性であるので、初代の変異化された集団におけるこの色の発現は、赤色の花をつける変異体が、RT遺伝子の野生型コピーにEMSによって誘導された点変異を保有したことを示す。これらの新しく単離した変異は、必然的にヘテロ接合である。
【0084】
新しく特定された変異体対立遺伝子から赤色の根底にある遺伝子をde novo特定するために、アントシアニン色素沈着が目に見えるようになる発生上の時点における花冠の舷部の完全かつノーマライズしたトランスクリプトームを、3つの独立の変異体においてシーケンシングした。これらの3つの変異体の各々の全RNAを、SMART cDNA合成キット(Clontech Company、米国、カリフォルニア州 94043、Mountain View、Terra Bella Avenue 1290)を使用してds−cDNAへと変換した。二本鎖の(ds−)cDNAを、Trimmerキット(Evrogen Company、ロシア、モスクワ、117997、16/10、Miklukho−Maklaya str)を使用してノーマライズした。各個々の変異体植物に由来するノーマライズしたcDNAを、GS−FLX Titaniumシーケンサー(454 Life Sciences)でのシーケンシングのために、別々にプロセシングした。プロセシングは、cDNAを約700ntへと断片化すること、および10bpの多重識別子(MID)を用いたタグ化を含んでいた。その後、すべての変異体に由来するすべてのプロセシングしたcDNA試料をプールし、2回のランのGS−FLX Titaniumシーケンシングでシーケンシングした。平均300ヌクレオチドの長さの合計1’977’422のリード(read)を得た。
【0085】
すべてのプールした配列データをトリミングしてアダプター配列およびMID配列を取り除き、その後、アセンブリプログラムNewbler(Roche 454 Software Release:2.3−PreRelease−9/14/2009)を使用し、デフォルト実行アセンブリ設定を使用して、重複のない組のコンティグへとアセンブリングした。結果の概略を表1Aに提示する。花冠で発現されたユニジーンの完全補体(full complement)を表す合計39306のユニークなコンティグ(平均サイズ 955ヌクレオチド、メジアンサイズ 1025ヌクレオチド)を得た。1塩基あたりのカバレッジは24×であり、これは、平均のヌクレオチドが24回シーケンシングされたことを意味する。この補体は、本発明に係る方法でこの後使用するための共通の参照トランスクリプトーム配列を表すので、この補体を、以降、「参照」と呼ぶ。同様に、コンティグを、以降、「ユニジーン(unigene)」と呼ぶ。
【0086】
本発明に係る方法の前提は、複数のユニジーンの中で、1つの特定のユニジーンが、トランスクリプトーム配列を生成するために使用する変異体のほとんどまたは各々において遺伝子的に非同義の一塩基多型(SNP)を保有するであろうということである。この実施例で提示する具体例では、赤色の花の色を生成することに関与する遺伝子は、3回、このcDNAプールを構成した各個々の変異体植物において1回変異されるべきである。ランダムなEMS変異の頻度は、典型的には、200キロベースあたり約1であるので、3つの異なるヌクレオチド変異がいずれかの単独のユニジーンで一貫して発生するであろうという可能性は、そのユニジーンが変異体植物を選択する際に基づいた表現型と因果関係がないならば、ゼロに近い。この変異基準に合致せず、かつ中の塩基変化も非同義的である(これは、その遺伝子のタンパク質産物においてアミノ酸変化を引き起こすということを意味する)特定の遺伝子は、赤色の花の色を引き起こす遺伝子である可能性が非常に高い。この後の記載では、塩基変化を、一ヌクレオチド変異(SNM)として示し、非同義の一ヌクレオチド変異をnSNMとして示す。同義の塩基変化、つまりアミノ酸変化を引き起こさない塩基変化は、それが、例えばイントロン−エクソンスプライス部位に存在する場合には、遺伝的に非中立でありうるときがあるということを注記することができる。しかしながら、対立遺伝子の少なくとも一対または好ましくは一群が比較のために使用されるので、そしてスプライシングエラーは大きく変化したcDNAを導くであろうから、本発明の方法は、そのような比較的稀なケースに対しても強力である、ということに留意されたい。
【0087】
本発明者らは、花冠の454配列データセットを、すべての個々の454配列のリードを上記の参照の花冠のトランスクリプトームに対してアラインメントすることにより、すべての個々の454の配列のリードにおけるSNMの発生について分析した。リードが参照と少なくとも98%同一であるときだけ、454のリードのアラインメントをSNM分析のために使用した。アラインメントは、当業者にとっては周知である種々のバイオインフォーマティクス方法によって行うことができる。SNMは、本実施例では、以下のように定義する:
(1)454のリードの完全セットにおいて少なくとも3回発生する(3×カバレッジ)
(2)3つの個々の変異体植物の1つだけにおいて発生する
(3)個々の変異体植物由来のすべてのリードの10%<N<90%に発生する。
これらの3つの基準は、SNMがシーケンシングエラーではなく(1)、独立であり(2)、かつヘテロ接合の条件で発生する(3)ということを保証する。当業者は、これらの基準は、プールの中の変異体植物の数、およびSNM組み入れ(calling)におけるタイプ1およびタイプ2のエラーのレベルに応じて、より厳格にするかまたは緩和することができるということを理解するであろう。加えて、この実施例ではG→AまたはC→Tの移行だけを可能なSNMとして採用した。なぜなら、これらは、使用した突然変異誘発物質(EMS)によって誘導される初代変異であるからである。また、当業者は、マッピングされたリードの98%同一性という閾値をより厳格にするかまたは緩和することができること、およびそのような閾値は、見出されるSNMの数に影響を及ぼす可能性があるということも理解するであろう。
【0088】
次の工程として、本発明者らは、当該プールの中の3つの変異体の各々について1つで、かつ上で明記したSNM組み入れ基準(1、2、3)によって特定された少なくとも3つのSNMが存在するユニジーンを検索した。シーケンシングカバレッジが、すべてのSNMがSNM組み入れについての3つの基準を満たすのに十分であれば、赤色の花をつける表現型と因果関係があるいずれかのユニジーンは、理論上、このルールに適合する必要がある。26のユニジーンが、各々異なる変異体植物に由来する少なくとも3つのSNMをコード領域に含有するということが判明した。これらのうちで、20個は、ちょうど3つのSNMを含有していたが、6つは4〜7つのSNMを含有していた。
【0089】
すべての上記のSNMの形式上の遺伝子パターンに適合したこれら26個のユニジーンを、その後、nSNMの発生について調べた。まず、DNAトリプレットをアミノ酸へと翻訳するための標準的な真核生物の遺伝コードに従って、最長の予測されるオープンリーディングフレーム(ORF)を見出すことにより、これら26個のユニジーンのDNA配列をアミノ酸配列へと変換した。次いで、相同タンパク質を検出し、これにより予測されたORFが正しい生物学的に意味のある翻訳リーディングフレーム(translational reading frame)の中にあることを確認するために、標準的なBLASTp手順を使用してこれらのORFをタンパク質配列のUniProtデータベースと比較した。次いで、これら26個の参照ユニジーンの各々のタンパク質配列を、SNMを含有する変異体植物の、上記タンパク質配列の対照物タンパク質配列と比較した。SNMを含むコドンでアミノ酸が発生していた場合には、そのSNMを、nSNMとして標識した。当然、nSNMだけが、コード領域内で表現型の変化を引き起こすことができる。それゆえ、各変異体植物が少なくとも1つのnSNMを含有しつつ少なくとも3つのnSNMを含有しないこれら26個のユニジーンはいずれも、赤色の花をつける表現型を引き起こす可能性のある候補としては、捨てた。この操作の後、9つのユニジーンが候補の一覧に残った(表1B)。
【0090】
この後、残りの9つのユニジーンのセットを、形式上の遺伝基準に関するランク付け手順にかけた。ちょうど3つの変異体植物をこの分析で使用したという事実によって導かれるとおり、完全なパターンはちょうど3であるので、3つを超えるnSNMの存在についてはペナルティーを与えた。nSNMが多いほど、ランクは低い。この操作の後、3つのユニジーンがランク1を共有した。9つのユニジーンおよびそれらのランク付けの全一覧を、UniProtデータベースへの最良のBLASTマッチを含めて、表1Cに提示する。赤色の花をつける表現型を引き起こすことが事前に知られており、かつUDPラムノース:アントシアニン−3−グルコシド ラムノシルトランスフェラーゼをコードするRT遺伝子がランク1を有することが分かる。
【0091】
これらのデータから、本発明に係る方法は、39306のユニジーンのバックグラウンドの範囲内で小さい組の候補の中からの、変異体表現型を引き起こす単独の遺伝子の特定を可能にすると結論される。当業者は、本発明に係る方法はペチュニア以外のいずれの種においても実施することができるということを理解するであろう。当業者は、当該方法は、1プールあたりの異なる数の変異体個体、参照トランスクリプトームへのリードのマッピングの際の異なる同一性%、1SNMあたりのカバレッジの異なる厳格さ、または検索に適用される他の測定可能な設定を用いて実施することができるということも理解するであろう。候補をランク付けするためのさらなる客観的な基準を単独でまたは組み合わせて使用することができることも明らかであり、このような客観的な基準としては、
・生のシーケンシングデータから得られる、可能性のあるSNMの塩基組み入れクオリティスコア、
・プールの組成および使用した変異体植物のヘテロ接合のまたはホモ接合の状態から得られる形式上の遺伝予測に従う、プールの中の個々の対立遺伝子にわたるSNMの完全分布に対するマッチ度、
・野生型アミノ酸と比較した、nSNMに起因するアミノ酸置換の化学的類似性スコア
が挙げられる。
【0092】
物質および方法
1)GS−FLX titaniumシーケンシングのためのcDNAの調製
分析に好適なcDNA試料を調製するために、以下の工程に従った。
I.製造業者の取扱説明書に従ってQiagen RNeasy Plant Miniキット(Qiagen Company、カリフォルニア州 91355、Valencia、Turnberry Lane 27220)を使用する、色素沈着の開始時の各変異体植物の花弁組織の全RNA単離
II.製造業者の取扱説明書に従った、SMART cDNA synthesis for Library Constructionプロトコル(Clontech Company、米国、カリフォルニア州 94043、Mountain View、Terra Bella Avenue 1290)による、SMART二本鎖(ds−)cDNA合成
III. 製造業者の取扱説明書に従ってTRIMMER cDNA Normalizationキット(Evrogen Company、ロシア、モスクワ、117997、16/10、Miklukho−Maklaya str)を使用するcDNAノーマライゼーション。
IV.以下の反応設定:
【表1】

を使用する、BAL31 エキソヌクレアーゼ(New England Biolabs、米国、マサチューセッツ州 01938−2723、Ipswich、County Road 240)によるds−cDNAからのポリA尾部の除去。
BAL31エキソヌクレアーゼによる反応を、アガロースゲル電気泳動および50+50=100塩基対の平均分子サイズシフトを観察することから判断して、cDNAの5’および3’末端から約50ヌクレオチドが取り除かれるまで、製造業者の取扱説明書に従って進行させた。次いで、処理したcDNA試料を、製造業者の取扱説明書(Qiagen Company、カリフォルニア州 91355、Valencia、Turnberry Lane 27220)に従ってQiagen PCR精製キットを使用して精製した。
V.BAL31処理したcDNA試料を15の小分け試料へと分割し、各小分け試料を、以下の一覧からの1つの制限酵素(それらのDNA認識配列をカッコ内に示す)を用いた消化によって断片化した:AccI(GTMKAC)、AluI(AGCT)、ApoI(RAATTY)、AvaI(CYCGRG)、AvaII(GGWCC)、BsaAI(YACGTR)、BsiEI(CGRYCG)、BstYI(RGATCY)、HaeII(RGCGCY)、Hpy99I(CGWCG)、MseI(TTAA)、NspI(RCATGY)、RsaI(GTAC)、SfcI(CTRYAG)、StyI(CGWWGG)。これらの制限酵素は、それらが、コンティグ構築を可能にするためのcDNAの良好なカバレッジおよび断片間の良好なオーバーラップの可能性を確保しつつ、GS−FLX Titaniumシーケンシングに好適なサイズ範囲の断片を生成することができることから選んだ。これらの反応を完結するまで進行させ、その後、酵素製造業者の取扱説明書に従って不活化した。すべての酵素をNew England Biolabs(米国、マサチューセッツ州 01938−2723、Ipswich、County Road 240)から得た。完全消化の後、1つの変異体植物あたりすべての15種の制限反応物をプールし、製造業者の取扱説明書(Qiagen Company、カリフォルニア州 91355、Valencia、Turnberry Lane 27220)に従ってQiagen PCR精製キットを用いて精製した。
VI 3〜5μgの、各変異体植物から個々に得た精製したcDNAを使用して、製造業者の取扱説明書に従ってGS−FLX Titanium General Library Preparation Kit(Roche Diagnostics Corporation、Roche Applied Science、米国、インディアナ州 46250−0414、インディアナポリス、Hague Road 9115、私書箱50414)を使用して、シーケンシングのためのGS−FLX Titaniumライブラリーを生成した。これらの個々のライブラリーを、異なる多重識別子(MID)を用いて調製した。次いで、本研究で使用した3つの変異体植物のMIDで区別可能なライブラリーをプールし、2回のランのGS−FLX Titaniumを使用してシーケンシングした。
【0093】
バイオインフォーマティクス解析
生のGS−FLX Titaniumリードの事前処理
GS−FLX Titanium General Library Preparation Kit(Roche Diagnostics Corporation、Roche Applied Science、米国、インディアナ州 46250−0414、インディアナポリス、Hague Road 9115、私書箱50414)で与えたMIDおよびアダプター配列を取り除くために、リードを事前処理した。
【0094】
参照トランスクリプトーム配列のアセンブリ
事前処理した配列をインプットとして用い、454のデフォルト実行アセンブリ設定を使用して、454 Life Sciences(454 Life Sciences、米国、コネティカット州 06405、Branford、Commercial Street 15)のNewblerアセンブリソフトウェアを用いてアセンブリを行った。
【0095】
解析
事前処理したリードを、98%の最小同一性を使用して、アセンブリングした参照コンティグ上にマッピングした。ユニジーンの中の異なる位置に少なくとも3つのSNMを有することにより、および異なる変異体植物個体との関連性により、候補のユニジーンを選択した。3×の最小カバレッジからSNMを組み入れた。このSNMの特性を、G→AまたはC→Tであるように強制した。1つのSNM位置あたり、唯一の、かつヘテロ接合の、変異体植物を許容した。同じヌクレオチドが個々の植物あたり90%以上のケースで見られた場合に、ヌクレオチド位置をホモ接合と考えた。

【特許請求の範囲】
【請求項1】
生物の特徴に関連する発現された核酸配列の特定、および任意の単離のための方法であって、
a)前記特徴の形質Aを有する前記生物の少なくとも2つのメンバーを準備する工程であって、形質Aを有する前記メンバーは、形質Bを有する前記生物の同質遺伝子的なメンバー(複数可)に由来し、好ましくは独立に由来し、かつ形質Aおよび形質Bは異なる工程と、
b)形質Aを有する工程a)の前記メンバーの各々からcDNAを得て、形質Aを有する前記メンバーから得られた個々のcDNAの、少なくとも一部分、好ましくは各々のヌクレオチド配列を決定する工程と、
c)形質Aを有する他のメンバーの対応するcDNAとの比較によって、形質Aを有するメンバーの各々の個々のcDNAの中の一塩基多型位置を決定する工程と、
d)形質Aを有する前記メンバーの少なくとも2つ、好ましくは形質Aを有する前記メンバーのすべて、が少なくとも1つの一塩基多型を含有する個々のcDNAを特定する工程であって、好ましくはこれらの一塩基多型は、前記形質Aを有する少なくとも2つの、好ましくはすべてのメンバーについてのcDNAの中で異なる位置にある工程と、
e)任意に、工程d)で特定されたcDNAの各々について、それが、生物の特徴に関連することを検証する工程と
を含むことを特徴とする方法。
【請求項2】
形質Aを有する前記生物の前記メンバーは前記形質Bを有する前記生物のメンバーの変異生成によって得られたものであり、形質Bを有する前記メンバーは変異生成処理の前には同質遺伝子的であった、請求項1に記載の方法。
【請求項3】
前記変異生成の方法は点変異を誘導する、請求項2に記載の方法。
【請求項4】
変異生成は、非生物学的変異誘発因子の使用によって実施される、請求項2または請求項3に記載の方法。
【請求項5】
前記生物は、植物、好ましくはトマト、コショウ、ナス、レタス、ニンジン、タマネギ、ニラ、チコリー、ダイコン、パセリ、ホウレンソウ、メロン、キュウリからなる群から選択される作物植物である、請求項1から請求項4のいずれか1項に記載の方法。
【請求項6】
前記生物が植物であり、かつ工程(a)に先立って、劣性の形質Aをコードする対立遺伝子および優性の形質Bをコードする第2の対立遺伝子についてヘテロ接合であるF1ハイブリッド集団が作成され、かつ前記F1ハイブリッド集団は突然変異を誘発され、かつ前記変異生成の後に前記F1集団から、形質Aを有するメンバーが選択される、請求項1から請求項5のいずれか1項に記載の方法。

【図1】
image rotate

【図2】
image rotate


【公表番号】特表2013−514080(P2013−514080A)
【公表日】平成25年4月25日(2013.4.25)
【国際特許分類】
【出願番号】特願2012−544420(P2012−544420)
【出願日】平成22年12月17日(2010.12.17)
【国際出願番号】PCT/NL2010/050860
【国際公開番号】WO2011/074964
【国際公開日】平成23年6月23日(2011.6.23)
【出願人】(509351340)
【Fターム(参考)】