説明

高処理量配列決定技術を使用する転写産物の特徴づけのための改良された戦略

cDNA内でヌクレオチド配列、cDNA試料中のヌクレオチド配列の頻度を決定するための方法、並びに複雑性の低下及び(高処理量)配列決定を使用する、遺伝子の配列情報を必要とせずに、前記遺伝子の相対的な転写産物レベルを(偏向せずに)決定するための方法が記載されている。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、分子生物学及び遺伝学の分野に関する。本発明は、高処理量配列決定技術の使用に基づいて転写産物の配列を決定するための改良された戦略に関する。本発明はさらに、偏向されていない転写産物の特徴づけのための改良された戦略に関する。
【背景技術】
【0002】
転写産物の特徴づけは、現代のバイオテクノロジー研究において使用される基礎技術の1つである。転写産物の特徴づけの主要な適用領域は、複雑な形質にかかわる遺伝子の発見である。これには、医薬の開発のための標的の同定(標的発見)、生体分子の合成を調節する生化学的経路(発酵産業)の解明、植物及び動物の育種のための複雑な形質の解析(遺伝子発見)及びその他の多くの目的のために、(ヒトの)疾病に関与する遺伝子を発見すること等、生物学的現象の広範な範囲が含まれる。
【0003】
第二の適用領域は、逆の経路に従う。すなわち、複雑な表現型を予測するために、遺伝子(の選択されたサブセット)の転写産物特性の定型的な診断決定のために転写産物の特徴づけを使用する。本カテゴリーにおける例は、ヒト乳癌(Van de Vijver et al.,2002,N.Engl.J.Med.,vol.347,25:1999−2009;van’t Veer et al.,2002,Breast Cancer Res.,vol.5(1):57−8;www.agendia.com)及び乳頭状腎細胞癌(Yang et al.,2005)の臨床的な予後の分子上の分類、診断及び予測である。分離された集団において回収された転写産物特徴づけデータに基づいて、関連遺伝子を同定するためのアプローチが、Schadt及び共同研究者(2005,Sci.STKE,vol.296:pe40)によって記載されている。簡潔には、特徴づけは、ライフサイエンス研究において極めて重要である。
【0004】
転写産物の特徴づけのための技術は、過去10年にわたって急速に進化してきた。1990年代の初期(PCRが広範に利用可能になった直後)まで、転写産物の特徴づけは、ノザンブロット分析又はRNAse保護アッセイによって実施されていた。これらの技術は、かなり特異的であり、且つ感受性が高い(特にRNAse保護アッセイ)が、これらの技術の限界は、唯一の又は数個の遺伝子を同時に分析できる(低処理量)が、手法が退屈で、時間がかかることである。さらに、両方法は、健康被害をもたらす放射性標識技術の使用を必要とする。
【0005】
1992年にディファレンシャルディスプレイ(DD)技術が登場すると(Liang & Pardee,1992,Science,vol.257(5072):967−71)、DDに関して多くの改変及び改良がなされ(例えば、Ordered Differential Display,Matz et al.,1997,Nucl.Acids.Res.,vol.25(12):2541−2)、多重転写産物の特徴づけを目標として、第一歩が踏み出された。DDの特徴は、無作為に設計されたPCRプライマーを、分析されるべきcDNA試料に低い厳密度で徐冷することによって、遺伝子の無作為なサブセットが標的とされ、使用されるPCRプライマーに対して高い相同性を有する配列を含有する発現された転写産物を優先的に増幅させることである。次に、増幅産物が配列ゲル上で分離され、転写された遺伝子のサブセットを表す指紋パターンを生じる。DD法は、ノザンブロット及びRNAse保護アッセイと比較して処理量は高いが、DD法の制約は、これらの技術の再現性/頑強性がかなり低いことである。これは、使用されるランダムPCRプライマーの非特異的な徐冷が1つの原因である。その結果、異なるランダムプライマーを用いて生成された指紋パターンは、転写産物の異なる(相補的な)サブセットを系統的に標的化しない。さらなる欠点は、DD法が、スラブゲルの調製又は毛細管ゲル電気泳動による検出を必要とすることである。さらに別の制約は、指紋中の観察されたバンドの遺伝子源が不明であり、遺伝資源を明らかにするために、バンドの切り出し、溶出、再増幅及びDNA配列決定を必要とすることである。後者の制約は、指紋をベースとした他の転写産物特徴づけ法と共通である。最後に、ゲル上のレーン/毛細管トレースあたり50から100個の断片を検出する本技術は、中程度に多重である。
【0006】
cDNA−AFLP法(Bachem et al.,1996,Plant J.,vol.9(5):745−53)は、DD技術の主要な制約の2つ、すなわち再現性/頑強性及び異なるPCRプライマーを用いて生成された指紋中に得られる情報の相補性に対処する。選択的AFLP(登録商標)(Keygene N.V.,the Netherlands;例えば欧州特許第0,534,858号及びVos P.,et al.(1995).AFLP:a new technique for DNA fingerprinting.Nucleic Acids Research,vol.23,No.21,p.4407−4414参照)プライマーを用いた、アダプターが連結された制限断片の増幅は、厳密度の高い条件下で起こり再現性が高い指紋パターンが得られるので、cDNA−AFLP法の頑強性及び再現性は非常に高い。さらに、異なる選択的ヌクレオチドを有する選択的AFLPプライマーを使用することによって、相補的情報を含有する指紋が確実に得られる。それゆえ、cDNA−AFLP技術によって、トランスクリプトームのサブセットのサンプリングが再現可能となる。(cDNA−)AFLP(及びDD)の別の利点は、配列情報が事前に必要ではなく、それゆえ生物の広範囲に本技術を適用できることである。cDNA−AFLPの制約は、レーン/トレースあたりの多重レベルが中程度であること、及びバンドの遺伝子源が直接には不明であるという事実である(DDも参照)。
【0007】
上述の転写産物特徴付け方法の多重レベルにおける制約は、SAGE(遺伝子発現の連続分析;Velculescu et al.,1995,Science,vol.270(5235):484−7)及び大量並行サイン配列決定(MPSS(Massively Parallel Signature Sequencing):Brenner et al.,2000,Nature Biotechnology,vol.18(6):630−4;Meyers et al.,2004,Nature Biotechnology,vol.22(8):1006−11)の両者によって対処されてきた。cDNA−AFLPと同様、両方法は、試料cDNAを切り出した後にアダプターを連結するために、IIS型制限酵素を使用する。
【0008】
SAGEでは、アダプターが連結された断片は、その後、連鎖状になり、サンガー配列決定法によって配列決定される。サンガー配列トレースから、14から20bpの短い配列タグが抽出され、転写された遺伝子に関する定量的情報を提供する(「デジタルノザン」)。試料間でタグの頻度を比較することによって、予め配列情報を必要とせずに、研究される試料間での相対的な発現レベルに関する情報が得られる。これにより異なる試料中での相対的な転写産物量が(正確に)決定されるが、得られた配列タグが短いことを考えると、研究される生物の巨大なEST集合物又は全ゲノム配列が利用可能でなく、及び、タグ配列がBLAST(Basic Local Alignment Search Tool)分析等の相同性研究へ供することができなければ、タグがどの遺伝子に由来するかを評価することは困難である。それゆえ、SAGEは、多重性が高く、再現性があり、頑強であるが、その価値は、配列決定されたゲノムを有する生物に限定される。別の制約は、前記方法が、大規模なサンガー配列決定に要する経費のため、多量の試料を処理することにあまり適していない(低処理量)ということである。
【0009】
SAGEとは対照的に、MPSSは、固相配列決定反応に基づいている。しかしながら、MPSSには、本質的に、SAGEと同一の制約がある。すなわち、非常に短い配列タグ(約20bp)が得られ、そのため、限定された(ゲノム)配列が利用することができる生物中の興味深い配列タグをさらに追跡する(遺伝子同定/アッセイ転換)ことが大きく妨げられる。要約すると、SAGE及びMPSSは、使用するために、配列情報を予め必要としない、頑強で、高度に多重化された転写産物特徴づけ技術であり、これらの価値は、全ゲノム配列が決定されている生物又は配列タグを遺伝子に接続するために、巨大なEST集合物を利用できる生物に事実上限定される。両方法は、低処理量であり、技術的に複雑である。
【0010】
概念的な長所は、両方法が、多くの遺伝子の(相対的な)転写レベルの非偏向概算値を同時に提供する正確な配列決定と組み合わせた(「デジタルノザン」を生じる、)転写産物ライブラリの統計的なサンプリングに依存すること、及び転写産物の特徴づけが、固体支持体上でのプローブとの交差ハイブリッド形成に弱点がないという事実である。
【0011】
1995年に、転写産物特徴づけの分野にパラダイム変化を与えた遺伝子発現マイクロアレイが導入された(Schena et al.,1995,Science,vol.270(5235):467−70)。初期には、プローブとしてEST由来のPCR産物を含有する、いわゆる「点状の」マイクロアレイが使用されたが、その後、頑強性が高く、拡大縮小が柔軟であるために、焦点は、オリゴヌクレオチドDNAチップに移った(Pease et al.,1994,Proc.Nat.Ac.Sci.USA,vol.91(11):5022−6)。現在、転写産物の特徴づけの市場は、多様な供給元(例えば、Affymetrix、Nimblegen、Agilent等)から得られるオリゴヌクレオチドDNAチップが支配的である。DNAチップの威力は、その表面に付着/合成できるDNA配列数が多いことにあり、これによって、転写産物の特徴づけを大量に並行処理することが可能となり、例えば、既知の全てのヒト遺伝子(=高い遺伝子多重化レベル)に対して転写産物の特徴づけを実施することができる。さらに、チップの製造過程及びハイブリッド形成は、自動化及び調節が可能であり、これにより、それぞれ高処理量及び頑強性が可能となる。その結果、DNAチップは、2005年において、転写産物の特徴づけに関する最先端技術である。しかしながら、多重化能、処理量及び頑強性は、DNAチップの非常に重要な利点であるが、チップを基礎とする転写産物特徴づけに関する2つの重要な制約は、チップを構築できるようにするために配列情報が必要とされること、及び、複製された遺伝子ファミリーのメンバー由来のものなど、相同性の高い配列間の交差ハイブリッド形成が、結果の正確性に影響を及ぼし得ることである。ハイブリッド形成をベースとした検出の本質的な特徴であるあるので、後者は、モニターし/排除することが非常に困難である。これらの事実により、(異なる製造技術及び応用プロトコールを反映する可能性を秘めた)異なる供給元から得られたDNAチップを使用して得られた結果の比較は、実施が困難である(Yauk et al.,2005,Nucleic Acids Research,vol.32(15):e124)。1つのプラットフォーム内で、リアルタイムPCRアッセイ(例えばTaqMan、Invader)等の独立した方法による結果の検証が必要とされる。従って、同一プラットフォームが全ての試料に関して使用される場合、DNAチップは、デジタルノザンの概念に適合するデータを提供しないが、相対的な発現レベルを決定するのに有用である。
【発明の開示】
【発明が解決しようとする課題】
【0012】
理想的には、転写産物の特徴づけ技術は、高度に多重化されており、すなわち、多くの遺伝子が同時に研究され、高処理量であり、非常に頑強で、再現性があり、非常に正確で(交差ハイブリッド形成という弱点がない。)、あらかじめ配列情報を必要とせずに適用可能であり得る。以下に記載される本発明は、このような基準に適合する方法を提供する。
【課題を解決するための手段】
【0013】
発明の要旨
本発明者らは、異なる戦略を使用して、この問題を解決できること、及び転写産物の特徴づけにおいて、高処理量配列決定技術を効率的に使用できることをここに発見した。
【0014】
本発明は、好ましくは、トランスクリプトーム(transcriptome)を再現性のあるサブセットに分割する技術を使用することを含む。これらのサブセットは、配列決定され、個々の転写産物に相当する連結断片へと構築される。異なる再現可能なサブセットが提供されるようにこの段階を反復することによって、連結断片の異なるセットが得られる。これらの異なる連結断片は、転写産物のドラフト配列を構築するために使用される。本発明は、配列に関する知識を一切必要とせず、いかなる複雑性の転写産物に対しても適用できる。本発明は、例えば、同一の生物又は別異の生物の異なる組織に由来する転写産物の組み合わせにも適用することができる。本発明は、目的のあらゆる転写産物へのアクセスを、より迅速で、信頼性が高く、且つより高速なものとし、それにより、転写産物の分析を促進する。
【0015】
本発明は、これらの遺伝子の配列情報を必要とせずに、遺伝子の相対的な転写産物レベルを(偏向せずに)決定することにも関する。この目的のために、cDNA試料内での配列の頻度は、前記cDNA試料の複雑性が低下したライブラリを配列決定し、及び配列がライブラリ中で同定される回数を決定するために配列を整列することによって決定される。これは、第二のcDNA試料に対して反復され得、2つのcDNA試料の頻度は、必要であれば相対的な転写レベルを決定するために標準化され、比較され得る。
【0016】
定義
以下の記載及び例において、多くの用語が使用される。このような用語に付与されるべき範囲を含め、明細書及び特許請求の範囲を明確且つ一貫して理解するために、以下の定義が提供される。本明細書に別段の定義がなければ、使用される全ての技術用語及び科学用語は、本発明が属する分野の当業者によって一般的に理解されるのと同一の意味を有する。全ての公報、特許出願、特許及び他の参考文献の開示は、参照により、その全ての内容が全体として本明細書に組み込まれる。
【0017】
核酸:本発明に係る核酸には、ピリミジン及びプリン塩基、好ましくは、シトシン、チミン及びウラシル、並びに、それぞれアデニン及びグアニンの全てのポリマー又はオリゴマーが含まれ得る(Albert L.Lehninger,Principles of Biochemistry,at 793−800(Worth Pub.1982)(全ての目的のために、その全ての内容が、参照により、本明細書に組み込まれる))。本発明は、全てのデオキシリボヌクレオチド、リボヌクレオチド又はペプチド核酸成分、及びこれらの塩基のメチル化、ヒドロキシメチル化又はグリコシル化された形態等のあらゆる化学的変種等を想定する。ポリマー又はオリゴマーの組成は、不均一又は均一であり得、天然源から単離され得、又は人工的に若しくは合成的に作製され得る。さらに、核酸は、DNA若しくはRNA又はこれらの混合物であり得、ホモ二本鎖、ヘテロ二本鎖及びハイブリッド状態を含む一本鎖又は二本鎖の形態で、永続的に又は一過的に存在し得る。
【0018】
複雑性の低下:複雑性の低下という用語は、試料のサブセットの生成によって、ゲノムDNA等の核酸試料の複雑性を低下させる方法を表すために使用される。このサブセットは、完全な(すなわち、複雑な)試料の代表であり得、好ましくは、再現性のあるサブセットである。本文脈において、再現性があるとは、同一方法を使用して、同一試料の複雑性を低下させる場合に、同一のサブセット又は少なくとも同程度のサブセットが得られることを意味する。複雑性の低下のために使用される方法は、本分野で公知の複雑性を低下させるための全ての方法であり得る。複雑性を低下させるための方法の非限定的な例には、AFLP(登録商標)(Keygene N.V.,the Netherlands;例えば欧州特許第0,534,858号参照)、Dongによって記載されている方法(例えば、国際公開第03/012118号、国際公開第00/24939号参照)、指標付き連結(Unrau,et al.,1994,Gene,145:163−169)、米国特許出願第2005/260628号、国際公開第03/010328号、米国特許出願第2004/10153号に開示されているもの、ゲノム分割(例えば、国際公開第2004/022758号参照)、遺伝子発現の連続分析(SAGE;例えば、Velculescu et al.,1995、上述参照、及びMatsumura et al.,1999,The Plant Journal,vol.20(6):719−726)及びSAGEの変法(例えば、Powell,1998,Nucleic Acids Research,vol.26(14):3445−3446;及びKenzelmann and Muhlemann,1999,Nucleic Acids Research,vol.27(3):917−918参照)、微量SAGE(例えば、Datson et al.,1999,Nucleic Acids Research,vol.27(5):1300−1307参照)、大量並行サイン配列決定(MPSS;例えば、Brenner et al.,2000,Nature Biotechnology,vol.18:630−634及びBrenner et al.,2000,PNAS,vol.97(4):1665−1670参照)、自己減算型cDNAライブラリ(Laveder et al.,2002,Nucleic Acids Research,vol.30(9):e38)、リアルタイム多重連結依存的プローブ増幅(RT−MLPA;例えば、Eldering et al.,2003,vol.31(23):e153参照)、高適用範囲発現特徴づけ(HiCEP;例えば、Fukumura et al.,2003,Nucleic Acids Research,vol.31(16):e94)、Roth et al.,Nature Biotechnology,vol.22(4):418−426に開示されている普遍的マイクロアレイシステム、トランスクリプトーム減算法(例えば、Li et al.,Nucleic Acids Research,vol.33(16):e136参照)、及び断片ディスプレイ(例えば、Metsis et al.,2004,Nucleic Acids Research,vol.32(16):e127参照)が含まれる。本発明において使用される複雑性低下法は、再現性があることで共通している。同一の試料の複雑性を同じ様式で低下させる場合に、より無作為な複雑性の低下(顕微解剖又は選択された組織中で転写されたゲノムの一部に相当するmRNA(cDNA)の使用など)とは異なり、試料の同一のサブセットが得られるという意味において再現性があり、その再現性に関しては、組織の選択、単離時間などに依存する。
【0019】
タグ付け:タグ付けという用語は、核酸試料を第二の又はさらなる核酸試料と識別できるようにするために、核酸試料へタグを付加することを指す。タグ付けは、例えば、複雑性を低下させる間に配列同定子を添加することによって、又は本分野で公知のその他の手段によって、実施され得る。このような配列同定子は、様々な長さの、但し、特異的な核酸試料を同定するために一意的に使用される確定された長さの特有の塩基配列とすることができる。その典型的な例は、例えば、ZIP配列である。このようなタグを使用して、さらなる加工を行って、試料の起源を決定することができる。異なる核酸試料に由来する加工された生成物を組み合わせるには、異なる核酸試料は、異なるタグを使用して同定すべきである。
【0020】
タグ付きライブラリ:タグ付きライブラリという用語は、タグ付き核酸のライブラリを指す。
【0021】
配列決定: 配列決定という用語は、核酸試料、例えば、DNA又はRNA中でヌクレオチド(塩基配列)の順序を決定することを指す。
【0022】
整列させること及び整列化:「整列させること」及び「整列化」という用語は、同一又は類似のヌクレオチドの短い又は長い伸長の存在に基づいて、2つ又はそれ以上のヌクレオチド配列を比較することを意味する。以下にさらに説明されているように、ヌクレオチド配列を整列化するための幾つかの方法が、本分野で公知である。「構築すること」又は「クラスター形成すること」という用語が、同義語として使用される場合があるが、これらの用語は、技術的には同一ではない。整列化は、最大の相同性を比較することに基づいて行われるのに対して、構築とは、重複に基づいて連結断片を調製することを意味する。
【0023】
高処理量スクリーニング:しばしばHTSと略記される高処理量スクリーニングは、生物学及び化学の分野と特に関連する科学実験のための方法である。現代のロボット工学と他の特殊化された研究室用ハードウェアとの組み合わせを通じて、研究者は、高処理量スクリーニングによって、多量の試料を同時に効果的にスクリーニングする仔おtが可能となる。
【0024】
高処理量配列決定:高処理量技術を使用してヌクレオチド配列の配列を決定すること。
【0025】
制限エンドヌクレアーゼ:制限エンドヌクレアーゼ又は制限酵素は、二本鎖DNA分子中の特異的なヌクレオチド配列(標的部位)を認識する酵素であり、あらゆる標的部位において、DNA分子の両鎖を切断する。
【0026】
制限断片:制限エンドヌクレアーゼによる消化によって生成されるDNA分子は、制限断片と呼ばれる。あらゆる所与のゲノム(又は核酸(その由来に関わらない。))は、特定の制限エンドヌクレアーゼによって制限断片の分離したセットへと消化される。制限エンドヌクレアーゼの切断によって生じるDNA断片は、様々な技術においてさらに使用することが可能であり、例えば、ゲル電気泳動によって検出することができる。
【0027】
ゲル電気泳動:制限断片を検出するために、大きさに基づいて二本鎖DNA分子を分画するための分析方法が必要とされ得る。このような分画を達成するために最も一般的に使用される技術は、(毛細管)ゲル電気泳動である。DNA断片がこのようなゲル中で移動する速度は、DNA断片の分子量に依存し、従って、移動する距離は、断片長が増大するにつれて減少する。ゲル電気泳動によって分画されるDNA断片は、パターン中に含まれる断片の数が十分小さければ、染色手法、例えば銀染色又は臭化エチジウムを用いた染色によって直接可視化することができる。あるいは、DNA断片のさらなる処理によって、フルオロフォア又は放射性標識等の、検出可能な標識を断片中に取り込ませ得る。
【0028】
連結:二本鎖DNA分子が互いに共有結合される、リガーゼ酵素によって触媒される酵素反応は、連結と呼ばれる。一般に、両DNA鎖は、互いに共有結合しているが、鎖の末端の1つの化学的若しくは酵素的修飾を通じて2つの鎖のうちの1つが連結しないようにすることも可能である。その場合、共有結合は、2つのDNA鎖のうちの1つのみに生じる。
【0029】
合成オリゴヌクレオチド:化学的に合成できる好ましくは約10から約50までの塩基を有する一本鎖DNA分子は、合成オリゴヌクレオチドと呼ばれる。一般に、これらの合成DNA分子は、固有のヌクレオチド配列又は望ましいヌクレオチド配列を有するように設計されるが、関連配列を有し、ヌクレオチド配列内の特定の位置で異なるヌクレオチド組成を有する分子のファミリーを合成することが可能である。合成オリゴヌクレオチドという用語は、設計された又は望ましいヌクレオチド配列を有するDNA分子を指すために使用される。
【0030】
アダプター:塩基対の限定された数、例えば、約10から約30塩基対の長さの短い二本鎖DNA分子であり、制限断片の末端に連結できるように設計されている。アダプターは、一般的に、互いに部分的に相補的であるヌクレオチド配列を有する2つの合成オリゴヌクレオチドからなる。2つの合成オリゴヌクレオチドを、溶液中で、適切な条件下で混合すると、互いに徐冷して二本鎖構造を形成する。徐冷後に、アダプター分子の一方の末端は、制限断片の末端に対して適合的であり、一方の末端に連結できるように設計することが可能であり、アダプターの他方の末端は、連結できないように設計することが可能であるが、必ずしも、このようにする必要はない(二重連結アダプター)。
【0031】
アダプターが連結された制限断片:連結の結果として、アダプターによってキャップ形成された制限断片。
【0032】
プライマー:一般に、プライマーという用語は、DNAの合成を開始させることができるDNA鎖を指す。DNAポリメラーゼは、プライマーなしに、DNAを新規に合成することはできない。DNAポリメラーゼは、構築されるべきヌクレオチドの順序にを指定するために、相補鎖がテンプレートとして使用される反応において、既存のDNA鎖を伸長することができるにすぎない。本発明者らは、ポリメラーゼ連鎖反応(PCR)において使用される合成オリゴヌクレオチド分子をプライマーと称する。
【0033】
DNA増幅:DNA増幅という用語は、典型的には、PCRを使用して、二本鎖DNA分子をインビトロで合成することを指すために使用される。他の増幅方法が存在すること、及び、本旨から逸脱せずに、本発明において、他の増幅方法を使用し得ることが注目される。
【0034】
発明の詳細な説明
本発明は、
(a)cDNAを準備する段階;
(b)前記cDNAの少なくとも1つに対して複雑性の低下を実施してcDNA断片を含むcDNAの第一のライブラリを得る段階;
(c)高処理量配列決定によって、第一のライブラリの前記cDNA断片のヌクレオチド配列の少なくとも一部を決定する段階;
(d)段階d)の第一のライブラリの前記cDNA断片の前記ヌクレオチド配列を整列させて第一のライブラリの連結断片を生成する段階;及び
(e)前記cDNAの前記ヌクレオチド配列を決定する段階
を含む、cDNAのヌクレオチド配列を決定するための方法を提供する。
【0035】
これまで、配列決定技術の分野において、転写産物を示すための、cDNAの高処理量配列決定と組み合わせた前記複雑性の低下の使用は、開示されておらず、示唆されてもいない。
【0036】
方法の段階(a)において、cDNAが準備される。cDNAの調製方法は、本分野で周知である。調製のための方法が、以下に示されている。しかしながら、cDNAの調製のためのあらゆる方法が使用され得る。
【0037】
cDNA(相補的DNA)は、通常、逆転写酵素を使用してmRNAから調製される。この場合、逆転写酵素は、RNAに対して塩基対形成され、遊離の3’−Oh基を含有するプライマーと共に準備されると、RNAテンプレートに相補的なDNA鎖を合成する。このようなプライマーは、例えば、多くの真核生物mRNA分子の3’末端に存在するポリA配列と対形成するオリゴdTプライマーであり得る。次に、4つのデオキシリボヌクレオシド三リン酸塩の存在下で、cDNA鎖の残りを合成できる。得られたRNA−DNAハイブリッドのRNA鎖は、その後、例えば、pHを上昇させることによって加水分解される。RNAとは異なり、DNAは、アルカリ加水分解耐性であり、そのため、DNA鎖は未変化のままである。これに代わるプライマーは、ランダムプライマーであり得る。cDNAの無作為な合成開始は、逆転写酵素がmRNAテンプレートを完全に転写することができない場合に、又は二次構造が存在する場合に、利点があり得る。さらに、これに代わるプライマーは、配列特異的プライマーであり得る。
【0038】
生物体の組織の細胞又は生物自体からRNAを単離する方法は、分子生物学の分野で周知である。さらに、cDNA合成のための多くの市販のキットが、例えば、ABgene、Ambion、Applied Biosystems、BioChain、Bio−Rad、Clontech、GE Healthcare、GeneChoice、Invitrogen、Novagen、Qiagen、Roche Applied Science、Stratagene等から購入できる。このような方法は、例えば、Sambrook et al.(Sambrook,J.,Fritsch,E.F.,and Maniatis,T.,in Molecular Cloning:A Laboratory Manual.Cold Spring Harbor Laboratory Press,NY,Vol.1,2,3(1989))に記載されている。RNAは、細胞培養物、組織等の幾つもの源から単離され得る。
【0039】
本発明に係る方法の段階(b)において、複雑性の低下は、cDNA断片を含むcDNAの第一のライブラリを得るために、cDNAの少なくとも一部に対して実施される。複雑性の低下のための多くの方法は、定義の節で示されるように、本分野において公知である。
【0040】
本発明の一実施形態において、核酸試料の複雑性を低下させる段階は、制限断片中で核酸試料を酵素で切断すること、制限断片を分離すること及び制限断片の特定のプールを選択することを含む。場合により、選択された断片は次に、PCRプライマーテンプレート/結合配列を含有するアダプター配列に連結される。
【0041】
複雑性の低下に関する一実施形態において、IIs型エンドヌクレアーゼは、核酸試料を消化するために使用され、制限断片は、アダプター配列へ選択的に連結される。アダプター配列は、連結されるべき突出中に多様なヌクレオチドを含有することができ、突出中のヌクレオチドの適合するセットを有するアダプターのみが、断片に連結され、その後増幅される。本技術は、「標識付けするリンカー」として本分野で示されている。本原理の例は、とりわけ、Unrau and Deugau(1994)Gene 145:163−169中に見出され得る。
【0042】
一実施形態において、複雑性を低下させるための方法は、異なる標的部位及び頻度を有する2つの制限エンドヌクレアーゼ並びに2つの異なるアダプター配列を利用して、AFLP等においてアダプターが連結された制限断片を準備する。
【0043】
本発明の一実施形態において、複雑性を低下させる段階は、任意に開始されるPCR(Arbitrarily Primed PCR)を試料に対して実施することを含む。
【0044】
本発明の一実施形態において、複雑性を低下させる段階は、DNAを変性及び再徐冷した後、二本鎖を除去することによって、反復された配列を除去することを含む。
【0045】
本発明のある種の実施形態において、複雑性の低下の段階は、望ましい配列を含有するオリゴヌクレオチドプローブに結合されている磁気ビーズに、核酸試料をハイブリッド形成することを含む。本実施形態はさらに、ハイブリッド形成された試料を一本鎖DNAヌクレアーゼへ曝露して、一本鎖DNAを除去すること、IIsクラスの制限酵素を含有するアダプター配列を連結して磁気ビーズを放出することを含み得る。本実施形態は、単離されたDNA配列の増幅を含んでもよく、又は含まなくてもよい。さらに、アダプター配列は、PCRオリゴヌクレオチドプライマーのためのテンプレートとして使用されてもよく、又は使用しなくてもよい。本実施形態において、アダプター配列は、配列同定子又はタグを含有してもよく、又は含有しなくてもよい。
【0046】
本発明の特定の実施形態において、複雑性の低下は、ディファレンシャルディスプレイ技術又はREADS(Gene Logic)技術を利用する。
【0047】
本発明の特定の実施形態において、複雑性を低下させる方法は、DNA試料を不適正塩基対の結合タンパク質へ曝露すること、及び試料を3’から5’のエキソヌクレアーゼで消化した後、一本鎖ヌクレアーゼで消化することを含む。本実施形態は、不適正塩基対結合タンパク質に付着した磁気ビーズの使用を含んでもよく、又は含まなくてもよい。
【0048】
本発明の一実施形態において、複雑性の低下は、本明細書の別の箇所に記載されているCHIP法、又はSSR、NBS領域(ヌクレオチド結合領域)、プロモーター/エンハンサー配列、テロメア共通配列、MADSボックス遺伝子、ATPase遺伝子ファミリー及び他の遺伝子ファミリー等の保存モチーフに対して配向するPCRプライマーの設計を含む。
【0049】
段階(c)において、第一のライブラリのcDNA断片のヌクレオチド配列の少なくとも一部が、高処理量配列決定によって決定される。高処理量配列決定法の非限定的な例は、国際公開第03/004690号、国際公開第03/054142号、国際公開2004/069849号、国際公開第2004/070005号、国際公開第2004/070007号及び国際公開第2005/003375号において開示される方法、Seo et al.(2004)Proc.Natl.Acad.Sci.USA 101:5488−93による方法、及びHelios,Solexa,US Genomics等の技術であり、これらは、参照により本明細書に組み込まれる。配列決定は、国際公開第03/004690号、国際公開第03/054142号、国際公開2004/069849号、国際公開第2004/070005号、国際公開第2004/070007号及び国際公開第2005/003375号(参照により本明細書に組み込まれる。)(全て、454法人の名においてである。)において開示される装置及び/又は方法を使用して実施されるのが最も好ましい。記載されている技術によって、単一試行で400万個の塩基の配列決定が可能であり、サンガー配列決定に基づいた競合する技術及びMegaBACE(GE Healthcare)若しくはABI3700(x1)(Applied Biosystems)よりも100倍高速で安価である。配列決定技術は、大まかに、4段階、すなわち:1)DNAの断片化及び一本鎖DNA(ssDNA)のライブラリへの特異的アダプターが連結;2)ssDNAのビーズへの徐冷及び油中水微小反応器中でのビーズの乳化;3)PicoTiterPlate(登録商標)中へのDNA運搬ビーズの配置;並びに4)ピロリン酸塩光信号の発生による多重ウェル中での同時配列決定からなる。本方法は、後により詳細に説明される。
【0050】
段階(d)において、第一のライブラリの連結断片を生成させるために、段階(d)の第一のライブラリのcDNA断片のヌクレオチド配列が整列される。
【0051】
配列から連結断片を構築することによって、集合段階は、計算上あまり複雑ではなく、それゆえ、より迅速に実施される。ライブラリ中で配列を整列させることによって、制限断片のセットの各制限断片に対する連結断片は、各プライマーの組み合わせに対して構築できる。これにより、連結断片のセットが生じ、各セットは、特定の制限断片に対応する。その結果、少なくとも1つの制限エンドヌクレアーゼによるcDNAの制限から得られる各断片は、この段階で、決定された(連結断片の)配列を有する。
【0052】
比較を目的とする配列の整列化の方法は、本分野において周知である。非限定的な多様なプログラム及び整列化アルゴリズムが、Smith and Waterman(1981)Adv.Appl.Math.2:482;Needleman and Wunsch(1970)J.Mol.Biol.48:443;Pearson and Lipman(1988)Proc.Natl.Acad.Sci.USA 85:2444;Higgins and Sharp(1988)Gene 73:237−244;Higging and Sharp(1989)CABIOS 5:151−153;Corpet et al.(1988)Nucl.Acids Res.16:10881−90;Huang et al.(1992)Computer Appl.in the Biosci.8:155−65;及びPearson et al.(1994)Meth.Mol.Biol.24:307−31に記載されており、それらは参照により本明細書に組み込まれる。Altschul et al.(1994)Nature Genet.6:119−29(参照により本明細書に組み込まれる。)は、配列整列化方法及び相同性算出に関する詳細な考えを示している。
【0053】
NCBIのBasic Local Alignment Search Tool(BLAST)(Altschul et al.,1990)は、National Center for Biological Information(NCBI,Bethesda,Md.)及びインターネットを含む幾つかの供給源から利用可能であり、配列分析プログラムblastp、blastn、blastx、tblastn及びtblastxと共に使用される。BLASTは、「http//www.ncbi.nlm.nih.gov/BLAST/」においてアクセス可能である。本プログラムを使用して配列の同一性を決定する方法に関する記載は、「http://www.ncbi.nlm.nih.gov/BLAST/blast_help.html」において利用可能である。マイクロサテライトマイニングにおいて、さらに応用され得る(Varshney et al.(2005)Trends in Biotechn.23(1):48−55参照)。
【0054】
一実施形態において、整列化は、アダプター/プライマーに関して整えられた配列データに対して、及び/又は再構築された制限酵素認識配列を使用して、すなわちcDNA由来の断片から配列データのみを使用することによって実施される。典型的には、得られた配列データは、断片の起源(すなわち、どの試料由来か)を同定するために使用され、アダプター及び/又は同定子配列に由来する配列は、データから除去され、この整えられたセットに対して整列化が実施される。
【0055】
段階(e)において、cDNAのヌクレオチド配列は、例えば配列の集合化によって決定される。
【0056】
前記方法は、例えば、cDNA中又は前記cDNAの複雑性の低下した画分中に存在する異なる配列の数を決定するために、又は特定の遺伝子の発現を発見するために有用である。
【0057】
一実施形態において、段階(a)は、i)生物試料を準備する段階、ii)前記生物試料から全RNA又はmRNAを単離する段階、iii)全RNA又はmRNAからcDNAを合成する段階を含む。
【0058】
一実施形態において、高処理量配列決定は、ビーズ等の固体支持体上で実施され(例えば、国際公開第03/004690号、国際公開第03/054142号、国際公開2004/069849号、国際公開第2004/070005号、国際公開第2004/070007号及び国際公開第2005/003375号参照)(全て、454 Corporationの名で公開されている。)、これらは、参照により本明細書に組み込まれる。このような配列決定方法は、同時に多くの試料を安価で効率的に配列決定するのに特に適している。
【0059】
さらなる実施形態において、高処理量配列決定は、合成による配列決定、好ましくはピロシーケンスに基づいている。ピロシーケンスは、本分野で公知であり、とりわけ、www.biotagebio.com;www.pyrosequencing.com/技術部分に記載されている。前記技術は、例えば、国際公開第03/004690号、国際公開第03/054142号、国際公開2004/069849号、国際公開第2004/070005号、国際公開第2004/070007号及び国際公開第2005/003375号(参照により本明細書に組み込まれる。)において開示される装置及び/又は方法(全て、454 Life Sciencesの名で公開されている。)においてさらに応用され、これらは参照により本明細書に組み込まれる。前記技術は、高処理量配列決定に特に適した高速で、非常に再現性のある技術である。
【0060】
好ましい実施形態において、高処理量配列決定は、
(c1)配列決定アダプターを断片に連結する段階;
(c2)、各々、単一の断片と徐冷するビーズに、配列決定アダプター連結断片を徐冷する段階;
(c3)各々、単一ビーズを含む油中水微小反応器中でビーズを乳化する段階;
(c4)ビーズの表面上で配列決定アダプター連結断片を増幅するために、乳濁液PCRを実施する段階;
(c5)増幅された配列決定アダプター連結断片を含有するビーズを選択/濃縮する段階;
(c6)各々、単一ビーズを含むウェル中にビーズを負荷する段階;及び
(c7)ピロリン酸塩シグナルを発生させる段階
を含む。
【0061】
段階c1)において、配列決定アダプターは、ライブラリ内の断片に連結される。前記配列決定アダプターには、ビーズに徐冷するための少なくとも1つの「鍵」領域、配列決定プライマー領域及びPCRプライマー領域が含まれる。従って、適宜に改変された断片が得られる。
【0062】
段階c2)において、配列決定アダプター連結断片をビーズ(各ビーズは、単一の断片と徐冷する。)に徐冷する。配列決定アダプター連結断片のプールにビーズを過剰量で添加し、ビーズの大部分にについて、ビーズ当たり単一の適応断片の徐冷が確実に起こるようにする(ポワソン分布)。
【0063】
段階c3)において、各々単一のビーズを含む油中水微小反応器中でビーズを乳化する。
【0064】
段階c4)において、乳濁液PCRを実施し、ビーズの表面上で配列決定アダプター連結断片を増幅する。PCR試薬は、油中水微小反応器中に存在し、PCR反応が前記微小反応器内で起きる。
【0065】
段階c5)において、増幅された配列決定アダプター連結断片を含有するビーズを選択/濃縮する。
【0066】
段階c6)において、各々、単一のビーズを含むウェル中にビーズを負荷する。ウェルは、好ましくは、断片を多量に同時配列決定することが可能であるPicoTiter(商標)Plateの一部である。酵素搭載ビーズを添加した後、ピロシーケンスを使用して、断片の配列を決定する。
【0067】
段階c7)において、ピロリン酸塩信号を発生させる。連続的段階において、PicoTiter(商標)Plate及びビーズ及びその中の酵素ビーズは、慣用の配列決定試薬の存在下において、異なるデオキシリボヌクレオチドへ供され、デオキシリボヌクレオチドが組み込まれると、光信号が発生し、記録される。正しいヌクレオチドの組み込みによって、本分野で公知の手段によって検出することができるピロシーケンス信号が発生する。
【0068】
本発明に係る方法の好ましい実施形態において、複雑性の低下は、
i).少なくとも1つの制限エンドヌクレアーゼでcDNAを消化して制限断片へと断片化する段階;
ii).制限断片の一方又は両方の末端と適合性のある1つの末端を有する少なくとも1つの二本鎖合成オリゴヌクレオチドアダプターと前記制限断片を連結してアダプターが連結された制限断片を生成する段階;
iii).前記アダプターが連結された制限断片を、1つ又はそれ以上のオリゴヌクレオチドプライマーと、ハイブリッド形成条件下で接触させる段階(前記1つ又はそれ以上のオリゴヌクレオチドプライマーは、少なくとも1つのアダプターの一部と、及び制限エンドヌクレアーゼの認識配列の残りの部分の一部とに相補的なヌクレオチド配列部分を含むプライマー配列を有する。);並びに
iv).ハイブリッド形成された1つ又はそれ以上のオリゴヌクレオチドプライマーの伸長によって、前記アダプターが連結された制限断片を増幅する段階
を含む方法によって実施される。
【0069】
複雑性を低下させるための上述の方法は、AFLP(登録商標)(Keygene N.V.,the Netherlands;例えば、その全ての内容が全体として参照により本明細書に組み込まれる、欧州特許第0,534,858号及びVos et al.(1995).AFLP:a new technique for DNA fingerprinting,Nucleic Acids Research,vol.23,no.21,4407−4414参照)とも呼ばれる。AFLPは、複雑性を低下させるための非常に再現性のある方法であり、それゆえ、本発明に係る方法に特に適している。AFLPは、選択的制限断片増幅のための方法である。AFLPは、配列情報を事前に一切必要とせず、全ての開始cDNAに対して実施することが可能である。
【0070】
従って、AFLPは、アダプター連結断片の再現性のあるサブセットを提供する。AFLP技術の1つの有用な変種は、選択的ヌクレオチドを使用せず(すなわち、+0/+0プライマー)、時に、リンカー−PCRと呼ばれる。これは、特に転写産物及びそこから得られるcDNAに非常に適した複雑性の低下も提供する。
【0071】
段階i)において、制限断片へと断片化するために、少なくとも1つの制限エンドヌクレアーゼでcDNAを消化する。特定の実施形態において、少なくとも2つの制限エンドヌクレアーゼが使用される。他の実施形態において、3つ又はそれ以上の制限エンドヌクレアーゼが使用できる。制限エンドヌクレアーゼは、頻度の高い切断剤であり得(すなわち、典型的には4及び5個の切断剤、すなわち、それぞれ4個又は5個のヌクレオチドの認識配列を有する制限エンドヌクレアーゼ)、又は頻度の低い切断剤であり得(すなわち、典型的には、それぞれ6個又はそれ以上のヌクレオチドの認識部位を有する。)、又はそれらの組み合わせであり得る。特定の実施形態において、頻度の低い又は頻度の高い切断剤の組み合わせが使用され得る。制限エンドヌクレアーゼは、認識配列の片側又は両側の何れかで、認識配列の外側のcDNAを切断するIIs型及びIIsa型を含む全ての種類であり得る。
【0072】
段階ii)において、アダプターが連結された制限断片を生成するために、制限断片の一方又は両方の末端と適合性のある1つの末端を有する少なくとも1つの二本鎖合成オリゴヌクレオチドアダプターと前記制限断片を連結する。好ましくは、アダプターは、エンドヌクレアーゼ認識部位が、アダプターが連結の際に修復されないようになっている。例えば、段階i)における2つ又はそれ以上の制限エンドヌクレアーゼを使用する場合、2つ又はそれ以上の異なるアダプターを使用することも可能である。本連結段階は、アダプターが連結された制限断片を生じる。アダプターは、平滑末端化でき、又は段階i)において使用される制限エンドヌクレアーゼに依存して、突出を含有し得る。
【0073】
特定の実施形態において、アダプターは、標識付けリンカーとして知られるアダプターのセットであり得る(Unrau,et al.,1994,Gene,145:163−169)。
【0074】
段階iii)において、前記アダプターが連結された制限断片を、1つ又はそれ以上のオリゴヌクレオチドプライマーと、ハイブリッド形成条件下で接触させる。1つ又はそれ以上のオリゴヌクレオチドプライマーは、少なくとも1つのアダプターの一部と、及び制限エンドヌクレアーゼの認識配列の残りの部分の一部と相補的なヌクレオチド配列部分を含むプライマー配列を有する。
【0075】
標準的なハイブリッド形成条件は、選択的ハイブリッド形成のための条件である。選択的ハイブリッド形成とは、厳密なハイブリッド形成条件下で、非標的核酸配列とのハイブリッド形成より検出可能に大きな程度(例えば、バックグラウンドより少なくとも2倍)まで、核酸配列を、指定された核酸標的配列とハイブリッド形成すること、及び非標的核酸を実質的に除外することに関する。「厳密な条件」又は「厳密なハイブリッド形成条件」という用語には、プローブが、他の配列(例えば、バックグラウンドより少なくとも2倍)より検出可能に大きな程度まで、その標的配列とハイブリッド形成する条件に対する表記が含まれる。厳密な条件は、配列依存的であり、異なる環境において異なる。ハイブリッド形成及び/又は洗浄の条件の厳密性を調節することによって、プローブと100%相補的である標的配列を同定することができる(相同的探索)。あるいは、類似性のより低い程度が検出できる(不均一性探索)ように、厳密性の条件は、配列中に幾つかの誤塩基対形成が許容されるように調整することができる。一般的に、プローブは、長さ約100ヌクレオチド未満であり、場合により、長さ50以下、又は25ヌクレオチドである。典型的には、厳密な条件は、塩濃度が、約1.5M未満のNaイオンである条件であり、典型的には、pH7.0から8.3において、約0.01から1.0MのNaイオン濃度(又は他の塩)であり、温度は、短いプローブ(例えば、10から50ヌクレオチド)に関しては、少なくとも約30℃であり、長いプローブ(例えば、50超のヌクレオチド)に関しては、少なくとも約60℃である。厳密な条件は、ホルムアミド等の脱安定化剤の添加によっても達成され得る。典型的な低い厳密度の条件には、37℃で、30から35%ホルムアミド、1M NaCl、1%SDS(ドデシル硫酸ナトリウム)の緩衝溶液によるハイブリッド形成、及び50から55℃での1×から2×SSC(20×SSC=3.0M NaCl/0.3Mクエン酸三ナトリウム)中での洗浄が含まれる。典型的な中程度の厳密度の条件には、37℃で、40から45%ホルムアミド、1M NaCl、1%SDS中でのハイブリッド形成、及び55から60℃で、0.5×から1×SSC中での洗浄が含まれる。典型的な高い厳密度の条件には、37℃で、50%ホルムアミド、1M NaCl、1%SDS中でのハイブリッド形成、及び60から65℃での0.1×SSC中での洗浄が含まれる。特異性は典型的に、ハイブリッド形成後の洗浄の作用であり、決定的因子は、最終洗浄溶液のイオン強度及び温度である。DNA−DNAハイブリッドに関し、Tmは、Meinkoth and Wahl,Anal.Biochem.,138:267−284(1984)の式:Tm=81.5℃+16.6(logM)+0.41(%GC)−0.61(%ホルムアミド)−500/Lから概算でき、式中Mは、一価の陽イオンのモル濃度、%GCは、DNA中のグアノシン及びシトシンのヌクレオチドの%であり、%ホルムアミドは、ハイブリッド形成溶液中のホルムアミドの%であり、Lは、塩基対中のハイブリッドの長さである。Tmは、相補的標的配列が、完全に適合したプローブとハイブリッド形成する(定義されたイオン強度及びpHのもとでの)温度である。Tmは、不適正塩基対の各1%につき約1℃低下し、従って、Tm、ハイブリッド形成及び/又は洗浄条件は、望ましい同一性の配列とハイブリッド形成するように調整できる。例えば、90%超の同一性を有する配列が探索される場合、Tmは10℃低下し得る。一般的に、厳密な条件は、定義されたイオン強度及びpHで、具体的な配列及びその相補対に関する融点(Tm)よりも約5℃低く選択される。しかしながら、非常に厳密な条件は、融点(Tm)よりも1、2、3又は4℃低いハイブリッド形成及び/又は洗浄を利用し得、中程度に厳密な条件は、融点(Tm)よりも6、7、8、9又は10℃低いハイブリッド形成及び/又は洗浄を利用し得、低い厳密度の条件は、融点(Tm)よりも11、12、13、14、15又は20℃低いハイブリッド形成及び/又は洗浄を利用し得る。等式を使用して、ハイブリッド形成及び洗浄組成物、並びに望ましいTmを使用して、当業者は、ハイブリッド形成及び/又は洗浄溶液の厳密性における変動が、内在的に記載されていることを理解する。誤塩基対の望ましい程度が、45℃未満(水溶液)又は32℃(ホルムアミド溶液)のTmをもたらす場合、SSC濃度を上昇させることが好ましく、これによりさらに高い温度が使用できる。核酸のハイブリッド形成に対する広範囲に及ぶ指針は、Tjjssen,Laboratory Techniques in Biochemistry and Molecular Biology−Hybridization with Nucleic Acid Probes,Part 1,Chapter 2 “Overview of principles of hybridization and the strategy of nucleic acid probe assays”,Elsevier,N.Y.(1993);及びCurrent Protocols in Molecular Biology,Chapter 2,Ausubel,et al.,Eds.,Greene Publishing and Wiley−Interscience,New York(1995)中に見出される。
【0076】
2つ又はそれ以上の制限エンドヌクレアーゼが使用される場合、2つ又はそれ以上のオリゴヌクレオチドプライマーが、エンドヌクレアーゼの認識部位に依存して、段階iii)において使用される可能性がある。欧州特許第0,534,858号及びVos et al.((1995).AFLP:a new technique for DNA fingerprinting,Nucleic Acids Research,vol.23,no.21, 4407−4414)においてさらに説明されるように、オリゴヌクレオチドプライマーは、少なくとも1つのアダプターに対して、並びに制限エンドヌクレアーゼの認識配列の残りの部分、及び場合により制限エンドヌクレアーゼの認識配列の残りの部分の一部に対して相補的なヌクレオチド配列部分を含むプライマー配列を有する。典型的には、認識配列の一部は、制限エンドヌクレアーゼによる配列の制限の後に残存しているその一部である。従って、要約すると、プライマーは、アダプターが連結された制限断片の既知の一部に対して少なくとも相補的である。
【0077】
段階iv)において、ハイブリッド形成された1つ又はそれ以上のオリゴヌクレオチドプライマーの伸長によって、前記アダプターが連結された制限断片を増幅する増幅は、好ましくは、本分野で周知のPCRを使用して実施される。
【0078】
本発明の好ましい実施形態において、プライマーは、プライマー配列の3末端に選択された配列をさらに含み、1から10個の選択的ヌクレオチドを含む前記選択された配列が、制限エンドヌクレアーゼの認識配列の残りの部分に直接隣接して配置される部分と相補的である。典型的には、認識配列の一部は、制限エンドヌクレアーゼによる配列の制限の後に残存しているその一部である。その3’末端で、プライマーは、好ましくは、選択された配列を含有する。選択された配列は、1から10個のヌクレオチドの既に選択されたセット、好ましくは1から8個、好ましくは1から5個、より好ましくは1から3個の選択されたヌクレオチドを含む。典型的なプライマーは、(2つの選択的なヌクレオチド(AC)に関して)実例となる次の構造、すなわち「5’アダプター特異的領域−制限配列特異的領域−AC−3’」を有し得る。従って、この典型的なプライマーは、2つの選択的ヌクレオチドACを含有し、アダプターが連結された制限断片の既知の部分の後に(すなわち、制限エンドヌクレアーゼの制限部位の残りの後に)、最初の2つのヌクレオチドとして相補的TGを含有するアダプター連結断片を増幅するにすぎない。
【0079】
AFLP、その利点、その実施形態、並びに技術、酵素、アダプター、プライマー及びさらなる化合物及びAFLPに使用されるツールに関するさらなる記載については、その全ての内容が、全体として、本明細書により組み込まれる米国特許第6,045,994号、欧州特許(B)第0,534,858号、欧州特許第976835号及び欧州特許第974672号、国際公開第01/88189号及びVos et al.Nucleic Acids Research,1995, 23, 4407−4414に表記される。
【0080】
一実施形態において、前記アダプターは、同定子配列をさらに含む。このような同定子配列は、例えば、複雑性の低下によって得られるライブラリの起源を示すのに使用される変動する長さの特有の塩基配列であり得る。
【0081】
本発明は、
(a)cDNAを準備する段階;
(b)前記cDNAの少なくとも部分について複雑性の低下を実施してcDNA断片を含む前記cDNAの第一のライブラリを得る段階;
(c)配列決定によって、第一のライブラリの前記cDNA断片のヌクレオチド配列の少なくとも一部を決定する段階;及び
(d)ヌクレオチド配列の頻度を決定する段階
を含む、ヌクレオチド配列の頻度を決定するための方法にも関する。
【0082】
方法の段階(a)において、cDNAが準備される。cDNAを調製する方法は本分野で周知であり、適切な方法が上述に提供されている。cDNAは、上述に説明されるように、全ての起源に由来し得る。
【0083】
方法の段階(b)において、複雑性の低下は、cDNA断片を含むcDNAの第一のライブラリを得るために、cDNAの少なくとも一部に対して実施される。複雑性の低下は、上述に説明されるように、本分野で公知の何れかの方法によって実施され得る。
【0084】
本発明に従った方法の段階(c)において、第一のライブラリのcDNA断片のヌクレオチド配列の少なくとも一部が、配列決定によって決定される。配列決定は、周知のサンガー(ジデオキシ)法を含む、本分野で公知の何れかの方法によって実施できる。好ましい実施形態において、配列決定は、複数の試料の同時配列決定が可能な高処理量配列決定を使用して実施される。高処理量配列決定のための好ましい方法は、上述に説明される。
【0085】
本発明に係る方法の段階(d)において、ヌクレオチド配列の頻度が決定される。ヌクレオチド配列の頻度は、例えば、次の方法によって決定され得る。cDNA断片のヌクレオチド配列の整列化は、同一の転写された遺伝子に由来するヌクレオチド配列を回収するために、及び前記ヌクレオチド配列を計数するために使用され得る。ヌクレオチド配列が、同一の転写された遺伝子に由来するかどうかは、配列間の相同性によってまだ確立されていない。本発明において、ヌクレオチド配列が、少なくとも10の、好ましくは少なくとも15の、より好ましくは少なくとも20の、さらにより好ましくは少なくとも25、30、40、50、100、150、200のヌクレオチドの長さにわたって、少なくとも95、96、97、98、99、100%相同である場合に、前記ヌクレオチド配列が、同一の転写された遺伝子に由来すると仮定される。前記方法は、統計的に異なる頻度を示すために、T検定等の統計的解釈によって補助され得る。配列の同定された数に基づいて、単純な順位決定を実施することも可能である。試料1において、(不明な)遺伝子「X」のヌクレオチド配列が10回測定され(10は、例えば、98%の配列相同性を有するヌクレオチド配列の数である。)、試料2において、同一の配列が20回測定されると仮定する。この場合、試料2における遺伝子Xの転写レベルは、試料1の2倍であると思われる。但し、試料1及び2に対して、決定された配列の総数は同一であり、従って、転写産物の正確な特徴づけは、試料間の標準化を必要とし得、及び/又は遺伝子「X」に由来する配列の頻度を、相対的な転写レベルが複数の試料間で一定であると仮定されるいわゆるハウスキーピング遺伝子の頻度と比較し得る。試料の表現型特徴に関する試料間での相対的な転写特性の順位決定は、異なる表現型の発生にどの遺伝子が影響するかに関する情報を提供する。表現型という用語には、生物体の特徴の全ての種類、例えば、疾病状態等が含まれる。
【0086】
遺伝子あたりのヌクレオチド配列数(すなわち、デジタルノザン)の統計的評価に関して、cDNA断片の重複的配列決定を確保することが重要である。このように、実験が実施される前に配列ライブラリの複雑性を確立し、十分な配列を得るのに必要な配列読み取り数を調整することは有用であり得る。例えば、典型的なcDNA試料は、8,000から16,000の異なる転写産物を含む。+0/+1のcDNA−AFLPが使用される場合、転写産物の総数の約80%を標的とする4ヌクレオチドの配列を認識する2つの制限エンドヌクレアーゼが使用されると想定すると、複雑性の低下した試料は、約1,600から3,200の転写産物を含む。20倍の重複的配列決定を用いると、これは、試料あたり必要とされる32,000から64,000の読み取りに相当する。これは、比較的低レベルで発現する遺伝子の転写産物レベルも決定し得るのに十分である。
【0087】
配列ライブラリの複雑性を決定するための極めて適切な方法が、国際公開第03/010328号に記載されており、参照により、本明細書に組み込まれる。
【0088】
本発明は、
(a)第一のcDNA試料に対して請求項2に記載の方法を実施することによって、前記第一のcDNA試料中のヌクレオチド配列の頻度を決定する段階;
(b)第二の及び/又はさらなるcDNA試料に対して請求項2に記載の方法を実施することによって、第二の及び/又はさらなるcDNA試料中の同一のヌクレオチド配列の頻度を決定する段階;及び
(c)第一のcDNA試料中のヌクレオチド配列の頻度を、第二の及び/又はさらなるcDNA試料中の同一のヌクレオチド配列の頻度と比較して前記ヌクレオチド配列の相対的な転写レベルを得る段階
を含む、cDNA試料中のヌクレオチド配列の相対的な転写レベルを決定するための方法にも関する。
【0089】
方法の段階(a)において、第一のcDNA試料に対して請求項2に記載の方法を実施することによって、前記第一のcDNA試料中でヌクレオチド配列の頻度を決定する。
【0090】
方法の段階(b)において、第二の及び/又はさらなるcDNA試料に対して請求項2に記載の方法を実施することによって、前記第二の第二の及び/又はさらなるcDNA試料中で同一のヌクレオチド配列の頻度を決定する。
【0091】
段階(c)において、前記第一のcDNA試料中のヌクレオチド配列の頻度を、前記第二の及び/又はさらなるcDNA試料中の同一のヌクレオチド配列の頻度と比較して前記ヌクレオチド配列の相対的な転写レベルを得る。
【0092】
このような相対的な転写レベルに関する知識は、上述に論議されるように、特定の表現型に関して重要な転写産物を確立するために重要であり得る。
【0093】
本発明は、

a)第一のcDNA試料を準備する段階;
b)第一のcDNA試料に対して複雑性の低下を実施して第一のライブラリを得る段階;
c)第一のライブラリにタグ付けして第一のタグ付きライブラリを得る段階;
d)好ましくは各cDNA試料に対して異なるタグを使用して、第二の及び/又はさらなるcDNA試料を用いて連続して又は同時に段階(a)及び(b)を実施して第二の及び/又はさらなるタグ付きライブラリを得る段階;
e)前記第一のタグ付きライブラリ並びに第二の及び/又はさらなるタグ付きライブラリを組み合わせて組み合わされたライブラリを得る段階;
f)前記組み合わされたライブラリのヌクレオチド配列の少なくとも一部を配列決定によって決定する段階;
g)第一のcDNA試料並びに第二の及び/又はさらなるDNA試料中のヌクレオチド配列の頻度を決定する段階;並びに
h)第一のcDNA試料中のヌクレオチド配列の頻度を、第二の及び/又はさらなるcDNA試料中のヌクレオチド配列の頻度と比較して前記cDNA試料中のヌクレオチド配列の相対的な転写レベルを得る段階
を含む、前記cDNA試料中のヌクレオチド配列の相対的な転写レベルを決定するための方法にも関する。
【0094】
段階(a)において、第一のcDNA試料を準備する。cDNA試料は、上述に論議されるように得られ得る。
【0095】
段階(b)において、第一のcDNA試料に対して複雑性の低下を実施して第一のライブラリを得る。複雑性の低下は、何れかの技術によって実施され得るが、好ましくはKeygeneのAFLP(登録商標)技術によって実施される。
【0096】
段階(c)において、第一のタグ付きライブラリを得るため、第一のライブラリをタグ付けする。タグ付けは、複雑性の低下の段階(b)と同時に起こり得る。このような同時タグ付けは、例えば、各試料のための固有の(ヌクレオチド)同定子を含むアダプターを使用して、AFLPによって達成できる。
【0097】
タグ付けは、組み合わされたライブラリを得るために、2つ又はそれ以上のcDNA試料の2つ又はそれ以上の複雑性低下ライブラリが組み合わされる場合に、例えば、異なる植物の系から得られた異なる源の試料を識別することを目的とする。従って、好ましくは、第一のcDNA試料及び第二又はさらなるcDNA試料のタグ付きライブラリを調製するために、異なるタグが使用される。例えば、5個の核酸試料を使用する場合には、5個の異なるタグ付きライブラリを取得することが予定され、5個の異なるタグは、個々のもとの試料を表す。
【0098】
タグは、核酸試料を識別するための、本分野で公知の何れのタグでもあり得るが、好ましくは短い同定子配列である。このような同定子配列は、例えば、複雑性の低下によって得られるライブラリの起源を示すために使用される変動する長さの固有の塩基配列であり得る。ライブラリをタグ付けするさらなる段階が必要ではないので、アダプター又はプライマー中にオリゴヌクレオチドタグを組み込むことは、非常に簡便である。このような同定子配列は、比較されるべき核酸試料の数に応じて長さが変動し得る。約試料の限定された数の源間を識別するには、4個の塩基の長さ(4=起こり得る256個の異なるタグ配列)が十分である(256個まで)が、タグ配列は、識別されるべき試料間で2つ以上の塩基が異なることが好ましい。必要に応じて、タグ配列の長さは、適宜調整することができる。
【0099】
段階d)において、好ましくは、各cDNA試料に対して異なるタグを使用し、第二の及び/又はさらなるcDNA試料を用いて、連続して又は同時に段階(a)及び(b)を実施して第二の及び/又はさらなるタグ付きライブラリを得る。cDNA試料は、例えば、異なる起源であり得、例えば、異なる植物の系であり得、これにより、このような植物の系のこのような転写産物の特性が比較され得る。あるいは、cDNA試料は、例えば、植物の発達中の転写産物の特性を比較するために、発達の異なる段階における単一の植物の系に由来し得る。単に有効性を調べるために、完全に無関係のcDNA試料に対して、本発明に係る方法を実施することも可能である。
【0100】
段階(e)において、第一のタグ付きライブラリ並びに第二の及び/又はさらなるタグ付きライブラリを組み合わせて組み合わされたライブラリを得る。このような組み合わされたライブラリを同時配列決定に供して、非常に効果的なプロセスを提供し得る。
【0101】
段階(f)において、組み合わされたライブラリのヌクレオチド配列の少なくとも一部を、配列決定、好ましくは高処理量配列決定によって、好ましくは上述のとおり決定する。
【0102】
段階(g)において、第一のcDNA試料並びに前記第二の及び/又はさらなるDNA試料中のヌクレオチド配列の頻度を決定する。タグによって、第一のライブラリのヌクレオチド配列を、第二の及び/又はさらなるライブラリのヌクレオチド配列と識別する。この場合、整列化は、アダプター/プライマーに関して整えられた配列データに対して、及び/又は同定子に関して整えられた配列データに対して行われるが、再構築された制限酵素認識配列を使用することによって、すなわちcDNA由来の断片から配列データのみを使用することによって実施される。典型的には、得られた配列データは、断片の起源(すなわち、どの試料由来か)を同定するために使用され、アダプター及び/又は同定子配列に由来する配列は、データから除去され、この整えられたセットに対して整列化が実施される。
【0103】
段階(h)において、第一のcDNA試料中のヌクレオチド配列の頻度を、第二の及び/又はさらなるcDNA試料中のヌクレオチド配列の頻度と比較してcDNA試料中のヌクレオチド配列の相対的な転写レベルを得る。
【0104】
タグ付け戦略により、異なるcDNA試料に関するヌクレオチド配列の転写レベルの決定は、同時に実施でき、同時実施が非常に有利である。本方法は、上で論述されているように、ある種の表現型形質に関与する転写産物を迅速に同定するのに非常に適している。
【0105】
好ましい実施形態において、第一のライブラリ及び第二の又はさらなるライブラリのタグ付けは、異なるタグを使用して実施される。上で論述されているように、、cDNA試料の各ライブラリが、それ自体のタグによって同定されることが好ましい。
【実施例】
【0106】
実施例
ノザンハイブリッド形成又はDNAマイクロアレイ発現適用等のアプローチを使用して、高等植物中での遺伝子発現の時間的及び空間的制御の多数の例が蓄積されている。後者の技術は、遺伝子千個の発現を同時にモニターすることを可能とする。これらの分析方法とは異なり、遺伝子発現の特徴づけのデジタル分析は、高処理量配列技術を直接使用して、タグ付き転写産物を配列決定することによって実現され得る。試料中の特異的転写産物から得られた配列数は、この特定の配列の転写レベルを反映する。配列決定の深度を考慮しながら、複数の試料間でこれらの数を比較することによって、これらの試料間で転写レベルを正確に測定することが可能である。前記技術は、ある種の発現特性と関連した新たな未知の性質マーカーを発見するための強力なツールと思われる。
【0107】
本明細書において、本発明者は、2つのコショウ系からのmRNA画分に由来するAFLP技術を使用して複雑性を低下させる、cDNAの高処理量配列決定を記載する。タグ付きcDNA断片を直接配列決定することによって、発現特性が生じ得る。
【0108】
方法
全RNA/ポリ(A)RNA単離
コショウ系PSP11及びPI201234から、RNeasyミニキット(カタログ番号74104)を使用するQIAGEN製RNeasy Plant Mini Protocolを使用して、葉の材料から全RNAを単離した。入力として、試料あたり100mgの葉の材料を使用した。
【0109】
本プロトコールの後、試料あたり2.5から3μgの全RNA収量を得た。その後、QIAGEN製Oligotex mRNA Mini Kit(カタログ番号70022)を使用して、全RNA試料1μgからのポリ(A)RNA画分を単離した。150から200ngのポリ(A)RNA収量を得た。これらの試料の濃度は、5から10ng/μLであった。全RNA及び全ポリ(A)RNAの両者をアガロースゲルで分析し、RNAの性質をチェックした。
【0110】
cDNA合成
以下のプロトコールに従って、cDNAを作製した。
【0111】
第一の鎖のcDNA合成
以下を共に添加する。
10μLポリ(A)RNA(50から100ng)
5μLオリゴ−dT25(70ng/μL)
その後、以下を添加する。
5μLの5×第一の鎖の緩衝液(Superscript II RTとともに供給)
2.5μLの0.1M DTT
1μLの10mM dNTP
0.5μLのSuperscript II(200U/μL)
1μLのMQ水で25μLの最終容積にする。
42℃で2時間定温放置する。
【0112】
第二の鎖のcDNA合成
以下のものを、一緒に添加する。
25μLの第一の鎖の反応混合物
8μLの10×第二の鎖の緩衝液
1.5μLの10mM dNTP
7.5単位のイー・コリ(E.coli)DNAリガーゼ
25単位のイー・コリポリメラーゼ
0.8単位のRNase−H(1U/μL)
MQ水を添加して、80μLの最終容積にする。
12℃で1時間定温放置する。
22℃で1時間定温放置する。
【0113】
その後、QIAGEN製Qiaquick PCRメンブレン精製キット(カタログ番号28104)を使用して、cDNA試料を精製した。30μLの溶出緩衝液を使用して、溶出を実施した(5mMトリス−HCl、pH8.5)。
【0114】
タグ付きAFLPプライマーを使用するcDNA−AFLPテンプレート調製
Zabeau & Vos,1993:Selective restriction fragment amplification;a general method for DNA fingerprinting.欧州特許出願公開(A1)第0534858号;米国特許第6045994号及びVosら(Vos,P.,Hogers,R.,Bleeker,M.,Reijans,M.,van de Lee,T.,Hornes,M.,Frijters,A.,Pot,J.,Peleman,J.,Kuiper,M.et al.(1995)AFLP:a new technique for DNA fingerprinting.Nucl.Acids Res.,21,4407−4414)によって記載されているとおり、制限エンドヌクレアーゼの組み合わせTaqI/MseIを使用して、コショウ親系PSP11及びPI−201234の作製されたcDNAのAFLPテンプレートを調製した。
【0115】
cDNAの制限及び連結手法
2つの段階、すなわち、TaqIによる第一段階(最高定温放置温度)、MseIによるその後の段階(最低定温放置温度)において消化を実施した。
【0116】
TaqI及びMseIによるcDNAの制限を以下のとおり実施した。
【0117】
DNA制限処理
以下のものを、一緒に添加する。
250ng cDNA
10単位のTaqI
8μLの5×RL緩衝液 5×RL緩衝液は、50mMトリス−HAc、50mM MgAc、250mM KAc、25mM DTT、250ng/BSAμL;pH7.5である。
MQ水を添加して、40μLの最終容積にする。
65℃で2時間定温放置する。
【0118】
TaqIによる制限の後、
以下を添加する。
10単位のMseI
2μLの5×RL緩衝液
MQ水を添加して、50μLの最終容積にする。
37℃で2時間定温放置する。
【0119】
アダプターの連結
消化混合物に以下の成分を添加した。
1μLの10mM ATP
1μLのT4 DNAリガーゼ
1μLのTaqIアダプター(50pmol/μL)
【0120】
【化1】

1μLのTaqIアダプター(50pmol/μL)
【0121】
【化2】

2μLの5×RL緩衝液。
MQ水を添加して、60μLの最終容積にする。
37℃で3時間定温放置する。
【0122】
cDNA−AFLP増幅
制限−連結の後、非選択的増幅段階において、この制限/連結反応性生物をテンプレートとして使用した。選択的増幅(+1/+1)のために、これらの非選択的AFLP生成物をその後テンプレートとして使用した。+2/+3の選択的増幅を実施することによって、前記+1/+1生成物に関して性質チェックを実施した。後者の増幅の生成物を4.5%配列ゲルでチェックした。
【0123】
非選択的cDNA−AFLP増幅を以下のとおり実施した。
5μLの希釈されていない制限−連結混合物
1.5μLのTaqI−プライマー(50ng/μL)
【化3】

1.5μLのMseI−プライマー(50ng/μL)
【化4】

2μLの5mM dNTP
1単位のTaq.ポリメラーゼ
5μLの10×PCR緩衝液
MQ水を添加して、50μLの最終容積にする。
【0124】
次の条件、すなわち30周期(94℃で30秒、56℃で60秒及び72℃で120秒)を使用して、金又は銀のブロックとともにPE9700を使用して、PCR増幅を実施した。
【0125】
タグ配列を使用する選択的cDNA−AFLP増幅を以下のとおり実施した。
コショウ系PSP11に由来する非選択的cDNA−AFLP生成物用
5μLの600×希釈した非選択的生成物
1.5μLのTr01ACACプライマー(+A)(50ng/μg)
【0126】
【化5】

1.5μLのM02ACACプライマー(+C)(50ng/μg)
【0127】
【化6】

2μLの5mM dNTP
1.5単位のAmpliTaq−Goldポリメラーゼ
5μLの10×PCR緩衝液
MQ水を添加して、50μLの最終容積にする。
【0128】
コショウ系PI201234に由来する非選択的cDNA−AFLP0/0生成物用
5μLの600×希釈した非選択的生成物
1.5μLのTr01AGCTプライマー(+A)(50ng/μg)
【0129】
【化7】

1.5μLのM02AGCTプライマー(+C)(50ng/μg)
【0130】
【化8】

2μLの5mM dNTP
1.5単位のAmpliTaq−Goldポリメラーゼ
5μLの10×PCR緩衝液
MQ水を添加して、50μLの最終容積にする。
【0131】
次の条件、すなわち94℃で12秒(高温開始)、94℃で30秒、65℃で30秒、72℃で60秒を1周期;23周期−より低温の徐冷温度であって12周期中各周期0.7℃−13周期のタッチダウン相−94℃で30秒、56℃で30秒、72℃で60秒を使用して、金ブロックとともにPE9700を使用して、PCR増幅を実施した。100塩基対ラダーを使用する1%アガロースゲル上で、生成された+1/+1産物の品質をチェックし、断片長の分布をチェックした(図1参照)。
【0132】
選択的プライマーは、その5’末端で4bpタグ(上述の下線部)を含有し、配列決定処理の終了時に個々のコショウ系由来の増幅産物を識別する。本発明に従ったタグ付きcDNA−AFLP PCR産物を生成する原理を図2に示す。
【0133】
配列ライブラリ調製及び高処理量配列決定
Marguliesら(Margulies et al.,Nature 437,pp.376−380及びオンライン補遺)によって記載されている454 Life Sciences/Roche GS20配列決定技術を使用する高処理量配列決定に、両コショウ系由来のタグ付きcDNA AFLP生成物を供した。
タグ付きcDNA−AFLP PCR生成物をまず生成し、修飾されたアダプター(
【0134】
【化9】

及び
【0135】
【化10】

)に連結し、乳濁液−PCR増幅並びにMargulies及び共同研究者によって記載されているその後の断片配列決定を容易にした。
【0136】
乳濁液PCRプライマー、配列プライマー及び配列実行条件は全て、Margulies及び共同研究者によって記載されるとおりであった。配列ライブラリ調製手法を図3に示す。Keygene NV,Wageningen,The Netherlandsの研究室で、高処理量GS20配列実行を実施した。
【0137】
GS20配列実行データ処理
バイオインフォマティクスパイプライン(Keygene N.V.)を使用して、GS20配列実行の半分(すなわち、GS20PicoTiterPlate上で利用可能な2チャネルのうちの1チャネル)から得られる配列データを処理した。具体的には、塩基が呼び出された(basecalled)生配列の読み取りをFASTAフォーマット中で変換し、BLASTアルゴリズムを使用して、タグ付きAFLPアダプター配列の存在に関して検査した。既知のタグ付きAFLPプライマー配列に対して信頼度の高い合致が得られたら、配列を整え、制限エンドヌクレアーゼ部位を復元し、適切なタグを割り当てた。その後、全体的な配列相同性に基づいたメガBLAST手法を使用して、33塩基よりも大きな整えられた配列を全てクラスター化した。次に、CAP3多重整列化アルゴリズムを使用して、クラスターあたり1つ又はそれ以上の連結断片中にクラスターを構築した。
【0138】
13個の配列読み取りの出力例
クラスター387
試料2のIDタグ(AGTC)を太字で示している。試料1のIDタグ(ACAC)を下線で示している。図4を参照されたい。
【0139】
配列実行の全体的な統計を表1に示す。
【0140】
【表1】

【0141】
解釈:
段階1)「試料配列決定深度標準化因子」は、2.45であり、試料2から得られた読み取り全体を試料1に由来する読み取り総数で除したものとして定義される(123822/50599=2.45)。連結断片あたりの試料2に由来する読み取り数を2.45で除して、転写レベルを試料1の転写レベルと比較した。
【0142】
段階2)内部標準物質として供する「ハウスキーピング」遺伝子の「発現」を決定することによって、第二の「ハウスキーピング遺伝子の標準化」段階を実施した。このため、リコペルシコン・エスキュレンタム(Lycopersicon esculentum)アルギニンデカルボキシラーゼ遺伝子を選択した。CAP3多重整列化を使用して得られた連結断片の配列に対して、リコペルシコン・エスキュレンタムアルギニンデカルボキシラーゼの配列を「BLAST処理」し、コショウアルギニンデカルボキシラーゼ遺伝子の転写産物が、試料1及び2においてどの程度頻繁に観察されたかを決定した。その後、「試料配列決定深度標準化因子」を最初に適用した後、これらの転写産物が試料1及び2において観察された比を算出した(段階1)。本実施例において、前記比(=ハウスキーピング遺伝子標準化因子)は、試料1/試料2に関して17/14=1.2であった(表1)。
【0143】
連結断片プールに対するハウスキーピング遺伝子(リコペルシコン・エスキュレンタムアルギニンデカルボキシラーゼ)のBLAST検索例
参考文献:Altschul,Stephen F.,Thomas L.Madden,Alejandro A.Schaffer,Jinghui Zhang,Zheng Zhang,Webb Miller,and David J.Lipman(1997),“Gapped BLAST and PSI−BLAST:a new generation of protein database search programs”,Nucleic Acids Res.25:3389−3402。
【0144】
クエリ=gi|293549|gb|K16582|TOMARGDECA リコペルシコン・エスキュレンタムアルギニンデカルボラーゼmRNA、完全コード(2060文字)
データベース:taggedReads.fna
174,421配列;15,408,192全文字。結果を図5に示す。
【0145】
【表2】

【0146】
段階3)実際の発現特徴づけに関し、10超の読み取りを含有する連結断片のみを考慮した。連結断片あたりの10個の読み取りの最小レベルを選択して、不十分な配列決定深度による不正確な転写産物の特徴づけの結果を回避した。表2は、上述に概略された3段階手法後のPSP11(試料1)対PI201234(試料2)において差動的に発現した2つの転写産物の相対的なmRNA発現レベルを示す。具体的には、クラスター2215は、試料1において上方制御された転写産物を表し、クラスター847は、試料1において下方制御された転写産物を表し;これらの転写産物の相対的な転写レベルの算出を表3に示す。最後に、表4は、上述の原理の基づいた全データセットにおける差動的に転写された遺伝子数の概略を含有する。
【0147】
上方制御試料1の例−生データ。クラスター2215。試料2のIDタグ(AGTC)を太字で示している。試料1のIDタグ(ACAC)を図6において下線で示している。
【0148】
下方制御試料1の例−生データ。クラスター847。試料2のIDタグ(AGTC)を太字で示している。試料1のIDタグ(ACAC)を図7において下線で示している。
【0149】
【表3】

【0150】
【表4】

【図面の簡単な説明】
【0151】
【図1】図1:タグ付き(A/C)cDNA−AFLP生成物は、コショウ系PSP11及びPI201234を形成する。両系由来の2つの試料を1%アガロースゲル上で二重に負荷する。 M:100bpマーカー 1:cDNA−AFLP PSP11試料1 2:cDNA−AFLP PSP11試料1 3:cDNA−AFLP PSP11試料2 4:cDNA−AFLP PSP11試料2 5:cDNA−AFLP PI201234−試料1 6:cDNA−AFLP PI201234−試料1 7:cDNA−AFLP PI201234−試料2 8:cDNA−AFLP PI201234−試料2
【図2】図2:4bpの5プライムタグ配列を含有するAFLPプライマーによる増幅後のコショウAFLP+1/+1増副産物の模式的呈示
【図3】図3:配列ライブラリの調製の作業の流れ
【図4】図4:13個の配列読み取りの出力例
【図5】図5:BLASTの結果
【図6−1】図6−1:上方制御の生データの呈示
【図6−2】図6−2:上方制御の生データの呈示
【図6−3】図6−3:上方制御の生データの呈示
【図6−4】図6−4:上方制御の生データの呈示
【図7−1】図7−1:上方制御の生データの呈示
【図7−2】図7−2:上方制御の生データの呈示
【図7−3】図7−3:上方制御の生データの呈示
【図7−4】図7−4:上方制御の生データの呈示
【図7−5】図7−5:上方制御の生データの呈示
【図7−6】図7−6:上方制御の生データの呈示

【特許請求の範囲】
【請求項1】
(a)cDNAを準備する段階;
(b)前記cDNAの少なくとも部分について複雑性の低下を実施してcDNA断片を含むcDNAの第一のライブラリを得る段階;
(c)高処理量配列決定によって、第一のライブラリの前記cDNA断片のヌクレオチド配列の少なくとも一部を決定する段階;
(d)段階d)の第一のライブラリの前記cDNA断片のヌクレオチド配列を整列させて第一のライブラリの連結断片を生成する段階;及び
(e)前記cDNAのヌクレオチド配列を決定する段階
を含む、cDNAのヌクレオチド配列を決定するための方法。
【請求項2】
(a)cDNAを準備する段階;
(b)前記cDNAの少なくとも部分について複雑性の低下を実施してcDNA断片を含むcDNAの第一のライブラリを得る段階;
(c)配列決定によって、第一のライブラリの前記cDNA断片のヌクレオチド配列の少なくとも一部を決定する段階;及び
(d)ヌクレオチド配列の頻度を決定する段階
を含む、ヌクレオチド配列の頻度を決定するための方法。
【請求項3】
(a)第一のcDNA試料に対して請求項2に記載の方法を実施することによって、第一のcDNA試料中のヌクレオチド配列の頻度を決定する段階;
(b)第二の及び/又はさらなるcDNA試料に対して請求項2に記載の方法を実施することによって、第二の及び/又はさらなるcDNA試料において同一のヌクレオチド配列の頻度を決定する段階;並びに
(c)第一のcDNA試料中のヌクレオチド配列の頻度を、第二の及び/又はさらなるcDNA試料中の同一のヌクレオチド配列の頻度と比較して前記ヌクレオチド配列の相対的な転写レベルを得る段階
を含む、cDNA試料中のヌクレオチド配列の相対的な転写レベルを決定するための方法。
【請求項4】
(a)第一のcDNA試料を準備する段階;
(b)第一のcDNA試料に対して複雑性の低下を実施して第一のライブラリを得る段階;
(c)第一のライブラリにタグ付けして第一のタグ付きライブラリを得る段階;
(d)好ましくは各cDNA試料に対して異なるタグを使用して、第二の及び/又はさらなるcDNA試料を用いて、連続して又は同時に段階(a)及び(b)を実施して第二の及び/又はさらなるタグ付きライブラリを得る段階;
(e)第一のタグ付きライブラリ並びに第二の及び/又はさらなるタグ付きライブラリを組み合わせて組み合わされたライブラリを得る段階;
(f)前記組み合わされたライブラリのヌクレオチド配列の少なくとも一部を配列決定によって決定する段階;
(g)第一のcDNA試料並びに第二の及び/又はさらなるDNA試料中のヌクレオチド配列の頻度を決定する段階;並びに
(h)第一のcDNA試料中のヌクレオチド配列の頻度を、第二の及び/又はさらなるcDNA試料中のヌクレオチド配列の頻度と比較して前記cDNA試料中のヌクレオチド配列の相対的な転写レベルを得る段階
を含む、cDNA試料中のヌクレオチド配列の相対的な転写レベルを決定するための方法。
【請求項5】
複雑性の低下が、増幅化断片長多形性技術、指標付き連結、ゲノム分割、遺伝子発現及びその修飾の連続分析、大量並行サイン配列決定、リアルタイム多重連結依存的プローブ増幅、高適用範囲発現特徴づけ、普遍的マイクロアレイシステム、トランスクリプトーム減算法、断片ディスプレイ、ディファレンシャルディスプレイ及び順序化ディファレンシャルディスプレイからなる群から選択される方法によって実施される、請求項1から4の何れか一項に記載の方法。
【請求項6】
配列決定が、高処理量配列決定によって実施される、請求項2から5の何れか一項に記載の方法。
【請求項7】
高処理量配列決定が、ビーズ等の固体支持体上で実施される、請求項1から6の何れか一項に記載の方法。
【請求項8】
高処理量配列決定が、合成による配列決定、好ましくはピロシーケンスに基づいている、請求項6又は7の何れか一項に記載の方法。
【請求項9】
高処理量配列決定が、
(c1)配列決定アダプターを断片に連結する段階;
(c2)各々、単一の断片と徐冷するビーズに、配列決定アダプター連結断片を徐冷する段階;
(c3)各々、単一ビーズを含む油中水微小反応器中で前記ビーズを乳化する段階;
(c4)乳濁液PCRを実施してビーズの表面上で配列決定アダプター連結断片を増幅する段階;
(c5)増幅された配列決定アダプター連結断片を含有するビーズを選択し/濃縮する段階;
(c6)各々単一ビーズを含むウェル中にビーズを負荷する段階;及び
(c7)ピロリン酸塩シグナルを発生させる段階
を含む、請求項6から7の何れか一項に記載の方法。
【請求項10】
(a)少なくとも1つの制限エンドヌクレアーゼでcDNAを消化して制限断片へと断片化する段階;
(b)制限断片の一方又は両方の末端と適合性のある1つの末端を有する少なくとも1つの二本鎖合成オリゴヌクレオチドアダプターと前記制限断片を連結してアダプターが連結された制限断片を生成する段階;
(c)前記アダプターが連結された制限断片を、少なくとも1つのアダプターの一部と、及び制限エンドヌクレアーゼの認識配列の残りの部分の一部と相補的なヌクレオチド配列部分を含むプライマー配列を有する1つ又はそれ以上のオリゴヌクレオチドプライマーと、ハイブリッド形成条件下で接触させる段階;及び
(d)ハイブリッド形成された1つ又はそれ以上のオリゴヌクレオチドプライマーの伸長によって前記アダプターが連結された制限断片を増幅する段階
を含む方法によって複雑性の低下が実施される、請求項1から9の何れかにに記載の方法。
【請求項11】
プライマーが、プライマー配列の3’末端に、選択された配列をさらに含み、1から10個の選択的ヌクレオチドを含む前記選択された配列が、制限エンドヌクレアーゼの認識配列の残りの部分に直接隣接して配置される部分と相補的である、請求項10に記載の方法。
【請求項12】
プライマー配列の3’末端の選択された配列が、1から8個、好ましくは1から5個、より好ましくは1から3個の選択的ヌクレオチドを含む、請求項10又は11の何れか一項に記載の方法。
【請求項13】
前記アダプターが、同定子配列をさらに含む、請求項10から12の何れか一項に記載の方法。
【請求項14】
タグが、同定子配列である、請求項4に記載の方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6−1】
image rotate

【図6−2】
image rotate

【図6−3】
image rotate

【図6−4】
image rotate

【図7−1】
image rotate

【図7−2】
image rotate

【図7−3】
image rotate

【図7−4】
image rotate

【図7−5】
image rotate

【図7−6】
image rotate


【公表番号】特表2009−520500(P2009−520500A)
【公表日】平成21年5月28日(2009.5.28)
【国際特許分類】
【出願番号】特願2008−547131(P2008−547131)
【出願日】平成18年12月21日(2006.12.21)
【国際出願番号】PCT/NL2006/000654
【国際公開番号】WO2007/073171
【国際公開日】平成19年6月28日(2007.6.28)
【出願人】(505464888)キージーン ナムローゼ フェンノートシャップ (11)
【Fターム(参考)】