説明

ポリヌクレオチドの並行配列決定のための一定長シグネチャー

オリゴヌクレオチドタグ−DNAシグネチャー配列構築物の固相クローン化ライブラリーを生成するための方法が、開示され、この方法において、そのDNAシグネチャー成分は、すべて同じ長さである。そのようなライブラリーは、供給源集団(例えば、mRNAまたはゲノムDNA)から調製されたDNAシグネチャー配列の大規模並列配列決定のために特に有用である。供給源核酸集団から同一長のシグネチャー配列のライブラリーを調製する方法が、本出願において提供される。

【発明の詳細な説明】
【技術分野】
【0001】
(発明の分野)
本発明は、一般に、ポリヌクレオチドを分類し、そして配列決定する方法に関し、より具体的には、多くのポリヌクレオチドを同時に配列決定する方法(例えば、供給源DNA集団の比較のため)に関する。
【背景技術】
【0002】
(発明の背景)
ポリヌクレオチドの大きな集団の並行配列決定は、ゲノムマッピング、遺伝子同定、医療診断などの分野において有用である。そのような配列決定は、ポリヌクレオチドフラグメントの固相支持されたライブラリーの提供によって促進される。そのライブラリーにおいては、各フラグメントは、クローン性の部分集団中の別個の微粒子に付着される(例えば、Brenner,米国特許第5,604,097号、Brennerら、PCT公開WO96/41011、およびAlbrechtら、米国特許第6,265,163号に開示される)。複数の細胞または組織における遺伝子発現の分析における使用のための、そのようなライブラリーは、目的の細胞または組織から生成されたcDNAライブラリーから構築することができる。個体または個体の集団のゲノムDNAサンプル間の遺伝的多様性の分析のために、ライブラリーを各々の個体から抽出したゲノムDNAから得る。
【0003】
以下に、より十分に説明されるように、そのようなライブラリーを作製する配列のクローン性部分集団は、Brenner、米国特許第5,604,097号および同第5,763,175号、ならびにBrennerら、PCT公開第WO96/41011号に詳細に開示される「固相クローニング」手順、によって形成することができる。手短には、ポリヌクレオチドフラグメントをタグベクター(オリゴヌクレオチドタグのレパートリーを保有する)のライブラリー中に挿入して、タグ−シグネチャー配列結合体のベクターライブラリーを形成する。タグ−シグネチャー結合体を含むベクターを、増幅する。次に、タグ−DNA結合体のタグを、一本鎖にして、そしてタグ−シグネチャー結合体を、微粒子に付着したタグ相補物にハイブリダイズし、そして連結する。
【0004】
次に、ロードした配列を同定し得る。この同定は、支持体に結合した配列の長さに沿って、ヌクレオチドまたはヌクレオチドの短い配列を連続的に同定する段階的な方法によることが好ましい。同定のために、DNAの部分のみが、配列決定される必要がある。多くの場合、その部分は、9ヌクレオチドまたは10ヌクレオチドの程度の小ささであり得る(例えば、Velculescuら、Science 270:484−486(1995)を参照のこと)。そのような配列決定法としては、例えば、Brenner、米国特許第5,604,097号、第5,962,228号、および第5,599,675号に記載される方法が挙げられる。1つの実施形態において、以下およびBrenner、米国特許第6,013,445号、およびAlbrechtら、PCT公開第WO97/46704号に記載されるように、MPSS(大量並行シグネチャー配列決定(massively parallel signature sequencing))によって、配列を並行して同時に同定する。
【0005】
上記の方法は、例えば、米国特許第6,013,445号に記載されるように、核酸集団のシグネチャー配列決定のために使用されている。固相で分類された配列のライブラリーを並行で配列決定して、ライブラリーが由来する核酸集団のシグネチャーまたは「フットプリント」を提供し得る。米国特許第6,265,163号に記載されるように、ライブラリーを、競合的ハイブリダイゼーションによる複数のライブラリーの差示的分析のための参照ライブラリーとしてもまた使用し得る。
【発明の開示】
【発明が解決しようとする課題】
【0006】
以前に報告された、固相にてクローニングされたライブラリーの調製方法において、上記のように、最初に、供給源DNAを制限エンドヌクレアーゼを用いて切断してフラグメントを生成し、次に、これをタグ−ベクターライブラリー中にクローニングする。これらのフラグメントは、長さにおいてかなり多様であり得、処理における(特にPCR増幅工程において、そして、ある程度は、タグ−DNA結合体の相補物含有微粒子へのロードおよび連結において)バイアスをもたらす可能性がある。特に、代表的な制限消化からの核酸フラグメントのPCR増幅は、より長い種に対するバイアスを導入することが予測される。なぜなら、短いDNA分子は、PCRにおいて優先的に増幅されることが公知だからである。
【0007】
本発明は、DNAシグネチャー成分が全て同じ長さであるタグ−DNA構築物またはライブラリーを生成する方法を提供し、そのようにして、配列の増幅に間における、上記のバイアスを除去する。
【課題を解決するための手段】
【0008】
(発明の要旨)
本発明は、1つの局面において、供給源ポリヌクレオチド集団から同一長のシグネチャー配列のライブラリーを調製する方法を提供する。この方法は、以下の工程(以下の章において、より詳細に記載される)を包含する:
(a)ポリヌクレオチドの集団の各々の末端を、第1の制限エンドヌクレアーゼの認識部位を含む第1のアダプタ(以下「Qアダプタ」という)に付着させる工程であって、その結果、そのエンドヌクレアーゼの切断部位は、ポリヌクレオチド内に存在し、
ここで、そのアダプタが付着する末端は、集団中の各ポリヌクレオチドについて同一であり、そして(i)全長cDNA転写物の5’末端、(ii)ポリA/ポリT領域が除去されたcDNA転写物の3’末端、(iii)cDNAを制限エンドヌクレアーゼで切断することによって生成されたcDNAフラグメントの5’末端、および(iv)cDNAを制限エンドヌクレアーゼで切断することによって生成されたcDNAフラグメントの3’末端、から選択される、工程;
(b)ポリヌクレオチドを第1の制限エンドヌクレアーゼで切断して、アダプタ−シグネチャー結合体の集団を産生する工程であって、ここでアダプタ−シグネチャー結合体の各々は、少なくとも6塩基対長であり、新規の切断末端を有する、供給源核酸の同一長のシグネチャー配列を含む、工程;ならびに
(c)シグネチャーの新規の切断末端を、第2の制限エンドヌクレアーゼの認識部位および切断部位を含む第2のアダプタと連結して、アダプタ−シグネチャー−アダプタ構築物のライブラリーを産生する工程。
次に、構築物を、第2のエンドヌクレアーゼと、第1のアダプタを切断するのに有効な制限エンドヌクレアーゼとを用いて切断して、クローニング部位に隣接する同一長のシグネチャーフラグメントのライブラリーを産生し得る。
【0009】
1つの実施形態において、第1の制限エンドヌクレアーゼは、以下にさらに考察するように、IIs型制限エンドヌクレアーゼである。
【0010】
選択された実施形態において、第1のアダプタが付着する末端は:(i)全長cDNAの5’末端、および(ii)ポリA領域が除去された全長cDNAの3’末端から選択される。他の実施形態において、第1のアダプタが付着する末端は:(iii)cDNAを制限エンドヌクレアーゼで切断することによって生成されたcDNAフラグメントの5’末端、および(iv)cDNAを制限エンドヌクレアーゼで切断することによって生成されたcDNAフラグメントの3’末端から選択される。後者の場合、(iii)のcDNAフラグメントの部分は、好ましくは、その供給源核酸集団の3’領域由来である。同様に、(iv)のcDNAフラグメントの部分は、好ましくは、その供給源核酸集団の5’領域由来である。それぞれ供給源核酸集団の3’領域または5’領域を表すこれらフラグメントは、好ましくは、第1のアダプタへの付着後に、他のcDNAフラグメントから単離される。
【0011】
選択された実施形態において、Qアダプタは、上記工程(a)において液相中で付着され;他の実施形態において、反応の1つ以上の成分は、固相支持体に結合する。
【0012】
好ましい実施形態において、少なくとも1つのアダプタ、そして好ましくは各アダプタは、プライマーの結合部位およびポリメラーゼの結合部位を含み、そして、この方法はさらに、工程(c)の後であって、工程(d)の前に、以下の工程を含む:各アダプタ−シグネチャー構築物の底部鎖を除去する工程、および、底部鎖を、逆転写、プライマー伸長、またはPCR増幅によって(好ましくは、PCR増幅によって)再生する工程。
【0013】
一般に、工程(a)での切断された末端は、一本鎖突出を有する。あるいは、突出は、第1のアダプタに連結するまえにフラグメントから除去され、この場合、第1のアダプタは、平滑末端を有する。
【0014】
第2のアダプタは、代表的には、工程(b)において生成された新規の切断末端の一本鎖突出とハイブリダイズするのに有効な、全ての可能な配列の一本鎖の突出を含むアダプタのセットを含む。
【0015】
第1の制限エンドヌクレアーゼは、好ましくは、認識部位から少なくとも10ヌクレオチドにおいて、より好ましくは認識部位から少なくとも16ヌクレオチドにおいて、切断部位を有するIIs型制限エンドヌクレアーゼである。例としては、BpmI、MmeI、GsuI、およびそのイソシゾマーが挙げられる。
【0016】
第2の制限エンドヌクレアーゼは、好ましくは、切断の際に少なくとも2ヌクレオチドの突出を産生する4塩基認識部位を有するIIs型エンドヌクレアーゼである;より好ましくは、第2の制限エンドヌクレアーゼは、切断の際に少なくとも3ヌクレオチドの5’伸長を生じる。例としては、SfaNI、BspMI、BbvI、FokI、BsmFI、BbsI、およびそれらのイソシゾマーが挙げられる。
【0017】
シグネチャー配列を、以下の工程を含むプロセスによって、並行に配列決定し得る:
オリゴヌクレオチドタグを、各シグネチャーフラグメントに付着する工程であって、その結果、実質的に全ての異なるシグネチャーフラグメントが、異なる付着されたオリゴヌクレオチドタグを有し、タグ−シグネチャー結合体を形成する、工程;
タグ−シグネチャー結合体を、タグ相補物のライブラリーと接触させ、ここで、タグ相補物の各々は別個の固相支持体上にあり、そして、タグをその対応する相補物とハイブリダイズさせて、固相に支持されたシグネチャー配列のクローン性の部分集団を形成する工程;ならびに、
複数の固相に支持されたシグネチャー配列を配列決定する工程。
好ましい実施形態において、シグネチャーを含む挿入物を、オリゴヌクレオチドタグ−ベクターのライブラリー中に連結し、ここで、各タグ−ベクターは、以下を含む:左側制限切断部位、オリゴヌクレオチドタグ、シグネチャーフラグメントの挿入のためのクローニング部位、および右側制限切断部位を含み;それによってタグ−シグネチャー結合体のベクターライブラリーを形成し、次に、そのベクターを宿主生物において複製する。
【0018】
好ましくは、タグ−ベクターライブラリー中の異なるオリゴヌクレオチドタグの数は、異なるフラグメントの数よりも少なくとも100倍多く、このプロセスは、さらに、ベクターライブラリーからサンプルを取り、その結果、サンプル内の実質的に全ての異なるポリヌクレオチドフラグメントが、付着した異なるタグを有する工程を包含する。
【0019】
増幅したタグ−シグネチャー構築物のさらなる処理を、以下のように、構築物を固相支持体上にロードすることによって行い得る:好ましくは、蛍光標識したプライマーおよびビオチン化したプライマーを使用して構築物のサンプルのPCRにより増幅し、そしてストレプトアビジン捕捉による増幅物を精製する工程;タグ−シグネチャー結合体のベクターからの切断工程;タグ−シグネチャー結合体のタグ成分の底部鎖の除去工程;タグ−シグネチャー結合体とタグ成分のライブラリーとの接触工程であって、ここで、タグ成分の各々が別個の固相支持体上にあり、これによって、一本鎖タグをその対応する相補物にハイブリダイズする;および、シグネチャーフラグメントの底部鎖をタグ相補物に連結する工程;それによって、供給源ポリヌクレオチド集団からの各同一長シグネチャー配列の、固相に支持されたクローン性の部分集団を含むライブラリーを形成する。
【0020】
蛍光標識(PCRの間に、取り込まれる、上記)を使用して、FACS(蛍光細胞分析分離)によって、固相支持体にロードしていないものからロードしたものを分類し得、次に配列決定の前に除去され得る。
【0021】
代替的なロードプロセスにおいて、PCR増幅工程は、省略され、タグ−シグネチャー構築物を、ベクター骨格から切断して単離し(例えば、電気泳動分離による)、そして蛍光アダプタを、タグ−シグネチャー結合体に連結し、その後、タグを「ストリッピング」し、上記のように固相支持体にハイブリダイゼーションして、連結する。
【0022】
そのようなロードのなお別の方法は、以下:
i)タグ−シグネチャー結合体を含むベクターを直鎖状にする工程;
ii)上部鎖を、インビトロ転写(第1のビオチン標識化プライマーを使用する、底部鎖の逆転写)によって複製し、そして、第2のビオチン標識化プライマーを用いて、上部鎖の第2鎖の合成を行う工程;
iii)左側制限切断部位において、ベクターを切断し、それによって、第1のビオチン標識を除去する工程;
iv)第2のビオチン標識を、ストレプトアビジン支持体に結合させ、そして上部鎖を支持体から除去する工程;
v)プライマーをシグネチャーの3’側にある各上部鎖の領域にアニーリングさせる工程;
vi)タグ−シグネチャー構築物の上部鎖をタグ相補物のライブラリーと接触させる工程であって、ここでタグ相補物の各々は、別個の固相支持体上にあり、これによってタグをその対応する相補物にハイブリダイズさせる工程;
vii)上部鎖のシグネチャー部分を複製して、二本鎖シグネチャーを形成する工程;および
viii)シグネチャーを含む鎖をタグ相補物に連結する工程;
のように実施され得、それによって、供給源ポリヌクレオチド集団からの各同一長シグネチャー配列の、固相に支持されたクローン性部分集団を含むライブラリーを形成する。
【0023】
後者の手順の1つの実施形態において、上記のシグネチャーの3’側の領域(工程v)は、その5’末端に制限酵素切断部位を含み、そして、工程viiiの連結の後に、対応する制限酵素を使用して、シグネチャーからその領域を切断する。
【0024】
オリゴヌクレオチドタグを参照して、各タグは、好ましくは、同一の最少に交差ハイブリダイズするオリゴヌクレオチドのセットから選択され;1つの実施形態において、各タグは、複数のサブユニットからなり、各サブユニットは、3〜9ヌクレオチド長のオリゴヌクレオチドからなり、ここで、各サブユニットは、同一の最少に交差ハイブリダイズするオリゴヌクレオチドのセットから選択される。好ましくは、これらサブユニットの各々は、同一の最少に交差ハイブリダイズするセットの全ての他のサブユニットとは、少なくとも3ヌクレオチド異なる。
【0025】
同一長シグネチャーを調製し、そしてそのようなシグネチャーの固相ライブラリーを調製する開示された方法を、各供給源ポリヌクレオチド集団について、そのような固相に支持された複数のシグネチャー配列を配列決定することによって、1つ以上の供給源ポリヌクレオチド集団の比較のために使用し得る。1つの実施形態において、配列決定は、以下にさらに記載されるように、大量並行シグネチャー配列決定(massively parallel signature sequencing、MPSS)によって行われる。
【0026】
そのような配列決定は、差示的に制御される遺伝子または差示的に発現する遺伝子の分析に向けられ得、ここで、供給源集団は、異なる細胞、組織または個体から選択された複数の供給源の各々の発現した遺伝子に由来するcDNAライブラリーである。これはまた、個体中または個体の集団中の遺伝的多様性の分析に向けられ得、ここで、供給源集団は、異なる個体または個体の集団に由来するゲノムDNAライブラリーである。後者の場合、遺伝的多様性は、好ましくは、ゲノムDNA中の既知または予測された、位置または領域において生じる。
【0027】
関連する実施形態において、本発明は、サンプル核酸集団からのシグネチャー配列の並行配列決定における使用のためのキットを提供する。キットの成分は、以下:(i)オリゴヌクレオチドタグベクターライブラリーであって、ライブラリー中の各タグベクターは、以下:左側プライマー結合部位、左側制限切断部位、最少に交差ハイブリダイズするオリゴヌクレオチドのセットより選択されたオリゴヌクレオチドタグ、シグネチャー配列の挿入のためのクローニング部位、右側制限切断部位、および右側プライマー結合部位を含む、ライブラリー;(ii)対応するオリゴヌクレオチドタグ相補物のセットであって、各々は、空間的に別個の固相支持体に結合する、セット;ならびに、(iii)クローニング部位に隣接するシグネチャー挿入物の集団であって、シグネチャー挿入物の各々は、サンプル核酸集団からの同一長のシグネチャー配列を含む、フラグメント、を含む。
【0028】
そのようなキットは、さらに、アダプタ結合部位に結合するのに有効な、右側PCRプライマーおよび左側PCRプライマーを含む。タグベクターはまた、好ましくは、E.coli中での複製のためのプラスミドDNAを含む。
【0029】
サンプル核酸集団からの、同一長シグネチャー配列の調製における使用のためのキットの成分は、開示された方法に従って、以下を含み得る:その認識部位から少なくとも10ヌクレオチドにおいて切断部位を有するIIs型制限エンドヌクレアーゼである第1の制限エンドヌクレアーゼ;第2の制限エンドヌクレアーゼの認識部位を含む第1の二重鎖アダプタ;その第2の制限エンドヌクレアーゼによる、二本鎖cDNAまたは二本鎖cDNAフラグメントの切断によって産生された突出とハイブリダイズするのに有効な一本鎖突出を有する第2のアダプタであって、第2の制限エンドヌクレアーゼの認識部位および切断部位を含むアダプタ;ならびに第2の制限エンドヌクレアーゼ。
【0030】
第2のアダプタは、好ましくは、全ての可能なヌクレオチド配列の、一本鎖の2〜4ヌクレオチド突出、より好ましくは、2ヌクレオチド突出を含むアダプタのセットを含む。代表的には、各アダプタは、プライマー結合部位を含み、そして、キットはさらに、これら結合部位に結合するのに有効なPCRプライマーを含む。
【0031】
本発明のこれらおよび他の目的、ならびに特徴は、以下の発明の詳細な説明を添付の図面とともに読む場合に、より十分に明らかとなる。
【0032】
(発明の詳細な説明)
(1.定義)
以下の用語は、他のように示されない限り、以下の意味を有する。用語「オリゴヌクレオチド」は、本明細書中で使用される場合、モノマー−モノマー相互作用の規則的なパターン(例えば、Watson−Crick型の塩基対形成、塩基スタッキング(stacking)、Hoogsteen型または逆Hoogsteen型の塩基対形成)によって標的ポリヌクレオチドに特異的に結合し得る、天然または改変型のモノマーまたは連結物(デオキシリボヌクレオシド、リボヌクレオシド、それらのαアノマー型、ペプチド核酸(PNA)などを含む)の直鎖オリゴマーを含む。モノマーは、一般には、ホスホジエステル結合またはそのアナログにより連結されて、少数のモノマーユニット(例えば、3〜4個)から数十個のモノマーユニット(例えば、40〜60個)の範囲にわたる大きさのオリゴヌクレオチドを形成する。オリゴヌクレオチドが一連の文字(例えば、「ATGCCTG」)により示される場合は、他のように記載されない限り、そのヌクレオチドは、左から右に5’→3’の順であること、そして「A」はデオキシアデノシンを示し、「C」はデオキシシチジンを示し、「G」はデオキシグアノシンを示し、そして「T」はチミジンを示すことが理解される。通常、オリゴヌクレオチドは、4種の天然のヌクレオチドを包含する;しかし、それらは、非天然ヌクレオチドアナログもまた包含し得る。天然のヌクレオチドまたは非天然ヌクレオチドを有するオリゴヌクレオチドが用いられ得る場合(例えば、酵素により処理される必要がある場合)、通常は、天然のヌクレオチドからなるオリゴヌクレオチドが必要であることは、当業者には明らかである。
【0033】
「相補物」または「タグ相補物」とは、オリゴヌクレオチドタグに関して本明細書中で使用される場合、オリゴヌクレオチドタグが、完全にマッチした二重鎖または完全にマッチした三重鎖を形成するように特異的にハイブリダイズするオリゴヌクレオチドを指す。特異的ハイブリダイゼーションが三重鎖を生じる実施形態において、このオリゴヌクレオチドタグは、二本鎖または一本鎖のいずれかであるように選択され得る。従って、三重鎖が形成される場合、用語「相補物」は、一本鎖オリゴヌクレオチドタグの二本鎖相補物、または二本鎖オリゴヌクレオチドタグ一本鎖相補物のいずれかを包含することになっている。
【0034】
二重鎖に関して「完全にマッチした」とは、二重鎖を作るポリヌクレオチド鎖またはオリゴヌクレオチド鎖が、各鎖中の全てのヌクレオチドがもう一方の鎖中のヌクレオチドとWatson−Crick塩基対形成するように、互いに二本鎖構造を形成することを意味する。この用語はまた、用いられ得るヌクレオシドアナログ(例えば、デオキシイノシン、2−アミノプリン塩基を有するヌクレオシドなど)の対形成を包含する。三重鎖に関して、この用語は、その三重鎖が、完全にマッチした二重鎖と第3鎖とからなり、その三重鎖において、全てのヌクレオチドが、その完全にマッチした二重鎖の塩基対とHoogsteen会合または逆Hoogsteen会合することを意味する。逆に、二重鎖におけるタグとオリゴヌクレオチドとの間の「ミスマッチ」は、その二重鎖または三重鎖におけるヌクレオチドの対またはトリプレット(triplet)が、Watson−Crick結合および/またはHoogsteen結合および/または逆Hoogsteen結合をし損なうことを意味する。
【0035】
本明細書中に用いられる場合、「ヌクレオシド」は、2’−デオキシ型および2’−ヒドロキシル型(例えば、KornbergおよびBaker、DNA Replication、第2版(Freeman)San Francisco,1992)に記載されるような)を含む、天然ヌクレオシドを含む。ヌクレオシドに関して「アナログ」とは、改変された塩基部分および/または改変された糖部分を有する合成ヌクレオシド(例えば、Scheit,Nucleotide Analogs(John Wiley,New York,1980);UhlmanおよびPeyman,Chemical Reviews,90:543−584(1990)などに記載された)を、それらが特異的ハイブリダイゼーションをし得るという条件付きで含む。このようなアナログは、結合特性を増強し、複雑度を低減し、特異性を増すなどのために設計された合成ヌクレオシドを包含する。
【0036】
ポリヌクレオチドの末端への「アダプタの付着」とは、(好ましくは溶液相における)そのアダプタの連結を指し得るか、またはこれは、そのポリヌクレオチドの合成中に使用されるプライマー中にそのアダプタを使用し、それによりそのポリヌクレオチドの末端にそのアダプタを組み込むことを包含し得る。
【0037】
「供給源核酸集団の5’領域由来」のフラグメントとは、好ましくは、その核酸集団の(一般的には、制限エンドヌクレアーゼによる)切断によって調製されるフラグメント集団の最も5’側のフラグメントにあるDNAを含むか、またはそのDNAからなる。「供給源核酸集団の3’領域由来」のフラグメントとは、同様に規定され得るが但し、mRNAおよびcDNAの場合、3’ポリA/ポリT領域(tract)は除外される。
【0038】
(II.オリゴヌクレオチドタグ)
オリゴヌクレオチド「タグ」が、本発明の方法における使用のために、固相支持体(好ましくは、微粒子)に付着したDNA集団を構築するために使用され得る。そのようなタグ、ならびにその調製方法および使用方法は、PCT公開番号WO96/41001およびWO96/12014ならびに共有に係る米国特許第5,604,097号に詳細に記載される。上記に引用される公開物に記載されるように、そのタグは、オリゴヌクレオチドの最少交差ハイブリダイズするセットから選択される。そのようなセットのうちのいずれか2つのオリゴヌクレオチドタグの配列は、常に、少なくとも2ヌクレオチド、好ましくは3ヌクレオチド、異なる。そのようなセットのメンバーは、2つ(または3つ)未満のミスマッチしたヌクレオチドを含む、同じセットの別のメンバーの相補物とは、二重鎖も三重鎖も形成し得ない。好ましくは、最少交差ハイブリダイズするセットは、二重鎖の安定性に対して、そのセット中の他のどのサブユニットともほぼ等しい寄与をなすサブユニットを含む。このように、あらゆるサブユニットとその相補物との間の完全にマッチした二重鎖の安定性は、ほぼ等しい。
【0039】
最少交差ハイブリダイズするセットの好ましい実施形態は、4種の天然ヌクレオチドのうちの3種からサブユニットが作製されるセットである。以下に考察するように、オリゴヌクレオチドタグ中に1つの型のヌクレオチドが存在しないことは、標的ポリヌクレオチドが、DNAポリメラーゼの5’→3’エキソヌクレアーゼ活性の使用によって固相支持体上にロードされることを可能にする。
【0040】
以下は、A、G、およびTからなる群より選択される4つのヌクレオチドを各々が含むサブユニット(「ワード」)の例示的な最少交差ハイブリダイズするセットである:
【0041】
【化1】

このセットにおいて、各メンバーは、他のどのメンバーの相補物とも、3つのミスマッチした塩基を有する二重鎖を形成する。
【0042】
分類および固相クローニングのためのオリゴヌクレオチドタグは、長さが12ヌクレオチド〜60ヌクレオチドもしくは12塩基対〜60塩基対、好ましくは18ヌクレオチド〜40ヌクレオチドもしくは18塩基対〜40塩基対、より好ましくは25ヌクレオチド〜40ヌクレオチドもしくは25塩基対〜40塩基対の範囲であり得る。分類および固相クローニングのための一本鎖オリゴヌクレオチドタグのレパートリーは、好ましくは、少なくとも100個のメンバー、より好ましくは少なくとも1000個のメンバー、そして最も好ましくは少なくとも10,000個のメンバーを含む。オリゴヌクレオチドタグおよびタグ相補物に関して本明細書中で使用される場合、用語「レパートリー」とは、固相クローニング(分配)または同定のために使用される、異なるオリゴヌクレオチドタグまたはタグ相補物の総数を意味する。オリゴヌクレオチドタグが分類のために使用される場合、それらのオリゴヌクレオチドタグは、(好ましくは固相支持体に結合している)タグ相補物にハイブリダイズされる。そのようなタグ相補物は、固相支持体(例えば、微視的なビーズ)の表面上でかまたは単一支持体上の合成位置アレイの特定の位置上で、合成され得、その結果、同一配列の集団または実質的に同一の配列の集団が、特定の領域中で生成される。
【0043】
好ましくは、タグ相補物は、微粒子上で組み合わせ的に合成され、その結果、各微粒子は、同じタグ相補物の多くのコピーを結合している。広範な種類の微粒子支持体が、本発明とともに使用され得、そのような支持体としては、当該分野で公知であるような、細孔性ガラス(controlled pore glass)(CPG)製の微粒子、高度架橋ポリスチレン製の微粒子、アクリルコポリマー製の微粒子、セルロース製微粒子、ナイロン製微粒子、デキストラン製微粒子、ラテックス製微粒子、ポリアクロレイン製微粒子などが挙げられる。
【0044】
好ましくは、混合物中のタグ相補物は、組み合わせ的に合成されようと、または個別に合成されようと、互いに類似する二重鎖安定性または三重鎖安定性を有するように選択され、その結果、完全にマッチしたハイブリッドが、類似する融解温度または実質的に同一の融解温度を有する。この特徴によって、ミスマッチしたタグ相補物を、ハイブリダイゼーション工程において(例えば、ストリンジェントな条件下での洗浄工程によって)完全にマッチしたタグ相補物からより容易に区別することが可能になる。
【0045】
分類における使用のための例示的タグライブラリーが、以下に示される(配列番号1)。
【0046】
【化2】

上記タグレパートリーは、[(A,G,T)]により示され、これは、上記に記載されるような、8つの連結された4ヌクレオチドの「ワード」を示し、この「ワード」は、上記にように、示される3種のヌクレオチドを含み、そして最少交差ハイブリダイズするセットから選択される。このオリゴヌクレオチドタグの隣接領域は、クローニングベクター中への簡便な挿入およびクローニングベクターからの簡便な切り出しのために、上記に例証されるように、制限部位を含むように操作され得る。必要に応じて、左のプライマーまたは右のプライマー(配列番号3および配列番号2)は、(従来の試薬(例えば、Clontech Laboratories,Palo Alto,Calif.から入手可能)を使用して)ビオチンを付着させて合成され得、増幅および/または切断後の精製が容易になり得る。好ましくは、タグ−フラグメント結合体を作製するために、上記ライブラリーが、従来のクローニングベクター(例えば、pUC19など)中に挿入される。必要に応じて、そのタグライブラリーを含むベクターは、「スタッファー(stuffer)」領域「XXX...XXX」を含み得、これは、例えば、BamHIおよびBbsIで完全消化されたフラグメントの単離を容易にする。シグネチャーの固相クローニングのための例示的なタグベクターが、以下の実施例1に示される(配列番号16)。
【0047】
ライブラリー(例えば、cDNAライブラリーまたはゲノムライブラリー)中のDNA配列集団を、分類し、そして微粒子または固相支持体の別個の領域へ付着させることは、各微粒子または領域が、実質的に1種類だけの付着した配列を有するように、すなわち、それらのDNA配列が、クローン性の部分集団中に存在するように、実行される。
【0048】
好ましくは、それらのDNA配列のうちの少なくとも95%が、付着した独特の(unique)タグを有する。この状態は、以下にさらに記載されるように、ポリヌクレオチド集団より実質的に大きいタグレパートリーを使用すること、そしてタグ化ポリヌクレオチドの全集合(ensemble)からタグ化ポリヌクレオチドの十分に小さいサンプルを得ることによって、達成される。(同一のDNA配列が異なるタグを有することが許容される。なぜなら、これは、ただ単に二回操作または分析される同じDNA配列を生じるのみだからである)。そのようなサンプリングは、例えば、タグをDNA配列に結合した後に、小容量をより大きな混合物から得ることによって、明白に実行され得るか、このようなサンプリングは、DNA配列およびタグを処理するために使用される技術の二次的効果として固有に実行され得るか、またはサンプリングは、明白にかつ処理工程の固有部分として実行され得る。
【0049】
好ましくは、DNA配列は、その配列を、上記のような、タグライブラリーを保有する従来のクローニングベクター中に挿入することによって、オリゴヌクレオチドタグに結合される。サンプルが、増幅および分類のためにこのライブラリーから得られる。サンプリングは、そのライブラリーの連続希釈によってか、またはプラスミド含有細菌宿主をコロニーから単に釣菌することによって、達成され得る。増幅後、そのタグ−DNA結合体は、そのプラスミドから切り出され得る。
【0050】
そのDNA−タグ結合体は、タグとその相補物との間での完全にマッチする二重鎖の形成を支持する条件下で、そのタグ相補物を含む微粒子と(例えば、図5Aに示され、以下に考察されるように)混合される。これらの条件を生成するための広範な指針が、文献中に存在する。例えば、Wetmur,Clitical Reviews in Biochemistry and Molecular Biology,26:227〜259(1991)およびSambrookら、Molecular Cloning:A Laboratory Manual,第2版(Colg Spring Harbor Laboratory,New York,1989)を参照のこと。好ましくは、そのハイブリダイゼーション条件は、完全にマッチする配列だけが安定な二重鎖を形成するために十分にストリンジェントである。そのような条件下で、そのタグ全体にわたり特異的にハイブリダイズしたポリヌクレオチドは、微粒子に付着している相補的配列に連結され得る。最後に、その微粒子は、未連結タグおよび/またはミスマッチタグを有するポリヌクレオチドを除去するために洗浄される。
【0051】
(III.固相クローン化ライブラリーの調製)
(A.シグネチャ−配列挿入物の調製)
本明細書中に記載されるシグネチャーは、一般的に、cDNAに由来する。従来の方法に従うcDNAライブラリーの調製のために、mRNAが、従来技術を使用して、目的とする各細胞供給源または組織供給源から抽出され、そしてcDNAへと変換される。このような従来技術は、例えば、Sambrookら、Molecular Cloning:A Laboratory Manual,第2版(Cold Spring Harbor Laboratory,New York);Schenaら、Science 270:467〜470(1995);DeRisiら、Science 278:680〜686(1997)に開示される。好ましくは、cDNAの第1鎖は、5’ビオチンと、mRNA鎖へのアニリーングのためのポリ(dT)領域とを有するプライマーを使用して、4種のdNTPの存在下で、逆転写酵素を用いて合成される。望ましい場合、そのcDNAは、dCTPの代わりにメチル−dCTPを使用することによってメチル化され得、後の工程において、メチル感受性制限エンドヌクレアーゼによる望ましくない切断が防止され得る。特定の他の改変が、下記のシグネチャー配列を調製するための別のプロトコルに従って使用され得る。
【0052】
本発明の方法は、付着したcDNA中に切断部位がある制限酵素認識部位を有する、第1アダプターを使用する。そのような酵素の最も一般的で広範に利用されているのは、IIs型制限酵素である。この定義中に入る他の種類の酵素としては、IIb型制限酵素が挙げられ、この酵素は、二分され中断されている認識部位を有し、そしてその認識部位の両方の側の両方のDNA鎖を切断し、それにより、その認識部位は、そのDNAから切り出される。これらの酵素のうち、以下の第F節においてさらに考察されるBcgIが、市販されている。III型制限酵素は、非パリンドローム認識部位を有し、その認識部位から約25塩基にて切断が生じる。IIe制限酵素としては、IIs型として分類されるが遅い切断部位または抵抗性の切断部位を示す酵素が、挙げられる。これらの部位での効率的な切断は、その酵素の遠位の非触媒部位に、別の(アフェクター)認識配列が結合することによって、達成され得る。
【0053】
(A1.cDNAの3’末端を示すフラグメント由来のシグネチャー)
上記の方法の一実施形態において、シグネチャー配列が、全長cDNAの3’末端を示すcDNA制限フラグメントから調製される。例示的方法が、図1に示される。この実施形態はまた、図6に示されるフローチャートに示され、実施例1において詳細に記載される。
【0054】
第2鎖合成の後、cDNAが、2塩基認識部位〜4塩基認識部位(好ましくは、4塩基認識部位)を有する制限エンドヌクレアーゼを用いて消化される(10)。適切なエンドヌクレアーゼとしては、例えば、NlaIII、DpnII、ChaI、Csp6I、およびそれらのイソシゾマーが挙げられる。本明細書中に記載されるプロセスにおけるこの工程および他の工程のために適切な他の酵素は、当業者によって決定され得る。この工程は、図1に示されるような、(好ましくは3’突出を有する)切断末端を有する二本鎖フラグメント集団を生成するために、有効である。
【0055】
望ましい場合、この段階において、その3’突出は、例えば、T4 DNAポリメラーゼを使用して除去され得て、平滑切断末端が生成され得る。下記の工程から明らかであるように、この工程は、より長い独特のシグネチャー配列を生じる。しかし、処理を簡単にするために、この3’突出は、一般に保持される。
【0056】
第1アダプタ(Qアダプタと呼ばれる)が、その後、上記切断末端と連結される(12)。(図1におけるアダプタ中の領域およびcDNA中の領域は、一般に比例(sclae)するように示されていないことに留意されたい)。このアダプタは、上記突出が除去されていない限り、上記切断末端における突出と相補的な突出を含み、上記突出が除去されている場合、平滑末端アダプタが使用される。このQアダプタはまた、そのDNA中の切断部位を有する制限エンドヌクレアーゼの認識部位(一般には、IIs型制限エンドヌクレアーゼの認識部位)を含み、このQアダプタは、その認識部位から少なくとも10ヌクレオチドに、好ましくはその認識部位から少なくとも16ヌクレオチドに、切断部位を有する。適切なIIs型酵素としては、例えば、BmpI、MmeI、GsuIおよびそれらのイソシゾマーが挙げられる。
【0057】
例えば、図1のアダプタは、MmeIの認識部位を含み、3’方向に20ヌクレオチドの位置に切断部位を有し、この場合、この切断部位は、制限フラグメント中に16ヌクレオチドである。MmeI部位を有する例示的アダプタの上部鎖および底部鎖が、対応するPCRプライマーとともに、以下に示される(配列番号4〜6)。
【0058】
(QM2アダプタおよびプライマー(MmeI用))
【0059】
【化3】

部分的(下記を参照のこと)MmeI部位を有する第2の例示的Qアダプタが、対応するPCRプライマーとともに以下に示される(配列番号7〜8):
【0060】
【化4】

上記アダプタおよび制限エンドヌクレアーゼは、IIs型エンドヌクレアーゼの認識部位が、上記cDNAの初期消化に使用される酵素の認識および切断部位と重複するように、選択され得る。例えば、上記配列番号8を有するアダプタが、最初の塩基Cを有する認識部位を有するエンドヌクレアーゼ(例えば、認識部位CATGを有するNlaIII)とともに使用される場合、MmeIの認識部位(TCCRAC)は、この認識部位と1ヌクレオチド重複する。結果として、以下にさらに記載されるように、切断の際に生成されるシグネチャー配列(以下に太字で示される)は、(図1に示される実施形態におけるように)16ヌクレオチドではなく、17ヌクレオチド、フラグメント中に延びる。
【0061】
【化5】

BpmIを有するさらなる例示的Qアダプタが、対応するPCRプライマーとともに、以下に示される(配列番号11〜12):
(Qアダプタおよびプライマー(BpmI用))
【0062】
【化6】

上記Qアダプタの上部鎖は、例えば、チオヌクレオチドの使用によってか、または(上記QM2topについて示されるように)小さい5’突出によって、その5’末端にて保護される。このことは、後の工程におけるエクソヌクレアーゼによる鎖の切断を防ぐ。
【0063】
図1を継続して参照すると、その後、cDNAの3’末端を示すフラグメント−アダプタ構築物が、ビオチン標識を介して、ストレプトアビジン支持体(例えば、Dynabeads M−280(Dynal,Oslo,Norway))に結合される(14)。この操作は、cDNAの3’末端を示すフラグメントを、ビオチン標識を含まない他のフラグメントから単離するために役立つ。
【0064】
IIs型制限エンドヌクレアーゼを用いる切断(16)は、各々が均一な長さすなわちシグネチャー配列を含む、供給源cDNAの切断フラグメントを生じる。MmeI切断を使用する図1の実施形態において、新しく切断された末端は、2塩基の3’突出を有する。その後、このアダプタ−シグネチャーフラグメントは、ストレプトアビジン支持体から溶出することによって単離され得る。
【0065】
(A2.cDNAの3’末端由来のシグネチャー(signature))
別の実施形態において、mRNAの3’末端のポリアデニル化領域が取り除かれ、上述のQアダプターが、対応するcDNAの残りの3’末端にライゲーションされる。
【0066】
図2Aに示されるように、ポリA領域の除去の1つの方法において、第1鎖のcDNA合成が、ビオチン−アダプター−オリゴ(dT)プライマーを使用して行われる(30)。上述のように、Qアダプターは、代表的には、II型の認識部位を含み、そのために、Qアダプター−cDNA結合体がそれぞれのII型酵素で切断される場合に、cDNA内、好ましくはcDNAの少なくとも6塩基対の内側で、切断が起きる。下でさらに考察するように、第2の認識部位がまた、後の構築物からのQアダプターの切断のために含まれ得る。
【0067】
第2鎖の合成は、上述の5−メチルシトシンを使用して行われる(32)。この二本鎖cDNAのII型酵素による切断(34)は、図2Aに示すように、ポリA領域を除去するために有効である。次いで、切断されたポリAを含むフラグメントは、ビオチン標識を介して除去され得る(34)。
【0068】
次いで、II型認識部位を含む第2のアダプターが、cDNAの切断された3’末端にライゲーションされる(36)。上述のように、認識部位を認識する酵素は、好ましくは、その認識部位から少なくとも10ヌクレオチド、および好ましくはその認識部位から少なくとも16ヌクレオチドに切断部位を有する。適切な酵素としては、例えば、BmpI、MmeI、GsuI、およびそれらのイソシゾマーが挙げられる。また、アダプターは、好ましくは、増幅のためのPCRプライマー部位および/または精製のためのビオチンを含む。II型酵素による切断(38)は、3’シグネチャーに連結されたQアダプターを与える。
【0069】
この方法において、2つのアダプターでの認識部位の配置は、所望の部位での切断を起こし、シグネチャーがcDNAの3’末端付近の異なる領域で捕捉されることを可能にするために、変更され得る。
【0070】
図2Bに示されるように、mRNAからポリAテイルを切断するための代替的な手順において、第1鎖cDNA合成(40)が、ビオチン−オリゴ(dT)−(rT)ハイブリッドプライマーによってプライミング(prime)される。このハイブリッドプライマーは、プライマーの3’末端に、またはその付近に、リボヌクレオチド(rT)の短い配列(約24個までのrTが使用され得るが、好ましくは1〜3個のrT、より好ましくは1つのrT)を有する。第2鎖の合成(42)は、上述のように、5−メチルシトシンを使用して行われる。次いで、アダプターのリボヌクレオチド部位が、RNaseHによってニックが入れられ、ポリA領域が、S1ヌクレアーゼによって消化され、平滑末端が精製される(44)。平滑末端Qアダプターは、II型認識部位を含み、平滑な3’末端にライゲーションされる(46)。それぞれのII型酵素による切断(48)によって、アダプターに連結された3’シグネチャーが提供され、これは、アダプター中に取り込まれたビオチンを介して精製され得る。
【0071】
(A3.cDNAの5’末端由来のシグネチャー)
別の実施形態において、シグネチャーは、cDNA、好ましくは全長cDANの5’末端から調製される。これらの5’シグネチャーは、プロモーター、エンハンサー、および転写開始部位に関する配列情報を提供し得る。3’シグネチャーから得られた情報と組合わせた場合、5’配列情報はまた、完全な転写物を延びるPCRプライマーの設計を可能にすることで、全長cDNAの配列決定を容易にし得る。定量的な転写物レベルが、より詳細に決定され得る。
【0072】
さらに、制限酵素によるフラグメントよりも全長cDNAの末端(3’または5’のいずれか)由来のシグネチャーの誘導によって所定の制限酵素部位を含まないcDNAへのアクセスが可能になる。
【0073】
5’シグネチャーは、QアダプターをcDNA、代表的には全長cDNAの5’末端へ結合することによって調製され得る。上述のように、Qアダプターは、好ましくは、cDNA内に対応する切断部位を有するII型制限酵素部位を有し、また、下でさらに考察するように、後の構築物からのQアダプターの切断のための第2の認識部位も含み得る。種々の方法が、mRNAの5’末端にアダプターを結合するために使用され得る。
【0074】
図3Aに示されるように、1つの方法に従って、ビオチンは、mRNAの3’末端および5’末端に存在するジオール構造を利用することによって、mRNAの5’末端に結合され、必要に応じて3’末端にも同様に結合される(例えば、Y.Hayashizakiら,米国特許第6,174,669号を参照のこと)。第1鎖cDNAの合成は、オリゴ(dT)プライマーを使用して行われ(50)、上述のように、後の工程で使用される制限酵素によるcDNAの切断を防止するために、メチル−dCTPがdCTPの代替として使用され得る。
【0075】
次いで、DNA/RNAハイブリッドの集団が、一本鎖RNAを切断するRNAseIで処理される(52)。従って、図に示されるように、5’ビオチンは全長mRNAを含む二重鎖に対してのみ保持される。これらの二重鎖は、ストレプトアビジンビーズと接触させることで単離され得る(54)。
【0076】
次いで、RNA鎖が、RNAseHで消化され(56)、第2鎖cDNAの合成が行われる。これは種々の方法で行われ得る;例えば、1つの方法において、末端デオキシヌクレオチジルトランスフェラーゼ(deoxynucleotidyl transferase)を使用して、第1鎖cDNA(この時点では、ビーズから解放されている)が、5’末端において、オリゴ(dG)(または、(dC))でホモテイル(homotail)される(56)。次いで、オリゴ(dG)(または、それぞれ(dC))突出部(overhang)を有し、好ましくは後の精製、プライミング、および最終的な除去のための要素を含む二本鎖のQアダプターが、5’末端へアニーリングされる(58)。第2鎖cDNAの合成は、DNAポリメラーゼIを使用して行われる(60)。
【0077】
あるいは、別の方法において、ニック翻訳による第2鎖の合成のために、ハイブリッド中のRNA鎖にニックを入れるために、RNAseHが使用される。次いで、Qアダプター−オリゴ(dC)およびニックの入ったRNAによってプライミングされたフラグメントをシールするために、T4 DNAリガーゼが使用される。
【0078】
II型酵素による切断(62)により、cDNA内で切断され、示されるように、5’シグネチャーに連結したアダプターが得られる。好ましくは、Qアダプターは、結合部分(例えば、精製のためのビオチンおよび/または増幅のためのプライマー結合部位)を含む。
【0079】
好ましくは全長cDNAに由来する5’シグネチャーを作製するための第2の方法(図3B)は、例えば、A.Chenchikら,米国特許第5,962,272号に記載されるように、「テンプレートスイッチングオリゴヌクレオチド」を利用する。テンプレートスイッチングオリゴヌクレオチドは、短いdG配列(添加された短いdC配列を、逆転写酵素によって第1鎖cDNAの3’末端へ結合させるため)、および選択した配列(例えば、II型認識部位およびプライマー部位が挙げられる)を有するアダプターを含む。オリゴヌクレオチド(例えば、図3Bの「Qアダプター−GGG」)は、第1鎖の合成(70)の間に、逆転写酵素のための伸長した鋳型を作成し、第1鎖cDNAの3’末端にアダプター配列を取り込ませる。
【0080】
アダプター中のプライマー配列に相補的なプライマーが、第2鎖の合成(72)のために使用され、それによって、第2鎖cDNAの5’末端にQアダプターが取り込まれる。好ましくは、Qアダプターは、結合部分(例えば、精製のためのビオチン)を含む。(あるいは、ビオチンは、第1鎖の合成の間にオリゴdTプライマーを介して取り込まれ得る。3’末端または5’末端のいずれかでのビオチンの使用は、所望の精製スキームによって決定される。)上述のように、II型酵素による切断(74)は、cDNA内を切断し、示されるように、5’シグネチャーに連結されたアダプターを与える。
【0081】
第3の方法は、不完全なcDNA転写物も含む調製物から全長cDNAを単離について、K.Maruyamaら(Gene 138:171−174,1994)およびS.Katoら(Gene 150:243−50,1994)によって記載された戦略の変法を利用する。この方法(図3C)に従って、mRNAサンプル中の任意のキャップされていない(全長ではない)mRNA種が、仔ウシ小腸のホスファターゼを使用して脱リン酸化される(80)。次いで、全長mRNAの5’キャップ構造が、タバコ酸ピロホスファターゼ(TAP)によって除去されて、5’リン酸基が残る(82)。II型認識部位、および好ましくは精製のためのビオチンを含むアダプターが、これらの5’リン酸化末端にライゲーションされる(84)。この時点で、ビオチンが、これらの配列をキャップされていないmRNAから単離するために使用され得る。
【0082】
次いで、従来の手順に従って、ビオチン化オリゴ(dT)プライマーおよび5−メチルシトシンを用いて第1鎖cDNAの合成が行われる(86)。mRNAをRNAseで除去し、次に5−メチルシトシンを用いて第2鎖cDNAの合成を行う(88)。次いで、二本鎖cDNAをII型エンドヌクレアーゼで切断して(90)、5’シグネチャーに連結したQアダプターを得る。
【0083】
(A4.cDNAの5’末端を表すフラグメント由来のシグネチャー)
全長cDNAの5’捕捉を用いる上述の方法はまた、cDNAの3’末端を表すフラグメントからシグネチャーを調製するために図1に示された工程と類似の工程を用いることで、cDNAの5’末端を表すフラグメントからシグネチャーを提供するように改変され得る。図3Aに示されるプロセスに基づくプロセスの例が、図4に示される。
【0084】
図3Aのプロセスは、第1鎖cDNAの5’−オリゴ(dG)テイルの作製を介して、行われる(56/106)。この時点で、第2鎖の合成が、ビオチン−オリゴ(dC)プライマーを用いて行われ(108)、二本鎖cDNAを制限エンドヌクレアーゼ、好ましくは4−切断エンドヌクレアーゼ、および好ましくは粘着末端(例えば、2塩基突出部または4塩基突出部)を生成するエンドヌクレアーゼで消化する(110)。例としては、セクション1Aで考察した制限酵素(例えば、NlaIII、DpnII、ChaIおよびCsp6I)が挙げられる。
【0085】
次いで、II型エンドヌクレアーゼのための認識部位を含み、フラグメントの切断した3’末端にアニーリングするように設計されたQアダプターが、フラグメントにライゲーションされる(112)。次いで、示されるように、cDNAの5’末端を表すフラグメントを、例えばストレプトアビジンビーズ上で、ビオチン化プライマーを介して単離し得る(112)。II型エンドヌクレアーゼでの切断(114)によって、アダプターに連結したcDNAの5’末端を表すシグネチャーが作製される。
【0086】
(B.クローニング部位の調製)
微粒子に取り付けられたシグネチャー配列のクローンの部分集団は、例えば、同有に係る米国特許第6,265,163号に記載されるプロセスから適合された図5A〜Bに示したプロセスを使用して調製され得る。上述のように、本発明の方法は、各クローンの部分集合における同じ長さのシグネチャー配列(例えば、図5Aの140で示される)という利点を提供する。シグネチャー配列は、好ましくは、少なくとも6、より好ましくは少なくとも12ヌクレオチド(または塩基対)の長さである。
【0087】
図1を続いて参照して、シグネチャー−Qアダプター結合体の精製の後で、Rアダプターと名付けた第2のアダプターが、II型エンドヌクレアーゼによって切断された切断末端にライゲーションされる(18)。このセクションおよび以下のセクションに記載される操作は、図2〜4に示されるように、本発明の他の実施形態に従って調製された同じ長さのシグネチャーにも適用され得ることに注意のこと。例えば、切断末端は3’末端よりも5’末端である場合に、いくつかの改変が必要であり得、これは当業者にとって明らかである。
【0088】
Rアダプターは、II型酵素による切断によって生成された突出部とハイブリダイズするために有効である一本鎖の突出を有する。従って、Rアダプターは、好ましくは、切断末端の突出部(図1でNNとして太字で示される)とハイブリダイズするために有効である全ての可能性のある配列の一本鎖突出部を含む、複数のアダプターである。
【0089】
Rアダプターはまた、さらなる制限エンドヌクレアーゼのための認識部位を含み、この制限エンドヌクレアーゼは、好ましくはまたII型酵素であり、切断の際に、好ましくは少なくとも2ヌクレオチド、より好ましくは少なくとも3ヌクレオチドの5’伸長部を作製する。この制限エンドヌクレアーゼはまた、メチル感受性エンドヌクレアーゼであり得る。適切な例としては、SfaNI、BspMI、BbvI、FokI、BsmFI、BbsI、およびそれらのイソシゾマーが挙げられる。
【0090】
SfaNI認識部位を有する例示的なRプライマーが、以下(それぞれ、配列番号13、14および9)に示され、ここで、NNは全ての可能性のある2ヌクレオチド配列を表す。
【0091】
(R4アダプターおよびプライマー)
【0092】
【化7】

アダプターはまた、アダプターのダイマーが、アダプターのサインに対するライゲーションの間に副生成物として形成され、適切な制限エンドヌクレアーゼでの処置によりすぐに切断され得るように設計され得る。例えば、上記のアダプターのダイマーは、以下の式を有し:
【0093】
【化8】

酵素BsaJIにより切断され得、これは認識部位および切断部位GGN^NCCを有する。
【0094】
好ましい実施形態において、NN部位でのトップ鎖とボトム鎖との間の相補性の正確さを確実にするために、アダプター−サイン−アダプター構築物のボトム鎖(これは、この部位でのミスマッチを含み得る)を除去する(例えば、T7エンドヌクレアーゼにより)(20)。(これは、上のセクションA1で記載される実施形態についての図1において示され、そして本明細書中で記載される任意の他の方法により調製されるサインに適用され得る。)次いで、トップ鎖が、好ましくはPCR増幅(22)により、複製される。従って、QおよびRアダプターは、好ましい実施形態において、上の例示的なアダプターのように、PCRのためのプライマー結合部位を含む。あるいは、鎖が、直線状プライマー伸長により、またはT7ポリメラーゼのようなRNAポリメラーゼにより、複製され得、この場合、アダプターの1つは、ポリメラーゼ結合部位を含む。
【0095】
次いで、構築物は、第3の制限エンドヌクレアーゼで切断され(24)、Rアダプターを切断し、そしてQアダプターを切断することによりサインの構築物5’を切断するのに有効なエンドヌクレアーゼにより切断される。(図1に示される実施形態について、これは下で考察されるようにcDNA制限フラグメントを生成するために初めに使用される酵素であり得る。他の実施形態において、Qアダプターは、サインからの切断のための別個の制限部位を含むように設計され得る。)この工程は、クローニング部位により隣接される同じ長さのサイン配列(図1においてNNNN...により表される)を生じる。
【0096】
Qアダプターは、第3の制限エンドヌクレアーゼでの切断が、配列番号8(Qアダプター)について示されるように、両方のアダプターを切断し、下のQアダプター−サイン−Rアダプター構築物(配列番号10)に組み込まれるように設計され得る。例示的なQアダプターは、酵素が両方のアダプターを切断するように配置される第3の制限エンドヌクレアーゼ、SfaNIについての認識部位を含む。
【0097】
【化9】

供給源ポリヌクレオチドから得られる同じ長さのサイン配列が、第1のアダプターおよび/または第2のアダプターのいくつかの残っているフラグメントにより隣接され得ることに注意のこと;しかし、このようなアダプターフラグメントを含めて、全体の構築物が、同様の均一な長さである。一般に、本明細書中で使用されるような、「サイン」は、供給源ポリヌクレオチドから得られる配列のみをいい、「サインフラグメント」は、アダプターから得られる1つまたは2つの短い隣接配列を含み得る。
【0098】
削除されたサイン含有フラグメントは、標準的な技術(例えば、エタノール沈殿および/または電気泳動)を使用して精製される。1つの実施形態において、アダプター−サイン−アダプター構築物のPCR増幅(図1における最後から2番目の工程)は、ビオチン化された(biotinylated)プライマーを使用して行われる。アダプターの切断に続いて、サインフラグメントは、ストレプトアビジン支持体からの溶出により精製される。
【0099】
(C.タグ−サインライブラリのクローニング)
適切な緩衝液中に再懸濁した後、サインフラグメントは、指向的にタグベクターのライブラリに連結され(図5A)、タグサイン結合体のベクターライブラリを形成する(142)。各々のタグベクターは、左側制限切断部位(144)、オリゴヌクレオチドタグ(146;上のセクションIを参照のこと)、サインフラグメントの挿入のためのクローニング部位、および右側制限切断部位(148)を含む。好ましくは、ベクターは、その後のPCR増幅のためのE.coliおよびプライマー結合部位(152、154)中にクローニングするためのプラスミドDNA(150)さらに含む。(本明細書中で使用されるような「タグ−サイン結合体」がまた、上の「サインフラグメント」について示されるような、いくらかの残りのアダプターDNAを含み得る。)
好ましくは、タグ−サイン結合体のライブラリのE.coli複製後に、宿主細胞のサンプルが、培養培地のユニット体積当たりの組換え体の数を決定するためにプレートされる。サンプルが、さらなる処理のために採取され、サンプルのサイズは、タグベクターライブラリで使用されるタグレパートリーのサイズ(セクションIを参照のこと)に依存する。「二重体(double)」(すなわち、同じタグを有するが、異なるcDNAフラグメントを有する2つ以上の結合体)の発生を最小化するために、サンプルは、好ましくは、タグレパートリーと約1%のサイズと等しい多くの結合体を含む。(Brennerら、PCT公開番号WO96/41011および米国特許第5,604,097号を参照のこと。)従って、8つの4−ヌクレオチド「単語」の最小の交差ハイブリダイゼーションセットから選択される8つ単語の連結からなるタグレパートリー(下のセクションIIIを参照のこと)について、レパートリーのサイズは、8すなわち約1.7×10タグである。従って、このようなタグレパートリーを用いて、約1.7×10種類の結合体含有ベクターのサンプルが、好ましくはさらなる処理のために選択される。このようなサンプリングのための実際的な方法が、上、および例えば、米国特許第6,265,163号に記載される。
【0100】
サンプリングの後、タグ−サイン結合体は、好ましくは5−メチルdCTPの存在下で、ビオチン化プライマー(156)および標識化プライマー(158)を使用して、PCRにより増幅され、その後、結果として生じるアンプリコンが、ストレプトアビジン捕捉により単離される。ベクターにおける制限部位(144)が、好ましくは希切断(rarecutting)制限エンドヌクレアーゼ(例えば、PacI、NotI、FseI、PmeI、またはSwaI)に対応し、このエンドヌクレアーゼは、捕捉されたアンプリコンがサインフラグメントに対して内部の部位にて生じる切断の最小の確率で支持体から放出されることを可能にする。
【0101】
タグサイン結合体が、PCR増幅なしに複製されたベクターから負荷される場合、結合体は、ベクターから放出され、例えば、電気泳動による精製により、単離される。好ましくは、蛍光標識を有するアダプターは、下に記載されるようなFACS分類においての使用のために、構築物に連結される。
【0102】
(D.固体相支持体上への負荷)
「ストリッピング(stripping)」反応が、タグ−サイン結合体のタグを一本鎖にするために実行される(例えば、Brenner,米国特許第5,604,097号を参照のこと)。これは、単一のdNTPの存在下で、例えば、3’→5’エキソヌクレアーゼ活性を有するDNAポリメラーゼ、好ましくはT4 DNAポリメラーゼを使用することにより、達成され得る。図5Aに示される、連結(160)は、配列5’GGGCCC−3’(トップ鎖)を有し、エキソヌクレアーゼ反応がdGTPの存在下で実施される場合、ストリッピング反応をGトリプレットにて休止させる。さらに、タグが、A、CおよびTの場合においてセクションIで考察されるように、4つの天然のヌクレオチドから3つだけを含むように設計される。従って、放出されたタグ−サイン結合体が、dGTPの存在下でT4 DNAポリメラーゼで処理される場合、タグの相補的鎖が、図5Aに示されるように、最初のGまでストリッピングされる。
【0103】
「ストリッピング」反応が、クエンチされる場合、結果物は、一本鎖タグ(164)を有する二重鎖(162)である。単離後、以下の工程が、実施される(米国特許第5,604,097を参照のこと):タグ−サイン結合体が、微小粒子(168)に接着したタグ補体にハイブリダイズされる;充填反応が、タグ−サイン結合体の相補鎖と微小粒子に接着したタグ補体の5’末端との間の任意のギャップを満たすように実施され、そしてタグ−cDNA結合体の相補鎖が、タグ補体(166)の5’末端に結合され、この補体は、この目的のためにリン酸化される。
【0104】
タグ−サイン結合体のサンプリングされたセット(上に記載されるように)が、タグ補体の完全レパートリーにハイブリダイズされるために、結合体は、一般に微小粒子のわずか約1%にハイブリダイズされる。負荷された微小粒子は、蛍光活性化細胞ソーター(FACS)の使用により負荷されていない微小粒子から分離され得、このソーターは、PCRプライマー(158)により接着された、増幅された結合体上の蛍光標識を検出する。
【0105】
配列決定の前に、蛍光標識は、ベクターの切断部位(148)を認識する制限エンドヌクレアーゼで処理することにより、好ましくは除去される(図5B)。この切断は、二重鎖タグ−サイン結合体(170)を有する微小粒子(168)を結果として生じる。
【0106】
(E.代替的負荷方法)
「チューバック(chewback)」反応を必要としない、ビーズ上に構築物を負荷する代替的な方法が、以下のように実施され得る(図7)。この実施形態において、上の第1のアダプターは、好ましくは、下に記載されるような、その後のプライマー除去のための、II型制限部位の3’側の、さらなる制限部位(172)を含む。
【0107】
タグ−サイン結合体を含むベクターは、例えば、PacIで切断することにより、直線状にされる。トップ鎖が、所望される場合、インビトロ転写により複製され、次いでボトム鎖が、第1のビオチン標識化されたプライマー(174)を使用して転写され、そしてトップ鎖の第2の鎖の合成が、第2のビオチン標識化プライマー(176)を使用して実施される。次いで、ベクターが、左側制限切断部位で切断され、これにより、第1のビオチン標識を除去し、そして生成物が、ストレプトアビジンビーズ(178)上に負荷され、従って第2のビオチン標識に結合する。トップ鎖(180)が、支持体から溶出される。(ボトム鎖の短い3’領域(182)がまた溶出され、しかしさらなる処理を妨げない。)
好ましくは負荷されたビーズのFACS分類のために蛍光的に標識された、プライマー(184)が、サインの3’側である各々のトップ鎖の領域(186)にアニーリングされる。次いで、一本鎖タグおよびサインを有する、トップ鎖は、タグ補体(188)のライブラリ(上のように、それぞれ別個の固体相支持体(190)上に存在する)と接触され、これによりタグをそれぞれの補体にハイブリダイズさせる。
【0108】
次いで、プライマーが伸長されてサインのボトム鎖を複製し、次いでこれが、固体支持体上のタグ補体と結合される。次いで、上で参照されるさらなる制限部位が、切断されてプライマー標識およびサインの3’側のDNAの一部を除去し得る。
【0109】
(F.同じ長さのサインを調製するための代替的方法)
1つの方法において、ゲノムDNA中のメチル化シトシンに隣接するサインが、捕捉され得る。このようなサイン由来の配列データを使用して、ゲノムDNA中の、メチル化プロモーター領域のような、メチル化CpGをマッピングし得る。脊椎動物DNAにおける約60〜90%のCpG部位が、メチル化されると概算される(Bird,A.P.,Nature 321:209−213,1986)。
【0110】
この方法に従って、DNAが、酵素McrBCで切断され、この酵素は、配列5’...PuC(N40−3000)PuC....3’を認識し、ここで必要に応じてN=55〜103塩基であり、そしてCは、メチル化シトシンを表す。酵素は、1つの半部位(half−site)または他の半部位と近接して、「半部位」の各々の対の間のDNAを切断する。切断位置は、いくつかの塩基対(メチル化塩基からおよそ30塩基対)にわたって分布される(Stewart,F.J.およびRaleigh,E.A.,Biol.Chem.379,611−616,1998)。
【0111】
平滑断端フラグメントを作製すると考えられる切断の後に、上に記載されるようなII型認識部位を有する平滑断端アダプターの結合が続く。続く工程(II型酵素での切断、「R」アダプターの結合、クローニングなど)が、上に記載される。
【0112】
別の方法において、同じ長さのサインが、配列5’...(N)10CGA(N)TGC(N)12...3’を認識するIIb型酵素BcgI、または配列5’...(N)10AC(N)GTAYC(N)12...3’を認識する酵素BaeIのような、「二重切断」酵素で切断し、5−ヌクレオチド突出部を作製することにより、1工程で作製される。従って、切断により、それぞれ32塩基対または33塩基対のサイン配列が生成され、この配列に対して、クローニングのために、アダプターが結合され得る。
【0113】
(IV.シグネチャーの配列決定)
本発明は、1つの実施形態において、発現された遺伝子の大量並行分析方法を提供し、モニターされる差示的に発現する遺伝子の事前の知識を必要とすることなく、差示的に発現された配列の検出および単離を可能とする。より一般的には、この方法は、任意の2つの核酸集団からの、差示的に表わされた核酸の検出(例えば、ゲノムDNAの多様性)を可能にする。この方法を、複数の細胞および/または組織(例えば、疾患組織または疾患細胞型および健常組織または健常細胞型、あるいは刺激またはストレス(例えば、栄養、温度などの変化)に供された細胞または組織型、およびストレスを与えられていない状態または刺激を受けていない状態の対応する細胞または組織型)中の相対的な遺伝子発現の分析のために使用し得る。この方法はまた、個体中のゲノムDNA中の差示的に表わされる多様性を同定するために使用され得る(例えば、SNP、欠失、挿入または重複)。
【0114】
この方法の利点は、多くの場合において、分析される核酸の同一性が、分析の前に知られている必要がないということである。しかし、いくつかの場合において、差示的に表される配列の予測される位置の事前の知識(例えば、ゲノムDNA中のSNP)は、有用である。
【0115】
固相支持体においてクローニングされたシグネチャーは、任意の多数の段階的な配列決定法(支持体に結合されたヌクレオチド配列の長さに沿って、ヌクレオチドまたはヌクレオチドの短配列を連続的に同定する)によって配列決定され得る。そのような配列決定法としては、例えば、Brennerの米国特許第5,604,097号、同5,962,228号、および同5,599,675号に記載される。従来の配列決定方法(シーケンス−バイ−ハイブリダイゼーション(SBH)および合成による配列決定を包含する)もまた、使用し得る。
【0116】
1つの実施形態において、配列は、以下に記載され、そしてBrenner、米国特許第6,013,445号、およびAlbrechtら、PCT公開第WO97/46704号に記載されるように、MPSS(大量並行シグネチャー配列決定(massively parallel signature sequencing)によって、同時並行して同定される。この手順は、好ましくは、以下の工程を用いて行われる:
(a)コードされたアダプタを、微粒子上のフラグメントの末端に連結する工程であって、ここで、コードされたアダプタは、その切断部位がその認識部位から離れているヌクレアーゼのヌクレアーゼ認識部位を有する、工程;
(b)フラグメントに連結されたコードされたアダプタの同一性によって、フラグメントの末端における1つ以上のヌクレオチドを同定する工程;
(c)コードされたアダプタのヌクレアーゼ認識部位を認識するヌクレアーゼを用いて、フラグメントを切断し、その結果、フラグメントが1ヌクレオチド以上短くなる工程;および
(d)所望の数のヌクレオチドが、フラグメントの末端において同定されるまで、工程(a)から(c)を繰り返す工程。
【0117】
第I章において考察され、そして、さらにAlbrechtら、PCT公開WO97/46704において考察されるように、工程(a)の各コードされたアダプタは、突出した鎖、および最小に交差ハイブリダイズするオリゴヌクレオチドのセットから選択されたオリゴヌクレオチドタグを有する。その突出鎖が、フラグメントの相補的な突出鎖とともに、完全にマッチした二重鎖を形成する場合、コードされたアダプタが連結される。連結後、突出鎖のヌクレオチドの同定および順序付けが、標識したタグ相補物または「デコーダー」を、連結したアダプタ上のその対応するタグに対して、特異的にハイブリダイズすることによって、決定されるか、または「デコード」される。好ましくは、標識を送達するための一本鎖タグ相補物の長さは、8〜20の間であり、より好ましくは9〜15の間である。
【0118】
同定工程において、タグ相補物の連続するセットまたはデコーダーは、連結したコードされたアダプタによって保有されるそれぞれのタグに特異的にハイブリダイズする。ポリヌクレオチドの突出した鎖におけるヌクレオチドの型および配列は、特異的にハイブリダイズしたデコーダーによって保有される標識およびデコーダーが由来するセットによって同定される(米国特許第5,599,675号に記載される)。
【実施例】
【0119】
以下の実施例は、例示であって、いかなる方法によっても、本発明を限定することを意図しない。
【0120】
(材料)
オリゴヌクレオチドを、購入したか、または従来法によって合成した。ラピッドライゲーションバッファー1(Rapid Ligation Buffer 1)、ラピッドライゲーションバッファー2(Rapid Ligation Buffer 2)、およびラピッドライゲーションリガーゼ(Rapid Ligation Ligase)は、Rapid DNA Lidatioin Kit(Roche Biochemical #1635379)の成分である。NEBと示した試薬は、New England Biolabs、Beverly、MAによって供給される。
【0121】
(cDNAからのクローニングされたシグネチャーライブラリーの調製)
(A.第1の制限エンドヌクレアーゼでの消化)
従来のプロトコールを使用して、cDNAを約1μgのmRNAから調製し、EtOHで沈殿し、そしてDpnIIで以下のように開裂した。ペレットに対して、10μlの10×DpnII緩衝液および1.5μlのDpnII(50U/μl)を添加して、混合物を、37℃で2時間インキュベートした。次に混合物を、水で希釈して、200μlの緩衝液で飽和したフェノール(2×)、および200μlのクロロホルム:イソアミルアルコール(24:1)で抽出し、次に、20μlの3M NaOAcおよび500μlの−20℃のEtOHを添加して、−20℃で一晩インキュベートした。ペレットを−20℃の70%エタノールで洗浄した。
【0122】
(B.アダプタの生成)
Q3top.S、Q3bot.P、QM2top.S、QM2bot.P、R4top.FAMおよびRbotAA ... TT(以下を参照のこと)と称するオリゴヌクレオチドを、各200μMで水の中に懸濁した。各アダプタについて、30μlの「上部」オリゴ、30μlの「底部」オリゴ、10μlの10×NEB2および30μlの水を0.5mlのエッペンドルフチューブ中に混合して、95℃で5分間加熱し、室温まで冷却し、手短に遠心し、そして−20℃で保存した。
【0123】
(オリゴヌクレオチド)
【0124】
【化10】

s=ホスホロチオエート結合;p=5’−ホスフェート;FAM=6−フルオレセインアミダイト。
【0125】
(C.Qアダプタの連結およびSAビーズへの結合)
上記AからのDpnII−フラグメント、および9.5μlのQアダプタ(Q3またはQM2)の混合液に対して、2.3μlのラピッドライゲーションバッファー2を添加した。混合的を混合し、そして手短に遠心し、その後、11.8μlのラピッドライゲーションバッファー1を添加し、さらに混合し、1μlのラピッドライゲーションリガーゼを添加し、さらに混合し、そして4時間室温にてインキュベートした。次に混合物を、80μlの5M NaClおよび196μlのTE(100mM NaCl、20mM Tris−HCI(pH7.5)、10mM EDTA)で処理し、そして65℃で10分間加熱して、リガーゼを不活性化した。
【0126】
4μlのBSA(10mg/ml)を添加した後、混合物を、2×の500μlのTE(上記)で洗浄し、100μlのTE中に再懸濁した150μlのストレプトアビジン−ダイナビーズM−280(Dynal 112.05)に添加した。混合物を、1時間30℃で持続する回転のもとで、インキュベートした。上清を捨て、5×の500μlのTEを用いて、ビーズを慎重に洗浄した。
【0127】
(D.IIs型制限エンドヌクレアーゼでの切断(SAビーズからのシグネチャーの除去))
いずれのアダプタ(それぞれ、Q3またはQM2)が上記で使用されたかに依存して、第2の消化物を、BpmIまたはMmeIのいずれかを用いて調製した。BpmI消化物は、40μlの10×NEB3バッファー、10μlのBSA(10mg/ml)、6μlのBpmI(2U/μl)、および400μlまでの水を含んだ。MmeI消化物は、
40μlの10×MmeIバッファー、40μlの10×SAM(400μM)、10μlのBSA、8μlのMmeI(4U/μl)、および400μlまでの水を含んだ。
【0128】
消化物を、SAビーズと混合し、そして37℃で1.5時間の回転のもとでインキュベートし、次に、上清の除去のために、磁器粒子コンセントレーターに移した。混合物を、3μlのエビアルカリホスファターゼ(SAP;1U/μl;Amersham)の添加によって脱リン酸化し、37℃での1時間の後、70℃で20分間インキュベートすることにより不活性化した。混合物を冷却し、そしてバッファーで平衡化したフェノール(100μl)およびCHCl:IAA(24:1)(100μl)を用いて抽出した。0.1容量の3M NaOAc(pH5.2)および1μlのグリコーゲン(20μl/μl)の添加後、混合物を2.5容量のエタノールを用いて沈殿させた。
【0129】
(E.第2の(R)アダプタの連結および底部鎖の除去)
ペレットをR4アダプタライゲーション混合液(1μlのR4アダプタ(60μM、上記を参照のこと)および3μlのHOからなる)中で再懸濁した。以下のものを順次、各添加後に混合/遠心して、添加した:1μlのラピッドライゲーションバッファー2(5×)、5μlのラピッドライゲーションバッファー1(2×);および1μlのラピッドライゲーションリガーゼ。混合物を、4時間室温にてインキュベートし、その後、9μlの10×NEB4および79μlのHOを添加し、その時点で、迅速に10分間65℃にまで加熱し、リガーゼを不活性化した。
【0130】
混合物を氷上でクエンチングした後、2μlのT7エクソヌクレアーゼ(10U/μl)(New England Biolabs #M0263S)を添加し、その後、100μlの総容量にまで、水を添加した。混合物を、30分間37℃でインキュベートし、次に、95℃で5分間不活性化した。
【0131】
(F.挿入物の生成(PCR増幅;アダプタの除去))
増幅混合物を、以下のように調製した:
10μl エクソヌクレアーゼ処理DNA(上記)
10μl 10×クローン化Pfuバッファー
4μl 10μMのQ3プライマー.FAMまたはQM2プライマー.FAM
4μl 10μMのRプライマー.FAM
2μl SC dNTPミックス(10mMの各dATP+dGTP+dTTP+5−Me−dCTP)(注意:5−Me−dCTPを、第1鎖および第2鎖の両方において使用する)
68μl H
2μl Pfu Turbo Hotstartポリメラーゼ(2.5U/μl)(ストラタジーン)
100μlまでの水。
【0132】
増幅を以下のサイクルを用いて行った。
【0133】
【化11】

反応混合物をフェノールおよびクロロホルムを用いて抽出し、その後、1μlのグリコーゲン、50μlの7.5M NHOAc、および400μlのエタノールを添加し、CO(s)上で30分間または、−20℃で一晩で沈殿させた。
【0134】
ペレットをエタノールで洗浄し、そして12.5μlの水および1.5μlの10×DpnII−バッファーに再懸濁し、その後、1μlのDpnII(NEB、10U/μl)を添加し、37℃で1〜1.5時間インキュベートした。制限反応物に対して、13.5μlのNEB3および120.5μlのHOを添加し、その後、65℃で20分間不活性化した。
【0135】
SfaNI(NEB;1U/μl)を添加(6μl)し、その後、37℃で1〜1.5時間インキュベートした。混合物を、一度、フェノール:クロロホルム:IAA(25:24:1)で抽出し、そして16μlの3MのNaOAcおよび450μlのエタノール(−20℃)を添加した。ペレットを洗浄し、次に、12μlのTE(上記を参照のこと)中に再懸濁した。
【0136】
(G.電気泳動精製)
ローディングバッファー(50%グリセロール+BPB;4μl)を、Fからの懸濁液に添加し、そして混合物を、20%PAGE/1×TBE 10ウェルゲル(Novex)にロードし、そして40分間200Vで電気泳動した。関連するバンド(BpmIについて29bp、MmeIについて32bp)を同定し、そして従来法にて単離した。
【0137】
(H.ライブラリーのクローニング)
ライゲーション混合物を調製した(1μlのベクター(MBS1−8−ワードタグ/BamHI/BbsI/EcoRV/CIAP/ゲル精製した、〜200ng/μl;配列番号16、下記)、2μlのラピッドライゲーションバッファー2(5×)、および6μlの挿入物(上記)からなる)。(オリゴヌクレオチドタグを、ベクター中のBseRI−Bsp120I部位中にクローニングした)混合物を手短に遠心し、その後、10μlのラピッドライゲーションバッファー1(2×)を添加し、さらに混合/遠心をして、そして1μlのラピッドライゲーションリガーゼを添加した。この混合物を室温で4時間インキュベートした。
【0138】
連結の後、10μlの3M NaOAcおよび70μlのHOを添加し、混合物を一度、フェノール:クロロホルム:IAA(25:24:1)で抽出し、その後2μlのPellet Paint(登録商標)(Novagen)および275μlの−20℃エタノール(100%)を添加した。混合物をCO(s)上で少なくとも30分間インキュベートして、10分間遠心した。上清を除去し、そしてペレットを−20℃のエタノール(70%)で洗浄した。さらに遠心して、上清を除去した後、ペレットを10μlのHO中に再懸濁した。
【0139】
エレクトロコンピテントなE.coli株(TOP10(Invitirogen))を、0.5μlのライゲーション産物および40μlの細胞を用い、標準的な手順に従った。
【0140】
【化12】

【図面の簡単な説明】
【0141】
【図1】図1は、本発明の実施形態に従う、mRNAサンプル集団の3’領域を示す制限フラグメントから同一長のシグネチャ−配列のライブラリーを調製するための一手順を示す。
【図2A】図2Aは、本発明のさらなる実施形態に従う、mRNAの3’末端から同一長のシグネチャー配列を調製するための例示的手順を示す。
【図2B】図2Bは、本発明のさらなる実施形態に従う、mRNAの3’末端から同一長のシグネチャー配列を調製するための例示的手順を示す。
【図3A】図3Aは、本発明のさらなる実施形態に従う、mRNAの5’末端から同一長のシグネチャー配列を調製するための例示的手順を示す。
【図3B】図3Bは、本発明のさらなる実施形態に従う、mRNAの5’末端から同一長のシグネチャー配列を調製するための例示的手順を示す。
【図3C】図3Cは、本発明のさらなる実施形態に従う、mRNAの5’末端から同一長のシグネチャー配列を調製するための例示的手順を示す。
【図4】図4は、本発明のさらなる実施形態に従う、mRNAの5’領域を示すフラグメントから同一長のシグネチャー配列を調製するための例示的手順を示す。
【図5A】図5Aは、シグネチャー配列の固相クローン化ライブラリーを調製するための手順を示す。
【図5B】図5Bは、シグネチャー配列の固相クローン化ライブラリーを調製するための手順を示す。
【図6】図6は、図1の実施形態に従う、固相クローン化ライブラリーの調製における重要な工程を概説するフローチャートである。
【図7】図7は、固相支持体上にタグ−シグネチャー構築物をロードするための別の手順を示す。

【特許請求の範囲】
【請求項1】
供給源核酸集団から同一長のシグネチャー配列のライブラリーを調製する方法であって、該方法は、以下:
(a)ポリヌクレオチドの各集団の末端に、第1の制限エンドヌクレアーゼの認識部位を含む第1のアダプタを付着する工程であって、その結果、該エンドヌクレアーゼの切断部位が該ポリヌクレオチド内にあり、
ここで、該アダプタが付着する末端は、該集団の各ポリヌクレオチドについて同一であり、そして、(i)全長cDNA転写物の5’末端、(ii)ポリA/ポリT領域が除去されたcDNA転写物の3’末端、(iii)cDNAを制限エンドヌクレアーゼで切断することによって生成されたcDNAフラグメントの5’末端、および(iv)cDNAを制限エンドヌクレアーゼで切断することによって生成されたcDNAフラグメントの3’末端、から選択される、工程;
(b)該ポリヌクレオチドを該第1の制限エンドヌクレアーゼで切断して、アダプタ−シグネチャー結合体の集団を産生する工程であって、ここで該アダプタ−シグネチャー結合体の各々は、少なくとも6塩基対長であり、新規の切断末端を有する、供給源核酸の同一長のシグネチャー配列を含む、工程;ならびに
(c)該シグネチャーの該新規の切断末端を、第2の制限エンドヌクレアーゼの認識部位および切断部位を含む第2のアダプタと連結して、アダプタ−シグネチャー−アダプタ構築物のライブラリーを産生する工程、
を包含する方法。
【請求項2】
請求項1に記載の方法であって、さらに、(d)前記構築物を前記第2のエンドヌクレアーゼと前記第1のアダプタを切断するのに有効な制限エンドヌクレアーゼとを用いて消化して、クローニング部位に隣接する同一長のシグネチャーフラグメントのライブラリーを産生する工程を包含する、方法。
【請求項3】
請求項1に記載の方法であって、ここで、付着工程(a)が、液相中で行われる、方法。
【請求項4】
請求項1に記載の方法であって、ここで、前記第1のアダプタが付着する末端が:(i)全長cDNAの5’末端、および(ii)ポリA領域が除去された全長cDNAの3’末端から選択される、方法。
【請求項5】
請求項1に記載の方法であって、ここで、前記第1のアダプタが付着する末端が、(iii)制限エンドヌクレアーゼを用いたcDNAの切断によって産生されたcDNAフラグメントの5’末端、および(iv)制限エンドヌクレアーゼを用いたcDNAの切断によって産生されたcDNAフラグメントの3’末端から選択される、方法。
【請求項6】
請求項5に記載の方法であって、ここで、前記(iii)のcDNAフラグメントの部分が、前記供給源核酸集団の3’領域由来であり、そして、該cDNAフラグメントの部分が、(iv)該供給源核酸集団の5’領域由来である、方法。
【請求項7】
請求項6に記載の方法であって、ここで、前記供給源核酸集団の3’領域または5’領域を表すフラグメントが、前記付着の後に他のcDNAフラグメントから単離される、方法。
【請求項8】
請求項2に記載の方法であって、ここで、少なくとも1つのアダプタが、プライマーの結合部位またはポリメラーゼの結合部位を含み、そしてさらに、工程(c)の後であって、工程(d)の前に:
各アダプタ−シグネチャー構築物の底部鎖を除去する工程;および
該底部鎖を、逆転写、プライマー伸長、またはPCR増幅によって再生する工程、
を包含する、方法。
【請求項9】
請求項1に記載の方法であって、ここで、前記第1の制限エンドヌクレアーゼ(r1)は、その認識部位から少なくとも10ヌクレオチドにおいて切断部位を有するIIs型制限エンドヌクレアーゼである、方法。
【請求項10】
請求項9に記載の方法であって、ここで、rは、その認識部位から少なくとも16ヌクレオチドにおいて切断部位を有する、方法。
【請求項11】
請求項10に記載の方法であって、ここで、rは、BpmI、MmeI、GsuI、およびそのイソシゾマーから選択される、方法。
【請求項12】
請求項1に記載の方法であって、ここで、前記シグネチャーは、少なくとも10塩基対長である、方法。
【請求項13】
請求項2に記載の方法であって、さらに、以下:
オリゴヌクレオチドタグを、各シグネチャーフラグメントに付着する工程であって、その結果、実質的に全ての異なるシグネチャーフラグメントは、付着した異なるオリゴヌクレオチドタグを有し、タグ−シグネチャー結合体を形成する、工程;
該タグ−シグネチャー結合体を、タグ相補物のライブラリーと接触させ、ここで、該タグ相補物の各々は別個の固相支持体上にあり、そして該タグをその対応する相補物とハイブリダイズし、シグネチャー配列の固相支持されたクローン性の部分集団を形成する工程、ならびに
複数の該固相支持されたシグネチャー配列を配列決定する工程、
を包含する、方法。
【請求項14】
請求項13に記載の方法であって、ここで、前記タグの付着工程が:
前記シグネチャーフラグメントをオリゴヌクレオチドタグ−ベクターのライブラリーに連結することであって、ここで、各タグ−ベクターは:左側制限切断部位、オリゴヌクレオチドタグ、該シグネチャーフラグメントの挿入のためのクローニング部位、および右側制限切断部位を含み、タグ−シグネチャー結合体のベクターライブラリーを形成する、工程;ならびに
該ベクターライブラリーを宿主生物中で複製する工程、
を包含する、方法。
【請求項15】
請求項14に記載の方法であって、ここで、前記タグ−ベクターライブラリー中の異なるオリゴヌクレオチドタグの数は、異なるフラグメントの数よりも少なくとも100倍多く、該方法は、さらに、該ベクターライブラリーからサンプルを取り、その結果、該サンプル内の実質的に全ての異なるポリヌクレオチドフラグメントが、付着した異なるタグを有する工程を包含する、方法。
【請求項16】
請求項14に記載の方法であって、さらに、以下:
前記タグ−シグネチャー結合体を前記ベクターライブラリーから切断する工程;
タグ−シグネチャー結合体のタグ成分の底部鎖を除去する工程;
該タグ−シグネチャー結合体を、タグ成分のライブラリーと接触させる工程であって、ここで、該タグ成分の各々は別個の固相支持体上にあり、それによって、前記一本鎖タグをその対応する相補物にハイブリダイズさせる、工程;ならびに
該シグネチャーフラグメントの該底部鎖を、該タグ成分に連結する工程、を包含し、
それによって、前記供給源ポリヌクレオチド集団からの各シグネチャー配列の、固相支持されたクローン性の部分集団を形成する、方法。
【請求項17】
サンプル核酸集団からのシグネチャー配列の並行配列決定における使用のためのキットであって、以下:
オリゴヌクレオチドタグベクターライブラリーであって、該ライブラリー中の各タグベクターは、以下:左側プライマー結合部位、左側制限切断部位、最少に交差ハイブリダイズするオリゴヌクレオチドのセットより選択されたオリゴヌクレオチドタグ、シグネチャー配列の挿入のためのクローニング部位、右側制限切断部位、および右側プライマー結合部位を含む、ライブラリー;
対応するオリゴヌクレオチドタグ相補物のセットであって、各々は、空間的に別個の固相支持体に結合する、セット;ならびに、
右側クローニング部位および左側クローニング部位を有する同一長のシグネチャーフラグメントの集団であって、ここで、各々は、該サンプル核酸集団からの同一長のシグネチャー配列を含む、フラグメント、
を含む、キット。
【請求項18】
請求項17に記載のキットであって、さらに、前記結合部位に結合するのに有効な、右側PCRプライマーおよび左側PCRプライマーを含む、キット。
【請求項19】
サンプル核酸集団から同一長シグネチャー配列を調製することにおいて使用するためのキットであって、以下:
その認識部位から少なくとも10ヌクレオチドにおいて切断部位を有するIIs型制限エンドヌクレアーゼである、第1の制限エンドヌクレアーゼ、
第2の制限エンドヌクレアーゼ、
該第2の制限エンドヌクレアーゼの認識部位を含む第1の二本鎖アダプタ;ならびに
二本鎖cDNAまたは二本鎖cDNAフラグメントを、該第2の制限エンドヌクレアーゼで切断することによって産生される突出とハイブリダイズするのに有効な一本鎖突出を有する第2のアダプタであって、該第2の制限エンドヌクレアーゼの認識部位および切断部位を含むアダプタ;
を含む、キット。
【請求項20】
請求項19に記載のキットであって、ここで、前記第2のアダプタは、全ての可能なヌクレオチド配列の、一本鎖の2ヌクレオチド〜4ヌクレオチドの突出を含むアダプタのセットを含む、キット。

【図1】
image rotate

【図2A】
image rotate

【図2B】
image rotate

【図3A】
image rotate

【図3B】
image rotate

【図3C】
image rotate

【図4】
image rotate

【図5A】
image rotate

【図5B】
image rotate

【図6】
image rotate

【図7】
image rotate


【公表番号】特表2006−506953(P2006−506953A)
【公表日】平成18年3月2日(2006.3.2)
【国際特許分類】
【出願番号】特願2003−587952(P2003−587952)
【出願日】平成15年4月25日(2003.4.25)
【国際出願番号】PCT/US2003/013076
【国際公開番号】WO2003/091416
【国際公開日】平成15年11月6日(2003.11.6)
【出願人】(598114930)ソレクサ・インコーポレイテッド (10)
【氏名又は名称原語表記】Solexa,Inc.
【住所又は居所原語表記】3832 Bay Center Place, Hayward, California 94545 U.S.A.
【Fターム(参考)】