分子タグ化システム

【課題】複数のポリヌクレオチドの並行配列決定のための方法を提供する。
【解決手段】方法は、(a)微粒子の集団を用意する工程であって、各微粒子がただ1種のポリヌクレオチドを結合させている工程と、(b)前記微粒子の集団を平面基板上に分散させる工程と、(c)標識された配列決定試薬を用いて、処理および検出の連続的なサイクルを通じて、各微粒子からのヌクレオチドの配列を並行して同定する工程(前記処理操作は標識ヌクレオチドとポリメラーゼまたはリガーゼを用いて行う。)と、を含む。

【発明の詳細な説明】
【発明の分野】
【0001】
本発明は、概して、オリゴヌクレオチドラベルで分子、特にポリヌクレオチド、を同定、分類および/または探知するための方法に関し、より詳細には、オリゴヌクレオチドタグへの特異的ハイブリダイゼーションによりポリヌクレオチドを分類する方法に関する。
【発明の背景】
【0002】
オリゴヌクレオチドおよびそのアナログの特異的ハイブリダイゼーションは、広く多様な研究用途、医療用途および産業用途(診断アッセイにおける疾患関連のポリヌクレオチドの同定、新規の標的ポリヌクレオチドのクローンのスクリーニング、ポリヌクレオチド混合物のブロットにおける特異的ポリヌクレオチドの同定、特異的な標的ポリヌクレオチドの増幅、不適切に発現された遺伝子の治療的ブロッキング、DNA配列決定、等)で用いられている基礎的なプロセスである(例えば、Sambrookら,Molecular Cloning:A Laboratory Manual.第2版(Cold Spring Harbor Laboratory,New York,1989);KellerおよびManak,DNA Probes,第2版(Stockton Press.New York,1993);Milliganら,J.Med.Chem.,36:1923−1937(1993);Drmanacら,Science,260:1649−1652(1993);Bains J.DNA Sequencing and Mapping,4:143−150(1993))。
【0003】
特異的ハイブリダイゼーションはまた、オリゴヌクレオチドタグで標識された化合物を探知、回収および同定する方法として提案されている。例えば、多重DNA配列決定において、オリゴヌクレオチドタグは、同じ配列決定反応において生じるDNAフラグメントからなる、ゲル上の電気泳動的に分離されたバンドを同定するために用いられる。このように、多くの配列決定反応に由来するDNAフラグメントが、ゲルの同じレーンで分離され、次いで、レーンは別々の固相物質でブロットされる。固相物質上では、別々の配列決定反応に由来するフラグメントバンドが、相補的なタグに特異的にハイブリダイズするオリゴヌクレオチドプローブで可視化される(Churchら,Science,240:185−188(1988))。オリゴヌクレオチドタグの同様の用途はまた、爆発物や潜在的汚染物質(例えば、原油)の同定用として、また、模造品の防止・検出目的の通貨の同定用として提案されている(例えば、Dollinger,265−274頁,Mullisら編,The Polymerase Chain Reaction(Birkhauser,Boston,1994)に概説されている)。さらに最近、オリゴヌクレオチドタグを利用するシステムはまた、複雑なコンビナトリアルケミカルライブラリー中の個々の分子を操作および同定する方法として(例えば、薬物候補物のライブラリーのスクリーニングを補助するものとして)提案されている(BrennerおよびLerner,Proc.Natl.Acad.Sci.,89:5381−5383(1992):Alper.Science,264:1399−1401(1994);Needelsら,Proc.Natl.Acad.Sci.,90:10700−10704(1993))。
【0004】
このようなタグ化スキームをうまく実施できるかどうかは、タグとその相補的プローブとの間での特異的なハイブリダイゼーションがうまく達成されるかどうかに大部分依存している。すなわち、オリゴヌクレオチドタグが基質をうまく同定するためには、擬陽性および擬陰性のシグナルの数を最小限にしなければならない。残念ながら、このような偽のシグナルは希ではない。なぜなら、塩基対形成および塩基の積み重ね(base stacking)の自由エネルギーは、二重鎖または三重鎖構造におけるヌクレオチドの間で大きく異なるからである。例えば、その相補物に結合したデオキシアデニン(A)およびチミジン(T)の繰り返し配列からなる二重鎖は、ミスマッチを含む部分的に相補的な標的に結合したデオキシグアニジン(G)およびデオキシシチジン(C)の繰り返し配列、からなる同じ長さの二重鎖より安定性が低い可能性がある。従って、大きなコンビナトリアルケミカルライブラリー由来の所望の化合物が前者のオリゴヌクレオチドでタグ化された場合、完全にマッチしたATに富む二重鎖を検出するように設計されたハイブリダイゼーション条件下では、GCに富むオリゴヌクレオチドで標識された非所望の化合物が、ATに富むタグからなる完全にマッチした二重鎖とともに(場合により、ミスマッチした二重鎖として)検出される可能性がかなりある。Brennerら(上記)により提案された分子タグ化システムでは、近い関係にあるタグのミスハイブリダイゼーションに関する問題は、いわゆる「comma−less」コードを用いることにより対処される。これにより、その相補的タグについて見当合わせが外れた(すなわちフレームシフトした)プローブは、その5以上の3塩基ワード(すなわち「コドン」)の各々について1つ以上のミスマッチを有する二重鎖を生じることになる。
【0005】
塩化テトラメチルアンモニウムのような試薬が、オリゴヌクレオチド二重鎖の塩基特異的安定性の差異を無効にするために利用可能であるとしても、そのような試薬の効果はしばしば限定され、その存在は、選択された化合物のさらなる操作(例えば、ポリメラーゼ連鎖反応(PCR)等による増幅)を不可能にするか、より困難にすることがある。
【0006】
このような問題は、例えば多重PCR、リバースドットブロッティング等を介する多数の、または複合した遺伝子座の分析における多数のハイブリダイゼーションプローブの同時使用を非常に困難にしている。その結果、例えばHLA遺伝子のような特定の遺伝子座の直接配列決定は、特異的ハイブリダイゼーションを用いる間接的な遺伝子型同定法に対する信頼性のある代替法として奨励される(例えば、Gyllenstenら,Proc.Natl.Acad.Sci.,85:7652−7656(1988))。
【0007】
クローン化され、同様にタグ化されたDNAを他と区別された固相支持体上に分類することができれば、そのような配列決定は容易になる。このことは、特に、並行して多くのサンプルに同時に適用可能な非ゲルベースの配列決定法と組み合わされる場合にいえる。
【0008】
以上より、大きなタグレパートリーを提供するが、天然の塩基対形成および塩基の積み重ねの自由エネルギーの差異を変化させるための特別な試薬を用いる必要なしに、擬陽性および擬陰性のシグナルの発生を最小化するオリゴヌクレオチドベースのタグ化システム、が利用可能であれば有用である。このようなタグ化システムは、コンビナトリアルケミカルライブラリーの構築および使用、DNAの大スケールのマッピングおよび配列決定、遺伝子同定、医療診断、等を含む多くの領域で適用可能である。
【発明の概要】
【0009】
本発明の目的は、化合物の探知、回収および同定のための分子タグ化システムを提供することである。
【0010】
本発明の別の目的は、オリゴヌクレオチドタグおよびその相補物の特異的ハイブリダイゼーションにより固相物質表面上の同一の分子または分子のサブクラス、特にポリヌクレオチドを分類するための方法を提供することである。
【0011】
本発明のさらなる目的は、メンバー化合物がオリゴヌクレオチドタグおよびその相補物の特異的ハイブリダイゼーションにより同定されるコンビナトリアルケミカルライブラリーを提供することである。
【0012】
本発明のさらなる目的は、同時の分析および/または配列決定用の標的ポリヌクレオチドの数千ものフラグメント(特にランダムに重複するフラグメント)をタグ化、分類するためのシステムを提供することである。
【0013】
本発明の別の目的は、数百塩基対ないし数万塩基対の長さを有する標的ポリヌクレオチドを配列決定するための迅速で信頼性のある方法を提供することである。
【0014】
本発明は、オリゴヌクレオチドタグを用いて分子のクラスまたは亜集団を探知、同定および/または分類するための方法および物質を提供することにより、上述のような目的を達成する。本発明のオリゴヌクレオチドタグは多くのサブユニットからなり、各サブユニットは3〜6ヌクレオチド長のオリゴヌクレオチドからなる。オリゴヌクレオチドタグのサブユニットは、最少にクロスハイブリダイズしているセット(minimally cross−hybridizing set)から選択される。このようなセットでは、このセットのサブユニットと、このセットの任意の他のサブユニットの相補物と、からなる二重鎖または三重鎖は少なくとも2つのミスマッチを含む。言い換えると、最少にクロスハイブリダイズしているセットのサブユニットは、最良でも、同じセットの任意の他のサブユニットの相補物と、2つのミスマッチを有する二重鎖または三重鎖を形成する。特定の実施形態で使用可能なオリゴヌクレオチドタグの数は、タグ当たりのサブユニット数、およびサブユニットの長さに依存する。サブユニット数は、一般に、そのタグの長さで実現可能な全配列の数(nヌクレオチド長のタグでは4)よりずっと少ない。より好ましくは、サブユニットは4〜5ヌクレオチド長のオリゴヌクレオチドである。
【0015】
本発明の一態様において、固相支持体に結合した、オリゴヌクレオチドタグの相補物は、ポリヌクレオチドを、各々がタグを含むポリヌクレオチドの混合物から選び出すために用いられる。この実施形態では、オリゴヌクレオチドタグの相補物は、同一配列の集団が特定の領域で製造されるように、固相支持体(例えば、微細ビーズ、または単一支持体上の合成位置のアレイ(array)上の特定の位置)の表面上で合成される。すなわち、各支持体(ビーズの場合)または各領域(アレイの場合)の表面は、特定の配列を有する一つのタイプの相補物によって誘導体化される。このようなビーズまたは領域の集団は、異なる配列を有する相補物のレパートリーを含み、レパートリーのサイズは、オリゴヌクレオチドタグ当たりのサブユニット数、および用いられたサブユニットの長さに依存する。同様に、分類対象のポリヌクレオチドは各々、同一のポリヌクレオチドが同一のタグを有し、異なるポリヌクレオチドが異なるタグを有するように、レパートリー中のオリゴヌクレオチドタグを含む。以下でより詳細に説明するとおり、この条件は、タグ化されたポリヌクレオチドの完全なアンサンブルから、タグ化されたポリヌクレオチドの十分に小さなサンプルを取ることにより達成される。そのため、支持体およびポリヌクレオチドの集団が、オリゴヌクレオチドタグとそのそれぞれの相補物との特異的ハイブリダイゼーションを可能にする条件下で混合されると、同一ポリヌクレオチドの亜集団は特定のビーズまたは領域上に仕分けされる。次いで、ポリヌクレオチドの亜集団はミクロ生化学的手法により固相支持体上で操作することができる。
【0016】
一般に、本発明の方法は次の工程を包含する。(a)分子集団中の各分子にタグのレパートリー由来のオリゴヌクレオチドタグを結合させる工程であって、(i)集団中の実質的にすべての同じ分子または同じ分子亜集団は、同じオリゴヌクレオチドタグを結合させ、集団中の実質的にすべての異なる分子または異なる分子亜集団は、異なるオリゴヌクレオチドタグを結合させ、(ii)レパートリー由来の各オリゴヌクレオチドタグは複数のサブユニットを有し、複数のサブユニットの各々は、3〜6ヌクレオチドまたは3〜6塩基対の長さのオリゴヌクレオチドからなり、サブユニットは、最少にクロスハイブリダイズしているセットから選択される工程:および(b)オリゴヌクレオチドタグとそのそれぞれの相補物とを特異的にハイブリダイズさせることにより、集団の分子または分子亜集団を分類する工程。
【0017】
本発明の重要な態様は、並行配列決定においてポリヌクレオチドを分類するためのオリゴヌクレオチドタグの使用である。このような配列決定は、好ましくは次の工程により行われる。(a)標的ポリヌクレオチドをカバーする複数のフラグメントを標的ポリヌクレオチドから生成させる工程;(b)複数のフラグメントの各々にタグのレパートリー由来のオリゴヌクレオチドタグを結合させる工程であって、(i)実質的にすべての同じフラグメントは、同じオリゴヌクレオチドタグを結合させ、実質的にすべての異なるフラグメントは、異なるオリゴヌクレオチドタグを結合させ、(ii)レパートリー由来の各オリゴヌクレオチドタグは複数のサブユニットを有し、複数のサブユニットの各々は、3〜6ヌクレオチドまたは3〜6塩基対の長さのオリゴヌクレオチドからなり、サブユニットは、最少にクロスハイブリダイズしているセットから選択される工程;オリゴヌクレオチドタグとそのそれぞれの相補物とを特異的にハイブリダイズさせることにより、フラグメントを分類する工程;(c)好ましくは下記の一塩基配列決定(single−base sequencing)法により、複数のフラグメントの各々の一部のヌクレオチド配列を決定する工程;および(d)標的ポリヌクレオチドのヌクレオチド配列を、フラグメントの配列を照合することにより決定する工程。
【0018】
本発明は、オリゴヌクレオチドで分子をタグ化または標識する現在の方法の鍵となる欠点を克服する。本発明に従ってタグの配列をコードすることにより、タグと別のタグに対する相補物との間でミスマッチした二重鎖または三重鎖の安定性は、タグとそれ自身の相補物との間で完全にマッチした二重鎖の安定性よりはるかに低くなる。そのため、GCに富むタグのミスマッチした二重鎖が完全にマッチしたATに富むタグよりも安定であることによる誤った分類の問題は除去される。
【0019】
微細ビーズのような固相支持体と組み合わせて用いた場合、本発明は、大スケールの並行操作(例えば、大スケールのDNA配列決定)において特に有用である、自動化の容易な、ポリヌクレオチドの操作、分類のためのシステムを提供する。このシステムでは、多くの標的ポリヌクレオチド、または単一の標的ポリヌクレオチドの多くのセグメントが、同時に配列決定および/または分析される。
【用語の定義】
【0020】
オリゴヌクレオチドタグに関して本明細書で用いられる「相補物」または「タグ相補物」とは、オリゴヌクレオチドタグが特異的にハイブリダイズして完全にマッチした二重鎖または三重鎖を形成するオリゴヌクレオチドをいう。特異的ハイブリダイゼーションが三重鎖を生じる実施形態では、オリゴヌクレオチドタグが2本鎖及び1本鎖のいずれかであることを選択することができる。従って、三重鎖が形成される場合、「相補物」という語は、1本鎖オリゴヌクレオチドタグの2本鎖相補物、および2本鎖オリゴヌクレオチドタグの一本鎖相補物、のいずれをも包含するものとする。
【0021】
本明細書において、「オリゴヌクレオチド」という語は、モノマー−モノマー相互作用の通常のパターン(例えば、Watson−Crick型の塩基対形成、塩基の積み重ね、Hoogsteenまたは逆Hoogsteen型の塩基対形成)を介して標的ポリヌクレオチドに特異的に結合し得る、天然の、または改変されたモノマーまたは結合からなる直鎖オリゴマー(例えば、デオキシリボヌクレオシド、リボヌクレオシド、それらのαアノマー型、ペプチド核酸(PNA))を包含する。通常、モノマーはホスホジエステル結合またはそのアナログにより連結され、少数のモノマーユニット(例えば3〜4)から数十のモノマーユニットまでの大きさのオリゴヌクレオチドを形成する。オリゴヌクレオチドが文字の列(例えば、「ATGCCTG」)により示される場合は常に、ヌクレオチドは左から右に5’→3’の順であり、特に断りのない限り、「A」はデオキシアデノシン、「C」はデオキシシチジン、「G」はデオキシグアノシン、「T」はチミジンを示すことは理解されよう。ホスホジエステル結合のアナログとしては、ホスホロチオエート、ホスホロジチオエート、ホスホルアニリデート、ホスホルアミデート等が挙げられる。通常、本発明のオリゴヌクレオチドは4つの天然のヌクレオチドを包むが、それらは、非天然のヌクレオチドアナログを含んでいてもよい。天然または非天然のヌクレオチドを有するオリゴヌクレオチドが使用可能な場合でも、例えば、酵素処理が必要な場合は通常、天然のヌクレオチドからなるオリゴヌクレオチドが必要であることは当業者には明らかである。
【0022】
二重鎖に関する「完全にマッチした」という語は、各鎖の各ヌクレオチドが他方鎖のヌクレオチドとWatson−Crick塩基対形成を受けるように、二重鎖を構成するポリヌクレオチド鎖またはオリゴヌクレオチド鎖が互いに2本鎖構造を形成することを意味する。この語はまた、用いられるヌクレオシドアナログ(例えば、デオキシイノシン、2−アミノプリン塩基を有するヌクレオシド、等)の対形成を包含する。三重鎖に関しては、この語は、三重鎖が完全にマッチした二重鎖および第3鎖からなり、各ヌクレオチドが、完全にマッチした二重鎖の塩基対とHoogsteen会合または逆Hoogsteen会合を受けることを意味する。逆に、二重鎖におけるタグおよびオリゴヌクレオチドの間の「ミスマッチ」とは、二重鎖または三重鎖におけるヌクレオチドの対またはトリプレット(triplet)が、Watson−Crick結合および/またはHoogsteen結合および/または逆Hoogsteen結合を受け損なうことを意味する。
【0023】
本明細書において、「ヌクレオシド」という語は、2’−デオキシ型および2’−ヒドロキシル型(例えば、KornbergおよびBaker,DNA Replication,第2版(Freeman,San Francisco,1992)に記載のもの)を始めとする天然ヌクレオシドを包含する。ヌクレオシドに関する「アナログ」とは、改変された塩基部分および/または改変された糖部分を有する合成ヌクレオシド(例えば、Scheit,Nucleotide Analogs(John Wiley,New York,1980);UhlmanおよびPeyman,Chemical Reviews,90:543−584(1990)、等に記載のもの)を包含する(ただし、特異的ハイブリダイゼーションが可能なものに限る)。そのようなアナログには、例えば、結合特性を増強し、縮重を低減し、特異性を増大させるように設計された合成ヌクレオシドが包含される。
【発明の詳細な説明】
【0024】
本発明は、分子(特にポリヌクレオチド)を、オリゴヌクレオチドタグを用いて標識および分類する方法を提供する。本発明のオリゴヌクレオチドタグは、複数の「ワード」、すなわち最少にクロスハイブリダイズしているサブユニットのセットから選択されるサブユニット、を包含する。このようなセットのサブユニットは、ミスマッチしたヌクレオチドが2つより少ない同じセットの別のサブユニットの相補物とは二重鎖または三重鎖を形成し得ない。そのため、二重鎖を形成する、レパートリーの任意の2つのオリゴヌクレオチドタグの配列が、2ヌクレオチド異なる場合より「近い(close)」ということはない。特定の実施形態では、レパートリーの任意の2つのオリゴヌクレオチドタグの配列は、例えば、サブユニットが、ミスマッチしたヌクレオチドが3つより少ない同じセットの別のサブユニットの相補物とは二重鎖を形成し得ないように、最少にクロスハイブリダイズしているセットを設計することによって、「さらに」離れることさえあり得る。このような実施形態では、より大きな特異性が達成されるが、タグの総レパートリーはより小さくなる。従って、一定の長さおよびワードサイズのタグについて、所望の特異性の程度と所望のレパートリーのサイズとの間でトレードオフを行う必要がある。本発明は、並行操作(配列決定、フィンガープリンティング、または他のタイプの分析)においてポリヌクレオチドを標識、分類するのに特に有用である。
【0025】
〔最少にクロスハイブリダイズしているサブユニットのセットからのオリゴヌクレオチドタグの構築〕
最少にクロスハイブリダイズしているセット用のサブユニットのヌクレオチド配列は、好都合なことに、図3に示される一般的なアルゴリズムに従う簡単なコンピュータプログラム(付録Iにソースコードが挙げられたプログラムminhxにより例示されている。)によって列挙される。minhxは、3種のヌクレオチドからなる4の長さのサブユニットを有する、最少にクロスハイブリダイズしているすべてのセットを算定する。
【0026】
図3のアルゴリズムは、最少にクロスハイブリダイズしているセットのサブユニットの特性、すなわち長さ、メンバー間の塩基の相違の数、および組成(例えば、2、3または4種の塩基からなる)を最初に定義することにより実施される。一定の長さおよび組成のすべての可能な配列からなるテーブルM,n=1が生じる(100)。最初のサブユニットSを選択し、テーブルの最後までi=n+1である連続したサブユニットSと比較する(120)。連続したサブユニットが、最少にクロスハイブリダイズしているセットのメンバーであるために必要なミスマッチの数を有する場合はいつも、新たなテーブルMn+1(125)にセーブされる。このテーブルは、前述の工程120までの経路で既に選択されたサブユニットを含む。例えば、比較の第一セットでは、MはSを含む;比較の第二セットでは、MはSおよびSを含む;比較の第三セットでは、MはS、SおよびSを含む、等。同様に、テーブルMにおける比較は、Sとすべての連続サブユニットMとの間にある。各連続したテーブルMn+1は、サブユニットが工程130までの連続する経路において除去されるので、その前のものより小さいことに留意されたい。テーブルMのすべてのサブユニットが比較された(140)後に、古いテーブルは新たなテーブルMn+1に置き換わり、次のラウンドの比較が開始される。選択されたサブユニットSと比較される連続したサブユニットを含まないテーブルMに達する(すなわちM=Mn+1)と、プロセスは停止する(160)。
【0027】
好ましくは、最少にクロスハイブリダイズしているセットはセットのすべての他のサブユニットのように二重鎖安定性にほぼ等しい寄与をするサブユニットを含有する。このように、すべてのサブユニットとその相補物との間で完全にマッチした二重鎖の安定性はほぼ等しい。このようなセットを選択するための指針は、至適なPCRプライマーの選択および二重鎖安定性の計算について報告された技術により提供される。例えば、Rychlikら,Nucleic Acids Research,17:8543−8551(1989)および18:6409−6412(1990);Breslauerら,Proc.Natl.Acad.Sci.,83:3746−3750(1986);Wetmur,Crit.Rev.Biochem.Mol.Biol.,26:227−259(1991)等。より短いタグ(例えば、約30ヌクレオチドまたはそれより少ない)について、RychlikおよびWetmurにより記載されたアルゴリズムが好ましく、より長いタグ(例えば、約30〜35ヌクレオチドまたはそれより大きい)については、Suggsら、Brown編のICN−UCLA Symp.Dev.Biol.,第23巻(Academic Press,New York,1981)の683−693頁に開示された演算法が使用可能である。明らかに、本発明の範囲内で最少にクロスハイブリダイズしているサブユニットのセットを設計するために当業者に利用可能な多くのアプローチがある。例えば、サブユニットを組み立てる場合、末端ヌクレオチドの異なる塩基の積み重ねエネルギーの影響を最小にするために、サブユニットは同じ末端ヌクレオチドを有するように提供され得る。このように、サブユニットを連結する場合、すべての隣接する末端ヌクレオチドの塩基の積み重ねエネルギーの総量は同じであり、これによりタグ融解温度の多様性が低減または除去される。
【0028】
最少にクロスハイブリダイズしているセットの好ましい実施形態は、そのサブユニットが4つの天然ヌクレオチドのうちの3つからなるセットである。以下でより詳細に述べるように、オリゴヌクレオチドタグ中のヌクレオチドの1タイプのヌクレオチドの欠損は、DNAポリメラーゼの5’→3’エキソヌクレアーゼ活性の使用により標的ポリヌクレオチドが固相支持体上にロードされることを可能にする。A、GおよびTからなる群から選択される4つのヌクレオチドを各々が含有する、最少にクロスハイブリダイズしているサブユニットのセットの例は次のとおりである。
【0029】
【表1】

【0030】
このセットでは、各メンバーはすべての他のメンバーの相補物と3つミスマッチした塩基を有する二重鎖を形成する。
【0031】
最少にクロスハイブリダイズしているセットのさらなる例を下記表Iに挙げる。明らかに、さらなるセットは、異なるグループのヌクレオチドを置換することにより、あるいは最少にクロスハイブリダイズしている公知のセットのサブユニットを用いることにより生じ得る。
【0032】
【表2】

【0033】
本発明のオリゴヌクレオチドタグおよびそれらの相補物は、自動化DNA合成機(例えば、Applied Biosystems,Inc.(Foster City,California)モデル392または394型DNA/RNA合成機)で、ホスホルアミダイトケミストリーのような標準ケミストリー(例えば、次の文献に開示されている。)を用いて便利に合成される。BeaucageおよびIyer,Tetrahedron,48:2223−2311(1992);Molkoら,米国特許第4980460号;Kosterら,米国特許第4725677号;Caruthersら,米国特許第4415732号;第4458066号;第4973679号、等。得られたオリゴヌクレオチドが特異的ハイブリダイゼーションし得るという条件で、別のケミストリー(例えば、ホスホロチオエート、ホスホルアミデートのような非天然骨格基(backbone group)で生じる。)も使用可能である。いくつかの実施形態では、タグは、酵素による処理または操作が可能な、天然に存在するヌクレオチドを含有してもよく、また、対応するタグ相補物は、分類の間、より安定な二重鎖の形成を促進する非天然ヌクレオチドアナログ(例えば、ペプチド核酸)または同様の化合物を含有してもよい。
【0034】
微粒子が支持体として用いられる場合、オリゴヌクレオチドタグおよびタグ相補物のレパートリーは、好ましくは、例えば、Shortleら,国際特許出願PCT/US93/03418に記載の「分裂および混合(split and mix)」技術を介するサブユニット様式(subunit−wise)合成により生じる。簡単に述べると、合成の基本ユニットは、オリゴヌクレオチドタグのサブユニットである。好ましくは、ホスホルアミダイトケミストリーを用い、3’ホスホルアミダイトオリゴヌクレオチドが最少にクロスハイブリダイズしているセット(例えば、上記に最初に挙げたセットについて、8つの4マー3’−ホスホルアミダイトがある)における各サブユニット用に調製される。合成は、Shortleらに開示されているとおりに、または、ヌクレオシドモノマーを用いる種々のオリゴヌクレオチドライブラリーを生じるために用いられている手法(例えば、Teleniusら,Genomics,13:718−725(1992);Welshら,Nucleic Acids Research,19:5275−5279(1991);Grothuesら,Nucleic Acids Research,21:1321−1322(1993);Hartley,ヨーロッパ特許出願第90304496.4号;Lamら,Nature,354;82−84(1991);Zuckermanら,Int.J.Pept.Protein Research,40:498−507(1992)に開示されている。)と全く同様に処理される。一般に、これらの手法はカップリング工程の間、成長するオリゴヌクレオチドへの活性化されたモノマーの混合物の適用を単に必要とする。
【0035】
2本鎖型のタグは、相補物鎖を別個に合成し、続いて二重鎖形成を可能にする条件下で混合することにより作製され得る。あるいは、2本鎖タグは、プライマー結合部位として働く公知のオリゴヌクレオチド配列に連結した一本鎖レパートリーを最初に合成することにより形成され得る。次いで、第2の鎖はプライマーと一本鎖レパートリーとを結合し、ポリメラーゼで伸長することにより合成される。この後者のアプローチは、Oliphantら,Gene,44:177−183(1986)に記載される。次いで、このような二重鎖タグは、本発明に従って標的ポリヌクレオチドの分類および操作用の標的ポリヌクレオチドと一緒にクローニングベクターに挿入され得る。
【0036】
特異的なハイブリダイゼーションが三重鎖形成を経て起きる実施形態では、タグ配列のコード化は、二重鎖形成タグについての原理と同じ原理に従う。しかし、サブユニット配列の選択において、さらなる制約が存在する。一般に、結合のHoogsteen型を経た第3鎖の会合は、2本鎖標的においてホモピリミジン−ホモプリントラックに沿って最も安定である。通常、塩基トリプレットは、T−ATまたはC−GCモチーフ(ここで、「−」はWatson−Crick対形成を示し、そして「」は結合のHoogsteen型を示す)を形成する。しかし、他のモチーフもまた可能である。例えば、Hoogsteen塩基対形成は、鎖の状態および組成に依存して、第3鎖(Hoogsteen鎖)と第3鎖に結合する二重鎖のプリンに富む鎖との間に平行および逆平行(antiparallel)の配向を可能にする。特定の実施形態で所望されるように、三重鎖の安定性を最大にするか、またはそうでなければ調節するための、適切な配列、配向、条件、ヌクレオシド型(例えば、リボースヌクレオシドまたはデオキシリボースヌクレオシドのどちらを用いるか)、塩基修飾(例えば、メチル化シトシン)の選択に関する広範な指針が文献中に見出される。例えば、Robertsら,Proc.Natl.Acad.Sci.,88:9397−9401(1991);Robertsら,Science,258:1463−1466(1992);Distefanoら,Proc.Natl.Acad.Sci.,90:1179−1183(1993);Mergnyら,Biochemistry,30:9791−9798(1991);Chengら,J.Am.Chem.Soc.,114:4465−4474(1992);BealおよびDervan,Nucleic Acids Research,20:2773−2776(1992);BealおよびDervan,J.Am.Chem.Soc.,114:4976−4982(1992);Giovannangeliら,Proc.Natl.Acad.Sci.,89:8631−8635(1992);MoserおよびDervan,Science,238:645−650(1987);McShanら,J.Biol.Chem.,267:5712−5721(1992);Yoonら,Proc.Natl.Acad.Sci.,89:3840−3844(1992);Blumeら,Nucleic Acids Research,20:1777−1784(1992);ThuongおよびHelene,Angew.Chem.Int.Ed.Engl.,32:666−690(1993)等。1本鎖タグまたは二重鎖タグをそれらの1本鎖相補物または二重鎖相補物にアニールするための条件は周知である(例えば、Jiら,Anal.Chem.,65:1323−1328(1993))。
【0037】
本発明のオリゴヌクレオチドタグの長さは、12〜60ヌクレオチドまたは塩基対とすることができる。好ましくは、オリゴヌクレオチドタグの長さは18〜40ヌクレオチドまたは塩基対である。さらに好ましくは、オリゴヌクレオチドタグの長さは25〜40ヌクレオチドまたは塩基対である。サブユニットの好ましい数、さらに好ましい数に関して、それらの範囲は次のように表すことができる。
【0038】
【表3】

【0039】
最も好ましくは、オリゴヌクレオチドタグは1本鎖であり、特異的なハイブリダイゼーションはタグ相補物とのWatson−Crick対形成により起こる。
【0040】
〔分子へのタグの結合〕
オリゴヌクレオチドタグは、当該分野で周知の種々の反応性官能基により、多くの異なるクラスの分子に結合し得る(例えば、Haugland,Handbook of Fluorescent Probes and Research Chemicals(Molecular Probes,Inc.,Eugene,1992);Khannaら,米国特許第4318846号)。表IVは、オリゴヌクレオチドタグまたは目的の分子上に存在し得る官能基およびカウンターパート反応基の例を提供する。官能基およびカウンターパート反応体がともに反応する場合、いくつかの場合では活性化の後に連結基が形成される。さらに、以下でより詳細に説明するとおり、タグは、選択された分子と同時に合成され、コンビナトリアルケミカルライブラリーを形成し得る。
【0041】
【表4】

【0042】
コンビナトリアルケミカルライブラリーの生成において特に好都合なクラスの分子は下記の形態の線形ポリマー分子を含む。
−(M−L)
【0043】
ここで、Lはリンカー(linker)部分であり、そしてMは、広い範囲の化学構造から選択され得、不活性な非立体的に障害となるスペーサー部分として働くことから、他の成分に結合する分岐点、標識に結合するための部位:オリゴヌクレオチドに結合するための部位、あるいは治療標的にハイブリダイズまたは結合するための他の結合ポリマー:または溶解性、二重鎖および/または三重鎖形成の促進に影響を与える他の基を結合するための部位として働き得る反応性官能基を提供することまでの範囲の機能を提供するモノマー(例えば、インターカレーター、アルキル化剤)である。このような線形ポリマー分子の配列およびその結果の組成は、BrennerおよびLerner(上記)により教示されたように、タグに結合するポリヌクレオチド内にコードされ得る。しかし、選択事象後、選択分子のタグを増幅し、次に配列決定する代わりに、タグそれ自体または付加コードセグメントは、目的の分子の放出後、例えば、タグ中の操作された部位の制限消化により、直接的に(いわゆる以下に記載の「一塩基」アプローチを用いて)配列決定することができる。明らかに、タグ部位の同時合成と両立できる一連のケミストリー工程により生産される任意の分子は、コンビナトリアルライブラリーの生成に用いることができる。
【0044】
好都合なことに、コンビナトリアルライブラリーの生成に使用可能な広範なホスフェート結合モノマーが存在する。次の文献は、本発明での使用に適するいくつかのホスホルアミダイトおよび/または水素ホスホネートモノマーを開示し、それらの合成およびオリゴヌクレオチドへの組み入れに関する指針を提供する。Newtonら,Nucleic Acids Research,21:1155−1162(1993);Griffinら,J.Am.Chem.Soc.,114:7976−7982(1992);Jaschkeら,Tetrahedron Letters,34:301−304(1992);Maら,国際出願PCT/CA92/00423;Zonら,国際出願PCT/US90/06630;Durandら,Nucleic Acids Research,18:6353−6359(1990);Salunkheら,J.Am.Chem.Soc.,114:8768−8772(1992);Urdeaら,米国特許第5093232号;Ruth,米国特許第4948882号;Cruickshank,米国特許第5091519号;Haralambidisら,Nucleic Acids Research,15:4857−4876(1987)、等。さらに特に、Mは、1〜20個の炭素原子、ならびに酸素、窒素およびイオウからなる群から選択される0〜10個のヘテロ原子を有する直鎖、環式または分枝有機分子構造であり得る。好ましくは、Mは、1〜16個の炭素原子を有するアルキル、アルコキシ、アルケニルまたはアリール;3〜8個の炭素原子および酸素、窒素およびイオウからなる群から選択される1〜3個のヘテロ原子を有するヘテロ環;グリコシル;またはヌクレオシジルである。さらに好ましくは、Mは、1〜8個の炭素原子を有する、アルキル、アルコキシ、アルケニルまたはアリール;グリコシル;またはヌクレオシジルである。
【0045】
好ましくは、Lはリン(V)連結基であり、このリン連結基は、例えば、ホシホジエステル、ホスホトリエステル、メチルホスホネートまたはエチルホスホネート、ホスホロチオエート、ホスホロジチオエート、ホスホルアミデートであり得る。一般に、ホスホルアミダイトまたは水素ホスホネート前駆体由来の結合が好ましく、そのため、本発明の線形ポリマー単位は、好都合にも、市販の自動化DNA合成機(例えば、Applied Biosystems,Inc.(Foster City,CA)モデル394等)で合成することができる。
【0046】
nは、MおよびLの性質に依存して大きく変わる。通常、nは、約3〜約100の範囲の値を取る。Mが、ヌクレオシドまたはそのアナログまたはヌクレオシドサイズのモノマーであり、Lがリン(V)結合の場合、nは約12〜約100の範囲の値を取る。Mが、ヌクレオシドまたはそのアナログまたはヌクレオシドサイズのモノマーであり、Lがリン(V)結合の場合、好ましくは、nは約12〜約40の範囲の値を取る。
【0047】
ペプチドは、本発明のタグに結合する別の好ましいクラスの分子である。本発明で使用可能なペプチド−オリゴヌクレオチド結合体の合成については、Nielsenら,J.Am.Chem.Soc.,115:9812−9813(1993);Haralambidisら(上記)および国際特許出願PCT/AU88/004417;Truffertら,Tetrahedron Letters,35:2353−2356(1994);de la Torreら,Tetrahedron Letters、35:2733−2736(1994)等の文献に記載されている。好ましくは、ペプチド−オリゴヌクレオチド結合体は、下記のように合成される。本発明に従って合成されたペプチドは、天然アミノ酸モノマーまたは非天然モノマー(天然アミノ酸のD異性体等を含む。)からなるものであってもよい。
【0048】
〔コンビナトリアルケミカルライブラリー〕
本発明のタグを用いるコンビナトリアルケミカルライブラリーは、好ましくは、Nielsenら(上記)で開示され、そして詳細な実施形態のために図4で図解された方法により調製される。簡単にいえば、固相支持体(例えば、CPG)は、タグを合成するために用いられるケミストリーおよびいくつかの選択プロセスを経る分子を合成するために用いられるケミストリーの両方に適合する切断可能なリンカーで誘導体化される。好ましくは、タグは、上述のようなホスホルアミダイトケミストリーを用いて、Neilsenら(上記)により推奨される改変(すなわち、メチル保護ホスファイトおよびホスフェート部分を有するDMT−5’−O−保護3’−ホスホルアミダイト−誘導体化サブユニットが、各合成サイクルに加えられる)により合成される。ライブラリー化合物は、好ましくは、Fmocまたは同等物(連続モノマーをカップリングする官能基をマスクする保護基)を有するモノマーである。DMTおよびFmoc保護基(本明細書中でサルコシンリンカーという)の両方を用いるケミストリーに対する適切なリンカーは、Brownら、J.Chem.Soc.Chem.Commun.,1989:891−893により開示され、この開示は参考として援用される。
【0049】
図4は、オリゴヌクレオチドタグと結合するペプチドのコンビナトリアルケミカルライブラリーを生成するためのスキームを例示する。固相支持体200は、Nielsenら(上記)により教示されるようにサルコシンリンカー205(下記式で例示される。)により誘導体化され、このリンカーは、試薬の接近を促進する伸長結合部分を有する。
【0050】
【化1】

【0051】
ここで、「CPG」は徐放性の多孔性ガラス支持体を表す。「DMT」はジメトキシトリチルを表し、そして、「Fmoc」は9−フルオレニルメトキシカルボニルを表す。好ましい実施形態では、オリゴヌクレオチドセグメント214は、最初に合成され、そのため2本鎖の形態で、微粒子または基質の様なものの上で分類した後に、制限エンドヌクレアーゼ部位が、ライブラリー化合物を切断するために提供される。連続したサブユニットS、S、S等の代替的な付加により、合成は進行してタグ212を形成し、そしてそれらの対応するライブラリー化合物モノマーA、A、A等により、合成は進行してライブラリー化合物216を形成する。「分裂および混合」技術を用いると多様性が生じる。
【0052】
最少にクロスハイブリダイズしているセット中のサブユニットは、ライブラリー化合物中に加えられたモノマーをコードする。従って、9ワードのセットは、9つのモノマーから構築されるライブラリー化合物を曖昧性なしにコードし得る。いくつかの曖昧さが受容可能であれば、単一のサブユニットは、1つより多いモノマーをコードし得る。
【0053】
合成が完了した後、産物は、切断および脱保護され(220)、タグライブラリー化合物225を形成し、次いで、この化合物は選択230(例えば、タンパク質のような予定された標的235への結合)を受ける。次いで、選択プロセス230から回収されたライブラリー化合物のサブセットは、固相支持体245上で、そのタグ部分(そこでは、相補的サブユニットおよびヌクレオチドがイタリック体で示される)を介して分類される(240)。オリゴヌクレオチドスプリント242をタグ相補物250に結合し、制限部位255を形成した後、結合体は、対応する制限エンドヌクレアーゼで消化され、ライブラリー化合物(図4の実施例中のぺプチド)をオリゴヌクレオチド部分から切断する。次いで、タグの配列、それゆえライブラリー化合物の同定は、以下に記載の本発明の好ましい一塩基配列決定技術により決定される。
【0054】
〔固相支持体〕
本発明で用いられる固相支持体は、広い種類の形態を有し得、例えば、微粒子、ビーズ、および膜、スライド、プレート、ミクロマシーンドチップ(micromachined chip)等が挙げられる。同様に、本発明の固相支持体は、広い種類の組成物を含み得、例えば、ガラス、プラスチック、シリコン、アルカンチオレート誘導体化金(alkanethiolate−derivatized gold)、セルロース、低架橋ポリスチレンおよび高架橋ポリスチレン、シリカゲル、ポリアミドが挙げられる。好ましくは、分離した粒子の集団のいずれかは、各々が同じタグ(および他はなし)への相補的配列の、均一のコーティング(または集団)を有するように用いられ、あるいは、単一支持体または数個の支持体は、各々が同じタグ(および他はなし)への相補的配列の、均一のコーティング(または集団)を含む、空間的に分離した領域で用いられる。後者の実施形態では、領域の面積は、特別な適用に従って変化し得、通常、数(例えば、3〜5)μmから数百(例えば、100〜500)μmの面積の領域範囲である。好ましくは、このような領域は、空間的に分離され、そのため隣接領域での事象(例えば、蛍光発光)により発生されるシグナルが、用いられる検出システムにより解明され得る。いくつかの適用では、1つより多いタグ相補物(例えば、同時配列分析、または別々にタグ化された分子を極めて近接に持ってくるための)の均一コーティングの領域を有することが、望ましくあり得る。
【0055】
タグ相補物は、当該タグ相補物が合成された固相支持体と共に使用しても、また、別途合成して、使用時に固相支持体に結合させてもよい。このことは、例えば、Lundら,Nucleic Acids Research,16:10861−10880(1988);Albretsenら,Anal.Biochem.,189:40−50(1990);Wolfら,Nucleic Acids Research,15:2911−2926(1987);Ghoshら,Nucleic Acids Research,15:5353−5372(1987)に開示されている。好ましくは、タグ相補物は、固相支持体上で合成し、その同じ固相支持体と共に使用される。固相支持体は、種々の形態を取ることができ、また、種々の結合部分を含んでいてもよい。そのような支持体としては、タグ相補物の均一集団が合成される領域を有する、微粒子、アレイまたはマトリックスが挙げられる。広範な種類の微粒子支持体が本発明で使用可能であり、例えば、徐放性の多孔性ガラス(CPG)、高架橋ポリスチレン、アクリルコポリマー、セルロース、ナイロン、デキストラン、ラテックス、ポリアクロレインにより作製される微粒子が挙げられる。これらは、例えば次の文献中に開示されている。Meth.Enzymol.,Section A,11−147頁,第44巻(Academic Press,New York,1976);米国特許第4678814号;第4413070号;第4046720号;Pon,19章,Agrawal(編),Methods in Molecular Biology,第20巻(Humana Press,Totowa,NJ,1993)。微粒子支持体としては、市販のヌクレオシド−誘導体化CPGおよびポリスチレンビーズ(例えば、Applied Biosystems,Foster City,CA);誘導体化磁気ビーズ;ポリエチレングリコールでグラフトされたポリスチレン(例えば、TentaGelTM,Rapp Polymere,Tubingen Germany)、等がさらに挙げられる。支持体の特性(例えば、物質、多孔度、サイズ、形態)の選択、および用いられる結合部分のタイプは、タグを用いる際の条件に依存する。例えば、酵素による連続的なプロセスを含む適用において、酵素の立体障害を最小にし、そして基質への接近を容易にする支持体およびリンカーが好ましい。最も適切な微粒子支持体を選択する際に、考慮されるべき他の重要なファクターとしては、サイズの均一性、合成支持体としての効率、既知の表面積の度合い、および光学特性(例えば、以下で十分に説明するとおり、表面で多くのビーズを扱う場合、透明で平滑なビーズは、計測的な(instrumentational)利点を提供する。)が挙げられる。
【0056】
微粒子表面上でタグを結合および/または合成するための結合部分の例は、例えば次の文献に開示されている。Ponら,Biotechniques,6:768−775(1988);Webb,米国特許第4659774号;Baranyら,国際特許出願PCT/US91/06103;Brownら,J.Chem.Soc.Commun.,1989:891−893;Damhaら,Nucleic Acids Research,18:3813−3821(1990);Beattieら,Clinical Chemistry,39:719−722(1993);MaskosおよびSouthern,Nucleic Acids Research,20:1679−1684(1992)。
【0057】
上述のように、タグ相補物はまた、単一の(または数個の)固相支持体上で合成され得、タグ相補物で均一にコートされた領域のアレイを形成する。すなわち、このようなアレイ中の各領域内で、同じタグ相補物が合成される。このようなアレイを合成するための技術は次の文献に開示されている。McGallら,国際出願PCT/US93/03767;Peaseら,Proc.Natl.Acad.Sci.,91:5022−5026(1994);SouthernおよびMaskos,国際出願PCT/GB89/01114;MaskosおよびSouthern(上記);Southernら,Genomics,13:1008−1017(1992);MaskosおよびSouthern,Nucleic Acids Research,21:4663−4669(1993)。
【0058】
好ましくは、本発明は、同じタグ配列の相補物で均一にコートされた微粒子またはビーズを用いて実施される。微粒子支持体、およびそれらの表面とオリゴヌクレオチドとを共有結合または非共有結合する方法は周知であり、次の文献により例示される。BeaucageおよびIyer(上記);Gait(編)Oligonucleotide Synthesis;A Practical Approach(IRL Press,Oxford,1984);および上述の文献。一般に、微粒子のサイズおよび形態は重要ではない;しかし、最少の試薬およびサンプルの使用でオリゴヌクレオチドタグの多くのレパートリーの構築および操作を容易にするので、直径数μm(例えば、1〜2μm)から数百μm(例えば、200〜1000μm)のサイズの微粒子が好ましい。
【0059】
いくつかの好ましい適用では、市販の徐放性の多孔性ガラス(CPG)またはポリスチレン支持体が、本発明における固相支持体として用いられる。このような支持体は、塩基不安定性のリンカーおよび結合した最初のヌクレオチド(例えば、Applied Biosystems(Foster City,CA))を用いて有効になる。好ましくは、500オングストローム〜1000オングストロームの間のポアサイズを有する微粒子が用いられる。
【0060】
他の好ましい適用では、小孔のない微粒子が、その光学特性のために用いられ、この微粒子は、平面支持体(例えば、顕微鏡スライド)の上で多くの微粒子を探知する場合、有利に用いることができる。特に、好ましい小孔のない微粒子は、Bangs Laboratories(Carmel.IN)から入手可能なグリシダルメタクリレート(glycidal methacrylate)(GMA)である。このような微粒子は、種々のサイズで有用であり、そしてタグまたはタグ相補物を合成するための種々の連結基で誘導体化される。好ましくは、タグ化された微粒子の多量(massively)の並行操作のために、直径5μmのGMAビーズが用いられる。
【0061】
〔標的ポリヌクレオチドの微粒子への結合〕
本発明の重要な態様は、同一のポリヌクレオチド(例えば、cDNAライブラリー由来)の集団の分類、ならびに各微粒子または領域が単一種のポリヌクレオチドのみを有するような微粒子あるいは固相支持体の分離領域へのそれらの結合である。この後者の条件は、タグのレパートリーをポリヌクレオチドの集団へ連結することにより、本質的に満たされ得る。次いで、連結産物は、クローン化され、増幅され、そしてサンプリングされる。サンプルが十分小さければ、以下でより詳細に説明するとおり、得られたライブラリーの実質的にすべてのタグポリヌクレオチド結合体は、唯一である。すなわち、各ポリヌクレオチドは、唯一のタグを有し、逆も同様である。次いで、ポリヌクレオチドは、タグをその相補物にハイブリダイズすることにより分類される。
【0062】
オリゴヌクレオチドタグのレパートリーは、多くの方法で(例えば、直接酵素で連結することによって;あるいは、タグ配列を含むプライマーを用いて、例えばPCRで増幅することによって)ポリヌクレオチドの集団に連結させることができる。最初の連結工程は、タグ−ポリヌクレオチド結合体の非常に大きな集団を生み出し、その結果、単一のタグが、一般に、多くの異なるポリヌクレオチドに結合する。しかし、結合体の十分に小さなサンプルを採取することにより、「ダブル」(すなわち、2つの異なるポリヌクレオチド上の同じタグ)を得る可能性は無視し得るものとなる(サンプル中の同じポリヌクレオチドについて異なるタグを得る可能性もあることに留意されたい。この場合は、ポリヌクレオチドが2回処理(例えば、配列決定)されることになるだけであり、通常は問題にならない)。以下でより詳細に説明するとおり、サンプル中にダブルを得る可能性は、ポアソン分布により評価することができる。これは、サンプル中の結合体の数が大きい(例えば、数千以上のオーダー)こと、および、タグのレパートリーが大きい(例えば、数万以上のオーダー)ため、特定のタグを選択する可能性が小さいことによる。一般に、サンプルが大きいほど、ダブルを得る可能性は大きくなる。そのため、タグ−ポリヌクレオチド結合体の大きなサンプルを選択すること(これにより、例えば、ショットガン配列決定操作において標的ポリヌクレオチドが十分にカバーされる。)と、小さなサンプルを選択すること(これにより、ダブルの数が最小化される。)と、の間に設計トレードオフが生じる。大半の実施形態では、ダブルの存在は、単に、さらなるノイズ源を与えるか、あるいは配列決定の場合は、スキャニングおよびシグナルプロセシングにおける小さな問題を生じさせるにすぎない。これは、多数の蛍光シグナルを与える微粒子が無視し得るのと同様である。本明細書において、分子(特にポリヌクレオチド)へのタグの結合に関する「実質的にすべて」という語は、本質的にダブルのないタグ−分子結合体の集団を得るのに用いられるサンプリング法の統計的性質を反映したものとして使用される。タグ−分子結合体の実際の割合の点では、「実質的にすべて」の意味は、タグがどのように用いられているかに依存する。核酸配列決定においては、「実質的にすべて」とは、好ましくは、タグの少なくとも80%が、他と異なるポリヌクレオチドを結合させていることを意味する。より好ましくは、タグの少なくとも90%が、他と異なるポリヌクレオチドを結合させていることを意味する。さらに好ましくは、タグの少なくとも95%が、他と異なるポリヌクレオチドを結合させていることを意味する。そして、最も好ましくは、タグの少なくとも99%が、他と異なるポリヌクレオチドを結合させていることを意味する。
【0063】
好ましくは、ポリヌクレオチドの集団がメッセンジャーRNA(mRNA)からなる場合、オリゴヌクレオチドタグは、mRNAを、タグ配列の相補物を含有するプライマーのセットで逆転写することにより結合される。このようなプライマーのセットの一例は下記配列を有し得る。
【0064】
【化2】

【0065】
ここで、「[W,W,W,C]」は、4つのヌクレオチドの9つのサブユニットのオリゴヌクレオチドタグの配列を表し、「[W,W,W,C]」は、上で挙げたサブユニット配列(すなわち、「W」はTまたはAを表す。)を表す。下線を引いた部分の配列は、任意の制限エンドヌクレアーゼ部位と同一である。その部位は、ビオチンを介した固相支持体への結合からポリヌクレオチドを放出させるのに用いることができる。上記プライマーに関して、微粒子に結合した相補物は下記の形態を有し得る。
5’−[G,W,W,W]TGG−リンカー−微粒子
【0066】
逆転写後、mRNAは、例えば、RNase H消化により除去され、cDNAの第2の鎖は、例えば、下記の形態のプライマーを用いて合成される。
5’−NRRGATCYNNN−3’
【0067】
ここで、NはA、T、G、Cのいずれか一つであり、Rはプリン含有ヌクレオチドであり、そしてYはピリミジン含有ヌクレオチドである。この特定のプライマーは、得られた2本鎖DNA中にBst Yl制限部位を作り、それは、Sal I部位とともに、例えばBam HIおよびXho I部位を用いたベクター中へのクローニングを容易にする。Bst YlおよびSal I消化の後、例示した結合体は下記の形態を有する。
【0068】
【化3】

【0069】
好ましくは、リガーゼベースの配列決定の方法を用いた場合、Bst YlおよびSal I消化フラグメントが下記の単一コピー制限部位を有するBam HI−/Xho I−消化ベクター中にクローン化される。
【0070】
【化4】

【0071】
これは、以下でより詳細に議論される配列決定プロセスの開始を可能とするFok I部位を添加する。
【0072】
増幅後の一本鎖のタグを露出させるための一般的な方法は、標的ポリヌクレオチド含有結合体をT4 DNAポリメラーゼまたは同様の酵素の5’→3’エキソヌクレアーゼ活性で消化することを含む。単一ヌクレオシドトリホスフェートの存在下で用いられる場合、このようなポリメラーゼは、単一ヌクレオシドトリホスフェートの相補物がテンプレート鎖に届くまで、2本鎖フラグメントの非テンプレート鎖に存在する3’陥凹(recessed)末端からヌクレオチドを切断する。このようなヌクレオチドが届いた場合、5’→3’消化は、効果的に停止する。というのは、除去活性がヌクレオチドを除去するより早い速度で、ポリメラーゼの伸長活性がヌクレオチドを付加するからである。結果として、3つのヌクレオチドで構成されるタグは、固相支持体上にロードするために容易に調製される。
【0073】
この技術はまた、標的ポリヌクレオチドの内部のFok I部位を選択的にメチル化し、一方ポリヌクレオチドの末端で一本鎖のFok I部位をメチル化されないまま残すために用いられる。最初に、末端Fok I部位は、デオキシシチジントリホスフェートとともにポリメラーゼを用いて1本鎖とされる。次いで、フラグメントの2本鎖部分は、メチル化され、その後、1本鎖末端は、4つすべてのヌクレオシドトリホスフェートの存在下で、DNAポリメラーゼを用いて満たされ、それによりFok I部位を再生する。明らかに、この手順は、Fok I 以外のエンドヌクレアーゼに一般化され得る。
【0074】
オリゴヌクレオチドタグが、特定のハイブリダイゼーション(例えば、上述のようにそれらを1本鎖にすることにより)のために調製された後、ポリヌクレオチドは、タグとその相補物との間の完全にマッチする二重鎖の形成に有利な条件下で、タグの相補的配列を含む微粒子と混合される。これらの条件を作るための広範囲の指針が文献中に存在する。このような指針を提供する例示的な文献としては、Wetmur,Biochemistry and Molecular Biology中のCritical Reviews,26:227−259(1991);Sambrookら,Molecular Cloning;A Laboratory Manual,第2版(Cold Spring Harbor Laboratory,New York,1989)、等が挙げられる。好ましくは、ハイブリダイゼーション条件は、完全にマッチした配列のみが安定した二重鎖を形成するのに十分にストリンジェントである。このような条件下で、それらのタグにより特にハイブリダイズされたポリヌクレオチドは、微粒子に結合した相補的配列に連結される。最終的に、微粒子は洗浄され、連結されないポリヌクレオチドが除去される。
【0075】
合成支持体として通常使用されるCPG微粒子が用いられる場合、微粒子表面上でタグ相補物の密度は、代表的にいくつかの配列決定操作に必要な密度以上である。すなわち、ポリヌクレオチドを種々の酵素に結合させる連続的な処理を必要とする配列決定アプローチにおいては、空間を密にとったポリヌクレオチドは、比較的大きな酵素のポリヌクレオチドへの接近を阻害する傾向がある。このような場合、ポリヌクレオチドは、好ましくは、タグ相補物がかなり過剰に(例えば、ポリヌクレオチドに対して10:1から100:1まで、あるいはそれ以上)存在するように微粒子と混合される。これにより、微粒子表面上におけるポリヌクレオチドの密度が、酵素の接近を阻害するほど高くなるのが防止される。好ましくは、微粒子表面上のポリヌクレオチド間の平均空間は30〜100nm位である。標準CPG支持体およびBallotiniビーズ(固体ガラス支持体の1種)に関する割合選択の際の指針は、MaskosおよびSouthern,Nucleic Acids Research,20:1679−1684(1992)中に見られる。好ましくは、配列決定の適用において、そして直径20〜50μmの範囲の標準CPGビーズが、約10のポリヌクレオチドでロードされ、そして直径5〜10μmの範囲のGMAビーズが、数万(例えば、4×10〜6×10)のポリヌクレオチドでロードされる。
【0076】
上記方法は、以下に記載される並行配列決定法とカップリングさせれば、mRNA集団をフィンガープリントするために用いることができる。部分配列情報は、上記方法のような分離された微粒子に結合したcDNAの大量の(例えば、1万〜10万)サンプルから同時に得られる。部分配列の頻度分布は、種々の細胞または組織型、ならびに疾患組織(例えば、ガン)からのmRNA集団を同定することができる。このようなmRNAフィンガープリントは、病状をモニタリングおよび診断するのに有用である(例えば、国際出願PCT/US95/21944。これは、同じ目的のための発現配列タグ(EST)の使用について記載する)。
【0077】
〔一塩基DNA配列決定〕
本発明は、DNA配列決定の従来の方法、例えば、Hultmanら,Nucleic Acids Research,17:4937−4946(1989)によって開示された方法とともに用いることができる。しかし、複数のポリヌクレオチドの並行または同時の配列決定に関しては、次の文献が挙げられる。Cheeseman,米国特許第5302509号;Tsienら,国際出願WO91/06678号;Rosenthalら,国際出願WO93/21340号;Canardら,Gene,148:1−6(1994);Metzkerら,Nucleic Acids Research,22:4259−4267(1994)。
【0078】
本発明で用いるのに適切であり、DNAフラグメントの電気泳動での分離を必要としないDNA配列決定の「一塩基」方法が、国際出願第PCT/US95/03678号に記載されている。この方法は次の工程を包含する。(a)突出鎖を有するポリヌクレオチドの末端にプローブを連結して、連結複合体を形成する工程であって、プローブは、ポリヌクレオチドの鎖に対して相補的な突出鎖を有し、かつ、ヌクレアーゼ認識部位を有する工程;(b)連結複合体から非連結プローブを除去する工程;(c)連結プローブの同定によりポリヌクレオチドの突出鎖における1つまたはそれ以上のヌクレオチドを同定する工程;(d)ヌクレアーゼで連結複合体を切断する工程;および(e)ポリヌクレオチドのヌクレオチド配列が決定されるまで(a)〜(d)の工程を繰り返す工程。以下にさらに記載するように、1つまたはそれ以上のヌクレオチドの同定は、標的ポリヌクレオチドからの連結複合体の切断前または切断後のいずれに行ってもよい。好ましくは、この方法は、天然のタンパク質エンドヌクレアーゼが用いられる場合は常に、配列決定操作の開始時に、標的ポリヌクレオチドをメチル化する工程をさらに包含する。
【0079】
この方法の重要な特徴は、標的ポリヌクレオチドに連結されるプローブである。プローブの好適な形態は、図1aに示されている。一般に、プローブは、一方の末端10において突出鎖を有する二本鎖DNAである。プローブは、認識部位と突出末端10との間に少なくとも1つのヌクレアーゼ認識部位12およびスペーサー領域14を含む。好ましくは、プローブはまた、標識16を含み、これは、この特定の実施形態において、突出鎖の反対側の末端に示されている。プローブは、種々の手段により、そして種々の位置において標識され得、唯一の制限は、選択された標識手段が、連結工程またはヌクレアーゼによるプローブの認識を邪魔しないということである。
【0080】
プローブの突出鎖10が、5’末端または3’末端であるかどうかは重要ではない。しかし、標的ポリヌクレオチドおよびプローブの突出鎖が、完全に一致する二重鎖を形成し得、特異的な連結を可能にすることが重要である。もし、標的ポリヌクレオチドおよびプローブの突出鎖が異なる長さであれば、生じるギャップは、例えば、Backmanら,欧州特許出願第91100959.5号に開示されている「ギャップLCR」におけるように、連結以前にポリメラーゼによってフィルインされ得る。好ましくは、プローブおよび標的ポリヌクレオチドの両方の鎖が、フィルイン工程なしに連結され得るように、それぞれの突出鎖におけるヌクレオチドの数が同じである。好ましくは、プローブの突出鎖は2〜6のヌクレオチドの長さである。以下に示すように、突出鎖の長さが長くなるにつれて、各連結および切断サイクルの間に、標的ポリヌクレオチドへ適用されるプローブ混合物の複雑性が増す。
【0081】
プローブの相補鎖は、好都合にも、自動DNA合成機(例えば、Applied Biosystems,Inc.(Foster City,California) モデル392または394 DNA/RNA Synthesizer)上で、標準的なケミストリーを用いて合成される。合成後、相補鎖は、組み合わされて二本鎖プローブを形成する。一般に、プローブの突出鎖は、混合物として合成されるので、すべての可能な配列は、突出部に表される。例えば、もし、突出部が4つのヌクレオチドからなっているなら、ある実施形態において、4つの混合物が次のように調製される。
【0082】
【化5】

【0083】
ここで、「NNN」はすべての可能な3マーを表し、「X」は鎖の二重鎖形成部分を表す。従って、上に挙げられた4つプローブの各々が、4すなわち64の異なる配列を含む。すなわち、4つのプローブの各々は64の縮重を有する。例えば、X...XNNNAは下記配列を含む。
【0084】
【化6】

【0085】
このような混合物は、例えば、Teleniusら(上記)に開示されているように、周知の技術を用いて簡単に合成される。一般に、これらの技術は、単に、縮重を導入したい位置でのカップリング工程の間、成長しているオリゴヌクレオチドへの活性化モノマーの混合物の適用を必要とするだけである。ある実施形態において、プローブの縮重を減少させることが所望され得る。これは、例えば、Kong Thoo Linら,Nucleic Acids Research,20:5149−5152または米国特許第5002867号に記載の、デオキシイノシン、2−アミノプリンのような縮重減少アナログを用いて達成され得る。
【0086】
好ましくは、ホスホジエステル結合を有するオリゴヌクレオチドについては、プローブの二重鎖形成領域の長さは約12〜約30塩基対であり、より好ましくは、その長さは約15〜約25塩基対である。
【0087】
従来のリガーゼが本発明に用いられる場合、以下でさらに説明するとおり、プローブの5’末端が、ある実施形態においてリン酸化され得る。5’モノホスフェートが、化学的にまたはキナーゼを用いて酵素的に(例えば、Sambrookら(上記))のいずれかで第2のオリゴヌクレオチドに結合され得る。化学的リン酸化は、HornおよびUrdea,Tetrahedron Lett.,27:4705(1986)に記載され、開示されたプロトコールを実施するための試薬は、市販されている(例えば、Clontech Laboratories(Palo Alto,California)からの5’Phosphate−ONTM))。従って、ある実施形態において、プローブは、下記の形態を有し得る。
【0088】
【化7】

【0089】
ここで、Y’はX’の相補ヌクレオチドであり、「p」はモノホスフェート基である。
【0090】
上記プローブは、種々の方法で標識可能である(放射性部分、蛍光部分、比色部分、化学ルミネセンスマーカー等の直接または間接結合を含む)。DNAの標識およびDNAプローブの構築のための方法の多くの包括的な概説が、本発明のプローブの構築に適用可能な指針を提供している。このような概説としては、例えば、Kricka編,Nonisotopic DNA Probe Techniques(Academic Press,San Diego,1992);Haugland,Handbook of Fluorescent Probes and Research Chemicals(Molecular Probes,Inc.,Eugene,1992);KellerおよびManak,DNA Probes,第2版(Stockton Press,New York、1993);およびEckstein編,Oligonucleotides and Analogues;A Practical Approach(IRL Press,Oxford,1991);Kessler編,Nonradioactive Labeling and Detection of Biomolecules(Springer−Verlag,Berlin,1992);Wetmur(上記)が挙げられる。
【0091】
好ましくは、プローブは、1つまたはそれ以上の蛍光色素で標識される(例えば、Menchenら,米国特許第5188934号;Begotら,国際出願PCT/US90/05565号に開示されている)。
【0092】
この方法によれば、プローブは、標的ポリヌクレオチドの末端へ連結され、各連結および切断のサイクルにおいて連結複合体を形成する。連結複合体は、標的ポリヌクレオチドおよびプローブの突出鎖がアニールし、そして、少なくとも一対のプローブおよび標的の同じ向きの鎖が連結された、すなわち、互いに共有結合された後に、形成された二本鎖構造である。連結は、酵素的または化学的のいずれかで達成され得る。化学的連結方法は、当該分野において周知である(例えば、Ferrisら,Nucleosides & Nucleotides,8:407−414(1989);Shabarovaら,Nucleic Acids Research,19;4247−4251(1991))。しかし、好ましくは、連結は、標準的なプロトコールにおいてリガーゼを用いて、酵素的に行われる。多くのリガーゼが公知であり、本発明の使用に適している(例えば、Lehman,Science,186:790−797(1974);Englerら,DNAリガーゼ,3−30頁,Boyer編,The Enzymes,Vol.15B(Academic Press,New York,1982)等)。好適なリガーゼは、T4 DNAリガーゼ、T7 DNA リガーゼ、E.coli DNAリガーゼ、Taqリガーゼ、PfuリガーゼおよびTthリガーゼを含む。これらの使用の際のプロトコールは周知である(例えば、Sambrookら(上記);Barany,PCR Methods and Applications,1:5−16(1991);Marshら,Strategies,5:73−76(1992))。一般に、リガーゼは、5’ホスフェート基が、接する鎖の3’水酸基への連結のために存在することを必要とする。これは、好都合に、5’ホスフェートを残すヌクレアーゼ(例えば、Fok I)を選択することによって、標的ポリヌクレオチドの少なくとも1つの鎖に対して提供される。
【0093】
非リン酸化プローブを用いる配列決定法の実施形態において、連結工程は、(i)リガーゼで標的ポリヌクレオチドへプローブを連結させ、その結果連結複合体が、一方の鎖上にニックを有して形成される工程;(ii)従来のプロトコールを用いて、キナーゼでニックにおいて5’水酸基をリン酸化する工程(例えば、Sambrookら(上記));および(iii)再度連結を行い、ニックにおいて鎖を共有的に連結させる、すなわち、ニックを除去する工程を包含する。
【0094】
〔微粒子表面での酵素的処理および/または結合事象の観察装置〕
本発明の目的は、タグおよびその相補物の特異的ハイブリダイゼーションによって、微粒子の表面上の同一分子、特に、ポリヌクレオチドを分類することである。一旦、このような分類が行われると、分子の存在またはそれらに対して行われる操作は、タグ化された分子の性質、微粒子が分離して(すなわち「バッチ」で)検出されるかどうか、反復された測定が所望であるかどうか、等に応じて、多くの方法で検出され得る。代表的に、分類された分子は、例えば、薬物開発において、結合のためにリガンドに曝されるか、または、例えば、ポリヌクレオチド配列決定において化学的または酵素的処理に供される。これらの使用の両方において、多くの微粒子上でのこのような事象または処理に対応する信号を同時に観察することがしばしば望まれる。分類された分子を担持する微粒子(本明細書において「ロードされた」微粒子と称する)が、このような大規模な並行操作に役立つ(例えば、Lamら(上記)に示されている)。
【0095】
好ましくは、発光信号(例えば、化学ルミネセンス、蛍光)が、事象または処理を検出するために用いられる場合は常に、ロードされた微粒子は、平面基板(例えば、ガラススライド)上に、(例えば、国際特許出願第PCT/US91/09217号、同第PCT/NL90/00081号および同第PCT/US95/01886号に記載されているような)走査システムでの検査のために分散されている。走査システムは、再現性よく基板を走査し、かつ、座標系によって、所定の領域に各微粒子の位置を規定し得るものである必要がある。ポリヌクレオチド配列決定に適用する場合は、微粒子の位置同定は、連続的な走査工程において反復可能であることが重要である。
【0096】
このような走査システムは、市販の構成要素(例えば、1つまたはそれ以上の光電子増倍管、あるいは、CCDアレイおよび、例えば、蛍光信号を励起、収集および分類するための適切な光学機器を備える検出システムとともに用いられるデジタルコンピューターによって制御されるx−y換算テーブル)から構築され得る。ある実施形態において、共焦光学システムが所望であり得る。4色配列決定での使用に適切な走査システムの一例が、図5に模式的に示されている。基板300(例えば、固定微粒子を有する顕微鏡スライド)がx−y換算テーブル302上に置かれ、これが、種々の市販のパーソナルコンピューター(例えば、Apple Computer(Cupertino,CA)から入手可能な486−ベースの機械またはPowerPC モデル7100または8100)のうちのいずれかであり得る適切にプログラムされたデジタルコンピューター304に接続され、それにより制御される。テーブル換算およびデータ収集機能のためのコンピューターソフトウェアは、National Instrumentsから入手可能なLab Windowsのような市販の実験ソフトウェアによって提供され得る。
【0097】
基板300およびテーブル302は、光を集め、基板300に固定した微粒子へ伝達し得る1つまたはそれ以上の対物レンズ308を有する顕微鏡306と動作が連動する。好ましくは、レーザーである光源312からの励起光線310が、光線スプリッター314(例えば、二色性ミラー)へ指向し、これが、光線を顕微鏡306および対物レンズ308を通して再指向し、今度は、対物レンズが光線の焦点を基板300に合わせる。レンズ308は、微粒子から発光された蛍光316を集め、それを、光線スプリッター314を通じて信号分配光学機器318へ指向し、それが、今度は、蛍光をいくつかの蛍光特性(例えば、強度、寿命)を電気信号に変換するための1つまたはそれ以上の適切な光学電気デバイスへ指向する。信号分配光学機器318は、帯域通過フィルター、ファイバー光学機器、回転ミラー、固定位置ミラーおよびレンズ、回折格子のような当該分野において標準的な種々の構成要素を備え得る。図5に図示するように、信号分配光学機器318は蛍光316を4つの分離した光電子増倍管330、332、334および336へ向け、次いで、これらの出力は、プリアンプおよびフォトンカウンター350、352、354および356に向けられる。フォトンカウンターの出力は、コンピューター304によって収集され、そこで、蓄積され、分析され、ビデオ360において観察され得る。あるいは、信号分配光学機器318は、蛍光信号318をCCDアレイ上に向ける回折格子であり得る。
【0098】
走査の際の位置付けの安定性および再現性が、間隔が密接な微粒子を分離するための解像度をかなりの程度まで決定する。好ましくは、走査システムは、間隔が密接な(例えば、1粒子直径またはそれ以下分だけ分離されている)微粒子を解像し得るべきである。従って、(例えば、CPG微粒子を用いる)ほとんどの用途において、走査システムは、少なくとも10〜100μm程度に対象物を解像する能力を有する方がよい。ある実施形態において、さらに高い解像度が所望であり得るが、解像度が増すにつれて、基板を完全に走査するのに必要な時間が増す。従って、ある実施形態において、速度と解像度との間で妥協が必要であり得る。走査時間の増加は、微粒子が配置していることが知られている(例えば、最初のフル走査から)位置のみを走査するシステムによって達成され得る。好ましくは、微粒子サイズおよび走査システム解像度が、1cm当たり約1万〜10万の間の微粒子の密度で平面上にランダムに配置される蛍光標識された微粒子の解像度を可能にするように選択される。
【0099】
配列決定に適用する場合は、ロードされた微粒子は、種々の方法で基板の表面に固定され得る。固定は、微粒子が、顕著な損失なく、試薬露出および洗浄の連続的なサイクルを行うのに十分に強力であるべきである。基板がガラスであるとき、その表面は、市販の試薬(例えば、Pierce Chemical)を用いて、アルキルアミノリンカーで誘導体化され得、これは次に再び従来のケミストリーを用いて、アビジンに架橋され、アビジン化された表面を形成し得る。ビオチン部分は、多くの方法でロードされた微粒子に導入され得る。例えば、ポリヌクレオチドにタグを結合するために用いられるクローニングベクターの画分(例えば、10〜15パーセント)が、タグの反対側のポリヌクレオチドの末端でポリヌクレオチド挿入物に隣接して(消化において粘着末端を提供する)唯一の制限部位を含有するように操作される。この部位は、微粒子にロードするためのポリヌクレオチドおよびタグで切り出される。ロード後、ロードされたポリヌクレオチドの約10〜15パーセントが、微粒子表面から遠位の唯一の制限部位を有する。関連の制限エンドヌクレアーゼで消化後、ビオチン部分を含有している適切な二本鎖アダプターが、粘着末端に連結される。それから、得られた微粒子が、アビジン化されたガラス表面に広げられ、そこで、ビオチン−アビジン結合を介して固定される。
【0100】
あるいは、好ましくは、連結による配列決定が用いられる場合、最初の連結工程において、プローブの混合物は、ロードされた微粒子にアプライされる。プローブの一画分は、配列決定法に必要であるようなIIs型制限認識部位を含み、プローブの一画分は、このような認識部位を有さないが、その代わりに、その非連結末端においてビオチン部分を含む。好ましくは、混合物は、約10〜15パーセントのビオチン化プローブを含む。
【0101】
さらに別の実施形態において、DNAがロードされた微粒子が、ガラス基板に塗布されると、DNAは、数時間(例えば、24時間)のインキュベーションで、ガラス表面に非特異的に吸着され、微粒子の顕著な損失なく、反復される試薬への露出および洗浄を可能とするために十分に強力な結合を形成し得る。好ましくは、このようなガラス基板は、フローセル(flow cell)であり、これは、ガラススライドにエッチングされた流路を含み得る。好ましくは、このような流路は、流体がそこを通って吸い上げられ得るように閉じられ、かつ、微粒子の単層が規定された観察領域内に閉じ込められるように、微粒子の直径と十分に近い深さを有する。
【0102】
〔並行配列決定〕
本発明のタグ化システムは、数キロベースまでの長さのポリヌクレオチドを配列決定するための一塩基配列決定法とともに用いることができる。タグ化システムは、標的ポリヌクレオチドの何千ものフラグメントが、1つまたはそれ以上の固相支持体上に分類され、同時に配列決定されることを可能にする。この方法の好適な実施形態によると、各分類されたフラグメントの一部分が、上述のような走査システムまたは画像分析システムに関連する、顕微鏡スライドのような共通の基板に固定された何千ものロードされた微粒子の各々において、段階的に配列決定される。配列決定されたフラグメントの部分のサイズは、いくつかの要因、例えば、生成および分類されたフラグメントの数、標的ポリヌクレオチドの長さ、用いられた一塩基法の速度および正確さ、微粒子および/または同時にモニターされ得る別個の領域の数に依存する。好ましくは12〜50塩基が各微粒子または領域で同定され、さらに好ましくは18〜30塩基が各微粒子または領域で同定される。この情報により、標的ポリヌクレオチドの配列が、重複する領域を介して12〜50塩基のフラグメントを照合することによって決定される(例えば、米国特許第5002867号に記載されている)。以下の引例は、所与の長さの標的ポリヌクレオチドを首尾良く再構築するために配列決定されなければならないフラグメントの部分を決定する際のさらなる指針を提供する。LanderおよびWaterman,Genomics,2:231−239(1988);Drmanacら,Genomics,4:114−128(1989);Bains,DNA Sequencing and Mapping,4:143−150(1993);Bains,Genomics,11:294−301(1991);Drmanacら,J.Biomolecular Structure and Dynamics,8:1085−1102(1991);およびPevzner,J.Biomolecular Structure and Dynamics,7:63−73(1989)。好ましくは、標的ポリヌクレオチドの長さは、1〜50キロベースである。より好ましくは、長さは、10〜40キロベースである。LanderおよびWaterman(上記)は、配列決定されるフラグメントの数(すなわちサンプルサイズ)、各フラグメントから得られた配列情報の量、および、標的ポリヌクレオチドが、ギャップ(すなわち「アイランド」)のない部分的な配列から再構築される可能性、の間の関係に関する指針を提供する。本発明において、所与のサンプルサイズおよび所与のフラグメント配列のサイズで得ることが可能な最大のポリヌクレオチドサイズを下に示す。
【0103】
【表5】

【0104】
フラグメントは、最小の重複で標的ポリヌクレオチドをカバーするフラグメントのセットを生成しようとする、いわゆる「直接的」なアプローチ、およびランダムに重複するフラグメントが生成される、いわゆる「ショットガン」アプローチを含む、種々の方法で標的ポリヌクレオチドから生成され得る。好ましくは、フラグメント生成についての「ショットガン」アプローチが、その簡便性および固有の縮重のために用いられる。例えば、標的ポリヌクレオチドをカバーする、ランダムに重複するフラグメントは、以下の従来の「ショットガン」配列決定プロトコールで生成される(例えば、Sambrookら(上記)に開示されている)。本明細書において、この文脈での「カバーする(cover)」とは、標的ポリヌクレオチド配列のすべての部分が、生成されたフラグメントの各サイズ範囲(例えば、すべてのフラグメントの長さは100塩基対〜200塩基対の範囲にある。)で表されることを意味する。簡潔には、適切なクローニングベクター(例えば、λファージ)における挿入物としての標的ポリヌクレオチドから始まって、ベクターは拡大され、精製され、適切な制限酵素で消化され、約10〜15μgの精製された挿入物を得る。代表的には、プロトコールは、1マイクログラムの開始DNA当たり約500〜1000のサブクローンをもたらす。挿入物は、調製ゲル電気泳動によってベクターフラグメントから分離され、従来の方法によってゲルから取り出され、そしてTE(Tris−EDTA)のような標準的な緩衝液に再懸濁される。ベクターから挿入物を切り出すために選択される制限酵素は、好ましくは、挿入物に適合する粘着末端を残し、これにより、挿入物が、ランダムに重複するフラグメントを生成するために、調製において自己連結され得る。Sambrookら(上記)で説明されているとおり、環状化DNAは、以下に用いられる断片化方法における直鎖状DNAに比べて、フラグメントのよりよいランダム分配を与える。挿入物を例えば、T4リガーゼで従来のプロトコールを用いて、自己連結した後、生成された連結挿入物が、標準的なプロトコール(例えば、Mn++の存在下における超音波処理またはDNase I消化)によって断片化される。断片化後、フラグメントの末端が、例えば、Sambrookら(上記)に記載されるように修復され、そして修復されたフラグメントは、ゲル電気泳動を用いて、サイズによって分離される。300〜500塩基対の範囲のフラグメントが選択され、従来の手段によってゲルから溶出され、上述のように、タグを有するベクター中に連結され、タグ−フラグメント結合体のライブラリーを形成する。
【0105】
上述のように、数千のタグ−フラグメント結合体を含有するサンプルがライブラリーから採取され、拡大される。その後、タグ−フラグメント挿入物がベクターから切り出され、上述のように、微粒子上のタグ相補物への特異的なハイブリダイゼーション用に調製される。標的ポリヌクレオチドのサイズに応じて、複数のサンプルが、タグ−フラグメントライブラリーから採取され、別々に拡大され、微粒子上にロードされ、配列決定される。選択されるダブルの数は、サンプル中に現れたタグレパートリーの割合に依存する[トリプル(同じタグを有する3つの異なるポリヌクレオチド)またはそれ以上を得る可能性は無視しても問題ない)。上述のように、サンプル中のダブルの可能性は、Poisson分布 p(ダブル)=m−m/2[mは、サンプル中のタグレパートリーの割合である。]から推定することができる。下記表Vは、所与のタグサイズ、サンプルサイズ、およびレパートリーの多様性について、サンプル中でダブルを得る可能性を挙げている。
【0106】
【表6】

【0107】
いずれの場合においても、次いで、ロードされた微粒子が、好ましくは、アビジン−ビオチン結合を介して、ガラス顕微鏡スライド上に分散、固定される。好ましくは、それぞれのランダムフラグメントの少なくとも15〜20のヌクレオチドが、一塩基法で同時に配列決定される。次いで、標的ポリヌクレオチドの配列は、アセンブリングコンティグに用いられるのと類似の、またはハイブリダイゼーションによる配列決定(上記文献に開示されている。)用に開発されたアルゴリズムを用いて、それらの重複する部分を通じてランダムフラグメントの部分的な配列を照合することによって再構築される。
【0108】
〔本発明の方法を実施するためのキット〕
本発明は、本発明の種々の実施形態を実施するためのキットを含む。好ましくは、本発明のキットは、固相支持体に結合されたタグ相補物のレパートリーを含む。さらに、本発明のキットは、対応するタグのレパートリーを(例えば、ポリヌクレオチドを増幅して分類するためのプライマーとして、またはポリヌクレオチドを増幅して分類するために用いられるクローニングベクターの要素として)含み得る。好ましくは、タグ相補物のレパートリーは、微粒子に結合される。キットはまた、酵素的プロセシング、検出ケミストリー(例えば、蛍光タグまたは化学ルミネセンスタグ)等のための適切な緩衝液、使用説明書、プロセシング酵素(例えば、リガーゼ、ポリメラーゼ、トランスフェラーゼ)を含み得る。配列決定のための重要な実施形態において、キットはまた、プロセシングのためにロードされた微粒子を固定するための、アビジン化された顕微鏡スライドのような基板を含み得る。
【0109】
〔cDNAライブラリーにおける新規のポリヌクレオチドの同定〕
cDNAライブラリーにおける新規のポリヌクレオチドは、上述のように、微粒子に結合したcDNA分子のライブラリーを構築することによって同定することができる。そして、ライブラリーの大きな画分、あるいは場合によりライブラリー全体について、並行して部分的な配列決定を行うことができる。mRNAの単離の後、そしておそらく、Soaresら,Proc.Natl.Acad.Sci.,91:9228−9232(1994)等に記載の、集団の正規化の後、下記プライマーを、従来のプロトコールを用いて、逆転写酵素による第1鎖合成のためにポリAテールにハイブリダイズすればよい。
【0110】
【化8】

【0111】
ここで、[W,W,W,C]は上述のようなタグを表し、「ACCAGCTGATC」は、二本鎖形態で制限部位を形成する任意の配列であり、「プライマー部位」は、PCRによって目的のポリヌクレオチドを増幅するためのプライマー結合部位として後に用いられる、ライブラリーのすべてのメンバーに共通の配列である。
【0112】
従来の技術による逆転写および第2鎖合成の後、二本鎖フラグメントが、上述のようにクローニングベクターに挿入され、増幅される。次いで、増幅されたライブラリーがサンプリングされ、サンプルは増幅する。増幅されたサンプルからのクローニングベクターが単離され、タグ化されたcDNAフラグメントが切り出され、精製される。上述のようなポリメラーゼでタグを一本鎖にした後、フラグメントはメチル化され、本発明によって微粒子上に分類される。好ましくは、上述のように、クローニングベクターは、タグ化されたcDNAが、分類および微粒子への連結後に好適な一塩基法による即座の配列決定を可能にする、Fok Iのようなエンドヌクレアーゼで切り出され得るように構築される。
【0113】
次いで、段階的な配列決定が、本発明に従って、ライブラリー全体またはライブラリーの1つまたはそれ以上の大きな画分で同時に行われ、ついには、十分な数のヌクレオチドが、ライブラリーが由来する生物のゲノムに特有の表示のために各cDNAについて同定される。例えば、もし、ライブラリーが哺乳動物のmRNAに由来するなら、14〜15ヌクレオチドの長さのランダムに選択された配列が、典型的な哺乳動物のゲノムの2000〜3000メガベースの間で特有の表示を有すると予想される。もちろん、細菌または他の下等生物に由来するライブラリーに特有の表示には、ずっと少ないヌクレオチドの同定で十分である。好ましくは、少なくとも20〜30ヌクレオチドが、特有の表示を確実にし、かつ、以下に記載するように、適切なプライマーの構築を可能にするために同定される。次いで、表にされた配列は、ユニークなcDNAを同定するために、既知の配列と比較され得る。
【0114】
次いで、ユニークなcDNAは、従来の技術(例えば、プライム部位および配列決定されたcDNAの部分を対象とするプライマーで製造されたPCRアンプリコンからプローブを構築する技術)によって単離される。次いで、プローブは、従来のスクリーニングプロトコールを用いてライブラリー中のcDNAを同定するのに用いられる。
【実施例】
【0115】
〔実施例I:pUC19由来の複数の標的ポリヌクレオチドの分類〕
3つの標的ポリヌクレオチドタグ結合体の混合物を次のように得る。まず、下記の6つのオリゴヌクレオチドを合成し、対として組み合わせ、タグ1、タグ2およびタグ3を形成する。
【0116】
【化9】

【0117】
ここで、「p」はモノホスフェートを示し、wは表Iで定義されるサブユニットを表し、「(**)」はそれぞれの相補物を表す。pUC19を、Sal IおよびHind IIIで消化し、大きなフラグメントを精製し、そしてタグ1、タグ2およびタグ3で別々に連結して、それぞれ、pUC19−1、pUC19−2およびpUC19−3を形成する。この3つの組換え体を、別々に増幅、単離し、その後、pUC19−1を、Hind IIIおよびAat Iで消化し、pUC19−2をHind IIIおよびSsp Iで消化し、pUC19−3を、Hind IIIおよびXmn Iで消化する。小さなフラグメントを従来のプロトコールを用いて単離して、それぞれ、約250、375および575塩基対の長さの3つの二本鎖フラグメントを得る。それぞれは、タグに隣接する陥没した3’鎖および反対側の末端には平滑または3’突出鎖を有する。およそ12nmolの各フラグメントを、製造者が推薦する、33μM デオキシシトシントリホスフェートを含有する反応緩衝液中で、5ユニットのT4 DNAポリメラーゼと混合する。反応混合物を37℃で30分間インキュベートし、その後、氷の上に置くことによって反応を止める。次いで、フラグメントを、従来の手段で精製する。
【0118】
CPG微粒子(粒子サイズ37〜74mm、孔サイズ500オングストローム、Pierce Chemical)を、MaskosおよびSouthen、Nucleic Acids Research、20:1679−1684(1992)によって開示されたリンカーで誘導体化する。3つのアリコートに分離後、タグ1、タグ2およびタグ3の相補物を、従来の自動化されたDNA合成機(例えば、model 392 DNA合成機(Applied Biosystems,Foster City,CA))を用いて、微粒子上で合成する。異なって誘導体化された微粒子のそれぞれ約1mgを、別個の容器に入れる。
【0119】
pUC19−1、pUC19−2およびpUC19−3から切り出されたT4 DNAポリメラーゼ処理のフラグメントを、製造者推薦のTaq DNAリガーゼ(New England Biolabs)のための緩衝液50μLに再懸濁する。次いで、混合物を、誘導体化CPG微粒子をそれぞれ1mg含有している3つの容器に等分する。5ユニットのTaq DNAリガーゼを各容器に添加し、その後、それらを55℃で15分間インキュベートする。氷の上に置くことによって反応を止め、そして微粒子を、繰り返し遠心分離およびTEに再懸濁することによって数回洗浄する。最後に、微粒子をNde I反応緩衝液(New England Biolabs)で再懸濁し、結合したポリヌクレオチドを消化する。微粒子からの分離後、Nde I消化によって放出されたポリヌクレオチドフラグメントを、Sequenase DNAポリメラーゼおよびフルオレセイン標識チミジントリホスフェート(Applied Biosystems,Foster City、CA)でインキュベートすることにより、蛍光標識する。次いで、そのフラグメントを、Applied Biosystems model 373 DNA配列決定機を用いて、非変性ポリアクリルアミドゲル上で別々に分析する。
【0120】
〔実施例II:SV40フラグメントの並行配列決定〕
表Iから選択される9つの4−ヌクレオチドサブユニットからなる36マーのタグのレパートリーを、上述のような分裂または混合手段によって、タグおよびタグ相補物を別々に合成することによって調製する。Sma I/Hind III消化M13mp19に連結可能なように、レパートリーを合成する。従って、実施例Iと同様に、1組のオリゴヌクレオチドはAの添加で開始し、9回の分裂および混合合成が続く。このオリゴヌクレオチドを、表Iのサブユニットに対応して3’−ホスホルアミダイト誘導体化4マーによりサブユニットで伸張する。次いで、Sma I認識部位(GGG)の半分、2つのCおよび5’−モノホスフェートを、例えば、Clontech Laboratories(Palo Alto,CA)から入手可能なPhosphate−ON試薬を用いて、ヌクレオチド毎に添加することで合成を完了する。他方の組のオリゴヌクレオチドは、3つのC(Sma I認識部位の一部)および2つのGの添加で開始し、9回の分裂および混合合成が続く。このオリゴヌクレオチドを、表Iのサブユニットの相補物に対応して、3’−ホスホルアミダイト誘導体化4マーにより伸張する。Hind III認識部位および5’−モノホスフェートのヌクレオチド毎の添加により合成を完了する。合成支持体からの分離後、オリゴヌクレオチドを下記の二重鎖の形成を可能にする条件下で混合する。
【0121】
【化10】

【0122】
次いで、二重鎖の混合物をSma I/Hind III消化M13mp19に連結する。タグ相補物のレパートリーを上述のようにCPG微粒子上で合成する。
【0123】
次に、Fok I部位ならびにEco RIおよびSma I部位の一部を含有する、下記のアダプターを調製する。
【0124】
【化11】

【0125】
このアダプターを、上述のように、Eco RI/Sma I消化M13に連結する。
【0126】
別に、Sambrookら(上記)に記載のプロトコールに従って超音波処理により、SV40 DNAを断片化する。得られたフラグメントを標準的なプロトコールを用いて修復し、そしてサイズによって分離する。300〜500塩基対の範囲のフラグメントを選択し、上記Sma I消化M13に連結してフラグメント−タグ結合体のライブラリーを形成し、次いで、増幅する。数千の異なるフラグメント−結合体を含有するサンプルをライブラリーから取り出し、さらに増幅し、そしてフラグメント−タグ挿入物を、Eco R IおよびHind IIIで消化することにより切り出す。切り出されたフラグメント−タグ結合体を、実施例Iに記載のように、デオキシシチジントリホスフェートの存在下でT4 DNAポリメラーゼで処理して、特異的なハイブリダイゼーションのためのオリゴヌクレオチドタグをCPG微粒子に曝露する。
【0127】
実施例Iに記載のように、ハイブリダイゼーションおよび連結後、ロードされた微粒子をFok Iで処理して、予め決定した配列の4−ヌクレオチド突出鎖を生成する。下記のプローブの10:1(プローブ1:プローブ2)の混合物を微粒子上のポリヌクレオチドに連結する。
【0128】
【化12】

【0129】
FAMは、Appiled Biosystemsから入手可能なアミノホスフェートリンカー(Aminolinker)を介してプローブ1の上段の鎖の5’−水酸基に結合されるフルオレセインを表す。ビオチンはまた、Aminolinker部分を介して結合され得、そして必要に応じて、ポリエチレンオキシドリンカー(例えば、Jaschkeら(上記))を介してさらに伸張され得る。
【0130】
次いで、ロードされた微粒子をアビジン化ガラススライドの表面上に堆積する。試薬および洗浄溶液は表面上へ送達および表面上から除去され得る。結合した微粒子を有するアビジン化スライドにより、走査型蛍光顕微鏡(例えば、Newport Model PM500−Cモーションコントローラー、488nmの励起光を発生するSpectra−Physics Model 2020アルゴンイオンレーザー、520nm波長域発光フィルター、等の装置を備えたZeiss Axioskop)で検査する。励起光および蛍光発光を、同じ対物レンズを通して、それぞれ、送達および収集する。二色性ミラーによって励起光および収集蛍光を分離する。二色性ミラーは、収集された蛍光を一連の帯域フィルターを介して、モニターされている蛍光物質に対応するフォトン計数デバイス(例えば、Hamamatsu model 9403−02光電子増倍管、Stanford Research Systems model SR445増幅器およびmodel SR430多重チャンネルスケーラーおよびデジタルコンピューター(例えば、486−ベースのコンピューター)を備える)へ指向する。コンピューターは、微粒子の位置を記録するスライドの二次元マップを生成する。
【0131】
最初のプローブを除去するためのFok Iでの切断後、結合微粒子上のポリヌクレオチドを、以下に記載の好適な一塩基配列決定法に従い、プローブ連結、洗浄、検出、切断および洗浄工程を20サイクル行う。各検出工程において、走査システムが、各微粒子で同定された塩基に対応する蛍光発光を記録する。一般に、下記の反応および洗浄を、特に記載されない限り、用いる酵素のための、製造者(New England Biolabs)の推薦する緩衝液で実施する。標準的な緩衝液もまた、Sambrookら(上記)に記載されている。
【0132】
下記の4組の混合プローブを、標的ポリヌクレオチドへの添加用に提供する。
【化13】

【0133】
ここで、TAMRA、FAM、ROXおよびJOEは、Aminolinker IIによって結合された分光解像可能な蛍光標識である(すべて、Applied Biosystems,Inc.,Forster City,Californiaから入手可能である)。太字のヌクレオチドは、Fok Iエンドヌクレアーゼのための認識部位であり、「N」は、4つのヌクレオチド(A、C、G、T)のいずれか1つを表す。TAMRA(テトラメチルローダミン)、FAM(フルオレセイン)、ROX(ローダミンX)、JOE(2’,7’−ジメトキシ−4’,5’−ジクロロフルオレセイン)、およびそれらのオリゴヌクレオチドへの結合についてはまた、Fungら,米国特許第4855225号に記載されている。
【0134】
上記プローブを、約5モル過剰量の標的ポリヌクレオチド末端中で、以下のようにインキュベートする。プローブを、200ユニットのT4 DNAリガーゼおよびアンカー化標的ポリヌクレオチドとともに、16℃で60分間、T4 DNAリガーゼ緩衝液中でインキュベートする。次いで、洗浄後、標的ポリヌクレオチドを、100ユニットのT4ポリヌクレオチドキナーゼとともに、37℃で30分間、製造者の推薦する緩衝液中でインキュベートし、洗浄し、そして再度、200ユニットのT4 DNAリガーゼおよびアンカー化標的ポリヌクレオチドとともに、16℃で30分間、T4 DNAリガーゼ緩衝液中でインキュベートする。洗浄は、スライド上に洗浄緩衝液(例えば、TE)を大量に連続的に流すことによって達成される(Sambrookら(上記)に開示されている)。連結−リン酸化−連結のサイクルおよび最後の洗浄後、結合微粒子が、蛍光標識の存在について走査され、その位置および特徴が走査システムによって記録される。次いで、標識された標的ポリヌクレオチド、すなわち連結複合体を、製造者の推薦する緩衝液中、37℃で30分間、10ユニットのFor Iとともにインキュベートし、その後、TE中で洗浄する。その結果、標的ポリヌクレオチドは各鎖上で1つのヌクレオチド分短くされ、次の連結および切断サイクルのために準備される。20のヌクレオチドが同定されるまでこのプロセスを続ける。
【0135】
【表7−1】


【表7−2】


【表7−3】

【0136】
【表8−1】


【表8−2】


【表8−3】

【図面の簡単な説明】
【0137】
【図1a】本発明で用いられる好適な「一塩基」配列決定法において使用される標識プローブの構造を示す図である。
【図1b】本発明で用いられる好適な「一塩基」配列決定法において使用される標識プローブの構造を示す図である。
【図1c】本発明で用いられる好適な「一塩基」配列決定法において使用される標識プローブの構造を示す図である。
【図2】好適な「一塩基」配列決定法において使用された標的ポリヌクレオチドおよびプローブの間で形成された連結複合体における、ヌクレアーゼ認識部位、連結部位および切断部位の相対的な位置を示す図である。
【図3】最少にクロスハイブリダイズしているセットを生成するための一般的なアルゴリズムを示すフローチャートである。
【図4】メンバー化合物が本発明のオリゴヌクレオチドタグで標識されているコンビナトリアルケミカルライブラリーを合成、使用するためのスキームを示す図である。
【図5】本発明に従って並行操作(例えば、ポリヌクレオチド配列決定)を行うための装置を示す概略図である。

【特許請求の範囲】
【請求項1】
複数のポリヌクレオチドの並行配列決定のための方法であって、
(a)微粒子の集団を用意する工程であって、各微粒子がただ1種のポリヌクレオチドを結合させている工程と、
(b)前記微粒子の集団を平面基板上に分散させる工程と、
(c)標識された配列決定試薬を用いて、処理および検出の連続的なサイクルを通じて、各微粒子からのヌクレオチドの配列を並行して同定する工程と、
を含む方法。
【請求項2】
微粒子が、1cm当たり10000微粒子以上の密度で基板上に分散している、請求項1に記載の方法。
【請求項3】
前記処理が、標識ヌクレオチドおよびポリメラーゼを用いて行われる、請求項2に記載の方法。
【請求項4】
前記処理が、標識ヌクレオチドおよびリガーゼを用いて行われる、請求項2に記載の方法。
【請求項5】
前記配列の長さが12〜50塩基である、請求項1に記載の方法。
【請求項6】
前記検出が、各微粒子における前記標識された配列決定試薬からの蛍光発光の測定を含む、請求項1に記載の方法。
【請求項7】
前記蛍光発光が、平面基板を移動させるx−y換算テーブルを備えた顕微鏡に記録される、請求項6に記載の方法。
【請求項8】
前記x−y換算テーブルがコンピューターによって制御される、請求項7に記載の方法。
【請求項9】
前記コンピューターが、微粒子の位置を記録する基板の二次元マップを生成する、請求項8に記載の方法。
【請求項10】
前記蛍光発光がCCDに記録される、請求項7に記載の方法。
【請求項11】
前記ポリヌクレオチドが50〜5000ヌクレオチドの長さを有する、請求項1に記載の方法。
【請求項12】
前記微粒子が、ガラス微粒子、磁気ビーズ、グリシダルメタクリレート微粒子およびポリスチレン微粒子からなる群より選ばれる、請求項1に記載の方法。
【請求項13】
前記微粒子が1〜100μmの直径を有する、請求項1に記載の方法。
【請求項14】
前記平面基板が、ガラス、シリコンおよびプラスチックからなる群より選ばれる、請求項1に記載の方法。
【請求項15】
ポリヌクレオチドがcDNAライブラリーを含む、請求項1に記載の方法。
【請求項16】
平面基板がフローセルである、請求項1に記載の方法。
【請求項17】
前記フローセルが、流体がそこを通って吸い上げられるように閉じられている、請求項16に記載の方法。

【図1a】
image rotate

【図1b】
image rotate

【図1c】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate


【公開番号】特開2008−301806(P2008−301806A)
【公開日】平成20年12月18日(2008.12.18)
【国際特許分類】
【外国語出願】
【出願番号】特願2008−52711(P2008−52711)
【出願日】平成20年3月3日(2008.3.3)
【分割の表示】特願平8−513298の分割
【原出願日】平成7年10月12日(1995.10.12)
【出願人】(598114930)ソレクサ・インコーポレイテッド (10)
【氏名又は名称原語表記】Solexa,Inc.
【住所又は居所原語表記】3832 Bay Center Place, Hayward, California 94545 U.S.A.
【Fターム(参考)】