説明

核酸の配列決定のための方法および手段

一群の核酸プローブが、所望の配列情報への鋳型を含む核酸にアニールされ、鋳型内での各プローブに相補的な配列の存在または非存在の判定を含むことによって配列情報を提供する、核酸配列決定、特に高密度フィンガープリンティングに関する。鋳型に少なくとも部分的に関連する参照配列が使用される。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、核酸の配列決定に関する。
【0002】
本発明は、特に、所望の配列情報に対する鋳型を含む核酸に一群の核酸プローブがアニーリングされる「高密度フィンガープリンティング」に関し、鋳型内の各プローブに対する相補的な配列の存在または非存在の判定によって配列情報がもたらされる。本発明の一部は、少なくとも部分的に鋳型に関連する参照配列の使用に基づき、既存の配列決定技術に伴う様々な問題を克服し、標準的な試薬および装置を用いて極めて大量の配列を1日の内に得ることを可能にする。好ましい実施形態では、さらなる利点を発揮することが可能になる。本発明は、配列解析用のアルゴリズムおよび技術、ならびに配列決定のための装置およびシステムにも関する。本発明は、当該技術において容易に利用することができる標準的なベンチトップ機器のみを利用し、膨大な配列決定に向けた努力を自動化することを可能にする。
【0003】
本発明は、各プローブが鋳型にハイブリダイズするか否かを判定することによって標的の「ハイブリダイゼーションスペクトル」を形成する連続的工程における一群のプローブのハイブリダイゼーションに関与するものであり、各プローブは一もしくは複数のオリゴヌクレオチド分子を含む。好ましくは、一群のプローブと鋳型鎖の長さを調節することで、「表示プローブ」(鋳型鎖に確実にハイブリダイズするプローブ)とともに任意の所定の鋳型鎖の高密度範囲が確定される。本発明は、得られたハイブリダイゼーションスペクトルと、鋳型鎖に類似する一もしくは複数の配列を含むことが期待される参照データベースとを比較することにより、一もしくは複数の参照配列内における鋳型鎖の一もしくは複数の予想される位置を決定することに、さらに関与する。本発明は、鋳型鎖のハイブリダイゼーションスペクトルを、その一もしくは複数の位置で期待されるハイブリダイゼーションスペクトルと比較することをさらに可能にし、それによって鋳型鎖の少なくとも部分的な配列情報が得られる。
【背景技術】
【0004】
ゲノム研究では多くの異なる方法が用いられるが、直接配列決定が最も重要なものである。実際、配列決定が十分かつ効率的に実施できる場合、ゲノミクスにおける主要な科学的問題のうちの3つ(配列の決定、遺伝子型同定、および遺伝子発現解析)すべてに対処することが可能であろう。モデル種の配列決定が可能で、個体の全ゲノム配列決定による遺伝子型同定が可能であり、cDNAへの変換および配列決定(各mRNAのコピー数を直接計数する)によりRNA集団を徹底的に解析することが可能であろう。
【0005】
配列決定によって対処可能な科学的および医学的問題の他の例として、エピゲノミクス(ゲノム内のメチル化シトシンの研究−メチル化されていないシトシンからウリジンへのbisulfite変換と、それに続く得られた配列と変換されていない鋳型配列との比較による)、タンパク質−タンパク質相互作用(酵母2ハイブリッド実験で得られたヒットの配列決定による)、タンパク質−DNA相互作用(染色体の免疫沈降後に得られたDNA断片の配列決定による)、ならびに多数のその他が含まれる。それ故、DNA配列決定には高効率的な方法が望ましい。
【0006】
しかし、マイクロアレイおよびPCR断片解析などの補助的方法に取って代わるためには、配列決定の極めて高度なスループットが要求される。例えば、生細胞は、約300,000個のメッセンジャーRNAのコピーを含み、各コピーの平均塩基長が約2,000である。したがって、1個の細胞内でさえRNAを完全に配列決定するのに、6億個のヌクレオチドをプローブしなければならない。多数の異なる細胞種からなる複雑な組織では、細胞種に特異的な転写物がさらに希釈されるために、作業がなお一層困難なものになる。これらの要求を満たすには、1日にギガベースのスループットが必要となる。下記の表は、各実験に要求されるスループットに関する見積もりの一部を示す(他に指定されないかぎり、ヒト)。
【0007】
【表1】

【0008】
本発明は、上記のすべてを適正なコストで手の届く範囲内に設定する。
【0009】
DNAの配列決定のための方法
蛍光ジデオキシヌクレオチドを用いるサンガーの配列決定(サンガー(Sanger)ら、PNAS 74 no.12:5463−5467頁、1977年)は、最も広く用いられる方法であり、96ひいては384−キャピラリーのシークエンサにおいて自動化に成功している。しかしながら、該方法は、鋳型の各塩基位置に対応する多数の断片の物理的分離に依存するため、極めて高度なスループットをもつ配列決定(現行の最高の機器は1日あたり最大200万のヌクレオチド配列を生成する)まで容易に拡張可能ではない。
【0010】
一群のプローブから選択されたプローブを用いて標的ポリヌクレオチドをプローブすることよって間接的に配列を得ることも可能である。
【0011】
ハイブリダイゼーションによる配列決定(sequencing by hybridization; SBH)では、最大で特定の長さのすべてのあり得る配列を表す一群のプローブが使用され(すなわち、1セットがすべてk量体、kはマイクロアレイ表面上に適合可能なプローブの数によって制限;100万本のプローブではk=10を用いることが可能)、鋳型がハイブリダイズされる。プローブセットから鋳型配列を再構築することは、複雑であり、ハイブリダイゼーションの動態の性質が本質的に予測不可能であることや、より大きな鋳型の配列決定に必要とされるプローブの数の組み合わせが膨大になることによって一層困難なものになる。たとえこれらの問題を克服可能であるとしても、各鋳型に対する何百万ものプローブを保有する1つのマイクロアレイが必要とされ、アレイは通常再利用できないことから、スループットは必然的に低いものになる。
【0012】
SBHに対する代替アプローチは、固体表面上に鋳型を置き、次いで一群のプローブを連続的にハイブリダイズさせることである。このアプローチを用いて多数の鋳型を同時に配列決定することが可能であるが、プロトコルの本質が連続的であることによって一群のプローブのサイズが必然的に制限される。結果として、極めて短い鋳型に限って配列決定できる。実際、k量体のプローブによって配列決定可能と期待される長さは、2にすぎない。すなわち16384プローブ(k=7)を用いると128ヌクレオチドである。実際のハイブリダイゼーション時間では、かかるプロトコルは実現可能ではない。ドルマナク(Drmanac)ら、Nature Biotech 1998年(16):54−8頁)の筆者らは、そこで同時にハイブリダイズ可能な何百もの分離膜上にある各鋳型を複製することによって同問題の克服に努めている。しかしながら、かかる次善策では、スループットが制限され、鋳型調製方法に関してさらなる要望が提起される。
【0013】
ナノポアシーケンシング(USゲノミクス(US Genomics)、米国特許第6355420号明細書)では、長いDNA分子が2つの反応チャンバを分離するナノポアを通過させられるにつれて、結合したプローブをチャンバ間の伝導度における変化として検出可能であるという事実が利用される。すべてのあり得るk−量体のサブセットでDNAを修飾することにより、部分配列を推定することが可能である。ナノポアのアプローチによる完全配列の獲得に対してこれまで実現可能な戦略が全く提案されていないが、もしそれが可能であれば、原理的には驚異的なスループット(30分以内にヒトゲノム1セット程度)が達成可能であろう。
【0014】
合成による配列決定(sequencing by synthesis; SBS)においては、様々なアプローチが設計されてきた。
【0015】
配列決定のスループットを増大させるためには、例えばガラス表面または類似の反応チャンバの上で多数の鋳型上での各塩基の取り込みを同時に視覚化できることが望ましいであろう。これはSBSによって達成される(例えば、マラメデ(Malamede)ら、米国特許第4863849号明細書、クマール(Kumar)、米国特許第5908755号明細書)。SBSに対しては2つのアプローチがある。すなわち、各々の取り込まれたヌクレオチドから放出された副産物が検出されるか、または永久的に付着した標識が検出される。
【0016】
パイロシーケンシング(例えば、国際公開第93/23564号パンフレット)では、取り込まれた各単量体の副産物を無機二リン酸塩(PPi)の形態で検出することによって鋳型の配列が決定される。すべての鋳型分子の反応の同期化状態を保つために、単量体が一度に1つずつ付加され、次の付加前に取り込まれていない単量体が分解される。しかしながら、多重の取り込みを阻止できないことから、単独重合体のサブ配列(同一単量体のラン)が問題を起こす。(鋳型の小分画での取り込みの欠如または取り込みの誤りによって最終的に真のシグナルを破壊することから)最終的に同期化が崩れ、現行の最高のシステムは、約200,000塩基/日の組み合わされたスループットによっても約20〜30塩基しか読み取ることができない。
【0017】
サンガー配列決定は各鋳型に対して精巧な装置(すなわちキャピラリー)を必要とする一方で、パイロシーケンシングは単一の反応チャンバ内で容易に並列化することができる。米国特許第6274320号明細書では、光ファイバに付着されたタンデムリピート線状1本鎖DNA分子を生成し、ここで並列処理が可能なパイロシーケンシング反応において解析される、ローリングサークル増幅の利用が記載されている。原理上、かかるシステムのスループットは、表面積(鋳型分子数)、反応速度およびイメージング機器(解像度)によってのみ制限される。しかしながら、PPiが検出可能なシグナルに変換される前に検出器から遠くへ拡散することを阻止する必要性は、反応部位の数が実際上制限されなければならないことを意味する。米国特許第6274320号明細書では、各反応が光ファイバの先端表面に位置する小型の反応容器内で生じるように制約されることから、ファイバ1本あたりの配列数が1つに制限されている。
【0018】
さらにより制限的であるのは、パイロシーケンシングによって得られる読み取り長さの短さ(<50bp)である。かかる短い配列は、全ゲノム配列決定において常に有用とは限らず、反応の平衡を保つセットが複雑であるが故に、読み取り長さの大幅な拡張が困難になる。報告されている最大100bpの読み取り長さは、極まれであって特定の鋳型についてのものである。
【0019】
放出された標識の検出を備える類似のスキームが米国特許第6255083号明細書に記載されている。ヌクレオチドの連続的付加およびエキソヌクレアーゼによって開裂された標識の検出を備えるスキームが国際公開第01/23610号パンフレットに記載されている。
【0020】
放出された標識または副産物の検出における主要な利点は、鋳型が後続する工程において無標識状態のままである点である。しかしながら、シグナルが鋳型から遠くに拡散することから、かかる配列決定スキームをマイクロアレイなどの固体表面上で並列化させることは困難でありうる。
【発明の開示】
【発明が解決しようとする課題】
【0021】
様々な態様において本発明は、先行技術の課題に巧妙に対処する。
【課題を解決するための手段】
【0022】
本発明は、一態様において、従属請求項および明細書に記載される様々な実施形態とともに、請求項1に記載される配列決定方法を提供する。
【0023】
請求項1の方法において、ローリングサークル増幅による該鋳型分子の増幅は、標的配列の多重コピーを含むタンデムリピート増幅産物が形成されるように増幅プライマーの伸長および鎖置換を引き起こす条件下で、ポリメラーゼおよび三リン酸塩を添加する工程を含んでもよい。
【0024】
使用されるプローブ群は、さらに下記で説明されるように完全群または部分群であってよい。
【0025】
鋳型の配列に対する参照配列は類似配列になろう。参照配列と鋳型の間の類似性は、多数の方法で測定可能である。例えば、同一ヌクレオチド位置の割合が広く利用される。より高度な測定では、例えばスミス−ウォーターマン(Smith−Waterman)のアライメントのように挿入および欠失の測定が可能になり、ダービン(Durbin)ら「Biological Sequence Analysis」(Cambridge University Press 1998年)のように確率的類似性スコア(probabilistic similarity score)が提供される。
【0026】
本発明の方法に要求される類似度は、使用されるプローブの数と特異性、ハイブリダイゼーションデータの質、鋳型の長さおよび参照データベースのサイズを含むいくつかの因子によって決定される。例えばシミュレーションによると、マッチプローブとミスマッチプローブの間で5℃の融点差がある(変動係数が1℃の)条件下で、256本のプローブおよび100bpの鋳型を有する参照としてのヒトゲノムの利用、それから最大で5%の配列の相違が許容可能であることが示される。これは例えば、参照としてヒトゲノムを利用してゴリラゲノムの配列決定を行うことに対応する。さらにプローブ数の増加、鋳型の長さの減少またはマッチ/ミスマッチの識別の改善により、例えば5〜10%、最大で10%、5〜20%、10〜20%または最大で20%といったなお一層類似性が低い配列が参照として使用されうる。
【0027】
本発明は、再配列決定、発現プロファイリング、遺伝的変動の解析または評価、およびエピゲノミクスなどにおいて、様々な方法で適用可能である。
【0028】
配列決定されるべき核酸はいかなるものも対象とすることができ、全ゲノム、BAC、一もしくは複数の染色体、cDNAおよび/またはmRNAであるとか、これらから得られるあるいはこれらを由来とするものであってもよい。
【0029】
一もしくは複数の入力分子は、例えば、dsDNA、DNA/RNA、dsRNA、ssDNAまたはssRNAを例とする2本鎖あるいは1本鎖であってよい。
【0030】
様々な実施形態が以下のように実施されうる。
【0031】
第1工程(工程1)は断片化、特に短い断片のショットガンライブラリの生成を含みうる。例えば、以下の方法を含む、断片を生成する酵素的および/または機械的方法を用いてもよい。
酵素的:
○DnaseIによる分解(Mn2+の存在下)、次いでダングリングssDNA末端の充填および/または酵素による短縮;
○MboIなどの比較的よく用いられるカッターによる切断;
○CviJ I、CviJ Iなどの極めてよく用いられるカッターによる部分的切断;
○制限酵素の混合による切断;
機械的:
○フレンチプレス;
○超音波処理;
○剪断;
上記各々の次に酵素による短縮および末端修復を行ってもよい。;
PCR
○ヘキサマーなどのランダムプライミング配列の使用(場合によってnested PCRのための配列を用いてテイリングされる);
○変性プライマーまたは低ストリンジェンシーの条件を用いたPCRによる;
○遺伝子ファミリーに特異的なプライマー(など)を用いたPCRによる
【0032】
PCRのアプローチにおいて、RCA(ローリングサークル増幅)プライマーのアニーリング部位を導入する配列でプライマーのテイリングを行うことで、場合によってこの工程を工程2と組み合わせてもよい。
【0033】
場合によって、後述するように、第1工程の後に工程「X」を実施してもよい。
【0034】
第2工程(工程2)(場合によって工程Xに後続する)は、RCAプライマーのアニーリング配列の導入を含みうる。これは例えば、ベクター(例えば細菌ベクター、ファージなど)内へのクローニング、次いでクローニング部位ならびにプライマーのモチーフの外側に置かれる制限酵素を用いる切断;一端もしくは両端での2本鎖アダプターのライゲーション;または各末端でのヘアピンアダプターのライゲーション(同時環状化を引き起こす)による場合がある。取り込まれうる任意の追加的で機能的な特徴には、環状化を促進する特徴および/またはヘルパーオリゴが下流分析のFRETにおいてドナーまたはアクセプタとして機能しうるヘルパーオリゴ結合部位が含まれる。
【0035】
場合によって、後述するように、工程2の後に工程「X」を実施してもよい。
【0036】
第3工程(工程3)は、1本鎖環状DNAの生成を含みうる。これは例えば、融解およびマラカス形状での末端間の自己アニーリングの後のヘアピンアダプターのライゲーション;dsDNAの自己ライゲーションとそれに続く融解;dsDNA環を形成するためのヘルパー断片へのライゲーションとそれに続く融解;ダンベル形状でのdsDNAの両末端へのヘアピンアダプターのライゲーション;ヘルパーのリンカー(RCAプライマーとしても機能しうる)を用いてのssDNAの自己ライゲーションによる場合がある。
【0037】
工程2および3は、場合によって単一の工程に統合してもよく、そこでは例えば環状化によってRCAプライマーのアニーリング配列および任意の他の望ましい特徴が同時に導入される。
【0038】
第4の工程(工程4)は、ローリングサークル増幅(RCA)を含みうる。これは以下のプロトコルに従う場合がある。
・環状ssDNAに対してRCAプライマーをアニールする。プライマーは固定化のために使用可能な反応性部分を保有する必要がある。
・RCAプライマーの付着基を用い、プライマー/鋳型複合体を活性化したアレイの表面にランダムに固定化する。同表面上のプライマー/鋳型複合体の密度は、RCA増幅後に重複産物(overlapping products)を生成することなく表面上のプライマー/鋳型複合体が最大数になるのに最適化される必要がある(下記参照)。同表面上のプライマー/鋳型複合体の密度は、例えばプライマー/鋳型複合体の濃度、表面上の付着部位の密度および/または反応条件(時間、緩衝液、温度など)によって制御されうる。
・RCAプライマーの付着基を利用して、活性化したアレイの表面にプライマーをランダムに固定化する。同表面上のプライマーの密度は、RCA増幅後に重複産物を生成することなく表面上のプライマー/鋳型複合体が最大数になるのに最適化される必要がある(下記参照)。同表面上のプライマーの密度は、例えばプライマーの濃度、表面上の付着部位の密度および/または反応条件(時間、緩衝液、温度など)によって制御されうる。
・RCAプライマーを環状ssDNAにアニールする。プライマーは、固定化のために使用可能な反応性部分を保有する必要がある。
【0039】
固定化およびアニーリングの後、次いで
・ポリメラーゼおよび4つのdNTPを添加することでローリングサークル増幅を開始する。
・場合によってRCAにFRETにおける蛍光ドナーまたは蛍光アクセプタとして機能可能な蛍光標識を組み込む。
・場合によってRCAに、
○タグに対して親和性を有する多価リンカー分子を用いる、内部架橋によるRCA産物の縮合;
○タグに対して親和性を有する分子とコンジュゲートされる蛍光標識を用いる、増幅後の標識、
といった複数の目的のために使用可能なアフィニティータグを組み込む。
【0040】
あるいは、RCAを溶液中で実施し、増幅後に産物を固定化してもよい。例えば、増幅および固定化に対して同一のプライマーを使用してもよい。別の選択肢では、固定化基を保有する修飾されたdNTPを増幅過程で取り込み、次いで取り込まれた固定化基を用いて増幅産物を固定化してもよい。例えば、ビオチン−dUTP、またはアミノアリル−dUTP(シグマ(Sigma))を使用してもよい。
【0041】
第5の工程すなわち工程5では、配列決定を行う。
・後述するように、一群の非固有プローブの連続ハイブリダイゼーションを用い、アレイ上で様々な鋳型の完全配列または部分配列を決定する。
・場合によって各鋳型の配列情報を、探索中の試料の典型的な配列のデータベースと比較することにより、試料内における各標的の相対比率および/またはデータベースに対する任意の遺伝的または他の構造的な差異を判定する。
【0042】
工程Xについては既に触れている。それは断片サイズの範囲(理想的には極めて優れた解像度1〜10%CVを有する)の選択工程である。利用可能な技術として以下のものが挙げられる。
・○dsDNAによるPAGE
○ssDNAによるPAGE
○アガロースゲル
を用いたゲル電気泳動および溶出による;
・クロマトグラフィー(例えばHPLC、FPLC)による;
・アフィニティータグ、例えばcDNA上での3’−ビオチンの使用。
【0043】
これらの工程は、本発明の態様および実施形態に従って方法の工程を実施する好ましい任意の工程および方法の開示を提供する。本明細書では、本発明の態様および実施形態として本明細書において逐語的に定義されるように、工程内で開示される特徴のすべての組み合わせが提供される。
【0044】
本発明は、先に記載の配列決定方法を改善した新規配列決定方法の開発に基づく一方、それらの困難の大部分を回避することを可能にする。それは、並列化しやすく(サイズ分画が不要)、長い読み取り長さに対して可能性をもたらす戦略である。
【0045】
本発明に従う方法は、3つの基本工程を含みうる。第1に、複数の鋳型鎖を含む試料から局所的に増幅された鋳型分子のランダムアレイが生成される(好ましくは単一の工程で)。第2に、ランダムアレイは、アレイ上で増幅された各鋳型内の各プローブに相補的な配列の存在または非存在の判定を伴う、一群のプローブを用いた連続ハイブリダイゼーションに従う。第3に、こうして得られたハイブリダイゼーションスペクトルを、あり得る挿入、欠失、多型、スプライス変異体または注目すべき他の配列上の特徴の決定を可能にする方法を有する参照配列データベースと比較する。比較工程は、探索工程とそれに続く整列化工程にさらに分かれる場合がある。
【0046】
ランダムアレイ合成(Random array synthesis)
増幅された鋳型を高密度で提供するには多数のアプローチが存在する。第1に、増幅された鋳型を機械的手段によってアレイ化してもよいが、各々個別の鋳型分子に対して別々の増幅反応が必要である(それ故にスループットが制限されてコストが増大する)。第2に、in−gel PCRを用いて鋳型をin situで増幅してもよい(例えば、米国特許第6485944号明細書およびミトラ RD(Mitra RD)、チャーチ GM(Church GM)、「In situ localized amplification and contact replication of many individual DNA molecules」、Nucleic Acids Research 1999年:27(24):e34に記載の通り)が、ゲルの使用が必要である(それ故に後続するハイブリダイゼーション反応と著しく干渉する。)。
【0047】
本発明では、複数の鋳型分子を含む試料から単一の反応でランダムアレイを合成するために、ローリングサークル増幅が有利に利用される。最大10〜10/mmの密度が達成可能である。本発明の実施形態において利用されるランダムアレイ合成プロトコルは以下を含みうる。
a.活性化表面を有する表面(例えばガラス)を提供する。
b.好ましくは共有結合を介してプライマーを付着させる。または共有結合の代わりに、強力な非共有結合(ビオチン/ストレプトアビジンなど)を用いてもよい。
b.好ましくは検出機器に適する密度で環状1本鎖鋳型を添加する。
c.鋳型をプライマーにアニールする。
d.ローリングサークル増幅を用いて増幅することで、各位置で表面に付着した長い1本鎖タンデムリピート鋳型が生成する。
【0048】
リザーディ(Lizardi)らは、「アイソサーマル・ローリングサークル増幅を利用した変異検出および一分子計数(Mutation detection and single−molecule counting using isothermal rolling circle amplification)」:Nature Genetics 第19巻、225頁を著している。
【0049】
この手順の修正には、固定化前に環状鋳型分子の活性化プライマーへの予備アニーリングを行うこと、および/またはプライマーへのアニーリングの際に環状化され、ライゲーション反応を用いて閉じられる「開環」鋳型分子を提供することが含まれる。
【0050】
「適切な密度」とは、好ましくはスループットを最大にする密度である。例えば、できるだけ多数の検出器(または検出器内の画素)が単一の鋳型分子を確実に検出する限界希釈である。任意の規則的なアレイ上での完全な限界希釈では、すべての位置の37%が単一の鋳型を保持し(ポアソン分布の形態故に)、残りが1つも保持しないか2つ以上保持することになる。
【0051】
例えば、6μmの画素サイズを有するTecan LS400上では、7.5×2.2cmの反応表面が4,500万画素を有する。限界希釈(ポアソン分布)を用いると、同画素の37%が単一の鋳型、すなわち1700万の鋳型を保持する。各鋳型上での150個のヌクレオチドの配列決定では、150サイクルで2.5Gbの配列がもたらされる。5分のサイクル時間で1日のスループットは約5Gbpであり、これはヒトゲノムの完全配列2セットに相当する。実際、信頼性よく特徴を検出するには2画素以上が必要でありうるが、検出器が単一の画素であるか複数の画素であるかに同じ論理が適用できる。
【0052】
固相のRCAに適する鋳型については、収量(鋳型配列のコピー数による)が最適化される一方で、下流の適用に適する配列が提供される必要がある。概して、小さい鋳型が好ましい。特に鋳型は、プライマー結合配列が20〜25bpおよびインサートが40〜500bpから構成可能である。ここでインサートは40〜150bpであってもよい。しかしながら、最大500bpまたは最大1000bpまたは最大5000bpの鋳型も考えられるが、同鋳型は配列決定段階でより低いコピー数、それ故により低いシグナルをもたらすことになる。最初に線状鋳型を環状化させてかつ環状化後にRCAを開始させるのに、プライマー結合配列を使用してもよい。または鋳型は、別々のRCAプライマーの結合部位を含みうる。
【0053】
ローリングサークル増幅を施された鋳型から生成されるシグナルを増大させるために、それらを濃縮する必要がありうる。RCA産物が本質的に元の環状鋳型の1000もしくはさらに10000もの数のタンデムリピートからなる1本鎖DNA分子であることから、同分子は極めて長いものになる。例えば、100bpの鋳型は、RCAを用いて1000倍に増幅されると約30μmとなり、それ故に数個の異なる画素(5μm画素の解解像を仮定)を横切ってそのシグナルを拡散させることになる。細いssDNA産物は、単に30μmの画素領域の極めて小さい部分を占めることから検出不能でありうるために、より低解像度の機器を用いても役に立たない可能性がある。したがって、シグナルを小さい領域内に濃縮できることが望ましい。
【0054】
(リザーディ(Lizardi)ら、上記)では、架橋剤としてエピトープで標識されたヌクレオチドおよび多価抗体を用いることによってRCA産物が縮合される。代替アプローチには、ストレプトアビジンによって架橋されたビオチン化ヌクレオチドが含まれる。
【0055】
あるいは、CTAB(例えば、ブルームフェルド(Bloomfeld) 「DNA condensation by multivalent cations」 in 「Biopolymers:Nucleic Acid Sciences」を参照)などのDNA濃縮剤を用いると濃縮が行われうる。
【0056】
RCAプライマーオリゴヌクレオチドを表面に固定化させるために、多種のアプローチが著されている(例えば、リンドルーズ(Lindroos)ら、「Minisequencing on oligonucleotide arrays:comparison of immobilisation chemistries」、Nucleic Acids Research 2001年:29(13) e69を参照)。例えば、ビオチン化オリゴは、ストレプトアビジンでコーティングされたアレイに付着されうる。NHで修飾されたオリゴは、エポキシシランで誘導体化されたまたはイソチオシアネートでコーティングされたスライドガラスに共有結合で付着されうる。スクシニル化されたオリゴは、アミノフェニルもしくはアミノプロピル由来のガラスとペプチド結合によってカップリングされうる。また、ジスルフィドで修飾されたオリゴは、チオール/ジスルフィド交換反応によってメルカプトシラン化されたガラス上に固定化されうる。さらに多数のものが文献に記載されている。
【0057】
短いプローブの連続ハイブリダイゼーションによる再配列決定
本発明の配列決定アプローチは、各々のプローブおよび標的に対するマッチ/ミスマッチの識別を伴う、一群のプローブのハイブリダイゼーションを含む。その結果は、各標的の「スペクトル」である。さらに、提供される参照配列においてスペクトルが位置決めされアライメントされることで、参照に対する標的の配列における差異が高精度で判定可能である。
【0058】
同スペクトルを利用することで、(1)参照配列内に各標的配列を明確に位置づけ、(2)標的と参照配列の間のあらゆる配列上の差異を正確に決定することが可能になるように、プローブ群および標的の長さが最適化される。
【0059】
第1の要求を満たすために、同群が(情報理論的な意味で)十分な情報を含むことで、標的が厳密に位置づけられる。単一の特異的な標的を位置づけるのには単一の長い特異的なプローブで十分であるが、予測される各標的に対して別々のプローブが必要とされるため、それを使用することはできない。その代わり、短い非固有プローブが使用される。最適な群であれば、1本のプローブあたり1ビットの情報に対応する、各標的へのハイブリダイズの統計的確率が50%であるプローブが使用される。50本のかかるプローブであれば、10兆を超える標的を識別する能力を有する。かかる群は、誤りおよび遺伝的多型に対して柔軟性があるという更なる利点を有する。発明者らの実験では、最大10SNPの存在下でさえ、一群の100本の4量体プローブがヒトトランスクリプトームにおいて100bpの標的を固有に配置する能力があることが示されている。
【0060】
第2の要求を満たすために、プローブ群は、標的をカバーする必要があり、配列差異がスペクトルにおいて明確な変化をもたらすように設計されなければならない。例えば、一群のすべてのあり得る4量体プローブは4倍の冗長性を有する任意の所定の標的を完全にカバーするであろう。任意の単一ヌクレオチド変化により、4本のプローブのハイブリダイゼーションの失敗および4本の他の特徴的なプローブの獲得という結果を招くであろう。
【0061】
プローブ群の感度は以下のように算出可能である。
【0062】
プローブは、一もしくは複数のオリゴヌクレオチドの混合物である。同混合物および各オリゴヌクレオチドの配列は、プローブの特異性を定める。プローブの希釈因子は、プローブが含むオリゴヌクレオチドの数である。プローブの有効な特異性は、標的に結合するのと同じ確率を有する非変性オリゴヌクレオチドの長さによって与えられる。例えば、最初の位置がすべての4つのヌクレオチド間で変化する(すなわち完全に変性される)4つのオリゴヌクレオチドからなる6量体プローブは、5つのヌクレオチドの有効な特異性を有する。
【0063】
一群とは、任意の所定のkの長さの標的が同群内の1本および1本のみのプローブによってハイブリダイズされるという特性を有する1セットのk量体プローブである。したがって、一群は完全で冗長性のない1セットのプローブである。
【0064】
1プローブ群の複雑度(complexity)Cは、群内のプローブ数である。
【0065】
一群内における位置の感度は、その位置で識別可能な異なる標的のセットである。例えば、プローブがある位置(GC/ATで示される)で混合されたGCまたは混合されたATである群は、G−A、CA、C−TおよびG−Tの差異(すなわち転移)に感度を示すが、塩基転換(GからCなど)には示さない。
【0066】
完全なプローブ群によるプロービングの場合、標的内の各位置が群内の各位置、すなわちkが互い違いに重なったプローブによって確実にプローブされる。しかしながら、各位置の感度が異なる場合があることから、標的内の一部の差異はkより少ないプローブによってのみ検出可能である。
【0067】
例えば、(GCAT)(GC/AT)(GC/AT)(G/C/A/T)(G/C/A/T)(GC/AT)(GC/AT)(GCAT)によって与えられる群は、8つの位置を有する(すなわちk=8)。最初と最後の位置は完全に変性されることから、これらの位置によって標的内の変化が全く検出されない。転移(GC<−>AT)が6つの位置によって検出される一方、塩基転換(GA<−>CT)が各プローブ内の2つの位置のみによって検出される。各位置の有効な特異性を合計することによって有効な特異性の算出が可能である。すなわち、0+0.5+0.5+1+1+0.5+0.5+0=4bpである。
【0068】
重要な標的では、プローブが標的内で繰り返される場合が多くなるであろう。かかるプローブは、依然として他方とハイブリダイズすることから任意の単一の位置での変化に対するその感度を失わせる。
【0069】
標的の長さをLと仮定すると、発明者らは少なくとも1本のプローブがその位置での変化に感度を示す確率(標的内の各位置に対する)を算出することができる。まず発明者らは、何本のプローブが反復のない標的内での注目される変化に感度を示すかを解明する必要がある。このkについては、先例において転移では6であり、塩基転換では2である。
【0070】
次いで、発明者らは、任意の所定のプローブが標的における他の位置の一もしくは複数に存在する(すなわちそれが繰り返される)という確率p(R)が
【数1】


であるという点に着目する。
【0071】
2kに感度を示すプローブのすべてが繰り返されるとは限らないという確率p(S)が
【数2】


である。
【0072】
任意の変化がkプローブの消失およびkの新たなプローブの出現を引き起こすことから指数は2kである。
【0073】
発明者らは、現在では標的の長さで与えられる感度を算出することができる。例えば、C=256、k=2、L=120は、p=98%を与える、すなわち256本のプローブを有する群がすべての塩基転換の98%(および転移の100%、k=6)に感度を示す。もし発明者らが、有効なkが1になるように群内のプローブの半分だけを使用する場合、塩基転換ではp=86%で、転移では99.7%である(k=3)。(63%の転移を有する)ヒトのような種であれば、全体の平均感度は95%である。
【0074】
SNPの数が標的の長さに比べて少ない限り、すなわち1本のプローブ長の範囲内で複数のSNPが生じない限り、この理論は厳密に有効である。実際の実験において、これはほぼ常に真実である。つまり例えば、ヒトゲノムDNAは1000ヌクレオチドあたりSNPを1つ程度含むことから、7つの塩基内に2つのSNPが存在する可能性は極めて低い。
【0075】
実際、発明者らは、1つのSNPを得るのに少なくとも2本の感度の優れたプローブを必要とする場合がある(すなわちハイブリダイゼーションデータが誤りやすいのが理由)。この場合、確率P(S)は1−p(R)2kc−lになり、計算結果もまた単純である。
【0076】
にもかかわらず、群のサブセットを用いて行う場合(時間と試薬を節約するため)、標的内の任意の位置が1本鎖もしくはそれ以外の上で確実にプローブされることが望ましい場合がある。換言すれば、発明者らは、プローブされない任意のk量体が反対鎖上で確実にプローブされるようにプローブのサブセットを探索する。かかるサブセットは、(G/A)、(C/T)、(G/T)または(C/A)を中央位置に配置することによって取得可能である。例えば(G/A)は標的内のGおよびAをプローブできないであろう。ここで反対鎖がCまたはTであることが保証される場合にはプローブされる。他のバリエーションもあり得る。
【0077】
(GC/AT)の変性位置は、2つの望ましい特徴を有する。第1に、それは各プローブ内の個々のオリゴが類似の融点を有することを保証する(それらがすべてのGCまたはすべてのATであるため)。第2に、同位置はヒトのすべてのSNPの63%を表す転移に対して感度を示すであろう。
【0078】
短いオリゴマープローブのハイブリダイゼーション
本発明では、一群のプローブが標的に対して連続的にハイブリダイズされることが示される。プローブ群の複雑度を制限するために、プローブを短く保つこと、好ましくは3〜6bpだけの有効な特異性を有することが望まれる。ここで発明者らは、短いオリゴマープローブをハイブリダイズするための要求事項について記載する。
【0079】
プローブはそれ自体のために有効にハイブリダイズするために安定化されるか、全く安定化されない。さらに安定化によってプローブと標的内に存在しうる任意の内部二次構造との競合が促進される。多種の方法において安定化が達成可能である。
・ハイブリダイゼーション反応において、塩、CTAB、マグネシウム、安定化タンパク質を例とする安定化添加剤を介する。
・プローブの複雑度を増大させずにその長さを拡張させる変性位置の添加を介する。例えば、「N」位置で拡張された6量体プローブは、実際には4つのオリゴヌクレオチドの混合物であってそれぞれが7塩基長を有するであろう。GとCの混合またはAとTの混合を示す(GC/AT)位置は、プローブを1塩基分拡張させる一方、複雑度を2倍にするにすぎないだろう(それを4倍にする代わりに)。
・Locked nucleic acid(LNA)(エキシコン(Exiqon)、デンマーク)、ペプチド核酸および/またはマイナー・グルーブ・バインダー(エポック・バイオサイエンシーズ(Epoch Biosciences)、米国)を例とするプローブ化学反応の修飾を介する。
・CTAB緩衝液中でハイブリダイズされるLNAを有する変性プローブを例とする上記の組み合わせ。
【0080】
これらの中で、1番目は標的をも安定化させることになる(それ故、潜在的にハイブリダイゼーションを阻止する安定な二次構造を誘導する)。プローブを選択的に安定化させる方法が好ましい。
【0081】
ハイブリダイゼーションの検出
ハイブリダイゼーションの検出においては多数のアプローチが知られている。
・直接蛍光。プローブが標識され、標的にハイブリダイズされるプローブの上昇する局所濃度によってハイブリダイゼーションが検出される。これは高倍率、共焦点光学または全内部反射蛍光(TIRF)を必要とする場合がある。
・エネルギー伝達。プローブがクエンチャーまたはドナーによって標識され、標的が相手のドナーまたはクエンチャーによって標識される。ハイブリダイゼーションがドナー蛍光の減少および/またはクエンチャー蛍光における増加によって検出される。
・単一の塩基伸長。ハイブリダイズされたプローブが蛍光染色を取り込む単一の塩基伸長反応におけるプライマーとして機能する(あるいは、パイロシーケンシングなどでは放出されたPPiが検出されうる)。
【0082】
好ましいアプローチが以下に示される。
プローブは、エピ蛍光顕微鏡またはレーザースキャナーで検出可能な、例えばCy3などの蛍光体によって標識される。多数の他の適切な染色は市販されている。プローブは、ハイブリダイズされたアレイの場所で、すべての液体中に存在するバックグラウンドを超えて、濃度の局所的上昇の検出を可能にするのに最適化された濃度でアレイにハイブリダイズされる。例えば、400nMが使用可能であり、または光学的設定に依存してプローブは1nM〜500nMもしくはさらに500nM〜5μMであってもハイブリダイズされうる。この検出スキームの利点は、それが洗浄工程を回避することから平衡ハイブリダイゼーション条件で検出の進行が可能であり、これによってマッチ/ミスマッチの識別が促進されるという点である。
【0083】
エネルギー伝達アプローチが以下に示される。
標的は、蛍光ドナーによって恒久的にハイブリダイズされたヘルパーオリゴヌクレオチドを保有する。短いプローブを融解させる洗浄に耐えるようにヘルパーが設計される。プローブはダーククエンチャーを保有する。例えば、ドナーは蛍光色素でクエンチャーはEclipseダーククエンチャー(エポック・バイオサイエンシーズ(Epoch Biosciences))であってもよい。多数の他のドナー/クエンチャーのペアが既知である(例えば、ホーグランド、R.P.(Haugland、R.P.)、「Handbook of fluorescent probes and research chemicals」、モレキュラープローブス(Molecular Probes Inc.)、米国を参照)。一般に、長距離にわたってクエンチング可能なフォレスター半径が長いプローブを有することが望ましい。プローブのハイブリダイゼーション時に、ドナー蛍光体のクエンチングによってハイブリダイゼーションが検出される。
【0084】
スペクトルの探索および調整
標的のスペクトルが与えられると、発明者らはまず参照配列内の標的の位置を探索し、配列差異を考慮する。単に標的と同じサイズの窓を用いて参照配列を走査し、各位置に対して期待されるスペクトルを算出し、同位置で期待されるスペクトルを観察されたスペクトルと比較することによって探索を行うことができる。最高のスコアを有する一もしくは複数の位置が返される。
【0085】
本発明の方法によって短期間に極めて多数のハイブリダイゼーションスペクトルが生成されることから、探索工程を最適化することが重要である。例えば、現行の実施では、ハイエンドワークステーション上で1秒あたり12億個のマッチを得るペースでスペクトル検索が進行し、発明者らは1台の配列決定機器に対応するのに10台のワークステーションが必要となると推定する。プログラム可能なハードウェア、すなわちフィールドプログラマブルゲートアレイ(FPGA)を用いて探索を促進することは本発明の別の態様である。探索アルゴリズムをMitrion−C(Mitrion AB、スウェーデン)に翻訳することにより、1台のワークステーションコンピュータ内のたった2個のFPGAチップを用いて30倍に加速することが可能である。
【0086】
一旦一もしくは複数のあり得る位置が見出されてくると、発明者らは観察されたスペクトルと期待されるスペクトルの間の任意の相違を説明する参照配列に対する修飾を探索する。発明者らは、この段階でSNP、短いindel、長いindel、マイクロサテライト、スプライス変異体などを例とする関連する修飾を参照配列に導入する場合がある。各修飾または修飾の組み合わせに対して、発明者らは観察されたスペクトルと期待されるスペクトルの間の類似性に対して再度スコアを計算する。最もあり得る修飾された1つまたは複数の参照配列が返される。極めて大きなパラメータ空間を探索するための方法は当該技術において既知である。例えば、ギブスサンプリング、マルコフ鎖モンテカルロ(MCMC)およびメトロポリス−ヘイスティング(Metropolis−Hastings)アルゴリズムが挙げられる。
【0087】
スペクトルを比較する場合、単純な2進数の重なりスコアを利用するか(両スペクトルにおいてハイブリダイズするもしくはハイブリダイズしない各プローブに対して1のスコアリング、その他の場合は0)、またはより精巧な統計的アプローチではスペクトルの重なりの段階的もしくは確率的測定を利用してもよい。複数の標的が標的内の同じ位置に位置する場合、任意の配列差異における信頼性を評価するのにより高レベルな解析を行ってもよい。
【0088】
自動化された高スループット配列決定のための装置
本発明に従う方法は、検出器の上部または内部に設置された反応チャンバを介して単に多数の試薬液を循環させることによって実施可能であることから特に自動化に適し、場合によって熱制御を伴う。
【0089】
一例では、検出器は、例えばフィルタキューブを介して導かれた白色光によって操作されることで、各標的に結合された蛍光体に適する別々の励起光および放射光の光路が創出されうるCCD撮像装置である。例えば、コダック(Kodak) KAF−16801E CCDが利用可能で、1670万の画素および2秒以下のイメージング時間を有する。かかる機器における1日の配列決定のスループットは最大で10Gbpであろう。
【0090】
反応チャンバは、
・光へのアクセスの容易さ
・閉じた反応チャンバ
・反応チャンバからの試薬の注入および除去のための注入口
・大気および試薬のチャンバへの出入りを可能にする流出口
を提供する。
【0091】
図3に示されるように、イメージング機器内での挿入に適する標準マイクロアレイのスライドフォーマット内に反応チャンバを構築してもよい。反応チャンバは機器内に挿入され、すべての配列決定反応の間そこに残存しうる。定着したプロトコルに従ってポンプおよび試薬フラスコが試薬を供給し、コンピュータがポンプとスキャナーの両方を制御し、反応と走査の間を交互に行う。場合により、反応チャンバを温度制御してもよい。また場合により、チャンバ上の複数の位置でのイメージングを可能にするように、位置決め段階で反応チャンバを配置してもよい。
【0092】
試薬の流れを指示するのに、ディスペンサユニットを電動弁に接続してもよい。ここではコンピュータの制御下で全体システムが稼働する。統合されたシステムとは、スキャナー、ディスペンサ、弁および容器ならびに制御用コンピュータで構成されるものであろう。
【0093】
本発明の更なる態様に従い、
取り込まれたまたは放出された標識を検出可能なイメージング部品、
イメージング部品に1サイクルあたり少なくとも1回アクセス可能なように一もしくは複数の付着した鋳型を保持するための反応チャンバ、
試薬を反応チャンバに提供するための試薬分配システム
を含む、本発明の方法を実施するための機器が提供される。
【0094】
反応チャンバは、少なくとも100/cm、場合によって少なくとも1,000/cm、少なくとも10,000/cmまたは少なくとも100,000/cm、または少なくとも1,000,000/cm、少なくとも10,000,000/cmまたは少なくとも100,000,000/cmの密度で付着した鋳型を提供し、イメージング部品はそれらを決定しうる。
【0095】
イメージング部品では、例えば光電子増倍管、フォトダイオード、電荷結合素子、CMOSイメージングチップ、近接場走査型顕微鏡、遠視野共焦点顕微鏡、広視野落射型顕微鏡および全内部反射顕微鏡からなる群から選択されるシステムまたは素子が利用されうる。
【0096】
イメージング部品は、蛍光標識を検出しうる。
【0097】
イメージング部品は、レーザー誘導蛍光を検出しうる。
【0098】
本発明に従う機器の一実施形態では、反応チャンバが、透明な表面、蓋、および反応チャンバを試薬分配システムに取り付けるためのポートを含む閉構造である。ここで透明な表面はその内部表面上に鋳型分子を保持し、イメージング部品は透明な表面を介するイメージングが可能である。
【0099】
本発明の更なる態様は、1本鎖DNA分子のランダムアレイを提供する。ここで、
各々の該分子は初期配列の少なくとも2つのタンデムリピートコピーからなり、
各々の該分子は密度10〜10/cm、好ましくは10〜10/cm、または好ましくは10/cm〜10/cmの密度でランダムな位置で表面上に固定され、
各々の該初期配列は1本鎖もしくは2本鎖のRNAまたはDNA分子の混合物を含む初期標的のDNAまたはRNAライブラリからのランダム断片を示し、
すべての該DNA分子の該初期配列はほぼ同一の長さである。
【0100】
一般に、同分子は、初期配列の少なくとも100、通常で少なくとも1000、または少なくとも2000、好ましくは最大で20000のタンデムリピートコピーを含むことになる。同分子は初期配列の50以上のタンデムリピートコピーを含む可能性があり、これは標準の顕微鏡を用いて検出可能である。
【0101】
好ましくは、初期配列は50%CV以内、好ましくは5〜50%CV以内、好ましくは10%CV以内、好ましくは5%CV以内の長さに等しい。すなわち変動係数(CV)が例えば5%であるような分布を有する。CVは平均で除される標準偏差である。初期配列の長さは等しい可能性がある。
【0102】
初期標的ライブラリは、例えば一もしくは複数のRNAライブラリ、mRNAライブラリ、cDNAライブラリ、ゲノムDNAライブラリ、プラスミドDNAライブラリまたはDNA分子のライブラリであるかあるいはそれらを含みうる。
【0103】
本発明の更なる態様は、1セットまたは一群のプローブを提供する。ここで、
各プローブは一もしくは複数のオリゴヌクレオチドからなり、
各々の該オリゴヌクレオチドは安定化され、
各々の該オリゴヌクレオチドはレポーター部分を保有し、
各プローブの有効な特異性は3〜10bpであり、
プローブセットは標的配列内のすべての位置の少なくとも10%に統計学的にハイブリダイズする。
【0104】
有効な特異性は4〜6bpでありうる。有効な特異性は3、4、5、6、7、8、9または10bpでありうる。
【0105】
プローブセットは、標的配列内のすべての位置の少なくとも25%、少なくとも50%、少なくとも90%、または標的配列内のすべての位置の100%に統計学的にハイブリダイズしうる。
【0106】
プローブセットは、標的または標的の反転表示(reverse complement)内の各位置がその位置でセット内の少なくとも1本のプローブによってハイブリダイズされるように、標的配列またはその反転表示内ですべての位置の100%にハイブリダイズしうる。
【0107】
標的配列は任意の標的配列であってよい。
【0108】
変性位置の導入、固定化核酸単量体の導入、ペプチド核酸単量体の導入および副溝結合の導入の一もしくは複数により、本発明に従うプローブセットを安定化してもよい。
【0109】
レポーター部分を、例えば蛍光体、クエンチャー、ダーククエンチャー、レドックス標識、および標識されたヌクレオチドによるプライマー伸長における遊離3’−OHまたはハイブリダイゼーション後の化学標識におけるアミンを例とする酵素的または化学的手段によって標識可能な化学反応基からなる群から選択してもよい。
【0110】
応用例
遺伝子発現プロファイリング
cDNA断片をランダムに配列決定することにより、それに対応するRNAの発現レベルが各RNA由来の断片の発生数を計数することによって定量可能である。構造的特徴(スプライス変異体、5’/3’UTR変異体など)および遺伝的多型を同時に発見することが可能である。
【0111】
遺伝的プロファイリング
参照ゲノムに対する配列差異の発生に着目することで個々の遺伝子型を同定するのに、全ゲノムのショットガンシーケンシングが利用可能である。例えば、この方法によってSNPおよびindel(挿入/欠失)は容易に発見され、その遺伝子型が同定される。ヘテロ接合体部位を識別するために、両方の対立遺伝子が確実に配列決定されるのに高密度の断片範囲が必要でありうる。
【0112】
本発明の開示に照らして、当業者にとっては本発明のさらなる態様および実施形態が明らかになろう。本明細書ではいずれかの箇所で引用されるすべての文献が参照として援用される。
【実施例】
【0113】
実施例1
カンタループのDNA鋳型の調製
【0114】
入力
2本鎖DNA鋳型
【0115】
鋳型の分取:
発明者らは、5’−GC−3’を認識し、その間を切断して平滑末端化する制限酵素CviJ I(ユルクス(EURx)、ポーランド)を用いた。発明者らは以下のように制限反応を設定した。
【0116】
【表2】

【0117】
反応物を37℃で1時間インキュベートした。
【0118】
製造業者のプロトコルに従ってPCRクリーンアップキット(キアゲン(Qiagen))を用いて開裂DNAを精製した。
【0119】
発明者らは、2%アガロースゲル上の分画を分析し、鋳型の特定のバッチおよび酵素に対する最適な反応条件を特定した(図1、4〜8ラインを参照)。
【0120】
発明者らは、最適な開裂反応を繰り返すことで、全体で5μgのDNAを得た(図1、1ライン)。
【0121】
鋳型サイズの選択:
発明者らは、8%の変性されていないPAGE(40cm高、1mm厚)上でDNAを精製した。各ウェルにlμg以下のDNAを充填し、目的の領域である95〜105のラダーを含ませた。ラダーは95、100および105の塩基対で3つのPCR断片からなった。
【0122】
発明者らは、SYBRゴールドを用いてゲルを染色し、スキャナー上の結果を解析し、その注目領域(95〜105bp)を切断し、製造業者のプロトコルに従ってElutaTube(商標)(ファーメンタス(Fermentas))を用いてDNAの望ましい領域を電気溶出させた。
【0123】
アダプターライゲーション:
ライゲーションにおいて1つのアダプターを用いた。
5’GCAGAATGCGCGGCCGCCTTAG 3’
3’CGTCTTACGCGCCGGCGGAATC 5’
【0124】
それは5’リン酸塩および内部Not I部位を含んだ。
【0125】
発明者らは、以下のライゲーション混合物を調製した。
【0126】
【表3】

【0127】
25℃で15分間インキュベートした。
【0128】
製造業者のプロトコルに従ってPCRクリーンアップ(キアゲン(Qiagen))を用いて精製した。図2を参照のこと。
【0129】
制限消化物Not I:
発明者らは以下の反応を設定した。
【0130】
【表4】

【0131】
1晩にわたり37℃で4時間インキュベートした。
【0132】
製造業者のプロトコルに従ってPCRクリーンアップ(キアゲン(Qiagen))を用いて試料を精製した。
【0133】
発明者らは、PCRクリーンアップを用いて精製を繰り返すことで、できるだけ多くの余分のアダプターを除去した。
【0134】
鋳型の環状化:
発明者らは、リンカーオリゴ5’−CGTCTTACGCGCCGGCGGAATCCGTCTTACGCGCCGGCGGAATC−3’の存在下で試料を変性させることによって1本鎖環を形成した。
【0135】
発明者らは以下を混合した。
【0136】
【表5】

【0137】
93℃に3分間加熱し、冷えるまで氷上に置き、迅速に回転させた。
【0138】
2×Quickライゲーション緩衝液(NEB)50μlおよびQuickリガーゼ(NEB)1μlを添加し、短時間混合した。
【0139】
25℃で15分間インキュベートした。
【0140】
この段階で環を形成し、RCAにおいて試料を維持できる。図3を参照のこと。
【0141】
固定化:
5μMのRCAプライマー(付加的な5’−AAAAAAAAAA−C6−NH−3’テイルを有する環状化リンカーと同一、ここでC6は6つの炭素リンカーでNHはアミン基)を15%DMSOを含むpH9.0の100mM 炭酸塩緩衝液中のSAL−1スライド(アスパー・バイオテック(Asper Biotech)、エストニア)上に固定化した。
【0142】
23℃で10時間インキュベートした。
【0143】
スライド表面上での活性部位の残存を阻止した。まず炭酸塩緩衝液(上記のとおりであるが40mM)中の15mM グルタミン酸に30℃で40分間漬けてから、pH8.0で2mg/mlのポリアクリル酸に室温で10分間漬けた。
【0144】
環状鋳型を緩衝液1(2×SSC、0.1% SDS)で30℃で2時間アニーリングし、次いで緩衝液1で20分間洗浄し、次いで緩衝液2(2×SSC、0.1% Tween)で30分間洗浄し、次いで0.1×SSCでリンスし、次いで1.5mM MgClでリンスした。
【0145】
増幅:
Phi29緩衝液、1mM dNTP、0.05mg/mL BSAおよび0.16u/μL Phi29酵素(すべてをNEB、米国から入手)の中でローリングサークル増幅を30℃で2時間実施した。
【0146】
環状化リンカーに相補的で6−FAMで標識されたレポーターオリゴヌクレオチドを上記のようにアニールした後、緩衝液3(5mM トリス pH8.0、3.5mM MgCl、1.5mM (NHSO、0.01mM CTAB)に漬けた。図4は、明確に視認される個々のRCA産物を含むスライドのごく一部を示す。
【0147】
プローブ群のハイブリダイゼーション:
(GCAT)(GC/AT)(GC/AT)(G/C/A/T)(GC/AT)(G/C/A/T)(GC/AT)のスキームに従って各プローブを設計した。ここで各々は、位置2、4および6で固定化核酸(エキシコン(Exiqon)、デンマーク)および3’末端でEclipseダーククエンチャー(エポック・バイオサイエンシーズ(Epoch Biosciences)、米国)を有する。
【0148】
プローブを緩衝液3中、100nMでハイブリダイズした。各プローブに対して温度ランプを使用することで、マッチ/ミスマッチの識別における最適温度を見出した。図5は、2つのマッチ/ミスマッチペアのハイブリダイゼーションの結果を示す。
【図面の簡単な説明】
【0149】
【図1】時間が次第に経過する場合のCviJによるcDNA試料(レーン4)の開裂結果を示すゲル像を示す。100bpに向けての平均断片長における漸減が観察される(100bpがサイズ標準の最短の断片である、レーン3)。最適な開裂反応がレーン1内に重点され、約100bpの断片が精製される。
【図2】アダプターライゲーションを示す。レーン1はサイズマーカー、レーン2はライゲートされていない断片、レーン3および4はライゲートされた断片である。大部分の断片が正確にライゲートされる。
【図3】環状化の前(レーン1)および後(レーン2)の断片試料を示す。レーン3は精製後の結果を示す。レーン3でリンカーが存在しないことを確認する。
【図4】488nmレーザーおよび6FAMのフィルタを用い、Tecan(商標) LS400を4μmの解像度で用いて走査されたランダムアレイスライドから得られた約0.8×2.4mmの切片を示す。スポットは個々の環状鋳型分子から生成された増幅産物を表す。
【図5】融点分析によって測定された短いオリゴヌクレオチドプローブの安定性を示す。
【図5A】100mM トリス pH8.0、50mM NaCl中でのCTABの効果を示す。
【図5B】TaqExpress緩衝液(ジェネティクス(GENETIX)、英国)中でのLNAの効果を示す。
【図5C】TaqExpress緩衝液中でのLNAの特異性を示す。
【図5D】変性位置を導入する効果を示す。ここで5LNAを有する7量体(左)、5LNAを有する7量体および2つの変性位置(中央)、3LNAを有する7量体および2つの変性位置(右)である。
【図6】ランダムアレイにハイブリダイズされ、蛍光顕微鏡によって可視化された、FAMで標識されたユニバーサル20量体プローブ(左群)およびTAMRAで標識された7量体プローブ(中央)を示す。アレイは2つの鋳型を用いて合成され、それらの両方がユニバーサルプローブに結合する必要があるが、配列CGAACCTで7量体に結合する必要があるのはそれらの片方のみである。ニコン(Nikon) TE2000倒立顕微鏡上で20倍の倍率でニコン(Nikon) DS1QM CCDカメラを使用して画像が取得された。右手群は期待どおりすべてのTAMRAで標識された特徴がFAM陽性でもあることを示す色合成画像を示す。

【特許請求の範囲】
【請求項1】
核酸の配列決定方法であって、
各々がプライマーのアニーリング配列および標的配列を含む複数の環状1本鎖DNA鋳型分子を含有するDNA試料を提供する工程と、
以下の工程によって、固定化および増幅された鋳型分子のランダムアレイを形成する工程と、
前記鋳型分子を増幅プライマーと接触させ前記プライマーのアニーリング配列にアニールさせることによって、アニールしたプライマー/鋳型の複合体を形成すること、
ローリングサークル増幅によって前記鋳型分子を増幅すること、
前記鋳型のアニーリング前に前記増幅プライマー、増幅前に前記プライマー/鋳型複合体、または増幅後に前記増幅された鋳型、を固定化することによって、固体支持体上に前記増幅された鋳型分子を確実に固定化すること、
テスト条件下で一群のプローブによってタンデムリピート増幅産物を探索し、各プローブについてそれが前記テスト条件下で前記標的配列にハイブリダイズするか否かを判定することによって、前記標的のハイブリダイゼーションスペクトルを得る工程と、
前記ハイブリダイゼーションスペクトルを、前記DNA鋳型の配列に対する一または複数の参照配列を含むことが期待される、複数の参照配列を含む参照データベース内の参照配列についてのハイブリダイゼーションスペクトルと比較することにより、一または複数の参照配列における前記標的配列の位置と予想される一または複数の位置を判定する工程と、
場合によって、実際のハイブリダイゼーションスペクトルと前記一または複数の位置で期待されるハイブリダイゼーションスペクトルとの比較することにより、前記標的配列の予想される配列および/または一もしくは複数の参照配列と比較した前記標的配列の配列における差異を計算する工程と、を含む、方法。
【請求項2】
一または複数の参照配列と比較した前記標的配列の配列における差異を計算する工程を含み、前記差異は、一塩基多型、挿入、欠失、選択的スプライシング、選択的転写開始部位、選択的ポリアデニル化、及びマイクロサテライトからなる群から選択される差異の一または複数または組み合わせである、請求項1に記載の方法。
【請求項3】
前記一群のプローブが3〜10塩基の有効な特異性を有するプローブを含む、請求項1または2に記載の方法。
【請求項4】
前記有効な特異性が4〜6個の塩基である、請求項3に記載の方法。
【請求項5】
各標的配列のサイズおよび前記一群のプローブの全部または一部の有効な特異性が、各プローブの各標的に対するハイブリダイゼーションの統計的確率が5%〜95%であるように調節される、請求項1〜4のいずれか一項に記載の方法。
【請求項6】
前記統計的確率が10%〜90%である、請求項5に記載の方法。
【請求項7】
前記統計的確率が25%〜75%である、請求項6に記載の方法。
【請求項8】
前記統計的確率が40%〜60%である、請求項7に記載の方法。
【請求項9】
複数のプローブ群によって探索する工程を含み、各プローブ群内の各プローブが他の各プローブ群内の各プローブと異なる、請求項1〜8のいずれか一項に記載の方法。
【請求項10】
前記参照データベースが、前記標的配列として同一種由来の核酸配列から作成される、請求項1〜9のいずれか一項に記載の方法。
【請求項11】
前記参照データベースが、前記標的配列と異なる種由来の核酸配列から作成される、請求項1〜9のいずれか一項に記載の方法。
【請求項12】
1本鎖DNA分子のランダムアレイを形成する工程を含み、
前記分子のそれぞれは初期配列の少なくとも2つのタンデムリピートコピーからなり、
前記分子のそれぞれは10〜10/cmの密度で表面上のランダムな位置に固定化され、
前記初期配列のそれぞれは1本鎖もしくは2本鎖RNAまたはDNA分子の混合物を含む初期標的DNAまたはRNAライブラリからのランダム断片を表し、
すべての前記DNA分子の前記初期配列はほぼ同じ長さである、請求項1〜11のいずれか一項に記載の方法。
【請求項13】
各分子が初期配列の少なくとも1000のタンデムリピートコピーを含む、請求項12に記載の方法。
【請求項14】
前記密度が10/cm〜10/cmである、請求項12または13に記載の方法。
【請求項15】
前記初期配列が50%CV以内で同じ長さである、請求項12〜14のいずれか一項に記載の方法。
【請求項16】
前記初期配列が10%CV以内で同じ長さである、請求項15に記載の方法。
【請求項17】
前記初期配列が5%CV以内で同じ長さである、請求項16に記載の方法。
【請求項18】
前記初期標的ライブラリがRNAライブラリ、mRNAライブラリ、cDNAライブラリ、ゲノムDNAライブラリ、プラスミドDNAライブラリまたはDNA分子のライブラリである、請求項12〜17のいずれか一項に記載の方法。
【請求項19】
前記プローブ群において、
各プローブは一または複数のオリゴヌクレオチドからなり、
前記オリゴヌクレオチドのそれぞれは安定化され、
前記オリゴヌクレオチドのそれぞれはレポーター部分を有し、
各プローブの有効な特異性は3〜10bpであり、
前記プローブセットは、ランダムなまたは任意の標的配列内のすべての位置の少なくとも10%が、該プローブセット内の少なくとも1本のプローブと統計的にハイブリダイズするようになっている、請求項1〜18のいずれか一項に記載の方法。
【請求項20】
前記有効な特異性が4〜6bpである、請求項19に記載の方法。
【請求項21】
前記プローブ群が標的配列内のすべての位置の少なくとも25%に統計的にハイブリダイズする、請求項19または20に記載の方法。
【請求項22】
前記プローブ群が標的配列内のすべての位置の少なくとも50%に統計的にハイブリダイズする、請求項21に記載の方法。
【請求項23】
前記プローブ群が標的配列内のすべての位置の少なくとも90%に統計的にハイブリダイズする、請求項22に記載の方法。
【請求項24】
前記プローブ群が標的配列内のすべての位置の100%に統計的にハイブリダイズする、請求項23に記載の方法。
【請求項25】
変性位置の導入、Locked Nuceleic Acid(LNA)単量体の導入、ペプチド核酸(PNA)単量体の導入およびマイナーグルーブバインダー(MGB)の導入の一もしくは複数によって安定化される、請求項19〜24のいずれか一項に記載の方法。
【請求項26】
前記レポーター部分は、蛍光体、クエンチャー、ダーククエンチャー、レドックス標識、および、標識されたヌクレオチドによるプライマー伸長のための遊離3’−OHもしくはハイブリダイゼーション後の化学標識のためのアミンを例とする酵素的または化学的手段によって標識可能な化学反応基からなる群から選択される、請求項19〜25のいずれか一項に記載の方法。
【請求項27】
前記ハイブリダイゼーションスペクトルは、ホストコンピュータに取り付けられるフィールドプログラマブルゲートアレイ(FPGA)およびコンピュータ可読記憶デバイスを含むスペクトル検索機器を用いて比較され、
前記FPGAはスペクトル検索を行うように設定され、
前記コンピュータ可読記憶デバイスは参照ヌクレオチド配列およびハイブリダイゼーションスペクトルセットを格納し、
前記ホストコンピュータは前記参照ヌクレオチド配列および各々の前記ハイブリダイゼーションスペクトルを有する前記FPGAを提供するように設定され、
前記FPGAは、参照ヌクレオチド配列およびハイブリダイゼーションスペクトルとともに提供される場合、前記ハイブリダイゼーションスペクトルと前記参照ヌクレオチド配列の間で最もよくマッチする前記一もしくは複数の位置を格納するように前記コンピュータ可読記憶装置に書き込む、請求項1〜26のいずれか一項に記載の方法。
【請求項28】
請求項1〜27のいずれか一項に記載の方法を制御するようにプログラムされるコンピュータプロセッサ。
【請求項29】
請求項28に記載のコンピュータプロセッサ用のプログラムを有するコンピュータ可読デバイス。
【請求項30】
請求項1〜27のいずれか一項に記載の方法の実行から、核酸に対する配列情報を提供するようにプログラムされるコンピュータプロセッサ。
【請求項31】
請求項30に記載のコンピュータプロセッサ用のプログラムを有するコンピュータ可読デバイス。
【請求項32】
1本鎖DNA分子のランダムアレイであって、
前記分子のそれぞれは初期配列の少なくとも2つのタンデムリピートコピーからなり、
前記分子のそれぞれは10〜10/cmの密度で表面上のランダムな位置に固定化され、
前記初期配列のそれぞれは1本鎖もしくは2本鎖RNAまたはDNA分子の混合物を含む初期標的DNAあるいはRNAライブラリからのランダム断片を表し、
すべての前記DNA分子の前記初期配列はほぼ同じ長さである、ランダムアレイ。
【請求項33】
各分子が初期配列の少なくとも1000のタンデムリピートコピーを含む、請求項32に記載のランダムアレイ。
【請求項34】
前記密度が10/cm〜10/cmである、請求項32または33に記載のランダムアレイ。
【請求項35】
前記初期配列が50%CV以内で同じ長さである、請求項32〜34のいずれか一項に記載のランダムアレイ。
【請求項36】
前記初期配列が10%CV以内で同じ長さである、請求項35に記載のランダムアレイ。
【請求項37】
前記初期配列が5%CV以内で同じ長さである、請求項36に記載のランダムアレイ。
【請求項38】
前記初期標的ライブラリが、RNAライブラリ、mRNAライブラリ、cDNAライブラリ、ゲノムDNAライブラリ、プラスミドDNAライブラリまたはDNA分子のライブラリである、請求項32〜37のいずれか一項に記載のランダムアレイ。
【請求項39】
各プローブが一もしくは複数のオリゴヌクレオチドからなり、
前記オリゴヌクレオチドのそれぞれは安定化され、
前記オリゴヌクレオチドのそれぞれはレポーター部分を有し、
各プローブの有効な特異性は3〜10bpであり、
前記プローブセットは、ランダムなまたは任意の標的配列内のすべての位置の少なくとも10%がプローブセット内の少なくとも1本のプローブと統計的にハイブリダイズするようになっている、プローブセット。
【請求項40】
前記有効な特異性が4〜6bpである、請求項39に記載のプローブセット。
【請求項41】
標的配列内のすべての位置の少なくとも25%、少なくとも50%、少なくとも90%に統計的にハイブリダイズする、請求項39または40に記載のプローブセット。
【請求項42】
標的配列内のすべての位置の100%に統計的にハイブリダイズする、請求項41に記載のプローブセット。
【請求項43】
変性位置の導入、Locked Nuceleic Acid(LNA)単量体の導入、ペプチド核酸(PNA)単量体の導入およびマイナーグルーブバインダー(MGB)の導入の一もしくは複数によって安定化される、請求項39〜42のいずれか一項に記載のプローブセット。
【請求項44】
前記レポーター部分は、蛍光体、クエンチャー、ダーククエンチャー、レドックス標識、および、標識されたヌクレオチドによるプライマー伸長のための遊離3’−OHもしくはハイブリダイゼーション後の化学標識のためのアミンを例とする酵素的または化学的手段によって標識可能な化学反応基とからなる群から選択される、請求項39〜43のいずれか一項に記載のプローブセット。
【請求項45】
ホストコンピュータに取り付けられたフィールドプログラマブルゲートアレイ(FPGA)およびコンピュータ可読記憶デバイスを含むスペクトル検索機器であって、
前記FPGAはスペクトル検索を行うように設定され、
前記コンピュータ可読記憶デバイスは参照ヌクレオチド配列およびハイブリダイゼーションスペクトルセットを格納し、
前記ホストコンピュータは前記参照ヌクレオチド配列および各々の前記ハイブリダイゼーションスペクトルを有する前記FPGAを提供するように設定され、
前記FPGAは、参照ヌクレオチド配列およびハイブリダイゼーションスペクトルとともに提供される場合、前記ハイブリダイゼーションスペクトルと前記参照ヌクレオチド配列の間で最もよくマッチする前記一もしくは複数の位置を格納するように前記コンピュータ可読記憶装置に書き込む、スペクトル検索機器。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate


【公表番号】特表2007−530020(P2007−530020A)
【公表日】平成19年11月1日(2007.11.1)
【国際特許分類】
【出願番号】特願2007−504316(P2007−504316)
【出願日】平成17年3月17日(2005.3.17)
【国際出願番号】PCT/EP2005/002870
【国際公開番号】WO2005/093094
【国際公開日】平成17年10月6日(2005.10.6)
【出願人】(507213569)ゲニゾン バイオサイエンシス インコーポレイテッド (2)
【Fターム(参考)】