説明

シークエンシングの改良

それぞれが複数の連鎖停止反応由来の合成化ポリマーの濃度を表し、停止アーティファクトを含むデータである複数のデータのセットを準備する工程;
二つ以上のデータセット中に存在する少なくとも一つの停止アーティファクトに基づいて、前記二つ以上のデータセットを整列させる工程;及び
整列したデータに基づいてポリマー配列を決定する工程
を含む、ポリマーのシークエンシング方法が提供される。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ポリマーのシークエンシングの改良に関する。好ましい実施態様では、本発明は、内部マーカーとして連鎖停止シークエンシング法から生ずる停止アーティファクトの使用に関する。特定の特徴点では、本発明は、核酸のシークエンシングに関する。
【背景技術】
【0002】
DNAの連鎖停止シークエンシングは、核酸ポリマー内の塩基の順序を測定するための一般的に使用される方法である。Sanger等(Proc. Natl. Acad. Sci USA 1977, 74(12): 5463-7)に記載されている通り、前記方法は、DNAポリメラーゼ反応内への修飾塩基の取り込みに基づく。修飾塩基は典型的にジデオキシヌクレオチド三リン酸(ddNTP)であり、非修飾dNTP、テンプレートDNA鎖、及びプライマー鎖とともにポリメラーゼ反応ミックスに導入される。プライマーはテンプレート鎖の相補部位にハイブリダイズし、DNAポリメラーゼはプライマー及びテンプレート鎖と相互作用し、相補的dNTPの添加によってプライマーを伸長する。ddNTPが伸長中の鎖に取り込まれると、ポリメラーゼはもはや鎖に更なるdNTPを加えることができなくなり、連鎖伸長が停止する。
【0003】
対応するdNTP(例えばdTTP)と他の三種のdNTPと共に、単一のタイプのddNTP(例えばddTTP)で連鎖停止を実施することにより、鎖の長さの混合物が得られ、その全ては適切な位置でddNTPで停止している。この混合物を電気泳動で分画化すると、バンドのパターンは合成されたフラグメント中のdTの分布を示す。他の三種のddNTPのそれぞれについてこの方法を繰り返すと、塩基の完全な配列を読むことが可能となる。
【0004】
一般的に、合成された鎖は、フラグメントの検出を容易にするために、いくつかの態様でラベルされるであろう。本来的にはラジオヌクレオチドがポリメラーゼ反応に含まれたが、より最近では蛍光ラベルが使用されている。従来では、単一のタイプのラベルが使用されており、全ての4種の反応物が、例えば電気泳動ゲルでの4個のレーンとして別個に分画化されている。
【0005】
より最近では、4種の異なるラベルが使用されており、全ての反応物を単一のレーンで同時に分画化できている。これは前記方法の自動化を可能にし、迅速なスループットを可能にする。しかしながら、4種の異なるラベルを使用する必要性は、前記方法のコストと複雑性を高めることになる。
【0006】
国際特許出願WO 96/35946は、その内容が参考としてここに取り込まれるが、ポリマーが光エミッター及び検出器を通過する際の特定の波長の光の吸収の変化の測定に基づく、核酸を含むポリマーの検出方法を記載している。ポリマーがDNAである場合、紫外線が典型的に使用され、DNAは220から290nmの範囲の波長を有する光を吸収する。この方法は、ポリマー内に取り込まれる外部からのラベルの必要が存在しないため、ラベルフリーの内部イメージングとして既知である。上記参考出願は、ラベルフリーの内部イメージングが、DNAシークエンシングで使用されてよいことも示唆している。ラベルが使用されないことを考慮して、シークエンシング反応は4種の別個のレーンで分画化されなければならないことは明白である。
【0007】
すべての4種の反応で単一のラベルが使用される場合、レーンの間の移動パターンの生じ得る差異を説明するため、既知のサイズのマーカーが、典型的に分画化工程に取り込まれる。これらのマーカーはレーンの間で整列させられ、分画化を較正するために使用され、正確な順序で配列を読むことを確保する。マーカーの添加及び較正は、シークエンシング方法のコストと複雑性を高める。
【0008】
国際特許出願WO 02/12877は、その内容が参考としてここに取り込まれるが、DNAのようなポリマーのシークエンシングに使用できる分析システムと方法を記載している。このシステムは、上述のラベルフリーの内部イメージングに基づき、共通のセット内の移動ポリマーの群の分類を可能にする。ポリマーバンドがUV検出器を通過する電気泳動によって移動されると、その速度が計算される。同調した空間−時間マップが前記速度から生成され、バーテックスファインダーを使用してマップから少なくともひとつのバーテックスが同定される。単一のバーテックスが各群について見出される(例えば共通の開始位置を有するバンド)。次いでバンドのグルーピングが使用されて、単一の電気泳動のランから複数の初期群が分離できる。参考出願に記載されている通り、時間(例えば、レーンに配列の反応混合物を添加することによって)、または空間(レーンに沿って別個の位置で反応混合物を導入することによって)のいずれかで、レーン内に4種の反応物の導入を単純に分けることによって、連鎖停止シークエンシング反応物を単一の電気泳動レーン内に移動させることができる。この方法は、ラベルが反応に取り込まれていない場合に、単一のレーンを使用することが可能である一方、電気泳動分画化を較正するためのマーカーの使用は依然として必要である。
【0009】
本出願人は、電気泳動由来の固有情報を内部マーカーとて使用し、別個のマーカーを導入する必要を除去する方法を開発した。
【0010】
サンガー(連鎖停止)シークエンシングでは、特定のddNTPによって停止したDNAフラグメントは、最高の濃度で検出されるであろう。いずれかの所定の軌跡について、一般的に非所望であると考慮されるミックス中のより低い濃度のフラグメントが存在するであろう。例えば、停止するddNTP残基を含む前に、DNAポリメラーゼがテンプレートDNAから離れる場合などがある。これらは「偽の停止」と称され、一般的にミックス中のすべてのDNAがラベルされている場合、またはラベルフリーシステムでUV吸収を通じて視覚化する場合のみ気がつくであろう。強度のピークとして視覚化する場合、偽の停止は、より低い濃度のため、ddNTPによって停止された「真の停止」より小さく出現する。
【非特許文献1】Sanger等(Proc. Natl. Acad. Sci USA 1977, 74(12): 5463-7)
【特許文献1】国際特許出願WO 96/35946
【特許文献2】国際特許出願WO 02/12877
【発明の開示】
【発明が解決しようとする課題】
【0011】
本出願人は、分画化の間のアーティファクトピークの高さと形状(濃度)の一致した相関関係が存在することを見出した。これらは、同じ配列テンプレートについての異なるラン/実験を通じて同じピーク位置で出現し、偽の停止の形成がランダムではない態様で存在することを示す。この一致を使用して、シークエンシングの較正を促進することができ、偽の停止を固有のマーカーシステムとして使用して、対応するアーティファクトピークを同定することにより、4種のヌクレオチドフラグメントの停止シリーズをあらわす4種の軌跡を並べることが可能である。蛍光ラベルしたプライマーを使用する以前の実験は、これらのピークの意義を観察することはなく、またはこれらのピークがラベルにより情報がぼやけた各種の実験を通じて相対強度が一致することを観察することができなかったことに注意すべきである。
【課題を解決するための手段】
【0012】
本発明は、シークエンシングのための固有のマーカーとして停止アーティファクトを使用する、連鎖停止法を使用するポリマーのシークエンシングにおける使用の方法及びシステムを提供する。
【0013】
本発明の第一の特徴点によれば、
それぞれが複数の連鎖停止反応由来の合成化ポリマーの濃度を表し、停止アーティファクトを含むデータである複数のデータのセットを準備する工程;
二つ以上のデータセット中に存在する少なくとも一つの停止アーティファクトに基づいて、前記二つ以上のデータセットを整列させる工程;及び
整列したデータに基づいてポリマー配列を決定する工程
を含む、ポリマーのシークエンシング方法が提供される。
【0014】
かくして停止アーティファクトは、連鎖停止反応から由来する二つ以上のデータセットの整列を可能にする固有のマーカーとして使用されてよい。この態様では、シークエンシングの信頼性及び容易性は、外的なマーカーを導入する必要なく改良できる。
【0015】
好ましくは前記ポリマーは核酸であり、より好ましくはDNAである。連鎖停止反応は好ましくは、ジデオキシヌクレオチド三リン酸(ddNTP)停止反応であるが、いずれかの適切な連鎖停止反応が使用されてもよい。拡散が配列決定されている場合、好ましくは少なくとも4種の連鎖停止反応由来のデータが準備され、各反応は異なるタイプのddNTPまたは他のターミネーターで実施されている。
【0016】
ポリマーはラベルされてよいが、好ましくはラベルされていない。ポリマーの濃度は、ポリマーから検出される光または他の光線の検出強度によって現されてよい;好ましくは前記濃度は、ポリマーのUV光の検出吸光度によって表される。
【0017】
好ましくは停止アーティファクトは偽の停止である;即ち、その合成が連鎖停止モノマーの取り込みの前に停止したポリマーフラグメントである。
【0018】
好ましくは各データセットは、物理的特徴に従って分離された構成ポリマーの濃度を表す。次いでデータセットは、データセット内の各種のポリマーの配置を表すデータを含む;これは、絶対配置(例えば電気泳動の軌道に沿った絶対的変位)、または相対配置(セット内の各種のポリマーの順序、各ポリマーが検出された時間、電気泳動の軌跡に沿ったポリマーの間の分離)であって良い。ポリマーは、その鎖の長さに従って分画化されてよい。鎖の長さを間接的に使用して、ポリマーを分画化してもよい;例えばポリマーの電気的荷電がその鎖の長さに比例する場合、ポリマーを荷電によって分画化する。二つ以上のデータセットを同じ分離から得てもよい(例えば、単一の分画化レーンで分離された4種の連鎖停止反応)。またはすべてのデータセットを別個の分離から得てもよい(例えば、4種の分画化レーンで分離された4種の連鎖停止反応)。データセットを同じ分離から得る場合、それらはWO 02/12877に記載された方法、または同様な方法によって、単一のデータセットから従来通り由来してもよい。
【0019】
好ましくは、前記複数のデータセットのそれぞれが互いに整列される。
【0020】
データセットを整列する工程は、少なくとも二つのデータセットに存在する少なくとも一つの停止アーティファクトの位置を決定する工程、及び停止アーティファクトが各変換したデータセットで同じ位置に存在するようにデータセットを変換する工程を含んでよい。好ましくは、複数の停止アーティファクトを使用する。好ましくは停止アーティファクトは二つより多いデータセットに存在するが、各停止アーティファクトは、全てのデータセットに必ずしも存在することはないであろう。累積的整列法が使用されてもよい;つまり、第一の停止アーティファクトが第一及び第二のデータセットを整列するために使用され、第二のアーティファクトが第二及び第三のデータセットを整列するために使用され、全ての3種のデータセットが整列されてもよい。この方法を繰り返して、より多い数のデータセットを整列してもよい。更に、または別法として、更なる停止アーティファクトが使用されて、初期のアーティファクトですでに整列されているデータセットの整列を改良してもよい。
【0021】
好ましくは前記方法は、複数のデータセットを生成する工程を含む。これは、連鎖停止反応由来の合成化ポリマーの濃度を検出する形態をとってもよく、当該濃度を表すデータセットにデータアイテムを含ませる形態をとってもよい。前記濃度は、ポリマーを光源と光検出器、好ましくはUV源と検出器との間を通過させることによって検出されてよい。好ましくはポリマーは、光源と検出器の間を通過させる前、または通過させながらサイズ分画化される。これは、電気泳動、またはいずれかの他の適切な方法によって実施されてよい。ポリマーの分画化は、ポリマーをマトリックスに通過させることを含んでもよい;マトリックスは固体または液体であって良い。好ましいマトリックスはポリエチレンオキシド(PEO)であるが、他のマトリックスを使用してもよい。ポリマーは、電場の下でマトリックスを通過してもよい。
【0022】
データセットはもちろん、いずれかの適切な態様で生成してもよい。
【0023】
前記方法は好ましくは、合成化ポリマーを分画化する工程;分画化したポリマーをアレンジされた検出器に通過させて、前記ポリマーの濃度を検出する工程;及び分画化ポリマーの濃度を表すデータセットを生成する工程を含む。
【0024】
好ましくは前記方法は、一つ異常の連鎖停止反応を実施して、複数の合成化ポリマーを得る工程を含む。適切な連鎖停止反応は、当業者に既知である。
【0025】
本発明の更なる特徴点は、
それぞれが複数の連鎖停止反応由来の合成化核酸の濃度を表すデータを含む複数のデータセットを準備し、各反応は各種の停止ヌクレオチドで実施され、データセットが停止アーティファクトを含む工程;
二つ以上のデータセットに存在する少なくとも一つの停止アーティファクトに基づいて前記二つ以上のデータセットを整列する工程;及び
整列したデータに基づいて核酸配列を決定する工程
を含む、核酸をシークエンシングする方法を提供する。
【0026】
好ましくは、前記核酸はDNAである。好ましくは、4のデータセットが準備され、それぞれは、核酸に見出される4種のヌクレオチドの異なる一つ、または対応する修飾ヌクレオチドで実施される連鎖停止反応を表す。
【0027】
更に、
複数の連鎖停止反応由来の合成化ポリマーの複数のセット内で、ポリマーの濃度を検出するための検出手段;
合成化ポリマーの前記複数のセットに対応するデータを含む複数のデータセットを生成するためのデータ加工手段;
二つ以上のデータセットに存在する少なくとも一つの停止アーティファクトに基づいて、前記二つ以上のデータセットを整列させるためのデータ加工手段;
整列した停止アーティファクトで整列中のデータセットの残余のデータを調節するための手段;並びに
調節したデータに基づいてポリマー配列をアウトプットするための手段
を含む、ポリマーをシークエンシングするための装置を提供する。
【0028】
前記検出手段は、前記ポリマーがエミッターとセンサーとの間の通路を遮断するように並んだ光エミッターとセンサーとを含んでよい。光は好ましくはUV光である。
【0029】
好ましくは前記装置は、前記ポリマーが取り出されて分離されてもよい分離チャネルを更に含む。前記チャネルは好ましくは、検出手段に隣接して配置される。従来前記チャネルは、検出手段を通過した分離したポリマーを移動するように整列される。前記チャネルは電気泳動チャネルであってもよく、キャピラリーまたは毛管流動チップの形態で存在してもよい。
【0030】
前記装置は複数の分離チャネルを含んでもよいが、好ましくは一つのみのチャネルが準備される。単一のチャネルが準備される場合、複数の開口部が存在してもよく、それによって前記複数のセットの合成化ポリマーがチャネル内に別個に導入されてよい。別報として単一の開口部が準備されてよく、前記複数のセットが連続的に導入されてよい。
【0031】
本発明の更なる特徴点によれば、
それぞれが複数の連鎖停止反応由来の合成化ポリマーの濃度を表すデータを含む複数のデータセットを準備し、前記データセットが停止アーティファクトを含む工程;及び
二つ以上のデータセットに存在する少なくとも一つの停止アーティファクトに基づいて、前記二つ以上のデータセットを整列し、複数の反応を較正する工程
を含む、複数の連鎖停止反応を較正する方法が提供される。
【0032】
更に本発明により、
ポリメラーゼ酵素を使用して複数の連鎖停止反応を実施する工程;
それぞれが前記複数の連鎖停止反応由来の合成化ポリマーの濃度を表すデータを含む複数のデータセットを生成する工程;及び
前記複数のデータセットに存在する停止アーティファクトを比較し、各アーティファクトが二つ以上のデータセットに存在する場合、前記酵素は許容可能な質を有する工程
を含む、ポリメラーゼ酵素を品質管理する方法が提供される。
【0033】
停止アーティファクトの比較は、二つ以上のデータセットに存在する少なくとも一つの停止アーティファクトに基づいて、前記二つ以上のデータセットを整列する工程;及び整列したデータセットを比較する工程によって達成されてよい。
【0034】
本発明は更に、ポリマーをシークエンスする方法、連鎖停止反応を表すデータセットを整列する方法、または連鎖停止反応由来のデータを較正する方法における停止アーティファクトの使用を提供する。更に、ポリメラーゼ酵素を品質管理する方法における停止アーティファクトの使用を提供する。
【発明を実施するための最良の形態】
【0035】
本発明は、連鎖停止シークエンシング方法の間で生成する停止アーティファクトが、同じポリメラーゼで同じテンプレートで実施される反応の間で一致するという知見を使用する。本出願人は、かくしてこれらのアーティファクトが、シークエンシング反応の整列のための固有のマーカーとして使用されてよいことを発見した。それゆえ本出願人は、本出願人によって使用されるラベルフリーの内部イメージングシステムとともに、サンガー連鎖停止法に対する背景を記載する。本出願人は、前記アーティファクトをどのようにシークエンシングランを整列するために使用して良いかを説明する。
【0036】
先ず最初に図1を参照し、これはサンガー連鎖停止法を説明する。前記方法には多くのバリエーションが存在するが、基本的な原理はみな同一である。
【0037】
図1a:プライマーとして基地のオリゴヌクレオチドが、DNAテンプレートの相補部位にアニールするように特異的にデザインされている。DNAテンプレートは一本鎖であり、化学的または熱的に変性されている。酵素であるDNAポリメラーゼは、5’から3’の方向で相補的な鎖を伸長する。4種のDNA塩基であるアデニン(dATP)、チミン(dTTP)、グアニン(dGTP)、及びシトシン(dCTP)からなるヌクレオチドが反応ミックスに添加され、生成中のDNA鎖を伸長する。更に、ジデオキシヌクレオチド(ddNTP)と称されるdNTPのアナログ(以下の実施例ではddGTPとして表される)が反応ミックスに添加される。ddNTPは、DNAポリメラーゼが3’方向に生成中のDNA鎖を伸長することを妨げる。これは、ddNTPによって停止した各種の長さの切り詰められたDNAフラグメントの集団を生成する。
【0038】
図1b:ddNTPの化学的構造はこの図に見ることができ、リボース部分がdNTPで見出されるヒドロキシル基を欠いている。これは、次に導入されるdNTPとホスホジエステル結合を形成するために必要である(リン酸は「P」によって表される)。
【0039】
図1c:4つの連鎖停止反応を別個に実施し、各反応は4種のddNTP(ddTTP、ddATP、ddGTP、ddCTP)の一つのランダムな取り込みを利用する。生成したDNAフラグメントは、一本鎖(ssDNA)に変性される。
【0040】
図1d:キャピラリーまたはゲル電気泳動を使用して、各種のサイズ/長さのssDNAフラグメントを分離する。DNAは負に荷電しているので、負の電極に対して移動するであろう。より小さいフラグメントは、分離マトリックスの篩い効果により、より大きいフラグメントより早く移動するであろう。フラグメントは、単一のヌクレオチドの差異より好適に解像できる。同じゲルで同時にすべての軌跡を稼動させることにより、それぞれのヌクレオチドタイプに対応するフラグメントが、その見かけのサイズの順番で読み取ることができ、配列が得られてよい。
【0041】
図2を参照すると、これはラベルフリーの内部イメージングで使用されてよいシークエンシングプラットフォームを説明し、更なるラベルの使用なしでDNA配列が得られる。この図で模式的に表された工程は、シグナルを保有するヌクレオチドの識別を表し、図1dと結びつけて簡単に示される配列を得るために使用される。
【0042】
図2a:この図は、本出願人のシステムの成分を記載する。紫外光が、分離キャピラリーに対して一連のフィルターと光学でフォーカスされる。DNAフラグメントを含むバンドが検出窓を横切るのにつれて、254nmでUV光度の下降が、512ピクセルのフォトダイオードアレー検出器によって測定される。本出願人は、ポリエチレンオキシド(PEO)からなるマトリックスを使用し、各種のサイズの個々のDNAフラグメントを解像するが、固体であれ液体であれいずれかの適切なマトリックスが使用されてよい。
【0043】
図2b:単一の電気泳動グラムがこの図に示されている;観察される溝は個々のDNAフラグメントを現している。フォトダイオードアレイは、単一のスキャンについて512のそのような電気泳動グラムを生成する。
【0044】
図2c:これらの電気泳動グラムをWO 002/12877に記載された方法を使用して加工して、バックグランドノイズを減らしてシグナル強度を10倍に増幅する。もちろん他の加工方法が使用されてもよい;必要であることは、特定の位置でDNAバンドの存在または不在を示すアウトプットを得ることだけである。個々の軌跡ランについてアウトプットを加工した増幅したEVA(シグナル加工ソフトウェアー)がここでプロットしたものを観察できる。マーカーピークである、すべての軌跡に添加されている既知のサイズ及び濃度のDNAフラグメントは、各プロットの最左及び右端に観察できる。マーカーは4つの軌跡に添加され、整列のためにすべての軌跡に共通の参照のポイントを有する。
【0045】
図2d:図2cから得られた四つのヌクレオチドの軌跡の整列を、配列アライメントソフトウェアーを使用してここで重ね合わせたものが観察できる。再言すると、いずれかの適切なソフトウェアーを使用してもよい。整列で使用されるマーカーは、プロットの最左及び右端で強調されており、この整列が生ずる配列はグラフの下に観察できる。
【0046】
アーティファクトピーク
場合によりシャドーバンドとしても既知であるアーティファクトピークは一般的に、各ddNTPによって停止した正確なサイズのフラグメントには対応しない分離で観察できるいずれかのピークについて緩く規定された用語である。アーティファクトピークは、プライマーが誘導するアーティファクトピークと、テンプレートが誘導するアーティファクトピークに分割できる。プライマーが関連するアーティファクトは、使用されるプライマーが、企図される配列に関連しないDNAフラグメントの形成を導くように結合を企図しないテンプレートの他の領域に結合する親和性を有する場合に生ずる。
【0047】
本出願人は、さもなければ偽の停止として知られる、または停止アーティファクトとしてここに規定される、テンプレートが関連するアーティファクトにより関心を有する。これらのピークは、ddNTPが導入される前に、テンプレートから離れたDNAポリメラーゼの結果として生ずる(図3参照)。テンプレートDNAの二次構造が、この偽の停止に関与すると解される。DNAポリメラーゼはまた、テンプレートに対する会合の点で有限の周期性を有し、これは進化性とも称され、短い進化性の頻度は、アーティファクトの数を増大すると解される。この文献で観察されるすべての配列の軌跡は、約40bpの進化製を有するTaq DNAポリメラーゼを使用して生成され、プライマーが関連するアーティファクトピークを含まないものと解される。
【0048】
図3a:サンガー連鎖停止の正常なラウンドでは、DNAポリメラーゼは、ddNTPに遭遇した際に生成中の鎖の伸長を妨げられる。図3b:DNAポリメラーゼが、ddNTPを含まずにDNA鎖伸長を停止したテンプレートから脱離する際に、生成したピークが偽の停止と称される。
【0049】
図2に記載されたシークエンシングシステムで観察されるアーティファクトピークまたは停止アーティファクトが、図4を参照してここで議論される。EVAによって選択的に生じた正確なシグナルにより、個々のDNAの軌跡について生成したアーティファクトピークが観察可能である。図4において「個々の軌跡のトレース」のセクションで示される比較可能な軌跡のトレースは、シークエンシングプラットフォームによって生成するシグナル加工アウトプットを表す。両者の軌跡(T及びA)は、両者のグラフの各側で観察される大きなピークによって整列した配列の同じストレッチを表す。アーティファクトピークは、グラフの底部の部分で観察できるが、各ddNTPによって停止したピークは、上部の部分で観察される。ddNTPピークは、停止アーティファクトピークよりもずっと大きな振幅を有する。各軌跡由来のDNAを5Kvで2分間電気速度論的に注入し、検出窓に70cmの分離で14Kvで分離を実施した。使用されtキャピラリーは、75μMの内径を有し、5MdのPBOを分離マトリックスとして使用した。Taq DNAポリメラーゼを使用して、200サイクルのddNTPの連鎖停止反応を実施した。
【0050】
図4の第2の部分(「整列した軌跡のトレース(T/A/G/C)」の表題)は、本出願人のアライメントソフトウェアーTrackAlignerを通じて整列して展示した4のddNTP軌跡トレースを示す。拡大した部分は、軌跡のトレースの間の相補的なアーティファクトピークが、ピークの高さとピークの形状の両者で互いに対応することを示す。観察の数は図中に示されている;1)アーティファクトピークは、真のddNTP停止ピークの間の個々の塩基対の位置をマークするために使用できる−これはサンガーシークエンシングについての元の論文で記載された(Sanger等, 1977);2)所的の軌跡についてのddNTPピークを予測するアーティファクトピークはしばしば、予測よりも小さいであろう(これは解像度または圧縮に関連する問題であろう)。それ故、大まかなガイドとして、整列した配列についてのいずれかの所定の塩基対の位置で、ddNTP停止フラグメントを表す一つの大きなピークが存在し、空の塩基対の位置を表す三つのアーティファクトピークが存在し、3のアーティファクトピークの一つは、各軌跡のddNTPで次の塩基対の位置で停止したかどうかを予測するよりは小さく、いずれかの所定の塩基対位置で、少なくとも2のアーティファクトピークは相同な形態を有するであろう。
【0051】
予備的な結果では、このアーティファクトの相関関係は、別個の実験を通じて各種のddNTP反応に関わらず維持されることが示される。
【0052】
図5は、アーティファクトピークを使用する本出願人が提案するDNAシークエンシングストラテジーを説明する。図5a:現在のシークエンシングストラテジーは、人工的に導入したマーカーピークを利用している(図2cに記載される)。軌跡のトレースを伸ばし、そのマーカーピークと対照させ、調節した軌跡を一方のグラフに併せ、各軌跡に対応するピークの配列を読み取って配列を決定する。図5b:本出願人は、各軌跡についての内部マーカーとしてアーティファクトピークを使用するシークエンシングストラテジーを提案する。各種の軌跡から由来する対応するアーティファクトピークを測定し、図5に示された軌跡のトレースを並べるために使用する。3つの対応するアーティファクトピークを使用し、同定できるすべての対応するアーティファクトピークについて一度に3つの軌跡を較正する。すべての4つの軌跡を各アーティファクト整列について同時に並べないが、対応するアーティファクトがすべての4つの軌跡の間で同定されるため、4つの軌跡は次第に並べられるであろう。特定の場合では、二つのみの対応するアーティファクトピークが同定された際、当該塩基対位置について二つの軌跡が較正されるであろう。アーティファクトピークの次第に組み合わせた整列は、非常に良好な際列を形成するであろう;理論的に、全ての軌跡について塩基対毎の位置に対する同定可能なマーカーが存在するのであれば、一度に各塩基対位置の三つの軌跡についてマーカーの較正が存在するであろう。
【0053】
プラスミドpGEM3zf(−)DNA配列についての伸長した軌跡の整列が図6に示されている。これらのグラフを生成するために使用される実験条件は、図4と結び付けて記載される。これらのグラフは、各種の軌跡の間でアーティファクトピークについて相同性が存在するが、特定の領域が他者より良好であることを示す。現実的には、減少したシグナル強度、並びにエラーを生じたDNAフラグメントの混在が、対応するアーティファクトピークの正確性に影響するかもしれない。しかしながらこれらの問題は、プログラムにより解消されているはずである。更に一般的な規則として、相同である対応するアーティファクトを有する少なくとも二つの軌跡が常に存在する。個々のアーティファクトピークは、パターン認識法を使用して同定される必要があるであろう。
【図面の簡単な説明】
【0054】
【図1】図1は、DNAをシークエンシングするサンガー連鎖停止法の説明図である。
【図2】図2は、ラベルフリー内部イメージングの使用、及びWO 02/12877に記載されたアルゴリズムの使用を実施するDNAシークエンシングプラットフォームを示す図である。
【図3】図3は、サンガー連鎖停止法における「偽の停止」停止アーティファクトの生成を表す図である。
【図4】図4は、図2のシークエンシングプラットフォーム由来のアーティファクトピークを表す図である。
【図5】図5は、シークエンシング反応の整列に対する固有のマーカーとしてのそのようなアーティファクトピークの使用を表す図である。
【図6】図6は、プラスミドシークエンシング実験から生成した伸長した軌跡の整列を示す図である。

【特許請求の範囲】
【請求項1】
それぞれが複数の連鎖停止反応由来の合成化ポリマーの濃度を表し、停止アーティファクトを含むデータである複数のデータのセットを準備する工程;
二つ以上のデータセット中に存在する少なくとも一つの停止アーティファクトに基づいて、前記二つ以上のデータセットを整列させる工程;及び
整列したデータに基づいてポリマー配列を決定する工程
を含む、ポリマーのシークエンシング方法。
【請求項2】
前記ポリマーが核酸である、請求項1に記載の方法。
【請求項3】
前記ポリマーがDNAである、請求項1に記載の方法。
【請求項4】
前記連鎖停止反応がジデオキシヌクレオチド三リン酸(ddNTP)停止反応である、請求項3に記載の方法。
【請求項5】
少なくとも4の連鎖停止反応からデータが準備され、各反応は異なるタイプのターミネーターで実施される、請求項2、3または4に記載の方法。
【請求項6】
前記ポリマーがラベルされている、請求項1から5のいずれか一項に記載の方法。
【請求項7】
前記ポリマーがラベルされていない、請求項1から5のいずれか一項に記載の方法。
【請求項8】
前記ポリマーの濃度が、前記ポリマー由来の光の検出強度によって表される、請求項1から7のいずれか一項に記載の方法。
【請求項9】
前記濃度がポリマーによるUV光の検出吸光度によって表される、請求項8に記載の方法。
【請求項10】
前記停止アーティファクトが偽の停止である、請求項1から9のいずれか一項に記載の方法。
【請求項11】
各データセットが、物理的な特徴によって分離された合成化ポリマーの濃度を表す、請求項1から10のいずれか一項に記載の方法。
【請求項12】
各データセットが、データセット内の異なるポリマーの位置を表すデータを含む、請求項11に記載の方法。
【請求項13】
前記ポリマーが、その鎖の長さによって分離される、請求項11または12に記載の方法。
【請求項14】
二つ以上のデータセットが同じ分離から得られる、請求項11から13のいずれか一項に記載の方法。
【請求項15】
全てのデータセットが別個の分離から得られる、請求項11から13のいずれか一項に記載の方法。
【請求項16】
前記複数のデータセットの各々が互いに整列される、請求項1から15のいずれか一項に記載の方法。
【請求項17】
データセットの整列工程が、少なくとも二つのデータセットに存在する少なくとも一つの停止アーティファクトの位置を測定し、前記データセットを変換して、停止アーティファクトが各変換したデータセットの同じ位置に存在するようにすることを含む、請求項1から16のいずれか一項に記載の方法。
【請求項18】
複数の停止アーティファクトがデータセットを整列するために使用される、請求項1から17のいずれか一項に記載の方法。
【請求項19】
前記停止アーティファクトが二つより多いデータセットに存在する、請求項1から18のいずれか一項に記載の方法。
【請求項20】
前記データセットが累積的に整列される、請求項1から19のいずれか一項に記載の方法。
【請求項21】
複数のデータセットを生成する工程を含む、請求項1から20のいずれか一項に記載の方法。
【請求項22】
前記データセットの生成が、連鎖停止反応由来の合成化ポリマーの濃度を検出し、当該濃度を表すデータセットにデータアイテムを含ませることを含む、請求項21に記載の方法。
【請求項23】
前記濃度が、光源と光検出器の間をポリマーが通過することによって検出される、請求項22に記載の方法。
【請求項24】
前記ポリマーが、光源と検出器の間を通過する前または通過しながらサイズ分画化される、請求項23に記載の方法。
【請求項25】
前記ポリマーが電気泳動によってサイズ分画化される、請求項24に記載の方法。
【請求項26】
合成化ポリマーを分画化する工程;前記ポリマーの濃度を検出するように整列した検出器を分画化ポリマーが通過する工程;及び分画化ポリマーの濃度を表すデータセットを生成する工程を含む、請求項1から20のいずれか一項に記載の方法。
【請求項27】
複数の合成化ポリマーを得るために、一つ以上の連鎖停止反応を実施する工程を含む、請求項1から26のいずれか一項に記載の方法。
【請求項28】
それぞれが複数の連鎖停止反応由来の合成化核酸の濃度を表すデータを含む複数のデータセットを準備し、各反応は各種の停止ヌクレオチドで実施され、データセットが停止アーティファクトを含む工程;
二つ以上のデータセットに存在する少なくとも一つの停止アーティファクトに基づいて前記二つ以上のデータセットを整列する工程;及び
整列したデータに基づいて核酸配列を決定する工程
を含む、核酸をシークエンシングする方法。
【請求項29】
4のデータセットが準備され、それぞれは、核酸に見出される4種のヌクレオチドの異なる一つ、または対応する修飾ヌクレオチドで実施される連鎖停止反応を表す、請求項28に記載の方法。
【請求項30】
複数の連鎖停止反応由来の合成化ポリマーの複数のセット内で、ポリマーの濃度を検出するための検出手段;
合成化ポリマーの前記複数のセットに対応するデータを含む複数のデータセットを生成するためのデータ加工手段;
二つ以上のデータセットに存在する少なくとも一つの停止アーティファクトに基づいて、前記二つ以上のデータセットを整列させるためのデータ加工手段;
整列した停止アーティファクトで整列中のデータセットの残余のデータを調節するための手段;並びに
調節したデータに基づいてポリマー配列をアウトプットするための手段
を含む、ポリマーをシークエンシングするための装置。
【請求項31】
前記検出手段が、前記ポリマーがエミッターとセンサーとの間の通路を遮断するように並んだ光エミッターとセンサーとを含む、請求項30に記載の装置。
【請求項32】
前記ポリマーが取り出されて分離される分離チャネルを更に含む、請求項30または31に記載の装置。
【請求項33】
前記チャネルが電気泳動チャネルである、請求項32に記載の装置。
【請求項34】
それぞれが複数の連鎖停止反応由来の合成化ポリマーの濃度を表すデータを含む複数のデータセットを準備し、前記データセットが停止アーティファクトを含む工程;及び
二つ以上のデータセットに存在する少なくとも一つの停止アーティファクトに基づいて、前記二つ以上のデータセットを整列し、複数の反応を較正する工程
を含む、複数の連鎖停止反応を較正する方法。
【請求項35】
ポリメラーゼ酵素を使用して複数の連鎖停止反応を実施する工程;
それぞれが前記複数の連鎖停止反応由来の合成化ポリマーの濃度を表すデータを含む複数のデータセットを生成する工程;及び
前記複数のデータセットに存在する停止アーティファクトを比較し、各アーティファクトが二つ以上のデータセットに存在する場合、前記酵素は許容可能な質を有する工程
を含む、ポリメラーゼ酵素を品質管理する方法。
【請求項36】
停止アーティファクトの比較が、二つ以上のデータセットに存在する少なくとも一つの停止アーティファクトに基づいて、前記二つ以上のデータセットを整列する工程;及び整列したデータセットを比較する工程によって達成される、請求項35に記載の方法。
【請求項37】
ポリマーをシークエンスする方法における停止アーティファクトの使用。
【請求項38】
連鎖停止反応を表すデータセットを整列する方法における停止アーティファクトの使用。
【請求項39】
連鎖停止反応由来のデータを較正する方法における停止アーティファクトの使用。
【請求項40】
ポリメラーゼ酵素を品質管理する方法における停止アーティファクトの使用。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate


【公表番号】特表2009−514518(P2009−514518A)
【公表日】平成21年4月9日(2009.4.9)
【国際特許分類】
【出願番号】特願2008−538427(P2008−538427)
【出願日】平成18年11月1日(2006.11.1)
【国際出願番号】PCT/GB2006/050365
【国際公開番号】WO2007/052078
【国際公開日】平成19年5月10日(2007.5.10)
【出願人】(508134762)デルタドット・リミテッド (3)
【Fターム(参考)】