説明

分子冗長配列決定

標的核酸が、鋳型配列から決定された配列の数又は相対位置を同定するために標的核酸内に配置されたレジストレーション配列を含む方法、システム及び組成物。特に好ましい態様は環状鋳型核酸配列の中にレジストレーション配列を含み、この環状鋳型核酸配列が、鋳型配列の同定における鋳型依存ポリメラーゼ媒介プライマー伸長に基づいた結合プロセスにより順々に用いられる。

【発明の詳細な説明】
【技術分野】
【0001】
(関連出願とのクロスリファレンス)
本願は米国仮特許出願第60/962,036号(出願日2007年7月26日)の優先権を主張し、その開示内容全体を参考資料として全目的で本明細書に組込む。
【0002】
(連邦政府支援研究に関する陳述)
適応なし。
【背景技術】
【0003】
遺伝子分析は、生物学的研究において重要なツールであり、薬理学や医療診断の分野においてでさえ必須のツールに早急になりつつある。新旧の幅広い各種の技術がこのような遺伝子分析、特に遺伝物質の大型断片のヌクレオチド配列分析における同定に適用されてきた。
【0004】
しかしながら、加工されていない遺伝子配列データは全体的分析において同じくらい重要であり、概して書かれた小説の中の文字の一綴りに類似している。文字の順序は重要であるが、最も有用な情報の一番大きい部分を伝えるのは、語、文、段落及び章の中での文字の前後関係である。同様に、純粋なヌクレオチド配列情報は遺伝子分析において極めて重要であるが、さらに多くの情報量を伝えるのは、コドン、遺伝子、遺伝子クラスター、染色体及びゲノム全体の中でのその配列情報の前後関係である。
【0005】
配列前後関係に加えて、 最も一般的な配列決定技術は核酸の集団の分析を基本としていて、その結果、核酸の混合物のバルク分析から配列コンセンサスを得る。 その方法は全共通配列を得る事には効果的であるが、各種の異なる適用にとって特に重要となりえる分子から分子への変化を見落としてしまう。それと対照的に、単一分子配列決定方法はバルク・コンセンサス法では顕著でない不正確さをこうむる。
【発明の概要】
【発明が解決しようとする課題】
【0006】
本発明は概して、配列決定方法での配列前後関係情報を決定することだけではなく決定の精度を向上することに使うことができる個々の核酸分子についての冗長配列情報を提供する方法及びシステムに関するものである。本発明のこれらおよび別の側面を、より詳細に以下で述べる。
【課題を解決するための手段】
【0007】
本発明は概して、個々の核酸分子からの非常に正確な配列情報を提供するために、個々の核酸分子の繰返し分析のための方法とシステムに関するものである。特に、本発明は、個々のポリマーと特に核酸ポリマーの冗長配列分析を行う上で有効な改良した方法、システム及び組成物を提供する。
【0008】
第一の側面では、本発明は標的核酸の決定された配列の配列前後関係を同定する方法を提供する。その方法は、標的核酸配列の中の選択された位置に既知のレジストレーション配列を提供し、レジストレーション配列を含む標的核酸の配列の少なくとも一部を決定し、配列の一部の中のレジストレーション配列の相対位置から決定する段階で決定した標的核酸の配列の一部の配列前後関係を同定することを含む。
【0009】
他の側面では、本発明は標的核酸配列の中に既知のレジストレーション配列を提供することを含み、完全な標的核酸を配列決定する方法を提供する。標的核酸を環状化し、レジストレーション配列が少なくとも2回は配列決定されるまで標的核酸配列を破壊しない配列決定法を使って、標的核酸を配列決定する。
【0010】
さらに別の側面では、本発明は、鋳型核酸を提供することを含む核酸配列の決定方法を提供し、鋳型配列の一部が少なくともヌクレオチドの第一配列とヌクレオチドの第一配列に関して選択された位置にあるレジストレーション配列を有する。ヌクレオチドの第一配列及びレジストレーション配列は複数回配列決定され、配列決定段階からの配列情報は配列決定段階にて同定されたレジストレーション配列に少なくともある程度は基づき整列される。次に整列段階から共通配列が決定され、ヌクレオチドの第一配列の核酸配列を決定する。
【0011】
関連する側面では、本発明は前記の方法を実行するための組成物を提供する。このような組成物は典型として、少なくとも第一外来レジストレーション配列、核酸ポリメラーゼ及び第一鋳型核酸配列の少なくとも一部に相補的なプライマー配列を含む第一鋳型核酸配列を含む核酸合成複合体を含むものである。その鋳型核酸配列は、鋳型核酸配列の中の同一のヌクレオチド配列に対して核酸ポリメラーゼが複数回プライマー伸長反応を起こすように構成されている。その組成物は同様に典型として複数の種類のヌクレオチド又はヌクレオチド類似体を含んでいる。
【図面の簡単な説明】
【0012】
【図1】図1は配列決定法によって生成された配列情報の整列においてレジストレーション配列を使用する本発明の方法を図式的に示す。
【0013】
【図2】図2は環状鋳型配列から得られた配列情報に適用する本発明の方法を図式的に示す。
【0014】
【図3】図3は本発明の方法から共通配列の決定を図式的に示す。
【0015】
【図4】図4はレジストレーション配列を使った代替の配列前後関係方法を図式的に示す。
【発明を実施するための形態】
【0016】
[I.序論]
本発明は概して、個々の核酸分子の冗長配列決定によって標的核酸の配列情報を決定する方法を改良することに向けられる。反復して同じ標的配列又はその一部を配列決定することによって、この方法から得られる配列情報の信頼性は劇的に向上することができる。単一分子配列決定方法の冗長配列分析の使用は米国特許出願番号第2006−0063264号に記載されていて、その開示内容全体を参考資料として全目的で本明細書に組込む。
【0017】
本明細書に記載されている冗長配列決定方法は各種の配列決定法の中でも幅広い実用性を見出されるであろうが、これらの方法は単一分子配列決定方法に採用されることが特に好ましい態様として認められるだろう。単一分子方法の実施例は、米国特許第7,033,764号、第7,052,847号、第7,056,661号及び第7,056,676号に記載されていて、その開示内容全体を参考資料として全目的で本明細書に組込む。
【0018】
手短に言えば、単一分子鋳型依存配列決定反応が配列中の同一のヌクレオチド配列を複数回処理するように、標的又は鋳型核酸が提供され、構成される。鋳型内の同一のヌクレオチド配列の繰返し配列決定は、同一の塩基配列の冗長配列の提供によって、その方法から得られた配列情報の信頼性水準を向上させる。例として、所定の配列決定方法における配列同定又は決定に関連する潜在的誤差水準が存在する場合、所定配列の一通過は、そのことから決定される配列の信頼性水準の制限としてその潜在的誤差をもつであろう。 言い換えれば、配列決定方法が10%の誤差率だとすると、その配列のいずれかの塩基の決定において90%の信頼性水準しかもてない。しかしながら、反復して同一の配列を配列決定することによって、各通過からの配列情報の比較により、誤差水準を意図的に軽減することができる。このように、各通過の結果として、複数回の通過による塩基の同定に関連する誤率は、劇的に落ちる。
【0019】
配列決定法における固有の不正確性の減少に加えて、個々の核酸分子の冗長配列決定は、低コピー数の環境で遺伝子変異を同定すること、例えばより大きい核酸サンプルから同定できないかもしれない分子間変異を探すことにおいて、非常に高い価値がある。例えば、ある遺伝子異常は所定のサンプル内の細胞の比較的小さい部分集合に存在しているかもしれないし、もしくは個々の細胞内の遺伝物質のほんの小さな部分集合かもしれない。このような場合、遺伝物質の大まかな選択に基づいたサンプリングは変異物質と正常物質間のなんらかの違いを見逃してしまう可能性がある。
【0020】
本開示内容から分かるように、本発明の方法はここに考察されている冗長配列決定を達成するいくつかの構成に依存してもよい。このような構成としては、個々の鋳型分子内の所定配列の複数コピーについての配列決定、単一分子複合体による所定鋳型配列内のヌクレオチドの同じ集合の冗長配列決定及び複数の異なった分子複合体を使った1以上の同一の配列の配列決定並びにそれらの組合せが挙げられる。
【0021】
ヌクレオチド配列の冗長な処理方法に加えて、また、このような冗長配列決定を簡易にする改良を提供すると共に、これら及び関連した方法から得られた冗長配列データの評価及び処理のための方法を提供する。
【0022】
前記に加えて、本発明の目的は、例えば核酸ポリメラーゼ及びプライマー配列と共にレジストレーション配列を含んだ本発明の鋳型配列を含む核酸合成組成物と、例えば蛍光標識されたヌクレオチド又はヌクレオチド類似体などの検出可能な類似体を用いてプライマー伸長、好ましくは核酸配列決定の操作を実行するための複数種のヌクレオチド及び/又はヌクレオチド類似体とを含んだ、本明細書に記載の組成物を提供することである。同じように、これらの組成物を用いてこれらの方法を実行するためのシステムも同様に考察される。
【0023】
[II. 冗長配列決定]
先に述べたように、本発明は多重の鋳型配列分子の内部のヌクレオチドの所定の配列の冗長配列決定を行う。本発明に基づいて、鋳型分子内の所与の配列のこの冗長配列決定は、いくつかの異なる構成を採用できる。例えば、少なくとも一つの側面では、冗長的に配列決定されるヌクレオチド配列は、環状鋳型分子の内部に存在していて、配列決定方法は環状鋳型の周りで反復して行われる。察すると、環状鋳型が採用されると、環周の第一回転後の初期ストランドの置換により継続的又は反復した配列決定が可能となる。最も単純な態様において、これは配列決定方法においてストランド置換ポリメラーゼ酵素の使用を通してなされる。各種のストランド置換ポリメラーゼが特に結合による配列決定での使用のために記載されている。(例えば、国際公開第2007/075987号、国際公開2007/075873号、国際公開2007/076057号及びそれらアメリカ合衆国での出願に対応するものに記載されていて、その開示内容全体を参考資料として全目的で本明細書に組込む。)要するに、環状鋳型の周りの単一回転が完了すると、ポリメラーゼは鋳型の周りの合成を続けるために新しく合成された初期ストランドを置換する。
【0024】
ストランド置換ポリメラーゼの使用は環状鋳型に関係する発明の特に好まれる実施であるが、いくつかの他の方法を採用して初期ストランドを取り除いてもよい。例えば、合成方法が先に進展している間に放端の初期ストランドを消化する特定のエクソヌクレアーゼを用いて、基本的な鋳型から初期ストランドを取り除くことができる。いずれにしても、特定分子内のヌクレオチドの同じ集合を反復して配列決定したい場合、配列決定するために使用される方法は鋳型核酸配列に非破壊的であることが分かる。例として、温浸配列決定方法はこれらの側面では好まれない。同様に、組込まれ且つ/又は標識されたヌクレオチド又は終止ヌクレオチドを、脱保護及び/又は脱標識する洗浄段階を反復して要求する配列決定方法は、ほんの数サイクル後に鋳型ストランドを劣化させる傾向にあり、よって非破壊的配列方法が採用される本発明の方法には含まれない。
【0025】
代わりの側面として、同一のヌクレオチド配列又は標的配列は、単一鋳型ストランド内の当該の標的配列の複数の複製を提供することにより配列決定してもよい。上記のように、鋳型は冗長の付加された層を提供するために環状であってもよいし、もしくは線状鋳型を含んでいてもよい。ヌクレオチド配列の複数の複製を持つ線状鋳型を使用するとき、鋳型に対する単一パスはそのような冗長配列読取りを提供するので、同一のヌクレオチド配列はストランド置換又は除去の必要なしに配列決定することができると考察される。線状鋳型は同様に、例えば、標的配列の反復するパターンを提供するためにローリングサークル方法を通して環状化し複製する単一の開始鋳型又は標的配列から準備することができる。
【0026】
また他の側面では、ヌクレオチドの配列は、所与のプライミング部位にて鋳型のプライミングを再開することで鋳型の同じ部分を反復して配列決定することにより、反復して配列決定することができる。このような再開はその最も簡単な形において、固定化された鋳型を洗浄して前の重合複合体を取り除くために洗浄し、新しいポリメラーゼプライマー混合物を再導入し、合成すなわち配列決定プロセスを再び始めることを含んでもよい。固定化された鋳型の洗浄は、鋳型からポリメラーゼを分離できるように、温度、pH及び/又は反応混合物の塩濃度のひとつもしくはそれ以上を調整することを含んでもよい。同様に、ポリメラーゼは、線状鋳型の末端を脱合成することによって、単一鋳型分子の配列決定の完了を単に可能にすることができる。これによって、初期/プライマーストランドの除去は、鋳型から初期ストランドを融解すべく温度及び/又は塩濃度を上昇させるといったハイブリダイゼーション条件を調整することによって成し遂げることができる。
【0027】
なお他の側面として、例えば隣接するが光学的に分解可能な基板部分の上に隣接配置された複数のポリメラーゼ(例えば、顕微鏡スライド又はZMWアレイの隣接0モード導波管)を、同じ鋳型の異なった部分に対して用意してもよく、鋳型の同じ部分を複数回反復して処理することで配列決定するだろう。
【0028】
[III.配列前後関係]
上記で指摘したように、分子冗長配列から得られた配列情報の比較又はオーバーレイは、所定分子の配列の中の各塩基の共通同定を提供することによって、得られた配列情報の信頼性を高める利点を持つ。比較の容易化において、配列情報の多様な要素の前後関係は非常に有用である。そのために、本発明はこのような前後関係を提供するために、鋳型配列の中にレジストレーション配列を提供し、それを使用する。
【0029】
本発明の少なくとも1つの態様では、鋳型配列は、鋳型内の後続又は先行の配列の前後関係を示すレジストレーション配列を備える。 例えば、配列内の同一のヌクレオチドの各伸張の初期にレジストレーション配列を提供することにより、このような配列の開始を容易に同定することができる。環状鋳型の場合には、レジストレーション配列は鋳型上のセットポイントを提供し、環状配列上でプロセスが所定の時間にされることを示す。特に、このような配列決定に配列前後関係パラメーターを含むことによって行う。 配列前後関係パラメーターは、全標的核酸配列又は更に広い配列領域のよい幅広い前後関係の中で決定された配列フラグメントの配置の同定を容易にする。本発明に基づいて、配列前後関係パラメーターは標的配列の中に埋め込まれたレジストレーション配列を含む。鋳型内のレジストレーション配列の含有は鋳型配列の内部の所定配置の内部マーカーを提供する。このようなマーカーは、所定の鋳型分子から、又は鋳型配列のこのような複数の複製のなかにレジストレーション配列が同一的に位置する鋳型配列の複数の複製からの重複する配列読出しの整列を可能にする利益を提供することができる。 加えて、このようなレジストレーション配列は環状鋳型分子の内部の所定の関連した配置のマーカーを提供し、環状鋳型の複製及び/又は配列決定の完了の指示を提供する。
【0030】
本発明のレジストレーション配列は、発展したもしくは発展してきた結合方法、特に個々の鋳型分子からの配列決定に依存するそれらの方法による配列前後関係の決定に関して特に効果的である。一般に、結合方法による配列決定方法は、プライマー伸長反応に作用する鋳型の中のそれらの結合順を基本として配列の塩基を同定する。特に、プライマー伸長産物に組込まれている塩基が同定され、対となっている鋳型内の塩基を相補的に同定する。このような配列決定方法は、鋳型依存プライマー伸長反応にて逐次塩基を加えることを含み、各結合事象にて組込まれた塩基が同定される。
【0031】
一般に、当該の方法はその結合事象を越えた更なるプライマー伸長を防ぐため、例えば、加えられた塩基の3’ヒドロキシル基にて被せられ又は開鎖され染料標識ヌクレオチドを利用する。一度組込むと、塩基上の染料は特定の塩基が組込まれたことの徴候として検知される。それから複合体は開鎖又は被せられた基と染料又は標識基を取り除くように処理され、そして本プロセスが繰り返され、組込まれる次の塩基を同定し、このようにして基本的な鋳型の配列を同定する。この方法の異なった変形は、一度に単一の型の塩基を使用して複合体を取り調べ、異なる塩基を試す前に塩基が組込まれているか否かを判定することができる。あるいは、それらは異なって標識された複数の塩基を同時に使用し、組込まれたヌクレオチドの染料のスペクトル特徴から組込んだ塩基を同定してもよい。また他の方法は、発光酵素レポーターシステムを使って、ピロリン酸塩といった結合反応の副産物の存在の分析により結合を判断する非蛍光性検出技術を採用する。
【0032】
特に好ましい側面では、本発明はリアルタイムの単一分子配列決定方法に関して使用される。このような方法は例えば、米国特許第7,033,764号、第7,052,847号、第7,056,661号及び第7,056,676号に記載されていて、その開示内容全体を参考資料として全目的で本明細書に組込む。要するに、これらの方法は一般に個々の複合体が他の複合体から光学的に分解可能なように固体の支持体に固定された鋳型/プライマーポリメラーゼ複合体を提供する。標識されたヌクレオチドが複合体に導入され、それらの結合が直接観測できる。直接観測はエネルギー転送供与体/受容体フルオロフォアの組といった相互作用ラベルの使用によって提供でき、その場合、供与体又は受容体フルオロフォアの一方が例えば、ポリメラーゼ分子上の離れた配置にて複合体の活性部位に近接して束縛され、組の他の要素は組込まれているヌクレオチドに結びついている。受容体標識ヌクレオチドが組込まれるとき、それはポリメラーゼ上の供与体と近接するように組込まれ、検知可能な蛍光信号が生成される。代わりの手段として、結合の間、ヌクレオチド類似体からポリリン酸塩鎖が分裂するまで抑制されるフルオロフォアを採用し分裂によって染料の抑制が解除される。
【0033】
さらに別の好ましい手段として、固定された複合体の光閉じ込めがあり、蛍光標識を検出でき且つランダムに拡散する標識又は標識ヌクレオチド(更に短期的な信号プロファイルをもつ)から区別できる十分な時間の間、組込みによって標識ヌクレオチドを閉じ込めの照明/検出体積中に取り込む。特に好ましい閉じ込めの例として、ゼロモード導波管アレイが挙げられる。上記で参考として本明細書に組込んだ米国特許第7,033,764号,第7,052,847号,第7,056,661号,及び第7,056,676号、並びに、米国特許第6,991,726号,第7,013,054号,及び第7,181,122号(その開示内容全体を参考として全目的で本明細書に組込む)を参照のこと。特に、このようなZMWは透明な基板上に配置されたクラッド層により特徴付けられ、このクラッド層はそれを通して下の基板にまで配置された中空のコアを有し、 これらのコアはクラッド/基板の全域にわたって配列される。例えば、断面において約20〜約200nmのナノ規模の断面寸法(長さ、幅又は直径)を有するこれらのコアを設けると、コアを通る光がコアのカットオフ周波数より低い周波数の光の場合にその光の伝搬を減衰させることで、コア内に光閉じ込めが得られる。その結果、光はコア中に短距離進むだけであり、光を送り出すコアの端部にて非常に小さな照明体積が得られる。
【0034】
上述したように、これらの配列決定方法に用いられる鋳型にレジストレーション配列を組込むことにより、これらの方法から得られる配列情報に対する基準又は整列配列が得られる。このような整列配列は、環状鋳型から配列決定された繰り返し部分を同定するために、又は線状若しくは環状鋳型配列の同じ若しくは同一セットから得られる配列を整列させるために用いることができる。図1はこのような整列を行う際のレジストレーション配列の使用を示す。特にパネルIに示されるように、適当なプライマー配列104と核酸ポリメラーゼ106を鋳型分子102に複合化させた当該鋳型分子102上で、プライマー伸長反応が実行される。鋳型配列102はレジストレーション配列108を備える。鋳型は、プライマー伸長反応において例えば反復して反応させる線状分子として、又は連続的な反応を行わせる環状分子としてプライマー及びポリメラーゼ酵素と繰り返し反応させる単一鋳型分子としてもよく、あるいは1種以上の異なるポリメラーゼ及びプライマーと反応する複数の同一鋳型配列を含んでもよい。鋳型が単一分子か複数の同一配列か否かに関わりなく、その配列内の特定の位置にレジストレーション配列(ハッチングされたボックスとして図示)を含む。
【0035】
パネルIIに示されるように、このような鋳型から、例えば標的/鋳型配列の異なる部分に由来する性質がやや異なる配列情報を得ることができる。つまり、鋳型に対して繰り返されるポリメラーゼ106によるプライマー伸長により、鋳型配列に由来する配列情報又は読取り110、112、114及び116が生成され、これらはレジストレーション配列108の相補物を含む(それぞれ登録相補物118、120、122及び124として示される)。
【0036】
レジストレーション配列の相補配列118−124の存在により、パネルIIIに示されるようにこれらの決定された配列をどのように整列させるかが分かる。本明細書の別のところで述べたように、このことは、配列決定の範囲、例えば所与の地点まで配列決定したか否かについて指標を与えることができ、又は得られた配列範囲のレベルを判断するのに使用できる。特に、核酸の配列決定の場合、配列決定プロセスの精度は一般に所与の配列領域の種々の配列決定又はカバー範囲に依存する。鋳型配列の所与の部分に対する各パスの始めと終わりを同定することにより、単一の鋳型分子又はその部分からカバー範囲レベルを容易に求めることができる。同様に、配列の前後関係においてレジストレーション配列が等しく配置された複数の同一の鋳型分子(又は重なり合った鋳型分子)を配列決定する場合、レジストレーション配列の周りの特定の配列領域を何回配列決定したかの尺度を与える。例えば、図1のパネルIIIでは、整列した配列から、配列の部分A及びFが2回カバーされ、部分B及びEは3回カバーされ、部分C(レジストレーション配列)及びDの配列は4回カバーされている。
【0037】
ある場合には、配列決定プロセス中に得られる配列情報を同類として分類するために、所与の鋳型分子中に1より多いレジストレーション配列を組込むのが望ましい。このことにより、特定の標的配列セグメントの開始及び終了地点を同定できる。所与の鋳型中のこのような複数のレジストレーション配列は、それらを同定し区別するのを助けるために、同一又は異なる塩基配列を含んでもよい。
【0038】
他の側面では、配列決定のために遺伝物質の別々のフラグメントにおいてレジストレーション配列を用いてもよく、遺伝物質(例えばゲノム)より大きな断片の所与の領域からの各フラグメントには所与のレジストレーション配列がタグ付けされ、一方、異なる領域からの鋳型には異なるレジストレーション配列がタグ付けされる。次に、レジストレーション配列の配列決定では、配列プロセスがどこに存在するかについて鋳型内の位置決めと、当該より大きなゲノム中の特定のフラグメントがどこから得られたかについての同定との両方が行われる。実際には、より大きな標的遺伝物質(例えばゲノム)を分離フラクション(例えば100kb又は1メガベース)又は染色体に分割できる。次に、例えばタグの部分制限消化及びライゲーションにより、フラクション内の複数の場所にレジストレーション配列を加える。このようにして所与のフラクション内の各断片が、識別ラベルとして機能する同一のレジストレーション配列を得、すべてのフラクションが異なるレジストレーション配列を備える。次にすべてのフラクションからのすべての断片をプールし配列決定できる。次にレジストレーション配列情報を用いて個々の読取り(例えば、フラクション1から得られるレジストレーション配列1を有するすべての読取り、フラクション2から得られるレジストレーション配列2を有するすべての読取り)を整理する。この分画法は、大きな標的中に反復配列が存在する場合には特に有効であり、反復をその元の場所に割り当てることができる。分類法はまた、大きな標的中の短い読取りを整理するという整理の難しい状況においても有効である。
【0039】
本明細書の他のところでも言及したように、配列情報の整列におけるそれらの使用に加えて、特定の鋳型(例えば環状鋳型、又はレジストレーション配列が鋳型の5’末端に配置された線状鋳型)内のレジストレーション配列の同定により、鋳型配列全体が配列決定されたこと、又は当該鋳型の5’末端を通って少なくとも配列決定したことの基本的な確認を行うことができる。特に、環状鋳型に関して、鋳型を配列決定する際に少なくとも2回現れるレジストレーション配列の同定により、鋳型配列全体が1回カバーされて調査/決定されたことが確認される。さらに、図1に関して上記で言及したように、このようなレジストレーション配列により、単一の環状鋳型又は複数の同一鋳型から配列カバー範囲のレベルを直接読み出すことができる。
【0040】
上記のことを図2に概略的に示す。パネルIに示されるように、プライマー配列202とストランド置換ポリメラーゼ酵素204とが複合化した環状鋳型分子200が提供される。鋳型配列200はレジストレーション配列部分206を含む。プライマー伸長反応(パネルII)中、レジストレーション配列206に相補的な配列210を含んだ伸長反応産物208又は初期ストランドが生成される。例えば好ましいリアルタイム単一分子配列決定プロセスを用いて伸長反応から得られる配列情報が、パネルIIIA、IIIB及び/又はIIICに概略的に示される。特に、パネルIIIAに示されるように、レジストレーション配列212の少なくとも第1の同定からその配列214の第2の同定までの範囲の配列情報を得、間にあるセグメント216の配列が決定された。その結果、環状鋳型配列の全体を少なくとも1回は配列決定したことを容易に確認できる。複数回カバーする配列決定は、例えばパネルIIIBに示されるように、環状鋳型の周りで連続的に配列決定することにより行われる。カバー範囲のレベルを決定するには、レジストレーション配列の同定間の中間配列に対する通過回数を単に必要とするだけである(6回のカバーが図示)。
【0041】
さらに別の側面では、同じ環状鋳型配列又は複数の同一の鋳型配列の上で行われる複数の異なる伸長反応から得られる配列情報を、パネルIIICに示されるように、レジストレーション配列を用いて整列して配置してもよい。例えば、場合によっては、環状鋳型の異なる部分からプライマー伸長により、別々の非連続的な配列情報の断片を得ることもできる。このことは、ポリメラーゼの分離による所与のプライマー伸長反応の中断、故意若しくはその他による反応条件の変化、又は同じ鋳型配列に異なるやりかたで行われる複数の異なる伸長反応(異なる反応の各々は識別可能な配列出力を提供する)の結果により生じ得る。次に、パネルIIICに示されるように、配列情報のこれら別々の複数のフラグメントを、それらのレジストレーション配列によって関連付けることができる。
【0042】
既に述べたように、所与の鋳型分子から共通配列情報を得る際にレジストレーション配列を用いることができる。特に、同一のヌクレオチド配列が繰り返し配列決定された、単一鋳型分子からの配列情報が、同定されたレジストレーション配列に基づいて配列を整列させること(例えば少なくとも部分的に整列させることを含む)によってそれ自身と比較され、複数比較によって当該配列中の各塩基位置の共通配列情報を得る。この共通配列の決定の説明図が図3に示される。図示されているように、同一のヌクレオチド配列が繰り返し配列決定(配列302〜312として図示)されている、単一鋳型からの配列読取りが、それらのレジストレーション配列セグメント314に基づいて整列されている。図示されているように、同じ鋳型(例えば本明細書の他のところに記載のような環状鋳型又は反復配列鋳型)内の同一配列の繰り返し配列決定から、同じ配列が得られた。1以上の配列読取り(例えば塩基316及び318)において異なって読み出された塩基が、同じ位置の共通同定(例えば塩基320及び322)と比較される。所与の配列位置で十分な共通配列情報を得ることにより、所望の信頼レベルにてその位置の塩基を読み出し、よって鋳型の共通配列324を決定できる。
【0043】
明らかに、所与の位置で塩基を読み出すことのできる信頼性は、用いられる配列決定システムの固有の誤差率だけでなく、その位置を通って繰り返される配列読取りの回数に依存するであろう。しかしながら、特に、組込み中の非系統誤差率(例えばランダム配列誤差率)が25%と仮定すると、冗長配列決定プロセスにおける5重の配列カバーによって、所与の配列に対して実質的に低い、例えば理論的には0.1%より低い誤差率となることが分かる。
【0044】
冗長配列決定から塩基を読み出す際、所与の読み出しのコンセンサスを確立しなければならないことが分かる。よって、所与の位置での反復配列決定があいまいな結果になる場合、例えば各配列決定パスにおいて異なって同定される場合には、多数コンセンサスを確立するために、コンセンサス読み出しはその位置にて2より多い読み出しを必要とする。さらに、このようなコンセンサス読み出しにおける信頼性を高めるためには、当該位置にて3、4、5、10又はそれより多い読み出しを行う必要がある。例として、所与の位置がAとして1回、Cとして1回同定され、他には無い場合、50%より高い精度にて当該位置での正確な塩基読出しを同定するのは難しい。しかしながら、その位置での追加の読み出しを行い、例えば3回以上がAの読み出しであったなら、Cの読み出しは誤りであったと合理的な確実性をもって決定できる。
【0045】
したがって、本発明と共に、所与の鋳型からの配列データの比較は、鋳型中のヌクレオチド配列の同一の組からの少なくとも2つの配列読取り、好ましくは少なくとも5つの配列読取り、ある場合には少なくとも10の配列読取り、さらに別の場合には少なくとも15又は20の配列読取りを比較することを含む。
【0046】
複数の読取りが所与の標的配列から得られると、それらが整列され、共通配列が生成される。その簡単な形では、整列は、同じ配列位置に共通配列要素を配置し、欠けた又は置換された塩基に合わせて調節することによって手動で実行できる。しかしながら、好ましい側面では、整列ソフトウエアを用いてコンピュータによって種々の配列読取りを整列させる。例えばBLAST, FASTA, SSEARCH, SAM, DNABaserなどを含めて、様々な遺伝子整列プログラムが容易に入手できる。
【0047】
再度、一旦種々の配列読取りを整列させると、共通配列を確立できる。最も簡単な形では、単純な多数読み出しを用いて、所与の位置でのコンセンサス読み出しを確立してもよい。しかしながら、場合によっては、配列プロセスの誤差率から生じ得るあいまいさを取り除くために、共通塩基読出しのために圧倒的な過半数を確立することが望ましい。例えば、コンセンサス読み出しを確立するには51%より大きい過半数を必要とするのが望ましく、好ましい側面では、所与の位置にてコンセンサス読み出しを確立するために60%より大きい、70%より大きい、75%より大きい、80%より大きい、又は90%より大きいコンセンサスを必要とする。好ましい態様では、配列の比較及び共通塩基の決定は、この場合も、配列データを受信し、整列された配列のすべてに対する百分率コンセンサスに基づいてコンセンサス読み出しを割り当てるように適当にプログラミングされたコンピュータによって実行される。
【0048】
III.レジストレーション配列
レジストレーション配列の特定の性質は、少なくともある部分において、その配列が置かれる用途の性質に依存する。特に、鋳型配列内の長さ、及び配列構成、及び所望の配置(望まれる場合)は、以下で詳細に述べるように用途に依存して変わり得る。好ましくは、既知のレジストレーション配列は、外来導入されたレジストレーション配列であり、これはその元の状態にて存在する標的核酸配列の既知の部分と対照して「外来配列」などともいう。一般に、このような外来配列は、サンプル調製段階中に事前選択され標的配列に導入され、場合によっては、配列決定されている鋳型の性質(例えば長さ、予想される配列前後関係、鋳型内に天然で存在するレジストレーション配列の複製の可能性など)に基づいてレジストレーション配列を最適に認識するよう設計される。外来レジストレーション配列の事前選択及び/又は設計に加えて、一般にレジストレーション配列はまた、標的配列内で選択された特定の位置に配置される。選択された位置は、完全に既知であるか、又は相対的な意味で既知であってよく、例えば、環状鋳型中の所与の鋳型配列中に例えば1回存在するといったように特定回数存在することを知っているか、又は所与の鋳型配列の3’又は5’末端にさらに近接して若しくは3’又は5’末端に配置されていることを知っていてもよい。
【0049】
標的配列内で複製される可能性を最小にしてレジストレーション配列を確定的に同定する機会を最大にするように、レジストレーション配列を選択してもよい。一般に、標的配列内でレジストレーション配列が複製されない確率の変化は、レジストレーション配列の長さの関数となる。よって、一般に標的配列内のレジストレーション配列の長さは、決定される標的配列の長さに依存して変わる。
【0050】
例として、ランダムな1キロベース標的配列内に別様に存在する5塩基レジストレーション配列の確率は、高くはないが、1キロベース標的配列内で生じる所与の10塩基配列の確率より大きい。明らかに、鋳型配列が長くなればなるほど、複製の確率が増すことを考慮すれば、レジストレーション配列の所望の長さは長くなる。同様に、鋳型配列内の自然複製を避ける要求が強くなればなるほど、所望のレジストレーション配列は長くなる。一般に鋳型配列内で100〜1000又はそれ以上の連続した塩基から配列決定することが要求されるたいていの配列決定用途、例えばリアルタイム配列決定の場合、一般にレジストレーション配列の長さは約5〜約100塩基又はそれ以上変化し、好ましいレジストレーション配列の長さは約10〜約50塩基であり、特定の好ましい側面では、長さが約10〜約20塩基である。
【0051】
より大きな配列中に存在するn個の塩基配列の確率は、その配列中の特定塩基に関わりなく同じなので、レジストレーション配列中の特定の塩基配列は重要な成分ではない。しかしながら、場合によっては、他のもの、容易に識別可能な染料の組み合わせ、標的配列中の予想される配列塩基などに対する特定の塩基に関する配列決定の精度を利用するために、レジストレーション配列中の特定の塩基配列を選択するのが望ましいかもしれない。標的配列中の塩基の同一性に関わりなく、本発明によると、レジストレーション配列は既知の塩基配列から構成されるので、レジストレーション配列はレジストレーション配列が埋め込まれた標的配列から容易に同定できる。
【0052】
上述したように、一般にレジストレーション配列は鋳型配列内の特定の選択された相対位置に設けられる。選択された相対位置とは、レジストレーション配列の位置を確定的に知ることはできないが、他のなんらかの構成要素に対するその位置が少なくとも部分的に選択されることを意味する。例えば、線状標的配列などの特定の場合には、標的配列の3’又は5’末端に又はそれに近接してレジストレーション配列を設けてもよい。
【0053】
しかしながら、環状配列の場合には、環状標的内のどこかへのレジストレーション配列の配置は、選択された相対位置と考えられる。それ自身に対するその位置(標的配列の全長1つ分離れている)が既知だからである。
【0054】
標的又は鋳型配列内へのレジストレーション配列の提供は、一般に種々の方法により行うことができる。例えば、PCR又は他の非線形増幅プロセスを用いて、標的配列を複製するのに用いられるプライマー配列上に取り付けられたタグとしてレジストレーション配列を提供でき、実質的にこの標的配列は、配列決定されるストランドの3’又は5’末端に配置されたレジストレーション配列を有してサンプル内に存在する。二本鎖配列の一方のストランドの一方の末端又はもう一方の末端にレジストレーション配列を付加するのにライゲーションプロセスを用いてもよい。それに続く二本鎖鋳型の融解とポリメラーゼ及びプライマーの複合化により、レジストレーション配列を含んで新たに合成された鋳型が提供される。
【0055】
少なくとも1つの好ましい側面では、例えば図2に概略的に示されているように、配列決定されている鋳型核酸として環状の標的核酸が用いられる。特定の場合には、このような環状鋳型は、複合体の形成を再び始める必要なく繰り返し配列決定できるので特に好ましい。環状鋳型の周りで繰り返し配列決定することにより、配列の冗長性又は複数の配列カバー範囲を得ることができるので、決定された配列を検証できる。しかしながら、このような冗長配列決定プロセスを用いる際には、鋳型の配列決定が完全に又は所定回数行われた時を認識できることが特に有効である。レジストレーション配列部分を鋳型内に含めることにより、環状鋳型が配列決定されるたびに組込みカウンターを提供できる。環状鋳型が少なくとも1回配列決定されたことを確認することに加え、レジストレーションはまた、鋳型の複数の配列決定を整列させるための位置決めを行い、重なり合ったカバー範囲を整列させる。このような整列は、単一環状分子の配列決定、又は場合によっては同一の環状鋳型分子の複数回の配列決定(この場合にはレジストレーション配列は各鋳型中の同じ位置に提供される)に対して行うことができる。
【0056】
例として、組込みプロセスによる配列決定において、環状鋳型を用いている場合、配列決定プロセスが環状鋳型の周りで少なくとも1回進んだことを所望のレベルの確率にて示すのに十分な配列冗長性が存在するまで、全体の鋳型配列が得られたことを確信できなかった。所与の鋳型のデノボ配列決定を用いて実施する場合、正しい配列は不明であるので、一般にはこのような結論を引き出すことができる前に、鋳型配列全体を複数回カバーする必要がある。既知のレジストレーション配列を用いる場合、既知のレジストレーション配列を2回横切り同定した地点にて、配列を少なくとも1回通過したことを確認でき、環の周りの少なくとも1回の完全な実行が保証される。さらに、重なり合ったカバー範囲を探す際に、単一反応からの配列出力内のレジストレーション配列の反復同定により、その鋳型から得ている配列カバー範囲のレベルの直接的な指標が得られる。
【0057】
環状鋳型の作成は、公知のサンプル調製プロセスを用いて容易に実行でき、それにより、レジストレーション配列を、線状鋳型の末端部分に付加又は連結し(又は下にある標的配列から鋳型の調製に用いられる事前合成されたプライマー上のタグとして含ませ)た後、例えばcircリガーゼを用いる鋳型の環状化、又は他の公知の環状化技術を行う。
【0058】
レジストレーション配列は他の配列部分の統合成分として存在し得ることが分かる。例えば、レジストレーション配列は、配列決定プライマー認識配列として機能するか又はそれに結合され得る。よって、レジストレーション配列の導入は、プライミング配列の導入と同時に実行してもよい。他の機能的な配列成分は、制限部位、ヘヤーピンなどの配列を含んだ二次構造を含んでもよい。
【0059】
本発明は配列情報のリアルタイム読み出しによって一般的に記載されているが、好ましい側面では、配列決定部分又は鋳型配列のすべてから配列データを得た後、レジストレーション配列の存在に関して配列データの評価が行われる。配列データ中における転写されたレジストレーション配列の少なくとも2回の同定により、鋳型配列全体が読み出しの中に与えられていることが示される。
【0060】
固定長の鋳型により記載されているが、本明細書に記載されたレジストレーション配列を可変長の鋳型の一方の末端に含ませた後、環状化してもよい。このようにすることにより、線状鋳型中のレジストレーション配列から様々な距離にある鋳型配列のセグメントについてレジストレーション配列からの差動読出しが得られるが、これらのセグメントは環状化されるときレジストレーション配列に隣接して配置される。可変長の鋳型配列の提供は、例えばその長さ方向に沿った可変地点での鋳型配列の制限又は分割を含めて、種々の手段により実行し、元の鋳型配列のフラグメントの入れ子(nested)集合を生成し、その各々が一方の末端にレジストレーション配列を有し、もう一方の末端に全配列中の異なる地点を有する。鋳型フラグメントが環状化され、レジストレーション配列から新たに結合されたフラグメント末端の方向に配列決定されるとき、新たな配列から配列前後関係の情報と、異なる長さの他のフラグメントから決定された他の配列とを得ることができる。その結果は、複数の入れ子鋳型フラグメントの配列決定により鋳型配列の仮想的に重なったカバー範囲を提供することである。このことは図4に概略的に示されている。
【0061】
図4Aに示されるように、共通配列の1組の異なる長さのフラグメント(402、404、406)が与えられる。レジストレーション配列408が、例えば同じ配列位置にてフラグメントの共通端部に結合された後、環状化される。次に、環状配列の共通の開始地点の指示としてレジストレーション配列が用いられ、レジストレーション配列に隣接した非共通領域が共通の開始地点から可変距離にて連結されることが知られている。特に、単一鋳型配列の異なる長さの入れ子フラグメント(402、404、406)が得られ、各フラグメントの共通末端に連結されたレジストレーション配列408を有する。次に、各フラグメントが環状化され、環状鋳型(例えば環状鋳型412、414、416)が得られる。レジストレーション配列を越えて環状化フラグメントの非共通末端に向かって(矢印で図示)配列決定するとき、環状鋳型412、414及び416(それぞれ配列読取り422、424及び426として図4Bに概略的に図示)の各々から異なる配列情報を生成できる。
【0062】
これらの配列読取りの各々は下にある共通の鋳型から得られるので、これらのフラグメントが共通の配列コンテキストに由来することが分かる。さらに、例えばフラグメントにサイズベースの分離を行うことによって種々のフラグメントの相対長さの知識をもつことにより、鋳型配列全体のコンテキスト内で互いに共通しない配列の各々の相対位置を提供できる。このことを図4Cに概略的に示す。図示されているように、決定された各配列読取りは、特定サイズのフラグメントからのその原点により、下にある鋳型配列430内でコンテキストに割り当てることができる。さらに、重なった配列部分が2以上のこのような配列読取り内に存在する程度まで、これらの読取りに対して連続したコンテキストを決定できる。
【先行技術文献】
【特許文献】
【0063】
【特許文献1】米国特許出願番号第2006−0063264号
【特許文献2】米国特許第7,033,764号
【特許文献3】米国特許第7,052,847号
【特許文献4】米国特許第7,056,661号
【特許文献5】米国特許第7,056,676号
【特許文献6】国際公開第2007/075987号
【特許文献7】国際公開2007/075873号
【特許文献8】国際公開2007/076057号
【特許文献9】米国特許第6,991,726号
【特許文献10】米国特許第7,013,054号
【特許文献11】米国特許第7,181,122号
【符号の説明】
【0064】
102…鋳型分子
104…プライマー配列
106…核酸ポリメラーゼ
108…レジストレーション配列


【特許請求の範囲】
【請求項1】
標的核酸配列の中の選択された位置に既知のレジストレーション配列を提供し;
レジストレーション配列を含む標的核酸の配列の少なくとも一部を決定し;
配列の前記一部内のレジストレーション配列の相対位置から前記決定の段階で決定された標的核酸の配列の前記一部の配列の前後関係を同定する;
ことを含む標的核酸の決定された配列の配列前後関係を同定する方法。
【請求項2】
前記決定の段階が同一のヌクレオチド配列を複数回配列決定することを含み、レジストレーション配列が前記同一のヌクレオチド配列に関して選択された位置に提供される請求項1に記載の方法。
【請求項3】
標的核酸が環状核酸からなる請求項1に記載の方法。
【請求項4】
前記同一のヌクレオチド配列が標的核酸配列内で複数回提供される請求項1に記載の方法。
【請求項5】
前記決定の段階がレジストレーション配列を少なくとも2回決定し、標的核酸配列の前記一部の配列を決定することを含み、前記配列決定の前後関係を同定する段階が前記環状核酸の全体が少なくとも1回配列決定されたことを判断することを含む請求項1に記載の方法。
【請求項6】
標的核酸が線状核酸からなる請求項1に記載の方法。
【請求項7】
レジストレーション配列が標的核酸配列の内部で複数の位置に提供される請求項6に記載の方法。
【請求項8】
レジストレーション配列が標的核酸配列の一方の末端に近接し提供される請求項6に記載の方法。
【請求項9】
標的核酸の配列の少なくとも一部を決定する段階が、ポリメラーゼ媒介鋳型依存性プライマー伸長反応の間に塩基の結合によって配列を決定することを含む請求項1に記載の方法。
【請求項10】
標的核酸配列の少なくとも一部を決定する段階が結合方法によるリアルタイム配列決定を含む請求項9に記載の方法。
【請求項11】
レジストレーション配列が少なくとも5塩基から約100塩基を含む請求項1に記載の方法。
【請求項12】
レジストレーション配列が少なくとも5塩基から約50塩基を含む請求項1に記載の方法。
【請求項13】
レジストレーション配列が約10塩基から約20塩基を含む請求項1に記載の方法。
【請求項14】
標的核酸配列の内部に既知のレジストレーション配列を提供し;
標的核酸配列を環状化し;
レジストレーション配列が少なくとも2回配列決定されるまで標的核酸配列に非破壊的な配列決定方法を使用して標的核酸配列を配列決定すること;
を含む完全な標的核酸の配列決定方法。
【請求項15】
配列決定方法が鋳型に向けられたポリメラーゼ媒介プライマー伸長反応における結合の際に塩基を同定することを含み、標的核酸配列が鋳型を含む請求項14に記載の方法。
【請求項16】
配列決定方法が標的核酸配列のローリングサークル複製の産物を配列決定することを含む請求項14に記載の方法。
【請求項17】
配列決定方法がサンガー配列決定方法からなる請求項14に記載の方法。
【請求項18】
配列決定方法が鋳型に向けられたポリメラーゼ媒介プライマー伸長反応における結合の際に塩基を同定することを含み、ローリングサークル増幅産物が鋳型を含む請求項14に記載の方法。
【請求項19】
鋳型核酸を提供し、その一部が少なくとも第1のヌクレオチド配列と第一のヌクレオチド配列に関して選択された位置にレジストレーション配列を有し;
第1のヌクレオチド配列とレジストレーション配列と複数回配列決定し;
前記配列決定の段階で同定されるレジストレーション配列に少なくとも部分的に基づいて配列決定段階からの配列情報を整列し;
前記整列の段階から共通配列を決定し、ヌクレオチドの第1の配列の核酸配列を決定する;
ことを含む核酸配列を決定する方法。
【請求項20】
鋳型核酸が環状核酸であり、第1のヌクレオチド配列を複数回配列決定する段階が環状核酸を複数回配列決定することを含む請求項20に記載の方法。
【請求項21】
第1のヌクレオチド配列が鋳型核酸の中に複数回存在する請求項20に記載の方法。
【請求項22】
第1のヌクレオチド配列を少なくとも5回配列決定する請求項20に記載の方法。
【請求項23】
第1のヌクレオチド配列を少なくとも10回配列決定する請求項20に記載の方法。
【請求項24】
第1のヌクレオチド配列を少なくとも20回配列決定する請求項20に記載の方法。
【請求項25】
前記整列の段階がコンピュータによって行う請求項20に記載の方法。
【請求項26】
核酸合成複合体と、
複数の種類のヌクレオチド又はヌクレオチド類似体とを含む組成物であって、前記核酸合成複合体が、
少なくとも第一外来レジストレーション配列を含む第1の鋳型核酸配列;
核酸ポリメラーゼ;及び
第1の鋳型核酸配列の少なくとも一部に相補的なプライマー配列に相補的なプライマー配列を含み、鋳型核酸配列は鋳型核酸配列の中の同一のヌクレチオド配列に対して核酸ポリメラーゼが複数回プライマー伸長反応を行うように構成される組成物。
【請求項27】
第1の鋳型核酸配列が環状であり、核酸ポリメラーゼが環状配列の周りで複数回プライマー伸長反応を行う請求項27に記載の組成物。
【請求項28】
鋳型が、同一のヌクレオチド配列を含む複数の部分列を含む請求項27に記載の組成物。
【請求項29】
プライマー配列が外来レジストレーション配列の少なくとも一部に相補的である請求項27に記載の組成物。
【請求項30】
前記複数の種類のヌクレオチド又はヌクレオチド類似体が検知可能な標識を含む請求項30に記載の組成物。


【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate


【公表番号】特表2010−534474(P2010−534474A)
【公表日】平成22年11月11日(2010.11.11)
【国際特許分類】
【出願番号】特願2010−518235(P2010−518235)
【出願日】平成20年7月25日(2008.7.25)
【国際出願番号】PCT/US2008/009064
【国際公開番号】WO2009/017678
【国際公開日】平成21年2月5日(2009.2.5)
【出願人】(506141546)パシフィック バイオサイエンシーズ オブ カリフォルニア, インコーポレイテッド (11)
【Fターム(参考)】