説明

核酸分子に沿って順序付けられ分断化された配列断片を得るための方法およびシステム

伸長した形態で核酸分子をディスプレイする段階;分子を操作して核酸分子の長さに沿って、ポリメラーゼのアクセス可能な複数のプライミング部位を形成する段階;1つまたは複数のプライミング部位で伸張反応を開始する段階;伸張反応中に放出されるシグナルをモニターする段階;およびシグナルを分析して核酸分子の配列を決定する段階による、リアルタイムで単一核酸分子の順序づけられたセグメントのシーケンシングをするための新規の方法が開示される。


【発明の詳細な説明】
【技術分野】
【0001】
本発明は2007年10月22日付け出願の米国仮出願第60/981,803号に基づく優先権を主張する出願である。
【0002】
発明の分野
核酸のシーケンシングのための方法、システム、および組成物が提供される。より具体的には、本明細書では核酸分子に沿って順序付けられ、分断化された配列断片を用いてリアルタイムで単一分子のシーケンシングをするために適当な方法、システム、および組成物が提供される。
【背景技術】
【0003】
発明の背景
最も広く研究された生体高分子の一つはデオキシリボ核酸(DNA)であり、大部分のDNAの研究には配列分析が含まれる。一般的に「第一世代」の方法と呼ばれる従来からのシーケンシング方法は、シーケンシングすべき標的DNAを大量に必要とし、時間およびリソース集約的なプロセスを用いる。例えば、マクサム・ギルバートシーケンシング法は末端標識されたDNA断片を化学的に切断する。その後、得られた断片をゲル電気泳動でサイズにより分離し、ゲルによって生成した断片のパターンを解析することにより、もとの末端標識した断片の配列を決定する。この手法を用いた読み取り長は通常約500ヌクレオチドに制限されている。さらに、このような方法は時間がかかり、十分な量の開始材料を得るためにしばしば標的DNAの増幅が必要である。
【0004】
他の従来のDNAシーケンシング法は、一般にDNAポリメラーゼのようなシーケンシング酵素が、dNTPのような単量体サブユニットを重合することによって試験DNA分子を複製し、プライマーを関心対象の試験分子に相補的な新規合成DNA鎖に伸張する時に、その活性をモニターする段階を含む。重合産物はシーケンシング反応を終了した後で分析されるので、それによりプロセスはさらに長くかかる。例えば、サンガージデオキシシーケンシングは、4つの別々のDNAポリメラーゼ反応において、鎖を終了させるジデオキシヌクレオチドのランダムな取り込みを用いて末端標識されたヌクレオチドプライマーの伸長を含む。マクサム・ギルバート法における化学的に切断されたDNA断片と同様に、伸張産物はゲル電気泳動によってサイズで分離する必要があり、ゲルにおける断片のパターンを分析することでヌクレオチド配列が決定できる。もともとは放射性ヌクレオチド(radionucleotide)で標識されたプライマーで行われ、今日では4つの異なる蛍光標識されたジデオキシヌクレオチドを用いることで単一のゲルレーンでシーケンシング反応をサイズで分離することができるため、自動化シーケンシングが容易になっている。本手法を用いて読み取り長は約1000ヌクレオチドに制限されており、本プロセスを実行するためには数時間から半日かかる。
【0005】
全体として、これらの第一世代の方法では、比較的大量のDNA基質を必要とすること、複雑な液体操作段階を必要とすること、読み取り長の短さ(通常は500から1000ヌクレオチド)、および根底にある生化学の複雑さが足かせとなっている。さらに、これらの手法は核酸分子の迅速なシーケンシングには適さない。したがって、当技術分野では、例えば、少量の標的分子または単一の核酸分子から、従来のシーケンシング法で現在可能なものよりも迅速にシーケンシングできる迅速ポリマーシーケンシング法および組成物が必要とされている。
【0006】
過去10年、いわゆる「次世代」または「第2世代」の方法が出現し、これらはシーケンシングスループットおよびデータ生成速度の増加によって特徴付けられ、1塩基あたりのシーケンシングコストの低下、より高速なスループット、およびより高い感度が伴なう。それでもまだ、単一標的分子のリアルタイムのシーケンシングは実現していない。
【0007】
より最近には、いわゆる「第3世代」のシーケンシング法がリアルタイムで単一の標的分子のシーケンシングを試みている。これらの方法では、シーケンシング反応の間にシーケンシング機構の様々な成分に接着された発光団、蛍光体、または他の標識によって放出されるシグナルのモニタリングを行う。典型的には、これらの方法は、しばしば「対をなす末端読み取り(paired end read)」の形式で、テンプレートから単一配列の「読み取り」をモニタリングし、シーケンシング反応のプライミングは核酸テンプレートの各末端で起きる。これらの方法の中には、環境からの干渉を最低限に抑えるため、シーケンシング反応および/またはシグナル検出ゾーンを固定された狭い領域に限定する必要もあるものがある。最後に、これらの方法は一般に2次構造または3次構造に関する情報を提供せず、ハプロタイプベースの異型に関する情報も提供しない。したがって、本技術分野において、特定のマクロおよびミクロの特性に関してDNAの効率良く速いスクリーニングのために、シーケンシングとDNA識別マッピングを組み合わせる戦略が必要とされている。
【発明の概要】
【0008】
本明細書に記述される方法および関連する組成物は、現行の方法に対して著しい利点を持つ。例えば、開示された本方法は長いDNA鎖のシーケンシングを可能にするため、伸張した連続核酸配列の正確な組み立てが容易になる。さらに、これらの方法は並行してハイスループットのシーケンシングを簡単にできるようにし、究極的にはゲノム全体を迅速かつ安価に同時にシーケンシングすることを可能にする。
【0009】
より具体的には、本明細書では、核酸分子をディスプレイする段階;核酸分子を操作して核酸分子の長さに沿って1つまたは複数のポリメラーゼのアクセス可能なプライミング部位を形成する段階であって、1つまたは複数のプライミング部位は、検出システムによって、各プライミング部位で起きるシーケンシング活性の独立した検出および分解が可能なために十分な長さのヌクレオチドによって互いに分離されている;核酸分子の少なくとも一部に、ポリメラーゼ溶液および1つまたは複数の検出可能に標識された成分を、少なくとも1つのプライミング部位から伸張が起きるような条件で接触させる段階;少なくとも1つの検出可能に標識された成分により伸張反応中に放出されるシグナルをモニターする段階;ならびに核酸分子の少なくとも一部の配列を決定するためにリアルタイムまたはほぼリアルタイムでシグナルを分析する段階、を含む、リアルタイムまたはほぼリアルタイムで核酸分子の少なくとも一部のシーケンシングをする方法が提供される。
【0010】
任意で、検出可能に標識された成分の少なくとも1つは、フェルスター共鳴エネルギー転移(FRET)ドナーを含む。
【0011】
任意で、検出可能に標識された成分の少なくとも1つは、FRETアクセプターを含む。
【0012】
任意で、検出可能に標識された成分の少なくとも1つは、FRETドナーおよびFRETアクセプターの両方を含む。
【0013】
いくつかの態様では、検出可能に標識された成分の少なくとも1つは、FRETドナーに機能的に連結されたポリメラーゼである。
【0014】
いくつかの態様では、伸張反応中に放出されるシグナルは、FRETドナー基を含む少なくとも1つの検出可能に標識された成分と、FRETアクセプター基を含む少なくとも1つの検出可能に標識された成分の間で起きるFRETの結果である。
【0015】
いくつかの態様では、伸張反応中に放出されるシグナルは、FRETドナーとFRETアクセプターの間のFRETに起因するシグナルである。
【0016】
いくつかの態様では、伸張反応中に放出されるシグナルは、少なくとも1つの挿入色素分子と、FRETアクセプターで標識された少なくとも1つのヌクレオチドの間のエネルギー転移に起因するFRETシグナルである。
【0017】
いくつかの態様では、検出可能に標識された成分の少なくとも1つは、挿入色素である。
【0018】
いくつかの態様では、少なくとも1つの検出可能に標識された成分は、FRETアクセプターに機能的に連結されたヌクレオチドである。1つの態様では、FRETアクセプターは、ポリメラーゼによって合成される新生ヌクレオチド鎖にヌクレオチドが取り込まれると遊離される、ヌクレオチドの部分である。
【0019】
さらに別の態様では、FRETアクセプターはポリメラーゼによって合成される新生ヌクレオチド鎖に取り込まれる、ヌクレオチドの部分に結合し、シーケンシング法はさらに取り込み後にアクセプターを除去する段階を含む。いくつかの態様では、取り込み後のアクセプターの除去は、取り込み後のアクセプターの光退色、または取り込み後のアクセプターの光切断を含む。
【0020】
いくつかの態様では、単一核酸分子ディスプレイには、基質への接着による核酸分子の不動化が含まれる。任意で、ポリヌクレオチド鎖の不動化は、さらに伸長した形態のポリヌクレオチド鎖または複数のポリヌクレオチド鎖を不動化するために調合された層を持つ表面を含む基質を提供する段階を含む。任意で、不動化された各ポリヌクレオチド鎖は、少なくとも1つの接着部位によって基質に接着される。いくつかの態様では、不動化されたポリヌクレオチド鎖は、長さに沿って位置する複数の接着部位によって不動化されているため、鎖は基質に対して伸長した形態で固定されるので、その後の処理段階において鎖の動きが最低限に抑えられる。
【0021】
いくつかの態様では、単一核酸分子のディスプレイには、分子を受け入れディスプレイするように適応したナノ構造に分子を導入する段階が含まれる。
【0022】
いくつかの態様では、核酸分子を操作して複数のポリメラーゼアクセス可能なプライミング部位を形成する段階には、核酸分子の長さに沿って1つまたは複数のオリゴヌクレオチドプライマーをアニーリングする段階がさらに含まれる。1つの態様では、1つまたは複数のオリゴヌクレオチドプライマーは、ランダムプライマーである。いくつかの態様では、1つまたは複数のオリゴヌクレオチドプライマーは、部位特異的プライマーである。
【0023】
1つの態様では、核酸分子を操作して複数のポリメラーゼのアクセス可能なプライミング部位を形成する段階には、核酸分子の長さに沿って複数のポリメラーゼのアクセス可能なニック部位を形成するように適応させたニッキング試薬を核酸分子に接触させる段階がさらに含まれる。
【0024】
いくつかの態様では、核酸分子を操作して複数のポリメラーゼのアクセス可能なプライミング部位を形成する段階には、化学的または酵素的ニッキング剤でDNAを処理する段階がさらに含まれる。
【0025】
いくつかの態様では、ポリメラーゼ溶液は、少なくとも1つのタイプの検出可能に標識されたヌクレオチドを含む。または、検出可能に標識されたヌクレオチドは、ポリメラーゼ溶液とは別に添加される。いくつかの態様では、検出可能に標識されたヌクレオチドは、ポリメラーゼ溶液の添加の前、または後に添加される。
【0026】
いくつかの態様では、ポリメラーゼ溶液は少なくとも2、3、または4つのタイプの検出可能に標識されたヌクレオチドを含む。
【0027】
任意で、検出可能に標識されたヌクレオチドの少なくとも1つのタイプの検出可能な標識は、発色団、蛍光体、または発光団である。任意で、検出可能に標識されたヌクレオチドの少なくとも1つのタイプの検出可能な標識は、ROX、Cy3、Cy5、キサンチン色素、フルオレセイン、シアニン、ローダミン、クマリン、アクリジン、テキサスレッド色素、BODIPY、ALEXA、GFP、および前記の任意のものの修飾体または改変体からなる群から選択される。
【0028】
いくつかの態様では、ポリメラーゼ溶液はポリメラーゼを含む。任意で、ポリメラーゼはRNAポリメラーゼ、DNAポリメラーゼ、または逆転写酵素である。いくつかの態様では、DNAポリメラーゼはDNAポリメラーゼIのクレノウ断片、Phi29 DNAポリメラーゼ、B54 DNAポリメラーゼ、9°N DNAポリメラーゼ、Vent DNAポリメラーゼ、Deep Vent DNAポリメラーゼ、大腸菌(E. coli)DNAポリメラーゼI、T7 DNAポリメラーゼ、T4 DNAポリメラーゼ、テルムス・アクアティクス(Thermus acquaticus)DNAポリメラーゼ、またはテルモコックス・リトラリス(Thermococcus litoralis)DNAポリメラーゼである。
【0029】
いくつかの態様では、ポリメラーゼ溶液は、3、4、またはそれ以上のリン酸基を含む検出可能に標識されたヌクレオチドを少なくとも1つのタイプ含む。
【0030】
いくつかの態様では、少なくとも1つの検出可能に標識された成分は、検出可能に標識されたヌクレオチドを含み、ここで検出可能な標識は検出可能に標識されたヌクレオチドのポリリン酸鎖の末端リン酸に機能的に連結している。
【0031】
いくつかの態様では、少なくとも1つの検出可能に標識された成分は、少なくとも2つの別々の検出可能な標識に機能的に連結したヌクレオチドを含む。
【0032】
いくつかの態様では、ポリメラーゼ溶液はさらに検出可能に標識されたポリメラーゼを含む。
【0033】
いくつかの態様では、検出可能に標識された成分の少なくとも1つは、ナノ結晶または他のFRETドナーに機能的に連結したポリメラーゼである。
【0034】
いくつかの態様では、核酸分子は染色体DNAを含む。
【0035】
いくつかの態様では、核酸分子は完全な染色体を含む。
【0036】
いくつかの態様では、シーケンシング法は、本明細書に開示される方法に従った第1のヌクレオチド鎖のシーケンシングと並行して、1つまたは複数のさらなるヌクレオチド鎖をシーケンシングする段階をさらに含む。
【0037】
いくつかの態様では、検出可能に標識された成分は、検出可能に標識された1つのタイプのヌクレオチドおよび検出可能に標識されたポリメラーゼを含む。
【0038】
いくつかの態様では、検出可能に標識された成分は、分子の長さに沿ってテンプレートの核酸分子と非特異的に会合する蛍光部分を含む。任意で、蛍光部分はFRETドナーである。
【0039】
いくつかの態様では、蛍光部分は挿入色素である。いくつかの態様では、挿入色素はポリヌクレオチド鎖に吸収され、吸収されると蛍光的に活性になる。
【0040】
いくつかの態様では、ポリメラーゼのアクセス可能なプライミング部位は、検出システムを介してポリメラーゼのアクセス可能なニック部位上でポリメラーゼの独立した検出が可能になるために十分な距離だけポリメラーゼのアクセス可能な部位を分離するために十分なヌクレオチドの長さによって分離している。
【0041】
本明細書では、リアルタイムまたはほぼリアルタイムで核酸分子の少なくとも一部のシーケンシングをするための方法も提供され、これは基質に核酸分子を不動化する段階;不動化された核酸分子にニッキングをして鎖の長さに沿ってポリメラーゼのアクセス可能なニック部位を1つまたは複数形成する段階;不動化された核酸分子の長さに沿った1つまたは複数のポリメラーゼのアクセス可能なニック部位において伸張反応が開始する条件下で、挿入色素およびポリメラーゼ溶液を添加する段階であって、ポリメラーゼ溶液はさらにポリメラーゼおよび1つまたは複数の検出可能に標識されたヌクレオチドを含む段階;1つまたは複数のポリメラーゼのアクセス可能なニック部位における伸張反応中に放出されるシグナルをモニターする段階;ならびにリアルタイムまたはほぼリアルタイムでシグナルを分析し、核酸分子の少なくとも一部の配列を決定する段階を含む。
【0042】
いくつかの態様では、伸張反応はポリメラーゼのアクセス可能なニック部位を複数のヌクレオチド、または少なくとも10、20、50、100、250、500、または1000ヌクレオチド伸張する。
【0043】
いくつかの態様では、伸張反応は1つまたは複数のポリメラーゼのアクセス可能なニック部位において鎖に沿って伸張活性を可視化できるモニタリングサブシステムによってモニターされる。
【0044】
いくつかの態様では、伸張反応は、少なくとも1つの挿入色素分子および検出可能に標識されたヌクレオチドの少なくとも1つの検出可能な標識から転移するエネルギーに起因するFRETシグナルの検出によってモニターされる。
【0045】
いくつかの態様では、シーケンシング法は、検出されたイベントを、ニック部位におけるニックのない単鎖に相補的な同定されたヌクレオチドの配列に変換する段階をさらに含む。
【0046】
いくつかの態様では、ニック部位を分離している距離は約1 Kbから約250 Kbの間、約2 Kbから約200 Kbの間、約3 Kbから約100 Kbの間、約3 Kbから約50 Kbの間、約3 Kbから約10 Kbの間、約3 Kbから約5 Kbの間、または約5 Kbから約10 Kbの間である。
【0047】
本明細書ではまた、その上に少なくとも1つのポリヌクレオチド鎖を不動化してニッキングすることのできる基質を含む反応チェンバー;少なくとも1つのポリヌクレオチド鎖に沿ったニック部位で生じる伸張活性からのシグナルを検出することのできるモニタリングサブシステム;および伸張活性から検出されるシグナルを配列情報に転換し、その後、核酸の同定と分類のための順序付けられた配列断片情報が得られるように、少なくとも1つのポリヌクレオチド鎖の長さに沿って配列断片をマッピングする分析サブシステム、を含むポリヌクレオチド鎖に沿って順序付けられた配列断片を得ることによってヌクレオチド鎖のシーケンシングをするシステムも提供される。
【0048】
本明細書ではまた、その上に少なくとも1つのポリヌクレオチド鎖を不動化することのできる基質を含む反応チェンバー;少なくとも1つのポリヌクレオチド鎖に沿ったニック部位で起きる伸張活性から得られるシグナルを検出することのできるモニタリングサブシステム;および伸張活性から得られるシグナルを配列情報に転換し、その後、核酸の同定と分類のための順序付けられた配列断片情報が得られるように、少なくとも1つのポリヌクレオチド鎖の長さに沿って配列断片をマッピングする分析サブシステム、を含むポリヌクレオチド鎖に沿って順序付けられた配列断片を得ることによってDNAのシーケンシングをするシステムも提供される。
【図面の簡単な説明】
【0049】
本開示は、同様な要素には同じ番号が付与されている添付の説明図と合わせて以下の詳細な説明を参照するとより良く理解できる。
【0050】
【図1】本開示のシーケンシング法およびシステムの1つの態様の視覚的描写を表す。
【図2】4つの挿入色素の蛍光スペクトルを表す。
【図3】図3Aは、平均のバックグラウンド強度に対する、DNA断片を含むユーザー定義の関心領域(ROI)から得られるSYBRグリーンIの平均強度を表す。図3Bは、平均のバックグラウンド強度に対する、ユーザー定義のROI内でのYOYO-1の平均強度を表す。
【図4A】YOYO-1および4つの蛍光アクセプターのスペクトルを表す。
【図4B】量子ドット(Qdot 525)および4つの蛍光アクセプターのスペクトルを表す。
【図5】+-+-+およびPEBN層でコートされたガラス基質上のアクセプター標識されたヌクレオチドからのバックグラウンド蛍光の画像を表す。
【図6】部位特異的ニッカーゼでニッキングされ、アクセプター標識されたヌクレオチド(dU-Cy5)およびポリメラーゼとインキュベートされ、挿入色素YOYO-1と混合され、PEBNでコートされた表面に不動化された、DNAの画像を表す。
【図7】部位特異的ニッカーゼでニッキングされ、FRETアクセプター標識されたヌクレオチド(dU-Al610)およびポリメラーゼとインキュベートされ、挿入色素YOYO-1と混合され、PEBNでコートされた表面に不動化された、DNAの画像を表す。
【図8】部位特異的ニッカーゼでニッキングされ、アクセプター標識されたヌクレオチド(dU-Cy5)およびポリメラーゼとインキュベートされ、挿入色素YOYO-1と混合され、ポリアリルアミンおよびポリアクリル酸の連続する層でコートされた表面に不動化された、DNAの画像を表す。
【図9】部位特異的ニッカーゼでニッキングされ、PEBNでコートされた表面に不動化され、アクセプター標識されたヌクレオチドおよびポリメラーゼとインキュベートされ、挿入色素YOYO-1と混合された、DNAの画像を表す。
【図10】ドナーで標識されたポリメラーゼ、アクセプターで標識されたヌクレオチド、および非標識の表面に不動化されたDNAテンプレートを用いる、本明細書に開示されるシーケンシングの組成物および方法の1つの模範的態様を絵で表す。
【図11】図10の方法を用いて起きる取り込みイベントの検出を図解し、表面上に不動化された二重鎖に結合する異なるポリメラーゼの間で行われた、ドナーセグメントの様々な属性の比較を表す。
【図12】リアルタイムで塩基標識されたヌクレオチドの取り込みにより発生したFRET発光をモニターするための概略を表す。
【図13】FRETドナーとしてSYBRグリーンIを用いたアクセプターシグナルの評価を表す。
【図14】単一分子アッセイにおけるFRETドナーとしてSYBRグリーンIを用いたアクセプターシグナルの評価を表す。
【図15】FRETドナーとしてSYBRグリーンIを用いたアクセプターシグナルの評価を表す。
【図16】DNAse I、アクセプター標識ヌクレオチド、およびポリメラーゼを含む混合液とインキュベートされ、挿入色素YOYO-1と混合され、PEBNでコートした表面に不動化されたラムダ(λ)DNAの画像を表す。
【図17】右側に塩基標識されたdNTP(「BL dNTP」)を持つ20 ASNを示すリアルタイムの取り込みトレースを表す;ドナーの一時的減少はトレース中で明らかに検出される。
【図18】FRETイベントを同定するための蛍光画像の自動分断化および登録後の、分断化されたオブジェクトの重ね合わせの結果を表す。パネル18(A)はドナーチャネル中の平均強度の画像を表し、ユーザー定義のボックスは画像中の関心領域(ROI)を表す。パネル18(B)は、ドナーチャネル中の平均強度の画像の上への、分断化されたオブジェクトの重ね合わせを表す。パネル18(C)はアクセプターチャネル中の平均強度の画像を表し、ユーザー定義のボックスは画像中のROIを表す。パネル18(D)は、アクセプターチャネル中の平均強度の画像の上への、分断化されたオブジェクトの重ね合わせを表す。
【図19】パネル19(A)は、ドナーチャネル中の平均強度の画像の上への、分断化されたオブジェクトの重ね合わせを表す。図19(B)は、アクセプターチャネル中の平均強度の画像の上への、分断化されたオブジェクトの重ね合わせを表す。パネル19(C)は、アクセプターチャネル中の平均強度の画像の上への、ドナーチャネルに関して登録されたオブジェクトの重ね合わせを表す。
【図20】パネル20(A)の上段のグラフは、ドナーチャネルにおける分断化されたオブジェクトの正規化強度プロファイルを表す。パネル20(A)の中段のグラフは、アクセプターチャネルにおける分断化されたオブジェクトの正規化強度プロファイルを表す。パネル20(A)の下段のグラフは、E = NIA / NIA+NIDの公式を用いて計算して閾値処理された強度関数を表し、式中、NIAとNIDはそれぞれアクセプターおよびドナー分子の蛍光強度である。パネル20(B)はアルゴン488nmまたは赤色HeNe励起を介したアクセプターチャネル中で検出された点の共局在を表し、これは自動化分析のピクセル登録レベルの正確性を確認するものである。
【発明を実施するための形態】
【0051】
詳細な説明
他に定義されない限り、本明細書で使用されるすべての技術的および科学的用語は、これらの発明が属する技術分野の当業者によって一般的に理解されるものと同一の意味を持つ。本明細書で参照されるすべての特許、特許出願、公開された出願、論文、および本明細書で参照される上記および下記の両方の他の出版物は、その全体が参照により本明細書に組み入れられる。本明細書で規定される定義および/または記述が、参照により本明細書に組み入れられる特許、特許出願、公開された出願、および他の出版物で規定される任意の定義に反するまたは一致しない場合は、本明細書で規定される定義および/または記述が、参照により組み入れられる定義に優先される。
【0052】
本開示の実施には、他に示されない限り、当技術分野の範囲内である分子生物学、微生物学、および組み換えDNA技術の通常の技術が採用される。そのような技術は、文献に十分に説明されている。例えば、Sambrook, J., and Russell, D.W., 2001, Molecular Cloning: A Laboratory Manual, Third Edition; Ausubel, F.M., et al., eds., 2002, Short Protocols In Molecular Biology, Fifth Edition.を参照されたい。
【0053】
本明細書で使用される「1つの(a)」または「1つの(an)」という用語は「少なくとも1つ」または「1つまたは複数の」を意味する。
【0054】
本明細書で使用される「含んでいる(comprising)」(ならびに「含む(comprise)」および「含む(comprises)」を含めその任意の形態または活用形)、「持っている(having)」(ならびに「持つ(have)」および「持つ(has)」を含めその任意の形態または活用形)、「含んでいる(including)」(ならびに「含む(includes)」および「含む(include)」を含めその任意の形態または活用形)、または「含有している(containing)」(ならびに「含有する(contains)」および「含有する(contain)」を含めその任意の形態または活用形)は、包括的であるかまたは非限定的(open-ended)であり、追加的な、列挙されていない添加物、成分、整数、要素、または方法の段階を排除するものではない。
【0055】
本明細書で使用される「1つの(a)」、「1つの(an)」および「その(the)」ならびに同様な指示物は、文脈によりそうでないことが示される場合を除き、単数および複数の両方を含むと理解される。したがって、請求項または明細書において「含んでいる(comprising)」という用語と合わせて「1つの(a)」または「1つの(an)」という単語が使用されるときは、「1つ」を意味する可能性があるが、「1つまたは複数」、「少なくとも1つ」、および「1つまたは1つより多い」という意味とも適合する。
【0056】
本明細書で開示および主張されるすべての組成物および方法は、本開示を踏まえると過度の実験なしに作製および実施できる。本発明の組成物および方法は、好ましい態様の観点から記述されているが、これらの態様は請求の範囲を制限する意図は全くなく、本発明の概念、精神、および範囲から逸脱することなく、本明細書に記述される組成物および/または方法ならびに方法の段階または段階の順序に対して変化を適用することができることは、当業者に明らかだろう。より具体的には、本明細書に記述される物質を、化学的および物理的の両方で関連した特定の物質で置き換え、同一または類似した結果を得ることができることは明らかだろう。そのような当業者に明らかな類似した置換および改変は、添付の請求項によって定義される本発明の精神、範囲、および概念の中であると考えられる。
【0057】
本開示のシーケンシングの方法、システム、および組成物は、合わせて、放出されるシグナルをモニターすることによって、核酸のような関心対象の単一ポリマー分子の迅速なシーケンシングを提供する。より具体的には、本開示は、ポリヌクレオチド鎖に沿って順序付けられ、分断化された配列断片を得る方法を提供する。
【0058】
本開示に従ってヌクレオチドのシーケンシングを行うためには、シーケンシングする核酸分子を、インサイチューでの伸張(すなわち、シーケンシング)反応にかける前または後に、空間的に指定可能に並べるかまたは別の方法でディスプレイする。ディスプレイおよび/または伸張の前または後のいずれかに、分子の長さに沿って複数のポリメラーゼのアクセス可能なプライミング部位を導入または形成するために、核酸分子の処理も行い、鎖上の隣接するプライミング部位は検出システムによる独立した検出および分解を可能にするために十分な長さのヌクレオチドで分離している。プライミング部位を導入するための核酸分子の処理は、伸長/ディスプレイ段階および/または伸張段階の前、後、またはそれと同時に実行できる;段階の順序は重要ではない。プロセスのある時点で、ポリメラーゼが核酸分子の遊離3’末端にヌクレオチドを重合させることによって少なくとも1つのプライミング部位から核酸鎖を伸張させる条件下で、核酸分子にポリメラーゼ溶液およびシーケンシング機構の他の成分を接触させる。ポリメラーゼおよび/またはシーケンシング機構の成分は、シーケンシング反応が進行するにつれシグナルを放出する検出可能な標識に機能的に連結、または会合している。これらのシグナルは、リアルタイムまたはほぼリアルタイムで検出および分析され、核酸分子の少なくとも一部の配列情報を得る。本開示の典型的なシーケンシングの方法およびシステムは、図1に示されている。
【0059】
典型的には、シーケンシングをする核酸分子はDNAまたはRNAである;しかし、場合によってはポリメラーゼによって重合できるヌクレオチドアナログを含むポリマーである場合もある。
【0060】
典型的には、核酸は、核酸分子の特定の別個の点、部分、領域、または末端から放出されるシグナルが、可視化でき、核酸分子上のその起点に分解され割り当てられ、および時間を追って追跡できるような、空間的にアドレス可能な形式で維持されることによってディスプレイされる。核酸分子のディスプレイには任意の適当な方法が使用でき、これには表面上への分子の固定または不動化、層流中での核酸分子の懸濁、ナノ細孔への核酸分子の通過、導波路内または適当なナノ構造内への核酸分子の閉じ込め、例えば、核酸分子を受け入れディスプレイするように適応させたナノチュア(nanoture)、ナノウェル、ナノチャネル、もしくは同様なもの、または検出段階中に核酸分子を保持および制限するための光ピンセットが含まれるがこれらに限定されない。または、核酸分子は、分子から放出されるシグナルが、分子の長さに沿って追跡され、核酸分子に沿ったその起点に割り当てされるように、検出ステーションに対して分子を移動させることによってもディスプレイできる。
【0061】
1つの態様では、核酸分子は基質上の2次元表面に核酸分子を固定または不動化することによってディスプレイされる。核酸分子の不動化には、核酸に対して非特異的な付着を示す基質、または核酸分子を結合できる基質を含め、任意の適切な基質が使用できる。好ましくは、核酸分子は、伸長した形態でポリヌクレオチド鎖または複数のポリヌクレオチド鎖を不動化するように調合された層を持つ表面を含む基質に接触させることによって不動化する。核酸分子は、その後の処理段階中に鎖の動きを抑えるために、伸長した形態で鎖を基質に固定できるように、長さに沿って存在する複数の接着部位を介して表面に結合できる。
【0062】
他の態様では、個々のポリマー分子はナノチャネルアレイを含むナノ流体装置を用いてディスプレイおよび伸長され、ここでサンプルポピュレーション全体が、空間的にアドレス可能な形式で伸長およびディスプレイされる。本明細書に開示されるように、FRETに基づく分析と組み合わせた、関心対象の標的ポリマーを単離およびシーケンシングするためのナノ流体装置の使用は、著しい利点を提供する。例えば、試験ポリマー分子の分離および単離のためにナノ流体装置を使用すると、基質にシーケンシング成分を不動化または接着する必要性を回避することができ、また完全な染色体のシーケンシングも可能になるため、単一の反応から得られるシーケンシング情報の量が指数関数的に増加し、またメチル化、逆位、挿入欠失(indel)、およびタンデムリピートのような「マクロ」の構造的特徴の解析も可能になる。いくつかの態様では、複数のチャネルにおいて多数の高分子を同時に観察できるナノ流体装置を採用することができる。そのような装置は、単一の実験から得られる配列情報の量を増加させ、ゲノム全体のシーケンシングコストを低下させる。例えば、米国特許出願公開第2004/0197843号を参照されたい。さらに、ポリメラーゼ活性に機能的に連結した半導体ナノ結晶またはそのアナログを使用することにより、標識単量体がポリメラーゼにより新しく合成されるポリマーに取り込まれる際にポリマー配列のデータを作製でき、これによりリアルタイムでのポリマーのシーケンシングが可能となる。さらに、本明細書で開示されるナノ流体装置に基づくシーケンシング法は、単一の核酸分子レベルにおける「生の」配列の取得、およびテンプレート鎖に沿った複数点における同時プライミングを介した入来(incoming)配列情報の検証の両方に使用できる。
【0063】
DNAの操作には、分子から分解可能な配列情報を得る能力を保持し、分子の構造的完全性を維持しながら、すなわち、核酸分子の断片化、解重合、破損、または完全な切断を誘導しない、核酸分子の長さに沿って1つまたは複数のプライミング部位が形成される任意の処理方法が含まれるがこれらに限定されない。好ましくは、操作はDNA鎖の長さに沿って間隔をあけた各々のプライミング部位から独立した配列情報が決定できるように実行される。任意で、操作はプライミング部位の最適な間隔を得るように洗練され、それによりプライミング部位はその後の伸張のためにポリメラーゼが末端にアクセス可能になるために十分な長さのヌクレオチドによって互いに分離される。プライミング部位間のこの分離の長さ、または距離は、核酸鎖に沿って約1 Kb(キロベース)から約250 Kbの間で変わり得る。特定の態様では、隣接するプライミング部位間の分離距離は、核酸分子の長さに沿って約3 Kbと約5 Kbの間である。
【0064】
試験核酸分子上にプライミング部位を形成する1つの適当な方法は、1つまたは複数のプライマーと核酸分子をアニーリングすることによる。プライマーは、ランダムであるか、核酸分子の特定の部分にのみ結合するように適応されている可能性がある。
【0065】
核酸分子にプライミング部位を導入するために使用する別の典型的な方法は、化学的または酵素的な手段による、またはニッキング試薬を用いた、分子のニッキングを含む。適当なニッキング試薬には、ポリヌクレオチドのいずれかの鎖にニックを作成できる任意の試薬、例えば、エキソヌクレアーゼ、DNアーゼ、Fermentas International, Inc., Ontario, Canadaのグリコーゲン製品のような化学的試薬、または核酸分子の一方または両方の鎖にニック部位を導入できる他の任意の化学的または生物学的システムが含まれるが、これらに限定されない。限定的ニッキング反応は、Zasloff and Camerini-Otero, 1980に記述されるようにして核酸の不動化の前に溶液中で実行するか、ポリヌクレオチドのニッキングに酵素が使用される場合には、限定的ニッキング反応を核酸の不動化の後で行ない、すべてまたはほぼ全てのニック部位にポリメラーゼがアクセス可能であるようにできる。
【0066】
特定の態様では、ニッキング段階の後に、溶液中でニック部位に塩基標識したヌクレオチドを取り込ませることにより、伸張可能なニックの頻度を解析する。ニック入りの末端を含む得られた核酸は、本明細書に記述されるように、その後基質上に不動化し、アクセプターの直接の励起による、またはDNAを染色するために使用したドナー色素(例えば、SYBRグリーンI、YOYO-1、または同様な挿入色素もしくは溝結合色素)と取り込まれたアクセプターとの間のFRETの検出による、単分子検出システムを用いて可視化する。
【0067】
本発明の開示の方法およびシステムでは、核酸分子はポリメラーゼ溶液および少なくとも1つの検出可能に標識された成分と接触させる必要がある。そのような接触は、最終的にヌクレオチドの重合が起きるような、任意の適当な手段で、任意の相において、試薬の任意の順序での添加によって、および任意の適当な条件下で行なうことができる。
【0068】
典型的には、ポリメラーゼ溶液は、ポリメラーゼまたは単量体のサブユニットをポリマーに重合できる任意の試薬、および適当な緩衝液を含むポリメラーゼ溶液である。いくつかの態様では、ポリメラーゼによって伸張する鎖に重合され得るヌクレオチドまたはヌクレオチドアナログのようなシーケンシング機構の他の成分もポリメラーゼ溶液に含まれている。または、これらの追加的成分は、伸張反応に添加されるか、または手順の任意の時点で核酸テンプレートに接触され得る。伸張反応の任意の成分の添加の順序は重要ではなく、シーケンシング/伸張反応の全ての成分は、伸張する鎖に対するヌクレオチドの取り込みを介した生産的伸張を可能にする任意の順序で、シーケンシングをする核酸分子に添加または接触できる。
【0069】
典型的には、ポリメラーゼおよび/またはシーケンシング機構の他の成分は、検出可能な標識に機能的に連結または会合している。いくつかの態様では、ポリメラーゼ溶液のヌクレオチドが検出可能に標識されている。標識されたヌクレオチドが酵素活性部位に入ると、ヌクレオチド取り込み部位の5’(すなわち上流)または3’(すなわち下流)の両方、または5’と3’の両方に存在するドナー挿入色素分子からアクセプターへのエネルギー転移を介した高効率のFRETイベントが発生する。
【0070】
典型的には、検出可能なシグナルはFRETドナー部分とFRETアクセプター部分の間で生成するFRETシグナルである。フェルスター共鳴エネルギー転移(FRET)は2つの分子の電子的励起状態の間の距離依存的相互作用であり、その間にエネルギーは、第1の励起分子(FRETドナーと呼ばれる)から、その後光子を放出する可能性のあるFRETアクセプターと呼ばれる第2の分子に非放射的に転移する。エネルギー転移プロセスの結果、FRETドナーの蛍光強度および励起状態の寿命の低減(クエンチング)が起き、FRETアクセプターの発光強度の増加が起きる可能性がある。FRETは2つの適切に標識された分子または部分が、エネルギー転移が可能なために十分なほど互いに近接している場合にのみ起きる。FRETイベントの可視化は、FRETドナー色素部分からFRETアクセプター部分へのエネルギー転移により誘導されるFRETシグナルの検出を介して行われ得る。
【0071】
いくつかの態様では、FRETアクセプターはヌクレオチドに接着しており、FRETドナーはポリヌクレオチドバックボーン(例えば、リン酸基)、ポリヌクレオチド塩基、またはポリメラーゼのようなシーケンシング機構の任意の成分に機能的に連結、または他の方法で直接または間接的に会合している。
【0072】
好ましくは、FRETドナーはシーケンシング反応が進行するにつれ常に補給され、それにより伸張した読み取り長が得られる。補給するドナーの1つの例は、挿入色素を含むがこれに限定されない、核酸に配列非依存的に高親和性で結合する色素である。または、補給するドナーは、標識されたDNAポリメラーゼでよく、これはシーケンシング反応が進行するにつれ酵素の交換によって補給され得る。補給するドナーで標識されたポリメラーゼを用いたシステムの1つの態様は、図10に示されており、これはドナー標識ポリメラーゼおよびγ標識dNTPと共に、表面への接着を介して不動化された非標識DNAテンプレートの利用を含む。そのようなシステムは、いくつかの利点を提供する。例えば、ドナーは酵素の交換によって補給され得る。さらに、酵素複合体から二重鎖が解離する懸念がない。さらに、取り込みは、二重鎖にドナー(酵素)が結合した時にのみ起き、検出される。これはドナー標識ポリメラーゼとアクセプター標識γdNTPの間のFRETシグナルの検出によって示される。この態様では、ドナーのより迅速な交換が可能で、ドナーが光退色する可能性がより低いので、プロセッシビティーのより低い(less processive)ポリメラーゼを使用すると有利である。この方法の最も適当な酵素を決定するための実験が行なわれている。例えば、γ修飾dNTPとの活性が上昇しているがプロセッシビティー(processivity)が低下している変異ポリメラーゼを使用しても良い。
【0073】
または、いくつかの態様では、補給するドナーの代わりにナノ結晶のような超安定性ドナーを使用できる。この方法の1つの例示的態様には、ポリメラーゼに安定的に接着したドナーのナノ結晶が含まれる。
【0074】
1つの典型的な態様では、FRETドナーは、挿入色素分子または他の蛍光部分であり、これはポリヌクレオチドに高親和性を持ち、核酸分子の塩基の間に自然に挿入するかまたは核酸分子と別の方法で会合して、それにより挿入または会合状態において蛍光の上昇を作り出す。ポリメラーゼがヌクレオチドテンプレートに沿って移動すると、挿入色素分子は、ポリメラーゼの3’方向から外れ、DNAの5’方向に吸収されるため、重合反応が進行するにつれ常に補給される。アクセプター標識されたヌクレオチドが、ポリメラーゼによって新規合成されるDNA鎖に取り込まれるためにポリメラーゼの活性部位内に入ると、ドナーとFRETを起こし、それにより検出および解析できるFRETシグナルが放出される。取り込まれたヌクレオチドに結合したアクセプターが取り除かれると、第2の検出可能に標識されたヌクレオチドが活性部位に入り、第2の高効率FRETイベントを起こす。ポリメラーゼが、テンプレート依存的に鎖の遊離3’末端に標識単量体を連続的に付加することによって新規合成鎖を伸張すると、ポリメラーゼに結合され取り込まれた継続的に入来する各単量体の識別は、特定の単量体に接着したFRETアクセプターの発光スペクトルにより同定できるようになる。従って、新規合成される鎖の塩基配列は、以下に記述するように、FRETイベントの時間-配列の検出および解析によって、同定できる。
【0075】
典型的には、テンプレートDNA鎖は、プライミング部位が独立した検出および分解のために最適な間隔となるように、鎖の長さに沿って複数のプライミング部位を導入するよう処理される。検出および分解の限界は、開示された方法で採用される特定の検出システムの能力に依存する。
【0076】
開示された方法およびシステムの1つの重要な利点は、分子の長さに沿って各々が独立した伸張イベントとしてプライミングおよびモニターできる複数の、最適間隔のプライミング部位を作成するための核酸分子の処理から得られる。単一の鎖から複数の「読み取り」を同時に得ることにより、各試験から得られる情報は指数関数的に増加する。具体的には、鎖に沿った各シーケンシング複合体は、伸張した断片内に含まれる領域に関する配列情報のみならず、同じ鎖から得られる他の配列読み取りに対する各配列読み取りの位置に関する情報も提供する。言い換えると、鎖に沿った各配列読み取りは、別個であり、かつ順序付けられている。
【0077】
ポリメラーゼ溶液中のヌクレオチドポリメラーゼ酵素がプライミング部位を認識および結合し、ヌクレオチドの重合およびプライミング部位からの伸長によりプライミング部位における伸張を開始する接触段階の後に、シグナルの検出が行われる。リアルタイムのシーケンシングは、伸張反応が進行するにつれ、ポリメラーゼ溶液の様々な成分に接着した検出可能な標識からの発光をモニターすることによって行われる。
【0078】
いくつかの態様では、シーケンシングまたは伸張反応の進行は、FRETドナーおよびアクセプター部分の間のエネルギー転移を含む任意のFRETイベントに伴う、ドナー強度の一時的減少を検出することによって、追跡することもできる。ドナー強度の一時的減少を検出する能力は、様々な条件に依存する可能性がある。ドナー強度の一時的減少は、標準的な検出システムを用いてモニターできる。
【0079】
任意で、ニッキング反応後に、アクセプターFRETを最大化するために、核酸に会合するドナー蛍光体の数を変化させることができる。取り込むヌクレオチド上のアクセプターとドナー蛍光体の間の最適な間隔は、高いFRETが得られるようにドナー・アクセプター対のRよりも近い必要がある。特定の態様では、FRET効率は約80%よりも高い。核酸と相互作用するドナー蛍光体の数が少な過ぎると、ドナー蛍光体の間隔は広がり過ぎて、適切なFRETシグナルノイズ比、すなわち適切なFRET検出ができなくなる。しかし、挿入ドナー蛍光体が多すぎると、シグナルのクエンチングが起きる可能性がある。
【0080】
任意で、本開示の方法およびシステムで使用されるポリメラーゼは、収集時間の中のドナー持続時間およびドナーシグナル頻度に関してまず分析される。ドナーシグナルは、ノイズレベルと比較した強度に依存して、励起(デジタルユニット)および暗(デジタルゼロ)のセグメントとして割り当てられる。励起したドナーセグメントは、水平の濃い緑のバーで示され、暗領域は水平の黒いバーで示される(下記の図)。視野中の各々のドナーについて励起状態のドナーセグメントの数が抽出され、持続時間、強度、および頻度のようなこれらのセグメントの属性が分析される。表面上に不動化された二重鎖に結合した異なるポリメラーゼの間のドナーセグメントの属性の比較は図11に示されている。
【0081】
ヌクレオチドのシーケンシング分野の当業者には、開示された方法における段階の具合的な順序は定義されても強制でもなく、随意に変えることができることは容易に理解されるだろう。例えば、いくつかの態様では、プライミング部位の形成および/または伸張は、ディスプレイの前に実行できる;他の態様では、プライミングおよび/または伸張は、ヌクレオチドが不動化された後で実行される。またさらなる態様では、プライミング部位の形成および/または不動化は、伸張の前に行なわれる。これらの順列および組み合せの全て、ならびに本発明の精神および範囲を保持する任意の他のものは、本開示に従って使用でき、本発明の精神および範囲内であると考えられる。
【0082】
ポリメラーゼによる新規合成DNAへのヌクレオチドの取り込みに続くヌクレオチドの検出可能標識の除去は、任意の適当な手段で行なうことができる。典型的には、FRETアクセプターを含む検出可能標識が、ポリメラーゼ活性の天然副産物として取り込み時に遊離されるヌクレオチド部分に接着している場合に起きるように(例えば、リンカーを伴うまたは伴わないピロリン酸基;蛍光体)、除去は取り込み時の酵素的切断によって実行される。そのような標識は「非永続型」アクセプターと一般的に呼ばれる。他の態様では、FRETアクセプターを含む検出可能標識は「永続型」標識であり、すなわち、伸長するヌクレオチド鎖に取り込まれるヌクレオチド部分に接着したまま残り、したがってヌクレオチド鎖の新規合成部分にも取り込まれる。永続型アクセプターが使用される場合は、アクセプターは取り込み後に光退色もしくは光切断される、またはアクセプターは永続型アクセプターが永久に光退色するまで、次の入来ヌクレオチドによって放出されるシグナルに寄与することになる。
【0083】
単量体サブユニットをポリマーに重合する能力のある任意の適当なポリメラーゼが使用できる。好ましくは、ポリメラーゼはヌクレオチドポリメラーゼ、すなわち、DNA、RNA、または混合配列を伸張した核酸ポリマーに重合させるDNAまたはRNAポリメラーゼのような、ヌクレオチドを重合させるポリメラーゼである。一般に、ヌクレオチドポリメラーゼは、鎖の3’末端にヌクレオチドを重合させることによって、既存のポリヌクレオチド鎖、典型的にはプライマーを伸長する。また、精製および使用のために十分な量を宿主から単離できるポリメラーゼ、および/または使用に十分な量の発現、単離、および精製のために他の生物中に遺伝子操作されたポリメラーゼ、ならびに検出可能な特性を持つ原子または分子標識の接着を受けやすいアミノ酸によって1つまたは複数のアミノ酸が置換されている天然ポリメラーゼの変異体または異型も好ましい。例示的ポリメラーゼには、DNAポリメラーゼ、RNAポリメラーゼ、および逆転写酵素が含まれるがこれらに限定されない。
【0084】
好ましい態様では、ポリメラーゼはDNAポリメラーゼである。本明細書に開示される方法の実施に使用できる適当なヌクレオチドポリメラーゼには、任意の天然に存在するヌクレオチドポリメラーゼ、およびそのようなポリメラーゼの変異した、切断した、修飾された、遺伝子操作された、または融合した異型が含まれるがこれらに限定されない。公知の通常の天然に存在するDNAポリメラーゼには、細菌DNAポリメラーゼ、真核生物DNAポリメラーゼ、古細菌DNAポリメラーゼ、ウイルスDNAポリメラーゼ、およびファージDNAポリメラーゼが含まれるがこれらに限定されない。適当な細菌DNAポリメラーゼには、大腸菌DNAポリメラーゼI、II、およびIII、IV、およびV、大腸菌DNAポリメラーゼ(エキソヌクレアーゼ活性の欠如した変異体のようなその変異体を含む)のクレノウフラグメント、クロストリジウム・ステルコラリウム(Clostridium stercorarium)(Cst)DNAポリメラーゼ、クロストリジウム・テルモセルム(Clostridium thermocellum)(Cth)DNAポリメラーゼ、およびスルフォロブス・ソルファタリクス(Sulfolobus solfataricus)(Sso)DNAポリメラーゼが含まれるがこれらに限定されない。適当な真核生物DNAポリメラーゼには、DNAポリメラーゼα、δ、ε、η、ζ、β、σ、λ、μ、ι、およびκ、ならびにRev1ポリメラーゼ(ターミナルデオキシシチジルトランスフェラーゼ)およびターミナルデオキシヌクレオチジルトランスフェラーゼ(TdT)が含まれるがこれらに限定されない。適当なウイルスDNAポリメラーゼには、T4 DNAポリメラーゼ、T7 DNAポリメラーゼ、Phi29 DNAポリメラーゼ(Phi-29ポリメラーゼとも呼ばれる)、およびエキソヌクレアーゼ活性の欠如した変異体を含む変異および/または操作したPhi29 DNAポリメラーゼが含まれるがこれらに限定されない。適当な古細菌DNAポリメラーゼには、例えば、テルムス・アクアティクス(Taq)DNAポリメラーゼから単離されるDNAポリメラーゼ、テルムス・フィリフォルミス(Thermus filiformis)(Tfi)DNAポリメラーゼ、テルモコックス・ジリギ(Thermococcus zilligi)(Tzi)DNAポリメラーゼ、テルムス・テルモフィルス(Thermus thermophilus)(Tth)DNAポリメラーゼ、テルムス・フラブス(Thermus flavus)(Tfl)DNAポリメラーゼ、ピロコックス・ウェセイ(Pyrococcus woesei)(Pwo)DNAポリメラーゼ、ピロコックス・フリオスス(Pyrococcus furiosus)(Pfu)DNAポリメラーゼ、ならびにTurbo Pfu DNAポリメラーゼ、テルモコックス・リトラリス(Tli)DNAポリメラーゼ、またはベントDNAポリメラーゼ、ピロコックス種GB-Dポリメラーゼ、「ディープベント」DNAポリメラーゼ(New England Bolabs)、テルモトガ・マリティマ(Thermotoga maritima)(Tma)DNAポリメラーゼ、バチルス・ステアロテルモフィルス(Bacillus stearothermophilus)(Bst)DNAポリメラーゼ、ピロコックス・カダカラエンシス(Pyrococcus Kodakaraensis)(KOD)DNAポリメラーゼ、Pfx DNAポリメラーゼ、テルモコックス種JDF-3(JDF-3)DNAポリメラーゼ、テルモコックス・ゴルゴナリウス(Thermococcus gorgonarius)(Tgo)DNAポリメラーゼ、テルモコックス・アキドフィリウム(Thermococcus acidophilium)DNAポリメラーゼ;スルフォロブス・アキドカルダリウス(Sulfolobus acidocaldarius)DNAポリメラーゼ;テルモコックス種9° N-7 DNAポリメラーゼ;ピロディクティウム・オクルトゥム(Pyrodictium occultum)DNAポリメラーゼ;メタノコックス・ウォルタエ(Methanococcus voltae)DNAポリメラーゼ;メタノコックス・テルモアウトトロフィクム(Methanococcus thermoautotrophicum)DNAポリメラーゼ;メタノコックス・ヤンナスキイ(Methanococcus jannaschii)DNAポリメラーゼ;デスルフロコックス(Desulfurococcus)株TOK DNAポリメラーゼ(D. Tok Pol);ピロコックス・アビッシ(Pyrococcus abyssi)DNAポリメラーゼ;ピロコックス・ホリコシイ(Pyrococcus horikoshii)DNAポリメラーゼ;ピロコックス・イスランディクム(Pyrococcus islandicum)DNAポリメラーゼ;テルモコックス・フミコランス(Thermococcus fumicolans)DNAポリメラーゼ;アエロピルム・ペルニクス(Aeropyrum pernix)DNAポリメラーゼ;およびヘテロ二量体DNAポリメラーゼDP1/DP2のような熱安定性および/または好熱性DNAポリメラーゼが含まれるがこれらに限定されない。同様に、適当なRNAポリメラーゼには、T7、T3、およびSP6 RNAポリメラーゼが含まれるがこれらに限定されない。適当な逆転写酵素には、HIV、HTLV-I、HTLV-II、FeLV、FIV、SIV、AMV、MMTV、およびMoMuLVから得られる逆転写酵素、ならびに市販の「Superscript」逆転写酵素(Invitrogen)およびテロメラーゼが含まれるがこれらに限定されない。天然に存在するポリメラーゼに加えて、本明細書で開示される方法およびシステムは、天然に存在するポリメラーゼの任意のサブユニット、変異した、修飾された、短縮した、遺伝子操作された、または融合した異型(ここで変異は1つもしくは複数もしくは多くのアミノ酸の他のアミノ酸による置換、1つもしくは複数もしくは多くのアミノ酸の挿入もしくは欠失、または1つもしくは複数のポリメラーゼの部分の結合を含む)、天然に存在しないポリメラーゼ、合成分子、またはモノマーの既定のもしくは指定されたもしくはテンプレート化された配列を持つポリマーを重合できる任意の分子集合体が、本明細書で開示される方法では使用できる。特に、ドナーまたはアクセプター蛍光体に結合した時に望ましいレベルのプロセッシビティーを保持するポリメラーゼが好ましい。または低いエラー率で高い忠実度を示すように選択および/または操作されたポリメラーゼも好ましい。本明細書で使用される「忠実度」という用語は、特定のテンプレートに依存したヌクレオチドポリメラーゼによるヌクレオチドの重合の正確さをさす。ヌクレオチドポリメラーゼの忠実度は、通常はエラー率、すなわち、広く知られたワトソン・クリックの塩基対の法則に違反するようなヌクレオチドの取り込み頻度、として測定される。DNA重合の正確さまたは忠実度は、特定の酵素のポリメラーゼ活性によってのみならず、DNAポリメラーゼの3’-5’エキソヌクレアーゼ活性によっても影響される。DNAポリメラーゼの忠実度またはエラー率は、当技術分野で公知のアッセイを用いて測定できる。例えば、Lundburg et al., 1991 Gene, 108:1-6を参照されたい。ヌクレオチドポリメラーゼの適当な選択および操作によって、本明細書に開示される単一分子シーケンシング法のエラー率はさらに改善できる。
【0085】
任意で、本シーケンシング技術で使用するポリメラーゼは、下流の鎖を除去し、それによりDNA合成を促進するために強力な鎖置き換え活性または5’→3’エキソヌクレアーゼ活性のいずれかを持つように操作しても良い。操作したPhi29ポリメラーゼのようなプロセッシビティーの高いポリメラーゼが使用される場合には、下流の鎖がはずされる。しかし、5’で終結した鎖はプライマーの添加なしにはテンプレートとして作用できないので、この部位から2次的な配列情報は検出されず、それにより配列データ解析が混乱することになる。
【0086】
核酸が不動化される場合のようないくつかの態様では、トポイソメラーゼまたはジャイレースのような巻き戻し剤を伸張反応に添加して、最適なシーケンシングパフォーマンスを促進しても良い。不動化DNAはその長さに沿った様々な点で表面に接着することで通常は直線化され、それにより一連の閉鎖DNAドメインからなる。DNAの「閉鎖」状態を回避する1つのオプションは、トポイソメラーゼおよび/またはジャイレースを含めることでシーケンシング反応中に導入される可能性のあるDNAのスーパーコイルの数を調節することである(例えばChampoux, 2001を参照されたい)。そのような酵素を含める必要性は、配列の読み取り長およびDNAが表面に不動化されている程度の両方を反映する。長い読み取り長を持ち、したがって表面への接着部位の数が多いテンプレートでは、トポイソメラーゼおよび/またはジャイレースを含めると、シーケンシング中に生成するらせんの巻きの数または影響をより迅速に増加させる。これらの状況では、効率的な複製を支持するレベルでDNAのスーパーコイルを維持できる酵素を含めると有益である。
【0087】
いくつかの態様では、伸張反応は、伸張反応の進行を妨げる2次構造の形成を抑える薬剤の添加によって補助される。2次構造は色素分子に結合し、溶液中または外された単鎖中に挿入し低下した蛍光強度を示す色素分子と比較して、上昇した蛍光強度を示すので、そのような2次構造の存在は望ましくない。(例えばZipper et al., 2004を参照されたい。)そのような態様では、外された鎖の2次構造は、外された鎖への不適切な色素の挿入を招き、そのために蛍光の不適切な検出が起きる。そのような問題が起きた場合は、追加的な色素を用いて、最高の質の配列情報を生成する色素または色素の組み合せを同定できる。または、外された鎖を安定化させ2次構造の形成を予防する薬剤を伸張反応混合液中に含めても良い。不要な2次構造の形成を予防するために伸張反応混合液に任意で添加できる試薬の1つの例は、SSBPとしても知られる単鎖結合蛋白質である。
【0088】
特定の態様では、DNAと会合するドナー蛍光体の数は、高いFRETを生成する染色濃度を同定するために、最適化される。一般に、取り込まれたヌクレオチド上のドナー蛍光体とアクセプターの最適な間隔は、高いFRETが生じるようにドナー・アクセプター対のR0よりも近いはずで、80%を越えるFRETが好ましい。DNAと相互作用をする蛍光体の数が少な過ぎると、アクセプター蛍光体と高いFRETを生じるために十分近い間隔ではなくなる。しかし、DNAに挿入または結合するドナー蛍光体が多すぎると、蛍光のクエンチングが起きる可能性がある。
【0089】
開示された方法および組成物中で使用するために適当な脱重合剤には、DNA、RNA、またはDNA/RNA混合ポリマーの場合のエキソヌクレアーゼ、ポリペプチドの場合のプロテアーゼ、および連続的に多糖類を脱重合させる酵素または酵素システムのような、段階的に単量体を脱重合させる任意の脱重合剤が含まれるが、これらに限定されない。
【0090】
いくつかの態様では、FRETドナーはテンプレート核酸分子の塩基の間に挿入、または核酸分子とその他の方法で会合する、色素分子である。適当な挿入色素には、単鎖または二本鎖ポリヌクレオチドに差し込み、介在、または他の方法で挿入できる任意の検出可能な部分が含まれるがこれらに限定されない。挿入色素は蛍光色素、または主に挿入剤である分子に結合した蛍光色素で良い。挿入色素は当業者に周知である。開示された方法および組成物中での使用に適した挿入色素の例には、モノ-およびビス-挿入色素、フェナントリジンおよびアクリジン、例えば、エチジウムブロマイド、ヨウ化プロピジウム、ヨウ化ヘキシジウム、ジヒドロエチジウム、エチジウムホモダイマー、アクリジンオレンジ、9-アミノ-6-クロロ-2-メトキシアクリジン;インドールおよびイミダゾール、例えば、DAPI、ビスベンジミド色素、アクチノマイシンD、Nissl染色、ヒドロキシスチルバミジン、SYBRグリーンI(本明細書では単に「SYBRグリーン」とも呼ぶ)、SYBRグリーンII、SYBR GOLD、YO(オキサゾールイエロー)、TO(チアゾールオレンジ)、PG(ピコグリーン)、ATTO-TEC GmbH, Siegen, Germanyの色素、挿入色素、BEBO、BETO、およびBOXTO、BO、BO-PRO、TO-PRO、YOPRO、BOBO-3、挿入オキサゾールイエローDNA色素キノリニウム、4-[(3-メチル-2(3H)-ベンゾキサゾリリデン)メチル]-1-[3-(トリメチルアンモニオ)プロピル]-、ジイオダイド(YO-PRO)およびそのホモダイマー(YOYO)が含まれるがこれらに限定されない。例えば、WO/1997/017471および米国特許第5,734,058号および第6,015,902号を参照されたい。特定の態様では、DNAに会合するドナー蛍光体の数は、高いFRETを生じる染色濃度を同定するために最適化される。例えば、SYBRグリーンIおよび他の挿入色素を補給するFRETドナーとして使用すると、ドナーの寿命および強度が増加し、より重要なことにはアクセプターの強度が増加する。色素と塩基対の比が約1:5〜7で複数のドナーを使用すると、これは成長するDNA鎖のためのドナーとなり得る色素分子でDNAの区切り付けができる(例えば、Howell et al., 2002; Takatsu et al 2004を参照されたい)。
【0091】
開示された方法および組成物には、任意の適当なヌクレオチドまたはヌクレオチドアナログが使用できる。本明細書で使用される「ヌクレオチド」または「ヌクレオチドアナログ」という用語またはその異型は、天然に存在する、遺伝子的に改変または操作されたヌクレオチドポリメラーゼによって、新規に合成される鎖に重合されるおよび/または取り込まれることのできる任意の化合物をさす。本方法および組成物中で使用される適当なヌクレオチドまたは他の単量体には、リボヌクレオチド、デオキシリボヌクレオチド、改変リボヌクレオチド、改変デオキシリボヌクレオチド、リボヌクレオチドポリリン酸、デオキシリボヌクレオチドポリリン酸、改変リボヌクレオチドポリリン酸、改変デオキシリボヌクレオチドポリリン酸、ペプチドヌクレオチド、改変ペプチドヌクレオチド、および改変リン酸-糖バックボーンヌクレオチド、ならびに、原子および/または分子標識が接着したアナログもしくは異型を含む上記のものの任意のアナログもしくは異型、または混合物またはその組み合せを含むがこれらに限定されない、ポリメラーゼまたは他の重合化剤によって伸長するヌクレオチド鎖または他のポリヌクレオチドポリマーに段階的に重合されるおよび/または取り込まれることのできる任意のモノマーが含まれるがこれらに限定されない。非核酸ポリマー(例えばタンパク質)のシーケンシングのためには、例えば、タンパク質またはタンパク質アナログの合成にはアミノ酸(天然または合成)、および炭水化物の合成には単糖または多糖を含む、天然に存在する、遺伝子操作された、または合成のポリメラーゼによって重合できる任意の適当な単量体が使用できる。いくつかの態様では、標識ヌクレオチド単量体は、3、4、またはそれ以上のリン酸を含む。いくつかの態様では、ヌクレオチドまたはヌクレオチドアナログは、各ヌクレオチド分子あたり複数の検出可能な標識部分を含む。例えば、ヌクレオチドまたはヌクレオチドアナログは、永続型アクセプター、非永続型アクセプター、または同一のヌクレオチド分子に結合した永続型と非永続型のアクセプター基の両方を含む可能性がある。そのような「二重の」ヌクレオチドは当技術分野で公知である。例えば、全体が参照により本明細書に組み入れられる2007年2月21日出願の米国仮出願第60/891,029号および2008年2月21日出願の米国特許出願第12/035.352号を参照されたい。
【0092】
好ましくは、ヌクレオチドは適当な方法を用いて検出可能な標識に結合または機能的に連結している。ヌクレオチドを検出可能に標識するための任意の適当な方法が採用でき、米国特許第7,041,892号、第7,052,839号、第7,125,671号、および第7,223,541号;米国特許出願公開第2007/072196号および第2008/0091005号;Sood et al., 2005, J. Am. Chem. Soc. 127:2394-2395; Arzumanov et al., 1996, J. Biol. Chem. 271:24389-24394;およびKumar et al., 2005, Nucleosides, Nucleotides & Nucleic Acids, 24(5):401-408に記述されたものを含むがこれらに限定されない。本明細書出使用される「機能的に連結」という用語およびその異型は、リンカーとヌクレオチドの間;リンカーと色素部分の間;および同様なもののような、異なる分子または部分の組み合せの間で、利用されるヌクレオチドのシーケンシング法で遭遇する条件に耐えるために十分な安定性のある、化学的融合または結合または会合をさす。例えば、色素標識は、適当な技術を用いてリンカーおよび/またはスペーサーを用いてデオキシリボヌクレオチドポリリン鎖の末端リン酸に結合されても良い。適当なリンカーには、例えば、分子的な橋として作用して2つの異なる分子を機能的に連結できる任意の化合物または部分が含まれる。リンカーの例には、化学的チェーン、化学的化合物(例えば、試薬)、および同様なものが含まれるがこれらに限定されない。リンカーは、ホモ2官能性リンカーおよびヘテロ2官能性リンカーを含む可能性があるがこれらに限定されない。例えば、ヘテロ2官能性リンカーは、第1の分子に特異的に連結するための第1の反応性官能基を持つ1つの末端、および第2の分子に特異的に連結するための第2の反応性官能基を持つ反対側の末端を持つ。連結する分子および鎖の合成方法の条件のような要因に依存して、リンカーの長さ、および安定性、長さ、FRET効率、特定の化学物質への抵抗性および/または温度パラメーターのような性質を最適化するための組成は異なる可能性があり、得られた結合物が重合反応の最適化に有用であるようにヌクレオチドに検出可能な標識を機能的に連結するための十分な立体選択性またはサイズを持つ可能性がある。リンカーは標準的な化学的技術を用いて使用でき、ヌクレオチドに標識を接着するためのアミンリンカー(例えば米国特許第5,151,507号を参照されたい);ヌクレオチドに標識を機能的に連結するための第1または第2アミンを典型的に含むリンカー;およびヌクレオチド塩基に添加された硬い炭化水素アーム(例えばScience 282:1020-21, 1998を参照されたい)を含むがこれらに限定されない。
【0093】
ポリメラーゼ、核酸分子、および/またはヌクレオチドに結合するために適した任意の検出可能な標識が使用でき、これには発光性、光輝性、エレクトロルミネセント、生物発光性、化学発光性、蛍光、および/または燐光性の標識が含まれるがこれらに限定されない。典型的には、標識はFRETドナーおよび/またはFRETアクセプターを含む。FRETドナーおよび/またはFRETアクセプターは典型的には蛍光体または蛍光標識である;しかしFRETドナーおよび/またはFRETアクセプターは発光団、化学発光団、生物発光団、もしくは他の標識であるか、または下記に記述するようにこの反応に参加し得る消光剤である可能性もある。この記述では、FRET標識は便宜的に蛍光体または蛍光標識と呼ぶが、これによって消光剤を使用する可能性を排除するものでも、ドナーおよび/またはアクセプターを蛍光標識に限定するものでもない。または、開示された方法および組成物中で使用される検出可能な標識は、発光共鳴エネルギー転移、生物発光共鳴エネルギー転移、化学発光共鳴エネルギー転移、および、非重複アクセプターが使用された時の非重複エネルギー転移のようなフェルスターの理論に厳密に従わない同様なタイプのエネルギー転移を含むがこれらに限定されない他のタイプのエネルギー転移を互いに行なう可能性もある。例えばAnal. Chem. 2005, 77: 1483-1487を参照されたい。開示された方法および組成物で使用するために適当な検出可能な標識には、以下が含まれるがこれらに限定されない:ユーロピウムシフト剤、NMR活性原子または同様なものを含むがこれらに限定されない、重合剤またはdNTP中の特異的部位に接着できる任意の原子構造、分子または他の部分;Rhodol色素、ジクロロ[R110]、ジクロロ[R6G]、ジクロロ[TAMRA]、ジクロロ[ROX]または同様なものを含むがこれらに限定されないd-ローダミンアクセプター色素、フルオレセイン、6-FAM、または同様なものを含むがこれらに限定されない蛍光ドナー色素、のような蛍光色素;アクリジンオレンジ、アクリジンイエロー、プロフラビン、または同様なものを含むがこれらに限定されないアクリジン;2-メチルベンゾキサゾール、エチルp-ジメチルアミノベンゾエート、フェノール、ベンゼン、トルエン、または同様なものを含むがこれらに限定されない芳香族炭化水素;オーラミンO、クリスタルバイオレット、クリスタルバイオレット、マラカイトグリーン、または同様なものを含むがこれらに限定されないアリルメチン色素;7-メトキシクマリン-4-酢酸、クマリン1、クマリン30、クマリン314、クマリン343、クマリン6または同様なものを含むがこれらに限定されないクマリン色素;1,1’-ジエチル-2,2’-ヨウ化シアニン、クリプトシアニン、インドカルボシアニン(C3)色素、インドジカルボシアニン(C5)色素、インドトリカルボシアニン(C7)色素、オキサカルボシアニン(C3)色素、オキサジカルボシアニン(C5)色素、オキサトリカルボシアニン(C7)色素、ヨウ化ピナシアノール、Stains all、チアカルボシアニン(C3)色素、チアカルボシアニン(C3)色素、チアジカルボシアニン(C5)色素、チアトリカルボシアニン色素(C7)、または同様なものを含むがこれらに限定されないシアニン色素;N,N’-ジフルオロボリル-1,9-ジメチル-5-(4-インドフェニル)-ジピリン、N,N’-ジフルオロボリル-1,9-ジメチル-5-[(4-(2-トリメチルシリルエチニル)、N,N’-ジフルオロボリル-1,9-ジメチル-5-フェニルジピリン、または同様なものを含むがこれらに限定されないジピリン色素;4-(ジシアノメチレン)-2-メチル-6-(p-ジメチルアミノスチリル)-4H-ピラン(DCM)、4-(ジシアノメチレン)-2-メチル-6-(p-ジメチルアミノスチリル)-4H-ピラン(DCM)、4-ジメチルアミノ-4’-ニトロスチルベン、メロシアニン540、または同様なものを含むがこれらに限定されないメロシアニン;4’6-ジアミニド-2-フェニルインドール(DAPI)、4’,6-ジアミジノ-2-フェニルインドール(DAPI)、7-ベンジルアミノ-4-ニトロベンズ-2-オクサ-1,3-ジアゾール、ダンシルグリシン、ダンシルグリシン、ヘキスト33258、ヘキスト33258、ルシファーイエローCH、ピロキシカム、硫酸キニーネ、硫酸キニーネ、スクアリリウム色素III、または同様なものを含むがこれらに限定されない色々な色素;2,5-ジフェニルオキサゾール(PPO)、ビフェニル、POPOP、p-クアテルフェニル、p-テルフェニル、または同様なものを含むがこれらに限定されないオリゴフェニレン;過塩素酸クレシルバイオレット、ナイルブルー、ナイルレッド、ナイルブルー、オキサジン1、オキサジン170、または同様なものを含むがこれらに限定されないオキサジン;9,10-ビス(フェニエチニル)アントラセン、9,10-ジフェニルアントラセン、アントラセン、ナフタレン、ペリレン、ピレン、または同様なものを含むがこれらに限定されない多環式芳香族炭化水素;1,2-ジフェニルアセチレン、1,4-ジフェニルブタジエン、1,4-ジフェニルブタジイン、1,6-ジフェニルヘキサトリエン、β-カロテン、スチルベン、または同様なものを含むがこれらに限定されないポリエン/ポリイン;アントラキノン、アゾベンゼン、ベンゾキノン、フェロセン、リボフラビン、トリス(2,2’-ビピリジル)ルテニウム(II)、テトラピロール、ビリルビン、クロロフィルa、クロロフィルb、ジプロトン化テトラフェニルポルフィリン、ヘマチン、マグネシウムオクタエチルポルフィリン、マグネシウムオクタエチルポルフィリン(MgOEP)、マグネシウムフタロシアニン(MgPc)、マグネシウムフタロシアニン(MgPc)、マグネシウムテトラメシチルポルフィリン(MgTMP)、マグネシウムテトラフェニルポルフィリン(MgTPP)、オクタエチルポルフィリン、フタロシアニン(Pc)、ポルフィン、テトラ-t-ブチルアザポルフィン、テトラ-t-ブチルナフタロシアニン、テトラキス(2,6-ジクロロフェニル)ポルフィリン、テトラキス(o-アミノフェニル)ポルフィリン、テトラメシチルポルフィリン(TMP)、テトラフェニルポルフィリン(TPP)、ビタミンB12、亜鉛オクタエチルポルフィリン(ZnOEP)、亜鉛フタロシアニン(ZnPc)、亜鉛テトラメシチルポルフィリン(ZnTMP)、亜鉛テトラメシチルポルフィリンラディカルカチオン、亜鉛テトラフェニルポルフィリン(ZnTPP)、または同様なものを含むがこれらに限定されない酸化還元活性のある発色団;Cy3、Cy3B、Cy5、Cy5.5、Atto590、Atto61O、Atto611、Atto611x、Atto620、Atto655、Alexa488、Alexa546、Alexa594、Alexa610、Alexa610x、Alexa633、Alexa647、Alexa660、Alexa680、Alexa700、Bodipy630、DY610、DY615、DY630、DY632、DY634、DY647、DY680、DyLight647、HiLyte647、HiLyte680、LightCycler (LC) 640、Oyster650、ROX、TMR、TMR5、TMR6;エオシンY、フルオレセイン、フルオレセイン、ローダミン123、ローダミン6G、ローダミンB、ローズベンガル、スルホローダミン101、または同様なものを含むがこれらに限定されないキサンテン;あるいはその混合物もしくは組み合せ、またはその合成誘導体、またはFRET蛍光体-消光剤対で、これにはDLO-FBl (5'-FAM/3'-BHQ-l) DLO-TEBl (5'-TET/3'-BHQ-l)、DLO-JBl (5'-JOE/3'-BHQ-1)、DLO-HBl (5'-HEX/3'-BHQ-l)、DLO-C3B2 (5'-Cy3/3'-BHQ-2)、DLO-TAB2 (5'-TAMRA/3'-BHQ-2)、DLO-RB2 (5'-ROX/3'-BHQ-2)、DLO-C5B3 (5'-Cy5/3'-BHQ-3)、DLO- C55B3 (5'-Cy5.5/3'-BHQ-3)、MBO-FBl (5'-FAM/3'-BHQ-l)、MBO-TEBl (5'-TET/3'-BHQ-1)、MBO-JBl (5'-JOE/3'-BHQ-l)、MBO-HBl (5'-HEX/3'-BHQ-l)、MBO-C3B2 (5'-Cy3/3'-BHQ-2)、MB0-TAB2 (5'-TAMRA/3'-BHQ-2)、MB0-RB2 (5'-ROX/3'-BHQ-2)が含まれるがこれらに限定されない;MBO-C5B3 (5'-Cy5/3'-BHQ-3)、MBO-C55B3 (5'-Cy5.5/3'-BHQ-3)またはBiosearch Technologies, Inc., Novato, CAから得られる同様なFRET対;蛍光量子ドット(安定した長寿命の蛍光ドナー);NMR活性基を持つ標識;ラマン活性の標識;赤外、遠赤外、近赤外、可視紫外、遠紫外、または同様なもののような容易に同定できるスペクトルの特徴を持つ標識。化学的修飾が可能で、検出システムによる検出ができる検出可能な性質を含む任意の分子、ナノ構造、または他の化学的構造が、開示された方法およびシステムで使用され得ることを認識するべきである。そのような検出可能な構造には、現在公知のもの、現在設計されつつある構造、および将来作られる構造が含まれ得る。
【0094】
いくつかの態様では、ヌクレオチドはポリメラーゼによる新規合成鎖への次のヌクレオチドの取り込みの前に、適当な手段で除去できる遊離可能または非永続型標識を含む。適当な非永続型または遊離可能な標識の例には、ヌクレオチドまたはヌクレオチドアナログの塩基、糖、またはαリン酸に機能的に連結された検出可能な部分が含まれる。適当な手段で標識が切断および除去できるような、遊離可能に標識されたヌクレオチドの使用は、例えば、米国特許出願公開第US2005/0244827号および第US2004/0244827号、ならびに米国特許第7,345,159号;第6,664,079号;第7,345,159号;および第7,223,568号に記述されている。典型的には、FRETアクセプター標識は、その基礎のヌクレオチドがプライマー鎖に取り込まれる時に切断および遊離されるヌクレオチドリン酸基、例えばβリン酸、γリン酸、または入来ヌクレオチドの末端リン酸、に接着される。入来ヌクレオチドの取り込み時にリン酸が切断され標識が遊離されると、標識からのシグナル(または標識がFRETドナーの態様では、FRETドナーとFRETアクセプター部分の間のFRETシグナル)は、ヌクレオチドが取り込まれ標識(またはFRETシグナル)が拡散すると停止する。したがって、これらの態様では、各入来ヌクレオチドが標的核酸分子の相補的ヌクレオチドにハイブリダイズし、新規合成鎖に取り込まれると、ヌクレオチドの取り込みを示す検出可能なシグナルが生成する。FRETイベントが起きたかどうかおよびいつ起きたかを決定するためにアクセプターの強度の増加を検出することに加えて、それに伴うドナー強度の一時的減少も検出してFRETの発生を確認することもできる。ドナーの一時的減少の検出は、FRETイベントの独立した裏付けを提供することで有用であるが、アクセプターシグナルが十分に強く、明確に定義されている態様では、なしで済ますこともできる。
【0095】
取り込み時に標識を遊離するいわゆる「非永続型」アクセプターを含む特定の態様では、相補鎖に前に取り込まれたヌクレオチドからの干渉なしに連続的伸張が検出できる。他の態様では、ヌクレオチドは永続型標識を含み、これはポリメラーゼにより合成された新生ヌクレオチド鎖にヌクレオチドが取り込まれる時に遊離されない。適当な永続型標識の例には、ヌクレオチドまたはヌクレオチドアナログの塩基、糖、または内部リン酸、例えば、αリン酸、に機能的に連結した任意のFRETアクセプター部分が含まれるがこれらに限定されない。永続型標識をしたヌクレオチドは、安定なシグナルが好ましい場合に使用でき、それを使用すると、検出システムで観察するための支持体上への不動化の前に反応を実行でき、これにより反応効率が改善する。永続型標識をしたヌクレオチドは、反応部位へ単一ヌクレオチドが取り込まれることを確かにするため、ジデオキシヌクレオチドであり得る。
【0096】
非永続型標識をしたヌクレオチドまたは永続型および非永続型標識の両方を含むヌクレオチドは、非永続型シグナルの検出が好ましい場合に使用される。非永続型標識をしたヌクレオチドまたは永続型および非永続型標識の両方を含むヌクレオチドを使用するには、非永続型ラベルと特定の核酸鎖を関連付けるために、伸張反応がリアルタイムまたはほぼリアルタイムで実行され検出システム上で検出されることが必要である。
【0097】
ドナー蛍光体としてSYBRグリーンIのような挿入色素を使用する1つの利点は、そのような色素を使用すると、新しい色素分子がシーケンシング部位の上流と下流の両方で絶え間なく挿入される時に、ドナー蛍光体が効果的に補給できることである。この補給の結果、新しい蛍光体は、新規合成された二重鎖DNAに挿入される時に新しいドナーとして位置づけられる。そのような「ドナー置換シーケンシング」を行う場合には、ドナー-アクセプター対は、典型的にはドナーの発光スペクトルとアクセプターの励起スペクトルの間に重複があるように選択される。色素および色素の濃度は、ドナーの発光を最適化し、アクセプター強度を最大化するように選択される。特定の態様では、DNAに会合したドナー色素の特定の組み合せが、塩基の識別に基づいて他のシーケンシング技術で使用されるスペクトル分解したアクセプターと対になったときに、より高いアクセプターシグナルを生成し(すなわち、ドナー蛍光体はヌクレオチドの標識に使用したアクセプターの良いFRETパートナーである必要がある)、これらのドナー色素はその効果を最大化するために特定の比率で存在する必要がある場合がある。開示された方法および組成物では任意の適当なFRETドナー:アクセプター対が使用でき、これにはフルオレセイン、シアニン、ローダミン、クマリン、アクリジン、テキサスレッド色素、BODIPY、Alexa Fluor、GFP、または前記の任意のものの誘導体または修飾物が含まれるがこれらに限定されない。例えば、米国特許出願公開第2008/0091995号を参照されたい。
【0098】
ドナーからアクセプターへのエネルギー転移には光の放出が含まれないが、以下のように考えることができる:ドナーの励起は発光スペクトルにおけるエネルギーを生成し、これはアクセプターの励起スペクトルによって受け取られ、アクセプターの発光スペクトルからの光の放出に至る。実際には、ドナーの励起は連鎖反応を開始し、2つが互いに十分近くにある時にはアクセプターからの発光に至る。
【0099】
ドナーとアクセプターの間のスペクトルの重複に加えて、FRET効率に影響する他の要因には、ドナーの量子収率およびアクセプターの吸光係数が含まれる。FRETシグナルは、収率の高いドナーおよび吸光係数の高いアクセプターを選択し、この2つの間にスペクトルの可能な限り最大の重複があるように選択することによって最大化し得る。例えば、Piston, D.W.およびKremers, G. J., 2007, Trends Biochem. Sci., 32:407を参照されたい。
【0100】
他の態様では、ヌクレオチドに機能的に連結または接合した標識は、消光剤である可能性がある。消光剤は、ドナー蛍光体からの蛍光の低下またはクエンチングを通してシグナルを生成するので、FRET用途にアクセプターとして有用である。通常の蛍光標識と同様に、消光剤は吸収スペクトルおよび大きな吸光係数を持つが、消光剤の量子収率は極度に低下しており、消光剤は励起時にほとんどまたは全く光を放出しない。例えば、FRET検出システムでは、ドナー蛍光体を照明するとドナーを励起させ、適当なアクセプターがドナーの十分近くになければ、ドナーが光を放出する。この光のシグナルは、FRETがドナーと消光剤アクセプターとの間に起きる場合には低下または消滅しており、消光剤からほとんどまたは全く光の放出がない。したがって、ドナーと消光剤アクセプターの間の相互作用または近接性は、ドナーの光の放出の低下または欠如によって検出できる。消光剤の例には、Molecular Probes (Eugene, OR)の販売するQSY色素が含まれる。
【0101】
1つの例示的な方法では、蛍光標識と組み合せて消光剤が使用される。この戦略では、反応混合液中の特定のヌクレオチドが蛍光標識され、残りのヌクレオチドは1つまたは複数の消光剤で標識される。または、反応混合液中の各々のヌクレオチドが1つまたは複数の消光剤で標識される。ヌクレオチド塩基の区別は、FRETアクセプターから放出される光の波長および/または強度、ならびにFRETドナーから放出される光の強度に基づく。FRETアクセプターからシグナルが検出されなければ、FRETドナーからの光の放出における対応する低下は、消光剤で標識されたヌクレオチドの取り込みを示す。強度低下の度合いを用いて異なる消光剤の区別ができる。
【0102】
好ましくは、ヌクレオチドの挿入色素および検出可能な標識は、そのような標識の存在が、新規合成鎖のスピード、エラー率、忠実度、プロセッシビティー、および平均読み取り長で決定した重合反応の進行を不当に妨げることがないように選択および/または設計される。
【0103】
典型的には、シーケンシング反応は、適当なポリメラーゼおよび標識ヌクレオチドを添加することによって開始する。適当な温度、および2価金属イオンのような他の成分の添加は、特定のヌクレオチドポリメラーゼおよび標的核酸配列に基づいて、決定および最適化できる。反応部位を照明すると、検出可能なシグナル、例えば、FRETシグナル、の観察が可能になり、これはヌクレオチドの取り込みイベントを示す。
【0104】
ポリメラーゼがテンプレートに指図されて伸張する鎖にヌクレオチドを取り込むにつれ、反応混合液の様々な成分によって放出されるシグナルは、そのようなシグナルの検出および/またはモニタリングの可能な任意の適当なシステムにより検出される。典型的には、検出システムは、まずナノ構造中で単離されたポリヌクレオチドに対して、入射波長を生成および伝送し、その後に反応物からの発光を収集および解析することによって、これらの機能を果たす。典型的なシーケンシングシステムは、基質上の視野を観察する能力のある検出サブシステムを含む。視野は、1つまたは複数の伸長および不動化した核酸を観察できるように調節できる。シーケンシングシステムは、シーケンシングするヌクレオチド鎖のニック部位で起きるヌクレオチドの取り込みイベントを検出する能力のあるモニタリングサブシステムも含む。システムはまた、検出されたイベントをシーケンシング情報に変換し、その後、配列断片を核酸の長さに沿ってマッピングして、部分的または断片的配列情報を含め、核酸の同定および分類のための順序づけられた配列断片情報が得られるようにする解析サブシステムも含む。本開示に従って使用するために適当な検出システム例には、その全体が参照により本明細書に組み入れられる米国特許出願公開第2008/0241951号および第2008/0241938号が含まれるがこれらに限定されない。
【0105】
いくつかの態様では、本発明の検出システムは少なくとも2つの要素、すなわち励起源および検出器を持つ。励起源はアレイに含まれる反応物を励起するために使用される入射放射(incident radiation)を生成および伝送する。意図される用途によって、入射光の光源はレーザー、レーザーダイオード、発光ダイオード(LED)、紫外光電球、および/または白色光電球であり得る。望ましい場合は、複数の光源が同時に採用される。異なる励起スペクトルを持つ複数の異なる試薬化合物を採用する用途においては、複数の光源を使用して、複数または1つのタイプの分子の相互作用を同時に追跡するために複数の蛍光シグナルの検出ができることは特に望ましい。
【0106】
採用する標識戦略の性質に依存して、入来ヌクレオチドの窒素塩基の識別を行うために、任意の適当な検出戦略が採用できる。例示的な標識および検出戦略には、米国特許第6,423,551号および第6,864,626号;米国特許出願公開第2005/0003464号、第2006/0176479号、第2006/0177495号、第2007/0109536号、第2007/0111350号、第2007/0116868号、第2007/0250274号、および第2008/08825号が含まれるがこれらに限定されない。重合反応中に発光を検出すると、独自に標識された部分、反応物、またはサブユニットの間の独立した相互作用の区別ができる。適当な化学、電気、電磁気エネルギー(潜在的に任意の光源、典型的にはレーザー)への曝露、またはFRETの場合のような共鳴時に、ヌクレオチドに連結された標識は、「励起状態」へ遷移し、そこで発光部分の識別によって特徴づけられるスペクトル範囲にわたって光子を放出する。FRETが起きるためにはドナー部分は十分に励起される必要がある。
【0107】
発光は任意の適当な装置を用いて検出できる。当技術分野では広範囲の検出器が利用できる。代表的な検出器には、顕微鏡、光学的リーダー、高効率光子検出システム、光ダイオード(例えば、アバランシェフォトダイオード(APD);APDアレイ等)、カメラ、電荷結合素子(CCD)、電子増倍型電荷結合素子(EMCCD)、増感電荷結合素子 (ICCD)、光電子増倍管(PMT)、マルチアノードPMT、および上記の任意の検出器を搭載した顕微鏡が含まれるがこれらに限定されない。望ましい場合には、対象アレイは、以下に記述するように各々の空間的にアドレス可能なアレイの位置および励起源、光子検出器、または光伝送要素の適切な空間的配置を容易にするための様々な整列エイドまたは鍵を含む。
【0108】
典型的には、独立して標識された異なるヌクレオチドからの特徴的なシグナルは、それぞれの標識の区別ができる適当な検出方法を用いて、同時に検出され分解される。典型的には、各ヌクレオチドからの特徴的なシグナルは、異なる標識の特徴的なスペクトル特性を分解して区別される。例えば、Lakowitz, J.R., 2006, Principles of Fluorescence Spectroscopy、第3版を参照されたい。スペクトルの検出は、任意で、偏光、寿命、ラマン、強度、レシオメトリック、時間分解異方性、光退色後蛍光回復(FRAP)、および並行多色イメージングを含むがこれらに限定されない、並行して化学的に類似したまたは異なる標識の間の区別ができる他の検出方法と組み合せるまたはそれにより置き換えることもできる。例えば、Lakowitz、上記を参照されたい。後者の技術では、同じ検出器、典型的にはCCDが並行して画像を収集できるように、各標識に特徴的なスペクトル成分を分離するためのイメージスプリッター(例えば、2色性ミラー、フィルター、回折格子、プリズム等)の使用が好ましい。任意で、異なる波長特異性を持つ光学的要素(例えば、2色性ミラー、フィルター、回折格子、プリズム等)を通してサンプルを観察するために、複数のカメラまたは検出器が使用できる。発光イベントを区別するための他の適当な方法には、相関/反相関分析、蛍光寿命測定、異方性、時間分解法、および偏光検出が含まれるがこれらに限定されない。発光の検出のために実行できる適当なイメージング方法には、共焦点レーザー走査顕微鏡法、全内部反射(Total Internal Reflection)(TIR)、全内部反射蛍光(TIRF)、近接場走査顕微鏡法、遠視野共焦点顕微鏡法、広視野落射照明、光散乱、暗視野顕微鏡法、光変換、広視野蛍光、単一および/または多光子励起、スペクトル波長判別、エバネセント波照明、走査型2光子、走査型広視野2光子、ニポウ回転円板、多焦点多光子、および/または他の形の顕微鏡法が含まれるがこれらに限定されない。
【0109】
検出システムは、任意で、入射波長を反応物アレイに収集および/または方向づけする;反応物から放出されたシグナルを光子検出器に伝送および/または方向づけする;および/または入射波長もしくは反応物から放出される波長の光学的特性を選択および改変する、作用を持つ、1つまたは複数の光伝送要素を含む場合がある。適当な光伝送要素および光検出システムの具体的例には、回折格子、アレイ導波路回折格子(AWG)、光ファイバー、光スイッチ、ミラー、レンズ(マイクロレンズおよびナノレンズを含む)、コリメータが含まれるがこれらに限定されない。他の例には、光減衰器、偏光フィルター(例えば、2色フィルター)、波長フィルター(低域、帯域通過、高域)、波長板、および遅延線が含まれる。
【0110】
典型的には、検出システムは、1つの位置から別の位置まで変化したまたは変化しない状態で光を運ぶために適した光伝送要素を含む。そのような光伝送要素の非限定的な例には、光ファイバー、回折格子、アレイ導波路回折格子(AWG)、光スイッチ、ミラー(2色ミラーを含む)、レンズ(マイクロレンズおよびナノレンズを含む)、コリメータ、フィルター、プリズム、および適切な屈折率および形状で光伝送を導く任意の他の装置が含まれる。
【0111】
1つの態様では、検出システムは、複数の異なる位置からの異なる光学的シグナルを同時に検出するために、整ったアレイからのシグナルをアレイに基づく検出器の異なる位置へ方向付ける、光列(optical train)を含む。特に、光列は、異なるスペクトル特性を持つシグナルを、アレイ上の空間的にアドレス可能な各位置からアレイに基づく検出器、例えば、CCD上の異なる位置へ同時に方向付け分離するために、典型的には光回折格子および/またはウェッジプリズムを含む。各アレイ位置からのシグナルを検出器上の異なる位置に別々に方向付け、さらに各アレイ位置からの成分シグナルを分離することにより、各アレイ位置からの複数のシグナルを同時にモニターできる。
【0112】
1つの態様では、検出は、各々の異なるタイプのヌクレオチドが、残りとは異なるスペクトル特性を持つ標識に機能的に連結されており、それによりすべての異なるヌクレオチドタイプの取り込みの同時検出が可能になる、マルチ蛍光イメージングを用いて実施される。例えば、各々の異なるタイプのヌクレオチドは、異なる蛍光体の吸収および発光スペクトルの重複、ならびに異なる蛍光体の吸収および発光最大値の重複が最低限となるように各蛍光体が選択された、FRETアクセプター蛍光体に機能的に連結される可能性がある。異なるヌクレオチド標識の検出は、同時に2つまたはそれ以上の標的を観察することにより行われ、各標識からの発光は検出パス中で分離される。そのような分離は、典型的には、特定の発光波長を選択的に検出できる、帯域通過フィルター、イメージ分割プリズム、帯域遮断フィルター、波長分散プリズム、および2色ミラーを含むがこれらに限定されない適当なフィルターの使用によって行われる。そのようなフィルターは任意で、適当な回折格子と組み合わせて使用しても良い。
【0113】
または、各励起線および各発光帯域ごとに特別なフィルターの組み合わせのセクションを必要として、各標識を別々に観察することにより、異なる標識をされたヌクレオチドタイプの関与するマルチ蛍光試験が実施できる。1つの態様では、検出システムは調節可能な励起および/または調節可能な発光蛍光イメージングを使用する。調節可能な励起では、光源からの光はサンプルの照射の前に調節セクションおよび集光装置を通過する。調節可能な発光では、サンプルからの発光は、結像光学系および調節セクションを通過した後に検出器上に画像化される。ユーザーは調節セクションをコントロールしてシステムの性能を最適化しても良い。
【0114】
FRET技術を用いた塩基の区別のためには、いくつかの標識および検出戦略が利用できる。例えば、伸張反応中に存在する各ヌクレオチドタイプに異なる蛍光標識を使用して、異なる標識の間の区別は蛍光標識から放出される光の波長および/または強度に基づく場合がある。
【0115】
第2の戦略では、蛍光標識および消光剤を用いる。この戦略では、反応混合液中の特定のヌクレオチドは蛍光標識で標識され、残りのヌクレオチドは1つまたは複数の消光剤で標識される。または、反応混合液中の各ヌクレオチドは、1つまたは複数の消光剤で標識される。ヌクレオチド塩基の区別は、FRETアクセプターから放出される光の波長および/または強度、ならびにFRETドナーから放出される光の強度に基づく。FRETアクセプターからシグナルが検出されなければ、FRETドナーからの光の放出の対応する低下は、消光剤で標識されたヌクレオチドの取り込みを示す。強度の低下の程度は、異なる消光剤の区別に使用しても良い。
【0116】
典型的には、検出器からのシグナルは、A-Dコンバータを用いてデジタルシグナルに変換され、サンプルのイメージはモニター上に再構成される。任意でユーザーは、いくつかの異なる波長で導き出されるイメージを単一のイメージに組み合わせる複合イメージを選択しても良い。ユーザーは、特定のプローブが特定の色と人為的に結びつけられる、人為的カラーシステムを特定することもできる。別の人為的カラーシステムでは、ユーザーは特定の発光強度に特定の色を指定することができる。
【0117】
上に記述した標識および検出戦略の任意の組み合わせが、同一のシーケンシング反応中で採用できる。上記の戦略の任意のもので使用される区別可能な標識および消光剤の数によって、単一のシーケンシング反応中で1、2、3、または4つのヌクレオチドの識別が決定できる。その後、各反応で決定するヌクレオチドの識別を交代させて複数のシーケンシング反応を実施し、残りのヌクレオチドの識別を決定することができる。いくつかの態様では、これらの反応は同時に並行して実施し、短縮した時間で完全なシーケンシングが可能になる。
【0118】
取り込まれたヌクレオチドの識別は、ヌクレオチドがポリメラーゼにより新規合成鎖に取り込まれる際の、挿入色素ドナー部分および入来ヌクレオチドに接着したFRETアクセプター部分の間のFRET相互作用により、プライマー鎖の伸張が起きる際に迅速に、例えばリアルタイムまたはほぼリアルタイムで決定できる。
【0119】
典型的には、検出器の生成する生データは、波長および強度の情報を含む、複数の時間依存性蛍光データ流を表す。発光が検出され収集されると、データは発光の特定のスペクトル特性を、取り込まれた塩基の識別と相関させるための適当な方法を用いて分析できる。いくつかの態様では、そのような分析は適当な情報処理および制御システムによって実行される。好ましくは、情報処理および制御システムは、検出システムから収集されたデータを含むデータ記憶ユニットに付属したまたはこれを内蔵したコンピュータまたはマイクロプロセッサを含む。情報処理および制御システムは、特定のスペクトル発光特性を特定のヌクレオチドと関連付けるデータベースを維持する場合がある。情報処理および制御システムは、検出器により検出された発光を記録する場合があり、それらの発光と特定のヌクレオチドの取り込みと相関させる可能性がある。情報処理および制御システムは、テンプレート分子の配列を示すヌクレオチドの取り込み記録を維持する場合もある。情報処理および制御システムはバックグラウンドシグナルの差し引きのような、当技術分野で公知の標準的な手順も実施する場合がある。
【0120】
例示的な情報処理および制御システムは、情報の交信のためのバスおよび情報処理のためのプロセッサを含む可能性がある。1つの態様では、プロセッサはPentium.RTM、Celeron.RTM、Itanium.RTM、またはPentium Xeon.RTMファミリーのプロセッサ(Intel Corp., Santa Clara, Calif.)からなる群より選択される。または、他のプロセッサも使用できる。コンピュータはさらにランダム・アクセス・メモリ(RAM)または他の動的記憶装置、リード・オンリー・メモリ(ROM)および/または他の静的記憶装置、および磁気ディスクまたは光ディスクのようなデータ記憶装置、およびその対応するドライブを含む可能性がある。情報処理および制御システムは、ディスプレイ装置(例えば、ブラウン管または液晶ディスプレイ)、英数字入力装置(例えば、キーボード)、カーソル制御装置(例えば、マウス、トラックボール、またはカーソル指示キー)、および交信装置(例えば、モデム、ネットワークインターフェースカード、またはイーサネット、トークンリング、もしくは他のタイプのネットワークにカップリングするために使用されるインターフェース装置)のような当技術分野で公知の他の周辺装置も含む可能性がある。
【0121】
特定の態様では、検出システムもバスと連結していて良い。検出ユニットからのデータはプロセッサにより処理され、データは主メモリーに記憶される。標準的な核種の発光プロファイルに関するデータも主メモリーまたはROMに記憶されても良い。プロセッサはポリメラーゼ反応中の核種からの発光プロファイルを比較して、新規合成鎖に取り込まれたヌクレオチド前駆体の種類を同定できる。プロセッサは検出システムからのデータを分析して、テンプレート核酸の配列を決定できる。
【0122】
上に記述したものとは異なる装備の情報処理および制御システムも特定の実施に使用できることが理解される。したがって、システムの構成は、異なる態様では異なる可能性がある。また、本明細書に記述されるプロセスはプログラムされたプロセッサの制御下で実行できるが、別の態様ではプロセスは、例えばフィールド・プログラマブル・ゲート・アレイ (FPGA)、TTLロジック、または特定用途向け集積回路 (ASIC)のようなプログラム可能なまたはハードコードされたロジックによって完全にまたは部分的に実施される可能性がある。さらに、本方法はプログラムされた汎用コンピュータコンポーネントおよび/またはカスタムハードウェアコンポーネントの任意の組み合わせで実行しても良い。
【0123】
データ収集操作後に、典型的にはデータはデータ分析操作に報告される。分析操作を容易にするために、検出システムにより得られたデータは典型的にはデジタルコンピュータを用いて分析される。典型的には、コンピュータは検出システムからのデータの受け入れおよび記憶、ならびに収集したデータの分析および報告のために適切にプログラムされている。
【0124】
任意の適当なベースコーリングアルゴリズムが採用できる。例えば、米国仮出願第 61/037,285号を参照されたい。特定の態様では、カスタムデザインされたソフトウェアパッケージを用いて、検出システムから得られたデータを分析できる。別の態様では、データ分析は、情報処理および制御システムならびに公に利用できるソフトウェアパッケージを用いて行われ得る。DNAシーケンシング分析のために利用できるソフトウェアの非限定的例には、PRISM.TM. DNAシーケンシング分析ソフトウェア(Applied Biosystems, Foster City, Calif.)、Sequencher.TM.パッケージ(Gene Codes, Ann Arbor, Mich.)、およびwww.nbif.org/links/1.4.1.phpのNational Biotechnology Information Facilityから利用できる様々なソフトウェアパッケージが含まれる。データ収集では、テンプレートまたは標的分子の全体の配列を決定するために、部分的情報からデータを組み立てて複数のポリメラーゼ分子から配列情報を得ることができる。
【0125】
さらに、特定の場合には、マイクロアレイアッセイと同様に、標準対照とともに反応を実行すると有用な場合がある。参照配列と試験サンプルの間のシグナルの比較を用いて、配列または配列の組成における相違と類似を同定することができる。そのような反応は、DNAポリマーを迅速にスクリーニングして、ポリマー間の相同性の程度の決定、DNAポリマーの多型性の決定、または病原体の同定に使用することができる。
【0126】
いくつかの態様では、方法はさらに、第1の核酸分子のシーケンシングと並行した1つまたは複数の核酸分子、例えば、第2の核酸分子のシーケンシングを含む。別の態様では、ヌクレオチドシーケンシング決定の速度(核酸テンプレートの単一の読み取りに基づく)は、1秒あたり10ヌクレオチドまたはそれ以上、典型的には1秒あたり100ヌクレオチドまたはそれ以上である。
【0127】
典型的には、シーケンシングのエラー率は100,000塩基あたり1またはそれ未満である。いくつかの態様では、ヌクレオチド配列決定のエラー率は10塩基あたり1、20塩基あたり1、100塩基あたり3、100塩基あたり1、1000塩基あたり1、および10,000塩基あたり1と等しいまたはそれ未満である。別の好ましい態様では、試験DNAは完全かつ無傷の染色体を含む。任意で、本明細書で開示される方法は、第1の核酸分子と並行して別の核酸分子のシーケンシングをするように、多重化様式(アレイ形式を含む)で行っても良い。
【0128】
別の態様では、シーケンシング複合体をDNA鎖に沿った特定のエリアに方向付けするプライマーは、それらの部位における配列を特異的に決定するために使用できる。そのような部位特異的プライマーに基づくシーケンシングを行うために、DNAを変性し、少なくとも1つの部位特異的プライマーにハイブリダイズさせ、適切な成分、例えば、ポリメラーゼ、ヌクレオチド(特に長時間のシグナルを生成する塩基標識したヌクレオチド)および反応緩衝液を添加することにより伸張を開始する。その後、伸張産物をディスプレイおよび可視化する。または、ドナー標識プライマーを用いて、複数の取り込み部位においてより特異的に配列を同定しても良い。さらに別の態様では、いくつかの異なる標識をしたプライマーを用いて、DNA鎖に沿った分解可能部位における「多重化」配列情報を作製することもできる。
【0129】
いくつかの態様では、プライミング部位は検出システムで分解可能でなくてもよい。例えば、特定の配列またはDNA鎖上の単一ヌクレオチド多型の組み合せ(ハプロタイプ)の有無を決定するためのアッセイでは、鎖上に存在するプライマーに取り込まれたヌクレオチドから放出されるシグナルが、他のプライマーに取り込まれたヌクレオチドの蛍光に影響を与えない限り、分解はなくてもよい。現在の検出システムにおいて1つのピクセルにまたがる塩基の数は約700であるので、単一のピクセル内で潜在的なSNPをインテロゲート(interrogate)するために多くのプライマープローブが使用できる。アクセプターのシグナルノイズ比およびFRET距離の制限が、上限を決定する。情報部位は他の情報部位からのデータに干渉するべきではなく(すなわち、プライマーに取り込まれたアクセプター標識FRET対は、>10 nmの間隔で鎖に沿って分布しており、これは〜30bpよりも近くはない)、取り込まれたアクセプターは高いFRETイベントを生成するためにプライマー上のドナーの近くに位置する(すなわち、各プライマーに取り込まれたアクセプター標識ヌクレオチドは、ドナー・アクセプター対のR0またはそれ以内にある)。しかし、取り込まれていないヌクレオチドがDNA不動化の前に取り除かれる場合は、アクセプターのシグナルノイズ比が改善するためにこの距離は増加する可能性がある。いずれにしろ、ドナーおよびアクセプターの蛍光体は、クエンチングが起きるほど近くてはならない。したがって、典型的には、ドナーはプライマーの3’末端から15塩基内に存在する。プライマーはその標的部位に特異的にハイブリダイズするために十分長い(すなわち、65Kbテンプレートではおそらく8塩基プライマーがユニークであり、発生頻度はシーケンシングをするDNAの塩基組成およびタイプ、コード領域か非コード領域か、に関連する;Hardin et al., U.S. Patent No. 6,083,695)。プライマーが長くなるとハイブリダイゼーションの特異性が高まり、特定のゲノムまたはその領域を高度に精製する必要性が低下する。好ましいプライマーの長さは25〜50塩基であり、各プライマーの間には最低1塩基の間隔がある。プライマー/DNAテンプレート上の結合部位内またはそのすぐ5’にあるドナー蛍光体の存在によって有意に影響されないポリメラーゼが使用され、この酵素はさらに5’→3’エキソヌクレアーゼ活性および鎖置き換え活性を欠く。さらに、永続型標識をされたヌクレオチドがアニーリングされた各々の標的特異的プライマーの3’に取り込まれると、テンプレートに指令される伸張産物は、単一塩基から伸張されたアニーリングされたプライマーを含む共有結合で閉じた線状DNA鎖を作製するために、任意で、低濃度(分子内連結イベントを優先するため)で連結されても良い。上記のように、各々のドナー・アクセプターは別個のFRETイベントを生成するために、最適な間隔で配置されている。本方法の別の異型は、合成を完了するために次のアニーリングされたプライマーの5’末端に天然のヌクレオチドを付加した後、任意で連結反応を行うことによって、まずプライマーの3’に永続型標識をしたヌクレオチドを取り込んだ後に、十分に分離したドナー・アクセプター対を生成する。
【0130】
上記のように、本シーケンシング戦略の1つの重要な利点は、鎖の長さに沿って、順序づけられた別個の読み取りが作製できることである。標準的な顕微鏡技術を用いて、既存のリアルタイムシーケンシングシステムを用いて1つの視野中で約100 KbのDNA鎖を見ることができ、さらに調べるDNAの長さを増やすために視野を動かすことができる。本開示のシステムおよび方法を用いる、3〜5 Kbの間隔のニックは、分解可能な複合体を生成し、1つの鎖からの配列読み取りが反対鎖のニックに遭遇し、伸張が終了するというリスクを低下させる。本開示のシステムおよび方法は、約〜1 Kbの長さの読み取りを提供するので、この間隔は1本の鎖からの配列読み取りが反対鎖のニックに遭遇し、伸張が終了するという状況を予防もする。さらに、標準的な検出器で得られたデータの各ピクセルは、約700bpの物理的距離に対応しているので、1000塩基未満の間隔のニックからのシーケンシング反応は、特異的なシーケンシング部位に信頼性を持って関連付けできないアクセプターシグナルを生成する可能性がある。約3〜5 Kbの間隔のニックを作製するためにニッキング処理を最適化すると、この問題が排除でき、さらに配列の元になる鎖に関する追加情報が得られる可能性もある。約700塩基が標準的検出システムの単一ピクセルに広がるため、1000塩基より長い読み取り長は、光子密度の単一ピクセルシフトのおかげで、配列の元になった鎖に関する情報をさらに提供する可能性があり、さらに正しいゲノムの組み立てを促進する可能性がある。
【0131】
別の態様では、可視マーカーの相対距離(DNA鎖の末端からの距離のような)を用いて、どのDNA部位が決定されているかを決定することもできる。ドナーがプライマー上に存在する適用では、不動化したDNAは検出可能なFRETイベントの生成に関与していない色素で染色できる。染色/可視化のためには、不動化DNA鎖に関する情報が必要な時には、DNAが二本鎖か単鎖かという性質も考慮する必要がある。
【0132】
任意で、シーケンシング部位間の距離のさらなる確認として、本開示のシステムおよび方法を、分位値分析と結合した統合蛍光強度測定がDNAの量の正確な測定を提供する、報告された技術と組み合せることができる(Li et al., 2007)。ゲノム全体のショットガンシーケンシング戦略と類似して、ゲノム全体の配列は、本開示にしたがって、同一または重複するDNA断片の多くの個々のコピーのシーケンシングをすることによって、決定できる。
【0133】
本明細書に開示されるリアルタイムのシーケンシング方法およびシステムにはさらにいくつかの利点がある。例えば、挿入色素ドナーおよびアクセプター標識したヌクレオチドを用いる態様のような、特定の態様に関しては、ポリメラーゼを標識する必要がなく、そのため重合のスピードが上昇し、シーケンシングプロセスに伴う取り扱いの手間が減少する。さらに、新しいドナー蛍光体が新生鎖に絶え間なく挿入され、光退色した、またはヌクレオチドの取り込みおよび酵素の転位のために酵素の活性部位に結合したアクセプター標識dNTPから離れ過ぎる可能性のある、より上流のドナーと比較して、高い効率のFRETイベントを生成する距離に効果的に新しいドナーを位置させるので、ドナーのエネルギー転移能力は伸張反応の間を通して継続的に最適化される。同様に、単一のドナー蛍光体を用いる他のシステムで生成するシグナルと比べて、アクセプターシグナルは上昇する。最後に、本開示の方法およびシステムは、ドナー強度の軌道に沿って同一DNA鎖に沿った異なる領域から生じるアクセプターシグナル(配列情報)の追跡ソフトウェアサーチを使用し、それによりDNA鎖に沿って各独立配列の相対位置を正確に配置することが可能になり、単一核酸鎖の長さに沿って複数の別個で順序づけられた配列「読み取り」を同時に生成することになる。
【0134】
さらに、本明細書に開示される方法およびシステムを用いると、シーケンシングプロセスを通して生成する情報のレパートリーが拡大する。例えば、本開示に従った長いDNA鎖のシーケンシングは、ゲノム再配列の同定を促進し、染色体配列の組み立ての正確度を改善する(例えば、独立したHIVゲノムを正しく同定する;配列読み取りを正しい母系/父系の染色体と関連付ける)。
【0135】
本開示にしたがって得られる配列読み取りは、ハプロタイプ情報を提供し、そのために正確なゲノムの組み立てをさらに促進する。ハプロタイプ情報の生成は、これが関連研究および疾患リスクの予測においては、個々のヌクレオチド異型よりも強力であることが示されたので(Stephens, Schneider et al., 2001; HapMap Project)、特に重要である。単一のヒトの最初の二倍体ゲノム配列は、挿入および欠失による遺伝的異型を考慮すると、母系および父系の染色体は99.5%類似していることを示す(Levy, Sutton et al., 2007)。より長い読み取り長と別個の順序づけられた読み取りの組み合せは、母系および父系の染色体配列の正しい組み立てを容易にする。例えば、ゲノム領域の複製を含む再配列は、配列が高度に保存されていると配列情報のみからでは同定が非常に難しい。というのは、独立した配列読み取りが、母系または父系の染色体からの情報を反映しているのか、またはゲノムの異なる領域からかを決定しなくてはならないからである。現在、$1000の何倍もかけると、ゲノムの中断点が同定されれば、非常に正確および深い配列の適用(coverage)によりこのような区別をすることができる。しかし、ドナー置換シーケンシング戦略は、配列情報とマッピング情報を直接に結びつけるので、これらのゲノム異型は「ルーチンの」$1000の全ゲノムシーケンシング中に同定できる。
【0136】
さらに、本明細書に開示される長いDNA鎖のシーケンシングのための方法、組成物、およびシステムは、鎖内のゲノム再配列の同定を促進し、染色体配列の組み立ての正確度を改善し(特に類似性の多い領域において)、およびコピー数の異型の決定を改善する(特により長い繰り返しに関して)。単一のヒトの最初の二倍体ゲノム配列は、挿入および欠失による遺伝的異型を考慮すると、母系および父系の染色体は99.5%類似していることを示す(Levy et al., 2007)。したがって、各染色体に関連する配列情報を注意深く追跡することは非常に重要である。
【実施例】
【0137】
実施例1:FRETドナーとして使用するための挿入色素の評価
アクセプターシグナルのドナーに基づく検出において、ドナーとして使用するために様々な挿入色素が試験された。これらの色素は、伸張反応中に多くのドナーが存在し、交換および/または補給できるため、長いドナーの寿命が得られるという点で有利である。試験された色素は、SYBRグリーンI、YOYO-1、YO-PRO-1、SYBR GOLD、およびYOYO-1を伴うSYBRグリーンIである。代表的なスペクトルは図2に示されている。蛍光強度は、短いプライマー/テンプレート二重鎖、および線状ゲノムDNAと共にYOYO-1またはSYBRグリーンIを用いて、観察された。
【0138】
次に、シグナルノイズ比を評価し、不動化DNAへの結合後の色素のバックグラウンド蛍光のレベルを評価するために、不動化した線状ラムダ(λ)DNAとのインキュベーション後に各色素(YOYO-1およびSYBRグリーンI)からの蛍光の滴定曲線が作製された。典型的な結果は図3AおよびBに示されている。
【0139】
図3Aおよび3Bに示されるデータを生成するために、PEBNまたは+-+-+ 層でガラス基質をコートすることによって、DNA不動化に適した基質が調製された。ここで「+」はポリアリルアミン層、および「-」はポリアクリル酸層の存在を示す。
【0140】
PEBNコートした基質は、Braslavsky et al., 2003, PNAS Vol. 100, No. 7, pp. 3960-3964により開示された手順の改変版を用いて調製された。簡単に述べると、ガラスのカバースリップをアルカリベースのバス中で一晩処理し、蒸留水ですすぎ、その後、音波処理および熱を用いて2% Micro-90で60分間洗浄した後、RCA溶液(H2O: 30% NH4OH: 30% H2O2 (6:4:1))中で60分間(2 x 30分)煮沸した。その後、洗浄したガラスカバースリップを2 mg/ml ポリアリルアミン中に10分間浸し、水で5回すすいだ後、2 mg/mlポリアクリル酸中に10分間浸し、水で5回洗った。ポリアリルアミンおよびポリアクリル酸への液浸はもう一度繰り返された。その後カバースリップを水ですすぎ、10 mM MES緩衝液、pH 5.5中の5 mM EDC-ビオチンアミン溶液で30分間コートした。その後スライドをMES緩衝液で5分間、水で5分間、および10 mM Tris、pH 8.0、10 mM NaClで5分間すすいだ。最後に、スライドを1 mg/ml Neutravidinを含む溶液中で30分間インキュベートすることにより、Neutravidinでコートした。
【0141】
+-+-+層でコートした基質を調製するために、ガラスのカバースリップをアルカリベースのバス中で一晩処理し、その後蒸留水ですすぎ、音波処理および熱を用いて2% Micro-90で60分間洗浄した後、RCA溶液(H2O: 30% NH4OH: 30% H2O2 (6:4:1))中で60分間(2 x 30分)煮沸した。その後、洗浄したガラスカバースリップを2 mg/ml ポリアリルアミン中に10分間浸し、水で5回すすいだ後、2 mg/mlポリアクリル酸中に10分間浸し、水で5回洗った。ポリアリルアミンおよびポリアクリル酸への液浸はもう一度繰り返された。最後に、カバースリップを2 mg/mlのポリアリルアミンに10分間浸した。
【0142】
図3は、DNAのない領域の強度と比較して、染色されたDNAが存在する領域における、SYBRグリーンI(図3A)およびYOYO-1(図3B)から得られる平均蛍光強度を表す。簡単に述べると、DNA結合SYBRグリーンIから得られる平均蛍光強度のレベルが、DNAの非存在下のSYBRグリーンIの平均バックグラウンド蛍光強度のレベルと比較された。1X KB (50 mM Tris pH 7.2; 10 mM MgSO4; 0.1 mM DTT)中の最終濃度10 pMの完全なラムダ(λ)DNAは、上述のコート手順を用いてPEBN層でコートされたカバースリップとガラススライドとの間に形成されるガラスチェンバーへの注入により、まず不動化された。DNAは、濃度を徐々に上げたSYBRグリーンI(50 mM BMEを添加した1X KB緩衝液中0.01X, 0.1X; 0.3X; 0.6X; 1X; 2Xおよび5X SYBRグリーンI)とインキュベートされた。反応チェンバーに一連の濃度のSYBRグリーンIを添加した後、チェンバーおよび内容物を500 uW電力でアルゴン488 nmレーザーで照射し、データは25 msの積分時間でデータが収集された。
【0143】
データ解析は、以下の実施例10に記述されるようにソフトウェアを使用して行われた。簡単に述べると、色素に染色されたDNA鎖を表す領域を同定するために、画像は視覚的に評価された。SYBRグリーンIに結合したDNAからなる関心領域(ROI)およびバックグラウンドを含む画像の領域を手作業で選択し、ROIとバックグラウンド領域の両方からの蛍光強度が比較された。
【0144】
SYBRグリーンIで得られた代表的な結果は図3Aに示されており、各々の所定濃度のSYBRグリーンIでの平均バックグラウンド強度に対する所定の関心領域(ROI)のSYBRグリーンIの平均強度が表されている。図3Aで見られるように、SYBRグリーンIは色素濃度が高くてもDNAの非存在下ではバックグラウンド蛍光は高くなかった。しかし、特に色素濃度が高い場合に、DNAの存在下ではSYBRグリーンIの蛍光が観察された。
【0145】
SYBRグリーンIの代わりに挿入色素YOYO-1を用いて、同一の滴定が実施された(図3B)。代表的な結果は図3Bに示されており、各々の所定濃度のYOYO-1での平均バックグラウンド強度に対する所定の関心領域(ROI)のYOYO-1の平均強度が示されている。図3Bで見られるように、YOYO-1は色素濃度が高くてもDNAの非存在下ではバックグラウンド蛍光は高くなかった。しかし、特に色素濃度が高い場合に、DNAの存在下ではYOYO-1の蛍光が観察された。(YOYO-1の300 pMおよび600 pM濃度で得られたROI値は、これらの濃度で観察された蛍光強度が低過ぎたため含まれていない。)
【0146】
実施例2:標識ヌクレオチドのバックグラウンド結合の見積りによる、様々なコートした表面の特徴づけ
+-+-+およびPEBNでそれぞれコートされたガラス表面は、アクセプター標識ヌクレオチドを非特異的に結合し、有害なバックグラウンドシグナルに寄与し、色素標識したDNAからの蛍光発光の検出に干渉する傾向について試験された。図5はアクセプター標識ヌクレオチドと+-+-+表面(図5A)またはPEBN表面(図5B)のいずれかとの非特異的相互作用に起因するアクセプターバックグラウンドの画像を表す。これらの試験では、ラムダ(λ)DNAは、Xiao et al., Nucl. Acid Res. Vol. 35(3) e16, pp.1-12 (2007)に記述される手順にしたがって、部位特異的ニッキング酵素Nb.BbvClとインキュベーションすることによってまずニッキングされた。簡単に述べると、500 ng/ul (15.62 nM)の濃度を持つ8.5μlのラムダ(λ)DNAは、1X Nb.BbvCl緩衝液を含む最終反応容量50μlまたは100μl中でニッキングされた(最終DNA濃度:1.33 nM)。反応液は37℃で1時間インキュベートされた。その後、ニッキング産物を、最終酵素濃度0.476 nMの、D424Aの変異を含みエキソヌクレアーゼ活性を欠く変異型クレノウポリメラーゼ(以下「クレノウ(エキソ)ポリメラーゼ」と呼ぶ)の存在下で、6.8 nMアクセプター標識ヌクレオチドdU-Al610と37℃で40分間インキュベートした。その後ニッキングおよび標識されたDNAは挿入色素YOYO-1とインキュベートした後、+-+-+(図5A)またはPEBN(図5B)のいずれかで誘導体化した表面から形成されるガラスチェンバーに、10 pM濃度の色素・DNA混合物を注入することにより不動化した。コートした表面のアクセプター強度は、同じ視野で、黄色HeNeレーザー(アクセプター標識ヌクレオチドの可視化のため)またはアルゴン488 nmレーザー(YOYO-1標識DNAの可視化のため)を用いた直接の励起による蛍光顕微鏡を用いて可視化した。図5Aに示されるように、+-+-+表面では、DNAを含まない領域でも、標識ヌクレオチドからの高レベルのバックグラウンド蛍光が観察された。同様に、ポリアクリル酸またはTween-20を含むコーティングを使用しても、表面に対する標識ヌクレオチドの非特異的結合はまったくまたはあまり軽減しなかった(データは示さず)。反対に、図5Bに示されるように、おそらくPEBN表面へのアクセプター標識ヌクレオチドのバックグラウンド結合が低下しているため、PEBN表面の標識ラムダ(λ)DNAの可視化では、アクセプターチャネルのバックグラウンドは低かった。
【0147】
実施例3:アクセプター標識ヌクレオチドと挿入色素ドナーの間のFRETの検出
YOYO-1および/または量子ドットが様々な色素標識ヌクレオチドと効果的なFRET対を形成する能力は、YOYO-1(図4A)または市販の量子ドット(Invitrogen Corp.のQdot525、図4B)のいずれかをFRETドナーとして、アクセプター色素Cy3、ROX、Alexa Fluor 610、およびCy5と組み合わせて、スペクトルを組み立てることによって評価された。組み立てられたスペクトルは図4Aおよび4Bに示されている。ドナーおよびアクセプター化合物を混合し、457 nmレーザーを用いて励起した。これらの条件下では、カバースリップに不動化したプライマー/テンプレート二重鎖上で、Cy3、Alexa Fluor 610、およびCy5により独立して標識された塩基dUTPのリアルタイムの取り込みを検出することが可能だった。より低い波長で効率的に励起される量子ドットのドナーとしての使用を調べる実験も行われた。より低いレーザー線を使用すると、溶液中のアクセプターの濃度を5倍にでき、バックグラウンドは低くなった;濃度を20倍に上げてもまだ、許容可能なノイズレベルだった(データは示さず)。
【0148】
実施例4:挿入色素ドナーとの蛍光の重複に基づくアクセプター標識ヌクレオチドの取り込みの検出
ニッキングしたDNAへのアクセプター標識ヌクレオチドの溶液ベースの取り込みの可視化は以下のように行われた。簡単に述べると、実施例2に記述されるようにしてXiao et alの手順にしたがって、λDNAを部位特異的ニッキング酵素Nb.BbvClと37℃で1時間インキュベートした。その後、ニッキング産物はクレノウ(エキソ)ポリメラーゼの存在下で、6.8 nM dU-Cy5(図6)またはdU-Al610(図7)と37℃で40分間インキュベートした後、1X KB緩衝液中に300 nM YOYO-1および50 mM BMEを含むイメージング混合液を10 pMの標識λDNAに接触させた。混合液全体を、実施例1に記述されるようにしてPEBNコートしたガラス表面によって形成されたガラスチェンバーに注入した。dU-Cy5を用いた研究では、YOYO-1含有領域の可視化はアルゴン488 nmレーザーを用い、アクセプター含有領域の可視化は赤色HeNeレーザーを用いた(図6)。画像はNikon Eclipse TE-2000顕微鏡を用いて100フレーム、25 msの積分時間で収集された;アルゴン488nmの励起および赤色HeNe励起を用いて得られた画像は、図6に示されるように互いに重ね合わせて、取り込まれた蛍光標識を含む領域を可視化した。
【0149】
dU-Al610を用いた研究では(図7)、YOYO-1含有領域の可視化はアルゴン488 nmレーザーを用いて行われ、アクセプター含有領域の可視化には黄色HeNeレーザーが用いられた。画像はNikon Eclipse TE-2000顕微鏡を用いて25フレーム、25 msの積分時間で収集された;アルゴン488 nm励起(YOYO-1染色DNA)および黄色HeNe(dU-Al610)の励起を用いて得られた画像は、互いに重ね合わせ、図7に示されるように、取り込まれた蛍光標識を含む領域を可視化した。
【0150】
図6および7に示されるように、潜在的FRET発光領域は、取り込まれたアクセプター(白矢印で示す)の領域との重複により同定された。例えば、図6の第1パネルは、ドナー蛍光を示す;第2パネルは、アルゴン488 nmレーザーでの励起後にチャネルに「流出」した蛍光のためにアクセプターチャネル中で見られる標識λDNAの蛍光画像を表す。蛍光アクセプターは、白矢印で示されるような蛍光強度の増加した領域として可視化される。第3パネルは、取り込まれたアクセプター標識の位置を可視化するために、赤色HeNe励起を用いて描かれた同じ視野を示す。第4パネルは、第2と第3パネルの重ね合わせによって作製された複合画像を示し、取り込まれたアクセプターの位置が確認される。
【0151】
図8は図6の試験と同一の結果を表すが、ただし取り込まれたアクセプターを含むDNAは可視化の前にPEBNの代わりに+-+-+表面に不動化された。
【0152】
実施例5:表面不動化DNAへのアクセプター標識ヌクレオチドの取り込みの検出
簡単に述べると、λDNAは実施例2に記述されるようにしてニッキングし、その後、実施例1に記述されるようにしてPEBNでコートした表面に不動化した。その後、ニッキングおよび不動化されたDNAに、KB緩衝液中に300〜900 nM YOYO-1、6.8 nM dU-Cy5、およびクレノウ(エキソ)を含む伸張反応混合液を接触させた。20から40分後に、伸張混合液は25 mM Tris pH 7.6および50 mM BMEを含む緩衝液によって置き換えた。(一部の実験では、YOYO-1色素は伸張混合液の代わりにTris-BME緩衝液中に含まれていた。)その後、取り込み産物はアルゴン488 nmレーザー(YOYO-1のため)または赤色HeNeレーザー(dU-Cy5のため)を用いた励起の後に、蛍光顕微鏡を用いて可視化した。アルゴン488 nmおよび赤色HeNe励起を用いて収集した画像を重ね合わせて、取り込まれた蛍光標識の存在を決定した。代表的な結果は図9に示されている。
【0153】
実施例6:挿入色素ドナーとアクセプター標識ヌクレオチドの間のFRET活性の可視化
以下の試験では、単一のFRETドナー(Al488)を含むように操作された単一DNA二重鎖、および複数の挿入色素ドナーを含む天然のDNA二重鎖から得られるFRETシグナルを分析および比較した。操作された二重鎖は、プライマー鎖の-7の位置にAlexa 488 (Al488)部分を含んでいた;操作されたDNA二重鎖上でのFRETドナーとFRETアクセプターの間の距離は、8塩基すなわち27Åだった。
【0154】
伸張反応は蛍光光度計キュベット中で行われ、単一塩基標識アクセプター分子が取り込まれ、ドナーおよび/またはアクセプターシグナルの上昇が、キネティックスキャン(kinetic scan)モードでCary Eclipse蛍光光度計を用いて時間の関数としてモニターされた。反応液は200 nMプライマー/テンプレート二重鎖、2.5 uM塩基標識NTP、および600 nMクレノウ(エキソ)を含んでいた。反応は酵素の添加によって開始された。Al488またはSYBRグリーンIドナー、およびROX、Al594、Al610、またはCy5アクセプターで標識された二重鎖から得られたアクセプターシグナルの強度が、互いに比較された。
【0155】
典型的な結果が図12に示されている。パネル12(A)は、複数の挿入色素SYBRグリーンIドナーを含む天然(操作していない)二重鎖の使用の模式図である。この試験システムでは、FRETは挿入ドナーと取り込まれた塩基標識dNTPの間で起きる。
【0156】
パネル12(B)は蛍光光度計を用いて検出したドナーおよびアクセプター基の両方の蛍光シグナルの時系列のグラフを表す。X軸は時間を秒で表す;Y軸は蛍光強度を任意単位(AU)で表す。
【0157】
パネル12(C)はキュベット中で行われた一連の個々の取り込み実験から得られた正規化FRETデータの棒グラフを表す。ドナー・アクセプター対はX軸に指定されている。左のY軸はE = IA / IA+IDの公式を用いて計算したFRET効率を表し、ここでIAとIDはそれぞれAUで測定されたアクセプターおよびドナー分子の蛍光強度である。右のY軸はFRETによるアクセプターシグナルの正規化した上昇を示す。データは、(酵素注入後のIA)-(酵素注入前のIA)/開始時のドナー強度、の公式を用いて正規化した。このパネルから分かるように、SYBRグリーンIをドナーとして使用したFRET効率および正規化されたアクセプター強度は、Alexa 488ドナーサンプルの対応するFRET効率および正規化アクセプター強度よりも高い。
【0158】
パネル12(D)は、ドナーとしてAl488を使用して得られたアクセプター強度に対して、SYBRグリーンIを用いて得られたアクセプター強度が何倍であるかを表す棒グラフである。
【0159】
図12から分かるように、試験した3つ全てのアクセプターに関して、ドナーとしてSYBRグリーンを使用して得られるアクセプターシグナルは、単一ドナー標識の操作された二重鎖を用いて得られるアクセプターシグナルよりも高い。励起後のアクセプター強度の最大の増加は、アクセプターROXを用いて検出された(3倍の増加)。
【0160】
図13は、単一分子形式で行われた同様な試験を示す。簡単に述べると、操作された二重鎖のビオチン化誘導体(プライマーの-7の位置に単一ドナー基Al488を含む)または天然の二重鎖のビオチン化誘導体(内在性ドナーは含まないが、0.1X濃度のSYBRグリーンIと天然の二重鎖とのコインキュベーションによりSYBRグリーンIドナー分子が挿入されている)のいずれかを含む約50 pMのビオチン化プライマーテンプレート二重鎖は、各二重鎖のテンプレート鎖上のビオチンの接着を介して、PEG表面に不動化された。各々の表面不動化二重鎖は、150 nMクレノウ(エキソ)ポリメラーゼ、0.5 uMの塩基標識dNTP(dUTP-ROXまたはdUTP-Alexa610)、50 mM Tris pH 7.2、2 mM MnSO4、10 mM Na2SO4、2 mM DTT、0.1% Triton X-100、および0.01% Tween-20を含む伸張混合液をチェンバーに注入することにより、インサイチューで伸張反応を行った。反応は10分間行ない、その後に1 M NaClですすぎ、その後サンプルを緩衝液単独、または0.1X SYBRグリーンIを添加した緩衝液ですすいだ。サンプルはアルゴン488 nmレーザーを用いて460 uWで励起し、データは150フレーム、300 msの積分時間で収集された。放出されたシグナルは、Nikon倒立顕微鏡(TE 2000 U)および60x油浸対物レンズを取り付けたRoper ScientificバックイルミネートEMCCDカメラ(カスケード1)によって検出した。放出された光は、2色性(560 nm、650 nm)および帯域通過フィルター(535/50 nm; 620/40 nm)を用いて分離した。
【0161】
FRETANソフトウェアを用いてドナーおよびアクセプターのトレースが得られ、FRET分析が行われた。FRETANソフトウェアは、自動化分析ソフトウェアで、ドナーチャネル中の各スポットを同定し(ノイズ閾値を考慮する)、バックグラウンド蛍光を差し引き、各アクセプター波長において蛍光の経時的な反相関変化を同定して単一対FRETイベントを同定し、FRETに関連する約50の属性を計算する。FRETANソフトウェアに関する詳細は、全体が参照により本明細書に組み入れられる2006年2月6日出願の米国仮出願第60/765,693号、および2007年10月25日公開の米国特許出願公開第2007/0250274 A1号を参照されたい。FRETANソフトウェアを用いて、個々の分子のFRET効率はE = IA / IA+IDの公式を用いて計算され、ここでIAおよび IDはそれぞれアクセプターおよびドナー分子の蛍光強度である。カスタムデザインされたPERLおよびMATLABスクリプトはデータの抽出およびグラフ作成に使用された。
【0162】
結果は図13、パネルA〜Dに示されており、これらはFRETANソフトウェアを用いて作製された単一分子FRET時間トレースを表す。パネル13(A)はAlexa 488 FRETシステムの模式図を示す。パネル13(B)はドナーAlexa 488および取り込まれた塩基標識dUTP-ROXの間のFRETのトレース例を示す。パネル13(C)はSYBRグリーンIドナーのFRETシステムの模式図を示す。パネル13(D)はドナーとしての挿入色素SYBRグリーンIおよび取り込まれた塩基標識dUTP-ROXの間のFRETのトレース例を示す。ドナーとしてSYBRグリーンIを用いて検出されたアクセプターシグナルは、ドナーとしてAlexa 488を用いて検出されたシグナルと比較して、明るい。
【0163】
図14は、ドナーとしてAl488または挿入色素SYBRグリーンを用いたFRET効率およびアクセプター強度を比較する単一分子FRETデータを示す。アクセプターAlexa 610およびアクセプターROXに関するアクセプター強度(Y軸)およびFRET効率(X軸)の散布図は、それぞれパネル(A)および(B)に示されている。薄い灰色の丸はドナーとしてAlexa 488を用いて得られたデータポイントを示し、プロットAおよびBの両方の濃い星印は、ドナーとしてSYBRグリーンを用いて得られたデータポイントを示す。パネル(C)はAlexa 488およびSYBRグリーンIに導かれるFRETの模式図を示す。最後に、パネル(D)は、2つのユーザ定義の閾値、すなわち1500 AUまたは2000 AUを越える、Alexa 488またはSYBRグリーンにより導かれるアクセプター強度の棒グラフを示す。濃いバー(左)は1500 AUを越えるアクセプターシグナル、および薄い灰色のバー(右)は2000 AUを越えるアクセプターシグナルである。
【0164】
図14に示されるように、ドナーとしてAl488が用いられた時にはアクセプター強度のうち非常に小さな割合のみが、ユーザ定義のカットオフ閾値(すなわち1500 AUまたは2000 AU)を越えるが、SYBRグリーンIをドナーとして用いた時のアクセプター強度は、一貫して両方の閾値を超える。
【0165】
アクセプターの5’および3’の両方に挿入色素が存在するとアクセプター強度が上昇するかどうかを調べるために、蛍光キュベット中で溶液ベースの伸張反応が行われ、ドナーおよびアクセプター強度の両方が、時間の関数として30分間追跡された。反応液は、200 nMプライマー/テンプレート二重鎖、2.5 uM dNTP、および600 nMのエキソヌクレアーゼ活性を欠く変異Phi29ポリメラーゼ(以下「Phi29(エキソ)ポリメラーゼ」と呼ぶ)を含んでいた。1つの実験ではテンプレート配列に基づき、天然のG、A、およびC、ならびに塩基標識したU-Al610が添加され、Phi29(エキソ)ポリメラーゼの添加によって反応が開始された。別の実験では、天然のG、A、およびC、ならびに塩基標識したU-Al610が添加され、Phi29(エキソ)ポリメラーゼの添加によって反応が開始され、反応は天然物および塩基標識が取り込まれるのを〜10分間モニターされ、その後、テンプレートの全長に渡り伸張されるように、反応に天然のTがスパイクされた。反応はさらに20分間モニターされた。両方の反応は、1X濃度のSYBRグリーンIの存在下で実行されたことに注目されたい。最初の実験では、SYBRグリーンIは取り込まれたアクセプターの3’にのみ存在している。第2の実験ではSYBRグリーンIは取り込まれたアクセプターの3’および5’の両方に存在している。
【0166】
代表的な結果は図15に示されている。パネル15(A)は30分間にわたるアクセプター強度の時系列を表し、SYBRグリーンは取り込まれたAlexa 610アクセプターの5’のみに存在する。パネル15(B)は30分間にわたるアクセプターの時系列を表し、SYBRグリーンIは取り込まれたAlexa 610アクセプターの5’および3’の両方に存在する。これらの結果から分かるように、アクセプターの3’および5’側の両方にドナーが存在すると、アクセプター強度が増加する。
【0167】
実施例7:ランダムにニッキングされたDNAへのアクセプター標識ヌクレオチドの取り込み
ラムダ(λ)DNAには、DNA骨格にランダムな単鎖ニックを導入する酵素であるDNase Iとのインキュベーションによりランダムにニックが入れられた。ニッキングされたDNAは、0.002ユニット/μl DNase 1および457 nMクレノウ(エキソ)ポリメラーゼの存在下で、1X KB緩衝液中で1.33 nMのDNAを6.8 nM dU-Cy5またはdU-Al594とインキュベートすることにより、溶液中でdU-Cy5またはdU-Al594で標識された。反応は37℃で40分間インキュベートされた後、DNase1停止溶液(Promega)を添加することにより停止した。13 pMの標識DNAが、1X KB、50 mM BME、および300 nM YOYO1を含むイメージング混合液に添加された。標識DNAを含むイメージング混合液は、PEBNコートされたガラスチェンバーの乾燥した表面に添加された。その後、結合したDNAは、50 mM BMEを含む25 mM Tris pH 7.6で洗浄して、過剰のYOYO-1および取り込まれなかったヌクレオチドを除去した。Cy5標識ヌクレオチドを含む反応液では、結合したDNAはさらに、25 mM Tris pH 7.6、50 mM BME、1 mg/mlグルコースオキシダーゼ、0.04 mg/mlカタラーゼ、および0.4%グルコースからなる脱酸素剤含有溶液で洗浄した。FRET活性の領域は、アルゴン488 nmレーザー(YOYO-1標識DNAの検出用)または赤色HeNeレーザー(Cy5検出用)、または黄色HeNeレーザー(Al594検出用)を用いて画像化した。2つのレーザーを用いて収集した画像は、MetaMorphソフトウェアを用いて重ね合わせ、取り込まれたアクセプター標識の存在を確認した。重ね合わせの結果は図16に示されている。
【0168】
実施例8:特定の患者におけるHIV遺伝子型のスクリーニングのための開示された方法の使用
非限定的な例では、HIVゲノム内で診断的SNPが決定される。HIVゲノムの各鎖に沿ってプライマーが作製され(HIV RNAゲノムを直接インテロゲートするか、またはdsDNAに変換して、ssDNAにしてからインテロゲートすることができる)、好ましくは各プライマーの3’端は候補SNPの部位で終了する。いくつかのプライマーはシーケンシング反応の効率および正確さの内部対照となるために、非異型部位で終了しても良い。ハイブリダイゼーションにdsDNAが存在する場合は、プライマー・テンプレートの二重鎖形成を促進するために、テンプレート鎖のアニーリングを優先する徐冷よりも、急冷が好ましい。
【0169】
このようにして個々のHIVゲノムについての情報が決定されたら(好ましくは永続型標識をしたヌクレオチドまたはジデオキシヌクレオチドを用いて)、この情報を用いて医療従事者は、個体内の総HIV配列含有量に関する情報ではなく、個々の患者内のHIVゲノム集団に基づいて、治療法を処方することができる。患者内のHIVの集団を含む、HIVゲノムのディープシーケンシングを行う費用効果の高い方法は現在ないので、これは重要である。この問題は、個体内のHIV配列の多様性、および現在のシーケンシング技術ではHIVゲノム全体を完全にシーケンシングすることはできないという事実の結果である。HIV集団内の高度な変動性のために、単一の患者内のHIV遺伝型の各々に対するコンセンサス配列を正しく製作することは非常に困難である。これは大問題である、というのはHIVゲノム内のSNPの間の関係は、治療転帰を予示するからである。本明細書に記述されるシーケンシング方法を用いると、HIV集団をスクリーニングして、必要に応じて治療方法を処方および改変できる。この方法は、任意の用途、すなわち、癌または遺伝的に影響または決定される任意の疾患に対する素因の予測、のために、任意の核酸のSNPの関係を決定するために使用できる。
【0170】
実施例9:検出された配列異型を特定の遺伝型に対応付けるための本開示方法の使用
一般に、従来のシーケンシング方法が使用される時には、配列の異型がシーケンシングシステムの読み取り長よりも離れている場合には、特定の配列の異型を同じ起源ゲノムに対応付けることは非常に困難である。例えば、患者の組織サンプルから得られたHIVゲノムをシーケンシングする場合、特定の異型をどの変異体に適切に対応付けるべきかを知ることは困難であり、各HIVゲノムに多数の多型性があることにより、さらにこの問題は悪化する。重要な課題は、異型が同じ配列読み取りの内部にない場合に、特定の遺伝型に関して、個々の配列読み取りをコンセンサスゲノムに適切に組み立てることである(すなわち、変異体の他の部分は非常に類似していても、ある読み取りは変異体Aに属するが変異体Bには属さない場合がある)。この状況は、図17に模式的に表わされている。
【0171】
例えば、配列読み取りは、以下の4つの変異体を生成する場合があり、その各々を分析して、HIVゲノムのこの領域のコンセンサス読み取りを決定することができる(適切な整列については図17を参照されたい)。

【0172】
異なる組み合せでヌクレオチド「N」または「NN」を含む配列変異体の生物活性は、非常に異なる可能性がある。例えば、上記のコンセンサス中で「A」を「CC」で置き換えると、特定の薬剤療法に対して耐性の遺伝型となり、「A」を「TT」で置き換えると同じ治療法で効果的に治療ができる場合がある。
【0173】
本開示の方法およびシステムは、これらの異なる短い配列読み取りの間の関係に関する重要な情報、すなわち、同じウイルスゲノムか違うウイルスゲノムに存在するのか、を提供するので、1、2、3、および4をどのように整列させるかという中心的な問題に対処するものである。
【0174】
実施例10:ラムダ(λ)DNAから収集された蛍光データのソフトウェア分析
初期の研究では、アクセプターチャネル内へのドナーの流入が、しばしばアクセプターシグナルの検出をマスクした。したがって、ドナーの流入からアクセプターシグナルを抽出する分析ソフトウェアが開発された。
【0175】
データは以下のように処理された。ラムダ(λ)DNAボリュームの平均画像のユーザ定義の関心領域(ROI)が分断化された。閾値処理および空間連結性情報を用いて、ドナーチャネル中のラムダ(λ)DNAの平均画像中のROIが自動的に分断化された。具体的には、自動閾値処理の後、最大連結成分分析法を用いて、図18、パネル(A)および(B)に示されるようにドナー中でラムダ(λ)DNAを分断化した。ドナーチャネル中のROIの空間的範囲に関する情報を用いて、図18、パネル(C)および(D)に示されるように、アクセプターチャネル中のラムダ(λ)DNAは同様に分断化された。
【0176】
次に、両方のチャネルの分断化されたROIは、図19に示されるように、標準的画像登録技術を用いて登録された。
【0177】
ドナーおよびアクセプターチャネルの登録後、ドナーおよびアクセプターチャネルROIにおけるすべての対応する空間位置においてシグナルが抽出され、両方のチャネルの全ての空間的に対応する点の正規化強度が比較された。特定の点におけるドナー強度とアクセプター強度の関数として1つの基準が定義され、ラムダ(λ)DNAに組込まれた標識としてのその空間座標の適格性が決定された。特に、これらの点においてのみ、ドナーチャネルと比較してアクセプターチャネルでより高い強度が観察された。図20は、アルゴン488 nmまたは赤色HeNe励起によりアクセプターチャネル中で検出された点の共存を示し、自動分析の正確さ、ピクセル登録レベルまで、を確認している。
【0178】
本明細書に引用される全ての参考文献は、その全体が参照により本明細書に組み入れられる。
【0179】
本明細書で開示および主張されるすべての組成物および方法は、本開示を踏まえると過度の実験なしに作製および実施できる。本発明の組成物および方法は、好ましい態様の観点から記述されているが、これらの態様は請求の範囲を制限する意図は全くなく、本発明の概念、精神、および範囲から逸脱することなく、本明細書に記述される組成物および/または方法ならびに方法の段階または段階の順序に対して変化を適用することができることは、当業者に明らかだろう。より具体的には、本明細書に記述される物質を、化学的および物理的の両方で関連した特定の物質で置き換え、同一または類似した結果を得ることができることは明らかだろう。そのような当業者に明らかな類似した置換および改変は、添付の請求の範囲によって定義される本発明の精神、範囲、および概念の中であると考えられる。

【特許請求の範囲】
【請求項1】
a. 核酸分子をディスプレイする段階;
b. 核酸分子を操作して、核酸分子の長さに沿って、ポリメラーゼのアクセス可能な1つまたは複数のプライミング部位を形成する段階であって、1つまたは複数のプライミング部位は、検出システムによって、各プライミング部位で起きるシーケンシング活性の独立した検出および分解が可能なために十分な長さのヌクレオチドによって各々分離されている;
c. 核酸分子の少なくとも一部に、ポリメラーゼ溶液および1つまたは複数の検出可能に標識された成分を、少なくとも1つのプライミング部位から伸張が起きるような条件下で接触させる段階;
d. 少なくとも1つの検出可能に標識された成分により伸張反応中に放出されるシグナルをモニターする段階;ならびに
e. 核酸分子の少なくとも一部の配列を決定するためにリアルタイムまたはほぼリアルタイムでシグナルを分析する段階
を含む、リアルタイムまたはほぼリアルタイムで核酸分子の少なくとも一部のシーケンシングをするための方法。
【請求項2】
検出可能に標識された成分の少なくとも1つがFRETドナー、FRETアクセプター、または両方を含む、請求項1記載の方法。
【請求項3】
検出可能に標識された成分の少なくとも1つがFRETドナーに機能的に連結されたポリメラーゼである、請求項1記載の方法。
【請求項4】
検出可能に標識された成分の少なくとも1つが挿入色素である、請求項1記載の方法。
【請求項5】
少なくとも1つの検出可能に標識された成分がFRETアクセプターに機能的に連結したヌクレオチドである、請求項1記載の方法。
【請求項6】
FRETアクセプターが、ポリメラーゼによって合成されている新生ヌクレオチド鎖にヌクレオチドが取り込まれると遊離される、ヌクレオチドの部分に接着している、請求項1記載の方法。
【請求項7】
単一核酸分子をディスプレイする段階が、ポリヌクレオチド鎖または複数のポリヌクレオチド鎖を伸長した形態で不動化するように調合された層を持つ表面を含む基質に接着することにより、核酸分子を不動化する段階を含む、請求項1記載の方法。
【請求項8】
単一核酸分子をディスプレイする段階が、分子を受け入れかつディスプレイするように適応させたナノ構造に分子を導入する段階を含む、請求項1記載の方法。
【請求項9】
核酸分子を操作して、ポリメラーゼのアクセス可能な複数のプライミング部位を形成する段階が、核酸分子の長さに沿って1つまたは複数のオリゴヌクレオチドプライマーをアニーリングする段階をさらに含む、請求項1記載の方法。
【請求項10】
核酸分子を操作して、ポリメラーゼのアクセス可能な複数のプライミング部位を形成する段階が、核酸分子の長さに沿ってポリメラーゼのアクセス可能な複数のニック部位を形成するように適応させたニッキング試薬に核酸分子を接触させる段階をさらに含む、請求項1記載の方法。
【請求項11】
請求項1記載の方法にしたがう第1のヌクレオチド鎖のシーケンシングと並行して、請求項1記載の方法にしたがって1つまたは複数のさらなるヌクレオチド鎖をシーケンシングする段階をさらに含む、請求項1記載の方法。
【請求項12】
a. 基質に核酸分子を不動化する段階;
b. 不動化された核酸分子にニッキングをして、鎖の長さに沿ってポリメラーゼのアクセス可能な1つまたは複数のニック部位を形成する段階;
c. 不動化された核酸分子の長さに沿ったポリメラーゼのアクセス可能な1つまたは複数のニック部位において伸張反応が開始する条件下で、挿入色素およびポリメラーゼ溶液を添加する段階であって、該ポリメラーゼ溶液はポリメラーゼおよび1つまたは複数の検出可能に標識されたヌクレオチドをさらに含む、段階;
d. ポリメラーゼのアクセス可能な1つまたは複数のニック部位における伸張反応中に放出されるシグナルをモニターする段階;ならびに
e. リアルタイムまたはほぼリアルタイムでシグナルを分析し、核酸分子の少なくとも一部の配列を決定する段階
を含む、リアルタイムまたはほぼリアルタイムで核酸分子の少なくとも一部のシーケンシングをするための方法。
【請求項13】
伸張反応中に放出されるシグナルが、FRETドナーからFRETアクセプターへのフェルスター共鳴エネルギー転移(FRET)に起因するシグナルである、請求項1または12記載の方法。
【請求項14】
伸張反応中に放出されるシグナルが、少なくとも1つの挿入色素分子および少なくとも1つのFRETアクセプターで標識されたヌクレオチドの間の、エネルギー転移に起因するFRETシグナルである、請求項1または12記載の方法。
【請求項15】
a. その上に少なくとも1つのポリヌクレオチド鎖を不動化してニッキングすることのできる基質を含む反応チェンバー;
b. 少なくとも1つのポリヌクレオチド鎖に沿ったニック部位で生じる伸張活性からのシグナルを検出することのできる光学的モニタリングサブシステム;および
c. 伸張活性から検出されるシグナルを配列情報に転換し、その後、核酸の同定と分類のための順序付けられた配列断片情報が得られるような様式で、少なくとも1つのポリヌクレオチド鎖の長さに沿って配列断片をマッピングする分析サブシステム
を含む、請求項1または12記載の方法にしたがう、ヌクレオチド鎖のシーケンシングのためのシステム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4A】
image rotate

【図4B】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate


【公表番号】特表2011−505119(P2011−505119A)
【公表日】平成23年2月24日(2011.2.24)
【国際特許分類】
【出願番号】特願2010−531213(P2010−531213)
【出願日】平成20年10月22日(2008.10.22)
【国際出願番号】PCT/US2008/080843
【国際公開番号】WO2009/055508
【国際公開日】平成21年4月30日(2009.4.30)
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.イーサネット
【出願人】(502221282)ライフ テクノロジーズ コーポレーション (113)
【Fターム(参考)】