Notice: Undefined variable: fterm_desc_sub in /mnt/www/biblio_conv.php on line 353
ポリヌクレオチドシーケンス法
説明

ポリヌクレオチドシーケンス法

【課題】ポリヌクレオチドシーケンスの解読効率と解読精度とを両立することが出来る方法を提供する。
【解決手段】以下の工程を含むポリヌクレオチドシーケンス法;(a)長鎖核酸の断片配列を有する複数分子の鋳型核酸Xから得た複数分子のプライマー結合鋳型核酸にプライマーをハイブリダイズする工程、(b)可逆的ターミネータヌクレオチドN(T)とヌクレオチドNとを含む相補鎖合成基質を用いて複数分子間での異なる位置で合成を停止させ複数種の可逆的ターミネータ含有相補鎖e(T)を得る工程、(c)相補鎖e(T)においてターミネータを開裂させる工程、(d)シグナル物質標識ヌクレオチドアナログN(L)である相補鎖合成基質を用いて上記異なる位置から伸長させることにより複数種の相補鎖(L)を得るとともに複数種の相補鎖(L)を1分子毎にシーケンスし、長鎖核酸の断片配列の部分配列を決定する工程。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、生化学分野において用いられる核酸配列決定に関する。より具体的には、本発明は、ポリヌクレオチドシーケンスに関する。
【背景技術】
【0002】
DNAシーケンス法として、ショットガン法が知られている。ショットガン法においては、超音波処理によって断片化されたDNA断片をサンガー法で解析する。なお、サンガー法における解読長は900塩基、スループットは0.00009Gb/runすなわち0.00072Gb/日である(非特許文献1:www.ddbj.nig.ac.jp/ddbjing/dl/21-5-1.pdf)。
【0003】
その後、技術革新が起こり、DNAシーケンス法においては、並列処理を行うことで高スループットを実現した次世代型のゲノムシーケンサを用いることが一般的となっている。並列処理の方法は、基板上に鋳型DNAを固定化し、ヌクレオチド合成の過程を顕微鏡などで同時に観察することによって実現している。シグナルの取得やヌクレオチド合成方法には様々あり、パイロシーケンス(Roche社)、SBS(sequence by synthesis)(helicos社、Illumina社)、SBH(sequence by hybridyzation)、及びSBL(sequence by oligo ligation and detection)(Applied Biosystems社)がその代表的なものである。
DNAシーケンス法がサンガー法から並列処理が可能な方法に変わっても、DNA断片の前処理には超音波が用いられており、次世代型のゲノムシーケンサではショットガン法と基板上合成による並列処理とが組み合わされていることが一般的である。
【0004】
より具体的には、SBS法(特許文献1:米国特許第4863849号明細書)においては、DNAポリメラーゼを用い、DNAテンプレートに相補的なdNTPアナログが取り込まれる順番を測定することでDNA塩基配列を決定する。このdNTPアナログは蛍光標識されていたものであり、TIRF(全反射蛍光顕微鏡システム)を用いて基板上で検出することができる(特許文献2:国際公開第9013666号パンフレット)。また、SBS法においては、可逆的ターミネータを用いて伸長プロセスを停止する手段が利用されることがある(特許文献3:米国特許第5302509号明細書)。
【0005】
次世代型のポリヌクレオチドシーケンス法においては、精製した長鎖DNAを超音波によって解読しやすい長さに小断片化する。小断片化されたDNAの塩基配列は、SBS法の多重並列処理によって解読されうる(非特許文献2:New High Throughput Technologies for DNA Sequencing and Genomics, Volume 2, p.187-203)。
また、小断片化されたDNAの塩基配列は、次のような手順で解読されうる。基板上に、同じ配列を有する小断片DNAのクラスターを形成し、プライマー、ポリメラーゼ、及び4種のラベルがそれぞれ付された、可逆的ターミネータdNTPを含む核酸合成系によって、一塩基を合成する。蛍光励起によって取り込まれた一塩基を特定し、蛍光ラベルを取りはずした後、さらに次の一塩基を同様に合成及び特定し、蛍光ラベルを取り外す。この工程を繰り返すことによって、小断片DNAの塩基配列を決定する。
【0006】
なお、ポリメラーゼによる合成サイクルを75回繰り返すと、ミスなく解読することが出できる塩基は75%であるというデータが報告されている(非特許文献3:www.illumina.com/downloads/GenomicSeq_DataSheet.pdf)。
SBS法における配列決定された小断片DNAの配列の長さ(すなわち解読長)の具体例は、例えば平均30〜35mer(非特許文献4:www.helicosbio.com/Portals/0/Documents/Helicos_SalesSpec.pdf)、又は35〜150mer(非特許文献5:www.illumina.com/systems/genome_analyzer.ilmn#workflow_specs)である。SBS法のスループットは6.5Gb/日(非特許文献5)である。
SBL法における解読長は75mer、スループットは20〜30Gb/日(非特許文献6:www.appliedbiosystems.com/absite/us/en/home/applications-technologies/solid-next-generation-sequencing/next-generation-systems.html)である。
【0007】
決定された小断片DNAの塩基配列を元に、コンピュータにより、既知のリファレンス(ヒトゲノムなど)に基づいて取得した当該小断片DNAの塩基配列データのマッチングを行い、長鎖DNAの配列を決定する。
【先行技術文献】
【特許文献】
【0008】
【特許文献1】米国特許第4863849号明細書
【特許文献2】国際公開第9013666号パンフレット
【特許文献3】米国特許第5302509号明細書
【非特許文献】
【0009】
【非特許文献1】“第21回DDBJing講習会(2009.6.17-18) Shorts Readsデータ解析例の紹介”、[online]、DDBJ(DNA・データ・バンク・オブ・ジャパン)、[平成22年11月22日検索]、インターネット<URL:http://www.ddbj.nig.ac.jp/ddbjing/dl/21-5-1.pdf>
【非特許文献2】New High Throughput Technologies for DNA Sequencing and Genomics, Volume 2, p.187-203、2007年
【非特許文献3】“HIGH ACCURACY PAIRED-END READS”、[online]、イルミナ・インコーポレイテッド、[平成21年検索]、インターネット<URL:http://www.illumina.com/downloads/GenomicSeq_DataSheet.pdf>
【非特許文献4】“Helicos(R)Genetic Analysis System”、[online]、ヘリコス・バイオサイエンス・コーポレーション、[平成22年7月21日検索]、インターネット<URL:http://www.helicosbio.com/Portals/0/Documents/Helicos_SalesSpec.pdf>
【非特許文献5】“Genome Analyzer IIe”、[online]、イルミナ・インコーポレイテッド、[平成22年7月21日検索]、インターネット<URL:www.illumina.com/systems/genome_analyzer.ilmn#workflow_specs>
【非特許文献6】“5500 Series SOLiDTMSequencers”、[online]、アプライド・バイオシステムズ、[平成22年11月22日検索]、インターネット<URL:http://www.appliedbiosystems.com/absite/us/en/home/applications-technologies/solid-next-generation-sequencing/next-generation-systems.html>
【発明の概要】
【発明が解決しようとする課題】
【0010】
従来の方法においては、下記の問題があるため、未知配列のポリヌクレオチド長塩基配列を高いスループットで解読・再構成することができない。
【0011】
[サンガー法においては1kmer以上の長塩基を直接解読することは難しく、また解読スループットも後述するSBS法に比べ低い]
サンガー法における解読長はゲル電気泳動における分離分解能で制約され、一般的には900mer程度であり、また解読スループットはSBS法と比較して非常に低い(非特許文献1及び非特許文献5)。
【0012】
[SBS法においては長塩基を連続して合成した時のエラー率が高い]
蛍光ラベル化されたdNTPアナログは天然のdNTPに比べてポリメラーゼによって合成伸長されにくく、典型的な例ではエラー率が約1%あることが知られている。(なお、エラーの原因は、テンプレートとのミスマッチ(例えばテンプレートがAの時T以外が取り込まれるとミスマッチになる)と、合成しないとこによる同期遅れとが挙げられる。)具体的には、既に述べたとおり、ポリメラーゼによる合成サイクルを75回繰り返すと、ミス無く解読することが出来る塩基は75%であるというデータが報告されている(非特許文献3)。このことから、伸長すべきDNAの長さが75merを超えると、エラー率がより高いことが予想できる。従って、ポリメラーゼ連鎖反応によってDNAポリメラーゼに取り込まれた蛍光ラベル化dNTPアナログを特定する方法では、その性質上、連続して直接的に数百mer以上の長い塩基配列を特定することが難しいことがわかる。
【0013】
[SBS法においては各断片解読長が短いためコンピュータによる未知配列再構成長に制約がある]
このため、SBS法では1回のシーケンス長さをエラーが少ない範囲(例えば36塩基)に限定し、代わりに多数のポリヌクレオチド断片を並列的に解読しコンピュータ技術で解読した断片間の重複部を一致させるように再構成を行うことで、実効的に長い配列を解読しようとするものである。しかしながら、対象が全く未知の配列を断片化して再構成しようとする場合、未知配列の長さに応じて重複部分の長さが必要になる。このため、各々の解読断片長は、再構成可能な未知配列長さを制約する。SBS法として典型的な例では1回のシーケンス長が30〜35塩基であるが、このような解読断片長で1kmer以上の長い未知塩基配列を決定することは非常に難しい。
【0014】
また、一回のシーケンス長さを短くすると、今度は以下の問題による悪影響も発生する。
【0015】
[DNAの小断片化による末端配列の消失]
超音波や制限酵素で切断されたDNA末端は、平滑化された後、プライマーのライゲーションに供される。平滑化によって数塩基が消失するため、消失した塩基はシーケンスすることが出来ない。従って、断片長が短くなるほど、読み取る塩基長に比べて消失する塩基数の割合が増え無視できなくなるため、より多くの断片を解読する必要が発生する。これによって、断片化がより多く起こるほど、解読する必要がある塩基数の割には、最終的な配列(再構成塩基配列)が十分な長さで得られないということになる。言い換えれば、断片化がより多く起こるほど、解読すべき塩基数に対する再構成塩基配列長の比率は低下する、或いは、断片長が短いほど、解読すべき塩基数に対する再構成塩基配列長は短くなる。
【0016】
そこで本発明の目的は、配列が未知であるポリヌクレオチドのシーケンス法でありながら、従来のSBS法の特徴である、サンガー法に勝る解読のスピードを維持しつつ、サンガー法を超える連続長塩基配列を再構成することが出来る方法を提供することにある。より具体的には、本発明の目的は、一回の(断片の)連続シーケンス長さを、SBS法におけるシーケンス精度を保つことが出来る最低限の長さとしつつも、連続シーケンスした多数の断片から未知配列のポリヌクレオチドを再構成する長さを従来法における場合よりも長くすることができるポリヌクレオチドシーケンス法を提供することにある。
【課題を解決するための手段】
【0017】
本発明者らは、同じ配列を有し且つ複数本のポリヌクレオチド断片を調製し、それぞれにおいてシーケンス開始位置を異ならしめるようにプライマーを予め伸長し、同じ配列の異なる領域を同時にシーケンスすることを可能にすることによって、上記本発明の目的が達成されることを見出し、本発明を完成するに至った。
【0018】
本発明は、以下の発明を含む。
(1)
以下の工程を含む、ポリヌクレオチドシーケンス法;
(a)準備工程であって、
ポリヌクレオチドZの断片配列と同一又は実質的に同一の配列を有する鋳型ポリヌクレオチドXにプライマーp’が結合したプライマー結合鋳型ポリヌクレオチドp’−Xに、プライマーpがハイブリダイズしたハイブリッドを複数個用意する工程と、
(b)チェーンターミネーション工程であって、
可逆的ターミネータヌクレオチドN(T)とヌクレオチドNとを含むチェーンターミネーション用相補鎖合成基質を用いて、前記ハイブリダイズしたプライマーpの3’末端側から前記鋳型ポリヌクレオチドXの相補鎖伸長を行い、前記可逆的ターミネータヌクレオチドN(T)の相補結合により前記複数分子間での異なる位置で合成が停止することによって、長さの異なる複数種の可逆的ターミネータ含有相補鎖e(T)を得る工程、
(c)ターミネーションのリバース工程であって、
前記長さの異なる複数種の可逆的ターミネータ含有相補鎖e(T)においてターミネータを開裂させることによって、長さの異なる複数種の相補鎖eを得る工程、
(d)一分子単位での解読工程であって、
シグナル物質標識ヌクレオチドアナログN(L)である解読用相補鎖合成基質を用いて、前記複数分子間での異なる位置からそれぞれ前記鋳型ポリヌクレオチドXの相補鎖伸長を行い、複数種の相補鎖x(L)を、前記複数種のうちの一つの相補鎖x(L)の3’末端配列と他の一つの相補鎖(L)の5’末端配列とが重複するように得ると共に、
前記シグナル物質標識ヌクレオチドアナログN(L)が結合した順に、前記ヌクレオチドアナログN(L)に由来するシグナルを、一分子の前記鋳型ポリヌクレオチドXの相補鎖ごとに個別に検出することによって、前記複数種の相補鎖x(L)を前記鋳型ポリヌクレオチドXの複数の部分配列として決定する工程。
【0019】
前記工程(a)において、ポリヌクレオチドZの断片配列と実質的に同一の配列には、通常起こりうる複製時のエラーを含む配列を含む。また、前記工程(a)においては、通常、ポリヌクレオチドZの断片配列と同一又は実質的に同一の配列とともに、それらの相補配列も生じる。このため、本発明においては、ポリヌクレオチドZの断片配列と同一又は実質的に同一の配列にはこのような相補配列も含む。従って、相補配列も引き続く工程に供されることができる。
前記工程(a)においては、複数分子の鋳型ポリヌクレオチドXから複数分子のプライマー結合鋳型ポリヌクレオチドp’−Xを用意し、プライマーpをハイブリダイズさせることにより、プライマーpとプライマー結合鋳型ポリヌクレオチドp’−Xとのハイブリッドp’−X/pを複数個(いずれも同一又は実質的に同一の配列を有するもの)得ることができる。
【0020】
前記工程(b)においては、チェーンターミネーション用相補鎖合成基質を含む核酸合成により、複数個のハイブリッドp’−X/pから、長さが異なる複数種の相補鎖e(T)を得ることにより、複数種のハイブリッドp’−X/p−e(T)を得る。より具体的には、工程(b)における核酸合成では、プライマーpの3’末端側から伸長反応が開始し、前記可逆的ターミネータヌクレオチドN(T)が結合することにより伸長反応が停止するまで相補鎖合成が行われる。伸長反応が停止した位置は、ハイブリッドごとに異なりうるため、長さの異なる複数種の相補鎖e(T)が得られる。相補鎖e(T)は、3’末端に可逆的ターミネータヌクレオチドN(T)を有する。
【0021】
前記工程(c)においては、相補鎖e(T)の3’末端塩基においてターミネータが開裂することにより、複数種のハイブリッドp’−X/p−e(T)それぞれからハイブリッドp’−X/p−eを得る。
【0022】
前記工程(d)においては、相補鎖の合成と、合成された相補鎖塩基の解読とが行われる。解読は、相補鎖一分子単位で行われる。
具体的には、解読用相補鎖合成基質を含む核酸合成により、複数種のハイブリッドp’−X/p−eそれぞれにおいて相補鎖x(L)を得ることにより、複数種のハイブリッドp’−X/p−e−x(L)を得る。複数種の相補鎖x(L)は、全て、鋳型ポリヌクレオチドXに由来する配列を有するものであり、それぞれ、鋳型ポリヌクレオチドX上の異なる位置を占める配列の相補配列を有する。相補鎖x(L)の配列は互いに一部重複する。すなわち、複数種の相補鎖x(L)のうちの一つの相補鎖x(L)の3’末端配列と他の一つの相補鎖(L)の5’末端配列とが重複する。ここでいう3’末端配列、5’末端配列は、それぞれ、3’末端塩基を含む配列、5’末端塩基を含む配列という意味であり、その末端配列が相補鎖x(L)においてどのような長さを占めるものであってもよい。複数種の相補鎖x(L)は、同様の長さで得られうる。
また、解読用相補鎖合成基質が結合した順番に、基質に由来するシグナル物質を相補鎖ごとに個別に検出される。これにより相補鎖x(L)一分子ごとに配列が決定される。決定された配列は、すなわち鋳型ポリヌクレオチドXの部分配列に相当する。
【0023】
(2)
前記複数の部分配列から、前記鋳型ポリヌクレオチドXの配列を再構成する工程(e)をさらに含む、(1)に記載のポリヌクレオチドシーケンス方法。
上記(2)に記載の方法においては、相補鎖xの配列データをつなぎ合わせて鋳型ポリヌクレオチドXの配列が決定される。
【0024】
(3)
前記再構成された前記鋳型ポリヌクレオチドXの配列から、前記ポリヌクレオチドZの配列を再構成する工程(f)をさらに含む、(2)に記載のポリヌクレオチドシーケンス法。
上記(3)に記載の方法においては、上記(2)で決定された鋳型ポリヌクレオチドXの配列の配列データをつなぎ合わせてポリヌクレオチドZの配列が決定される。
すなわち、上記(3)の方法においては、解読で得られた比較的短い前記部分配列(相補鎖x)の配列データのアセンブルにより、一旦、中間の長さのコンティグ(鋳型ポリヌクレオチドXの配列)を作成、さらに、鋳型ポリヌクレオチドXの配列データから長鎖のコンティグ(ポリヌクレオチドZの配列)を作成する。
【0025】
(4)
前記チェーンターミネーション用相補鎖合成基質において、前記可逆的ターミネータヌクレオチドN(T)が、前記ヌクレオチドNに対して、0.01〜99%となる量で混合されている、(1)〜(3)のいずれかに記載のポリヌクレオチドシーケンス法。
【0026】
上記(4)に記載の方法がもたらす効果の一つとして、複数種の相補鎖e(T)を好ましい長さの差を有するように得ることができることが挙げられる。
【0027】
(5)
前記鋳型ポリヌクレオチドXの長さが1000mer以上である、(1)〜(4)のいずれかに記載のポリヌクレオチドシーケンス法。
【0028】
上記(5)に記載の方法がもたらす効果の一つとして、断片化によって消失する塩基長の割合を、著しく低減することができることが挙げられる。
【0029】
上記相補鎖x(L)の長さが1mer〜300merである、上記のポリヌクレオチドシーケンス法。
本発明は、従来法に比べて鋳型となるヌクレオチドの鎖長が長い場合であっても、直接シーケンスされる相補鎖の長さを、連続合成時のエラーを可及的に抑えることができる程度に短くすることができる。
【0030】
下記は、核酸を基板上に固定化した状態で核酸合成を行う方法に関する。
(6)
上記工程(d)の前に、前記工程(c)で得られた、前記相補鎖eが前記プライマーpから伸長して生じた伸長プライマーp−eと前記プライマー結合鋳型ポリヌクレオチドp’−Xとのハイブリッドを基板上に配置する工程をさらに含む、(1)〜(5)のいずれかに記載のポリヌクレオチドシーケンス法。
(7)
上記工程(c)の前に、前記工程(b)で得られた、前記可逆的ターミネータ含有相補鎖e(T)が前記プライマーpから伸長して生じた鎖p−e(T)と前記プライマー結合鋳型ポリヌクレオチドp’−Xとのハイブリッドを基板上に配置する工程をさらに含む、(1)〜(5)のいずれかに記載のポリヌクレオチドシーケンス法。
(8)
上記工程(b)の前に、前記工程(a)で得られた、前記プライマーpと前記プライマー結合鋳型ポリヌクレオチドp’−Xとのハイブリッドを基板上に配置する工程をさらに含む、(1)〜(5)のいずれかに記載のポリヌクレオチドシーケンス法。
【0031】
(9)
前記プライマーp鎖が固定化用タグを有するものであり、
前記基板がその表面にリンカーを有するものであり、
前記固定化用タグは、前記リンカーに対する結合能を有するものである、(1)〜(8)のいずれかに記載のポリヌクレオチドシーケンス法。
【0032】
(10)
前記固定化用タグが、シグナル物質で標識されたものである、(9)に記載のポリヌクレオチドシーケンス法。
上記の方法がもたらす効果の一つとして、基板上におけるポリヌクレオチドの固定化位置を確認することができることが挙げられる。
【0033】
(11)
前記可逆的ターミネータヌクレオチドN(T)が、さらにシグナル物質で標識されたものである、(1)〜(10)のいずれかに記載のポリヌクレオチドシーケンス法。
上記の方法がもたらす効果の一つとして、上記(10)の方法での固定化用タグにおけるシグナル物質標識の使用と同様に、固定化位置の確認を行うことができることが挙げられる。従って、シグナル物質で標識された可逆的ターミネータヌクレオチドN(T)の使用は、上記(10)の方法での固定化用タグにおけるシグナル物質標識の使用の代替手段として用いることもできる。
【0034】
(12)
前記プライマーpが、前記プライマーp’の5’末端塩基に対応する相補塩基を欠如したものであり、
前記可逆的ターミネータヌクレオチドN(T)が、前記欠如した相補塩基を有するものである、(1)〜(10)のいずれかに記載のポリヌクレオチドシーケンス法。
上記(12)に記載の方法がもたらす効果の一つとして、シーケンスできない配列をなくすことができることが挙げられる。
【0035】
以下は、鋳型ポリヌクレオチドの調製法を特定したものである。
(13)
前記ポリヌクレオチドZが、1つの細胞から精製されたものである、(1)〜(12)のいずれかに記載のポリヌクレオチドシーケンス法。
(14)
複数分子の前記鋳型ポリヌクレオチドXが、複数の細胞から精製された前記ポリヌクレオチドの断片として調製されたものである、(1)〜(13)のいずれかに記載のポリヌクレオチドシーケンス法。
(15)
複数分子の前記鋳型ポリヌクレオチドXが、前記断片配列をベクターに挿入し、宿主細胞で増殖することによって調製されたものである、(1)〜(14)のいずれか記載のポリヌクレオチドシーケンス法。
(16)
複数分子の前記鋳型ポリヌクレオチドXが、前記ポリヌクレオチドZの断片をPCRによって調製したものである、(1)〜(14)のいずれかに記載のポリヌクレオチドシーケンス法。
(17)
前記ポリヌクレオチドZの断片が、前記ポリヌクレオチドを超音波又は制限酵素で断片化することによって調製されたものである、(1)〜(16)のいずれかに記載のポリヌクレオチドシーケンス法。
【0036】
下記(18)及び(19)は、前記工程(b)の前までに、配列の異なる複数種類の鋳型ポリヌクレオチドXを同一基板上に固定化する場合に、それら配列の異なる複数種類の鋳型ポリヌクレオチドXを識別する工程を特定するものである。
なお、以下において「直接的に又は間接的に」とは、鋳型ポリヌクレオチドXに直接結合して、又は、鋳型ポリヌクレオチドXにライゲート又はハイブリダイズしたオリゴヌクレオチドに直接結合して、という意味である。
【0037】
下記(18)における識別工程においては、配列の異なる複数種類の鋳型ポリヌクレオチドXそれぞれに含まれる塩基配列情報を識別用インデックスとして利用することによって、同一基板上に無作為に決定される位置で(すなわちランダムに)固定化された複数種類の鋳型ポリヌクレオチドXを、それらの固定化位置情報に基づいて識別する。
【0038】
(18)
前記工程(b)の前までに、同一基板上に、複数個の鋳型ポリヌクレオチドXを含むハイブリッドが、前記鋳型ポリヌクレオチドXの配列がそれぞれ異なる複数種類用意され、
前記基板上の前記複数種類の異なるハイブリッドが以下の鋳型ポリヌクレオチドX識別方法により識別されている、(1)〜(17)のいずれかに記載のポリヌクレオチドシーケンス方法;
(I)基板、及び、その表面上に無作為に決定される位置で直接的又は間接的に固定化された複数種類の前記鋳型ポリヌクレオチドXであってシグナルプローブを直接的又は間接的に有するものを用意し、前記シグナルプローブに由来するシグナルを検出し、前記固定化された複数種類の前記鋳型ポリヌクレオチドXそれぞれの前記基板上の固定位置情報を前記シグナルに基づいて取得する工程と、
(II)前記位置情報に基づいて前記複数種類の鋳型ポリヌクレオチドXを互いに識別する工程とを含み、
前記工程(I)が、前記基板上に固定化された前記複数種類の鋳型ポリヌクレオチドXのそれぞれに含まれる塩基配列情報を取得することを含み、
前記工程(II)において、前記塩基配列情報を前記位置情報と関連付けることによって、前記複数種類の鋳型ポリヌクレオチドXを互いに識別する方法。
【0039】
下記(19)における識別工程においては、配列の異なる複数種類の鋳型ポリヌクレオチドXが基板上に固定化された順番を識別用インデックスとして利用することによって、同一基板上に無作為に決定される位置で(すなわちランダムに)固定化された複数種類の鋳型ポリヌクレオチドXを、それらの固定化位置情報に基づいて識別する。
【0040】
(19)
前記工程(b)の前までに、同一基板上に、複数個の鋳型ポリヌクレオチドXを含むハイブリッドが、前記鋳型ポリヌクレオチドXの配列がそれぞれ異なる複数種類用意され、
前記基板上の前記複数種類の異なるハイブリッドが以下の鋳型ポリヌクレオチドX識別方法により識別されている、(1)〜(17)のいずれかに記載のポリヌクレオチドシーケンス方法;
(I)基板、及び、その表面上に無作為に決定される位置で直接的又は間接的に固定化された複数種類の前記鋳型ポリヌクレオチドXであってシグナルプローブを直接的又は間接的に有するものを用意し、前記シグナルプローブに由来するシグナルを検出し、前記固定化された複数種類の前記鋳型ポリヌクレオチドXそれぞれの前記基板上の固定位置情報を前記シグナルに基づいて取得する工程と、
(II)前記位置情報に基づいて前記複数種類の鋳型ポリヌクレオチドXを互いに識別する工程とを含み、
前記工程(I)において、(A)基板、及び、その表面上に無作為に決定される位置で直接的又は間接的に固定化された前記鋳型ポリヌクレオチドXであってシグナルプローブを直接的又は間接的に有するものを用意し、前記鋳型ポリヌクレオチドXの前記シグナルプローブに由来するシグナルを検出し、位置情報を取得する工程と、その後、(B)前記基板表面上に、無作為に決定される位置で直接的又は間接的に固定化された他の鋳型ポリヌクレオチドXであってシグナルプローブを直接的又は間接的に有するものをさらに得て、前記他の鋳型ポリヌクレオチドXの前記シグナルプローブに由来するシグナルを検出し、位置情報を取得する工程とを少なくとも行い、
前記工程(II)において、前記工程(A)及び(B)を含む工程の順番と、それぞれの工程において取得された前記位置情報とを関連付けることによって、前記複数種類の鋳型ポリヌクレオチドXを互いに識別する方法。
【発明の効果】
【0041】
本発明によって、配列が未知であるポリヌクレオチドのシーケンス法でありながら、従来のSBS法の特徴である、サンガー法に勝る解読のスピードを維持しつつ、サンガー法を超える連続長塩基配列を再構成することが出来る方法が可能になる。より具体的には、本発明によって、一回の(断片の)連続シーケンス長さを、SBS法におけるシーケンス精度を保つことが出来る最低限の長さとしつつも、連続シーケンスした多数の断片から未知配列のポリヌクレオチドを再構成する長さを従来法における場合よりも長くすることができるポリヌクレオチドシーケンス法が可能になる。
【0042】
例えば、従来法のように、ポリヌクレオチドの断片化によって得られる鋳型ポリヌクレオチドの長さを、連続合成に適した長さ(例えば75mer)に合わせると、断片化によって失われる塩基(例えば両端5merが失われるとした場合)の割合が5/75=6.7%である。一方、本発明の方法は、鋳型ポリヌクレオチドの一部のみ(例えば連続合成に適した長さの一例である75mer)について連続合成をすればよいため、鋳型ポリヌクレオチドを短くする必要がなくなる。例えば鋳型ポリヌクレオチドを2kmer長程度に設定することも可能であり、この場合、断片化によって失われる塩基の割合は5/2000=0.3%ですむ。
【0043】
また、本発明の方法が、連続合成する長さを75mer程度の短さとすることができるということは、従来法のように2kmerもの長さを連続合成する場合に比べてエラー率を低減させることが可能である。
【0044】
本発明の方法は、例えば5000塩基長の長い断片を用い、その断片内で多数の比較的短い領域を解読することによって、5000塩基長の断片を精度高くシーケンスすることができる。従来法における解読長はサンガー法で900塩基、SBS法で150塩基、SBL法で75塩基であることから、本発明の方法によって、従来のサンガー法と実質的に同程度又はそれ以上の長塩基解読が可能である。
本発明の方法によると、原理的に市販のSBS法と同等のスループット(シーケンス塩基量)が得られるため、サンガー法に比べ圧倒的に優れたスループット性を実現することができる。
本発明の方法によると、実施例で実証されているとおり、従来のSBS法やSBL法に比べ圧倒的に優れたde novo対応力を実現することができる。
【図面の簡単な説明】
【0045】
【図1】本発明の概要を模式的に示したものである。
【図2】ポリヌクレオチドZの断片とプライマーとのライゲート(A)、ポリヌクレオチドZの断片配列を有する鋳型ポリヌクレオチドXとプライマーp’とからなるプライマー結合鋳型ポリヌクレオチドp’−Xとプライマーpとを含むハイブリッドp’−X/pの例(B)(i)〜(iv)をそれぞれ模式的に示したものである。
【図3】図2の(B)(ii)の態様をより具体的に示したものである。
【図4】図2の(iv)のハイブリッドp’−X/pが固定化工程において基盤に固定化される態様、本発明の工程(b)によってハイブリッドp’−X/pにおいて可逆的ターミネータ含有相補鎖e(T)が伸長した態様、本発明の工程(c)によって可逆的ターミネータ含有相補鎖e(T)においてターミネータが開裂した態様、本発明の工程(d)によって解読用相補鎖x(L)が伸長された態様を模式的に示したものである。
【図5】図3の態様における本発明の工程(b)において、同一又は実質同一の配列を有する複数個のハイブリッドp’−X/pから、ハイブリッド間で長さの異なる可逆的ターミネータ含有相補鎖e(T)が伸長し、複数種のハイブリッドp’−X/p−e(T)を生じた態様を模式的に示したものである。
【図6】図5に引き続く態様であって、本発明の工程(c)において、可逆的ターミネータ含有相補鎖e(T)においてターミネータが開裂した態様を模式的に示したものである。
【図7】図6に引き続く態様であって、本発明の工程(d)において、解読用相補鎖x(L)が伸長された態様及び解読用相補鎖x(L)に由来するシグナルを相補鎖x(L)一分子毎に個別に検出したCCD画像、及び、本発明の工程(e)において、解読用相補鎖x(L)の配列(鋳型ポリヌクレオチドXの部分配列)から鋳型ポリヌクレオチドXを再構成する態様を模式的に示したものである。
【図8】図2の(iii)のハイブリッドp’−X/pが、図4と同様に固定化工程において基盤に固定化される態様、及び本発明の工程(b)によってハイブリッドp’−X/pにおいて可逆的ターミネータ含有相補鎖e(T)が伸長した態様を模式的に示したものである。
【図9】基板上に固定化された鋳型ポリヌクレオチドXが、液体流によって引き伸ばされることによって基板上から200nmまでの領域において存在する状態において、核酸合成酵素によって鋳型ポリヌクレオチドXの相補鎖が合成された態様を模式的に示したもの(A)、及び、基板上に固定化された核酸合成酵素を用い、鋳型ポリヌクレオチドXの相補鎖が合成されている態様を模式的に示したもの(B)を示す。
【図10】鋳型ポリヌクレオチドXの識別のために、鋳型ポリヌクレオチドXに含まれる塩基配列情報をインデックスとして使用する場合における、個々のハイブリッドの態様を、インデックス配列取得工程、工程(b)及び工程(d)を抜粋して模式的に示したものである。
【図11】固定化対象が基板上に無作為に決定される位置で固定化され、位置情報が取得された態様の一例を、基板上の一部における固定化された対象の態様を示す拡大図と共に模式的に示したもの(a)、及びさらにその後、当核対象において、インデックス用塩基配列情報を与える配列を合成した態様の一例を模式的に示したものである。
【図12】図11(a)において位置情報が取得された後、さらに別種類の固定化対象を無作為に決定される位置で固定化し位置情報を取得した態様の一例を、基板上の一部における固定化された対象の態様を示す拡大図と共に模式的に示したものである。
【図13】複数の親水性部分が疎水性部分によって隔てられるように設けられた基板(基板表面の一部を拡大)を模式的に示したものである。
【図14】実施例1におけるシミュレーションにおいて想定した態様の概要を示したものである。
【図15】再構成に用いられる断片の長さと、再構成可能なコンティグ長との関係を示したものである。
【図16】断片長に対するコンティグ長の変化を示したものである。
【図17】実施例2におけるシミュレーションにおいて想定した態様の概要を示したものである。
【図18】コンティグ長(ターゲットDNA長)と、そのコンティグ長に到達するための最低限必要とされる断片長との関係を示したものである。
【図19】図18で示された関係から導出された、コンティグ長3Gmerを再構成できる断片長についての外挿結果である。
【発明を実施するための最良の形態】
【0046】
図1に、本発明の概要を模式的に示す。本発明は、ポリヌクレオチドZの断片配列を有する鋳型ポリヌクレオチドXを分断することなく、鋳型ポリヌクレオチドX全体を網羅することができる複数の部分配列を得て(工程a、b、c及びdによる)、部分配列から再構成により、鋳型ポリヌクレオチドXの配列を決定する(工程eによる)方法である。さらに、決定された鋳型ポリヌクレオチドXの配列情報から再構成により、ポリヌクレオチドZの配列を決定する(工程fによる)。
【0047】
[1.準備工程(a)]
準備工程においては、ポリヌクレオチドZの断片配列と同一又は実質的に同一の配列を有する複数分子の鋳型ポリヌクレオチドXそれぞれにプライマーp’が結合した、複数分子のプライマー結合鋳型ポリヌクレオチドp’−Xを用意する。複数分子のp’−Xにプライマーpをハイブリダイズする。
【0048】
[1−1.ポリヌクレオチドZ及び鋳型ポリヌクレオチドX]
鋳型ポリヌクレオチドXは、ポリヌクレオチドZの断片と同一又は実質的に同一の配列を有する配列を有する。より具体的には、複数分子のポリヌクレオチドXには、ポリヌクレオチドZの断片と完全同一の配列を有するポリヌクレオチドを含み、さらに、ポリヌクレオチドZの断片と実質的に同一の配列を有する配列を有するものを含んでも良い。ポリヌクレオチドZの断片配列と実質的に同一の配列には、当業者が同一の配列を有するヌクレオチドを調製する場合に通常生じうるものであって、例えば、複製時のエラーを含む配列を含む。許容するエラー率は特に限定されるものではないが、例えばPCR用のポリメラーゼtaqのエラー率は1/9000すなわち0.011%程度であり、さらに改質されたポリメラーゼPhusionのエラー率はtaqポリメラーゼの1/50すなわち0.00022%程度である。従って、許容するエラー率は、例えば0.01%以下、好ましくは0.00022%以下でありうる。
また、ポリヌクレオチドZの断片と同一又は実質的に同一の配列を得る際、通常、それらの相補配列も生じる。従って、本発明においては、ポリヌクレオチドZの断片配列と同一又は実質的に同一の配列には、それらの相補配列も包含される。
【0049】
[1−2.種類]
鋳型ポリヌクレオチドXの母体であるポリヌクレオチドZは、最終的に配列が決定されうる。従って、ポリヌクレオチドZは、その断片が核酸合成の鋳型となりうるものであれば、特に限定されるものではない。ポリヌクレオチドZ及び鋳型ポリヌクレオチドXとしては、以下のものが挙げられる。
【0050】
構造的観点からは、主として核酸塩基、五炭糖及びリン酸基から構成されるヌクレオチド残基がホスホジエステル結合により連結したポリマーであり、DNA、RNAに限らず、それらポリヌクレオチドのアナログも含まれる。(ポリヌクレオチドアナログは、ポリヌクレオチドにおける原子又は原子団が別の原子又は原子団に置換された構造を持つ、ポリヌクレオチドとは別の物質をいう。以下、アナログについては同様に解釈するものとする。)
【0051】
核酸塩基としては、相補的な核酸塩基又は核酸塩基アナログとワトソンクリック水素結合により塩基対を形成し得る、いかなる窒素含有複素環も許容される。具体的には、プリン、7−デアザプリン、ピリミジン及びそれらの誘導体が挙げられる。代表的な核酸塩基は、天然に存在する核酸塩基であるアデニン(A)、グアニン(G)、シトシン(C)、ウラシル(U)、チミン(T)、およびこれらの核酸塩基のアナログ(例えば、7−デアザアデニン、7−デアザグアニン、イノシン、ネブラリン、ニトロピロール、ニトロインドール、2−アミノ−プリン、2,6−ジアミノ−プリン、ヒポキサンチン、プソイドウリジン、プソイドシチジン、プソイドイソシチジン、5−プロピニル−シチジン、イソシチジン、イソグアニン、7−デアザ−グアニン、2−チオ−ピリミジン、6−チオ−グアニン、4−チオ−チミン、4−チオ−ウラシル、O6−メチル−グアニン、N6−メチル−アデニン、O4−メチル−チミン、5,6−ジヒドロチミン、5,6−ジヒドロウラシル、4−メチル−インドール、及びエテノアデニン)が挙げられる。
【0052】
五炭糖は、置換されていても置換されていなくてもよく、置換された五炭糖は、例えば、3’炭素が−R基、−OR基、−NRR基、及びハロゲン基から選ばれる置換基を有しうる(Rは同じ又は異なっていてよいC1〜C6のアルキル基)。従って、五炭糖は、2’−デオキシリボースやリボースに代表されるが、2’,3’−ジデオキシリボース、3’−ハロリボース、3’−フルオロリボース、3’−クロロリボース、および3’−アルキルリボースなども許容される。
【0053】
ホスホジエステル結合には、置換されていても置換されていなくてもよく、置換されたホスホジエステル結合としては、ホスホロチオエート結合、ホスホロジチオエート結合、アルキルホスホネート結合、ホスホルアニリデート結合及びホスホルアミデート結合などが挙げられる。
【0054】
また、配列由来の観点からは、天然に由来するもの、人為的に変更されたもの又は合成配列、及びそれらの混合が許容される。より具体的には、ヒトを含む様々な生物、及びウイルス及び細菌を含む様々な微生物の染色体、ゲノム、cDNA、それらの断片(但し鋳型ポリヌクレオチドXより大きな単位のもの)などが挙げられる。また、ポリヌクレオチドZは、異なる個体に由来する同じ配列のものであってもよい。
【0055】
[1−3.ポリヌクレオチドZ及び鋳型ポリヌクレオチドXの長さ]
ポリヌクレオチドZの長さは、特に限定されるものではない。例えば、10kmer程度〜3Gmerでありうる。上記範囲の下限値は、例えば16k、10M、30M、100M、300M、500M、又は1Gmerであってもよい。また、上記範囲の上限値は、例えば1G、500M、300M、100M、30M、又は10Mmerであってもよい。
【0056】
鋳型ポリヌクレオチドXは、ポリヌクレオチドZの断片として生じるものであるから、例えば1mer〜5kmerの長さのものでありうる。この中でも、本発明の方法においては、鋳型ポリヌクレオチドXの長さは、ポリヌクレオチドZより短く、後述の相補鎖xより長いことが通常である。
鋳型ポリヌクレオチドXの長さは、シグナル物質標識されたヌクレオチドアナログを基質とした相補鎖の連続合成が可能な長さよりも長いことが通常である。従って、従来のポリヌクレオチドシーケンス法における鋳型に比べて長いことが好ましい。例えば、1kmer以上でありうる。この範囲の上限値は、PCRの増幅サイズの上限で決まるため、特に限定されるものではない。(例えば、BioLabs社から市販されているPCRポリメラーゼTaqの増幅サイズは5kb以下であり、LongAmp Taqの増幅サイズは40kb以下である。)従って、上記範囲の上限値は例えば40kmerである場合もあるが、それを超える場合もある。上記範囲の下限値は、さらに、2k、3k、4k、又は5kmerであってもよい。また、上記範囲の上限値は、さらに、35k、30k、25k、20k、15k、10k、5k、4k、3k、又は2kmerであってもよい。
【0057】
また、後述のように鋳型ポリヌクレオチドXがポリヌクレオチドZから調製される際には断片化工程が行われるが、断片化工程では、平滑化による数塩基の消失を伴う。消失した塩基はシーケンス不可能である。従って、得られる断片(すなわち鋳型ポリヌクレオチドX)の長さが十分な長さを保つように調製されることは、シーケンス不可能な配列を相対的に著しく低減し、ポリヌクレオチドシーケンスの精度向上に貢献する点で好ましい。
【0058】
[1−4.複数分子の鋳型ポリヌクレオチドXの調製法]
鋳型ポリヌクレオチドXは、ポリヌクレオチドZを断片化し、得られた断片のそれぞれと同一又は実質的に同一の配列を有する配列を有するポリヌクレオチドとして調製する。
【0059】
ポリヌクレオチドZは、1つの細胞に由来するものであってもよいし、複数の細胞に由来するものであってもよい。また、ポリヌクレオチドZは、1つの検体に由来するものであってもよいし、複数の検体に由来するものであってもよい。
ポリヌクレオチドZは、細胞から精製されたものでありうる。精製の手法としては特に限定されるものではなく、当業者によって公知の方法が適宜選択される。
【0060】
ポリヌクレオチドZの断片それぞれについて同配列或いは実質的に同配列のものを複数本得るための方法としては、ポリヌクレオチドZの断片のコピーを調製する方法が挙げられる。
ポリヌクレオチドZの断片のコピーを調製する方法としては、例えば、ポリヌクレオチドZの断片配列を鋳型とする核酸増幅法(PCRに代表される方法)が挙げられる。増幅法の具体的なプロトコルも特に限定されるものではなく、当業者によって公知の方法から適宜選択される。また、ポリヌクレオチドZの断片のコピーを調製する他の方法としては、例えば、ポリヌクレオチドの断片配列をベクターに挿入し、宿主細胞で増殖させることによって行う方法が挙げられる。この方法についても、具体的なプロトコルは特に限定されるものではなく、当業者によって公知の方法が適宜選択される。
【0061】
ポリヌクレオチドZの断片それぞれについて同配列或いは実質的に同配列のものを複数本得るための他の方法としては、異なるソースからポリヌクレオチドZを取得し、それぞれ断片化することによって得る方法が挙げられる。異なるソースとしては、異なる細胞が挙げられる。当該異なる細胞は、異なる個体に由来しうる。
【0062】
ポリヌクレオチドZの断片配列を得るために行われる断片化工程は、公知の手法を用いて当業者によって適宜行われる。具体的には、超音波や制限酵素を用いた方法が挙げられる。
【0063】
[1−5.プライマー]
プライマーはオリゴヌクレオチドである。その具体的構成要素としては、上述のポリヌクレオチドZ及び鋳型ポリヌクレオチドXにおけるものと同様である。プライマーは、プライマー結合鋳型ポリヌクレオチドp’−Xの調製に用いられる。さらに、核酸合成反応系において、相補鎖合成の開始点を与える。プライマーは合成したものであっても良く、生物界から単離したものであっても良い。
【0064】
また、プライマーは、後述の項目7で記載するように固定化用タグを有するものであってもよい。さらにその場合、当該固定化用タグが基板上に固定化されていてもよい。
【0065】
[1−6.プライマー結合鋳型ポリヌクレオチドp’−Xとプライマーpとのハイブリッドp’−X/p]
ハイブリッドp’−X/pの調製法は特に限定されず、上述の複数分子の鋳型ポリヌクレオチドXを用いることによって、当業者が適宜決定する事ができるものである。
一例として、まず、複数分子の鋳型ポリヌクレオチドXから、複数分子のプライマー結合鋳型ポリヌクレオチドp’−Xを得て、その後、複数分子のプライマー結合鋳型ポリヌクレオチドp’−Xから、複数個のハイブリッドp’−X/pを得ることができる。
【0066】
プライマー結合鋳型ポリヌクレオチドp’−Xは、例えば、図2(A)に記載のように鋳型ポリヌクレオチドXにプライマーをライゲーションさせ、一本鎖化することによって、プライマー結合鋳型ポリヌクレオチドp’−Xを得ることができる。一本鎖化は、熱処理やアルカリ処理などによる変性を行えばよい。
なお、プライマー結合鋳型ポリヌクレオチドp’−Xにおいて、プライマーp’はXの両端に結合しうる。
【0067】
図2(B)(i)に記載のように、プライマー結合鋳型ポリヌクレオチドp’−Xに、プライマーpをハイブリダイズさせることにより、ハイブリッドp’−X/pを調製することができる。
図2(B)(ii)に記載のように、ハイブリダイズしているプライマーpは、鋳型ポリヌクレオチドXにライゲートしているプライマーp’の5’末端塩基に対応する相補塩基を欠如したものであってよい。図2(B)(ii)の態様をより具体的に図3に示す。図3においては、鋳型ポリヌクレオチドXの5’末端の記載は省略している。図3においては、鋳型ポリヌクレオチドXにライゲートしているプライマーp’の5’末端塩基(すなわちA)に対応する相補塩基(すなわちT)を欠如している。後述するが、このようにプライマーをデザインすると、後述の可逆的ターミネータヌクレオチドN(T)の核酸塩基部分を上記の欠如した相補塩基(図3の場合にあってはT)としてデザインすることによって、鋳型ポリヌクレオチドXの3’末端塩基からシーケンスを行うことが可能になる。
【0068】
図2(B)(iii)及び(iv)は、プライマーpが後述の固定化用タグを有する場合のハイブリッドp’−X/pを示したものである。(iv)に示すハイブリッドp’−X/pは、さらにシグナル物質を有する。これらのような態様とすることによって、基板上への固定化が可能となる(図4及び図8)。
【0069】
[2.チェーンターミネーション工程(b)]
チェーンターミネーション工程は、プライマー結合鋳型ポリヌクレオチドp’−Xとプライマーpとのハイブリッドp’−X/p、及び、可逆的ターミネータヌクレオチドN(T)とヌクレオチドNとを含むチェーンターミネーション用相補鎖合成基質を含む核酸合成系にて行われる。
【0070】
[2−1.チェーンターミネーション用相補鎖合成基質]
チェーンターミネーション用相補鎖合成基質は、可逆的ターミネータヌクレオチドN(T)と、ヌクレオチドNと、の両方を含む。チェーンターミネーション用相補鎖合成基質は、プライマーpの3’末端から伸長する伸長鎖e(T)の構成単位となる。
【0071】
[2−1−1.(リバーシブルターミネート機能を有しない通常の)ヌクレオチドN]
ヌクレオチドNは、主として核酸塩基、五炭糖および1以上(通常1〜3)のリン酸基から構成されるものであれば特に限定されるものではない。核酸塩基及び五単糖としては、上述の項目1−2で述べたポリヌクレオチドの構成要素と同様である。また、リン酸基としては、上述の項目1−2で述べたポリヌクレオチドを構成するホスホジエステル結合を生じさせるものであればよい。具体的には、ヌクレオチドNとして、デオキシリボヌクレオチド、リボヌクレオチド、及びその他ヌクレオチドアナログが挙げられる。ただし、ここでいうヌクレオチドNとしてのヌクレオチドアナログは、リバーシブルターミネート機能を有しないという点で、後述の可逆的ターミネータヌクレオチドN(T)と区別される。
【0072】
ヌクレオチドNは通常、その核酸塩基が異なる複数種のものが混合されて用いられる。しばしば、ヌクレオチドNは、その核酸塩基が、アデニン(A)、シトシン(C)、グアニン(G)、及びチミン(T)又はウラシル(U)であるものが混合されて用いられる。例えば、4種のデオキシリボヌクレオチド三リン酸(dATP、dCTP、dGTP、dTTP)が混合されたものが用いられる場合がある。混合量としては、それぞれのヌクレオチドの量が同程度(モル基準)となるように調整されてもよいし、使用する核酸合成酵素の反応効率に応じて当業者によって適宜調整されてもよい。後者の場合においては、核酸合成酵素に取り込まれる速度が速いヌクレオチドは相対的に少なく、その速度が遅いヌクレオチドは相対的に多くなるように調整することができる。例えば、dATPの反応速度が他のdCTP、dGTP及びdTTPに比べて早い場合は、dATPの濃度をdCTP、dGTP及びdTTPに比べて低くすることができる。
【0073】
[2−1−2.可逆的ターミネータヌクレオチドN(T)
可逆的ターミネータヌクレオチドN(T)は、可逆的ターミネータ部とヌクレオチド部とを含む。
【0074】
[2−1−2−1.可逆的ターミネータ部]
可逆的ターミネータは、ヌクレオチドの伸長において、さらなる伸長が起こらないようにヌクレオチド末端をターミネートする機能とともに、開裂によってヌクレオチドの伸長を再開することを可能とする可逆的機能を有するターミネータをいう。
従って、可逆的ターミネータは、可逆的ターミネート機能を有する構造、すなわち成長中の核酸へさらなるヌクレオチドの取り込みを妨害することが可能な構造を有する。そのような構造としては、例えば、五炭糖の少なくとも3’−水酸基における改変部(すなわち3’−水酸基の置換基)が挙げられる。改変部は、プライマーpと鋳型ポリヌクレオチドXとの相互作用に支障をきたさない条件下で除去することができるものであれば特に限定されるものではない。
例えば、3’−水酸基の置換基は、還元的切断を受けうるいかなる基でもよく、具体的にはジスルフィド基含有有機基(有機基はアルキル基でありうる)などが挙げられる。また、また例えば、3’−水酸基の置換基は、脱離機構による切断を受けうるいかなる基でもよく、具体的にはアリル基などが挙げられる。
【0075】
[2−1−2−2.ヌクレオチド部のデザイン]
可逆的ターミネータヌクレオチドN(T)のヌクレオチド部は、可逆的ターミネート機能を有する構造を有することを除いて、上述のヌクレオチドNと同様の構造を有してよい。
【0076】
可逆的ターミネータヌクレオチドN(T)の核酸塩基は、アデニン(A)、シトシン(C)、グアニン(G)、チミン(T)及びウラシル(U)のいずれか1とすることができる。また、当該核酸塩基は、アデニン(A)、シトシン(C)、グアニン(G)、チミン(T)及びウラシル(U)から選ばれる2以上、例えば3、4或いは5であることも許容する。
【0077】
可逆的ターミネータヌクレオチドN(T)は、複数個のハイブリッドp’−X/pの少なくともいずれかにおいて、プライマー伸長開始位置(すなわちプライマーpの3’末端の塩基に隣接する塩基の位置)に取り込まれるようにデザインされることができる。
具体的には、当該核酸合成開始位置の塩基が予め判っている場合において、可逆的ターミネータヌクレオチドN(T)の核酸塩基が、プライマーpの3’末端の塩基に相補的結合している塩基の5’末端側に隣接する塩基に相補的であるようにデザインされうる。
【0078】
このようにデザインすることにより、複数個のハイブリッドp’−X/pの少なくともいずれかにおいて、プライマーpに隣接する位置でプライマー伸長を停止させることができる。プライマーからの伸長鎖e(T)の部分は後述工程(d)におけるシーケンスの対象とならない。従って上述のようにデザインすると、プライマーpの3’末端に隣接する塩基(すなわち鎖長1の伸長鎖e(T)を構成する塩基)が既知となる。結果として、後述のシーケンスと合わせて鋳型ポリヌクレオチドXの全ての配列を解読することができる。
【0079】
より好ましい態様としては、図3に示すように、ハイブリッドp’−X/pにおけるプライマーpが、鋳型ポリヌクレオチドXにライゲートしているプライマーp’の5’末端塩基(図3の場合ではA(アデニン))に対応する相補塩基(図3の場合はT(チミン))を欠如したものであり、可逆的ターミネータヌクレオチド(T)の核酸塩基が、上記の欠如した相補塩基(図3の場合はT(チミン))となるようにデザインされる。
【0080】
上記の好ましい態様のようにデザインすることにより、上記プライマーpの3’末端の欠如した位置に可逆的ターミネータヌクレオチド(T)が結合して伸長を停止させることができる。このため、後述工程(d)において最初に結合する解読用相補鎖合成基質が、鋳型ポリヌクレオチドXの3’末端塩基の相補塩基となる。すなわち、後述のシーケンスによって鋳型ポリヌクレオチドXの3’末端塩基からシーケンスを開始することができる。すなわち、シーケンスできない配列がない。結果として、鋳型ポリヌクレオチドXの全ての配列を解読することができる。
【0081】
可逆的ターミネータヌクレオチドN(T)は、さらにシグナル物質で標識されたものであってよい。標識された可逆的ターミネータヌクレオチドは、例えば図2の(B)(iii)のように、ハイブリッドp’−X/pがシグナル物質を有しない場合に有用である。この場合、図8に示すように、ハイブリッドp’−X/pを基板に固定し、チェーンターミネーション工程(b)に供して得られるハイブリッドp’−X/p−e(T)をシグナル標識(図中Lと表記)を有するものとして得ることができる。これにより、ハイブリッドの基板上の固定位置の確認が可能になる。
【0082】
[2−2.可逆的ターミネータ含有相補鎖e(T)伸長反応]
上述のチェーンターミネーション用相補鎖合成基質を用いて、プライマー結合鋳型ポリヌクレオチドp’−Xとプライマーpとを含むハイブリッドp’−X/pとともに核酸合成系が構築される。
【0083】
[2−2−1.核酸合成系]
核酸合成系は、上記成分を含んだ核酸合成反応液を適切な条件下におくことによって構築されるものであり、上記成分以外の成分の使用及び条件などは当業者が適宜決定することができる。
具体的には、核酸合成反応液は、上記成分の他に、pH緩衝液、MgCl、KClなどの塩類及び核酸合成酵素を含む。その他に、界面活性剤やタンパク質などの物質を必要に応じて添加することができる。
【0084】
pH緩衝液としては、例えば、トリス(ヒドロキシメチル)アミノメタンと、塩酸、硝酸、硫酸などの鉱酸とを組み合わせたもの、及び、その他種々のpH緩衝液を用いることができる。pH調製された緩衝液は、PCR反応液の中で10mMから100mMの間の濃度で使用することができる。
【0085】
核酸合成酵素としては、基質であるヌクレオチドN及び可逆的ターミネータヌクレオチドN(T)を、鋳型ポリヌクレオチド依存的に、プライマーへ結合させる能力を有するものであれば特に限定されず、当該分野で用いられうるいかなる核酸重合酵素も含まれる。
核酸重合酵素には、DNAポリメラーゼ類、RNAポリメラーゼ類、逆転写酵素類、リガーゼ類、キナーゼ類、及びそれらの組み換え体などが含まれる。酵素の起源となる種についても特に限定されない。
例えば、DNAポリメラーゼβ、E.coliのDNAポリメラーゼ、E.coliのDNAポリメラーゼのクレノーフラグメント、T4DNAポリメラーゼ、TaqDNAポリメラーゼ、T.litoralisDNAポリメラーゼ、TthDNAポリメラーゼ、PfuDNAポリメラーゼ、Hot Start Taqポリメラーゼ、KODDNAポリメラーゼ、EX TaqDNAポリメラーゼ、逆転写酵素などを用いることができる。
【0086】
さらに上記の他にも、KAPA2GTMFastDNAポリメラーゼ(カパ・バイオシステムズ)、KAPA2GTMRobustDNAポリメラーゼ(カパ・バイオシステムズ)、HybripolDNAポリメラーゼ(バイオライン)、Sequenase Version 2.0 T7DNAポリメラーゼ(GEヘルスケアジャパン)、TherminatorTMDNAポリメラーゼ(ニュー・イングランド・バイオラブズ・インコーポレイティッド)、Therminator TM IIDNAポリメラーゼ(ニュー・イングランド・バイオラブズ・インコーポレイティッド)、Therminator TMIIIDNAポリメラーゼ(ニュー・イングランド・バイオラブズ・インコーポレイティッド)、及びPhusion TM High-Fidelity DNA Polymerase(ニュー・イングランド・バイオラブズ・インコーポレイティッド)なども用いることができる。
【0087】
増幅反応におけるその他の条件としては、核酸合成酵素の活性を保持することができる条件が当業者によって適宜選択される。pH条件としては、例えば25℃におけるpHが5.8〜10.7とすることができる。上記範囲の上限値は、9.5、8.5又は7.0であってもよく、上記範囲の下限値は、7.0、8.5又は9.5であってもよい。この条件は、当業者によって、核酸合成酵素の至適pHに応じて適宜決定される。また、温度条件としては、例えば25〜100℃とすることができる。上記範囲の上限値は、95℃、65℃又は37℃であってもよく、上記範囲の下限値は、37℃、65℃又は95℃であってもよい。この条件は、当業者によって、核酸合成酵素の至適温度に応じて適宜決定される。
【0088】
[2−2−2.可逆的ターミネータ含有相補鎖e(T)
核酸合成系が構築されると、プライマーpの3’末端塩基に隣接する位置(すなわち合成開始位置)から相補鎖伸長が始まる。相補鎖伸長においては、チェーンターミネーション用相補鎖合成基質からランダムに、ヌクレオチドN又は可逆的ターミネータヌクレオチドN(T)が取り込まれる。ヌクレオチドNが連続して取り込まれている間はプライマーpの伸長反応が持続するが、可逆的ターミネータヌクレオチドN(T)が取り込まれると当該伸長反応は停止する。従って、プライマーpの3’末端塩基に隣接する合成開始位置から可逆的ターミネータヌクレオチドN(T)が結合した位置まで相補鎖が伸長される。これにより、可逆的ターミネータヌクレオチドN(T)を3’末端に有する伸長鎖e(T)が生成する(図4工程(b)、図5)。
【0089】
この際、可逆的ターミネータヌクレオチドN(T)がいつ取り込まれるかは可逆的ターミネータヌクレオチドN(T)の混合比に依存する。従って、核酸合成反応中に存在する同配列、複数個のハイブリッドp’−X/pについては、その各々において、相補鎖の伸長は可逆的ターミネータヌクレオチドN(T)の混合比に依存した異なる位置で停止しうる。すなわち、プライマー伸長反応中、可逆的ターミネータヌクレオチドN(T)の混合比が一定であれば、相補鎖e(T)の終点(すなわち3’末端残基の位置)は確率的な分布をとりうる。
その結果、同一又は実質同一の配列を有する複数個のハイブリッドp’−X/pから、異なる長さの相補鎖e(T)が生成する。結果として、複数種のハイブリッドp’−X/p−e(T)を得る(図5)。
【0090】
[2−3.チェーンターミネーション用相補鎖合成基質における混合比]
可逆的ターミネータヌクレオチドN(T)とヌクレオチドNとの混合比は特に限定されず、当業者が適宜決定することができる。混合比は、プライマー伸長反応によって得られる長さの異なる複数種の相補鎖e(T)を、どの程度の長さの差をもって生じさせるかということを考慮して決定することができる。一般的に、可逆的ターミネータヌクレオチドN(T)の量をより少なくなるように調整すると相補鎖e(T)の長さの差をより大きく設定することができ、可逆的ターミネータヌクレオチドN(T)の量をより多くなるように調整すると上記長さの差をより小さく設定することができる。
上記に加え、使用する核酸合成酵素の反応効率も考慮して決定することができる。この場合においては、核酸合成酵素に取り込まれる速度が速い可逆的ターミネータヌクレオチドN(T)は相対的に少なく、その速度が遅い可逆的ターミネータヌクレオチドN(T)は相対的に多くなるように調整することができる。
【0091】
例えば、可逆的ターミネータヌクレオチドN(T)を、ヌクレオチドNの0.01〜99%(モル基準)となるように当該混合比を決定することができる。当該範囲を上回ると、鋳型ポリヌクレオチドXの配列決定の正確さは担保できるものの、例えば鋳型ポリヌクレオチドXの長さに対し後述工程(e)で再構成される部分配列(後述の相補鎖x(L)の配列)の数が不所望に多くなる場合があり、このために当該再構成の効率が下がる傾向にある。また、当該範囲を下回ると、例えば後述工程(d)で設定される1回の連続シーケンス長さ(後述の相補鎖x(L)の長さ)を不所望に長く設定する必要性が生じる場合があり、その結果、配列決定におけるエラー率が上がる傾向にある。
【0092】
[2−4.ハイブリッド間での可逆的ターミネータ含有相補鎖e(T)の長さの差]
上述のとおり、ハイブリッド間での相補鎖e(T)の長さの差がどの程度であれば適切かは、想定される後述の相補鎖x(L)の長さ及び数を考慮して判断することができる。
工程(d)における1回の連続シーケンス長さ(相補鎖x(L)の長さ)はある程度限定されることが通常である(後述項目4−2−2.相補鎖x(L))。従って、通常、ハイブリッド間での相補鎖e(T)の長さの差は、工程(d)における1回の連続シーケンス長さより短い。どの程度短ければ適切かは、後述工程(e)(図7)において部分配列(相補鎖x(L)の配列)から鋳型ポリヌクレオチドXの配列を再構成する場合に必要となる、部分配列同士(相補鎖x(L)の配列)の配列重複部分の長さによって判断される。後述(項目4−2−2.相補鎖x(L))の通り、相補鎖x(L)の長さは例えば1〜300mer、配列重複部分の長さは例えば1〜299merであるから、相補鎖e(T)の長さの差は例えば1〜299merでありうる。
【0093】
[3.ターミネーションのリバース工程(c)]
ハイブリッドp’−X/p−e(T)において、伸長鎖e(T)の3’末端の塩基は前記可逆的ターミネータヌクレオチドN(T)に由来する。可逆的ターミネータヌクレオチドN(T)において、ターミネータが開裂する。そのための具体的な方法は、プライマーpと鋳型ポリヌクレオチドXとの相互作用に支障をきたさない条件下で除去することができれば特に限定されるものではなく、可逆的ターミネータの種類に応じて、当業者が適宜決定することができる。
【0094】
ターミネータの開裂は、例えば、可逆的ターミネータヌクレオチドN(T)における3’−水酸基の置換基がジスルフィド基含有有機基(有機基はアルキル基などの炭化水素基でありうる)などである場合は、還元条件下での切断によって行うことができる。より具体的には、パラジウム系触媒を用いる接触水素化によって行うことができる。
また例えば、可逆的ターミネータヌクレオチドN(T)における3’−水酸基の置換基がアリル基などである場合は、脱離反応によって行うことができる。より具体的には、パラジウム触媒による還元的脱離反応によって行うことができる。
【0095】
ターミネータの開裂によって、ハイブリッドp’−X/p−e(T)からハイブリッドp’−X/p−eを得ることができる(図4工程(c)、図6)。より具体的には、複数種のハイブリッドp’−X/p−eが、伸長鎖eの長さを異にして得られる(図6)。
【0096】
ターミネータの開裂によって、伸長プライマーp−eの3’末端に隣接する合成開始位置から再び核酸合成を行うことが可能になる。
【0097】
[4.鋳型ポリヌクレオチドXの部分配列を一分子単位でシーケンスする工程(d)]
本工程においては、合成開始位置の異なる複数種のハイブリッドp’−X/p−eを核酸合成系に供することによって、鋳型ポリヌクレオチドXの相補鎖x(L)を複数種得る。相補鎖x(L)は鋳型ポリヌクレオチドXの部分配列を有するものであるため、シーケンスの対象となる。相補鎖x(L)の合成とシーケンスとを同時に行ってもよいし、相補鎖x(L)を合成した後、合成された相補鎖x(L)をシーケンスしてもよい。
【0098】
[4−1.解読用相補鎖合成基質]
解読用相補鎖合成基質は、シグナル物質で標識されたヌクレオチドアナログN(L)である。
[4−1−1.ヌクレオチド部]
ヌクレオチド部については、前述の2−1−1におけるヌクレオチドNと同様の構造を有することができる。また、ヌクレオチドアナログN(L)は、ヌクレオチド部の核酸塩基が異なる複数種のものが混合されて用いられる。しばしば、ヌクレオチドN(L)は、その核酸塩基が、アデニン(A)、シトシン(C)、グアニン(G)、及びチミン(T)又はウラシル(U)であるものが混合されて用いられる。例えば、4種のデオキシリボヌクレオチド三リン酸(dATP、dCTP、dGTP、dTTP)のシグナル標識体が混合されたものが用いられる場合がある。混合量としては、それぞれのヌクレオチドの量が同程度(モル基準)となるように調整されてもよいし、使用する核酸合成酵素の反応効率に応じて当業者によって適宜調整されてもよい。後者の場合においては、核酸合成酵素に取り込まれる速度が速いヌクレオチドアナログは相対的に少なく、その速度が遅いヌクレオチドアナログは相対的に多くなるように調整することができる。例えば、標識dATPの反応速度が他の標識dCTP、標識dGTP及び標識dTTPに比べて早い場合は、標識dATPの濃度を標識dCTP、標識dGTP及び標識dTTPに比べて低くすることができる。
【0099】
[4−1−2.シグナル物質による標識部]
シグナル物質による標識部については、例えば以下のシグナル物質(蛍光物質)に由来する基が挙げられる。Dimethylcoumarine、BODIPY FL、BODIPY TMR、BODIPY630/650・Naptofluorescein、Fluorescein、Fluorescein Chlorotriazinyl、OregonGreen488、Rohdamine Green、Alexa Fluor488、Alexa Fluor532、Alexa Fluor546、Alexa Fluor594、Cy3、Cy5、Cy5.5、Cy3.5、Lissamine Rohdamine B、Tetramethylrohdamine、Texas Redなど。
【0100】
また、核酸合成酵素として例えばDNAポリメラーゼβを用いる場合に、陰イオン性の蛍光基が好ましく用いられる場合がある。これは、陰イオン性の蛍光基をシグナル標識として有するヌクレオチドアナログN(L)とDNAポリメラーゼβとの相性を有効に利用することができる場合があるためである。上述の蛍光基のうち、陰イオン性の蛍光標識としては、フルオレセイン、Oregon Green 488、ナフトフルオレセイン、Cy3.5・5・5.5などが挙げられる。
【0101】
標識部に由来するシグナルによってヌクレオチド部の違いを識別することができるように、標識部は、ヌクレオチド部の種類に応じてそれぞれ異なるシグナルを発するように選択されうる。例えばシグナル物質が蛍光物質である場合、蛍光物質は、ヌクレオチド部の種類に応じてそれぞれ異なる波長の蛍光を発するように選択されうる。このことによって、発せられたシグナルに基づいてシーケンスを行うことができる。
【0102】
[4−2.相補鎖x(L)伸長反応]
上述の解読用相補鎖合成基質を用いて、プライマー結合鋳型ポリヌクレオチドp’−Xと伸長プライマーp−eとを含むハイブリッドp’−X/p−eとともに核酸合成系が構築される。
【0103】
[4−2−1.核酸合成系]
核酸合成系は、上記成分を含んだ核酸合成反応液を適切な条件下におくことによって構築されるものであり、上記成分以外の成分の使用及び条件などは当業者が適宜決定することができる。具体的には、上記工程(b)のチェーンターミネーション反応において記載したとおりである。
【0104】
なお、核酸合成酵素については、上記工程(b)で挙げた核酸合成酵素と同じものを用いてもよいし、異なるものを用いてもよい。本工程における核酸合成酵素は、解読用相補鎖合成基質であるシグナル物質標識ヌクレオチドアナログN(L)の取り込み活性が高い核酸合成酵素などを当業者が適宜選択することができる。例えば蛍光標識デオキシリボヌクレオチドの取り込み活性が高い核酸合成酵素として、上記工程(b)で挙げた核酸合成酵素のうち、DNAポリメラーゼβを選択することが好ましい場合がある。
【0105】
核酸合成酵素は基板に固定化されることがあるため(図9(B)、後述項目7)、固定化用タグを有する場合がある。この場合において、固定化用タグを有する核酸合成酵素は、固定化用タグを有する融合タンパク質として発現させることによって調製することができる。このような融合タンパク質の調製方法は、当業者が適宜選択することができるものである。核酸合成酵素を基板に固定化して核酸合成を行う方法は、核酸合成が固定化されることを除いては通常の核酸合成方法と同様に行うことができ、より具体的な方法は当業者が適宜決定する事ができるものである。例えば、米国特許明細書第6210896号などを参照することができる。
【0106】
[4−2−2.相補鎖x(L)
核酸合成系の構築により、合成開始位置の異なるハイブリッドp’−X/p−eそれぞれにおいて鋳型ポリヌクレオチドXの相補鎖x(L)の合成が行われる(図4工程(d))。相補鎖伸長は、複数種のハイブリッドp’−X/p−eにおける伸長鎖eの3’末端塩基に隣接する位置からそれぞれ始まり、一定の位置まで続けられる(図7)。このことによって、伸長鎖eがさらに伸長され、同様の長さの相補鎖x(L)が得られる。ことにより、複種のハイブリッドp’−X/p−e−x(L)が得られる。複数種のハイブリッドにおいて得られた複数種の相補鎖x(L)は、それぞれ、鋳型ポリヌクレオチドX上の異なる位置を占める配列の相補配列を有する。
【0107】
相補鎖x(L)は、本工程における合成対象であるとともに、直接解読される対象でもある。すなわち、相補x(L)の長さは、1回の連続シーケンス長さ(リード長)に相当する。相補鎖x(L)は、本発明のポリヌクレオチドシーケンスにおいて直接解読される最小単位である。解読された相補鎖x(L)の配列は、鋳型ポリヌクレオチドX配列解読のための部分配列に相当する(図7)。
相補鎖x(L)は、鋳型ポリヌクレオチドXの一部を占める長さを有する。相補鎖x(L)は1回の連続合成によって得られる相補鎖であるため、その長さはある程度の限界があることが通常である。また、配列決定におけるエラー率の観点からみても、相補鎖x(L)の長さにある程度の限度を設けておくことが好ましい。本発明は従来法によるポリヌクレオチドシーケンス法に比べて長い鋳型ポリヌクレオチドXのシーケンスが可能であるが、それにも関わらず、連続合成する鋳型相補鎖の長さ(すなわち1回の連続シーケンス長さ、リード長)は、従来法に比べて特に長くする必要はない。従って、本工程の相補鎖x(L)の長さは、当業者が適宜決定することができる
。例えば、相補鎖x(L)の具体的な長さは、1〜300merでありうる。上記長さの範囲の下限値は、例えば、3、4、10、11、15、16、18、20、30、35、75、100、又は200merであってもよい。また、上記長さの上限値は、例えば、200、100、75、35、30、20、18、16、15、11、10、4、又は3merであってもよい。
【0108】
得られた相補鎖x(L)は、それぞれ末端部分において、他の相補鎖x(L)と配列が重複するように得る(図7)。すなわち、複数種の相補鎖x(L)においては、それらのうちの一つの相補鎖x(L)の3’末端配列(3’末端塩基を含む配列)と他の一つの相補鎖(L)の5’末端配列(5’末端塩基を含む配列)とが重複する。配列重複部分の長さは、鋳型ポリヌクレオチドX配列の再構成の正確性の観点からは、一般的により長い方が好ましく、鋳型ポリヌクレオチドXの配列の再構成の効率の観点からは、一般的により短い方が好ましい。これらの観点などを考慮し、配列重複部分の長さは、例えば1〜299merでありうる。また、上記長さの下限値は、例えば、3、4、10、11、15、16、18、20、30、35、75、100、又は200merであってもよい。また、上記長さの上限値は、例えば、199、99、74、34、29、19、17、15、14、10、9、3、又は2であってもよい。
【0109】
[4−3.シーケンス]
相補鎖x(L)はシーケンスによりその配列(すなわち鋳型ポリヌクレオチドXの部分配列)が解読される。このことによって、複数の相補鎖x(L)から鋳型ポリヌクレオチドXの再構成に必要な複数の異なる部分配列を得ることができる。
前述のように、シグナル物質は、デオキシリボヌクレオチドのヌクレオチド部の違いを識別できるように、ヌクレオチド部の種類に応じてそれぞれ異なるシグナルを発するように選択されうる。従って、上述の相補鎖伸長において、シグナル物質標識ヌクレオチドN(L)が結合した順に当該シグナル物質に由来するシグナルを検出することによってシーケンスが行われうる。なお、シグナル検出は、鋳型ポリヌクレオチドXの相補鎖一分子ごとに別個に検出される(図7、CCD画像)。
【0110】
[4−3−1.シグナル物質検出方法]
シグナル物質の検出の手段としては特に限定されるものではないが、単塩基分解能で検出を行うことができる手段を用いることができる。
単塩基分解能で検出を行うことができる手段の例としては、米国特許第6,818,395号明細書やProceeding of the National Academy of Science of the United States of America,100,3960−3964,(2003)に記載されている方法が挙げられる。この方法を用いる場合、必要な種類(通常4種)のシグナル物質標識ヌクレオチドアナログを用意し、それら必要な種類の溶液を1種類ずつ順に流し、洗浄することを繰り返すことによって、シグナル物質標識ヌクレオチドアナログの種類ごとに塩基取り込みの有無を確認しながら解析していく。
【0111】
単塩基分解能で検出を行うことができる手段の他の例としては、全反射蛍光顕微鏡技術(total internal reflection fluorescence microscopy;TIRFM)を用いる方法が挙げられる。この場合、鋳型ポリヌクレオチドXを含むハイブリッドが基板に固定化される。そして、この基板における、鋳型ポリヌクレオチドXを含むハイブリッドが固定化された表面に、エバネッセント場を発生させる。核酸合成反応によって、蛍光標識ヌクレオチドアナログが核酸合成酵素に取り込まれたときに、取り込まれた蛍光標識ヌクレオチドアナログの蛍光標識がエバネッセント場によって励起される。このように励起された蛍光を検出することができる。
【0112】
蛍光分子を励起するために、全反射照明を行い、基板の表面にエバネッセント場を発生させることができる。エバネッセント光が染み出すエリアは基板の表面から約200nm以内に限定され、それより遠い領域は非照明領域となる。このため、その限定された領域において生じる蛍光現象の観察を、バックグラウンド蛍光の少ない状態で高感度に行うことが可能になる。
【0113】
本発明の鋳型ポリヌクレオチドXを基板に固定化してシーケンスを行う場合、固定化された鋳型ポリヌクレオチドX分子全体をエバネッセント領域内に存在させるため、液体流を利用して鋳型ポリヌクレオチドX分子を引き伸ばすことができる。
一例として、鋳型ポリヌクレオチドX分子が例えば平均1〜50μm/秒の流速を受けるようにすることができる。このことは、平均1〜50μm/秒の流れの中で、ビーズに固定された長鎖DNAが(完全に引き伸ばされた場合の長さの)15〜80%に引き伸ばされることが開示されている文献Perkins T.T., Smith D.E., Larson R.G., Chu S. Stretching of a single tethered polymer in a uniform flow. Science. 1995;268:83-87.の記載から当業者にとって明らかである。
他の一例として、鋳型ポリヌクレオチドX分子が例えば平均1μm/秒〜1mm/秒の流速を受けるようにすることができる。このことは、本発明者らによって、鋳型ポリヌクレオチドX分子が受ける上記の流速範囲を上回る流速、例えば1mm/秒であっても、固定化された鋳型ポリヌクレオチドX分子全体をエバネッセント領域内に存在させることができることが確認されていることによる。
【0114】
なお、図9(A)に模式的に示すように基板表面と略平行に液体流を発生させると、基板表面近傍は流速が極端に遅くなる上に揚力が働く傾向にある。このため、基板表面近傍に存在する固定化された鋳型ポリヌクレオチドX分子が所望の平均流速を有する液体流を受けることができるために、例えば以下の計算結果及び実験結果などに基づいて、当業者が適宜、発生させるべき液体流の大きさを決定する事ができる。例えば、流路幅2mm、流路高50μmの流路に平均流速10mm/秒の液体流を生じさせると、流路の底面を構成する基板表面から200nmの地点における流速は255μm/秒であると計算できる。さらに例えば、流路に平均流速40mm/秒の液体流を生じさせると、流路の底面を構成する基板表面から200nmの地点における流速は1mm/秒程度である。実際に、基板表面に2kmerの1本鎖DNAの一方を固定し、上述の条件で、流路に基板表面と略平行に液体流を生じさせると、図9(A)に模式的に示すようにDNAが固定化された状態を維持したまま基板近傍に引き伸ばされ、他方の末端の塩基がTIRF観察できたことが本発明者らによって確認されている。すなわち、上述の平均流速を生じさせることにより、DNA鎖全体をエバネッセント領域である基板の表面から約200nm以内の領域に存在させることができることが確認されている。
【0115】
[4−3−2.シグナル検出のタイミング]
シグナル検出のタイミングとしては、合成と同時にシグナルを検出する方法(リアルタイム法)と、未反応基質をリンスしシグナルを検出する方法とを問わない。いずれの場合も、シグナル(具体的には発光した蛍光の波長)及び/又はその強度を順に読み取ることによって、相補鎖x(L)のシーケンスを行うことができる。
【0116】
リアルタイム法においては、以下の原理で検出を行うことができる。蛍光標識されたヌクレオチドアナログは、検出用のカメラでは捉えきれない速度でブラウン運動を行っているため、通常は、照明範囲内にある蛍光標識ヌクレオチドアナログは認識することができない。一方、核酸合成酵素に取り込まれると、蛍光標識ヌクレオチドアナログはそのブラウン運動が抑えられるため、検出用カメラで認識することが可能になる。このことによって、取り込まれたヌクレオチドアナログと、取り込まれていないヌクレオチドアナログすなわち溶液中を漂う遊離のヌクレオチドアナログとを区別することができる。
【0117】
さらに、励起された蛍光標識ヌクレオチドアナログは、励起光によって生成した活性酸素の働きにより、次の蛍光標識ヌクレオチドアナログが取り込まれて発光するまでに消光する、もしくは次の蛍光標識ヌクレオチドアナログが取り込まれて発光し消光する以前に前の蛍光標識ヌクレオチドアナログが消光する。このため、読みたい蛍光標識ヌクレオチドアナログのみを検出することができる。
【0118】
未反応基質をリンスしシグナルを検出する方法においては、核酸合成系においてシグナル物質標識ヌクレオチドアナログが核酸合成酵素に取り込まれた後に、取り込まれなかったシグナル物質標識ヌクレオチドアナログを洗い流す。これによって、ノイズ成分を除くことができ、合成されたヌクレオチドアナログに由来するシグナルの検出を容易にすることができる。
【0119】
シグナル検出の後、再び核酸合成系を構築し、同様の操作を繰り返してよい。この場合においては、先の核酸合成により得られた鋳型ポリヌクレオチド相補鎖の3’末端がターミネートされている場合がある。例えば、先の核酸合成系において、反応を停止させることができるヌクレオチドアナログ(具体的には、さらに可逆的ターミネータ機能を有するシグナル物質標識ヌクレオチドアナログ(すなわち、上述の項目2−1−2−2に記載の、標識された可逆的ターミネータヌクレオチドと同じ物質))を解読用相補鎖合成基質に使用した場合が挙げられる。この場合、再び核酸合成系を構築する前に、項目3で記載したようにターミネーションのリバースを行う。
【0120】
[5.鋳型ポリヌクレオチドXの配列の再構成工程(e)]
上記工程(d)で得られた複数の異なる部分配列において、一の部分配列の末端を含む配列は、他の一の部分配列の末端を含む配列と同じである。このように、互いに同じ配列を有する末端配列同士を重ねる合わせることによって部分配列同士をつなぎ合わせ、鋳型ポリヌクレオチドXの配列が再構成される(図1)。
【0121】
[6.ポリヌクレオチドZの配列の再構成工程(f)]
再構成されたそれぞれの鋳型ポリヌクレオチドXの配列同士をつなぎ合わせ、ポリヌクレオチドZの配列が再構成される(図1)。上述の(a)〜(e)の工程により、配列が未知のポリヌクレオチドZのシーケンスが可能となる。
【0122】
[7.固定化]
本発明において、基板に固定化される対象(以下、固定化対象と記載する場合がある)は、ヌクレオチド種(プライマー分子や、鋳型ポリヌクレオチドXを含むハイブリッド)又は核酸合成酵素でありうる。
【0123】
[7−1.固定化工程の順序]
ヌクレオチド種を固定化する場合、固定化は、鋳型ポリヌクレオチドXの部分配列をシーケンスする工程(d)を行う前であれば、いつ行ってもよい。
例えば、固定化は、準備工程(a)の後、チェーンターミネーション工程(b)の前に行うことができる。この場合、準備工程(a)で得られたハイブリッド、すなわちプライマーpとプライマー結合鋳型ポリヌクレオチドp’−Xとのハイブリッドp’−X/pが基板上に配置される。図4に、チェーンターミネーション工程(b)の前に固定化を行う態様の一例を模式的に示す。
【0124】
また、固定化は、チェーンターミネーション工程(b)の後、ターミネーションのリバース工程(c)の前に行うことができる。この場合、チェーンターミネーション工程(b)で得られたハイブリッド、すなわち可逆的ターミネータ含有相補鎖e(T)がプライマーpから伸長したp−e(T)とプライマー結合鋳型ポリヌクレオチドp’−Xとのハイブリッドp’−X/p−e(T)が基板上に配置される。
さらに、固定化は、ターミネーションのリバース工程(c)の後、鋳型ポリヌクレオチドXの部分配列をシーケンスする工程(d)の前に行うことができる。この場合、ターミネーションのリバース工程(c)で得られたハイブリッド、すなわち相補鎖eがプライマーpから伸長した伸長プライマーp−eとプライマー結合鋳型ポリヌクレオチドp’−Xとのハイブリッドp’−X/p−eが基板上に配置される。
上記いずれの場合においても、固定化される対象は、プライマー(遊離のプライマー分子及びハイブリッドを構成しているプライマーの両方を含む)に固定化用タグを有することができ、当該固定化用タグが基板に固定化されることができる。
【0125】
核酸合成酵素を固定化する場合(図9(B))は、鋳型ポリヌクレオチドXの部分配列をシーケンスする工程(d)で用いられる核酸合成酵素が基板に固定化される。従って、工程(d)の前のいずれかの段階で基板上に固定化されることができる。
【0126】
[7−2.基板]
基板としては、特に限定されるものではないが、少なくとも光を透過させる材質から構成されるものが好ましく用いられる。例えば、シリコーン、ガラス、石英ガラス、石英などのケイ素含有基材や、ポリカーボネート、ポリアクリルアミド、ポリスチレン、ポリメタクリル酸メチルなどの樹脂基材など、高い光透過率を有する材質から構成される基板を好適に用いることができる。
また、核酸合成反応液より高い屈折率を有し、且つ、基板と反応液との界面でレーザーを全反射させたときに、反応液側にエバネッセント場を生じることができるような材質から構成される基板であることが好ましい場合がある。
【0127】
[7−3.固定化の態様]
基板への固定化は、基板表面におけるリンカーと固定化される対象が有する固定化用タグとを結合させることができる手段であれば特に限定されることなく、当該リンカーや固定化用タグの特性に基づいて、当業者が適宜選択することができる。
基板表面におけるリンカーと固定化される対象における固定化用タグとの結合の種類については特に限定されず、核酸合成条件下においてリンカーと固定化用タグとが不所望に離れないものであればよい。例えば、水素結合、抗原抗体結合、及びビオチン結合性タンパク質−ビオチン間結合などの特異的結合や、共有結合などの結合が挙げられる。
【0128】
水素結合の例としては、適当な塩基配列を有するヌクレオチド種同士の相補的結合が挙げられる(図4にその態様の一例を示す。リンカーとなるオリゴヌクレオチドは、例えば10〜20mer程度でありうる)が、その他にも、核酸が関与しない水素結合のあらゆるものも含まれる。
【0129】
抗原抗体結合のいくつかの例としては、ジゴキシゲニンとジゴキシゲニン抗体との結合、GST(Glutathione S−transferase)と抗GSTとの結合、6xHis(ヒスチジン)と6xHis抗体もしくはNi−NTA(Nitrilotriacetic acid)との結合などが挙げられるが、その他当業者によって用いられうる抗原抗体間結合のいかなるものも含まれる。ビオチン結合性タンパク質−ビオチン間結合としては、アビジン−ビオチン結合に代表されるもので、それらの一方又は両方が誘導体である場合の結合も含まれる。
【0130】
共有結合としては、反応性官能基間において形成される結合であれば特に限定されるものではない。また、当該結合は、リンカー試薬を介在させることによって形成されるものであってもよい。反応性官能基としては、ごくいくつかの例として、アミノ基、水酸基、カルボキシル基などが挙げられる。また、リンカー試薬としては、ごくいくつかの例として、EDC(1−Ethyl−3−[3−dimethylaminopropyl]carbodiimide Hydrochloride)やNHS(N−hydroxysuccinimide)などが挙げられる。
【0131】
[7−4.固定化用タグ]
固定化用タグは、基板への固定化が行われるまでに固定化される対象に備えられていれば良いため、固定化される対象自身が有する官能基をそのまま固定化タグとして用いる場合を除き、当該固定化用タグを固定化される対象に付す工程は、基板への固定化を行う以前のいずれの段階で行われてもよい。
固定化される対象自身が有する官能基としては、例えばアミノ基、カルボニル基、水酸基、アリール基、炭化水素基、及びリン酸基などが挙げられる。
【0132】
固定化用タグは、基板表面のリンカーに対する結合能を有する構造であれば特に限定されるものではなく、当業者が適宜決定することができる。固定化用タグとリンカーとの結合の種類については、上述のとおりである。従って固定化タグとしては、例えば、適当な塩基配列(例えば10〜20mer)を有するオリゴヌクレオチド、抗原又は抗体、アビジン又はビオチン、及び反応性官能基などを用いることができる。
オリゴヌクレオチドとしては、前述の項目1−2において述べた鋳型ポリヌクレオチドやポリヌクレオチドZの種類と同様のものが適用される。抗原/抗体としては、あらゆるものが許容され当業者が適宜選択することができるが、ごく一例として、ジゴキシゲニン/ジゴキシゲニン抗体が挙げられる。アビジン/ビオチンとしては、それらの誘導体も含む。反応性官能基としては、アミノ基、水酸基、カルボキシル基及びそれらを含む基などが含まれる。
本発明においては、オリゴヌクレオチドであって、基板表面に設けられたリンカーとしての核酸と相補的結合が可能な配列を有するものが固定化用タグとして好ましく用いられる場合がある(図2(B)(iii)及び(iv)、図4、及び図8にその態様の一例を示す)。
【0133】
固定化タグは、さらに、シグナル物質で標識されていてよい(図2(B)(iv)及び図4にその態様の一例を示す)。当該シグナル物質は、固定化タグが基板上に固定化された場合に、基板上における存在位置を把握する目的で用いられうる。
なお、同様の目的を達成するための代替手段として、前述のように、工程(b)における可逆的ターミネータヌクレオチドに、シグナル物質をさらに有するもの(すなわち標識された可逆的ターミネータヌクレオチド)を用いることもできる(図8にその態様の一例を示す)。しかしながら、標識された可逆的ターミネータヌクレオチドを用い且つシグナル物質で標識された固定化タグを有することも許容する。
【0134】
シグナル物質は、当業者に公知の手段によって検出可能なものであれば特に限定されるものではない。好ましくは、蛍光物質が挙げられる。より具体的には、例えば、Dimethylcoumarine、BODIPY FL、BODIPY TMR、BODIPY630/650・Naptofluorescein、Fluorescein、Fluorescein Chlorotriazinyl、OregonGreen488、Rohdamine Green、Alexa Fluor488、Alexa Fluor532、Alexa Fluor546、Alexa Fluor594、Cy3、Cy5、Cy5.5、Cy3.5、Lissamine Rohdamine B、Tetramethylrohdamine、Texas Redなどが挙げられる。
【0135】
シグナル物質は、鋳型ポリヌクレオチドXの由来元に応じて異なるものを付すことができる。これは、鋳型ポリヌクレオチドの由来元を識別する(例えばどの個体のDNAについてシーケンスしているか、などの識別を行う)目的で行われることがある。
【0136】
[7−5.リンカー]
リンカーは、基板がその表面に有するものであって、上記固定化タグに対する結合能を有する構造である。
リンカーは、固定化タグに対する結合能を有する構造であれば特に限定されるものではなく、当業者が適宜決定することができる。固定化用タグとリンカーとの結合の種類については、上述のとおりである。従ってリンカーとしては、例えば、適当な塩基配列を有するオリゴヌクレオチド、抗原又は抗体、アビジン又はビオチン、及び反応性官能基(アミノ基、水酸基、カルボキシル基及びそれらを含む基など)などを用いることができる。本発明においては、オリゴヌクレオチドであって、固定化用タグとしての核酸と相補的結合が可能な配列を有するものが、リンカーとして好ましく用いられる場合がある(図4及び図8にその態様の一例を示す)。
【0137】
リンカーは、基板の材料そのものの一部であってもよいし、基板の表面に設けられたものであってもよい。
基板の材料そのものの一部であるリンカーとしては、基板を構成する高分子が有する反応性官能基であって基板表面に露出しているものや、基板表面にコーティングされた物質が有する反応性官能基であってコート層表面に露出しているものなどが挙げられる。ごくいくつかの例として、シラノール基、水酸基、アミノ基などが挙げられる。
また、基板の表面に設けられたリンカーは、上述の基板の材料そのものの一部である反応性官能基に対して、固定化用タグとの結合能を有する構造を付与することによって設けることができる。
【0138】
[7−6.固定化の密度]
基板上に固定化する密度としては、例えば固定化された核酸に由来するシグナルを検出する検出器によって光学分解可能な密度とすることができる。そのような密度は、ソフトウェアの解析能等によって異なるため特に限定されるものではない。一例として、3pixel x 3pixelの中の1pixelの輝点を認識することができる検出手段を用いる場合、1mm当たり97,500〜4,333,000個の核酸を固定することができる。また、ソフトウェアの解析能その他の要因により、上記範囲の上限が例えば1,560,000個又は390,000個であってもよいし、上記範囲の下限が例えば390,000個又は1,560,000個であってもよい場合がある。
【0139】
[8.同一基板上における種類の異なる鋳型ポリヌクレオチドXの識別法]
本発明においては、同一基板上で、複数種の異なる鋳型ポリヌクレオチドXについて本発明を実施することができる。複数種の異なる鋳型ポリヌクレオチドXは、同じポリヌクレオチドZから断片化により生じたもの(図1)でありうる。
同一基板上で複数種の異なる鋳型ポリヌクレオチドXについて本発明を実施するには、基板上における複数種の異なる鋳型ポリヌクレオチドXが互いに識別可能でなければならない。遅くとも工程(b)の前までにハイブリッドがそれを構成する鋳型ポリヌクレオチドXの種類ごとに識別されている。識別においては、鋳型ポリヌクレオチドXの種類ごとに、基板上の位置情報が明らかであることと、当該位置情報に、鋳型ポリヌクレオチドXを識別することができるインデックスが関連付けられていることとが必要となる。
【0140】
[8−1.鋳型ポリヌクレオチドXの識別態様の例]
鋳型ポリヌクレオチドXの識別態様としては以下が挙げられる。以下のいずれの態様においても、鋳型ポリヌクレオチドXが直接的又は間接的にシグナルプローブを有する。すなわち、シグナルプローブは、鋳型ポリヌクレオチドXに直接的に結合するか、又は、鋳型ポリヌクレオチドXにライゲート又はハイブリダイズしたオリゴヌクレオチドに直接的に(すなわち鋳型ポリヌクレオチドXに間接的に)結合しうる。シグナルプローブは、シグナル物質標識を有する。シグナル物質については、前述のとおりである。シグナルプローブは、例えば既に述べた、図2(B)(iv)に例示されるシグナル物質標識部分又はシグナル物質標識及び固定化用タグからなる部分と同一である場合がある。
【0141】
鋳型ポリヌクレオチドXの識別態様の一例においては、異なる種類の鋳型ポリヌクレオチドXそれぞれに応じて異なるシグナルプローブを付すことができる。位置情報の取得の際には、シグナルプローブをインデックスとして用いることができる。
鋳型ポリヌクレオチドXの識別態様の他の一例においては、鋳型ポリヌクレオチドXの一部の塩基配列情報を解読(但し上記工程(d)で行われる解読とは異なる工程で行われる)により取得することができる。位置情報の取得の際には、この解読された塩基配列情報をインデックスとし用いることができる。この場合における個々のハイブリッドの態様を、インデックス配列取得工程、工程(b)及び工程(d)を抜粋して図10に模式的に示す。
鋳型ポリヌクレオチドXの識別態様のさらなる他の一例においては、固定化及び上記工程(a)〜(d)を含む一連の工程の順番を鋳型ポリヌクレオチドXの種類ごとに行うことができる。位置情報の取得の際には、その順番をインデックスとして用いることができる。
【0142】
[8−2.固定位置の決定]
[8−2−1.固定位置が無作為に決定される場合]
固定位置は、基板上における無作為に決定される位置でありうる(図11及び図12に例示される)。すなわち、固定化対象は基板上の任意の位置にランダムに固定されうる。固定後の対象はインデックスを有するものであり、そのインデックスに基づいて位置情報が記録される。
【0143】
[8−2−1−1.固定位置の態様]
この場合、固定化にかかる操作において、固定化対象はその種類によって固定化位置が識別可能となるようには制御されない。すなわち、アレイ技術を用いた固定化によって実現されるような整然さは伴わない。従って、複数種の固定化対象が基板上に固定化されると、各種対象は互いに混合した状態で分布する。混合の度合いは供給態様によって異なる場合もあり、特に限定されない。例えば、基板上の複数の対象が固定化されている領域全体において、各種固定化対象の混合割合がほぼ同じとなる分布である場合(図12に例示される)や、基板上の場所によって各種固定化対象の混合割合において不連続な変化が生じるような分布である場合がある。前者の場合は、複数の固定化対象の全てを含む溶液を供給することや、固定化対象を複数回に分けて且つ基板上の同じ位置に重ねて供給することによって生じうる。後者の場合は、固定化対象を複数回に分けて供給することによって生じうる。
【0144】
[8−2−1−2.固定化対象の供給]
固定化対象に含まれるシグナルプローブ又は塩基配列情報をインデックスとする場合、固定化対象の基板上への供給は、識別すべき複数種の固定化対象のうち少なくとも二種を含む溶液を供給することによって行われてよい。この場合、識別すべき複数種の固定化対象を一時に供給してもよいし、複数回に分けて供給してもよい。無論、識別すべき固定化対象を一種類ずつ供給することも許容される。いずれの場合も、シグナルの取得を行うまでに全ての固定化対象が供給され固定化される。
【0145】
固定化の順番をインデックスとする場合、固定化対象の基板上への供給は、識別すべき固定化対象が一種類ずつステップワイズに供給されうる。固定化対象の一種類について供給及び固定化され、位置情報が取得された後に、固定化対象の他の一種類について供給及び固定化され、位置情報が取得される、という操作が繰り返される。
また、本発明において、固定化対象に含まれるシグナルプローブ又は塩基配列情報と固定化の順番との両方をインデックスとする場合、固定化対象の基板上への供給は、複数種の固定化対象が複数回にわたって供給されうる。
【0146】
固定化対象が基板上に固定化された後においては、洗浄などによって、未固定の固定化対象を除去する処理が行われていることが好ましい。この処理は当業者によって適宜行われる。
【0147】
[8−2−2.固定位置が作為的に決定される場合]
また、固定位置は、作為的に決定される位置でもありうる。例えば、固定化の対象を一種類ごとに基板上の異なる位置に供給する場合が挙げられる。この場合、供給手段(マイクピペットなど)は、固定化の対象の種類ごとに変え、基板上の供給位置も隔離することによって、種類の異なる固定化対象が混ざり合わないようにする。好ましくは、複数の親水性部分が疎水性部分によって隔てられるように設けられた基板を用い、固定化の対象をその種類ごとに親水性部分のそれぞれに供給することができる(図13)。このようにすることによって、基板上における複数種の固定化の対象の集積度を上げることができる。
【0148】
[8−3.位置情報の取得]
検出されたシグナルは、固定化対象の基板上における位置情報に変換される。位置情報は、どのような形式で表されるものであってもよいが、検出されたシグナルの位置を、基板上の座標として特定することによって表されるものであることが好ましい。具体的には、基板上に座標系(好ましくは直交座標系)を定め、検出された一のシグナルに対して一義的に定まる二の実数の組によって、シグナルの位置(すなわち固定化対象の位置)を特定することができる(図11(a)及び図12に例示される)。
【0149】
固定化対象に含まれる塩基配列情報をインデックスとする場合、基板上に固定化された識別すべき対象の全てについて、一工程で位置情報を取得することができる。
固定化の順番をインデックスとする場合、識別すべき固定化対象が基板上に固定化される都度、位置情報の取得を行う。具体的には、基板上に固定化された識別すべき対象について位置情報を取得し、その後新たに基板上に固定化された別の識別すべき対象について位置情報を取得する。このとき、例えば、既に取得された対象の位置座標と、新たに取得された対象の位置座標との間で差分をとり、新たなシグナルが検出された座標を、当該別の対象の位置情報として取得することができる。
【0150】
このような位置情報を取得する手段は、固定化された対象を識別するための装置(以下、識別装置と記載する)に一手段として備えられることができ、自動化することができる。位置情報読み取り手段としては特に限定されることなく、デジタイザやプラニメータなど、当業者によって適宜選択される。
【0151】
取得された位置情報は、上記の識別装置に備えられうる記憶手段に記憶されてもよいし、上記の識別装置から外部の装置に出力されることによって、外部の装置における記憶手段に記憶されてもよい。
【0152】
[8−4.インデックス]
インデックスは、複数種の鋳型ポリヌクレオチドXを種類ごとに特定することによって、その識別を可能にする。本発明において、鋳型ポリヌクレオチドXの種類の識別のために用いられるインデックスには、上述のように、鋳型ポリヌクレオチドXに含まれるシグナルプローブ又は塩基配列情報と、固定化順番とが挙げられる。いずれか一つのインデックスのみを用いてもよいし、それぞれのインデックスを組み合わせて用いることもできる。
【0153】
[8−4−1.インデックスとしてシグナルプローブを利用する場合]
識別すべき複数の鋳型ポリヌクレオチドXを識別するためのインデックスの一つとして、鋳型ポリヌクレオチドXに含まれるシグナルプローブを利用する場合、固定化後におけるそのシグナルプローブに由来するシグナルを位置情報と共に取得すればよい。
【0154】
[8−4−2.インデックスとして塩基配列情報を利用する場合]
識別すべき複数の鋳型ポリヌクレオチドXを識別するためのインデックスの一つとして、鋳型ポリヌクレオチドXに含まれる塩基配列情報を利用する場合、識別すべき対象の全てを基板に固定化し、位置情報を取得した(図11(a)に例示される)後、このような塩基配列情報の取得を行う(図11(b)に例示される)ことができる。
【0155】
インデックスとして利用される塩基配列情報は、複数種の鋳型ポリヌクレオチドXを識別するための固有配列情報を与えることができるものであれば特に限定されない。
また、鋳型ポリヌクレオチドXに含まれる塩基配列の長さとしては特に限定されないが、複数種の鋳型ポリヌクレオチドXを識別することができる固有の配列を与える十分な長さであって、識別の効率性や簡便性に支障を与えない程度の長さであることが好ましい。このような長さは、当業者であれば容易に決定することができる。
【0156】
インデックスとしての塩基配列の、鋳型ポリヌクレオチドX中の位置としては、例えばプライマーpの3’末端に隣接する位置でありうる。すなわちこの場合、工程(a)の後、工程(b)の前に、プライマーpの3’末端から伸長する相補鎖を合成し、その相補鎖の配列を解読することによってインデックスを取得することができる。引き続く工程(b)で合成する可逆的ターミネータ含有伸長鎖e(T)は、インデックス配列の3’末端に隣接する位置から伸長させることができる。インデックス配列の解読方法は、例えば上記工程(d)と同様に行うことができる。
【0157】
上記のような配列を取得する手段は、固定化された対象を識別するための装置に一手段として備えられることができ、自動化することもできる。そのような手段には、蛍光物質標識されたヌクレオチドを供給する手段、及び前記蛍光物質に由来する蛍光を観察する全反射蛍光顕微鏡システムが含まれうる。
また、上記の識別装置は、観察された蛍光を塩基配列情報に変換する手段をさらに含んでもよい。このような手段はソフトウェアによって実現されうる。
【0158】
取得された配列情報は、上記の識別装置に備えられうる記憶手段に記憶されてもよいし、識別装置から外部の装置に出力されることによって、外部の装置における記憶手段に記憶されてもよい。
【0159】
[8−4−3.インデックスとして固定化の順番を利用する場合]
識別すべき複数の鋳型ポリヌクレオチドXを識別するためのインデックスの一つとして、固定化対象が基板上に固定化された順番を利用する場合、固定化対象が基板上に固定化される都度、位置情報の取得を行う。すなわち、工程順番の違いが固定化対象の種類の違いを反映する。
【0160】
まず、基板及びその表面上に無作為に決定される位置で固定化され且つシグナル物質標識(上述のシグナル物質を使用することができる)を有する固定化対象を用意する。固定化後、当該対象の標識に由来するシグナルが検出され、位置情報が取得される(図11(a)に例示される)。次に、同一の基板表面上において、無作為に決定される位置で固定化され且つシグナル物質標識を有する他の固定化対象を用意する。固定化後、当該他の対象の標識由来するシグナルが検出され、位置情報が取得される(図12に例示される)。同様の工程が、さらに繰り返して行われることもできる。
【0161】
なお、図12の例においては、後に固定化した核酸検体が有するシグナル標識は、先に固定化した対象が有するシグナル標識と異なるように示されているが、同じシグナル標識を用いることもできる。いずれの場合であっても、位置情報取得においては、既に取得された先の対象の位置座標と、新たに取得された後の対象の位置座標との間で差分をとり、新たなシグナルが検出された座標を、当該後の対象の位置情報として取得することができる。
【0162】
上記の識別装置においては、固定化対象を供給する手段と、シグナルを検出する手段と、固定位置情報を取得する手段を含む一連の手段をこの順で複数回機能させるための制御手段が備えられうる。このような手段は、ソフトウェアによって実現されうる。
【0163】
[8−5.位置情報とインデックスとの関連付け]
インデックスとして、鋳型ポリヌクレオチドXに含まれる配列を利用する場合、取得された位置情報と配列情報とを上記の識別装置又は外部装置の記憶手段から呼び出し、位置情報と、当該位置において取得された配列情報とを関連付けることによって、各種対象を識別することができる。
例えば図11(a)に示すように、固定化及びシグナル検出された検体に、符号A1、A2、A3・・・Anを付し、それぞれについて位置座標を取得し、図11(b)に示すように、それぞれの鋳型ポリヌクレオチドXに含まれる配列の相補鎖合成を行って、配列情報を取得する。取得した配列をインデックスとして、それぞれの対象に関連付ける(図示せず)。それぞれの対象が固有の位置情報を有し、それぞれに鋳型ポリヌクレオチドXの種類を表すインデックスが関連付けられているため、位置情報から鋳型ポリヌクレオチドXの種類を特定することができる。
【0164】
インデックスとして、固定化順番を利用する場合、位置情報を取得するごとに、取得された位置情報を上記の識別装置又は外部装置の記憶手段から呼び出し、当該位置情報を取得した固定化順番と関連付けることによって、各種鋳型ポリヌクレオチドXを識別することができる。
例えば図11(a)に示すように、工程Aにおいて固定化及びシグナル検出された対象に、工程順番を表すインデックスAを付した符号A1、A2、A3・・・Anを付し、それぞれについて位置座標を取得し、図12に示すように、工程Bにおいて、新たに固定化及びシグナル検出された別種類の対象に、工程順番を表すインデックスBを付した符号B1、B2、B3・・・Bmを付し、それぞれについて位置情報を取得する。それぞれの対象が固有の位置情報を有し、それぞれに鋳型ポリヌクレオチドXの種類を表すインデックスが関連付けられているため、位置情報から鋳型ポリヌクレオチドXの種類を特定することができる。
【0165】
上記の識別装置においては、このように位置情報とインデックス情報とを関連付ける手段が備えられていてよい。当該手段は、ソフトウェアによって実現されうる。
【実施例】
【0166】
[実施例1:16kmerのポリヌクレオチドの再構成]
本実施例では、リード長16merから16kmer(32bit PCにおける限界長)のポリヌクレオチド再構成についてphrap(断片配列の重ね合わせから配列を再構成するプログラム)を用いたシミュレーションを行った。本発明の方法における工程(d)の解読をSBS(sequence by synthesis)によって行う場合、本発明の方法を「CT型SBS法」による方法と記載する。本実施例においては、ポリヌクレオチド再構成能について、従来の方法である「通常のSBS法」による方法と比較した。
【0167】
本実施例におけるシミュレーションにおいて想定した態様の概要を図14に示す。図14において、本発明のCT型SBS法は、ゲノム(Genome)のモデルである16kmerのポリヌクレオチド(ポリヌクレオチドZに相当)から断片化により200merの断片(Fragment、ポリヌクレオチドZの断片である鋳型ポリヌクレオチドXに相当)を調製し、200merの断片においてリード長16mer(相補鎖x(L)に相当)を得る。リード長16merから中間長の200merのcontig(鋳型ポリヌクレオチドX配列)を作り、200merから16kmer(ポリヌクレオチドZ配列)を再構成する。
一方、従来の通常のSBS法はゲノム(Genome)のモデルである16kmerのポリヌクレオチドから断片化により16merの断片(Fragment)を調製し、16merの断片においてリード長16merを得る。リード長16merからは下記のとおり16kmerの再構成はできない。
【0168】
ターゲットDNAの断片化により調製したFragmentの長さとアセンブラ(phrap)で生成されるcontig長さとの関係を図15に示す。図15における「16mer」及び「30mer」で示されたポイントに着目すると、以下のことが示されている。
1) 16merのfragment長からは200〜300merのcontigが再構成可能である。
2) 30merのfragment長からは16kmerのcontigが再構成可能である。
3) fragment長が30merを超えると、再構成できるcontig長は16kmer程度でプラトーになる。
さらに、Fragment長に対するcontig長の変化を示す図を図16に示す。
【0169】
以上の計算結果から以下のことが言える。
I) 16kmerのcontig長を再構成可能なFragment長は30mer以上である。
II) Fragment長30mer未満の場合、ターゲットとするcontig長が長くなれば再構成に必要なFragment長も長くなる。
【0170】
すなわち、本発明のCT型SBS法においては、上記1)よりリード長16merから中間長の200merのcontig(鋳型ポリヌクレオチドX配列)の再構成が可能である。さらに、上記(I)より、200merから16kmer(ポリヌクレオチドZ配列)の再構成も可能である。従って、リード長16merから最終的に16kmerの再構成が可能であることが証明された。
一方、従来の通常のSBS法においては、上記1)よりリード長16merから16kmerの再構成は不可能であることが証明された。
【0171】
[実施例2:3Gmerのポリヌクレオチドの再構成]
本実施例では、250〜300mer程度から3Gmerのポリヌクレオチド再構成についてphrap(断片配列の重ね合わせから配列を再構成するプログラム)を用いたシミュレーションを行った。本発明の「CT型SBS法」による方法のポリヌクレオチド再構成能について、従来の方法である「通常のSBS法」による方法と比較した。
【0172】
本実施例におけるシミュレーションにおいて想定した態様の概要を図17に示す。図17において、本発明のCT型SBS法は、3Gmerのゲノム(Genome、ポリヌクレオチドZに相当)から断片化により2kmerの断片(Fragment、ポリヌクレオチドZの断片である鋳型ポリヌクレオチドXに相当)を調製し、2kmerの断片においてリード長75mer(相補鎖x(L)に相当)を得る。リード長75merから中間長の2kmerのcontig(鋳型ポリヌクレオチドX配列)を作り、2kmerから3Gmer(ポリヌクレオチドZ配列)を再構成する。
一方、従来の通常のSBS法は3Gmerのゲノム(Genome)から断片化により75merの断片(Fragment)を調製し、75merの断片においてリード長75merを得る。リード長75merからは下記のとおり3Gkmerの再構成はできない。
【0173】
実施例1の図16のデータをもとに、contig長(target DNA長)と、そのcontig長に到達するための最低限必要とされるFragment長との関係を図18に示す。図18で示された関係から、contig長3Gmerを再構成できるFragment長を外挿した。外挿結果を図19に示す。図19に示すように、282merのFragment長があれば3Gのcontig(target DNA)を再構成することができることが示された。
【0174】
一方、従来の通常のSBS法においては、75merから3Gmerの再構成をすることは不可能である。このことは、Genome Research 2010 20: 265-272に実証されている。この論文においては、それまでの既存のアセンブラの欠点(例えば、リード長が短いと(Short readsである場合)PCのメモリを大量に用いる必要があり実用性がない、short reads専用でもヒトゲノム(3x109)の大きさに対応できない、又はアセンブルしても断片化されてしまう)に鑑み、アセンブラillumina GAを用い新たなアルゴリズムによってde novo再構成をしたことが記載されている。アジア人とアフリカ人のゲノムを対象に、35〜75bpのreadを用いて再構成を行ったところ、N50の contig size はアジア人で7.4kb、アフリカ人 5.9 kbであり、Genome coverageも全ゲノムの85〜87%であったことが記載されている。(なお、paired-endを使っており、scaffold は 446.3kb及び61.9 kbと長くなっている。)


【特許請求の範囲】
【請求項1】
以下の工程を含む、ポリヌクレオチドシーケンス法;
(a)準備工程であって、
ポリヌクレオチドZの断片配列と同一又は実質的に同一の配列を有する鋳型ポリヌクレオチドXにプライマーp’が結合したプライマー結合鋳型ポリヌクレオチドp’−Xに、プライマーpがハイブリダイズしたハイブリッドを複数個用意する工程と、
(b)チェーンターミネーション工程であって、
可逆的ターミネータヌクレオチドN(T)とヌクレオチドNとを含むチェーンターミネーション用相補鎖合成基質を用いて、前記ハイブリダイズしたプライマーpの3’末端側から前記鋳型ポリヌクレオチドXの相補鎖伸長を行い、前記可逆的ターミネータヌクレオチドN(T)の相補結合により前記複数分子間での異なる位置で合成が停止することによって、長さの異なる複数種の可逆的ターミネータ含有相補鎖e(T)を得る工程、
(c)ターミネーションのリバース工程であって、
前記長さの異なる複数種の可逆的ターミネータ含有相補鎖e(T)においてターミネータを開裂させることによって、長さの異なる複数種の相補鎖eを得る工程、
(d)一分子単位での解読工程であって、
シグナル物質標識ヌクレオチドアナログN(L)である解読用相補鎖合成基質を用いて、前記複数分子間での異なる位置からそれぞれ前記鋳型ポリヌクレオチドXの相補鎖伸長を行い、複数種の相補鎖x(L)を、前記複数種のうちの一つの相補鎖x(L)の3’末端配列と他の一つの相補鎖(L)の5’末端配列とが重複するように得ると共に、
前記シグナル物質標識ヌクレオチドアナログN(L)が結合した順に、前記ヌクレオチドアナログN(L)に由来するシグナルを、一分子の前記鋳型ポリヌクレオチドXの相補鎖ごとに個別に検出することによって、前記複数種の相補鎖x(L)を前記鋳型ポリヌクレオチドXの複数の部分配列として決定する工程。
【請求項2】
前記複数の部分配列から、前記鋳型ポリヌクレオチドXの配列を再構成する工程(e)をさらに含む、請求項1に記載のポリヌクレオチドシーケンス方法。
【請求項3】
前記再構成された前記鋳型ポリヌクレオチドXの配列から、前記ポリヌクレオチドZの配列を再構成する工程(f)をさらに含む、請求項2に記載のポリヌクレオチドシーケンス法。
【請求項4】
前記チェーンターミネーション用相補鎖合成基質において、前記可逆的ターミネータヌクレオチドN(T)が、前記ヌクレオチドNに対して、0.01〜99%となる量で混合されている、請求項1〜3のいずれか1項に記載のポリヌクレオチドシーケンス法。
【請求項5】
前記鋳型ポリヌクレオチドXの長さが1000mer以上である、請求項1〜4のいずれか1項に記載のポリヌクレオチドシーケンス法。
【請求項6】
上記工程(d)の前に、前記工程(c)で得られた、前記相補鎖eが前記プライマーpから伸長して生じた伸長プライマーp−eと前記プライマー結合鋳型ポリヌクレオチドp’−Xとのハイブリッドを基板上に配置する工程をさらに含む、請求項1〜5のいずれか1項に記載のポリヌクレオチドシーケンス法。
【請求項7】
上記工程(c)の前に、前記工程(b)で得られた、前記可逆的ターミネータ含有相補鎖e(T)が前記プライマーpから伸長して生じた鎖p−e(T)と前記プライマー結合鋳型ポリヌクレオチドp’−Xとのハイブリッドを基板上に配置する工程をさらに含む、請求項1〜5のいずれか1項に記載のポリヌクレオチドシーケンス法。
【請求項8】
上記工程(b)の前に、前記工程(a)で得られた、前記プライマーpと前記プライマー結合鋳型ポリヌクレオチドp’−Xとのハイブリッドを基板上に配置する工程をさらに含む、請求項1〜5のいずれか1項に記載のポリヌクレオチドシーケンス法。
【請求項9】
前記プライマーp鎖が固定化用タグを有するものであり、
前記基板がその表面にリンカーを有するものであり、
前記固定化用タグは、前記リンカーに対する結合能を有するものである、請求項1〜8のいずれか1項に記載のポリヌクレオチドシーケンス法。
【請求項10】
前記固定化用タグが、シグナル物質で標識されたものである、請求項9に記載のポリヌクレオチドシーケンス法。
【請求項11】
前記可逆的ターミネータヌクレオチドN(T)が、さらにシグナル物質で標識されたものである、請求項1〜10のいずれか1項に記載のポリヌクレオチドシーケンス法。
【請求項12】
前記プライマーpが、前記プライマーp’の5’末端塩基に対応する相補塩基を欠如したものであり、
前記可逆的ターミネータヌクレオチドN(T)が、前記欠如した相補塩基を有するものである、請求項1〜10のいずれか1項に記載のポリヌクレオチドシーケンス法。
【請求項13】
前記ポリヌクレオチドZが、1つの細胞から精製されたものである、請求項1〜12のいずれか1項に記載のポリヌクレオチドシーケンス法。
【請求項14】
複数分子の前記鋳型ポリヌクレオチドXが、複数の細胞から精製された前記ポリヌクレオチドZの断片として調製されたものである、請求項1〜13のいずれか1項に記載のポリヌクレオチドシーケンス法。
【請求項15】
複数分子の前記鋳型ポリヌクレオチドXが、前記断片配列をベクターに挿入し、宿主細胞で増殖することによって調製されたものである、請求項1〜14のいずれか1項に記載のポリヌクレオチドシーケンス法。
【請求項16】
複数分子の前記鋳型ポリヌクレオチドXが、前記ポリヌクレオチドZの断片をPCRによって調製したものである、請求項1〜14のいずれか1項に記載のポリヌクレオチドシーケンス法。
【請求項17】
前記ポリヌクレオチドZの断片が、前記ポリヌクレオチドを超音波又は制限酵素で断片化することによって調製されたものである、請求項1〜16のいずれか1項に記載のポリヌクレオチドシーケンス法。
【請求項18】
前記工程(b)の前までに、同一基板上に、複数個の鋳型ポリヌクレオチドXを含むハイブリッドが、前記鋳型ポリヌクレオチドXの配列がそれぞれ異なる複数種類用意され、
前記基板上の前記複数種類の異なるハイブリッドが以下の鋳型ポリヌクレオチドX識別方法により識別されている、請求項1〜17のいずれか1項に記載のポリヌクレオチドシーケンス方法;
(I)基板、及び、その表面上に無作為に決定される位置で直接的又は間接的に固定化された複数種類の前記鋳型ポリヌクレオチドXであってシグナルプローブを直接的又は間接的に有するものを用意し、前記シグナルプローブに由来するシグナルを検出し、前記固定化された複数種類の前記鋳型ポリヌクレオチドXそれぞれの前記基板上の固定位置情報を前記シグナルに基づいて取得する工程と、
(II)前記位置情報に基づいて前記複数種類の鋳型ポリヌクレオチドXを互いに識別する工程とを含み、
前記工程(I)が、前記基板上に固定化された前記複数種類の鋳型ポリヌクレオチドXのそれぞれに含まれる塩基配列情報を取得することを含み、
前記工程(II)において、前記塩基配列情報を前記位置情報と関連付けることによって、前記複数種類の鋳型ポリヌクレオチドXを互いに識別する方法。
【請求項19】
前記工程(b)の前までに、同一基板上に、複数個の鋳型ポリヌクレオチドXを含むハイブリッドが、前記鋳型ポリヌクレオチドXの配列がそれぞれ異なる複数種類用意され、
前記基板上の前記複数種類の異なるハイブリッドが以下の鋳型ポリヌクレオチドX識別方法により識別されている、請求項1〜17のいずれか1項に記載のポリヌクレオチドシーケンス方法;
(I)基板、及び、その表面上に無作為に決定される位置で直接的又は間接的に固定化された複数種類の前記鋳型ポリヌクレオチドXであってシグナルプローブを直接的又は間接的に有するものを用意し、前記シグナルプローブに由来するシグナルを検出し、前記固定化された複数種類の前記鋳型ポリヌクレオチドXそれぞれの前記基板上の固定位置情報を前記シグナルに基づいて取得する工程と、
(II)前記位置情報に基づいて前記複数種類の鋳型ポリヌクレオチドXを互いに識別する工程とを含み、
前記工程(I)において、(A)基板、及び、その表面上に無作為に決定される位置で直接的又は間接的に固定化された前記鋳型ポリヌクレオチドXであってシグナルプローブを直接的又は間接的に有するものを用意し、前記鋳型ポリヌクレオチドXの前記シグナルプローブに由来するシグナルを検出し、位置情報を取得する工程と、その後、(B)前記基板表面上に、無作為に決定される位置で直接的又は間接的に固定化された他の鋳型ポリヌクレオチドXであってシグナルプローブを直接的又は間接的に有するものをさらに得て、前記他の鋳型ポリヌクレオチドXの前記シグナルプローブに由来するシグナルを検出し、位置情報を取得する工程とを少なくとも行い、
前記工程(II)において、前記工程(A)及び(B)を含む工程の順番と、それぞれの工程において取得された前記位置情報とを関連付けることによって、前記複数種類の鋳型ポリヌクレオチドXを互いに識別する方法。

【図2】
image rotate

【図4】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図18】
image rotate

【図19】
image rotate

【図1】
image rotate

【図3】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate


【公開番号】特開2012−191876(P2012−191876A)
【公開日】平成24年10月11日(2012.10.11)
【国際特許分類】
【出願番号】特願2011−57295(P2011−57295)
【出願日】平成23年3月15日(2011.3.15)
【出願人】(000001993)株式会社島津製作所 (3,708)
【Fターム(参考)】