単一分子全ゲノム解析のための方法及び関連装置
【解決手段】 直線状の生体高分子のような、少なくとも1つの巨大分子に沿って、特徴を標識し解析する方法であって、個々の非折り畳み状態の核酸分子に沿って、特定の配列モチーフ、或いはそうした配列モチーフの化学的又はプロテオミクス的な改変状態の、分布及び頻度をマッピングする方法が含まれる方法を提供する。
本発明はまた、そうした標識した巨大分子に沿った配列又はエピゲノムの差異のサインパターンを、直接的な超並列の単分子レベル解析によって同定する方法を提供する。
本発明はまた、そうした標識した巨大分子の高スループット解析に適したシステムを提供する。
本発明はまた、そうした標識した巨大分子に沿った配列又はエピゲノムの差異のサインパターンを、直接的な超並列の単分子レベル解析によって同定する方法を提供する。
本発明はまた、そうした標識した巨大分子の高スループット解析に適したシステムを提供する。
【発明の詳細な説明】
【技術分野】
【0001】
本出願は、2009年10月21日出願の米国出願第61/253,639号「Methods and Devices for Single Molecule Whole Genome Analysis」に対して優先権を主張するものであり、前記出願の全体が参照により本明細書中に援用される。
【0002】
本発明は、ナノテクノロジーの分野及び単一分子ゲノム解析の分野に関するものである。
【背景技術】
【0003】
DNAやRNAのような高分子は、ヌクレオチドを有する長い重合鎖であり、その直鎖状の配列は、採取元の生物のゲノム的及びポストゲノム的な遺伝子発現情報に、直接的に関連している。
【0004】
配列領域、モチーフ、及びオープンリーディングフレーム(ORFs:open reading frames)、非翻訳領域(UTRs:untranslated regions)、タンパク質因子結合領域、CpGクラスターなどのエピゲノム領域、マイクロRNA領域、トランスポゾン、逆トランスポゾン、並びにその他の構造的及び機能的なユニットのような機能ユニットの、直接的なシークエンシング及びマッピングは、個々人のゲノム構成及び「健康プロファイル」を評価するのに重要である。
【0005】
ある場合には、個人の寿命の間に起きる、部分重複、挿入、欠失、逆位、及び転座を含めた、ヌクレオチド配列の複雑な再構成が、遺伝子異常又は細胞腫瘍を含めた疾患状態に繋がる。別の場合では、別々の個人における遺伝子構造間の、配列の違い、コピー数多型(CNVs:copy number variations)、及びその他の違いが、集団における遺伝子構造の多様性、並びに環境的な刺激及び薬剤治療などのその他の外部的な刺激に対する反応差を反映する。
【0006】
DNAメチル化、ヒストン修飾、クロマチン折畳み、及びその他のDNA−DNA、DNA−RNA又はDNA−タンパク質間の相互作用を改変する変化のような、その他の進行中のプロセスは、遺伝子の調節、発現、及び最終的には細胞機能に影響し、その結果疾患及びガンを生じる。
【0007】
ゲノムの構造多型(SVs:structural variations)は、非常に一般的であり、健康的な個人間でも見られるものである。遺伝子配列情報の理解がヒトの健康にとって重要であることが、ますます明らかになってきている。
【0008】
核型分析、蛍光インサイツハイブリダイゼーション法(FISH:Fluorescent in situ Hybridization)などの、従来の細胞遺伝学的な方法は、わずか1個の細胞におけるゲノム構成の全体的視点を提供するものである。こうした方法は、数千及び数百万塩基対の大きな断片の、異数性、増加、減少、又は再構成などの、ゲノムの総体的変化を明らかにするものである。しかしながら、こうした方法は、小から中程度の大きさの断片のモチーフ又は損傷の検出に対しては比較的低い感度及び解像度であること、並びに煩雑であること、速度に制限があること、及び精度に一貫性が無いことを、欠点としている。
【0009】
アレイ比較ゲノムハイブリダイゼーション法(aCGH:array Comparative Genomic Hybridization)、ファイバーFISH、又は大量ペアエンドシークエンシングなどの、配列の領域、対象の配列モチーフ、及び構造的多型を検出するより新しい方法は、改善された解像度とスループットを有している。こうしたより新しい方法であってもなお、間接的であるか、煩雑で一貫性が無いか、高価であるか、のいずれかの欠点があり、また多くの場合、制限のある固定の解像度を持ち、参照ゲノムへのマッピングによる再アセンブリに依存した推測上の位置情報か、逆位又は転座などの差引きの無い損傷イベントについては明らかにしない比較強度比か、のいずれかを提供するものである。
【0010】
機能ユニット及び一般的な構造多型は、数十塩基からメガベース以上を含んでいると考えられている。したがって、大きな未変性のゲノム分子に沿って、キロベース下の(つまり、長さが約1キロベースより小さい)解像度スケールからメガベースの解像度スケールにわたって、配列情報及び構造多型を明らかにする方法は、過去に特性決定されていないゲノムの特徴をカタログ化するための、シークエンシング及び高解像度マッピングのプロジェクトにとって、非常に望ましいものであろう。
【0011】
さらに、特にヒトのような倍数体生物において、生体系の表現型多型又は疾患状態は、母系及び父系の血統から受け継いだ、2つの一倍体ゲノム間の相互作用の結果である。ガンは多くの場合、二倍体の染色体の損傷間においてヘテロ接合性が消失した結果である。
【0012】
現行のシークエンシング解析のアプローチは、限定されたハプロタイプ情報を持つ平均化された倍数体のゲノム材料に由来するサンプルに大きく基づくものである。これは、不均質な細胞集団から混合した二倍体のゲノム材料を抽出し、次いでそれらをランダムな小断片へと細かく切断するために現在使用されている、現行のフロントエンドのサンプル調製法によるものである。しかしながらこのアプローチは、前記二倍体ゲノムの未変性の構造情報を破壊してしまう。
【0013】
最近開発されている第二世代のシークエンシング法は、スループットは改善されているが、複数の非常に短いシークエンシング読取り値からより難しいアセンブリを行うために、複雑なゲノム情報の描出をさらに複雑化している。
【0014】
一般的に、短い読取り値は、複雑なゲノム中に一意に位置合わせすることがより難しく、短い標的領域の線形順序を解読するためには、追加の配列情報が必要となる。従来のBACシークエンシング法及びショットガン・サンガーシークエンシング法において必要な8〜10倍のカバー率ではなく、同様のアセンブリ信頼度に達するためには、25倍のオーダーの配列カバー率が必要とされる(Wendl MC,Wilson RK Aspects of coverage in medical DNA sequencing,BMC Bio informatics 2008 May 16;9:239)。この事実は、シークエンシングのコスト削減にさらなる難題を課しており、シークエンシングのコストを目標の1000ドルより低く抑えるまでに、大幅に削減するという当初の第一目標を挫くものである。
【0015】
巨大な無傷のゲノム分子についての単一分子レベルの解析は、クローン化又は増幅の過程無しに配列モチーフをインサイツで精密にマッピングすることによって、正確な未変性のゲノム構造を保存できる可能性を与える。ゲノム断片が大きくなればなるほどに、ゲノム分析物中のサンプル集団はより複雑でなくなる。理想的な筋書においては、ヒトの倍数体ゲノム全体をカバーするのに46の染色体断片のみの単一細胞レベルでの解析が必要となり、そうしたアプローチによって導き出された配列はその性質上、無傷のハプロタイプ情報を有する。
【0016】
実質的なレベルでは、メガベースのゲノム断片が細胞から抽出され、直接的な解析のために保存されうる。このことは、複雑なアルゴリズムとアセンブリの重荷を減らし、また、元の文脈中のゲノム及び/又はエピゲノムの情報と、個々の細胞表現型とを、より直接的に相互に関連付けるであろう。
【0017】
ゲノムDNAのような高分子は、多くの場合、半柔軟性でミミズ状の重合鎖の形をとる。これらの高分子は通常、自由溶液中でランダムコイル構造を持つことが想定される。生物学的溶液中の無改変のdsDNAにおいて、その持続長(剛性を定義するパラメーター)は、一般的に約50nmである。
【0018】
大きく無傷な高分子に沿って顕著な特徴を一貫して分離し、定量的な測定を達成するための一つのアプローチは、そうした重合分子を、平坦な表面か、化学的若しくは位相的に予め定義された表面パターンか、好ましくは長いナノトラックか、又は閉鎖型マイクロ/ナノチャネルかのいずれかの上に、一貫した直線形に引き伸ばすことである。
【0019】
光ピンセット、気液界面の対流(liquid−air boundary convective flows)(コーミング)、又は層流の液体力学的流動(laminar fluidic hydrodynamic flow)のような外力を用いることで、長いゲノム分子を引き伸ばし伸長させる方法が、実証されている。
【0020】
分子の伸長した形は、前記外力が維持されている限り一時的に安定化されるか、又は表面に付着させ静電的若しくは化学的な処理による改変を通して増強することで、より恒久的に安定化されるであろう。マイクロ/ナノチャネル内における実証済みの重合高分子の伸長は、物理的なエントロピー拘束によって実証されている(Cao etal.,Applied Phys.Lett.2002a、Cao et al Applied Phys.Lett.2002b、米国特許出願第10/484,293号公報を参照のこと;参照によってこれら全体が本明細書に援用される)。
【0021】
約100nmの直径を持つナノチャネルが、dsDNAゲノム断片を数百キロベースからメガベースまでに直線化することが示されている(Tegenfeldt et al.,Proc.Natl.Acad.Sci.2004)。ナノ流体力学によって伸長された半柔軟性の標的分子は、イオン濃度又はpH値が生物学的範囲内にある緩衝液状態中に懸濁することができ、したがって、こうした分子に対して生物学的機能アッセイを実施することはより受け入れやすいことである。この伸長の形式はまた、正確な制御のもとで高い速度から完全に静止した状態までの範囲を取る電界又は圧力の勾配中に、荷電した核酸分子を移動させるような操作にとって、比較的容易である。
【0022】
さらに、ナノスケール環境における流体流動の性質は、乱流及びそれ以外に長いDNA分子を断片化する可能性のある剪断力の多くを除外する。これは、巨大分子の直線解析にとって、特にssDNAが使われうるシークエンシングの適用先においてとりわけ有益である。最終的には、効果的な読取り長は、維持することができた最も長い無傷の断片と同じ長さにしかできない。
【0023】
ゲノミクスに加えて、エピゲノミクスの分野も、ガンなどのヒトの疾患において、その役割に目覚しい重要性があることが理解されている。ゲノミクスとエピゲノミクスの両分野における知識の蓄積により、主要な挑戦は、どのようにゲノムとエピゲノムの因子が、ヒトの疾患及び悪性病変における多型性又は病態生理学的状態に、直接的又は間接的に相関するのかということを理解することとなっている。
【0024】
全ゲノム解析の概念は、ゲノムシークエンシング、エピジェネティックなメチル化解析、及び機能的ゲノミクスの分野が、別個に深く研究されるという、区分化されたアプローチから、より多面的な全体論的なアプローチまで進化してきた。DNAシークエンシング、構造多型マッピング、CpGアイランドメチル化パターン、ヒストン修飾、ヌクレオソオーム再構築、マイクロRNA機能、及び転写プロファイリングは、より系統的な方法で観察された。しかしながら、細胞の分子状態の上記観点のそれぞれを調べる技術は多くの場合独立しており、退屈で互換性がなく、このことが互いに干渉する実験データ結果を必要とするシステム生物学の解析をひどく複雑化してしまう。
【0025】
巨大な無傷で未変性の生物学的サンプルは、配列の構造多型を、異常なメチル化パターン、マイクロRNAサイレンシング部位、及びその他の機能的分子の情報に、重ね合わせる工程のような、正しく重要で有益な解析方法を用いることで、標的サンプルのゲノム情報及びエピゲノム情報を研究する可能性を提供できる。(例えば、国際特許出願PCT/US2003/0022444号を参照のこと。参照によってこれら全体が本明細書に援用される。)オーダーメイド医療における細胞の分子機能及び疾患の形成メカニズムを理解するのに、非常に強力な道具を提供するであろう。
【発明の概要】
【課題を解決するための手段】
【0026】
本発明は、一態様において、直線状の生体高分子のような、少なくとも1つの巨大分子に沿って、顕著な特徴を標識し解析する方法に関するものである。前記方法は、幾つかの実施形態において、特定の配列モチーフ(つまり、パターン、テーマ)の分布及び頻度、或いは、そうした配列モチーフの化学的又はプロテオミクス的な改変状態を、個々の非折畳み状態の核酸分子に沿って、その長さ及び前記モチーフの配列に依存して、マッピングする方法に関するものである。
【0027】
また、標識した巨大分子を選別し直線状に展開する工程に適した、流体チップ及びシステムが、開示される。これらのチップ及びシステムは、光学的及び非光学的なシグナル解析を並列に行うことが可能なものである。
【0028】
本発明の別態様は、DNA主鎖に沿って短い配列モチーフの分布をマッピングすることによって、二本鎖DNA分子を同定するものである。これは、配列モチーフ間の高い空間解像度を提供する。この高解像度マップに基づいて、シークエンシング反応をそれぞれの配列特異的モチーフの位置において初期化し、時間をかけて繰り返して既知の空間的位置における複数の塩基情報を得た。これを、STS、又は空間的時間的シークエンシングと呼ぶことができる。本発明はまた、そうした標識化のプロセス及び特徴の使用に関わるものである。
【0029】
一実施形態において、二本鎖DNA上の顕著な特定の配列モチーフは、DNA一本鎖にニッキングして、ギャップを形成することによって(これは酵素によって行われてもよい)作成されるものである。利用者は、次いで鎖伸長のためにポリメラーゼを適用し、同時に「フラップ」と呼ばれる「剥離した」短い配列断片を生成することができる。これらの剥離した一本鎖のフラップは、標識プローブを用いた配列特異的なハイブリダイゼーションに利用可能な領域を生成するものである。幾つかの実施形態において、塩基(標識された塩基又は標識されたプローブを含む)が、剥離した前記フラップに結合する。別の実施形態において、前記フラップが形成された鎖に残された「ギャップ」の少なくとも一部を充填するために、塩基(又はプローブ)が結合する。これらの実施形態において、このギャップ充填塩基又はプローブは、前記ギャップを充填する役目を果たし、その結果前記フラップは「自由」な状態になり、その元の位置に戻ることがなくなる。標識した塩基又はプローブは、前記フラップ及びフラップの形成によって残された前記ギャップに、結合することができる。
【0030】
こうした標識には、フルオレセインなどのような、蛍光色素分子が含まれる。蛍光物質の非網羅的リストは、www.abcacm.comにおいて利用可能であり、適切な蛍光分子はまた、本技術分野の当業者にとって既知のものであろう。標識は、磁性体、放射性物質、量子ドットなどが含まれてもよい。
【0031】
標識したゲノムDNAが、支持表面上又はナノチャネルアレイ内において直線状に伸長するとき、フラップに特異的な配列にハイブリダイズした修飾プローブからのシグナル間の空間距離を、定量的に計測することが出来る(一貫性のある方法で)。この情報を、次いで、その領域の特定のゲノム配列情報を反映する、一意的な「バーコード」のサインパターンを生成するために使用してもよい。標的分子上のニッキングされたギャップは、Nb.BbvCI、Nb.BsmI、Nb.BsrDI、Nb.BtsI、Nt.AlwI、Nt.BbvCI、Nt.BspQI、Nt.BstNBI、Nt.CviPII、及びこれらの組合せを含むがこれらに限定されない特定の酵素によって、適切に作成されるものである。このマップに基づいて、シークエンシングを行うことができる。
【0032】
非限定的な実施例として、バーコードを以下のように作成することができる。ある既知の疾患状態は、固有のヌクレオチド配列TTT−(10塩基)−CCC−(5塩基)−AAAによって特徴付けられている。AAA−赤色素、GGG−青色素、TTT−緑色素の、3つのプローブを作成する。これらのプローブを、次いで、上記の固有のヌクレオチド配列を含むことが知られているdsDNAのある領域にフラップが形成された、フラップ含有dsDNAサンプルに、プローブの結合を促進する条件下において接触させる。前記DNAサンプルを、次いで伸長させ、利用者は前記プローブの有無について前記サンプルを分析する。もし、前記3つの色素が前記サンプル中に存在し、適切な順番にあり、互いに適切な距離をもって離れている(つまり、色素の順番が赤−青−緑であり、赤と青の色素が10塩基に対応する距離で離れており、青と緑のし基礎が約5塩基に対応する距離で離れている)ことを、利用者が検出した場合、利用者は調べている前記dsDNAサンプルが前記既知の疾患を持つことが示唆されるという情報を得ることができるであろう。
【0033】
上記のプローブは、例証のみのために列挙したものである。プローブは、1〜10塩基、1〜100塩基、1〜1000塩基、又はさらに長い長さを持つことができる。 プローブは単一のタグ又は複数のタグ又は標識を持っていてもよい。一実施例として、プローブは2つ(又はそれより多くの)蛍光物質を持つように構築されてもよい。プローブは、柔軟性又は硬直性のスペーサー領域によって接続された、2つ以上の結合領域を含むことができる。
【0034】
請求された本発明はまた、遺伝子の特定の配列のコピーを検出するのに用いることができる。これらの実施形態において、本明細書の他の場所で記載されているように、DNAを処理してフラップを形成し、前記DNAにプローブを接触させてもよい。特定のDNA配列に固有の「バーコード」が2つ以上存在する場合、ある個人が特定の遺伝子又は特定の配列の複数のコピーを持っている可能性があることを示すのに用いることができる。これは、様々な多遺伝子性疾患のような、遺伝子の複数コピーによって自体が特徴付けられる状態の有無を、診断又は予測するのに有用な可能性がある。利用者はまた、2つ以上のバーコード間の距離を(その距離はサンプルの身長によって決定されうる)、dsDNAサンプルの特徴決定の助けとするために用いてもよい。例えば、利用者はプローブを用いて、特定の疾患の発現に重要な領域を含むことが知られている(又は疑われている)dsDNAサンプルについて、ある領域の開始及び終端において、バーコードを生成してもよい。
【0035】
もし前記疾患が存在しない場合、前記バーコード間の距離は第一の距離D0となる可能性がある。一方で、もし前記疾患が存在した場合、2つの前記バーコード間の距離は、より長い距離D1であることが明らかになる可能性がある。この場合、前記dsDNAサンプルを提供した被験者中の、関心の配列(例えば、遺伝子)の有無を示唆する情報を得るであろう。他の実施形態において、「正常」な個人は、DNAの特定領域の開始及び終端の前記バーコード間の「正常」な距離がD1であるような遺伝子を持つ可能性がある。しかしながら、その個人が遺伝子を欠いている場合、前記2つのバーコード間の距離は、より短い距離D0となる可能性があり、この場合、利用者は前記dsDNAの提供者が、関心の塩基配列(又は遺伝子)を欠いていることを示唆する情報を得るであろう。
【0036】
この情報を、被験者又は患者の防御的な(又は治療的な)療法を設計するために、順番に用いることができる。一実施例として、もし被験者がフェニルケトン尿症と対応した遺伝子プロファイルを持っていると利用者が決定した場合、利用者は被験者にフェニルアラニン含有の素材の食用を避けることを助言することができる。
【0037】
本発明はまた、dsDNAサンプル中の、複数の異なる塩基配列の有無を検出するのに用いられる。これは、プローブを用いて、異なる配列に異なるバーコードを生み出すことによって達成されうる。例えば、利用者は疾患1が互いに距離D1だけ離れた塩基配列S1a及びS1bによって特徴付けられると知っている場合がある。疾患2は、互いに距離D2だけ離れた塩基配列S2a及びS2bによって特徴付けられる。利用者は、次いで疾患1についてのバーコード(S1a及びS1bに特異的なプローブを使用する)と、疾患2についてのバーコード(S2a及びS2bに特異的なプローブを使用する)とを生成する。フラップ処理したdsDNAサンプルに適切なプローブを適用し、2つの前記バーコードの有無を調べることによって、利用者は前記dsDNAサンプルの提供者が、疾患1、疾患2、又はその両方を持つものとして特徴付けられるかどうかを、決定することができる。この方法において、利用者は、複数の条件で単一のサンプルを分析することができる。
【0038】
特定の解析において用いられるプローブは、同じであるか、或いは標識、結合特異性、又はその両方において互いに異なっている可能性がある。例えば、利用者は、配列AAAに結合する赤色蛍光色素を持つプローブと、GTTC配列に結合する緑色蛍光色素を持つプローブとを用いて解析を行なってもよい。利用者は、磁性体又は放射性物質を持つプローブと、蛍光物質を持つプローブとを同時に用いてもよい。この方法において、利用者は複数のプローブを同時に分析することができる。
【0039】
利用者はまた、単一条件において複数のサンプルを同時に分析することもできる。例えば、利用者は、複数の個人から得られた複数のdsDNAについて、それらのサンプルの、特定の1又はそれ以上のバーコードの存在(又は欠失)を分析することによって、ある特定の状態について並列で分析することができる。したがって利用者はまた、複数の状態について複数のdsDNAサンプルを同時に分析することができ、これによって複数個人についての高スループットのスクリーニングが可能となる。そうした一実施形態において、利用者はナノチャネルのセット又はアレイを用い、各ナノチャネルは異なる被験者由来の、処理した(例えば、フラップ含有の)dsDNAを伸長させるのに用いられる。この個々のサンプルは、次いで、特定の配列の有無又はバーコードの有無を示す個々のプローブの有無について(例えば、前記サンプルに存在する可能性のある蛍光プローブを励起するための放射光を適用することによって)調べられる。
【0040】
本発明はまた、遺伝子プロファイルを生成するために用いることができる。そうした実施形態において、利用者はある特定の状態(例えば、疾患又は障害)によって特徴付けられる被験者から、dsDNAサンプルを得てもよい。利用者は、次いでdsDNA中の1又はそれ以上の位置にフラップを形成し、次いでサンプル中の得られたフラップ又はギャプに、標識プローブを結合させてもよい。利用者は、次いでこれらのプローブについての有無及び場所について被験者のdsDNAを調べてもよく、これらのプローブは順番に被験者のdsDNAの含有量について順番に情報を産み出す。(例えば、配列ACACACを持つプローブが被験者のdsDNAに結合した場合、当該dsDNAがその位置に配列TGTGTGを持つことを示す。)利用者は、次いで被験者のDNAのマップを構築することができ、このマップは関連する特定の配列があるという情報(それらの配列に相補的なプローブの結合によって示される)と、それらの配列の位置(結合したそれらのプローブの市によって示される)を有するものである。したがって、利用者は、非限定的な実施例において、遺伝子疾患Xを持つと特徴付けられる個人が、dsDNAサンプルの10321番目の塩基位置において配列S1が開始し、dsDNAサンプルの11555番目の塩基位置において配列S2が開始するdsDNAを、持っていると決定することもあり得る。この情報を遺伝子疾患Xの有無を示すものとして扱うことで、利用者は、次いで第1の被験者からの情報に対して、別の被験者からのdsDNAを比較することができる。もし、第2の被験者が、塩基位置10321番目及び11555番目に、それぞれ配列S1及びS1を示したならば、第2の被験者もまた遺伝子疾患Xを持っている可能性がある。この方法において、利用者は、様々な遺伝子状態を持っているとして特徴付けられた個人から得られたdsDNAについての、様々な配列特異的プローブの結合位置に関係する情報の、自身の「ライブラリー」を作成することができる。新たな被験者からのdsDNAを、次いで本発明に従って処理することで(例えば、フラップを形成し、標識プローブを結合させる)、この新たな被験者が、利用者の結合情報ライブラリーにおいてカタログ化された1又はそれ以上の疾患を、持っている(つまり、保有している)かどうか決定することができる。
【0041】
別の実施形態において、標識した(例えば、共有結合的にタグを付けた)二本鎖DNAの特定の配列モチーフは、ニッキングした一本鎖にギャップを作成し、次いで標識したヌクレオチドをその中に組み込むことによって、作成される。そうした特定の標識した配列モチーフの、個々の非折畳み状態の核酸分子に沿った、物理的な分布及び頻度が、マッピングされる。幾つかの実施形態において、この後に一塩基シークエンシングを行うことで、サンプルについての塩基毎の配列情報を得ることができる。
【0042】
別の実施形態において、個々に標識された非折畳み状態の核酸分子は、直線状に伸長される。これは、そうした伸長した巨大分子を、表面の性質によって定義される、ナノスケールのチャネル、位相的なナノスケールの溝、又はナノスケールの走路の中に閉じ込めることによって、達成される。一実施例として、米国特許出願第10/484,293号の装置及び方法が、直線状伸長をもたらすのに適切であると考えられる。光ピンセット及び剪断応力を適用する方法(例えば、米国特許第6,696,022号で、参照によって本明細書中に援用される)もまた、そうした伸長をもたらすのに適切であると考えられる。
【0043】
別の実施形態において、ナノチャネル、ポスト、トレンチなどの極めて小さなナノ流体構造が基質上で製造され、超並列アレイとして、単一分子の解像度におけるDNA及びタンパク質などの生体分子の操作及び解析に用いられる。適切にも、チャネルの断面積の大きさは、伸長した生体分子の断面積のオーダー、つまり約1〜約106平方ナノメートルのオーダーであり、個々に分離され、数十、数百、数千、数百万さえも同時に解析される、伸長した(例えば、少なくとも部分的に直線状又は部分的に非折畳み状態であるとして特徴付けられる)生体分子を提供するものである。
【0044】
前記チャネルの長さは、巨大分子の長さの相当な部分又は相当な数の巨大分子までも収容するほど十分に長く、光学ズームを持つ一般的なCCDAカメラの視野域(約100ミクロン)から、染色体の全長と同じ長さの10センチメートル長のオーダーまでの範囲を取ることが望ましい(が、必須ではない)。最適な長さは、利用者の必要性に依存するであろう。
【0045】
本発明はまた、そのような標識化プロセスおよび特性の使用に関するものである。フラップおよび一本鎖DNAのギャップはゲノム学、遺伝学、臨床診断学を含むがこれに限定されない多くの分野において利用することが可能である。
【0046】
1実施形態において、(例えば、フルオロフォアで)タグを付けたプローブは長い二本鎖ゲノムDNA分子に沿いフラップまたは一本鎖DNAのギャップでハイブリダイズし、標識されたフラップまたは一本鎖DNAのギャップの空間バーコード(すなわち、ヌクレオチド間隔、配列またはその両方に関連したサイン)を観察するため、標識されたDNA分子を蛍光顕微鏡下で画像化することが可能である。個々のバーコードからのサインがサンプル高分子の特定の領域に関するさらなる情報を提供するため一緒につなぎ合わすことが可能である場合、バーコードを全ゲノムマッピングに順番に使用することが可能である。1つの非限定的な例として、利用者はDNAサンプルをサブセクションに分断する可能性があり、それから特定の塩基配列の存在(または欠如)および特定の順序でのそのような配列の存在について各々のサブセクションが解析される可能性がある。サブセクションを解析した後、利用者は、個々のサブセクションから情報を収集し、全ての、オリジナルサンプルとして全体的な情報である「地図」を作成することが可能である。
【0047】
1つの非限定的な例として、利用者は5kbのサンプルを用い、5つの1kbのサブセクションにサンプルを切断する可能性がある。その結果、利用者はこれらのサブセクションの各々においてフラップを作成する可能性があり、そのサブセクションに存在する塩基配列により特徴づけられることが知られている(または疑われる)1若しくはそれ以上の遺伝子疾患のため、各々のサブセクションを解析する可能性がある。たとえば、サブセクション1は心臓病のために解析され、特徴的配列または配列のセットが0〜1000塩基の位置で生じることが知られており、サブセクション2は糖尿病のために解析され、特徴的配列または配列のセットが1001〜1999の位置で生じることが知られている。それから利用者は、個人の疾患状態の総合的評価を行うため、この情報をアッセンブルすることが可能である。
【0048】
別の実施形態において、異なるゲノム領域のフラップまたは一本鎖DNAは、2つの領域の関係を同定するため違なる色素の(または、異なるシグナルの)プローブで標識される。そのようなBCR−ABL融合の例において、同じ領域での2色またはそれ以上の色素の存在は、転座のような構造変異を証明する。これは図5において示され、図はBCRおよびABL染色体セグメントの部分転座を図示する。
【0049】
別の実施形態において、標識したフラップまたは一本鎖DNAのギャップの(単一色素または複数の色素を含むパターンを含む可能性がある)1若しくはそれ以上の空間バーコード化パターンは、多重疾患診断法における複数の領域を検査するのに用いることが可能である。1つの非限定的な例として、利用者は複数の転座に対し複数の領域を検査することが可能である。
【0050】
これは、例えば非限定的な図6により示される。その図は複数のプローブがDNAサンプル上の複数の部位へ結合することを示し、利用者はそのサンプルにおける複数の病気の存在の解析を同時に行うことが可能である。その非限定的な図で示すように、その領域における特定のフラップが作成され、それから適切な標識により標識される場合、BCR−ABL領域で兆候が現れる特定の病気(病気1)は独特のバーコードまたはサインを示す。その領域における特定のフラップが作成され、標識される場合、疾患2は同様に独特なバーコードまたはサインを示す。その結果、利用者は同時に2若しくはそれ以上の疾患を解析する能力を持つこととなり、与えられた対象において複数の病気またはその他の状態の迅速な検出を可能にする。フラップを形成することにより、利用者はDNAサンプルの構造にアクセスポイントを獲得し、その結果、アクセスポイントをプローブの配列特異的な結合に用いることが可能である。
【0051】
本発明はまた、DNAサンプルのシークエンシングを行うのに利用することが可能である。そのような実施形態において、利用者はDNAに(DNA構造にアクセスポイントを提供する)フラップを形成させる可能性がある。その結果、利用者はDNAサンプルの一塩基配列ずつ、1つずつ、プローブに一塩基標識のプローブを導入することが可能である。たとえば、利用者はDNAの中にニックを導入することが可能であり、その結果Aに対する赤色プローブを導入することが可能である。その結果、赤色標識が認識可能な場合、利用者はAがニック部位に存在するという情報を得る。赤色標識が確認できない場合、利用者は異なるヌクレオチドに特異的な第2の標識プローブを導入することが可能である。
【0052】
別の実施形態において、利用者はまたDNAサンプルを断片に分断することが可能であり、断片の長さに従いニック/フラップを作成でき、その結果、断片上のニック/フラップにおいて塩基または配列特異的なプローブを導入することが可能である。その結果、各々の断片から収集した結果として生じる情報は、オリジナルの全長DNAサンプルの配列地図を作成するため、一緒にアッセンブル可能である。ニック/フラップは、DNAサンプルの特定の部位で、または、ランダムな部位で作成することが可能である。たとえば、利用者は20塩基の断片の塩基位置1および塩基位置11において10塩基のフラップ/ギャップを形成する可能性がある。その結果、利用者は(長さ10塩基までのプローブを含む)様々に一意的に標識された一意的に特異的プローブを断片へ導入することができる。どのプローブが断片に結合したかを(結合したプローブから決定した特定のシグナルに基づき)決定することにより、その結果、利用者は断片についての配列情報を得ることが可能となる。
【0053】
プローブは、フラップに、または特定の染色体の一本鎖DNAのギャップに結合するように設計される。染色体の過剰の存在、または少な過ぎるコピー数により異数性の診断を行うことが可能である。たとえば、特定の遺伝子または染色体でさえもその存在を証明する配列を標識するようプローブを設計することが可能である。その結果、対象における複数のプローブ(またはプローブの存在に関連した複数のバーコード)の存在は、対象が問題の遺伝子または染色体の複数コピーを有することを示すのに用いられることが可能である。
【0054】
別の実施形態において、本請求項の発明は、病原体ゲノムを同定する。病原体ゲノムはフラップ形成の間、予測された断片に適切に分断され、それからプローブ(例えば、いわゆるユニバーサルプローブ)はフラップの保存配列を検査するため用いられる。その結果、得られたバーコードパターンは、利用者が解析中のゲノムの構造を決定できるよう予測した参照地図と比較される。これは2層DNAバーコード化として知られており、DNA断片サイズおよび異なるサイズの各々の断片におけるバーコードの両方を考慮するものである。
【0055】
別の実施形態において、その手順は病原体ゲノムを同定するのに用いられる。病原体ゲノムは、フラップ形成の間、予測される断片に分断され、その結果、そのプローブはフラップ保存配列を検査するのに用いられる。
【0056】
得られたバーコードは、病原体ゲノムの新規のマッピングを得るため、それから予測された参照地図と比較される。これは異なるサイズの断片のDNA断片サイズおよびバーコードを結合させる2層DNAバーコード化スキームである。
【0057】
別の実施形態において、その手順は病原体ゲノムの同定を行うものである。既知の病原体ゲノム配列に基づき、利用者は病原体に特異的なフラップまたは一本鎖DNAのギャップのプローブを設計する可能性があり、異なる病原体に対する異なるバーコードをもたらし、利用者に様々な病原体または他の関心配列を示す様々なバーコードの「ライブラリー」を構築することを可能にする。これは非限定的な図7に示し、そのゲノム内における様々なセグメントの存在の解析のための乳がんゲノム由来のサンプルに対する様々な配列特異的なプローブの応用を示す。
【0058】
別の実施形態において、フラップまたは一本鎖DNAのギャップは、特定のゲノム領域を濃縮するのに用いることが可能である。たとえば、特定のフラップ配列を含んでいる特定の領域へのビオチン化プローブのハイブリダイゼーションにより、解析中の領域を固定させることが可能である。アビジン分子を含むビーズまたは基質と結合させることにより、ハイブリダイズしたDNA分子を選択する。結合した分子はさらにゲノム解析のために保持され、結合していないDNA分子は洗い流される。このように、利用者は解析および処理を容易にすべくDNAを固定することが可能である。フラップは、サンプルDNAおよびビーズまたは基質の間の付着点である可能性がある。他の実施形態において、フラップおよびビーズまたは基質の間とは対照的に、結合点が主要なdsDNAの塩基およびビーズまたは基質の間である可能性がある。
【0059】
別の実施形態において、非制限的な図11で示すように、フラップ配列または一本鎖DNAのギャップ配列上の一塩基突然変異はSNPまたはハプロタイプ情報収集のために得られる。図では、SNP1および2(それぞれ)のAおよびG対立遺伝子を示す。
【図面の簡単な説明】
【0060】
添付の図面と併せて以下の詳細な説明を読むと本発明の概要はさらに理解される。本発明を例証する目的で本発明の例示的な実施形態が図面に示されているが、本発明は開示された特定の方法、合成物、および装置に限定されるものではない。また、図面は必ずしも一定の縮尺で描かれていない。
【図1】図1は、ニッキング後の一本鎖フラップ形成により長いゲノム領域において「バーコード化」パターンのサインが形成される概略図を図示する。配列特異的ニッキングエンドヌクレアーゼまたはニッカーゼが二本鎖DNA上に一本鎖切断ギャップを形成し、同時に位置がずれたストランド、またはいわゆる「はがれたフラップ」を生成し、そこにポリメラーゼが結合し、ストランドの伸長を開始する。これらのはがれた一本鎖フラップは、同定可能なシグナルを生成させるため標識したプローブと配列特異的なハイブリダイゼーションに対し利用可能な領域を形成する。放射線(例えば、UV放射線)、フリーラジカルまたはその任意の組合せをサンプルに接触させることにより、ニッキングを生じさせることが可能である。
【0061】
図1はまた、測定可能である配列特異的フラップ上にハイブリダイズした修飾したプローブからのシグナル間の空間距離を用い、その領域に存在する特定のゲノム配列を反映する独特な「バーコード」サインパターンを形成するナノチャネルアレイ中で直線的に変性する標識ゲノムDNAを示す。ラムダdsDNA(48.5kbp全長)の複数のニッキング部位を、これらに限定されないがNb.BbvCI;Nb.BsmI;Nb.BsrDI;Nb.BtsI;Nt.AlwI;Nt.BbvCI;Nt.BspQI;Nt.BstNBI;Nt.CviPIIを含む酵素、およびその任意の組み合わせの特異的な酵素により形成された例として示す。蛍光性標識したオリゴヌクレオチドプローブが予測されるニッカーゼが形成する部位にハイブリダイズすることを示す直線化した一本鎖ラムダDNA画象もまた示す。長い生物高分子に従い記録されたそのような実際のバーコードは、いわゆる観察されたバーコードとして本明細書において示される。
【図2】図2はモデルシステムとしてラムダDNA分子の使用を図示し、異なる標識化スキームを実行したものである。図2aはニック標識を示し、図2bは2つのフラップ構造上にハイブリした特異的配列を有する蛍光プローブを示し、図2cは標識したニック部位、および標識したフラップ構造から放出されたシグナルを図示する。
【図3】図3は、Nb.BbVCIに基づく22番染色体全域におけるフラップ配列の50塩基対の6塩基スライディング解析を図示する。図示の通り、かなりの保存配列がフラップ配列上で観察された。複数のフラップ構造をターゲットとする1若しくはそれ以上のプローブを設計するのに、この保存配列は、順番に用いることが可能である。
【図4】図4は典型的なユニバーサルプローブ、TGAGGCAGGAGAATの使用法を図示し、BACクローン3f5の上で(計52箇所のニック部位のうち)21箇所のフラップ構造にハイブリダイズするようプローブが設計された。形成されるバーコード化パターンは予測したパターンとかなり対応し、全ゲノムマッピングを行うためそのようなユニバーサルプローブを使用することが可能であることを証明した。
【図5A】図5は、白血病の主要な原因である、いわゆるフィラデルフィア染色体を形成するBCRおよびABL1遺伝子翻訳の転座の臨床診断を図示する。このスキームでは、BCR遺伝子は複数のフラップにおいて緑色のプローブで標識され、ABL1遺伝子は複数のフラップにおいて赤色のプローブで標識されている。赤色および緑色のパターンが観察される場合、これら2つの遺伝子の転座の裏付けとなる。
【図5B】図5は、白血病の主要な原因である、いわゆるフィラデルフィア染色体を形成するBCRおよびABL1遺伝子翻訳の転座の臨床診断を図示する。このスキームでは、BCR遺伝子は複数のフラップにおいて緑色のプローブで標識され、ABL1遺伝子は複数のフラップにおいて赤色のプローブで標識されている。赤色および緑色のパターンが観察される場合、これら2つの遺伝子の転座の裏付けとなる。
【図6】図6は開示された多重診断法を示す略図である。各々の病気または遺伝子領域は独自のサインバーコードを形成し、バーコードは2つ(またはそれ以上の)色素を含む可能性がある。複数のバーコードを複数のフラップに置くことは、利用者に基本的に無制限のバーコード化能を提供する。
【図7】図7は構造変異の確認を示し、複数の構造的な再編成を有するBACクローン3f5がフラップマッピングにより確認された。
【図8】図8は、2層バーコード、断片サイズおよびフラップバーコード化でユニバーサルプローブを用いた病原体同定の略図である。
【図9】図9は、病原体特異的プローブを用いた病原体同定を図示する。プローブは病原体ゲノムの特定の領域またはターゲット特異的領域に設計され、標識した構造は固有のバーコードを形成する。この場合、例としてサルモネラ属領域の350000〜400000および1090000〜1130000が用いられた。大腸菌の領域もまた示される。
【図10】図10は、サンプル濃縮および診断の略図である。
【図11】図11は、フラップ構造に基づく分子ハプロタイピングを図示する。
【発明を実施するための形態】
【0062】
本明細書の開示の一部を成す添付の図面および実施例と伴に以下の詳細な説明を参照することより、本発明はより容易に理解されるであろう。本発明は本明細書において記載および/または示される特定の装置、方法、適用、条件、またはパラメータに限定されないものであり、本明細書で使用される用語は特定の実施形態をほんの一例として説明するためのものであり、請求項に係る発明に限定を加えることを意図したものでないことを理解すべきである。また、添付の特許請求の範囲を含む本明細書で使用される単数形「a」「an」および「the」は複数形を含み、特定の数値の言及はその文脈において明らかな別段の指示がない限り少なくともその特定の値を含む。本明細書で使用される「多数」という用語は2以上を意味する。値の範囲が表される場合、別の実施形態には1つの特定の値からおよび/または他の特定の値までが含まれる。同様に、値が先行詞「約」の使用により近似値として表される場合、別の実施形態において特定の値が設定されることは理解されるべきである。全ての範囲は包括的で組み合わせが可能である。
【0063】
本明細書において明確さのため別々の実施形態の関連で記載されている本発明の複数の特定の特徴はまた、単一の実施形態において組合せで提供されるかもしれない。反対に、簡潔さのため単一の実施形態の関連で記載されている本発明の様々な特徴はまた、単独でまたは部分的組合せで提供されるかもしれない。さらに、範囲で記載される値への言及はその範囲内のそれぞれ全ての値を含む。
【0064】
最初の実施形態において、本発明はDNAまたは他の核酸サンプルから構造情報を得る方法を提供する。これらの方法には、二本鎖DNAサンプルから置き換えられる二本鎖DNAサンプルの第一鎖のフラップを生じさせるため二本鎖DNAサンプルを処理することが適切に含まれる。フラップの適切な長さは約1〜約1000塩基、または5〜750塩基、または10〜200塩基、または50〜100塩基の範囲である。フラップの最適な長さは利用者の必要性に依存する。本明細書においてどこか他で説明されるように、フラップの形成はフラップの反対側のdsDNAで形成されている「ギャップ」において終了する。
【0065】
例えば図1で示すように、フラップの形成はフラップの位置と対応するdsDNAサンプルにおいてギャップを適切に生じさせる。このフラップ(およびギャップ)はその結果、増幅、プローブの付着、またはさらなる標識化のためdsDNAの一本鎖部分を曝露させるのに用いることが可能である。このように利用者は、解析のため生物高分子を個々の核酸に分断する必要がなく、DNAまたは他の核酸生物高分子サンプルの遺伝的解析を行う可能性がある。さらに本発明により利用者は、生物高分子内で核酸配列から基本的に独立している核酸生物高分子の分析を行うことが可能となる。
【0066】
これにより2若しくはそれ以上のプローブが位置したDNA領域の単なるサイズ/長さから遺伝情報を収集することが可能となる。たとえば、プローブが関心地域に位置するようにサンプルと結合し、対象において通常認められるより関心領域が長い(または認められるべきものより長い)場合、利用者は対象が伸長した関心領域により特徴づけられた生理的状態(例えば特定の遺伝子の過剰のコピー数により特徴づけられるような状態)または疾患であると処理される可能性があることを知ることとなる。
【0067】
1若しくはそれ以上の置換塩基はギャップを除去するように二本鎖DNAの第一鎖に適切に取り込まれ、その結果、生じた二本鎖サンプルの少なくとも一部が1若しくはそれ以上のタグで適切に標識される。タグは適切な蛍光標識、放射性標識などである。標識は高分子の長さに従いニックまたはフラップにおいて、またはこれらの部位の任意の組合せにおいて付加される可能性がある(例えば図2を参照)。同様に(例えば、プローブにより生じる)標識がdsDNAのギャップに導入される可能性がある。
【0068】
ニッキングは、1若しくはそれ以上の配列特異的な部位において適切に生じる。これはニッカーゼまたはニッキングエンドヌクレアーゼにより、または一本鎖切断を導入する任意の酵素により、電磁波(例えば、紫外線光)により、フリーラジカルなどによりなされる可能性がある。ニッキングはまた非配列特異的な部位においてもなされる可能性がある。そのようなフラップを作製するための酵素は、例えば、ニューイングランドバイオラボ、www.neb.com、から市販されている。
【0069】
前記置換塩基の組み込みはポリメラーゼ、1若しくはそれ以上のヌクレオチド、リガーゼまたはその任意の組合せにより二本鎖DNAの第一鎖に接触することでなされる可能性がある。これは、いくつかの実施形態において、1若しくはそれ以上の置換塩基の存在下において実行され、その塩基には検出可能なタグまたは標識が含まれる可能性がある。このように、利用者は順番に利用者にターゲット高分子に関する構造情報を与えるターゲット標識またはタグに取り込ませる可能性がある。
【0070】
当技術分野で知られていているように、フラップ構造の形成はポリメラーゼ伸長および1若しくはそれ以上のヌクレオチドの取り込みにより適切に調整される。ポリメラーゼは適切な5’−3’置換活性を有し、いくつかの実施形態において、5’−3’エキソヌクレアーゼ活性を欠く。適当なポリメラーゼには、これに限定されるものではないがベントエキソ−ポリメラーゼ(ニューイングランドバイオラボ、www.neb.com)が含まれる。
【0071】
ポリメラーゼおよびヌクレオチドは、フラップの長さを調整するために選択される可能性がある。反応温度および時間はまた、生じるフラップの長さを調整するため調整されることが可能である。フラップ長はまた、異なるヌクレオチドの存在の相対的な割合、すなわち、dATP、dCTP、dTTPおよびdGTPの比率により調整される可能性がある。ポリマーターミネーターに対するヌクレオチドの比率もまたフラップ長に影響を及ぼすことが可能である。ターミネーターには、ddNTPとおよびacylo−dNTPが含まれるがこれに限定されない。
【0072】
標識する工程は(a)少なくとも1つの相補的プローブが少なくともフラップの一部に結合し、プローブが適切に1若しくはそれ以上のタグ(例えばフルオロフォア)を有し、(b)2若しくはそれ以上の相補的プローブが互いに次のものとハイブリダイズし、共にライゲートされ、またはさらに(c)2若しくはそれ以上の相補的なプローブが互いに次のものとそれらの間で1若しくはそれ以上の塩基のギャップでハイブリダイズすることにより適切になされる。その結果、ギャップが標識、または非標識ヌクレオチドで満たされ、ヌクレオチドはリガーゼの働きにより結合されることが可能である。標識は結果として「ギャップ」となるフラップ、または、複数の部位において存在する可能性がある。
【0073】
DNAサンプルから構造情報を得る方法もまた提供される。これらの方法には二本鎖DNAサンプルの第二鎖の一本鎖DNAギャップを生じさせるため二本鎖DNAサンプルを処理することが含まれる。これは、例えばdsDNAのDNAサンプルからニッキング部位において消化される第一鎖DNAによりなされる可能性がある。ギャップの適切な長さは約1〜約1000塩基、または5〜750塩基、または10〜500塩基のような範囲である。利用者は少なくとも一部の一本鎖DNAのギャップに適切に標識することが可能である。
【0074】
本明細書においてどこか他で解説されるように、ニッキングは二本鎖DNA分子の第一鎖をニッキングすることによりなされる。ニッキングエンドヌクレアーゼNb.BbvCIは適当であると考えられる。他の適当なニッキングエンドヌクレアーゼはニューイングランドバイオラボ(www.neb.com)およびフェルメンタス(www.fermentas.com)を含む商業供給源から入手可能である。
【0075】
いくつかの実施形態において、ニックから下流のストランドは、例えばdUTP dA(C,G)TPで5’>3’エキソ+ポリメラーゼにより伸長される。ベントポリメラーゼはこのためのそのような適当な酵素の1つである。
【0076】
その後、DNAを例えばウラシルDNAグリコシラーゼで消化する。dUTPの除去により一本鎖DNAのギャップが生じる。
【0077】
いくつかの実施形態において、フラップはある程度、または、完全に取り除くことが可能である。結果として生じるギャップはフラップエンドヌクレアーゼで満たされ、一本鎖DNAのギャップ構造を生じさせる。伸長した配列は同じニッキングエンドヌクレアーゼにより再度ニッキングされ、配列は変性により除去される。
【0078】
標識する工程は(a)少なくとも1つの相補的プローブが少なくともフラップの一部に結合し、プローブが1若しくはそれ以上のタグ(例えばフルオロフォア)を有し、(b)2若しくはそれ以上の相補的プローブが互いに次のものとハイブリダイズし、共にライゲートされ、および/または、(c)2若しくはそれ以上の相補的なプローブが互いに次のものとそれらの間で1若しくはそれ以上の塩基のギャップでハイブリダイズすることにより適切になされる。その結果、ギャップが標識、または非標識ヌクレオチドで満たされ、ライゲースによりともにライゲートされる。
【0079】
本明細書においてどこか他で解説されるように、その結果、標識されたサンプルは引き延ばされる可能性がある。その伸長はエントロピー閉じ込め、流れまたは剪断力の応用、光学ピンセット、(例えばビーズのような磁気材料を含むサンプルにおける)磁力、などによりなされる可能性がある。
【0080】
DNAから構造情報を得る方法もまた提供される。これらの方法には第一の二本鎖DNAサンプルにおける、第一のサンプルの1若しくはそれ以上の配列特異的部位に標識する工程と、第二の二本鎖DNAサンプル上の対応する1又はそれ以上の配列特異的部位に標識する工程と、伸長した前記第1の二本鎖DNAサンプルの少なくとも1つの標識についての、シグナルの強度、シグナルの位置、又はその両方と、伸長した前記第2の二本鎖DNAサンプルの少なくとも1つの標識についての、シグナルの強度、シグナルの位置、又はその両方とを比較する工程とが含まれる。
【0081】
本発明のこの観点において、利用者は2つの(またはそれ以上の)サンプルのバーコードまたはプローブ結合プロファイルの比較を行う。これにより利用者が特定の状態を持つ(または欠如する)ことが既に知られているある個人由来のサンプルと2人目の個人由来のサンプルとの間で遺伝的プロファイルを比較することが可能となり、2人目の個人の疾患状態の決定を可能にする。たとえば、利用者は、ゲノム解析により検出することが可能な疾患(例えば、糖尿病)で陽性であることが知られている個人のプローブプロファイルとその疾患の検査を受けていないテスト個人のプロファイルを比較する可能性がある。2つのプロフィールが同一である場合(例えば、テスト個人が陽性対照個人と同じ「バーコード」を示す場合)、利用者はテスト個人が疾患に対し「陽性」であることの示唆的な情報を得ることとなる。
【0082】
本明細書において他で解説されているように、これはDNAサンプルの少なくとも1つに1若しくはそれ以上のプローブをハイブリダイズすることにより適切になされる。これは本明細書においてどこか他で記述されるフラップを用いた方法によりなされる可能性がある。
【0083】
本明細書においてどこか他で記述されるように、標識化は、(a)二本鎖DNAサンプルから分離した第一鎖のフラップを生じさせ、および(b)フラップと対応する二本鎖DNAサンプルの第一鎖におけるギャップを生じさせるため、二本鎖DNAサンプルの第一鎖をニッキングすることによりなされ、ギャップは二本鎖DNAサンプルの第一鎖でニッキングの部位およびフラップの接合部位により決定される。
【0084】
本方法は全ゲノムマッピングのため設計したプローブを適切に用い、プローブは全ゲノム全域のフラップ配列に保存されている。このように、1若しくはごく少数のプローブのみが何百または何万ものフラップ配列にハイブリダイズすることが可能であり、本配列またはこれらのフラップ全体で保存されている配列を利用する。ハイブリしたプローブは個々のDNA断片を同定するためにバーコードを適切に形成し、バーコードは特定の断片に特有である。プローブは配列特異的である。
【0085】
様々なスキームがゲノムマッピングに用いることが可能である。1実施形態において、フラップの標識化に加えニックの標識化(2若しくはそれ以上の色素)を用いることが可能である。別の実施形態において、1つのニッキング酵素および、2若しくはそれ以上の異なる色素を用い、2若しくはそれ以上のプローブによるフラップ標識を用いることが可能である。さらに別の実施形態において、フラップおよびニック標識化の様々な組合せにより2つの異なるニッキング酵素を用いることが可能である。
【0086】
DNAから構造情報を得る他の方法もまた提供される。これらの方法には2つの領域の間の空間関係を同定するため異なる色のプローブで(例えば2箇所以上の)異なるフラップの領域を標識化することが含まれる。あるいは、利用者は2つの領域の関係を同定するため異なる色のプローブおよび異なる数のプローブで異なる領域のフラップを標識する可能性がある。利用者はまた、異なる(または同様の)色をつけたプローブの異なる数で、異なる領域のフラップを標識する可能性があり、2若しくはそれ以上の領域の空間関係を同定するため、結果として生じる色素パターンを用いる可能性がある。異なるプローブで異なる領域のフラップ上において標識化がなされる可能性がある。プローブはまた特定の染色体を同定するため、特定の染色体をターゲットにする可能性がある。
【0087】
プローブは単一の疾患または異常の存在を検索するため配置することが可能である。プローブはまた、同時に複数の領域および複数の病気でさえ同定できるよう、多重様式で用いることが可能である。
【0088】
フラップまたはssDNAのギャップをプローブすることにより病原性ゲノム材料を同定する可能性がある。この同定には複数の領域の全域にわたり保存される配列と結合するユニバーサルプローブを使うことが適切に含まれ、ユニバーサルプローブは新規の病原体同定に使用可能である。1実施形態において、これはフラップ保存配列の検査に用いるユニバーサルプローブでフラップ形成の間、病原体ゲノムを予測した断片に切断することによりなされる。得られたバーコードは、それから病原体ゲノムの予測された参照地図と比較される。これは「2層」DNAバーコード化として知られており、DNA断片サイズおよびバーコード情報を結合するものである。
【0089】
図8はこの2層バーコード化の1つの実施例を図示する。その図に示すように、ユニバーサル(または他の)プローブは、フラップ、ニックまたは両方の部位でサンプル高分子と結合する。高分子は特定のサイズの断片に再分割することが可能であり、断片のサイズはサンプルに関するさらなる構造情報を収集するのに用いることが可能である。1つの非限定的な例として(その断片の終点を決定する元のサンプルの部位を知る)利用者は、元のサンプルの中で特定の断片のサイズをその断片の位置に関連させることが可能である。
【0090】
多重病原体同定のための病原体特異的プローブの使用もまた提供される。これは、異なるバーコードを有する異なる病原体において、病原体特異的なフラップのプローブを設計するため既知の病原体ゲノム配列を用いなされる。非限定的な図9で示すように、緑色−赤色−緑色−赤色プローブの順序での存在はサルモネラ属の存在を意味する。同じバーコードは、同じバクテリアの他の領域で解析することが可能である。本発明のこの観点では、利用者は病原体(例えば、バクテリア)特異的なバーコードを作出するのに順番に用いられる配列特異的プローブを用いることが可能である。
【0091】
その結果、そのようなバーコードを特定のサンプルにおいて病原体(または病原体のゲノムの一部でさえ)の存在を解析するのに使用することが可能となる。本明細書において解説されるように、利用者は1若しくはそれ以上のプローブが存在する領域に一意的なシグナルに基づき1若しくはそれ以上のプローブの位置を決定する可能性があり;1若しくはそれ以上の病原性の状態と対応することが知られているDNA領域から対応するシグナルに合わせDNAサンプルに結合する1若しくはそれ以上のプローブの位置、色またはその両方と比較する可能性がある。このように、利用者は対象が病原性の状態で苦しんでいるか(または、苦しむ傾向があるか)どうか決定することが可能である。
【0092】
別の観点において、本発明は特定のゲノム領域を濃縮する方法を提供する。これらの方法には、特定のフラップ配列を含む1若しくはそれ以上の領域へのアンカー支持プローブのハイブリダイゼーションが含まれる。(そのようなプローブの適当なものの1つとしてビオチン化プローブがある。)ハイブリダイズしたDNA分子は、アビジンのようなリンカー分子を有するビーズまたはガラス表面に結合することが可能である。結合していないDNA分子は洗い流され、結合した分子はそれから更なる解析、イメージング、などに利用される。別の実施形態において、磁気ビーズはDNAサンプルに結合または付け加えられる可能性があり、その結果、サンプルを固定するため基質にサンプルをひきつける。
【0093】
図10は本発明技術の非限定的な実施形態である。その図に示すように、プローブは、DNAサンプル上で形成されたフラップに結合する可能性があり、同様にフラップの形成により取り残されるギャップに挿入される可能性がある。ビオチン化プローブはフラップを基質に固定する。その図に示される例において、赤色および緑色のプローブの出現は、BCR−ABL融合の存在を意味する。緑色プローブのみが現れた場合、ABLのみが確認できる。赤色プローブのみが認められた場合、BCRのみが存在する。分子ハプロタイピングはまた、フラップ配列および一本鎖DNAのギャップ配列上で一塩基突然変異を調査することによりなされることが可能である。
【0094】
光学的および非光学的シグナル解析の超並列様式でそのような標識した高分子を選別し、直線的に変性するのに適切なシステムもまた提供される。例示的な実施形態において、これらのシステムには、DNA、RNAまたは他のサンプル材料が本明細書において記述されるニッキング、フラップ形成、標識化および他のステップを経る1若しくはそれ以上の反応帯域が含まれる。そのような場所は、チューブ、フラスコまたは他の一般的に利用される研究器具のような反応容器である可能性がある。あるいは、(本明細書においてどこか他で解説されるように)利用者が高分子についての構造情報の収集を可能にするため高分子を引き伸ばすために用いるナノチャネルまたはナノチャネルアレイによる流体連結における反応帯域において、これらのステップの1若しくはそれ以上が実行される可能性がある。伸長は物理的/エントロピー閉じ込め、流体剪断流、地理的力(光学ピンセット)、などによりなされる可能性がある。適切なナノチャネルチップおよびアレイは米国出願10/484,293において記述され、それの全ては参照することにより本明細書に組み込まれる。
【0095】
標識したサンプルについての視覚情報を収集するため、本システムには撮像装置のような装置が含まれる可能がある。1実施形態において、撮像装置は、請求した本発明に従い処理される高分子に存在する可能性がある標識を励起させるため用いられる放射線(例えば、光、レーザー、など)の1若しくはそれ以上の源から成る。撮像装置にはCCD装置または他の画像収集ハードウェアが適切に含まれる。画象は利用者により調査される、または処理される可能性があり、本システムによりさらに解析がなされる。そのような更なる処理には、モデルを用い標識した高分子から得た画象、または他のサンプル材料の、または、解析するサンプルと比較可能である材料の解析により作出した予測画象の比較のみならず、標識した高分子から得た原画像の改良が含まれる可能性がある。疾患の状態、健康状態または他の遺伝的変異を示す解析中の核酸生物高分子からとられる画象および対照群の画象との間で比較を行う可能性がある。その比較はコンピュータによりなされる(または補助される)可能性がある。
【0096】
さらなる開示
本応用は、長いゲノムDNAを形成する方法、配列特異的なタグを付ける方法および個々のDNA分子を直接イメージングすること、およびナノチャネル(適切な実施形態において、直径<500nm)の内側の単一DNA分子における複数の配列モチーフまたは多型部位の位置に基づいたDNAをバーコード化する方法を含むDNAマッピングおよびシークエンシングに関する方法を示す。DNAマップに関する範囲内において、これらの方法は連続する塩基ごとの配列情報を得るものである。
【0097】
従来の方法と比較し、開示されたDNAマッピング方法は、改善された標識化効率、より安定した標識化、高感度およびより良い解像度を提供する。開示されたDNAシークエンシング法は長い鋳型の塩基の解読を提供し、アッセンブルを容易にし、ハプロタイプおよび構造変異のような他のシークエンシング技術からは入手不可能な情報を提供する。
【0098】
DNAマッピングの応用として、個々のゲノムDNA分子または長距離PCR断片を特定の配列モチーフにおいて蛍光色素で標識した。標識されたDNA分子はそれからナノチャネルの中で直線状に伸長し、蛍光顕微鏡検査を用い画像化した。DNA骨格に対し蛍光標識の局在および色素を決定することにより、バーコードを読み込む同様の方法で、配列モチーフの配布を正確に構築することが可能である。このDNAをバーコード化する方法は、例えば、ラムダファージDNA分子およびヒトのbacクローンの同定において用いられる。
【0099】
配列特異的ニッキング部位におけるフラップ配列による1つのサンプルの実施形態は、
a)特異的配列モチーフにニックを導入するニッキングエンドヌクレアーゼによる長い(例えば、>2Kb)二本鎖ゲノムDNA分子の1つの鎖をニッキングする工程と、
b)DNAポリメラーゼによるニックにおける蛍光色素標識したヌクレオチドまたは非蛍光色素標識のヌクレオチドを取り込む工程、およびフラップ配列を生成するため下流鎖を置き換える工程と、
c)標識したヌクレオチドのポリメラーゼ取り込み、または蛍光プローブの直接のハイブリダイゼーション、またはリガーゼによる蛍光プローブのライゲーションによるフラップ配列を標識化する工程と、
d)チャネルを通じてサンプルを流すことにより、またはチャネル内でDNAの片方の末端を固定することにより、ナノチャネル中で直線的に標識DNA分子を伸長させる工程と、
e)DNAのマップまたはサインバーコードを得るため蛍光顕微鏡検査を用いてDNA骨格における蛍光標識の位置を測定する工程とを含む。
【0100】
配列特異的ニッキング部位におけるssDNAギャップを有するもう別の実施形態は、
a)特異的配列モチーフにニックを導入するニッキングエンドヌクレアーゼによる長い(例えば、>2Kb)二本鎖ゲノムDNA分子の1つの鎖をニッキングする工程と、
b)DNAポリメラーゼによるニックにおける蛍光色素標識したヌクレオチドまたは非蛍光色素標識のヌクレオチドを取り込む工程、およびフラップ配列を生成するため下流ストランドを置き換える工程と、
c)新たに伸長した鎖にニックを入れるため同一のニッキングエンドヌクレアーゼを使用する工程、およびフラップエンドヌクレアーゼで新たに生成したフラップ配列を切断する工程と(分離したssDNAは温度を上げることにより除去可能である)、
d)標識したヌクレオチドのポリメラーゼ取り込み、または蛍光プローブの直接のハイブリダイゼーション、またはリガーゼによる蛍光プローブのライゲーションによるssDNAギャップを標識する工程と、
e)チャネルを通じて流すか、またはチャネル内でDNAの片方の末端を固定させて、ナノチャネル中で直線的に標識DNA分子を伸長させる工程と、
f)DNAのマップまたはバーコードを得るため蛍光顕微鏡検査を用いてDNA骨格における蛍光標識の位置を測定する工程とを含む。
【0101】
フラップと一本鎖DNAのギャップのもう1つの応用は全ゲノムマッピングである。(これに限定されるものではないがNb.BbVCIを含む)ニッキングエンドヌクレアーゼにより形成した全ゲノムDNAのフラップおよび/またはssDNAのギャップ配列を解析し、サンプルの複数の領域の全域、または、複数のサンプル全体で保存された(すなわち、目下の)配列に基づき、ハイブイダイゼーションプローブを設計した。Cy3−TGAGGCAGGAGAAT−Cy3のような、単一または少数(4つ未満のプローブ)を使用することが可能である。(本明細書においてどこか他で解説されるように)ナノチャネルで標識したDNA分子は線形化され、DNAバーコードを産生する。
【0102】
図3は、保存領域に結合し位置する、いわゆるユニバーサルプローブの使用を示す例示的な実施形態である。その図に示すように、所定のサンプル高分子の長さに従い、保存配列をターゲットとし、位置させるのにプローブ(この場合、プローブは図らずも比較的高いGC含量を持つ)を用いることが可能である。ユニバーサルプローブの使用は図4にさらに図示され、図はサンプル高分子の長さに従って多数の部位と結合する単一のユニバーサルプローブの使用を図示する。
【0103】
フラップおよび/またはssDNAギャップの使用の別の実施形態は、構造変異に起因する疾患の検出である。そのような病気の1つの例はそれが白血病の主要な原因となるBCR−ABL遺伝子融合である。この場合、(図5および6で示すように)緑色フルオロフォア標識したプローブはフラップ上、または、BCR遺伝子の一本鎖DNAのギャップにハイブリダイズし、赤色フルオロフォア標識したプローブはフラップ上、または、ABL遺伝子の一本鎖DNAのギャップにハイブリダイズする。緑色赤色の2色素が同じDNA分子上で観察される場合、BCR−ABL融合遺伝子の存在の裏付けとなる。
【0104】
上記の病気診断の別の実施形態はゲノムの4つの異なる領域由来の4つセグメントの再編成から成るジンクフィンガー乳がん診断マーカーのような2つ以上の領域の再編成を伴うものである。
【0105】
別の実施形態において、より多くの色素の組み合せ、または、より複雑なフラップまたはssDNAギャップの空間バーコードまたは両方の色素、および複合的な検出フォーマットであるフラップおよびssDNAのギャップ色素の空間分布を用い、2若しくはそれ以上の病気を調査することが可能である。
【0106】
別の実施形態において、その手順は病原体ゲノムを同定するのに用いられるものである。ゲノムは(Nb.BbVCI、Nb.BsmIなどを含むがこれに限定されるものではない)ニッキングエンドヌクレアーゼにより、二本鎖DNA分子の第一鎖において、適切にニッキングされる。2箇所のニッキング部位は100bp以内の逆のストランドにおいて適切に存在し、ストランドはフラップ形成によりに適切に切断される。切断パターンは特定の病原体ゲノムに特異的であり、パターンはバーコード情報の第一層として使用されることが可能である。
【0107】
その結果、断片の各々のサブセットはフラップ上の蛍光プローブ、またはユニバーサルプライマーを用いたssDNAのギャップにより標識することが可能である。その結果、断片サイズおよび内部色素バーコードの組合せが病原体ゲノムを同定する。たとえば、エルシニア属バクテリアはこのようにして同定することが可能である。
【0108】
別の実施形態において、既知の病原体ゲノム配列に基づき、病原体の存在を確認するため、病原体ゲノムの特定の領域を選択することが可能である。この場合、病原体特異的フラップまたは一本鎖DNAのギャップのプローブを設計することが可能であり、異なる病原体に対し特異的なパターンを生じる。たとえば、350000〜400000bpの部位(50kbの領域)のサルモネラ属細菌のゲノムは、Nb.BbVCIによりニック−フラップ標識され、ゲノムをバーコード化するプローブと関連する。特異性を増すため、更にそのような領域、1000000〜1500000bpまでの50kbのような領域が用いられる。病原体ゲノムの混合物は同様にして同定することが可能である。
【0109】
別の実施形態において、フラップまたは一本鎖DNAのギャップを特定のゲノム領域を濃縮するのに使用することが可能である。これらの実施形態において、利用者は特定のフラップ配列を含む特定の領域にビオチン化プローブのハイブリダイゼーションをもたらす。それからハイブリダイズしたDNA分子をアビジン分子を含むビーズまたはガラス表面にそれらを結合させることにより選択する。結合した分子はさらにゲノム解析のため保持される。結合していないDNA分子は洗い流され、固定されたサンプルに対し更なる解析を行う。
【0110】
実施例
以下の実施例は例証のみを目的とするものであり、必ずしも請求項に係る本発明の範囲を限定するものでない。
【0111】
実施例:二本鎖DNA分子における一本鎖DNAフラップの産生。
【0112】
ゲノムDNAサンプルをニック反応に使用するため50ngまで希釈した。ラムダDNA(50ng/uL)の10uLを0.2mLのPCR遠心分離チューブに添加し、続いて10XNEBバッファー#2を2uL、およびこれに限定されるものではないがNb.BbvCI;Nb.BsmI;Nb.BsrDI;Nb.BtsI;Nt.AlwI;Nt.BbvCI;Nt.BspQI;Nt.BstNBI;Nt.CviPIIを含むニッキングエンドヌクレアーゼを3uL添加した。混合液を1時間37度でインキュベートした。
【0113】
ニッキング反応が完了した後、本実施例では3’下流のストランドを置き換え、一本鎖フラップを生成するため、ニッキング部位に限定したポリメラーゼ伸長を続いて行った。フラップ形成反応混合物は、15ulのニッキング産物、および10Xバッファーを2ul、これに限定されるものではないがベント(エキソ−)、BstおよびPhi29ポリメラーゼを含むポリメラーゼを0.5ul、および1uMから1mMまでの様々な濃度でヌクレオチドを1ul含む組み込み混合物5ulから成る。フラップ形成反応混合液を55度でインキュベートした。フラップの長さはインキュベート時間、使用するポリメラーゼ、および使用するヌクレオチドの量で調整した。
【0114】
実施例:二本鎖DNA分子における蛍光性標識した配列特異的ニック。
【0115】
ゲノムDNAサンプルをニック反応に使用するため50ngまで希釈した。ラムダDNA(50ng/uL)の10uLを0.2mLのPCR遠心分離チューブに添加し、続いて10XNEBバッファー#2を2uL、およびこれに限定されるものではないがNb.BbvCI;Nb.BsmI;Nb.BsrDI;Nb.BtsI;Nt.AlwI;Nt.BbvCI;Nt.BspQI;Nt.BstNBIおよびNt.CviPIIを含むニッキングエンドヌクレアーゼを3uL添加した。混合液を1時間37度でインキュベートした。
【0116】
ニッキング反応が完了した後、本実施例ではニッキング部位に染料ヌクレオチドを取り込むためポリメラーゼ伸長を続いて行った。1実施形態において、単一の蛍光ヌクレオチドターミネーターが取り込まれる。別の実施形態では、複数の蛍光ヌクレオチドが取りこまれる。組み込み混合物は、15ulのニッキング産物、および10Xバッファーを2ul、これに限定されるものではないがベント(エキソ−)を含むポリメラーゼを0.5ul、蛍光色素ヌクレオチドまたは これに限定されるものではないがcy3を含むヌクレオチドターミネーター、アレクサ標識したヌクレオチドを1ul含む組み込み混入混合物5ulから成る。組み込み混合液を55度で30分間インキュベートした。
【0117】
実施例:二本鎖DNA分子上のニッキング部位および一本DNAフラップの2色標識化。
【0118】
ニッキング部位を1色フルオロフォアにより標識する。本反応は、フラップを形成するため250nMの非標識のヌクレオチドdNTPで追跡した。一旦フラップ配列が形成されると、フラップは異なる色の蛍光色素分子により標識される。これは、例えばプローブのハイブリダイゼーション、ポリメラーゼによる蛍光ヌクレオチドの取り込みおよび蛍光プローブのライゲーションによりなされる。
【0119】
実施例:単一プローブTGAGGCAGGAGAATによる全ゲノムマッピング。
【0120】
ゲノムDNAサンプルをニック反応に使用するため50ngまで希釈した。ラムダDNA(50ng/uL)の10uLを0.2mLのPCR遠心分離チューブに添加し、続いて10XNEBバッファー#2を2uL、およびこれに限定されるものではないがNb.BbvCI;Nb.BsmI;Nb.BsrDI;Nb.BtsI;Nt.AlwI;Nt.BbvCI;Nt.BspQI;Nt.BstNBIおよびNt.CviPIIを含むニッキングエンドヌクレアーゼを3uL添加した。混合液を1時間37度でインキュベートした。
【0121】
ニッキング反応が完了した後、本実施例では3’下流のストランドを置き換え、一本鎖フラップを生成するため、ニッキング部位に限定したポリメラーゼ伸長を続いて行った。フラップ形成反応混合物は、15ulのニッキング産物、および10Xバッファーを2ul、これに限定されるものではないがベント(エキソ−)を含むポリメラーゼを0.5ul、および1uMから1mMまでの様々な濃度でヌクレオチドを1ul含む組み込み混合物5ulから成る。フラップ形成反応混合液を55度でインキュベートした。フラップの長さはインキュベート時間、使用するポリメラーゼ、および使用するヌクレオチドの量で調整した。その結果、形成したフラップはハイブリダイズし、Nb.BbVCIに対するTGAGGCAGGAGAATのようなユニバーサルプローブで標識された。
【0122】
実施例:乳がんゲノム由来のMCF−7 3F5 BACクローンの再編成した構造の構造変異の確認。
【0123】
この領域は4つのセグメントから成る:3p14.1、14.1Kbブロックの逆位;20q12、PTPRT遺伝子のエクソン6を含む22.3Kbブロックの逆位;20p13.31、全プロモーター領域を伴う切断BMP7遺伝子のエクソン1を含む45.5Kbブロック;20p13.2、ZNF217遺伝子完全長を含む23.4Kbブロック。フラップにハイブリダイズする領域特異的なプローブが4つの領域、20q12に対するTGCCACCTACCCCT、20p13.31に対するAGAAGCCTGTCAGATGCAT、20p13.2に対するACTGTAGTCTTGAATTCCTGAおよび3p14.1に対するTCCTTGGTTGACCTAACAACACAの存在を確認するのに用いられる。
【0124】
実施例:検出スキーム
検出スキームの1つの例として、流しモードで移動するDNAのビデオ画象を時間遅延積分方式(TDI)カメラによりキャプチャーする。そのような実施形態において、DNAの挙動はTDIと同期する。
【0125】
検出スキームのもう1つの例として、流しモードで移動するDNAのビデオ画象をCCDまたはCMOSカメラによりキャプチャーし、映像をDNAの画象を同定し再構築するためソフトウェアまたはハードウェアに収集する。
【0126】
検出スキームのもう1つの例として、センサーの別々のセットで異なる波長を同時に捕えることにより、DNAのビデオ画象の収集を行う。これは、1台のカメラおよびデュアルまたはマルチビュースプリッターを用い、または、フィルタおよび複数のカメラを用い行うことが可能である。カメラは、TDI、CCDまたはCMOS検出システムである。
【0127】
別の実施例においては、同時複数の波長ビデオ検出を用い、基幹染料を一意的なDNA断片を同定するのに使用し、標識をDNAの挙動を追跡するマーカーとして使用する。これはDNAの長さがカメラの視野より大きい場合に有用であり、マーカーはDNA画象を再構築し図にするのに役立つ。
【技術分野】
【0001】
本出願は、2009年10月21日出願の米国出願第61/253,639号「Methods and Devices for Single Molecule Whole Genome Analysis」に対して優先権を主張するものであり、前記出願の全体が参照により本明細書中に援用される。
【0002】
本発明は、ナノテクノロジーの分野及び単一分子ゲノム解析の分野に関するものである。
【背景技術】
【0003】
DNAやRNAのような高分子は、ヌクレオチドを有する長い重合鎖であり、その直鎖状の配列は、採取元の生物のゲノム的及びポストゲノム的な遺伝子発現情報に、直接的に関連している。
【0004】
配列領域、モチーフ、及びオープンリーディングフレーム(ORFs:open reading frames)、非翻訳領域(UTRs:untranslated regions)、タンパク質因子結合領域、CpGクラスターなどのエピゲノム領域、マイクロRNA領域、トランスポゾン、逆トランスポゾン、並びにその他の構造的及び機能的なユニットのような機能ユニットの、直接的なシークエンシング及びマッピングは、個々人のゲノム構成及び「健康プロファイル」を評価するのに重要である。
【0005】
ある場合には、個人の寿命の間に起きる、部分重複、挿入、欠失、逆位、及び転座を含めた、ヌクレオチド配列の複雑な再構成が、遺伝子異常又は細胞腫瘍を含めた疾患状態に繋がる。別の場合では、別々の個人における遺伝子構造間の、配列の違い、コピー数多型(CNVs:copy number variations)、及びその他の違いが、集団における遺伝子構造の多様性、並びに環境的な刺激及び薬剤治療などのその他の外部的な刺激に対する反応差を反映する。
【0006】
DNAメチル化、ヒストン修飾、クロマチン折畳み、及びその他のDNA−DNA、DNA−RNA又はDNA−タンパク質間の相互作用を改変する変化のような、その他の進行中のプロセスは、遺伝子の調節、発現、及び最終的には細胞機能に影響し、その結果疾患及びガンを生じる。
【0007】
ゲノムの構造多型(SVs:structural variations)は、非常に一般的であり、健康的な個人間でも見られるものである。遺伝子配列情報の理解がヒトの健康にとって重要であることが、ますます明らかになってきている。
【0008】
核型分析、蛍光インサイツハイブリダイゼーション法(FISH:Fluorescent in situ Hybridization)などの、従来の細胞遺伝学的な方法は、わずか1個の細胞におけるゲノム構成の全体的視点を提供するものである。こうした方法は、数千及び数百万塩基対の大きな断片の、異数性、増加、減少、又は再構成などの、ゲノムの総体的変化を明らかにするものである。しかしながら、こうした方法は、小から中程度の大きさの断片のモチーフ又は損傷の検出に対しては比較的低い感度及び解像度であること、並びに煩雑であること、速度に制限があること、及び精度に一貫性が無いことを、欠点としている。
【0009】
アレイ比較ゲノムハイブリダイゼーション法(aCGH:array Comparative Genomic Hybridization)、ファイバーFISH、又は大量ペアエンドシークエンシングなどの、配列の領域、対象の配列モチーフ、及び構造的多型を検出するより新しい方法は、改善された解像度とスループットを有している。こうしたより新しい方法であってもなお、間接的であるか、煩雑で一貫性が無いか、高価であるか、のいずれかの欠点があり、また多くの場合、制限のある固定の解像度を持ち、参照ゲノムへのマッピングによる再アセンブリに依存した推測上の位置情報か、逆位又は転座などの差引きの無い損傷イベントについては明らかにしない比較強度比か、のいずれかを提供するものである。
【0010】
機能ユニット及び一般的な構造多型は、数十塩基からメガベース以上を含んでいると考えられている。したがって、大きな未変性のゲノム分子に沿って、キロベース下の(つまり、長さが約1キロベースより小さい)解像度スケールからメガベースの解像度スケールにわたって、配列情報及び構造多型を明らかにする方法は、過去に特性決定されていないゲノムの特徴をカタログ化するための、シークエンシング及び高解像度マッピングのプロジェクトにとって、非常に望ましいものであろう。
【0011】
さらに、特にヒトのような倍数体生物において、生体系の表現型多型又は疾患状態は、母系及び父系の血統から受け継いだ、2つの一倍体ゲノム間の相互作用の結果である。ガンは多くの場合、二倍体の染色体の損傷間においてヘテロ接合性が消失した結果である。
【0012】
現行のシークエンシング解析のアプローチは、限定されたハプロタイプ情報を持つ平均化された倍数体のゲノム材料に由来するサンプルに大きく基づくものである。これは、不均質な細胞集団から混合した二倍体のゲノム材料を抽出し、次いでそれらをランダムな小断片へと細かく切断するために現在使用されている、現行のフロントエンドのサンプル調製法によるものである。しかしながらこのアプローチは、前記二倍体ゲノムの未変性の構造情報を破壊してしまう。
【0013】
最近開発されている第二世代のシークエンシング法は、スループットは改善されているが、複数の非常に短いシークエンシング読取り値からより難しいアセンブリを行うために、複雑なゲノム情報の描出をさらに複雑化している。
【0014】
一般的に、短い読取り値は、複雑なゲノム中に一意に位置合わせすることがより難しく、短い標的領域の線形順序を解読するためには、追加の配列情報が必要となる。従来のBACシークエンシング法及びショットガン・サンガーシークエンシング法において必要な8〜10倍のカバー率ではなく、同様のアセンブリ信頼度に達するためには、25倍のオーダーの配列カバー率が必要とされる(Wendl MC,Wilson RK Aspects of coverage in medical DNA sequencing,BMC Bio informatics 2008 May 16;9:239)。この事実は、シークエンシングのコスト削減にさらなる難題を課しており、シークエンシングのコストを目標の1000ドルより低く抑えるまでに、大幅に削減するという当初の第一目標を挫くものである。
【0015】
巨大な無傷のゲノム分子についての単一分子レベルの解析は、クローン化又は増幅の過程無しに配列モチーフをインサイツで精密にマッピングすることによって、正確な未変性のゲノム構造を保存できる可能性を与える。ゲノム断片が大きくなればなるほどに、ゲノム分析物中のサンプル集団はより複雑でなくなる。理想的な筋書においては、ヒトの倍数体ゲノム全体をカバーするのに46の染色体断片のみの単一細胞レベルでの解析が必要となり、そうしたアプローチによって導き出された配列はその性質上、無傷のハプロタイプ情報を有する。
【0016】
実質的なレベルでは、メガベースのゲノム断片が細胞から抽出され、直接的な解析のために保存されうる。このことは、複雑なアルゴリズムとアセンブリの重荷を減らし、また、元の文脈中のゲノム及び/又はエピゲノムの情報と、個々の細胞表現型とを、より直接的に相互に関連付けるであろう。
【0017】
ゲノムDNAのような高分子は、多くの場合、半柔軟性でミミズ状の重合鎖の形をとる。これらの高分子は通常、自由溶液中でランダムコイル構造を持つことが想定される。生物学的溶液中の無改変のdsDNAにおいて、その持続長(剛性を定義するパラメーター)は、一般的に約50nmである。
【0018】
大きく無傷な高分子に沿って顕著な特徴を一貫して分離し、定量的な測定を達成するための一つのアプローチは、そうした重合分子を、平坦な表面か、化学的若しくは位相的に予め定義された表面パターンか、好ましくは長いナノトラックか、又は閉鎖型マイクロ/ナノチャネルかのいずれかの上に、一貫した直線形に引き伸ばすことである。
【0019】
光ピンセット、気液界面の対流(liquid−air boundary convective flows)(コーミング)、又は層流の液体力学的流動(laminar fluidic hydrodynamic flow)のような外力を用いることで、長いゲノム分子を引き伸ばし伸長させる方法が、実証されている。
【0020】
分子の伸長した形は、前記外力が維持されている限り一時的に安定化されるか、又は表面に付着させ静電的若しくは化学的な処理による改変を通して増強することで、より恒久的に安定化されるであろう。マイクロ/ナノチャネル内における実証済みの重合高分子の伸長は、物理的なエントロピー拘束によって実証されている(Cao etal.,Applied Phys.Lett.2002a、Cao et al Applied Phys.Lett.2002b、米国特許出願第10/484,293号公報を参照のこと;参照によってこれら全体が本明細書に援用される)。
【0021】
約100nmの直径を持つナノチャネルが、dsDNAゲノム断片を数百キロベースからメガベースまでに直線化することが示されている(Tegenfeldt et al.,Proc.Natl.Acad.Sci.2004)。ナノ流体力学によって伸長された半柔軟性の標的分子は、イオン濃度又はpH値が生物学的範囲内にある緩衝液状態中に懸濁することができ、したがって、こうした分子に対して生物学的機能アッセイを実施することはより受け入れやすいことである。この伸長の形式はまた、正確な制御のもとで高い速度から完全に静止した状態までの範囲を取る電界又は圧力の勾配中に、荷電した核酸分子を移動させるような操作にとって、比較的容易である。
【0022】
さらに、ナノスケール環境における流体流動の性質は、乱流及びそれ以外に長いDNA分子を断片化する可能性のある剪断力の多くを除外する。これは、巨大分子の直線解析にとって、特にssDNAが使われうるシークエンシングの適用先においてとりわけ有益である。最終的には、効果的な読取り長は、維持することができた最も長い無傷の断片と同じ長さにしかできない。
【0023】
ゲノミクスに加えて、エピゲノミクスの分野も、ガンなどのヒトの疾患において、その役割に目覚しい重要性があることが理解されている。ゲノミクスとエピゲノミクスの両分野における知識の蓄積により、主要な挑戦は、どのようにゲノムとエピゲノムの因子が、ヒトの疾患及び悪性病変における多型性又は病態生理学的状態に、直接的又は間接的に相関するのかということを理解することとなっている。
【0024】
全ゲノム解析の概念は、ゲノムシークエンシング、エピジェネティックなメチル化解析、及び機能的ゲノミクスの分野が、別個に深く研究されるという、区分化されたアプローチから、より多面的な全体論的なアプローチまで進化してきた。DNAシークエンシング、構造多型マッピング、CpGアイランドメチル化パターン、ヒストン修飾、ヌクレオソオーム再構築、マイクロRNA機能、及び転写プロファイリングは、より系統的な方法で観察された。しかしながら、細胞の分子状態の上記観点のそれぞれを調べる技術は多くの場合独立しており、退屈で互換性がなく、このことが互いに干渉する実験データ結果を必要とするシステム生物学の解析をひどく複雑化してしまう。
【0025】
巨大な無傷で未変性の生物学的サンプルは、配列の構造多型を、異常なメチル化パターン、マイクロRNAサイレンシング部位、及びその他の機能的分子の情報に、重ね合わせる工程のような、正しく重要で有益な解析方法を用いることで、標的サンプルのゲノム情報及びエピゲノム情報を研究する可能性を提供できる。(例えば、国際特許出願PCT/US2003/0022444号を参照のこと。参照によってこれら全体が本明細書に援用される。)オーダーメイド医療における細胞の分子機能及び疾患の形成メカニズムを理解するのに、非常に強力な道具を提供するであろう。
【発明の概要】
【課題を解決するための手段】
【0026】
本発明は、一態様において、直線状の生体高分子のような、少なくとも1つの巨大分子に沿って、顕著な特徴を標識し解析する方法に関するものである。前記方法は、幾つかの実施形態において、特定の配列モチーフ(つまり、パターン、テーマ)の分布及び頻度、或いは、そうした配列モチーフの化学的又はプロテオミクス的な改変状態を、個々の非折畳み状態の核酸分子に沿って、その長さ及び前記モチーフの配列に依存して、マッピングする方法に関するものである。
【0027】
また、標識した巨大分子を選別し直線状に展開する工程に適した、流体チップ及びシステムが、開示される。これらのチップ及びシステムは、光学的及び非光学的なシグナル解析を並列に行うことが可能なものである。
【0028】
本発明の別態様は、DNA主鎖に沿って短い配列モチーフの分布をマッピングすることによって、二本鎖DNA分子を同定するものである。これは、配列モチーフ間の高い空間解像度を提供する。この高解像度マップに基づいて、シークエンシング反応をそれぞれの配列特異的モチーフの位置において初期化し、時間をかけて繰り返して既知の空間的位置における複数の塩基情報を得た。これを、STS、又は空間的時間的シークエンシングと呼ぶことができる。本発明はまた、そうした標識化のプロセス及び特徴の使用に関わるものである。
【0029】
一実施形態において、二本鎖DNA上の顕著な特定の配列モチーフは、DNA一本鎖にニッキングして、ギャップを形成することによって(これは酵素によって行われてもよい)作成されるものである。利用者は、次いで鎖伸長のためにポリメラーゼを適用し、同時に「フラップ」と呼ばれる「剥離した」短い配列断片を生成することができる。これらの剥離した一本鎖のフラップは、標識プローブを用いた配列特異的なハイブリダイゼーションに利用可能な領域を生成するものである。幾つかの実施形態において、塩基(標識された塩基又は標識されたプローブを含む)が、剥離した前記フラップに結合する。別の実施形態において、前記フラップが形成された鎖に残された「ギャップ」の少なくとも一部を充填するために、塩基(又はプローブ)が結合する。これらの実施形態において、このギャップ充填塩基又はプローブは、前記ギャップを充填する役目を果たし、その結果前記フラップは「自由」な状態になり、その元の位置に戻ることがなくなる。標識した塩基又はプローブは、前記フラップ及びフラップの形成によって残された前記ギャップに、結合することができる。
【0030】
こうした標識には、フルオレセインなどのような、蛍光色素分子が含まれる。蛍光物質の非網羅的リストは、www.abcacm.comにおいて利用可能であり、適切な蛍光分子はまた、本技術分野の当業者にとって既知のものであろう。標識は、磁性体、放射性物質、量子ドットなどが含まれてもよい。
【0031】
標識したゲノムDNAが、支持表面上又はナノチャネルアレイ内において直線状に伸長するとき、フラップに特異的な配列にハイブリダイズした修飾プローブからのシグナル間の空間距離を、定量的に計測することが出来る(一貫性のある方法で)。この情報を、次いで、その領域の特定のゲノム配列情報を反映する、一意的な「バーコード」のサインパターンを生成するために使用してもよい。標的分子上のニッキングされたギャップは、Nb.BbvCI、Nb.BsmI、Nb.BsrDI、Nb.BtsI、Nt.AlwI、Nt.BbvCI、Nt.BspQI、Nt.BstNBI、Nt.CviPII、及びこれらの組合せを含むがこれらに限定されない特定の酵素によって、適切に作成されるものである。このマップに基づいて、シークエンシングを行うことができる。
【0032】
非限定的な実施例として、バーコードを以下のように作成することができる。ある既知の疾患状態は、固有のヌクレオチド配列TTT−(10塩基)−CCC−(5塩基)−AAAによって特徴付けられている。AAA−赤色素、GGG−青色素、TTT−緑色素の、3つのプローブを作成する。これらのプローブを、次いで、上記の固有のヌクレオチド配列を含むことが知られているdsDNAのある領域にフラップが形成された、フラップ含有dsDNAサンプルに、プローブの結合を促進する条件下において接触させる。前記DNAサンプルを、次いで伸長させ、利用者は前記プローブの有無について前記サンプルを分析する。もし、前記3つの色素が前記サンプル中に存在し、適切な順番にあり、互いに適切な距離をもって離れている(つまり、色素の順番が赤−青−緑であり、赤と青の色素が10塩基に対応する距離で離れており、青と緑のし基礎が約5塩基に対応する距離で離れている)ことを、利用者が検出した場合、利用者は調べている前記dsDNAサンプルが前記既知の疾患を持つことが示唆されるという情報を得ることができるであろう。
【0033】
上記のプローブは、例証のみのために列挙したものである。プローブは、1〜10塩基、1〜100塩基、1〜1000塩基、又はさらに長い長さを持つことができる。 プローブは単一のタグ又は複数のタグ又は標識を持っていてもよい。一実施例として、プローブは2つ(又はそれより多くの)蛍光物質を持つように構築されてもよい。プローブは、柔軟性又は硬直性のスペーサー領域によって接続された、2つ以上の結合領域を含むことができる。
【0034】
請求された本発明はまた、遺伝子の特定の配列のコピーを検出するのに用いることができる。これらの実施形態において、本明細書の他の場所で記載されているように、DNAを処理してフラップを形成し、前記DNAにプローブを接触させてもよい。特定のDNA配列に固有の「バーコード」が2つ以上存在する場合、ある個人が特定の遺伝子又は特定の配列の複数のコピーを持っている可能性があることを示すのに用いることができる。これは、様々な多遺伝子性疾患のような、遺伝子の複数コピーによって自体が特徴付けられる状態の有無を、診断又は予測するのに有用な可能性がある。利用者はまた、2つ以上のバーコード間の距離を(その距離はサンプルの身長によって決定されうる)、dsDNAサンプルの特徴決定の助けとするために用いてもよい。例えば、利用者はプローブを用いて、特定の疾患の発現に重要な領域を含むことが知られている(又は疑われている)dsDNAサンプルについて、ある領域の開始及び終端において、バーコードを生成してもよい。
【0035】
もし前記疾患が存在しない場合、前記バーコード間の距離は第一の距離D0となる可能性がある。一方で、もし前記疾患が存在した場合、2つの前記バーコード間の距離は、より長い距離D1であることが明らかになる可能性がある。この場合、前記dsDNAサンプルを提供した被験者中の、関心の配列(例えば、遺伝子)の有無を示唆する情報を得るであろう。他の実施形態において、「正常」な個人は、DNAの特定領域の開始及び終端の前記バーコード間の「正常」な距離がD1であるような遺伝子を持つ可能性がある。しかしながら、その個人が遺伝子を欠いている場合、前記2つのバーコード間の距離は、より短い距離D0となる可能性があり、この場合、利用者は前記dsDNAの提供者が、関心の塩基配列(又は遺伝子)を欠いていることを示唆する情報を得るであろう。
【0036】
この情報を、被験者又は患者の防御的な(又は治療的な)療法を設計するために、順番に用いることができる。一実施例として、もし被験者がフェニルケトン尿症と対応した遺伝子プロファイルを持っていると利用者が決定した場合、利用者は被験者にフェニルアラニン含有の素材の食用を避けることを助言することができる。
【0037】
本発明はまた、dsDNAサンプル中の、複数の異なる塩基配列の有無を検出するのに用いられる。これは、プローブを用いて、異なる配列に異なるバーコードを生み出すことによって達成されうる。例えば、利用者は疾患1が互いに距離D1だけ離れた塩基配列S1a及びS1bによって特徴付けられると知っている場合がある。疾患2は、互いに距離D2だけ離れた塩基配列S2a及びS2bによって特徴付けられる。利用者は、次いで疾患1についてのバーコード(S1a及びS1bに特異的なプローブを使用する)と、疾患2についてのバーコード(S2a及びS2bに特異的なプローブを使用する)とを生成する。フラップ処理したdsDNAサンプルに適切なプローブを適用し、2つの前記バーコードの有無を調べることによって、利用者は前記dsDNAサンプルの提供者が、疾患1、疾患2、又はその両方を持つものとして特徴付けられるかどうかを、決定することができる。この方法において、利用者は、複数の条件で単一のサンプルを分析することができる。
【0038】
特定の解析において用いられるプローブは、同じであるか、或いは標識、結合特異性、又はその両方において互いに異なっている可能性がある。例えば、利用者は、配列AAAに結合する赤色蛍光色素を持つプローブと、GTTC配列に結合する緑色蛍光色素を持つプローブとを用いて解析を行なってもよい。利用者は、磁性体又は放射性物質を持つプローブと、蛍光物質を持つプローブとを同時に用いてもよい。この方法において、利用者は複数のプローブを同時に分析することができる。
【0039】
利用者はまた、単一条件において複数のサンプルを同時に分析することもできる。例えば、利用者は、複数の個人から得られた複数のdsDNAについて、それらのサンプルの、特定の1又はそれ以上のバーコードの存在(又は欠失)を分析することによって、ある特定の状態について並列で分析することができる。したがって利用者はまた、複数の状態について複数のdsDNAサンプルを同時に分析することができ、これによって複数個人についての高スループットのスクリーニングが可能となる。そうした一実施形態において、利用者はナノチャネルのセット又はアレイを用い、各ナノチャネルは異なる被験者由来の、処理した(例えば、フラップ含有の)dsDNAを伸長させるのに用いられる。この個々のサンプルは、次いで、特定の配列の有無又はバーコードの有無を示す個々のプローブの有無について(例えば、前記サンプルに存在する可能性のある蛍光プローブを励起するための放射光を適用することによって)調べられる。
【0040】
本発明はまた、遺伝子プロファイルを生成するために用いることができる。そうした実施形態において、利用者はある特定の状態(例えば、疾患又は障害)によって特徴付けられる被験者から、dsDNAサンプルを得てもよい。利用者は、次いでdsDNA中の1又はそれ以上の位置にフラップを形成し、次いでサンプル中の得られたフラップ又はギャプに、標識プローブを結合させてもよい。利用者は、次いでこれらのプローブについての有無及び場所について被験者のdsDNAを調べてもよく、これらのプローブは順番に被験者のdsDNAの含有量について順番に情報を産み出す。(例えば、配列ACACACを持つプローブが被験者のdsDNAに結合した場合、当該dsDNAがその位置に配列TGTGTGを持つことを示す。)利用者は、次いで被験者のDNAのマップを構築することができ、このマップは関連する特定の配列があるという情報(それらの配列に相補的なプローブの結合によって示される)と、それらの配列の位置(結合したそれらのプローブの市によって示される)を有するものである。したがって、利用者は、非限定的な実施例において、遺伝子疾患Xを持つと特徴付けられる個人が、dsDNAサンプルの10321番目の塩基位置において配列S1が開始し、dsDNAサンプルの11555番目の塩基位置において配列S2が開始するdsDNAを、持っていると決定することもあり得る。この情報を遺伝子疾患Xの有無を示すものとして扱うことで、利用者は、次いで第1の被験者からの情報に対して、別の被験者からのdsDNAを比較することができる。もし、第2の被験者が、塩基位置10321番目及び11555番目に、それぞれ配列S1及びS1を示したならば、第2の被験者もまた遺伝子疾患Xを持っている可能性がある。この方法において、利用者は、様々な遺伝子状態を持っているとして特徴付けられた個人から得られたdsDNAについての、様々な配列特異的プローブの結合位置に関係する情報の、自身の「ライブラリー」を作成することができる。新たな被験者からのdsDNAを、次いで本発明に従って処理することで(例えば、フラップを形成し、標識プローブを結合させる)、この新たな被験者が、利用者の結合情報ライブラリーにおいてカタログ化された1又はそれ以上の疾患を、持っている(つまり、保有している)かどうか決定することができる。
【0041】
別の実施形態において、標識した(例えば、共有結合的にタグを付けた)二本鎖DNAの特定の配列モチーフは、ニッキングした一本鎖にギャップを作成し、次いで標識したヌクレオチドをその中に組み込むことによって、作成される。そうした特定の標識した配列モチーフの、個々の非折畳み状態の核酸分子に沿った、物理的な分布及び頻度が、マッピングされる。幾つかの実施形態において、この後に一塩基シークエンシングを行うことで、サンプルについての塩基毎の配列情報を得ることができる。
【0042】
別の実施形態において、個々に標識された非折畳み状態の核酸分子は、直線状に伸長される。これは、そうした伸長した巨大分子を、表面の性質によって定義される、ナノスケールのチャネル、位相的なナノスケールの溝、又はナノスケールの走路の中に閉じ込めることによって、達成される。一実施例として、米国特許出願第10/484,293号の装置及び方法が、直線状伸長をもたらすのに適切であると考えられる。光ピンセット及び剪断応力を適用する方法(例えば、米国特許第6,696,022号で、参照によって本明細書中に援用される)もまた、そうした伸長をもたらすのに適切であると考えられる。
【0043】
別の実施形態において、ナノチャネル、ポスト、トレンチなどの極めて小さなナノ流体構造が基質上で製造され、超並列アレイとして、単一分子の解像度におけるDNA及びタンパク質などの生体分子の操作及び解析に用いられる。適切にも、チャネルの断面積の大きさは、伸長した生体分子の断面積のオーダー、つまり約1〜約106平方ナノメートルのオーダーであり、個々に分離され、数十、数百、数千、数百万さえも同時に解析される、伸長した(例えば、少なくとも部分的に直線状又は部分的に非折畳み状態であるとして特徴付けられる)生体分子を提供するものである。
【0044】
前記チャネルの長さは、巨大分子の長さの相当な部分又は相当な数の巨大分子までも収容するほど十分に長く、光学ズームを持つ一般的なCCDAカメラの視野域(約100ミクロン)から、染色体の全長と同じ長さの10センチメートル長のオーダーまでの範囲を取ることが望ましい(が、必須ではない)。最適な長さは、利用者の必要性に依存するであろう。
【0045】
本発明はまた、そのような標識化プロセスおよび特性の使用に関するものである。フラップおよび一本鎖DNAのギャップはゲノム学、遺伝学、臨床診断学を含むがこれに限定されない多くの分野において利用することが可能である。
【0046】
1実施形態において、(例えば、フルオロフォアで)タグを付けたプローブは長い二本鎖ゲノムDNA分子に沿いフラップまたは一本鎖DNAのギャップでハイブリダイズし、標識されたフラップまたは一本鎖DNAのギャップの空間バーコード(すなわち、ヌクレオチド間隔、配列またはその両方に関連したサイン)を観察するため、標識されたDNA分子を蛍光顕微鏡下で画像化することが可能である。個々のバーコードからのサインがサンプル高分子の特定の領域に関するさらなる情報を提供するため一緒につなぎ合わすことが可能である場合、バーコードを全ゲノムマッピングに順番に使用することが可能である。1つの非限定的な例として、利用者はDNAサンプルをサブセクションに分断する可能性があり、それから特定の塩基配列の存在(または欠如)および特定の順序でのそのような配列の存在について各々のサブセクションが解析される可能性がある。サブセクションを解析した後、利用者は、個々のサブセクションから情報を収集し、全ての、オリジナルサンプルとして全体的な情報である「地図」を作成することが可能である。
【0047】
1つの非限定的な例として、利用者は5kbのサンプルを用い、5つの1kbのサブセクションにサンプルを切断する可能性がある。その結果、利用者はこれらのサブセクションの各々においてフラップを作成する可能性があり、そのサブセクションに存在する塩基配列により特徴づけられることが知られている(または疑われる)1若しくはそれ以上の遺伝子疾患のため、各々のサブセクションを解析する可能性がある。たとえば、サブセクション1は心臓病のために解析され、特徴的配列または配列のセットが0〜1000塩基の位置で生じることが知られており、サブセクション2は糖尿病のために解析され、特徴的配列または配列のセットが1001〜1999の位置で生じることが知られている。それから利用者は、個人の疾患状態の総合的評価を行うため、この情報をアッセンブルすることが可能である。
【0048】
別の実施形態において、異なるゲノム領域のフラップまたは一本鎖DNAは、2つの領域の関係を同定するため違なる色素の(または、異なるシグナルの)プローブで標識される。そのようなBCR−ABL融合の例において、同じ領域での2色またはそれ以上の色素の存在は、転座のような構造変異を証明する。これは図5において示され、図はBCRおよびABL染色体セグメントの部分転座を図示する。
【0049】
別の実施形態において、標識したフラップまたは一本鎖DNAのギャップの(単一色素または複数の色素を含むパターンを含む可能性がある)1若しくはそれ以上の空間バーコード化パターンは、多重疾患診断法における複数の領域を検査するのに用いることが可能である。1つの非限定的な例として、利用者は複数の転座に対し複数の領域を検査することが可能である。
【0050】
これは、例えば非限定的な図6により示される。その図は複数のプローブがDNAサンプル上の複数の部位へ結合することを示し、利用者はそのサンプルにおける複数の病気の存在の解析を同時に行うことが可能である。その非限定的な図で示すように、その領域における特定のフラップが作成され、それから適切な標識により標識される場合、BCR−ABL領域で兆候が現れる特定の病気(病気1)は独特のバーコードまたはサインを示す。その領域における特定のフラップが作成され、標識される場合、疾患2は同様に独特なバーコードまたはサインを示す。その結果、利用者は同時に2若しくはそれ以上の疾患を解析する能力を持つこととなり、与えられた対象において複数の病気またはその他の状態の迅速な検出を可能にする。フラップを形成することにより、利用者はDNAサンプルの構造にアクセスポイントを獲得し、その結果、アクセスポイントをプローブの配列特異的な結合に用いることが可能である。
【0051】
本発明はまた、DNAサンプルのシークエンシングを行うのに利用することが可能である。そのような実施形態において、利用者はDNAに(DNA構造にアクセスポイントを提供する)フラップを形成させる可能性がある。その結果、利用者はDNAサンプルの一塩基配列ずつ、1つずつ、プローブに一塩基標識のプローブを導入することが可能である。たとえば、利用者はDNAの中にニックを導入することが可能であり、その結果Aに対する赤色プローブを導入することが可能である。その結果、赤色標識が認識可能な場合、利用者はAがニック部位に存在するという情報を得る。赤色標識が確認できない場合、利用者は異なるヌクレオチドに特異的な第2の標識プローブを導入することが可能である。
【0052】
別の実施形態において、利用者はまたDNAサンプルを断片に分断することが可能であり、断片の長さに従いニック/フラップを作成でき、その結果、断片上のニック/フラップにおいて塩基または配列特異的なプローブを導入することが可能である。その結果、各々の断片から収集した結果として生じる情報は、オリジナルの全長DNAサンプルの配列地図を作成するため、一緒にアッセンブル可能である。ニック/フラップは、DNAサンプルの特定の部位で、または、ランダムな部位で作成することが可能である。たとえば、利用者は20塩基の断片の塩基位置1および塩基位置11において10塩基のフラップ/ギャップを形成する可能性がある。その結果、利用者は(長さ10塩基までのプローブを含む)様々に一意的に標識された一意的に特異的プローブを断片へ導入することができる。どのプローブが断片に結合したかを(結合したプローブから決定した特定のシグナルに基づき)決定することにより、その結果、利用者は断片についての配列情報を得ることが可能となる。
【0053】
プローブは、フラップに、または特定の染色体の一本鎖DNAのギャップに結合するように設計される。染色体の過剰の存在、または少な過ぎるコピー数により異数性の診断を行うことが可能である。たとえば、特定の遺伝子または染色体でさえもその存在を証明する配列を標識するようプローブを設計することが可能である。その結果、対象における複数のプローブ(またはプローブの存在に関連した複数のバーコード)の存在は、対象が問題の遺伝子または染色体の複数コピーを有することを示すのに用いられることが可能である。
【0054】
別の実施形態において、本請求項の発明は、病原体ゲノムを同定する。病原体ゲノムはフラップ形成の間、予測された断片に適切に分断され、それからプローブ(例えば、いわゆるユニバーサルプローブ)はフラップの保存配列を検査するため用いられる。その結果、得られたバーコードパターンは、利用者が解析中のゲノムの構造を決定できるよう予測した参照地図と比較される。これは2層DNAバーコード化として知られており、DNA断片サイズおよび異なるサイズの各々の断片におけるバーコードの両方を考慮するものである。
【0055】
別の実施形態において、その手順は病原体ゲノムを同定するのに用いられる。病原体ゲノムは、フラップ形成の間、予測される断片に分断され、その結果、そのプローブはフラップ保存配列を検査するのに用いられる。
【0056】
得られたバーコードは、病原体ゲノムの新規のマッピングを得るため、それから予測された参照地図と比較される。これは異なるサイズの断片のDNA断片サイズおよびバーコードを結合させる2層DNAバーコード化スキームである。
【0057】
別の実施形態において、その手順は病原体ゲノムの同定を行うものである。既知の病原体ゲノム配列に基づき、利用者は病原体に特異的なフラップまたは一本鎖DNAのギャップのプローブを設計する可能性があり、異なる病原体に対する異なるバーコードをもたらし、利用者に様々な病原体または他の関心配列を示す様々なバーコードの「ライブラリー」を構築することを可能にする。これは非限定的な図7に示し、そのゲノム内における様々なセグメントの存在の解析のための乳がんゲノム由来のサンプルに対する様々な配列特異的なプローブの応用を示す。
【0058】
別の実施形態において、フラップまたは一本鎖DNAのギャップは、特定のゲノム領域を濃縮するのに用いることが可能である。たとえば、特定のフラップ配列を含んでいる特定の領域へのビオチン化プローブのハイブリダイゼーションにより、解析中の領域を固定させることが可能である。アビジン分子を含むビーズまたは基質と結合させることにより、ハイブリダイズしたDNA分子を選択する。結合した分子はさらにゲノム解析のために保持され、結合していないDNA分子は洗い流される。このように、利用者は解析および処理を容易にすべくDNAを固定することが可能である。フラップは、サンプルDNAおよびビーズまたは基質の間の付着点である可能性がある。他の実施形態において、フラップおよびビーズまたは基質の間とは対照的に、結合点が主要なdsDNAの塩基およびビーズまたは基質の間である可能性がある。
【0059】
別の実施形態において、非制限的な図11で示すように、フラップ配列または一本鎖DNAのギャップ配列上の一塩基突然変異はSNPまたはハプロタイプ情報収集のために得られる。図では、SNP1および2(それぞれ)のAおよびG対立遺伝子を示す。
【図面の簡単な説明】
【0060】
添付の図面と併せて以下の詳細な説明を読むと本発明の概要はさらに理解される。本発明を例証する目的で本発明の例示的な実施形態が図面に示されているが、本発明は開示された特定の方法、合成物、および装置に限定されるものではない。また、図面は必ずしも一定の縮尺で描かれていない。
【図1】図1は、ニッキング後の一本鎖フラップ形成により長いゲノム領域において「バーコード化」パターンのサインが形成される概略図を図示する。配列特異的ニッキングエンドヌクレアーゼまたはニッカーゼが二本鎖DNA上に一本鎖切断ギャップを形成し、同時に位置がずれたストランド、またはいわゆる「はがれたフラップ」を生成し、そこにポリメラーゼが結合し、ストランドの伸長を開始する。これらのはがれた一本鎖フラップは、同定可能なシグナルを生成させるため標識したプローブと配列特異的なハイブリダイゼーションに対し利用可能な領域を形成する。放射線(例えば、UV放射線)、フリーラジカルまたはその任意の組合せをサンプルに接触させることにより、ニッキングを生じさせることが可能である。
【0061】
図1はまた、測定可能である配列特異的フラップ上にハイブリダイズした修飾したプローブからのシグナル間の空間距離を用い、その領域に存在する特定のゲノム配列を反映する独特な「バーコード」サインパターンを形成するナノチャネルアレイ中で直線的に変性する標識ゲノムDNAを示す。ラムダdsDNA(48.5kbp全長)の複数のニッキング部位を、これらに限定されないがNb.BbvCI;Nb.BsmI;Nb.BsrDI;Nb.BtsI;Nt.AlwI;Nt.BbvCI;Nt.BspQI;Nt.BstNBI;Nt.CviPIIを含む酵素、およびその任意の組み合わせの特異的な酵素により形成された例として示す。蛍光性標識したオリゴヌクレオチドプローブが予測されるニッカーゼが形成する部位にハイブリダイズすることを示す直線化した一本鎖ラムダDNA画象もまた示す。長い生物高分子に従い記録されたそのような実際のバーコードは、いわゆる観察されたバーコードとして本明細書において示される。
【図2】図2はモデルシステムとしてラムダDNA分子の使用を図示し、異なる標識化スキームを実行したものである。図2aはニック標識を示し、図2bは2つのフラップ構造上にハイブリした特異的配列を有する蛍光プローブを示し、図2cは標識したニック部位、および標識したフラップ構造から放出されたシグナルを図示する。
【図3】図3は、Nb.BbVCIに基づく22番染色体全域におけるフラップ配列の50塩基対の6塩基スライディング解析を図示する。図示の通り、かなりの保存配列がフラップ配列上で観察された。複数のフラップ構造をターゲットとする1若しくはそれ以上のプローブを設計するのに、この保存配列は、順番に用いることが可能である。
【図4】図4は典型的なユニバーサルプローブ、TGAGGCAGGAGAATの使用法を図示し、BACクローン3f5の上で(計52箇所のニック部位のうち)21箇所のフラップ構造にハイブリダイズするようプローブが設計された。形成されるバーコード化パターンは予測したパターンとかなり対応し、全ゲノムマッピングを行うためそのようなユニバーサルプローブを使用することが可能であることを証明した。
【図5A】図5は、白血病の主要な原因である、いわゆるフィラデルフィア染色体を形成するBCRおよびABL1遺伝子翻訳の転座の臨床診断を図示する。このスキームでは、BCR遺伝子は複数のフラップにおいて緑色のプローブで標識され、ABL1遺伝子は複数のフラップにおいて赤色のプローブで標識されている。赤色および緑色のパターンが観察される場合、これら2つの遺伝子の転座の裏付けとなる。
【図5B】図5は、白血病の主要な原因である、いわゆるフィラデルフィア染色体を形成するBCRおよびABL1遺伝子翻訳の転座の臨床診断を図示する。このスキームでは、BCR遺伝子は複数のフラップにおいて緑色のプローブで標識され、ABL1遺伝子は複数のフラップにおいて赤色のプローブで標識されている。赤色および緑色のパターンが観察される場合、これら2つの遺伝子の転座の裏付けとなる。
【図6】図6は開示された多重診断法を示す略図である。各々の病気または遺伝子領域は独自のサインバーコードを形成し、バーコードは2つ(またはそれ以上の)色素を含む可能性がある。複数のバーコードを複数のフラップに置くことは、利用者に基本的に無制限のバーコード化能を提供する。
【図7】図7は構造変異の確認を示し、複数の構造的な再編成を有するBACクローン3f5がフラップマッピングにより確認された。
【図8】図8は、2層バーコード、断片サイズおよびフラップバーコード化でユニバーサルプローブを用いた病原体同定の略図である。
【図9】図9は、病原体特異的プローブを用いた病原体同定を図示する。プローブは病原体ゲノムの特定の領域またはターゲット特異的領域に設計され、標識した構造は固有のバーコードを形成する。この場合、例としてサルモネラ属領域の350000〜400000および1090000〜1130000が用いられた。大腸菌の領域もまた示される。
【図10】図10は、サンプル濃縮および診断の略図である。
【図11】図11は、フラップ構造に基づく分子ハプロタイピングを図示する。
【発明を実施するための形態】
【0062】
本明細書の開示の一部を成す添付の図面および実施例と伴に以下の詳細な説明を参照することより、本発明はより容易に理解されるであろう。本発明は本明細書において記載および/または示される特定の装置、方法、適用、条件、またはパラメータに限定されないものであり、本明細書で使用される用語は特定の実施形態をほんの一例として説明するためのものであり、請求項に係る発明に限定を加えることを意図したものでないことを理解すべきである。また、添付の特許請求の範囲を含む本明細書で使用される単数形「a」「an」および「the」は複数形を含み、特定の数値の言及はその文脈において明らかな別段の指示がない限り少なくともその特定の値を含む。本明細書で使用される「多数」という用語は2以上を意味する。値の範囲が表される場合、別の実施形態には1つの特定の値からおよび/または他の特定の値までが含まれる。同様に、値が先行詞「約」の使用により近似値として表される場合、別の実施形態において特定の値が設定されることは理解されるべきである。全ての範囲は包括的で組み合わせが可能である。
【0063】
本明細書において明確さのため別々の実施形態の関連で記載されている本発明の複数の特定の特徴はまた、単一の実施形態において組合せで提供されるかもしれない。反対に、簡潔さのため単一の実施形態の関連で記載されている本発明の様々な特徴はまた、単独でまたは部分的組合せで提供されるかもしれない。さらに、範囲で記載される値への言及はその範囲内のそれぞれ全ての値を含む。
【0064】
最初の実施形態において、本発明はDNAまたは他の核酸サンプルから構造情報を得る方法を提供する。これらの方法には、二本鎖DNAサンプルから置き換えられる二本鎖DNAサンプルの第一鎖のフラップを生じさせるため二本鎖DNAサンプルを処理することが適切に含まれる。フラップの適切な長さは約1〜約1000塩基、または5〜750塩基、または10〜200塩基、または50〜100塩基の範囲である。フラップの最適な長さは利用者の必要性に依存する。本明細書においてどこか他で説明されるように、フラップの形成はフラップの反対側のdsDNAで形成されている「ギャップ」において終了する。
【0065】
例えば図1で示すように、フラップの形成はフラップの位置と対応するdsDNAサンプルにおいてギャップを適切に生じさせる。このフラップ(およびギャップ)はその結果、増幅、プローブの付着、またはさらなる標識化のためdsDNAの一本鎖部分を曝露させるのに用いることが可能である。このように利用者は、解析のため生物高分子を個々の核酸に分断する必要がなく、DNAまたは他の核酸生物高分子サンプルの遺伝的解析を行う可能性がある。さらに本発明により利用者は、生物高分子内で核酸配列から基本的に独立している核酸生物高分子の分析を行うことが可能となる。
【0066】
これにより2若しくはそれ以上のプローブが位置したDNA領域の単なるサイズ/長さから遺伝情報を収集することが可能となる。たとえば、プローブが関心地域に位置するようにサンプルと結合し、対象において通常認められるより関心領域が長い(または認められるべきものより長い)場合、利用者は対象が伸長した関心領域により特徴づけられた生理的状態(例えば特定の遺伝子の過剰のコピー数により特徴づけられるような状態)または疾患であると処理される可能性があることを知ることとなる。
【0067】
1若しくはそれ以上の置換塩基はギャップを除去するように二本鎖DNAの第一鎖に適切に取り込まれ、その結果、生じた二本鎖サンプルの少なくとも一部が1若しくはそれ以上のタグで適切に標識される。タグは適切な蛍光標識、放射性標識などである。標識は高分子の長さに従いニックまたはフラップにおいて、またはこれらの部位の任意の組合せにおいて付加される可能性がある(例えば図2を参照)。同様に(例えば、プローブにより生じる)標識がdsDNAのギャップに導入される可能性がある。
【0068】
ニッキングは、1若しくはそれ以上の配列特異的な部位において適切に生じる。これはニッカーゼまたはニッキングエンドヌクレアーゼにより、または一本鎖切断を導入する任意の酵素により、電磁波(例えば、紫外線光)により、フリーラジカルなどによりなされる可能性がある。ニッキングはまた非配列特異的な部位においてもなされる可能性がある。そのようなフラップを作製するための酵素は、例えば、ニューイングランドバイオラボ、www.neb.com、から市販されている。
【0069】
前記置換塩基の組み込みはポリメラーゼ、1若しくはそれ以上のヌクレオチド、リガーゼまたはその任意の組合せにより二本鎖DNAの第一鎖に接触することでなされる可能性がある。これは、いくつかの実施形態において、1若しくはそれ以上の置換塩基の存在下において実行され、その塩基には検出可能なタグまたは標識が含まれる可能性がある。このように、利用者は順番に利用者にターゲット高分子に関する構造情報を与えるターゲット標識またはタグに取り込ませる可能性がある。
【0070】
当技術分野で知られていているように、フラップ構造の形成はポリメラーゼ伸長および1若しくはそれ以上のヌクレオチドの取り込みにより適切に調整される。ポリメラーゼは適切な5’−3’置換活性を有し、いくつかの実施形態において、5’−3’エキソヌクレアーゼ活性を欠く。適当なポリメラーゼには、これに限定されるものではないがベントエキソ−ポリメラーゼ(ニューイングランドバイオラボ、www.neb.com)が含まれる。
【0071】
ポリメラーゼおよびヌクレオチドは、フラップの長さを調整するために選択される可能性がある。反応温度および時間はまた、生じるフラップの長さを調整するため調整されることが可能である。フラップ長はまた、異なるヌクレオチドの存在の相対的な割合、すなわち、dATP、dCTP、dTTPおよびdGTPの比率により調整される可能性がある。ポリマーターミネーターに対するヌクレオチドの比率もまたフラップ長に影響を及ぼすことが可能である。ターミネーターには、ddNTPとおよびacylo−dNTPが含まれるがこれに限定されない。
【0072】
標識する工程は(a)少なくとも1つの相補的プローブが少なくともフラップの一部に結合し、プローブが適切に1若しくはそれ以上のタグ(例えばフルオロフォア)を有し、(b)2若しくはそれ以上の相補的プローブが互いに次のものとハイブリダイズし、共にライゲートされ、またはさらに(c)2若しくはそれ以上の相補的なプローブが互いに次のものとそれらの間で1若しくはそれ以上の塩基のギャップでハイブリダイズすることにより適切になされる。その結果、ギャップが標識、または非標識ヌクレオチドで満たされ、ヌクレオチドはリガーゼの働きにより結合されることが可能である。標識は結果として「ギャップ」となるフラップ、または、複数の部位において存在する可能性がある。
【0073】
DNAサンプルから構造情報を得る方法もまた提供される。これらの方法には二本鎖DNAサンプルの第二鎖の一本鎖DNAギャップを生じさせるため二本鎖DNAサンプルを処理することが含まれる。これは、例えばdsDNAのDNAサンプルからニッキング部位において消化される第一鎖DNAによりなされる可能性がある。ギャップの適切な長さは約1〜約1000塩基、または5〜750塩基、または10〜500塩基のような範囲である。利用者は少なくとも一部の一本鎖DNAのギャップに適切に標識することが可能である。
【0074】
本明細書においてどこか他で解説されるように、ニッキングは二本鎖DNA分子の第一鎖をニッキングすることによりなされる。ニッキングエンドヌクレアーゼNb.BbvCIは適当であると考えられる。他の適当なニッキングエンドヌクレアーゼはニューイングランドバイオラボ(www.neb.com)およびフェルメンタス(www.fermentas.com)を含む商業供給源から入手可能である。
【0075】
いくつかの実施形態において、ニックから下流のストランドは、例えばdUTP dA(C,G)TPで5’>3’エキソ+ポリメラーゼにより伸長される。ベントポリメラーゼはこのためのそのような適当な酵素の1つである。
【0076】
その後、DNAを例えばウラシルDNAグリコシラーゼで消化する。dUTPの除去により一本鎖DNAのギャップが生じる。
【0077】
いくつかの実施形態において、フラップはある程度、または、完全に取り除くことが可能である。結果として生じるギャップはフラップエンドヌクレアーゼで満たされ、一本鎖DNAのギャップ構造を生じさせる。伸長した配列は同じニッキングエンドヌクレアーゼにより再度ニッキングされ、配列は変性により除去される。
【0078】
標識する工程は(a)少なくとも1つの相補的プローブが少なくともフラップの一部に結合し、プローブが1若しくはそれ以上のタグ(例えばフルオロフォア)を有し、(b)2若しくはそれ以上の相補的プローブが互いに次のものとハイブリダイズし、共にライゲートされ、および/または、(c)2若しくはそれ以上の相補的なプローブが互いに次のものとそれらの間で1若しくはそれ以上の塩基のギャップでハイブリダイズすることにより適切になされる。その結果、ギャップが標識、または非標識ヌクレオチドで満たされ、ライゲースによりともにライゲートされる。
【0079】
本明細書においてどこか他で解説されるように、その結果、標識されたサンプルは引き延ばされる可能性がある。その伸長はエントロピー閉じ込め、流れまたは剪断力の応用、光学ピンセット、(例えばビーズのような磁気材料を含むサンプルにおける)磁力、などによりなされる可能性がある。
【0080】
DNAから構造情報を得る方法もまた提供される。これらの方法には第一の二本鎖DNAサンプルにおける、第一のサンプルの1若しくはそれ以上の配列特異的部位に標識する工程と、第二の二本鎖DNAサンプル上の対応する1又はそれ以上の配列特異的部位に標識する工程と、伸長した前記第1の二本鎖DNAサンプルの少なくとも1つの標識についての、シグナルの強度、シグナルの位置、又はその両方と、伸長した前記第2の二本鎖DNAサンプルの少なくとも1つの標識についての、シグナルの強度、シグナルの位置、又はその両方とを比較する工程とが含まれる。
【0081】
本発明のこの観点において、利用者は2つの(またはそれ以上の)サンプルのバーコードまたはプローブ結合プロファイルの比較を行う。これにより利用者が特定の状態を持つ(または欠如する)ことが既に知られているある個人由来のサンプルと2人目の個人由来のサンプルとの間で遺伝的プロファイルを比較することが可能となり、2人目の個人の疾患状態の決定を可能にする。たとえば、利用者は、ゲノム解析により検出することが可能な疾患(例えば、糖尿病)で陽性であることが知られている個人のプローブプロファイルとその疾患の検査を受けていないテスト個人のプロファイルを比較する可能性がある。2つのプロフィールが同一である場合(例えば、テスト個人が陽性対照個人と同じ「バーコード」を示す場合)、利用者はテスト個人が疾患に対し「陽性」であることの示唆的な情報を得ることとなる。
【0082】
本明細書において他で解説されているように、これはDNAサンプルの少なくとも1つに1若しくはそれ以上のプローブをハイブリダイズすることにより適切になされる。これは本明細書においてどこか他で記述されるフラップを用いた方法によりなされる可能性がある。
【0083】
本明細書においてどこか他で記述されるように、標識化は、(a)二本鎖DNAサンプルから分離した第一鎖のフラップを生じさせ、および(b)フラップと対応する二本鎖DNAサンプルの第一鎖におけるギャップを生じさせるため、二本鎖DNAサンプルの第一鎖をニッキングすることによりなされ、ギャップは二本鎖DNAサンプルの第一鎖でニッキングの部位およびフラップの接合部位により決定される。
【0084】
本方法は全ゲノムマッピングのため設計したプローブを適切に用い、プローブは全ゲノム全域のフラップ配列に保存されている。このように、1若しくはごく少数のプローブのみが何百または何万ものフラップ配列にハイブリダイズすることが可能であり、本配列またはこれらのフラップ全体で保存されている配列を利用する。ハイブリしたプローブは個々のDNA断片を同定するためにバーコードを適切に形成し、バーコードは特定の断片に特有である。プローブは配列特異的である。
【0085】
様々なスキームがゲノムマッピングに用いることが可能である。1実施形態において、フラップの標識化に加えニックの標識化(2若しくはそれ以上の色素)を用いることが可能である。別の実施形態において、1つのニッキング酵素および、2若しくはそれ以上の異なる色素を用い、2若しくはそれ以上のプローブによるフラップ標識を用いることが可能である。さらに別の実施形態において、フラップおよびニック標識化の様々な組合せにより2つの異なるニッキング酵素を用いることが可能である。
【0086】
DNAから構造情報を得る他の方法もまた提供される。これらの方法には2つの領域の間の空間関係を同定するため異なる色のプローブで(例えば2箇所以上の)異なるフラップの領域を標識化することが含まれる。あるいは、利用者は2つの領域の関係を同定するため異なる色のプローブおよび異なる数のプローブで異なる領域のフラップを標識する可能性がある。利用者はまた、異なる(または同様の)色をつけたプローブの異なる数で、異なる領域のフラップを標識する可能性があり、2若しくはそれ以上の領域の空間関係を同定するため、結果として生じる色素パターンを用いる可能性がある。異なるプローブで異なる領域のフラップ上において標識化がなされる可能性がある。プローブはまた特定の染色体を同定するため、特定の染色体をターゲットにする可能性がある。
【0087】
プローブは単一の疾患または異常の存在を検索するため配置することが可能である。プローブはまた、同時に複数の領域および複数の病気でさえ同定できるよう、多重様式で用いることが可能である。
【0088】
フラップまたはssDNAのギャップをプローブすることにより病原性ゲノム材料を同定する可能性がある。この同定には複数の領域の全域にわたり保存される配列と結合するユニバーサルプローブを使うことが適切に含まれ、ユニバーサルプローブは新規の病原体同定に使用可能である。1実施形態において、これはフラップ保存配列の検査に用いるユニバーサルプローブでフラップ形成の間、病原体ゲノムを予測した断片に切断することによりなされる。得られたバーコードは、それから病原体ゲノムの予測された参照地図と比較される。これは「2層」DNAバーコード化として知られており、DNA断片サイズおよびバーコード情報を結合するものである。
【0089】
図8はこの2層バーコード化の1つの実施例を図示する。その図に示すように、ユニバーサル(または他の)プローブは、フラップ、ニックまたは両方の部位でサンプル高分子と結合する。高分子は特定のサイズの断片に再分割することが可能であり、断片のサイズはサンプルに関するさらなる構造情報を収集するのに用いることが可能である。1つの非限定的な例として(その断片の終点を決定する元のサンプルの部位を知る)利用者は、元のサンプルの中で特定の断片のサイズをその断片の位置に関連させることが可能である。
【0090】
多重病原体同定のための病原体特異的プローブの使用もまた提供される。これは、異なるバーコードを有する異なる病原体において、病原体特異的なフラップのプローブを設計するため既知の病原体ゲノム配列を用いなされる。非限定的な図9で示すように、緑色−赤色−緑色−赤色プローブの順序での存在はサルモネラ属の存在を意味する。同じバーコードは、同じバクテリアの他の領域で解析することが可能である。本発明のこの観点では、利用者は病原体(例えば、バクテリア)特異的なバーコードを作出するのに順番に用いられる配列特異的プローブを用いることが可能である。
【0091】
その結果、そのようなバーコードを特定のサンプルにおいて病原体(または病原体のゲノムの一部でさえ)の存在を解析するのに使用することが可能となる。本明細書において解説されるように、利用者は1若しくはそれ以上のプローブが存在する領域に一意的なシグナルに基づき1若しくはそれ以上のプローブの位置を決定する可能性があり;1若しくはそれ以上の病原性の状態と対応することが知られているDNA領域から対応するシグナルに合わせDNAサンプルに結合する1若しくはそれ以上のプローブの位置、色またはその両方と比較する可能性がある。このように、利用者は対象が病原性の状態で苦しんでいるか(または、苦しむ傾向があるか)どうか決定することが可能である。
【0092】
別の観点において、本発明は特定のゲノム領域を濃縮する方法を提供する。これらの方法には、特定のフラップ配列を含む1若しくはそれ以上の領域へのアンカー支持プローブのハイブリダイゼーションが含まれる。(そのようなプローブの適当なものの1つとしてビオチン化プローブがある。)ハイブリダイズしたDNA分子は、アビジンのようなリンカー分子を有するビーズまたはガラス表面に結合することが可能である。結合していないDNA分子は洗い流され、結合した分子はそれから更なる解析、イメージング、などに利用される。別の実施形態において、磁気ビーズはDNAサンプルに結合または付け加えられる可能性があり、その結果、サンプルを固定するため基質にサンプルをひきつける。
【0093】
図10は本発明技術の非限定的な実施形態である。その図に示すように、プローブは、DNAサンプル上で形成されたフラップに結合する可能性があり、同様にフラップの形成により取り残されるギャップに挿入される可能性がある。ビオチン化プローブはフラップを基質に固定する。その図に示される例において、赤色および緑色のプローブの出現は、BCR−ABL融合の存在を意味する。緑色プローブのみが現れた場合、ABLのみが確認できる。赤色プローブのみが認められた場合、BCRのみが存在する。分子ハプロタイピングはまた、フラップ配列および一本鎖DNAのギャップ配列上で一塩基突然変異を調査することによりなされることが可能である。
【0094】
光学的および非光学的シグナル解析の超並列様式でそのような標識した高分子を選別し、直線的に変性するのに適切なシステムもまた提供される。例示的な実施形態において、これらのシステムには、DNA、RNAまたは他のサンプル材料が本明細書において記述されるニッキング、フラップ形成、標識化および他のステップを経る1若しくはそれ以上の反応帯域が含まれる。そのような場所は、チューブ、フラスコまたは他の一般的に利用される研究器具のような反応容器である可能性がある。あるいは、(本明細書においてどこか他で解説されるように)利用者が高分子についての構造情報の収集を可能にするため高分子を引き伸ばすために用いるナノチャネルまたはナノチャネルアレイによる流体連結における反応帯域において、これらのステップの1若しくはそれ以上が実行される可能性がある。伸長は物理的/エントロピー閉じ込め、流体剪断流、地理的力(光学ピンセット)、などによりなされる可能性がある。適切なナノチャネルチップおよびアレイは米国出願10/484,293において記述され、それの全ては参照することにより本明細書に組み込まれる。
【0095】
標識したサンプルについての視覚情報を収集するため、本システムには撮像装置のような装置が含まれる可能がある。1実施形態において、撮像装置は、請求した本発明に従い処理される高分子に存在する可能性がある標識を励起させるため用いられる放射線(例えば、光、レーザー、など)の1若しくはそれ以上の源から成る。撮像装置にはCCD装置または他の画像収集ハードウェアが適切に含まれる。画象は利用者により調査される、または処理される可能性があり、本システムによりさらに解析がなされる。そのような更なる処理には、モデルを用い標識した高分子から得た画象、または他のサンプル材料の、または、解析するサンプルと比較可能である材料の解析により作出した予測画象の比較のみならず、標識した高分子から得た原画像の改良が含まれる可能性がある。疾患の状態、健康状態または他の遺伝的変異を示す解析中の核酸生物高分子からとられる画象および対照群の画象との間で比較を行う可能性がある。その比較はコンピュータによりなされる(または補助される)可能性がある。
【0096】
さらなる開示
本応用は、長いゲノムDNAを形成する方法、配列特異的なタグを付ける方法および個々のDNA分子を直接イメージングすること、およびナノチャネル(適切な実施形態において、直径<500nm)の内側の単一DNA分子における複数の配列モチーフまたは多型部位の位置に基づいたDNAをバーコード化する方法を含むDNAマッピングおよびシークエンシングに関する方法を示す。DNAマップに関する範囲内において、これらの方法は連続する塩基ごとの配列情報を得るものである。
【0097】
従来の方法と比較し、開示されたDNAマッピング方法は、改善された標識化効率、より安定した標識化、高感度およびより良い解像度を提供する。開示されたDNAシークエンシング法は長い鋳型の塩基の解読を提供し、アッセンブルを容易にし、ハプロタイプおよび構造変異のような他のシークエンシング技術からは入手不可能な情報を提供する。
【0098】
DNAマッピングの応用として、個々のゲノムDNA分子または長距離PCR断片を特定の配列モチーフにおいて蛍光色素で標識した。標識されたDNA分子はそれからナノチャネルの中で直線状に伸長し、蛍光顕微鏡検査を用い画像化した。DNA骨格に対し蛍光標識の局在および色素を決定することにより、バーコードを読み込む同様の方法で、配列モチーフの配布を正確に構築することが可能である。このDNAをバーコード化する方法は、例えば、ラムダファージDNA分子およびヒトのbacクローンの同定において用いられる。
【0099】
配列特異的ニッキング部位におけるフラップ配列による1つのサンプルの実施形態は、
a)特異的配列モチーフにニックを導入するニッキングエンドヌクレアーゼによる長い(例えば、>2Kb)二本鎖ゲノムDNA分子の1つの鎖をニッキングする工程と、
b)DNAポリメラーゼによるニックにおける蛍光色素標識したヌクレオチドまたは非蛍光色素標識のヌクレオチドを取り込む工程、およびフラップ配列を生成するため下流鎖を置き換える工程と、
c)標識したヌクレオチドのポリメラーゼ取り込み、または蛍光プローブの直接のハイブリダイゼーション、またはリガーゼによる蛍光プローブのライゲーションによるフラップ配列を標識化する工程と、
d)チャネルを通じてサンプルを流すことにより、またはチャネル内でDNAの片方の末端を固定することにより、ナノチャネル中で直線的に標識DNA分子を伸長させる工程と、
e)DNAのマップまたはサインバーコードを得るため蛍光顕微鏡検査を用いてDNA骨格における蛍光標識の位置を測定する工程とを含む。
【0100】
配列特異的ニッキング部位におけるssDNAギャップを有するもう別の実施形態は、
a)特異的配列モチーフにニックを導入するニッキングエンドヌクレアーゼによる長い(例えば、>2Kb)二本鎖ゲノムDNA分子の1つの鎖をニッキングする工程と、
b)DNAポリメラーゼによるニックにおける蛍光色素標識したヌクレオチドまたは非蛍光色素標識のヌクレオチドを取り込む工程、およびフラップ配列を生成するため下流ストランドを置き換える工程と、
c)新たに伸長した鎖にニックを入れるため同一のニッキングエンドヌクレアーゼを使用する工程、およびフラップエンドヌクレアーゼで新たに生成したフラップ配列を切断する工程と(分離したssDNAは温度を上げることにより除去可能である)、
d)標識したヌクレオチドのポリメラーゼ取り込み、または蛍光プローブの直接のハイブリダイゼーション、またはリガーゼによる蛍光プローブのライゲーションによるssDNAギャップを標識する工程と、
e)チャネルを通じて流すか、またはチャネル内でDNAの片方の末端を固定させて、ナノチャネル中で直線的に標識DNA分子を伸長させる工程と、
f)DNAのマップまたはバーコードを得るため蛍光顕微鏡検査を用いてDNA骨格における蛍光標識の位置を測定する工程とを含む。
【0101】
フラップと一本鎖DNAのギャップのもう1つの応用は全ゲノムマッピングである。(これに限定されるものではないがNb.BbVCIを含む)ニッキングエンドヌクレアーゼにより形成した全ゲノムDNAのフラップおよび/またはssDNAのギャップ配列を解析し、サンプルの複数の領域の全域、または、複数のサンプル全体で保存された(すなわち、目下の)配列に基づき、ハイブイダイゼーションプローブを設計した。Cy3−TGAGGCAGGAGAAT−Cy3のような、単一または少数(4つ未満のプローブ)を使用することが可能である。(本明細書においてどこか他で解説されるように)ナノチャネルで標識したDNA分子は線形化され、DNAバーコードを産生する。
【0102】
図3は、保存領域に結合し位置する、いわゆるユニバーサルプローブの使用を示す例示的な実施形態である。その図に示すように、所定のサンプル高分子の長さに従い、保存配列をターゲットとし、位置させるのにプローブ(この場合、プローブは図らずも比較的高いGC含量を持つ)を用いることが可能である。ユニバーサルプローブの使用は図4にさらに図示され、図はサンプル高分子の長さに従って多数の部位と結合する単一のユニバーサルプローブの使用を図示する。
【0103】
フラップおよび/またはssDNAギャップの使用の別の実施形態は、構造変異に起因する疾患の検出である。そのような病気の1つの例はそれが白血病の主要な原因となるBCR−ABL遺伝子融合である。この場合、(図5および6で示すように)緑色フルオロフォア標識したプローブはフラップ上、または、BCR遺伝子の一本鎖DNAのギャップにハイブリダイズし、赤色フルオロフォア標識したプローブはフラップ上、または、ABL遺伝子の一本鎖DNAのギャップにハイブリダイズする。緑色赤色の2色素が同じDNA分子上で観察される場合、BCR−ABL融合遺伝子の存在の裏付けとなる。
【0104】
上記の病気診断の別の実施形態はゲノムの4つの異なる領域由来の4つセグメントの再編成から成るジンクフィンガー乳がん診断マーカーのような2つ以上の領域の再編成を伴うものである。
【0105】
別の実施形態において、より多くの色素の組み合せ、または、より複雑なフラップまたはssDNAギャップの空間バーコードまたは両方の色素、および複合的な検出フォーマットであるフラップおよびssDNAのギャップ色素の空間分布を用い、2若しくはそれ以上の病気を調査することが可能である。
【0106】
別の実施形態において、その手順は病原体ゲノムを同定するのに用いられるものである。ゲノムは(Nb.BbVCI、Nb.BsmIなどを含むがこれに限定されるものではない)ニッキングエンドヌクレアーゼにより、二本鎖DNA分子の第一鎖において、適切にニッキングされる。2箇所のニッキング部位は100bp以内の逆のストランドにおいて適切に存在し、ストランドはフラップ形成によりに適切に切断される。切断パターンは特定の病原体ゲノムに特異的であり、パターンはバーコード情報の第一層として使用されることが可能である。
【0107】
その結果、断片の各々のサブセットはフラップ上の蛍光プローブ、またはユニバーサルプライマーを用いたssDNAのギャップにより標識することが可能である。その結果、断片サイズおよび内部色素バーコードの組合せが病原体ゲノムを同定する。たとえば、エルシニア属バクテリアはこのようにして同定することが可能である。
【0108】
別の実施形態において、既知の病原体ゲノム配列に基づき、病原体の存在を確認するため、病原体ゲノムの特定の領域を選択することが可能である。この場合、病原体特異的フラップまたは一本鎖DNAのギャップのプローブを設計することが可能であり、異なる病原体に対し特異的なパターンを生じる。たとえば、350000〜400000bpの部位(50kbの領域)のサルモネラ属細菌のゲノムは、Nb.BbVCIによりニック−フラップ標識され、ゲノムをバーコード化するプローブと関連する。特異性を増すため、更にそのような領域、1000000〜1500000bpまでの50kbのような領域が用いられる。病原体ゲノムの混合物は同様にして同定することが可能である。
【0109】
別の実施形態において、フラップまたは一本鎖DNAのギャップを特定のゲノム領域を濃縮するのに使用することが可能である。これらの実施形態において、利用者は特定のフラップ配列を含む特定の領域にビオチン化プローブのハイブリダイゼーションをもたらす。それからハイブリダイズしたDNA分子をアビジン分子を含むビーズまたはガラス表面にそれらを結合させることにより選択する。結合した分子はさらにゲノム解析のため保持される。結合していないDNA分子は洗い流され、固定されたサンプルに対し更なる解析を行う。
【0110】
実施例
以下の実施例は例証のみを目的とするものであり、必ずしも請求項に係る本発明の範囲を限定するものでない。
【0111】
実施例:二本鎖DNA分子における一本鎖DNAフラップの産生。
【0112】
ゲノムDNAサンプルをニック反応に使用するため50ngまで希釈した。ラムダDNA(50ng/uL)の10uLを0.2mLのPCR遠心分離チューブに添加し、続いて10XNEBバッファー#2を2uL、およびこれに限定されるものではないがNb.BbvCI;Nb.BsmI;Nb.BsrDI;Nb.BtsI;Nt.AlwI;Nt.BbvCI;Nt.BspQI;Nt.BstNBI;Nt.CviPIIを含むニッキングエンドヌクレアーゼを3uL添加した。混合液を1時間37度でインキュベートした。
【0113】
ニッキング反応が完了した後、本実施例では3’下流のストランドを置き換え、一本鎖フラップを生成するため、ニッキング部位に限定したポリメラーゼ伸長を続いて行った。フラップ形成反応混合物は、15ulのニッキング産物、および10Xバッファーを2ul、これに限定されるものではないがベント(エキソ−)、BstおよびPhi29ポリメラーゼを含むポリメラーゼを0.5ul、および1uMから1mMまでの様々な濃度でヌクレオチドを1ul含む組み込み混合物5ulから成る。フラップ形成反応混合液を55度でインキュベートした。フラップの長さはインキュベート時間、使用するポリメラーゼ、および使用するヌクレオチドの量で調整した。
【0114】
実施例:二本鎖DNA分子における蛍光性標識した配列特異的ニック。
【0115】
ゲノムDNAサンプルをニック反応に使用するため50ngまで希釈した。ラムダDNA(50ng/uL)の10uLを0.2mLのPCR遠心分離チューブに添加し、続いて10XNEBバッファー#2を2uL、およびこれに限定されるものではないがNb.BbvCI;Nb.BsmI;Nb.BsrDI;Nb.BtsI;Nt.AlwI;Nt.BbvCI;Nt.BspQI;Nt.BstNBIおよびNt.CviPIIを含むニッキングエンドヌクレアーゼを3uL添加した。混合液を1時間37度でインキュベートした。
【0116】
ニッキング反応が完了した後、本実施例ではニッキング部位に染料ヌクレオチドを取り込むためポリメラーゼ伸長を続いて行った。1実施形態において、単一の蛍光ヌクレオチドターミネーターが取り込まれる。別の実施形態では、複数の蛍光ヌクレオチドが取りこまれる。組み込み混合物は、15ulのニッキング産物、および10Xバッファーを2ul、これに限定されるものではないがベント(エキソ−)を含むポリメラーゼを0.5ul、蛍光色素ヌクレオチドまたは これに限定されるものではないがcy3を含むヌクレオチドターミネーター、アレクサ標識したヌクレオチドを1ul含む組み込み混入混合物5ulから成る。組み込み混合液を55度で30分間インキュベートした。
【0117】
実施例:二本鎖DNA分子上のニッキング部位および一本DNAフラップの2色標識化。
【0118】
ニッキング部位を1色フルオロフォアにより標識する。本反応は、フラップを形成するため250nMの非標識のヌクレオチドdNTPで追跡した。一旦フラップ配列が形成されると、フラップは異なる色の蛍光色素分子により標識される。これは、例えばプローブのハイブリダイゼーション、ポリメラーゼによる蛍光ヌクレオチドの取り込みおよび蛍光プローブのライゲーションによりなされる。
【0119】
実施例:単一プローブTGAGGCAGGAGAATによる全ゲノムマッピング。
【0120】
ゲノムDNAサンプルをニック反応に使用するため50ngまで希釈した。ラムダDNA(50ng/uL)の10uLを0.2mLのPCR遠心分離チューブに添加し、続いて10XNEBバッファー#2を2uL、およびこれに限定されるものではないがNb.BbvCI;Nb.BsmI;Nb.BsrDI;Nb.BtsI;Nt.AlwI;Nt.BbvCI;Nt.BspQI;Nt.BstNBIおよびNt.CviPIIを含むニッキングエンドヌクレアーゼを3uL添加した。混合液を1時間37度でインキュベートした。
【0121】
ニッキング反応が完了した後、本実施例では3’下流のストランドを置き換え、一本鎖フラップを生成するため、ニッキング部位に限定したポリメラーゼ伸長を続いて行った。フラップ形成反応混合物は、15ulのニッキング産物、および10Xバッファーを2ul、これに限定されるものではないがベント(エキソ−)を含むポリメラーゼを0.5ul、および1uMから1mMまでの様々な濃度でヌクレオチドを1ul含む組み込み混合物5ulから成る。フラップ形成反応混合液を55度でインキュベートした。フラップの長さはインキュベート時間、使用するポリメラーゼ、および使用するヌクレオチドの量で調整した。その結果、形成したフラップはハイブリダイズし、Nb.BbVCIに対するTGAGGCAGGAGAATのようなユニバーサルプローブで標識された。
【0122】
実施例:乳がんゲノム由来のMCF−7 3F5 BACクローンの再編成した構造の構造変異の確認。
【0123】
この領域は4つのセグメントから成る:3p14.1、14.1Kbブロックの逆位;20q12、PTPRT遺伝子のエクソン6を含む22.3Kbブロックの逆位;20p13.31、全プロモーター領域を伴う切断BMP7遺伝子のエクソン1を含む45.5Kbブロック;20p13.2、ZNF217遺伝子完全長を含む23.4Kbブロック。フラップにハイブリダイズする領域特異的なプローブが4つの領域、20q12に対するTGCCACCTACCCCT、20p13.31に対するAGAAGCCTGTCAGATGCAT、20p13.2に対するACTGTAGTCTTGAATTCCTGAおよび3p14.1に対するTCCTTGGTTGACCTAACAACACAの存在を確認するのに用いられる。
【0124】
実施例:検出スキーム
検出スキームの1つの例として、流しモードで移動するDNAのビデオ画象を時間遅延積分方式(TDI)カメラによりキャプチャーする。そのような実施形態において、DNAの挙動はTDIと同期する。
【0125】
検出スキームのもう1つの例として、流しモードで移動するDNAのビデオ画象をCCDまたはCMOSカメラによりキャプチャーし、映像をDNAの画象を同定し再構築するためソフトウェアまたはハードウェアに収集する。
【0126】
検出スキームのもう1つの例として、センサーの別々のセットで異なる波長を同時に捕えることにより、DNAのビデオ画象の収集を行う。これは、1台のカメラおよびデュアルまたはマルチビュースプリッターを用い、または、フィルタおよび複数のカメラを用い行うことが可能である。カメラは、TDI、CCDまたはCMOS検出システムである。
【0127】
別の実施例においては、同時複数の波長ビデオ検出を用い、基幹染料を一意的なDNA断片を同定するのに使用し、標識をDNAの挙動を追跡するマーカーとして使用する。これはDNAの長さがカメラの視野より大きい場合に有用であり、マーカーはDNA画象を再構築し図にするのに役立つ。
【特許請求の範囲】
【請求項1】
二本鎖DNAサンプルを解析する方法であって、
前記二本鎖サンプルから置き換えられる前記二本鎖DNAサンプルの第一鎖のフラップを生じさせるために、二本鎖DNAサンプルを処理する工程であって、
前記フラップの長さが約1〜約1000塩基の範囲であり、
前記フラップは、当該フラップに対応する前記二本鎖DNAサンプルの第一鎖中に、ギャップを生じさせるものである、前記処理する工程と、
前記ギャップの少なくとも一部を除去するために、1又はそれ以上の塩基を前記二本鎖DNAに組み込む工程と、
処理された前記二本鎖DNAの少なくとも一部を、1又はそれ以上のタグによって標識する工程と、
1又はそれ以上の標識の位置を、前記DNAサンプルの構造的特徴に関連付ける工程と
を有する方法。
【請求項2】
請求項1記載の方法において、前記処理する工程が、二本鎖DNAの第一鎖をニッキングする工程を有するものである、方法。
【請求項3】
請求項2記載の方法において、前記ニッキングする工程が、前記二本鎖DNA上の1又はそれ以上の配列特異的部位において達成されるものである、方法。
【請求項4】
請求項2記載の方法において、前記ニッキングする工程が、前記二本鎖DNA上の1又はそれ以上の非特異的部位において達成されるものである、方法。
【請求項5】
請求項2記載の方法において、前記ニッキングする工程が、ニッキングエンドヌクレアーゼ、一本鎖に切断をもたらす酵素、電磁放射線、フリーラジカル、又はそれらの任意の組合せに、前記二本鎖DNAを暴露することによって達成されるものである、方法。
【請求項6】
請求項1記載の方法において、1又はそれ以上の置換塩基を前記二本鎖DNAの第一鎖に組み込む工程が、ポリメラーゼ、1若しくはそれ以上のヌクレオチド、リガーゼ、又はそれらの任意の組合せに、前記二本鎖DNAの第一鎖を接触させる工程を有するものである、方法。
【請求項7】
請求項1記載の方法において、前記フラップの形成が、ポリメラーゼ伸長、1若しくはそれ以上のヌクレオチドの組込み、反応時間、反応ターミネーターの存在、又はそれらの任意の組合せによって調整されるものである、方法。
【請求項8】
請求項6記載の方法において、前記ポリメラーゼが、5’−3’置換活性を有するものである、方法。
【請求項9】
請求項8記載の方法において、前記ポリメラーゼが、ベントエキソ−ポリメラーゼを有するものである、方法。
【請求項10】
請求項7記載の方法において、1又はそれ以上のヌクレオチドが、dATP、dCTP、dTTP、dGTP、又はそれらの任意の組合せを有するものである、方法。
【請求項11】
請求項7記載の方法において、前記反応ターミネーターが、ddNTP、acylo−dNTP、又はそれらの任意の組合せを有するものである、方法。
【請求項12】
請求項1記載の方法において、前記標識する工程が、前記フラップの一部、DNAの第一鎖の一部、DNAの第二鎖の一部、又はそれらの任意の組合せに、少なくとも1つの相補的な標識プローブを結合させることによって達成されるものである、方法。
【請求項13】
請求項1記載の方法において、当該方法は、さらに、
2またはそれ以上の相補的なプローブを前記DNAサンプルにハイブリダイズする工程と、前記プローブを共にライゲーションする工程とを有するものである、方法。
【請求項14】
請求項1記載の方法において、当該方法は、さらに、
2またはそれ以上の相補的なプローブを、1又はそれ以上の塩基のギャップを前記プローブ間に持つ前記DNAサンプルにハイブリダイズする工程を有するものである、方法。
【請求項15】
請求項14記載の方法において、当該方法は、さらに、
前記ギャップの少なくとも一部を、1又はそれ以上のヌクレオチドによって充填する工程を有するものである、方法。
【請求項16】
請求項14記載の方法において、当該方法は、さらに、
前記ギャップの少なくとも一部を、1又はそれ以上の標識したヌクレオチドによって充填する工程を有するものである、方法。
【請求項17】
請求項15記載の方法において、1又はそれ以上のヌクレオチドが、ともにライゲーションされるものである、方法。
【請求項18】
請求項16記載の方法において、1又はそれ以上の標識したヌクレオチドが、ともにライゲーションされるものである、方法。
【請求項19】
請求項1記載の方法において、当該方法は、さらに、
前記フラップをニッキングエンドヌクレアーゼによって除去する工程を有するものである、方法。
【請求項20】
請求項1記載の方法において、当該方法は、さらに、
前記二本鎖DNAサンプルの少なくとも一部を伸長させる工程を有するものである、方法。
【請求項21】
請求項1記載の方法において、当該方法は、さらに、
1又はそれ以上のフラップを基質に付け加える工程を有するものである、方法。
【請求項22】
DNAから構造情報を取得する方法であって、
第1の二本鎖DNAサンプル上において、当該第1のサンプル上の1又はそれ以上の配列特異的部位に標識する工程と、
第2の二本鎖DNAサンプル上において、当該第2の二本鎖DNAサンプル上の対応する1又はそれ以上の配列特異的部位に標識する工程と、
前記第1の二本鎖DNAサンプルの少なくとも一部を伸長させる工程と、
前記第2の二本鎖DNAサンプルの少なくとも一部を伸長させる工程と、
伸長した前記第1の二本鎖DNAサンプルの少なくとも1つの標識についての、シグナルの強度、シグナルの位置、又はその両方と、伸長した前記第2の二本鎖DNAサンプルの少なくとも1つの標識についての、シグナルの強度、シグナルの位置、又はその両方とを比較する工程と
を有する方法。
【請求項23】
請求項22記載の方法において、前記標識する工程が、二本鎖DNAサンプルの第一鎖をニッキングすることで、(a)前記二本鎖DNAサンプルから分離した第一鎖のフラップと、(b)当該フラップと対応する前記二本鎖DNAサンプルの第一鎖におけるギャップであって、前記ニッキングの位置と、前記二本鎖DNAサンプルの第一鎖との前記フラップの接合位置とによって定義されるものである前記ギャップと、を生じさせることによって達成されるものである、方法。
【請求項24】
請求項22記載の方法において、当該方法は、さらに、
1又はそれ以上のプローブを、少なくとも1つの前記二本鎖DNAサンプルにハイブリダイズする工程を有するものである、方法。
【請求項25】
請求項22記載の方法において、1又はそれ以上のプローブが前記サンプルの少なくとも2つの領域にハイブリダイズすることができるように、前記1又はそれ以上のプローブが、1又はそれ以上の保存されたフラップの配列に結合するものである、方法。
【請求項26】
DNAから構造情報を取得する方法であって、
2またはそれ以上のプローブによって、二本鎖DNAサンプルの一本鎖DNAメンバーのフラップ上の2またはそれ以上の領域を標識する工程と、前記領域のうちの1又はそれ以上の領域の構造、配列、又はその両方に対する、前記2またはそれ以上の領域間の空間関係に、前記プローブの位置を関連付ける工程とを有する、方法。
【請求項27】
請求項26記載の方法において、2またはそれ以上のプローブが、互いに異なるものである、方法。
【請求項28】
請求項26記載の方法において、1又はそれ以上のプローブが、配列特異的である、方法。
【請求項29】
病原性の遺伝形質を同定する方法であって、
1又はそれ以上の標識プローブを、DNAサンプルの1又はそれ以上の領域に結合させる工程と、
1又はそれ以上のプローブの位置を、1又はそれ以上の前記プローブの存在する領域に一意的なシグナルに基づいて決定する工程と、
前記DNAサンプルに結合した1又はそれ以上のプローブの、位置、色、又はその両方と、1又はそれ以上の病原性の状態に対応することが知られているDNA領域からの、対応するシグナルとを比較する工程と
を有する方法。
【請求項30】
請求項29記載の方法において、当該方法は、さらに、
前記DNA上に1又はそれ以上のフラップを形成させる工程を有するものである、方法。
【請求項31】
請求項30記載の方法において、当該方法は、さらに、
前記DNAサンプルを2またはそれ以上の断片に分離する工程を有するものである、方法。
【請求項32】
請求項29記載の方法において、1又はそれ以上のプローブが、前記DNAサンプルの2またはそれ以上の領域に相補的である、方法。
【請求項33】
請求項29記載の方法において、当該方法は、さらに、
1又はそれ以上のフラップを基質に結合させる工程を有するものである、方法。
【請求項34】
請求項33記載の方法において、前記結合させる工程が、ビオチン−アビジンカップリングによって達成されるものである、方法。
【請求項35】
解析システムであって、
一本鎖又は二本鎖の核酸生体高分子をニッキング及び標識するための1又はそれ以上の領域と、
核酸生体高分子を伸長させるのに適した1又はそれ以上の領域と、
標識した核酸生体高分子から視覚的情報を収集するのに適した撮像装置と
を有する解析システム。
【請求項36】
請求項35に記載の解析システムにおいて、当該解析システムは、さらに、
核酸生体高分子上に配置された蛍光標識を励起させるのに適した、1又はそれ以上の照射源を有するものである、解析システム。
【請求項37】
請求項35記載の解析システムにおいて、前記撮像装置が、CCD装置を有するものである、解析システム。
【請求項38】
請求項37記載の解析システムにおいて、当該解析システムは、さらに、
標識した核酸生体高分子から得られた画像と、対照の画像とを比較するのに適したコンピュータを有するものである、解析システム。
【請求項39】
請求項35記載の解析システムにおいて、核酸生体高分子を伸長させるのに適した前記領域が、ナノチャネル、光ピンセット、流路、又はそれらの任意の組合せを有するものである、解析システム。
【請求項1】
二本鎖DNAサンプルを解析する方法であって、
前記二本鎖サンプルから置き換えられる前記二本鎖DNAサンプルの第一鎖のフラップを生じさせるために、二本鎖DNAサンプルを処理する工程であって、
前記フラップの長さが約1〜約1000塩基の範囲であり、
前記フラップは、当該フラップに対応する前記二本鎖DNAサンプルの第一鎖中に、ギャップを生じさせるものである、前記処理する工程と、
前記ギャップの少なくとも一部を除去するために、1又はそれ以上の塩基を前記二本鎖DNAに組み込む工程と、
処理された前記二本鎖DNAの少なくとも一部を、1又はそれ以上のタグによって標識する工程と、
1又はそれ以上の標識の位置を、前記DNAサンプルの構造的特徴に関連付ける工程と
を有する方法。
【請求項2】
請求項1記載の方法において、前記処理する工程が、二本鎖DNAの第一鎖をニッキングする工程を有するものである、方法。
【請求項3】
請求項2記載の方法において、前記ニッキングする工程が、前記二本鎖DNA上の1又はそれ以上の配列特異的部位において達成されるものである、方法。
【請求項4】
請求項2記載の方法において、前記ニッキングする工程が、前記二本鎖DNA上の1又はそれ以上の非特異的部位において達成されるものである、方法。
【請求項5】
請求項2記載の方法において、前記ニッキングする工程が、ニッキングエンドヌクレアーゼ、一本鎖に切断をもたらす酵素、電磁放射線、フリーラジカル、又はそれらの任意の組合せに、前記二本鎖DNAを暴露することによって達成されるものである、方法。
【請求項6】
請求項1記載の方法において、1又はそれ以上の置換塩基を前記二本鎖DNAの第一鎖に組み込む工程が、ポリメラーゼ、1若しくはそれ以上のヌクレオチド、リガーゼ、又はそれらの任意の組合せに、前記二本鎖DNAの第一鎖を接触させる工程を有するものである、方法。
【請求項7】
請求項1記載の方法において、前記フラップの形成が、ポリメラーゼ伸長、1若しくはそれ以上のヌクレオチドの組込み、反応時間、反応ターミネーターの存在、又はそれらの任意の組合せによって調整されるものである、方法。
【請求項8】
請求項6記載の方法において、前記ポリメラーゼが、5’−3’置換活性を有するものである、方法。
【請求項9】
請求項8記載の方法において、前記ポリメラーゼが、ベントエキソ−ポリメラーゼを有するものである、方法。
【請求項10】
請求項7記載の方法において、1又はそれ以上のヌクレオチドが、dATP、dCTP、dTTP、dGTP、又はそれらの任意の組合せを有するものである、方法。
【請求項11】
請求項7記載の方法において、前記反応ターミネーターが、ddNTP、acylo−dNTP、又はそれらの任意の組合せを有するものである、方法。
【請求項12】
請求項1記載の方法において、前記標識する工程が、前記フラップの一部、DNAの第一鎖の一部、DNAの第二鎖の一部、又はそれらの任意の組合せに、少なくとも1つの相補的な標識プローブを結合させることによって達成されるものである、方法。
【請求項13】
請求項1記載の方法において、当該方法は、さらに、
2またはそれ以上の相補的なプローブを前記DNAサンプルにハイブリダイズする工程と、前記プローブを共にライゲーションする工程とを有するものである、方法。
【請求項14】
請求項1記載の方法において、当該方法は、さらに、
2またはそれ以上の相補的なプローブを、1又はそれ以上の塩基のギャップを前記プローブ間に持つ前記DNAサンプルにハイブリダイズする工程を有するものである、方法。
【請求項15】
請求項14記載の方法において、当該方法は、さらに、
前記ギャップの少なくとも一部を、1又はそれ以上のヌクレオチドによって充填する工程を有するものである、方法。
【請求項16】
請求項14記載の方法において、当該方法は、さらに、
前記ギャップの少なくとも一部を、1又はそれ以上の標識したヌクレオチドによって充填する工程を有するものである、方法。
【請求項17】
請求項15記載の方法において、1又はそれ以上のヌクレオチドが、ともにライゲーションされるものである、方法。
【請求項18】
請求項16記載の方法において、1又はそれ以上の標識したヌクレオチドが、ともにライゲーションされるものである、方法。
【請求項19】
請求項1記載の方法において、当該方法は、さらに、
前記フラップをニッキングエンドヌクレアーゼによって除去する工程を有するものである、方法。
【請求項20】
請求項1記載の方法において、当該方法は、さらに、
前記二本鎖DNAサンプルの少なくとも一部を伸長させる工程を有するものである、方法。
【請求項21】
請求項1記載の方法において、当該方法は、さらに、
1又はそれ以上のフラップを基質に付け加える工程を有するものである、方法。
【請求項22】
DNAから構造情報を取得する方法であって、
第1の二本鎖DNAサンプル上において、当該第1のサンプル上の1又はそれ以上の配列特異的部位に標識する工程と、
第2の二本鎖DNAサンプル上において、当該第2の二本鎖DNAサンプル上の対応する1又はそれ以上の配列特異的部位に標識する工程と、
前記第1の二本鎖DNAサンプルの少なくとも一部を伸長させる工程と、
前記第2の二本鎖DNAサンプルの少なくとも一部を伸長させる工程と、
伸長した前記第1の二本鎖DNAサンプルの少なくとも1つの標識についての、シグナルの強度、シグナルの位置、又はその両方と、伸長した前記第2の二本鎖DNAサンプルの少なくとも1つの標識についての、シグナルの強度、シグナルの位置、又はその両方とを比較する工程と
を有する方法。
【請求項23】
請求項22記載の方法において、前記標識する工程が、二本鎖DNAサンプルの第一鎖をニッキングすることで、(a)前記二本鎖DNAサンプルから分離した第一鎖のフラップと、(b)当該フラップと対応する前記二本鎖DNAサンプルの第一鎖におけるギャップであって、前記ニッキングの位置と、前記二本鎖DNAサンプルの第一鎖との前記フラップの接合位置とによって定義されるものである前記ギャップと、を生じさせることによって達成されるものである、方法。
【請求項24】
請求項22記載の方法において、当該方法は、さらに、
1又はそれ以上のプローブを、少なくとも1つの前記二本鎖DNAサンプルにハイブリダイズする工程を有するものである、方法。
【請求項25】
請求項22記載の方法において、1又はそれ以上のプローブが前記サンプルの少なくとも2つの領域にハイブリダイズすることができるように、前記1又はそれ以上のプローブが、1又はそれ以上の保存されたフラップの配列に結合するものである、方法。
【請求項26】
DNAから構造情報を取得する方法であって、
2またはそれ以上のプローブによって、二本鎖DNAサンプルの一本鎖DNAメンバーのフラップ上の2またはそれ以上の領域を標識する工程と、前記領域のうちの1又はそれ以上の領域の構造、配列、又はその両方に対する、前記2またはそれ以上の領域間の空間関係に、前記プローブの位置を関連付ける工程とを有する、方法。
【請求項27】
請求項26記載の方法において、2またはそれ以上のプローブが、互いに異なるものである、方法。
【請求項28】
請求項26記載の方法において、1又はそれ以上のプローブが、配列特異的である、方法。
【請求項29】
病原性の遺伝形質を同定する方法であって、
1又はそれ以上の標識プローブを、DNAサンプルの1又はそれ以上の領域に結合させる工程と、
1又はそれ以上のプローブの位置を、1又はそれ以上の前記プローブの存在する領域に一意的なシグナルに基づいて決定する工程と、
前記DNAサンプルに結合した1又はそれ以上のプローブの、位置、色、又はその両方と、1又はそれ以上の病原性の状態に対応することが知られているDNA領域からの、対応するシグナルとを比較する工程と
を有する方法。
【請求項30】
請求項29記載の方法において、当該方法は、さらに、
前記DNA上に1又はそれ以上のフラップを形成させる工程を有するものである、方法。
【請求項31】
請求項30記載の方法において、当該方法は、さらに、
前記DNAサンプルを2またはそれ以上の断片に分離する工程を有するものである、方法。
【請求項32】
請求項29記載の方法において、1又はそれ以上のプローブが、前記DNAサンプルの2またはそれ以上の領域に相補的である、方法。
【請求項33】
請求項29記載の方法において、当該方法は、さらに、
1又はそれ以上のフラップを基質に結合させる工程を有するものである、方法。
【請求項34】
請求項33記載の方法において、前記結合させる工程が、ビオチン−アビジンカップリングによって達成されるものである、方法。
【請求項35】
解析システムであって、
一本鎖又は二本鎖の核酸生体高分子をニッキング及び標識するための1又はそれ以上の領域と、
核酸生体高分子を伸長させるのに適した1又はそれ以上の領域と、
標識した核酸生体高分子から視覚的情報を収集するのに適した撮像装置と
を有する解析システム。
【請求項36】
請求項35に記載の解析システムにおいて、当該解析システムは、さらに、
核酸生体高分子上に配置された蛍光標識を励起させるのに適した、1又はそれ以上の照射源を有するものである、解析システム。
【請求項37】
請求項35記載の解析システムにおいて、前記撮像装置が、CCD装置を有するものである、解析システム。
【請求項38】
請求項37記載の解析システムにおいて、当該解析システムは、さらに、
標識した核酸生体高分子から得られた画像と、対照の画像とを比較するのに適したコンピュータを有するものである、解析システム。
【請求項39】
請求項35記載の解析システムにおいて、核酸生体高分子を伸長させるのに適した前記領域が、ナノチャネル、光ピンセット、流路、又はそれらの任意の組合せを有するものである、解析システム。
【図1】
【図2】
【図3】
【図4】
【図5A】
【図5B】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図2】
【図3】
【図4】
【図5A】
【図5B】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【公表番号】特表2013−507964(P2013−507964A)
【公表日】平成25年3月7日(2013.3.7)
【国際特許分類】
【出願番号】特願2012−535362(P2012−535362)
【出願日】平成22年10月21日(2010.10.21)
【国際出願番号】PCT/US2010/053513
【国際公開番号】WO2011/050147
【国際公開日】平成23年4月28日(2011.4.28)
【出願人】(509018638)バイオナノ ジェノミックス、インク. (7)
【Fターム(参考)】
【公表日】平成25年3月7日(2013.3.7)
【国際特許分類】
【出願日】平成22年10月21日(2010.10.21)
【国際出願番号】PCT/US2010/053513
【国際公開番号】WO2011/050147
【国際公開日】平成23年4月28日(2011.4.28)
【出願人】(509018638)バイオナノ ジェノミックス、インク. (7)
【Fターム(参考)】
[ Back to top ]