説明

ペアエンド配列決定の方法

インビトロの反応において標的核酸の2つの末端領域を含むDNA構築物を得るための方法の態様が開示される。本方法は、以下の工程を含む:大きな核酸分子を断片化し、標的核酸分子を生成する工程;組換えアダプターエレメントを標的核酸分子の各末端へライゲーションし、アダプター付加標的核酸分子を生成する工程;アダプター付加標的核酸を部位特異的リコンビナーゼへ曝露し、アダプター付加標的核酸から環状核酸産物および直鎖状核酸産物を生成する工程であって、環状核酸産物が標的核酸分子を含む、工程;ならびに、環状核酸産物を断片化し、標的核酸分子の各末端由来の配列領域を含む鋳型核酸分子を生成する工程。


【発明の詳細な説明】
【技術分野】
【0001】
発明の分野
本発明は、核酸配列決定、ゲノム配列決定、および連続配列への配列決定結果のアセンブリの分野に関する。
【背景技術】
【0002】
発明の背景
ヒトゲノムなどの大きな標的核酸を配列決定する1つのアプローチは、ショットガン配列決定の使用である。ショットガン配列決定において、標的核酸は、一連の重複する核酸フラグメントを生成するために断片化またはサブクローニングされ、これらのフラグメントの配列が決定される。各フラグメントの配列の重複および知見に基づいて、標的核酸の完全な配列が、構築され得る。
【0003】
配列決定に対するショットガンアプローチの不利な点の1つは、標的核酸配列が多数の小さな反復配列(縦列または逆方向反復配列)を含む場合に、アセンブリが困難であり得ることである。反復領域においてゲノム配列をアセンブリできないと、アセンブリされた配列においてギャップが生じる。従って、核酸配列の最初のアセンブリの後、配列範囲におけるギャップは、埋められる必要があり、アセンブリにおける不確実性は、解消される必要がある。
【0004】
これらのギャップを解消する1つの方法は、配列決定のためにより大きなクローンまたはフラグメントを使用することである。これは、これらのより大きなフラグメントが、反復領域にまたがるのに十分なほど長いためである。しかし、核酸の大きなフラグメントの配列決定は、現行の配列決定装置では、より困難でありかつ時間がかかる。
【0005】
配列中のギャップにまたがることへの別のアプローチは、大きなフラグメントの両方の末端の配列を決定することである。ショットガン配列決定フラグメントの一方の末端の単一の配列読み取りとは対照的に、両方の末端からの一対の配列読み取りは、既知のスペーシングおよび方向を有する。比較的長いフラグメントの使用はまた、散在する反復エレメントを含む配列のアセンブリに役立つ。このタイプのアプローチ(Smith, M.W. et al., Nature Genetics 7: 40-47 (1994)(非特許文献1))は、ペアエンド配列決定(paired-end sequencing)として当技術分野において公知である。本発明は、ペアエンド配列決定アプローチおよび他の核酸技術に有用な新規の方法、システムおよび組成物を含む。
【先行技術文献】
【非特許文献】
【0006】
【非特許文献1】Smith, M.W. et al., Nature Genetics 7: 40-47 (1994)
【発明の概要】
【0007】
本発明の一態様は、生物のゲノム由来の大きなセグメントであり得る、標的核酸の2つの末端領域を含むDNA構築物をインビトロの反応において得るための方法に向けられる。本方法は、以下の工程を含む。
【0008】
インビトロの反応において標的核酸の2つの末端領域を含むDNA構築物を得るための方法の態様が記載され、これは、以下の工程を含む:大きな核酸分子を断片化し、標的核酸分子を生成する工程;組換えアダプターエレメントを標的核酸分子の各末端へライゲーションし、アダプター付加(adapted)標的核酸分子を生成する工程;アダプター付加標的核酸を部位特異的リコンビナーゼへ曝露し、アダプター付加標的核酸から環状核酸産物および直鎖状核酸産物を生成する工程であって、環状核酸産物が標的核酸分子を含む、工程;ならびに、環状核酸産物を断片化し、標的核酸分子の各末端由来の配列領域を含む鋳型核酸分子を生成する工程。
【0009】
ある実施において、前記方法は、エキソヌクレアーゼを使用して非環状分子を除去する工程をさらに含む。さらに、ある実施において、本方法は、以下の工程をさらに含む:環状核酸産物へ複数の環状キャリアDNA分子を添加する工程;環状核酸産物およびキャリアDNA分子を断片化し、鋳型分子および複数の直鎖状キャリア分子を生成する工程;鋳型分子および直鎖状キャリア分子から断片化の効率を測定する工程;鋳型分子を増幅し、複数の実質的に同一のコピーを含む集団を生成する工程であって、直鎖状キャリア分子が増幅不能である、工程;ならびに、前記集団を配列決定し、鋳型核酸の配列組成を含む配列データを作成する工程。
【0010】
本発明の方法は、DNAの大きなフラグメント由来の末端を含有するDNA構築物のライブラリーを作製するために、複数の標的DNAフラグメントに対して同時に行われ得る。本発明の1つの利点は、ライブラリーが、原核生物または真核生物宿主細胞を使用することなく、インビトロで構築され得ることである。
【0011】
従って、本発明は、インビトロの反応において標的核酸の2つの末端領域を含むDNA構築物を得るための方法であって、以下の工程を含む方法に関する:
核酸を断片化し、標的核酸分子を生成する工程;
組換えアダプターエレメントを標的核酸分子の各末端へライゲーションし、アダプター付加標的核酸分子を生成する工程;
アダプター付加標的核酸を部位特異的リコンビナーゼへ曝露し、アダプター付加標的核酸から環状核酸産物および直鎖状核酸産物を生成する工程であって、環状核酸産物が標的核酸分子を含む、工程;ならびに
環状核酸産物を断片化し、標的核酸分子の各末端由来の配列領域を含む鋳型核酸分子を生成する工程。
【0012】
断片化される核酸は、非常に大きな分子からなってもよい。例えば、前記核酸は、先に実質的にせん断されたかまたはそうでなければ予め断片化された、ゲノムDNAであり得る。この文脈において、新規の本方法は、少なくとも3Kb、少なくとも8Kb、少なくとも10Kb、少なくとも20Kb、少なくとも50Kb、および少なくとも100Kbからなる群より選択される長さを含む標的核酸分子に特に好適である。
【0013】
本発明の文脈において使用され得る部位特異的リコンビナーゼについての顕著な例は、Creリコンビナーゼである。
【0014】
環状核酸産物を断片化するための好ましい方法は、噴霧化の工程を含む。好ましくは、環状核酸産物を断片化する工程は、II型制限酵素を使用する環状核酸産物の第1の破壊、および噴霧化を使用する第2の破壊をさらに含み、ここで、II型制限酵素が、環状核酸産物のハイブリッドアダプター領域中の制限部位を切断し、標的核酸由来の短い配列領域を生成し、噴霧化が、標的核酸由来の長い配列領域を生成する。例えば、II型制限酵素はMmeIを含み、短い配列領域は20bp配列長を含む。
【0015】
第1の態様において、アダプター付加標的核酸を部位特異的リコンビナーゼへ曝露する工程の後、前記方法は、非環状分子を除去する工程をさらに含む。好ましくは、非環状分子は、直鎖状核酸産物およびアダプターダイマー産物を含み、ここで、アダプターダイマー産物は、互いへの2つの組換えアダプターエレメントのライゲーションから作製される。また好ましくは、前記方法は、少なくとも1つのエキソヌクレアーゼを使用して非環状分子を除去する工程をさらに含む。
【0016】
また好ましくは、前記方法は、さらに以下の工程を含む:
− 環状核酸産物へ複数の環状キャリアDNA分子を添加する工程;
− 環状核酸産物およびキャリアDNA分子を断片化し、鋳型分子および複数の直鎖状キャリア分子を生成する工程;
− 鋳型分子および直鎖状キャリア分子から断片化の効率を測定する工程;
− 鋳型分子を増幅し、複数の実質的に同一のコピーを含む集団を生成する工程であって、直鎖状キャリア分子が増幅不能である、工程;ならびに、
− 前記集団を配列決定し、鋳型核酸の配列組成を含む配列データを作成する工程。
【0017】
特に好ましくは、環状キャリア分子は、pUC19を含む。また特に好ましくは、環状キャリア分子は、損傷DNAを含み、ここで、損傷DNAは増幅不能である。その場合、損傷DNAは、UV損傷、アルキル化/メチル化、X線損傷、加水分解、および酸化的損傷からなる群より選択されるタイプの損傷を有し得る。
【0018】
上記に開示される第1の態様と適合性であり、これと組み合わせられ得る、第2の態様において、本発明の方法は、さらに以下の工程を含む:
− 鋳型核酸を増幅し、複数の実質的に同一のコピーを含む集団を生成する工程;および
− 前記集団を配列決定し、鋳型核酸の配列組成を含む配列データを作成する工程。
【0019】
好ましくは、前記方法は、第2のセットのアダプターエレメントを鋳型核酸分子へライゲーションする工程をさらに含み、ここで、第2のセットのアダプターエレメントが、第1のプライマーエレメントおよび第2のプライマーエレメントを含み、ここで、増幅工程が第1のプライマーエレメントを使用し、配列決定工程が第2のプライマーエレメントを使用する。
【0020】
また好ましくは、鋳型核酸の配列組成は、標的分子の末端由来の配列領域の各々についての配列組成を含む。
【0021】
上記に開示される第1および第2の態様と適合性であり、これらと組み合わせられ得る、第3の態様において、組換えアダプターエレメントは、第1の組換えアダプターエレメントおよび第2の組換えアダプターエレメントを含み、ここで、第1および第2の組換えアダプターエレメントが両方とも方向エレメントを含む。
【0022】
好ましくは、環状核酸産物および直鎖状核酸産物は、第1および第2の組換えアダプターエレメント中の方向エレメントが同一の方向関係にある場合に、生成される。その場合、第1および第2の組換えアダプターエレメントは、方向エレメントの同一の方向関係を促進する方向で標的核酸分子へライゲーションする平滑末端を各々が含み得る。
【0023】
また好ましくは、第1および第2の組換えアダプターエレメントは、アダプターコンカテマーの形成を阻害する突出末端を含む。また好ましくは、方向エレメントは、lox配列エレメントを含む。また好ましくは、第1および第2の組換えアダプターエレメントは、方向エレメントの両方の末端にフランキングするパリンドローム配列エレメントを含む。
【0024】
上記に開示される第1および第2の態様と適合性であり、これらと組み合わせられ得る、第4の態様において、環状核酸産物は第1のハイブリッド組換えアダプターを含み、直鎖状核酸産物は第2のハイブリッド組換えアダプターを含み、ここで、第1および第2のハイブリッド組換えアダプターは、ライゲーションされた組換えアダプター由来のエレメントを含む。
【0025】
好ましくは、鋳型核酸は、末端配列領域間に配置された第1のハイブリッド組換えアダプターを含む。非常に好ましくは、鋳型核酸は、第1のハイブリッド組換えアダプターと結合された少なくとも1つの濃縮タグを含む。前記濃縮タグは、例えば、ビオチンタグであり得る。
【0026】
さらに、本発明は、インビトロの反応において、標的核酸の2つの末端領域を含む複数のDNA構築物を得るための方法であって、以下の工程を含む方法に関する:
− 大きな核酸分子を断片化し、複数の標的核酸分子を生成する工程;
− 組換えアダプターエレメントを標的核酸分子の各末端へライゲーションし、複数のアダプター付加標的核酸分子を生成する工程;
− アダプター付加標的核酸分子を部位特異的リコンビナーゼへ曝露し、アダプター付加標的核酸分子から複数の環状核酸産物および複数の直鎖状核酸産物を生成する工程であって、環状核酸産物が標的核酸分子を含む、工程;ならびに
− 環状核酸産物を断片化し、標的核酸分子の各末端由来の配列領域を含む複数の鋳型核酸分子を生成する工程。
【0027】
さらに、本発明は、上記に開示される方法を行うためのキットであって、
− 複数の組換えアダプターエレメント;および
− 部位特異的リコンビナーゼ、
を含むキットを提供する。
【0028】
部位特異的リコンビナーゼは、好ましくは、Creリコンビナーゼである。
【0029】
特に、このようなキットは、
− 複数の組換えアダプターエレメント;
− 部位特異的リコンビナーゼ、例えば、Creリコンビナーゼ;
− エキソヌクレアーゼ;および
− 環状キャリアDNA、例えば、pUC19 DNA
を含み得る。
【0030】
例として与えられる以下の詳細な説明は、記載される特定の態様に本発明を限定するようには意図されず、参照により本明細書に組み入れられる添付の図面と組み合わせて理解され得る。
【図面の簡単な説明】
【0031】
(図1)図1A〜1Mは、ペアエンド配列決定ストラテジーの一態様の概略図を示す。数値ラベルは、核酸の起源を示す。「101」は、例えば、図3Aの左側に示される捕捉エレメントの1つのフランキング領域を示す。「102」は、例えば、図3Aの右側に示される、捕捉エレメントの第2のフランキング領域を示す。「103」は、捕捉エレメントを示す。「104」は、断片化された(および任意でサイズ分画された)出発核酸を示す。「105」は、セパレーターエレメントを示す。「106」は、ポリメラーゼを示す。
(図2)ペアエンド配列決定ストラテジーの第2の態様の概略図を示す。
(図3)捕捉フラグメントの配列および設計を示す。配列のアイデンティティーは、以下の通りである:
ペアエンド捕捉フラグメント産物 SEQ ID NO:1
オリゴ1 SEQ ID NO:2
オリゴ2 SEQ ID NO:3
オリゴ3 SEQ ID NO:4
オリゴ4 SEQ ID NO:5
ペアエンド捕捉フラグメント産物(IIS型、MmeI) SEQ ID NO:6
短いアダプターペアエンド捕捉フラグメント SEQ ID NO:7
短いアダプターペアエンド捕捉フラグメント(IIS型、MmeI) SEQ ID NO:8。
(図4)REフラグメントの一態様を示す。
(図5)REフラグメントの別の態様を示す。
(図6)図6A〜6Fは、ヘアピンアダプターを使用するペアエンド読み取りアプローチを示す。ヘアピンアダプターは、以下の配列を有する:

ヘアピンアダプターは、1つの連続した核酸配列であり、これは、上記の4つの領域へと分割されるように示されている。4つの領域は、左から右へ、ヘアピン領域、制限エンドヌクレアーゼ認識部位、ビオチン化領域、およびIIS型制限エンドヌクレアーゼ認識部位である。「601」は、ヘアピンアダプターを示す。「603」は、ゲノムDNAを示す。Metは、メチル化DNAを示す。「602」は、ヘアピンアダプターダイマーを示す。「604」は、制限エンドヌクレアーゼによって切断されたヘアピンアダプターを示す。「605」は、制限エンドヌクレアーゼによって切断され、再度ライゲーションされた、2つのヘアピンアダプターを示す。SAは、ストレプトアビジンビーズを示す。Bioは、ビオチン(例えば、ビオチン化DNA)を示す。
(図7)ペアエンド手順に対する改善を示す。
(図8)図8A〜8Kは、突出アダプターを用いてのペアエンド読み取りアプローチを示す。
(図9)本発明の産物を配列決定するための1つの方法である「タグ・プライムド」ダブル・エンディッド配列決定を示す。
(図10)アダプター連結された環化を示す。
(図11)ssDNAに基づく環化を示す。
(図12)図12A〜12Iは、ペアエンド配列決定ストラテジー−ペア読み取りPETランダム断片化(Paired-Reads PET Random Fragmentation)の別の態様の概略図を示す。SPRIは、固相可逆的固定化を指す。
(図13)大腸菌K12を配列決定することからのペア読み取りPETランダム断片化配列決定データを示す。
(図14)図14A〜14Eは、大腸菌エンドヌクレアーゼVによる二本鎖DNA切断の種々の方法を示す。囲まれたヌクレオチド「I」は、デオキシイノシンを示す。図14Aは、二本鎖DNAのヌクレオチド配列が、3’一本鎖パリンドローム突出を生じさせるように大腸菌エンドヌクレアーゼVによる二本鎖切断を指示する方法を示す。3’一本鎖突出がデオキシイノシン残基を含むことに留意すること。図14Bは、二本鎖DNAのヌクレオチド配列が、3'一本鎖非パリンドローム突出を生じさせるように大腸菌エンドヌクレアーゼVによる二本鎖切断を指示する方法を示す。3'一本鎖突出がデオキシイノシン残基を含むことに留意すること。図14Cは、二本鎖DNAのヌクレオチド配列が、5'一本鎖パリンドローム突出を生じさせるように大腸菌エンドヌクレアーゼVによる二本鎖切断を指示する方法を示す。5'一本鎖突出がデオキシイノシン残基を含まないことに留意すること。図14Dは、二本鎖DNAのヌクレオチド配列が、5'一本鎖非パリンドローム突出を生じさせるように大腸菌エンドヌクレアーゼVによる二本鎖切断を指示する方法を示す。5'一本鎖突出がデオキシイノシン残基を含まないことに留意すること。図14Eは、二本鎖DNAのヌクレオチド配列が、平滑末端を生じさせるように大腸菌エンドヌクレアーゼVによる二本鎖切断を指示する方法を示す。
(図15)図15A〜15Iは、逆の鎖にデオキシイノシンを含有するヘアピンアダプター(デオキシイノシンヘアピンアダプター)の大腸菌エンドヌクレアーゼVによる二本鎖切断を用いたペアエンド配列決定ストラテジーの別の態様の概略図を示す。
(図16)図15に示されるデオキシイノシンヘアピンアダプター法を使用する大腸菌K12ゲノムDNAの配列決定から得られたペア読み取り距離の分布を示す。
(図17)本発明のペアエンド配列決定法の別の態様の概略図を示す。ヘアピンアダプター、ペアエンドアダプター(「A」および「B」)ならびにPCRプライマー「F-PCR」および「R-PCR」のヌクレオチド配列は、図18に示される。ペアエンドアダプターの各々は、図18に示されるような二本鎖部分および一本鎖部分を有する。「Bio」は、ビオチンを示す。「Met」は、メチル化塩基を示す。「SA-ビーズ」は、ストレプトアビジンコーティングされた微粒子を示す。「EcoRI」および「MmeI」は、それぞれ、制限エンドヌクレアーゼEcoRIおよびMmeIに対する認識部位を示す。
(図18)図17に示されるアダプターおよびプライマーオリゴヌクレオチドのヌクレオチド配列および修飾を示す。図18Aは、ヘアピンアダプター配列を示す。「iBiodT」は、内部ビオチン標識デオキシチミンを示す。「Bio」は、ビオチンを示す。「EcoRI」および「MmeI」は、それぞれ、制限エンドヌクレアーゼEcoRIおよびMmeIに対する認識部位を示す。図18Bは、ペアエンドアダプター配列およびPCRプライマーヌクレオチド配列を示す。ペアエンドアダプターの各々(「A」および「B」)は、2つの一本鎖オリゴヌクレオチド、「A上部」および「A下部」、「B上部」および「B下部」のアニーリングによって生成される。図18Bに示されるポリヌクレオチド配列の5'末端は、リン酸化されていない。
(図19)油中水型エマルジョンにおけるポリヌクレオチドライゲーションのための方法の一態様の概略図を示す。
(図20)MmeI部位含有キャリアDNAを伴ってかまたは伴わずに得られたペアエンド配列決定データによって達成された大腸菌K12ゲノムDNAの範囲の深さのグラフを示す。
(図21)組換えに基づくペアエンドストラテジーのための方法の一態様の概略図を示す。
(図22)図21の組換えに基づくストラテジーに有用なアダプターの一態様、およびそれから作製されたアダプター産物を示す。SEQ ID NO:57〜64は、出現順に、本明細書に示される。
(図23)アダプター方向性に基づく図21の組換えに基づくストラテジーの産物の概略図を示す。
(図24)図21に示される組換えに基づく方法に少なくとも一部分基づく、大腸菌K12ゲノムDNAの配列決定から得られたペア読み取り距離の分布を示す。
(図25)図21の組換えに基づく方法を使用して生成された長いペアエンドフラグメントから作成された配列情報から提供された利点の概略図を示す。
【発明を実施するための形態】
【0032】
発明の詳細な説明
他に定義されない限り、本明細書において使用される全ての技術用語および科学用語は、本発明が属する分野の当業者によって一般的に理解されるのと同一の意味を有する。本明細書に記載されるものと類似するかまたは同等である多くの方法および材料が、本発明の実施において使用され得るが、好ましい材料および方法が、本明細書に記載される。
【0033】
本発明は、核酸の大きなフラグメントの両方の末端を単離および配列決定するための迅速でありかつ費用対効果の高い方法に関する。前記方法は、迅速であり、自動化が適用でき、DNAの大きなフラグメントの配列決定および連結を可能にする。
【0034】
ペアエンド配列決定は、従来の階層的ショットガン配列決定と比較して多数の重要な利点を有し、事実、階層的ショットガン配列決定を補完するものである。これらの利点の間で最も重要なものは、ゲノムに反復エレメントが散在している場合であっても、大きなゲノムの足場を迅速に作る能力である。本発明の方法は、インビトロの反応からDNAフラグメントのライブラリーを生成するために使用され得、ここで、これらのフラグメントは、DNAのより大きなフラグメント由来の末端を含む。なおさらに、本発明の方法は、少なくとも10kbまたはそれより大きい末端間のペア距離スペーシング(paired distance spacing)を使用することによって、最小限の配列決定の試みにより、全体のゲノム足場をアセンブリするために使用され得る。
【0035】
第1の方法
一態様において、ペアエンド配列決定は、以下の工程において行われ得る。
【0036】
工程1A
出発材料は、任意の核酸であり得、これらとしては、例えば、ゲノムDNA、cDNA、RNA、PCR産物、エピソームなどが挙げられる。本発明の方法が、核酸出発材料の長いストレッチに対して特に有効である一方で、本発明はまた、小さな核酸、例えば、コスミド、プラスミド、小さなPCR産物、ミトコンドリアDNAなどに適用可能である。
【0037】
DNAは、任意の供給源由来であり得る。例えば、DNAは、そのDNA配列が未知であるかまたは完全には知られていない生物のゲノム由来であり得る。別の例として、DNAは、そのDNA配列が公知である生物のゲノム由来であり得る。公知のゲノムのDNAを配列決定することは、研究者がゲノム多型についてのデータを収集し、遺伝子型を疾患と相関させることを可能にする。
【0038】
核酸出発材料は、公知のサイズまたは公知の範囲のサイズのものであり得る。例えば、出発材料は、平均の挿入物サイズおよび分布が公知であるcDNAライブラリーまたはゲノムライブラリーであり得る。
【0039】
あるいは、核酸出発材料は、多数の一般的に使用される方法のいずれか1つによって断片化され得(図1A)、これらとしては、噴霧化、音波破砕、HydroShear、超音波断片化、酵素的切断(例えば、リミテッドDNase処理を含むDNase処理、RNase処理(リミテッドRNase処理を含む)、および制限エンドヌクレアーゼによる消化)、予め断片化されたライブラリー(cDNAライブラリーにおけるような)、および化学物質(例えば、NaOH)誘導断片化、熱誘導断片化、およびDNAサンプル全体に切断部位、例えば、制限エンドヌクレアーゼ切断部位を導入し得るトランスポゾン媒介変異が挙げられる。Goryshin I.Y. and Reznikoff W.S., J Biol Chem. 1998 Mar 27;273(13):7367-74;Reznikoff W.S. et al., Methods Mol Biol. 2004;260:83-96;Oscar R. et al., Journal of Bacteriology, April 2001, p.2384-2388, Vol.183, No.7;Pelicic, V. et al., Journal of Bacteriology, October 2000, p.5391-5398, Vol.182を参照のこと。
【0040】
いくつかの断片化法、例えば、噴霧化は、2倍だけサイズが異なる標的DNAフラグメントの集団を生成し得る。他の分画方法、例えば、制限酵素消化は、より広い範囲のサイズをもたらす。さらに他の方法、例えば、HydroShearingは、大きな核酸フラグメントが望まれる場合に好まれ得る。HydroShearing(Genomic Solutions, Ann Arbor, MI, USA)において、溶液中のDNAは、急激な収縮を有するチューブに通される。収縮に近づくにつれ、収縮のより小さな領域を通る体積流量を維持するために、流体が加速される。この加速の間、抗力により、DNAは切れるまで引き伸ばされる。せん断力が化学結合を破壊するには断片が短すぎるようになるまで、DNAは断片化する。流体の流量および収縮のサイズは、最終的なDNAフラグメントサイズを決定する。核酸出発材料を作製するためのさらなる方法は、国際特許出願第WO04/070007号に見出され、これは、参照によりその全体が本明細書に組み入れられる。
【0041】
使用される断片化法に依存して、DNAの末端は、ポリッシュを必要とし得る。即ち、二本鎖DNA末端は、平滑末端にしてライゲーションに対して適切になるように処理される必要があり得る。この工程は、断片化法に依存して当技術分野で公知の様式において多様である。例えば、機械的にせん断されたDNAは、配列の突出を切断するためにBal31を使用してポリッシュされ得、ポリメラーゼ、例えば、クレノウ、T4ポリメラーゼ、およびdNTPは、充填して平滑末端を生成するために使用され得る。
【0042】
工程1B
フラグメントのサイズが、所望よりも変化に富む場合、核酸フラグメントは、このサイズバリエーションを減少させるためにサイズ分画され得る。
【0043】
サイズ分画は、当技術分野において公知の多数の方法によって行われ得る任意の工程である。サイズ分画のための方法としては、ゲル法、例えば、パルスゲル電気泳動、およびスクロース勾配または塩化セシウム勾配による沈降、およびサイズ排除クロマトグラフィー(ゲル透過クロマトグラフィー)が挙げられる。選択されるサイズ範囲の選択は、ペアエンド配列決定によってまたぐ領域の長さに基づく。
【0044】
サイズ分画のための1つの好ましい技術は、ゲル電気泳動である(図1Bを参照のこと)。好ましい態様において、サイズ分画されたDNAフラグメントは、互いの25%以内であるサイズ分布を有する。例えば、5Kbサイズの分画は、5Kb+/−1kb(即ち、4Kb〜6Kb)であるフラグメントを含み、50Kbサイズの分画は、50Kb+/−10kb(即ち、40Kb〜60Kb)であるフラグメントを含む。
【0045】
工程1C
この工程において、「捕捉エレメント」が作製される。捕捉エレメントは、先の工程由来の核酸フラグメントをライゲーションするために使用される一本鎖末端または二本鎖末端を有し得る、直鎖状二本鎖核酸である。「捕捉エレメント」は、順方向および逆方向アダプター末端(円の厚い領域として図1Cに示される)を含む環状核酸(例えば、図1Cに示されるようなプラスミド)として増殖され得る。この環状プラスミドは、捕捉エレメントが使用される前に切断され得る。これらのアダプター末端は、その後の工程において、可能性のあるPCRプライマーおよび配列決定プライマーについてのハイブリダイゼーション部位として役立ち得る核酸配列を含む。
【0046】
捕捉エレメントは、2つのアダプター末端の間に、さらなるエレメント、例えば、制限エンドヌクレアーゼ認識および/または切断部位、抗生物質耐性マーカー、原核生物または真核生物の複製起点、またはこれらのエレメントの組み合わせを含み得る。このような抗生物質耐性マーカーの例としては、とりわけ、アンピシリン、テトラサイクリン、ネオマイシン、カナマイシン、ストレプトマイシン、ブレオマイシン、ゼオシン(zeocin)、クロラムフェニコールに対する耐性を与える遺伝子が挙げられるが、これらに限定されない。原核生物の複製起点としては、とりわけ、OriCおよびOriVが挙げられ得る。真核生物の複製起点としては、自律複製配列(ARS)が挙げられ得るが、これらの配列に限定されない。さらに、捕捉エレメントは、小さな(PCRによって)増幅可能なフラグメントへその後の核酸産物を消化する(工程L)ために使用され得る制限エンドヌクレアーゼ認識および/または切断部位(例えば、特有かつ稀な部位が好ましい)を含み得る。捕捉エレメントはまた、ペアエンド配列決定のための核酸の容易な精製または濃縮のためのマーカーまたはタグ、例えば、ビオチンを含み得る。
【0047】
工程1D
捕捉エレメントは、制限エンドヌクレアーゼ消化などの公知の技術を使用して直鎖状化される(平滑末端または粘着末端は、異なるフラグメントの作製のために使用され得る;以下および図1Dを参照のこと)。コンカテマー形成(即ち、互いへの複数の捕捉エレメントのライゲーション)を防止するために、捕捉エレメントは、TAクローニング用のトポイソメラーゼによって脱リン酸化または修飾され得る。
【0048】
工程1E
捕捉エレメントは、工程Aまたは工程Bのフラグメント(またはサイズ分画されたフラグメント)へライゲーションされ、1つの捕捉エレメントと標的DNAの1つのフラグメントとを含む環状核酸が形成される(図1E)。捕捉エレメントおよび標的DNAは、周知の方法、例えば、DNAリガーゼによるライゲーション、またはトポイソメラーゼクローニングストラテジーによって連結される。
【0049】
工程1F
先の工程の結果は、大きなサイズのものであり得るDNAフラグメントへライゲーションされた捕捉エレメントのコレクションをもたらす。本工程は、標的DNAフラグメントの大きな内部領域を削除して、自動DNA配列決定に適用できるサイズのクローニングされた挿入物をもたらすために使用される(図1F)。
【0050】
この工程において、捕捉されたゲノムDNA(即ち、工程Eによって生成された環状核酸)は、ゲノムDNA内に1つまたは複数の切断部位を有し得る1つまたは複数の制限エンドヌクレアーゼによって消化される。一般的に、任意の制限エンドヌクレアーゼが、制限エンドヌクレアーゼが捕捉エレメント内を切断しない限り、「内部切断」のために使用され得る。内部切断とは、標的DNAに対して内部であり、捕捉エレメントを切断しない切断をいう。内部切断制限酵素は、選択された制限エンドヌクレアーゼの切断部位を含まないように捕捉エレメントを設計することによって選択され得る。制限エンドヌクレアーゼおよびそれらの使用は、当技術分野において周知であり、本方法に容易に適用され得る。さらに、各々が内部切断に制限される、多数の制限酵素の組み合わせが、標的DNAフラグメントのサイズをさらに減少させるために使用され得る。
【0051】
好ましい態様において、ゲノムDNAは、1つまたは複数のこれらの制限エンドヌクレアーゼによって、捕捉エレメントの50〜150塩基へと切断される。
【0052】
工程1G
この工程において、公知の配列の二本鎖核酸である「セパレーターエレメント」が、環状核酸を形成するために、先の工程の消化されたゲノム材料の末端の間にライゲーションされる(図1G)。この「セパレーターエレメント」は、2つの目的を果たす。第1に、セパレーターエレメントは、ミニサークルのローリングサークル増幅のためのプライミング部位を含み得る(以下、工程Iを参照のこと)。第2に、セパレーターエレメントの配列は公知であるので、それは、ペアのゲノム末端の末端にしるしをつける識別子として機能し得る(連結された末端のトリミングおよび容易なソフトフェア分析を可能にする)。即ち、ゲノムフラグメントのその後の配列決定の間、セパレーターエレメントの配列は、ゲノムフラグメント全体が配列決定されたこと示す。このようなセパレーターエレメントはまた、さらなるエレメント、例えば、制限エンドヌクレアーゼ認識および/または切断部位、抗生物質耐性マーカー、原核生物または真核生物の複製起点、またはこれらのエレメントの組み合わせを含み得る。抗生物質耐性マーカーおよび複製起点のようなエレメントの任意の存在にもかかわらず、本発明の方法の利点の1つは、該方法が核酸のクローニング、増幅または他の操作のために宿主細胞(例えば、大腸菌)の使用を必要としないことである。セパレーターエレメントはまた、ビオチン化され得るか、またはそうでなければペアエンド配列決定のために核酸の容易な精製または濃縮のためのマーカーまたはタグでタグ付けされ得る。
【0053】
工程1H
最後の工程から生成された環状核酸(即ち、ミニサークル)は、一本鎖にされ、一本鎖核酸が得られる。これは、溶液の塩、温度またはpHを変えることによる標準的なDNA変性成技術を使用して行なわれる。他のDNA変性技術は、当業者に公知である。変性の後、同一のミニサークル由来のDNA環は、依然として連結されている場合があるが、これは、本発明の方法に影響を及ぼさない(図1H)。
【0054】
工程1I
プライマーは、プライマーへアニーリングし得る配列を含むセパレーターエレメントへアニーリングされる。従って、このセパレーター配列は、ローリングサークル増幅のためのイニシエーターとして作用する(図1I)。
【0055】
工程1J
サンプルはローリングサークル増幅によって増幅され、長い一本鎖産物が作製される(図1J)。このローリングサークル増幅工程の1つの利点は、セパレーターエレメントを含まないエレメントが増幅されず、閉じた環ではないエレメントがほとんど増幅されないことである。
【0056】
工程1K
1つまたは複数のキャッピングオリゴが、順方向アダプターおよび逆方向アダプター(それらをこれらの領域において二本鎖にする)にフランキングする一本鎖の制限酵素認識部位へアニーリングされる(図1L)。キャッピングオリゴは、捕捉エレメントの少なくとも一部、アダプター領域の少なくとも一部、または両方に相補的であり得る。
【0057】
工程1L
キャッピングされた一本鎖DNAは、キャッピングされた部位にて小さいフラグメントへと切断される(図1M)。これらの小さなフラグメントは、公知の配列の末端を有し、従来の増幅技術、例えば、PCRを使用して容易に増幅され得る。
【0058】
第2の方法
第2の態様において、ペアエンド配列決定は、以下の工程において行われ得る。
【0059】
工程2A−サンプルDNAの断片化
標的核酸の断片化およびサイズ分画は、先の態様についてのものと同一である。
【0060】
工程2B−メチル化および末端ポリッシュ
所望される場合、断片化された標的核酸は、任意のメチラーゼによってメチル化され得る。好ましいメチラーゼは、制限エンドヌクレアーゼ消化に影響を及ぼすものである。メチラーゼは、少なくとも2つの異なるストラテジーにおいて使用され得る。好ましい一態様において、メチラーゼは、メチル化された制限酵素認識部位でのみ切断する制限エンドヌクレアーゼによる切断を可能にする。別の好ましい態様において、メチラーゼは、非メチル化DNAのみを切断する制限エンドヌクレアーゼによる切断を防止する。
【0061】
末端ポリッシュの工程は、第1の方法において記載されるものと同一である。
【0062】
工程2C−タグアダプターのライゲーション
この工程において、アダプターが、標的核酸フラグメントの末端にライゲーションされ(図2、I.)、両方の末端にアダプターを有するフラグメントが生成される。アダプターは任意のサイズのものであり得るが、10〜30塩基のサイズが好ましく、12〜15塩基のサイズがより好ましい。アダプターおよび/または標的核酸フラグメントのコンカテマーの形成を防止するために、アダプターは、平滑末端および不適合性の粘着末端(即ち、5’突出または3’突出を有する末端)を含み得る。アダプターがDNAフラグメントにライゲーションされ、リガーゼが除去された後、粘着末端は、ポリメラーゼおよびdNTPを用いて充填され得る。
【0063】
このセクションのアダプターは、捕捉フラグメントであり得る。捕捉フラグメントの例は、図4および5に示される。
【0064】
コンカテマー形成を防止するために、上記アダプターは、ヘアピンアダプターであり得る(図6A)。ヘアピンアダプターはダイマーよりも大きなマルチマーを形成できないため、ヘアピンアダプターの使用(例えば、図6)はコンカテマーを防止する。コンカテマーを防止するための別の方法は、一方または両方の鎖の5’末端がリン酸化されていないアダプターを使用することである。
【0065】
使用され得る他のアダプターとしては、リン酸化されていないアダプターが挙げられ、これらは、より少ない処理工程を使用するという利点を有するが、これらはまた、キナーゼを使用するリン酸化工程を必要とする。
【0066】
本開示中の他の箇所において考察されているように、アダプターは、メチル化されてもよく、またはビオチン化されてもよく、またはその両方であってもよい。
【0067】
工程2D−エキソヌクレアーゼ消化およびゲル精製
2つのヘアピンアダプターにライゲーションされるDNAフラグメントは、エキソヌクレアーゼを使用して精製され得る。このエキソヌクレアーゼ精製は、両方の末端上でヘアピンアダプターへライゲーションされた二本鎖DNAが、露出した5’末端または3’末端を有さないDNA分子であるという事実を利用する。ライゲーション混合物中の他のDNA、例えば、たった1つのヘアピンアダプターにライゲーションされた二本鎖DNAフラグメント、ライゲーションされていないDNAフラグメント、およびライゲーションされていないアダプターは、エキソヌクレアーゼに感受性である(図6B)。従って、エキソヌクレアーゼへのライゲーション混合物の曝露は、2つのヘアピンアダプターへライゲーションされたDNAフラグメント、およびヘアピンアダプターダイマーを除く、大部分のDNAを除去する。ヘアピンアダプターダイマーは、DNAフラグメントよりも著しく小さいので、それらは、サイズ分画カラム(例えば、スピンカラム)またはアガロースもしくはアクリルアミドゲル電気泳動などの公知の技術、または当技術分野において公知であるおよび/または本開示中の他の箇所において考察されている他のポリヌクレオチドサイズ識別法のうちの1つを使用して除去され得る。
【0068】
一態様において、アダプターは、タグを保有するフラグメントの単離/濃縮を容易にするために、ビオチン化され得る。
【0069】
別の態様において、アダプターを含むフラグメントは、タグ配列に相補的な捕捉オリゴヌクレオチドをフラグメントへアニーリングさせることによって精製され得る。
【0070】
工程2E−環化のためのフラグメントの作製
標的核酸フラグメントの両方の末端へアダプターを付加した後、フラグメントは、環化される。
【0071】
自己環化のための標的核酸を作製するために、アダプター領域における切断が、多数の理由から望ましい場合がある。例えば、ヘアピンアダプターが使用される場合、遊離5’末端または3’末端が存在しないため、DNAフラグメントは自己環化しない。別の例として、アダプターが、平滑末端をDNAフラグメントに残す場合、切断は、アダプターが5’または3’突出を有することを可能にし、これらの突出(いわゆる「粘着末端」)は、ライゲーション効率を大いに促進する。さらに、アダプター領域における消化は、各末端でライゲーションされた、2つのアダプターを有するDNAフラグメントの選択を可能にする。これは、適合性の粘着末端を制限エンドヌクレアーゼでの切断が残すように、アダプターが設計され得るためである。アダプター領域における切断の後、1つのみのアダプターを有するDNAフラグメント(望ましくない化学種)は、1つの粘着末端および1つの平滑末端を有し、自己環化において困難性を有する。従って、両方の末端にアダプターを有するDNAフラグメントのみが、環化される。
【0072】
アダプターに切断を限定することは、多数の方法によって達成され得る。1つの方法において、アダプターは、メチル化され、非メチル化DNAへライゲーションされる。次いで、前記構築物は、メチル化されたDNAのみを切断する制限エンドヌクレアーゼで消化される。アダプターのみがメチル化されているので、アダプターのみが切断される。
【0073】
別の方法において、DNAフラグメントはメチル化され得、アダプターはメチル化されない。非メチル化DNAのみを認識および切断する制限エンドヌクレアーゼでの切断は、アダプターに切断を限定する。これは、既にメチル化されている出発DNAを使用することによって、またはインビトロでのメチル化によって達成され得る。
【0074】
ある状況において、アダプターの消化は必要とされないことが、理解される。例えば、先の工程由来のフラグメントが、平滑末端のみを含む場合、アダプターの消化は、任意であり得る。
【0075】
DNAフラグメントがライゲーション/環化を容易にするように処理され得ることがまた、理解される。例えば、アダプターが、ブロックされているか、または5’リン酸を含まない場合、ブロック基が除去され得るか、またはリン酸が付加され得、フラグメントはライゲーションの準備ができている状態にされる。
【0076】
工程2F 環化されたフラグメントを形成するための末端のライゲーション
多数の方法が、環化のために使用され得る。
【0077】
一態様において、リガーゼが、好適なリガーゼ緩衝液と共に反応混合物に添加され、DNAフラグメントは、再環化することが可能になる。
【0078】
一態様において、ライゲーションは、自己ライゲーションを促進し、コンカテマーの形成を妨害するために、希薄なDNA濃度にて行なわれる。
【0079】
別の態様において、ライゲーションは、油中水型エマルジョン中で行われ、ここで、水性液滴は、本開示中の他の箇所において記載されるように、環化されるおよそ1つのフラグメントを含有する。
【0080】
一態様において、シグナチャータグが、標的核酸フラグメントにライゲーションされ、フラグメントは、自己環化される(図2を参照のこと)。シグナチャータグは、24〜30塩基対の二本鎖核酸配列である。この「シグナチャータグ」は、ペアのゲノム末端の末端にしるしをつける識別子として機能し得る(連結された末端のトリミングおよび容易なソフトフェア分析を可能にする)点で、先の態様の「セパレーターエレメント」と類似している。ゲノムフラグメントのその後の配列決定の間に、シグナチャータグの配列は、標的核酸配列の2つの末端の間の境界を示す。
【0081】
工程2G
シグナチャータグの付加および自己環化の後、標的核酸フラグメントは、さらに消化または断片化される。断片化は、本開示において列挙される任意の断片化手順を使用して行われ得る。例えば、上記の工程1Aを参照のこと。あるいは、1つまたは複数の制限エンドヌクレアーゼが、標的DNAを消化してフラグメントを生成するために使用され得る。
【0082】
好ましい一態様において、噴霧器が、平均フラグメントサイズが約200〜300bpになるまで核酸を断片化するために使用される。図2に示されるように、これらのフラグメントのいくつかはシグナチャータグを含み、一方、他のフラグメントはシグナチャータグを含まない。
【0083】
この時点で、核酸フラグメントは、標準的な技術を使用して配列決定され得る。核酸フラグメントを配列決定するための方法は、公知である。配列決定の1つの好ましい方法は、2004年1月28日に出願された国際特許出願第WO 05/003375号に記載される。
【0084】
工程2H
任意の工程において、シグナチャータグを含むフラグメントは、シグナチャータグを有さないフラグメントから濃縮され得る。濃縮のための1つの方法は、サンプル調製工程においてビオチン化されたシグナチャータグの使用を含む。断片化の後に、シグナチャータグを含むフラグメントは、ビオチン化され、溶液中のストレプトアビジンカラムまたはストレプトアビジンビーズを使用して精製され得る。
【0085】
濃縮の後、核酸フラグメントは、2004年1月28日に出願された国際特許出願第WO 05/003375号に記載されるものなどの自動化技術を含む標準的な技術を使用して配列決定され得る。
【0086】
第3の方法
ペアエンド配列決定は、第3の方法によって行なわれ得る。
【0087】
工程3A〜3E
この方法において、工程A〜工程Eは、第2の方法において記載された通り(即ち、工程2A〜工程2Eの通り)に行われ得る。さらに、第3の方法においては、各アダプターは、制限エンドヌクレアーゼ認識部位から約15〜25bp離れてDNA切断を指示し得るIIS型制限エンドヌクレアーゼ部位を含む。異なるIIS型制限エンドヌクレアーゼがエンドヌクレアーゼ認識部位からの種々の距離にて切断すること、およびこの距離を調節するための異なるIIS型制限エンドヌクレアーゼの使用が企図されることが、公知である。
【0088】
工程3F 環化されたフラグメントを形成するための末端のライゲーション
工程3Fは、シグナチャータグが使用されないことを除いて第2の方法(工程2F)に従って行われ得る(図6Dを参照のこと)。
【0089】
任意の濃縮工程
本発明の任意の方法において、エキソヌクレアーゼは、環化されていないフラグメントを除去するため、およびコンカテマー化されたフラグメントの存在を減少させるために、ライゲーション後に使用され得る。適切に再環化されたDNAフラグメントは、露出した5’または3’末端を有さないので、それは、エキソヌクレアーゼ消化に対して抵抗性である。さらに、コンカテマーは、より大きく、ニックに起因して露出した5’または3’末端を有する可能性が高い。エキソヌクレアーゼ処理はまた、ニックを有するこれらのコンカテマーを除去する。
【0090】
任意のローリングサークル増幅
環化されたDNAは、ローリングサークル増幅によって増幅され得る。簡単に記載すると、オリゴヌクレオチドが、再環化されたDNAの一方の鎖へハイブリダイズさせるために使用され得る。
【0091】
このオリゴヌクレオチドプライマーは、ポリメラーゼを用いて伸長される。鋳型は環状であるので、ポリメラーゼは、標的DNAの複数の反復を有する一本鎖コンカテマーを作製する。この一本鎖コンカテマーは、第2のプライマーをそれにハイブリダイズさせ、この第2のプライマーから伸長させることによって二本鎖にされ得る。例えば、この第2のプライマーは、この一本鎖コンカテマーのアダプター配列に相補的であり得る。得られた二本鎖コンカテマーは、次の工程に直接使用され得る。
【0092】
工程3G DNAの消化/断片化
この工程において、環化された核酸またはローリングサークル増幅からコンカテマー化された核酸は、IIS型制限エンドヌクレアーゼによって消化される(図6D)。工程3Aについて記載されたように、各アダプターは、少なくとも1つのIIS型制限エンドヌクレアーゼ切断部位を含む。IIS型制限エンドヌクレアーゼは、アダプター上のIIS型制限エンドヌクレアーゼ切断部位を認識し、そして約10〜20塩基対離れて核酸を切断する。IIS型制限エンドヌクレアーゼの例としては、MmeI(約20 bp)、EcoP151(25 bp)またはBpmI(14bp)が挙げられる。
【0093】
この工程は、2つの末端の間にアダプター領域を有する、より大きなDNAフラグメントの2つの末端を含むDNAの短いフラグメント(10〜100bp)を生成する(図6E)。同一の構造を生成するための代替の方法は、本開示中の他の箇所において記載される(例えば、工程1Aに記載される)多数のDNA断片化法のいずれかを使用して、環化された核酸をランダムに断片化することである。これは、任意のサイズ(100bp、150bp、200bp、250bp、300bpまたはそれ以上)のフラグメントが作製されることを可能にする。
【0094】
いずれかの方法によって、その中間にアダプター領域を有さない他のDNAフラグメントもまた、生成される(図6E)。しかし、アダプター領域はビオチン化されているので、アダプター領域を含むDNAは、例えば、ストレプトアビジンビーズ、アビジンビーズ、BCCPビーズなどのビオチンに対して親和性を有する固体支持体を使用して、選択的に精製され得る。
【0095】
工程3H.配列決定
本発明の任意の方法の産物は、手動か、または自動化された配列決定技術によって配列決定され得る。サンガー配列決定またはマクサム−ギルバート配列決定のような方法による手動の配列決定が、周知である。自動化された配列決定は、例えば、454 Life Sciences Corporation(Branford, CT)によって開発された454 Sequencing(商標)のような自動化された配列決定法を使用することによって行なわれ得、これはまた、出願WO/05003375(2004年1月28日に出願)ならびに同時係属中の米国特許出願USSN:10/767,779(2004年1月28日に出願)、USSN:60/476,602(2003年6月6日に出願);USSN:60/476,504(2003年6月6日に出願);USSN:60/443,471(2003年1月29日に出願);USSN:60/476,313(2003年6月6日に出願);USSN:60/476,592(2003年6月6日に出願);USSN:60/465,071(2003年4月23日に出願);およびUSSN:60/497,985(2003年8月25日に出願)に記載されている。
【0096】
簡単に記載すると、自動化された配列決定手順、例えば、454 Life Sciences Corp.によって開発された配列決定手順において、1つの配列決定アダプター(配列決定アダプターA)が、DNAフラグメントの1つの末端にライゲーションされ得、第2の配列決定アダプター(配列決定アダプターB)が、DNAフラグメントの第2の末端にライゲーションされ得る。ライゲーションの後、DNAフラグメントは、ビオチンを固体支持体に結合することによって、ライゲーションされていない配列決定アダプターから精製され得る。単離された核酸フラグメントは、個々の反応チャンバー中に配置され得、配列決定アダプターAおよび配列決定アダプターBに対して特異的なプライマーを使用してのPCRによってさらに増幅され得る。AアダプターまたはBアダプターのいずれかにビオチンを結合させることによって、優先的にA−Bフラグメントからなる一本鎖DNAが、単離され得る。この増幅された核酸は、配列決定アダプターA、配列決定アダプターBに特異的な配列決定プライマー、または、2つの末端の間に置かれたアダプター(例えば、ヘアピンアダプター)に特異的な配列決定プライマーを使用して配列決定され得る。
【0097】
より大きなDNAフラグメントの末端を含む複数のこれらのフラグメントが一旦作製されると、それらは配列決定され得、ペアエンド配列情報が、ゲノムの部分的または完全な配列地図を作成するためにアセンブリされ得る。
【0098】
第4の方法
ペアエンド配列決定は、図12に概説されるようなペア読み取りPETランダム断片化と呼ばれる上述の方法のバリエーションを使用して行なわれ得る。この第4の方法に従う実験からの結果を、図13に示す。
【0099】
工程4A〜4E
この方法において、工程A〜工程Dは、第2の方法または第3の方法(即ち、工程2A〜工程2Dまたは工程3A〜工程3D)において記載される通りに行われ得る。代替法として、工程4Dは、エキソヌクレアーゼ処理フラグメントを精製するために、SPRI(固相可逆的固定化)を使用して行なわれ得る。例えば、図12中の核酸フラグメントは、ビオチン化プライマーへライゲーションされ、例えば、ストレプトアビジン、アビジン、親和性の減少したストレプトアビジンまたは親和性の減少したアビジンでコーティングされたビーズを使用して精製され得る。
【0100】
工程4Eは、工程2Eまたは工程3Eに記載される通りに行われ得る。
【0101】
工程4Fは、工程3Fに記載される通りに行われ得る。簡単に記載すると、最後の工程において作製された直鎖状DNAフラグメントは、工程2Fまたは工程3Fについて上述されたような環化の任意の公知の方法を使用して環化され得る。
【0102】
さらに、上記の工程3Fに記載されるような任意の濃縮工程が、環状核酸を濃縮するために行われ得る。簡単に記載すると、環化されていない核酸は、遊離末端を有する核酸を分解するエキソヌクレアーゼによって除去され得る。共有結合で閉じられた環状核酸は、遊離末端を有さず、そしてエキソヌクレアーゼ攻撃に対して耐性である。これに起因して、エキソヌクレアーゼでの処理は、直鎖状核酸を除去しつつ環状核酸を濃縮する。
【0103】
工程4G
自己環化の後、断片化が、本開示に列挙される任意の断片化手順を使用して行なわれ得る。1つの好ましい方法は、機械的せん断を使用して、環状核酸を断片化することである。機械的せん断は、例えば、ボルテックスすることによって、小さい開口部へ溶液中の核酸を押し通すことによって、または本開示中の他の箇所において記載される他の類似の手順によって行なわれ得る。機械的せん断の1つの利点は、異なる長さの核酸が作製され得ることである(図12における工程Gの後の核酸を参照のこと)。
【0104】
中間にアダプター領域を有さないDNAフラグメントもまた、生成される。図12を参照のこと。しかし、アダプター領域はビオチン化されているので、アダプター領域を含むDNAは、例えば、ストレプトアビジンビーズ、アビジンビーズ、BCCPビーズなどのようなビオチンに対して親和性を有する固体または半固体支持体を使用して、選択的に精製され得る。
【0105】
工程4H
方法4の産物は、利用可能な任意の手動または自動の方法を使用して配列決定され得る。このような方法は、上記の工程3Hにおいて詳細に記載される。
【0106】
上述され、図12に概説されるような、ペア読み取りPETランダム断片化は、多数の利点を提供する。第1に、機械的せん断はより長いフラグメントを生じ得、これは、次に、より長い読み取りを可能にするため、方法4は、アセンブリにおけるより高い信頼性を可能にする。より長い読み取りは、より高い信頼性を伴う標的配列のアセンブリを可能にする。第2に、機械的せん断によって可能にされたより長いフラグメントは、核酸のより長い領域にまたがるペアエンド読み取りを生じる。核酸のより長い領域にまたがることによって、方法4は、ギャップ閉鎖を容易にし、そしてまた、分析が困難である核酸の領域にまたがる可能性が高い。これらの困難な領域は、例えば、反復領域または高いGC含量の領域であり得る。この様式において、方法4は、改善されたギャップ閉鎖性能の利点を提供する。第3に、方法4は、ギャップ閉鎖を提供するその能力に起因して、各個々の末端がアセンブリを構築するために使用され得るので、完全なゲノムを配列決定するために専ら使用され得る。
【0107】
方法4の利点の例は、図13において見られる。図13は、方法4を使用して配列決定された大腸菌K12ゲノムDNAを示す。見られるように、50未満〜約400の、有意に長い読み取り長さの分布が、この方法を使用して可能である。さらに、約3kbのフラグメント長が生成され得、それらの末端が配列決定され得る。これは、方法4が他の方法と比較して優れたギャップ閉鎖性能を提供することを示す。
【0108】
第5の方法
ペアエンド配列決定は、図15において概説されるような上述の方法のバリエーションを使用して行なわれ得る。
【0109】
この方法において、アダプターは、ヘアピンの二本鎖領域の逆鎖上にデオキシイノシンヌクレオチド(本明細書中でイノシンとも呼ばれる)を組み込むデオキシイノシンヘアピンアダプターとして設計され得る。大腸菌エンドヌクレアーゼV(EndoV)は、イノシンヌクレオチドから2番目のヌクレオチド3’と3番目のヌクレオチド3’との間に一本鎖切断(ニック)を導入する(Yao M and Kow YW, J Biol Chem. 1995, 270(48):28609-16;Yao M and Kow YW, J Biol Chem. 1994, 269(50):31390-6;Yao M et al., Ann N Y Acad Sci. 1994, 726:315-6;Yao M et al., J Biol Chem. 1994, 269(23):16260-8)。
【0110】
図14に示されるように、ヘアピンアダプター中のイノシンの相対的な配置は、両方の鎖のEndoV切断の際に、3’一本鎖突出(図14Aおよび図14B)、5’一本鎖突出(図14Cおよび図14D)、または平滑末端(突出なし)(図14E)が作製されるかどうかを決定する。ヘアピンアダプターの配列はまた、EndoV切断の際に非パリンドローム(図14AおよびB)またはパリンドローム(図14AおよびC)の一本鎖突出を生成するように設計され得る。デオキシイノシンが4つの塩基、A、G、CおよびTのいずれかと、およびそれ自体と対形成することは、当技術分野において周知である(Watkins and SantaLucia, 2005, Nucleic Acids Res. 33(19):6258-67)。さらに、アダプターは、本開示中の他の箇所において開示されるように、IIS型制限エンドヌクレアーゼ認識部位(例えば、MmeI)を含み得る。
【0111】
工程5A(図15工程A)
この方法において、工程Aは、工程1Aについて記載されたように、実質的に行なわれ得る。標的DNAは、上述したように、当技術分野において公知である任意の物理的または生化学的方法によって断片化され得る。任意で、得られたフラグメントは、本開示中の他の箇所において記載される任意のサイズ分画法によってサイズ分画され得る。
【0112】
工程5Bおよび5C(図15工程B+C)
標的DNAの末端が、本明細書に記載される任意のポリッシュ法によってポリッシュされ得、上述のデオキシイノシンヘアピンアダプターへライゲーションされ、アダプターでタグ化された標的DNAが形成され得る。
【0113】
工程5D(図15工程D)
ライゲーション反応は、1つまたは複数のエキソヌクレアーゼによって処理され得(本明細書中の他の箇所において考察されている通り)、本明細書に記載される任意の方法によってサイズ分画され、所望の反応産物が濃縮され得る。
【0114】
工程5E(図15工程E)
アダプターでタグ化された標的核酸は、EndoVによって切断される。切断反応についての条件は、Yaoらによって記載される条件のいずれか(Yao M and Kow YW, J Biol Chem. 1995, 270(48):28609-16;Yao M and Kow YW, J Biol Chem. 1994, 269(50):31390-6;Yao M et al., Ann N Y Acad Sci. 1994, 726:315-6;およびYao M et al., J Biol Chem. 1994, 269(23):16260-8)であり得る。当業者は、同様の条件も使用され得ることを認識する。
【0115】
工程5F〜H(図15工程F〜H)
この第5の方法において、工程F〜工程Hは、第2、第3、または第4の方法において記載されるように(即ち、工程2F〜Hまたは工程3F〜Hまたは工程4F〜Hのように)行なわれ得る。
【0116】
EndoVは、DNA中のイノシンまたは損傷もしくは塩基誤対合の特定の部位の存在下でのみ切断するため、第5の方法のデオキシイノシンヘアピンアダプターは有利である。従って、標的核酸は、EndoV処理によって切断されない。従って、EndoV部位はアダプターに特有であるので、標的DNAは、いくつかの上述の態様におけるようなメチル化によって保護される必要がない。メチル化工程の排除は時間を節約し、標的DNAの不完全なメチル化に関連する問題が、排除される。さらに、EndoV消化は、EcoRI消化と比較して非常に迅速であり、従って、この方法を行なうために必要とされる時間を短縮する。
【0117】
デオキシイノシンヘアピンアダプターアプローチによって得られるペア読み取り結果の例を、図16に示す。大腸菌K12ゲノムDNAを、第5の方法に従って作製および配列決定した(図15)。ペア読み取り間の平均距離は、2070bp(標準偏差=594)であった。
【0118】
第6の方法
さらなる態様において、ペアエンド配列決定は、図17および18に記載されるように、以下の工程の一部または全部を含む方法によって行なわれ得る。
【0119】
工程6A−標的DNAの断片化(図17A)
第6の方法によれば、ゲノムDNAなどの、標的DNAサンプルのポリヌクレオチド分子は、約500塩基より長いか、約1000塩基より長いか、約2000塩基より長いか、約5000塩基より長いか、約10000塩基より長いか、約20,000塩基より長いか、約50,000塩基より長いか、約100,000塩基より長いか、約250,000塩基より長いか、約100万塩基より長いか、または約500万塩基より長い分子へと断片化される。好ましい態様において、フラグメントは、約1.5〜約5kb長の範囲にある。断片化は、本開示中の他の箇所において記載される任意の物理的および/または生化学的方法によって達成され得る。好ましい態様において、標的DNAは、物理的な力によって、例えば、HydroShear(登録商標)装置(Genomic Solutions)の使用によってランダムにせん断される。せん断されたDNAは、次いで、所望のフラグメントサイズに関して精製され得る。この任意のサイズ選択は、当技術分野において公知であり、本明細書中に開示される任意のサイズ選択法、例えば、電気泳動および/または液体クロマトグラフィーによって達成され得る。好ましい態様において、せん断されたDNAサンプルは、SPRI(登録商標)サイズ排除ビーズ(Agencourt; Hawkins, et. al., Nucleic Acids Res. 1995 (23): 4742-4743)における精製によってサイズについて選択される。例えば、約2〜2.5kbのフラグメントの末端(対である)を配列決定することは、典型的な細菌ゲノム配列決定実験においてコンティグ順序付けを可能にし得る。より大きいフラグメントは、より高等な生物、例えば、真菌、植物および動物のゲノムの配列決定に有利であり得る。
【0120】
工程6B−特定の制限酵素認識部位のメチル化(図17B)
下記に説明されるように、標的DNAフラグメントへのアダプターのライゲーションの後、アダプターは、環化の準備において1つまたは複数の制限酵素によって切断され得る。選択した制限酵素での標的DNAの消化を防止するために、標的DNAは、対応のメチラーゼでの修飾によって消化から保護される。好ましい態様において、アダプターは、ヘアピンアダプターであり、EcoRI制限部位を保有する(図18A)。従って、好ましい態様において、サンプルDNAフラグメント中に存在するEcoRI制限部位は、ライゲーションによる環化の前に、EcoRI付着末端がヘアピンアダプターから作製される場合、それらの完全性を保存するために、EcoRIメチラーゼを使用してメチル化される。
【0121】
工程6C−フラグメント末端ポリッシュおよびリン酸化(図17C)
DNAの流体力学的せん断は、すり切れた末端(一本鎖突出)を有するいくつかのフラグメントをもたらす。平滑末端が、その後のアダプターライゲーションに好ましい。従って、任意で、すり切れた末端は、酵素的にDNAポリメラーゼを用いての「充填」および/またはエキソヌクレアーゼ(例えば、Mung Beanヌクレアーゼ)を用いての「チューイングバック(chewing back)」のいずれかによって、平滑にされ、ライゲーションの準備ができている状態にされ得る。有利には、いくつかのDNAポリメラーゼは、エキソヌクレアーゼ活性も有する。任意で、平滑化反応に続いて、好ましくはフラグメントの5’末端は、ポリヌクレオチドキナーゼによってリン酸化される。好ましい態様において、T4 DNAポリメラーゼおよびT4ポリヌクレオチドキナーゼ(T4 PNK)が、それぞれ、充填およびリン酸化のために使用される。T4 DNAポリメラーゼは、その5’→3’ポリメラーゼ活性によってDNAの3’陥凹末端(5’突出)を「充填する」ために使用され、一方、その一本鎖3’→5’エキソヌクレアーゼ活性は、3’突出末端を除去する。T4 PNKのキナーゼ活性は、5’ヒドロキシ末端へリン酸基を付加する。
【0122】
工程6D−ヘアピンアダプターライゲーション(図17Dおよび図18A)
本発明によれば、二本鎖オリゴヌクレオチドアダプターは、標的DNAフラグメントの末端へライゲーションされる。好ましい態様において、アダプターは、ヘアピンアダプターである(図18A)。ヘアピンアダプターの1つの利点は、アダプター−アダプターライゲーション事象はアダプターダイマーのみを生じる、即ち、マルチマーアダプターコンカテマーの形成が防止されることである。さらに、それらのヘアピン構造は、ライゲーションされていないフラグメントを除去するために使用されるエキソヌクレアーゼ消化(工程6E)からサンプルフラグメントを保護する。図18Aに示される1つの好ましいヘアピンアダプターの設計は、EcoRIおよびMmeI制限部位を含む。EcoRIは、各フラグメントの末端上に付着末端を作製して(工程6F)、それらの環化を可能にする(工程6G)ために使用され得、MmeIは、その認識部位から20bp離れてDNAを切断するIIs型制限酵素であり;それは、環化されたサンプルフラグメントの末端に切込みを入れるために使用され、配列決定されるペアエンドタグが作製される。当業者は、EcoRIが、アダプターオリゴヌクレオチドのヌクレオチド配列の付随する変化と、標的DNAフラグメントの保護のための適切なメチラーゼの使用とを伴って、任意の多数の他のエンドヌクレアーゼによって置換され得ることを認識する。同様に、選択した酵素が、下流配列アセンブリを可能にするのに十分な長さのペア末端を作製するのに十分なその制限部位からの距離にて切断する限り、MmeIは、他のIIs型制限酵素によって置換され得る。好ましい態様において、ヘアピンアダプターは、例えば、図18Aに示される部位にてビオチン化される。他のビオチン化部位もまた、好適であり、当業者によって選択され得る。ビオチン部分は、ペアエンドアダプターのライゲーションの間、充填反応(フラグメント修復)の間、およびペアエンドライブラリーの増幅の間、アダプター含有ペアエンドフラグメントの任意の選択、およびペアエンドライブラリーフラグメントの任意の固定化(MmeI消化後)を可能にする。
【0123】
工程6E−エキソヌクレアーゼ選択(図17E)
好ましくは、ヘアピンアダプターのライゲーションに続いてエキソヌクレアーゼ消化が行われ、両方の末端にヘアピンアダプターが適切に備えられていないDNAが除去され;SPRIサイズ排除ビーズにおける精製は、小さな望ましくない分子種、例えば、アダプター−アダプターダイマーを除去する。エキソヌクレアーゼ消化は、当技術分野において周知である種々のエキソヌクレアーゼの1つまたは複数によって行なわれ得る。好ましくは、消化は、3’→5’方向および5’→3’方向の両方において一本鎖DNAおよび二本鎖DNAの消化を同時に可能にする活性の組み合わせによって達成される。好ましい態様において、エキソヌクレアーゼ混合物は、大腸菌エキソヌクレアーゼI(3’→5’一本鎖エキソヌクレアーゼ)、ファージλエキソヌクレアーゼ(5’→3’一本鎖および二本鎖エキソヌクレアーゼ)、およびファージT7エキソヌクレアーゼ(5’→3’二本鎖エキソヌクレアーゼ、ギャップおよびニックにて開始し得る)を含有する。
【0124】
工程6F−EcoRI消化(図17F)
好ましい態様において、EcoRIによるエンドヌクレアーゼ切断は、ヘアピンアダプター(図18A)を切断することによって各フラグメントの末端上に付着末端を作製するために使用され、フラグメントの環化が可能となる。EcoRIを用いての消化は、フラグメントの末端においてヘアピン構造を除去し、付着末端を残す。サンプルDNA中に存在する内部のEcoRI部位は、工程6Bにおいてより早くに行なわれたメチル化によって保護されている。
【0125】
工程6G−環化(図17G)
次いで、フラグメントは、それらの付着EcoRI末端の分子内ライゲーション環化される。従って、ライゲーションの部位は、サンプルフラグメントの末端によっていずれかの側においてフランキングされた、2つの部分的なヘアピンアダプター(再構成されたEcoRI部位によって、頭部と頭部とが向かい合っている;合計44bp)を有する。別のエキソヌクレアーゼ消化が、環化されていないDNAを除去するために行なわれる。
【0126】
工程6H−MmeI消化(図17H)
次いで、環化されたDNAフラグメントは、MmeIによって制限される。このIIs型制限酵素は、その制限部位から約20bp離れて切断する(2ntの3’突出を残す、即ちその切れ目は、20/18ntにある;前記酵素はまた、前記部位から19〜22bpの範囲の切れ目を有するいくつかの少数の産物を作製する)。MmeI部位は、サンプルDNAフラグメントへライゲーションされているヘアピンアダプターの末端に存在する(図18A);これらの部位における制限によって、ライゲーションされた「二重の」ヘアピンアダプター(44bp)とサンプルフラグメントの2つの20bp末端とを各々が含み、合計の長さが84bpの、ペアエンドDNAライブラリーフラグメントが作製される。
【0127】
工程6I−ストレプトアビジンビーズによる単離(図17I)
ビオチンタグを欠いているので、ライゲーションされた「二重の」ヘアピンアダプターを有さないMmeI制限フラグメントは、任意で、この工程において排除され得る。ペアエンドフラグメントのライブラリーは、ストレプトアビジンまたはアビジンビーズへのヘアピンアダプター中に存在するビオチンタグの結合によって、固定化され得る(そして他のMmeI制限フラグメントから単離され得る)。
【0128】
工程6J−ペアエンドアダプターライゲーション(図17J)
この工程において、工程6Hにおいて作製され、任意で工程6Iにおいて精製されたペアエンドライブラリーフラグメントの末端が、ペアエンドライブラリーアダプターまたはペアエンドアダプターと呼ばれる二本鎖アダプターにライゲーションされる(図18B)。これらのペアエンドアダプターは、増幅およびヌクレオチド配列決定の両方を支えるプライミング領域を提供し、さらに、454 Sequencing(商標)System上で十分に見つけ出すために有用な短い(例えば、4ヌクレオチド)「配列決定キー」配列を含み得る。アダプターは、「縮重」2塩基一本鎖3’突出を有し得る。縮重は、2つの突出する塩基がランダムである、即ち、それらが、各々、G、A、T、またはCのいずれかであり得ることを意味する。MmeI以外の酵素が使用される場合、当業者は、他の酵素と適合性であるペアエンドアダプターを容易に設計することができる。図18Bに示される例示的なアダプターは、ペアエンドライブラリーフラグメントへの指向性ライゲーションを強く選好するように設計され、各アダプターは、それらの3’末端に縮重2bp 3’突出を含み、これは、MmeIによって作製されたペアエンドライブラリーフラグメントの末端へ専らライゲーションし得る(但し、そのアダプターの5’末端は、リン酸化されていない。以下を参照のこと)。アダプターは、ペアエンドライブラリーフラグメントの利用を最大限にすること、およびペアエンドライブラリーフラグメントコンカテマーを形成する可能性を最小限にすることの両方のために、大過剰モルのアダプター(15:1のアダプター:フラグメント比)を含むライゲーション反応においてペアエンドライブラリーフラグメントと合わせられ得る。アダプター自体は、アダプターダイマーの形成を最小限にするために、リン酸化されていない場合があるが、結果として、ライゲーション産物は、充填反応(工程6K)によって続いて修復されなければならない。
【0129】
工程6K−充填反応(図6K)
工程6Jにおいてライゲーションされたペアエンドアダプターがリン酸化されていない場合、ギャップが、ペアエンドライブラリーDNAフラグメントとのそれらの3’結合部に存在する。これらの2つの「ギャップ」または「ニック」は、鎖置換型DNAポリメラーゼを使用して修復され得、それによって、ポリメラーゼは、ニックを認識し、ニックを有する鎖を置換し(各アダプターの遊離3’末端へ)、ニックの修復および全長dsDNAの形成を生じさせる様式で鎖を伸長する。好ましい態様において、Bst DNAポリメラーゼ(ラージフラグメント)が使用される。当技術分野において公知の他の鎖置換型DNAポリメラーゼ、例えば、phi29 DNAポリメラーゼ、DNAポリメラーゼI(クレノウフラグメント)、またはVent(登録商標)DNAポリメラーゼもまた、この工程に好適である。
【0130】
工程6L−増幅(図6L)
任意で、「アダプター付加」ペアエンドDNAライブラリーは、増幅され得る。好ましくは、増幅は、PCRによって行なわれるが、当技術分野において公知のおよび/または本明細書中に記載の他の核酸増幅法もまた、使用され得る。好ましくは、図18Bに示されるF-PCRおよびR-PCRのオリゴヌクレオチドが、PCRプライマーとして使用され得る。
【0131】
次いで、「アダプター付加」ペアエンドDNAライブラリーは、増幅された(上の段落に記載されるように)かどうかにかかわらず、配列決定される。好ましくは、ライブラリー由来の個々の分子が、配列決定される。選択されたDNA配列決定法が、各個々の配列決定反応において複数の同一の鋳型分子を必要とする場合、ライブラリー由来の個々の分子は、クローン増幅され得る。好ましくは、クローン増幅は、参照により各々が全体として本明細書に組み入れられる、国際特許出願第WO 2005/003375号、第WO 2004/069849号、第WO 2005/073410号に記載されるようなビーズエマルジョンPCRによって行なわれる。
【0132】
第7の方法
なお別の態様において、ペアエンド配列決定は、図21〜25に示されるように、以下の工程の一部または全部を含む方法によって行われ得る。
【0133】
記載の態様は、特に有利で、独創的な方法を提供し、これは、ライゲーションによる環化の代替法を提供し、上述の方法およびバリエーションの一部または全部による実施に適用できる。さらに、現在記載の態様は、10Kbまたはそれよりも長い(即ち、約20Kbのペアエンド距離について)のペアエンド距離を作製するのに特に効率的であり、しかし、記載の組換えに基づくストラテジーは、10Kbよりも短い(即ち、約3Kb、または8Kbのペアエンド距離について)フラグメントを環化するためにも有用であることも認識される。現在記載の態様は、より長いペアエンド距離について所望の配列長を含む核酸分子の環化についての分子内組換えに基づくストラテジーを使用し、核酸分子、特に、大きな核酸分子の環化についての効率において実質的な利点を提供する。
【0134】
ある好ましい態様は、直鎖状アダプター付加標的フラグメントを環化し、標的フラグメントを含む環状核酸と、ハイブリッドアダプター配列を含む第2の切除化直鎖状フラグメントとを生成するために、Cre/Lox型部位特異的リコンビナーゼ(以下、「SSR」と呼ぶ)システムを使用する組換え反応方法によるインビトロ切除と呼ばれるものを含み、このような方法の一例を図21に示す。例えば、図21は、10Kbまたはそれより長いペア距離を有する配列決定可能なペアエンド鋳型核酸分子のライブラリーを生成するためのSSRに基づくストラテジーの例示的な概観を提供する。下記においてより詳細に説明するように、図21は、ゲノムまたは他の所望のDNAを断片化し、アダプター2105および2107を取り付け、アダプター付加フラグメント2100を生成し、次いで、これを所望の長さについて選択する方法を示す。アダプター付加フラグメント2100から環状産物2150および直鎖状産物2155を生成するSSR組換え工程も示され、ここで、環状産物2150が機械的にせん断され、直鎖状ペアエンド鋳型2160が生成され、これが続いて増幅され、鋳型2160の多くの実質的に同一のコピーを含む集団2170が生成される。
【0135】
Cre/Loxを使用するSSRシステムの態様が本明細書に記載されているが、当業者は、Int/attおよびFLP/FRTなどのインテグラーゼファミリーの他のメンバーもまた使用され得、従って、Cre/Loxの開示が限定として考えられるべきではないことを認識する。さらに、前記方法は単一の分子によって一般的に説明されているが、前記方法は、同一のまたは同様の反応環境、例えば、本明細書中の他の箇所に記載の油中水型エマルジョンリアクター中において同時に実質的に多数の分子に対して行われ得、ここで、各反応環境中の標的分子の数は、単一の分子、または数十、数百、数千、数百万などの分子のオーダーであり得ることが認識される。例えば、本明細書の他の箇所に記載の油中水型エマルジョンストラテジーを使用することは、分子間事象(即ち、コンカテマーの形成など)を阻害し、所望の分子内組換えを促進し、下記に詳細に記載した環化産物を生じさせる。
【0136】
工程7A−断片化
上記の種々の態様において説明したように、標的DNAサンプルのポリヌクレオチド分子の生ゲノムまたは他の供給源が、約10,000塩基より長いか、約20,000塩基より長いか、約50,000塩基より長いか、約100,000塩基より長いか、約250,000塩基より長いか、約100万塩基より長いか、もしくは約500万塩基より長い分子へ断片化される。ある好ましい態様において、フラグメントの長さは、約10Kb〜約50Kb、〜約100Kb、または〜100Kbよりも長い範囲にある。断片化は、本開示中の他の箇所において記載される任意の物理的および/または生化学的方法によって達成され得る。好ましい態様において、標的DNAは、物理的な力によって、例えば、HydroShear(登録商標)装置(Genomic Solutions)の使用によって、ランダムにせん断される。しかし、選択される方法が所望のフラグメント長を生成することができるならば、本明細書に記載されるフラグメントを作製する任意の方法が使用され得ることが認識される。
【0137】
工程7B−末端ポリッシュ
現在記載のバリエーションにおいて、フラグメントの各々の末端は、本開示中の他の箇所において記載の任意の方法、例えば、上記の工程6Cに記載の方法を使用してポリッシュされ得る。記載したように、その後のアダプターライゲーションのために平滑末端が好ましい。従って、任意のすり切れたまたは突出した末端が、DNAポリメラーゼを用いての「充填」および/またはエキソヌクレアーゼ(例えば、Mung Beanヌクレアーゼ)を用いての「チューイングバック」のいずれかによって、酵素的に平滑にされ、ライゲーションの準備ができている状態にされ得る。有利には、いくつかのDNAポリメラーゼは、エキソヌクレアーゼ活性も有する。任意で、平滑化反応に続いて、好ましくはフラグメントの5’末端は、ポリヌクレオチドキナーゼによってリン酸化される。好ましい態様において、T4 DNAポリメラーゼおよびT4ポリヌクレオチドキナーゼ(T4 PNK)は、それぞれ、充填およびリン酸化のために使用される。T4 DNAポリメラーゼは、その5’→3’ポリメラーゼ活性によってDNAの3’陥凹末端(5’突出)を「充填する」ために使用され、一方、その一本鎖3’→5’エキソヌクレアーゼ活性は、3’突出末端を除去する。T4 PNKのキナーゼ活性は、5’ヒドロキシ末端にリン酸基を付加する。
【0138】
工程7C−アダプターライゲーション
やはり上述したように、標的DNAフラグメントのポリッシュされた末端へ二本鎖オリゴヌクレオチドアダプターがライゲーションされる。現在記載の態様において、アダプターは、loxPアダプターを含み得、この例は、図22に示される。例えば、図22は、2つの二本鎖アダプター化学種、loxP-6Fアダプター2105およびloxP-6Rアダプター2107の説明のための例を提供し、各々は、5'リン酸を欠く第1の平滑末端と、リン酸化5'末端および3つの配列位置の3'突出を有する第2の末端とを有する。当業者は、記載の3'突出が3つの配列位置に限定されないこと、および所望の条件に応じて3つよりも多いまたは3つよりも少ない場合があることを認識する。
【0139】
アダプター2105および2107の第1の平滑末端は、標的DNAフラグメントのポリッシュされた(即ち、平滑)末端へライゲーションされ、その結果、各アダプター中のlox P 2200領域が、下記に詳細に説明されるように環化産物を促進するために、同一の方向性配向となる。さらに、各アダプターの5'リン酸化および突出を含む両方のアダプター化学種の第2の末端は、特定の利点を提供する。第1の利点は、上記に説明されるようなアダプターコンカテマーの分子を生成するマルチマーアダプター形成の阻害である。換言すれば、アダプター2105および2107の平滑末端のみが互いにライゲーション可能であり、このようなアダプターライゲーション事象をダイマーの形成に限定し、これは、アダプター付加標的分子から識別することがより困難であり、場合によっては、有意な割合のアダプター分子を消費して標的分子へのライゲーションにそれらを利用不能にする、長いコンカテマーとは対照的である。第2の利点は、5'リン酸化および3'突出は、各々、エキソヌクレアーゼ分解の効率を改善し、従って、下記にさらに詳細に説明される環化されていない分子の除去を改善することである。
【0140】
工程7D−サイズ選択
次に、アダプターがライゲーションされた核酸フラグメント2100は、所望のフラグメントサイズに関して精製され得る。この任意のサイズ選択工程は、当技術分野において公知でありかつ本明細書に開示される任意のサイズ選択法、例えば、電気泳動および/または液体クロマトグラフィーを使用して行われ得る。一態様において、せん断されたDNAサンプルは、上述のようにゲル電気泳動によってサイズについて選択される。記載の態様において、ゲルに基づく方法は、所望の長さの25%の範囲といった一定の所望の長さを有する長さのサイズ分布を含む、サイズ分画されたDNAフラグメントを生成する。例えば、標的化される20Kbサイズフラクションは、20Kb+/−5kbであるフラグメントのプールを作る(即ち、15Kb〜25Kbフラグメント長の範囲を作る)。同一または他の態様において、代替のサイズ分画技術が使用され得、特にここで、より長いフラグメントがペアエンド距離を増加させるために望ましい。より長い分子のサイズ分画に適用できる1つのこのような技術は、一般的に、「パルスフィールドゲル電気泳動」と呼ばれる(本明細書以下においてPFGEと呼ばれ、Schwartz DC, Cantor CR. Separation of yeast chromosome-sized DNAs by pulsed field gradient gel electrophoresis. Cell. 1984 May;37(l):67-75によって記載され、これは、全ての目的について参照によりその全体が本明細書に組み入れられる)。PFGEは、標準ゲル電気泳動法によって達成可能であるよりも遥かに大きな分解能で大きなサイズの分子のサイズ分画を可能にする。例えば、当業者は、標準ゲル電気泳動法は、一般的に、大きな分子、特に、約20Kbまたはそれより長い配列長を有する核酸分子を効率的にサイズ分離することにおいて無効であることを認識する。他方で、PFGE法は、このような大きな核酸分子について正確なサイズ識別を提供する。
【0141】
さらに、標準ゲル電気泳動法またはPFGE法のいずれかを使用する態様において、ポリアクリルアミドまたはアガロースゲルからの核酸またはタンパク質分子の効率的な抽出のために、当業者に公知の「電気溶出」法と呼ばれるものを使用することが、時には望ましい。
【0142】
ある態様において、本明細書中の他の箇所に記載の方法、例えば、工程6Kで記載の方法を使用して、上述のアダプターライゲーション工程から残されたギャップを充填することが、重要である。
【0143】
工程7E−組換えによる環化
次に、直鎖状アダプター付加核酸配列フラグメント2100が、標的核酸配列の末端へライゲーションされこれにフランキングしているアダプター2105および2107中の34bp loxP領域2206を認識するCreリコンビナーゼ酵素などの部位特異的リコンビナーゼへ曝露される。アダプターloxP領域2206(下記においてさらに説明)の同一の方向性配向を含むアダプター付加フラグメントについて、Creリコンビナーゼは、loxP領域のハイブリッドを含む短い直鎖状フラグメント(直鎖状産物2155として図21に示される)を切除し、標的核酸を環化し、第2のハイブリッドloxP領域と標的核酸とを含む環状分子(環状産物2150として図21に示される)を生成する。例えば、図21および23は、Creリコンビナーゼによって作製された直鎖状産物2155および環状産物2150として、両方の組換え産物を示す。図22は、環化産物2150中に存在するハイブリッドloxP領域2208を有する組換えられたアダプター2110の組成をさらに示す。当業者は、Creリコンビナーゼ酵素が、アダプター2105および2107の両方におけるloxP領域2206内で切断し、組換えて、オリジナルのアダプター2105および2107の両方由来の領域2206のハイブリッドであるloxP領域を有する産物を形成することを認識する。例えば、Creリコンビナーゼ酵素は、6F 2105および6R 2107アダプターの各々のloxP領域2206において結合し、同一の配列位置で各々を切断する。結合されたリコンビナーゼ/核酸複合体は、アダプター付加標的核酸配列フラグメントの各末端に配置され、互いと反応し、6F 2105および6R 2107アダプター由来の切断末端が一緒に合わされ、従って、核酸フラグメントが環化される。この例において、リコンビナーゼ酵素は、8bp方向配列2200を欠く6F 2105アダプターから切断されたセグメントと、8bp方向配列2200を含む6R 2107アダプターのセグメントとを合わせ、環状産物2150を生じさせる。さらに、6F 2105アダプター由来の8bp方向配列2200エレメントは、8bp方向配列2200を欠く残りの6R 2107アダプターへ合わされ、上述の直鎖状産物2155において短いハイブリッドアダプターが生じる。環状産物2150中の得られたハイブリッドアダプターを、loxP領域2208を含むアダプター2110として図22中に示す。領域2208の態様は、loxP領域2206と本質的に同一である配列組成を含み、環状産物2150中のアダプター2110の領域2208はまた、濃縮タグ2205の2つの関連の態様を含む(1つのタグは、アダプター2105および2107の各々に由来する)。ある態様において、濃縮タグ2205の2つの態様の存在は、その後の濃縮工程の効率を改善する。図22に示されるように、濃縮タグはビオチンを含み得、しかし、本明細書に記載される(即ち、結合対)かまたは当技術分野において一般的に公知である任意のタイプの濃縮タグが使用され得ることが認識される。アダプター2110はまた、環状産物2150中の標的DNAフラグメントへライゲーションされたオリジナルのアダプター2105および2107由来の平滑末端を含むことも注意される。
【0144】
図22および23は、SSRプロセスから環化産物を作製するためのloxP部位の方向性の重要性の例を提供する。図22の例において、loxP領域2206の野生型バージョン(配列領域の周りのボックスによって示される)が、アダプター2105および2107と関連している。しかし、SSR機能性が保持される限り、他の突然変異体が使用され得ることが認識される。さらに、当業者は、記載のSSRシステムにおいて、loxP領域は方向性特徴を有すること、およびこのような特徴は、Creリコンビナーゼへ曝露された場合に産物に影響を及ぼすことを認識する。図22の例において、6Fアダプター2105および6Rアダプター2107の両方の領域2206は、長さが8bpである方向loxP配列2200を含むCre/Loxシステムに典型的な特徴を含む(方向性は配列2200と関連する矢印によって示される)。さらに、領域2206は、方向配列2200の各サイドにフランキングする約13bpのパリンドローム配列エレメントを含む。
【0145】
図23は、loxP領域2206の相対的な方向性配向に基づいて作製されたSSR産物の例示的な例を提供する。まず、図23Aは、反対方向関係に向けられた2つのloxP領域2206を有するアダプター付加フラグメント2100'、および、Creリコンビナーゼによって作製された直鎖状反転産物2305(影付きの領域2300の位置の変化によって示される)の代表的な図解を提供する。全く異なることに、図23Bは、同一方向関係に向けられた2つのloxP領域2206を有するアダプター付加フラグメント2100"の出現、ならびに、(上述のような組換えられたアダプター2110中に)領域2208を含む第1の環状産物2150と、アダプター付加フラグメント2100から切除され、第2の組換えられた領域2208を含む、第2の直鎖状産物2155とを含む、Creリコンビナーゼによって作製された産物を提供する。図23Bの組換え反応は、方向矢印によって示されるように「二方向性」であることが認識され、ここで、切除矢印2334は、組込み矢印2336によって示される組込み方向と比較した場合、反応の方向の大きさがより大きいことを示している。当業者はまた、矢印2334および2336が、例示目的のみのために提供され、反応条件に少なくとも一部分依存し得る方向性の実際の大きさの正確な規模まで描かれていないことを認識する。重要なことに、好ましい態様において、反応条件は、切除方向および環状産物形成を促進するように最適化される。
【0146】
工程7F−非環状核酸の除去
続いて、切除された産物2155、反転された産物2305、アダプターダイマー、アダプター付加されていない標的核酸フラグメントなどを含む、全ての直鎖状核酸分子が、本明細書中の他の箇所に記載の任意の方法を使用して除去され得る。例えば、エキソヌクレアーゼ処理ストラテジーが、直鎖状核酸分子産物または他の残りの直鎖状フラグメントの全てを効果的に除去するために使用され得る。
【0147】
ある態様において、望ましくない直鎖状核酸分子の除去の効率を高めるために、2つ以上のタイプのエキソヌクレアーゼを使用することが望ましい場合がある。例えば、ある態様において、2つまたはそれ以上のエキソヌクレアーゼ化学種が使用され得、これらとしては、エキソヌクレアーゼ1(EXO 1とも呼ばれ得る)エキソヌクレアーゼ化学種、および直鎖状二本鎖DNAを消化するためのATP依存性DNAseと呼ばれるもの(即ち、例えば、Epicentre Biotechnologies, Madison WI製のPlasmid-Safe(商標)ATP依存性DNase)が挙げられるが、これらに限定されない。
【0148】
工程7G−直鎖状化
次いで、環状核酸産物2150は、本明細書中の他の箇所に記載の任意の種々の方法を使用して、中間にアダプター領域を有するオリジナルの標的核酸由来の末端領域を含む直鎖状核酸分子を作製するために、断片化され得る。現在記載のバリエーションにおいて、好ましいフラグメント長の選択を可能にし、かつ、対のタグの1つまたは複数についてより長い配列長を有するペアのタグの形成を促進する噴霧化などの、機械的せん断タイプの方法の1つを使用することが、特に有利であり得る。
【0149】
また、図22に示されるアダプターエレメントは、MmeIまたは本明細書中の他の箇所に記載されている他のIIs型制限部位を欠いているが、しかしこのような部位が含まれ得ることが容易に認識されることに注意することが重要である。実際に、ある態様において、MmeI部位をアダプター化学種の1つと結合させることが有利であり、その結果、核酸フラグメントが両方のアダプター化学種へライゲーションされて環化されると、今度は直鎖状フラグメントの一方の末端に20bpタグを残して環状分子を切断するために、MmeI酵素が使用され得る。次いで、直鎖状フラグメントは、下記および本明細書中の他の箇所においてより詳細に説明される、機械的な手段を使用して再び断片化され得、ここで、機械的な断片化は、20bpタグと34bp loxP領域との組み合わせよりも実質的により長い特定のフラグメント長について選択する。結果として、第1のものよりも長い長さのペア中の第2のタグ、および、アダプター2110を含む介在領域内での断片化の可能性の実質的な減少をもたらす。ペア中の第2のタグの好ましい長さは、得られたペアエンドフラグメントについての配列データを作成するために使用される配列決定法の平均または総読み取り長さ能力に、少なくとも一部分、基づき得る。
【0150】
ある態様において、その後の精製工程の間に、少量でおよび/または低品質で存在し得る貴重な標的DNAフラグメントを不注意で損失することを防ぐために、キャリアDNAがさらに直鎖状化工程の前に添加され得る。MmeIなどのII型制限部位を使用する記載の態様において、本明細書中の他の箇所に記載されるようなMmeIキャリアDNAを使用することが有利であり得る。
【0151】
同一または代替の態様において、他の目的のために他のタイプのキャリアDNAを使用することもまた有利であり得、これは、特定の適用についてより好適であり得る。1つのこのような目的としては、上述の直鎖状化工程などの機械的操作工程の効率の分析が挙げられる。ある態様において、本明細書に記載される噴霧化の方法などの、機械的な断片化方法の効率を評価することが望ましく、ここで、ペアエンド鋳型2160は、この効率の有効な測定に十分な量では生成されない。従って、断片化工程の前にいくらかの環状キャリアDNAを添加することによって、断片化産物の量を増加させることが望ましい。しかし、このようなキャリアDNA産物は、サンプル中にプールされると、ペアエンド鋳型2160と区別できない。このような態様において、機械的分析工程が行われた後に、キャリアDNAの配列決定可能な量を制限することがさらに有利である。換言すれば、機械的操作工程の分析のためにキャリアDNAを使用することは有益であるが、配列決定プロセスから貴重な資源を消費して、関心対象ではないキャリアDNAから配列情報を作成することは、一般的に望ましくない。キャリアDNAの配列決定可能な量を制限するための1つの手段は、それをPCRまたは他の増幅方法によっては増幅不能にすることである。従って、ペアエンド鋳型2160などの、直鎖状化された産物のプールが配列決定のためにさらに増幅される態様において、キャリアDNAの全体的な出現は、集団2170として示される配列決定可能な鋳型の増幅された集団において実質的に低減される。例えば、下記により詳細に説明されるように、環状キャリアDNA、例えば、pUC 19は、具体的には、ピリミジンダイマーを作ることによって鎖を架橋し、それを増幅不能にするのに有効な短波長紫外線で処理されてもよく、その結果、それが最終サンプル中において実質的に示されず、配列決定されない。処理されたキャリアDNAは、環化された標的DNA(即ち、環状産物2150)を有するサンプルへ添加され得、直鎖状化され得、その結果、サンプルは、標的(即ち、ペアエンド鋳型2160)およびキャリアDNA集団の両方からの直鎖状化された代表物を含む。この例において、例えば、Agilent Technologies, inc.製のLabChip DNA 7500チップを使用することによって、直鎖状化の効率を測定するためにサンプル全体が分析され得、ここで、キャリアDNAは、核酸体積の増加に起因してより正確な測定を可能にする。本明細書に記載の任意の方法を使用するサンプルのその後の増幅において、キャリアDNAのコピー数は増加せず、標的DNA分子の割合が実質的により大きな、増幅されたサンプルが生じる。
【0152】
工程7H−濃縮
さらに、各アダプター化学種と結合された濃縮タグ2205の態様が図22に示され、これらとしては、ビオチンタグ、または本明細書中の他の箇所に記載のもしくは当技術分野において一般的に公知の他のタイプの濃縮タグが挙げられ得る。上述したように、ビオチン部分などの濃縮タグは、アダプター含有ペアエンドフラグメントの任意の選択、ならびに、ペアエンドアダプターのライゲーションの間、充填反応(フラグメント修復)の間、およびペアエンドライブラリー増幅の間、ペアエンドライブラリーフラグメントの任意の固定化(環状核酸の直鎖状化の後)を可能にする。本明細書に記載のloxPアダプター2105および2107のさらなる利点は、アダプター−アダプターライゲーション事象が、アダプターダイマーのみへ至る、即ち、マルチマーアダプターコンカテマーの形成が防止されることである。
【0153】
本発明の方法7のバリエーションの他の局面は、例えば、本願においてこれも記載される、アダプターのライゲーションおよび産物のその後の配列決定を伴う増幅に関する、第6の方法の工程J〜L(工程6J〜6L)などの、本明細書に記載の他の方法およびバリエーションと一致する。
【0154】
前述したように、方法7のバリエーションは、図25に示されるように、最小数の配列読み取りでゲノム足場を効率的にカバーする能力において、他の方法と比べて実質的な利点を提供する。例えば、図25は、約20Kbの長いペアエンド読み取りが、大腸菌K12ゲノム足場のアセンブリにおいて、約3Kbのより短いペアエンド読み取りと比べてもたらされる実質的な利点、および周知のショットガンに基づくアプローチと比べてなおより大きな利点を示す。方法7は、技術者の時間、機器の時間および使用、ならびに試薬の使用などの少ない貴重な資源を必要とするプロセッシング工程の必要性が少ないため、ライゲーションに基づく方法に比べて他の利点を提供する。
【0155】
上述の7個の方法の対応する工程の任意の組み合わせもまた企図され、本発明に包含されることが、理解される。
【0156】
上記の開示から理解され得るように、方法1、2、3、4、5および6の間には類似性が存在する。特に、方法2、3、4、5および6の類似する工程は、特に類似しており、等価なまたは好ましい結果をもたらすために、前記方法の間において、組み合わせても入れ替えてもよい。
【0157】
ペアエンド配列決定の一般的な方法を記載したので、方法のバリエーションを記載する。
【0158】
1つのバリエーションにおいて、ヘアピンアダプターは、突出アダプターによって置換され得る(図8)。突出アダプターは、ビオチン化され得、例えば、以下の配列を有し得る:

【0159】
上の鎖(SEQ ID NO:28)の3’末端の6個のヌクレオチド(即ち、TCCAAC)は、下の鎖(SEQ ID NO:29)の相補ヌクレオチドと組み合わさって、IIS型制限酵素MmeIに対する認識部位を形成する。
【0160】
バリエーションは、方法3と同様の様式で行われる。第1のゲノムDNA(図8A)は、断片化およびポリッシュされ(図8B)、突出アダプターが、フラグメントの末端へライゲーションされる(図8C)。突出アダプターのダイマーは、サイズ分画クロマトグラフィー(即ち、スピンカラム)または電荷ベースのクロマトグラフィーによって除去され得る。突出アダプターのより高次のコンカテマーは、5’突出におけるリン酸の欠如に起因して、形成され得ない。突出プライマーダイマーの除去後(図8D)、フラグメントは、キナーゼを用いた処理によって、自己ライゲーションが可能になる(図8E)。自己ライゲーション(即ち、環化)が行なわれ、続いて、ライゲーションされていない非環状DNAを除去するために、エキソヌクレアーゼ消化が行われ得る。突出アダプターへライゲーションされないDNAフラグメントは、ポリッシュに起因して平滑末端を有するので、それらは、各サイドにおいてライゲーションされた2つの突出アダプターを有するフラグメントの5’突出末端(粘着末端)と同程度に効率的にライゲーションするとは予想されない。環化の後、MmeI消化が、突出アダプターより遠位のDNAを除去し(図8Fを参照のこと)、ライゲーションされた突出アダプターの各サイド上のオリジナルのゲノムDNAのうちの約20塩基を残す(図8G)ために使用される。突出アダプターを有するフラグメントは、ビオチン化されたアダプターへ結合するストレプトアビジンビーズを使用して精製される(図8H)。
【0161】
得られたフラグメントは、例えば、本開示において提供される方法(例えば、工程3H)のなどの利用可能な任意の方法によって配列決定され得る。
【0162】
本発明の方法によって作製された核酸は、配列の末端に相補的な1つまたは複数のプライマーを使用して配列決定され得る。即ち、工程3Hに記載される配列決定プロトコルにおいて、配列決定アダプターAおよび配列決定アダプターBが、フラグメントが配列決定される前にフラグメントの末端にライゲーションされる。フラグメントの末端配列は配列決定アダプターAまたはBのいずれかであることが既知であるので、配列決定アダプターAまたはBに相補的な配列決定プライマーが、フラグメントを配列決定するために使用され得る。さらに、ライゲーションされたアダプターを含む、各フラグメントの中間にある配列は、既知である(例えば、図7の703を参照のこと)。配列決定はまた、この中間領域に相補的なプライマーを使用して中間から始まり得る。さらに、末端領域由来の配列決定プライマーおよび中間領域由来の配列決定プライマーは、同時に、配列決定されるフラグメントへハイブリダイズされ得る(図9を参照のこと)。一方のプライマーは、保護されるが、他方のプライマーは、保護されない。図9において、末端にハイブリダイズされたプライマーは、リン酸基によって保護される。配列決定の第1ラウンドは、保護されていないプライマー(図9、中間プライマー)から始まる。配列決定の第1ラウンドの後、第1のプライマーの伸長は、任意で、例えば、相補ジデオキシヌクレオチドの組み込みによって終結され得る。あるいは、第1のプライマーの伸長は、鋳型鎖の末端へと進み、終結を不必要とし得る。第2の保護されたプライマーは、フラグメントの末端から配列を決定するために、配列決定の第2ラウンドにおいて脱保護および伸長され得る。この方法は、一本鎖であり得る単一の鋳型からの2つの長いペアエンド配列決定読み取りを可能にする。
【0163】
第2のバリエーションにおいて、断片化された出発DNA(図10A)は、3’CC突出および任意の内部のIIS型制限エンドヌクレアーゼ部位を有するアダプターへライゲーションされる。ライゲーションされたフラグメントは、末端が適合性ではない(相補的でない)ため、自己ライゲーションも自己環状もし得ない。しかし、これらのフラグメントは、両サイドに5’GG突出を有するリンカーを使用してライゲーションされ得る(図10B)。ライゲーション後、核酸フラグメントは、上記で考察された標準的なゲルおよびカラムクロマトグラフィーによって、または環化されていない分子を切断するエキソヌクレアーゼ消化によって、非環状DNAから精製され得る。得られた環状DNA(図10D)は、他の方法におけるようにMmeIによって切断され得、得られたDNAが配列決定され得る。
【0164】
別のバリエーションにおいて、本発明の方法は、A/Bアダプター付加ssDNAを生成するために、使用され得る(図11、工程1)。この一本鎖フラグメントは、A/Bアダプターに相補的な配列を含むオリゴへのハイブリダイゼーションによって環化され得(図11、工程2)、リガーゼの存在下においてライゲーションされ得る。ライゲーションを促進することに加えて、前記オリゴは、環化されたssDNAのローリングサークル増幅を促進するために、プライマーとして使用され得る(図11、工程3)。ローリングサークル増幅されたDNAは、方法1、工程1KおよびL(図1LおよびM)について記載されたように切断され得る。増幅の後、標準的なライブラリー作製および配列決定技術が、産物に適用され得る(図11、工程4)。
【0165】
本発明のある態様は、実験プロトコルが本明細書に記載の方法に従うMmeI切断の使用を含んだ、大腸菌株K12ゲノムのペアエンド配列決定実験において、ゲノムにわたる読み取り範囲の深さが大きく変化したという驚くべき知見に基づく(図20、「キャリア無し(−)」)。深さによって、ゲノムの実質的に同一の領域への配列読み取りマッピングの数が意味される。この深さバリエーションは、ゲノムにわたるMmeI部位の密度に相関した(図20)。予想外かつ驚くべきことに、本発明者らは、MmeI部位を含むことが既知である二本鎖DNA(図20において「(+)」と示される)、即ち、大腸菌B株DNA(「EcoliBStrain(+)」)、サケ精子DNA(「SalSprmDNA(+)」、またはMmeI部位を含むことが既知であるPCR増幅産物(「AmpPosMmeI(+)」))の付加が、ゲノムにわたる範囲の深さのバリエーションを大幅に減少させ、ランダム化したことを発見した。しかし、MmeI部位を欠く二本鎖DNA(図20において「(−)」と示される)、即ち、ポリ(dIdC)(「dIdC(-)」)、またはMmeI部位を含まないことが既知であるPCR増幅産物(「AmpNegMmeI(-)」)の付加は、「キャリア無し」コントロールと比較して、ゲノムにわたる範囲の深さのバリエーションのパターンを変化させなかった。従って、MmeIポジティブキャリアDNAの使用は、ゲノムにわたるペアエンド読み取りのより一様な分布を提供し、これは有利である。これらの驚くべき知見は、以下の表に示されるデータによってさらに実証される。
【0166】
(表1)ペアエンド読み取りの深さ分布および長さに対するMmeIキャリアDNAの効果

【0167】
表1は、大腸菌K12についての深さの範囲の統計を示す。上部3つのサンプル(行)には、MmeIポジティブキャリアDNAが添加され、一方、下部3つのサンプルには、MmeIネガティブキャリアDNAが添加された。列の見出しは、以下を示す:「Depth Ave」=平均の深さ;「Depth STDEV」=深さの標準偏差;「Depth%CV」=Depth Aveによって除算されたDepth STDEV(この商は、平均の深さによって補正された深さにおけるバリエーションを示す);「Length Ave」=ゲノムにおけるペア読み取りの平均距離;「LengthSTDEV」=ゲノムにおけるペア読み取りの距離の標準偏差;「Length%CV」=Length Aveによって除算されたLengthSTDEV。
【0168】
表1は、図20に従って、大腸菌K12ゲノムにわたる範囲の深さにおけるバリエーションがMmeIポジティブキャリアDNAの添加によって大幅に低下したことを示す(Depth STDEVおよびDepth %CVの値を参照のこと;より小さなDepth STDEVおよびDepth %CV値が、有利である)。これは、ゲノムにわたるペアエンド読み取りのより一様な分布をもたらす。この一様な分布は有利である。
【0169】
(表2)大腸菌K12のゲノム足場に対するMmeIポジティブキャリアDNAでのペアエンド配列決定の効果

【0170】
表2は、ショットガンコンティグの足場に対するMmeIポジティブキャリアDNAによって得られたペアエンド配列決定データの効果を示す。GS20配列決定装置(454 Life Sciences, Branford, CT, USA)における大腸菌K12ゲノムDNAのショットガン配列決定によって得られた121の大きなコンティグが、ペアエンド配列決定読み取りによってアセンブリされた場合、より低い数(19〜25)の足場(即ち、より大きい足場)が、キャリアDNAを用いずにもたらされたまたはMmeI部位を欠くキャリアDNA(48〜56の足場)によってもたらされたペアエンド配列決定の読み取りと比較して、MmeIポジティブキャリアDNA(列「Stratagene SS dsDNA (+)」、「大腸菌B株(+)」および「増幅されたポジティブ(+)」)によってもたらされたペアエンド配列決定読み取りから生じた。従って、MmeIポジティブキャリアDNAの使用は、本発明に従って行われるペアエンド配列決定によって達成されるゲノムアセンブリ性能を改善する。
【0171】
上述したように、本発明のある態様は、二本鎖「キャリアDNA」の使用を包含する。ある態様において、キャリアDNAは、制限エンドヌクレアーゼMmeIによるDNA切断を含む工程において使用される。前記態様において、キャリアDNAは、1つまたは複数のMmeI部位を含有する。MmeIによるエンドヌクレアーゼ切断は、MmeI酵素分子のモル数がDNAサンプルに存在するMmeI部位のモル数とほぼ等しい場合、最も効率的に生じる(New England Biolabs, Ipswich, MA, USAの製品カタログ)。本発明の方法において、MmeI部位の数は、確実に測定するのが困難でありかつ時間がかかる低いDNA濃度(代表的に、数ナノグラム〜数十ナノグラムのオーダーである)に起因して、およびまた、配列決定される標的DNAに基づくMmeI部位の数におけるバリエーションに起因して、推定することが困難であり得る。従って、(化学量論的濃度を達成するように)反応に添加されるMmeI酵素の量の正確な計算には、問題がある。この困難性を克服し、MmeI部位の数とMmeI酵素分子の数との均衡に対する必要性を満たすために、本発明のいくつかの方法は、(サンプルDNAに関して)過剰のキャリアDNAの添加を包含する。この方法において、反応に添加されるMmeI酵素の量が、既知量のキャリアDNAに基づいて算出され得、一方、(環状)サンプルDNA中のMmeI部位の数は、無視可能となる。従って、サンプルDNAのDNA濃度の測定は、不必要となる。これは、速度を改善し、本方法に必要とされるコストおよび時間を減少させる。キャリアDNAの量は、サンプルDNAの量を、数倍〜約10倍、〜約100倍、〜約1000倍、またはそれ以上、上回ってもよい。好ましい態様において、2マイクログラムの音波破砕された二本鎖サケ精子DNAは、100マイクロリットルの体積において、2ユニットのMmeIおよび全ての必要とされる試薬(例えば、1×NEBuffer 4(New England Biolabs)および50μMのS-アデノシルメチオニン(SAM))と共にサンプルDNAに添加され、そして約37℃にて約15分間インキュベートされる。当業者は、反応温度および持続時間が実用的な範囲内で調節され得ることを認識する。
【0172】
上述されるような、ほぼ化学量論的量のMmeI酵素と組み合わせての、MmeI制限消化における過剰のMmeI部位含有キャリアDNAの使用は、本開示において、例えば、第6の方法の工程6H(図17H)において記載されるMmeI消化を含む任意の方法に任意で組み入れられ得る。当業者はまた、MmeI部位を含む「キャリアDNA」を添加するストラテジーが、任意のMmeI制限消化反応において、特に、サンプルDNA量が低いおよび/またはサンプルDNA中のMmeI部位の数が未知である反応において、有用であることを認識する。
【0173】
キャリアDNAのさらなるいくつかの態様は、サンプルの機械的操作の分析のために使用され得、ここで、キャリアDNAがプロセスの他の工程と干渉しないことが望ましい。他のこのようなプロセスは、DNAサンプルの増幅であり、ここで、環状キャリアDNAは、DNAを増幅不能にするが他の点では影響を与えない当業者に公知の方法を使用して(即ち、DNA損傷を作製することによって)処理され得る。例えば、pUC 19ベクターDNAが、短波長紫外線を使用して約45分間(即ち、典型的に30〜60分間)照射され得、これは、DNA構造中に「ピリミジンダイマー」と呼ばれるものを作製する。増幅プロセスについて典型的に使用されるポリメラーゼ酵素は、鋳型DNA上のダイマーを「読み通す」ことができず、従って、照射されたpUC DNAは増幅不能である。当業者は、DNAに損傷を与えそれを増幅不能にする任意の他の方法が使用され得ることをさらに認識する。例えば、損傷は、内因性または外因性のプロセスによって発生させられ得る。DNA損傷を生じさせるいくつかの手段としては、UV損傷(UV-B、UV-A)、アルキル化/メチル化、X線損傷、加水分解(即ち、脱プリン化を引き起こす熱的崩壊)、ならびに酸化的損傷が挙げられるが、これらに限定されない。
【0174】
上述したように、ある態様において、処理された環状キャリアDNAは、環化された標的DNAサンプルへ添加され、直鎖状化工程、特に、噴霧化の使用などの機械的な断片化を使用する直鎖状化の有効性のキャラクタライゼーションを改善する。例えば、1〜4ugの処理されたキャリアpUC DNAが、環化された標的DNAサンプルへ添加され、30psiで2分間噴霧化され、約20kbのペア距離を含むメンバーを有する直鎖状核酸フラグメントが生成され得る。噴霧化されたサンプル全体が、Agilent Technologies製のLabChip 7500テストチップを使用して試験され、噴霧化が所望の結果を生じさせたかどうかが測定される。
【0175】
(表3)未処理キャリアDNAを使用して得られた結果

【0176】
表3は、増幅後にサンプル中に存在するキャリアDNAの相対的パーセンテージを示し、これは、増幅前にサンプルへ添加された未処理キャリアDNAの量に比例する。例えば、1ug未処理キャリアDNAの添加は、増幅されたサンプル中の核酸分子の6%でキャリアDNAの出現を生じさせ、同様に、3ugの添加は、20%出現を生じさせる。
【0177】
(表4)処理済みキャリアDNAを使用して得られた結果

【0178】
表4は、増幅後にサンプル中に存在する処理済みキャリアDNAの相対的パーセンテージを示し、ここで、表3中に示される未処理キャリアDNAからの実質的な減少が存在する。例えば、1ug処理済みキャリアDNAの添加は、増幅されたサンプル中の核酸分子の0.02%でキャリアDNAの出現を生じさせ、同様に、3ugの添加は、0.06%出現を生じさせる。
【0179】
油中水型エマルジョン中におけるライゲーション
本発明のいくつかの態様は、ライゲーションによる核酸分子の環化のための方法も包含する。一般的に、核酸分子の環化は、低い核酸濃度でのライゲーションによって達成される。低濃度は、二次(またはより高次)反応速度論に従う分子間事象よりも、一次反応速度論に従う所望の分子内ライゲーション反応(即ち環化)に有利である(F. M. Ausubel, et al., (eds), 2001, Current Protocols in Molecular Biology, John Wiley & Sons Inc.)。しかし、高希釈度であっても、分子間事象は防止され得ず、核酸の極度の希釈は、実用的ではない。分子間ライゲーション(コンカテマー、二重の環など)の発生は、所望の分子内環化事象の収率を減少させる。いくつかのシナリオにおいて、分子間ライゲーション産物は、下流での適用に不利であり得る。要約すると、従来のアプローチは、少なくとも2つの主要な欠点を有する。第1に、出発核酸を希釈する必要性は、反応体積および関連する試薬のコストを増大させる。高い希釈度はまた、反応産物の効率的な回収を困難にする。第2に、多数の分子間ライゲーション事象が生じ、所望の分子内ライゲーション産物の収率が減少する。
【0180】
本発明は、上述の従来の環化アプローチに関連する問題を大幅に排除する方法を包含する。例えば、本発明によれば、高い希釈度で、即ち、低い核酸濃度でライゲーション反応を行う必要性は、存在しない。一態様において、適合性のライゲーション可能な末端、例えば、平滑末端またはねじれ型(「粘着」)末端を有する個々の直鎖状の二本鎖DNA分子が、物理的に隔離された反応環境においてライゲーションされる。ライゲーションされるDNAとライゲーション反応に必要な全ての試薬(例えば、DNAリガーゼ、リガーゼ緩衝液、ATPなど)とを含有する水溶液は、好ましくは、エマルジョンを安定化するように機能する界面活性剤の存在下で、油中に乳化される。エマルジョンを作製するための好適な組成物および方法は、下記においてより詳細に考察される。得られた油中水型エマルジョンは、各々が0個、1個、またはそれ以上のDNA分子を含有する、微小滴(マイクロリアクター)を含有する。マイクロリアクター1個当たりのDNA分子の数は、DNA濃度および微小滴のサイズを変えることによって調節され得る。当業者に対して、核酸濃度、ポリヌクレオチドのサイズ(塩基の数として測定される長さ)、および微小滴の平均体積に基づいて好適な条件を算出することは、慣用的な最適化の問題である。理想的な微小滴は、単一のライゲーション可能なDNA分子を含む。しかし、マイクロリアクターの集団において、マイクロリアクター1個当たりのDNA分子の数は、マイクロリアクターのサイズ可変性およびDNA分子のランダムな分布に一部分依存して変化することが、理解される。従って、いくつかのマイクロリアクターは、DNA分子を含有しない場合があり、いくつかは、1個のDNA分子を含有し得、いくつかは、2個またはそれ以上のDNA分子を含有し得る。当業者は、収率およびコスト(試薬の使用)は、マイクロリアクター1個当たりのDNA分子の平均数を変えることによって、必要に応じて釣り合わせることができることを、認識する。
【0181】
好ましくは、ライゲーション混合物は、それがアセンブリされている間、および乳化工程が完了するまで、低温で(例えば、0〜4℃で)保たれる。これは、ライゲーション反応が、所望のエマルジョン環境が形成される前に進行するのを防ぎ、従って、望ましくない分子間結合の形成を防止する。続いて、乳化されたライゲーション反応物は、ライゲーション反応が許容される温度にてインキュベートされる。インキュベーション時間は、数分間〜1時間、〜数時間、〜一晩、または〜24時間または1日より長い範囲であり得る。このインキュベーションの後、しかしエマルジョンの破壊の前、間、および後に、ライゲーション反応は、合わせたライゲーション反応物中の望ましくない分子間ライゲーションを防止するために停止され得る。ライゲーション反応は、約0〜4℃まで温度を下げること(水氷)、リガーゼの熱不活性化、EDTAの添加、リガーゼインヒビターの添加など、またはこのような方法の任意の組み合わせによって、停止され得る。
【0182】
当業者は、上述の本発明の方法を、一本鎖もしくは二本鎖RNA、または一本鎖もしくは二本鎖DNAの環化に容易に適用する。例えば、直鎖状一本鎖ポリヌクレオチド分子の末端は、方法1の工程1Kにおいて記載されるように、前記直鎖状一本鎖ポリヌクレオチド分子の各末端に相補的な部分を有するキャッピングオリゴヌクレオチド(架橋オリゴヌクレオチドとも呼ばれる)へアニーリングさせることによって直接並置され得る(図1Lおよび図11を参照のこと)。
【0183】
乳化されたライゲーション反応は、次いで、好適な温度にてインキュベートされ得る。例えば、T4 DNAリガーゼによる「粘着末端」ライゲーションについて、好適なインキュベーション温度は16℃であり、しかし広範な温度が許容される。DNAおよび他の分子のライゲーションについての条件は、当技術分野において広く公知である。エマルジョンにおいて環化反応を行う1つの利点は、延長された反応時間が手順の成功に対して中立であるかまたは有益でさえあることである。例えば、マイクロリアクター1個当たりDNA分子を1個のみ有する理想的なシナリオにおいて、インキュベーション時間は、大部分のDNA分子が環化されるまで延長され得る。対照的に、上述の従来の非エマルジョン方法を使用することによって、延長されたインキュベーション時間は、より高い割合の分子間ライゲーション産物をもたらし得る。本発明のエマルジョンベースのライゲーション方法の別の利点は、分子間ライゲーションの発生を増大させることなく比較的長い時間にわたって反応を進行させる能力である。このような増大したインキュベーション時間により、分子間ライゲーションが起きる危険性の増大を伴わずに、より多い数の環化された産物が可能になる。さらに、前記分子は、濃度依存的様式ではなく物理的手段によって単離されるので、反応体積は、同じ数のライゲーション事象について遥かにより小さいものであり得(即ち、水相中の核酸の核酸濃度は、遥かにより高いものであり得る)、試薬のコストは低下し、サンプルを処理する容易性は増大する。当業者は、所定の微小滴中においてライゲーションが生じるためには、該微小滴が、リガーゼ酵素の少なくとも1個の分子を含む十分な試薬を含有しなければならないことを理解する。
【0184】
エマルジョンの破壊および環化されたDNAの単離
ライゲーションの後、ライゲーション反応は停止され得、エマルジョンは、「破壊される」(当技術分野において「解乳化」とも呼ばれる)。エマルジョンを破壊する多くの方法(例えば、米国特許第5,989,892号およびその中に引用された参考文献を参照のこと)が存在し、当業者は、好適な方法を選択し得る。解乳化に続いて、核酸を単離するための任意の好適な方法によって行われ得る核酸単離工程が行われ得る。一旦核酸が単離されると、ライゲーションされていない物質は、この課題に好適な任意の方法によって除去され得、その方法の1つは、サンプルのエキソヌクレアーゼ消化を行うことである。使用される特定のエキソヌクレアーゼ酵素は、作用される分子の型(一本鎖または二本鎖の、DNAまたはRNA)、および他の考慮すべき事項、例えば、プロセスに都合よく組み入れられる反応温度に、一部分、依存する。環化された物質は、エキソヌクレアーゼ処理の後に、当技術分野において公知である多くの手順のうちの1つ、例えば、フェノール/クロロホルム抽出またはこの目的に好適な任意の市販の精製キットによって、精製する必要がある。
【0185】
上述の従来の希釈ベースの環化プロトコルを使用すると、所望の環状産物の回収は、直鎖状の投入したDNA分子の長さの増大に伴って減少することが、観察された。本発明のエマルジョンライゲーション方法は、長いポリヌクレオチド分子、例えば、約500塩基より長いか、約1000塩基より長いか、約2000塩基より長いか、約5000塩基より長いか、約10000塩基より長いか、約20,000塩基より長いか、約50,000塩基より長いか、約100,000塩基より長いか、約250,000塩基より長いか、約100万塩基より長いか、もしくは約500万塩基より長いか、または関心対象の実験プロトコルにおいて望ましいと考えられる事実上任意のサイズの分子の環化において特に有用である。
【0186】
本明細書中に記載されるエマルジョンライゲーション方法は、それらが環化をもたらすか否かにかかわらず、広範な種々のライゲーション反応において有用である。従って、上述のエマルジョンライゲーション法は、本明細書に記載の種々の方法の任意のライゲーション工程、特に、投入した核酸の環化が望まれるライゲーション反応において使用され得る。
【0187】
乳化
エマルジョンは、2つの非混和性液相の不均一な系であり、相の一方が、他方の相中に顕微鏡サイズまたはコロイドサイズの液滴として分散される。本発明のエマルジョンは、マイクロカプセル(マイクロリアクター)の形成を可能にしなければならない。エマルジョンは、非混和性液体の任意の好適な組み合わせから生成され得る。本発明のエマルジョンは、微細に分かれた液滴の形態で存在する相(分散、内部または不連続相)として親水性の相(生化学的成分を含有)、および、これらの液滴が懸濁されるマトリックス(非分散、連続または外部相)として疎水性の非混和性液体(「油」)を有する。このようなエマルジョンは、「油中水型)」(W/O)と呼ばれる。これは、生化学的成分を含有する水相全体が分離した液滴(内部相)に区画化されているという利点を有する。疎水性の油である外部相は、一般に、生化学的成分を含有せず、従って不活性である。
【0188】
ある態様において、マイクロリアクターは、核酸ライゲーションに必要な試薬を含有する。複数のマイクロリアクターは、それぞれ、ちょうど1個のポリヌクレオチド分子を含有し得る。特定の態様において、例えば、リガーゼの熱不活性化が反応後に行われる場合、またはライゲーションが耐熱性リガーゼ(例えば、Taq DNAリガーゼ)を使用して高温で行われる場合、耐熱性の油中水型エマルジョンが望ましい。エマルジョンは、当技術分野において公知の任意の好適な方法によって形成され得る。エマルジョンを作製する1つの方法を下記に記載するが、エマルジョンを作製するための任意の方法が使用され得る。これらの方法は、当技術分野において公知であり、これらとしては、アジュバント法、向流法、逆流法、振盪、回転ドラム法、およびメンブレン法が挙げられる。さらに、マイクロカプセルのサイズは、成分の流量および速度を変えることによって調節され得る。例えば、滴下において、液滴のサイズおよび送達の合計時間は、変えられ得る。ある態様において、微小滴は、例えば、参照により全体として本明細書に組み入れられるLinkら(Angew. Chem. Int. Ed., 2006, 45, 2556-2560)によって記載されるようなマイクロ流体デバイス内で作製され得る。
【0189】
マイクロリアクターの少なくともいくつかは、十分な核酸および他のライゲーション試薬を含むのに十分に大きくあるべきである。しかし、マイクロリアクターの少なくともいくつかは、そのマイクロリアクター集団の一部が単一の自己ライゲーション可能なポリヌクレオチド分子を含有するように十分に小さくあるべきである。ある態様において、エマルジョンは、熱安定性である。好ましくは、形成される液滴は、直径が約100ナノメートル〜約500マイクロメートル、より好ましくは、約1マイクロメートル〜約100マイクロメートルのサイズの範囲である。有利には、任意で電場と組み合わせられた、直交流流体混合が、液滴形成の制御および液滴サイズの均一性を可能にする。
【0190】
生物学的反応に好適である種々のエマルジョンは、参照により各々が完全に本明細書に組み入れられる、Griffiths and Tawfik, EMBO, 22, pp. 24-35 (2003);Ghadessy et al., Proc. Natl. Acad. Sci. USA 98, pp. 4552-4557 (2001);米国特許第6,489,103号およびWO 02/22869において言及されている。好ましい態様において、油はシリコーンオイルである。
【0191】
界面活性剤
本発明のエマルジョンは、1つまたは複数の表面活性剤(エマルジョン安定化剤;界面活性剤)の添加によって安定化され得る。これらの界面活性剤は、乳化剤とも呼ばれ、水/油界面にて作用し、相の分離を防止する(または少なくとも遅らせる)。多くの油および多くの乳化剤が、油中水型エマルジョンの作製のために使用され得る;最近の編集物は、16,000種を超える界面活性剤を記載し、それらの多くは、乳化剤として使用される(Ash, M. and Ash, I. (1993) Handbook of industrial surfactants. Gower, Aldershot)。本発明の方法において使用されるエマルジョン安定化剤としては、Atlox 4912、ソルビタンモノオレエート(Span80;ICI)、ポリオキシエチレンソルビタンモノオレエート(Tween80;ICI)ならびに他の認識される市販の好適な安定化剤が挙げられる。
【0192】
種々の態様において、界面活性剤は、0.5〜50%、好ましくは、10〜45%、より好ましくは、30〜40%のエマルジョンの油相中のv/v濃度で提供される。
【0193】
ある態様において、化学的に不活性なシリコーンベースの界面活性剤、例えば、シリコーンコポリマーが、使用される。一態様において、使用されるシリコーンコポリマーは、ポリシロキサン−ポリセチル−ポリエチレングリコールコポリマー(セチルジメチコンコポリオール)、例えば、Abil(登録商標)EM90(Goldschmidt)である。
【0194】
化学的に不活性なシリコーンベースの界面活性剤は、エマルジョン組成物中における唯一の界面活性剤として提供されてもよく、または数種の界面活性剤の1つとして提供されてもよい。従って、異なる界面活性剤の混合物が、使用され得る。
【0195】
特定の態様において、使用される1つの界面活性剤は、Dow Corning(登録商標)749 Fluidである(1〜50%、好ましくは、10〜45%、より好ましくは25〜35%w/wで使用される)。他の特定の態様において、使用される1つの界面活性剤は、Dow Corning(登録商標)5225C Formulation Aidである(1〜50%、好ましくは、10〜45%、より好ましくは35〜45%w/wにて使用される)。好ましい態様において、油/界面活性剤混合物は、40%(w/w)Dow Corning(登録商標)5225C Formulation Aid、30%(w/w)Dow Corning(登録商標)749 Fluid、および30%(w/w)シリコーンオイルからなる。
【0196】
本発明の方法は、現行の方法を上回る複数の利益および利点を提供する。先行技術を上回る本方法の1つの利点は、真核生物または原核生物宿主中における作製されたフラグメントのクローニングおよび増殖が必要とされないことである。これは、標的配列が宿主細胞中におけるエピソームとしての増殖の間に再配列され得る複数の反復を含む場合、特に有用である。
【0197】
本開示の方法の別の利点は、それが、コンティグ配列だけでなく、100bpを超えるか、300bpを超えるか、500bpを超えるか、1kbを超えるか、5kbを超えるか、10kbを超えるか、100kbを超えるか、1Mbを超えるか、10Mbを超えるか、またはより長い長さを有し得る長いコンティグの末端配列および末端配列の方向も提供することによってゲノムアセンブリを容易にし得ることである。この配列情報および方向情報は、ゲノムアセンブリを容易にし、ギャップ閉鎖を提供するために、使用され得る。
【0198】
さらに、ペアエンド読み取りは、ゲノムのアセンブリにおける第2のレベルの信頼度を提供する。例えば、ペアエンド配列決定および定型的なコンティグ配列決定がDNA配列について一致する場合、その配列の信頼度のレベルは、増大する。あるいは、2つの配列データが互いに矛盾する場合、その信頼度は減少し、さらなる分析および/または配列決定が、不一致の原因を見出すために必要となる。
【0199】
ペアエンド読み取りにおけるオープンリーディングフレームの有無はまた、オープンリーディングフレームの位置についての方向を提供する。例えば、コンティグの両方の配列決定された末端が、オープンリーディングフレームを含む場合、完全なコンティグがオープンリーディングフレームである機会が、存在する。これは、標準的な配列決定技術によって確認され得る。あるいは、2つの末端の知見によって、特異的PCRプライマーが、その2つの末端を増幅するために構築され得、増幅された領域は、オープンリーディングフレームの存在を測定するために配列決定され得る。
【0200】
本発明の方法はまた、ゲノムの構成および構造の理解を改善する。ペアエンド配列決定は、配列決定が困難である領域にまたがる能力を有するので、ゲノムの構造は、これらの領域が配列決定されない場合であっても推定され得る。配列決定が困難である領域は、例えば、反復領域および二次構造の領域であり得る。この場合において、これらの困難な領域の数および位置は、これらの領域の配列が公知でない場合であってもゲノムにおいてマッピングされ得る。
【0201】
本発明の方法はまた、長い距離にわたってゲノムのハプロタイピングを可能にする。例えば、特異的プライマーが、長い距離によって連結された2つのSNPを含むゲノムの領域を増幅するために作製され得る。この増幅された領域の2つの末端は、本発明の方法を使用して配列決定され得、2つのSNPの間の核酸を配列決定することなくハロタイプが決定される。この方法は、2つのSNPが、配列決定するのが非経済である領域にまたがる場合に、特に有用である。これらの領域は、長い領域、反復を有する領域、または二次構造の領域を含む。
【0202】
本方法のビオチン化されたアダプターは、さらなる利点を提供する(図7および22)。図7Aは、配列決定の準備ができている状態である形式の、配列決定プライマーAおよび配列決定プライマーBにライゲーションされた核酸を示す。核酸のいくつかは、単一のコンティグ領域(701)の2つの末端を含まない混入核酸である。コンティグの両方の末端を含む核酸フラグメントは、702として示される。核酸702は、ビオチンを含む核酸の唯一の化学種であるので、この化学種は、ストレプトアビジンビーズを使用して精製され得る(図7B)。この化学種は、精製後、配列決定の準備ができている状態になっている。アフィニティー精製を使用することによって、有用な情報をもたらす配列の分画が、実質的に増大され得る。
【0203】
これは、混入DNA(701)が長い場合、例えば、図7Dにおける混入核酸(701)の各々が、数kb長である場合に、特に有用である。これらの混入物を配列決定することは、計画に投入される試薬、人的資源、およびコンピュータの処理能力のかなりの部分を消費する。この場合において、アフィニティークロマトグラフィーによる適切なフラグメントの事前の精製(図7E)は、実質的な労力および試薬の節約をもたらす。
【0204】
当業者は、逆鎖のイノシンを含む任意の二本鎖DNA(ヘアピンを伴ってまたは伴わずに、図14に示される通り)のEndoVによるエンドヌクレアーゼ切断が、一本鎖突出(粘着末端)を生成し得ることを即座に認識し、ここで、突出は、実質的に任意のヌクレオチド配列を有し得る。本発明はまた、図14に実質的に類似するがヘアピンを伴わないポリヌクレオチド設計および方法を含む。さらに、上述されるように、ヘアピンを伴うまたは伴わない、図14に示されるような本発明の方法および組成物は、特有のエンドヌクレアーゼ部位の導入が望ましい多数の分子生物学技術および組換えDNA技術において有用である。このような技術としては、DNAライブラリーおよびcDNAライブラリーの構築、種々のサブクローニングストラテジー、またはプライマー、アダプター、もしくはリンカー中の特有のエンドヌクレアーゼ部位から恩恵を受ける任意の方法が挙げられるが、これらに限定されない。
【0205】
本明細書中に記載される方法のいずれかによって生成されるペアエンド核酸構築物は、当技術分野において公知である任意の配列決定方法によって配列決定され得る。標準的な配列決定方法、例えば、サンガー配列決定またはマクサム−ギルバート配列決定は、当技術分野において広く公知である。配列決定はまた、例えば、454(登録商標)Life Sciences Corporation(Branford, CT, USA)によって開発された454 Sequencing(商標)として公知である自動配列決定方法を使用することによって行われ得、これは、例えば、米国特許第7,323,305号、および第7,244,567号、ならびに米国特許出願第10/767,894号(2004年1月28日出願);および第10/767,899号(2004年1月28日出願)に記載されている。当技術分野において公知であるさらなる配列決定方法、例えば、参照により本明細書に組み入れられるMetzger(Genome Res. 2005 Dec; 15(12): 1767-76)によって概説されるような任意の合成による配列決定(sequencing-by-synthesis)方法またはライゲーションによる配列決定(sequencing-by-ligation)方法もまた企図され、本発明のペアエンド配列決定法において使用され得る。
【0206】
本開示を通して、用語「ビオチン」、「アビジン」または「ストレプトアビジン」は、結合対のメンバーを記載するために使用された。これらの用語は結合対を使用するための1つの方法を単に例示することが、理解される。従って、用語「ビオチン」、「アビジン」、または「ストレプトアビジン」は、結合対の任意の1つのメンバーによって置換され得る。結合対は、互いへの特異的結合を示す任意の2つの分子であってよく、これらとしては、少なくとも、FLAG/抗FLAG抗体;ビオチン/アビジン、ビオチン/ストレプトアビジン、レセプター/リガンド、抗原/抗体、レセプター/リガンド、ポリHIS/ニッケル、プロテインA/抗体およびそれらの誘導体などの結合対が挙げられる。他の結合対が、公知であり、文献において公開されている。
【0207】
本開示中のいずれかの箇所において引用される全ての特許、特許出願および参考文献は、参照によりそれらの全体が本明細書に組み入れられる。
【0208】
ここで、本発明を以下の非限定的な実施例によってさらに説明する。
【実施例】
【0209】
実施例1:オリゴヌクレオチド設計
この実験において使用されるオリゴヌクレオチドは、以下の通りに設計および合成される。
【0210】
図3Aの上部に示される捕捉エレメントオリゴヌクレオチドを、UA3アダプターおよびキーを含むように設計する。NotI部位を、アダプターの間に配置する。完全な構築物(捕捉エレメント)を、ネステッドオリゴおよびPCRを使用して作製し得る。最終産物の配列を、合成およびクローニングする。
【0211】
図3Aの下部に示されるIIS型捕捉フラグメントオリゴヌクレオチドは、IIS型制限エンドヌクレアーゼ部位(例えば、MmeI)を示す配列がキー配列の後に捕捉フラグメント中に含まれることを除いて、上述の捕捉フラグメントと同様である。これらのIIS型制限エンドヌクレアーゼ切断部位は、IIS型制限エンドヌクレアーゼによって切断されるこれらの捕捉エレメントを用いて作製される任意の構築物の切断を可能にする。当技術分野において公知であるように、IIS型制限エンドヌクレアーゼは、その認識部位から種々の距離にて、MmeIの場合は20/18塩基にて、DNAを切断する。
【0212】
短いアダプター捕捉フラグメントオリゴヌクレオチドを、SAD1アダプターおよびキーを含むように設計した(図3B)。また、NotI部位をアダプターの間においた。このオリゴヌクレオチドを、キー配列の後のMmeI IIS型制限エンドヌクレアーゼ切断部位を用いて合成し得る(図3B、短いアダプター捕捉フラグメント(IIS型)を参照のこと)。
【0213】
実施例2:ヘアピンアダプターペアエンド配列決定のためのプロトコル
100μl中のE. CoIi K12 DNA(20μg)を、標準的なHydroShearアセンブリ(Genomic Solutions, Ann Arbor, MI, USA)を使用して速度10で20サイクルにわたってハイドロシアーした。メチル化反応を、50μlのDNA(5μg)、34.75μlのH2O、10μlのメチラーゼ緩衝液、0.25μlの32mM SAM、および5μlのEcoRIメチラーゼ(40,000ユニット/ml、New England Biolabs (NEB), Ipswich, MA, USA)を添加することによって、せん断されたDNAに対して行った。反応物を、37℃で30分間インキュベートした。メチル化反応の後、せん断されメチル化されたDNAを、製造業者の説明書に従ってQiagen MinElute PCR精製カラムを使用して精製した。精製されたDNAを、10μlのEB緩衝液によってカラムから溶出した。
【0214】
せん断されメチル化されたDNAを、平滑末端を有するせん断された材料を作製するためにポリッシュ工程に供した。10μlのDNAを、13μlのH2O、5μlの10Xポリッシュ緩衝液、5μlの1mg/mlウシ血清アルブミン、5μlの10mM ATP、3μlの10mM dNTP、5μlの10U/μl T4ポリヌクレオチドキナーゼ、および5μlの3U/μl T4 DNAポリメラーゼを含む反応混合物へ添加した。反応物を12℃で15分間インキュベートし、その後、温度を、さらに15分間、25℃まで上昇させた。続いて、反応物を、製造業者の説明書に従ってQiagen MinElute PCR精製カラムにおいて精製した。
【0215】
10μlの5μgせん断DNA、17.5μlのH2O、50μlの2X Quickリガーゼ緩衝液、20μlの10μMヘアピンアダプター、および2.5μlのQuickリガーゼ(T4 DNAリガーゼ、NEB)を添加することによって、ヘアピンアダプターを、せん断された平滑末端DNAフラグメントへライゲーションした。反応物を25℃で15分間インキュベートし、その後、ライゲーションされたフラグメントを、混合物へ2μlのλエキソヌクレアーゼ、1μlのRec J(30,000ユニット/ml、NEB)、1μlのT7エキソヌクレアーゼ(10,000ユニット/ml、NEB)、および1μlのエキソヌクレアーゼI(20,000ユニット/ml、NEB)を添加することによって選択した。反応物を37℃で30分間インキュベートし、その後、サンプルを、Qiagen MinElute PCR精製カラムにおいて精製した。次いで、処理されたDNAを、製造業者の説明書に従ってInvitrogen Purelinkカラムに通し、50μlの体積でカラムから溶出した。
【0216】
ライゲーションされ、エキソヌクレアーゼ処理されたDNAを、EcoRIによる消化に供した。50μlのDNA、30μlのH2O、10μlのEcoRI緩衝液、および10μlのEcoRI(20,000ユニット/ml)を含む反応物を、37℃で一晩インキュベートした。切断された産物を、製造業者の説明書に従ってQiagen QiaQuickカラムを使用して精製した。切断された産物を、50μlのDNA、20μlの緩衝液4(New England Biolabs)、2μlの100mM ATP、123μlのH2O、および5μlのリガーゼ(上記の通り)を含む反応において、閉じた環状DNAを作製するために、もう一度ライゲーションした。ライゲーション反応物を25℃で15分間インキュベートし、その後、1μlのλエキソヌクレアーゼ(5,000ユニット/ml、NEB)、0.5μlのRec J(上記の通り)、0.5μlのT7エキソヌクレアーゼ(上記の通り)、および0.5μlのエキソヌクレアーゼI(上記の通り)を混合物へ添加することによって、それらをエキソヌクレアーゼ処理のさらなるラウンドに供した。エキソヌクレアーゼ反応物を37℃で30分間インキュベートし、その後、サンプルをQiagen MinElute PCR精製カラムによって精製した。
【0217】
処理されたDNAを、次いで、10μlのDNA、78.75μlのH2O、10μlの緩衝液4(New England Biolabs)、0.25μlのSAM、および0.5μlのMme I(2,000ユニット/ml、NEB)を含む反応混合物におけるMme I消化に供した。反応物を37℃で60分間にわたってMme Iを用いて消化し、次いで0.1%の最終濃度の3M酢酸ナトリウムによって緩衝化したQiagen QiaQuickカラムにおいて精製した。カラムを700μlの8.0MグアニジンHClによって洗浄し、前記サンプルを、製造業者の説明書に従ってカラムに添加した。DNAを30μlのEB緩衝液において溶出し、100μlの最終体積まで希釈した。
【0218】
ストレプトアビジン磁気ビーズ(50μl)(Dynal Dynabeads M270, Invitrogen, Carlsbad, CA, USA)を、2Xビーズ結合緩衝液によって洗浄し100μlの2Xビーズ結合緩衝液中にそのビーズを懸濁することによって調製し、その後、100μlのDNAサンプルをビーズに添加し、室温で20分間にわたって混合した。ビーズを洗浄緩衝液において2回洗浄した。SAD7アダプターセット(A/Bセット、ここで、一本鎖オリゴヌクレオチドであるSAD7FtopおよびSAD7Fbotを、Aアダプターを形成するためにアニーリングさせ、一本鎖オリゴヌクレオチドであるSAD7RtopおよびSADRFbotを、Bアダプターを形成するためにアニーリングさせる)

ここでNは、4種の塩基A、G、TまたはCのいずれかである)を、ストレプトアビジンビーズに結合したDNAへライゲーションし、ここで、15μlのH2O、25μlのQuickリガーゼ緩衝液、5μlのSAD7アダプターセット、および5μlのQuickリガーゼ(上記の通り)を含むライゲーション反応混合物を、ビーズ−DNA混合物に添加した。ライゲーション反応物を25℃で15分間インキュベートし、次いで、ビーズをビーズ洗浄緩衝液によって2回洗浄した。
【0219】
ヌクレオチド充填反応を、40μlのH2O、5μlの10X充填緩衝液、2μlの10mM dNTP、および3μlの充填ポリメラーゼ(Bst DNAポリメラーゼ、8,000ユニット/ml、NEB)を含有する混合物をビーズへ添加することによって行った。反応物を37℃で20分間インキュベートし、ビーズを洗浄緩衝液において2回洗浄した。次いで、ビーズを25μlのTE緩衝液に懸濁した。
【0220】
次いで、ビーズへ結合されたDNAを、30μlのH2Oと、5μlの10X Advantage 2緩衝液と、2μlの10mM dNTPと、1μlの100μM順方向プライマー

と、1μlの100μM逆方向プライマー

と、10μlのビーズへ結合されたDNAと、1μlのAdvantage 2ポリメラーゼ混合物(Clontech, Mountain View, CA, USA)とを含有する反応混合物でPCRへ供した。PCRを、以下のプログラムを使用して行い、その後、反応物を14℃で維持した:(a)94℃で4分間、(b)94℃で15秒間、(c)64℃で15秒間、ここで、工程(b)および(c)を、19サイクルにわたって行う、(d)68℃で2分間。
【0221】
PCR産物を、Qiagen MinElute PCR精製カラムを使用して精製し、次いで、精製された産物を、120bpの産物の存在を検出するために、1センチメートル当たり5ボルトで1.5%アガロースゲルにおいて電気泳動した。120bpのフラグメントをゲルから切り出し、Qiagen MinEluteゲル抽出プロトコルを使用して回収した。120bpのフラグメントを、18μlのEB緩衝液で溶出した。二本鎖産物を、ストレプトアビジンビーズに結合させ、ビーズ洗浄緩衝液で2回洗浄した。一本鎖産物を、125mM NaOHで溶出し、Qiagen MinElute PCR精製カラムにおいて精製した。次いで、この物質を、454 Life Sciences Corporation自動配列決定システムにおいて、標準的な454 Life Sciences Corporation(Branford, CT, USA)配列決定法を使用して、配列決定した。
【0222】
実施例3:非ヘアピンアダプターペアエンド配列決定のためのプロトコル
体積100μlの大腸菌K12 DNA(5μg)を、標準アセンブリ(HydroShear、上記の通り)を使用して速度11において20サイクルにわたってハイドロシアーした。せん断されたDNAを、製造業者の説明書に従ってQiagen MinElute PCR精製カラムにおいて精製し、そして23μlのEB緩衝液によって溶出した。精製されたせん断DNAを、23μlのDNA、5μlの10Xポリッシュ緩衝液、5μlの1mg/mlウシ血清アルブミン、5μlの10mM ATP、3μlの10mM dNTP、5μlの10U/μl T4ポリヌクレオチドキナーゼ、および5μlの3U/μl T4 DNAポリメラーゼを含有する反応混合物中において平滑末端ポリッシュに供した。反応物を12℃で15分間インキュベートし、その後、温度をさらに15分間25℃へ上昇させた。続いて、反応物を、製造業者の説明書に従ってQiagen MinElute PCR精製カラムにおいて精製した。非ヘアピンアダプターのライゲーションを、25μlの2X Quickリガーゼ緩衝液、18.5μlの10μM非ヘアピンアダプター、および2.5μlのQuickリガーゼ(上記の通り)を含有する反応混合物中において、2μgのせん断され精製されたDNAを使用して行った。ライゲーション反応物を25℃で15分間インキュベートし、その後、サンプルを、Sephacryl S-400スピンカラムに通し、続いてQiagen MinElute PCR精製カラムに通した。次いで、10μlのEB緩衝液によってDNAをカラムから溶出した。
【0223】
精製された、ライゲーションされたDNAを、次いで、キナーゼ反応に供し、ここで、混合物は、13μlのH2O、25μlの2X緩衝液、10μlのDNA、および2μlの10U/μl T4ポリヌクレオチドキナーゼを含有していた。反応物を37℃で60分間インキュベートし、その後、サンプルを、1 cm当たり5ボルトで1%アガロースゲルにおいて電気泳動した。1500〜4000bpのバンドをゲルから切り出し、Qiagen MinEluteゲル抽出プロトコルを使用して回収した。
【0224】
精製されたDNAを、18μlのDNA、20μlの緩衝液4(New England Biolabs)、2μlのATP、150μlのH2O、および10μlのリガーゼ(上記の通り)を含有する反応混合物中において環状DNAを作製するために、ライゲーションの別のラウンドへ供した。反応物を25℃で15分間インキュベートし、その後、2μlのλエキソヌクレアーゼ(上記の通り)、1μlのRec J(上記の通り)、1μlのT7エキソヌクレアーゼ(上記の通り)、および1μlのエキソヌクレアーゼI(上記の通り)を含有する混合物、37℃で30分間インキュベートした。エキソヌクレアーゼ反応の後、DNAを、Qiagen MinElute PCR精製カラムにおいて精製し、20μlのEB緩衝液によって溶出した。
【0225】
精製されたライゲーションされたDNAを、次いで、68.6μlのH2O、10μlの緩衝液4(New England Biolabs)、0.2μlのSAM、および1μlのMme I制限エンドヌクレアーゼ(上記の通り)を含有する混合物へ添加した。DNAを37℃で30分間切断し、その後、DNAを、0.1%の最終濃度の3M酢酸ナトリウムにて予め緩衝化したQiagen QiaQuickカラムを使用して精製し、700μlの8.0MグアニジンHClによって洗浄した。精製されたDNAを、次いで、30μlのEB緩衝液によって溶出し、体積を100μlへ調節した。
【0226】
ストレプトアビジン磁気ビーズ(50μl)(上記の通り)を、2Xビーズ結合緩衝液によって洗浄し、100μlのビーズ結合緩衝液に懸濁した。次いで、ビーズを100μlの前記DNAサンプルと混合し、室温で20分間にわたって互いに結合させた。その後、ビーズを洗浄緩衝液中において2回洗浄し、SAD7アダプターセット(A/Bセット)(上記の通り)とのライゲーション反応へ供した。15μlのH2O、25μlのQuickリガーゼ緩衝液、5μlのSAD7アダプター、および5μlのQuickリガーゼ(上記の通り)を含有する混合物を、ビーズへ結合されたDNAに添加し、25℃で15分間インキュベートし、その後、ビーズを洗浄緩衝液中において2回洗浄した。
【0227】
ビーズへ結合されたDNAを、40μlのH2O、5μlの10X充填緩衝液、2μlの10mM dNTP、および3μlの充填ポリメラーゼ(上記の通り)を含有する混合物中において、充填反応に供した。反応を37℃で20分間行い、その後、ビーズを洗浄緩衝液において2回洗浄し、25μlのTE緩衝液に懸濁した。ビーズへ結合されたDNAを、30μlのH2O、5μlの10X Advantage 2緩衝液、2μlのdNTP、0.5μlの100μM順方向プライマー(上記の通り)、0.5μlの100μM逆方向プライマー(上記の通り)、10μlのビーズへ結合されたDNA、および1μlのAdvantage 2酵素(上記の通り)を含有する反応混合物中において増幅させた。PCR反応を以下の条件下で行い、その後、PCR反応を14℃で保った:(a)94℃で4分間、(b)94℃で15秒間、(c)64℃で15秒間、ここで、工程(b)および(c)を、24サイクルにわたって繰り返した、(d)68℃で2分間。PCR産物を、Qiagen MinElute PCR精製カラムにおいて精製し、1cm当たり5ボルトで1.5%アガロースゲルにおいて電気泳動した。120bpの産物をゲルから切り出し、Qiagen MinEluteゲル抽出プロトコルで回収した。続いて、DNAを18μlのEB緩衝液で溶出した。
【0228】
二本鎖DNAをストレプトアビジンビーズに結合させ、ビーズを洗浄緩衝液で2回洗浄した。次いで、一本鎖DNAを125mM NaOHによって溶出し、続いて、Qiagen MinElute PCR精製カラムを使用して精製した。精製した物質を、標準的な454エマルジョンおよび配列決定プロトコルに供した。
【0229】
上述の手順を使用して、本発明者らは、以下の結果を得た。
【0230】
大腸菌コンティグが、4回の60×60の実行(約130万の読み取り)からの通常の454配列からもたらされた:1000bpよりも大きい303個のコンティグがもたらされ、それらは、16,858bpの平均サイズ、および94,060bpの最大サイズを有した。表5は、上記の手順を使用して達成されたさらなる結果を含む。
【0231】
(表5)ペアエンド配列決定手順の結果

【0232】
分析を、最初に、Genbankから得た大腸菌K12ゲノムに対して全てのペア読み取りをブラスト検索することによって行った。参照ゲノムと0.1未満の期待値で一致した読み取りを、保持した。内部リンカー配列によって分けられた2つの別個のブラストヒットを含んだ全ての読み取りを、ゲノムにおいて離れているそれらのブラスト検索した距離について分析し、距離が5,000bp未満である場合にのみ保持した。これらの読み取りを、次いで、ゲノムにおける第1および第2の位置ヒットによって順序付けし、次の分類したペア配列にオーバーラップが生じたかどうかを見るために試験した。これらの順序付けされたコンティグの各々を、次いで、上記と同一の様式において454配列決定コンティグに対するオーバーラップパターンについて試験した。
【0233】
実施例4:組換え反応によるインビトロ切除についてのプロトコル
1.DNA断片化
30μgの大腸菌K12 DNAサンプルを、Hydroshearラージアセンブリを使用してせん断し、15〜30Kbのフラグメントを作製した。DNAフラグメントを、MicroSpin S400カラムを通過させることによって精製処理した。
【0234】
2.フラグメント末端ポリッシュ
DNAフラグメントの末端を、微小遠心管中において以下のようにT4 DNAポリメラーゼおよびT4 PNKを使用してポリッシュした。2つの反応を、30μgの最初のDNAサンプルについて行った。
10X PNK緩衝液 10μl
BSA(20mg/ml希釈) 0.5μl
ATP(100mM) 1μl
dNTP(各々10mM) 4μl
せん断されたDNA(<15μg) 75μl
T4 DNAポリメラーゼ(3U/μl) 5μl
T4 PNK(10U/μl) 5μl
【0235】
反応混合物を十分に混合し、12℃で15分間インキュベートした。その直後に、反応混合物を25℃で15分間インキュベートした。反応物をQIAEX IIキットで精製処理し、1反応当たり37 μl EBで溶出した。
【0236】
3.LoxPアダプターライゲーション
loxP6アダプターを、下記のように、ポリッシュされたDNAフラグメントへ添加した(二重の反応が必要とされた)
Roche 2X Rapidリガーゼ緩衝液(#1) 50μl
loxP6アダプター(各々20uM) 10μl
ポリッシュされたDNA 35μl
Roche Rapidリガーゼ(#3) 5μl
【0237】
反応混合物を十分に混合し、25℃で15分間インキュベートした。
【0238】
4.ゲル精製およびサイズ選択
2つのloxPがライゲーションされたDNAサンプルを、プレパラティブコーム(サンプルコームを使用する場合、複数のウエルを使用し得る)を使用して大きな0.5%アガロースゲル上にロードし、ゲルを、35Vで一晩、電気泳動した。
【0239】
所望の範囲、例えば、20〜25KbのDNAフラグメントを、翌朝回収し、製造業者の指示通りにQIAEX IIを使用して精製した。
【0240】
5.充填反応
充填反応を行い、loxP6アダプターライゲーションによって導入されたニックを修復した。
LoxPアダプター付加DNA 38μl
10X Bstポリメラーゼ緩衝液 5μl
dNTP(各々10 mM) 4μl
Bst DNAポリメラーゼ 3μl
【0241】
反応混合物を十分に混合し、50℃で15分間インキュベートし、続いて、MicroSpin S400カラムに通した。次いで、DNA濃度を定量した。
【0242】
6.環化についての切除反応
環化された分子を作製するための部位特異的組換えを、上記の充填反応から作製された150〜300ngのDNAを使用して行った。
分子生物学グレードの水 39μl
10X Cre緩衝液 10μl
充填された完成したDNA(150ng) 50μl
Creリコンビナーゼ(12U/ul) 1μl
【0243】
反応混合物を十分に混合し、37℃で45分間、次いで80℃で10分間インキュベートし、Creリコンビナーゼを不活性化した。反応混合物を10℃へ冷却し、次の工程を直ちに行った。
【0244】
7.直鎖状分子除去
直鎖状分子を、エキソヌクレアーゼ処理によって上記の反応混合物から除去した。
【0245】
エキソヌクレアーゼインキュベーションを、下記の試薬を上述の冷却した切除反応混合物へ添加することによって直ちに行った。
ATP(100mM) 1.1μl
DTT(100mM) 1.1μl
Plasmid-Safe ATP-Dependent DNase(10U/ul) 5μl
エキソヌクレアーゼI(20U/μl) 3μl
【0246】
反応混合物を十分に混合し、37℃で30〜60分間インキュベートした。次いで、エキソヌクレアーゼを、80℃で20分間のインキュベーションによって直ちに不活性化した。
【0247】
以下の残りの手順は、454ライブラリー作製法の改変バージョンである。
【0248】
8.環化された分子の噴霧化
環化された分子を、噴霧化によって1Kb未満のフラグメントへ破壊した。
【0249】
1μlの0.5M EDTAおよび1μlのpUC19を、上記の熱不活性化された反応混合物中へ添加した。DNAを、44psiで2分間、噴霧化緩衝液中において噴霧化した。噴霧化されたDNAフラグメントを、製造業者の指示通りにMinEluteキットを使用して精製処理した。
【0250】
9.フラグメント末端ポリッシュ
10X PNK緩衝液 5μl
BSA(1mg/ml希釈) 5μl
ATP(10mM) 5μl
dNTP(各々10 mM) 2μl
噴霧化されたDNA 23μl
T4 DNAポリメラーゼ(3U/μl) 5μl
PNK(10U/μl) 5μl
【0251】
反応混合物を十分に混合し、12℃で15分間インキュベートした。その直後に、反応混合物を25℃で15分間インキュベートした。反応物をQiaQuickで精製処理し、50μlのEB中で溶出した。
【0252】
10.ライブラリー固定化
ポリッシュされたDNAフラグメントを、製造業者の推奨通りに、ストレプトアビジンがコーティングされたビーズ、例えば、Dynal M270ビーズへ結合させた。ビーズを500μlのTEで3回洗浄し、ビーズのみを保持した。
【0253】
11.454 PEアダプターライゲーション
454ペアエンドアダプターを、以下のように、ビーズ上の固定化されポリッシュされたDNAフラグメントへライゲーションした。
分子生物学グレードの水 15μl
Roche Rapidリガーゼ緩衝液(#1) 25μl
非ビオチン化454 PEアダプター 5μl
【0254】
反応混合物を十分に混合し、捕捉されたDNAを有するビーズへ添加した。反応混合物をボルテックスして混合し、次いで、
Roche Rapidリガーゼ(#3) 5μl
を添加した。
【0255】
反応混合物を十分に混合し、室温でローテーター上において15分間インキュベートした。ビーズを500μlのTEで少なくとも3回洗浄し、ビーズのみを保持した。
【0256】
12.充填反応
充填反応を、ニック修復のため、および454 PEアダプターによって導入された5'突出を充填するために行った。
分子生物学グレードの水 40μl
10X Bst DNAポリメラーゼ緩衝液 5μl
dNTP(各々10 mM) 2μl
Bst DNAポリメラーゼ 3μl
【0257】
反応混合物を上記由来のDNAビーズへ添加し、37℃で15分間インキュベートした。次いで、ビーズを20ulのEBに再懸濁した。
【0258】
13.ライブラリープレ増幅
二本鎖ペアエンドライブラリーを以下のようにプレ増幅した。
分子生物学グレードの水 28.5μl
10X HiFi緩衝液 5μl
50mM MgCl2 2.5μl
dNTP(各々10 mM) 2μl
順方向/逆方向プライマー対(各々100μM) 1μl
ビーズ上のDNA 10μl
HiFi Taq DNAポリメラーゼ(5U/μl) 1μl
【0259】
サーモサイクラーについて以下のプログラムを使用した。
94℃で3分間
940Cで30秒間;60℃で20秒間;72℃で45秒間、20サイクルについて
72℃で2分間
10℃で永久に
【0260】
14.ライブラリーサイズの選択
所望のライブラリーフラグメントサイズを、以下の通りに、SPRIビーズクリーニングを2ラウンド行うことによって選択した。
1)上記の反応混合物を、分子生物学グレードの水を添加することによって100μlにした。72μlのSPRIビーズをサンプルへ添加した。製造業者の指示に従って、ビーズをインキュベートおよび洗浄した。DNAを80μlのEBで溶出した。
2)52μlのSPRIビーズを、80μlの溶出されたサンプルへ添加し、室温で5分間インキュベートした。ビーズをMPCへ結合させ、結合されていない上澄みを回収した。
3)QiaQuickキットを使用して緩衝液交換を行い、50μlのEBで溶出した。
【0261】
15.一本鎖ライブラリー単離
1)上記のサイズ選択されたDNAを、ストレプトアビジンビーズへ捕捉した。洗浄後、ビーズに結合されたDNAを、Melt溶液で変性させ、結合されていないssDNAを回収した。
2)ssDNAを酢酸ナトリウムで中和し、緩衝液を、MinEluteキットを使用して交換した。ssDNAを15〜20μlのTE中に溶出した。
【0262】
次いで、一本鎖ペアエンドライブラリーのメンバーを、標準454エマルジョン増幅反応において増幅し、増幅されたメンバーの集団を配列決定した。図24は、ペア距離分布を示すグラフを含み、これは、24Kbの標的挿入物サイズおよびおよそ40Kbの最も長い検出されたペア距離と一致している。
【0263】
本発明の有利な態様をこのように詳細に説明したが、それらの多くの明白なバリエーションが本発明の精神または範囲を逸脱することなく可能であるから、上記のパラグラフによって定義される本発明は、上記の説明に記載される特定の詳述に限定されないことが理解されるべきである。本明細書中に記載される方法の改変およびバリエーションは、当業者に自明であり、添付の特許請求の範囲によって包含されることが意図される。
【図1−1】

【図1−2】

【図1−3】

【図1−4】

【図1−5】

【図2】

【図3】

【図4】

【図5】

【図6A】

【図6B】

【図6C】

【図6D】

【図6E】

【図6F】

【図7】

【図8−1】

【図8−2】

【図8−3】

【図8−4】

【図8−5】

【図8−6】

【図9】

【図10】

【図11】

【図12−1】

【図12−2】

【図12−3】

【図12−4】

【図12−5】

【図12−6】

【図13】

【図14A】

【図14B】

【図14C】

【図14D】

【図14E】

【図15−1】

【図15−2】

【図15−3】

【図15−4】

【図15−5】

【図15−6】

【図16】

【図17】

【図18】

【図19】

【図20】

【図21】

【図22】

【図23】

【図24】

【図25】


【特許請求の範囲】
【請求項1】
− 核酸分子を断片化し、標的核酸分子を生成する工程;
− 組換えアダプターエレメントを標的核酸分子の各末端へライゲーションし、アダプター付加(adapted)標的核酸分子を生成する工程;
− アダプター付加標的核酸を部位特異的リコンビナーゼへ曝露し、アダプター付加標的核酸から環状核酸産物および直鎖状核酸産物を生成する工程であって、環状核酸産物が標的核酸分子を含む、工程;ならびに
− 環状核酸産物を断片化し、標的核酸分子の各末端由来の配列領域を含む鋳型核酸分子を生成する工程
を含む、インビトロの反応において標的核酸の2つの末端領域を含むDNA構築物を得るための方法。
【請求項2】
アダプター付加標的核酸を部位特異的リコンビナーゼへ曝露する工程の後に、非環状分子を除去する工程をさらに含む、請求項1記載の方法。
【請求項3】
− 鋳型核酸を増幅し、複数の実質的に同一のコピーを含む集団を生成する工程;および
− 前記集団を配列決定し、鋳型核酸の配列組成を含む配列データを作成する工程
をさらに含む、請求項1記載の方法。
【請求項4】
組換えアダプターエレメントが、第1の組換えアダプターエレメントおよび第2の組換えアダプターエレメントを含み、第1および第2の組換えアダプターエレメントが両方とも方向エレメントを含む、請求項1記載の方法。
【請求項5】
部位特異的リコンビナーゼが、Creリコンビナーゼを含む、請求項1記載の方法。
【請求項6】
標的核酸分子が、少なくとも3Kb、少なくとも8Kb、少なくとも10Kb、少なくとも20Kb、少なくとも50Kb、および少なくとも100Kbからなる群より選択される長さを含む、請求項1記載の方法。
【請求項7】
大きな核酸分子がゲノムDNAを含む、請求項1記載の方法。
【請求項8】
環状核酸産物が第1のハイブリッド組換えアダプターを含み、かつ直鎖状核酸産物が第2のハイブリッド組換えアダプターを含み、第1および第2のハイブリッド組換えアダプターが、ライゲーションされた組換えアダプター由来のエレメントを含む、請求項1記載の方法。
【請求項9】
環状核酸産物を断片化する工程が噴霧化を含む、請求項1記載の方法。
【請求項10】
− 大きな核酸分子を断片化し、複数の標的核酸分子を生成する工程;
− 組換えアダプターエレメントを標的核酸分子の各末端へライゲーションし、複数のアダプター付加標的核酸分子を生成する工程;
− アダプター付加標的核酸分子を部位特異的リコンビナーゼへ曝露し、アダプター付加標的核酸分子から複数の環状核酸産物および複数の直鎖状核酸産物を生成する工程であって、環状核酸産物が標的核酸分子を含む、工程;ならびに
− 環状核酸産物を断片化し、標的核酸分子の各末端由来の配列領域を含む複数の鋳型核酸分子を生成する工程
を含む、インビトロの反応において標的核酸の2つの末端領域を含む複数のDNA構築物を得るための方法。
【請求項11】
− 複数の組換えアダプターエレメント;および
− 好ましくはCreリコンビナーゼである、部位特異的リコンビナーゼ
を含む、請求項1記載の方法を行うためのキット。
【請求項12】
− 複数の組換えアダプターエレメント;
− 好ましくはCreリコンビナーゼである、部位特異的リコンビナーゼ;
− エキソヌクレアーゼ;および
− 好ましくはpUC19である、環状キャリアDNA
を含む、請求項1記載の方法を行うためのキット。

【公表番号】特表2011−510669(P2011−510669A)
【公表日】平成23年4月7日(2011.4.7)
【国際特許分類】
【出願番号】特願2010−545396(P2010−545396)
【出願日】平成21年2月4日(2009.2.4)
【国際出願番号】PCT/EP2009/000741
【国際公開番号】WO2009/098037
【国際公開日】平成21年8月13日(2009.8.13)
【出願人】(591003013)エフ.ホフマン−ラ ロシュ アーゲー (1,754)
【氏名又は名称原語表記】F. HOFFMANN−LA ROCHE AKTIENGESELLSCHAFT
【Fターム(参考)】