ウルトラディープ配列決定を用いて配列変異体を決定するための方法

本発明は、ピロリン酸配列決定技法を使用してＰＣＲ産物の直接配列決定を可能にする、新しい試料調製方法を提供する。ＰＣＲ産物はゲノムの特定の領域である場合がある。本開示内容に示される技法は、一個体又は個体集団における個々の対立遺伝子多型のＳＮＰ（一塩基多型）検出、分類及び評価を可能にする。これらの結果は、患者の診断及び処置、並びにウイルス及び細菌の集団同定の評価に使用される場合がある。現在の方法と対比して、本発明は、ある程度は高処理能力の非サンガー配列決定技法の速度及び処理能力を有効に使用し、対象となる１つ以上の特定のポリヌクレオチド領域又は遺伝子座における、優れた正確さ、及び対立遺伝子検知の低い閾値を達成する。

【発明の詳細な説明】
【技術分野】
【０００１】
発明の分野
本発明は、標的ポリヌクレオチドの集団において、一塩基多型（ＳＮＰ）、挿入／欠失変異体（「ｉｎｄｅｌｓ」と称する）及び対立遺伝子頻度を含めた配列変異体を同時に検出及び解析するための方法、試薬及びシステムを提供する。本発明は又、既知及び未知の両方の変異体及び多型を特定するための、ポリメラーゼ連鎖反応によって複製された核酸の平行ピロリン酸配列決定による研究方法に関する。本発明は、アンプリコンを生成するための配列変異体からなると思われる、標的核酸集団中の核酸の領域を増幅するための核酸プリマーの使用を必要とする。個々のアンプリコンは、増幅された核酸中で見出される配列変異体の分布を生成するために効果的かつ費用効果的な様式で配列決定される。
【背景技術】
【０００２】
発明の背景
ゲノムＤＮＡは、一卵性の兄弟姉妹を除き、個体によって顕著に異なっている。多くのヒト疾患は、遺伝子の変異体から起こる。ヒトの間の遺伝的多様性及び来世の形態は、疾病の感受性において観察される遺伝性の変異体を明らかにする。遺伝的変異体から発生する疾病には、ハンチントン舞踏病、嚢胞性線維症、デュシェンヌ型筋ジストロフィー、及び特定の形態の乳癌が含まれる。これらの疾病のそれぞれは、単一の遺伝子変異体と関連する。多発性硬化症、糖尿病、パーキンソン病、アルツハイマー病、及び高血圧症等の疾病は更に複雑である。これらの疾病は、多遺伝子（複数の遺伝子の影響）又は多因子（複数の遺伝子及び環境の影響）が原因である。ゲノムにおける多くの変異体は疾病特性をもたらさない。しかし、上述したように、単一の変異体は疾病特性をもたらし得る。このような疾病の病理の根底にあるか、関連する遺伝子の位置を特定するためのヒトゲノムを精査する能力は、医学及びヒトの生物学において非常に強力な手段である。
【０００３】
挿入及び欠失（ｉｎｄｅｌｓ）、反復配列の数、及び単一塩基対変異体（ＳＮＰ）等の変異体の幾つかのタイプはゲノムの多様性をもたらす。一塩基多型と呼ばれる、単一塩基対相違は、ヒトゲノムにおける最も多いタイプの変異体である（１０^３塩基中約１個の塩基で発生）。本明細書で使用される、ＳＮＰは、２以上の選択的なヌクレオチドの対立遺伝子が発生するいかなるゲノム位置でもあり得る。又、本明細書で使用されるＳＮＰは、単一塩基の挿入／欠失変異体（「ｉｎｄｅｌ」と称する）、又は２〜１００個の塩基の挿入及び／又は欠失を含むｉｎｄｅｌであり得る。相対的に安定であり（即ち、低い突然変異率を示す）、又遺伝形質に関与し得るので、ＳＮＰは配列変異体を研究するのに適切である。前記の議論において、用語ＳＮＰは、「ｉｎｄｅｌ」に適用することを意味することが理解される（下記に定義）。
【０００４】
例えば、マイクロサテライトをベースとする解析を使用して特定された多型は種々の目的に使用されてきた。単一の遺伝子の位置を特定するための遺伝子連鎖戦略は多くの場合成功している（非特許文献１；非特許文献２）。腫瘍抑制遺伝子の染色体上の位置の特定は、一般的にヒトの腫瘍におけるヘテロ接合性の損失の研究によって達成されてきた（非特許文献３；非特許文献４；非特許文献５；及び非特許文献６）。更に、Ｉ型糖尿病等の複雑な特徴の原因となる遺伝子の染色体位置を推測するための遺伝子マーカーの使用はヒト遺伝学における研究の中心となってきている（非特許文献７；非特許文献８）。
【０００５】
多くのヒト疾患の遺伝的根拠の特定においては大きな進歩が見られるものの、この情報の作成に使用される現在の方法は、大きな試料集団から遺伝子型情報を得るために必要となる莫大な費用及び膨大な作業により制限されている。この制限により、糖尿病等の障害の原因となる複雑な遺伝子変異体の特定が極めて困難になる。疾患の進行に関与する遺伝子の位置を特定するためのヒトゲノムの精査のための技法は、制限酵素断片長多型（ＲＦＬＰ）解析を使用して１９８０年代初期に開始した（非特許文献９；非特許文献１０）。ＲＦＬＰ解析は、サザンブロット及び他の技法を必要とする。サザンブロットは、例えば、特定の表現型に関連する複雑な遺伝型を特定するために必要なため、大量の試料について実施する場合、費用及び時間の両方を消費する。これらの問題の幾つかは、マイクロサテライトマーカー解析に基づくポリメラーゼ連鎖反応（ＰＣＲ）の開発によって回避された。マイクロサテライトマーカーは、ジ−、トリ−、及びテトラ−ヌクレオチド反復からなる、単純配列長多型（ＳＳＬＰｓ）である。
【０００６】
他のタイプの遺伝解析は、複数の対立遺伝子の変異体及び高いヘテロ接合性を有するＤＮＡの超可変領域とハイブリダイズするマーカーの使用に基づく。ゲノムＤＮＡのフィンガープリンティングのために有用な可変領域は、ミニサテライトと呼ばれる、短い配列のタンデム反復である。多型は、有糸分裂又は減数分裂の同等でない交換の結果として、又は複製の際のＤＮＡのずれにより発生する、多くの反復における対立遺伝子の相違による。
【０００７】
現在のところ、ＤＮＡ配列決定による変異体の特定は、多くの欠点によって妨害されている。現在の方法においては、対象領域の増幅は、増幅産物（即ち、変異体配列の混合物）の直接配列決定に続く。又、配列決定工程は、微生物のサブクローニング工程が、即ち、意図する宿主生物中での増殖に適するベクター中への増幅産物の組換えによる挿入が先行する。
【０００８】
増幅産物の直接配列決定の不都合は、配列中の可変部位において生じるシグナルの混合にある。低頻度の対立遺伝子の存在量が５０％に達するときでさえ、このようなシグナルの混合における、種々のヌクレオチドの相対的な寄与率は数量化することは困難又は不可能である。更に、変異体が挿入又は欠失である（塩基置換よりも）場合、異なる分子間に得られる位相シフトは混乱した、読めないシグナルを導くだろう。
【０００９】
微生物によるクローニング工程の追加は、混合したシグナルが接触しないという点において、直接配列決定と関連する問題を克服する。しかし、この戦略は多くの配列決定試薬を必要とする。更に、微生物によるクローニング工程は高価で時間を要し、特定の変異体に対して選択され、その結果、変異体の相対的頻度を歪曲させる。多くの（即ち、１００、１，０００、１０，０００）クローンの配列決定が望まれる場合、費用は非常に高くなる。
【非特許文献１】Ｂｅｎｏｍａｒ，ｅｔ．ａｌ．，（１９９５），Ｎａｔ．Ｇｅｎｅｔ，１０：８４−８
【非特許文献２】Ｂｌａｎｔｏｎ，ｅｔ．ａｌ．，（１９９１），Ｇｅｎｏｍｉｃｓ，１１：８５７−６９
【非特許文献３】Ｃａｖｅｎｅｅ，ｅｔ．ａｌ．，（１９８３）；Ｎａｔｕｒｅ，３０５：７７９−７８４
【非特許文献４】Ｃｏｌｌｉｎｓ，ｅｔ．ａｌ．，（１９９６），Ｐｒｏｃ．Ｎａｔｌ．ＡｃａｄＳｃｉ．ＵＳＡ，９３：１４７７１−１４７７５
【非特許文献５】Ｋｏｕｆｏｓ，ｅｔ．ａｌ．，（１９８４），Ｎａｔｕｒｅ，３０９：１７０−１７２
【非特許文献６】Ｌｅｇｉｕｓ，ｅｔ．ａｌ．，（１９９３），Ｎａｔ．Ｇｅｎｅｔ．，３：１２２−１２６
【非特許文献７】Ｄａｖｉｓ，ｅｔ．ａｌ．，（１９９４），Ｎａｔｕｒｅ，３７１：１３０−１３６
【非特許文献８】Ｔｏｄｄ，ｅｔ．ａｌ．，（１９９５），Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ，９２：８５６０−８５６５
【非特許文献９】Ｂｏｔｓｔｅｉｎ，ｅｔ．ａｌ．，（１９８０），Ａｍ．Ｊ．Ｈｕｍ．Ｇｅｎｅｔ．３２：３１４−３１
【非特許文献１０】Ｎａｋａｍｕｒａ，ｅｔ．ａｌ．，（１９８７），Ｓｃｉｅｎｃｅ，２３５：１６１６−２２
【発明の開示】
【発明が解決しようとする課題】
【００１０】
これらの現在の方法のそれぞれは、時間を要し、問題の解決には限界があるので、欠点を有している。ＤＮＡの配列決定は、高い解像度をもたらすが、ＳＮＰの検出のためには最も高価な方法である。現時点では、１，０００種の異なる試料の集団の中でのＳＮＰの頻度の検出は非常に高価であり、１００，０００種の試料の中でのＳＮＰの頻度の検出には手が出せない。従って、当業界において、ポリヌクレオチド集団中、特に、低頻度で存在する変異体に存在する配列変異体の特定及び再配列決定の経済的な方法の継続的な必要性が存在している。
【課題を解決するための手段】
【００１１】
発明の概要
これらの現在の方法の不都合、及び正確さ、信頼性、費用及び時間の間の避けられない矛盾を解決するために努力し、本発明によってほとんど解決された。前述した現在の方法と対比して、本発明は、ある程度は高処理能力の非サンガー配列決定技法の速度及び処理能力を有効に使用し、対象となる１つ以上の特定のポリヌクレオチド領域又は遺伝子座における、優れた正確さ、及び対立遺伝子検知の低い閾値を達成する。「ポリヌクレオチド領域」及び「遺伝子座」は、本明細書において交換可能に使用される。本発明の増幅及び配列決定方法は、単一分子の配列決定を直接促進するか、又は、単一の分子に由来するクローン増幅産物の配列決定により促進される。この単一分子変換は、テンプレートポリヌクレオチド混合物中に非常に低い頻度で存在する変異体の高度な正確な検出及び又は頻度の測定を可能にする。
【００１２】
一局面において、本発明は、低い、又は非常に低い頻度における、核酸混合物中の配列変異体の正確な測定を可能にする方法を含む。本発明は、部分的に、いわゆる単一分子の配列決定技法と結びついた、核酸試料における特定の対象領域で標的とする増幅工程の含有が、配列変異体の正確、急速かつ低コストの発見、及び対立遺伝子の頻度の測定を可能にするという発見に基づく。既知の方法を上回るこの改良は、特定の単一分子配列決定に先立つインビトロ増幅工程を使用することにより、部分的に達成される。
【００１３】
本発明の顕著な特徴は、対象となるポリヌクレオチド領域のヌクレオチド配列を大きな深さで決定する能力である。深さは、特定の対象領域を通して読み取られる個々の配列の数を意味する。例えば、１，０００個の分子が別々に配列決定される場合、深さは１，０００に等しく、「１，０００倍」又は「１，０００×」として言及されるかもしれない。本発明によれば、深さは、約２〜数十億の範囲、例えば、約１０〜約１００万、約１０〜約１，０００万、約１００〜約１００，０００、又は約１，０００〜約１００万の範囲であり得る。深さは、約２以上、約１０以上、約１００以上、約１，０００以上、約１０，０００以上、約１００，０００以上、約１００万以上、約１，０００万以上、約１億以上、約１０億以上であり得る。本発明の方法によって達成される配列深さは、現在の方法によって達成でき、現実的であり手が届く深さよりも大きい。特に、本発明の方法は微生物のクローニングを必要としない。微生物のクローニングによるとは、例えば大腸菌等の微生物の宿主生物中でのポリヌクレオチド増幅を意味する。本発明による深さは、相対的に容易、迅速かつ低コストで最高の配列変異体の決定を促進することが可能であることが、当業者には明らかであろう。
【００１４】
本発明は、特定のポリヌクレオチド配列を特定することにより幾つかの配列変異体（例えば、対立遺伝子の変異体、単一のヌクレオチド多型）を診断する方法に関する。現在の技法では、例えばポリメラーゼ連鎖反応（ＰＣＲ）によるＳＮＰの検出が可能である。しかし、ＰＣＲによるＳＮＰの検出は、１つのタイプのＳＮＰとハイブリダイズするが、１のタイプのＳＮＰとはハイブリダイズしないデザインを必要とする。更に、ＰＣＲは強力な方法であるが、対立遺伝子の特定のＰＣＲはＳＮＰの性質（配列）の以前の知識が必要であると同様、複数のＰＣＲ、及び対立遺伝子の頻度を決定するためのゲル電気泳動が必要である。例えば、５％（即ち、２０個中の１個）対立遺伝子頻度は、その検出に２０のＰＣＲ反応を必要とする。対立遺伝子の頻度を決定するためのＰＣＲ及びゲル電気泳動の量は、対立遺伝子の頻度が、例えば、４％、３％、２％、１％、０．５％、０．２％又はそれ以下に減少すると劇的に上昇する。
【００１５】
現在の方法は、特定のＤＮＡの配列を決定することにより、少量のＳＮＰを含むＳＮＰを検出する、簡易かつ迅速な方法を提供しない。
【００１６】
我々は、新規のピロリン酸配列決定技法と組み合わせた２つのＰＣＲ法が、迅速で信頼性があり、費用効果的な様式で配列変異体（ＳＮＰ、ｉｎｄｅｌ及び他のＤＮＡ多型）の決定を可能にすることを発見した。更に、本発明の方法は、不定比でＤＮＡ試料中に存在する配列変異体、例えば、約５０％未満、約２５％未満、約１０％未満、約５％未満又は約１％未満で存在するＤＮＡ変異体を検出することができる。
【００１７】
本発明によれば、核酸試料中の複数の対立遺伝子の特異的増幅及び配列決定により配列変異体（対立遺伝子頻度、ＳＮＰ頻度、ｉｎｄｅｌ頻度）を検出する方法が提供される。最初に、核酸を、対象領域を包囲する領域を増幅するために設計された一対のＰＣＲプライマーによって増幅する。更に、ＥＢＣＡ（エマルジョンをベースとするクローン増幅、ＥｍｕｌｓｉｏｎＢａｓｅｄＣｌｏｎａｌＡｍｐｌｉｆｉｃａｔｉｏｎ）を使用した別々の反応容器中で個々に、ＰＣＲ反応の各産物（アンプリコン）を増幅する。ＥＢＣＡ（本明細書で第二アンプリコンを意味する）を配列決定し、異なるエマルジョンＰＣＲアンプリコンからの配列のコレクションを、対立遺伝子頻度を決定するために使用することができる。
【００１８】
本発明の一実施形態は、核酸集団における配列変異体を決定する方法に関する。配列変異体は、ＳＮＰ、ｉｎｄｅｌ、配列ヌクレオチド頻度、又は対立遺伝子頻度又はそれらのパラメータの組み合わせであってもよい。前記方法は、それぞれＤＮＡ断片を含む、第一アンプリコン集団を産生する遺伝子座を特定する、一対の核酸プライマーを使用して、核酸集団に共通するＤＮＡ断片を増幅する工程を含む。第一アンプリコン集団の各メンバーは、クローン増幅され、第二アンプリコンの集団が第一アンプリコン集団のメンバーに由来する、第二アンプリコンの集団を生成する。第二アンプリコンは、各移動固相担体が、第二アンプリコンの１つの集団と接触するように、複数の移動固相担体に固定することができる。各移動固相担体上の核酸−１配列／移動固相担体−は配列決定され、核酸配列の集団が生成される。配列変異体、対立遺伝子頻度、ＳＮＰ又はｉｎｄｅｌは、核酸配列の集団から決定することができる。
【００１９】
本発明の他の実施形態は、複数の異なる生物種を使用して、集団を特定する方法に関する。前記方法は、核酸試料が、集団の各メンバー由来の核酸の混合物であるように、集団由来の核酸試料を単離することを含む。次いで、集団中の全ての生物に共通する遺伝子座の核酸断片の頻度が、前節の方法から生成される。遺伝子座は、各異なる種についての異なる配列（対立遺伝子）を有することが要求される。即ち、それぞれの種は、遺伝子座において、異なる核酸配列を有するべきである。対立遺伝子頻度は、遺伝子座において、核酸の各タイプの頻度から決定される。集団における生物の分布は、対立遺伝子頻度から決定される。
【００２０】
好ましい実施形態において、本発明の方法は、核酸試料中のＳＮＰ及び／又はｉｎｄｅｌ分布を決定するために使用される。核酸の標的集団は、個体、組織試料、培養試料土壌標本（例えば、実施例５及び実施例３を参照）、又は異なる対立遺伝子を発現する各ポリヌクレオチドを有する、少なくとも２種の異なるポリヌクレオチドを含む、他のタイプの核酸試料由来であり得る。
【００２１】
本発明の方法は、対立遺伝子の組成を決定するために、組織試料を解析するために使用される。例えば、癌遺伝子の遺伝子座において特定の対立遺伝子を含むかどうかを決定するために腫瘍組織が解析される。この方法を使用して、活性化又は変異した癌遺伝子を有する腫瘍中の細胞の割合、及びＤＮＡ試料中の腫瘍ＤＮＡの合計量を測定することができる。
【００２２】
本明細書で使用される対立遺伝子という用語には、変異体が、同一種の個々の生物の間、又は異なる種の個々の生物の間、１つ以上の個体に由来する正常及び病変組織の間、及びウイルスゲノムの間の、単一生物中で生じる、可変部位における配列変異体が含まれる。
【発明を実施するための最良の形態】
【００２３】
発明の詳細な説明
本発明は、特定のポリヌクレオチド配列を特定することにより、１つ以上の配列変異体を検出する方法に関する。配列変異体は、２種の核酸分子の間に任意の配列の相違を含む。それ自体は、又、配列変異体は、少なくとも一塩基多型、挿入／欠失（ｉｎｄｅｌ）、対立遺伝子頻度及びヌクレオチド頻度を意味すると理解され、即ち、これらの用語は交換可能に使用される。種々の検出技法が、特定の実施例を使用した本明細書を通じて議論されるが、本発明の方法は、任意の配列変異体を検出するために、等しく適用することができることが理解される。例えば、本明細書においてＳＮＰを検出するための方法は、又、ｉｎｄｅｌ又はヌクレオチド頻度を検出するための方法に適用することができる。
【００２４】
本発明のこの方法は、とりわけ、ゲノム、組織試料、異種細胞集団、ウイルス集団又は環境試料等の特定の標的テンプレートを増幅し、配列決定するために使用される。例えば、それらには、ＰＣＲ産物、候補遺伝子、変異的ホットスポット、進化的又は医学的に重要な変異領域が含まれる。それは、又、全ゲノム増幅、それに続く変異体又は縮重増幅プライマーを使用することによる全ゲノム配列決定等の増幅のために使用することができる。
【００２５】
今まで、標的テンプレート中の新規の配列変異体の発見は、完全なゲノムの調製及び配列決定、又は対象領域の事前のＰＣＲ増幅、それに続く、ＰＣＲ産物分子のプールの配列決定、又は単一のＰＣＲ産物分子の配列決定、それに続く微生物によるサブクローニングによる増幅による、配列決定を必要とする。本発明の方法は、新規の配列変異体の発見、並びに既知の変異体の検定を可能にし、これらは、微生物のサブクローニングを回避しながら、既存の技術により現在提供されているよりも大幅に改善された感受性、速度及びコストで、且つ大幅に大きな深さで実施される。
【００２６】
この開示においては、一塩基多型（ＳＮＰ）は、少なくとも共通の変異体が集団の少なくとも０．００１％に存在する、少なくとも２種の変異体中に存在する配列変異体として定義される。本発明の方法が「ｉｎｄｅｌｓ」に応用することができることは理解される。従って、本発明の開示がＳＮＰに触れる場合、「ＳＮＰ」という用語が、任意の位置で「ｉｎｄｅｌ」という用語と置換されるなら、この開示は同様に適用できると理解される。
【００２７】
本明細書で使用される「ｉｎｄｅｌ」という用語は、関連する核酸配列と比較し、核酸配列中に１つ以上のヌクレオチドの挿入又は欠失の存在を意味する。従って、挿入又は欠失には、隣接するヌクレオチド部分で同一の核酸配列と比較し、１個の核酸中のユニークなヌクレオチドの存在又は非存在が含まれる。例えば、挿入及び欠失には、関連する基準配列と比較して任意の特定の位置で１個のヌクレオチド、５、１０、２０、５０、１００又はそれ以上のヌクレオチドを含む数個のヌクレオチド又は多くのヌクレオチドが含まれる。又、用語には、関連する配列と比較し、核酸配列中に１つ以上の挿入又は欠失が含まれることが理解される。
【００２８】
ポアソン統計は、完全に負荷された６０ｍｍ×６０ｍｍのピコタイタープレート（２００，０００×１００ベースリードからなる、２×１０^６高品質ベース）についての検出の下限（即ち、１未満の事象）が、９５％の検出信頼性を有する３個の事象及び９９％の検出信頼性を有する５個の事象であることを示す（表１参照）。これは読み取りの数に直接対応し、同一の検出限界は１０，０００読み取り、１，０００読み取り又は１００読み取り中の３又は５個の事象について維持する。ＤＮＡの読み取りの実際の量は２００，０００より高いため、実際の検出の下限は、検定の感度上昇のために低いポイントであると予想される。比較のために、最小頻度の対立遺伝子が集団の１０％以上存在する限りは、ピロリン酸をベースとする配列決定によるＳＮＰ検出は、４倍体ゲノム上に示される個々の対立遺伝子について報告されている（Ｒｉｃｋｅｒｔ，ｅｔ．ａｌ．，２００２ＢｉｏＴｅｃｈｎｉｑｕｅｓ．３２：５９２−６０３）。従来の蛍光ＤＮＡ配列決定は低感度であり、５０／５０（即ち５０％）のヘテロ接合体の分解の困難を経験する（Ａｈｍａｄｉａｎ，ｅｔ．ａｌ．，２０００Ａｎａｌ．Ｂｉｏｃｈｅｍ．２８０：１０３−１１０）。
【００２９】
表１：全集団における多くの事象をベースとする、０又は１つ以上の事象の検出の可能性。「＊」は、３つの事象の検出の失敗の可能性が５．０％であり、それ故、同様に、前記事象の検出の可能性は９５％である。「＊＊」は、５倍を生じる１つ以上の事象を検出する可能性が９９．３％であることを示す。
【００３０】
【表１】

結果として、単一のＳＮＰを検出するための完全な６０×６０ｍｍピコタイタープレートの使用は、９５％の信頼性を有し、集団のわずか０．００２％のみ、又は９９％の信頼性を有し、集団の０．００３％で存在するＳＮＰの検出を可能にする。当然、多様な解析は、検出のこの深さよりも大きな適用性を有し、表２は、９５％及び９９％の信頼性で検出可能な最小対立遺伝子頻度を有して、単一のピコタイタープレート上で同時にスクリーニングすることができるＳＮＰの数を示す。
【００３１】
【表２】

本発明の１つの利点は、通常、試料調製（例えば、配列決定のための、組織からのＤＮＡの抽出及び精製）と関連する工程数が除去されるか単純化されることである。例えば、方法の感度のために、粉砕した組織及び化学的精製の伝統的な技法を使用した、組織からのＤＮＡの抽出はもはや必要ではない。代わりに、容量において１μＬ未満の少量の組織試料を煮沸し、第一のＰＣＲ増幅のために使用される。この溶液増幅の産物を、ｅｍＰＣＲ反応に直接加える。従って、本発明の方法は、時間、労力及び産物の損失（ヒトの間違いによる損失を含む）を減少する。
【００３２】
本発明の方法の他の利点は、方法が多重化に大変受け入れられやすいことである。以下に議論するように、本発明の二部プライマー（ｂｉｐａｒｔｉｔｅｐｒｉｍｅｒ）は、単一の溶液増幅におけるプライマーセットのピロリン酸配列決定と一致する、同義遺伝子についてのプライマーセットとの組み合わせを許容する。又、複数の調整品の産物は、単一のエマルジョンＰＣＲ反応に配置される。結果として、本発明の方法は、高処理能力の応用についての相当の可能性を示す。
【００３３】
本発明の一実施形態は、対立遺伝子頻度（ＳＮＰ及びｉｎｄｅｌ頻度を含む）の決定方法に関する。最初の工程において、アンプリコンの第一の集団を、解析すべき遺伝子座を含む核酸の標的集団を増幅するための第一のプライマーセットを使用したＰＣＲによって産生する。前記遺伝子座は、複数の対立遺伝子、例えば、２、４、１０、１５又は２０又はそれ以上の対立遺伝子を含む。第一のアンプリコンは、例えば、約５０〜約１００ｂｐ、約１００ｂｐ〜約２００ｂｐ、又は約２００ｂｐ〜約１Ｋｂ、又は約５００ｂｐ〜約５，０００ｂｐ、又は約２０００〜約２０，０００ｂｐ等の、任意のサイズであってもよい。前記方法の１つの利点は、２つのプライマーの間の核酸配列の知識が必要でないことである。
【００３４】
次の工程においては、第一アンプリコン集団は、複数の水性リアクターが、（１）単一のテンプレート又はアンプリコンによって特色付けられる増幅を開始するのに十分なＤＮＡ、（２）単一のビーズ、及び（３）核酸増幅を実施するのに必要な試薬を含む増幅反応溶液（以下のＥＢＣＡ（ＥｍｕｌｓｉｏｎＢａｓｅｄＣｌｏｎａｌＡｍｐｌｉｆｉｃａｔｉｏｎ）に関する議論を参照）を含むように、油中水型エマルジョン型エマルジョンン中の水性リアクター中に送達される。我々は、単一のテンプレート又はアンプリコンによって特徴付けられる増幅反応が、たとえテンプレートがマイクロリアクター中に存在するとしても達成されることを見出した。従って、１つ以上のテンプレートを含む水性マイクロリアクターは本発明によって計画される。好ましい実施形態において、各水性マイクロリアクターは、増幅のためのＤＮＡテンプレートの単一のコピーを有する。
【００３５】
送達工程の後、第一アンプリコン集団をマイクロリアクター中で増幅し、第二アンプリコンを形成する。例えば、サーモサイクラー中でＥＢＣＡ（ＰＣＲを含む）（ＷＯ２００４／０６９８４９に記載）を使用して実施することができ、第二アンプリコンを生成する。ＥＢＣＡの後、第二アンプリコンをマイクロリアクター中でビーズと結合することができる。第二アンプリコンと結合したビーズを、平面上の反応チャンバーのアレイ（例えば、少なくとも１０，０００個の反応チャンバーのアレイ）に送達する。送達は、複数の反応チャンバーが１つ以上のビーズを含まないように調製することができる。例えば、これは、反応チャンバーが単一のビーズのみに適応するのに十分に小さいアレイを使用することによって達成することができる。
【００３６】
配列決定反応は、複数の反応チャンバー上で同時に実施することができ、前記複数の対立遺伝子に関連する複数の核酸配列を決定することができる。反応チャンバーを使用した、同時の並列配列決定の方法は、前記他のセクション及び実施例において開示される。配列決定に次ぎ、少なくとも２種の対立遺伝子についての対立遺伝子頻度が、核酸の標的集団に由来する配列を解析することによって兄弟される。具体例として、１０，０００種の配列が決定され、９，９００種の配列が“ａａａ”を読み取るが、１００種の配列が“ａａｇ”を読み取る場合、“ａａａ”対立遺伝子は約９９％の頻度を有するが、“ａａｇ”対立遺伝子は約１％の頻度を有すると考えられる。これは、以下の記載及び実施例において詳細に開示される。
【００３７】
本発明の１つの利点は、以前に実施されたよりも高い感度レベルを可能にすることである。ピコタイターを使用する場合、本発明の方法は、ピコタイタープレート当たり、１００，０００を超える、又は３００，０００を超える異なるコピーの配列決定をすることができる。検出の感度は、約１％又はそれより少ない対立遺伝子変異体を表す、少量の対立遺伝子の検出を可能にすべきである。本発明の方法の他の利点は、反応決定反応が解析された領域の配列を供給することでもある。即ち、解析すべき遺伝子座の配列の事前の知識を有することを必要としない。
【００３８】
好ましい実施形態において、本発明の方法は、本発明の方法は、約５０％未満、約２０％未満、約１０％未満、約５％未満、又は約２％未満である対立遺伝子頻度を検出することができる。更に好ましい実施形態において、本発明の方法は、約０．５％未満、約０．２％未満、又は約０．０２％未満等の、約１％未満の対立遺伝子頻度を検出することができる。検出感度の典型的な範囲は、約０．０１％〜約１００％、約０．０１％〜約５０％、約０．０１％〜約１０％、約０．１％〜約５％である。
【００３９】
核酸の標的集団は、多くの原料由来であり得る。例えば、原料は生物由来の組織又は体液であってもよい。生物は、ほ乳類を含むがこれらに限定されない、任意の生物であってもよい。ほ乳類は、ヒト、又は牛、羊、豚、山羊、ウサギ等の商業的に有用な家畜であってもよい。本発明の方法は、植物の組織又は体液試料の解析を可能にする。全ての植物が本発明の方法によって解析することができるが、本発明の方法に好ましい植物には、単子葉植物及び双子葉植物を含む、商業的に有用な種が含まれる。好ましい一実施形態において、核酸の標的集団は、穀物又は加工食品由来であってもよく、穀物又は加工食品を作成する、遺伝型、対立遺伝子又は種のオリジナル及び分布を決定することができる。このような作物には、例えば、トウモロコシ、スイートコーン、カボチャ、メロン、キュウリ、サトウダイコン、ヒマワリ、米、ワタ、アブラナ、サツマイモ、マメ、ササゲ、タバコ、ダイズ、アルファルファ、小麦等が含まれる。
【００４０】
核酸試料は、複数の生物から集めることができる。例えば、１，０００の個体の集団の対立遺伝子頻度は、１，０００の個体由来の混合ＤＮＡ試料を解析する１回の実験で実施することができる。当然、集団（各個体）の対立遺伝子頻度の代表である混合ＤＮＡ試料については、集団の各メンバーは、プールされた試料に対して等量（又はほぼ同じ量）の核酸（対立遺伝子の同じ数のコピー）に寄与しなければならない。例えば、ゲノムの対立遺伝子頻度の解析においては、それぞれの個体は、プールされたＤＮＡ試料に対し、約１．０×１０^６細胞由来のＤＮＡに寄与する。
【００４１】
本発明の他の実施形態において、単一の個体における多型が検出される。即ち、標的核酸は単一の個体から単離することができる。例えば、個体の複数の組織試料由来のプールされた核酸を、多型及びヌクレオチド頻度について試験することができる。例えば、これは、個体の腫瘍における多型、又は腫瘍を含むことが疑わしい組織の検出に有用である。例えば、本発明の方法は、個体の組織試料（又は複数の組織試料由来のプールされたＤＮＡ）における、活性化癌遺伝子の頻度の検出に使用することができる。この具体例においては、活性化癌遺伝子の５０％以上の対立遺伝子頻度は、腫瘍が単クローンであることを示す。５０％未満の活性化癌遺伝子の存在は、腫瘍が多クローンであるか、組織試料が腫瘍組織及び正常（非腫瘍）組織の組み合わせを含むことを示す。更に、疑わしい組織の生検においては、例えば１％の活性化癌遺伝子は、新生の腫瘍の存在、又は悪性腫瘍の浸潤の存在を示す。更に、薬剤耐性突然変異体、又薬剤感受性の腫瘍細胞の画分の存在は、全体的に薬剤耐性腫瘍を有する患者の再発を予言するかもしれない。このような予後の情報は、癌治療及び研究において貴重であろう。
【００４２】
核酸の標的集団は、プラスミド、コスミド、ＤＮＡウイルスゲノム、ＲＮＡウイルスゲノム、細菌ゲノム、真菌ゲノム、原生動物ゲノム、ミトコンドリアＤＮＡ、ほ乳類ゲノム及び植物ゲノムを含むが、これらに限定されない、ＤＮＡ、ＲＮＡ及び種々の形態のＤＮＡ及びＲＮＡを含む任意の核酸であってもよい。核酸は、組織試料から、又はインビトロ培養物から単離される。ゲノムＤＮＡは、組織試料、全生物、又は細胞試料から単離することができる。所望であれば、核酸の標的集団は、集団に寄与するそれぞれの個体由来の対立遺伝子と等量を含むように、標準化してもよい。
【００４３】
本発明の一つの利点は、ゲノムＤＮＡが、更なる処理なしで直接使用することができることである。しかし、好ましい実施形態において、ゲノムＤＮＡは、ＰＣＲ又はハイブリダイゼーション工程を妨害するタンパク質を実質的に含まず、ヌクレアーゼ等のＤＮＡを損傷するタンパク質を実質的に含まない。又、好ましくは、単離されたゲノムは、ポリメラーゼ機能の非タンパク性阻害剤（例えば、重金属）及びＰＣＲを妨害するハイブリダイゼーションの非タンパク性阻害剤を含まない。タンパク質は、当前記技術分野で既知の種々の方法によって単離されたゲノムから除去される場合がある。例えば、タンパク質は、プロテイナーゼＫ又はプロナーゼ等のプロテアーゼを使用することにより、又はドデシル硫酸ナトリウム（ＳＤＳ）又はラウリルサルコシン酸ナトリウム（ＳＬＳ）等の強力な界面活性剤を使用することにより分離したゲノムを得た細胞を溶解し、除去することができる。溶解した細胞をフェノール及びクロロホルムで抽出し、エタノールで沈殿することができる、単離されたゲノムを含む、核酸を含む水相を生成する。
【００４４】
核酸の標的集団は、土壌試料、食物試料等のＤＮＡの未知の起源を有する原料由来であり得る。例えば、食物試料由来の核酸試料中の病原体中に見出される対立遺伝子の配列決定は、食物中の病原体汚染の存在の検出を可能にする。更に、本発明の方法は、植物中の病原体対立遺伝子の分布の検出を可能にする。例えば、本発明の方法は、土壌試料（実施例５を参照）又は海水試料等の環境試料中の特定の生物（例えば、細菌、ウイルス、病原体）の株（種）又は株（種）の分布を決定することができる。
【００４５】
本明細書に提供される方法の一つの利点は、核酸又はポリヌクレオチド集団における突然変異体又は配列変異体の推測的な知識が、方法のために必要でないということである。前記方法は核酸配列に基づくので、一つの位置における全ての突然変異体が決定される。更に、配列決定のために、微生物のクローニングは必要でない。ＤＮＡ試料は、クローニング、サブクローニング、及びクローニングされたＤＮＡの培養なしで連続した工程においてインビトロで増幅され配列決定される。
【００４６】
例えば、本発明の方法は、ウイルス試料中の変異体の検出及び定量のために使用することができる。これらのウイルス試料には、例えば、ＨＩＶウイルス分離株が含まれる。本発明の方法の他の応用には、配列変異体の集団調査が含まれる。ＤＮＡ試料を、生物の集団から集め、混合し、１つの実験で解析し、対立遺伝子頻度を決定する。生物の集団には、例えば、ヒトの集団、家畜の集団、収穫物由来の穀物が含まれる。他の用途には、腫瘍生検（例えば、肺及び直腸癌）又は腫瘍及び正常細胞の混合集団を含む生検由来の体細胞突然変異体の検出及び定量が含まれる。本発明の方法は、又、臨床的に疑わしいと関連する遺伝子（例えば、胸部、卵巣、直腸及び膵臓癌、メラノーマ）の高信頼性の再配列決定のために使用することができる。
【００４７】
本発明の他の用途には、複数の異なるゲノムに関連する多型の特定が含まれる。異なるゲノムは、家族性起源、物理的近接、品種、クラス等の幾つかの表現型特性によって関連する集団から単離することができる。その他の場合において、ゲノムは、同一の集団から選択されたものより相互に関連しないように集団から無作為に選択される。好ましい一実施形態において、方法は、遺伝病又は他の特性等の特定の表現型特性を有する被験者の遺伝型（例えば、ＳＮＰ含量）を決定するために実施することができる。
【００４８】
本発明の方法は、ヘテロ接合性の損失について試験するか、特定のＳＮＰの対立遺伝子頻度を決定することにより腫瘍の遺伝子構造を特徴付けるために使用することもできる。更に、本発明の方法は、ゲノム中のＳＮＰのパネルのそれぞれの存在又は非存在を特定し、ＳＮＰの対立遺伝子頻度を決定することにより、ゲノムについてのゲノム分類コードを生成するために使用することができる。これらの用途のそれぞれは、本明細書で更に詳細に議論される。
【００４９】
本発明の好ましい用途には、高処理能力の遺伝子型決定方法が含まれる。「遺伝子型決定」は、ゲノムＤＮＡ中の特定のゲノム配列の存在又は非存在を特定する処理である。異なるゲノムは、表現型ファミリー、位置、品種、クラス等に関連のある多型（例えば、複数の異なるゲノムに関連するもの）を特定するために、幾つかの表現型特性、家族性起源、物理的近接、品種、クラス等によって関連する集団の個体から単離することができる。或いは、異なるゲノムは、集団中の起源と相互に関連しないように、集団から無作為に単離することができる。このようなゲノムにおける多型の特定は、全体として集団中の多型の存在又は非存在を示すが、特定の表現型と関連付ける必要はない。ゲノムはＤＮＡの長い領域に及び、複数の染色体を含むので、遺伝型を決定するための本発明の方法は、複数の位置における複数の配列変異体を解析し、９９．９９％の信頼性で遺伝型を決定する必要がある。
【００５０】
遺伝子型の決定は、特定の表現型特性と関連する多型を特定するために使用されることが多いが、この関連は必ずしも必要なわけではない。遺伝子型の決定においては、（コード領域中に存在する場合もあれば存在しない場合もある）多型が存在することのみ必須条件となる。遺伝子型の決定が、表現型特性の特定に使用される場合、多型が、特徴付けられる表現型特性に影響を及ぼすと仮定される。表現型は望ましいものである場合もあれば、有害なものである場合もあり、場合によっては中性のものである場合もある。本発明の方法によって特定される多型は、表現型に寄与することができる。幾つかの多型はタンパク質コード配列内に生じ、それ故、タンパク質構造に影響を及ぼし、その結果、観察される表現型の原因となるか寄与する。タンパク質コード配列の外側に生じる他の多型は、遺伝子の発現に影響しない。対象となる遺伝子の単に近くに生じる、更なる他の多型は遺伝子マーカーとして有用である。単一の多型は、１つ以上の表現型特性の原因となる可能性もあれば、これに寄与する可能性もあり、同様に、単一の表現型特性は、１つ以上の多型による場合もある。一般的に、特定の遺伝子の同一のハプロタイプ中に生じる複数の多型は同一の表現型と関連する。更に、個体が、特定の多型についてヘテロ接合又はホモ接合であるかどうかは、特定の表現型特性の存在又は非存在に影響を及ぼす可能性がある。
【００５１】
表現型の関連は、表現型特性を示す被験者の実験的集団、及び表現型特性を示さないコントロールの集団を特定することによって実施することができる。表現型特性を共有する被験者の実験的集団中に生じ、コントロール集団中に生じない多型は、表現型特性と関連する多型であると考えられる。多型が、いったん表現型特性と関連するとして特定されると、表現型特性又は特徴を発生する可能性を有する被験者のゲノムは、被験者が、最終的に表現型特徴を発生すると思われるかどうかを確立するために、被験者のゲノム中の多型の発生又は非発生を決定するためにスクリーニングすることができる。これらのタイプの解析は、ハンチントン舞踏病又は乳癌等の特定の疾病を発生する危険性における被験者において実施することができる。
【００５２】
本発明の一実施形態は、表現型特性をＳＮＰと関連させる方法に関する。表現型特性には、任意のタイプの遺伝病、病状、又は特性、被験者において積極的に検出される存在又は非存在を含む。遺伝病又は病状である表現型特性には、構成要素が、遺伝的（例えば、ＳＮＰの被験者における発生による）、及びこのような疾病になりやすい傾向である多因子性疾病が含まれる。これらの疾病には、喘息、癌、自己免疫疾患、炎症、視覚消失症、潰瘍、心臓及び心血管の疾病、神経系の疾病、及び病原性微生物又はウイルスによる感染に対する感受性が含まれるが、これらに限定されない。自己免疫疾患には、リウマチ様関節炎、多発性硬化症、糖尿病、全身性エリテマトーデス、及びグレーブズ病が含まれるが、これらに限定されない。癌には、膀胱、脳、乳房、結腸、食道、腎臓、白血病等の造血系、肝臓、肺、口腔、卵巣、膵臓、前立腺、皮膚、胃及び子宮の癌が含まれるがこれらに限定されない。表現型特性には、薬剤又は他の薬物療法に対する感受性、外観、伸長、色（例えば、植物の花）、強度、速度（例えば競争馬）、髪の色等が含まれる。遺伝的変異体に関連する表現型特性の多くの具体例は、例えば、米国特許第５，９０８，９７８号（遺伝的変異体に関連する植物の特定の種における耐病性の関連を特定する）及び米国特許第５，９４２，３９２号（アルツハイマー病の発生に関連する遺伝的マーカーを開示する）に開示されている。
【００５３】
遺伝的変異体及び表現型特性の間の関連の特定は多くの目的のために有用である。例えば、被験者におけるＳＮＰ対立遺伝子の存在と、疾病の被験者によって最終的な発生との関連の特定は、早期治療投与、又は生活様式の変化の実施（例えば、このような疾病に対する通常よりもかかりやすい傾向を有する被験者において、心血管疾病を回避するためのコレステロール又は脂肪食の減少）又は癌又は他の疾病の発生のための患者の監視のために特に有用である。又、胎児が、重篤な疾病に苦しんでいるか、発生しやすいかどうかを特定するための出産前のスクリーニングに有用である。更に、このタイプの情報は、所望の特性を向上するか又は示す目的のために繁殖する動物又は植物のスクリーニングに有用である。
【００５４】
複数のゲノムに関連するＳＮＰ又は複数のＳＮＰを検出するための一方法は、特性を有する生物に由来する複数のゲノム試料におけるＳＮＰの存在又は非存在のためのスクリーニングである。ＳＮＰが特定の表現型特性と関連するかどうかを決定するため、ゲノム試料を、特定の表現型特性を示す個体の群から単離し、共通のＳＮＰの存在について、試料を解析する。それぞれの個体から得られるゲノム試料を一緒にし、プールされたゲノム試料を形成する。次いで、本発明の方法を、それぞれのＳＮＰについての対立遺伝子頻度を決定するために使用する。プールされたゲノム試料を、本発明の高処理能力方法におけるＳＮＰのパネルを使用してスクリーニングし、特定のＳＮＰ（対立遺伝子）の存在又は非存在が表現型と関連するかどうかを決定する。場合によっては、特定の被験者が関連する表現型を示す可能性を予測ことが可能である。アルツハイマー病が発生する個体の３０％において、特定の多型対立遺伝子が存在するが、集団では１％のみである場合、対立遺伝子を有する個体は、アルツハイマー病の発生の高い可能性を有している。前記可能性は、アルツハイマー病に苦しんでいない個体がこの対立遺伝子を有するかどうか、及び他の因子がアルツハイマー病の発生と関連するかどうか等の、幾つかの因子にもよる。このタイプの解析は、特定の表現型が示される可能性を決定するのに有用である。このタイプの解析の予測的な能力を上昇するために、特定の表現型と関連する複数のＳＮＰが解析され、相関値が特定される。
【００５５】
又、特定の疾病を区別するＳＮＰを特定することが可能である。複数の多型部位が検出され、それらの間、又はマーカー（ＳＮＰ）と表現型との間の物理的結合を特定するために試験することができる。これは、染色体上の位置に対する表現型特性と連結する、又は関連する遺伝子座をマッピングするために使用することができ、その結果、表現型特性と関連する１つ以上の遺伝子が明らかにされる。２種の多型部位が無作為に分離される場合、それらは、別々の染色体にあるか、同時分離されない、同一の染色体上に相互に十分に離れている。２つの部位が、有意な頻度で同時分離される場合、それらは同一の染色体上で相互に連結している。これらのタイプの連鎖解析は、疾病遺伝型を含む、遺伝型に重要なゲノムの領域を特定する遺伝子地図を開発するのに有用である。
【００５６】
連鎖解析は、特定の表現型又は特定の疾病の高い率を示す家族について実施することができる。生物学的試料は、表現型特性を示す家族から、及び表現型特性を示さない被験者から単離することができる。これらの試料は、それぞれ、個々のＳＮＰ対立遺伝子頻度を生成するために使用することができる。データを解析し、種々のＳＮＰが表現型特性と関連するかどうか、及び任意のＳＮＰが表現型特性から分離されるかどうかを決定することができる。
【００５７】
連鎖データを解析する方法は、Ｔｈｏｍｐｓｏｎ及びＴｈｏｍｐｓｏｎ，ＧｅｎｅｔｉｃｓｉｎＭｅｄｉｃｉｎｅ（５ｔｈｅｄｉｔｉｏｎ），Ｗ．Ｂ．ＳａｕｎｄｅｒｓＣｏ．，Ｐｈｉｌａｄｅｌｐｈｉａ，１９９１；及びＳｔｒａｃｈａｎ，“ＭａｐｐｉｎｇｔｈｅＨｕｍａｎＧｅｎｏｍｅ” ｉｎｔｈｅＨｕｍａｎＧｅｎｏｍｅ（ＢｉｏｓＳｃｉｅｎｔｉｆｉｃＰｕｂｌｉｓｈｅｒｓＬｔｄ．，Ｏｘｆｏｒｄ）第４章を含む多くの文献に開示されており、Ａｆｆｙｍｅｔｒｉｘ，Ｉｎｃによる、ＰＣＴ公開特許出願ＷＯ９８／１８９６７に要約されている。奇数値（ＬＯＤ値）の対数を計算することにより関与する連鎖解析は、マーカー及び遺伝子座が連結しない場合の値と比較し、組換え割合におけるマーカーと遺伝子座との間の連結の可能性を示す。組換え画分は、マーカーが連結している可能性を示す。それぞれ、種々の組換え画分のＬＯＤスコアを計算し、特定のＬＯＤスコアに基づく組換え画分を決定するために、コンピュータプログラム及び数表が開発された。Ｌａｔｈｒｏｐ，ＰＮＡＳ，ＵＳＡ８１，３４４３−３４４６（１９８４）；Ｓｍｉｔｈ，ｅｔ．ａｌ．，ＭａｔｈｅｍａｔｉｃａｌＴａｂｌｅｓｆｏｒＲｅｓｅａｒｃｈＷｏｒｋｅｒｓｉｎＨｕｍａｎＧｅｎｅｔｉｃｓ（Ｃｈｕｒｃｈｉｌｌ，Ｌｏｎｄｏｎ，１９６１）；Ｓｍｉｔｈ，Ａｎｎ．Ｈｕｍ．Ｇｅｎｅｔ．３２，１２７−１５００（１９６８）を参照されたい。表現型特性の遺伝子マッピングのためのＬＯＤ値の使用は、Ａｆｆｙｍｅｔｒｉｘ，ＩｎｃによるＰＣＴ公開特許出願ＷＯ９８／１８９６７に開示されている。一般的に、整数のＬＯＤスコア値は、２つの遺伝子座が連結し、＋３以上のＬＯＤスコアは２つの遺伝子座が連結している有力な証拠である。負の値は、連結の可能性が少ないことを示す。
【００５８】
本発明の方法は、又、腫瘍におけるヘテロ接合性の損失の評価に有用である。腫瘍におけるヘテロ接合性の損失は、腫瘍が侵攻性であるか、転移性腫瘍であるか等の、腫瘍の状態の決定に有用である。前記方法は、同じタイプの腫瘍を有する複数の被験者から得られる腫瘍試料、及び同じ被験者から得られる正常組織（即ち非癌性）由来のゲノムＤＮＡを単離することによって実施することができる。これらのゲノムＤＮＡ試料は、本発明のＳＮＰ検出方法において使用することができる。正常組織から生成されるＳＮＰ対立遺伝子と比較し腫瘍からのＳＮＰ対立遺伝子の非存在は、ヘテロ接合性の損失が生じたかどうかを示す。ＳＮＰ対立遺伝子が癌の転移状態と関連する場合、ＳＮＰ対立遺伝子の非存在は、非転移性腫瘍試料又は正常組織試料におけるその存在又は非存在と比較することができる。正常及び腫瘍組織中に生じるＳＮＰのデータベースを生成することができ、患者試料中のＳＮＰの発生を、診断又は予後診断の目的のためのデータベースと比較することができる。
【００５９】
転移は、癌患者における治療の失敗の主要な原因であるので、非転移性原発腫瘍を転移性腫瘍と区別できることは有用である。転移性が早期に検出することができれば、疾病の進行を遅くするために積極的に治療することができる。転移は、原発腫瘍からの細胞の剥離、循環による細胞の移動、及び局所的又は遠位部位における腫瘍細胞の最終的な定着を含む複合過程である。更に、監視及び早期治療が開始するように、特定の癌の発生についての傾向を検出できることは好ましい。多くの癌及び腫瘍は遺伝子変異体と関連している。
【００６０】
固形腫瘍は、転移段階を通じた腫瘍形成から幾つかの遺伝的な異常が発生する段階へ進行する。例えば、Ｓｍｉｔｈ，ｅｔ．ａｌ．，ＢｒｅａｓｔＣａｎｃｅｒＲｅｓ．Ｔｅｒａｔ．，１８Ｓｕｐｐｌ．１，“Ｓ５−１４，１９９１を参照。遺伝的異常は、即ち、増殖性の利益、薬剤耐性を生じる能力、血管新生、タンパク質分解又は転移能力の向上を与えることにより、次の段階へ進行させるように、腫瘍を変化させると信じられている。これらの遺伝的異常は、「ヘテロ接合性の損失」として言及される。ヘテロ接合性の損失は、腫瘍の進行において役割を果たす遺伝子変異体をもたらす欠失又は組換えによって引き起こされ得る。腫瘍抑制遺伝子についてのヘテロ接合性の損失は、腫瘍の進行において役割を果たしていると信じられている。例えば、染色体１３ｑ１４に位置する網膜芽細胞腫瘍抑制遺伝子中の突然変異体が、網膜芽細胞腫、骨肉腫、小細胞肺癌及び乳癌を引き起こすと信じられている。同様に、第三染色体の短腕は、小細胞肺癌、腎臓癌及び卵巣癌等の癌と関連していると思われる。例えば、潰瘍性大腸炎は、蓄積した遺伝子変異体を含む多段階の経過をおそらく含む癌の危険の増加と関連する疾病である（米国特許第５，８１４，４４４号）。長期の潰瘍性大腸炎に苦しんでいる患者は、癌の危険の上昇を示し、１つの初期マーカーは、第八染色体の末端短腕の領域のヘテロ接合性の損失であることが示された。この領域は、前立腺及び乳癌とも関係する推定上の腫瘍抑制遺伝子の部位である。ヘテロ接合性の損失は、潰瘍性大腸炎に苦しんでいる患者において本発明の方法を日常的に実施することにより、容易に検出することができる。同様の解析は、ヘテロ接合性と関連することが知られているか、又は信じられている、他の腫瘍から得られた試料を使用して実施することができる。本発明の方法は、何千もの試料を一度にスクリーニングすることができるので、ヘテロ接合性の損失を研究するために特に有利である。
【００６１】
本発明は、部分的に、対立遺伝子頻度を検出するための核酸の処理方法を含む。これらの方法の一つは、以下の３つの工程、即ち（１）試料調製−第一のアンプリコンの調製；（２）ビーズエマルションＰＣＲ−第二アンプリコンの調製；（３）合成による配列決定−対立遺伝子頻度を決定するための、第二アンプリコン由来の複数の配列の検出において広く特定される。これらの核工程は、以下に、及び実施例の項において更に詳細に記載される。
【００６２】
１．核酸テンプレートの調製
核酸テンプレート
テンプレート核酸は、核酸の任意の起源、例えば、任意の細胞、組織、又は生物から構築することができ、当業界で認識されている何れかの方法によって生成することができる。又、テンプレートライブラリーは、ＲＮＡ、例えばメッセンジャーＲＮＡ（ｍＲＮＡ）由来の相補的なＤＮＡ（ｃＤＮＡ）ライブラリーを生成することによって作成することができる。試料調製の方法は、同時係属出願米国特許出願第１０／７６７，７７９号、及びＰＣＴ出願ＰＣＴ／ＵＳ０４／０２５７０に見出すことができ、ＷＯ／０４０７０００７にも開示されており、全て、本明細書に完全に参考文献として組み入れられる。
【００６３】
本発明の方法は、第一ポリヌクレオチド分子の集団に由来する対象ポリヌクレオチド領域の選択的増幅を含む。増幅は、対象領域を含む複数の第一の分子に由来する第二ポリヌクレオチド分子の集団をもたらす。増幅された第一の分子のそれぞれが対象領域を含むとしても、１つ以上の配列変異体は、対象領域中の第一の分子の間に示されることが認められる。このようにして増幅された集団中の個々の第一の分子の数は、２〜数十億、好都合には約１００以上、約１，０００以上、約１０，０００以上、約１００，０００以上、約１００万以上、又は約１０億分子以上の範囲である。
【００６４】
選択的な増幅は、増幅が対象領域で実施され、それにより好ましくは又は具体的には対象領域が増幅されることを意味する。理想的には、対象領域のみが増幅される。しかし、当業者は、核酸増幅反応において得られる頻度のように、実質的に他の領域の非特異的増幅も生じることを理解するだろう。このような非特異的反応産物は、温度、プライマーの設計及び濃度の改善、緩衝液成分及びヌクレオチドの濃度等の反応条件の最適化によって回避することができる。当業者は、増幅特異性を改善するためのネステッドプライマーの両方使用を含む、増幅反応の最適化についての戦略に詳しいだろう。又、非特異的増幅産物は、例えば、ゲル電気泳動又はクロマトグラフィー法によるサイズ選択により、所望の生成物から分離することができる。非特異的増幅の程度及び特定の実験デザインに依存し、非特異的生成物の除去は必ずしも必要でない。
【００６５】
選択的増幅反応は、等温法及びサーモサイクリングを含む、当前記技術分野で既知の多くの方法によって実施することができる。例えば、当業者に容易に知られるサーモサイクリング法は、ポリメラーゼ連鎖反応（ＰＣＲ）である。選択的増幅のための等温法の具体例は、Ｎｏｔｏｍｉ，ｅｔ．ａｌ．，ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．２０００；２８（１２）：Ｅ６３に開示されたｌｏｏｐ−ｍｅｄｉａｔｅｄｉｓｏｔｈｅｒｍａｌａｍｐｌｉｆｉｃａｔｉｏｎ（ＬＡＭＰ）である。ＬＡＭＰは、特別に設計された標的特異的プライマーのセットによって準備された自己再発鎖置換ＤＮＡ合成（ｓｅｌｆ−ｒｅｃｕｒｒｉｎｇｓｔａｎｄｄｉｓｐｌａｃｅｍｅｎｔ）を使用する。対象ポリヌクレオチド領域のサイズ、即ち、その長さは、約５０〜約１０，０００ヌクレオチド、約８０〜約１，０００ヌクレオチド、又は約１００〜５００ヌクレオチド等の、約２０〜約４０，０００ヌクレオチドの範囲である。約５０〜約２，０００ヌクレオチドの長さが好ましい。増幅産物は、一本鎖又は二本鎖の形態、又は両方であり得る。ＤＮＡ増幅の、これらの方法及び他の方法は、ＤＮＡＡｍｐｌｉｆｉｃａｔｉｏｎ：ＣｕｒｒｅｎｔＴｅｃｈｎｏｌｏｇｉｅｓａｎｄＡｐｐｌｉｃａｔｉｏｎｓ，Ｖ．Ｄｅｍｉｄｏｖ及びＮ．Ｂｒｏｕｄｅ，ｅｄｓ．，ＨｏｒｉｚｏｎＢｉｏｓｃｉｅｎｃｅ，２００４に開示されている。これらの任意の異なる増幅方法の組み合わせが意図される。
【００６６】
使用される方法に関係なく、選択的増幅は、第二ポリヌクレオチド分子の集団の合成をもたらす。このようにして増幅された集団における個々の第二ポリヌクレオチド分子の数は、２〜数十億、好都合には、約１００以上、約１，０００以上、約１０，０００以上、約１００，０００以上、約１００万以上、又は約１０億以上の分子である。増幅されたポリヌクレオチド領域は、好都合には、少なくとも約２５、少なくとも約５０、少なくとも約１５０、少なくとも約３００、少なくとも約５００、少なくとも約１，０００、少なくとも約５，０００、又は少なくとも約１０，０００を含む、２〜数十億ヌクレオチドの範囲である。
【００６７】
又、選択的な増幅は、別々の反応、又は単一の反応の何れかにおいて（即ち、多重化）、複数の対象領域を標的としてもよい。複数の領域が別々に増幅される場合、増幅産物は配列決定工程の前に、何れかの時点で混合（プール）される。
【００６８】
核酸テンプレート調製の一つの好ましい方法は、対象となる（既知又は疑わしい）対立遺伝子を含む領域を増幅するための試料においてＰＣＲを実施することである。ＰＣＲ法は、相互に間隔の空いたオリゴヌクレオチドプライマーを使用して、何れかの核酸試料（ＤＮＡ、ＲＮＡ、ｃＤＮＡ）に応用することができる。プライマーは、二本鎖ＤＮＡ分子の反対の鎖に相補的であり、通常、約５０〜２，０００ヌクレオチド、又はそれ以上によって分離される。しかし、約３５，０００塩基と同じくらいの領域のＰＣＲ増幅は、プルーフリーディングＤＮＡポリメラーゼの使用により可能である（Ｂａｒｎｅｓ，Ｗ．Ｍ．（１９９４）Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ９１：２２１６）。ＰＣＲ法は、Ｓａｉｋｉ，ｅｔ．ａｌ．，Ｓｃｉｅｎｃｅ（１９８５）２３０：１３５０−１３５４；Ｓａｉｋｉ，ｅｔ．ａｌ．，Ｎａｔｕｒｅ（１９８６）３２４：１６３−１６６；及びＳｃｈａｒｆ，ｅｔ．ａｌ．，Ｓｃｉｅｎｃｅ（１９８６）２３３：１０７６−１０７８を含めた、幾つかの出版物に開示されている。又、それぞれの特許の本文が本明細書に参考文献として組み入れられる、米国特許第４，６８３，１９４号、第４，６８３，１９５号、及び４，６８３，２０２号を参照されたい。ＰＣＲ増幅のための追加の方法は、本明細書に参考文献として組み入れられる、ＰＣＲＴｅｃｈｎｏｌｏｇｙ：ＰｒｉｎｃｉｐｌｅｓａｎｄＡｐｐｌｉｃａｔｉｏｎｓｆｏｒＤＮＡＡｍｐｌｉｆｉｃａｔｉｏｎｅｄ．ＨＡＥｒｌｉｃｈ，ＦｒｅｅｍａｎＰｒｅｓｓ，ＮｅｗＹｏｒｋ，Ｎ．Ｙ．（１９９２）；ＰＣＲＰｒｏｔｏｃｏｌｓ：ＡＧｕｉｄｅｔｏＭｅｔｈｏｄｓａｎｄＡｐｐｌｉｃａｔｉｏｎｓ，ｅｄｓ．Ｉｎｎｉｓ，Ｇｅｌｆｌａｎｄ，Ｓｎｉｓｋｙ，及びＷｈｉｔｅ，ＡｃａｄｅｍｉｃＰｒｅｓｓ，ＳａｎＤｉｅｇｏ，Ｃａｌｉｆ．（１９９０）；Ｍａｔｔｉｌａ，ｅｔ．ａｌ．，（１９９１）ＮｕｃｌｅｉｃＡｃｉｄＲｅｓ．１９：４９６７；Ｅｃｋｅｒｔ，Ｋ．Ａ．及びＫｕｎｋｅｌ，Ｔ．Ａ．（１９９１）ＰＣＲＭｅｔｈｏｄｓａｎｄＡｐｐｌｉｃａｔｉｏｎ１：１７，ａｎｄ；ＰＣＲｅｄｓ．ＭｃＰｈｅｒｏｎ，Ｑｕｉｒｋｅｓ，ａｎｄＴａｙｌｏｒ，ＩＲＬＰｒｅｓｓ，Ｏｘｆｏｒｄに開示されている。
【００６９】
２．核酸テンプレート増幅
次いで、第二ポリヌクレオチド分子の集団を配列決定解析にかけ、それによって、単一の第二ポリヌクレオチド分子を別々に配列決定することができる。
【００７０】
しかし、必要に応じて、配列決定解析の前に、単一の第二ポリヌクレオチド分子を、インビトロ増幅の第二ラウンドにかけ、第三ポリヌクレオチド分子の集合を合成させる。この増幅の第二ラウンドは、他の第二の分子から得られる第三の分子集団から、各第二の分子に由来する第三の分子集団を分離することを可能とする、当前記技術分野で既知の幾つかの方法の任意の１つによって実施することができる。このタイプの増幅は、通常、クローン増幅として言及される。本明細書で使用されるように、「クローン」は、例えば、単一の原核酸分子から増幅される、複数の同一の核酸分子等の、複数の同一の分子又はコピーからなることを意味する。特に、各集団は、それに続く配列決定における、単一の第二ポリヌクレオチド分子を表すクローンである。
【００７１】
一実施形態において、２回目の増幅は、米国特許出願公開第２００５／０１００９００号、米国特許出願公開第２００３／００２２２０７号、及び米国特許出願公開第２００４／００９６８５３号に記載されるような、ブリッジ増幅等の既知の増幅方法によって、固相担体又は半固相担体上で実施することができる。従って、第二ポリヌクレオチド分子を、固相担体に固定された、適当なオリゴヌクレオチドプライマー分子にアニーリングする。次いで、プライマーを伸長し、分子及びプライマーを相互に分離する。次いで、伸長したプライマーを他の固定されたプライマー（このようにしてブリッジを形成する）にアニーリングし、他のプライマーを伸長させる。次いで、両方の伸長したプライマーを相互に分離し、更なる伸長プライマーの供給のために使用する。増幅された、第三ポリヌクレオチド分子の固定集団を供給するため、前記工程を繰り返す。第二ポリヌクレオチド分子の初期アニーリングを、アニーリングした分子が相互に十分に離れるように実施する場合、第三のポリヌクレオチドの集団は、コロニーの形態に装置相互に分離する傾向にあり、従ってクローンである。従って、たとえ、コロニーが、固相担体又は半固相担体上で相互に近接していたとしても、適当な開始条件の下、コロニーの大部分は別個であり、クローン増幅産物を表す。次いで、ブリッジ増幅を含むこれらのコロニーを核酸配列解析にかける。
【００７２】
他の実施形態において、２回目の増幅は、エマルジョン中の増幅によって実施することができる（ＷＯ２００４／０６９８４９及びＷＯ２００５／０７３４１０）。前記エマルジョンは、何百万の個々の反応を含む。前記エマルジョンは、増幅産物がクローン方法に関連するような微粒子を含んでいてもよい。
【００７３】
更に他の実施形態において、２回目の増幅は、米国特許第６，４３２，３６０号、第６，４８５，９４４号及び第６，５１１，８０３号に開示されたポロニー技術によって固相担体又は半固相担体上で実施することができる。例えば、オリゴヌクレオチドプライマーを半固相担体上に固定し、テンプレート核酸を半固相担体上に播種し、プライマーとハイブリダイズし、ＤＮＡポリメラーゼ及びデオキシヌクレオチドトリホスファターゼを使用して伸長し、次いで変性させる。数回のアニーリング、伸長及び変性により、ｉｎｓｉｔｕの半固相担体上でクローン増幅がもたらされる。増幅産物は、それらが由来するテンプレート分子のすぐ近くに空間的に制限される。これは、ポロニーとして当前記技術分野で既知のＰＣＲコロニーの形成をもたらす。次いで、各ポリニー中の核酸分子のポリヌクレオチド配列を、例えば、Ｍｉｔｒａ，ｅｔ．ａｌ．，（２００３）Ａｎａｌｙｔ．Ｂｉｏｃｈｅｍ．３２０：５５−６５に開示されているような、合成による配列決定法を含めた、当前記技術分野で既知の幾つかの方法によって決定することができる。
【００７４】
好ましい実施形態において、増幅の第二ラウンドは、新規の増幅システムにより実施することができ、本明細書で命名されたＥＢＣＡ（エマルジョンをベースとするクローン増幅、ＥｍｕｌｓｉｏｎＢａｓｅｄＣｌｏｎａｌＡｍｐｌｉｆｉｃａｔｉｏｎ）は、第二の増幅を実施するために使用される。ＥＢＣＡ（ＷＯ２００４／０６９８４９及びＷＯ２００５／０７３４１０）は、増幅するためのテンプレート核酸（例えばＤＮＡ）を、好ましくは、通常球形の固相担体に付着させることによって実施することができる。本発明の試料調製方法に従って調製された一本鎖テンプレートＤＮＡのライブラリーは、本発明の増幅方法において使用されるビーズに付着する出発核酸テンプレートライブラリーの適当な起源の具体例である。
【００７５】
ビーズは、テンプレートＤＮＡの領域に相補的な、多くの単一のプライマー種（即ち、図１のプライマーＢ）に結合する。ビーズにアニーリングされるテンプレートＤＮＡはプライマーと結合する。ビーズを水性反応混合物中に懸濁し、油中水エマルジョンに封入する。エマルジョンは、熱安定油相によって封入された、約６０〜２００μｍ直径の分離した水性微液滴からなる。好ましくは、各微液滴は、増幅反応溶液（即ち、核酸の増幅に必要な試薬）を含む。増幅の具体例はＰＣＲ反応混合物（ポリメラーゼ、塩、ｄＮＴＰｓ）及び一対のＰＣＲプライマー（プライマーＡ及びプライマーＢ）である。図１Ａを参照されたい。微液滴集団のサブセットは、又、ＤＮＡテンプレートを含むＤＮＡビーズを含む。微液滴のサブセットは、増幅のための基礎である。このサブセット中にないマイクロカプセルは、テンプレートＤＮＡを有さず、増幅に関与しない。一実施形態において、増幅技法はＰＣＲであり、ＰＣＲプライマーは、合成ＰＣＲを実施するために、８：１又は１６：１の比で存在する。
【００７６】
全体を見渡すと、ＤＮＡは、ビーズに固定されるオリゴヌクレオチド（プライマーＢ）にアニーリングされる。サーモサイクリングの際に（図１Ｂ）、一本鎖ＤＮＡテンプレートと、ビーズ上に固定されたＢプライマーとが破砕され、テンプレートは周囲のマイクロカプセル溶液中に放出される。この場合、増幅溶液、ＰＣＲ溶液は、追加のプライマーＡ及びＢを加えて含む。溶液相プライマーについて、固定プライマーよりも早い結合反応速度で、溶液相のＢプライマーは、テンプレートの相補的ｂ’領域と容易に結合する。初期段階のＰＣＲにおいては、Ａ及びＢの両方の鎖は同様に増幅される（図１Ｃ）。
【００７７】
中間相（ｍｉｄｐｈａｓｅ）ＰＣＲ（即ち１０〜３０サイクル）によって、Ｂプライマーは消耗し、指数関数的増幅は停止する。次いで、反応は不斉増幅に入り、アンプリコン集団はＡ鎖によって支配される（図１Ｄ）。ＰＣＲの後期においては（図１Ｅ）、３０〜４０サイクル後、不斉増幅は溶液中のＡ鎖の濃度を上昇させる。過剰のＡ鎖は、ビーズに固定されたＢプライマーにアニーリングを開始する。次いで、熱安定ポリマーはテンプレートとしてＡ鎖を使用し、アンプリコンの、固定されたビーズに結合したＢ鎖を合成する。
【００７８】
ＰＣＲの最後の段階においては（図１Ｆ）、連続した熱サイクリングは、ビーズに結合したプライマーを更にアニーリングさせる。溶液相増幅は、この段階で最小になるが、固定されたＢ鎖の濃度は上昇する。次いで、エマルジョンが破壊し、変性（熱、ｐＨ等によって）によって固定された生成物が、相補的なＡ鎖が除去された一本鎖となる。Ａプライマーは、固定された鎖のＡ’領域にアニーリングし、固定された鎖が配列決定酵素、及び必要な補助タンパク質に保持される。次いで、広く認められているピロリン酸技法を使用して、ビーズの配列を決定する（例えば、全体として、本明細書に参考文献として組み入れられる、米国特許第６，２７４，３２０号、第６，２５８，５６８号及び第６，２１０，８９１号に開示されている）。
【００７９】
好ましい実施形態において、増幅のために使用されるプライマーは２つの部分、即ち、５’部分及び３’部分を含む。プライマーの３’部分は標的特異的配列（図２参照）を含み、ＰＣＲプライマーの機能を果たす。プライマーの５’部分は配列決定法又は固定法に有用な配列を含む。例えば、図２においては、増幅に使用される２種のプライマーの５’部分は、ビーズ上のプライマー又は配列決定プライマーの相補的な配列（標識された４５４フォワード及び４５４リバース）を含む。即ち、フォワード又はリバース配列を含む５’部分は、アンプリコンが、フォワード又はリバース配列に相補的な、固定されたオリゴを含むビーズに接着することを可能にする。更に、配列決定反応は、フォワード及びリバースプライマー配列に相補的な配列決定プライマーを使用して開始する。従って、２つの部分のプライマーの５’部分に相補的な配列を含むビーズの１つのセットが全ての反応において使用される。同様に、２つの部分のプライマーの５’部分に相補的な配列を含む配列決定プライマーの１つのセットが、２つの部分のプライマーを使用して製造された任意のアンプリコンの配列を決定するために使用される。最も好ましい実施形態において、増幅に使用される２つの部分のプライマーセットは、図２に示す、４５４フォワード及び４５４リバースプライマー等の、５’部分の同一のセットを有する。この場合、全てのアンプリコンは、５’部分に相補的なオリゴでコーティングされた標準的ビーズを使用して解析することができる。同じオリゴ（ビーズに固定されているか、固定されていない）を、配列決定オリゴとして使用することができる。
【００８０】
エマルジョンの破壊及びビーズの回復
テンプレートの増幅に続き、エマルジョンを「破壊」する（当業界では「抗乳化」とも称する）。エマルジョンを破壊する多くの方法があり（例えば、米国特許第５，９８９，８９２号及びそれに引用されている文献を参照）、当業者は適当な方法を選択することができる。エマルジョンを破壊する、１つの好ましい方法は、実施例の項で詳述する。
【００８１】
エマルジョンが破壊された後、次いで、増幅されたテンプレートを含むビーズを、例えば、既知の技術による配列毛低反応において使用される水溶液に再懸濁する（Ｓａｎｇｅｒ，Ｆ．ら，Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．Ｕ．Ｓ．Ａ．７５，５４６３−５４６７（１９７７）；Ｍａｘａｍ，Ａ．Ｍ．及びＧｉｌｂｅｒｔ，Ｗ．Ｐｒｏｃ．ＮａｔｌＡｃａｄＳｃｉＵＳＡ７４，５６０−５６４（１９７７）；Ｒｏｎａｇｈｉ，Ｍ，ｅｔ．ａｌ．，Ｓｃｉｅｎｃｅ２８１，３６３，３６５（１９９８）；Ｌｙｓｏｖ，Ｉ，ｅｔ．ａｌ．，ＤｏｋｌＡｋａｄＮａｕｋＳＳＳＲ３０３，１５０８−１５１１（１９８８）；ＢａｉｎｓＷ．及びＳｍｉｔｈＧ．Ｃ．Ｊ．ＴｈｅｏｒＢｉｏｌ１３５，３０３−３０７（１９８８）；Ｄｒｎａｎａｃ，Ｒ．ら，Ｇｅｎｏｍｉｃｓ４，１１４−１２８（１９８９）；Ｋｈｒａｐｋｏ，Ｋ．Ｒ．ら，ＦＥＢＳＬｅｔｔ２５６．１１８−１２２（１９８９）；ＰｅｖｚｎｅｒＰ．Ａ．ＪＢｉｏｍｏｌＳｔｒｕｃｔＤｙｎ７，６３−７３（１９８９）；Ｓｏｕｔｈｅｒｎ，Ｅ．Ｍ．ら，Ｇｅｎｏｍｉｃｓ１３，１００８−１０１７（１９９２）を参照）。ｂ−ずが、ピロリン酸をベースとする配列決定反応（例えば、全てにおいて、本明細書に参考文献として組み入れられる、米国特許第６，２７４，３２０号、第６，２５８，５６８号及び第６，２１０，８９１号に開示されている）に使用される場合、ＰＣＲ産物の第二の鎖を除去し、配列決定プライマーを、ビーズに結合する単一の標準的テンプレートとアニーリングする必要がある。
【００８２】
この点において、ビーズ上で増幅されたＤＮＡは、ビーズ上で直接的に、又は異なる反応容器内で配列決定される。本発明の一実施形態において、ＤＮＡは、ビーズを反応容器に移し、ＤＮＡを配列決定反応（例えば、ピロリン酸又はサンガー法）にかけることによって、ビーズ上で直接的に配列決定される。又、ビーズを単離し、各ビーズを除去し、配列決定することができる。何れの場合にも、配列決定段階は、それぞれの個々のビーズ上で実施することができる。
【００８３】
３．核酸の配列決定方法
本発明によれば、第二ポリヌクレオチド分子の複数又は集団のそれぞれ、又は任意に第三ポリヌクレオチド分子の複数又は集団のそれぞれがヌクレオチド配列決定にかけられる。第二の（及び任意に第三の）ポリヌクレオチド分子の配列は、２〜数十億、好都合には約１００以上、約１，０００以上、約１０，０００以上、約１００，０００以上、約百万以上、又は約十億以上の範囲で、本発明の方法によって決定される。配列が、少なくとも２つの連続したヌクレオチド、好ましくは少なくとも５個、少なくとも約２５個、少なくとも約５０個、少なくとも約１００個、少なくとも約１５０個、少なくとも約２００個、少なくとも約３００個、少なくとも約５００個、少なくとも約１，０００個、少なくとも約５，０００個、少なくとも約１０，０００個、又は少なくとも約１００，０００個の連続したヌクレオチドを含み、各第二の（又は任意に第三の）ポリヌクレオチド分子のそれぞれから決定される。
【００８４】
当業者は、ポリヌクレオチドの配列決定のための幾つかの方法に精通している。それらには、サンガー法（ジデオキシ配列決定とも称する）及びＭｅｔｚｇｅｒ（ＭｅｔｚｇｅｒＭＬ２００５，ＧｅｎｏｍｅＲｅｓｅａｒｃｈ１７６７）により概説された、種々の合成による配列決定（ｓｅｑｕｅｎｃｉｎｇ−ｂｙ−ｓｙｎｔｈｅｓｉｓ）（ＳＢＳ）法、ハイブリダイゼーションによる配列決定、連結による（例えば、ＷＯ２００５／０２１７８６））、分解による（例えば、米国特許第５，６２２，８２４号及び第６，１４０，０５３号）及びナノポアの配列決定が含まれるが、これらに限定されない。
【００８５】
選択したアプローチが、単一のポリヌクレオチド分子の配列決定、又は任意に前記単一のポリヌクレオチド分子からの増幅によって誘導されるクローンポリヌクレオチド集団の配列決定をもたらす限りは、当前記技術分野で既知のポリヌクレオチド増幅及び配列決定方法は本発明に使用することができる。微生物のクローニングによるのと対照的に、任意の増殖はインビトロで起こる。
【００８６】
特定の実施形態において、ポリヌクレオチドの配列決定は、合成による配列決定（ＳＢＳ）として言及される方法の任意の群によって達成される。ＳＢＳは、ポリヌクレオチド又はポリヌクレオチドの集団における１つ以上のヌクレオチドの同一性を検出する方法であって、ヌクレオチド配列が決定されている、テンプレートポリヌクレオチドに相補的なポリヌクレオチド一本鎖の段階的な合成を含む方法を意味する。オリゴヌクレオチドプライマーは、予め決められた、試料テンプレート分子の相補的な部分とアニーリングするように設計されている。プライマー／テンプレート複合体は、核酸ポリメラーゼ酵素の存在下、ヌクレオチドと共に存在する。ヌクレオチドが、オリゴヌクレオチドプライマーの３’末端に直接隣接する試料テンプレート分子上の位置と相補的である場合、ポリメラーゼは、ヌクレオチドを使用してプライマーを伸長する。又、プリマー／テンプレート複合体は、対象となる全てのヌクレオチド（通常、Ａ、Ｇ、Ｃ及びＴ）と、オリゴヌクレオチドプライマーの３’末端と直接隣接する試料テンプレート分子上の位置と相補的なヌクレオチドと同時に存在する。何れかのシナリオにおいて、ヌクレオチドは化学的にブロックされ（３’−Ｏ位等で）、更に伸長するのが阻止され、合成の次のラウンド前にブロックを解除する必要がある。ヌクレオチドの何れかの挿入は、当前記技術分野で既知の種々の方法、例えば、例えば、化学発光により、又はヌクレオチドと結合した検出可能な標識を使用することにより、ピロリン酸（ＰＰｉ）の放出を検出することによって（米国特許第６，２１０，８９１号、第６，２５８，５６８号、及び第６，８２８，１００号）検出することができる。検出可能な標識には、質量タグ（例えば、米国特許第５，６２２，８２４号及び第６，１４０，０５３号）及び蛍光又は化学発光標識が含まれる。検出可能な標識は、直接的又は間接的にヌクレオチドに結合する。蛍光標識の場合においては、標識は、外部からの光刺激によって直接、又は蛍光（ＦＲＥＴ）又は化学発光（ＬＲＥＴ）供与体（米国特許第６，９８２，１４６号）によって間接的に励起される。検出可能な標識の検出後、それに続く標識からのシグナルを妨害せず、又は混合しないように、標識を不活性化し、又は反応物から分離する。標識の分離は、例えば、化学的切断（例えば、米国特許出願公開第２００３／０１２４５９４号）又は光開裂によって達成することができる。標識の不活性化は、例えば、光退色によって達成することができる。本発明によれば、当前記技術分野で既知のＳＢＳ法が、第二ポリヌクレオチド、又は第三のポリヌクレオチドの集団の配列決定に使用される。
【００８７】
本発明によれば、ポリヌクレオチドの配列決定は、又、ナノポアをベースとする方法によっても達成することができる。ナノポアの配列決定の基礎をなす原理は、一本鎖ＤＮＡ又はＲＮＡ分子が、分子が、厳密な直線様式で孔を横切るという方法で、ナノスケールの孔を通じて電気泳動的に実施できることである。転移する分子が、部分的にナノポアを妨害又はブロックするので、それは、孔の電気的性質を変える。電機的性質における変化は、ヌクレオチド配列に依存し、測定することができる。ナノポアはタンパク質分子を含んでもよければ、固相であってもよい。ナノポアをベースとする方法の１つの利点は、非常に長い読み取り長を達成することができ、例えば、１，０００，１０，０００、１００，０００の連続したヌクレオチドが、単一の分子から読み取ることができる。ナノポアによるポリヌクレオチドの特徴付けの方法は、例えば、米国特許出願公開第２００６／００６３１７１号、第２００６／００６８４０１号、及び第２００５／０２０２４４４号に開示されている。
【００８８】
配列決定の一方法は、ピロリン酸をベースとする配列決定として言及されるＳＢＳ法である。ピロリン酸をベースとする配列決定においては、試料ＤＮＡ配列及び伸長プライマーを、ヌクレオチド三リン酸の存在下、ポリメラーゼ反応にかけ、それによって、標的位置中の塩基と相補的である場合、ヌクレオチド三リン酸は取り込まれ、放出されるのみであり、ヌクレオチド三リン酸は、試料−プライマー混合物の一定量、又は同じ試料−プライマー混合物を連続的に分離するように添加される。次いで、ヌクレオチドの取り込みを示すＰＰｉの放出を検出する。
【００８９】
一実施形態において、配列決定産物の領域は、配列決定プライマーをテンプレート核酸の領域とアニーリングし、配列決定プライマーをＤＮＡポリメラーゼ及び既知のヌクレオチド三リン酸、即ち、ｄＡＴＰ、ｄＣＴＰ、ｄＧＴＰ、ｄＴＴＰ又はこれらのヌクレオチドの類似体と接触させることによって決定される。配列は、以下に記載するような、反応の副生物の配列を決定することによって決定することができる。
【００９０】
増幅された核酸テンプレートの領域に特異的にアニーリングすることができる限りは、配列決定プライマーは、任意の長さ又は塩基組成であってもよい。増幅されたテンプレート核酸上の領域を特異的にプライミングすることができる限りは、配列決定プライマーについての特定の構造は必要でない。好ましくは、配列決定プライマーは、特徴付けすべき配列と、アンカープライマーとハイブリダイズする配列との間のテンプレートの領域と相補的である。配列決定プライマーはＤＮＡポリメラーゼを使用して伸長され、配列決定産物を形成する。伸長は、１つ以上のタイプのヌクレオチド三リン酸、所望であれば、結合補助タンパク質の存在下に実施される。
【００９１】
ｄＮＴＰの取り込みは、好ましくは、配列決定副生物の存在を検定することによって検出される。好ましい実施形態において、配列決定副生物のヌクレオチド配列は、ｄＮＭＰが伸長された配列決定プライマーに取り込まれるように、ヌクレオチド三リン酸（ｄＮＴＰ）から遊離する無機ピロリン酸（ＰＰｉ）を測定することにより決定される。Ｐｙｒｏｓｅｑｕｅｎｃｉｎｇ（登録商用）技術（ＰｒｙｏＳｅｑｕｅｎｃｉｎｇＡＢ，Ｓｔｏｃｋｈｏｌｍ，Ｓｗｅｄｅｎ）と命名された、この配列決定法は、溶液中で（液相）又は固相技法として実施することができる。ＰＰｉをベースとする配列決定方法は、一般的に、例えば、ＷＯ９８１３５２３Ａ１、Ｒｏｎａｇｈｉ，ｅｔ．ａｌ．，１９９６，Ａｎａｌ．Ｂｉｏｃｈｅｍ．２４２：８４−８９，Ｒｏｎａｇｈｉ，ｅｔ．ａｌ．，１９９８．Ｓｃｉｅｎｃｅ２８１：３６３−３６５（１９９８）及び米国特許出願公開第２００１／００２４７９０号に開示されている。ＰＰｉ配列決定のこれらの開示は、全体として、参考文献として本明細書に組み入れられる。例えば、完全に、本明細書に参考文献として組み入れられる米国特許第６，２１０，８９１号及び第６，２５８，５６８号を参照されたい。
【００９２】
好ましい実施形態において、ＤＮＡの配列決定は、全て２００４年１月２８日に出願された、同時継続特許出願ＵＳＳＮ：１０／７６８，７２９、ＵＳＳＮ：１０／７６７，７７９、ＵＳＳＮ：１０／７６７，８９９、及びＵＳＳＮ：１０／７６７，８９４に開示されている、４５４ｃｏｒｐｏｒａｔｉｏｎ（４５４ＬｉｆｅＳｃｉｅｎｃｅ）の配列決定装置及び方法を使用して実施される。
【００９３】
特に定義しない限り、本明細書で使用される全ての技術的及び科学的用語は、本発明が属する分野の当業者によって通常に理解されるのと同じ意味を持つ。一般的に理解される定義は、２００３年６月６日に出願されたＵＳＳＮ：６０／４７６，６０２、２００３年６月６日に出願されたＵＳＳＮ：６０／４７６，５０４、２００３年１月２９日に出願されたＵＳＳＮ：６０／４４３，４７１、２００３年６月６日に出願されたＵＳＳＮ：６０／４７６，３１３、２００３年６月６日に出願されたＵＳＳＮ：６０／４７６，５９２、２００３年４月２３日に出願されたＵＳＳＮ：６０／４６５，０７１、２００３年８月２５日に出願されたＵＳＳＮ：６０／４９７，９８５、２００４年１月２８日に出願されたＵＳＳＮ：１０／７６７，７７９、２００４年１月２８日に出願された１０／７６７，８９９、２００４年１月２８日に出願されたＵＳＳＮ１０／７６７，８９４に定義されたものを含む。全ての特許、特許出願、及びこの出願に引用された文献は、完全に本明細書に参考文献として組み入れられる。
【実施例】
【００９４】
実施例１ＨＬＡ遺伝子座の配列決定
５種のＰＣＲプライマー対を、ＭＨＣクラスＩＩ遺伝子座における公的に開示されたＳＮＰの既知の長さに設計した。入力として標的領域を含む、約２００塩基対長のゲノム配列を使用して、Ｐｒｉｍｅｒ３ソフトウェア（ＷｈｉｔｅｈｅａｄＩｎｓｔｉｔｕｔｅｆｏｒＢｉｏｍｅｄｉｃａｌＲｅｓｅａｒｃｈ）を使用して、プライマーを設計した。各プライマーは、２０〜２４塩基の長さの遺伝子座特異的な３’部分、及び４塩基キー（太字における重要点）を含む一定の１９塩基の５’部分（小文字で示す）からなる。プライマーは、ＩｎｔｅｇｒａｔｅｄＤＮＡＴｅｃｈｎｏｌｏｇｉｅｓ（Ｃｏｒａｌｖｉｌｌｅ，ＩＡ）から購入した。
【００９５】
【化１】

４人の個体由来のヒトゲノムＤＮＡ（ＣｏｒｎｅｌｌＭｅｄｉｃａｌＩｎｓｔｉｔｕｔｅｆｏｒＲｅｓｅａｒｃｈ，Ｃａｍｄｅｎ，ＮＪ）を２６０ｎｍの吸光度に基づいて定量し、１００ｎｇ（約１５，０００ハプロイドゲノム等量）を、各ＰＣＲ増幅反応のためのテンプレートとして使用した。ＰＣＲ反応を、標準的反応条件下（６０ｍＭＴｒｉｓ−ＳＯ_４、ｐＨ８．９、１８ｍＭ（ＮＨ_４）_２ＳＯ_４、２．５ｍＭＭｇＳＯ_４、１ｍＭｄＮＴＰｓ、０．６２５μＭの各プライマー、４．５ユニットのＰｌａｔｉｎｕｍＴａｑＨｉｇｈＦｉｄｅｌｉｔｙポリメラーゼ（Ｉｎｖｉｔｒｏｇｅｎ，Ｃａｒｌｓｂａｄ，Ｃａ））で、以下の温度プロフィール、即ち、９４℃、３分；９４℃、３秒の３０サイクル、５７℃、４５秒、７２℃、１分；７２℃、３分で実施した。増幅産物を、ＱｉａＱｕｉｃｋＰＣＲ精製キット（Ｑｉａｇｅｎ，Ｖａｌｅｎｃｉａ，ＣＡ）を使用して生成し、予想されるサイズ（１５６〜１８１塩基対）を、５００ＤＮＡＬａｂＣｈｉｐ（登録商標）（ＡｇｉｌｅｎｔＴｅｃｈｎｏｌｏｇｉｅｓ，Ｉｎｃ，ＰａｌｏＡｌｔｏ，ＣＡ）を使用した、２１００ＢｉｏＡｎａｌｙｚｅｒ微小流体装置を使用して確認した。精製したアンプリコンを、ＰｉｃｏＧｒｅｅｎ（登録商標）ｄｓＤＮＡ定量キット（ＭｏｌｅｃｕｌａｒＰｒｏｂｅｓ，Ｅｕｇｅｎｅ，ＯＲ）を使用して定量し、１０^７コピー／μＬに希釈した。
【００９６】
増幅プライマーＳＡＤ１Ｆ（ＧＣＣＴＣＣＣＴＣＧＣＧＣＣＡ（配列番号：１１））及びＳＡＤ１Ｒ及びＳＡＤＲ１（ＧＣＣＴＴＧＣＣＡＧＣＣＣＧＣ（配列番号：１２））捕獲プライマー（ＡｍｅｒｓｈａｍＢｉｏＳｃｉｅｎｃｅ，Ｐｉｓｃａｔａｗａｙ，ＮＪ）を有するセファロース捕獲ビーズを使用して、ビーズ当たり０．５アンプリコンで、前述したように、ＥＢＣＡ（エマルジョンをベースとする増幅）を実施した。エマルジョンの破壊及びＰｉｃｏＴｉｔｅｒプレート上の配列決定を含む、全ての操作は、前述したように実施した。
【００９７】
実施例２感受性の変異体検出
少量の配列変異体、特に単一の塩基置換を検出するための最新のシステム（即ち、４５４プラットフォーム）の能力を証明するため、種々の比で混合された既知の対立遺伝子配列決定するために実験を設計した。
【００９８】
前記に記載した６種のプライマー対を、増幅効率について試験し、全てが別個の増幅産物を生成するＳＡＤ１Ｆ／Ｒ−ＤＤ１４、ＳＡＤ１Ｆ／Ｒ−ＤＥ１５、及びＳＡＤ１Ｆ／Ｒ−Ｆ５の対（図３）を使用して更なる解析を実施した。合計８種のヒトゲノムＤＮＡ試料を増幅し、４５４プラットフォーム上で配列決定し、各遺伝子座について遺伝型を決定した。実験的セットアップを単純化するため、プライマー対ＳＡＤ１Ｆ／Ｒ−ＤＤ１４（図３Ａ）、及び特定の遺伝子座でＣ又はＴ対立遺伝子の何れかについてヘテロ接合性を示した２個の試料を使用して、全ての更なる解析を実施した。
【００９９】
各試料由来の一次アンプリコンを定量し、１０：９０〜１：１，０００の範囲の特定の比、通常はＴ対立遺伝子過剰で混合した。混合した後、試料を２×１０^６コピー／μＬの作用濃度まで希釈し、ＥＢＣＡにかけ、４５４プラットフォーム上で配列決定した。図２はＴ対立遺伝子への１：５００及び１：１，０００に近い比におけるＣ対立遺伝子の混合物から得られた配列決定データを示す。何れの場合にも、おおよそ１０，０００の高品質の配列読み取りが生成され、Ｂｌａｓｔ解析にかけ、基準配列に対するヌクレオチド置換を特定した（この場合、Ｔ対立遺伝子が配列を保有する）。結果を可視化するために、置換頻度を基準配列に対してカラーコード様式でプロットした。データは、両方の試料において、低頻度の単一塩基置換が容易に特定されることを証明した（図４Ａ〜Ｃ）。更に、バックグラウンドは、バックグラウンド除去法を許容しながら、試料の間で相対的に一致していることがわかった。これは、１０を超える１：１，０００の対立遺伝子について考えても、通常に信号対雑音比を生成した（図５Ａ及びＢ）。既知の遺伝型の試料を使用した追加の実験は、少なくとも０．１％多いレベルまで、単一ヌクレオチド置換を検出能力が落ちることを確認した。少量の変化における更なる信頼性は、両方向でのテンプレートの配列決定から得ることができる。通常、２種の種の独立的な両方向のデータセット由来の頻度間の相違は、１％量のレベルに下がるまで２０％以内である。
【０１００】
対立遺伝子の広い範囲を超えた線形応答を証明するため、ＤＤ１４ＨＬＡ遺伝子座由来のＴ及びＣ対立遺伝子を表わすアンプリコンを、１：１０、１：２０、１：５０及び１：２００（１０％、５％、２％及び０．５％）の比で混合し、ＥＢＣＡ増幅し、配列決定した。図６は、低頻度の対立遺伝子の相対数における線形上昇が、前記範囲を通じて得られたことを示す（Ｒ^２＝０．９９２７）。記録された絶対頻度は、いくらか意図された比に由来し（下記表を参照）、ＤＮＡの一定量及び少量の混合物を正確に定量するために試みる通常に得られる相違に寄与する。
【０１０１】
【化２】

図６のグラフを作成するために使用された配列決定の概要。２〜５列目の数字が、配列決定されるテンプレートの合計数、各対立遺伝子の期待値及び測定値を示す。
【０１０２】
実施例３細菌の１６Ｓプロジェクト−細菌の集団を試験するための方法
細菌集団の調査は、医学、環境及び農業研究に加え、産業用プロセス制御を含む多くの分野についての本質的な応用である。細菌種を区別するための１つの共通の方法は１６ＳリボソームＲＮＡを使用する（Ｊｏｎａｓｓｏｎ，Ｏｌｏｆｓｓｏｎ，ｅｔ．ａｌ．，２００２；Ｇｒａｈｎ，Ｏｌｏｆｓｓｏｎ，ｅｔ．ａｌ．，２００３）。他の方法は、同様に、１６Ｓ及び２３ＳリボソームＲＮＡ遺伝子の間に入る配列を調べる（Ｇａｒｃｉａ−Ｍａｒｔｉｎｅｚ，Ｂｅｓｃｏｓ，ｅｔ．ａｌ．，２００１）。しかし、大多数の研究者は、現在の試料調製及び配列決定技法を使用した、複雑な細菌集団の完全な調査は不可能であることを見出した。このようなプロジェクトについての必要労働量は、非常に高いか、集団の副標本抽出を強制する。
【０１０３】
一般的に、高処理能力の方法は、細菌の集団を試験するために日常的に使用されない。一般的な方法は、その後にサブクローニングされ配列決定される１６ＳリボソームＲＮＡ遺伝子を増幅するために一般的なプライマーを使用する。制限酵素による消化は、同一の制限パターンを示すベクターを排除することによって、配列付加を減少させるために、ベクターにおいて、しばしば実施される。得られた配列を、種々の生物由来の既知の遺伝子のデータベースと比較する。集団組成の評価は、種又は属に特異的な遺伝子の存在から結論が出る。本発明の方法は、クローニング及び制限酵素による消化の段階を排除することで人件費を徹底的に減少することによって、１６Ｓ（及びおそらく遺伝子間及び２３Ｓ）ＲＮＡ領域からの完全配列を供給することによって情報の出力を増加し、以前は入手しにくかった亜株の区別を潜在的に可能にし、オーバーサンプリングされた配列を相対的に多量に変換することによって種密度を評価の潜在的に供給し、細菌の集団の研究を根本的に変える可能性を有する。
【０１０４】
核酸配列決定の、好ましい一方法は、４５４ＬｉｆｅＳｃｉｅｎｃｅｓによって開発された、ピロリン酸をベースとする配列決定法である。大規模並列４５４技術の全ての特徴と組み合わせた本発明の方法の利用は、処理能力を大いに上昇し、同一性の特定の費用を減少することができる。４５４技術は、多くの個々のＰＣＲ産物のクローニングの必要性を排除し、小さいサイズの１６Ｓ遺伝子（１．４ｋｂ）は、１０，０００個の試料を同時に処理することを可能にする。前記処理は、以下に概要を述べる方法で首尾よく証明される。
【０１０５】
最初に、大腸菌（Ｅｓｃｈｅｒｉｃｈｉａｃｏｌｉ）の１６ＳＤＮＡを、Ｅ．ｃｏｌｉＴＯＰ１０のコンピテント細胞（Ｉｎｖｉｔｒｏｇｅｎ，Ｃａｒｌｓｂａｄ，ＣＡ）から得、ＰＣＲ２．１ベクターに形質転換し、ＬＢ／アンピシリン（５０μｇ／ｍＬ）プレートに播種し、３７℃で一晩インキュベートした。１個のコロニーを選び、３ｍＬのＬＢ／アンピシリン液体培地に播種し、２５０ＲＰＭ、３７℃で６時間振盪した。１μＬのこの溶液を、１６Ｓ配列のＶ１及びＶ３領域を増幅するためのテンプレートとして使用した。
【０１０６】
１６Ｓ遺伝子中の２箇所の変異体領域について２つの部分からなるＰＣＲプライマーを設計し、Ｍｏｎｓｔｅｉｎ，ｅｔ．ａｌ．，（Ｍｏｎｓｔｅｉｎ，Ｎｉｋｐｏｕｒ−Ｂａｄｒ，ｅｔ．ａｌ．，２００１）に記載されたようにＶ１及びＶ３と命名した。４５４に特異的な、１９塩基（１５塩基増幅プライマー、３’に続く４塩基（ＴＣＧＡ）キー）のフォワード又はリバースプライマーを、可変のＶ１及びＶ３領域に隣接する、領域特異的フォワード及びリバースプライマーと融合させた。これは、５’−（１５塩基フォワード又はリバース増幅プライマー）−（４塩基キー）−（フォワード）又はリバースＶ１又はＶ３プライマー）−３’として表わされる。１６Ｓアンプリコンを生産するために使用されるプライマーは、大文字で表されるＶ１又はＶ３特異的プライマー、太字でキーを特定する４塩基、及び４５４増幅プライマーを示す小文字を含む、以下の配列を含む。
【０１０７】
【化３】

Ｖ１及びＶ３アンプリコンは、以下の試薬、即ち、１×ＨｉＦｉ緩衝液、２．５ｍＭＭｇＳＯ_４（Ｉｎｖｉｔｒｏｇｅｎ）、１ｍＭｄＮＴＰｓ（Ｐｉｅｒｃｅ，ＭｉｌｗａｕｋｅｅＷＩ）、１μＭの、Ｖ１又はＶ３領域の何れかについての２つの部分からなる各フォワード及びリバースプライマー（ＩＤＴ，Ｃｏｒａｌｖｉｌｌｅ，ＩＡ）、０．１５Ｕ／μＬのＰｌａｔｉｎｕｍＨｉＦｉＴａｑ（Ｉｎｖｉｔｒｏｇｅｎ）を含むＰＣＲ反応中で別々に生成された。１μＬの、Ｅ．ｃｏｌｉのＬＢ／アンピシリン液体培地を反応混合物に加え、３５サイクルのＰＣＲ（９４℃に３０秒間、５５℃に３０秒間、及び６８℃に１５０秒間、最後に１０℃に無限に持続）を実施した。次いで、１μＬの増幅反応混合物をＡｇｉｌｅｎｔ２１００Ｂｉｏａｎａｌｙｚｅｒ（Ａｇｉｌｅｎｔ，ＰａｌｏＡｌｔｏ，ＣＡ）で流し、最終産物の濃度を評価し、Ｖ１について１５５ｂｐ、Ｖ３について１４５ｂｐの適切なサイズが生成されたことを確認した。
【０１０８】
次いで、Ｖ１及びＶ３産物を一緒にし、ＤＮＡ捕獲ビーズ当たり０．５〜１０テンプレート分子の範囲の濃度のテンプレートで乳化し、以下の項におけるＥＢＣＡプロトコールに概要を示したようなＥＢＣＡ（エマルジョンをベースとするクローン増幅）法により増幅した。次いで、得られたクローン増幅ビーズを、４５４ＧｅｎｏｍｅＳｅｑｕｅｎｃｅｒ（４５４ＬｉｆｅＳｃｉｅｎｃｅｓ，ＢｒａｎｆｏｒｄＣＴ）で配列決定した。
【０１０９】
増幅されたビーズから得られた配列を、大腸菌の１６Ｓ遺伝子配列（Ｅｎｔｒｅｚｇｉｌ７４３７５）に対して一列に並べた。各配列についての配列スコアを計算することにより、容認できる（又はマップされる）配列を、容認できない（又はマップされない）配列から区別した。スコアは、得られたシグナルが予想されるホモポリマーに相当する可能性の平均対数であるか、又は
【０１１０】
【化４】

（式中、Ｓは計算された配列スコアであり、Ｐは固有の流量での可能性であり、ｓは前記流量におけいて測定されたシグナルであり、ｈは前記流用で予想される基準ホモポリマーの長さであり、Ｎは流れ配列（ｆｌｏｗｓａｌｉｇｎｅｄ）の合計数である）である。次いで、各配列についての配列スコアを最大配列スコア、又はＭＡＳと比較し、ＭＡＳより小さい配列スコアを「リアル」と判断し、出力ファイルに印刷した。このプロジェクトのため、１．０のＭＡＳ（９５％同一とおおよそ同等）を使用した。
【０１１１】
Ｖ１特異的プライマーを使用して生成された配列について、１３７０２個の生成された配列のうち、８７．７５％又は１１９７３個の読み取りが１．０未満の配列スコア、及び２１塩基以上の読み取り長でゲノムとマップした。１．６Ｋｂの１６Ｓ遺伝子断片に対する読み取りマッピングの位置を示すグラフ表示を図７Ａに示し、１６Ｓ遺伝子の最初の１００塩基に対する、おおよそ１２，０００の読み取りマッピングを示す。
【０１１２】
１６Ｓデータベース（ｈｔｔｐ：／／ｇｒｅｅｎｇｅｎｅｓ．１ｌｎｌ．ｇｏｖ）に対する修飾されていないコンセンサス配列
【０１１３】
【化５】

は、最初の既知の生物として大腸菌と適合した。
【０１１４】
【化６】

Ｖ１コンセンサス配列を、
【０１１５】
【化７】

に編集し、非常に低い信頼性スコアに基づき、ホモポリマーストレッチの９位における４番目の“Ｔ”（太字及び下線で印をつけた）を再調査し除去した。編集したＶ１配列のＢＬＡＳＴ結果は、大腸菌１６Ｓ遺伝子に対して向上したヒットを証明した。
【０１１６】
【化８】

Ｖ３特異的プライマーを使用して、同様の結果が得られた。１７３２９個の読み取りのうち、７１．００％が、前述した５種のＶ１テンプレートを使用したような同一の解析条件下で１６Ｓ基準ゲノムにマップした。これは、マップしたＶ１読み取りの８７．７５％よりも低く、これは、Ｖ１試料及び基準配列の間よりも、Ｖ３試料及び基準配列の間に大きい分岐を示す。図７Ｂに示すように、コンセンサス配列：
【０１１７】
【化９】

は、基準ゲノムの領域９６６〜１０６７とマップする。
【０１１８】
Ｖ１配列と異なり、修飾されていないコンセンサス配列からのＢＬＡＳＴの結果は、最初の既知の生物としての大腸菌と適合しなかったが、むしろ第二の生物として適合した。
【０１１９】
【化１０】

コンセンサス配列を、信頼性スコア及び再ＢＬＡＳＴに基づき再調査し、
【０１２０】
【化１１】

に編集した。ＢＬＡＳＴは、大腸菌に対して生じる、最も高く位置付けられるヒットをもたらした。
【０１２１】
【化１２】

処理されていない細菌細胞（大腸菌細胞を飽和状態まで増殖し１：１，０００の細菌培養液希釈液１μＬを、テンプレートの代わりにＥＢＣＡ反応混合物に加えたもの）における混合ＰＣＲプライマーの使用能力を証明するために第二の実験を実施した。ＥＢＣＡ反応に使用されたプライマーは、Ｖ１及びＶ３特異的な二部プライマーを、それぞれ０．０４μＭ、及びそれぞれ０．６２５及び０．０４μＭでフォワード及びリバース４５４増幅プライマーを含む。そうでなければ、ＥＢＣＡプロトコールは以下に示す。
【０１２２】
データは、Ｖ１及びＶ３領域が、未処理の細菌細胞のプールから首尾よく増幅し、配列決定し同時に区別できることをしめした。１５８４個の読み取りのうち、８７．６６％が１６Ｓ基準ゲノムと、図７Ｃに示す、特有のＶ１及びＶ３位に位置する配列でマップした。
【０１２３】
Ｖ１及びＶ３配列の両方の１００個の読み取りをプールし、生のシグナルデータを二進法の文字列に変化することにより評価した。即ち、１は塩基が既知の流れに存在しており、０は存在しないことを示す。“Ａ”、“ＡＡ”及び“ＡＡＡＡＡ”（配列番号：２９）が、全て１の同一スコアを受けられるように、ホモポリマーストレッチは、単一の正の値に折りたたまれる。ついで、折りたたまれた二進法の文字列は、Ｒ統計パッケージ（Ｔｅａｍ２００４）における、階層的に秩序化された分割及び崩壊ハイブリッド（ＨＯＰＡＣＨ）法（Ｐｏｌｌａｒｄ及びｖａｎｄｅｒＬａａｎ２００５）によりクラスター形成された。図８に示すように、得られた系統樹は、２００個の配列の１個を除き、Ｖ１（短い長さの赤い標識）及びＶ３（長い長さの青い標識）配列の間を明らかに識別する。
【０１２４】
同一生物中の同じ遺伝子に由来する２つの同じ領域を明確に識別する能力は、この技術が、異なる生物に由来する可変領域を識別し、有益な診断手段を提供することに熟練していることを証明しなければならないことを示唆している。
【０１２５】
実施例４ＥＢＣＡプロトコール
４．１ＤＮＡ捕獲ビーズの調製
１ｍＬのＮ−ヒドロキシスクシンイミドエステル（ＮＨＳ）で活性化したセファロースＨＰアフィニティーカラム（ＡｍｅｒｓｈａｍＢｉｏｓｃｉｅｎｃｅｓ，Ｐｉｓｃａｔａｗａｙ，ＮＪ）由来の充填ビーズを、製品のカタログ（ＡｍｅｒｓｈａｍＰｈａｒｍａｃｉａＰｒｏｔｏｃｏｌ＃７１００６００ＡＰ）に記載されたように、カラムから除去し、活性化した。３６及び２５μｍのポアフィルターメッシュ部分を連続的に通過させることによって、２５〜３６μｍのビーズを選択した後、２０ｍＭリン酸緩衝液ｐＨ８．０中の、２５μＬの、１ｍＭのアミンで標識したＨＥＧ捕獲プライマー（５’−アミン−３シーケンシャル１８原子ヘキサ−エチレングリコールスペーサーＣＣＡＴＣＴＧＴＴＧＣＧＴＧＣＧＴＧＴＣ−３’（配列番号：３０）（ＩＤＴＴｃｃｈｎｏｌｏｇｉｅｓ，Ｃｏｒａｌｖｉｌｌｅ，ＩＡ，ＵＳＡ）をビーズと結合させた。最初のフィルターを通過するが、第二のフィルターによって保持されるＤＮＡ捕獲ビーズをビーズ保存緩衝液（５０ｍＭＴｒｉｓ，０．０２％Ｔｗｅｅｎ，０．０２％アジ化ナトリウム、ｐＨ８）に集め、Ｍｕｌｔｉｓｉｚｅｒ３ＣｏｕｌｔｅｒＣｏｕｎｔｅｒ（ＢｅｃｋｍａｎＣｏｕｌｔｅｒ，Ｆｕｌｌｅｒｔｏｎ，ＣＡ，ＵＳＡ）を使用して定量し、必要になるまで４℃に保存した。
【０１２６】
４．２ＤＮＡ捕獲ビーズに対する結合テンプレート種
テンプレート分子を、ＵＶ処理した層流フード中でＤＮＡ捕獲ビーズ上の相補的なプライマーとアニーリングした。ビーズ保存緩衝液中に懸濁した、６０万個のＤＮＡ捕獲ビーズを２００μＬのＤＮＡチューブに移し、卓上小型遠心機で１０秒間遠心し、チューブを１８０°回転させ、更に１０秒間回転させ、沈殿の形成を完全確実にした。次いで、上清を除去し、ビーズを、２００μＬのアニーリング緩衝液（２０ｍＭＴｒｉｓ，ｐＨ７．５及び５ｍＭ酢酸マグネシウム）で洗浄し、５秒間撹拌し、ビーズを再懸濁し、前記のように沈殿にした。全てであるが、約１０μＬのビーズ上の上清を除去し、更に２００μＬのアニーリング緩衝液を加えた。ビーズを、更に５秒間撹拌し、１分間静置し、次いで前記のように沈殿にした。全てであるが、１０μＬの上清を捨て、０．４８μｍＬの、２×１０^７分子／μＬのテンプレートライブラリーをビーズに加えた。チューブを５秒間撹拌し、成分を混合し、次いで、テンプレートを、ＭＪサーモサイクラー（８０℃で５分間、次いで０．１℃／秒で７０まで下降させ、７０℃で１分間、０．１℃／秒で６０℃まで下降させ、６０℃に１分間維持し、０．１℃／秒で５０℃まで下降させ、５０℃に１分間維持し、０．１℃／秒で２０℃まで下降させ、２０℃に維持する））中で実施される制御された変性／アニーリングプログラム中のビーズとアニーリングさせた。アニーリング処理の完了により、ビーズを必要になるまで氷上で保存した。
【０１２７】
４．３ＰＣＲ反応混合物調製及び製剤
汚染の可能性を減少するため、ＰＣＲ反応混合物を、ＰＣＲクリーンルーム中に配置された、ＵＶ処理された層流フード中で調製した。それぞれ６００，０００のビーズエマルジョンＰＣＲ反応について、１．５ｍＬのチューブ中に２２５μＬの反応混合物（１×ＰｌａｔｉｎｕｍＨｉＦｉ緩衝液（Ｉｎｖｉｔｒｏｇｅｎ）、１ｍＭｄＮＴＰｓ（Ｐｉｅｒｃｅ）、２．５ｍＭＭｇＳＯ_４（Ｉｎｖｉｔｒｏｇｅｎ）、０．１％アセチル化された、分子生物学グレードのＢＳＡ（Ｓｉｇｍａ）、０．０１％Ｔｗｅｅｎ−８０（ＡｃｒｏｓＯｒｇａｎｉｃｓ）、０．００３Ｕ／μＬの熱安定性ピロホスファターゼ（ＮＥＢ）、０．６２５μＭのフォワード（５’−ＣＧＴＴＴＣＣＣＣＴＧＴＧＴＧＣＣＴＴＧ−３’）（配列番号：３１）及び０．０３９μＭのリバースプライマー（５’−ＣＣＡＴＣＴＧＴＴＧＣＧＴＧＴＣ−３’）（配列番号：３２）（ＩＤＴＴｅｃｈｎｏｌｏｇｉｅｓ，Ｃｏｒａｌｖｉｌｌｅ，ＩＡ，ＵＳＡ）及び０．１５Ｕ／μＬのＰｌａｔｉｎｕｍＨｉ−ＦｉＴａｑポリメラーゼ（Ｉｎｖｉｔｒｏ））を調製した。２５μＬの反応混合物を除去し、陰性コントロールとして使用するために個々の２００μＬのＰＣＲチューブに保存した。反応混合物及び陰性コントロールの両方を、必要になるまで氷上で保存した。更に、各エマルジョンについて、２４０μＬのモック増幅混合物（１×ＰｌａｔｉｎｕｍＨｉＦｉ緩衝液（Ｉｎｖｉｔｒｏｇｅｎ）、２．５ｍＭＭｇＳＯ_４（Ｉｎｖｉｔｒｏｇｅｎ）、０．１％ＢＳＡ、０．０１％Ｔｗｅｅｎ）を１．５ｍＬチューブ中で調製し、必要になるまで室温にて同様に保存した。
【０１２８】
４．４乳化及び増幅
１μＬ当たり１０，０００個の別々のＰＣＲマイクロリアクター（単一分子のマトリックス、標的ライブラリーの個々の分子のクローン増幅として供給される）を使用して、耐熱性の油中水型エマルジョンを形成した。単一の反応のための反応混合物及びＤＮＡ捕獲ビーズを以下の方法、即ち、ＵＶ処理した層流フード中で、２００μＬのＰＣＲ溶液を、６００，０００個のＤＮＡ捕獲ビーズを含むチューブに加える方法で乳化した。ピペットの繰り返し作用によりビーズを再懸濁し、次いで、ＰＣＲ−ビーズ混合物を室温に少なくとも２分間静置し、ビーズをＰＣＲ溶液と平衡化した。一方で、４００μＬのエマルジョンオイル（６０％（ｗ／ｗ）のＤＣ７４９Ｆｕｉｄ（ＤｏｗＣｈｅｍｉｃａｌＣｏ，Ｍｉｄｌａｎｄ，ＭＩ）、及び３０％（ｗ／ｗ）のＡｒ２０ＳｉｌｉｃｏｎｅＯｉｌ（Ｓｉｇｍａ））を、上部が平たい２ｍＬのチューブ（ＤｏｔＳｃｉｅｎｔｉｆｉｃ）に一定量入れた。次いで、２４０μＬのモック増幅混合物を、４００μＬのエマルジョンオイルに加え、チューブにしっかりとキャップをし、ＴｉｓｓｕｅＬｙｓｅｒＭＭ３００（ＲｅｔｓｃｈＧｍｂＨ＆Ｃｏ．ＫＧ，Ｈａａｎ，Ｇｅｒｍａｎｙ）の２４ウェルのＴｉｓｓｕｅＬｙｓｅｒＡｄａｐｔｏｒ（Ｑｉａｇｅｎ）に入れた。エマルジョンを、２５振動／秒で５分間ホモジナイズし、反応を更に安定化させる、非常に小さいエマルジョン、又は「超微粒子」を生成した。
【０１２９】
微粒子形成の際に、１６０μＬのＰＣＲ増幅混合物を、アニーリングしたテンプレート及びＤＮＡ捕獲ビーズの混合物に加えた。一緒にしたビーズ及びＰＣＲ反応混合物を手短く撹拌し、２分間平衡化させた。微粒子が形成された後、増幅混合物、テンプレート及びＤＮＡ捕獲ビーズを、乳化した物質に加えた。ＴｉｓｓｕｅＬｙｓｅｒ速度を１５振動／秒に減少し、反応混合物を５分間ホモジナイズした。より低い均質化速度は、ＤＮＡ捕獲ビーズ及び増幅混合物を十分な量で含む、１００〜１５０μｍの平均直径を有する水滴を油混合物中に形成する。
【０１３０】
エマルジョンを、ＰＣＲチューブ７〜８個に、それぞれ約８０μＬ含むように分割して入れた。チューブを封入し、前に製造した、２５μＬの陰性コントロールと一緒にＭＪサーモサイクラーに入れた。以下のサイクル時間、即ち１回（９４℃に４分間）−加熱開始、４０回（９４℃に３０秒間、５８℃に６０秒間、６８℃に９０秒間）−増幅、１３回（９４℃に３０秒間、５８℃に３６０秒間）−ハイブリダイゼーション伸長を使用した。ＰＣＲプログラムの完了後、反応物を除去し、エマルジョンをすぐに破壊する（後述する）か、破壊処理の開始前に、反応物を１０℃に１６時間まで保存する。
【０１３１】
４．５エマルジョンの破壊及びビーズの回収
増幅した物質のエマルジョンを含む、それぞれのＰＣＲチューブに、５０μＬのイソプロピルアルコール（Ｆｉｓｈｅｒ）を加え、１０秒間撹拌し、エマルジョンの粘度を低下させた。チューブを微小遠心管中で数秒間遠心し、チューブのキャップに捕捉された乳化物質を除去した。エマルジョン−イソプロピルアルコールの混合物を各チューブから、１６ゲージの先がとがっていない針（ＢｒｉｃｏＭｅｄｉｃａｌＳｕｐｐｌｉｅｓ）を取り付けたＢＤ−ＤｉｐｏｓａｂｌｅＳｙｒｉｎｇｅ（ＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ）に回収した。各ＰＣＲチューブに追加の５０μＬのイソプロピルアルコールを加え、前述したように遠心し、シリンジの成分を加えた。シリンジ内の容量はイソプロピルアルコールで９ｍＬに増加し、次いで、シリンジを転倒させ、１ｍＬの空気を吸い込み、イソプロパノールとエマルジョンとの混合を促進した。先のとがっていない針を除去し、１５μｍポアのＮｉｔｅｘＳｉｅｖｉｎｇＦａｂｒｉｃ（ＳｅｆａｒＡｍｅｒｉｃａ，Ｄｅｐｅｗ，ＮＹ，ＵＳＡ）を含む２５ｍｍのＳｗｉｎｌｏｃｋフィルターホルダー（Ｗｈａｔｍａｎ）をシリンジルアーに付着させ、先のとがっていない針を、Ｓｗｉｎｌｏｃｋユニットの反対側に付けた。
【０１３２】
シリンジの成分を、Ｓｗｉｎｌｏｃｋフィルターユニットを通して、緩やかに、しかし完全に、漂白剤を配合した廃棄物容器に放出した。先のとがっていない針及びＳｗｉｎｌｏｃｋフィルターユニットを通してシリンジ中に、６ｍＬの新鮮なイソプロピルアルコールを入れ、シリンジを１０回転倒させ、イソプロピルアルコール、ビーズ及び残りのエマルジョン成分を混合した。シリンジの成分を、再度廃棄物容器に排出し、各洗浄において６ｍＬの追加のイソプロピルアルコールを使用した洗浄工程を２回繰り返した。６ｍＬの、８０％エタノール／１×アニーリング緩衝液（８０％エタノール、２０ｍＭＴｒｉｓ−ＨＣｌ、ｐＨ７．６、５ｍＭ酢酸マグネシウム）で洗浄工程を繰り返した。次いで、ビーズを、６ｍＬの、０．１％のＴｗｅｅｎ（０．１％Ｔｗｅｅｎ−２０、２０ｍＭＴｒｉｓ−ＨＣｌ、ｐＨ７．６、５ｍＭ酢酸マグネシウム）を含む１×アニーリング緩衝液で洗浄し、次いで、ピコ純粋な水６ｍＬで洗浄した。
【０１３３】
最終の洗浄液を廃棄物容器に排出した後、１．５ｍＬの０．１ｍＭＥＤＴＡをシリンジ中に入れ、Ｓｗｉｎｌｏｃｋフィルターユニットを除去し取りのけておいた。シリンジの成分を、１．５ｍＬの遠心チューブに連続的に移した。チューブを、微小遠心管中で、周期的に２０秒間遠心し、ビーズを沈殿させ、上清を除去し、次いでシリンジの残留した成分を遠心チューブに加えた。Ｓｗｉｎｌｏｃｋユニットをフィルターに再接続し、１．５ｍＬのＥＤＴＡをシリンジ内に加えた。最終的にＳｗｉｎｌｏｃｋユニットを除去し、ビーズ及びＥＤＴＡを遠心チューブに加え、ビーズを沈殿させ、必要に応じて上清を除去した。
【０１３４】
４．６二次鎖の除去
捕獲ビーズ上に固定した増幅されたＤＮＡを、塩基性融解溶液中でインキュベーションすることによって二次鎖を除去し、一本鎖とした。ビーズに、１ｍＬの、新たに調製した融解溶液（０．１２５ＭＮａＯＨ、０．２ＭＮａＣｌ）を加え、中間にセットした、２秒間の撹拌により沈殿を再懸濁し、チューブを、ＴｈｅｒｍｏｌｙｎｅＬａｂＱｕａｋｅチューブローラーに３分間静置した。次いで、ビーズを前述のように沈殿とし、上清を注意深く除去して捨てた。次いで、残った融解溶液を、１ｍＬのアニーリング溶液（２０ｍＭＴｒｉｓ−アセテート、ｐＨ７．６、５ｍＭ酢酸マグネシウム）を加えることにより希釈し、次いで、ビーズを中間にセットして２秒間撹拌し、ビーズを沈殿させ、前述のように上清を除去した。遠心後に、８００μＬのアニーリング緩衝液を除去することを除き、アニーリング緩衝液洗浄を繰り返した。ビーズ及び残ったアニーリング緩衝液を、０．２ｍＬのＰＣＲチューブに移し、すぐに使用するか、又はそれに続く濃縮工程の前４８時間まで４℃に保存する。
【０１３５】
４．７ビーズの濃縮
ある程度まで、ビーズの質量は、増幅産物を有するビーズ、固定されたＤＮＡ鎖を含み、空のビーズは増幅産物を有しない。濃縮工程は、空のビーズを排除し、テンプレートＤＮＡの配列決定可能な量を有する捕獲ビーズを選択的に使用する。
【０１３６】
卓上型小型遠心機中で１０秒間遠心することによって、前の工程由来の一本鎖ビーズを沈殿させ、次いで、チューブを１８０°回転させ、更に１０秒間回転して沈殿の形成を確実にする。次いで、ビーズを妨害することなく、可能な限り多くの上清を除去する。ビーズに、１５μＬのアニーリング緩衝液を、次いで、２μＬの、１００μＭのビオチニル化された、４０塩基のＨＥＧ濃縮プライマー（５’ビオチン−１８原子ヘキサエチレングリコールスペーサー−ＣＧＴＴＴＣＣＣＣＴＧＴＣＴＧＣＣＴＴＧＣＣＡＴＣＴＧＴＴＣＣＣＴＣＣＣＴＧＴＣ−３’（配列番号：３３）、ＩＤＴＴｅｃｈｎｏｌｏｇｉｅｓ，一緒にした増幅産物、及びビーズに固定したテンプレートの３’−末端部分の配列部位（それぞれ２０塩基長）と相補的）を加えた。中間にセットし、２秒間溶液を撹拌して混合し、制御された、変性／アニーリングプログラムを使用して、ＭＪサーモサイクラー中で濃縮したプライマーを、固定したＤＮＡ鎖とアニーリングした（６５℃に３０秒間、０．１℃／秒で５８℃まで低下、５８℃に９０秒間、及び１０℃に維持）。
【０１３７】
プライマーをアニーリングしている間、ＳｅｒａＭａｇ−３０磁気ストレプトアビジンビーズ（Ｓｅｒａｄｙｎ，Ｉｎｄｉａｎａｐｏｌｉｓ，ＩＮ，ＵＳＡ）をゆっくりと撹拌することにより再懸濁し、１ｍＬの増強溶液（ＥｎｈａｎｃｉｎｇＦｌｕｉｄ）（２ＭＮａＣｌ、１０ｍＭＴｒｉｓ−ＨＣｌ、１ｍＭＥＤＴＡ、ｐＨ７．５）を含む、１．５ｍＬの微小遠心チューブに、２０μＬのＳｅｒａＭａビーズを加えた。ＳｅｒａＭａｇビーズ混合物を５秒間撹拌し、チューブをＤｙｎａｌＭＰＣ−Ｓ磁石中に置き、常磁性ビーズを微小遠心チューブの側面に対して沈殿させた。上清を慎重に除去して、ＳｅｒａＭａｇビーズを妨害せずに捨て、磁石からチューブを除去し、１００μＬの増強溶液を加えた。チューブを３秒間撹拌し、ビーズを再懸濁し、必要になるまでチューブを氷上に保存した。
【０１３８】
アニーリングプログラムの完了により、１００μＬのアニーリング緩衝液を、ＤＮＡ捕獲ビーズ及び濃縮プライマーを含むＰＣＲチューブに加え、チューブを５秒間撹拌し、成分を、新しい１．５ｍＬの微小遠心チューブに移した。濃縮されたプライマーが捕獲ビーズにアニーリングされているＰＣＲチューブを、２００μＬのアニーリング緩衝液で１度洗浄し、洗浄溶液を１．５ｍＬのチューブに加えた。ビーズを、１ｍＬのアニーリング緩衝液で３回洗浄し、２秒間撹拌し、前述したように沈殿させ、上清を慎重に除去した。３回目の洗浄後、ビーズを２ｍＬの氷冷した増強溶液で２回洗浄し、撹拌し、沈殿させ、前述したように上清を除去した。次いで、ビーズを１５０μＬの氷冷した増強溶液に再懸濁し、ビーズ溶液を洗浄したＳｅｒａＭａｇビーズに加えた。
【０１３９】
ストレプトアビジンをコーティングしたＳｅｒａＭａｇビーズをＤＮＡ捕獲ビーズ上に固定されたテンプレートにアニーリングした、ビオチニル化された濃縮プライマーに結合させる間に、ビーズ混合物を３秒間撹拌し、ＬａｂＱｕａｋｅチューブローラー上で３分間室温にてインキュベートした。次いで、ビーズを２，０００ＲＰＭで３分間遠心し、その後、ビーズが再懸濁されるまでビーズを緩やかに軽くたたいた。次いで、再懸濁したビーズを氷上に５分間静置した。氷上でのインキュベーションに次いで、冷却した増強溶液を、最終容量１．５ｍＬになるようにビーズに加えた。ＤｙｎａｌＭＰＣ−Ｓ磁石に挿入したチューブ、及びビーズを１２０秒間そのままにし、磁石に対してビーズを沈殿させ、次いで、上清（過剰のＳｅｒａＭａｇ及び空のＤＮＡ捕獲ビーズを含む）を慎重に除去して捨てた。
【０１４０】
ＭＰＣ−Ｓ磁石からチューブを除去し、１ｍＬの冷却した増強溶液をビーズに加え、ビーズを緩やかに軽くたたきながら再懸濁した。撹拌がＳｅｒａＭａｇとＤＮＡ捕獲ビーズとの間の結合を破壊するかもしれないので、ビーズを撹拌することは必須でない。ビーズを磁石に戻し、上清を除去した。この洗浄を更に３回繰り返し、空の捕獲ビーズの除去を確実にした。ＤＮＡ捕獲ビーズからのアニーリングした濃縮プライマー及びＳｅｒａＭａｇビーズを除去するため、ビーズを１ｍＬの融解溶液に再懸濁し、５秒間撹拌し、磁石を使用して沈殿させた。濃縮ビーズを含む上清を１．５ｍＬの別々の微小遠心チューブに写し、ビーズを沈殿させ、上清を捨てた。次いで、濃縮ビーズを、０．１％Ｔｗｅｅｎ−２０を含む１×アニーリング緩衝液に再懸濁した。ビーズをＭＰＣ上に再度沈殿させ、上清を、新しい１．５ｍＬのチューブに移し、残ったＳｅｒａＭａｇビーズの最大の除去を確実にした。ビーズを遠心し、次いで、上清を除去し、ビーズを、１ｍＬの１×アニーリング緩衝液で３回洗浄した。３回の洗浄後、８００μＬの上清を除去し、残ったビーズ及び溶液を、０．２ｍＬのＰＣＲチューブに移した。
【０１４１】
濃縮工程の平均収率は、エマルジョンに加えたオリジナルのビーズの３３％であるか、乳化反応当たり、１９８，０００個の濃縮ビーズであった。６０×６０ｍｍのＰＴＰフォーマットが、９００，０００個の濃縮ビーズを必要とするので、５個の、６００，０００個のビーズエマルジョンを６０×６０ｍｍのＰＴＰに対して処理し、配列決定を実施した。
【０１４２】
４．８配列決定プライマーのアニーリング
濃縮ビーズを、２，０００ＲＰＭで３分間遠心し、上清を捨て、次いで、１５μＬのアニーリング緩衝液、及び３μＬの配列決定プライマー（１００ｍＭＳＡＤ１Ｆ（５’−ＧＣＣＴＣＣＣＴＣＧＣＧＣＣＡ−３’（配列番号：３４）、ＩＤＴＴｅｃｈｎｏｌｏｇｉｅｓ）を加えた。次いで、チューブを５秒間撹拌し、以下の４段階アニーリングプログラム、即ち、６５℃に５分間、０．１℃／秒で５０℃まで下降、５０℃に１分間、０．１℃／秒で４０℃まで下降、４０℃に１分間維持し、０．１℃／秒で１５℃まで下降、１５℃に維持、の４段階アニーリングプログラムのＭＪサーモサイクラー中に配置した。
【０１４３】
アニーリングプログラムの完了後、ビーズをサーモサイクラーから除去し、１０秒間遠心することによって沈殿させ、チューブを１８０℃回転し、更に１０秒間回転させた。上清を捨て、２００μＬのアニーリング緩衝液を加えた。５秒間の撹拌によりビーズを再懸濁し、前述したようにしてビーズを沈殿させた。上清を除去し、ビーズを１００μＬのアニーリング緩衝液で再懸濁し、Ｍｕｌｔｉｓｉｚｅｒ３ＣｏｕｌｔｅｒＣｏｕｎｔｅｒを使用してビーズを定量した。ビーズを４℃に保存し、少なくとも１週間安定であった。
【０１４４】
４．９ＤＮＡポリメラーゼ、大きな断片及びＳＳＢタンパク質とのＤＮＡビーズのインキュベーション
アピラーゼ（Ｂｉｏｔｇｅ）（最終活性８．５ユニット／リットル）を、０．１％ＢＳＡを含む１倍検定用緩衝液に加えることにより、ビーズ洗浄緩衝液（１００ｍＬ）を調製した。光ファイバースライドをピコ純粋な水から除去し、ビーズ洗浄緩衝液中でインキュベーションした。９０万個の既に調製したＤＮＡビーズを遠心し、上清を伸長に除去した。次いで、ビーズを、０．４ｍｇ／ｍＬのポリビニルピロリドン（ＭＷ３６０，０００）、１ｍＭＤＴＴ、１７５μｇの大腸菌一本鎖結合タンパク質（ＳＳＢ）（ＵｎｉｔｅｄＳｔａｔｅｓＢｉｏｃｈｅｍｉｃａｌｓ）及び７０００単位のＢｓｔＤＮポリメラーゼ、大きい断片（ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ）を含む、１２９０μＬのビーズ洗浄緩衝液中でインキュベーションした。ビーズを、回転子上で３０分間室温にてインキュベーションした。
【０１４５】
４．１０酵素ビーズ及び微粒子充填材の調製
ＵｌｔｒａＧｌｏｗルシフェラーゼ（Ｐｒｏｍｅｇａ）及びＢｓｔＡＴＰスルフリラーゼを、ビオチンカルボキシルキャリアータンパク質（ＢＣＣＰ）融合対として組織内で調製した。８７個のアミノ酸ＢＣＣＰ領域は、大腸菌内で融合タンパク質のｉｎｖｉｖｏ発現の際に、ビオチンが共有結合するリジン残基を含む。ビオチニル化ルシフェラーゼ（１．２ｍｇ）及びスルフリラーゼ（０．４ｍｇ）を予め混合し、製造業者の使用説明書に従い、４℃で、２．０ｍＬのＤｙｎａｌＭ２８０常磁性ビーズ（１０ｍｇ／ｍＬ、ＤｙｎａｌＳＡ，Ｎｏｒｗａｙ）と結合させた。酵素結合ビーズを２０００μＬの洗浄緩衝液中で３回洗浄し、２０００μＬのビーズ洗浄緩衝液に再懸濁した。
【０１４６】
Ｓｅｒａｄｙｎ微粒子（ＰｏｗｅｒｂｉｎｄＳＡ，０．８μｍ，１０ｍｇ／ｍＬ、ＳｅｒａｄｙｎＩｎｃ）を以下のようにして調製した。即ち、１０５０μＬのストックを、１，０００μＬの、０．１％ＢＳＡを含む１倍検定用緩衝液で洗浄した。微粒子を９３００ｇで１０分間遠心し、上清を除去した。洗浄を更に２回繰り返し、微粒子を、０．１％ＢＳＡを含む、１０５０μＬの１倍検定用緩衝液に再懸濁した。ビーズ及び微粒子を、使用するまで氷上に保存した。
【０１４７】
４．１１ビーズ蒸着
Ｄｙｎａｌ酵素ビーズ及びＳｅｒａｄｙｎ微小粒子を１分間撹拌し、１，０００μＬのそれぞれを新しい微小遠心チューブ中で混合し、短く撹拌し氷上に保存した。酵素／Ｓｅｒａｄｙｎビーズ（１９２０μＬ）をＤＮＡビーズ（１３００μＬ）と混合し、ビーズ洗浄緩衝液を使用して最終容量を３４６０μＬに調整した。ビーズを正しく並べられた層中に蒸着した。光ファイバースライドをビーズ洗浄緩衝液から除去し、層１を、ＤＮＡ及び酵素／Ｓｅｒａｄｙｎビーズの混合物で蒸着した。遠心後、層１の上清を光ファイバーから吸引し、層２を、Ｄｙａｎａｌ酵素ビーズで蒸着した。この項は、異なる層をどのようにして遠心するかを詳細に記載する。
【０１４８】
層１．６０×６０ｍｍの光ファイバースライドの表面の全体の２つの３０×６０ｍｍの活性領域を形成するガスケットを、ジグの上部の、指定されたステンレス鋼の合わせくぎに慎重に適合させた。光ファイバースライドを、スライド下部のエッチングされていない側面を有するジグ中に配置し、ジグの上部／ガスケットを、スライドのエッチングされた側面に適合させる。次いで、手できつく締めるように、反対側の末端を堅くしめることにより、ジグの上部をねじで締め付けた。ＤＮＡ−酵素ビーズ混合物をジグの上部に供給された２個の入口を通して光ファイバースライド上に積載した。ビーズ混合物の積載の間、泡立ちを最小にするように最大の注意を払った。ピペットプランジャーを、緩やかに連続的に押し出すことで、それぞれの蒸着を完了させた。全体のアセンブリを、ＧＨ３．８−Ａローターを使用した、ＢｅｃｋｍａｎＣｏｕｌｔｅｒＡｌｌｅｇｒａ６遠心機中で２８００ｒｐｍで１０分間遠心した。遠心後、ピペットで上清を除去した。
【０１４９】
層２．Ｄｙｎａｌ酵素ビーズ（９２０μＬ）を２７６０μＬのビーズ洗浄緩衝液と混合し、３４００μＬの酵素−ビーズ懸濁液を、前述のようにして光ファイバースライドに積載した。スライドアセンブリを２８００ｒｐｍで１０分間遠心し、上清を捨てた。ジグから光りファイバースライドを除去し、器具上に積載する準備ができるまで、ビーズ洗浄緩衝液中に保存した。
【０１５０】
４．１２４５４装置による配列決定
全てのフロー試薬（ｆｌｏｗｒｅａｇｅｎｔｓ）は、０．４ｍｇ／ｍＬのポリビニルピロリドン（ＭＷ３６０，０００）、１ｍＭＤＴＴ及び０．１％Ｔｗｅｅｎ２０を含む、１倍検定用緩衝液中で調製した。基質（３００μＭのＤ−ルシフェリン（Ｒｅｇｉｓ）及び２．５μＭのアデノシンホスホ硫酸（Ｓｉｇｍａ））は、０．４ｍｇ／ｍＬのポリビニルピロリドン（ＭＷ３６０，０００）、１ｍＭＤＴＴ及び０．１％Ｔｗｅｅｎ２０を含む、１倍検定用緩衝液中で調製した。アピラーゼ洗浄液は、０．４ｍｇ／ｍＬのポリビニルピロリドン（ＭＷ３６０，０００）、１ｍＭＤＴＴ及び０．１％Ｔｗｅｅｎ２０を含む、１倍検定用緩衝液中に１リットル当たり最終的に８．５ユニットの活性になるようにアピラーゼを加えることにより調製する。デオキシヌクレオチドｄＣＴＰ、ｄＧＴＰ及びｄＴＴＰ（ＧＥＢｉｏｓｃｉｅｎｃｅｓ）は、基質緩衝液中に最終濃度６．５μＭに、α−チオデオキシアデノシン三リン酸（ｄＡＴＰαＳ、Ｂｉｏｌｏｇ）及びピロリン酸ナトリウム（Ｓｉｇｍａ）は、それぞれ基質緩衝液中に最終濃度５０μＭ及び０．１μＭに調製した。
【０１５１】
４５４配列決定装置は、３つの主要なアセンブリ、即ち、流体サブシステム、光ファイバーカートリッジ／フローチャンバー、及び画像処理サブシステムからなる。試薬注入口、多岐管バルブ、及びぜん動ポンプは、流体サブシステムの一部を形成する。個々の試薬は、延長した流速及び時間で一度に１つの試薬をフローチャンバー内に送達する、適切な試薬注入口に接続されている。光ファイバースライドカートリッジ／フローチャンバーは、エッチングされた側面とフローチャンバーの天井との間に２５０μｍの空間を有している。又、フローチャンバーは、試薬及び光学スライドの温度制御用装置、及び遮光筐体を含む。スライドの研磨された（エッチングされていない）側面は、画像処理システムに直接接触している。
【０１５２】
配列決定試薬の光ファイバースライドウェルへの周期性の送達、及びウェル由来の配列決定反応の副産物の洗浄は、流体システムの予めプログラムされた操作によって達成された。プログラムは、インターフェースコントロール言語（ＩＣＬ）スクリプトの形態で書かれ、各スクリプト工程の試薬名（洗浄、ｄＡＴＰαＳ、ｄＣＴＰ、ｄＧＴＰ、ｄＴＴＰ、及びＰＰｉ標準）、流速及び時間を特定する。全ての試薬について流速を４ｍＬ／分にセットし、フローチャンバー内の線速度は約１ｃｍ／ｓ以下であった。配列決定試薬の流れの順番は、最初のカーネルがＰＰｉ流れ（２１秒）からなり、次いで、１４秒の基質の流れ、２８秒のアピラーゼ洗浄、及び２１秒の基質の流れであるカーネル内に計画された。最初のＰＰｉ流れの後に、２１サイクルのｄＮＴＰの流れが続いた。各カーネルは８４秒の長さであり（ｄＮＴＰ−２１秒、基質の流れ−１４秒、アピラーゼ洗浄の２８秒、基質の流れ−２１秒）、２１秒及び６３秒の後に画像を捕獲する。ｄＮＴＰ流れの２１サイクルの後、ＰＰｉカーネルが導入され、次いで、２１サイクルのｄＮＴＰの流れが続く。配列決定のランの終わりに第三のＰＰｉカーネルが続く。全てのランの時間は２４４分である。このランを完了するのに必要な試薬の容量は以下の通り、即ち、５００ｍＬの各洗浄溶液、１００ｍＬの各ヌクレオチド溶液である。ランの間、全ての試薬を室温に維持した。フローチャンバー及びフローチャンバーの入口チューブの温度を３０℃に制御し、フローチャンバーに入る全ての試薬を前もって３０℃に加熱した。
【０１５３】
実施例５土壌試料の解析
本発明の方法を使用した解析のため、土壌中の生物から核酸を抽出した。抽出は、Ｅｐｉｃｅｎｔｒｅ（Ｍａｄｉｓｏｎ，ＷＩ，ＵＳＡ）由来のＤＮＡ抽出キットを使用して、製造業者の指示に従って実施した。
【０１５４】
即ち、５５０μＬの阻害剤除去樹脂を、それぞれ、Ｅｐｉｃｅｎｔｒｅ由来の空のＳｐｉｎカラムに加えた。カラムを２０００×ｇで１分間遠心し、カラムを充填した。フロースルーを除去し、他の５５０μＬの阻害剤除去樹脂を各カラムに加え、２０００×ｇで２分間遠心した。
【０１５５】
１００ｍｇの土壌を、１．５ｍＬのチューブ中に集め、２μＬのプロテイナーゼＫを含む、２５０μＬの土壌ＤＮＡ抽出緩衝液を加えた。溶液を撹拌し、５０μＬの土壌溶解緩衝液を加え、再度撹拌した。チューブを６５℃で１０分間インキュベーションし、次いで１，０００×ｇで２分間遠心した。１０μＬの上清を新しいチューブに移し、６０μＬのタンパク質沈殿試薬を、チューブを転倒することによって混合しながら加えた。チューブを氷上で８分間インキュベーションし、最大速度で８分間遠心した。１００〜１５０μＬの上清を、調製したＳｐｉｎカラムに直接移し、カラムを２０００×ｇで２分間、１．５ｍＬチューブ中に遠心した。カラムを捨て、溶出液を集めた。６μＬのＤＮＡ遠心溶液を溶出液に加え、チューブを簡単に撹拌することによって混合した。室温に５分間インキュベーションした後、チューブを、最大速度で５分間遠心した。上清を除去し、沈殿を、５００μＬの沈殿洗浄溶液で洗浄した。チューブを転倒して溶液を混合し、次いで、最大速度で３分間遠心した。上清を辱佳、洗浄工程を繰り返した。上清を再度除去し、最終的な沈殿を３００μＬのＴＥ緩衝液に再懸濁した。
【０１５６】
生成されたＤＮＡ試料は、少なくとも、遺伝子座におけるヌクレオチドの頻度を検出するための方法を含む本発明の方法に使用される。
【０１５７】
参考文献
【０１５８】
【表３】

【０１５９】
【表４】

【０１６０】
【表５】

【図面の簡単な説明】
【０１６１】
【図１】図１は、ビーズエマルジョン増幅法の一実施形態の概略図を示す。
【図２】図２は、ウルトラディープ配列決定法（ｕｌｔｒａｄｅｅｐｓｅｑｕｅｎｃｉｎｇｍｅｔｈｏｄ）の一実施形態の概略図を示す。
【図３】図３は、プライマー対ＳＡＤ１Ｆ／Ｒ−ＤＤ１４（パネルＡ）、ＳＡＤ１Ｆ／Ｒ−ＤＥ１５（パネルＢ）及びＳＡＤ１Ｆ／Ｒ−Ｆ５（パネルＣ）を使用して生成されたアンプリコンの品質評価を示す。解析は、ＰＣＲ産物を表わす中心のピーク及び基準サイズマーカーのフランキングピークを有するＢｉｏＡｎａｌｙｚｅｒＤＮＡ１，０００ＢｏｐＣｈｉｐにより実施した。各ピークは、１５６〜１８１塩基対の範囲である、理論的なサイズの５ｂｐ以内で測定された。
【図４】図４は、１−５００（Ａ）及び１：１，０００（Ｂ）、又はＴ対立遺伝子のみ（Ａ）の近似比（Ｔ対立遺伝子に対するＣ対立遺伝子）で混合され、クローン増幅され、４５４ＬｉｆｅＳｃｉｅｎｃｅで配列決定されたＭＨＣＩＩ遺伝子座における、２つの異なる対立遺伝子を表わすアンプリコン中のヌクレオチド頻度（非適合の頻度）を示す。各バーは、コンセンサス配列からの偏差の頻度を表わし、得られた塩基置換に従い、色でコードした（赤＝Ａ；緑＝Ｃ；青＝Ｇ；黄＝Ｔ）。
【図５】図５は、図４Ｂ及び４Ｃをにおいて表わされるのと同じデータを示すが、試料のみのＴ対立遺伝子を使用したバックグラウンド減算法の試料を図４Ａに示す。
【図６】図６は、混合され、４５４プラットフォームで配列決定され、ダイナミックレジを決定した、ＤＤ１４ＨＬＡ遺伝子座由来のＣからＴへの対立遺伝子の種々の比を示す。実験的に得られた比を、意図した比に対してプロットする（横軸）。各データポイントについての配列読み取りの現実の数を表１にまとめる。
【図７】Ａ：１６Ｓ遺伝子の最初の１００塩基に対してマップする、おおよそ１２，０００の読み取りを示す、１．６Ｋｂの１６Ｓ遺伝子断片に対するマップを読み取る位置を示すグラフである。Ｂ：塩基１，０００の周辺の領域に対してマップするＶ３プライマーを除いた７Ａとしての同様の結果を示す。Ｃ：Ｖ１及びＶ３両方のプライマーが使用される読み取りの位置を示す。
【図８】図８は、２００個の配列のうちの１個以外の全てにおいて、Ｖ１（図の左半分の短い長さ）及びＶ３（図の右半分の長い長さ）を明瞭に区別する系統樹を示す。
【図９】図９は、ウルトラディープ配列決定法の一実施形態の概略図を示す。水平の矢印は、対象領域を攻撃するプライマーを示す。
【図１０】図１０は、ウルトラディープ配列決定法の一実施形態の概略図を示す。水平の矢印は、対象領域を攻撃するプライマーを示す。

【特許請求の範囲】
【請求項１】
核酸集団における１つ以上の配列変異体を検出する方法であって、
（ａ）前記核酸集団に共通するポリヌクレオチドセグメントを、それぞれが前記ポリヌクレオチド断片を含む第一アンプリコン集団を生成する遺伝子座を規定する一対の核酸プライマーを使用して、増幅する工程；
（ｂ）前記第一アンプリコン集団の各メンバーをクローン増幅し、第二アンプリコンの複数の集団を生成する工程であって、ここで、第二アンプリコンの各集団は、前記第一アンプリコン集団の１つのメンバーに由来する、工程；
（ｃ）前記第二アンプリコンを複数の移動固相担体に、各移動固相担体が前記第二アンプリコンの１つの集団を含むように、固定する工程；
（ｄ）各固相担体上で前記第二アンプリコンの核酸配列を決定し、核酸配列の集団を生成する工程；及び
（ｅ）前記ポリヌクレオチドセグメントの各位置で各タイプのヌクレオチドの発生を測定し、前記核酸集団における１つ以上の配列変異体を検出する工程
を含む、方法。
【請求項２】
前記プライマーが、５’領域及び３’領域を含む二部プライマーであり、前記３’領域が前記ポリヌクレオチドセグメント上の領域と相補的であり、前記５’領域が配列決定プライマー又はその相補体と相同である、請求項１に記載の方法。
【請求項３】
前記５’領域が、前記移動固相担体上で捕獲オリゴヌクレオチド又はその相補体と相同である、請求項２に記載の方法。
【請求項４】
前記増幅がポリメラーゼ連鎖反応により実施される、請求項１に記載の方法。
【請求項５】
前記移動固相担体が、約１〜約５００μｍ、約５〜約１００μｍ、約１０〜約３０μｍ、及び約１５〜約２５μｍからなる群から選択される直径を有するビーズである、請求項１に記載の方法。
【請求項６】
前記移動固相担体が、前記第一アンプリコン集団、第二アンプリコン又は、その両方とハイブリダイズし、固定するオリゴヌクレオチドを含む、請求項１に記載の方法。
【請求項７】
前記核酸配列を決定する工程が、前記複数の移動固相担体を、平面上の少なくとも１０，０００個の反応チャンバーのアレイに送達する工程であって、ここで、前記複数の反応チャンバーが単一の移動固相担体を含むにすぎない、工程；および前記各移動固相担体上で前記アンプリコンの核酸配列を決定する工程によって実施される、請求項１に記載の方法。
【請求項８】
前記核酸配列を決定する工程が、ピロリン酸をベースとする配列決定により実施される、請求項１に記載の方法。
【請求項９】
前記配列変異体が、約５０％未満、約１０％未満、約５％未満、約２％未満、約１％未満、約０．５％未満、及び約０．２％未満からなる群から選択される頻度を有する、請求項１に記載の方法。
【請求項１０】
前記配列変異体が０．２〜５％の頻度を有する、請求項１に記載の方法。
【請求項１１】
前記核酸集団が、ＤＮＡ、ＲＮＡ、ｃＤＮＡ又はそれらの組み合わせを含む、請求項１に記載の方法。
【請求項１２】
前記核酸集団が複数の生物に由来する、請求項１に記載の方法。
【請求項１３】
前記核酸集団が１種の生物に由来する、請求項１に記載の方法。
【請求項１４】
前記核酸集団が前記生物の複数の組織試料に由来する、請求項１３に記載の方法。
【請求項１５】
前記核酸集団が前記生物の単一の組織に由来する、請求項１３に記載の方法。
【請求項１６】
前記核酸集団が病変組織に由来する、請求項１に記載の方法。
【請求項１７】
前記病変組織が腫瘍組織を含む、請求項１６に記載の方法。
【請求項１８】
前記核酸集団が細菌培養物、ウイルス培養物又は環境試料に由来する、請求項１に記載の方法。
【請求項１９】
前記第一アンプリコン集団が３０〜５００塩基長である、請求項１に記載の方法。
【請求項２０】
前記第一アンプリコン集団が、１，０００より多いアンプリコン、５，０００より多いアンプリコン、又は１０，０００より多いアンプリコンを含む、請求項１に記載の方法。
【請求項２１】
前記ビーズのそれぞれが、前記複数の第二アンプリコンの少なくとも１０，０００種のメンバーと結合する、請求項１に記載の方法。
【請求項２２】
前記ポリヌクレオチドセグメントの前記核酸配列が、前記方法の前に決定されていないか又は部分的に決定されていない、請求項１に記載の方法。
【請求項２３】
第一ポリヌクレオチド分子の集団における１つ以上のヌクレオチド配列変異体を検出する方法であって、
（ａ）ポリヌクレオチド領域をインビトロで選択的に増幅する工程であって、前記領域は複数の第一ポリヌクレオチド分子から増幅され、それによって第二ポリヌクレオチド分子の集団を生成する、工程；
（ｂ）複数の個々の第二ポリヌクレオチド分子のヌクレオチド配列を決定する工程であって、各配列は、少なくとも２つの連続したヌクレオチドを含み、前記配列を決定する前に、必要に応じて、複数の個々の第二ポリヌクレオチド分子がそれぞれインビトロでクローン増幅されて第三ポリヌクレオチド分子の集団を生成する、工程；及び
（ｃ）工程（ｂ）で決定したヌクレオチド配列を比較し、第二のポリヌクレオチド分子間、及び必要に応じて第三のポリヌクレオチド分子間の配列の相違を同定し、それによって前記第一ポリヌクレオチド分子の集団における１つ以上のヌクレオチド配列変異体を検出する工程
を含む、方法。
【請求項２４】
前記ポリヌクレオチド増幅が等温増幅又は熱サイクル増幅により実施される、請求項２３に記載の方法。
【請求項２５】
前記熱サイクル増幅がポリメラーゼ連鎖反応により実施される、請求項２４に記載の方法。
【請求項２６】
前記第一ポリヌクレオチド分子集団が、約１００より多い、約１，０００より多い、約１０，０００より多い、約１００，０００より多い、約１００万より多い、又は約１０億より多い分子を含む、請求項２３に記載の方法。
【請求項２７】
前記第二ポリヌクレオチド分子集団が、約１００より多い、約１，０００より多い、約１０，０００より多い、約１００，０００より多い、約１００万より多い、又は約１０億より多い分子を含む、請求項２３に記載の方法。
【請求項２８】
前記複数の個々の第二ポリヌクレオチド分子が、約１００より多い、約１，０００より多い、約１０，０００より多い、約１００，０００より多い、約１００万より多い、又は約１０億より多い分子を含む、請求項２３に記載の方法。
【請求項２９】
前記増幅されたポリヌクレオチド領域が、少なくとも約２５、少なくとも約５０、少なくとも約１５０、少なくとも約３００、少なくとも約５００、少なくとも約１，０００、少なくとも約５，０００、又は少なくとも約１０，０００個のヌクレオチドを含む、請求項２３に記載の方法。
【請求項３０】
前記配列のそれぞれが、少なくとも約５、少なくとも約２５、少なくとも約５０、少なくとも約１００、少なくとも約１５０、少なくとも約２００、少なくとも約３００、少なくとも約５００、少なくとも約１，０００、少なくとも約５，０００、少なくとも約１０，０００、又は少なくとも約１００，０００個の連続したヌクレオチドを含む、請求項２３に記載の方法。
【請求項３１】
前記第二ポリヌクレオチド分子集団が、固相又は半固相の担体に固定されている、請求項２３に記載の方法。
【請求項３２】
前記第三ポリヌクレオチド分子の集団が、固相又は半固相担体に固定されている、請求項２３に記載の方法。
【請求項３３】
前記配列が、サンガー配列決定法、合成による配列決定、ハイブリダイゼーションによる配列決定、連結反応による配列決定、分解による配列決定、及びナノポアの配列決定からなる群から選択される方法によって決定される、請求項２３に記載の方法。
【請求項３４】
前記合成による配列決定法がピロリン酸の検出を含む、請求項３３に記載の方法。
【請求項３５】
前記配列決定が、標識されたヌクレオチドを組み込む工程を含み、標識が、蛍光標識、質量タグ及び発光標識からなる群から選択される、請求項２３に記載の方法。
【請求項３６】
前記標識が光又は化学処理により除去又は不活性化される、請求項３５に記載の方法。
【請求項３７】
前記１つ以上のヌクレオチド配列変異体が、約５０％未満、約２０％未満、約１０％未満、約５％未満、約２％未満、約１％未満、約０．５％未満、約０．２％未満、及び約０．０２％未満からなる群から選択される頻度を有する、請求項２３に記載の方法。
【請求項３８】
前記１つ以上のヌクレオチド配列変異体の少なくとも１つが、前記配列を決定する前に未知である、請求項２３に記載の方法。
【請求項３９】
複数の異なる個々の生物を含む集団における生物の分布を同定する方法であって、
（ａ）前記集団から核酸試料を単離する工程；
（ｂ）請求項１又は請求項２３の何れか１項に記載の方法を使用して、前記集団中の全ての生物に共通する遺伝子座を含む核酸セグメントの１つ以上の配列変異体を決定する工程であって、ここで、各生物は前記遺伝子座で異なる核酸配列を含む、工程；及び
（ｃ）前記核酸配列の集団に基づき、前記集団における生物の分布を同定する工程
を含む、方法。
【請求項４０】
前記集団が、細菌、ウイルス、単細胞生物、植物及び酵母からなる群から選択される生物集団である、請求項３９に記載の方法。
【請求項４１】
組織試料の組成を決定する方法であって、
（ａ）前記組織試料から核酸試料を単離する工程；
（ｂ）請求項１又は請求項２３の何れか１項に記載の方法を使用して、核酸セグメントの配列変異体を検出する工程であって、ここで、前記セグメントは前記試料中の全細胞に共通する遺伝子座を含み、各細胞型は前記遺伝子座において異なる配列変異体を含む、工程；及び
（ｃ）前記ヌクレオチド頻度から前記組織試料の組成を決定する工程
を含む、方法。
【請求項４２】
生物の遺伝子型を決定するための自動化方法であって、
（ａ）前記生物から核酸を単離する工程；
（ｂ）請求項１又は請求項２３の何れか１項に記載の方法に従って、前記核酸中の１つ以上の遺伝子座における核酸配列を決定し、１つ以上の遺伝子座における核酸配列の集団を生成する工程；及び
（ｃ）前記核酸配列の集団から前記１つ以上の遺伝子座におけるホモ接合性又はヘテロ接合性を決定し、前記生物の遺伝型を決定する工程
を含む、方法。
【請求項４３】
更に（ｄ）前記核酸配列の集団を１つ以上の基準遺伝型の配列と比較し、前記生物の遺伝型を決定する工程を含む、請求項４２に記載の方法。
【請求項４４】
前記１つ以上の遺伝子座がＳＮＰを含み、前記遺伝型がＳＮＰ遺伝型である、請求項４２に記載の方法。
【請求項４５】
前記第三ポリヌクレオチド分子集団がブリッジ増幅により生成される、請求項２３に記載の方法。
【請求項４６】
前記第三ポリヌクレオチド分子集団が、半固相担体上での増幅により生成される、請求項２３に記載の方法。

【図１】

【図２】

【図３】

【図４】

【図５】

【図６】

【図７】

【図８】

【図９】

【図１０】

【公表番号】特表２００８−５３８４９６（Ｐ２００８−５３８４９６Ａ）
【公表日】平成２０年１０月３０日（２００８．１０．３０）
【国際特許分類】

【出願番号】特願２００８−５０６６５７（Ｐ２００８−５０６６５７）
【出願日】平成１８年４月１２日（２００６．４．１２）
【国際出願番号】ＰＣＴ／ＵＳ２００６／０１３７５３
【国際公開番号】ＷＯ２００６／１１０８５５
【国際公開日】平成１８年１０月１９日（２００６．１０．１９）
【出願人】（５０７３３１２３２）４５４　ライフ　サイエンシーズ　コーポレイション (11)
【Ｆターム（参考）】

[ Back to top ]

ウルトラディープ配列決定を用いて配列変異体を決定するための方法

メニュー

スポンサーリンク

次の公報 »

« 前の公報

ウルトラディープ配列決定を用いて配列変異体を決定するための方法

メニュー

スポンサー リンク

次の公報 »

« 前の公報

スポンサーリンク