説明

ウルトラディープ配列決定を用いて配列変異体を決定するための方法

本発明は、ピロリン酸配列決定技法を使用してPCR産物の直接配列決定を可能にする、新しい試料調製方法を提供する。PCR産物はゲノムの特定の領域である場合がある。本開示内容に示される技法は、一個体又は個体集団における個々の対立遺伝子多型のSNP(一塩基多型)検出、分類及び評価を可能にする。これらの結果は、患者の診断及び処置、並びにウイルス及び細菌の集団同定の評価に使用される場合がある。現在の方法と対比して、本発明は、ある程度は高処理能力の非サンガー配列決定技法の速度及び処理能力を有効に使用し、対象となる1つ以上の特定のポリヌクレオチド領域又は遺伝子座における、優れた正確さ、及び対立遺伝子検知の低い閾値を達成する。

【発明の詳細な説明】
【技術分野】
【0001】
発明の分野
本発明は、標的ポリヌクレオチドの集団において、一塩基多型(SNP)、挿入/欠失変異体(「indels」と称する)及び対立遺伝子頻度を含めた配列変異体を同時に検出及び解析するための方法、試薬及びシステムを提供する。本発明は又、既知及び未知の両方の変異体及び多型を特定するための、ポリメラーゼ連鎖反応によって複製された核酸の平行ピロリン酸配列決定による研究方法に関する。本発明は、アンプリコンを生成するための配列変異体からなると思われる、標的核酸集団中の核酸の領域を増幅するための核酸プリマーの使用を必要とする。個々のアンプリコンは、増幅された核酸中で見出される配列変異体の分布を生成するために効果的かつ費用効果的な様式で配列決定される。
【背景技術】
【0002】
発明の背景
ゲノムDNAは、一卵性の兄弟姉妹を除き、個体によって顕著に異なっている。多くのヒト疾患は、遺伝子の変異体から起こる。ヒトの間の遺伝的多様性及び来世の形態は、疾病の感受性において観察される遺伝性の変異体を明らかにする。遺伝的変異体から発生する疾病には、ハンチントン舞踏病、嚢胞性線維症、デュシェンヌ型筋ジストロフィー、及び特定の形態の乳癌が含まれる。これらの疾病のそれぞれは、単一の遺伝子変異体と関連する。多発性硬化症、糖尿病、パーキンソン病、アルツハイマー病、及び高血圧症等の疾病は更に複雑である。これらの疾病は、多遺伝子(複数の遺伝子の影響)又は多因子(複数の遺伝子及び環境の影響)が原因である。ゲノムにおける多くの変異体は疾病特性をもたらさない。しかし、上述したように、単一の変異体は疾病特性をもたらし得る。このような疾病の病理の根底にあるか、関連する遺伝子の位置を特定するためのヒトゲノムを精査する能力は、医学及びヒトの生物学において非常に強力な手段である。
【0003】
挿入及び欠失(indels)、反復配列の数、及び単一塩基対変異体(SNP)等の変異体の幾つかのタイプはゲノムの多様性をもたらす。一塩基多型と呼ばれる、単一塩基対相違は、ヒトゲノムにおける最も多いタイプの変異体である(10塩基中約1個の塩基で発生)。本明細書で使用される、SNPは、2以上の選択的なヌクレオチドの対立遺伝子が発生するいかなるゲノム位置でもあり得る。又、本明細書で使用されるSNPは、単一塩基の挿入/欠失変異体(「indel」と称する)、又は2〜100個の塩基の挿入及び/又は欠失を含むindelであり得る。相対的に安定であり(即ち、低い突然変異率を示す)、又遺伝形質に関与し得るので、SNPは配列変異体を研究するのに適切である。前記の議論において、用語SNPは、「indel」に適用することを意味することが理解される(下記に定義)。
【0004】
例えば、マイクロサテライトをベースとする解析を使用して特定された多型は種々の目的に使用されてきた。単一の遺伝子の位置を特定するための遺伝子連鎖戦略は多くの場合成功している(非特許文献1;非特許文献2)。腫瘍抑制遺伝子の染色体上の位置の特定は、一般的にヒトの腫瘍におけるヘテロ接合性の損失の研究によって達成されてきた(非特許文献3;非特許文献4;非特許文献5;及び非特許文献6)。更に、I型糖尿病等の複雑な特徴の原因となる遺伝子の染色体位置を推測するための遺伝子マーカーの使用はヒト遺伝学における研究の中心となってきている(非特許文献7;非特許文献8)。
【0005】
多くのヒト疾患の遺伝的根拠の特定においては大きな進歩が見られるものの、この情報の作成に使用される現在の方法は、大きな試料集団から遺伝子型情報を得るために必要となる莫大な費用及び膨大な作業により制限されている。この制限により、糖尿病等の障害の原因となる複雑な遺伝子変異体の特定が極めて困難になる。疾患の進行に関与する遺伝子の位置を特定するためのヒトゲノムの精査のための技法は、制限酵素断片長多型(RFLP)解析を使用して1980年代初期に開始した(非特許文献9;非特許文献10)。RFLP解析は、サザンブロット及び他の技法を必要とする。サザンブロットは、例えば、特定の表現型に関連する複雑な遺伝型を特定するために必要なため、大量の試料について実施する場合、費用及び時間の両方を消費する。これらの問題の幾つかは、マイクロサテライトマーカー解析に基づくポリメラーゼ連鎖反応(PCR)の開発によって回避された。マイクロサテライトマーカーは、ジ−、トリ−、及びテトラ−ヌクレオチド反復からなる、単純配列長多型(SSLPs)である。
【0006】
他のタイプの遺伝解析は、複数の対立遺伝子の変異体及び高いヘテロ接合性を有するDNAの超可変領域とハイブリダイズするマーカーの使用に基づく。ゲノムDNAのフィンガープリンティングのために有用な可変領域は、ミニサテライトと呼ばれる、短い配列のタンデム反復である。多型は、有糸分裂又は減数分裂の同等でない交換の結果として、又は複製の際のDNAのずれにより発生する、多くの反復における対立遺伝子の相違による。
【0007】
現在のところ、DNA配列決定による変異体の特定は、多くの欠点によって妨害されている。現在の方法においては、対象領域の増幅は、増幅産物(即ち、変異体配列の混合物)の直接配列決定に続く。又、配列決定工程は、微生物のサブクローニング工程が、即ち、意図する宿主生物中での増殖に適するベクター中への増幅産物の組換えによる挿入が先行する。
【0008】
増幅産物の直接配列決定の不都合は、配列中の可変部位において生じるシグナルの混合にある。低頻度の対立遺伝子の存在量が50%に達するときでさえ、このようなシグナルの混合における、種々のヌクレオチドの相対的な寄与率は数量化することは困難又は不可能である。更に、変異体が挿入又は欠失である(塩基置換よりも)場合、異なる分子間に得られる位相シフトは混乱した、読めないシグナルを導くだろう。
【0009】
微生物によるクローニング工程の追加は、混合したシグナルが接触しないという点において、直接配列決定と関連する問題を克服する。しかし、この戦略は多くの配列決定試薬を必要とする。更に、微生物によるクローニング工程は高価で時間を要し、特定の変異体に対して選択され、その結果、変異体の相対的頻度を歪曲させる。多くの(即ち、100、1,000、10,000)クローンの配列決定が望まれる場合、費用は非常に高くなる。
【非特許文献1】Benomar,et.al.,(1995),Nat.Genet,10:84−8
【非特許文献2】Blanton,et.al.,(1991),Genomics,11:857−69
【非特許文献3】Cavenee,et.al.,(1983);Nature,305:779−784
【非特許文献4】Collins,et.al.,(1996),Proc.Natl.Acad Sci.USA,93:14771−14775
【非特許文献5】Koufos,et.al.,(1984),Nature,309:170−172
【非特許文献6】Legius,et.al.,(1993),Nat.Genet.,3:122−126
【非特許文献7】Davis,et.al.,(1994),Nature,371:130−136
【非特許文献8】Todd,et.al.,(1995),Proc.Natl.Acad.Sci.USA,92:8560−8565
【非特許文献9】Botstein,et.al.,(1980),Am.J.Hum.Genet.32:314−31
【非特許文献10】Nakamura,et.al.,(1987),Science,235:1616−22
【発明の開示】
【発明が解決しようとする課題】
【0010】
これらの現在の方法のそれぞれは、時間を要し、問題の解決には限界があるので、欠点を有している。DNAの配列決定は、高い解像度をもたらすが、SNPの検出のためには最も高価な方法である。現時点では、1,000種の異なる試料の集団の中でのSNPの頻度の検出は非常に高価であり、100,000種の試料の中でのSNPの頻度の検出には手が出せない。従って、当業界において、ポリヌクレオチド集団中、特に、低頻度で存在する変異体に存在する配列変異体の特定及び再配列決定の経済的な方法の継続的な必要性が存在している。
【課題を解決するための手段】
【0011】
発明の概要
これらの現在の方法の不都合、及び正確さ、信頼性、費用及び時間の間の避けられない矛盾を解決するために努力し、本発明によってほとんど解決された。前述した現在の方法と対比して、本発明は、ある程度は高処理能力の非サンガー配列決定技法の速度及び処理能力を有効に使用し、対象となる1つ以上の特定のポリヌクレオチド領域又は遺伝子座における、優れた正確さ、及び対立遺伝子検知の低い閾値を達成する。「ポリヌクレオチド領域」及び「遺伝子座」は、本明細書において交換可能に使用される。本発明の増幅及び配列決定方法は、単一分子の配列決定を直接促進するか、又は、単一の分子に由来するクローン増幅産物の配列決定により促進される。この単一分子変換は、テンプレートポリヌクレオチド混合物中に非常に低い頻度で存在する変異体の高度な正確な検出及び又は頻度の測定を可能にする。
【0012】
一局面において、本発明は、低い、又は非常に低い頻度における、核酸混合物中の配列変異体の正確な測定を可能にする方法を含む。本発明は、部分的に、いわゆる単一分子の配列決定技法と結びついた、核酸試料における特定の対象領域で標的とする増幅工程の含有が、配列変異体の正確、急速かつ低コストの発見、及び対立遺伝子の頻度の測定を可能にするという発見に基づく。既知の方法を上回るこの改良は、特定の単一分子配列決定に先立つインビトロ増幅工程を使用することにより、部分的に達成される。
【0013】
本発明の顕著な特徴は、対象となるポリヌクレオチド領域のヌクレオチド配列を大きな深さで決定する能力である。深さは、特定の対象領域を通して読み取られる個々の配列の数を意味する。例えば、1,000個の分子が別々に配列決定される場合、深さは1,000に等しく、「1,000倍」又は「1,000×」として言及されるかもしれない。本発明によれば、深さは、約2〜数十億の範囲、例えば、約10〜約100万、約10〜約1,000万、約100〜約100,000、又は約1,000〜約100万の範囲であり得る。深さは、約2以上、約10以上、約100以上、約1,000以上、約10,000以上、約100,000以上、約100万以上、約1,000万以上、約1億以上、約10億以上であり得る。本発明の方法によって達成される配列深さは、現在の方法によって達成でき、現実的であり手が届く深さよりも大きい。特に、本発明の方法は微生物のクローニングを必要としない。微生物のクローニングによるとは、例えば大腸菌等の微生物の宿主生物中でのポリヌクレオチド増幅を意味する。本発明による深さは、相対的に容易、迅速かつ低コストで最高の配列変異体の決定を促進することが可能であることが、当業者には明らかであろう。
【0014】
本発明は、特定のポリヌクレオチド配列を特定することにより幾つかの配列変異体(例えば、対立遺伝子の変異体、単一のヌクレオチド多型)を診断する方法に関する。現在の技法では、例えばポリメラーゼ連鎖反応(PCR)によるSNPの検出が可能である。しかし、PCRによるSNPの検出は、1つのタイプのSNPとハイブリダイズするが、1のタイプのSNPとはハイブリダイズしないデザインを必要とする。更に、PCRは強力な方法であるが、対立遺伝子の特定のPCRはSNPの性質(配列)の以前の知識が必要であると同様、複数のPCR、及び対立遺伝子の頻度を決定するためのゲル電気泳動が必要である。例えば、5%(即ち、20個中の1個)対立遺伝子頻度は、その検出に20のPCR反応を必要とする。対立遺伝子の頻度を決定するためのPCR及びゲル電気泳動の量は、対立遺伝子の頻度が、例えば、4%、3%、2%、1%、0.5%、0.2%又はそれ以下に減少すると劇的に上昇する。
【0015】
現在の方法は、特定のDNAの配列を決定することにより、少量のSNPを含むSNPを検出する、簡易かつ迅速な方法を提供しない。
【0016】
我々は、新規のピロリン酸配列決定技法と組み合わせた2つのPCR法が、迅速で信頼性があり、費用効果的な様式で配列変異体(SNP、indel及び他のDNA多型)の決定を可能にすることを発見した。更に、本発明の方法は、不定比でDNA試料中に存在する配列変異体、例えば、約50%未満、約25%未満、約10%未満、約5%未満又は約1%未満で存在するDNA変異体を検出することができる。
【0017】
本発明によれば、核酸試料中の複数の対立遺伝子の特異的増幅及び配列決定により配列変異体(対立遺伝子頻度、SNP頻度、indel頻度)を検出する方法が提供される。最初に、核酸を、対象領域を包囲する領域を増幅するために設計された一対のPCRプライマーによって増幅する。更に、EBCA(エマルジョンをベースとするクローン増幅、Emulsion Based Clonal Amplification)を使用した別々の反応容器中で個々に、PCR反応の各産物(アンプリコン)を増幅する。EBCA(本明細書で第二アンプリコンを意味する)を配列決定し、異なるエマルジョンPCRアンプリコンからの配列のコレクションを、対立遺伝子頻度を決定するために使用することができる。
【0018】
本発明の一実施形態は、核酸集団における配列変異体を決定する方法に関する。配列変異体は、SNP、indel、配列ヌクレオチド頻度、又は対立遺伝子頻度又はそれらのパラメータの組み合わせであってもよい。前記方法は、それぞれDNA断片を含む、第一アンプリコン集団を産生する遺伝子座を特定する、一対の核酸プライマーを使用して、核酸集団に共通するDNA断片を増幅する工程を含む。第一アンプリコン集団の各メンバーは、クローン増幅され、第二アンプリコンの集団が第一アンプリコン集団のメンバーに由来する、第二アンプリコンの集団を生成する。第二アンプリコンは、各移動固相担体が、第二アンプリコンの1つの集団と接触するように、複数の移動固相担体に固定することができる。各移動固相担体上の核酸−1配列/移動固相担体−は配列決定され、核酸配列の集団が生成される。配列変異体、対立遺伝子頻度、SNP又はindelは、核酸配列の集団から決定することができる。
【0019】
本発明の他の実施形態は、複数の異なる生物種を使用して、集団を特定する方法に関する。前記方法は、核酸試料が、集団の各メンバー由来の核酸の混合物であるように、集団由来の核酸試料を単離することを含む。次いで、集団中の全ての生物に共通する遺伝子座の核酸断片の頻度が、前節の方法から生成される。遺伝子座は、各異なる種についての異なる配列(対立遺伝子)を有することが要求される。即ち、それぞれの種は、遺伝子座において、異なる核酸配列を有するべきである。対立遺伝子頻度は、遺伝子座において、核酸の各タイプの頻度から決定される。集団における生物の分布は、対立遺伝子頻度から決定される。
【0020】
好ましい実施形態において、本発明の方法は、核酸試料中のSNP及び/又はindel分布を決定するために使用される。核酸の標的集団は、個体、組織試料、培養試料土壌標本(例えば、実施例5及び実施例3を参照)、又は異なる対立遺伝子を発現する各ポリヌクレオチドを有する、少なくとも2種の異なるポリヌクレオチドを含む、他のタイプの核酸試料由来であり得る。
【0021】
本発明の方法は、対立遺伝子の組成を決定するために、組織試料を解析するために使用される。例えば、癌遺伝子の遺伝子座において特定の対立遺伝子を含むかどうかを決定するために腫瘍組織が解析される。この方法を使用して、活性化又は変異した癌遺伝子を有する腫瘍中の細胞の割合、及びDNA試料中の腫瘍DNAの合計量を測定することができる。
【0022】
本明細書で使用される対立遺伝子という用語には、変異体が、同一種の個々の生物の間、又は異なる種の個々の生物の間、1つ以上の個体に由来する正常及び病変組織の間、及びウイルスゲノムの間の、単一生物中で生じる、可変部位における配列変異体が含まれる。
【発明を実施するための最良の形態】
【0023】
発明の詳細な説明
本発明は、特定のポリヌクレオチド配列を特定することにより、1つ以上の配列変異体を検出する方法に関する。配列変異体は、2種の核酸分子の間に任意の配列の相違を含む。それ自体は、又、配列変異体は、少なくとも一塩基多型、挿入/欠失(indel)、対立遺伝子頻度及びヌクレオチド頻度を意味すると理解され、即ち、これらの用語は交換可能に使用される。種々の検出技法が、特定の実施例を使用した本明細書を通じて議論されるが、本発明の方法は、任意の配列変異体を検出するために、等しく適用することができることが理解される。例えば、本明細書においてSNPを検出するための方法は、又、indel又はヌクレオチド頻度を検出するための方法に適用することができる。
【0024】
本発明のこの方法は、とりわけ、ゲノム、組織試料、異種細胞集団、ウイルス集団又は環境試料等の特定の標的テンプレートを増幅し、配列決定するために使用される。例えば、それらには、PCR産物、候補遺伝子、変異的ホットスポット、進化的又は医学的に重要な変異領域が含まれる。それは、又、全ゲノム増幅、それに続く変異体又は縮重増幅プライマーを使用することによる全ゲノム配列決定等の増幅のために使用することができる。
【0025】
今まで、標的テンプレート中の新規の配列変異体の発見は、完全なゲノムの調製及び配列決定、又は対象領域の事前のPCR増幅、それに続く、PCR産物分子のプールの配列決定、又は単一のPCR産物分子の配列決定、それに続く微生物によるサブクローニングによる増幅による、配列決定を必要とする。本発明の方法は、新規の配列変異体の発見、並びに既知の変異体の検定を可能にし、これらは、微生物のサブクローニングを回避しながら、既存の技術により現在提供されているよりも大幅に改善された感受性、速度及びコストで、且つ大幅に大きな深さで実施される。
【0026】
この開示においては、一塩基多型(SNP)は、少なくとも共通の変異体が集団の少なくとも0.001%に存在する、少なくとも2種の変異体中に存在する配列変異体として定義される。本発明の方法が「indels」に応用することができることは理解される。従って、本発明の開示がSNPに触れる場合、「SNP」という用語が、任意の位置で「indel」という用語と置換されるなら、この開示は同様に適用できると理解される。
【0027】
本明細書で使用される「indel」という用語は、関連する核酸配列と比較し、核酸配列中に1つ以上のヌクレオチドの挿入又は欠失の存在を意味する。従って、挿入又は欠失には、隣接するヌクレオチド部分で同一の核酸配列と比較し、1個の核酸中のユニークなヌクレオチドの存在又は非存在が含まれる。例えば、挿入及び欠失には、関連する基準配列と比較して任意の特定の位置で1個のヌクレオチド、5、10、20、50、100又はそれ以上のヌクレオチドを含む数個のヌクレオチド又は多くのヌクレオチドが含まれる。又、用語には、関連する配列と比較し、核酸配列中に1つ以上の挿入又は欠失が含まれることが理解される。
【0028】
ポアソン統計は、完全に負荷された60mm×60mmのピコタイタープレート(200,000×100ベースリードからなる、2×10高品質ベース)についての検出の下限(即ち、1未満の事象)が、95%の検出信頼性を有する3個の事象及び99%の検出信頼性を有する5個の事象であることを示す(表1参照)。これは読み取りの数に直接対応し、同一の検出限界は10,000読み取り、1,000読み取り又は100読み取り中の3又は5個の事象について維持する。DNAの読み取りの実際の量は200,000より高いため、実際の検出の下限は、検定の感度上昇のために低いポイントであると予想される。比較のために、最小頻度の対立遺伝子が集団の10%以上存在する限りは、ピロリン酸をベースとする配列決定によるSNP検出は、4倍体ゲノム上に示される個々の対立遺伝子について報告されている(Rickert,et.al.,2002 BioTechniques.32:592−603)。従来の蛍光DNA配列決定は低感度であり、50/50(即ち50%)のヘテロ接合体の分解の困難を経験する(Ahmadian,et.al.,2000 Anal.Biochem.280:103−110)。
【0029】
表1:全集団における多くの事象をベースとする、0又は1つ以上の事象の検出の可能性。「*」は、3つの事象の検出の失敗の可能性が5.0%であり、それ故、同様に、前記事象の検出の可能性は95%である。「**」は、5倍を生じる1つ以上の事象を検出する可能性が99.3%であることを示す。
【0030】
【表1】

結果として、単一のSNPを検出するための完全な60×60mmピコタイタープレートの使用は、95%の信頼性を有し、集団のわずか0.002%のみ、又は99%の信頼性を有し、集団の0.003%で存在するSNPの検出を可能にする。当然、多様な解析は、検出のこの深さよりも大きな適用性を有し、表2は、95%及び99%の信頼性で検出可能な最小対立遺伝子頻度を有して、単一のピコタイタープレート上で同時にスクリーニングすることができるSNPの数を示す。
【0031】
【表2】

本発明の1つの利点は、通常、試料調製(例えば、配列決定のための、組織からのDNAの抽出及び精製)と関連する工程数が除去されるか単純化されることである。例えば、方法の感度のために、粉砕した組織及び化学的精製の伝統的な技法を使用した、組織からのDNAの抽出はもはや必要ではない。代わりに、容量において1μL未満の少量の組織試料を煮沸し、第一のPCR増幅のために使用される。この溶液増幅の産物を、emPCR反応に直接加える。従って、本発明の方法は、時間、労力及び産物の損失(ヒトの間違いによる損失を含む)を減少する。
【0032】
本発明の方法の他の利点は、方法が多重化に大変受け入れられやすいことである。以下に議論するように、本発明の二部プライマー(bipartite primer)は、単一の溶液増幅におけるプライマーセットのピロリン酸配列決定と一致する、同義遺伝子についてのプライマーセットとの組み合わせを許容する。又、複数の調整品の産物は、単一のエマルジョンPCR反応に配置される。結果として、本発明の方法は、高処理能力の応用についての相当の可能性を示す。
【0033】
本発明の一実施形態は、対立遺伝子頻度(SNP及びindel頻度を含む)の決定方法に関する。最初の工程において、アンプリコンの第一の集団を、解析すべき遺伝子座を含む核酸の標的集団を増幅するための第一のプライマーセットを使用したPCRによって産生する。前記遺伝子座は、複数の対立遺伝子、例えば、2、4、10、15又は20又はそれ以上の対立遺伝子を含む。第一のアンプリコンは、例えば、約50〜約100bp、約100bp〜約200bp、又は約200bp〜約1Kb、又は約500bp〜約5,000bp、又は約2000〜約20,000bp等の、任意のサイズであってもよい。前記方法の1つの利点は、2つのプライマーの間の核酸配列の知識が必要でないことである。
【0034】
次の工程においては、第一アンプリコン集団は、複数の水性リアクターが、(1)単一のテンプレート又はアンプリコンによって特色付けられる増幅を開始するのに十分なDNA、(2)単一のビーズ、及び(3)核酸増幅を実施するのに必要な試薬を含む増幅反応溶液(以下のEBCA(Emulsion Based Clonal Amplification)に関する議論を参照)を含むように、油中水型エマルジョン型エマルジョンン中の水性リアクター中に送達される。我々は、単一のテンプレート又はアンプリコンによって特徴付けられる増幅反応が、たとえテンプレートがマイクロリアクター中に存在するとしても達成されることを見出した。従って、1つ以上のテンプレートを含む水性マイクロリアクターは本発明によって計画される。好ましい実施形態において、各水性マイクロリアクターは、増幅のためのDNAテンプレートの単一のコピーを有する。
【0035】
送達工程の後、第一アンプリコン集団をマイクロリアクター中で増幅し、第二アンプリコンを形成する。例えば、サーモサイクラー中でEBCA(PCRを含む)(WO2004/069849に記載)を使用して実施することができ、第二アンプリコンを生成する。EBCAの後、第二アンプリコンをマイクロリアクター中でビーズと結合することができる。第二アンプリコンと結合したビーズを、平面上の反応チャンバーのアレイ(例えば、少なくとも10,000個の反応チャンバーのアレイ)に送達する。送達は、複数の反応チャンバーが1つ以上のビーズを含まないように調製することができる。例えば、これは、反応チャンバーが単一のビーズのみに適応するのに十分に小さいアレイを使用することによって達成することができる。
【0036】
配列決定反応は、複数の反応チャンバー上で同時に実施することができ、前記複数の対立遺伝子に関連する複数の核酸配列を決定することができる。反応チャンバーを使用した、同時の並列配列決定の方法は、前記他のセクション及び実施例において開示される。配列決定に次ぎ、少なくとも2種の対立遺伝子についての対立遺伝子頻度が、核酸の標的集団に由来する配列を解析することによって兄弟される。具体例として、10,000種の配列が決定され、9,900種の配列が“aaa”を読み取るが、100種の配列が“aag”を読み取る場合、“aaa”対立遺伝子は約99%の頻度を有するが、“aag”対立遺伝子は約1%の頻度を有すると考えられる。これは、以下の記載及び実施例において詳細に開示される。
【0037】
本発明の1つの利点は、以前に実施されたよりも高い感度レベルを可能にすることである。ピコタイターを使用する場合、本発明の方法は、ピコタイタープレート当たり、100,000を超える、又は300,000を超える異なるコピーの配列決定をすることができる。検出の感度は、約1%又はそれより少ない対立遺伝子変異体を表す、少量の対立遺伝子の検出を可能にすべきである。本発明の方法の他の利点は、反応決定反応が解析された領域の配列を供給することでもある。即ち、解析すべき遺伝子座の配列の事前の知識を有することを必要としない。
【0038】
好ましい実施形態において、本発明の方法は、本発明の方法は、約50%未満、約20%未満、約10%未満、約5%未満、又は約2%未満である対立遺伝子頻度を検出することができる。更に好ましい実施形態において、本発明の方法は、約0.5%未満、約0.2%未満、又は約0.02%未満等の、約1%未満の対立遺伝子頻度を検出することができる。検出感度の典型的な範囲は、約0.01%〜約100%、約0.01%〜約50%、約0.01%〜約10%、約0.1%〜約5%である。
【0039】
核酸の標的集団は、多くの原料由来であり得る。例えば、原料は生物由来の組織又は体液であってもよい。生物は、ほ乳類を含むがこれらに限定されない、任意の生物であってもよい。ほ乳類は、ヒト、又は牛、羊、豚、山羊、ウサギ等の商業的に有用な家畜であってもよい。本発明の方法は、植物の組織又は体液試料の解析を可能にする。全ての植物が本発明の方法によって解析することができるが、本発明の方法に好ましい植物には、単子葉植物及び双子葉植物を含む、商業的に有用な種が含まれる。好ましい一実施形態において、核酸の標的集団は、穀物又は加工食品由来であってもよく、穀物又は加工食品を作成する、遺伝型、対立遺伝子又は種のオリジナル及び分布を決定することができる。このような作物には、例えば、トウモロコシ、スイートコーン、カボチャ、メロン、キュウリ、サトウダイコン、ヒマワリ、米、ワタ、アブラナ、サツマイモ、マメ、ササゲ、タバコ、ダイズ、アルファルファ、小麦等が含まれる。
【0040】
核酸試料は、複数の生物から集めることができる。例えば、1,000の個体の集団の対立遺伝子頻度は、1,000の個体由来の混合DNA試料を解析する1回の実験で実施することができる。当然、集団(各個体)の対立遺伝子頻度の代表である混合DNA試料については、集団の各メンバーは、プールされた試料に対して等量(又はほぼ同じ量)の核酸(対立遺伝子の同じ数のコピー)に寄与しなければならない。例えば、ゲノムの対立遺伝子頻度の解析においては、それぞれの個体は、プールされたDNA試料に対し、約1.0×10細胞由来のDNAに寄与する。
【0041】
本発明の他の実施形態において、単一の個体における多型が検出される。即ち、標的核酸は単一の個体から単離することができる。例えば、個体の複数の組織試料由来のプールされた核酸を、多型及びヌクレオチド頻度について試験することができる。例えば、これは、個体の腫瘍における多型、又は腫瘍を含むことが疑わしい組織の検出に有用である。例えば、本発明の方法は、個体の組織試料(又は複数の組織試料由来のプールされたDNA)における、活性化癌遺伝子の頻度の検出に使用することができる。この具体例においては、活性化癌遺伝子の50%以上の対立遺伝子頻度は、腫瘍が単クローンであることを示す。50%未満の活性化癌遺伝子の存在は、腫瘍が多クローンであるか、組織試料が腫瘍組織及び正常(非腫瘍)組織の組み合わせを含むことを示す。更に、疑わしい組織の生検においては、例えば1%の活性化癌遺伝子は、新生の腫瘍の存在、又は悪性腫瘍の浸潤の存在を示す。更に、薬剤耐性突然変異体、又薬剤感受性の腫瘍細胞の画分の存在は、全体的に薬剤耐性腫瘍を有する患者の再発を予言するかもしれない。このような予後の情報は、癌治療及び研究において貴重であろう。
【0042】
核酸の標的集団は、プラスミド、コスミド、DNAウイルスゲノム、RNAウイルスゲノム、細菌ゲノム、真菌ゲノム、原生動物ゲノム、ミトコンドリアDNA、ほ乳類ゲノム及び植物ゲノムを含むが、これらに限定されない、DNA、RNA及び種々の形態のDNA及びRNAを含む任意の核酸であってもよい。核酸は、組織試料から、又はインビトロ培養物から単離される。ゲノムDNAは、組織試料、全生物、又は細胞試料から単離することができる。所望であれば、核酸の標的集団は、集団に寄与するそれぞれの個体由来の対立遺伝子と等量を含むように、標準化してもよい。
【0043】
本発明の一つの利点は、ゲノムDNAが、更なる処理なしで直接使用することができることである。しかし、好ましい実施形態において、ゲノムDNAは、PCR又はハイブリダイゼーション工程を妨害するタンパク質を実質的に含まず、ヌクレアーゼ等のDNAを損傷するタンパク質を実質的に含まない。又、好ましくは、単離されたゲノムは、ポリメラーゼ機能の非タンパク性阻害剤(例えば、重金属)及びPCRを妨害するハイブリダイゼーションの非タンパク性阻害剤を含まない。タンパク質は、当前記技術分野で既知の種々の方法によって単離されたゲノムから除去される場合がある。例えば、タンパク質は、プロテイナーゼK又はプロナーゼ等のプロテアーゼを使用することにより、又はドデシル硫酸ナトリウム(SDS)又はラウリルサルコシン酸ナトリウム(SLS)等の強力な界面活性剤を使用することにより分離したゲノムを得た細胞を溶解し、除去することができる。溶解した細胞をフェノール及びクロロホルムで抽出し、エタノールで沈殿することができる、単離されたゲノムを含む、核酸を含む水相を生成する。
【0044】
核酸の標的集団は、土壌試料、食物試料等のDNAの未知の起源を有する原料由来であり得る。例えば、食物試料由来の核酸試料中の病原体中に見出される対立遺伝子の配列決定は、食物中の病原体汚染の存在の検出を可能にする。更に、本発明の方法は、植物中の病原体対立遺伝子の分布の検出を可能にする。例えば、本発明の方法は、土壌試料(実施例5を参照)又は海水試料等の環境試料中の特定の生物(例えば、細菌、ウイルス、病原体)の株(種)又は株(種)の分布を決定することができる。
【0045】
本明細書に提供される方法の一つの利点は、核酸又はポリヌクレオチド集団における突然変異体又は配列変異体の推測的な知識が、方法のために必要でないということである。前記方法は核酸配列に基づくので、一つの位置における全ての突然変異体が決定される。更に、配列決定のために、微生物のクローニングは必要でない。DNA試料は、クローニング、サブクローニング、及びクローニングされたDNAの培養なしで連続した工程においてインビトロで増幅され配列決定される。
【0046】
例えば、本発明の方法は、ウイルス試料中の変異体の検出及び定量のために使用することができる。これらのウイルス試料には、例えば、HIVウイルス分離株が含まれる。本発明の方法の他の応用には、配列変異体の集団調査が含まれる。DNA試料を、生物の集団から集め、混合し、1つの実験で解析し、対立遺伝子頻度を決定する。生物の集団には、例えば、ヒトの集団、家畜の集団、収穫物由来の穀物が含まれる。他の用途には、腫瘍生検(例えば、肺及び直腸癌)又は腫瘍及び正常細胞の混合集団を含む生検由来の体細胞突然変異体の検出及び定量が含まれる。本発明の方法は、又、臨床的に疑わしいと関連する遺伝子(例えば、胸部、卵巣、直腸及び膵臓癌、メラノーマ)の高信頼性の再配列決定のために使用することができる。
【0047】
本発明の他の用途には、複数の異なるゲノムに関連する多型の特定が含まれる。異なるゲノムは、家族性起源、物理的近接、品種、クラス等の幾つかの表現型特性によって関連する集団から単離することができる。その他の場合において、ゲノムは、同一の集団から選択されたものより相互に関連しないように集団から無作為に選択される。好ましい一実施形態において、方法は、遺伝病又は他の特性等の特定の表現型特性を有する被験者の遺伝型(例えば、SNP含量)を決定するために実施することができる。
【0048】
本発明の方法は、ヘテロ接合性の損失について試験するか、特定のSNPの対立遺伝子頻度を決定することにより腫瘍の遺伝子構造を特徴付けるために使用することもできる。更に、本発明の方法は、ゲノム中のSNPのパネルのそれぞれの存在又は非存在を特定し、SNPの対立遺伝子頻度を決定することにより、ゲノムについてのゲノム分類コードを生成するために使用することができる。これらの用途のそれぞれは、本明細書で更に詳細に議論される。
【0049】
本発明の好ましい用途には、高処理能力の遺伝子型決定方法が含まれる。「遺伝子型決定」は、ゲノムDNA中の特定のゲノム配列の存在又は非存在を特定する処理である。異なるゲノムは、表現型ファミリー、位置、品種、クラス等に関連のある多型(例えば、複数の異なるゲノムに関連するもの)を特定するために、幾つかの表現型特性、家族性起源、物理的近接、品種、クラス等によって関連する集団の個体から単離することができる。或いは、異なるゲノムは、集団中の起源と相互に関連しないように、集団から無作為に単離することができる。このようなゲノムにおける多型の特定は、全体として集団中の多型の存在又は非存在を示すが、特定の表現型と関連付ける必要はない。ゲノムはDNAの長い領域に及び、複数の染色体を含むので、遺伝型を決定するための本発明の方法は、複数の位置における複数の配列変異体を解析し、99.99%の信頼性で遺伝型を決定する必要がある。
【0050】
遺伝子型の決定は、特定の表現型特性と関連する多型を特定するために使用されることが多いが、この関連は必ずしも必要なわけではない。遺伝子型の決定においては、(コード領域中に存在する場合もあれば存在しない場合もある)多型が存在することのみ必須条件となる。遺伝子型の決定が、表現型特性の特定に使用される場合、多型が、特徴付けられる表現型特性に影響を及ぼすと仮定される。表現型は望ましいものである場合もあれば、有害なものである場合もあり、場合によっては中性のものである場合もある。本発明の方法によって特定される多型は、表現型に寄与することができる。幾つかの多型はタンパク質コード配列内に生じ、それ故、タンパク質構造に影響を及ぼし、その結果、観察される表現型の原因となるか寄与する。タンパク質コード配列の外側に生じる他の多型は、遺伝子の発現に影響しない。対象となる遺伝子の単に近くに生じる、更なる他の多型は遺伝子マーカーとして有用である。単一の多型は、1つ以上の表現型特性の原因となる可能性もあれば、これに寄与する可能性もあり、同様に、単一の表現型特性は、1つ以上の多型による場合もある。一般的に、特定の遺伝子の同一のハプロタイプ中に生じる複数の多型は同一の表現型と関連する。更に、個体が、特定の多型についてヘテロ接合又はホモ接合であるかどうかは、特定の表現型特性の存在又は非存在に影響を及ぼす可能性がある。
【0051】
表現型の関連は、表現型特性を示す被験者の実験的集団、及び表現型特性を示さないコントロールの集団を特定することによって実施することができる。表現型特性を共有する被験者の実験的集団中に生じ、コントロール集団中に生じない多型は、表現型特性と関連する多型であると考えられる。多型が、いったん表現型特性と関連するとして特定されると、表現型特性又は特徴を発生する可能性を有する被験者のゲノムは、被験者が、最終的に表現型特徴を発生すると思われるかどうかを確立するために、被験者のゲノム中の多型の発生又は非発生を決定するためにスクリーニングすることができる。これらのタイプの解析は、ハンチントン舞踏病又は乳癌等の特定の疾病を発生する危険性における被験者において実施することができる。
【0052】
本発明の一実施形態は、表現型特性をSNPと関連させる方法に関する。表現型特性には、任意のタイプの遺伝病、病状、又は特性、被験者において積極的に検出される存在又は非存在を含む。遺伝病又は病状である表現型特性には、構成要素が、遺伝的(例えば、SNPの被験者における発生による)、及びこのような疾病になりやすい傾向である多因子性疾病が含まれる。これらの疾病には、喘息、癌、自己免疫疾患、炎症、視覚消失症、潰瘍、心臓及び心血管の疾病、神経系の疾病、及び病原性微生物又はウイルスによる感染に対する感受性が含まれるが、これらに限定されない。自己免疫疾患には、リウマチ様関節炎、多発性硬化症、糖尿病、全身性エリテマトーデス、及びグレーブズ病が含まれるが、これらに限定されない。癌には、膀胱、脳、乳房、結腸、食道、腎臓、白血病等の造血系、肝臓、肺、口腔、卵巣、膵臓、前立腺、皮膚、胃及び子宮の癌が含まれるがこれらに限定されない。表現型特性には、薬剤又は他の薬物療法に対する感受性、外観、伸長、色(例えば、植物の花)、強度、速度(例えば競争馬)、髪の色等が含まれる。遺伝的変異体に関連する表現型特性の多くの具体例は、例えば、米国特許第5,908,978号(遺伝的変異体に関連する植物の特定の種における耐病性の関連を特定する)及び米国特許第5,942,392号(アルツハイマー病の発生に関連する遺伝的マーカーを開示する)に開示されている。
【0053】
遺伝的変異体及び表現型特性の間の関連の特定は多くの目的のために有用である。例えば、被験者におけるSNP対立遺伝子の存在と、疾病の被験者によって最終的な発生との関連の特定は、早期治療投与、又は生活様式の変化の実施(例えば、このような疾病に対する通常よりもかかりやすい傾向を有する被験者において、心血管疾病を回避するためのコレステロール又は脂肪食の減少)又は癌又は他の疾病の発生のための患者の監視のために特に有用である。又、胎児が、重篤な疾病に苦しんでいるか、発生しやすいかどうかを特定するための出産前のスクリーニングに有用である。更に、このタイプの情報は、所望の特性を向上するか又は示す目的のために繁殖する動物又は植物のスクリーニングに有用である。
【0054】
複数のゲノムに関連するSNP又は複数のSNPを検出するための一方法は、特性を有する生物に由来する複数のゲノム試料におけるSNPの存在又は非存在のためのスクリーニングである。SNPが特定の表現型特性と関連するかどうかを決定するため、ゲノム試料を、特定の表現型特性を示す個体の群から単離し、共通のSNPの存在について、試料を解析する。それぞれの個体から得られるゲノム試料を一緒にし、プールされたゲノム試料を形成する。次いで、本発明の方法を、それぞれのSNPについての対立遺伝子頻度を決定するために使用する。プールされたゲノム試料を、本発明の高処理能力方法におけるSNPのパネルを使用してスクリーニングし、特定のSNP(対立遺伝子)の存在又は非存在が表現型と関連するかどうかを決定する。場合によっては、特定の被験者が関連する表現型を示す可能性を予測ことが可能である。アルツハイマー病が発生する個体の30%において、特定の多型対立遺伝子が存在するが、集団では1%のみである場合、対立遺伝子を有する個体は、アルツハイマー病の発生の高い可能性を有している。前記可能性は、アルツハイマー病に苦しんでいない個体がこの対立遺伝子を有するかどうか、及び他の因子がアルツハイマー病の発生と関連するかどうか等の、幾つかの因子にもよる。このタイプの解析は、特定の表現型が示される可能性を決定するのに有用である。このタイプの解析の予測的な能力を上昇するために、特定の表現型と関連する複数のSNPが解析され、相関値が特定される。
【0055】
又、特定の疾病を区別するSNPを特定することが可能である。複数の多型部位が検出され、それらの間、又はマーカー(SNP)と表現型との間の物理的結合を特定するために試験することができる。これは、染色体上の位置に対する表現型特性と連結する、又は関連する遺伝子座をマッピングするために使用することができ、その結果、表現型特性と関連する1つ以上の遺伝子が明らかにされる。2種の多型部位が無作為に分離される場合、それらは、別々の染色体にあるか、同時分離されない、同一の染色体上に相互に十分に離れている。2つの部位が、有意な頻度で同時分離される場合、それらは同一の染色体上で相互に連結している。これらのタイプの連鎖解析は、疾病遺伝型を含む、遺伝型に重要なゲノムの領域を特定する遺伝子地図を開発するのに有用である。
【0056】
連鎖解析は、特定の表現型又は特定の疾病の高い率を示す家族について実施することができる。生物学的試料は、表現型特性を示す家族から、及び表現型特性を示さない被験者から単離することができる。これらの試料は、それぞれ、個々のSNP対立遺伝子頻度を生成するために使用することができる。データを解析し、種々のSNPが表現型特性と関連するかどうか、及び任意のSNPが表現型特性から分離されるかどうかを決定することができる。
【0057】
連鎖データを解析する方法は、Thompson及びThompson,Genetics in Medicine(5th edition),W.B.Saunders Co.,Philadelphia,1991;及びStrachan,“Mapping the Human Genome” in the Human Genome(Bios Scientific Publishers Ltd.,Oxford)第4章を含む多くの文献に開示されており、Affymetrix,Incによる、PCT公開特許出願WO98/18967に要約されている。奇数値(LOD値)の対数を計算することにより関与する連鎖解析は、マーカー及び遺伝子座が連結しない場合の値と比較し、組換え割合におけるマーカーと遺伝子座との間の連結の可能性を示す。組換え画分は、マーカーが連結している可能性を示す。それぞれ、種々の組換え画分のLODスコアを計算し、特定のLODスコアに基づく組換え画分を決定するために、コンピュータプログラム及び数表が開発された。Lathrop,PNAS,USA 81,3443−3446(1984);Smith,et.al.,Mathematical Tables for Research Workers in Human Genetics(Churchill,London,1961);Smith,Ann.Hum.Genet.32,127−1500(1968)を参照されたい。表現型特性の遺伝子マッピングのためのLOD値の使用は、Affymetrix,IncによるPCT公開特許出願WO98/18967に開示されている。一般的に、整数のLODスコア値は、2つの遺伝子座が連結し、+3以上のLODスコアは2つの遺伝子座が連結している有力な証拠である。負の値は、連結の可能性が少ないことを示す。
【0058】
本発明の方法は、又、腫瘍におけるヘテロ接合性の損失の評価に有用である。腫瘍におけるヘテロ接合性の損失は、腫瘍が侵攻性であるか、転移性腫瘍であるか等の、腫瘍の状態の決定に有用である。前記方法は、同じタイプの腫瘍を有する複数の被験者から得られる腫瘍試料、及び同じ被験者から得られる正常組織(即ち非癌性)由来のゲノムDNAを単離することによって実施することができる。これらのゲノムDNA試料は、本発明のSNP検出方法において使用することができる。正常組織から生成されるSNP対立遺伝子と比較し腫瘍からのSNP対立遺伝子の非存在は、ヘテロ接合性の損失が生じたかどうかを示す。SNP対立遺伝子が癌の転移状態と関連する場合、SNP対立遺伝子の非存在は、非転移性腫瘍試料又は正常組織試料におけるその存在又は非存在と比較することができる。正常及び腫瘍組織中に生じるSNPのデータベースを生成することができ、患者試料中のSNPの発生を、診断又は予後診断の目的のためのデータベースと比較することができる。
【0059】
転移は、癌患者における治療の失敗の主要な原因であるので、非転移性原発腫瘍を転移性腫瘍と区別できることは有用である。転移性が早期に検出することができれば、疾病の進行を遅くするために積極的に治療することができる。転移は、原発腫瘍からの細胞の剥離、循環による細胞の移動、及び局所的又は遠位部位における腫瘍細胞の最終的な定着を含む複合過程である。更に、監視及び早期治療が開始するように、特定の癌の発生についての傾向を検出できることは好ましい。多くの癌及び腫瘍は遺伝子変異体と関連している。
【0060】
固形腫瘍は、転移段階を通じた腫瘍形成から幾つかの遺伝的な異常が発生する段階へ進行する。例えば、Smith,et.al.,Breast Cancer Res.Terat.,18 Suppl.1,“S5−14,1991を参照。遺伝的異常は、即ち、増殖性の利益、薬剤耐性を生じる能力、血管新生、タンパク質分解又は転移能力の向上を与えることにより、次の段階へ進行させるように、腫瘍を変化させると信じられている。これらの遺伝的異常は、「ヘテロ接合性の損失」として言及される。ヘテロ接合性の損失は、腫瘍の進行において役割を果たす遺伝子変異体をもたらす欠失又は組換えによって引き起こされ得る。腫瘍抑制遺伝子についてのヘテロ接合性の損失は、腫瘍の進行において役割を果たしていると信じられている。例えば、染色体13q14に位置する網膜芽細胞腫瘍抑制遺伝子中の突然変異体が、網膜芽細胞腫、骨肉腫、小細胞肺癌及び乳癌を引き起こすと信じられている。同様に、第三染色体の短腕は、小細胞肺癌、腎臓癌及び卵巣癌等の癌と関連していると思われる。例えば、潰瘍性大腸炎は、蓄積した遺伝子変異体を含む多段階の経過をおそらく含む癌の危険の増加と関連する疾病である(米国特許第5,814,444号)。長期の潰瘍性大腸炎に苦しんでいる患者は、癌の危険の上昇を示し、1つの初期マーカーは、第八染色体の末端短腕の領域のヘテロ接合性の損失であることが示された。この領域は、前立腺及び乳癌とも関係する推定上の腫瘍抑制遺伝子の部位である。ヘテロ接合性の損失は、潰瘍性大腸炎に苦しんでいる患者において本発明の方法を日常的に実施することにより、容易に検出することができる。同様の解析は、ヘテロ接合性と関連することが知られているか、又は信じられている、他の腫瘍から得られた試料を使用して実施することができる。本発明の方法は、何千もの試料を一度にスクリーニングすることができるので、ヘテロ接合性の損失を研究するために特に有利である。
【0061】
本発明は、部分的に、対立遺伝子頻度を検出するための核酸の処理方法を含む。これらの方法の一つは、以下の3つの工程、即ち(1)試料調製−第一のアンプリコンの調製;(2)ビーズエマルションPCR−第二アンプリコンの調製;(3)合成による配列決定−対立遺伝子頻度を決定するための、第二アンプリコン由来の複数の配列の検出において広く特定される。これらの核工程は、以下に、及び実施例の項において更に詳細に記載される。
【0062】
1.核酸テンプレートの調製
核酸テンプレート
テンプレート核酸は、核酸の任意の起源、例えば、任意の細胞、組織、又は生物から構築することができ、当業界で認識されている何れかの方法によって生成することができる。又、テンプレートライブラリーは、RNA、例えばメッセンジャーRNA(mRNA)由来の相補的なDNA(cDNA)ライブラリーを生成することによって作成することができる。試料調製の方法は、同時係属出願米国特許出願第10/767,779号、及びPCT出願PCT/US04/02570に見出すことができ、WO/04070007にも開示されており、全て、本明細書に完全に参考文献として組み入れられる。
【0063】
本発明の方法は、第一ポリヌクレオチド分子の集団に由来する対象ポリヌクレオチド領域の選択的増幅を含む。増幅は、対象領域を含む複数の第一の分子に由来する第二ポリヌクレオチド分子の集団をもたらす。増幅された第一の分子のそれぞれが対象領域を含むとしても、1つ以上の配列変異体は、対象領域中の第一の分子の間に示されることが認められる。このようにして増幅された集団中の個々の第一の分子の数は、2〜数十億、好都合には約100以上、約1,000以上、約10,000以上、約100,000以上、約100万以上、又は約10億分子以上の範囲である。
【0064】
選択的な増幅は、増幅が対象領域で実施され、それにより好ましくは又は具体的には対象領域が増幅されることを意味する。理想的には、対象領域のみが増幅される。しかし、当業者は、核酸増幅反応において得られる頻度のように、実質的に他の領域の非特異的増幅も生じることを理解するだろう。このような非特異的反応産物は、温度、プライマーの設計及び濃度の改善、緩衝液成分及びヌクレオチドの濃度等の反応条件の最適化によって回避することができる。当業者は、増幅特異性を改善するためのネステッドプライマーの両方使用を含む、増幅反応の最適化についての戦略に詳しいだろう。又、非特異的増幅産物は、例えば、ゲル電気泳動又はクロマトグラフィー法によるサイズ選択により、所望の生成物から分離することができる。非特異的増幅の程度及び特定の実験デザインに依存し、非特異的生成物の除去は必ずしも必要でない。
【0065】
選択的増幅反応は、等温法及びサーモサイクリングを含む、当前記技術分野で既知の多くの方法によって実施することができる。例えば、当業者に容易に知られるサーモサイクリング法は、ポリメラーゼ連鎖反応(PCR)である。選択的増幅のための等温法の具体例は、Notomi,et.al.,Nucleic Acids Res.2000;28(12):E63に開示されたloop−mediated isothermal amplification(LAMP)である。LAMPは、特別に設計された標的特異的プライマーのセットによって準備された自己再発鎖置換DNA合成(self−recurring stand displacement)を使用する。対象ポリヌクレオチド領域のサイズ、即ち、その長さは、約50〜約10,000ヌクレオチド、約80〜約1,000ヌクレオチド、又は約100〜500ヌクレオチド等の、約20〜約40,000ヌクレオチドの範囲である。約50〜約2,000ヌクレオチドの長さが好ましい。増幅産物は、一本鎖又は二本鎖の形態、又は両方であり得る。DNA増幅の、これらの方法及び他の方法は、DNA Amplification:Current Technologies and Applications,V.Demidov及びN.Broude,eds.,Horizon Bioscience,2004に開示されている。これらの任意の異なる増幅方法の組み合わせが意図される。
【0066】
使用される方法に関係なく、選択的増幅は、第二ポリヌクレオチド分子の集団の合成をもたらす。このようにして増幅された集団における個々の第二ポリヌクレオチド分子の数は、2〜数十億、好都合には、約100以上、約1,000以上、約10,000以上、約100,000以上、約100万以上、又は約10億以上の分子である。増幅されたポリヌクレオチド領域は、好都合には、少なくとも約25、少なくとも約50、少なくとも約150、少なくとも約300、少なくとも約500、少なくとも約1,000、少なくとも約5,000、又は少なくとも約10,000を含む、2〜数十億ヌクレオチドの範囲である。
【0067】
又、選択的な増幅は、別々の反応、又は単一の反応の何れかにおいて(即ち、多重化)、複数の対象領域を標的としてもよい。複数の領域が別々に増幅される場合、増幅産物は配列決定工程の前に、何れかの時点で混合(プール)される。
【0068】
核酸テンプレート調製の一つの好ましい方法は、対象となる(既知又は疑わしい)対立遺伝子を含む領域を増幅するための試料においてPCRを実施することである。PCR法は、相互に間隔の空いたオリゴヌクレオチドプライマーを使用して、何れかの核酸試料(DNA、RNA、cDNA)に応用することができる。プライマーは、二本鎖DNA分子の反対の鎖に相補的であり、通常、約50〜2,000ヌクレオチド、又はそれ以上によって分離される。しかし、約35,000塩基と同じくらいの領域のPCR増幅は、プルーフリーディングDNAポリメラーゼの使用により可能である(Barnes,W.M.(1994)Proc.Natl.Acad.Sci.USA 91:2216)。PCR法は、Saiki,et.al.,Science(1985)230:1350−1354;Saiki,et.al.,Nature(1986)324:163−166;及びScharf,et.al.,Science(1986)233:1076−1078を含めた、幾つかの出版物に開示されている。又、それぞれの特許の本文が本明細書に参考文献として組み入れられる、米国特許第4,683,194号、第4,683,195号、及び4,683,202号を参照されたい。PCR増幅のための追加の方法は、本明細書に参考文献として組み入れられる、PCR Technology:Principles and Applications for DNA Amplification ed.HA Erlich,Freeman Press,New York,N.Y.(1992);PCR Protocols:A Guide to Methods and Applications,eds.Innis,Gelfland,Snisky,及びWhite,Academic Press,San Diego,Calif.(1990);Mattila,et.al.,(1991)Nucleic Acid Res.19:4967;Eckert,K.A.及びKunkel,T.A.(1991)PCR Methods and Application 1:17,and;PCR eds.McPheron,Quirkes, and Taylor,IRL Press,Oxfordに開示されている。
【0069】
2.核酸テンプレート増幅
次いで、第二ポリヌクレオチド分子の集団を配列決定解析にかけ、それによって、単一の第二ポリヌクレオチド分子を別々に配列決定することができる。
【0070】
しかし、必要に応じて、配列決定解析の前に、単一の第二ポリヌクレオチド分子を、インビトロ増幅の第二ラウンドにかけ、第三ポリヌクレオチド分子の集合を合成させる。この増幅の第二ラウンドは、他の第二の分子から得られる第三の分子集団から、各第二の分子に由来する第三の分子集団を分離することを可能とする、当前記技術分野で既知の幾つかの方法の任意の1つによって実施することができる。このタイプの増幅は、通常、クローン増幅として言及される。本明細書で使用されるように、「クローン」は、例えば、単一の原核酸分子から増幅される、複数の同一の核酸分子等の、複数の同一の分子又はコピーからなることを意味する。特に、各集団は、それに続く配列決定における、単一の第二ポリヌクレオチド分子を表すクローンである。
【0071】
一実施形態において、2回目の増幅は、米国特許出願公開第2005/0100900号、米国特許出願公開第2003/0022207号、及び米国特許出願公開第2004/0096853号に記載されるような、ブリッジ増幅等の既知の増幅方法によって、固相担体又は半固相担体上で実施することができる。従って、第二ポリヌクレオチド分子を、固相担体に固定された、適当なオリゴヌクレオチドプライマー分子にアニーリングする。次いで、プライマーを伸長し、分子及びプライマーを相互に分離する。次いで、伸長したプライマーを他の固定されたプライマー(このようにしてブリッジを形成する)にアニーリングし、他のプライマーを伸長させる。次いで、両方の伸長したプライマーを相互に分離し、更なる伸長プライマーの供給のために使用する。増幅された、第三ポリヌクレオチド分子の固定集団を供給するため、前記工程を繰り返す。第二ポリヌクレオチド分子の初期アニーリングを、アニーリングした分子が相互に十分に離れるように実施する場合、第三のポリヌクレオチドの集団は、コロニーの形態に装置相互に分離する傾向にあり、従ってクローンである。従って、たとえ、コロニーが、固相担体又は半固相担体上で相互に近接していたとしても、適当な開始条件の下、コロニーの大部分は別個であり、クローン増幅産物を表す。次いで、ブリッジ増幅を含むこれらのコロニーを核酸配列解析にかける。
【0072】
他の実施形態において、2回目の増幅は、エマルジョン中の増幅によって実施することができる(WO2004/069849及びWO2005/073410)。前記エマルジョンは、何百万の個々の反応を含む。前記エマルジョンは、増幅産物がクローン方法に関連するような微粒子を含んでいてもよい。
【0073】
更に他の実施形態において、2回目の増幅は、米国特許第6,432,360号、第6,485,944号及び第6,511,803号に開示されたポロニー技術によって固相担体又は半固相担体上で実施することができる。例えば、オリゴヌクレオチドプライマーを半固相担体上に固定し、テンプレート核酸を半固相担体上に播種し、プライマーとハイブリダイズし、DNAポリメラーゼ及びデオキシヌクレオチドトリホスファターゼを使用して伸長し、次いで変性させる。数回のアニーリング、伸長及び変性により、in situの半固相担体上でクローン増幅がもたらされる。増幅産物は、それらが由来するテンプレート分子のすぐ近くに空間的に制限される。これは、ポロニーとして当前記技術分野で既知のPCRコロニーの形成をもたらす。次いで、各ポリニー中の核酸分子のポリヌクレオチド配列を、例えば、Mitra,et.al.,(2003)Analyt.Biochem.320:55−65に開示されているような、合成による配列決定法を含めた、当前記技術分野で既知の幾つかの方法によって決定することができる。
【0074】
好ましい実施形態において、増幅の第二ラウンドは、新規の増幅システムにより実施することができ、本明細書で命名されたEBCA(エマルジョンをベースとするクローン増幅、Emulsion Based Clonal Amplification)は、第二の増幅を実施するために使用される。EBCA(WO2004/069849及びWO2005/073410)は、増幅するためのテンプレート核酸(例えばDNA)を、好ましくは、通常球形の固相担体に付着させることによって実施することができる。本発明の試料調製方法に従って調製された一本鎖テンプレートDNAのライブラリーは、本発明の増幅方法において使用されるビーズに付着する出発核酸テンプレートライブラリーの適当な起源の具体例である。
【0075】
ビーズは、テンプレートDNAの領域に相補的な、多くの単一のプライマー種(即ち、図1のプライマーB)に結合する。ビーズにアニーリングされるテンプレートDNAはプライマーと結合する。ビーズを水性反応混合物中に懸濁し、油中水エマルジョンに封入する。エマルジョンは、熱安定油相によって封入された、約60〜200μm直径の分離した水性微液滴からなる。好ましくは、各微液滴は、増幅反応溶液(即ち、核酸の増幅に必要な試薬)を含む。増幅の具体例はPCR反応混合物(ポリメラーゼ、塩、dNTPs)及び一対のPCRプライマー(プライマーA及びプライマーB)である。図1Aを参照されたい。微液滴集団のサブセットは、又、DNAテンプレートを含むDNAビーズを含む。微液滴のサブセットは、増幅のための基礎である。このサブセット中にないマイクロカプセルは、テンプレートDNAを有さず、増幅に関与しない。一実施形態において、増幅技法はPCRであり、PCRプライマーは、合成PCRを実施するために、8:1又は16:1の比で存在する。
【0076】
全体を見渡すと、DNAは、ビーズに固定されるオリゴヌクレオチド(プライマーB)にアニーリングされる。サーモサイクリングの際に(図1B)、一本鎖DNAテンプレートと、ビーズ上に固定されたBプライマーとが破砕され、テンプレートは周囲のマイクロカプセル溶液中に放出される。この場合、増幅溶液、PCR溶液は、追加のプライマーA及びBを加えて含む。溶液相プライマーについて、固定プライマーよりも早い結合反応速度で、溶液相のBプライマーは、テンプレートの相補的b’領域と容易に結合する。初期段階のPCRにおいては、A及びBの両方の鎖は同様に増幅される(図1C)。
【0077】
中間相(midphase)PCR(即ち10〜30サイクル)によって、Bプライマーは消耗し、指数関数的増幅は停止する。次いで、反応は不斉増幅に入り、アンプリコン集団はA鎖によって支配される(図1D)。PCRの後期においては(図1E)、30〜40サイクル後、不斉増幅は溶液中のA鎖の濃度を上昇させる。過剰のA鎖は、ビーズに固定されたBプライマーにアニーリングを開始する。次いで、熱安定ポリマーはテンプレートとしてA鎖を使用し、アンプリコンの、固定されたビーズに結合したB鎖を合成する。
【0078】
PCRの最後の段階においては(図1F)、連続した熱サイクリングは、ビーズに結合したプライマーを更にアニーリングさせる。溶液相増幅は、この段階で最小になるが、固定されたB鎖の濃度は上昇する。次いで、エマルジョンが破壊し、変性(熱、pH等によって)によって固定された生成物が、相補的なA鎖が除去された一本鎖となる。Aプライマーは、固定された鎖のA’領域にアニーリングし、固定された鎖が配列決定酵素、及び必要な補助タンパク質に保持される。次いで、広く認められているピロリン酸技法を使用して、ビーズの配列を決定する(例えば、全体として、本明細書に参考文献として組み入れられる、米国特許第6,274,320号、第6,258,568号及び第6,210,891号に開示されている)。
【0079】
好ましい実施形態において、増幅のために使用されるプライマーは2つの部分、即ち、5’部分及び3’部分を含む。プライマーの3’部分は標的特異的配列(図2参照)を含み、PCRプライマーの機能を果たす。プライマーの5’部分は配列決定法又は固定法に有用な配列を含む。例えば、図2においては、増幅に使用される2種のプライマーの5’部分は、ビーズ上のプライマー又は配列決定プライマーの相補的な配列(標識された454フォワード及び454リバース)を含む。即ち、フォワード又はリバース配列を含む5’部分は、アンプリコンが、フォワード又はリバース配列に相補的な、固定されたオリゴを含むビーズに接着することを可能にする。更に、配列決定反応は、フォワード及びリバースプライマー配列に相補的な配列決定プライマーを使用して開始する。従って、2つの部分のプライマーの5’部分に相補的な配列を含むビーズの1つのセットが全ての反応において使用される。同様に、2つの部分のプライマーの5’部分に相補的な配列を含む配列決定プライマーの1つのセットが、2つの部分のプライマーを使用して製造された任意のアンプリコンの配列を決定するために使用される。最も好ましい実施形態において、増幅に使用される2つの部分のプライマーセットは、図2に示す、454フォワード及び454リバースプライマー等の、5’部分の同一のセットを有する。この場合、全てのアンプリコンは、5’部分に相補的なオリゴでコーティングされた標準的ビーズを使用して解析することができる。同じオリゴ(ビーズに固定されているか、固定されていない)を、配列決定オリゴとして使用することができる。
【0080】
エマルジョンの破壊及びビーズの回復
テンプレートの増幅に続き、エマルジョンを「破壊」する(当業界では「抗乳化」とも称する)。エマルジョンを破壊する多くの方法があり(例えば、米国特許第5,989,892号及びそれに引用されている文献を参照)、当業者は適当な方法を選択することができる。エマルジョンを破壊する、1つの好ましい方法は、実施例の項で詳述する。
【0081】
エマルジョンが破壊された後、次いで、増幅されたテンプレートを含むビーズを、例えば、既知の技術による配列毛低反応において使用される水溶液に再懸濁する(Sanger,F.ら,Proc.Natl.Acad.Sci.U.S.A.75,5463−5467(1977);Maxam,A.M.及びGilbert,W.Proc.Natl Acad Sci USA 74,560−564(1977);Ronaghi,M,et.al.,Science 281,363,365(1998);Lysov,I,et.al.,Dokl Akad Nauk SSSR 303,1508−1511(1988);Bains W.及びSmith G.C.J.TheorBiol 135,303−307(1988);Drnanac,R.ら,Genomics 4,114−128(1989);Khrapko,K.R.ら,FEBS Lett 256.118−122(1989);Pevzner P.A.J Biomol Struct Dyn 7,63−73(1989);Southern,E.M.ら,Genomics 13,1008−1017(1992)を参照)。b−ずが、ピロリン酸をベースとする配列決定反応(例えば、全てにおいて、本明細書に参考文献として組み入れられる、米国特許第6,274,320号、第6,258,568号及び第6,210,891号に開示されている)に使用される場合、PCR産物の第二の鎖を除去し、配列決定プライマーを、ビーズに結合する単一の標準的テンプレートとアニーリングする必要がある。
【0082】
この点において、ビーズ上で増幅されたDNAは、ビーズ上で直接的に、又は異なる反応容器内で配列決定される。本発明の一実施形態において、DNAは、ビーズを反応容器に移し、DNAを配列決定反応(例えば、ピロリン酸又はサンガー法)にかけることによって、ビーズ上で直接的に配列決定される。又、ビーズを単離し、各ビーズを除去し、配列決定することができる。何れの場合にも、配列決定段階は、それぞれの個々のビーズ上で実施することができる。
【0083】
3.核酸の配列決定方法
本発明によれば、第二ポリヌクレオチド分子の複数又は集団のそれぞれ、又は任意に第三ポリヌクレオチド分子の複数又は集団のそれぞれがヌクレオチド配列決定にかけられる。第二の(及び任意に第三の)ポリヌクレオチド分子の配列は、2〜数十億、好都合には約100以上、約1,000以上、約10,000以上、約100,000以上、約百万以上、又は約十億以上の範囲で、本発明の方法によって決定される。配列が、少なくとも2つの連続したヌクレオチド、好ましくは少なくとも5個、少なくとも約25個、少なくとも約50個、少なくとも約100個、少なくとも約150個、少なくとも約200個、少なくとも約300個、少なくとも約500個、少なくとも約1,000個、少なくとも約5,000個、少なくとも約10,000個、又は少なくとも約100,000個の連続したヌクレオチドを含み、各第二の(又は任意に第三の)ポリヌクレオチド分子のそれぞれから決定される。
【0084】
当業者は、ポリヌクレオチドの配列決定のための幾つかの方法に精通している。それらには、サンガー法(ジデオキシ配列決定とも称する)及びMetzger(Metzger ML 2005,Genome Research 1767)により概説された、種々の合成による配列決定(sequencing−by−synthesis)(SBS)法、ハイブリダイゼーションによる配列決定、連結による(例えば、WO2005/021786))、分解による(例えば、米国特許第5,622,824号及び第6,140,053号)及びナノポアの配列決定が含まれるが、これらに限定されない。
【0085】
選択したアプローチが、単一のポリヌクレオチド分子の配列決定、又は任意に前記単一のポリヌクレオチド分子からの増幅によって誘導されるクローンポリヌクレオチド集団の配列決定をもたらす限りは、当前記技術分野で既知のポリヌクレオチド増幅及び配列決定方法は本発明に使用することができる。微生物のクローニングによるのと対照的に、任意の増殖はインビトロで起こる。
【0086】
特定の実施形態において、ポリヌクレオチドの配列決定は、合成による配列決定(SBS)として言及される方法の任意の群によって達成される。SBSは、ポリヌクレオチド又はポリヌクレオチドの集団における1つ以上のヌクレオチドの同一性を検出する方法であって、ヌクレオチド配列が決定されている、テンプレートポリヌクレオチドに相補的なポリヌクレオチド一本鎖の段階的な合成を含む方法を意味する。オリゴヌクレオチドプライマーは、予め決められた、試料テンプレート分子の相補的な部分とアニーリングするように設計されている。プライマー/テンプレート複合体は、核酸ポリメラーゼ酵素の存在下、ヌクレオチドと共に存在する。ヌクレオチドが、オリゴヌクレオチドプライマーの3’末端に直接隣接する試料テンプレート分子上の位置と相補的である場合、ポリメラーゼは、ヌクレオチドを使用してプライマーを伸長する。又、プリマー/テンプレート複合体は、対象となる全てのヌクレオチド(通常、A、G、C及びT)と、オリゴヌクレオチドプライマーの3’末端と直接隣接する試料テンプレート分子上の位置と相補的なヌクレオチドと同時に存在する。何れかのシナリオにおいて、ヌクレオチドは化学的にブロックされ(3’−O位等で)、更に伸長するのが阻止され、合成の次のラウンド前にブロックを解除する必要がある。ヌクレオチドの何れかの挿入は、当前記技術分野で既知の種々の方法、例えば、例えば、化学発光により、又はヌクレオチドと結合した検出可能な標識を使用することにより、ピロリン酸(PPi)の放出を検出することによって(米国特許第6,210,891号、第6,258,568号、及び第6,828,100号)検出することができる。検出可能な標識には、質量タグ(例えば、米国特許第5,622,824号及び第6,140,053号)及び蛍光又は化学発光標識が含まれる。検出可能な標識は、直接的又は間接的にヌクレオチドに結合する。蛍光標識の場合においては、標識は、外部からの光刺激によって直接、又は蛍光(FRET)又は化学発光(LRET)供与体(米国特許第6,982,146号)によって間接的に励起される。検出可能な標識の検出後、それに続く標識からのシグナルを妨害せず、又は混合しないように、標識を不活性化し、又は反応物から分離する。標識の分離は、例えば、化学的切断(例えば、米国特許出願公開第2003/0124594号)又は光開裂によって達成することができる。標識の不活性化は、例えば、光退色によって達成することができる。本発明によれば、当前記技術分野で既知のSBS法が、第二ポリヌクレオチド、又は第三のポリヌクレオチドの集団の配列決定に使用される。
【0087】
本発明によれば、ポリヌクレオチドの配列決定は、又、ナノポアをベースとする方法によっても達成することができる。ナノポアの配列決定の基礎をなす原理は、一本鎖DNA又はRNA分子が、分子が、厳密な直線様式で孔を横切るという方法で、ナノスケールの孔を通じて電気泳動的に実施できることである。転移する分子が、部分的にナノポアを妨害又はブロックするので、それは、孔の電気的性質を変える。電機的性質における変化は、ヌクレオチド配列に依存し、測定することができる。ナノポアはタンパク質分子を含んでもよければ、固相であってもよい。ナノポアをベースとする方法の1つの利点は、非常に長い読み取り長を達成することができ、例えば、1,000,10,000、100,000の連続したヌクレオチドが、単一の分子から読み取ることができる。ナノポアによるポリヌクレオチドの特徴付けの方法は、例えば、米国特許出願公開第2006/0063171号、第2006/0068401号、及び第2005/0202444号に開示されている。
【0088】
配列決定の一方法は、ピロリン酸をベースとする配列決定として言及されるSBS法である。ピロリン酸をベースとする配列決定においては、試料DNA配列及び伸長プライマーを、ヌクレオチド三リン酸の存在下、ポリメラーゼ反応にかけ、それによって、標的位置中の塩基と相補的である場合、ヌクレオチド三リン酸は取り込まれ、放出されるのみであり、ヌクレオチド三リン酸は、試料−プライマー混合物の一定量、又は同じ試料−プライマー混合物を連続的に分離するように添加される。次いで、ヌクレオチドの取り込みを示すPPiの放出を検出する。
【0089】
一実施形態において、配列決定産物の領域は、配列決定プライマーをテンプレート核酸の領域とアニーリングし、配列決定プライマーをDNAポリメラーゼ及び既知のヌクレオチド三リン酸、即ち、dATP、dCTP、dGTP、dTTP又はこれらのヌクレオチドの類似体と接触させることによって決定される。配列は、以下に記載するような、反応の副生物の配列を決定することによって決定することができる。
【0090】
増幅された核酸テンプレートの領域に特異的にアニーリングすることができる限りは、配列決定プライマーは、任意の長さ又は塩基組成であってもよい。増幅されたテンプレート核酸上の領域を特異的にプライミングすることができる限りは、配列決定プライマーについての特定の構造は必要でない。好ましくは、配列決定プライマーは、特徴付けすべき配列と、アンカープライマーとハイブリダイズする配列との間のテンプレートの領域と相補的である。配列決定プライマーはDNAポリメラーゼを使用して伸長され、配列決定産物を形成する。伸長は、1つ以上のタイプのヌクレオチド三リン酸、所望であれば、結合補助タンパク質の存在下に実施される。
【0091】
dNTPの取り込みは、好ましくは、配列決定副生物の存在を検定することによって検出される。好ましい実施形態において、配列決定副生物のヌクレオチド配列は、dNMPが伸長された配列決定プライマーに取り込まれるように、ヌクレオチド三リン酸(dNTP)から遊離する無機ピロリン酸(PPi)を測定することにより決定される。Pyrosequencing(登録商用)技術(PryoSequencing AB,Stockholm,Sweden)と命名された、この配列決定法は、溶液中で(液相)又は固相技法として実施することができる。PPiをベースとする配列決定方法は、一般的に、例えば、WO9813523A1、Ronaghi,et.al.,1996,Anal.Biochem.242:84−89,Ronaghi,et.al.,1998.Science 281:363−365(1998)及び米国特許出願公開第2001/0024790号に開示されている。PPi配列決定のこれらの開示は、全体として、参考文献として本明細書に組み入れられる。例えば、完全に、本明細書に参考文献として組み入れられる米国特許第6,210,891号及び第6,258,568号を参照されたい。
【0092】
好ましい実施形態において、DNAの配列決定は、全て2004年1月28日に出願された、同時継続特許出願USSN:10/768,729、USSN:10/767,779、USSN:10/767,899、及びUSSN:10/767,894に開示されている、454corporation(454 Life Science)の配列決定装置及び方法を使用して実施される。
【0093】
特に定義しない限り、本明細書で使用される全ての技術的及び科学的用語は、本発明が属する分野の当業者によって通常に理解されるのと同じ意味を持つ。一般的に理解される定義は、2003年6月6日に出願されたUSSN:60/476,602、2003年6月6日に出願されたUSSN:60/476,504、2003年1月29日に出願されたUSSN:60/443,471、2003年6月6日に出願されたUSSN:60/476,313、2003年6月6日に出願されたUSSN:60/476,592、2003年4月23日に出願されたUSSN:60/465,071、2003年8月25日に出願されたUSSN:60/497,985、2004年1月28日に出願されたUSSN:10/767,779、2004年1月28日に出願された10/767,899、2004年1月28日に出願されたUSSN10/767,894に定義されたものを含む。全ての特許、特許出願、及びこの出願に引用された文献は、完全に本明細書に参考文献として組み入れられる。
【実施例】
【0094】
実施例1 HLA遺伝子座の配列決定
5種のPCRプライマー対を、MHCクラスII遺伝子座における公的に開示されたSNPの既知の長さに設計した。入力として標的領域を含む、約200塩基対長のゲノム配列を使用して、Primer3ソフトウェア(Whitehead Institute for Biomedical Research)を使用して、プライマーを設計した。各プライマーは、20〜24塩基の長さの遺伝子座特異的な3’部分、及び4塩基キー(太字における重要点)を含む一定の19塩基の5’部分(小文字で示す)からなる。プライマーは、Integrated DNA Technologies(Coralville,IA)から購入した。
【0095】
【化1】

4人の個体由来のヒトゲノムDNA(Cornell Medical Institute for Research,Camden,NJ)を260nmの吸光度に基づいて定量し、100ng(約15,000ハプロイドゲノム等量)を、各PCR増幅反応のためのテンプレートとして使用した。PCR反応を、標準的反応条件下(60mM Tris−SO、pH8.9、18mM(NHSO、2.5mM MgSO、1mM dNTPs、0.625μMの各プライマー、4.5ユニットのPlatinum Taq High Fidelityポリメラーゼ(Invitrogen,Carlsbad,Ca))で、以下の温度プロフィール、即ち、94℃、3分;94℃、3秒の30サイクル、57℃、45秒、72℃、1分;72℃、3分で実施した。増幅産物を、QiaQuick PCR 精製キット(Qiagen,Valencia,CA)を使用して生成し、予想されるサイズ(156〜181塩基対)を、500DNA LabChip(登録商標)(Agilent Technologies,Inc,Palo Alto,CA)を使用した、2100BioAnalyzer微小流体装置を使用して確認した。精製したアンプリコンを、PicoGreen(登録商標)dsDNA定量キット(Molecular Probes,Eugene,OR)を使用して定量し、10コピー/μLに希釈した。
【0096】
増幅プライマーSAD1F(GCC TCC CTC GCG CCA(配列番号:11))及びSAD1R及びSADR1(GCC TTG CCA GCC CGC(配列番号:12))捕獲プライマー(Amersham BioScience,Piscataway,NJ)を有するセファロース捕獲ビーズを使用して、ビーズ当たり0.5アンプリコンで、前述したように、EBCA(エマルジョンをベースとする増幅)を実施した。エマルジョンの破壊及びPicoTiterプレート上の配列決定を含む、全ての操作は、前述したように実施した。
【0097】
実施例2 感受性の変異体検出
少量の配列変異体、特に単一の塩基置換を検出するための最新のシステム(即ち、454プラットフォーム)の能力を証明するため、種々の比で混合された既知の対立遺伝子配列決定するために実験を設計した。
【0098】
前記に記載した6種のプライマー対を、増幅効率について試験し、全てが別個の増幅産物を生成するSAD1F/R−DD14、SAD1F/R−DE15、及びSAD1F/R−F5の対(図3)を使用して更なる解析を実施した。合計8種のヒトゲノムDNA試料を増幅し、454プラットフォーム上で配列決定し、各遺伝子座について遺伝型を決定した。実験的セットアップを単純化するため、プライマー対SAD1F/R−DD14(図3A)、及び特定の遺伝子座でC又はT対立遺伝子の何れかについてヘテロ接合性を示した2個の試料を使用して、全ての更なる解析を実施した。
【0099】
各試料由来の一次アンプリコンを定量し、10:90〜1:1,000の範囲の特定の比、通常はT対立遺伝子過剰で混合した。混合した後、試料を2×10コピー/μLの作用濃度まで希釈し、EBCAにかけ、454プラットフォーム上で配列決定した。図2はT対立遺伝子への1:500及び1:1,000に近い比におけるC対立遺伝子の混合物から得られた配列決定データを示す。何れの場合にも、おおよそ10,000の高品質の配列読み取りが生成され、Blast解析にかけ、基準配列に対するヌクレオチド置換を特定した(この場合、T対立遺伝子が配列を保有する)。結果を可視化するために、置換頻度を基準配列に対してカラーコード様式でプロットした。データは、両方の試料において、低頻度の単一塩基置換が容易に特定されることを証明した(図4A〜C)。更に、バックグラウンドは、バックグラウンド除去法を許容しながら、試料の間で相対的に一致していることがわかった。これは、10を超える1:1,000の対立遺伝子について考えても、通常に信号対雑音比を生成した(図5A及びB)。既知の遺伝型の試料を使用した追加の実験は、少なくとも0.1%多いレベルまで、単一ヌクレオチド置換を検出能力が落ちることを確認した。少量の変化における更なる信頼性は、両方向でのテンプレートの配列決定から得ることができる。通常、2種の種の独立的な両方向のデータセット由来の頻度間の相違は、1%量のレベルに下がるまで20%以内である。
【0100】
対立遺伝子の広い範囲を超えた線形応答を証明するため、DD14HLA遺伝子座由来のT及びC対立遺伝子を表わすアンプリコンを、1:10、1:20、1:50及び1:200(10%、5%、2%及び0.5%)の比で混合し、EBCA増幅し、配列決定した。図6は、低頻度の対立遺伝子の相対数における線形上昇が、前記範囲を通じて得られたことを示す(R=0.9927)。記録された絶対頻度は、いくらか意図された比に由来し(下記表を参照)、DNAの一定量及び少量の混合物を正確に定量するために試みる通常に得られる相違に寄与する。
【0101】
【化2】

図6のグラフを作成するために使用された配列決定の概要。2〜5列目の数字が、配列決定されるテンプレートの合計数、各対立遺伝子の期待値及び測定値を示す。
【0102】
実施例3 細菌の16Sプロジェクト−細菌の集団を試験するための方法
細菌集団の調査は、医学、環境及び農業研究に加え、産業用プロセス制御を含む多くの分野についての本質的な応用である。細菌種を区別するための1つの共通の方法は16SリボソームRNAを使用する(Jonasson,Olofsson,et.al.,2002;Grahn,Olofsson,et.al.,2003)。他の方法は、同様に、16S及び23SリボソームRNA遺伝子の間に入る配列を調べる(Garcia−Martinez,Bescos,et.al.,2001)。しかし、大多数の研究者は、現在の試料調製及び配列決定技法を使用した、複雑な細菌集団の完全な調査は不可能であることを見出した。このようなプロジェクトについての必要労働量は、非常に高いか、集団の副標本抽出を強制する。
【0103】
一般的に、高処理能力の方法は、細菌の集団を試験するために日常的に使用されない。一般的な方法は、その後にサブクローニングされ配列決定される16SリボソームRNA遺伝子を増幅するために一般的なプライマーを使用する。制限酵素による消化は、同一の制限パターンを示すベクターを排除することによって、配列付加を減少させるために、ベクターにおいて、しばしば実施される。得られた配列を、種々の生物由来の既知の遺伝子のデータベースと比較する。集団組成の評価は、種又は属に特異的な遺伝子の存在から結論が出る。本発明の方法は、クローニング及び制限酵素による消化の段階を排除することで人件費を徹底的に減少することによって、16S(及びおそらく遺伝子間及び23S)RNA領域からの完全配列を供給することによって情報の出力を増加し、以前は入手しにくかった亜株の区別を潜在的に可能にし、オーバーサンプリングされた配列を相対的に多量に変換することによって種密度を評価の潜在的に供給し、細菌の集団の研究を根本的に変える可能性を有する。
【0104】
核酸配列決定の、好ましい一方法は、454Life Sciencesによって開発された、ピロリン酸をベースとする配列決定法である。大規模並列454技術の全ての特徴と組み合わせた本発明の方法の利用は、処理能力を大いに上昇し、同一性の特定の費用を減少することができる。454技術は、多くの個々のPCR産物のクローニングの必要性を排除し、小さいサイズの16S遺伝子(1.4kb)は、10,000個の試料を同時に処理することを可能にする。前記処理は、以下に概要を述べる方法で首尾よく証明される。
【0105】
最初に、大腸菌(Escherichia coli)の16S DNAを、E.coli TOP10のコンピテント細胞(Invitrogen,Carlsbad,CA)から得、PCR2.1ベクターに形質転換し、LB/アンピシリン(50μg/mL)プレートに播種し、37℃で一晩インキュベートした。1個のコロニーを選び、3mLのLB/アンピシリン液体培地に播種し、250RPM、37℃で6時間振盪した。1μLのこの溶液を、16S配列のV1及びV3領域を増幅するためのテンプレートとして使用した。
【0106】
16S遺伝子中の2箇所の変異体領域について2つの部分からなるPCRプライマーを設計し、Monstein,et.al.,(Monstein,Nikpour−Badr,et.al.,2001)に記載されたようにV1及びV3と命名した。454に特異的な、19塩基(15塩基増幅プライマー、3’に続く4塩基(TCGA)キー)のフォワード又はリバースプライマーを、可変のV1及びV3領域に隣接する、領域特異的フォワード及びリバースプライマーと融合させた。これは、5’−(15塩基フォワード又はリバース増幅プライマー)−(4塩基キー)−(フォワード)又はリバースV1又はV3プライマー)−3’として表わされる。16Sアンプリコンを生産するために使用されるプライマーは、大文字で表されるV1又はV3特異的プライマー、太字でキーを特定する4塩基、及び454増幅プライマーを示す小文字を含む、以下の配列を含む。
【0107】
【化3】

V1及びV3アンプリコンは、以下の試薬、即ち、1×HiFi緩衝液、2.5mM MgSO(Invitrogen)、1mM dNTPs(Pierce,Milwaukee WI)、1μMの、V1又はV3領域の何れかについての2つの部分からなる各フォワード及びリバースプライマー(IDT,Coralville,IA)、0.15U/μLのPlatinum HiFi Taq(Invitrogen)を含むPCR反応中で別々に生成された。1μLの、E.coliのLB/アンピシリン液体培地を反応混合物に加え、35サイクルのPCR(94℃に30秒間、55℃に30秒間、及び68℃に150秒間、最後に10℃に無限に持続)を実施した。次いで、1μLの増幅反応混合物をAgilent 2100 Bioanalyzer(Agilent,Palo Alto,CA)で流し、最終産物の濃度を評価し、V1について155bp、V3について145bpの適切なサイズが生成されたことを確認した。
【0108】
次いで、V1及びV3産物を一緒にし、DNA捕獲ビーズ当たり0.5〜10テンプレート分子の範囲の濃度のテンプレートで乳化し、以下の項におけるEBCAプロトコールに概要を示したようなEBCA(エマルジョンをベースとするクローン増幅)法により増幅した。次いで、得られたクローン増幅ビーズを、454Genome Sequencer(454 Life Sciences,Branford CT)で配列決定した。
【0109】
増幅されたビーズから得られた配列を、大腸菌の16S遺伝子配列(Entrez gil74375)に対して一列に並べた。各配列についての配列スコアを計算することにより、容認できる(又はマップされる)配列を、容認できない(又はマップされない)配列から区別した。スコアは、得られたシグナルが予想されるホモポリマーに相当する可能性の平均対数であるか、又は
【0110】
【化4】

(式中、Sは計算された配列スコアであり、Pは固有の流量での可能性であり、sは前記流量におけいて測定されたシグナルであり、hは前記流用で予想される基準ホモポリマーの長さであり、Nは流れ配列(flows aligned)の合計数である)である。次いで、各配列についての配列スコアを最大配列スコア、又はMASと比較し、MASより小さい配列スコアを「リアル」と判断し、出力ファイルに印刷した。このプロジェクトのため、1.0のMAS(95%同一とおおよそ同等)を使用した。
【0111】
V1特異的プライマーを使用して生成された配列について、13702個の生成された配列のうち、87.75%又は11973個の読み取りが1.0未満の配列スコア、及び21塩基以上の読み取り長でゲノムとマップした。1.6Kbの16S遺伝子断片に対する読み取りマッピングの位置を示すグラフ表示を図7Aに示し、16S遺伝子の最初の100塩基に対する、おおよそ12,000の読み取りマッピングを示す。
【0112】
16Sデータベース(http://greengenes.1lnl.gov)に対する修飾されていないコンセンサス配列
【0113】
【化5】

は、最初の既知の生物として大腸菌と適合した。
【0114】
【化6】

V1コンセンサス配列を、
【0115】
【化7】

に編集し、非常に低い信頼性スコアに基づき、ホモポリマーストレッチの9位における4番目の“T”(太字及び下線で印をつけた)を再調査し除去した。編集したV1配列のBLAST結果は、大腸菌16S遺伝子に対して向上したヒットを証明した。
【0116】
【化8】

V3特異的プライマーを使用して、同様の結果が得られた。17329個の読み取りのうち、71.00%が、前述した5種のV1テンプレートを使用したような同一の解析条件下で16S基準ゲノムにマップした。これは、マップしたV1読み取りの87.75%よりも低く、これは、V1試料及び基準配列の間よりも、V3試料及び基準配列の間に大きい分岐を示す。図7Bに示すように、コンセンサス配列:
【0117】
【化9】

は、基準ゲノムの領域966〜1067とマップする。
【0118】
V1配列と異なり、修飾されていないコンセンサス配列からのBLASTの結果は、最初の既知の生物としての大腸菌と適合しなかったが、むしろ第二の生物として適合した。
【0119】
【化10】

コンセンサス配列を、信頼性スコア及び再BLASTに基づき再調査し、
【0120】
【化11】

に編集した。BLASTは、大腸菌に対して生じる、最も高く位置付けられるヒットをもたらした。
【0121】
【化12】

処理されていない細菌細胞(大腸菌細胞を飽和状態まで増殖し1:1,000の細菌培養液希釈液1μLを、テンプレートの代わりにEBCA反応混合物に加えたもの)における混合PCRプライマーの使用能力を証明するために第二の実験を実施した。EBCA反応に使用されたプライマーは、V1及びV3特異的な二部プライマーを、それぞれ0.04μM、及びそれぞれ0.625及び0.04μMでフォワード及びリバース454増幅プライマーを含む。そうでなければ、EBCAプロトコールは以下に示す。
【0122】
データは、V1及びV3領域が、未処理の細菌細胞のプールから首尾よく増幅し、配列決定し同時に区別できることをしめした。1584個の読み取りのうち、87.66%が16S基準ゲノムと、図7Cに示す、特有のV1及びV3位に位置する配列でマップした。
【0123】
V1及びV3配列の両方の100個の読み取りをプールし、生のシグナルデータを二進法の文字列に変化することにより評価した。即ち、1は塩基が既知の流れに存在しており、0は存在しないことを示す。“A”、“AA”及び“AAAAA”(配列番号:29)が、全て1の同一スコアを受けられるように、ホモポリマーストレッチは、単一の正の値に折りたたまれる。ついで、折りたたまれた二進法の文字列は、R統計パッケージ(Team 2004)における、階層的に秩序化された分割及び崩壊ハイブリッド(HOPACH)法(Pollard及びvan der Laan 2005)によりクラスター形成された。図8に示すように、得られた系統樹は、200個の配列の1個を除き、V1(短い長さの赤い標識)及びV3(長い長さの青い標識)配列の間を明らかに識別する。
【0124】
同一生物中の同じ遺伝子に由来する2つの同じ領域を明確に識別する能力は、この技術が、異なる生物に由来する可変領域を識別し、有益な診断手段を提供することに熟練していることを証明しなければならないことを示唆している。
【0125】
実施例4 EBCAプロトコール
4.1 DNA捕獲ビーズの調製
1mLのN−ヒドロキシスクシンイミドエステル(NHS)で活性化したセファロースHPアフィニティーカラム(Amersham Biosciences,Piscataway,NJ)由来の充填ビーズを、製品のカタログ(Amersham Pharmacia Protocol #7100600AP)に記載されたように、カラムから除去し、活性化した。36及び25μmのポアフィルターメッシュ部分を連続的に通過させることによって、25〜36μmのビーズを選択した後、20mMリン酸緩衝液pH8.0中の、25μLの、1mMのアミンで標識したHEG捕獲プライマー(5’−アミン−3 シーケンシャル18原子ヘキサ−エチレングリコールスペーサーCCATCTGTTGCGTGCGTGTC−3’(配列番号:30)(IDT Tcchnologies,Coralville,IA,USA)をビーズと結合させた。最初のフィルターを通過するが、第二のフィルターによって保持されるDNA捕獲ビーズをビーズ保存緩衝液(50mM Tris,0.02% Tween,0.02%アジ化ナトリウム、pH8)に集め、Multisizer 3 Coulter Counter(Beckman Coulter,Fullerton,CA,USA)を使用して定量し、必要になるまで4℃に保存した。
【0126】
4.2 DNA捕獲ビーズに対する結合テンプレート種
テンプレート分子を、UV処理した層流フード中でDNA捕獲ビーズ上の相補的なプライマーとアニーリングした。ビーズ保存緩衝液中に懸濁した、60万個のDNA捕獲ビーズを200μLのDNAチューブに移し、卓上小型遠心機で10秒間遠心し、チューブを180°回転させ、更に10秒間回転させ、沈殿の形成を完全確実にした。次いで、上清を除去し、ビーズを、200μLのアニーリング緩衝液(20mM Tris,pH7.5及び5mM 酢酸マグネシウム)で洗浄し、5秒間撹拌し、ビーズを再懸濁し、前記のように沈殿にした。全てであるが、約10μLのビーズ上の上清を除去し、更に200μLのアニーリング緩衝液を加えた。ビーズを、更に5秒間撹拌し、1分間静置し、次いで前記のように沈殿にした。全てであるが、10μLの上清を捨て、0.48μmLの、2×10分子/μLのテンプレートライブラリーをビーズに加えた。チューブを5秒間撹拌し、成分を混合し、次いで、テンプレートを、MJサーモサイクラー(80℃で5分間、次いで0.1℃/秒で70まで下降させ、70℃で1分間、0.1℃/秒で60℃まで下降させ、60℃に1分間維持し、0.1℃/秒で50℃まで下降させ、50℃に1分間維持し、0.1℃/秒で20℃まで下降させ、20℃に維持する))中で実施される制御された変性/アニーリングプログラム中のビーズとアニーリングさせた。アニーリング処理の完了により、ビーズを必要になるまで氷上で保存した。
【0127】
4.3 PCR反応混合物調製及び製剤
汚染の可能性を減少するため、PCR反応混合物を、PCRクリーンルーム中に配置された、UV処理された層流フード中で調製した。それぞれ600,000のビーズエマルジョンPCR反応について、1.5mLのチューブ中に225μLの反応混合物(1×Platinum HiFi緩衝液(Invitrogen)、1mM dNTPs(Pierce)、2.5mM MgSO(Invitrogen)、0.1%アセチル化された、分子生物学グレードのBSA(Sigma)、0.01% Tween−80(Acros Organics)、0.003U/μLの熱安定性ピロホスファターゼ(NEB)、0.625μMのフォワード(5’−CGTTTCCCCTGTGTGCCTTG−3’)(配列番号:31)及び0.039μMのリバースプライマー(5’−CCATCTGTTGCGTGTC−3’)(配列番号:32)(IDT Technologies,Coralville,IA,USA)及び0.15U/μLのPlatinum Hi−Fi Taqポリメラーゼ(Invitro))を調製した。25μLの反応混合物を除去し、陰性コントロールとして使用するために個々の200μLのPCRチューブに保存した。反応混合物及び陰性コントロールの両方を、必要になるまで氷上で保存した。更に、各エマルジョンについて、240μLのモック増幅混合物(1×Platinum HiFi緩衝液(Invitrogen)、2.5mM MgSO(Invitrogen)、0.1%BSA、0.01% Tween)を1.5mLチューブ中で調製し、必要になるまで室温にて同様に保存した。
【0128】
4.4 乳化及び増幅
1μL当たり10,000個の別々のPCRマイクロリアクター(単一分子のマトリックス、標的ライブラリーの個々の分子のクローン増幅として供給される)を使用して、耐熱性の油中水型エマルジョンを形成した。単一の反応のための反応混合物及びDNA捕獲ビーズを以下の方法、即ち、UV処理した層流フード中で、200μLのPCR溶液を、600,000個のDNA捕獲ビーズを含むチューブに加える方法で乳化した。ピペットの繰り返し作用によりビーズを再懸濁し、次いで、PCR−ビーズ混合物を室温に少なくとも2分間静置し、ビーズをPCR溶液と平衡化した。一方で、400μLのエマルジョンオイル(60%(w/w)のDC749Fuid(Dow Chemical Co,Midland,MI)、及び30%(w/w)のAr20 Silicone Oil(Sigma))を、上部が平たい2mLのチューブ(Dot Scientific)に一定量入れた。次いで、240μLのモック増幅混合物を、400μLのエマルジョンオイルに加え、チューブにしっかりとキャップをし、TissueLyser MM300(Retsch GmbH & Co.KG,Haan,Germany)の24ウェルのTissueLyser Adaptor(Qiagen)に入れた。エマルジョンを、25振動/秒で5分間ホモジナイズし、反応を更に安定化させる、非常に小さいエマルジョン、又は「超微粒子」を生成した。
【0129】
微粒子形成の際に、160μLのPCR増幅混合物を、アニーリングしたテンプレート及びDNA捕獲ビーズの混合物に加えた。一緒にしたビーズ及びPCR反応混合物を手短く撹拌し、2分間平衡化させた。微粒子が形成された後、増幅混合物、テンプレート及びDNA捕獲ビーズを、乳化した物質に加えた。TissueLyser速度を15振動/秒に減少し、反応混合物を5分間ホモジナイズした。より低い均質化速度は、DNA捕獲ビーズ及び増幅混合物を十分な量で含む、100〜150μmの平均直径を有する水滴を油混合物中に形成する。
【0130】
エマルジョンを、PCRチューブ7〜8個に、それぞれ約80μL含むように分割して入れた。チューブを封入し、前に製造した、25μLの陰性コントロールと一緒にMJサーモサイクラーに入れた。以下のサイクル時間、即ち1回(94℃に4分間)−加熱開始、40回(94℃に30秒間、58℃に60秒間、68℃に90秒間)−増幅、13回(94℃に30秒間、58℃に360秒間)−ハイブリダイゼーション伸長を使用した。PCRプログラムの完了後、反応物を除去し、エマルジョンをすぐに破壊する(後述する)か、破壊処理の開始前に、反応物を10℃に16時間まで保存する。
【0131】
4.5 エマルジョンの破壊及びビーズの回収
増幅した物質のエマルジョンを含む、それぞれのPCRチューブに、50μLのイソプロピルアルコール(Fisher)を加え、10秒間撹拌し、エマルジョンの粘度を低下させた。チューブを微小遠心管中で数秒間遠心し、チューブのキャップに捕捉された乳化物質を除去した。エマルジョン−イソプロピルアルコールの混合物を各チューブから、16ゲージの先がとがっていない針(Brico Medical Supplies)を取り付けたBD−Diposable Syringe(Fisher Scientific)に回収した。各PCRチューブに追加の50μLのイソプロピルアルコールを加え、前述したように遠心し、シリンジの成分を加えた。シリンジ内の容量はイソプロピルアルコールで9mLに増加し、次いで、シリンジを転倒させ、1mLの空気を吸い込み、イソプロパノールとエマルジョンとの混合を促進した。先のとがっていない針を除去し、15μmポアのNitex Sieving Fabric(Sefar America,Depew,NY,USA)を含む25mmのSwinlockフィルターホルダー(Whatman)をシリンジルアーに付着させ、先のとがっていない針を、Swinlockユニットの反対側に付けた。
【0132】
シリンジの成分を、Swinlockフィルターユニットを通して、緩やかに、しかし完全に、漂白剤を配合した廃棄物容器に放出した。先のとがっていない針及びSwinlockフィルターユニットを通してシリンジ中に、6mLの新鮮なイソプロピルアルコールを入れ、シリンジを10回転倒させ、イソプロピルアルコール、ビーズ及び残りのエマルジョン成分を混合した。シリンジの成分を、再度廃棄物容器に排出し、各洗浄において6mLの追加のイソプロピルアルコールを使用した洗浄工程を2回繰り返した。6mLの、80%エタノール/1×アニーリング緩衝液(80%エタノール、20mM Tris−HCl、pH7.6、5mM酢酸マグネシウム)で洗浄工程を繰り返した。次いで、ビーズを、6mLの、0.1%のTween(0.1% Tween−20、20mM Tris−HCl、pH7.6、5mM 酢酸マグネシウム)を含む1×アニーリング緩衝液で洗浄し、次いで、ピコ純粋な水6mLで洗浄した。
【0133】
最終の洗浄液を廃棄物容器に排出した後、1.5mLの0.1mM EDTAをシリンジ中に入れ、Swinlockフィルターユニットを除去し取りのけておいた。シリンジの成分を、1.5mLの遠心チューブに連続的に移した。チューブを、微小遠心管中で、周期的に20秒間遠心し、ビーズを沈殿させ、上清を除去し、次いでシリンジの残留した成分を遠心チューブに加えた。Swinlockユニットをフィルターに再接続し、1.5mLのEDTAをシリンジ内に加えた。最終的にSwinlockユニットを除去し、ビーズ及びEDTAを遠心チューブに加え、ビーズを沈殿させ、必要に応じて上清を除去した。
【0134】
4.6 二次鎖の除去
捕獲ビーズ上に固定した増幅されたDNAを、塩基性融解溶液中でインキュベーションすることによって二次鎖を除去し、一本鎖とした。ビーズに、1mLの、新たに調製した融解溶液(0.125M NaOH、0.2M NaCl)を加え、中間にセットした、2秒間の撹拌により沈殿を再懸濁し、チューブを、Thermolyne LabQuakeチューブローラーに3分間静置した。次いで、ビーズを前述のように沈殿とし、上清を注意深く除去して捨てた。次いで、残った融解溶液を、1mLのアニーリング溶液(20mM Tris−アセテート、pH7.6、5mM 酢酸マグネシウム)を加えることにより希釈し、次いで、ビーズを中間にセットして2秒間撹拌し、ビーズを沈殿させ、前述のように上清を除去した。遠心後に、800μLのアニーリング緩衝液を除去することを除き、アニーリング緩衝液洗浄を繰り返した。ビーズ及び残ったアニーリング緩衝液を、0.2mLのPCRチューブに移し、すぐに使用するか、又はそれに続く濃縮工程の前48時間まで4℃に保存する。
【0135】
4.7 ビーズの濃縮
ある程度まで、ビーズの質量は、増幅産物を有するビーズ、固定されたDNA鎖を含み、空のビーズは増幅産物を有しない。濃縮工程は、空のビーズを排除し、テンプレートDNAの配列決定可能な量を有する捕獲ビーズを選択的に使用する。
【0136】
卓上型小型遠心機中で10秒間遠心することによって、前の工程由来の一本鎖ビーズを沈殿させ、次いで、チューブを180°回転させ、更に10秒間回転して沈殿の形成を確実にする。次いで、ビーズを妨害することなく、可能な限り多くの上清を除去する。ビーズに、15μLのアニーリング緩衝液を、次いで、2μLの、100μMのビオチニル化された、40塩基のHEG濃縮プライマー(5’ビオチン−18原子ヘキサエチレングリコールスペーサー−CGTTTCCCCTGTCTGCCTTGCCATCTGTTCCCTCCCTGTC−3’(配列番号:33)、IDT Technologies,一緒にした増幅産物、及びビーズに固定したテンプレートの3’−末端部分の配列部位(それぞれ20塩基長)と相補的)を加えた。中間にセットし、2秒間溶液を撹拌して混合し、制御された、変性/アニーリングプログラムを使用して、MJサーモサイクラー中で濃縮したプライマーを、固定したDNA鎖とアニーリングした(65℃に30秒間、0.1℃/秒で58℃まで低下、58℃に90秒間、及び10℃に維持)。
【0137】
プライマーをアニーリングしている間、SeraMag−30磁気ストレプトアビジンビーズ(Seradyn,Indianapolis,IN,USA)をゆっくりと撹拌することにより再懸濁し、1mLの増強溶液(Enhancing Fluid)(2M NaCl、10mM Tris−HCl、1mM EDTA、pH7.5)を含む、1.5mLの微小遠心チューブに、20μLのSeraMaビーズを加えた。SeraMagビーズ混合物を5秒間撹拌し、チューブをDynal MPC−S磁石中に置き、常磁性ビーズを微小遠心チューブの側面に対して沈殿させた。上清を慎重に除去して、SeraMagビーズを妨害せずに捨て、磁石からチューブを除去し、100μLの増強溶液を加えた。チューブを3秒間撹拌し、ビーズを再懸濁し、必要になるまでチューブを氷上に保存した。
【0138】
アニーリングプログラムの完了により、100μLのアニーリング緩衝液を、DNA捕獲ビーズ及び濃縮プライマーを含むPCRチューブに加え、チューブを5秒間撹拌し、成分を、新しい1.5mLの微小遠心チューブに移した。濃縮されたプライマーが捕獲ビーズにアニーリングされているPCRチューブを、200μLのアニーリング緩衝液で1度洗浄し、洗浄溶液を1.5mLのチューブに加えた。ビーズを、1mLのアニーリング緩衝液で3回洗浄し、2秒間撹拌し、前述したように沈殿させ、上清を慎重に除去した。3回目の洗浄後、ビーズを2mLの氷冷した増強溶液で2回洗浄し、撹拌し、沈殿させ、前述したように上清を除去した。次いで、ビーズを150μLの氷冷した増強溶液に再懸濁し、ビーズ溶液を洗浄したSeraMagビーズに加えた。
【0139】
ストレプトアビジンをコーティングしたSeraMagビーズをDNA捕獲ビーズ上に固定されたテンプレートにアニーリングした、ビオチニル化された濃縮プライマーに結合させる間に、ビーズ混合物を3秒間撹拌し、LabQuakeチューブローラー上で3分間室温にてインキュベートした。次いで、ビーズを2,000RPMで3分間遠心し、その後、ビーズが再懸濁されるまでビーズを緩やかに軽くたたいた。次いで、再懸濁したビーズを氷上に5分間静置した。氷上でのインキュベーションに次いで、冷却した増強溶液を、最終容量1.5mLになるようにビーズに加えた。Dynal MPC−S磁石に挿入したチューブ、及びビーズを120秒間そのままにし、磁石に対してビーズを沈殿させ、次いで、上清(過剰のSeraMag及び空のDNA捕獲ビーズを含む)を慎重に除去して捨てた。
【0140】
MPC−S磁石からチューブを除去し、1mLの冷却した増強溶液をビーズに加え、ビーズを緩やかに軽くたたきながら再懸濁した。撹拌がSeraMagとDNA捕獲ビーズとの間の結合を破壊するかもしれないので、ビーズを撹拌することは必須でない。ビーズを磁石に戻し、上清を除去した。この洗浄を更に3回繰り返し、空の捕獲ビーズの除去を確実にした。DNA捕獲ビーズからのアニーリングした濃縮プライマー及びSeraMagビーズを除去するため、ビーズを1mLの融解溶液に再懸濁し、5秒間撹拌し、磁石を使用して沈殿させた。濃縮ビーズを含む上清を1.5mLの別々の微小遠心チューブに写し、ビーズを沈殿させ、上清を捨てた。次いで、濃縮ビーズを、0.1% Tween−20を含む1×アニーリング緩衝液に再懸濁した。ビーズをMPC上に再度沈殿させ、上清を、新しい1.5mLのチューブに移し、残ったSeraMagビーズの最大の除去を確実にした。ビーズを遠心し、次いで、上清を除去し、ビーズを、1mLの1×アニーリング緩衝液で3回洗浄した。3回の洗浄後、800μLの上清を除去し、残ったビーズ及び溶液を、0.2mLのPCRチューブに移した。
【0141】
濃縮工程の平均収率は、エマルジョンに加えたオリジナルのビーズの33%であるか、乳化反応当たり、198,000個の濃縮ビーズであった。60×60mmのPTPフォーマットが、900,000個の濃縮ビーズを必要とするので、5個の、600,000個のビーズエマルジョンを60×60mmのPTPに対して処理し、配列決定を実施した。
【0142】
4.8 配列決定プライマーのアニーリング
濃縮ビーズを、2,000RPMで3分間遠心し、上清を捨て、次いで、15μLのアニーリング緩衝液、及び3μLの配列決定プライマー(100mM SAD1F(5’−GCC TCC CTC GCG CCA−3’(配列番号:34)、IDT Technologies)を加えた。次いで、チューブを5秒間撹拌し、以下の4段階アニーリングプログラム、即ち、65℃に5分間、0.1℃/秒で50℃まで下降、50℃に1分間、0.1℃/秒で40℃まで下降、40℃に1分間維持し、0.1℃/秒で15℃まで下降、15℃に維持、の4段階アニーリングプログラムのMJサーモサイクラー中に配置した。
【0143】
アニーリングプログラムの完了後、ビーズをサーモサイクラーから除去し、10秒間遠心することによって沈殿させ、チューブを180℃回転し、更に10秒間回転させた。上清を捨て、200μLのアニーリング緩衝液を加えた。5秒間の撹拌によりビーズを再懸濁し、前述したようにしてビーズを沈殿させた。上清を除去し、ビーズを100μLのアニーリング緩衝液で再懸濁し、Multisizer 3 Coulter Counterを使用してビーズを定量した。ビーズを4℃に保存し、少なくとも1週間安定であった。
【0144】
4.9 DNAポリメラーゼ、大きな断片及びSSBタンパク質とのDNAビーズのインキュベーション
アピラーゼ(Biotge)(最終活性8.5ユニット/リットル)を、0.1%BSAを含む1倍検定用緩衝液に加えることにより、ビーズ洗浄緩衝液(100mL)を調製した。光ファイバースライドをピコ純粋な水から除去し、ビーズ洗浄緩衝液中でインキュベーションした。90万個の既に調製したDNAビーズを遠心し、上清を伸長に除去した。次いで、ビーズを、0.4mg/mLのポリビニルピロリドン(MW 360,000)、1mM DTT、175μgの大腸菌一本鎖結合タンパク質(SSB)(United States Biochemicals)及び7000単位のBst DNポリメラーゼ、大きい断片(New England Biolabs)を含む、1290μLのビーズ洗浄緩衝液中でインキュベーションした。ビーズを、回転子上で30分間室温にてインキュベーションした。
【0145】
4.10 酵素ビーズ及び微粒子充填材の調製
UltraGlowルシフェラーゼ(Promega)及びBst ATPスルフリラーゼを、ビオチンカルボキシルキャリアータンパク質(BCCP)融合対として組織内で調製した。87個のアミノ酸BCCP領域は、大腸菌内で融合タンパク質のin vivo発現の際に、ビオチンが共有結合するリジン残基を含む。ビオチニル化ルシフェラーゼ(1.2mg)及びスルフリラーゼ(0.4mg)を予め混合し、製造業者の使用説明書に従い、4℃で、2.0mLのDynal M280常磁性ビーズ(10mg/mL、Dynal SA,Norway)と結合させた。酵素結合ビーズを2000μLの洗浄緩衝液中で3回洗浄し、2000μLのビーズ洗浄緩衝液に再懸濁した。
【0146】
Seradyn微粒子(Powerbind SA,0.8μm,10mg/mL、Seradyn Inc)を以下のようにして調製した。即ち、1050μLのストックを、1,000μLの、0.1%BSAを含む1倍検定用緩衝液で洗浄した。微粒子を9300gで10分間遠心し、上清を除去した。洗浄を更に2回繰り返し、微粒子を、0.1%BSAを含む、1050μLの1倍検定用緩衝液に再懸濁した。ビーズ及び微粒子を、使用するまで氷上に保存した。
【0147】
4.11 ビーズ蒸着
Dynal酵素ビーズ及びSeradyn微小粒子を1分間撹拌し、1,000μLのそれぞれを新しい微小遠心チューブ中で混合し、短く撹拌し氷上に保存した。酵素/Seradynビーズ(1920μL)をDNAビーズ(1300μL)と混合し、ビーズ洗浄緩衝液を使用して最終容量を3460μLに調整した。ビーズを正しく並べられた層中に蒸着した。光ファイバースライドをビーズ洗浄緩衝液から除去し、層1を、DNA及び酵素/Seradynビーズの混合物で蒸着した。遠心後、層1の上清を光ファイバーから吸引し、層2を、Dyanal酵素ビーズで蒸着した。この項は、異なる層をどのようにして遠心するかを詳細に記載する。
【0148】
層1.60×60mmの光ファイバースライドの表面の全体の2つの30×60mmの活性領域を形成するガスケットを、ジグの上部の、指定されたステンレス鋼の合わせくぎに慎重に適合させた。光ファイバースライドを、スライド下部のエッチングされていない側面を有するジグ中に配置し、ジグの上部/ガスケットを、スライドのエッチングされた側面に適合させる。次いで、手できつく締めるように、反対側の末端を堅くしめることにより、ジグの上部をねじで締め付けた。DNA−酵素ビーズ混合物をジグの上部に供給された2個の入口を通して光ファイバースライド上に積載した。ビーズ混合物の積載の間、泡立ちを最小にするように最大の注意を払った。ピペットプランジャーを、緩やかに連続的に押し出すことで、それぞれの蒸着を完了させた。全体のアセンブリを、GH3.8−Aローターを使用した、Beckman Coulter Allegra 6遠心機中で2800rpmで10分間遠心した。遠心後、ピペットで上清を除去した。
【0149】
層2.Dynal酵素ビーズ(920μL)を2760μLのビーズ洗浄緩衝液と混合し、3400μLの酵素−ビーズ懸濁液を、前述のようにして光ファイバースライドに積載した。スライドアセンブリを2800rpmで10分間遠心し、上清を捨てた。ジグから光りファイバースライドを除去し、器具上に積載する準備ができるまで、ビーズ洗浄緩衝液中に保存した。
【0150】
4.12 454装置による配列決定
全てのフロー試薬(flow reagents)は、0.4mg/mLのポリビニルピロリドン(MW360,000)、1mM DTT及び0.1%Tween 20を含む、1倍検定用緩衝液中で調製した。基質(300μMのD−ルシフェリン(Regis)及び2.5μMのアデノシンホスホ硫酸(Sigma))は、0.4mg/mLのポリビニルピロリドン(MW360,000)、1mM DTT及び0.1%Tween 20を含む、1倍検定用緩衝液中で調製した。アピラーゼ洗浄液は、0.4mg/mLのポリビニルピロリドン(MW360,000)、1mM DTT及び0.1%Tween 20を含む、1倍検定用緩衝液中に1リットル当たり最終的に8.5ユニットの活性になるようにアピラーゼを加えることにより調製する。デオキシヌクレオチドdCTP、dGTP及びdTTP(GE Biosciences)は、基質緩衝液中に最終濃度6.5μMに、α−チオデオキシアデノシン三リン酸(dATPαS、Biolog)及びピロリン酸ナトリウム(Sigma)は、それぞれ基質緩衝液中に最終濃度50μM及び0.1μMに調製した。
【0151】
454配列決定装置は、3つの主要なアセンブリ、即ち、流体サブシステム、光ファイバーカートリッジ/フローチャンバー、及び画像処理サブシステムからなる。試薬注入口、多岐管バルブ、及びぜん動ポンプは、流体サブシステムの一部を形成する。個々の試薬は、延長した流速及び時間で一度に1つの試薬をフローチャンバー内に送達する、適切な試薬注入口に接続されている。光ファイバースライドカートリッジ/フローチャンバーは、エッチングされた側面とフローチャンバーの天井との間に250μmの空間を有している。又、フローチャンバーは、試薬及び光学スライドの温度制御用装置、及び遮光筐体を含む。スライドの研磨された(エッチングされていない)側面は、画像処理システムに直接接触している。
【0152】
配列決定試薬の光ファイバースライドウェルへの周期性の送達、及びウェル由来の配列決定反応の副産物の洗浄は、流体システムの予めプログラムされた操作によって達成された。プログラムは、インターフェースコントロール言語(ICL)スクリプトの形態で書かれ、各スクリプト工程の試薬名(洗浄、dATPαS、dCTP、dGTP、dTTP、及びPPi標準)、流速及び時間を特定する。全ての試薬について流速を4mL/分にセットし、フローチャンバー内の線速度は約1cm/s以下であった。配列決定試薬の流れの順番は、最初のカーネルがPPi流れ(21秒)からなり、次いで、14秒の基質の流れ、28秒のアピラーゼ洗浄、及び21秒の基質の流れであるカーネル内に計画された。最初のPPi流れの後に、21サイクルのdNTPの流れが続いた。各カーネルは84秒の長さであり(dNTP−21秒、基質の流れ−14秒、アピラーゼ洗浄の28秒、基質の流れ−21秒)、21秒及び63秒の後に画像を捕獲する。dNTP流れの21サイクルの後、PPiカーネルが導入され、次いで、21サイクルのdNTPの流れが続く。配列決定のランの終わりに第三のPPiカーネルが続く。全てのランの時間は244分である。このランを完了するのに必要な試薬の容量は以下の通り、即ち、500mLの各洗浄溶液、100mLの各ヌクレオチド溶液である。ランの間、全ての試薬を室温に維持した。フローチャンバー及びフローチャンバーの入口チューブの温度を30℃に制御し、フローチャンバーに入る全ての試薬を前もって30℃に加熱した。
【0153】
実施例5 土壌試料の解析
本発明の方法を使用した解析のため、土壌中の生物から核酸を抽出した。抽出は、Epicentre(Madison,WI,USA)由来のDNA抽出キットを使用して、製造業者の指示に従って実施した。
【0154】
即ち、550μLの阻害剤除去樹脂を、それぞれ、Epicentre由来の空のSpinカラムに加えた。カラムを2000×gで1分間遠心し、カラムを充填した。フロースルーを除去し、他の550μLの阻害剤除去樹脂を各カラムに加え、2000×gで2分間遠心した。
【0155】
100mgの土壌を、1.5mLのチューブ中に集め、2μLのプロテイナーゼKを含む、250μLの土壌DNA抽出緩衝液を加えた。溶液を撹拌し、50μLの土壌溶解緩衝液を加え、再度撹拌した。チューブを65℃で10分間インキュベーションし、次いで1,000×gで2分間遠心した。10μLの上清を新しいチューブに移し、60μLのタンパク質沈殿試薬を、チューブを転倒することによって混合しながら加えた。チューブを氷上で8分間インキュベーションし、最大速度で8分間遠心した。100〜150μLの上清を、調製したSpinカラムに直接移し、カラムを2000×gで2分間、1.5mLチューブ中に遠心した。カラムを捨て、溶出液を集めた。6μLのDNA遠心溶液を溶出液に加え、チューブを簡単に撹拌することによって混合した。室温に5分間インキュベーションした後、チューブを、最大速度で5分間遠心した。上清を除去し、沈殿を、500μLの沈殿洗浄溶液で洗浄した。チューブを転倒して溶液を混合し、次いで、最大速度で3分間遠心した。上清を辱佳、洗浄工程を繰り返した。上清を再度除去し、最終的な沈殿を300μLのTE緩衝液に再懸濁した。
【0156】
生成されたDNA試料は、少なくとも、遺伝子座におけるヌクレオチドの頻度を検出するための方法を含む本発明の方法に使用される。
【0157】
参考文献
【0158】
【表3】

【0159】
【表4】

【0160】
【表5】

【図面の簡単な説明】
【0161】
【図1】図1は、ビーズエマルジョン増幅法の一実施形態の概略図を示す。
【図2】図2は、ウルトラディープ配列決定法(ultradeep sequencing method)の一実施形態の概略図を示す。
【図3】図3は、プライマー対SAD1F/R−DD14(パネルA)、SAD1F/R−DE15(パネルB)及びSAD1F/R−F5(パネルC)を使用して生成されたアンプリコンの品質評価を示す。解析は、PCR産物を表わす中心のピーク及び基準サイズマーカーのフランキングピークを有するBioAnalyzer DNA 1,000BopChipにより実施した。各ピークは、156〜181塩基対の範囲である、理論的なサイズの5bp以内で測定された。
【図4】図4は、1−500(A)及び1:1,000(B)、又はT対立遺伝子のみ(A)の近似比(T対立遺伝子に対するC対立遺伝子)で混合され、クローン増幅され、454Life Scienceで配列決定されたMHCII遺伝子座における、2つの異なる対立遺伝子を表わすアンプリコン中のヌクレオチド頻度(非適合の頻度)を示す。各バーは、コンセンサス配列からの偏差の頻度を表わし、得られた塩基置換に従い、色でコードした(赤=A;緑=C;青=G;黄=T)。
【図5】図5は、図4B及び4Cをにおいて表わされるのと同じデータを示すが、試料のみのT対立遺伝子を使用したバックグラウンド減算法の試料を図4Aに示す。
【図6】図6は、混合され、454プラットフォームで配列決定され、ダイナミックレジを決定した、DD14HLA遺伝子座由来のCからTへの対立遺伝子の種々の比を示す。実験的に得られた比を、意図した比に対してプロットする(横軸)。各データポイントについての配列読み取りの現実の数を表1にまとめる。
【図7】A:16S遺伝子の最初の100塩基に対してマップする、おおよそ12,000の読み取りを示す、1.6Kbの16S遺伝子断片に対するマップを読み取る位置を示すグラフである。B:塩基1,000の周辺の領域に対してマップするV3プライマーを除いた7Aとしての同様の結果を示す。C:V1及びV3両方のプライマーが使用される読み取りの位置を示す。
【図8】図8は、200個の配列のうちの1個以外の全てにおいて、V1(図の左半分の短い長さ)及びV3(図の右半分の長い長さ)を明瞭に区別する系統樹を示す。
【図9】図9は、ウルトラディープ配列決定法の一実施形態の概略図を示す。水平の矢印は、対象領域を攻撃するプライマーを示す。
【図10】図10は、ウルトラディープ配列決定法の一実施形態の概略図を示す。水平の矢印は、対象領域を攻撃するプライマーを示す。

【特許請求の範囲】
【請求項1】
核酸集団における1つ以上の配列変異体を検出する方法であって、
(a)前記核酸集団に共通するポリヌクレオチドセグメントを、それぞれが前記ポリヌクレオチド断片を含む第一アンプリコン集団を生成する遺伝子座を規定する一対の核酸プライマーを使用して、増幅する工程;
(b)前記第一アンプリコン集団の各メンバーをクローン増幅し、第二アンプリコンの複数の集団を生成する工程であって、ここで、第二アンプリコンの各集団は、前記第一アンプリコン集団の1つのメンバーに由来する、工程;
(c)前記第二アンプリコンを複数の移動固相担体に、各移動固相担体が前記第二アンプリコンの1つの集団を含むように、固定する工程;
(d)各固相担体上で前記第二アンプリコンの核酸配列を決定し、核酸配列の集団を生成する工程;及び
(e)前記ポリヌクレオチドセグメントの各位置で各タイプのヌクレオチドの発生を測定し、前記核酸集団における1つ以上の配列変異体を検出する工程
を含む、方法。
【請求項2】
前記プライマーが、5’領域及び3’領域を含む二部プライマーであり、前記3’領域が前記ポリヌクレオチドセグメント上の領域と相補的であり、前記5’領域が配列決定プライマー又はその相補体と相同である、請求項1に記載の方法。
【請求項3】
前記5’領域が、前記移動固相担体上で捕獲オリゴヌクレオチド又はその相補体と相同である、請求項2に記載の方法。
【請求項4】
前記増幅がポリメラーゼ連鎖反応により実施される、請求項1に記載の方法。
【請求項5】
前記移動固相担体が、約1〜約500μm、約5〜約100μm、約10〜約30μm、及び約15〜約25μmからなる群から選択される直径を有するビーズである、請求項1に記載の方法。
【請求項6】
前記移動固相担体が、前記第一アンプリコン集団、第二アンプリコン又は、その両方とハイブリダイズし、固定するオリゴヌクレオチドを含む、請求項1に記載の方法。
【請求項7】
前記核酸配列を決定する工程が、前記複数の移動固相担体を、平面上の少なくとも10,000個の反応チャンバーのアレイに送達する工程であって、ここで、前記複数の反応チャンバーが単一の移動固相担体を含むにすぎない、工程;および前記各移動固相担体上で前記アンプリコンの核酸配列を決定する工程によって実施される、請求項1に記載の方法。
【請求項8】
前記核酸配列を決定する工程が、ピロリン酸をベースとする配列決定により実施される、請求項1に記載の方法。
【請求項9】
前記配列変異体が、約50%未満、約10%未満、約5%未満、約2%未満、約1%未満、約0.5%未満、及び約0.2%未満からなる群から選択される頻度を有する、請求項1に記載の方法。
【請求項10】
前記配列変異体が0.2〜5%の頻度を有する、請求項1に記載の方法。
【請求項11】
前記核酸集団が、DNA、RNA、cDNA又はそれらの組み合わせを含む、請求項1に記載の方法。
【請求項12】
前記核酸集団が複数の生物に由来する、請求項1に記載の方法。
【請求項13】
前記核酸集団が1種の生物に由来する、請求項1に記載の方法。
【請求項14】
前記核酸集団が前記生物の複数の組織試料に由来する、請求項13に記載の方法。
【請求項15】
前記核酸集団が前記生物の単一の組織に由来する、請求項13に記載の方法。
【請求項16】
前記核酸集団が病変組織に由来する、請求項1に記載の方法。
【請求項17】
前記病変組織が腫瘍組織を含む、請求項16に記載の方法。
【請求項18】
前記核酸集団が細菌培養物、ウイルス培養物又は環境試料に由来する、請求項1に記載の方法。
【請求項19】
前記第一アンプリコン集団が30〜500塩基長である、請求項1に記載の方法。
【請求項20】
前記第一アンプリコン集団が、1,000より多いアンプリコン、5,000より多いアンプリコン、又は10,000より多いアンプリコンを含む、請求項1に記載の方法。
【請求項21】
前記ビーズのそれぞれが、前記複数の第二アンプリコンの少なくとも10,000種のメンバーと結合する、請求項1に記載の方法。
【請求項22】
前記ポリヌクレオチドセグメントの前記核酸配列が、前記方法の前に決定されていないか又は部分的に決定されていない、請求項1に記載の方法。
【請求項23】
第一ポリヌクレオチド分子の集団における1つ以上のヌクレオチド配列変異体を検出する方法であって、
(a)ポリヌクレオチド領域をインビトロで選択的に増幅する工程であって、前記領域は複数の第一ポリヌクレオチド分子から増幅され、それによって第二ポリヌクレオチド分子の集団を生成する、工程;
(b)複数の個々の第二ポリヌクレオチド分子のヌクレオチド配列を決定する工程であって、各配列は、少なくとも2つの連続したヌクレオチドを含み、前記配列を決定する前に、必要に応じて、複数の個々の第二ポリヌクレオチド分子がそれぞれインビトロでクローン増幅されて第三ポリヌクレオチド分子の集団を生成する、工程;及び
(c)工程(b)で決定したヌクレオチド配列を比較し、第二のポリヌクレオチド分子間、及び必要に応じて第三のポリヌクレオチド分子間の配列の相違を同定し、それによって前記第一ポリヌクレオチド分子の集団における1つ以上のヌクレオチド配列変異体を検出する工程
を含む、方法。
【請求項24】
前記ポリヌクレオチド増幅が等温増幅又は熱サイクル増幅により実施される、請求項23に記載の方法。
【請求項25】
前記熱サイクル増幅がポリメラーゼ連鎖反応により実施される、請求項24に記載の方法。
【請求項26】
前記第一ポリヌクレオチド分子集団が、約100より多い、約1,000より多い、約10,000より多い、約100,000より多い、約100万より多い、又は約10億より多い分子を含む、請求項23に記載の方法。
【請求項27】
前記第二ポリヌクレオチド分子集団が、約100より多い、約1,000より多い、約10,000より多い、約100,000より多い、約100万より多い、又は約10億より多い分子を含む、請求項23に記載の方法。
【請求項28】
前記複数の個々の第二ポリヌクレオチド分子が、約100より多い、約1,000より多い、約10,000より多い、約100,000より多い、約100万より多い、又は約10億より多い分子を含む、請求項23に記載の方法。
【請求項29】
前記増幅されたポリヌクレオチド領域が、少なくとも約25、少なくとも約50、少なくとも約150、少なくとも約300、少なくとも約500、少なくとも約1,000、少なくとも約5,000、又は少なくとも約10,000個のヌクレオチドを含む、請求項23に記載の方法。
【請求項30】
前記配列のそれぞれが、少なくとも約5、少なくとも約25、少なくとも約50、少なくとも約100、少なくとも約150、少なくとも約200、少なくとも約300、少なくとも約500、少なくとも約1,000、少なくとも約5,000、少なくとも約10,000、又は少なくとも約100,000個の連続したヌクレオチドを含む、請求項23に記載の方法。
【請求項31】
前記第二ポリヌクレオチド分子集団が、固相又は半固相の担体に固定されている、請求項23に記載の方法。
【請求項32】
前記第三ポリヌクレオチド分子の集団が、固相又は半固相担体に固定されている、請求項23に記載の方法。
【請求項33】
前記配列が、サンガー配列決定法、合成による配列決定、ハイブリダイゼーションによる配列決定、連結反応による配列決定、分解による配列決定、及びナノポアの配列決定からなる群から選択される方法によって決定される、請求項23に記載の方法。
【請求項34】
前記合成による配列決定法がピロリン酸の検出を含む、請求項33に記載の方法。
【請求項35】
前記配列決定が、標識されたヌクレオチドを組み込む工程を含み、標識が、蛍光標識、質量タグ及び発光標識からなる群から選択される、請求項23に記載の方法。
【請求項36】
前記標識が光又は化学処理により除去又は不活性化される、請求項35に記載の方法。
【請求項37】
前記1つ以上のヌクレオチド配列変異体が、約50%未満、約20%未満、約10%未満、約5%未満、約2%未満、約1%未満、約0.5%未満、約0.2%未満、及び約0.02%未満からなる群から選択される頻度を有する、請求項23に記載の方法。
【請求項38】
前記1つ以上のヌクレオチド配列変異体の少なくとも1つが、前記配列を決定する前に未知である、請求項23に記載の方法。
【請求項39】
複数の異なる個々の生物を含む集団における生物の分布を同定する方法であって、
(a)前記集団から核酸試料を単離する工程;
(b)請求項1又は請求項23の何れか1項に記載の方法を使用して、前記集団中の全ての生物に共通する遺伝子座を含む核酸セグメントの1つ以上の配列変異体を決定する工程であって、ここで、各生物は前記遺伝子座で異なる核酸配列を含む、工程;及び
(c)前記核酸配列の集団に基づき、前記集団における生物の分布を同定する工程
を含む、方法。
【請求項40】
前記集団が、細菌、ウイルス、単細胞生物、植物及び酵母からなる群から選択される生物集団である、請求項39に記載の方法。
【請求項41】
組織試料の組成を決定する方法であって、
(a)前記組織試料から核酸試料を単離する工程;
(b)請求項1又は請求項23の何れか1項に記載の方法を使用して、核酸セグメントの配列変異体を検出する工程であって、ここで、前記セグメントは前記試料中の全細胞に共通する遺伝子座を含み、各細胞型は前記遺伝子座において異なる配列変異体を含む、工程;及び
(c)前記ヌクレオチド頻度から前記組織試料の組成を決定する工程
を含む、方法。
【請求項42】
生物の遺伝子型を決定するための自動化方法であって、
(a)前記生物から核酸を単離する工程;
(b)請求項1又は請求項23の何れか1項に記載の方法に従って、前記核酸中の1つ以上の遺伝子座における核酸配列を決定し、1つ以上の遺伝子座における核酸配列の集団を生成する工程;及び
(c)前記核酸配列の集団から前記1つ以上の遺伝子座におけるホモ接合性又はヘテロ接合性を決定し、前記生物の遺伝型を決定する工程
を含む、方法。
【請求項43】
更に(d)前記核酸配列の集団を1つ以上の基準遺伝型の配列と比較し、前記生物の遺伝型を決定する工程を含む、請求項42に記載の方法。
【請求項44】
前記1つ以上の遺伝子座がSNPを含み、前記遺伝型がSNP遺伝型である、請求項42に記載の方法。
【請求項45】
前記第三ポリヌクレオチド分子集団がブリッジ増幅により生成される、請求項23に記載の方法。
【請求項46】
前記第三ポリヌクレオチド分子集団が、半固相担体上での増幅により生成される、請求項23に記載の方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate


【公表番号】特表2008−538496(P2008−538496A)
【公表日】平成20年10月30日(2008.10.30)
【国際特許分類】
【出願番号】特願2008−506657(P2008−506657)
【出願日】平成18年4月12日(2006.4.12)
【国際出願番号】PCT/US2006/013753
【国際公開番号】WO2006/110855
【国際公開日】平成18年10月19日(2006.10.19)
【出願人】(507331232)454 ライフ サイエンシーズ コーポレイション (11)
【Fターム(参考)】