説明

HIV薬物耐性バリアントの検出のためのシステムおよび方法

一実施形態において、薬物耐性と関連している1種類以上のHIV配列バリアントの低頻度存在を検出するための方法であって、HIV試料集団のRNA分子からcDNA種を作製すること;該cDNA種から第1のアンプリコンを増幅させること、ここで、各アンプリコンは増幅コピーを含み、遺伝子座を規定する1対の核酸プライマーで増幅される;該第1のアンプリコンの増幅コピーをクローン増幅させ、第1のアンプリコンの増幅コピーの1つと実質的に同一のコピーの固定化集団を含む第2のアンプリコンを得ること;該固定化集団の少なくとも100個の核酸配列組成を単一の機器においてパラレルで決定すること;該少なくとも100個の固定化集団の核酸配列組成において、5%以下の頻度で存在する1つ以上の配列バリアントを検出すること;および検出された配列バリアントを、HIV薬物耐性と関連している変異と相関させることを含む方法を記載する。

【発明の詳細な説明】
【技術分野】
【0001】
(関連する出願)
本願は、2007年3月16日に出願された、「System and Method ForDesign and Use of HIV Primer Species」と題する米国仮特許出願第60/918,440号;および2007年9月14日に出願された、「System and Method For Design and Use of HIV Primer Species」と題する米国仮特許出願第60/972,387号からの優先権を主張する。本願はまた、2005年4月12日に出願された、「Methods for determining sequence variants using ultra−deep sequencing」と題する米国特許出願第11/104,781号の一部継続出願である。米国仮特許出願第60/918,440号、米国仮特許出願第60/972,387号および米国特許出願第11/104,781号のそれぞれは、その全体が全ての目的のために本明細書中に参考として援用される。
(発明の分野)
本発明は、HIV−IクレイドBおよびクレイドC内の薬物耐性と関連した配列バリアントであって、単一ヌクレオチド多型(SNP)、挿入/欠失バリアント(「インデル(indel)」と称される)および対立遺伝子頻度を含むものであり得る配列バリアントを、標的ポリヌクレオチド集団においてパラレルで検出および解析するための方法、試薬およびシステムを提供する。本発明はまた、既知配列と未知配列の両方の突然変異および多型の特定のために、ポリメラーゼ連鎖反応(PCR)によって複製させた核酸を、ピロリン酸塩系パラレル配列決定によって調べる方法に関する。本発明は、標的HIV核酸集団において薬物耐性配列バリアント(疑似種とも称される)を含むことが疑われる核酸を増幅させて個々のアンプリコンを得るために、低い突然変異率を有するHIV RNAまたはその相補DNAのプロテアーゼ領域および逆転写酵素領域に対して特異的に設計された核酸プライマーの使用を伴う。数千個の個々のHIVアンプリコンが、大規模でパラレルな効率的かつコスト効率のよい様式で配列決定され、アンプリコン集団において見られる配列バリアントの、これまで使用されてきた方法よりも高い検出感度を可能にする分布が得られる。
【背景技術】
【0002】
(発明の背景)
ゲノムDNAは、同一同胞以外、個体毎に有意に異なる。多くのヒト疾患は、ゲノムの変異により生じる。ヒトおよび他の生命体間の遺伝的多様性により、疾患易罹患性において観察される遺伝性変異が説明される。かかる遺伝的変異により生じる疾患としては、ハンティングトン病、嚢胞性線維症、デュシェーヌ筋ジストロフィ、およびある種の形態の乳癌が挙げられる。このような疾患は各々、単一遺伝子の突然変異と関連している。多発性硬化症、糖尿病、パーキンソン病、アルツハイマー病、および高血圧などの疾患は、ずっとより複雑である。このような疾患は、多遺伝子性(多数の遺伝子の影響)または多因子性(多数の遺伝子の影響および環境の影響)の原因によるものであり得る。ゲノム内の変異の多くは、疾患形質をもたらさない。しかしながら、上記のように、単一の突然変異によって疾患形質がもたらされることがあり得る。さらに、多くのウイルスゲノムは非常に多様であること、および変異によってある種の形質がウイルスに付与されることがあり得る高度突然変異原性であることはよく知られており、このことにより疾患の進行または処置レジメンが変更される。ヒトまたはウイルスのゲノムをスキャンしてかかる疾患の病理の基礎となる、または該病理と関連する遺伝子または特定の突然変異の位置を特定できることは、医学およびヒト生物学において非常に強力なツールとなる。
【0003】
いくつかの型の配列変異、例えば、挿入および欠失(インデル)、反復配列の数の違い、および単一の塩基対の違い(SNP)は、ゲノムの多様性をもたらす。単一の塩基対の違いは、単一ヌクレオチド多型(SNP)と称され、ヒトゲノムにおいて最も頻度の高い変異の型である(ほぼ10塩基に1塩基で存在)。SNPは、集団において少なくとも2つ以上の択一的ヌクレオチド対立遺伝子が比較的高い頻度(1%より高い)で存在するゲノムの位置である。また、SNPは単一塩基(または数個の塩基)の挿入/欠失バリアント(「インデル」と称される)であり得る。SNPは、比較的安定であるため(すなわち、低い突然変異率を示す)、ならびに単一のヌクレオチドの変異(例えば、挿入および欠失)が遺伝形質の原因であり得るため、配列変異の研究に適切である。上記において、用語SNPはまた「インデル」(後で定義)にも適用可能であることが意図されることは理解されよう。
【0004】
例えば、マイクロサテライトによる解析を用いて確認された多型は、さまざまな目的に使用されている。単一のメンデル因子の位置を特定するための遺伝子連鎖ストラテジーの使用は、多くの場合で好成績である(非特許文献1;非特許文献2)。癌抑制遺伝子の染色体上の位置の特定は、一般的に、ヒト腫瘍におけるヘテロ接合性の減少を試験することにより行なわれている(非特許文献3;非特許文献4;非特許文献5;および非特許文献6)。さらに、I型糖尿病などの複雑な形質に寄与する遺伝子の染色体上の位置を推測するための遺伝子マーカーの使用(非特許文献7;非特許文献8)は、ヒト遺伝学における研究の中心となっている。
【0005】
多くのヒト疾患の原因遺伝子の特定は相当進歩したが、この情報がもたらされるのに使用された現在の方法論は、大きな試料集団から遺伝子型情報を得るのに必要とされる莫大なコストと多大な作業量により制限される。このような制限のため、糖尿病などの障害に寄与する複雑な遺伝子突然変異の確認が極めて困難となっている。ヒトゲノムをスキャンし、疾患過程に関与している遺伝子の位置を特定する手法は、制限断片長多型(RFLP)解析の使用により、1980年代初期に始まった(非特許文献9;非特許文献10)。RFLP解析は、サザンブロッティングおよび他の手法を伴う。サザンブロッティングは、多数の試料(特定の表現型と関連する複雑な遺伝子型を特定するのに必要とされるものなど)で行なった場合、費用がかかるとともに時間もかかる。このような問題の一部は、ポリメラーゼ連鎖反応(PCR)に基づくマイクロサテライトマーカー解析の開発によって回避された。マイクロサテライトマーカーは、ジ−、トリ−、およびテトラ−ヌクレオチドリピートからなる単純な配列長多型(SSLP)である。
【0006】
他の型のゲノムの解析は、多対立遺伝的変異および高ヘテロ接合性を有するDNAの超可変領域とハイブリダイズするマーカーの使用に基づくものである。ゲノムDNAのフィンガープリントに有用な可変領域は、ミニサテライトと称される短い配列のタンデムリピートである。多型は、有糸分裂もしくは減数分裂の不等交換の結果生じ得る、または複製中のDNAスリップ(slippage)によって生じ得るリピート数における対立遺伝子間の差によるものである。
【0007】
これらの現行の各方法は、時間がかかるが分離能が限定的であるため、重大な欠点を有する。DNAの配列決定は最も高い分離能をもたらすが、これはまた、バリアントの測定に最も費用がかかる方法でもある。例えば、1000例の異なる試料の集団におけるSNP頻度の測定は、上記の方法を用いると非常に費用がかかり、100,000例の試料の集団におけるSNP頻度の測定では莫大である。ヒト免疫不全ウイルス(一般的に、HIVと称される)は、DNA配列決定によってもたらされる感度が大きな影響を有し得る疾患である。これは、集団において各薬物耐性株の頻度が比較的低い処置の初期に、DNA配列決定によって薬物耐性HIV株の高感度検出がもたらされ得る場合、特に明白である。
【0008】
HIVは、非常に多くの化合物が処置に承認されているにもかかわらず、依然として世界的に大きな問題のままである。現在、ヌクレオシド/ヌクレオチド逆転写酵素阻害剤、非ヌクレオシド逆転写酵素阻害剤、プロテアーゼ阻害剤、融合阻害剤の一種、ケモカイン受容体阻害剤の一種、およびインテグラーゼ阻害剤の一種を含む6つの類型の薬物がある。これらは、HIVのライフサイクルの4つの段階:ビリオンRNAのDNAへの逆転写、宿主ゲノム内へのプロウイルスDNAの組込み、ウイルス遺伝子のポリペプチド産物の機能性タンパク質への切断、および細胞表面でのウイルス侵入を標的化するものである。HIVおよびAIDSに対する対処法における大きな問題は、薬物耐性突然変異体の発生である。国際エイズ学会では、現在、突然変異が薬物耐性と関連する73個のアミノ酸残基(プロテアーゼ部に37個、逆転写酵素部に27個、エンベロープ部に7個、およびインテグラーゼ部に2個)が認められている(非特許文献11、これは引用によりその全体が、あらゆる目的のために本明細書に組み込まれる)。そのリストは、少なくとも1年に1回更新されている。これらの突然変異の一部は、ある種の薬物に特異的であるが、一部は、単独または組合せのいずれかで薬物クラス耐性をもたらす。
【0009】
ウイルス逆転写酵素のエラープローン性および高いウイルスターンオーバー(t1/2=1〜3日間)のため、HIVゲノムは非常に急激に変異する。逆転写酵素は、平均すると、9.7Kbのゲノムの複製1回あたり1回の突然変異が生じると推定されるが、これはウイルスの増殖能に劇的な影響を及ぼさない。これは、多くの異なる変異型が動的関係で存在する「疑似種」の形成をもたらす。
【0010】
HIV患者は、生存期間が延びるという点で抗ウイルス処置の恩恵を受けているが、多くの患者は、ある種の薬物または薬物の組合せに対して耐性が発現されると、いわゆるウイルス学的治療失敗(virological failure)エピソードを何度か経験する。ウイルス学的治療失敗は、生存の可能性を劇的に減少させる(非特許文献12、これは引用によりその全体が、あらゆる目的のために本明細書に組み込まれる)。
【0011】
処置開始前の単一の患者に見られる疑似種のサブセットに耐性付与突然変異が存在することによって、耐性ウイルスの出現およびその後のウイルス学的治療失敗がもたらされるという仮説がたられている(Coffin,Science(1995)、これは引用によりその全体が、あらゆる目的のために本明細書に組み込まれる)。これが正しければ、処置の決定が行なわれる前に、低頻度で存在する突然変異を検出することは非常に有益となり得る。多くの研究所で、オリゴヌクレオチドアレイまたはリアルタイムPCRアッセイなどの専門的な手法が開発されているが、これらは、予め選択したヌクレオチド位置のウイルス遺伝子型の決定に対して限界があり、新たな耐性突然変異が認められるたびに調整が必要である。直接配列決定は、ある種のヌクレオチド種/残基に偏らず、また、新たな薬物耐性関連突然変異を確認できるという点で優れている。現在、従来のサンガー配列決定に基づいたキットが薬物耐性突然変異の検出に利用可能であるが、このようなシステムは、まずウイルス種をサブクローニングしないと、頻度が25%未満の突然変異の信頼性のある検出を行なうことができない。サブクローン種の配列決定により、1人の患者に由来するウイルス集団内に低頻度耐性突然変異が実際に存在すること、およびこれらの多くは、標準的なバルク配列決定では見逃されていることが明白に示された(非特許文献13、これは引用によりその全体が、あらゆる目的のために本明細書に組み込まれる)。また、さらなる研究により、薬物未処置の慢性HIV感染患者のおよそ10%が耐性突然変異を有することが示された(非特許文献14、これは引用によりその全体が、あらゆる目的のために本明細書に組み込まれる)。このような低頻度の持続性耐性関連突然変異が処置開始前に存在しており、処置の転帰に影響を及ぼすと想定することは、非常に妥当である。
【0012】
したがって、配列決定によるこのような突然変異の効率的な検出によって、該疾患の知識および初期検出による処置可能性における想到な進歩が可能になる。さらに、ハイスループット配列決定手法の実施形態により、「大規模でパラレルな(Massively Parallel)」と称され得る処理法が、これまでの配列決定手法よりもかなりより強力な解析、感度およびスループット特性を有することが可能となった。例えば、本明細書に記載の発明のHIV特異的プライマーを用いるハイスループット配列決定技術は、集団において1%以下の頻度の対立遺伝子バリアントを含む低アバンダンス対立遺伝子が検出される感度が得られ得るものである。上記のように、このことは、HIVバリアントの検出との関連において重要であり、、特に、高い感度によって重要な早期検出機構がもたらされ、相当な治療的有益性がもたらされる薬物耐性バリアントの検出との関連において重要である。
【先行技術文献】
【非特許文献】
【0013】
【非特許文献1】Benomarら(1995),Nat. Genet.,10:84−8
【非特許文献2】Blantonら(1991),Genomics,11:857−69
【非特許文献3】Caveneeら(1983),Nature,305:779−784
【非特許文献4】Collinsら(1996),Proc. Natl. Acad Sci. USA,93:14771−14775
【非特許文献5】Koufosら(1984),Nature,309:170−172
【非特許文献6】Legiusら(1993),Nat. Genet.,3:122−126
【非特許文献7】Davisら(1994),Nature,371:130−136
【非特許文献8】Toddら(1995),Proc. Natl. Acad. Sci. USA,92:8560−8565
【非特許文献9】Botsteinら(1980),Am. J. Hum. Genet.,32:314−31
【非特許文献10】Nakamuraら(1987),Science,235:1616−22
【非特許文献11】Johnsonら,Topics in HIV medicine(2007),15:119
【非特許文献12】Hennesseyら,AIDS Res Hum Retroviruses(2000),16:103
【非特許文献13】Palmerら,J. Clin. Microbiol(2005),43:406
【非特許文献14】Novakら,Clin. Infect. Dis.(2005),40:468
【発明の概要】
【課題を解決するための手段】
【0014】
発明の簡単な概要
本発明は、特定のDNAの確認による、HIV薬物耐性におけるいくつかの低頻度配列バリアント(例えば、対立遺伝子バリアント、単一ヌクレオチド多型バリアント、インデルバリアント)の診断方法に関する。現在の手法では、例えば、ポリメラーゼ連鎖反応(PCR)によってSNP検出可能である。しかしながら、PCRによるSNP検出には、SNPのある型にはハイブリダイズするがSNPの別の型にはハイブリダイズしない特別なPCRプライマーの設計が必要とされる。さらに、PCRは強力な手法であるが、対立遺伝子の特異的PCRには、SNPの性質(配列)、ならびに対立遺伝子頻度を測定するための多重PCRの実行およびゲル電気泳動での解析の予備知識が必要とされる。例えば、5%の対立遺伝子頻度(すなわち、20個中1個)には、その検出に最低20回のPCR反応が必要とされ得る。対立遺伝子頻度を検出するのに必要とされるPCRとゲル電気泳動の量は、対立遺伝子頻度が減少すると(例えば、4%、3%、2%または1%以下まで)、劇的に上昇する。
【0015】
現行の方法で、特定のDNA配列の確認によるSNP(例えば、低アバンダンスのSNP)の簡単かつ迅速な検出方法はは提供されていない。
【0016】
本発明者らは、ピロリン酸塩系の新規な配列決定手法と合わせた、薬物耐性と関連していることがわかっているHIVの領域を標的化する2段階PCR手法により、迅速で信頼性があり、かつコスト効率よい様式で、低頻度HIV配列バリアント(SNP、インデルおよび他のDNA多型)の検出が可能となり得ることを見出した。さらに、本発明の方法により、HIV試料中に非化学量論的対立遺伝子量で存在する配列バリアント(例えば、50%未満、25%未満、10%未満、5%未満または1%未満などで存在するHIVバリアント)が検出され得る。
該手法は、簡便に「ウルトラディープ(ultradeep)シークエンシング」と称されることがあり得る。
【0017】
本発明によれば、核酸試料中の多種類の対立遺伝子の特異的増幅および配列決定によって配列バリアント(対立遺伝子頻度、SNP頻度、インデル頻度など)を診断するための方法が提供される。核酸を、まず、HIV薬物耐性と関連していることがわかっている領域を含む対象領域の周囲の領域が増幅されるように設計された1対のPCRプライマーによる増幅に供する。続いて、各PCR反応産物(アンプリコン)を、別の反応槽内で、EBCA(乳液系クローン増幅(Emulsion Based Clonal Amplification))を用いて個々にさらに増幅させる。EBCAアンプリコン(本明細書では、第2のアンプリコンと称する)を配列決定し、種々の乳液型PCRアンプリコンの配列の集合体を用いて、対立遺伝子頻度を測定する。
【0018】
本発明の一実施形態において、薬物耐性と関連している1種類以上のHIV配列バリアントの低頻度存在を検出するための方法であって、HIV試料集団の各RNA分子から複数のcDNA種を作製する工程;該cDNA種から複数の第1のアンプリコンを増幅させる工程、ここで、第1のアンプリコンは各々、複数の増幅コピーを含み、該第1のアンプリコンの遺伝子座を規定する1対の核酸プライマーで増幅される;該第1のアンプリコンの増幅コピーをクローン増幅させ、複数の第2のアンプリコンを得る工程、ここで、該複数の第2のアンプリコンは、第1のアンプリコンの増幅コピーの1つと実質的に同一のコピーの固定化集団を含む;該固定化集団の少なくとも100個の実質的に同一のコピーの核酸配列組成を、単一の機器においてパラレルで決定する工程;該少なくとも100個の固定化集団の核酸配列組成において、5%以下の頻度で存在する1つ以上の配列バリアントを検出する工程;および検出された配列バリアントを、HIV薬物耐性と関連している変異と相関させる工程で構成される方法を記載する。
【図面の簡単な説明】
【0019】
【図1】ビーズ乳液型増幅プロセスの一実施形態の概略図を示す。
【図2】ウルトラディープシークエンシングの概略図を示す。
【図3】プライマー対SAD1F/R−DD14(パネルA)、SAD1F/R−DE15(パネルB)およびSAD1F/R−F5(パネルC)を用いて生成されたアンプリコンの品質評価を示す。解析は、BioAnalyzer DNA 1000 BioChipにおいて行ない、中心ピークはPCR産物を表し、両側のピークは参照サイズマーカーを表す。各ピークは、理論サイズ(156〜181塩基対の範囲である)の5bp以内となるように測定した。
【図4】MHC II遺伝子座内の2つの異なる対立遺伝子を表すアンプリコンにおけるヌクレオチド頻度(非マッチング頻度)を示す。ほぼ1:500(A)および1:1000(B)の比(T対立遺伝子に対するC対立遺伝子)、またはT対立遺伝子のみ(A)で混合し、クローン増幅し、および454 Life Sciencesの配列決定プラットホームにおいて配列決定した。各バーは、コンセンサス配列からの偏差の頻度を表し、得られた塩基置換に応じて色分けしている(赤=A;緑=C;青=G;黄色=T)。
【図5】図4Bと4Cに示したものと同じデータを示すが、図4Aに示したT対立遺伝子のみの試料を用いてバックグラウンドを差し引いた後である。
【図6】DD14 HLA遺伝子座のT対立遺伝子に対するC対立遺伝子の種々の比を示す。混合し、454プラットホームにおいて配列決定してダイナミックレンジを決定する。実験で観察された比を対象とする比(横軸)に対してプロットしている。各データ点での配列決定読み取り(read)の実際の数は、表1にまとめている。
【図7】図7Aは、1.6Kbの16S遺伝子断片に対する読み取りマッピング位置を示すグラフ表示であり、16S遺伝子の最初の100塩基へのほぼ12,000の読み取りマッピングを示す。図7Bは、ほぼ塩基1000個の領域にマッピングされたV3プライマー以外は、図7Aと同様の結果を示す。図7Cは、V1プライマーとV3プライマーの両方が使用された読み取りの位置を示す。
【図8】200個の配列のうち1個以外すべてにおいてV1(図の左側の短い長さ)とV3(図の右側の長い長さ)の配列が明白に識別されている系統樹(phylogentic tree)を示す。
【図9】HIV−IクレイドBコンセンサス配列(配列番号:133)と、突然変異が起こりやすいことがわかっている領域の一実施形態を示す。
【図10】図9のクレイドB配列(配列番号:133)と、クレイドBプライマーセットの設計のために標的化した配列領域の一実施形態を示す。
【図11】突然変異が起こりやすいことがわかっている領域と、クレイドCプライマーセットの設計のために標的化した配列領域とを含むHIV−IクレイドB コンセンサス配列(配列番号:133)の一実施形態を示す。
【図12】プロテアーゼ領域から逆転写酵素領域にわたって存在するHIV RNAから得られたcDNA分子、および得られたアンプリコンのオーバーラップ配列の一実施形態を示す。
【図13】RNAの処理および低頻度配列バリアントの確認のための方法の一実施形態を示す。
【図14】HIV被検体から測定されたHIV疑似種バリアントのミックスの一実施形態を示す。
【図15】HIV被検体試料において3.7%の頻度で確認された、プロテアーゼ阻害剤耐性と関連しているHIV疑似種バリアント(配列番号:132)の一実施形態を示す。
【図16】HIV被検体試料において1.0%の頻度で確認された、非ヌクレオシド逆転写酵素阻害剤耐性と関連しているHIV疑似種バリアントの一実施形態を示す。
【図17】ヌクレオチド/ヌクレオシド逆転写酵素阻害剤耐性と関連しているHIV疑似種バリアントの一実施形態を示す。
【図18−1】HIVクレイドB(配列番号:133)とクレイドC(配列番号:134)配列とのヌクレオチド配列アラインメントを示す。
【図18−2】HIVクレイドB(配列番号:133)とクレイドC(配列番号:134)配列とのヌクレオチド配列アラインメントを示す。
【発明を実施するための形態】
【0020】
発明の詳細な説明
本発明は、試料集団において数千個の特異的核酸の配列組成を特定することによる、HIV薬物耐性株に特異的な1つ以上の配列バリアントの高感度検出方法に関する。配列バリアントには、2つの核酸分子間の任意の配列の違いが包含される。したがって、配列バリアントはまた、少なくとも、単一ヌクレオチド多型、挿入/欠失(インデル)、対立遺伝子頻度およびヌクレオチド頻度をいう、すなわち、これらの用語は互換的であると理解されたい。本明細書全体を通して具体的な実施例を用いて種々の検出手法について論考しているが、本発明の方法は、任意の配列バリアントの検出に対して等しく適用可能であることは理解されよう。例えば、本開示におけるSNPの検出方法の論考は、インデルまたはヌクレオチド頻度の検出方法にも適用可能である。
【0021】
本発明のこの方法は、標的化された特異的鋳型(ゲノム、組織試料、不均一系細胞集団または環境試料中に見られるものなど)を増幅し、配列決定するために使用され得る。このようなものとしては、例えば、PCR産物、候補遺伝子、突然変異ホットスポット、進化的または医学的に重要な可変領域が挙げられ得る。また、該方法は、全ゲノム増幅(続いて、可変または縮重増幅プライマーを使用することによる全ゲノム配列決定を伴う)などの用途にも使用され得る。
【0022】
これまで、配列決定を目的とした鋳型には、対象ゲノム全体の調製および配列決定、または対象領域の事前のPCR増幅および該領域の配列決定が必要とされていた。本発明の方法により、既存の手法によって現在もたらされるものよりも相当大きな深度(depth)で、SNP配列決定を実施することが可能になる。本開示において、「単一ヌクレオチド多型」(「SNP」)は、少なくとも2つのバリアントにおいて存在するSNPであって、最も一般的でないバリアントが、その集団の少なくとも1%に存在するSNPと定義され得る(Wangら,1998 Science 280:1077−1082)。集団において1%未満で存在する変異は、典型的には「突然変異」と称される。本開示の方法が「インデル」に適用され得ることは理解されよう。したがって、本開示ではSNPに対して言及しているが、任意の箇所で用語「SNP」を用語「インデル」で置き換えると、本開示が等しく適用可能であることは理解されよう。
【0023】
本明細書で用いる場合、用語「インデル」は、関連核酸配列と比較される核酸配列内への1つ以上のヌクレオチドの挿入または欠失の存在を意味するものとする。したがって、挿入または欠失には、1つの核酸配列における特異なヌクレオチド(1つまたは複数)の存在または非存在(該核酸配列は、隣接するヌクレオチド位置において、該存在または非存在以外は同一の核酸配列と比較される)が包含される。挿入および欠失としては、関連参照配列と比べたときの任意の特定の位置の、例えば、単一のヌクレオチド、数個のヌクレオチドまたは多くのヌクレオチド(例えば、5、10、20、50、100個もしくはそれ以上のヌクレオチド)が挙げられ得る。また、該用語は、関連配列と比べたときの核酸配列内の1つより多くの挿入または欠失も包含することは理解されよう。
【0024】
最近の核酸配列決定技術における発達により、多くの標的核酸分子がパラレルで、以前の手法よりも非常に少ないコストで配列決定されることによって、スループットが劇的に増大した。このような技術の発達により、本明細書に記載の発明の高感度検出が可能
になり、調製方法および/または配列決定方法と関連する1つ以上の工程または操作が自動化された機器類を用いて行なわれ得る。例えば、一部の機器では、ウェルを有するプレートなどの反応基材要素、または各ウェルもしくはチャンバにおいて同時に反応を行なうことができる他の型のマルチチャンバ型構成が使用される。一部のある実施形態において、配列決定のための反応基材は、PicoTiterPlate(登録商標)アレイと称される(PTP(登録商標)プレートとも称される)ものを含むものであり得、該アレイは、光ファイバーフェースプレートで形成されており、酸でのエッチングによって数十万個の非常に小さいウェルが設けられ、各ウェル内に実質的に同一の鋳型分子集団が保持されることが可能になっている。ハイスループット配列決定手法ならびに大規模でパラレルな配列決定のためのシステムおよび方法の例は、米国特許第6,274,320号;同第6,258,568号;同第6,210,891号;同第7,211,390号;同第7,244,559号;および同第7,323,305号(これらは各々、引用によりその全体が、あらゆる目的のために本明細書に組み込まれる);ならびに米国特許出願第10/299,180号;同第10/222,298号;同第10/222,592号;および同第11/195,254号(これらは各々、引用によりその全体が、あらゆる目的のために本明細書に組み込まれる)に記載されている。
【0025】
上記のように、多くの核酸鋳型がパラレルで配列決定されることにより、本明細書に記載の発明に必要な感度がもたらされる。例えば、ポアソン統計により、充分に負荷された60mm×60mmのPTPプレート(2×10個の高品質塩基、200,000×100塩基読み取りで構成)の検出下限(すなわち、1事象未満)は、95%検出信頼度で3事象および99%検出信頼度で5事象であることが示される(表1参照)。これは、読み取りの数値に直接対応するため、10,000個の読み取り、1000個の読み取り、または100個の読み取りにおいて、同じ検出限界値が3事象または5事象に対してあてはまる。用語「読み取り」は、本明細書で用いる場合、一般的に、単一の核酸鋳型分子または鋳型核酸分子の複数の実質的に同一のコピー集団から得られた配列組成を含むデータをいう。DNA読み取りの実際の量は、上記の例で得られる200,000個よりも大きいため、アッセイの感度が高いことにより、実際の検出下限はさらに低い点であると予測される。比較のため、ピロリン酸塩系配列決定法によるSNP検出により、最も低頻度で存在する対立遺伝子の比率が集団の10%以上であれば、四倍体ゲノム上の別の対立遺伝子状態の検出が報告された(Rickertら,2002 BioTechniques. 32:592−603)。慣用的な蛍光DNA配列決定法は感度がさらに低く、50/50(すなわち、50%)ヘテロ接合型対立遺伝子の分離能に問題が生じる(Ahmadianら、2000 Anal. BioChem. 280:103−110)。
【0026】
【表1】

その結果、単一のバリアントを検出するのに60×60mmのPTPプレート全体を用いると、集団の0.002%のみに存在するバリアントを信頼度95%で、または集団の0.003%に存在するバリアントを信頼度99%での検出が可能になる。当然、多重解析は、この検出深度よりも適用可能性が大きく、表2に、単一のPTPプレートにおいて同時にスクリーニングされ得るバリアントの数を、95%および99%の信頼度で検出可能な最小対立遺伝子頻度とともに示す。
【0027】
【表2】

本発明の利点の1つは、いくつかの工程(通常、試料調製と関連するもの)(例えば、配列決定のための組織からのDNAの抽出および単離)が、排除または簡素化され得ることである。例えば、該方法の感度により、組織の磨砕および化学的精製という従来の手法を用いて組織からDNAを抽出することは必要でなくなる。代わりに、容量で1μLの少量の組織試料を煮沸し、最初のPCR増幅に使用するとよい。この溶液型増幅の産物を、emPCR反応に直接添加する。したがって、本発明の方法により時間が短縮され、労力と産物のロス(人間の過失によるロスを含む)が低減される。
【0028】
本発明の方法の別の利点は、該方法が高度に多重化し易いことである。後述するように、本発明の二部構成プライマーによって、多数の遺伝子に対するプライマーセットを、同一のピロリン酸塩系配列決定用プライマーセットと、1回の溶液型増幅において合わせることが可能になる。あるいはまた、複合調製物の産物を、1回の乳液型PCR反応に入れてもよい。その結果、本発明の方法は、ハイスループット用途の大きな可能性を示す。
【0029】
本発明の一実施形態は、HIV薬物耐性バリアントの対立遺伝子頻度(SNPおよびインデル頻度を含む)の測定方法に関する。第1工程では、患者(「被検体」とも称する)由来のHIV RNAを鋳型として用い、cDNA分子を作製する。次に、1つ以上の標的特異的プライマーセットを用いたPCRによって、解析対象の遺伝子座を含む1つ以上の核酸集団を増幅させ、第1のアンプリコン集団を得る。各遺伝子座は、複数の対立遺伝子(例えば、2、4、10、15もしくは20個など、またはそれ以上の対立遺伝子)を含むものであり得る。第1のアンプリコンは、任意の大きさであり得、例えば、50〜100bp、100bp〜200bp、または200bp〜1kbであり得る。この方法の利点の1つは、2つのプライマー間の核酸配列の知識が必要とされないことである。
【0030】
次の工程では、第1のアンプリコン集団を、水性マイクロリアクター内に油中水型乳液状態で、複数の水性マイクロリアクターが(1)単一の鋳型またはアンプリコンによって支配される増幅反応が開始されるのに充分なDNA、(2)1個のビーズ、および(3)核酸増幅が行なわれるのに必要な試薬を含む増幅反応溶液(後述のEBCA(乳液系クローン増幅)に関する論考を参照のこと)を含むように送達する。本発明者らは、マイクロリアクター内に2種類以上の鋳型が存在する場合であっても、単一の鋳型またはアンプリコンに支配される増幅反応がなされ得ることを見出した。したがって、1種類より多くの鋳型を含む水性マイクロリアクターもまた、本発明で想定される。好ましい実施形態では、各水性マイクロリアクターが増幅用DNA鋳型の単一コピーを有する。
【0031】
送達工程後、第1のアンプリコン集団をマイクロリアクター内で増幅させ、第2のアンプリコンを形成する。増幅は、例えば、サーモサイクラー(thermocycler)内でEBCA(これはPCRを伴う)を用いて行なわれ、第2のアンプリコンが生成され得る。EBCA後、第2のアンプリコンをマイクロリアクター内のビーズに結合させる。ビーズを、第2のアンプリコンが結合した状態で平らな表面上の反応チャンバのアレイ(例えば、少なくとも10,000個の反応チャンバのアレイ)に送達する。この送達は、複数の反応チャンバが1つ以下のビーズを含むように調整する。これは、例えば、反応チャンバがビーズを1個だけ収容するように充分に小さいアレイを使用することによりなされ得る。
【0032】
配列決定反応は、該複数の反応チャンバにおいて同時に行なわれ、前記複数の対立遺伝子に対応する複数の核酸配列が決定される。反応チャンバを用いたパラレルでのパラレル配列決定法は、上記の別のセクションおよび実施例に開示している。配列決定後、核酸の標的集団の配列を解析することにより、少なくとも2つの対立遺伝子に対する対立遺伝子頻度が測定され得る。一例として、10000個の配列が決定され、9900個の配列読み取りが「aaa」であり、100個の配列読み取りが「aag」である場合、「aaa」対立遺伝子は頻度90%を有すると言え、「aag」対立遺伝子は頻度10%を有すると言え得る。これについては、後述の説明および実施例でより詳細に記載する。
【0033】
本発明の方法の利点の1つは、HIV配列変異に関して、これまで達成されていたものよりも高いレベルの感度が可能になることである。PTPプレートを使用した場合、本発明の方法により、ピコタイタープレート1つあたり100,000個より多く、または300,000個より多くの異なる対立遺伝子コピーが配列決定され得る。この検出感度により、被検体試料において、1%以下の対立遺伝子バリアントで示され得る低アバンダンス対立遺伝子の検出が可能になる。本発明の方法の別の利点は、配列決定反応により、解析された領域の配列組成もまた提供されることである。すなわち、解析する遺伝子座の配列の予備知識をもつ必要がない。
【0034】
好ましい実施形態において、本発明の方法により、10%未満、5%未満、または2%未満である対立遺伝子頻度が検出され得る。より好ましい実施形態では、該方法により、1%未満(0.5%未満または0.2%未満など)の対立遺伝子頻度が検出され得る。典型的な検出感度範囲は、0.1%〜100%、0.1%〜50%、0.1%〜10%(0.2%〜5%など)であり得る。
【0035】
種々の実施形態において、標的核酸集団は、いくつかの供給源に由来のものであり得る。例えば、HIV試料の供給源は、HIV感染を受け易い患者/被検体、または他の生物体由来の組織または体液であり得る。また、他の型の試料供給源としては、任意の生物体、例えば哺乳動物が挙げられ得る。哺乳動物は、ヒトまたは商業的価値のある家畜、例えば、ウシ、ヒツジ、ブタ、ヤギ、ウサギなどであり得る。また、記載の方法により、植物の組織試料や液試料の解析が可能になる。あらゆる植物が記載の方法によって解析され得るが、好ましい植物としては、商業的価値のある作物種、例えば、単子葉植物および双子葉植物が挙げられる。特定の一実施形態において、標的核酸集団は、穀物または食物に由来するものであり、遺伝子型、対立遺伝子、または該穀物もしくは食物を構成する種の原型および分布が測定され得る。かかる作物としては、例えば、トウモロコシ、スイートコーン、カボチャ、メロン、キュウリ、サトウキビ、ヒマワリ、コメ、綿花、ナタネ、サツマイモ、マメ、ササゲ、タバコ、ダイズ、アルファファ、コムギなどが挙げられる。
【0036】
また、一部のある実施形態において、核酸試料は、多数の生物体から採取されたものであり得る。例えば、1000個体の集団の対立遺伝子頻度が、1000個体に由来する混合DNA試料を解析する1つの実験で測定され得る。当然、集団の対立遺伝子頻度を表す混合DNA試料では、該集団の各構成員(各個体)は、試料プールに対して、同じ(またはほぼ同じ)量の核酸(同じ対立遺伝子コピー数)に寄与しているはずである。例えば、ゲノムの対立遺伝子頻度の解析において、各個体は、DNA試料プールに対しておよそ1.0×10個の細胞からのDNAに寄与し得る。
【0037】
別の実施形態では、単一の個体における多型が測定され得る。すなわち、標的核酸は単一の個体から単離されたものであり得る。例えば、1人の個体の多数の組織試料に由来する核酸プールが、多型およびヌクレオチド頻度について検査され得る。これは、例えば、個体の腫瘍または腫瘍を含むことが疑われる組織における多型の測定に有用であり得る。本発明の方法は、例えば、個体の組織試料(または多数の組織試料をプールしたDNA)における活性化癌遺伝子頻度を測定するために使用され得る。この例において、活性化癌遺伝子の50%以上の対立遺伝子頻度は、この腫瘍がモノクローナルであることを示し得る。50%未満の活性化癌遺伝子の存在は、この腫瘍がポリクローナルであること、または組織試料が腫瘍組織と正常(非腫瘍)組織の組合せを含むことを示し得る。さらに、疑わしい組織の生検材料において、例えば1%の活性化癌遺伝子の存在は、新生腫瘍の存在、または悪性腫瘍の浸潤の存在を示し得る。
【0038】
標的核酸集団は、任意の核酸、例えば、DNA、RNAならびにかかるDNAおよびRNAの種々の形態、例えば、プラスミド、コスミド、DNAウイルスゲノム、RNAウイルスゲノム、細菌ゲノム、ミトコンドリアDNA、哺乳動物のゲノム、植物のゲノムであり得る。核酸は、組織試料またはインビトロ培養物から単離されたものであり得る。ゲノムDNAは、組織試料、完全体の生物体、または細胞試料から単離され得る。所望により、標的核酸集団は、該集団に寄与した各個体からの等量の対立遺伝子を含むように標準化してもよい。
【0039】
本発明の利点の1つは、ゲノムDNAが、さらに処理することなく直接使用され得ることである。しかしながら、好ましい実施形態において、ゲノムDNAは、PCRまたはハイブリダイゼーションプロセスを妨げるタンパク質を実質的に含まないものであるのがよく、また、DNAを損傷するタンパク質(ヌクレアーゼなど)も実質的に含まないものであるのがよい。また、好ましくは、単離したゲノムも、ポリメラーゼ機能の非タンパク質阻害剤(例えば、重金属)およびPCRを妨げ得るハイブリダイゼーションの非タンパク質阻害剤を含まないものである。タンパク質は、単離したゲノムから当該技術分野で知られた多くの方法によって除去され得る。例えば、タンパク質は、プロテアーゼ(プロテイナーゼKまたはプロナーゼなど)を用いて、強力な界面活性剤(例えば、ドデシル硫酸ナトリウム(SDS)もしくは単離したゲノムを得た細胞を溶解させるラウリルサルコシン酸ナトリウム(SLS)または両方)を使用することにより除去され得る。溶解細胞をフェノールとクロロホルムで抽出すると、核酸(例えば、単離したゲノム)を含有する水相が得られ得、該核酸はエタノールで沈殿させ得る。
【0040】
標的核酸集団は、DNAの起源が未知の供給源、例えば、土壌試料、食品試料などに由来するものであってもよい。例えば、食品試料由来の核酸試料中の病原体内に見られる対立遺伝子の配列決定により、該食品への病原体混入の存在の測定が可能となり得る。さらに、本発明の方法により、食品中の病原性対立遺伝子の分布の測定が可能となり得る。例えば、本発明の方法により、環境試料(土壌試料(実施例5参照)など)または海水試料中の特定の生物体(例えば、細菌、ウイルス、病原体)の株(種)または株(種)の分布が測定され得る。
【0041】
この方法の利点の1つは、該方法に対する変異の予備知識(priori knowledge)が必要でないことである。この方法は核酸配列決定に基づくものであるため、1つの位置のすべての変異が検出され得る。さらに、配列決定のためにクローニングは必要でない。DNA試料は、クローニング、サブクローニング、およびクローニングしたDNAの培養の必要なく、配列決定される一連の工程で増幅される。
【0042】
低頻度変異の検出に関する上記の態様は、本明細書に記載の発明のこの状況において、特に有用である。例えば、より詳細に後述するように、本発明は、薬物耐性と関連しているあらゆるHIVバリアントの検出と定量、特に、ウイルス試料中に低頻度で存在するバリアントの検出と定量を提供する。このようなウイルス試料としては、本実施例において、HIVウイルス単離物が挙げられ得る。本明細書に記載の発明の一部のある好ましい実施形態において、「標的集団」、「試料集団」、または「被検体集団」は、検出可能な力価のウイルスを含むHIV RNA供給源に由来するものであり得る。典型的な実施形態では、供給源は、HIV感染患者から採取された組織試料または体液試料を含むヒト被検体由来試料を含むものであり得、HIV感染患者は、薬物処置レジメンに曝露されたことがある患者でもよく、曝露されたことがない患者でもよい(すなわち、患者は「薬物未処置」であってもよく、そうでなくてもよい)。また、本明細書に記載の本発明の方法により、試料中において、逆転写酵素領域および/またはプロテアーゼ領域内に低頻度で変異が存在するかどうかが測定され得、このとき、該変異は、既知の薬物耐性株または新たに確認された耐性株と相関させ得る。該方法はまた、試料集団における各バリアントの頻度の尺度を提供し、該尺度を用いて治療レジメンが決定または変更され得る(例えば、確認されたHIVバリアント株(1つまたは複数)によって付与される耐性のためほとんど治療的有益性がない1種類以上の薬物、薬物クラス、または薬物組合せの回避などが挙げられる)。
【0043】
記載の方法の他の適用用途としては、配列バリアントの集団試験が挙げられる。DNA試料は、生物体の集団から採取されたものであってもよく、併合して、1つの実験で解析して対立遺伝子頻度を測定する。生物体の集団としては、例えば、ヒト集団、家畜集団、収穫された穀物集団などが挙げられ得る。他の使用としては、腫瘍と正常細胞の混合集団を含む生検材料由来の腫瘍生検材料(例えば、肺癌や結腸直腸癌)における体細胞突然変異の検出および定量が挙げられる。本発明の方法はまた、臨床的に関連性のある易罹患性遺伝子(例えば、乳癌、卵巣癌、結腸直腸癌および膵臓癌、黒色腫)の高信頼度での再配列決定に使用され得る。
【0044】
記載の方法の別の使用は、複数の相違するゲノムと関連している多型の確認を伴うものである。相違するゲノムは、一部の表現型の特徴、家族性起源、身体的近接性、人種、綱などによって関連している集団から単離されたものであり得る。他の場合において、該ゲノムは集団から、同じ集団から選択されること以外は互いに何の関係もないように無作為に選択されたものである。好ましい一実施形態では、該方法を用いて、特定の表現型の特徴(遺伝性疾患または他の形質など)を有する被検体の遺伝子型(例えば、SNP含量)が決定される。
【0045】
また、記載の方法を用いて、ヘテロ接合性の減少について試験することにより腫瘍の遺伝子構造が特徴付けされ得るか、または特定のSNPの対立遺伝子頻度が測定され得る。さらに、該方法を用いて、ゲノム内の一群のSNPの存在または非存在を確認することによりゲノムのゲノム分類コードが作成され得、SNPの対立遺伝子頻度が測定され得る。このような各使用は、本明細書においてより詳細に論考する。
【0046】
本発明の好ましい使用は、ハイスループット遺伝子型分類法におけるものである。「遺伝子型分類は、ゲノムDNA内における特定のゲノム配列の存在または非存在を確認するプロセスである。相違するゲノムは、表現型、家族、地域、人種、綱などと相関している多型(例えば、複数の相違するゲノムと関連したもの)が確認されるように、一部の表現型の特徴、家族性起源、身体的近接性、人種、綱などによって関連している集団の個体から単離されたものであり得る。あるいはまた、相違するゲノムは集団から、集団におけるその起源以外は互いに何の関係もないように無作為に単離されたものであり得る。かかるゲノムにおける多型の確認は、該集団全体として多型の存在または非存在を示すが、必ずしも特定の表現型と相関していない。ゲノムは長いDNA領域にわたって存在し得、多数の染色体を伴うことがあり得るため、本発明の遺伝子型検出方法では、遺伝子型が99.99%の信頼性で検出されるように、多数の位置の複数の配列バリアントを解析する必要があり得る。
【0047】
遺伝子型分類は、多くの場合、特定の表現型形質と関連している多型を確認するために使用されるが、この相関性は必要でない。遺伝子型分類に必要とされることは、多型(これは、コード領域に存在していても、そうでなくてもよい)が存在していることだけである。遺伝子型分類を用いて表現型の特徴を特定する場合、特徴付けする表現型形質が多型によって影響を受けることが推定される。表現型は、所望されるもの、有害なもの、または場合によっては中性のものであり得る。本発明の方法によって確認される多型は、表現型に寄与するものであり得る。一部の多型はタンパク質コード配列内に存在し、したがって、そのタンパク質の構造に影響を及ぼし得、それが、観察される表現型の原因または寄与因子となり得る。一部の他の多型は、タンパク質コード配列の外側に存在するが、その遺伝子の発現には影響しない。また他の多型は、対象遺伝子の近傍に存在しているだけであり、該遺伝子のマーカーとして有用である。単一の多型が1つより多くの表現型の特徴の原因または寄与因子となることがあり得、同様に、単一の表現型の特徴が、1つより多くの多型によるものである場合がある。一般に、1つの遺伝子内に存在する多数の多型が同じ表現型と相関している。さらに、個体が特定の多型に関してヘテロ接合型であるかホモ接合型であるかは、特定の表現型形質の存在または非存在に影響し得る。
【0048】
表現型相関性は、表現型の特徴を示す被検体の実験集団と、該表現型の特徴を示さない対照集団を特定することにより調べる。表現型の特徴を共有する被検体の実験集団に存在し、対照集団には存在しない多型は、表現型形質と相関している多型と言える。多型が表現型形質と相関していると確認されたら、ある表現型の形質または特徴を発現する可能性を有する被検体が、最終的に該表現型の特徴を発現することがあり得るか否かを確立するために、該被検体のゲノムをスクリーニングすると、被検体のゲノムにおける多型の存在または非存在が測定され得る。このような型の解析は、特定の障害(ハンティングトン病または乳癌など)を発症するリスクのある被検体において行なわれ得る。
【0049】
記載の方法の一実施形態は、表現型形質をSNPと関連させる方法に関する。表現型形質には、被検体においてその存在もしくは非存在が陽性と決定され得る任意の型の遺伝性の疾患、病状または特徴が包含される。遺伝性の疾患または病状である表現型形質としては、その成分が遺伝性であり得る(例えば、被検体におけるSNPの存在のため)多因子性疾患、およびかかる疾患に対する素因が挙げられる。このような疾患としては、限定されないが、喘息、癌、自己免疫疾患、炎症、盲目、潰瘍、心臓または心臓血管の疾患、神経系の障害、および病原性の微生物またはウイルスによる感染に対する易感染性などが挙げられる。自己免疫疾患としては、限定されないが、慢性関節リウマチ、多発性硬化症、糖尿病、全身性エリテマトーデス(systemic lupus,erythematosus)およびグレーヴズ病が挙げられる。癌としては、限定されないが、膀胱、脳、乳房、結腸、食道、腎臓、造血系(例えば、白血病)、肝臓、肺、口腔、卵巣、膵臓、前立腺、皮膚、胃および子宮の癌が挙げられる。また、表現型形質としては、薬物または他の治療処置に対する感受性、外観、身長(高さ)、色(例えば、顕花植物の)、強度、速度(例えば、競走馬の)、毛髪の色などが挙げられ得る。遺伝的変異と関連している表現型形質の多くの例が報告されており、例えば、米国特許第5,908,978号(ここでは、ある種の植物における疾患耐性と遺伝的変異との関連が確認されている)および米国特許第5,942,392号(これには、アルツハイマー病の発症と関連する遺伝子マーカーが記載されている)を参照されたい。
【0050】
遺伝的変異(例えば、SNPの存在)と表現型形質との関連性の確認は、多くの目的に有用である。例えば、被検体におけるSNP対立遺伝子の存在と、最終的に被検体が疾患を発症することとの相関性の確認は、早期処置剤の投与、またはライフスタイルの変更の策定(例えば、心臓血管の疾患を回避するため、かかる疾患に対して正常より高い素因を有する被検体においてコレステロールまたは脂肪性食品を低減する)、または癌もしくは他の疾患の発症に関する患者の綿密なモニタリングに特に有用である。また、相関性の確認は、胎児が重篤な疾患に罹患しているか否か、または重篤な疾患を発症する素因を有するか否かを特定するための出生前スクリーニングに有用であり得る。さらに、このタイプの情報は、所望の特性を向上または発現させる目的で交配させる動物または植物のスクリーニングに有用である。
【0051】
複数のゲノムと関連しているSNPまたは複数のSNPを調べる方法の一例は、形質を有する生物体に由来する複数のゲノム試料におけるSNPの存在または非存在に関するスクリーニングである。どのSNPが特定の表現型形質に関連しているのかを調べるため、ゲノム試料を、該特定の表現型形質を示す一群の個体から単離し、試料を一般的なSNPの存在について解析する。各個体から得たゲノム試料を合わせ、ゲノム試料プールを構成してもよい。次いで、本発明の方法を用いて、各SNPについて対立遺伝子頻度を測定する。ゲノム試料プールは、SNPの群を用いて本発明のハイスループット法においてスクリーニングし、特定のSNP(対立遺伝子)の存在または非存在が表現型と関連しているか否かを調べる。場合によっては、特定の被検体が関連表現型を発現する尤度を予測することが可能であり得る。特定の表現型の対立遺伝子がアルツハイマー病を発症している個体の30%に存在しているが、集団においては1%のみに存在するならば、該対立遺伝子を有する個体は、アルツハイマー病を発症する尤度が高い。また、尤度は、いくつかの要素、例えば、アルツハイマー病を患っていない個体がこの対立遺伝子を有するか否か、および他の要素がアルツハイマー病の発症と関連しているか否かなどに依存し得る。この型の解析は、特定の表現型が発現される確率を調べるのに有用であり得る。この型の解析の予測能を増大させるためには、特定の表現型と関連している多数のSNPが解析され得、相関値が特定される。
【0052】
また、特定の疾患により分離されるSNPを確認することも可能である。多数の表現型部位を検出して調べると、該部位間またはマーカー(SNP)と表現型との物理的関係が確認され得る。これを用いると、表現型形質と連鎖または関連している遺伝子の遺伝子座が、染色体上の位置にマッピングされ得、それにより該表現型形質と関連している1つ以上の遺伝子が明らかになり得る。2つの表現型部位が無作為に分離されている場合、これらは、別々の染色体上に存在するか、または同時分離しないで同じ染色体上で互いに対して充分遠位に存在するかのいずれかである。2つの部位が有意な頻度同時分離している場合、これらは、同じ染色体上で互いに連鎖している。このような型の連鎖解析は遺伝子マップの作成に有用であり、表現型(疾患遺伝子型を含む)に重要なゲノム領域が画定され得る。
【0053】
連鎖解析は、高い割合で特定の表現型または特定の疾患を示すファミリー構成員において行なわれ得る。生物学的試料を、表現型形質を示すファミリー構成員ならびに該表現型形質を示さない被検体から単離する。これらの各試料を用いて、個々のSNP対立遺伝子頻度を得る。データを解析すると、該種々のSNPが該表現型形質と関連しているか否か、および任意のSNPが表現型形質により分離されているか否かが判定され得る。
【0054】
連鎖データの解析方法は、多くの参考文献、例えば、Thompson & Thompson,Genetics in Medicine(第5版),W.B. Saunders Co.,Philadelphia,1991;およびStrachan,“Mapping the Human Genome”in the Human Genome(Bios Scientific Publishers Ltd.,Oxford)第4章に記載されており、Affymetrix,Inc.によるPCT特許出願公開公報WO98/18967に要約が示されている。対数オッズ値(LOD値)の計算を伴う連鎖解析により、マーカーと遺伝子座が連鎖していない場合の値と比較した場合の、ある組換え比での該マーカーと遺伝子座との連鎖の尤度が示される。組換え比は、マーカーが連鎖している尤度を示す。それぞれ、異なる組換え比の値のLODスコアを計算するため、および特定のLODスコアに基づいて組換え比を求めるためのコンピュータプログラムおよび数表が開発されている。例えば、Lathrop,PNAS,USA 81,3443−3446(1984);Smithら,Mathematical Tables for Research Workers in Human Genetics (Churchill,London,1961);Smith,Ann. Hum. Genet. 32,127−1500(1968)を参照のこと。表現型形質の遺伝子マッピングのためのLOD値の使用は、Affymetrix,Inc.によるPCT特許出願公開公報WO98/18967に記載されている。一般に、正のLODスコア値は、2つの遺伝子座が連鎖していることを示し、+3以上のLODスコアは、2つの遺伝子座が連鎖していることの強力な証拠である。負の値は、連鎖の可能性が低いことを示す。
【0055】
また、本発明の方法は、腫瘍におけるヘテロ接合性の減少の評価にも有用である。腫瘍におけるヘテロ接合性の減少は、腫瘍の状態、例えば、腫瘍が浸潤性であるのか、転移性腫瘍であるのかを調べるのに有用である。該方法は、同じ型の腫瘍を有する腫瘍試料、ならびに同じ被検体から得た正常(すなわち、非癌性)組織からゲノムDNAを単離することにより行なわれ得る(is can be)。これらのゲノムDNA試料は、本発明のSNP検出方法に使用される。正常組織で得られたSNP対立遺伝子と比較したときの腫瘍でのSNP対立遺伝子の非存在は、ヘテロ接合性の減少が生じたかどうかを示す。SNP対立遺伝子が癌の転移性状態と関連している場合、SNP対立遺伝子の非存在が、非転移性腫瘍試料または正常組織試料におけるその存在または非存在と比較され得る。正常組織および腫瘍組織に存在するSNPのデータベースを作成し、診断または予後の目的で、患者の試料におけるSNPの存在を該データベースと比較することができる。
【0056】
転移性腫瘍から非転移性原発腫瘍に分化させることが可能なことは、転移が癌患者の処置失敗の主な原因であるため、有用である。転移を早期に検出することができれば、該疾患の進行を遅滞させるために積極的に処置することができる。転移は、原発腫瘍からの細胞の剥離、循環系を介した該細胞の移動、および結果としての局所または遠位組織部位での腫瘍細胞の転移増殖を伴う複雑なプロセスである。さらに、モニタリングおよび早期処置が開始され得るように、特定の癌の発症に対する素因を検出することが可能なことが望ましい。多くの癌および腫瘍は、遺伝子の改変と関連している。
【0057】
充実性腫瘍は、腫瘍形成から転移性病期を経由して、いくつかの遺伝子異常が起こり得る病期に進行する。例えば、Smithら,Breast Cancer Res. Terat.,18 Suppl. 1,S5−14,1991。遺伝子異常は、腫瘍を、次の病期に進行し得るように、すなわち、増殖性の利点、薬物耐性を発現する能力もしくは血管新生の増強、タンパク質分解、または転移能を付与することにより改変すると考えられている。このような遺伝子異常は、「ヘテロ接合性の減少」と称される。ヘテロ接合性の減少は欠失または組換えによって引き起こされ得、腫瘍の進行に役割を果たす遺伝子の突然変異がもたらされ得る。癌抑制遺伝子のヘテロ接合性の減少は、腫瘍の進行に役割を果たすと考えられている。例えば、染色体13q14に存在する網膜芽腫の癌抑制遺伝子における突然変異は、網膜芽腫、骨肉腫、小細胞肺癌、および乳癌の進行を引き起こすと考えられている。同様に、第3染色体の短腕は、小細胞肺癌、腎癌および卵巣癌などの癌と関連していることが示されている。例えば、潰瘍性大腸炎は、おそらく遺伝子変化の蓄積が関与した多段階進行を伴う癌の高リスクと関連している疾患である(米国特許第5,814,444号)。長期間潰瘍性大腸炎を患っている患者は癌の高リスクを示すこと、および初期マーカーの1つは、第8染色体の短腕遠位の一領域のヘテロ接合性の減少であることが示されている。この領域は、前立腺癌および乳癌に関与している思われる推定癌抑制遺伝子部位である。ヘテロ接合性の減少は、潰瘍性大腸炎を患う患者において常套的に本発明の方法を実施することにより容易に検出され得る。同様の解析が、ヘテロ接合性の減少と関連していることがわかっている、または関連していると考えられる他の腫瘍から得た試料を用いて行なわれ得る。本発明の方法は、数千個の腫瘍試料が同時にスクリーニングされ得るため、ヘテロ接合性の減少の試験に特に好都合である。
【0058】
記載の方法のある実施形態は、対立遺伝子頻度を測定するために核酸の処理を伴うものである。該方法は、以下の3つの工程:(1)試料調製(第1のアンプリコンの調製);(2)ビーズ乳液型PCR(第2のアンプリコンの調製)(3)合成による配列決定(第2のアンプリコンの多数の配列の決定により対立遺伝子頻度が測定)において広く規定され得る。これらの各工程は、より詳細に後述し、実施例のセクションに記載する。
【0059】
本明細書に記載の発明の好ましい実施形態は、すぐ上に記載した方法工程を、HIVの多数のウイルス種を含む試料において高頻度および低頻度両方の突然変異の検出を可能にする特異的に設計したプライマーセットを用いて使用することを含むものである。例えば、HIV−IクレイドBおよびクレイドCの試料における少数派バリアントの検出は、従来の(ジデオキシヌクレオチドターミネータ)配列決定法では、これまで検出不可能であった。このような少数派バリアントは、かかる突然変異によって抗レトロウイルス薬に対する耐性が付与される場合、重要である。1組以上のプライマーセットの使用、および続くオーバーサンプリングの配列決定により、既知の耐性突然変異およびこれまで未確認の耐性突然変異の両方が、偏りの少ない様式で検出され得る(すなわち、該方法は、既に開発されたほとんどの感度のよい検出アッセイのように、既知の突然変異だけに焦点をあてるものではなく、対象の位置のすぐ横に結合しているプライマーに依存的でない)。用語「オーバーサンプリングの配列決定」は、本明細書で用いる場合、一般的に、異なる供給源(すなわち、異なるウイルス粒子)の同じ領域(すなわち、アンプリコン領域の場合と同様)を、該領域に対して試料集団において配列バリアントの高感度のレベルの検出をもたらす頻度で配列決定することをいう。
【0060】
一部のある実施形態において、本明細書に記載のプライマーセットは、高感度の配列決定法、例えば(such)、集団に1%未満の頻度で存在する配列バリアントを検出する感度が得られ得る上記の標的特異的アンプリコン(「ウルトラディープ」とも称される)方法に使用され得る。場合によっては、この感度は、集団において0.01%の頻度を検出できるものである。
【0061】
本明細書に記載の発明において、プライマーセットは、当業者に知られた方法によって多くの既知HIV配列のアラインメントを用いて設計した。例えば、数多くの配列アラインメント法、アルゴリズム、およびアプリケーションが、当該技術分野において利用可能であり、限定されないが、Smith−Watermanアルゴリズム(Smith TF,Waterman MS(1981)“Identification of Common Molecular Subsequences”. Journal of Molecular Biology 147:195−197(これは引用によりその全体が、あらゆる目的のために本明細書に組み込まれる)、BLASTアルゴリズム(Altschul,S.F.,Gish,W.,Miller,W.,Myers,E.W. & Lipman,DJ.(1990)“Basic local alignment search tool.”J. Mol. Biol. 215:403−410(これは引用によりその全体が、あらゆる目的のために本明細書に組み込まれる)、およびClustal(Thompson JD,Gibson TJ,Plewniak F,Jeanmougin F,Higgins DG(1997).The ClustalX windows interface:flexible strateries for multiple sequence alignment aided by quality analysis tools. Nucleic Acids Research,25:4876−4882(これは引用によりその全体が、あらゆる目的のために本明細書に組み込まれる)が挙げられる。本発明の実施例では、上記のアラインメントアルゴリズムの任意の1つを用いて、同じ一般配列領域の配列の多重アラインメントが行なわれされ得る。かかる配列は、一般的に、種々の公的リソース、例えば、よく知られたGenBankデータベースなどにおいて入手可能であるか、または本発明のHIVの場合では、配列は、Los Alamos National Laboratoryに保存されたHIV配列データベースから入手され得る。また、本発明の実施例では、任意のクレイドと関連しているHIV POL領域の配列は、アラインメントのために特異的に選択され得る。当業者には認識されるように、HIVは、感染がウイルスの特定のクレイド(サブタイプとも称される)と関連したものであり得る途方もない量の遺伝的多様性を有する。現在、A〜Kの文字で指定される9つのクレイドが確認されており、一部のクレイド型は、特定の地理的領域と関連している。例えば、HIVクレイドBは、一般的に北米および欧州で見られるが、クレイドCは、一般的に南アフリカおよびインドで見られる。
【0062】
図9は、POL領域内の6000を超えるHIVクレイドB配列のアラインメントの結果の一例の実例を示す。図9に示されるように、数千個の異なるHIV配列集団を単一の「コンセンサス」配列にアラインメントすることにより、HIV配列集団の各配列位置における最も高頻度の核酸種の確認の表示、ならびに各位置における変異性の程度または突然変異頻度の尺度が得られる。かかる突然変異頻度の尺度は、図9の実施例にバーが配列表示部より突き出ることで示されており、特定の配列位置(1つまたは複数)と関連している。また、バーは、クレイドによる突然変異頻度などの他の特徴を提示するための色(もしくは例えばハッシュマークなどの他のグラフ表示)などの一定の特徴の他のグラフ上での確認因子も含み得、また、バーの高さは頻度の尺度の程度を示す。また、図9は、配列領域を示すコンセンサス配列の下部に位置する小さい四角を用いて、薬物耐性と関連している突然変異に感受性であることがわかっている対象領域を示し、この場合も、四角の色は、薬物クラスまたは特定の対象薬物などのさらなる情報を示し得る。かかる薬物クラスおよび治療剤としては、限定されないが、高度に活性な抗レトロウイルス療法剤(HAARTとも称される);プロテアーゼ阻害剤(PIとも称される);ヌクレオチド/ヌクレオシド逆転写酵素阻害剤(NRTIとも称される);および非ヌクレオシド逆転写酵素阻害剤(NNRTI)が挙げられ得る。
【0063】
次いで、図9のコンセンサス配列内の、突然変異が起こり易いことがわかっている領域よりも保存された(すなわち、変異が起こりにくい)領域に対するプライマーセットを設計した。プライマー設計で低い突然変異率配列領域が標的化される利点としては、プライマーを結合不可能にし得る標的領域の突然変異による失敗の実質的なリスクなく、設計されプライマーを高信頼性で使用できること、ならびに、同じプライマーセットを多種類のクレイドに対して使用できる可能性が挙げられる。図10は、方向を示す矢印(プライマー設計の相対方向性を示す)を伴う陰影を付けた四角で示したクレイドB配列をインテロゲート(interrogate)するプライマー設計に選択した領域の実例の1つを示す。
【0064】
図10に示したクレイドBプライマー設計の例としては、
【0065】
【化1】

が挙げられる。
【0066】
記載のプライマーはすべて、5’−3’方向である。また、セット内のあるプライマーは、1つ以上の配列内位置における配列の縮重のため、1つより多くの種を有するものであり得ることは認識されよう。例えば、B−ACF−1とB−ACF−2は、図10に示すACFプライマー種を表し、これらは、プライマー配列内の同じ塩基位置のヌクレオチド種AとGの違いで互いに異なる。
【0067】
さらに、図11は、クレイドBプライマーとクレイドCプライマーの違いの実例の1つを示し、方向を示す矢印(プライマー設計の相対方向性を示す)を伴う陰影を付けた四角で示したクレイドC配列をインテロゲートするために選択されたクレイドBプライマー設計の修飾領域を示す。また、上記のように、一部のプライマーセットは、1つより多くの種を有するプライマーを有する。例えば、クレイドBプライマー配列と同様、C−ACF−1とC−ACF−2のプライマー配列は、同じ塩基位置の同じヌクレオチド種AとGの違いで異なる。
【0068】
図11に示したクレイドCプライマー設計の例としては、
【0069】
【化2】

【0070】
【化3】

が挙げられる。
【0071】
当業者には、プライマーセットの配列組成に、ある程度の変異性が存在することは認識されよう。これは、主に、設計したプライマー対に対してより広い有用性(より広範なさまざまなクレイドサブクラスでの使用など)を可能にする一部の配列位置における「配列の縮重」によるものである。用語「配列の縮重」は、本明細書で用いる場合、一般的に、配列組成全体におけるわずかな差に適合した1つ以上の配列位置における核酸種の置換をいう。また、該プライマーセットの標的領域はわずかにシフトされることがあり得、したがって、プライマー配列組成にある程度の差が予測される。また、標的領域の配列組成においてわずかな違いを示すコンセンサス配列に対する改良を行なってもよく、同様に、プライマー配列組成にある程度の差が予測される。
【0072】
配列決定のための配列特異的アンプリコンの作製の記載関して上記のように、プライマー種のセットを用いて、逆転写酵素領域、プロテアーゼ領域、およびインテグラーゼ領域を含むHIVの領域に関するオーバーラップアンプリコンが得られ得る。図12は、プライマー種のセット使用の実施の実例の1つを示す。図12の実施例では、3種類の別々のcDNA種をHIV RNAから、プライマーBR、4R−1/4R−2ミックスおよび5Rを用いて作製しており、それぞれの相対的な位置関係を、互いにオーバーラップする領域を有するように示している。これらの3種類のcDNAから、以下のプライマーセットによって8種類のアンプリコンが得られた。
【0073】

クレイドB:
cDNA BR:アンプリコンA (PR):B−ACF−1/B−ACF−2ミックス+B−AR
cDNA BR:アンプリコンB (PR):B−BF +B−BR
cDNA BR:アンプリコンC (PR):B−ACF−1/B−ACF−2ミックス+B−CR
cDNA 4R:アンプリコン1 (RT):B−1F +B−1R−1/B−1R−2ミックス
cDNA 5R:アンプリコン2 (RT):B−2F +B−2R
cDNA 5R:アンプリコン3 (RT):B−3F +B−3R
cDNA 4R:アンプリコン4 (RT):B−4F +B−4R−1/B−4R−2ミックス
cDNA 5R:アンプリコン5 (RT):B−5F +B−5R−1/B−5R−2ミックス

クレイドC:
cDNA BR:アンプリコンA (PR):C−ACF−1/C−ACF−2ミックス+C−AR−1/C−AR−2ミックス
cDNA BR:アンプリコンB (PR):C−BF−1/C−BF−2ミックス+C−BR
cDNA BR:アンプリコンC (PR):C−ACF−1/C−ACF−2ミックス+C−CR
cDNA 4R:アンプリコン1 (RT):C−1F−l/C−1F−2ミックス+C−1R−1/C−1R−2ミックス
cDNA 5R:アンプリコン2 (RT):C−2F−1/C−2F−2ミックス+C−2R
cDNA 5R:アンプリコン3 (RT):C−3F−1/C−3F−2/C−3F−3/C−3F−4ミックス+C−3R
cDNA 4R:アンプリコン4 (RT):C−4F +C−4R−1/C−4R−2ミックス
cDNA 5R:アンプリコン5 (RT):C−5F−1/C−5F−2ミックス+C−5R

cDNAの表示と同様、図12は、アンプリコンの位置関係をオーバーラップ領域を有するように示す。本発明の実施例において、アンプリコンは、各原試料について混合して複合試料とし、上記の配列決定法および機器類を用いて配列決定される。
【0074】
図13は、HIV亜種(「疑似種」とも称される)における低頻度変異の確認方法の一実施形態の実例の1つを示し、該方法は、初期RNA品質管理評価のための工程1303を含む。一部のある実施形態において、RNA Qcは、BioAnalyzer RNA Picoチップ(Agilent Technologiesから入手可能)を用いて行なわれ、続いて、チューブ1本あたり35ng(1回の配列決定の実行に充分)のアリコートが採取される。また、一般的に、各アリコートにはバーコードを付け、HIV RNA試料ごとに個々に採取することが好ましい。35ng未満のRNA(担体+ウイルス)の試料または明らかにRNAが分解された試料はいずれも除外される。次に、QcされたRNAは、工程1305に示したようにして処理され、HIV試料集団から1種類以上のcDNA鋳型が得られる。好ましい実施形態において、各試料は、3種類の遺伝子特異的プライマーを使用するcDNA合成において、バーコード付きの96ウェルプレート形式の3つの別個の反応で使用される。続いて、cDNAは、後続のPCR成績が改善されるようにRNAse Hで処理され得る。
【0075】
続いて、工程1310に示すように、領域特異的プライマー対を用いて、工程1305で得られたcDNA鋳型から標的領域を増幅させる。各アンプリコンPCR反応には3μLの当該cDNAが使用される。バーコード付きの96ウェルプレート形式での40サイクルのPCRにより、1試料あたり8種類のアンプリコンが得られる。工程1310で得られたアンプリコンは、一部のある実施形態では、次いで、関連技術分野で知られた固相可逆的固定化(Solid Phase Reversible Immobilization)(SPRIとも称される)またはサイズ選択のためのゲル切り出し法のいずれかを用いて取り出され得る。例えば、アンプリコンは、SPRIビーズを用いて個々に精製され、dsDNA結合蛍光色素(Picogreen、Invitrogen Corporation製)を用いて定量される。続いて、各試料から得られたこの8種類のアンプリコンは、等モル比で混合され得る。次に、工程1315に示すように、アンプリコンの核酸鎖は、本明細書中のどこかに記載したようにして乳液滴中に導入され、増幅される。一部のある実施形態において、患者試料1例あたり2種類の乳液が設定され得、1つはアンプリコンAキットで使用、1つはアンプリコンBキット(ともに、454 Life Sciencesから入手可能)で使用される。異なる実施形態では、異なる数の乳液および/または異なるキットが使用され得ることは認識されよう。
【0076】
増幅後、乳液を破壊し、固定化された増幅核酸集団を有するビーズを、工程1320に示すように富化させる。例えば、DNA含有ビーズは、本明細書中のどこかに記載したようにして富化させ得る。
【0077】
富化させたビーズは次いで、工程1330に示すように、配列決定される。一部のある実施形態では、各試料は、本明細書中のどこかに記載したようにして配列決定される。続いて、工程1340に示すように、配列データ出力が解析される。一部のある実施形態では、高品質に関してフィルター処理されたフローグラムデータを含むSFFファイルが、特異的アンプリコンソフトウェアを用いて処理され、該データは、6000+HIV−1クレイドB POL領域の配列のアラインメントから誘導されたコンセンサス配列に関する差について解析される。用語「フローグラム」または「パイログラム」は、本明細書において互換的に使用され得、一般的に、本明細書に記載の配列決定法によって得られた配列データのグラフ表示をいう。また、データ解析には、配列データにおいて確認された変異と、薬物耐性と関連していることがわかっている以前に確認されたバリアントとの関連性が含まれるか、または該変異は、薬物耐性と相関する「新たな」バリアントとして確認され得る。
【0078】
上記の工程は、例示の目的のためのものにすぎず、限定を意図するものではないこと、さらに、該工程の一部または全部は、種々の実施形態において種々の組合せで使用され得ることは理解されよう。
【0079】

1. 核酸鋳型の調製
核酸鋳型
鋳型核酸は、任意の核酸供給源、例えば、任意の細胞、組織または生物体から構築され得、任意の当該技術分野で認められた方法によって作製され得る。あるいはまた、RNA、例えばメッセンジャーRNA(mRNA)から相補DNA(cDNA)ライブラリーを作製することにより、鋳型ライブラリーが作製され得る。試料の調製方法は、米国特許第7,323,305号および同時係属中のPCT出願US04/02570号を見るとよく、また、WO/04070007(すべて、引用によりその全体が本明細書に組み込まれる)にも公開されている。
【0080】
核酸鋳型調製方法の好ましい一例は、試料においてPCRを行ない、対立遺伝子または対立対象遺伝子を含む領域を増幅させることである。PCR手法は、互いに間隔をあけたオリゴヌクレオチドプライマーを使用し、任意の核酸試料(DNA、RNA、cDNA)に適用され得る。プライマーは、二本鎖DNA分子の反対側の鎖に相補的であり、典型的には、約50〜450ヌクレオチドまたはそれ以上(通常、2000ヌクレオチド以下)離れている。PCR法は、いくつかの刊行物、例えば、Saikiら,Science(1985)230:1350−1354;Saikiら,Nature(1986)324:163−166;およびScharfら,Science(1986)233:1076−1078に記載されている。また、米国特許第4,683,194号;同第4,683,195号;および同第4,683,202号(各特許の本文は、引用により本明細書に組み込まれる)を参照のこと。さらなるPCR増幅法は、PCR Technology:Principles and Applications for DNA Amplification HA Erlich編,Freeman Press,New York,N.Y.(1992);PCR Protocols:A Guide to Methods and Applications,Innis,Gelfland,SniskyおよびWhite編,Academic Press,San Diego,Calif.(1990);Mattilaら(1991)Nucleic Acids Res. 19:4967;Eckert,K.A.およびKunkel,T.A.(1991)PCR Methods and Applications 1:17ならびに;PCR,McPherson,QuirkesおよびTaylor編,IRL Press,Oxford(これらは、引用により本明細書に組み込まれる)に記載されている。
【0081】

2. 核酸鋳型の増幅
核酸鋳型(すなわち、第1工程のPCR法によって得られたアンプリコン)が本発明の方法に従って配列決定されるためには、コピー数は、2回目に、光検出手段によって検出可能なシグナルが生成されるのに充分なコピー数の各鋳型が得られるように増幅させなければならない。任意の適当な核酸増幅手段が使用され得る。好ましい実施形態において、EBCA(乳液系クローン増幅またはビーズ乳液型増幅)と称する本明細書の新規な増幅システムが、この第2の増幅の実施に使用される。
【0082】
EBCAは、増幅対象の鋳型核酸(例えば、DNA)を、固相(好ましくは、おおむね球形のビーズの形態のもの)に結合させることにより行なわれる。本発明の試料調製法に従って調製される単鎖鋳型DNAのライブラリーは、この増幅方法における使用のためのビーズに結合させる出発核酸鋳型ライブラリーの好適な供給源の一例である。
【0083】
ビーズは、鋳型DNAの一領域に相補的な多数の単一のプライマー種(すなわち、図1のプライマーB)に結合させる。鋳型DNAを、ビーズ結合プライマーにアニーリングさせる。ビーズを水性反応混合物中に懸濁させ、次いで、油中水型乳液中に封入させる。この乳液は、熱安定性油相によって囲まれた直径がおよそ60〜200umの個々の水相微小液滴で構成されたものである。各微小液滴は、好ましくは、増幅反応溶液(すなわち、核酸増幅に必要な試薬)を含むものである。増幅物の一例は、PCR反応ミックス(ポリメラーゼ、塩、dNTP)ならびに1対のPCRプライマー(プライマーAおよびプライマーB)であり得る。図1A参照。また、微小液滴集団の小集団は、DNA鋳型を含むDNAビーズを含むものである。この微小液滴の小集団が増幅の基礎となる。この小集団内にないマイクロカプセルは、鋳型DNAを有さず、増幅に参与しない。一実施形態において、増幅手法はPCRであり、PCRプライマーは、8:1または16:1の比(すなわち、第2プライマー1つに対して8個または16個の第1プライマー)で存在させ、非対称PCRを行なう。
【0084】
この概説において、DNAは、ビーズに固定化させたオリゴヌクレオチド(プライマーB)にアニーリングさせる。サーモサイクリング中(図1B)、単鎖DNA鋳型とビーズ上に固定化されたBプライマー間の結合を破壊させ、鋳型を、周囲のマイクロカプセル封入溶液中に放出させる。増幅溶液(この場合、PCR溶液)は、付加用液相プライマーAおよびプライマーBを含むものである。液相Bプライマーは、結合反応速度論が、固定化されプライマーよりも液相プライマーで高速であるため、鋳型の相補的なb’領域に容易に結合する。PCR初期では、A鎖およびB鎖はともに等しく良好に増幅される(図1C)。
【0085】
PCR中期(すなわち、10〜30サイクル)までに、Bプライマーは枯渇され、指数増幅が停止する。次いで、反応は非対称増幅に入り、アンプリコン集団は、A鎖に支配されるようになる(図1D)。30〜40サイクル後のPCR後期(図1E)では、非対称増幅により溶液中のA鎖の濃度が増大する。過剰のA鎖は、ビーズに固定化されたBプライマーにアニーリングし始める。次いで、熱安定性ポリメラーゼは、A鎖を鋳型として使用し、アンプリコンの固定化されたビーズ結合B鎖を合成する。
【0086】
PCR最終期では(図1F)、継続的な熱サイクリングにより、ビーズ結合プライマーに対するさらなるアニーリングが押し進められる。液相増幅は、この段階において最小限となり得るが、固定化B鎖の濃度は増大する。次いで、乳液を破壊し、固定化された産物を変性によって(熱、pHなどによって)単鎖にすると、相補A鎖の方に移動する。Aプライマーは、固定化された鎖のA’領域にアニーリングされ、固定化された鎖には、配列決定用酵素および任意の必要なアクセサリータンパク質が負荷される。次いで、ビーズは、認められたピロリン酸塩系手法(例えば、米国特許第6,274,320号、同第6258,568号および同第6,210,891号(引用により全体が本明細書に組み込まれる)に記載)を用いて配列決定される。
【0087】
好ましい実施形態において、増幅に使用されるプライマーは、5’部分と3’部分を含む二部構成である。プライマーの3’部分は、標的特異的配列(図2参照)を含み、PCRプライマーの機能を発揮した。プライマーの5’部分は、配列決定法または固定化法に有用な配列を含む。例えば、図2において、増幅に使用された2つのプライマーの5’部分は、ビーズ上のプライマーまたは配列決定用プライマーに相補的な配列(454フォワードおよび454リバースと表示)を含む。すなわち、5’部分がフォワードまたはリバース配列を含むことにより、アンプリコンが、フォワードまたはリバース配列に相補的な固定化オリゴ配列を含むビーズに結合することが可能になる。さらに、配列決定反応は、フォワード配列およびリバースプライマー配列に相補的な配列決定用プライマーを用いて開始され得る。したがって、二部構成プライマーの5’部分に相補的な配列を含む1組のビーズは、全反応において使用され得る。同様に、二部構成プライマーの5’部分に相補的な配列を含む1組の配列決定用プライマーを用いて、二部構成プライマーを用いて作製された任意のアンプリコンが配列決定され得る。最も好ましい実施形態において、増幅に使用される二部構成プライマーセットはすべて、同じ組の5’部分を有するものであり得る(図2に示した454フォワードプライマーと454リバースプライマーなど)。この場合、すべてのアンプリコンは、該5’部分に相補的なオリゴ配列でコートされた標準的なビーズを用いて解析され得る。同じオリゴ配列(ビーズ上に固定化または固定化されていない)を、配列決定用オリゴ配列として使用してもよい。
【0088】

乳液の破壊およびビーズの回収
鋳型の増幅後、乳液を「破壊」する(当該技術分野において「解乳化」とも称される)。乳液の破壊には多くの方法があり(例えば、米国特許第5,989,892号およびそこに挙げられた参考文献を参照のこと)、当業者であれば、適正な方法を選択することができよう。好ましい乳液破壊方法の一例を、実施例のセクションにより詳細に記載する。
【0089】
乳液を破壊した後、増幅させた鋳型含有ビーズは、次いで、例えば、既知の手法による配列決定反応における使用のための水溶液に再懸濁され得る(Sanger,F.ら,Proc. Natl. Acad. Sci. U.S.A. 75,5463−5467(1977);Maxam,A.M.&Gilbert,W. Proc Natl Acad Sci USA 74,560−564 (1977);Ronaghi,M.ら,Science 281,363,365(1998);Lysov,I.ら,Dokl Akad Nauk SSSR 303,1508−1511(1988);Bains W.&Smith G.C. J.TheorBiol 135,303−307(1988);Drnanac,R.ら,Genomics 4,114−128(1989);Khrapko,K.R.ら,FEBS Lett 256. 118−122(1989);Pevzner P.A. J Biomol Struct Dyn 7,63−73(1989);Southern,E.M.ら,Genomics 13,1008−1017(1992)を参照のこと)。ビーズが、ピロリン酸塩系配列決定反応(例えば、米国特許第6,274,320号、同第6258,568号および同第6,210,891号(引用により全体が本明細書に組み込まれる)に記載)において使用される場合、PCR産物の第2鎖を除き、配列決定用プライマーを、ビーズに結合された単鎖鋳型にアニーリングさせることが必要である。
【0090】
この時点で、ビーズ上の増幅DNAは、ビーズ上で直接または異なる反応槽でのいずれかで配列決定され得る。本発明の一実施形態において、該DNAは、ビーズを反応槽に移し、該DNAを配列決定反応(例えば、ピロリン酸塩系またはサンガー配列決定法)に供することにより、ビーズ上で直接配列決定される。あるいはまた、ビーズを単離して該DNAを各ビーズから取り出し、配列決定してもよい。いずれの場合も、配列決定工程は個々の各ビーズ上で行なわれ得る。
【0091】

3. 核酸の配列決定法
配列決定法の一例は、ピロリン酸塩系配列決定法である。ピロリン酸塩系配列決定法では、試料DNA配列および伸長プライマーが、ヌクレオチド三リン酸の存在下で、ポリメラーゼ反応に供され、ここで、ヌクレオチド三リン酸は、組み込まれた状態であるにすぎず、標的位置の塩基に相補的である場合にピロリン酸塩(PPi)を放出し、ヌクレオチド三リン酸は、試料−プライマー混合物の別々のアリコートに添加されるか、または同じ試料−プライマー混合物に連続して添加されるかのいずれかである。次いで、どのヌクレオチドが組み込まれたかを示すPPiの放出が検出される。
【0092】
一実施形態において、配列産物の一領域は、配列決定用プライマーが鋳型核酸の一領域にアニーリングさせ、次いで、配列決定用プライマーを、DNAポリメラーゼと既知のヌクレオチド三リン酸(すなわち、dATP、dCTP、dGTP、dTTP、またはこれらのヌクレオチドの1つの類縁体)と接触させることにより決定される。配列は、配列反応副生成物を検出することにより決定され得る(後述)。
【0093】
配列決定用プライマーは、増幅された核酸鋳型の一領域に特異的にアニーリングできる限り、任意の長さまたは塩基組成であり得る。配列決定用プライマーには、増幅された鋳型核酸の一領域に特異的にプライミングできる限り、特別な構造は必要とされない。好ましくは、配列決定用プライマーは、特徴付けする配列とアンカープライマーにハイブリダイズ可能な配列の間の鋳型の領域に相補的である。配列決定用プライマーはDNAポリメラーゼにより伸長され、配列産物が形成される。伸長は、1種類以上の型のヌクレオチド三リン酸、および所望により、補助結合タンパク質の存在下で行なわれる。dNTPの組込みは、好ましくは、配列決定副生成物の存在についてアッセイすることにより測定される。好ましい実施形態において、配列決定産物のヌクレオチド配列は、伸長された配列決定用プライマー内にdNMPが組み込まれるとヌクレオチド三リン酸(dNTP)から遊離される無機ピロリン酸塩(PPi)を測定することにより決定される。この配列決定法は、Pyrosequencing(商標)手法(PyroSequencing AB,ストックホルム、スウェーデン)と称され、溶液状(液相)または固相手法として行なわれ得る。PPiによる配列決定法は、例えば、WO9813523A1、Ronaghiら,1996. Anal. Biochem. 242:84−89、Ronaghiら,1998. Science 281:363−365(1998)およびUSSN 2001/0024790に一般的に記載されている。これらのPPi配列決定法の開示内容は、引用によりその全体が本明細書に組み込まれる。また、例えば、米国特許第6,210,891号および同第6,258,568号(各々は、引用により本明細書に完全に組み込まれる)も参照のこと。
【0094】
好ましい実施形態において、DNA配列決定は、454 Corporationの(454 Life Sciences)配列決定用の装置および方法(これらは、米国特許第7,323,305号ならびに同時係属中の特許出願USSN:10/768,729、USSN:10/767,899およびUSSN:10/767,894(これらはすべて、2004年1月28日に出願)に開示)を用いて行なわれる。
【0095】
特に規定のない限り、本明細書で用いるすべての科学技術用語は、本発明が属する技術分野の当業者によって一般的に理解されているものと同じ意味を有する。一般的に理解されている定義としては、USSN:60/476,602(2003年6月6日出願);USSN:60/476,504(2003年6月6日出願);USSN:60/443,471(2003年1月29日出願);USSN:60/476,313(2003年6月6日出願);USSN:60/476,592(2003年6月6日出願);USSN:60/465,071(2003年4月23日出願);USSN:60/497,985(2003年8月25日出願);米国特許第7,323,305号(2004年1月28日出願);10/767,899(2004年1月28日出願);USSN:10/767,894(2004年1月28日出願)に定義されたものが挙げられ得る。本出願に挙げたすべての特許、特許出願および参考文献は、引用により本明細書に完全に組み込まれる。
【実施例】
【0096】
実施例1 HLA遺伝子座の配列決定
5組のPCRプライマー対を、MHCクラスII遺伝子座内の既知の公に開示されたSNPにまたがるように設計した。プライマーは、Primer3ソフトウェア(Whitehead Institute for Biomedical Research)を使用し、入力として標的領域を含むおよそ200塩基対長のゲノム配列を用いて設計した。各プライマーは、20〜24塩基長の範囲の遺伝子座特異的3’部分と、4塩基のキー(太字で強調)を含む19塩基固定の5’部分(小文字で表示)からなるものであった。プライマーは、Integrated DNA Technologies(Coralville,IA)から購入した。
【0097】
【化4】

4例の個体由来のヒトゲノムDNA(Cornell Medical Institute for Research,Camden,NJ)を、260nmでの光学密度に基づいて定量し、100ng(およそ15,000個のハプロイドゲノム相当量)を、各PCR増幅反応の鋳型として使用した。PCR反応は、標準的な反応条件下(60mMのTris−SO、pH8.9、18mM(NH4)SO)、2.5mMのMgSO、1mMのdNTP、0.625uMの各プライマー、4.5単位のPlatinum Taq High Fidelityポリメラーゼ(Invitrogen,Carlsbad,CA))、以下の温度プロフィール:94℃で3分間;94℃で30秒間、57℃で45秒間、72℃で1分間を30サイクル;72℃で3分間で行なった。増幅産物を、QiaQuick PCR Purificationキット(Qiagen,Valencia,CA)を用いて精製し、その予測サイズ(156〜181塩基対)を、500 DNA LabChip(登録商標)(Agilent Technologies,Inc,Palo Alto,CA)が使用された2100 Bio Analyzer微小流体工学機器において確認した。この精製アンプリコンを、PicoGreen(登録商標)dsDNA定量キット(Molecular Probes,Eugene,OR)を用いて定量し、10コピー/μLに希釈した。
【0098】
EBCA(乳液系クローン増幅)を、0.5アンプリコン/ビーズを使用し、増幅プライマーSAD1F(GCC TCC CTC GCG CCA(配列番号:11))およびSAD1Rならびにセファロース捕捉ビーズをSADR1(GCC TTG CCA GCC CGC(配列番号:12))捕捉プライマー(Amersham BioSciences,Piscataway、NJ)とともに用いて上記のようにして行なった。乳液の破壊およびPicoTiterプレートでの配列決定を含むさらなる操作はすべて、上記のようにして行なった。
【0099】

実施例2 感受性突然変異の検出
現行のシステム(すなわち、454プラットホーム)の低アバンダンスの配列バリアントの検出能、特に、単一塩基置換の検出能を実証するため、種々の比で混合した既知対立遺伝子を配列決定する実験を設計した。
【0100】
上記の6組のプライマー対を増幅効率について試験し、SAD1F/R−DD14、SAD1F/R−DE15およびSAD1F/R−F5のペア(これらはすべて、異なる増幅産物をもたらす)(図3)を用いて、さらなる解析を行なった。合計8例のヒトゲノムDNA試料を増幅させ、454プラットホームにおいて配列決定し、各遺伝子座について遺伝子型を決定した。実験設備を単純化するため、さらなる解析はすべて、プライマー対SAD1F/R−DD14(図3A)と、特定の遺伝子座のCまたはTいすれかの対立遺伝子に対してホモ接合型であることが示された2つの試料を用いて行なった。
【0101】
各試料の第1のアンプリコンを定量し、10:90〜1:1000までの範囲の特定の比で、典型的にはT対立遺伝子過剰で混合した。混合後、試料を2×10コピー/μLの作業濃度まで希釈し、EBCAに供し、454プラットホームにおいて配列決定した。図2は、C対立遺伝子をほぼ1:500および1:1000の比でT対立遺伝子に混合することにより得られた配列決定データを示す。どちらの場合も、ほぼ10,000個の高品質の配列決定読み取りが得られ、Blast解析に供すると、参照配列(この場合、T対立遺伝子を有する配列)に対するヌクレオチド置換を確認した。結果の視覚化のため、置換頻度を、参照配列に対して色分けしてプロットする。このデータは、両方の試料で低頻度の単一塩基置換が容易に確認されたことことを示す(図4A〜4C)。さらに、バックグラウンドは、試料間で比較的一貫しており、バックグラウンドを差し引くことが可能なことがわかった。これにより、典型的には、1:1000対立遺伝子であっても10より大きい信号雑音比がもたらされた(図5Aおよび5B)。既知遺伝子型の試料を用いたさらなる実験手法によって、少なくとも0.1%アバンダンスレベルに至るまで単一ヌクレオチド置換検出能が確認された。低アバンダンス変化におけるさらなる信頼性は、両方向で鋳型を配列決定することにより得られ得る。典型的には、2つの独立した両方向のデータセットの頻度間の差は、1%アバンダンスレベルに至るまで20%以内である。
【0102】
広範囲の対立遺伝子比にわたる線形応答を実証するため、DD14 HLA遺伝子座のT対立遺伝子およびC対立遺伝子を提示するアンプリコンを1:10、1:20、1:50および1:200(10%、5%、2%および0.5%)の比で混合し、EBCAにより増幅させ、配列決定した。図6は、この範囲全体において、低頻度対立遺伝子の相対数の線形増大が観察されたことを示す(R=0.9927)。この記録された絶対頻度は、意図された比からいくぶん外れており(以下の表を参照)、原因は、少量のDNAを正確に定量し、等分し、混合しようと試みる際に一般に観察される困難さであった。
【0103】
【表3】

実施例3 細菌16Sプロジェクト−細菌集団を調べるための方法
細菌集団の調査は、医療、環境および農業の研究に加えて、産業プロセス制御などの多くの分野にとって基幹的な適用である。一般的な方法の一例は、16SリボソームRNA遺伝子の配列を用いて細菌種を識別するものである(Jonasson,Olofssonら,2002;Grahn,Olofssonら,2003)。別の方法は、16SリボソームRNA遺伝子と23SリボソームRNA遺伝子の間の介在配列を、同様にして調べるものである(Garcia−Martinez,Bescosら,2001)。しかしながら、研究者のほとんどは、現在利用可能な試料調製および配列決定手法を用いて、複雑な細菌集団の完全な個体数調査を行なうは不可能であると考えている;かかるプロジェクトに対する作業要件は、莫大に費用がかかるか、または集団の劇的な二段抽出が強制されるかのいずれかである。
【0104】
現在、細菌集団を調べるのに、ハイスループット法は常套的には使用されていない。一般的な実務では、ユニバーサルプライマー(1つまたは複数)を用いて16SリボソームRNA遺伝子(または該遺伝子内の領域)を増幅し、続いて、該遺伝子をベクター内にサブクローニングし、配列決定する。多くの場合、同一の制限パターンを示すベクターを排除することにより配列決定の負荷を軽減する目的で、該ベクターにおいて制限消化(restriction digests)が行なわれる。得られた配列を、種々の生物体の既知遺伝子のデータベースと比較し、集団組成の推定は、種−または属−特異的遺伝子の配列の存在から導かれる。本開示の方法は、クローニングおよび制限消化工程の排除によって作業コストを劇的に削減することにより、これまでは取得不可能な亜株分化が可能になる16S(および場合によっては遺伝子間および23S)RNA領域の完全な配列を提供することによって情報出力を増大させることにより、ならびに配列オーバーサンプリングを相対アバンダンスに変換することによって種の密度の推定値が得られる可能性があることにより、細菌集団の試験に革命をもたらす可能性を有する。
【0105】
好ましい核酸配列決定法の一例は、454 Life Sciencesによって開発されたピロリン酸塩系配列決定法である。本発明の方法を、大量パラレル型454手法(その一部を、本明細書において開示している)のあらゆる態様と合わせて用いると、スループットが大きく増大され、集団(community)特定のコストが大きく削減され得る。454手法では、多数の個々のPCR産物をクローニングする必要がないとともに、小サイズの16S遺伝子(1.4kb)で、何十万という試料を同時に処理することが可能である。このプロセスは、概要を後述する様式で好成績が実証された。
【0106】
最初に、PCR2.1ベクターで形質転換し、LB/アンピシリンプレート(50μg/mL)上で平板培養し、37℃で一晩インキュベートした大腸菌TOP10コンピテント細胞(Invitrogen,Carlsbad,CA.)から、大腸菌16S DNAを採取した。単一のコロニーを選出し、3mLのLB/アンピシリン培養液中に播種し、250RPMで6時間37℃にて振とうした。この溶液1μLを、16S配列のV1およびV3領域を増幅させるための鋳型として使用した。
【0107】
二部構成PCRプライマーを、V1およびV3で表示される16S遺伝子内の2つの可変領域のために、Monsteinら(Monstein,Nikpour−Badrら2001)に記載のようにして設計した。454特異的な19塩基(15塩基の増幅プライマーに続いて3’に4塩基(TCGA)キー)のフォワードまたはリバースプライマーで構成された5種類のプライミングタグを、V1およびV3可変領域に隣接する領域特異的フォワードおよびリバースプライマーに融合させた。これは、5’−(15塩基フォワードまたはリバース増幅プライマー)−(4塩基キー)−(フォワードまたはリバースV1またはV3プライマー)−3’と表示され得る。16Sアンプリコンを得るために用いたプライマーは以下の配列を含むものであり、該配列において、大文字はV1またはV3特異的プライマーを表し、太字の4つの塩基により該キーを特定し、小文字の塩基は454増幅プライマーを示す。
【0108】
【化5】

V1およびV3アンプリコンは、以下の試薬:1×HiFiバッファー、2.5mMのMgSO(Invitrogen)、1mMのdNTP(Pierce,ミルウォーキー,WL)、V1またはV3領域いずれかに対する1μMの各フォワードおよびリバース二部構成プライマー(IDT,Coralville,IA)、0.15U/μLのPlatinum HiFi Taq(Invitrogen)を含めたPCR反応において別々に作製した。1μLの大腸菌LB/アンピシリン培養液を反応混合物に添加し、PCRを35サイクル行なった(94℃で30秒間、55℃で30秒間、および68℃で150秒間とし、最終サイクルの後、10℃で「infinite hold」状態した)。続いて、1μLの増幅反応ミックスを、Agilent 2100 Bioanalyzer(Agilent,Palo Alto,CA)において泳動させて最終産物の濃度を推定し、適正な大きさの産物(V1は155bp、V3は145bp)が得られることを確実にした。
【0109】
次いで、V1産物およびV3産物を合わせ、0.5〜10鋳型分子/DNA捕捉ビーズの範囲の鋳型濃度で乳化させ、EBCA(乳液系クローン増幅)法(以下のEBCAプロトコルのセクションに概略を記載)によって増幅させた。得られたクローン増幅ビーズを、続いて、454 Genome Sequencer(454 Life Sciences,Branford CT)で配列決定した。
【0110】
増幅させたビーズから得られた配列を大腸菌16S遺伝子配列(Entrez gil74375)に対してアラインメントした。許容され得る(または「マッピングされた」)アラインメントを、各配列のアラインメントスコアを計算することにより、却下された(または「アンマッピングされた」)アラインメントと区別した。スコアは、観察されたシグナルが予測したホモポリマーに相当する確率の平均対数、すなわち:
S = Σ ln[P(s|h)]/N
(式中、Sは、コンピュータ計算されたアラインメントスコアであり、Pは、特定のフローでの確率であり、sは、該フローで測定されたシグナルであり、hは、該フローで予測される参照ホモポリマーの長さであり、Nは、アラインメントされたフローの総数である)とする。次いで、各配列のアラインメントスコアを、Maximum Alignment ScoreすなわちMASと比較した。MASより小さいアラインメントスコアリングを「リアル」とみなし、出力ファイルにプリントした。このプロジェクトでは、1.0(ほぼ95%同一性に相当)のMASを使用した。
【0111】
V1特異的プライマーを用いて生成した配列では、生成された13702の配列のうち、87.75%すなわち11973個の読み取りがゲノムに、1.0未満のアラインメントスコアおよび21塩基より大きい解読長でマッピングされた。1.6Kbの16S遺伝子断片への読み取りマッピングの位置を示すグラフ表示を図7Aに示す。これは、16S遺伝子の最初の100塩基へのほぼ12,000個の読み取りマッピングを示す。
【0112】
非修飾コンセンサス配列のBLAST実行
16Sデータベース(http://greengenes.llnl.gov)に対する
【0113】
【化6】

は、第1の既知生物体としての大腸菌にマッチした
【0114】
【化7−1】


V1コンセンサス配列は、過度に低い信頼度スコアに基づき、ホモポリマー鎖の9位の4つ目の「T」(太字でマーク、下線)を検討し、除去したため、
【0115】
【化7−2】

に修正された。修正されたV1配列のBLASTの結果により、大腸菌16S遺伝子に対するヒットの改善が示された。
【0116】
【化8−1】


同様の結果がV3特異的プライマーでも得られた。17329個の読み取りのうち71.00%が、上記のV1鋳型で用いたものと同一の解析条件下で、16S参照ゲノムにマッピングされた。これは、マッピングされたV1読み取り87.75%よりも小さい数値であり、これは、V3試料と参照配列間での逸脱が、V1試料と参照配列間よりも大きいことを明らかにするものであり得る。コンセンサス配列:
【0117】
【化8−2】

は、図7Bに示されるように、参照ゲノムの966〜1067の領域にマッピングされた。
【0118】
V1配列とは異なり、非修飾コンセンサス配列によるBLASTの結果は、第1の既知生物体としての大腸菌にマッチせず、むしろ第2の生物体としてマッチした。
【0119】
【化9−1】


信頼度スコアに基づいてコンセンサス配列を検討し、
【0120】
【化9−2】

(2つの塩基が除去)に修正し、BLASTを再実行した。BLASTにより、大腸菌に対して最も高いランクのヒットの存在が得られた。
【0121】
【化10】


第2の実験は、未処理細菌細胞に対して混合PCRプライマーを使用できることを示すために行なった。ここでは、大腸菌細胞を飽和まで培養し、この細菌培養液の1:1000希釈液1μLを、鋳型の代わりにEBCA反応ミックスに添加した。EBCA反応に使用したプライマーは、各々0.04μMのV1−およびV3−特異的二部構成プライマー、ならびにそれぞれ0.625および0.04μMのフォワードおよびリバース454増幅プライマーからなるものとした。あるいは、概要を後述するEBCAプロトコルに従った。
【0122】
このデータにより、V1およびV3領域は、未処理細菌細胞プールから同時に成功裡に増幅され、配列決定され、識別され得ることが示された。15484個の読み取りのうち、87.66%が16S参照ゲノムにマッピングされ、それぞれV1およびV3の位置に存在する配列を図7Cに示す。
【0123】
V1配列とV3配列を識別する能力を、V1配列とV3配列両方の100個の読み取りプールし、未加工のシグナルデータをバイナリ列に変換することにより評価した。ここで、「1」は、所与のフローにおいて塩基が存在したことを示し、「0」は存在しなかったことを示す。ホモポリマー鎖を単一の正の値にコラプス(collapse)し、その結果、「A」、「AA」および「AAAAA」(配列番号:29)はすべて、同一のスコア「1」を得た。このコラプスされたバイナリ列を、次いで、R統計パッケージ(Team 2004)内のHierarchical Ordered Partitioning and Collapsing Hybrid(HOPACH)方法論(Pollard and van der Laan 2005)によってクラスター化した。得られた系統樹(図8に図示)では、200個の配列のうち1個以外すべてにおいてV1(短い長さの赤ラベル)とV3(長い長さの青ラベル)の配列が明白に識別されている。
【0124】
同じ生物体の同じ遺伝子に由来する2つの類似した領域をこのように明白に識別できることは、この手法により、異なる生物体に由来する可変領域間の識別において熟練性(adept)が示されるはずであり、価値のある診断用ツールが提供されることを示す。
【0125】

実施例4 EBCAプロトコル
4.1 DNA捕捉ビーズの調整
1mL容のN−ヒドロキシスクシンイミドエステル(NHS)活性化セファロースHPアフィニティカラム(Amersham Biosciences,Piscataway、NJ)の充填ビーズをカラムから取り出し、製品に関する資料(Amersham Pharmaciaプロトコル番号71700600AP)に記載のようにして活性化した。25μLの1mMアミン標識HEG捕捉プライマー(5’−アミン−3連続18−原子ヘキサ−エチレングリコールスペーサーCCATCTGTTGCGTGCGTGTC−3’(配列番号:30))(IDT Technologies,Coralville,IA,USA)を、20mMのリン酸バッファー(pH8.0)中、ビーズに結合させた後、25〜36μmのビーズを、36および25μmの細孔フィルターメッシュセクション(Sefar America,Depew,NY,USA)に連続通過させることによって選択した。最初のフィルターは通過したが2番目で保持されたDNA捕捉ビーズを、ビーズ保存バッファー(50mMのTris、0.02%Tween、0.02%アジ化ナトリウム、pH8)中に収集し、Multisizer 3 Coulter Counter (Beckman Coulter,フラートン,CA、USA)で定量し、必要時まで4℃で保存した。
【0126】

4.2 DNA捕捉ビーズへの鋳型種の結合
鋳型分子を、UV処理済層流フード内で、DNA捕捉ビーズ上の相補プライマーにアニーリングさせた。ビーズ保存バッファー中に懸濁させた60万個のDNA捕捉ビーズを、200μL容のPCRチューブに移し、ベンチトップ型ミニ遠心機内で10秒遠心分離し、チューブを180°回転させ、さらに10秒スピンさせて、ペレットが形成されるほど確実にした。次いで、上清みを除去し、ビーズを200μLのアニーリングバッファー(20mMのTris、pH7.5および5mMの酢酸マグネシウム)で洗浄し、5秒間ボルテックスしてビーズを再懸濁させ、上記のようにしてペレット化させた。ビーズ上部のおよそ10μL以外の上清みは全部除去し、さらに200μLのアニーリングバッファーを添加した。ビーズを5秒間再度ボルテックスし、1分間放置し、次いで、上記のようにしてペレット化させた。10μL以外の上清みは全部廃棄し、0.48μLの2×10分子/μL鋳型ライブラリーをビーズに添加した。チューブを5秒間ボルテックスして内容物を混合した後、MJサーモサイクラーで行なう制御された変性/アニーリングプログラムにおいて、鋳型をビーズにアニーリングさせた(80℃で5分間の後、0.1℃/秒で70℃に低下、70℃で1分間、0.1℃/秒で60℃に低下、60℃で1分間保持、0.1℃/秒で50℃に低下、50℃で1分間保持、0.1℃/秒で20℃に低下、20℃で保持)。アニーリングプロセスの終了時、ビーズを必要時まで氷上で保存した。
【0127】

4.3 PCRミックスの調製および配合
混入物の可能性を低減させるため、PCR反応ミックスを、PCRクリーンルーム内に存在するUV処理済層流フード内で調製した。各600,000ビーズ乳液型PCR反応に対して、225μLの反応ミックス(1×Platinum HiFi Buffer(Invitrogen)、1mMのdNTP(Pierce)、2.5mMのMgSO(Invitrogen)、0.1%のアセチル化された分子生物学等級BSA(Sigma)、0.01%のTween−80(Acros Organics)、0.003 U/μLの熱安定性ピロリン酸塩(NEB)、0.625μMのフォワード(5’−CGTTTCCCCTGTGTGCCTTG−3’(配列番号:31))および0.039μMのリバースプライマー(5’−CCATCTGTTGCG TGCGTGTC−3’(配列番号:32))(IDT Technologies,Coralville,IA、USA)ならびに0.15U/μLのPlatinum Hi−Fi Taq Polymerase(Invitrogen))を、1.5mL容のチューブ内で調製した。25μLの反応ミックスを取り出し、陰性対照としての使用のために、個々の200μL容のPCRチューブ内に保存した。反応ミックスおよび陰性対照は、ともに必要時まで氷上で保存した。さらに、240μLの偽(mock)増幅ミックス(1×Platinum HiFi Buffer(Invitrogen)、2.5mMのMgSO(Invitrogen)、0.1%のBSA、0.01%のTween)を、乳液毎に1.5mL容のチューブ内で調製し、必要時まで室温で同様に保存した。
【0128】

4.4 乳化および増幅
乳化プロセスにより、およそ10,000個の個々のPCRマイクロリアクター/μLを有する熱安定性の油中水型乳液が生成され、該マイクロリアクターは、標的ライブラリーの個々の分子の単一分子のクローン増幅のためのマトリックスとしての機能を果たす。単一の反応用の反応混合物とDNA捕捉ビーズを、UV処理済層流フード内で以下のようにして乳化させ、200μLのPCR溶液を、600,000個のDNA捕捉ビーズの入ったチューブに添加した。ビーズをピペッティング動作の反復によって再懸濁させた後、PCR−ビーズ混合物を室温で少なくとも2分間放置し、ビーズをPCR溶液で平衡化させた。その間、400μLのEmulsion Oil(60%の(w/w)DC 5225C Formulation Aid(Dow Chemical CO,Midland,MI)、30%の(w/w)DC 749 Fluid(Dow Chemical CO,Midland,MI)、および30%の(w/w)Ar20 Silicone Oil(Sigma))を上部が平坦な2mL容の遠心チューブ(Dot Scientific)内に等分した。次いで、240μLのmock増幅ミックスを400μLの乳液油状物に添加し、チューブにしっかりキャップし、TissueLyser MM300(Retsch GmbH & Co.KG,Hann,Germany)の24ウェルTissueLyser Adaptor(Qiagen)内に配置した。
この乳液を25振動/秒で5分間ホモジナイズすると、反応液にさらなる安定性を付与する極めて小さい乳液、すなわち「マイクロファイン液(microfine)」が得られた。
【0129】
マイクロファイン液の形成中、160μLのPCR増幅ミックスを、アニーリングさせた鋳型とDNA捕捉ビーズの混合物に添加した。ビーズとPCR反応ミックスの混合物を手短にボルテックスし、2分間平衡化させた。マイクロファイン液が形成された後、増幅ミックス、鋳型およびDNA捕捉ビーズを、該乳化物質に添加した。TissueLyserの速度を15振動/秒に低下させ、反応ミックスを5分間ホモジナイズした。ホモジネーション速度を低下させると、DNA捕捉ビーズおよび増幅ミックスを内包するのに充分に大きい100〜150μmの平均直径を有する水滴を含有する油状ミックスが生成された。
【0130】
この乳液を7〜8個の別々のPCRチューブ内に等分した(各々、80μLを含んだ)。チューブを密封し、MJサーモサイクラー内に、事前に作製した25μLの陰性対照とともに配置した。以下のサイクル時間を使用した:1×(94℃で4分間)−ホットスタート開始、40×(94℃で30秒、58℃で60秒、68℃で90秒)−増幅、13×(94℃で30秒、58℃で360秒)−ハイブリダイゼーション伸長。PCRプログラムの終了時、反応液を取り出し、乳液は、すぐに破壊するか(後述のとおり)、または反応物を16時間まで10℃で保存後、破壊プロセスを開始するかのいずれかとした。
【0131】

4.5 乳液の破壊およびビーズの回収
50μLのイソプロピルアルコール(Fisher)を、増幅物質の乳液を入れた各PCRチューブに添加し、10秒ボルテックスして乳液の粘度を低下させた。チューブをマイクロ遠心機内で数秒間遠心分離し、チューブキャップ内に付着した乳化物質があれば除去した。乳液−イソプロピルアルコールミックスを、各チューブから、先の太い16ゲージの先の太い針(Brico Medical Supplies)を取り付けた10mL容のBD−Disposable Syringe(Fisher Scientific)内に抜き出した。さらに50μLのイソプロピルアルコールを、各PCRチューブに添加し、ボルテックスし、先のようにして遠心分離し、シリンジの内容物に添加した。シリンジ内部の容積をイソプロピルアルコールで9mLに増大させた後、シリンジを反転させ、1mLの空気をシリンジ内に吸引させ、イソプロパノールと乳液の混合を助長させた。該先の太い針を外し、15μm細孔Nitex Sieving Fabric(Sefar America,Depew,NY,USA)を含む25mmのSwinlockフィルターホルダー(Whatman)をシリンジルアーに取り付け、該先の太い針をSwinlockユニットの反対側に固定した。
【0132】
シリンジの内容物を、Swinlockのフィルターユニットと針を介して静かに、だが完全に、漂白剤入りの廃物容器内に押し出した。6ミリリットルの新たなイソプロピルアルコールを、先の太い針およびSwinlockフィルターユニットによってシリンジ内に再度吸引させ、シリンジを10回反転させてイソプロピルアルコール、ビーズおよび残留乳液成分を混合した。シリンジの内容物を再度廃物容器内に押し出し、洗浄プロセスを2回(各洗浄において、6mLのさらなるイソプロピルアルコール)繰り返した。洗浄工程を、6mLの80%のエタノール/1×アニーリングバッファー(80%のエタノール、20mMのTris−HCl、pH7.6、5mMの酢酸マグネシウム)を用いて繰り返した。次いで、ビーズを、0.1%のTweenを含む6mLの1×アニーリングバッファー(0.1%のTween−20、20mMのTris−HCl、pH7.6、5mMの酢酸マグネシウム)で洗浄した後、6mLの2次純水(picopure water)で洗浄した。
【0133】
最終洗浄液を廃物容器内に押し出した後、1.5mLの1mMのEDTAをシリンジ内に吸引させ、Swinlockフィルターユニットを外して横に置いた。シリンジの内容物を、連続的に1.5mL容の遠心チューブ内に移した。チューブを、ミニ遠心機内で定期的に20秒間遠心分離してビーズをペレット化させ、上清みを除去した後、残留したシリンジの内容物を遠心チューブに添加した。Swinlockユニットをフィルターに再度取り付け、1.5mLのEDTAをシリンジ内に吸引させた。最後にSwinlockフィルターを外し、ビーズとEDTAを遠心チューブに添加し、必要に応じてビーズをペレット化させ、上清みを除去した。
【0134】

4.6 第2鎖の除去
捕捉ビーズ上に固定化された増幅DNAを、塩基性融解溶液中でのインキュベーションによる第2鎖の除去によって単鎖にし、1mLの新たに調製した融解溶液(0.125MのNaOH、0.2MのNaCl)をビーズに添加し、中程度の設定で2秒間のボルテックスによってペレットを再懸濁させ、チューブをThermolyne LabQuakeチューブロール内に3分間配置した。次いで、ビーズを上記のようにしてペレット化し、上清みを注意深く除去し、廃棄した。次いで、1mLのアニーリングバッファー(20mMのTris−酢酸塩、pH7.6、5mMの酢酸マグネシウム)の添加によって残留融解溶液を希釈した後、ビーズを中速で2秒間ボルテックスし、ビーズをペレット化し、上清みを先のようにして除去した。アニーリングバッファー洗浄を繰り返したが、遠心分離後、アニーリングバッファーは800μLのみ除去した。ビーズおよび残留アニーリングバッファーを0.2mL容のPCRチューブに移し、すぐに使用するか、または4℃で48時間まで保存した後、続いて富化プロセスを継続するかのいずれかとした。
【0135】
4.7 ビーズの富化
この時点までで、ビーズ塊は、固定化された増幅DNA鎖を有するビーズと、増幅産物を有しない無負荷(null)ビーズの両方で構成されていた。富化プロセスを用いて、配列決定可能な量の鋳型DNAを有するビーズを選択的に捕捉するとともに無負荷ビーズを排除した。
【0136】
先の工程の単鎖ビーズを、ベンチトップ型ミニ遠心機内での10秒間の遠心分離によってペレット化した後、チューブを180°回転させ、さらに10秒スピンさせて、ペレットが形成されるほど確実にした。次いで、ビーズを撹乱させずにできるだけ多くの上清みを除去した。15μLのアニーリングバッファーをビーズに添加した後、2μLの100μMビオチン化40塩基HEG富化プライマー(5’ビオチン−18−原子ヘキサ−エチレングリコールスペーサー−CGTTTCCCCTGTGTGCCTTGCCATCTGTTCCCTCCCTGTC−3’(配列番号:33)、IDT Technologies、ビーズ固定鋳型の3’末端の混合された増幅部位と配列決定部位(各々、20塩基長)に相補的)。この溶液を、中程度の設定で2秒間のボルテックスによって混合し、富化プライマーを固定化されたDNA鎖に、MJサーモサイクラーでの制御された変性/アニーリングプログラム(65℃で30秒、0.1℃/秒で58℃に低下、58℃で90秒、および10℃で保持)を用いてアニーリングさせた。
【0137】
プライマーをアニーリングさせている間、SeraMag−30磁性ストレプトアビジンビーズ(Seradyn,インディアナポリス,IN、USA)のストック溶液を、静かに旋回させることにより再懸濁させ、20μLのSeraMagビーズを、1mLの増強液(2MのNaCl、10mMのTris−HCl、1mMのEDTA、pH7.5)の入った1.5mL容マイクロ遠心チューブに添加した。SeraMagビーズミックスを5秒間ボルテックスし、チューブをDynal MPC−S磁石内に配置し、常磁性のビーズをマイクロ遠心チューブの側面に対してペレット化した。SeraMagビーズを撹乱させずに上清みを注意深く除去して廃棄し、チューブを磁石から取り出し、100μLの増強液を添加した。チューブを3秒間ボルテックスしてビーズを再懸濁させ、チューブを必要時まで氷上で保存した。
【0138】
アニーリングプログラムが終了したら、100μLのアニーリングバッファーを、DNA捕捉ビーズと富化プライマーの入ったPCRチューブに添加し、チューブを5秒間ボルテックスし、内容物を新たな1.5mL容マイクロ遠心チューブに移した。富化プライマーを捕捉ビーズにアニーリングさせたPCRチューブを200μLのアニーリングバッファーで1回洗浄し、この洗浄液を該1.5mL容チューブに添加した。ビーズを1mLのアニーリングバッファーで3回洗浄し、2秒間ボルテックスし、先のようにしてペレット化し、上清みを注意深く除去した。3度目の洗浄後、ビーズを1mLの氷冷増強液で2回洗浄し、ボルテックスし、ペレット化し、先のようにして上清みを除去した。次いで、ビーズを150μLの氷冷増強液中に再懸濁させ、このビーズ溶液を洗浄したSeraMagビーズに添加した。
【0139】
ビーズ混合物を3秒間ボルテックスし、LabQuakeチューブロールにおいて室温で3分間インキュベートするとともに、ストレプトアビジンコートSeraMagビーズ結合ビオチン化富化プライマーを、DNA捕捉ビーズ上に固定化させた鋳型にアニーリングさせた。次いで、ビーズを2,000RPMで3分間遠心分離した後、ビーズが再懸濁されるまでビーズを静かに「タッピング(flick)」した。次いで、再懸濁ビーズを氷上に5分間に配置した。氷上でのインキュベーション後、冷増強液をビーズに、最終容量1.5mLまで添加した。チューブをDynal MPC−S磁石内に挿入し、ビーズを撹乱させずに120秒放置してビーズを磁石に対してペレットさせた後、上清み(過剰のSeraMagおよび無負荷DNA捕捉ビーズを含む)を注意深く除去して廃棄した。
【0140】
チューブをMPC−S磁石から取り出し、1mLの冷増強液をビーズに添加し、ビーズを静かにタッピングすることによって再懸濁させた。ボルテックスすると、SeraMagとDNA捕捉ビーズとの結合が破壊されることがあり得るため、ビーズをボルテックスしないことが不可欠であった。ビーズを磁石に戻し、上清みを除去した。この洗浄をさらに3回繰り返して、すべての無負荷捕捉ビーズが確実に除去されるようにした。アニーリングされた富化プライマーとSeraMagビーズをDNA捕捉ビーズから除去するため、ビーズを1mLの融解溶液中に再懸濁させ、5秒間ボルテックスし、磁石でペレット化させた。富化されたビーズを含む上清みを別の1.5mL容マイクロ遠心チューブに移し、ビーズをペレット化し、上清みを廃棄した。次いで、富化されたビーズを0.1%のTween−20を含む1×アニーリングバッファー中に再懸濁させた。ビーズをMPC上で再度ペレット化し、上清みを新たな1.5mL容チューブに移し、残留SeraMagビーズの最大限の除去を確実にした。ビーズを遠心分離した後、上清みを除去し、ビーズを1mLの1×アニーリングバッファーで3回洗浄した。3度目の洗浄後、800μLの上清みを除去し、残留ビーズ溶液を0.2mL容PCRチューブに移した。
【0141】
富化プロセスの平均収率は、乳液に添加した最初のビーズの33%、すなわち198,000富化ビーズ/乳化反応であった。60×60mm PTP形式では900,000富化ビーズが必要とされるため、60×60mmのPTP配列決定あたり、5つの600,000ビーズ乳液が処理された。
【0142】

4.8 配列決定用プライマーのアニーリング
富化されたビーズを2,000RPMで3分間遠心分離し、上清みをデカントした後、15μLのアニーリングバッファーおよび3μLの配列決定用プライマー(100mMのSAD1F(5’−GCC TCC CTC GCG CCA−3’(配列番号:34)、IDT Technologies)を添加した。次いで、チューブを5秒間ボルテックスし、以下の4段階アニーリングプログラム:65℃で5分間、0.1℃/秒で50℃に低下、50℃で1分間、0.1℃/秒で40℃に低下、40℃で1分間保持、0.1℃/秒で15℃に低下、15℃で保持のためにMJサーモサイクラー内に配置した。
アニーリングプログラムが終了したら、ビーズをサーモサイクラーから取り出し、10秒の遠心分離によってペレット化し、チューブを180°回転させ、さらに10秒スピンさせた。上清みを廃棄し、200μLのアニーリングバッファーを添加した。ビーズを5秒間のボルテックスで再懸濁させ、ビーズを先のようにしてペレット化した。上清みを除去し、ビーズを100μLのアニーリングバッファー中に再懸濁させ、この時点でビーズをMultisizer 3 Coulter Counterで定量した。ビーズを4℃で保存すると、少なくとも1週間安定であった。
【0143】

4.9 Bst DNAポリメラーゼラージフラグメントおよびSSBタンパク質とのDNAビーズのインキュベーション
ビーズ洗浄バッファー(100mL)を、アピラーゼ(Biotage)(最終活性8.5単位/L)を0.1%のBSAを含有する1×アッセイバッファーに添加することによって調製した。光ファイバースライドを2次純水から取り出し、ビーズ洗浄バッファー中でインキュベートした。90万個の事前に調製したDNAビーズを遠心分離し、上清みを注意深く除去した。次いで、ビーズを、1290μlのビーズ洗浄バッファー(0.4mg/mLのポリビニルピロリドン(MW360,000)、1mMのDTT、175μgの大腸菌単鎖結合タンパク質(SSB)(United States Biochemicals)および7000単位のBst DNAポリメラーゼラージフラグメント(New England Biolabs)含有)中でインキュベートした。ビーズは、回転体において室温で30分間インキュベートした。
【0144】

4.10 酵素ビーズおよび微粒子充填剤の調製
UltraGlow Luciferase(Promega)とBst ATPスルフリラーゼを、研究所内で、ビオチンカルボキシ担体タンパク質(BCCP)融合体として調製した。87−アミノ酸BCCP領域は、大腸菌内での該融合タンパク質のインビボ発現中にビオチンが共有結合するリシン残基を含む。このビオチン化ルシフェラーゼ(1.2mg)とスルフリラーゼ(0.4mg)を、製造業者の使用説明書に従って予備混合し、2.0mLのDynal M280常磁性のビーズ(10mg/mL、Dynal SA,Norway)に4℃で結合させた。酵素結合ビーズを、2000μLのビーズ洗浄バッファー中で3回洗浄し、2000μLのビーズ洗浄バッファー中に再懸濁させた。
【0145】
Seradyn微粒子(Powerbind SA、0.8μm、10mg/mL、Seradyn Inc)を以下のとおりに調製した。1050μLのストックを、0.1%のBSAを含有する1000μLの1×アッセイバッファーで洗浄した。微粒子を9300gで10分間遠心分離し、上清みを除去した。洗浄をもう2回繰り返し、微粒子を0.1%のBSAを含有する1050μLの1×アッセイバッファー中に再懸濁させた。ビーズおよび微粒子は、使用時まで氷上で保存される。
【0146】

4.11 ビーズの堆積
Dynal酵素ビーズおよびSeradyn微粒子を1分間ボルテックスし、各々1000μLを新たなマイクロ遠心チューブ内で混合し、手短にボルテックスし、氷上で保存した。酵素/Seradynビーズ(1920μl)をDNAビーズ(1300μl)と混合し、最終容量をビーズ洗浄バッファーで3460μLに調整した。ビーズを順に層状に堆積させた。光ファイバースライドをビーズ洗浄バッファーおよび第1層から取り出し、DNAと酵素/Seradynビーズの混合物を堆積させた。遠心分離後、第1層の上清みを、光ファイバースライドおよび第2層から吸引し、Dynal酵素ビーズを堆積させた。このセクションでは、どのようにして異なる層を遠心分離したかをより詳細に記載する。
【0147】
第1層. 60×60mmの光ファイバースライドの表面上に2つの30×60mmの活性領域をもたらすガスケットを、ジグ上面に割り当てられたステンレス鋼ダウエルに注意深く取り付けた。光ファイバースライドをジグ内に、スライドのエッチングされていない平滑側面を下にして配置し、ジグ上面/ガスケットを、スライドのエッチングされた側面上に取り付けた。次いで、ジグ上面を、設けられたネジで、両端が手できつく締められるように締めることにより適正に固定した。DNA−酵素ビーズ混合物を、ジグ上面に設けられた2つの供給ポートから光ファイバースライドに負荷した。ビーズ混合物の負荷中、気泡が最小限となるように細心の注意を払った。各堆積は、ピペットプランジャーの1回の静かな連続推進で終了した。GH 3.8−Aローターを有するBeckman CouLter Allegra 6遠心機内で、アセンブリ全体を2800rpmで10分間遠心分離した。遠心分離後、ピペットで上清みを除去した。
【0148】
第2層. 先に記載のようにして、Dynal酵素ビーズ(920μL)を2760μLのビーズ洗浄バッファーと混合し、3400μLの酵素−ビーズ懸濁液を光ファイバースライド上に負荷した。スライドアセンブリを2800rpmで10分間遠心分離し、上清みをデカントした。光ファイバースライドをジグから取り出し、機器に負荷する用意ができるまでビーズ洗浄バッファーに保存する。
【0149】

4.12 454機器での配列決定
すべてのフロー試薬は、0.4mg/mLのポリビニルピロリドン(MW 360,000)、1mMのDTTおよび0.1%のTween 20を含む1×アッセイバッファーにおいて調製した。基質(300μMのD−ルシフェリン(Regis)および2.5μMのアデノシンホスホ硫酸(Sigma))は、0.4mg/mLのポリビニルピロリドン(MW 360,000)、1mMのDTTおよび0.1%のTween 20を含む1×アッセイバッファーにおいて調製した。アピラーゼ洗浄液は、アピラーゼを最終活性8.5単位/Lまで、0.4mg/mLのポリビニルピロリドン(MW 360,000)、1mMのDTTおよび0.1%のTween 20を含む1×アッセイバッファー中に添加することによって調製する。基質バッファー中、デオキシヌクレオチドdCTP、dGTPおよびdTTP(GE Biosciences)は、終濃度6.5μMに調製し、α−チオデオキシアデノシン三リン酸(dATPαS、Biolog)およびピロリン酸塩ナトリウム(Sigma)は、それぞれ、終濃度50μMのおよび0.1μMに調製した。
【0150】
454配列決定機器は、3つの主なアセンブリ:流体工学サブシステム、光ファイバースライドカートリッジ/フローチャンバ、および画像形成サブシステムからなる。試薬供給ライン、マルチバルブマニホルド、および蠕動ポンプは、流体工学サブシステムの一部を構成する。個々の試薬は、適切な試薬供給ラインに接続されており、これにより、1回に1種類の試薬を予めプログラムされた流速および持続期間でフローチャンバ内に試薬送達することが可能となる。光ファイバースライドカートリッジ/フローチャンバは、スライドのエッチング側とフローチャンバの天井との間に250μmの空間を有する。また、フローチャンバには、試薬および光ファイバースライドの温度制御手段、ならび遮光ハウジングを含めた。スライドの研磨(非エッチング)側を、直に画像形成システムと接触させて配置した。
【0151】
光ファイバースライドウェル内への配列決定用試薬の循環的送達、および該ウェルからの配列決定反応副生成物の洗浄は、流体工学システムの予めプログラムされた操作によって行なわれた。このプログラムは、各スクリプト工程の試薬名(Wash、dATPαS、dCTP、dGTP、dTTP、およびPPi標準)、流速および持続期間を指定するインターフェース制御言語(ICL)スクリプトの形態で作成されたものであった。流速は、すべての試薬で4mL/分に設定し、フローチャンバ内の線速度はおよそ1cm/秒とした。配列決定用試薬のフロー順はカーネルに組織化し、ここで、第1カーネルは、PPiフロー(21秒)の後、14秒間の基質フロー、28秒間のアピラーゼ洗浄液および21秒間の基質フローで構成した。第1PPiフローの後、21サイクルのdNTPフロー(dC−基質−アピラーゼ洗浄液−基質dA−基質−アピラーゼ洗浄液−基質−dG−基質−アピラーゼ洗浄液−基質−dT−基質−アピラーゼ洗浄液−基質)とし、ここで、各dNTPフローは4つの個々のカーネルで構成した。各カーネルは長さ84秒間であり(dNTP−21秒、基質フロー−14秒、アピラーゼ洗浄液−28秒、基質フロー−21秒);画像は、21秒後および63秒後に取得する。21サイクルのdNTPフロー後、PPiカーネルを導入した後、次いで、さらに21サイクルのdNTPフローを行なう。配列決定実行の終了後、第3PPiカーネルを導入した。総実行時間は244分間であった。この実行を終了するのに必要とされる試薬容量は、以下のとおり:500mLの各洗浄液、100mLの各ヌクレオチド溶液である。実行中、すべての試薬は室温で維持した。フローチャンバおよびフローチャンバ供給チュービングの温度は30℃に制御し、フローチャンバに入れる試薬はすべて30℃に予備加熱する。
【0152】

実施例5 土壌試料の解析
本発明の方法を用いた解析のため、核酸を土壌中生物体から抽出した。抽出は、DNA抽出キット(Epicentre(Madison,WI,USA)を用いて製造業者の指示書に従って行なった。
【0153】
簡単には、550μLのインヒビター除去樹脂を各空のスピンカラム(Epicentre製)に添加した。カラムを2000×gで1分間遠心分離してカラムを充填した。フロースルー分を除去し、さらに550uLのインヒビター除去樹脂を各カラムに添加した後、2000×gで2分間の遠心分離を行なった。
【0154】
100mgの土壌を1.5mL容チューブ内に採取し、250uLの土壌DNA抽出バッファーを、2uLのプロテイナーゼKとともに添加した。この溶液をボルテックスし、50uLの土壌溶解バッファーを添加し、再度ボルテックスした。チューブを65Cで10分間インキュベートし、次いで、1000×gで2分間遠心分離した。180μLの上清みを新たなチューブに移し、60uLのタンパク質沈殿試薬を、チューブを反転させることによって混合することにより添加した。チューブを氷上で8分間インキュベートし、最大速度で8分間遠心分離した。100〜150μLの上清みを、調製済スピンカラム上に直接移し、カラムを1.5mL容チューブ内に2000×gで2分間遠心分離した。カラムを廃棄し、溶出液を収集した。6uLのDNA沈殿溶液を溶出液に添加し、手短なボルテックスによってチューブを混合した。室温で5分間のインキュベーション後、チューブを最大速度で5分間遠心分離した。上清みを除去し、ペレットを500uLのペレット洗浄液で洗浄した。チューブを反転させて溶液を混合し、次いで、この溶液を最大速度で3分間遠心分離した。上清みを除去し、洗浄工程を繰り返した。上清みを再度除去し、最終ペレットを300uLのTEバッファー中に再懸濁させた。
【0155】
得られたDNA試料は本発明の方法に使用され得、例えば、少なくとも、遺伝子座におけるヌクレオチド頻度の検出方法に使用され得る。
【0156】

実施例6 HIVクレイドBプライマーの設計
HIVゲノムにおける高レベルの変異性のため、多数の配列のアラインメントをコンパイルした。Los Alamos National Laboratoryに保存されたHIV配列データベースを、POL領域(これは、プロテアーゼ領域、逆転写酵素領域、およびインテグラーゼコード領域を含む)におけるデータを有するHIV−IクレイドB配列に関して検索した。6000個を超える高品質の配列をアラインメントし、コンセンサス配列を得た。次いで、この配列をアプリケーションサーバーにアップロードし、標的配列として該コンセンサス配列を用いて突然変異プロットを作成した。このプロットから保存領域が特定され、該保存領域に対するプライマーを設計した。
【0157】
このプライマーを、まず、一群の4つの参照配列(1A、4A、8Aおよび4B)予測サイズのアンプリコンを生成する能力について試験した。最終プライマーセットは、プロテアーゼ領域および逆転写酵素領域の対象領域すべてが多重にカバーされるように選択した。また、4種類のプライマーは、各々、プライマー結合および大部分(>10〜30%)の配列の表現型に決定的と思われる1つのヌクレオチド位置が異なる2つの配列の混合物となるように設計した。このストラテジーにより、所与の配列において1つや2つのプライマーにミスがあっても、たいていの場合、完全にカバーすることが可能になる。プライマーおよびアンプリコンの位置は、図12のこれらの概略図に示す。
【0158】

実施例7 アンプリコンストラテジーの試験
実施例6のアンプリコンストラテジーを、合計8種類の参照試料(1A、4A、8A、4B、14、15、17、および25と表示)を配列決定することにより試験した。これらの参照試料は、ネステッドPCR法による1.4Kbのアンプリコンの形態であった。アンプリコンは参照試料から、15サイクルのPCRによって生成させ、乳液は、アンプリコンAキットおよびアンプリコンBキットを用いて作製した。ある場合では、単一のアンプリコンを配列決定し、またある場合では、乳液工程の際に数種類を一緒に混合した。次いで、アンプリコンの配列決定を、ネブライズさせ、ランダムライブラリーとして配列決定した全く同じ1.4Kbのアンプリコンの配列決定と比較した。ネブライズした試料は、各位置における実施のヌクレオチド組成の検出に関して偏りが最小限であると仮定した。すべての場合で、アンプリコンとライブラリーの突然変異プロットの配列決定間に優れた一致性が得られた。プライマー結合領域における唯一の問題は、縮重位置による突然変異の導入およびプライマーよりも突然変異の試料の明白な抑制のため起こった。これらの問題はともに、解析前に各アンプリコンからプライマー部位の配列自動的に除くアンプリコンデータ解析ソフトウェアを用いて解決される。
【0159】
1つの長鎖のcDNA断片を作製し、次いで1.4Kbのアンプリコン(合計75サイクルのネステッドPCRを使用)を増幅させて本発明者らの鋳型を得ることは、次善的であった。これは多数回のPCRサイクルを伴うが、単一cDNAストラテジーが、患者の被検物質中に存在するRNA疑似種プール全体を充分に反映しているかは明白ではない。したがって、多数のcDNA断片、ここでは図12に示すように3つ(1つはプロテアーゼおよび2つはRT、配列をほぼ等しい3つの部分に分割)を作製するストラテジーを採用する。SuperscriptII(MMLV RT由来)は合成中RNAをcDNAに置き換えず、したがって、混合反応物中では最も3’側の配列に偏りが導入されるため、反応は別々に行なわなければならない。
【0160】
平均収量がおよそ150ng/アンプリコンの40サイクルのPCRによって、一貫したアンプリコン増幅が達成される。高いウイルス負荷の試料では、より少ないサイクル数の増幅を使用することが可能である。
【0161】

実施例8 被検体のプロテアーゼ領域およびRT領域におけるHIV変異
記載の本発明のアンプリコンストラテジーを、コンセンサス配列と比べるといくつかの配列バリアントを有するHIV陽性被検体において試験した。各変異の程度を含む配列バリアントの表示を図14に示す。図14において、「変異の頻度」は、対応する配列位置のバーの高さで示され、0(すなわち、HIV被検体において0%の頻度)から1(すなわち、HIV被検体において100%の頻度)の範囲の階級で相対的である。また、被検体の対応する配列位置バリアントヌクレオチド種の特定は色で示される。図14で明白なように、この特定の被検体は、プロテアーゼ領域と逆転写酵素領域に数多くのバリアントを有し、一部は高い頻度で存在し、少数の群が低頻度で存在する。すべてのバリアントが記載の薬物耐性などの有害な効果と関連しているわけではないことは認識されよう。
【0162】

実施例9 PI薬物耐性と関連しているバリアントの確認
記載の本発明のアンプリコンストラテジーを、HIVプロテアーゼの選択的非ペプチド阻害剤であるナルフィナビル(Pfizer Inc.によってViracept(登録商標)として市販)と称される薬物に対する耐性と関連している特異的配列バリアントを有するHIV陽性被検体において試験した。この特定の被検体における特定の変異の頻度は、図15に示されるように、被検体から採取した試料中のウイルスRNA分子から、3.7%で存在すると確認された。また、図15は、被検体試料から得られたアンプリコン配列の、Gヌクレオチド種からAヌクレオチド種への変化(配列決定されたRNA分子の3.7%)を示すコンセンサス配列へのアラインメントの実例の1つを示す。図15はまた、被検体試料において配列決定されたRNA分子の数のパーセンテージでの変異の程度の例示的なグラフを示す(「読み取り」の数で表示)。用語「読み取り」は、本明細書で用いる場合、一般的に、実質的に同一の鋳型核酸分子コピーのクローン集団を含む単一の核酸鋳型分子から得られた配列データ全体をいう。この例では、バリアントは、配列位置244における単一ヌクレオチド変化であり、これは、品質管理基準に合格した2000個を超える配列読み取りの3.7%に存在することがわかった。
【0163】

実施例10 NNRTI薬物耐性と関連しているバリアントの確認
記載の本発明のアンプリコンストラテジーを、すべて非ヌクレオシド逆転写酵素阻害剤(NNRTI)であるデラビルジン(Pfizer Inc.によってRescriptor(登録商標)として市販)、ネビラピン(Boehringer Ingelheim Pharmaceuticals Inc.によってViramune(登録商標)として市販)、エファビレンツ(Bristol Myers SquibbによってSustiva(登録商標)として市販)、およびエトラビリン(登録商標)(Tibotec TherapeuticsによってIntelenceとして市販)と称される薬物に対する耐性と関連している特異的配列バリアントを有するHIV陽性被検体において試験した。この特定の被検体における特定の変異の頻度は、図16に示されるように、被検体から採取した試料中のウイルスRNA分子から、1.0%で存在すると確認された。また、図16は、被検体試料から得られたアンプリコン配列の、Aヌクレオチド種からGヌクレオチド種への変化(配列決定されたRNA分子の1.0%)を示すコンセンサス配列へのアラインメントの実例の1つを示す。図16はまた、被検体試料において配列決定されたRNA分子の数のパーセンテージでの変異の程度の例示的なグラフを示す(「読み取り」の数で表示)。この例では、バリアントは、配列位置995における単一ヌクレオチド変化であり、これは、品質管理基準に合格した約5000個の配列読み取りの1.0%に存在することがわかった。
【0164】

実施例11 NRTI薬物耐性と関連しているバリアントの確認
記載の本発明のアンプリコンストラテジーを、特定のコドン内に、ヌクレオチド/ヌクレオシド逆転写酵素阻害剤(NRTI)に対する以前の耐性と関連している配列バリアントを有するHIV陽性被検体において試験した。確認された変異は、図17に示されるように、該コドンの最初の2つの位置に存在し、第1のバリアントはAヌクレオチド種からGヌクレオチド種への変化であり、第2はCヌクレオチド種からAヌクレオチド種の変化である。図17の例において、第1および第2の位置における変化は、同じRNA配列内に存在するのではなく、各々、独立したRNA分子に存在することは明白である。
【0165】
【化11】

【0166】
【化12】


【特許請求の範囲】
【請求項1】
(a) HIV試料集団の各RNA分子から複数のcDNA種を作製する工程;
(b) 該cDNA種から複数の第1のアンプリコンを増幅させる工程であって、ここで、該第1のアンプリコンは各々、複数の増幅コピーを含み、該第1のアンプリコンの遺伝子座を規定する1対の核酸プライマーで増幅される、工程;
(b)該第1のアンプリコンの増幅コピーをクローン増幅させ、複数の第2のアンプリコンを得る工程であって、ここで、該複数の第2のアンプリコンは、第1のアンプリコンの増幅コピーの1つと実質的に同一のコピーの固定化集団を含む、工程;
(c)該固定化集団の少なくとも100個からの実質的に同一のコピーの核酸配列組成を、単一の機器においてパラレルで決定する工程;および
(d)該少なくとも100個の固定化集団の核酸配列組成において、5%以下の頻度で存在する1つ以上の配列バリアントを検出する工程;および
(e)検出された配列バリアントを、HIV薬物耐性と関連している変異と相関させる工程、
を含む、薬物耐性と関連している1つ以上のHIV配列バリアントの低頻度存在の検出方法。
【請求項2】
HIV薬物耐性と関連している変異が、特定の薬物クラスまたは薬物と関連していることがわかっている、請求項1に記載の方法。
【請求項3】
HIV薬物クラスが、プロテアーゼ阻害剤、ヌクレオチド/ヌクレオシド逆転写酵素阻害剤、および非ヌクレオシド逆転写酵素阻害剤からなる群より選択される、請求項2に記載の方法。
【請求項4】
該複数のcDNA種が3種類のcDNA種を含む、請求項1に記載の方法。
【請求項5】
3種類のcDNA種の各々が、少なくとも1つの隣接cDNA種とオーバーラップする配列組成を有する、請求項1に記載の方法。
【請求項6】
HIV試料集団が1人の患者に由来するものである、請求項1に記載の方法。
【請求項7】
1人の患者が薬物未処置の患者である、請求項1に記載の方法。
【請求項8】
1人の患者が、以前にHIV抗レトロウイルス剤療法に曝露された患者である、請求項1に記載の方法。
【請求項9】
該複数の第1のアンプリコンが8種類のアンプリコンを含む、請求項1に記載の方法。
【請求項10】
第1のアンプリコンの該1対のプライマーが、突然変異頻度が低い領域を標的化する、請求項1に記載の方法。
【請求項11】
第1のアンプリコンのための該1対のプライマーが、クレイドBおよびクレイドCからなる群より選択されるHIVクレイドに特異的である、請求項1に記載の方法。
【請求項12】
クレイドBに特異的な第1のアンプリコンのための該1対のプライマーが、B−ACF−1(配列番号:39)とB−AR(配列番号:36);B−ACF−2(配列番号:40)とB−AR(配列番号:36);B−BF(配列番号:35)とB−BR(配列番号:38);B−ACF−1(配列番号:39)とB−CR(配列番号:37);B−ACF−2(配列番号:40)とB−CR(配列番号:37);B−1F(配列番号:42)とB−1R−1(配列番号:44);B−1F(配列番号:42)とB−1R−2(配列番号:45);B−2F(配列番号:43)とB−2R(配列番号:49);B−3F(配列番号:50)とB−3R(配列番号:51);B−4F(配列番号:41)とB−4R−1(配列番号:46);B−4F(配列番号:41)とB−4R−2(配列番号:47);B−5F(配列番号:48)とB−5R−1(配列番号:52);およびB−5F(配列番号:48)とB−5R−2(配列番号:53)からなる群より選択されるプライマー対の群を含む、請求項11に記載の方法。
【請求項13】
クレイドCに特異的な第1のアンプリコンのための該1対のプライマーが、C−ACF−1(配列番号:54)とC−AR−1(配列番号:58);C−ACF−1(配列番号:54)とC−AR−2(配列番号:59);C−ACF−2(配列番号:55)とC−AR−1(配列番号:58);C−ACF−2(配列番号:55)とC−AR−2(配列番号:59);C−BF−1(配列番号:56)とC−BR(配列番号:61);C−BF−2(配列番号:57)ミックスとC−BR(配列番号:61);C−ACF−1(配列番号:54)とC−CR(配列番号:60);C−ACF−2(配列番号:55)とC−CR(配列番号:60);C−1F−1(配列番号:63)とC−1R−1(配列番号:65);C−1F−1(配列番号:63)とC−1R−2(配列番号:66);C−1F−2(配列番号:64)とC−1R−1(配列番号:65);C−1F−2(配列番号:64)とC−1R−2(配列番号:66);C−2F−1(配列番号:67)とC−2R(配列番号:73);C−2F−2(配列番号:68)とC−2R(配列番号:73);C−3F−1(配列番号:74)とC−3R(配列番号:78);C−3F−2(配列番号:75)とC−3R(配列番号:78);C−3F−3(配列番号:76)とC−3R(配列番号:78);C−3F−4(配列番号:77)とC−3R(配列番号:78);C−4F(配列番号:62)とC−4R−1(配列番号:69);C−4F(配列番号:62)とC−4R−2(配列番号:70);C−5F−1(配列番号:71)とC−5R(配列番号:79);およびC−5F−2(配列番号:72)とC−5R(配列番号:79)からなる群より選択されるプライマー対の群を含む、請求項11に記載の方法。
【請求項14】
第1のアンプリコンの遺伝子座が、プロテアーゼと関連しているHIVの領域を含む、請求項1に記載の方法。
【請求項15】
第1のアンプリコンの遺伝子座が、逆転写酵素と関連しているHIVの領域を含む、請求項1に記載の方法。
【請求項16】
第2のアンプリコンが、1対の一般的なプライマーを用いて増幅される、請求項1に記載の方法。
【請求項17】
各配列バリアントが信頼度99%レベルで検出される、請求項1に記載の方法。
【請求項18】
少なくとも400個の固定化集団で実質的に同一のコピーの核酸組成が決定され、検出された各配列バリアントが1.25%以下の頻度で存在する、請求項1に記載の方法。
【請求項19】
少なくとも10000個の固定化集団で実質的に同一のコピーの核酸組成が決定され、検出された各配列バリアントが0.050%以下の頻度で存在する、請求項1に記載の方法。
【請求項20】
少なくとも200000個の固定化集団で実質的に同一のコピーの核酸組成が決定され、検出された各配列バリアントが0.003%以下の頻度で存在する、請求項1に記載の方法。
【請求項21】
単一の機器が、複数の反応部位を含む単一の基質を含む、請求項1に記載の方法。
【請求項22】
単一の機器が、複数の配列決定反応から生成されるシグナルを検出できる単一の検出デバイスを含む、請求項1に記載の方法。
【請求項23】
B−ACF−1(配列番号:39)とB−AR(配列番号:36);B−ACF−2(配列番号:40)とB−AR(配列番号:36);B−BF(配列番号:35)とB−BR(配列番号:38);B−ACF−1(配列番号:39)とB−CR(配列番号:37);B−ACF−2(配列番号:40)とB−CR(配列番号:37);B−1F(配列番号:42)とB−lR−1(配列番号:44);B−1F(配列番号:42)とB−1R−2(配列番号:45);B−2F(配列番号:43)とB−2R(配列番号:49);B−3F(配列番号:50)とB−3R(配列番号:51);B−4F(配列番号:41)とB−4R−1(配列番号:46);B−4F(配列番号:41)とB−4R−2(配列番号:47);B−5F(配列番号:48)とB−5R−1(配列番号:52);およびB−5F(配列番号:48)とB−5R−2(配列番号:53)からなる群より選択される1組以上のHIVクレイドBに特異的なプライマー対を含む、請求項1に記載の方法を行なうためのキット。
【請求項24】
C−ACF−1(配列番号:54)とC−AR−1(配列番号:58);C−ACF−1(配列番号:54)とC−AR−2(配列番号:59);C−ACF−2(配列番号:55)とC−AR−1(配列番号:58);C−ACF−2(配列番号:55)とC−AR−2(配列番号:59);C−BF−1(配列番号:56)とC−BR(配列番号:61);C−BF−2(配列番号:57)ミックスとC−BR(配列番号:61);C−ACF−1(配列番号:54)とC−CR(配列番号:60);C−ACF−2(配列番号:55)とC−CR(配列番号:60);C−1F−1(配列番号:63)とC−1R−1(配列番号:65);C−1F−1(配列番号:63)とC−1R−2(配列番号:66);C−1F−2(配列番号:64)とC−1R−1(配列番号:65);C−1F−2(配列番号:64)とC−1R−2(配列番号:66);C−2F−1(配列番号:67)とC−2R(配列番号:73);C−2F−2(配列番号:68)とC−2R(配列番号:73);C−3F−1(配列番号:74)とC−3R(配列番号:78);C−3F−2(配列番号:75)とC−3R(配列番号:78);C−3F−3(配列番号:76)とC−3R(配列番号:78);C−3F−4(配列番号:77)とC−3R(配列番号:78);C−4F(配列番号:62)とC−4R−1(配列番号:69);C−4F(配列番号:62)とC−4R−2(配列番号:70);C−5F−1(配列番号:71)とC−5R(配列番号:79);およびC−5F−2(配列番号:72)とC−5R(配列番号:79)からなる群より選択される1組以上のHIVクレイドCに特異的なプライマー対を含む、請求項1に記載の方法を行なうためのキット。

【図1】
image rotate

【図2】
image rotate

【図3A】
image rotate

【図3B】
image rotate

【図3C】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

image rotate


【公表番号】特表2010−521156(P2010−521156A)
【公表日】平成22年6月24日(2010.6.24)
【国際特許分類】
【出願番号】特願2009−553642(P2009−553642)
【出願日】平成20年3月14日(2008.3.14)
【国際出願番号】PCT/US2008/003424
【国際公開番号】WO2008/115427
【国際公開日】平成20年9月25日(2008.9.25)
【出願人】(507331232)454 ライフ サイエンシーズ コーポレイション (11)
【Fターム(参考)】