説明

HIV親和性バリアントの検出のためのシステムおよび方法

HIV試料集団中のそれぞれのRNA分子からcDNA種を生成する工程;該cDNA種から少なくとも1つの第1アンプリコンを増幅する工程、それぞれの第1アンプリコンは複数の増幅されたコピーを含み、第1アンプリコンの座を規定する一対の核酸プライマーで増幅される;第1アンプリコンの増幅されたコピーをクローン増幅して、複数の第2アンプリコンを生成する工程、複数の第2アンプリコンは、第1アンプリコンの増幅されたコピーの1つに由来する実質的に同じコピーの固定された集団を含む;少なくとも100の固定された集団に由来する実質的に同じコピーの核酸配列組成を、単一基材上で並行して決定する工程;および少なくとも100の固定された集団の核酸配列組成中で5%以下の頻度で存在する1つ以上の配列バリアントを検出する工程;および検出された配列バリアントをHIV親和性に関連のある変形と相関する工程を含む、低出現頻度の薬物耐性に関わる1つ以上のHIV配列バリアントを検出するための方法の態様が記載される。

【発明の詳細な説明】
【技術分野】
【0001】
発明の分野
本発明は、世界中で見られる感染の大部分を占めるクレードA、B、C、DおよびGのHIV-1親和性と関連する配列バリアントを検出および解析するためのシステム、方法、試薬およびキットを提供する。また、本発明は、感染の1%未満を占め、入手可能な配列情報量が限られたクレードF、H、JおよびKの配列バリアントの解析のための利用も提供する。本発明の有力な局面は、標的ポリヌクレオチドの集団、例えば、患者試料由来の集団からバリアントが並行して検出され、該集団におけるバリアントの対立遺伝子の頻度が測定されることである。また、本発明は、望ましい結果の見込みが最も高い治療計画の決定ためのバリアント頻度の解析を含む。
【背景技術】
【0002】
発明の背景
ヒト免疫不全ウイルス(一般に、HIVと称される)は、多くの化合物が治療用に承認されているにもかかわらず、世界中で継続して大きな問題となっている。ウイルス逆転写酵素のエラーを生じやすい性質および高いウイルスターンオーバー(t1/2 = 1〜3日間)のため、HIVゲノムは非常に急速に変異する。例えば、逆転写酵素は、平均で、ウイルスの増殖能には劇的に影響しない9.7Kbのゲノムの1回の複製あたり1回の変異が起こると推定されている。これにより、多くの異なる変異体が動的関係で存在する「疑似種」の形成がもたらされる。
【0003】
HIVウイルス粒子は、CD4受容体および共受容体分子を介して細胞に侵入する。任意のウイルス粒子は、共受容体特異性により、親和性が決定される(用語「親和性」は、一般的に、特定の細胞および受容体型に対するウイルス粒子の親和性をいう)。HIV-1株のほとんどは、ケモカイン受容体CCR5(R5親和性)、CXCR4(X4親和性)または両方(R5X4あるいは二重親和性)を利用する。感染したばかりの個体は主にR5親和性ウイルスを有するようであり、SI表現型は、後期HIV感染および低CD4細胞計数ならびにAIDS進行の加速と関連している。HIV親和性株のさらなる例およびその疾患進行との関係は、Poveda et al.,AIDS 2006、20:1359-1367;Jensen et al.,AIDS Rev 2003;5:104-112;Jensen et al.,Journal of Virology May 2006、p. 4698-4704;Jensen et al.,Journal of Virology、Dec. 2003、p. 13376-13388;およびNelson et al.,Journal of Virology、Nov. 1997、p. 8750-8758に記載されており、これらは各々、あらゆる目的のために参照によりその全体が本明細書に援用される。
【0004】
現在、共受容体との相互作用を破壊することによりHIV侵入を阻害するFDA承認薬は1つしかないが、多くの薬が開発中である。マラビロク(シーエルセントリとしても知られており、これはPfizer Inc.から販売されている)は、低分子CCR5インヒビターである。FDAから発表されている現行の推奨には、マラビロクを処方する前に各患者のHIV集団を親和性について試験するよう示されている。これは、マラビロク臨床試験での治療が不成功であった患者におけるHIV疑似種のクローン解析により、治療開始前に少量のX4親和性ウイルスが存在していたことが示され、CCR5侵入に対する選択肢によって大部分のR5株よりもX4ウイルスに利点がもたらされたと考えられるという事実のためである。この耐性発現様式は、有意なHIV感染被検体サブセットが、薬物曝露の前に既に存在する耐性株を有する(ほとんどの場合、治療経験個体由来のウイルスへの曝露による一次感染のため)という、「古典的」HIV薬、すなわち、プロテアーゼおよび逆転写酵素インヒビターに対する耐性の出現と類似している。この経路に加えて、耐性株は、上記のようなウイルス逆転写酵素のエラーを生じやすい性質による薬物選択的圧力下での複製によって、野生型ウイルスから継続的に新たに生成される。しかしながら、既存の耐性ウイルス、またはマラビロク治療の場合はX4親和性ウイルスの増殖は薬物治療下でより効率的であり、治療不成功の加速をもたらす。
【0005】
ウイルス親和性は、gp120表面エンベロープタンパク質内の露出アミノ酸配列によって決定される。特に、V3(第3可変)領域が共受容体使用選択に関与している。名前が示すように、ほぼ35アミノ酸長配列が高度に可変性であるが、この配列に位置するR5親和性ウイルスおよびX4親和性ウイルスを区別する一般的な特徴が存在する。いくつかの親和性予測アルゴリズムが、直接V3配列に基づいて開発されており、これらは、おそらく、今後数年間で継続的に精密化されるであろう。例えば、V3内のアミノ酸残基を親和性表現型と直接相関させる(また、該表現型を決定することもできる)いくつかの部位特異的スコアリングマトリックス(PSSM)アルゴリズムが公表されており、一部のものは、インターネットにから入手することさえできる。
【0006】
表現型親和性試験は、現在、市販されているが高価であり、労力と費用がかかる。さらに、表現型決定は、ウイルス配列のライブラリーの効率的な作製に大きく依存するため、クローニングの偏向により、体系的な試験エラーが生じる。表現型決定および配列に基づいた親和性測定はともに、現在、集団アッセイとして行なわれているが、これは、性質上、各ウイルス株のクローン分離に基づいたアッセイよりも感度が低い。しかしながら、クローン解析は、高感度を達成するためには、極めて労力がかかり、各被検体由来の数千個のクローンの試験が必要である。本発明に記載の態様は、労力がかかるクローニング工程を用いずに、クローン配列をウイルスRNA疑似種から直接得る、配列に基づいた親和性測定アッセイを含む。454 Life Science Corporationから入手可能な454という長い読取長さの配列決定法は、1回の配列決定の実行で多くの被検体から数千個のクローン読取を得るのに理想的に適している。さらに、記載の配列決定技術の態様により、「大規模並列(Massively Parallel)」と称されることがある技術で集団内に1%以下の頻度の対立遺伝子バリアントを含む低アバンダンスバリアントの感度のよい検出を達成させ得ることが可能である。これを、親和性予測アルゴリズムと合わせると、親和性情報を非常に高感度で迅速かつ効率的に得るための簡便な方法が提供される。
【発明の概要】
【0007】
発明の概要
本発明の一部の態様は、核酸配列の決定に関する。より詳しくは、本発明の一部の態様は、SBSによる核酸の配列決定の際に得られたデータのエラーを補正するための方法およびシステムに関する。
【0008】
HIV試料集団の各RNA分子からcDNA種を生成させる工程;少なくとも1つの第1アンプリコンをcDNA種から増幅する工程、ここで、各第1アンプリコンは、複数の増幅コピーを含み、第1アンプリコンの遺伝子座を規定する1対の核酸プライマーを用いて増幅される;第1アンプリコンの増幅コピーをクローン増幅し、複数の第2アンプリコンを生成させる工程、ここで、複数の第2アンプリコンは、第1アンプリコンの増幅コピーの1つに由来する実質的に同一コピーの固定化した集団を含む;少なくとも100の固定化した集団由来の実質的に同一コピーの核酸配列組成を、単一の基材上で並行して決定する工程;および少なくとも100の固定化した集団の核酸配列組成中の5%以下の頻度で存在する1つ以上の配列バリアントを検出する工程;および検出された配列バリアントを、HIV親和性と関連する変形(variation)と相関させる工程を含む、薬物耐性と関連する1種類以上のHIV配列バリアントの低頻度の存在を検出するための方法の一態様を記載する。
【0009】
以下に詳細に開示するこの新規な方法により、各配列バリアントが99%信頼レベルで検出され得る。
【0010】
したがって、一態様において、該新規な方法は、少なくとも400の固定化した集団に由来する実質的に同一コピーの核酸組成を測定するために使用され、検出された各配列バリアントは、1.85%以下の頻度で存在する。特定の態様において、該新規な方法は、少なくとも10000の固定化した集団に由来する実質的に同一コピーの核酸組成を測定するために使用され、検出された各配列バリアントは0.74%以下の頻度で存在する。非常に特定の態様において、該新規な方法は、少なくとも200000の固定化した集団に由来する実質的に同一コピーの核酸組成を測定するために使用され、検出された各配列バリアントは0.003%以下の頻度で存在する。
【0011】
また、V3-1FとV3-1R;V3-2FとV3-2R;V3-1FとV3-2R;およびV3-2FとV3-1Rからなる群より選択される 1対以上のプライマーを含む、該方法を実施するためのキットを記載する。
【図面の簡単な説明】
【0012】
上記の特徴およびさらなる特徴は、添付の図面と合わせて考えると、以下の詳細説明から明白に認識されよう。図面において、同様の参照番号は同様の構造、要素または方法工程を示し、参照番号の左端の桁は、該参照要素を最初に示した図の番号を示す(例えば、要素160は最初に図1に示されている)。しかしながら、これらの規定はすべて、限定的ではなく典型的または例示的であることを意図する。
【図1】図1は、コンピュータ制御下にある配列決定装置および反応基材の一態様の機能ブロック図である。
【図2】図2Aおよび2Bは、HIV V3 env領域におけるアンプリコンとプライマー種の位置関係の一態様の一例の略図である。
【図3】図3は、HIV V3領域セクションに関する多数のHIV RNAから得られた配列データと、コンセンサス配列との比較の一態様の一例の略図である。図3に示した配列は、上から下に以下のとおり:配列番号:8、配列番号:8、配列番号:9、配列番号:9、配列番号:10、配列番号:8、配列番号:8、配列番号:11、配列番号:12、配列番号:8、および配列番号:8である。
【図4】図4Aおよび4Bは、HIV試料由来の親和性型と関連するHIV親和性ハプロタイプの同定された頻度の一態様の一例の略図である。図4Aに示した配列は、以下の配列(上から下に):配列番号:13、配列番号:14、配列番号:13、配列番号:14、配列番号:14、配列番号:13、配列番号:13、配列番号:13、配列番号:14、および配列番号:14に対応する。図4Bにおいて、配列は、上から下に以下のとおり:配列番号:15、配列番号:16、配列番号:15、および配列番号:15である。
【発明を実施するための形態】
【0013】
発明の詳細な説明
以下により詳細に記載するように、本記載の発明の一部の態様は、HIVバリアントを含む配列領域を増幅するために特異的なプライマー種を用いて、標的化配列決定するための、および増幅された配列領域をバリアントの高感度検出に使用するためのシステム、方法およびキットを含む。
【0014】
特に、本発明の一部の態様は、試料から増幅した標的核酸配列の集団を並行して配列決定し、集団の少なくとも1%で存在する各バリアントを検出し、検出されたバリアントを治療計画と関連させることにより、HIV親和性変形を調べることに関する。一態様において、試料中の集団HIVウイルス全体の代表的な集団に由来する1つ以上の標的領域が、ポリメラーゼ連鎖反応(PCR)によってクローン複製され、ここで、クローン集団(「アンプリコン」とも称する)は、各々、単一のウイルス粒子に由来する。クローン集団を平行に並べ、事前に既知の組成および未知の組成のバリアントならびに元の試料中のバリアントの頻度を代表する各バリアントの存在頻度を同定する。
【0015】
上記のように、本発明の一部の態様では、第3可変領域(本明細書において、以下、V3領域という)と称される領域を含むHIV RNAのenv領域またはその相補DNAを増幅するために特異的に設計された核酸プライマーが使用される。また、プライマーの標的配列は、標的領域に近位であるため、ならびにプライマーハイブリダイゼーションおよびHIV核酸集団における標的核酸領域の増幅が可能であることが予測され得る低い変異率を示すため特別に選択したものである。数千個の個々のHIVアンプリコンが、大規模並列で効率的で費用効果の高い様式で配列決定され、HIVウイルス粒子の集団に見られる配列バリアントの分布が得られる。
【0016】
a. 一般
用語「フローグラム(flow gram)」は、一般的に、SBS法、特に、ピロリン酸系配列決定法(「ピロ配列決定」とも称する)によって作成された配列データのグラフ表示をいい、より具体低に「ピログラム」と称されることもある。
【0017】
用語「読取」または「配列読取」は、本明細書で使用されるように、一般的に、単一の核酸鋳型分子または複数の実質的に同一コピーの鋳型核酸分子の集団から得られた配列データ全体をいう。
【0018】
用語「実行」または「配列決定の実行」は、本明細書で使用されるように、一般的に、1つ以上の鋳型核酸分子の配列決定操作で行なわれる一連の配列決定反応をいう。
【0019】
用語「フロー」は、本明細書で使用されるように、一般的に、鋳型核酸分子を含む環境への溶液の添加の連続または反復サイクルをいい、この場合、溶液は、発生期の分子に添加するためのヌクレオチド種、あるいは配列決定反応において使用され得る、または先のフローサイクルのヌクレオチド種の繰越し汚染もしくはノイズ効果を低減するために使用され得るバッファまたは酵素などの他の試薬を含み得る。
【0020】
用語「フローサイクル」は、本明細書で使用されるように、一般的に、ヌクレオチド種がサイクル中に1回のフローに供される一連の連続フローをいう(すなわち、フローサイクルは、T、A、C、Gの順のヌクレオチド種の逐次添加を含み得るが、他の配列の組合せもまた、定義の一部として考慮される)。典型的に、フローサイクルは、サイクルからサイクルへの同じ順序のフローを有する反復性サイクルである。
【0021】
用語「読取長さ」は、本明細書で使用されるように、一般的に、信頼性のある配列決定がなされ得る鋳型分子の長さの上限をいう。システムおよび/または方法の読取長さに寄与する要素は数多くのあり、限定されないが、鋳型核酸分子中のGC含有量の程度が挙げられる。
【0022】
用語「試験断片」、または「TF」は、本明細書で使用されるように、一般的に、品質管理、較正または他の関連目的に使用され得る既知配列組成の核酸エレメントをいう。
【0023】
「発生期の分子」は、一般的に、鋳型分子内の対応するヌクレオチド種に相補的なヌクレオチド種の組込みによる鋳型依存性DNAポリメラーゼによって伸長されるDNA鎖をいう。
【0024】
用語「鋳型核酸」、「鋳型分子」、「標的核酸」、または「標的分子」は、一般的に、配列データまたは情報を得る配列決定反応の対象である核酸分子をいう。
【0025】
用語「ヌクレオチド種」は、本明細書で使用されるように、一般的に、発生期の核酸分子内の典型的に組み込まれるプリン(アデニン、グアニン)およびピリミジン(シトシン、ウラシル、チミン)などの核酸単量体の実体(identity)をいう。
【0026】
用語「単量体反復配列」または「ホモポリマー」は、本明細書で使用されるように、一般的に、同じヌクレオチド種(すなわち、反復ヌクレオチド種)を含む2つ以上の配列位置をいう。
【0027】
用語「均一な伸長」は、本明細書で使用されるように、一般的に、実質的に同一の鋳型分子の集団の各構成員が、反応において同じ伸長工程を均一に行なっている伸長反応の関係または相をいう。
【0028】
用語「完成効率」は、本明細書で使用されるように、一般的に、所定のフロー中で適正に伸長される発生期の分子の割合をいう。
【0029】
用語「不完全伸長速度」は、本明細書で使用されるように、一般的に、発生期の全分子の数に対する適正に伸長されていない発生期の分子の数の比をいう。
【0030】
用語「ゲノムライブラリー」または「ショットガンライブラリー」は、本明細書で使用されるように、一般的に、生物または個体のゲノム全体に由来する、および/またはゲノム全体(すなわち、ゲノムの全領域)に相当する分子の集合をいう。
【0031】
用語「アンプリコン」は、本明細書で使用されるように、一般的に、ポリメラーゼ連鎖反応またはリガーゼ連鎖反応技術によって生成されるものなどの選択された増幅産物をいう。
【0032】
用語「バリアント」、「疑似種」、または「対立遺伝子」は、本明細書で使用されるように、一般的に、各々、類似しているが、互いにある程度の違いを有する配列組成をコードする複数の種の1つをいう。違いとしては、関連分野の当業者に知られた任意の型の遺伝子変形が挙げられ得、該変形としては、限定されないが、単一ヌクレオチド多型(SNP)、挿入または欠失(挿入/欠失の組合せ事象は「インデル」とも称される)、反復配列(タンデム反復配列とも称する)の数の違い、および構造の変形が挙げられる。
【0033】
用語「対立遺伝子頻度」または「対立遺伝子の頻度」は、本明細書で使用されるように、一般的に、特定のバリアントで構成された集団内のすべてのバリアントの割合をいう。
【0034】
用語「キー配列」または「キーエレメント」は、本明細書で使用されるように、一般的に、既知の位置の(すなわち、典型的には、ライゲートしたアダプターエレメント内に含まれる)鋳型核酸分子と関連し、鋳型分子から生成された配列データの品質管理参照として使用される既知配列組成を含む、核酸配列エレメント(典型的には、約4配列位置、すなわち、TGACまたはヌクレオチド種の他の組合せ)をいう。配列データは、正確な位置のキーエレメントと関連する既知配列組成を含む場合、品質管理にパスする。
【0035】
用語「キーパス(keypass)」または「キーパスウェル」は、本明細書で使用されるように、一般的に、反応ウェル内の既知配列組成の完全長核酸試験配列(すなわち、上記の「試験断片」または「TF」)の配列決定をいい、この場合、キーパス試験配列由来の配列の精度は、既知配列組成と比較され、配列決定の精度を測定するため、および品質管理のために使用される。典型的な態様において、配列決定の実行におけるウェルの総数の集団は、いくつかの態様において、局所的に分布し得るキーパスウェルである。
【0036】
用語「平滑端」は、本明細書で使用されるように、関連分野の当業者の理解と一致して解釈され、一般的に、1対の相補ヌクレオチド塩基種で終結した末端を有する線状二本鎖核酸分子をいい、この場合、1対の平滑端は、互いへのライゲーションに常に適合性である。
【0037】
用語「突出端」または「突出部」は、本明細書で使用されるように、関連分野の当業者の理解と一致して解釈され、一般的に、分子の一方の鎖の末端に1つ以上の非対ヌクレオチド種を有する線状二本鎖核酸分子をいい、ここで、非対ヌクレオチド種はいずれかの鎖に存在し得、単一の塩基位置または複数の塩基位置を含む(「付着端」と称されることもある)。
【0038】
用語「ビーズ」または「ビーズ基材」は、本明細書で使用されるように、一般的に、任意の簡便な大きさであり、任意の数の既知の材料、例えば、セルロース、セルロース誘導体、アクリル樹脂、ガラス、シリカゲル、ポリスチレン、ゼラチン、ポリビニルピロリドン、ビニルとアクリルアミドのコポリマー、ジビニルベンゼンなどと架橋したポリスチレン(例えば、Merrifield、Biochemistry 1964、3、1385-1390記載)、ポリアクリルアミド、ラテックスゲル、ポリスチレン、デキストラン、ゴム、シリコン、プラスチック、ニトロセルロース、海綿、シリカゲル、制御孔径ガラス、金属、架橋デキストラン(例えば、SephadexTM)アガロースゲル(SepharoseTM)で作製された任意の型のビーズ、および当業者に公知の他の固相ビーズ支持体をいう。
【0039】
試料の調製および処理、配列データの生成、ならびに配列データの解析と関連するシステムおよび方法のいくつかの例示的な態様を以下に一般的に記載する。その一部および全部は、本記載の発明の態様との使用に適している。特に、鋳型核酸分子の調製、鋳型分子の増幅、標的特異的アンプリコンおよび/またはゲノムライブラリーの作製、配列決定法および装置、ならびにコンピュータシステムのためのシステムおよび方法の例示的な態様を記載する。
【0040】
典型的な態様において、実験用または診断用試料からの核酸分子は、原料形態から調製し、ハイスループット配列決定に適した鋳型分子に処理しなければならない。処理方法は用途によって異なり得、種々の特徴を含む鋳型分子がもたらされる。例えば、ハイスループット配列決定のいくつかの態様において、少なくとも、特定の配列決定法によって配列データが正確に得られ得る長さである配列または読取長さを有する鋳型分子を作製することが好ましい。本実施例において、長さは、約25〜30塩基対、約50〜100塩基対、約200〜300塩基対、約350〜500塩基対500塩基対より大きい範囲、あるいは特定の配列決定適用に適した他の長さを含むものであり得る。いくつかの態様において、ゲノム試料などの試料由来の核酸は、当業者に公知のいくつかの方法を用いて断片化される。好ましい態様において、該方法は、核酸をランダムに断片し(すなわち、特定の配列または領域に選択的でない)、ネブライゼーション法または超音波処理法と称されるものを含み得る。しかしながら、制限エンドヌクレアーゼを用いる消化などの断片化の他の方法が断片化目的に使用され得ることは認識されよう。また、本実施例において、いくつかの処理方法では、所望の長さの核酸断片を選択的に単離するための当該技術分野で公知のサイズ選択方法が使用され得る。
【0041】
また、いくつかの態様において、さらなる機能性エレメントを各鋳型核酸分子と関連させることが好ましい。該エレメントは、種々の機能、例えば限定されないが、増幅および/または配列決定法のためのプライマー配列、品質管理エレメント、起源もしくは患者の試料などとの種々の関連をコードするユニーク配列識別因子(マルチプレックス識別因子または「MID」とも称する)、または他の機能性エレメントのために使用され得る。特定の処理工程において、記載の機能性エレメントのいくつかまたは全部を合わせ、ヌクレオチド配列に連結するアダプターエレメントにしてもよい。例えば、いくつかの態様では、相補配列組成を含むプライミング配列エレメントまたは領域を、増幅および/または配列決定に使用されるプライマー配列と関連させ得る。さらに、同じエレメントを、「鎖選択」と称され得るものおよび固相基材への核酸分子の固定化に使用してもよい。いくつかの態様において、2組のプライミング配列領域(本明細書において、以下プライミング配列A、およびプライミング配列Bという)が鎖選択に使用され得、この場合、1コピーのプライミング配列Aと1コピーのプライミング配列Bを有する単鎖のみが選択され、調製試料として含まれる。代替的な態様において、アダプターエレメントの設計の特徴により、鎖選択の必要性が排除される。同じプライミング配列領域が、増幅および固定化のための方法に使用され得、この場合、例えば、プライミング配列Bは固体基材上に固定化され得、該配列から増幅産物が伸長される。
【0042】
断片化、鎖選択、ならびに機能性エレメントおよびアダプターの付加のための試料の処理のさらなる例は、2004年1月28日に出願された標題「Method for preparing single-stranded DNA libraries」の米国特許出願第10/767,894号;2008年5月29日に出願された標題「System and Method for Identification of Individual Samples from a Multiplex Mixture」の米国特許出願第12/156,242号;および2009年2月23日に出願された標題「System and Method for Improved Processing of Nucleic Acids for Production of Sequencable Libraries」の米国特許出願第12/380,139号に記載されており、これらは各々、あらゆる目的のために参照によりその全体が本明細書に援用される。
【0043】
鋳型核酸分子の増幅を行ない、実質的に同一コピーの集団を生成させるためのシステムおよび方法の種々の例を記載する。SBSのいくつかの態様において、鋳型分子コピーと関連している1つ以上のヌクレオチド種を、発生期の各分子に組み込む場合、より強いシグナルを生成させるために、各核酸エレメントの多くのコピーを生成させることが望ましいことは当業者に自明であろう。例えば、細菌ベクターと称するものを使用する増幅、「ローリングサイクル(Rolling Circle)」増幅(米国特許第6,274,320号および同第7,211,390号に記載されており、参照により上記に組み込まれる)ならびにポリメラーゼ連鎖反応(PCR)方法など(これらの技術は各々、本記載の発明での使用に適用可能である)の核酸分子コピーを生成させるための当該技術分野で公知の多くの技術が存在する。ハイスループット適用に特に適したPCR技術の一例としては、エマルジョンPCR法と称されるもの(emPCRTM法とも称する)が挙げられる。
【0044】
エマルジョンPCR法の典型的な態様は、2種類の非混和性物質の安定なエマルジョンを作製して内部で反応が起こり得る水性液滴を作製する工程を含む。特に、PCR法における使用に適したエマルジョンの水性液滴は、典型的にはある種の型の油が挙げられる疎水性流体などの別の流体(連続相とも称する)中に液滴として懸濁または分散された水系流体などの第1流体(不連続相とも称する)を含み得る。使用され得る油の例としては、限定されないが、鉱油、シリコーン系油またはフッ素化油が挙げられる。
【0045】
さらに、いくつかのエマルジョンの態様では、PCRなどの特定の処理方法に特に有用であり得るエマルジョンを安定化させる作用をする界面活性剤が使用され得る。界面活性剤のいくつかの態様は、シリコーンまたはフッ素化界面活性剤のうちの1種類以上を含み得る。例えば、1つ以上の非イオン系界面活性剤、例えば、限定されないが、ソルビタンモノオレエート(SpanTM 80とも称する)、ポリオキシエチレンソルビタン(sorbitsan)モノオレエート(TweenTM 80とも称する)、またはいくつかの好ましい態様において、ジメチコンコポリオール(Abil(登録商標)EM90とも称する)、ポリシロキサン、ポリアルキルポリエーテルコポリマー、ポリグリセロールエステル、ポロキサマー、およびPVP/ヘキサデカンコポリマー(Unimer U-151とも称する)、またはより好ましい態様において、シクロペンタシロキサン中の高分子量シリコーンポリエーテル(Dow Corningから入手可能なDC 5225Cとも称する)が使用され得る。
【0046】
また、エマルジョンの液滴は、区画、マイクロカプセル、マイクロリアクター、微環境、または関連技術分野で一般的に使用されている他の名称で称され得る。水性液滴は、大きさが、エマルジョン成分または組成物の組成、その内容物、および使用される形成技術に応じて変動し得る。記載のエマルジョンは、PCRなどの化学反応が行なわれ得る微環境をもたらす。例えば、鋳型核酸および所望のPCR反応を行なうのに必要なすべての試薬が封入され得、エマルジョンの液滴中に化学的に隔離され得る。いくつかの態様では、上記の液滴のさらなる安定性を向上させるために、さらなる界面活性剤または他の安定化剤が使用され得る。該液滴を用いてPCR法の典型的なサーモサイクリング操作を行って封入核酸鋳型の増幅が行なわれ得、多くの実質的に同一コピーの鋳型核酸を含む集団の生成がもたらされる。いくつかの態様において、液滴中の集団は、「クローン単離された」、「区画化された」、「封鎖された」、「封入された」、または「局在した」集団と称され得る。また、本実施例において、記載の液滴の一部または全部に、鋳型および鋳型の増幅コピー、鋳型に相補的なに増幅コピーまたはその組合せの結合のためのビーズなどの固体基材を封入してもよい。さらに、固体基材は、他の型の核酸、試薬、標識または目的の他の分子に結合し得る。
【0047】
本記載の発明に有用なエマルジョンの態様は、非常に高い密度の液滴またはマイクロカプセルを含み得、記載の化学反応が大規模並列様式で行なわれることが可能となり得る。増幅に使用されるエマルジョンおよびその配列決定適用のための使用のさらなる例は、米国特許出願第10/861,930号;同第10/866,392号;同第10/767,899号;同第11/045,678号に記載されており、これらは各々、あらゆる目的のために参照によりその全体が本明細書に援用される。
【0048】
また、標的核酸を含む試料から選択された1つまたは複数の標的領域を増幅するために特定の核酸プライマーの組の使用を含む配列決定のための標的特異的アンプリコンを作製する態様が、本記載の発明とともに使用され得る。さらに、試料は、配列バリアントを含むことが既知の、または含むと思われる核酸分子の集団を含み得、プライマーを使用して配列バリアントを増幅させ、試料中のその分布の洞察がもたらされ得る。例えば、核酸試料中の多数の対立遺伝子の特異的増幅および配列決定によって、配列バリアント同定するための方法が行なわれ得る。核酸は、まず、核酸集団に共通する目的領域またはセグメント周囲の領域を増幅するように設計された1対の PCR プライマーによる増幅に供される。続いて、PCR反応の各生成物(第1アンプリコン)を、個々に、上記のエマルジョン系槽などの別々の反応槽内でさらに増幅する。得られたアンプリコン(本明細書において第2アンプリコンという)(各々、第1集団のアンプリコンの1つの構成員に由来する)を配列決定し、異なるエマルジョンPCRアンプリコン(すなわち、第2アンプリコン)の配列集合体を用いて対立遺伝子の頻度を測定する。
【0049】
記載の標的特異的増幅および配列決定法のいくつかの利点としては、これまで達成されていたよりも高いレベルの感度が挙げられる。さらに、ハイスループット配列決定装置を使用する態様、例えば、454 Life Sciences Corporationによって供給されるウェルのPicoTiterPlate(登録商標)アレイと称されるもの(PTPTMプレートまたはアレイと称されることもある)を使用する態様など、実行または実験1回あたり100,000を超える、300,000を超える、500,000を超える、または1,000,000を超える核酸領域の配列組成を得るために記載の方法が使用され得、少なくとも一部は、ガスケットなどの使用によって可能になるレーン構成などのユーザーの優先性に依存し得る。また、記載の方法は、1%以下に相当し得る対立遺伝子バリアントの低アバンダンス対立遺伝子の検出感度を提供する。該方法の別の利点としては、解析領域の配列を含むデータが得られることが挙げられる。重要なことに、解析する遺伝子座の配列の予備知識を有することは必要でない。
【0050】
配列決定のための標的特異的アンプリコンのさらなる例は、2005年4月12日に出願された標題「Methods for determining sequence variants using ultra-deep sequencing」の米国特許出願第11/104,781号;および2008年3月14日に出願された標題「System and Method for Detection of HIV Drug Resistant Variants」のPCT特許出願番号US 2008/003424に記載されており、これらは各々、あらゆる目的のために参照によりその全体が本明細書に援用される。
【0051】
さらに、配列決定の態様としては、サンガー型技術、一般的にハイブリダイゼーションによる配列決定(SBH)、ライゲーションによる配列決定(SBL)、または組み込みによる配列決定(SBI)技術と称される技術が挙げられ得る。さらに、配列決定技術としては、ポロニー(polony)配列決定技術と称されるもの;ナノポア、導波管および他の単一分子検出技術;または可逆的ターミネーター技術が挙げられ得る。上記のように、好ましい技術としては合成法による配列決定が挙げられ得る。例えば、いくつかのSBSの態様では、実質的に同一コピーの核酸鋳型の集団が配列決定され、典型的には、試料鋳型分子または鋳型分子に結合された1つ以上のアダプターの所定の相補位置にアニーリングするように設計された1つ以上のオリゴヌクレオチドプライマーが使用される。プライマー/鋳型複合体は、核酸ポリメラーゼ酵素の存在下で、ヌクレオチド種により提示される。ヌクレオチド種が、オリゴヌクレオチドプライマーの3’末端に直接隣接する試料鋳型分子上の配列位置に対応する核酸種に相補的である場合、ポリメラーゼにより、該ヌクレオチド種を有するプライマーが伸長される。あるいは、いくつかの態様において、プライマー/鋳型複合体は、目的の複数のヌクレオチド種(典型的には、A、G、CおよびT)によって一度に提示される。オリゴヌクレオチドプライマーの3’末端に直接隣接する試料鋳型分子上の対応する配列位置に相補的なヌクレオチド種が組み込まれる。記載の態様のいずれにおいても、ヌクレオチド種は、さらなる伸長を防ぐために化学的にブロックされ得(3’-O位においてなど)、次の回の合成前にブロック解除する必要がある。また、発生期の分子の末端へのヌクレオチド種の付加プロセスは、プライマーの末端への付加で上記のものと実質的に同じであることが認識されよう。
【0052】
上記のように、ヌクレオチド種の組込みは、当該技術分野で公知の種々の方法によって、例えば、ピロリン酸基(PPi)の放出の検出によって(例は、米国特許第6,210,891号;同第6,258,568号;および同第6,828,100号に記載されており、これらは各々、あらゆる目的のために参照によりその全体が本明細書に援用される)、またはヌクレオチドに結合された検出可能な標識によって検出され得る。検出可能な標識のいくつかの例としては、限定されないが、質量タグおよび蛍光または化学発光標識が挙げられる。典型的な態様において、組み込まれていないヌクレオチドは、例えば、洗浄によって除去される。さらに、いくつかの態様において、組み込まれていないヌクレオチドは、2008年6月27日に出願された標題「System and Method for Adaptive Reagent Control in Nucleic Acid Sequencing」の米国特許出願第12/215,455号;および2009年1月29日に出願された標題「System and Method for Improved Signal Detection in Nucleic Acid Sequencing」の代理人整理番号21465-538001 US(これらは各々、あらゆる目的のために参照によりその全体が本明細書に援用される)に記載されているような、例えば、アピラーゼまたはピロホスファターゼ酵素を用いた分解などの酵素的分解に供され得る。
【0053】
検出可能な標識が使用される態様では、該標識は、典型的には、後続の合成サイクルの前に不活性化されなければならない(例えば、化学的切断または光退色によって)。次いで、鋳型/ポリメラーゼ複合体内の次の配列位置が、目的の別のヌクレオチド種または複数のヌクレオチド種を用いて、上記のようにして質問(query)され得る。ヌクレオチドの付加、伸長、シグナル取得および洗浄の反復サイクルにより、鋳型鎖のヌクレオチド配列の決定がもたらされる。本実施例を継続すると、典型的には、多数または集団の実質的に同一の鋳型分子(例えば、103、104、105、106または107分子)が、信頼性のある検出のために充分に強力なシグナルを得るため、任意の1回の配列決定反応で同時に解析される。
【0054】
また、いくつかの態様において、「対末端(paired-end)」配列決定ストラテジーと称され得るものを使用することにより、読取長さの許容量および配列決定プロセスの質を改善することは有利であり得る。例えば、配列決定法のいくつかの態様は、高品質で信頼性のある読取が得られ得る分子の全長に対して制限がある。換言すると、信頼性のある読取長さの配列位置の総数は、使用される配列決定態様に応じて、限度が25、50、100または500塩基であり得る。対末端配列決定ストラテジーによって、リンカー配列によって中心部の各端に連結された元の鋳型核酸分子の断片を含む分子の各末端(「タグ」末端と称されることもある)を別々に配列決定することにより、信頼性のある読取長さが拡張される。鋳型断片の当初の位置関係は既知であり、したがって、配列読取によるデータは、より長い高品質の読取長さを有する単一の読取と再度組み合わされ得る。対末端配列決定態様のさらなる例は、2006年6月6日に出願された標題「Paired end sequencing」の米国特許出願第11/448,462号、および2009年1月28日に標題「Paired end sequencing」の米国特許出願第12/322,119号に記載されており、これらは各々、あらゆる目的のために参照によりその全体が本明細書に援用される。
【0055】
SBS装置のいくつかの例は、上記の方法の一部または全部を実施するものであり得、電荷結合素子(すなわち、CCDカメラ)または共焦点型アーキテクチャーなどの検出デバイス、マイクロフルイディクスチャンバもしくはフローセル、反応基材、および/またはポンプとフロー弁の1つ以上を含み得る。ピロリン酸系配列決定を一例として取り上げると、装置の一部の態様では、生じる固有バックグラウンドノイズレベルが低い化学発光検出ストラテジーが使用され得る。
【0056】
いくつかの態様において、配列決定の反応基材としては、酸エッチングによって、各々が実質的に同一の鋳型分子の集団を収容することを可能にした数十万またはそれ以上の非常に小さいウェルをもたらした(すなわち、いくつかの好ましい態様は、70×75mmのPTPTMアレイ上に35μmのウェル間ピッチで約330万個のウェルを含む)光ファイバーフェースプレートで形成された上記のPTPTMアレイと称されるものが挙げられ得る。いくつかの態様において、実質的に同一の鋳型分子の各集団は、各々が前記ウェルの1つに配置され得るビーズなどの固体基材上に配置され得る。例えば、装置は、PTPプレートホルダーに流体試薬を提供するための試薬送達要素、ならびにPTPプレート上の各ウェルから放出された光の光子の収集を可能にしたCCD 型検出デバイスを含み得る。改善されたシグナル認識のための特徴を含む反応基材の一例は、2005年8月30日に出願された標題「THIN-FILM COATED MICROWELL ARRAYS AND METHODS OF MAKING SAME」の米国特許出願第11/215,458号に記載されており、これは、あらゆる目的のために参照によりその全体が本明細書に援用される。SBS型配列決定およびピロリン酸配列決定を行なうための装置および方法のさらなる例は、米国特許第7,323,305号および米国特許出願第11/195,254号に記載されており、両方とも、参照により上記に組み込まれる。
【0057】
また、上記のemPCRTMプロセスなどの、1つ以上の試料調製プロセスを自動化するシステムおよび方法が使用され得る。例えば、自動化システムは、emPCR処理のためのエマルジョンを生成させ、PCRサーモサイクリング操作を行ない、成功裡に調製された核酸分子集団を配列決定のために富化するための効率的な溶液を提供するために使用され得る。自動化試料調製システムの例は、2005年1月28日に出願された標題「Nucleic acid amplification with continuous flow emulsion」の米国特許出願第11/045,678号に記載されており、これは、あらゆる目的のために参照によりその全体が本明細書に援用される。
【0058】
また、本記載の本発明の一部の態様のシステムおよび方法は、なんらかの設計、解析の実施またはコンピュータシステム上での実施のために保存されたコンピュータ可読媒体を使用する他の操作を含み得る。例えば、検出されたシグナルを処理するため、および/またはSBSシステムおよび方法を用いて得られたデータを解析するためのいくつかの態様を以下に詳細に記載する。ここで、該処理および解析の態様はコンピュータシステム上で実施可能である。
【0059】
本記載の発明での使用のためのコンピュータシステムの例示的な態様としては、ワークステーション、パーソナルコンピュータ、サーバーなどの任意の型のコンピュータプラットフォーム、または任意の他の既存または将来的なコンピュータが挙げられ得る。しかしながら、当業者には、本明細書に記載の前述のコンピュータプラットフォームは、記載の発明の特別な操作を行なうために特別に構成され、多目的コンピュータは考慮されないことが認識されよう。コンピュータは、典型的には、プロセッサ、オペレーティングシステム、システムメモリー、メモリー記憶デバイス、入出力制御装置、入出力デバイス、およびディスプレイデバイスなどの既知の構成要素を含む。また、関連分野の当業者には、多くの可能なコンピュータの構造および構成要素が存在し、キャッシュメモリー、データ縛アップユニットおよび多くの他のデバイスも含まれ得ることが理解されよう。
【0060】
ディスプレイデバイスとしては、視覚情報を提供するディスプレイデバイスが挙げられ得、この情報は、典型的には、ピクセルのアレイとして論理的および/または物理的に組織化されたものであり得る。また、入出力インターフェースを提供する任意の種々の公知のまたは将来的なソフトウェアプログラムを含み得るインターフェース制御装置も含まれ得る。例えば、インターフェースとしては、ユーザーに1つ以上のグラフ表示を提供する、一般的に「グラフィカルユーザーインターフェース(Graphical User Interface)」(しばしばGUIとも称される)と称されるものが挙げられ得る。インターフェースは、典型的には、選択手段を用いたユーザーの入力または関連分野の当業者に公知の入力の受容を可能にしたものである。
【0061】
同じまたは代替的な態様において、コンピュータ上のアプリケーションには、「コマンドラインインターフェース」と称されるもの(しばしば、CLIと称される)を含むインターフェースが使用され得る。CLIは、典型的には、アプリケーションとユーザー間のテキストベースの対話を提供する。典型的に、コマンドラインインターフェースは、ディスプレイデバイスを介してテキストラインとして出力を提示し、入力を受容する。例えば、実行の一例としては、関連分野の当業者に公知のUnix Shellsなどの「シェル(shell)」と称されるものまたはMicrosoft .NET frameworkなどの目的向き型プログラミングアーキテクチャーが使用されるMicrosoft Windows Powershellが挙げられ得る。
【0062】
関連分野の当業者には、インターフェースが、1つ以上のGUI、CLIまたはその組合せを含み得ることが認識されよう。
【0063】
プロセッサとしては、Intel Corporation製のCentrino(登録商標)、CoreTM2、Itanium(登録商標)もしくはPentium(登録商標)プロセッサ、Sun Microsystems製のSPARC(登録商標)プロセッサ、AMD corporation製のAthalonTMもしくはOpteronTMプロセッサなどの市販のプロセッサが挙げられ得、あるいは利用可能な、または利用可能となるであろう他のプロセッサのうちの1つであってもよい。プロセッサのいくつかの態様としては、マルチコアプロセッサと称されるもの、および/または単一もしくはマルチコア構成における並行処理技術の使用を可能にしたものが挙げられ得る。例えば、マルチコアアーキテクチャーは、典型的には、2つ以上のプロセッサ「実行コア」を含む。本実施例において、各実行コアは、多重スレッドの並行実行を可能にする独立したプロセッサとして機能を果たし得る。また、関連分野の当業者には、プロセッサが、一般的に32もしくは64ビットアーキテクチャーと称されるもの、または現在公知の、もしくは将来開発されるであろう他のアーキテクチャー構造に構成され得ることが認識されよう。
【0064】
プロセッサは、典型的にはオペレーティングシステムを実行するものであり、オペレーティングシステムは、例えば、Microsoft Corporation製のWindows(登録商標)型オペレーティングシステム(Windows(登録商標)XPもしくはWindows Vista(登録商標)など);Apple Computer Corp.製のMac OS X オペレーティングシステム(Mac OS X v10.5「Leopard」もしくは「Snow Leopard」オペレーティングシステムなど);多くの供給元から入手可能なUnix(登録商標)またはLinux-型オペレーティングシステム、あるいはオープンソースと称されるもの;別の、または将来的なオペレーティングシステム;あるいはこれらのいくつかの組合せであり得る。オペレーティングシステムは、ファームウェアとハードウェアを周知の様式でインターフェース接続し、プロセッサが、種々のプログラミング言語で記載され得る種々のコンピュータプログラムの機能を調和および実行するのを容易にする。オペレーティングシステムは、典型的には、プロセッサと協同して、コンピュータの他の構成要素の機能を調和および実行する。また、オペレーティングシステムは、スケジューリング、入出力制御、ファイルとデータの管理、メモリー管理、および通信制御ならびに関連サービスを、すべて公知の技術で提供する。
【0065】
システムメモリーとしては、任意の種々の公知の、または将来的なメモリー記憶デバイスが挙げられ得る。例としては、任意の市販のランダムアクセスメモリー(RAM)、常駐ハードディスクもしくはテープなどの磁気媒体、読取および書込用コンパクトディスクなどの光学媒体、または他のメモリー記憶デバイスが挙げられる。メモリ記憶デバイスとしては、任意の種々の公知の、または将来的なデバイス、例えば、コンパクトディスクドライブ、テープドライブ、リムーバブルハードディスクドライブ、USBもしくはフラッシュドライブ、またはディスケットドライブが挙げられ得る。かかる型のメモリー記憶デバイスは、典型的には、プログラム記憶媒体(示さず)、例えば、コンパクトディスク、磁気テープ、リムーバブルハードディスク、USBもしくはフラッシュドライブ、またはフロッピーディスケットなどからの読取および/または書込がそれぞれなされる。任意のこれらのプログラム記憶媒体、または現在使用されている、あるいは後に開発されるであろう他のものがコンピュータプログラム製品として考慮され得る。認識されようが、これらのプログラム記憶媒体は、典型的には、コンピュータソフトウェアプログラムおよび/またはデータを記憶するものである。コンピュータ制御論理とも称されるコンピュータソフトウェアプログラムは、典型的には、メモリー記憶デバイスと共に使用されるシステムメモリーおよび/またはプログラム記憶デバイスに記憶される。
【0066】
いくつかの態様において、制御論理(コンピュータソフトウェアプログラム、例えば、プログラムコード)が内蔵されたコンピュータ使用可能媒体を含むコンピュータプログラム製品を記載する。制御論理がプロセッサによって実行されると、該プロセッサは本明細書に記載の機能を果たす。他の態様において、いくつかの機能は、例えば、例えば、ハードウェア状態機械を用いて主にハードウェアにおいて実行される。本明細書に記載の機能が果たされるようなハードウェア状態機械の実行は、関連分野の当業者には自明である。
【0067】
入出力制御装置としては、局所であれ遠隔であれ、人間からであれ機械からであれ、ユーザーからの情報の受取および処理のための任意の種々の公知のデバイスが挙げられ得る。かかるデバイスとしては、例えば、モデムカード、ワイヤレスカード、ネットワークインターフェースカード、サウンドカード、または任意の種々の公知の入力デバイスのための他の型の制御装置が挙げられる。出力制御装置としては、局所であれ遠隔であれ、人間であれ機械であれ、ユーザーに情報を提示するための任意の種々の公知のディスプレイデバイスのための制御装置が挙げられ得る。本記載の態様において、コンピュータの機能要素は、システムバスを介して互いに通信する。コンピュータのいくつかの態様は、いくつかの機能要素とネットワークまたは他の型の遠隔通信によって通信し得る。
【0068】
関連分野の当業者には自明であろうが、機器の制御および/またはデータ処理アプリケーションは、ソフトウェアにおいて実行される場合、システムメモリーおよび/またはメモリー記憶デバイスにロードされ、実行され得る。また、機器の制御および/またはデータ処理アプリケーションの全部または一部は、リードオンリーメモリー、あるいは入出力制御装置を介して最初に機器の制御および/またはデータ処理アプリケーションをロードすることを必要としないデバイスのようなメモリー記憶デバイスの類似したデバイスに存在する。関連分野の当業者には、機器の制御および/またはデータ処理アプリケーション、あるいはその一部分がプロセッサによって公知の様式で、実行に有利なようにシステムメモリーまたはキャッシュメモリーまたは両方にロードされ得ることが理解されよう。
【0069】
また、コンピューターは、1つ以上のライブラリーファイル、実験データファイル、およびシステムメモリ中に保存されたインターネットクライアント(client)を含み得る。例えば、実験データとしては、検出されたシグナル値または1つ以上のSBS実験もしくはプロセスに関する他の値などの1つ以上の実験もしくはアッセイに関連するデータが挙げられ得る。さらに、インターネットクライアントとしては、ネットワークを使用して別のコンピューターで遠隔サービスにアクセス可能なアプリケーションが挙げられ得、例えば一般的に「ウェブブラウザ」と称されるものを挙げられ得る。本実施例において、いくつかの一般的に利用されるウェブブラウザとしては、Microsoft Corporationから入手可能なMicrosoft(登録商標) Internet Explorer 7、Mozilla CorporationのMozilla Firefox(登録商標) 2、Apple Computer Corp.のSafari 1.2、または現在当該技術分野に公知であるかもしくは将来開発される他の種類のウェブブラウザが挙げられる。また、同じまたは他の態様において、インターネットクライアントは、SBSアプリケーションのためのデータ処理アプリケーションなどのネットワークを介して遠隔情報にアクセス可能な特殊なソフトウェアアプリケーションを含み得るか、または該ソフトウェアアプリケーションの要素であり得る。
【0070】
ネットワークには、当業者に周知の多くの種類のネットワークの1つ以上が含まれ得る。例えば、ネットワークには、通信に適した、一般にTCP/IPプロトコルと称されるものを利用する局所または広域ネットワークが含まれ得る。ネットワークには、一般にインターネットと称される相互連結コンピューターネットワークの世界規模のシステムを含むネットワークが含まれ得るか、または種々のイントラネットアーキテクチャが含まれ得る。当業者はまた、ネットワーク環境内で、ハードウェアおよび/またはソフトウェアへの情報トラフィック、ならびにハードウェアおよび/またはソフトウェアシステムからの情報トラフィックを制御するための、一般に「ファイアウォール」(しばしば、パケットフィルターまたはボーダー防御デバイスとも呼ばれる)と呼ばれるものを好適に利用しているユーザーがいることを理解しよう。例えば、ファイアウォールにはハードウェア要素またはソフトウェア要素またはそのいくつかの組合せが含まれ得、典型的に、セキュリティーポリシーが、例えばネットワーク管理者などのユーザーにより適所に設置されるように設計される。
【0071】
b. 記載された発明の態様
上述のように、本発明は、試料からのHIV親和性配列バリアントの検出、およびバリアント配列組成をR5またはX4親和性型と関連付けることによる前記試料中に存在する親和性型の同定の方法に関する。特定の態様において、本発明は、数千のウイルス粒子から配列情報を並行して生成し、HIV親和性型が試料中に低頻度で存在する場合でもこれらの型の存在の同定を可能にする、配列決定技術(親和性型と試料中のバリアントの検出された配列組成の関係に基づく)と合わせた、親和性バリアントに関連することが知られているHIVの領域を標的化する2期的PCR技術(つまり、上述のように第一および第二のアンプリコンを生成する工程)を含む。実際には、本発明の態様により、非化学量論的な対立遺伝子量でHIVウイルス粒子を含む試料中に存在する親和性配列バリアント、例えば50%未満、25%未満、10%未満、5%未満または1%未満で存在するHIV親和性バリアントなどを検出することができる。記載される態様により、かかる同定を迅速に、高信頼度で、かつ費用効果的な様式で行うことができる。
【0072】
典型的に、1つ以上のプロセス工程を自動化する1つ以上の機器要素が使用され得る。例えば、配列決定法の態様は、一部または全プロセス工程を自動化して実施するための機器を使用して実行され得る。図1に、光学サブシステムおよび流体工学サブシステムを含む配列決定機器100の具体例を示す。配列決定プロセスを実行するために使用される配列決定機器100の態様には、流体工学サブシステム中に種々の流体工学構成要素、光学サブシステム中に種々の光学構成要素、ならびにいくつかの機能の局所制御のためのマイクロプロセッサおよび/またはマイクロコントローラ構成要素を含み得る、図1には示さないさらなる構成要素が含まれ得る。さらに、図1に例示するように、配列決定機器100は、例えば構成要素および/またはいくつかのデータ解析機能の1つ以上の指示制御をもたらし得るアプリケーション135などのシステムソフトウェアまたはファームウェアを実行し得るコンピューター130などの1つ以上の外部コンピューター構成要素に作動的に連結され得る。同じまたは代替的な態様において、コンピューター130は、別のコンピューター、イントラネット、またはネットワーク150を介したインターネットに連結され得る。本実施例において、配列決定機器100および/またはコンピューター130またはネットワーク150は、一般的に上述される態様の構成要素および特徴の一部または全部を含み得る。
【0073】
本発明の一局面において、記載される配列決定適用での直接使用のための少なくとも2つのアンプリコンが、偏りが極めて低い様式で生成されるように設計された10,000を超える公知のHIV env配列の整列から標的特異的プライマーを設計した。図2Aには、該プライマーから生成されたアンプリコン205およびアンプリコン215の具体例を示す。図2Aにおいて、アンプリコン205および215は、V3領域を覆うようにずらした関係で並べられるが、アンプリコン205および215は例示であり、限定とみなされるべきではないことが理解されよう。例えば、アンプリコン205および215は、異なるプライマー組合せから生成することができ、異なる長さおよびカバー率(coverage)を有する。図2Bに、プライマー221、223、225および227を例示し、図2Aに例示されるようにアンプリコン205は、プライマー223と227の組合せを使用して生成され得、アンプリコン215は、プライマー221および225を使用して生成され得る。代替的に、異なるプライマー組合せを使用して、長いアンプリコン産物にカバーされる領域内の短いアンプリコン産物を有するアンプリコン産物などの異なるアンプリコン産物を生成することが有利であり得るが、この場合、短い産物にカバーされる領域は、両方のアンプリコン内に示される。両方の戦略は、アンプリコン産物の1つが適切に増幅できない場合に有利な、アンプリコンによる「二重カバー率」を有する領域をもたらす。本実施例において、長いアンプリコン産物は、プライマー221および227を使用して生成することができ、短いアンプリコン産物は、プライマー223および225を使用して生成できる。「ずらした」アンプリコン戦力および「短い/長い」アンプリコン戦略の両方を含むプライマー組合せを使用して、4つまでのアンプリコンを生成することができる。いくつかの態様において、それぞれのアンプリコンは、関連のあるプライマー組合せを使用して別々の反応で生成される。代替的に、プライマーは、異なる組合せ由来の代表的な産物が存在する1つの反応チャンバ中でプールされ増幅され得る。例えば、プライマー221、223、および225(つまり、プライマー227以外)は1つの反応容器中で組み合わされ得、異なる長さの2つのアンプリコン産物を生じる。しかしながら、このアプローチは、1つのアンプリコンが別のアンプリコンに対して優先的に生成され得るいくつかの条件において制限を有することがある。
【0074】
当業者はまた、プライマー221、223、225および227を使用した、「ネステッド」型の増幅戦略が利用され得ることを理解しよう。例えば、ネステッドPCR戦略は、典型的に、複数のプライマー結合部位および望ましくない増幅産物の生成によって生じる混入の影響を低減するために、一般的に使用される。本実施例において、第一の組の増幅産物は、フォワードプライマー221およびリバースプライマー227を使用して生成され、いくつかの望ましくない産物を含み得る。その後、第一の組の望ましくない産物がプライマー223および225に対する結合部位を有さない場合、フォワードプライマー223およびリバースプライマー225および第一の組の増幅産物を使用した二回目の増幅を実行して、所望の標的領域に対してかなり高い特異性を有する一組の増幅産物を生成する。
【0075】
いくつかの態様において、プライマー221/223と225/227の組合せは、それぞれ、組み合わせた両方のプライマー(つまり、フォワードプライマー種またはリバースプライマー種の両方)を含むのに十分な長さの高度に保存された領域を標的とする。実際には、標的に対する両方のプライマー種を設計するのに充分な長さを欠いき、長さが制限されているので望ましくない保存された領域がV3領域の付近に存在することがある。しかしながら、本明細書に記載される配列決定技術により、該プライマーがかなり離れた領域を標的化し得る充分な読み出し長さが提供され、V3領域の完全な適用領域が提供される。実際には、300bp未満の読み出し長さを有する配列決定技術では、読み出し長さが制限されているので、記載されたプライマー種を用いて全V3領域を完全に配列決定することができない。実際には、親和性型の正確な予測にはV3領域の各末端の配列組成が重要であるので、推定アルゴリズムには、各ウイルス由来のクローンレベルでの完全配列が必要である。同じまたは代替的な態様において、記載されるプライマー組合せによる2アンプリコン(つまり、第一アンプリコンの)アプローチを使用して、特に診断型の適用に望ましいカバー率およびクレード適合性が向上される。例えば、2つの第一アンプリコンのアプローチを使用して、単一の第1アンプリコンのアプローチでは提供されない非常にロバストなアッセイがもたらされる。まず、2つのアンプリコンの生成を目標とすることにより重複がもたらされるので、例えば予期されないSNPまたは標的領域中の他の未知の配列組成のために1つのアンプリコンが生成されず、他方のアンプリコンが成功裡に生成される相当な見込みがあり、プロセスが進行し得る。また、記載されるずらした第一アンプリコンアプローチなどのいくつかの態様において、開始から終わりまでの全アンプリコンを配列決定する効率のために、より大きなV3領域のカバー率で両方のアンプリコンが成功裡に生成されて配列決定される見込みがある。
【0076】
重要なことに、臨床試料は複数のウイルスを含むので、混合物中の膨大な数の配列を増幅するためのプライマーセットを特異的に設計した。例えば、Los Alamos公共配列データベースに列挙された全て(>10,000)のクレードBおよびクレードC擬似種の>99.4%から少なくとも1つのアンプリコンが生成される。これにより、臨床血漿試料中に存在する全ての配列の偏りが非常に低い増幅およびクローン配列決定が可能になり、それにより全V3領域中で(高頻度および低頻度の両方の)全ての変形を検出することができる。実際には、本発明のプライマーは、世界規模のHIV感染のほとんどの原因であるクレードA、B、C、D、およびGに適合可能である。当業者が理解するように、クレード(サブタイプとも称される)Cは、2004年に世界規模での感染の50%の原因であり、Aは12%、Bは10%、Gは6%およびDは3%であった。上述のように、本発明のプライマーは、組み合わせて2004年に世界中のHIV感染の0.94%の原因であったクレードF、H、JおよびKにも適合可能であるが、該プライマー配列の特異性は、充分な配列情報が不均衡であるために確認できない。現在、A〜Kの文字で表される9個の同定されたクレードがあり、特定のクレード型が特定の地理的領域に関連していることも当業者は理解しよう。例えば、HIVクレードBは一般的に北米および欧州に見られ、クレードCは、一般的に南アフリカおよびインドに見られる。
【0077】
公知のHIV配列の整列は、当業者に公知の方法を使用してなされ得る。例えば、限定されないが、Smith-Watermanアルゴリズム(Smith TF, Waterman MS (1981). 「Identification of Common Molecular Subsequences」. Journal of Molecular Biology 147: 195-197、その全体において全ての目的で、参照により本明細書に援用される)、BLASTアルゴリズム(Altschul, S.F., Gish, W., Miller, W., Myers, E.W. & Lipman, D.J. (1990) 「Basic local alignment search tool」. J. Mol. Biol. 215:403-410、その全体において全ての目的で、参照により本明細書に援用される)およびClustal(Thompson JD, Gibson TJ, Plewniak F, Jeanmougin F, Higgins DG (1997). The ClustalX windows interface: flexible strategies for multiple sequence alignment aided by quality analysis tools. Nucleic Acids Research, 25:4876-4882、その全体において全ての目的で、参照により本明細書に援用される)などの数多くの配列整列法、アルゴリズムならびにアプリケーションが当該技術分野で利用可能である。1つの配列に配列を整列することは、HIV配列の集団の最も頻度の高い配列組成のコンセンサスをもたらす。また、本実施例において、ソフトウェアアプリケーションにより、整列されたコンセンサス配列に対して、親和性型決定のための目的の領域ならびにプライマー配列の標的領域がプロットされ得る。目的の領域としては、変異しそうなことが知られており、ウイルス親和性型に寄与し得る領域が挙げられる。その後、公知の変異感受性の領域よりも保存された(つまり、変異しにくい)コンセンサス配列の領域に対してプライマーセットを設計し得る。本明細書に開示されるプライマーセットは、公知の変異感受性の領域よりも保存された(つまり、変異しにくい)コンセンサス配列の領域に対して設計された。プライマー設計について変異率が低い配列領域を標的化することの利点としては、プライマーが結合できなくなり得る標的領域での変形のために失敗する実質的なリスクを有さない設計されたプライマーを確実に使用する能力、ならびに複数のクレードについて同じプライマーセットを使用する可能性が挙げられる。また、コンセンサス配列の「保存された」領域と見なされ得るものの特定の位置は、その組成が可変性あり得、「縮重」位置であると見なされることを当業者は理解しよう。いくつかの好ましい態様において、プライマー設計に使用されるパラメータは、コンセンサス配列を決定するために使用される複数配列整列において、ある位置に98%未満の頻度のヌクレオチド種が存在する場合、プライマー組成中の該位置に縮重塩基を挿入することを含む。また、結合標的領域およびプライマー組成の選択に影響する他のパラメータとしては、2つの選択的ヌクレオチド種のみを有する位置に縮重位置を制限すること、および増幅反応においてプライマーダイマーの形成のリスクを低減するためにプライマー組成を2つ以下の縮重位置に制限することが挙げられる。いくつかの態様において、結合効率について、最後の5つの位置は高度に保存されていることが有利なので、縮重位置を、プライマー組成の最後の5配列の位置(つまりフォワードプライマーの3’末端およびリバースプライマーの5’末端)に制限することも望ましい。例えば、典型的に、縮重配列位置は、かかる位置での選択的配列組成として存在する、異なり得る複数のヌクレオチド種を有する。縮重塩基は当該技術分野において周知であり、IUPAC記号により種類に関連する選択的ヌクレオチド組成を表す様々な種類の縮重が示される。例えば、IUPAC記号Rは、プリン塩基(つまりAおよびG)が選択性である見込みを表す。
【0078】
記載の発明の態様としては、高速配列決定に従順な少なくとも2つのアンプリコンを生成するように設計された、以下のプライマー種が挙げられる:
V3-1Fプライマー 5’ TCAGCACAGTACARTGYACACATGG 3’ (配列番号:1)
V3-1Rプライマー 5’ CATTACAATTTCTRGGTCYCCTCC 3’ (配列番号:2)
V3-2Fプライマー 5’ CAACTCAACTRCTGTTAAATGGYAG 3’ (配列番号:3)
V3-2Rプライマー 5’ TGTTGTATTACAGTAGAARAAYTC 3’ (配列番号:4)
【0079】
プライマーセットについて配列組成のいくつかの変動性が存在し、開示されるプライマー配列に対して90%以上の相同性が本発明の範囲内にあるとみなされることを、当業者は理解しよう。例えば、プライマーの組の標的領域は、わずかに移動し得るので、プライマー配列組成にある程度の違いが予想される。また、コンセンサス配列の改善がなされて、標的領域中の配列組成のわずかな差が示され、同様に、プライマー配列組成中にいくつかの変形が予想される。
【0080】
上述のように、本発明の記載される態様のプライマーを使用して、少なくとも2つのアンプリコンが生成される。例えば、短い/長いおよびずらしたアンプリコンアプローチの両方が同時に使用されて、実質的に4Xカバー率のV3領域が提供されることを当業者は理解しよう。ずらしたアンプリコン戦略が使用される場合、V3-1アンプリコンは389bpの平均長を含み、V3-2アンプリコンは393bpの平均長を含む。代替的に、ずらした短い/長い戦略が使用される場合、V3短アンプリコンは348bpの平均長を含み、V3長アンプリコンは434bpの平均長を含む。また、本発明の態様のプライマーにより、信頼性があり、ロバストに所望のアンプリコンが生成される。例えば、短い/長いアンプリコン戦略(つまり、V3-2F、V3-1Rから生成された短いアンプリコン;およびV3-1F、V3-2Rから生成された長いアンプリコン)を使用して113〜242ng/μlの濃度のアンプリコンが生成された。また、ずらしたアンプリコン戦略(つまり、V3-1F、V3-1Rから生成された1つのアンプリコン;V3-2F、V3-2Rから生成された第二のアンプリコン)を使用して、113〜251ng/μlの濃度のアンプリコンが生成された。
【0081】
いくつかの態様において、アダプターエレメントを、個々のアンプリコンからクローンコピーの集団を生成する(つまり、第二のアンプリコンを生成するための)二回目の増幅に使用される一般的な別のプライマーを含むアンプリコンの末端に連結する。アダプターとしては、本明細書の他の箇所に記載されるように、品質管理エレメントなどの他のエレメント、配列決定プライマーおよび/または増幅プライマー(または増幅および配列決定プライマーの両方として機能し得る単一のプライマー)などの他のプライマー、ユニーク配列識別因子(つまり、上述のMIDエレメント)なども挙げられ得る。また、いくつかの態様において、上述の標的特異的プライマーは、その後のプロセス工程に使用される1つ以上の他のエレメントと組み合わされ得る。例えば、一本鎖核酸分子は、さらなる配列エレメントが隣接した一方の末端に、標的特異的プライマー配列を含み得る。標的特異的プライマーは、標的領域に隣接する配列に対する配列組成の非相補的な性質のために他のエレメントが後方にある、標的領域にハイブリダイズし、増幅産物は目的の領域のコピーおよびさらなる配列エレメントを含む。
【0082】
本発明のいくつかの態様において、標的特異的プライマーを使用して、HIV RNAから第一鎖cDNAが生成される。一態様において、第一鎖cDNAは、図5に記載の方法に関して以下に記載される配列決定アダプター(SADともいう)を欠くV3-1Rプライマーなどの1つのプライマーを使用して生成され得る。続いて、標的特異的プライマー/プロセッシングエレメント戦略を使用して、少なくとも2つのアンプリコン(つまり、短い/長いもしくはずらした戦略のアンプリコン、または両方の戦略由来の1つ以上のアンプリコンの一員の組合せ)が生成される。従って、得られたアンプリコンは、そのプライマーとの関係で、必要なプロセッシングエレメントを含む。
【0083】
また、好ましい態様において、エマルジョンが破壊された際に第二のアンプリコンが効果的に引き離されて拡散が防がれるビーズ基材に固定された第二のアンプリコンのクローン集団が典型的に生じる、上述のエマルジョン系PCR増幅戦略を使用して、二回目の増幅が行われる。典型的に、その後、数千の第二のアンプリコンを、本明細書の他の箇所に記載されるように並行して配列決定する。例えば、第二のアンプリコンの集団が固定されたビーズを、反応環境基材105に負荷し得、配列決定機器100を使用してプロセッシングし、それぞれの試料から>1000クローン読み出しを生成してプロセッシングのために配列データをコンピューター130に出力する。コンピューター130は、特殊なソフトウェアを実行して、試料から1%以下のアバンダンスでバリアントを同定する。
【0084】
図3には配列解析ソフトウェアの出力の具体例を示し、該ソフトウェアは、複数の区画を含み、それぞれ個々のHIV RNA分子からの1回読み出しに由来する複数の配列305と整列したコンセンサス配列303の可視的な表示をユーザー101に提供するインターフェース300を含む。インターフェース300はまた、コンセンサス配列303と配列組成が異なるベースコール310を同定し、かかる同定は、ベースコールを、異なる色、太字、斜体または関連分野で公知の表示の他の視覚的手段で強調することを含む。インターフェース300はまた、参照配列303中の塩基位置により試料中で検出された変形320のレベルの視覚的な表示、およびかかる塩基位置での配列読み出し330の数の表示をユーザー101に提供する。図3の例において、試料中、1%以下の頻度で存在するバリアントは、クローン読み出しを調べることにより容易に決定される。示される例において、完全または部分V3カバー率を有する>60,000の読み出し(フォワードまたはリバース配列決定方向のいずれか)を、臨床試料から生成した。
【0085】
配列データは、それぞれの読み出しからの配列情報と、親和性型に関連する公知のハプロタイプを相関するソフトウェアアプリケーションの同じまたは異なる態様によってもさらに解析され、個々の読み出しからの配列データはコンセンサス配列の変形を含んでも含まなくてもよい。本明細書で使用する場合、用語「ハプロタイプ」は一般的に、核酸配列に関連する対立遺伝子の組み合わせのことをいい、HIVの場合は、HIV RNA配列を含む。相関は、ハプロタイプおよび/または親和性関連情報を保存する例えば1つ以上のデータベースなどの、1つ以上の特殊化されたデータ構造の使用を含み得ることを、当業者は理解しよう。ソフトウェアアプリケーションは、データ構造を含み得るか、またはデータ構造から情報を抽出する、および/またはデータ構造に新規の情報を提供するために公知の方法でデータ構造と連絡し得る。
【0086】
図4Aおよび4Bには、かかる配列解析ソフトウェアの出力の具体例が示され、インターフェース400'および400''のそれぞれが含まれる。400'および400''の両方の例は、同定されたハプロタイプ405;長アンプリコン413、短アンプリコン415、V3-1アンプリコン417、およびV3-2アンプリコン419中でハプロタイプが同定された頻度;親和性コール425、ならびにハプロタイプ配列435を示す。インターフェース400'は、親和性コール425中のX4親和性型に相当するハプロタイプ405中の「ntHap006」に対する参照を提供することを、当業者は理解しよう。インターフェース400''は、それぞれのアンプリコン413、415、417および419中で少なくとも1%未満の頻度で同定されたハプロタイプ405の「ntHap004」に対する参照を提供することも理解されよう。
【0087】
上述のように、多くの核酸鋳型を並行して配列決定することにより、本発明に必要な感度が提供される。例えば、二項式統計学に基づいて、完全に負荷された60mmx60mm PicoTiterPlate(200,000x100塩基読み出しからなる2X106高品質ベース)についての低い検出の制限(つまり一回の事象)は、少なくとも0.002%の対立遺伝子頻度を有する集団について95%信頼性であり、少なくとも0.003% 9の対立遺伝子頻度を有する集団について99%信頼性である(かなり大きい数の読み出しを可能にし、それにより感度を増加する、70x75mm PicoTiterPlateを、上述のように使用することができることも理解されよう)。比較のために、最も頻度の低い対立遺伝子が集団中に10%以上存在するならば、ピロリン酸系配列決定によるSNP検出では、四倍体ゲノムについて別々の対立遺伝子状態の検出が報告された(Rickert et al., 2002 BioTechniques. 32:592-603)。従来の蛍光DNA配列決定は、さらに低感度であり、50/50(つまり50%)のへテロ対立遺伝子を識別するにも困難を伴う(Ahmadian et al., 2000 Anal. BioChem. 280:103-110)。
【0088】
表1は、所定の数N(=100)の配列決定されたアンプリコンについて、全集団中のSNPの発生率に基づいて、0または1以上の事象を検出する確率を示す。「*」は、発生率が5.0%である場合、少なくとも1つの事象の検出を失敗する確率3.7%を示し;同様に「**」は、発生率が7%である場合、1つ以上の事象の検出を失敗する確率0.6%を示す。
【0089】
従って、この表は、5%のレベルで存在するSNPを検出する信頼性のレベルが95%以上であること、同様に、7%のレベルで存在するSNPを検出する信頼性が99%以上であることを示す。
【0090】

【0091】
当然、多重解析は、検出の深度よりも大きな適用可能性を有し、表2は、95%および99%の信頼性で最小の検出可能対立遺伝子頻度で、1つのピコタイタープレートで同時にスクリーニングできるSNPの数を示す。
【0092】

【0093】
図5は、最初の試料入力のための工程503を含む、HIV V3領域中の低頻度変形の同定のための方法の一態様の具体例を示す。3%より低い頻度の少数のバリアントを一定に検出するために、該方法に使用するHIV-1 RNA試料には、Artus HIVリアルタイム定量的PCRアッセイ(Artus Biotech GmbHから入手可能)で測定した場合、160IU/μlの最小ウイルス含有量が必要である。1%より低い頻度を検出するために、最小ウイルス含有量は少なくとも500IU/μlであるべきである。
【0094】
RNA試料を定量することが実際的ではない場合、血漿中の元のウイルス負荷が1mlあたり100,000コピーである場合、少なくとも140μlの血漿で最大60μlの総溶出量のRNA抽出を行うことができる。より低いウイルス負荷については、血漿の量を合わせ、20,600rpm、4℃で、1時間30分ウイルスをペレット化する。抽出手順のために、充分な上清を除去して140μlの濃縮物を残す。いくつかの試料についてPCRを設定し、配列決定反応を2回行ない、低頻度バリアントの一定の検出を確実にする。
【0095】
次に、RNA試料を工程505に示すように処理し、HIV試料集団から1つ以上のcDNA鋳型を生成する。試料からcDNAを生成することは、以下の手順を用いて行われ得る:
1. 96ウェルプレートを冷却器に置く
2. 1ウェル当たり11.5μlのRNAを添加する
3. 0.5μlのプライマーV3-1Rを添加する
cDNA-V3-1R:
CATTACAATTTCTRGGTCYCCTCC (配列番号:2)
65℃で10分間インキュベートした後、すぐにチューブを氷上に置く。
【0096】
チューブの数に合わせた逆転写酵素(RT)混合物を調製する:
1. Transcriptor RT反応バッファ(Rocheから入手可能)4μl
2. Protector RNaseインヒビター(Rocheから入手可能)0.5μl
3. dNTPs 2μl
4. DTT(Rocheから入手可能)1μl
5. Transcriptor逆転写酵素(Rocheから入手可能)0.5μl
ボルテックスにより簡単に混合してRNA試料に添加するまで氷上に維持する。
6. 1ウェル当たり8μlのRT混合物を添加する
7. プレートを密封して簡単に遠心分離する
8. サーモサイクラーに入れ、以下のcDNAプログラムを行う
50℃、60分
85℃、5分
4℃長時間(forever)
9. 1ウェル当たり1μlのRNAse H(New England Biolabsから入手可能)を添加する
10. 37℃で20分間サーモサイクラーブロックに置く(50℃以上に設定した過熱された蓋を有する)。
11. すぐにアンプリコン生成に進むか、-80℃で保存する。
【0097】
その後、工程510に示されるように、以下の手順を使用して、領域特異的プライマーの組を使用して、工程505で生成したcDNA鋳型から標的領域を増幅する。
1. 一枚の96ウェルプレートには下記の13x混合物で充分である(2アンプリコン、47試料+1対照)。必要に応じて方法をスケールアップまたはスケールダウンし得る。
2. 2本の1.5ml遠心分離チューブを「V3-1」、および「V3-S」とラベル表示する。これらのラベル表示は、以下のアンプリコン/プライマーセットを示す:
V3-1 V3-1F + V3-1R
V3-S V3-2F + V3-1R
(注意:上述の標的特異的プライマー配列の他に、以下のプライマーには以下のエレメント:+6塩基、フォワード=CGTATC、リバース=CTATGC;フォワードおよびリバースプライマーに特異的なSAD配列;ならびにKeyエレメント=TCAGが含まれる)
V3-1F
CGTATCGCCTCCCTCGCGCCATCAGTCAGCACAGTACARTGYACACATGG (配列番号:5)
V3-1R
CTATGCGCCTTGCCAGCCCGCTCAGCATTACAATTTCTRGGTCYCCTCC (配列番号:6)
V3-2F
CGTATCGCCTCCCTCGCGCCATCAGCAACTCAACTRCTGTTAAATGGYAG (配列番号:7)
3. 実験にマルチプレックス識別因子(MID)が必要な場合には、対応するMIDプライマーをアンプリコンのそれぞれの組に添加する。例えば、MID1を使用する場合には、プライマーセットAの全てのプライマーは、フォワードおよびリバースの両方向のプライマーに添加されたMID1を有するはずである。MID配列は、10塩基対の長さであり、アダプター配列の後で標的プライマー配列の直前に挿入されるべきである。
4. それぞれのチューブ中で、ラベルに示されるプライマーセットを有するPCRマスターミックスを調製する:


5. 22μlの「V3-1」PCRマスターミックスを一列目のそれぞれのウェルにピペットで移す。
6. 22μlの「V3-S」PCRマスターミックスを二列目のそれぞれのウェルにピペットで移す。
7. 以下のスキームに従って、1ウェル当たり3μlのcDNAを添加する(1カラム当たり1試料)
8. カラム11の陽性対照は、公知試料cDNAであり、カラム12の陰性対照は、cDNA合成プレートからの水対照である。
9. プレートをプレートシールで密封する。
10. プレートを30秒間、900xgで遠心分離する。
11. プレートをサーモサイクラーブロックに置き、プログラム「Ti_V3Amp」
94℃、3分
40サイクル:
94℃、15秒
55℃、20秒
72℃、45秒
72℃、8分
4℃長時間、を行う。
12. すぐに次の工程に進まない場合は、プレートを(同日中に進む場合は)氷上または-20℃で保存する。
【0098】
次いで、いくつかの態様において、工程510で生成したアンプリコンを、固相可逆的固定(SPRIともいう)または関連の分野で公知のサイズの選択のためのゲル切断法のいずれかを使用して、工程513に示されるように清浄化または精製し得る。例えば、アンプリコン精製は、以下の手順を使用して行い得る:
1. プレートを30秒間、900xgで遠心分離する。
2. 8チャンネルマルチピペッターを使用して、22.5μlの分子等級水を96ウェル丸底PPプレート(Fisher Scientificから入手可能)のカラム1〜11のそれぞれのウェルに移す。
3. PCRプレートから22.5μlのPCR産物を丸底PPプレートのそれぞれのウェルに移し;二枚のプレートについて同じレイアウトを維持する。
4. 72μlのSPRIビーズをそれぞれのウェルに添加して、SPRIビーズ/PCR混合物が均一になるまでピペットで少なくとも12回上下して完全に混合する。
5. 上清が透明になるまでプレートを室温で10分間インキュベートする。
6. プレートを96ウェル磁気リングスタンド(Ambion, Inc.から入手可能)に置き、室温で5分間インキュベートする。
7. プレートを磁気リングスタンド上に置いたまま、ビーズを拡散させることなく注意深く上清を除去して廃棄する。
8. 磁気リングスタンドからPPプレートを取り外し、200μlの新たに調製した70%エタノールを添加する。
9. PPプレートを磁気リングスタンドに戻す。PPプレートを約10回タップするかまたは磁気リングスタンド上で前後/円運動にて動かし、溶液を攪拌してペレットを分散させる(ペレットは完全に分散しなくてもよい;これは許容可能)。
10. PPプレートを磁気リングスタンドに置き、1分間インキュベートする。
11. プレートを磁気リングスタンドに置いたまま、ビーズが分散しないように注意深く上清を除去して廃棄する。
12. 工程8〜11を繰り返す。上清を可能な限り除去する。
13. 全てのペレットが完全に乾燥するまで、PPプレート/磁気リングスタンドを一緒に40℃に設定したヒートブロック上に置く(10〜20分)。
14. 10μlの1X TE(pH7.6±0.1)を各ウェルに添加する。全てのペレットが分散するまでPPプレートをタップ/同じように前後円運動にて動かす。
15. PPプレートを磁気リングスタンドに置き、2分間インキュベートする。
16. 各ウェルの上清を新しい96ウェル(黄色)プレートにピペットで移す。いくつかのウェルでペレットが全く移動しないようにすることは困難である;これは許容可能である。
17. プレートをプレートシールで覆い、-20℃で保存する。
【0099】
1つ以上の態様において、アンプリコンを定量することも有利であり得る。本実施例において、アンプリコン定量は以下のプロセスを使用して実施され得る:
1. 当該技術分野に公知の方法を使用して、PicoGreen(登録商標)試薬でこれらのアンプリコンの1μlを定量する。
2. 5ng/μl以下で定量されたいずれかのアンプリコンは、2100 Bioanalyzer(Agilent Technologiesから入手可能)でさらに評価すべきである:1μlのそれぞれの精製したアンプリコンをBioanalyzer DNAチップに負荷して、DNA-1000シリーズIIアッセイを行う。
a. 予想された大きさのバンドが存在し、プライマーダイマーが明らかに3:1以下のモル比である場合、PicoGreenを使用して定量しアンプリコンプールに進む。
b. 予想された大きさのバンドが存在し、プライマーダイマーが明らかに3:1より高いモル比である場合、SPRIおよびPicoGreen定量を繰り返し、次にBioanalyzer解析を行ない、プライマーダイマーの除去を確認する。
3. 1μlの陰性PCR対照反応をBioanalyzerで解析する。プライマーダイマー以外のバンドは見られないはずである。
【0100】
次に、工程515に示すように、アンプリコン由来の核酸鎖を選択して、エマルジョン滴に導入し本明細書の他の箇所に記載のように増幅する。いくつかの態様において、1試料当たり2つのエマルジョンを設定し、一方はAmplicon Aキットを使用し、もう一方はAmplicon Bキットを使用する。両キットは454 Life Sciences Corporationから入手可能である。異なる態様において、異なる数のエマルジョンおよび/または異なるキットを使用できることが理解されよう。以下のプロセスを使用して、最終混合物のためにアンプリコンを選択し得る:
1. それぞれの試料について2つのアンプリコンを生成し、そのそれぞれは理想的にはemPCR反応について等モル量で混合すべきである。全てのアンプリコンが同じ効率で生成されるわけではなく、アンプリコンがほとんど作製されずに大量のプライマーダイマーが存在する場合もある。最適な配列決定結果を達成するために、いくつかのアンプリコンの質が標準以下であっても、充分に定量された比較的純粋な(下記参照)アンプリコンのみを、それぞれの試料の最終混合物に使用することが重要である。種々のアンプリコン間でかなりの重複があるために、所定の試料の完全なカバー率には全ての2アンプリコンが必要ではないことがある。二つの高品質なアンプリコンの組が利用可能ではない場合、それぞれの試料についての最終的な混合物についてアンプリコンを選択するために、以下の規則に従う:
i. アンプリコンがBioanalyzerで定量可能なバンドとして認識されない場合、6.2の最終アンプリコン混合物には使用しない。
ii. プライマーダイマー対アンプリコンのモル比が3:1以上である場合、最終アンプリコン混合物には使用しない。この基準は、6.1でAgilent Bioanalyzerアッセイによってさらに定量された低濃度のアンプリコンに対してのみ利用可能である。
iii. アンプリコンが上述の基準に該当しないか、または全くない場合、以下のスキームに従って、他の重複アンプリコンの量を増やす:
2. アンプリコンV3-1がない場合、アンプリコンV3-Sの量を二倍にする。
3. アンプリコンV3-Sがない場合、アンプリコンV3-1の量を二倍にする。
4. アンプリコンV3-1およびV3-Sの両方がない場合、V3領域は配列決定できない。これらのアンプリコンのPCRを繰り返す。
【0101】
また、工程515の一部として、emPCRでの使用のために、アンプリコンの希釈および混合のための以下のプロセスを使用し得る:
1. 以下の等式を使用して、所定の試料由来の2アンプリコンのそれぞれについて1μl当たりの分子の濃度を計算する:


2. 2アンプリコンのそれぞれの109分子/μl希釈物を作製する:
1μlのアンプリコン溶液に以下の容量の1xTEを添加する:


3. 等容量の2アンプリコン希釈物のそれぞれ、例えば10μlを混合する。アンプリコンのいずれかがない場合、工程505のガイドラインに従って重複アンプリコンの容量を増やす。
4. 1μlの109モル/μl溶液を499μlの1xTEに添加して、混合されたアンプリコンのさらなる希釈物を2x106分子/μlにする。
5. 最終希釈物(2x106分子/μl)を、oリングキャップを有する0.5mlのチューブ中、-20℃で保存する。
【0102】
増幅後、エマルジョンを破壊して、増幅された核酸の集団が固定されたビーズを、工程520に示されるように富化する。例えば、DNA含有ビーズは、本明細書の他の箇所に記載されるように富化され得、以下のプロセス要素を含み得る:
1. エマルジョンを設定する直前に、6.3.4からの2x106分子/μlの溶液の10μlを、90μlのビーズ洗浄バッファに添加して、10倍希釈物を作製する。5秒間ボルテックスにかけて混合する。
2. それぞれの試料について、1cpbの1つのAエマルジョンおよび1つのBエマルジョンを作製する(つまり、エマルジョン当たり上述の希釈物の12μl(2,400,000ビーズ))。
3. より簡単な扱いのために、破壊中に所定の試料について2つのエマルジョンをプールし得る。
【0103】
次いで、工程530に示されるように、富化されたビーズを配列決定する。いくつかの態様において、本明細書の他の箇所に記載されるようにそれぞれの試料を配列決定する。例えば、富化および配列決定のための処理の後、16レーンガスケットを備えた70x75の金属PTPに、1レーン当たり組み合わせたエマルジョン由来の80,000ビーズ(陽性対照試料を含む)を負荷し、GS-FLX機器(454 Life Sciences Corporationから入手可能)で配列決定する。
【0104】
GS-FLX配列決定機器は、3つの主要なアセンブリ:流体工学サブシステム、光ファイバースライドカートリッジ/フローチャンバ、および画像化サブシステムを含む。流体工学サブシステムの一部は、試薬流入ライン、マルチバルブマニフォールド、および蠕動ポンプで形成される。個々の試薬を適切な試薬流入ラインにつなぐことで、同時に、所定の流速および持続時間で1つの試薬の試薬チャンバへの試薬送達が可能になる。光ファイバースライドカートリッジ/フローチャンバは、スライドのエッチングされた側面とフローチャンバ天井の間に250μmの空間を有する。フローチャンバはまた、試薬および光ファイバースライドの温度制御のための手段、ならびに遮光(light-tight)ハウジングも含んだ。スライドの研磨された(エッチングされていない)側面は、画像化システムに直接接触して設置される。
【0105】
光ファイバースライドウェルへの配列決定試薬の送達およびウェルからの配列決定反応副産物の洗浄のサイクルは、流体工学システムの前もってプログラムされた操作によって達成される。プログラムは典型的に、インターフェースコントロール言語(ICL)スクリプトの形態で書かれ、試薬名(Wash、dATPαS、dCTP、dGTP、dTTPおよびPPi標準)、それぞれのスクリプト工程の流速および持続時間が特定される。例えば、可能な一態様において、約1cm/秒のフローチャンバ中の線速度を有する全ての試薬について、流速を4mL/分に設定し得る。配列決定試薬の流量規模は、第一のカーネルがPPiフロー(21秒)、その後14秒の基質フロー、28秒のアピラーゼ洗浄および21秒の基質フローから構成されるカーネルに統合され得る。第一のPPiフロー後に、21サイクルのdNTPフローを行い得(dC-基質-アピラーゼ洗浄-基質dA-基質-アピラーゼ洗浄-基質-dG-基質-アピラーゼ洗浄-基質-dT-基質-アピラーゼ洗浄-基質)、それぞれのdNTPフローは、4つの個々のカーネルから構成される。それぞれのカーネルは84秒の長さであり(dNTP-21秒、基質フロー-14秒、アピラーゼ洗浄-28秒、基質フロー-21秒);21秒および63秒後に画像が捕捉される。21サイクルのdNTPフロー後、PPiカーネルを導入し、次いで別の21サイクルのdNTPフローを続ける。配列決定試行の終わりに、第3のPPiカーネルを続ける。全試行時間は244分であった。この試行を完了するために必要な試薬の容量は以下の通りである:それぞれ500mLの洗浄溶液、それぞれ100mLのヌクレオチド溶液。試行の間、全ての試薬は室温に維持した。フローチャンバおよびフローチャンバ流入チューブの温度を30℃に調整し、フローチャンバに入る全ての試薬を予め30℃に温める。
【0106】
続いて、工程540に示されるように、出力配列データを解析する。いくつかの態様において、高品質化のためにフィルターにかけられたフローグラムデータを含むSFFファイルを、特異的アンプリコンソフトウェアを使用して処理し、データを解析した。
【0107】
上述の工程は、単に例示のためであり、限定を意図しないこと、さらに該工程の一部または全部が種々の組合せで異なる態様に使用され得ることが理解されよう。例えば、上述の方法に使用されるプライマーは、他のHIV特徴/領域について質問するためにさらなるプライマーセットと組み合わされて、より包括的な診断または治療の恩恵をもたらし得る。本実施例において、かかる組合せは、プレート上に「ドライダウン」されて提供され得、記載される親和性プライマー、ならびにHIV薬物耐性またはインテグラーゼ領域の検出のためのプライマーの一部または全部、ならびに任意の他の目的の領域を含み得る。それぞれがその全体において、全ての目的のために参照により本明細書に援用される、2008年3月14日に出願されたPCT出願番号US 2008/003424、発明の名称「System and Method for Detection of HIV Drug Resistant Variants」;および/または2008年12月1日に出願されたUS特許仮出願第61/118,815号、発明の名称「System and Method for Detection of HIV Integrase Variants」にさらなる例が開示される。

【特許請求の範囲】
【請求項1】
(a) HIV試料集団中のそれぞれのRNA分子から複数のcDNA種を生成する工程;
(b) 該cDNA種から少なくとも1つの第一アンプリコンを増幅する工程、第一アンプリコンのそれぞれは、複数の増幅されたコピーを含み、第一アンプリコンの座を規定する一組の核酸プライマーにより増幅される;
(b) 該第一アンプリコンの増幅されたコピーをクローン増幅して、複数の第二アンプリコンを生成する工程、該複数の第二アンプリコンは、第一アンプリコンの増幅されたコピーの1つに由来する実質的に同じコピーの固定化された集団を含む;
(c) 少なくとも100の固定化された集団に由来する実質的に同じコピーの核酸配列組成を、1つの基材上で並行して決定する工程;および
(d) 該少なくとも100の固定化された集団の核酸配列組成中に5%以下の頻度で存在する1つ以上の配列バリアントを検出する工程;および
(e) 該検出された配列バリアントを、HIV親和性に関連する変形と相関する工程
を含む、薬物耐性に関連する低存在頻度の1つ以上のHIV配列バリアントを検出する方法。
【請求項2】
HIV親和性に関連する変形が、好ましくはCCR5およびCXCR4からなる群より選択されるコレセプターに関連することが知られている、請求項1記載の方法。
【請求項3】
cDNA種を生成する工程により、好ましくは重複する配列組成を有する2つのcDNA種が作製される、請求項1記載の方法。
【請求項4】
該HIV試料集団が1人の患者に由来する、請求項1記載の方法。
【請求項5】
該複数の第一アンプリコンが2つのアンプリコンを含む、請求項1記載の方法。
【請求項6】
該第一アンプリコンに対するプライマーの組が、低変異頻度の領域を標的とする、請求項1記載の方法。
【請求項7】
該第一アンプリコンに対するプライマーの組が、クレードA、クレードB、クレードC、クレードDおよびクレードGからなる群より選択されるHIVクレードの領域を増幅するように設計される、請求項1記載の方法。
【請求項8】
該第一アンプリコンに対するプライマーの組が、V3-1F(配列番号:1)とV3-1R(配列番号:2);V3-2F(配列番号:3)とV3-2R(配列番号:4);V3-1F(配列番号:1)とV3-2R(配列番号:4);およびV3-2F(配列番号:3)とV3-1R(配列番号:2)からなる群より選択されるプライマー対の群を含む、請求項7記載の方法。
【請求項9】
該第一アンプリコンの座が、好ましくはHIVエンベロープ領域であるV3領域に関連するHIVの領域を含む、請求項1記載の方法。
【請求項10】
該第二アンプリコンが、一般的なプライマーの組を使用して増幅される、請求項1記載の方法。
【請求項11】
該検出する工程が、複数の配列決定反応から生成されたシグナルを1つの基材上で検出し得る1つの検出デバイスを含む機器を使用する、請求項1記載の方法。
【請求項12】
V3-1F(配列番号:1)とV3-1R(配列番号:2);V3-2F(配列番号:3)とV3-2R(配列番号:4);V3-1F(配列番号:1)とV3-2R(配列番号:4);およびV3-2F(配列番号:3)とV3-1R(配列番号:2)からなる群より選択される1つ以上のプライマーの組を含む、請求項1記載の方法を実行するためのキット。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate


【公表番号】特表2011−525365(P2011−525365A)
【公表日】平成23年9月22日(2011.9.22)
【国際特許分類】
【出願番号】特願2011−515220(P2011−515220)
【出願日】平成21年6月29日(2009.6.29)
【国際出願番号】PCT/EP2009/004672
【国際公開番号】WO2010/000427
【国際公開日】平成22年1月7日(2010.1.7)
【出願人】(591003013)エフ.ホフマン−ラ ロシュ アーゲー (1,754)
【氏名又は名称原語表記】F. HOFFMANN−LA ROCHE AKTIENGESELLSCHAFT
【Fターム(参考)】