説明

HLA変異体の検出のためのシステムおよび方法

一またはそれ以上のHLA配列類型を検出する方法であって、以下の工程:
二本鎖核酸サンプルから、複数の第一増幅産物を複製する工程であって、これにおいて第一増幅産物が、HLA−A、HLA−BおよびHLA−Cからなる群から選択されるHLA遺伝子座のそれぞれの鎖のエキソン2および3を規定する複数の核酸プライマー対を用いて増幅される工程;
第一増幅産物を増幅して、第二増幅産物の複数の集合の生産をする工程であって、これにおいて第二増幅産物のそれぞれの集合は、第一増幅産物の一つからクローナルに増幅される工程;
第二増幅産物の複数の集合をシークエンシングして、複数の第二増幅産物の各々についての核酸配列構成を作成する工程;および
一またはそれ以上のHLA遺伝子座についての、一またはそれ以上の第二増幅産物から配列構成における変化を検出する工程
を含む、方法が記載される。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、HLAクラスIおよびクラスII遺伝子座に関連する配列変異体検出および分析のための方法、試薬およびシステムを提供する。当該変異体は、一塩基変異多型(SNPs)、多形配列モチーフ(すなわち、隣接したヌクレオチドを含む複雑な多形)、挿入または欠失変異(「挿入欠失」 と称される)、並びに他のタイプの多形または変異であって、関連技術分野の当業者に知られており、標的ポリヌクレオチドの集合において起こりうる多形または変異を含んでもよい。本発明は、また、既知および未知の配列の両方における変異および多形を同定するために、大量に並行シークエンシングすることにより、ポリメラーゼ連鎖反応(PCR)によって複製された核酸を調査する方法に関する。本発明は、特定のHLA特性および機能に関連するHLA DNAの特定の領域および/または一連の重なりあった領域を増幅するために特異的に設計された核酸プライマーの使用に関する。また、一部においては、変異を含み、個々の増幅産物を生成すると疑われている標的HLA核酸集合において、一貫した核酸の増幅を可能にする低レベルの多形のため、プライマーの標的部位が選択される。数千の個々のHLA増幅産物は、大量に並行して、効率良く、かつ費用効果のある態様でシークエンシングされて、増幅産物の集合中に見出される配列変異の分布を作成し、これは従来の方法よりも、より優れた検出感度を可能にする。
【背景技術】
【0002】
ヒト白血球型抗原(一般的にHLAと称される)クラスIおよびクラスIIは、クラスII遺伝子においてはエキソン2に、そしてクラスI遺伝子においてはエキソン2および3に主に局在する複雑なパターンのパッチワーク多形(すなわち、変異)を伴い、ヒトゲノム中で最も多形的な遺伝子である。現代のHLA分類手法において、造血幹細胞の移植において臨床的に重要なHLA対立遺伝子の対立遺伝子レベルでの分離(allele level resolution)は、技術的に困難である。ドナーと患者の間の正確な、対立遺伝子レベルでのHLAの適合が、急性および慢性両方の移植片対宿主拒絶反応の発生率及び重症度を低下させ、そして移植の成功率を改善することにより、全体的な移植成功率を顕著に改善することが、幾つかの大規模な研究により実証されている。例えば、8つの最も重要なHLA対立遺伝子の8つとも適合している場合、6つが適合している場合と比較して、移植の12ヶ月後の生存率が60%亢進した。
【0003】
数百万人の潜在的骨髄ドナーが、A、B、そして多くの場合においてDRB1遺伝子座について低〜中程度の分離能でHLA型を決定される骨髄バンクを維持することが現在の慣例である。この初期の分類に基づいて、複数の潜在的に適合した非血縁ドナーが選択され、それから、これら及び追加的な遺伝子座について対立遺伝子レベルの分解能で遺伝子型を決定して、レシピエントに最適なドナーを同定する。
【0004】
目下のところ、変異型に対する最高分解能のHLA型決定は、キャピラリー電気泳動を使用する蛍光およびサンガー法を基礎とするDNAシークエンシングを用いて行うものである。しかしながら、両対立遺伝子を一緒に増幅し、シークエンシングする場合、対立遺伝子間の複数の多形、および位相不確実性(phase ambiguity)により、HLA分類データの不確実性はなおも存在し得る。これらの不確実性を解消するためには、増幅してから2つの対立遺伝子を個別に解析する等の時間のかかるアプローチを必要とする。
【0005】
そのため、数百万のDNA分子から並行して配列情報を作成できる改善されたシークエンシング方法を介した変異の効率的な検出が、非常に望まれている。このシステムのクローナルシークエンシング特性は、対立遺伝子変異が、分離してシークエンシングされ得ることを意味し、それゆえ増幅産物中の結合された多形の調節期を許容する。さらに、改善されたシークエンシング方法の実施態様は、約250ヌクレオチド、約400ヌクレオチド、または、400超のヌクレオチドの長さを解析する標的特異的な高スループットのシークエンシング手法を含み、重要なHLA領域の完全な配列のカバーを可能とする。例えば、本明細書に記載された発明の、HLA特異的プライマーを使用する標的特異的高スループットシークエンシング技術は、エキソンに含まれる結合された多形の調節期を可能にし、そして、それぞれのHLA対立遺伝子の配列の明確な決定を可能にする。
【発明の概要】
【発明が解決しようとする課題】
【0006】
本発明の実施態様は、核酸の配列の決定に関する。より詳細には、本発明の実施態様は、合成時解読(SBS)による核酸のシークエンシングの間に得られたデータ中のエラーを訂正するための方法およびシステムに関する。
【0007】
一またはそれ以上のHLA配列類型を検出する方法であって、以下の工程:
二本鎖核酸サンプルから、複数の第一増幅産物を複製する工程であって、これにおいて第一増幅産物が、HLA−A、HLA−BおよびHLA−Cからなる群から選択されるHLA遺伝子座のそれぞれの鎖のエキソン2および3を規定する複数の核酸プライマー対を用いて増幅される工程;
第一増幅産物を増幅して、第二増幅産物の複数の集合の生産をする工程であって、これにおいて第二増幅産物のそれぞれの集合は、第一増幅産物の一つからクローナルに増幅される工程;
第二増幅産物の複数の集合をシークエンシングして、複数の第二増幅産物の各々についての核酸配列構成を作成する工程;および
一またはそれ以上のHLA遺伝子座についての、一またはそれ以上の第二増幅産物から配列構成における変化を検出する工程
を含む方法が記載される。ある態様では、核酸プライマー対は、下記の表4および5中に挙げられた複数のプライマーから選択される配列構成を含む。ある態様では、複数の核酸プライマー対は、HLA遺伝子座のエキソン1、4および5を規定する。ある態様では、第一増幅産物は、HLA遺伝子座のエキソン1、イントロン1、およびエキソン2の配列構成を含んでいる増幅産物を含む。他の態様では、第一増幅産物は、HLAの遺伝子座のエキソン3の配列構成を含んでいる増幅産物を含む。他の態様では、第一増幅産物は、HLAの遺伝子座のエキソン4、イントロン4およびエキソン5の配列構成を含んでいる増幅産物を含む。ある態様では、複数の核酸プライマー対は、HLA−Cの遺伝子座のエキソン6および7を規定する。特定の態様では、第一増幅産物は、HLA−Cの遺伝子座のエキソン6、イントロン6、およびエキソン7の配列構成を含んでいる増幅産物を含む。ある態様では、HLA−Aの遺伝子座についての複数の核酸プライマー対は、フォーワードおよびリバース方向で一またはそれ以上のエキソンのシークエンシングを可能にする。ある態様では、HLA−Bの遺伝子座についての複数の核酸プライマー対は、フォーワードおよびリバース方向で一またはそれ以上のエキソンのシークエンシングを可能にする。ある態様では、HLA−Cの遺伝子座についての複数の核酸プライマー対は、フォーワードおよびリバース方向で一またはそれ以上のエキソンのシークエンシングを可能にする。ある態様では、当該方法はさらに、複数のアダプターを含み、その各々は核酸プライマー対由来の個々のプライマーを含む。ある態様では、一つのまたはそれ以上の複数のアダプターは、MID識別子を含む。ある態様では、MID識別子は、複数の核酸サンプル由来の第一増幅産物のプールを可能にし、これにおいて、プールされた第一増幅産物から増幅された第二増幅産物の集合は、並行してシークエンシングされる。別の態様では、複数のアダプターは、一般的なアダプターエレメントおよびキーエレメントを含む。ある態様では、第二増幅産物の各集合は、ビーズ基質上に固定される。ある態様では、第二増幅産物の集合は、エマルジョンPCR工程を使用してクローナルに増幅される。ある態様では、第二増幅産物の複数の集合は、並行してシークエンシングされる。ある態様では、当該方法はさらに、当該変異とHLA類型とを関連づける工程を含む。特定の態様では、変異とHLA類型の関連は知られている。
【0008】
さらに、一またはそれ以上のHLA配列類型を検出するための方法であって、以下の工程:
二本鎖核酸サンプルから、複数の第一増幅産物を増幅する工程であって、これにおいて第一増幅産物は、DRB1、DQA1、DQB1、DPA1、DPB1からなる群から選択されるHLA遺伝子座のそれぞれの鎖のエキソン2を規定する複数の核酸プライマー対を用いて増幅される工程;
第一増幅産物を増幅して、第二増幅産物の複数の集合を作成する工程であって、これにおいて第二増幅産物の各集合は、第一増幅産物の一つからクローナルに増幅される工程;
第二増幅産物の複数の集合をシークエンシングして、複数の第二増幅産物の各々について核酸配列構成を作成する工程;および
一またはそれ以上のHLA遺伝子座について、一またはそれ以上の第二増幅産物由来の配列構成における変異を検出する工程
を含む方法が記載される。ある態様では、核酸プライマー対は、下記の表4および5中に挙げられた複数のプライマーから選択される配列構成を含む。ある態様では、DRB1遺伝子座についての複数の核酸プライマー対は、汎用的であり、そしてさらにDRB3、DRB4およびDRB5遺伝子座からなる群から選択される遺伝子座の増幅を可能にする。ある態様では、DRB1,3、4および5の遺伝子座についての複数の核酸プライマー対は、フォーワードまたはリバース方向におけるエキソン2のシークエンシングを可能とする。ある態様では、DQA1の遺伝子座のための、複数の核酸プライマー対は、フォーワードまたはリバース方向におけるエキソン2のシークエンシングを可能とする。ある態様では、DQB1の遺伝子座についての複数の核酸プライマー対は、フォーワードまたはリバース方向におけるエキソン2およびエキソン3のシークエンシングを可能とする。ある態様では、DPA1の遺伝子座についての複数の核酸プライマー対は、フォーワードまたはリバース方向におけるエキソン2のシークエンシングを可能とする。ある態様では、DPB1の遺伝子座についての複数の核酸プライマー対は、フォーワードまたはリバース方向におけるエキソン2のシークエンシングを可能とする。ある態様では、当該方法は、さらに、複数のアダプターを含み、その各々は、核酸プライマー対由来の個々のプライマーを含む。ある態様では、一つのまたはそれ以上の複数のアダプターは、MID識別子を含む。ある態様では、MID識別子は、複数の核酸サンプル由来の第一増幅産物のプールを可能にし、これにおいて、プールされた第一増幅産物から増幅された第二増幅産物の集合は、並行してシークエンシングされる。ある態様では、複数のアダプターは、一般的なアダプターエレメントおよびキーエレメントを含む。ある態様では、第二増幅産物のそれぞれの集合は、ビーズ基質上に固定される。ある態様では、第二増幅産物の集合は、エマルジョンPCR工程を使用してクローナルに増幅される。ある態様では、第二増幅産物の複数の集合は、並行してシークエンシングされる。ある態様では、当該方法はさらに、当該変異をHLA類型と関連付けする工程を含む。特定の態様では、変異とHLA類型との関連は知られている。
【0009】
また、一またはそれ以上のHLA類型を検出するためのキットの実施態様は、上に記載された方法の実施態様の第一増幅産物を増幅するために使用された核酸プライマー対を含むことが記載されている。
【0010】
上の実施態様および実例は、必ずしもそれぞれ包括的なまたは排他的でなく、そして矛盾しないか、または他の可能であるなんらかの様式で、同一のまたは異なる実施態様または実例に関連して提示されようがされまいが、組み合わされてもよい。ある実施態様または実例の記載は、他の実施態様および/または実例について限定することを意図するものではない。また、本明細書中至る所に記載される任意の、一またはそれ以上の機能、工程、操作または技術は、代わりの実例において、要約中において記載された任意の一またはそれ以上の機能、工程、操作または技術と組み合わされてもよい。それゆえ、上の実施態様および実施例は、限定というより例示である。
【図面の簡単な説明】
【0011】
上記およびさらなる特徴は、添付の図面と併せた場合に、以下の詳細な説明からより明らかに理解されるであろう。図面中、同参照数字は、同構造、エレメント、または方法工程を示し、そして参照数字の左端の数字は、参照エレメントが最初に現れる図の番号を示している(例えば、エレメント160は、図1中、最初に現れる)。これらすべての規則は、しかしながら、限定というよりも、典型的なまたは例示的なものを意図されている。
【図1】図1は、コンピュータ制御下のシークエンシング装置および反応基質についての一の実施態様の機能ブロック図である。
【図2】図2は、第一増幅産物とHLA−A、BおよびCの遺伝子領域(エキソンおよびイントロン構造)間の関係の簡単な画像図である。
【図3】図3は、第一増幅産物とDPA1、DPB1、およびDQAのHLA領域間の関係の簡単な画像図である。
【図4】図4は、第一増幅産物とDQB1およびDRB1のHLA領域間の関係の簡単な画像図である。
【発明を実施するための形態】
【0012】
発明の詳細な説明
以下でより詳細に述べられるように、記載された本発明の実施態様は、HLA変異特異的なプライマー種を設計するための、そして変異配列の高感度検出のためのこれらのプライマーの使用するためのシステムおよび方法を含む。
【0013】
a.一般
「フローグラム(flowgram)」という用語は、一般的にSBS方法、特にピロリン酸に基づくシークエンシング方法(また、「ピロシークエンシング(pyrosequencing)」とも称される)により作成されたシークエンシングデータの画像図を指し、そしてより具体的に「ピログラム(pyrogram)」と称されてもよい。
【0014】
「リード」または「シークエンシングリード」という用語は、本明細書において使用される場合、一般的に、単一の核酸テンプレート分子、またはテンプレート核酸分子の複数の実質的に同一のコピーの集合から得られた全シークエンシングデータを指す。
【0015】
「ラン」または「シークエンシングラン」という用語は、本明細書において使用される場合、一般的に、一またはそれ以上のテンプレート核酸分子のシーケンシング手法において遂行される一連のシークエンシング反応を指す。
【0016】
「フロー」という用語は、本明細書において使用される場合、一般的に、テンプレート核酸分子を含んでいる環境への連続的なまたは反復的な溶液の添加のサイクルを指し、ここで当該溶液は、新生核酸分子に添加のためのヌクレオチド種または他の試薬、例えば、シーケンシング反応において使用されうるか、またはヌクレオチド種の従前のフローサイクルからキャリーオーバーまたはノイズ効果を減らすための緩衝液または酵素を含んでもよい。
【0017】
「フローサイクル」という用語は、本明細書において使用される場合、一般的に、サイクルの間の、一つのヌクレオチド種が1回流れるフローの逐次的な連続を指す(すなわち、他のシークエンシング組み合わせもまた、定義の一部と考慮できるが、フローサイクルは、T、A、C、Gヌクレオチド種の順序での逐次添加を含んでもよい)。典型的に、フローサイクルは、サイクル毎に同一のフローのシークエンシングを有する反復サイクルである。
【0018】
「リードレングス(read length)」という用語は、本明細書において使用される場合、一般的に、信頼してシークエンシングされうるテンプレート分子の長さの上限を指す。システムおよび/または工程のリードレングスに寄与する多くの因子が存在し、例えば、これに限定されるものでないが、テンプレート核酸分子中のGC含量の程度が含まれる。
【0019】
「テストフラグメント」または「TF」という用語は、本明細書において使用される場合、一般的に、品質管理、キャリブレーション、または他の関係する目的のために使用されてもよい既知シークエンシング組成物の核酸エレメントを指す。
【0020】
「プライマー」という用語は、本明細書において使用される場合、一般的に、核酸鎖に相補的なプライマー伸長生産物の合成が誘導される適切な緩衝液および適切な温度条件下で、DNA合成の開始点として機能するオリゴヌクレオチドを指す。プライマーは、好ましくは単鎖オリゴデオキシリボヌクレオチドである。
【0021】
「新生分子」とは、一般的に、テンプレート分子において、対応しているヌクレオチド種と相補的であるヌクレオチド種の取り込みによって、テンプレート依存性DNA合成酵素によって伸長されているDNA鎖を指す。
【0022】
「テンプレート核酸」「テンプレート分子」「標的核酸」または「標的分子」という用語は、一般的に、シークエンシングデータまたは情報が作成されるシーケンシング反応の対象である核酸分子を指す。
【0023】
「ヌクレオチド種」という用語は、本明細書において使用される場合、一般的に、新生核酸分子中に、典型的に取り込まれるプリン(アデニン、グアニン)およびピリミジン(シトシン、ウラシル、チミン)を含んでいる核酸単量体の同一性を指す。
【0024】
「単量体リピート」または「ホモポリマー」という用語は、本明細書において使用される場合、一般的に、同じヌクレオチド種を含む、二またはそれ以上のシークエンシング位置(すなわち、繰り返されたヌクレオチド種)を指す。
【0025】
「均一伸長」という用語は、本明細書において使用される場合、一般的に、実質的に同一のテンプレート分子の集合のそれぞれのメンバーが、反応において同じ伸長工程を均一に遂行している、伸長反応の関係またはフェーズを指す。
【0026】
「完了効率」という用語は、本明細書において使用される場合、一般的に、所定のフローの間に適切に伸長された新生分子の割合を指す。
【0027】
「不完全伸長率」という用語は、本明細書において使用される場合、一般的に、すべての新生分子の数に対する、適切に伸長され得ない新生分子の数の比率を指す。
【0028】
「ゲノムライブラリー」または「ショットガンライブラリー」という用語は、本明細書において使用される場合、一般的に、生物または個体の全ゲノム(すなわち、ゲノムのすべての領域)に由来し、および/またはそれを表す分子の集合を指す。
【0029】
「増幅産物」という用語は、本明細書において使用される場合、一般的に、例えば、ポリメラーゼ連鎖反応またはリガーゼ連鎖反応手法から作成される選択された増幅生産物を指す。
【0030】
「変異」または「対立遺伝子」という用語は、本明細書において使用される場合、一般的に、それぞれ微妙な差異を有するが、同様のシークエンシング組成をそれぞれエンコードしている複数の種の一つを指す。当該差異は、関連分野における通常の手段として知られるどんな遺伝子変異を含んでもよく、それらに限定されないが、多型、例えば一塩基多型(SNPs)、挿入または欠失変異(「インデル」としてまた称される、挿入/欠失の組み合わせ事象)、繰り返し配列(またタンデムリピートと称される)の数の相違、および構造的変異を含む。
【0031】
「対立遺伝子頻度(allele frequency)」または「対立遺伝子頻度(allelic frequency)」という用語は、本明細書において使用される場合、一般的に、ある特定の変異が含まれる集合における、すべての変異の比率を指す。
【0032】
「キーシークエンシング」または「キーエレメント」という用語は、本明細書において使用される場合、一般的に、テンプレート分子から作成されたシークエンシングデータに対する品質管理のレファレンスとして使用される既知のシークエンシング組成を含んでいる既知の位置(すなわち、典型的に、ライゲーションされたアダプターエレメント中に含まれる)におけるテンプレート核酸分子に関連した核酸シークエンシングエレメント(典型的に、約4つのシークエンシング配列、すなわち、TGACまたはその他のヌクレオチド種の組み合わせ)を指す。当該シークエンシングデータは、もし、正確な位置においてキーエレメントに関連した既知のシークエンシング組成を含むならば、当該品質管理に合格する。
【0033】
「キーパス」または「キーパスウェル」という用語は、本明細書において使用される場合、一般的に、反応ウェルにおける既知のシークエンシング組成の核酸テストシークエンシング全長(すなわち、上で「テストフラグメント」または「TF」と称される)のシークエンシングを指し、ここで、キーパステストシークエンシング由来のシークエンシングの精度が、既知のシークエンシング組成と比べられ、そして、シークエンシングの精度を測定するためおよび品質管理のために使用される。典型的な実施態様において、シークエンシングランにおけるウェルの総数のある割合は、ある実施態様では部分的に分配されるかもしれないキーパスウェルであろう。
【0034】
「平滑末端」という用語は、本明細書において使用される場合、関連技術分野における当業者の理解と一緒に、首尾一貫して解釈され、そして、一般的に、相補的なヌクレオチド塩基種対で終結している末端を持っている直鎖状二本鎖核酸分子であり、平滑末端対は、典型的に、それぞれのライゲーションのため適合する。
【0035】
「突出末端」という用語は、本明細書において使用される場合に、関連技術分野における当業者の理解と一緒に、首尾一貫して理解され、そして、一般的に、当該分子の一方の鎖の末端に一またはそれ以上の不対ヌクレオチド種を持っている鎖状二本鎖核酸分子であり、ここで不対ヌクレオチド種はいずれの鎖に存在してもよく、単一塩基位置(single base position)または複数の塩基位置(a plurality of base positions)(また、時々「付着末端」と称される)を含んでもよい。
【0036】
「ビーズ」または「ビーズ基質」という用語は、本明細書において使用される場合、一般的に、あらゆる手ごろなサイズの、例えば、セルロース、セルロース誘導体、アクリル樹脂、ガラス、シリカゲル、ポリスチレン、ゼラチン、ポリビニルピロリドン、ビニルおよびアクリルアミドの共重合体(co-polymer)、ジビニルベンゼンまたは類似物(例えば、Merrifield, Biochemistry 1964,3,1385-1390に記載されるような)と架橋されたポリスチレン、ポリアクリルアミド、ラテックスゲル、ポリスチレン、デキストラン、ラバー、シリコン、プラスチック、ニトロセルロース、天然スポンジ、シリカゲル、制御孔ガラス、金属、架橋されたデキストラン(例えば、セファデックス(登録商標))アガロースゲル(セファロース(登録商標))、および当業者に知られたその他の固相ビーズ支持体のようないくつもの既知の材料から形成加工されるあらゆる種類のビーズを指す。
【0037】
サンプル調製および処理、シークエンシングデータの作成、およびシークエンシングデータの解析に関わるシステムおよび方法のいくつかの模範的な実施態様は、一般的に以下に記載され、それらのいくらかのまたはすべては、本記載された発明の実施態様と一緒に使用することを受け入れられる。特に、テンプレート核酸分子の調製、テンプレート分子の増幅、標的特異的増幅産物および/またはゲノムライブラリーの作成、シークエンシング方法および機器、およびコンピュータシステムのためのシステムおよび方法の例示的な実施態様が記載されている。
【0038】
典型的な実施態様において、実験または診断サンプル由来の核酸分子は、その元の状態から高スループットシークエンシングに対応できるテンプレート分子に調製および処理されなければならない。処理方法は、アプリケーションごとに変わってもよく、さまざまな性質を含むテンプレート分子がもたらされてもよい。例えば、高スループットシークエンシングのある実施態様において、特定のシークエンシング方法が、シークエンシングデータを正確に生成することができる長さを少なくとも有するシークエンシングまたはリードレングスを有するテンプレート分子を作成することが、好ましい。本実施例において、長さは、約25〜30塩基対、約50〜100塩基対、約200〜300塩基対、約350〜500塩基対、500塩基対超の範囲、または特定のシークエンシングアプリケーションに対応できる他の長さを含んでもよい。ある実施態様において、サンプル、例えば、ゲノムサンプル由来の核酸は、当業者に既知のいくつかの方法を使用して、断片化される。好ましい実施態様において、核酸をランダムに断片化し(すなわち、特定のシークエンシングまたは領域について選択をしない)は、噴霧化および超音波処理方法と称される方法を含んでもよい。しかしながら、断片化の他の方法、例えば制限酵素を使用した分解は、断片化の目的のために使用されてもよい。また、本実施例において、ある処理方法は、所望する長さの核酸フラグメントを、選択的に分離するための当該分野において知られているサイズ選択方法を、使用してもよい。
【0039】
また、ある実施態様において、追加の機能的エレメントをそれぞれのテンプレート核酸分子と結合することは、好ましい。当該エレメントは、さまざまな機能のために使用されてもよく、例えば以下のものに制限されないが、増幅および/またはシークエンシング方法のためのプライマー、品質管理エレメント(すなわち、例えばキーエレメントまたは他の種類の品質管理エレメント)、起源または患者のサンプルについてのさまざまな関連付けをコード化する固有の識別子(多重識別子、つまり「MID」とも称される)、または他の機能的エレメントを含んでもよい。
【0040】
例えば、上記発明のある実施態様は、既知のかつ同定可能なシークエンシング組成を有するMIDエレメントの一またはそれ以上の実体を、サンプルと結合し、そして当該MIDエレメントの実体を、上記結合されたサンプル由来のテンプレート核酸とカップリングすることを含む。MIDが結合された、多くの異なるサンプル由来のテンプレート核酸分子は、単一の「多重化(multiplexed)」サンプルまたは組成中にプールされ、これは次にMIDが結合されたテンプレート核酸分子の各々についてのシークエンシングデータを生成するように効率的に処理されうる。それぞれのテンプレート核酸についてのシークエンシングデータは、解読されて(de-convoluted)、カップリングされたMIDエレメントのシークエンシング組成、並びに同定された元のサンプルとの関連を同定する。本実施例において、多重化された組成は、約384サンプル、約96サンプル、約50サンプル、約20サンプル、約16サンプル、約10サンプルまたは、他の数のサンプルから代表を含んでもよい。それぞれのサンプルは、研究の文脈では、異なる実験条件、処置、種、または個体と関連付けされてもよい。同様に、それぞれのサンプルは、診断の文脈では、異なる組織、細胞、個体、条件、または処理関連付けされてもよい。関連技術分野における当業者は、上に挙げられたサンプルの数は、例示の目的であり、そうして限定的に考慮されるべきではないということを理解されよう。
【0041】
好ましい実施態様において、それぞれのMIDエレメントのシークエンシング組成は、簡単に同定でき、そしてシークエンシング工程から導入されたエラーに耐性を有する。MIDエレメントのある実体は、天然シークエンシングと最小限のシークエンシング類似性を有する核酸種の固有のシークエンシング組成を含む。あるいは、MIDエレメントの実体は、天然シークエンシングに対するある程度のシークエンシング類似性含んでもよい。
【0042】
また、好ましい実施態様において、それぞれのMIDエレメントの位置は、テンプレート核酸分子および/または当該テンプレート分子に結合されたアダプターエレメントのいくらかの特徴に関係することが知られている。それぞれのMIDの既知の位置を有することは、シークエンシングデータ中においてMIDエレメントを見つけ、そして起こり得るエラーおよびそれに続く元のサンプルとの関連付けについて、MIDシークエンシング組成を解読するために有用である。
【0043】
例えば、MIDエレメントに対する位置的な関係のためのアンカーとして有用であるいくつかの特徴は、以下のものに限定されないが、テンプレート分子の長さ(すなわち、MIDエレメントは5’または3’末端からの多くのシークエンシング位置であることが知られている)、MIDエレメントに隣接して配置される確認できるシークエンシングマーカー、例えば、キーエレメントおよび/または一またはそれ以上のプライマーエレメント、を含んでもよい。本実施例において、キーおよびプライマーエレメントは、一般的に、多重化された組成中のサンプル間で典型的には変化しておらず、そしてMIDエレメントを探すための位置的参照として使用されうる、既知のシークエンシング組成を含む。アプリケーション135により実装される分析アルゴリズムは、コンピュータ130上で実行されて、より簡単に認識できるキーおよび/またはプライマーエレメントを同定するためのMIDが結合されたテンプレートの各々について作成されたシークエンシングデータを解析し、そしてこれらの位置から、MIDエレメントの配列を含むと推定されるシークエンシング領域の同定を推定する。アプリケーション135は、推定される領域およびその隣接領域においておそらくいくらか離れている領域のシークエンシング組成を処理して、MIDエレメントとそのシークエンシング組成を確実に同定する。
【0044】
いくつかのまたはすべての記載された機能的エレメントは、ある処理工程においてヌクレオチドシークエンシングに結合されたアダプターエレメントに組み込まれてもよい。例えば、ある実施態様は、増幅および/またはシークエンシングのために使用されるプライマーシークエンシングの相補的なシークエンシング組成を含んでいるプライミングシークエンシングエレメントまたは領域に関してもよい。さらに、同じエレメントは、「鎖選択」(strand selection)と称されるもの、および核酸分子の固相基質への固定化に使用されてもよい。ある実施態様によると、二組のプライミングシークエンシング領域(以後、プライミングシークエンシングA、およびプライミングシークエンシングBと称する)は、鎖選択に使用してもよく、ここで、プライミングシークエンシングAの一つの複製およびプライミングシークエンシングBの一つの複製を有する一つの鎖のみが、調製されたサンプルとして選択され、そして、含まれる。代替的な実施態様において、アダプターエレメントの設計特性は、鎖選択の必要を除去する。同じプライミングシークエンシング領域は、増幅および固定化のための方法であって、当該方法において例えば、プライミングシークエンシングBは、固体基質に固定化されそして増幅産物はそこから伸長される方法において使用されてもよい。
【0045】
細分化、鎖選択、および機能的エレメントおよびアダプターの追加のためのサンプル処理の追加的な実施例は、“Method for preparing single‐stranded DNA libraries”の表題で、2004年1月28日に出願された米国特許出願番号第10/767,894号;“System and Method for Identification of Individual Samples from a Multiplex Mixture”の表題で、2008年5月29日に出願された米国特許出願番号第12/156,242号;および、“System and Method for Improved Processing of Nucleic Acids for Production of Sequencable Libraries”の表題で、2009年2月23日に出願された米国特許出願番号第12/380,139号において記載されている。
【0046】
実質的に同一のコピーの集合を作成するためのテンプレート核酸分子の増幅を遂行するためのシステムおよび方法のさまざまな例が、記載されている。一またはそれ以上のヌクレオチド種が、テンプレート分子のコピーに付随しているそれぞれの新生分子に取り込まれる場合、SBSのいくつかの実施態様において、それぞれの核酸エレメントの多くのコピーを作成して強いシグナルを生成することが望ましいということは、当業者に自明であろう。核酸分子のコピーを作成するための本技術分野において知られた多くの技術、例えば、バクテリアのベクターとして称されるものを用いた増幅、「ローリングサークル」(Rolling Circle)増幅(米国特許第6,274,320号および第7,211,390号に記載)、およびポリメラーゼ連鎖反応(PCR)法があり、それぞれの技術は、本発明への使用に適している。特定の高スループットアプリケーションに受け入れられる、あるPCR技術は、エマルジョンPCRとして称されるもの(emPCR(商標)法としても称される)を含む。
【0047】
エマルジョンPCR法の典型的な実施態様は、その中で反応が起こりうる水性液胞を作り出す二つの非混和性物質の安定なエマルジョンを作成することを含む。特に、PCR方法における使用に許容されるエマルジョンの水性液胞は、他の液体、例えば、典型的にある種類の油を含む、例えば疎水性の液体(また、連続相とも称される)中に、第一液体、例えば、液胞として懸濁されまたは分散された水から成る液体(また、不連続相とも称される)を含んでもよい。使用されてもよい油の例は、これらに限定されないが、ミネラルオイル、シリコーン系オイル、またはフッ素化オイルを含む。
【0048】
さらに、あるエマルジョンの実施態様は、エマルジョンを安定させるように働く界面活性剤を使用してもよく、それは、例えば、PCRのための特定の処理方法のために、特に有用であることもある。界面活性剤のある実施態様は、一またはそれ以上のシリコーンまたはフッ素化界面活性剤を含んでもよい。例えば、これらに限定されないが、ソルビタンモノオレアート(また、Span(商標)80)と称される)、ポリオキシエチレンソルビタンモノオレアート(また、Tween(商標)80)と称される)、またはある好ましい実施態様によると、ジメチコンコポリオール(また、Abil(商標)EM90と称される)、ポリシロキサン、ポリアクリル ポリエーテル コポリマー、ポリグリセロール エステル、ポロキサマー、およびPVP/ヘキサデカン コポリマー(また、Unimer U-151と称される)、または、より好ましい実施態様は、シクロペンタシロキサン中の高分子量のシリコーンポリエーテル(また、ダウ コーニングから入手できるDC 5225Cと称される)を含む一またはそれ以上の非イオン界面活性剤が使用されてもよい。
【0049】
エマルジョンの液胞は、また、コンパートメント、マイクロカプセル、マイクロリアクション、マイクロエンヴァイラメントまたは、関連技術分野において通常使用される他の名前で称されもよい。水性液胞のサイズは、エマルジョン構成要素または組成物の組成、その中に含まれる内容物、および使用される製剤技術に依存し変動してもよい。上記エマルジョンは、その中で化学反応、例えばPCRが行われるところのマイクロエンヴァイラメントを作り出してもよい。例えば、テンプレート核酸、および所望のPCR反応を実行するために必要なすべての試薬は、エマルジョンの液胞中に封入され、そして化学的に孤立されてもよい。ある実施態様において、追加の界面活性剤または他の安定化剤は、上に記載されたように液胞のさらなる安定性を促進するために、使用されてもよい。PCR方法の典型、サーモサイクリング操作は、カプセル化されたテンプレート核酸を増幅し、テンプレート核酸の多くの実質的に同一のコピーを含んでいる集合の作成に至るために、液胞を使用して遂行されてもよい。ある実施態様において、液胞内の集合は、「クローナルに分離された」(clonally isolated)、「コンパートメント化された」(compartmentalized)、「隔離された」(sequestered)、「カプセル化された」(encapsulated)、または「局在化された」(localized)集合として、称されてもよい。また、本実施例において、いくつかのまたはすべての記載された液胞は、さらに、例えば、テンプレートおよびテンプレートの増幅されたコピー、テンプレート相補的な増幅されたコピー、またはそれらの組み合わせを結合するためのビーズのような固体基質をカプセル化してもよい。さらに、固体基質は、他のタイプの核酸、試薬、標識、または他の目的の分子の結合を可能にしてもよい。
【0050】
本発明と有用なエマルジョンの実施態様は、上記化学反応が大量に並行して遂行されることを可能にする、非常に高密度の液胞またはマイクロカプセルを含んでもよい。増幅に使用されるエマルジョン、およびそのシークエンシング適用のための使用の追加的な例は、米国特許第7,638,276号、第7,622,280号および米国特許出願第10/767,899号、および第11/045,678号に記載されている。
【0051】
また、ときに超深シークエンシング(Ultra-Deep Sequencing)と称され、シークエンシングのための標的特異的増幅産物を生成する実施態様は、本発明と使用されてもよく、特異的核酸プライマーのセットを使用して、標的核酸を含むサンプルから得られた選択された標的領域(一または複数)を増幅することを含む。さらに、当該サンプルは、当該プライマーが、増幅のため、およびサンプル中におけるシークエンシング変異の分布についての見識を与えるために使用されうる研究または診断的用途に関係するシークエンシング組成を含んでいるシークエンシング変異を包含することが知られているか、または包含すると疑われている核酸分子の集合を含んでもよい。例えば、核酸サンプルにおいて、複数の対立遺伝子を特異的に増幅し、そしてシークエンシングすることにより、シークエンシング変異を同定するための方法が、遂行されてもよい。核酸は、まず、目的の領域の周囲の領域または核酸集合に共通している部分を増幅するように設計されたPCRプライマー対により、増幅にかけられる。PCR反応のそれぞれの産物(第一増幅産物)は、例えば上記エマルジョンに基づく液胞などの分離した反応容器内において、引き続いてさらに個別に増幅される。得られた増幅産物(本明細書において第二増幅産物と称される)、そしてそれぞれ増幅産物の第一集合の一つに由来する、はシークエンシングされそしてシークエンシングの集合を用いて、一またはそれ以上の変異の存在についての対立遺伝子頻度が決定される。重要なことに、当該方法は、変異の存在についての今までの知識を必要とせず、そして典型的に核酸分子の集合において1%未満の頻度の変異の存在を同定する。
【0052】
上記の標的特異的な増幅およびシークエンシング方法のある利点は、従来の到達されるより高いレベルの感度を含む。さらに、高スループットシークエンシング器具を使用する実施態様、例えば、454ライフ サイエンス コーポレーションにより提供されるウェルのPico Titer Plate(登録商標)アレイ(また、時々PTP(商標)プレートまたはアレイとして称される)と呼ばれるものを使用する実施態様では、上記方法は、1回のランまたは実験ごとに100,000超、300,000超、500,000超、または1,000,000超の核酸領域のためのシークエンシング組成を作成するために使用されそして、少なくともある程度、例えば、ガスケットなどの使用によって可能とされるレーンの配置など、使用者の能力に依存する。また、記載された方法は、対立遺伝子の変異のうちの1%またはそれ未満を占める低い発生量の対立遺伝子の検出の感度を提供する。当該方法の他の利点は、分析された領域のシークエンシングを含んでいるデータの作成を含む。重要なことは、分析されている遺伝子座のシークエンシングについての事前の知識を有する必要がないことである。
【0053】
シークエンシングのための標的特異的増幅産物の追加的な実施例は、2005年4月12日に出願された“Method for determining sequence variants using ultra−deep sequencing”という表題の米国特許出願第11/104,781号において、2008年3月14日に出願された“System and Method for Detection of HIV Drug Resistant Variants”という表題のPCT特許出願番号US 2008/003424号において、そして2009年6月17日に出願された“System and Method for Detection of HIV Tropism Variants”という表題の米国特許出願第12/456,528号において記載されている。
【0054】
さらに、シークエンシングの実施態様は、サンガー型技術、一般的に、シークエンシングバイハイブリダイゼーション(SBH)技術、シークエンシングバイライゲーション(SBL)技術、またはシークエンシングバイインコーポレーション(SBI)技術と称される技術を含む。さらに、シークエンシング技術は、ポロニーシークエンシング技術;ナノポア、導波管、およびその他の一分子検出技術;または、可逆的ターミネーター技術が含まれてもよい。上記のように、好ましい技術は、シークエンシングバイシンセシス方法が含まれてもよい。例えば、いくつかのSBS実施態様は、テンプレート核酸の実質的に同一のコピーの集合をシークエンシングし、典型的には、サンプルテンプレート分子またはテンプレート分子に結合した一またはそれ以上のアダプターの予定された相補的な位置にアニールするように設計された一またはそれ以上のオリゴヌクレオチドプライマーを使用する。プライマー/テンプレート複合体は、核酸合成酵素の存在下で、ヌクレオチド種と一緒に、提示される。ヌクレオチド種が、オリゴヌクレオチドプライマーの3’末端に直接隣接しているサンプルテンプレート分子上のシークエンシング位置に対応する核酸種に相補的である場合には、合成酵素がそのヌクレオチド種によりプライマーを伸長するであろう。代替的には、ある実施態様において、プライマー/テンプレート複合体に、複数の目的のヌクレオチド種(典型的には、A,G、C、およびT)が一度に提示され、オリゴヌクレオチドプライマーの3’末端に直接隣接しているサンプルテンプレート分子上の対応するシークエンシング位置において相補的なヌクレオチド種が取り込まれる。記載された実施態様のいずれにおいても、ヌクレオチド種は、さらなる伸長を防止するために(例えば、3'‐O位等に)化学的に保護され、合成の次のラウンドの前に脱保護される必要があるかもしれない。新生分子の末端にヌクレオチド種を加える工程は、プライマーの末端への添加に関して上記されたものと実質的に同一であることも。認識されるであろう。
【0055】
上記のように、ヌクレオチド種の結合は、本技術において知られているさまざまな方法によって、例えば、ピロリン酸(PPi)の放出の検出によって(米国特許第6,210,891号;第6,258,568号;および第6,828,100号において記載された例)、またはヌクレオチドに結合した検出可能標識を介して、検出され得る。検出可能標識のいくつかの例は、これに限定されないが、マスタグ(mass tag)および蛍光標識または化学発光標識を含む。典型的な実施態様において、未取り込みのヌクレオチドは、例えば、洗浄により、除去される。さらに、いくつかの実施態様において、未取り込みのヌクレオチドは、例えば、2008年6月27日に出願された“System and Method for Adaptive Reagent Control in Nucleic Acid Sequencing”という表題の米国特許出願第12/215,455号;および2009年1月29日に出願された“System and Method for Improved Signal Detection in Nucleic Acid Sequencing”という表題の米国特許出願第12/322,284号に記載されたようなアピラーゼまたはピロフォスファターゼ酵素を使用する分解などの酵素分解に供されてもよい。
【0056】
検出可能標識が使用される実施態様において、それらは、典型的には、合成の次のサイクルの前に(例えば、化学的切断またはフォトブリーチングにより)不活性化されなければならないであろう。次に、上記のように、テンプレート/ポリメラーゼ複合体内の次のシークエンシング位置が、目的のもう一つのヌクレオチド種または複数のヌクレオチド種によりクエリーされ得る。ヌクレオチドの添加、伸長、シグナル取得および洗浄の繰り返されたサイクルが、テンプレート鎖のヌクレオチドシークエンシングの決定をもたらす。本実施例を続けると、多数の実質的に同一のテンプレート分子または実質的に同一のテンプレート分子の集合(例えば、103、104、105、106または107分子)が、典型的には、確実な検出のために十分強力なシグナルを達成するため、いずれか一つのシークエンシング反応において同時に分析される。
【0057】
さらに、いくつかの実施態様において、「ペアエンド」(pair end)シークエンシング戦略として称されるものを使用することにより、シークエンシング工程のリードレングス能力および品質を改善することは、有利かもしれない。例えば、シークエンシング方法のいくつかの実施態様は、高品質かつ信頼できるリードが作成されうる分子の全長について限界を有する。言い換えると、信頼できるリードレングスのための塩基配列の総数は、使用されたシークエンシング実施態様に依存して、25、50、100、または500塩基を超えられないであろう。ペアエンドシークエンシング戦略は、リンカーシークエンシングにより中央で接合された最初の元のテンプレート核酸分子の断片を各末端において含む分子の各末端(時々「タグ」末端として称される)を別々にシークエンシングすることにより、信頼できるリードレングスを延長する。テンプレート断片の最初の位置関係は知られており、それゆえシークエンシングリードからのデータは、より長い高品質のリードレングスを有する単一リードに再度組み合わせられ得る。ペアエンドシークエンシング実施態様のさらなる例は、2009年1月28日に出願された“Paired end sequencing” という表題の米国特許第7,601,499号において、および“Paired end sequencing”という表題の米国特許出願第12/322,119号に記載されている。
【0058】
SBS装置のいくつかの例は、上記方法のいくつかまたはすべてを実行することができ、そして荷電結合素子(すなわち、CCDカメラ)または共焦点型アーキテクチャーのような検出器、マクロ流体チャンバーもしくはフローセル、反応基質、および/またはポンプおよびフローバルブのうちの一またはそれ以上を含んでもよい。ピロリン酸に基づくシークエンシングを例とすると、装置の実施態様は、本質的に低いレベルのバックグラウンドノイズを生じる光学発光検出戦略を使用してもよい。
【0059】
いくつかの実施態様において、シークエンシングのための反応基質は、それぞれ実質的に同一のテンプレート分子の集合を保持することが可能な、数十万個以上の極めて小さなウェルを与えるように酸エッチングされたファイバーフェースプレートから形成された、上記のような454ライフ サイエンス コーポレーションから入手できるPTP(商標)アレイと称されるものを含んでもよい(すなわち、いくつかの好ましい実施態様は、70×75mmPTP(商標)アレイに35μmのウェル間隔で約330万個のウェルを含む)。いくつかの実施態様において、実質的に同一のテンプレート分子のそれぞれの集合は、例えば、ビーズのような固体基質上に配置され、そして、それぞれ、当該ウェルのうちの一つに配置されてもよい。例えば、装置は、PTPプレート上のそれぞれのウェルから放射された光の光子を集めることが可能なCCD型検出器と同様にPTPプレートホルダーに液体試薬を提供するための試薬デリバリーエレメントを含んでもよい。改善されたシグナル認識のための特徴を含んでいる反応基質の例は、2005年8月30日に出願された“THIN‐FILM COATED MICROWELL ARRAYS AND METHODS OF MAKING SAME”という表題の米国特許第7,682,816号に記載されている。SBS型シークエンシングおよびピロリン酸シークエンシングの遂行のための装置および方法のさらなる例は、米国特許第7,323,305号および第7,682,816号に記載されている。
【0060】
さらに、例えば、上記emPCR(商標)工程のような、一またはそれ以上のサンプル調製工程を自動化するシステムおよび方法が、使用されてもよい。例えば、自動化されたシステムは、emPCR処理のためのエマルジョンを作成し、PCRサーモサイクリング運転を遂行し、そしてシークエンシングのための核酸分子の成功裏に調製された集合を濃縮するために有効な溶液を提供するために使用されてもよい。自動化されたサンプル調製システムの例は、2005年1月28日に出願された“Nucleic acid amplification with continuous flow emulsion”という表題の米国特許出願第11/045,678号に記載されている。
【0061】
また、本明細書に記載された本発明の実施態様のシステムおよび方法は、コンピュータシステムでの実行のために保管された読み取り可能な媒体を使用する、ある設計、分析、または他の操作の実行を含んでもよい。例えば、処理および分析実施態様がコンピュータシステムにおいて実行できる、SBSシステムおよび方法を使用して、検出されたシグナルを処理しおよび/または作成されたデータを分析するためのいくつかの実施態様が以下に詳細に記載される。
【0062】
本記載された発明と一緒に使用するためのコンピュータシステムの例示的な実施態様は、例えば、ワークステーション、パーソナルコンピュータ、サーバー、または他のあらゆる既存のまたは将来のコンピュータなどのコンピュータプラットフォームのあらゆる型を含んでもよい。しかしながら、本明細書に記載されたように、前述のコンピュータプラットフォームは、本記載された発明に特化した操作を遂行するために明確に構成され、そして一般的な目的のコンピュータを考慮されないことが当業者によって認識される。コンピュータは、典型的に、例えばプロセッサー、オペレーティングシステム、システムメモリー、メモリーストレージデバイス、入出力コントローラー、入出力デバイス、およびディスプレイデバイスのような既知の構成要素を含む。コンピュータの多くの潜在的な機器構成および構成要素があり、そしてまたキャシュメモリー、データバックアップユニット、および多くの他の装置も含まれ得ることが、関連分野における当業者によってまた、理解されるであろう。
【0063】
ディスプレイデバイスは、視覚情報を提供するディスプレイデバイスが含まれてもよく、この情報は、典型的に、ピクセルのアレイとして論理的におよび/または物理的に組織化されてもよい。入出力インターフェースを提供するためのあらゆる多様な既知のまたは将来のソフトウェアプログラムを含んでもよいインターフェースコントローラーが含まれてもよい。例えば、インターフェースは、ユーザーに一またはそれ以上のグラフィカル表示を提供する「グラフィカルユーザーインターフェース」と一般的に称されるもの(しばしば、GUI'sと称される)を含んでもよい。インターフェースは、典型的に、関連分野の当業者に知られた選択または入力の手段を使用してユーザー入力を認めることが可能である。
【0064】
同様のまたは代替的な実施態様において、コンピュータ上のアプリケーションは、「コマンドラインインターフェース」と称されるもの(しばしば、CLI'sと称される)を含むインターフェースを使用してもよい。CLI’sは、典型的に、アプリケーションとユーザーとの間のテキストベースのインターフェースを提供する。典型的に、コマンドラインインターフェースは、ディスプレイデバイスを通じてテキストのラインとして出力を提示しおよび入力を受容する。例えば、いくつかの実行は、例えば、関連分野の当業者に知られたユニックスシェル(Unix(登録商標) shell)のような「シェル」と称されるもの、または例えば、Microsoft(登録商標).NET framework(登録商標)のようなオブジェクト指向型プログラミングアーキテクチャーを使用するMicrosoft(登録商標)Windows Powershell(登録商標)を含んでもよい。
【0065】
関連分野の当業者は、インターフェースが一またはそれ以上のGUI’s、CLI’sまたはそれらの組み合わせを含んでもよいことを認識するであろう。
【0066】
プロセッサーには、例えば、Intel Corporation製のCeleron(登録商標)、Core(商標)、またはPentium(登録商標)プロセッサー、Sun Microsystems製のSPARC(登録商標)、AMD corporation製のAthlon(商標)、Sempron(商標)、Phenom(商標)、またはOpteron(商標)プロセッサーのような市販のプロセッサーが含まれてもよく、または利用可能または利用可能になりうる他のプロセッサーの一つかもしれない。プロセッサーのいくつかの実施態様は、マルチコア(multi-core)プロセッサーと称され、および/またはシングルまたはマルチコア機器構成において並行処理技術を使用することが可能なものが含まれてもよい。例えば、マルチコアアーキテクチャーは、典型的に、二またはそれ以上のプロセッサー「実行コア(execution cores)」を含む。本実施例において、それぞれの実行コアは、複数のスレッドの並行実行を可能にする独立したプロセッサーとして遂行してもよい。さらに、関連分野の当業者は、プロセッサーが、32または64ビットアーキテクチャーとして一般的に称され、または現在知られているまたは将来において開発されるであろう他のアーキテクチャー機器構成で構成されてもよいことを、認識するであろう。
【0067】
プロセッサーは、典型的に、例えば、Microsoft(登録商標)コーポレーションの(例えば、Windows(登録商標)XP、Windows Vista(登録商標)、またはWindows(登録商標)7のような)Windows(登録商標)型オペレーティングシステム;Apple(登録商標)Computer Corp.の(例えば、Mac OS(登録商標)X v10.6「Snow Leopard(登録商標)」オペレーティングシステムのような)Mac OS(登録商標)Xオペレーティングシステム;多くの供給元またはオープンソースと称されるものから入手可能なUnix(登録商標)またはLinux(登録商標)型オペレーティングシステム;その他のまたは将来のオペレーティングシステム;またはそれらのいくつかの組み合わせであってもよいオペレーティングシステムを実行する。オペレーティングシステムはよく知られた方法でファームウェアおよびハードウェアとインターフェースで接続し、そして多様なプログラミング言語で書かれてもよいさまざまなコンピュータプログラムの機能をプロセッサーが調整し実行するのを容易にする。オペレーティングシステムは、典型的にプロセッサーと協調して、コンピュータのその他の構成の機能を調整および実行する。オペレーティングシステムは、また、スケジューリング、入出力コントロール、ファイルおよびデータ管理、メモリー管理、およびコミュニケーションコントロールおよび関連サービスも、すべての既知の技術に従って、提供する。
【0068】
システムメモリーには、多様な既知のまたは将来のメモリーストレージデバイスのいずれかのものが含まれてもよい。例には、あらゆる一般的に入手可能なランダムアクセスメモリー(RAM)例えば常駐ハードディスクまたはテープのような磁気媒体、読み取りおよび書き込みコンパクトディスクのような光学媒体、またはその他のメモリーストレージデバイスを含む。メモリーストレージデバイスは、コンパクトディスクドライブ、テープドライブ、リムーバルハードディスクドライブ、USB(登録商標)またはフラッシュドライブ、またはディスクドライブを含んでいる、多様な既知のまたは将来のデバイスのいずれかを含んでもよい。そのような型のメモリーストレージドライブは、典型的に、例えば、それぞれ、コンパクトディスク、磁気テープ、リムーバルハードディスク、USB(登録商標)またはフラッシュドライブ、またはフロッピー(登録商標)ディスクのようなプログラムストレージ媒体(示されていない)から読み出す、および/または書き込む。これらのプログラムストレージ媒体いずれか、または現在使用しているまたは後に開発されるかもしれないその他は、コンピュータプログラム製品と考慮されてもよい。認識されうるように、これらのプログラムストレージ媒体は、典型的にコンピュータソフトウェアおよび/またはデータを記憶する。コンピュータソフトウェアプログラムは、また、コンピュータコントロールロジックと呼ばれ、典型的にシステムストレージデバイスと併せて使用されるシステムメモリーおよび/またはプログラムストレージデバイスに記憶される。
【0069】
いくつかの実施態様において、内部に記憶されたコントロールロジック(プログラムコードを含むコンピュータソフトウェアプログラム)を有するコンピュータで使用可能な媒体を含んでいるコンピュータプログラム製品が、記載される。コントロールロジックは、プロセッサーによって実行された時、本明細書に記載された機能をプロセッサーに遂行させる。その他の実施態様において、いくつかの機能は、例えば、ハードウェアステイトマシンを使用して、主としてハードウェアにおいて実行される。本明細書に記載された機能を遂行するためのハードウェアステイトマシンの実行は、関連分野の当業者に明白であろう。
【0070】
入出力コントローラーは、ヒトまたは機械であってもよく、ローカルまたはリモートであってもよいユーザーからの情報を受容および処理するための多様な既知のデバイスのいずれかを含むであろう。そのようなデバイスは、例えば、モデムカード、ワイヤレスカード、ネットワークインターフェースカード、サウンドカード、または多様な既知の入力デバイスのいずれかのための、その他の型のコントローラーを含む。出力コントローラーは、ヒトまたは機械であってもよく、ローカルまたはリモートであってもよいユーザーからの情報を提示するための多様な既知のディスプレイデバイスのいずれかのためのコントローラーを含むであろう。上記実施態様において、コンピュータの機能要素は、システムデバイスを介して相互に通信し合う。コンピュータのいくつかの実施態様は、ネットワークまたは他の型のリモートコミュニケーションを使用して、いくつかの機能要素と通信し合ってもよい。
【0071】
関連分野の当業者に明らかなように、装置コントロールおよび/またはデータ処理アプリケーションは、ソフトウェアにおいて実行される場合、システムメモリーおよび/またはメモリーストレージデバイスへロードされ、そして実行されてもよい。装置コントロールおよび/またはデータ処理アプリケーションの全部または一部は、リードオンリーメモリーまたはメモリーストレージデバイスの類似のデバイスに存在してもよく、そのようなデバイスは、装置コントロールおよび/またはデータ処理アプリケーションが、最初に入出力コントローラーを通じてロードされることを必要としない。装置コントロールおよび/またはデータ処理アプリケーション、またはその一部は、実行のために有利であるような、システムメモリーまたはキャッシュメモリーまたはその両方へ、既知の様式で、プロセッサーによりロードされてもよいことが、関連分野の当業者により理解されるであろう。
【0072】
また、コンピュータは、一またはそれ以上のシステムメモリーに記憶されたライブラリーファイル、実験データファイルおよびインターネットクライアントを含んでもよい。例えば、実験データは、検出されたシグナル値のような一またはそれ以上の実験またアッセイに関するデータ、または一またはそれ以上のSBS実験または処理と関連する他の値を含んでもよい。さらに、インターネットクライアントは、ネットワークを使用してもう一つのコンピュータ上のリモートサービスにアクセス可能なアプリケーションを含んでもよく、例えば、「ウェブブラウザー」と一般的に称されるものを含んでもよい。本例において、いくつかの一般的に使用されているウェブブラウザーは、Microsoft(登録商標)コーポレーションから入手可能なMicrosoft(登録商標)Internet Explorer(登録商標)8、Mozilla(登録商標)コーポレーションからのMozilla Firefox(登録商標)3.6、Apple(登録商標)Computer Corp.からのSafari4、Google(商標)コーポレーションからのGoogle(登録商標)Chrome、または当該技術分野において現在知られているかまたは将来において開発されるその他の型のウェブブラウザーを含む。また、同一のまたは他の実施態様において、インターネットクライアントは、バイオロジカルアプリケーションのためのデータ処理アプリケーションのようなネットワークを介して遠隔の情報にアクセス可能な特殊なソフトウェアアプリケーションを含んでもよく、またはそれの要素であってもよい。
【0073】
ネットワークは、当業者に周知の多くのさまざまな型のネットワークの一またはそれ以上を含んでもよい。例えば、ネットワークは、通信を行うためのTCP/IPプロトコルスイートと一般的に称されるものを使用するローカルまたはワイドエリアネットワークを含んでもよい。ネットワークは、インターネットとして一般的に称される相互接続されたコンピュータネットワークのワールドワイドシステムを含んでいるネットワークを含んでもよく、または、さまざまなイントラネットアーキテクチャーも含まれてもよい。関連技術分野の当業者は、ネットワーク環境におけるいくつかのユーザーが、ハードウェアおよび/またはソフトウェアのシステム間の情報交信をコントロールするための「ファイヤウォール」と一般的に称されるもの(また、時々パケットフィルターまたはボーダープロテクションデバイスと称される)を使用することを好むかもしれないことも認識するであろう。例えば、ファイヤーウォールは、ハードウェアまたはソフトウェアエレメントまたはそれらのいくつかの組み合わせを含んでもよく、典型的には、例えば、ネットワーク管理者等のようなユーザーにより適所に置かれたセキュリティポリシーを強化するよう設計されている。
【0074】
b.本明細書記載の発明の実施態様
上記のように、当該発明の実施態様は、特定のDNAの同定によってHLAと関連するシークエンシング変異(例えば、対立遺伝子変異、一塩基多型変異、インデル変異)のいくつかを同定または診断する方法に関する。HLA対立遺伝子の例は、Mason and Parham(1998)Tissue Antigens51:417−66に記載され、そしてそこでは、HLA−A、HLA−BおよびHLA−Cの対立遺伝子が示されており、およびMarsh et al.(1992)Hum.Immunol.35:1に記載され、そしてそこでは、DRA,DRB、DQA1、DQB1、DPA1、およびDPB1のHLAクラスII対立遺伝子が示されている。
【0075】
典型的に、一またはそれ以上の処理工程を自動化する一またはそれ以上の装置エレメントが、使用されてもよい。例えば、シークエンシング方法の実施態様は、いくつかのまたはすべての処理工程を自動化しおよび実行するための、計装の使用を実行してもよい。図1は、光学シグナルの収集を必要とするシークエンシング処理については光学サブシステムを、そして反応基質105上で生じるシークエンシング反応の実行とデータの補足については流体サブシステムを、典型的に含むシークエンシング装置100の例示的な例を提供する。しかしながら、他のデータ収集のモード(すなわち、pH、温度、電気化学など)を必要とするシークエンシング処理については、関連分野の当業者に知られているデータ収集のモードのためのサブシステムが使用されてもよいことが認識されるであろう。
【0076】
シークエンシング処理を実行するために使用されるシークエンシング装置100の実施態様は、液体のサブシステムにおけるさまざまな液体の構成要素、光学サブシステムにおけるさまざまな光学構成要素、並びに図1において図示されていない追加の構成要素であって、いくつかの機能のローカルコントロールのための、マイクロプロセッサーおよび/またはマイクロコントローラー構成要素を含みうる構成要素を含んでもよい。いくつかの実施態様によると、装置100を使用するシークエンシングのための必要な調製のいくつかまたはすべてを遂行するように構成されたサンプル調製装置180を使用して、サンプルは、自動化されたまたは部分的に自動化された様式でのシークエンシング用に場合により調製されてもよい。さらに、図1に図示されたように、シークエンシング装置100は、例えば、一またはそれ以上の外部コンピュータ構成要素、例えば、システムソフトフェアまたはファームウェア、例えばアプリケーション135、を実行しうるコンピュータ130に作動可能なように繋げられてもよい。ここで、アプリケーション135は、シークエンシング装置100またはサンプル調製装置180などの一またはそれ以上の装置、および/またはデータ分析機能の指示による制御を提供しうるものである。コンピュータ130は、装置システムを遠隔操作すること、並びに大量のデータを貯蔵および処理が可能なシステムへとエクスポートすることを可能にしうるネットワーク150経由で、他のコンピュータまたはサーバーに作動可能なように繋がれてもよい。本例において、シークエンシング装置100および/またはコンピュータ130は、上で一般的に記載された実施態様の構成要素および特性のうちのいくつかまたはすべてを含んでもよい。
【0077】
一般的に、本発明の実施態様は、たとえ、サンプルにおいて、HLA型が、非常に低い頻度で生じる場合でも、存在するHLA型の発生の頻度の同定を可能とする、数千の核酸分子からシークエンシング情報を並行して生成するシークエンシング技術と相まった、HLAの特定の領域を標的とした2段階のPCR技術(すなわち、上記のように第一および第二増幅産物を生成する)を含む。典型的なHLA型決定の実施態様では、個人についてのHLA型は、完全にホモ接合(この場合、各タイプは、約100%の頻度で検出される)、または完全にヘテロ接合(この場合、各タイプは、約50%の頻度で検出される)であると認められよう。しかしなから、当該発明の実施態様は、非化学量論的な対立遺伝子量でHLA型を含んでいるサンプルにおいて存在するHLA型、例えば50%超の、50%未満の、25%未満の、10%未満の、5%未満の、1%未満で存在するHLA型を検出することができる。例えば、特異的増幅を使用して単一の個人に由来するサンプルについては、HLA対立遺伝子の100%または50%(ヘテロ接合において)を検出することが予期されるであろう。しかしながら、二人以上に由来する複雑な混合物において、例えば複数の寄与者を伴う科学捜査資料(容疑者および被害者からの血液)または骨髄移植(ドナーおよびレシピエントの混合)後の生着をモニタリングする血液サンプルにおいて、または1〜2%の母親細胞を伴う重症複合免疫不全の症例において、例えば5%または10%検出できるであろう。上記実施態様は、迅速に、信頼でき、および費用効率的な態様で、そのような同定を可能にする。
【0078】
上記実施態様において、上記エマルジョンに基づくPCR増幅戦略を用いて、第二ラウンドの増幅が起こり、ビーズ基質上に固定された「第二増幅産物」のクローナル集合をもたらし、これは第二増幅産物を効果的に隔離して、エマルジョンが壊れた場合の拡散を防止する。典型的に、数千の第二増幅産物は、その後、この明細書の別の場所に記載されたように並行してシークエンシングされる。例えば、第二増幅産物の集合を固定化したビーズは、反応基質105にロードされ、そしてぞれぞれのサンプルから1000超のクローナル長を作成しそして処理のためのコンピュータ130にシークエンシングデータを出力するシークエンシング装置100を使用して処理される。コンピュータ130は、サンプル中の本目的の遺伝子座についてのHLA型(一または複数)を同定する専用ソフトフェア(例えばアプリケーション135等)を実行する。
【0079】
上記のとおり、並行による多くの核酸テンプレートのシークエンシングは、上記の通り本発明に感度を提供する。例えば、二項統計(binomial statistic)に基づく、95%の信頼性での60mm×60mmのPico Titer Plate(2×106高品質塩基、200,000×100塩基長を含んでいる)の検出下限(すなわち、一つのイベント)は、少なくとも0.002%の対立遺伝子頻度を有する集合であり、そして99%の信頼性では、少なくとも0.003%の対立遺伝子頻度を有する集合(70×75mmPico Titer Plateが、上記のように使用されることが好ましく、そしてそれは、さらにより多数のリードを可能にし、そして高い感度を可能にする)である。比較のために、ピロリン酸に基づくシークエンシングを介したSNPの検出は、最も頻度の低い対立遺伝子が10%またはそれ以上存在する限り、4倍体ゲノムにおける分離した対立遺伝子状態の検出を報告している(Rickert et al.,2002 Bio Techniques. 32:592-603)。従来の蛍光DNAシークエンシングは、感度がさらに良くなく、50/50(すなわち50%)のヘテロ接合対立遺伝子を分離するのにトラブルを生じる(Ahmadian et al.,2000 Anal. BioChem. 280:103-110)。
【0080】
例示を目的として、表1は、所定の数N(=100)のシークエンシングされた増幅産物について、全集合におけるSNPの出現に基づき、ゼロあるいは、一またはそれ以上のイベントの検出確率を示している。「*」は、出現が5.0%の時の、少なくとも一のイベントを検出するのに失敗する3.7%の確率の失敗を示しており、同様に、「**」は、出現が7%の時の、一またはそれ以上のイベントを検出するのに失敗する0.6%の確率の失敗を表している。
【0081】
当該表は、5%レベルのSNPの存在を検出するための信頼水準は95%またはそれ以上であり、7%のSNPの存在を検出するための信頼水準は99%またはそれ以上であることを示す。
【0082】
【表1】

【0083】
当然、複合分析は、検出の奥行きよりもさらに広い適応範囲でありそして表2は、95%または99%で検出可能な最小対立遺伝子頻度で、単一のPico Titer Plateアレイ上で同時に検査できるSNPの数を示している。
【0084】
【表2】

【0085】
上記発明の実施態様は、複合の、並行のクローナルシークエンシング分析が、同時に、多様な個体において、少なくとも3、典型的には、少なくとも6、および好ましくは少なくとも8のHLA遺伝子座の遺伝子型を同定するために使用できるという発見に基づくHLA遺伝子型同定方法を提供する。本明細書に記載されたシークエンシングプラットフォームは、数百万の単一DNA分子を並行でクローン的に増殖し、そしてその後また並行にシークエンシングされる。記載されたシークエンシングプラットフォーム(例えば、454ライフ サイエンス コーポレーションから入手可能なGS FLXまたはGSジュニアシークエンシングプラットフォーム)によって得られるリードレングスは、典型的に、500超のヌクレオチドであることが認識されるであろう。これらのクローナルリードレングスは、エキソン内の結合された多形のフェーズの決定を可能にし、そして、それゆえそれぞれのHLA対立遺伝子のシークエンシングの明確な決定を可能にする。500塩基またはそれ以上のリードレングスの記載されたシークエンシング技術は、両方向において単一長として目的の遺伝子座のための完全なシークエンシング組成の取得を可能とすることを特筆することは重要である。例えば、一またはそれ以上の遺伝子座を含んでいる領域のための二本鎖DNAのそれぞれの鎖は、HLA分類を明確にできる前記遺伝子座を横切って完全長を生成するために5’から3’方向において同時にシークエンシングされるであろう。目的の遺伝子座においてそれぞれのヌクレオチド位置は、フォーワードおよびリバース方向の両方において調べそして再調査される事実により、それゆえより高度なレベルの信頼性が得られる。
【0086】
上記発明において、当該システムは、本明細書で記載されるように次世代シークエンシングプラットフォームを使用して、単一シークエンシングランにおいて、複数の個体、例えば、24、48またはそれ以上の被験者について、8遺伝子座の完全なHLA分類を可能するために十分な高スループットである。
【0087】
上記実施態様における高度に複合化された増幅産物のシークエンシングは、サンプルの貯蔵を許容しかつ特定の個体にシークエンシングを割り与える能力を維持するプライマー中のサンプル特異的な内部シークエンシングタグ(すなわち、上記のMID(一または複数))を、使用する。記載された実施態様において、少なくとも8遺伝子座(HLA−A、B、C、DRB1、DQA1、DQB1、DPA1、DPB1)について、並びにDRB3、4および5についてのHLAの遺伝子型は、シークエンシングによって作成されたデータから得ることができる。このHLAシークエンシングシステムは、また、キメラの混合物、例えば、上の参照のようにSCID患者の血液中にある遺伝しない稀な母由来の対立遺伝子の検出を検出することができる。例えば、関連分野の当業者によると、SCID(一または複数)(また、時々「バブルボーイ病(Bubble-Boy Disease)と称される)が、個体の中の血液循環系において母由来の細胞中における第3の対立遺伝子の存在を含むことができると認識されている。非遺伝性の母由来対立遺伝子(すなわち、母由来細胞)を含んでいる個体は、時々「マイクロキメラ(Micro chimeras)」と称され、そして母由来細胞は、典型的に、非常に低い頻度(すなわち、〜1−2%)で発生するが、機能的な免疫システムをしばしば欠損する個体において重大な効果を有する。
【0088】
関連技術分野の当業者は、ヒト白血球抗原システム(HLA)複合体は、第6染色体の短腕上の約350万塩基対を範囲とすることを認識する。当該主な領域は、クラスIおよびクラスII領域である。クラスIの主な抗原は、HLA−A、HLA−BおよびHLA−Cであり、そしてクラスIIの主な抗原は、HLA−DP、HLA−DQおよびHLA−DRである。HLA−DP、HLA−DQおよびHLA−DR遺伝子座は、HLA−DR、DPおよびDQ抗原のαおよびβ鎖をコード化する。HLA遺伝子は、ゲノム中でもっとも多形な遺伝子のうちの一つである。HLA抗原において発現される多形(そのため移植のための分類にとって最も興味深い)は、クラスII遺伝子のエキソン2およびクラスI遺伝子のエキソン2および3に主に局在する。上記実施態様において、本明細書に記載された、HLAプライマーとシークエンシングシステムを使用して達成可能なリードレングスは、エキソン2およびエキソン3を含んでいる、正確な分類のために重要なHLA領域を通した完全なシークエンシングを可能とする。例えば、関連分野の当業者は、ほとんどの個体においてHLA−A*01010101は典型的に、エキソン1において約73シークエンシング位置に、イントロン1において約130シークエンシング位置、エキソン2において約270シークエンシング位置、イントロン2において241シークエンシング位置、エキソン3において約276シークエンシング位置、イントロン3において約578シークエンシング位置、エキソン4において約276シークエンシング位置、イントロン4において約102シークエンシング位置、エキソン5において約117シークエンシング位置、イントロン5において約442シークエンシング位置、エキソン6において約33シークエンシング位置、イントロン6において約142シークエンシング位置、エキソン7において約48シークエンシング位置、イントロン7において169シークエンシング位置、およびエキソン8において約5シークエンシング位置を含むことを認識するであろう。
【0089】
上記発明の実施態様において、本明細書に記載されているHLA遺伝子の遺伝子型は、HLA遺伝子座に存在するHLA型における多様性(さまざまな多形を含む)を決定するために参照される。HLA−Aについて、エキソン2およびエキソン3中にある変異は、個体からPCRによって作成された第一増幅産物の結果のシークエンシングによって、決定される。典型的な実施態様において、エキソン4のシークエンシングは、また、決定される。対立遺伝子決定要素を含むエキソン2、エキソン3およびエキソン4または、それらの領域は、第一増幅産物を得るために個々にPCR反応においてそれぞれ増幅される。同様に、第一増幅産物は、個体のHLA−BおよびHLA−C対立遺伝子のための、エキソン2およびエキソン3、およびいくつかの実施態様において、エキソン4について得られる。HLAクラスII対立遺伝子の遺伝子分類のために、第一増幅産物は、DRB1、DPB1、DPA1、DQA1のエキソン2、並びにDQB1のエキソン2および3について得られる。それぞれのエキソンは、特定のHLA対立遺伝子が明確に割り当てられうるいずれかの末端由来のリードの間の十分なオーバーラップを有し、両鎖から作成された第一増幅産物の生成物をシークエンシングすることにより完全にシークエンシングされることができる。
【0090】
図2〜4は、それぞれのHLA領域の当該発明の実施態様において作成された第一増幅産物間の関係の単純化された図例を提供する。例えば、図2は、HLA特異的フォーワードプライマー250およびリバースプライマー260を使用しているHLA−A対立遺伝子の、エキソン1、イントロン1、およびエキソン2を含んでいる領域に及ぶ第一増幅産物203;エキソン3を含んでいる領域におよぶ第一増幅産物205;およびエキソン4、イントロン4およびエキソン5を含んでいる領域に及ぶ第一増幅産物207を図示している。図2は、また、HLA−B対立遺伝子の、第一増幅産物213、215、および217;およびエキソン6、イントロン6およびエキソン7を含んでいる領域に及ぶ、さらなる第一増幅産物229とHLA−Cの223、225および227第一増幅産物のための同様の関係を図示する。同様に図3は、DPA1、DPB1およびDQA1対立遺伝子それぞれのエキソン2を含んでいる領域に及ぶ第一増幅産物303、313、および323を図示し;そして、図4は、DQB1、およびDRB1対立遺伝子のエキソン2を含んでいる領域に及ぶ第一増幅産物403および413とさらにDRB1のエキソン3を含んでいる領域に及ぶ第一増幅産物405を図示する。図2〜4において提供される図の表示は、図解の目的であり、そして限定して考慮されるべきではないことを認識されるであろう。
【0091】
個体からのそれぞれのサンプルは、一またはそれ以上の目的のエキソンの多形領域を典型的に含む目的の標的遺伝子座を標的とするプライマーを使用することにより、一またはそれ以上の遺伝子座を個別に増幅させる。増幅反応において使用されるプライマーは、例えば、エマルジョンPCRのためのアダプターエレメントおよび単一の個体由来のDNAのためのマーカーとして機能する識別MIDシークエンシングエレメントのような追加のシークエンシングエレメントを含んでもよい。
【0092】
当該発明は、HLA遺伝子の目的の遺伝子座を増幅する増幅プライマーを使用する。典型的に、当該プライマーは、エキソンの全多形部が得られることを確実にするために設計される。
【0093】
記載された実施態様において、本発明の複合増幅のためのプライマーシークエンシングは、クローナルシークエンシングおよび分析を容易にするために使用することができるシークエンシングエレメントを含むアダプター内に導入される。記載された実施態様のいくつかのまたはすべてのアダプターは、それゆえ、以下の要素:一般的なアダプターエレメント、固有の識別(すなわち、MID)タグ、目的のHLA遺伝子にハイブリダイズして、第一HLA増幅産物を得るための増幅反応において使用されるプライマーシークエンシングを含む。例えば、アダプターの模式図の表現は、以下の:
一般的なアダプターシークエンシング(General Adaptor Sequence)+MIDシークエンシング(MID sequence)+標的特異的シークエンシング(Target-specific Sequence)を含んでもよい。
【0094】
記載された実施態様の一般的なアダプターエレメントは、さまざまなシークエンシングエレメントを含み、そして典型的に、アダプターの5’末端に存在する。例えば、一般的なアダプター領域は、シークエンシング反応用のプライマーのアニーリングの部位として機能し、そしてまたビーズまたは固体表面上に存在するシークエンシングに対応するシークエンシングを含んでもよく、その結果、第一増幅産物は、エマルジョンPCRの表面にアニールできる。HLAエキソンを増幅するためのフォーワードプライマーは、アダプター領域Aとしてここで称されるアダプターシークエンシングを5’末端に含む。リバースプライマーは、5’末端にアダプターシークエンシングを包含し、アダプター領域Bとここで称される領域を含む。特筆されるように、アダプター領域に存在するシークエンシング、およびそれらの相補体は、第一増幅産物のエマルジョンPCR用のビーズへのアニーリングを可能にし、そして当該emPCR過程から生じる第二増幅産物の集合を許容する。場合により、アダプターは、さらに非繰り返しヌクレオチドシークエンシング(すなわち、ACGT、CAGT,など)から構成される固有の識別力のあるキーシークエンシングをさらに含んでもよい。このキーシークエンシングは、典型的に、反応中に含まれるコントロールシークエンシングから、HLA遺伝子型同定のための第二増幅産物のシークエンシングされた集合をバイオインフォマティクス的に区別するために導入される。
【0095】
記載された実施態様において、一般的なアダプターシークエンシングは、以下のシークエンシングを含んでもよい:
【0096】
【表3】

【0097】
記載された発明は、上記の一般的なアダプターシークエンシングの的確な組成に限定されず、そして異なるシークエンシング組成が使用されてもよいことが認識されるであろう。
【0098】
HLA遺伝子型同定方法の記載された実施態様において使用するためのPCRプライマーは、さらに上記のようにMIDシークエンシングエレメントを含む。これらのMIDシークエンシングエレメントは、それぞれ分析された個々から、シークエンシングされたHLA第二増幅産物をバイオインフォマティックス的に区別するために使用される。記載された実施態様において、目的のHLA領域は、遺伝子型が同定される対象由来の核酸サンプルから増幅される。例えば、HLAエキソン、またはエキソンの領域は、対立遺伝子の決定要素として働く変異を含んでおり、個々に増幅される。対象から得られる第一増幅産物は、第一増幅産物を対象と関連づける同一のMIDシークエンシングエレメントでマークされている。本例において、当該MIDシークエンシングエレメントは、対象のそれぞれの第一増幅産物を増幅し、そして第二増幅産物の集合を生成する次の増幅のために使用されるアダプター中に含まれる。従って、MIDシークエンシングエレメントは、またシークエンシング反応においてシークエンシングされ、そしてそれぞれの第一増幅産物のシークエンシング組成(すなわち、第二増幅産物のそれぞれの集合のシークエンシングを介して)は、バイオインフォマティックス的に解読されて、配列組成、およびその中に含まれる変異と、対象とを関連づける。
【0099】
表3は、記載された発明の実施態様で使用可能なMIDシークエンシングエレメントの例を提供する。
【0100】
【表4】

【0101】
記載された発明の実施態様において、MIDシークエンシングは、上記のいくつかのまたはすべてのパラメーターを含んでもよいあるパラメーターを考慮して設計されうる。例えば、4残基MIDタグの設計において、シークエンシング反応における、ヌクレオチドのフローサイクルを考慮する4塩基を選択することが望ましい。本例において、もし核酸がT、A、CおよびGの順番で添加されたら、ポジティブであるヌクレオチド(すなわち、フローにおけるヌクレオチドがMIDシークエンシングにおいて次のヌクレオチドと相補的である)に、ネガティブであろう残基(すなわち、フローにおけるヌクレオチドがMIDシークエンシングにおいて次のヌクレオチドと非相補的である)が続くようにMIDシークエンシングを設計することが、典型的に望ましい。従って、この例において、もしシークエンシング反応において結合する核酸がTであるようにMIDシークエンシングがAヌクレオチドで開始すれば、タグシークエンシングおける第二ヌクレオチドは、Aが取り込まれないようなヌクレオチドであろう。さらに、MIDシークエンシングの中であろうと、またはアダプター領域の最後のヌクレオチドまたはアダプターのHLA特異的プライマー領域の最初のヌクレオチドに基づいてホモポリマーを生成することのいずれであろうとも、ホモポリマーを形成することを避けることが望ましい。
【0102】
記載されたアダプターの標的特異的シークエンシング(また、HLAプライマー領域、HLA結合領域、またはHLAハイブリダイジング領域として本明細書において称される)は、エキソン、二つのエキソンと介在するイントロンシークエンシングとの組み合わせ、または、いくつかの実施態様において、エキソンの限定された領域を含みうる所望の遺伝子座を増幅するように、目的のHLAシークエンシングにハイブリダイズするプライマーの領域である。典型的に、全エキソンシークエンシングを得るために、アダプターのHLAプライミング領域は、増幅されるエキソンに隣接するイントロンのシークエンシングにハイブリダイズする。HLAプライマーシークエンシングは、目的のHLAエキソンを選択的に増幅するために好ましく選択されるが、いくつかの実施態様において、プライマー対は、HLA遺伝子の関係する領域の高い類似領域をまた増幅することもある。例えば、以下の実施例部分において記載されるDRB1のエキソン2のためのプライマーは、また、DRB3、DRB4、およびDRB5遺伝子座(すなわち、それらは、それらの遺伝子座の「汎用体(generic)」である)も増幅する。エキソンが、当該シークエンシングからHLA遺伝子型の明確な決定を可能にするために十分な特異性で増幅されるように、プライマーシークエンシングは選択される。
【0103】
HLA遺伝子のコンセンサスシークエンシングおよび対立遺伝子は、ジェンバンク(GenBank)および他の遺伝子データベースを含む、さまざまなデータベースを通じて知られかつ利用可能であり、そして発行されている(例えば、Mason and Parham (1998) Tissue Antigens 51:417-66, 「listing HLA-A, HLA−B, and HLA-C alleles」; Marsh et al. (1992) Hum. Immunol. 35:1, 「Listing HLA Class II alleles--DRA, DRB, DQA1, DQB1, DPA1, and DPB1」を参照)。
【0104】
PCRプライマーは、本技術分野において知られる原理に基づいて設計された。プライマー設計の戦略は、科学文献、例えば、Rubin, E. and A. A. Levy, Nucleic Acids Res, 1996.24(18):p.3538−45; およびBuck et al., Biotechniques, 1999.27(3):p.528−36において見出されるであろう。例えば、HLA特異的プライマーは、典型的に約20ヌクレオチドまたはそれ以上、例えば、長さにおいて20から35ヌクレオチドである。他の考慮されるパラメーターは、G/C含量、内部二次構造(internal secondary structure)を避けるための設計の考慮、およびプライマーダイマーの形成の予防、同様に融解温度(melting temperature(Tm))である。
【0105】
当該発明の実施態様において使用するためのHLA標的特異的プライマーの例は、表4において提供される。
【0106】
【表5−1】

【0107】
【表5−2】

【0108】
さらに表5は、記載された発明の実施態様に使用可能なHLA標的特異的プライマーの追加の例を提供する。関連分野の当業者は、表4および5中の標的特異的プライマーシークエンシングが、同じ標的遺伝子座のためお互いに互換的に使用されてもよいことを認識するであろう。表5のアダプターシークエンシングにおいてHLA特異的プライマーのいくつかは、表4中のそれらと同様であるかもしれないが、いくつかのHLA遺伝子座においていくつかの相違が存在することがまた特筆される。
【0109】
【表6−1】

【0110】
【表6−2】

【0111】
【表6−3】

【0112】
当該分野の当業者は、プライマー対のシークエンシング組成のいくらかの変動性が存在し、そして開示されたプライマーシークエンシングの90%またはそれ以上の相同性が、本明細書の発明の範囲内と考慮されることを認識するであろう。例えば、プライマー対のための標的領域は、わずかにシフトされてもよく、そうして、プライマーシークエンシング組成においていくつかの相違が予想される。また、コンセンサスシークエンシングに対する微修正が行われてもよくまたは、ある位置で新しいシークエンシングの縮重が発見されてもよく、結果、標的領域においてシークエンシング組成のわずかな相違がおこり、そして、同様にプライマーシークエンシング組成においていくつかの多様性が予想されてもよい。
【0113】
目的のHLA第一増幅産物を増幅するために使用されるテンプレート核酸は、典型的に、遺伝子型が同定される対象から単離されたゲノムDNAに由来する。現在の方法において、二人以上の対象は、並行反応において、HLA遺伝子型を同定される。本発明において、少なくとも12の対象、そして典型的に少なくとも16、20、24、30、36または48の対象が、HLA遺伝子型を同定される。HLA増幅産物は、あらゆる型の増幅反応を使用して得られてもよい。記載された実施態様において、第一増幅産物は、典型的に本明細書に記載されたようにHLAプライマー対を使用してPCRで作成され、そして例えば、高信頼性タックポリメラーゼ(high-fidelity Taq Polymerase)(Roche Diagnostics)のような、低いエラー率のポリメラーゼを使用することが望ましい。PCR条件は、対象から第一HLA増幅産物を得るために適した条件を決定するために、最適化されることができる。それぞれの第一HLA増幅産物は、分離したPCR反応において個々に増幅されてもよい。いくつかの実施態様において、対象に対する第一HLA増幅産物は、個々の増幅産物を増幅するためのプライマー対を含む、一またはそれ以上の複合的な反応において得られてもよい。
【0114】
記載された実施態様において、HLA第二増幅産物の集合は、上記のようにエマルジョンPCR過程を介して増幅され、そしてビーズ上に固定化される。例えば、第一HLA増幅産物は、好ましくは、油中水エマルジョンの水性液胞の中に個々に区分され、そして、アダプター領域中の相補的プライマーエレメントを介して、ビーズに結合されたプライマーを、第一増幅産物へとアニーリングすることによって水泡内に区分された単一のビーズに付着される。ビーズは、アダプター部分においてプライマーエレメントと相補的な多数のプライマー種を含む。本例において、分離した水相微小液胞は、直径約60〜200μmであり、熱安定性オイル相により閉じ込まれており、ここで当該エマルジョンが平均してただ一つの標的核酸および一つのビーズを含むように、エマルジョン液胞が形成されている。それぞれの微小液胞は、好ましくは、増幅反応溶液(すなわち、核酸増幅に必要な試薬、例えば、ポリメラーゼ、塩類、および、例えば、アダプター領域に対応する適当なプライマー)を含む。
【0115】
記載された実施態様において、エマルジョンPCRは、第一HLA増幅産物が両方向にシークエンシングされるように、典型的にビーズの二つの集合で遂行される。ビーズの一つの集合において、アダプターシークエンシングにおいて「リバース」プライマーエレメントと相補的な第一プライマー(すなわち、「B」アダプター)は、ビーズと付着される。ビーズの第二集合において、アダプターシークエンシングにおいて「フォーワード」プライマーエレメントと相補的な第二プライマー(すなわち、「A」アダプター)は、ビーズと付着される。従って、エマルジョン増幅反応において使用するためのプライマーは、典型的に、例えば「キー」シークエンシングのような追加のシークエンシングなしに、アダプター領域のシークエンシングを有する。いくつかの実施態様において、エマルジョン増幅反応は、水性溶液中の非対称プライマー濃度と遂行されてもよい(すなわち、典型的に、ビーズ上に固定化されたプライマー種は、溶液中においてより低い濃度を有するであろう)。例えば、PCRプライマーは、非対称PCRを遂行するために、8:1または16:1の比(すなわち、8または16の一つのプライマーと1の第二プライマー)で、存在されてもよい。しかしながら、非対称プライマー濃度は、必須ではないであろうし、そして同じプライマー濃度は、水性溶液において代わりに使用されてもよく、またはいくつかの好ましい実施態様において、ビーズ上に固定化されたプライマー種は、水溶液中に存在しないであろう(すなわち、Bプライマー種は、固定化されそしてAプライマー種は、溶液中にある)ということを認識されるであろう。
【0116】
以下のエマルジョンPCR増幅は、たとえば、エマルジョンPCRの間、増幅プライマー上に存在するビオチンのような成分によって、一本鎖第二HLA増幅産物テンプレートを有するビーズは単離され、そして当該テンプレートは、この明細書の別の場所で記載されたDNAシークエンシング技術を使用してシークエンシングされる。例えば、クローナル第二増幅産物は、シークエンシングプライマー(たとえば、プライマーAまたはプライマーB)を使用し、そして、ポリメラーゼ反応を行わせるための4つの異なるdNTPまたはddNTPを添加してシークエンシングされる。それぞれのdNTPまたはddNTPは、プライマー伸長生成物に添加されたとたんに、ピロリン酸分子が放出される。ピロリン酸の放出は、例えば、ルシフェレース−ルシフェリン反応における光の発生によるように、酵素的に、検出することができる。さらに、例えばアピラーゼのような、ヌクレオチド分解酵素は、取り込まれられないヌクレオチドを分解するために反応の間、存在させることができる。他の実施態様において、当該反応は、シークエンシングプライマー、ポリメラーゼ、ヌクレオチド分解酵素、dNTP、並びにATPスルフリラーゼおよびルシフェラーゼを含んでいるピロリン酸検出システムの存在下において実行されうる。
【0117】
ひとたびシークエンシングデータが、個々のDNA分子のシークエンシングについて得られると、既知のHLA対立遺伝子についてのシークエンシングデータベースを記録したこれらのシークエンシングと比較することで、明確なHLAシークエンシングが決定されることができる。454シークエンシングシステム(454 ライフ サイエンス コーポレーション)によって達成されるリードレングス(特に、少なくとも500bp)は、それぞれのエキソンのシークエンシング組成の明確な決定を十分可能にする。エキソンシークエンシングデータファイルに基づくそれぞれの遺伝子座における遺伝子型の割り当ては、アプリケーション135により遂行される。例えば、アプリケーション135は、Conexio Genomicsにより開発されたソフトウェアアプリケーションを含んでもよい。ソフトウェアの重要な側面は、標的シークエンシングと一緒に、プライマーによって共に増幅された関係するシークエンシングリード(偽遺伝子または他の所望しないHLA遺伝子)をフィルターを通して除去する能力である。同様のまたは代替的な例において、アプリケーション135は、各第一増幅産物から作成されたシークエンシング組成を、コンセンサスシークエンシングに対して比較し、そしてコンセンサスから逸脱したすべての変異を同定するアンプリコン バリアント アナライザー ソフトウェアアプリケーション(一般的に、AVAソフトウェアと称される)(454 ライフ サイエンス コーポレーション)を含んでもよい。いくつかの実施態様において、AVAソフトウェアは、変異(または、変異の組み合わせ)と、既知の型の変異(すなわち、HLA型)または疾患、状態、抵抗などに関連する表現型を与えることが知られている変異とを関連付けることをさらに可能されてもよい。代替的に、AVAソフトウェアは、シークエンシングデータを前処理するために使用されてもよく、ここで当該前処理されたデータは、続いてさらなる処理ためのコネクシオソフトウェアへとアップロードされてもよい。
【0118】
さらに、記載された発明の実施態様は、キットになる本明細書に記載された、いくつかのまたはすべての組成物および試薬を、キットへとパッケージングすることを含む。記載された実施態様のキットは、典型的に、HLA対立遺伝子中の目的の領域を増幅するための適当な、本明細書に記載された多様なアダプター対を含む。アダプター対は、一般的なアダプター領域、MIDタグおよびHLAプライマー領域を含んでいるフォーワードプライマー;および一般的なアダプター領域、MIDタグ、およびHLAプライマー領域を含むリバースプライマーを含む。しかしながら、ただ一つのMIDタグが、必要とされるサンプル集団の数に依存して、必要であろうことが認識されるであろう。記載された実施態様のキットは、しばしば、少なくともHLA−A、HLA−B、およびDRB1のための複数の対象の遺伝子型を決定するための第一増幅産物を増幅するプライマー対を含む。しばしば、記載された実施態様のキットは、複数の個人、例えば、12またはそれ以上の個人のHLA−A、HLA−B、HLA−C、DRB1、DQA1、DQB1、DPA1、およびDPB1遺伝子の遺伝子型を決定するための十分なHLAプライマー対を含む。
【0119】
いくつかの実施態様において、キットは、エマルジョンPCRにおいて使用され得るアダプター領域に応じた付着されたプライマーを有する一またはそれ以上のビーズをさらに含むことができる。いくつかの実施態様において、キットは、使用者が自由に選択できる反応を実行するのに適している試薬を含む一またはそれ以上の反応区画を含むことができる。例えば、いくつかの実施態様では、キットは、一またはそれ以上のシークエンシング試薬を含む一またはそれ以上の反応区画を含むことができる。
【0120】
キット中に含まれるさまざまな構成要素は、典型的に、個々のコンテナ中に含まれ、しかしながら、いくつかの実施態様において、構成要素の一またはそれ以上は、同じコンテナ中に存在することができる。さらに、キットは、本明細書に記載された組成および試薬のあらゆる組み合わせを含むことができる。いくつかの実施態様において、キットは、開示された方法を遂行するために必要なまたは任意であってもよい追加の試薬を含むことができる。そのような試薬は、緩衝液、コントロールポリヌクレオチドなどを含むが、これらに限定はされない。
【0121】
さまざまな実施態様または実施を記載してきたが、ほんの一例として示されたものであるので、前述のものは、ただの実例にすぎず、そして限定されないということは関連技術分野の当業者にとって明らかであるべきである。例示された実施態様のさまざまな機能的エレメントに機能を割り振る多くの他のスキームが可能である。あらゆるエレメントの機能は、代替的な実施態様においてさまざまな方法で実行されてもよい。

【特許請求の範囲】
【請求項1】
一またはそれ以上のHLA配列変異を検出する方法であって、以下の工程:
(a)二本鎖核酸サンプルから、複数の第一増幅産物を増幅する工程であって、これにおいて第一増幅産物が、HLA−A、HLA−BおよびHLA−Cからなる群から選択されるHLA遺伝子座の両方の鎖のエキソン2および3を規定する複数の核酸プライマー対を用いて増幅される工程;
(b)当該第一増幅産物を増幅して、第二増幅産物の複数の集合の生産をする工程であって、これにおいて第二増幅産物の各集合は、当該第一増幅産物の一つからクローナルに増幅される工程;
(c)当該第二増幅産物の複数の集合をシークエンシングして、当該複数の第二増幅産物の各々についての核酸配列組成を作成する工程;および
(d)一またはそれ以上のHLA遺伝子座について、一またはそれ以上の当該第二増幅産物由来の上記配列組成における変化を検出する工程
を含む、前記方法。
【請求項2】
一またはそれ以上のHLA配列変異を検出するための方法であって、以下の工程:
(a)二本鎖核酸サンプルから、複数の第一増幅産物を増幅する工程であって、これにおいて当該第一増幅産物が、DRB1、DQA1、DQB1、DPA1、DPB1からなる群から選択されるHLA遺伝子座の両方の鎖のエキソン2を規定する複数の核酸プライマー対を用いて増幅される工程;
(b)当該第一増幅産物を増幅して、第二増幅産物の複数の集合を生産する工程であって、これにおいて第二増幅産物の各集合は、当該第一増幅産物の一つからクローナルに増幅される工程;
(c)当該第二増幅産物の複数の集合をシークエンシングして、当該複数の第二増幅産物の各々について核酸配列組成を作成する工程;および
(d)一またはそれ以上のHLA遺伝子座について、一またはそれ以上の当該第二増幅産物由来の上記配列組成における変異を検出する工程
を含む、前記方法。
【請求項3】
前記核酸プライマー対が、表4および5に列挙される複数のプライマーから選択される配列組成を含む、請求項1または2に記載の方法。
【請求項4】
前記複数の核酸プライマー対が、前記HLA遺伝子座のエキソン1、4および5を規定する、請求項1に記載の方法。
【請求項5】
前記複数の核酸プライマー対が、前記HLA−C遺伝子座のエキソン6、および7を規定する、請求項1に記載の方法。
【請求項6】
前記DRB1遺伝子座についての前記複数の核酸プライマー対が、汎用性を有し、そしてさらにDRB3、DRB4、およびDRB5遺伝子座からなる群から選択される遺伝子座の増幅を可能にする、請求項2に記載の方法。
【請求項7】
複数のアダプターをさらに含み、その各々が前記核酸プライマー対由来の個々のプライマーを含んでいる、請求項1〜6のいずれか一項に記載の方法。
【請求項8】
前記複数のアダプターの一またはそれ以上が、MID識別子を含み、そして当該MID識別子が、複数の核酸サンプル由来の前記第一増幅産物の貯蔵を可能とし、ここで、当該貯蔵された第一増幅産物から増幅された前記第二増幅産物の集合が、並行にシークエンシングされる、請求項7に記載の方法。
【請求項9】
前記複数のアダプターが、一般的なアダプターエレメントおよびキーエレメントを含む、請求項7または8に記載の方法。
【請求項10】
第二増幅産物の各集合が、ビーズ基質上に固定化される、請求項1〜9のいずれか一項に記載の方法。
【請求項11】
前記第二増幅産物の集合が、エマルジョンPCR処理を使用してクローナルに増幅される、請求項1〜10のいずれか一項に記載の方法。
【請求項12】
前記第二増幅産物の複数の集合が、並行にシークエンシングされる、請求項1〜11のいずれか一項に記載の方法。
【請求項13】
さらに、以下の工程:
(e)前記変異をHLA型と関連付ける工程
を含む、請求項1〜12のいずれか一項に記載の方法。
【請求項14】
請求項1に記載の第一増幅産物を増幅するために使用される前記複数の核酸プライマー対を含む、一またはそれ以上のHLA配列変異を検出するためのキット。
【請求項15】
請求項2に記載の第一増幅産物を増幅するために使用される前記複数の核酸プライマー対を含む、一またはそれ以上のHLA配列変異を検出するためのキット。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate


【公表番号】特表2012−523824(P2012−523824A)
【公表日】平成24年10月11日(2012.10.11)
【国際特許分類】
【出願番号】特願2012−505088(P2012−505088)
【出願日】平成22年4月15日(2010.4.15)
【国際出願番号】PCT/EP2010/002307
【国際公開番号】WO2010/118865
【国際公開日】平成22年10月21日(2010.10.21)
【出願人】(591003013)エフ.ホフマン−ラ ロシュ アーゲー (1,754)
【氏名又は名称原語表記】F. HOFFMANN−LA ROCHE AKTIENGESELLSCHAFT
【Fターム(参考)】