説明

核酸配列決定の検証、較正、および標準化のための方法およびシステム

核酸サンプル配列決定法の品質制御を行うためのシステムが開示される。このシステムは、一セットの固体担体を有し、各担体は、それに付着された複数の核酸配列を有する。そのセットは、複数の群の固体担体を有し、各群は、同じ核酸配列が付着された固体担体を含有する。各群の核酸配列は互いに異なる。核酸配列は、合成的に誘導される。核酸サンプル配列決定法を行うための品質対照を調製する方法、および、核酸配列決定器具を検証する方法もまた開示される。


【発明の詳細な説明】
【技術分野】
【0001】
〔優先権主張〕
本出願は、参照により全体を本願明細書に組み込む、2008年9月5日に出願された名称「合成ビーズを使用した器具の検証、較正、および標準化(Instrument Validation, Calibration and Normalization Using Synthetic Beads)」の米国特許仮出願第61/094,785号の優先権の利益を主張するものである。
【0002】
〔分野〕
本教示は、核酸配列決定する器具類およびデータの検証、較正、および標準化のために使用される核酸配列対照に関する。
【背景技術】
【0003】
ヒトゲノム計画が完了すると、配列決定産業の焦点は、次世代の配列決定技術と呼ばれることもある、より高いスループット、および/または、より低コストの配列決定技術の発見に変わった。配列決定法をより高いスループット、および/またはより低価にすることにおいて、その目標は、その技術を配列決定に対してより利用しやすくすることである。これらの目標は、配列決定プラットフォームの使用、ならびに、かなりの複雑性を有するより多量のサンプルのためのサンプル調製、より多くの複雑なサンプルの配列決定、および/または、短期間での高容量の情報生成と分析を、提供する方法の使用により達成され得る。例えば合成による配列決定法、ハイブリダイゼーションによる配列決定法、および、核酸連結(ligation)による配列決定法などの様々な方法が、これらの課題を満たすために進化している。
【発明の概要】
【発明が解決しようとする課題】
【0004】
これらの次世代配列決定技術に起こりうる不都合点は、追加的システムノイズ、または、各ステップについての性能変動の増大である。各ステップにおいて、システムノイズまたはそのステップについての性能変動は、ハードウェア、化学現象、およびソフトウェアのうちの少なくとも1つから寄与されうる。次世代配列決定技術およびプラットフォームの複雑性は、サンプル調製からサンプル配列決定までの性能の一貫性を確実にするために様々な対照を必要としうる。ゆえに、システムノイズまたは各ステップの可変(例えば劣った)性能を選別または特定する対照または方法を有することが望ましい場合がある。生成された莫大な量の情報を有意義に比較することができる場合に、ノイズまたは変動の減少は、時間と共に生成されるデータセットの標準化を改善しうる。
【0005】
1つの従来対照は、例えば大腸菌株などの良く知られているサンプルから作り出された断片のライブラリーを使用し、配列決定方法をその断片のライブラリーに対して行う。しかしながら、対照ための自然発生的サンプルの使用は、サンプルの個々の株内の変異体に起因してそれ自体変動を示すことがある。さらに、これら従来の対照の調製は結果として、対照配列の所望のモノクロナール集団内に異なる配列が導入されるということをもたらして、それによって対照システムそれ自体の中でノイズを生成する場合がある。
【課題を解決するための手段】
【0006】
したがって、当技術分野において、システムノイズおよび/または性能低下の様々な原因の系統的決定および特徴づけを提供することができる対照システムおよび方法のための次世代配列決定法の必要性が存在する。配列決定における一貫性を提供する1つの望ましい態様は、実行から実行への、および、器具から器具への、両方における器具性能を確実にする対照を提供することを含む。さらに、化学現象および/またはライブラリー構造に起因する配列決定の間の性能変動および/またはノイズの検出の可能性を最小にする対照技術を提供することが望ましいこともあり、それによってそのような検出が器具品質に原因があるとすることが可能である。
【図面の簡単な説明】
【0007】
【図1】次世代配列決定法のために使用される器具類の様々な実施形態を表すブロック図である。
【図2】本教示にしたがう核酸配列決定法における検証、較正、および標準化に有用な合成対照ビーズの例示的実施形態の概略描写図である。
【図3】本教示にしたがう合成対照ビーズの別の例示的実施形態の概略描写図である。
【図4】本教示にしたがう合成対照ビーズの様々な実施形態を作製するための方法の制御可能な性質を表す一連のグラフを示す。
【図5】本教示の例示的実施形態にしたがって調製される様々な合成対照ビーズについてのテンプレート密度結果を示すグラフである。
【図6】合成対照ビーズの様々な実施形態を作製するための方法の例示的実施形態の再現性を表すグラフである。
【図7】配列決定法に使用される器具上の合成対照ビーズを使用して生成されたエラーチャートである。
【図8】本教示の様々な例示的実施形態にしたがう合成対照ビーズを使用して生成された内因性システムノイズと比較した、配列決定法に使用された器具のシステムノイズ寄与を証明する2つのグラフである。
【図9】1024の核酸配列の各々を同数含む合成対照ビーズのセットの品質制御(QC)配列決定法における4つの色素の強度を示すsatayプロットである。
【0008】
図面は縮尺で描かれておらず、あるいは、図面中の物体は互いの関係において縮尺で必ずしも描かれていないことは理解されるべきである。図面は、本明細書において開示されている装置、システム、および方法の様々な実施形態に対する明瞭さおよび理解をもたらすように意図される描写である。可能な限り、同じ参照番号が、同一または類似部分を参照するために図面全体を通して使用されるだろう。
【発明を実施するための形態】
【0009】
〔詳細な説明〕
本明細書において使用されるセクションの表題は、単に組織化目的のためのものであり、いかようにも説明された主題を限定するように解釈されるべきでない。本出願に引用された全ての文献および同様の資料は、限定するものではないが、特許、特許出願、論文、書籍、条約、および、インターネットウェブページを含み、それら内容全体が参照により任意の目的のために明白に組み込まれる。組み込まれた参照文献内の用語の定義が、本教示において提供された定義と異なるように思われる場合、本教示に提供された定義が支配することになる。本教示に論じられている、温度、濃度、時間などの前の暗に含まれた「約」が存在することは認識されるであろうし、それによってわずかで実質のないずれは本教示の範囲内に含まれる。本出願において、単数形の使用は、特に明記されていない限り複数を含む。また、「含む(comprise、comprises、comprising)」、「含有する(contain、contains、containing)」、および、「含む(include、includes、including)」の使用は、限定していることを意図されない。前述の全般的説明、および以下の詳細な説明の双方とも、単に例示的で説明のためのものであり、本教示を制限するものではないということは理解されるべきである。
【0010】
特に定義されていない限り、本明細書に説明されている本教示に関連して使用される科学用語および技術用語は、当業者によって一般的に理解される意味を有するであろう。さらに、特に文脈で要求されていない限り、単数形の用語は、複数形を含むであろうし、複数形の用語は、単数形を含むであろう。全般的に、本明細書に説明されている、細胞と組織培養、分子生物学、ならびにタンパク質とオリゴまたはポリヌクレオチド化学およびハイブリダイゼーションに関連して利用される専門語およびそれらの技術は、当技術分野で使用される良く知られた一般的なものである。例えば核酸の精製および調製、化学分析、組換え核酸、ならびにオリゴヌクレオチド合成のための標準的な技術が使用される。酵素反応および精製技術は、製造業者の指示にしたがって、あるいは、当技術分野で一般的に達成されるように、あるいは、本明細書で説明されるように、実行される。本明細書で説明される技術および手順は概して、当技術分野でよく知られている従来方法にしたがい、また、本明細書全体を通して引用され論じられる様々な一般的でより特定の参照文献に説明されているように、実行される。例えばSambrookらによる、分子クローニング(Molecular Cloning):ラボラトリー・マニュアル(A Laboratory Manual)(第3版、コールド・スプリング・ハーバー・ラボラトリー・プレス(Cold Spring Harbor Laboratory Press)、コールド・スプリング・ハーバー、ニューヨーク、2000年)を参照のこと。本明細書で説明される研究室手順および技術、およびそれらに関連して利用される専門語は、当技術分野でよく知られた一般的に使用されるものである。
【0011】
本明細書に提供される実施形態にしたがって利用される場合、特に指示されていない限り、以下の用語は、以下の意味を有するように理解されるだろう。
【0012】
フレーズ「次世代配列決定法」は、増加したスループットを有する、例えば何十万もの比較的小さい配列読取値を一度に生成する能力を備えた、サンガー法を基礎としない(non-Sanger-based)配列決定技術を指す。次世代配列決定技術の幾つかの例は、限定するものではないが、合成による配列決定法、核酸連結による配列決定法、および、ハイブリダイゼーションによる配列決定法を含む。幾つかの比較的よく知られている次世代配列決定方法は、454コーポレーション(454 Corporation)により開発されたピロシーケンス、Solexaシステム、および、アプライド・バイオシステムズ(Applied Biosystems)(現在のライフ・テクノロジーズ社(Life Technologies, Inc.))により開発されたSOLiD(オリゴヌクレオチド核酸連結および検出による配列決定法)をさらに含む。
【0013】
フレーズ「合成ビーズ」または「合成対照ビーズ」は、ビーズに付着した合成テンプレート核酸配列の複数コピーを有するビーズを指す。リンカー配列は、合成テンプレートをビーズに付着させるために使用されうる。
【0014】
フレーズ「断片ライブラリー」は、より大きい核酸をより小さい断片に切断または剪断することによって生成される核酸断片の収集物を指す。断片ライブラリーは、バクテリア核酸など自然発生的核酸から生成されうる。大きさが同様な合成核酸配列を含むライブラリーも合成断片ライブラリーを作るために生成されうる。
【0015】
フレーズ「メイト・ペア・ライブラリー(mate-pair library)」は、核酸の断片を内部アダプタカセットで環状化し、次いで核酸断片の中間部分を取り除いて内部アダプタの両端部に付着した核酸断片の端部からの配列を備えた内部アダプタを含む核酸の線状鎖を作り出すことによって、生成される核酸配列の収集物を指す。断片ライブラリーのように、メイト・ペア・ライブラリーは、自然発生的核酸配列から生成されうる。合成メイト・ペア・ライブラリーはまた、合成核酸配列を内部アダプタ配列の両端部に付着させることによって生成されうる。
【0016】
フレーズ「合成核酸配列」、およびその変形体は、デザインされ合成された核酸の配列を指す。例えば、合成核酸配列は、規則またはガイドラインにしたがうようにデザインされうる。合成核酸配列のセットは例えば、各合成核酸配列が異なる配列を含む、および/または、その合成核酸配列のセットは、一セットの長さの配列のあらゆる可能な変形を含むようにデザインされうる。例えば、一セットの64の合成核酸配列は、3塩基配列の各々の可能な組み合わせを含むこともでき、あるいは、一セットの1024の合成核酸配列は、5塩基配列の各々の可能な組み合わせを含むこともできる。
【0017】
フレーズ「対照セット」は、各々が既知の配列を有する核酸の収集物を指し、複数の異なる核酸配列が存在する。対照セットは例えば、核酸配列が付着したビーズを含むこともできる。核酸配列の源は、合成的に誘導された核酸配列、または、自然発生的核酸配列であってもよい。自然発生的または合成いずれの核酸配列も、例えば断片ライブラリーまたはメイト・ペア・ライブラリーとして、あるいは類似的合成ライブラリーとして、提供され得る。核酸配列はまた、複数のインサートおよび複数の内部アダプタを含むテンプレートなどの他の形態であることもできる。核酸配列の他の形態は、連鎖状を含むこともできる。
【0018】
用語「テンプレート」は、ビーズなどの固体担体に付着された核酸配列を指す。例えば、テンプレート配列は、固体担体に付着された合成核酸配列を含むこともできる。テンプレート配列はまた、対象のサンプルからの知られていない核酸配列、および/または既知の核酸配列を含むこともできる。
【0019】
フレーズ「テンプレート密度」は、各々の個々の固体担体に付着されたテンプレート配列の数を指す。
【0020】
フレーズ「satayプロット」は、2次元平面上への4空間プロットの投影を指す。例えば、satayプロットは、2次元平面内の4つの異なる色素の強度を示すことができる。
【0021】
本教示は、核酸配列決定法を行う際の品質制御を行うための方法およびシステムの様々な例示的実施形態に関する。例えば、本教示は、配列決定法で使用される器具類および化学現象(例えばプローブの化学現象)の検証、較正、および/または標準化のための対照として使用されうる合成対照ビーズを企図するものである。本教示はさらに、配列決定法において使用される器具類の検証、較正、および/または標準化のための方法およびシステムに関する。
【0022】
本教示の様々な実施形態は、核酸サンプル配列決定法のための品質制御を行うためのシステムに関する。このシステムは、一セットの固体担体を含むことができ、各固体担体は、それに付着した複数の核酸配列を有する。このセットは、固体担体の複数の群を含むことができ、各群は、同じ核酸配列が付着された固体担体を含有することができ、ここで各群の核酸配列は、互いに異なり、核酸配列は合成的に誘導される。
【0023】
本教示の他の例示的実施形態は、核酸サンプル配列決定法を行うための品質対照を調製する方法に関し、この方法は、各合成核酸配列は別の核酸配列と異なる、複数の合成核酸配列を生成する工程と、合成核酸配列の各々を複数群の固体担体における固体担体に付着させる工程であって、各群における固体担体には同じ合成核酸配列が付着する、付着させる工程と、核酸サンプル配列決定法を行うための一セットの対照固体担体を作り出すために、合成核酸配列を付着させた各群の固体担体を組み合わせる工程と、を含む。
【0024】
本教示の追加的実施形態はさらに、核酸配列決定の検証を行う方法に関し、この方法は、一セットの固体担体であって各々がそれに付着された複数の合成核酸配列を有する一セットの固体担体を、核酸配列決定器具の検出領域に設置する工程を含み、ここで、固体担体のセットは、複数の群の固体担体を含み、一群の固体担体の各々は、それに付着された同じ合成核酸配列を有し、異なる群の固体担体は、それに付着された異なる合成核酸配列を有する。この方法はさらに、核酸配列決定器具の検出領域に対する各固体担体の場所を特定するための局所的マップを生成する工程と、固体担体に付着された核酸配列に色素標識されたプローブ配列を付着させるために1以上の核酸連結サイクルを行う工程と、を含むこともできる。この方法はさらに、核酸配列の各々に付着された色素標識されたプローブを検出する工程と、色素標識されたプローブの強度を測定する工程と、器具が妥当に機能しているかどうかを決定するために測定された強度を閾値と比較する工程と、を含むことができる。
【0025】
本明細書で説明される様々な例および実施形態において、合成対照システムおよび方法は、(例えばSOLiD配列決定法に利用されるような)2塩基(two-base)すなわち二塩基(dibase)コード化を使用して核酸連結による配列決定システムに関連して説明される。しかしながら、当業者は容易に認識するであろうが、本明細書で説明される合成ビーズおよび方法は、他の配列決定システムまたは検出技術に適用されうる。合成対照ビーズ、および合成ビーズを使用する方法の原理は、本明細書で説明される本教示の範囲から逸脱することなく他のシステムおよび方法に適用されうる。
【0026】
次世代配列決定法のためのプラットフォームの様々な実施形態は、図1のブロック図で示されているような構成要素を含むこともできる。様々な実施形態にしたがい、器具100は、流体送達および制御ユニット110、サンプル処理ユニット120、光学ユニット130、ならびに、データ収集、分析および制御ユニット140を含むこともできる。次世代配列決定法に使用される器具類、試薬、ライブラリー、および方法の様々な実施形態は、McKernanらに付与された、米国特許出願公開第2007/066931号(ASN11/737308号)、および米国特許出願公開第2008/003571号(ASN11/345,979号)に説明されており、これら出願は参照により本明細書に組み込まれる。器具100の様々な実施形態は、複数の配列から並行して、すなわち実質的に同時に配列情報を集めるために使用されうる自動配列決定法を提供することもできる。配列決定法のための器具および方法の様々な実施形態において、標的配列は、後により詳細に論じられるように、フローセル内に位置する実質的に平坦な基板またはプレート上に整列されるか、または、別様に分布させられうる。
【0027】
図1において、自動配列決定器具100の実施形態は、可動ステージ、およびサーモスタットで調温されたフローセルを含むサンプル処理ユニット120を有することもできる。自動配列決定器具100の様々な実施形態にしたがい、フローセルは、インプットポートおよびアウトプットポートを有するチャンバーを具備することもでき、これらのポートを通って流体が流れることができる。流体の流れは、流体送達および制御ユニット110によって制御され得、それによってフローセル内に位置する部分(例えばテンプレート、微粒子、分析物など)からの様々な試薬の自動的除去または添加を可能にする。器具100の様々な実施形態にしたがい、フローセルは、基板またはプレート、例えば、スライドグラスなどの実質的に平坦な基板またはプレートが据えられ得る場所を含み、したがって、流体が、基板またはプレートの表面上、および、光学ユニット130の様々な実施形態を使用して、照明、励起、信号収集などを可能にするための窓の上を流れる。次世代配列決定システムの様々な実施形態において、微粒子などの部分は典型的に、基板がフローセル内部に設置される前に、基板上に整列されるか、または別様に分布される。
【0028】
器具100の様々な実施形態において、光学ユニット130は、光源、CCDカメラ、および、蛍光顕微鏡を含むこともできる。光学ユニット130の様々な実施形態において、構成要素の代用品が作られうることは当業者によって認識されるであろう。例えば、代替の画像取込装置が使用されうる。追加的に、データ収集、分析および制御ユニット140は、図1に示されたユニット110〜140の様々な構成要素、例えばポンプ、ステージ、カメラ、フィルター、温度制御器などを適切に並べ、また、画像データに注釈を付け保存するための制御を提供する。ユーザー・インターフェースが提供され、オペレータが器具を設置し維持するのを助け、またユーザー・インターフェースは、スライドを載せる/降ろすため、および流体ラインをプライミングするためにステージを位置付けるための機能を含むこともできる。ディスプレイ機能が含まれて、例えばオペレータに様々な実行パラメータ、例えば温度、ステージ位置、流体光学フィルター構成、実行プロトコルの状態などを示すことができる。様々な実施形態において、データ取得、分析および制御ユニット140はまた、試薬ロットおよびサンプルIDなどの追跡データを記録するためにデータベースへのインターフェイスを含む。
【0029】
器具100の様々な実施形態は、様々な配列決定方法を実施するために使用され得、その方法は、本明細書で説明される核酸連結を基にした方法、および、例えば限定するものではないが合成方法による配列決定法を含む他の固相配列決定方法の双方を含むことは、当業者によって認識されるであろう。核酸連結を基にした配列決定方法の場合のように、合成による配列決定法は、半固体担体内またはその上に直接固体化されたテンプレート、半固体担体内またはその上の微粒子上に固体化されたテンプレート、基板に直接付着されたテンプレートなどに行われうる。
【0030】
本教示の様々な実施形態にしたがい、一セットの対照は、複数の合成ビーズを含むことができ、各々のビーズは、それに付着された少なくとも1つの合成核酸配列を有する。さらなる実施形態において、各合成ビーズは、それに付着された複数の特有の核酸配列を有する。非限定的例として、そのセットの対照は、64群のビーズを含むことができ、ここで各群のビーズは、それぞれの特有の核酸配列の複数のコピーを含む。少なくとも1つのさらなる実施形態において、各ビーズに付着された核酸配列は、特有の核酸配列から本質的になる。例えば、そのセットのある合成ビーズは、配列5’−AAA−3’を含むことができ、そのセットの別の合成ビーズは、配列5’−AAT−3’、または、64ビーズセットの例において3塩基配列で可能である他の63の変形体のうちのいずれか1つを含むことができる。一セットの対照ビーズは、特有の核酸配列を含む複数の合成ビーズの各々の複数コピーを含むことができ、言い換えれば、各セットは、複数群のビーズを含み、一群の各ビーズはそれに付着された同一の特有の合成核酸配列を有することもできる。
【0031】
少なくとも1つの実施形態において、合成核酸配列の数は、配列決定技術で使用されるプローブ配列によって網羅される塩基の数に基づいてデザインされうる。例えば、一度に3塩基を網羅するプローブ配列に対して、64の特有の合成核酸配列の一群がデザインされうる。同じように、一度に4塩基を網羅するプローブ配列に対して、256の特有核酸配列の一群が使用され得、一度に5塩基を網羅するプローブ配列に対して、1024の特有の核酸配列の一群が使用され得る。同様に、特有核酸配列のより多くの群がより多数の塩基を網羅するプローブ配列に対して使用され得る。プローブ配列によって網羅される塩基の数は、例えば分析の複雑性、および所望のレベルの正確性に基づいて選択されうる。当業者は、2以上の塩基のプローブ長が使用され得、合成核酸配列はそれに応じてデザインされることを認識するであろう。
【0032】
図2に示されているように、合成ビーズ200の様々な実施形態は、リンカー220を有するビーズ210を含み、リンカー220は、合成テンプレート230をビーズに付着させるための合成配列である。合成テンプレート230は、第1またはP1プライミング部位240、インサート250、および、第2またはP2プライミング部位260を含むこともできる。リンカー220および合成テンプレート230の長さは変えることができる。例えば、リンカー220の長さは、10〜100塩基、例えば、15〜45塩基の範囲にわたり、例えば18塩基(18b)などの長さでありうる。リンカー220はまた、P1 240、インサート250、およびP2 260を含めて、長さを変えることができる。少なくとも1つの実施形態において、P1 240およびP2 260は各々、10〜100塩基、例えば15〜45塩基の範囲にわたり、例えば23塩基(23b)などの長さでありうる。インサート250は、2塩基(2b)〜20,000塩基(20kb)の範囲にわたり、例えば60塩基(60b)などでありうる。少なくとも1つの実施形態において、インサート250は、100を超える塩基、例えば1,000以上などの塩基を含むことができる。様々な実施形態において、インサートは、連鎖状の形態であってよく、その場合は、インサート250は、最大で100,000までの塩基(100kb)またはそれ以上を含むこともできる。
【0033】
少なくとも1つの実施形態において、インサート250は、特異的にデザインされた合成配列を含む。各対照セットは、異なるインサート250を含む複数の合成ビーズ200を含む。例えば、少なくとも1つの実施形態において、対照セットは、少なくとも1024の特有インサート250を含む合成ビーズを含むこともできる。様々な代替実施形態にしたがい、対照セットは、64の特有インサート、256の特有インサート、またはそれ以上を含むこともできる。例えば、5塩基(5b)の特有配列を含むインサートについて、これはペンタマーとしても知られており、4つの基準塩基(A、G、C、およびT)から選ばれ、合計4すなわち1024の特有配列が使用されうる。当業者は、各特有インサート配列250における塩基の数は、限定するものではないが、対照セットの所望の正確性、研究されているサンプルの複雑性などを含む幾つかの判断基準に基づいて選択されうるということを認識するであろう。
【0034】
少なくとも1つの実施形態において、一セットの対照合成ビーズは、それに付着された追加的な特有核酸配列を有するビーズを含むこともできる。例として、追加的な特有合成酸配列は、一セットの対照の生成後に認められる任意の偏り(bias)の説明をするために導入されて対照を増大させてその偏りの説明をする対照セットを形成することができる。例えば、一度に5塩基を網羅するプローブで対照セットを分析するために二塩基配列決定法が使用される場合、一セットの1024の特有核酸配列は、インサート上の所与の場所で4つの基準塩基のあらゆる可能なペンタマー組み合わせを提供するであろう。1024の特有核酸配列は、インサート上の所与の場所であらゆる可能なペンタマー組み合わせを提供することができるが、追加的な特有核酸配列に関連した追加的ビーズも提供されうる。理論によって限定されることを望まないが、偏りは、いくつかの配列において、あるいは、各合成核酸配列内のいくつかの場所、例えば上記の例におけるペンタマー配列の間の接合点に、存在し得ると考えられており、接合点は、一度に5塩基を網羅するプローブによって調べられる、第1ペンタマーの最終塩基、および、第2ペンタマーの最初の塩基として定義される。少なくとも1つの実施形態において、試験の間に偏りを示す任意の核酸配列に類似する合成核酸配列を含む追加的ビーズも含まれうる。
【0035】
様々な例示的実施形態において、可能な追加的合成核酸配列の数は最大で、2つの隣接するプローブされた配列(例えば、前述された5塩基プローブ配列の例では2つの隣接するペンタマー)の間の接合部にわたる各核酸連結事象の説明をするために二乗された対照セットにおける特有核酸配列の数まででありうる。例えば、64の特有合成核酸配列を含む対照セットは、核酸連結事象間のセット全体の相互作用を網羅するために合計64=4,096の異なるプローブ配列を含むこともできる。同様に、1024の特有プローブ配列を含む対照セットは、核酸連結事象間のセット全体の相互作用を網羅するために合計1024=1,048,576の配列を含むこともできる。
【0036】
本教示の様々な例示的実施形態にしたがい、対象セットは、複数のビーズ200を含むこともでき、各ビーズは、2塩基コード化におけるプローブ配列で一度に5塩基を調べる場合に核酸連結サイクルの5塩基ごとに特有ペンタマーを含む1024の特有インサートから選択される特有インサート250を含む。複数のビーズ200の各々は、各インサート250の複数のコピー、例えばインサート250の平均5,000コピー〜250,000コピーなど、例えば平均95,000コピー〜170,000コピーを、含むこともできる。少なくとも1つの実施形態において、ビーズ200は、インサート250の平均約130,000コピーを有することもできる。当業者は、インサート250のコピーの数は、実行される実験によって変わることができ、実際数は、おおよそ、様々な用途の必要性を満たすような数でありうることを認識するであろう。
【0037】
二塩基配列決定法において、プローブ配列は、複数の核酸連結サイクルの各々の間に設定された数の塩基を調べる。例えば、一度に5塩基を網羅するプローブ配列は、その後の核酸連結サイクルの各々の間、第1の5塩基を、それに続いて第2セットの5塩基が網羅されるであろう。二塩基配列決定法が5塩基プローブ配列を用いて使用される場合、プローブ配列によって網羅される5塩基のうちのたった2つのみがプローブによって調べられる。様々な実施形態において、より多くの塩基を調べる他のプローブが使用されうるか(例えば多塩基配列決定法)、あるいは、調べない塩基と比較した合成核酸配列を調べる塩基の異なる比を有する他のプローブ、例えば4塩基を網羅し合成核酸配列の2塩基を調べる二塩基プローブなども使用され得る。完全なデータセットを構築するために、各プローブ配列によって網羅される塩基の数と少なくとも同数のプライマーが使用されるべきであり、各プライマーは、1塩基によってオフセットされる。例えば、60の塩基インサートは、一度に5塩基を調べるプローブを使用する場合、各塩基を特定するのに十分なデータを提供するために、互いからオフセットしている5プライマーを使用して、12の核酸連結サイクルを必要とするであろう。ゆえに、各核酸連結サイクルでx個の塩基を調べるプローブを使用する場合、必要とされる核酸連結サイクルの数は、塩基の長さをxで割り、次の整数まで端数を切り上げたものと等しい。少なくとも1つの実施形態において、各インサートに関連する各特有ペンタマーは、そのインサートにおいてたった1度現れる。単一テンプレートにおいて続くプローブによって調べられる配列は、繰り返すべきでない。言い換えれば、テンプレート配列は、連続する任意のx個の塩基の配列が、(正の整数であるn)×x離れた距離にある、連続する任意の他の一連のx個の塩基において繰り返されないようにデザインされうる。例えば、インサートの第1の5塩基に現れる特有ペンタマー(すなわちx=5)は、インサートの残り部分における後の連続した5塩基配列、すなわちxの倍数、例えば5塩基、10塩基、15塩基など離れた5塩基配列の、各々において現れないであろう。
【0038】
少なくとも1つの実施形態にしたがい、ペンタマーを排除するインサート配列の残りの部分は、ペンタマーに類似する準反復配列を避けることもできる。例えば、あるビーズについて第1ペンタマーが配列AAAAAである場合、インサート配列の残りの部分は、類似配列、例えばAAAATAAAACAAAAGなどを避けることもできる。合成ビーズが二塩基コード化(2塩基コード化としても呼ばれる)で使用される場合、当業者は精通しているが、合成配列インサートはまた、先の核酸連結サイクルからも残留信号を場合により区別するのを助けるために、隣接核酸連結サイクルの間で同じ色の呼び出しを繰り返すのを避けるようにデザインされうる。ゆえに例えば、塩基を(個々に、または組み合わせとして)コード化するために蛍光色素タグを使用する場合、合成配列インサートは、1つの色が第1配列決定サイクル(例えば核酸連結サイクル)の間に検出された場合に、次の配列決定サイクルは、同じ色をもたらさないようにデザインされうる。したがって、様々な例示的実施形態において、連続するプローブ配列決定サイクルの間に同じ色が検出されると、配列決定プロセスにおいてエラーが起こったということが決定され得、配列決定実行全体が必要に応じて打ち切られ得る。
【0039】
本教示の様々な実施形態にしたがい、合成テンプレート配列は、ランダムに生成された配列から最小のフォールディング自由エネルギー(folding free energy)を有する配列として選択されうる。例えば、多数の配列セット、例えば、1024の合成配列の10,000の生成されたセットなどが、例えばフォールディング自由エネルギーを計算するのに有用なソフトウェアおよび/または他の技術を使用して、最低自由エネルギーを有する配列を決定するために分析されうる。可能性がある二次的構造問題も、合成テンプレート配列を選択するときに、避けられうる。セットにおける幾つかの配列は、可能性がある二次的構造問題を手動でチェックするためにランダムに選択されうる。少なくとも1つの実施形態において、ランダムなテンプレート配列は、以下のアルゴリズムを使用して決定されうる。1024の異なる配列を含む対照セットについて、全ての1024のペンタマーは、配列の根源(seed)としてランダムな順番で生成される。次に、1024の配列の各々は、以下の法則で拡大適用される:1)最後の4塩基で1024配列の全てをグループ化して、その結果として256群、および、各群に4配列をもたらすべきである;2)異なる塩基A、T、G、およびCをランダムに4配列に適用し、その結果、異なる塩基で付加された全ての4配列をもたらす;3)適用された配列が任意の要求される制約を満たすかどうかチェックする;要求される制約が満たされたら、別の群についてステップ2を繰り返し、そして、要求された制約が満たされなかったら、ステップ2が規定数の再試行だけ繰り返されうる(例えば最大で、4回まで、または試験される必要のある24の組み合わせ);4)規定数の再試行に達した後も、制約を満たすことができない場合、1024のランダムに生成されたペンタマー配列の新しいセットで始める;5)全ての群で制約が満たされたら、別の塩基に適用するために、全ての群についてステップ1からプロセスを繰り返す;6)いったん所望の長さに達したら、結果として生じた合成配列を出力する。
【0040】
合成ビーズ300の代替例示的実施形態は、図3に概略的に示されている。合成ビーズ300は、ビーズ310、リンカー320、および、合成テンプレート330を含むことができる。合成ビーズ300の合成テンプレート330は、メイト・ペア・ライブラリー構造に類似することもできる。合成テンプレート330は、長さが10〜100塩基、例えば15〜45塩基の範囲にわたることができ、例えば23bの長さなどである、第1またはP1プライミング部位340および第2またはP2プライミング部位360を含むことができる。合成テンプレート330は、第1合成タグ配列352、第2合成タグ配列354、および、第1タグ配列352と第2タグ配列354との間に位置する内部アダプタ356を含むことができる、インサート350をさらに含む。第1タグ配列352および第2タグ配列354は、2塩基(2b)〜20,000塩基(20kb)の範囲にわたる長さ、例えば60塩基などの長さを有することもできる。第1タグ配列352および第2タグ配列354は、同じ配列か、または、異なる配列であってよい。第1タグ配列352および第2タグ配列354は、異なる数の塩基、または、同数の塩基を含むこともできる。対照セットにおける全てのテンプレート配列に共通であることができる内部アダプタ356は、10〜100塩基、例えば15〜45塩基の範囲にわたる長さ、例えば36塩基などの長さを有することもできる。
【0041】
第1テンプレート配列352および第2テンプレート配列354は、特異的にデザインされた合成配列を含むこともできる。少なくとも1つの実施形態では、対照セットは、複数の合成ビーズ300を含むことができ、それら合成ビーズの各々は、第1タグ配列352および第2タグ配列354において、前述されたような特有配列を含む。少なくとも1つの実施形態では、合成ビーズ300の各々は、1024の特有配列から選択される特有配列を含む(4の可能なペンタマー配列)。第1タグ配列352および第2タグ配列354の配列は、前述されたデザイン法則に基づいて選択されうる。追加的に、第1タグ配列352における塩基、および、第2タグ配列354の塩基は、ペンタマー配列に類似する準反復配列を避けるように選択されうる。
【0042】
様々な実施形態において、追加的な内部アダプタおよびタグ配列が使用され得る。例えば、インサートは、3以上のタグ配列、および2以上の内部アダプタをそれぞれ交互パターンで含み得る。様々な他のタイプの配列パターンが、所望の用途に応じて合成核酸配列に利用されうる。
【0043】
少なくとも1つの実施形態において、内部アダプタは、PCR増幅プロセスにおける追加的プライマーでありうる、プライマー配列を含み得る。
【0044】
少なくとも1つの実施形態において、様々な合成テンプレートデザインを有する合成ビーズが調製されて、PCRを使用して固体担体に付着されうる(ポリメラーゼ連鎖反応)。PCRの任意の既知の方法が、核酸配列を増幅して固体担体に付着させるために使用され得る。少なくとも1つの実施形態において、各合成テンプレートデザインは、別個のPCR溶液において増幅されうる。この方法において、特有ペンタマーを含むテンプレート配列などの、各特有合成テンプレート配列は、個々のバッチにおいてビーズ上に線形成長方式で増幅されうる。結果として、別個のPCR溶液で調製された全てのビーズバッチは、モノクロナールであることができ、ポリクローナルで非特異的増幅サンプル調製ノイズを減少させることができ、さもなければこのノイズは他の方法を使用して調製された対照に存在することがある。
【0045】
1つの例示的実施形態において、1024の特有テンプレート配列を有する一セットの合成ビーズを調製するために、11以上の96ウェルプレートが、各ウェル内で1024の別個の反応物を支えるために使用され得る。例えば、1つの特有の合成的に誘導されたテンプレート(例えば、前述された方法論を使用して得た合成配列)が、1024ウェルの各々の中に設置され得、およそ十万以上のビーズが各ウェル内に設置され得る。各ウェル内のビーズ数は、ビーズの十分なテンプレーティングを達成するために必要とされる量のビーズ(すなわち、そこに付着された十分なプレート密度を有するビーズの数)に応じて変わることができる。例えば、ビーズの数は、2億〜10億以上の範囲にわたることができる。当業者は容易に認識するであろうが、使用され各PCRバッチ内でテンプレーティングされうるビーズの実際数はおおよそであり得、例えば各PCR反応が行われる反応容器のサイズに依存する場合もある;当業者は、個々のPCR反応容量がナノリットルからリットルの範囲にわたり得ることを理解するであろう。ウェルプレート上でのPCRは、ウェル内のビーズ上への合成配列の所望のテンプレート負荷(template loading)を達成するように選択された多くのサイクルの間、行われ得る。様々な例示的実施形態において、前述されたように、PCRサイクルは、ビーズ当たり約5,000コピー〜約250,000コピー、例えばビーズ当たり約95,000〜約170,000コピーの範囲にわたる平均テンプレート負荷を達成するように繰り返され得る。
【0046】
例えば、様々な実施形態にしたがい、合成ビーズは、P1プライミング部位を有するビーズを使用して、多くの特異的にデザインされたテンプレートの各々を個々のバッチにおいてPCRを使用して増幅して調製されうる。このプロセスは、図4A〜図4Dに示されているように、線形増幅であり、指数関数的増幅ではない。図4A〜図4Dにおいて、異なる配列のテンプレートの代表例について、熱サイクルの数の関数としてテンプレート密度が示されている。利用可能P1部位でのテンプレートの取込比率は、異なるテンプレートデザインによって変わりうるが、全ての場合において取込比率は、線形方式で進むことができ、ゆえに各バッチのテンプレート密度に対する対照を可能にする。
【0047】
PCRは、合成核酸配列を増幅し、合成核酸配列を固体担体に付着させるために使用されうるが、そのような技術は、非限定的で例示として理解されるべきである。本教示の様々な代替実施形態において、核酸配列は、化学的または生化学的のいずれかで固体担体に付着されうる。例えば、核酸配列は、共有結合を、固体担体または固体担体に付着されたリンカーに、化学的に形成することによって付着されうる。別の例において、核酸配列は、固体担体、または固体担体に付着されたリンカーに酵素的に付着されうる。
【0048】
本教示にしたがって対照を作り出すためのプロセスは調整可能でありうるということは、図5に提示されたグラフに証明されている。図5において、選択されたテンプレートの関数とするテンプレート密度のプロットが示されている。ひし形を使用してプロットが示されている、オリジナルの30サイクルのプロットに見られるように、幾つかのテンプレートは、他のものより高い比率で形成している場合もあり、このことは図4A〜図4Dに示されるデータに一貫している。四角を使用して示されているグラフでは、これらは後続反応、またはリメイク反応である。このプロットに見られるように、これは、全ての配列のテンプレート密度が標準化されうるということを証明する。合成は線形であり、全ての合成テンプレートデザインによく特徴付けられ得るので、テンプレート密度は、容易に調節可能になりうる。
【0049】
少なくとも1つの実施形態にしたがい、個々のバッチが、例えば一バッチにおけるビーズ数、テンプレート密度(例えば平均テンプレート密度)、および、反応変動について分析されうる。線形増幅を使用して、一バッチにおけるビーズ当たりのテンプレート密度が監視され正確に制御されうる。様々な実施形態にしたがい、合成ビーズバッチは、精密に調整されたテンプレート密度で調製され得る。前述されたように、合成ビーズの様々な例示的実施形態において、ビーズ当たり約5,000テンプレート〜ビーズ当たり約250,000テンプレートの範囲にわたる平均テンプレート負荷が望ましいこともある。しかしながら、調製の調整可能な性質は、ビーズ当たり約1つのP1部位〜ビーズ当たり全ての利用可能なP1部位の間の等価物を可能にさせる。モノクロナールビーズのバッチの調製および特徴付けの後に、ビーズは、例えば、各特有テンプレートを含む実質的に同数のビーズを含有する合成ビーズ対照セットを作り出すために、実質的に等しい濃度の各々のビーズ群を注ぐ(例えば1024の特有合成テンプレート配列のための1024群)ことによって、プールされうる。したがって、各対照セットは、およそ同数のテンプレートを含むことができる。例えば、様々な例示的実施形態において、対照セットは、1,000億〜1兆5,000億ビーズを含むこともできる。少なくとも1つの実施形態において、対照セットは、8,000億の合成ビーズを含むこともできる。当業者は、対照セットのビーズ数は、対照セットが使用される用途、および、大なり小なりビーズによって提供されるだろう所望の反応強度に基づいて選択されうると認識するであろう。
【0050】
少なくとも1つの実施形態において、合成ビーズの品質は、適切なテンプレート負荷および負荷されるビーズの数を確かめるための品質制御(QC)配列決定方法を使用して決定されうる。QC配列決定方法の例示的実施形態において、プールされた合成ビーズのセットは、スライド上(例えばフローセル内)に設置される。全てのビーズの場所を特定するために標識されたP1およびP2プライマーの局所的マップが生成され、リセットが続き(例えばP1およびP2ラベルの除去)、プライマー1による単一核酸連結サイクルが続く。リン酸化または開裂ステップは行われない。次いでスライドがスキャンされる。ビーズはモノクロナールであり、開裂ステップは行われないので、ノイズの存在のみが、局所的マップに続く非効率的なリセット、または、核酸連結ステップにおける誤取り込みの結果として生じる。図9に示されているsatayプロットなどのsatayプロットは、2塩基コード化システムで使用されるような4つの色素の各々の強度を示す。図9に示されている4つの別個のsatayプロットは、スライドの4つの異なる領域、または区画(quads)に対応する。あるスライドについて4つのsatayプロットの比較は、そのスライド上のビーズの分布を示すこともできる。軸上のパーセンテージは、色素の強度の変動を示す。
【0051】
合成ビーズの分析および特徴づけの後に、合成ビーズ対照セットは、個々のバッチ調製物から(例えば、上記の例では1024バッチから)一定分量をプールすることによって作り出されうる。全てのプローブが配列決定法のあらゆるラウンドで調べられうるということ(例えば上記で提供された例において1024のペンタマープローブ)を提供することに加えて、合成ビーズの様々な実施形態の他のデザイン特徴は、合成テンプレートが最小の二次的構造を有するということ、合成テンプレートが断片ライブラリー、メイト・ペア・ライブラリー、またはより複雑なライブラリーの後にデザインされうること、ならびに、合成テンプレートが色から塩基割当まで容易にデコードされうるということを含むが、それに限定されない。追加的に、合成ビーズの様々な実施形態は、制御可能なプロセスを使用して、ならびにテンプレート密度が調整可能であるということを提供して、生産のスケーリングを提供する様々な方法を使用して調製されうる。これらの調製方法は、合成ビーズの様々な実施形態が、バッチからバッチへ高度に再現可能であり、テンプレート長、またはバッチの標準化の複雑性における相違に基づいて精密に調整されうるということを確実にする。
【0052】
合成ビーズの様々な実施形態は、先に説明されたように、様々な固相配列決定システムにおいて使用され得る。その点において、合成ビーズの様々な実施形態が、限定するものではないが、合成による配列決定法、ハイブリダイゼーションによる配列決定法、および、核酸連結による配列決定法などの先に言及された次世代配列決定方法の任意のものにおいて使用され得る。
【0053】
例えば、核酸連結による配列決定法に対する一アプローチは、先に言及され組み込まれた参考文献においてMcKernanらによって説明されたように、2塩基コード化を使用する。2塩基コード化を使用する核酸連結による配列決定法の様々な実施形態にしたがい、長さが8bのプローブが使用され得る。ここで第1の3塩基は変性し、最後の3塩基は万能である。第4および第5の塩基は、調べられる2塩基である。2塩基コード化方法の様々な実施形態において、4つの異なる色素タグは、プローブを検出するために使用され得る。したがって、単一の色は、可能性があるジヌクレオチドを16の可能な組み合わせのうちの4つに限定する。核酸連結プロセスの間、蛍光タグを保持する3つの万能塩基が開裂され、検出可能な蛍光信号を生み出し、したがって各サイクルにおいて、塩基のペンタマーが成長鎖に加えられる。そのようなアプローチを利用した核酸連結による配列決定法のための方法の様々な実施形態には、1024の可能なペンタマープローブが存在するであろう。本教示の様々な実施形態において、他の長さのプローブもまたは使用され得る。例えば、2以上の塩基の長さを有するプローブは、少なくとも1つの実施形態において使用され得る。
【0054】
ペンタマープローブの上記の例を使用して、モノクロナール合成ビーズの様々な実施形態は、配列決定法のあらゆるラウンドにおいて1024の可能なペンタマープローブの全てを調べるようにデザインされうる。例えば、1024の特異的モノクロナールテンプレートデザインは、例えば個々のPCR反応を使用して別個に調製されうる。そのようなモノクロナールビーズおよびプローブ組み合わせはまた、2を超える塩基のコード化が利用される多塩基コード化配列決定法に使用され得、当業者は、合成配列のデザインを多塩基または単塩基コード化配列決定技術に有用になるようにどのように修正すべきかを理解するであろう。さらに、4つの蛍光色素タグ(例えば4色)が16の可能な2塩基組み合わせをコード化するために使用され、ゆえに各色が4つの可能性がある2塩基組み合わせを表す、二塩基コード化を使用する場合、合成対照ビーズの合成配列インサートは、もし1つの色が第1核酸連結サイクルの間に検出されると、次の核酸連結サイクルは、同じ色をもたらすことがないようにデザインされうる。
【0055】
合成ビーズの様々な実施形態は、器具機能を評価するための対照としての性質を有するということは、図6〜図8に証明されている。これらのグラフの基として使用されるデータは、図1で描写され説明されたような器具上で先に説明されたような核酸連結方法による配列を使用して生成された。
【0056】
合成ビーズバッチの様々な実施形態の全体的な再現性は、テンプレート密度対配列IDのグラフである図6で証明されている。フローセル内に設置された単一プレートは、4バッチからの合成ビーズ対照を収容するように細区画され、配列決定法が、4バッチについて同時に実行された。バッチは、5%未満のパーセント(CV%)として表された変動係数で実質的に重ね合わされるデータを生成する。
【0057】
配列決定法についてのエラー率決定は、配列決定法におけるエラーが、配列決定されるサンプルでなく、器具性能の機能に根本があるという条件下でのみ、器具性能を特徴付けることに対して重要な計量であり得る。ポリクローナル特徴(例えばビーズに付着されるポリクローナル配列)を有する他の対照と異なり、本教示にしたがう合成ビーズの様々な実施形態は、図7に示されているようなエラー率プロットを決定するために使用されうる。合成ビーズの様々な実施形態にしたがい、合成テンプレートのための配列は、ポリクローナルビーズのための配列割当とは対照的に容易に割り当てられ得る。したがって、合成ビーズの様々な実施形態は、図7に示されているように再現性のあるエラー率を有することができる。
【0058】
図8Aおよび図8Bは、合成ビーズ対照の様々な実施形態を使用した場合の配列決定法におけるエラー率は、器具性能に起因し得、ビーズ化学現象には起因し得ないということを証明する。グラフIに提示されているデータにおいて、統計的に決定されたエラーバーが、累積分布関数対ミスマッチ数のプロットにおいて8器具から収集されたデータについて示している。グラフIIに提示されているデータにおいて、比較データが、1つの器具についての単一スライド上における6ビーズロットから抜き出された8ビーズサンプルについて示されている。ビーズによるシステムノイズへの寄与は、10%であり、これは器具類によって寄与されたものである。これらのデータに基づいて、器具がビーズ変動性の結果として品質制御評価に不合格になりうる可能性はたった約1%あるだけである。この点で、システムノイズ全体のそのような小さな部分に寄与する、合成ビーズの様々な実施形態は、器具品質および検証のための方法に使用され得、ビーズを使用して生成されたシステムノイズまたはエラー率などの計量は、その計量について許容可能な性能の所定限界と比較されうる。
【0059】
少なくとも1つの実施形態において、合成ビーズの対照セットは、色素標識されたプローブ配列の品質および有効性を決定するために使用され得る。色素反応は、色素標識されたプローブ配列の濃度に対して線形反応を示す。したがって、色素標識されたプローブ配列のバッチの品質は、上記で説明された合成ビーズを使用して試験されうる。同様に、異なる色素標識されたプローブセット間の比較がなされうる。少なくとも1つの実施形態において、標識されていないプローブの品質は、色素標識されたプローブを用いた、あるいは、標識されたプローブと標識されていないプローブとの既知比率での混合による、続く核酸連結サイクルで監視され得る。
【0060】
合成ビーズの様々な実施形態にしたがい、合成ビーズのデザイン特徴、ならびにバッチからバッチへの再現性を確実にする合成ビーズの調製方法は、合成ビーズを、器具検証、較正および標準化のための、ならびにプローブ化学現象による品質制御のための、理想的な対照にする。
【0061】
本教示の様々な実施形態にしたがい、上記で説明された合成ビーズの対照セットは、配列決定器具を検証するため、例えば、器具品質(IQ)を確かめるために使用されうる。少なくとも1つの実施形態において、上記で説明されたQC配列決定実行は、実験的配列決定実行の前および後に行われ得る。実験的実行前のQC配列決定実行からの結果、および、実験的実行後のQC配列決定実行からの結果は、器具が適切に機能したかどうか決定するために比較され得る。例えば、実験的実行後に行われたQC配列決定実行が、実験的配列決定実行前に行われたQC配列決定実行と異なる場合、実験的実行の結果は、器具の性能における変化によると推測されうる。
【0062】
少なくとも1つの実施形態にしたがい、合成ビーズは、例えばスライドまたはフローセルにおけるビーズの分布(標的配列に対する対照とそれゆえビーズの双方)を決定するために使用され得る。例えば、スライドの異なる領域を測定するsatayプロットの理想的な群は、各軸に沿って実質的に均一に分布された散在状態を示すべきである。ある器具がうまく作動していない場合、各領域についてのsatayプロットの比較は、エラーとその器具を結び付けることができる。追加的に、合成ビーズの対照セットは、実験的配列決定実行におけるビーズが均一に分布されたことを示すために使用されうる。
【0063】
少なくとも1つの他の実施形態において、合成対照ビーズのセットは、全体的な(すなわち総計の)マッチング統計を決定するために使用され得る。全体的なマッチング統計は、各配列決定実行の品質をアッセイするために使用され得る。例えば、低いミスマッチング率は、配列決定実行の品質が満足するものであったということを示すことができ、一方で高いミスマッチング率は、劣った実行品質を示すことができる。特有テンプレート核酸配列の各々の個々のマッチング率はまた、配列構成依存性問題、例えば劣ったプローブ化学現象および/または系統的核酸連結および/またはハイブリダイゼーション問題などを検出するために使用され得る。合成配列を使用することにおいて、配列読取値を基準(対照)にマッピングする多義性は取り除かれ、個々の配列の各々に対する性能の測定がより一貫して決定されることを可能にする。
【0064】
少なくとも1つの実施形態において、IQ配列決定実行はまず、合格および不合格双方の器具を含む、一セットの試験SOLiDシーケンサー(一般的に30〜40)(例えばライフ・テクノロジーズ社(Life Technologies, Inc.)から市販されているSOLiDシーケンサー)において試験されうる。これらの器具は、IQ配列決定実行に先立って合格または不合格として予め決定されうる。合格器具の規格は、1.5標準偏差を引いた平均マッチングパーセンテージとして設定されてよく、これは数学的に95%の合格器具を含む。例えば、例示的実施形態にしたがう合格器具のマッチングパーセンテージ規格は、77.7%で設定されてよく;言い換えれば、マッチングパーセンテージは、合格されたIQを有すると見なされる器具について約77.7%を超えるものと設定されてよい。同様に、個々の合成配列のマッチングパーセンテージは、対照セットのビーズの品質を決定するために使用されうる。誤って合成された核酸テンプレート、または欠損テンプレートのサブセットは、高エラー率を有する配列ブロックとして検出され観察されうる。
【0065】
少なくとも1つの実施形態において、IQは、対照セットの別個の実行における各核酸連結サイクル後に測定された強度を比較することによって分析されうる。理論によって限定されることを望まないが、プローブ強度の反応は、任意の所与の配列において、配列中の調べられた塩基の物理的位置に基づいて変わることができるということが考えられる。例えば、核酸配列の始まり近くの2塩基配列を検出するプローブは、その核酸配列の物理的にさらに遠くにあり後の核酸連結サイクルにおいてプローブされる同じ2塩基配列において同様のプローブと異なる反応強度を提供することもある。この変動は、再現性があり予想通りと言える。様々な実施形態にしたがい、この変動は、IQのインジケータとして使用され得る。例えば、1つの配列決定実行における変動が、同じ対照セットの別の配列決定実行における変動と異なる場合、器具エラーがその変動の原因でありえ、実験的配列決定実行の問題を示唆しうる。
【0066】
少なくとも1つの実施形態において、合成対照ビーズはまた、2つの異なる器具間のデータを標準化するために使用され得る。対照セットの結果は、図7および図8に示されているように再現性があるので、対照ビーズのセットは、異なる器具にQC配列決定法を実行することによって異なる器具の感度におけるいかなる相違も決定するために使用され得る。QC配列決定実行から得たデータは、各器具によって提供されたデータを標準化するために使用され得る。
【0067】
少なくとも1つの実施形態にしたがい、連続する核酸連結サイクルについてのエラー率は、先の核酸連結サイクルで起こった可能性のあるエラーを決定するために使用され得る。例えば、1024の特有核酸配列を含む対照セットにおいて、特定の色の測定のエラー率は、進行中の核酸連結サイクルおよび先の核酸連結サイクルのペンタマー配列に依存することもある。ペンタマーは、それ単独で1サイクルで良好に連結しうるので、それはいくつかの上流ペンタマーによって達成される場合に誤ることもある。少なくとも1つの実施形態において、進行中の核酸連結サイクルと先の核酸連結サイクルの測定値を比較する相互作用マトリックスは、エラーを決定するために使用され得る。理論に限定されることを望まないが、配列決定エラー率の相互作用マトリックスは、生物学的配列カセット(例えば断片ライブラリーまたはメイト・ペア・ライブラリー)を使用して推定され得、合成配列は配列決定エラー率の相互作用マトリックスの不偏推定値を提供することができるということが考えられている。
【0068】
様々な実施形態が、合成核酸配列が付着される固体担体としてビーズを説明したが、他の固体担体、例えば微粒子、マイクロアレイ、スライドなども利用されうる。追加的に、ビーズは、ポリマー材料および無機材料、ならびに常磁性材料および非常磁性材料を含む、そのような使用に知られている任意の既知の材料を含むこともできる。適切な固体担体の選択は、使用される配列決定プラットフォーム、研究を行うために使用される材料、および、実験の実行に影響を及ぼし得る任意の他の要因に基づいて決定する当業者の能力の範囲内であろう。
【0069】
本教示の原理が合成ビーズおよび配列決定プラットフォームの特定の実施形態に関連して説明されたが、これらの説明は、単なる例としてなされ、本教示または請求項の範囲を限定するようには意図されないということは明らかに理解されるべきである。本明細書に開示されたものは、例証および説明の目的のために提供された。網羅的であることや、開示されるものを説明されたまさにその形態に限定することは意図されない。多くの修正形態および変形形態が当業者には明らかであろう。開示されているものは、説明された技術の開示された実施形態の原理および実際的適用を最良に説明し、それによって他の当業者が、企図される特定使用に適合される様々な実施形態および様々な修正形態を理解することができるように、選択され説明された。開示されているものの範囲は、以下の特許請求の範囲およびそれらの等価物によって定義されることが意図される。

【特許請求の範囲】
【請求項1】
一セットの固体担体を含む、核酸サンプル配列決定法の品質制御を行うためのシステムであって、
各々の固体担体はそれに付着された複数の核酸配列を有し、
前記セットは複数の群の固体担体を含み、各群は同じ核酸配列が付着した固体担体を含有し、
各群の前記核酸配列は互いに異なり、
前記核酸配列は合成的に誘導される、システム。
【請求項2】
前記固体担体は、ビーズである、請求項1に記載のシステム。
【請求項3】
前記複数の核酸配列は、テンプレート核酸配列のポリメラーゼ連鎖反応により各固体担体に付着される、請求項1に記載のシステム。
【請求項4】
前記複数の核酸配列は、化学的または生化学的に各固体担体に付着される、請求項1に記載のシステム。
【請求項5】
各核酸配列は、核酸連結による配列決定プロセスの間の核酸連結の連続するサイクルが、色素標識されたプローブ核酸配列を用いて同じ検出色をもたらさないようにデザインされる、請求項1に記載のシステム。
【請求項6】
前記セットは、少なくとも64群の固体担体を含む、請求項1に記載のシステム。
【請求項7】
前記セットは、少なくとも1024群の固体担体を含む、請求項6に記載のシステム。
【請求項8】
各固体担体は、約5,000〜約250,000のモノクロナール核酸配列が結合されている、請求項1に記載のシステム。
【請求項9】
各核酸配列は、複数のタグ配列を含み、前記複数のタグ配列は、同じ配列または異なる配列を含む、請求項1に記載のシステム。
【請求項10】
内部アダプタ配列が、前記複数のタグ配列の各々の間に配置される、請求項9に記載のシステム。
【請求項11】
前記固体担体に付着された前記核酸配列は、モノクロナール核酸配列である、請求項1に記載のシステム。
【請求項12】
前記核酸配列は、各配列のフォールディング自由エネルギーが最小にされるようにデザインされる、請求項1に記載のシステム。
【請求項13】
連続する任意のx個の塩基の配列が、nxの距離離れた連続する別の一連のx個の塩基における核酸配列において繰り返されないように、前記核酸配列がデザインされている、請求項1に記載のシステムであって、ここで、nは正の整数であり、xは核酸連結による配列決定プロセスにおける各核酸連結サイクルの間、プローブ配列によって網羅される塩基の数である、システム。
【請求項14】
各合成核酸配列が別の核酸配列と異なる、複数の合成核酸配列を生成する工程と、
前記合成核酸配列の各々を複数群の固体担体における固体担体に付着させる工程であって、各群における前記固体担体には同じ前記合成核酸配列が付着する、付着させる工程と、
核酸サンプル配列決定法を行うための一セットの対照固体担体を作り出すために、前記合成核酸配列を付着させた各群の固体担体を組み合わせる工程と、
を含む、核酸サンプル配列決定法を行うための品質対照を調製する方法。
【請求項15】
前記複数の合成核酸配列を生成する工程は、前記配列の連続する任意のx個の塩基が、nx距離離れた連続する別の一連のx個の塩基における前記核酸配列において繰り返されないように、配列を生成する工程を含む、請求項14に記載の方法であって、ここで、nは正の整数であり、xは、核酸連結による配列決定プロセスにおいて各核酸連結サイクルの間にプローブ配列によって網羅される塩基の数である、方法。
【請求項16】
各固体担体が、それに付着された前記合成核酸配列の複数のモノクロナールコピーを有するように、各固体担体上で前記合成核酸配列を増幅する工程をさらに含む、請求項14に記載の方法。
【請求項17】
前記増幅する工程は、他の前記合成核酸配列とは別個の反応において各合成核酸配列を増幅する工程を含む、請求項16に記載の方法。
【請求項18】
各固体担体は、それに付着された約5,000〜約250,000の合成核酸配列を有する、請求項14に記載の方法。
【請求項19】
前記合成核酸配列の各々を固体担体に付着させる工程は、前記合成核酸配列を化学的または生化学的に前記固体担体に付着させる工程を含む、請求項14に記載の方法。
【請求項20】
前記固体担体はビーズである、請求項14に記載の方法。
【請求項21】
各合成核酸配列は、核酸連結による配列決定プロセスの間の核酸連結の連続するサイクルが、色素標識されたプローブ核酸配列を用いて同じ検出色をもたらさないように、デザインされる、請求項14に記載の方法。
【請求項22】
前記組み合わされた群の固体担体は、少なくとも64群の固体担体を含む、請求項14に記載の方法。
【請求項23】
前記組み合わされた群の固体担体は、少なくとも1024群の固体担体を含む、請求項22に記載の方法。
【請求項24】
各核酸配列は、複数のタグ配列を含み、前記複数のタグ配列は、同じ配列または異なる配列を含む、請求項14に記載の方法。
【請求項25】
内部アダプタ配列が、前記複数のタグ配列の各々の間に配置される、請求項24に記載の方法。
【請求項26】
複数の合成核酸配列が各々に付着された固体担体の一セットを、核酸配列決定器具の検出領域に設置する工程であって、前記固体担体のセットは、複数の群の固体担体を含み、ある群における前記固体担体の各々は、それに付着された同じ合成核酸配列を有し、異なる群における前記固体担体は、そこに付着された異なる合成核酸配列を有する、設置する工程と、
前記核酸配列決定器具の前記検出領域に対する各固体担体の場所を特定するために局所的マップを生成する工程と、
色素標識されたプローブ配列を、前記固体担体に付着された前記核酸配列に付着させるために、1以上の核酸連結サイクルを行う工程と、
前記核酸配列の各々に付着された前記色素標識されたプローブを検出する工程と、
前記色素標識されたプローブの強度を測定する工程と、
前記器具が妥当に機能しているかどうかを決定するために、測定された前記強度を閾値と比較する工程と、
を含む、核酸配列決定検証を行う方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate


【公表番号】特表2012−501658(P2012−501658A)
【公表日】平成24年1月26日(2012.1.26)
【国際特許分類】
【出願番号】特願2011−526271(P2011−526271)
【出願日】平成21年9月8日(2009.9.8)
【国際出願番号】PCT/US2009/056225
【国際公開番号】WO2010/028366
【国際公開日】平成22年3月11日(2010.3.11)
【出願人】(502221282)ライフ テクノロジーズ コーポレーション (113)
【Fターム(参考)】