説明

電気泳動分析のための内部較正標準

【課題】ポリヌクレオチド配列決定およびフラグメント分析、ならびに光学蛍光検出技術を用いる、ポリヌクレオチドシーケンサーおよびポリヌクレオチド分析器における従来の技術における問題の解決であって、以下の1つ以上を提供すること:改善された長さまたは読み取り、わずかなベースコーリング誤差、データおよび実験品質の良好な評価、および/または広範な種々の実験条件下においてデータを呼び出す性能。
【解決手段】新規の電気泳動分析のための内部較正標準。

【発明の詳細な説明】
【技術分野】
【0001】
本出願は、米国仮特許出願番号60/304,934(2001年7月11日出願)(
これは、本明細書中で参考として援用される)に対する優先権を主張する。
【0002】
(分野)
本発明の教示は、ポリヌクレオチド配列決定およびフラグメント分析、ならびに光学蛍
光検出技術を用いる、ポリヌクレオチドシーケンサーおよびポリヌクレオチド分析器に関
する。
【0003】
(参考文献)
【0004】
【表1】

【背景技術】
【0005】
(背景)
自動化DNA配列決定は、データ解析プロセスへの多数のチャレンジを示す。この入力
データは、非常に可変であり得、データ挙動の予測モデルがないが、コンピューター解析
ルーチンは、非常に正確な出力データを作成すると予測される。
【0006】
ベースコーリング(base−calling)は、自動化DNA配列決定のデータ解
析部分であり、これは、4つの蛍光強度の時間変動(time−varying)シグナ
ルを受け取り、そしてこのシグナルを生じる基礎となるDNA配列の推定を行う。
【0007】
一般に、ベースコーリングソフトウェアは、種々の現象(例えば、拡散および塗沫)の
「モデル」、移動における種々の色素および配列特異的改変物の移動度の差異を、観察さ
れるスペクトルデータに適用して、フラグメントの正味の挙動およびそれらがどのように
分離されるかを予測することで働く。このモデルがより現実的になると、アルゴリズムは
、生のシグナルデータを、実際のフラグメント分離順序、従って配列(および/またはフ
ラグメントサイズ)の表示へと、より良好に逆重畳し得る。広範に使用されるアルゴリズ
ムは、非常に単純でかつ概算的なモデルのみを提供する。
【0008】
改善のためのこれらの供給源の各々は、ある程度の成功まで処理されるが、より完全な
アプローチが、現在の方法を越える画期的な向上を遂げるために必要とされることは明ら
かである。改善されたアルゴリズムに、必要とされるさらなる情報を提供して、正味のデ
ータシグナルのより正確な表示および分離フラグメントの現実的なモデルを開発し得る配
列決定プロセスに対する改変が、特に有用である。
【0009】
ベースコーリング誤差の主な供給源は、空間の不正確な推定であり、すなわち、これは
、特定の塩基に関連するフラグメントが検出器を通過する際に、認識される。これは、特
に、操作後期のホモポリマー領域において認識可能である(例えば、5Asが6Asとし
て不正確に呼ばれ得る)。現在、多数の別々の較正操作および広範な分析が、ハードコー
ド(hard−coded)間隔曲線を生じる。しかし、適用された操作条件におけるバ
リエーションまたは全く制御されていない実験バリエーションは、フラグメント分離プロ
フィールを生じ得、このプロフィールは、ハードコード曲線から実質的に逸脱している。
異なる操作条件に対して頑健性であるピーク間隔を決定する力学的方法は、操作後期のベ
ースコーリング精度を実質的に改善する。
【0010】
逆重畳の数学的方法または数学的技術は、ベースコーリング精度を改善するための別の
機会を提供する。逆重畳は、生のデータを一連の既知のピーク形状として説明するように
試み、そして重複しているピークを正確に分離することが示されている。しかし、逆重畳
は、正味のピーク形状およびピークサイズが事前に知られていない場合、擬似ピークを生
じ得る。このピーク形状および単離された既知のピーク幅を測定する方法は、逆重畳方法
を改善し、次いで、この方法は、ベースコーリング精度、特に操作後期(さらに一緒に)
を改善する。
【発明の開示】
【課題を解決するための手段】
【0011】
(要旨)
このような問題は、本明細書中の教示によって(例えば、較正標準をポリヌクレオチド
分析(例えば、配列決定またはサイズ決定)反応物に加えることによって)、取り組まれ
る。例えば、ピーク形状およびピーク間隔情報のうちの1つまたは両方が、標準から有用
に抽出され、各個々の実験に耐性な、フラグメント移動挙動の良好なモデルを提供する。
【0012】
本発明の教示は、とりわけ、以下の1つ以上を提供する:改善された長さまたは読み取
り、わずかなベースコーリング誤差、データおよび実験品質の良好な評価、および/また
は広範な種々の実験条件下においてデータを呼び出す性能。
【0013】
本発明の種々の局面は、ポリヌクレオチドの分析用装置を較正するための方法に関する
。種々の実施形態において、このような方法は、以下の工程を包含する:
(i)この装置の細長分離チャネルに、(a)サンプル、および(b)内部標準を提供
する工程であって、このサンプルは、未知のヌクレオチド配列の複数の分析物ポリヌクレ
オチドフラグメントを含み、これらの各々は、第1の蛍光標識、第2の蛍光標識、第3の
蛍光標識または第4の蛍光標識に結合し、そしてこの内部標準は、未知のヌクレオチド長
の複数のポリヌクレオチドフラグメントを含み、これらの各々は、第5の(5番目の)蛍
光標識に結合し;ここで、この第1の蛍光標識、第2の蛍光標識、第3の蛍光標識および
第4の蛍光標識は、サンプル中に存在しており、そしてさらにここで、この第1の蛍光標
識、第2の蛍光標識、第3の蛍光標識、第4の蛍光標識および第5の蛍光標識は、スペク
トルによって互いに識別可能である、工程;
(ii)これらのポリヌクレオチドフラグメントを電気泳動によって分離する工程;
(iii)(a)この装置の検出領域に沿って通過する場合、この分離しているポリヌ
クレオチドフラグメントまたは分離したポリヌクレオチドフラグメントの標識から、蛍光
発光を誘導する工程、(b)この誘導された蛍光発光を検出する工程、および(c)この
検出された標識の各々についての蛍光強度痕跡を表わすデータを収集する工程;
(iv)第5の標識に対応する痕跡のピークを位置付ける工程、およびそれらの少なく
とも1つの特徴(ピーク形状およびピーク間間隔の少なくとも1つ)を決定する工程;
(v)この少なくとも1つの特徴に、少なくとも部分的に基づいた較正モデルを作成す
る工程、ならびに第1の標識、第2の標識、第3の標識および第4の標識に対応するピー
クを位置付けて分析する際に、このモデルを適用する工程。
【0014】
種々の実施形態において、このような方法は、未知のヌクレオチド配列の分析物ポリヌ
クレオチドフラグメントに対するベースコールを作製する工程をさらに包含し得る。
【0015】
これらおよび種々の他の実施形態は、以下の説明、図面、および添付の特許請求の範囲
に示される。
よって、 本発明によって以下が提供される:
(1) ポリヌクレオチドの分析のための装置を較正するための方法であって、以下:
(i)該装置の細長分離チャネル中に、(a)未知のヌクレオチド配列の複数の分析物
のポリヌクレオチドフラグメントを含むサンプルであって、該フラグメントの各々は、第
1、第2、第3または第4の蛍光標識と結合する、サンプル、および(b)既知のヌクレ
オチド長の複数のポリヌクレオチドフラグメントを含む内部標準であって、該ポリヌクレ
オチドフラグメントの各々が、第5の蛍光標識と結合する、内部標準、を提供する工程で
あって;ここで該第1、第2、第3および第4の蛍光標識は、該サンプル中に存在し、そ
してさらにここで、該第1、第2、第3、第4および第5の蛍光標識は、互いにスペクト
ル識別可能である、工程;
(ii)該ポリヌクレオチドフラグメントを電気泳動分離する工程;
(iii)(a)分離しているまたは分離されたポリヌクレオチドフラグメントの標識
が該装置の検出ゾーンに沿って通過する場合、該分離しているかまたは分離されたポリヌ
クレオチドフラグメントの標識から蛍光発光を誘発する工程、(b)該誘発された蛍光発
光を検出する工程、および(c)該検出された標識の各々についての蛍光強度トレースを
表すデータを収集する、工程;
(iv)該第5の標識に対応するトレースのピークを位置決めし、ピークの形状および
ピークからピークの間隔のうち少なくとも1つを含む、該ピークの少なくとも1つの特徴
を決定する、工程;ならびに
(v)該少なくとも1つの特徴に少なくとも部分的に基づいて較正モデルを作成し、該
モデルを、該第1、第2、第3および第4の標識に対応するピークの位置決めおよび分析
に適用する、工程、
を包含する、方法。
(2) 項目1に記載の方法であって、前記ピークの形状の特徴が、(a)ピーク高さ、(b
)ピーク幅、および(c)ピーク面積のうちの1つ以上を含む、方法。
(3) 項目1に記載の方法であって、前記分析物のポリヌクレオチドフラグメントのヌクレ
オチド配列が、決定され、該方法は、以下の工程:
(vi)該分析物のポリヌクレオチドフラグメントについてのベースコールを作製する
工程、
をさらに包含する、方法。
(4) ポリヌクレオチド配列分析のための方法であって、以下:
(i)分離チャネル中に、(a)分析のための複数のポリヌクレオチドフラグメントを
含むサンプルであって、該複数のポリヌクレオチドフラグメントの各々が、第1、第2、
第3または第4の検出可能な標識に結合している、サンプル、および(b)複数の既知の
ポリヌクレオチドフラグメントを含む内部標準であって、該複数のポリヌクレオチドフラ
グメントの各々が、少なくとも第5の検出可能な標識に結合している、内部標準、を注入
する工程;
(ii)該サンプルおよび該標準を一緒に、該チャネル中で電気泳動し、それにより該
フラグメントを分離する、工程;
(iii)該分離の間または後に、該標識の全てを検出し、検出された標識を示すデー
タを収集する、工程;
(iv)該少なくとも第5の標識に対応する該収集されたデータのデータに基づいて、
較正モデルを作成する工程;ならびに
(v)該第1、第2、第3および第4の標識に関する該収集されたデータの分析に、該
較正モデルを使用して、該サンプルポリヌクレオチドフラグメントについてのベースコー
ルを作製する工程、
を包含する、方法。
(5) 工程(i)〜(v)が、複数の分離チャネルの各々の中で、実質的に同時に行われる、
項目4に記載の方法。
(6) ポリヌクレオチド配列分析における動的較正のための方法であって、以下:
(i)未知のヌクレオチド配列のポリヌクレオチドサンプルおよび既知のヌクレオチド
長のポリヌクレオチド標準を含む混合物中のヌクレオチド塩基を示す複数の成分シグナル
を含む複合シグナルセットを受信する工程;
(ii)該標準を示す第1のシグナルプロフィールを決定する工程;
(iii)該第1のシグナルプロフィールの少なくとも1つの特性を決定する工程;
(iv)該ポリヌクレオチドサンプルを示す該複合シグナルセットからの1つ以上のさ
らなるシグナルプロフィールを分析するための較正モデルとして、(iii)からの少な
くとも1つの特性を用いる工程;ならびに
(v)第2のサンプルについて工程(i)〜(iv)を繰り返す工程であって、これに
より、前に用いられた較正モデルの代わりに使用するための第2の較正モデルが、作成さ
れる、工程、
を包含する、方法。
(7) 前記複数のシグナルが、少なくとも5つの異なるシグナルを含む、項目6に記載の方
法。
(8) 機械により読み取り可能なプログラム記憶デバイスであって、該デバイスは、該機械に
より実行可能な指示プログラムを具現化し、ポリヌクレオチド配列分析における動的較正
のための方法工程を実行し、該方法工程は、以下の工程:
(i)複数の成分シグナルから構成される複合シグナルセットを受信する工程であって
、該成分シグナルは、未知のヌクレオチド配列のポリヌクレオチドサンプルおよび既知の
ヌクレオチド配列および/またはヌクレオチド長のポリヌクレオチド標準を含む混合物中
のヌクレオチド塩基を示す、工程;
(ii)該標準を示す第1の成分シグナルプロフィールを決定する工程;
(iii)該第1の成分シグナルプロフィールの少なくとも1つの特徴を決定する工程
;ならびに
(iv)該ポリヌクレオチドサンプルを示す1つ以上のさらなる成分シグナルプロフィ
ールを決定および分析するための較正値として、(iii)からの該少なくとも1つの特
徴を用いる工程、を包含する、
デバイス。
(9) 項目8に記載のデバイスであって、工程(i)〜(iv)が、さらなるサンプルにつ
いて繰り返され、それにより、以前に用いられた較正値の代わりに使用するためのさらな
る較正値が生成される、デバイス。
(10) ポリヌクレオチドの配列分析のための方法であって、以下:
(i)複数の成分シグナルから構成される複合シグナルセットを受信する工程であって
、該成分シグナルは、分析のためのポリヌクレオチドサンプルおよび既知の配列および/
または長さのポリヌクレオチド標準を含む混合物中のヌクレオチド塩基を示す、工程;
(ii)該標準に対応する第1の成分シグナルプロフィールを決定する工程;
(iii)該第1の成分シグナルプロフィールのうちの少なくとも1つの特徴を決定す
る工程;
(iv)較正基準として、(iii)からの該少なくとも1つの特徴を使用して、該ポ
リヌクレオチドサンプルに対応する1つ以上のさらなる成分シグナルプロフィールを決定
する、工程;ならびに
(v)該1つ以上のさらなる成分シグナルプロフィールを用いて、該ポリヌクレオチド
サンプルについてのベースコールを作製する工程、
を包含する、方法。
(11) 項目10に記載の方法であって、工程(iii)が、前記第1の成分シグナルプロフ
ィール中のピークを位置決めする工程、および(a)ピーク高さ、(b)ピーク幅、(c
)ピーク面積、および(d)ピークからピークの間隔のうち1つ以上を決定する工程を包
含する、方法。
(12) ポリヌクレオチドの分析のための方法であって、以下:
(i)複数の成分シグナルから構成される複合シグナルセットを受信する工程であって
、該成分シグナルは、未知のヌクレオチド配列の複数の分析物ポリヌクレオチドフラグメ
ントから構成されるサンプル、ならびに既知のヌクレオチド配列および/またはヌクレオ
チド長の複数の基準ポリヌクレオチドフラグメントから構成される内部標準を含む多成分
混合物中のヌクレオチド塩基を示す、工程;
(ii)該基準ポリヌクレオチドフラグメントに対応する第1の成分シグナルを決定す
る工程;
(iii)較正基準として、(ii)からの該第1の成分シグナルを使用し、該分析物
ポリヌクレオチドフラグメントに対応する1つ以上のさらなる成分シグナルを決定する工
程;ならびに
(iv)該分析物ポリヌクレオチドフラグメントについてのベースコールを作製する工
程、
を包含する、方法。
(13) 機械により読み取り可能なプログラム記憶デバイスであって、該デバイスは、該機械に
より実行可能な指示プログラムを具現化し、ポリヌクレオチド配列分析のための方法工程
を実行し、該方法工程は、以下:
(i)複数の成分シグナルから構成される複合シグナルセットを受信する工程であって
、該成分シグナルは、未知のヌクレオチド配列の複数の分析物ポリヌクレオチドフラグメ
ントから構成されるサンプル、ならびに既知のヌクレオチド配列および/またはヌクレオ
チド長の複数の基準ポリヌクレオチドフラグメントから構成される内部標準を含む多成分
混合物中のヌクレオチド塩基を示す、工程;
(ii)該基準ポリヌクレオチドフラグメントに対応する第1の成分シグナルを決定す
る工程;
(iii)較正基準として、(ii)からの該第1の成分シグナルを使用し、該分析物
ポリヌクレオチドフラグメントに対応する1つ以上のさらなる成分シグナルを決定する工
程;ならびに
(iv)該分析物ポリヌクレオチドフラグメントについてのベースコールを作製する工
程、を包含する、
デバイス。
(14) ポリヌクレオチド分析のための較正方法であって、以下:
(i)複数の成分シグナル強度プロフィールから構成されるシグナル強度プロフィール
セットを受信する工程であって、該成分シグナル強度プロフィールが、未知のヌクレオチ
ド配列の蛍光標識されたポリヌクレオチドおよび蛍光標識された基準ポリヌクレオチドを
含む混合物中のヌクレオチド塩基を示し;該シグナル強度プロフィールの各々は、一連の
別個のスキャン点または時点で検出された蛍光発光強度を示す、工程;
(ii)塩基中の、該基準ポリヌクレオチドについてのサイズを含むサイズ規定を受信
する工程;
(iii)該基準ポリヌクレオチドに対応する第1の成分シグナル強度プロフィールを
決定する工程;
(iv)該第1の成分シグナル強度プロフィールにおけるピークを決定する工程;
(v)該サイズ規定におけるそれぞれのサイズに対して、(iv)において決定された
該ピークを相関させる工程;ならびに
(vi)それぞれのスキャン点または時点に対して、該サイズ規定におけるサイズを相
関させる工程、
を包含する、方法。
(15) 項目14に記載の方法であって、以下:
前記未知の配列のポリヌクレオチドの第1の塩基に対応するピークが生じる可能性のあ
るスキャン点または時点を推定する工程、をさらに包含する、方法。
(16) (iv)で決定された前記ピークの少なくとも1つの特徴を決定する工程をさらに包含
する、項目14に記載の方法。
(17) 項目16に記載の方法であって、前記少なくとも1つの特徴が、(a)ピーク高さ、
(b)ピーク幅、(c)ピーク面積、(d)ピークからピークの間隔、および(e)(a
)〜(d)の任意の組合せからなる群から選択される、方法。
(18) 項目17に記載の方法であって、前記未知の配列のポリヌクレオチドに対応する1つ
以上のさらなる成分シグナル強度プロフィールの決定において、前記少なくとも1つの特
徴を用いる工程をさらに包含する、方法。
(19) 前記1つ以上のさらなる成分シグナル強度プロフィールに基づいて、ベースコールを作
製する工程をさらに包含する、項目18に記載の方法。
(20) 機械により読み取り可能なプログラム記憶デバイスであって、該デバイスは、該機械に
より実行可能な指示プログラムを具現化し、ポリヌクレオチド配列分析のための方法工程
を実行し、該方法工程は、以下の工程:
(i)複数の成分シグナル強度プロフィールから構成される複合シグナル強度プロフィ
ールを受信する工程であって、該成分シグナル強度プロフィールは、未知のヌクレオチド
配列の蛍光標識されたポリヌクレオチドおよび蛍光標識された基準ポリヌクレオチドを含
む混合物中のヌクレオチド塩基を示し;該シグナル強度プロフィールの各々は、一連の別
個のスキャン点または時点において検出された蛍光発光強度を示す、工程;
(ii)塩基中の、該基準ポリヌクレオチドについてのサイズを含むサイズ規定を受信
する工程;
(iii)該基準ポリヌクレオチドを示す第1の成分シグナル強度プロフィールを決定
する工程;
(iv)該第1の成分シグナル強度プロフィールにおけるピークを決定する工程;
(v)該サイズ規定におけるそれぞれのサイズに対して、(iv)において決定された
該ピークを相関させる工程;ならびに
(vi)それぞれのスキャン点または時点に対して、該サイズ規定におけるサイズを相
関させる工程、を包含する、
デバイス。
(21) 項目20に記載のデバイスであって、前記方法工程が、以下:
前記未知の配列のポリヌクレオチドの第1の塩基に対応するピークが生じる可能性のあ
るスキャン点または時点を推定する工程、をさらに包含する、デバイス。
(22) 項目20に記載のデバイスであって、前記方法工程が、以下:
(iv)で決定された前記ピークの少なくとも1つの特徴を決定する工程、をさらに包
含する、デバイス。
(23) 項目22に記載のデバイスであって、前記方法工程が、以下:
前記未知の配列のポリヌクレオチドを示す1つ以上のさらなる成分シグナル強度プロフ
ィールの決定において、前記少なくとも1つの特徴を用いる工程、をさらに包含する、デ
バイス。
(24) 項目23に記載のデバイスであって、前記方法工程が、以下:
前記未知の配列のポリヌクレオチドについてのベースコールを作製する工程、をさらに
包含する、デバイス。
(25) 配列分析のためのポリヌクレオチドサンプルを含む、内部較正標準として使用するため
のポリヌクレオチド混合物であって、以下:
(i)既知の長さの蛍光標識したポリヌクレオチドの第1のセットであって、該ポリヌ
クレオチドは、電気泳動の際にラダーを形成するように構成されており、該第1のセット
は、短いポリヌクレオチド、長いポリヌクレオチドおよび該短いポリヌクレオチドおよび
長いポリヌクレオチドに対して中間の長さの複数のポリヌクレオチドを含み;ここで該第
1のセットの該中間のポリヌクレオチドおよび長いポリヌクレオチドの長さが、(a)該
短いポリヌクレオチドの正の整数の倍数、または(b)該短いポリヌクレオチドの正の整
数の倍数+定数である、第1のセット;ならびに
(ii)既知の長さの蛍光標識されたポリヌクレオチドの第2のセットであって、該ポ
リヌクレオチドは、電気泳動の際に同定可能なサインを形成するように構成されており、
該第2のセットのポリヌクレオチドは、該第1のセットのポリヌクレオチドの長さとは異
なる長さを有する、第2のセット、
を含む、混合物。
(26) 項目25に記載の混合物であって、前記ポリヌクレオチドの第1および第2のセット
が、該混合物の全ポリヌクレオチド内容物の実質的に全てを構成する、混合物。
(27) 項目25に記載の混合物であって、前記ポリヌクレオチドの第1のセットが、前記短
いポリヌクレオチドよりも短いフラグメントを含み;前記定数が、塩基において、該短い
フラグメントの長さと等しい整数である、混合物。
(28) 配列分析のためのヌクレオチドサンプルであって、該サンプルは、1つ以上の未知の配
列の蛍光標識されたポリヌクレオチドを含み、項目25に記載のポリヌクレオチド混合
物と混合され;ここで、前記ポリヌクレオチドの第1および第2のセットの蛍光標識が、
該配列分析のためのポリヌクレオチドサンプルの蛍光標識からスペクトル識別される、サ
ンプル。
(29) 配列分析のためのポリヌクレオチドサンプルを含む、内部較正標準として使用するため
のポリヌクレオチド混合物であって、以下:
(i)電気泳動の際にポリヌクレオチドラダーを形成するように構成された蛍光標識さ
れたポリヌクレオチドの第1のセット;
(ii)該第1のセットと共に電気泳動された際に同定可能なサインを形成するように
構成された蛍光標識されたポリヌクレオチドの第2のセットであって、該第2のセットは
、種々の長さの複数のポリヌクレオチドから構成され、該長さは、(i)で規定された該
ポリヌクレオチドの長さとは等しくない、第2のセット、
を含む、混合物。
(30) 前記第1および第2のセットのポリヌクレオチドが、同じ蛍光標識を有する、項目2
9に記載の混合物。
(31) ポリヌクレオチド分析における誤差を決定するための方法であって、該方法は、以下:
(i)1つ以上の配列決定反応の誤差の非存在下で、配列決定サンプルの各々が未知の
ヌクレオチド配列の複数の分析物ポリヌクレオチドフラグメントを含むことが推定される
ような様式で、該複数の配列決定サンプルを生成する工程であって、ここで該分析物ポリ
ヌクレオチドフラグメントは、第1、第2、第3または第4の蛍光標識と結合している、
工程;
(ii)該配列決定サンプルの各々を内部標準と組み合わせ、それにより複数のそれぞ
れのサンプル混合物を形成する工程であって、ここで該内部標準は、既知のヌクレオチド
長の1つ以上のポリヌクレオチドフラグメントを含み、該1つ以上のポリヌクレオチドフ
ラグメントの各々は、第5の蛍光標識と結合しており、さらにここで、該第1、第2、第
3、第4および第5の蛍光標識は、互いにスペクトル識別可能である、工程;
(iii)該サンプル混合物の各々を、マルチレーン電気泳動装置のそれぞれの分離レ
ーンに充填する工程;
(iv)該サンプル混合物の各々を、そのそれぞれのレーンを下向きに、その検出ゾー
ンに沿って移動させるのに十分な電気泳動力を適用する工程;
(v)(a)分離しているポリヌクレオチドフラグメントまたは分離されたポリヌクレ
オチドフラグメントが該検出ゾーンを通過する場合に、該分離しているポリヌクレオチド
フラグメントまたは分離されたポリヌクレオチドフラグメントの標識から蛍光発光を誘発
するのに十分な励起放射線を、該検出ゾーンに向かって方向付ける工程、(b)誘発され
た蛍光発光について検出する工程、および(c)該検出された標識の各々の蛍光強度トレ
ースを示すデータを収集する工程;
(vi)該サンプル混合物の各々について、該第5の標識に対応するトレースと、該第
1、第2、第3および第4の標識についてのトレースとを比較する工程;ならびに
(vii)少なくとも部分的に、工程(vi)の該比較に基づいて、前の工程の1つ以
上において誤差が生じたか否かを決定する工程、
を包含する、方法。
(32) 項目31に記載の方法であって、工程(vi)の前記比較が、前記サンプル混合物の
各々についての少なくとも1つのトレースと、前記サンプル混合物の他の少なくとも1つ
に対応する少なくとも1つのトレースとを比較する工程をさらに包含する、方法。
(33) 項目31に記載の方法であって、少なくとも部分的に、工程(vi)の前記比較に基
づいて、誤差が生じたと決定された場合、該誤差が生じた工程を決定する工程をさらに包
含する、方法。
(34) 項目33に記載の方法であって、決定された誤差が生じた工程を決定する前記工程が
、以下の判定:(i)(a)前記第5の標識が、第1の選択された閾値より上のレベルで
検出された場合、および(b)前記第1、第2、第3および第4の標識が、検出されない
かまたは少なくとも第2の選択された閾値より下のレベルで検出された場合、誤差は、前
記生成工程で生じたとみなされること;および(ii)(a)該第5の標識が検出されな
いかまたは第1の選択された閾値より下のレベルで検出される場合、および(b)該第1
、第2、第3および第4の標識が、検出されないかまたは少なくとも第2の選択された閾
値より下のレベルで検出される場合、誤差は前記充填工程で生じたとみなされること、の
少なくとも1つを含む理論の使用を包含する、方法。
(35) 項目34に記載の方法であって、前記選択された閾値が、少なくとも部分的に、前記
サンプル混合物の少なくとも1つについての少なくとも1つのトレースと、前記サンプル
混合物の他の少なくとも1つに対応する少なくとも1つのトレースとを比較することによ
って、決定される、方法。
(36) 項目34に記載の方法であって、前記理論が、以下の判定:(a)前記第1、第2、
第3または第4の標識、および(b)前記第5の標識の一方が、少なくとも1つの選択さ
れた閾値より上のレベルで検出されるが、(a)および(b)の他方が、検出されないか
少なくとも1つの他の選択された閾値より下のレベルで検出される場合、誤差は、前記組
合せ工程で生じたとみなされること、をさらに含む、方法。
(37) 項目34に記載の方法であって、前記理論が、以下の判定:(a)前記第1、第2、
第3または第4の標識、および(b)前記第5の標識の両方が、少なくとも1つの選択さ
れた閾値より上のレベルで検出されるが、他のサンプル混合物の少なくとも1つのこのよ
うなトレースと比較すると、時間的に遅れる場合、誤差は、前記レーンまたはそれぞれの
レーンの充填領域、あるいはサンプル純度に関与する工程で生じたとみなされること、を
さらに含む、方法。
(38) マルチレーン電気泳動機器を使用してポリヌクレオチド分析におけるシグナルクロスト
ークを決定するための方法であって、以下:
(i)複数の配列決定サンプルを内部標準と組み合わせて、複数のサンプル混合物を形
成する工程であって;ここで該配列決定サンプルの各々は、未知のヌクレオチド配列の複
数の分析物ポリヌクレオチドフラグメントを含み、該分析物ポリヌクレオチドフラグメン
トは、第1、第2、第3または第4の蛍光標識と結合し;そして該内部標準は、既知のヌ
クレオチド長の1つ以上のポリヌクレオチドフラグメントを含み、該1つ以上のポリヌク
レオチドフラグメントの各々は、第5の蛍光標識と結合し;さらにここで、該第1、第2
、第3、第4および第5の蛍光標識は、互いにスペクトル識別可能である、工程;
(ii)該機器のそれぞれの分離レーンに、該サンプル混合物を充填する工程;
(iii)該サンプル混合物の各々を、そのそれぞれのレーンを下向きに、その検出ゾ
ーンに沿って移動させるのに十分な電気泳動力を適用する工程;
(iv)分離しているポリヌクレオチドフラグメントまたは分離されたポリヌクレオチ
ドフラグメントが該検出ゾーンを通過する場合に、該分離しているポリヌクレオチドフラ
グメントまたは分離されたポリヌクレオチドフラグメントの標識から蛍光発光を誘発する
のに十分な励起放射線を、該検出ゾーンに向かって方向付ける工程、(b)誘発された蛍
光発光について検出する工程、および(c)該検出された標識の各々の蛍光強度トレース
(蛍光強度 対 時間)を示すデータを収集する工程;
(v)少なくとも2つの隣接するレーンの1つ以上の時点について、第5の標識のシグ
ナルの量を算出する工程;ならびに
(vi)工程(v)の結果を使用して、クロストーク値を決定する工程、
を包含する、方法。
(39) 項目38に記載の方法であって、前記クロストークが、x/yを含む比として決定さ
れ、ここでyは、選択されたサンプルレーンにおける前記第5の標識のシグナルであり、
xは、隣接するレーンにおける該第5の標識のシグナルである、方法。
(40) 項目38に記載の方法であって、前記クロストーク値が、前記第1、第2、第3およ
び第4の標識シグナルから独立して決定される、方法。
(41) 電気泳動装置を使用して、ポリヌクレオチド分析物の分解能を決定するための方法であ
って、以下:
(i)1つ以上の配列決定サンプルを内部標準と組み合わせて、1つ以上のそれぞれの
サンプル混合物を形成する工程であって;該配列決定サンプルの各々は、未知のヌクレオ
チド配列の複数の分析物ポリヌクレオチドフラグメントを含み、該分析物ポリヌクレオチ
ドフラグメントは、第1、第2、第3または第4の蛍光標識と結合し;ここで該内部標準
は、既知のヌクレオチド長の1つ以上のポリヌクレオチドフラグメントを含み、該1つ以
上のポリヌクレオチドフラグメントの各々は、第5の蛍光標識と結合し;さらにここで、
該第1、第2、第3、第4および第5の蛍光標識は、互いにスペクトル識別可能である、
工程;
(ii)該サンプル混合物を、該装置のそれぞれの分離レーンに充填する工程;
(iii)該サンプル混合物の各々を、そのそれぞれのレーンを下向きに、その検出ゾ
ーンに沿って移動させるのに十分な電気泳動力を適用する工程;
(iv)分離しているポリヌクレオチドフラグメントまたは分離されたポリヌクレオチ
ドフラグメントが該検出ゾーンを通過する場合に、該分離しているポリヌクレオチドフラ
グメントまたは分離されたポリヌクレオチドフラグメントの標識から蛍光発光を誘発する
のに十分な励起放射線を、該検出ゾーンに向かって方向付ける工程、(b)誘発された蛍
光発光について検出する工程、および(c)該検出された標識の各々の蛍光強度トレース
を示すデータを収集する工程;
(v)各サンプル混合物について、該第5の標識のトレースのピークを決定し、そして
ピークの位置およびピークの半値幅を決定する工程;
(vi)工程(v)の該検出されたピークについてのピークからピークの距離を決定す
る工程;ならびに
(vii)工程(v)および(vi)からの結果を使用して、分解能値を算出する工程

を包含する方法。
(42) 1つ以上の電気泳動装置を使用して、ポリヌクレオチド分析実験間を標準化するための
方法であって、以下:
(A)実験を実施する工程であって、以下:
(i)検出可能な標識の第1のセットを有する複数の分析物ポリヌクレオチドフラグ
メントを含む配列決定反応サンプル、および(b)第5の色素標識を有する既知量の1つ
以上のポリヌクレオチドフラグメントを含む内部標準、を含むサンプル混合物を形成する
こと;
(ii)該サンプル混合物を電気泳動し、該標識の第1のセットおよび該第5の色素
標識からのシグナルを収集し、そして選択されたウインドウにわたって各々の合計を算出
すること;および
(iii)第1の標識セットのシグナル 対 第5の色素シグナルの比を算出するこ
と、
を包含する、工程、
を包含する、方法。
(43) 項目42に記載の方法であって、以下:
(B)第2の実験を実施する工程であって、第2の配列決定反応サンプルを使用する工
程(A)(i)〜(iii)を包含する、工程であって;それにより第1の標識セットの
シグナル 対 第5の色素シグナルの第2の比が、算出される、工程;および
(A)および(B)からの比を使用し、前記実験の間の配列決定反応サンプルの相対量
を決定する工程、をさらに包含する、方法。
(44) 項目43に記載の方法であって、前記電気泳動装置が、マルチレーン電気泳動機器で
あり、前記実験が、該機器の異なるレーンにおいて実質的に同時に行われる、方法。
(45) 項目44に記載の方法であって、前記(A)の実験が、1つの電気泳動機器で行われ
、前記(B)の実験が、第2の電気泳動機器で行われる、方法。
【発明を実施するための最良の形態】
【0016】
(種々の実施形態の記載)
種々の実施形態に対して、参照がなされ、この例は、添付の図面において例示される。
本発明の教示は、種々の実施形態とともに記載されているが、それらは、本発明の教示を
それらの実施形態に対して制限することを意図しないことが理解される。対照的に、本発
明の教示は、当業者によって理解されるような、種々の代替物、改変物、および等価物を
包含することが意図される。
【0017】
現代のシーケンサー(例えば、ABI Prism(登録商標)3700、3100お
よび377 DNA Analyzer:Applied Biosystems製(F
oster City,CA))の高度に進化した検出器性能を用いると、DNA配列決
定およびフラグメント分析に代表的に使用される、4色の検出スキームにもはや制限され
ない。従って、異なる色素または「第5」の色素で標識される標準は、サンプルと同じ分
離レーンに加えられ得、そして配列決定またはサイズ決定のために現在使用されている基
礎的な4つとともに検出され得る。次いで、これらの「内部」標準は、追跡、シグナル分
析、および/またはサイズ決定機能などのために使用され得る。種々の実施形態において
、本明細書中に提供されるような内部標準は、標識分子(例えば、既知のサイズのポリヌ
クレオチドフラグメント)のセットを含み、これを使用して、所定の分離時間間隔内で見
出される塩基の数、およびゲルの領域についてのより正確なピーク形状モデル(レーンお
よび移動時間)を推定し得る。
【0018】
本記載の大部分は、キャピラリーベースのシステムの文脈において、第5色素標準に焦
点を合わせているが、同様に、スラブゲルベースのデバイスが本発明の教示を組み込み得
ることが理解されるべきである。また、本記載の大部分は、同時に第5の標準の使用を記
載しているが、1レーンあたり1つより多い余分な色素(例えば、第6の色素、第7の色
素、またはそれより多い)を使用するのに、固有の制限がないことが理解されるべきであ
り、最終的な数は、主に、利用可能な色素のプロセスの必要性およびスペクトル分離に依
存する。
【0019】
(配列決定/マッピング/対立遺伝子検出の関係)
本発明の教示は、内部標準の配列決定レーン(キャピラリー、チャネル、ゲルトラック
)に封入物を提供し、この内部標準は、基礎となるシグナルのより正確なモデルを可能に
し、基準ピークのより正確な逆重畳を可能にする。この標準は、例えば、以下の1つ以上
を提供し得る:
・どれだけの塩基が所定の分離間隔内にあるべきかを決定するための間隔曲線;
・レーン/キャピラリー/トラックおよび実験特異的ピーク形状モデル(例えば、サン
プルデータの逆重畳のため);
・全シグナル、ピーク形状および標準ピーク間のベースラインを使用する、より正確な
ベースライン予測;
・較正されたピーク形状およびベースラインを使用する、ピークと実験との間、および
混合された塩基(例えば、ヘテロ接合体)分析における、より正確な相対的な定量化の推
定;
・移動度補正のための較正;
・開始点(すなわち、塩基1)インジケータ;
・バーコード様サンプル/実験追跡標識;
・サンプルの充填およびデバイスの状態についての、品質評価(QA)インジケータ;
ならびに/または、
・正規化標準および定量化標準。
【0020】
種々の実施形態において、標準は、既知のセットの分子を含み、この分子は、配列決定
および/またはフラグメントサイズ決定のために使用される4色セットからスペクトルに
よって区別される蛍光を用いて標識される。特定の実施形態において、本発明の教示に従
う標準は、配列決定−標識DNAフラグメントの様式を模範し得る様式で、移動可能であ
り、検出の際に類似のピーク形状を提供する。本明細書中の教示に従う標準は、例えば、
標識配列反応またはサイズ決定実験の1つ以上のレーンに充填され、余分な色素または第
5の色素の色データは、従来の4色セットとともに、このようなレーンに戻される。第5
の色標準によって提供される情報を使用して、ピーク形状、ベースライン、移動度、相対
的移動度、および/または相対的なサンプル品質のためのモデルは、各レーンおよび操作
条件の組み合わせについて特有に構成され得る。このようなモデルは、先行技術方法を超
える多数の利点(絶対的により長い読み出し長さ性能だけでなく、それらがより高速のゲ
ルのゲル分解能を低下させるように補正し得る場合、匹敵する読み出し長さのための高速
な操作時間を含む)の実現を可能にする。このハイブリッドアプローチは、配列決定の(
最終データの)正味のスループットをかなり増加させ、最終塩基あたりのコストを低下さ
せ、そしてさらなるユーザがアクセス可能な配列決定を実行し得る。また、良好なシグナ
ルモデルは、品質値評価およびヘテロ接合性区別におけるより高い精度のために、より正
確なビニング(binning)機能を可能にする(la TraceTunerTM
Paracel;Pasadena,CA)。特定の標準および特定のレーンに送達され
るべき量を認識するのに、実験プロセスおよび機械状態のQAが、追跡される。
【0021】
本発明の教示は、かなり多数の環境での使用を見出し得る;例えば、非常に高スループ
ットのグループ、作業を完了するための長期読み取りに関与し、高い「正確さ(accu
rabcy)」および「精度(precision)」が必要である調節された環境(ス
クリーニングおよび診断)に関与し、そして発見または診断のための混合された配列決定
ストラテジーに関する。
【0022】
レーンの追跡は、通常、キャピラリー機器を必要としないが、ゲルベースのシステムの
巨大な接地されたベースがなお存在する(例えば、ABIPrism(登録商標)377
(Applied Biosystems;Foster City,CA)。有利には
、第5の染色標準は、より良好なレーン区分を提供し得、従って、追跡する(すなわち、
それが検出器の前を移動する際に、単一サンプルのフラグメントを追跡し、そして単離す
る)。これは、順に、より高密度なサンプルの充填を促進し得、面倒な手動の再追跡を排
除し、そして乏しいサンプル対レーンの基準に起因して、一般的に、ゲル機械上で小さい
値である様々な配列決定モデル(例えば、同じクローンの両端からの配列決定)が可能で
ある。(欠損ウェルなどからの)異常なレーンを補正するか、またはバンドの異常が解像
度を歪めないような追跡に対する単一(最良)点をちょうど選ぶいずれかの方法をまた提
供し得る。レーンの密度が増加するので、これは、オーバーラップするシグナルのシグナ
ル分解が減少するのを助け得る。本発明の1つの実施形態は、隣接するレーン(少なくと
も2つの交互)または時差充填における異なる標準フラグメント対を使用する。この適用
を使用して、単一ゲル上で分離され得るレーンの数は、劇的に増加し得る。
【0023】
レーン追跡(tracking)は、代表的に、キャピラリーシステムに対してほとん
ど関連性を有さないが、差次的な標準は実際に、テンプレート/反応セットの追跡につい
て関係する。基本的なテンプレート標識化は、結果の誤標識を除外することによって、大
規模指向性の配列決定ストラテジーまたは二重末端配列決定ストラテジーを、大いに容易
にし得る。次いで、この標識化は下流のアセンブリプログラムについての要求を低減し、
さらにプロジェクトが重要性を有する前に行われるべき配列の量を低減する。このことは
また、クローン同定が重要である、スクリーニング適用、診断的適用および法医学的適用
において、より高い保証性を提供する。例えば、1組の5番目の色素で標識化されたサイ
ズ化フラグメントは、全てのテンプレートサンプルをコードする、完全な32ビット(ま
たはそれより大きい)バーを提供し得る。1つの実施形態において、バーコードがウェル
に予め添加されたマイクロタイタープレートが製造される。このようなバーコードは、異
なる研究室の間でさえ、唯一のサンプル識別を保証するのに役立ち得る。これは、特に、
医療サンプルの維持において有用であり得る。
【0024】
このようなサンプルのタグ化は、サンプルの物理学的マッピングにおける使用もまた見
出し得る。例えば、初期のテンプレートレベルでのタグの付加は、クローンのフットプリ
ンティングの調製、およびその後の配列決定(マップされた低パス配列決定のストラテジ
ー)を容易にし得る。サンプルIDがサブクローンをマッピングするプロジェクトに対し
てさらに困難である可能性がある(これらは、サブクローニングして配列決定のために選
別する追跡(tracing)のために、ハイスループット方法および高度に自動化され
た方法を必要とする)ことが注目され得る。本明細書中に記載される、統合されたサイズ
化標準物は、サイズ化に対して、現在のGeneScan(登録商標)(Applied
Biosystems;Foster City,CA)方法が提供する増強と同じ増
強を提供し得るが、より大きいスループットを提供する(サンプル/レーン)。また、本
発明によって可能とされる、(修正、逆重畳積分、などのために)シグナルをよりよく理
解する能力は、任意のサイズ化プロセス、特に、より大きなクローンのSTRマッピング
およびII型酵素マッピングのより乱雑なピークデータに、まさしく有用であり得る。
【0025】
第5の色素系の1つの重要な含意は、第5の色素系がプロトコールおよび泳動条件を改
変および改善するために提供する柔軟性である。各新たなマトリックス、色素セットまた
は分離時間についての塩基呼び出し(base calling)ソフトウェアを微調整
すること、保持することおよび/または再較正は、かなり最小化または排除され得る。本
発明での使用に好ましいソフトウェアは、含まれる任意の新しい内部標準を本質的に使用
するために適応される。このソフトウェアは、好ましくは泳動時間パラメータとして、検
索するための色、検索するためのフラグメントパターン、そのパターンに関連させるサイ
ズ、ピーク形状変換機能および任意の組成物特異的な標準化因数(以下で考察される)を
持つように構成される。その上、標準の登録は、別の含意を有する。標準の登録は、サン
プルの第1の塩基位置をよりうまく算出するために使用され得る。これは、より正確かつ
より長い初期の読み取りを可能にするだけではなく、排除、分類などのために、主なベク
ターまたはタグ配列のよりよい同定を促進する。
【0026】
よりよいピーク形状およびベースラインのモデル(本発明によって理解され得る)は、
混合された配列決定の必要性(相対的頻度測定)に決定的な相対的定量化にかなり役立ち
得る。これは、SNP頻度の解析および掘り出し(mining)ならびに診断(体細胞
性の変動について)のいずれにおいても有用であり得る。
【0027】
(技術的含意)
色素(標識)特性:
配列決定に慣習的に使用される4つの色素は、便利な励起振動数(多重光源または非レ
ーザー光源が使用されない限り、通常は4つの色素に共通の振動数)のための要件、それ
らの発光振動数において十分な分離と、シグナル強度と、類似のサイズ/移動度プロフィ
ールと、酵素適合性と、配列特異的な色素の相互作用(移動度の差異に影響する)と製造
可能性(manufacturability)との間での譲歩を表す。任意の新たな第
5の色素は、全てのこれらの関係から免除されないが、それらの要件は、一般に非常に限
定的である。
【0028】
その励起振動数は、好ましくは従来の対(共通のレーザーを与えられる)と同じ範囲内
であるが、発光振動数は、好ましくは配列決定色素からうまく除外される。このことは、
配列決定色素についても同様に好ましいが、第5の色素は、移動度が一致するようには制
約されない。従って、この選択は、この分離を強調し得る。このことは、実際に全シグナ
ル中で最良のノイズプロフィールを維持するために特に重要であり得る。相対的移動度は
、合理的にのみ類似していなければならない(多重の塩基によって離され得る)。移動が
一貫しており、そして予測可能であることだけが重要である。
【0029】
(標識分子特性:)
第5の色素試薬で標識される分子の望ましい特徴は、標識されるセットの意図される使
用に少なくとも一部依存する。本明細書中の実施形態に企図されるように、(標識剤とい
かに相互作用するかとともに)標識される分子の2つの主要な特徴は、一致した結果を生
じること、および最も少ない分子がロードされ得る一方で、代表的なピーク挙動を維持す
ることである(形状は、好ましくは、類似のサイズの配列フラグメントとおよそ同じであ
る)。特定の実施形態が、ネスト化したセットのDNAフラグメントを標識することが少
なくとも最初には容易であることを企図するものの、使用される分子に固有の制限はない
。例えば、レーンおよびサンプル追跡は、実際の形状もサイズの要件も有さず、一致した
バンド形成のみを要件として有する。また、第5の色素に加えて、本発明は、スペクトル
分解が提供される限り、第6(またはそれ以上)の使用を企図する。シグナル分析および
サンプル追跡は、組み合わせた機能を有する必要はない。フラグメントは、妥協した移動
度一貫性を有さないでシグナルが改善される場合、複数の色素で標識され得る。ピーク形
状は、そのサイズのサンプルフラグメントが見える場所に予測可能にマッピングされる限
り、類似のサイズのサンプルフラグメントと同一である必要はない。ピーク形状間にマッ
ピングするこの能力は、多数の較正配列を実行する必要なく、新規なプロトコルに対して
信頼のある値の測定を推測するために有用であり得る。
【0030】
本明細書中の特定の実施形態は、第5の色素標識DNAフラグメントの使用を企図する
。DNAベースのラダーの例(本発明によって企図される)は、以下の特性のうちの1つ
以上を含み得る:
・既知の標準(例えば、Tラダー)の単一塩基配列決定反応;
・既知の長さのセットのPCRフラグメント(1つの実施形態において、一連の非関連
配列とは反対に、共通末端(common end)でネストされたセット);
・細菌により増幅されたクローン挿入物−例えば、セットのS1ヌクレアーゼ産物;
・ラダーを生成するように自己連結された粘着性末端を有する単一オリゴ;
・2分子構造の特定の特性、標識の容易化、製造性、移動度一貫性、組成などについて
設計されたセットの完全合成ネスト化配列。
【0031】
上記の任意が、容易に標識化され得る既知のそれぞれのサイズのセットのDNAフラグ
メントを提供し得る。ラダーの横木(rung)間のサイズの違いが一致する(同じであ
る)ことは重要ではない。実際、いくらの不一致は、ベースカラーに提供されるサイズ情
報を用いてフラグメントデータを記載するには有用であり得る。しかし、同じ配列の増分
を構成するラダーの一貫性は、魅力的であり得る(連結ラダーモデル)。同じ長さの配列
および同じ標識が、配列特異的移動の問題(ピリミジンリッチな配列は、プリンリッチな
配列よりも速く移動する傾向がある)に起因して、わずかに異なって移動し得るので、増
分の配列は、「平均」配列を反映するように選択され得る。補正因子は、標準フラグメン
トに対してその領域での推定ベース組成物に依存して、2つの標準的な点間でベースの数
を推定する場合、ベースカラーに含まれ得る。標準配列は、好ましくは、異常な予測不可
能な局所フラグメント移動度を導く2次構造の問題を避けるかまたは最小化するように設
計される。
【0032】
本発明とともに使用可能な標識化技術は、例えば、色素標識化ターミネーターを用いる
単一塩基伸長、増幅スキームにおける標識プライマーの使用または任意の連結方法におけ
る標識末端フラグメントの直接的組み込みのいくつかの形態であり得る。選択される特定
の方法は、標識の容易さ、フラグメント生成の容易さ、および異なる標識(ターミネータ
ーまたはプライマー)がピーク形状モデル化のために有する意味の間のバランスを反映す
る。
【0033】
種々の実施形態に従って、標識化標準分子が、サイズ決めされるフラグメントに対して
直接的な類似の移動曲線を提供するように設計および/または選択される。種々の実施形
態が、実際の配列決定またはサイズ反応標識化に類似の標識化を利用することによって、
最も良いシグナルモデルを達成する。例えば、大部分の配列決定が、標識化ターミネータ
ーを用いてなされる。標準フラグメント(本発明に従う)は、同じ方法で標識化され得る
。これは、サンプルと標識の配列特異的相互作用の性質によって複雑になり得;標識され
たプラマーは全て、色素の隣に同じ局所配列を有し、一方ターミネーター標識は、通常、
異なる局所配列に隣接する。本明細書中の実施形態に提供されるように、標準DNAフラ
グメントは、この問題を最小化するために、同じ局所末端配列を有するように設計され得
る(例えば、連結ラダーモデル、あるいは連結ラダーまたはカスタム設計の最もランダム
な配列(ジデオキシ配列決定反応において使用される標識されるべき塩基に隣接する短い
共通エレメントを有する)から作製されるクローン)。
【0034】
種々の実施形態に従って、費用を減少し、そしてロードする容積および過剰ロードする
歪みに起因して分解能を低下させないために、できるだけ少ない標準がロードされるが、
代表的なピーク特徴を提供するには十分にロードされる。標準の実際のピークサイズは、
配列決定ピークより有意に少なくあり得、スペクトル分離が改善するように多い。なぜな
ら、ベースカラーは、何を探し、基本的にどこに見えるかを知り得るからである。従って
、多くの場合において、規則的な配列反応ロードのモル量の10分の1ほどの少なさで、
十分であり、いくらかの場合、より少ない。使用者が反応混合物を希釈するので、絶対的
なシグナルは、問題になり得、含まれるべきより多くの標準を必要とすることが注意され
る。ラダー分子が正常な色素/配列フラグメントセットの移動度のオフセットを正確に反
映し得る必要がない(重要であるのは、フラグメントの絶対的なサイズではなく、フラグ
メント間の相対的な差異である)ので、多くの標識フラグメントが、より少ない標準がロ
ードされ得るように、シグナル強度を増加するために使用され得る。
【0035】
(ラダー密度)
本発明の実施形態において、本発明の好ましいラダーは、それらの長さ範囲にわたって
完全に分離した(明確なベースライン)ピークを提供するが、レーン当たりの移動度(移
動度 対 ゲルランタイム)プロフィールの生成のために第5の色素標識フラグメントの
十分な分離を提供するために、それ以下を有することが必要である。このようなラダーが
実験的に決定され得る。1つの実施形態において、10〜50のオーダー(例えば、16
、18または20)のラダーが使用される。ラダーが規則的である必要はない(すなわち
、第1の数百ほどの塩基が、50塩基毎の密度を有し得、後者のサイズは、10により近
くあり得る)ことが理解されるべきである。また、たとえラダーが多かれ少なかれ規則的
であるとしても、マーカーピーク位置間の差異は、正確に同じである必要はなく、ただ正
確に知られればよい。実際いくらかの不規則性が、ある絶対的なサイズ標準に対してデー
タを記録する場合、有用性を提供し得る。また、より多くのフラグメントを有することは
、それぞれが使用されなければないことを意味しない。例えば、移動の平均は、セットの
2つの間隔マーカーの重なりを使用することによって計算され得る。選択は、現在の実験
的必要性に最も適合する標準からなされ得る。
【0036】
実際に、実際の標準サイズDNA分子がない(同じ数の塩基を有する2つのフラグメン
トが、組成の違いおよび色素自身との配列特異的相互作用のため、依然として異なって移
動する−ときどき劇的に−)ので、局所組成の極度について調節し、そして試験すること
が望ましくあり得る。1つの実施形態は、移動平均が使用され得るように、ラダーの密度
(所定のロードおよび製造性の要件)を最大化することが好ましいことを提供する。より
長い間隔およびより短い間隔の両方が、ある領域において探されるべき塩基の推定の数を
計算する場合に、適用され得る。例えば、これは、未知のデータについて最良の「平均」
間隔曲線を得るために10塩基の距離および50塩基の差異の両方を提供するために、1
0塩基ラダーを使用することを含み得る。これは、例えば、標準の間隔配列が異なった場
合、有用である。
【0037】
(シグナル補正)
特定の実施形態において、使用される標準色素は、配列決定色素の発光シグナルとそれ
自身との間で最大の区別を提供するように選択される。これは、例えば、そのシグナルの
最良のIDを提供するため、そして複数の成分の分析において固有のノイズを減少させる
ために有用であり得る。これは、真実のシグナル特性およびベースラインについてのより
良い特徴付けのためのツールを提供し得る。シグナルは、好ましくは、真実のサンプルシ
グナルを表すピーク形状を提供するように十分大きい。異なる実験条件下での標準的な実
施はまた、新たな試験されてない条件についての構成(学習)モデルを提供し得る。1つ
以上の独立した実験由来の構成モデルが実施され、そしてこれらの新たな実験に含まれる
第5の色素なしでさえ、類似の実験のためにモデルを提供するために使用され得る。
【0038】
第5の色素ピークが、配列決定フラグメントと正確に同じ形状を与える必要はないこと
が注意されるべきである。しかし、これらは、好ましくは、適切な外挿を行うには十分な
一貫性が存在する。この変換を行い得ることはまた、まだ訓練されていない新規な条件下
で、第5のピークデータ実行を使用して予期される実験ピーク形状を予測するための方法
を提供する。これは、劇的に(同じ「実施」の間)なされ得るか、または有用性およびプ
ロセスが、新規なプロトコルを用いて実施される既知の配列からの正確なデータ(例えば
、ベクター配列のT反応)に提供され得、そのプロトコル下での実際の実験の実施におい
て使用のために内部標準に形状−参照モデルをマップする。
【0039】
(平坦なゲルシステムの使用)
スラブゲルベースシステムについて、特定のレーンの移動プロファイルを決定する際に
、ソフトウェアがゲル幅情報(すなわち、解釈される個々のレーンのデータから分離され
た他のレーン/ゲル領域からのデータを含む)を使用し得る条件で、いくつかの数だけの
レーンが、このラダーを含むのに必要とされる。内挿は、介在するレーンについての「仮
想的な」標準プロフィールを提供し得る。
【0040】
(レーン追跡)
平坦なゲル機械について、レーン追跡を容易にするために、ゲルの長さにわたるシグナ
ルを提供することが有用である。これは、サイズ標準の改変によって提供され得る。各レ
ーンが同じサイズ標準でロードされる場合、レーン追跡についてかなり少ない利点が存在
する(レーンが、隣接レーンをオフセットするために非同期的にロードされる場合、幾分
和らげる)。しかし、隣接レーンが(異なるパターンのバンド間隔のために)異なるセッ
トのサイズフラグメントを有する場合、レーン追跡ソフトウェアは、レーンを追跡するた
めのこの情報を使用し得、そして適切なフラグメントセット内に維持し得る。レーン毎に
サイズ標準をロードしないことについての上記示唆とは異なり、このスキームの1つの実
施形態は、シグナルを有するための各レーンを必要とする。例えば、最小の2つのセット
は、使用され得、代替的にロードされ得る。別の実施形態は、3つ(またはそれ以上)の
セットの使用を企図する。
【0041】
種々の実施形態において、単一の完全なセットのサイジングマーカーは、3つのサブセ
ットに分けられ(2つの連続的サイズが同じセットにないように分けられる)、そして上
記完全ゲル分析が使用される。基本的に、この実施形態において、3つのレーン毎に、そ
れらの隣接するレーンに全てのサイズ範囲を提供し、なお、追跡を支持するためのレーン
特異的パターンを提供する。隣接レーンが同じ標準バンドパターンを有し得ないことを期
待して、追跡/呼びかけソフトウェアは、「失われた」レーン(すなわち、ロードに失敗
した場所)を認識し得、正しいレーン−サンプルの対応を維持し得る。
【0042】
(サンプル追跡:)
先に示されるように、標識分子は、必ずしもDNAではない。ゲル上の適切なサイズ範
囲内で移動する任意の分子であり得、そして比較的容易に標識される。添加される場合に
依存して、これはまた、好ましくは、反応条件と親密であり、反応条件によって害されな
い。1つの実施形態において、好ましいモデルは、代表的なバーコードのモデルである(
実際、標準バーコードコードスキームが使用され得る)。1つの実施形態において、少な
くとも16ビット、より好ましくは、24〜32ビットが、多くの十分なサンプル数を提
供するために使用される。このスキームは、2進法(存在するまたは存在しない)であり
得るか、または複雑(例えば、3進法−0、1Xまたは2Xの強度)であり得る。第1は
、より単純であり、そして精密さを必要としないが、第2のものは、より小さなマーカー
成分(標識されたエレメント)および分離のためのより小さいゲル長さを必要とするが、
潜在的に、より複雑な製造プロセスを要する。1つの実施形態において、開始モチーフ(
フラグメントバンドパターン)は、各タグセットについて提供され、その結果、それぞれ
は、正しい相に記録され得る。これは、必要とされるバンドの数を増加し得ることが注意
される。サイズエレメント(バンド)間の少なくとも2〜3塩基の等価な分離が、ベース
ライン分離のために好ましい。1つの実施形態において、合計のバーコードは、100塩
基分離範囲以下(好ましくは50)で読み取り可能である。
【0043】
いつ標識(バーコード)を追加するかは、サンプルコーディングをどれだけ良好に行う
か、または少なくともどれだけ意義があるかを規定することに重要であり得る。1つの好
ましいプロセスにおいて、サンプルIDは、プラークまたはコロニーがつみ取られるとす
ぐに加えられる。1つの実施形態において、サンプルの処理が進むにつれて、コードは情
報を増加する(各工程は、その工程についてコードするビットのいくらかの数を加える)
。あるいは、別の実施形態において、プロセスの完全な記録は、情報管理システム(LI
MS)によって維持される。
【0044】
サンプルがその元のつみ取りの後に、いくらかの形態の増幅を受ける状況において、コ
ードフラグメントセットをつみ取りのときに加えることは、最適ではない。なぜなら、そ
れは、希釈され得、増幅テンプレートで単離され得ず、そして/または増幅に影響し得る
からである。これを認識すると、1つの実施形態は、固体支持体(例えば、ビーズ)に取
り付けられたタグを提供し、これは、元のプラークピックに添加され、これは、次いで、
適切なプロトコルの変化とともに、調製および配列決定反応を介してテンプレートが物理
的に続き得る。次いで、コードセットが、ゲルロード時間においてビーズから捕まれ得る
。最終コードの異なる部分を有する一連のビーズは、サンプル履歴を追跡するためにプロ
セスの間、添加され得る。1つの実施形態において、一連の複数標識化ビーズは、予め作
製され、そしてコンビナトリアルの様式で、ヘキサマー配列決定に添加される。
【0045】
別の実施形態において、タグセット添加は、増幅の直後にもたらされる。これが元のピ
ックに対していくらかの参照的整合性の損失を生じ得るが、本発明は、すでに比較的小さ
な問題を最小化するために、追跡プログラム(例えば、自動化ピッカーを増幅デバイス(
使用される場合)に連結すること)の使用を企図する。この点から、異なるプロセシング
についてのサンプルの任意の分割がカバーされる。ここで制限は、タグが、配列決定反応
を妨害しないことである。なおさらなる実施形態(実施するのが最も簡単であるものであ
り得る)において、各配列反応セットは、ロードの前に標識される。これは、独特のレー
ン同定ならびに配列決定プロセスにおけるチューブまたはウェルとゲルロードプロセスに
おけるチューブまたはウェルとの間の参照整合性(最も有意な点の誤差の2つ)を提供す
る。
【0046】
本発明の技術はさらに、ここで記載されるように、レーン同定(ID)のための実施形
態を提供する。1つの実施形態において、レーンIDは、上記のようにバーコードタグに
よって提供される。特定の他の(幾分より簡単な)実施形態は、単一ゲルにおいてレーン
を識別するためのみに提供される(レーンID対サンプルID)。本明細書中に企図され
るように、1つの方法は、完全なサンプルID実施形態に類似するが、より少ないタグ化
成分を必要とする(すなわち、潜在的な数のレーンほどに多くの数を生成するのにちょう
いど十分なビット(例えば、7〜8ビット))。サンプルIDが完全な配列決定反応に加
えられるのみであり、そしてテンプレートに加えられない場合において、このより単純な
方法は、おそらく反応セットの使用されない部分が再ロードのために保存される場合を除
いて、ほぼ利点であり得る。テンプレートの2つの端部が配列決定される場合でさえ、こ
の方法は、テンプレートが、別の配列決定反応位置(例えば、マイクロタイタープレート
のウェル)に直接アリコートされる限り、良好であり、その結果、追跡が、データベース
によってなされ、そして手動で維持されず/ノートを入力しない。サンプルが、自動反応
プロセスに配置される場合、正しくサンプルが追跡される(記録される)と仮定すると、
これらのタグは、同じレベルの識別を提供する。これは、反応が進まず、レーン追跡が混
乱し、そして同じテンプレート配列に連結を提供し得る場合、曖昧なくデータのレーンを
識別するのに有用である。
【0047】
本発明によって企図される、レーンIDについての別の潜在的に単純な方法は、サイジ
ング/移動度タグを直接組み込む。レーン特異的移動度の予測を提供するために、基本的
にサイジング標準を必要とする。レーン追跡を容易にするために、隣接するレーンが異な
る(しかし、機能的に等価な)レーンであるように、複数のこのようなサイジング標準を
提供することが有用であり得る。これらの規定されたマーカーがレーンの長さについて異
なることを知ることは、ラインで追跡を維持するために直接的に使用され得る。同時に、
これは、レーンIDにつて最小の指定を提供する。この極限において、この実施形態は、
レーン毎に異なる標準を呼び出す。しかし、代替的にロードされる2および好ましくは3
個の標準は、レーン指定のために少なくとも一貫性チェックを提供し得る(例えば、レー
ン4は、ロードされた標準#1を有するが、反応4が進まなかったので、追跡が戻り、考
えているレーン5は、レーン4であった場合、それは、その中に標準#2を有し、そして
誤差が認識される)。この方法は、バーコードレーンタグの必要を除くが、きわめて簡単
でなくても良い(どれだけタグ化された配列がゲルにロードされるかにおいて柔軟でなく
ても良い)。1つの実施形態において、2つのサイズの標準のみ(テンプレートタグ化が
使用されないと仮定する)を用いて両方の方法を組合せることが好ましい。
【0048】
ゲルベースのシステムについて、特定のレーンについて移動度プロフィールを予測する
場合に、提供されるソフトウェアがゲル幅情報を使用する場合、いくつかの数のレーンだ
けがこのラダーを有さなければならない。
【0049】
レーン分離がキャピラリー電気泳動シークエンサーの問題でないので、単純な単一パタ
ーンの第5の色素較正標準が、配列決定化学キットにおいて直接的に含まれ得る。このよ
うなキットを使用して、使用者は、新たな試薬を混合または添加する必要がない;標準は
、使用者に対して透明である。
【0050】
(実験的プロセスの意義)
モデルおよび生データの正確な最高の表示に対する能力を改善することならびにサンプ
ルとデータ間の参照整合性を維持することを越えて、第5の色素は、個々の実験の状態お
よび質の追跡、異なる実験からの結果の比較、およびデバイス(例えば、シークエンサー
)の性能の特定の局面の分析を補助し得る。これらは、一般的に、品質制御/評価(QC
/QA)機能として議論され得、そしてより効率的な全体の実験/工業プロセスを容易に
しないが、より制御された努力のために必要な正確な実験的記載を生じ得る。
【0051】
(サンプル注入/ロードモニタリング:)
現在の方法とともに、シグナルがレーンまたはキャピラリーにおいて検出されない場合
、問題が注入/ロードプロセスに関連するのか、または実際の配列決定反応に関連するの
か明瞭でない。これは、既知の標準(第5の色素)フラグメントセットが含まれ、そして
配列決定反応生成物に含まれる場合、よりよくモニターされ得る:第5の色素シグナルの
存在または非存在が可能な誤差条件を制限し得る。この適用において、第5の色素フラグ
メント密度は、任意の数(レーン当たり1つのフラグメントでさえ)であり得る。この適
用の実施形態は、以下の通りである:
配列決定反応生成物は、第5の色素フラグメントセットと組み合わされる。このサンプ
ルは、ABI Prism3700機器にロードされ、そして各色チャネルからのシグナ
ルが収集され、そして抽出される(この場合、チャネル1〜5)。第5の色素チャネルか
らのシグナルが調べられ、そして他の4つのチャネルと比較される。第5の色素チャネル
からのシグナルのみが存在する場合、配列決定反応は、いくらかの点で失敗すると推定さ
れる。チャネル1〜4が、予期されるように(そして/または、存在する場合、他のレー
ン/キャピラリーと比較して(例えば、存在する場合、任意の他のレーンの少なくとも5
0%、少なくとも75%、少なくとも85%、そして/または少なくとも90%)シグナ
ル強度で存在するが、第5のチャネルシグナルがないかまたは予想されるよりも(そして
/または他のレーン/キャピラリーと比較して(例えば、存在する場合、任意の他のレー
ンの50%未満、30%未満、20%未満、そして/または10%未満)かなり少なく存
在する場合、混合プロセスが疑われる。第5のチャンネルシグナルがないことまたは減少
したことを、サンプルチャネル強度がないことまたは減少したことと組み合わせる場合、
ロードがおそらく失敗している。種々の実施形態において、この機能は、各レーンがかな
りの量の存在する標準を有するべきなので、レーン間の値を比較するための能力を含む。
【0052】
配列決定における別の共通の問題は、レーン/キャピラリー(例えば、気泡)あるいは
ロードウェルまたは注入容積における不完全さの存在である。これらの全てが、変形を導
き、従って、たとえ合計のサンプルシグナルが精密でも、バンドを識別するのは困難で、
乏しい配列測定を生じる。この問題は、種々のチャネルのトレースを見ることによって、
単純に乏しいまたは「汚い」配列決定反応を識別することは困難であり得る。しかし、標
準的なフラグメントのベースライン分離(予期されるピーク間のいくらかの距離)が存在
するので、さらにゆがんだ第5の色素のバンドは、単離可能なようである。従って、ゆが
んだ(乏しい形状、広すぎるなど)バンドは、問題の性質を示し得る。最高の場合に、上
に示されるように、この情報は、使用可能な配列データ(ピーク検出機能において実際の
ピーク形状を組み込むことによる)を得るのに十分にデータを「クリーンアップ」するた
めに使用され得る。
【0053】
(レーンシグナルクロストーク:)
1つのレーンからのシグナルは、隣接レーンからのシグナルに流れ込み得る。キャピラ
リーにおいて、これは、光源のまずい較正ならびに/あるいはキャピラリーおよび供給源
/検出器要素のまずい整列の結果であり得る(例えば、1つのレーンからの散乱蛍光が別
のレーンの検出器によって検出される)。スラブゲルにおいて、これは、2つのレーン間
のフラグメントの実際のクロストークによって悪化され得る(まずいロード、変形したゲ
ルなど)。全体として、このシグナルクロストークは、レーンの価値を深刻に減少させ得
る。クロストークは、同じ走査点および色チャネルにおいて「正常」なシグナルの量に起
因して定量化するのは困難である。従って、単純に乏しい配列反応からこの結果を区別す
ることは困難である。しかし、第5の色素フラグメントセットがキャピラリーまたはスラ
ブゲル機器のいずれかに配列決定反応サンプルをロードする場合、シグナルクロストーク
は、配列決定シグナルから独立して決定され得る。これは、基本的に可能である。なぜな
ら、特にキャピラリーにおいて、標準バンドは、決して、2つの別々のレーンに同時に正
確にラインナップされないからである。最も明らかな場合において、隣接レーンのシグナ
ルピークに対応する1つのレーンの第5の色素チャネルのゴーストピークまたはショルダ
ーは、クロストークであると推定され得る。しかし、より拡散するシグナルの散乱は、単
純にノイズバックグラウンドを生じ得る。このシグナルの漏れは、補正され得る(分析の
前に流れ出たシグナルを引く)。重要なことは、機器およびその較正を診断するために使
用され得る。この現象に「気付いている」ベースカラーとともに、自動報告が生成され得
、そしてシステム操作者および援助要員が、気づき得る。この適用の実施形態は、以下の
通りである:
配列決定反応サンプルは、第5の色素フラグメントセットと組合わせられる。このサン
プルは、機器(キャピラリーまたはスラブシステムのいずれか)にロードされる。全ての
5個のシグナルチャネルからのシグナルは、各レーンで収集される。各時点における第5
の色素の量は、各レーンについて計算される。クロストークの比は、サンプルレーンにお
いて第5の色素のシグナルによって、隣接レーンの第5の色素のシグナルを割ったシグナ
ルとして決定される。
【0054】
(インサイチュクロスオーバー(解像度)決定)
特定の条件下での分離マトリックスの解像力は、フラグメントが隣接するフラグメント
から分離される際にいかに良好に同定され得るかを決定する。多くの要因が、この解像度
に影響を与える。従って、特定のプロセスの解像力を計算し得ることは、実験の問題を診
断する際、およびいかに多くの有用なデータが収集され得るかを予測する際に、有用であ
り得る。ピークの解像度は、しばしば、隣接するピークまでのそのピークの距離と、その
ピークの幅(その高さの半分において計算される)との比として決定される。これは、時
々、クロスオーバープロットと称される(この距離が、クロスオーバーが達成される幅の
半分より小さく、そしてピークが単離可能であるとみなされない場合)。これは、4色の
配列決定反応データのみを用いて決定することが、困難である。なぜなら、バンドの密度
が、ピークの有意な重なりをもたらし、ピークをさらに連続させるからである。ピークの
形状が乏しいモデルは、ベースラインの乏しい決定と組み合わせて、ピーク間距離の計算
およびそれらのピークの真の高さの計算さえも、疑わしくする。しかし、中程度の密度〜
高密度であるがベースラインがなお解像された(100の塩基あたり2〜10のフラグメ
ントの)5番目の色素フラグメントのセットが、配列決定反応サンプルと共に充填される
場合、システムの解像度は、配列決定反応サンプルのシグナルとは無関係に決定され得る
。この適用の実施形態は、以下の通りである:
配列決定サンプルが、複数の5番目の色素フラグメントと混合され、そして配列決定反
応生成物を充填される。5番目の色素からのシグナルが収集され、そしてピーク位置およ
び各ピークの半分の高さにおけるピーク幅が、決定される。ピーク間距離が決定され、そ
して解像度が決定される。
【0055】
(シグナル強度の標準化)
DNAフラグメント分析の多くの適用は、より量的な記載を必要とするか、またはより
量的な記載から利益を受け得る。充填、検出器の感度などの差異に起因して、この記載は
、特に実験間で困難である。しかし、既知の量の内部標準が、異なる機器に対してさえも
、実験間の標準化のための基礎を提供し得る。これは、少なくとも相対的な量的比較のた
めの基礎を提供する。この適用の実施形態は、以下の通りである:
配列決定サンプルが、高密度の5番目の色素フラグメントと混合され、そして配列決定
反応生成物を充填される。サンプルチャネルおよび5番目の色素のチャネルからのシグナ
ルが収集され、そして適切なウィンドウ(ピークの数(1つ以上))にわたって、各々の
合計が計算される。サンプルシグナル対5番目の色素のシグナルの比が決定される。サン
プルの相対量が、実験間のこのサンプル値の比として決定される。
【0056】
(追跡システムの性能)
経時的に組み合わされ、そして追跡される場合、上記分析の結果を使用して、システム
全体(デバイスおよびプロセス)にわたる性能をモニタリングし得る。例えば、充填され
る標準の量および性質は、各実験について既知であるので、実験間(泳動間)でのシグナ
ル強度、解像度、クロスオーバー、クロストークおよびピーク形状の一貫性の比較が、進
行中の基礎で決定され得る。この比較は、化学、操作プロセス(例えば、充填)、使用さ
れるマトリックス(個々のキャピラリー、ゲルロットなど)、検出デバイスの較正などを
反映し得る変化の記載を提供する。適切な報告手順(ソフトウェアなど)を構築して、こ
れらの変化を説明し得、そしてこれらの変化をプロセス性能の推定機能および/またはメ
ンテナンスの介入の要件に結び付け得る。
【0057】
(機器システム)
図3は、機器システムの実施形態の構成要素を図示し、この機器システムは、本明細書
中の教示に従って分析されるべきデータシグナルを発生させるための、電気泳動および蛍
光の検出機器を備える。別の構成要素間の適切なインターフェース(例えば、これらの構
成要素をユニット間の情報の伝達に適合させるためのもの)が、それぞれ構成要素に備え
られる。
【0058】
図3によれば、サンプル103および参照105のポリヌクレオチド溶液(おそらく、
電気泳動および蛍光の検出のために調製されている)が、検出可能な成分への分離のため
に、電気泳動機器107に添加される。分離の間または分離後に、これらの成分は、励起
ビーム(例えば、レーザー光)によって励起される場合に放出される蛍光によって、検出
される。
【0059】
蛍光検出ユニット109は、サンプルおよび参照配列のそれぞれのヌクレオチド塩基に
ついて、それぞれの蛍光の強度レベルを提示するシグナル111を発生させる。強度シグ
ナル111が、ベースコーリングユニット113に出力され、そしてまた、記憶デバイス
117(例えば、ディスプレイデバイス(モニタ)、プリンターまたはディスクドライブ
)に送られ得る。
【0060】
ベースコーリングユニット113は、本明細書中の教示を使用して、強度シグナル11
1を解釈し、そしてヌクレオチド塩基の配列に対応する出力121を提供する。ベースコ
ーリングユニット113は、配列における、十分に高い信頼度で決定されない1つ以上の
位置を特異的に標識し得ることが、理解されるべきである。
【0061】
(コンピュータ実行)
図4は、特定の実施形態によるコンピュータシステム500を図示するブロック図であ
り、このコンピュータシステムにおいて、本教示の実施形態が実行され得る。コンピュー
タシステム500は、バス502または情報を通信するための他の通信機構、および情報
を処理するためのバス502に結合されるプロセッサ504を備える。コンピュータシス
テム500はまた、メモリ506を備え、このメモリは、ランダムアクセスメモリ(RA
M)または他の動的記憶デバイスであり得、ベースコール、およびプロセッサ504によ
って実行されるべき命令を決定するために、バス502に結合される。メモリ506はま
た、プロセッサ504によって実行されるべき命令の実行の間に、一時的な変数または他
の中間的な情報を記憶するために使用され得る。コンピュータシステム500は、静的情
報およびプロセッサ504のための指示を記憶するための、バス502に結合されたリー
ドオンリーメモリ(ROM)508または他の静的記憶デバイスをさらに備える。記憶デ
バイス510(例えば、磁気ディスクまたは光ディスク)が、情報および命令を記憶する
ために提供され、そしてバス502に結合される。
【0062】
コンピュータシステム500は、バス502を介して、コンピュータのユーザに情報を
表示するためのディスプレイ512(例えば、陰極線管(CRT)または液晶ディスプレ
イ(LCD))に結合され得る。入力デバイス514(英数字および他のキーを備える)
が、情報およびコマンド選択をプロセッサ504に通信するために、バス502に結合さ
れる。別の型のユーザ入力デバイスは、方向の情報およびコマンド選択をプロセッサ50
4に通信するため、ならびにカーソルの移動をディスプレイ512上で制御するための、
カーソルコントロール516(例えば、マウス、トラックボールまたはカーソル方向キー
)である。この入力デバイスは、代表的に、2つの軸(第1の軸(例えば、x)および第
2の軸(例えば、y))での2の自由度を有し、これは、このデバイスが平面内で位置を
特定することを可能にする。
【0063】
ベースコールは、メモリ506に含まれる1つ以上の指示の1つ以上の順序を実行する
プロセッサ504に応答して、コンピュータシステム500によって提供される。このよ
うな命令は、別のコンピュータ読み取り可能媒体(例えば、記憶デバイス510)から、
メモリ506に読み込まれ得る。メモリ506に含まれる命令の順序の実行は、プロセッ
サ504に、本明細書中に記載されるプロセス状態を実施させる。あるいは、ハードワイ
ヤード回路が、ソフトウェア指示の代わりにかまたはソフトウェア指示と組み合わせて使
用されて、本教示を実行し得る。従って、本開示の実行は、ハードウェア回路とソフトウ
ェアとのいずれの特定の組み合わせにも限定されない。
【0064】
用語「コンピュータ読み取り可能媒体」とは、本明細書中において使用される場合、実
行のためにプロセッサ504に指示を提供することに関与する、任意の媒体をいう。この
ような媒体は、任意の形態をとり得、不揮発性媒体、揮発性媒体、および伝送媒体が挙げ
られるが、これらに限定されない。不揮発性媒体としては、例えば、光ディスクまたは磁
気ディスク(例えば、記憶デバイス510)が挙げられる。揮発性媒体としては、動的メ
モリ(例えば、メモリ506)が挙げられる。伝送媒体としては、同軸ケーブル、銅線、
および光ファイバーが挙げられ、バス502を構成するワイヤを含む。伝送媒体はまた、
音波または光波の形態(例えば、伝播および赤外線のデータ通信の間に発生するもの)を
とり得る。
【0065】
コンピュータ読み取り可能媒体の通常の形態としては、例えば、フロッピー(登録商標
)ディスク、フレキシブルディスク、ハードディスク、磁気テープ、または他の任意の磁
気媒体、CD−ROM、他の任意の光媒体、穿孔カード、紙テープ、孔のパターンを有す
る他の任意の物理的媒体、RAM、PROM、およびEPROM、FLASH−EPRO
M、他の任意のメモリチップ、またはカートリッジ、本明細書中以下に記載されるような
搬送波、あるいはコンピュータが読み取り得る他の任意の媒体が挙げられる。
【0066】
種々の形態のコンピュータ読み取り可能媒体が、実行のためにプロセッサ504に1つ
以上の指示の1つ以上の順序を運ぶことに関与し得る。例えば、これらの指示は、最初、
遠隔コンピュータの磁気ディスク上で運ばれ得る。遠隔コンピュータは、これらの指示を
その動的メモリにロードし得、そしてこれらの指示を、モデムを使用して電話回線を通し
て送信し得る。コンピュータシステム500に局在するモデムは、電話回線上のデータを
受信し得、そして赤外線送信機を使用して、これらのデータを赤外線シグナルに変換し得
る。バス502に結合された赤外線検出器は、赤外線シグナル中で運ばれるデータを受信
し得、そしてバス502上にデータを配置し得る。バス502は、このデータをメモリ5
06に運び、このメモリ506から、プロセッサ504が指示を検索および実行する。メ
モリ506によって受信される指示は、必要に応じて、プロセッサ504による実行の前
または後のいずれかに、記憶デバイス510に記憶され得る。
【実施例】
【0067】
以下の実施例は、単なる例示であり、そして本発明の範囲および本発明に関する特許請
求の範囲の範囲を、いずれの様式でも限定することは意図されない。
【0068】
(実施例1)
図1は、シミュレートされた5番目の色素の泳動からのデータを示す、電気泳動図であ
る。x軸は、走査数であり、そしてy軸は、任意の単位での蛍光振幅である。各走査は、
持続時間が約1秒間である。ピークの大部分は、等間隔である。すなわち、これらのピー
クは、各々18塩基で生じる。3700 POP5データ(Applied Biosy
stems;Foster City,CA)に類似の移動度を使用して、現実的な走査
間隔をシミュレートした。これらのピークのうちの少数が、規則的な18塩基の間隔から
ずれている。このようなパターン化されたピークを使用して、開始位置(すなわち、塩基
1)の絶対的な較正を提供する。同定を容易にするために、規則的に間隔を空けたピーク
は、空白(赤色)の円によって同定され、一方でパターン化されたピークは、塗りつぶさ
れた(緑色の)円で同定される。
【0069】
5番目の色素ラダー(図1A)から、図1Bおよび1Cの曲線が推定され得る。図1B
は、走査数の関数として、ピーク間の間隔を表す。この間隔はまた、走査数で報告される
。図1Cの曲線は、各ピークの幅を、走査数で、走査数の関数として表す。この幅は、そ
のピークの最大高さの半分の全幅(FWHM)として測定され得る。
【0070】
幅曲線(図1C)を使用して、デコンボリューション技術を改善し得る。いくつかの技
術(例えば、WienerおよびMaximumのエントロピー)は、ピーク幅が比較的
一定であるウィンドウに対して、フーリエ変換を実行する。走査軸を再補間して一定の幅
を達成することによって、フーリエウィンドウは、データセット全体であり得る。このこ
とは、有意に改善された実行時間をもたらし、そしてデコンボルブされたウィンドウを一
緒に切り替える必要性を排除する。
【0071】
(実施例2)
図2は、本発明の実施形態によって企図される工程を示すフローチャートを提供する。
【0072】
ピーク検出は、当該分野において公知の多数の技術によって、達成され得る。例えば、
ピーク検出は、不連続にサンプリングされたEPデータにおける局所的極大の同定によっ
て達成され得る。本発明の実施形態は、Savitsky−Golay平滑化を包含する
アルゴリズムを利用する。ピーク特徴を評価するための任意の種々の技術が、本発明を実
施する際に使用され得る。目的の特徴としては、以下が挙げられる:位置(走査)および
形状(例えば、高さ、幅)。Savitsky−Golay平滑化はまた、これらの終了
の近くに使用され得る。
【0073】
ピークの弁別がまた、種々の様式で達成され得る。種々の実施形態において、何らかの
参照点からのピークの高さ−幅空間におけるユークリッド距離が記憶され、そして区別さ
れて、引き続く分析のために考慮されるべきピークから、無視されるべきピークを分離す
る境界を決定する。
【0074】
ピークをサイズ鮮明度からのサイズと適合させることは、RatioMatcher(
このような作業のために設計された動的プログラミングアルゴリズム、米国仮特許出願番
号60/129,697を参照のこと;本明細書中に参考として援用される)によって取
り扱われ得る。本発明は、しばしば、比較的多数の大きさおよびピークを取り扱うことを
包含するので、RatioMatcherは、いくつかの状況において、所望されるより
コンピュータ的に強くあり得る。しかし、RatioMatcherは、データのサブセ
ットに対して使用され得、次いで、その結果が、より単純なアルゴリズム(5番目の色素
データの特定の特徴(例えば、十分に改造された、ほぼ等しく間隔を空けたピーク)を利
用する)のための開始点として使用され得る。
【0075】
5番目の色素データの分析の結果は、最初の4つの色素シグナルの処理および分析、な
らびにピークの分類(すなわち、ベースのコーリング)を補助する。利点としては、以下
が挙げられる:
5番目の色素のデータの十分に解像されたピークは、ピークの形状(幅、および充填/
注入の異常、分離マトリックス中の気泡などに起因する不均一性の影響)ならびに間隔の
良好な推定を、シグナルの位置の関数として提供する。これらの幅および間隔の推定は、
乏しい解像度を有する付随するシグナルの、より良好な分析を可能にする。
【0076】
移動度シフトの較正は、参照点(通常、「塩基1」と称される)の位置に依存する。こ
の参照点の推定は、5番目の色素のシグナル分析によって提供される、大きさ−走査マッ
プによって改善される。
【0077】
(実施例3)
本開示の1つの例によれば、ラダーは、5番目の色素で標識されたフラグメントを、1
0〜20塩基ごとに、塩基約20〜塩基約1200〜1500(すなわち、少なくとも6
0フラグメント)で含むように、設計および構築される。さらなる2〜3個のピークは、
塩基1の推定の開始の近くに存在するように設計され得る。ラダー配列は、この実施形態
において、標準的な条件下で泳動される場合に、ほぼ「通常の」移動(例えば、4つ全て
の塩基の全く等しい提示を有することによる)を示し、そして実質的な移動度不規則性を
示さない。このラダーは、例えば、反復内部ユニットからなり得、従って、ピーク間で、
同じ配列の一定の数の塩基が存在する。このラダーは、例えば、一塩基配列決定反応から
生じ得る。別の実施形態において、テンプレートは、さらなるピークを含むが、(少なく
とも約5塩基)単離されたピークを約20塩基程度ごとに含む。理想的には、これは、上
記反復ユニットを含む。
【0078】
(実施例4)
この実施例は、以下の2つの異なる型の生成物を企図する:(a)合成(および連結)
された核酸配列のセット、ならびに(b)合成およびクローニングされた核酸配列のセッ
ト。生成物(a)は、種々の大きさの、(5’末端が標識された)5番目の色素で標識さ
れたフラグメントから構成され、これは、泳動される場合に、例えば、3700または3
100DNA Analyzer(Applied Biosystems;Foste
r City,CA)で泳動される場合に、5番目の色素のラダーを生じる。生成物(b
)は、5番目の色素で標識されたジでオキシターミネーターを用いて、例えば、−21M
13万能プライマーを使用して配列決定される場合、(3’末端が標識された)5番目の
色素のラダーを生じるために使用され得るクローンである。
【0079】
5番目の色素のラダーは、配列決定サンプルと共に、例えば、ABI DNA 分析機
器で泳動され得る。このラダーは、大きさが、例えば、18または19〜7200を超え
る塩基までの範囲であり得、1つの5番目の色素で標識されたフラグメントは、10〜5
0塩基ごと(例えば、12または18塩基ごとなど)である。
【0080】
生成物(a)または(b)の実施形態において、5番目の色素で標識された3つのさら
なるフラグメントが、5番目の色素ターミネーター配列決定反応によって、塩基57、8
7、および94の近くに生じた。
【0081】
(実施例5)
最初の較正標準は、3つの塩基(例えば、G、C、A、Tのいずれか3つ)がその配列
の長さに沿ってランダムに組み込まれ、そして4番目の塩基(例えば、G、C、A、Tの
4番目)が、その配列の長さに沿って規則的に間隔を空けた(例えば、10番目の塩基位
置ごと)間隔で(そしてこの間隔でのみ)組み込まれた配列を含んで作製される。第4の
塩基は、標準的な配列決定反応を使用して、独特の蛍光標識で標識される。
【0082】
(実施例6)
この実施例は、実施例4の生成物(b)に関して上記したものと類似の様式で構築され
た、5番目の色素ラダーに関する。
【0083】
最初のクローニングインサート(小容量)を、1つのGのみ(これは、12マーの末端
に存在する)を含む12マーの自己連結によって作製した。より大きい量を、連結産物を
クローニングすることによって、生成した。次いで、規則的な4つの色素配列決定反応を
、クローン産物に対して実施した。図5は、配列決定データからのこのGのみの追跡を示
すプロットである。示されるように、このプロットにおける軸は、より適切かつ有用な部
分にズームインするようにクリッピングされて示される。
【0084】
(実施例7)
この実施例は、サンプルの注入/充填のモニタリングに関する。
【0085】
96個の配列決定サンプルを、各々、5番目の色素フラグメントのセットと混合した。
次いで、これらのサンプルを、ABI Prism 3700 DNA Analyze
r機器に充填し、そして泳動(分離)し、そしてシグナルを収集した。図6は、3700
機器からこれらのサンプルの各々に対して報告されたシグナルを示す。サンプルの完全性
は、各サンプルの結果を個々に調査することによって、決定され得る。この図において、
C01位置におけるサンプルは、いずれの配列決定シグナル(色素1〜4)をも示さず5
番目の色素シグナルが存在した。このことは、C01には配列決定反応生成物が存在しな
いことを示し、このことは、プロセスの反応段階における問題を示す。他方で、プロフィ
ールA03は、配列決定と5番目の色素シグナルとの両方において、シグナルを示さなか
った。このことは、サンプル充填(注入)の問題が起こったかもしれないことを示す。E
05位置は、配列決定と5番目の色素のシグナルとの両方を示したが、それぞれが、他の
実験におけるそれらのプロフィールに相対的であるようであることを示した。このことは
、キャピラリーまたは充填ウェル、あるいはサンプルの純度さえにおける問題を示し得る

【0086】
本明細書中で言及された全ての刊行物および特許出願は、各個々の刊行物または特許出
願が具体的にかつ個別に、参考として援用されると示されたと同じ程度まで、本明細書中
に参考として援用される。
【0087】
当業者は、多くの改変が可能であることを理解する。このような改変の全ては、本明細
書中に包含されることが意図される。
【図面の簡単な説明】
【0088】
本発明の教示の例示的な構造および操作様式は、それらの種々の目的および利点ととも
に、添付の図面と組み合わせて与えられる以下の説明に記載される。ここで、同一の参照
番号は、類似または同様な要素を同定する。
【図1A】図1Aは、シミュレートした第5色素電気泳動操作によって生じたデータを表わす電気泳動図である。任意の単位において、このx軸は、走査数であり、そしてy軸は、蛍光振幅である。規則正しく間隔を空けたピークは、白丸によって同定され、そしてパターン化されたピークは、黒丸を用いて同定される。
【図1B】図1Bは、図1Aの第5色素ラダー(ladder)から推定される曲線であり、これは、走査数の関数として、ピーク間の間隔を示している。この間隔はまた、走査数においても報告されている。
【図1C】図1Cは、図1Aの第5色素ラダーから推定される曲線であり、走査数の関数として、この走査数における各ピーク幅を示している。この幅は、このピークの高さの半波高全幅値(FWHM)として測定される。
【図2】図2は、本発明の教示の実施形態によって企図される工程を示すフローチャートである。
【図3】図3は、本明細書中の教示に従って、分析物についてのデータシグナルを発生させるためのシステムを例示する概略ブロック図である。
【図4】図4は、種々の実施形態に従う、コンピューターシステムを例示するブロック図であり、ここにおいて、本発明の教示の実施形態が実行され得る。
【図5】図5は、自動化DNA分析器を使用する、種々の実施形態に従って構成される第5色素ラダーの電気泳動プロフィールである。x軸は、走査数であり、y軸は、蛍光振幅である。
【図6】図6は、96個の配列決定サンプルの各々について、ABI Prism 3700 DNA Analyzer機器から報告されたシグナルであり、これらのサンプルの各々は、第5色素フラグメントのセットと組み合わされた。各ウェルについて、上部パネルは、配列決定シグナルを示し(色素1〜4)そして低部パネルは、第5色素シグナルを示す。

【特許請求の範囲】
【請求項1】
本明細書に記載されるような、電気泳動分析のための内部較正標準。

【図1A】
image rotate

【図1B】
image rotate

【図1C】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate


【公開番号】特開2008−5850(P2008−5850A)
【公開日】平成20年1月17日(2008.1.17)
【国際特許分類】
【出願番号】特願2007−215327(P2007−215327)
【出願日】平成19年8月21日(2007.8.21)
【分割の表示】特願2003−512449(P2003−512449)の分割
【原出願日】平成14年7月11日(2002.7.11)
【出願人】(500069057)アプレラ コーポレイション (120)
【住所又は居所原語表記】850 Lincoln Centre Drive Foster City CALIFORNIA 94404 U.S.A.
【Fターム(参考)】