リアルタイムPCR蛍光データ内のステップ型不連続部除去用のシステム及び方法
【課題】PCR又は成長データ内のジャンプ不連続部を除去する。
【解決手段】成長プロセスを表すデータセットを受信する段階、非線形回帰プロセスを第1非線形関数に適用して前記第1関数のパラメータを決定することにより、前記データセットにフィットする曲線の第1近似を算出する段階、第2回帰プロセスを第2非線形関数に適用して前記第2関数のパラメータを決定することにより、前記データセットにフィットする曲線の第2近似を算出する段階、前記第1及び第2近似のそれぞれのものの情報係数を決定する段階、前記情報係数に基づいて前記近似の中の1つものを選択する段階、前記選択された近似の前記ステップ型不連続部パラメータの信頼区間を決定する段階、前記信頼区間が値ゼロを含まない場合に、ゼロに設定された対応する前記ステップ型不連続部パラメータを有する前記選択された近似によって前記データセットの一部を置換する段階、を含んで成る。
【解決手段】成長プロセスを表すデータセットを受信する段階、非線形回帰プロセスを第1非線形関数に適用して前記第1関数のパラメータを決定することにより、前記データセットにフィットする曲線の第1近似を算出する段階、第2回帰プロセスを第2非線形関数に適用して前記第2関数のパラメータを決定することにより、前記データセットにフィットする曲線の第2近似を算出する段階、前記第1及び第2近似のそれぞれのものの情報係数を決定する段階、前記情報係数に基づいて前記近似の中の1つものを選択する段階、前記選択された近似の前記ステップ型不連続部パラメータの信頼区間を決定する段階、前記信頼区間が値ゼロを含まない場合に、ゼロに設定された対応する前記ステップ型不連続部パラメータを有する前記選択された近似によって前記データセットの一部を置換する段階、を含んで成る。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、一般に、ポリメラーゼ連鎖反応システムに関し、更に詳しくは、ポリメラーゼ連鎖反応データ内のステップ型不連続部を除去するシステム及び方法に関する。
【背景技術】
【0002】
ポリメラーゼ連鎖反応(Polymerase Chain Reaction:PCR)は、既定の核酸配列を酵素によって合成又は増幅する生体内(in vivo)法である。その反応は、通常、2つのオリゴヌクレオチドプライマーを使用し、これらが両側の鎖にハイブリダイズし、増幅対象の鋳型又は標的DNA配列に隣接する。プライマーは、熱安定性DNAポリメラーゼの触媒作用によって伸長する。鋳型変性、プライマーアニーリング、及びポリメラーゼによるアニーリングされたプライマーの伸長を伴う反復的な一連のサイクルの結果として、特定のDNA断片が指数的に蓄積される。通常、このプロセスにおいては、増幅プロセスの検出及び定量化を円滑に実行するべく、蛍光ブローブ又はマーカーが使用される。
【0003】
図1には、代表的なリアルタイムPCR曲線が示されており、代表的なPCRプロセスにおける蛍光強度値がサイクル数に対してプロットされている。この場合、PCRプロセスのそれぞれのサイクルにおいて、PCR産物の形成がモニタリングされる。増幅は、通常、増幅反応の際の蛍光信号を計測するコンポーネント及び装置を含むサーモサイクラ内において計測される。このようなサーモサイクラの一例が、Roche Diagnostics LightCycler(Cat. No. 20110468)である。増幅産物は、例えば、標的核酸にバインドされた際にのみ蛍光信号を放出する蛍光標識ハイブリダイゼーションプローブにより、或いは、特定のケースにおいては、二本鎖DNAに結合する蛍光染料により、検出される。
【0004】
リアルタイムPCRにおいて使用される蛍光染料は、温度感受性を有する。サーマルサイクリングプロファイルは、アニーリング温度を変更する段階を包含可能である。アニーリング温度の変化は、蛍光読取値の大きさの不連続部として出現する。図2は、サイクル6の後にアニーリング温度の変化が見られる具体例を示す。
【0005】
図2のプロファイルを使用して実施された実験に対応する蛍光データの読取値が図3に示されている。HEXチャネルにおいて、サイクル5とサイクル6の間に不連続部が存在することがはっきりと分かる。図3は、104IU/mlの濃度を有するB19パルボウイルスサンプルから採取した。温度に対する感受性が低いFAM染料の場合には、ジャンプ不連続部の大きさが、HEX染料よりも小さくなっている。
【0006】
但し、標的の濃度が増加した場合には、不連続部を蛍光データ内に反映させることができない可能性がある。例えば、2.9×1011IU/mlの濃度を有するB19パルボウイルスサンプルを検討すれば、サイクル5の後にアニーリング温度の変化が存在したにも拘わらず、不連続部は、図4aでは見られない。
【0007】
いくつかの現在のPCRシステムは、アニーリング温度の変化に起因したステップ型不連続部の除去のための方法を実装している。このようなシステムは、通常、予想されるアニーリング温度の変化及び最大蛍光の変化に対応するサイクル数用の検定固有の入力パラメータを必要としている。このような方法は、いくつかの制限を具備する。第1に、これらは、高滴定濃度サンプルを取り扱うことができない。これは、図4bで見ることができ、この場合には、2.9×1011IU/mlの濃度のB19パルボサンプルが、このようなシステムによって不正確に取り扱われている。第2に、このような方法が取り扱うことができるのは、不連続部の地点における小さな最大(例えば、5つの)絶対蛍光単位の変化のみである。不連続部における蛍光変化の大きさは、大きく変化することが複数の検定において観察されている。最大変化を通知するための検定固有の入力のセットアップは、最適化が困難である。第3に、このような方法は、ベースラインドリフトが大きい蛍光データを取り扱うことができないであろう。このようなケースにおいては、提供される補正が不十分なものとなろう。第4に、アニーニング温度の変化に対応するサイクル数から1つ以下のサイクルの距離にスパイクが存在する場合には、提供される補正により、報告される結果濃度の変化、即ち、誤った結果が生成されることが判明している。
【発明の概要】
【発明が解決しようとする課題】
【0008】
従って、前述の及びその他の問題を克服する、シグモイドタイプ又は成長曲線と、特に、PCR曲線を処理するシステム及び方法を提供することが望ましい。具体的には、これらのシステム及び方法は、確実且つ安定した方式における温度ステップ補正を実装することを要する。
【課題を解決するための手段】
【0009】
本発明は、PCRプロセスにおいて発生可能な温度シフトについてPCRデータを補正するシステム及び方法を提供する。
【0010】
本発明の態様は、リアルタイムポリメラーゼ連鎖反応データの蛍光のジャンプ不連続(jump discontinuity:第1種不連続部)を除去する。不連続部の存在は、不正確な結果計算を生成可能であり、且つ、従って、除去することが推奨される。標的の初期複写数に応じて、高濃度レベルにおいては、蛍光の不連続部が存在しない可能性がある。8パラメータ非線形モデルの信頼域を使用し、データを正確に推定する。本方法は、すべての濃度レベルにおける不連続部の除去のための従来の方法における問題点を克服する。
【0011】
ある態様においては、データセットをモデル化する非線形関数に非線形回帰プロセスを適用して非線形関数のステップ型不連続部パラメータを含むパラメータを決定することにより、受信したPCRデータセットにフィットする曲線に対する第1近似を決定する。非線形関数の一例は、ダブルシグモイド式である。又、第2の非線形関数に回帰プロセスを適用して第2の関数のステップ型不連続部パラメータを含むパラメータを決定することにより、PCRデータセットにフィットする曲線に対する第2の近似をも決定する。次いで、第1及び第2近似のそれぞれのものについて決定した情報係数に基づいて、第1又は第2近似の中の1つのものを選択する。ステップ型不連続部パラメータについて算出した信頼区間が値ゼロを含む(例えば、信頼区間が、値0を含む範囲(例えば、−1〜1)にわたって広がっている)場合には、ステップ補正を実行しない。信頼区間が値ゼロを含まない場合には、ステップ補正を実行する。ステップ補正を実行する場合には、ステップ型変化の前のデータ曲線の部分を、選択された近似の適切な部分と置換することにより、シフト補正済みのデータセットを生成する。特定の態様においては、近似が適合度(goodness of fit)の基準を満足しない場合には、ステップ補正を実行しない。シフト補正済みのデータセットを返し、表示可能であり、さもなければ、更なる処理のために使用可能である。
【0012】
ある態様によれば、成長プロセスを表すデータ内のステップ型不連続部を自動的に除去する方法が提供される。本方法は、通常、成長プロセスを表すデータセットを受信する段階であって、データセットは、複数のデータポイントを含み、それぞれのデータポイントは、座標値のペアを具備する、段階と、非線形回帰プロセスを第1非線形関数に適用して第1関数のパラメータを決定することにより、データセットにフィットする曲線の第1近似を算出する段階であって、パラメータは、ステップ型不連続部パラメータを含む、段階と、を含む。又、本方法は、通常、第2回帰プロセスを第2非線形関数に適用して第2関数のパラメータを決定する段階により、データセットにフィットする曲線の第2近似を算出する段階であって、第2関数のパラメータは、ステップ型不連続部パラメータを含む、段階と、第1及び第2近似のそれぞれのものについて情報係数を決定する段階と、情報係数に基づいて近似の中の1つのものを選択する段階と、をも含む。又、本方法は、通常、選択された近似のステップ型不連続部パラメータの信頼区間を決定する段階と、信頼区間が値ゼロを含まない(例えば、信頼区間が、値0を含まない範囲にわたって広がっている)場合に、ゼロに設定された対応するステップ型不連続部パラメータを有する選択された近似によってデータセットの一部を置換する段階と、をも含む。
【0013】
別の態様によれば、プロセッサを制御し、成長曲線を表すデータセット内のステップ型不連続部を自動的に除去するコードを含むコンピュータ可読媒体が提供される。コードは、通常、成長プロセスを表すデータセットを受信する段階であって、データセットは、複数のデータポイントを含み、それぞれのデータポイントは、座標値のペアを具備する、段階と、非線形回帰プロセスを第1関数に適用して第1関数のパラメータを決定することにより、データセットにフィットする曲線の第1近似を算出する段階であって、パラメータは、ステップ型不連続部パラメータを含む、段階と、を実行するためのコードを含む。又、コードは、通常、第2回帰プロセスを第2非線形関数に適用して第2関数のパラメータを決定することにより、データセットにフィットする曲線の第2近似を算出する段階であって、第2関数のパラメータは、ステップ型不連続部パラメータを含む、段階と、第1及び第2近似のそれぞれのものについて情報係数を決定する段階と、情報係数に基づいて近似の中の1つものを選択する段階と、を実行するコードをも含む。又、コードは、通常、選択された近似のステップ型不連続部パラメータの信頼区間を決定する段階と、信頼区間が値ゼロを含まない場合に、ゼロに設定された対応するステップ型不連続部パラメターを有する選択された近似によってデータセットの一部を置換する段階と、を実行する命令をも含む。
【0014】
更に別の態様によれば、それぞれのものが座標値のペアを具備する複数のデータポイントを含む、キネティックPCR増幅曲線を表すPCRデータセットを生成するキネティックPCR分析モジュールと、インテリジェンスモジュールと、を通常含むキネティックポリメラーゼ連鎖反応(PCR)システムが提供される。インテリジェンスモジュールは、通常、非線形回帰プロセスを第1非線形関数に適用してステップ型不連続部パラメータを含む第1関数のパラメータを決定することによってデータセットにフィットする曲線の第1近似を算出し、且つ、第2回帰プロセスを第2非線形関数に適用してステップ型不連続部パラメータを含む第2関数のパラメータを決定することによってデータセットにフィットする曲線の第2近似を算出することにより、PCRデータセットを処理してデータセット内のステップ型不連続部を自動的に除去するべく適合されている。又、インテリジェンスモジュールは、通常、第1及び第2近似のそれぞれのものについて情報係数を決定し、情報係数に基づいて近似の中の1つのものを選択し、選択された近似についてステップ型不連続部パラメータの信頼区間を決定し、且つ、信頼区間が値ゼロを含んでいない場合に、ゼロに設定された対応するステップ型不連続部パラメータを有する選択された近似によってデーセットの一部を置換するべく、適合されている。
【0015】
図面及び請求項を含む本明細書の残りの部分を参照することにより、本発明のその他の特徴及び利点について理解することができよう。以下、添付の図面との関係において、本発明の更なる特徴及び利点と本発明の様々な態様の構造及び動作について詳述する。添付図面においては、類似の参照符号により、同一又は機能的に類似した要素を示している。
【図面の簡単な説明】
【0016】
【図1】PCRプロセスの環境における増幅曲線の一例を示す。
【図2】サイクル6の後にアニーリング温度の変化が見られる具体例を示す。
【図3】104IU/mlの濃度を有するB19パルボウイルスサンプルから採取されたFEM及びHEXチャネルにおけるPCR増幅曲線を示す。
【図4A】標的の濃度が増大した場合に、不連続部が蛍光データ内に反映されない可能性があることを示すPCR増幅曲線を示す。
【図4B】標的の濃度が増大した場合に、不連続部が蛍光データ内に反映されない可能性があることを示すPCR増幅曲線を示す。
【図5】PCR増幅曲線内の温度シフトを補正するプロセスの一態様を示す。
【図6A】本発明の一態様によるスパイク識別及び置換プロセスの詳細なプロセスフローを示す。
【図6B】本発明の一態様によるスパイク識別及び置換プロセスの詳細なプロセスフローを示す。
【図6C】本発明の一態様によるスパイク識別及び置換プロセスの詳細なプロセスフローを示す。
【図6D】本発明の一態様によるスパイク識別及び置換プロセスの詳細なプロセスフローを示す。
【図6E】本発明の一態様によるスパイク識別及び置換プロセスの詳細なプロセスフローを示す。
【図7】パラメータa〜gを含むダブルシグモイド式の分解を示す。パラメータa〜gは、ダブルシグモイド曲線の形状及び位置を定義する。
【図8】曲線及び変曲点のx値である(e)の位置に対するパラメータ(d)の影響を示す。図8の曲線は、いずれも、パラメータdを除いて、同一のパラメータ値を具備する。
【図9】異なるパラメータセットにおける3つの曲線形状の一例を示す。
【図10A】ある観点によるダブルシグモイド式のパラメータ(e)及び(g)の値を決定するプロセスを示す。
【図10B】ある観点によるダブルシグモイド式のパラメータ(e)及び(g)の値を決定するプロセスを示す。
【図11A】パラメータの初期セットにおけるLevenberg−Marquardt回帰プロセスのプロセスフローを示す。
【図11B】パラメータの初期セットにおけるLevenberg−Marquardt回帰プロセスのプロセスフローを示す。
【図11C】パラメータの初期セットにおけるLevenberg−Marquardt回帰プロセスのプロセスフローを示す。
【図11D】パラメータの初期セットにおけるLevenberg−Marquardt回帰プロセスのプロセスフローを示す。
【図12】CAP/CTM HIVモニタ検定からのIQS(HEXチャネル)蛍光データを示す。未加工の蛍光データは、点線で示されており、補正済みのデータは、実線で示されている。
【図13】B19バルボウイルス標的チャネル(FAMチャネル)検定の(実際の標的の増幅を伴わない)蛍光データを示す。未加工の蛍光データは、点線で示されており、補正済みのデータは、実線で示されている。
【図14】HBV High Pure(FAMチャネル)の標的の蛍光データを示す。未加工の蛍光データは、点線で示されており、補正済みのデータは、実線で示されている。この検定は、ジャンプ不連続部を具備しておらず、従って、不連続部の補正は不要である。
【図15】高濃度(2.9×1011IU/ml)のB19パルボウイルスサンプル(FAMチャネル)検定の蛍光データを示す。未加工の蛍光データは、点線で示されており、補正済みのデータは、実線で示されている。
【図16】本発明の方法及びシステムを実装するべく使用可能なソフトウェア及びハードウェアリソースの間の関係を示す概略ブロックダイアグラムの一例である。
【図17】サーモサイクラ装置とコンピュータシステムの間の関係を示す概略ブロックダイアグラムの一例である。
【発明を実施するための形態】
【0017】
本発明は、増幅プロセスにおいて発生可能な温度シフトについてPCR増幅曲線及びその他の成長曲線を補正するシステム及び方法を提供する。
【0018】
温度シフトの一例は、検定の際の特定のサイクル内におけるアニーリング温度の制御された変化である。通常、この温度シフトは、ベースライン領域によって表されるプロセスの一部に発生する。この温度変化は、シフトが発生したサイクル数に、蛍光信号における後続のシフトを生成する。本明細書においては、温度シフトが発生したサイクルをCAC(Cycle of Annealing change:アニーリングが変化したサイクル)と呼ぶこととする。
【0019】
ある態様においては、デーセットをモデル化する非線形関数に非線形回帰プロセスを適用して非線形関数のステップ型不連続部パラメータを含むパラメータを決定することにより、PCRデータセットにフィットする曲線に対する第1近似を決定する。非線形関数の一例は、後程詳述するダブルシグモイド式である。又、回帰プロセスを第2非線形関数に適用して第2関数のステップ型不連続部パラメータを含むパラメータを決定することにより、PCRデータセットにフィットする曲線に対する第2近似をも決定する。次いで、第1及び第2近似のそれぞれものについて決定した情報係数に基づいて、第1又は第2近似の中の1つのものを選択する。ステップ型不連続部パラメータについて算出した信頼区間が値ゼロを含む(例えば、信頼区間が、値0を含む範囲にわたって広がっている)場合には、ステップ補正を実行しない。信頼区間が値ゼロを含まない場合には、ステップ補正を実行する。ステップ補正を実行する場合には、ステップ型変化の前のデータ曲線の部分を、選択された近似の適切な部分によって置換することにより、シフト補正済みのデータセットを生成する。特定の態様においては、近似が適合度の基準を満足しない場合には、ステップ補正を実行しない。シフト補正済みのデータセットを返し、表示可能であり、さもなければ、更なる処理のために使用可能である。例えば、シフト補正済みのデータセットを使用し、PCR検定のCt値を決定可能である。
【0020】
PCRプロセスの環境における増幅曲線10の一例が図1に示されている。図示のように、曲線10は、ラグフェーズ領域15と、指数フェーズ領域25と、を含む。ラグフェーズ領域15は、一般に、ベースライン又はベースライン領域と呼ばれている。このような曲線10は、ラグフェーズ領域と指数フェーズ領域をリンクする関心の対象である遷移領域20を含む。領域20は、一般に、エルボー又はエルボー領域と呼ばれている。エルボー領域は、通常、基礎をなすプロセスの成長又は増幅レートにおけるベースライン領域の末尾及び遷移部を定義する。領域20内の特定の遷移点の識別は、基礎をなすプロセスの振る舞いを分析するのに有用であろう。代表的なPCR曲線においては、エルボー値又はサイクル閾値(Ct)と呼ばれる遷移点の識別は、PCRプロセスの効率特性を理解するのに有用である。
【0021】
類似のシグモイド又は成長曲線を提供可能であるその他のプロセスは、バクテリアプロセス、酵素プロセス、及びバインディングプロセスを含む。例えば、バクテリア成長曲線においては、関心の対象である遷移点は、ラグフェーズ内の時間λと呼ばれている。本発明によって分析可能であるデータ曲線を生成するその他の特定のプロセスは、SDA(Strand Displacement Amplification)プロセス、NASBA(Nucleic Acid Sequence−Based Amplification)プロセス、及びTMA(Transcription Mediated Amplification)プロセスを含む。SDA及びNASBAプロセス及びデータ曲線の例については、それぞれ、Wang, Sha−Sha他による「Homogeneous Real−Time Detection of Sigle−Nucleotide Polymorphisms by Strand Displacement Amplification on the BD ProbeTec ET System」(Clin Chem 2003 49(10):1599)及びWeusten, Jos J.A.M.他による「Principles of Quantitation of Viral Loads Using Nucleic Acid Sequence−Based Amplification in Combination With Homogeneous Detection Using Molecular Beacons」(Nucleic Acids Research、2002 30(6):26)に見出すことができる。従って、本明細書の残りの部分は、PCR曲線に対するその適用性の観点において本発明の態様及び観点について説明しているが、本発明は、その他のプロセスに関係したデータ曲線に適用することも可能であることを理解されたい。
【0022】
図1に示されているように、代表的なPCR成長曲線のデータは、PCRサイクル数がx軸を定義し、且つ、蓄積されたポリヌクレオチド成長のインジケータがy軸を定義する2次元座標系において表現可能である。通常、図1に示されているように、蓄積された成長のインジケータは、蛍光強度値であり、この理由は、蛍光マーカーの使用が、おそらくは、最も広範に使用されている標識方式であるということによる。但し、使用される特定の標識及び/又は検出方式に応じて、その他のインジケータを使用することも可能であることを理解されたい。発生量又は蓄積された信号成長のその他の有用なインジケータの例は、ルミネッセンス強度、ケミルミネッセンス強度、バイオルミネッセンス強度、燐光強度、電荷移動、電圧、電流、電力、エネルギー、温度、粘度、光散乱、放射線強度、反射率、透過率、及び吸収率を含む。又、サイクルの定義も、時間、プロセスサイクル、単位動作サイクル、及び再生サイクルを包含可能である。
【0023】
本発明によれば、キネティックPCR増幅曲線の温度シフトについて補正するプロセス100のある観点は、図5を参照して説明可能である。段階110において、曲線を表す実験データセットを受信するか、さもなければ、取得する。又、温度シフトが発生したサイクルも識別する。通常、このサイクルの値は、先験的に判明しており、例えば、データを供給する装置又は機器によって記録される。プロットされたPCRデータセットの例が図1、図3、及び図4に示されており、この場合に、y軸及びx軸は、それぞれ、PCR曲線における蛍光強度及びサイクル数を表している。特定の態様においては、データセットは、連続的であると共に軸に沿って均一に離隔したデータを含むことを要する。
【0024】
サーモサイクラなどのPCRデータ取得装置内に存在するインテリジェンスモジュール(例えば、命令を実行するプロセッサ)内にプロセス100を実装するケースにおいては、データセットは、データの収集に伴って、リアルタイムでインテリジェンスモジュールに供給可能であり、或いは、メモリユニット又はバッファ内に保存し、実験が完了した後にインテリジェンスモジュールに供給することも可能である。同様に、データセットは、(例えば、LAN、VPN、イントラネット、インターネットなどの)ネットワーク接続又は取得装置に対する(例えば、USB又はその他の直接的な有線又は無線接続などの)直接接続を介して、デスクトップコンピュータやその他のコンピュータシステムなどの別個のシステムに供給することも可能であり、或いは、CD、DVD、フロッピー(登録商標)ディスク、携帯型USBドライブ、又はこれらに類似したものなどの携帯型媒体上において供給することも可能である。特定の態様においては、データセットは、座標値のペア(又は、2次元ベクトル)を具備するデータポイントを含む。PCRデータの場合には、座標値のペアは、通常、サイクル数と蛍光強度値を表す。段階110においてデータセットを受信又は取得した後に、データセットを更に分析し、例えば、検定の際の温度シフトについて補正可能である。
【0025】
段階120において、例えば、サイクル1から最終サイクルまでのデータセットに基づいて、第1近似を演算する。この段階においては、ある態様においては、Levenberg−Marquardt(LM)回帰プロセス又はその他の回帰プロセスによって決定されたパラメータを有するダブルシグモイド関数を使用し、データセットを表す曲線の近似を見出している。又、後程詳述するように、段階120においては、データセットに基づいて、第1近似とは異なる第2近似をも演算する。
【0026】
ある態様によれば、その内部に内蔵されたステップ関数を有する非線形モデルの信頼域を使用している。ある態様によれば、「PCR Elbow Determination Using Curvature Analysis of a Double Sigmoid」という名称の米国特許出願第11/533,291号及び「PCR Elbow Determination Using Quadratic Test for Curvature Analysis of a Double Sigmoid」という名称の米国特許出願第11/861,188号に提示されたダブルシグモイドモデルに基づいて構築することにより、次の式1に規定された関数を第1非線形モデルとして使用している。
【0027】
【数1】
式1 非線形モデル
【0028】
式1において、{a、b、c、d、e、f、g、h}は、モデル係数であり、cacは、アニーリング温度が変化したサイクル数である。cac値は、既知であり、且つ、システムによって供給される。係数「h」は、ジャンプ不連続部の大きさを表す。(例えば、後程詳述するLevenberg−Marquardt法などの)非線形回帰法を使用し、非線形モデルに対応する係数を導出する。非線形回帰は、通常、アプリケーションに固有である適切な大域的収束のために、初期係数の組を必要とする。回帰プロセス及びパラメータ決定の詳細については、更に詳しく後述する。
【0029】
ある態様においては、式2に定義されたUnitStep関数を使用する。
【0030】
【数2】
式2 UnitStep関数
【0031】
ある態様によれば、第2モデルを式3のように規定している。
【0032】
【数3】
式3 追加の非線形モデル
【0033】
ある観点においては、第2非線形モデルを使用し、標的を有していない反応井戸から生成された蛍光データを正確に表現している。(例えば、最小二乗QRDフィットやその他の回帰法などの)非線形回帰法を使用し、第2非線形モデルに対応する係数を導出する。
【0034】
厳格な数学的観点においては、且つ、前述の態様の式において観察可能であるように、本発明の方法において実装される第2関数は、非線形関数ではなく、線形関数と表記可能であろう。但し、本発明の方法においては、この第2関数を非線形関数として取り扱っているため、本特許出願の文脈においては、これを非線形関数と表記する。
【0035】
ある態様によれば、段階130において、式1に規定されたモデルと式3に規定されたモデルの間において選択を実行する。式1に規定されたモデルと式3に規定されたモデルの間の選択は、特定の観点においては、非パラメトリック情報理論に基づいた方法を使用して実行される。ある態様においては、式4に定義された改良型Akaike Information Coefficient(aic)を非線形回帰モデル(式1及び2)のそれぞれのものについて算出している。この態様においては、最小の係数を有する回帰モデルがベストフィットであると仮定している。ある観点においては、バイアス値を式3によって規定されたモデルから減算している。このバイアスにより、成長を伴わないサンプルを正確に検出可能である。バイアス値は、0(バイアスなし)〜約50の範囲をとることができる。特定の観点においては、約10のバイアスを減算している。
【0036】
【数4】
式4 改良型Akaike情報係数
【0037】
式4において、
【0038】
【数5】
【0039】
は、予測残差であり、nは、蛍光取得サイクルの数であり、且つ、mは、モデルの自由度である(例えば、式1の場合には、8であり、式3の場合には、3である)。
【0040】
ある態様によれば、段階140において、(例えば、R2などの)適合度統計値を算出し、モデル式が実際に蛍光データにマッチングしていることを検証する。この統計値が、予め定義された範囲を外れている場合には、モデルは、収束しておらず、従って、蛍光の不連続部補正を実行しない。例えば、ある観点においては、R2<0.8である場合に、収束は実現されない。
【0041】
R2値は、未加工の曲線(蛍光データ)及び推定モデルとの関係において演算される。ある観点においては、R2値を演算するための式は、次のように付与される。
【0042】
【数6】
【0043】
ここで、yは、未加工のデータ曲線を表し、f(x)は、モデル化された曲線を表し、
【数7】
は、未加工のデータ曲線の平均値を表し、且つ、nは、未加工のデータ曲線の(サイクル数を単位とする)長さを表す。
【0044】
ある態様によれば、段階150において、いずれが選択されたのかに応じて、式1又は式3から、h係数の信頼区間を所与の(例えば、90%〜99.9%の間の95%などの)信頼レベルにおいて算出する。この信頼区間が値ゼロを含む場合には、モデルは、過剰決定パラメータとしての係数hを具備する。このようなケースにおいては、データ内の不連続部は識別されず、従って、蛍光の不連続部補正は不要である。h係数の信頼区間演算は、選択されたモデル及びモデルの標準誤差に依存している。特定の態様においては、信頼区間の幅を次のように決定している。
【0045】
【数8】
【0046】
ここで、1.96は、95%の信頼を表し、H−1は、h係数のヘッセ行列の逆行列を表し、且つ、stdErrorは、選択されたモデルの標準誤差を表す。ヘッセ行列は、次のように演算される。
【0047】
【数9】
【0048】
ここで、Jは、ヤコビ行列であり、JTは、ヤコビ転置行列である。ヤコビは、すべての蛍光サイクルにおけるそれぞれのモデル係数の一次偏微分係数の評価である。標準誤差は、次のように演算される。
【0049】
【数10】
【0050】
ここで、yは、未加工の曲線を表し、f(x)は、モデル化された曲線を表し、且つ、nは、曲線の長さを表す。信頼区間の下限及び上限は、h±ciとして演算され、ここで、hの値は、推定モデルによって付与される。
【0051】
段階140及び段階150(段階165を含む)は、相互交換可能であり、且つ、いずれも任意選択であることを理解されたい。
【0052】
ある態様によれば、段階170において、ステップ又はシフト補正済みのデータセットを生成する。ある観点においては、係数hをゼロに等しくなるように設定することによって選択されたモデルから得られた値により、未加工の蛍光強度データ値を置換している。ある観点においては、アニーリング温度の変化の前に発生するサイクルについて置換を実行し、これにより、ジャンプ不連続部を効果的に除去すると共に滑らかな遷移を保証している。ある観点においては、例えば、サイクル1〜サイクルcac+1のように、第1サイクルから始まってアニーリング温度の変化が発生したサイクルの後のサイクルを含むものまで、置換を実行している。
【0053】
段階175において、例えば、表示又は更なる処理のために、変更されたシフト補正済みのデータセットを返す。例えば、補正済みの曲線を処理してCt値を決定可能であり、且つ、結果(シフト補正済みのデータ及び/又はCt値)を、例えば、分析を実行したシステムに、或いは、分析を要求した別個のシステムに返すことができる。図5の分析を実行したシステムに結合されたモニタ画面又はプリンタなどの表示装置によってグラフィカルな表示を生成可能であり、或いは、表示装置上においてレンダリングするべく別個のシステムにデータを供給することも可能である。Ct値は、補正済みのデータセットを使用して様々な方法に従って決定可能である。例えば、ある観点においては、米国特許出願第11/316,315号及び第11/349,550号の開示内容を使用し、Ct値を決定可能である。
【0054】
ある態様においては、式1には、係数の3つの組を導出するための3つの異なる開始条件を提供し、且つ、式3には、係数の単一の組を導出するための開始条件の単一の組を提供している。この態様においては、前述のように、係数の4つの導出された組を使用して式4を処理し、最小のaic値を有するモデルを決定する。プロセスをモデル化するべく使用される非線形式のそれぞれのものごとに、異なる開始条件を使用可能であることを理解されたい。特定の態様においては、開始条件は、経験的に決定される。
【0055】
図6の段階502〜段階524は、データセットの曲線を近似すると共にフィット関数のパラメータを決定するプロセスフローを示す。ある態様においては、Levenberg−Marquardt(LM)法を使用し、曲線のポイント上におけるデータセットの安定した曲線近似を算出する。LM法は、非線形回帰プロセスであり、これは、非線形関数とデータセットの間の距離を最小化する反復的な技法である。このプロセスは、とうげ点プロセスとガウス−ニュートンプロセスの組み合わせのように動作し、現在の近似が良好にフィットしない場合には、とうげ点プロセスのように動作するが(相対的に低速であるが、相対的に信頼性の高い収束)、現在の近似が正確になるのに伴って、ガウス−ニュートンプロセスのように動作することになる(相対的に高速であるが、相対的に信頼性の乏しい収束)。
【0056】
一般に、LM回帰法は、様々な入力を必要とすると共に出力を供給するアルゴリズムを含む。ある観点においては、入力は、処理対象のデータセットと、データをフィッティングするのに使用される関数と、関数のパラメータ又は変数の初期推定値と、を含む。出力は、関数とデータセットの間の距離を極小化する関数のパラメータの組を含む。
【0057】
ある態様によれば、フィット関数は、次の形態のダブルシグモイドである。
【0058】
【数11】
【0059】
この式のフィット関数としての選択は、一般的なPCR曲線又はその他の成長曲線がとり得る様々な曲線形状にフィットするその柔軟性及びその能力に基づくものである。当業者は、前述のフィット関数の変形又はその他のフィット関数を必要に応じて使用可能であることを理解するであろう。例えば、ある態様においては、式1が使用される。
【0060】
ダブルシグモイド式(5)は、a、b、c、d、e、f、及びgという7つのパラメータを具備し、式1は、a、b、c、d、e、f、g、及びhという8つのパラメータを具備する。この式は、定数、スロープ、及びダブルシグモイドの合計に分解可能である。ダブルシグモイド自体は、2つのシグモイドの乗算である。図7は、ダブルシグモイド式(5)の分解を示す。パラメータd、e、f、及びgは、2つのシグモイドの形状を決定する。最終的な曲線に対するこれらの影響を示すべく、次の単一のシグモイドを検討してみよう。
【0061】
【数12】
【0062】
ここで、パラメータdは、曲線の「鋭さ」を決定し、且つ、パラメータeは、変曲点のx値を決定する。図8は、曲線に対するパラメータdの、そして、変曲点のx値の位置に対するパラメータeの影響を示す。次の表1は、ダブルシグモイド曲線に対するパラメータの影響を示している。
【0063】
【表1】
【0064】
ある観点においては、曲線が非現実的な形状をとることを防止するべく、ダブルシグモイド式の「鋭さ」パラメータd及びfを制限する必要がある。従って、ある観点においては、d<−1又はd>1.1、或いは、f<−1又はf>1.1におけるすべての反復を不成功と見なしている。その他の態様においては、パラメータd及びfに対する異なる制限を使用可能である。
【0065】
Levenberg−Marquardtアルゴリズムは、反復的なアルゴリズムであるため、通常、フィットのための関数パラメータの初期推定値が必要である。初期推定値が良好であるほど、近似が良好になり、且つ、アルゴリズムが局所的な最小値に向かって収束する確率が低下する。ダブルシグモイド関数の複雑性及びPCR曲線又はその他の成長曲線の様々な形状に起因し、アルゴリズムがしばしば局所的な最小値に向かって収束することを防止するには、すべてのパラメータ用の1つの初期推定値では、十分ではない可能性がある。従って、ある観点においては、初期パラメータの複数(例えば、3つ以上)の組を入力し、且つ、最良の結果を保持している。ある観点においては、パラメータの大部分を、使用されるパラメータの複数の組にわたって一定に保持しており、パラメータc、d、及fのみが複数のパラメータセットのそれぞれのものについて異なるものであってよい。図9は、異なるパラメータセットにおける3つの曲線形状の例を示す。これらのパラメータの3つの組の選択肢は、PCRデータを表す曲線の3つの可能な異なる形状を示す。パラメータの3つを上回る数の組を処理し、且つ、最良の結果を保持可能であることを理解されたい。
【0066】
図6に示されているように、段階510において、LM法の初期入力パラメータを識別する。これらのパラメータは、オペレータによって入力可能であり、或いは、算出することも可能である。ある観点によれば、後述するように、段階502、504、及び506に従ってパラメータを決定又は設定している。
【0067】
初期パラメータ(a)の算出:パラメータ(a)は、ベースラインの高さであり、この値は、初期パラメータのすべての組について同一である。ある観点においては、段階504において、データセットから、例えば、蛍光値などの3番目に小さいy軸値をパラメータ(a)に割り当てている。これにより、安定した計算が実現する。当然のことながら、その他の態様においては、必要に応じて、最低のy軸値や2番目に小さい値などの任意のその他の蛍光値をパラメータ(a)に割当可能である。
【0068】
初期パラメータ(b)の計算:パラメータ(b)は、ベースライン及びプラトーのスロープである。この値は、初期パラメータのすべての組について同一である。ある観点においては、段階502において、0.01という固定値を(b)に割り当てており、これは、理想的には、スロープが存在するべきではないという理由による。その他の態様においては、例えば、0〜約0.5の範囲の値などの異なる値をパラメータ(b)に割り当て可能である。ある観点においては、値(b)は、CAC+1からベースラインの末尾までのベースラインのスロープを表す。
【0069】
初期パラメータ(c)の計算:パラメータ(c)は、プラトーの高さからベースラインの高さを減算したものを意味しており、これは、AFI(Absolute Fluorescence Increase)と表記される。ある観点においては、パラメータの第1の組については、c=AFI+2であり、最後の2つのパラメータについては、c=AFIである。これが図9に示されており、この場合には、最後の2つのパラメータの組については、c=AFIであり、パラメータの最初の組については、c=AFI+2である。この変化は、パラメータの第1の組によってモデル化された曲線の形状に起因するものであり、これは、プラトーを具備していない。
【0070】
パラメータ(d)及び(f)の計算:パラメータ(d)及び(f)は、2つのシグモイドの鋭さを定義している。これらのパラメータにおける曲線に基づいて近似を付与する方法は存在しないことから、ある観点においては、段階502において、3つの代表的な固定値を使用している。その他の固定された又は固定されていない値をパラメータ(d)及び/又は(f)に使用することも可能であることを理解されたい。これらのペアは、遭遇するPCR曲線の最も共通的な形状をモデル化する。次の表2は、図9に示されたパラメータの異なる組における(d)及び(g)の値を示す。
【0071】
【表2】
【0072】
パラメータ(e)及び(g)の計算:段階506において、パラメータ(e)及び(g)を決定する。パラメータ(e)及び(g)は、2つのシグモイドの変曲点を定義している。ある観点においては、これらは、いずれも、すべての初期パラメータセットにわたって、同一の値をとる。パラメータ(e)及び(g)は、同一又は異なる値を具備可能である。近似を見出すべく、ある観点においては、例えば、蛍光などの強度の平均を上回る第1ポイントのx値を使用している(これは、スパイクではない)。この態様に従って(e)及び(g)の値を決定するプロセスが図10に示されており、且つ、以下、これについて説明する。この態様に従ってパラメータ(e)及び(g)及びその他のパラメータの値を決定するプロセスの更に詳細な説明は、米国特許出願第11/316,315号に見出すことができる。
【0073】
図10を参照すれば、まず、(例えば、蛍光強度などの)曲線の平均を決定する。次に、平均を上回る第1データポイントを識別する。次いで、a.そのポイントが、曲線の、例えば、最初の5サイクル内などのような開始点の近傍に位置していないかどうか、b.そのポイントが、曲線の、例えば、最後の5つのサイクル内などのような末尾の近傍に位置していないかどうか、並びに、c.そのポイントの周り(例えば、その周りの2ポイントの半径内)の微分係数が、符号の変化を示していないかどうかを決定する。これらが変化を示している場合には、そのポイントは、スパイクである可能性が高く、且つ、従って、拒絶することを要する。
【0074】
別の態様においては、係数(e)及び(g)の決定において、cacサイクルの後のサイクルの蛍光値のみを検討している。従って、近似を見出すべく、cacから最後のサイクルまでのサイクルの、例えば、蛍光などの強度の平均を上回る(スパイクではない)第1ポイントのx値を使用する。まず、(サイクルcacから最後のサイクルまでの)曲線の平均を決定し、且つ、平均を上回る第1ポイントを決定する。このようなポイントが見出されない場合には、ある観点においては、未加工の曲線の長さの2/3を検討する。
【0075】
次の表3は、ある観点による図9において使用される初期パラメータ値の例を示す。
【0076】
【表3】
【0077】
図6を再度参照すれば、段階510において、すべてのパラメータが設定されたら、入力されたデータセット、関数、及びパラメータを使用し、LMプロセス520を実行する。従来、Levenberg−Marquardt法は、非線形最小二乗問題を解決するべく使用されている。従来のLM法は、曲線近似とデータセットの間の誤差の二乗の合計として定義された距離尺度を算出している。しかしながら、二乗の合計を極小化する場合には、異常値の距離がスパイクではないデータポイントの距離を上回っていることから、異常値に対して大きな重みが付与されることになり、この結果、しばしば、不適切な曲線、又は望ましくない曲線が得られる。従って、本発明のある観点によれば、絶対誤差の合計を極小化することにより、近似とデータセットの間の距離を演算しており、この理由は、この場合には、大きな重みが異常値に対して付与されないためである。この態様においては、近似とデータの間の距離は、次式によって付与される。
【0078】
【数13】
【0079】
上述のように、ある態様においては、段階522及び524に示されているように、初期パラメータの複数(例えば、3つ)の組のそれぞれのものを入力して処理した後に、最良の結果を保持しており、この場合に、最良の結果とは、式(7)における最も小さい又は最小の距離を提供するパラメータセットである。ある観点においては、パラメータの大部分をパラメータの複数の組にわたって一定に保持しており、パラメータのそれぞれの組について異なることができるのは、c、d、及びfのみである。任意の数の初期パラメータセットを使用可能であることを理解されたい。
【0080】
図11は、本発明によるパラメータの組におけるLMプロセス520のプロセスフローを示す。前述のように、Levenberg−Marquardt法は、とうげ点プロセスのように、又はガウス−ニュートンプロセスのように動作可能である。この動作は、減衰係数λに依存している。λが大きいほど、Levenberg−Marquardtアルゴリズムは、とうげ点プロセスのように動作する。一方、λが小さいほど、Levenberg−Marquardtアルゴリズムは、ガウス−ニュートンプロセスのように動作することになる。ある観点においては、λは、0.001から始まっている。λは、約0.000001〜約1.0などの任意のその他の値から始まることも可能であることを理解されたい。
【0081】
前述のように、Levenberg−Marquardt法は、反復的な技法である。ある観点によれば、図11に示されているように、それぞれの反復において、次の段階を次実行している。
【0082】
1.先行する近似のヘッセ行列(H)を算出する。
【0083】
2.先行する近似の転置ヤコビ行列(JT)を算出する。
【0084】
3.先行する近似の距離ベクトル(d)を算出する。
【0085】
4.現在の減衰係数λにより、次のように、ヘッセ行列の対角項を増大させる。
【0086】
【数14】
【0087】
5.増大した式を次のように解く。
【0088】
【数15】
【0089】
6.増大した式の解xを関数のパラメータに追加する。
【0090】
7.新しい近似及び曲線の間の距離を算出する。
【0091】
8.このパラメータの新しい組に伴う距離が以前のパラメータの組に伴う距離を下回っている場合には、・その反復は成功であると見なされ、・新しいパラメータの組を保持又は保存し、且つ、・例えば、係数10だけ、減衰係数λを低減する。
【0092】
新しいパラメータの組に伴う距離が以前のパラメータの組に伴う距離を上回っている場合には、・その反復は失敗であると見なされ、・新しいパラメータの組を破棄し、且つ、・例えば、係数10だけ、減衰係数λを増大させる。
【0093】
ある観点においては、図11のLMプロセスは、次の基準の中の1つのものが実現される時点まで反復される。
【0094】
1.既定の回数Nだけ既に反復されている。この第1基準は、アルゴリズムが無制限に反復されることを防止する。例えば、図10に示されたある観点においては、既定の反復値Nは、100である。アルゴリズムが収束可能である場合には、100回の反復は、アルゴリズムが収束するのに十分であるはずである。一般に、Nは、10未満から100以上の範囲をとることができる。
【0095】
2.2つの成功した反復の間の距離の差が、例えば、0.0001などの閾値を下回っている。差が非常に小さくなった際には、所望の精度が実現されており、解は、それ以上大幅に良好にはなることはないことから、反復を継続するのは無意味である。
【0096】
3.減衰係数λが既定の値を超過し、例えば、1020を上回っている。λが非常に大きくなった際には、アルゴリズムは、現在の解よりも良好に収束することはなく、従って、反復を継続するのは無意味である。一般に、規定値は、1020を大幅に下回る又は上回るものであってよい。
【0097】
別の態様によれば、使用するLevenberg−Marquardt法は、次の式10に規定された式と等価である。初期条件z0及び(例えば、既定により、10-3に設定される)精度レベルtolを有するベクトル関数
【0098】
【数16】
【0099】
が付与された場合に、式10は、真である。関数J(z)は、関数f(z)のヤコビ行列として定義される。変数maxiterは、反復の最大数である(例えば、既定により、100に設定される)。変数λは、回帰における減衰係数である。
【0100】
【数17】
式10 Levenberg−Marquartdt非線形回帰
【0101】
式10における逆行列は、QR分解によって取得される。ある観点においては、QR分解は、Anderson, E.(編集)の「LAPACK Users’ Guide」(第3版、Philadelphia, PA: Society for Industrial and Applied Mathematics、1999年)のDGELS法に類似している。逆行列を決定不能である場合には、λに2(又は、その他の値)を乗算して回帰を継続する。
【0102】
本発明の方法、システム、及びコンピュータ可読媒体の特定の態様においては、第1及び第2近似のそれぞれのものの情報係数を決定する段階は、第1及び第2近似のそれぞれのもののAIC(Akaike Information Coefficient)値を算出する段階を包含可能である。
【0103】
特定の態様においては、本発明による方法、システム、及びコンピュータ可読媒体は、第2非線形関数について算出されたAIC値からバイアス値を減算する段階を更に包含可能である。
【0104】
本発明の方法、システム、及びコンピュータ可読媒体の特定の態様においては、情報係数に基づいて近似の中の1つものを選択する段階は、最低のAIC値を具備する近似を選択する段階を含む。
【0105】
本発明の方法及びコンピュータ可読媒体の特定の態様においては、データセットは、キネティックポリメラーゼ連鎖反応(PCR)プロセスの成長曲線を表すことが可能であり、この場合に、座標値のペアは、増幅されたポリヌクレオチドの蓄積及びサイクル数を表すことができる。
【0106】
本発明の方法及びコンピュータ可読媒体の特定の態様においては、増幅されたポリヌクレオチドの蓄積は、蛍光強度値、ルミネッセンス強度値、ケミルミネッセンス強度値、燐光強度値、電荷移動値、バイオルミネッセンス強度値、又は吸収率値の中の1つのものによって表すことができる。
【0107】
本発明の方法及びコンピュータ可読媒体の特定の態様においては、データセットは、キネティックポリメラーゼ連鎖反応(PCR)プロセス、バクテリアプロセス、酵素プロセス、又はバインディングプロセスの成長曲線を表すことが可能である。
【0108】
本発明による特定の態様においては、置換されるデータセットの部分は、第1データポイントから始まってステップ型不連続部が発生するデータポイントを含むものまでのデータセットの部分を包含可能である。
【0109】
又、インテリジェンスモジュールは、選択の後に、選択された近似の適合度の値を算出し、且つ、適合度の値が閾値を上回る場合にのみ、継続するべく更に適合可能である。
【0110】
本発明によるシステムの特定の態様においては、インテリジェンスモジュールは、第2非線形関数について算出されたAIC値からバイアス値を減算するべく更に適合可能である。
【0111】
本発明によるシステムの特定の態様においては、情報係数に基づいて近似の中の1つのものを選択する段階は、最低のAIC値を具備する近似を選択する段階を包含可能である。
【0112】
本発明によるシステムの特定の態様においては、キネティックPCR分析モジュールは、キネティックサーモサイクラ装置内に存在可能であり、この場合に、インテリジェンスモジュールは、分析モジュールに通信可能に結合されたプロセッサを包含可能である。
【0113】
本発明によるシステムの特定の態様においては、インテリジェンスモジュールは、ネットワーク接続又は直接接続の中の1つのものによって分析モジュールに結合されたコンピュータシステム内に存在するプロセッサを包含可能である。
【0114】
本発明によるシステムの特定の態様においては、置換されるデータセットの部分は、ステップ型不連続部が発生したデータポイントの後のデータポイントを包含可能である。
【0115】
本発明によるコンピュータ可読媒体の特定の態様においては、置換されるデータセットの部分は、ステップ型不連続部が発生したデータポイントの後のデータポイントを包含可能である。
【0116】
本発明による方法の特定の態様においては、置換されるデータセットの部分は、ステップ型不連続部が発生したデータポイントの後のデータポイントを包含可能である。
【0117】
特定の態様においては、本発明による方法は、限定を伴うことなしに、キーボード、マウス、及びこれらに類似したものなどのデータセットを入力するための入力装置と、モニタなどの曲線の領域内の関心の対象である特定のポイントを表すための表示装置と、CPUなどの方法のそれぞれの段階を実行するのに必要な処理装置と、モデムなどのネットワークインターフェイスと、データセットを保存するためのデータストレージ装置と、プロセッサ上において稼働するコンピュータコードと、これらに類似したものと、を含む従来のパーソナルコンピュータシステムを使用することによって実装可能である。更には、方法は、本発明によるPCR装置内において実装することも可能である。
【0118】
本発明によるシステムの一例が図16〜図17に示されている。図16は、本発明の方法及びシステムを実装するべく使用可能なソフトウェア及びハードウェアリソースの間の関係を説明する概略ブロックダイアグラムを示す。図17に示されたシステムは、サーモサイクラ装置内に配置可能なキネティックPCR分析モジュールと、コンピュータシステムの一部であるインテリジェンスモジュールと、を有する。データセット(PCRデータセット)は、ネットワーク接続又は直接接続を介して、分析モジュールからインテリジェンスモジュールに、或いは、この反対方向に、転送される。データセットは、例えば、図5、図6、図10、及び図11に示されたフローチャートに従って処理可能である。これらのフローチャートは、例えば、図16に示されたフローチャートに従って、コンピュータシステムのハードウェア上に保存されたソフトウェアによって便利に実装可能である。図16を参照すれば、コンピュータシステム(200)は、例えば、PCR反応において得られた蛍光データを受信する受信手段(210)と、本発明の方法に従って前述のデータを処理する計算手段(220)と、計算手段によって得られた結果に従って前述のデータの一部を置換する適用手段(230)と、コンピュータ画面上に結果を表示する表示手段(249)と、を有することができる。図17は、サーモサイクラ装置とコンピュータシステムの間のやり取りを示す。本システムは、サーモサイクラ装置内に配置可能であるキネティックPCR分析モジュールと、コンピュータシステムの一部であるインテリジェンスモジュールと、を有する。データセット(PCRデータセット)は、分析モジュールからインテリジェンスモジュールに、或いは、この反対方向に、ネットワーク接続又は直接接続を介して転送される。データセットは、プロセッサ上において稼働すると共にインテリジェンスモジュールのストレージ装置内に保存されたコンピュータコードにより、図16に従って処理され、且つ、処理の後に、分析モジュールのストレージ装置に返送可能であり、ここで、変更済みのデータを表示装置上に表示可能である。
【0119】
前述のように、本発明のシステム及び方法は、ポリメラーゼ連鎖反応データ内のステップ型不連続部を除去するために有用である。例えば、蛍光データを使用してポリメラーゼ連鎖反応をモニタリングする際には、本発明のシステム及び方法は、相対的に正確なデータを提供する。このようなデータは、反応をモニタリングするのに有用であるのみならず、PCRにおいて増幅された標的核酸の定量化又は得られたデータに応じたPCRの反応条件の適合などの技術的な効果をも提供する。
【0120】
以下の例及び図は、本発明の理解を支援するべく提供されるものであり、本発明の真の範囲は、添付の請求項に記述されているとおりである。本発明の精神を逸脱することなしに、記述された手順における変更を実施可能であることを理解されたい。
【0121】
(例)
(ケース1)
これは、CAP/CTM HIVモニタ検定からのIQS(HEXチャネル)蛍光データである。検定設計は、サイクル15の後にジャンプ不連続部を具備する。図12は、未加工の蛍光データ(点線)と、補正済みのデータ(実線)と、を示す。次の表4は、推定された係数と、対応する信頼区間と、を示す。ケース1のR2は、0.99を上回っている。
【0122】
【表4】
【0123】
(ケース2)
これは、実際の標的の増幅を伴わないB19パルボウイルス標的チャネル(FAMチャネル)である。検定設計は、サイクル5の後にジャンプ不連続部を具備する。図13は、未加工の蛍光データ(点線)と、補正済みのデータ(実線)と、を示す。次の表5は、推定されたモデル係数と、それらの対応する信頼区間と、を示す。ケース2のR2は、0.94である。
【0124】
【表5】
【0125】
(ケース3)
これは、HBV High Pure(FAMチャネル)の標的である。この検定は、ジャンプ不連続部を具備しない。このケースにおける係数hの信頼区間は、ゼロを含むことになる。従って、不連続部の補正は不要である。図14は、未加工のデータ(点線)と、補正済みのデータ(実線)と、を示す。次の表6は、推定されたモデル係数と、それらの対応する信頼区間と、を示す。ケース3のR2は、0.99を上回っている。
【0126】
【表6】
【0127】
(ケース4)
これは、高濃度(2.9×1011IU/ml)のB19パルボウイルスサンプル(FAMチャネル)である。検定設計は、サイクル5の後にジャンプ不連続部を具備するが、大きな複写数に起因し、不連続部は観察されない。前述の方法は、このケースを上手に取り扱うことができる。図15は、未加工のデータ(点線)と、補正済みのデータ(実線)と、を示す。このケースにおける係数hの信頼区間はゼロを含む。次の表7は、推定されたモデル係数と、それらの対応する信頼区間と、を示す。ケース4のR2は、0.99を上回る。
【0128】
【表7】
【0129】
以上、例示目的で、且つ、特定の態様の観点で本発明について説明したが、本発明は、開示された態様に限定されないことを理解されたい。
【技術分野】
【0001】
本発明は、一般に、ポリメラーゼ連鎖反応システムに関し、更に詳しくは、ポリメラーゼ連鎖反応データ内のステップ型不連続部を除去するシステム及び方法に関する。
【背景技術】
【0002】
ポリメラーゼ連鎖反応(Polymerase Chain Reaction:PCR)は、既定の核酸配列を酵素によって合成又は増幅する生体内(in vivo)法である。その反応は、通常、2つのオリゴヌクレオチドプライマーを使用し、これらが両側の鎖にハイブリダイズし、増幅対象の鋳型又は標的DNA配列に隣接する。プライマーは、熱安定性DNAポリメラーゼの触媒作用によって伸長する。鋳型変性、プライマーアニーリング、及びポリメラーゼによるアニーリングされたプライマーの伸長を伴う反復的な一連のサイクルの結果として、特定のDNA断片が指数的に蓄積される。通常、このプロセスにおいては、増幅プロセスの検出及び定量化を円滑に実行するべく、蛍光ブローブ又はマーカーが使用される。
【0003】
図1には、代表的なリアルタイムPCR曲線が示されており、代表的なPCRプロセスにおける蛍光強度値がサイクル数に対してプロットされている。この場合、PCRプロセスのそれぞれのサイクルにおいて、PCR産物の形成がモニタリングされる。増幅は、通常、増幅反応の際の蛍光信号を計測するコンポーネント及び装置を含むサーモサイクラ内において計測される。このようなサーモサイクラの一例が、Roche Diagnostics LightCycler(Cat. No. 20110468)である。増幅産物は、例えば、標的核酸にバインドされた際にのみ蛍光信号を放出する蛍光標識ハイブリダイゼーションプローブにより、或いは、特定のケースにおいては、二本鎖DNAに結合する蛍光染料により、検出される。
【0004】
リアルタイムPCRにおいて使用される蛍光染料は、温度感受性を有する。サーマルサイクリングプロファイルは、アニーリング温度を変更する段階を包含可能である。アニーリング温度の変化は、蛍光読取値の大きさの不連続部として出現する。図2は、サイクル6の後にアニーリング温度の変化が見られる具体例を示す。
【0005】
図2のプロファイルを使用して実施された実験に対応する蛍光データの読取値が図3に示されている。HEXチャネルにおいて、サイクル5とサイクル6の間に不連続部が存在することがはっきりと分かる。図3は、104IU/mlの濃度を有するB19パルボウイルスサンプルから採取した。温度に対する感受性が低いFAM染料の場合には、ジャンプ不連続部の大きさが、HEX染料よりも小さくなっている。
【0006】
但し、標的の濃度が増加した場合には、不連続部を蛍光データ内に反映させることができない可能性がある。例えば、2.9×1011IU/mlの濃度を有するB19パルボウイルスサンプルを検討すれば、サイクル5の後にアニーリング温度の変化が存在したにも拘わらず、不連続部は、図4aでは見られない。
【0007】
いくつかの現在のPCRシステムは、アニーリング温度の変化に起因したステップ型不連続部の除去のための方法を実装している。このようなシステムは、通常、予想されるアニーリング温度の変化及び最大蛍光の変化に対応するサイクル数用の検定固有の入力パラメータを必要としている。このような方法は、いくつかの制限を具備する。第1に、これらは、高滴定濃度サンプルを取り扱うことができない。これは、図4bで見ることができ、この場合には、2.9×1011IU/mlの濃度のB19パルボサンプルが、このようなシステムによって不正確に取り扱われている。第2に、このような方法が取り扱うことができるのは、不連続部の地点における小さな最大(例えば、5つの)絶対蛍光単位の変化のみである。不連続部における蛍光変化の大きさは、大きく変化することが複数の検定において観察されている。最大変化を通知するための検定固有の入力のセットアップは、最適化が困難である。第3に、このような方法は、ベースラインドリフトが大きい蛍光データを取り扱うことができないであろう。このようなケースにおいては、提供される補正が不十分なものとなろう。第4に、アニーニング温度の変化に対応するサイクル数から1つ以下のサイクルの距離にスパイクが存在する場合には、提供される補正により、報告される結果濃度の変化、即ち、誤った結果が生成されることが判明している。
【発明の概要】
【発明が解決しようとする課題】
【0008】
従って、前述の及びその他の問題を克服する、シグモイドタイプ又は成長曲線と、特に、PCR曲線を処理するシステム及び方法を提供することが望ましい。具体的には、これらのシステム及び方法は、確実且つ安定した方式における温度ステップ補正を実装することを要する。
【課題を解決するための手段】
【0009】
本発明は、PCRプロセスにおいて発生可能な温度シフトについてPCRデータを補正するシステム及び方法を提供する。
【0010】
本発明の態様は、リアルタイムポリメラーゼ連鎖反応データの蛍光のジャンプ不連続(jump discontinuity:第1種不連続部)を除去する。不連続部の存在は、不正確な結果計算を生成可能であり、且つ、従って、除去することが推奨される。標的の初期複写数に応じて、高濃度レベルにおいては、蛍光の不連続部が存在しない可能性がある。8パラメータ非線形モデルの信頼域を使用し、データを正確に推定する。本方法は、すべての濃度レベルにおける不連続部の除去のための従来の方法における問題点を克服する。
【0011】
ある態様においては、データセットをモデル化する非線形関数に非線形回帰プロセスを適用して非線形関数のステップ型不連続部パラメータを含むパラメータを決定することにより、受信したPCRデータセットにフィットする曲線に対する第1近似を決定する。非線形関数の一例は、ダブルシグモイド式である。又、第2の非線形関数に回帰プロセスを適用して第2の関数のステップ型不連続部パラメータを含むパラメータを決定することにより、PCRデータセットにフィットする曲線に対する第2の近似をも決定する。次いで、第1及び第2近似のそれぞれのものについて決定した情報係数に基づいて、第1又は第2近似の中の1つのものを選択する。ステップ型不連続部パラメータについて算出した信頼区間が値ゼロを含む(例えば、信頼区間が、値0を含む範囲(例えば、−1〜1)にわたって広がっている)場合には、ステップ補正を実行しない。信頼区間が値ゼロを含まない場合には、ステップ補正を実行する。ステップ補正を実行する場合には、ステップ型変化の前のデータ曲線の部分を、選択された近似の適切な部分と置換することにより、シフト補正済みのデータセットを生成する。特定の態様においては、近似が適合度(goodness of fit)の基準を満足しない場合には、ステップ補正を実行しない。シフト補正済みのデータセットを返し、表示可能であり、さもなければ、更なる処理のために使用可能である。
【0012】
ある態様によれば、成長プロセスを表すデータ内のステップ型不連続部を自動的に除去する方法が提供される。本方法は、通常、成長プロセスを表すデータセットを受信する段階であって、データセットは、複数のデータポイントを含み、それぞれのデータポイントは、座標値のペアを具備する、段階と、非線形回帰プロセスを第1非線形関数に適用して第1関数のパラメータを決定することにより、データセットにフィットする曲線の第1近似を算出する段階であって、パラメータは、ステップ型不連続部パラメータを含む、段階と、を含む。又、本方法は、通常、第2回帰プロセスを第2非線形関数に適用して第2関数のパラメータを決定する段階により、データセットにフィットする曲線の第2近似を算出する段階であって、第2関数のパラメータは、ステップ型不連続部パラメータを含む、段階と、第1及び第2近似のそれぞれのものについて情報係数を決定する段階と、情報係数に基づいて近似の中の1つのものを選択する段階と、をも含む。又、本方法は、通常、選択された近似のステップ型不連続部パラメータの信頼区間を決定する段階と、信頼区間が値ゼロを含まない(例えば、信頼区間が、値0を含まない範囲にわたって広がっている)場合に、ゼロに設定された対応するステップ型不連続部パラメータを有する選択された近似によってデータセットの一部を置換する段階と、をも含む。
【0013】
別の態様によれば、プロセッサを制御し、成長曲線を表すデータセット内のステップ型不連続部を自動的に除去するコードを含むコンピュータ可読媒体が提供される。コードは、通常、成長プロセスを表すデータセットを受信する段階であって、データセットは、複数のデータポイントを含み、それぞれのデータポイントは、座標値のペアを具備する、段階と、非線形回帰プロセスを第1関数に適用して第1関数のパラメータを決定することにより、データセットにフィットする曲線の第1近似を算出する段階であって、パラメータは、ステップ型不連続部パラメータを含む、段階と、を実行するためのコードを含む。又、コードは、通常、第2回帰プロセスを第2非線形関数に適用して第2関数のパラメータを決定することにより、データセットにフィットする曲線の第2近似を算出する段階であって、第2関数のパラメータは、ステップ型不連続部パラメータを含む、段階と、第1及び第2近似のそれぞれのものについて情報係数を決定する段階と、情報係数に基づいて近似の中の1つものを選択する段階と、を実行するコードをも含む。又、コードは、通常、選択された近似のステップ型不連続部パラメータの信頼区間を決定する段階と、信頼区間が値ゼロを含まない場合に、ゼロに設定された対応するステップ型不連続部パラメターを有する選択された近似によってデータセットの一部を置換する段階と、を実行する命令をも含む。
【0014】
更に別の態様によれば、それぞれのものが座標値のペアを具備する複数のデータポイントを含む、キネティックPCR増幅曲線を表すPCRデータセットを生成するキネティックPCR分析モジュールと、インテリジェンスモジュールと、を通常含むキネティックポリメラーゼ連鎖反応(PCR)システムが提供される。インテリジェンスモジュールは、通常、非線形回帰プロセスを第1非線形関数に適用してステップ型不連続部パラメータを含む第1関数のパラメータを決定することによってデータセットにフィットする曲線の第1近似を算出し、且つ、第2回帰プロセスを第2非線形関数に適用してステップ型不連続部パラメータを含む第2関数のパラメータを決定することによってデータセットにフィットする曲線の第2近似を算出することにより、PCRデータセットを処理してデータセット内のステップ型不連続部を自動的に除去するべく適合されている。又、インテリジェンスモジュールは、通常、第1及び第2近似のそれぞれのものについて情報係数を決定し、情報係数に基づいて近似の中の1つのものを選択し、選択された近似についてステップ型不連続部パラメータの信頼区間を決定し、且つ、信頼区間が値ゼロを含んでいない場合に、ゼロに設定された対応するステップ型不連続部パラメータを有する選択された近似によってデーセットの一部を置換するべく、適合されている。
【0015】
図面及び請求項を含む本明細書の残りの部分を参照することにより、本発明のその他の特徴及び利点について理解することができよう。以下、添付の図面との関係において、本発明の更なる特徴及び利点と本発明の様々な態様の構造及び動作について詳述する。添付図面においては、類似の参照符号により、同一又は機能的に類似した要素を示している。
【図面の簡単な説明】
【0016】
【図1】PCRプロセスの環境における増幅曲線の一例を示す。
【図2】サイクル6の後にアニーリング温度の変化が見られる具体例を示す。
【図3】104IU/mlの濃度を有するB19パルボウイルスサンプルから採取されたFEM及びHEXチャネルにおけるPCR増幅曲線を示す。
【図4A】標的の濃度が増大した場合に、不連続部が蛍光データ内に反映されない可能性があることを示すPCR増幅曲線を示す。
【図4B】標的の濃度が増大した場合に、不連続部が蛍光データ内に反映されない可能性があることを示すPCR増幅曲線を示す。
【図5】PCR増幅曲線内の温度シフトを補正するプロセスの一態様を示す。
【図6A】本発明の一態様によるスパイク識別及び置換プロセスの詳細なプロセスフローを示す。
【図6B】本発明の一態様によるスパイク識別及び置換プロセスの詳細なプロセスフローを示す。
【図6C】本発明の一態様によるスパイク識別及び置換プロセスの詳細なプロセスフローを示す。
【図6D】本発明の一態様によるスパイク識別及び置換プロセスの詳細なプロセスフローを示す。
【図6E】本発明の一態様によるスパイク識別及び置換プロセスの詳細なプロセスフローを示す。
【図7】パラメータa〜gを含むダブルシグモイド式の分解を示す。パラメータa〜gは、ダブルシグモイド曲線の形状及び位置を定義する。
【図8】曲線及び変曲点のx値である(e)の位置に対するパラメータ(d)の影響を示す。図8の曲線は、いずれも、パラメータdを除いて、同一のパラメータ値を具備する。
【図9】異なるパラメータセットにおける3つの曲線形状の一例を示す。
【図10A】ある観点によるダブルシグモイド式のパラメータ(e)及び(g)の値を決定するプロセスを示す。
【図10B】ある観点によるダブルシグモイド式のパラメータ(e)及び(g)の値を決定するプロセスを示す。
【図11A】パラメータの初期セットにおけるLevenberg−Marquardt回帰プロセスのプロセスフローを示す。
【図11B】パラメータの初期セットにおけるLevenberg−Marquardt回帰プロセスのプロセスフローを示す。
【図11C】パラメータの初期セットにおけるLevenberg−Marquardt回帰プロセスのプロセスフローを示す。
【図11D】パラメータの初期セットにおけるLevenberg−Marquardt回帰プロセスのプロセスフローを示す。
【図12】CAP/CTM HIVモニタ検定からのIQS(HEXチャネル)蛍光データを示す。未加工の蛍光データは、点線で示されており、補正済みのデータは、実線で示されている。
【図13】B19バルボウイルス標的チャネル(FAMチャネル)検定の(実際の標的の増幅を伴わない)蛍光データを示す。未加工の蛍光データは、点線で示されており、補正済みのデータは、実線で示されている。
【図14】HBV High Pure(FAMチャネル)の標的の蛍光データを示す。未加工の蛍光データは、点線で示されており、補正済みのデータは、実線で示されている。この検定は、ジャンプ不連続部を具備しておらず、従って、不連続部の補正は不要である。
【図15】高濃度(2.9×1011IU/ml)のB19パルボウイルスサンプル(FAMチャネル)検定の蛍光データを示す。未加工の蛍光データは、点線で示されており、補正済みのデータは、実線で示されている。
【図16】本発明の方法及びシステムを実装するべく使用可能なソフトウェア及びハードウェアリソースの間の関係を示す概略ブロックダイアグラムの一例である。
【図17】サーモサイクラ装置とコンピュータシステムの間の関係を示す概略ブロックダイアグラムの一例である。
【発明を実施するための形態】
【0017】
本発明は、増幅プロセスにおいて発生可能な温度シフトについてPCR増幅曲線及びその他の成長曲線を補正するシステム及び方法を提供する。
【0018】
温度シフトの一例は、検定の際の特定のサイクル内におけるアニーリング温度の制御された変化である。通常、この温度シフトは、ベースライン領域によって表されるプロセスの一部に発生する。この温度変化は、シフトが発生したサイクル数に、蛍光信号における後続のシフトを生成する。本明細書においては、温度シフトが発生したサイクルをCAC(Cycle of Annealing change:アニーリングが変化したサイクル)と呼ぶこととする。
【0019】
ある態様においては、デーセットをモデル化する非線形関数に非線形回帰プロセスを適用して非線形関数のステップ型不連続部パラメータを含むパラメータを決定することにより、PCRデータセットにフィットする曲線に対する第1近似を決定する。非線形関数の一例は、後程詳述するダブルシグモイド式である。又、回帰プロセスを第2非線形関数に適用して第2関数のステップ型不連続部パラメータを含むパラメータを決定することにより、PCRデータセットにフィットする曲線に対する第2近似をも決定する。次いで、第1及び第2近似のそれぞれものについて決定した情報係数に基づいて、第1又は第2近似の中の1つのものを選択する。ステップ型不連続部パラメータについて算出した信頼区間が値ゼロを含む(例えば、信頼区間が、値0を含む範囲にわたって広がっている)場合には、ステップ補正を実行しない。信頼区間が値ゼロを含まない場合には、ステップ補正を実行する。ステップ補正を実行する場合には、ステップ型変化の前のデータ曲線の部分を、選択された近似の適切な部分によって置換することにより、シフト補正済みのデータセットを生成する。特定の態様においては、近似が適合度の基準を満足しない場合には、ステップ補正を実行しない。シフト補正済みのデータセットを返し、表示可能であり、さもなければ、更なる処理のために使用可能である。例えば、シフト補正済みのデータセットを使用し、PCR検定のCt値を決定可能である。
【0020】
PCRプロセスの環境における増幅曲線10の一例が図1に示されている。図示のように、曲線10は、ラグフェーズ領域15と、指数フェーズ領域25と、を含む。ラグフェーズ領域15は、一般に、ベースライン又はベースライン領域と呼ばれている。このような曲線10は、ラグフェーズ領域と指数フェーズ領域をリンクする関心の対象である遷移領域20を含む。領域20は、一般に、エルボー又はエルボー領域と呼ばれている。エルボー領域は、通常、基礎をなすプロセスの成長又は増幅レートにおけるベースライン領域の末尾及び遷移部を定義する。領域20内の特定の遷移点の識別は、基礎をなすプロセスの振る舞いを分析するのに有用であろう。代表的なPCR曲線においては、エルボー値又はサイクル閾値(Ct)と呼ばれる遷移点の識別は、PCRプロセスの効率特性を理解するのに有用である。
【0021】
類似のシグモイド又は成長曲線を提供可能であるその他のプロセスは、バクテリアプロセス、酵素プロセス、及びバインディングプロセスを含む。例えば、バクテリア成長曲線においては、関心の対象である遷移点は、ラグフェーズ内の時間λと呼ばれている。本発明によって分析可能であるデータ曲線を生成するその他の特定のプロセスは、SDA(Strand Displacement Amplification)プロセス、NASBA(Nucleic Acid Sequence−Based Amplification)プロセス、及びTMA(Transcription Mediated Amplification)プロセスを含む。SDA及びNASBAプロセス及びデータ曲線の例については、それぞれ、Wang, Sha−Sha他による「Homogeneous Real−Time Detection of Sigle−Nucleotide Polymorphisms by Strand Displacement Amplification on the BD ProbeTec ET System」(Clin Chem 2003 49(10):1599)及びWeusten, Jos J.A.M.他による「Principles of Quantitation of Viral Loads Using Nucleic Acid Sequence−Based Amplification in Combination With Homogeneous Detection Using Molecular Beacons」(Nucleic Acids Research、2002 30(6):26)に見出すことができる。従って、本明細書の残りの部分は、PCR曲線に対するその適用性の観点において本発明の態様及び観点について説明しているが、本発明は、その他のプロセスに関係したデータ曲線に適用することも可能であることを理解されたい。
【0022】
図1に示されているように、代表的なPCR成長曲線のデータは、PCRサイクル数がx軸を定義し、且つ、蓄積されたポリヌクレオチド成長のインジケータがy軸を定義する2次元座標系において表現可能である。通常、図1に示されているように、蓄積された成長のインジケータは、蛍光強度値であり、この理由は、蛍光マーカーの使用が、おそらくは、最も広範に使用されている標識方式であるということによる。但し、使用される特定の標識及び/又は検出方式に応じて、その他のインジケータを使用することも可能であることを理解されたい。発生量又は蓄積された信号成長のその他の有用なインジケータの例は、ルミネッセンス強度、ケミルミネッセンス強度、バイオルミネッセンス強度、燐光強度、電荷移動、電圧、電流、電力、エネルギー、温度、粘度、光散乱、放射線強度、反射率、透過率、及び吸収率を含む。又、サイクルの定義も、時間、プロセスサイクル、単位動作サイクル、及び再生サイクルを包含可能である。
【0023】
本発明によれば、キネティックPCR増幅曲線の温度シフトについて補正するプロセス100のある観点は、図5を参照して説明可能である。段階110において、曲線を表す実験データセットを受信するか、さもなければ、取得する。又、温度シフトが発生したサイクルも識別する。通常、このサイクルの値は、先験的に判明しており、例えば、データを供給する装置又は機器によって記録される。プロットされたPCRデータセットの例が図1、図3、及び図4に示されており、この場合に、y軸及びx軸は、それぞれ、PCR曲線における蛍光強度及びサイクル数を表している。特定の態様においては、データセットは、連続的であると共に軸に沿って均一に離隔したデータを含むことを要する。
【0024】
サーモサイクラなどのPCRデータ取得装置内に存在するインテリジェンスモジュール(例えば、命令を実行するプロセッサ)内にプロセス100を実装するケースにおいては、データセットは、データの収集に伴って、リアルタイムでインテリジェンスモジュールに供給可能であり、或いは、メモリユニット又はバッファ内に保存し、実験が完了した後にインテリジェンスモジュールに供給することも可能である。同様に、データセットは、(例えば、LAN、VPN、イントラネット、インターネットなどの)ネットワーク接続又は取得装置に対する(例えば、USB又はその他の直接的な有線又は無線接続などの)直接接続を介して、デスクトップコンピュータやその他のコンピュータシステムなどの別個のシステムに供給することも可能であり、或いは、CD、DVD、フロッピー(登録商標)ディスク、携帯型USBドライブ、又はこれらに類似したものなどの携帯型媒体上において供給することも可能である。特定の態様においては、データセットは、座標値のペア(又は、2次元ベクトル)を具備するデータポイントを含む。PCRデータの場合には、座標値のペアは、通常、サイクル数と蛍光強度値を表す。段階110においてデータセットを受信又は取得した後に、データセットを更に分析し、例えば、検定の際の温度シフトについて補正可能である。
【0025】
段階120において、例えば、サイクル1から最終サイクルまでのデータセットに基づいて、第1近似を演算する。この段階においては、ある態様においては、Levenberg−Marquardt(LM)回帰プロセス又はその他の回帰プロセスによって決定されたパラメータを有するダブルシグモイド関数を使用し、データセットを表す曲線の近似を見出している。又、後程詳述するように、段階120においては、データセットに基づいて、第1近似とは異なる第2近似をも演算する。
【0026】
ある態様によれば、その内部に内蔵されたステップ関数を有する非線形モデルの信頼域を使用している。ある態様によれば、「PCR Elbow Determination Using Curvature Analysis of a Double Sigmoid」という名称の米国特許出願第11/533,291号及び「PCR Elbow Determination Using Quadratic Test for Curvature Analysis of a Double Sigmoid」という名称の米国特許出願第11/861,188号に提示されたダブルシグモイドモデルに基づいて構築することにより、次の式1に規定された関数を第1非線形モデルとして使用している。
【0027】
【数1】
式1 非線形モデル
【0028】
式1において、{a、b、c、d、e、f、g、h}は、モデル係数であり、cacは、アニーリング温度が変化したサイクル数である。cac値は、既知であり、且つ、システムによって供給される。係数「h」は、ジャンプ不連続部の大きさを表す。(例えば、後程詳述するLevenberg−Marquardt法などの)非線形回帰法を使用し、非線形モデルに対応する係数を導出する。非線形回帰は、通常、アプリケーションに固有である適切な大域的収束のために、初期係数の組を必要とする。回帰プロセス及びパラメータ決定の詳細については、更に詳しく後述する。
【0029】
ある態様においては、式2に定義されたUnitStep関数を使用する。
【0030】
【数2】
式2 UnitStep関数
【0031】
ある態様によれば、第2モデルを式3のように規定している。
【0032】
【数3】
式3 追加の非線形モデル
【0033】
ある観点においては、第2非線形モデルを使用し、標的を有していない反応井戸から生成された蛍光データを正確に表現している。(例えば、最小二乗QRDフィットやその他の回帰法などの)非線形回帰法を使用し、第2非線形モデルに対応する係数を導出する。
【0034】
厳格な数学的観点においては、且つ、前述の態様の式において観察可能であるように、本発明の方法において実装される第2関数は、非線形関数ではなく、線形関数と表記可能であろう。但し、本発明の方法においては、この第2関数を非線形関数として取り扱っているため、本特許出願の文脈においては、これを非線形関数と表記する。
【0035】
ある態様によれば、段階130において、式1に規定されたモデルと式3に規定されたモデルの間において選択を実行する。式1に規定されたモデルと式3に規定されたモデルの間の選択は、特定の観点においては、非パラメトリック情報理論に基づいた方法を使用して実行される。ある態様においては、式4に定義された改良型Akaike Information Coefficient(aic)を非線形回帰モデル(式1及び2)のそれぞれのものについて算出している。この態様においては、最小の係数を有する回帰モデルがベストフィットであると仮定している。ある観点においては、バイアス値を式3によって規定されたモデルから減算している。このバイアスにより、成長を伴わないサンプルを正確に検出可能である。バイアス値は、0(バイアスなし)〜約50の範囲をとることができる。特定の観点においては、約10のバイアスを減算している。
【0036】
【数4】
式4 改良型Akaike情報係数
【0037】
式4において、
【0038】
【数5】
【0039】
は、予測残差であり、nは、蛍光取得サイクルの数であり、且つ、mは、モデルの自由度である(例えば、式1の場合には、8であり、式3の場合には、3である)。
【0040】
ある態様によれば、段階140において、(例えば、R2などの)適合度統計値を算出し、モデル式が実際に蛍光データにマッチングしていることを検証する。この統計値が、予め定義された範囲を外れている場合には、モデルは、収束しておらず、従って、蛍光の不連続部補正を実行しない。例えば、ある観点においては、R2<0.8である場合に、収束は実現されない。
【0041】
R2値は、未加工の曲線(蛍光データ)及び推定モデルとの関係において演算される。ある観点においては、R2値を演算するための式は、次のように付与される。
【0042】
【数6】
【0043】
ここで、yは、未加工のデータ曲線を表し、f(x)は、モデル化された曲線を表し、
【数7】
は、未加工のデータ曲線の平均値を表し、且つ、nは、未加工のデータ曲線の(サイクル数を単位とする)長さを表す。
【0044】
ある態様によれば、段階150において、いずれが選択されたのかに応じて、式1又は式3から、h係数の信頼区間を所与の(例えば、90%〜99.9%の間の95%などの)信頼レベルにおいて算出する。この信頼区間が値ゼロを含む場合には、モデルは、過剰決定パラメータとしての係数hを具備する。このようなケースにおいては、データ内の不連続部は識別されず、従って、蛍光の不連続部補正は不要である。h係数の信頼区間演算は、選択されたモデル及びモデルの標準誤差に依存している。特定の態様においては、信頼区間の幅を次のように決定している。
【0045】
【数8】
【0046】
ここで、1.96は、95%の信頼を表し、H−1は、h係数のヘッセ行列の逆行列を表し、且つ、stdErrorは、選択されたモデルの標準誤差を表す。ヘッセ行列は、次のように演算される。
【0047】
【数9】
【0048】
ここで、Jは、ヤコビ行列であり、JTは、ヤコビ転置行列である。ヤコビは、すべての蛍光サイクルにおけるそれぞれのモデル係数の一次偏微分係数の評価である。標準誤差は、次のように演算される。
【0049】
【数10】
【0050】
ここで、yは、未加工の曲線を表し、f(x)は、モデル化された曲線を表し、且つ、nは、曲線の長さを表す。信頼区間の下限及び上限は、h±ciとして演算され、ここで、hの値は、推定モデルによって付与される。
【0051】
段階140及び段階150(段階165を含む)は、相互交換可能であり、且つ、いずれも任意選択であることを理解されたい。
【0052】
ある態様によれば、段階170において、ステップ又はシフト補正済みのデータセットを生成する。ある観点においては、係数hをゼロに等しくなるように設定することによって選択されたモデルから得られた値により、未加工の蛍光強度データ値を置換している。ある観点においては、アニーリング温度の変化の前に発生するサイクルについて置換を実行し、これにより、ジャンプ不連続部を効果的に除去すると共に滑らかな遷移を保証している。ある観点においては、例えば、サイクル1〜サイクルcac+1のように、第1サイクルから始まってアニーリング温度の変化が発生したサイクルの後のサイクルを含むものまで、置換を実行している。
【0053】
段階175において、例えば、表示又は更なる処理のために、変更されたシフト補正済みのデータセットを返す。例えば、補正済みの曲線を処理してCt値を決定可能であり、且つ、結果(シフト補正済みのデータ及び/又はCt値)を、例えば、分析を実行したシステムに、或いは、分析を要求した別個のシステムに返すことができる。図5の分析を実行したシステムに結合されたモニタ画面又はプリンタなどの表示装置によってグラフィカルな表示を生成可能であり、或いは、表示装置上においてレンダリングするべく別個のシステムにデータを供給することも可能である。Ct値は、補正済みのデータセットを使用して様々な方法に従って決定可能である。例えば、ある観点においては、米国特許出願第11/316,315号及び第11/349,550号の開示内容を使用し、Ct値を決定可能である。
【0054】
ある態様においては、式1には、係数の3つの組を導出するための3つの異なる開始条件を提供し、且つ、式3には、係数の単一の組を導出するための開始条件の単一の組を提供している。この態様においては、前述のように、係数の4つの導出された組を使用して式4を処理し、最小のaic値を有するモデルを決定する。プロセスをモデル化するべく使用される非線形式のそれぞれのものごとに、異なる開始条件を使用可能であることを理解されたい。特定の態様においては、開始条件は、経験的に決定される。
【0055】
図6の段階502〜段階524は、データセットの曲線を近似すると共にフィット関数のパラメータを決定するプロセスフローを示す。ある態様においては、Levenberg−Marquardt(LM)法を使用し、曲線のポイント上におけるデータセットの安定した曲線近似を算出する。LM法は、非線形回帰プロセスであり、これは、非線形関数とデータセットの間の距離を最小化する反復的な技法である。このプロセスは、とうげ点プロセスとガウス−ニュートンプロセスの組み合わせのように動作し、現在の近似が良好にフィットしない場合には、とうげ点プロセスのように動作するが(相対的に低速であるが、相対的に信頼性の高い収束)、現在の近似が正確になるのに伴って、ガウス−ニュートンプロセスのように動作することになる(相対的に高速であるが、相対的に信頼性の乏しい収束)。
【0056】
一般に、LM回帰法は、様々な入力を必要とすると共に出力を供給するアルゴリズムを含む。ある観点においては、入力は、処理対象のデータセットと、データをフィッティングするのに使用される関数と、関数のパラメータ又は変数の初期推定値と、を含む。出力は、関数とデータセットの間の距離を極小化する関数のパラメータの組を含む。
【0057】
ある態様によれば、フィット関数は、次の形態のダブルシグモイドである。
【0058】
【数11】
【0059】
この式のフィット関数としての選択は、一般的なPCR曲線又はその他の成長曲線がとり得る様々な曲線形状にフィットするその柔軟性及びその能力に基づくものである。当業者は、前述のフィット関数の変形又はその他のフィット関数を必要に応じて使用可能であることを理解するであろう。例えば、ある態様においては、式1が使用される。
【0060】
ダブルシグモイド式(5)は、a、b、c、d、e、f、及びgという7つのパラメータを具備し、式1は、a、b、c、d、e、f、g、及びhという8つのパラメータを具備する。この式は、定数、スロープ、及びダブルシグモイドの合計に分解可能である。ダブルシグモイド自体は、2つのシグモイドの乗算である。図7は、ダブルシグモイド式(5)の分解を示す。パラメータd、e、f、及びgは、2つのシグモイドの形状を決定する。最終的な曲線に対するこれらの影響を示すべく、次の単一のシグモイドを検討してみよう。
【0061】
【数12】
【0062】
ここで、パラメータdは、曲線の「鋭さ」を決定し、且つ、パラメータeは、変曲点のx値を決定する。図8は、曲線に対するパラメータdの、そして、変曲点のx値の位置に対するパラメータeの影響を示す。次の表1は、ダブルシグモイド曲線に対するパラメータの影響を示している。
【0063】
【表1】
【0064】
ある観点においては、曲線が非現実的な形状をとることを防止するべく、ダブルシグモイド式の「鋭さ」パラメータd及びfを制限する必要がある。従って、ある観点においては、d<−1又はd>1.1、或いは、f<−1又はf>1.1におけるすべての反復を不成功と見なしている。その他の態様においては、パラメータd及びfに対する異なる制限を使用可能である。
【0065】
Levenberg−Marquardtアルゴリズムは、反復的なアルゴリズムであるため、通常、フィットのための関数パラメータの初期推定値が必要である。初期推定値が良好であるほど、近似が良好になり、且つ、アルゴリズムが局所的な最小値に向かって収束する確率が低下する。ダブルシグモイド関数の複雑性及びPCR曲線又はその他の成長曲線の様々な形状に起因し、アルゴリズムがしばしば局所的な最小値に向かって収束することを防止するには、すべてのパラメータ用の1つの初期推定値では、十分ではない可能性がある。従って、ある観点においては、初期パラメータの複数(例えば、3つ以上)の組を入力し、且つ、最良の結果を保持している。ある観点においては、パラメータの大部分を、使用されるパラメータの複数の組にわたって一定に保持しており、パラメータc、d、及fのみが複数のパラメータセットのそれぞれのものについて異なるものであってよい。図9は、異なるパラメータセットにおける3つの曲線形状の例を示す。これらのパラメータの3つの組の選択肢は、PCRデータを表す曲線の3つの可能な異なる形状を示す。パラメータの3つを上回る数の組を処理し、且つ、最良の結果を保持可能であることを理解されたい。
【0066】
図6に示されているように、段階510において、LM法の初期入力パラメータを識別する。これらのパラメータは、オペレータによって入力可能であり、或いは、算出することも可能である。ある観点によれば、後述するように、段階502、504、及び506に従ってパラメータを決定又は設定している。
【0067】
初期パラメータ(a)の算出:パラメータ(a)は、ベースラインの高さであり、この値は、初期パラメータのすべての組について同一である。ある観点においては、段階504において、データセットから、例えば、蛍光値などの3番目に小さいy軸値をパラメータ(a)に割り当てている。これにより、安定した計算が実現する。当然のことながら、その他の態様においては、必要に応じて、最低のy軸値や2番目に小さい値などの任意のその他の蛍光値をパラメータ(a)に割当可能である。
【0068】
初期パラメータ(b)の計算:パラメータ(b)は、ベースライン及びプラトーのスロープである。この値は、初期パラメータのすべての組について同一である。ある観点においては、段階502において、0.01という固定値を(b)に割り当てており、これは、理想的には、スロープが存在するべきではないという理由による。その他の態様においては、例えば、0〜約0.5の範囲の値などの異なる値をパラメータ(b)に割り当て可能である。ある観点においては、値(b)は、CAC+1からベースラインの末尾までのベースラインのスロープを表す。
【0069】
初期パラメータ(c)の計算:パラメータ(c)は、プラトーの高さからベースラインの高さを減算したものを意味しており、これは、AFI(Absolute Fluorescence Increase)と表記される。ある観点においては、パラメータの第1の組については、c=AFI+2であり、最後の2つのパラメータについては、c=AFIである。これが図9に示されており、この場合には、最後の2つのパラメータの組については、c=AFIであり、パラメータの最初の組については、c=AFI+2である。この変化は、パラメータの第1の組によってモデル化された曲線の形状に起因するものであり、これは、プラトーを具備していない。
【0070】
パラメータ(d)及び(f)の計算:パラメータ(d)及び(f)は、2つのシグモイドの鋭さを定義している。これらのパラメータにおける曲線に基づいて近似を付与する方法は存在しないことから、ある観点においては、段階502において、3つの代表的な固定値を使用している。その他の固定された又は固定されていない値をパラメータ(d)及び/又は(f)に使用することも可能であることを理解されたい。これらのペアは、遭遇するPCR曲線の最も共通的な形状をモデル化する。次の表2は、図9に示されたパラメータの異なる組における(d)及び(g)の値を示す。
【0071】
【表2】
【0072】
パラメータ(e)及び(g)の計算:段階506において、パラメータ(e)及び(g)を決定する。パラメータ(e)及び(g)は、2つのシグモイドの変曲点を定義している。ある観点においては、これらは、いずれも、すべての初期パラメータセットにわたって、同一の値をとる。パラメータ(e)及び(g)は、同一又は異なる値を具備可能である。近似を見出すべく、ある観点においては、例えば、蛍光などの強度の平均を上回る第1ポイントのx値を使用している(これは、スパイクではない)。この態様に従って(e)及び(g)の値を決定するプロセスが図10に示されており、且つ、以下、これについて説明する。この態様に従ってパラメータ(e)及び(g)及びその他のパラメータの値を決定するプロセスの更に詳細な説明は、米国特許出願第11/316,315号に見出すことができる。
【0073】
図10を参照すれば、まず、(例えば、蛍光強度などの)曲線の平均を決定する。次に、平均を上回る第1データポイントを識別する。次いで、a.そのポイントが、曲線の、例えば、最初の5サイクル内などのような開始点の近傍に位置していないかどうか、b.そのポイントが、曲線の、例えば、最後の5つのサイクル内などのような末尾の近傍に位置していないかどうか、並びに、c.そのポイントの周り(例えば、その周りの2ポイントの半径内)の微分係数が、符号の変化を示していないかどうかを決定する。これらが変化を示している場合には、そのポイントは、スパイクである可能性が高く、且つ、従って、拒絶することを要する。
【0074】
別の態様においては、係数(e)及び(g)の決定において、cacサイクルの後のサイクルの蛍光値のみを検討している。従って、近似を見出すべく、cacから最後のサイクルまでのサイクルの、例えば、蛍光などの強度の平均を上回る(スパイクではない)第1ポイントのx値を使用する。まず、(サイクルcacから最後のサイクルまでの)曲線の平均を決定し、且つ、平均を上回る第1ポイントを決定する。このようなポイントが見出されない場合には、ある観点においては、未加工の曲線の長さの2/3を検討する。
【0075】
次の表3は、ある観点による図9において使用される初期パラメータ値の例を示す。
【0076】
【表3】
【0077】
図6を再度参照すれば、段階510において、すべてのパラメータが設定されたら、入力されたデータセット、関数、及びパラメータを使用し、LMプロセス520を実行する。従来、Levenberg−Marquardt法は、非線形最小二乗問題を解決するべく使用されている。従来のLM法は、曲線近似とデータセットの間の誤差の二乗の合計として定義された距離尺度を算出している。しかしながら、二乗の合計を極小化する場合には、異常値の距離がスパイクではないデータポイントの距離を上回っていることから、異常値に対して大きな重みが付与されることになり、この結果、しばしば、不適切な曲線、又は望ましくない曲線が得られる。従って、本発明のある観点によれば、絶対誤差の合計を極小化することにより、近似とデータセットの間の距離を演算しており、この理由は、この場合には、大きな重みが異常値に対して付与されないためである。この態様においては、近似とデータの間の距離は、次式によって付与される。
【0078】
【数13】
【0079】
上述のように、ある態様においては、段階522及び524に示されているように、初期パラメータの複数(例えば、3つ)の組のそれぞれのものを入力して処理した後に、最良の結果を保持しており、この場合に、最良の結果とは、式(7)における最も小さい又は最小の距離を提供するパラメータセットである。ある観点においては、パラメータの大部分をパラメータの複数の組にわたって一定に保持しており、パラメータのそれぞれの組について異なることができるのは、c、d、及びfのみである。任意の数の初期パラメータセットを使用可能であることを理解されたい。
【0080】
図11は、本発明によるパラメータの組におけるLMプロセス520のプロセスフローを示す。前述のように、Levenberg−Marquardt法は、とうげ点プロセスのように、又はガウス−ニュートンプロセスのように動作可能である。この動作は、減衰係数λに依存している。λが大きいほど、Levenberg−Marquardtアルゴリズムは、とうげ点プロセスのように動作する。一方、λが小さいほど、Levenberg−Marquardtアルゴリズムは、ガウス−ニュートンプロセスのように動作することになる。ある観点においては、λは、0.001から始まっている。λは、約0.000001〜約1.0などの任意のその他の値から始まることも可能であることを理解されたい。
【0081】
前述のように、Levenberg−Marquardt法は、反復的な技法である。ある観点によれば、図11に示されているように、それぞれの反復において、次の段階を次実行している。
【0082】
1.先行する近似のヘッセ行列(H)を算出する。
【0083】
2.先行する近似の転置ヤコビ行列(JT)を算出する。
【0084】
3.先行する近似の距離ベクトル(d)を算出する。
【0085】
4.現在の減衰係数λにより、次のように、ヘッセ行列の対角項を増大させる。
【0086】
【数14】
【0087】
5.増大した式を次のように解く。
【0088】
【数15】
【0089】
6.増大した式の解xを関数のパラメータに追加する。
【0090】
7.新しい近似及び曲線の間の距離を算出する。
【0091】
8.このパラメータの新しい組に伴う距離が以前のパラメータの組に伴う距離を下回っている場合には、・その反復は成功であると見なされ、・新しいパラメータの組を保持又は保存し、且つ、・例えば、係数10だけ、減衰係数λを低減する。
【0092】
新しいパラメータの組に伴う距離が以前のパラメータの組に伴う距離を上回っている場合には、・その反復は失敗であると見なされ、・新しいパラメータの組を破棄し、且つ、・例えば、係数10だけ、減衰係数λを増大させる。
【0093】
ある観点においては、図11のLMプロセスは、次の基準の中の1つのものが実現される時点まで反復される。
【0094】
1.既定の回数Nだけ既に反復されている。この第1基準は、アルゴリズムが無制限に反復されることを防止する。例えば、図10に示されたある観点においては、既定の反復値Nは、100である。アルゴリズムが収束可能である場合には、100回の反復は、アルゴリズムが収束するのに十分であるはずである。一般に、Nは、10未満から100以上の範囲をとることができる。
【0095】
2.2つの成功した反復の間の距離の差が、例えば、0.0001などの閾値を下回っている。差が非常に小さくなった際には、所望の精度が実現されており、解は、それ以上大幅に良好にはなることはないことから、反復を継続するのは無意味である。
【0096】
3.減衰係数λが既定の値を超過し、例えば、1020を上回っている。λが非常に大きくなった際には、アルゴリズムは、現在の解よりも良好に収束することはなく、従って、反復を継続するのは無意味である。一般に、規定値は、1020を大幅に下回る又は上回るものであってよい。
【0097】
別の態様によれば、使用するLevenberg−Marquardt法は、次の式10に規定された式と等価である。初期条件z0及び(例えば、既定により、10-3に設定される)精度レベルtolを有するベクトル関数
【0098】
【数16】
【0099】
が付与された場合に、式10は、真である。関数J(z)は、関数f(z)のヤコビ行列として定義される。変数maxiterは、反復の最大数である(例えば、既定により、100に設定される)。変数λは、回帰における減衰係数である。
【0100】
【数17】
式10 Levenberg−Marquartdt非線形回帰
【0101】
式10における逆行列は、QR分解によって取得される。ある観点においては、QR分解は、Anderson, E.(編集)の「LAPACK Users’ Guide」(第3版、Philadelphia, PA: Society for Industrial and Applied Mathematics、1999年)のDGELS法に類似している。逆行列を決定不能である場合には、λに2(又は、その他の値)を乗算して回帰を継続する。
【0102】
本発明の方法、システム、及びコンピュータ可読媒体の特定の態様においては、第1及び第2近似のそれぞれのものの情報係数を決定する段階は、第1及び第2近似のそれぞれのもののAIC(Akaike Information Coefficient)値を算出する段階を包含可能である。
【0103】
特定の態様においては、本発明による方法、システム、及びコンピュータ可読媒体は、第2非線形関数について算出されたAIC値からバイアス値を減算する段階を更に包含可能である。
【0104】
本発明の方法、システム、及びコンピュータ可読媒体の特定の態様においては、情報係数に基づいて近似の中の1つものを選択する段階は、最低のAIC値を具備する近似を選択する段階を含む。
【0105】
本発明の方法及びコンピュータ可読媒体の特定の態様においては、データセットは、キネティックポリメラーゼ連鎖反応(PCR)プロセスの成長曲線を表すことが可能であり、この場合に、座標値のペアは、増幅されたポリヌクレオチドの蓄積及びサイクル数を表すことができる。
【0106】
本発明の方法及びコンピュータ可読媒体の特定の態様においては、増幅されたポリヌクレオチドの蓄積は、蛍光強度値、ルミネッセンス強度値、ケミルミネッセンス強度値、燐光強度値、電荷移動値、バイオルミネッセンス強度値、又は吸収率値の中の1つのものによって表すことができる。
【0107】
本発明の方法及びコンピュータ可読媒体の特定の態様においては、データセットは、キネティックポリメラーゼ連鎖反応(PCR)プロセス、バクテリアプロセス、酵素プロセス、又はバインディングプロセスの成長曲線を表すことが可能である。
【0108】
本発明による特定の態様においては、置換されるデータセットの部分は、第1データポイントから始まってステップ型不連続部が発生するデータポイントを含むものまでのデータセットの部分を包含可能である。
【0109】
又、インテリジェンスモジュールは、選択の後に、選択された近似の適合度の値を算出し、且つ、適合度の値が閾値を上回る場合にのみ、継続するべく更に適合可能である。
【0110】
本発明によるシステムの特定の態様においては、インテリジェンスモジュールは、第2非線形関数について算出されたAIC値からバイアス値を減算するべく更に適合可能である。
【0111】
本発明によるシステムの特定の態様においては、情報係数に基づいて近似の中の1つのものを選択する段階は、最低のAIC値を具備する近似を選択する段階を包含可能である。
【0112】
本発明によるシステムの特定の態様においては、キネティックPCR分析モジュールは、キネティックサーモサイクラ装置内に存在可能であり、この場合に、インテリジェンスモジュールは、分析モジュールに通信可能に結合されたプロセッサを包含可能である。
【0113】
本発明によるシステムの特定の態様においては、インテリジェンスモジュールは、ネットワーク接続又は直接接続の中の1つのものによって分析モジュールに結合されたコンピュータシステム内に存在するプロセッサを包含可能である。
【0114】
本発明によるシステムの特定の態様においては、置換されるデータセットの部分は、ステップ型不連続部が発生したデータポイントの後のデータポイントを包含可能である。
【0115】
本発明によるコンピュータ可読媒体の特定の態様においては、置換されるデータセットの部分は、ステップ型不連続部が発生したデータポイントの後のデータポイントを包含可能である。
【0116】
本発明による方法の特定の態様においては、置換されるデータセットの部分は、ステップ型不連続部が発生したデータポイントの後のデータポイントを包含可能である。
【0117】
特定の態様においては、本発明による方法は、限定を伴うことなしに、キーボード、マウス、及びこれらに類似したものなどのデータセットを入力するための入力装置と、モニタなどの曲線の領域内の関心の対象である特定のポイントを表すための表示装置と、CPUなどの方法のそれぞれの段階を実行するのに必要な処理装置と、モデムなどのネットワークインターフェイスと、データセットを保存するためのデータストレージ装置と、プロセッサ上において稼働するコンピュータコードと、これらに類似したものと、を含む従来のパーソナルコンピュータシステムを使用することによって実装可能である。更には、方法は、本発明によるPCR装置内において実装することも可能である。
【0118】
本発明によるシステムの一例が図16〜図17に示されている。図16は、本発明の方法及びシステムを実装するべく使用可能なソフトウェア及びハードウェアリソースの間の関係を説明する概略ブロックダイアグラムを示す。図17に示されたシステムは、サーモサイクラ装置内に配置可能なキネティックPCR分析モジュールと、コンピュータシステムの一部であるインテリジェンスモジュールと、を有する。データセット(PCRデータセット)は、ネットワーク接続又は直接接続を介して、分析モジュールからインテリジェンスモジュールに、或いは、この反対方向に、転送される。データセットは、例えば、図5、図6、図10、及び図11に示されたフローチャートに従って処理可能である。これらのフローチャートは、例えば、図16に示されたフローチャートに従って、コンピュータシステムのハードウェア上に保存されたソフトウェアによって便利に実装可能である。図16を参照すれば、コンピュータシステム(200)は、例えば、PCR反応において得られた蛍光データを受信する受信手段(210)と、本発明の方法に従って前述のデータを処理する計算手段(220)と、計算手段によって得られた結果に従って前述のデータの一部を置換する適用手段(230)と、コンピュータ画面上に結果を表示する表示手段(249)と、を有することができる。図17は、サーモサイクラ装置とコンピュータシステムの間のやり取りを示す。本システムは、サーモサイクラ装置内に配置可能であるキネティックPCR分析モジュールと、コンピュータシステムの一部であるインテリジェンスモジュールと、を有する。データセット(PCRデータセット)は、分析モジュールからインテリジェンスモジュールに、或いは、この反対方向に、ネットワーク接続又は直接接続を介して転送される。データセットは、プロセッサ上において稼働すると共にインテリジェンスモジュールのストレージ装置内に保存されたコンピュータコードにより、図16に従って処理され、且つ、処理の後に、分析モジュールのストレージ装置に返送可能であり、ここで、変更済みのデータを表示装置上に表示可能である。
【0119】
前述のように、本発明のシステム及び方法は、ポリメラーゼ連鎖反応データ内のステップ型不連続部を除去するために有用である。例えば、蛍光データを使用してポリメラーゼ連鎖反応をモニタリングする際には、本発明のシステム及び方法は、相対的に正確なデータを提供する。このようなデータは、反応をモニタリングするのに有用であるのみならず、PCRにおいて増幅された標的核酸の定量化又は得られたデータに応じたPCRの反応条件の適合などの技術的な効果をも提供する。
【0120】
以下の例及び図は、本発明の理解を支援するべく提供されるものであり、本発明の真の範囲は、添付の請求項に記述されているとおりである。本発明の精神を逸脱することなしに、記述された手順における変更を実施可能であることを理解されたい。
【0121】
(例)
(ケース1)
これは、CAP/CTM HIVモニタ検定からのIQS(HEXチャネル)蛍光データである。検定設計は、サイクル15の後にジャンプ不連続部を具備する。図12は、未加工の蛍光データ(点線)と、補正済みのデータ(実線)と、を示す。次の表4は、推定された係数と、対応する信頼区間と、を示す。ケース1のR2は、0.99を上回っている。
【0122】
【表4】
【0123】
(ケース2)
これは、実際の標的の増幅を伴わないB19パルボウイルス標的チャネル(FAMチャネル)である。検定設計は、サイクル5の後にジャンプ不連続部を具備する。図13は、未加工の蛍光データ(点線)と、補正済みのデータ(実線)と、を示す。次の表5は、推定されたモデル係数と、それらの対応する信頼区間と、を示す。ケース2のR2は、0.94である。
【0124】
【表5】
【0125】
(ケース3)
これは、HBV High Pure(FAMチャネル)の標的である。この検定は、ジャンプ不連続部を具備しない。このケースにおける係数hの信頼区間は、ゼロを含むことになる。従って、不連続部の補正は不要である。図14は、未加工のデータ(点線)と、補正済みのデータ(実線)と、を示す。次の表6は、推定されたモデル係数と、それらの対応する信頼区間と、を示す。ケース3のR2は、0.99を上回っている。
【0126】
【表6】
【0127】
(ケース4)
これは、高濃度(2.9×1011IU/ml)のB19パルボウイルスサンプル(FAMチャネル)である。検定設計は、サイクル5の後にジャンプ不連続部を具備するが、大きな複写数に起因し、不連続部は観察されない。前述の方法は、このケースを上手に取り扱うことができる。図15は、未加工のデータ(点線)と、補正済みのデータ(実線)と、を示す。このケースにおける係数hの信頼区間はゼロを含む。次の表7は、推定されたモデル係数と、それらの対応する信頼区間と、を示す。ケース4のR2は、0.99を上回る。
【0128】
【表7】
【0129】
以上、例示目的で、且つ、特定の態様の観点で本発明について説明したが、本発明は、開示された態様に限定されないことを理解されたい。
【特許請求の範囲】
【請求項1】
成長プロセスを表すデータ内のステップ型不連続部を自動的に除去する方法であって、
−成長プロセスを表すデータセットを受信する段階、ここで、前記データセットは、複数のデータポイントを含み、それぞれのデータポイントは、座標値のペアを具備する、
−非線形回帰プロセスを第1非線形関数に適用して前記第1関数のパラメータを決定することにより、前記データセットにフィットする曲線の第1近似を算出する段階、ここで、前記パラメータは、ステップ型不連続部パラメータを含む、
−第2回帰プロセスを第2非線形関数に適用して前記第2関数のパラメータを決定することにより、前記データセットにフィットする曲線の第2近似を算出する段階、ここで、前記第2関数の前記パラメータは、ステップ型不連続部パラメータを含む、
−前記第1及び第2近似のそれぞれのものの情報係数を決定する段階、
−前記情報係数に基づいて前記近似の中の1つものを選択する段階、
−前記選択された近似の前記ステップ型不連続部パラメータの信頼区間を決定する段階、
−前記信頼区間が値ゼロを含まない場合に、ゼロに設定された対応する前記ステップ型不連続部パラメータを有する前記選択された近似によって前記データセットの一部を置換する段階、
を含んで成る方法。
【請求項2】
前記第1非線形回帰プロセスは、Levenberg−Marquardt(LM)回帰プロセスであり、且つ、前記第1非線形関数は、ダブルシグモイド関数である請求項1記載の方法。
【請求項3】
前記ダブルシグモイド関数は、次の形態を有し、
【数1】
式中、UnitStepは、次の形態を有し、
【数2】
ここで、第1近似を算出する段階は、前記関数の前記パラメータa、b、c、d、e、f、g、及びhの中の1つ又は複数のものを反復的に決定する段階を含む請求項2記載の方法。
【請求項4】
前記第2非線形関数は、次の形態を有し、
【数3】
式中、UnitStepは、次の形態を有し、
【数4】
式中、xは、サイクル数であり、cacは、前記不連続部が発生したサイクルであり、a、b、及びhは、前記パラメータであり、且つ、hは、前記ステップ型不連続部パラメータである請求項1記載の方法。
【請求項5】
置換された前記データセットの前記部分は、第1データポイントから始まって前記ステップ型不連続部が発生したデータポイントを含むものまでの前記データセットの部分を含む請求項1記載の方法。
【請求項6】
前記選択段階の後に、
−前記選択された近似のフィットの適合度値を算出し、且つ、前記フィットの適合度値が閾値を上回る場合にのみ、継続する段階、
を更に含む請求項1記載の方法。
【請求項7】
プロセッサを制御し、成長曲線を表すデータセット内のステップ型不連続部を自動的に除去するコードを含むコンピュータ可読媒体であって、
前記コードは、
−成長プロセスを表すデータセットを受信する段階、ここで、前記データセットは、複数のデータポイントを含み、それぞれのデータポイントは、座標値のペアを具備する、
−非線形回帰プロセスを第1非線形関数に適用して前記第1関数のパラメータを決定することにより、前記データセットにフィットする曲線の第1近似を算出する段階、ここで、前記パラメータは、ステップ型不連続部パラメータを含む、
−第2回帰プロセスを第2非線形関数に適用して前記第2関数のパラメータを決定することにより、前記データセットにフィットする曲線の第2近似を算出する段階、ここで、前記第2関数の前記パラメータは、ステップ型不連続部パラメータを含む、
−前記第1及び第2近似のそれぞれのものの情報係数を決定する段階、
−前記情報係数に基づいて前記近似の中の1つものを選択する段階、
−前記選択された近似の前記ステップ型不連続部パラメータの信頼区間を決定する段階、
−前記信頼区間が値ゼロを含まない場合に、ゼロに設定された対応する前記ステップ型不連続部パラメータを有する前記選択された近似によって前記データセットの一部を置換する段階、
を実行するための命令を含む、コンピュータ可読媒体。
【請求項8】
前記第1非線形回帰プロセスは、Levenberg−Marquardt(LM)回帰プロセスであり、且つ、前記第1非線形関数は、ダブルシグモイド関数である請求項7記載のコンピュータ可読媒体。
【請求項9】
前記ダブルシグモイド関数は、次の形態を有し、
【数5】
式中、UnitStepは、次の形態を有し、
【数6】
ここで、第1近似を算出する段階は、前記関数の前記パラメータa、b、c、d、e、f、g、及びhの中の1つ又は複数のものを反復的に決定する段階を含む請求項8記載のコンピュータ可読媒体。
【請求項10】
前記第2非線形関数は、次の形態を有し、
【数7】
式中、UnitStepは、次の形態を有し、
【数8】
式中、xは、サイクル数であり、cacは、前記不連続部が発生したサイクルであり、a、b、及びhは、前記パラメータであり、且つ、hは、前記ステップ型不連続部パラメータである請求項7記載のコンピュータ可読媒体。
【請求項11】
置換された前記データセットの前記部分は、第1データポイントから始まって前記ステップ型不連続部が発生したデータポイントを含むものまでの前記データセットの部分を含む請求項7記載のコンピュータ可読媒体。
【請求項12】
−キネティックPCR増幅曲線を表すPCRデータセットを生成するキネティックPCR分析モジュールであって、前記データセットは、複数のデータポイントを含み、それぞれのデータポイントは、座標値のペアを具備する、キネティックPCR分析モジュールと、
−インテリジェンスモジュールと、
を有し、
前記インテリジェンスモジュールは、
−非線形回帰プロセスを第1非線形関数に適用して前記第1関数のパラメータを決定することにより、前記データセットにフィットする曲線の第1近似を算出する段階、ここで、前記パラメータは、ステップ型不連続部パラメータを含む、
−第2回帰プロセスを第2非線形関数に適用して前記第2関数のパラメータを決定することにより、前記データセットにフィットする曲線の第2近似を算出する段階、ここで、前記第2関数の前記パラメータは、ステップ型不連続部パラメータを含む、
−前記第1及び第2近似のそれぞれのものの情報係数を決定する段階、
−前記情報係数に基づいて前記近似の中の1つものを選択する段階、
−前記選択された近似の前記ステップ型不連続部パラメータの信頼区間を決定する段階、
−前記信頼区間が値ゼロを含まない場合に、ゼロに設定された対応する前記ステップ型不連続部パラメータを有する前記選択された近似によって前記データセットの一部を置換する段階、
により、前記PCRデータセットを処理し、前記データセット内のステップ型不連続部を自動的に除去するべく適合されている、キネティックポリメラーゼ連鎖反応(PCR)システム。
【請求項13】
前記第1非線形回帰プロセスは、Levenberg−Marquardt(LM)回帰プロセスであり、且つ、前記第1非線形関数は、ダブルシグモイド関数である請求項12記載のシステム。
【請求項14】
前記ダブルシグモイド関数は、次の形態を有し、
【数9】
式中、UnitStepは、次の形態を有し、
【数10】
ここで、第1近似を算出する段階は、前記関数の前記パラメータa、b、c、d、e、f、g、及びhの中の1つ又は複数のものを反復的に決定する段階を含む請求項13記載のシステム。
【請求項15】
前記第2非線形関数は、次の形態を有し、
【数11】
式中、UnitStepは、次の形態を有し、
【数12】
式中、xは、サイクル数であり、cacは、前記不連続部が発生したサイクルであり、a、b、及びhは、前記パラメータであり、且つ、hは、前記ステップ型不連続部パラメータである請求項12記載のコンピュータ可読媒体。
【請求項1】
成長プロセスを表すデータ内のステップ型不連続部を自動的に除去する方法であって、
−成長プロセスを表すデータセットを受信する段階、ここで、前記データセットは、複数のデータポイントを含み、それぞれのデータポイントは、座標値のペアを具備する、
−非線形回帰プロセスを第1非線形関数に適用して前記第1関数のパラメータを決定することにより、前記データセットにフィットする曲線の第1近似を算出する段階、ここで、前記パラメータは、ステップ型不連続部パラメータを含む、
−第2回帰プロセスを第2非線形関数に適用して前記第2関数のパラメータを決定することにより、前記データセットにフィットする曲線の第2近似を算出する段階、ここで、前記第2関数の前記パラメータは、ステップ型不連続部パラメータを含む、
−前記第1及び第2近似のそれぞれのものの情報係数を決定する段階、
−前記情報係数に基づいて前記近似の中の1つものを選択する段階、
−前記選択された近似の前記ステップ型不連続部パラメータの信頼区間を決定する段階、
−前記信頼区間が値ゼロを含まない場合に、ゼロに設定された対応する前記ステップ型不連続部パラメータを有する前記選択された近似によって前記データセットの一部を置換する段階、
を含んで成る方法。
【請求項2】
前記第1非線形回帰プロセスは、Levenberg−Marquardt(LM)回帰プロセスであり、且つ、前記第1非線形関数は、ダブルシグモイド関数である請求項1記載の方法。
【請求項3】
前記ダブルシグモイド関数は、次の形態を有し、
【数1】
式中、UnitStepは、次の形態を有し、
【数2】
ここで、第1近似を算出する段階は、前記関数の前記パラメータa、b、c、d、e、f、g、及びhの中の1つ又は複数のものを反復的に決定する段階を含む請求項2記載の方法。
【請求項4】
前記第2非線形関数は、次の形態を有し、
【数3】
式中、UnitStepは、次の形態を有し、
【数4】
式中、xは、サイクル数であり、cacは、前記不連続部が発生したサイクルであり、a、b、及びhは、前記パラメータであり、且つ、hは、前記ステップ型不連続部パラメータである請求項1記載の方法。
【請求項5】
置換された前記データセットの前記部分は、第1データポイントから始まって前記ステップ型不連続部が発生したデータポイントを含むものまでの前記データセットの部分を含む請求項1記載の方法。
【請求項6】
前記選択段階の後に、
−前記選択された近似のフィットの適合度値を算出し、且つ、前記フィットの適合度値が閾値を上回る場合にのみ、継続する段階、
を更に含む請求項1記載の方法。
【請求項7】
プロセッサを制御し、成長曲線を表すデータセット内のステップ型不連続部を自動的に除去するコードを含むコンピュータ可読媒体であって、
前記コードは、
−成長プロセスを表すデータセットを受信する段階、ここで、前記データセットは、複数のデータポイントを含み、それぞれのデータポイントは、座標値のペアを具備する、
−非線形回帰プロセスを第1非線形関数に適用して前記第1関数のパラメータを決定することにより、前記データセットにフィットする曲線の第1近似を算出する段階、ここで、前記パラメータは、ステップ型不連続部パラメータを含む、
−第2回帰プロセスを第2非線形関数に適用して前記第2関数のパラメータを決定することにより、前記データセットにフィットする曲線の第2近似を算出する段階、ここで、前記第2関数の前記パラメータは、ステップ型不連続部パラメータを含む、
−前記第1及び第2近似のそれぞれのものの情報係数を決定する段階、
−前記情報係数に基づいて前記近似の中の1つものを選択する段階、
−前記選択された近似の前記ステップ型不連続部パラメータの信頼区間を決定する段階、
−前記信頼区間が値ゼロを含まない場合に、ゼロに設定された対応する前記ステップ型不連続部パラメータを有する前記選択された近似によって前記データセットの一部を置換する段階、
を実行するための命令を含む、コンピュータ可読媒体。
【請求項8】
前記第1非線形回帰プロセスは、Levenberg−Marquardt(LM)回帰プロセスであり、且つ、前記第1非線形関数は、ダブルシグモイド関数である請求項7記載のコンピュータ可読媒体。
【請求項9】
前記ダブルシグモイド関数は、次の形態を有し、
【数5】
式中、UnitStepは、次の形態を有し、
【数6】
ここで、第1近似を算出する段階は、前記関数の前記パラメータa、b、c、d、e、f、g、及びhの中の1つ又は複数のものを反復的に決定する段階を含む請求項8記載のコンピュータ可読媒体。
【請求項10】
前記第2非線形関数は、次の形態を有し、
【数7】
式中、UnitStepは、次の形態を有し、
【数8】
式中、xは、サイクル数であり、cacは、前記不連続部が発生したサイクルであり、a、b、及びhは、前記パラメータであり、且つ、hは、前記ステップ型不連続部パラメータである請求項7記載のコンピュータ可読媒体。
【請求項11】
置換された前記データセットの前記部分は、第1データポイントから始まって前記ステップ型不連続部が発生したデータポイントを含むものまでの前記データセットの部分を含む請求項7記載のコンピュータ可読媒体。
【請求項12】
−キネティックPCR増幅曲線を表すPCRデータセットを生成するキネティックPCR分析モジュールであって、前記データセットは、複数のデータポイントを含み、それぞれのデータポイントは、座標値のペアを具備する、キネティックPCR分析モジュールと、
−インテリジェンスモジュールと、
を有し、
前記インテリジェンスモジュールは、
−非線形回帰プロセスを第1非線形関数に適用して前記第1関数のパラメータを決定することにより、前記データセットにフィットする曲線の第1近似を算出する段階、ここで、前記パラメータは、ステップ型不連続部パラメータを含む、
−第2回帰プロセスを第2非線形関数に適用して前記第2関数のパラメータを決定することにより、前記データセットにフィットする曲線の第2近似を算出する段階、ここで、前記第2関数の前記パラメータは、ステップ型不連続部パラメータを含む、
−前記第1及び第2近似のそれぞれのものの情報係数を決定する段階、
−前記情報係数に基づいて前記近似の中の1つものを選択する段階、
−前記選択された近似の前記ステップ型不連続部パラメータの信頼区間を決定する段階、
−前記信頼区間が値ゼロを含まない場合に、ゼロに設定された対応する前記ステップ型不連続部パラメータを有する前記選択された近似によって前記データセットの一部を置換する段階、
により、前記PCRデータセットを処理し、前記データセット内のステップ型不連続部を自動的に除去するべく適合されている、キネティックポリメラーゼ連鎖反応(PCR)システム。
【請求項13】
前記第1非線形回帰プロセスは、Levenberg−Marquardt(LM)回帰プロセスであり、且つ、前記第1非線形関数は、ダブルシグモイド関数である請求項12記載のシステム。
【請求項14】
前記ダブルシグモイド関数は、次の形態を有し、
【数9】
式中、UnitStepは、次の形態を有し、
【数10】
ここで、第1近似を算出する段階は、前記関数の前記パラメータa、b、c、d、e、f、g、及びhの中の1つ又は複数のものを反復的に決定する段階を含む請求項13記載のシステム。
【請求項15】
前記第2非線形関数は、次の形態を有し、
【数11】
式中、UnitStepは、次の形態を有し、
【数12】
式中、xは、サイクル数であり、cacは、前記不連続部が発生したサイクルであり、a、b、及びhは、前記パラメータであり、且つ、hは、前記ステップ型不連続部パラメータである請求項12記載のコンピュータ可読媒体。
【図1】
【図2】
【図3】
【図4A】
【図4B】
【図5】
【図6A】
【図6B】
【図6C】
【図6D】
【図6E】
【図7】
【図8】
【図9】
【図10A】
【図10B】
【図11A】
【図11B】
【図11C】
【図11D】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図2】
【図3】
【図4A】
【図4B】
【図5】
【図6A】
【図6B】
【図6C】
【図6D】
【図6E】
【図7】
【図8】
【図9】
【図10A】
【図10B】
【図11A】
【図11B】
【図11C】
【図11D】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【公開番号】特開2010−15546(P2010−15546A)
【公開日】平成22年1月21日(2010.1.21)
【国際特許分類】
【外国語出願】
【出願番号】特願2009−115321(P2009−115321)
【出願日】平成21年5月12日(2009.5.12)
【出願人】(591003013)エフ.ホフマン−ラ ロシュ アーゲー (1,754)
【氏名又は名称原語表記】F. HOFFMANN−LA ROCHE AKTIENGESELLSCHAFT
【Fターム(参考)】
【公開日】平成22年1月21日(2010.1.21)
【国際特許分類】
【出願番号】特願2009−115321(P2009−115321)
【出願日】平成21年5月12日(2009.5.12)
【出願人】(591003013)エフ.ホフマン−ラ ロシュ アーゲー (1,754)
【氏名又は名称原語表記】F. HOFFMANN−LA ROCHE AKTIENGESELLSCHAFT
【Fターム(参考)】
[ Back to top ]