説明

ダブルシグモイドの曲率分析を使用したPCRのエルボー決定

【課題】PCR増幅曲線のサイクル閾値(Ct)などのシグモイド又は成長タイプの曲線のエルボー値などの特徴的な遷移値を決定するシステム及び方法の提供。
【解決手段】Levenberg−Marquardt(LM)回帰プロセスによって決定されたパラメータを有するダブルシグモイド関数を使用することにより、PCRデータセットにフィットする曲線に対する近似を検出する。パラメータの決定が完了したら、決定されたパラメータの1つ又は複数のものを使用して曲線を正規化可能である。正規化の後に、正規化済みの曲線を処理することにより、曲線に沿ったいくつか又はすべてのポイントにおける曲線の曲率を決定し、例えば、曲率対サイクル数を表すデータセット又はプロットを生成する。最大曲率が発生するサイクル数がCt値に対応している。次いで、このCt値が返され、これを表示するか又は更なる処理のために使用可能である。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、概して、シグモイド又は成長曲線を表すデータを処理するシステム及び方法に関するものであり、更に詳しくは、PCR増幅曲線の特徴的なサイクル閾値(Cycle Threshold:Ct)又はエルボー値、或いは、その他の成長曲線のエルボー値を決定するシステム及び方法に関するものである。
【背景技術】
【0002】
ポリメラーゼ連鎖反応(Polymerase Chain Reaction:PCR)は、規定の核酸配列を酵素によって合成又は増幅する体外的な方法である。この反応においては、通常、正反対の鎖にハイブリダイズし、増幅対象のテンプレート又は標的DNA配列にフランキングする2つのオリゴヌクレオチドプライマーを使用する。該プライマーの伸長は、熱安定性を有するDNAポリメラーゼにより触媒される。テンプレートの変性、プライマーのアニーリング、及びアニーリングされたプライマーのポリメラーゼによる伸長を伴う反復的な一連のサイクルの結果として、特定のDNAフラグメントが指数的に蓄積される。通常、このプロセスにおいては、増幅プロセスの検出及び定量化を円滑に実行するべく、蛍光プローブ又はマーカーが使用されている。
【0003】
図1には、典型的なリアルタイムのPCR曲線が示されており、典型的なPCRプロセスにおける蛍光強度値がサイクル数に対してプロットされている。このケースにおいては、PCRプロセスのそれぞれのサイクルにおいて、PCR産物の形成がモニタリングされている。増幅は、通常、増幅反応の際に蛍光信号を計測するコンポーネント及び装置を含むサーモサイクラー内において計測される。このようなサーモサイクラーの一例が、Roche Diagnostics LightCyclerである(Cat. No.20110468)。例えば、増幅産物は、標的核酸に結合した際にのみ蛍光信号を放出する蛍光標識ハイブリダイゼーションプローブによるか、或いは、場合によっては二本鎖DNAに結合する蛍光染料により、検出される。
【0004】
典型的なPCR曲線において、ベースライン領域の終点における遷移点(これは、一般に、エルボー値又はサイクル閾値(Ct)と呼ばれている)を識別することは、PCR増幅プロセスの特性を理解するのに非常に有用である。Ct値は、PCRプロセスの効率の尺度として使用可能である。例えば、通常、分析対象であるすべての反応について規定の信号閾値を決定し、この閾値に到達するのに必要なサイクル数(Ct)を標的核酸及び標準又はハウスキーピング遺伝子などの基準核酸について決定する。標的核酸及び基準核酸について得られたCt値に基づいて、標的分子の絶対的又は相対的なコピー数を決定可能である(Gibson他による「Genome Research」(6巻、995〜1001頁)、Bieche他による「Cancer Research」(59巻、2759〜2765頁、1999年)、WO 97/46707、WO 97/46712、WO 97/46714)。図1のベースライン領域15の終点にある領域20のエルボー値は、サイクル数30の領域に位置しうる。
【0005】
PCR曲線のエルボー値は、いくつかの既存の方法を使用して決定可能である。例えば、様々な現在の方法においては、AFL(Arbitrary Fluorescence Value)と呼ばれる既定のレベルに蛍光が到達する値としてエルボーの実際の値を決定している。その他の現在の方法においては、蛍光対サイクル数の二次導関数が極大値に到達するサイクル数を使用することがある。これらの方法は、いずれも欠点を有している。例えば、方法によっては、異常値(雑音)データの影響を非常に受けやすく、AFL値法は、高いベースラインを有するデータセットには、十分に機能しない。図1に示されている成長曲線のベースラインの停止点(又は、ベースラインの終点)を決定する従来の方法は、特に、高タイター環境においては、満足に機能することができない。更には、これらのアルゴリズムは、通常、明確に規定されておらず、線形依存性であり、且つ、不可能でないにしても、最適化が非常に困難であるという、多数(例えば、50個以上)のパラメータを有している。
【発明の開示】
【発明が解決しようとする課題】
【0006】
従って、前述の及びその他の問題点を克服するシグモイドタイプ又は成長曲線などの曲線(特に、PCR曲線)のエルボー値を決定するシステム及び方法を提供することが望ましい。
【課題を解決するための手段】
【0007】
本発明は、シグモイド又は成長タイプの曲線のエルボー値などの特徴的な遷移値を決定する新しい効率的なシステム及び方法を提供する。ある実施においては、本発明のシステム及び方法は、PCR増幅曲線のサイクル閾値(Ct)を決定するのに特に有用である。
【0008】
本発明によれば、Levenberg−Marquardt(LM)回帰プロセスによって決定されたパラメータを有するダブルシグモイドを使用することにより、PCRデータセットにフィットする曲線に対する近似を検出している。パラメータの決定が完了したら、決定されたパラメータの1つ又は複数のものを使用し、その曲線を正規化可能である。正規化の後に、正規化済みの曲線を処理することにより、曲線に沿ったいくつか又はすべてのポイントにおける曲線の曲率を決定し、例えば、曲率対サイクル数を表すデータセット又はプロットを生成する。最大曲率が発生するサイクル数がCt値に対応している。この結果、Ct値が返され、これを表示するか又は更なる処理に使用可能である。
【0009】
本発明の第1の態様においては、成長曲線のベースライン領域の終点におけるポイントを決定するコンピュータにより実施される方法であって:
−成長曲線を表すデータセットであって、それぞれが座標値のペアを有する複数のデータポイントを含んでいるデータセットを受領する段階と、
−Levenberg−Marquardt(LM)回帰プロセスをダブルシグモイド関数に適用してデータセットにフィットする曲線の近似を算出することにより、この関数のパラメータを決定する段階と、
−決定されたパラメータを使用して曲線を正規化し、正規化済みの曲線を生成する段階と、
−正規化済みの曲線を処理することにより、長曲線のベースライン領域の終点を表す最大曲率のポイントを決定する段階と、
を含んで成る方法を提供する。
【0010】
本発明の第2の態様においては、プロセッサを制御して成長曲線のベースライン領域の終点におけるポイントを決定するためのコードを含むコンピュータ読み取り可能な媒体が提供され、このコードは、
−成長曲線を表すデータセットを受領する段階であって、このデータセットは、それぞれが座標値のペアを有する複数のデータポイントを含んでいる、段階と、
−Levenberg−Marquardt(LM)回帰プロセスをダブルシグモイド関数に適用してデータセットにフィットする曲線の近似を算出することにより、この関数のパラメータを決定する段階と、
−決定されたパラメータを使用して曲線を正規化し、正規化済みの曲線を生成する段階と、
−正規化済みの曲線を処理することにより、最大曲率のポイントを決定する段階であって、この最大曲率のポイントは、成長曲線のベースライン領域の終点を表している、段階と、
を実行する命令を含んでいる。
【0011】
本発明の更に別の態様においては、動力学的なポリメラーゼ連鎖反応(PCR)システムであって:
−動力学的なPCR増幅曲線を表すPCRデータセットを生成する動力学的PCR分析モジュールであって、このデータセットは、それぞれが座標値のペアを有する複数のデータポイントを含んでおり、且つ、このデータセットは、サイクル閾値(Ct)を含む注目の領域内にデータポイントを含んでいる、動力学的PCR分析モジュールと;
−PCRデータセットを、
−Levenberg−Marquardt(LM)回帰プロセスをダブルシグモイド関数に適用してデータセットにフィットする曲線の近似を算出することにより、この関数のパラメータを決定する段階と、
−決定されたパラメータを使用して曲線を正規化し、正規化済みの曲線を生成する段階と、
−正規化済みの曲線を処理することにより、成長曲線のサイクル閾値(Ct)を表す最大曲率のポイントを決定する段階と、により、
処理してCt値を決定するべく適合されたインテリジェンスモジュール;
を有している。
【0012】
添付の図面と請求項を含む本明細書の残りの部分を参照することにより、本発明のその他の特徴及び利点について理解することができよう。以下、添付の図面との関連において、本発明の更なる特徴及び利点、並びに、本発明の様々な実施例の構造及び動作について詳細に説明することとする。尚、添付図面中においては、類似の参照符号により、同一又は機能的に類似した要素を示している。
【発明を実施するための最良の形態】
【0013】
本発明は、PCR増幅曲線のベースライン領域の終点又はエルボー値又はCt値などのシグモイド又は成長曲線の遷移値を決定するためのシステム及び方法を提供する。ある態様においては、Levenberg−Marquardt(LM)回帰プロセスによって決定されたパラメータを有するダブルシグモイド関数を使用することにより、曲線に対する近似を検出している。パラメータの決定が完了したら、決定されたパラメータの1つ又は複数のものを使用して曲線を正規化可能である。正規化の後に、正規化済みの曲線は、曲線に沿ったいくつか又はすべてのポイントにおける曲線の曲率を決定するように、例えば、曲率対サイクル数を表すデータセット又はプロットを生成するように処理される。最大曲率が発生するサイクル数はCt値に対応している。この結果、Ct値が返され、これを表示するか又は更なる処理に使用可能である。
【0014】
一例としてPCRプロセスの環境における成長又は増幅曲線10を図1に示す。図示のように、曲線10は、遅滞期領域15と、対数期領域25と、を含んでいる。遅滞期領域15は、一般に、ベースライン又はベースライン領域と呼ばれている。このような曲線10は、遅滞期領域と対数期領域を結びつける注目の遷移領域20を含んでいる。領域20は、一般に、エルボー又はエルボー領域と呼ばれている。エルボー領域は、通常、ベースラインの終点と、基礎となっているプロセスの成長又は増幅レートにおける遷移と、を規定する。領域20内の特定の遷移ポイントを識別することは、基礎となっているプロセスの振る舞いを分析するのに有用であろう。典型的なPCR曲線において、エルボー値又はサイクル閾値(Ct)と呼ばれる遷移ポイントを識別することは、PCRプロセスの効率特性を理解するのに非常に有用である。
【0015】
同様のシグモイド又は成長曲線を提供可能なその他のプロセスには、細菌的なプロセス、酵素的なプロセス、及び結合のプロセスが含まれる。例えば、細菌増殖曲線において、注目の遷移ポイントは、遅滞期における時点θと称される。本発明に従って分析可能なデータ曲線を生成するその他の具体的なプロセスは、SDA(Strand Displacement Amplification)プロセス、NASBA(Nucleic Acid Sequence−Based Amplification)プロセス、及びTMA(Transcription Mediated Amplification)プロセスを含んでいる。SDA及びNASBAプロセスの例及びデータ曲線については、それぞれ、Wang,Sha−Sha他による「Homogeneous Real−Time Detection of Single−Nucleotide Polymorphisms by Strand Displacement Amplification on the BD ProbeTec Et System」(Clin Chem、2003年、49(10)、1599頁)と、Weusten、Jos J.A.M.他による「Principles of Quantitation of Viral Loads Using Nucleic Acid Sequence−Based Amplification in combination With Homogeneous Detection Using Molecular Beacons」(Nucleic Acids Research、2002年、30(6)、26)を参照されたい。従って、本明細書の残りの部分においては、PCR曲線に対するその適用可能性の観点から本発明の実施例及び態様について説明することとするが、本発明は、その他のプロセスに関係したデータ曲線にも適用可能であることを理解されたい。
【0016】
図1に示されているように、典型的なPCR成長曲線のデータは、例えば、x軸を規定するPCRサイクル数と、y軸を規定する蓄積されたポリヌクレオチドの成長のインジケータと、によるものなどの2次元座標系において表現可能である。通常は、蛍光マーカーの使用が、恐らくは、最も広範に使用されている標識の方式であることから、図1に示されているように、蓄積された成長のインジケータは、蛍光の強度値である。但し、使用する特定の標識及び/又は検出の方式に応じて、その他のインジケータを使用することも可能であることを理解されたい。蓄積された信号成長のその他の有用なインジケータの例には、ルミネセンス強度、ケミルミネセンス強度、バイオルミネセンス強度、リン光強度、電荷転送、電圧、電流、電力、エネルギー、温度、粘度、光散乱、放射性強度、反射率、透過率、及び吸光度が含まれている。サイクルの定義も、時間、プロセスサイクル、単位動作サイクル、及び再生サイクルを包含可能である。
【0017】
(全般的プロセスの概要)
本発明によれば、動力学的なPCR増幅曲線のエルボー値又はCt値などのシングルシグモイド曲線の遷移値を決定するプロセスの一実施例100については、図2を参照することにより、簡潔に説明可能である。段階110において、曲線を表す実験データセットを受領するか又は取得する。図1には、プロットされたPCRデータセットの一例が示されており、この場合には、y軸とx軸は、それぞれ、PCR曲線の蛍光強度とサイクル数を表している。ある態様においては、このデータセットは、連続的であって軸に沿って等間隔を有するデータを含むべきである。
【0018】
本発明の例示的な実施態様においては、本方法は、キーボード、マウス、及びこれらに類似したものなどのデータセットを入力するための入力装置;モニターなどの、曲線の領域内の注目の特定のポイントを表すための表示装置;CPUなどの本方法のそれぞれの段階を実行するのに必要な処理装置;モデムなどのネットワークインターフェイス;データセットを保存するためのデータストレージ装置;プロセッサ上において稼動するコンピュータコード;及びこれらに類似したものを含む(但し、これらに限定されない)従来のパーソナルコンピュータシステムを使用することによって実施可能である。又、本方法は、PCR装置内で実施することも可能である。
【0019】
図21には、本発明によるシステムが表示されている。この図は、ソフトウェア及びハードウェア資源間における関係を示す概略的なブロックダイアグラムを示している。本システムは、サーモサイクラー内に配置可能な動力学的PCR分析モジュールと、コンピュータシステムの一部であるインテリジェンスモジュールと、を有している。データセット(PCRデータセット)は、ネットワーク接続又は直接接続を介して分析モジュールからインテリジェンスモジュールに(又は、この逆方向に)転送される。データセットは、プロセッサ上において稼動していると共にインテリジェンスモジュールのストレージ装置内に保存されているコンピュータコードにより、図2に示されている方法に従って処理された後に、分析モジュールのストレージ装置に返送され、変更されたデータを表示装置上に表示可能である。特定の実施態様においては、PCRデータ取得装置内にインテリジェントモジュールを実装することも可能である。
【0020】
プロセス100は、サーモサイクラーなどのPCRデータ取得装置内に位置するインテリジェンスモジュール内で(例えば、プロセッサ実行命令として)実施されているケースにおいては、データの収集に伴って、データセットをリアルタイムでインテリジェンスモジュールに供給可能であり、或いは、メモリユニット又はバッファ内に保存し、実験が完了した後に、インテリジェンスモジュールに供給することも可能である。同様に、データセットは、取得装置に対するネットワーク接続(例えば、LAN、VPN、イントラネット、インターネットなど)又は直接接続(例えば、USBやその他の直接的な有線又は無線接続)を介してデスクトップコンピュータシステムやその他のコンピュータシステムなどの別個のシステムに供給することも可能であり、或いは、CD、DVD、フロッピー(登録商標)ディスク、又はこれらに類似したものなどの携帯型の媒体上において提供することも可能である。ある態様においては、データセットは、座標値のペアを有するデータポイント(又は、2次元ベクトル)を含んでいる。PCRデータの場合には、座標値のペアは、通常、サイクル数と蛍光強度値を表している。段階110においてデータセットの受領又は取得が完了した後に、データセットを分析することにより、ベースライン領域の終点を決定可能である。
【0021】
段階120において、曲線の近似を算出する。この段階において、ある実施態様においては、Levenberg−Marquardt(LM)回帰プロセス又はその他の回帰プロセスによって決定されたパラメータを有するダブルシグモイド関数を使用することにより、データセットを表す曲線の近似を検出している。この近似は、異常値又はスパイクポイントが曲線フィットの品質に対して最小限の影響を有していることから、「ロバスト(robust)」と称されている。図13(これについては、後述する)は、受領したデータセットのプロットと、本発明に従ってLevenberg−Marquadtr回帰プロセスを使用してダブルシグモイド関数のパラメータを決定することによって決定されたデータセットのロバスト近似の一例を示している。
【0022】
ある態様においては、データセットを処理してベースライン領域の終点を決定する前に、データセット内の異常値又はスパイクポイントを除去又は置換している。スパイクの除去は、段階110においてデータセットを取得する前又は後において実行可能である。図3は、PCR又はその他の成長曲線を表すデータセット内のスパイクポイントを識別及び置換するためのプロセスフローを示している。
【0023】
段階130において、後述するように、段階120において決定されたパラメータを使用して曲線を正規化することにより、例えば、ベースラインスロープを除去している。この方式による正規化によれば、曲線のベースライン領域の終点又はベースラインの停止位置を決定又は規定することを必要とすることなしに、Ct値を決定可能である。この結果、後述するように、段階140において、正規化済みの曲線を処理してCt値を決定する。
【0024】
(LM回帰プロセス)
後述するように、図3の段階502〜段階524も、データセットの曲線を近似すると共に、フィット関数のパラメータを決定するプロセスフロー(段階120)を示している。これらのパラメータは、曲線の正規化(段階130)に使用可能である(これは、例えば、本発明のある実施態様によれば、PCR曲線などのシグモイド又は成長タイプ曲線を表すデータセットのベースラインスロープの変更又は除去である)。データセットの処理によってスパイクポイントが除去又は置換された変更済みのデータセットが生成されたら、段階502〜段階524に従って、この変更済みのスパイクを有していないデータセットを処理することにより、フィット関数のパラメータを識別可能である。
【0025】
図示したある実施態様においては、Levenberg−Marquardt(LM)法を使用することにより、データセットのロバスト曲線近似を算出している。LM法は、非線形の回帰プロセスであり、これは、非線形関数とデータセット間の距離を最小化する反復的な技法である。これは、最急降下プロセスとGauss−Newtonプロセスの組み合わせのように振舞うプロセスであり、現在の近似が十分にフィットしていない場合には、最急降下プロセスのように振舞うが(これは、低速であるが、相対的に高い信頼性を有する収束である)、現在の近似が正確になるに伴って、Gauss−Newtonプロセスのように振舞うことになる(これは、相対的に高速であるが、相対的に低い信頼性を有する収束である)。LM回帰法は、非線形の回帰問題を解決するべく、広く使用されている。
【0026】
一般的に、LM回帰法は、様々な入力を必要とすると共に出力を供給するアルゴリズムを含んでいる。ある観点においては、入力は、処理の対象であるデータセットと、このデータへのフィットに使用される関数と、この関数のパラメータ又は変数の初期推定値と、を含んでいる。出力は、関数とデータセット間の距離を最小化する関数のパラメータの組を含んでいる。
【0027】
ある実施態様よれば、フィット関数は、次のようなダブルシグモイドの形態を有している。
【0028】
f(x)=a+bx+c/((1+exp-d(x-e))(1+exp-f(x-g))) (1)
【0029】
この式をフィット関数として選択した理由は、典型的なPCR曲線又はその他の成長曲線が有する様々な曲線形状にフィットするためのその柔軟性とその能力に基づいている。当業者であれば、必要に応じて、前述のフィット関数やその他のフィット関数の変形を使用可能であることを理解するであろう。
【0030】
ダブルシグモイド式(1)は、a、b、c、d、e、f、及びgという7つのパラメータを有している。この式は、定数、スロープ、及びダブルシグモイドの和に分解可能である。ダブルシグモイド自体は、2つのシグモイドの乗算である。図4は、ダブルシグモイド式(1)の分解を示している。パラメータd、e、f、及びgは、2つのシグモイドの形状を決定している。最終的な曲線に対するこれらの影響を示すために、次のシングルシグモイドを検討する。
【0031】
1/(1+exp-d(x-e)) (2)
【0032】
ここで、パラメータdは、曲線の「シャープネス」を決定しており、パラメータeは、変曲点のx値を決定している。図5は、曲線に対するパラメータdの影響と、変曲点のx値の位置に対するパラメータeの影響と、を示している。次の表1は、ダブルシグモイド曲線に対するパラメータの影響を示している。
【0033】
【表1】

【0034】
ある観点においては、曲線が非現実的な形状を獲得することを防止するべく、ダブルシグモイド式の「シャープネス」パラメータd及びfを制約する必要がある。従って、ある観点においては、d<−1又はd>1.1、或いは、f<−1又はf>1.1におけるすべての反復を失敗と見なしている。その他の態様においては、パラメータd及びfに対する異なる制約を使用可能である。
【0035】
Levenberg−Marquardtアルゴリズムは、反復的なアルゴリズムであるため、通常は、フィットのための関数のパラメータの初期推定値を必要としている。初期推定値が良好であればあるほど、近似も良好になり、アルゴリズムが局所的な最小値に向かって収束する可能性も低くなる。ダブルシグモイド関数の複雑性とPCR曲線又はその他の成長曲線の様々な形状に起因し、アルゴリズムがしばしば局所的な最小値に収束することを防止するには、すべてのパラメータにおける1つの初期推定値だけでは、十分ではないであろう。従って、ある観点においては、複数(例えば、3つ以上)の初期パラメータの組を入力し、最良の結果を保持している。ある観点においては、使用している複数のパラメータの組にわたって、大部分のパラメータを一定に保持しており、複数のパラメータの組のそれぞれごとに異なってよいのは、パラメータc、d、及びfのみである。図6は、異なるバラメータの組における3つの曲線形状の例を示している。これらの3つのパラメータの組の選択は、PCRデータを表す曲線の3つの可能な異なる形状を示している。3つを上回る数のパラメータの組を処理して最良のものを保持することも可能であることを理解されたい。
【0036】
図3に示されているように、段階510において、LM法の初期入力パラメータを識別している。これらのパラメータは、操作者が入力するか又は算出可能である。一態様によれば、これらのパラメータは、後述するように、段階502、504、及び506によって決定又は設定されている。
【0037】
(初期パラメータ(a)の算出)
パラメータ(a)は、ベースラインの高さであり、この値は、初期パラメータのすべての組にわたって同一である。ある観点においては、段階504において、データセットから、3番目に小さいy軸値(例えば、蛍光値)がパラメータ(a)に割り当てられている。この結果、安定した計算が可能である。当然のことながら、その他の態様においては、必要に応じて、最小のy軸値や2番目に小さい値などの任意のその他の蛍光値をパラメータ(a)に割り当て可能である。
【0038】
(初期パラメータ(b)の算出)
パラメータ(b)は、ベースライン及びプラトーのスロープである。この値は、初期パラメータのすべての組にわたって同一である。理想的には、なんらのスロープも存在するべきではないことから、ある観点においては、段階502において、0.01という固定値を(b)に対して割り当てている。その他の態様においては、例えば、0〜約0.5の範囲の値などの異なる値をパラメータ(b)に対して割り当て可能である。
【0039】
(初期パラメータ(c)の算出)
パラメータ(c)は、プラトーの高さ−ベースラインの高さを表しており、これは、AFI(Absolute Fluorescence Increase)として表記される。ある観点においては、最初のパラメータの組においては、c=AFI+2であり、最後の2つのパラメータの組においては、c=AFIである。これが図6に示されており、最後の2つのパラメータの組の場合には、c=AFIであり、最初のパラメータの組の場合には、c=AFI+2である。この変化は、パラメータの最初の組によってモデル化された曲線の形状に起因しており、これは、プラトーを有していない。
【0040】
(パラメータ(d)及び(f)の算出)
パラメータ(d)及び(f)は、2つのシグモイドのシャープネスを定義している。これらのパラメータにおける曲線に基づいて近似を付与する方法は存在していないことから、ある観点においては、段階502において、3つの典型的な固定値を使用している。その他の固定した又は固定されていない値をパラメータ(d)及び/又は(f)に使用することも可能であることを理解されたい。これらのペアは、遭遇するPCR曲線の大部分の共通的な形状をモデル化している。次の表2は、図6に示されているパラメータの異なる組における(d)及び(f)の値を示している。
【0041】
【表2】

【0042】
(パラメータ(e)及び(g)の算出)
段階506において、パラメータ(e)及び(g)を決定している。パラメータ(e)及び(g)は、2つのシグモイドの変曲点を定義している。ある観点においては、これらは、いずれも、すべての初期パラメータの組にわたって同一の値を有している。パラメータ(e)及び(g)は、同一又は異なる値を具備可能である。近似を検出するべく、ある観点においては、強度の平均を上回る最初のポイントのx値を使用している(これは、例えば、蛍光であるが、スパイクではない)。この態様に従って(e)及び(g)の値を決定するプロセスが図7に示されており、以下、これについて説明する。
【0043】
図7を参照すれば、まず、曲線の平均(例えば、蛍光強度)を決定している。次いで、平均を上回る最初のデータポイントを識別している。次いで、(a)そのポイントが、曲線の開始点の近傍(例えば、最初の5サイクル内)に位置していないかどうか、(b)そのポイントが、曲線の終点の近傍(例えば、最後の5つのサイクル内)に位置していないかどうか、及び(c)そのポイントの周り(例えば、その周りの2ポイントの半径内)の導関数が符号の変化を示していないかどうか(変化を示している場合には、そのポイントは、スパイクである可能性が高く、従って、拒絶する必要がある)を決定している。
【0044】
次の表3は、一態様による図6に使用されている初期パラメータ値の例を示している。
【0045】
【表3】

【0046】
再度図3を参照すれば、段階510において、すべてのパラメータが設定された後に、入力されたデータセット、関数、及びパラメータを使用してLMプロセス520を実行する。従来は、Levenberg−Marquardt法を使用することにより、非線形の最小二乗問題を解決している。従来のLM法においては、曲線の近似とデータセット間の誤差の二乗の合計として定義されている距離の尺度を算出している。しかしながら、二乗の合計を最小化する場合には、異常値の距離が、スパイクではないデータポイントの距離を上回っているために、異常値に対して大きな重みが付与されることになり、この結果、しばしば、不適切な曲線や好ましくない曲線が得られることになってしまう。従って、本発明の一態様によれば、絶対誤差の合計を極小化することにより、近似とデータセット間の距離を演算している(この結果、この場合には、異常値に対して大きな重みが付与されない)。この態様においては、近似とデータ間の距離は、次式によって付与される。
【0047】
距離=Σ|ydata−yapproximation| (3)
【0048】
前述のように、ある観点においては、段階522及び段階524に示されているように、複数(例えば、3つ)の初期パラメータの組のそれぞれを入力し、処理した後に、最良の結果を保持しており、この最良の結果は、式(3)における最も小さい又は最小の距離を提供するパラメータの組である。ある観点においては、パラメータの大部分を複数のパラメータの組にわたって一定に保持しており、パラメータのそれぞれの組ごとに異なってよいものは、c、d、及びfのみである。任意の数の初期パラメータの組を使用可能であることを理解されたい。
【0049】
図8は、本発明によるパラメータの組におけるLMプロセス520のプロセスフローを示している。前述のように、Levenberg−Marquardt法は、最急降下プロセス又はGauss−Newtonプロセスのように動作可能である。この振る舞いは、減衰係数λによって左右される。λが大きいほど、Levenberg−Marquardtアルゴリズムは、最急降下プロセスのように振舞うことになる。一方、λが小さいほど、Levenberg−Marquardtアルゴリズムは、Gauss−Newtonプロセスのように振舞うことになる。ある観点においては、λは、0.001から始まっている。λは、約0.000001〜約1.0などの任意のその他の値から始まることも可能であることを理解されたい。
【0050】
前述のように、Levenberg−Marquardt法は、反復的な技法である。一態様によれば、図8に示されているように、それぞれの反復において、次の各段階を実行している。
【0051】
1.先行する近似のヘッセ行列(H)を算出する。
【0052】
2.先行する近似の転置ヤコビ行列(JT)を算出する。
【0053】
3.先行する近似の距離ベクトル(d)を算出する。
【0054】
4.現在の減衰係数λにより、次のようにヘッセ行列の対角項を増大させる。
【0055】
aug=Hλ (4)
【0056】
5.増大した式を次のように解く。
【0057】
augx=JTd (5)
【0058】
6.増大した式の解xを関数のパラメータに追加する。
【0059】
7.新しい近似及び曲線間の距離を算出する。
【0060】
8.新しいパラメータの組を有する距離が、以前のパラメータの組を有する距離を下回っている場合には、・その反復は成功であると見なされ、・パラメータの新しい組を維持又は保存し、・減衰係数λを(例えば、係数10だけ)減少させる。新しいパラメータの組を有する距離が、以前のパラメータの組を有する距離を上回っている場合には、・その反復は失敗であると見なされ、・パラメータの新しい組を破棄し、・減衰係数λを(例えば、係数10だけ)増大させる。
【0061】
ある観点においては、図8のLMプロセスは、次の基準の中の1つが実現されるまで反復される。
【0062】
1.既定の反復回数Nだけ既に実行されている。この第1の基準は、アルゴリズムが無制限に反復されることを防止している。例えば、図10に示されているある観点においては、既定の反復値Nは、100である。アルゴリズムが収束可能である場合には、100回の反復は、アルゴリズムが収束するのに十分なものであるはずである。一般に、Nは、10未満〜100超の範囲をとることができる。
【0063】
2.2つの成功した反復間の距離の差が閾値(例えば、0.0001)を下回っている。差が非常に小さくなった場合には、所望の精度が既に実現されており、解がそれ以上大幅に良好になることはないことから、反復を継続するのは無意味である。
【0064】
3.減衰係数λが既定の値を超過している(例えば、1020を上回っている)。λが非常に大きくなると、アルゴリズムは、現在の解よりも良好に収束することはなく、従って、反復を継続するのは無意味である。一般に、この規定値は、1020を大幅に下回る又は上回るものであってよい。
【0065】
(正規化)
パラメータの決定が完了した後に、ある実施態様においては、決定されたパラメータの1つ又は複数のものを使用して曲線を正規化している(段階130)。例えば、ある観点においては、曲線の線形成長部分を減算することにより、ゼロのベースラインスロープを有するように曲線を正規化又は調節可能である。数学的には、これは、次のように表される。
【0066】
dataNew(BLS)=data−(a+bx) (6)
【0067】
ここで、dataNew(BLS)は、ベースライン減算の後の正規化された信号であり、これは、例えば、線形成長又はベースラインスロープが減算又は除去されたデータセット(data)である。パラメータa及びbの値は、LM式を使用して曲線回帰させることによって決定された値であり、xは、サイクル数である。従って、x軸に沿ったすべてのデータ値について、定数aとスロープbにx値を乗算したものをデータから減算することにより、ゼロのベースラインスロープを有するデータ曲線を生成している。ある態様においては、LM回帰プロセスをデータセットに適用して正規化パラメータを決定する前に、スパイクポイントをデータセットから除去している。
【0068】
別の態様においては、次式に従って、ゼロのスロープを有するように曲線を正規化又は調節可能である。
【0069】
dataNew(BLSD)=(data−(a+bx))/a (7a)
【0070】
ここで、dataNew(BLSD)は、除算を有するベースライン減算の後の正規化された信号であり、これは、例えば、線形成長又はベースラインスロープを減算又は除去し、この結果をaによって除算したデータセット(data)である。パラメータa及びbの値は、LM式を使用して曲線回帰させることによって決定された値であり、xは、サイクル数である。従って、x軸に沿ったすべての値について、定数aとスロープbにx値を乗算したものをデータから減算し、この結果をパラメータaの値によって除算することにより、ゼロのベースラインスロープを有するデータ曲線を生成している。ある観点においては、式(7a)は、パラメータ”a”≧1の場合に有効であり、”a”<1の場合には、次の式が使用される。
【0071】
dataNew(BLSD)=data−(a+bx) (7b)
【0072】
ある態様においては、LM回帰プロセスをデータセットに適用して正規化パラメータを決定する前に、スパイクポイントをデータセットから除去している。
【0073】
更に別の態様においては、曲線は、次式に従って正規化又は調節可能である。
【0074】
dataNew(BLD)=data/a (8a)
【0075】
ここで、dataNew(BLD)は、ベースライン除算の後の正規化済みの信号であり、これは、例えば、パラメータaによって除算されたデータセット(data)である。パラメータa及びbの値は、LM式を使用して曲線回帰させることによって決定された値であり、xは、サイクル数である。ある観点においては、式(8a)は、パラメータ”a”≧1の場合に有効であり、”a”<1の場合には、次の式が使用される。
【0076】
dataNew(BLD)=data+(1−a) (8b)
【0077】
ある態様においては、LM回帰プロセスをデータセットに適用して正規化パラメータを決定する前に、スパイクポイントをデータセットから除去している。
【0078】
更に別の態様においては、次の式に従って曲線を正規化又は調節可能である。
【0079】
dataNew(PGT)=(data−(a+bx))/c (9a)
【0080】
この場合に、dataNew(PGT)は、除算を伴うベースライン減算の後の正規化済みの信号であり、これは、例えば、線形成長又はベースラインスロープを減算又は除去し、この結果をcによって除算したデータセット(data)である。a、b、及びcの値は、LM式を使用して曲線回帰させることによって決定された値であり、xは、サイクル数である。従って、x軸に沿ったすべてのデータ値について、定数aとスロープbにx値を乗算したものをデータから除算し、この結果をパラメータcの値によって除算することにより、ゼロのベースラインスロープを有するデータ曲線を生成している。ある観点においては、式(9a)は、パラメータ”c”≧1の場合に有効であり、パラメータ”c”<1及び”c”≧0の場合には、次の式を使用する。
【0081】
dataNew(PGT)=data−(a+bx) (9b)
【0082】
ある態様においては、LM回帰プロセスをデータセットに適用して正規化パラメータを決定する前に、データセットからスパイクポイントを除去している。
【0083】
当業者であれば、Levenberg−Marquardt又はその他の回帰プロセスによって決定されたパラメータを使用することにより、その他の正規化式を使用してベースラインを正規化及び/又は変更可能であることを理解するであろう。
【0084】
(曲率決定)
式(6)、(7)、(8)、又は(9)、或いは、その他の正規化式のいずれかを使用した曲線の正規化が完了した後に、Ct値を決定可能である。ある観点においては、動力学的PCR曲線のエルボー値又はCt値を決定するためのプロセスフローを示している図9を参照して説明するように、曲率決定プロセス又は方法を正規化済みの曲線に適用している。段階910において、データセットを取得している。決定プロセスが、サーモサイクラーなどのPCRデータ取得装置内に位置するインテリジェンスモジュール内で(例えば、プロセッサ実行命令として)実施されているケースにおいては、データセットは、データの収集に伴って、インテリジェンスモジュールにリアルタイムで供給可能であり、或いは、メモリユニット又はバッファ内に保存し、実験が完了した後に、モジュールに供給することも可能である。同様に、データセットは、取得装置に対するネットワーク接続(例えば、LAN、VPN、イントラネット、インターネットなど)又は直接接続(例えば、USB又はその他の直接的な有線又は無線接続)を介してデスクトップコンピュータシステムなどの別個のシステムに供給することも可能であり、或いは、CD、DVD、フロッピー(登録商標)ディスク、又はこれらに類似したものなどの携帯型の媒体上において供給することも可能である。
【0085】
データセットの受領又は取得が完了した後に、段階920において、曲線に対する近似を決定する。この段階においては、ある実施態様においては、Levenberg−Marquardt回帰プロセスによって決定されたパラメータを有するダブルシグモイド関数を使用することにより、データセットを表す曲線の近似を検出している。又、図3を参照して説明したように、段階920の前に、スパイクポイントをデータセットから除去することも可能である。例えば、段階910において取得されたデータセットは、既にスパイクが除去されているデータセットであってもよい。段階930において、曲線を正規化する。ある態様においては、前述の式(6)、(7)、(8)、又は(9)の中のいずれかを使用して曲線を正規化している。例えば、段階920において決定したダブルシグモイド式のパラメータを使用し、前述の式(6)に従ってベースラインスロープを減算することにより、ベースラインをゼロスロープに設定可能である。段階940において、プロセスを正規化済みの曲線に対して適用することにより、正規化済みの曲線に沿ったポイントにおける曲率を決定している。曲率対サイクル数のプロットを返すと共に/又は表示可能である。最大曲率のポイントがエルボー値又はCt値に対応している。段階950において、結果を、例えば、分析を実行したシステム又は分析を要求した別個のシステムに対して返している。段階960において、Ct値を表示している。データセットの全体や曲線の近似などの追加データを表示することも可能である。図9の分析を実行したシステムと結合されているモニター画面又はプリンタなどの表示装置によってグラフィカルな表示をレンダリングすることも可能であり、或いは、表示装置上においてレンダリングするべく別個のシステムにデータを供給することも可能である。
【0086】
ある実施態様よれば、この曲線のCt値を取得するべく、最大曲率を決定している。ある観点においては、正規化済みの曲線上のいくつか又はすべてのポイントにおける曲率を決定している。曲率対サイクル数のプロットを表示可能である。曲線の曲率は、次式によって付与される。
【0087】
【数1】

【0088】
次式によって付与される半径aの円を検討する。
【0089】
【数2】

【0090】
式(11)の曲率は、kappa(x)=−(1/a)である。従って、曲率の半径は、曲率の負の逆数に等しい。円の半径が一定であるため、その曲率は、−(1/a)によって付与される。ここで、図10bを検討する。これは、図10aのPCRデータセットのフィットの曲率のプロットである。Ct値は、最大曲率の位置において発生すると考えられ、これは、サイクル数Ct=21.84において発生している。このCt値は、図10aに示されているPCR成長曲線に良好に対応している。
【0091】
最大曲率(これは、21.84のCt値に対応している)における曲率半径は、半径=1/0.2818=3.55サイクルである。この半径の円を図10aのPCR成長曲線に重ね合わせたものが図11に示されている。図11が示しているように、この最大曲率に対応する半径の円は、曲線に正接した状態で曲線の成長領域の開始点に重ね合わせることができる最大の円を表している。小さな(最大の)曲率半径を有する曲線は、急峻な成長曲線を有することになり、大きな(最大の)曲率半径を有する曲線は、穏やかな成長曲線を有することになる。曲率半径が極端に大きい場合には、これは、明らかな信号を有していない曲線を示している。
【0092】
曲率の計算において必要な式(1)のダブルシグモイドの1次及び2次導関数を次に示しておく。
【0093】
(1次導関数)
【数3】

【0094】
(2次導関数)
【数4】

【実施例】
【0095】
図12aは、成長曲線の未加工のデータの一例を示している。ダブルシグモイド/LM法を図12bに示されている未加工のデータプロットに適用することにより、次の表4に示されている式(1)の7つのパラメータの値が得られる。
【0096】
【表4】

【0097】
図13には、図12に示されているデータに対するダブルシグモイドフィットが示されており、これは、データポイントの非常に正確な評価を示している。次いで、これらのデータを式(6)(ベースライン減算)に従って正規化することにより、図14に示されているグラフが得られる。図14に示されている実線は、式(6)に従って正規化済みのこのデータセットに対する式(1)のダブルシグモイド/LMの適用結果である。図15は、図14の正規化済みの曲線における曲率対サイクル数のプロットを示している。曲率の最大値である0.1378の曲率は、サイクル数34.42において発生している。従って、この最大曲率におけるサイクル数に基づいて、Ct=34.42であり、曲率半径=1/0.1378=7.25である。この曲率半径を有する円と正規化済みのデータセットを重ね合わせたものが図16に示されている。
【0098】
「遅成長(slow−grower)」データセットの一例が図17に示されている。このデータセットに対するダブルシグモイドフィットとベースライン減算(式(6))を使用した正規化により、図18に示されているフィット結果が得られる。対応する曲率プロットが図19に示されている。最大曲率である曲率=0.00109274は、サイクル数25.90において発生しており、これは、曲率半径=915に対応している。この大きな曲率半径は、これが遅成長(slow grower)データセットであることを示している。
【0099】
別の例として、図20に示されているPCR成長曲線の組を検討する。既存の方法(「閾値」)を使用して得られたCt値対除算を伴うベースライン減算(BLSD−式(7))を使用して得られたCt値の比較が、次の表5に示されている。
【0100】
【表5】

【0101】
表5は、Ct値を算出する曲率法(この場合には、BLSDによる正規化の後におけるものである)によれば、既存の閾値法と比べて、小さなCv(Coefficient of Variation)が得られることを示している。又、曲率法によって算出された曲率半径(Radius Of Curvature:ROC)は、線形曲線と真の成長曲線を弁別するための簡単な方法を提供している。
【0102】
(結論)
本発明の一態様によれば、成長曲線のベースラインの終点におけるポイントを決定するコンピュータにより実施される方法が提供される。この方法は、通常、成長曲線を表すデータセットを受領する段階であって、このデータセットは、それぞれが座標値のペアを有する複数のデータポイントを含んでいる、段階と、Levenberg−Marquardt(LM)回帰プロセスをダブルシグモイド関数に適用してデータセットにフィットする曲線の近似を算出することにより、関数のパラメータを決定する段階と、を含んでいる。本方法は、通常、決定されたパラメータを使用して曲線を正規化し、正規化された曲線を生成する段階と、正規化済みの曲線を処理して最大曲率のポイントの座標値を決定する段階と、を更に含んでおり、このポイントは、成長曲線のベースライン領域の終点を表している。ある観点においては、正規化済みの曲線を処理することにより、曲線に沿ったいくつか又はすべてのポイントにおける曲率を決定している。特定の実施態様においては、本方法は、正規化済みの曲線の曲率のプロットを表示する段階を更に含んでいる。
【0103】
ある観点においては、データセットは、動力学的なポリメラーゼ連鎖反応(PCR)プロセス、バクテリアプロセス、酵素プロセス、又はバインディングプロセスの成長曲線を表している。特定の実施態様においては、増幅されたポリヌクレオチドの蓄積は、蛍光強度値、ルミネセンス強度値、ケミルミネセンス強度値、リン光強度値、電荷転送値、バイオルミネセンス強度値、又は吸収値の中の1つによって表されている。
【0104】
別の実施例においては、曲線は、動力学的なポリメラーゼ連鎖反応(PCR)プロセスの成長曲線を表しており、ベースライン領域の終点におけるポイントは、動力学的なPCR曲線のエルボー又はサイクル閾値(Ct)を表しており、この場合に、最大曲率を有するポイントがCt値を表している。ある態様においては、座標値のペアは、増幅されたポリヌクレオチドの蓄積とサイクル数を表している。別の態様においては、本方法は、Ct値を返す段階を更に含んでいる。更に別の態様においては、本方法は、Ct値を表示する段階を更に含んでいる。
【0105】
ある態様においては、正規化する段階は、曲線の線形成長部分を減算する段階を含んでいる。ある態様においては、受領したデータセットは、1つ又は複数の異常値又はスパイクポイントを除去するべく処理済みのデータセットを含んでいる。
【0106】
ある態様においては、ダブルシグモイド関数は、a+bx+c/((1+exp-d(x-e))(1+exp-f(x-g)))という形態を有しており、算出段階は、この関数のパラメータa、b、c、d、e、f、及びgの中の1つ又は複数のものを反復的に決定する段階を含んでいる。特定の実施態様においては、少なくともパラメータa及びbが決定され、正規化段階は、曲線から線形成長部分a+bxを減算する段階を含んでいる。別の特定の実施態様においては、少なくともパラメータaが決定され、正規化段階は、曲線をパラメータaによって除算する段階を含んでいる。更に別の特定の実施態様においては、少なくともパラメータa及びbが決定され、正規化する段階は、曲線から線形成長部分a+bxを減算し、この結果をパラメータaによって除算する段階を含んでいる。
【0107】
別の実施例においては、少なくともパラメータa、b、及びcが決定され、正規化段階は、曲線から線形成長部分a+bxを減算する段階と、この結果をパラメータcによって除算する段階と、を含んでいる。
【0108】
本発明の別の態様によれば、プロセッサを制御して成長曲線のベースライン領域の終点におけるポイントを決定するためのコードを含むコンピュータ読み取り可能な媒体が提供される。このコードは、通常、成長曲線を表すデータセットを受領し(このデータセットは、それぞれが座標値のペアを有する複数のデータポイントを含んでいる)、Levenberg−Marquardt(LM)回帰プロセスをダブルシグモイド関数に適用してデータセットにフィットする曲線の近似を算出することにより、この関数のパラメータを決定するための命令を含んでいる。又、本コードは、通常、決定されたパラメータを使用して曲線を正規化して正規化済みの曲線を生成し、正規化済みの曲線を処理して最大曲率のポイントの座標値を決定するための命令をも含んでおり、このポイントが成長曲線のベースライン領域の終点を表している。
【0109】
特定の実施態様においては、コンピュータ読み取り可能な媒体は、正規化済みの曲線の曲率のプロットを表示するための命令を更に含んでいる。ある態様においては、本コードは、ベースライン領域の終点におけるポイントの座標値を返す又は表示するための命令を更に含んでいる。
【0110】
ある観点においては、データセットは、動力学的ポリメラーゼ連鎖反応(PCR)プロセス、バクテリアプロセス、酵素プロセス、又はバインディングプロセスの成長曲線を表している。別の態様においては、コンピュータ読み取り可能な媒体は、Ct値を表示するための命令を更に含んでいる。更に別の実施例においては、コンピュータ読み取り可能な媒体は、Ct値を返すための命令を更に含んでいる。
【0111】
特定の実施態様においては、データセットは、動力学的ポリメラーゼ連鎖反応(PCR)プロセスの成長曲線を表しており、ベースライン領域の終点におけるポイントは、成長曲線のエルボー又はサイクル閾値(Ct)を表している。別の実施例においては、座標値のペアは、増幅されたポリヌクレオチドの蓄積とサイクル数を表している。更に別の実施例においては、増幅されたポリヌクレオチドの蓄積は、蛍光強度値、ルミネセンス強度値、ケミルミネセンス強度値、リン光強度値、電荷転送値、バイオルミネセンス強度値、又は吸収値の中の1つによって表されている。
【0112】
ある観点においては、処理するための命令は、正規化済みの曲線に沿ったいくつか又はすべてのポイントにおける曲率を決定するための命令を含んでいる。ある態様においては、正規化するための命令は、データセットから線形成長部分を減算するための命令を含んでいる。別の態様においては、曲線は、動力学的なポリメラーゼ連鎖反応(PCR)プロセスの増幅曲線であり、ベースライン領域の終点におけるポイントは、動力学的PCR曲線のエルボー又はサイクル閾値(Ct)を表しており、最大曲率を有するポイントがCt値を表している。
【0113】
特定の実施態様においては、ダブルシグモイド関数は、a+bx+c/((1+exp-d(x-e))(1+exp-f(x-g)))という形態を有しており、算出するための命令は、この関数のパラメータa、b、c、d、e、f、及びgの中の1つ又は複数のものを反復的に決定するための命令を含んでいる。
【0114】
ある態様においては、少なくともパラメータa及びbが決定され、正規化するための命令は、曲線から線形成長部分a+bxを減算するための命令を含んでいる。別の態様においては、少なくともパラメータa、b、及びcが決定され、正規化するための命令は、曲線から線形成長部分a+bxを減算し、この結果をパラメータcによって除算するための命令を含んでいる。更に別の態様においては、少なくともパラメータaが決定され、正規化するための命令は、曲線をパラメータaによって除算するための命令を含んでいる。更に別の態様においては、少なくともパラメータa及びbが決定され、正規化するための命令は、曲線から線形成長部分a+bxを減算し、この結果をパラメータaによって除算するための命令を含んでいる。
【0115】
本発明の更に別の態様によれば、動力学的ポリメラーゼ連鎖反応(PCR)システムが提供される。本システムは、通常、動力学的なPCR増幅曲線を表すPCRデータセットを生成する動力学的PCR分析モジュール(このデータセットは、それぞれが座標値のペアを有する複数のデータポイントを含んでおり、且つ、本データセットは、サイクル閾値(Ct)を含む注目の領域内にデータポイントを含んでいる)と、PCRデータセットを処理してCt値を決定するべく適合されたインテリジェンスモジュールと、を含んでいる。インテリジェンスモジュールは、通常、Levenberg−Marquardt(LM)回帰プロセスをダブルシグモイド関数に適用してデータセットにフィットする曲線の近似を算出することにより、関数のパラメータを決定し、決定されたパラメータを使用して曲線を正規化して正規化済みの曲線を生成すると共に、正規化済みの曲線を処理して最大曲率のポイントの座標値を決定することにより(このポイントは、成長曲線のサイクル閾値(Ct)を表している)、PCRデータセットを処理する。
【0116】
ある態様においては、ダブルシグモイド関数は、a+bx+c/((1+exp-d(x-e))(1+exp-f(x-g)))という形態を有しており、算出段階は、この関数のパラメータa、b、c、d、e、f、及びgの中の1つ又は複数のものを反復的に決定する段階を含んでいる。特定の実施態様においては、少なくともパラメータa及びbが決定され、正規化段階は、曲線から線形成長部分a+bxを減算する段階を含んでいる。別の特定の実施態様においては、パラメータa及びbが決定され、正規化する段階は、曲線から線形成長部分a+bxを減算する段階と、この結果をパラメータaによって除算する段階を含んでいる。更に別の特定の実施態様においては、少なくともパラメータaが決定され、正規化する段階は、パラメータaによって曲線を除算する段階を含んでいる。
【0117】
別のある態様においては、少なくともパラメータa、b、及びcが決定され、正規化する段階は、曲線から線形成長部分a+bxを減算する段階と、この結果をパラメータcによって除算する段階と、を含んでいる。
【0118】
ある観点においては、正規化済みの曲線を処理することにより、曲線に沿ったいくつか又はすべてのポイントにおける曲率を決定しており、この場合に、最大曲率を有するポイントがCt値を表している。特定の実施態様においては、インテリジェンスモジュールは、正規化済みの曲線の曲率のプロットの表示をレンダリングするべく更に適合されている。
【0119】
ある態様においては、正規化する段階は、データセットから線形成長部分を減算する段階を含んでいる。特定の実施態様においては、曲線から線形成長部分a+bxを減算することによって曲線フィットを正規化している。
【0120】
特定の実施態様においては、インテリジェンスモジュールは、Ct値を返すべく更に適合されている。別の実施例においては、インテリジェンスモジュールは、Ct値を表示するべく更に適合されている。
【0121】
別の態様においては、座標値のペアは、増幅されたポリヌクレオチドの蓄積とサイクル数を表している。特定の実施態様においては、増幅されたポリヌクレオチドの蓄積は、蛍光強度値、ルミネセンス強度値、ケミルミネセンス強度値、リン光強度値、電荷転送値、ケミルミネセンス強度値、又は吸収値の中の1つによって表されている。
【0122】
特定の実施態様においては、動力学的PCR分析モジュールは、動力学的なサーモサイクラー装置内に存在しており、インテリジェンスモジュールは、分析モジュールに通信可能に結合されたプロセッサを含んでいる。別の特定の実施態様においては、インテリジェンスモジュールは、ネットワーク接続又は直接接続のいずれかによって分析モジュールに結合されたコンピュータシステム内に存在するプロセッサを含んでいる。
【0123】
曲線フィッティング及び曲率決定プロセスを含むCt決定プロセスは、コンピュータシステムのプロセッサ上において稼動するコンピュータコードとして実施可能であることを理解されたい。このコードは、プロセッサを制御してCt決定プロセスの様々な態様及び段階を実施するための命令を含んでいる。本コードは、通常、ハードディスク、RAM、或いは、CDやDVDなどの携帯型の媒体上に保存される。同様に、これらのプロセスは、プロセッサに結合されたメモリユニット内に保存されているプロセッサ実行命令を含むサーモサイクラーなどのPCR装置内で実施することも可能である。このような命令を含むコードは、周知のように、コード供給源に対するネットワーク接続又は直接的な接続を介して、或いは、携帯型の媒体を使用することにより、PCR装置のメモリにダウンロード可能である。
【0124】
当業者であれば、本発明のエルボー決定プロセスは、C、C++、C#、Fortran、VisualBasicなどの様々なプログラミング言語、並びに、データの視覚化及び分析に有用な事前パッケージングされたルーチン、関数、及び手順を提供するMathematicaなどのアプリケーションを使用してコーディング可能であることを理解するであろう。後者の更なる例がMATLAB(登録商標)である。
【0125】
以上、一例として、特定の実施態様の観点から本発明について説明したが、本発明は開示された実施例に限定されるものではないことを理解されたい。逆に、本発明は、当業者には明らかな様々な変更及び類似の構成を包含することを意図するものである。従って、添付の請求項の範囲には、これらのあらゆる変更及び類似の構成を包含するべく、最も広範な解釈を付与することを要するものである。
【図面の簡単な説明】
【0126】
【図1】蛍光強度対サイクル数としてプロットされた典型的なPCR成長曲線の一例を示している。
【図2】成長曲線のベースライン領域の終点(又は、PCR曲線のCt値)を決定するためのプロセスフローを示している。
【図3A】本発明のある実施態様によるスパイクの識別及び置換プロセスの詳細なプロセスフローを示している。
【図3B】本発明のある実施態様によるスパイクの識別及び置換プロセスの詳細なプロセスフローを示している。
【図3C】本発明のある実施態様によるスパイクの識別及び置換プロセスの詳細なプロセスフローを示している。
【図3D】本発明のある実施態様によるスパイクの識別及び置換プロセスの詳細なプロセスフローを示している。
【図3E】本発明のある実施態様によるスパイクの識別及び置換プロセスの詳細なプロセスフローを示している。
【図3F】本発明のある実施態様によるスパイクの識別及び置換プロセスの詳細なプロセスフローを示している。
【図4】パラメータa〜gを含むダブルシグモイド式の分解を示している。
【図5】曲線に対するパラメータ(d)の影響と、変曲点のx値の位置に対する(e)の影響を示している。図5のすべての曲線は、パラメータ(d)を除いて同一のパラメータを有している。
【図6】異なるパラメータの組における3つの曲線形状の一例を示している。
【図7A】一態様に従ってダブルシグモイド式のパラメータ(e)及び(g)の値を決定するプロセスを示している。
【図7B】一態様に従ってダブルシグモイド式のパラメータ(e)及び(g)の値を決定するプロセスを示している。
【図8A】初期のパラメータの組におけるLevenberg−Marquardt回帰プロセスのプロセスフローを示している。
【図8B】初期のパラメータの組におけるLevenberg−Marquardt回帰プロセスのプロセスフローを示している。
【図8C】初期のパラメータの組におけるLevenberg−Marquardt回帰プロセスのプロセスフローを示している。
【図8D】初期のパラメータの組におけるLevenberg−Marquardt回帰プロセスのプロセスフローを示している。
【図9】ある実施態様従ってPCRプロセスのエルボー値を決定する更に詳細なプロセスフローを示している。
【図10】図10aは、ダブルシグモイドを使用して実験データにフィットされた典型的な成長曲線を示している。図10bは、図10aのダブルシグモイド曲線の曲率のプロットを示している。
【図11】図10aの成長曲線に重ね合わせられた最大曲率のポイントに正接する円を示している。
【図12a】成長曲線のデータセットの一例を示している。
【図12b】図12aのデータセットのプロットを示している。
【図13】図12のデータセットに対するダブルシグモイドフィットを示している。
【図14】式(6)のベースライン減算法を使用した正規化の後の図12(図13)のデータセット(並びに、ダブルシグモイドフィット)を示している。
【図15】図14の正規化済みのデータセットにおける曲率対サイクル数のプロットを示している。
【図16】最大曲率半径を有する円と図14の正規化済みのデータセットの重ね合わせを示している。
【図17】「遅成長(slow−grower)」データセットの一例を示している。
【図18】式(6)のベースライン減算法を使用した正規化の後の図17のデータセット及びダブルシグモイドフィットを示している。
【図19】図18の正規化済みのデータセットにおける曲率対サイクル数のプロットを示している。
【図20】反復ラン及び負サンプルを含むPCR成長曲線の組のプロットを示している。
【図21】ソフトウェア及びハードウェア資源間における関係を示す概略的なブロックダイアグラムを示している。

【特許請求の範囲】
【請求項1】
成長曲線のベースライン領域の終点におけるポイントを決定するためのコンピュータにより実施される方法において、
成長曲線を表すデータセットであって、それぞれが座標値のペアを有する複数のデータポイントを含んでいるデータセットを受領する段階と、
Levenberg−Marquardt(LM)回帰プロセスをダブルシグモイド関数に適用して前記データセットにフィットする曲線の近似を算出することにより、前記関数のパラメータを決定する段階と、
前記の決定したパラメータを使用して前記曲線を正規化し、正規化した曲線を生成する段階と、
前記正規化済みの曲線を処理することにより、前記成長曲線の前記ベースライン領域の前記終点を表す、最大曲率のポイントを決定する段階と、
を有する方法。
【請求項2】
正規化する段階が、前記データセットから線形成長部分を減算する段階を含む、請求項1記載の方法。
【請求項3】
処理する段階が、前記正規化済みの曲線に沿ったいくつか又はすべてのポイントにおける前記曲率を決定する段階を含む、請求項1記載の方法。
【請求項4】
前記正規化済みの曲線の前記曲率のプロットを表示する段階を更に含む、請求項3記載の方法。
【請求項5】
前記ダブルシグモイド関数が、a+bx+c/((1+exp-d(x-e))(1+exp-f(x-g)))という形態を有しており、算出する段階が、前記関数のパラメータa、b、c、d、e、f、及びgの中の1つ又は複数のものを反復的に決定する段階を含む、請求項1記載の方法。
【請求項6】
少なくとも前記パラメータa及びbが決定され、正規化する段階が、前記曲線から線形成長部分a+bxを減算する段階を含む、請求項5記載の方法。
【請求項7】
少なくとも前記パラメータaが決定され、正規化する段階が、前記曲線をパラメータaによって除算する段階を含む、請求項5記載の方法。
【請求項8】
少なくとも前記パラメータa及びbが決定され、正規化する段階が、前記曲線から前記線形成長部分a+bxを減算する段階と、この結果を前記パラメータaによって除算する段階と、を含む、請求項5記載の方法。
【請求項9】
少なくとも前記パラメータa、b、及びcが決定され、正規化する段階が、前記曲線から前記線形成長部分a+bxを減算する段階と、この結果をパラメータcによって除算する段階と、を含む請求項5記載の方法。
【請求項10】
前記データセットが、動力学的ポリメラーゼ連鎖反応(PCR)プロセスの成長曲線を表しており、前記ベースライン領域の前記終点における前記ポイントが、前記成長曲線のエルボー又はサイクル閾値(Ct)を表している、請求項1記載の方法。
【請求項11】
前記Ct値を返す段階を更に含む、請求項10記載の方法。
【請求項12】
前記Ct値を表示する段階を更に含む、請求項10記載の方法。
【請求項13】
プロセッサを制御して成長曲線のベースライン領域の終点におけるポイントを決定するためのコードを含むコンピュータ読み取り可能な媒体であって、
前記コードが、
成長曲線を表すデータセットであって、それぞれが座標値のペアを有する複数のデータポイントを含んでいるデータセットを受領する段階と、
Levenberg−Marquardt(LM)回帰プロセスをダブルシグモイド関数に適用して前記データセットにフィットする曲線の近似を算出することにより、前記関数のパラメータを決定する段階と、
前記決定されたパラメータを使用して前記曲線を正規化し、正規化済みの曲線を生成する段階と、
前記正規化済みの曲線を処理することにより、前記成長曲線の前記ベースライン領域の前記終点を表す、最大曲率のポイントを決定する段階と、
を実行するための命令を含んでいる、コンピュータ読み取り可能な媒体。
【請求項14】
前記処理するための命令が、前記正規化済みの曲線に沿っていくつか又はすべてのポイントにおける前記曲率を決定するための命令を含む、請求項13記載のコンピュータ読み取り可能な媒体。
【請求項15】
前記ダブルシグモイド関数は、a+bx+c/((1+exp-d(x-e))(1+exp-f(x-g)))という形態を有しており、前記算出するための命令が、前記関数のパラメータa、b、c、d、e、f、及びgの中の1つ又は複数のものを反復的に決定するための命令を含む、請求項13記載のコンピュータ読み取り可能な媒体。
【請求項16】
前記コードが、前記ベースライン領域の前記終点における前記ポイントの前記座標値を返す又は表示するための命令を更に含む、請求項13記載のコンピュータ読み取り可能な媒体。
【請求項17】
動力学的ポリメラーゼ連鎖反応(PCR)システムにおいて、
動力学的PCR増幅曲線を表すPCRデータセットであって、それぞれが座標値のペアを有する複数のデータポイントを含んでおり、且つ、サイクル閾値(Ct)を含む注目の領域内にデータポイントを含んでいるデータセットを生成する動力学的PCR分析モジュールと;
Levenberg−Marquardt(LM)回帰プロセスをダブルシグモイド関数に適用して前記データセットにフィットする曲線の近似を算出することにより、前記関数のパラメータを決定する段階と、
前記決定されたパラメータを使用して前記曲線を正規化し、正規化された曲線を生成する段階と、
前記正規化済みの曲線を処理することにより、前記成長曲線の前記サイクル閾値(Ct)を表す最大曲率のポイントを決定する段階と、
により、前記PCRデータセットを処理して前記Ct値を決定するべく適合されたインテリジェンスモジュールと;
を有するシステム。
【請求項18】
前記ダブルシグモイド関数が、a+bx+c/((1+exp-d(x-e))(1+exp-f(x-g)))という形態を有しており、算出する段階が、前記関数のパラメータa、b、c、d、e、f、及びgの中の1つ又は複数のものを反復的に決定する段階を含む、請求項17記載のシステム。
【請求項19】
処理する段階が、前記正規化済みの曲線に沿っていくつか又はすべてのポイントにおける前記曲率を決定する段階を含む、請求項17記載のシステム。
【請求項20】
前記インテリジェンスモジュールが、前記正規化済みの曲線の前記曲率のプロットの表示をレンダリングするべく適合されている、請求項19記載のシステム。
【請求項21】
前記動力学的PCR分析モジュールが、動力学的サーモサイクラー装置内に存在しており、前記インテリジェンスモジュールが、前記分析モジュールに通信可能に結合されたプロセッサを含む、請求項17記載のシステム。
【請求項22】
前記インテリジェンスモジュールが、ネットワーク接続又は直接接続のいずれかによって前記分析モジュールに結合されたコンピュータシステム内に存在するプロセッサを含む、請求項17記載のシステム。

【図1】
image rotate

【図2】
image rotate

【図3A】
image rotate

【図3B】
image rotate

【図3C】
image rotate

【図3D】
image rotate

【図3E】
image rotate

【図3F】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7A】
image rotate

【図7B】
image rotate

【図8A】
image rotate

【図8B】
image rotate

【図8C】
image rotate

【図8D】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12a】
image rotate

【図12b】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate

【図21】
image rotate


【公開番号】特開2007−226771(P2007−226771A)
【公開日】平成19年9月6日(2007.9.6)
【国際特許分類】
【外国語出願】
【出願番号】特願2006−341420(P2006−341420)
【出願日】平成18年12月19日(2006.12.19)
【出願人】(591003013)エフ.ホフマン−ラ ロシュ アーゲー (1,754)
【氏名又は名称原語表記】F. HOFFMANN−LA ROCHE AKTIENGESELLSCHAFT