式レス法による融解温度の測定
【課題】融解曲線データに基づく、オリゴヌクレオチドに対する融解温度を決定するシステム及び方法を提供する。
【解決手段】融解曲線データセットの1次微分係数の数値的決定がなされる。基準は第1の微分値に対して決定し、その基準を第1の微分値から差し引き、修正された第1の微分値を生じさせる。修正された第1の微分値の第1の最大値を決定し、この第1の最大値は、DNA試料の融解温度Tmを表す。また、モデル関数、例えば、ガウシアン混合モデル(GMM)関数は、レーベンバーグ・マルカート(LM)回帰プロセスを用いて決定されたパラメーターを含み、それを用いて、第1の微分曲線への近似を見出すことが可能である。数値的に決定した第1の微分値の最大値は、このモデル関数のパラメーターについての初期条件として使用される。決定したパラメーターは、1以上の分画融解温度値を提供し、その値は戻され、例えば、表示され、又は更なる処理に使用され得る。
【解決手段】融解曲線データセットの1次微分係数の数値的決定がなされる。基準は第1の微分値に対して決定し、その基準を第1の微分値から差し引き、修正された第1の微分値を生じさせる。修正された第1の微分値の第1の最大値を決定し、この第1の最大値は、DNA試料の融解温度Tmを表す。また、モデル関数、例えば、ガウシアン混合モデル(GMM)関数は、レーベンバーグ・マルカート(LM)回帰プロセスを用いて決定されたパラメーターを含み、それを用いて、第1の微分曲線への近似を見出すことが可能である。数値的に決定した第1の微分値の最大値は、このモデル関数のパラメーターについての初期条件として使用される。決定したパラメーターは、1以上の分画融解温度値を提供し、その値は戻され、例えば、表示され、又は更なる処理に使用され得る。
【発明の詳細な説明】
【背景技術】
【0001】
本発明は、概して、オリゴヌクレオチドの融解特徴を表すデータを処理することに関し、より具体的には、融解曲線データに基づくオリゴヌクレオチド試料についての1以上の融解温度を決定する方法に関する。
【0002】
DNA融解温度の決定は、通常は、PCR実験後に直接的に実行され、遺伝子型を区別するために重要な方法である。例えば、最近、文献には、非小細胞肺癌の治療のためにどの患者が候補をなり得るかを決定するためのKRAS遺伝子の試験の使用が開示されている。KRAS遺伝子が野生型である患者は、治療の恩恵を受けるが、患者がこの遺伝子の突然変異した改変を有する場合には、治療による恩恵は受けられない。これらの治療は、多くの場合、重大な副作用を有するため、患者の正確な遺伝子型を決定することが重要となる。融解KRASアッセイの使用は、患者の遺伝子型を区別するのに役立つ。したがって、DNA試料の融解温度を正確かつ効率的に決定するシステム及び方法を提供することが望まれる。
【発明の概要】
【課題を解決するための手段】
【0003】
本発明は、融解曲線データに基づく、オリゴヌクレオチドに対する融解温度を決定するシステム及び方法を提供する。種々の態様では、融解曲線データセットの1次微分係数の数値的な決定がなされる。モデル関数、例えば、ガウシアン混合モデル(Gaussian Mixture Model:GMM)関数は、レーベンバーグ・マルカート(Levenberg−Marquardt:LM)回帰プロセスを用いて決定されるパラメーターを含み、それを使用して、第1の微分曲線への近似を見出す。数値的に決定した第1の微分値の最大値は、モデル関数のパラメーターについての初期条件として使用される。決定したパラメーターは、分画(fractional)融解温度値を提供し、それは戻され、例えば、表示され、あるいは更なる処置のために使用され得る。
【0004】
本発明の1局面によれば、DNAの融解温度Tmを測定するためのコンピュータに実行させる方法が提供される。この方法は、典型的には、各々が座標値を有する複数のデータポイントを含む、DNA試料についての融解曲線を表すデータセットを受け入れることを含む。また、この方法は、典型的には、該融解曲線のデータポイントについての第1の微分値を数値的に決定し、該第1の微分値に対して基準を決定し、該第1の微分値から基準を差し引いて、修正された(modified)第1の微分値を生じさせ、該修正された第1の微分値の第1の最大値を決定することを含む。また、この方法は、典型的には、該DNA試料の融解温度Tmを表す該第1の最大値を出力することを含む。この方法は、さらに、レーベンバーグ・マルカート(Levenberg−Marquardt:LM)回帰プロセスをガウシアン混合モデル(Gaussian Mixture Model)関数に適用することによって、前記修正された第1の微分値を適合させ、該関数の1以上のパラメーターを決定する曲線に対する近似を計算し、ここで、該パラメーターは初期条件を含み、該第1の最大値は第1のパラメーターに対する初期条件として使用され、前記決定された第1のパラメーターは前記DNA試料の融解温度Tmを表す第1のパラメーターを出力する工程を含む。ある局面では、この方法は、さらに、第1の微分値が第1の最大値に近い肩値を含むかどうかを決定することを含む。ある種の態様では、ガウシアン混合モデルが、形式:
【0005】
【数1】
【0006】
(式中、μ1は第1のパラメーターであり、a1及びσ1は付加パラメーターである)
の式を含む。別の局面では、この方法は、さらに、第1のパラメーター値を表示することを含む。なお別の局面では、回帰プロセスはレーベンバーグ・マルカート(LM)回帰プロセスを含む。ある種の局面では、この方法は、修正された第1の微分値の第2、第3又は第4の最大値を決定することをさらに含み、ここで、該第2、第3又は第4の最大値は、第2、第3又は第4のパラメーターについての初期条件として使用され;前記決定された第2、第3又は第4のパラメーターが、前記DNA試料の第2の融解温度Tm2、第3の融解温度Tm3又は第4の融解温度Tm4を表す前記第2、第3又は第4のパラメーターを出力する。この方法の別の局面では、ガウシアン混合モデルは、形式:
【0007】
【数2】
【0008】
(式中、μ1は第1のパラメーターであり、μ2は第2のパラメーターであり、a1、σ1、a2及びσ2は付加パラメーターである)
の式を含む。この方法のなお別の局面では、ガウシアン混合モデルは、形式:
【0009】
【数3】
【0010】
(式中、μ1は第1のパラメーターであり、μ2は第2のパラメーターであり、μ3は第3のパラメーターであり、a1、σ1、a2、σ2、a3及びσ3は付加パラメーターである)
の式を含む。この方法のなお別の局面では、ガウシアン混合モデルは、形式:
【0011】
【数4】
【0012】
(式中、μ1は第1のパラメーターであり、μ2は第2のパラメーターであり、μ3は第3のパラメーターであり、μ4は第4のパラメーターであり、a1、σ1、a2、σ2、a3、σ3、a4及びσ4は付加パラメーターである)
の式を含む。この方法の別の局面では、第1の最大値を決定することは、修飾された第1の微分値にウィンドウプロセスを適用することを含み、ここで、該ウィンドウプロセスはまた、ガウシアン混合モデル関数パラメーターについての1以上の付加初期条件を決定する。
【0013】
本発明の別の局面によれば、コンピュータ読み取り可能な媒体が提供され、それは、DNAの融解温度Tmを決定するプロセッサーを制御するためのコードを格納する。格納されたコートは、典型的には、各々が一対の座標値を有する複数のデータポイントを含む、DNA試料についての融解曲線を表すデータセットを受け入れ、該融解曲線のデータポイントについての第1の微分値を数値的に決定し、第1の微分値に対する基準を決定し、第1の微分値から基準を差し引いて、修正された第1の微分値を生じさせ、第1の微分値の第1の最大値を決定する指示を含む。また、コードは、典型的には、第1の最大値を出力する指示を含み、ここで、第1の最大値はDNA試料の融解温度Tmを表す。また、コードは、典型的には、レーベンバーグ・マルカート(LM)回帰プロセスをガウシアン混合モデル関数に適用することによって修正された第1の微分値を適合して、この関数の1以上のパラメーターを決定する曲線の近似を計算し、ここで、該パラメーターは初期条件を含み、第1の最大値は第1のパラメーターについての初期条件として使用し、修正された第1のパラメーターはDNA試料の融解温度Tmを表す第1のパラメーターを出力する指示を含む。本明細書では、ある種の局面では、ガウシアン混合モデルは、形式:
【0014】
【数5】
【0015】
(式中、μ1は第1のパラメーターであり、a1及びσ1は付加パラメーターである)
の式を含む。ある種の局面では、コードは、第1の微分値が第1の最大値に近い肩値を含むかどうかを決定するための指示をさらに含む。別の局面では、コードは、第1のパラメーター値を表示する指示をさらに含む。なお別の局面では、コードは、修正された第1の微分値の第2の最大値を決定し、ここで、第2の最大値は、第2のパラメーターについての初期条件として使用され;修正された第2のパラメーターはDNA試料の第2の融解温度Tmを表す、第2のパラメーターを出力する指示を含む。ある種の局面では、ガウシアン混合モデルは、形式:
【0016】
【数6】
【0017】
(式中、μ1は第1のパラメーターであり、μ2は第2のパラメーターであり、a1、σ1、a2及びσ2は付加パラメーターである)
の式を含む。なお別の局面では、ガウシアン混合モデルは、形式:
【0018】
【数7】
【0019】
(式中、μ1は第1のパラメーターであり、μ2は第2のパラメーターであり、μ3は第3のパラメーターであり、a1、σ1、a2、σ2、a3及びσ3は付加パラメーターである)
の式を含む。なお別の局面では、ガウシアン混合モデルは、形式:
【0020】
【数8】
【0021】
(式中、μ1は第1のパラメーターであり、μ2は第2のパラメーターであり、μ3は第3のパラメーターであり、μ4は第4のパラメーターであり、a1、σ1、a2、σ2、a3、σ3、a4及びσ4は付加パラメーターである)
の式を含む。コンピュータ読み取り可能な媒体の別の局面では、第1の最大値を決定する指示は、修正された第1の微分値へのウィンドウプロセスを適用する指示を含み、ここで、ウィンドウプロセスはまた、ガウシアン混合モデル関数パラメーターについての1以上の付加初期条件を決定する。
【0022】
本発明のなお別の局面によれば、動的ポリメラーゼ連鎖反応(PCR)システムが提供され、それは、典型的には、各々が一対の座標値を有する複数のデータポイントを含む、DNA融解曲線を表す融解曲線データセットを生じさせる動的PCR分析モジュール;並びにTm値を決定する融解曲線データセットを処理するように適合される情報(intelligence)を含む。この情報モジュールは、典型的には、該融解曲線のデータポイントについての第1の微分値を数値的に決定し、該第1の微分値に対して基準を決定し、該第1の微分値から基準を差し引いて、修正された第1の微分値を生じさせ、該修正された第1の微分値の第1の最大値を決定することによって、Tm値を決定する。また、情報モジュールは、典型的には、Tm値として修正された1次微分係数の決定した第1の最大値を使用して、該Tm値を出力することによってTm値を決定する。ある種の態様では、情報モジュールは、レーベンバーグ・マルカート(LM)回帰プロセスをガウシアン混合モデル関数に適用することによって修正された第1の微分値を適合させ、この関数の1以上のパラメーターを決定する曲線の近似を計算し、ここで、該パラメーターは初期条件を含み、該第1の最大値は第1のパラメーターについての初期条件として使用され、並びに、該決定した第1のパラメーターはDNA試料の融解温度Tmを表す、第1のパラメーターを出力することによって、Tm値を決定する。ある種の局面では、ガウシアン混合モデルは、形式:
【0023】
【数9】
【0024】
(式中、μ1は第1のパラメーターであり、a1及びσ1は付加パラメーターである)
の式を含む。別の局面では、情報モジュールは、第1の微分値が第1の最大値に近い肩値を含むかどうかを決定するためにさらに適合される。なお別の局面では、情報モジュールは、さらに、修正された第1の微分値の第2の最大値を決定し、ここで、第2の最大値は、第2のパラメーターについての初期条件として使用され;決定した第2のパラメーターはDNA試料の第2の融解温度Tmを表す、第2のパラメーターを出力するようにさらに適合される。ある種の局面では、修正された第1の微分値の第2の最大値が決定され、ここで、第2の最大値は、第2のパラメーターについての初期条件として使用され、ガウシアン混合モデルは、形式:
【0025】
【数10】
【0026】
(式中、μ1は第1のパラメーターであり、μ2は第2のパラメーターであり、a1、σ1、a2、及びσ2は付加パラメーターである)
の式を含む。ある種の局面では、修正された第1の微分値の第3の最大値が決定され、ここで、第3の最大値は、第3のパラメーターについての初期条件として使用され、ガウシアン混合モデルは、形式:
【0027】
【数11】
【0028】
(式中、μ1は第1のパラメーターであり、μ2は第2のパラメーターであり、μ3は第3のパラメーターであり、a1、σ1、a2、σ2、a3及びσ3は付加パラメーターである)
の式を含む。ある種の局面では、修正された第1の微分値の第4の最大値が決定され、ここで、第4の最大値は、第4のパラメーターについての初期条件として使用され、ガウシアン混合モデルは、形式:
【0029】
【数12】
【0030】
(式中、μ1は第1のパラメーターであり、μ2は第2のパラメーターであり、μ3は第3のパラメーターであり、μ4は第4のパラメーターであり、a1、σ1、a2、σ2、a3、σ3、a4及びσ4は付加パラメーターである)
の式を含む。このシステムの別の局面では、情報モジュールは、修正された第1の微分値にウィンドウプロセスを適用することによって第1の最大値を決定し、ここで、ウィンドウプロセスはまた、ガウシアン混合モデル関数パラメーターについての1以上の付加初期条件を決定する。
【0031】
図面及び特許請求の範囲を含む本発明の残り部分への参照は、本発明の他の特徴及び利点を実現する。本発明の更なる特徴及び利点、並びに本発明の種々の態様の構造及び操作は、添付の図面と比較しながら、下記に詳細に記載される。図面では、同様に、参考文献の番号は、同一又は機能的に類似した要素を指示する。
【図面の簡単な説明】
【0032】
【図1】融解曲線の例を例示する。
【図2】図1の融解曲線に対する第1の微分曲線を例示する。
【図3】基準の差し引き後の図2の微分曲線を示す。
【図4】一態様による、融解温度(単数又は複数)を決定するためのプロセスを例示する。
【図5】一態様による、融解温度コンピュータ化プロセスを例示する。
【図6】一態様による、肩検出プロセスを例示する。
【図7a】図7aは、それぞれ、1つの融解ピークの場合での生データ及び融解曲線の例示を示す。
【図7b】図7bは、それぞれ、1つの融解ピークの場合での生データ及び融解曲線の例示を示す。
【図8a】図8aは、それぞれ、2つの融解ピークの場合での生データ及び融解曲線の例示を示す。
【図8b】図8bは、それぞれ、2つの融解ピークの場合での生データ及び融解曲線の例示を示す。
【図9a】図9aは、それぞれ、2つの融解ピークの場合での生データ及び融解曲線の例示を示す。
【図9b】図9bは、それぞれ、2つの融解ピークの場合での生データ及び融解曲線の例示を示す。
【図10a】図10aは、それぞれ、1つの融解ピーク+肩の場合での生データ及び融解曲線の例示を示す。
【図10b】図10bは、それぞれ、1つの融解ピーク+肩の場合での生データ及び融解曲線の例示を示す。
【図11a】図11aは、それぞれ、1つの融解ピーク+肩の場合での生データ及び融解曲線の例示を示す。
【図11b】図11bは、それぞれ、1つの融解ピーク+肩の場合での生データ及び融解曲線の例示を示す。
【図12】本発明のプロセス及びシステムを実行するために使用することができるソフトウェアとハードウェア資源との間の関係を説明する一般的なブロック図を示す。
【図13】サーモサイクラーとコンピュータシステムとの間の相互作用を例示する。
【発明を実施するための形態】
【0033】
本発明は、DNAについての融解温度Tmを決定するためのシステム及び方法を提供する。
【0034】
本発明は、融解曲線を表すデータを分析することによる、融解温度を決定するためのシステム及び方法を提供する。ある種の局面では、融解曲線データセットの1次微分係数の数値的な決定がなされる。レーベンバーグ・マルカート(LM)回帰プロセスを用いて測定されたパラメーターを含むガウシアン混合モデル(GMM)関数を使用して、第1の微分曲線への近似を見出す。数値的に決定した第1の微分値の最大値は、GMM関数のパラメーターについての初期条件として使用される。決定したパラメーターは、分画融解温度Tm値を提供する。次に、Tm値(単数又は複数)は、戻され、表示されるか又は他には更なる処置のために使用されてもよい。
【0035】
PCRプロセスとの関連における融解曲線の一例を図1に示す。図1に示されるように、典型的な融解曲線についてのデータは、2次元座標系で表すことができ、例えば、温度をx軸に定義し、蓄積されたポリヌクレオチドの指標をy軸にする。典型的には、蓄積されたポリヌクレオチドの指標は、蛍光マーカーの使用がおそらくは最も広く使用されている標識スキームであるため、蛍光強度値である。しかしながら、他の指標は、特定の標識及び/又は使用される検出スキームに依存して使用可能である。蓄積されたシグナルの他の有用な指標の例には、ルミネッセンス強度、ケミルミネッセンス強度、バイオルミネッセンス強度、リン光強度、電荷移動、電圧、電力、力、エネルギー、温度、粘度、光散乱、放射線強度、反射率、透過及び吸光度が挙げられる。
【0036】
一般的プロセスの概要
図1に示される典型的な融解曲線を考慮されたい。図1に表されるデータからは1以上の融解温度を得ることが望まれる。一態様によれば、融解温度を決定するためのプロセス100は、図4と比較して、簡潔に記載することができる。肯定110では、融解曲線を表す実験的データセットは、戻され、又は他には獲得される。プロットされた融解曲線データセットの例を図1に示す。ここでは、y軸及びx軸は、それぞれ、融解曲線に対する蛍光強度及び温度を表す。ある種の局面では、データセットは、連続的であり、かつ軸に沿って等しく間隔を空けているデータを含まなければならない。
【0037】
プロセス100が、サーモサイクラーなどのPCRデバイスにある情報モジュール(例えば、指示を施行するプロセッサー)において実行される場合、データセットは、データが回収されているので、リアルタイムで情報モジュールに提供されてもよく、あるいは、記憶ユニット又はバッファーに格納され、実験が完了後に情報モジュールに情報モジュールに適用されてもよい。同様に、データセットは、取得デバイスに対してネットワーク接続(例えば、LAN、VPN、イントラネット、インターネットなど)又は直接的な接続(例えば、USB又は他の直接的なワイヤー接続若しくはワイヤーレス接続)を介して、デスクトップコンピュータシステム又は他のコンピュータシステムなどの別々のシステムに提供されてもよく、あるいはCD、DVD、フロッピー(登録商標)ディスクなどのポータブル媒体に提供されてもよい。ある種の局面では、データセットには、一対の座標値を有するデータポイント(又は2次元ベクター)が含まれる。融解データに関しては、一対の座標値は、典型的には、温度及び蛍光強度値を表す。データセットが工程110で受け入れられるか又は取得された後、このデータセットを分析して、融解温度(単数又は複数)を決定してもよい。
【0038】
工程120では、データを数値的に処理して、微分値が決定される。これらの曲線の融解温度は、温度と比較した蛍光強度の1次微分係数(y軸)の最大に対応する(分画)温度値(x軸)を見出すことによって得られる。図1に示されるデータを用いて、1次微分係数に関する対応図を図2に示す。一態様では、基準の差し引きは、微分曲線データで実行され、修正された微分係数データを生じさせる。一態様では、基準差し引きは、最初に、図2における最初の5点の蛍光値の中央値として「中央値左(MedianLeft)」を決定し、次に、図2における最後の5点の蛍光値の中央値として「中央値右(MedianRight)」を決定することによって実行される。その後、図2における「中央値左」点(x,y)と「中央値右」点(x,y)とを結ぶ直線が特定される。次に、この直線の傾き及び切片は、全ての座標対から差し引かれる。図3は、基準差し引き後の微分曲線を示す。
【0039】
一態様では、微分係数は、Savitzky−Golay(SG)法の使用によって得られる。[A.Savitzky and Marcel J.E. Golay(1964).Smoothing and Differentiation of Data by Simplified Least Squares Procedures.Analytical Chemistry,36:1627−1639 and Press,W.H.,et al.“Numerical Recipes in C,2nd Ed.,”Savitzky−Golay Smoothing Filters,Section 14.8,650−655を参照されたい]。SG−2−2−2形態(左に2点、右に2点、2次多項式を意味する)を用いて、一態様では、生の融解データ曲線の1次微分係数を計算する。一般に、SG法の他の形態は、例えば、SG−1−1−2からSG−50−50−2なども用いてもよい。より一般には、SG−x−y−zを使用してもよく、この場合、x及びyは1〜50の数であり、zは1〜5の数である。
【0040】
微分係数のスケール不変形
ある種の態様では、代替法を用いて、融解温度をスケール不変であるようにするために微分係数が計算される。スケール不変は、蛍光値が定数で乗じられる場合、得られるTm値(単数又は複数)は変化しない。
【0041】
一方法によれば、蛍光値は、平均した蛍光値によって除され、その後、微分融解曲線を計算し、例えば、yは、
【0042】
【数13】
【0043】
によって置換される。
【0044】
別の方法によれば、蛍光値は、(最大蛍光−最少蛍光)によって除され、その後、微分融解温度が計算される。
【0045】
別の方法によれば、蛍光値の微分係数は、蛍光値によって除され、その後、融解温度が計算される。
【0046】
なお別の方法によれば、蛍光値の微分係数は、蛍光値の平均した微分係数によって除され、その後、融解温度が計算される。
【0047】
さらに別の方法によれば、蛍光値の微分係数は、蛍光値の(最大−最少)微分係数によって除され、その後、融解温度が計算される。
【0048】
図4に戻ると、工程130では、最初の微分係数データにおける多数のピークは決定される。一態様では、極大プロセスを用いて、1次微分係数データにおける0、1、2、3又は4つのピークが決定され、これは、より詳細には下記に検討される。生の微分係数データを使用してもよく、あるいは基準を差し引いた微分係数データを使用してもよい。
【0049】
一態様では、分画Tm値は、工程140で決定される。例えば、図2又は3に示されるように、曲線の最大値を見出すために、一態様では、ガウシアン混合モデルがデータに適合される。ガウシアン混合モデルの平均は、最大値、即ち、Tm値に対応する。一態様では、曲線の当てはめは、決定された1次微分係数値、又は修正された(基準を差し引いた)微分係数値を適合する曲線の近似を計算し、回帰プロセスをガウシアン混合モデル関数に適用することによってなされ、この関数の1以上のパラメーターを決定する。ある種の局面では、レーベンバーグ・マルカート回帰プロセスが使用される。一態様では、単一ピークの場合に関しては、単一ピークに対するガウシアン混合モデルが、式(2)に示されるように使用される。2つのピークが存在する場合、2つのピークに対するガウシアン混合モデルが、式(3)に示されるように使用される。3つのピークが存在する場合、3つのピークに対するガウシアン混合モデルが、式(4)に示されるように使用される。4つのピークが存在する場合、4つのピークに対するガウシアン混合モデルが、式(5)に示されるように使用される。係数μ1又は(μ1,μ2)に対する回帰された値は、それぞれ、1つ又は2つのピークに対するTm値に対応する。ガウシアン混合モデルは、最大を見出すために付加的な微分係数を採用することよりはむしろ、一態様として使用され、微分係数のオーダーが高くなるにつれて(3次、4次)不安定となる可能性がある。
【0050】
【数14】
【0051】
当業者に明らかとなるように、他のモデル/関数がガウシアン混合モデルの代わりに使用可能であることは承認される。他のモデルの例には、Beta、Binomial、Cauchy、Chi、ChiSquare、Exponential、Extreme Value、FRatio、Gamma、Gumbel、Laplace、Logistic、Maxwell、Pareto、Rayleigh、Student T、及びWeibullモデルが挙げられる。
【0052】
2を超えるピークを含む1次微分係数データを用いて、上記態様が適用可能であることが理解されなければならない。この場合、極大による係数μ1、μ2、μ3、μ4に対する初期概算は、最終の融解温度に対応する。
【0053】
一態様では、レーベンバーグ・マルカート(LM)法を使用して、式(2)(又は式(3)、式(4)、式(5))を曲線当てはめされる。この方法の詳細は、参考文献[More,J.J.,“The Levenberg−Marquardt Algorithm,Implementation and Theory,”Numerical Analysis,ed.Watson,G.A.Lecture Notes in Mathematics 630,Springer−Verlag,1977]に見出すことができる。周知である他の回帰法を使用してもよいことは承認されなければならない。一般に、LM回帰法は、種々のインプットを必要とし、アウトプットを提供するアルゴリズムを含む。一局面では、インプットは、処理されるべきデータセット、このデータを適合するために使用される関数(例えば、ガウシアン混合モデル)、並びにこの関数のパラメーター又は変数についての初期推測を含む。アウトプットは、関数とデータセットとの間の距離の二乗の合成を最少にする関数に関する一連の1以上のパラメーターを含む。当業者に明らかとのなるように、他の回帰プロセスを使用してもよいことは承認されなければならない。
【0054】
レーベンバーグ・マルカート法の1つの特徴は、回帰を実行する前にパラメーター値の良好な概算を必要とすることである。パラメーターa1(又はa1、a2、a3、a4)及びσ1(又はσ1、σ2、σ3、σ4)に関して、初期条件は、全ての場合において定数(例えば、1又は2)に等しいように設定可能である。これらのパラメーターは、一般に、影響を受けず、一般に、使用される初期条件に関わらずに収束する。パラメーターμ1(又はμ1、μ2、μ3、μ4)は、各曲線について決定されるべきであるより正確な初期条件を必要としてもよい。一態様では、ウィンドウプロセスを用いて、下記により詳細に記載されるように、パラメーターμ1(又はμ1、μ2、μ3、μ4)に関する初期条件を計算する。
【0055】
任意工程150では、1以上のエキスパートシステムチェックを行い、下記により詳細に検討されるように、結果が有効であるかどうかを評価する。例えば、実行されると、エキスパートシステムチェックは、決定された結果が無効であることを判断することができる。
【0056】
工程160では、Tm値(単数又は複数)が、例えば、表示又は他の処理のために戻されてもよい。グラフ表示は、図4の分析を実行したシステムと連結された、モニタースクリーン又はプリンターなどの表示デバイスを用いて表すことができ、あるいは、データは表示デバイス上で表すための別々のシステムに提供されてもよい。
【0057】
ある態様では、R2統計及び/又は信頼(例えば、95%信頼性)区間は、GMM1、GMM2、GMM3、GMM4パラメーターについて計算される。これらの値は、曲線当てはめの質を評価し、計算されたTm値が有効であるか、無効であるか、又はゼロである(試料が存在しない)かを決定するのを助けるためにエキスパートシステム(後述)において使用されてもよい。また、これらの値は、工程160で表示されてもよい。
【0058】
曲線における最大の決定
一態様では、ウィンドウプロセスは、パラメーターμ1、μ2、μ3、μ4についての初期条件を決定するためにデータセットに使用される。下記のウィンドウプロセスは、最大2つのピークを含む1次微分係数について記載される。それにもかかわらず、上述されるように、このウィンドウプロセスは、最大4つのピークを示す1次微分係数データに適用可能であることは理解されなければならない。一態様では、ウィンドウプロセスは、下記の手法を使用することによって、潜在的な極大について検索する。
【0059】
1.第1の点から開始して、データセットの第1のいくつかの(例えば、5個の)ポイント(ポイント1〜5)を調べる。
2.中間のyポイントがこれらの5ポイントにおいて最大でない場合、これらの5ポイントにおいて潜在的な最大はない。中間のyポイントがこれらの5ポイントの最大であり、(一連の潜在的な最大に、0の正確な値を有するより長いポイント配列の中間の点を加えることを避けるために)0よりも大きな値を有する場合、潜在的な最大がある。一連の潜在的な最大Sにこのポイントを加える。
3.1ポイント(例えば、現にポイント2〜6)によって滑りウィンドウを進め、2項に記載のプロセスを繰り返す。再度、これらの5ポイントのインデックス3で最大のみを受け入れる。全データセットを通じてこのプロセスを継続する。
4.可能性のある最大の結果セットSを調べ、インデックス3で可能性の最大のセットを表し、可能性のある最大のこのセットS(Smax)を見出す。
5.Smaxが、マックスノイズ(MaxNoise)インプットパラメーター(ユーザーによってインプットされるか、又は自動的に決定されてもよいノイズパラメーター)に等しいか又はそれよりも小さい場合、曲率データにおいてピークはない。
6.このセットSからの残りの可能性のある最大データポイントを維持し、それらが、Smax x RelativeMinインプットパラメーターより大きく、AbsoluteMinインプットパラメーターより大きいことを与える。
7.残されたデータポイントがただ1つである場合、ただ1つのピークが存在し、曲線はただ1つの最大を有する。この1つのピークをpk1として特定する。残されたデータポイントが2つある場合、これは2つの最大を有する曲線を表す。2を超えるピークが存在する場合、データセットSの最大値を有する2つのピークを採用し、これらの2つのうちのより低いサイクル数を有するピークをpk1とし、より高いサイクル数を有するピークをpk2として戻す。
8.μ1についての初期条件はpk1であり、(μ1,μ2)についての初期条件は(pk1,pk2)である。
【0060】
融解温度計算(computation)
一態様に従う融解温度計算は、図5に例証される。工程210では、1次微分係数データセットが1つ又は2つ(又は3つ、4つ)のピークを含むどうかの決定がなされる。工程220では、融解データの1次微分係数が単一のピークを有するものとして同定される場合、融解曲線の最大は、式(2)に記載される単一成分のガウシアン関数の非線形回帰(例えば、レーベンバーグ・マルカート法又は他の回帰法を用いる)によって見出される。初期条件は、極大検索によって与えられる。工程230では、融解データセットの1次微分係数が2つのピーク(又は3つ、4つ)を有するものとして同定される場合、融解曲線の両方の極大は、式(3)に記載される二重成分のガウス関数の非線形回帰(例えば、レーベンバーグ・マルカート法を用いる)によって見出され、パラメーターμ1、μ2(又はμ3及びμ4)(Tm1、Tm2、又はTm3及びTm4に対応する)が戻される。初期条件は、極大検索によって与えられる。たとえ図5が1つ又は2つのピークについての融解温度計算を示す場合であっても、2つのピークについて使用される同じ融解温度計算は3つ及び4つのピークについても使用可能であることは承認されなければならない。
【0061】
工程240では、肩検出プロセスは、一態様に従う単一の微分係数ピークについて肩が存在するかどうかを決定天然に存在しない微生物値する。2つ(又は3つ、4つ)のピークがMELTアルゴリズムにおいて見出される場合、さらに処理されない。その代わりに、1つのピークが見出された場合、このピークに肩が存在することはあり得る。一態様に従う肩検出プロセスの詳細は、後に検討される。肩が検出されない場合、μ1(Tm1に対応する)が戻される。工程250では、信頼区間は、種々のパラメーターについて決定される。工程260では、R2値は、使用されるガウシアン混合モデルについて計算される。一態様では、GMMA(又はGMM2、GMM3、GMM4)フィットのR2値が>0.9であるか、又はパラメーター(μ1,σ1)、又は(μ1,σ1,μ2,σ2,μ3,σ3,μ4,σ4)がゼロを含まない場合、Tm1(又はTm1、Tm2、TM3、Tm4)の値は、工程270で許容される。そうでなければ、Tm1、(又はTm1、Tm2、TM3、Tm4)は工程280では、標的が検出されない(TND)として設定され、工程290での任意のエキスパートシステムは、TNDの最終コールとなるか又は無効である。
【0062】
肩検出
一態様に従う肩検出プロセスは、図6に示される。工程310では、二重成分ガウシアンモデルは、初期条件としてa1,2=2、μ1,2=m±2、σ1,2=2(ここで、mは単一ピークの融解温度である)を用いた同じ1次微分係数に適合される。工程320では、潜在的な主ピーク及び肩(低い)ピークが上述のように決定される。工程330では、より低いピークの高さが少なくともより高いピークのある種のパーセント(例えば、0.05倍以上高いピーク)であるかどうかについて決定される。そうでない場合、コールを示さない肩は戻され、Tm決定処理が図5の工程250により継続する。そうである場合、工程340では、信頼区間は、種々のパラメーターについて決定され、工程350では、R2値は、GMM2式について決定される。工程360では、平均の信頼区間が、互いに離れた少なくともある種の数値の℃(例えば、3℃以上)であるかどうかについて決定される。そうでない場合、コールを示さない肩は戻され、Tm決定処理が図5の工程250により継続する。そうである場合、工程370では、信頼区間がゼロを含むかどうか、又はR2値が閾値(例えば、0.9)よりも大きいかどうかについての決定がされる。そうでない場合、コールを示さない肩は戻され、Tm決定処理が図5の工程250により継続する。μ1及びμ2の両方で評価される二重成分のガウシアンモデル(GMM2)の二次(2d)微分係数が負であるかどうかの決定。そうである場合、肩を検出するコールがなされる。
【0063】
このようにして、収束されたLM法を前提とすると、一態様では、肩は、下記の条件の全てが当てはまる場合に検出される。
・1次微分係数データが正確に1つの極大を有するように同定された。
・低いピークが高さにして高いピークの少なくとも0.5倍である(例えば、「exp(−a)」を用いる)。
・平均の信頼区間が互いに少なくとも3℃離れている。
・μ1、μ2、σ1及びσ2の信頼区間はゼロを含まないか、又はR2>0.9である。
・μ1及びμ2の両方で評価される二重成分のガウシアンモデル(GMM2)の2次微分係数が負である。
【0064】
これらの条件が満たされる場合、肩検出フラグが生じる。上記の肩検出プロセスは、1つ又は2つのピークを含む1次微分係数についての図6と関連して記載される。それにもかかわらず、上述されるように、この肩検出プロセスは、最大4つのピークを示す1次微分係数データに適用可能であることは理解しなければならない。
【0065】
エキスパートシステムチェック
一態様では、1以上のエキスパートシステムチェックは、工程290(図5)で実行される。1つのチェックでは、全部の全融解曲線の中央値が>0であるかどうかが決定される。これが誤りである場合、結果は、無効としてレポートされる。別のチェックでは、融解ピーク(Melt Peak)蛍光データの最大の絶対値が融解ピーク蛍光データの最少の絶対値よりも大きいかどうかが決定される。これが誤りである場合、結果は、無効としてレポートされる。別のチェックでは、生の蛍光の中央値 対 第1のいくつかの(例えば、5個の)サイクルからの温度値が、生の蛍光の中央値 対 少なくともいくつかの(例えば、5個の)サイクルからの温度値よりも大きいかどうかの決定がされる。これが誤りである場合、結果は、無効としてレポートされる。なお別のチェックでは、二次多項式が、生の蛍光 対 温度データセットに適合される。この適合におけるR2が閾値(0.99)よりも高い場合、ピークは存在せず、結果は、標的が検出されない(TND)としてレポートされる。
【実施例】
【0066】
図7a及び7bは、それぞれ、1つの融解ピークの場合の生のデータ曲線及び融解曲線を示す。計算された融解温度はTm=67.8である。
【0067】
図8a及び8bは、それぞれ、2つの融解ピークの場合の生のデータ曲線及び融解曲線を示す。計算された融解温度は、Tm1=58.8、Tm2=67.8である。
【0068】
図9a及び9bは、それぞれ、2つの融解ピークの場合の生のデータ曲線及び融解曲線を示す。計算された融解温度は、Tm1=57.9、Tm2=68.6である。
【0069】
図10a及び10bは、それぞれ、1つの融解ピーク+肩の場合の生のデータ曲線及び融解曲線を示す。計算された融解温度は、Tm1=62.4、Tm2=68.8である。
【0070】
図11a及び11bは、それぞれ、1つの融解ピーク+肩の場合の生のデータ曲線及び融解曲線を示す。計算された融解温度は、Tm1=61.3、Tm2=68.1である。
【0071】
ある種の態様では、本発明に従うTm決定プロセスは、従来のパーソナルコンピュータシステムの使用によって実行可能であり、このシステムには、限定されないが、キーボード、マウスなどのデータセットをインプットするためのインプットデバイス;モニターなどの、曲線領域において対象とする特定のポイントを表すための表示デバイス;CPUなどの、この方法における各工程を実行するために必要な処理デバイス;モデムなどのネットワークインターフェイス、データセットを格納するためのデータ格納デバイス、プロセッサー上で稼働するコンピュータコードなどが含まれる。さらに、プロセッサーもまた、本発明に従うPCRプロセス、又は本発明に従うPCRシステムにおいて実行されてもよい。
【0072】
微分係数及び肩決定プロセスを含むTm決定プロセスは、コンピュータシステムのプロセッサー上で稼働するコンピュータコードにおいて実行可能であることが承認されなければならない。このコードは、Tm決定プロセスの種々の局面及び工程を実行するためのプロセッサーを制御する指示を含む。このコードは、典型的には、ハードディスク、RAM、又はCD、DVDなどのポータブル媒体に格納される。同様に、このプロセスは、サーモサイクラーなどのPCRデバイス、又は他の特殊なデバイスにおいて実行されてもよく、それには、プロセッサーに連結された記憶ユニットに格納された指示を実行するプロセッサーが含まれる。このような指示を含むコードは、コード供給源へのネットワーク接続若しくは直接的な接続を介して、又は周知であるポータブル媒体を用いて、デバイス記憶ユニットにダウンロードされてもよい。
【0073】
当業者は、本発明のTm決定プロセスが、種々のプログラム言語、例えば、C、C++、C#、Fortran、VisualBasicなど、並びに、データ視覚化及び分析に有用な予めパックされたルーチン、関数及び手法を提供するMathematica(登録商標)などのアプリケーションを用いてコードされ得ることを承認しなければならない。後者の別の例は、MATLAB(登録商標)である。
【0074】
本発明に従うシステムの例は、図12及び13に示される。図12は、本発明のプロセス及びシステムを実行するために使用されてもよいソフトウェアとハードウェア供給源との間の関連を説明する一般的なブロック図を示す。図13に示されるシステムは、サーモサイクラーデバイスに位置されてもよい動的PCR分析モジュール、コンピュータシステムの一部である情報モジュールを含む。データセット(PCRデータセット)は、ネットワーク接続若しくは直接的な接続を介して、分析モジュールから情報モジュール(又はその反対)に転送される。データセットは、例えば、図4、5及び6に示されるフローチャートに従って処理されてもよい。これらのフローチャートは、都合良くは、例えば、図12に示されるフローチャートに従って、コンピュータシステムのハードウェアに格納されるソフトウェアによって実行されてもよい。図12を参照すると、コンピュータシステム(400)は、例えば、PCR反応中に得られる蛍光データを受け入れるための受信手段(410)、本発明のプロセスに従って該データを処理するための計算手段(420)、この計算手段によって得られる結果を適用するための適用手段(430)、並びにコンピュータスクリーンに結果を表示するための表示手段(440)を含んでもよい。図13は、サーモサイクラーデバイスとコンピュータシステムとの間の相互作用を例証する。このシステムは、サーモサイクラーデバイスに位置されてもよい動的PCR分析モジュール、並びにコンピュータシステムの一部である情報モジュールを含む。データセット(PCRデータセット)は、ネットワーク接続若しくは直接的な接続を介して、分析モジュールから情報モジュール(又はその反対)に転送される。データセットは、図12に従って、プロセッサー上で稼働するコンピュータコードによって処理され、情報モジュールの格納デバイスに格納されてもよく、処理後、分析モジュールの格納デバイスに戻されてもよい。この場合、修正されたデータは、表示デバイス上に表示可能である。
【0075】
本発明は、例示の目的で、特定の態様に関して記載されているが、本発明は、開示された態様に限定されないことを理解しなければならない。これとは反対に、当業者に明らかとなるように、種々の変更及び類似の処置を覆うことが意図される。
【背景技術】
【0001】
本発明は、概して、オリゴヌクレオチドの融解特徴を表すデータを処理することに関し、より具体的には、融解曲線データに基づくオリゴヌクレオチド試料についての1以上の融解温度を決定する方法に関する。
【0002】
DNA融解温度の決定は、通常は、PCR実験後に直接的に実行され、遺伝子型を区別するために重要な方法である。例えば、最近、文献には、非小細胞肺癌の治療のためにどの患者が候補をなり得るかを決定するためのKRAS遺伝子の試験の使用が開示されている。KRAS遺伝子が野生型である患者は、治療の恩恵を受けるが、患者がこの遺伝子の突然変異した改変を有する場合には、治療による恩恵は受けられない。これらの治療は、多くの場合、重大な副作用を有するため、患者の正確な遺伝子型を決定することが重要となる。融解KRASアッセイの使用は、患者の遺伝子型を区別するのに役立つ。したがって、DNA試料の融解温度を正確かつ効率的に決定するシステム及び方法を提供することが望まれる。
【発明の概要】
【課題を解決するための手段】
【0003】
本発明は、融解曲線データに基づく、オリゴヌクレオチドに対する融解温度を決定するシステム及び方法を提供する。種々の態様では、融解曲線データセットの1次微分係数の数値的な決定がなされる。モデル関数、例えば、ガウシアン混合モデル(Gaussian Mixture Model:GMM)関数は、レーベンバーグ・マルカート(Levenberg−Marquardt:LM)回帰プロセスを用いて決定されるパラメーターを含み、それを使用して、第1の微分曲線への近似を見出す。数値的に決定した第1の微分値の最大値は、モデル関数のパラメーターについての初期条件として使用される。決定したパラメーターは、分画(fractional)融解温度値を提供し、それは戻され、例えば、表示され、あるいは更なる処置のために使用され得る。
【0004】
本発明の1局面によれば、DNAの融解温度Tmを測定するためのコンピュータに実行させる方法が提供される。この方法は、典型的には、各々が座標値を有する複数のデータポイントを含む、DNA試料についての融解曲線を表すデータセットを受け入れることを含む。また、この方法は、典型的には、該融解曲線のデータポイントについての第1の微分値を数値的に決定し、該第1の微分値に対して基準を決定し、該第1の微分値から基準を差し引いて、修正された(modified)第1の微分値を生じさせ、該修正された第1の微分値の第1の最大値を決定することを含む。また、この方法は、典型的には、該DNA試料の融解温度Tmを表す該第1の最大値を出力することを含む。この方法は、さらに、レーベンバーグ・マルカート(Levenberg−Marquardt:LM)回帰プロセスをガウシアン混合モデル(Gaussian Mixture Model)関数に適用することによって、前記修正された第1の微分値を適合させ、該関数の1以上のパラメーターを決定する曲線に対する近似を計算し、ここで、該パラメーターは初期条件を含み、該第1の最大値は第1のパラメーターに対する初期条件として使用され、前記決定された第1のパラメーターは前記DNA試料の融解温度Tmを表す第1のパラメーターを出力する工程を含む。ある局面では、この方法は、さらに、第1の微分値が第1の最大値に近い肩値を含むかどうかを決定することを含む。ある種の態様では、ガウシアン混合モデルが、形式:
【0005】
【数1】
【0006】
(式中、μ1は第1のパラメーターであり、a1及びσ1は付加パラメーターである)
の式を含む。別の局面では、この方法は、さらに、第1のパラメーター値を表示することを含む。なお別の局面では、回帰プロセスはレーベンバーグ・マルカート(LM)回帰プロセスを含む。ある種の局面では、この方法は、修正された第1の微分値の第2、第3又は第4の最大値を決定することをさらに含み、ここで、該第2、第3又は第4の最大値は、第2、第3又は第4のパラメーターについての初期条件として使用され;前記決定された第2、第3又は第4のパラメーターが、前記DNA試料の第2の融解温度Tm2、第3の融解温度Tm3又は第4の融解温度Tm4を表す前記第2、第3又は第4のパラメーターを出力する。この方法の別の局面では、ガウシアン混合モデルは、形式:
【0007】
【数2】
【0008】
(式中、μ1は第1のパラメーターであり、μ2は第2のパラメーターであり、a1、σ1、a2及びσ2は付加パラメーターである)
の式を含む。この方法のなお別の局面では、ガウシアン混合モデルは、形式:
【0009】
【数3】
【0010】
(式中、μ1は第1のパラメーターであり、μ2は第2のパラメーターであり、μ3は第3のパラメーターであり、a1、σ1、a2、σ2、a3及びσ3は付加パラメーターである)
の式を含む。この方法のなお別の局面では、ガウシアン混合モデルは、形式:
【0011】
【数4】
【0012】
(式中、μ1は第1のパラメーターであり、μ2は第2のパラメーターであり、μ3は第3のパラメーターであり、μ4は第4のパラメーターであり、a1、σ1、a2、σ2、a3、σ3、a4及びσ4は付加パラメーターである)
の式を含む。この方法の別の局面では、第1の最大値を決定することは、修飾された第1の微分値にウィンドウプロセスを適用することを含み、ここで、該ウィンドウプロセスはまた、ガウシアン混合モデル関数パラメーターについての1以上の付加初期条件を決定する。
【0013】
本発明の別の局面によれば、コンピュータ読み取り可能な媒体が提供され、それは、DNAの融解温度Tmを決定するプロセッサーを制御するためのコードを格納する。格納されたコートは、典型的には、各々が一対の座標値を有する複数のデータポイントを含む、DNA試料についての融解曲線を表すデータセットを受け入れ、該融解曲線のデータポイントについての第1の微分値を数値的に決定し、第1の微分値に対する基準を決定し、第1の微分値から基準を差し引いて、修正された第1の微分値を生じさせ、第1の微分値の第1の最大値を決定する指示を含む。また、コードは、典型的には、第1の最大値を出力する指示を含み、ここで、第1の最大値はDNA試料の融解温度Tmを表す。また、コードは、典型的には、レーベンバーグ・マルカート(LM)回帰プロセスをガウシアン混合モデル関数に適用することによって修正された第1の微分値を適合して、この関数の1以上のパラメーターを決定する曲線の近似を計算し、ここで、該パラメーターは初期条件を含み、第1の最大値は第1のパラメーターについての初期条件として使用し、修正された第1のパラメーターはDNA試料の融解温度Tmを表す第1のパラメーターを出力する指示を含む。本明細書では、ある種の局面では、ガウシアン混合モデルは、形式:
【0014】
【数5】
【0015】
(式中、μ1は第1のパラメーターであり、a1及びσ1は付加パラメーターである)
の式を含む。ある種の局面では、コードは、第1の微分値が第1の最大値に近い肩値を含むかどうかを決定するための指示をさらに含む。別の局面では、コードは、第1のパラメーター値を表示する指示をさらに含む。なお別の局面では、コードは、修正された第1の微分値の第2の最大値を決定し、ここで、第2の最大値は、第2のパラメーターについての初期条件として使用され;修正された第2のパラメーターはDNA試料の第2の融解温度Tmを表す、第2のパラメーターを出力する指示を含む。ある種の局面では、ガウシアン混合モデルは、形式:
【0016】
【数6】
【0017】
(式中、μ1は第1のパラメーターであり、μ2は第2のパラメーターであり、a1、σ1、a2及びσ2は付加パラメーターである)
の式を含む。なお別の局面では、ガウシアン混合モデルは、形式:
【0018】
【数7】
【0019】
(式中、μ1は第1のパラメーターであり、μ2は第2のパラメーターであり、μ3は第3のパラメーターであり、a1、σ1、a2、σ2、a3及びσ3は付加パラメーターである)
の式を含む。なお別の局面では、ガウシアン混合モデルは、形式:
【0020】
【数8】
【0021】
(式中、μ1は第1のパラメーターであり、μ2は第2のパラメーターであり、μ3は第3のパラメーターであり、μ4は第4のパラメーターであり、a1、σ1、a2、σ2、a3、σ3、a4及びσ4は付加パラメーターである)
の式を含む。コンピュータ読み取り可能な媒体の別の局面では、第1の最大値を決定する指示は、修正された第1の微分値へのウィンドウプロセスを適用する指示を含み、ここで、ウィンドウプロセスはまた、ガウシアン混合モデル関数パラメーターについての1以上の付加初期条件を決定する。
【0022】
本発明のなお別の局面によれば、動的ポリメラーゼ連鎖反応(PCR)システムが提供され、それは、典型的には、各々が一対の座標値を有する複数のデータポイントを含む、DNA融解曲線を表す融解曲線データセットを生じさせる動的PCR分析モジュール;並びにTm値を決定する融解曲線データセットを処理するように適合される情報(intelligence)を含む。この情報モジュールは、典型的には、該融解曲線のデータポイントについての第1の微分値を数値的に決定し、該第1の微分値に対して基準を決定し、該第1の微分値から基準を差し引いて、修正された第1の微分値を生じさせ、該修正された第1の微分値の第1の最大値を決定することによって、Tm値を決定する。また、情報モジュールは、典型的には、Tm値として修正された1次微分係数の決定した第1の最大値を使用して、該Tm値を出力することによってTm値を決定する。ある種の態様では、情報モジュールは、レーベンバーグ・マルカート(LM)回帰プロセスをガウシアン混合モデル関数に適用することによって修正された第1の微分値を適合させ、この関数の1以上のパラメーターを決定する曲線の近似を計算し、ここで、該パラメーターは初期条件を含み、該第1の最大値は第1のパラメーターについての初期条件として使用され、並びに、該決定した第1のパラメーターはDNA試料の融解温度Tmを表す、第1のパラメーターを出力することによって、Tm値を決定する。ある種の局面では、ガウシアン混合モデルは、形式:
【0023】
【数9】
【0024】
(式中、μ1は第1のパラメーターであり、a1及びσ1は付加パラメーターである)
の式を含む。別の局面では、情報モジュールは、第1の微分値が第1の最大値に近い肩値を含むかどうかを決定するためにさらに適合される。なお別の局面では、情報モジュールは、さらに、修正された第1の微分値の第2の最大値を決定し、ここで、第2の最大値は、第2のパラメーターについての初期条件として使用され;決定した第2のパラメーターはDNA試料の第2の融解温度Tmを表す、第2のパラメーターを出力するようにさらに適合される。ある種の局面では、修正された第1の微分値の第2の最大値が決定され、ここで、第2の最大値は、第2のパラメーターについての初期条件として使用され、ガウシアン混合モデルは、形式:
【0025】
【数10】
【0026】
(式中、μ1は第1のパラメーターであり、μ2は第2のパラメーターであり、a1、σ1、a2、及びσ2は付加パラメーターである)
の式を含む。ある種の局面では、修正された第1の微分値の第3の最大値が決定され、ここで、第3の最大値は、第3のパラメーターについての初期条件として使用され、ガウシアン混合モデルは、形式:
【0027】
【数11】
【0028】
(式中、μ1は第1のパラメーターであり、μ2は第2のパラメーターであり、μ3は第3のパラメーターであり、a1、σ1、a2、σ2、a3及びσ3は付加パラメーターである)
の式を含む。ある種の局面では、修正された第1の微分値の第4の最大値が決定され、ここで、第4の最大値は、第4のパラメーターについての初期条件として使用され、ガウシアン混合モデルは、形式:
【0029】
【数12】
【0030】
(式中、μ1は第1のパラメーターであり、μ2は第2のパラメーターであり、μ3は第3のパラメーターであり、μ4は第4のパラメーターであり、a1、σ1、a2、σ2、a3、σ3、a4及びσ4は付加パラメーターである)
の式を含む。このシステムの別の局面では、情報モジュールは、修正された第1の微分値にウィンドウプロセスを適用することによって第1の最大値を決定し、ここで、ウィンドウプロセスはまた、ガウシアン混合モデル関数パラメーターについての1以上の付加初期条件を決定する。
【0031】
図面及び特許請求の範囲を含む本発明の残り部分への参照は、本発明の他の特徴及び利点を実現する。本発明の更なる特徴及び利点、並びに本発明の種々の態様の構造及び操作は、添付の図面と比較しながら、下記に詳細に記載される。図面では、同様に、参考文献の番号は、同一又は機能的に類似した要素を指示する。
【図面の簡単な説明】
【0032】
【図1】融解曲線の例を例示する。
【図2】図1の融解曲線に対する第1の微分曲線を例示する。
【図3】基準の差し引き後の図2の微分曲線を示す。
【図4】一態様による、融解温度(単数又は複数)を決定するためのプロセスを例示する。
【図5】一態様による、融解温度コンピュータ化プロセスを例示する。
【図6】一態様による、肩検出プロセスを例示する。
【図7a】図7aは、それぞれ、1つの融解ピークの場合での生データ及び融解曲線の例示を示す。
【図7b】図7bは、それぞれ、1つの融解ピークの場合での生データ及び融解曲線の例示を示す。
【図8a】図8aは、それぞれ、2つの融解ピークの場合での生データ及び融解曲線の例示を示す。
【図8b】図8bは、それぞれ、2つの融解ピークの場合での生データ及び融解曲線の例示を示す。
【図9a】図9aは、それぞれ、2つの融解ピークの場合での生データ及び融解曲線の例示を示す。
【図9b】図9bは、それぞれ、2つの融解ピークの場合での生データ及び融解曲線の例示を示す。
【図10a】図10aは、それぞれ、1つの融解ピーク+肩の場合での生データ及び融解曲線の例示を示す。
【図10b】図10bは、それぞれ、1つの融解ピーク+肩の場合での生データ及び融解曲線の例示を示す。
【図11a】図11aは、それぞれ、1つの融解ピーク+肩の場合での生データ及び融解曲線の例示を示す。
【図11b】図11bは、それぞれ、1つの融解ピーク+肩の場合での生データ及び融解曲線の例示を示す。
【図12】本発明のプロセス及びシステムを実行するために使用することができるソフトウェアとハードウェア資源との間の関係を説明する一般的なブロック図を示す。
【図13】サーモサイクラーとコンピュータシステムとの間の相互作用を例示する。
【発明を実施するための形態】
【0033】
本発明は、DNAについての融解温度Tmを決定するためのシステム及び方法を提供する。
【0034】
本発明は、融解曲線を表すデータを分析することによる、融解温度を決定するためのシステム及び方法を提供する。ある種の局面では、融解曲線データセットの1次微分係数の数値的な決定がなされる。レーベンバーグ・マルカート(LM)回帰プロセスを用いて測定されたパラメーターを含むガウシアン混合モデル(GMM)関数を使用して、第1の微分曲線への近似を見出す。数値的に決定した第1の微分値の最大値は、GMM関数のパラメーターについての初期条件として使用される。決定したパラメーターは、分画融解温度Tm値を提供する。次に、Tm値(単数又は複数)は、戻され、表示されるか又は他には更なる処置のために使用されてもよい。
【0035】
PCRプロセスとの関連における融解曲線の一例を図1に示す。図1に示されるように、典型的な融解曲線についてのデータは、2次元座標系で表すことができ、例えば、温度をx軸に定義し、蓄積されたポリヌクレオチドの指標をy軸にする。典型的には、蓄積されたポリヌクレオチドの指標は、蛍光マーカーの使用がおそらくは最も広く使用されている標識スキームであるため、蛍光強度値である。しかしながら、他の指標は、特定の標識及び/又は使用される検出スキームに依存して使用可能である。蓄積されたシグナルの他の有用な指標の例には、ルミネッセンス強度、ケミルミネッセンス強度、バイオルミネッセンス強度、リン光強度、電荷移動、電圧、電力、力、エネルギー、温度、粘度、光散乱、放射線強度、反射率、透過及び吸光度が挙げられる。
【0036】
一般的プロセスの概要
図1に示される典型的な融解曲線を考慮されたい。図1に表されるデータからは1以上の融解温度を得ることが望まれる。一態様によれば、融解温度を決定するためのプロセス100は、図4と比較して、簡潔に記載することができる。肯定110では、融解曲線を表す実験的データセットは、戻され、又は他には獲得される。プロットされた融解曲線データセットの例を図1に示す。ここでは、y軸及びx軸は、それぞれ、融解曲線に対する蛍光強度及び温度を表す。ある種の局面では、データセットは、連続的であり、かつ軸に沿って等しく間隔を空けているデータを含まなければならない。
【0037】
プロセス100が、サーモサイクラーなどのPCRデバイスにある情報モジュール(例えば、指示を施行するプロセッサー)において実行される場合、データセットは、データが回収されているので、リアルタイムで情報モジュールに提供されてもよく、あるいは、記憶ユニット又はバッファーに格納され、実験が完了後に情報モジュールに情報モジュールに適用されてもよい。同様に、データセットは、取得デバイスに対してネットワーク接続(例えば、LAN、VPN、イントラネット、インターネットなど)又は直接的な接続(例えば、USB又は他の直接的なワイヤー接続若しくはワイヤーレス接続)を介して、デスクトップコンピュータシステム又は他のコンピュータシステムなどの別々のシステムに提供されてもよく、あるいはCD、DVD、フロッピー(登録商標)ディスクなどのポータブル媒体に提供されてもよい。ある種の局面では、データセットには、一対の座標値を有するデータポイント(又は2次元ベクター)が含まれる。融解データに関しては、一対の座標値は、典型的には、温度及び蛍光強度値を表す。データセットが工程110で受け入れられるか又は取得された後、このデータセットを分析して、融解温度(単数又は複数)を決定してもよい。
【0038】
工程120では、データを数値的に処理して、微分値が決定される。これらの曲線の融解温度は、温度と比較した蛍光強度の1次微分係数(y軸)の最大に対応する(分画)温度値(x軸)を見出すことによって得られる。図1に示されるデータを用いて、1次微分係数に関する対応図を図2に示す。一態様では、基準の差し引きは、微分曲線データで実行され、修正された微分係数データを生じさせる。一態様では、基準差し引きは、最初に、図2における最初の5点の蛍光値の中央値として「中央値左(MedianLeft)」を決定し、次に、図2における最後の5点の蛍光値の中央値として「中央値右(MedianRight)」を決定することによって実行される。その後、図2における「中央値左」点(x,y)と「中央値右」点(x,y)とを結ぶ直線が特定される。次に、この直線の傾き及び切片は、全ての座標対から差し引かれる。図3は、基準差し引き後の微分曲線を示す。
【0039】
一態様では、微分係数は、Savitzky−Golay(SG)法の使用によって得られる。[A.Savitzky and Marcel J.E. Golay(1964).Smoothing and Differentiation of Data by Simplified Least Squares Procedures.Analytical Chemistry,36:1627−1639 and Press,W.H.,et al.“Numerical Recipes in C,2nd Ed.,”Savitzky−Golay Smoothing Filters,Section 14.8,650−655を参照されたい]。SG−2−2−2形態(左に2点、右に2点、2次多項式を意味する)を用いて、一態様では、生の融解データ曲線の1次微分係数を計算する。一般に、SG法の他の形態は、例えば、SG−1−1−2からSG−50−50−2なども用いてもよい。より一般には、SG−x−y−zを使用してもよく、この場合、x及びyは1〜50の数であり、zは1〜5の数である。
【0040】
微分係数のスケール不変形
ある種の態様では、代替法を用いて、融解温度をスケール不変であるようにするために微分係数が計算される。スケール不変は、蛍光値が定数で乗じられる場合、得られるTm値(単数又は複数)は変化しない。
【0041】
一方法によれば、蛍光値は、平均した蛍光値によって除され、その後、微分融解曲線を計算し、例えば、yは、
【0042】
【数13】
【0043】
によって置換される。
【0044】
別の方法によれば、蛍光値は、(最大蛍光−最少蛍光)によって除され、その後、微分融解温度が計算される。
【0045】
別の方法によれば、蛍光値の微分係数は、蛍光値によって除され、その後、融解温度が計算される。
【0046】
なお別の方法によれば、蛍光値の微分係数は、蛍光値の平均した微分係数によって除され、その後、融解温度が計算される。
【0047】
さらに別の方法によれば、蛍光値の微分係数は、蛍光値の(最大−最少)微分係数によって除され、その後、融解温度が計算される。
【0048】
図4に戻ると、工程130では、最初の微分係数データにおける多数のピークは決定される。一態様では、極大プロセスを用いて、1次微分係数データにおける0、1、2、3又は4つのピークが決定され、これは、より詳細には下記に検討される。生の微分係数データを使用してもよく、あるいは基準を差し引いた微分係数データを使用してもよい。
【0049】
一態様では、分画Tm値は、工程140で決定される。例えば、図2又は3に示されるように、曲線の最大値を見出すために、一態様では、ガウシアン混合モデルがデータに適合される。ガウシアン混合モデルの平均は、最大値、即ち、Tm値に対応する。一態様では、曲線の当てはめは、決定された1次微分係数値、又は修正された(基準を差し引いた)微分係数値を適合する曲線の近似を計算し、回帰プロセスをガウシアン混合モデル関数に適用することによってなされ、この関数の1以上のパラメーターを決定する。ある種の局面では、レーベンバーグ・マルカート回帰プロセスが使用される。一態様では、単一ピークの場合に関しては、単一ピークに対するガウシアン混合モデルが、式(2)に示されるように使用される。2つのピークが存在する場合、2つのピークに対するガウシアン混合モデルが、式(3)に示されるように使用される。3つのピークが存在する場合、3つのピークに対するガウシアン混合モデルが、式(4)に示されるように使用される。4つのピークが存在する場合、4つのピークに対するガウシアン混合モデルが、式(5)に示されるように使用される。係数μ1又は(μ1,μ2)に対する回帰された値は、それぞれ、1つ又は2つのピークに対するTm値に対応する。ガウシアン混合モデルは、最大を見出すために付加的な微分係数を採用することよりはむしろ、一態様として使用され、微分係数のオーダーが高くなるにつれて(3次、4次)不安定となる可能性がある。
【0050】
【数14】
【0051】
当業者に明らかとなるように、他のモデル/関数がガウシアン混合モデルの代わりに使用可能であることは承認される。他のモデルの例には、Beta、Binomial、Cauchy、Chi、ChiSquare、Exponential、Extreme Value、FRatio、Gamma、Gumbel、Laplace、Logistic、Maxwell、Pareto、Rayleigh、Student T、及びWeibullモデルが挙げられる。
【0052】
2を超えるピークを含む1次微分係数データを用いて、上記態様が適用可能であることが理解されなければならない。この場合、極大による係数μ1、μ2、μ3、μ4に対する初期概算は、最終の融解温度に対応する。
【0053】
一態様では、レーベンバーグ・マルカート(LM)法を使用して、式(2)(又は式(3)、式(4)、式(5))を曲線当てはめされる。この方法の詳細は、参考文献[More,J.J.,“The Levenberg−Marquardt Algorithm,Implementation and Theory,”Numerical Analysis,ed.Watson,G.A.Lecture Notes in Mathematics 630,Springer−Verlag,1977]に見出すことができる。周知である他の回帰法を使用してもよいことは承認されなければならない。一般に、LM回帰法は、種々のインプットを必要とし、アウトプットを提供するアルゴリズムを含む。一局面では、インプットは、処理されるべきデータセット、このデータを適合するために使用される関数(例えば、ガウシアン混合モデル)、並びにこの関数のパラメーター又は変数についての初期推測を含む。アウトプットは、関数とデータセットとの間の距離の二乗の合成を最少にする関数に関する一連の1以上のパラメーターを含む。当業者に明らかとのなるように、他の回帰プロセスを使用してもよいことは承認されなければならない。
【0054】
レーベンバーグ・マルカート法の1つの特徴は、回帰を実行する前にパラメーター値の良好な概算を必要とすることである。パラメーターa1(又はa1、a2、a3、a4)及びσ1(又はσ1、σ2、σ3、σ4)に関して、初期条件は、全ての場合において定数(例えば、1又は2)に等しいように設定可能である。これらのパラメーターは、一般に、影響を受けず、一般に、使用される初期条件に関わらずに収束する。パラメーターμ1(又はμ1、μ2、μ3、μ4)は、各曲線について決定されるべきであるより正確な初期条件を必要としてもよい。一態様では、ウィンドウプロセスを用いて、下記により詳細に記載されるように、パラメーターμ1(又はμ1、μ2、μ3、μ4)に関する初期条件を計算する。
【0055】
任意工程150では、1以上のエキスパートシステムチェックを行い、下記により詳細に検討されるように、結果が有効であるかどうかを評価する。例えば、実行されると、エキスパートシステムチェックは、決定された結果が無効であることを判断することができる。
【0056】
工程160では、Tm値(単数又は複数)が、例えば、表示又は他の処理のために戻されてもよい。グラフ表示は、図4の分析を実行したシステムと連結された、モニタースクリーン又はプリンターなどの表示デバイスを用いて表すことができ、あるいは、データは表示デバイス上で表すための別々のシステムに提供されてもよい。
【0057】
ある態様では、R2統計及び/又は信頼(例えば、95%信頼性)区間は、GMM1、GMM2、GMM3、GMM4パラメーターについて計算される。これらの値は、曲線当てはめの質を評価し、計算されたTm値が有効であるか、無効であるか、又はゼロである(試料が存在しない)かを決定するのを助けるためにエキスパートシステム(後述)において使用されてもよい。また、これらの値は、工程160で表示されてもよい。
【0058】
曲線における最大の決定
一態様では、ウィンドウプロセスは、パラメーターμ1、μ2、μ3、μ4についての初期条件を決定するためにデータセットに使用される。下記のウィンドウプロセスは、最大2つのピークを含む1次微分係数について記載される。それにもかかわらず、上述されるように、このウィンドウプロセスは、最大4つのピークを示す1次微分係数データに適用可能であることは理解されなければならない。一態様では、ウィンドウプロセスは、下記の手法を使用することによって、潜在的な極大について検索する。
【0059】
1.第1の点から開始して、データセットの第1のいくつかの(例えば、5個の)ポイント(ポイント1〜5)を調べる。
2.中間のyポイントがこれらの5ポイントにおいて最大でない場合、これらの5ポイントにおいて潜在的な最大はない。中間のyポイントがこれらの5ポイントの最大であり、(一連の潜在的な最大に、0の正確な値を有するより長いポイント配列の中間の点を加えることを避けるために)0よりも大きな値を有する場合、潜在的な最大がある。一連の潜在的な最大Sにこのポイントを加える。
3.1ポイント(例えば、現にポイント2〜6)によって滑りウィンドウを進め、2項に記載のプロセスを繰り返す。再度、これらの5ポイントのインデックス3で最大のみを受け入れる。全データセットを通じてこのプロセスを継続する。
4.可能性のある最大の結果セットSを調べ、インデックス3で可能性の最大のセットを表し、可能性のある最大のこのセットS(Smax)を見出す。
5.Smaxが、マックスノイズ(MaxNoise)インプットパラメーター(ユーザーによってインプットされるか、又は自動的に決定されてもよいノイズパラメーター)に等しいか又はそれよりも小さい場合、曲率データにおいてピークはない。
6.このセットSからの残りの可能性のある最大データポイントを維持し、それらが、Smax x RelativeMinインプットパラメーターより大きく、AbsoluteMinインプットパラメーターより大きいことを与える。
7.残されたデータポイントがただ1つである場合、ただ1つのピークが存在し、曲線はただ1つの最大を有する。この1つのピークをpk1として特定する。残されたデータポイントが2つある場合、これは2つの最大を有する曲線を表す。2を超えるピークが存在する場合、データセットSの最大値を有する2つのピークを採用し、これらの2つのうちのより低いサイクル数を有するピークをpk1とし、より高いサイクル数を有するピークをpk2として戻す。
8.μ1についての初期条件はpk1であり、(μ1,μ2)についての初期条件は(pk1,pk2)である。
【0060】
融解温度計算(computation)
一態様に従う融解温度計算は、図5に例証される。工程210では、1次微分係数データセットが1つ又は2つ(又は3つ、4つ)のピークを含むどうかの決定がなされる。工程220では、融解データの1次微分係数が単一のピークを有するものとして同定される場合、融解曲線の最大は、式(2)に記載される単一成分のガウシアン関数の非線形回帰(例えば、レーベンバーグ・マルカート法又は他の回帰法を用いる)によって見出される。初期条件は、極大検索によって与えられる。工程230では、融解データセットの1次微分係数が2つのピーク(又は3つ、4つ)を有するものとして同定される場合、融解曲線の両方の極大は、式(3)に記載される二重成分のガウス関数の非線形回帰(例えば、レーベンバーグ・マルカート法を用いる)によって見出され、パラメーターμ1、μ2(又はμ3及びμ4)(Tm1、Tm2、又はTm3及びTm4に対応する)が戻される。初期条件は、極大検索によって与えられる。たとえ図5が1つ又は2つのピークについての融解温度計算を示す場合であっても、2つのピークについて使用される同じ融解温度計算は3つ及び4つのピークについても使用可能であることは承認されなければならない。
【0061】
工程240では、肩検出プロセスは、一態様に従う単一の微分係数ピークについて肩が存在するかどうかを決定天然に存在しない微生物値する。2つ(又は3つ、4つ)のピークがMELTアルゴリズムにおいて見出される場合、さらに処理されない。その代わりに、1つのピークが見出された場合、このピークに肩が存在することはあり得る。一態様に従う肩検出プロセスの詳細は、後に検討される。肩が検出されない場合、μ1(Tm1に対応する)が戻される。工程250では、信頼区間は、種々のパラメーターについて決定される。工程260では、R2値は、使用されるガウシアン混合モデルについて計算される。一態様では、GMMA(又はGMM2、GMM3、GMM4)フィットのR2値が>0.9であるか、又はパラメーター(μ1,σ1)、又は(μ1,σ1,μ2,σ2,μ3,σ3,μ4,σ4)がゼロを含まない場合、Tm1(又はTm1、Tm2、TM3、Tm4)の値は、工程270で許容される。そうでなければ、Tm1、(又はTm1、Tm2、TM3、Tm4)は工程280では、標的が検出されない(TND)として設定され、工程290での任意のエキスパートシステムは、TNDの最終コールとなるか又は無効である。
【0062】
肩検出
一態様に従う肩検出プロセスは、図6に示される。工程310では、二重成分ガウシアンモデルは、初期条件としてa1,2=2、μ1,2=m±2、σ1,2=2(ここで、mは単一ピークの融解温度である)を用いた同じ1次微分係数に適合される。工程320では、潜在的な主ピーク及び肩(低い)ピークが上述のように決定される。工程330では、より低いピークの高さが少なくともより高いピークのある種のパーセント(例えば、0.05倍以上高いピーク)であるかどうかについて決定される。そうでない場合、コールを示さない肩は戻され、Tm決定処理が図5の工程250により継続する。そうである場合、工程340では、信頼区間は、種々のパラメーターについて決定され、工程350では、R2値は、GMM2式について決定される。工程360では、平均の信頼区間が、互いに離れた少なくともある種の数値の℃(例えば、3℃以上)であるかどうかについて決定される。そうでない場合、コールを示さない肩は戻され、Tm決定処理が図5の工程250により継続する。そうである場合、工程370では、信頼区間がゼロを含むかどうか、又はR2値が閾値(例えば、0.9)よりも大きいかどうかについての決定がされる。そうでない場合、コールを示さない肩は戻され、Tm決定処理が図5の工程250により継続する。μ1及びμ2の両方で評価される二重成分のガウシアンモデル(GMM2)の二次(2d)微分係数が負であるかどうかの決定。そうである場合、肩を検出するコールがなされる。
【0063】
このようにして、収束されたLM法を前提とすると、一態様では、肩は、下記の条件の全てが当てはまる場合に検出される。
・1次微分係数データが正確に1つの極大を有するように同定された。
・低いピークが高さにして高いピークの少なくとも0.5倍である(例えば、「exp(−a)」を用いる)。
・平均の信頼区間が互いに少なくとも3℃離れている。
・μ1、μ2、σ1及びσ2の信頼区間はゼロを含まないか、又はR2>0.9である。
・μ1及びμ2の両方で評価される二重成分のガウシアンモデル(GMM2)の2次微分係数が負である。
【0064】
これらの条件が満たされる場合、肩検出フラグが生じる。上記の肩検出プロセスは、1つ又は2つのピークを含む1次微分係数についての図6と関連して記載される。それにもかかわらず、上述されるように、この肩検出プロセスは、最大4つのピークを示す1次微分係数データに適用可能であることは理解しなければならない。
【0065】
エキスパートシステムチェック
一態様では、1以上のエキスパートシステムチェックは、工程290(図5)で実行される。1つのチェックでは、全部の全融解曲線の中央値が>0であるかどうかが決定される。これが誤りである場合、結果は、無効としてレポートされる。別のチェックでは、融解ピーク(Melt Peak)蛍光データの最大の絶対値が融解ピーク蛍光データの最少の絶対値よりも大きいかどうかが決定される。これが誤りである場合、結果は、無効としてレポートされる。別のチェックでは、生の蛍光の中央値 対 第1のいくつかの(例えば、5個の)サイクルからの温度値が、生の蛍光の中央値 対 少なくともいくつかの(例えば、5個の)サイクルからの温度値よりも大きいかどうかの決定がされる。これが誤りである場合、結果は、無効としてレポートされる。なお別のチェックでは、二次多項式が、生の蛍光 対 温度データセットに適合される。この適合におけるR2が閾値(0.99)よりも高い場合、ピークは存在せず、結果は、標的が検出されない(TND)としてレポートされる。
【実施例】
【0066】
図7a及び7bは、それぞれ、1つの融解ピークの場合の生のデータ曲線及び融解曲線を示す。計算された融解温度はTm=67.8である。
【0067】
図8a及び8bは、それぞれ、2つの融解ピークの場合の生のデータ曲線及び融解曲線を示す。計算された融解温度は、Tm1=58.8、Tm2=67.8である。
【0068】
図9a及び9bは、それぞれ、2つの融解ピークの場合の生のデータ曲線及び融解曲線を示す。計算された融解温度は、Tm1=57.9、Tm2=68.6である。
【0069】
図10a及び10bは、それぞれ、1つの融解ピーク+肩の場合の生のデータ曲線及び融解曲線を示す。計算された融解温度は、Tm1=62.4、Tm2=68.8である。
【0070】
図11a及び11bは、それぞれ、1つの融解ピーク+肩の場合の生のデータ曲線及び融解曲線を示す。計算された融解温度は、Tm1=61.3、Tm2=68.1である。
【0071】
ある種の態様では、本発明に従うTm決定プロセスは、従来のパーソナルコンピュータシステムの使用によって実行可能であり、このシステムには、限定されないが、キーボード、マウスなどのデータセットをインプットするためのインプットデバイス;モニターなどの、曲線領域において対象とする特定のポイントを表すための表示デバイス;CPUなどの、この方法における各工程を実行するために必要な処理デバイス;モデムなどのネットワークインターフェイス、データセットを格納するためのデータ格納デバイス、プロセッサー上で稼働するコンピュータコードなどが含まれる。さらに、プロセッサーもまた、本発明に従うPCRプロセス、又は本発明に従うPCRシステムにおいて実行されてもよい。
【0072】
微分係数及び肩決定プロセスを含むTm決定プロセスは、コンピュータシステムのプロセッサー上で稼働するコンピュータコードにおいて実行可能であることが承認されなければならない。このコードは、Tm決定プロセスの種々の局面及び工程を実行するためのプロセッサーを制御する指示を含む。このコードは、典型的には、ハードディスク、RAM、又はCD、DVDなどのポータブル媒体に格納される。同様に、このプロセスは、サーモサイクラーなどのPCRデバイス、又は他の特殊なデバイスにおいて実行されてもよく、それには、プロセッサーに連結された記憶ユニットに格納された指示を実行するプロセッサーが含まれる。このような指示を含むコードは、コード供給源へのネットワーク接続若しくは直接的な接続を介して、又は周知であるポータブル媒体を用いて、デバイス記憶ユニットにダウンロードされてもよい。
【0073】
当業者は、本発明のTm決定プロセスが、種々のプログラム言語、例えば、C、C++、C#、Fortran、VisualBasicなど、並びに、データ視覚化及び分析に有用な予めパックされたルーチン、関数及び手法を提供するMathematica(登録商標)などのアプリケーションを用いてコードされ得ることを承認しなければならない。後者の別の例は、MATLAB(登録商標)である。
【0074】
本発明に従うシステムの例は、図12及び13に示される。図12は、本発明のプロセス及びシステムを実行するために使用されてもよいソフトウェアとハードウェア供給源との間の関連を説明する一般的なブロック図を示す。図13に示されるシステムは、サーモサイクラーデバイスに位置されてもよい動的PCR分析モジュール、コンピュータシステムの一部である情報モジュールを含む。データセット(PCRデータセット)は、ネットワーク接続若しくは直接的な接続を介して、分析モジュールから情報モジュール(又はその反対)に転送される。データセットは、例えば、図4、5及び6に示されるフローチャートに従って処理されてもよい。これらのフローチャートは、都合良くは、例えば、図12に示されるフローチャートに従って、コンピュータシステムのハードウェアに格納されるソフトウェアによって実行されてもよい。図12を参照すると、コンピュータシステム(400)は、例えば、PCR反応中に得られる蛍光データを受け入れるための受信手段(410)、本発明のプロセスに従って該データを処理するための計算手段(420)、この計算手段によって得られる結果を適用するための適用手段(430)、並びにコンピュータスクリーンに結果を表示するための表示手段(440)を含んでもよい。図13は、サーモサイクラーデバイスとコンピュータシステムとの間の相互作用を例証する。このシステムは、サーモサイクラーデバイスに位置されてもよい動的PCR分析モジュール、並びにコンピュータシステムの一部である情報モジュールを含む。データセット(PCRデータセット)は、ネットワーク接続若しくは直接的な接続を介して、分析モジュールから情報モジュール(又はその反対)に転送される。データセットは、図12に従って、プロセッサー上で稼働するコンピュータコードによって処理され、情報モジュールの格納デバイスに格納されてもよく、処理後、分析モジュールの格納デバイスに戻されてもよい。この場合、修正されたデータは、表示デバイス上に表示可能である。
【0075】
本発明は、例示の目的で、特定の態様に関して記載されているが、本発明は、開示された態様に限定されないことを理解しなければならない。これとは反対に、当業者に明らかとなるように、種々の変更及び類似の処置を覆うことが意図される。
【特許請求の範囲】
【請求項1】
DNAの融解温度Tmを測定するためのコンピュータに実行させる方法であって、下記:
各々が座標値を有する複数のデータポイントを含む、DNA試料についての融解曲線を表すデータセットを受け入れ、
該融解曲線のデータポイントについての第1の微分値を数値的に決定し、
該第1の微分値に対して基準を決定し、
該第1の微分値から基準を差し引いて、修正された(modified)第1の微分値を生じさせ、
該修正された第1の微分値の第1の最大値を決定し、並びに
該DNA試料の融解温度Tmを表す該第1の最大値を出力する
ことを含む方法。
【請求項2】
さらに、下記:
レーベンバーグ・マルカート(Levenberg−Marquardt:LM)回帰プロセスをガウシアン混合モデル(Gaussian Mixture Model)関数に適用することによって、前記修正された第1の微分値を適合させ、該関数の1以上のパラメーターを決定する曲線に対する近似を計算し、ここで、該パラメーターは初期条件を含み、該第1の最大値は第1のパラメーターに対する初期条件として使用され、
前記決定された第1のパラメーターは前記DNA試料の融解温度Tmを表す第1のパラメーターを出力する
工程を含む、請求項1に記載の方法。
【請求項3】
ガウシアン混合モデルが、形式:
【数1】
(式中、μ1は第1のパラメーターであり、a1及びσ1は付加パラメーターである)
の式を含む、請求項2に記載の方法。
【請求項4】
前記第1の微分値が前記第1の最大値に近い肩値を含むかどうかを決定することをさらに含む、請求項1に記載の方法。
【請求項5】
前記第1のパラメーター値を表示することをさらに含む、請求項2に記載の方法。
【請求項6】
さらに、下記:
前記修正された第1の微分値の第2、第3又は第4の最大値を決定し、ここで、該第2、第3又は第4の最大値は、第2、第3又は第4のパラメーターについての初期条件として使用され、並びに
前記決定された第2、第3又は第4のパラメーターが、前記DNA試料の第2の融解温度Tm2、第3の融解温度Tm3又は第4の融解温度Tm4を表す前記第2、第3又は第4のパラメーターを出力する
工程を含む、請求項1に記載の方法。
【請求項7】
前記ガウシアン混合モデルが、形式:
【数2】
(式中、μ1は第1のパラメーターであり、μ2は第2のパラメーターであり、a1、σ1、a2及びσ2は付加パラメーターである)
の式を含む、請求項6に記載の方法。
【請求項8】
前記ガウシアン混合モデルが、形式:
【数3】
(式中、μ1は第1のパラメーターであり、μ2は第2のパラメーターであり、μ3は第3のパラメーターであり、a1、σ1、a2、σ2、a3及びσ3は付加パラメーターである)
の式を含む、請求項6に記載の方法。
【請求項9】
前記ガウシアン混合モデルが、形式:
【数4】
(式中、μ1は第1のパラメーターであり、μ2は第2のパラメーターであり、μ3は第3のパラメーターであり、μ4は第4のパラメーターであり、a1、σ1、a2、σ2、a3、σ3、a4及びσ4は付加パラメーターである)
の式を含む、請求項6に記載の方法。
【請求項10】
DNAの融解温度Tmを決定する処理装置を制御するコードを含むコンピュータ読み取り可能な媒体であって、該コードは、下記:
各々が一対の座標値を有する複数のデータポイントを含む、DNA試料についての融解曲線を表すデータセットを受け入れ、
該融解曲線のデータポイントについての第1の微分値を数値的に決定し、
該第1の微分値に対して基準を決定し、
該第1の微分値から基準を差し引いて、修正された(modified)第1の微分値を生じさせ、
該修正された第1の微分値の第1の最大値を決定し、並びに
該DNA試料の融解温度Tmを表す該第1の最大値を出力する
という指示を含む媒体。
【請求項11】
前記コードが、請求項2〜9のいずれか1項に記載の工程を実行するために適応される、請求項10に記載のコンピュータ読み取り可能な媒体。
【請求項12】
動的ポリメラーゼ連鎖反応(PCR)システムであって、下記:
各々が一対の座標値を有する複数のデータポイントを含む、DNA融解曲線を表す融解曲線データセットを生じさせる動的PCR分析モジュール;並びに
下記:
各々が一対の座標値を有する複数のデータポイントを含む、DNA試料についての融解曲線を表すデータセットを受け入れ、
該融解曲線のデータポイントについての第1の微分値を数値的に決定し、
該第1の微分値に対して基準を決定し、
該第1の微分値から基準を差し引いて、修正された(modified)第1の微分値を生じさせ、
該修正された第1の微分値の第1の最大値を決定し、及び
該DNA試料の融解温度Tmを表す該第1の最大値を出力する
によって、Tm値を決定するために該融解曲線データセットを処理するように適用される情報(intelligence)モジュール
を含むシステム。
【請求項13】
前記動的PCR分析モジュールが動的サーモサイクラーデバイスにあり、前記情報モジュールが該分析モジュールに伝達可能に連結されたプロセッサーを含むか、又は前記情報モジュールがネットワーク接続若しくは直接的な接続の1つによって該分析モジュールに連結されたコンピュータシステムにあるプロセッサーを含む、請求項12に記載のシステム。
【請求項14】
前記出力が表示モジュール上にTm値を表示することを含む、該表示モジュールをさらに含む、請求項12に記載のシステム。
【請求項15】
前記システムが、請求項2〜9のいずれか1項の工程を実行するために適応される、請求項12に記載のシステム。
【請求項1】
DNAの融解温度Tmを測定するためのコンピュータに実行させる方法であって、下記:
各々が座標値を有する複数のデータポイントを含む、DNA試料についての融解曲線を表すデータセットを受け入れ、
該融解曲線のデータポイントについての第1の微分値を数値的に決定し、
該第1の微分値に対して基準を決定し、
該第1の微分値から基準を差し引いて、修正された(modified)第1の微分値を生じさせ、
該修正された第1の微分値の第1の最大値を決定し、並びに
該DNA試料の融解温度Tmを表す該第1の最大値を出力する
ことを含む方法。
【請求項2】
さらに、下記:
レーベンバーグ・マルカート(Levenberg−Marquardt:LM)回帰プロセスをガウシアン混合モデル(Gaussian Mixture Model)関数に適用することによって、前記修正された第1の微分値を適合させ、該関数の1以上のパラメーターを決定する曲線に対する近似を計算し、ここで、該パラメーターは初期条件を含み、該第1の最大値は第1のパラメーターに対する初期条件として使用され、
前記決定された第1のパラメーターは前記DNA試料の融解温度Tmを表す第1のパラメーターを出力する
工程を含む、請求項1に記載の方法。
【請求項3】
ガウシアン混合モデルが、形式:
【数1】
(式中、μ1は第1のパラメーターであり、a1及びσ1は付加パラメーターである)
の式を含む、請求項2に記載の方法。
【請求項4】
前記第1の微分値が前記第1の最大値に近い肩値を含むかどうかを決定することをさらに含む、請求項1に記載の方法。
【請求項5】
前記第1のパラメーター値を表示することをさらに含む、請求項2に記載の方法。
【請求項6】
さらに、下記:
前記修正された第1の微分値の第2、第3又は第4の最大値を決定し、ここで、該第2、第3又は第4の最大値は、第2、第3又は第4のパラメーターについての初期条件として使用され、並びに
前記決定された第2、第3又は第4のパラメーターが、前記DNA試料の第2の融解温度Tm2、第3の融解温度Tm3又は第4の融解温度Tm4を表す前記第2、第3又は第4のパラメーターを出力する
工程を含む、請求項1に記載の方法。
【請求項7】
前記ガウシアン混合モデルが、形式:
【数2】
(式中、μ1は第1のパラメーターであり、μ2は第2のパラメーターであり、a1、σ1、a2及びσ2は付加パラメーターである)
の式を含む、請求項6に記載の方法。
【請求項8】
前記ガウシアン混合モデルが、形式:
【数3】
(式中、μ1は第1のパラメーターであり、μ2は第2のパラメーターであり、μ3は第3のパラメーターであり、a1、σ1、a2、σ2、a3及びσ3は付加パラメーターである)
の式を含む、請求項6に記載の方法。
【請求項9】
前記ガウシアン混合モデルが、形式:
【数4】
(式中、μ1は第1のパラメーターであり、μ2は第2のパラメーターであり、μ3は第3のパラメーターであり、μ4は第4のパラメーターであり、a1、σ1、a2、σ2、a3、σ3、a4及びσ4は付加パラメーターである)
の式を含む、請求項6に記載の方法。
【請求項10】
DNAの融解温度Tmを決定する処理装置を制御するコードを含むコンピュータ読み取り可能な媒体であって、該コードは、下記:
各々が一対の座標値を有する複数のデータポイントを含む、DNA試料についての融解曲線を表すデータセットを受け入れ、
該融解曲線のデータポイントについての第1の微分値を数値的に決定し、
該第1の微分値に対して基準を決定し、
該第1の微分値から基準を差し引いて、修正された(modified)第1の微分値を生じさせ、
該修正された第1の微分値の第1の最大値を決定し、並びに
該DNA試料の融解温度Tmを表す該第1の最大値を出力する
という指示を含む媒体。
【請求項11】
前記コードが、請求項2〜9のいずれか1項に記載の工程を実行するために適応される、請求項10に記載のコンピュータ読み取り可能な媒体。
【請求項12】
動的ポリメラーゼ連鎖反応(PCR)システムであって、下記:
各々が一対の座標値を有する複数のデータポイントを含む、DNA融解曲線を表す融解曲線データセットを生じさせる動的PCR分析モジュール;並びに
下記:
各々が一対の座標値を有する複数のデータポイントを含む、DNA試料についての融解曲線を表すデータセットを受け入れ、
該融解曲線のデータポイントについての第1の微分値を数値的に決定し、
該第1の微分値に対して基準を決定し、
該第1の微分値から基準を差し引いて、修正された(modified)第1の微分値を生じさせ、
該修正された第1の微分値の第1の最大値を決定し、及び
該DNA試料の融解温度Tmを表す該第1の最大値を出力する
によって、Tm値を決定するために該融解曲線データセットを処理するように適用される情報(intelligence)モジュール
を含むシステム。
【請求項13】
前記動的PCR分析モジュールが動的サーモサイクラーデバイスにあり、前記情報モジュールが該分析モジュールに伝達可能に連結されたプロセッサーを含むか、又は前記情報モジュールがネットワーク接続若しくは直接的な接続の1つによって該分析モジュールに連結されたコンピュータシステムにあるプロセッサーを含む、請求項12に記載のシステム。
【請求項14】
前記出力が表示モジュール上にTm値を表示することを含む、該表示モジュールをさらに含む、請求項12に記載のシステム。
【請求項15】
前記システムが、請求項2〜9のいずれか1項の工程を実行するために適応される、請求項12に記載のシステム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7a】
【図7b】
【図8a】
【図8b】
【図9a】
【図9b】
【図10a】
【図10b】
【図11a】
【図11b】
【図12】
【図13】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7a】
【図7b】
【図8a】
【図8b】
【図9a】
【図9b】
【図10a】
【図10b】
【図11a】
【図11b】
【図12】
【図13】
【公開番号】特開2010−113711(P2010−113711A)
【公開日】平成22年5月20日(2010.5.20)
【国際特許分類】
【外国語出願】
【出願番号】特願2009−239192(P2009−239192)
【出願日】平成21年10月16日(2009.10.16)
【出願人】(591003013)エフ.ホフマン−ラ ロシュ アーゲー (1,754)
【氏名又は名称原語表記】F. HOFFMANN−LA ROCHE AKTIENGESELLSCHAFT
【Fターム(参考)】
【公開日】平成22年5月20日(2010.5.20)
【国際特許分類】
【出願番号】特願2009−239192(P2009−239192)
【出願日】平成21年10月16日(2009.10.16)
【出願人】(591003013)エフ.ホフマン−ラ ロシュ アーゲー (1,754)
【氏名又は名称原語表記】F. HOFFMANN−LA ROCHE AKTIENGESELLSCHAFT
【Fターム(参考)】
[ Back to top ]