融解曲線の自動解析システムおよび自動解析法
実験的な融解曲線を、真の融解曲線とバックグラウンド蛍光の和としてモデル化する。実験的な融解曲線データおよびバックグラウンド信号のモデルに基づいて偏差関数を生成することができる。この偏差関数は、その実験曲線のある範囲を複数の窓に分割することによって生成することができる。窓ごとに、バックグラウンド信号のモデルと実験的な融解曲線データの間のフィットを計算することができる。この偏差関数は、その結果得られるフィットパラメータから形成することができる。この偏差関数はバックグラウンド信号補償を含むことができ、そのため、データ視覚化、クラスタリング、ジェノタイピング、スキャニング、ネガティブ試料除去など、さまざまな融解曲線解析操作において、この偏差関数を使用することができる。この偏差関数を使用して、自動バックグラウンド補正プロセスを提供することができる。バックグラウンド補正された融解曲線をさらに処理して、凝集信号を除去することができる。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、融解曲線の解析に関し、具体的には、核酸、タンパク質などの化合物の融解曲線の自動解析システムおよび自動解析法に関する。
【発明の概要】
【発明が解決しようとする課題】
【0002】
【課題を解決するための手段】
【0003】
【図面の簡単な説明】
【0004】
【図1】図1は、融解曲線の直線ベースライン解析を示すプロットである。
【図2】図2は、複数の遺伝子型および低温における指数バックグラウンド蛍光を示す、非標識プローブ融解実験の未変更の実験的な融解曲線のプロットである。
【図3】図3は、実験的な融解曲線の偏差関数を生成する方法の一実施形態の流れ図である。
【図4】図4は、ヘアピン構造の例示的な未変更の実験的な融解曲線のプロットを示す図である。
【図5】図5は、図4の融解曲線の導関数プロットを示す図である。
【図6】図6は、指数バックグラウンド差引き後の図4の融解曲線の導関数プロットを示す図である。
【図7】図7は、図4に示したデータの偏差関数のプロットを示す図である。
【図8】図8は、図4に示したデータの指数バックグラウンド差引き後の正規化された融解曲線のプロットを示す図である。
【図9】図9は、図4に示したデータの積分された偏差関数のプロットを示す図である。
【図10】図10は、多重ジェノタイピングのための指数バックグラウンド差引き後の融解曲線データの導関数プロットを示す図である。
【図11】図11は、図10に示した融解曲線データの偏差プロットを示す図である。
【図12A】図12Aは、平滑化された例示的なタンパク質融解曲線を示す図である。
【図12B】図12Bは、図12Aの平滑化されたタンパク質融解曲線の導関数プロットを示す図である。
【図12C】図12Cは、図12Aのタンパク質融解曲線データの偏差関数プロットを示す図である。
【図12D】図12Dは、バックグラウンド補正後の導関数融解曲線を示す図である。
【図13】図13は、図12Aのタンパク質融解曲線の正規化されたアンフォールディング曲線の導関数プロットを示す図である。
【図14A】図14Aは、平滑化された例示的なタンパク質融解曲線を示す図である。
【図14B】図14Bは、図14Aの平滑化されたタンパク質融解曲線の導関数プロットを示す図である。
【図14C】図14Cは、図14Aのタンパク質融解曲線データの偏差関数プロットを示す図である。
【図14D】図14Dは、バックグラウンド補正後の導関数融解曲線を示す図である。
【図15】図15は、図14Aのタンパク質融解曲線の正規化されたアンフォールディング曲線の導関数プロットを示す図である。
【図16】図16は、偏差解析を使用してネガティブ試料を特定する方法の一実施形態の流れ図である。
【図17】図17は、偏差解析を使用してネガティブ試料を特定する方法の他の実施形態の流れ図である。
【図18】図18は、融解曲線のバックグラウンド領域および/または融解領域を自動的に特定する方法の一実施形態の流れ図である。
【図19】図19は、例示的な偏差関数のプロットを示す図である。
【図20】図20は、アンプリコンバックグラウンド領域および/またはアンプリコン融解領域ならびにプローブバックグラウンド領域および/またはプローブ融解領域を自動的に特定する方法の一実施形態の流れ図である。
【図21A】図21Aは、アンプリコン融解領域およびプローブ融解領域を含む融解曲線の偏差関数のプロットである。
【図21B】図21Bは、プローブ融解領域の偏差関数のプロットである。
【図21C】図21Cは、カーソルプローブ領域を特定するプロセスの他の例を示す図である。
【図22】図22は、自動バックグラウンド差引き法の一実施形態の流れ図である。
【図23A】図23Aは、例示的な理想曲線および融解曲線を示す図である。
【図23B】図23Bは、例示的な理想曲線および融解曲線を示す図である。
【図24】図24は、自動バックグラウンド差引き法の他の実施形態の流れ図である。
【図25】図25は、不偏階層法によって正確に自動クラスタリングされた偏差プロットを示す図である。
【図26】図26は、不偏階層法によって正確にクラスタリングされていない、指数バックグランド除去後の導関数プロットを示す図である。
【図27】図27は、PCR融解解析後のネガティブ試料を含む一組の未変更の融解曲線を示す図である。
【図28】図28は、振幅カットオフ技法を使用したネガティブ試料排除後の一組のネガティブ試料インジケータを示す図である。
【図29】図29は、偏差解析を使用したネガティブ試料排除後の一組の融解曲線を示す図である。
【図30】図30は、偏差解析を使用したネガティブ試料排除後の一組のネガティブ試料インジケータを示す図である。
【図31】図31は、偏差解析によるプローブ融解領域およびアンプリコン融解領域の自動位置設定後の偏差プロットを示す図である。
【図32】図32は、一組のネガティブ試料/クラスタメンバシップインジケータを示す図である。
【図33】図33は、融解曲線データを解析するシステムのブロック図である。
【発明を実施するための形態】
【0005】
追加の態様および利点は、添付図面を参照して展開される好ましい実施形態の以下の詳細な説明から明らかになるであろう。
【0006】
融解曲線の解析は、さまざまな物質の研究に役立つ。特に、核酸は、融解曲線によって広範囲に研究されており、融解曲線の差異によりさまざまな核酸配列を示すことができる。融解曲線は、タンパク質の結合の研究でも使用されており、特性融解曲線が、特定のリガンドに対するタンパク質の結合親和性を示す。本明細書では核酸およびタンパク質の融解を参照するが、他の化合物の融解曲線の解析も本開示の範囲に含まれることが理解される。
【0007】
本明細書の一例では、融解曲線の解析が、核酸生成物の特定および/または構造に関する情報を提供する。核酸構造内の(例えば2本のDNA鎖間の)塩基−塩基水素結合を切るのに必要なエネルギー量は、その核酸生成物の構造に関連した因子に依存することがある。このような因子には、限定はされないが、長さ、相補性、グアニン−シトシン(GC)含量量、反復配列の有無などが含まれる。
【0008】
融解曲線は、核酸生成物を含む溶液にエネルギー勾配を与える(例えば核酸生成物を含む溶液を加熱する)ことによって得ることができる。エネルギーが加えられ、溶液の温度が上昇すると、核酸生成物は変性する(例えば解離する)ことがある。この例は温度の上昇に関するが、当技術分野では、他の融解法、例えばイオン濃度を変化させる勾配も知られている。融解曲線は、この解離が起こる程度を、温度(または他の融解勾配)の関数として測定することによって生成することができる。例えば、参照によって本明細書に組み込まれる米国特許第5,871,908号を参照されたい。したがって、本明細書で使用するとき、融解曲線は、温度、イオン濃度などの融解勾配に反応して化合物がその構造を変化させる程度(例えば、核酸生成物に加えられたエネルギー勾配に応じて核酸生成物中の鎖が解離する程度)を定量化する測定値を含む任意のデータセットを指すことがある。
【0009】
ある実施形態では、この解離を電気光学的に測定する。結合染料を含む溶液に核酸生成物(または他の化合物)を入れる。この結合染料は、2本鎖DNA(dsDNA)に結合しているときに電気光学(EO)放射を放出するように適合されている。生成物が解離すると、結合染料はEO放射の放出をやめる(または、後に論じるように、低レベルのEO放射を放出する)。これに応じて、溶液にエネルギーを加えたときに(例えば溶液の温度を上昇させたときに)溶液から放出されるEO放射(蛍光)の測定値を取得することにより、融解曲線を生成する。さらに、本開示は、融解時に蛍光が低減する実施形態だけに限定されないことが理解される。G−クエンチング単標識プローブ(G−クエンチング・シングルラベル・プローブ)を使用する実施形態など、いくつかの実施形態では、融解すると蛍光信号が増大する(例えば米国特許第6,635,427号参照)。
【0010】
したがって、融解曲線は、一連のEO放射測定値(例えば溶液から放出された蛍光の測定値)を温度の関数として含むことがある。しかしながら、他の方法で取得した解離測定値を含む他の融解曲線に、本開示の教示を適用することもできる。したがって、融解曲線データを取得する(例えば、核酸の解離を定量化する測定値を、溶液に加えたエネルギーの関数として取得する)特定の方法および/または技法に、本開示が限定されると解釈すべきではない。
【0011】
上で論じたように、融解曲線から、核酸生成物の構造に関する情報を推測することができる。そのため、融解曲線データを使用して、ポリメラーゼ連鎖反応(PCR)生成物を調べることができる。PCR生成物の融解曲線は、結合染料の存在下でPCR反応の生成物を加熱することによって取得することができる。上で論じたように、この結合染料は、dsDNAに結合しているときの方が、1本鎖DNA(ssDNA)に結合しているときよりも強い蛍光を発するように適合されている。したがって、PCR生成物が主にdsDNAとして存在する比較的に低い温度において、この溶液は、比較的に高いレベルの蛍光を発する。溶液の温度を上昇させると、生成物は、2本のssDNAに解離(例えば変性)し、それによって、溶液は、より低レベルの蛍光を発する。PCR生成物は、dsDNA状態からssDNA状態への相転移を、幅の狭い温度窓内で経験することがある。前述のとおり、この転移は、溶液が発する蛍光を低減させることがある。この転移が起こる温度窓を、融解領域、融解転移および/または融解窓と呼ぶことがある。
【0012】
このような融解曲線実験で一般的に使用される結合染料には、温度に応じて、溶液中で自ら蛍光を発するものがある。例えば、dsDNAが存在しない場合、(アイダホ・テクノロジー社から販売されており、アイダホ・テクノロジー社の登録商標である)LCGreen(登録商標) Plusなどの結合染料の蛍光信号は、温度の関数として単調に低減する。したがって、前述の方法で(例えば核酸生成物と結合染料の溶液を加熱したときに放出されたEO放射を測定することによって)取得した融解曲線は、dsDNA生成物に結合した染料によって放出された蛍光と、溶液中の結合染料および/またはssDNAに結合した染料が自ら発したバックグラウンド蛍光との組合せを含むことがある。
【0013】
したがって、結合染料の存在下で核酸生成物を融解させることによって取得した生の測定蛍光信号は、生成物の融解(溶液を加熱したときのdsDNAからssDNAへの生成物の解離)に起因する蛍光とバックグラウンド蛍光の和としてモデル化することができる。式1は、「真の」融解曲線M(T)(例えば核酸生成物の融解によって生じた蛍光)とバックグラウンド蛍光B(T)の和を含む実験的な融解曲線F(T)を示す。
【0014】
【数1】
【0015】
上で論じたように、実験的な融解曲線F(T)から、核酸生成物に関する情報(例えば生成物の構造、組成など)を推測し、および/または求めることができる。しかしながら、実験的な融解曲線データF(T)の解析は、そのバックグラウンド蛍光B(T)成分によって複雑になることがある。バックグラウンド蛍光B(T)信号をモデル化し、実験的な融解曲線データF(T)からバックグラウンド蛍光B(T)信号を除去するさまざまなシステムおよび方法が開発されている。
【0016】
一例では、バックグラウンド蛍光B(T)が1次関数としてモデル化される。一般的な多くの染料の蛍光は、温度とともに直線的に低減する(ある温度範囲にわたって温度の上昇とともに低減する)。核酸融解曲線では、融解領域内で、生成物の蛍光が急激に低減する。しかしながら、融解領域の外側では、温度に伴う蛍光変化がほぼ直線的である。したがって、融解転移前の直線ベースラインおよび融解転移後の直線ベースラインを外挿することによって、実験的な融解曲線を正規化することができる。
【0017】
図1は、直線ベースラインL1(T)およびL0(T)を有する実験的な融解曲線F(T)を示す。正規化された融解曲線は、上ベースラインと下ベースラインの差に対する、下ベースライン(L0(T))よりも上の実験的な融解曲線F(T)の高さの比として計算することができる。上ベースラインと下ベースラインの勾配は同じであることも、同じでないこともある。
【0018】
図2は、非標識プローブの存在下で非対称PCR反応の生成物を融解させることによって得た融解曲線のプロットを示す。この曲線は、非標識プローブの融解転移とPCR生成物の融解転移の両方を含む。図2に示すように、融解曲線の非直線性のため、上直線ベースラインと下直線ベースラインとが融解曲線よりも下で交差し、図1に示した1次補償方程式の分母がゼロになるため、前述の直線ベースライン法の使用には問題がある。
【0019】
代替手法では、指数減衰関数を使用して、バックグラウンド蛍光B(T)をモデル化する。指数バックグラウンドモデル化および指数バックグラウンド差引き(subtraction)のためのシステムおよび方法は、参照によってその全体が参照によって組み込まれる2006年9月20日に出願された「MELTING CURVE ANALYSIS WITH EXPONENTIAL BACKGROUND SUBTRACTION」という名称のPCT出願第WO2007/035806号に記載されている。
【0020】
経験的証拠は、ある温度(例えば85℃よりも低い温度)では、結合染料からのバックグラウンド蛍光信号を、以下の形の減衰指数関数として正確にモデル化することができることを示している。
【0021】
【数2】
【0022】
式2で、Cおよびaは、融解曲線データF(T)からフィット(fit)させるための定数、TLは、指数部の引数に対するシフティングパラメータ(カーソル位置(後述))であり、一般に、融解曲線F(T)内の融解転移よりも下に位置する。
【0023】
とりわけ、融解領域の前後ではバックグラウンド蛍光のスケールが変化するため、式2のバックグラウンド蛍光モデルは、観察された蛍光のデータに直接にはフィットしない可能性がある。バックグラウンド蛍光B(T)をモデル化するのに使用する指数関数の特性(例えば指数関数の導関数が指数関数であること)に基づいて、式3を得ることができる。
【0024】
【数3】
【0025】
このバックグラウンド蛍光モデルによれば、融解転移領域の前後で、生成物融解関数が一定である。融解転移領域を間に挟むように2つの温度を選択することができる。融解転移領域の前に第1の温度TLを選択し、融解転移領域の後に第2の温度TRを選択することができる。本明細書ではこれらの温度を「正規化カーソル」と呼ぶことがある。式2と式3を結合することによって、正規化カーソルTLおよびTRを使用して、指数バックグラウンド信号B(T)のモデルを構築することができる。
【0026】
【数4a】
【0027】
【数4b】
【0028】
観察された蛍光データの導関数は、例えば中心差分法(セントラル・ディラレンシング法)を使用して近似することができる。式4aおよび4bを、aおよびCについて解くと、式5aおよび5bが得られる。
【0029】
【数5a】
【0030】
【数5b】
【0031】
式5aおよび5bの結果を使用して、バックグラウンド蛍光B(T)のモデルを構築することができる。実験的な融解曲線F(T)からこのモデルを差し引くと、「真の」融解曲線M(T)が得られる。
【0032】
【数6】
【0033】
一般に、操作者は、バックグラウンド蛍光B(T)をモデル化するために(例えば式3〜6で)使用する正規化カーソル位置(TLおよびTR)を手動で選択する。この操作は、融解曲線データについて事前にある程度の知識を有し、および/または、生の実験的な融解曲線データF(T)を適切に解釈する技能および経験を有する(例えば融解転移がどこで起こったのかなどが分かる)ことを操作者に要求することがある。本明細書に開示するシステムおよび方法は、融解曲線データF(T)内のバックグラウンド領域と融解領域とを、偏差解析(後述)を使用して特定することによって、実験的な融解曲線F(T)の自動解析を提供することができる。したがって、本明細書に開示する偏差解析システムおよび方法は、この手動操作の必要性を回避する(例えば、融解領域についての事前の知識および/または融解領域の手動推定の必要性を排除する)ことができる。
【0034】
用途によっては、融解曲線データが、正規化された蛍光曲線として示され、この正規化された蛍光曲線では、融解曲線M(T)が、例えば1(完全にアニールしている)から0(完全に解離している)までに再スケーリングされる。ある実施形態では、以下の変換を使用して、融解曲線M(T)がN(T)に正規化される。
【0035】
【数7】
【0036】
1次バックグラウンドモデル化/バックグラウンド除去技法および指数バックグラウンドモデル化/バックグラウンド除去技法は、多くの用途で有用であることがある。例えば、1次モデルは、80から95℃までの間のTmを有するPCR生成物に対する良好なフィットであり、指数モデルは、解析する温度範囲が20℃以下であるときに良好なフィットである。しかしながら、温度が80℃未満であり、および/または解析する温度範囲が20℃より高いとき、(緩衝液、dNTP、プライマなどによって生成された蛍光を含む)バックグラウンド蛍光B(T)信号は、1次モデルにも、指数モデルにも従わない可能性がある。具体的には、80℃未満の温度は、予想されるバックグラウンドからの偏差を示し、70℃未満の温度は、よりいっそう大きな偏差を示し、60℃、50℃および40℃では偏差が次第に増大する。温度範囲に関して、20℃より高い範囲でも、バックグラウンドは、単純な1次および指数モデルから外れることがある。解析範囲が、30℃、40℃、50℃および60℃と増大するにつれて、1次または指数モデルからのバックグラウンドの偏差は増大する。これらの低温解析条件および/または範囲の広い解析条件下においては、後述する偏差解析が、固定されたモデル化に対する良好な代替となる可能性がある。例えば、非標識プローブ、スナップバック・プライマおよびマルチプレックス・スモール・アンプリコンの融解は全て、しばしば20℃より高い範囲で起こり、一部は80℃未満の温度で起こる複数の融解転移に帰着しうる。非標識プローブ、スナップバックプライマおよびマルチプレックススモールアンプリコンの融解に関する追加の情報は、参照によってそれらの全体が本明細書に組み込まれる「L.Zhou他、Snapback Primer Genotyping with Saturating DNA Dye and Melting Analysis、54(10)Clin.Chem.1648〜56(2008年10月)」、米国特許第7,387,887号、および2008年3月7日に出願された「PRIMERS FOR MELTING ANALYSIS」という名称のPCT公開第WO2008/109823号に出ている。
【0037】
核酸融解曲線は、核酸の配列に関する情報を得るために使用されているが、タンパク質融解曲線はしばしば、タンパク質の熱力学的安定性を測定するために使用される。タンパク質の熱安定性を評価するためには、タンパク質のネイティブの構造が熱力学的に安定である温度よりも高い温度まで温度を上昇させる。タンパク質はアンフォールドし、以前はタンパク質構造中に隠れていた疎水性アミノ酸残基が露出する。タンパク質の融解では、熱傾斜の中点としてしばしばTmが定義され、Tmは、ネイティブの形の自由エネルギーとネイティブでない形の自由エネルギーが等しい温度を表す。例えば、タンパク質を、単独で、およびリガンドの存在下で融解させ、安定性の摂動を使用して、ライブラリをスクリーニングすることができる。追加の情報は、参照によってその全体が本明細書に組み込まれる「D.Matulis他、Thermodynamic Stability of Carbonic Anhydrase:Measurements of Binding Affinity and Stoichiometry Using ThermoFluor、Biochemistry 2005、44、5258〜5266」に出ている。
【0038】
上で論じた核酸融解曲線の解析と同様に、タンパク質融解曲線も、式1のF(T)=M(T)+B(T)の形で表すことができる。典型的なタンパク質融解と典型な核酸融解の主な違いB(T)は、タンパク質融解では、タンパク質が変性するにつれてEO放射信号が増大することである。典型的なタンパク質融解曲線を図12Aおよび14Aに示す。図12Aの例では、温度が40度に向かって上昇すると、熱消光(サーマル・クエンチング)によって蛍光が低減する。タンパク質に応じて、アンフォールディングは通常40から60℃までの間の温度で始まり、露出した疎水性残基により多くの染料が結合するため、このアンフォールディングは蛍光の増大として観察される。最終的には、タンパク質の凝集および沈殿が(通常は45から75℃までの間で)起こり、それに熱消光が加わるため、蛍光は再び低減する。図12Aには、一般的に観察される安定性および強度の範囲を示す、よく知られている6種類のタンパク質の融解が示されており、濃度は全て2.25μMである。
【0039】
経験的証拠は、融解転移よりも高い高温(タンパク質によって例えば60〜90℃)では、結合染料からの残留蛍光を、下の形の2次多項式によってモデル化することができることを示している。
【0040】
【数8】
【0041】
式8で、ai、biおよびciは、実験的な融解曲線データF(T)からフィットさせるための定数である。次いで、タンパク質融解曲線を、前述のF(T)=M(T)+B(T)の形で表すことができる。式1を参照されたい。式8の定数は一般に、バックグラウンド領域内の連続するある温度範囲にわたって集めた蛍光データに対する最小2乗フィットによって見つける。
【0042】
本開示は、バックグラウンド蛍光信号の例示的な指数モデルおよび2次モデルの使用を教示するが、この点に関して本開示は限定されない。当業者には理解されるであろうが、当技術分野で知られている任意のモデル化技法および/またはモデル化形態とともに機能するように、本明細書に教示する偏差関数(および関連解析技法)を適合させることができる。
【0043】
前述のとおり、操作者は一般に、融解曲線中のバックグラウンド蛍光B(T)を(例えば式8において)モデル化するために使用する温度領域を手動で選択する。この操作は、融解曲線データについて事前にある程度の知識を有し、および/または、生の実験的な融解曲線データF(T)を適切に解釈する技能および経験を有する(例えば融解転移がどこで起こったのかなどが分かる)ことを操作者に要求することがある。本明細書に開示するシステムおよび方法は、融解曲線データF(T)内のバックグラウンド領域と融解領域とを、偏差解析(後述)を使用して特定することによって、実験的な融解曲線F(T)の自動解析を提供することができる。したがって、本明細書に開示する偏差解析システムおよび方法は、この手動操作の必要性を回避する(例えば、融解領域およびバックグラウンド領域についての事前の知識ならびに/または融解領域およびバックグラウンド領域の手動推定の必要性を排除する)ことができる。
【0044】
融解曲線データは、導関数の形で(例えば正規化された融解曲線N(T)の導関数または負の導関数として)表すことができる。しかしながら、融解曲線M(T)は、常に等間隔であるとは限らない離散的な温度測定で集められ、少量の雑音を含むことがあるため、データを(例えば3次元平滑化スプライン(3次元スムージングスプライン)を使用して)平滑化することができ、および/または均一な温度測定値で再サンプリングすることができる。中心差分技法または他の技法を使用して、融解曲線の導関数を近似することができる。単一の融解転移を含む融解曲線については、導関数曲線のピークを「融解転移」ないしTMとして示すことができる。複数の融解転移を含む融解曲線については、融解転移ピークを特定し、および/またはそれに応じて番号(例えばTM1、TM2、...、TMn)をつけることができる。
【0045】
融解曲線データを、偏差関数に換算して表示し、および/または解析することができる。この偏差関数は、実験的な融解曲線データF(T)がバックグラウンド蛍光B(T)のモデルから外れる程度を定量化することができる。上で論じたとおり、ある実施形態では、とりわけ指数減衰関数を使用して、バックグラウンド蛍光B(T)をモデル化する(例えば融解曲線の「理想」モデル化)。したがって、偏差関数は、実験的な融解曲線F(T)の指数減衰率と(例えば上式2に基づく)バックグラウンド蛍光モデルの指数減衰率との間の偏差に基づくことがある。
【0046】
偏差解析は、一連の温度窓内において実験的な融解曲線F(T)を予め定義された関数にフィットさせることによって計算した複数のフィットパラメータを生成することを含むことができる。したがって、偏差関数(本明細書ではE(T)と称する)は、実験的な融解曲線F(T)が予め定義された関数から外れる程度を、温度の関数として定量化することができる。
【0047】
後に論じるが、融解曲線の偏差関数E(T)は、融解曲線データを(例えば検査、視覚化、作図などによって)直接に解析するために使用することができ、および/または別の融解曲線解析プロセスもしくはシステムで使用することもできる。本明細書に開示した偏差関数E(T)の用途には、限定はされないが、(例えばジェノタイピング、スキャニングなどに使用する融解曲線間の差異を強調するために)融解曲線データを表示し、作図すること、ネガティブ試料(例えばネガティブコントロール試料、無効データなど)を自動的に特定すること、融解領域および/またはバックグラウンド領域の特定を自動化すること、融解曲線クラスタリングを自動化すること、ジェノタイピングおよび/またはスキャニング操作を自動化すること、バックグラウンド蛍光B(T)の差引きを自動化することなどがある。しかしながら、本明細書に開示された偏差解析システムおよび偏差解析法を、別の融解曲線用途で使用することもできることを当業者なら理解するであろう。したがって、偏差解析を生成し、および/または本明細書に開示された融解曲線解析に偏差解析を適用するためのシステムおよび方法が、特定の一組の用途に限定されると解釈すべきではない。
【0048】
偏差関数E(T)の生成は、実験的な融解曲線F(T)と所定の関数との間のランニングフィットを計算することを含むことができる。この所定の関数は、実験的な融解曲線F(T)内のバックグラウンド蛍光B(T)のモデル(本明細書では理想融解曲線と呼ぶ)を含むことができ、このモデルは、上で論じたように、指数減衰関数を使用して近似することができる。式2〜6を参照されたい。
【0049】
実験的な融解曲線F(T)は、温度区間[Tmin,Tmax]内で定義することができる。ランニングフィットは、実験的な融解曲線の温度区間(例えば[Tmin,Tmax]または[Tmin,Tmax−W])内の幅がそれぞれWの複数の温度窓(TW)内で実行することができる。
【0050】
【数9】
【0051】
式9で、TWLは、温度窓TWの最低温度または「開始」温度を表す。温度窓TWの幅Wは、融解曲線データの分解能(例えば実験的な融解曲線F(T)データの密度および/または精度)ならびに/または融解曲線データから抽出する特徴に応じて選択することができる。幅Wは、温度窓TW内の雑音のランダム変化を平滑化するために十分に大きく、同時に、関心の特徴を分解するために十分に小さくなるように選択することができる。
【0052】
偏差関数E(T)は、区間[Tmin+W/2,Tmax−W/2]のTiによって表される均一な離散化に対して定義される。例えば、温度窓TW間の温度間隔ΔTを下式として定義することができる。
【0053】
【数10】
【0054】
ΔT(温度窓TW間の間隔)の選択は、実験的な融解曲線F(T)の分解能、性能考慮事項、実験的な融解曲線F(T)から抽出する特徴の性質などに基づくことができる。温度間隔ΔTは、連続する任意の2つの融解曲線データ点間の最大差よりも大きく(例えば実験的な融解曲線F(T)内の最も粗い温度分解能よりも大きく)なるように選択することができる。
【0055】
各温度窓TW内で、予め定義された関数と実験的な融解曲線F(T)の間のフィットを計算することができる。フィットごとにフィットパラメータを得ることができ、そのフィットパラメータを、温度窓TWに関連づけられたある点(温度値)に割り当てることができる。特定の温度窓TWに関連づけられた温度点を、(範囲[Ti−W/2,Ti+W/2]を含む温度窓に対する)Tiと呼ぶことがある。
【0056】
例えば、この形の偏差関数は、核酸融解曲線に対して適している。上で論じたように、偏差関数E(T)を生成するために使用するこの予め定義された関数は、実験的な融解曲線内のバックグラウンド蛍光B(T)(例えば「理想」融解曲線)をモデル化するように構成された指数減衰関数とすることができる。この予め定義された関数が指数減衰関数を含む場合、前記フィットは、下式のようになるように、パラメータCiおよび/またはaiを選択することを含むことができる。
【0057】
【数11】
【0058】
式11のフィットは、例えば最小2乗フィッティング技法など、当技術分野で知られている任意のフィッティング技法を使用して実施することができる。
【0059】
ある実施形態では、数値的に安定させるために、指数関数形の式11を、温度窓TW内の左端の温度値にシフトさせる(例えば左へシフトさせる)。
【0060】
指数減衰因子aiを使用して、フィットパラメータTiごとに下式のようになるように、偏差関数E(T)を形成することができる。
【0061】
【数12】
【0062】
上で示したとおり、式12の偏差関数は、実験的な融解曲線F(T)の指数減衰因子と「理想」融解曲線との間の偏差を温度の関数として定量化する。純粋な指数バックグラウンドについては、指数減衰因子が定数となることがある。したがって、その定数からの偏差を、2重鎖(duplex)融解(例えばバックグラウンド減衰と組み合わさった核酸生成物の融解)の結果とすることができる。ある実施形態では、この指数関数からの偏差を表すのに、偏差関数の最小値を偏差関数から差し引く。複数の曲線を、ピーク高さによって互いに正規化することができる(例えばE(T)−min{E(T)}/max{E(T)}−min{E(T)})。あるいは、またはこれに加えて、それぞれの曲線を数値積分で除することによって、全ピーク面積による正規化を実行することもできる。(正規化された融解曲線に類似の)積分された偏差プロットE(T)は全てのプロットが同じ値から始まり、同じ値で終わるため、ピーク面積正規化の方が有利であることがある。
【0063】
あるいは、またはこれに加えて、振幅定数Ci、ならびに/または振幅因子と減衰因子Ciおよび/またはaiの組合せを、偏差関数E(T)に組み込むこともできる。他の実施形態では、偏差関数が、融解曲線データとバックグラウンド蛍光B(T)の他のモデル(例えば2次モデル、離散モデルなど)との間の偏差を定量化する。したがって、本明細書に開示した偏差関数が特定の所定のフィット関数に限定されると解釈すべきではない。
【0064】
タンパク質融解曲線に関しては、偏差関数E(T)の生成に使用する予め定義された関数を、例えば、実験的な融解曲線データ内のバックグラウンド蛍光B(T)をモデル化する2次多項式とすることができる。この予め定義された関数が2次多項式を含む場合、前記フィットは、下式のようになるように、パラメータai、biおよび/またはciを選択することを含むことができる。
【0065】
【数13】
【0066】
式13のフィットは、例えば最小2乗フィッティング技法など、当技術分野で知られている任意のフィッティング技法を使用して実施することができる。
【0067】
2次項に乗じる定数aiを使用して、フィットパラメータTiごとに下式のようになるように、偏差関数E(T)を形成することができる。
【0068】
【数14】
【0069】
上で示したとおり、式14の偏差関数は、実験的な融解曲線F(T)と「理想」融解曲線との間の偏差を温度の関数として定量化する。純粋な2次バックグラウンドについては、この振幅因子が定数となることがある。したがって、その定数からの偏差を、タンパク質のアンフォールディングの結果とすることができる。
【0070】
後に論じるように、(例えば融解領域/バックグラウンド領域の特定、バックグラウンド蛍光の除去、ネガティブ試料の特定、クラスタリングなどに使用する)実験的な融解曲線データF(T)の解析において、この偏差関数E(T)を使用することができる。偏差関数E(T)は、バックグラウンド蛍光B(T)のモデルと実験的な融解曲線F(T)の間の偏差を定量化することができるため、偏差関数E(T)は、本来的に、(場合によっては)(例えば1次バックグラウンド差引きおよび/または指数バックグラウンド差引きを使用する)専用バックグラウンド差引き処理に対する必要性を排除するバックグラウンド蛍光B(T)補償を含むことがある。
【0071】
図3は、実験的な融解曲線F(T)の偏差関数E(T)を生成する方法300の一実施形態を示す。ステップ310で、方法300を初期化する。この初期化は、方法300が必要とする資源を割り当て、および/または方法300が必要とする資源を初期化することを含むことができる。ある実施形態では、方法300を、コンピュータ可読記憶媒体上に記憶された命令および/または別個のソフトウェアモジュールとして具体化する。したがって、ステップ310の初期化は、コンピューティングデバイスが、それらの命令を読み取り、および/またはそれらの命令をメモリもしくは他のデバイスへロードすることを含むことができる。あるいは、またはこれに加えて、方法300は、1つまたは複数のプロセッサ、センサ、フィールドプログラマブルゲートアレイ、特定用途向け集積回路、ディジタル論理などの1つまたは複数のハードウェアコンポーネントを含むことができる。
【0072】
ステップ320で、方法300は、実験的な融解曲線F(T)を含む融解曲線データにアクセスする。
【0073】
ステップ330で、実験的な融解曲線F(T)の温度範囲を複数の温度窓TWに分割する。温度窓TWはそれぞれ、幅Wを有するように定義することができる。幅Wは、実験的な融解曲線F(T)の分解能および/または融解曲線データから抽出する特徴の性質に応じて、方法300(または方法300のユーザ)が選択することができる。上で論じたとおり、温度窓TWは、実験的な融解曲線F(T)の温度区間の均一な離散化を形成するように定義することができ、温度窓TW間の間隔を定義するΔTメトリックによっては互いに重なり合うことがある。
【0074】
ステップ340で、複数の温度窓TWのそれぞれの温度窓TWにわたって、方法300は反復する。したがって、ステップ340で、方法300は、処理すべき追加の温度窓TWがあるかどうかを判定し、処理すべき追加の温度窓TWがある場合には、フローはステップ342へ続き、ステップ342で、次の温度窓TWに対する偏差パラメータを計算し、処理すべき追加の温度窓TWがなければ、フローはステップ350へ続く。
【0075】
ステップ342で、(現在の温度窓TW内において)実験的な融解曲線F(T)と理想バックグラウンド蛍光のモデルとの間のフィットを計算する。上で論じたように、ある実施形態では、バックグラウンド蛍光を指数減衰関数としてモデル化する。実験的な融解曲線F(T)(例えば核酸融解曲線)と指数減衰関数の間のフィットの一例は、式11〜12に関して上に示されている。他の実施形態では、2次関数(または他のモデル)を使用してバックグラウンド蛍光をモデル化する。実験的な融解曲線(例えばタンパク質融解曲線)と2次モデルとの間のフィットの一例は、式13〜14に関して上に示されている。ステップ342はさらに、温度窓TWに対するフィットパラメータを求めることを含む。上で論じたように、数値的に安定させるために、フィッティングパラメータおよび/または窓を左へシフトさせることができる。
【0076】
ステップ350で、それぞれの温度窓TWのフィットパラメータを使用して偏差関数E(T)を生成する。ある実施形態では、ステップ350がさらに、偏差関数E(T)を正規化することを含む。
【0077】
ステップ360で、表示、追加の融解曲線解析などに対して、偏差関数E(T)を使用可能にする。ステップ360は、偏差関数E(T)の表現をコンピュータ可読媒体に記憶すること、その表現を、1人または数人のユーザに対して使用可能にすること、人間機械インタフェース(HMI)(例えばディスプレイ、プリンタなど)上にその表現を表示することなどを含むことができる。ステップ360はさらに、偏差関数E(T)を、別の1つもしくは複数のプロセスおよび/またはシステムに送信し、および/または、それらの別の1つもしくは複数のプロセスおよび/またはシステムに対して使用可能にすることを含むことができる。例えば、後に論じるように、自動ネガティブ試料特定プロセス、自動バックグラウンド差引きプロセスなどでこの偏差関数E(T)を使用することができる。
【0078】
前述の方法300に従って生成した偏差関数E(T)を使用して、実験的な融解曲線データF(T)を表示し、および/または、解析することができる。一例として、以下のオリゴヌクレオチドを標準法を使用して合成した。
【0079】
S5D:gttaaccACTGAtagcacgacgTCAGT (配列ID No.1)
【0080】
S7D:gttaaccACTGACAtagcacgacgTGTCAGT (配列ID No.2)
【0081】
S9D:gttaaccACTGACAGTtagcacgacgACTGTCAGT (配列ID No.3)
【0082】
上記のそれぞれのオリゴヌクレオチドの大文字の領域は相補型であり、そのため、これらのオリゴヌクレオチドは、低温において、5、7または9塩基対(bp)の幹領域を有する分子内ヘアピンを形成する。各ヘアピンには10塩基のループが存在する。各ヘアピンの短端は、ポリメラーゼの存在下で7塩基分延長され、それぞれ12、14または16塩基の幹領域を形成する。
【0083】
上に開示したオリゴヌクレオチドを含む溶液を調製することによって融解曲線データを生成した。この溶液は、最終体積10μl中に、PCR緩衝液(例えば50mMのトリス、pH 8.3、3mMのMgCl2、500μg/mlのウシ血清アルブミンを含む)中の1μMのそれぞれのオリゴヌクレオチド、200μMのそれぞれのdNTP、および染料(例えば、アイダホ・テクノロジー社から市販されている1X LCGreen(登録商標) Plus染料)を含む。一部の反応では、この溶液が、0.5UのKlenTaq 1(AB Peptides)を含み、その結果として、延長後に12、14および16塩基対のヘアピンを得た。HR−1(商標)高分解能融解機器(アイダホ・テクノロジー社から市販されている)内において、LightCycler(登録商標)毛細管(ロシュ・ダイアグノスティックス社から市販されており、ロシュ・ダイアグノスティックス社の登録商標である)を使用して、0.3℃/秒で、融解曲線データを得た。
【0084】
図4は、HR−1(商標)機器(アイダホ・テクノロジー社から市販されている)を使用して得た未変更の融解曲線の例を示す。HR−1(商標)は、利得を自動的に調整するように構成することができ、そのため、各融解曲線は蛍光値90から始まる。これらの曲線の指数関数的特徴は明白であり、75℃付近には、より長いヘアピンの融解挙動が示唆される。しかしながら、図4に示した未変更の曲線を解釈することは容易ではなく、より短いヘアピンの観測可能な2重鎖融解が起こったかどうかははっきりしない。
【0085】
図5は、図4に示したデータと同じデータの導関数プロットである。より高い温度における2重鎖転移がピークとしてはっきりと示されている。しかしながら、低温ではバックグラウンドが高いため、より低温での転移のTmを特定することは難しいことがある。したがって、追加の操作および/または処理(例えばバックグラウンド除去)なしでは、導関数プロットは、曲線中のバックグラウンド蛍光B(T)を適切に表現し、および/または調整することができないことがある。
【0086】
(例えば式1〜6に関して)上で論じたように、実験的な融解曲線のバックグラウンド蛍光B(T)成分を融解曲線F(T)から差し引き、それにより「真の」融解曲線M(T)の近似を得ることができる。上式1〜6を参照されたい。図18および24(後に論じる)は、とりわけ偏差解析を使用する自動バックグラウンド除去プロセスの例を提供する。
【0087】
図6は、指数バックグラウンド差引き後の図4および5のデータと同じデータの導関数プロットを示す。図6のプロットでは、全ての試料が融解転移を示しているが、バックグラウンド差引きの成果は理想的とは言えず、特に5bpヘアピン2重鎖でそうである。
【0088】
図3〜6のそれぞれの実験的な融解曲線の偏差関数E(T)を、(例えば式9〜14および/または図3の方法300を使用して)生成することができる。図7は、数値積分が1から0までの間で変化するように面積によって正規化した偏差関数E(T)のプロットである。図7に示すように、この偏差プロットはEm(T)によって示されている。後に論じるように、Em(T)は、各温度窓内で、偏差関数E(T)の最小値を偏差関数E(T)から差し引くようにして偏差関数E(T)から導き出される関数である。下式20を参照されたい。図7に示すように、偏差関数E(T)(図7の例ではEM(T))を使用すると、融解曲線データ内の関連する特徴がより際立ち、かつ容易に観測可能となる。例えば、図7は、47〜77℃の30℃の範囲にわたってヘアピンTmが明らかに散らばっていることを示している。予想どおり、より短い幹は、より長い幹よりも広い範囲にわたって融解し、全ての転移が示されている。偏差関数E(T)(または図7に示したEM(T))は本来的にバックグラウンド蛍光B(T)に対して適応するため、バックグラウンドは、全ての試料について適切に除去される。
【0089】
導関数プロットの代わりに、指数バックグラウンド差引き後の正規化された融解曲線を示すこともできる。このようにして解析したヘアピンデータを図8に示す。より高い温度ではそれらの融解曲線は妥当であるように見えるが、より低い温度では、予想されるものからのより大きな偏差が観察され、5塩基対2重鎖は、いくつかの範囲の温度で「物理的に不可能な」蛍光の増大を示す。
【0090】
図9は、図6〜8に示したデータと同じデータの(累積偏差の百分率として示された)積分された偏差プロットを示す。この場合には、予想どおり、長い2重鎖ほどより鮮明な転移を示しており、全ての曲線が理に適っているように見える。導関数/偏差プロットとして示されているのか、またはそれらの融解曲線/積分形として示されているかに関わらず、偏差関数E(T)を使用して生成されたプロットはよりロバストであることができ、大きな温度範囲にまたがる複数の曲線の比較を可能にする。
【0091】
別の例として、2つの温度コントロールキャリブレータを用いた少なくとも4つの単一塩基多様体の多重ジェノタイピングを、プローブなしで均一に実行する。多重プライマおよび内部コントロールに対するオリゴヌクレオチド配列は以前に、参照によってその全体が本明細書に組み込まれる「Seipp MT他、Quadruplex Genotyping of F5,F2,and MTHFR Variants in a Single Closed Tube by High−Resolution Amplicon Melting、54(a)Clin.Chem.108〜15(2008年1月)」によって発表されている。
【0092】
この例では、以下の50bp低温コントロールを使用した。
【0093】
ATCGTGATTTCTATAGTTATCTAAGTAGTTGGCATTAATAATTTCATTTT (配列ID No.4)
【0094】
上記配列の相補配列を、260nmにおける吸光度によって求めた等しいモル割合で上記配列と混合することができる。温度コントロールオリゴヌクレオチドは、3’−リン酸塩でブロックすることができる。以下の50bp高温コントロールを使用した。
【0095】
(G)CGGTC(A)GTCGG(C)CTAGCGGT(A)GCCAG(C)TGCGGC(A)CTGCGTG(A)CGCTCA(G) (配列ID No.5)
【0096】
このコントロールはさらに相補配列を含むことができ、括弧内の太字の塩基は、記載した鎖上でのみロックト核酸(LNA)である。
【0097】
1X LightCycler(登録商標) FastStart DNA Master HybProbe(ロシュ・ダイアグノスティックス社から市販されている)、それぞれ0.5μMのFVプライマ、それぞれ0.15μMのMTHFR1298および677プライマ、それぞれ0.16μMのF2プライマ、0.06μMの低温補正コントロールおよび0.08μMの高温補正コントロール、3.5mMのMgCl2(LightCycler(登録商標) Master溶液によって与えられた1mMのMgCl2を含む)、0.01U/μlの非耐熱性ウラシル−DNAグリコシラーゼ(ロシュ・ダイアグノスティックス社から市販されている)、1X LCGreen(登録商標) Plus(Idaho Technology,Inc.から市販されている)ならびにテンプレートDNA 20ngを含む10μlの体積中で、PCR増幅を実行した。
【0098】
この例において、PCRおよび高分解能融解実験は、LS32(商標)デバイス(アイダホ・テクノロジー社から市販されている)を使用して実行した。PCRは、最初に95℃を10分間維持し、続いて95℃、2秒、56℃、1秒および72℃、1秒のサイクルを15回、95℃、2秒、58℃、1秒および72℃、4秒のサイクルを25回繰り返すことによって実行した。温度サイクルが長くなることを避けるために、増幅中は蛍光の取得は行わなかった。PCR中の加熱および冷却ステップは全て、20℃/秒にプログラムされた傾斜率で実行した。PCR後、試料を(10℃/秒で)95℃から40℃まで冷却し、その後、55℃から95℃まで0.3℃/秒で蛍光を連続取得して、融解曲線を生成した。
【0099】
このようにして得た融解曲線データを、前述のとおりに処理して指数バックグラウンド蛍光B(T)を除去し、正規化した。図10は、処理後の融解曲線の導関数のプロットを示す。図10は、25℃の範囲にまたがる融解温度を示しており、68℃付近に低温コントロールピークを有する。しかしながら、高温コントロールの量を増大させた後でも、強度は低いことが明らかであり(92〜93℃における右側の小さなピーク)、このことは、高温コントロールピークを使用した温度調整を難しくする。
【0100】
前述の偏差解析技法(例えば式9〜14および/または図3の方法300)を適用することによって、より高温のピークの見かけの相対強度を増大させることができる。この例では、この融解曲線データを使用して対応するそれぞれの偏差関数E(T)を生成した。
【0101】
これらの偏差関数E(T)のプロットを(式20に関して後に論じるEm(T)の形で)図11に示す。図11に示すように、この偏差解析は、低温転移に対する高温転移の見かけの大きさを増大させる。これらの両方の解析法によって、中央の4つのピークの正確なジェノタイピングが達成された。
【0102】
図12Aは、6種類の異なるタンパク質、すなわち精製リゾチーム、C反応性タンパク質、IgG、クエン酸シンターゼ、リンゴ酸デヒドロゲナーゼおよびアルカリホスファターゼ(全てSigma−Aldrich(登録商標))の実験的な融解曲線を示す。これらのタンパク質をそれぞれ別個に、等張リン酸緩衝生理食塩水、pH 7.4(PBS)に対して透析し、PBS中で、5X SYPRO(登録商標) Orange(Invitrogen(登録商標)から市販されている)の存在下で、タンパク質濃度2.25μMまで希釈した。LightScanner(登録商標)(アイダホ・テクノロジー社から市販されている)内で、反応物10ulを、1℃/分で、35から99℃まで融解させた。3次平滑化スプラインを使用して実験的な融解曲線データを平滑化し、均一な温度測定値で再サンプリングした。
【0103】
図12Bは、図12Aの実験タンパク質融解曲線の導関数プロットを示す。これらの導関数は、中心差分技法を使用して近似することができる。
【0104】
図12Cは、図12Aの実験タンパク質融解曲線データの偏差関数E(T)プロットを示す。図12Cの偏差関数は、上で論じた式9〜14および/または方法300を使用して計算することができる。図12Cの例では、式13の2次多項式を使用してバックグラウンド蛍光信号をモデル化し、窓の幅は20データ点とした。偏差関数は、それぞれのフィットの2次項に乗じる定数(式13のai)から形成した。
【0105】
図12Dは、バックグラウンド補正後の導関数融解曲線を示す。バックグラウンド除去に関しては、カーソル位置を、84.4度および98.4度に手動でセットする(全試料について、これらのカーソル位置はともに、融解特徴よりも上のバックグラウンド領域内に位置する)。試料ごとに、前述のカーソル位置内で、(図12Aに示した)平滑な融解曲線データに2次多項式を、最小2乗フィッティングでフィットさせる。平滑化された実験的な融解曲線データからバックグラウンドモデルを差し引くことによって、バックグラウンドが補正された(以後、バックグラウンド補正された)融解曲線が形成される。次いで、バックグラウンド補正された融解曲線を正規化した。正規化後、融解曲線は一般にゼロ付近から始まり、融解転移の後、1付近で横ばいになる。図12Dに示したバックグラウンド補正され、正規化された曲線の導関数は、中心差分技法を使用して計算した。全てのタンパク質(低強度のリゾチームは除く)が、よく知られた形式の予想された融解転移を示す。
【0106】
図13は、指数関数的に減衰するバックグラウンドを除去し、さらに局所的に一定の凝集速度に起因する信号を除去した後の図12Aの融解曲線データのプロットを示す。タンパク質はしばしばより高い温度で凝集し、それにより、アンフォールディングによって以前に露出したさまざまな疎水性残基を覆い隠す。補正によって、その結果得られるデータが、バックグラウンドおよび凝集が補正されたアンフォールディング曲線を表すことがある。後に論じるように、図13に示したアンフォールディング曲線は、導関数をとる前に、補正された融解曲線データを最大値によって再スケーリングすることによって、0〜100の百分率範囲に正規化されている。
【0107】
図13のアンフォールディング曲線データは、式1の実験曲線のモデルを、タンパク質アンフォールディング領域間の凝集を考慮するように修正することによって得ることができる。
【0108】
【数15】
【0109】
式15で、U(T)は、アンフォールディング曲線、A(T)は凝集信号、B(T)はバックグラウンドEO放射を表す。アンフォールディング曲線U(T)は、低温および高温では実質的に平らであり、A(T)は、実質的に一定の負の勾配を有し、上で論じたように、B(T)は、指数減衰モデルに従うことが観察されている。これらの特性を使用して、バックグラウンド信号B(T)を特定し、除去することができる。後に、別のバックグラウンド除去プロセスが図22に関して説明される。
【0110】
このバックグラウンド除去プロセスは、アンフォールディング転移の始点の直ぐ下側の第1の温度TLを特定することを含み、この第1の温度TLでは、凝集曲線がゼロであり、アンフォールディング曲線が平らである。曲線のこの点において、測定される(負の)勾配は全て、バックグラウンドEO放射信号の勾配に帰すことができる(例えばB(T):F’(TL)=B’(TL))。TLの位置は、生の蛍光がもはや一定の指数減衰率を示さない温度を特定するためにDNA融解に対して使用したのと同じ指数偏差解析を使用して、低温範囲において検出することができる。上で論じた式11を参照されたい。
【0111】
アンフォールディング転移よりも上の温度領域で、第2の温度TRを特定することができる。この領域では、A’(T)がほぼ一定であり、U’(T)=0であり、B’(T)が依然として指数関数である。これらの条件は、U’’(T)=0、A’’(T)=0であり、したがってF’’(TR)=B’’(TR)であることを含意する。バックグラウンドEO放射信号の指数モデルの導関数は、下式のように表現することができる。
【0112】
【数16a】
【0113】
これらの2つの温度値(TRおよびTR)から、式16のCおよびaの値を見つけることができる。式16から、
【数16b】
であり、除算
【数16c】
は、例えばニュートンの方法を使用して解くことができる式であるため、C=B’(TL)=F’(TL)である。Cおよびa、したがってB’(T)を求めた後、そのバックグラウンドモデルを実験的な融解曲線データから差し引いて(式15参照。U’(T)+A’(T)=F’(T)−B’(T))、バックグラウンド補正された融解曲線の導関数を得ることができる。
【0114】
次いで、凝集曲線A(T)からアンフォールディング曲線U(T)を抽出する(例えば上で計算したバックグラウンド補正された融解曲線データから抽出する)ことができる。ある実施形態では、凝集の補正が、抽出されたアンフォールディングと凝集の重ね合わせの導関数を、その高温度範囲側の凝集成分A’(T)のロジスティックモデルによってフィットさせることを含む。指数バックグラウンドは上で抽出されているため、局所的に一定の(負の)凝集率Mをこの範囲で、測定することが可能である。この凝集率Mを、ロジスティックモデルの「キャリイング・キャパシティ」として使用することができる。
【0115】
【数17a】
【0116】
次に、量
【数17b】
に対して、(上で論じた)指数偏差解析を実行して、パラメータDおよびkが一定であるフィッティング範囲を特定することができる。この範囲のDおよびkの平均(アベレージ)値をこのフィットに対して使用することができる。その結果得られたモデル凝集曲線を、バックグラウンド補正された曲線から差し引くことができ、その結果、バックグラウンドおよび凝集が補正されたアンフォールディング曲線の導関数が得られる(式1参照。U’(T)=F’(T)−B’(T)−A’(T))。このバックグラウンドおよび凝集導関数曲線U’(T)を積分して、バックグラウンドおよび凝集が補正された融解曲線を得ることができる。
【0117】
代替手法では、抽出された曲線の上肩部まで、および/または上肩部を含む温度(TSとして示される)では凝集の影響を無視することができる仮定の下で、低温度範囲側のロジスティックモデルによる、抽出されたアンフォールディングと凝集の重ね合わせが実現される。TS温度は、U(T)+A(T)の2次導関数が最もネガティブであり(例えばmin{U’’(T)+A’’(T)})、そのためU’’’(TS)=0である点として特定することができる。導関数重ね合わせU(T)+A(T)は抽出されている(例えばバックグラウンドEO放射信号B’(T)の導関数は除去されている)ため、その1次導関数が最もネガティブである温度TSを見つける。
【0118】
このロジスティックモデルのパラメータは、以下のように表すことができる。
【0119】
【数18】
【0120】
式18のパラメータは、U’’’(TS)=0であることによって求めることができ、U(TS)およびU’(TS)の値は以下のとおりである。
【0121】
【数19】
【0122】
凝集信号A(T)はTSよりも低い範囲では無視することができるため、(上で論じた)バックグラウンド除去の後に導関数曲線を評価して、U’(TS)=F’(TS)―B’(TS)を見つける。前述のとおり、U’(T)を積分して、バックグラウンドおよび凝集が補正された融解曲線(アンフォールディング信号U(T)だけを含む融解曲線)を得ることができる。任意選択で、得られたアンフォールディング曲線U(T)およびその導関数U’(T)を、再スケーリングU(T)=100(U(T))/max{U(T)}によって百分率範囲0〜100に正規化することができる。
【0123】
図13は、前述の方法(例えば式15〜19)を使用して図12Aのタンパク質融解曲線から得た正規化された融解曲線データを示す。したがって、図13のプロットは、図12Aの融解曲線データのアンフォールディング成分(U(T))を示す。
【0124】
図14Aは、別の一組の実験タンパク質融解曲線を示す。図14Aに示す融解曲線データは、精製IgG(Sigma−Aldrich(登録商標)から市販されている)の段階2倍希釈を示している。精製IgGは、最初にPBSに対して透析し、次いで、10μMの1−アニリノ−8−ナフタリンスルホナート(シグマ・アルドリッチ(登録商標)から市販されている)の存在下で、12mg/ml、6mg/ml、3mg/ml、1.5mg/ml、0.75mg/mlおよび0.37mg/mlの最終濃度まで段階希釈した。400nmでのUV励起用に変更したLightScanner(登録商標)(アイダホ・テクノロジー社から市販されている)上で、10μlの体積を解析し、融解曲線を1℃/分で集めた。次いで、融解曲線データを前述のとおりに平滑化した。
【0125】
図14Bは、図14Aの実験的な融解曲線データのプロットを示す。導関数は中心差分技法を使用して近似した。
【0126】
図14Cは、図14Aの融解曲線データの偏差関数E(T)のプロットを示す。図14Cの例では、式13の2次多項式を使用してバックグラウンド蛍光信号をモデル化し、窓の幅は30データ点に設定した。偏差関数は、それぞれのフィットの2次項に乗じる定数(式13のai)から形成した。
【0127】
図14Dは、図14A〜14Cのバックグラウンド補正された融解曲線の導関数プロットを示す。このバックグラウンド補正された融解曲線データは、バックグラウンド除去カーソル位置を80.0度および98度に手動でセットすることによって得た(全試料について、これらのカーソル位置はともに、融解特徴よりも上のバックグラウンド領域内に位置する)。融解曲線ごとに、カーソル位置内で、平滑化された融解曲線データに2次多項式を(最小2乗技法を使用して)フィットさせた。平滑化された実験的な融解曲線データからバックグラウンド蛍光信号のモデルを差し引くことによって、バックグラウンド補正された融解曲線を形成した。次いで、バックグラウンド補正された融解曲線を正規化した。バックグラウンド補正され、正規化された曲線の導関数は、中心差分技法を使用して近似した。図12Dおよび14Dは、手動バックグラウンド補正技法を示しているが、図18〜21および式20〜27に関して後述するように、本開示の教示を使用して、バックグラウンド補正された融解曲線データを自動的に計算することもできる。
【0128】
図15は、前述の方法(例えば式15〜19)を使用して得た、図14Aのタンパク質融解曲線の正規化された導関数アンフォールディング曲線データを示す。したがって、図15のプロットは、図14Aの融解曲線データのアンフォールディング成分(U(T))を示す。
【0129】
図16は、ネガティブ試料を特定する方法1600の一実施形態を示す。本明細書で使用するとき、ネガティブ試料は、有効な融解転移領域を含まない実験的な融解曲線F(T)を指すことがある。一組の融解曲線は、結果を検証する役目を果たす1つまたは複数のネガティブコントロール試料を含むことがある。あるいは、またはこれに加えて、ネガティブ試料は、融解曲線実験を実行する際のエラー、PCR処理におけるエラー、融解曲線を構成する生の蛍光値を測定する際のエラー、特定の実験で使用した結合染料に関係したエラー、核酸生成物の不在、などによって生じる可能性がある。検証目的で、および/または処理時間を短縮するために、および/または無効データを処理することによって生じる他の問題を回避するために、ネガティブ試料を検出することが望ましいことがある。
【0130】
ステップ1610で、方法1600を初期化する。この初期化は、上で論じたように、方法1600を構成する1つまたは複数のコンピュータ可読命令をロードすること、1つまたは複数のハードウェアコンポーネントにアクセスすることなどを含むことができる。
【0131】
ステップ1620で、実験的な融解曲線F(T)にアクセスする。
【0132】
ステップ1630で、その実験的な融解曲線F(T)を使用して、偏差関数E(T)を生成する。偏差関数E(T)は、前述の式9〜14および/または図3の方法300に従って生成することができる。したがって、方法300を使用して生成された偏差関数E(T)にアクセスするように方法1600を構成することができ、および/または、方法1600は、方法300の1つもしくは複数のステップを含むことができる。
【0133】
ステップ1640で、偏差関数E(T)を解析して、偏差関数E(T)が有効な融解転移領域を含むかどうかを判定する。上で論じたように、この偏差関数E(T)は、その実験的な融解曲線F(T)がバックグラウンド蛍光B(T)のモデルから外れる程度を(例えば対応するそれぞれの指数減衰因子間の偏差に換算して)定量化することができる。F(T)がバックグラウンドモデルに一致する(例えばバックグラウンド領域内の)温度領域では偏差関数E(T)が小さく、融解領域では偏差関数E(T)が増大する。したがって、偏差関数E(T)を使用して、その実験的な融解曲線F(T)のどの部分が融解転移領域に対応し、どの部分がバックグラウンドであるのかを特定することができる。この判定は、偏差曲線E(T)をしきい値と比較することを含むことができる。このしきい値は、しきい値よりも小さな偏差値がバックグラウンド領域を示し、しきい値よりも大きな偏差値が融解領域を示すように設定することができる。偏差しきい値の一例を図19に関して後に示す。ある実施形態では、このしきい値を、偏差関数E(T)のピークと偏差関数E(T)の平均(アベレージ)の比として計算する。あるいは、またはこれに加えて、このしきい値を、一組の融解曲線の解析(例えば偏差関数E(T)の平均(アベレージ)ピークの比)から導き出すこともできる。例えば、一組の融解曲線の偏差関数E(T)の平均(ミーン)μおよび標準偏差σを計算する。ある特定の量(例えば標準偏差σの2倍)を超えてそのグループとは異なる曲線をその解析から外す。残りの融解曲線F(T)を使用して、「平均(アベレージ)最大」を計算する。この平均最大が、(例えばこの最大値の1/e、1/3または他の比率などとして)バックグラウンド領域/融解領域しきい値の基礎をなす。
【0134】
ステップ1640で、その実験的な融解曲線F(T)が有効な融解転移領域を含まない(例えば全てのTの値について実験的な融解曲線F(T)がしきい値よりも小さい)ことを、偏差関数E(T)の解析が示している場合、フローはステップ1650へ続き、そうでなければ、ステップ1660へ続く。
【0135】
ステップ1650で、その実験的な融解曲線F(T)をネガティブ試料としてマークする。ステップ1650は、処理対象の一組の融解曲線からその融解曲線を除くこと、および/またはその実験的な融解曲線F(T)に「無効」試料ないし「ネガティブ」試料のフラグを立てることを含むことができる。ある実施形態では、その一組の実験的な融解曲線F(T)が、1つまたは複数の既知の「ネガティブコントロール」を含む。それらのネガティブコントロールは、ネガティブ試料であることを示す特性を示すように構成された実験的な融解曲線とすることができ、そのため、それらのネガティブコントロールを使用して結果を検証することができる。したがって、ステップ1650は、ネガティブ試料の識別子を既知の「ネガティブコントロール」のリストと比較して、そのネガティブ試料が「ネガティブコントロール」であるかどうかを判定することを含むことできる。
【0136】
ある実施形態では、ステップ1660で、その実験的な融解曲線F(T)を「有効な」融解曲線としてマークする。別の実施形態では、ステップ1660のマーク付けを実行しない(例えば、その一組の融解曲線の中に残っており、および/または「無効」とマークされていない一切の実験的な融解曲線F(T)を有効とみなす)。
【0137】
図17は、ネガティブ試料を検出する方法1700の代替実施形態を示す。ステップ1710、1720および1730で、ステップ1610〜1630に関して上で説明したとおりに、方法1700を初期化し、融解曲線データにアクセスし、偏差関数を計算する。
【0138】
ステップ1732で、温度領域[TMIN,TMAX−W]内の偏差関数E(T)の絶対値の最小値(minE)を求める。範囲[TMIN,TMAX−W]内の全てのTの値について、この最小値minEをE(T)から差し引いて、Em(T)を得ることができる。
【0139】
【数20】
【0140】
ステップ1734で、この変更された偏差関数Em(T)の最大値maxEおよび平均(アベレージ)値または平均(ミーン)値μEを計算する。
【0141】
ステップ1736で、変更された偏差関数Em(T)の最大値maxEと平均(アベレージ)値または平均(ミーン)値μEの比REを計算する。
【0142】
【数21a】
【0143】
ステップ1740で、方法1700は、比REを使用して、その曲線がネガティブ試料であるかどうかを判定する。ある実施形態では、ステップ1740が、ステップ1736で計算した比REをしきい値と比較することを含む。このしきい値は、方法1700のユーザが定義してもよく、および/または所定の値としてもよい。例えば、自動高分解能融解曲線解析では、このしきい値を5とすることができる。このしきい値よりも小さい比REは、融解領域が存在しないこと、そのためその融解曲線F(T)がネガティブ試料であることを示し、その場合、フローはステップ1750へ続き、そうでなければ、ステップ1760へ続く。ステップ1750では、ステップ1650に関して上で説明したとおりに、融解曲線F(T)を無効試料ないしネガティブ試料としてマークする。ステップ1760では、ステップ1660に関して上で説明したとおりに、融解曲線F(T)を有効な試料としてマークする。
【0144】
図18は、偏差解析を使用して融解曲線のバックグラウンド領域および/または融解領域を自動的に特定する方法1800の一実施形態を示す。後に論じるように、方法1800を使用して特定した温度領域を使用して、自動バックグラウンド差引きプロセスを提供すること、および/または融解曲線データを表示し、もしくは融解曲線データの他の処理を実行することができる。
【0145】
ステップ1810で、方法1800を初期化する。この初期化は、上で論じたように、方法1800に必要な資源を割り当て、および/または方法1800に必要な資源を初期化すること、コンピュータ可読記憶媒体から1つまたは複数の命令および/または別個のソフトウェアモジュールをロードすること、ハードウェアコンポーネントにアクセスすることなどを含むことができる。
【0146】
ステップ1820で、方法1800は、一組の生の蛍光測定値を温度の関数として含む実験的な融解曲線F(T)にアクセスする。この実験的な融解曲線F(T)は、バックグラウンド蛍光成分B(T)を含むことがあり、そのため、バックグラウンド蛍光B(T)と「真の」融解曲線蛍光M(T)の和としてモデル化することができる。上で論じた式1を参照されたい。ある実施形態では、ステップ1820のアクセスすることがさらに、正規化された実験的な融解曲線
【数21b】
にアクセスし、および/またはこの正規化された実験的な融解曲線を計算することを含む。
【0147】
ステップ1830で、偏差関数E(T)を生成する。この偏差関数は、前述の方法300を使用して生成することができる。したがって、ステップ1830は、外部プロセス(例えば方法300)によって生成された偏差関数E(T)にアクセスすることを含むことができ、および/または方法300において開示した1つもしくは複数のステップを含むことができる。
【0148】
ステップ1840で、この偏差関数を使用して、正規化カーソルの探索領域、および、拡張により、その融解曲線F(T)内の融解転移を特定する。上で論じたとおり、この探索領域は、融解転移領域を間に挟む融解曲線F(T)のバックグラウンド領域(例えば融解転移の前の低位バックグラウンド領域および融解転移の後の高位バックグラウンド領域)を含むことができる。したがって、ステップ1840の特定することは、低位探索領域Tlowおよび高位探索領域Thighを特定することを含むことができる。低位探索領域Tlowおよび高位探索領域Thighを特定することによって、拡張により、それらの探索領域間の融解転移領域(例えば低位領域Tlowと高位領域Thighの間の温度領域)を特定することができる。
【0149】
ステップ1830で生成した偏差関数を使用して、関心の温度領域(例えば低位バックグラウンド領域、高位バックグラウンド領域、および/またはそれらのバックグラウンド領域間の融解領域)を特定することができる。これらの温度領域を特定することは、ステップ1830の偏差関数E(T)を1つまたは複数のしきい値と比較することを含むことができる。前述のとおり、偏差の大きい領域は融解領域を示すことがあり、偏差の小さい領域は、バックグラウンド領域を示すことがある。したがって、ステップ1830の特定することは、偏差関数E(T)を1つまたは複数のしきい値と比較すること、偏差関数E(T)の平均(アベレージ)、および/または偏差関数E(T)のピークと平均(ミーン)もしくは平均(アベレージ)の比を計算することなどを含むことができる。
【0150】
方法1800は、単一の融解転移を間に挟む単一の温度領域対(Tlow、Thigh)の特定を論じているが、当業者は、融解曲線データ内の融解転移の数に応じた任意の数の温度領域(Tlow、Thigh)を特定するように、方法1800を適合させることができることを理解するであろう。後に、複数の融解領域を特定する方法2000の一例を、図20に関して説明する。したがって、融解曲線内の特定の数の探索領域および/または融解転移を特定することに、本開示が限定されると解釈すべきではない。
【0151】
図19は、例示的ないくつかの偏差関数の偏差プロットの一例を示す。図19の例では、単一の融解転移1920が示されている。したがって、ステップ1840では、2つの温度領域(Tlow1930およびThigh1932)を特定する。別の実験的な融解曲線は、追加の融解転移領域を含むことがある(例えばn個の融解転移領域を含むことがある)。したがって、ステップ1840の特定は、融解曲線内のn個のバックグラウンド温度領域(例えばTlow_1およびThigh_1、Tlow_2およびThigh_2、...、Tlow_nおよびThigh_n)を特定することを含むことがある。各融解転移領域は、それぞれが異なる遺伝子型に対応する複数の融解パターン、例えば1912、1914および1916を含むことがある。しかしながら、それぞれの融解領域の外側において、それらの異なる遺伝子型の融解曲線は類似している。このことは、複数の曲線に対して、(両側にバックグラウンドを有する)1つの融解領域を定義することを可能にする。融解解析は複数の曲線を比較するため、曲線ごとに個別の領域を使用するよりも、これらの集合(アグリゲート)領域を使用した方がしばしば有利である。
【0152】
温度領域Tlow1930およびThigh1932は、とりわけステップ1830の偏差関数E(T)を使用して選択することができる。実験的な融解曲線F(T)の温度範囲[Tmin,Tmax]または[Tmin,Tmax−W]内で、融解曲線の偏差関数E(T)を、1つまたは複数の偏差しきい値と比較することができる。図19の例では、偏差関数E(T)がしきい値1910よりも小さい温度領域を、バックグラウンド領域1930および1932として特定し、偏差関数E(T)がしきい値1910よりも大きい領域を融解領域1920として特定する。
【0153】
しきい値1910は予め決めておくことができる。あるいは、またはこれに加えて、複数の実験的な融解曲線F(T)の偏差関数E(T)を平均することによって、および/または偏差関数E(T)のピーク値を使用することによって、しきい値1910を計算することもできる。この平均算出および/または比の計算は、異常値の棄却および/または他の統計的技法(例えば上で論じたネガティブ試料の特定)を含むことができる。例えば、一組の融解曲線の偏差関数E(T)の平均(ミーン)μおよび標準偏差σを計算する。ある特定の量(例えば標準偏差σの2倍)を超えてそのグループとは異なる曲線をその解析から外す。残りの融解曲線F(T)を使用して、「平均(アベレージ)最大」を計算する。この平均最大が、(例えばこの最大値の1/e、1/3または他の比率などとして)しきい値1910の基礎をなす。
【0154】
図19は、例示的な3つの偏差関数E(T)1912、1914および1916を示している。融解領域1920は、偏差関数E(T)1912、1914および/または1916が偏差しきい値1910よりも大きい領域として示されている。下側バックグラウンド領域1930は、偏差関数E(T)1912、1914および/または1916が偏差しきい値1910よりも小さい温度領域を含む。
【0155】
図18に戻ると、ステップ1880で、ステップ1840で特定した温度領域(1つまたは複数)を、表示および/または追加の処理に対して使用可能にする。前述のとおり、ステップ1880は、特定した温度領域(1つまたは複数)をコンピュータ可読記憶媒体上に記憶すること、それらの領域をHMI上に表示する(例えば融解曲線データの表示にそれらの領域を上重ねする)こと、それらの領域を使用して、融解曲線データの一部を表示する(例えば融解曲線データの融解領域だけを表示する)こと、外部システムおよび/または外部プロセス(例えば指数バックグラウンド除去プロセス)にデータを送信することなどを含むことができる。
【0156】
図20は、融解曲線内のバックグラウンド領域および/または融解転移領域を自動的に特定する方法2000の他の実施形態の流れ図である。複数の融解領域、すなわちアンプリコン融解領域およびプローブ融解領域を含む融解曲線内の融解領域を特定するように、図20の方法2000を適合させることができる。後に論じるように、この例示的な実施態様では、アンプリコン融解領域の方がプローブ融解領域よりも際立つことがある。(例えばアンプリコン融解領域およびプローブ融解領域を含む)このタイプの融解曲線の解析は、突然変異スキャニングとジェノタイピングの同時実施を可能にすることがある。しかしながら、方法2000の教示を、異なる融解領域セットを含む別の融解曲線に適用することもできる。したがって、この点に関して方法2000が限定されると解釈すべきではない。
【0157】
上で論じたように、方法2000が処理する融解曲線は、2つの融解領域(例えばアンプリコン融解領域およびプローブ融解領域)を含むことができる。このような融解曲線の偏差関数プロットの一例を図21Aに示す。別個の4つの温度値、すなわちアンプリコン融解領域を間に挟む低位アンプリコン温度値TA,Lおよび高位アンプリコン温度値TA,H、ならびにプローブ融解領域を間に挟む低位プローブ温度値TP,Lおよび高位プローブ温度値TP,Hを自動的に特定するように、方法2000を構成することができる。これらの温度値は、TP,L<TP,H<TA,L<TA,Hとなるように特定される。
【0158】
ステップ2010および2020で、前述のとおりに、方法2000を初期化し、融解曲線データにアクセスする。
【0159】
ステップ2030で、融解曲線データの偏差関数E(T)を生成する。この偏差関数E(T)は、方法300を使用することによって、および/または方法300の1つまたは複数のステップを組み込むことによって生成することができる。
【0160】
ステップ2032および2034で、温度範囲[Tmin,Tmax−W(温度窓の幅)]内の偏差関数E(T)の絶対値の最小値minEを求める。[Tmin,Tmax−W]内の全てのTの値について、この最小値minEをE(T)から差し引いて、Em(T)を得ることができる(Em(T)=|ET(T)|−minE)。図17のステップ1732〜1734に関して上で説明したように、Em(T)の最大値maxEを求めることができる。
【0161】
ステップ2040で、第1の温度セットを求める。この第1の温度カーソルセットは、アンプリコン融解領域を間に挟む低位アンプリコンカーソルTA,Lおよび高位アンプリコンカーソルTA,Hを含むことができる。低位アンプリコンカーソルTA,Lは、偏差関数Em(T)の絶対値がある特定の値以上である(Em(T)の温度範囲内の)最も小さいTの値とすることができる。ある実施形態では、この値が、スケーリングファクタ(例えば1/e、1/3または他のスケーリングファクタ)によってスケーリングされたmaxEである。したがって、温度TA,Lは、式22を満たす最も低い温度Tとして特定することができる。
【0162】
【数22】
【0163】
このようにしてTA,Lを特定した一例が図21Aに示されており、図21Aには、TA,L2124が示されている。
【0164】
高位アンプリコン温度値TA,Hは、偏差関数Em(T)の絶対値がある特定の値(例えば1/eなどの定数によってスケーリングされたmaxE)以上である(Em(T)の温度範囲内の)最も大きなTの値として特定することができる。
【0165】
【数23】
【0166】
このようにしてTA,Hを特定した一例が図21Aに示されており、図21Aには、TA,H2126が示されている。
【0167】
ある実施形態では、ステップ2050で、ステップ2040で特定した第1の温度セットTA,LおよびTA,Hを変更する。値TA,LおよびTA,Hの外側の温度値を使用することによって、この解析を改善することができる。したがって、緩衝定数BA,LおよびBA,Hを使用して、温度TA,LおよびTA,Hの両側に、対応するそれぞれのバッファ値BA,LおよびBA,Hを含めることができる。緩衝定数BA,LおよびBA,Hの値は経験的に求めることができる。これらの緩衝定数は、融解曲線データ内の関心の特徴サイズ(例えば1℃)に近くなるように選択することができる。したがって、これらの温度位置をそれぞれ、TA,L−BA,LおよびTA,H+BA,Hになるように変更することができる。図21Aを参照されたい。さらに、図21Aおよび21Bに示すように、値TA,LおよびTA,Hの両側にWパラメータを加えることによって、値TA,LおよびTA,Hに基づくバックグラウンド温度領域を定義することができる。
【0168】
後に論じるように、温度値TA,LおよびTA,H、ならびに/もしくはこれらの温度値によって定義された温度領域を使用して、バックグラウンド領域および/または融解領域を特定し、または指数バックグラウンド差引きプロセスを自動化することができ(例えば、これらの温度を使用して、バックグラウンド蛍光の指数モデルを式2〜6に従って構築することができ)、あるいは、これらの温度値ならびに/もしくは温度領域を、クラスタリング操作またはスキャニング操作で使用することなどができる。
【0169】
ステップ2060で、Em(T)内のプローブ温度領域を特定する。この温度領域は、第1の温度セットの低位温度(TA,L)よりも低い温度範囲を含むことがある。ある実施形態では、この温度領域が、TA,L、バッファ値、および/または偏差関数E(T)の温度窓TWの幅よりも低い(例えばEm(T)の全てのTについてTA,L−BA,L−Wよりも低い)。この温度領域は、第2の融解領域(プローブ融解領域)を含み、アンプリコン融解領域を含まない。図21Bを参照されたい。図21Aに示すように、プローブ融解領域は、(Em(T)によって定量化される)アンプリコン融解領域ほど際立ってはいない。この理由から、第2の温度セット(例えばプローブ温度TP,LおよびTP,H)は、第1の温度セット(TA,LおよびTA,H)の後に、E(T)のサブセットを使用して特定することができる。しかしながら、他の実施形態および/または他のタイプの融解曲線では、これが当てはまらないこともある。したがって、本開示が、温度セットの特定の順序および/または数に限定されると解釈すべきではない。
【0170】
ステップ2062で、ステップ2060で特定した領域内におけるE(T)の最小値minEを求める。上で論じたステップ2032を参照されたい。minEを使用して、その温度領域内においてEm2(T)を生成することができる(ステップ2032〜2050で論じたEm(T)から区別するため、本明細書ではEm2(T)と呼ぶ)。
【0171】
ステップ2064で、Em2(T)の最大値maxE2を求める。上で論じたステップ2034を参照されたい。図21Aおよび21Bの点2142も参照されたい。
【0172】
ステップ2070で、ステップ2064で求めた最大値maxE2を使用して、第2の温度セットを特定する。第2の温度セットの低位温度値TP,Lは、Em2(T)の値が、定数(例えば1/e)によってスケーリングされたmaxE2よりも大きい温度領域内の最も低い温度とすることができる。図21BのTP,L2154を参照されたい。第2の温度セットの高位温度値TP,Hは、Em2(T)の値が、定数(例えば1/e)によってスケーリングされたmaxE2以上である温度領域内の最も高い温度とすることができる。図21BのTP,H2156を参照されたい。
【0173】
ステップ2080で、対応するそれぞれの緩衝定数および/または偏差関数E(T)を生成するために使用した温度窓の幅Wを使用して、第2の温度セットTP,LおよびTP,Hを変更する。上で論じたステップ2050を参照されたい。図21Bの点2164および2166も参照されたい。
【0174】
ステップ2090で、第1および第2の温度セットを、表示、および/または1つもしくは複数の外部プロセスでの使用に対して使用可能にする。ある実施形態では、後に論じるように、これらの温度セットを使用して、指数バックグラウンド差引きプロセスを自動化する。例えば、第1の温度セット(TA,LおよびTA,H)を使用して、アンプリコン融解領域のバックグラウンドを差し引くことができ、第2の温度セット(TP,LおよびTP,H)を使用して、プローブ融解領域のバックグラウンド蛍光を差し引くことができる。上で論じた式1〜6を参照されたい。あるいは、またはこれに加えて、これらの温度値セットを使用して、アンプリコン融解領域および/またはプローブ融解領域の表示および/または処理(例えば、対応するそれぞれの融解領域(1つまたは複数)のスケーリングされ、および/またはズームされた図を自動的に表示すること、関連領域(1つまたは複数)内のクラスタリングを自動化することなど)を提供することができる。
【0175】
図21Aおよび21Bは、アンプリコン融解領域およびプローブ融解領域を含む融解曲線を使用して生成した例示的な偏差関数Em(T)2110のプロットである。
【0176】
図21Aは、前述の方法2000のステップ2030〜2050の操作を示す。例えば、2112は、Em(T)の最大値maxEを示し、2114は、スケーリングファクタ(1/e)によってスケーリングされた最大値maxE、2124は、Em(T)がmaxE/e以上である最も低い温度TA,L、2126は、Em(T)がmaxE/e以上である最も高い温度TA,Hである。図21Aに示すように、対応するそれぞれの緩衝定数2134および2136ならびに/または温度窓の幅Wによって、温度値TA,LおよびTA,Hを変更することができる。
【0177】
図21Bは、前述の方法2000のステップ2060〜2080の操作を示す。プロット2140はプローブ融解領域を含み、このプローブ融解領域は、Em(T)の温度範囲のサブセット(例えばTA,L−BA,L−Wよりも低い温度範囲)を含むことができる。関数Em2(T)は、プローブ融解領域(例えばステップ2050で特定した温度範囲)内の全てのE(T)値について、偏差関数の絶対値の最小値minEを差し引くことによって生成する。Em2(T)2142の最大値maxE2を使用して、温度値TP,L2154およびTP,H2156を特定することができる。低位プローブ温度TP,L2154は、Em2(T)が、スケーリングされた最大値maxE2(maxE2/e)以上である最も低い温度として特定され、高位プローブ温度TP,H2156は、Em2(T)が、スケーリングされた最大値maxE2(maxE2/e)以上である最も高い温度として特定される。図21Bに示すように、対応するそれぞれの緩衝定数2164および2166ならびに/または温度窓の幅Wを使用して、温度TP,LおよびTP,Hを変更することができる。
【0178】
上で論じたように、方法2000で特定した温度値を使用して、実験的な融解曲線からバックグラウンド蛍光信号B(T)を差し引くことができる。これは、方法2000で特定したバックグラウンド温度値(例えばアンプリコン融解領域およびプローブ融解領域を間に挟む温度値)を使用して実行することができる。そのようにして特定した温度値を使用して、指数バックグラウンド信号を式2〜5に従ってモデル化することができる。式6に従って、その指数バックグラウンドのモデルを、実験的な融解曲線F(T)から差し引くことができる。
【0179】
図21Cは、カーソルプローブ領域を特定するプロセスの他の例を示す。偏差関数2160は例えばタンパク質融解曲線に対応する。この例示的な偏差関数2160は、ベースライン偏差2165、融解領域および(カーソルプローブ領域2175として示された)バックグラウンド領域を含む。偏差関数2160の融解領域は、それぞれが異なるタンパク質に対応する複数の融解パターンを含むことがある。しかしながら、(融解領域(1つまたは複数)の外側の)カーソルプローブ領域2175では、異なるタンパク質の融解曲線が類似している。このことは、複数の曲線に対して、1つのバックグラウンド領域(カーソルプローブ領域2175)を使用することを可能にする。融解解析は複数の曲線を比較するため、曲線ごとに個別の領域を使用するよりも、集合領域(例えば領域2175)を使用した方がしばしば有利である。
【0180】
カーソルプローブ領域2175は、(図20のステップ2040のとおりに)バックグラウンドカーソル温度Tc2174を選択することによって特定することができる。バックグラウンドカーソル温度Tc2174は、偏差しきい値2164よりも大きく、および/または偏差しきい値2164に等しい偏差関数2160に沿った(温度範囲[Tmin,Tmax]または[Tmin,Tmax−W]内の)最も高い温度として特定することができる。この偏差しきい値は、最大値maxE2162(または最大値maxE2162とベースライン偏差2165の間の高さ)と定数(例えばe)の比として定義することができる。上式22および23を参照されたい。図21Cに示すように、カーソルプローブ領域2175は、バックグラウンドカーソル温度Tc2174よりも高く、および/またはバックグラウンドカーソル温度Tc2174に等しい温度を含むと定義することができる。
【0181】
上で論じたように、偏差しきい値2164の値は、予め決めておくことができ(定数)、および/または偏差関数E(T)の最大値maxE2162を使用していることができる。あるいは、またはこれに加えて、複数の実験的な融解曲線の偏差関数E(T)を平均することによって、しきい値2164を計算することもできる。この平均算出および/または比の計算は、異常値の棄却および/または他の統計的技法(例えば上で論じたネガティブ試料の特定)を含むことができる。例えば、一組の融解曲線の偏差関数E(T)の平均(ミーン)μおよび標準偏差σを計算する。ある特定の量(例えば標準偏差σの2倍)を超えてそのグループとは異なる曲線をその解析から外す。残りの融解曲線F(T)を使用して、「平均(アベレージ)最大」を計算する。この平均最大が、(例えば1/e、1/3または他の比として)しきい値2164の基礎をなす。
【0182】
方法1800および/または2000で特定し、ならびに/または図21A〜21Cを使用して特定したバックグラウンド温度領域(カーソルプローブ領域)を使用して、バックグラウンド補正プロセスを自動化することができる。図22は、偏差解析を使用して指数バックグラウンド差引きを自動化する方法2200の流れ図である。
【0183】
ステップ2210〜2230で、前述のとおりに、方法2200を初期化し、融解曲線データにアクセスし、この融解曲線データから偏差関数E(T)を生成する。
【0184】
ステップ2240で、融解曲線データ内のバックグラウンド温度領域を特定する。バックグラウンド温度領域は、図18の方法1800を使用して(偏差関数E(T)を1つまたは複数のしきい値と比較することによって)特定することができる。あるいは、またはこれに加えて、方法2000に従って(例えば偏差関数E(T)のスケーリングされた最大値を使用して)バックグラウンド領域を特定することもできる。
【0185】
ステップ2250で、目的関数(Φ)にアクセスする。目的関数Φは、最適化問題(方法2200の場合には、実験的な融解曲線F(T)内の指数バックグラウンド蛍光B(T)をモデル化するために使用するカーソル位置の位置設定など)に対する特定の解の望ましさ(デザイラビリティ)を定義することができる。ある実施形態では、ステップ2250でアクセスする目的関数Φが、以下の形の関数である。
【0186】
【数24a】
【0187】
式24で、TLおよびTRは、温度軸に沿った正規化カーソル位置(その曲線の融解領域を間に挟む温度)を表す。式24の目的関数は、ある種の条件に従うことがある。例えば、正規化カーソル位置TLおよびTRの探索空間を、ステップ2240で特定した温度領域に限定することができる。
【0188】
実験的な融解曲線F(T)と理想融解曲線の間の誤差を最小化するように、目的関数Φを構成することができる。図23Aは、「理想」融解曲線の例および正規化された実験的な融解曲線
【数24b】
の一部を示す。図23Aに示すように、曲線2310および2312はともに、低位バックグラウンド領域2326、高位バックグラウンド領域2328および融解領域2325を含む。理想融解曲線2310では、融解領域2325が、滑らかな単調非増加関数としてモデル化されている。理想融解曲線2310と実験的な融解曲線
【数24b】
2312は、バックグラウンド領域2326および2328では類似しているが、融解領域2325では偏差を示す。したがって、理想曲線2310と実験曲線2312の間の偏差を使用して、(例えば理想曲線2310と実験曲線F(T)2312の指数減衰率を、例えば方法1800および2000に関して上で説明したとおりに比較することによって、)バックグラウンド領域2326および2328を融解領域2325から区別することができる。
【0189】
領域2320内において、曲線2310と2312は発散する。領域2320は、図23Bに拡大図が示されている。面積2322は、理想融解曲線2310と正規化された融解曲線2312の(温度Tに沿って積分した)全体差を示す。正規化された融解曲線
【数24b】
2312が、蛍光中間点(正規化後の0.5蛍光)を通る温度をT1/2 2324と定義することができる。
【0190】
図23Aおよび23Bは、単一の融解領域2325を含む理想融解曲線および実験的な融解曲線2310および2312を示しているが、この点に関して本開示は限定されない。当業者には理解されることだが、本開示の教示を、任意の数の融解領域(および対応するバックグラウンド領域)を含むより複雑な融解曲線に適用することもできる。
【0191】
ある実施形態では、ステップ2250でアクセスする目的関数Φが、T1/2点2324の前に生じる1に対する誤差を最小化し、T1/2点2324の後に生じる0に対する誤差を0に最小化するように構成されている。さらに、実験的な融解曲線F(T)が、融解転移領域(例えば図23の領域2325)内において、単調に減少する指数関数に一致するように、目的関数Φを構成することができる。
【0192】
図22を再び参照すると、「バックグラウンド」として特定された温度領域内に限って温度カーソル位置を探索するように、ステップ2250でアクセスする目的関数Φを構成することができる。低位バックグラウンド領域および高位バックグラウンド領域内への拘束を含むように、目的関数Φを書き直すことができる。
【0193】
【数25】
【0194】
上で論じたように、融解転移の前(例えば図23のT1/2点2324の前)に生じる1に対する誤差を最小化し、融解転移の後に生じる0に対する誤差を最小化するように、目的関数Φを構成することができる。下式26の目的関数はそのように構成されている。
【0195】
【数26a】
【0196】
式26で使用されるとき、演算子
【数26b】
(例えば
【数26c】
に適用されている)は、以下の特性を有する。
【0197】
【数27】
【0198】
ステップ2260で、方法2200は、目的関数Φを使用して、最適な正規化カーソル値を特定する。ステップ2260の特定は、Tlow温度領域およびThigh温度領域内のさまざまな温度値において、目的関数Φを評価することを含むことができる。ある実施形態では、これらの領域を、所定の数の値(例えばそれぞれの領域内の30個の離散温度値)に量子化する。目的関数Φを最小化する温度TLおよびTRを、最適なカーソル位置として特定することができる。ステップ2260の特定は、極小検出、最急降下、勾配降下などを含む当技術分野で知られている任意の最適化技法を含むことができる。
【0199】
ステップ2270で、実験的な融解曲線F(T)を処理して、実験的な融解曲線F(T)のバックグラウンド蛍光B(T)成分を除去する。上で論じた式1〜6を参照されたい。ステップ2270の除去は、最適な温度値TLおよびTRを使用してバックグラウンド蛍光をモデル化することを含むことができる。このモデルを、上で論じた式6に従って融解曲線データから差し引くことができる。
【0200】
ステップ2280で、「真の」融解曲線データM(T)を使用可能にする。これは、上で論じたように、この補正されたデータを表示すること、補正されたデータをコンピュータ可読記憶媒体に記憶すること、補正されたデータを別のプロセッサおよび/またはシステムに送信することなどができるようにすることを含むことができる。
【0201】
図24は、バックグラウンド蛍光補償を自動化する方法2400の他の実施形態である。方法2400は、バックグラウンド差引きの結果に対する改善を可能にするために、フィードバックステップおよび評価ステップを含む。
【0202】
ステップ2410〜2470は、方法2200に関して上で説明したステップ2210〜2270と同じように実施することができる。
【0203】
テップ2472で、処理され、および/または正規化された融解曲線データM(T)を使用して、追加の解析を実行する。例えば、この融解曲線データM(T)をHMI内に表示し、またはジェノタイピング操作、スキャニング操作、クラスタリングプロセス、グルーピングプロセスなどで使用する。
【0204】
ステップ2472で実行した解析の結果の質(クオリティ)を定量化することができることがある。例えば、ステップ2472の解析が、クラスタリング操作またはグルーピング操作を含む場合、クラスタ/グループ間の分離性(セパレーション)を評価して、操作の「質」を決定することができる。したがって、ステップ2480で、質メトリックを計算する。この質メトリックを使用して、ステップ2460のバックグラウンド除去の質を定量化する(例えば「最適な」カーソルTLおよびTRの質を定量化する)ことができる。
【0205】
式28は、クラスタリング操作および/またはグルーピング操作の質を定量化する1つの方式を示す。
【0206】
【数28a】
【0207】
式28に示すように、質メトリックγは温度の関数である。式28は、2つのクラスタ/グループの質を、グループ間の分離性およびグループ内の凝集性(コヒージョン)の関数として定量化する(式28ではこれらのグループがグループ1および2として特定される)。グループ/クラスタの質は、グループ平均(ミーン)値の分離および個々のグループ分散の和によって決定される。低い質メトリックγは、グループ1および2内の大きな偏差、および/またはグループ平均(ミーン)間の小さな分離に起因する。あるいは、グループがタイトにクラスタリングされており(
【数28b】
および
【数28c】
の値が小さい)、および/またはグループどうしが広く分離されている(差μ1(T)−μ2(T)が大きい)場合、質メトリックγは「良好」となる。
【0208】
本明細書では質メトリックの一例を論じるが、当業者は、(ステップ2472の解析に関係する任意の一組の因子に応じた)任意の質メトリックを本開示の教示の下で使用することができることを理解するであろう。
【0209】
ステップ2482で、ステップ2480で計算した質メトリックを評価する。この評価は、融解曲線データに対する改良をさらに実行する(例えばステップ2484でバックグラウンド除去カーソル位置を変更する)かどうかを判定することができる。したがって、ステップ2482は、質メトリックを1つまたは複数のしきい値と比較することを含むことができる。あるいは、またはこれに加えて、ステップ2482の判定は、現在の質メトリックを、ステップ2460〜2480の以前の1回または数回の繰返しで得た質メトリックと比較することを含むこともできる。このメトリックが一貫した改善を示している(例えば改善勾配をたどっている)場合には、改良を続けることが望ましいと判定することができ、(例えば所定の数の繰返しに比べて)質メトリックが低下している場合には、改良を続けても改善が見込めない可能性がある。さらに、この判定は、最大繰返しカウンタまたは他の処理限界を評価することを含むことができる。カーソル位置のさらなる改良を実行すべきと判定された場合、フローはステップ2484へ続き、そうでなければ、ステップ2490へ続く。
【0210】
ステップ2484で、正規化カーソル位置を改良する。ステップ2484で加える改良は、用途に特化した改良とすることができる(例えば、ステップ2472で実行した解析によって定義することができる)。あるいは、またはこれに加えて、この改良は、カーソル位置の1つもしくは複数の所定のシフト、および/またはユーザが選択可能なカーソル位置の1つもしくは複数のシフトを実行することを含むことができる。ある実施形態では、ステップ2480で計算した質メトリックがこの改良を決定する。あるいは、またはこれに加えて、カーソル位置TLおよびTRに対する改良を、所定のパターンに従って実施することもでき、および/または、カーソル位置TLおよびTRに対する改良がランダムな成分を含んでもよい。ステップ2484の改良はさらに、改良されたカーソル位置を使用して目的関数Φを評価することを含むことができる。ある変更によって目的関数Φの結果が不良になる場合には、より良好な結果を与える別の変更のために、その変更を破棄することができる。カーソル位置を改良した後、ステップ2460〜2482のバックグラウンド除去、解析、質メトリック計算および評価を実行することができる。
【0211】
ステップ2490で、解析結果および/または処理された融解曲線データを使用可能にする。上で論じたように、データを使用可能にすることは、そのデータをHMI上に表示すること、そのデータをコンピュータ可読記憶媒体に記憶すること、そのデータを他のプロセスおよび/またはシステムに送信することなどを含むことができる。
【0212】
低温融解転移または幅広い温度範囲にわたる転移の偏差プロットはしばしば、他の種類のプロットよりも、正確に自動クラスタリングすることが容易であることが分かっている。例えば、A>Cトランスバージョンであるヒト単一塩基多様体rs#729172を、スナップバックプライマを使用して増幅し、その遺伝子型を判定した。スナップバックプライマは、参照によってその全体が本明細書に組み込まれるPCT公開第WO2008/109823号の主題である。スナップバックプライマに関する追加の情報は、「Zhou L.他、Snapback Primer Genotyping with Saturating DNA Dye and Melting Analysis、54(10)Clin.Chem.1648〜56(2008年10月)」に出ている。
【0213】
一例では、偏差解析後には異なる遺伝子型が正確にクラスタリングされたが、指数バックグラウンド差引き後には正確にクラスタリングされなかった。以下のプライマを使用して、ヒトゲノムDNAからの162bp生成物を増幅した。
【0214】
ATGGCAAGCTTGGAATTAGC (配列ID No.6)、および
【0215】
ggTCTGCAGACCGAATGTATGCCTAAGCCAGCGTGTTAGA (配列ID No.7)
【0216】
上記配列6および7の下線が引かれた塩基は、ヒトDNAターゲットと相同であり、下線が引かれていない大文字の塩基は、スナップバックプライマのプローブ要素を構成し、太字の塩基は、単一塩基多様体の位置であり、小文字の塩基は、ターゲットにミスマッチされた2塩基オーバハングである。このPCRは、LC480リアルタイム機器(ロシュ・アプライド・サイエンスから市販されている)内で、0.5μMの制限プライマ、0.05μMのスナップバックプライマ、3mMのMgCl2、50mMのトリス、pH8.3、500μg/mlのBSA、1X LCGreen Plus、200μMのそれぞれのdNTP、および0.04U/μlのKlenTaq 1ポリメラーゼ(AB Peptides)を含む5ng/plのヒトゲノムDNAが存在する条件下で、10μlの反応体積で実行した。この反応混合物を95℃に加熱して、2分置き、次いで、95℃、4.4℃/秒、10秒保持、58℃、2.2℃/秒、10秒保持、76℃、4.4℃/秒、15秒保持のサイクルを50回繰り返した。続いて、4.4℃/秒で95℃に加熱し、10秒保持、2.2℃/秒で42℃に冷却し、1秒保持、0.1℃/秒で98℃に加熱する融解プロトコルを実行し、10回/℃の取得率で蛍光をモニタした。
【0217】
スナップバックプローブ融解転移の温度区間を、融解曲線の検査によって手動で特定し、2つの方法で処理した。図25は、上で参照によって本明細書に組み込んだPCT公開第WO2007/035806号に記載された不偏階層法によって、自動クラスタリングした偏差プロットを示す。
【0218】
この例では使用しないが、図25に示したクラスタリング結果を使用し、質評価技法およびフィードバック技法を使用することによって、バックグラウンド差引きおよび/または温度領域の特定を改良することができる。このような技法を使用して融解曲線解析を改良する方法の一例を、図24に関して説明した。図29のステップ2470〜2482を参照されたい。式20も参照されたい。例えば、図25に示したグループ内の凝集性およびグループ間の分離性を定量化するように、式28の質メトリックを適合させることができる。この質メトリックを評価して、(バックグラウンド差引きおよび/または温度領域の特定に対して使用する)温度領域を、より良好な結果(これは質メトリックによって定量化される)を与えるように改良すべきかどうかを判定することができる。
【0219】
このクラスタリングは、異なる遺伝子型を正確に分離し、約66℃および74℃にTmを有する予想されたホモ接合体およびヘテロ接合体を表示し、68℃の異なるTmのところに予想外のヘテロ接合体を特定する。対照的に、指数バックグラウンド差引きだけによって同じデータを処理し、導関数プロットとして表示した場合には、全く同じ方法による自動クラスタリングでも、予想されたヘテロ接合体の区別に失敗する(図26)。低温ホモ接合体とヘテロ接合体が一緒にクラスタリングされ、ジェノタイピングが不正確になる。これはおそらく、1つには、遺伝子型内の曲線の分散が大きいことが原因である。
【0220】
偏差解析を使用して、(方法1600および1700に関して上で説明したように)ネガティブ試料を特定することができる。さらに、偏差解析を使用して、クラスタリングおよびジェノタイピングのためのプローブ解析領域を自動的に求めることもできる。例えば、方法1800および2000は、融解曲線データ内の融解領域(1つまたは複数)を、偏差解析を使用して自動的に特定する。
【0221】
一例として、参照によってその全体が本明細書に組み込まれる「Zhou L.他、CT.High−resolution DNA Melting Analysis for Simultaneous Mutation Scanning and Genotyping in Solution、51(10)Clin.Chem.1770〜77(2005年10月)」に記載された方法の後に、非標識プローブを使用したPCRおよび融解解析によって、F5ライデン単一塩基多様体の遺伝子型を判定した。
【0222】
(全体で3つの遺伝子型の)ポジティブ試料とネガティブ(テンプレート無しコントロール)試料とがチェッカー盤の形に散らばるように、96穴プレート上に試料を置いた。PCRおよび融解解析の後、50から95℃までの未処理の融解曲線にアクセスした。図27は、そのようにして得た未処理の融解曲線のプロットを示す。
【0223】
図27に示すように、これらの曲線は2つのクラスタに分かれ、ポジティブ試料からなる上側のクラスタは、非標識プローブの融解転移とPCR生成物の融解転移の両方を含み、ネガティブ試料からなる下側のクラスタは予想された融解転移を示さず、その代わりに、代替生成物の意図しない増幅により、75℃付近に予想外の転移が存在する。図28は、(図27では直線カットオフとして示されている)振幅カットオフ技法を使用して検出した一組の試料インジケータを示す。図28に示すように、ネガティブ試料はいずれもこの技法を使用して正確に特定されなかった。
【0224】
それぞれの融解曲線に対して偏差関数E(T)を生成し、それらの偏差関数E(T)を使用して、ネガティブ試料(例えばテンプレート無しコントロール試料)を自動排除した。図16および17に関して上で説明したように、ネガティブ試料の特定を使用して、解析しうる信号を生成しない融解曲線を排除することができる。この例では、図17の方法1700に従ってネガティブ試料の特定を実行した。そのため、このネガティブ試料の特定は、区間[TMIN,TMAX−W]にわたって偏差関数E(T)の絶対値の最小minEを求め、前述のとおりにEM(T)を計算し(全てのT値についてminEを差し引き)、最大値maxEおよびEM(T)の平均(ミーン)または平均(アベレージ)を計算し、最大値maxEと平均(ミーン)または平均(アベレージ)の比を計算し、その比をしきい値と比較することを含む。この例ではしきい値を5に設定した。
【0225】
図29は、ネガティブ試料が除去された図27の一組の融解曲線を示す。図29に示すように、下側の一組の融解曲線(図27の下部の部分に見られたネガティブ試料)はもはや、この一組の「有効」融解曲線には含まれていない。図30は、前述の偏差解析技法を使用して検出したネガティブ試料を含む一組の試料インジケータを示す。図28(振幅カットオフを使用したネガティブ試料の特定)と比較すると、図30は、偏位分析の使用が、振幅カットオフ法が特定できなかったネガティブ試料の特定の成功を可能にしたことを示している。偏差解析とネガティブ試料の特定の振幅カットオフ法は、独立した解析であるため、並行して(例えば同時に)実施することができる。
【0226】
ネガティブデータの自動排除の後、偏差関数をさらに使用して、PCR生成物(アンプリコン)融解領域と、プローブ融解領域と、全ての融解領域を含む全体領域とを特定した。この例では、図20に関して上で説明したとおりに、4つの別個の温度を特定した:TP,L<TP,H<TA,L<TA,H。低い方の温度対は、プローブ融解領域を間に挟みTP,L<T<TP,H、高い方の温度対はアンプリコン融解領域を間に挟むTA,L<T<TA,H。同時突然変異スキャニング/ジェノタイピングのための全体融解領域の自動解析の一例では、これらの4つの温度の中の極端対、すなわちTP,L<T<TA,Hを使用することができ、そのため、追加の温度を計算する必要がない。
【0227】
アンプリコン領域は、TA,L<T<TA,Hによって特定されるが、TA,LおよびTA,Hの両側のバッファ値Bを使用して、これらの境界の十分に外側で解析を開始した。したがって、解析領域は、TA,L−B<T<TA,L+Bになる。図20のステップ2050を参照されたい。
【0228】
適当なバッファ値Bは、機器特性(雑音、データ密度)および一般に約1℃であるデータから抽出する最小特徴サイズによって求めた。さらに、(指数バックグラウンド差引きなどの)いくつかの解析法は、計算のために両側に温度区間を必要とし、そのため、これらの区間を定義するために、それぞれの緩衝帯の外側に追加の幅(W)を含めることができる。図20のステップ2050を参照されたい。
【0229】
これらの4つのそれぞれのBおよびW値は、同じでもまたは異なっていてもよいことが理解される。複数の融解曲線を一度に解析するときには、平均(アベレージ)区間または最も外側の区間を使用することができる。
【0230】
アンプリコンバックグラウンド領域およびアンプリコン融解領域を特定した後、プローブ融解領域を含む温度範囲を求める。上で論じたように、この温度領域は、アンプリコン領域よりも低い[TMIN,TA,L−(B+W)]を含む。図20のステップ2060を参照されたい。この温度領域内で、区間[TMIN,TA,L−(B+W)]内の|E(T)|の最小値minE2を特定し、区間[TMIN,TA,L−(B+W)]にわたって関数EM2(T)を構築する(EM2(T)=|E(T)|−minP)。図20のステップ2062を参照されたい。EM2(T)の最大値maxE2を求める。図20のステップ2064を参照されたい。
【0231】
上で特定したプローブ温度領域を評価して、プローブ融解領域が存在するかどうかを(例えば図16および17の方法1600および1700に開示したネガティブ試料の特定を使用して)判定した。この例では、対応するそれぞれの偏差プロット上のプローブピークとアンプリコンピークの比が約0.02よりも小さい場合(maxE2<maxE/e4の場合)、そのデータ中に自動的に検出可能なプローブ融解はないと判定する。融解曲線データを取得するために使用する機器の分解能によっては、0.02以外の値を選択することもできることが理解される。
【0232】
図17の方法1700に従って、プローブ温度値(TP,LおよびTP,H)を特定した。したがって、温度(TP,LおよびTP,H)を特定することは、maxE2が上記のしきい値(maxE/e4)よりも大きい場合に、TP,Lを、[TMIN,TA,L−(B+W)]内のEM2(T)>maxE2/eである最も小さなTとすることを含む。TP,Hは、[TMIN,TA,L−(B+W)]内のEM2(T)>maxE2/eである最も大きなTである。図20のステップ2070を参照されたい。したがって、TP,L<T<およびTP,Hの外側では、EM2(T)値>maxE2/eであり、これは、この記述が保持する[TMIN,TA,L−(B+W)]の最も小さな部分区間である。
【0233】
プローブ解析についても、アンプリコン解析と同様に、バッファ値(B)および幅(W)区間を使用して、プローブ領域TP,L<T<TP,Hを、TP,L−B<T<TP,H+BまたはTP,L−(B+W)<T<TP,L+(B+W)に拡張した。図20のステップ2080を参照されたい。
【0234】
図31は、テンプレート無しコントロールの自動排除、アンプリコン領域およびプローブ領域の自動特定、積分された偏差プロット上で試料が1から0へ変化するようにするプローブ領域偏差データの正規化、自動ジェノタイピングのための曲線のクラスタリング、および積分された偏差プロットとしての(累積偏差の百分率としての)プローブデータの作図の後の、F5プローブ解析の結果を示す。図32のプレートマップは、遺伝子型およびネガティブコントロール試料(前述の偏差解析技法を使用して特定したネガティブ試料)の正しいパターンを示している。
【0235】
図33は、融解曲線データを解析するシステム3300のブロック図である。このシステムは、コンピューティングデバイス3310を含み、コンピューティングデバイス3310は、1つまたは複数のプロセッサ(図示せず)、メモリ(図示せず)、コンピュータ可読媒体3312、1つまたは複数のHMIデバイス3314(例えば入出力デバイス、ディスプレイ、プリンタなど)、1つまたは複数の通信インタフェース3316(例えばネットワークインタフェース、ユニバーサルシリアルバス(USB)インタフェースなど)などを備えることができる。あるいは、またはこれに加えて、システム3300は、ローカルクラスタおよび/または分散クラスタ(図示せず)内に、複数のコンピューティングデバイス3310を備えることができる。
【0236】
コンピューティングデバイス3310を、融解曲線データ源3320に通信可能に結合することができ、融解曲線データ源3320は、融解曲線生成機器(例えばRoche Diagnostics,GmbH.から市販されているLightCycler(登録商標)デバイス、HR−1(商標)高分解能融解機器など)を備えることができる。あるいは、またはこれに加えて、データ源3320は、融解曲線データを含むコンピュータ可読媒体を備えることができる。
【0237】
コンピュータ可読媒体3312からコンピュータ可読プログラムコードをロードするように、コンピューティングデバイス3310を構成することができる。このプログラムコードは、本明細書に開示したシステムおよび方法(例えば方法300、1600、1700、2000、2200、2400など)またはそれらの変型システムおよび方法のうちの1つまたは複数のシステムまたは方法を実現するプロセッサ実行可能命令またはプロセッサ解釈可能命令を含むことができる。これらの命令は、コンピュータ可読媒体3312上の1つまたは複数の別個のソフトウェアモジュールとして具体化することができる。これらのモジュールは、データ源3320の融解曲線データにアクセスするように構成されたデータ取得モジュール3332、バックグラウンド蛍光のモデルにアクセスするように構成されたモデル化モジュール3334、融解曲線データに対して偏差解析を実行する(例えば、とりわけ図3の方法300に従って偏差関数を生成する)ように構成された解析モジュール3336、(HMI3314を介した)融解曲線データの表示、および/または前述の偏差解析技法を使用した融解曲線データの追加の処理(例えば自動ネガティブ試料の特定、指数バックグラウンド差引き、融解領域の特定、クラスタリングなど)を提供するように構成された処理モジュール3338、ならびに人間ユーザ(図示せず)によるシステム3300の制御、および/または他のコンピューティングデバイスもしくはエージェント(図示せず)などの1つもしくは複数の外部プロセス(図示せず)によるシステム3300の制御を提供するように構成された制御モジュール3339を備えることができる。
【0238】
制御モジュール3339は、前述のとおりに、融解曲線データを取得し、かつ/もしくは融解曲線データにアクセスし、融解曲線データに対する偏差解析を実行し、および/または解析されたデータを表示するように、システム3300を導くことを可能にすることができる。例えば、制御モジュール3339は、融解曲線データ、クラスタリングの結果、ジェノタイピングの結果、スキャニングの結果などのHMI3314上への表示を提供することができる。したがって、制御モジュール3339は、ユーザインタフェース制御をHMI3314上に表示し、および/またはHMI3314からユーザ入力を受け取るように構成されたユーザインタフェース(図示せず)を備えることができる。さらに、1つまたは複数の通信インタフェース3316を介してコマンドおよび/または命令を(例えばリモートコンピューティングデバイス、エージェントなどから)受け取るように、制御モジュール3339を構成することもできる。制御モジュール3339は、自動ネガティブ試料の特定、融解領域の特定、バックグラウンド差引き、表示、クラスタリングおよび他のプロセスを実行するため、ユーザおよび/または外部プロセスからプログラミングコマンドを受け取ることができる。さらに、偏差解析処理の結果をコンピュータ可読媒体3312に記憶し、および/または1つまたは複数の通信インタフェース3316上でそれらの結果を送信するように、制御モジュール3339を構成することもできる。
【0239】
ある実施形態では、本明細書に開示した偏差解析技法(例えば方法300、1600、1700、2000、2200、2400またはこれらの方法の変型法)を使用して、ジェノタイピングプロセスおよび/またはスキャニングプロセスを自発的に実行するように、システム3300が構成される。上で論じたとおり、本明細書に開示した偏差解析技法は、特定の一組の融解曲線解析用途だけに限定されず、本明細書に開示した偏差解析技法を使用して多数の融解曲線解析用途を実現するように、システム3300を構成することができる。したがって、本開示およびシステム3300が、特定の一組の融解曲線偏差解析用途に限定されると解釈すべきではない。
【0240】
以上の説明では、本明細書に記載した実施形態を完全に理解できるように、多数の具体的な詳細を示した。しかしながら、それらの具体的な詳細のうちの1つもしくは複数の詳細を省くことができ、または、その他の方法、構成要素もしくは材料を使用することができることを、当業者なら理解するであろう。いくつかの場合には、操作を詳細には示さず、または説明しなかった。
【0241】
さらに、1つまたは複数の実施形態において、記載した特徴、操作または特性を適当な方法で組み合わせることができる。当業者には明らかなことだが、開示した実施形態に関して説明した方法のステップまたは実行の順序を変更することができることも容易に理解される。したがって、図面または詳細な説明内における順序は、例示だけが目的であり、その順序が必須であると明示されない限り、どの順序も、必須の順序であることを含意するものではない。
【0242】
実施形態は、さまざまなステップを含むことがあり、それらのさまざまなステップは、汎用または専用コンピュータ(または他の電子デバイス)によって実行される機械実行可能命令として具体化することができる。それらの機械実行可能命令は、コンピュータ可読記憶媒体上において具体化することができる。ある実施形態では、これらの命令が、1つまたは複数の別個のソフトウェアモジュールとして具体化される。あるいは、1つまたは複数のステップを、それらのステップを実行する特定の論理を含むハードウェアコンポーネントによって、または、ハードウェア、ソフトウェアおよび/またはファームウェアの組合せによって実行することができる。
【0243】
実施形態は、本明細書に記載したプロセスを実行するようにコンピュータ(または他の電子デバイス)をプログラムするのに使用することができる命令を記憶したコンピュータ可読媒体を含むコンピュータプログラム製品として提供することもできる。このコンピュータ可読媒体には、限定はされないが、ハードドライブ、フロッピーディスケット、光ディスク、CD−ROM、DVD−ROM、ROM、RAM、EPROM、EEPROM、磁気もしくは光学カード、固体メモリデバイス、または電子的な命令を記憶するのに適した他のタイプの媒体/機械可読媒体が含まれる。
【0244】
本明細書で使用するとき、ソフトウェアモジュールまたはコンポーネントは、メモリデバイスおよび/またはコンピュータ可読記憶媒体内に位置する任意のタイプのコンピュータ命令またはコンピュータ実行可能コードを含むことができる。ソフトウェアモジュールは例えば、1つまたは複数のタスクを実行し、または特定の抽象データ型を実現するルーチン、プログラム、オブジェクト、コンポーネント、データ構造などとして編成することができるコンピュータ命令の1つまたは複数の物理または論理ブロックを含むことができる。
【0245】
ある種の実施形態では、特定のソフトウェアモジュールが、メモリデバイスの異なる位置に記憶された異種の命令を含み、それらの命令は、協力して、そのモジュールの記載された機能を実現する。そのモジュールは、コンピュータ可読記憶媒体上において具体化し、および/または記憶媒体上の別個のモジュールとして具体化することができる。モジュールは、単一の命令または多くの命令を含むことができ、異なるいくつかのコードセグメントにわたって、異なるプログラムの中に、および/またはいくつかのメモリデバイスにわたって分散させることができる。ある実施形態は、通信ネットワークを介してリンクされたリモート処理デバイスによってタスクが実行される分散コンピューティング環境で実施することができる。分散コンピューティング環境では、ソフトウェアモジュールを、ローカルメモリ記憶デバイスおよび/またはリモートメモリ記憶デバイス内に配置することができる。さらに、データベースレコードとして連結されまたは一緒にされているデータは、同じメモリデバイス内に、またはいくつかのメモリデバイスにわたって常駐していることがあり、ネットワークにわたってデータベース内のあるレコードのフィールド内でリンクされていることがある。
【0246】
根底にある本発明の原理から逸脱することなく前述の実施形態の詳細に多くの変更を実施することができることを当業者なら理解するであろう。
【技術分野】
【0001】
本開示は、融解曲線の解析に関し、具体的には、核酸、タンパク質などの化合物の融解曲線の自動解析システムおよび自動解析法に関する。
【発明の概要】
【発明が解決しようとする課題】
【0002】
【課題を解決するための手段】
【0003】
【図面の簡単な説明】
【0004】
【図1】図1は、融解曲線の直線ベースライン解析を示すプロットである。
【図2】図2は、複数の遺伝子型および低温における指数バックグラウンド蛍光を示す、非標識プローブ融解実験の未変更の実験的な融解曲線のプロットである。
【図3】図3は、実験的な融解曲線の偏差関数を生成する方法の一実施形態の流れ図である。
【図4】図4は、ヘアピン構造の例示的な未変更の実験的な融解曲線のプロットを示す図である。
【図5】図5は、図4の融解曲線の導関数プロットを示す図である。
【図6】図6は、指数バックグラウンド差引き後の図4の融解曲線の導関数プロットを示す図である。
【図7】図7は、図4に示したデータの偏差関数のプロットを示す図である。
【図8】図8は、図4に示したデータの指数バックグラウンド差引き後の正規化された融解曲線のプロットを示す図である。
【図9】図9は、図4に示したデータの積分された偏差関数のプロットを示す図である。
【図10】図10は、多重ジェノタイピングのための指数バックグラウンド差引き後の融解曲線データの導関数プロットを示す図である。
【図11】図11は、図10に示した融解曲線データの偏差プロットを示す図である。
【図12A】図12Aは、平滑化された例示的なタンパク質融解曲線を示す図である。
【図12B】図12Bは、図12Aの平滑化されたタンパク質融解曲線の導関数プロットを示す図である。
【図12C】図12Cは、図12Aのタンパク質融解曲線データの偏差関数プロットを示す図である。
【図12D】図12Dは、バックグラウンド補正後の導関数融解曲線を示す図である。
【図13】図13は、図12Aのタンパク質融解曲線の正規化されたアンフォールディング曲線の導関数プロットを示す図である。
【図14A】図14Aは、平滑化された例示的なタンパク質融解曲線を示す図である。
【図14B】図14Bは、図14Aの平滑化されたタンパク質融解曲線の導関数プロットを示す図である。
【図14C】図14Cは、図14Aのタンパク質融解曲線データの偏差関数プロットを示す図である。
【図14D】図14Dは、バックグラウンド補正後の導関数融解曲線を示す図である。
【図15】図15は、図14Aのタンパク質融解曲線の正規化されたアンフォールディング曲線の導関数プロットを示す図である。
【図16】図16は、偏差解析を使用してネガティブ試料を特定する方法の一実施形態の流れ図である。
【図17】図17は、偏差解析を使用してネガティブ試料を特定する方法の他の実施形態の流れ図である。
【図18】図18は、融解曲線のバックグラウンド領域および/または融解領域を自動的に特定する方法の一実施形態の流れ図である。
【図19】図19は、例示的な偏差関数のプロットを示す図である。
【図20】図20は、アンプリコンバックグラウンド領域および/またはアンプリコン融解領域ならびにプローブバックグラウンド領域および/またはプローブ融解領域を自動的に特定する方法の一実施形態の流れ図である。
【図21A】図21Aは、アンプリコン融解領域およびプローブ融解領域を含む融解曲線の偏差関数のプロットである。
【図21B】図21Bは、プローブ融解領域の偏差関数のプロットである。
【図21C】図21Cは、カーソルプローブ領域を特定するプロセスの他の例を示す図である。
【図22】図22は、自動バックグラウンド差引き法の一実施形態の流れ図である。
【図23A】図23Aは、例示的な理想曲線および融解曲線を示す図である。
【図23B】図23Bは、例示的な理想曲線および融解曲線を示す図である。
【図24】図24は、自動バックグラウンド差引き法の他の実施形態の流れ図である。
【図25】図25は、不偏階層法によって正確に自動クラスタリングされた偏差プロットを示す図である。
【図26】図26は、不偏階層法によって正確にクラスタリングされていない、指数バックグランド除去後の導関数プロットを示す図である。
【図27】図27は、PCR融解解析後のネガティブ試料を含む一組の未変更の融解曲線を示す図である。
【図28】図28は、振幅カットオフ技法を使用したネガティブ試料排除後の一組のネガティブ試料インジケータを示す図である。
【図29】図29は、偏差解析を使用したネガティブ試料排除後の一組の融解曲線を示す図である。
【図30】図30は、偏差解析を使用したネガティブ試料排除後の一組のネガティブ試料インジケータを示す図である。
【図31】図31は、偏差解析によるプローブ融解領域およびアンプリコン融解領域の自動位置設定後の偏差プロットを示す図である。
【図32】図32は、一組のネガティブ試料/クラスタメンバシップインジケータを示す図である。
【図33】図33は、融解曲線データを解析するシステムのブロック図である。
【発明を実施するための形態】
【0005】
追加の態様および利点は、添付図面を参照して展開される好ましい実施形態の以下の詳細な説明から明らかになるであろう。
【0006】
融解曲線の解析は、さまざまな物質の研究に役立つ。特に、核酸は、融解曲線によって広範囲に研究されており、融解曲線の差異によりさまざまな核酸配列を示すことができる。融解曲線は、タンパク質の結合の研究でも使用されており、特性融解曲線が、特定のリガンドに対するタンパク質の結合親和性を示す。本明細書では核酸およびタンパク質の融解を参照するが、他の化合物の融解曲線の解析も本開示の範囲に含まれることが理解される。
【0007】
本明細書の一例では、融解曲線の解析が、核酸生成物の特定および/または構造に関する情報を提供する。核酸構造内の(例えば2本のDNA鎖間の)塩基−塩基水素結合を切るのに必要なエネルギー量は、その核酸生成物の構造に関連した因子に依存することがある。このような因子には、限定はされないが、長さ、相補性、グアニン−シトシン(GC)含量量、反復配列の有無などが含まれる。
【0008】
融解曲線は、核酸生成物を含む溶液にエネルギー勾配を与える(例えば核酸生成物を含む溶液を加熱する)ことによって得ることができる。エネルギーが加えられ、溶液の温度が上昇すると、核酸生成物は変性する(例えば解離する)ことがある。この例は温度の上昇に関するが、当技術分野では、他の融解法、例えばイオン濃度を変化させる勾配も知られている。融解曲線は、この解離が起こる程度を、温度(または他の融解勾配)の関数として測定することによって生成することができる。例えば、参照によって本明細書に組み込まれる米国特許第5,871,908号を参照されたい。したがって、本明細書で使用するとき、融解曲線は、温度、イオン濃度などの融解勾配に反応して化合物がその構造を変化させる程度(例えば、核酸生成物に加えられたエネルギー勾配に応じて核酸生成物中の鎖が解離する程度)を定量化する測定値を含む任意のデータセットを指すことがある。
【0009】
ある実施形態では、この解離を電気光学的に測定する。結合染料を含む溶液に核酸生成物(または他の化合物)を入れる。この結合染料は、2本鎖DNA(dsDNA)に結合しているときに電気光学(EO)放射を放出するように適合されている。生成物が解離すると、結合染料はEO放射の放出をやめる(または、後に論じるように、低レベルのEO放射を放出する)。これに応じて、溶液にエネルギーを加えたときに(例えば溶液の温度を上昇させたときに)溶液から放出されるEO放射(蛍光)の測定値を取得することにより、融解曲線を生成する。さらに、本開示は、融解時に蛍光が低減する実施形態だけに限定されないことが理解される。G−クエンチング単標識プローブ(G−クエンチング・シングルラベル・プローブ)を使用する実施形態など、いくつかの実施形態では、融解すると蛍光信号が増大する(例えば米国特許第6,635,427号参照)。
【0010】
したがって、融解曲線は、一連のEO放射測定値(例えば溶液から放出された蛍光の測定値)を温度の関数として含むことがある。しかしながら、他の方法で取得した解離測定値を含む他の融解曲線に、本開示の教示を適用することもできる。したがって、融解曲線データを取得する(例えば、核酸の解離を定量化する測定値を、溶液に加えたエネルギーの関数として取得する)特定の方法および/または技法に、本開示が限定されると解釈すべきではない。
【0011】
上で論じたように、融解曲線から、核酸生成物の構造に関する情報を推測することができる。そのため、融解曲線データを使用して、ポリメラーゼ連鎖反応(PCR)生成物を調べることができる。PCR生成物の融解曲線は、結合染料の存在下でPCR反応の生成物を加熱することによって取得することができる。上で論じたように、この結合染料は、dsDNAに結合しているときの方が、1本鎖DNA(ssDNA)に結合しているときよりも強い蛍光を発するように適合されている。したがって、PCR生成物が主にdsDNAとして存在する比較的に低い温度において、この溶液は、比較的に高いレベルの蛍光を発する。溶液の温度を上昇させると、生成物は、2本のssDNAに解離(例えば変性)し、それによって、溶液は、より低レベルの蛍光を発する。PCR生成物は、dsDNA状態からssDNA状態への相転移を、幅の狭い温度窓内で経験することがある。前述のとおり、この転移は、溶液が発する蛍光を低減させることがある。この転移が起こる温度窓を、融解領域、融解転移および/または融解窓と呼ぶことがある。
【0012】
このような融解曲線実験で一般的に使用される結合染料には、温度に応じて、溶液中で自ら蛍光を発するものがある。例えば、dsDNAが存在しない場合、(アイダホ・テクノロジー社から販売されており、アイダホ・テクノロジー社の登録商標である)LCGreen(登録商標) Plusなどの結合染料の蛍光信号は、温度の関数として単調に低減する。したがって、前述の方法で(例えば核酸生成物と結合染料の溶液を加熱したときに放出されたEO放射を測定することによって)取得した融解曲線は、dsDNA生成物に結合した染料によって放出された蛍光と、溶液中の結合染料および/またはssDNAに結合した染料が自ら発したバックグラウンド蛍光との組合せを含むことがある。
【0013】
したがって、結合染料の存在下で核酸生成物を融解させることによって取得した生の測定蛍光信号は、生成物の融解(溶液を加熱したときのdsDNAからssDNAへの生成物の解離)に起因する蛍光とバックグラウンド蛍光の和としてモデル化することができる。式1は、「真の」融解曲線M(T)(例えば核酸生成物の融解によって生じた蛍光)とバックグラウンド蛍光B(T)の和を含む実験的な融解曲線F(T)を示す。
【0014】
【数1】
【0015】
上で論じたように、実験的な融解曲線F(T)から、核酸生成物に関する情報(例えば生成物の構造、組成など)を推測し、および/または求めることができる。しかしながら、実験的な融解曲線データF(T)の解析は、そのバックグラウンド蛍光B(T)成分によって複雑になることがある。バックグラウンド蛍光B(T)信号をモデル化し、実験的な融解曲線データF(T)からバックグラウンド蛍光B(T)信号を除去するさまざまなシステムおよび方法が開発されている。
【0016】
一例では、バックグラウンド蛍光B(T)が1次関数としてモデル化される。一般的な多くの染料の蛍光は、温度とともに直線的に低減する(ある温度範囲にわたって温度の上昇とともに低減する)。核酸融解曲線では、融解領域内で、生成物の蛍光が急激に低減する。しかしながら、融解領域の外側では、温度に伴う蛍光変化がほぼ直線的である。したがって、融解転移前の直線ベースラインおよび融解転移後の直線ベースラインを外挿することによって、実験的な融解曲線を正規化することができる。
【0017】
図1は、直線ベースラインL1(T)およびL0(T)を有する実験的な融解曲線F(T)を示す。正規化された融解曲線は、上ベースラインと下ベースラインの差に対する、下ベースライン(L0(T))よりも上の実験的な融解曲線F(T)の高さの比として計算することができる。上ベースラインと下ベースラインの勾配は同じであることも、同じでないこともある。
【0018】
図2は、非標識プローブの存在下で非対称PCR反応の生成物を融解させることによって得た融解曲線のプロットを示す。この曲線は、非標識プローブの融解転移とPCR生成物の融解転移の両方を含む。図2に示すように、融解曲線の非直線性のため、上直線ベースラインと下直線ベースラインとが融解曲線よりも下で交差し、図1に示した1次補償方程式の分母がゼロになるため、前述の直線ベースライン法の使用には問題がある。
【0019】
代替手法では、指数減衰関数を使用して、バックグラウンド蛍光B(T)をモデル化する。指数バックグラウンドモデル化および指数バックグラウンド差引き(subtraction)のためのシステムおよび方法は、参照によってその全体が参照によって組み込まれる2006年9月20日に出願された「MELTING CURVE ANALYSIS WITH EXPONENTIAL BACKGROUND SUBTRACTION」という名称のPCT出願第WO2007/035806号に記載されている。
【0020】
経験的証拠は、ある温度(例えば85℃よりも低い温度)では、結合染料からのバックグラウンド蛍光信号を、以下の形の減衰指数関数として正確にモデル化することができることを示している。
【0021】
【数2】
【0022】
式2で、Cおよびaは、融解曲線データF(T)からフィット(fit)させるための定数、TLは、指数部の引数に対するシフティングパラメータ(カーソル位置(後述))であり、一般に、融解曲線F(T)内の融解転移よりも下に位置する。
【0023】
とりわけ、融解領域の前後ではバックグラウンド蛍光のスケールが変化するため、式2のバックグラウンド蛍光モデルは、観察された蛍光のデータに直接にはフィットしない可能性がある。バックグラウンド蛍光B(T)をモデル化するのに使用する指数関数の特性(例えば指数関数の導関数が指数関数であること)に基づいて、式3を得ることができる。
【0024】
【数3】
【0025】
このバックグラウンド蛍光モデルによれば、融解転移領域の前後で、生成物融解関数が一定である。融解転移領域を間に挟むように2つの温度を選択することができる。融解転移領域の前に第1の温度TLを選択し、融解転移領域の後に第2の温度TRを選択することができる。本明細書ではこれらの温度を「正規化カーソル」と呼ぶことがある。式2と式3を結合することによって、正規化カーソルTLおよびTRを使用して、指数バックグラウンド信号B(T)のモデルを構築することができる。
【0026】
【数4a】
【0027】
【数4b】
【0028】
観察された蛍光データの導関数は、例えば中心差分法(セントラル・ディラレンシング法)を使用して近似することができる。式4aおよび4bを、aおよびCについて解くと、式5aおよび5bが得られる。
【0029】
【数5a】
【0030】
【数5b】
【0031】
式5aおよび5bの結果を使用して、バックグラウンド蛍光B(T)のモデルを構築することができる。実験的な融解曲線F(T)からこのモデルを差し引くと、「真の」融解曲線M(T)が得られる。
【0032】
【数6】
【0033】
一般に、操作者は、バックグラウンド蛍光B(T)をモデル化するために(例えば式3〜6で)使用する正規化カーソル位置(TLおよびTR)を手動で選択する。この操作は、融解曲線データについて事前にある程度の知識を有し、および/または、生の実験的な融解曲線データF(T)を適切に解釈する技能および経験を有する(例えば融解転移がどこで起こったのかなどが分かる)ことを操作者に要求することがある。本明細書に開示するシステムおよび方法は、融解曲線データF(T)内のバックグラウンド領域と融解領域とを、偏差解析(後述)を使用して特定することによって、実験的な融解曲線F(T)の自動解析を提供することができる。したがって、本明細書に開示する偏差解析システムおよび方法は、この手動操作の必要性を回避する(例えば、融解領域についての事前の知識および/または融解領域の手動推定の必要性を排除する)ことができる。
【0034】
用途によっては、融解曲線データが、正規化された蛍光曲線として示され、この正規化された蛍光曲線では、融解曲線M(T)が、例えば1(完全にアニールしている)から0(完全に解離している)までに再スケーリングされる。ある実施形態では、以下の変換を使用して、融解曲線M(T)がN(T)に正規化される。
【0035】
【数7】
【0036】
1次バックグラウンドモデル化/バックグラウンド除去技法および指数バックグラウンドモデル化/バックグラウンド除去技法は、多くの用途で有用であることがある。例えば、1次モデルは、80から95℃までの間のTmを有するPCR生成物に対する良好なフィットであり、指数モデルは、解析する温度範囲が20℃以下であるときに良好なフィットである。しかしながら、温度が80℃未満であり、および/または解析する温度範囲が20℃より高いとき、(緩衝液、dNTP、プライマなどによって生成された蛍光を含む)バックグラウンド蛍光B(T)信号は、1次モデルにも、指数モデルにも従わない可能性がある。具体的には、80℃未満の温度は、予想されるバックグラウンドからの偏差を示し、70℃未満の温度は、よりいっそう大きな偏差を示し、60℃、50℃および40℃では偏差が次第に増大する。温度範囲に関して、20℃より高い範囲でも、バックグラウンドは、単純な1次および指数モデルから外れることがある。解析範囲が、30℃、40℃、50℃および60℃と増大するにつれて、1次または指数モデルからのバックグラウンドの偏差は増大する。これらの低温解析条件および/または範囲の広い解析条件下においては、後述する偏差解析が、固定されたモデル化に対する良好な代替となる可能性がある。例えば、非標識プローブ、スナップバック・プライマおよびマルチプレックス・スモール・アンプリコンの融解は全て、しばしば20℃より高い範囲で起こり、一部は80℃未満の温度で起こる複数の融解転移に帰着しうる。非標識プローブ、スナップバックプライマおよびマルチプレックススモールアンプリコンの融解に関する追加の情報は、参照によってそれらの全体が本明細書に組み込まれる「L.Zhou他、Snapback Primer Genotyping with Saturating DNA Dye and Melting Analysis、54(10)Clin.Chem.1648〜56(2008年10月)」、米国特許第7,387,887号、および2008年3月7日に出願された「PRIMERS FOR MELTING ANALYSIS」という名称のPCT公開第WO2008/109823号に出ている。
【0037】
核酸融解曲線は、核酸の配列に関する情報を得るために使用されているが、タンパク質融解曲線はしばしば、タンパク質の熱力学的安定性を測定するために使用される。タンパク質の熱安定性を評価するためには、タンパク質のネイティブの構造が熱力学的に安定である温度よりも高い温度まで温度を上昇させる。タンパク質はアンフォールドし、以前はタンパク質構造中に隠れていた疎水性アミノ酸残基が露出する。タンパク質の融解では、熱傾斜の中点としてしばしばTmが定義され、Tmは、ネイティブの形の自由エネルギーとネイティブでない形の自由エネルギーが等しい温度を表す。例えば、タンパク質を、単独で、およびリガンドの存在下で融解させ、安定性の摂動を使用して、ライブラリをスクリーニングすることができる。追加の情報は、参照によってその全体が本明細書に組み込まれる「D.Matulis他、Thermodynamic Stability of Carbonic Anhydrase:Measurements of Binding Affinity and Stoichiometry Using ThermoFluor、Biochemistry 2005、44、5258〜5266」に出ている。
【0038】
上で論じた核酸融解曲線の解析と同様に、タンパク質融解曲線も、式1のF(T)=M(T)+B(T)の形で表すことができる。典型的なタンパク質融解と典型な核酸融解の主な違いB(T)は、タンパク質融解では、タンパク質が変性するにつれてEO放射信号が増大することである。典型的なタンパク質融解曲線を図12Aおよび14Aに示す。図12Aの例では、温度が40度に向かって上昇すると、熱消光(サーマル・クエンチング)によって蛍光が低減する。タンパク質に応じて、アンフォールディングは通常40から60℃までの間の温度で始まり、露出した疎水性残基により多くの染料が結合するため、このアンフォールディングは蛍光の増大として観察される。最終的には、タンパク質の凝集および沈殿が(通常は45から75℃までの間で)起こり、それに熱消光が加わるため、蛍光は再び低減する。図12Aには、一般的に観察される安定性および強度の範囲を示す、よく知られている6種類のタンパク質の融解が示されており、濃度は全て2.25μMである。
【0039】
経験的証拠は、融解転移よりも高い高温(タンパク質によって例えば60〜90℃)では、結合染料からの残留蛍光を、下の形の2次多項式によってモデル化することができることを示している。
【0040】
【数8】
【0041】
式8で、ai、biおよびciは、実験的な融解曲線データF(T)からフィットさせるための定数である。次いで、タンパク質融解曲線を、前述のF(T)=M(T)+B(T)の形で表すことができる。式1を参照されたい。式8の定数は一般に、バックグラウンド領域内の連続するある温度範囲にわたって集めた蛍光データに対する最小2乗フィットによって見つける。
【0042】
本開示は、バックグラウンド蛍光信号の例示的な指数モデルおよび2次モデルの使用を教示するが、この点に関して本開示は限定されない。当業者には理解されるであろうが、当技術分野で知られている任意のモデル化技法および/またはモデル化形態とともに機能するように、本明細書に教示する偏差関数(および関連解析技法)を適合させることができる。
【0043】
前述のとおり、操作者は一般に、融解曲線中のバックグラウンド蛍光B(T)を(例えば式8において)モデル化するために使用する温度領域を手動で選択する。この操作は、融解曲線データについて事前にある程度の知識を有し、および/または、生の実験的な融解曲線データF(T)を適切に解釈する技能および経験を有する(例えば融解転移がどこで起こったのかなどが分かる)ことを操作者に要求することがある。本明細書に開示するシステムおよび方法は、融解曲線データF(T)内のバックグラウンド領域と融解領域とを、偏差解析(後述)を使用して特定することによって、実験的な融解曲線F(T)の自動解析を提供することができる。したがって、本明細書に開示する偏差解析システムおよび方法は、この手動操作の必要性を回避する(例えば、融解領域およびバックグラウンド領域についての事前の知識ならびに/または融解領域およびバックグラウンド領域の手動推定の必要性を排除する)ことができる。
【0044】
融解曲線データは、導関数の形で(例えば正規化された融解曲線N(T)の導関数または負の導関数として)表すことができる。しかしながら、融解曲線M(T)は、常に等間隔であるとは限らない離散的な温度測定で集められ、少量の雑音を含むことがあるため、データを(例えば3次元平滑化スプライン(3次元スムージングスプライン)を使用して)平滑化することができ、および/または均一な温度測定値で再サンプリングすることができる。中心差分技法または他の技法を使用して、融解曲線の導関数を近似することができる。単一の融解転移を含む融解曲線については、導関数曲線のピークを「融解転移」ないしTMとして示すことができる。複数の融解転移を含む融解曲線については、融解転移ピークを特定し、および/またはそれに応じて番号(例えばTM1、TM2、...、TMn)をつけることができる。
【0045】
融解曲線データを、偏差関数に換算して表示し、および/または解析することができる。この偏差関数は、実験的な融解曲線データF(T)がバックグラウンド蛍光B(T)のモデルから外れる程度を定量化することができる。上で論じたとおり、ある実施形態では、とりわけ指数減衰関数を使用して、バックグラウンド蛍光B(T)をモデル化する(例えば融解曲線の「理想」モデル化)。したがって、偏差関数は、実験的な融解曲線F(T)の指数減衰率と(例えば上式2に基づく)バックグラウンド蛍光モデルの指数減衰率との間の偏差に基づくことがある。
【0046】
偏差解析は、一連の温度窓内において実験的な融解曲線F(T)を予め定義された関数にフィットさせることによって計算した複数のフィットパラメータを生成することを含むことができる。したがって、偏差関数(本明細書ではE(T)と称する)は、実験的な融解曲線F(T)が予め定義された関数から外れる程度を、温度の関数として定量化することができる。
【0047】
後に論じるが、融解曲線の偏差関数E(T)は、融解曲線データを(例えば検査、視覚化、作図などによって)直接に解析するために使用することができ、および/または別の融解曲線解析プロセスもしくはシステムで使用することもできる。本明細書に開示した偏差関数E(T)の用途には、限定はされないが、(例えばジェノタイピング、スキャニングなどに使用する融解曲線間の差異を強調するために)融解曲線データを表示し、作図すること、ネガティブ試料(例えばネガティブコントロール試料、無効データなど)を自動的に特定すること、融解領域および/またはバックグラウンド領域の特定を自動化すること、融解曲線クラスタリングを自動化すること、ジェノタイピングおよび/またはスキャニング操作を自動化すること、バックグラウンド蛍光B(T)の差引きを自動化することなどがある。しかしながら、本明細書に開示された偏差解析システムおよび偏差解析法を、別の融解曲線用途で使用することもできることを当業者なら理解するであろう。したがって、偏差解析を生成し、および/または本明細書に開示された融解曲線解析に偏差解析を適用するためのシステムおよび方法が、特定の一組の用途に限定されると解釈すべきではない。
【0048】
偏差関数E(T)の生成は、実験的な融解曲線F(T)と所定の関数との間のランニングフィットを計算することを含むことができる。この所定の関数は、実験的な融解曲線F(T)内のバックグラウンド蛍光B(T)のモデル(本明細書では理想融解曲線と呼ぶ)を含むことができ、このモデルは、上で論じたように、指数減衰関数を使用して近似することができる。式2〜6を参照されたい。
【0049】
実験的な融解曲線F(T)は、温度区間[Tmin,Tmax]内で定義することができる。ランニングフィットは、実験的な融解曲線の温度区間(例えば[Tmin,Tmax]または[Tmin,Tmax−W])内の幅がそれぞれWの複数の温度窓(TW)内で実行することができる。
【0050】
【数9】
【0051】
式9で、TWLは、温度窓TWの最低温度または「開始」温度を表す。温度窓TWの幅Wは、融解曲線データの分解能(例えば実験的な融解曲線F(T)データの密度および/または精度)ならびに/または融解曲線データから抽出する特徴に応じて選択することができる。幅Wは、温度窓TW内の雑音のランダム変化を平滑化するために十分に大きく、同時に、関心の特徴を分解するために十分に小さくなるように選択することができる。
【0052】
偏差関数E(T)は、区間[Tmin+W/2,Tmax−W/2]のTiによって表される均一な離散化に対して定義される。例えば、温度窓TW間の温度間隔ΔTを下式として定義することができる。
【0053】
【数10】
【0054】
ΔT(温度窓TW間の間隔)の選択は、実験的な融解曲線F(T)の分解能、性能考慮事項、実験的な融解曲線F(T)から抽出する特徴の性質などに基づくことができる。温度間隔ΔTは、連続する任意の2つの融解曲線データ点間の最大差よりも大きく(例えば実験的な融解曲線F(T)内の最も粗い温度分解能よりも大きく)なるように選択することができる。
【0055】
各温度窓TW内で、予め定義された関数と実験的な融解曲線F(T)の間のフィットを計算することができる。フィットごとにフィットパラメータを得ることができ、そのフィットパラメータを、温度窓TWに関連づけられたある点(温度値)に割り当てることができる。特定の温度窓TWに関連づけられた温度点を、(範囲[Ti−W/2,Ti+W/2]を含む温度窓に対する)Tiと呼ぶことがある。
【0056】
例えば、この形の偏差関数は、核酸融解曲線に対して適している。上で論じたように、偏差関数E(T)を生成するために使用するこの予め定義された関数は、実験的な融解曲線内のバックグラウンド蛍光B(T)(例えば「理想」融解曲線)をモデル化するように構成された指数減衰関数とすることができる。この予め定義された関数が指数減衰関数を含む場合、前記フィットは、下式のようになるように、パラメータCiおよび/またはaiを選択することを含むことができる。
【0057】
【数11】
【0058】
式11のフィットは、例えば最小2乗フィッティング技法など、当技術分野で知られている任意のフィッティング技法を使用して実施することができる。
【0059】
ある実施形態では、数値的に安定させるために、指数関数形の式11を、温度窓TW内の左端の温度値にシフトさせる(例えば左へシフトさせる)。
【0060】
指数減衰因子aiを使用して、フィットパラメータTiごとに下式のようになるように、偏差関数E(T)を形成することができる。
【0061】
【数12】
【0062】
上で示したとおり、式12の偏差関数は、実験的な融解曲線F(T)の指数減衰因子と「理想」融解曲線との間の偏差を温度の関数として定量化する。純粋な指数バックグラウンドについては、指数減衰因子が定数となることがある。したがって、その定数からの偏差を、2重鎖(duplex)融解(例えばバックグラウンド減衰と組み合わさった核酸生成物の融解)の結果とすることができる。ある実施形態では、この指数関数からの偏差を表すのに、偏差関数の最小値を偏差関数から差し引く。複数の曲線を、ピーク高さによって互いに正規化することができる(例えばE(T)−min{E(T)}/max{E(T)}−min{E(T)})。あるいは、またはこれに加えて、それぞれの曲線を数値積分で除することによって、全ピーク面積による正規化を実行することもできる。(正規化された融解曲線に類似の)積分された偏差プロットE(T)は全てのプロットが同じ値から始まり、同じ値で終わるため、ピーク面積正規化の方が有利であることがある。
【0063】
あるいは、またはこれに加えて、振幅定数Ci、ならびに/または振幅因子と減衰因子Ciおよび/またはaiの組合せを、偏差関数E(T)に組み込むこともできる。他の実施形態では、偏差関数が、融解曲線データとバックグラウンド蛍光B(T)の他のモデル(例えば2次モデル、離散モデルなど)との間の偏差を定量化する。したがって、本明細書に開示した偏差関数が特定の所定のフィット関数に限定されると解釈すべきではない。
【0064】
タンパク質融解曲線に関しては、偏差関数E(T)の生成に使用する予め定義された関数を、例えば、実験的な融解曲線データ内のバックグラウンド蛍光B(T)をモデル化する2次多項式とすることができる。この予め定義された関数が2次多項式を含む場合、前記フィットは、下式のようになるように、パラメータai、biおよび/またはciを選択することを含むことができる。
【0065】
【数13】
【0066】
式13のフィットは、例えば最小2乗フィッティング技法など、当技術分野で知られている任意のフィッティング技法を使用して実施することができる。
【0067】
2次項に乗じる定数aiを使用して、フィットパラメータTiごとに下式のようになるように、偏差関数E(T)を形成することができる。
【0068】
【数14】
【0069】
上で示したとおり、式14の偏差関数は、実験的な融解曲線F(T)と「理想」融解曲線との間の偏差を温度の関数として定量化する。純粋な2次バックグラウンドについては、この振幅因子が定数となることがある。したがって、その定数からの偏差を、タンパク質のアンフォールディングの結果とすることができる。
【0070】
後に論じるように、(例えば融解領域/バックグラウンド領域の特定、バックグラウンド蛍光の除去、ネガティブ試料の特定、クラスタリングなどに使用する)実験的な融解曲線データF(T)の解析において、この偏差関数E(T)を使用することができる。偏差関数E(T)は、バックグラウンド蛍光B(T)のモデルと実験的な融解曲線F(T)の間の偏差を定量化することができるため、偏差関数E(T)は、本来的に、(場合によっては)(例えば1次バックグラウンド差引きおよび/または指数バックグラウンド差引きを使用する)専用バックグラウンド差引き処理に対する必要性を排除するバックグラウンド蛍光B(T)補償を含むことがある。
【0071】
図3は、実験的な融解曲線F(T)の偏差関数E(T)を生成する方法300の一実施形態を示す。ステップ310で、方法300を初期化する。この初期化は、方法300が必要とする資源を割り当て、および/または方法300が必要とする資源を初期化することを含むことができる。ある実施形態では、方法300を、コンピュータ可読記憶媒体上に記憶された命令および/または別個のソフトウェアモジュールとして具体化する。したがって、ステップ310の初期化は、コンピューティングデバイスが、それらの命令を読み取り、および/またはそれらの命令をメモリもしくは他のデバイスへロードすることを含むことができる。あるいは、またはこれに加えて、方法300は、1つまたは複数のプロセッサ、センサ、フィールドプログラマブルゲートアレイ、特定用途向け集積回路、ディジタル論理などの1つまたは複数のハードウェアコンポーネントを含むことができる。
【0072】
ステップ320で、方法300は、実験的な融解曲線F(T)を含む融解曲線データにアクセスする。
【0073】
ステップ330で、実験的な融解曲線F(T)の温度範囲を複数の温度窓TWに分割する。温度窓TWはそれぞれ、幅Wを有するように定義することができる。幅Wは、実験的な融解曲線F(T)の分解能および/または融解曲線データから抽出する特徴の性質に応じて、方法300(または方法300のユーザ)が選択することができる。上で論じたとおり、温度窓TWは、実験的な融解曲線F(T)の温度区間の均一な離散化を形成するように定義することができ、温度窓TW間の間隔を定義するΔTメトリックによっては互いに重なり合うことがある。
【0074】
ステップ340で、複数の温度窓TWのそれぞれの温度窓TWにわたって、方法300は反復する。したがって、ステップ340で、方法300は、処理すべき追加の温度窓TWがあるかどうかを判定し、処理すべき追加の温度窓TWがある場合には、フローはステップ342へ続き、ステップ342で、次の温度窓TWに対する偏差パラメータを計算し、処理すべき追加の温度窓TWがなければ、フローはステップ350へ続く。
【0075】
ステップ342で、(現在の温度窓TW内において)実験的な融解曲線F(T)と理想バックグラウンド蛍光のモデルとの間のフィットを計算する。上で論じたように、ある実施形態では、バックグラウンド蛍光を指数減衰関数としてモデル化する。実験的な融解曲線F(T)(例えば核酸融解曲線)と指数減衰関数の間のフィットの一例は、式11〜12に関して上に示されている。他の実施形態では、2次関数(または他のモデル)を使用してバックグラウンド蛍光をモデル化する。実験的な融解曲線(例えばタンパク質融解曲線)と2次モデルとの間のフィットの一例は、式13〜14に関して上に示されている。ステップ342はさらに、温度窓TWに対するフィットパラメータを求めることを含む。上で論じたように、数値的に安定させるために、フィッティングパラメータおよび/または窓を左へシフトさせることができる。
【0076】
ステップ350で、それぞれの温度窓TWのフィットパラメータを使用して偏差関数E(T)を生成する。ある実施形態では、ステップ350がさらに、偏差関数E(T)を正規化することを含む。
【0077】
ステップ360で、表示、追加の融解曲線解析などに対して、偏差関数E(T)を使用可能にする。ステップ360は、偏差関数E(T)の表現をコンピュータ可読媒体に記憶すること、その表現を、1人または数人のユーザに対して使用可能にすること、人間機械インタフェース(HMI)(例えばディスプレイ、プリンタなど)上にその表現を表示することなどを含むことができる。ステップ360はさらに、偏差関数E(T)を、別の1つもしくは複数のプロセスおよび/またはシステムに送信し、および/または、それらの別の1つもしくは複数のプロセスおよび/またはシステムに対して使用可能にすることを含むことができる。例えば、後に論じるように、自動ネガティブ試料特定プロセス、自動バックグラウンド差引きプロセスなどでこの偏差関数E(T)を使用することができる。
【0078】
前述の方法300に従って生成した偏差関数E(T)を使用して、実験的な融解曲線データF(T)を表示し、および/または、解析することができる。一例として、以下のオリゴヌクレオチドを標準法を使用して合成した。
【0079】
S5D:gttaaccACTGAtagcacgacgTCAGT (配列ID No.1)
【0080】
S7D:gttaaccACTGACAtagcacgacgTGTCAGT (配列ID No.2)
【0081】
S9D:gttaaccACTGACAGTtagcacgacgACTGTCAGT (配列ID No.3)
【0082】
上記のそれぞれのオリゴヌクレオチドの大文字の領域は相補型であり、そのため、これらのオリゴヌクレオチドは、低温において、5、7または9塩基対(bp)の幹領域を有する分子内ヘアピンを形成する。各ヘアピンには10塩基のループが存在する。各ヘアピンの短端は、ポリメラーゼの存在下で7塩基分延長され、それぞれ12、14または16塩基の幹領域を形成する。
【0083】
上に開示したオリゴヌクレオチドを含む溶液を調製することによって融解曲線データを生成した。この溶液は、最終体積10μl中に、PCR緩衝液(例えば50mMのトリス、pH 8.3、3mMのMgCl2、500μg/mlのウシ血清アルブミンを含む)中の1μMのそれぞれのオリゴヌクレオチド、200μMのそれぞれのdNTP、および染料(例えば、アイダホ・テクノロジー社から市販されている1X LCGreen(登録商標) Plus染料)を含む。一部の反応では、この溶液が、0.5UのKlenTaq 1(AB Peptides)を含み、その結果として、延長後に12、14および16塩基対のヘアピンを得た。HR−1(商標)高分解能融解機器(アイダホ・テクノロジー社から市販されている)内において、LightCycler(登録商標)毛細管(ロシュ・ダイアグノスティックス社から市販されており、ロシュ・ダイアグノスティックス社の登録商標である)を使用して、0.3℃/秒で、融解曲線データを得た。
【0084】
図4は、HR−1(商標)機器(アイダホ・テクノロジー社から市販されている)を使用して得た未変更の融解曲線の例を示す。HR−1(商標)は、利得を自動的に調整するように構成することができ、そのため、各融解曲線は蛍光値90から始まる。これらの曲線の指数関数的特徴は明白であり、75℃付近には、より長いヘアピンの融解挙動が示唆される。しかしながら、図4に示した未変更の曲線を解釈することは容易ではなく、より短いヘアピンの観測可能な2重鎖融解が起こったかどうかははっきりしない。
【0085】
図5は、図4に示したデータと同じデータの導関数プロットである。より高い温度における2重鎖転移がピークとしてはっきりと示されている。しかしながら、低温ではバックグラウンドが高いため、より低温での転移のTmを特定することは難しいことがある。したがって、追加の操作および/または処理(例えばバックグラウンド除去)なしでは、導関数プロットは、曲線中のバックグラウンド蛍光B(T)を適切に表現し、および/または調整することができないことがある。
【0086】
(例えば式1〜6に関して)上で論じたように、実験的な融解曲線のバックグラウンド蛍光B(T)成分を融解曲線F(T)から差し引き、それにより「真の」融解曲線M(T)の近似を得ることができる。上式1〜6を参照されたい。図18および24(後に論じる)は、とりわけ偏差解析を使用する自動バックグラウンド除去プロセスの例を提供する。
【0087】
図6は、指数バックグラウンド差引き後の図4および5のデータと同じデータの導関数プロットを示す。図6のプロットでは、全ての試料が融解転移を示しているが、バックグラウンド差引きの成果は理想的とは言えず、特に5bpヘアピン2重鎖でそうである。
【0088】
図3〜6のそれぞれの実験的な融解曲線の偏差関数E(T)を、(例えば式9〜14および/または図3の方法300を使用して)生成することができる。図7は、数値積分が1から0までの間で変化するように面積によって正規化した偏差関数E(T)のプロットである。図7に示すように、この偏差プロットはEm(T)によって示されている。後に論じるように、Em(T)は、各温度窓内で、偏差関数E(T)の最小値を偏差関数E(T)から差し引くようにして偏差関数E(T)から導き出される関数である。下式20を参照されたい。図7に示すように、偏差関数E(T)(図7の例ではEM(T))を使用すると、融解曲線データ内の関連する特徴がより際立ち、かつ容易に観測可能となる。例えば、図7は、47〜77℃の30℃の範囲にわたってヘアピンTmが明らかに散らばっていることを示している。予想どおり、より短い幹は、より長い幹よりも広い範囲にわたって融解し、全ての転移が示されている。偏差関数E(T)(または図7に示したEM(T))は本来的にバックグラウンド蛍光B(T)に対して適応するため、バックグラウンドは、全ての試料について適切に除去される。
【0089】
導関数プロットの代わりに、指数バックグラウンド差引き後の正規化された融解曲線を示すこともできる。このようにして解析したヘアピンデータを図8に示す。より高い温度ではそれらの融解曲線は妥当であるように見えるが、より低い温度では、予想されるものからのより大きな偏差が観察され、5塩基対2重鎖は、いくつかの範囲の温度で「物理的に不可能な」蛍光の増大を示す。
【0090】
図9は、図6〜8に示したデータと同じデータの(累積偏差の百分率として示された)積分された偏差プロットを示す。この場合には、予想どおり、長い2重鎖ほどより鮮明な転移を示しており、全ての曲線が理に適っているように見える。導関数/偏差プロットとして示されているのか、またはそれらの融解曲線/積分形として示されているかに関わらず、偏差関数E(T)を使用して生成されたプロットはよりロバストであることができ、大きな温度範囲にまたがる複数の曲線の比較を可能にする。
【0091】
別の例として、2つの温度コントロールキャリブレータを用いた少なくとも4つの単一塩基多様体の多重ジェノタイピングを、プローブなしで均一に実行する。多重プライマおよび内部コントロールに対するオリゴヌクレオチド配列は以前に、参照によってその全体が本明細書に組み込まれる「Seipp MT他、Quadruplex Genotyping of F5,F2,and MTHFR Variants in a Single Closed Tube by High−Resolution Amplicon Melting、54(a)Clin.Chem.108〜15(2008年1月)」によって発表されている。
【0092】
この例では、以下の50bp低温コントロールを使用した。
【0093】
ATCGTGATTTCTATAGTTATCTAAGTAGTTGGCATTAATAATTTCATTTT (配列ID No.4)
【0094】
上記配列の相補配列を、260nmにおける吸光度によって求めた等しいモル割合で上記配列と混合することができる。温度コントロールオリゴヌクレオチドは、3’−リン酸塩でブロックすることができる。以下の50bp高温コントロールを使用した。
【0095】
(G)CGGTC(A)GTCGG(C)CTAGCGGT(A)GCCAG(C)TGCGGC(A)CTGCGTG(A)CGCTCA(G) (配列ID No.5)
【0096】
このコントロールはさらに相補配列を含むことができ、括弧内の太字の塩基は、記載した鎖上でのみロックト核酸(LNA)である。
【0097】
1X LightCycler(登録商標) FastStart DNA Master HybProbe(ロシュ・ダイアグノスティックス社から市販されている)、それぞれ0.5μMのFVプライマ、それぞれ0.15μMのMTHFR1298および677プライマ、それぞれ0.16μMのF2プライマ、0.06μMの低温補正コントロールおよび0.08μMの高温補正コントロール、3.5mMのMgCl2(LightCycler(登録商標) Master溶液によって与えられた1mMのMgCl2を含む)、0.01U/μlの非耐熱性ウラシル−DNAグリコシラーゼ(ロシュ・ダイアグノスティックス社から市販されている)、1X LCGreen(登録商標) Plus(Idaho Technology,Inc.から市販されている)ならびにテンプレートDNA 20ngを含む10μlの体積中で、PCR増幅を実行した。
【0098】
この例において、PCRおよび高分解能融解実験は、LS32(商標)デバイス(アイダホ・テクノロジー社から市販されている)を使用して実行した。PCRは、最初に95℃を10分間維持し、続いて95℃、2秒、56℃、1秒および72℃、1秒のサイクルを15回、95℃、2秒、58℃、1秒および72℃、4秒のサイクルを25回繰り返すことによって実行した。温度サイクルが長くなることを避けるために、増幅中は蛍光の取得は行わなかった。PCR中の加熱および冷却ステップは全て、20℃/秒にプログラムされた傾斜率で実行した。PCR後、試料を(10℃/秒で)95℃から40℃まで冷却し、その後、55℃から95℃まで0.3℃/秒で蛍光を連続取得して、融解曲線を生成した。
【0099】
このようにして得た融解曲線データを、前述のとおりに処理して指数バックグラウンド蛍光B(T)を除去し、正規化した。図10は、処理後の融解曲線の導関数のプロットを示す。図10は、25℃の範囲にまたがる融解温度を示しており、68℃付近に低温コントロールピークを有する。しかしながら、高温コントロールの量を増大させた後でも、強度は低いことが明らかであり(92〜93℃における右側の小さなピーク)、このことは、高温コントロールピークを使用した温度調整を難しくする。
【0100】
前述の偏差解析技法(例えば式9〜14および/または図3の方法300)を適用することによって、より高温のピークの見かけの相対強度を増大させることができる。この例では、この融解曲線データを使用して対応するそれぞれの偏差関数E(T)を生成した。
【0101】
これらの偏差関数E(T)のプロットを(式20に関して後に論じるEm(T)の形で)図11に示す。図11に示すように、この偏差解析は、低温転移に対する高温転移の見かけの大きさを増大させる。これらの両方の解析法によって、中央の4つのピークの正確なジェノタイピングが達成された。
【0102】
図12Aは、6種類の異なるタンパク質、すなわち精製リゾチーム、C反応性タンパク質、IgG、クエン酸シンターゼ、リンゴ酸デヒドロゲナーゼおよびアルカリホスファターゼ(全てSigma−Aldrich(登録商標))の実験的な融解曲線を示す。これらのタンパク質をそれぞれ別個に、等張リン酸緩衝生理食塩水、pH 7.4(PBS)に対して透析し、PBS中で、5X SYPRO(登録商標) Orange(Invitrogen(登録商標)から市販されている)の存在下で、タンパク質濃度2.25μMまで希釈した。LightScanner(登録商標)(アイダホ・テクノロジー社から市販されている)内で、反応物10ulを、1℃/分で、35から99℃まで融解させた。3次平滑化スプラインを使用して実験的な融解曲線データを平滑化し、均一な温度測定値で再サンプリングした。
【0103】
図12Bは、図12Aの実験タンパク質融解曲線の導関数プロットを示す。これらの導関数は、中心差分技法を使用して近似することができる。
【0104】
図12Cは、図12Aの実験タンパク質融解曲線データの偏差関数E(T)プロットを示す。図12Cの偏差関数は、上で論じた式9〜14および/または方法300を使用して計算することができる。図12Cの例では、式13の2次多項式を使用してバックグラウンド蛍光信号をモデル化し、窓の幅は20データ点とした。偏差関数は、それぞれのフィットの2次項に乗じる定数(式13のai)から形成した。
【0105】
図12Dは、バックグラウンド補正後の導関数融解曲線を示す。バックグラウンド除去に関しては、カーソル位置を、84.4度および98.4度に手動でセットする(全試料について、これらのカーソル位置はともに、融解特徴よりも上のバックグラウンド領域内に位置する)。試料ごとに、前述のカーソル位置内で、(図12Aに示した)平滑な融解曲線データに2次多項式を、最小2乗フィッティングでフィットさせる。平滑化された実験的な融解曲線データからバックグラウンドモデルを差し引くことによって、バックグラウンドが補正された(以後、バックグラウンド補正された)融解曲線が形成される。次いで、バックグラウンド補正された融解曲線を正規化した。正規化後、融解曲線は一般にゼロ付近から始まり、融解転移の後、1付近で横ばいになる。図12Dに示したバックグラウンド補正され、正規化された曲線の導関数は、中心差分技法を使用して計算した。全てのタンパク質(低強度のリゾチームは除く)が、よく知られた形式の予想された融解転移を示す。
【0106】
図13は、指数関数的に減衰するバックグラウンドを除去し、さらに局所的に一定の凝集速度に起因する信号を除去した後の図12Aの融解曲線データのプロットを示す。タンパク質はしばしばより高い温度で凝集し、それにより、アンフォールディングによって以前に露出したさまざまな疎水性残基を覆い隠す。補正によって、その結果得られるデータが、バックグラウンドおよび凝集が補正されたアンフォールディング曲線を表すことがある。後に論じるように、図13に示したアンフォールディング曲線は、導関数をとる前に、補正された融解曲線データを最大値によって再スケーリングすることによって、0〜100の百分率範囲に正規化されている。
【0107】
図13のアンフォールディング曲線データは、式1の実験曲線のモデルを、タンパク質アンフォールディング領域間の凝集を考慮するように修正することによって得ることができる。
【0108】
【数15】
【0109】
式15で、U(T)は、アンフォールディング曲線、A(T)は凝集信号、B(T)はバックグラウンドEO放射を表す。アンフォールディング曲線U(T)は、低温および高温では実質的に平らであり、A(T)は、実質的に一定の負の勾配を有し、上で論じたように、B(T)は、指数減衰モデルに従うことが観察されている。これらの特性を使用して、バックグラウンド信号B(T)を特定し、除去することができる。後に、別のバックグラウンド除去プロセスが図22に関して説明される。
【0110】
このバックグラウンド除去プロセスは、アンフォールディング転移の始点の直ぐ下側の第1の温度TLを特定することを含み、この第1の温度TLでは、凝集曲線がゼロであり、アンフォールディング曲線が平らである。曲線のこの点において、測定される(負の)勾配は全て、バックグラウンドEO放射信号の勾配に帰すことができる(例えばB(T):F’(TL)=B’(TL))。TLの位置は、生の蛍光がもはや一定の指数減衰率を示さない温度を特定するためにDNA融解に対して使用したのと同じ指数偏差解析を使用して、低温範囲において検出することができる。上で論じた式11を参照されたい。
【0111】
アンフォールディング転移よりも上の温度領域で、第2の温度TRを特定することができる。この領域では、A’(T)がほぼ一定であり、U’(T)=0であり、B’(T)が依然として指数関数である。これらの条件は、U’’(T)=0、A’’(T)=0であり、したがってF’’(TR)=B’’(TR)であることを含意する。バックグラウンドEO放射信号の指数モデルの導関数は、下式のように表現することができる。
【0112】
【数16a】
【0113】
これらの2つの温度値(TRおよびTR)から、式16のCおよびaの値を見つけることができる。式16から、
【数16b】
であり、除算
【数16c】
は、例えばニュートンの方法を使用して解くことができる式であるため、C=B’(TL)=F’(TL)である。Cおよびa、したがってB’(T)を求めた後、そのバックグラウンドモデルを実験的な融解曲線データから差し引いて(式15参照。U’(T)+A’(T)=F’(T)−B’(T))、バックグラウンド補正された融解曲線の導関数を得ることができる。
【0114】
次いで、凝集曲線A(T)からアンフォールディング曲線U(T)を抽出する(例えば上で計算したバックグラウンド補正された融解曲線データから抽出する)ことができる。ある実施形態では、凝集の補正が、抽出されたアンフォールディングと凝集の重ね合わせの導関数を、その高温度範囲側の凝集成分A’(T)のロジスティックモデルによってフィットさせることを含む。指数バックグラウンドは上で抽出されているため、局所的に一定の(負の)凝集率Mをこの範囲で、測定することが可能である。この凝集率Mを、ロジスティックモデルの「キャリイング・キャパシティ」として使用することができる。
【0115】
【数17a】
【0116】
次に、量
【数17b】
に対して、(上で論じた)指数偏差解析を実行して、パラメータDおよびkが一定であるフィッティング範囲を特定することができる。この範囲のDおよびkの平均(アベレージ)値をこのフィットに対して使用することができる。その結果得られたモデル凝集曲線を、バックグラウンド補正された曲線から差し引くことができ、その結果、バックグラウンドおよび凝集が補正されたアンフォールディング曲線の導関数が得られる(式1参照。U’(T)=F’(T)−B’(T)−A’(T))。このバックグラウンドおよび凝集導関数曲線U’(T)を積分して、バックグラウンドおよび凝集が補正された融解曲線を得ることができる。
【0117】
代替手法では、抽出された曲線の上肩部まで、および/または上肩部を含む温度(TSとして示される)では凝集の影響を無視することができる仮定の下で、低温度範囲側のロジスティックモデルによる、抽出されたアンフォールディングと凝集の重ね合わせが実現される。TS温度は、U(T)+A(T)の2次導関数が最もネガティブであり(例えばmin{U’’(T)+A’’(T)})、そのためU’’’(TS)=0である点として特定することができる。導関数重ね合わせU(T)+A(T)は抽出されている(例えばバックグラウンドEO放射信号B’(T)の導関数は除去されている)ため、その1次導関数が最もネガティブである温度TSを見つける。
【0118】
このロジスティックモデルのパラメータは、以下のように表すことができる。
【0119】
【数18】
【0120】
式18のパラメータは、U’’’(TS)=0であることによって求めることができ、U(TS)およびU’(TS)の値は以下のとおりである。
【0121】
【数19】
【0122】
凝集信号A(T)はTSよりも低い範囲では無視することができるため、(上で論じた)バックグラウンド除去の後に導関数曲線を評価して、U’(TS)=F’(TS)―B’(TS)を見つける。前述のとおり、U’(T)を積分して、バックグラウンドおよび凝集が補正された融解曲線(アンフォールディング信号U(T)だけを含む融解曲線)を得ることができる。任意選択で、得られたアンフォールディング曲線U(T)およびその導関数U’(T)を、再スケーリングU(T)=100(U(T))/max{U(T)}によって百分率範囲0〜100に正規化することができる。
【0123】
図13は、前述の方法(例えば式15〜19)を使用して図12Aのタンパク質融解曲線から得た正規化された融解曲線データを示す。したがって、図13のプロットは、図12Aの融解曲線データのアンフォールディング成分(U(T))を示す。
【0124】
図14Aは、別の一組の実験タンパク質融解曲線を示す。図14Aに示す融解曲線データは、精製IgG(Sigma−Aldrich(登録商標)から市販されている)の段階2倍希釈を示している。精製IgGは、最初にPBSに対して透析し、次いで、10μMの1−アニリノ−8−ナフタリンスルホナート(シグマ・アルドリッチ(登録商標)から市販されている)の存在下で、12mg/ml、6mg/ml、3mg/ml、1.5mg/ml、0.75mg/mlおよび0.37mg/mlの最終濃度まで段階希釈した。400nmでのUV励起用に変更したLightScanner(登録商標)(アイダホ・テクノロジー社から市販されている)上で、10μlの体積を解析し、融解曲線を1℃/分で集めた。次いで、融解曲線データを前述のとおりに平滑化した。
【0125】
図14Bは、図14Aの実験的な融解曲線データのプロットを示す。導関数は中心差分技法を使用して近似した。
【0126】
図14Cは、図14Aの融解曲線データの偏差関数E(T)のプロットを示す。図14Cの例では、式13の2次多項式を使用してバックグラウンド蛍光信号をモデル化し、窓の幅は30データ点に設定した。偏差関数は、それぞれのフィットの2次項に乗じる定数(式13のai)から形成した。
【0127】
図14Dは、図14A〜14Cのバックグラウンド補正された融解曲線の導関数プロットを示す。このバックグラウンド補正された融解曲線データは、バックグラウンド除去カーソル位置を80.0度および98度に手動でセットすることによって得た(全試料について、これらのカーソル位置はともに、融解特徴よりも上のバックグラウンド領域内に位置する)。融解曲線ごとに、カーソル位置内で、平滑化された融解曲線データに2次多項式を(最小2乗技法を使用して)フィットさせた。平滑化された実験的な融解曲線データからバックグラウンド蛍光信号のモデルを差し引くことによって、バックグラウンド補正された融解曲線を形成した。次いで、バックグラウンド補正された融解曲線を正規化した。バックグラウンド補正され、正規化された曲線の導関数は、中心差分技法を使用して近似した。図12Dおよび14Dは、手動バックグラウンド補正技法を示しているが、図18〜21および式20〜27に関して後述するように、本開示の教示を使用して、バックグラウンド補正された融解曲線データを自動的に計算することもできる。
【0128】
図15は、前述の方法(例えば式15〜19)を使用して得た、図14Aのタンパク質融解曲線の正規化された導関数アンフォールディング曲線データを示す。したがって、図15のプロットは、図14Aの融解曲線データのアンフォールディング成分(U(T))を示す。
【0129】
図16は、ネガティブ試料を特定する方法1600の一実施形態を示す。本明細書で使用するとき、ネガティブ試料は、有効な融解転移領域を含まない実験的な融解曲線F(T)を指すことがある。一組の融解曲線は、結果を検証する役目を果たす1つまたは複数のネガティブコントロール試料を含むことがある。あるいは、またはこれに加えて、ネガティブ試料は、融解曲線実験を実行する際のエラー、PCR処理におけるエラー、融解曲線を構成する生の蛍光値を測定する際のエラー、特定の実験で使用した結合染料に関係したエラー、核酸生成物の不在、などによって生じる可能性がある。検証目的で、および/または処理時間を短縮するために、および/または無効データを処理することによって生じる他の問題を回避するために、ネガティブ試料を検出することが望ましいことがある。
【0130】
ステップ1610で、方法1600を初期化する。この初期化は、上で論じたように、方法1600を構成する1つまたは複数のコンピュータ可読命令をロードすること、1つまたは複数のハードウェアコンポーネントにアクセスすることなどを含むことができる。
【0131】
ステップ1620で、実験的な融解曲線F(T)にアクセスする。
【0132】
ステップ1630で、その実験的な融解曲線F(T)を使用して、偏差関数E(T)を生成する。偏差関数E(T)は、前述の式9〜14および/または図3の方法300に従って生成することができる。したがって、方法300を使用して生成された偏差関数E(T)にアクセスするように方法1600を構成することができ、および/または、方法1600は、方法300の1つもしくは複数のステップを含むことができる。
【0133】
ステップ1640で、偏差関数E(T)を解析して、偏差関数E(T)が有効な融解転移領域を含むかどうかを判定する。上で論じたように、この偏差関数E(T)は、その実験的な融解曲線F(T)がバックグラウンド蛍光B(T)のモデルから外れる程度を(例えば対応するそれぞれの指数減衰因子間の偏差に換算して)定量化することができる。F(T)がバックグラウンドモデルに一致する(例えばバックグラウンド領域内の)温度領域では偏差関数E(T)が小さく、融解領域では偏差関数E(T)が増大する。したがって、偏差関数E(T)を使用して、その実験的な融解曲線F(T)のどの部分が融解転移領域に対応し、どの部分がバックグラウンドであるのかを特定することができる。この判定は、偏差曲線E(T)をしきい値と比較することを含むことができる。このしきい値は、しきい値よりも小さな偏差値がバックグラウンド領域を示し、しきい値よりも大きな偏差値が融解領域を示すように設定することができる。偏差しきい値の一例を図19に関して後に示す。ある実施形態では、このしきい値を、偏差関数E(T)のピークと偏差関数E(T)の平均(アベレージ)の比として計算する。あるいは、またはこれに加えて、このしきい値を、一組の融解曲線の解析(例えば偏差関数E(T)の平均(アベレージ)ピークの比)から導き出すこともできる。例えば、一組の融解曲線の偏差関数E(T)の平均(ミーン)μおよび標準偏差σを計算する。ある特定の量(例えば標準偏差σの2倍)を超えてそのグループとは異なる曲線をその解析から外す。残りの融解曲線F(T)を使用して、「平均(アベレージ)最大」を計算する。この平均最大が、(例えばこの最大値の1/e、1/3または他の比率などとして)バックグラウンド領域/融解領域しきい値の基礎をなす。
【0134】
ステップ1640で、その実験的な融解曲線F(T)が有効な融解転移領域を含まない(例えば全てのTの値について実験的な融解曲線F(T)がしきい値よりも小さい)ことを、偏差関数E(T)の解析が示している場合、フローはステップ1650へ続き、そうでなければ、ステップ1660へ続く。
【0135】
ステップ1650で、その実験的な融解曲線F(T)をネガティブ試料としてマークする。ステップ1650は、処理対象の一組の融解曲線からその融解曲線を除くこと、および/またはその実験的な融解曲線F(T)に「無効」試料ないし「ネガティブ」試料のフラグを立てることを含むことができる。ある実施形態では、その一組の実験的な融解曲線F(T)が、1つまたは複数の既知の「ネガティブコントロール」を含む。それらのネガティブコントロールは、ネガティブ試料であることを示す特性を示すように構成された実験的な融解曲線とすることができ、そのため、それらのネガティブコントロールを使用して結果を検証することができる。したがって、ステップ1650は、ネガティブ試料の識別子を既知の「ネガティブコントロール」のリストと比較して、そのネガティブ試料が「ネガティブコントロール」であるかどうかを判定することを含むことできる。
【0136】
ある実施形態では、ステップ1660で、その実験的な融解曲線F(T)を「有効な」融解曲線としてマークする。別の実施形態では、ステップ1660のマーク付けを実行しない(例えば、その一組の融解曲線の中に残っており、および/または「無効」とマークされていない一切の実験的な融解曲線F(T)を有効とみなす)。
【0137】
図17は、ネガティブ試料を検出する方法1700の代替実施形態を示す。ステップ1710、1720および1730で、ステップ1610〜1630に関して上で説明したとおりに、方法1700を初期化し、融解曲線データにアクセスし、偏差関数を計算する。
【0138】
ステップ1732で、温度領域[TMIN,TMAX−W]内の偏差関数E(T)の絶対値の最小値(minE)を求める。範囲[TMIN,TMAX−W]内の全てのTの値について、この最小値minEをE(T)から差し引いて、Em(T)を得ることができる。
【0139】
【数20】
【0140】
ステップ1734で、この変更された偏差関数Em(T)の最大値maxEおよび平均(アベレージ)値または平均(ミーン)値μEを計算する。
【0141】
ステップ1736で、変更された偏差関数Em(T)の最大値maxEと平均(アベレージ)値または平均(ミーン)値μEの比REを計算する。
【0142】
【数21a】
【0143】
ステップ1740で、方法1700は、比REを使用して、その曲線がネガティブ試料であるかどうかを判定する。ある実施形態では、ステップ1740が、ステップ1736で計算した比REをしきい値と比較することを含む。このしきい値は、方法1700のユーザが定義してもよく、および/または所定の値としてもよい。例えば、自動高分解能融解曲線解析では、このしきい値を5とすることができる。このしきい値よりも小さい比REは、融解領域が存在しないこと、そのためその融解曲線F(T)がネガティブ試料であることを示し、その場合、フローはステップ1750へ続き、そうでなければ、ステップ1760へ続く。ステップ1750では、ステップ1650に関して上で説明したとおりに、融解曲線F(T)を無効試料ないしネガティブ試料としてマークする。ステップ1760では、ステップ1660に関して上で説明したとおりに、融解曲線F(T)を有効な試料としてマークする。
【0144】
図18は、偏差解析を使用して融解曲線のバックグラウンド領域および/または融解領域を自動的に特定する方法1800の一実施形態を示す。後に論じるように、方法1800を使用して特定した温度領域を使用して、自動バックグラウンド差引きプロセスを提供すること、および/または融解曲線データを表示し、もしくは融解曲線データの他の処理を実行することができる。
【0145】
ステップ1810で、方法1800を初期化する。この初期化は、上で論じたように、方法1800に必要な資源を割り当て、および/または方法1800に必要な資源を初期化すること、コンピュータ可読記憶媒体から1つまたは複数の命令および/または別個のソフトウェアモジュールをロードすること、ハードウェアコンポーネントにアクセスすることなどを含むことができる。
【0146】
ステップ1820で、方法1800は、一組の生の蛍光測定値を温度の関数として含む実験的な融解曲線F(T)にアクセスする。この実験的な融解曲線F(T)は、バックグラウンド蛍光成分B(T)を含むことがあり、そのため、バックグラウンド蛍光B(T)と「真の」融解曲線蛍光M(T)の和としてモデル化することができる。上で論じた式1を参照されたい。ある実施形態では、ステップ1820のアクセスすることがさらに、正規化された実験的な融解曲線
【数21b】
にアクセスし、および/またはこの正規化された実験的な融解曲線を計算することを含む。
【0147】
ステップ1830で、偏差関数E(T)を生成する。この偏差関数は、前述の方法300を使用して生成することができる。したがって、ステップ1830は、外部プロセス(例えば方法300)によって生成された偏差関数E(T)にアクセスすることを含むことができ、および/または方法300において開示した1つもしくは複数のステップを含むことができる。
【0148】
ステップ1840で、この偏差関数を使用して、正規化カーソルの探索領域、および、拡張により、その融解曲線F(T)内の融解転移を特定する。上で論じたとおり、この探索領域は、融解転移領域を間に挟む融解曲線F(T)のバックグラウンド領域(例えば融解転移の前の低位バックグラウンド領域および融解転移の後の高位バックグラウンド領域)を含むことができる。したがって、ステップ1840の特定することは、低位探索領域Tlowおよび高位探索領域Thighを特定することを含むことができる。低位探索領域Tlowおよび高位探索領域Thighを特定することによって、拡張により、それらの探索領域間の融解転移領域(例えば低位領域Tlowと高位領域Thighの間の温度領域)を特定することができる。
【0149】
ステップ1830で生成した偏差関数を使用して、関心の温度領域(例えば低位バックグラウンド領域、高位バックグラウンド領域、および/またはそれらのバックグラウンド領域間の融解領域)を特定することができる。これらの温度領域を特定することは、ステップ1830の偏差関数E(T)を1つまたは複数のしきい値と比較することを含むことができる。前述のとおり、偏差の大きい領域は融解領域を示すことがあり、偏差の小さい領域は、バックグラウンド領域を示すことがある。したがって、ステップ1830の特定することは、偏差関数E(T)を1つまたは複数のしきい値と比較すること、偏差関数E(T)の平均(アベレージ)、および/または偏差関数E(T)のピークと平均(ミーン)もしくは平均(アベレージ)の比を計算することなどを含むことができる。
【0150】
方法1800は、単一の融解転移を間に挟む単一の温度領域対(Tlow、Thigh)の特定を論じているが、当業者は、融解曲線データ内の融解転移の数に応じた任意の数の温度領域(Tlow、Thigh)を特定するように、方法1800を適合させることができることを理解するであろう。後に、複数の融解領域を特定する方法2000の一例を、図20に関して説明する。したがって、融解曲線内の特定の数の探索領域および/または融解転移を特定することに、本開示が限定されると解釈すべきではない。
【0151】
図19は、例示的ないくつかの偏差関数の偏差プロットの一例を示す。図19の例では、単一の融解転移1920が示されている。したがって、ステップ1840では、2つの温度領域(Tlow1930およびThigh1932)を特定する。別の実験的な融解曲線は、追加の融解転移領域を含むことがある(例えばn個の融解転移領域を含むことがある)。したがって、ステップ1840の特定は、融解曲線内のn個のバックグラウンド温度領域(例えばTlow_1およびThigh_1、Tlow_2およびThigh_2、...、Tlow_nおよびThigh_n)を特定することを含むことがある。各融解転移領域は、それぞれが異なる遺伝子型に対応する複数の融解パターン、例えば1912、1914および1916を含むことがある。しかしながら、それぞれの融解領域の外側において、それらの異なる遺伝子型の融解曲線は類似している。このことは、複数の曲線に対して、(両側にバックグラウンドを有する)1つの融解領域を定義することを可能にする。融解解析は複数の曲線を比較するため、曲線ごとに個別の領域を使用するよりも、これらの集合(アグリゲート)領域を使用した方がしばしば有利である。
【0152】
温度領域Tlow1930およびThigh1932は、とりわけステップ1830の偏差関数E(T)を使用して選択することができる。実験的な融解曲線F(T)の温度範囲[Tmin,Tmax]または[Tmin,Tmax−W]内で、融解曲線の偏差関数E(T)を、1つまたは複数の偏差しきい値と比較することができる。図19の例では、偏差関数E(T)がしきい値1910よりも小さい温度領域を、バックグラウンド領域1930および1932として特定し、偏差関数E(T)がしきい値1910よりも大きい領域を融解領域1920として特定する。
【0153】
しきい値1910は予め決めておくことができる。あるいは、またはこれに加えて、複数の実験的な融解曲線F(T)の偏差関数E(T)を平均することによって、および/または偏差関数E(T)のピーク値を使用することによって、しきい値1910を計算することもできる。この平均算出および/または比の計算は、異常値の棄却および/または他の統計的技法(例えば上で論じたネガティブ試料の特定)を含むことができる。例えば、一組の融解曲線の偏差関数E(T)の平均(ミーン)μおよび標準偏差σを計算する。ある特定の量(例えば標準偏差σの2倍)を超えてそのグループとは異なる曲線をその解析から外す。残りの融解曲線F(T)を使用して、「平均(アベレージ)最大」を計算する。この平均最大が、(例えばこの最大値の1/e、1/3または他の比率などとして)しきい値1910の基礎をなす。
【0154】
図19は、例示的な3つの偏差関数E(T)1912、1914および1916を示している。融解領域1920は、偏差関数E(T)1912、1914および/または1916が偏差しきい値1910よりも大きい領域として示されている。下側バックグラウンド領域1930は、偏差関数E(T)1912、1914および/または1916が偏差しきい値1910よりも小さい温度領域を含む。
【0155】
図18に戻ると、ステップ1880で、ステップ1840で特定した温度領域(1つまたは複数)を、表示および/または追加の処理に対して使用可能にする。前述のとおり、ステップ1880は、特定した温度領域(1つまたは複数)をコンピュータ可読記憶媒体上に記憶すること、それらの領域をHMI上に表示する(例えば融解曲線データの表示にそれらの領域を上重ねする)こと、それらの領域を使用して、融解曲線データの一部を表示する(例えば融解曲線データの融解領域だけを表示する)こと、外部システムおよび/または外部プロセス(例えば指数バックグラウンド除去プロセス)にデータを送信することなどを含むことができる。
【0156】
図20は、融解曲線内のバックグラウンド領域および/または融解転移領域を自動的に特定する方法2000の他の実施形態の流れ図である。複数の融解領域、すなわちアンプリコン融解領域およびプローブ融解領域を含む融解曲線内の融解領域を特定するように、図20の方法2000を適合させることができる。後に論じるように、この例示的な実施態様では、アンプリコン融解領域の方がプローブ融解領域よりも際立つことがある。(例えばアンプリコン融解領域およびプローブ融解領域を含む)このタイプの融解曲線の解析は、突然変異スキャニングとジェノタイピングの同時実施を可能にすることがある。しかしながら、方法2000の教示を、異なる融解領域セットを含む別の融解曲線に適用することもできる。したがって、この点に関して方法2000が限定されると解釈すべきではない。
【0157】
上で論じたように、方法2000が処理する融解曲線は、2つの融解領域(例えばアンプリコン融解領域およびプローブ融解領域)を含むことができる。このような融解曲線の偏差関数プロットの一例を図21Aに示す。別個の4つの温度値、すなわちアンプリコン融解領域を間に挟む低位アンプリコン温度値TA,Lおよび高位アンプリコン温度値TA,H、ならびにプローブ融解領域を間に挟む低位プローブ温度値TP,Lおよび高位プローブ温度値TP,Hを自動的に特定するように、方法2000を構成することができる。これらの温度値は、TP,L<TP,H<TA,L<TA,Hとなるように特定される。
【0158】
ステップ2010および2020で、前述のとおりに、方法2000を初期化し、融解曲線データにアクセスする。
【0159】
ステップ2030で、融解曲線データの偏差関数E(T)を生成する。この偏差関数E(T)は、方法300を使用することによって、および/または方法300の1つまたは複数のステップを組み込むことによって生成することができる。
【0160】
ステップ2032および2034で、温度範囲[Tmin,Tmax−W(温度窓の幅)]内の偏差関数E(T)の絶対値の最小値minEを求める。[Tmin,Tmax−W]内の全てのTの値について、この最小値minEをE(T)から差し引いて、Em(T)を得ることができる(Em(T)=|ET(T)|−minE)。図17のステップ1732〜1734に関して上で説明したように、Em(T)の最大値maxEを求めることができる。
【0161】
ステップ2040で、第1の温度セットを求める。この第1の温度カーソルセットは、アンプリコン融解領域を間に挟む低位アンプリコンカーソルTA,Lおよび高位アンプリコンカーソルTA,Hを含むことができる。低位アンプリコンカーソルTA,Lは、偏差関数Em(T)の絶対値がある特定の値以上である(Em(T)の温度範囲内の)最も小さいTの値とすることができる。ある実施形態では、この値が、スケーリングファクタ(例えば1/e、1/3または他のスケーリングファクタ)によってスケーリングされたmaxEである。したがって、温度TA,Lは、式22を満たす最も低い温度Tとして特定することができる。
【0162】
【数22】
【0163】
このようにしてTA,Lを特定した一例が図21Aに示されており、図21Aには、TA,L2124が示されている。
【0164】
高位アンプリコン温度値TA,Hは、偏差関数Em(T)の絶対値がある特定の値(例えば1/eなどの定数によってスケーリングされたmaxE)以上である(Em(T)の温度範囲内の)最も大きなTの値として特定することができる。
【0165】
【数23】
【0166】
このようにしてTA,Hを特定した一例が図21Aに示されており、図21Aには、TA,H2126が示されている。
【0167】
ある実施形態では、ステップ2050で、ステップ2040で特定した第1の温度セットTA,LおよびTA,Hを変更する。値TA,LおよびTA,Hの外側の温度値を使用することによって、この解析を改善することができる。したがって、緩衝定数BA,LおよびBA,Hを使用して、温度TA,LおよびTA,Hの両側に、対応するそれぞれのバッファ値BA,LおよびBA,Hを含めることができる。緩衝定数BA,LおよびBA,Hの値は経験的に求めることができる。これらの緩衝定数は、融解曲線データ内の関心の特徴サイズ(例えば1℃)に近くなるように選択することができる。したがって、これらの温度位置をそれぞれ、TA,L−BA,LおよびTA,H+BA,Hになるように変更することができる。図21Aを参照されたい。さらに、図21Aおよび21Bに示すように、値TA,LおよびTA,Hの両側にWパラメータを加えることによって、値TA,LおよびTA,Hに基づくバックグラウンド温度領域を定義することができる。
【0168】
後に論じるように、温度値TA,LおよびTA,H、ならびに/もしくはこれらの温度値によって定義された温度領域を使用して、バックグラウンド領域および/または融解領域を特定し、または指数バックグラウンド差引きプロセスを自動化することができ(例えば、これらの温度を使用して、バックグラウンド蛍光の指数モデルを式2〜6に従って構築することができ)、あるいは、これらの温度値ならびに/もしくは温度領域を、クラスタリング操作またはスキャニング操作で使用することなどができる。
【0169】
ステップ2060で、Em(T)内のプローブ温度領域を特定する。この温度領域は、第1の温度セットの低位温度(TA,L)よりも低い温度範囲を含むことがある。ある実施形態では、この温度領域が、TA,L、バッファ値、および/または偏差関数E(T)の温度窓TWの幅よりも低い(例えばEm(T)の全てのTについてTA,L−BA,L−Wよりも低い)。この温度領域は、第2の融解領域(プローブ融解領域)を含み、アンプリコン融解領域を含まない。図21Bを参照されたい。図21Aに示すように、プローブ融解領域は、(Em(T)によって定量化される)アンプリコン融解領域ほど際立ってはいない。この理由から、第2の温度セット(例えばプローブ温度TP,LおよびTP,H)は、第1の温度セット(TA,LおよびTA,H)の後に、E(T)のサブセットを使用して特定することができる。しかしながら、他の実施形態および/または他のタイプの融解曲線では、これが当てはまらないこともある。したがって、本開示が、温度セットの特定の順序および/または数に限定されると解釈すべきではない。
【0170】
ステップ2062で、ステップ2060で特定した領域内におけるE(T)の最小値minEを求める。上で論じたステップ2032を参照されたい。minEを使用して、その温度領域内においてEm2(T)を生成することができる(ステップ2032〜2050で論じたEm(T)から区別するため、本明細書ではEm2(T)と呼ぶ)。
【0171】
ステップ2064で、Em2(T)の最大値maxE2を求める。上で論じたステップ2034を参照されたい。図21Aおよび21Bの点2142も参照されたい。
【0172】
ステップ2070で、ステップ2064で求めた最大値maxE2を使用して、第2の温度セットを特定する。第2の温度セットの低位温度値TP,Lは、Em2(T)の値が、定数(例えば1/e)によってスケーリングされたmaxE2よりも大きい温度領域内の最も低い温度とすることができる。図21BのTP,L2154を参照されたい。第2の温度セットの高位温度値TP,Hは、Em2(T)の値が、定数(例えば1/e)によってスケーリングされたmaxE2以上である温度領域内の最も高い温度とすることができる。図21BのTP,H2156を参照されたい。
【0173】
ステップ2080で、対応するそれぞれの緩衝定数および/または偏差関数E(T)を生成するために使用した温度窓の幅Wを使用して、第2の温度セットTP,LおよびTP,Hを変更する。上で論じたステップ2050を参照されたい。図21Bの点2164および2166も参照されたい。
【0174】
ステップ2090で、第1および第2の温度セットを、表示、および/または1つもしくは複数の外部プロセスでの使用に対して使用可能にする。ある実施形態では、後に論じるように、これらの温度セットを使用して、指数バックグラウンド差引きプロセスを自動化する。例えば、第1の温度セット(TA,LおよびTA,H)を使用して、アンプリコン融解領域のバックグラウンドを差し引くことができ、第2の温度セット(TP,LおよびTP,H)を使用して、プローブ融解領域のバックグラウンド蛍光を差し引くことができる。上で論じた式1〜6を参照されたい。あるいは、またはこれに加えて、これらの温度値セットを使用して、アンプリコン融解領域および/またはプローブ融解領域の表示および/または処理(例えば、対応するそれぞれの融解領域(1つまたは複数)のスケーリングされ、および/またはズームされた図を自動的に表示すること、関連領域(1つまたは複数)内のクラスタリングを自動化することなど)を提供することができる。
【0175】
図21Aおよび21Bは、アンプリコン融解領域およびプローブ融解領域を含む融解曲線を使用して生成した例示的な偏差関数Em(T)2110のプロットである。
【0176】
図21Aは、前述の方法2000のステップ2030〜2050の操作を示す。例えば、2112は、Em(T)の最大値maxEを示し、2114は、スケーリングファクタ(1/e)によってスケーリングされた最大値maxE、2124は、Em(T)がmaxE/e以上である最も低い温度TA,L、2126は、Em(T)がmaxE/e以上である最も高い温度TA,Hである。図21Aに示すように、対応するそれぞれの緩衝定数2134および2136ならびに/または温度窓の幅Wによって、温度値TA,LおよびTA,Hを変更することができる。
【0177】
図21Bは、前述の方法2000のステップ2060〜2080の操作を示す。プロット2140はプローブ融解領域を含み、このプローブ融解領域は、Em(T)の温度範囲のサブセット(例えばTA,L−BA,L−Wよりも低い温度範囲)を含むことができる。関数Em2(T)は、プローブ融解領域(例えばステップ2050で特定した温度範囲)内の全てのE(T)値について、偏差関数の絶対値の最小値minEを差し引くことによって生成する。Em2(T)2142の最大値maxE2を使用して、温度値TP,L2154およびTP,H2156を特定することができる。低位プローブ温度TP,L2154は、Em2(T)が、スケーリングされた最大値maxE2(maxE2/e)以上である最も低い温度として特定され、高位プローブ温度TP,H2156は、Em2(T)が、スケーリングされた最大値maxE2(maxE2/e)以上である最も高い温度として特定される。図21Bに示すように、対応するそれぞれの緩衝定数2164および2166ならびに/または温度窓の幅Wを使用して、温度TP,LおよびTP,Hを変更することができる。
【0178】
上で論じたように、方法2000で特定した温度値を使用して、実験的な融解曲線からバックグラウンド蛍光信号B(T)を差し引くことができる。これは、方法2000で特定したバックグラウンド温度値(例えばアンプリコン融解領域およびプローブ融解領域を間に挟む温度値)を使用して実行することができる。そのようにして特定した温度値を使用して、指数バックグラウンド信号を式2〜5に従ってモデル化することができる。式6に従って、その指数バックグラウンドのモデルを、実験的な融解曲線F(T)から差し引くことができる。
【0179】
図21Cは、カーソルプローブ領域を特定するプロセスの他の例を示す。偏差関数2160は例えばタンパク質融解曲線に対応する。この例示的な偏差関数2160は、ベースライン偏差2165、融解領域および(カーソルプローブ領域2175として示された)バックグラウンド領域を含む。偏差関数2160の融解領域は、それぞれが異なるタンパク質に対応する複数の融解パターンを含むことがある。しかしながら、(融解領域(1つまたは複数)の外側の)カーソルプローブ領域2175では、異なるタンパク質の融解曲線が類似している。このことは、複数の曲線に対して、1つのバックグラウンド領域(カーソルプローブ領域2175)を使用することを可能にする。融解解析は複数の曲線を比較するため、曲線ごとに個別の領域を使用するよりも、集合領域(例えば領域2175)を使用した方がしばしば有利である。
【0180】
カーソルプローブ領域2175は、(図20のステップ2040のとおりに)バックグラウンドカーソル温度Tc2174を選択することによって特定することができる。バックグラウンドカーソル温度Tc2174は、偏差しきい値2164よりも大きく、および/または偏差しきい値2164に等しい偏差関数2160に沿った(温度範囲[Tmin,Tmax]または[Tmin,Tmax−W]内の)最も高い温度として特定することができる。この偏差しきい値は、最大値maxE2162(または最大値maxE2162とベースライン偏差2165の間の高さ)と定数(例えばe)の比として定義することができる。上式22および23を参照されたい。図21Cに示すように、カーソルプローブ領域2175は、バックグラウンドカーソル温度Tc2174よりも高く、および/またはバックグラウンドカーソル温度Tc2174に等しい温度を含むと定義することができる。
【0181】
上で論じたように、偏差しきい値2164の値は、予め決めておくことができ(定数)、および/または偏差関数E(T)の最大値maxE2162を使用していることができる。あるいは、またはこれに加えて、複数の実験的な融解曲線の偏差関数E(T)を平均することによって、しきい値2164を計算することもできる。この平均算出および/または比の計算は、異常値の棄却および/または他の統計的技法(例えば上で論じたネガティブ試料の特定)を含むことができる。例えば、一組の融解曲線の偏差関数E(T)の平均(ミーン)μおよび標準偏差σを計算する。ある特定の量(例えば標準偏差σの2倍)を超えてそのグループとは異なる曲線をその解析から外す。残りの融解曲線F(T)を使用して、「平均(アベレージ)最大」を計算する。この平均最大が、(例えば1/e、1/3または他の比として)しきい値2164の基礎をなす。
【0182】
方法1800および/または2000で特定し、ならびに/または図21A〜21Cを使用して特定したバックグラウンド温度領域(カーソルプローブ領域)を使用して、バックグラウンド補正プロセスを自動化することができる。図22は、偏差解析を使用して指数バックグラウンド差引きを自動化する方法2200の流れ図である。
【0183】
ステップ2210〜2230で、前述のとおりに、方法2200を初期化し、融解曲線データにアクセスし、この融解曲線データから偏差関数E(T)を生成する。
【0184】
ステップ2240で、融解曲線データ内のバックグラウンド温度領域を特定する。バックグラウンド温度領域は、図18の方法1800を使用して(偏差関数E(T)を1つまたは複数のしきい値と比較することによって)特定することができる。あるいは、またはこれに加えて、方法2000に従って(例えば偏差関数E(T)のスケーリングされた最大値を使用して)バックグラウンド領域を特定することもできる。
【0185】
ステップ2250で、目的関数(Φ)にアクセスする。目的関数Φは、最適化問題(方法2200の場合には、実験的な融解曲線F(T)内の指数バックグラウンド蛍光B(T)をモデル化するために使用するカーソル位置の位置設定など)に対する特定の解の望ましさ(デザイラビリティ)を定義することができる。ある実施形態では、ステップ2250でアクセスする目的関数Φが、以下の形の関数である。
【0186】
【数24a】
【0187】
式24で、TLおよびTRは、温度軸に沿った正規化カーソル位置(その曲線の融解領域を間に挟む温度)を表す。式24の目的関数は、ある種の条件に従うことがある。例えば、正規化カーソル位置TLおよびTRの探索空間を、ステップ2240で特定した温度領域に限定することができる。
【0188】
実験的な融解曲線F(T)と理想融解曲線の間の誤差を最小化するように、目的関数Φを構成することができる。図23Aは、「理想」融解曲線の例および正規化された実験的な融解曲線
【数24b】
の一部を示す。図23Aに示すように、曲線2310および2312はともに、低位バックグラウンド領域2326、高位バックグラウンド領域2328および融解領域2325を含む。理想融解曲線2310では、融解領域2325が、滑らかな単調非増加関数としてモデル化されている。理想融解曲線2310と実験的な融解曲線
【数24b】
2312は、バックグラウンド領域2326および2328では類似しているが、融解領域2325では偏差を示す。したがって、理想曲線2310と実験曲線2312の間の偏差を使用して、(例えば理想曲線2310と実験曲線F(T)2312の指数減衰率を、例えば方法1800および2000に関して上で説明したとおりに比較することによって、)バックグラウンド領域2326および2328を融解領域2325から区別することができる。
【0189】
領域2320内において、曲線2310と2312は発散する。領域2320は、図23Bに拡大図が示されている。面積2322は、理想融解曲線2310と正規化された融解曲線2312の(温度Tに沿って積分した)全体差を示す。正規化された融解曲線
【数24b】
2312が、蛍光中間点(正規化後の0.5蛍光)を通る温度をT1/2 2324と定義することができる。
【0190】
図23Aおよび23Bは、単一の融解領域2325を含む理想融解曲線および実験的な融解曲線2310および2312を示しているが、この点に関して本開示は限定されない。当業者には理解されることだが、本開示の教示を、任意の数の融解領域(および対応するバックグラウンド領域)を含むより複雑な融解曲線に適用することもできる。
【0191】
ある実施形態では、ステップ2250でアクセスする目的関数Φが、T1/2点2324の前に生じる1に対する誤差を最小化し、T1/2点2324の後に生じる0に対する誤差を0に最小化するように構成されている。さらに、実験的な融解曲線F(T)が、融解転移領域(例えば図23の領域2325)内において、単調に減少する指数関数に一致するように、目的関数Φを構成することができる。
【0192】
図22を再び参照すると、「バックグラウンド」として特定された温度領域内に限って温度カーソル位置を探索するように、ステップ2250でアクセスする目的関数Φを構成することができる。低位バックグラウンド領域および高位バックグラウンド領域内への拘束を含むように、目的関数Φを書き直すことができる。
【0193】
【数25】
【0194】
上で論じたように、融解転移の前(例えば図23のT1/2点2324の前)に生じる1に対する誤差を最小化し、融解転移の後に生じる0に対する誤差を最小化するように、目的関数Φを構成することができる。下式26の目的関数はそのように構成されている。
【0195】
【数26a】
【0196】
式26で使用されるとき、演算子
【数26b】
(例えば
【数26c】
に適用されている)は、以下の特性を有する。
【0197】
【数27】
【0198】
ステップ2260で、方法2200は、目的関数Φを使用して、最適な正規化カーソル値を特定する。ステップ2260の特定は、Tlow温度領域およびThigh温度領域内のさまざまな温度値において、目的関数Φを評価することを含むことができる。ある実施形態では、これらの領域を、所定の数の値(例えばそれぞれの領域内の30個の離散温度値)に量子化する。目的関数Φを最小化する温度TLおよびTRを、最適なカーソル位置として特定することができる。ステップ2260の特定は、極小検出、最急降下、勾配降下などを含む当技術分野で知られている任意の最適化技法を含むことができる。
【0199】
ステップ2270で、実験的な融解曲線F(T)を処理して、実験的な融解曲線F(T)のバックグラウンド蛍光B(T)成分を除去する。上で論じた式1〜6を参照されたい。ステップ2270の除去は、最適な温度値TLおよびTRを使用してバックグラウンド蛍光をモデル化することを含むことができる。このモデルを、上で論じた式6に従って融解曲線データから差し引くことができる。
【0200】
ステップ2280で、「真の」融解曲線データM(T)を使用可能にする。これは、上で論じたように、この補正されたデータを表示すること、補正されたデータをコンピュータ可読記憶媒体に記憶すること、補正されたデータを別のプロセッサおよび/またはシステムに送信することなどができるようにすることを含むことができる。
【0201】
図24は、バックグラウンド蛍光補償を自動化する方法2400の他の実施形態である。方法2400は、バックグラウンド差引きの結果に対する改善を可能にするために、フィードバックステップおよび評価ステップを含む。
【0202】
ステップ2410〜2470は、方法2200に関して上で説明したステップ2210〜2270と同じように実施することができる。
【0203】
テップ2472で、処理され、および/または正規化された融解曲線データM(T)を使用して、追加の解析を実行する。例えば、この融解曲線データM(T)をHMI内に表示し、またはジェノタイピング操作、スキャニング操作、クラスタリングプロセス、グルーピングプロセスなどで使用する。
【0204】
ステップ2472で実行した解析の結果の質(クオリティ)を定量化することができることがある。例えば、ステップ2472の解析が、クラスタリング操作またはグルーピング操作を含む場合、クラスタ/グループ間の分離性(セパレーション)を評価して、操作の「質」を決定することができる。したがって、ステップ2480で、質メトリックを計算する。この質メトリックを使用して、ステップ2460のバックグラウンド除去の質を定量化する(例えば「最適な」カーソルTLおよびTRの質を定量化する)ことができる。
【0205】
式28は、クラスタリング操作および/またはグルーピング操作の質を定量化する1つの方式を示す。
【0206】
【数28a】
【0207】
式28に示すように、質メトリックγは温度の関数である。式28は、2つのクラスタ/グループの質を、グループ間の分離性およびグループ内の凝集性(コヒージョン)の関数として定量化する(式28ではこれらのグループがグループ1および2として特定される)。グループ/クラスタの質は、グループ平均(ミーン)値の分離および個々のグループ分散の和によって決定される。低い質メトリックγは、グループ1および2内の大きな偏差、および/またはグループ平均(ミーン)間の小さな分離に起因する。あるいは、グループがタイトにクラスタリングされており(
【数28b】
および
【数28c】
の値が小さい)、および/またはグループどうしが広く分離されている(差μ1(T)−μ2(T)が大きい)場合、質メトリックγは「良好」となる。
【0208】
本明細書では質メトリックの一例を論じるが、当業者は、(ステップ2472の解析に関係する任意の一組の因子に応じた)任意の質メトリックを本開示の教示の下で使用することができることを理解するであろう。
【0209】
ステップ2482で、ステップ2480で計算した質メトリックを評価する。この評価は、融解曲線データに対する改良をさらに実行する(例えばステップ2484でバックグラウンド除去カーソル位置を変更する)かどうかを判定することができる。したがって、ステップ2482は、質メトリックを1つまたは複数のしきい値と比較することを含むことができる。あるいは、またはこれに加えて、ステップ2482の判定は、現在の質メトリックを、ステップ2460〜2480の以前の1回または数回の繰返しで得た質メトリックと比較することを含むこともできる。このメトリックが一貫した改善を示している(例えば改善勾配をたどっている)場合には、改良を続けることが望ましいと判定することができ、(例えば所定の数の繰返しに比べて)質メトリックが低下している場合には、改良を続けても改善が見込めない可能性がある。さらに、この判定は、最大繰返しカウンタまたは他の処理限界を評価することを含むことができる。カーソル位置のさらなる改良を実行すべきと判定された場合、フローはステップ2484へ続き、そうでなければ、ステップ2490へ続く。
【0210】
ステップ2484で、正規化カーソル位置を改良する。ステップ2484で加える改良は、用途に特化した改良とすることができる(例えば、ステップ2472で実行した解析によって定義することができる)。あるいは、またはこれに加えて、この改良は、カーソル位置の1つもしくは複数の所定のシフト、および/またはユーザが選択可能なカーソル位置の1つもしくは複数のシフトを実行することを含むことができる。ある実施形態では、ステップ2480で計算した質メトリックがこの改良を決定する。あるいは、またはこれに加えて、カーソル位置TLおよびTRに対する改良を、所定のパターンに従って実施することもでき、および/または、カーソル位置TLおよびTRに対する改良がランダムな成分を含んでもよい。ステップ2484の改良はさらに、改良されたカーソル位置を使用して目的関数Φを評価することを含むことができる。ある変更によって目的関数Φの結果が不良になる場合には、より良好な結果を与える別の変更のために、その変更を破棄することができる。カーソル位置を改良した後、ステップ2460〜2482のバックグラウンド除去、解析、質メトリック計算および評価を実行することができる。
【0211】
ステップ2490で、解析結果および/または処理された融解曲線データを使用可能にする。上で論じたように、データを使用可能にすることは、そのデータをHMI上に表示すること、そのデータをコンピュータ可読記憶媒体に記憶すること、そのデータを他のプロセスおよび/またはシステムに送信することなどを含むことができる。
【0212】
低温融解転移または幅広い温度範囲にわたる転移の偏差プロットはしばしば、他の種類のプロットよりも、正確に自動クラスタリングすることが容易であることが分かっている。例えば、A>Cトランスバージョンであるヒト単一塩基多様体rs#729172を、スナップバックプライマを使用して増幅し、その遺伝子型を判定した。スナップバックプライマは、参照によってその全体が本明細書に組み込まれるPCT公開第WO2008/109823号の主題である。スナップバックプライマに関する追加の情報は、「Zhou L.他、Snapback Primer Genotyping with Saturating DNA Dye and Melting Analysis、54(10)Clin.Chem.1648〜56(2008年10月)」に出ている。
【0213】
一例では、偏差解析後には異なる遺伝子型が正確にクラスタリングされたが、指数バックグラウンド差引き後には正確にクラスタリングされなかった。以下のプライマを使用して、ヒトゲノムDNAからの162bp生成物を増幅した。
【0214】
ATGGCAAGCTTGGAATTAGC (配列ID No.6)、および
【0215】
ggTCTGCAGACCGAATGTATGCCTAAGCCAGCGTGTTAGA (配列ID No.7)
【0216】
上記配列6および7の下線が引かれた塩基は、ヒトDNAターゲットと相同であり、下線が引かれていない大文字の塩基は、スナップバックプライマのプローブ要素を構成し、太字の塩基は、単一塩基多様体の位置であり、小文字の塩基は、ターゲットにミスマッチされた2塩基オーバハングである。このPCRは、LC480リアルタイム機器(ロシュ・アプライド・サイエンスから市販されている)内で、0.5μMの制限プライマ、0.05μMのスナップバックプライマ、3mMのMgCl2、50mMのトリス、pH8.3、500μg/mlのBSA、1X LCGreen Plus、200μMのそれぞれのdNTP、および0.04U/μlのKlenTaq 1ポリメラーゼ(AB Peptides)を含む5ng/plのヒトゲノムDNAが存在する条件下で、10μlの反応体積で実行した。この反応混合物を95℃に加熱して、2分置き、次いで、95℃、4.4℃/秒、10秒保持、58℃、2.2℃/秒、10秒保持、76℃、4.4℃/秒、15秒保持のサイクルを50回繰り返した。続いて、4.4℃/秒で95℃に加熱し、10秒保持、2.2℃/秒で42℃に冷却し、1秒保持、0.1℃/秒で98℃に加熱する融解プロトコルを実行し、10回/℃の取得率で蛍光をモニタした。
【0217】
スナップバックプローブ融解転移の温度区間を、融解曲線の検査によって手動で特定し、2つの方法で処理した。図25は、上で参照によって本明細書に組み込んだPCT公開第WO2007/035806号に記載された不偏階層法によって、自動クラスタリングした偏差プロットを示す。
【0218】
この例では使用しないが、図25に示したクラスタリング結果を使用し、質評価技法およびフィードバック技法を使用することによって、バックグラウンド差引きおよび/または温度領域の特定を改良することができる。このような技法を使用して融解曲線解析を改良する方法の一例を、図24に関して説明した。図29のステップ2470〜2482を参照されたい。式20も参照されたい。例えば、図25に示したグループ内の凝集性およびグループ間の分離性を定量化するように、式28の質メトリックを適合させることができる。この質メトリックを評価して、(バックグラウンド差引きおよび/または温度領域の特定に対して使用する)温度領域を、より良好な結果(これは質メトリックによって定量化される)を与えるように改良すべきかどうかを判定することができる。
【0219】
このクラスタリングは、異なる遺伝子型を正確に分離し、約66℃および74℃にTmを有する予想されたホモ接合体およびヘテロ接合体を表示し、68℃の異なるTmのところに予想外のヘテロ接合体を特定する。対照的に、指数バックグラウンド差引きだけによって同じデータを処理し、導関数プロットとして表示した場合には、全く同じ方法による自動クラスタリングでも、予想されたヘテロ接合体の区別に失敗する(図26)。低温ホモ接合体とヘテロ接合体が一緒にクラスタリングされ、ジェノタイピングが不正確になる。これはおそらく、1つには、遺伝子型内の曲線の分散が大きいことが原因である。
【0220】
偏差解析を使用して、(方法1600および1700に関して上で説明したように)ネガティブ試料を特定することができる。さらに、偏差解析を使用して、クラスタリングおよびジェノタイピングのためのプローブ解析領域を自動的に求めることもできる。例えば、方法1800および2000は、融解曲線データ内の融解領域(1つまたは複数)を、偏差解析を使用して自動的に特定する。
【0221】
一例として、参照によってその全体が本明細書に組み込まれる「Zhou L.他、CT.High−resolution DNA Melting Analysis for Simultaneous Mutation Scanning and Genotyping in Solution、51(10)Clin.Chem.1770〜77(2005年10月)」に記載された方法の後に、非標識プローブを使用したPCRおよび融解解析によって、F5ライデン単一塩基多様体の遺伝子型を判定した。
【0222】
(全体で3つの遺伝子型の)ポジティブ試料とネガティブ(テンプレート無しコントロール)試料とがチェッカー盤の形に散らばるように、96穴プレート上に試料を置いた。PCRおよび融解解析の後、50から95℃までの未処理の融解曲線にアクセスした。図27は、そのようにして得た未処理の融解曲線のプロットを示す。
【0223】
図27に示すように、これらの曲線は2つのクラスタに分かれ、ポジティブ試料からなる上側のクラスタは、非標識プローブの融解転移とPCR生成物の融解転移の両方を含み、ネガティブ試料からなる下側のクラスタは予想された融解転移を示さず、その代わりに、代替生成物の意図しない増幅により、75℃付近に予想外の転移が存在する。図28は、(図27では直線カットオフとして示されている)振幅カットオフ技法を使用して検出した一組の試料インジケータを示す。図28に示すように、ネガティブ試料はいずれもこの技法を使用して正確に特定されなかった。
【0224】
それぞれの融解曲線に対して偏差関数E(T)を生成し、それらの偏差関数E(T)を使用して、ネガティブ試料(例えばテンプレート無しコントロール試料)を自動排除した。図16および17に関して上で説明したように、ネガティブ試料の特定を使用して、解析しうる信号を生成しない融解曲線を排除することができる。この例では、図17の方法1700に従ってネガティブ試料の特定を実行した。そのため、このネガティブ試料の特定は、区間[TMIN,TMAX−W]にわたって偏差関数E(T)の絶対値の最小minEを求め、前述のとおりにEM(T)を計算し(全てのT値についてminEを差し引き)、最大値maxEおよびEM(T)の平均(ミーン)または平均(アベレージ)を計算し、最大値maxEと平均(ミーン)または平均(アベレージ)の比を計算し、その比をしきい値と比較することを含む。この例ではしきい値を5に設定した。
【0225】
図29は、ネガティブ試料が除去された図27の一組の融解曲線を示す。図29に示すように、下側の一組の融解曲線(図27の下部の部分に見られたネガティブ試料)はもはや、この一組の「有効」融解曲線には含まれていない。図30は、前述の偏差解析技法を使用して検出したネガティブ試料を含む一組の試料インジケータを示す。図28(振幅カットオフを使用したネガティブ試料の特定)と比較すると、図30は、偏位分析の使用が、振幅カットオフ法が特定できなかったネガティブ試料の特定の成功を可能にしたことを示している。偏差解析とネガティブ試料の特定の振幅カットオフ法は、独立した解析であるため、並行して(例えば同時に)実施することができる。
【0226】
ネガティブデータの自動排除の後、偏差関数をさらに使用して、PCR生成物(アンプリコン)融解領域と、プローブ融解領域と、全ての融解領域を含む全体領域とを特定した。この例では、図20に関して上で説明したとおりに、4つの別個の温度を特定した:TP,L<TP,H<TA,L<TA,H。低い方の温度対は、プローブ融解領域を間に挟みTP,L<T<TP,H、高い方の温度対はアンプリコン融解領域を間に挟むTA,L<T<TA,H。同時突然変異スキャニング/ジェノタイピングのための全体融解領域の自動解析の一例では、これらの4つの温度の中の極端対、すなわちTP,L<T<TA,Hを使用することができ、そのため、追加の温度を計算する必要がない。
【0227】
アンプリコン領域は、TA,L<T<TA,Hによって特定されるが、TA,LおよびTA,Hの両側のバッファ値Bを使用して、これらの境界の十分に外側で解析を開始した。したがって、解析領域は、TA,L−B<T<TA,L+Bになる。図20のステップ2050を参照されたい。
【0228】
適当なバッファ値Bは、機器特性(雑音、データ密度)および一般に約1℃であるデータから抽出する最小特徴サイズによって求めた。さらに、(指数バックグラウンド差引きなどの)いくつかの解析法は、計算のために両側に温度区間を必要とし、そのため、これらの区間を定義するために、それぞれの緩衝帯の外側に追加の幅(W)を含めることができる。図20のステップ2050を参照されたい。
【0229】
これらの4つのそれぞれのBおよびW値は、同じでもまたは異なっていてもよいことが理解される。複数の融解曲線を一度に解析するときには、平均(アベレージ)区間または最も外側の区間を使用することができる。
【0230】
アンプリコンバックグラウンド領域およびアンプリコン融解領域を特定した後、プローブ融解領域を含む温度範囲を求める。上で論じたように、この温度領域は、アンプリコン領域よりも低い[TMIN,TA,L−(B+W)]を含む。図20のステップ2060を参照されたい。この温度領域内で、区間[TMIN,TA,L−(B+W)]内の|E(T)|の最小値minE2を特定し、区間[TMIN,TA,L−(B+W)]にわたって関数EM2(T)を構築する(EM2(T)=|E(T)|−minP)。図20のステップ2062を参照されたい。EM2(T)の最大値maxE2を求める。図20のステップ2064を参照されたい。
【0231】
上で特定したプローブ温度領域を評価して、プローブ融解領域が存在するかどうかを(例えば図16および17の方法1600および1700に開示したネガティブ試料の特定を使用して)判定した。この例では、対応するそれぞれの偏差プロット上のプローブピークとアンプリコンピークの比が約0.02よりも小さい場合(maxE2<maxE/e4の場合)、そのデータ中に自動的に検出可能なプローブ融解はないと判定する。融解曲線データを取得するために使用する機器の分解能によっては、0.02以外の値を選択することもできることが理解される。
【0232】
図17の方法1700に従って、プローブ温度値(TP,LおよびTP,H)を特定した。したがって、温度(TP,LおよびTP,H)を特定することは、maxE2が上記のしきい値(maxE/e4)よりも大きい場合に、TP,Lを、[TMIN,TA,L−(B+W)]内のEM2(T)>maxE2/eである最も小さなTとすることを含む。TP,Hは、[TMIN,TA,L−(B+W)]内のEM2(T)>maxE2/eである最も大きなTである。図20のステップ2070を参照されたい。したがって、TP,L<T<およびTP,Hの外側では、EM2(T)値>maxE2/eであり、これは、この記述が保持する[TMIN,TA,L−(B+W)]の最も小さな部分区間である。
【0233】
プローブ解析についても、アンプリコン解析と同様に、バッファ値(B)および幅(W)区間を使用して、プローブ領域TP,L<T<TP,Hを、TP,L−B<T<TP,H+BまたはTP,L−(B+W)<T<TP,L+(B+W)に拡張した。図20のステップ2080を参照されたい。
【0234】
図31は、テンプレート無しコントロールの自動排除、アンプリコン領域およびプローブ領域の自動特定、積分された偏差プロット上で試料が1から0へ変化するようにするプローブ領域偏差データの正規化、自動ジェノタイピングのための曲線のクラスタリング、および積分された偏差プロットとしての(累積偏差の百分率としての)プローブデータの作図の後の、F5プローブ解析の結果を示す。図32のプレートマップは、遺伝子型およびネガティブコントロール試料(前述の偏差解析技法を使用して特定したネガティブ試料)の正しいパターンを示している。
【0235】
図33は、融解曲線データを解析するシステム3300のブロック図である。このシステムは、コンピューティングデバイス3310を含み、コンピューティングデバイス3310は、1つまたは複数のプロセッサ(図示せず)、メモリ(図示せず)、コンピュータ可読媒体3312、1つまたは複数のHMIデバイス3314(例えば入出力デバイス、ディスプレイ、プリンタなど)、1つまたは複数の通信インタフェース3316(例えばネットワークインタフェース、ユニバーサルシリアルバス(USB)インタフェースなど)などを備えることができる。あるいは、またはこれに加えて、システム3300は、ローカルクラスタおよび/または分散クラスタ(図示せず)内に、複数のコンピューティングデバイス3310を備えることができる。
【0236】
コンピューティングデバイス3310を、融解曲線データ源3320に通信可能に結合することができ、融解曲線データ源3320は、融解曲線生成機器(例えばRoche Diagnostics,GmbH.から市販されているLightCycler(登録商標)デバイス、HR−1(商標)高分解能融解機器など)を備えることができる。あるいは、またはこれに加えて、データ源3320は、融解曲線データを含むコンピュータ可読媒体を備えることができる。
【0237】
コンピュータ可読媒体3312からコンピュータ可読プログラムコードをロードするように、コンピューティングデバイス3310を構成することができる。このプログラムコードは、本明細書に開示したシステムおよび方法(例えば方法300、1600、1700、2000、2200、2400など)またはそれらの変型システムおよび方法のうちの1つまたは複数のシステムまたは方法を実現するプロセッサ実行可能命令またはプロセッサ解釈可能命令を含むことができる。これらの命令は、コンピュータ可読媒体3312上の1つまたは複数の別個のソフトウェアモジュールとして具体化することができる。これらのモジュールは、データ源3320の融解曲線データにアクセスするように構成されたデータ取得モジュール3332、バックグラウンド蛍光のモデルにアクセスするように構成されたモデル化モジュール3334、融解曲線データに対して偏差解析を実行する(例えば、とりわけ図3の方法300に従って偏差関数を生成する)ように構成された解析モジュール3336、(HMI3314を介した)融解曲線データの表示、および/または前述の偏差解析技法を使用した融解曲線データの追加の処理(例えば自動ネガティブ試料の特定、指数バックグラウンド差引き、融解領域の特定、クラスタリングなど)を提供するように構成された処理モジュール3338、ならびに人間ユーザ(図示せず)によるシステム3300の制御、および/または他のコンピューティングデバイスもしくはエージェント(図示せず)などの1つもしくは複数の外部プロセス(図示せず)によるシステム3300の制御を提供するように構成された制御モジュール3339を備えることができる。
【0238】
制御モジュール3339は、前述のとおりに、融解曲線データを取得し、かつ/もしくは融解曲線データにアクセスし、融解曲線データに対する偏差解析を実行し、および/または解析されたデータを表示するように、システム3300を導くことを可能にすることができる。例えば、制御モジュール3339は、融解曲線データ、クラスタリングの結果、ジェノタイピングの結果、スキャニングの結果などのHMI3314上への表示を提供することができる。したがって、制御モジュール3339は、ユーザインタフェース制御をHMI3314上に表示し、および/またはHMI3314からユーザ入力を受け取るように構成されたユーザインタフェース(図示せず)を備えることができる。さらに、1つまたは複数の通信インタフェース3316を介してコマンドおよび/または命令を(例えばリモートコンピューティングデバイス、エージェントなどから)受け取るように、制御モジュール3339を構成することもできる。制御モジュール3339は、自動ネガティブ試料の特定、融解領域の特定、バックグラウンド差引き、表示、クラスタリングおよび他のプロセスを実行するため、ユーザおよび/または外部プロセスからプログラミングコマンドを受け取ることができる。さらに、偏差解析処理の結果をコンピュータ可読媒体3312に記憶し、および/または1つまたは複数の通信インタフェース3316上でそれらの結果を送信するように、制御モジュール3339を構成することもできる。
【0239】
ある実施形態では、本明細書に開示した偏差解析技法(例えば方法300、1600、1700、2000、2200、2400またはこれらの方法の変型法)を使用して、ジェノタイピングプロセスおよび/またはスキャニングプロセスを自発的に実行するように、システム3300が構成される。上で論じたとおり、本明細書に開示した偏差解析技法は、特定の一組の融解曲線解析用途だけに限定されず、本明細書に開示した偏差解析技法を使用して多数の融解曲線解析用途を実現するように、システム3300を構成することができる。したがって、本開示およびシステム3300が、特定の一組の融解曲線偏差解析用途に限定されると解釈すべきではない。
【0240】
以上の説明では、本明細書に記載した実施形態を完全に理解できるように、多数の具体的な詳細を示した。しかしながら、それらの具体的な詳細のうちの1つもしくは複数の詳細を省くことができ、または、その他の方法、構成要素もしくは材料を使用することができることを、当業者なら理解するであろう。いくつかの場合には、操作を詳細には示さず、または説明しなかった。
【0241】
さらに、1つまたは複数の実施形態において、記載した特徴、操作または特性を適当な方法で組み合わせることができる。当業者には明らかなことだが、開示した実施形態に関して説明した方法のステップまたは実行の順序を変更することができることも容易に理解される。したがって、図面または詳細な説明内における順序は、例示だけが目的であり、その順序が必須であると明示されない限り、どの順序も、必須の順序であることを含意するものではない。
【0242】
実施形態は、さまざまなステップを含むことがあり、それらのさまざまなステップは、汎用または専用コンピュータ(または他の電子デバイス)によって実行される機械実行可能命令として具体化することができる。それらの機械実行可能命令は、コンピュータ可読記憶媒体上において具体化することができる。ある実施形態では、これらの命令が、1つまたは複数の別個のソフトウェアモジュールとして具体化される。あるいは、1つまたは複数のステップを、それらのステップを実行する特定の論理を含むハードウェアコンポーネントによって、または、ハードウェア、ソフトウェアおよび/またはファームウェアの組合せによって実行することができる。
【0243】
実施形態は、本明細書に記載したプロセスを実行するようにコンピュータ(または他の電子デバイス)をプログラムするのに使用することができる命令を記憶したコンピュータ可読媒体を含むコンピュータプログラム製品として提供することもできる。このコンピュータ可読媒体には、限定はされないが、ハードドライブ、フロッピーディスケット、光ディスク、CD−ROM、DVD−ROM、ROM、RAM、EPROM、EEPROM、磁気もしくは光学カード、固体メモリデバイス、または電子的な命令を記憶するのに適した他のタイプの媒体/機械可読媒体が含まれる。
【0244】
本明細書で使用するとき、ソフトウェアモジュールまたはコンポーネントは、メモリデバイスおよび/またはコンピュータ可読記憶媒体内に位置する任意のタイプのコンピュータ命令またはコンピュータ実行可能コードを含むことができる。ソフトウェアモジュールは例えば、1つまたは複数のタスクを実行し、または特定の抽象データ型を実現するルーチン、プログラム、オブジェクト、コンポーネント、データ構造などとして編成することができるコンピュータ命令の1つまたは複数の物理または論理ブロックを含むことができる。
【0245】
ある種の実施形態では、特定のソフトウェアモジュールが、メモリデバイスの異なる位置に記憶された異種の命令を含み、それらの命令は、協力して、そのモジュールの記載された機能を実現する。そのモジュールは、コンピュータ可読記憶媒体上において具体化し、および/または記憶媒体上の別個のモジュールとして具体化することができる。モジュールは、単一の命令または多くの命令を含むことができ、異なるいくつかのコードセグメントにわたって、異なるプログラムの中に、および/またはいくつかのメモリデバイスにわたって分散させることができる。ある実施形態は、通信ネットワークを介してリンクされたリモート処理デバイスによってタスクが実行される分散コンピューティング環境で実施することができる。分散コンピューティング環境では、ソフトウェアモジュールを、ローカルメモリ記憶デバイスおよび/またはリモートメモリ記憶デバイス内に配置することができる。さらに、データベースレコードとして連結されまたは一緒にされているデータは、同じメモリデバイス内に、またはいくつかのメモリデバイスにわたって常駐していることがあり、ネットワークにわたってデータベース内のあるレコードのフィールド内でリンクされていることがある。
【0246】
根底にある本発明の原理から逸脱することなく前述の実施形態の詳細に多くの変更を実施することができることを当業者なら理解するであろう。
【特許請求の範囲】
【請求項1】
融解曲線データを解析する方法であって、
前記方法は、
蛍光染料を含む化合物を融解させることによって得た複数の電気光学(EO)放射測定値を温度の関数として含む実験的な融解曲線データであって、バックグラウンドEO放射信号を含む実験的な融解曲線データにアクセスすることと、
前記バックグラウンドEO放射信号のモデルにアクセスすることと、
前記実験的な融解曲線データと前記バックグラウンドEO放射信号の前記モデルとの間の偏差を温度の関数として定量化する偏差関数を計算することと、
前記化合物の解析において使用するため、前記偏差関数をコンピュータ可読記憶媒体上に記憶することと、
を含むことを特徴とする方法。
【請求項2】
前記実験的な融解曲線データが、前記蛍光染料を含む前記化合物にエネルギー勾配を与えることによって得たものである、請求項1に記載の方法。
【請求項3】
前記バックグラウンドEO放射信号の前記モデルが、指数減衰関数および2次関数からなるグループの中の一方の関数を含む、請求項1に記載の方法。
【請求項4】
前記偏差関数を、人間−機械インタフェースデバイス上でユーザに提示することをさらに含む、請求項1に記載の方法。
【請求項5】
前記偏差関数を計算することが、
前記実験的な融解曲線データを、前記実験的な融解曲線データのある領域内にそれぞれ定義された複数の窓に分割することと、
前記窓のうちの対応するそれぞれの窓内でそれぞれ計算され、前記対応するそれぞれの窓内における前記実験的な融解曲線データと前記バックグラウンドEO放射信号の前記モデルとの間の偏差を定量化する複数のフィットパラメータを計算することと、
を含み、
前記偏差関数が前記フィットパラメータから形成される、請求項1に記載の方法。
【請求項6】
前記化合物が核酸試料を含み、選択された窓のフィットパラメータが、前記実験的な融解曲線データを、
【数29】
の形の前記バックグラウンドEO放射信号のモデルにフィットさせることによって計算され、Ciおよびaiがフィッティングパラメータ、Tが温度、Tiが窓の索引、Wが、前記選択された窓の幅である、請求項5に記載の方法。
【請求項7】
前記偏差関数を計算することがさらに、前記偏差関数から前記偏差関数の最小値を差し引くことを含む、請求項5に記載の方法。
【請求項8】
前記偏差関数の最大値と前記偏差関数の平均(アベレージ)値と平均(ミーン)値のうちの一方の比を計算し、前記比がしきい値よりも大きいときに、前記実験的な融解曲線データが有効な融解転移領域を含むと判定することによって、
前記実験的な融解曲線データが有効な融解転移領域を含むかどうかを判定することをさらに含む、請求項7に記載の方法。
【請求項9】
前記偏差関数の第1の温度領域内の高位バックグラウンド除去カーソルおよび低位バックグラウンド除去カーソルを特定することと、
前記高位バックグラウンド除去カーソルおよび前記低位バックグラウンド除去カーソルを使用して、バックグラウンド補正された融解曲線を計算することと、
をさらに含む、請求項7に記載の方法。
【請求項10】
前記偏差関数がしきい値よりも大きい前記第1の温度領域内の最も高い温度として第1のバックグラウンド温度を特定することと、
前記第1のバックグラウンド温度よりも高い、および/または、前記第1のバックグラウンド温度に等しい温度を含むカーソルプローブ領域を定義することと、
前記カーソルプローブ領域から、前記高位バックグラウンド除去カーソルおよび前記低位バックグラウンド除去カーソルを選択することと、
をさらに含む、請求項9に記載の方法。
【請求項11】
前記化合物がタンパク質試料を含み、
前記方法がさらに、
前記実験的な融解曲線データ内の凝集信号の導関数のモデルにアクセスすることと、
前記凝集信号モデルを使用して、前記バックグラウンド補正された融解曲線から前記凝集信号を除去することと、
を含む、請求項10に記載の方法。
【請求項12】
前記化合物が核酸試料を含み、
前記方法がさらに、
前記偏差関数がしきい値よりも大きい前記第1の温度領域内の最も高い温度に第1の緩衝定数を加えたものとして、高位バックグラウンド温度を特定することと、
前記偏差関数がしきい値よりも大きい前記第1の温度領域内の最も低い温度から第2の緩衝定数を差し引いたものとして、低位バックグラウンド温度を特定することと、
前記高位バックグラウンド温度よりも高い、および/または、前記高位バックグラウンド温度に等しい温度を含み、所定の幅を有する高位プローブ領域を定義することと、
前記低位バックグラウンド温度よりも低い、および/または、前記低位バックグラウンド温度に等しい温度を含み、所定の幅を有する低位プローブ領域を定義することと、
前記高位バックグラウンド除去カーソルを前記高プローブ領域から選択し、前記低位バックグラウンド除去カーソルを前記低位プローブ領域から選択することと、
を含む、請求項9に記載の方法。
【請求項13】
前記低位バックグラウンド除去カーソルおよび前記高位バックグラウンド除去カーソルが、目的関数を最小化することによって選択され、前記目的関数が、前記実験的な融解曲線データと前記バックグラウンドEO放射信号のモデルとの間の誤差を定量化するように構成された、請求項9に記載の方法。
【請求項14】
バックグラウンド補正された複数の融解曲線を互いに比較することと、
前記比較に基づいて、前記バックグラウンド補正された複数の融解曲線を2つ以上のグループにクラスタリングすることと、
前記2つ以上のクラスタ内の偏差および前記2つ以上のクラスタ間の偏差に基づいて、クラスタリング質メトリックを計算することと、
前記クラスタリング質メトリックに基づいて、前記バックグラウンド除去カーソルを改良するかどうかを判定することと、
前記バックグラウンド除去カーソルを改良するときに、前記バックグラウンド除去カーソルを変更し、変更されたバックグラウンド除去カーソルを使用して、バックグラウンド補正され、変更された融解曲線を計算し、前記クラスタ質メトリックを再計算することと、
をさらに含む、請求項9に記載の方法。
【請求項15】
前記化合物が核酸試料を含み、
前記方法がさらに、
前記核酸試料を増幅することと、
前記核酸試料と蛍光染料とを含む溶液にエネルギー勾配を与えることによって、前記溶液を融解させることと、
複数のEO放射測定値を温度の関数として取得することと、
を含む、請求項1に記載の方法。
【請求項16】
前記化合物がタンパク質試料を含む、請求項1に記載の方法。
【請求項17】
融解曲線データを解析する方法をコンピューティングデバイスに実行させるように構成されたコンピュータ可読命令を含むコンピュータ可読記憶媒体であって、
前記方法が、
蛍光染料を含む化合物を融解させることによって得た複数の電気光学(EO)放射測定値を温度の関数として含む実験的な融解曲線データであって、バックグラウンドEO放射信号を含む実験的な融解曲線データにアクセスすることと、
前記バックグラウンドEO放射信号のモデルにアクセスすることと、
前記実験的な融解曲線データと前記バックグラウンドEO放射信号の前記モデルとの間の偏差を温度の関数として定量化する偏差関数を計算することと、
を含むことを特徴とするコンピュータ可読記憶媒体。
【請求項18】
前記実験的な融解曲線データが、前記蛍光染料を含む前記化合物にエネルギー勾配を与えることによって得たものである、請求項17に記載のコンピュータ可読記憶媒体。
【請求項19】
前記バックグラウンドEO放射信号の前記モデルが、指数減衰関数および2次関数からなるグループの中の一方の関数を含む、請求項17に記載のコンピュータ可読記憶媒体。
【請求項20】
前記方法がさらに、前記偏差関数を、人間−機械インタフェースデバイス上でユーザに提示することを含む、請求項17に記載のコンピュータ可読記憶媒体。
【請求項21】
前記偏差関数を計算することが、
前記実験的な融解曲線データを、前記実験的な融解曲線データのある温度範囲内にそれぞれ定義された複数の窓に分割することと、
前記窓のうちの対応するそれぞれの窓内でそれぞれ計算され、前記対応するそれぞれの窓内における前記実験的な融解曲線データと前記バックグラウンドEO放射信号の前記モデルとの間の偏差を定量化する複数のフィットパラメータを計算することと、
を含み、
前記偏差関数が前記フィットパラメータから形成される、請求項17に記載のコンピュータ可読記憶媒体。
【請求項22】
前記化合物が核酸試料を含み、選択された窓のフィットパラメータが、前記実験的な融解曲線データを、
【数29】
の形の前記バックグラウンドEO放射信号のモデルにフィットさせることによって計算され、Ciおよびaiがフィッティングパラメータ、Tが温度、Tiが窓の索引、Wが、前記選択された窓の幅である、請求項21に記載のコンピュータ可読記憶媒体。
【請求項23】
前記偏差関数を計算することがさらに、前記偏差関数から前記偏差関数の最小値を差し引くことを含む、請求項22に記載のコンピュータ可読記憶媒体。
【請求項24】
前記方法がさらに、
前記偏差関数の最大値と前記偏差関数の平均(アベレージ)値と平均(ミーン)値のうちの一方の比を計算し、前記比がしきい値よりも大きいときに、前記実験的な融解曲線データが有効な融解転移領域を含むと判定することによって、
前記実験的な融解曲線データが有効な融解転移領域を含むかどうかを判定することを含む、請求項23に記載のコンピュータ可読記憶媒体。
【請求項25】
前記方法がさらに、
前記偏差関数の第1の温度領域内の高位バックグラウンド除去カーソルおよび低位バックグラウンド除去カーソルを特定することと、
前記高位バックグラウンド除去カーソルおよび前記低位バックグラウンド除去カーソルを使用して、バックグラウンド補正された融解曲線を計算することと、
を含む、請求項23に記載のコンピュータ可読記憶媒体。
【請求項26】
前記方法がさらに、
前記偏差関数がしきい値よりも大きい前記第1の温度領域内の最も高い温度として第1のバックグラウンド温度を特定することと、
前記第1のバックグラウンド温度よりも高い、および/または、前記第1のバックグラウンド温度に等しい温度を含むカーソルプローブ領域を定義することと、
前記カーソルプローブ領域から、前記高位バックグラウンド除去カーソルおよび前記低位バックグラウンド除去カーソルを選択することと、
を含む、請求項25に記載のコンピュータ可読記憶媒体。
【請求項27】
前記化合物がタンパク質試料を含み、
前記方法がさらに、
前記実験的な融解曲線データ内の凝集信号の導関数のモデルにアクセスすることと、
前記凝集信号モデルを使用して、前記バックグラウンド補正された融解曲線から前記凝集信号を除去することと、
を含む、請求項26に記載のコンピュータ可読記憶媒体。
【請求項28】
前記化合物が核酸試料を含み、
前記方法がさらに、
前記偏差関数がしきい値よりも大きい前記第1の温度領域内の最も高い温度に第1の緩衝定数を加えたものとして、高位バックグラウンド温度を特定することと、
前記偏差関数がしきい値よりも大きい前記第1の温度領域内の最も低い温度から第2の緩衝定数を差し引いたものとして、低位バックグラウンド温度を特定することと、
前記高位バックグラウンド温度よりも高い、および/または、前記高位バックグラウンド温度に等しい温度を含み、所定の幅を有する高位プローブ領域を定義することと、
前記低位バックグラウンド温度よりも低い、および/または、前記低位バックグラウンド温度に等しい温度を含み、所定の幅を有する低位プローブ領域を定義することと、
前記高位バックグラウンド除去カーソルを前記高プローブ領域から選択し、前記低位バックグラウンド除去カーソルを前記低位プローブ領域から選択することと、
を含む、請求項25に記載のコンピュータ可読記憶媒体。
【請求項29】
前記低位バックグラウンド除去カーソルおよび前記高位バックグラウンド除去カーソルが、目的関数を最小化することによって選択され、前記目的関数が、前記実験的な融解曲線データと前記バックグラウンドEO放射信号のモデルとの間の誤差を定量化するように構成された、請求項25に記載のコンピュータ可読記憶媒体。
【請求項30】
前記方法がさらに、
バックグラウンド補正された複数の融解曲線を互いに比較することと、
前記比較に基づいて、前記バックグラウンド補正された複数の融解曲線を2つ以上のグループにクラスタリングすることと、
前記2つ以上のクラスタ内の偏差および前記2つ以上のクラスタ間の偏差に基づいて、クラスタリング質メトリックを計算することと、
前記クラスタリング質メトリックに基づいて、前記バックグラウンド除去カーソルを改良するかどうかを判定することと、
前記バックグラウンド除去カーソルを改良するときに、前記バックグラウンド除去カーソルを変更し、変更されたバックグラウンド除去カーソルを使用して、バックグラウンド補正され、変更された融解曲線を計算し、前記クラスタ質メトリックを再計算することと、
を含む、請求項25に記載のコンピュータ可読記憶媒体。
【請求項31】
前記化合物が核酸試料を含み、
前記方法がさらに、
前記核酸試料を増幅することと、
前記化合物にエネルギー勾配を与えること、および、前記化合物のイオン濃度を増大させることのうちの一方によって、前記化合物を融解させることと、
複数のEO放射測定値を、温度とイオン濃度のうちの一方の関数として取得することと、
を含む、請求項17に記載のコンピュータ可読記憶媒体。
【請求項32】
融解曲線データを解析する装置であって、
プロセッサを備えるコンピューティングデバイスと、
前記プロセッサ上で動作可能である、実験的な融解曲線データにアクセスするように構成された取得モジュールであって、前記実験的な融解曲線データが、蛍光染料を含む化合物を融解させることによって得た複数の電気光学(EO)放射測定値を含み、前記実験的な融解曲線データがバックグラウンドEO放射信号を含む、取得モジュールと、
前記プロセッサ上で動作可能なモデル化モジュールであり、前記バックグラウンドEO放射信号のモデルにアクセスするように構成されたモデル化モジュールと、
前記プロセッサ上で動作可能な処理モジュールであり、前記実験的な融解曲線データと前記バックグラウンドEO放射信号の前記モデルとの間の偏差を定量化する偏差関数を計算するように構成された処理モジュールと、
を備え、
前記処理モジュールが、前記実験的な融解曲線データを、前記実験的な融解曲線データのある領域内にそれぞれ定義された複数の窓に分割し、前記窓のうちの対応するそれぞれの窓内でそれぞれ計算される複数のフィットパラメータを計算し、前記対応するそれぞれの窓内における前記実験的な融解曲線データと前記バックグラウンドEO放射信号の前記モデルとの間の偏差を定量化することによって、前記偏差関数を計算し、前記偏差関数が前記フィットパラメータから形成されることを特徴とする装置。
【請求項33】
前記窓の幅が、前記実験的な融解曲線データの分解能、前記実験的な融解曲線データ内の関心の特徴の特性および性能メトリックのうちの1つに基づいて選択される、請求項32に記載の装置。
【請求項34】
前記窓のうちの選択された窓のフィットパラメータが、前記実験的な融解曲線データを、
【数29】
の形の前記バックグラウンドEO放射信号のモデルにフィットさせることによって計算され、Ciおよびaiがフィッティングパラメータ、Tが温度、Tiが窓の索引、Wが、前記選択された窓の幅である、請求項32に記載の装置。
【請求項35】
前記処理モジュールが、前記偏差関数から前記偏差関数の最小値を差し引くように構成された、請求項32に記載の装置。
【請求項36】
前記偏差関数の最大値と前記偏差関数の平均(アベレージ)値と平均(ミーン)値のうちの一方の比を計算し、前記比がしきい値よりも大きいときに、前記実験的な融解曲線データが有効な融解転移領域を含むと判定し、前記比が前記しきい値以下であるときに、前記実験的な融解曲線データが有効な融解転移領域を含まないと判定することによって、前記実験的な融解曲線データが有効な融解転移領域を含むかどうかを判定するように、前記処理モジュールが構成された、請求項35に記載の装置。
【請求項37】
前記しきい値が、複数の偏差関数を使用して計算され、前記複数の偏差関数がそれぞれ、対応するそれぞれの異なる実験的な融解曲線データを使用して計算され、前記しきい値が、前記対応するそれぞれの偏差関数のそれぞれの関数の最大値と、前記対応するそれぞれの偏差関数の前記それぞれの関数の平均(アベレージ)および平均(ミーン)のうちの一方との比の平均(アベレージ)および平均(ミーン)のうちの一方を使用して計算される、請求項36に記載の装置。
【請求項38】
前記しきい値が、前記複数の偏差関数の前記比の標準偏差に基づく、請求項37に記載の装置。
【請求項39】
前記偏差関数の第1の温度領域内の高位バックグラウンド除去カーソルおよび低位バックグラウンド除去カーソルを特定し、前記高位バックグラウンド除去カーソルおよび前記低位バックグラウンド除去カーソルを使用して、バックグラウンド補正された融解曲線データを計算するように、前記処理モジュールが構成された、請求項37に記載の装置。
【請求項40】
前記偏差関数がしきい値よりも大きい前記第1の温度領域内の最も高い温度として第1のバックグラウンド温度を特定し、前記第1のバックグラウンド温度よりも高い、および/または、前記第1のバックグラウンド温度に等しい温度を含むカーソルプローブ領域を定義し、前記カーソルプローブ領域から、前記高位バックグラウンド除去カーソルおよび前記低位バックグラウンド除去カーソルを選択するように、前記処理モジュールが構成された、請求項39に記載の装置。
【請求項41】
前記化合物がタンパク質試料を含み、前記実験的な融解曲線データ内の凝集信号の導関数のモデルにアクセスし、前記凝集信号モデルを使用して、前記バックグラウンド補正された融解曲線から前記凝集信号を除去するように、前記処理モジュールが構成された、請求項40に記載の装置。
【請求項42】
前記処理モジュールが、
前記偏差関数がしきい値よりも大きい前記第1の温度領域内の最も高い温度に第1の緩衝定数を加えたものとして、高位バックグラウンド温度を特定し、
前記偏差関数がしきい値よりも大きい前記第1の温度領域内の最も低い温度から第2の緩衝定数を差し引いたものとして、低位バックグラウンド温度を特定し、
前記高位バックグラウンド温度よりも高い、および/または、前記高位バックグラウンド温度に等しい温度を含み、所定の幅を有する高位プローブ領域を定義し、
前記低位バックグラウンド温度よりも低い、および/または、前記低位バックグラウンド温度に等しい温度を含み、所定の幅を有する低位プローブ領域を定義し、
前記高位バックグラウンド除去カーソルを前記高プローブ領域から選択し、前記低位バックグラウンド除去カーソルを前記低位プローブ領域から選択するように構成された、請求項39に記載の装置。
【請求項43】
前記処理モジュールが、目的関数を最小化することによって前記低位バックグラウンド除去カーソルおよび前記高位バックグラウンド除去カーソルを選択するように構成され、前記目的関数が、前記実験的な融解曲線データと前記バックグラウンドEO放射信号のモデルとの間の誤差を定量化するように構成された、請求項39に記載の装置。
【請求項44】
前記処理モジュールが、
バックグラウンド補正された複数の融解曲線を互いに比較し、
前記比較に基づいて、前記バックグラウンド補正された複数の融解曲線を2つ以上のグループにクラスタリングし、
前記2つ以上のクラスタ内の偏差および前記2つ以上のクラスタ間の偏差に基づいて、クラスタリング質メトリックを計算し、
前記クラスタリング質メトリックに基づいて、前記バックグラウンド除去カーソルを改良するかどうかを判定し、
前記バックグラウンド除去カーソルを改良するときに、前記バックグラウンド除去カーソルを変更し、変更されたバックグラウンド除去カーソルを使用して、バックグラウンド補正され、変更された融解曲線を計算し、前記クラスタ質メトリックを再計算するように構成された、請求項39に記載の装置。
【請求項45】
前記化合物が核酸試料を含み、前記装置がさらに、前記実験的な融解曲線データを取得するように構成された機器を備え、前記機器が、前記化合物を保持するための容器を備える、請求項32に記載の装置。
【請求項46】
前記機器がサーモサイクラを備える、請求項45に記載の装置。
【請求項47】
融解曲線データを解析する方法であって、
EO放射放出染料を含む化合物に融解勾配を与えることによって得られた、前記融解勾配に沿った複数の電気光学(EO)放射測定値を含む実験的な融解曲線データであって、バックグラウンドEO放射信号を含む実験的な融解局線データにアクセスすること、
前記バックグラウンドEO放射信号のモデルにアクセスすること、
前記実験的な融解曲線データを、前記実験的な融解曲線データのある領域内にそれぞれ定義された複数の窓に分割し、対応するそれぞれの窓内における前記実験的な融解曲線データと前記バックグラウンドEO放射信号の前記モデルとの間の偏差をそれぞれが定量化する複数のフィットパラメータを計算し、前記フィットパラメータから前記偏位関数を形成することによって、前記実験的な融解曲線データと前記バックグラウンドEO放射信号の前記モデルとの間の偏差を前記融解勾配の関数として定量化する偏差関数を計算することと、
前記化合物の解析において使用するため、前記偏差関数をコンピュータ可読記憶媒体上に記憶することと、
を含むことを特徴とする方法。
【請求項48】
前記実験的な融解曲線データが、前記化合物にエネルギー勾配を与えること、および前記化合物のイオン濃度を増大させることのうちの一方により、前記化合物を融解させることによって得たものである、請求項47に記載の方法。
【請求項1】
融解曲線データを解析する方法であって、
前記方法は、
蛍光染料を含む化合物を融解させることによって得た複数の電気光学(EO)放射測定値を温度の関数として含む実験的な融解曲線データであって、バックグラウンドEO放射信号を含む実験的な融解曲線データにアクセスすることと、
前記バックグラウンドEO放射信号のモデルにアクセスすることと、
前記実験的な融解曲線データと前記バックグラウンドEO放射信号の前記モデルとの間の偏差を温度の関数として定量化する偏差関数を計算することと、
前記化合物の解析において使用するため、前記偏差関数をコンピュータ可読記憶媒体上に記憶することと、
を含むことを特徴とする方法。
【請求項2】
前記実験的な融解曲線データが、前記蛍光染料を含む前記化合物にエネルギー勾配を与えることによって得たものである、請求項1に記載の方法。
【請求項3】
前記バックグラウンドEO放射信号の前記モデルが、指数減衰関数および2次関数からなるグループの中の一方の関数を含む、請求項1に記載の方法。
【請求項4】
前記偏差関数を、人間−機械インタフェースデバイス上でユーザに提示することをさらに含む、請求項1に記載の方法。
【請求項5】
前記偏差関数を計算することが、
前記実験的な融解曲線データを、前記実験的な融解曲線データのある領域内にそれぞれ定義された複数の窓に分割することと、
前記窓のうちの対応するそれぞれの窓内でそれぞれ計算され、前記対応するそれぞれの窓内における前記実験的な融解曲線データと前記バックグラウンドEO放射信号の前記モデルとの間の偏差を定量化する複数のフィットパラメータを計算することと、
を含み、
前記偏差関数が前記フィットパラメータから形成される、請求項1に記載の方法。
【請求項6】
前記化合物が核酸試料を含み、選択された窓のフィットパラメータが、前記実験的な融解曲線データを、
【数29】
の形の前記バックグラウンドEO放射信号のモデルにフィットさせることによって計算され、Ciおよびaiがフィッティングパラメータ、Tが温度、Tiが窓の索引、Wが、前記選択された窓の幅である、請求項5に記載の方法。
【請求項7】
前記偏差関数を計算することがさらに、前記偏差関数から前記偏差関数の最小値を差し引くことを含む、請求項5に記載の方法。
【請求項8】
前記偏差関数の最大値と前記偏差関数の平均(アベレージ)値と平均(ミーン)値のうちの一方の比を計算し、前記比がしきい値よりも大きいときに、前記実験的な融解曲線データが有効な融解転移領域を含むと判定することによって、
前記実験的な融解曲線データが有効な融解転移領域を含むかどうかを判定することをさらに含む、請求項7に記載の方法。
【請求項9】
前記偏差関数の第1の温度領域内の高位バックグラウンド除去カーソルおよび低位バックグラウンド除去カーソルを特定することと、
前記高位バックグラウンド除去カーソルおよび前記低位バックグラウンド除去カーソルを使用して、バックグラウンド補正された融解曲線を計算することと、
をさらに含む、請求項7に記載の方法。
【請求項10】
前記偏差関数がしきい値よりも大きい前記第1の温度領域内の最も高い温度として第1のバックグラウンド温度を特定することと、
前記第1のバックグラウンド温度よりも高い、および/または、前記第1のバックグラウンド温度に等しい温度を含むカーソルプローブ領域を定義することと、
前記カーソルプローブ領域から、前記高位バックグラウンド除去カーソルおよび前記低位バックグラウンド除去カーソルを選択することと、
をさらに含む、請求項9に記載の方法。
【請求項11】
前記化合物がタンパク質試料を含み、
前記方法がさらに、
前記実験的な融解曲線データ内の凝集信号の導関数のモデルにアクセスすることと、
前記凝集信号モデルを使用して、前記バックグラウンド補正された融解曲線から前記凝集信号を除去することと、
を含む、請求項10に記載の方法。
【請求項12】
前記化合物が核酸試料を含み、
前記方法がさらに、
前記偏差関数がしきい値よりも大きい前記第1の温度領域内の最も高い温度に第1の緩衝定数を加えたものとして、高位バックグラウンド温度を特定することと、
前記偏差関数がしきい値よりも大きい前記第1の温度領域内の最も低い温度から第2の緩衝定数を差し引いたものとして、低位バックグラウンド温度を特定することと、
前記高位バックグラウンド温度よりも高い、および/または、前記高位バックグラウンド温度に等しい温度を含み、所定の幅を有する高位プローブ領域を定義することと、
前記低位バックグラウンド温度よりも低い、および/または、前記低位バックグラウンド温度に等しい温度を含み、所定の幅を有する低位プローブ領域を定義することと、
前記高位バックグラウンド除去カーソルを前記高プローブ領域から選択し、前記低位バックグラウンド除去カーソルを前記低位プローブ領域から選択することと、
を含む、請求項9に記載の方法。
【請求項13】
前記低位バックグラウンド除去カーソルおよび前記高位バックグラウンド除去カーソルが、目的関数を最小化することによって選択され、前記目的関数が、前記実験的な融解曲線データと前記バックグラウンドEO放射信号のモデルとの間の誤差を定量化するように構成された、請求項9に記載の方法。
【請求項14】
バックグラウンド補正された複数の融解曲線を互いに比較することと、
前記比較に基づいて、前記バックグラウンド補正された複数の融解曲線を2つ以上のグループにクラスタリングすることと、
前記2つ以上のクラスタ内の偏差および前記2つ以上のクラスタ間の偏差に基づいて、クラスタリング質メトリックを計算することと、
前記クラスタリング質メトリックに基づいて、前記バックグラウンド除去カーソルを改良するかどうかを判定することと、
前記バックグラウンド除去カーソルを改良するときに、前記バックグラウンド除去カーソルを変更し、変更されたバックグラウンド除去カーソルを使用して、バックグラウンド補正され、変更された融解曲線を計算し、前記クラスタ質メトリックを再計算することと、
をさらに含む、請求項9に記載の方法。
【請求項15】
前記化合物が核酸試料を含み、
前記方法がさらに、
前記核酸試料を増幅することと、
前記核酸試料と蛍光染料とを含む溶液にエネルギー勾配を与えることによって、前記溶液を融解させることと、
複数のEO放射測定値を温度の関数として取得することと、
を含む、請求項1に記載の方法。
【請求項16】
前記化合物がタンパク質試料を含む、請求項1に記載の方法。
【請求項17】
融解曲線データを解析する方法をコンピューティングデバイスに実行させるように構成されたコンピュータ可読命令を含むコンピュータ可読記憶媒体であって、
前記方法が、
蛍光染料を含む化合物を融解させることによって得た複数の電気光学(EO)放射測定値を温度の関数として含む実験的な融解曲線データであって、バックグラウンドEO放射信号を含む実験的な融解曲線データにアクセスすることと、
前記バックグラウンドEO放射信号のモデルにアクセスすることと、
前記実験的な融解曲線データと前記バックグラウンドEO放射信号の前記モデルとの間の偏差を温度の関数として定量化する偏差関数を計算することと、
を含むことを特徴とするコンピュータ可読記憶媒体。
【請求項18】
前記実験的な融解曲線データが、前記蛍光染料を含む前記化合物にエネルギー勾配を与えることによって得たものである、請求項17に記載のコンピュータ可読記憶媒体。
【請求項19】
前記バックグラウンドEO放射信号の前記モデルが、指数減衰関数および2次関数からなるグループの中の一方の関数を含む、請求項17に記載のコンピュータ可読記憶媒体。
【請求項20】
前記方法がさらに、前記偏差関数を、人間−機械インタフェースデバイス上でユーザに提示することを含む、請求項17に記載のコンピュータ可読記憶媒体。
【請求項21】
前記偏差関数を計算することが、
前記実験的な融解曲線データを、前記実験的な融解曲線データのある温度範囲内にそれぞれ定義された複数の窓に分割することと、
前記窓のうちの対応するそれぞれの窓内でそれぞれ計算され、前記対応するそれぞれの窓内における前記実験的な融解曲線データと前記バックグラウンドEO放射信号の前記モデルとの間の偏差を定量化する複数のフィットパラメータを計算することと、
を含み、
前記偏差関数が前記フィットパラメータから形成される、請求項17に記載のコンピュータ可読記憶媒体。
【請求項22】
前記化合物が核酸試料を含み、選択された窓のフィットパラメータが、前記実験的な融解曲線データを、
【数29】
の形の前記バックグラウンドEO放射信号のモデルにフィットさせることによって計算され、Ciおよびaiがフィッティングパラメータ、Tが温度、Tiが窓の索引、Wが、前記選択された窓の幅である、請求項21に記載のコンピュータ可読記憶媒体。
【請求項23】
前記偏差関数を計算することがさらに、前記偏差関数から前記偏差関数の最小値を差し引くことを含む、請求項22に記載のコンピュータ可読記憶媒体。
【請求項24】
前記方法がさらに、
前記偏差関数の最大値と前記偏差関数の平均(アベレージ)値と平均(ミーン)値のうちの一方の比を計算し、前記比がしきい値よりも大きいときに、前記実験的な融解曲線データが有効な融解転移領域を含むと判定することによって、
前記実験的な融解曲線データが有効な融解転移領域を含むかどうかを判定することを含む、請求項23に記載のコンピュータ可読記憶媒体。
【請求項25】
前記方法がさらに、
前記偏差関数の第1の温度領域内の高位バックグラウンド除去カーソルおよび低位バックグラウンド除去カーソルを特定することと、
前記高位バックグラウンド除去カーソルおよび前記低位バックグラウンド除去カーソルを使用して、バックグラウンド補正された融解曲線を計算することと、
を含む、請求項23に記載のコンピュータ可読記憶媒体。
【請求項26】
前記方法がさらに、
前記偏差関数がしきい値よりも大きい前記第1の温度領域内の最も高い温度として第1のバックグラウンド温度を特定することと、
前記第1のバックグラウンド温度よりも高い、および/または、前記第1のバックグラウンド温度に等しい温度を含むカーソルプローブ領域を定義することと、
前記カーソルプローブ領域から、前記高位バックグラウンド除去カーソルおよび前記低位バックグラウンド除去カーソルを選択することと、
を含む、請求項25に記載のコンピュータ可読記憶媒体。
【請求項27】
前記化合物がタンパク質試料を含み、
前記方法がさらに、
前記実験的な融解曲線データ内の凝集信号の導関数のモデルにアクセスすることと、
前記凝集信号モデルを使用して、前記バックグラウンド補正された融解曲線から前記凝集信号を除去することと、
を含む、請求項26に記載のコンピュータ可読記憶媒体。
【請求項28】
前記化合物が核酸試料を含み、
前記方法がさらに、
前記偏差関数がしきい値よりも大きい前記第1の温度領域内の最も高い温度に第1の緩衝定数を加えたものとして、高位バックグラウンド温度を特定することと、
前記偏差関数がしきい値よりも大きい前記第1の温度領域内の最も低い温度から第2の緩衝定数を差し引いたものとして、低位バックグラウンド温度を特定することと、
前記高位バックグラウンド温度よりも高い、および/または、前記高位バックグラウンド温度に等しい温度を含み、所定の幅を有する高位プローブ領域を定義することと、
前記低位バックグラウンド温度よりも低い、および/または、前記低位バックグラウンド温度に等しい温度を含み、所定の幅を有する低位プローブ領域を定義することと、
前記高位バックグラウンド除去カーソルを前記高プローブ領域から選択し、前記低位バックグラウンド除去カーソルを前記低位プローブ領域から選択することと、
を含む、請求項25に記載のコンピュータ可読記憶媒体。
【請求項29】
前記低位バックグラウンド除去カーソルおよび前記高位バックグラウンド除去カーソルが、目的関数を最小化することによって選択され、前記目的関数が、前記実験的な融解曲線データと前記バックグラウンドEO放射信号のモデルとの間の誤差を定量化するように構成された、請求項25に記載のコンピュータ可読記憶媒体。
【請求項30】
前記方法がさらに、
バックグラウンド補正された複数の融解曲線を互いに比較することと、
前記比較に基づいて、前記バックグラウンド補正された複数の融解曲線を2つ以上のグループにクラスタリングすることと、
前記2つ以上のクラスタ内の偏差および前記2つ以上のクラスタ間の偏差に基づいて、クラスタリング質メトリックを計算することと、
前記クラスタリング質メトリックに基づいて、前記バックグラウンド除去カーソルを改良するかどうかを判定することと、
前記バックグラウンド除去カーソルを改良するときに、前記バックグラウンド除去カーソルを変更し、変更されたバックグラウンド除去カーソルを使用して、バックグラウンド補正され、変更された融解曲線を計算し、前記クラスタ質メトリックを再計算することと、
を含む、請求項25に記載のコンピュータ可読記憶媒体。
【請求項31】
前記化合物が核酸試料を含み、
前記方法がさらに、
前記核酸試料を増幅することと、
前記化合物にエネルギー勾配を与えること、および、前記化合物のイオン濃度を増大させることのうちの一方によって、前記化合物を融解させることと、
複数のEO放射測定値を、温度とイオン濃度のうちの一方の関数として取得することと、
を含む、請求項17に記載のコンピュータ可読記憶媒体。
【請求項32】
融解曲線データを解析する装置であって、
プロセッサを備えるコンピューティングデバイスと、
前記プロセッサ上で動作可能である、実験的な融解曲線データにアクセスするように構成された取得モジュールであって、前記実験的な融解曲線データが、蛍光染料を含む化合物を融解させることによって得た複数の電気光学(EO)放射測定値を含み、前記実験的な融解曲線データがバックグラウンドEO放射信号を含む、取得モジュールと、
前記プロセッサ上で動作可能なモデル化モジュールであり、前記バックグラウンドEO放射信号のモデルにアクセスするように構成されたモデル化モジュールと、
前記プロセッサ上で動作可能な処理モジュールであり、前記実験的な融解曲線データと前記バックグラウンドEO放射信号の前記モデルとの間の偏差を定量化する偏差関数を計算するように構成された処理モジュールと、
を備え、
前記処理モジュールが、前記実験的な融解曲線データを、前記実験的な融解曲線データのある領域内にそれぞれ定義された複数の窓に分割し、前記窓のうちの対応するそれぞれの窓内でそれぞれ計算される複数のフィットパラメータを計算し、前記対応するそれぞれの窓内における前記実験的な融解曲線データと前記バックグラウンドEO放射信号の前記モデルとの間の偏差を定量化することによって、前記偏差関数を計算し、前記偏差関数が前記フィットパラメータから形成されることを特徴とする装置。
【請求項33】
前記窓の幅が、前記実験的な融解曲線データの分解能、前記実験的な融解曲線データ内の関心の特徴の特性および性能メトリックのうちの1つに基づいて選択される、請求項32に記載の装置。
【請求項34】
前記窓のうちの選択された窓のフィットパラメータが、前記実験的な融解曲線データを、
【数29】
の形の前記バックグラウンドEO放射信号のモデルにフィットさせることによって計算され、Ciおよびaiがフィッティングパラメータ、Tが温度、Tiが窓の索引、Wが、前記選択された窓の幅である、請求項32に記載の装置。
【請求項35】
前記処理モジュールが、前記偏差関数から前記偏差関数の最小値を差し引くように構成された、請求項32に記載の装置。
【請求項36】
前記偏差関数の最大値と前記偏差関数の平均(アベレージ)値と平均(ミーン)値のうちの一方の比を計算し、前記比がしきい値よりも大きいときに、前記実験的な融解曲線データが有効な融解転移領域を含むと判定し、前記比が前記しきい値以下であるときに、前記実験的な融解曲線データが有効な融解転移領域を含まないと判定することによって、前記実験的な融解曲線データが有効な融解転移領域を含むかどうかを判定するように、前記処理モジュールが構成された、請求項35に記載の装置。
【請求項37】
前記しきい値が、複数の偏差関数を使用して計算され、前記複数の偏差関数がそれぞれ、対応するそれぞれの異なる実験的な融解曲線データを使用して計算され、前記しきい値が、前記対応するそれぞれの偏差関数のそれぞれの関数の最大値と、前記対応するそれぞれの偏差関数の前記それぞれの関数の平均(アベレージ)および平均(ミーン)のうちの一方との比の平均(アベレージ)および平均(ミーン)のうちの一方を使用して計算される、請求項36に記載の装置。
【請求項38】
前記しきい値が、前記複数の偏差関数の前記比の標準偏差に基づく、請求項37に記載の装置。
【請求項39】
前記偏差関数の第1の温度領域内の高位バックグラウンド除去カーソルおよび低位バックグラウンド除去カーソルを特定し、前記高位バックグラウンド除去カーソルおよび前記低位バックグラウンド除去カーソルを使用して、バックグラウンド補正された融解曲線データを計算するように、前記処理モジュールが構成された、請求項37に記載の装置。
【請求項40】
前記偏差関数がしきい値よりも大きい前記第1の温度領域内の最も高い温度として第1のバックグラウンド温度を特定し、前記第1のバックグラウンド温度よりも高い、および/または、前記第1のバックグラウンド温度に等しい温度を含むカーソルプローブ領域を定義し、前記カーソルプローブ領域から、前記高位バックグラウンド除去カーソルおよび前記低位バックグラウンド除去カーソルを選択するように、前記処理モジュールが構成された、請求項39に記載の装置。
【請求項41】
前記化合物がタンパク質試料を含み、前記実験的な融解曲線データ内の凝集信号の導関数のモデルにアクセスし、前記凝集信号モデルを使用して、前記バックグラウンド補正された融解曲線から前記凝集信号を除去するように、前記処理モジュールが構成された、請求項40に記載の装置。
【請求項42】
前記処理モジュールが、
前記偏差関数がしきい値よりも大きい前記第1の温度領域内の最も高い温度に第1の緩衝定数を加えたものとして、高位バックグラウンド温度を特定し、
前記偏差関数がしきい値よりも大きい前記第1の温度領域内の最も低い温度から第2の緩衝定数を差し引いたものとして、低位バックグラウンド温度を特定し、
前記高位バックグラウンド温度よりも高い、および/または、前記高位バックグラウンド温度に等しい温度を含み、所定の幅を有する高位プローブ領域を定義し、
前記低位バックグラウンド温度よりも低い、および/または、前記低位バックグラウンド温度に等しい温度を含み、所定の幅を有する低位プローブ領域を定義し、
前記高位バックグラウンド除去カーソルを前記高プローブ領域から選択し、前記低位バックグラウンド除去カーソルを前記低位プローブ領域から選択するように構成された、請求項39に記載の装置。
【請求項43】
前記処理モジュールが、目的関数を最小化することによって前記低位バックグラウンド除去カーソルおよび前記高位バックグラウンド除去カーソルを選択するように構成され、前記目的関数が、前記実験的な融解曲線データと前記バックグラウンドEO放射信号のモデルとの間の誤差を定量化するように構成された、請求項39に記載の装置。
【請求項44】
前記処理モジュールが、
バックグラウンド補正された複数の融解曲線を互いに比較し、
前記比較に基づいて、前記バックグラウンド補正された複数の融解曲線を2つ以上のグループにクラスタリングし、
前記2つ以上のクラスタ内の偏差および前記2つ以上のクラスタ間の偏差に基づいて、クラスタリング質メトリックを計算し、
前記クラスタリング質メトリックに基づいて、前記バックグラウンド除去カーソルを改良するかどうかを判定し、
前記バックグラウンド除去カーソルを改良するときに、前記バックグラウンド除去カーソルを変更し、変更されたバックグラウンド除去カーソルを使用して、バックグラウンド補正され、変更された融解曲線を計算し、前記クラスタ質メトリックを再計算するように構成された、請求項39に記載の装置。
【請求項45】
前記化合物が核酸試料を含み、前記装置がさらに、前記実験的な融解曲線データを取得するように構成された機器を備え、前記機器が、前記化合物を保持するための容器を備える、請求項32に記載の装置。
【請求項46】
前記機器がサーモサイクラを備える、請求項45に記載の装置。
【請求項47】
融解曲線データを解析する方法であって、
EO放射放出染料を含む化合物に融解勾配を与えることによって得られた、前記融解勾配に沿った複数の電気光学(EO)放射測定値を含む実験的な融解曲線データであって、バックグラウンドEO放射信号を含む実験的な融解局線データにアクセスすること、
前記バックグラウンドEO放射信号のモデルにアクセスすること、
前記実験的な融解曲線データを、前記実験的な融解曲線データのある領域内にそれぞれ定義された複数の窓に分割し、対応するそれぞれの窓内における前記実験的な融解曲線データと前記バックグラウンドEO放射信号の前記モデルとの間の偏差をそれぞれが定量化する複数のフィットパラメータを計算し、前記フィットパラメータから前記偏位関数を形成することによって、前記実験的な融解曲線データと前記バックグラウンドEO放射信号の前記モデルとの間の偏差を前記融解勾配の関数として定量化する偏差関数を計算することと、
前記化合物の解析において使用するため、前記偏差関数をコンピュータ可読記憶媒体上に記憶することと、
を含むことを特徴とする方法。
【請求項48】
前記実験的な融解曲線データが、前記化合物にエネルギー勾配を与えること、および前記化合物のイオン濃度を増大させることのうちの一方により、前記化合物を融解させることによって得たものである、請求項47に記載の方法。
【図11】
【図12B】
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図12A】
【図12C】
【図12D】
【図13】
【図14A】
【図14B】
【図14C】
【図14D】
【図15】
【図16】
【図17】
【図18】
【図19】
【図20】
【図21A】
【図21B】
【図21C】
【図22】
【図23A】
【図23B】
【図24】
【図25】
【図26】
【図27】
【図28】
【図29】
【図30】
【図31】
【図32】
【図33】
【図12B】
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図12A】
【図12C】
【図12D】
【図13】
【図14A】
【図14B】
【図14C】
【図14D】
【図15】
【図16】
【図17】
【図18】
【図19】
【図20】
【図21A】
【図21B】
【図21C】
【図22】
【図23A】
【図23B】
【図24】
【図25】
【図26】
【図27】
【図28】
【図29】
【図30】
【図31】
【図32】
【図33】
【公表番号】特表2012−526560(P2012−526560A)
【公表日】平成24年11月1日(2012.11.1)
【国際特許分類】
【出願番号】特願2012−511050(P2012−511050)
【出願日】平成22年5月14日(2010.5.14)
【国際出願番号】PCT/US2010/034969
【国際公開番号】WO2010/132813
【国際公開日】平成22年11月18日(2010.11.18)
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.フロッピー
【出願人】(502420379)アイダホ テクノロジー インコーポレーテッド (6)
【出願人】(506051429)ユニバーシティ オブ ユタ リサーチ ファウンデーション (25)
【Fターム(参考)】
【公表日】平成24年11月1日(2012.11.1)
【国際特許分類】
【出願日】平成22年5月14日(2010.5.14)
【国際出願番号】PCT/US2010/034969
【国際公開番号】WO2010/132813
【国際公開日】平成22年11月18日(2010.11.18)
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.フロッピー
【出願人】(502420379)アイダホ テクノロジー インコーポレーテッド (6)
【出願人】(506051429)ユニバーシティ オブ ユタ リサーチ ファウンデーション (25)
【Fターム(参考)】
[ Back to top ]