化学物質を追跡し、定量化するためのシステムおよび方法
複雑な分離では、計測器が区別できる範囲内で複数の物質が同じ分子量を持つ可能性がある。保持時間(値
のN個の対)506を決定するために保持時間のこれまでに知られていない規則性に照らして正確な質量測定が使用される。保持時間マップにより、基準保持時間が1つの分離においてそれぞれの物質に割り当てられるようにできる。次いで、基準保持時間は、正確な質量測定とともに、分離と分離との間で物質704、708を追跡し比較するために使用することができる。
のN個の対)506を決定するために保持時間のこれまでに知られていない規則性に照らして正確な質量測定が使用される。保持時間マップにより、基準保持時間が1つの分離においてそれぞれの物質に割り当てられるようにできる。次いで、基準保持時間は、正確な質量測定とともに、分離と分離との間で物質704、708を追跡し比較するために使用することができる。
【発明の詳細な説明】
【技術分野】
【0001】
本出願は、全体が参照により本明細書に組み込まれる、2004年2月13日に出願した米国仮出願第60/544,501号の優先権を主張するものである。
【0002】
本特許明細書の開示の一部は、著作権保護の対象となる資料を含む。著作権所有者は、米国特許商標庁の特許ファイルまたは記録の記載に従い誰が特許文書または特許開示のファクシミリ複製を行おうと異存はないが、その他の点ではいかなる形であれすべての著作権を留保する。
【0003】
本発明は、一般的に、LC/MS分析システムに関する。より具体的には、本発明は、LC/MS実験中の一方の注入から他方の注入への物質の追跡に関する。
【背景技術】
【0004】
分析化学における重要な問題は、複雑な混合物内に含まれる1つまたは複数の分子状物質の濃度を推定することである。液体クロマトグラフィ(LC)の後に質量分析(MS)を行うことは、試料中の多数の化学物質を分離しそれぞれの化学物質の濃度または量を測定しやすくするために使用することができるよく知られている技術(LC/MS)である。物質の正確な質量を測定することで、複数の試料について物質を追跡することができる。追跡される物質の応答または強度を測定することで、物質の濃度を試料毎に追跡することができる。
【0005】
LC/MSでは、分析のため試料がシステム内に注入される。そのような注入毎に、LC/MSシステムは、イオンの保持時間、分子量、および強度を測定する。複数のイオンが、単一の分子から発生しうる。分子の濃度は、その分子が発生するイオンのうちの1つまたは複数による調査により決定されることができる。
【0006】
本明細書で使用されているように、「物質」という用語は、1つの分子からの単一イオン、または単一の共通分子から得られるイオンの集まりを意味することができる。例えば、低分子量の小さな分子は、単一イオンを発生することができる。ペプチドまたはタンパク質などの巨大分子は、複数のイオンを発生することができる。1つの分子から複数のイオンを組み合わせて単一の有効な、質量、保持時間、および強度を得るためによく知られている技術が使用できる。それぞれの物質は、質量、保持時間、および強度を有すること、および有効な質量、保持時間、および強度は、それぞれの物質に割り当てられることが仮定される。
【0007】
質量、保持時間、および強度のこれらの測定結果を使用することで、物質の特性を決定できる。例えば、注入と注入との間の対応する物質の強度の比較は、物質の濃度が対照と未知試料との間で変化するかどうかを判定する基準となる。試料間のタンパク質の濃度の変化は、試料間のタンパク質の発現量の変化を示すものである。
【0008】
一組の試料は、連続注入を使用して処理することができる。同じ試料を複数回注入して、一組の繰り返し注入を行うことができる。例えば、2つの区別できる試料(標準試料と未知試料)は、それぞれ、3回注入することができ、それにより、合計6回の注入を行える。濃度測定の再現性は、このデータを使用することで、それぞれの物質、さらに対照試料と未知試料との間のそれぞれの物質の濃度の変化について、推論することができる。それぞれの試料は、試料間の相対的較正を行うための一定量の内部標準を含むことができる。
【0009】
いかなる物質の濃度を判定する技術についても、まず、他のすべてのものからその物質を適切に分別しなければならない。LC/MS技術では、質量と保持時間の両方において物質(または物質に関連付けられたイオン)を分離することができる。他の方法では区別がつきようもない、保持時間内に共溶出する物質は、質量で分別することができ、したがって、その検出を行え、その強度の正確な推定を行うことができる。
【0010】
しかし、一方の注入から他方の注入への物質の関連付けまたは追跡については、正確な質量による分別だけでは十分でない場合がある。例えば、分子の質量および保持時間の特性を考えよう。分子量は、分子の固有特性である。質量分析計は、分子量と電荷との比m/zを測定する。記号μは、質量対電荷比m/zを示すために使用されることが多い。μに対する値は、注入と注入との間で直接比較できる。同じ物質に関して注入と注入との間のμの測定値の変動は、計測器ノイズ源のみによるものでなければならない。
【0011】
エレクトロスプレーイオン化などのイオン化技術により、ペプチドまたはタンパク質などの試料について電荷Zを決定することができる。決定された荷電状態により、物質の分子量mを推論することができる。したがって、分子量mは、物質を追跡するための基準を与える。これらの目的のために、経験的に観測された質量対電荷比の値μ、または分子量mの推論された値は、同義的に使用することができる。本明細書で使用されているように、質量という用語は、観測された質量対電荷の比の値μ、または推論された分子量mを意味する。
【0012】
十分に高い質量精度により、それぞれの物質は、質量の値に基づき潜在的に一意に区別可能である。そのため、物質をわずかしか含まない試料の場合、物質を分離する十分なクロマトグラフ分解能があると仮定すると、分解能m/Δm≒20,000の飛行時間型(TOF)分析器などの高精度質量分析計を使用することで、質量単独の正確な測定結果に基づいて一方の注入から他方の注入までそれぞれの物質を追跡することができる。このような場合、質量は、物質をその化学組成または構造に関して同定するために必ずしも使用されていない。むしろ、質量は、注入から注入までの間物質を追跡するための物質の経験的な、場合によっては一意的な識別子として使用される。
【0013】
しかし、質量だけだと、一方の注入から他方の注入まで物質を追跡するのに十分でない場合がある。質量精度が低く、試料が複雑である場合、一方の注入で確認されたような物質の質量が他方の注入における無関係の物質の経験的に観測された質量と一致することがある可能性がある。例えば、それぞれμが1024.200amuおよび1024.300amuである2つの物質がありうる。このような物質は0.100amu未満のMS精度で区別可能であるが、0.100amuを超える精度のMSを使用したのでは区別可能でない。
【0014】
物質のクロマトグラフ保持時間は、その物質の付加的な潜在的に無関係の識別子とすることができる。物質の保持時間は、固有特性ではない。むしろ、物質の保持時間は、物質(または、むしろ、物質を生じさせる分子)と、いろいろな効果のうち特に、クロマトグラフ分離における液相および固相との相互作用に依存する。しかし、保持時間が固有でないとしても、その値は、与えられた分離方法について再現性の高いものとすることができる。保持時間が正確に再現可能であり、精度が高い場合、質量と保持時間の両方の呼応の組み合わせは、一方の注入から他方の注入までそれぞれの物質を一意に追跡するのに十分でありうるのが理想的である。つまり、2つの異なる物質が正確な同じ質量および保持時間を共有することはまずありえないであろう。しかし、保持時間は、注入から注入までの間必ずしも再現可能であるわけではない。むしろ、物質の保持時間は、注入から注入までの間に変動する可能性がある。
【0015】
注入から注入までの間のこのような保持時間の変動にもかかわらず、保持時間には知られている規則性がある。つまり、物質が時刻tに注入Aで溶出した場合、その物質は、他の注入Bでも溶出し、保持時間は時間枠t±Δtの範囲にある。つまり、与えられた物質の保持時間は、一方の注入から他方の注入までの間に変動する可能性がある。しかし、このような変動は、時間枠t±Δtを上下限とする。この境界Δtは、経験的に決定することができ、本明細書では、粗保持時間閾値Δtcと呼ぶ。本明細書で使用されているように、t±Δtcという用語は、粗保持時間枠を指す。粗保持時間枠内にあるすべての物質が十分に一意的な質量を有し、一般に粗保持時間枠および質量だけに基づいて、また特に、より複雑な試料の場合に、追跡を行うことができる場合もあるかもしれないが、与えられた粗保持時間枠内で質量が一意にならないような質量値を持つ物質もありえる。
【発明の開示】
【発明が解決しようとする課題】
【0016】
本発明の実施形態は、限定はしないが、LCにより分離され、エレクトロスプレーイオン化によりイオン化され、四重極型分析器、飛行時間型分析器、イオントラップ型分析器、またはこれらの分析器の組み合わせを含む、質量分析計により分析される試料を伴う。さらに、本発明の実施形態は、MS−MSまたはMSn技術により断片化できる物質に適用可能である。
【0017】
本発明の実施形態では、クロマトグラフ保持時間のこれまでに知られていない付加的な規則性を、物質が試料中において一意的な質量を有するという事実とあわせて用い、他のいかなる手段でも質量単独では区別可能でないと思われる残留物質を一意に追跡する。このような試料の例は、天然タンパク質試料に由来するペプチドの消化物を含む。例えば、血清のペプチド消化物は、10,000個またはそれ以上の区別できるペプチド、つまり物質を含むことができる。クロマトグラフ分離では、30個またはそれ以上のペプチドは、クロマトグラフピークの幅の範囲内で溶出できる。
【0018】
第1のこれまでに知られていない規則性は、2つの異なる化学物質が一方の分離において全く同じ保持時間で溶出する場合に、他の分離におけるそれらの物質に対する保持時間の差も0になるというものである。つまり、2つの異なる化学物質が互いに関して一方の分離において同じ時間で溶出する場合、互いに関して他のすべての分離において全く同じ保持時間で溶出する。この対の絶対保持時間は、分離から分離への間に変わる可能性がある。しかし、保持時間の差が一方の分離において物質の対について0である場合、物質のその対の間の保持時間の差は、すべての分離に関して0となる。
【0019】
この規則性は、ペプチド混合物の重要な場合において生じる。一方の分離において同じ保持時間で溶出する2つのペプチドは、他のすべての分離においても同一保持時間で溶出する。ここでもまた、絶対保持時間は分離から分離までの間に変化しうるが、保持時間の差は0となる。
【0020】
第2のこれまでに知られていない規則性は、保持時間に関連付けられた固有測定誤差である。2つの物質がすべての注入において互いに関して同じ保持時間で溶出する場合、実際には、いくぶん異なる測定溶出時間で溶出する。そのため、単一の注入の範囲内では、2つの物質の測定された保持時間は、平均をとった場合のみ、一致し、同一となる。これらの測定誤差は、ピークの最高値を求めることと関連する統計誤差としてみなすことができる。例えば、物質が注入において10.0分で溶出する場合、その測定された保持時間は、±0.2分だけ異なると予測されると考えられ、第2の物質も10.0分で溶出する場合、その測定された保持時間も、±0.2分だけ異なるであろう。したがって、1つ注入の範囲内では、2つの物質に対する保持時間の測定された値は、9.90および10.15分とすることができる。0.25分のこの偏差は、2つの物質の実際の相対的保持時間の偏差ではない(0である)。これは、測定誤差によるその注入の範囲内でのそれぞれの物質の保持時間の測定結果の偏差である。
【0021】
一般に、この統計に基づく測定誤差は、Δtcで表される、変動誤差よりも著しく小さい。固有統計測定誤差に関連付けられた閾値は、本明細書では、詳細保持時間閾値と呼ばれ、Δtfで表される。
【0022】
第3のこれまでに知られていない規則性は、近い時間で溶出するが、全く同じ保持時間で溶出するわけではない物質について生じる。このような物質が溶出する保持時間は、分離から分離への間に変わる可能性がある。しかし、2つの時間的に近い溶出物質の間で溶出する第3の物質がある場合、これら2つの間で常に溶出する。
【0023】
例えば、保持時間変動の結果として、2つの物質の間の時間オフセットは、注入から注入までの間に変化しうる。例えば、物質が一方の注入において2.0分と2.4分で溶出する場合、第2の注入では2.5分と2.7分で溶出する可能性がある。第1の物質の保持時間が注入と注入との間に0.5分だけドリフトしたということは真実であるが、このドリフト量は、2つの物質の間の保持時間の差よりも重要性が低い。この差は、第1の注入では0.4分であり、第2の注入では0.2分であった。
【0024】
第3のこれまでに知られていない規則性も、これら2つの時間の間に注入1において溶出する第3の物質に適用される。例えば、このような第3の物質が注入1において2.1分で溶出すると仮定する。第3の規則性によれば、第3の物質は、注入1において物質1と2との間で溶出したため、注入2などの他の注入において、物質1と2との間でも溶出する。さらに、第3の物質に対する注入間のオフセットは比例する。そのため、注入2では、第3の物質は、2.55分で溶出する。
【0025】
粗時間枠(すでに知られている)に関する規則性および統計誤差または詳細保持時間閾値(すでには知られていない)に関する規則性は、再現可能な測定結果またはロバスト法に特徴的であるためすべてのクロマトグラフ分離において生じる。相対的保持時間(すでには知られていない)に関する規則性および保持時間順序(すでには知られていない)は、複雑な混合物中のすべての物質について生じる場合も生じない場合もある。しかし、これらは、ペプチド消化物中に観察され、物質がクロマトグラフ固定相および移動相との関連する化学的相互作用を持つ混合物について有効である可能性がある。
【0026】
本発明の実施形態では、これらの規則性の出現を認識し、注入から注入までの物質を追跡するためにそれらを利用することができる。本発明の一実施形態では、試料中のそれぞれの物質に対し、基準保持時間が割り当てられる。基準保持時間は、2つの物質が同じ基準保持時間を持たなければ同じ物質ではありえないという意味で一意である。他方で、それらが同じ基準保持期間を持つ場合、同じ物質である可能性がある。
【0027】
この仮定を使用することで、本発明の実施形態は、同じ質量および同じ基準保持時間を持つことを要求することにより物質を追跡する。分子量または保持時間のいずれかまたは両方において著しく異なる物質は、同じではない。本発明のいくつかの実施形態によれば、著しい差は、閾値を外れる差である。
【0028】
要約すれば、複雑な分離では、計測器が区別できる範囲内で複数の物質が同じ質量を持つ可能性がある。本発明のいくつかの実施形態は、保持時間の前記のすでには知られていない規則性に照らして正確な質量測定を使用し、保持時間マップを決定する。次いで、保持時間マップにより、基準保持時間が1つの分離においてそれぞれの物質に割り当てられるようにできる。次に、物質の基準保持時間および質量を分離(注入)の間に比較し、分離から分離まで(注入から注入まで)その物質を追跡することができる。
【課題を解決するための手段】
【0029】
一実施形態では、本発明は、LC/MSシステムで物質を追跡するための方法である。この方法は、第1の注入からの物質の部分集合および第2の注入からの物質の部分集合を選択することを含む。第1および第2の注入から選択された物質が比較される。一致する物質は、これらの比較に基づいて同定される。一致する物質を使用して、保持時間マップが形成される。保持時間マップは、基準保持時間をそれぞれの物質に割り当てるために使用される。次に、物質の基準保持時間および質量を分離(注入)の間に比較し、分離から分離まで(注入から注入まで)その物質を追跡することができる。
【0030】
他の実施形態では、本発明は、LC/MSシステムで物質を追跡するためのシステムである。システムは、液体クロマトグラフに投入される試料を含む。液体クロマトグラフは、試料を1つまたは複数の物質に分離する。システムは、さらに、物質のそれぞれの質量を決定するために物質が投入される質量分析計を含む。コンピュータがシステムに含まれる。コンピュータは、第1の注入からの物質の部分集合および第2の注入からの物質の部分集合を選択し、第1および第2の注入から選択された物質を比較し、第1および第2の注入における一致する物質を同定し、一致する物質に基づいて保持時間マップを構成し、マップに基づいて基準保持時間をそれぞれの物質に割り当て、物質の基準保持時間および質量を使用して分離と分離(注入)の間に物質を追跡するようにプログラムされる。
【発明を実施するための最良の形態】
【0031】
図1は、本発明の一実施形態による例示的なLC/MSシステム101の概略図である。試料102は、液体クロマトグラフ104内に自動的に、または手動で注入される。高圧のクロマトグラフ溶媒流は、強制的に試料102を液体クロマトグラフ104内のクロマトグラフカラム106に通す。カラム106は、典型的には、結合分子が表面に含まれるシリカビーズの充填カラムを含む。試料中の分子種、溶媒、およびビーズ間の競合的相互作用は、それぞれの分子種の移動速度を決定する。分子種は、カラム106内を移動し、保持時間と呼ばれる、特性時間にカラム106から出現する、つまり溶出する。
【0032】
LC/MSシステムでは、カラム106から溶出した後、分子は質量分析計108などの検出装置に搬送される。質量分析計108は、脱溶媒和システム110、イオン化装置112、質量分析器114、検出装置116、およびコンピュータを備える。コンピュータ118は、本明細書で説明されている物質追跡機能を実行するように構成またはプログラムできるコンピュータであればどのようなものでもよい。さらにコンピュータ118は、本明細書で説明されているように選択された値をユーザが入力できるように、または自動的に決定できるように構成することができる。
【0033】
試料が質量分析計108内に導入されると、脱溶媒和システム110が、溶媒を除去し、イオン発生源112が、検体分子をイオン化する。イオン化法は、よく知られている電子衝撃(EI)、エレクトロスプレー(ES)、大気圧化学イオン化(APCI)、マトリックス支援レーザー脱離イオン化(MALDI)、およびサーモスプレーを含む。APCIでは、試料は脱溶媒和され、その後イオン化されることに留意されたい。
【0034】
イオン化された分子は、質量分析器114に搬送される。質量分析器114は、質量対電荷比により分子をソートまたはフィルタ処理する。質量分析器114などの質量分析器は、四重極型(Q)質量分析器、飛行時間型(TOF)質量分析器、およびフーリエ変換(FT)質量分析器を含む。さらに、質量分析器は、例えば、四重極飛行時間型(Q−TOF)、三連四重極(Q1−Q2−Q3)型、およびQ1−Q2−TOFなどの他の四重極飛行時間型構成を含む、さまざまなタンデム構成で配置することができる。
【0035】
本発明の実施形態によれば、基準保持時間がそれぞれの注入におけるそれぞれの物質に割り当てられる。本発明の実施形態によれば、物質の基準保持時間および質量は、注入と注入との間で物質を追跡するために使用される。
【0036】
基準保持時間は、一方の注入を基準注入(注入A)として選択し、Aにおける物質を試料集合内の他の注入で見つかった物質と比較することにより得られる。例えば、2つの注入、注入Aと注入Bを考える。基準注入Aにおける物質が、注入Bにおける物質と比較される。この比較から得られた結果に基づき、この方法は、基準保持時間を注入Bにおける物質に割り当てる。第3の注入、注入Cが与えられた場合、この方法では、Aにおける物質をCにおける物質と比較して、Cに対する基準保持時間を求める。この手順は、基準保持時間を他のすべての試料集合内の他のすべての物質に割り当てるために繰り返される。
【0037】
次いで、BおよびCにおける物質に割り当てられた基準保持時間は、互いに、および/またはAにおける保持時間と直接比較することができる。実際、本発明の実施形態による方法では、注入BおよびCにおけるそれぞれの物質に対する、注入AとBとの間、および注入AとCとの間の保持時間ドリフトの効果を取り除く。本発明の実施形態は、望む数の試料の望む数の注入に拡張することができる。
【0038】
本発明の実施形態によれば、注入AとBにおける物質の部分集合は、注入AとBとの間の保持時間ドリフトを説明する保持時間マップを得るために使用される。このマップから、注入Bにおけるすべての物質について基準保持時間が決定される。同様に、本発明の実施形態によれば、注入AとCにおける物質の部分集合は、注入AとCとの間の保持時間ドリフトを説明する保持時間マップを得るために使用される。このマップから、注入Cにおけるすべての物質について基準保持時間が決定される。本発明の実施形態は、基準注入Aと望む数の試料の望む数の注入との間の保持時間マップを決定するように拡張できる。
【0039】
図2は、本発明の一実施形態による2つの注入AとBとの間の保持時間マップを決定するために一致する物質を同定する方法の流れ図である。この方法は、コンピュータにより自動的に、またはユーザからの入力と組み合わせて実行できる。
【0040】
工程202で、注入AおよびBの物質の部分集合が選択される。物質の部分集合は、多数の方法で、手動により、または自動的に選択することができる。例えば、この部分集合は、強度に基づいて選択できる。本発明のこのような一実施形態では、選択された物質の部分集合は、閾値よりも高い強度を持つ物質を含む。
【0041】
閾値は、多数の方法で選択できる。例えば、閾値は、手動で入力された、または収集データに従って決定された、予め定められている閾値とすることが可能である。データに従って決定されたこのような閾値は、閾値中央値である。閾値中央値は、注入における物質について測定された強度すべての中央値として計算される。収集データに従って決定された他の閾値は、特定の注入における測定された強度の標準偏差に基づく閾値である。必要というわけではないが、それぞれの注入における測定された強度は、閾値を適用する前または後に正規化することが可能である。
【0042】
保持時間マップを作成する際に使用される物質の部分集合は、この閾値を超える物質を含む。したがって、本発明の実施例の物質の部分集合は、強度が閾値を超える注入AおよびBにおける物質のみを含む。
【0043】
工程204では、粗保持時間閾値Δtcが選択される。本発明の一実施形態では、Δtcの好ましい値は、5分である。Δtcは、保持時間内に生じうる最大変動を定義するものである。粗保持時間閾値は、手動または自動で選択できる。さらに、粗保持時間閾値は、予め定めておき、例えば、工程204で読み出し元となる構成ファイル内に格納することができる。
【0044】
工程206では、分子量閾値Δmが選択される。分子量閾値は、本明細書では、別に質量閾値とも呼ぶ。分子量閾値は、さらに、100万分の1単位(Δm/m)*106、または質量対電荷比Δμとして表すこともできる。分子量閾値は、当業者によく知られている方法を使用してMSの特性を知ることで求めることができる。例えば、このような1つの方法では、分子量閾値をスペクトルのピークの幅に関して指定する。スペクトルのピーク幅が半値全幅(FWHM)として指定されている場合、ppm単位の閾値は、(FWHM/m)*106と表すことができる。高強度ピークでは、この閾値は、0.2などのFWHMの小さな数を使用して下げることができ、そのため、ppm誤差は、(0.2*FWHM/m)*106となる。
【0045】
分子量閾値は、手動または自動で選択できる。さらに、分子量閾値は、予め定めておき、例えば、工程206で読み出し元となる構成ファイル内に格納することができる。
【0046】
工程208で、注入Aにおけるすべての閾値選択物質を注入Bにおける物質と比較する探索が実行される。単独で注入Bにおける物質に一致する注入Aにおける物質は、工程210で同定される。2つの物質は、質量の差の大きさが質量閾値Δmよりも小さい場合、保持時間の差の大きさが粗保持時間閾値Δtcの範囲内にある場合、Bにおいてその基準と合致する単一の物質のみがある場合、両方の物質(注入Aにおける物質、および注入Bにおける可能な一致する物質)の強度がそれぞれの強度中央値よりも高い場合に一致していると考えられる。上の開示に照らしてこのような一致する物質を同定できる探索方法は、当業でよく知られている。
【0047】
その結果、工程210で得られる対の集合は、分子量、粗保持時間の一意的一致特性を有し、強度要件を満足する物質の対のみを含む。つまり、この集合は、物質のN個の一致する対を含み、それぞれ、下付き文字iにより示され、それぞれ以下の条件を満たす。
【数1】
【0048】
当業者には、単独で一致する物質を定義する他の要件を強制可能であることは理解されるであろう。これらの他の要件は、前記の要件の1つまたは複数に加える、それらとは別にする、またはそれらと組み合わせることが可能である。例えば、強度比が特定の閾値範囲内にあるという要件を加えることが可能である。このような条件の下で、一致する物質は、条件
【数2】
を満たさなければならない。このような場合、rに対する好ましい値は2としてよいであろう。
【0049】
加えられる他の要件は、知られている荷電状態のイオンが比較される場合に適用される。このような場合、
【数3】
というように荷電状態が一致する要件を加えることが可能である。
【0050】
次いで、注入AおよびBからの一致する物質の対は、工程202から210で説明されているように、本発明の一実施形態による探索を実行することにより得られる。物質のこれらの対は、注入AおよびBにおける物質が閾値基準を満たす場合にのみ保持される。つまり、工程202から210までの効果として、質量閾値、粗保持時間閾値、および可能な強度閾値からなる一致基準を満たす注入AおよびBにおける物質の部分集合を選ぶことになる。
【0051】
保持され、一致する物質の対から、
【数4】
として定義されている、保持時間差が対毎に得られる。保持時間差Δtiは、保持時間
【数5】
での注入Aにおけるその物質に関する注入Bにおける物質の保持時間ドリフトである。2つの保持時間
【数6】
および
【数7】
は、注入AおよびBからのi番目の保持されている一致する対である。
【0052】
図3は、Δtiと、一致する物質を同定した後に保持される対から得られた
【数8】
との例示的なグラフである(工程210)。図3内の点は、閾値基準を満たす注入AおよびBにおける物質に対応する。図3の例示的なグラフにおいて、閾値基準は、0.020amuの質量閾値Δmの範囲内で合致しなければならず、5分以内の保持時間差、粗保持時間閾値、および強度閾値中央値を持つ。
【0053】
図4は、本発明の一実施形態による、図3を拡大した、領域302の例示的なグラフである。拡大された水平軸は、一致する対が垂直軸上にどれだけ集中しているかを示している。
【0054】
図3および4を調べると、点の大半が塊をなしている、密度の高い背骨部分が存在することがわかる。しかし、これらの図から、さらに、背骨部分の周りに点がある程度散在し、外れ値が存在することもわかる。これらの問題は、後述のフィルタ処理などの技術を介して対処することができる。
【0055】
質量閾値および粗保持時間閾値を使用して一致する物質のリストが同定された後、工程212で保持時間マップが構成される。図5は、本発明の一実施形態による保持時間マップを構成するための方法の流れ図である。工程502で、一致する対のリストが、注入Bのときに観察された保持時間に応じてソートされる。好ましい一実施形態では、リストは、
【数9】
の値が昇順となるようにソートされる。そこで、i=1,2,...,N−1について
【数10】
となる。このソートで、質量および粗保持時間探索から得られた注入AおよびBにおける物質の間の対合が保持される。
【0056】
図3に示されているグラフを調べると、保持時間差の大半が粗保持時間枠内に入るため、Δtcの値の選択が確認される。さらに、このような調査から、Δtcの低減された値を使用して物質間の対合、つまりΔtcの値を精密化できると判定した可能性があることが示唆される。他方で、図3に例示されているようなグラフを調べて、偏位がΔtcの値を超えているように見えた場合、Δtcの値を増して、図2に例示されている一致する対を決定する工程204〜210を繰り返すことが可能である。
【0057】
工程504で、Δtiの値のフィルタ処理を行って、Δtiの精密化された値を、
【数11】
の関数として求める。このようなフィルタ処理は、多数の方法で実行できる。例えば、フィルタ処理は、移動平均フィルタ、中央値フィルタ、スプライン、または他の所望のフィルタ処理とすることができる。移動平均フィルタでは、Δtiのそれぞれの値は、その隣接要素の加重平均で置き換えられる。しかし、本開示の目的に関して、外れ値の影響をなくすため、中央値平均フィルタが採用される。中央値平均フィルタでは、Δtiのそれぞれの値は、それ自体とそのM個の隣接要素の中央値で置き換えられる。典型的には、Mは5から20までの範囲であるが、特定のアプリケーションについてはその範囲を外れる可能性もある。
【0058】
図8は、外れ値を除去するために5点中央値フィルタを例示的なデータセットに適用することを例示する図である。グラフ801は、5点中央値フィルタの適用前のデータセットをプロットしたものである。2つの外れ値802および804は、グラフ804内で目立っている。グラフ806は、5点中央値フィルタの適用後のデータセットを例示している。5点中央値フィルタが外れ値802および804を除去したことが容易にわかる。
【0059】
中央値フィルタによるフィルタ処理により、中央値フィルタ処理値
【数12】
の集合が生成され、これは、保持時間
【数13】
に対応する。図9Aおよび9Bは、本発明の一実施形態による、それぞれ図3および4に示されている例示的データに5点中央値フィルタを適用した結果をプロットしたグラフである。図9Bは、拡大された図9Aの領域902である。図9Aおよび9Bを調べると、中央値フィルタにより外れ値が取り除かれていることがわかる。ここでは、図9Aおよび9Bにプロットされた点の集合
【数14】
を背骨と呼ぶ。図9Aおよび9Bの
【数15】
対
【数16】
のプロットは、図3および4の高密度領域の中心を通る。
【0060】
工程506において、基準保持時間の集合は、
【数17】
として計算される。この方程式の効果として、フィルタ処理された保持時間ドリフト
【数18】
が
【数19】
から差し引かれる。値
【数20】
は、注入Aにあったとすれば物質が持つであろう保持時間である。ステップ506の結果、値のN個の対
【数21】
が得られる。値のこれらの対は、2つの注入の間の保持時間マップである。
【0061】
保持時間マップ
【数22】
は、対になっている値により記述される、ポイントツーポイントルックアップテーブル(LUT)とみなすことができる。上述のように、保持時間マップは、物質の部分集合から導かれる。保持時間マップを使用することで、注入Bにおけるすべての物質について基準保持時間が決定される。特に、保持時間マップは、LUTに記述されていようといまいと、注入Bにおけるすべての物質について基準保持時間を決定するために使用される。
【0062】
図6は、本発明の一実施形態により注入Bにおけるすべての物質に対する基準保持時間を決定するために保持時間マップを使用する方法の流れ図である。工程602で、注入Bにおける与えられた物質がルックアップテーブルの一部であるかどうかが判定される。物質がLUTの一部であるかどうかは、保持時間
【数23】
に基づく。物質の保持時間がLUTに含まれる場合、物質は、保持時間マップに含まれるものと考えられる。そうでない場合、物質は、保持時間マップに含まれるものとして考えられない。
【0063】
物質が保持時間マップに含まれる場合、その基準保持時間は、工程506において、上で定義されているように
【数24】
である。他方で、注入Bにおける物質が保持時間マップLUTの一部でない場合、本発明の一実施形態では、注入Bにおける物質に対する基準保持時間を計算するために線形補間が適用される。線形補間に対する方程式は、
【数25】
として与えられ、ただし、
【数26】
である。下付き文字iおよびi+1で指定された物質は、保持時間マップ、つまりLUTに含まれる物質を指定する。下付き文字kにより指定された物質は、LUTに含まれない。そこで、補間方程式では、LUTに含まれない物質について基準保持時間がどのように決定されるかを指定する。
【0064】
工程508で、注入Aにおけるすべての物質について、基準保持時間が計算される。本発明の好ましい一実施形態では、注入Aにおけるそれぞれの物質に対する基準保持時間は、元の保持時間である。つまり、注入におけるすべての物質について、基準保持時間は
【数27】
である。注入Aにおける物質に対する基準保持時間が割り当てられた後、注入AおよびBにおけるすべての物質について基準保持時間が割り当てられた。注入AおよびBにおける物質のそれぞれに基準保持時間を前記のように割り当てると、注入AおよびBにおける物質間の保持時間オフセットが除去される。
【0065】
追加の注入が、利用可能であれば、これも考慮することができる。例えば、第3の注入、注入Cが利用可能であった場合、上述の工程を繰り返し、注入Cにおける物質に対する値を注入Bにおける物質の代わりに置き換えて
【数28】
を決定することができる。
【0066】
そのため、本発明の実施形態では、試料集合内のすべての注入におけるすべての物質について基準保持時間を決定することができる。基準注入(ここでは、注入A)は、試料集合内の物質について基準保持時間を決定することを目的としてそのような試料集合内の注入とみなすことができる。
【0067】
図7は、注入AおよびBにおける物質を追跡するための方法の流れ図である。本発明の一実施形態により作成された保持時間マップが与えられた場合、工程702では、詳細保持時間閾値Δtfを決定する。詳細保持時間閾値は、ピークの保持時間の測定における固有統計誤差である。
【0068】
詳細保持時間閾値Δtfは、それぞれの一致する対について見つかった保持時間差の値Δtiとフィルタ処理された値
【数29】
を考慮することにより計算される。Δtiおよび
【数30】
が与えられた場合、これらの値の差は、
【数31】
として計算される。Δtiの中央値がΔt1自体である場合、
【数32】
のいくつかの値は0である。これらの0値は省かれ、点δtiの集合が形成される。δtiに対する値は、保持時間の測定における固有統計誤差を表す。
【0069】
Δtfは、例えば、δt1の平均を中心とする標準偏差をとり、Δtfをその標準偏差の4倍にとることにより、δt1から推定できる。それとは別に、Δtfは、よく知られているヒストグラム処理技術を使用することによりδt1から推定でき、その場合、δtiのヒストグラムが生成され、Δtfは指定されたわずかな部分の点、例えば、99%のΔtfを含む時間に対応する。
【0070】
注入と注入との間で物質を追跡する際に、保持時間閾値は、詳細保持時間閾値Δtfで使用される。詳細保持時間閾値は、基準保持時間および質量値をともに使用され、これにより、注入と注入との間で物質を追跡する。典型的には、Δtfは、0.4分のオーダーであるが、アプリケーション毎に異なっていてよい。そのため、保持時間閾値は、5分の粗保持時間閾値から約0.4分まで短縮される。次に、この短縮は、同じ分子量を持つ物質を比較する際の曖昧さを低減または排除する効果を有する。
【0071】
Δtfを使用して、注入A、B、およびCにおけるすべての物質を追跡できる。工程704で、注入AおよびBにおけるすべての物質が比較される。追跡基準を満たすものが保持される。例えば、本発明の好ましい一実施形態では、追跡基準は、
【数33】
である。
【0072】
探索は、注入Aにおける物質(インデックスiで示されている)と注入Bにおける物質(インデックスjで示されている)について実行される。上記の追跡基準からわかるように、質量枠(質量閾値)は無変化であるが、保持時間枠(保持時間閾値)は、保持時間自体ではなく、基準保持時間を詳細探索閾値と比較するために変化させられる。両方の基準が満たされたときに一致が示される。任意であるが、強度基準の適用は必要ない。
追加の注入を分析できる。例えば、第3の注入、注入Cが与えられた場合、注入Cにおけるすべての物質は、注入Aにおけるすべての物質と比較される。基準
【数34】
を満たす物質の対のみが保持される。それとは別に、注入Cにおけるすべての物質は、注入Bにおけるすべての物質と比較することが可能である。基準
【数35】
を満たす物質の対のみが保持される。
【0073】
注入Aが基準保持時間計算の共通目標として使用されるとしても、一度計算されれば、基準保持時間は、BとCとの間など、2つの注入の間で比較することができることに留意していただきたい。そのため、本発明の実施形態では、いくらでも多くの数の注入における物質追跡について完全に対称的な比較を行う。
【0074】
図10aおよび10bは、本発明の一実施形態により、注入と注入との間で物質を追跡するために詳細保持時間閾値を使用することを例示するグラフである。図10aの線1002は、詳細保持時間閾値を背骨(backbone)に加える
【数36】
ことにより得られ、線1004は、詳細保持時間閾値を背骨から差し引く
【数37】
ことにより得られる。図10bは、図10aを拡大した、領域1001のプロットである。線1006および1008は、線1002および1004の拡大図である。
【0075】
図10aでは、1002および1004内にある点が
【数38】
を満たす。したがって、1002および1004内にあるそれぞれの点は、注入AとBとの間で追跡される物質の対を表す。これは、それぞれの点が2つの基準、詳細保持時間閾値
【数39】
と質量閾値
【数40】
とを同時に満たすからである。
【0076】
要約すると、本発明の実施形態では、注入と注入との間で物質を追跡することができるということである。例えば、本発明の一実施形態では、2つの物質は、同じ分子量(前の指定された誤差の範囲に対し)を持つ場合に、かつ同じ基準保持時間(前の指定された誤差の範囲に対し)を持つ場合に、2つの物質は同じである。誤差は、データ特性を調べることにより決定できる。注入に関する物質のこのような追跡により、分析者は、試料集合内の試料の間の物質の濃度の相対的変化を定量化または追跡することができる。
【0077】
これからわかるように、本発明の実施形態は、従来の物質追跡方法を使用した場合に必要になるように内部標準を使用する必要はない。これは、本発明の実施形態では一意的な質量とともにどの物質が出現するかを先験的に知る必要がないからである。実際、正確な質量測定により、局所的保持時間標準として保持時間マップ内に出現するそれぞれの物質を使用することができる。
【0078】
基準保持時間を割り当てるには、粗保持時間閾値および詳細保持時間閾値がある必要がある。粗閾値は、超えられない境界上下限を与える。詳細閾値は、0を中心とする変動を与える。高強度(例えば、高い信号対雑音比)を持つ物質に対するすべての一意的一致は、粗閾値の範囲内で見つかることが予想される。
【0079】
注入から注入までに物質が追跡された後、試料間の物質の濃度の定量的変化を測定することができる。定量的応答は、物質を定めるイオンまたはイオンの集合についてLC/MSシステムにより測定された応答である。
【0080】
例えば、M個の試料のそれぞれについてN個の繰り返し注入を含む実験を考える。N個の繰り返し注入のそれぞれの部分集合内の追跡されるすべての物質に対する質量、強度、および保持時間について平均値、中央値、標準偏差、変動係数を求めることができる。これらの量の平均値は、M個の試料の間でそれぞれの物質について追跡される類似度とすることができる。
【0081】
試料の関数としてのそれぞれの物質の応答は、SIMCA(スイスのUmetrics社から入手可能)、またはPirouette(ワシントン州ウッデンビルのInfometrix社から入手可能)などの標準統計分析ソフトウェアに入力することができる。このような分析ソフトウェアは、本発明の実施形態により生成される追跡物質のリストを入力として受け取り、試料母集団間の物質の変化を明らかにする。SIMCAおよびPirouetteソフトウェアパッケージ、さらには他のソフトウェアシステムは、それらのデータに適用できる主成分分析法または因子分析法を機能として備える。
【0082】
特に、共通タンパク質の消化断片であるトリプシンペプチドに関連する強度は、試料から試料への間に一斉に変化する。一方の試料または試料の集合は、一方のレベルで発現されるタンパク質を含み、他の試料または試料の集合は、同じタンパク質を含むが、今度は異なる濃度レベルで発現されるということを考える。トリプシン消化が実行される場合、そのタンパク質に関連付けられたトリプシンペプチドの濃度は一方の試料から他方の試料へとスケーリングする。つまり、濃度パターンは、一方の試料内に1つの特徴的パターンを形成し、他の試料内に類似のパターンを形成するが、強度値は、親タンパク質の濃度が大きいか小さいかに応じて全体として大きくまたは小さくなるようにスケーリングされる。
【0083】
濃度のこのような相関性のある変化は、因子分析法、または主成分分析(PCA)に基づく方法により容易に確認できる。このような方法は、濃度、つまり発現レベルが試料毎に変化した親タンパク質を同定するために使用できる。つまり、ペプチドの集合がPCAプロット内に特徴的痕跡を生じる場合である。これらのペプチドが共通親タンパク質を指している場合、発現レベルが変化したタンパク質が同定されている。
【0084】
最終的な同定は、これらの関連するペプチド(一斉に変化したペプチド)の正確な質量をとり、http://www.matrixsciences.com/またはprospector.ucsf.eduから入手可能なペプチド質量指紋ソフトウェアなどの標準的ペプチド指紋ソフトウェアを使用して同定することにより行うことができる。
【0085】
本発明の好ましい実施形態の前記の開示は、例示および説明を目的として提示された。この説明は網羅的であることを意図しておらず、また本発明を開示した正確な形態だけに限る意図もない。本明細書で説明されている実施形態の多くの変更形態および修正形態は、上記開示に照らして当業者には明白なことであろう。本発明の範囲は、付属の請求項のみにより、またその同等の項目により、定められるものとする。
【0086】
さらに、本発明の代表的実施形態を説明する際に、明細書において本発明の方法および/またはプロセスを特定の一連の工程として提示している可能性がある。しかし、方法またはプロセスが本明細書に記載されている工程の特定の順序に依存しない限り、方法またはプロセスは、説明されている特定の一連の工程に限定されるべきではない。当業者であれば理解するように、他の一連の工程も可能である。したがって、明細書に記載されている工程の他の順序は、請求項に対する制限と解釈すべきではない。さらに、本発明の方法および/またはプロセスを対象とする請求項は、書かれている順序で工程を実行することに限定されるべきではなく、また当業者であれば、順序を変更することができ、それでも本発明の精神および範囲内あることを容易に理解するであろう。
【図面の簡単な説明】
【0087】
【図1】本発明の一実施形態によるLC/MSシステムの概略図である。
【図2】本発明の一実施形態による2つの注入AとBとの間の保持時間マップを決定するために一致する物質を同定する方法の流れ図である。
【図3】本発明の一実施形態による質量閾値および粗保持時間閾値の探索を実行する保持点の例示的なグラフである。
【図4】本発明の一実施形態による水平軸を拡大した質量閾値および粗保持時間閾値の探索を実行した後保持される点の例示的なグラフである。
【図5】本発明の一実施形態による保持時間マップを構成するために一致する物質を使用する方法の流れ図である。
【図6】本発明の一実施形態による基準保持時間を決定するために保持時間マップを使用する方法の流れ図である。
【図7】本発明の一実施形態による複数の注入にわたって物質を追跡するために基準保持時間および質量を使用する方法の流れ図である。
【図8】5点中央値フィルタを例示的なデータセットに適用することを例示する図である。
【図9A】本発明の一実施形態により、保持時間マップおよび詳細保持時間閾値を決定するためにそれぞれ図3および4に例示されているデータに5点中央値フィルタを適用した結果をプロットしたグラフである。
【図9B】本発明の一実施形態により、保持時間マップおよび詳細保持時間閾値を決定するためにそれぞれ図3および4に例示されているデータに5点中央値フィルタを適用した結果をプロットしたグラフである。
【図10A】本発明の一実施形態により、注入と注入との間で物質を追跡するために基準保持時間、詳細保持時間閾値、質量、質量閾値を使用することを例示するグラフである。
【図10B】本発明の一実施形態により、注入と注入との間で物質を追跡するために基準保持時間、詳細保持時間閾値、質量、質量閾値を使用することを例示するグラフである。
【技術分野】
【0001】
本出願は、全体が参照により本明細書に組み込まれる、2004年2月13日に出願した米国仮出願第60/544,501号の優先権を主張するものである。
【0002】
本特許明細書の開示の一部は、著作権保護の対象となる資料を含む。著作権所有者は、米国特許商標庁の特許ファイルまたは記録の記載に従い誰が特許文書または特許開示のファクシミリ複製を行おうと異存はないが、その他の点ではいかなる形であれすべての著作権を留保する。
【0003】
本発明は、一般的に、LC/MS分析システムに関する。より具体的には、本発明は、LC/MS実験中の一方の注入から他方の注入への物質の追跡に関する。
【背景技術】
【0004】
分析化学における重要な問題は、複雑な混合物内に含まれる1つまたは複数の分子状物質の濃度を推定することである。液体クロマトグラフィ(LC)の後に質量分析(MS)を行うことは、試料中の多数の化学物質を分離しそれぞれの化学物質の濃度または量を測定しやすくするために使用することができるよく知られている技術(LC/MS)である。物質の正確な質量を測定することで、複数の試料について物質を追跡することができる。追跡される物質の応答または強度を測定することで、物質の濃度を試料毎に追跡することができる。
【0005】
LC/MSでは、分析のため試料がシステム内に注入される。そのような注入毎に、LC/MSシステムは、イオンの保持時間、分子量、および強度を測定する。複数のイオンが、単一の分子から発生しうる。分子の濃度は、その分子が発生するイオンのうちの1つまたは複数による調査により決定されることができる。
【0006】
本明細書で使用されているように、「物質」という用語は、1つの分子からの単一イオン、または単一の共通分子から得られるイオンの集まりを意味することができる。例えば、低分子量の小さな分子は、単一イオンを発生することができる。ペプチドまたはタンパク質などの巨大分子は、複数のイオンを発生することができる。1つの分子から複数のイオンを組み合わせて単一の有効な、質量、保持時間、および強度を得るためによく知られている技術が使用できる。それぞれの物質は、質量、保持時間、および強度を有すること、および有効な質量、保持時間、および強度は、それぞれの物質に割り当てられることが仮定される。
【0007】
質量、保持時間、および強度のこれらの測定結果を使用することで、物質の特性を決定できる。例えば、注入と注入との間の対応する物質の強度の比較は、物質の濃度が対照と未知試料との間で変化するかどうかを判定する基準となる。試料間のタンパク質の濃度の変化は、試料間のタンパク質の発現量の変化を示すものである。
【0008】
一組の試料は、連続注入を使用して処理することができる。同じ試料を複数回注入して、一組の繰り返し注入を行うことができる。例えば、2つの区別できる試料(標準試料と未知試料)は、それぞれ、3回注入することができ、それにより、合計6回の注入を行える。濃度測定の再現性は、このデータを使用することで、それぞれの物質、さらに対照試料と未知試料との間のそれぞれの物質の濃度の変化について、推論することができる。それぞれの試料は、試料間の相対的較正を行うための一定量の内部標準を含むことができる。
【0009】
いかなる物質の濃度を判定する技術についても、まず、他のすべてのものからその物質を適切に分別しなければならない。LC/MS技術では、質量と保持時間の両方において物質(または物質に関連付けられたイオン)を分離することができる。他の方法では区別がつきようもない、保持時間内に共溶出する物質は、質量で分別することができ、したがって、その検出を行え、その強度の正確な推定を行うことができる。
【0010】
しかし、一方の注入から他方の注入への物質の関連付けまたは追跡については、正確な質量による分別だけでは十分でない場合がある。例えば、分子の質量および保持時間の特性を考えよう。分子量は、分子の固有特性である。質量分析計は、分子量と電荷との比m/zを測定する。記号μは、質量対電荷比m/zを示すために使用されることが多い。μに対する値は、注入と注入との間で直接比較できる。同じ物質に関して注入と注入との間のμの測定値の変動は、計測器ノイズ源のみによるものでなければならない。
【0011】
エレクトロスプレーイオン化などのイオン化技術により、ペプチドまたはタンパク質などの試料について電荷Zを決定することができる。決定された荷電状態により、物質の分子量mを推論することができる。したがって、分子量mは、物質を追跡するための基準を与える。これらの目的のために、経験的に観測された質量対電荷比の値μ、または分子量mの推論された値は、同義的に使用することができる。本明細書で使用されているように、質量という用語は、観測された質量対電荷の比の値μ、または推論された分子量mを意味する。
【0012】
十分に高い質量精度により、それぞれの物質は、質量の値に基づき潜在的に一意に区別可能である。そのため、物質をわずかしか含まない試料の場合、物質を分離する十分なクロマトグラフ分解能があると仮定すると、分解能m/Δm≒20,000の飛行時間型(TOF)分析器などの高精度質量分析計を使用することで、質量単独の正確な測定結果に基づいて一方の注入から他方の注入までそれぞれの物質を追跡することができる。このような場合、質量は、物質をその化学組成または構造に関して同定するために必ずしも使用されていない。むしろ、質量は、注入から注入までの間物質を追跡するための物質の経験的な、場合によっては一意的な識別子として使用される。
【0013】
しかし、質量だけだと、一方の注入から他方の注入まで物質を追跡するのに十分でない場合がある。質量精度が低く、試料が複雑である場合、一方の注入で確認されたような物質の質量が他方の注入における無関係の物質の経験的に観測された質量と一致することがある可能性がある。例えば、それぞれμが1024.200amuおよび1024.300amuである2つの物質がありうる。このような物質は0.100amu未満のMS精度で区別可能であるが、0.100amuを超える精度のMSを使用したのでは区別可能でない。
【0014】
物質のクロマトグラフ保持時間は、その物質の付加的な潜在的に無関係の識別子とすることができる。物質の保持時間は、固有特性ではない。むしろ、物質の保持時間は、物質(または、むしろ、物質を生じさせる分子)と、いろいろな効果のうち特に、クロマトグラフ分離における液相および固相との相互作用に依存する。しかし、保持時間が固有でないとしても、その値は、与えられた分離方法について再現性の高いものとすることができる。保持時間が正確に再現可能であり、精度が高い場合、質量と保持時間の両方の呼応の組み合わせは、一方の注入から他方の注入までそれぞれの物質を一意に追跡するのに十分でありうるのが理想的である。つまり、2つの異なる物質が正確な同じ質量および保持時間を共有することはまずありえないであろう。しかし、保持時間は、注入から注入までの間必ずしも再現可能であるわけではない。むしろ、物質の保持時間は、注入から注入までの間に変動する可能性がある。
【0015】
注入から注入までの間のこのような保持時間の変動にもかかわらず、保持時間には知られている規則性がある。つまり、物質が時刻tに注入Aで溶出した場合、その物質は、他の注入Bでも溶出し、保持時間は時間枠t±Δtの範囲にある。つまり、与えられた物質の保持時間は、一方の注入から他方の注入までの間に変動する可能性がある。しかし、このような変動は、時間枠t±Δtを上下限とする。この境界Δtは、経験的に決定することができ、本明細書では、粗保持時間閾値Δtcと呼ぶ。本明細書で使用されているように、t±Δtcという用語は、粗保持時間枠を指す。粗保持時間枠内にあるすべての物質が十分に一意的な質量を有し、一般に粗保持時間枠および質量だけに基づいて、また特に、より複雑な試料の場合に、追跡を行うことができる場合もあるかもしれないが、与えられた粗保持時間枠内で質量が一意にならないような質量値を持つ物質もありえる。
【発明の開示】
【発明が解決しようとする課題】
【0016】
本発明の実施形態は、限定はしないが、LCにより分離され、エレクトロスプレーイオン化によりイオン化され、四重極型分析器、飛行時間型分析器、イオントラップ型分析器、またはこれらの分析器の組み合わせを含む、質量分析計により分析される試料を伴う。さらに、本発明の実施形態は、MS−MSまたはMSn技術により断片化できる物質に適用可能である。
【0017】
本発明の実施形態では、クロマトグラフ保持時間のこれまでに知られていない付加的な規則性を、物質が試料中において一意的な質量を有するという事実とあわせて用い、他のいかなる手段でも質量単独では区別可能でないと思われる残留物質を一意に追跡する。このような試料の例は、天然タンパク質試料に由来するペプチドの消化物を含む。例えば、血清のペプチド消化物は、10,000個またはそれ以上の区別できるペプチド、つまり物質を含むことができる。クロマトグラフ分離では、30個またはそれ以上のペプチドは、クロマトグラフピークの幅の範囲内で溶出できる。
【0018】
第1のこれまでに知られていない規則性は、2つの異なる化学物質が一方の分離において全く同じ保持時間で溶出する場合に、他の分離におけるそれらの物質に対する保持時間の差も0になるというものである。つまり、2つの異なる化学物質が互いに関して一方の分離において同じ時間で溶出する場合、互いに関して他のすべての分離において全く同じ保持時間で溶出する。この対の絶対保持時間は、分離から分離への間に変わる可能性がある。しかし、保持時間の差が一方の分離において物質の対について0である場合、物質のその対の間の保持時間の差は、すべての分離に関して0となる。
【0019】
この規則性は、ペプチド混合物の重要な場合において生じる。一方の分離において同じ保持時間で溶出する2つのペプチドは、他のすべての分離においても同一保持時間で溶出する。ここでもまた、絶対保持時間は分離から分離までの間に変化しうるが、保持時間の差は0となる。
【0020】
第2のこれまでに知られていない規則性は、保持時間に関連付けられた固有測定誤差である。2つの物質がすべての注入において互いに関して同じ保持時間で溶出する場合、実際には、いくぶん異なる測定溶出時間で溶出する。そのため、単一の注入の範囲内では、2つの物質の測定された保持時間は、平均をとった場合のみ、一致し、同一となる。これらの測定誤差は、ピークの最高値を求めることと関連する統計誤差としてみなすことができる。例えば、物質が注入において10.0分で溶出する場合、その測定された保持時間は、±0.2分だけ異なると予測されると考えられ、第2の物質も10.0分で溶出する場合、その測定された保持時間も、±0.2分だけ異なるであろう。したがって、1つ注入の範囲内では、2つの物質に対する保持時間の測定された値は、9.90および10.15分とすることができる。0.25分のこの偏差は、2つの物質の実際の相対的保持時間の偏差ではない(0である)。これは、測定誤差によるその注入の範囲内でのそれぞれの物質の保持時間の測定結果の偏差である。
【0021】
一般に、この統計に基づく測定誤差は、Δtcで表される、変動誤差よりも著しく小さい。固有統計測定誤差に関連付けられた閾値は、本明細書では、詳細保持時間閾値と呼ばれ、Δtfで表される。
【0022】
第3のこれまでに知られていない規則性は、近い時間で溶出するが、全く同じ保持時間で溶出するわけではない物質について生じる。このような物質が溶出する保持時間は、分離から分離への間に変わる可能性がある。しかし、2つの時間的に近い溶出物質の間で溶出する第3の物質がある場合、これら2つの間で常に溶出する。
【0023】
例えば、保持時間変動の結果として、2つの物質の間の時間オフセットは、注入から注入までの間に変化しうる。例えば、物質が一方の注入において2.0分と2.4分で溶出する場合、第2の注入では2.5分と2.7分で溶出する可能性がある。第1の物質の保持時間が注入と注入との間に0.5分だけドリフトしたということは真実であるが、このドリフト量は、2つの物質の間の保持時間の差よりも重要性が低い。この差は、第1の注入では0.4分であり、第2の注入では0.2分であった。
【0024】
第3のこれまでに知られていない規則性も、これら2つの時間の間に注入1において溶出する第3の物質に適用される。例えば、このような第3の物質が注入1において2.1分で溶出すると仮定する。第3の規則性によれば、第3の物質は、注入1において物質1と2との間で溶出したため、注入2などの他の注入において、物質1と2との間でも溶出する。さらに、第3の物質に対する注入間のオフセットは比例する。そのため、注入2では、第3の物質は、2.55分で溶出する。
【0025】
粗時間枠(すでに知られている)に関する規則性および統計誤差または詳細保持時間閾値(すでには知られていない)に関する規則性は、再現可能な測定結果またはロバスト法に特徴的であるためすべてのクロマトグラフ分離において生じる。相対的保持時間(すでには知られていない)に関する規則性および保持時間順序(すでには知られていない)は、複雑な混合物中のすべての物質について生じる場合も生じない場合もある。しかし、これらは、ペプチド消化物中に観察され、物質がクロマトグラフ固定相および移動相との関連する化学的相互作用を持つ混合物について有効である可能性がある。
【0026】
本発明の実施形態では、これらの規則性の出現を認識し、注入から注入までの物質を追跡するためにそれらを利用することができる。本発明の一実施形態では、試料中のそれぞれの物質に対し、基準保持時間が割り当てられる。基準保持時間は、2つの物質が同じ基準保持時間を持たなければ同じ物質ではありえないという意味で一意である。他方で、それらが同じ基準保持期間を持つ場合、同じ物質である可能性がある。
【0027】
この仮定を使用することで、本発明の実施形態は、同じ質量および同じ基準保持時間を持つことを要求することにより物質を追跡する。分子量または保持時間のいずれかまたは両方において著しく異なる物質は、同じではない。本発明のいくつかの実施形態によれば、著しい差は、閾値を外れる差である。
【0028】
要約すれば、複雑な分離では、計測器が区別できる範囲内で複数の物質が同じ質量を持つ可能性がある。本発明のいくつかの実施形態は、保持時間の前記のすでには知られていない規則性に照らして正確な質量測定を使用し、保持時間マップを決定する。次いで、保持時間マップにより、基準保持時間が1つの分離においてそれぞれの物質に割り当てられるようにできる。次に、物質の基準保持時間および質量を分離(注入)の間に比較し、分離から分離まで(注入から注入まで)その物質を追跡することができる。
【課題を解決するための手段】
【0029】
一実施形態では、本発明は、LC/MSシステムで物質を追跡するための方法である。この方法は、第1の注入からの物質の部分集合および第2の注入からの物質の部分集合を選択することを含む。第1および第2の注入から選択された物質が比較される。一致する物質は、これらの比較に基づいて同定される。一致する物質を使用して、保持時間マップが形成される。保持時間マップは、基準保持時間をそれぞれの物質に割り当てるために使用される。次に、物質の基準保持時間および質量を分離(注入)の間に比較し、分離から分離まで(注入から注入まで)その物質を追跡することができる。
【0030】
他の実施形態では、本発明は、LC/MSシステムで物質を追跡するためのシステムである。システムは、液体クロマトグラフに投入される試料を含む。液体クロマトグラフは、試料を1つまたは複数の物質に分離する。システムは、さらに、物質のそれぞれの質量を決定するために物質が投入される質量分析計を含む。コンピュータがシステムに含まれる。コンピュータは、第1の注入からの物質の部分集合および第2の注入からの物質の部分集合を選択し、第1および第2の注入から選択された物質を比較し、第1および第2の注入における一致する物質を同定し、一致する物質に基づいて保持時間マップを構成し、マップに基づいて基準保持時間をそれぞれの物質に割り当て、物質の基準保持時間および質量を使用して分離と分離(注入)の間に物質を追跡するようにプログラムされる。
【発明を実施するための最良の形態】
【0031】
図1は、本発明の一実施形態による例示的なLC/MSシステム101の概略図である。試料102は、液体クロマトグラフ104内に自動的に、または手動で注入される。高圧のクロマトグラフ溶媒流は、強制的に試料102を液体クロマトグラフ104内のクロマトグラフカラム106に通す。カラム106は、典型的には、結合分子が表面に含まれるシリカビーズの充填カラムを含む。試料中の分子種、溶媒、およびビーズ間の競合的相互作用は、それぞれの分子種の移動速度を決定する。分子種は、カラム106内を移動し、保持時間と呼ばれる、特性時間にカラム106から出現する、つまり溶出する。
【0032】
LC/MSシステムでは、カラム106から溶出した後、分子は質量分析計108などの検出装置に搬送される。質量分析計108は、脱溶媒和システム110、イオン化装置112、質量分析器114、検出装置116、およびコンピュータを備える。コンピュータ118は、本明細書で説明されている物質追跡機能を実行するように構成またはプログラムできるコンピュータであればどのようなものでもよい。さらにコンピュータ118は、本明細書で説明されているように選択された値をユーザが入力できるように、または自動的に決定できるように構成することができる。
【0033】
試料が質量分析計108内に導入されると、脱溶媒和システム110が、溶媒を除去し、イオン発生源112が、検体分子をイオン化する。イオン化法は、よく知られている電子衝撃(EI)、エレクトロスプレー(ES)、大気圧化学イオン化(APCI)、マトリックス支援レーザー脱離イオン化(MALDI)、およびサーモスプレーを含む。APCIでは、試料は脱溶媒和され、その後イオン化されることに留意されたい。
【0034】
イオン化された分子は、質量分析器114に搬送される。質量分析器114は、質量対電荷比により分子をソートまたはフィルタ処理する。質量分析器114などの質量分析器は、四重極型(Q)質量分析器、飛行時間型(TOF)質量分析器、およびフーリエ変換(FT)質量分析器を含む。さらに、質量分析器は、例えば、四重極飛行時間型(Q−TOF)、三連四重極(Q1−Q2−Q3)型、およびQ1−Q2−TOFなどの他の四重極飛行時間型構成を含む、さまざまなタンデム構成で配置することができる。
【0035】
本発明の実施形態によれば、基準保持時間がそれぞれの注入におけるそれぞれの物質に割り当てられる。本発明の実施形態によれば、物質の基準保持時間および質量は、注入と注入との間で物質を追跡するために使用される。
【0036】
基準保持時間は、一方の注入を基準注入(注入A)として選択し、Aにおける物質を試料集合内の他の注入で見つかった物質と比較することにより得られる。例えば、2つの注入、注入Aと注入Bを考える。基準注入Aにおける物質が、注入Bにおける物質と比較される。この比較から得られた結果に基づき、この方法は、基準保持時間を注入Bにおける物質に割り当てる。第3の注入、注入Cが与えられた場合、この方法では、Aにおける物質をCにおける物質と比較して、Cに対する基準保持時間を求める。この手順は、基準保持時間を他のすべての試料集合内の他のすべての物質に割り当てるために繰り返される。
【0037】
次いで、BおよびCにおける物質に割り当てられた基準保持時間は、互いに、および/またはAにおける保持時間と直接比較することができる。実際、本発明の実施形態による方法では、注入BおよびCにおけるそれぞれの物質に対する、注入AとBとの間、および注入AとCとの間の保持時間ドリフトの効果を取り除く。本発明の実施形態は、望む数の試料の望む数の注入に拡張することができる。
【0038】
本発明の実施形態によれば、注入AとBにおける物質の部分集合は、注入AとBとの間の保持時間ドリフトを説明する保持時間マップを得るために使用される。このマップから、注入Bにおけるすべての物質について基準保持時間が決定される。同様に、本発明の実施形態によれば、注入AとCにおける物質の部分集合は、注入AとCとの間の保持時間ドリフトを説明する保持時間マップを得るために使用される。このマップから、注入Cにおけるすべての物質について基準保持時間が決定される。本発明の実施形態は、基準注入Aと望む数の試料の望む数の注入との間の保持時間マップを決定するように拡張できる。
【0039】
図2は、本発明の一実施形態による2つの注入AとBとの間の保持時間マップを決定するために一致する物質を同定する方法の流れ図である。この方法は、コンピュータにより自動的に、またはユーザからの入力と組み合わせて実行できる。
【0040】
工程202で、注入AおよびBの物質の部分集合が選択される。物質の部分集合は、多数の方法で、手動により、または自動的に選択することができる。例えば、この部分集合は、強度に基づいて選択できる。本発明のこのような一実施形態では、選択された物質の部分集合は、閾値よりも高い強度を持つ物質を含む。
【0041】
閾値は、多数の方法で選択できる。例えば、閾値は、手動で入力された、または収集データに従って決定された、予め定められている閾値とすることが可能である。データに従って決定されたこのような閾値は、閾値中央値である。閾値中央値は、注入における物質について測定された強度すべての中央値として計算される。収集データに従って決定された他の閾値は、特定の注入における測定された強度の標準偏差に基づく閾値である。必要というわけではないが、それぞれの注入における測定された強度は、閾値を適用する前または後に正規化することが可能である。
【0042】
保持時間マップを作成する際に使用される物質の部分集合は、この閾値を超える物質を含む。したがって、本発明の実施例の物質の部分集合は、強度が閾値を超える注入AおよびBにおける物質のみを含む。
【0043】
工程204では、粗保持時間閾値Δtcが選択される。本発明の一実施形態では、Δtcの好ましい値は、5分である。Δtcは、保持時間内に生じうる最大変動を定義するものである。粗保持時間閾値は、手動または自動で選択できる。さらに、粗保持時間閾値は、予め定めておき、例えば、工程204で読み出し元となる構成ファイル内に格納することができる。
【0044】
工程206では、分子量閾値Δmが選択される。分子量閾値は、本明細書では、別に質量閾値とも呼ぶ。分子量閾値は、さらに、100万分の1単位(Δm/m)*106、または質量対電荷比Δμとして表すこともできる。分子量閾値は、当業者によく知られている方法を使用してMSの特性を知ることで求めることができる。例えば、このような1つの方法では、分子量閾値をスペクトルのピークの幅に関して指定する。スペクトルのピーク幅が半値全幅(FWHM)として指定されている場合、ppm単位の閾値は、(FWHM/m)*106と表すことができる。高強度ピークでは、この閾値は、0.2などのFWHMの小さな数を使用して下げることができ、そのため、ppm誤差は、(0.2*FWHM/m)*106となる。
【0045】
分子量閾値は、手動または自動で選択できる。さらに、分子量閾値は、予め定めておき、例えば、工程206で読み出し元となる構成ファイル内に格納することができる。
【0046】
工程208で、注入Aにおけるすべての閾値選択物質を注入Bにおける物質と比較する探索が実行される。単独で注入Bにおける物質に一致する注入Aにおける物質は、工程210で同定される。2つの物質は、質量の差の大きさが質量閾値Δmよりも小さい場合、保持時間の差の大きさが粗保持時間閾値Δtcの範囲内にある場合、Bにおいてその基準と合致する単一の物質のみがある場合、両方の物質(注入Aにおける物質、および注入Bにおける可能な一致する物質)の強度がそれぞれの強度中央値よりも高い場合に一致していると考えられる。上の開示に照らしてこのような一致する物質を同定できる探索方法は、当業でよく知られている。
【0047】
その結果、工程210で得られる対の集合は、分子量、粗保持時間の一意的一致特性を有し、強度要件を満足する物質の対のみを含む。つまり、この集合は、物質のN個の一致する対を含み、それぞれ、下付き文字iにより示され、それぞれ以下の条件を満たす。
【数1】
【0048】
当業者には、単独で一致する物質を定義する他の要件を強制可能であることは理解されるであろう。これらの他の要件は、前記の要件の1つまたは複数に加える、それらとは別にする、またはそれらと組み合わせることが可能である。例えば、強度比が特定の閾値範囲内にあるという要件を加えることが可能である。このような条件の下で、一致する物質は、条件
【数2】
を満たさなければならない。このような場合、rに対する好ましい値は2としてよいであろう。
【0049】
加えられる他の要件は、知られている荷電状態のイオンが比較される場合に適用される。このような場合、
【数3】
というように荷電状態が一致する要件を加えることが可能である。
【0050】
次いで、注入AおよびBからの一致する物質の対は、工程202から210で説明されているように、本発明の一実施形態による探索を実行することにより得られる。物質のこれらの対は、注入AおよびBにおける物質が閾値基準を満たす場合にのみ保持される。つまり、工程202から210までの効果として、質量閾値、粗保持時間閾値、および可能な強度閾値からなる一致基準を満たす注入AおよびBにおける物質の部分集合を選ぶことになる。
【0051】
保持され、一致する物質の対から、
【数4】
として定義されている、保持時間差が対毎に得られる。保持時間差Δtiは、保持時間
【数5】
での注入Aにおけるその物質に関する注入Bにおける物質の保持時間ドリフトである。2つの保持時間
【数6】
および
【数7】
は、注入AおよびBからのi番目の保持されている一致する対である。
【0052】
図3は、Δtiと、一致する物質を同定した後に保持される対から得られた
【数8】
との例示的なグラフである(工程210)。図3内の点は、閾値基準を満たす注入AおよびBにおける物質に対応する。図3の例示的なグラフにおいて、閾値基準は、0.020amuの質量閾値Δmの範囲内で合致しなければならず、5分以内の保持時間差、粗保持時間閾値、および強度閾値中央値を持つ。
【0053】
図4は、本発明の一実施形態による、図3を拡大した、領域302の例示的なグラフである。拡大された水平軸は、一致する対が垂直軸上にどれだけ集中しているかを示している。
【0054】
図3および4を調べると、点の大半が塊をなしている、密度の高い背骨部分が存在することがわかる。しかし、これらの図から、さらに、背骨部分の周りに点がある程度散在し、外れ値が存在することもわかる。これらの問題は、後述のフィルタ処理などの技術を介して対処することができる。
【0055】
質量閾値および粗保持時間閾値を使用して一致する物質のリストが同定された後、工程212で保持時間マップが構成される。図5は、本発明の一実施形態による保持時間マップを構成するための方法の流れ図である。工程502で、一致する対のリストが、注入Bのときに観察された保持時間に応じてソートされる。好ましい一実施形態では、リストは、
【数9】
の値が昇順となるようにソートされる。そこで、i=1,2,...,N−1について
【数10】
となる。このソートで、質量および粗保持時間探索から得られた注入AおよびBにおける物質の間の対合が保持される。
【0056】
図3に示されているグラフを調べると、保持時間差の大半が粗保持時間枠内に入るため、Δtcの値の選択が確認される。さらに、このような調査から、Δtcの低減された値を使用して物質間の対合、つまりΔtcの値を精密化できると判定した可能性があることが示唆される。他方で、図3に例示されているようなグラフを調べて、偏位がΔtcの値を超えているように見えた場合、Δtcの値を増して、図2に例示されている一致する対を決定する工程204〜210を繰り返すことが可能である。
【0057】
工程504で、Δtiの値のフィルタ処理を行って、Δtiの精密化された値を、
【数11】
の関数として求める。このようなフィルタ処理は、多数の方法で実行できる。例えば、フィルタ処理は、移動平均フィルタ、中央値フィルタ、スプライン、または他の所望のフィルタ処理とすることができる。移動平均フィルタでは、Δtiのそれぞれの値は、その隣接要素の加重平均で置き換えられる。しかし、本開示の目的に関して、外れ値の影響をなくすため、中央値平均フィルタが採用される。中央値平均フィルタでは、Δtiのそれぞれの値は、それ自体とそのM個の隣接要素の中央値で置き換えられる。典型的には、Mは5から20までの範囲であるが、特定のアプリケーションについてはその範囲を外れる可能性もある。
【0058】
図8は、外れ値を除去するために5点中央値フィルタを例示的なデータセットに適用することを例示する図である。グラフ801は、5点中央値フィルタの適用前のデータセットをプロットしたものである。2つの外れ値802および804は、グラフ804内で目立っている。グラフ806は、5点中央値フィルタの適用後のデータセットを例示している。5点中央値フィルタが外れ値802および804を除去したことが容易にわかる。
【0059】
中央値フィルタによるフィルタ処理により、中央値フィルタ処理値
【数12】
の集合が生成され、これは、保持時間
【数13】
に対応する。図9Aおよび9Bは、本発明の一実施形態による、それぞれ図3および4に示されている例示的データに5点中央値フィルタを適用した結果をプロットしたグラフである。図9Bは、拡大された図9Aの領域902である。図9Aおよび9Bを調べると、中央値フィルタにより外れ値が取り除かれていることがわかる。ここでは、図9Aおよび9Bにプロットされた点の集合
【数14】
を背骨と呼ぶ。図9Aおよび9Bの
【数15】
対
【数16】
のプロットは、図3および4の高密度領域の中心を通る。
【0060】
工程506において、基準保持時間の集合は、
【数17】
として計算される。この方程式の効果として、フィルタ処理された保持時間ドリフト
【数18】
が
【数19】
から差し引かれる。値
【数20】
は、注入Aにあったとすれば物質が持つであろう保持時間である。ステップ506の結果、値のN個の対
【数21】
が得られる。値のこれらの対は、2つの注入の間の保持時間マップである。
【0061】
保持時間マップ
【数22】
は、対になっている値により記述される、ポイントツーポイントルックアップテーブル(LUT)とみなすことができる。上述のように、保持時間マップは、物質の部分集合から導かれる。保持時間マップを使用することで、注入Bにおけるすべての物質について基準保持時間が決定される。特に、保持時間マップは、LUTに記述されていようといまいと、注入Bにおけるすべての物質について基準保持時間を決定するために使用される。
【0062】
図6は、本発明の一実施形態により注入Bにおけるすべての物質に対する基準保持時間を決定するために保持時間マップを使用する方法の流れ図である。工程602で、注入Bにおける与えられた物質がルックアップテーブルの一部であるかどうかが判定される。物質がLUTの一部であるかどうかは、保持時間
【数23】
に基づく。物質の保持時間がLUTに含まれる場合、物質は、保持時間マップに含まれるものと考えられる。そうでない場合、物質は、保持時間マップに含まれるものとして考えられない。
【0063】
物質が保持時間マップに含まれる場合、その基準保持時間は、工程506において、上で定義されているように
【数24】
である。他方で、注入Bにおける物質が保持時間マップLUTの一部でない場合、本発明の一実施形態では、注入Bにおける物質に対する基準保持時間を計算するために線形補間が適用される。線形補間に対する方程式は、
【数25】
として与えられ、ただし、
【数26】
である。下付き文字iおよびi+1で指定された物質は、保持時間マップ、つまりLUTに含まれる物質を指定する。下付き文字kにより指定された物質は、LUTに含まれない。そこで、補間方程式では、LUTに含まれない物質について基準保持時間がどのように決定されるかを指定する。
【0064】
工程508で、注入Aにおけるすべての物質について、基準保持時間が計算される。本発明の好ましい一実施形態では、注入Aにおけるそれぞれの物質に対する基準保持時間は、元の保持時間である。つまり、注入におけるすべての物質について、基準保持時間は
【数27】
である。注入Aにおける物質に対する基準保持時間が割り当てられた後、注入AおよびBにおけるすべての物質について基準保持時間が割り当てられた。注入AおよびBにおける物質のそれぞれに基準保持時間を前記のように割り当てると、注入AおよびBにおける物質間の保持時間オフセットが除去される。
【0065】
追加の注入が、利用可能であれば、これも考慮することができる。例えば、第3の注入、注入Cが利用可能であった場合、上述の工程を繰り返し、注入Cにおける物質に対する値を注入Bにおける物質の代わりに置き換えて
【数28】
を決定することができる。
【0066】
そのため、本発明の実施形態では、試料集合内のすべての注入におけるすべての物質について基準保持時間を決定することができる。基準注入(ここでは、注入A)は、試料集合内の物質について基準保持時間を決定することを目的としてそのような試料集合内の注入とみなすことができる。
【0067】
図7は、注入AおよびBにおける物質を追跡するための方法の流れ図である。本発明の一実施形態により作成された保持時間マップが与えられた場合、工程702では、詳細保持時間閾値Δtfを決定する。詳細保持時間閾値は、ピークの保持時間の測定における固有統計誤差である。
【0068】
詳細保持時間閾値Δtfは、それぞれの一致する対について見つかった保持時間差の値Δtiとフィルタ処理された値
【数29】
を考慮することにより計算される。Δtiおよび
【数30】
が与えられた場合、これらの値の差は、
【数31】
として計算される。Δtiの中央値がΔt1自体である場合、
【数32】
のいくつかの値は0である。これらの0値は省かれ、点δtiの集合が形成される。δtiに対する値は、保持時間の測定における固有統計誤差を表す。
【0069】
Δtfは、例えば、δt1の平均を中心とする標準偏差をとり、Δtfをその標準偏差の4倍にとることにより、δt1から推定できる。それとは別に、Δtfは、よく知られているヒストグラム処理技術を使用することによりδt1から推定でき、その場合、δtiのヒストグラムが生成され、Δtfは指定されたわずかな部分の点、例えば、99%のΔtfを含む時間に対応する。
【0070】
注入と注入との間で物質を追跡する際に、保持時間閾値は、詳細保持時間閾値Δtfで使用される。詳細保持時間閾値は、基準保持時間および質量値をともに使用され、これにより、注入と注入との間で物質を追跡する。典型的には、Δtfは、0.4分のオーダーであるが、アプリケーション毎に異なっていてよい。そのため、保持時間閾値は、5分の粗保持時間閾値から約0.4分まで短縮される。次に、この短縮は、同じ分子量を持つ物質を比較する際の曖昧さを低減または排除する効果を有する。
【0071】
Δtfを使用して、注入A、B、およびCにおけるすべての物質を追跡できる。工程704で、注入AおよびBにおけるすべての物質が比較される。追跡基準を満たすものが保持される。例えば、本発明の好ましい一実施形態では、追跡基準は、
【数33】
である。
【0072】
探索は、注入Aにおける物質(インデックスiで示されている)と注入Bにおける物質(インデックスjで示されている)について実行される。上記の追跡基準からわかるように、質量枠(質量閾値)は無変化であるが、保持時間枠(保持時間閾値)は、保持時間自体ではなく、基準保持時間を詳細探索閾値と比較するために変化させられる。両方の基準が満たされたときに一致が示される。任意であるが、強度基準の適用は必要ない。
追加の注入を分析できる。例えば、第3の注入、注入Cが与えられた場合、注入Cにおけるすべての物質は、注入Aにおけるすべての物質と比較される。基準
【数34】
を満たす物質の対のみが保持される。それとは別に、注入Cにおけるすべての物質は、注入Bにおけるすべての物質と比較することが可能である。基準
【数35】
を満たす物質の対のみが保持される。
【0073】
注入Aが基準保持時間計算の共通目標として使用されるとしても、一度計算されれば、基準保持時間は、BとCとの間など、2つの注入の間で比較することができることに留意していただきたい。そのため、本発明の実施形態では、いくらでも多くの数の注入における物質追跡について完全に対称的な比較を行う。
【0074】
図10aおよび10bは、本発明の一実施形態により、注入と注入との間で物質を追跡するために詳細保持時間閾値を使用することを例示するグラフである。図10aの線1002は、詳細保持時間閾値を背骨(backbone)に加える
【数36】
ことにより得られ、線1004は、詳細保持時間閾値を背骨から差し引く
【数37】
ことにより得られる。図10bは、図10aを拡大した、領域1001のプロットである。線1006および1008は、線1002および1004の拡大図である。
【0075】
図10aでは、1002および1004内にある点が
【数38】
を満たす。したがって、1002および1004内にあるそれぞれの点は、注入AとBとの間で追跡される物質の対を表す。これは、それぞれの点が2つの基準、詳細保持時間閾値
【数39】
と質量閾値
【数40】
とを同時に満たすからである。
【0076】
要約すると、本発明の実施形態では、注入と注入との間で物質を追跡することができるということである。例えば、本発明の一実施形態では、2つの物質は、同じ分子量(前の指定された誤差の範囲に対し)を持つ場合に、かつ同じ基準保持時間(前の指定された誤差の範囲に対し)を持つ場合に、2つの物質は同じである。誤差は、データ特性を調べることにより決定できる。注入に関する物質のこのような追跡により、分析者は、試料集合内の試料の間の物質の濃度の相対的変化を定量化または追跡することができる。
【0077】
これからわかるように、本発明の実施形態は、従来の物質追跡方法を使用した場合に必要になるように内部標準を使用する必要はない。これは、本発明の実施形態では一意的な質量とともにどの物質が出現するかを先験的に知る必要がないからである。実際、正確な質量測定により、局所的保持時間標準として保持時間マップ内に出現するそれぞれの物質を使用することができる。
【0078】
基準保持時間を割り当てるには、粗保持時間閾値および詳細保持時間閾値がある必要がある。粗閾値は、超えられない境界上下限を与える。詳細閾値は、0を中心とする変動を与える。高強度(例えば、高い信号対雑音比)を持つ物質に対するすべての一意的一致は、粗閾値の範囲内で見つかることが予想される。
【0079】
注入から注入までに物質が追跡された後、試料間の物質の濃度の定量的変化を測定することができる。定量的応答は、物質を定めるイオンまたはイオンの集合についてLC/MSシステムにより測定された応答である。
【0080】
例えば、M個の試料のそれぞれについてN個の繰り返し注入を含む実験を考える。N個の繰り返し注入のそれぞれの部分集合内の追跡されるすべての物質に対する質量、強度、および保持時間について平均値、中央値、標準偏差、変動係数を求めることができる。これらの量の平均値は、M個の試料の間でそれぞれの物質について追跡される類似度とすることができる。
【0081】
試料の関数としてのそれぞれの物質の応答は、SIMCA(スイスのUmetrics社から入手可能)、またはPirouette(ワシントン州ウッデンビルのInfometrix社から入手可能)などの標準統計分析ソフトウェアに入力することができる。このような分析ソフトウェアは、本発明の実施形態により生成される追跡物質のリストを入力として受け取り、試料母集団間の物質の変化を明らかにする。SIMCAおよびPirouetteソフトウェアパッケージ、さらには他のソフトウェアシステムは、それらのデータに適用できる主成分分析法または因子分析法を機能として備える。
【0082】
特に、共通タンパク質の消化断片であるトリプシンペプチドに関連する強度は、試料から試料への間に一斉に変化する。一方の試料または試料の集合は、一方のレベルで発現されるタンパク質を含み、他の試料または試料の集合は、同じタンパク質を含むが、今度は異なる濃度レベルで発現されるということを考える。トリプシン消化が実行される場合、そのタンパク質に関連付けられたトリプシンペプチドの濃度は一方の試料から他方の試料へとスケーリングする。つまり、濃度パターンは、一方の試料内に1つの特徴的パターンを形成し、他の試料内に類似のパターンを形成するが、強度値は、親タンパク質の濃度が大きいか小さいかに応じて全体として大きくまたは小さくなるようにスケーリングされる。
【0083】
濃度のこのような相関性のある変化は、因子分析法、または主成分分析(PCA)に基づく方法により容易に確認できる。このような方法は、濃度、つまり発現レベルが試料毎に変化した親タンパク質を同定するために使用できる。つまり、ペプチドの集合がPCAプロット内に特徴的痕跡を生じる場合である。これらのペプチドが共通親タンパク質を指している場合、発現レベルが変化したタンパク質が同定されている。
【0084】
最終的な同定は、これらの関連するペプチド(一斉に変化したペプチド)の正確な質量をとり、http://www.matrixsciences.com/またはprospector.ucsf.eduから入手可能なペプチド質量指紋ソフトウェアなどの標準的ペプチド指紋ソフトウェアを使用して同定することにより行うことができる。
【0085】
本発明の好ましい実施形態の前記の開示は、例示および説明を目的として提示された。この説明は網羅的であることを意図しておらず、また本発明を開示した正確な形態だけに限る意図もない。本明細書で説明されている実施形態の多くの変更形態および修正形態は、上記開示に照らして当業者には明白なことであろう。本発明の範囲は、付属の請求項のみにより、またその同等の項目により、定められるものとする。
【0086】
さらに、本発明の代表的実施形態を説明する際に、明細書において本発明の方法および/またはプロセスを特定の一連の工程として提示している可能性がある。しかし、方法またはプロセスが本明細書に記載されている工程の特定の順序に依存しない限り、方法またはプロセスは、説明されている特定の一連の工程に限定されるべきではない。当業者であれば理解するように、他の一連の工程も可能である。したがって、明細書に記載されている工程の他の順序は、請求項に対する制限と解釈すべきではない。さらに、本発明の方法および/またはプロセスを対象とする請求項は、書かれている順序で工程を実行することに限定されるべきではなく、また当業者であれば、順序を変更することができ、それでも本発明の精神および範囲内あることを容易に理解するであろう。
【図面の簡単な説明】
【0087】
【図1】本発明の一実施形態によるLC/MSシステムの概略図である。
【図2】本発明の一実施形態による2つの注入AとBとの間の保持時間マップを決定するために一致する物質を同定する方法の流れ図である。
【図3】本発明の一実施形態による質量閾値および粗保持時間閾値の探索を実行する保持点の例示的なグラフである。
【図4】本発明の一実施形態による水平軸を拡大した質量閾値および粗保持時間閾値の探索を実行した後保持される点の例示的なグラフである。
【図5】本発明の一実施形態による保持時間マップを構成するために一致する物質を使用する方法の流れ図である。
【図6】本発明の一実施形態による基準保持時間を決定するために保持時間マップを使用する方法の流れ図である。
【図7】本発明の一実施形態による複数の注入にわたって物質を追跡するために基準保持時間および質量を使用する方法の流れ図である。
【図8】5点中央値フィルタを例示的なデータセットに適用することを例示する図である。
【図9A】本発明の一実施形態により、保持時間マップおよび詳細保持時間閾値を決定するためにそれぞれ図3および4に例示されているデータに5点中央値フィルタを適用した結果をプロットしたグラフである。
【図9B】本発明の一実施形態により、保持時間マップおよび詳細保持時間閾値を決定するためにそれぞれ図3および4に例示されているデータに5点中央値フィルタを適用した結果をプロットしたグラフである。
【図10A】本発明の一実施形態により、注入と注入との間で物質を追跡するために基準保持時間、詳細保持時間閾値、質量、質量閾値を使用することを例示するグラフである。
【図10B】本発明の一実施形態により、注入と注入との間で物質を追跡するために基準保持時間、詳細保持時間閾値、質量、質量閾値を使用することを例示するグラフである。
【特許請求の範囲】
【請求項1】
LC/MSシステムにおいて物質を追跡する方法であって、
第1の注入から物質の部分集合を選択することと、
第2の注入から物質の部分集合を選択することと、
第1の注入から選択された物質を第2の注入から選択された物質と比較することと、
第2の注入から選択された物質と一致する第1の注入から選択された物質を同定することと、
一致する物質に基づいて保持時間マップを構成することと、
保持時間マップに基づいて基準保持時間を割り当てることと、
基準保持時間および質量値を使用して第1および第2の注入を通して物質を追跡することとを含む、方法。
【請求項2】
粗保持時間閾値を選択することと、
質量閾値を選択することと、
粗保持時間閾値および質量閾値に応じて、第1の注入からの物質の部分集合、および第2の注入からの物質の部分集合を選択することとを含む、請求項1に記載の方法。
【請求項3】
一致した物質をソートすることを含む、請求項1に記載の方法。
【請求項4】
さらに、
物質が保持時間マップ内に対応するエントリを持つかどうかを判定することと、
物質がルックアップテーブル内に対応するエントリを持つ場合に保持時間の確定した値を使用することと、
物質がルックアップテーブル内に対応するエントリを持たない場合に保持時間の補間値を使用することとを含む、請求項1に記載の方法。
【請求項5】
さらに、
詳細保持時間閾値を決定することと、
詳細保持時間閾値および質量値を使用して物質を追跡することとを含む、請求項1に記載の方法。
【請求項6】
さらに、
正確な質量および粗保持時間に基づいて物質の照合を行うことと、
一致する物質の間の保持時間差を計算することと、
計算された保持時間差をフィルタ処理することと、
フィルタ処理された保持時間差を使用して保持時間マップを決定することと、
保持時間マップを使用して基準保持時間を決定することと、
基準保持時間および質量値を使用して注入を通して物質を追跡することとを含む、請求項1に記載の方法。
【請求項7】
フィルタ処理が中央値フィルタ処理である、請求項6に記載の方法。
【請求項8】
さらに、一致した物質をフィルタ処理することを含む、請求項1に記載の方法。
【請求項9】
フィルタ処理が中央値フィルタ処理である、請求項8に記載の方法。
【請求項10】
LC/MSシステムにおいて物質を追跡するシステムであって、
第1の注入から物質の部分集合を選択する手段と、
第2の注入から物質の部分集合を選択する手段と、
第1の注入から選択された物質を第2の注入から選択された物質と比較する手段と、
第2の注入から選択された物質と一致する第1の注入から選択された物質を同定する手段と、
一致する物質に基づいて保持時間マップを構成する手段と、
保持時間マップに基づいて基準保持時間を割り当てる手段と、
保持時間マップおよび質量値を使用して第1および第2の注入を通して物質を追跡する手段とを備える、システム。
【請求項11】
粗保持時間閾値を選択する手段と、
質量閾値を選択する手段と、
粗保持時間閾値および質量閾値に応じて、第1の注入からの物質の部分集合、および第2の注入からの物質の部分集合を選択する手段とを備える、請求項10に記載のシステム。
【請求項12】
一致した物質をソートする手段を備える、請求項10に記載のシステム。
【請求項13】
さらに、
物質が保持時間マップ内に対応するエントリを持つかどうかを判定する手段と、
物質がルックアップテーブル内に対応するエントリを持つ場合に保持時間の確定した値を使用するための手段と、
物質がルックアップテーブル内に対応するエントリを持たない場合に保持時間の補間値を使用するための手段とを備える、請求項10に記載のシステム。
【請求項14】
さらに、
詳細保持時間閾値を決定する手段と、
詳細保持時間閾値および質量値を使用して物質を追跡する手段とを備える、請求項10に記載のシステム。
【請求項15】
さらに、
正確な質量および粗保持時間に基づいて物質の照合を行う手段と、
一致する物質の間の保持時間差を計算する手段と、
計算された保持時間差をフィルタ処理する手段と、
フィルタ処理された保持時間差を使用して保持時間マップを決定する手段と、
保持時間マップを使用して基準保持時間を生成する手段と、
基準保持時間および質量値を使用して注入を通して物質を追跡する手段とを備える、請求項10に記載のシステム。
【請求項16】
フィルタ処理が中央値フィルタ処理である、請求項15に記載のシステム。
【請求項17】
さらに、一致した物質をフィルタ処理することを含む、請求項10に記載のシステム。
【請求項18】
フィルタ処理が中央値フィルタ処理である、請求項17に記載のシステム。
【請求項19】
LC/MSシステムにおいて物質を追跡するシステムであって、
試料内の物質を分離し、1つまたは複数の物質のそれぞれに関連付けられた保持時間を決定するために試料が注入される液体クロマトグラフと、
1つまたは複数の物質のそれぞれの質量を決定するために物質が投入される質量分析計と、
コンピュータであって、
第1の注入からの物質の部分集合および第2の注入からの物質の部分集合を選択し、
第1および第2の注入から選択された物質を比較し、
第1および第2の注入における一致する物質を同定し、
一致する物質に基づいて保持時間マップを構成し、
保持時間マップに基づいて基準保持時間を割り当て、
保持時間マップおよび質量値を使用して物質を追跡するようにプログラムされたコンピュータとを備える、システム。
【請求項20】
コンピュータが、さらに、
粗保持時間閾値を選択し、
質量閾値を選択し、
粗保持時間閾値および質量閾値に応じて、第1の注入からの物質の部分集合、および第2の注入からの物質の部分集合を選択するようにプログラムされる請求項19に記載の、システム。
【請求項21】
コンピュータが、さらに、一致する物質をソートするようにプログラムされる、請求項19に記載のシステム。
【請求項22】
コンピュータが、さらに、
物質が保持時間マップ内に対応するエントリを持つかどうかを判定し、
物質がルックアップテーブル内に対応するエントリを持つ場合に保持時間の確定した値を使用し、
物質がルックアップテーブル内に対応するエントリを持たない場合に保持時間の補間値を使用するようにプログラムされる、請求項19に記載のシステム。
【請求項23】
コンピュータが、さらに、
詳細保持時間閾値を決定し、
詳細保持時間閾値および質量値を使用して物質を追跡するようにプログラムされる、請求項19に記載のシステム。
【請求項24】
コンピュータが、さらに、
正確な質量および粗保持時間に基づいて物質の照合を行い、
一致する物質の間の保持時間差を計算し、
計算された保持時間差をフィルタ処理し、
保持時間差を使用して保持時間マップを決定し、
保持時間マップを使用して基準保持時間を決定し、
基準保持時間および質量値を使用して注入を通して物質を追跡するようにプログラムされる、請求項19に記載のシステム。
【請求項25】
フィルタ処理が中央値フィルタ処理である、請求項24に記載のシステム。
【請求項26】
さらに、一致した物質をフィルタ処理することを含む、請求項19に記載のシステム。
【請求項27】
フィルタ処理が中央値フィルタ処理である、請求項26に記載のシステム。
【請求項1】
LC/MSシステムにおいて物質を追跡する方法であって、
第1の注入から物質の部分集合を選択することと、
第2の注入から物質の部分集合を選択することと、
第1の注入から選択された物質を第2の注入から選択された物質と比較することと、
第2の注入から選択された物質と一致する第1の注入から選択された物質を同定することと、
一致する物質に基づいて保持時間マップを構成することと、
保持時間マップに基づいて基準保持時間を割り当てることと、
基準保持時間および質量値を使用して第1および第2の注入を通して物質を追跡することとを含む、方法。
【請求項2】
粗保持時間閾値を選択することと、
質量閾値を選択することと、
粗保持時間閾値および質量閾値に応じて、第1の注入からの物質の部分集合、および第2の注入からの物質の部分集合を選択することとを含む、請求項1に記載の方法。
【請求項3】
一致した物質をソートすることを含む、請求項1に記載の方法。
【請求項4】
さらに、
物質が保持時間マップ内に対応するエントリを持つかどうかを判定することと、
物質がルックアップテーブル内に対応するエントリを持つ場合に保持時間の確定した値を使用することと、
物質がルックアップテーブル内に対応するエントリを持たない場合に保持時間の補間値を使用することとを含む、請求項1に記載の方法。
【請求項5】
さらに、
詳細保持時間閾値を決定することと、
詳細保持時間閾値および質量値を使用して物質を追跡することとを含む、請求項1に記載の方法。
【請求項6】
さらに、
正確な質量および粗保持時間に基づいて物質の照合を行うことと、
一致する物質の間の保持時間差を計算することと、
計算された保持時間差をフィルタ処理することと、
フィルタ処理された保持時間差を使用して保持時間マップを決定することと、
保持時間マップを使用して基準保持時間を決定することと、
基準保持時間および質量値を使用して注入を通して物質を追跡することとを含む、請求項1に記載の方法。
【請求項7】
フィルタ処理が中央値フィルタ処理である、請求項6に記載の方法。
【請求項8】
さらに、一致した物質をフィルタ処理することを含む、請求項1に記載の方法。
【請求項9】
フィルタ処理が中央値フィルタ処理である、請求項8に記載の方法。
【請求項10】
LC/MSシステムにおいて物質を追跡するシステムであって、
第1の注入から物質の部分集合を選択する手段と、
第2の注入から物質の部分集合を選択する手段と、
第1の注入から選択された物質を第2の注入から選択された物質と比較する手段と、
第2の注入から選択された物質と一致する第1の注入から選択された物質を同定する手段と、
一致する物質に基づいて保持時間マップを構成する手段と、
保持時間マップに基づいて基準保持時間を割り当てる手段と、
保持時間マップおよび質量値を使用して第1および第2の注入を通して物質を追跡する手段とを備える、システム。
【請求項11】
粗保持時間閾値を選択する手段と、
質量閾値を選択する手段と、
粗保持時間閾値および質量閾値に応じて、第1の注入からの物質の部分集合、および第2の注入からの物質の部分集合を選択する手段とを備える、請求項10に記載のシステム。
【請求項12】
一致した物質をソートする手段を備える、請求項10に記載のシステム。
【請求項13】
さらに、
物質が保持時間マップ内に対応するエントリを持つかどうかを判定する手段と、
物質がルックアップテーブル内に対応するエントリを持つ場合に保持時間の確定した値を使用するための手段と、
物質がルックアップテーブル内に対応するエントリを持たない場合に保持時間の補間値を使用するための手段とを備える、請求項10に記載のシステム。
【請求項14】
さらに、
詳細保持時間閾値を決定する手段と、
詳細保持時間閾値および質量値を使用して物質を追跡する手段とを備える、請求項10に記載のシステム。
【請求項15】
さらに、
正確な質量および粗保持時間に基づいて物質の照合を行う手段と、
一致する物質の間の保持時間差を計算する手段と、
計算された保持時間差をフィルタ処理する手段と、
フィルタ処理された保持時間差を使用して保持時間マップを決定する手段と、
保持時間マップを使用して基準保持時間を生成する手段と、
基準保持時間および質量値を使用して注入を通して物質を追跡する手段とを備える、請求項10に記載のシステム。
【請求項16】
フィルタ処理が中央値フィルタ処理である、請求項15に記載のシステム。
【請求項17】
さらに、一致した物質をフィルタ処理することを含む、請求項10に記載のシステム。
【請求項18】
フィルタ処理が中央値フィルタ処理である、請求項17に記載のシステム。
【請求項19】
LC/MSシステムにおいて物質を追跡するシステムであって、
試料内の物質を分離し、1つまたは複数の物質のそれぞれに関連付けられた保持時間を決定するために試料が注入される液体クロマトグラフと、
1つまたは複数の物質のそれぞれの質量を決定するために物質が投入される質量分析計と、
コンピュータであって、
第1の注入からの物質の部分集合および第2の注入からの物質の部分集合を選択し、
第1および第2の注入から選択された物質を比較し、
第1および第2の注入における一致する物質を同定し、
一致する物質に基づいて保持時間マップを構成し、
保持時間マップに基づいて基準保持時間を割り当て、
保持時間マップおよび質量値を使用して物質を追跡するようにプログラムされたコンピュータとを備える、システム。
【請求項20】
コンピュータが、さらに、
粗保持時間閾値を選択し、
質量閾値を選択し、
粗保持時間閾値および質量閾値に応じて、第1の注入からの物質の部分集合、および第2の注入からの物質の部分集合を選択するようにプログラムされる請求項19に記載の、システム。
【請求項21】
コンピュータが、さらに、一致する物質をソートするようにプログラムされる、請求項19に記載のシステム。
【請求項22】
コンピュータが、さらに、
物質が保持時間マップ内に対応するエントリを持つかどうかを判定し、
物質がルックアップテーブル内に対応するエントリを持つ場合に保持時間の確定した値を使用し、
物質がルックアップテーブル内に対応するエントリを持たない場合に保持時間の補間値を使用するようにプログラムされる、請求項19に記載のシステム。
【請求項23】
コンピュータが、さらに、
詳細保持時間閾値を決定し、
詳細保持時間閾値および質量値を使用して物質を追跡するようにプログラムされる、請求項19に記載のシステム。
【請求項24】
コンピュータが、さらに、
正確な質量および粗保持時間に基づいて物質の照合を行い、
一致する物質の間の保持時間差を計算し、
計算された保持時間差をフィルタ処理し、
保持時間差を使用して保持時間マップを決定し、
保持時間マップを使用して基準保持時間を決定し、
基準保持時間および質量値を使用して注入を通して物質を追跡するようにプログラムされる、請求項19に記載のシステム。
【請求項25】
フィルタ処理が中央値フィルタ処理である、請求項24に記載のシステム。
【請求項26】
さらに、一致した物質をフィルタ処理することを含む、請求項19に記載のシステム。
【請求項27】
フィルタ処理が中央値フィルタ処理である、請求項26に記載のシステム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9A】
【図9B】
【図10A】
【図10B】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9A】
【図9B】
【図10A】
【図10B】
【公表番号】特表2007−522477(P2007−522477A)
【公表日】平成19年8月9日(2007.8.9)
【国際特許分類】
【出願番号】特願2006−553215(P2006−553215)
【出願日】平成17年2月11日(2005.2.11)
【国際出願番号】PCT/US2005/004176
【国際公開番号】WO2005/079261
【国際公開日】平成17年9月1日(2005.9.1)
【出願人】(504438255)ウオーターズ・インベストメンツ・リミテツド (80)
【Fターム(参考)】
【公表日】平成19年8月9日(2007.8.9)
【国際特許分類】
【出願日】平成17年2月11日(2005.2.11)
【国際出願番号】PCT/US2005/004176
【国際公開番号】WO2005/079261
【国際公開日】平成17年9月1日(2005.9.1)
【出願人】(504438255)ウオーターズ・インベストメンツ・リミテツド (80)
【Fターム(参考)】
[ Back to top ]