前駆体および生成物イオンの保持時間一致を実行し、前駆体および生成物イオンスペクトルを構成する技術
前駆体イオンを1つ以上の関連生成物イオンと一致させる方法が記載され、本方法は、複数の注入から取得された複数の入力データ集合を提供するステップであって、複数の入力データ集合の各々が、同じ前駆体イオンおよび1つ以上の生成物イオンを含むステップと、前駆体イオンの単一の保持時間にしたがって、複数の入力データ集合を正規化するステップと、複数の入力データ集合の各々について、前駆体イオンの単一の保持時間に対して、どの生成物イオンが所定の保持時間枠内にあるかを判断するステップと、生成物イオンが複数の入力データ集合の少なくとも1つの所定の保持時間枠内にある場合に、生成物イオンが単一の保持時間を有する前駆体イオンに関連すると判断するステップとを含む。
【発明の詳細な説明】
【技術分野】
【0001】
本願は、2008年5月29日出願の米国特許仮出願番号61/056,871の優先権を主張し、その全内容は参照により本明細書に組み込まれる。
【0002】
本発明は、主に化合物の分析に関し、より具体的には、ポリペプチド分析の機器および方法に関する。
【背景技術】
【0003】
プロテオミクスは一般的に、生物系由来のタンパク質の複合混合物を包含する研究を指す。プロテオミクスの研究は、タンパク質の同定、または生物系の状態における変化の判定に焦点を合わせる場合が多い。複合生物試料中のタンパク質の同定および定量化は、プロテオミクスにおける根本的な問題である。
【0004】
質量分析と組み合わされた液体クロマトグラフィ(LC/MS)は、プロテオミクス研究における基本的なツールとなっている。液体クロマトグラフィ(LC)による無傷のタンパク質またはそのタンパク質分解されたペプチド生成物の分離、および質量分析(MS)によるその後の分析は、多くの一般的なプロテオミクス方法論の基本を形成する。タンパク質の発現レベルの変化を測定する方法は、生物指標発見の基本および臨床診断を形成することができることから、非常に興味深い。
【0005】
無傷のタンパク質を直接分析するのではなく、むしろタンパク質は一般的に、タンパク質分解ペプチドの特定の集合を生成するために、消化される。その結果得られるペプチドは、その後LC/MS分析によって特徴付けられる場合が多い。消化に使用される一般的な酵素はトリプシンである。トリプシン消化において、タンパク質分解酵素の開裂特異性によって決定されるようにペプチドを生成するため、複合混合物中に存在するタンパク質は開裂される。観察されるペプチドの同一性および濃度から、利用可能なアルゴリズムは、試料中のタンパク質の同定および定量化に役立つ。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】米国特許第6,717,130号明細書
【特許文献2】国際公開第2006/133191号
【特許文献3】米国特許出願公開第2006/021919号明細書
【特許文献4】米国特許出願公開第2005/0127287号明細書
【特許文献5】国際公開第2005/079263号
【特許文献6】米国特許出願公開第2005/004180号明細書
【特許文献7】国際公開第2005/079261号
【特許文献8】米国特許出願公開第2005/004176号明細書
【非特許文献】
【0007】
【非特許文献1】RoepstorffおよびFohlman、Biomed Mass Spectrom、1984;11(11):601
【非特許文献2】Johnsonら、Anal.Chem 1987、59(21):2621:2625
【非特許文献3】Silvaらによる「Quantitative Proteomic Analysis by Accurate Mass Retention Time Pairs」、Anal.Chem.,Vol.77,2187〜2200頁(2005)
【発明の概要】
【発明が解決しようとする課題】
【0008】
LC/MS分析において、ペプチド消化はまず、LC分離およびその後のMS分析によって、分離および分析される。理想的には、十分な精度で測定された、1つのペプチドの質量は、ペプチドの固有の同定を提供する。しかし実際には、通常実現される質量精度は、おおよそ10ppm以上である。一般的に、そのような質量精度は、質量測定のみを使用してペプチドを一意的に同定するのに十分ではない。
【0009】
たとえば、10ppmの質量精度の場合、おおよそ10のペプチド配列が、ペプチド配列の典型的なデータベースの検索において同定される。たとえば質量精度に対する検索制約が低下するか、あるいは化学または翻訳後修飾、H2OまたはNH3の損失、および点突然変異の検索が可能であれば、この配列数は著しく増加するだろう。このように、ペプチド配列が欠失または置換のいずれかによって修飾される場合、ペプチドの同定のために前駆体の質量のみを使用することは、誤同定につながるだろう。2つのペプチドが、異なる配列を持ちながら同じアミノ酸組成を有することができる可能性から、さらなる複雑さが生じる。
【0010】
ペプチド前駆体の場合、生成物断片は、前駆体における単ペプチド結合での断片化によって得られることが可能である。このような単一断片化は、2つの副配列を生じる。ペプチドのC末端を含む断片は、イオン化された場合、Yイオンと称され、ペプチドのN末端を含む断片は、イオン化されるとBイオンと称される。
【0011】
タンパク質はしばしば、分析データを、断片の質量など、タンパク質の同一性をタンパク質の断片に関する情報と関連づけるデータベースと比較することによって、同定される。たとえば、データベースからの理論上のペプチド質量がデータで測定された前駆体の質量の質量検索枠内にある場合、これはヒットしたと見なされる。
【0012】
検索は、データベースで見つけられる、適合する可能性のあるペプチドのリストを提供することができる。これらの適合可能データベースペプチドは、統計的要因によって重み付けされてもされなくてもよい。このような検索から起こり得る結果は、いずれの適合可能データベースペプチドも同定されないか、1つの適合可能データベースペプチドが同定されるか、または2つ以上の適合可能データベースペプチドが同定されることである。適切な機器の較正を前提として、MSの分解能が高いほど、ppm閾値が小さくなり、その結果、誤同定が少なくなる。データベースで一致するペプチドが1つ以上ある場合には、この一致を確認するために、ペプチド断片イオンデータが使用されてもよい。
【0013】
検索の間、複数の電荷状態および複数の同位体が検索されてもよい。さらに、有効な一致を同定するのに役立てるために、実験的に生成された信頼性規則が適用され得る。
【課題を解決するための手段】
【0014】
前駆体イオンを1つ以上の関連生成物イオンと一致させる方法およびコンピュータ読み取り可能媒体は、本発明の一態様による。複数の入力データ集合が、複数の注入から取得される。複数の入力データ集合の各々は、同じ前駆体イオンおよび1つ以上の生成物イオンを含む。複数の入力データ集合は、前駆体イオン向けの単一の保持時間にしたがって正規化される。複数の入力データ集合の各々のために、上記前駆体イオン向けの単一の保持時間に対して、どの生成物イオンが所定の保持時間枠内にあるかが判断される。複数の入力データ集合のうち少なくとも1つにおいて生成物イオンが所定の保持時間枠内にある場合、生成物イオンは単一の保持時間を有する前駆体イオンに関連すると判断される。
【0015】
前駆体を関連生成物イオンと一致させる方法は、本発明の別の態様による。この方法は、複数の注入を実行するステップと、上記各前駆体に関連づけられた保持時間および質量を含む基準にしたがって、上記複数の注入のいずれが上記前駆体の各々を含むかを判断するために、複数の注入を通じて上記前駆体の各々を追跡するステップと、上記前駆体の各々のために、関連する生成物イオンの集合を決定するステップであって、前記関連生成物イオンの各々は、上記複数の注入の少なくとも1つにおける上記各前駆体の上記保持時間に対して所定の保持時間枠内の保持時間を有するステップと、上記前駆体の各々の上記関連生成物イオンの各々のために、強度和を決定するステップとを含み、上記強度和は、上記各関連生成物イオンの1つ以上の強度を加算することによって決定され、上記1つ以上の強度の各々は、上記各前駆体を含む上記複数の注入の異なる1つにおける上記各関連生成物イオンの強度に対応する。
【0016】
クロマトグラフィモジュールと、上記クロマトグラフィモジュールと通信する質量分析モジュールと、上記クロマトグラフィモジュールおよび上記質量分析モジュールと通信する制御部とを含む試料分析装置は、本発明の別の態様による。制御部は、少なくとも1つのプロセッサ、および上記プロセッサによって実行される複数の命令を記憶するためのメモリを含む。複数の命令はプロセッサに、上記各前駆体に関連づけられた保持時間および質量を含む基準にしたがって、上記複数の注入のいずれが上記前駆体の各々を含むかを判断するために、複数の注入を通じて上記前駆体の各々を追跡するステップと、上記前駆体の各々のために、関連生成物イオンの集合を決定するステップであって、前記関連生成物イオンの各々は、上記複数の注入の少なくとも1つにおける上記各前駆体の上記保持時間に対して所定の保持時間枠内の保持時間を有するステップと、上記前駆体の各々の上記関連生成物イオンの各々のために、強度和を決定するステップとを実行させ、上記強度和は、上記各関連生成物イオンの1つ以上の強度を加算することによって決定され、上記1つ以上の強度の各々は、上記各前駆体を含む上記複数の注入の異なる1つにおける上記各関連生成物イオンの強度に対応する。
【0017】
前駆体イオンを1つ以上の関連生成物イオンと一致させる方法は、本発明のさらに別の態様による。この方法は、複数の注入から複数の入力データ集合を取得するステップであって、上記入力データ集合の各々は同じ前駆体イオンおよび1つ以上の生成物イオンを含むステップと、上記複数の入力データ集合を上記前駆体イオン向けの単一の保持時間にしたがって正規化するステップと、上記複数の入力データ集合の各々のために、上記前駆体イオン向けの単一の保持時間に対して、どの生成物イオンが所定の保持時間枠内にある対応する保持時間を有するかを判断するステップと、上記判断ステップによって生成物イオンが、前記複数の入力データ集合のうち少なくとも1つの上記単一保持時間に対して所定の保持時間枠内にある、対応する保持時間を有すると判断された場合に、上記単一の保持時間を有する上記前駆体イオンに関連すると判断された結果的な生成物イオンの集合に上記生成物イオンが含まれるように、上記複数の入力データ集合に含まれる生成物イオンに対して和集合演算を実行するステップとを提供する。
【0018】
前駆体イオンを1つ以上の関連生成物イオンと一致させる方法およびコンピュータ読み取り可能媒体は、本発明の別の態様による。複数の注入から取得された複数の入力データ集合が提供される。複数の入力データ集合の各々は、第一保持時間を有する同じ前駆体イオンと、上記前駆体イオン向けの上記第一保持時間に対して所定の保持時間枠内の保持時間を有する1つ以上の生成物イオンとを含む。上記前駆体イオンの強度が、上記複数の入力データ集合のその他における上記前駆体の強度に対して最大となる、第一の入力データ集合が選択される。第一集合における各生成物イオンが上記選択ステップで選択された上記第一入力データ集合となり、上記第一保持時間に対する上記所定の保持時間枠内の保持時間を有するように、生成物イオンの第一集合が決定される。上記第一集合における各生成物イオンのために、どの上記複数の入力データ集合が、上記第一保持時間に対して上記所定の保持時間枠内の保持時間を有する上記各生成物イオンを含むかについて、第一の結果が決定され、上記第一の結果における入力データ集合にわたる上記生成物イオンのための強度の和として、上記各生成物イオンのために強度和が決定される。生成物イオンの第一集合は上記前駆体に関連しており、上記第一集合における上記生成物イオンの各々は、上記強度和決定ステップで決定された強度和を有する。
【0019】
前駆体イオンを1つ以上の関連生成物イオンと一致させる方法およびコンピュータ読み取り可能媒体は、本発明の別の態様による。複数の注入から取得された複数の入力データ集合が提供される。複数の入力データ集合の各々は、第一保持時間を有する同じ前駆体イオンと、上記前駆体イオン向けの上記第一保持時間に対して所定の保持時間枠内の保持時間を有する1つ以上の生成物イオンとを含む。上記複数の入力データ集合のうち少なくとも1つにおいて上記第一保持時間に対して上記所定の保持時間枠内の保持時間を有する生成物イオンの第一集合が、決定される。上記第一集合における各生成物イオンは、上記各生成物イオンを含む上記複数における入力データ集合にわたる上記生成物イオンの強度の和である強度を有し、上記各生成物イオンは、上記第一保持時間に対して上記所定の保持時間枠内の保持時間を有する。上記前駆体イオンの強度が、上記複数の入力データ集合のその他における上記前駆体の強度に対して最大となる、第一の入力データ集合が選択される。生成物イオンの第二集合は、上記第二集合における各生成物イオンが、上記選択ステップによって選択された上記第一入力データ集合に含まれ、上記第一保持時間に対して上記所定の保持時間枠内の保持時間を有するように、決定される。第一集合から削除されるのは、上記第二集合に含まれない生成物イオンである。第一集合から生成物イオンを削除した後、第一集合は上記前駆体に関連する生成物イオンを含む。
【0020】
前駆体イオンに関連する生成物イオンを判定する方法は、本発明の別の態様による。この方法は、複数の注入から取得された複数の入力データ集合を提供するステップであって、上記複数の入力データ集合の各々が、第一保持時間を有する同じ前駆体イオンと、上記前駆体イオン向けの上記第一保持時間に対して所定の保持時間枠内の保持時間を有する1つ以上の生成物イオンとを提供するステップと、複数の保持時間一致および生成物イオン選択技術を提供するステップであって、上記複数の保持時間一致および生成物イオン選択技術各々は、上記前駆体に関連すると判断された関連生成物イオンに関する上記複数の入力データ集合からの情報を組み合わせる処理を実行し、上記関連生成物イオンは各々、上記第一保持時間に対して上記所定の保持時間枠内の保持時間を有し、上記複数の保持時間一致および生成物イオン選択技術は、上記生成物イオンが複数の入力データ集合のうち少なくとも1つにおける上記第一保持時間に対して所定の保持時間枠内の保持時間を有する場合に、生成物イオンが上記前駆体イオンに関連すると判断する第一技術を含むステップと、複数の保持時間一致および生成物イオン選択技術のうちの少なくとも1つを選択するステップと、上記前駆体イオンに関連する生成物イオンを判定するために、上記少なくとも1つの選択された保持時間一致および生成物イオン選択技術を使用して、上記複数の入力データ集合を処理するステップとを含む。
【0021】
図面において、類似の参照符号は全体的に、異なる図面にわたって同じ部分を指す。また、図面は必ずしも縮尺通りとは限らず、むしろ本発明の原理を図解する上で、全体的に強調されている。
【図面の簡単な説明】
【0022】
【図1】本発明の一実施形態による、化合物の化学分析を実行する方法のフロー図である。
【図2A】本発明の一実施形態による、LC/MSシステムのブロック図である。
【図2B】本発明の一実施形態による、質量スペクトルの一群を示す、3つの関連するグラフである。
【図3】本発明の一実施形態における入力データ集合に対して実行可能な処理を示すブロック図である。
【図4】本発明の一実施形態によって本明細書に記載される、第一技術、Sumtrackを使用する、前駆体およびその関連生成物イオンの保持時間一致に関連する処理ステップのフロー図である。
【図5】本発明の一実施形態によって本明細書に記載される、第一技術、Sumtrackを使用する、前駆体およびその関連生成物イオンの保持時間一致に関連する処理ステップのフロー図である。
【図6】本発明の一実施形態による、本明細書の第一技術の使用を図解する、注入のグラフ表示である。
【図7】本発明の一実施形態による、本明細書の第一技術の使用を図解する、注入のグラフ表示である。
【図8】本発明の一実施形態による、本明細書の第一技術の使用を図解する、注入のグラフ表示である。
【図9】本発明の一実施形態による、本明細書の第一技術の使用を図解する、注入のグラフ表示である。
【図10】本発明の一実施形態による、本明細書の第一技術の使用を図解する、注入のグラフ表示である。
【図11A】本発明の一実施形態による、本明細書の第一技術の使用を図解する、注入のグラフ表示である。
【図11B】本発明の一実施形態による、本明細書の第一技術の使用を図解する、注入のグラフ表示である。
【図12】本発明の一実施形態によって本明細書に記載される、第一技術、Sumtrackを利用する処理ステップのフロー図である。
【図13】本発明の別の実施形態によって本明細書に記載される、第一技術、Sumtrackを利用する処理ステップのフロー図である。
【図14】本発明の一実施形態によって本明細書に記載される、第一技術、Sumtrackと連携して使用される入力データ集合を形成するために使用可能な、注入および関係する試料の図である。
【図15】本発明の一実施形態による、別の技術、Hitrackを使用する、前駆体およびその関連生成物イオンを決定するために使用可能な処理ステップのフロー図である。
【図16】本発明の一実施形態による、さらに別の技術、Mergetrackを適用する例である。
【図17】本発明の一実施形態による、さらに別の技術、Mergetrackを適用する例である。
【図18】本発明による、Mergetrackの異なる実施形態において実行可能な処理ステップのフローチャートである。
【図19】本発明による、Mergetrackの異なる実施形態において実行可能な処理ステップのフローチャートである。
【発明を実施するための形態】
【0023】
本明細書で使用される際に、以下の用語は主に、表示される意味を指す:
タンパク質−単一ポリペプチドとして組み立てたれたアミノ酸の特異的一次配列。
【0024】
ペプチド−タンパク質の一次配列に含まれる単一ポリペプチドとして組み立てたれたアミノ酸の特異的配列。
【0025】
トリプシンペプチド−トリプシンによるタンパク質の酵素開裂に起因するタンパク質配列から生成されるペプチド。次の説明において、便宜上、消化ペプチドはトリプシンペプチドと称される。しかし、本発明の実施形態がその他のペプチド消化技術に適用されることは、理解されたい。さらに、「消化」という用語は、本明細書において、たとえば細胞酵素(プロテアーゼ)の使用および分子内消化を含む、ポリペプチドを分解または開裂するいずれかの適切な方法を主に指すために使用される。本明細書で使用される際に、「タンパク質分解の」という用語は、大型タンパク質を消化または溶解してより小さい分画またはアミノ酸にする、いずれかの酵素を指す。
【0026】
前駆体ペプチド−タンパク質開裂手順を使用して生成される、トリプシンペプチド(または他のタンパク質開裂生成物)。前駆体は随意的に、クロマトグラフィによって分離され、質量分析計に送られる。前駆体の正に帯電され、タンパク化合化された形態を一般的に生成するために、イオン源がこれらの前駆体ペプチドをイオン化する。このように正に帯電されてタンパク化合化された前駆体イオンの質量は、本明細書では前駆体の「mwHPlus」または「MH+」と称される。以下において、「前駆体質量」という用語は主に、イオン化された、ペプチド前駆体のタンパク化合化されたmwHPlusまたはMH+質量を指す。
【0027】
断片または生成物イオン−LC/MS分析において発生し得る複数のタイプの断片または生成物イオン。トリプシンペプチド前駆体の場合、断片は、無傷のペプチド前駆体の衝突断片化から生成され、その一次アミノ酸配列が起源前駆体ペプチドに含まれる、ポリペプチドイオンを含むことができる。YイオンおよびBイオンは、このようなペプチド断片の例である。トリプシンペプチドの断片は、インモニウムイオン、リン酸イオン(PO3)などの官能基、特定の分子または分子種から開裂された質量タグ、あるいは前駆体からの水(H2O)またはアンモニア(NH3)の「中性損失」を含むことができる。
【0028】
YイオンおよびBイオン−ペプチドがペプチド結合において断片化し、電荷がN末端断片上に保持される場合、その断片イオンはBイオンと称される。電荷がC末端断片上に保持される場合には、断片イオンはYイオンと称される。可能な断片およびそれらの命名のより包括的なリストは、RoepstorffおよびFohlman、Biomed Mass Spectrom、1984;11(11):601、ならびにJohnsonら、Anal.Chem 1987、59(21):2621:2625において提供される。
【0029】
保持時間−文脈中において、通常は、物質がその最大強度に到達する、クロマトグラフィプロファイルの点を指す。
【0030】
イオン−各ペプチドは通常、構成元素の同位体の天然存在度のため、イオンの集合体としてLC/MS分析に現れる。イオンは保持時間およびm/z値を有する。質量分析計(MS)は、イオンのみを検出する。LC/MS技術は、全ての検出イオンの様々な観察測定値を生成する。これは、多数の計測されたイオンなどのイオンの質量対電荷比(m/z)、質量(m)、保持時間、および信号強度を含む。
【0031】
mwHPlus−ペプチドの、中性の、単一同位体質量に1つの陽子、1.007825amuの重量を加えたもの。
【0032】
一般的に、LC/MS分析は、その質量、電荷、保持時間、および総合強度に関して、ペプチドの経験的記述を随意的に提供する。クロマトグラフィカラムから溶離する際に、ペプチドは特定の保持期間をかけて溶離し、単一の保持時間においてその最大信号に到達する。イオン化および(可能な)断片化の後、ペプチドは、イオンの関連集合として現れる。集合中の異なるイオンは、異なる同位体組成および共通ペプチドの電荷に対応する。イオンの関連集合中の各イオンは、単一のピーク保持時間およびピーク形状を生成する。これらのイオンは共通ペプチドに由来するので、各イオンのピーク保持時間およびピーク形状は同一で、ある程度の測定公差範囲内である。各ペプチドのMS取得は、ある程度の測定公差範囲内で全てが同じピーク保持時間およびピーク形状を共有する、全ての同位体および電荷状態の複数のイオン検出を実行する。
【0033】
LC/MS分離において、単一のペプチド(前駆体または断片)は多くのイオン検出を実行し、これは複数の電荷状態において、イオンのクラスタとして現れる。このようなクラスタからのこれらのイオン検出のデコンボリューションは、ある電荷状態において、測定された信号強度の特定の保持時間における、固有の単一同位体質量の単一体の存在を示す。
【0034】
タンパク質データベース−本発明のいくつかの実施形態において、分析者はタンパク質のデータベースを利用する。典型的なデータベースでは、これに含まれる各タンパク質は、そのアミノ酸の一次配列によって記述される。分析者は、研究中のタンパク質とよく一致すると思われるデータベースを選択してもよいだろう。たとえば、大腸菌データベースは、大腸菌のcell lycateから取得されたデータと比較されることが可能であろう。同様に、ヒト血清データベースは、ヒト血清から取得されたデータと比較されることが可能であろう。ユーザはサブ集合データベースを選択することもできるだろう。ユーザは、スイスバイオインフォマティクス研究所(SIB)および欧州バイオインフォマティクス研究所(EBI)のSwiss−Protグループによって作成されたSwissProtデータベースに掲載されている全てのタンパク質など、上位データベースを選択することもできるだろう。ユーザは、アミノ酸のランダム配列によって記述された、模擬タンパク質を含むデータベースを選択することもできるだろう。このようなランダムデータベースは、タンパク質同定システムおよび検索アルゴリズムを評価または較正するための対照研究において使用される。ユーザは、自然発生および人工配列の両方を組み合わせたデータベースを使用することもできるだろう。タンパク質データベースより、各配列から、トリプシン前駆体イオンの配列および質量、YおよびBイオン、ならびにそれらの前駆体から生じるその他の可能な断片イオンを推察することが可能である。
【0035】
図1は、本明細書に記載された技術に関連する実施形態において実行可能な、化合物の化学分析を実行するための方法100のフロー図である。方法100は、標準試料の1つ以上の化合物を化合物の成分断片に消化するステップ110と、成分を分離するステップ120と、分離された成分の少なくともいくつかにおいてイオン化するステップ130および質量分析するステップ140と、本明細書に記載の技術とともに使用するための1つ以上の入力データ集合を取得するために、試料中の少なくとも1つの化合物の前駆体および生成物または断片イオンの質量スペクトルを生成するステップ150とを含む。入力データ集合は、前駆体および関連生成物イオンの保持時間一致を実行するために、本明細書に記載の技術にしたがって処理されてもよい。本明細書に記載の技術は、前駆体に関連する生成物イオンの集合を決定するために、保持時間一致および生成物イオン選択を実行する。以下のパラグラフにより詳細に記載されるように、100のステップは、1つ以上の試料の各々に対して1回以上実行されてもよい。
【0036】
好ましくは、対象試料に対して100のステップを繰り返す際に、事実上、消化、クロマトグラフィ分離、および/またはイオン化のために事前選択された同じ方法が、標準試料に使用された対象試料の消化110、分離120、イオン化130、および質量分析140に使用される。
【0037】
方法100のいくつかの好ましい使用は、タンパク質関連の分析を対象とする。したがって、便宜上、以下の説明は、タンパク質および関連する断片に関し、タンパク質などのポリペプチドである化合物の分析の例を使用し、これらの例において、タンパク質は消化されて、タンパク質の前駆体断片である成分断片となる。同様に、前駆体はイオン化されて前駆体イオンとなり、随意的に、質量分析の準備として断片化されて生成物イオンとなる。
【0038】
説明はポリペプチドに関連する例に焦点を当てるが、そのような例は、本発明の範囲をポリペプチドの分析に限定するように意図されるものではなく、化学分析分野の当業者は、本発明の原理がその他の化学的化合物の分析に適用可能であることを認識するであろう。
【0039】
消化110は、知られている技術を含む、タンパク質を開裂するいずれかの適切な技術を通じて達成される。たとえば、上述のように、タンパク質は、トリプシンなどの1つ以上の酵素を使用して、前駆体ポリペプチドまたはアミノ酸に消化される。タンパク質またはポリペプチドの断片は、本明細書では通常、「前駆体」と称される。このような断片は、クロマトグラフィ分離の後の追加分析で随意的に使用されるという意味において、前駆体である。以下により詳細に記載されるように、前駆体断片は、随意的にイオン化され、および/またはさらに断片化されて生成物断片となる。
【0040】
分離120は、逆相クロマトグラフィ、ゲル浸透クロマトグラフィ、サイズ排除クロマトグラフィ、および電気泳動などの知られている技術を含む、いずれかの適切なクロマトグラフィ関連技術によって、達成される。分離120は、タンパク質および/または試料中のタンパク質の消化110から得られた前駆体の保持時間に関する値を提供する。
【0041】
クロマトグラフィ分離120の溶離液を質量分析140するための準備において、分離120処理からの溶離液は、イオン化130処理にかけられる。エレクトロスプレーイオン化およびMALDIなどの知られている技術を含む、いずれかの適切なイオン化130処理が、随意的に使用される。イオン化130処理の間、少なくともいくつかの前駆体がイオン化されて前駆体イオンを形成する。たとえば、単一のタンパク質分子が消化110されて20の前駆体断片を形成し、そのうち10がイオン化130の間にイオン化される。以下により詳細に記載されるように、前駆体は、生成物イオンを得るために、さらに断片化されてもよい。
【0042】
質量分析140は、前駆体イオンの質量に関連する値、およびイオン強度に関連する値を提供する。質量分析140は、知られている技術を含む、いずれかの適切な質量分析技術を通じて実行される。そのような技術は、磁気セクタ分析および飛行時間形分析を含む。
【0043】
ステップ150に示されるように、上述の分析ステップ140から取得された情報は、本明細書に記載される技術を使用してさらに処理されてもよい、入力データ集合を取得するために使用される、前駆体および生成物イオンのための質量スペクトルを形成してもよい。
【0044】
図1のステップを実行するいくつかの実施形態において、ステップ150の入力データに含まれるデータは、LC/MSシステムを使用して取得されてもよい。たとえば、図2Aおよび図2Bを参照してより詳細に記載されるように、液体クロマトグラフによって出力された溶離液は、エレクトロスプレーインターフェースを通じて質量分析計に導入される。随意的に、三連四重極MS機器の第一の四重極は、イオンガイドとして機能する。交流電圧は、機器の衝突セルに印加される。以下に記載されるように、たとえば交互に、前駆体イオンおよびその断片(生成)イオンのスペクトルが収集される。
【0045】
好ましくは、前駆体イオンおよび関連生成物イオンの両方が、分離120処理から得られた同じ前駆体物質から形成される。このようにして、前駆体イオンおよび関連生成物イオンの両方が、分離120処理から決定された同じ保持時間データを有することになる。生成物イオンはこのように、それらが発生する前駆体と比較的容易に関連づけられるだろう。試料の2つ以上の注入が実行される場合、前駆体イオンと生成物イオンのデータは、異なる注入から取得されてもよい。
【0046】
知られている方法を含む、いずれかの適切な方法が、単一の試料注入から前駆体および生成物イオンの両方を取得するために使用されてもよい。このような方法は、前駆体および生成物イオンの両方の有効な同時質量分析を提供する。たとえば、溶離された前駆体の一部が断片化されて生成物イオンを形成し、前駆体および生成物イオンは、同時かまたは、たとえば続けざまに、ほぼ同時分析される。
【0047】
代替例として、ピークの2つ以上の交互部分は、それぞれ前駆体および生成物分析に使用される。ピークの前駆体物質の部分は、イオン化および分析され、その後次の部分が解離されて、分析される生成物断片となる。一実施形態において、溶離前駆体の交互部分は、前駆体イオンおよびその生成物イオンのデータを交互に取得するために、試料採取される。取得されたデータは、ピーク形状の復元によって、溶離された前駆体およびその関連生成物の両方の正確な保持時間値の測定を可能にさせる。さらに、たとえば、前駆体イオンおよび生成物イオンに関連する復元されたピークのピーク形状、幅、および/または時間は、どの生成物イオンが特定の生成物イオンと関連するかを判断するために、随意的に比較される。
【0048】
このような交互の有効な同時分析の手法の1つは、Batemanらによる米国特許第6,717,130号明細書(「Bateman」)に記載されており、これは参照により本明細書に組み込まれ、断片化を調整するために衝突セルに交流電圧を印加する技術を記載している。関連する特徴の付加的な説明は、図2Aおよび図2Bを参照して、以下に提供される。
【0049】
このように、Batemanに記載された技術またはその他の適切な技術は、どの生成物イオンが特定の前駆体に由来するかの判断を支援するために、保持時間観察を使用する。生成物イオンは、一致する保持時間値に応じて、その前駆体イオンに関連づけられる。
【0050】
たとえば、閾値保持時間差が選択され、生成物イオンおよび前駆体イオンの保持時間の差が閾値未満の場合、生成物はその前駆体に由来すると判断される。たとえば、1つの適切な閾値は、前駆体イオンの保持時間ピーク幅の十分の一に等しい。イオンの保持時間値は随意的に、そのイオンにおいて観察されたピークのピーク最大値の時間値として定義される。
【0051】
次に図2Aおよび図2Bを参照すると、本発明のいくつかの実施形態は、LC/MS機器に関する。図2Aは、本発明の一実施形態による、LC/MSシステム200のブロック図である。機器は、クロマトグラフィモジュール204、およびクロマトグラフィモジュール204から溶離液を受け取る質量分析計モジュール212を含む。LCモジュール204は、試料202を受け取る注入器206、ポンプ208,およびカラム210を含む。MSモジュール212は、脱溶媒和/イオン化装置214、イオンガイド216、質量分析器220、および検出器222を含む。システム200は、データ記憶装置224およびコンピュータモジュール226も含む。
【0052】
動作時、試料202は、注入器206を通じてLCモジュール204内に注入される。ポンプ208は、カラム210を通る保持時間にしたがって混合物を構成成分に分離するために、カラム210を通じて試料をポンプ移送する。
【0053】
カラム210からの出力は、分析のため質量分析計212に入力される。まず、試料は脱溶媒和/イオン化装置214によって脱溶媒和およびイオン化される。たとえば、ヒータ、ガス、およびガスと組み合わされたヒータ、またはその他の脱溶媒和技術を含む、いずれかの脱溶媒和技術が採用され得る。イオン化は、たとえばエレクトロスプレーイオン化(ESI)、大気圧化学イオン化(APCI)、またはその他のイオン化技術を含む、いずれかの適切なイオン化技術によってなされ得る。イオン化から生じるイオンは、イオンガイド216によって衝突セル218に供給される。
【0054】
衝突セル218は、イオンを断片化するために使用される。好適な実施形態において、衝突セル218は、前駆体イオンおよび同じ溶離前駆体物質の生成物イオンの両方の観察を支援するために、切り替えモードで操作される。
【0055】
知られている技術を含む、いずれの適切な切り替え技術が使用されてもよい。本発明のいくつかの実施形態は、好ましくは、比較的単純な交流電圧サイクルがセル218に印加される断片化手順を使用する。この切り替えは、複数の高エネルギーおよび複数の低エネルギースペクトルが単一のクロマトグラフィピークに含まれるように、十分に高い周波数で行われる。その他のいくつかの切り替え手順とは異なり、このサイクルはデータの内容とは無関係である。
【0056】
たとえば、「130特許(米国特許第6717130号明細書)」に記載されているように、断片化を生じさせるために、交流電圧が衝突セル218に印加される。前駆体(衝突無し)および断片(衝突の結果)のスペクトルが収集される。
【0057】
代替実施形態は、いずれかの適切な知られている装置を含む、いずれかの適切な衝突断片化または反応装置などのその他の断片化手段を利用する。いくつかの随意的な装置は:(i)表面誘起解離(「SID」)断片化装置、(ii)電子移動解離断片化装置、(iii)電子捕獲解離断片化装置、(iv)電子衝突または衝撃解離断片化装置、(v)光誘起解離(「PID」)断片化装置、(vi)レーザ誘起解離断片化装置、(vii)赤外線放射誘起解離断片化装置、(viii)紫外線放射誘起解離断片化装置、(ix)ノズル−スキマ間インターフェース断片化装置、(x)インソース断片化装置、(xi)イオン源衝突誘起解離断片化装置、(xii)熱または温度源断片化装置、(xiii)電界誘起断片化装置、(xiv)磁場誘起断片化装置、(xv)酵素消化または酵素分解断片化装置、(xvi)イオン−イオン反応断片化装置、(xvii)イオン−分子反応断片化装置、(xviii)イオン−原子反応断片化装置、(xix)イオン−準安定イオン反応断片化装置、(xx)イオン−準安定分子反応断片化装置、(xxi)イオン−準安定原子反応断片化装置、(xxii)イオンを反応させて付加物または生成物イオンを形成するためのイオン−イオン反応装置、(xxiii)イオンを反応させて付加物または生成物イオンを形成するためのイオン−分子反応装置、(xxiv)イオンを反応させて付加物または生成物イオンを形成するためのイオン−原子反応装置、(xxv)イオンを反応させて付加物または生成物イオンを形成するためのイオン−準安定イオン反応装置、(xxvi)イオンを反応させて付加物または生成物イオンを形成するためのイオン−準安定分子反応装置、および(xxvii)イオンを反応させて付加物または生成物イオンを形成するためのイオン−準安定原子反応装置、を含む。
【0058】
衝突セル218の出力は、質量分析器220に入力される。質量分析器220は、四重極、飛行時間形(TOF)、イオントラップ、磁気セクタ質量分析器、およびそれらの組合せを含む、いずれかの適切な質量分析器である。検出器222は、質量分析器220から発するイオンを検出する。検出器222は、質量分析器220と随意に一体化される。たとえば、TOF質量分析器の場合、検出器222は随意的に、イオンの強度を計測する、すなわち衝突イオンの数を計測するマイクロチャネルプレート検出器である。記憶媒体224は、分析用のイオン数を記憶するための永久記憶装置を提供する。たとえば、記憶媒体224は、内蔵または外付けコンピュータディスクである。分析コンピュータ226は、記憶されたデータを分析する。データは、記憶媒体224への記憶を必要とすることなく、リアルタイムで分析されることも可能である。その場合、検出器222は、最初に永久記憶装置に記憶させることなく、分析されるデータをコンピュータ226に直接送る。
【0059】
衝突セル218は、前駆体イオンの断片化を行う。断片化は、ペプチドの配列を決定し、その後起源タンパク質の同一性に導くために、使用され得る。
【0060】
衝突セル218は、窒素などの気体を利用する。帯電したペプチドが気体の分子と相互作用すると、結果的に生じる衝突が、1つ以上の特徴的な結合で分解することによって、ペプチドを断片化することができる。最も一般的な結果的断片化は、YまたはBイオンとして記述される。このような断片化は、ペプチド前駆体のMSスペクトルを取得する低電圧状態(低エネルギー)と、前駆体の衝突誘起断片のMSスペクトルを取得する高電圧状態(高エネルギー)との間で衝突セルの電圧を切り替えることによって、オンライン断片化として実現されることが可能である。電圧はイオンに運動エネルギーを与えるために使用されるので、高電圧および低電圧は、高エネルギーおよび低エネルギーと称される。
【0061】
クロマトグラフィモジュール204は、カラムに基づく機器など、知られている機器を含む、いずれかの適切なクロマトグラフィ機器を含む。適切なカラムは、クロマトグラフィ分野の当業者に知られているカラムを含む。カラムは、たとえば金属または絶縁材料などから形成されることが可能である。適切な材料は、鋼、溶融石英、または裏打ちされた材料など、知られている材料を含む。カラムは、直列および/または並列構成で配置された、2つ以上のカラムを含むことができる。たとえば、カラムは毛細管カラムでもよく、複数の毛細管を含むことができる。
【0062】
コンピュータモジュール226は、データ通信分野において知られているものなど、有線および/または無線手段を通じてシステム200のその他の部品とデータ通信している。モジュール226は、たとえば質量分析計モジュール212から処理データを受信し、制御信号を提供する。モジュール226は随意的に、上述の化学分析のための方法100など、本明細書に記載の方法を、および/または図1のステップ150の結果として取得される入力データ集合をさらに処理するために本明細書に記載された異なる技術を実現するように構成される。モジュール226は、様々な例示的実施形態において、ソフトウェア、ファームウェア、および/またはハードウェア(たとえば、特定用途向け集積回路として)において実現され、望ましければ、ユーザインターフェースを含む。モジュール226は、記憶装置224などの記憶部品を含み、および/またはこれと通信する。
【0063】
モジュール226の適切な埋め込みは、たとえば、マイクロプロセッサなどの1つ以上の集積回路を含む。いくつかの代替実施形態における単一の集積回路またはマイクロプロセッサは、モジュール226およびシステム200のその他の電子部を含む。いくつかの実施形態において、1つ以上のマイクロプロセッサは、モジュール226の機能を可能にするソフトウェアを実行する。いくつかの実施形態において、ソフトウェアは、汎用機器および/または本明細書に記載される機能性のために設けられた専用プロセッサを実行するように設計されている。
【0064】
LC/MS実験は、その出力の1つとして、マスクロマトグラムを生成することができる。マスクロマトグラムは、特定の質量値における時間関数として記録される応答(強度)の集合または群である。マスクロマトグラムにおいて、質量値は、ある範囲内の中央値であってもよい。つまり、与えられた時間における強度は、質量値の特定の範囲に亘って収集された強度を組み合わせることによって、取得されてもよい。通常、マスクロマトグラムは1つ以上のクロマトグラフィピークを含む。
【0065】
単一の分子、または化学物質は、特定の質量を有する。LC/MS実験において、その分子のイオン化された形態は、そのイオンの質量値をその電荷で除した商(質量対電荷比)におけるクロマトグラフィピークとして観察される。クロマトグラフィピークは、ピークプロファイル、または溶離プロファイルを有する。クロマトグラフィ・ピーク・プロファイルは、頂点保持時間、ピーク幅、離昇時間および接地時間を含む、いくつかの特徴を使用して、特徴付けられることが可能である。クロマトグラフィピーク幅は、特定のピーク高での幅(FWHM、50%高さでの幅)、または変曲点の間の幅、として、あるいは標準偏差として、記述されることが可能である。頂点強度またはクロマトグラフィピーク高は、クロマトグラフィ・ピーク・プロファイルで見られる最大強度である。一般的に、頂点強度は基準調整されている。
【0066】
クロマトグラフィ分離によって分離され、カラムから溶離した溶離液中の分子は、共通溶離分子または起源分子と称される。起源分子は、質量分析計のイオン化源を通じてイオン化される。結果的に生じるイオンは、LC/MSまたはLC/MSEスペクトルで測定される。文脈に応じて、LC/MSが通常はデータ取得のLC/MS処理を指す場合もあることに留意されたい。本明細書に記載される、たとえば図2Bに関連するような、スペクトルの形状などにおいて、収集および提示されるデータに関連して、MSスペクトルは、断片化されていない前駆体からのスペクトルを指してもよい。MSEスペクトルは、高エネルギースペクトル(すなわち、断片化された前駆体、つまり、「MSE」で標識された生成物イオンからのスペクトル)を指してもよい。同位体組成および/または断片化処理の結果、各起源分子は、各々が質量および電荷の固有値を有する、複数のカテゴリのイオンを発生させることができる。起源分子に対応するイオンは、前駆体イオン、または単に前駆体と称される。
【0067】
ペプチド消化において、起源分子はペプチドであり、ペプチドに対応するイオンは前駆体と称される。起源分子に由来するいずれのイオンも、前駆体であるか断片であるかにかかわらず、前駆体と同じ保持時間およびクロマトグラフィ・ピーク・プロファイルを有していなければならない。
【0068】
LC/MS実験において、イオンはその保持時間、質量対電荷比、および強度によって、記述および/または参照されることが可能である。単一の分子はLC/MSクロマトグラムにおいて、イオンのクラスタとして現れることができる。ペプチドは、1つ以上のイオンクラスタを発生させる。各クラスタは、異なる電荷状態(たとえば、Z=1またはZ=2)に対応する。クラスタ中の各イオンは、ペプチドの異なる同位体組成に対応する。共通ペプチドからのイオンのクラスタにおいて、単一同位体は最低質量を有するイオンであって、ここで全ての同位体は、その最も豊富な、低質量状態にある。クラスタ中のイオンは共通の起源分子から生じているので、これらは共通の保持時間およびピークプロファイルを共有するはずである。
【0069】
起源分子は、同位体および電荷効果のため、複数のイオンを発生させることができる。また、イオンの重要な源は、起源分子の断片である。これらの断片は、起源分子を離散させる処理から発生する。これらの処理は、イオン化源または衝突セルにおいて生じる。断片イオンは共通の溶離起源分子に由来するので、これらは起源分子と同じクロマトグラフィ保持時間およびピークプロファイルを有するはずである。
【0070】
一般的に、起源分子がNイオンに由来する場合、およびこれら質量分析計によって十分に解析される場合には、各マスクロマトグラムが起源分子に由来するイオンのクロマトグラフィプロファイルであるピークを含む、Nマスクロマトグラムが存在できる。これらNイオンの各々の保持時間およびピークプロファイルは、同一となる。共通保持時間実体という用語は、LC/MS分離において、全て同じ保持時間およびピーク形状を有するクロマトグラフィピークを生じさせる起源分子の全てのイオンを指す。
【0071】
イオン形成、断片化、およびイオン検出の時間は一般的に起源分子のピーク幅よりもはるかに短いので、共通の起源分子に由来するイオンの保持時間およびピーク形状は同じである。たとえば、半値全幅(FWHM)で測定された、典型的なクロマトグラフィピーク幅は、5〜30秒である。イオン形成、断片化、および検出の時間は、通常はミリ秒未満である。このように、クロマトグラフィの時間尺度では、イオン形成の時間は瞬間的処理である。すると、ある起源分子に由来するイオンの観察された保持時間の差は、実質的にゼロということになる。つまり、ある起源分子に由来するイオン間のミリ秒未満の保持時間差は、クロマトグラフィピーク幅と比較すると小さい。
【0072】
ある起源分子に関連するイオンは、いくつかのカテゴリのうちの1つに収まる。ある起源分子に由来するイオンは、前駆体、前駆体の断片、または断片の断片、あるいは上記質量のいずれかの中性損失であってもよい。これらの質量のいずれかが、1つ以上の個別同位体状態において、および1つ以上の電荷状態において、見られる。
【0073】
ペプチドの場合、与えられたペプチドは一般的に、各々が明らかな同位体状態にあり、各々が1つ以上の電荷状態にある、イオンのクラスタであるように見える。理想的には、イオン化源は、中性起源分子から形成されるタンパク化合化形状である前駆体を生成する。1つ以上の陽子は中性分子に取り付けられることが可能であり、したがって前駆体は、Z=+1または+2などの電荷を有する中性よりも高い1つ以上の質量単位となることができる。実際に、この前駆体(mwHPlusと称される)は、水、アンモニア、またはリン酸塩などの中性分子の損失から生じる、低質量体を伴ってもよい。通常、YまたはBイオンを生成する際に、源において、断片化が起こる可能性がある。断片化はまた、衝突セル中の気体分子との下流相互作用によって意図的に誘起されることも可能である。
【0074】
無傷の前駆体イオンの衝突誘起解離から生成されるイオンに関して、断片生成物イオンはその親前駆体イオンに関連づけられる。高低データ取得モードで質量分析計を使用することによって、この関連づけは、その後の断片化のために単一の前駆体を事前選択するための機器を必要とせずに実現される。より具体的には、関連づけられたイオンは、基本的に同じ保持時間で、複数の前駆体が同時に断片化しているときに、適切にグループ化される。このように、本発明の実施形態は、時間的に同時に断片化している2つ以上の前駆体があるときに、生成物イオンをそのそれぞれの前駆体に割り当てることができる。
【0075】
本発明の方法は、起源分子が前駆体イオンおよび断片イオンを生成する場合、ペプチド以外の混合物に適用可能である。本発明の実施形態はこのように、プロテオミクス、メタボロミクス、およびメタボノミクスにおいて使用可能である。
【0076】
カラム210など、クロマトグラフィ支持マトリクスから溶離する分子(ペプチド、代謝産物、天然生成物)の保持時間およびクロマトグラフィ・ピーク・プロファイルは、支持マトリクスと移動相との間のその分子の物理的相互作用の関数である。分子が支持マトリクスと移動相との間に有する相互作用の度合いは、その分子のクロマトグラフィプロファイルおよび保持時間を決定する。複合混合物において、各分子は化学的に異なる。その結果、各分子は、クロマトグラフィマトリクスおよび移動相に対する異なる親和性を有することができる。それゆえに、各々が固有のクロマトグラフィプロファイルを呈することができる。
【0077】
一般的に、特定の分子のクロマトグラフィプロファイルは固有であって、その分子の物理化学的特性を記述する。与えられた分子のクロマトグラフィ・ピーク・プロファイルを特徴付けるために随意的に使用されるパラメータは、その一部を挙げるだけでも、初期検出時間(離昇)、正規化勾配、ピーク頂点の時間に対する変曲点の時間、最大応答時間(ピーク頂点)、変曲点の、半値全幅(FWHM)の、ピーク幅、ピーク形状対称、および最終検出(接地)、を含む。
【0078】
図2Bは、本発明の一実施形態による、前駆体の溶離ピークを含む期間の質量スペクトルの一群を示す、3つの関連するグラフを示す。第一のグラフ254は、低エネルギースペクトル(すなわち、「MS」で標識された、断片化されていない前駆体からのスペクトル)および高エネルギースペクトル(すなわち、「MSE」で標識された生成物イオンである、断片化前駆体からのスペクトル)の溶離時間にわたる、交互の群を示す。第二および第三のグラフ254A、254Bはそれぞれ、MSおよびMSEスペクトル収集時間および前駆体に関連づけられた保持時間ピークの復元を示す。
【0079】
復元されたピークは、単一の前駆体のクロマトグラフィ溶離プロファイルを表す。横軸は、ピークプロファイルの溶離時間に対応する。縦軸は、クロマトグラフィカラムから溶離するときの前駆体の時間変動濃度に関連づけられた強度の任意の単位に対応する。
【0080】
質量分析計に送られると、溶離前駆体は、このように、低および高エネルギーモードにおいてイオンを生成する。低エネルギーモードで生成されたイオンは第一に、可能であれば異なる同位体および電荷状態における、前駆体イオンのものである。プロテオミクスの研究において、前駆体イオンは、無傷のタンパク質の酵素消化(通常はトリプシン消化)から生成されたペプチドである。高エネルギーモードでは、イオンは第一に、断片の異なる同位体および電荷状態、またはこれら前駆体の生成物イオンである。高エネルギーモードは、上昇エネルギーモードとも称される。
【0081】
グラフ254において、交互の白黒の棒はこのように、溶離クロマトグラフィピークの低および高エネルギー電圧でスペクトルが収集された時間を表す。低エネルギーグラフ254Aは、低エネルギー電圧が衝突セル218に印加された時間を示し、その結果、低エネルギースペクトルとなっている。高エネルギーグラフ254Bは、高エネルギー電圧が衝突セル218に印加された時間を示し、その結果、高エネルギースペクトルとなっている。
【0082】
前駆体のクロマトグラフィピークはこのように、高および低エネルギーモードによって、複数回抽出される。これらの複数のサンプルから、ピークに関連づけられて高および低エネルギースペクトルで見られる全てのイオンの正確な保持時間が推測される。これらの正確な保持時間は、それぞれのスペクトルから抽出された強度の補間によって取得される。
【0083】
以下に記載されるパラグラフおよび図面において、複数の注入からのスペクトルを組み合わせるために使用されてもよい、本明細書に記載される技術が参照される。このように、一実施形態は、出力スペクトルが複数の注入からの入力スペクトルを組み合わせた結果を表す、本明細書に記載される技術をもって実行される処理の結果として、出力スペクトルを生成してもよい。
【0084】
図3を参照すると、図1に示される方法を実行した結果として得られ得る入力データ集合306に対して一実施形態で実行されてもよい処理のブロック図が示されている。例300は、入力データ集合処理310に入力される、入力データ集合306およびセレクタ302を含む。処理310は、出力データ集合308を生成する。本明細書により詳細に記載される一実施形態において、入力データ集合306は、セレクタ302の値に応じた様々な異なる保持時間一致および生成物イオン選択技術から選択されたものを使用して後に処理される、1つ以上の注入のLC/MSシステムを使用して得られた、前駆体および生成物イオンデータを含んでもよい。一実施形態は、出力データ集合308を生成するための1つ以上のこのような技術を含んでもよい。1つ以上のこのような技術を含む一実施形態において、セレクタ302の値は、入力データ集合306を処理するために使用されてもよい異なる技術のうちのいずれかを選択するために、指定されてもよい。処理310は、出力データ集合308によって表されるように、前駆体および生成物イオンデータの複数のスペクトルを減少または組み合わせて1つの前駆体および生成物イオンスペクトルにするために選択された技術にしたがって、異なる規則または基準を使用してもよい。その結果、出力データ集合308は、本明細書の別の箇所により詳細に記載されるように、単一の前駆体に関連すると判断されたこれらの生成物イオンを同定する。
【0085】
以下に記載されるのは、一実施形態に含まれ、前駆体の保持時間一致の実行および入力データ集合に含まれる関連生成物イオンの選択に関連して使用されて得る技術である。第一の保持時間一致および生成物イオン選択技術は、本明細書では「Supertrack」と称されてもよく、これは2006年12月14日に公開された、Gorensteinらによる、国際公開第2006/133191号パンフレット、米国特許出願公開第2006/021919号明細書(‘919 PCT公開)、METHODS AND APPARATUS FOR PERFORMING RETENTION−TIME MATCHING に記載されており、これは参照により本明細書に組み込まれる。Supertrackの一実施形態において、与えられた前駆体の出力データ集合は、ある生成物イオンが入力データ集合の2つ以上の追跡スペクトルに含まれる場合、その生成物イオンを含む。追跡スペクトルとは、選択された対象となる前駆体を含むと判断されたスペクトルを指す。複数の注入および対応するスペクトルにおいて同じ前駆体を追跡するための異なる技術は、本明細書の別の箇所に記載されている。
【0086】
第二の保持時間一致および生成物イオン選択技術は、本明細書では「Sumtrack」と称されてもよく、これは、与えられた前駆体について、生成物イオンが入力データ集合の少なくとも1つの追跡スペクトルに含まれている場合に出力データ集合がその生成物イオンを含むように、和集合演算、またはその実行における論理的な同等処理を実行してもよい。第三の保持時間一致および生成物イオン選択技術は、本明細書では「Hitrack」と称されてもよく、これは、与えられた前駆体について、出力データ集合が、その前駆体が最大強度を有する入力データ集合のスペクトルに関連付けられた生成物イオンスペクトルを含むことを判断する。入力データ集合が3つのスペクトルを含み、その各々が異なる注入のものであって同じ前駆体が3つの全てのスペクトルで追跡される実施形態において、Hitrackは、その前駆体が最も強力な入力データ集合から、3つの追跡スペクトルの前駆体および生成物イオンスペクトルを選択する。前駆体と一致した保持時間である選択されたスペクトルにおける生成物イオンは、出力データ集合に含まれる。第四の保持時間一致および生成物イオン選択技術は、本明細書では「Mergetrack」と称されてもよく、これは、SumtrackおよびHitrackに関連づけられた処理の組合せを使用するものとして特徴付けられてもよい。先の最後の3つの技術の実施形態は、以下のパラグラフにより詳細に記載される。1つの実施形態は、いずれかの組合せにおいてこれらの技術のうちいずれか1つ以上を含んでもよい。
【0087】
以下のパラグラフにおいて、Sumtrackの実施形態が最初に記載され、MergetrackおよびHitrack技術の例示的実施形態がその後に続く。当業者によって理解されるように、前駆体および生成物イオンの間の保持時間一致およびSumtrackに関連して述べられたように異なる注入にわたって前駆体イオンを追跡することに関する一般的な議論は、入力データ集合に異なる規則を適用することと組み合わせて、保持時間一致および生成物イオン選択を実行するその他の技術を使用することにも、適用可能である。
【0088】
本明細書に記載される保持時間および生成物イオン選択技術の各々は、どの生成物イオンが前駆体に関連しているかを判断するための生成物イオン選択基準の集合を使用する。基準は、前駆体に関連すると判断された生成物イオンの選択に関連して使用される規則を特定する。全ての技術は、前駆体および生成物イオンの間の保持時間一致を実行する。特定の技術によって異なる追加基準が使用されてもよい。Sumtrack技術の実施形態は、処理を実行して、生成物イオンが少なくとも1つのスペクトルにおいて前駆体と一致する保持時間を有する場合に、生成物イオンがその前駆体と関連があると判断する。Sumtrack技術の実施形態は、上記に関連して、和集合演算、またはその同等処理を使用してもよい。Hitrack技術の実施形態は、被追跡前駆体強度がその被追跡前駆体を含む全スペクトルの中で最大である被追跡前駆体を含むスペクトルの選択を実行してもよい。Hitrack技術の実施形態に関連して、前駆体と一致する保持時間を有する選択されたスペクトル中の各生成物イオンは、その前駆体に関連すると判断される。Mergetrack技術の第一の実施形態は、前駆体に関連する生成物イオンの集合の判断において、Hitrack技術の基準を使用してもよい。Mergetrack技術の第二の実施形態は、前駆体に関連する生成物イオンの集合の判断において、Sumtrack技術およびHitrack技術の両方の基準を使用してもよい。本明細書に記載されるMergetrack技術の第一および第二の実施形態の結果、ある前駆体について同じ生成物イオンおよび対応する強度が選択されることに留意されたい。しかし、両方の実施形態は、その前駆体の関連生成物イオンの上記選択を行うために、異なる処理を実行する。
【0089】
本明細書に記載されるように、前駆体は、複数の注入にわたって追跡されてもよい。前駆体の質量および保持時間値にしたがって、複数の注入において同じ前駆体が同定されてもよい。前駆体の断片化の結果生成される生成物イオンは、前駆体と実質的に同じ保持時間を有することになる。このような生成物イオンは、その前駆体に関連するとして特徴付けられてもよい。複数の注入において、異なる生成物イオンが、同じ前駆体に関連するように見えるかもしれない。Sumtrackに関連して、和集合演算、またはその同等処理が、前駆体と実質的に同じ保持時間を有することによってその前駆体に関連する複数の注入にわたる全ての生成物イオンをまとめて判断するために、実行され得る。このように、Sumtrackでは、生成物イオンが1つ以上の注入において前駆体と実質的に同じ保持時間を有する場合に、その生成物イオンはその前駆体に関連する生成物イオンの集合に含まれる。前駆体に関連するこのような生成物イオンの各々について、強度和は、関連生成物イオンが現れる全ての注入にわたって関連生成物イオンの強度を加えることによって、判断されてもよい。
【0090】
複数の入力スペクトルからのデータが組み合わせられ得る、Sumtrackなどの本明細書に記載される技術に関連して、一実施形態が、出力スペクトルにおける生成物イオンの強度和を含み得ることに留意されたい。本明細書の別の箇所に記載されるように、2つの異なるスペクトル中の2つの生成物イオンは、両方の生成物イオンが与えられた質量公差の範囲内の質量値を有する場合に、同じ質量を有すると判断されてもよい。生成物イオンの強度和は、複数の入力スペクトル中の生成物イオンの各発生がある程度の質量公差範囲内の質量値を有する場合に、複数の入力スペクトルから取得された生成物イオンの強度追加の結果として、生成されてもよい。出力スペクトル中の生成物イオンの質量は、たとえば、それぞれの強度によって各入力スペクトルの生成物イオンの質量に重み付けすることによってなど、ある規則によって決定されてもよい。このように、一実施形態は、入力スペクトル中の生成物イオンの発生を(質量によって)特定し、その強度がそれら特定された発生の強度の和である出力スペクトル中の単一の生成物イオンとそのような発生を置き換え、出力スペクトル中の生成物イオンに質量値を割り当てることによって、強度和を有する生成物イオンを含む出力スペクトルを生成してもよい。
【0091】
一実施形態において、最大強度を有するこれらの生成物イオンが、同定、発見、および本明細書に記載されるような技術および当業者に知られている技術のその他の用途で使用されてもよいように、強度和は、関連生成物イオンの選択と関連して使用されてもよい。
【0092】
複数のタンパク質を含む複合タンパク質試料などの試料または混合物に関連して、多くの前駆体イオンは、同じ保持時間を有してもよい。前駆体イオンが断片化されると、断片化の結果生成された生成物イオンもまた、その前駆体と同じ保持時間を有することになる。同じ保持時間を有するであろう多数の前駆体イオンのため、異なる前駆体からの生成物イオンが、実質的に同じ保持時間を有する可能性がある。その結果、生成物イオンをそれぞれの正しい前駆体イオンと一致させることは難しいかも知れない。生成物イオンをその生成物イオンが由来する適切な前駆体イオンと一致させることには、本明細書に記載され、当業者にとって知られている多くの用途がある。
【0093】
LC/MSの文脈において、Sumtrackおよび本明細書に記載のその他の技術などの保持時間一致および生成物イオン選択技術は、これらの生成物イオンおよび同じ保持時間およびピーク形状を有してその生成物イオンが由来する関連前駆体イオンを発見する。本明細書に記載される技術は、生成物イオンと前駆体との関連性を提供し、生成物イオンおよび実質的に同じ測定保持時間を有する前駆体が、保持時間整合に基づいて出力スペクトルに含まれることを保証する。
【0094】
保持時間一致および生成物イオン選択を実行する技術は、単一試料と同様に、複合試料にも関連して使用されてよい。複合試料は、血清、組織、および細胞などの関連技術において知られている様々な異なる生物試料のいずれか1つと同様に、たとえばタンパク質混合物なども、含んでもよい。保持時間一致および生成物イオン選択技術はまた、単一ポリペプチドの単純な試料に関連して使用されてもよい。
【0095】
Sumtrackおよび本明細書に記載のその他の技術などの関連生成物イオンとの前駆体の保持時間一致の技術は、たとえば、タンパク質同定技術において使用されるポリペプチドプロファイルを生成するための、‘919PCT公開に記載されている技術に関連して、使用されてもよい。上述の‘919PCT公開に記載されているように、1つ以上のプロファイルが、試料中の1つ以上の関連するタンパク質のために定義されてもよい。タンパク質プロファイルは、タンパク質と関連する前駆体イオンの保持時間、イオン質量、およびイオン強度に関する値によって定義される。随意的に、タンパク質のプロファイルはまた、タンパク質の同定によって定義されてもよい。いくつかの好適な実施形態は、プロファイル中に生成物イオンデータを含む。このように、タンパク質のプロファイルは、タンパク質の前駆体に関連づけられる生成物イオンの保持時間、イオン質量、およびイオン強度に関連する値によっても定義されてよい。プロファイルは、後に分析される対象試料中のタンパク質を検出、同定、および/または定量化する際に後に使用するために、プロファイルのカタログに記憶されてもよい。随意的に、プロファイルは、対応する掲載タンパク質に関連する前駆体イオンの保持時間、イオン質量、およびイオン強度に関連する値でデータベースに掲載されたタンパク質に注釈をつけることによって、既存のタンパク質データベースにおいて定義される。
【0096】
本明細書に記載されるようなタンパク質のためのプロファイルに関連して、そのタンパク質について最も強力な前駆体と判断された前駆体イオンの集合が、タンパク質を同定するために使用されてもよい。プロファイルは、そのタンパク質が他のタンパク質から区別され得るように、十分な特異性までタンパク質を検出、同定、追跡、および/または定量化するために、使用されてもよい。プロファイルはまた、最も強力な前駆体の各々に関する付加的情報を含んでもよい。付加的情報は、たとえば、各前駆体に関連づけられる1つ以上の生成物イオン、および1つ以上の生成物イオンの各々に関するデータ(たとえば保持時間、強度、および/または質量あるいはm/zなど)を含んでもよい。保持時間一致および生成物イオン選択技術は、プロファイル中に含まれる最も強力な前駆体に関連付けられる生成物イオンを同定するために、使用されてもよい。最も強力な前駆体イオンの質量、および十分な数のその生成物イオンの質量などの、プロファイルからの情報は、タンパク質の配列を高い信頼性で、同定することができる。
【0097】
以下のパラグラフに記載される、Sumtrackおよびその他の技術など、本明細書に記載される技術は、ペプチドおよびタンパク質を検出、同定、追跡、および/または定量化するために使用されてもよく、プロテオミクスにおける問題を解決するかも知れない。本明細書に記載される技術はまた、生物学的ではないとして特徴付けられる可能性のある試料および混合物と関連して、使用されてもよい。プロテオミクス用途に関連して、ペプチドは、試料タンパク質の酵素消化に起因してもよい。ペプチド前駆体の確実な同定は、試料タンパク質の同定および定量化を可能にする。
【0098】
本明細書に記載される保持時間一致および生成物イオン選択技術は、生成物イオンと前駆体との誤った一致を補償するために、統計的方法などのその他の方法論を使用せずに決定論的なやり方で、確実に生成物イオンを前駆体に割り当てまたは一致させるために、使用されてもよい。本明細書に記載される技術を利用して同定された前駆体および関連生成物イオンは、データベースのみに、あるいは既存のデータストアに注釈を付けるときなどにその他のデータに関連づけられて、記憶されてもよい。データストアは、データを記憶するために使用される、様々な異なるデータ格納庫のいずれか1つとして特徴付けられてもよい。その例としては、データベース、1つ以上のファイル、ディレクトリ、などを含むが、これらに限定されない。本明細書に記載されるようなタンパク質プロファイルを含むカタログは、上記のいずれか1つ以上を使用して実現されてもよい。
【0099】
本明細書に記載される説明的な例は、Bateman(参照により本明細書に組み込まれる、米国特許第6,717,130号明細書)に記載される上述の技術を使用して分析されたタンパク質消化を使用する用途を参照してもよい、一実施形態は、たとえば、選択された前駆体イオンを単離し、選択された単離前駆体のために生成物イオンを同定するために使用される、データ依存分析または取得(DDA)などの、関連技術において知られているその他の方法論を使用して、主に図1に示されるようなデータ集合を生成してもよい。一実施形態において、質量分析計は、質量分析計が衝突セルおよび四重極を含むDDAを実行するために使用されてもよい。DDA技術にしたがって操作する際に、四重極は、第一段階において、対象の前駆体のみを選択的に単離および選択するためのフィルタとして使用される。このように、選択された前駆体のみが、第一フィルタリング段階の出力として生成される。選択された前駆体はその後、衝突セルに送られ、そこで十分に高い電圧を利用して、断片または生成物イオンを生成して、単離された前駆体および生成物イオンの所望の数の走査を取得するために、断片化される。上述のDDA技術は、異なる前駆体を単離して、前駆体および関連生成物イオンの所望の数の走査を取得するために、繰り返されてもよい。
【0100】
本明細書に記載される保持時間一致および生成物イオン選択技術のいずれかに関連して、一実施形態は、様々な異なる技術を利用して、対象とする特性の前駆体の質量を決定してもよい。たとえば、本明細書の別の箇所に記載されるBateman技術を利用する一実施形態において、1つ以上の前駆体イオンを含むスペクトルを生成するために、低エネルギー(LE)サイクルまたはモードが使用されてもよい。DDA技術など、入力データ集合を生成するために使用されるその他の技術もまた、前駆体を単離してその固有の質量を決定するために、使用されてもよい。選択された前駆体および関連する質量は、その後入力データ集合において同定されてもよい。
【0101】
本明細書に記載される技術を使用する一実施形態において、質量分析計を使用する異なる実験から生成された質量スペクトルが、比較されてもよい。本明細書に記載される保持時間一致および生成物イオン選択技術は、入力データ集合に質量スペクトルを含んでもよく、以下のパラグラフでより詳細に説明される和集合演算を使用して、前述の質量スペクトルの前駆体および関連生成物に関する情報を組み合わせてもよい。質量スペクトルは、複数の前駆体のデータを含んでもよい。図解および説明の簡素化のため、質量スペクトルが、前駆体と実質的に同じ測定保持時間およびピーク形状を有する単一の前駆体および生成物イオンに関するデータを含み得る例が、本明細書に記載される。しかし、生成物イオンは、異なる質量またはm/z値を有する。異なるスペクトルの各々における単一の前駆体およびその関連生成物イオンの保持時間は、可能性のある測定誤差によって被る誤差の予想される保持時間枠の範囲内であってもよい。一実施形態において、誤差の枠は、半値全幅(FWHM)方法論を使用して決定された前駆体の保持時間のピーク幅の1/10の閾値の範囲内であってもよい。関連技術において知られているように、FWHMは、曲線がその最大値の半分に到達する、クロマトグラフィピークの両側の2つの点の間の距離として決定される。一実施形態はまた、一実施形態において利用されるシステムおよび方法論の予想される誤差に応じて、予想される誤差の上記枠として、その他の値を使用してもよい。
【0102】
データ集合に含まれる質量スペクトルは、各々が保持時間公差枠(以下のパラグラフにより詳細に記載されるとおり)の範囲内の保持時間を有する、複数の注入の前駆体を含んでもよい。質量スペクトルの各々はその後、単一の保持時間にしたがって、整合または正規化されてもよい。たとえば、データ集合中の質量スペクトルは、別の質量スペクトル中の前駆体のいくつかのクロマトグラフィFWHMの保持時間を備える前駆体を有するこれらの質量スペクトルを含んでもよい。データ集合中のスペクトルの各々はその後、「n」などの、単一の保持時間において整合されてもよい。整合処理において、スペクトル中の各前駆体イオンは、保持時間「n」で前駆体を整合するために、ある量だけ、ある方向に、移動させられる。さらに、スペクトルの生成物イオンもまた、スペクトル中の前駆体の移動に応じて、同じ量だけ、および同じ方向に、移動させられる。上述の整合は、各スペクトルに対して繰り返される。整合の後、各スペクトルが調べられてもよい。スペクトル中の生成物イオンが、クロマトグラフィピーク幅の1/10の前駆体保持時間「n」に対する誤差の枠内(たとえば、該イオンに関するクロマトグラフィピークのクロマトグラフィFWMHの「n」±1/10)に収まる保持時間を有する場合、その生成物イオンもまた前駆体と同じ保持時間「n」を有すると判断され、その前駆体と一致する。対照的に、生成物イオンの保持時間が誤差の枠外である場合、その生成物イオンは、その特定のスペクトル中のその前駆体とは一致しないと判断される。一旦全てのスペクトルが処理されると、本明細書に記載される1つ以上の異なる保持時間一致および生成物イオン選択技術に関する規則が適用されてもよい。
【0103】
本明細書に記載される保持時間一致および生成物イオン選択技術とともに使用されるデータ集合は、様々な異なる技術を使用して生成される、MSスペクトルなどのスペクトルを含んでもよい。たとえば、スペクトルは、Batemanの技術またはDDA技術を使用する複合混合物のLC/MS分析を使用して、取得されてもよい。データ集合はまた、MALDI−MS−MSから、および高または低分解能の分析計を使用して、取得されてもよい。
【0104】
保持時間一致および生成物イオン選択技術に関連して使用されるデータ集合に含まれる生成物イオンは、関連技術において知られている様々な異なる方法論を利用して生成されてもよい。生成物イオンは、様々な異なる断片化技術のいずれか1つを利用して生成されてもよい。一実施形態は、ペプチド混合物の単一注入のLC/MS分析の一部として適用される高および低エネルギー切り替え手順を使用して、Batemanに記載される質量分析(MS)方法論を使用してもよい。そのようなデータにおいて、低エネルギー(LE)スペクトルは、主に断片化されていない前駆体からのイオンを含み、その一方で高エネルギー(HE)スペクトルは、主に断片化された前駆体または生成物イオンからのイオンを含む。
【0105】
本明細書に記載される保持時間一致および生成物イオン選択技術が適用されるデータ集合中の各スペクトルは、単一の分析または実験から取得されてもよい。たとえば、LC/MS分析の文脈において、入力データ集合に含まれるM個のスペクトルの各々は、M個の異なる注入から取得されてもよい。これらM個の注入は、同じアリコート(たとえば、複製注入)のM個の注入からのものであってもよい。あるいは、M個の注入の各々は、異なる試料混合物を使用してもよい。一実施形態はまた、ある程度の数の異なる試料混合物のある程度の数の複製注入からスペクトルが生成されているデータ集合を使用してもよい。
【0106】
LC/MSの文脈において、保持時間一致および生成物イオン選択技術は、生成物イオン、および同じ保持時間およびピーク形状を有する生成物イオンがそこに由来する関連前駆体イオンを見出す。本明細書に記載される全ての保持時間一致および生成物イオン選択技術は、生成物イオンと前駆体との関連性を提供し、実質的に同じ測定保持時間を有する生成物イオンおよび前駆体が、その前駆体に対する保持時間整合に基づく出力スペクトルに含まれることを確実にする。
【0107】
本明細書の保持時間一致および生成物イオン選択技術は、生成物イオンが由来する前駆体イオンとの密接な関連性をその生成物イオンが維持するという原理に基づいている。この関連性は、実質的に同じ測定保持時間で現れる生成物イオンおよび前駆体イオンの両方によって、示されてもよい。保持一致技術は、選択された前駆体と無関係のイオンは入力データ集合で分析されたスペクトルのために上述の関連を維持しないということを利用している。
【0108】
本明細書の技術のいずれかに関連して、異なる注入における2つの前駆体イオンは、その質量が所定の公差枠内にあって、いずれもある程度の保持時間公差範囲内となる保持時間を有する場合、異なる注入における同じ前駆体の事例であると判断されてもよい。異なる注入に現れて所定の質量公差枠内の質量を有する2つの生成物イオンは、同じ生成物イオンの事例であると判断されてもよい。第一のイオンの第一質量が第二のイオンの第二質量の所定の質量公差の範囲内にあるとき、2つのイオンは同じ質量を有すると見なされてもよい。この質量公差は、生成物イオンと同様に前駆体イオンに関連して本明細書に記載される技術とともに使用されてもよい。一実施形態において、質量公差は、百万分率(PPM)で表記される質量スペクトルに含まれ得るように、質量スペクトルピークのFWHMの±1/10であってもよい。その他の質量公差が、実施形態に関連して使用されてもよく、実施形態ごとに異なってもよい。
【0109】
前駆体および生成物イオンは、各々が本明細書の別の箇所に記載される誤差枠サイズまたは保持時間枠に応じて決定される同じ保持時間を有する場合、関連していると見なされる。一実施形態において、前駆体と生成物イオンとの一致に関連して使用される誤差枠サイズまたは保持時間枠は、質量スペクトルピークのクロマトグラフィFWHMと、または入力データ集合においてスペクトルを取得するために使用されるMS機器などの機器の分解能に関連するその他の公差と、関連づけられてもよい。
【0110】
Sumtrackなどの、本明細書に記載される保持時間一致および生成物イオン選択技術の1つを使用した結果として、前駆体イオンに関連すると見なされるこれらの生成物イオンを含む出力スペクトルが生成されてもよい。
【0111】
本明細書に記載される技術は、たった2つの入力スペクトルを含む入力データ集合を利用してもよい。入力スペクトルの各々は、対象の前駆体、および対象の前駆体に関連づけられるわずか1つの生成物イオンを含んでもよい。本明細書の技術のうちの1つを実行した結果として対象の前駆体に関連すると判断された各生成物イオンに定められた強度和は、関連生成物イオンをさらに順位付けし、関連強度または各生成物イオンがその前駆体にどの程度確実に関連しているかを判断するために、使用されてもよい。一実施形態において、生成物イオンの強度和が大きいほど、生成物イオンは前駆体により関連している。
【0112】
スペクトルに加えて、本明細書の技術に関連して使用される入力データ集合も、イオンリストにイオンを含んでもよい。イオンリストは、たとえば、LC/MSまたはその他の実験および処理方法論を利用して得られ得るような、三次元データから、取得されてもよい。イオンリストに含まれる各イオンは、イオンの保持時間、質量またはm/z、および/または強度によって注釈が付けられてもよい。三次元データが利用されるような事例では、スペクトルは、たとえば、参照により本明細書に組み込まれる、2004年11月16日出願の、Plumbらによる、米国特許出願公開第2005/0127287号明細書の「METHOD OF USING DATA BINNING IN THE ANALYSIS OF CHROMATOGRAPHY/SPECTROMETRY DATA」、または参照により本明細書に組み込まれる、Gorensteinらによる、2005年9月1日公開のPCT国際公開第2005/079263号パンフレット、PCT特許出願PCT US2005/004180号明細書、APPARATUS AND METHOD FOR IDENTIFYING PEAKS IN LIQUID CHROMATOGRAPHY/MASS SPECTROMETRY DATA AND FOR FORMING SPECTRA AND CHROMATOGRAMS に記載されるような、保持時間ビニングを使用して、取得されてもよい。
【0113】
本明細書に記載の技術に関連して、1つの注入において同じ保持時間を有する複数の前駆体は、たとえばBateman技術を利用して決定され得るような、複製条件の下であっても、別の注入においてはわずかに異なる保持時間を有することが見出される。したがって、複数の前駆体に関連づけられる生成物イオンは、第一注入において単一の保持時間を有するかも知れず、複数の前駆体は、別の注入においてわずかではあるが測定可能な程度に異なる保持時間を有するかも知れない。その結果、第一注入において第一保持時間を有するであろう生成物イオンは、複製条件の下であっても、その後に続く注入において、わずかに異なる保持時間を有するかも知れない。本明細書に記載の技術は、前駆体と生成物イオンとの間の測定保持時間の差が、誤差または閾値の所定の保持時間枠内である限り、その生成物イオンはその前駆体に関連づけられるということを有利に利用している。
【0114】
本明細書に記載の技術が入力データ集合またはスペクトルの範囲内のスペクトルピークの質量値を比較するということに留意されたい。前駆体および/または生成物イオンの質量値またはm/z値に関する予備知識は必要とされない。さらに、本明細書に記載の技術は、データベースまたはカタログにさらなる注釈を付けるために使用されてもよいが、与えられたタンパク質の配列の予備知識は、試料に対して本明細書に記載の技術を利用するために必要とされない。
【0115】
Sumtrackに関連して、一実施形態は、複数の注入にわたって追跡された前駆体との一致相手であると判定された全ての生成物イオンに関して、和集合演算、またはその同等処理を使用してもよい。このように、生成物イオンが、対応するスペクトルを有する少なくとも1つの注入において前駆体保持時間「n」に関する一致相手であると判定された場合、その生成物イオンは和演算とともに形成される結果的な集合に含まれる。したがって、前駆体および関連生成物イオンの保持時間一致は、決定論的な、信頼できる方法で実行されてもよい。その結果形成される集合は、前駆体、および入力データ集合の質量スペクトルからの全ての識別された関連(たとえば一致する)生成物イオンを含む、出力スペクトルに含まれてもよい。
【0116】
和集合演算、またはその同等処理を使用する保持時間一致のSumtrack技術の実施形態は、M個のスペクトルの各々が同じ前駆体およびその前駆体に関連する1つ以上の生成物イオンの集合を含む、M個のスペクトルに適用されてもよい(たとえば、同じスペクトルにおける生成物イオンおよび前駆体は、誤差の保持時間枠の範囲内である)。前駆体はM個のスペクトルにわたって追跡されてもよく、1つのスペクトルにおける前駆体は、別の箇所により詳細に記載されるように、1つ以上の基準(たとえば、実質的に同じ保持時間、質量など)に従って、別のスペクトル中の前駆体との一致相手(たとえば、同じもの)であると判断されてもよい。生成物イオンは、M個のスペクトルのうちいずれか1つ以上に出現して、前駆体の保持時間に関する誤差の保持時間枠の範囲内である場合、出力スペクトルに含まれてもよい。このように、出力スペクトルは、M個のスペクトルにわたって前駆体に関連づけられる全ての生成物イオンの和集合を含む。さらに、強度和は、各生成物イオンに関連づけられてもよい。生成物イオンの強度和は、M個のスペクトルにわたる生成物イオンの強度を加算することによって決定されてもよい。強度は、生成物イオンが含まれ、前駆体に関連すると判断された、M個のスペクトルの各々に対して取得され、そのような全ての強度は、生成物イオンの強度和を算出するために合計される。本明細書の別の箇所に注記されているように、異なるスペクトル中の2つの生成物イオンは、両方とも指定された質量公差範囲内の同じ質量を有する場合には、同じ生成物イオンであると見なされてもよい。
【0117】
入力データ集合の複数の注入にわたる前駆体および生成物イオンの一致について記載されたSumtrackの実施形態は、様々な異なる領域に適用されてもよく、様々な異なる方法論と結びつけて使用されてもよい。たとえば、これらの技術は、プロテオミクスおよび小分子研究において使用されてもよい。これらの技術は、試料の複製注入、ならびに、注釈付ペプチドカタログおよびペプチドプロファイルに含まれるものなど、データベース中のこのような情報の記憶装置の中で、前駆体および関連生成物イオンを検出するために使用されてもよい。このような記憶された情報は、未知の試料の特性に対する比較のために、データストアから抽出されてもよい。このような記憶された情報は、未知の試料を検出、同定、および/または定量化するために使用されてもよい。上述の使用はまた、本明細書に記載されるその他の保持時間一致および生成物イオン選択技術にも適用可能である。
【0118】
Sumtrackを使用して、和集合演算は、複数の注入にわたる前駆体に関連づけられる生成物イオンに適用されてもよく、その結果得られるそのような生成物イオンの和集合は、その前駆体に関連すると判断されてもよい。このように、Sumtrackの使用は、保持時間一致および生成物イオン選択のその他の上述の技術と同様に、関連する生成物イオンの前駆体に対して関連していないものからの分離を提供する。Sumtrackで、和集合の中のそのような各生成物イオンのために、複数の注入にわたる前駆体と関連する生成物イオンの強度を加算することによって、強度和が決定されてもよい。強度和はまた、同様に複数の注入にわたる前駆体の強度を加算することによって、前駆体のために決定されてもよい。
【0119】
本明細書に記載の技術の結果として生成された出力は、スペクトルの形態であってもよい。Sumtrackでは、出力スペクトルは、前駆体、および複数の注入にわたる生成物イオンの和集合を決定した結果として含まれる1つ以上の関連生成物イオンを含んでもよい。その結果生じる出力スペクトルは、未知のペプチド、追跡保持時間などを同定するための検索に関連して、記憶、表示、使用されてもよい。
【0120】
ここで図4および図5を参照すると、Sumtrackを使用して前駆体の保持時間一致およびその関連生成物イオンの選択の実行に関連する一実施形態において使用され得る、処理ステップのフローチャートが示されている。図4および図5のステップは、すぐ上に記載された処理をまとめたものである。
【0121】
ステップ1002において、入力データ集合が取得される。入力データ集合は、複数の注入からのデータを含んでもよく、図解のためフローチャート1000および1050のステップにスペクトルが含まれているが、イオンリストおよびスペクトルを含む様々な異なる形態のいずれか1つ以上であってもよい。図4および図5に関連して使用される入力データ集合は、入力データ集合の各スペクトルが同じ前駆体を含むように、被追跡前駆体のスペクトルを含む。図4および図5の処理ステップに関連して使用される入力データ集合は、前駆体を選択し、元データ集合のどのスペクトルが選択された前駆体を含むかを判断することによって、元データ集合から生成される。一実施形態はあるいは、この特定の実施形態に示されるのとは異なる処理点において、どのスペクトルが選択された前駆体を含むかを判断してもよい。複数の注入の間での前駆体の追跡は、参照により本明細書に含まれる、2005年9月1日出願のGorensteinらによる、国際公開第2005/079261号パンフレット、米国特許出願公開第2005/004176号明細書、「SYSTEM AND METHOD FOR TRACKING AND QUANTITATING CHEMICAL ENTRIES」に記載された技術を使用して実行されてもよく、ここで、異なる注入の第一および第二前駆体は、第一前駆体の質量が第二前駆体の質量の特定の質量公差の範囲内である場合、および第一前駆体の保持時間が第二前駆体の第二閾値または枠の範囲内である場合に、同じであると判断される。これは、本明細書の別の箇所に、より詳細に記載される。
【0122】
ステップ1004において、入力データ集合のスペクトルが選択される。ステップ1004で選択されたスペクトルは、基準スペクトルと称されてもよい。基準スペクトルを取得する際に使用された注入は、本明細書において、基準注入と称されてもよい。基準スペクトルにおいて第一保持時間を有する前駆体が決定される。一実施形態において、1つ以上の前駆体が、最大の質量および強度を有するこれらのイオンとして決定されてもよい。フローチャート1000および1050に関連する図解目的のため、1つの前駆体のみが入力データ集合の各スペクトルに含まれるものとする。本明細書に記載されるように、選択された対象の前駆体の質量を決定するために、Bateman技術に関連してなど、異なる方法論が使用されてもよい。Bateman技術を参照すると、前駆体の質量は、LE走査を使用して生成された結果的なスペクトルを観察することによって、決定されてもよい。
【0123】
基準スペクトルにおいて、前駆体の保持時間に対して保持時間枠内の保持時間を有する生成物イオンは、前駆体に関連する生成物イオンとして特徴付けられてもよい。関連生成物イオンおよび関連する強度は、ステップ1004の一部として記録されてもよい。本明細書に記載される技術を使用して、複数のスペクトルにわたって追跡される前駆体のために、上記が実行される。以下により詳細に記載されるように、被追跡前駆体を含む単一のスペクトルは、ステップ1006、1010、1012、1014、および1020において形成されるループの繰り返しによって処理される。1つ以上のスペクトルの前駆体に関連すると判断された全ての生成物イオンはその後、続く処理ステップにおいて、和集合演算を利用するなどして、組み合わせられる。生成物イオンの結果的な集合は、前駆体イオンと一致または関連すると判断される。
【0124】
基準注入の前駆体と同じ保持時間で発生する基準注入の生成物イオンを判定するときのステップ1004に関連して、前駆体の保持時間の保持時間枠または誤差枠の範囲内で発生する全ての生成物イオンが、考慮される。たとえば、前駆体は、基準注入において保持時間T1を有してもよい。第一生成物イオンは、T1およびT1±保持時間枠の範囲内に収まる保持時間を有してもよい。第一生成物イオンは、和集合に含まれ、前駆体に関連づけられる生成物イオンであると考えられる。第一生成物イオンがT1±保持時間枠の範囲外の測定保持時間を有する場合には、第一生成物イオンはその注入の前駆体に関連するとは見なされない。上述の保持時間枠はまた、標的注入における生成物イオンと前駆体との一致に関連して先に記載されたように、図4で形成されたループの各繰り返しのその後の処理ステップにおいて使用される。標的注入とは、基準注入以外の入力データの注入を指す。標的注入は、一番上の検査ステップ1006を備えて形成されるループの中のフローチャート1000において処理される残りのスペクトルを生成する際に、使用されてもよい。
【0125】
ステップ1006において、被追跡スペクトルを含む入力データ集合中の全てのスペクトルが処理されたか否かについて、判断がなされる。いいえの場合、制御は、可変の現在のスペクトルが入力データ集合中の次のスペクトルに割り当てられるステップ1010に進む。ステップ1012において、現在のスペクトルの前駆体および生成物イオンが決定される。現在のスペクトルでは、基準スペクトルの前駆体と同じ質量および保持時間(第二閾値または保持時間公差を表す枠の範囲内)を有するイオンが検索される。基準スペクトル中に存在する1つ以上の生成物イオンが現在のスペクトルにも出現してよいことに留意されたい。基準スペクトルおよび現在のスペクトルのうち1つのみに存在する生成物イオンもあってもよい。
【0126】
一実施形態は、基準および標的注入において前駆体を追跡するための処理であるステップ1012および1002においてなど、標的注入において特定の質量を有する前駆体を検索する際に使用される時間の枠を表す、上述の第二閾値または枠を利用してもよい。たとえば、保持時間T1において質量m1を有する前駆体が、基準注入において決定されてもよい。これに続く標的注入のため、処理は、同じ質量m1およびT1±第二閾値または枠の保持時間を有するイオンを検索する。第二閾値または枠は、実験的に決定されてもよく、実施形態に応じて異なってもよい。たとえば、一実施形態は、初期値を2〜3個のクロマトグラフィピーク幅に基づくなどして、第二閾値に割り当ててもよい。第二閾値は、システムの経験的実験にしたがって、変更または改善されてもよい。たとえば、一実施形態が大量の誤差またはノイズを生じさせるシステムまたは方法論を利用する場合、第二閾値または枠は増加されてもよい。
【0127】
ステップ1012の処理に関連して、現在のスペクトルの前駆体が、ある質量であると特定され、同じ質量を有するステップ1004の基準スペクトルの前駆体と一致することにもまた留意されたい。基準スペクトル中の前駆体の第一質量は、第一質量が第二質量の指定された質量公差の範囲内にある場合、現在のスペクトルの前駆体の第二質量と同じ質量であると見なされてもよい。説明の簡素化のために示される例示的実施形態において、処理された各スペクトルは、単一の前駆体が同定されたら残りのイオンが生成物イオンとして同定されてもいいように、対象の前駆体を1つしか含まない。
【0128】
ステップ1014において、現在のスペクトルの前駆体は、基準スペクトルの前駆体と時間的に整合していてもよく、現在のスペクトルの全ての生成物イオンは、適切におよびしかるべく、時間移動させられる。たとえば、基準スペクトル中の前駆体の保持時間が10.0分であって、現在のスペクトル中の前駆体の保持時間が9.8分である場合、現在のスペクトルの前駆体および生成物イオンは、+0.2分移動させられる。一旦移動が完了すると、制御は、予想される保持時間枠内にある、現在のスペクトル中の生成物イオンが決定されるステップ1020に進む。ステップ1020において、保持時間枠内の特定の生成物イオンは、後の処理ステップでの使用のために記録されてもよい。さらに、保持時間枠内の現在のスペクトルの各生成物イオンの強度(たとえば、現在のスペクトルの前駆体に関連)が、強度和を決定する際の後の処理ステップに関連して使用されるために、記録される。制御はその後、ステップ1020からステップ1006に進む。
【0129】
ステップ1006での判断が「はい」の場合、制御はステップ1051に進む。ステップ1051において、所定の質量公差枠に応じた固有の生成物イオンのリストが決定される。ステップ1020で決定されたような入力データ集合の基準スペクトルおよびその後のスペクトルに含まれる生成物イオンが調べられる。第一質量を有する1つのスペクトル中の第一生成物イオンは、第一質量および第二質量が所定の質量公差枠の範囲内である場合に、第二スペクトル中の別の生成物イオンと同じ質量を有すると見なされてもよい。本明細書に記載の技術に関連して、第一および第二生成物イオンは、2つの異なるスペクトル中の同じ生成物イオンであると見なされてもよい。ステップ1051から、制御はステップ1052に進む。ステップ1051において判定された各生成物イオンのため、それぞれ関連生成物イオンが含まれる入力データ集合中の1つ以上のスペクトルに対して、生成物イオンの1つ以上の強度を加算することによって、全体の強度和が決定される。一実施形態はまた、前駆体の強度和を決定するために、入力データ集合のスペクトルにわたる前駆体の強度を加算してもよいことに留意されたい。
【0130】
本明細書に記載される技術にしたがって、ステップ1051の結果として、前駆体と実質的に同じ保持時間を有する全ての生成物イオンの集合(たとえば、誤差の保持時間枠内)が、入力データ集合にわたって、決定される。生成物イオンが入力データ集合中の少なくとも1つのスペクトルのための前駆体の保持時間枠の範囲内にある場合に、生成物イオンがその前駆体に関連すると判断されるように、生成物イオンは、和集合演算、またはその同等処理を実行することによって、この集合に含まれる。制御は、出力スペクトルを生成するためのステップ1064に進む。本明細書の別の箇所に記載されるように、生成された出力は、イオンリストなど、スペクトル以外の形態であってもよい。ステップ1064で生成される出力スペクトルまたはその他の出力は、前駆体と実質的に同じ保持時間およびピーク形状を有することによって、その前駆体に関連づけられると判断される生成物イオンを含んでもよい。生成物イオンは、単一でまたは前駆体と併せて、関連する強度和の表示とともに、出力スペクトル中に含まれてもよい。
【0131】
本明細書に記載されるSumtrack技術は、ここで追加図面とともに説明される。説明の簡素化のため、単一の前駆体のみが示されるが、しかし本明細書に記載される技術は、複数の前駆体およびその関連生成物イオンを有する試料に関連して使用されてもよい。
【0132】
ここで図6を参照すると、基準注入のグラフ表示が示されている。この例1100において、前駆体1102、ならびに生成物イオン1104、1106、1108、および1110は、1114で示されるような前駆体1102の保持時間を有している。保持時間枠内の測定保持時間を有する全ての生成物イオンが考慮されていることに留意されたい。表1112は、図示される基準注入の異なる生成物イオンに関連づけられた強度のリストを含む。
【0133】
ここで図7を参照すると、別の注入のグラフ表示が示されている。例1120の注入は、第一標的注入と称されてもよく、前駆体1102、ならびに成物イオン1104、1106、1108、1110、および1112を含んでいる。この例1120では、標的注入のデータにおいて、基準注入からの前駆体1102と同じ質量の保持時間が検索される。保持時間の検索は、異なる注入で同じ前駆体を追跡する際に使用するための上述の第二閾値または保持時間公差に関連して実行される。一実施形態は、複数の注入の間で前駆体を追跡するための上述の国際公開第2005/079261号パンフレットに記載されているような技術を使用してもよい。例1120において、前駆体1102は、1124によって示される保持時間を有するように描写されている。図8において、基準注入からの前駆体の保持時間に応じた、第一標的注入の整合または正規化が、示されている。基準注入および第一標的注入からの前駆体は、整合されている。生成物イオンもまた、しかるべく移動されている。基準注入に関して記載されているように、標的注入の前駆体が、最大の質量および強度を有するこれら1つ以上のイオンとして判定され得ることに留意されたい。例1124に関連して、生成物イオン1104および1106が、どの前駆体および生成物イオンが実質的に同じ保持時間を有するかを判断する際に使用されてもよい上述の保持時間枠に対して決定され得る前駆体と同じ保持時間1114を有していないことに、注目すべきである。残りの生成物イオン1108、1110、および1112は、予想される保持時間枠内の保持時間1114を有している。表1126は、例1124に示される生成物イオンに関連する強度を掲載している。
【0134】
例1124において、生成物イオン1104および1106が、たとえば、本明細書の別の箇所に記載されているような、質量スペクトルピークのFWHMの±1/10を使用して決定され得るような、保持時間枠内の保持時間1114を有していないように描写されていることに、注目すべきである。
【0135】
和集合演算を適用するSumtrack技術を使用する、本明細書に記載される技術を使用して決定されるような、前駆体および関連生成物イオンを含む出力スペクトルの一例が、図9に示されている。本明細書のSumtrack技術を使用して、基準注入の前駆体に関連すると判断された生成物イオン(たとえば、図6)および第一標的注入の前駆体に関連すると判断された生成物イオン(たとえば、図7および図8)に、和集合演算が適用される:
前駆体に関連する基準注入の生成物イオン{A、B、C、D}和
前駆体に関連する第一標的注入の生成物イオン{C、D、E}={A、B、C、D、E}
上述の例に基づいて、生成物イオン1104、1106、1108、1110、および1112は、1114で示される保持時間を有する前駆体イオン1102と一致または関連すると、判断されてもよい。
【0136】
さらに、表1142は、各関連生成物イオンを含むスペクトルにわたって各生成物イオンの強度を加算することによって決定された、生成物イオンの強度和の表を示す。表1142は、図8の表1126および図6の表1112からの強度を合計している。図示されていないが、前駆体1114に関連する強度は、基準および標的注入における前駆体の強度の和であってもよい。
【0137】
保持時間一致および生成物イオン選択を実行するための上述のSumtrack技術は、ペプチドカタログなどのデータベースまたはカタログに注釈を付けるために、使用されてもよい。関連技術において知られているように、たとえば、タンパク質配列データベースは、最初に取得されてデータ記憶装置に記憶されてもよい。データベースは、すぐ上に記載された技術を使用して注釈が付けられてもよい。ペプチドデータベースは、どのイオンが特定のペプチドを含んでいるかなどの情報を含む。本明細書に記載される技術は、たとえば、タンパク質を特徴付けまたは同定するために、データベースに掲載されているうちのどのイオンがタンパク質プロファイリングに関連して使用されているかをさらに特定するために、データベースに注釈を付けるために使用されてもよい。たとえば、タンパク質を含み、タンパク質の配列において20個のトリプシンペプチドを同定する、ペプチドデータベースがあってもよい。これら20個のペプチドのうち、たとえば10個など、一部のみがイオン化されるのでもよく、タンパク質を同定するために前駆体として使用されてもよい。本明細書に記載される技術を使用して、ペプチドデータベースは、10個のうち最も強力な3つの前駆体を表すように、注釈が付けられてもよい。3つの最強前駆体は、本明細書の別の箇所に記載されるように、プロファイリングに関連してタンパク質を同定するために使用されてもよい。ペプチドデータベースは、たとえば、本明細書に記載される保持時間一致および生成物イオン選択技術のうちの1つを実行した結果として生成される1つの情報を使用して、同定もされるような、各前駆体の生成物イオンを同定するために、さらに注釈が付けられてもよい。
【0138】
単一のスペクトルが同じ保持時間の前駆体を1つ以上有する入力データ集合に関連して、基準注入が決定されてもよい。このようなスペクトルは、たとえば、分析された複合試料に関連して、生成されてもよい。各前駆体の質量は、基準注入から決定されてもよい。一例として、第一質量m1を第一前駆体に関連づけ、第二質量m2を第二前駆体に関連づける。各前駆体に対して、複数の標的注入が調べられ得る。標的注入では、質量m1を有し、異なる注入において前駆体を追跡するときに使用される保持時間公差を表す特定の第二閾値の範囲内の保持時間を有するイオンが、検索されてもよい。このようなイオンは、標的注入における第一前駆体であると判断される。標的注入の第一前駆体の保持時間が決定されて、基準注入の第一前駆体の保持時間と整合させられる。整合およびその他の処理ステップは、どの生成物イオンが第一前駆体と関連または一致するかを判断するために、標的注入の各々について、本明細書に記載されるように、実行されてもよい。標的注入の同じ集合も、質量m2を有する第二前駆体に関連して処理されてもよい。質量m1を有する第一前駆体に関して先に述べられたのと同じように、標的注入において、質量m2を有し、本明細書の別の箇所に記載される第二閾値の範囲内の保持時間を有するイオンが、検索されてもよい。標的注入の第二前駆体の保持時間が決定され、基準注入の第二前駆体の保持時間と整合させられる。整合およびその他の処理ステップは、どの生成物イオンが第二前駆体と関連または一致しているかを判断するために、標的注入の各々について、本明細書に記載されているように実行されてもよい。このように、標的注入の各々において、各前駆体と実質的に同じ保持時間で発生する適切な生成物イオンが、観察および処理されてもよい。
【0139】
2つ以上の前駆体を含むスペクトルを用いてSumtrack技術の使用をさらに説明するために、図10、図11A、および図11Bが参照される。
【0140】
図10を参照すると、基準注入のために生成されてもよいスペクトルの一例が示されている。例1250において、要素1202および1204が前駆体であると判断されてもよい。要素1202および1204は、その他のイオン1208、1210、および1212に関連してその大きい質量および強度にしたがって、前駆体であると判断されるイオンを表してもよい。前駆体1202は1240の保持時間を有してもよく、前駆体1204は1260の保持時間を有してもよい。表1252は、1250のスペクトルにおける生成物および前駆体に関連する強度を示す。基準注入において、生成物イオン1210および1212は、前駆体1202に関連すると判断される(たとえば、前駆体1202と実質的に同じ保持時間を有する関連生成物イオンを判断するために使用される1240の保持時間枠内)。生成物イオン1208は、前駆体1204に関連すると判断される。
【0141】
第一標的注入は、図11Aにグラフ表示で示されている。前駆体1202の第一標的注入の処理を実行するとき、第一標的注入において、質量1202を有し、1240に関連して、注入間で前駆体を追跡するために使用される保持時間の第二閾値の範囲内の保持時間を有するイオンが、検索されてもよい。この第一標的注入において、質量1202を有する前駆体もまた、保持時間1240で発生する。この第一標的注入において、生成物イオン1208、1210、および1212は、前駆体に関連する生成物イオンを決定するときの、特定の保持時間枠の範囲内の保持時間1240において、発生する。表1203は、1200のスペクトル中の生成物および前駆体に関連する強度を示す。
【0142】
前駆体1204について第一標的注入1200を使用して分析を実行するとき、第一標的注入において、1204の質量を有し、1260によって表される保持時間に関する第二閾値の範囲内の保持時間を有するイオンが、検索される。この事例において、1204の質量を有するイオンは、保持時間1260ではなく1240で発生し、保持時間1240および1260は、第二閾値の制限内ではないかも知れない。このように、保持時間1260を有する基準注入の前駆体1204は、保持時間1240で発生する第一注入の前駆体1204と一致せず、あるいは共に追跡されない。本明細書の技術を使用する一実施形態はその後、先の前駆体1204の発生の各々を異なる前駆体として扱ってもよく、これは、いずれの前駆体も質量公差の範囲内の質量を有しているとはいえ、2つの注入中のいずれの前駆体も、第二閾値の範囲内の共通保持時間を有していないためである。したがって、先の前駆体1204の発生の各々について、本明細書の技術を使用して、情報が記録されてもよい。表1203は、例1200の生成物イオンおよび前駆体イオンに関連する強度を含む。図10は基準注入であるが、基準注入中のいずれの前駆体とも一致または追跡されない標的注入において発生する前駆体が、追加追跡が行われる新しい前駆体として扱われてもよいことに留意されたい。言い換えると、図10および図11Bのその他の注入において図11Aのこの新しい前駆体を追跡するための処理が実行されてもよい。
【0143】
図11Bを参照すると、第二標的注入が示されている。第二標的注入は、図10の基準注入について先に図示および記載されたように、前駆体および生成物イオンの質量および保持時間に関する情報を提供する。生成物および前駆体イオン強度は、表1302に含まれている。本明細書の技術にしたがって、表1304に表されるように、情報が収集されてもよい。表1304は、表1203、1252、および1302のデータにしたがって図10、図11A、および図11Bに示される注入にわたって各前駆体の生成物イオンの集合および関連する強度和を決定するために、本明細書に記載の和集合処理技術を適用した結果を含む。また、表1304が各前駆体の強度和を含むことにも、留意されたい。強度和「X1+X2+X3」を有する前駆体P1 1202のために、基準スペクトル中のP1ならびに1304aの情報を生じさせる第一および第二標的注入中のP1に関連づけられる生成物イオンに対して、和集合演算が適用される。強度和「Y2+Y3」を有する保持時間(RT)1260で発生する前駆体P2 1204のために、1304bの情報を生じさせるRT=1260を有するP2に関連づけられる生成物イオンに対して、和集合演算が同様に適用される。強度和「Y1」を有する保持時間(RT)1240で発生する前駆体P2 1204のために、1304cの情報を生じさせるRT=1240を有するP2に関連づけられる生成物イオンに対して、和集合演算が同様に適用される。
【0144】
上記によって示されたように、生成物イオンと同様に、異なる保持時間を有する2つの前駆体は、図11Aに示される注入のように、1つの注入において同じ測定保持時間を有してもよい。しかし、2つの前駆体は、それぞれの生成物イオンと同様に、繰り返し実験において異なる保持時間を有するだろう。本明細書の技術を使用して、表1304の情報が蓄積されてもよい。一実施形態は、タンパク質の発見および同定のためなど、後に続く処理に関連して使用するために、表1304の情報の一部を選択してもよい。一実施形態において、表1304は、同じ質量を有するが異なるRTを有するこれらの前駆体を判定するために、調べられてもよい。一例として、1304bおよび1304cの入力値が決定される。一実施形態は、どの前駆体入力値が最大強度を有するかに基づいて、先の入力値の1つのみを使用するために選択してもよい。1304cよりむしろ1304bの情報が使用され得るように、Y2+Y3がY1より大きい強度を示すことになるかも知れない。一実施形態は同様に、ただしその後に続いて、閾値強度を超える強度を有する前駆体のみなど、選択された数の最強前駆体(たとえば、全ての前駆体のうち最も大きい強度を有する上位2つの前駆体)について、1304の収集された情報を使用してもよい。
【0145】
Sumtrack技術を使用して、生成物イオンが少なくとも1つの注入における前駆体に関連すると判断された場合に(たとえば、生成物イオンが少なくとも1つの注入における前駆体に関連する保持時間枠内に)、その生成物イオンが集合に含まれるように、前駆体に関連する生成物イオンの集合が、和集合演算を使用して決定される。複数の注入にわたって各固有の関連生成物イオンの強度を合計することによって生成された強度和を関連付ける、最大強度を有するこれらの生成物イオンが決定され、前駆体の同定に関連して使用されてもよい。言い換えると、与えられた前駆体の生成物イオンに関連する強度和は、前駆体に関連づけられる生成物イオンの順位付けに使用されてもよい。このような順位付けの後、生成物イオンの一部は、最大強度和を有するものとして選択されてもよい。たとえば、最大強度を有するm個の生成物イオンを表す上位の「m」生成物イオンが、その後の使用のために選択されてもよい。一実施形態は、前駆体のための本明細書に記載のタンパク質プロファイルに、Sumtrackまたは本明細書に記載のその他の技術を使用して決定された、多数の最強生成物イオンを含んでもよい。プロファイルは、質量、および、可能であれば、そのような各生成物イオンのその他の情報も、含んでもよい。
【0146】
本明細書に記載されるように、一実施形態は、質量分析計による処理に先立って、入力試料の処理を随意的に実行してもよい。このような処理は、一実施形態における液体クロマトグラフィ分離によって、分離を補完または置換してもよい。一実施形態において、試料は、ペプチドまたはタンパク質などの、1つ以上の分子の混合物であってもよい。質量分析の実行に先立って、一実施形態は、二次元ゲル電気泳動(2DE)を使用して、混合物中の様々なタンパク質を分離してもよい。その結果生じるスポットは、削除および消化されて、タンパク質をより短いポリペプチド鎖に分解してもよい。これらの消化物は、質量分析を通じて分析されてもよい。この特定の例において、物質は、たとえばペプチドまたはタンパク質などの、1つ以上の分子の混合物であってもよい。タンパク質を含む入力試料または物質は、酵素消化処理の一部として消化されてもよい。この酵素消化処理は、試料中のタンパク質をより短いプリペプチド鎖に分解する分離処理の一種である。続いて、消化物はその後、たとえば、上述のような液体クロマトグラフィ(LC)、2Dゲル分離などのような、別の分離処理技術を使用して、さらに分離されてもよい。一般的に、たとえば分子量、電界などに応じて様々なポリペプチドを分離するために、いかなる分離技術および/または消化技術が使用されてもよいことに留意されたい。先の分離は、質量分析を受ける前の試料、および生成されたスペクトルまたは保持時間一致のための入力データ集合に含まれ得るその他の形態のデータに対して、一実施形態において随意的に実行されてもよい。
【0147】
本明細書で使用されるように、第一注入における前駆体の第一測定保持時間が、第一注入における生成物イオンの第二測定保持時間と、前駆体と生成物イオンとの一致で使用するための、上述のような保持時間枠の範囲内にある場合には、この2つの測定保持時間が実質的に同じであると特徴付けられてもよいことに留意されたい。前駆体および生成物イオンは、実際の測定保持時間が異なったとしても同じ保持時間を有すると見なされてもよい。
【0148】
注入間での前駆体の追跡に関連して、異なる注入において同じ前駆体が発生する時を判断するために、異なる技術および基準が使用されてもよい。そのような技術の1つは、上述の国際公開第2005/079261号パンフレットに記載されている。より一般的には、異なる注入における2つの前駆体が同じであるか否かの判断に使用するために、1つ以上の基準が指定されてもよい。一実施形態は、各々の保持時間が第二閾値または所定の枠の範囲内か否か、および各々の質量が、本明細書の別の箇所に記載されるような、指定された質量公差の範囲内かどうか、を含む基準を使用してもよい。保持時間一致および生成物イオン選択の技術が、タンパク質混合物の分別に関連して、たとえば、参照により本明細書に組み込まれる、2006年12月14日に公開された、Gorensteinらによる、国際公開第2006/133191号パンフレット、米国特許出願公開第2006/021919号明細書、METHODS AND APPARATUS FOR PERFORMING RETENTION−TIME MATCHING に記載される、分別技術を使用して処理される試料に適用されてもよいことに留意されたい。
【0149】
図12を参照すると、Sumtrackを使用して、前駆体およびその関連生成物イオンの保持時間一致および生成物イオン選択の実行に関連して一実施形態において使用されてもよい、処理ステップのフローチャートが示されている。図12のフローチャート1400のステップは、複数の前駆体および関連生成物イオンを含む注入のための図4〜図5に関連して記載された処理ステップの、より一般的な形態を表している。ステップ1402において、入力データ集合が取得される。入力データ集合は、各注入が複数の前駆体を含む、複数の注入を含んでもよい。ステップ1404において、注入の各々について、各前駆体がその生成物イオンと一致させられる。本明細書に記載されるように、前駆体は、前駆体と実質的に同じ測定保持時間およびピーク形状を有するこれらの生成物イオンを発見することによって、その生成物イオンと一致させられてもよい。これも本明細書に記載されるように、どのイオンが前駆体であるかの判断は、いずれか1つ以上の異なる技術を使用して判断されてもよい。たとえば、Batemanに記載されるようなLEモードまたはサイクルを使用して生成されたイオンが、前駆体であると判断されてもよい。別の例としては、特定の強度を持って一定値以上の質量またはm/zを有するこれら1つ以上のイオンが、前駆体であると判断されてもよい。注入の中で実質的に同じ保持時間を有する前駆体および生成物イオンは、本明細書の別の箇所に記載されるように、前駆体の保持時間に対する誤差の保持時間枠内のこれら生成物イオンであると判断されてもよい。ステップ1404の結果、前駆体および関連生成物イオンが決定される。
【0150】
ステップ1406において、入力データ集合の全ての注入に対して、前駆体のリストが決定される。前駆体のリストは、異なる注入に現れるどの前駆体が同じ前駆体を参照するかを判断することによって生成され得るような、異なるまたは固有の前駆体のリストである。第一注入の第一前駆体および第二注入の第二前駆体は、第二前駆体の質量が第一前駆体の質量に対して定義された質量公差の範囲内である場合、および第二前駆体の保持時間が第一前駆体の保持時間に対して保持時間の第二枠または閾値の範囲内である場合に、一致相手であると判断されてもよい。異なる注入におけるどの前駆体が同じ前駆体を参照しているかを判断するために、注入間にわたる前駆体の追跡に関連して使用されてもよい技術はまた、上述の国際公開第2005/079261号パンフレットにも記載されている。ステップ1406の一部として、全注入にわたって追跡されたリスト上の各前駆体について、全ての固有の関連生成物イオンの和集合が決定される。上述のように、所定の質量公差内の質量を有する、異なる注入の2つの生成物イオンは、2つの異なる注入に出現する同じ生成物イオンであると見なされてもよい。ステップ1406は、どの注入が特定の前駆体を含むかの判断を含んでもよい。前駆体を含む各注入について、(たとえば、ステップ1404に関連して判断されたように)その前駆体に関連する注入の生成物イオンに対して、和集合演算が実行される。特定の前駆体の全てのそのような生成物イオンの和を表す集合は、異なる注入においてどの生成物イオンが所定の質量公差内の質量を有するかを判断することによって、固有の生成物イオンを決定するために、さらに圧縮されてもよい。本明細書の別の箇所に記載されるように、所定の質量公差内の質量を有する2つの異なる注入における2つの生成物イオンは、2つの注入に現れる同じ生成物イオンであると見なされてもよい。
【0151】
ステップ1406の処理の結果として、全ての注入にわたる固有の前駆体のリストが決定される。さらに、リスト上の各前駆体について、関連する、固有生成物イオンの集合も、決定される。そのような生成物イオンの各々について、全ての注入にわたる生成物イオンの強度を加算することによって、強度和が決定されてもよい。ステップ1408で始まる処理は、前駆体のリストを詳査し、生成物イオンの先の強度和を決定する。ステップ1408において、現在の前駆体は、リスト上の第一前駆体として割り当てられる。ステップ1410において、リスト上の全ての前駆体が処理されたか否かの判断がなされる。いいえの場合、制御はステップ1414に進み、現在の前駆体について生成物イオンの集合を詳査する。ステップ1414において、現在の生成物イオンは、現在の前駆体の和集合における第一生成物イオンに割り当てられる。ステップ1416において、現在の前駆体の全ての生成物イオンが処理されたか否かの判断がなされる。ステップ1416がいいえと評価した場合、制御はステップ1420に進み、全ての注入にわたる生成物イオンの強度を加算することによって、現在の固有かつ関連する生成物イオンの強度和を決定する。本明細書の別の箇所に記載されるように、2つの異なる注入にあって、質量公差内の質量値を有する2つの生成物イオンは、2つの注入において発生する同じ生成物イオンであると判断されてもよい。異なる注入にわたる生成物イオンの先の発生に関連する強度は、生成物イオンの強度和を決定するために加算されてもよい。生成物イオンが各注入に含まれなくてもよく、そのため関連生成物イオンおよび前駆体が現れる注入に関連する強度を加算することによって強度和が決定されることに留意されたい。制御は、現在の生成物イオンが、現在の前駆体の集合における次の生成物イオンであるように割り当てられるステップ1422に進む。制御はステップ1416に進む。ステップ1416が、はいと評価して終了するまで、現在の前駆体の生成物イオンの処理が続く。ステップ1416が、はいと評価した場合、制御はステップ1418に進み、その後ステップ1410に進んで、リスト上の次の前駆体を処理する。ステップ1410は、リスト上の全ての前駆体が処理されたときに、はいと評価する。ステップ1410が、はいと評価したら、制御はステップ1412に進んでイオンリストを生成する。
【0152】
この例において、イオンリストは、前駆体および関連する固有の生成物、ならびにそのような各生成物の強度和を含んでもよい。イオンリストに含まれてもよい情報は、本明細書の別の箇所に記載されている。ステップ1412のイオンリストは、各前駆体について、各生成物イオンの関連する強度和とともに判断される全ての生成物イオンを含んでもよい。イオンリストまた、これに続いて順位付けされてもよい。順位付けされた生成物イオンの一部は、生成物イオンの強度和に応じて決定された各前駆体について、たとえば、最大で所定数「X」の生成物イオンを含むように、選択されてもよい。各前駆体の生成物イオンは、強度和によって順位付けまたは分類されてもよく、最大強度和を有するこれら「X」個の生成物イオンは、イオンリストに含まれてもよい。一実施形態において、図12のステップを使用して処理された複数の注入(たとえば、複製注入)に、同じ試料が使用されてもよい。結果的に得られたイオンリストは、試料、試料中のタンパク質などの同定に使用されてもよい。別の例として、各注入は、異なる試料混合物を使用してもよい。
【0153】
ここで、本明細書のSumtrack技術が、各試料の複製注入の集合とともに、多数の異なる試料を使用して取得された入力データ集合に関連して、どのように使用され得るかを示す、別の例が記載される。一例として、入力データ集合は、各試料に3つの複製注入を備える20個の異なる試料を使用して取得された60個の注入に関するデータを含んでもよい。20個の異なる試料の各々は、異なる条件、病的状態などに対応してもよい。
【0154】
図13を参照すると、Sumtrack技術を使用する実施形態において実行されてもよい処理ステップが示されている。フローチャート1500のステップは、上述のように取得された入力データ集合を使用して実行されてもよい。ステップ1502において、先の60個の注入のものなどの、入力データ集合が、取得されてもよい。図14は、20個の試料の各々がどのようにして各試料向けに取得された3つの複製注入の集合に関連づけられ得るかを示す例1600である。ステップ1504において、入力データ集合の各注入について、どの生成物イオンが各前駆体と一致するかが判断される。ステップ1504の処理は、図12のステップ1404と類似している。ステップ1506において、全ての注入にわたって各前駆体を追跡することによって、固有の前駆体のリストが全ての注入にわたって決定される。ステップ1506の処理は、図12のステップ1406に関連して先に記載された処理の一部と類似している。
【0155】
ステップ1508において、単一の注入について最高の強度を有する前駆体が、リストから選択されてもよい。ステップ1510において、条件または試料およびステップ1508からの選択された単一の注入を含む複製注入の関連する集合が、決定される。たとえば、図14を参照すると、注入7に含まれる第一前駆体がリスト上の全ての前駆体の中で最大の強度を有することが、ステップ1508において判定されてもよい。続いて、ステップ1510はその後、注入7の関連する条件または試料が3であると判断してもよい。複製注入7、8、および9の集合1602は、試料3に関連づけられる。
【0156】
ステップ1512において、ステップ1510で決定された複製注入の集合について、選択された前駆体の全ての固有生成物イオン質量の和集合が決定される。さらに、選択された前駆体に関連する各固有の生成物イオン質量について、強度和が決定される。本明細書の別の箇所に記載されるように、異なる注入において発生し、所定の質量公差内の質量値を有する2つの生成物イオンは、同じ生成物イオンの2つの発生として判断されてもよい。第一および第二生成物イオン質量の両方が所定の質量公差内にない場合には、第一生成物イオン質量は、第二生成物イオン質量に対して固有であってもよい。ステップ1512の処理は、生成物イオンが固有であって単一の前駆体(たとえば、単一の注入7において最大強度を有すると判断された前駆体)に関連している、選択された注入の集合(たとえば、1602の7、8、および9)のために、本明細書で記載されるように全ての生成物イオンの和集合演算を実行するステップを含む。和集合を形成する際にステップ1512において実行され得るような処理、選択された前駆体のために固有かつ関連する生成物イオンの決定、およびそのような生成物イオンの強度和の決定は、本明細書の別の箇所に記載されている。ステップ1514において、前駆体、および固有かつ関連する生成物イオンの和集合は、そのような生成物イオンの各々の強度和とともに、同定またはその他の目的で使用されるイオンリストに含まれてもよい。
【0157】
図13の処理は、入力データ集合からの多数の最強前駆体について繰り返し実行されてもよい。各前駆体について、最大の強度を有するこれらの生成物イオンが決定されてもよい。前駆体および図13の処理を使用して決定された関連生成物イオンに関する情報は、たとえばデータベースなどに記憶されてもよく、分析された試料においてどのタンパク質が発生したかの特定に関連して使用されてもよい。さらに、この情報は、一致したタンパク質の情報を更新、または注釈を付けるためにも、使用されてもよい。一例として、既存のカタログに記憶された、本明細書に記載のタンパク質プロファイルについて考えてみる。タンパク質を同定するために使用される各タンパク質プロファイルは、本明細書の別の箇所により詳細に記載されるように、1つ以上の前駆体および関連生成物イオンの情報を含んでもよい。図13の処理を使用して決定される1つ以上の前駆体および関連生成物イオンに一致するタンパク質プロファイルを有するカタログからタンパク質を同定するために、検索が実行されてもよい。この例において、タンパク質プロファイル中の前駆体の1つは、2つの関連生成物イオンを有するだけでよい。図13の技術を使用して、第三生成物イオンが前駆体について判断されてもよく、既存のタンパク質プロファイルに追加されてもよい。カタログに含まれる情報、一致するタンパク質などを判断するために使用される基準、などに応じて、生成物イオン、前駆体などに関して本明細書に記載の処理を使用して取得される付加的情報が、タンパク質プロファイルに追加されてもよい。
【0158】
ここで、Hitrack技術について、より詳細に記載される。上述のように、Hitrackは、与えられた前駆体について、出力データ集合が、その前駆体が最大強度を有する入力データ集合のスペクトルに関連づけられた生成物イオンスペクトルを含むことを判断する。入力データ集合が3つのスペクトルを含み、その各々が異なる注入向けであって、同じ前駆体が3つの全てのスペクトルにおいて追跡される、一実施形態において、Hitrackは、その前駆体が最強となるスペクトルを選択する。前駆体と一致する保持時間である選択されたスペクトルにおける生成物イオンは、出力データ集合に含まれる。
【0159】
図15を参照すると、Hitrack技術の一実施形態において実行され得る処理ステップのフローチャートが示されている。ステップ1702において、入力データ集合が取得される。この例において、入力データ集合は、各注入のスペクトルを含む。データ集合における各スペクトルは、1つ以上の前駆体および1つ以上の生成物イオンのデータを含む。ステップ1704において、同じ前駆体が、入力データ集合を形成する1つ以上の注入において追跡されてもよい。1つ以上の注入にわたる前駆体の追跡は、本明細書の別の箇所により詳細に記載されている。同じ前駆体が追跡される1つ以上の注入を含む集合が形成される。ステップ1706において、被追跡前駆体の強度が集合中の全注入の中で最大または最高となる注入が、ステップ1704で決定された集合から選択される。ステップ1708において、被追跡前駆体に一致または関連する選択された注入の生成物イオンを決定するために、選択された注入の入力データ集合中のスペクトルを使用して、保持時間一致が実行されてもよい。ステップ1710において、出力スペクトルが、被追跡前駆体およびステップ1708で決定された一致する生成物イオンを含むと判断される。ステップ1710の出力スペクトルは、前駆体、およびその前駆体に関連していると判断されたこれら1つ以上の生成物イオンのみを含んでもよい。ステップ1710の出力スペクトルは、本明細書の別の技術の実施形態の結果として生成された出力スペクトルと同様に、本明細書に記載され、かつ当業者によって理解されるような使用法とより一般的に結びつけられる、量的および/または質的分析のためのその後の処理において、使用されてもよい。
【0160】
被追跡前駆体と一致または関連する生成物イオンを含む、被追跡前駆体の出力スペクトルを決定するために、入力データ集合における各被追跡前駆体についてステップ1704〜1710が実行されてもよいことに留意されたい。
【0161】
ここで、Mergetrack技術の一実施形態が、より詳細に記載される。上述のように、Mergetrack技術の一実施形態は、本明細書に記載のHitrackおよび/またはSumtrack技術に関連する処理および生成物イオン選択基準を利用してもよい。2つの例示的実施形態が本明細書に記載される。第一の実施形態に関連して、1つ以上のスペクトルにおける被追跡前駆体のため、出力スペクトル中の前駆体の強度は、全ての追跡スペクトルにわたる前駆体の強度の和として決定されてもよい。被追跡前駆体を含む追跡スペクトルの保持時間一致は、各追跡スペクトルについて、どの生成物イオンが被追跡前駆体に関連しているかを判断するために、実行されてもよい。その後のステップにおいてさらなる処理を受ける、第一の結果的スペクトルを決定するために、Hitrack技術の処理および生成物イオン選択基準が、被追跡前駆体を含むスペクトルの集合に最初に適用されてもよい。第一の結果的スペクトルに含まれる各生成物イオンについて、被追跡前駆体を含むスペクトルの集合における生成物イオンの全ての事例を同定するために、処理が実行される。異なるスペクトルにおける同じ生成物イオンの先の同定は、生成物イオン質量にしたがって一致相手を決定することによって、本明細書の別の箇所に記載されるように、実行されてもよい。生成物イオンを含む1つ以上のスペクトルの各々における生成物イオンの強度が、取得される。第一の結果的スペクトルにおける生成物イオンの強度は、生成物イオンが各々の被追跡前駆体と同じ保持時間を有する1つ以上のスペクトルにわたる生成物イオンの先の強度の和として、決定される。出力スペクトルは、生成物イオンが先の処理にしたがって決定された強度を有する、第一の結果的スペクトルとして、決定される。
【0162】
図16を参照すると、Mergetrack処理の一実施形態を描写する一例が示されている。例1800は、4つのスペクトルを含む:入力データ集合中のスペクトルである1810、1820、および1830、ならびに出力スペクトルである1840である。P1は、スペクトル1810、1820、および1830にわたって追跡される前駆体である。A、B、およびCは、1800に関連する生成物イオンである。各スペクトルについて、被追跡前駆体と一致する生成物イオンを判定するために、被追跡前駆体P1を含む3つのスペクトルの各々について、保持時間一致が実行されてもよい。スペクトル1810、1820、および1830は、各スペクトルが保持時間枠内の前駆体および生成物イオンを含むように、本明細書に記載の保持時間一致を適用した結果であってもよい。出力スペクトル1840における前駆体P1の強度は、前駆体を含む全ての追跡スペクトルにわたる前駆体の強度の和として決定される。この例において、出力スペクトル1840における前駆体P1の強度は、W1+W2+W3である。Hitrack技術の実施形態は、被追跡前駆体を含む3つのスペクトルに適用されてもよく、図解目的のため、HiTrack処理にしたがって1810が選択されるように(たとえば、図15に関連して使用される基準にしたがって選択されるように)、W1を全てのP1強度の中で最大にしてもよい。その結果、出力スペクトルは、選択されたスペクトル1810について保持時間一致を通じて被追跡前駆体P1と一致した生成物イオンAおよびBを含む。処理は、質量においてAおよびBと一致する3つの追跡スペクトル中のその他のイオンを発見するために実行される。本明細書に記載される質量一致技術による例1800に関連して、Aは1820にも存在すると判断され、Bもまた1820に存在すると判断される。Aの強度は、全ての一致する追跡スペクトルにわたるAの強度の和として決定され、したがって、出力スペクトル1840におけるAの強度がA1+A2となるように、1820におけるAの強度A2が1810におけるAの強度A1に加算される。同様に、Bの強度は全ての一致する追跡スペクトルにわたるBの強度の和として決定され、したがって、出力スペクトル1840におけるBの強度がB1+B2となるように、1820におけるBの強度B2が、1810におけるBの強度B1に加算される。Cが出力スペクトルに含まれないことに、注意する。
【0163】
あるいは、同じ出力スペクトル1840を取得するために、すぐ上に記載されたのとは異なる処理ステップを使用する一実施形態において、Mergetrack技術が実行されてもよい。この代替案を示す例は、ここで図17を参照して記載される。この代替実施形態において、入力データ集合に含まれる前駆体P1ならびに追跡スペクトル1810、1820、および1830について、Sumtrack技術の実施形態は、第一の結果的スペクトルを決定するために、第一ステップにおける処理を実行してもよい。要素1910は、この例のための上記第一の結果的スペクトルを表し、前駆体、および入力データ集合の少なくとも1つのスペクトル中の前駆体と保持時間が一致した全ての生成物イオンを含む。要素1910は、たとえば、図4および図5に関連して本明細書に記載される処理ステップを実行することによって、生成されてもよい。第二ステップにおいて、Hitrack技術の実施形態は、3つの追跡スペクトル1810、1820、および1830を使用して処理が実行されてもよい。要素1810が、図17に示されるように、選択される。代替実施形態はその後、第一の結果的スペクトル1910から、Hitrack技術の実施形態を使用して生成されたスペクトル1810に含まれない生成物イオンを除外する。この例において、1910からCが除外された結果、スペクトル1840となる。
【0164】
Mergetrack処理の先の2つの実施形態において、選択された生成物イオンは、(全ての追跡スペクトルに対して)被追跡前駆体の強度が最大となる追跡スペクトルに含まれ、被追跡前駆体の保持時間と一致する保持時間を有するものである。前駆体および生成物イオンの各々の強度は、Sumtrack技術の実施形態で決定されたものに対応する強度和であってもよい。本明細書のMergetrack技術の実施形態はいずれも、与えられた被追跡前駆体のために生成物イオンの同じ集合を選択し、生成物および前駆体イオンについて同じ強度を決定するという結果になる。
【0165】
Mergetrack技術の先の2つの代替実施形態の処理が、ここで要約される。Mergetrackについて図18および図19で記載されるような処理を実行する前に、各追跡スペクトルについて、どの生成物イオンがその被追跡前駆体に関連しているかを判断するために、被追跡前駆体を含む追跡スペクトルの保持時間一致が実行されてもよいことに留意されたい。図18および図19の処理で使用されるスペクトルは、前駆体および生成物イオンが一致する保持時間を有すると決定されるように、各スペクトルが、保持時間枠内で発生する保持時間を有する同じ前駆体および生成物イオンを含むように、本明細書に記載されるような保持時間一致を適用した結果であってもよい。
【0166】
図18を参照すると、Mergetrack技術の実施形態において実行されてもよい処理ステップのフローチャートが示されている。フローチャート1950は、図16を参照して先に記載されたような、Mergetrackを実行するための第一手法のための処理を要約している。ステップ1952において、出力スペクトルの中の被追跡前駆体強度が、全ての追跡スペクトルにわたる前駆体の強度の和として決定される。ステップ1954において、Hitrack技術の実施形態を使用して、被追跡前駆体を含む追跡スペクトルの処理を実行することによって、結果的に生じるスペクトルが決定される。ステップ1954は、図15に関連して本明細書に記載される処理の実行を含んでもよい。ステップ1954で生成された結果的スペクトルは、(全ての追跡スペクトルに対して)被追跡前駆体の強度が最大となる追跡スペクトルに含まれ、かつ被追跡前駆体の保持時間と一致する保持時間を有する、生成物イオンを同定する。ステップ1956において、ステップ1954の結果的スペクトルにおける各生成物イオンについて、追跡スペクトルのうちのどれが生成物イオンを含むかが判断される。出力スペクトルの中の生成物イオンの強度は、前駆体を含み、生成物イオンと前駆体が一致する保持時間を有する、全ての追跡スペクトルにわたる生成物イオンの強度の和として決定される。ステップ1958において、出力スペクトルは、ステップ1954からの被追跡前駆体がステップ1952で決定された強度を有し、各生成物イオンがステップ1956によって決定されているように、対応する強度を有する、結果的スペクトルとして決定される。
【0167】
図19を参照すると、Mergetrack技術の第二の実施形態に関連して実行されてもよい処理ステップのフローチャートが示されている。フローチャート2000は、図17を参照して先に記載されたような、Mergetrackを実行するための第二の手法のための処理を要約している。ステップ2002において、Sumtrack技術の実施形態を使用して被追跡前駆体を含むスペクトルの処理を実行することによって、第一の結果的スペクトルが決定される。第一の結果的スペクトルは、追跡スペクトルのうち少なくとも1つの中の被追跡前駆体の保持時間と一致する保持時間を有すると判断された生成物イオンを同定してもよい。ステップ2002は、図4および図5に関連して本明細書に記載される処理の実行を含んでもよい。ステップ2004において、Hitrack技術の実施形態を使用して、被追跡前駆体を含むスペクトルの処理を実行することによって、第二の結果的スペクトルが決定される。ステップ2004は、図15に関連して本明細書に記載される処理の実行を含んでもよい。第二の結果的スペクトルは、(全ての追跡スペクトルに対して)被追跡前駆体の強度が最大となる追跡スペクトルに含まれ、かつ被追跡前駆体の保持時間と一致する保持時間を有する、生成物イオンを同定する。ステップ2006において、第一の結果的スペクトルから、ステップ2004で決定された第二の結果的スペクトルに含まれないこれらのイオンを除外することによって、出力スペクトルが決定される。
【0168】
図18の処理の結果として生成された出力スペクトルは、図19の処理の結果として生成された出力スペクトルと同じであってもよい。
【0169】
図4、図5、図12、図13、図18、および図19に示されるような、本明細書の技術を利用する実施形態で実行される処理ステップは、コンピュータプロセッサによって実行されるコードの結果として行われてもよい。コードは、コンピュータ読み取り可能媒体、メモリなどの様々な異なる形態のいずれか1つに記憶されてもよい。
【0170】
一実施形態において本明細書に記載される技術に関連して、混合物中の分子は、液体クロマトグラフにおいて分離されてもよく、未修飾形態で溶離してもよい。先の分子は、LC/MSシステムにおいて1つ以上のイオンを生じさせることができ、起源分子とも称されてもよい。一実施形態に含まれてもよいその他の任意の処理と同様に、エレクトロスプレまたはその他のイオン化処理を受けると、起源分子の結果的な質量スペクトルは、2つ以上のイオンを含み得る。複数のイオンは、たとえば、分子の同位体分布、イオン化によって生じた異なる電荷状態、および/またはイオンに適用された断片化機構、あるいはLCからの溶離に続いて課せられるその他の変化から、生じる可能性がある。このように、起源分子は1つ以上のイオンを生成してもよい。本明細書に記載の技術に関連して、同じ起源分子に由来するイオンのピーク形状および保持時間は、同じであると見なされる保持時間を含む測定値を有するので、同一である。
【0171】
本明細書の技術に関連して記載されたイオンリストは、1行以上のデータを含んでもよい。一実施形態において、イオンリストの各行は、イオンを記述する、保持時間、質量/電荷、強度を含む。イオンリスト中の各イオンに関するデータは、様々な異なる技術のうちのいずれか1つを使用して取得されてもよい。たとえば、1つ以上のイオンに関するデータは、LEまたはHEモードでBateman技術を使用して取得されてもよい。イオンリストはまた、LEまたはHE取得モードを使用して取得されるような、各行が保持時間、mwHPlus、強度、および電荷状態を含む、AMRT(正確な質量保持時間)のリストを参照してもよい。AMRTは、Silvaらによる「Quantitative Proteomic Analysis by Accurate Mass Retention Time Pairs」、Anal.Chem.,Vol.77,2187〜2200頁(2005)に、より詳細に記載されている。
【0172】
本明細書に記載の技術に関連して使用される入力データ集合に含まれるスペクトルは、各々がm/z(またはmwHPlus)および強度によって記述されている、イオン(またはAMRT)のリストを含んでもよい。一実施形態は、質量分析計によって収集されるような単一の走査において取得されるデータを含む第一技術を使用して、入力データ集合におけるスペクトルを取得してもよい。この場合、スペクトルのイオンリストは、スペクトルにおいてみられるような質量スペクトルピークに対応し、スペクトルの保持時間は、スペクトル走査の取得時間である。あるいは、たとえば、参照により本明細書に組み込まれる、Gorensteinらによる、2005年9月1日公開の国際公開第2005/079263号パンフレット、米国特許出願公開第2005/004180号明細書、APPARATUS AND METHOD FOR IDENTIFYING PEAKS IN LIQUID CHROMATOGRAPHY/MASS SPECTROMETRY DATA AND FOR FORMING SPECTRA AND CHROMATOGRAMS に記載されているように、スペクトルは、保持時間および保持時間枠を選択し、その保持時間がこの枠内に収まる全てのイオンをイオンリストから収集することによって取得されてもよい。スペクトルの保持時間は、たとえば、FWHMで測定されたクロマトグラフィピーク幅の±1/10として表される枠の中央に位置する保持時間として、決定されてもよい。
【0173】
本明細書に記載される技術に関連して使用される入力データ集合に含まれるスペクトルは、たとえばその質量または強度が特定の範囲から外れているイオン(またはAMRTS)を除外することなどによって、フィルタをかけられてもよいことに留意されたい。
【0174】
本明細書の保持一致および生成物イオン選択技術に関連して、出力スペクトルは、1つ以上の出力規則に応じた形態で生成されてもよい。たとえば、本明細書に記載されるように、第一スペクトル中の生成物イオンは第一測定質量を有してもよく、入力データ集合の第二スペクトル中の同じ生成物イオンは第二測定質量を有してもよい。第一および第二測定質量は、それらが定義された質量公差内であれば、同じ質量と見なされてもよい。出力スペクトルにおいて、生成物イオンの質量は、たとえば、出力スペクトルにおいて出力される質量は第一および第二測定質量の平均であってもよいなどの規則に従って、出力されてもよい。出力スペクトルは、たとえば、第一または第二スペクトルのいずれか一方から取得された質量のみからなってもよい。その他の実施形態は、出力スペクトルに含まれる値を決定するために、その他の技術を使用してもよい。また、2つのスペクトル中の2つの質量が質量公差の範囲内であるか否かを判断するための先の技術の使用、およびそうであった場合に、2つの質量が異なるスペクトル中の同じイオンに対応すると判断することは、本明細書の技術と関連して利用されてもよい。たとえば、上記は、2つの異なるスペクトル中の2つの生成物イオンが一致するとみなされ、したがって同じ生成物イオンを表すか否かを判断するために、使用されてもよい。
【0175】
保持一致技術とともに使用される入力データ集合に含まれる1つ以上のスペクトルは、様々な異なる源に由来してもよい。上述のように、スペクトルは、1つ以上の実験から、様々な異なる方法で、生成されてもよい。スペクトルまたはその他の形態の入力データ集合に含まれるデータもまた、データベースまたはその他のデータストアに由来してもよい。たとえば、以前の実験からのデータがデータベースに記憶されていてもよい。データベースからの以前の実験データは、単一でまたは新しい追加データと組み合わされて、入力データ集合に含まれてもよい。データベースまたはその他のデータストアに含まれるデータは、本明細書に記載の技術に関連して使用するための理論的または模擬実験済みの実験データを含んでもよい。たとえば、MS/MSスペクトルのDDAを使用して取得されたスペクトルが、含まれてもよい。
【0176】
入力データ集合を取得するために使用された試料がタンパク質の複合混合物である一実施形態において、異なるタンパク質からのイオンが保持時間において重複するかも知れない。このようなデータについて、単一の注入において最も強力なイオンを選択し、最強イオンの保持時間枠内の全ての生成物イオンのスペクトルを形成することによって、本明細書の技術が適用されてもよい。この最強イオンは、本明細書に記載されるように両方の注入の前駆体に質量および保持時間(たとえば、特定の質量公差の範囲内の各注入の質量、および上述の第二閾値または枠の範囲内にある各注入の保持時間)を一致させることによって、実質的に同じタンパク質の混合物のその後の注入において発見される前駆体イオンと見なされてもよい。
【0177】
本明細書に記載の技術に関連して、同位体変形および/または電荷状態の変化が、前駆体および生成物イオンに生じるかも知れない。本明細書に記載のフローチャートの処理ステップには明確に含まれていないが、特定のイオンでの上述の変化が認識され、本明細書に記載の技術にしたがってイオンおよび任意のそのような変形を単一体として処理するための情報を減少または要約するための処理が実行されてもよいことは、当業者によって理解されるであろう。たとえば、先の単一体は、1の電荷状態を有する特定の保持時間に発生するイオンの単一同位体質量を有してもよい。
【0178】
本明細書には、異なる保持時間一致および前駆体選択技術の実施形態が記載される。一実施形態において処理ステップが実行されてもよい特定の順番が本明細書に記載されるのとは異なってもよいことは、当業者に理解されるであろう。
【0179】
本明細書に記載される内容の変形、修正、およびその他の実行は、請求項に記載される本発明の精神および範囲から逸脱することなく、当業者に想到されるであろう。したがって、本発明は、上記の説明的記載によらず、以下の請求項の精神および範囲によって、定義されるべきである。
【技術分野】
【0001】
本願は、2008年5月29日出願の米国特許仮出願番号61/056,871の優先権を主張し、その全内容は参照により本明細書に組み込まれる。
【0002】
本発明は、主に化合物の分析に関し、より具体的には、ポリペプチド分析の機器および方法に関する。
【背景技術】
【0003】
プロテオミクスは一般的に、生物系由来のタンパク質の複合混合物を包含する研究を指す。プロテオミクスの研究は、タンパク質の同定、または生物系の状態における変化の判定に焦点を合わせる場合が多い。複合生物試料中のタンパク質の同定および定量化は、プロテオミクスにおける根本的な問題である。
【0004】
質量分析と組み合わされた液体クロマトグラフィ(LC/MS)は、プロテオミクス研究における基本的なツールとなっている。液体クロマトグラフィ(LC)による無傷のタンパク質またはそのタンパク質分解されたペプチド生成物の分離、および質量分析(MS)によるその後の分析は、多くの一般的なプロテオミクス方法論の基本を形成する。タンパク質の発現レベルの変化を測定する方法は、生物指標発見の基本および臨床診断を形成することができることから、非常に興味深い。
【0005】
無傷のタンパク質を直接分析するのではなく、むしろタンパク質は一般的に、タンパク質分解ペプチドの特定の集合を生成するために、消化される。その結果得られるペプチドは、その後LC/MS分析によって特徴付けられる場合が多い。消化に使用される一般的な酵素はトリプシンである。トリプシン消化において、タンパク質分解酵素の開裂特異性によって決定されるようにペプチドを生成するため、複合混合物中に存在するタンパク質は開裂される。観察されるペプチドの同一性および濃度から、利用可能なアルゴリズムは、試料中のタンパク質の同定および定量化に役立つ。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】米国特許第6,717,130号明細書
【特許文献2】国際公開第2006/133191号
【特許文献3】米国特許出願公開第2006/021919号明細書
【特許文献4】米国特許出願公開第2005/0127287号明細書
【特許文献5】国際公開第2005/079263号
【特許文献6】米国特許出願公開第2005/004180号明細書
【特許文献7】国際公開第2005/079261号
【特許文献8】米国特許出願公開第2005/004176号明細書
【非特許文献】
【0007】
【非特許文献1】RoepstorffおよびFohlman、Biomed Mass Spectrom、1984;11(11):601
【非特許文献2】Johnsonら、Anal.Chem 1987、59(21):2621:2625
【非特許文献3】Silvaらによる「Quantitative Proteomic Analysis by Accurate Mass Retention Time Pairs」、Anal.Chem.,Vol.77,2187〜2200頁(2005)
【発明の概要】
【発明が解決しようとする課題】
【0008】
LC/MS分析において、ペプチド消化はまず、LC分離およびその後のMS分析によって、分離および分析される。理想的には、十分な精度で測定された、1つのペプチドの質量は、ペプチドの固有の同定を提供する。しかし実際には、通常実現される質量精度は、おおよそ10ppm以上である。一般的に、そのような質量精度は、質量測定のみを使用してペプチドを一意的に同定するのに十分ではない。
【0009】
たとえば、10ppmの質量精度の場合、おおよそ10のペプチド配列が、ペプチド配列の典型的なデータベースの検索において同定される。たとえば質量精度に対する検索制約が低下するか、あるいは化学または翻訳後修飾、H2OまたはNH3の損失、および点突然変異の検索が可能であれば、この配列数は著しく増加するだろう。このように、ペプチド配列が欠失または置換のいずれかによって修飾される場合、ペプチドの同定のために前駆体の質量のみを使用することは、誤同定につながるだろう。2つのペプチドが、異なる配列を持ちながら同じアミノ酸組成を有することができる可能性から、さらなる複雑さが生じる。
【0010】
ペプチド前駆体の場合、生成物断片は、前駆体における単ペプチド結合での断片化によって得られることが可能である。このような単一断片化は、2つの副配列を生じる。ペプチドのC末端を含む断片は、イオン化された場合、Yイオンと称され、ペプチドのN末端を含む断片は、イオン化されるとBイオンと称される。
【0011】
タンパク質はしばしば、分析データを、断片の質量など、タンパク質の同一性をタンパク質の断片に関する情報と関連づけるデータベースと比較することによって、同定される。たとえば、データベースからの理論上のペプチド質量がデータで測定された前駆体の質量の質量検索枠内にある場合、これはヒットしたと見なされる。
【0012】
検索は、データベースで見つけられる、適合する可能性のあるペプチドのリストを提供することができる。これらの適合可能データベースペプチドは、統計的要因によって重み付けされてもされなくてもよい。このような検索から起こり得る結果は、いずれの適合可能データベースペプチドも同定されないか、1つの適合可能データベースペプチドが同定されるか、または2つ以上の適合可能データベースペプチドが同定されることである。適切な機器の較正を前提として、MSの分解能が高いほど、ppm閾値が小さくなり、その結果、誤同定が少なくなる。データベースで一致するペプチドが1つ以上ある場合には、この一致を確認するために、ペプチド断片イオンデータが使用されてもよい。
【0013】
検索の間、複数の電荷状態および複数の同位体が検索されてもよい。さらに、有効な一致を同定するのに役立てるために、実験的に生成された信頼性規則が適用され得る。
【課題を解決するための手段】
【0014】
前駆体イオンを1つ以上の関連生成物イオンと一致させる方法およびコンピュータ読み取り可能媒体は、本発明の一態様による。複数の入力データ集合が、複数の注入から取得される。複数の入力データ集合の各々は、同じ前駆体イオンおよび1つ以上の生成物イオンを含む。複数の入力データ集合は、前駆体イオン向けの単一の保持時間にしたがって正規化される。複数の入力データ集合の各々のために、上記前駆体イオン向けの単一の保持時間に対して、どの生成物イオンが所定の保持時間枠内にあるかが判断される。複数の入力データ集合のうち少なくとも1つにおいて生成物イオンが所定の保持時間枠内にある場合、生成物イオンは単一の保持時間を有する前駆体イオンに関連すると判断される。
【0015】
前駆体を関連生成物イオンと一致させる方法は、本発明の別の態様による。この方法は、複数の注入を実行するステップと、上記各前駆体に関連づけられた保持時間および質量を含む基準にしたがって、上記複数の注入のいずれが上記前駆体の各々を含むかを判断するために、複数の注入を通じて上記前駆体の各々を追跡するステップと、上記前駆体の各々のために、関連する生成物イオンの集合を決定するステップであって、前記関連生成物イオンの各々は、上記複数の注入の少なくとも1つにおける上記各前駆体の上記保持時間に対して所定の保持時間枠内の保持時間を有するステップと、上記前駆体の各々の上記関連生成物イオンの各々のために、強度和を決定するステップとを含み、上記強度和は、上記各関連生成物イオンの1つ以上の強度を加算することによって決定され、上記1つ以上の強度の各々は、上記各前駆体を含む上記複数の注入の異なる1つにおける上記各関連生成物イオンの強度に対応する。
【0016】
クロマトグラフィモジュールと、上記クロマトグラフィモジュールと通信する質量分析モジュールと、上記クロマトグラフィモジュールおよび上記質量分析モジュールと通信する制御部とを含む試料分析装置は、本発明の別の態様による。制御部は、少なくとも1つのプロセッサ、および上記プロセッサによって実行される複数の命令を記憶するためのメモリを含む。複数の命令はプロセッサに、上記各前駆体に関連づけられた保持時間および質量を含む基準にしたがって、上記複数の注入のいずれが上記前駆体の各々を含むかを判断するために、複数の注入を通じて上記前駆体の各々を追跡するステップと、上記前駆体の各々のために、関連生成物イオンの集合を決定するステップであって、前記関連生成物イオンの各々は、上記複数の注入の少なくとも1つにおける上記各前駆体の上記保持時間に対して所定の保持時間枠内の保持時間を有するステップと、上記前駆体の各々の上記関連生成物イオンの各々のために、強度和を決定するステップとを実行させ、上記強度和は、上記各関連生成物イオンの1つ以上の強度を加算することによって決定され、上記1つ以上の強度の各々は、上記各前駆体を含む上記複数の注入の異なる1つにおける上記各関連生成物イオンの強度に対応する。
【0017】
前駆体イオンを1つ以上の関連生成物イオンと一致させる方法は、本発明のさらに別の態様による。この方法は、複数の注入から複数の入力データ集合を取得するステップであって、上記入力データ集合の各々は同じ前駆体イオンおよび1つ以上の生成物イオンを含むステップと、上記複数の入力データ集合を上記前駆体イオン向けの単一の保持時間にしたがって正規化するステップと、上記複数の入力データ集合の各々のために、上記前駆体イオン向けの単一の保持時間に対して、どの生成物イオンが所定の保持時間枠内にある対応する保持時間を有するかを判断するステップと、上記判断ステップによって生成物イオンが、前記複数の入力データ集合のうち少なくとも1つの上記単一保持時間に対して所定の保持時間枠内にある、対応する保持時間を有すると判断された場合に、上記単一の保持時間を有する上記前駆体イオンに関連すると判断された結果的な生成物イオンの集合に上記生成物イオンが含まれるように、上記複数の入力データ集合に含まれる生成物イオンに対して和集合演算を実行するステップとを提供する。
【0018】
前駆体イオンを1つ以上の関連生成物イオンと一致させる方法およびコンピュータ読み取り可能媒体は、本発明の別の態様による。複数の注入から取得された複数の入力データ集合が提供される。複数の入力データ集合の各々は、第一保持時間を有する同じ前駆体イオンと、上記前駆体イオン向けの上記第一保持時間に対して所定の保持時間枠内の保持時間を有する1つ以上の生成物イオンとを含む。上記前駆体イオンの強度が、上記複数の入力データ集合のその他における上記前駆体の強度に対して最大となる、第一の入力データ集合が選択される。第一集合における各生成物イオンが上記選択ステップで選択された上記第一入力データ集合となり、上記第一保持時間に対する上記所定の保持時間枠内の保持時間を有するように、生成物イオンの第一集合が決定される。上記第一集合における各生成物イオンのために、どの上記複数の入力データ集合が、上記第一保持時間に対して上記所定の保持時間枠内の保持時間を有する上記各生成物イオンを含むかについて、第一の結果が決定され、上記第一の結果における入力データ集合にわたる上記生成物イオンのための強度の和として、上記各生成物イオンのために強度和が決定される。生成物イオンの第一集合は上記前駆体に関連しており、上記第一集合における上記生成物イオンの各々は、上記強度和決定ステップで決定された強度和を有する。
【0019】
前駆体イオンを1つ以上の関連生成物イオンと一致させる方法およびコンピュータ読み取り可能媒体は、本発明の別の態様による。複数の注入から取得された複数の入力データ集合が提供される。複数の入力データ集合の各々は、第一保持時間を有する同じ前駆体イオンと、上記前駆体イオン向けの上記第一保持時間に対して所定の保持時間枠内の保持時間を有する1つ以上の生成物イオンとを含む。上記複数の入力データ集合のうち少なくとも1つにおいて上記第一保持時間に対して上記所定の保持時間枠内の保持時間を有する生成物イオンの第一集合が、決定される。上記第一集合における各生成物イオンは、上記各生成物イオンを含む上記複数における入力データ集合にわたる上記生成物イオンの強度の和である強度を有し、上記各生成物イオンは、上記第一保持時間に対して上記所定の保持時間枠内の保持時間を有する。上記前駆体イオンの強度が、上記複数の入力データ集合のその他における上記前駆体の強度に対して最大となる、第一の入力データ集合が選択される。生成物イオンの第二集合は、上記第二集合における各生成物イオンが、上記選択ステップによって選択された上記第一入力データ集合に含まれ、上記第一保持時間に対して上記所定の保持時間枠内の保持時間を有するように、決定される。第一集合から削除されるのは、上記第二集合に含まれない生成物イオンである。第一集合から生成物イオンを削除した後、第一集合は上記前駆体に関連する生成物イオンを含む。
【0020】
前駆体イオンに関連する生成物イオンを判定する方法は、本発明の別の態様による。この方法は、複数の注入から取得された複数の入力データ集合を提供するステップであって、上記複数の入力データ集合の各々が、第一保持時間を有する同じ前駆体イオンと、上記前駆体イオン向けの上記第一保持時間に対して所定の保持時間枠内の保持時間を有する1つ以上の生成物イオンとを提供するステップと、複数の保持時間一致および生成物イオン選択技術を提供するステップであって、上記複数の保持時間一致および生成物イオン選択技術各々は、上記前駆体に関連すると判断された関連生成物イオンに関する上記複数の入力データ集合からの情報を組み合わせる処理を実行し、上記関連生成物イオンは各々、上記第一保持時間に対して上記所定の保持時間枠内の保持時間を有し、上記複数の保持時間一致および生成物イオン選択技術は、上記生成物イオンが複数の入力データ集合のうち少なくとも1つにおける上記第一保持時間に対して所定の保持時間枠内の保持時間を有する場合に、生成物イオンが上記前駆体イオンに関連すると判断する第一技術を含むステップと、複数の保持時間一致および生成物イオン選択技術のうちの少なくとも1つを選択するステップと、上記前駆体イオンに関連する生成物イオンを判定するために、上記少なくとも1つの選択された保持時間一致および生成物イオン選択技術を使用して、上記複数の入力データ集合を処理するステップとを含む。
【0021】
図面において、類似の参照符号は全体的に、異なる図面にわたって同じ部分を指す。また、図面は必ずしも縮尺通りとは限らず、むしろ本発明の原理を図解する上で、全体的に強調されている。
【図面の簡単な説明】
【0022】
【図1】本発明の一実施形態による、化合物の化学分析を実行する方法のフロー図である。
【図2A】本発明の一実施形態による、LC/MSシステムのブロック図である。
【図2B】本発明の一実施形態による、質量スペクトルの一群を示す、3つの関連するグラフである。
【図3】本発明の一実施形態における入力データ集合に対して実行可能な処理を示すブロック図である。
【図4】本発明の一実施形態によって本明細書に記載される、第一技術、Sumtrackを使用する、前駆体およびその関連生成物イオンの保持時間一致に関連する処理ステップのフロー図である。
【図5】本発明の一実施形態によって本明細書に記載される、第一技術、Sumtrackを使用する、前駆体およびその関連生成物イオンの保持時間一致に関連する処理ステップのフロー図である。
【図6】本発明の一実施形態による、本明細書の第一技術の使用を図解する、注入のグラフ表示である。
【図7】本発明の一実施形態による、本明細書の第一技術の使用を図解する、注入のグラフ表示である。
【図8】本発明の一実施形態による、本明細書の第一技術の使用を図解する、注入のグラフ表示である。
【図9】本発明の一実施形態による、本明細書の第一技術の使用を図解する、注入のグラフ表示である。
【図10】本発明の一実施形態による、本明細書の第一技術の使用を図解する、注入のグラフ表示である。
【図11A】本発明の一実施形態による、本明細書の第一技術の使用を図解する、注入のグラフ表示である。
【図11B】本発明の一実施形態による、本明細書の第一技術の使用を図解する、注入のグラフ表示である。
【図12】本発明の一実施形態によって本明細書に記載される、第一技術、Sumtrackを利用する処理ステップのフロー図である。
【図13】本発明の別の実施形態によって本明細書に記載される、第一技術、Sumtrackを利用する処理ステップのフロー図である。
【図14】本発明の一実施形態によって本明細書に記載される、第一技術、Sumtrackと連携して使用される入力データ集合を形成するために使用可能な、注入および関係する試料の図である。
【図15】本発明の一実施形態による、別の技術、Hitrackを使用する、前駆体およびその関連生成物イオンを決定するために使用可能な処理ステップのフロー図である。
【図16】本発明の一実施形態による、さらに別の技術、Mergetrackを適用する例である。
【図17】本発明の一実施形態による、さらに別の技術、Mergetrackを適用する例である。
【図18】本発明による、Mergetrackの異なる実施形態において実行可能な処理ステップのフローチャートである。
【図19】本発明による、Mergetrackの異なる実施形態において実行可能な処理ステップのフローチャートである。
【発明を実施するための形態】
【0023】
本明細書で使用される際に、以下の用語は主に、表示される意味を指す:
タンパク質−単一ポリペプチドとして組み立てたれたアミノ酸の特異的一次配列。
【0024】
ペプチド−タンパク質の一次配列に含まれる単一ポリペプチドとして組み立てたれたアミノ酸の特異的配列。
【0025】
トリプシンペプチド−トリプシンによるタンパク質の酵素開裂に起因するタンパク質配列から生成されるペプチド。次の説明において、便宜上、消化ペプチドはトリプシンペプチドと称される。しかし、本発明の実施形態がその他のペプチド消化技術に適用されることは、理解されたい。さらに、「消化」という用語は、本明細書において、たとえば細胞酵素(プロテアーゼ)の使用および分子内消化を含む、ポリペプチドを分解または開裂するいずれかの適切な方法を主に指すために使用される。本明細書で使用される際に、「タンパク質分解の」という用語は、大型タンパク質を消化または溶解してより小さい分画またはアミノ酸にする、いずれかの酵素を指す。
【0026】
前駆体ペプチド−タンパク質開裂手順を使用して生成される、トリプシンペプチド(または他のタンパク質開裂生成物)。前駆体は随意的に、クロマトグラフィによって分離され、質量分析計に送られる。前駆体の正に帯電され、タンパク化合化された形態を一般的に生成するために、イオン源がこれらの前駆体ペプチドをイオン化する。このように正に帯電されてタンパク化合化された前駆体イオンの質量は、本明細書では前駆体の「mwHPlus」または「MH+」と称される。以下において、「前駆体質量」という用語は主に、イオン化された、ペプチド前駆体のタンパク化合化されたmwHPlusまたはMH+質量を指す。
【0027】
断片または生成物イオン−LC/MS分析において発生し得る複数のタイプの断片または生成物イオン。トリプシンペプチド前駆体の場合、断片は、無傷のペプチド前駆体の衝突断片化から生成され、その一次アミノ酸配列が起源前駆体ペプチドに含まれる、ポリペプチドイオンを含むことができる。YイオンおよびBイオンは、このようなペプチド断片の例である。トリプシンペプチドの断片は、インモニウムイオン、リン酸イオン(PO3)などの官能基、特定の分子または分子種から開裂された質量タグ、あるいは前駆体からの水(H2O)またはアンモニア(NH3)の「中性損失」を含むことができる。
【0028】
YイオンおよびBイオン−ペプチドがペプチド結合において断片化し、電荷がN末端断片上に保持される場合、その断片イオンはBイオンと称される。電荷がC末端断片上に保持される場合には、断片イオンはYイオンと称される。可能な断片およびそれらの命名のより包括的なリストは、RoepstorffおよびFohlman、Biomed Mass Spectrom、1984;11(11):601、ならびにJohnsonら、Anal.Chem 1987、59(21):2621:2625において提供される。
【0029】
保持時間−文脈中において、通常は、物質がその最大強度に到達する、クロマトグラフィプロファイルの点を指す。
【0030】
イオン−各ペプチドは通常、構成元素の同位体の天然存在度のため、イオンの集合体としてLC/MS分析に現れる。イオンは保持時間およびm/z値を有する。質量分析計(MS)は、イオンのみを検出する。LC/MS技術は、全ての検出イオンの様々な観察測定値を生成する。これは、多数の計測されたイオンなどのイオンの質量対電荷比(m/z)、質量(m)、保持時間、および信号強度を含む。
【0031】
mwHPlus−ペプチドの、中性の、単一同位体質量に1つの陽子、1.007825amuの重量を加えたもの。
【0032】
一般的に、LC/MS分析は、その質量、電荷、保持時間、および総合強度に関して、ペプチドの経験的記述を随意的に提供する。クロマトグラフィカラムから溶離する際に、ペプチドは特定の保持期間をかけて溶離し、単一の保持時間においてその最大信号に到達する。イオン化および(可能な)断片化の後、ペプチドは、イオンの関連集合として現れる。集合中の異なるイオンは、異なる同位体組成および共通ペプチドの電荷に対応する。イオンの関連集合中の各イオンは、単一のピーク保持時間およびピーク形状を生成する。これらのイオンは共通ペプチドに由来するので、各イオンのピーク保持時間およびピーク形状は同一で、ある程度の測定公差範囲内である。各ペプチドのMS取得は、ある程度の測定公差範囲内で全てが同じピーク保持時間およびピーク形状を共有する、全ての同位体および電荷状態の複数のイオン検出を実行する。
【0033】
LC/MS分離において、単一のペプチド(前駆体または断片)は多くのイオン検出を実行し、これは複数の電荷状態において、イオンのクラスタとして現れる。このようなクラスタからのこれらのイオン検出のデコンボリューションは、ある電荷状態において、測定された信号強度の特定の保持時間における、固有の単一同位体質量の単一体の存在を示す。
【0034】
タンパク質データベース−本発明のいくつかの実施形態において、分析者はタンパク質のデータベースを利用する。典型的なデータベースでは、これに含まれる各タンパク質は、そのアミノ酸の一次配列によって記述される。分析者は、研究中のタンパク質とよく一致すると思われるデータベースを選択してもよいだろう。たとえば、大腸菌データベースは、大腸菌のcell lycateから取得されたデータと比較されることが可能であろう。同様に、ヒト血清データベースは、ヒト血清から取得されたデータと比較されることが可能であろう。ユーザはサブ集合データベースを選択することもできるだろう。ユーザは、スイスバイオインフォマティクス研究所(SIB)および欧州バイオインフォマティクス研究所(EBI)のSwiss−Protグループによって作成されたSwissProtデータベースに掲載されている全てのタンパク質など、上位データベースを選択することもできるだろう。ユーザは、アミノ酸のランダム配列によって記述された、模擬タンパク質を含むデータベースを選択することもできるだろう。このようなランダムデータベースは、タンパク質同定システムおよび検索アルゴリズムを評価または較正するための対照研究において使用される。ユーザは、自然発生および人工配列の両方を組み合わせたデータベースを使用することもできるだろう。タンパク質データベースより、各配列から、トリプシン前駆体イオンの配列および質量、YおよびBイオン、ならびにそれらの前駆体から生じるその他の可能な断片イオンを推察することが可能である。
【0035】
図1は、本明細書に記載された技術に関連する実施形態において実行可能な、化合物の化学分析を実行するための方法100のフロー図である。方法100は、標準試料の1つ以上の化合物を化合物の成分断片に消化するステップ110と、成分を分離するステップ120と、分離された成分の少なくともいくつかにおいてイオン化するステップ130および質量分析するステップ140と、本明細書に記載の技術とともに使用するための1つ以上の入力データ集合を取得するために、試料中の少なくとも1つの化合物の前駆体および生成物または断片イオンの質量スペクトルを生成するステップ150とを含む。入力データ集合は、前駆体および関連生成物イオンの保持時間一致を実行するために、本明細書に記載の技術にしたがって処理されてもよい。本明細書に記載の技術は、前駆体に関連する生成物イオンの集合を決定するために、保持時間一致および生成物イオン選択を実行する。以下のパラグラフにより詳細に記載されるように、100のステップは、1つ以上の試料の各々に対して1回以上実行されてもよい。
【0036】
好ましくは、対象試料に対して100のステップを繰り返す際に、事実上、消化、クロマトグラフィ分離、および/またはイオン化のために事前選択された同じ方法が、標準試料に使用された対象試料の消化110、分離120、イオン化130、および質量分析140に使用される。
【0037】
方法100のいくつかの好ましい使用は、タンパク質関連の分析を対象とする。したがって、便宜上、以下の説明は、タンパク質および関連する断片に関し、タンパク質などのポリペプチドである化合物の分析の例を使用し、これらの例において、タンパク質は消化されて、タンパク質の前駆体断片である成分断片となる。同様に、前駆体はイオン化されて前駆体イオンとなり、随意的に、質量分析の準備として断片化されて生成物イオンとなる。
【0038】
説明はポリペプチドに関連する例に焦点を当てるが、そのような例は、本発明の範囲をポリペプチドの分析に限定するように意図されるものではなく、化学分析分野の当業者は、本発明の原理がその他の化学的化合物の分析に適用可能であることを認識するであろう。
【0039】
消化110は、知られている技術を含む、タンパク質を開裂するいずれかの適切な技術を通じて達成される。たとえば、上述のように、タンパク質は、トリプシンなどの1つ以上の酵素を使用して、前駆体ポリペプチドまたはアミノ酸に消化される。タンパク質またはポリペプチドの断片は、本明細書では通常、「前駆体」と称される。このような断片は、クロマトグラフィ分離の後の追加分析で随意的に使用されるという意味において、前駆体である。以下により詳細に記載されるように、前駆体断片は、随意的にイオン化され、および/またはさらに断片化されて生成物断片となる。
【0040】
分離120は、逆相クロマトグラフィ、ゲル浸透クロマトグラフィ、サイズ排除クロマトグラフィ、および電気泳動などの知られている技術を含む、いずれかの適切なクロマトグラフィ関連技術によって、達成される。分離120は、タンパク質および/または試料中のタンパク質の消化110から得られた前駆体の保持時間に関する値を提供する。
【0041】
クロマトグラフィ分離120の溶離液を質量分析140するための準備において、分離120処理からの溶離液は、イオン化130処理にかけられる。エレクトロスプレーイオン化およびMALDIなどの知られている技術を含む、いずれかの適切なイオン化130処理が、随意的に使用される。イオン化130処理の間、少なくともいくつかの前駆体がイオン化されて前駆体イオンを形成する。たとえば、単一のタンパク質分子が消化110されて20の前駆体断片を形成し、そのうち10がイオン化130の間にイオン化される。以下により詳細に記載されるように、前駆体は、生成物イオンを得るために、さらに断片化されてもよい。
【0042】
質量分析140は、前駆体イオンの質量に関連する値、およびイオン強度に関連する値を提供する。質量分析140は、知られている技術を含む、いずれかの適切な質量分析技術を通じて実行される。そのような技術は、磁気セクタ分析および飛行時間形分析を含む。
【0043】
ステップ150に示されるように、上述の分析ステップ140から取得された情報は、本明細書に記載される技術を使用してさらに処理されてもよい、入力データ集合を取得するために使用される、前駆体および生成物イオンのための質量スペクトルを形成してもよい。
【0044】
図1のステップを実行するいくつかの実施形態において、ステップ150の入力データに含まれるデータは、LC/MSシステムを使用して取得されてもよい。たとえば、図2Aおよび図2Bを参照してより詳細に記載されるように、液体クロマトグラフによって出力された溶離液は、エレクトロスプレーインターフェースを通じて質量分析計に導入される。随意的に、三連四重極MS機器の第一の四重極は、イオンガイドとして機能する。交流電圧は、機器の衝突セルに印加される。以下に記載されるように、たとえば交互に、前駆体イオンおよびその断片(生成)イオンのスペクトルが収集される。
【0045】
好ましくは、前駆体イオンおよび関連生成物イオンの両方が、分離120処理から得られた同じ前駆体物質から形成される。このようにして、前駆体イオンおよび関連生成物イオンの両方が、分離120処理から決定された同じ保持時間データを有することになる。生成物イオンはこのように、それらが発生する前駆体と比較的容易に関連づけられるだろう。試料の2つ以上の注入が実行される場合、前駆体イオンと生成物イオンのデータは、異なる注入から取得されてもよい。
【0046】
知られている方法を含む、いずれかの適切な方法が、単一の試料注入から前駆体および生成物イオンの両方を取得するために使用されてもよい。このような方法は、前駆体および生成物イオンの両方の有効な同時質量分析を提供する。たとえば、溶離された前駆体の一部が断片化されて生成物イオンを形成し、前駆体および生成物イオンは、同時かまたは、たとえば続けざまに、ほぼ同時分析される。
【0047】
代替例として、ピークの2つ以上の交互部分は、それぞれ前駆体および生成物分析に使用される。ピークの前駆体物質の部分は、イオン化および分析され、その後次の部分が解離されて、分析される生成物断片となる。一実施形態において、溶離前駆体の交互部分は、前駆体イオンおよびその生成物イオンのデータを交互に取得するために、試料採取される。取得されたデータは、ピーク形状の復元によって、溶離された前駆体およびその関連生成物の両方の正確な保持時間値の測定を可能にさせる。さらに、たとえば、前駆体イオンおよび生成物イオンに関連する復元されたピークのピーク形状、幅、および/または時間は、どの生成物イオンが特定の生成物イオンと関連するかを判断するために、随意的に比較される。
【0048】
このような交互の有効な同時分析の手法の1つは、Batemanらによる米国特許第6,717,130号明細書(「Bateman」)に記載されており、これは参照により本明細書に組み込まれ、断片化を調整するために衝突セルに交流電圧を印加する技術を記載している。関連する特徴の付加的な説明は、図2Aおよび図2Bを参照して、以下に提供される。
【0049】
このように、Batemanに記載された技術またはその他の適切な技術は、どの生成物イオンが特定の前駆体に由来するかの判断を支援するために、保持時間観察を使用する。生成物イオンは、一致する保持時間値に応じて、その前駆体イオンに関連づけられる。
【0050】
たとえば、閾値保持時間差が選択され、生成物イオンおよび前駆体イオンの保持時間の差が閾値未満の場合、生成物はその前駆体に由来すると判断される。たとえば、1つの適切な閾値は、前駆体イオンの保持時間ピーク幅の十分の一に等しい。イオンの保持時間値は随意的に、そのイオンにおいて観察されたピークのピーク最大値の時間値として定義される。
【0051】
次に図2Aおよび図2Bを参照すると、本発明のいくつかの実施形態は、LC/MS機器に関する。図2Aは、本発明の一実施形態による、LC/MSシステム200のブロック図である。機器は、クロマトグラフィモジュール204、およびクロマトグラフィモジュール204から溶離液を受け取る質量分析計モジュール212を含む。LCモジュール204は、試料202を受け取る注入器206、ポンプ208,およびカラム210を含む。MSモジュール212は、脱溶媒和/イオン化装置214、イオンガイド216、質量分析器220、および検出器222を含む。システム200は、データ記憶装置224およびコンピュータモジュール226も含む。
【0052】
動作時、試料202は、注入器206を通じてLCモジュール204内に注入される。ポンプ208は、カラム210を通る保持時間にしたがって混合物を構成成分に分離するために、カラム210を通じて試料をポンプ移送する。
【0053】
カラム210からの出力は、分析のため質量分析計212に入力される。まず、試料は脱溶媒和/イオン化装置214によって脱溶媒和およびイオン化される。たとえば、ヒータ、ガス、およびガスと組み合わされたヒータ、またはその他の脱溶媒和技術を含む、いずれかの脱溶媒和技術が採用され得る。イオン化は、たとえばエレクトロスプレーイオン化(ESI)、大気圧化学イオン化(APCI)、またはその他のイオン化技術を含む、いずれかの適切なイオン化技術によってなされ得る。イオン化から生じるイオンは、イオンガイド216によって衝突セル218に供給される。
【0054】
衝突セル218は、イオンを断片化するために使用される。好適な実施形態において、衝突セル218は、前駆体イオンおよび同じ溶離前駆体物質の生成物イオンの両方の観察を支援するために、切り替えモードで操作される。
【0055】
知られている技術を含む、いずれの適切な切り替え技術が使用されてもよい。本発明のいくつかの実施形態は、好ましくは、比較的単純な交流電圧サイクルがセル218に印加される断片化手順を使用する。この切り替えは、複数の高エネルギーおよび複数の低エネルギースペクトルが単一のクロマトグラフィピークに含まれるように、十分に高い周波数で行われる。その他のいくつかの切り替え手順とは異なり、このサイクルはデータの内容とは無関係である。
【0056】
たとえば、「130特許(米国特許第6717130号明細書)」に記載されているように、断片化を生じさせるために、交流電圧が衝突セル218に印加される。前駆体(衝突無し)および断片(衝突の結果)のスペクトルが収集される。
【0057】
代替実施形態は、いずれかの適切な知られている装置を含む、いずれかの適切な衝突断片化または反応装置などのその他の断片化手段を利用する。いくつかの随意的な装置は:(i)表面誘起解離(「SID」)断片化装置、(ii)電子移動解離断片化装置、(iii)電子捕獲解離断片化装置、(iv)電子衝突または衝撃解離断片化装置、(v)光誘起解離(「PID」)断片化装置、(vi)レーザ誘起解離断片化装置、(vii)赤外線放射誘起解離断片化装置、(viii)紫外線放射誘起解離断片化装置、(ix)ノズル−スキマ間インターフェース断片化装置、(x)インソース断片化装置、(xi)イオン源衝突誘起解離断片化装置、(xii)熱または温度源断片化装置、(xiii)電界誘起断片化装置、(xiv)磁場誘起断片化装置、(xv)酵素消化または酵素分解断片化装置、(xvi)イオン−イオン反応断片化装置、(xvii)イオン−分子反応断片化装置、(xviii)イオン−原子反応断片化装置、(xix)イオン−準安定イオン反応断片化装置、(xx)イオン−準安定分子反応断片化装置、(xxi)イオン−準安定原子反応断片化装置、(xxii)イオンを反応させて付加物または生成物イオンを形成するためのイオン−イオン反応装置、(xxiii)イオンを反応させて付加物または生成物イオンを形成するためのイオン−分子反応装置、(xxiv)イオンを反応させて付加物または生成物イオンを形成するためのイオン−原子反応装置、(xxv)イオンを反応させて付加物または生成物イオンを形成するためのイオン−準安定イオン反応装置、(xxvi)イオンを反応させて付加物または生成物イオンを形成するためのイオン−準安定分子反応装置、および(xxvii)イオンを反応させて付加物または生成物イオンを形成するためのイオン−準安定原子反応装置、を含む。
【0058】
衝突セル218の出力は、質量分析器220に入力される。質量分析器220は、四重極、飛行時間形(TOF)、イオントラップ、磁気セクタ質量分析器、およびそれらの組合せを含む、いずれかの適切な質量分析器である。検出器222は、質量分析器220から発するイオンを検出する。検出器222は、質量分析器220と随意に一体化される。たとえば、TOF質量分析器の場合、検出器222は随意的に、イオンの強度を計測する、すなわち衝突イオンの数を計測するマイクロチャネルプレート検出器である。記憶媒体224は、分析用のイオン数を記憶するための永久記憶装置を提供する。たとえば、記憶媒体224は、内蔵または外付けコンピュータディスクである。分析コンピュータ226は、記憶されたデータを分析する。データは、記憶媒体224への記憶を必要とすることなく、リアルタイムで分析されることも可能である。その場合、検出器222は、最初に永久記憶装置に記憶させることなく、分析されるデータをコンピュータ226に直接送る。
【0059】
衝突セル218は、前駆体イオンの断片化を行う。断片化は、ペプチドの配列を決定し、その後起源タンパク質の同一性に導くために、使用され得る。
【0060】
衝突セル218は、窒素などの気体を利用する。帯電したペプチドが気体の分子と相互作用すると、結果的に生じる衝突が、1つ以上の特徴的な結合で分解することによって、ペプチドを断片化することができる。最も一般的な結果的断片化は、YまたはBイオンとして記述される。このような断片化は、ペプチド前駆体のMSスペクトルを取得する低電圧状態(低エネルギー)と、前駆体の衝突誘起断片のMSスペクトルを取得する高電圧状態(高エネルギー)との間で衝突セルの電圧を切り替えることによって、オンライン断片化として実現されることが可能である。電圧はイオンに運動エネルギーを与えるために使用されるので、高電圧および低電圧は、高エネルギーおよび低エネルギーと称される。
【0061】
クロマトグラフィモジュール204は、カラムに基づく機器など、知られている機器を含む、いずれかの適切なクロマトグラフィ機器を含む。適切なカラムは、クロマトグラフィ分野の当業者に知られているカラムを含む。カラムは、たとえば金属または絶縁材料などから形成されることが可能である。適切な材料は、鋼、溶融石英、または裏打ちされた材料など、知られている材料を含む。カラムは、直列および/または並列構成で配置された、2つ以上のカラムを含むことができる。たとえば、カラムは毛細管カラムでもよく、複数の毛細管を含むことができる。
【0062】
コンピュータモジュール226は、データ通信分野において知られているものなど、有線および/または無線手段を通じてシステム200のその他の部品とデータ通信している。モジュール226は、たとえば質量分析計モジュール212から処理データを受信し、制御信号を提供する。モジュール226は随意的に、上述の化学分析のための方法100など、本明細書に記載の方法を、および/または図1のステップ150の結果として取得される入力データ集合をさらに処理するために本明細書に記載された異なる技術を実現するように構成される。モジュール226は、様々な例示的実施形態において、ソフトウェア、ファームウェア、および/またはハードウェア(たとえば、特定用途向け集積回路として)において実現され、望ましければ、ユーザインターフェースを含む。モジュール226は、記憶装置224などの記憶部品を含み、および/またはこれと通信する。
【0063】
モジュール226の適切な埋め込みは、たとえば、マイクロプロセッサなどの1つ以上の集積回路を含む。いくつかの代替実施形態における単一の集積回路またはマイクロプロセッサは、モジュール226およびシステム200のその他の電子部を含む。いくつかの実施形態において、1つ以上のマイクロプロセッサは、モジュール226の機能を可能にするソフトウェアを実行する。いくつかの実施形態において、ソフトウェアは、汎用機器および/または本明細書に記載される機能性のために設けられた専用プロセッサを実行するように設計されている。
【0064】
LC/MS実験は、その出力の1つとして、マスクロマトグラムを生成することができる。マスクロマトグラムは、特定の質量値における時間関数として記録される応答(強度)の集合または群である。マスクロマトグラムにおいて、質量値は、ある範囲内の中央値であってもよい。つまり、与えられた時間における強度は、質量値の特定の範囲に亘って収集された強度を組み合わせることによって、取得されてもよい。通常、マスクロマトグラムは1つ以上のクロマトグラフィピークを含む。
【0065】
単一の分子、または化学物質は、特定の質量を有する。LC/MS実験において、その分子のイオン化された形態は、そのイオンの質量値をその電荷で除した商(質量対電荷比)におけるクロマトグラフィピークとして観察される。クロマトグラフィピークは、ピークプロファイル、または溶離プロファイルを有する。クロマトグラフィ・ピーク・プロファイルは、頂点保持時間、ピーク幅、離昇時間および接地時間を含む、いくつかの特徴を使用して、特徴付けられることが可能である。クロマトグラフィピーク幅は、特定のピーク高での幅(FWHM、50%高さでの幅)、または変曲点の間の幅、として、あるいは標準偏差として、記述されることが可能である。頂点強度またはクロマトグラフィピーク高は、クロマトグラフィ・ピーク・プロファイルで見られる最大強度である。一般的に、頂点強度は基準調整されている。
【0066】
クロマトグラフィ分離によって分離され、カラムから溶離した溶離液中の分子は、共通溶離分子または起源分子と称される。起源分子は、質量分析計のイオン化源を通じてイオン化される。結果的に生じるイオンは、LC/MSまたはLC/MSEスペクトルで測定される。文脈に応じて、LC/MSが通常はデータ取得のLC/MS処理を指す場合もあることに留意されたい。本明細書に記載される、たとえば図2Bに関連するような、スペクトルの形状などにおいて、収集および提示されるデータに関連して、MSスペクトルは、断片化されていない前駆体からのスペクトルを指してもよい。MSEスペクトルは、高エネルギースペクトル(すなわち、断片化された前駆体、つまり、「MSE」で標識された生成物イオンからのスペクトル)を指してもよい。同位体組成および/または断片化処理の結果、各起源分子は、各々が質量および電荷の固有値を有する、複数のカテゴリのイオンを発生させることができる。起源分子に対応するイオンは、前駆体イオン、または単に前駆体と称される。
【0067】
ペプチド消化において、起源分子はペプチドであり、ペプチドに対応するイオンは前駆体と称される。起源分子に由来するいずれのイオンも、前駆体であるか断片であるかにかかわらず、前駆体と同じ保持時間およびクロマトグラフィ・ピーク・プロファイルを有していなければならない。
【0068】
LC/MS実験において、イオンはその保持時間、質量対電荷比、および強度によって、記述および/または参照されることが可能である。単一の分子はLC/MSクロマトグラムにおいて、イオンのクラスタとして現れることができる。ペプチドは、1つ以上のイオンクラスタを発生させる。各クラスタは、異なる電荷状態(たとえば、Z=1またはZ=2)に対応する。クラスタ中の各イオンは、ペプチドの異なる同位体組成に対応する。共通ペプチドからのイオンのクラスタにおいて、単一同位体は最低質量を有するイオンであって、ここで全ての同位体は、その最も豊富な、低質量状態にある。クラスタ中のイオンは共通の起源分子から生じているので、これらは共通の保持時間およびピークプロファイルを共有するはずである。
【0069】
起源分子は、同位体および電荷効果のため、複数のイオンを発生させることができる。また、イオンの重要な源は、起源分子の断片である。これらの断片は、起源分子を離散させる処理から発生する。これらの処理は、イオン化源または衝突セルにおいて生じる。断片イオンは共通の溶離起源分子に由来するので、これらは起源分子と同じクロマトグラフィ保持時間およびピークプロファイルを有するはずである。
【0070】
一般的に、起源分子がNイオンに由来する場合、およびこれら質量分析計によって十分に解析される場合には、各マスクロマトグラムが起源分子に由来するイオンのクロマトグラフィプロファイルであるピークを含む、Nマスクロマトグラムが存在できる。これらNイオンの各々の保持時間およびピークプロファイルは、同一となる。共通保持時間実体という用語は、LC/MS分離において、全て同じ保持時間およびピーク形状を有するクロマトグラフィピークを生じさせる起源分子の全てのイオンを指す。
【0071】
イオン形成、断片化、およびイオン検出の時間は一般的に起源分子のピーク幅よりもはるかに短いので、共通の起源分子に由来するイオンの保持時間およびピーク形状は同じである。たとえば、半値全幅(FWHM)で測定された、典型的なクロマトグラフィピーク幅は、5〜30秒である。イオン形成、断片化、および検出の時間は、通常はミリ秒未満である。このように、クロマトグラフィの時間尺度では、イオン形成の時間は瞬間的処理である。すると、ある起源分子に由来するイオンの観察された保持時間の差は、実質的にゼロということになる。つまり、ある起源分子に由来するイオン間のミリ秒未満の保持時間差は、クロマトグラフィピーク幅と比較すると小さい。
【0072】
ある起源分子に関連するイオンは、いくつかのカテゴリのうちの1つに収まる。ある起源分子に由来するイオンは、前駆体、前駆体の断片、または断片の断片、あるいは上記質量のいずれかの中性損失であってもよい。これらの質量のいずれかが、1つ以上の個別同位体状態において、および1つ以上の電荷状態において、見られる。
【0073】
ペプチドの場合、与えられたペプチドは一般的に、各々が明らかな同位体状態にあり、各々が1つ以上の電荷状態にある、イオンのクラスタであるように見える。理想的には、イオン化源は、中性起源分子から形成されるタンパク化合化形状である前駆体を生成する。1つ以上の陽子は中性分子に取り付けられることが可能であり、したがって前駆体は、Z=+1または+2などの電荷を有する中性よりも高い1つ以上の質量単位となることができる。実際に、この前駆体(mwHPlusと称される)は、水、アンモニア、またはリン酸塩などの中性分子の損失から生じる、低質量体を伴ってもよい。通常、YまたはBイオンを生成する際に、源において、断片化が起こる可能性がある。断片化はまた、衝突セル中の気体分子との下流相互作用によって意図的に誘起されることも可能である。
【0074】
無傷の前駆体イオンの衝突誘起解離から生成されるイオンに関して、断片生成物イオンはその親前駆体イオンに関連づけられる。高低データ取得モードで質量分析計を使用することによって、この関連づけは、その後の断片化のために単一の前駆体を事前選択するための機器を必要とせずに実現される。より具体的には、関連づけられたイオンは、基本的に同じ保持時間で、複数の前駆体が同時に断片化しているときに、適切にグループ化される。このように、本発明の実施形態は、時間的に同時に断片化している2つ以上の前駆体があるときに、生成物イオンをそのそれぞれの前駆体に割り当てることができる。
【0075】
本発明の方法は、起源分子が前駆体イオンおよび断片イオンを生成する場合、ペプチド以外の混合物に適用可能である。本発明の実施形態はこのように、プロテオミクス、メタボロミクス、およびメタボノミクスにおいて使用可能である。
【0076】
カラム210など、クロマトグラフィ支持マトリクスから溶離する分子(ペプチド、代謝産物、天然生成物)の保持時間およびクロマトグラフィ・ピーク・プロファイルは、支持マトリクスと移動相との間のその分子の物理的相互作用の関数である。分子が支持マトリクスと移動相との間に有する相互作用の度合いは、その分子のクロマトグラフィプロファイルおよび保持時間を決定する。複合混合物において、各分子は化学的に異なる。その結果、各分子は、クロマトグラフィマトリクスおよび移動相に対する異なる親和性を有することができる。それゆえに、各々が固有のクロマトグラフィプロファイルを呈することができる。
【0077】
一般的に、特定の分子のクロマトグラフィプロファイルは固有であって、その分子の物理化学的特性を記述する。与えられた分子のクロマトグラフィ・ピーク・プロファイルを特徴付けるために随意的に使用されるパラメータは、その一部を挙げるだけでも、初期検出時間(離昇)、正規化勾配、ピーク頂点の時間に対する変曲点の時間、最大応答時間(ピーク頂点)、変曲点の、半値全幅(FWHM)の、ピーク幅、ピーク形状対称、および最終検出(接地)、を含む。
【0078】
図2Bは、本発明の一実施形態による、前駆体の溶離ピークを含む期間の質量スペクトルの一群を示す、3つの関連するグラフを示す。第一のグラフ254は、低エネルギースペクトル(すなわち、「MS」で標識された、断片化されていない前駆体からのスペクトル)および高エネルギースペクトル(すなわち、「MSE」で標識された生成物イオンである、断片化前駆体からのスペクトル)の溶離時間にわたる、交互の群を示す。第二および第三のグラフ254A、254Bはそれぞれ、MSおよびMSEスペクトル収集時間および前駆体に関連づけられた保持時間ピークの復元を示す。
【0079】
復元されたピークは、単一の前駆体のクロマトグラフィ溶離プロファイルを表す。横軸は、ピークプロファイルの溶離時間に対応する。縦軸は、クロマトグラフィカラムから溶離するときの前駆体の時間変動濃度に関連づけられた強度の任意の単位に対応する。
【0080】
質量分析計に送られると、溶離前駆体は、このように、低および高エネルギーモードにおいてイオンを生成する。低エネルギーモードで生成されたイオンは第一に、可能であれば異なる同位体および電荷状態における、前駆体イオンのものである。プロテオミクスの研究において、前駆体イオンは、無傷のタンパク質の酵素消化(通常はトリプシン消化)から生成されたペプチドである。高エネルギーモードでは、イオンは第一に、断片の異なる同位体および電荷状態、またはこれら前駆体の生成物イオンである。高エネルギーモードは、上昇エネルギーモードとも称される。
【0081】
グラフ254において、交互の白黒の棒はこのように、溶離クロマトグラフィピークの低および高エネルギー電圧でスペクトルが収集された時間を表す。低エネルギーグラフ254Aは、低エネルギー電圧が衝突セル218に印加された時間を示し、その結果、低エネルギースペクトルとなっている。高エネルギーグラフ254Bは、高エネルギー電圧が衝突セル218に印加された時間を示し、その結果、高エネルギースペクトルとなっている。
【0082】
前駆体のクロマトグラフィピークはこのように、高および低エネルギーモードによって、複数回抽出される。これらの複数のサンプルから、ピークに関連づけられて高および低エネルギースペクトルで見られる全てのイオンの正確な保持時間が推測される。これらの正確な保持時間は、それぞれのスペクトルから抽出された強度の補間によって取得される。
【0083】
以下に記載されるパラグラフおよび図面において、複数の注入からのスペクトルを組み合わせるために使用されてもよい、本明細書に記載される技術が参照される。このように、一実施形態は、出力スペクトルが複数の注入からの入力スペクトルを組み合わせた結果を表す、本明細書に記載される技術をもって実行される処理の結果として、出力スペクトルを生成してもよい。
【0084】
図3を参照すると、図1に示される方法を実行した結果として得られ得る入力データ集合306に対して一実施形態で実行されてもよい処理のブロック図が示されている。例300は、入力データ集合処理310に入力される、入力データ集合306およびセレクタ302を含む。処理310は、出力データ集合308を生成する。本明細書により詳細に記載される一実施形態において、入力データ集合306は、セレクタ302の値に応じた様々な異なる保持時間一致および生成物イオン選択技術から選択されたものを使用して後に処理される、1つ以上の注入のLC/MSシステムを使用して得られた、前駆体および生成物イオンデータを含んでもよい。一実施形態は、出力データ集合308を生成するための1つ以上のこのような技術を含んでもよい。1つ以上のこのような技術を含む一実施形態において、セレクタ302の値は、入力データ集合306を処理するために使用されてもよい異なる技術のうちのいずれかを選択するために、指定されてもよい。処理310は、出力データ集合308によって表されるように、前駆体および生成物イオンデータの複数のスペクトルを減少または組み合わせて1つの前駆体および生成物イオンスペクトルにするために選択された技術にしたがって、異なる規則または基準を使用してもよい。その結果、出力データ集合308は、本明細書の別の箇所により詳細に記載されるように、単一の前駆体に関連すると判断されたこれらの生成物イオンを同定する。
【0085】
以下に記載されるのは、一実施形態に含まれ、前駆体の保持時間一致の実行および入力データ集合に含まれる関連生成物イオンの選択に関連して使用されて得る技術である。第一の保持時間一致および生成物イオン選択技術は、本明細書では「Supertrack」と称されてもよく、これは2006年12月14日に公開された、Gorensteinらによる、国際公開第2006/133191号パンフレット、米国特許出願公開第2006/021919号明細書(‘919 PCT公開)、METHODS AND APPARATUS FOR PERFORMING RETENTION−TIME MATCHING に記載されており、これは参照により本明細書に組み込まれる。Supertrackの一実施形態において、与えられた前駆体の出力データ集合は、ある生成物イオンが入力データ集合の2つ以上の追跡スペクトルに含まれる場合、その生成物イオンを含む。追跡スペクトルとは、選択された対象となる前駆体を含むと判断されたスペクトルを指す。複数の注入および対応するスペクトルにおいて同じ前駆体を追跡するための異なる技術は、本明細書の別の箇所に記載されている。
【0086】
第二の保持時間一致および生成物イオン選択技術は、本明細書では「Sumtrack」と称されてもよく、これは、与えられた前駆体について、生成物イオンが入力データ集合の少なくとも1つの追跡スペクトルに含まれている場合に出力データ集合がその生成物イオンを含むように、和集合演算、またはその実行における論理的な同等処理を実行してもよい。第三の保持時間一致および生成物イオン選択技術は、本明細書では「Hitrack」と称されてもよく、これは、与えられた前駆体について、出力データ集合が、その前駆体が最大強度を有する入力データ集合のスペクトルに関連付けられた生成物イオンスペクトルを含むことを判断する。入力データ集合が3つのスペクトルを含み、その各々が異なる注入のものであって同じ前駆体が3つの全てのスペクトルで追跡される実施形態において、Hitrackは、その前駆体が最も強力な入力データ集合から、3つの追跡スペクトルの前駆体および生成物イオンスペクトルを選択する。前駆体と一致した保持時間である選択されたスペクトルにおける生成物イオンは、出力データ集合に含まれる。第四の保持時間一致および生成物イオン選択技術は、本明細書では「Mergetrack」と称されてもよく、これは、SumtrackおよびHitrackに関連づけられた処理の組合せを使用するものとして特徴付けられてもよい。先の最後の3つの技術の実施形態は、以下のパラグラフにより詳細に記載される。1つの実施形態は、いずれかの組合せにおいてこれらの技術のうちいずれか1つ以上を含んでもよい。
【0087】
以下のパラグラフにおいて、Sumtrackの実施形態が最初に記載され、MergetrackおよびHitrack技術の例示的実施形態がその後に続く。当業者によって理解されるように、前駆体および生成物イオンの間の保持時間一致およびSumtrackに関連して述べられたように異なる注入にわたって前駆体イオンを追跡することに関する一般的な議論は、入力データ集合に異なる規則を適用することと組み合わせて、保持時間一致および生成物イオン選択を実行するその他の技術を使用することにも、適用可能である。
【0088】
本明細書に記載される保持時間および生成物イオン選択技術の各々は、どの生成物イオンが前駆体に関連しているかを判断するための生成物イオン選択基準の集合を使用する。基準は、前駆体に関連すると判断された生成物イオンの選択に関連して使用される規則を特定する。全ての技術は、前駆体および生成物イオンの間の保持時間一致を実行する。特定の技術によって異なる追加基準が使用されてもよい。Sumtrack技術の実施形態は、処理を実行して、生成物イオンが少なくとも1つのスペクトルにおいて前駆体と一致する保持時間を有する場合に、生成物イオンがその前駆体と関連があると判断する。Sumtrack技術の実施形態は、上記に関連して、和集合演算、またはその同等処理を使用してもよい。Hitrack技術の実施形態は、被追跡前駆体強度がその被追跡前駆体を含む全スペクトルの中で最大である被追跡前駆体を含むスペクトルの選択を実行してもよい。Hitrack技術の実施形態に関連して、前駆体と一致する保持時間を有する選択されたスペクトル中の各生成物イオンは、その前駆体に関連すると判断される。Mergetrack技術の第一の実施形態は、前駆体に関連する生成物イオンの集合の判断において、Hitrack技術の基準を使用してもよい。Mergetrack技術の第二の実施形態は、前駆体に関連する生成物イオンの集合の判断において、Sumtrack技術およびHitrack技術の両方の基準を使用してもよい。本明細書に記載されるMergetrack技術の第一および第二の実施形態の結果、ある前駆体について同じ生成物イオンおよび対応する強度が選択されることに留意されたい。しかし、両方の実施形態は、その前駆体の関連生成物イオンの上記選択を行うために、異なる処理を実行する。
【0089】
本明細書に記載されるように、前駆体は、複数の注入にわたって追跡されてもよい。前駆体の質量および保持時間値にしたがって、複数の注入において同じ前駆体が同定されてもよい。前駆体の断片化の結果生成される生成物イオンは、前駆体と実質的に同じ保持時間を有することになる。このような生成物イオンは、その前駆体に関連するとして特徴付けられてもよい。複数の注入において、異なる生成物イオンが、同じ前駆体に関連するように見えるかもしれない。Sumtrackに関連して、和集合演算、またはその同等処理が、前駆体と実質的に同じ保持時間を有することによってその前駆体に関連する複数の注入にわたる全ての生成物イオンをまとめて判断するために、実行され得る。このように、Sumtrackでは、生成物イオンが1つ以上の注入において前駆体と実質的に同じ保持時間を有する場合に、その生成物イオンはその前駆体に関連する生成物イオンの集合に含まれる。前駆体に関連するこのような生成物イオンの各々について、強度和は、関連生成物イオンが現れる全ての注入にわたって関連生成物イオンの強度を加えることによって、判断されてもよい。
【0090】
複数の入力スペクトルからのデータが組み合わせられ得る、Sumtrackなどの本明細書に記載される技術に関連して、一実施形態が、出力スペクトルにおける生成物イオンの強度和を含み得ることに留意されたい。本明細書の別の箇所に記載されるように、2つの異なるスペクトル中の2つの生成物イオンは、両方の生成物イオンが与えられた質量公差の範囲内の質量値を有する場合に、同じ質量を有すると判断されてもよい。生成物イオンの強度和は、複数の入力スペクトル中の生成物イオンの各発生がある程度の質量公差範囲内の質量値を有する場合に、複数の入力スペクトルから取得された生成物イオンの強度追加の結果として、生成されてもよい。出力スペクトル中の生成物イオンの質量は、たとえば、それぞれの強度によって各入力スペクトルの生成物イオンの質量に重み付けすることによってなど、ある規則によって決定されてもよい。このように、一実施形態は、入力スペクトル中の生成物イオンの発生を(質量によって)特定し、その強度がそれら特定された発生の強度の和である出力スペクトル中の単一の生成物イオンとそのような発生を置き換え、出力スペクトル中の生成物イオンに質量値を割り当てることによって、強度和を有する生成物イオンを含む出力スペクトルを生成してもよい。
【0091】
一実施形態において、最大強度を有するこれらの生成物イオンが、同定、発見、および本明細書に記載されるような技術および当業者に知られている技術のその他の用途で使用されてもよいように、強度和は、関連生成物イオンの選択と関連して使用されてもよい。
【0092】
複数のタンパク質を含む複合タンパク質試料などの試料または混合物に関連して、多くの前駆体イオンは、同じ保持時間を有してもよい。前駆体イオンが断片化されると、断片化の結果生成された生成物イオンもまた、その前駆体と同じ保持時間を有することになる。同じ保持時間を有するであろう多数の前駆体イオンのため、異なる前駆体からの生成物イオンが、実質的に同じ保持時間を有する可能性がある。その結果、生成物イオンをそれぞれの正しい前駆体イオンと一致させることは難しいかも知れない。生成物イオンをその生成物イオンが由来する適切な前駆体イオンと一致させることには、本明細書に記載され、当業者にとって知られている多くの用途がある。
【0093】
LC/MSの文脈において、Sumtrackおよび本明細書に記載のその他の技術などの保持時間一致および生成物イオン選択技術は、これらの生成物イオンおよび同じ保持時間およびピーク形状を有してその生成物イオンが由来する関連前駆体イオンを発見する。本明細書に記載される技術は、生成物イオンと前駆体との関連性を提供し、生成物イオンおよび実質的に同じ測定保持時間を有する前駆体が、保持時間整合に基づいて出力スペクトルに含まれることを保証する。
【0094】
保持時間一致および生成物イオン選択を実行する技術は、単一試料と同様に、複合試料にも関連して使用されてよい。複合試料は、血清、組織、および細胞などの関連技術において知られている様々な異なる生物試料のいずれか1つと同様に、たとえばタンパク質混合物なども、含んでもよい。保持時間一致および生成物イオン選択技術はまた、単一ポリペプチドの単純な試料に関連して使用されてもよい。
【0095】
Sumtrackおよび本明細書に記載のその他の技術などの関連生成物イオンとの前駆体の保持時間一致の技術は、たとえば、タンパク質同定技術において使用されるポリペプチドプロファイルを生成するための、‘919PCT公開に記載されている技術に関連して、使用されてもよい。上述の‘919PCT公開に記載されているように、1つ以上のプロファイルが、試料中の1つ以上の関連するタンパク質のために定義されてもよい。タンパク質プロファイルは、タンパク質と関連する前駆体イオンの保持時間、イオン質量、およびイオン強度に関する値によって定義される。随意的に、タンパク質のプロファイルはまた、タンパク質の同定によって定義されてもよい。いくつかの好適な実施形態は、プロファイル中に生成物イオンデータを含む。このように、タンパク質のプロファイルは、タンパク質の前駆体に関連づけられる生成物イオンの保持時間、イオン質量、およびイオン強度に関連する値によっても定義されてよい。プロファイルは、後に分析される対象試料中のタンパク質を検出、同定、および/または定量化する際に後に使用するために、プロファイルのカタログに記憶されてもよい。随意的に、プロファイルは、対応する掲載タンパク質に関連する前駆体イオンの保持時間、イオン質量、およびイオン強度に関連する値でデータベースに掲載されたタンパク質に注釈をつけることによって、既存のタンパク質データベースにおいて定義される。
【0096】
本明細書に記載されるようなタンパク質のためのプロファイルに関連して、そのタンパク質について最も強力な前駆体と判断された前駆体イオンの集合が、タンパク質を同定するために使用されてもよい。プロファイルは、そのタンパク質が他のタンパク質から区別され得るように、十分な特異性までタンパク質を検出、同定、追跡、および/または定量化するために、使用されてもよい。プロファイルはまた、最も強力な前駆体の各々に関する付加的情報を含んでもよい。付加的情報は、たとえば、各前駆体に関連づけられる1つ以上の生成物イオン、および1つ以上の生成物イオンの各々に関するデータ(たとえば保持時間、強度、および/または質量あるいはm/zなど)を含んでもよい。保持時間一致および生成物イオン選択技術は、プロファイル中に含まれる最も強力な前駆体に関連付けられる生成物イオンを同定するために、使用されてもよい。最も強力な前駆体イオンの質量、および十分な数のその生成物イオンの質量などの、プロファイルからの情報は、タンパク質の配列を高い信頼性で、同定することができる。
【0097】
以下のパラグラフに記載される、Sumtrackおよびその他の技術など、本明細書に記載される技術は、ペプチドおよびタンパク質を検出、同定、追跡、および/または定量化するために使用されてもよく、プロテオミクスにおける問題を解決するかも知れない。本明細書に記載される技術はまた、生物学的ではないとして特徴付けられる可能性のある試料および混合物と関連して、使用されてもよい。プロテオミクス用途に関連して、ペプチドは、試料タンパク質の酵素消化に起因してもよい。ペプチド前駆体の確実な同定は、試料タンパク質の同定および定量化を可能にする。
【0098】
本明細書に記載される保持時間一致および生成物イオン選択技術は、生成物イオンと前駆体との誤った一致を補償するために、統計的方法などのその他の方法論を使用せずに決定論的なやり方で、確実に生成物イオンを前駆体に割り当てまたは一致させるために、使用されてもよい。本明細書に記載される技術を利用して同定された前駆体および関連生成物イオンは、データベースのみに、あるいは既存のデータストアに注釈を付けるときなどにその他のデータに関連づけられて、記憶されてもよい。データストアは、データを記憶するために使用される、様々な異なるデータ格納庫のいずれか1つとして特徴付けられてもよい。その例としては、データベース、1つ以上のファイル、ディレクトリ、などを含むが、これらに限定されない。本明細書に記載されるようなタンパク質プロファイルを含むカタログは、上記のいずれか1つ以上を使用して実現されてもよい。
【0099】
本明細書に記載される説明的な例は、Bateman(参照により本明細書に組み込まれる、米国特許第6,717,130号明細書)に記載される上述の技術を使用して分析されたタンパク質消化を使用する用途を参照してもよい、一実施形態は、たとえば、選択された前駆体イオンを単離し、選択された単離前駆体のために生成物イオンを同定するために使用される、データ依存分析または取得(DDA)などの、関連技術において知られているその他の方法論を使用して、主に図1に示されるようなデータ集合を生成してもよい。一実施形態において、質量分析計は、質量分析計が衝突セルおよび四重極を含むDDAを実行するために使用されてもよい。DDA技術にしたがって操作する際に、四重極は、第一段階において、対象の前駆体のみを選択的に単離および選択するためのフィルタとして使用される。このように、選択された前駆体のみが、第一フィルタリング段階の出力として生成される。選択された前駆体はその後、衝突セルに送られ、そこで十分に高い電圧を利用して、断片または生成物イオンを生成して、単離された前駆体および生成物イオンの所望の数の走査を取得するために、断片化される。上述のDDA技術は、異なる前駆体を単離して、前駆体および関連生成物イオンの所望の数の走査を取得するために、繰り返されてもよい。
【0100】
本明細書に記載される保持時間一致および生成物イオン選択技術のいずれかに関連して、一実施形態は、様々な異なる技術を利用して、対象とする特性の前駆体の質量を決定してもよい。たとえば、本明細書の別の箇所に記載されるBateman技術を利用する一実施形態において、1つ以上の前駆体イオンを含むスペクトルを生成するために、低エネルギー(LE)サイクルまたはモードが使用されてもよい。DDA技術など、入力データ集合を生成するために使用されるその他の技術もまた、前駆体を単離してその固有の質量を決定するために、使用されてもよい。選択された前駆体および関連する質量は、その後入力データ集合において同定されてもよい。
【0101】
本明細書に記載される技術を使用する一実施形態において、質量分析計を使用する異なる実験から生成された質量スペクトルが、比較されてもよい。本明細書に記載される保持時間一致および生成物イオン選択技術は、入力データ集合に質量スペクトルを含んでもよく、以下のパラグラフでより詳細に説明される和集合演算を使用して、前述の質量スペクトルの前駆体および関連生成物に関する情報を組み合わせてもよい。質量スペクトルは、複数の前駆体のデータを含んでもよい。図解および説明の簡素化のため、質量スペクトルが、前駆体と実質的に同じ測定保持時間およびピーク形状を有する単一の前駆体および生成物イオンに関するデータを含み得る例が、本明細書に記載される。しかし、生成物イオンは、異なる質量またはm/z値を有する。異なるスペクトルの各々における単一の前駆体およびその関連生成物イオンの保持時間は、可能性のある測定誤差によって被る誤差の予想される保持時間枠の範囲内であってもよい。一実施形態において、誤差の枠は、半値全幅(FWHM)方法論を使用して決定された前駆体の保持時間のピーク幅の1/10の閾値の範囲内であってもよい。関連技術において知られているように、FWHMは、曲線がその最大値の半分に到達する、クロマトグラフィピークの両側の2つの点の間の距離として決定される。一実施形態はまた、一実施形態において利用されるシステムおよび方法論の予想される誤差に応じて、予想される誤差の上記枠として、その他の値を使用してもよい。
【0102】
データ集合に含まれる質量スペクトルは、各々が保持時間公差枠(以下のパラグラフにより詳細に記載されるとおり)の範囲内の保持時間を有する、複数の注入の前駆体を含んでもよい。質量スペクトルの各々はその後、単一の保持時間にしたがって、整合または正規化されてもよい。たとえば、データ集合中の質量スペクトルは、別の質量スペクトル中の前駆体のいくつかのクロマトグラフィFWHMの保持時間を備える前駆体を有するこれらの質量スペクトルを含んでもよい。データ集合中のスペクトルの各々はその後、「n」などの、単一の保持時間において整合されてもよい。整合処理において、スペクトル中の各前駆体イオンは、保持時間「n」で前駆体を整合するために、ある量だけ、ある方向に、移動させられる。さらに、スペクトルの生成物イオンもまた、スペクトル中の前駆体の移動に応じて、同じ量だけ、および同じ方向に、移動させられる。上述の整合は、各スペクトルに対して繰り返される。整合の後、各スペクトルが調べられてもよい。スペクトル中の生成物イオンが、クロマトグラフィピーク幅の1/10の前駆体保持時間「n」に対する誤差の枠内(たとえば、該イオンに関するクロマトグラフィピークのクロマトグラフィFWMHの「n」±1/10)に収まる保持時間を有する場合、その生成物イオンもまた前駆体と同じ保持時間「n」を有すると判断され、その前駆体と一致する。対照的に、生成物イオンの保持時間が誤差の枠外である場合、その生成物イオンは、その特定のスペクトル中のその前駆体とは一致しないと判断される。一旦全てのスペクトルが処理されると、本明細書に記載される1つ以上の異なる保持時間一致および生成物イオン選択技術に関する規則が適用されてもよい。
【0103】
本明細書に記載される保持時間一致および生成物イオン選択技術とともに使用されるデータ集合は、様々な異なる技術を使用して生成される、MSスペクトルなどのスペクトルを含んでもよい。たとえば、スペクトルは、Batemanの技術またはDDA技術を使用する複合混合物のLC/MS分析を使用して、取得されてもよい。データ集合はまた、MALDI−MS−MSから、および高または低分解能の分析計を使用して、取得されてもよい。
【0104】
保持時間一致および生成物イオン選択技術に関連して使用されるデータ集合に含まれる生成物イオンは、関連技術において知られている様々な異なる方法論を利用して生成されてもよい。生成物イオンは、様々な異なる断片化技術のいずれか1つを利用して生成されてもよい。一実施形態は、ペプチド混合物の単一注入のLC/MS分析の一部として適用される高および低エネルギー切り替え手順を使用して、Batemanに記載される質量分析(MS)方法論を使用してもよい。そのようなデータにおいて、低エネルギー(LE)スペクトルは、主に断片化されていない前駆体からのイオンを含み、その一方で高エネルギー(HE)スペクトルは、主に断片化された前駆体または生成物イオンからのイオンを含む。
【0105】
本明細書に記載される保持時間一致および生成物イオン選択技術が適用されるデータ集合中の各スペクトルは、単一の分析または実験から取得されてもよい。たとえば、LC/MS分析の文脈において、入力データ集合に含まれるM個のスペクトルの各々は、M個の異なる注入から取得されてもよい。これらM個の注入は、同じアリコート(たとえば、複製注入)のM個の注入からのものであってもよい。あるいは、M個の注入の各々は、異なる試料混合物を使用してもよい。一実施形態はまた、ある程度の数の異なる試料混合物のある程度の数の複製注入からスペクトルが生成されているデータ集合を使用してもよい。
【0106】
LC/MSの文脈において、保持時間一致および生成物イオン選択技術は、生成物イオン、および同じ保持時間およびピーク形状を有する生成物イオンがそこに由来する関連前駆体イオンを見出す。本明細書に記載される全ての保持時間一致および生成物イオン選択技術は、生成物イオンと前駆体との関連性を提供し、実質的に同じ測定保持時間を有する生成物イオンおよび前駆体が、その前駆体に対する保持時間整合に基づく出力スペクトルに含まれることを確実にする。
【0107】
本明細書の保持時間一致および生成物イオン選択技術は、生成物イオンが由来する前駆体イオンとの密接な関連性をその生成物イオンが維持するという原理に基づいている。この関連性は、実質的に同じ測定保持時間で現れる生成物イオンおよび前駆体イオンの両方によって、示されてもよい。保持一致技術は、選択された前駆体と無関係のイオンは入力データ集合で分析されたスペクトルのために上述の関連を維持しないということを利用している。
【0108】
本明細書の技術のいずれかに関連して、異なる注入における2つの前駆体イオンは、その質量が所定の公差枠内にあって、いずれもある程度の保持時間公差範囲内となる保持時間を有する場合、異なる注入における同じ前駆体の事例であると判断されてもよい。異なる注入に現れて所定の質量公差枠内の質量を有する2つの生成物イオンは、同じ生成物イオンの事例であると判断されてもよい。第一のイオンの第一質量が第二のイオンの第二質量の所定の質量公差の範囲内にあるとき、2つのイオンは同じ質量を有すると見なされてもよい。この質量公差は、生成物イオンと同様に前駆体イオンに関連して本明細書に記載される技術とともに使用されてもよい。一実施形態において、質量公差は、百万分率(PPM)で表記される質量スペクトルに含まれ得るように、質量スペクトルピークのFWHMの±1/10であってもよい。その他の質量公差が、実施形態に関連して使用されてもよく、実施形態ごとに異なってもよい。
【0109】
前駆体および生成物イオンは、各々が本明細書の別の箇所に記載される誤差枠サイズまたは保持時間枠に応じて決定される同じ保持時間を有する場合、関連していると見なされる。一実施形態において、前駆体と生成物イオンとの一致に関連して使用される誤差枠サイズまたは保持時間枠は、質量スペクトルピークのクロマトグラフィFWHMと、または入力データ集合においてスペクトルを取得するために使用されるMS機器などの機器の分解能に関連するその他の公差と、関連づけられてもよい。
【0110】
Sumtrackなどの、本明細書に記載される保持時間一致および生成物イオン選択技術の1つを使用した結果として、前駆体イオンに関連すると見なされるこれらの生成物イオンを含む出力スペクトルが生成されてもよい。
【0111】
本明細書に記載される技術は、たった2つの入力スペクトルを含む入力データ集合を利用してもよい。入力スペクトルの各々は、対象の前駆体、および対象の前駆体に関連づけられるわずか1つの生成物イオンを含んでもよい。本明細書の技術のうちの1つを実行した結果として対象の前駆体に関連すると判断された各生成物イオンに定められた強度和は、関連生成物イオンをさらに順位付けし、関連強度または各生成物イオンがその前駆体にどの程度確実に関連しているかを判断するために、使用されてもよい。一実施形態において、生成物イオンの強度和が大きいほど、生成物イオンは前駆体により関連している。
【0112】
スペクトルに加えて、本明細書の技術に関連して使用される入力データ集合も、イオンリストにイオンを含んでもよい。イオンリストは、たとえば、LC/MSまたはその他の実験および処理方法論を利用して得られ得るような、三次元データから、取得されてもよい。イオンリストに含まれる各イオンは、イオンの保持時間、質量またはm/z、および/または強度によって注釈が付けられてもよい。三次元データが利用されるような事例では、スペクトルは、たとえば、参照により本明細書に組み込まれる、2004年11月16日出願の、Plumbらによる、米国特許出願公開第2005/0127287号明細書の「METHOD OF USING DATA BINNING IN THE ANALYSIS OF CHROMATOGRAPHY/SPECTROMETRY DATA」、または参照により本明細書に組み込まれる、Gorensteinらによる、2005年9月1日公開のPCT国際公開第2005/079263号パンフレット、PCT特許出願PCT US2005/004180号明細書、APPARATUS AND METHOD FOR IDENTIFYING PEAKS IN LIQUID CHROMATOGRAPHY/MASS SPECTROMETRY DATA AND FOR FORMING SPECTRA AND CHROMATOGRAMS に記載されるような、保持時間ビニングを使用して、取得されてもよい。
【0113】
本明細書に記載の技術に関連して、1つの注入において同じ保持時間を有する複数の前駆体は、たとえばBateman技術を利用して決定され得るような、複製条件の下であっても、別の注入においてはわずかに異なる保持時間を有することが見出される。したがって、複数の前駆体に関連づけられる生成物イオンは、第一注入において単一の保持時間を有するかも知れず、複数の前駆体は、別の注入においてわずかではあるが測定可能な程度に異なる保持時間を有するかも知れない。その結果、第一注入において第一保持時間を有するであろう生成物イオンは、複製条件の下であっても、その後に続く注入において、わずかに異なる保持時間を有するかも知れない。本明細書に記載の技術は、前駆体と生成物イオンとの間の測定保持時間の差が、誤差または閾値の所定の保持時間枠内である限り、その生成物イオンはその前駆体に関連づけられるということを有利に利用している。
【0114】
本明細書に記載の技術が入力データ集合またはスペクトルの範囲内のスペクトルピークの質量値を比較するということに留意されたい。前駆体および/または生成物イオンの質量値またはm/z値に関する予備知識は必要とされない。さらに、本明細書に記載の技術は、データベースまたはカタログにさらなる注釈を付けるために使用されてもよいが、与えられたタンパク質の配列の予備知識は、試料に対して本明細書に記載の技術を利用するために必要とされない。
【0115】
Sumtrackに関連して、一実施形態は、複数の注入にわたって追跡された前駆体との一致相手であると判定された全ての生成物イオンに関して、和集合演算、またはその同等処理を使用してもよい。このように、生成物イオンが、対応するスペクトルを有する少なくとも1つの注入において前駆体保持時間「n」に関する一致相手であると判定された場合、その生成物イオンは和演算とともに形成される結果的な集合に含まれる。したがって、前駆体および関連生成物イオンの保持時間一致は、決定論的な、信頼できる方法で実行されてもよい。その結果形成される集合は、前駆体、および入力データ集合の質量スペクトルからの全ての識別された関連(たとえば一致する)生成物イオンを含む、出力スペクトルに含まれてもよい。
【0116】
和集合演算、またはその同等処理を使用する保持時間一致のSumtrack技術の実施形態は、M個のスペクトルの各々が同じ前駆体およびその前駆体に関連する1つ以上の生成物イオンの集合を含む、M個のスペクトルに適用されてもよい(たとえば、同じスペクトルにおける生成物イオンおよび前駆体は、誤差の保持時間枠の範囲内である)。前駆体はM個のスペクトルにわたって追跡されてもよく、1つのスペクトルにおける前駆体は、別の箇所により詳細に記載されるように、1つ以上の基準(たとえば、実質的に同じ保持時間、質量など)に従って、別のスペクトル中の前駆体との一致相手(たとえば、同じもの)であると判断されてもよい。生成物イオンは、M個のスペクトルのうちいずれか1つ以上に出現して、前駆体の保持時間に関する誤差の保持時間枠の範囲内である場合、出力スペクトルに含まれてもよい。このように、出力スペクトルは、M個のスペクトルにわたって前駆体に関連づけられる全ての生成物イオンの和集合を含む。さらに、強度和は、各生成物イオンに関連づけられてもよい。生成物イオンの強度和は、M個のスペクトルにわたる生成物イオンの強度を加算することによって決定されてもよい。強度は、生成物イオンが含まれ、前駆体に関連すると判断された、M個のスペクトルの各々に対して取得され、そのような全ての強度は、生成物イオンの強度和を算出するために合計される。本明細書の別の箇所に注記されているように、異なるスペクトル中の2つの生成物イオンは、両方とも指定された質量公差範囲内の同じ質量を有する場合には、同じ生成物イオンであると見なされてもよい。
【0117】
入力データ集合の複数の注入にわたる前駆体および生成物イオンの一致について記載されたSumtrackの実施形態は、様々な異なる領域に適用されてもよく、様々な異なる方法論と結びつけて使用されてもよい。たとえば、これらの技術は、プロテオミクスおよび小分子研究において使用されてもよい。これらの技術は、試料の複製注入、ならびに、注釈付ペプチドカタログおよびペプチドプロファイルに含まれるものなど、データベース中のこのような情報の記憶装置の中で、前駆体および関連生成物イオンを検出するために使用されてもよい。このような記憶された情報は、未知の試料の特性に対する比較のために、データストアから抽出されてもよい。このような記憶された情報は、未知の試料を検出、同定、および/または定量化するために使用されてもよい。上述の使用はまた、本明細書に記載されるその他の保持時間一致および生成物イオン選択技術にも適用可能である。
【0118】
Sumtrackを使用して、和集合演算は、複数の注入にわたる前駆体に関連づけられる生成物イオンに適用されてもよく、その結果得られるそのような生成物イオンの和集合は、その前駆体に関連すると判断されてもよい。このように、Sumtrackの使用は、保持時間一致および生成物イオン選択のその他の上述の技術と同様に、関連する生成物イオンの前駆体に対して関連していないものからの分離を提供する。Sumtrackで、和集合の中のそのような各生成物イオンのために、複数の注入にわたる前駆体と関連する生成物イオンの強度を加算することによって、強度和が決定されてもよい。強度和はまた、同様に複数の注入にわたる前駆体の強度を加算することによって、前駆体のために決定されてもよい。
【0119】
本明細書に記載の技術の結果として生成された出力は、スペクトルの形態であってもよい。Sumtrackでは、出力スペクトルは、前駆体、および複数の注入にわたる生成物イオンの和集合を決定した結果として含まれる1つ以上の関連生成物イオンを含んでもよい。その結果生じる出力スペクトルは、未知のペプチド、追跡保持時間などを同定するための検索に関連して、記憶、表示、使用されてもよい。
【0120】
ここで図4および図5を参照すると、Sumtrackを使用して前駆体の保持時間一致およびその関連生成物イオンの選択の実行に関連する一実施形態において使用され得る、処理ステップのフローチャートが示されている。図4および図5のステップは、すぐ上に記載された処理をまとめたものである。
【0121】
ステップ1002において、入力データ集合が取得される。入力データ集合は、複数の注入からのデータを含んでもよく、図解のためフローチャート1000および1050のステップにスペクトルが含まれているが、イオンリストおよびスペクトルを含む様々な異なる形態のいずれか1つ以上であってもよい。図4および図5に関連して使用される入力データ集合は、入力データ集合の各スペクトルが同じ前駆体を含むように、被追跡前駆体のスペクトルを含む。図4および図5の処理ステップに関連して使用される入力データ集合は、前駆体を選択し、元データ集合のどのスペクトルが選択された前駆体を含むかを判断することによって、元データ集合から生成される。一実施形態はあるいは、この特定の実施形態に示されるのとは異なる処理点において、どのスペクトルが選択された前駆体を含むかを判断してもよい。複数の注入の間での前駆体の追跡は、参照により本明細書に含まれる、2005年9月1日出願のGorensteinらによる、国際公開第2005/079261号パンフレット、米国特許出願公開第2005/004176号明細書、「SYSTEM AND METHOD FOR TRACKING AND QUANTITATING CHEMICAL ENTRIES」に記載された技術を使用して実行されてもよく、ここで、異なる注入の第一および第二前駆体は、第一前駆体の質量が第二前駆体の質量の特定の質量公差の範囲内である場合、および第一前駆体の保持時間が第二前駆体の第二閾値または枠の範囲内である場合に、同じであると判断される。これは、本明細書の別の箇所に、より詳細に記載される。
【0122】
ステップ1004において、入力データ集合のスペクトルが選択される。ステップ1004で選択されたスペクトルは、基準スペクトルと称されてもよい。基準スペクトルを取得する際に使用された注入は、本明細書において、基準注入と称されてもよい。基準スペクトルにおいて第一保持時間を有する前駆体が決定される。一実施形態において、1つ以上の前駆体が、最大の質量および強度を有するこれらのイオンとして決定されてもよい。フローチャート1000および1050に関連する図解目的のため、1つの前駆体のみが入力データ集合の各スペクトルに含まれるものとする。本明細書に記載されるように、選択された対象の前駆体の質量を決定するために、Bateman技術に関連してなど、異なる方法論が使用されてもよい。Bateman技術を参照すると、前駆体の質量は、LE走査を使用して生成された結果的なスペクトルを観察することによって、決定されてもよい。
【0123】
基準スペクトルにおいて、前駆体の保持時間に対して保持時間枠内の保持時間を有する生成物イオンは、前駆体に関連する生成物イオンとして特徴付けられてもよい。関連生成物イオンおよび関連する強度は、ステップ1004の一部として記録されてもよい。本明細書に記載される技術を使用して、複数のスペクトルにわたって追跡される前駆体のために、上記が実行される。以下により詳細に記載されるように、被追跡前駆体を含む単一のスペクトルは、ステップ1006、1010、1012、1014、および1020において形成されるループの繰り返しによって処理される。1つ以上のスペクトルの前駆体に関連すると判断された全ての生成物イオンはその後、続く処理ステップにおいて、和集合演算を利用するなどして、組み合わせられる。生成物イオンの結果的な集合は、前駆体イオンと一致または関連すると判断される。
【0124】
基準注入の前駆体と同じ保持時間で発生する基準注入の生成物イオンを判定するときのステップ1004に関連して、前駆体の保持時間の保持時間枠または誤差枠の範囲内で発生する全ての生成物イオンが、考慮される。たとえば、前駆体は、基準注入において保持時間T1を有してもよい。第一生成物イオンは、T1およびT1±保持時間枠の範囲内に収まる保持時間を有してもよい。第一生成物イオンは、和集合に含まれ、前駆体に関連づけられる生成物イオンであると考えられる。第一生成物イオンがT1±保持時間枠の範囲外の測定保持時間を有する場合には、第一生成物イオンはその注入の前駆体に関連するとは見なされない。上述の保持時間枠はまた、標的注入における生成物イオンと前駆体との一致に関連して先に記載されたように、図4で形成されたループの各繰り返しのその後の処理ステップにおいて使用される。標的注入とは、基準注入以外の入力データの注入を指す。標的注入は、一番上の検査ステップ1006を備えて形成されるループの中のフローチャート1000において処理される残りのスペクトルを生成する際に、使用されてもよい。
【0125】
ステップ1006において、被追跡スペクトルを含む入力データ集合中の全てのスペクトルが処理されたか否かについて、判断がなされる。いいえの場合、制御は、可変の現在のスペクトルが入力データ集合中の次のスペクトルに割り当てられるステップ1010に進む。ステップ1012において、現在のスペクトルの前駆体および生成物イオンが決定される。現在のスペクトルでは、基準スペクトルの前駆体と同じ質量および保持時間(第二閾値または保持時間公差を表す枠の範囲内)を有するイオンが検索される。基準スペクトル中に存在する1つ以上の生成物イオンが現在のスペクトルにも出現してよいことに留意されたい。基準スペクトルおよび現在のスペクトルのうち1つのみに存在する生成物イオンもあってもよい。
【0126】
一実施形態は、基準および標的注入において前駆体を追跡するための処理であるステップ1012および1002においてなど、標的注入において特定の質量を有する前駆体を検索する際に使用される時間の枠を表す、上述の第二閾値または枠を利用してもよい。たとえば、保持時間T1において質量m1を有する前駆体が、基準注入において決定されてもよい。これに続く標的注入のため、処理は、同じ質量m1およびT1±第二閾値または枠の保持時間を有するイオンを検索する。第二閾値または枠は、実験的に決定されてもよく、実施形態に応じて異なってもよい。たとえば、一実施形態は、初期値を2〜3個のクロマトグラフィピーク幅に基づくなどして、第二閾値に割り当ててもよい。第二閾値は、システムの経験的実験にしたがって、変更または改善されてもよい。たとえば、一実施形態が大量の誤差またはノイズを生じさせるシステムまたは方法論を利用する場合、第二閾値または枠は増加されてもよい。
【0127】
ステップ1012の処理に関連して、現在のスペクトルの前駆体が、ある質量であると特定され、同じ質量を有するステップ1004の基準スペクトルの前駆体と一致することにもまた留意されたい。基準スペクトル中の前駆体の第一質量は、第一質量が第二質量の指定された質量公差の範囲内にある場合、現在のスペクトルの前駆体の第二質量と同じ質量であると見なされてもよい。説明の簡素化のために示される例示的実施形態において、処理された各スペクトルは、単一の前駆体が同定されたら残りのイオンが生成物イオンとして同定されてもいいように、対象の前駆体を1つしか含まない。
【0128】
ステップ1014において、現在のスペクトルの前駆体は、基準スペクトルの前駆体と時間的に整合していてもよく、現在のスペクトルの全ての生成物イオンは、適切におよびしかるべく、時間移動させられる。たとえば、基準スペクトル中の前駆体の保持時間が10.0分であって、現在のスペクトル中の前駆体の保持時間が9.8分である場合、現在のスペクトルの前駆体および生成物イオンは、+0.2分移動させられる。一旦移動が完了すると、制御は、予想される保持時間枠内にある、現在のスペクトル中の生成物イオンが決定されるステップ1020に進む。ステップ1020において、保持時間枠内の特定の生成物イオンは、後の処理ステップでの使用のために記録されてもよい。さらに、保持時間枠内の現在のスペクトルの各生成物イオンの強度(たとえば、現在のスペクトルの前駆体に関連)が、強度和を決定する際の後の処理ステップに関連して使用されるために、記録される。制御はその後、ステップ1020からステップ1006に進む。
【0129】
ステップ1006での判断が「はい」の場合、制御はステップ1051に進む。ステップ1051において、所定の質量公差枠に応じた固有の生成物イオンのリストが決定される。ステップ1020で決定されたような入力データ集合の基準スペクトルおよびその後のスペクトルに含まれる生成物イオンが調べられる。第一質量を有する1つのスペクトル中の第一生成物イオンは、第一質量および第二質量が所定の質量公差枠の範囲内である場合に、第二スペクトル中の別の生成物イオンと同じ質量を有すると見なされてもよい。本明細書に記載の技術に関連して、第一および第二生成物イオンは、2つの異なるスペクトル中の同じ生成物イオンであると見なされてもよい。ステップ1051から、制御はステップ1052に進む。ステップ1051において判定された各生成物イオンのため、それぞれ関連生成物イオンが含まれる入力データ集合中の1つ以上のスペクトルに対して、生成物イオンの1つ以上の強度を加算することによって、全体の強度和が決定される。一実施形態はまた、前駆体の強度和を決定するために、入力データ集合のスペクトルにわたる前駆体の強度を加算してもよいことに留意されたい。
【0130】
本明細書に記載される技術にしたがって、ステップ1051の結果として、前駆体と実質的に同じ保持時間を有する全ての生成物イオンの集合(たとえば、誤差の保持時間枠内)が、入力データ集合にわたって、決定される。生成物イオンが入力データ集合中の少なくとも1つのスペクトルのための前駆体の保持時間枠の範囲内にある場合に、生成物イオンがその前駆体に関連すると判断されるように、生成物イオンは、和集合演算、またはその同等処理を実行することによって、この集合に含まれる。制御は、出力スペクトルを生成するためのステップ1064に進む。本明細書の別の箇所に記載されるように、生成された出力は、イオンリストなど、スペクトル以外の形態であってもよい。ステップ1064で生成される出力スペクトルまたはその他の出力は、前駆体と実質的に同じ保持時間およびピーク形状を有することによって、その前駆体に関連づけられると判断される生成物イオンを含んでもよい。生成物イオンは、単一でまたは前駆体と併せて、関連する強度和の表示とともに、出力スペクトル中に含まれてもよい。
【0131】
本明細書に記載されるSumtrack技術は、ここで追加図面とともに説明される。説明の簡素化のため、単一の前駆体のみが示されるが、しかし本明細書に記載される技術は、複数の前駆体およびその関連生成物イオンを有する試料に関連して使用されてもよい。
【0132】
ここで図6を参照すると、基準注入のグラフ表示が示されている。この例1100において、前駆体1102、ならびに生成物イオン1104、1106、1108、および1110は、1114で示されるような前駆体1102の保持時間を有している。保持時間枠内の測定保持時間を有する全ての生成物イオンが考慮されていることに留意されたい。表1112は、図示される基準注入の異なる生成物イオンに関連づけられた強度のリストを含む。
【0133】
ここで図7を参照すると、別の注入のグラフ表示が示されている。例1120の注入は、第一標的注入と称されてもよく、前駆体1102、ならびに成物イオン1104、1106、1108、1110、および1112を含んでいる。この例1120では、標的注入のデータにおいて、基準注入からの前駆体1102と同じ質量の保持時間が検索される。保持時間の検索は、異なる注入で同じ前駆体を追跡する際に使用するための上述の第二閾値または保持時間公差に関連して実行される。一実施形態は、複数の注入の間で前駆体を追跡するための上述の国際公開第2005/079261号パンフレットに記載されているような技術を使用してもよい。例1120において、前駆体1102は、1124によって示される保持時間を有するように描写されている。図8において、基準注入からの前駆体の保持時間に応じた、第一標的注入の整合または正規化が、示されている。基準注入および第一標的注入からの前駆体は、整合されている。生成物イオンもまた、しかるべく移動されている。基準注入に関して記載されているように、標的注入の前駆体が、最大の質量および強度を有するこれら1つ以上のイオンとして判定され得ることに留意されたい。例1124に関連して、生成物イオン1104および1106が、どの前駆体および生成物イオンが実質的に同じ保持時間を有するかを判断する際に使用されてもよい上述の保持時間枠に対して決定され得る前駆体と同じ保持時間1114を有していないことに、注目すべきである。残りの生成物イオン1108、1110、および1112は、予想される保持時間枠内の保持時間1114を有している。表1126は、例1124に示される生成物イオンに関連する強度を掲載している。
【0134】
例1124において、生成物イオン1104および1106が、たとえば、本明細書の別の箇所に記載されているような、質量スペクトルピークのFWHMの±1/10を使用して決定され得るような、保持時間枠内の保持時間1114を有していないように描写されていることに、注目すべきである。
【0135】
和集合演算を適用するSumtrack技術を使用する、本明細書に記載される技術を使用して決定されるような、前駆体および関連生成物イオンを含む出力スペクトルの一例が、図9に示されている。本明細書のSumtrack技術を使用して、基準注入の前駆体に関連すると判断された生成物イオン(たとえば、図6)および第一標的注入の前駆体に関連すると判断された生成物イオン(たとえば、図7および図8)に、和集合演算が適用される:
前駆体に関連する基準注入の生成物イオン{A、B、C、D}和
前駆体に関連する第一標的注入の生成物イオン{C、D、E}={A、B、C、D、E}
上述の例に基づいて、生成物イオン1104、1106、1108、1110、および1112は、1114で示される保持時間を有する前駆体イオン1102と一致または関連すると、判断されてもよい。
【0136】
さらに、表1142は、各関連生成物イオンを含むスペクトルにわたって各生成物イオンの強度を加算することによって決定された、生成物イオンの強度和の表を示す。表1142は、図8の表1126および図6の表1112からの強度を合計している。図示されていないが、前駆体1114に関連する強度は、基準および標的注入における前駆体の強度の和であってもよい。
【0137】
保持時間一致および生成物イオン選択を実行するための上述のSumtrack技術は、ペプチドカタログなどのデータベースまたはカタログに注釈を付けるために、使用されてもよい。関連技術において知られているように、たとえば、タンパク質配列データベースは、最初に取得されてデータ記憶装置に記憶されてもよい。データベースは、すぐ上に記載された技術を使用して注釈が付けられてもよい。ペプチドデータベースは、どのイオンが特定のペプチドを含んでいるかなどの情報を含む。本明細書に記載される技術は、たとえば、タンパク質を特徴付けまたは同定するために、データベースに掲載されているうちのどのイオンがタンパク質プロファイリングに関連して使用されているかをさらに特定するために、データベースに注釈を付けるために使用されてもよい。たとえば、タンパク質を含み、タンパク質の配列において20個のトリプシンペプチドを同定する、ペプチドデータベースがあってもよい。これら20個のペプチドのうち、たとえば10個など、一部のみがイオン化されるのでもよく、タンパク質を同定するために前駆体として使用されてもよい。本明細書に記載される技術を使用して、ペプチドデータベースは、10個のうち最も強力な3つの前駆体を表すように、注釈が付けられてもよい。3つの最強前駆体は、本明細書の別の箇所に記載されるように、プロファイリングに関連してタンパク質を同定するために使用されてもよい。ペプチドデータベースは、たとえば、本明細書に記載される保持時間一致および生成物イオン選択技術のうちの1つを実行した結果として生成される1つの情報を使用して、同定もされるような、各前駆体の生成物イオンを同定するために、さらに注釈が付けられてもよい。
【0138】
単一のスペクトルが同じ保持時間の前駆体を1つ以上有する入力データ集合に関連して、基準注入が決定されてもよい。このようなスペクトルは、たとえば、分析された複合試料に関連して、生成されてもよい。各前駆体の質量は、基準注入から決定されてもよい。一例として、第一質量m1を第一前駆体に関連づけ、第二質量m2を第二前駆体に関連づける。各前駆体に対して、複数の標的注入が調べられ得る。標的注入では、質量m1を有し、異なる注入において前駆体を追跡するときに使用される保持時間公差を表す特定の第二閾値の範囲内の保持時間を有するイオンが、検索されてもよい。このようなイオンは、標的注入における第一前駆体であると判断される。標的注入の第一前駆体の保持時間が決定されて、基準注入の第一前駆体の保持時間と整合させられる。整合およびその他の処理ステップは、どの生成物イオンが第一前駆体と関連または一致するかを判断するために、標的注入の各々について、本明細書に記載されるように、実行されてもよい。標的注入の同じ集合も、質量m2を有する第二前駆体に関連して処理されてもよい。質量m1を有する第一前駆体に関して先に述べられたのと同じように、標的注入において、質量m2を有し、本明細書の別の箇所に記載される第二閾値の範囲内の保持時間を有するイオンが、検索されてもよい。標的注入の第二前駆体の保持時間が決定され、基準注入の第二前駆体の保持時間と整合させられる。整合およびその他の処理ステップは、どの生成物イオンが第二前駆体と関連または一致しているかを判断するために、標的注入の各々について、本明細書に記載されているように実行されてもよい。このように、標的注入の各々において、各前駆体と実質的に同じ保持時間で発生する適切な生成物イオンが、観察および処理されてもよい。
【0139】
2つ以上の前駆体を含むスペクトルを用いてSumtrack技術の使用をさらに説明するために、図10、図11A、および図11Bが参照される。
【0140】
図10を参照すると、基準注入のために生成されてもよいスペクトルの一例が示されている。例1250において、要素1202および1204が前駆体であると判断されてもよい。要素1202および1204は、その他のイオン1208、1210、および1212に関連してその大きい質量および強度にしたがって、前駆体であると判断されるイオンを表してもよい。前駆体1202は1240の保持時間を有してもよく、前駆体1204は1260の保持時間を有してもよい。表1252は、1250のスペクトルにおける生成物および前駆体に関連する強度を示す。基準注入において、生成物イオン1210および1212は、前駆体1202に関連すると判断される(たとえば、前駆体1202と実質的に同じ保持時間を有する関連生成物イオンを判断するために使用される1240の保持時間枠内)。生成物イオン1208は、前駆体1204に関連すると判断される。
【0141】
第一標的注入は、図11Aにグラフ表示で示されている。前駆体1202の第一標的注入の処理を実行するとき、第一標的注入において、質量1202を有し、1240に関連して、注入間で前駆体を追跡するために使用される保持時間の第二閾値の範囲内の保持時間を有するイオンが、検索されてもよい。この第一標的注入において、質量1202を有する前駆体もまた、保持時間1240で発生する。この第一標的注入において、生成物イオン1208、1210、および1212は、前駆体に関連する生成物イオンを決定するときの、特定の保持時間枠の範囲内の保持時間1240において、発生する。表1203は、1200のスペクトル中の生成物および前駆体に関連する強度を示す。
【0142】
前駆体1204について第一標的注入1200を使用して分析を実行するとき、第一標的注入において、1204の質量を有し、1260によって表される保持時間に関する第二閾値の範囲内の保持時間を有するイオンが、検索される。この事例において、1204の質量を有するイオンは、保持時間1260ではなく1240で発生し、保持時間1240および1260は、第二閾値の制限内ではないかも知れない。このように、保持時間1260を有する基準注入の前駆体1204は、保持時間1240で発生する第一注入の前駆体1204と一致せず、あるいは共に追跡されない。本明細書の技術を使用する一実施形態はその後、先の前駆体1204の発生の各々を異なる前駆体として扱ってもよく、これは、いずれの前駆体も質量公差の範囲内の質量を有しているとはいえ、2つの注入中のいずれの前駆体も、第二閾値の範囲内の共通保持時間を有していないためである。したがって、先の前駆体1204の発生の各々について、本明細書の技術を使用して、情報が記録されてもよい。表1203は、例1200の生成物イオンおよび前駆体イオンに関連する強度を含む。図10は基準注入であるが、基準注入中のいずれの前駆体とも一致または追跡されない標的注入において発生する前駆体が、追加追跡が行われる新しい前駆体として扱われてもよいことに留意されたい。言い換えると、図10および図11Bのその他の注入において図11Aのこの新しい前駆体を追跡するための処理が実行されてもよい。
【0143】
図11Bを参照すると、第二標的注入が示されている。第二標的注入は、図10の基準注入について先に図示および記載されたように、前駆体および生成物イオンの質量および保持時間に関する情報を提供する。生成物および前駆体イオン強度は、表1302に含まれている。本明細書の技術にしたがって、表1304に表されるように、情報が収集されてもよい。表1304は、表1203、1252、および1302のデータにしたがって図10、図11A、および図11Bに示される注入にわたって各前駆体の生成物イオンの集合および関連する強度和を決定するために、本明細書に記載の和集合処理技術を適用した結果を含む。また、表1304が各前駆体の強度和を含むことにも、留意されたい。強度和「X1+X2+X3」を有する前駆体P1 1202のために、基準スペクトル中のP1ならびに1304aの情報を生じさせる第一および第二標的注入中のP1に関連づけられる生成物イオンに対して、和集合演算が適用される。強度和「Y2+Y3」を有する保持時間(RT)1260で発生する前駆体P2 1204のために、1304bの情報を生じさせるRT=1260を有するP2に関連づけられる生成物イオンに対して、和集合演算が同様に適用される。強度和「Y1」を有する保持時間(RT)1240で発生する前駆体P2 1204のために、1304cの情報を生じさせるRT=1240を有するP2に関連づけられる生成物イオンに対して、和集合演算が同様に適用される。
【0144】
上記によって示されたように、生成物イオンと同様に、異なる保持時間を有する2つの前駆体は、図11Aに示される注入のように、1つの注入において同じ測定保持時間を有してもよい。しかし、2つの前駆体は、それぞれの生成物イオンと同様に、繰り返し実験において異なる保持時間を有するだろう。本明細書の技術を使用して、表1304の情報が蓄積されてもよい。一実施形態は、タンパク質の発見および同定のためなど、後に続く処理に関連して使用するために、表1304の情報の一部を選択してもよい。一実施形態において、表1304は、同じ質量を有するが異なるRTを有するこれらの前駆体を判定するために、調べられてもよい。一例として、1304bおよび1304cの入力値が決定される。一実施形態は、どの前駆体入力値が最大強度を有するかに基づいて、先の入力値の1つのみを使用するために選択してもよい。1304cよりむしろ1304bの情報が使用され得るように、Y2+Y3がY1より大きい強度を示すことになるかも知れない。一実施形態は同様に、ただしその後に続いて、閾値強度を超える強度を有する前駆体のみなど、選択された数の最強前駆体(たとえば、全ての前駆体のうち最も大きい強度を有する上位2つの前駆体)について、1304の収集された情報を使用してもよい。
【0145】
Sumtrack技術を使用して、生成物イオンが少なくとも1つの注入における前駆体に関連すると判断された場合に(たとえば、生成物イオンが少なくとも1つの注入における前駆体に関連する保持時間枠内に)、その生成物イオンが集合に含まれるように、前駆体に関連する生成物イオンの集合が、和集合演算を使用して決定される。複数の注入にわたって各固有の関連生成物イオンの強度を合計することによって生成された強度和を関連付ける、最大強度を有するこれらの生成物イオンが決定され、前駆体の同定に関連して使用されてもよい。言い換えると、与えられた前駆体の生成物イオンに関連する強度和は、前駆体に関連づけられる生成物イオンの順位付けに使用されてもよい。このような順位付けの後、生成物イオンの一部は、最大強度和を有するものとして選択されてもよい。たとえば、最大強度を有するm個の生成物イオンを表す上位の「m」生成物イオンが、その後の使用のために選択されてもよい。一実施形態は、前駆体のための本明細書に記載のタンパク質プロファイルに、Sumtrackまたは本明細書に記載のその他の技術を使用して決定された、多数の最強生成物イオンを含んでもよい。プロファイルは、質量、および、可能であれば、そのような各生成物イオンのその他の情報も、含んでもよい。
【0146】
本明細書に記載されるように、一実施形態は、質量分析計による処理に先立って、入力試料の処理を随意的に実行してもよい。このような処理は、一実施形態における液体クロマトグラフィ分離によって、分離を補完または置換してもよい。一実施形態において、試料は、ペプチドまたはタンパク質などの、1つ以上の分子の混合物であってもよい。質量分析の実行に先立って、一実施形態は、二次元ゲル電気泳動(2DE)を使用して、混合物中の様々なタンパク質を分離してもよい。その結果生じるスポットは、削除および消化されて、タンパク質をより短いポリペプチド鎖に分解してもよい。これらの消化物は、質量分析を通じて分析されてもよい。この特定の例において、物質は、たとえばペプチドまたはタンパク質などの、1つ以上の分子の混合物であってもよい。タンパク質を含む入力試料または物質は、酵素消化処理の一部として消化されてもよい。この酵素消化処理は、試料中のタンパク質をより短いプリペプチド鎖に分解する分離処理の一種である。続いて、消化物はその後、たとえば、上述のような液体クロマトグラフィ(LC)、2Dゲル分離などのような、別の分離処理技術を使用して、さらに分離されてもよい。一般的に、たとえば分子量、電界などに応じて様々なポリペプチドを分離するために、いかなる分離技術および/または消化技術が使用されてもよいことに留意されたい。先の分離は、質量分析を受ける前の試料、および生成されたスペクトルまたは保持時間一致のための入力データ集合に含まれ得るその他の形態のデータに対して、一実施形態において随意的に実行されてもよい。
【0147】
本明細書で使用されるように、第一注入における前駆体の第一測定保持時間が、第一注入における生成物イオンの第二測定保持時間と、前駆体と生成物イオンとの一致で使用するための、上述のような保持時間枠の範囲内にある場合には、この2つの測定保持時間が実質的に同じであると特徴付けられてもよいことに留意されたい。前駆体および生成物イオンは、実際の測定保持時間が異なったとしても同じ保持時間を有すると見なされてもよい。
【0148】
注入間での前駆体の追跡に関連して、異なる注入において同じ前駆体が発生する時を判断するために、異なる技術および基準が使用されてもよい。そのような技術の1つは、上述の国際公開第2005/079261号パンフレットに記載されている。より一般的には、異なる注入における2つの前駆体が同じであるか否かの判断に使用するために、1つ以上の基準が指定されてもよい。一実施形態は、各々の保持時間が第二閾値または所定の枠の範囲内か否か、および各々の質量が、本明細書の別の箇所に記載されるような、指定された質量公差の範囲内かどうか、を含む基準を使用してもよい。保持時間一致および生成物イオン選択の技術が、タンパク質混合物の分別に関連して、たとえば、参照により本明細書に組み込まれる、2006年12月14日に公開された、Gorensteinらによる、国際公開第2006/133191号パンフレット、米国特許出願公開第2006/021919号明細書、METHODS AND APPARATUS FOR PERFORMING RETENTION−TIME MATCHING に記載される、分別技術を使用して処理される試料に適用されてもよいことに留意されたい。
【0149】
図12を参照すると、Sumtrackを使用して、前駆体およびその関連生成物イオンの保持時間一致および生成物イオン選択の実行に関連して一実施形態において使用されてもよい、処理ステップのフローチャートが示されている。図12のフローチャート1400のステップは、複数の前駆体および関連生成物イオンを含む注入のための図4〜図5に関連して記載された処理ステップの、より一般的な形態を表している。ステップ1402において、入力データ集合が取得される。入力データ集合は、各注入が複数の前駆体を含む、複数の注入を含んでもよい。ステップ1404において、注入の各々について、各前駆体がその生成物イオンと一致させられる。本明細書に記載されるように、前駆体は、前駆体と実質的に同じ測定保持時間およびピーク形状を有するこれらの生成物イオンを発見することによって、その生成物イオンと一致させられてもよい。これも本明細書に記載されるように、どのイオンが前駆体であるかの判断は、いずれか1つ以上の異なる技術を使用して判断されてもよい。たとえば、Batemanに記載されるようなLEモードまたはサイクルを使用して生成されたイオンが、前駆体であると判断されてもよい。別の例としては、特定の強度を持って一定値以上の質量またはm/zを有するこれら1つ以上のイオンが、前駆体であると判断されてもよい。注入の中で実質的に同じ保持時間を有する前駆体および生成物イオンは、本明細書の別の箇所に記載されるように、前駆体の保持時間に対する誤差の保持時間枠内のこれら生成物イオンであると判断されてもよい。ステップ1404の結果、前駆体および関連生成物イオンが決定される。
【0150】
ステップ1406において、入力データ集合の全ての注入に対して、前駆体のリストが決定される。前駆体のリストは、異なる注入に現れるどの前駆体が同じ前駆体を参照するかを判断することによって生成され得るような、異なるまたは固有の前駆体のリストである。第一注入の第一前駆体および第二注入の第二前駆体は、第二前駆体の質量が第一前駆体の質量に対して定義された質量公差の範囲内である場合、および第二前駆体の保持時間が第一前駆体の保持時間に対して保持時間の第二枠または閾値の範囲内である場合に、一致相手であると判断されてもよい。異なる注入におけるどの前駆体が同じ前駆体を参照しているかを判断するために、注入間にわたる前駆体の追跡に関連して使用されてもよい技術はまた、上述の国際公開第2005/079261号パンフレットにも記載されている。ステップ1406の一部として、全注入にわたって追跡されたリスト上の各前駆体について、全ての固有の関連生成物イオンの和集合が決定される。上述のように、所定の質量公差内の質量を有する、異なる注入の2つの生成物イオンは、2つの異なる注入に出現する同じ生成物イオンであると見なされてもよい。ステップ1406は、どの注入が特定の前駆体を含むかの判断を含んでもよい。前駆体を含む各注入について、(たとえば、ステップ1404に関連して判断されたように)その前駆体に関連する注入の生成物イオンに対して、和集合演算が実行される。特定の前駆体の全てのそのような生成物イオンの和を表す集合は、異なる注入においてどの生成物イオンが所定の質量公差内の質量を有するかを判断することによって、固有の生成物イオンを決定するために、さらに圧縮されてもよい。本明細書の別の箇所に記載されるように、所定の質量公差内の質量を有する2つの異なる注入における2つの生成物イオンは、2つの注入に現れる同じ生成物イオンであると見なされてもよい。
【0151】
ステップ1406の処理の結果として、全ての注入にわたる固有の前駆体のリストが決定される。さらに、リスト上の各前駆体について、関連する、固有生成物イオンの集合も、決定される。そのような生成物イオンの各々について、全ての注入にわたる生成物イオンの強度を加算することによって、強度和が決定されてもよい。ステップ1408で始まる処理は、前駆体のリストを詳査し、生成物イオンの先の強度和を決定する。ステップ1408において、現在の前駆体は、リスト上の第一前駆体として割り当てられる。ステップ1410において、リスト上の全ての前駆体が処理されたか否かの判断がなされる。いいえの場合、制御はステップ1414に進み、現在の前駆体について生成物イオンの集合を詳査する。ステップ1414において、現在の生成物イオンは、現在の前駆体の和集合における第一生成物イオンに割り当てられる。ステップ1416において、現在の前駆体の全ての生成物イオンが処理されたか否かの判断がなされる。ステップ1416がいいえと評価した場合、制御はステップ1420に進み、全ての注入にわたる生成物イオンの強度を加算することによって、現在の固有かつ関連する生成物イオンの強度和を決定する。本明細書の別の箇所に記載されるように、2つの異なる注入にあって、質量公差内の質量値を有する2つの生成物イオンは、2つの注入において発生する同じ生成物イオンであると判断されてもよい。異なる注入にわたる生成物イオンの先の発生に関連する強度は、生成物イオンの強度和を決定するために加算されてもよい。生成物イオンが各注入に含まれなくてもよく、そのため関連生成物イオンおよび前駆体が現れる注入に関連する強度を加算することによって強度和が決定されることに留意されたい。制御は、現在の生成物イオンが、現在の前駆体の集合における次の生成物イオンであるように割り当てられるステップ1422に進む。制御はステップ1416に進む。ステップ1416が、はいと評価して終了するまで、現在の前駆体の生成物イオンの処理が続く。ステップ1416が、はいと評価した場合、制御はステップ1418に進み、その後ステップ1410に進んで、リスト上の次の前駆体を処理する。ステップ1410は、リスト上の全ての前駆体が処理されたときに、はいと評価する。ステップ1410が、はいと評価したら、制御はステップ1412に進んでイオンリストを生成する。
【0152】
この例において、イオンリストは、前駆体および関連する固有の生成物、ならびにそのような各生成物の強度和を含んでもよい。イオンリストに含まれてもよい情報は、本明細書の別の箇所に記載されている。ステップ1412のイオンリストは、各前駆体について、各生成物イオンの関連する強度和とともに判断される全ての生成物イオンを含んでもよい。イオンリストまた、これに続いて順位付けされてもよい。順位付けされた生成物イオンの一部は、生成物イオンの強度和に応じて決定された各前駆体について、たとえば、最大で所定数「X」の生成物イオンを含むように、選択されてもよい。各前駆体の生成物イオンは、強度和によって順位付けまたは分類されてもよく、最大強度和を有するこれら「X」個の生成物イオンは、イオンリストに含まれてもよい。一実施形態において、図12のステップを使用して処理された複数の注入(たとえば、複製注入)に、同じ試料が使用されてもよい。結果的に得られたイオンリストは、試料、試料中のタンパク質などの同定に使用されてもよい。別の例として、各注入は、異なる試料混合物を使用してもよい。
【0153】
ここで、本明細書のSumtrack技術が、各試料の複製注入の集合とともに、多数の異なる試料を使用して取得された入力データ集合に関連して、どのように使用され得るかを示す、別の例が記載される。一例として、入力データ集合は、各試料に3つの複製注入を備える20個の異なる試料を使用して取得された60個の注入に関するデータを含んでもよい。20個の異なる試料の各々は、異なる条件、病的状態などに対応してもよい。
【0154】
図13を参照すると、Sumtrack技術を使用する実施形態において実行されてもよい処理ステップが示されている。フローチャート1500のステップは、上述のように取得された入力データ集合を使用して実行されてもよい。ステップ1502において、先の60個の注入のものなどの、入力データ集合が、取得されてもよい。図14は、20個の試料の各々がどのようにして各試料向けに取得された3つの複製注入の集合に関連づけられ得るかを示す例1600である。ステップ1504において、入力データ集合の各注入について、どの生成物イオンが各前駆体と一致するかが判断される。ステップ1504の処理は、図12のステップ1404と類似している。ステップ1506において、全ての注入にわたって各前駆体を追跡することによって、固有の前駆体のリストが全ての注入にわたって決定される。ステップ1506の処理は、図12のステップ1406に関連して先に記載された処理の一部と類似している。
【0155】
ステップ1508において、単一の注入について最高の強度を有する前駆体が、リストから選択されてもよい。ステップ1510において、条件または試料およびステップ1508からの選択された単一の注入を含む複製注入の関連する集合が、決定される。たとえば、図14を参照すると、注入7に含まれる第一前駆体がリスト上の全ての前駆体の中で最大の強度を有することが、ステップ1508において判定されてもよい。続いて、ステップ1510はその後、注入7の関連する条件または試料が3であると判断してもよい。複製注入7、8、および9の集合1602は、試料3に関連づけられる。
【0156】
ステップ1512において、ステップ1510で決定された複製注入の集合について、選択された前駆体の全ての固有生成物イオン質量の和集合が決定される。さらに、選択された前駆体に関連する各固有の生成物イオン質量について、強度和が決定される。本明細書の別の箇所に記載されるように、異なる注入において発生し、所定の質量公差内の質量値を有する2つの生成物イオンは、同じ生成物イオンの2つの発生として判断されてもよい。第一および第二生成物イオン質量の両方が所定の質量公差内にない場合には、第一生成物イオン質量は、第二生成物イオン質量に対して固有であってもよい。ステップ1512の処理は、生成物イオンが固有であって単一の前駆体(たとえば、単一の注入7において最大強度を有すると判断された前駆体)に関連している、選択された注入の集合(たとえば、1602の7、8、および9)のために、本明細書で記載されるように全ての生成物イオンの和集合演算を実行するステップを含む。和集合を形成する際にステップ1512において実行され得るような処理、選択された前駆体のために固有かつ関連する生成物イオンの決定、およびそのような生成物イオンの強度和の決定は、本明細書の別の箇所に記載されている。ステップ1514において、前駆体、および固有かつ関連する生成物イオンの和集合は、そのような生成物イオンの各々の強度和とともに、同定またはその他の目的で使用されるイオンリストに含まれてもよい。
【0157】
図13の処理は、入力データ集合からの多数の最強前駆体について繰り返し実行されてもよい。各前駆体について、最大の強度を有するこれらの生成物イオンが決定されてもよい。前駆体および図13の処理を使用して決定された関連生成物イオンに関する情報は、たとえばデータベースなどに記憶されてもよく、分析された試料においてどのタンパク質が発生したかの特定に関連して使用されてもよい。さらに、この情報は、一致したタンパク質の情報を更新、または注釈を付けるためにも、使用されてもよい。一例として、既存のカタログに記憶された、本明細書に記載のタンパク質プロファイルについて考えてみる。タンパク質を同定するために使用される各タンパク質プロファイルは、本明細書の別の箇所により詳細に記載されるように、1つ以上の前駆体および関連生成物イオンの情報を含んでもよい。図13の処理を使用して決定される1つ以上の前駆体および関連生成物イオンに一致するタンパク質プロファイルを有するカタログからタンパク質を同定するために、検索が実行されてもよい。この例において、タンパク質プロファイル中の前駆体の1つは、2つの関連生成物イオンを有するだけでよい。図13の技術を使用して、第三生成物イオンが前駆体について判断されてもよく、既存のタンパク質プロファイルに追加されてもよい。カタログに含まれる情報、一致するタンパク質などを判断するために使用される基準、などに応じて、生成物イオン、前駆体などに関して本明細書に記載の処理を使用して取得される付加的情報が、タンパク質プロファイルに追加されてもよい。
【0158】
ここで、Hitrack技術について、より詳細に記載される。上述のように、Hitrackは、与えられた前駆体について、出力データ集合が、その前駆体が最大強度を有する入力データ集合のスペクトルに関連づけられた生成物イオンスペクトルを含むことを判断する。入力データ集合が3つのスペクトルを含み、その各々が異なる注入向けであって、同じ前駆体が3つの全てのスペクトルにおいて追跡される、一実施形態において、Hitrackは、その前駆体が最強となるスペクトルを選択する。前駆体と一致する保持時間である選択されたスペクトルにおける生成物イオンは、出力データ集合に含まれる。
【0159】
図15を参照すると、Hitrack技術の一実施形態において実行され得る処理ステップのフローチャートが示されている。ステップ1702において、入力データ集合が取得される。この例において、入力データ集合は、各注入のスペクトルを含む。データ集合における各スペクトルは、1つ以上の前駆体および1つ以上の生成物イオンのデータを含む。ステップ1704において、同じ前駆体が、入力データ集合を形成する1つ以上の注入において追跡されてもよい。1つ以上の注入にわたる前駆体の追跡は、本明細書の別の箇所により詳細に記載されている。同じ前駆体が追跡される1つ以上の注入を含む集合が形成される。ステップ1706において、被追跡前駆体の強度が集合中の全注入の中で最大または最高となる注入が、ステップ1704で決定された集合から選択される。ステップ1708において、被追跡前駆体に一致または関連する選択された注入の生成物イオンを決定するために、選択された注入の入力データ集合中のスペクトルを使用して、保持時間一致が実行されてもよい。ステップ1710において、出力スペクトルが、被追跡前駆体およびステップ1708で決定された一致する生成物イオンを含むと判断される。ステップ1710の出力スペクトルは、前駆体、およびその前駆体に関連していると判断されたこれら1つ以上の生成物イオンのみを含んでもよい。ステップ1710の出力スペクトルは、本明細書の別の技術の実施形態の結果として生成された出力スペクトルと同様に、本明細書に記載され、かつ当業者によって理解されるような使用法とより一般的に結びつけられる、量的および/または質的分析のためのその後の処理において、使用されてもよい。
【0160】
被追跡前駆体と一致または関連する生成物イオンを含む、被追跡前駆体の出力スペクトルを決定するために、入力データ集合における各被追跡前駆体についてステップ1704〜1710が実行されてもよいことに留意されたい。
【0161】
ここで、Mergetrack技術の一実施形態が、より詳細に記載される。上述のように、Mergetrack技術の一実施形態は、本明細書に記載のHitrackおよび/またはSumtrack技術に関連する処理および生成物イオン選択基準を利用してもよい。2つの例示的実施形態が本明細書に記載される。第一の実施形態に関連して、1つ以上のスペクトルにおける被追跡前駆体のため、出力スペクトル中の前駆体の強度は、全ての追跡スペクトルにわたる前駆体の強度の和として決定されてもよい。被追跡前駆体を含む追跡スペクトルの保持時間一致は、各追跡スペクトルについて、どの生成物イオンが被追跡前駆体に関連しているかを判断するために、実行されてもよい。その後のステップにおいてさらなる処理を受ける、第一の結果的スペクトルを決定するために、Hitrack技術の処理および生成物イオン選択基準が、被追跡前駆体を含むスペクトルの集合に最初に適用されてもよい。第一の結果的スペクトルに含まれる各生成物イオンについて、被追跡前駆体を含むスペクトルの集合における生成物イオンの全ての事例を同定するために、処理が実行される。異なるスペクトルにおける同じ生成物イオンの先の同定は、生成物イオン質量にしたがって一致相手を決定することによって、本明細書の別の箇所に記載されるように、実行されてもよい。生成物イオンを含む1つ以上のスペクトルの各々における生成物イオンの強度が、取得される。第一の結果的スペクトルにおける生成物イオンの強度は、生成物イオンが各々の被追跡前駆体と同じ保持時間を有する1つ以上のスペクトルにわたる生成物イオンの先の強度の和として、決定される。出力スペクトルは、生成物イオンが先の処理にしたがって決定された強度を有する、第一の結果的スペクトルとして、決定される。
【0162】
図16を参照すると、Mergetrack処理の一実施形態を描写する一例が示されている。例1800は、4つのスペクトルを含む:入力データ集合中のスペクトルである1810、1820、および1830、ならびに出力スペクトルである1840である。P1は、スペクトル1810、1820、および1830にわたって追跡される前駆体である。A、B、およびCは、1800に関連する生成物イオンである。各スペクトルについて、被追跡前駆体と一致する生成物イオンを判定するために、被追跡前駆体P1を含む3つのスペクトルの各々について、保持時間一致が実行されてもよい。スペクトル1810、1820、および1830は、各スペクトルが保持時間枠内の前駆体および生成物イオンを含むように、本明細書に記載の保持時間一致を適用した結果であってもよい。出力スペクトル1840における前駆体P1の強度は、前駆体を含む全ての追跡スペクトルにわたる前駆体の強度の和として決定される。この例において、出力スペクトル1840における前駆体P1の強度は、W1+W2+W3である。Hitrack技術の実施形態は、被追跡前駆体を含む3つのスペクトルに適用されてもよく、図解目的のため、HiTrack処理にしたがって1810が選択されるように(たとえば、図15に関連して使用される基準にしたがって選択されるように)、W1を全てのP1強度の中で最大にしてもよい。その結果、出力スペクトルは、選択されたスペクトル1810について保持時間一致を通じて被追跡前駆体P1と一致した生成物イオンAおよびBを含む。処理は、質量においてAおよびBと一致する3つの追跡スペクトル中のその他のイオンを発見するために実行される。本明細書に記載される質量一致技術による例1800に関連して、Aは1820にも存在すると判断され、Bもまた1820に存在すると判断される。Aの強度は、全ての一致する追跡スペクトルにわたるAの強度の和として決定され、したがって、出力スペクトル1840におけるAの強度がA1+A2となるように、1820におけるAの強度A2が1810におけるAの強度A1に加算される。同様に、Bの強度は全ての一致する追跡スペクトルにわたるBの強度の和として決定され、したがって、出力スペクトル1840におけるBの強度がB1+B2となるように、1820におけるBの強度B2が、1810におけるBの強度B1に加算される。Cが出力スペクトルに含まれないことに、注意する。
【0163】
あるいは、同じ出力スペクトル1840を取得するために、すぐ上に記載されたのとは異なる処理ステップを使用する一実施形態において、Mergetrack技術が実行されてもよい。この代替案を示す例は、ここで図17を参照して記載される。この代替実施形態において、入力データ集合に含まれる前駆体P1ならびに追跡スペクトル1810、1820、および1830について、Sumtrack技術の実施形態は、第一の結果的スペクトルを決定するために、第一ステップにおける処理を実行してもよい。要素1910は、この例のための上記第一の結果的スペクトルを表し、前駆体、および入力データ集合の少なくとも1つのスペクトル中の前駆体と保持時間が一致した全ての生成物イオンを含む。要素1910は、たとえば、図4および図5に関連して本明細書に記載される処理ステップを実行することによって、生成されてもよい。第二ステップにおいて、Hitrack技術の実施形態は、3つの追跡スペクトル1810、1820、および1830を使用して処理が実行されてもよい。要素1810が、図17に示されるように、選択される。代替実施形態はその後、第一の結果的スペクトル1910から、Hitrack技術の実施形態を使用して生成されたスペクトル1810に含まれない生成物イオンを除外する。この例において、1910からCが除外された結果、スペクトル1840となる。
【0164】
Mergetrack処理の先の2つの実施形態において、選択された生成物イオンは、(全ての追跡スペクトルに対して)被追跡前駆体の強度が最大となる追跡スペクトルに含まれ、被追跡前駆体の保持時間と一致する保持時間を有するものである。前駆体および生成物イオンの各々の強度は、Sumtrack技術の実施形態で決定されたものに対応する強度和であってもよい。本明細書のMergetrack技術の実施形態はいずれも、与えられた被追跡前駆体のために生成物イオンの同じ集合を選択し、生成物および前駆体イオンについて同じ強度を決定するという結果になる。
【0165】
Mergetrack技術の先の2つの代替実施形態の処理が、ここで要約される。Mergetrackについて図18および図19で記載されるような処理を実行する前に、各追跡スペクトルについて、どの生成物イオンがその被追跡前駆体に関連しているかを判断するために、被追跡前駆体を含む追跡スペクトルの保持時間一致が実行されてもよいことに留意されたい。図18および図19の処理で使用されるスペクトルは、前駆体および生成物イオンが一致する保持時間を有すると決定されるように、各スペクトルが、保持時間枠内で発生する保持時間を有する同じ前駆体および生成物イオンを含むように、本明細書に記載されるような保持時間一致を適用した結果であってもよい。
【0166】
図18を参照すると、Mergetrack技術の実施形態において実行されてもよい処理ステップのフローチャートが示されている。フローチャート1950は、図16を参照して先に記載されたような、Mergetrackを実行するための第一手法のための処理を要約している。ステップ1952において、出力スペクトルの中の被追跡前駆体強度が、全ての追跡スペクトルにわたる前駆体の強度の和として決定される。ステップ1954において、Hitrack技術の実施形態を使用して、被追跡前駆体を含む追跡スペクトルの処理を実行することによって、結果的に生じるスペクトルが決定される。ステップ1954は、図15に関連して本明細書に記載される処理の実行を含んでもよい。ステップ1954で生成された結果的スペクトルは、(全ての追跡スペクトルに対して)被追跡前駆体の強度が最大となる追跡スペクトルに含まれ、かつ被追跡前駆体の保持時間と一致する保持時間を有する、生成物イオンを同定する。ステップ1956において、ステップ1954の結果的スペクトルにおける各生成物イオンについて、追跡スペクトルのうちのどれが生成物イオンを含むかが判断される。出力スペクトルの中の生成物イオンの強度は、前駆体を含み、生成物イオンと前駆体が一致する保持時間を有する、全ての追跡スペクトルにわたる生成物イオンの強度の和として決定される。ステップ1958において、出力スペクトルは、ステップ1954からの被追跡前駆体がステップ1952で決定された強度を有し、各生成物イオンがステップ1956によって決定されているように、対応する強度を有する、結果的スペクトルとして決定される。
【0167】
図19を参照すると、Mergetrack技術の第二の実施形態に関連して実行されてもよい処理ステップのフローチャートが示されている。フローチャート2000は、図17を参照して先に記載されたような、Mergetrackを実行するための第二の手法のための処理を要約している。ステップ2002において、Sumtrack技術の実施形態を使用して被追跡前駆体を含むスペクトルの処理を実行することによって、第一の結果的スペクトルが決定される。第一の結果的スペクトルは、追跡スペクトルのうち少なくとも1つの中の被追跡前駆体の保持時間と一致する保持時間を有すると判断された生成物イオンを同定してもよい。ステップ2002は、図4および図5に関連して本明細書に記載される処理の実行を含んでもよい。ステップ2004において、Hitrack技術の実施形態を使用して、被追跡前駆体を含むスペクトルの処理を実行することによって、第二の結果的スペクトルが決定される。ステップ2004は、図15に関連して本明細書に記載される処理の実行を含んでもよい。第二の結果的スペクトルは、(全ての追跡スペクトルに対して)被追跡前駆体の強度が最大となる追跡スペクトルに含まれ、かつ被追跡前駆体の保持時間と一致する保持時間を有する、生成物イオンを同定する。ステップ2006において、第一の結果的スペクトルから、ステップ2004で決定された第二の結果的スペクトルに含まれないこれらのイオンを除外することによって、出力スペクトルが決定される。
【0168】
図18の処理の結果として生成された出力スペクトルは、図19の処理の結果として生成された出力スペクトルと同じであってもよい。
【0169】
図4、図5、図12、図13、図18、および図19に示されるような、本明細書の技術を利用する実施形態で実行される処理ステップは、コンピュータプロセッサによって実行されるコードの結果として行われてもよい。コードは、コンピュータ読み取り可能媒体、メモリなどの様々な異なる形態のいずれか1つに記憶されてもよい。
【0170】
一実施形態において本明細書に記載される技術に関連して、混合物中の分子は、液体クロマトグラフにおいて分離されてもよく、未修飾形態で溶離してもよい。先の分子は、LC/MSシステムにおいて1つ以上のイオンを生じさせることができ、起源分子とも称されてもよい。一実施形態に含まれてもよいその他の任意の処理と同様に、エレクトロスプレまたはその他のイオン化処理を受けると、起源分子の結果的な質量スペクトルは、2つ以上のイオンを含み得る。複数のイオンは、たとえば、分子の同位体分布、イオン化によって生じた異なる電荷状態、および/またはイオンに適用された断片化機構、あるいはLCからの溶離に続いて課せられるその他の変化から、生じる可能性がある。このように、起源分子は1つ以上のイオンを生成してもよい。本明細書に記載の技術に関連して、同じ起源分子に由来するイオンのピーク形状および保持時間は、同じであると見なされる保持時間を含む測定値を有するので、同一である。
【0171】
本明細書の技術に関連して記載されたイオンリストは、1行以上のデータを含んでもよい。一実施形態において、イオンリストの各行は、イオンを記述する、保持時間、質量/電荷、強度を含む。イオンリスト中の各イオンに関するデータは、様々な異なる技術のうちのいずれか1つを使用して取得されてもよい。たとえば、1つ以上のイオンに関するデータは、LEまたはHEモードでBateman技術を使用して取得されてもよい。イオンリストはまた、LEまたはHE取得モードを使用して取得されるような、各行が保持時間、mwHPlus、強度、および電荷状態を含む、AMRT(正確な質量保持時間)のリストを参照してもよい。AMRTは、Silvaらによる「Quantitative Proteomic Analysis by Accurate Mass Retention Time Pairs」、Anal.Chem.,Vol.77,2187〜2200頁(2005)に、より詳細に記載されている。
【0172】
本明細書に記載の技術に関連して使用される入力データ集合に含まれるスペクトルは、各々がm/z(またはmwHPlus)および強度によって記述されている、イオン(またはAMRT)のリストを含んでもよい。一実施形態は、質量分析計によって収集されるような単一の走査において取得されるデータを含む第一技術を使用して、入力データ集合におけるスペクトルを取得してもよい。この場合、スペクトルのイオンリストは、スペクトルにおいてみられるような質量スペクトルピークに対応し、スペクトルの保持時間は、スペクトル走査の取得時間である。あるいは、たとえば、参照により本明細書に組み込まれる、Gorensteinらによる、2005年9月1日公開の国際公開第2005/079263号パンフレット、米国特許出願公開第2005/004180号明細書、APPARATUS AND METHOD FOR IDENTIFYING PEAKS IN LIQUID CHROMATOGRAPHY/MASS SPECTROMETRY DATA AND FOR FORMING SPECTRA AND CHROMATOGRAMS に記載されているように、スペクトルは、保持時間および保持時間枠を選択し、その保持時間がこの枠内に収まる全てのイオンをイオンリストから収集することによって取得されてもよい。スペクトルの保持時間は、たとえば、FWHMで測定されたクロマトグラフィピーク幅の±1/10として表される枠の中央に位置する保持時間として、決定されてもよい。
【0173】
本明細書に記載される技術に関連して使用される入力データ集合に含まれるスペクトルは、たとえばその質量または強度が特定の範囲から外れているイオン(またはAMRTS)を除外することなどによって、フィルタをかけられてもよいことに留意されたい。
【0174】
本明細書の保持一致および生成物イオン選択技術に関連して、出力スペクトルは、1つ以上の出力規則に応じた形態で生成されてもよい。たとえば、本明細書に記載されるように、第一スペクトル中の生成物イオンは第一測定質量を有してもよく、入力データ集合の第二スペクトル中の同じ生成物イオンは第二測定質量を有してもよい。第一および第二測定質量は、それらが定義された質量公差内であれば、同じ質量と見なされてもよい。出力スペクトルにおいて、生成物イオンの質量は、たとえば、出力スペクトルにおいて出力される質量は第一および第二測定質量の平均であってもよいなどの規則に従って、出力されてもよい。出力スペクトルは、たとえば、第一または第二スペクトルのいずれか一方から取得された質量のみからなってもよい。その他の実施形態は、出力スペクトルに含まれる値を決定するために、その他の技術を使用してもよい。また、2つのスペクトル中の2つの質量が質量公差の範囲内であるか否かを判断するための先の技術の使用、およびそうであった場合に、2つの質量が異なるスペクトル中の同じイオンに対応すると判断することは、本明細書の技術と関連して利用されてもよい。たとえば、上記は、2つの異なるスペクトル中の2つの生成物イオンが一致するとみなされ、したがって同じ生成物イオンを表すか否かを判断するために、使用されてもよい。
【0175】
保持一致技術とともに使用される入力データ集合に含まれる1つ以上のスペクトルは、様々な異なる源に由来してもよい。上述のように、スペクトルは、1つ以上の実験から、様々な異なる方法で、生成されてもよい。スペクトルまたはその他の形態の入力データ集合に含まれるデータもまた、データベースまたはその他のデータストアに由来してもよい。たとえば、以前の実験からのデータがデータベースに記憶されていてもよい。データベースからの以前の実験データは、単一でまたは新しい追加データと組み合わされて、入力データ集合に含まれてもよい。データベースまたはその他のデータストアに含まれるデータは、本明細書に記載の技術に関連して使用するための理論的または模擬実験済みの実験データを含んでもよい。たとえば、MS/MSスペクトルのDDAを使用して取得されたスペクトルが、含まれてもよい。
【0176】
入力データ集合を取得するために使用された試料がタンパク質の複合混合物である一実施形態において、異なるタンパク質からのイオンが保持時間において重複するかも知れない。このようなデータについて、単一の注入において最も強力なイオンを選択し、最強イオンの保持時間枠内の全ての生成物イオンのスペクトルを形成することによって、本明細書の技術が適用されてもよい。この最強イオンは、本明細書に記載されるように両方の注入の前駆体に質量および保持時間(たとえば、特定の質量公差の範囲内の各注入の質量、および上述の第二閾値または枠の範囲内にある各注入の保持時間)を一致させることによって、実質的に同じタンパク質の混合物のその後の注入において発見される前駆体イオンと見なされてもよい。
【0177】
本明細書に記載の技術に関連して、同位体変形および/または電荷状態の変化が、前駆体および生成物イオンに生じるかも知れない。本明細書に記載のフローチャートの処理ステップには明確に含まれていないが、特定のイオンでの上述の変化が認識され、本明細書に記載の技術にしたがってイオンおよび任意のそのような変形を単一体として処理するための情報を減少または要約するための処理が実行されてもよいことは、当業者によって理解されるであろう。たとえば、先の単一体は、1の電荷状態を有する特定の保持時間に発生するイオンの単一同位体質量を有してもよい。
【0178】
本明細書には、異なる保持時間一致および前駆体選択技術の実施形態が記載される。一実施形態において処理ステップが実行されてもよい特定の順番が本明細書に記載されるのとは異なってもよいことは、当業者に理解されるであろう。
【0179】
本明細書に記載される内容の変形、修正、およびその他の実行は、請求項に記載される本発明の精神および範囲から逸脱することなく、当業者に想到されるであろう。したがって、本発明は、上記の説明的記載によらず、以下の請求項の精神および範囲によって、定義されるべきである。
【特許請求の範囲】
【請求項1】
前駆体イオンを1つ以上の関連生成物イオンと一致させる方法であって、
複数の注入から取得された複数の入力データ集合を提供するステップであって、前記複数の入力データ集合の各々が同じ前駆体イオンおよび1つ以上の生成物イオンを含む、ステップと、
前記前駆体イオンの単一の保持時間にしたがって、前記複数の入力データ集合を正規化するステップと、
前記複数の入力データ集合の各々について、前記前駆体イオンの前記単一の保持時間に対して、どの生成物イオンが所定の保持時間枠内にあるかを判断するステップと、
生成物イオンが前記複数の入力データ集合の少なくとも1つの所定の保持時間枠内にある場合に、前記生成物イオンが前記単一の保持時間を有する前記前駆体イオンに関連すると判断するステップとを含む、方法。
【請求項2】
前記複数のデータ集合の各々が複数の前駆体イオンを含み、前記正規化ステップがさらに、
前記単一の保持時間に、前記複数の入力データ集合の各々における各前駆体イオンを整合させるステップと、前記整合ステップによって前記各前駆体イオンが移動させられる量にしたがって、前記複数の入力データ集合の前記各々の生成物イオンを時間的に移動させるステップとを含む、請求項1に記載の方法。
【請求項3】
前記所定の保持時間枠が、幅および閾値を使用して決定される、請求項1に記載の方法。
【請求項4】
前記幅が、前駆体イオンの質量スペクトルピークの半値全幅ピークとして決定されるクロマトグラフィピーク幅である、請求項3に記載の方法。
【請求項5】
前記閾値が前記幅の十分の一であり、前記所定の保持時間枠が前記幅から前記閾値を減算することによって決定された下限を有し、前記所定の保持時間枠が前記幅に前記閾値を加算することによって決定された上限を有する、請求項3に記載の方法。
【請求項6】
既存のデータストアに、前記前駆体イオンおよび前記1つ以上の生成物イオンに関する情報で注釈を付けるステップをさらに含む、請求項1に記載の方法。
【請求項7】
前記単一の保持時間を有する前記前駆体イオンに関連する各生成物イオンについて強度和を決定するステップであって、前記強度和が、前記各生成物イオンの1つ以上の強度を加算することによって決定され、前記1つ以上の強度の各々が、前記注入のうちの異なる1つにおける前記各生成物イオンの強度に対応するステップをさらに含む、請求項1に記載の方法。
【請求項8】
前記生成物イオンの各々に関連づけられた強度和にしたがって、前記前駆体イオンに関連する多数の生成物イオンを選択するステップをさらに含む、請求項7に記載の方法。
【請求項9】
生成物イオンの各々に関連づけられた強度和にしたがって、前記前駆体イオンに関連する生成物イオンを順位付けするステップをさらに含む、請求項8に記載の方法。
【請求項10】
同じ試料を使用して複数の複製注入を実行するステップをさらに含む、請求項1に記載の方法。
【請求項11】
複数の注入を実行するステップであって、前記複数の注入の各々が異なる試料を利用するステップをさらに含む、請求項1に記載の方法。
【請求項12】
前記複数の入力データ集合が、タンパク質混合物である試料を使用して取得される、請求項1に記載の方法。
【請求項13】
前記複数の入力データ集合が、血清である試料を使用して取得される、請求項1に記載の方法。
【請求項14】
前記複数の入力データ集合が、組織試料である試料を使用して取得される、請求項1に記載の方法。
【請求項15】
前記複数の入力データ集合が、複数のタンパク質を含む試料を使用して取得される、請求項1に記載の方法。
【請求項16】
前記複数の入力データ集合が、単一プリペプチドである試料を使用して取得される、請求項1に記載の方法。
【請求項17】
第一低断片化モードと第二高断片化モードを交互に行って、前記第一低断片化モードの第一スペクトルおよび前記第二高断片化モードの第二スペクトルを取得することによって、前記前駆体イオンを質量分析することで、前記複数の入力データ集合の一部が生成される、請求項1に記載の方法。
【請求項18】
前記複数の入力データ集合が、消化されたタンパク質である試料を使用して取得され、
前記消化されたタンパク質に対してLC/MSを実行するステップをさらに含む、請求項17に記載の方法。
【請求項19】
前記複数の入力データ集合が、タンパク質を含まない試料を使用して取得される、請求項17に記載の方法。
【請求項20】
前記複数の入力データ集合の少なくとも一部がスペクトルである、請求項1に記載の方法。
【請求項21】
前記複数のデータ集合の少なくとも一部がイオンリストであって、前記イオンリスト上の各イオンが、保持時間、強度、および質量、または前記各イオンの質量対電荷比を含む情報で注釈が付けられている、請求項1に記載の方法。
【請求項22】
前記複数の前記入力データ集合が、第一タンパク質を含む少なくとも1つの試料を使用して取得され、
タンパク質プロファイルのカタログを提供するステップであって、前記タンパク質プロファイルの各々がタンパク質の同定によって定義され、前記カタログが前記第一タンパク質のプロファイルを含むステップと、
前記第一タンパク質に関する情報を追加することによって前記カタログを更新するステップであって、前記情報が前記前駆体イオンおよび前記1つ以上の関連生成物イオンに関するデータを含むステップとをさらに含む、請求項1に記載の方法。
【請求項23】
前記カタログを使用して、未知の試料の1つ以上の未知のタンパク質を同定するステップをさらに含む、請求項22に記載の方法。
【請求項24】
前記同定ステップが、
前記未知の試料に関する第一データを取得するステップと、
前記第一タンパク質を前記未知の試料に含まれると特定するために、前記第一データの一部を前記前駆体イオンおよび前記カタログに含まれる前記1つ以上の関連生成物イオンに関する前記データと一致させるステップとを含む、請求項23に記載の方法。
【請求項25】
第一質量を有する第一入力データ集合中の第一生成物イオン、および第二質量を有する第二入力データ集合中の第二生成物イオンが、前記第一質量が前記第二質量の所定の質量公差枠内である場合に、同じ生成物イオンとして判断される、請求項1に記載の方法。
【請求項26】
前駆体を関連生成物イオンと一致させる方法であって、
複数の注入を実行するステップと、
前記各前駆体に関連づけられた保持時間および質量を含む基準にしたがって、前記複数の注入のいずれが前記前駆体の各々を含むかを判断するために、複数の注入にわたって前記前駆体の各々を追跡するステップと、
前記前駆体の各々のために、関連生成物イオンの集合を決定するステップであって、前記関連生成物イオンの各々が、前記複数の注入の少なくとも1つにおける前記各前駆体の前記保持時間に対して所定の保持時間枠内の保持時間を有するステップと、
前記前駆体の各々の前記関連生成物イオンの各々のために、強度和を決定するステップであって、前記強度和が前記各関連生成物イオンの1つ以上の強度を加算することによって決定され、前記1つ以上の強度の各々が、前記各前駆体を含む前記複数の注入の異なる1つにおける前記各関連生成物イオンの強度に対応するステップとを含む、方法。
【請求項27】
前記前駆体追跡ステップが、
第一注入における第一前駆体の第一保持時間、および第二注入における第二前駆体の第二保持時間を決定するステップと、
前記第一保持時間および前記第二保持時間が保持時間公差内であるか否かを判断するステップと、
前記第一前駆体の第一質量および前記第二前駆体の第二質量を決定するステップと、
前記第一質量および前記第二質量が質量公差内であるか否かを判定するステップと、
前記第一保持時間および前記第二保持時間が前記保持時間公差内であって、前記第一質量および前記第二質量が前記質量公差内である場合に、前記第一前駆体および前記第二前駆体が、異なる注入において発生する同じ前駆体の事例であると判断するステップとを含む、請求項26に記載の方法。
【請求項28】
試料分析装置であって、
クロマトグラフィモジュールと、
前記クロマトグラフィモジュールと通信する質量分析モジュールと、
前記クロマトグラフィモジュールおよび前記質量分析モジュールと通信する制御部であって、少なくとも1つのプロセッサ、および前記プロセッサによって実行される複数の命令を記憶するためのメモリを含む、制御部とを含み、前記複数の命令が、前記プロセッサに、
各前駆体に関連づけられた保持時間および質量を含む基準にしたがって、複数の注入のいずれが前記前駆体の各々を含むかを判断するために、前記複数の注入にわたって前記前駆体を追跡するステップと、
前記前駆体の各々のために、関連生成物イオンの集合を決定するステップであって、前記関連生成物イオンの各々が、前記複数の注入の少なくとも1つにおける前記各前駆体の前記保持時間に対して所定の保持時間枠内の保持時間を有するステップと、
前記前駆体の各々の前記関連生成物イオンの各々のために、強度和を決定するステップであって、前記強度和が、前記各関連生成物イオンの1つ以上の強度を加算することによって決定され、前記1つ以上の各強度が、前記各前駆体を含む前記複数の注入の異なる1つにおける前記各生成物イオンの強度に対応するステップとを実行させる装置。
【請求項29】
前駆体イオンを1つ以上の関連生成物イオンと一致させるために記憶された実行可能コードを含むコンピュータ読み取り可能媒体であって、
複数の注入から取得された複数の入力データ集合を提供するステップであって、前記複数の入力データ集合の各々が同じ前駆体イオンおよび1つ以上の生成物イオンを含むステップと、
前記前駆体イオンの単一の保持時間にしたがって、前記複数の入力データ集合を正規化するステップと、
前記複数の入力データ集合の各々について、前記前駆体イオンの前記単一の保持時間に対して、どの生成物イオンが所定の保持時間枠内にあるかを判断するステップと、
生成物イオンが前記複数の入力データ集合の少なくとも1つの所定の保持時間枠内にある場合に、前記生成物イオンが前記単一の保持時間を有する前記前駆体イオンに関連すると判断するステップとを実行させるための実行可能コードを含む、コンピュータ読み取り可能媒体。
【請求項30】
前駆体イオンを1つ以上の関連生成物イオンと一致させる方法であって、
複数の注入から取得された複数の入力データ集合を提供するステップであって、前記複数の入力データ集合の各々が同じ前駆体イオンおよび1つ以上の生成物イオンを含むステップと、
前記前駆体イオンの単一の保持時間にしたがって、前記複数の入力データ集合を正規化するステップと、
前記複数の入力データ集合の各々について、前記前駆体イオンの前記単一の保持時間に対して、どの生成物イオンが所定の保持時間枠内の対応する保持時間を有するかを判断するステップと、
前記判断ステップによって、生成物イオンが、前記複数の入力データ集合の少なくとも1つにおける前記単一の保持時間に対して所定の保持時間枠内の対応する保持時間を有すると判断された場合に、前記生成物イオンが、前記単一の保持時間を有する前記前駆体イオンに関連していると判断された生成物イオンの結果的な集合に含まれるように、前記複数の入力データ集合に含まれる生成物イオンに対して和集合演算を実行するステップとを含む、方法。
【請求項31】
前駆体イオンを1つ以上の関連生成物イオンと一致させる方法であって、
複数の注入から取得された複数の入力データ集合を提供するステップであって、前記複数の入力データ集合の各々が、第一保持時間を有する同じ前駆体イオンおよび前記前駆体イオンの前記第一保持時間に対して所定の保持時間枠内の保持時間を有する1つ以上の生成物イオンを含むステップと、
前記前駆体の強度が、前記複数の入力データ集合のその他における前記前駆体の強度に対して最大となる、第一の入力データ集合を選択するステップと、
第一集合の各生成物イオンが前記選択ステップによって選択された前記第一入力データ集合に含まれ、前記第一保持時間に対して前記所定の保持時間枠内の保持時間を有する、生成物イオンの第一集合を決定するステップと、
前記第一集合の各生成物イオンについて、第一の結果として、前記複数の入力データ集合のいずれが前記第一保持時間に対して前記所定の保持時間枠内の保持時間を有する前記各生成物イオンを含むかを決定し、前記第一の結果における入力データ集合にわたる前記生成物イオンの強度の合計として、前記各生成物イオンの強度和を決定するステップであって、前記生成物イオンの第一集合が前記前駆体に関連し、前記第一集合の前記各生成物イオンが前記強度和決定ステップによって決定された強度和を有するステップとを含む、方法。
【請求項32】
前記複数の入力データ集合にわたる前記前駆体の強度の和である強度を有する前記前駆体を含む出力データを決定するステップであって、前記出力データ集合が、前記第一集合の各生成物イオンおよび前記第一決定ステップで決定された強度和を有する前記各生成物イオンを含み、前記出力データ集合が前記前駆体に関連する生成物イオンを含むステップをさらに含む、請求項31に記載の方法。
【請求項33】
前記所定の保持時間枠が、幅および閾値を使用して決定される、請求項31に記載の方法。
【請求項34】
前記幅が、前駆体イオンの質量スペクトルピークの半値全幅ピークとして決定されたクロマトグラフィピーク幅である、請求項33に記載の方法。
【請求項35】
前記閾値が前記幅の1/10であり、前記所定の保持時間枠が、前記幅から前記閾値を減算することによって決定された下限を有し、前記所定の保持時間枠が前記幅に前記閾値を加算することによって決定された上限を有する、請求項33に記載の方法。
【請求項36】
前記複数の入力データ集合の一部が、第一低断片化モードと第二高断片化モードとを交互に行って、前記第一低断片化モードの第一スペクトルおよび前記第二高断片化モードの第二スペクトルを取得することによって、前記前駆体イオンを質量分析することで生成される、請求項31に記載の方法。
【請求項37】
前記複数の入力データ集合が、消化されたタンパク質である試料を使用して取得され、
該方法が前記消化されたタンパク質に対してLC/MSを実行するステップをさらに含む、請求項36に記載の方法。
【請求項38】
前駆体イオンを1つ以上の関連生成物イオンと一致させる方法であって、
複数の注入から取得された複数の入力データ集合を提供するステップであって、前記複数の入力データ集合の各々が、第一保持時間を有する同じ前駆体イオン、および前記前駆体イオンの前記第一保持時間に対して所定の保持時間枠内の保持時間を有する1つ以上の生成物イオンを含むステップと、
前記複数の入力データ集合の少なくとも1つの前記第一保持時間に対して前記所定の保持時間枠内の保持時間を有する生成物イオンの第一集合を決定するステップであって、前記第一集合の各生成物イオンが、前記各生成物イオンを含む前記複数中の入力データ集合にわたる前記生成物イオンの強度の和である強度を有し、前記各生成物イオンが、前記第一保持時間に対して前記所定の保持時間枠内の保持時間を有するステップと、
前記前駆体イオンの強度が、前記複数の入力データ集合のその他における前記前駆体の強度に対して最大となる、第一の入力データ集合を選択するステップと、
第二集合の各生成物イオンが前記選択ステップによって選択された前記第一入力データ集合に含まれ、前記第一保持時間に対して前記所定の保持時間枠内の保持時間を有する、生成物イオンの前記第二集合を決定するステップと、
前記第一集合から、前記第二集合に含まれない生成物イオンを除外するステップであって、前記除外を実行した後に、前記第一集合が前記前駆体に関連する生成物イオンを含むステップとを含む、方法。
【請求項39】
前記除外するステップを実行した後に、前記生成物イオンの第一集合を含む出力データ集合を決定するステップであって、前記出力データ集合が、前記複数の入力データ集合にわたる前記前駆体の強度の和である強度を有する前記前駆体を含み、前記第一集合の各生成物イオンが、生成物イオンの第一集合を決定するステップによって決定された強度を有するステップをさらに含む、請求項38に記載の方法。
【請求項40】
前記所定の保持時間枠が、幅および閾値を使用して決定される、請求項38に記載の方法。
【請求項41】
前記幅が、前駆体イオンの質量スペクトルピークの半値全幅ピークとして決定されたクロマトグラフィピーク幅である、請求項40に記載の方法。
【請求項42】
前記閾値が前記幅の1/10であり、前記所定の保持時間枠が、前記幅から前記閾値を減算することによって決定された下限を有し、前記所定の保持時間枠が前記幅に前記閾値を加算することによって決定された上限を有する、請求項40に記載の方法。
【請求項43】
前記複数の入力データ集合の一部が、第一低断片化モードと第二高断片化モードとを交互に行って、前記第一低断片化モードの第一スペクトルおよび前記第二高断片化モードの第二スペクトルを取得することによって、前記前駆体イオンを質量分析することで生成される、請求項38に記載の方法。
【請求項44】
前記複数の入力データ集合が、消化されたタンパク質である試料を使用して取得され、
該方法が前記消化されたタンパク質に対してLC/MSを実行するステップをさらに含む、請求項43に記載の方法。
【請求項45】
前駆体イオンに関連する生成物イオンを判定する方法であって、
複数の注入から取得された複数の入力データ集合を提供するステップであって、前記複数の入力データ集合の各々が、第一保持時間を有する同じ前駆体イオン、および前記前駆体イオンの前記第一保持時間に対して所定の保持時間枠内の保持時間を有する1つ以上の生成物イオンを含むステップと、
複数の保持時間一致および生成物イオン選択技術を提供するステップであって、前記複数の保持時間一致および生成物イオン選択技術の各々が、前記前駆体に関連すると判断された関連生成物イオンに関する前記複数の入力データ集合からの情報を組み合わせる処理を実行し、前記関連生成物イオンが各々、前記第一保持時間に対して前記所定の保持時間枠内の保持時間を有し、前記複数の保持時間一致および生成物イオン選択技術が、生成物イオンが複数の入力データ集合のうち少なくとも1つにおける前記第一保持時間に対して所定の保持時間枠内の保持時間を有する場合に、前記生成物イオンが前記前駆体イオンに関連すると判断する第一技術を含むステップと、
複数の保持時間一致および生成物イオン選択技術のうちの少なくとも1つを選択するステップと、
前記前駆体イオンに関連する生成物イオンを判定するために、前記少なくとも1つの選択された保持時間一致および生成物イオン選択技術を使用して、前記複数の入力データ集合を処理するステップとを含む、方法。
【請求項46】
前記複数の保持時間一致および生成物イオン選択技術が、前記第一技術の選択基準を使用する第二技術を含む、請求項45に記載の方法。
【請求項47】
前記複数の保持時間一致および生成物イオン選択技術が、前記前駆体イオンの強度が複数の入力データ集合のその他における前記前駆体の強度に対して最大である前記複数の入力データ集合のうち1つを選択する第二技術を含み、前記第二技術が、前記第一保持時間に対して前記所定の保持時間枠内の保持時間を有する前記選択された入力データ集合に含まれる生成物イオンが前記前駆体に関連すると判断する、請求項45に記載の方法。
【請求項48】
前記複数の保持時間一致および生成物イオン選択技術が、各々同じ生成物イオンの集合を前記前駆体イオンに関連すると判断する第二技術および第三技術を含む、請求項45に記載の方法。
【請求項49】
前駆体イオンを1つ以上の関連生成物イオンと一致させるために記憶された実行可能コードを含むコンピュータ読み取り可能媒体であって、
複数の注入から取得された複数の入力データ集合を提供するステップであって、前記複数の入力データ集合の各々が、第一保持時間を有する同じ前駆体イオン、および前記前駆体イオンの前記第一保持時間に対して所定の保持時間枠内の保持時間を有する1つ以上の生成物イオンを含むステップと、
前記前駆体イオンの強度が前記複数の入力データ集合のその他における前記前駆体の強度に対して最大である、第一の入力データ集合を選択するステップと、
第一集合の各生成物イオンが、前記選択するステップによって選択された前記第一入力データ集合に含まれ、前記第一保持時間に対して前記所定の保持時間枠内の保持時間を有する、生成物イオンの第一集合を決定するステップと、
前記第一集合の各生成物イオンについて、第一の結果として、前記複数の入力データ集合のいずれが、前記第一保持時間に対して前記所定の保持時間枠内の保持時間を有する前記各生成物イオンを含むかを判断し、前記第一の結果における入力データ集合にわたる前記生成物イオンの強度の和として前記各生成物イオンの強度和を決定するステップであって、前記生成物イオンの第一集合が前記前駆体に関連し、前記第一集合の前記生成物イオンの各々が前記強度和を決定するステップによって決定された強度和を有するステップとを実行させるための実行可能コードを含む、コンピュータ読み取り可能媒体。
【請求項50】
前駆体イオンを1つ以上の関連生成物イオンと一致させるために記憶された実行可能コードを含むコンピュータ読み取り可能媒体であって、
複数の注入から取得された複数の入力データ集合を提供するステップであって、前記複数の入力データ集合の各々が、第一保持時間を有する同じ前駆体イオン、および前記前駆体イオンの前記第一保持時間に対して所定の保持時間枠内の保持時間を有する1つ以上の生成物イオンを含むステップと、
前記複数の入力データ集合のうちの少なくとも1つにおける前記第一保持時間に対して前記所定の保持時間枠内の前記保持時間を有する生成物イオンの第一集合を決定するステップであって、前記第一集合の各生成物イオンが、前記各生成物イオンを含む前記複数中の入力データ集合にわたる前記生成物イオンの強度の和である強度を有し、前記各生成物イオンが、前記第一保持時間に対して前記所定の保持時間枠内の保持時間を有するステップと、
前記前駆体イオンの強度が、前記複数の入力データ集合のその他における前記前駆体イオンの強度に対して最大となる、第一の入力データ集合を選択するステップと、
前記第二集合の各生成物イオンが前記選択するステップによって選択された前記第一入力データ集合に含まれ、前記第一保持時間に対して前記所定の保持時間枠内の保持時間を有する、生成物イオンの第二集合を決定するステップと、
前記生成物イオンの第一集合から、前記第二集合に含まれない生成物イオンを除外するステップであって、前記除外するステップを実行した後に、前記第一集合が前記前駆体に関連する生成物イオンを含むステップとを実行させるための実行可能コードを含む、コンピュータ読み取り可能媒体。
【請求項1】
前駆体イオンを1つ以上の関連生成物イオンと一致させる方法であって、
複数の注入から取得された複数の入力データ集合を提供するステップであって、前記複数の入力データ集合の各々が同じ前駆体イオンおよび1つ以上の生成物イオンを含む、ステップと、
前記前駆体イオンの単一の保持時間にしたがって、前記複数の入力データ集合を正規化するステップと、
前記複数の入力データ集合の各々について、前記前駆体イオンの前記単一の保持時間に対して、どの生成物イオンが所定の保持時間枠内にあるかを判断するステップと、
生成物イオンが前記複数の入力データ集合の少なくとも1つの所定の保持時間枠内にある場合に、前記生成物イオンが前記単一の保持時間を有する前記前駆体イオンに関連すると判断するステップとを含む、方法。
【請求項2】
前記複数のデータ集合の各々が複数の前駆体イオンを含み、前記正規化ステップがさらに、
前記単一の保持時間に、前記複数の入力データ集合の各々における各前駆体イオンを整合させるステップと、前記整合ステップによって前記各前駆体イオンが移動させられる量にしたがって、前記複数の入力データ集合の前記各々の生成物イオンを時間的に移動させるステップとを含む、請求項1に記載の方法。
【請求項3】
前記所定の保持時間枠が、幅および閾値を使用して決定される、請求項1に記載の方法。
【請求項4】
前記幅が、前駆体イオンの質量スペクトルピークの半値全幅ピークとして決定されるクロマトグラフィピーク幅である、請求項3に記載の方法。
【請求項5】
前記閾値が前記幅の十分の一であり、前記所定の保持時間枠が前記幅から前記閾値を減算することによって決定された下限を有し、前記所定の保持時間枠が前記幅に前記閾値を加算することによって決定された上限を有する、請求項3に記載の方法。
【請求項6】
既存のデータストアに、前記前駆体イオンおよび前記1つ以上の生成物イオンに関する情報で注釈を付けるステップをさらに含む、請求項1に記載の方法。
【請求項7】
前記単一の保持時間を有する前記前駆体イオンに関連する各生成物イオンについて強度和を決定するステップであって、前記強度和が、前記各生成物イオンの1つ以上の強度を加算することによって決定され、前記1つ以上の強度の各々が、前記注入のうちの異なる1つにおける前記各生成物イオンの強度に対応するステップをさらに含む、請求項1に記載の方法。
【請求項8】
前記生成物イオンの各々に関連づけられた強度和にしたがって、前記前駆体イオンに関連する多数の生成物イオンを選択するステップをさらに含む、請求項7に記載の方法。
【請求項9】
生成物イオンの各々に関連づけられた強度和にしたがって、前記前駆体イオンに関連する生成物イオンを順位付けするステップをさらに含む、請求項8に記載の方法。
【請求項10】
同じ試料を使用して複数の複製注入を実行するステップをさらに含む、請求項1に記載の方法。
【請求項11】
複数の注入を実行するステップであって、前記複数の注入の各々が異なる試料を利用するステップをさらに含む、請求項1に記載の方法。
【請求項12】
前記複数の入力データ集合が、タンパク質混合物である試料を使用して取得される、請求項1に記載の方法。
【請求項13】
前記複数の入力データ集合が、血清である試料を使用して取得される、請求項1に記載の方法。
【請求項14】
前記複数の入力データ集合が、組織試料である試料を使用して取得される、請求項1に記載の方法。
【請求項15】
前記複数の入力データ集合が、複数のタンパク質を含む試料を使用して取得される、請求項1に記載の方法。
【請求項16】
前記複数の入力データ集合が、単一プリペプチドである試料を使用して取得される、請求項1に記載の方法。
【請求項17】
第一低断片化モードと第二高断片化モードを交互に行って、前記第一低断片化モードの第一スペクトルおよび前記第二高断片化モードの第二スペクトルを取得することによって、前記前駆体イオンを質量分析することで、前記複数の入力データ集合の一部が生成される、請求項1に記載の方法。
【請求項18】
前記複数の入力データ集合が、消化されたタンパク質である試料を使用して取得され、
前記消化されたタンパク質に対してLC/MSを実行するステップをさらに含む、請求項17に記載の方法。
【請求項19】
前記複数の入力データ集合が、タンパク質を含まない試料を使用して取得される、請求項17に記載の方法。
【請求項20】
前記複数の入力データ集合の少なくとも一部がスペクトルである、請求項1に記載の方法。
【請求項21】
前記複数のデータ集合の少なくとも一部がイオンリストであって、前記イオンリスト上の各イオンが、保持時間、強度、および質量、または前記各イオンの質量対電荷比を含む情報で注釈が付けられている、請求項1に記載の方法。
【請求項22】
前記複数の前記入力データ集合が、第一タンパク質を含む少なくとも1つの試料を使用して取得され、
タンパク質プロファイルのカタログを提供するステップであって、前記タンパク質プロファイルの各々がタンパク質の同定によって定義され、前記カタログが前記第一タンパク質のプロファイルを含むステップと、
前記第一タンパク質に関する情報を追加することによって前記カタログを更新するステップであって、前記情報が前記前駆体イオンおよび前記1つ以上の関連生成物イオンに関するデータを含むステップとをさらに含む、請求項1に記載の方法。
【請求項23】
前記カタログを使用して、未知の試料の1つ以上の未知のタンパク質を同定するステップをさらに含む、請求項22に記載の方法。
【請求項24】
前記同定ステップが、
前記未知の試料に関する第一データを取得するステップと、
前記第一タンパク質を前記未知の試料に含まれると特定するために、前記第一データの一部を前記前駆体イオンおよび前記カタログに含まれる前記1つ以上の関連生成物イオンに関する前記データと一致させるステップとを含む、請求項23に記載の方法。
【請求項25】
第一質量を有する第一入力データ集合中の第一生成物イオン、および第二質量を有する第二入力データ集合中の第二生成物イオンが、前記第一質量が前記第二質量の所定の質量公差枠内である場合に、同じ生成物イオンとして判断される、請求項1に記載の方法。
【請求項26】
前駆体を関連生成物イオンと一致させる方法であって、
複数の注入を実行するステップと、
前記各前駆体に関連づけられた保持時間および質量を含む基準にしたがって、前記複数の注入のいずれが前記前駆体の各々を含むかを判断するために、複数の注入にわたって前記前駆体の各々を追跡するステップと、
前記前駆体の各々のために、関連生成物イオンの集合を決定するステップであって、前記関連生成物イオンの各々が、前記複数の注入の少なくとも1つにおける前記各前駆体の前記保持時間に対して所定の保持時間枠内の保持時間を有するステップと、
前記前駆体の各々の前記関連生成物イオンの各々のために、強度和を決定するステップであって、前記強度和が前記各関連生成物イオンの1つ以上の強度を加算することによって決定され、前記1つ以上の強度の各々が、前記各前駆体を含む前記複数の注入の異なる1つにおける前記各関連生成物イオンの強度に対応するステップとを含む、方法。
【請求項27】
前記前駆体追跡ステップが、
第一注入における第一前駆体の第一保持時間、および第二注入における第二前駆体の第二保持時間を決定するステップと、
前記第一保持時間および前記第二保持時間が保持時間公差内であるか否かを判断するステップと、
前記第一前駆体の第一質量および前記第二前駆体の第二質量を決定するステップと、
前記第一質量および前記第二質量が質量公差内であるか否かを判定するステップと、
前記第一保持時間および前記第二保持時間が前記保持時間公差内であって、前記第一質量および前記第二質量が前記質量公差内である場合に、前記第一前駆体および前記第二前駆体が、異なる注入において発生する同じ前駆体の事例であると判断するステップとを含む、請求項26に記載の方法。
【請求項28】
試料分析装置であって、
クロマトグラフィモジュールと、
前記クロマトグラフィモジュールと通信する質量分析モジュールと、
前記クロマトグラフィモジュールおよび前記質量分析モジュールと通信する制御部であって、少なくとも1つのプロセッサ、および前記プロセッサによって実行される複数の命令を記憶するためのメモリを含む、制御部とを含み、前記複数の命令が、前記プロセッサに、
各前駆体に関連づけられた保持時間および質量を含む基準にしたがって、複数の注入のいずれが前記前駆体の各々を含むかを判断するために、前記複数の注入にわたって前記前駆体を追跡するステップと、
前記前駆体の各々のために、関連生成物イオンの集合を決定するステップであって、前記関連生成物イオンの各々が、前記複数の注入の少なくとも1つにおける前記各前駆体の前記保持時間に対して所定の保持時間枠内の保持時間を有するステップと、
前記前駆体の各々の前記関連生成物イオンの各々のために、強度和を決定するステップであって、前記強度和が、前記各関連生成物イオンの1つ以上の強度を加算することによって決定され、前記1つ以上の各強度が、前記各前駆体を含む前記複数の注入の異なる1つにおける前記各生成物イオンの強度に対応するステップとを実行させる装置。
【請求項29】
前駆体イオンを1つ以上の関連生成物イオンと一致させるために記憶された実行可能コードを含むコンピュータ読み取り可能媒体であって、
複数の注入から取得された複数の入力データ集合を提供するステップであって、前記複数の入力データ集合の各々が同じ前駆体イオンおよび1つ以上の生成物イオンを含むステップと、
前記前駆体イオンの単一の保持時間にしたがって、前記複数の入力データ集合を正規化するステップと、
前記複数の入力データ集合の各々について、前記前駆体イオンの前記単一の保持時間に対して、どの生成物イオンが所定の保持時間枠内にあるかを判断するステップと、
生成物イオンが前記複数の入力データ集合の少なくとも1つの所定の保持時間枠内にある場合に、前記生成物イオンが前記単一の保持時間を有する前記前駆体イオンに関連すると判断するステップとを実行させるための実行可能コードを含む、コンピュータ読み取り可能媒体。
【請求項30】
前駆体イオンを1つ以上の関連生成物イオンと一致させる方法であって、
複数の注入から取得された複数の入力データ集合を提供するステップであって、前記複数の入力データ集合の各々が同じ前駆体イオンおよび1つ以上の生成物イオンを含むステップと、
前記前駆体イオンの単一の保持時間にしたがって、前記複数の入力データ集合を正規化するステップと、
前記複数の入力データ集合の各々について、前記前駆体イオンの前記単一の保持時間に対して、どの生成物イオンが所定の保持時間枠内の対応する保持時間を有するかを判断するステップと、
前記判断ステップによって、生成物イオンが、前記複数の入力データ集合の少なくとも1つにおける前記単一の保持時間に対して所定の保持時間枠内の対応する保持時間を有すると判断された場合に、前記生成物イオンが、前記単一の保持時間を有する前記前駆体イオンに関連していると判断された生成物イオンの結果的な集合に含まれるように、前記複数の入力データ集合に含まれる生成物イオンに対して和集合演算を実行するステップとを含む、方法。
【請求項31】
前駆体イオンを1つ以上の関連生成物イオンと一致させる方法であって、
複数の注入から取得された複数の入力データ集合を提供するステップであって、前記複数の入力データ集合の各々が、第一保持時間を有する同じ前駆体イオンおよび前記前駆体イオンの前記第一保持時間に対して所定の保持時間枠内の保持時間を有する1つ以上の生成物イオンを含むステップと、
前記前駆体の強度が、前記複数の入力データ集合のその他における前記前駆体の強度に対して最大となる、第一の入力データ集合を選択するステップと、
第一集合の各生成物イオンが前記選択ステップによって選択された前記第一入力データ集合に含まれ、前記第一保持時間に対して前記所定の保持時間枠内の保持時間を有する、生成物イオンの第一集合を決定するステップと、
前記第一集合の各生成物イオンについて、第一の結果として、前記複数の入力データ集合のいずれが前記第一保持時間に対して前記所定の保持時間枠内の保持時間を有する前記各生成物イオンを含むかを決定し、前記第一の結果における入力データ集合にわたる前記生成物イオンの強度の合計として、前記各生成物イオンの強度和を決定するステップであって、前記生成物イオンの第一集合が前記前駆体に関連し、前記第一集合の前記各生成物イオンが前記強度和決定ステップによって決定された強度和を有するステップとを含む、方法。
【請求項32】
前記複数の入力データ集合にわたる前記前駆体の強度の和である強度を有する前記前駆体を含む出力データを決定するステップであって、前記出力データ集合が、前記第一集合の各生成物イオンおよび前記第一決定ステップで決定された強度和を有する前記各生成物イオンを含み、前記出力データ集合が前記前駆体に関連する生成物イオンを含むステップをさらに含む、請求項31に記載の方法。
【請求項33】
前記所定の保持時間枠が、幅および閾値を使用して決定される、請求項31に記載の方法。
【請求項34】
前記幅が、前駆体イオンの質量スペクトルピークの半値全幅ピークとして決定されたクロマトグラフィピーク幅である、請求項33に記載の方法。
【請求項35】
前記閾値が前記幅の1/10であり、前記所定の保持時間枠が、前記幅から前記閾値を減算することによって決定された下限を有し、前記所定の保持時間枠が前記幅に前記閾値を加算することによって決定された上限を有する、請求項33に記載の方法。
【請求項36】
前記複数の入力データ集合の一部が、第一低断片化モードと第二高断片化モードとを交互に行って、前記第一低断片化モードの第一スペクトルおよび前記第二高断片化モードの第二スペクトルを取得することによって、前記前駆体イオンを質量分析することで生成される、請求項31に記載の方法。
【請求項37】
前記複数の入力データ集合が、消化されたタンパク質である試料を使用して取得され、
該方法が前記消化されたタンパク質に対してLC/MSを実行するステップをさらに含む、請求項36に記載の方法。
【請求項38】
前駆体イオンを1つ以上の関連生成物イオンと一致させる方法であって、
複数の注入から取得された複数の入力データ集合を提供するステップであって、前記複数の入力データ集合の各々が、第一保持時間を有する同じ前駆体イオン、および前記前駆体イオンの前記第一保持時間に対して所定の保持時間枠内の保持時間を有する1つ以上の生成物イオンを含むステップと、
前記複数の入力データ集合の少なくとも1つの前記第一保持時間に対して前記所定の保持時間枠内の保持時間を有する生成物イオンの第一集合を決定するステップであって、前記第一集合の各生成物イオンが、前記各生成物イオンを含む前記複数中の入力データ集合にわたる前記生成物イオンの強度の和である強度を有し、前記各生成物イオンが、前記第一保持時間に対して前記所定の保持時間枠内の保持時間を有するステップと、
前記前駆体イオンの強度が、前記複数の入力データ集合のその他における前記前駆体の強度に対して最大となる、第一の入力データ集合を選択するステップと、
第二集合の各生成物イオンが前記選択ステップによって選択された前記第一入力データ集合に含まれ、前記第一保持時間に対して前記所定の保持時間枠内の保持時間を有する、生成物イオンの前記第二集合を決定するステップと、
前記第一集合から、前記第二集合に含まれない生成物イオンを除外するステップであって、前記除外を実行した後に、前記第一集合が前記前駆体に関連する生成物イオンを含むステップとを含む、方法。
【請求項39】
前記除外するステップを実行した後に、前記生成物イオンの第一集合を含む出力データ集合を決定するステップであって、前記出力データ集合が、前記複数の入力データ集合にわたる前記前駆体の強度の和である強度を有する前記前駆体を含み、前記第一集合の各生成物イオンが、生成物イオンの第一集合を決定するステップによって決定された強度を有するステップをさらに含む、請求項38に記載の方法。
【請求項40】
前記所定の保持時間枠が、幅および閾値を使用して決定される、請求項38に記載の方法。
【請求項41】
前記幅が、前駆体イオンの質量スペクトルピークの半値全幅ピークとして決定されたクロマトグラフィピーク幅である、請求項40に記載の方法。
【請求項42】
前記閾値が前記幅の1/10であり、前記所定の保持時間枠が、前記幅から前記閾値を減算することによって決定された下限を有し、前記所定の保持時間枠が前記幅に前記閾値を加算することによって決定された上限を有する、請求項40に記載の方法。
【請求項43】
前記複数の入力データ集合の一部が、第一低断片化モードと第二高断片化モードとを交互に行って、前記第一低断片化モードの第一スペクトルおよび前記第二高断片化モードの第二スペクトルを取得することによって、前記前駆体イオンを質量分析することで生成される、請求項38に記載の方法。
【請求項44】
前記複数の入力データ集合が、消化されたタンパク質である試料を使用して取得され、
該方法が前記消化されたタンパク質に対してLC/MSを実行するステップをさらに含む、請求項43に記載の方法。
【請求項45】
前駆体イオンに関連する生成物イオンを判定する方法であって、
複数の注入から取得された複数の入力データ集合を提供するステップであって、前記複数の入力データ集合の各々が、第一保持時間を有する同じ前駆体イオン、および前記前駆体イオンの前記第一保持時間に対して所定の保持時間枠内の保持時間を有する1つ以上の生成物イオンを含むステップと、
複数の保持時間一致および生成物イオン選択技術を提供するステップであって、前記複数の保持時間一致および生成物イオン選択技術の各々が、前記前駆体に関連すると判断された関連生成物イオンに関する前記複数の入力データ集合からの情報を組み合わせる処理を実行し、前記関連生成物イオンが各々、前記第一保持時間に対して前記所定の保持時間枠内の保持時間を有し、前記複数の保持時間一致および生成物イオン選択技術が、生成物イオンが複数の入力データ集合のうち少なくとも1つにおける前記第一保持時間に対して所定の保持時間枠内の保持時間を有する場合に、前記生成物イオンが前記前駆体イオンに関連すると判断する第一技術を含むステップと、
複数の保持時間一致および生成物イオン選択技術のうちの少なくとも1つを選択するステップと、
前記前駆体イオンに関連する生成物イオンを判定するために、前記少なくとも1つの選択された保持時間一致および生成物イオン選択技術を使用して、前記複数の入力データ集合を処理するステップとを含む、方法。
【請求項46】
前記複数の保持時間一致および生成物イオン選択技術が、前記第一技術の選択基準を使用する第二技術を含む、請求項45に記載の方法。
【請求項47】
前記複数の保持時間一致および生成物イオン選択技術が、前記前駆体イオンの強度が複数の入力データ集合のその他における前記前駆体の強度に対して最大である前記複数の入力データ集合のうち1つを選択する第二技術を含み、前記第二技術が、前記第一保持時間に対して前記所定の保持時間枠内の保持時間を有する前記選択された入力データ集合に含まれる生成物イオンが前記前駆体に関連すると判断する、請求項45に記載の方法。
【請求項48】
前記複数の保持時間一致および生成物イオン選択技術が、各々同じ生成物イオンの集合を前記前駆体イオンに関連すると判断する第二技術および第三技術を含む、請求項45に記載の方法。
【請求項49】
前駆体イオンを1つ以上の関連生成物イオンと一致させるために記憶された実行可能コードを含むコンピュータ読み取り可能媒体であって、
複数の注入から取得された複数の入力データ集合を提供するステップであって、前記複数の入力データ集合の各々が、第一保持時間を有する同じ前駆体イオン、および前記前駆体イオンの前記第一保持時間に対して所定の保持時間枠内の保持時間を有する1つ以上の生成物イオンを含むステップと、
前記前駆体イオンの強度が前記複数の入力データ集合のその他における前記前駆体の強度に対して最大である、第一の入力データ集合を選択するステップと、
第一集合の各生成物イオンが、前記選択するステップによって選択された前記第一入力データ集合に含まれ、前記第一保持時間に対して前記所定の保持時間枠内の保持時間を有する、生成物イオンの第一集合を決定するステップと、
前記第一集合の各生成物イオンについて、第一の結果として、前記複数の入力データ集合のいずれが、前記第一保持時間に対して前記所定の保持時間枠内の保持時間を有する前記各生成物イオンを含むかを判断し、前記第一の結果における入力データ集合にわたる前記生成物イオンの強度の和として前記各生成物イオンの強度和を決定するステップであって、前記生成物イオンの第一集合が前記前駆体に関連し、前記第一集合の前記生成物イオンの各々が前記強度和を決定するステップによって決定された強度和を有するステップとを実行させるための実行可能コードを含む、コンピュータ読み取り可能媒体。
【請求項50】
前駆体イオンを1つ以上の関連生成物イオンと一致させるために記憶された実行可能コードを含むコンピュータ読み取り可能媒体であって、
複数の注入から取得された複数の入力データ集合を提供するステップであって、前記複数の入力データ集合の各々が、第一保持時間を有する同じ前駆体イオン、および前記前駆体イオンの前記第一保持時間に対して所定の保持時間枠内の保持時間を有する1つ以上の生成物イオンを含むステップと、
前記複数の入力データ集合のうちの少なくとも1つにおける前記第一保持時間に対して前記所定の保持時間枠内の前記保持時間を有する生成物イオンの第一集合を決定するステップであって、前記第一集合の各生成物イオンが、前記各生成物イオンを含む前記複数中の入力データ集合にわたる前記生成物イオンの強度の和である強度を有し、前記各生成物イオンが、前記第一保持時間に対して前記所定の保持時間枠内の保持時間を有するステップと、
前記前駆体イオンの強度が、前記複数の入力データ集合のその他における前記前駆体イオンの強度に対して最大となる、第一の入力データ集合を選択するステップと、
前記第二集合の各生成物イオンが前記選択するステップによって選択された前記第一入力データ集合に含まれ、前記第一保持時間に対して前記所定の保持時間枠内の保持時間を有する、生成物イオンの第二集合を決定するステップと、
前記生成物イオンの第一集合から、前記第二集合に含まれない生成物イオンを除外するステップであって、前記除外するステップを実行した後に、前記第一集合が前記前駆体に関連する生成物イオンを含むステップとを実行させるための実行可能コードを含む、コンピュータ読み取り可能媒体。
【図1】
【図2A】
【図2B】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11A】
【図11B】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【図2A】
【図2B】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11A】
【図11B】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【公表番号】特表2011−522257(P2011−522257A)
【公表日】平成23年7月28日(2011.7.28)
【国際特許分類】
【出願番号】特願2011−511793(P2011−511793)
【出願日】平成21年5月28日(2009.5.28)
【国際出願番号】PCT/US2009/045373
【国際公開番号】WO2009/146345
【国際公開日】平成21年12月3日(2009.12.3)
【出願人】(509131764)ウオーターズ・テクノロジーズ・コーポレイシヨン (46)
【Fターム(参考)】
【公表日】平成23年7月28日(2011.7.28)
【国際特許分類】
【出願日】平成21年5月28日(2009.5.28)
【国際出願番号】PCT/US2009/045373
【国際公開番号】WO2009/146345
【国際公開日】平成21年12月3日(2009.12.3)
【出願人】(509131764)ウオーターズ・テクノロジーズ・コーポレイシヨン (46)
【Fターム(参考)】
[ Back to top ]