説明

保持時間整合を行うための方法および装置

前駆体イオンを、1つ以上の関連産物イオンと整合させる方法は、サンプル注入から得られる入力データ集合を提供すること、データ集合の各々は、前駆体イオンおよび1つ以上の産物イオンを含み、前駆体イオンについての単一の保持時間によって入力データ集合を正規化させること、どの産物イオンが、単一の保持時間に関して所定の保持時間枠内にあるかを決定すること、および産物イオンが、特定数の入力データ集合に関して所定の保持時間枠内にある場合、産物イオンが、単一の保持時間を有する前駆体に関連していると決定することを含む。サンプルを分析する装置は、クロマトグラフィーモジュール、クロマトグラフィーモジュールと連携している質量分析計モジュール、およびクロマトグラフィーモジュールおよび質量分析計モジュールと連携している制御ユニットを含む。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、一般に、化合物の分析に、およびさらに詳細には、ポリペプチド分析の装置および方法に関する。
【背景技術】
【0002】
プロテオミクスは、一般に、生物系に由来するタンパク質の混成混合物に関する研究に言及する。プロテオミクス研究は、しばしば、タンパク質の同定、または生物系の状態における変化の測定に焦点を当てる。混成生体サンプルでのタンパク質の同定および定量化は、プロテオミクスにおける基礎的問題である。
【0003】
質量分析と組合せた液体クロマトグラフィー(LC/MS)は、プロテオミクス研究における基礎的道具になった。液体クロマトグラフィー(LC)および質量分析(MS)による連続分析による無処理のタンパク質の、またはこれらのタンパク質分解ペプチド産物の分離は、多くの一般的プロテオミック方法論の基本を形成する。タンパク質の発現レベルにおける変化を測定する方法は、これらが、バイオマーカー発見および臨床診断学の根拠を形成することができることから非常に興味深い。
【0004】
無処理のタンパク質を直接的に分析することよりむしろ、このタンパク質を消化して特定集合のタンパク質分解ペプチドを生成することが一般的である。その後、生じるペプチドは、しばしばLC/MS分析を介して特徴付けられる。消化のために使用される一般的酵素は、トリプシンである。トリプシン消化では、タンパク質分解酵素の切断特異性によって決定されるとおり、混成混合物中に存在するタンパク質を切断して、ペプチドを生成する。観察されたペプチドの同一性および濃度から、利用可能なアルゴリズムは、サンプル中のタンパク質を同定および定量化する役割を果たす。
【0005】
LC/MS分析では、最初に、LC分離、続いてMS分析によってペプチド消化物を分離および解析する。理想的には、十分な精度で測定される単一ペプチドの質量は、ペプチドの特徴的同定を提供する。しかし、実際に、達成された質量精度は、一般に、10ppm以上の桁にある。一般に、このような質量精度は、質量測定を単独で使用してペプチドを特徴的に同定するのに十分でない。
【0006】
例えば、10ppmの質量精度の場合には、10ペプチド配列の桁で、ペプチド配列の典型的なデータベースの検索で同定される。質量精度における検索抑制が低下されたか、または例えば化学物質または後期翻訳修飾についての検索、HOまたはNHの損失、および点突然変異が可能になった場合、配列のこの数は、明らかに増大する。したがって、ペプチドの配列が、欠失または置換のいずれかによって修飾される場合、プチット(petite)の同定のための前駆体の質量のみの使用が、正確でない同定にいたる。別の複雑さが、2つのペプチドが同じアミノ酸組成を有することができるが、異なる配列を有することの可能性から生じる。
【0007】
ペプチド前駆体の場合には、前駆体中の単一のペプチド結合での断片化により産物フラグメントを得ることができる。このような単独断片化は、2つの副配列を生じる。ペプチドのC末端を含むフラグメントは、イオン化された場合、Y−イオンと称され、およびペプチドのN末端を含むフラグメントは、イオン化される場合、B−イオンと称される。
【0008】
タンパク質は、しばしば、フラグメントの質量のような、タンパク質のフラグメントについての情報と、タンパク質同一性を結びつけるデータベースに分析データを比較することによって同定される。例えば、データベースから得られる論理的ペプチド質量は、データにおいて測定した前駆体の質量の質量検索枠内にある場合、これは当たりであるとみなされる。
【0009】
検索は、データベースで見られる有望な整合性のペプチドのリストを提供できる。これらの有望な整合データベースペプチドは、統計的因子によって加重されても、されなくてもよい。このような検索の有望な成果は、有望な整合データベースペプチドが同定されないか、1つの有望な整合データベースペプチドが同定されるか、または1つより多い有望な整合データベースペプチドが同定されることである。適切な装置校正が見込まれるMSの解像度が高いほど、ppm閾値は小さく、および結果として、正確でない同定は少ない。データベース中のペプチドに対する1つ以上の整合がある場合、ペプチド−フラグメント・イオンデータは、整合を立証するために使用され得る。
【0010】
検索の間、複数の変化状態および複数のアイソトープを検索し得る。さらに、経験的に生じた信頼規則を、確かな整合を識別する助けになるために使用し得る。
【発明の開示】
【0011】
注入−対−注入から互いに関連のある前駆体によって示される保持時間移行を利用することによって、サンプルの複数のクロマトグラフィー注入が、前駆体および関連産物イオンを区別するのに利用可能であるという認識から起こるもののいくつかの実施形態。このような移行は、例えば、温度、溶媒、組成、および他のクロマトグラフィー分離パラメーターにおける小さな変化によってさえ誘導される。一般に、異なる前駆体の保持時間は、各注入が、実質的に同じ方法および同じサンプルの部分を使用する場合でさえ、注入−対−注入から異なって移行する。場合により、意図的および/またはランダム摂動を使用して、移行を生じさせる。
【0012】
いくつかの実施形態は、保持時間移行の観察を通して展開されるタンパク質プロファイルのカタログの発生および/または使用に関する。いくつかの実施形態では、化合物の数個のみのフラグメントの観察が、サンプル中のその化合物の正確な検出および/または定量を提供する。
【0013】
したがって、本発明の1つの実施形態は、前駆体イオンを、1つ以上の関連産物イオンと整合する方法を特徴とする。方法は、サンプル注入から得られる入力データ集合を提供すること、およびデータ集合の各々は、少なくとも1つの前駆体イオンおよび1つ以上の産物イオンを含み、前駆体イオンについての単一の保持時間による入力イオン集合を正規化すること、どの産物イオンが、単一の保持時間に関して所定の保持時間枠内にあるかを決定すること、および産物イオンが、特定数の入力データ集合について所定の保持時間枠内にある場合、産物イオンが、前駆体に関連していると決定することを含む。
【0014】
本発明の別の実施形態は、サンプルを分析する装置を特徴とする。装置としては、クロマトグラフィーモジュール、クロマトグラフィーモジュールと連携している質量分析計モジュール、およびクロマトグラフィーモジュールおよび質量分析計モジュールと連携している制御ユニットを含む。制御ユニットは、少なくとも1つのプロセッサ、およびプロセッサによって実行される指示を保存するためのメモリーを含む。指示は、プロセッサに、上述の方法に含まれるもののような作動を行わせる。
【0015】
図面では、類似の参照特徴は、一般に、異なった図面を通して同じ部分に言及される。さらに、図面は、必ずしも一定比率を用いておらず、その代わりに、一般に、本発明の原則を示す上で強調される。
【発明を実施するための最良の形態】
【0016】
ここで使用される場合、以下の語句は、一般に指示される意味に言及する。
【0017】
タンパク質−単一ポリペプチドとして組み立てられるアミノ酸の特異的一次配列
ペプチド−タンパク質の一次配列内に含まれる単一ポリペプチドとして組み立てられるアミノ酸の特定の配列
トリプシンペプチド−トリプシンによるタンパク質の酵素的切断から生じるタンパク質配列から発生されるペプチド。次の説明で、消化ペプチドは、便宜上トリプシンペプチドと呼ばれる。しかし、本発明の実施形態は、他のペプチド消化技術に適用すると理解すべきである。さらに、用語「消化」は、一般に、例えば細胞酵素(プロテアーゼ)および細胞内消化の使用を含むポリペプチドを分解または切断するあらゆる適切な方法に言及するためにここで使用される。ここで使用される場合、用語「タンパク質分解性」は、大きなタンパク質を小区分またはアミノ酸に消化または溶解するあらゆる酵素に言及する。
【0018】
前駆体ペプチド−タンパク質切断プロトコールを使用して発生されるトリプシンペプチド(または他のタンパク質切断産物)。前駆体は、場合により、クロマトグラフィーで分離させ、および質量分析計に通させる。イオン源は、これらの前駆体ペプチドをイオン化して、正に電荷され、protenated形態の前駆体を典型的に生じる。このような正に荷電され、protenated前駆体イオンの質量は、ここで、前駆体の「mwHプラス」または「MH+」と称される。以下で、用語「前駆体質量」は、一般に、イオン化ペプチド前駆体のprotenatedmwHプラスまたはMH+質量に言及する。
【0019】
フラグメント−複数のフラグメントが、LC/MS分析で起こり得る。トリプシンペプチド前駆体の場合には、フラグメントは、無処理のペプチド前駆体の衝突断片化から発生され、この一次アミノ酸配列が、当初の前駆体ペプチド内に含まれるポリペプチドイオンを含み得る。Y−イオンおよびB−イオンは、このようなペプチドフラグメントの例である。トリプシンペプチドのフラグメントは、イモニウムイオン、リン酸イオン(PO)のような官能基、特定の分子またはクラスの分子から切断された質量タグ、または前駆体からの水(HO)またはアンモニア(NH)分子の「ニュートラルロス」を含み得る。
【0020】
Y−イオンおよびB−イオン−ペプチドフラグメントがペプチド結合にある場合、および電荷が、N末端フラグメントで保持される場合、このフラグメントイオンは、B−イオンと称される。電荷が、C末端フラグメントに保持される場合、フラグメントイオンは、Y−イオンと称される。有望なフラグメントおよびこれらの用語法のさらに包括的なリストは、RoepstorffおよびFohlman、Biomed Mass Spectrom、1984;11(11):601およびJohnsonら、Anal.Chem 1987、59(21):2621:2625で提供される。
【0021】
保持時間−文脈で、典型的に、実体がこの最大強度に達するクロマトグラフィープロファイルでの点に言及する。
【0022】
イオン−各ペプチドは、典型的に、構成要素のアイソトープの天然存在度のため、イオンの集合体としてLC/MS分析で現れる。イオンは、保持時間およびm/z値を有する。質量分析計(MS)は、イオンのみを検出する。LC/MS技術は、各検出イオンについて多様な観察測定値を生じる。これは、質量対荷電比(m/z)、質量(m)、保持時間、および多数の計測されたイオンのようなイオンの信号強度を含む。
【0023】
mwHプラス−1つのプロトン、1.007825amuの重量を加えたペプチドのニュートラルモノアイソトープ質量。
【0024】
一般に、LC/MS分析は、場合により、これの質量、電荷、保持時間および総強度の点でペプチドの経験的説明を提供する。ペプチドが、クロマトグラフィーカラムから溶出するとき、これは特定の保持期間にわたって溶出し、および単独保持時間でこの最大信号を達成する。イオン化および(有望な)断片化の後、ペプチドは、関連イオンの集合として現れる。集合での異なるイオンは、共通のペプチドの異なるアイソトープ組成および電荷に対応する。関連イオンの集合内の各イオンは、単一のピーク保持時間およびピーク形状を生じる。これらのイオンは、共通のペプチドから生じるので、各イオンのピーク保持時間およびピーク形状は、ある程度の測定値容認内で一致する。各ペプチドのMS獲得は、全てのアイソトープおよび荷電状態について複数のイオン検出を生じ、全ては、ある程度の測定値許容内で同じピーク保持時間およびピーク形状を共有する。
【0025】
LC/MS分離では、単一のペプチド(前駆体またはフラグメント)は、多くのイオン検出を生じ、これは、複数の荷電状態でイオンのクラスターとして現れる。このようなクラスターからのこのイオン検出の解析は、特定の保持時間で荷電状態において測定された信号強度の特徴的なモノアイソトープ性質量の単一の実体の存在を示す。
【0026】
タンパク質データベース−本発明のいくつかの実施形態で、分析者は、タンパク質のデータベースを利用する。典型的なデータベースで、各々の含有タンパク質は、アミノ酸のこの一次配列によって説明される。分析者は、研究下で、タンパク質を緊密に整合させることが意図されるデータベースを選択し得る。例えば、イー.コリ(E.Coli)データベースは、イー.コリの細胞溶解物から得られるデータと比較し得る。同様に、ヒト血清データベースは、ヒト血清から得られるデータと比較し得る。使用者は、部分集合データベースを選択し得る。使用者は、Swiss Institute of Bioinformatics(SIB)およびthe European Bioinformatics Institute(EBI)でのSwiss−Protグループにより生じたSwissProtデータベースで列挙される全てのタンパク質のような上位集合データベースを選択し得る。使用者は、アミノ酸のランダム配列によって示される刺激タンパク質を含有するデータベースを選択し得る。このような無作為のデータベースは、タンパク質同定システムおよび検索アルゴリズムを評価または基準化するために対照研究で使用される。使用者は、自然に発生するおよび人工的配列の両方を合わせるデータベースを選択し得る。タンパク質データベースから、だれもが、各配列、トリプシン前駆体イオンの配列および質量、Y−およびB−イオン、およびこれらの前駆体から生じる他の可能なフラグメントイオンから推論できる。
【0027】
図1は、化合物の化学分析を行うための方法100の流れ図である。方法100は、参照サンプルの1つ以上の化合物を化合物の成分フラグメントに消化110すること、成分を分離120すること、分離成分の少なくともいくつかをイオン化130および質量分析140すること、およびプロファイルのカタログ中に、サンプル中の少なくとも1つの化合物のプロファイルを保存150することを含む。
【0028】
方法は、場合により、対象サンプルで、消化110、分離120、イオン化130および質量分析140、および対象−サンプル分析データおよび1つ以上の化合物のプロファイル中に保存されるデータの間の整合性に応じて対象サンプル中の1つ以上の化合物を同定170する段階を繰返す160ことを含む。
【0029】
好ましくは、対象サンプルでの分析段階を繰返す160ために、参照サンプルのために使用されるのと同様に、消化、クロマトグラフィー分離、および/またはイオン化について有効に同じ予備選択法は、対象サンプルの消化110、分離120、イオン化130、および質量分析140のために使用される。実質的に同じ方法の使用を通して、対象−サンプルデータを、対象サンプル中の化合物を同定170するプロファイルのカタログとさらに的確に比較する。したがって、分析者は、場合により、自身の分析装置および分析方法または処方を使用して自身のカタログを開発し、およびこれにより、さらにいっそう信頼を生じ、および一般的データベースの使用を通して他の方法では有望であるものより容易に同定を得る。
【0030】
場合により、実質的に同じ方法の使用を通して、異なる実験室で異なる分析者によって作成されるカタログを、主要カタログと合わせる。その後、これらのカタログは、実質的に同じ方法を通して得られるタンパク質を同定するために他の分析者によって利用可能である。したがって、例えば、実質的に同じ装置および装置を使用して、異なる実験室または同じ実験室で異なる装置は、タンパク質プロファイルのカタログを共同で生じ得る。このような実験室は、このようなカタログの使用者でもあり得る。
【0031】
方法100のいくつかの好ましい使用法は、タンパク質関連分析に向けられる。したがって、便宜のために、以下の説明はタンパク質および関連フラグメントに言及し、およびタンパク質のようなポリペプチドである化合物の分析の例を利用する。これらの例では、タンパク質を、タンパク質の前駆体フラグメントである成分フラグメントに消化する。順に、前駆体をイオン化して、前駆体イオンを形成し、および場合により、質量分析のための準備でこれら自身を産物イオンに断片化する。
【0032】
説明は、ポリペプチドに関連した例に焦点を置いているが、このような例は、ポリペプチドの分析に対して本発明の範囲を限定することが意図される。化学分析分野における当業者は、本発明の原理が他の化学的化合物の分析に利用可能であることを認識する。
【0033】
消化110は、既知技術を含むタンパク質を切断するために適切なあらゆる技術を介して達成される。例えば、上に示されるとおり、トリプシンのような1つ以上の酵素の使用を通して、タンパク質を前駆体ポリペプチドまたはアミノ酸に消化する。タンパク質またはポリペプチドのフラグメントは、ここで一般に、「前駆体」と称される。このようなフラグメントは、場合により、クロマトグラフィー分離に続く別の分析で使用されるという意味で前駆体である。下にさらに詳細に示されるとおり、前駆体フラグメントを、場合により、産物フラグメントにイオン化および/またはさらに断片化する。
【0034】
分離120は、逆相クロマトグラフィー、ゲル透過クロマトグラフィー、サイズ排除クロマトグラフィー、および電気泳動のような既知技術を含むいずれかの適切なクロマトグラフィー関連技術によって達成される。分離120は、サンプル中のタンパク質を消化110することから得られるタンパク質および/または前駆体の保持時間に関連した値を提供する。
【0035】
クロマトグラフィー分離120の溶出液を質量分析140するための準備で、分離120工程から得られる溶出液をイオン化130工程にかける。電子噴射イオン化およびMALDIのような既知技術を含むいずれかの適切なイオン化130工程を、場合により使用する。イオン化130工程の間に、前駆体の少なくともいくつかをイオン化して前駆体イオンを形成する。例えば、単一のタンパク質分子を消化110して、20の前駆体フラグメントを形成し、イオン化130の間にその内の10をイオン化する。場合により、以下により詳細に示されるとおり、前駆体をさらに断片化して、結合前駆体の同定を助ける産物イオンを得る。
【0036】
質量分析140は、前駆体イオンの質量に関係した値およびイオン強度に関連した値を提供する。質量分析140は、既知技術を含むいずれかの適切な質量分析技術を介して行われる。このような技術は、磁性セクター質量分析計および飛行時間型質量分析計を含む。
【0037】
上述の分析から得た情報を、サンプル中の1つ以上の関連タンパク質についての1つ以上のプロファイルを定義するために使用する。タンパク質プロファイルは、タンパク質と結合した前駆体イオンの保持時間、イオン質量およびイオン強度に関連した値によって定義される。場合により、タンパク質のプロファイルは、タンパク質の同一性によっても定義される。いくつかの好ましい実施形態は、プロファイル中に産物−イオンデータを含む。したがって、タンパク質のプロファイルは、タンパク質の前駆体と結合した産物イオンの保持時間、イオン質量、およびイオン強度に関連した値によっても定義され得る。
【0038】
プロファイルは、最新に分析された対象サンプル中のタンパク質を検出、同定および/または定量化する際に最新の使用のためのプロファイルのカタログ中に保存150される。場合により、プロファイルは、対応の列挙されたタンパク質に結合した前駆体イオンの保持時間、イオン質量、およびイオン強度に関連した値を有するデータベースで列挙されるタンパク質を注釈付けすることによって現存のタンパク質データベースで定義される。
【0039】
イオン強度値のいずれかの適切な測定値は、プロファイルの定義で使用される。例えば、LC/MSピークでのイオン計数の総量は、化学分析分野における当業者によって理解されるとおり、適切に使用される。
【0040】
タンパク質プロファイルを定義するために使用される特定の型の値は、場合により、例えば、分析者の特定の必要性に整合するように変化させ得る。プロファイルは、場合により、当業者によって認識されるとおり、例えば、m/zの値、および/または前駆体荷電状態および/または他の値で定義される。
【0041】
分析およびプロファイル定義工程は、示されるとおり場合により反復される。したがって、既知および/または未知タンパク質を含む対象サンプルの分析にとって便利な参照源を提供するタンパク質プロファイルのカタログを開発する。カタログは、場合により、1つ以上のタンパク質の各々についての1つより多いプロファイルを含む。さらに、以下にさらに詳細に示されるとおり、対象サンプル自体は、場合により、別のタンパク質プロファイルについてのデータを提供する。いくつかのタンパク質プロファイルの例は、図4から図7に関して以下で示される。
【0042】
いったんカタログが、特定のタンパク質についてのプロファイルを含むと、このタンパク質は、場合により上で示される同じかまたは十分に同じ分析段階によって分析される対象サンプル中での検出、同定170、および/または定量化に利用可能である。このアプローチは、カタログ中のプロファイル中での対応データに正確に整合されるべき対象サンプル中のタンパク質について十分に比較可能な分析データを提供する。プロファイル中の前駆体関連データとの確認された整合性は、対象サンプルでのタンパク質の検出を確認する。場合により、プロファイル中の産物関連データとの確認された整合性は、対象サンプル中のタンパク質の検出を確認する。さらに、プロファイルでの強度データに比較して、前駆体および/または産物から得られる対象サンプルから得た強度データは、場合により、対象サンプル中のタンパク質の定量化を提供する。
【0043】
カタログは、いずれかの適切な手段で有望な整合性について検索される。例えば、もしあれば、最高の整合性が得られるまで、カタログ中の各プロファイルとの比較を集約的に行う。同じLC方法が、カタログを発生させ、および対象サンプルを分析するために使用される場合、対象サンプル前駆体イオンの保持時間値は、例えば予備選択された保持時間枠を使用して、プロファイル値に直接的に比較可能である。産物イオン保持時間は、場合により、この比較に含まれる。
【0044】
保持時間値の有用性が低いような異なるLC方法を使用する場合、質量関連値に対する比較は、対象サンプル前駆体イオンデータを、対応のタンパク質プロファイルと結びつけるためになお使用され得る。
【0045】
一般に、対象サンプルでの前駆体の強度値は、タンパク質濃度差により、対応のプロファイルで保存される値と異なる。スケーリング因子は、場合により、対象サンプル前駆体イオンおよびプロファイル前駆体イオンの間の有効に正確な整合を提供するために適用される。決定された物差し因子は、場合により、対象サンプル中のタンパク質の定量化のために使用される。
【0046】
一般に、タンパク質が、このプロファイルを定義するために使用された対照サンプル中で示されるものより対象サンプルで高い濃度を有する場合、プロファイル中に含まれる全ての前駆体は、対象サンプルで観察可能である。反対に、対象サンプル濃度がプロファイルと比べて低い場合、いくつかのプロファイル前駆体イオンは未検出の可能性があり得る。
【0047】
対象サンプルの前駆体イオンデータおよびプロファイルの間の対応が得られた後、整合は、場合により、別の比較段階を通して確認される。例えば、3つの前駆体についてのデータの比較に基づいた当初の整合は、別の前駆体および/または産物イオンについてのデータを比較することによって、場合により認証される。例えば、当初の比較から決定されるスケーリング因子は、プロファイルの別の成分についての値の間の整合について検索することが可能である。したがって、一般に、予備整合を実証するために別の利用可能なデータが、予備整合と一致しなければならない。
【0048】
いくつかの実施形態では、整合が保持時間値の間の整合を含む条件で、単一の前駆体のデータは、プロファイルに対する整合を得るために使用される。保持時間の整合性なしに、少なくとも2つの前駆体イオンのデータを使用するのが好ましい。しばしば、整合における優れた精度は、3つの前駆体イオンのデータの使用を通して得られる。確認された整合で、整合タンパク質の同定および濃度は、場合により示される。好ましくは、最高の強度値を有する前駆体イオンを、プロファイルを定義するために、およびこれらのプロファイルに対する比較のために使用する。産物イオンのデータが、タンパク質プロファイル中に含まれ、およびサンプル中で観察される場合には、これらのイオンは、サンプル中のタンパク質の同定をさらに確認するために整合され得る。
【0049】
参照サンプルは、場合により、未知および/または既知タンパク質を含み、および方法100は、場合により、このタンパク質についてのプロファイルの定義の支持で、参照サンプル中のタンパク質の正確な同定を支援する。例えば、図2は、上述の方法100の代替の実施形態である化合物の化学分析を行うための方法200の部分的流れ図である。方法200は、方法100についてと同様に、サンプル中の少なくとも1つの化合物のプロファイルを消化110、分離120、および保存150することを含む。
【0050】
イオン化130および質量分析140の工程について、方法200は、以下に示されるいっそう詳細な段階を含む。これらの段階は、未知タンパク質のために、および既知タンパク質のために様々なプロセシングを提供する。以下で示されるとおり、様々のプロセシングは、正しいプロファイルの定義の支持で、未知タンパク質の信頼性のある同定を提供する。
【0051】
目的のタンパク質が、分析者に既知の同一性を有する決定231に応答して、前駆体イオンを既知タンパク質から形成235し、前駆体を、質量分析245にかけ、およびその後、タンパク質プロファイルは、場合により、保持時間、イオン質量、およびイオン強度に関連して観察された値に関連した既知同一性および前駆体イオンデータを使用して定義および保存150する。
【0052】
場合により、産物イオンを、既知タンパク質前駆体から形成する場合、産物イオンを質量分析し、およびその後タンパク質プロファイルを、場合により、保持時間、イオン質量、およびイオン強度に関連して観察された値に関連した既知同一性および産物イオンデータを使用して、定義および保存150する。
【0053】
サンプル中の目的のタンパク質の同一性は、分析者に未知であることが決定231される場合、前駆体および産物イオンの両方は、場合により、タンパク質から形成236され、および前駆体イオンおよび産物イオンの両方を質量分析246する。産物イオンは、前駆体イオンの同一性を実証するために使用される。実証された前駆体は、順に、タンパク質を同定する前駆体データの信頼性のある使用を支持する。例えば、前駆体データは、予め存在するタンパク質データベース242の検索に使用される。場合により、先駆体実証を実行するために使用される1つの適切な手段は、参照によりここに組み込まれる2005年12月1日に公開されたPCT特許出願国際公開第WO2005/114930号で示される。
【0054】
したがって、サンプル中のポリペプチドが、未同定ポリペプチドである場合、方法200は、場合により、分析を介して同定される前駆体を有するタンパク質について予め存在するタンパク質データベース242を検索することによって、ポリペプチドを同定することを含む。適切なデータベース242は、タンパク質分析分野で当業者に既知のとおり、市販で、または自由に利用可能である。
【0055】
例えば、データベース242は、タンパク質のリスト、および各列挙されたタンパク質については、例えばこれらの前駆体イオン質量によって示される結合トリプシンペプチドを含む。
【0056】
1つの例示の実施形態では、タンパク質データベース242は、タンパク質およびこれらの論理的ペプチド配列の収集を含む。本実施例では、論理的ペプチド配列に対応する前駆体および産物イオンの証拠についてデータベースの配列を検索することによって、サンプル中のタンパク質を同定241する。十分多くのこのような質量は、データで見出され、および共通の保持時間で、その後ペプチド配列をデータで同定する。例えば、このアプローチが、データ中に所与のタンパク質に結合した1つ以上のペプチド配列を見出す場合、これによりタンパク質は、サンプル中で同定241されているとみなされる。
【0057】
方法200のいくつかの好ましい手段では、LC/MSシステムおよび予備選択されたデータベース242を使用してデータを集める(すなわち、段階120、236、246、241を達成する)。例えば、図9Aおよび9Bに関してさらに詳細に示されるとおり、液体クロマトグラフィーによる溶出液出力を、電子噴霧インターフェイスを通して質量分析計に導入する。場合により、三−四極MS装置の第一の四極は、イオンガイドとして機能する。可変電圧を、装置の衝突セルに適用する。例えば、以下で示されるとおり、代替方式で、前駆体イオンの、およびこれらのフラグメント(産物)イオンのスペクトルを収集する。
【0058】
好ましくは、前駆体イオンおよび関連した産物イオンの両方は、分離120工程から得られる同じ前駆体材料から形成される。この手段では、前駆体イオンおよび結合した産物イオンの両方が、分離120工程から測定された同じ保持時間のデータを有する。したがって、産物イオンは、これらが生じた前駆体と比較的容易に結合し得る。まったく望ましくないことには、サンプルの2回以上の注入を行い、および前駆体イオンおよび産物イオンデータは、異なる注入から得られる。
【0059】
既知方法を含むいずれかの適切な方法は、単独サンプル注入から前駆体および産物イオンの両方を得るために使用され得る。このような方法は、前駆体および産物イオンの両方の効率的に同時の質量分析を提供する。例えば、溶出前駆体の一部を断片化して産物イオンを形成し、および前駆体および産物イオンを、同時に、または例えば高速連続でのいずれかで、実質的に同時に分析246する。
【0060】
代替の例としては、ピークの2つ以上の代替の部分を、前駆体および産物分析のために別個に使用する。ピークの前駆体材料の一部を、イオン化および分析し、およびその後、次の部分を、分析される産物フラグメントに解離させる。1つの好ましい実施形態では、溶出する前駆体の代わりの部分を採取して、前駆体イオンおよびこの産物イオンについてのデータを代わりに得る。得られたデータは、ピーク形状の再構築可能にして、溶出された前駆体およびこの結合産物の両方についての正確な保持時間の値の測定をさせることを可能にする。さらに、例えば、前駆体イオンと、および産物イオンと結合した再構築したピークのピーク形状、幅および/または時間を、場合により、どの産物イオンが、特定の産物イオンと結合するかを決定するために比較する。
【0061】
このような変化する、有効に同時の分析に対する1つのアプローチは、Batemanらに対するUS特許6,717,130(「Bateman」)で記載され、これは、参照によりここに組み込まれ、および断片化を調節する衝突セルに対する可変の電圧の適用を記載する。関連特徴の別の説明は、図9Aおよび9Bに関して以下で提供される。
【0062】
したがって、Batemanで記載された技術または他の適切な技術は、どの産物イオンが特定の前駆体から誘導されるかを決定するのに支持する保持時間観察を使用する。産物イオンは、保持時間の値を整合することに応答してこれらの前駆体イオンと結合される。
【0063】
例えば、閾値保持時間の差を選択する。産物イオンおよび前駆体イオンの保持時間における差が、閾値未満である場合、産物は、前駆体から誘導されると決定される。例えば、1つの適切な閾値は、前駆体イオンの保持時間ピーク幅の10分の1に等しい。イオンの保持時間値は、場合により、このイオンから観察されたピークのピーク最大限の時間値として定義される。
【0064】
いったんタンパク質プロファイルのカタログが、上に示されるとおり発生されると、カタログは、場合により、予め存在するタンパク質データベースに関わることなく対象サンプルでのタンパク質の正確な同定170を支持するために使用される。例えば、対象サンプル中のタンパク質は、場合により、タンパク質のプロファイルに列挙されるとおり、タンパク質の3つの最も集約的な前駆体が、サンプル中に適切に存在するという決定を通して同定される。データ中の前駆体の存在は、プロファイルの値と収集データの保持時間値、質量値、および強度比値を整合させることによって決定される。多かれ少なかれ、前駆体は、場合により、整合を決定するために使用され、および/または3つの最も集約的な前駆体イオン以外を利用し得る。
【0065】
タンパク質プロファイルの使用は、ある種の先行の同定方法より多くの利点を提供する。例えば、タンパク質は、比較的低い濃度で存在するときでさえ正確に同定され得る。低濃度サンプルは、しばしば、産物イオンのほとんど、またはまったく検出可能性がないことを提供する。しかし、プロファイルが比較的高い濃度のタンパク質を有するサンプルから発生した場合、対応するタンパク質プロファイルは、比較についての比較的信頼性のある正確な前駆体データを提供する。
【0066】
タンパク質の同定の後、同定は、場合により、観察可能なレベルで存在することが予測される場合、他の前駆体についての別のデータの比較、および/またはプロファイル中の産物イオンデータの比較によって確認される。対象サンプル中のタンパク質の濃度は、場合により、プロファイルの強度関連データに対する比較によって決定される。
【0067】
タンパク質プロファイルのカタログは、場合により、別の参照および/または対象サンプルの分析を補足および/または更新される。例えば、方法200が、カタログ中に存在しないタンパク質を同定する場合、タンパク質のプロファイルは、カタログ中に定義および保存150される。例えば、方法200が、カタログ中のプロファイルをすでに有するタンパク質を観察する場合、タンパク質のプロファイル中の存在するデータを、新たに獲得したデータを補足または交換し得る。例えば、タンパク質がプロファイルを定義するために使用された先行のサンプルについて存在するより、新たに観察されたサンプル中での大きな濃度で存在した場合に、さらに信頼性のあるプロファイルをおそらく得る。したがって、参照サンプルおよび対象サンプルの両方は、プロファイルのカタログを構築および更新するために分析者によって利用可能である。
【0068】
例えば、各注入は、このサンプル中に存在する各タンパク質についての強力な新規プロファイルを提供する。新たな注入を分析するときに、カタログは、場合により継続的に更新、延長および改良される。例えば、異なるサンプルが、同じタンパク質であるが、しかし異なる濃度を含み得る。一般に、タンパク質の最高に利用可能なプロファイルは、最高強度を有するものである。
【0069】
したがって、分析者は、場合により、第一のサンプル注入から得られるプロファイルで始まり、およびこれらのプロファイルを、先に定義されたタンパク質プロファイルの(多分大きな)カタログ中に存在する全プロファイルと体系的に比較する。注入におけるプロファイルと関連した強度が、カタログ中の整合性のある現存のプロファイルと関連した強度を越える場合、これにより新たなデータは、現存のプロファイル中のデータを補足するか、またはプロファイル中の現存するデータを単に交換する。
【0070】
上に示されるとおり、注入から得られるタンパク質プロファイルが、カタログ中に存在しない場合、これによりタンパク質プロファイルは、場合により、プロファイルのカタログに加えられる。場合により、その後、当初のカタログは空であり、および全連続注入を、カタログ中のタンパク質プロファイルを占める、改良する、および/または拡張するために使用される。ある種の代替実施形態では、カタログは、前駆体関連データをまだ含んでいなかったプロファイルについて1つ以上のタンパク質同一性を含む。その後、プロファイルは、タンパク質が分析サンプルで観察されるとおりデータで改良される。
【0071】
図3は、化学分析についての別の方法300の流れ図であり、これは、予備選択法の使用を通して得られるタンパク質プロファイルのカタログ332を提供する310こと、およびカタログ332および集約的前駆体イオンの決定320の間の比較に応答して、1つ以上の未同定タンパク質を同定330することを含む。340保存プロファイルが新たに観察されたタンパク質によって提供されるより低い強度値を有する場合、カタログは更新350される。
【0072】
例えば、1名以上の分析者らは、カタログ332を開発し、およびこれにより、1名以上の分析者は、サンプル中の1つ以上のタンパク質を検出、同定および/または定量化するために開発されたカタログ322を利用する。カタログを開発するために使用されるときに、同じか、または類似の装置をサンプル分析のために使用することが好ましい。カタログは、異なる実験室で類似の装置から得ることができ、および同じかまたは異なった分析によって発生される。同じかまたは異なった実験室中で同じかまたは異なった装置から得られるカタログを合わせて、単独または別のカタログを形成し得る。
【0073】
明記されるとおり、タンパク質−プロファイルデータは、場合により、検出タンパク質のサンプル中の濃度を定量化するためにも使用される。例えば、タンパク質の濃度が、タンパク質のプロファイルを定義するために使用された先行のサンプルについて知られるか、または決定される場合、プロファイルは、場合により、指標がプロファイルの強度値に関連している濃度の指標を含む。
【0074】
サンプル中のタンパク質の濃度の指示は、例えば、プロファイルの間の最高強度イオン、または設計された前駆体および/または産物イオン、または前駆体および/または産物イオンの設計された集合を比較することによって得られる。例えば、前駆体および産物の強度の平均または中央値を得て、その後異なるサンプル中のタンパク質の間のこのような平均または中央値の比を取ることによって、濃度の比較がなされる。
【0075】
場合により、強度の比の平均または中央値を形成する。場合により、加重または未加重最小二乗取付(weighted or unweighted least−squares fitting)は、もう1つのものに整合する1組のイオンの強度を測るために使用される。最小二乗取付によって得られるスケーリング因子は、濃度の指標、またはタンパク質の相対濃度として使用される。
【0076】
次に、図4、図5、図6、および図7に関して、ある種の型のタンパク質プロファイルの例を示す。
【0077】
図4は、1つの実施状態によるイー.コリ(E.Coli)から得られるタンパク質トランスアロダーゼ(酵素)のサンプルから得られる例のプロファイルの三次元グラフ図である。プロファイルは、前駆体および産物イオンについてのデータを含む。データは、各イオンについて線としてグラフに描かれ、イオンの質量および保持時間によって位置決めされる。各棒線の高さは、結合イオンの強度(イオン数)に対応する。前駆体イオンは、線の両末端でOによって識別され、および産物イオンは、線の両端でXによって識別される。プロファイルは、10個の前駆体イオンについての、および30より多い産物イオンについてのデータを含む(この全てが、類似の質量、時間、および強度値のため、図面で認められるわけではない)。
【0078】
図5は、図4のプロファイルの二次元棒グラフであり、イオン質量の関数として前駆体イオンおよび産物イオンの強度を示す。予想されるとおり、産物イオンは前駆体のフラグメントであり、およびいっそう膨大であるので、前駆体イオンは、一般に、産物イオンより大きな質量および強度を有する。
【0079】
図6は、図4のプロファイルの二次元棒グラフであり、保持時間の関数として前駆体イオンおよび産物イオンの強度を示す。個々の前駆体イオンおよびこれらの産物イオンとの間の結合(すなわち、同じ保持時間)を観察する。
【0080】
図7は、図4のプロファイルの包括図に対応する二次元プロットである。プロットは、プロファイルの各前駆体イオンおよび産物イオンの質量および保持時間での配置を示す。さらに、個々の前駆体イオンおよびこれらの産物イオンの間の結合は、共通の保持時間に沿ったこれらの調整のため観察される。
【0081】
次に、図8に関して、本発明のいくつかの実施形態は、複数のタンパク質を有するもののような、重複するクロマトグラフィーピークを示す前駆体を有する可能性がある比較的混成サンプルの分析を支援する。いくつかの実施形態は、混成サンプルの成分を単純化および/または濃縮し、および/または分析および比較のための複数のサンプル部分を提供するサンプル分画を利用する。
【0082】
いくつかの実施形態では、サンプルを分画して、当初のサンプルの分画でのタンパク質の濃度を増大させる。その後、濃縮サンプルを、場合により、上述の分析方法100、200にかける。このような実施形態は、方法100、200が有利に適用されるタンパク質濃度の動的範囲を増大する。
【0083】
例えば、本発明のいくつかの方法を利用して、細胞のプロテオームまたは血清プロテオーム中に存在する全てのタンパク質は、タンパク質プロファイルの定義および/またはタンパク質の同定のために強力に観察可能である。
【0084】
いくつかの他の実施形態では、その内の1つは、図8に関して示され、重複するタンパク質または前駆体ピークは、2つ以上の部分に分割される。この部分から得られるデータを、前駆体が同じタンパク質と結合しているという決定を支援するために比較する。例えば、分画後、分画を消化させ、およびクロマトグラフィー工程を介して分離する。その後、分画から分画までのピーク強度が、分画から分画までのタンパク質濃度に対応する分離前駆体は、これらが生じたタンパク質と結合される。
【0085】
2つのポリペプチドの重複ピークを分画することによって、2つのポリペプチドの連続的に生成された前駆体の比における規則的変化を得る。保持時間情報を保護する上述の方法によるような分画のLC/MS分析は、前駆体イオンデータを生じる。その後、分画関連データは、どの前駆体が、共通のポリペプチドと(各分画中の2つのポリペプチドの異なる濃度比に応答して)結合しているかを決定するために比較し得る。したがって、保持時間データが、結合を決定するために不十分である場合、分画によって提供される別の情報は、しばしば、結合工程の達成を可能にする。
【0086】
代わりに、例えば、消化された混成タンパク質サンプルを、クロマトグラフィー分離工程にかける。サンプル部分は、クロマトグラフィーピークの全幅より好ましくは小さい収集時間枠にわたって収集される。このような枠は、少なくとも2つの分画が、各々タンパク質の部分を含むことを保障する。
【0087】
図8は、本発明の1つの実施形態による化学分析のための方法800の流れ図である。方法800は、少なくとも2つのポリペプチドを有する混成サンプルを分画810すること、消化820すること、および第一のサンプル部分でLC/MSを行う830こと、消化840すること、および第二のサンプル部分でLC/MSを行う850こと、および前駆体イオンを、第一および第二のサンプル部分での前駆体イオンの観察された強度の比に応答して第一および第二のポリペプチドの内のこれらの対応の1つと結合860させることを含む。
【0088】
混成サンプルを、各々が様々な濃度比ではあるが2つのポリペプチドの部分を含む少なくとも第一のサンプル部分および第二のサンプル部分に分画810する。分画を、上に示されるもののようないずれかの適切な技術を介して消化820、840する。サンプル部分中にポリペプチドと結合した前駆体イオンの強度を観察するためにLC/MSを行う830、850。その後、強度に関連したデータは、前駆体イオンとこれらのポリペプチドとの結合860の決定を支持する。
【0089】
方法800は、特に、分画810より前の分離の間に物理的に重複するタンパク質の解析に適する。方法800は、区別できない保持時間を有する重複ピークを示す2つ以上のポリペプチドの場合に強力に最も有用である。したがって、方法800は、例えば、タンパク質の信頼性のあるプロファイルのカタログを生じる上で示される方法100、200のような方法と組み合わせて利用され得る。
【0090】
ゲル透過クロマトグラフィー、サイズ排除クロマトグラフィー、イオン交換クロマトグラフィー、および逆相クロマトグラフィーのような既知技術を含むいずれかの適切な分画技術を使用する。いくつかの適切な技術は、カラム過剰負荷、pH勾配、および/または変性可動相を利用する。
【0091】
分画は、場合により、例えば一連のバイアル中に収集される。代わりに、例えば、各分画は、例えば、上に示される方法100、200のような方法を介して連続分析の前に簡便に保持される。
【0092】
分画810は、好ましくは、過剰採取によって、すなわち、重複ピークの分画を収集するときに、ピーク幅より少ない分画収集時間を使用することによって行われる。例えば、ピーク幅が、1分である場合、1分未満の収集時間が望ましい。
【0093】
いずれかの適切な収集時間値を選択する。例えば、1つの適切な収集時間値は、ピークの半値全幅(FWHM)付近である。このような収集時間は、少なくとも2つの分画が、少なくとも2つの重複ピークの部分を含むことを確信させる。いくつかの実施形態では、サンプルポリペプチドとの前駆体の連続結合に対する十分な信頼を提供する重複ピークの3つの分画を収集する。さらに一般には、非常に多数の狭い収集枠が、場合により、各収集分画で簡便なサンプル組成物を提供するために使用される。
【0094】
したがって、収集枠幅は、いずれかの適切な手段で選択される。幅は、場合により、ピークの解析を場合により支援する幅が決定される相互作用工程に応答して選択される。単一のタンパク質は、場合により分析して、ピーク幅を経験的に決定する。その後、決定されたピーク幅のいくつかの分画を、決定ピークのFWHMのような、分画収集について選択する。代わりに、ピーク幅は、論理的に決定される。
【0095】
いくつかの代わりの実施形態では、混成サンプル中のタンパク質は、分画を介して濃縮される。分画を連続して消化し、および消化分画自体を、ペプチド分画プロトコールを介して分画化する。例えば、おそらく高カラム負荷で、分画ペプチドは、ゲル透過クロマトグラフィー、または逆相クロマトグラフィー、またはイオン交換クロマトグラフィーのような多数の十分に確立したタンパク質分画技術の内のいずれか1つによって分画される。
【0096】
各ペプチド分画は、目下、当初のペプチド消化物の一部を表す。この分画を、場合により濃縮し、および最大カラム負荷でクロマトグラフィーカラムに注入する。全ペプチド消化物のために使用されるLC/MS方法は、好ましくは、同じ(分画化および未分画化されたもの)である。したがって、所与のペプチドは、これが、分画されるか、または分画されていないサンプルから得られるかのいずれにせよ、実質的に同じ保持時間で溶出する。
【0097】
その後、分画化ペプチドを、例えば上に示されるとおり同定する。分画で見られるいずれかのペプチドは、高強度によって高質量負荷で見られ、およびこのフラグメントイオンの多くは、装置の検出限界より上で見られる。したがって、未分画消化物で見られるいずれかの高エネルギーで実証されたペプチドが、多くのイオンを有する分画化消化物中で見られ、より多くの配列範囲を提供する。ペプチドは、未分画化消化物で見られなかった高エネルギー実証を示す分画化消化物でも見られる。
【0098】
保持時間および正確な質量整合は、分画化および未分画化サンプル中の観察されたペプチドを互いに結びつけるために使用され得る。特定の使用法の内でも、未分画化消化物中で見られる前駆体の強度に対する分画化サンプル中で見られるペプチド前駆体の強度の比である。この比は、分画化消化物中で見られる全てのフラグメントイオンに適用でき、したがって、これらが未分画化消化物で現れるときに、フラグメントの強度を推測し得る。したがって、ある種の代替的プロファイルの1つの重要な特徴、タンパク質に対するペプチド前駆体の相対的強度の測定を保存する。
【0099】
次に、図9Aおよび9Bに関して、本発明のいくつかの実施形態は、LC/MS装置に関する。図9Aは、本発明の1つの実施形態によるLC/MSシステム900のブロック図である。装置は、クロマトグラフィーモジュール904、およびクロマトグラフィーモジュール904から溶出液を受ける質量分析計モジュール912を含む。LCモジュール904は、サンプル902を受ける注入器106、ポンプ908およびカラム910を含む。MSモジュール912は、脱溶媒/イオン化装置914、イオンガイド916、質量分析装置920、および検出器922を含む。システム900は、データ保存単位924およびコンピュータモジュール926も含む。
【0100】
操作時に、サンプル902を、注入器906を介してLCモジュール904に注入する。ポンプ908は、カラム910を通してサンプルを汲み取って、カラム910を通して保持時間によって、混合物を成分部分に分離する。
【0101】
カラム910から得られる出力を、分析のために質量分析計912に入力する。最初に、脱溶媒/イオン化装置914によって、サンプルを脱溶媒およびイオン化させる。例えば、加熱装置、ガス、およびガスまたは他の脱溶媒技術と組み合わせた加熱装置を含むいずれかの脱溶媒技術を使用し得る。イオン化は、例えば電子噴霧イオン化(ESI)、大気圧化学的イオン化(APCI)、または他のイオン化技術を含むいずれかの適切なイオン化技術により得る。イオン化から生じるイオンを、イオンガイド916によって衝突セル918に供給する。
【0102】
衝突セル918を、イオンを断片化するために使用する。好ましい実施形態では、衝突セル918を、同じ溶出前駆体材料の前駆体イオンおよび産物イオンの両方の観察を支持する切替モードで操作する。
【0103】
既知技術を含むいずれかの適切な切替技術を使用し得る。本発明のいくつかの実施形態は、好ましくは、比較的簡単な可変の電圧周期をセル918に適用する断片化プロトコールを使用する。この切替は、十分高い頻度で行われ、この結果、複数の高および複数の低エネルギースペクトルが、単一のクロマトグラフィーピーク内に含まれる。いくつかの他の切替プロトコールと異なり、周期は、データの内容と独立である。
【0104】
例えば、’130号特許で示されるとおり、可変の電圧を、衝突セル918に適用して、断片化を引き起こす。前駆体(衝突なし)およびフラグメント(衝突の結果)についてのスペクトルを収集する。
【0105】
代替の実施形態は、いずれかの適切な既知装置を含むいずれかの適切な衝突断片化または反応装置のような断片化のための他の手段を利用する。いくつかの選択肢の装置としては、(i)表面誘導解離(「SID」)断片化装置;(ii)電子移動解離断片化装置;(iii)電子捕捉解離断片化装置;(iv)電子衝突または衝撃解離断片化装置;(v)光誘導解離(「PID」)断片化装置;(vi)レーザー誘導解離断片化装置;(vii)赤外線照射誘導解離装置;(viii)紫外線照射誘導解離装置;(ix)雑音スキマーインターフェイス断片化装置;(x)インソース断片化装置;(xi)イオン源衝突誘導解離断片化装置;(xii)熱または温度源断片化装置;(xiii)電界誘導断片化装置;(xiv)磁界誘導断片化装置;(xv)酵素消化または酵素分解断片化装置;(xvi)イオン−イオン反応断片化装置;(xvii)イオン−分子反応断片化装置;(xviii)イオン−原子反応断片化装置;(xix)イオン−準安定性イオン反応断片化装置;(xx)イオン−準安定性分子反応断片化装置;(xxi)イオン−準安定性原子反応断片化装置;(xxii)イオンを反応させて、付加物または産物イオンを形成するためのイオン−イオン反応装置;(xxiii)イオンを反応させて、付加物または産物イオンを形成するためのイオン−分子反応装置;(xxiv)イオンを反応させて、付加物または産物イオンを形成するためのイオン−原子反応装置;(xxv)イオンを反応させて、付加物または産物イオンを形成するためのイオン−準安定性イオン反応装置;(xxvi)イオンを反応させて、付加物または産物イオンを形成するためのイオン−準安定性分子反応装置;および(xxvii)イオンを反応させて、付加物または産物イオンを形成するためのイオン−準安定性原子反応装置が挙げられる。
【0106】
衝突セル918の出力を、質量分析装置920に入力する。質量分析装置920は、四極、飛行時間型(TOF)、イオン捕捉、磁性セクター質量分析装置、並びにこれらの組合せを含むいずれかの適切な質量分析装置である。検出器922は、質量分析装置920から生じるイオンを検出する。検出器922は、場合により、質量分析装置920に不可欠である。例えば、TOF質量分析装置の場合には、検出器922は、場合により、イオンの強度を計測する、すなわち、作用するイオンの数を計測する微細チャネルプレート検出器である。保存媒体924は、分析のためのイオン計測を保存するための恒久的保存を提供する。例えば、保存媒体924は、内部または外部コンピュータディスクである。分析コンピュータ926は、保存データを分析する。データは、保存媒体924中での保存を要求することなく、実測時間でも分析され得る。この場合には、検出器922は、データを通過させて、最初にこれを恒久的保存に保存することなく、コンピュータ926に直接的に分析させる。
【0107】
衝突セル918は、前駆体イオンの断片化を行う。断片化を使用して、ペプチドの配列を決定し、および続いて、当初のタンパク質の同一性に至り得る。
【0108】
衝突セル918は、窒素のような気体を利用する。荷電されたペプチドは、気体の原子と相互に作用するとき、生じる衝突は、1つ以上の特徴的な結合でこれを破壊することによってペプチドを断片化し得る。最も一般的な得られたフラグメントは、Y−またはB−イオンとみなされる。ペプチド前駆体のMSスペクトルを得る低電圧状態(低エネルギー)の間の衝突セル中の電圧を、前駆体の衝突に誘発されたフラグメントのMSスペクトルを得る高電圧状態(高エネルギー)の間の衝突セル中の電圧に切替えることによって、このような断片化は、オンライン断片化として達成され得る。高および低電圧は、電圧がイオンに対して運動エネルギーを与えるために使用されるので、高および低エネルギーとして称される。
【0109】
クロマトグラフィーモジュール904は、カラム基本の装置のような既知装置を含むいずれかの適切なクロマトグラフィー装置を含む。適切なカラムは、クロマトグラフィー分野で当業者に既知のカラムを含む。カラムは、例えば、金属製または絶縁性材料から形成され得る。適切な材料としては、鋼、融合シリカ、または裏打ち材料のような既知材料が挙げられる。カラムは、一連および/または並行な形態で配列された1つより多いカラムを含み得る。例えば、カラムは、キャピラリーカラムであり得、および複数のキャピラリー管を含み得る。
【0110】
コンピュータモジュール926は、データ連携分野で既知のもののようなワイヤー付および/またはワイヤー無手段を介してシステム400の他の成分と情報交換のあるデータである。モジュール926は、例えば、質量分析計モジュール912からプロセスデータを受け、および制御信号を提供する。モジュール926は、場合により、上に示される化学分析のための方法100、200のようなここに示される方法を実行するように構成される。種々の例示の実施形態で、モジュール926は、ソフトウエア、フィルムウエア、および/またはハードウエア(例えば、アプリケーション特定集積回路として)中で実行され、および所望の場合、使用者インターフェイスを含む。モジュール926は、保存単位924のような保存構成要素を含むか、および/または情報交換している。
【0111】
モジュール926の適切な移植は、例えば、マイクロプロセッサのような1つ以上の集積回路を含む。いくつかの代替的実施形態では、単一の集積回路またはマイクロプロセッサは、モジュール926およびシステム900の他の電子部分を含む。いくつかの実施形態では、1つ以上のマイクロプロセッサは、モジュール926の機能を可能にするソフトウエアを実行する。いくつかの実施形態では、ソフトウエアは、一般目的の装置および/またはここに示される機能性に専用の特化されたプロセッサで稼動するように設計される。
【0112】
LC/MS実験は、この出力の内の1つとして、質量クラマトグラムを生じ得る。質量クロマトグラムは、特定の質量値で時間の関数として記録される1組または1群の応答(強度)である。質量クロマトグラムでは、質量値は、ある範囲内で中央値であり得る。すなわち、所与時間での強度は、特定範囲の質量値を超えて収集された強度を合わせることによって得ることができる。典型的には、質量クロマトグラムは、1つ以上のクロマトグラフィーピークを含む。
【0113】
単一の分子、または化学的実体は、特定の質量を有する。LC/MS実験では、この分子のイオン化形態は、この電荷によって割られたこのイオンの質量値(質量対荷電比)で、クロマトグラフィーピークとして観察される。クロマトグラフィーピークは、ピークプロファイル、または溶出プロファイルを有する。クロマトグラフィーピークのプロファイルは、頂端保持時間、ピーク幅、引き上げ時間および着地時間を含むいくつかの特性を使用して特徴付けられ得る。クロマトグラフィーピーク幅は、特定のピーク高さで幅(FWHM、50%高さでの幅)、または屈曲点の間の幅、または標準偏差とみなすことができる。頂端強度またはクロマトグラフィーピーク高さは、クロマトグラフィーピークのプロファイルで見られる最大強度である。一般に、頂端強度は、基本線で訂正される。
【0114】
クロマトグラフィー分離によって分離される溶出液中の分子、およびカラムからの溶出液は、共通の溶出分子、または当初の分子と称される。当初の分子を、質量分析計のイオン化源を通してイオン化する。得られるイオンを、LC/MSまたはLC/MSで測定する。アイソトープ組成物および、または断片化工程の結果として、各当初の分子は、イオンの複数のカテゴリーに生じ得て、各々は、質量および電荷の特徴的値を有する。当初の分子に対応するイオンは、前駆体イオン、または単に前駆体と称される。
【0115】
ペプチド消化物中で、当初の分子は、ペプチドであり、およびペプチドに対応するイオンは、前駆体と称される。当初の分子から誘導されるいずれかのイオンは、プロセッサまたはフラグメントのいずれであろうと、同じ保持時間および前駆体としてクロマトグラフィーピークのプロファイルを有するに違いない。
【0116】
LC/MS実験では、イオンは、これの保持時間、質量対荷電比、および強度によって示され、および/または帰され得る。単一分子は、イオンのクラスターとしてLC/MSクロマトグラムで現れ得る。ペプチドは、1つ以上のイオンクラスターを生じる。各クラスターは、異なる荷電状態(例えば、Z=1またはZ=2)に対応する。クラスター中の各イオンは、ペプチドの様々なアイソトープ組成に対応する。一般のペプチドから得られるイオンのクラスターでは、モノアイソトープは、全てのアイソトープがこれらの最も優勢な低質量状態にある最低質量を有するイオンである。クラスター中のイオンは、一般の当初の分子からくるので、これらは、一般の保持時間およびピークプロファイルを共有するに違いない。
【0117】
当初の分子は、アイソトープおよび電荷効果のため、複数のイオンを生じ得る。さらに、イオンの重要な源は、当初の分子のフラグメントである。これらのフラグメントは、当初の分子を崩壊するプロセスから生じる。これらのプロセスは、イオン化源で、または衝突セルで起こり得る。フラグメントイオンは、一般の溶出、当初の分子から誘導されるので、これらは、当初の分子と同じクロマトグラフィー保持時間およびピークプロファイルを有するに違いない。
【0118】
一般に、当初の分子は、Nイオンを生じる場合、およびこれらが、質量分析計によって適切に分解される場合、これにより、各質量クロマトグラムが、当初の分子から誘導されるイオンのピーク、クロマトグラフィープロファイルを含むN質量クロマトグラムがあり得る。これらのNイオンの各々の保持時間およびピークプロファイルは一致する。用語「一般−保持時間−実体」は、LC/MS分離で、クロマトグラフィーピークを生じさせ、全ては、同じ保持時間およびピーク形状を有する当初の分子の全イオンに言及される。
【0119】
共通の当初の分子から誘導されるイオンの保持時間およびピーク形状は、一般に、イオン形成、断片化、およびイオン検出の時が当初の分子のピーク幅より非常に短いので同じである。例えば、半値全幅(FWHM)で測定される典型的なクロマトグラフィーピーク幅は、5から30秒である。イオン形成、断片化、および検出の時間は、典型的に、数ミリ秒である。したがって、クロマトグラフィー時間規模で、イオン形成の時間は、即時プロセスである。当初の分子から誘導されるイオンの観察された保持時間での差は、有効にゼロであるという結果になる。すなわち、当初の分子から誘導されるイオンの間の数ミリ秒の保持時間差は、クロマトグラフィーピーク幅に比較して小さい。
【0120】
当初の分子に結合しているイオンは、いくつかのカテゴリーの内の1つに入る。当初の分子から誘導されるイオンは、前駆体、前駆体のフラグメント、またはフラグメントのフラグメント、または上記の質量のいずれかのニュートラルロスであり得る。これらの質量のいずれかは、1つ以上の別個のアイソトープ状態で、および1つ以上の荷電状態で見られ得る。
【0121】
ペプチドの場合には、所定のペプチドは、一般に、イオンのクラスターであると見られ、各々は、異なるアイソトープ状態にあり、および各々は、1つ以上の荷電状態にある。理想的には、イオン化源は、天然の当初の分子のタンパク質化形態である前駆体を生じる。1つ以上のプロトンを、天然の分子に付着でき、したがって、前駆体は、電荷Z=+1、または+2などを示す中性より高い1つ以上の質量単位であり得る。実際に、この前駆体(mwHプラスと称される)は、水、アンモニア、またはリン酸のような中性分子の損失分から生じる低質量実体によって達成され得る。断片化は、典型的にY−またはB−イオンを生じる源から起こり得る。断片化は、衝突セル中の気体分子との下流相互作用によっても意図的に誘導され得る。
【0122】
無処理の前駆体イオンの衝突で誘導される解離から発生されるイオンに関して、フラグメント産物イオンは、これらの親前駆体イオンと結合している。この結合は、ハイ・ローデータ取得モードにある質量分析計を使用して連続断片化のための単一の前駆体を予め選択する装置を必要とせずに達成される。さらに詳細には、結合イオンは、複数の前駆体が、基本的に同じ保持時間で同時に断片化しているときに適切に分類される。したがって、本発明の実施形態は、正しい拍子で同時に、1つより多くの前駆体断片化があるときに、産物イオンをこれらの個別の前駆体に割り当て得る。さらに、本発明の実施形態は、これらの共通の単独に荷電された注釈づけ(すなわち、MH+)に対する脱アイソトープ化および荷電状態減少イオンのためのコンピュータ処理負荷を明らかに減じ得る。
【0123】
本発明の方法は、当初の分子が前駆体イオンおよびフラグメントイオンを生じさせる場合に、ペプチドのもの以外の混合物を適用し得る。したがって、本発明の実施形態は、プロテオミクス、メタボロミクス、およびメタボノミクスで使用し得る。
【0124】
カラム910のようなクロマトグラフィー支持マトリックスから溶出する分子(ペプチド、代謝産物、天然の産物)の保持時間およびクロマトグラフィーピークのプロファイルは、支持マトリックスおよび可動相の間のこの分子の物理的相互作用の関数である。分子が、支持マトリックスおよび可動相の間に有する相互作用の程度は、この分子に関するクロマトグラフィープロファイルおよび保持時間を指示する。混成混合物では、各分子は、化学的に異なる。結果として、各分子は、クロマトグラフィーマトリックスおよび可動相について異なる親和性を有し得る。結果的に、各々は、特徴的なクロマトグラフィープロファイルを示し得る。
【0125】
一般に、特定の分子についてのクロマトグラフィープロファイルは、特徴的であり、およびこの分子の物理化学的特性を示す。所与の分子のクロマトグラフィーピークのプロファイルを特徴付けるために場合により使用されるパラメーターとしては、初期検出(引き上げ)の時点、正規化スロープ、ピーク頂端の時点に比べた屈曲点の時点、最大応答(ピーク頂端)の時点、屈曲点で、半値全幅(FWHM)でのピーク幅、ピーク形状非対称性、およびわずか数個を指名する最終検出(タッチダウン)の時点が挙げられる。
【0126】
図9Bは、本発明の1つの実施形態により、前駆体の溶出ピークを網羅する期間じゅうの質量スペクトルの収集を示す3つの関連グラフを示す。第一のグラフ994は、低エネルギースペクトル(すなわち、未断片化前駆体から得られるスペクトル、「MS」と標識される)および高エネルギースペクトル(すなわち、断片化前駆体、すなわち産物イオンから得られるスペクトル、「MS」と標識される)の溶出時間にわたる代替的収集を示す。第二および第三のグラフ994A、994Bは、MSおよびMSスペクトル収集時間および前駆体に関連した保持時間ピークの再構築をそれぞれに示す。
【0127】
再構築ピークは、単一前駆体のクロマトグラフィー溶出プロファイルを表す。水平軸は、ピークプロファイルの溶出時間に対応する。垂直軸は、前駆体がクロマトグラフィーカラムから溶出するときに、前駆体の時間変化濃度に関連した強度の随意単位に対応する。
【0128】
したがって、質量分析計を通過させた溶出前駆体は、低および高エネルギー方式の両方でイオンを生じる。低エネルギー方式で生じたイオンは、第一に、おそらく異なるアイソトープおよび荷電状態にある前駆体イオンのものである。プロテオミック研究では、前駆体イオンは、無処理のタンパク質の酵素的消化(典型的には、トリプシン消化)から発生されたペプチドである。高エネルギー方式で、イオンは、第一に、これらの前駆体の異なるアイソトープおよび荷電状態のフラグメントイオンである。高エネルギー方式は、上昇エネルギー方式とも呼ばれ得る。
【0129】
このようにして、グラフ994では、代替の白および黒棒線は、スペクトルが、溶出中のクロマトグラフィーピークの低および高エネルギー電圧で収集される時間を表す。低エネルギーグラフ994Aは、低エネルギー電圧が、衝突セル918で適用される時間を描き、低エネルギースペクトルを生じる。高エネルギーグラフ994Bは、高エネルギー電圧が、衝突セル918で適用される時間を描き、高エネルギースペクトルを生じる。
【0130】
したがって、前駆体のクロマトグラフィーピークは、高および低エネルギー方式によって複数回サンプル採取される。これらの複数サンプルから、ピークに関連し、および高および低エネルギースペクトル中でみられる全イオンの正確な保持時間を推測し得る。これらの正確な保持時間は、それぞれのスペクトルによってサンプル採取された強度の挿入事項によって得られる。
【0131】
ここで示されるものは、入力データ集合に含まれる前駆体および関連産物イオンの保持時間整合を行うことに関連して使用され得る技術である。
【0132】
複数のタンパク質を含む混成タンパク質サンプルのようなサンプルまたは混合物と関連して、多くの前駆体イオンは、同じ保持時間を有し得る。前駆体イオンが断片化されるとき、断片化の結果として生じる産物イオンも、この前駆体と同じ保持時間を有する。同じ保持時間を有し得る多数の前駆体イオンのため、異なる前駆体から得られる産物イオンは、実質的に同じ保持時間を示し得る。結果として、産物イオンをそれぞれの正しい前駆体イオンと整合させることは困難であり得る。産物イオンが発生される適切な前駆体イオンに産物イオンを整合させることは、ここで示されるとおり多くの用途を有し、および当業者に知られている。
【0133】
LC/MSに関して、保持時間整合技術は、産物イオンが誘導され、同じ保持時間およびピーク形状を示す産物イオンのもの、および関連前駆体イオンを見出す。ここに示される技術は、前駆体との産物イオンの結合のために準備し、実質的に同じ測定保持時間を有する産物イオンおよび前駆体が、保持時間整列に基づいた出力スペクトル中に含まれることを確実にする。
【0134】
保持時間整合を行うための技術は、混成サンプル並びに簡便なサンプルと関連して使用され得る。混成サンプルは、例えば、タンパク質混合物、並びに血清、組織および細胞のような当分野で既知の多様な異なる生物学上のサンプルの内のいずれか1つを含み得る。保持時間整合技術は、単一ポリペプチドの簡単なサンプルとも関連して使用され得る。
【0135】
関連産物イオンに対する前駆体の保持時間整合のための技術は、例えば、タンパク質同定技術で使用されるポリペプチドプロファイルを生成するために、ここに示される技術と関連して使用され得る。ここに示されるとおりタンパク質についてのこのようなプロファイルと関連して、タンパク質のための最も強力な前駆体として測定される前駆体イオンの集合は、タンパク質を同定するために使用し得る。プロファイルは、十分な特異性に対してタンパク質を検出、同定、書き込みおよび/または定量化するために使用でき、この結果、タンパク質が、他のタンパク質から区別され得る。プロファイルは、最も強力な前駆体の各々に関する追加情報も含み得る。追加情報は、例えば、前駆体の各々と結合した多くの産物イオンの内の1つ、1つ以上の産物イオンの各々についてのデータ(例えば、保持時間、強度および/または質量またはm/zのような)を含み得る。保持時間整合技術は、プロファイルに含まれるときに最も強力な前駆体に結合した産物イオンを同定するために使用し得る。十分な数のこれの産物イオンの質量と一緒に、最も強力な前駆体イオンの質量のような、プロファイルから得られる情報は、タンパク質の配列を高度の信頼まで同定し得る。
【0136】
以下の段落で示される保持時間整合技術は、ペプチドおよびタンパク質を検出、同定、書き込みおよび/または定量化するために使用され得て、およびプロテオミクスでの問題に対処する。ここで示される保持時間整合技術は、生物学以外として特徴付けられ得るサンプルまたは混合物と関連しても使用され得る。プロテオミック用途に関連して、ペプチドは、サンプルタンパク質の酵素的消化から生じ得る。ペプチド前駆体の信頼すべき同定は、サンプルタンパク質の同定および定量化を可能にする。
【0137】
ここで示される保持時間整合技術は、統計学的方法のような他の方法論を利用せずに、決定的な手段で産物イオンを前駆体に信頼して調整させるか、または整合させて、産物イオンおよび前駆体の不正確な整合について補償するために使用し得る。ここで技術を使用して同定される前駆体および関連産物イオンは、単独にデータベースで、または現存のデータ保存を注釈付けするときのような他のデータと関連して保存され得る。
【0138】
Batemanで示される前述の技術を使用して分析されるタンパク質消化物を使用して用途についてここで例示の例で参照し得るが、実施形態は、例えば、選択された単離前駆体について、選択された前駆体イオンを単離し、および産物イオンを同定するために使用されるデータ依存性分析(DDA)のような当分野で既知の他の方法論を使用してデータ集合を生じ得る。1つの実施形態では、質量分析計は、質量分析計が、衝突セルおよび四極を含むDDAを行うために使用され得る。DDA技術によって操作するときに、四極は、目的の前駆体のみを選択的に単離および選択する第一の相中でフィルターとして使用される。したがって、ただ選択された前駆体は、第一の濾過相の出力として発生される。その後、十分に高い電圧を使用するときに、選択された前駆体を、これらが断片化される衝突セルに通過させて、フラグメントまたは産物イオンを発生させ、および単離された前駆体および産物イオンについて所望の数の走査物を得る。前述のDDA技術は、異なる前駆体を単離し、および前駆体および関連産物イオンのための所望の数の走査物を得るために反復し得る。
【0139】
実施形態は、多様な異なる技術を使用して目的の特定の前駆体の質量を決定し得る。例えば、ここのどこかに示されるとおりBateman技術を利用する1つの実施形態では、低エネルギー(LE)周期または方式は、1つ以上の前駆体イオンを含むスペクトルを発生させるために使用され得る。DDA技術のような入力データ集合を発生するために使用される他の技術も、前駆体を単離するため、およびこれらの特定の質量を決定するために使用し得る。選択された前駆体および関連の質量は、入力データ集合で連続して同定され得る。
【0140】
ここで技術を使用する1つの実施形態では、質量分析計を使用して様々の実験から生じるときの質量スペクトルを比較し得る。ここに示される保持時間整合技術は、入力データ集合での質量スペクトルを含み得て、および質量スペクトルの交点を決定することによって前述の質量スペクトルを合わせ得る。例示および説明の簡素化のために、質量スペクトルは、単一前駆体、および前駆体と実質的に同じ測定保持時間およびピーク形状を有する産物イオンに関連したデータを含み得る。しかし、産物イオンは、様々の質量またはm/z値を有する。様々のスペクトルの各々での単一前駆体およびこれの関連産物イオンの保持時間は、可能性のある測定誤差により陥った誤差の予測保持時間枠内にあり得る。1つの実施形態で、誤差の枠は、半値全幅(FWHM)方法論を使用して測定されるとき、前駆体の保持時間のピーク幅の1/10の閾値内にあり得る。当分野で既知のとおり、FWHMは、曲線がこの最大値の半分に達する質量スペクトルピークのいずれかの側で2点の間の距離として測定される。実施形態は、実施形態で利用されるシステムおよび方法論の予測誤差によって、予測誤差の前述の枠として他の値も使用し得る。
【0141】
データ集合に含まれる質量スペクトルは、前述の保持時間枠または誤差の枠内に保持時間を有する前駆体を含み得る。その後、質量スペクトルの各々を、単一の保持時間によって調整または正規化させ得る。例えば、データ集合内の質量スペクトルは、質量スペクトルピークのクロマトグラフィーFWHMである「n」+/−1/10の保持時間を有する前駆体を示す質量スペクトルのものを含み得る。データ集合中のスペクトルの各々を、その後、「n」のような単一の保持時間で調整され得る。調整プロセスで、スペクトル中の各前駆体イオンは、質量により、および「n」の保持時間で前駆体を調整する方向で移動される。さらに、スペクトルの産物イオンも、同じ量によって、およびスペクトルの前駆体の移動によるのと同じ方法で移動される。前述の調整は、スペクトルの各々について繰返される。調整後、産物イオンが、データ集合中のスペクトルの各々での誤差の前述の枠内に入る場合、これによりこの産物イオンは、前駆体と同じ保持時間も有することも決定され、および調整プロセスが「n」の保持時間で行われる前駆体と整合させる。対照的に、産物イオンが、スペクトルの各々についての誤差の前述の枠内にない場合、産物イオンは、前駆体についての整合性がないと決定される。このようなものとして、前駆体および関連産物イオンの保持時間整合は、決定論的信頼性のある手段で行われ得る。結果は、入力データ集合の質量スペクトルから得られる前駆体および全ての同定産物イオンを含む出力スペクトルの形態にあり得る。
【0142】
データ集合は、MSスペクトルのような、多様な異なる技術を使用して発生されるスペクトルを含み得る。例えば、スペクトルは、Batemanの技術またはDDA技術を使用した混成混合物のLC/MS分析を使用して得られ得る。データ集合は、MALDI−MS−MSから、および高または低解像での質量分析計を使用しても得られ得る。
【0143】
保持時間整合技術と関連した使用のためにデータ集合に含まれる場合の産物イオンは、当分野で既知の多様な異なる方法論を使用して発生され得る。産物イオンは、多様な異なる断片化技術の内のいずれか1つを使用して発生され得る。実施形態は、ペプチド混合物の単独注入のLC/MS分析の一部として適用される高および低エネルギー切替プロトコールを使用して、Batemanで示される質量分析(MS)方法論を使用し得る。このようなデータでは、低エネルギー(LE)スペクトルは、主に未断片化前駆体から得られるイオンを含む一方で、高エネルギー(HE)スペクトルは、主に断片化前駆体から得られるイオンを含む。ここに示される保持時間整合技術が適用されるデータ集合での各スペクトルは、独立の分析または実験から得られ得る。例えば、LC/MS場面では、入力データ集合中に含まれるMスペクトルの各々は、Mの異なる注入から得られ得る。これらのM注入は、同じ適量(例えば、反復注入)のM注入から得られ得る。代わりに、M注入の各々は、様々のサンプル混合物を使用し得る。実施形態は、スペクトルが、様々なサンプル混合物の相当量の反復注入から発生されるデータ集合も利用し得る。
【0144】
保持整合技術は、産物イオンが誘導される前駆体イオンと厳密な結合を、産物イオンが保持するという原則による。この結合は、実質的に同じ測定保持時間で現れる産物イオンおよび前駆体イオンの両方によってそれ自体を明示し得る。保持整合技術は、選択された前駆体に未関連であるイオンが入力データ集合で分析されたスペクトルについての前述の結合を維持しないという事実を利用する。
【0145】
保持時間整合技術は、イオンの質量に使用されるとおりVenn交点の数学的操作を利用する。前駆体および産物イオンのような2つのイオンは、これらの質量が、所定の質量許容枠内にあり、および各々は、ここのいずれかに示されるとおり誤差枠サイズまたは保持時間枠によって決定されるのと同じ保持時間を有する場合に、関連するとみなされる。実施形態では、前駆体を産物イオンと整合させることに関連して使用される誤差枠サイズまたは保持枠は、質量スペクトルピークのクロマトグラフィーFWHMに関連し得るか、または他の許容は、入力データ集合でスペクトルを得るために使用されるMS装置のような装置の解像度に関連するとおりである。
【0146】
ここに示されるとおり、2つのイオンは、第一のイオンの第一の質量が第二のイオンの第二の質量の予め決められた質量許容内にある場合、同じ質量を有するとみなされ得る。この質量許容は、前駆体イオン並びに産物イオンに関してここに示される技術に関連して使用され得る。1つの実施形態では、質量許容は、百万分率(PPM)で表現される質量スペクトルで含まれ得るようなピークの+/−1/10のFWHMであり得る。他の質量許容は、実施形態と関連して使用でき、および実施形態で変化し得る。
【0147】
ここに示される保持時間整合技術を使用することの結果として、前駆体イオンに関連するとみなされる産物イオンのものを含む出力スペクトルが発生され得る。
【0148】
Venn交点を使用した保持時間整合のための技術は、これが所定の枠サイズ内に全Mスペクトルで現れる場合のみ、産物イオンが出力スペクトルで含まれるようにMスペクトルに適用され得る。代わりに、実施形態は、産物イオンが所定の枠サイズ内のMスペクトルの特定部分で現れる場合、産物イオンが出力スペクトル中に含まれるようにVenn交点を使用した保持時間整合を適用し得る。選択された部分サイズは、実施形態で変化し得る。
【0149】
ここに示される保持時間整合技術は、例えば、未関連イオンの数が、所与の前駆体に関連する産物イオンのものを非常に超過するスペクトルに使用し得る。これらの技術は、個別に考慮すると、現存のデータ解釈技術を使用して解釈するのには複雑すぎると特徴付けられ得るスペクトルを簡素化するために使用し得る。
【0150】
1つの実施例として、スペクトルは、共通の前駆体ペプチドから誘導される4つの産物イオンを含み得る。前述の4つの産物イオンは、スペクトル中に含まれ得て、さらに前駆体ペプチドに未関連である200の他の産物イオンも含む。ここに示される保持時間整合技術は、複数のスペクトルに適用でき、前述の4つの産物イオンおよび他の未関連産物イオンを含む。前駆体に未関連のイオンは、保持時間整合技術を適用する結果として発生される出力スペクトルに含まれない。例えば、ここに示される保持時間整合技術は、共通の前駆体に関連した前述の4つの産物イオンが、このようなものとして同定され得る3つのスペクトルを含む入力集合に関連して使用され得る。信頼性のある整合のために必要とされるスペクトルの数は、実施形態に特に前駆体および他の因子で変化し得る。前駆体質量およびここで技術の結果として発生される簡素化された出力スペクトルで見られる関連産物イオンの4つの質量を考慮すると、検索エンジンは、ペプチドを同定するときに使用され得る。このような検察エンジンは、例えば、Matrix Sciencesから得られるMASCOTを含み得る。別の例として、ここに示される技術は、2つ程度に少ない入力スペクトルを含む入力データ集合を利用し得る。入力スペクトルの各々は、目的の前駆体、および目的の前駆体と結合した単独程度に少ない産物イオンを含み得る。
【0151】
LC/MSに関して、保持時間整合技術は、産物イオンのもの、および産物イオンが誘導される関連前駆体イオンを見出し、および同じ保持時間およびピーク形状を有する。ここに示される技術は、前駆体との産物イオンの結合を提供し、および実質的に同じ測定保持時間を有する産物イオンおよび前駆体が、保持時間調整に基づいて出力スペクトルに含まれることを保障する。
【0152】
スペクトルに加えて、ここに示される技術に関連して使用される入力データ集合は、イオンのリストでイオンを含み得る。イオンのリストは、例えば、LC/MSまたは他の実験およびプロセシング方法論を利用して獲得され得るような三次元データから得ることができる。イオンのリストに含まれる各イオンは、イオンの保持時間、質量またはm/z、および/または強度によって注釈付けされ得る。三次元データが利用されるような例では、スペクトルは、例えば、ここで参照により組み込まれる2004年11月16日に提出され、「Method of Using Data Binning in the Analysis of Chromatography/Spectrometry Data」と題されるPlumbら、US特許公開第2005/0127287号、または2005年2月11日に提出され、Gorensteinらによって、「Apparatus and Method for Identifying Peaks in Liquid Chromatography/Mass Spectrometry Data and for Forming Spectra and Chromatograms」と題されるPCT国際公開第PCT US2005/004180号で示されるとおり、例えば保持時間保存を使用して得ることができる。
【0153】
Venn交点を使用して前駆体および産物イオンを整合させるために示される保持時間整合技術は、多様な異なる領域に適用でき、および多様な異なる方法論と関連して使用され得る。例えば、これらの技術は、プロテオミクスおよび小型分子研究で使用され得る。これらの技術は、サンプルの反復注入で前駆体および関連産物イオンを検出するために、および注釈付けされたペプチドカタログのようなデータベースでのこのような情報の保存に使用され、およびペプチドプロファイルで含まれ得る。このような保存情報は、未知サンプルの特徴に対する比較のためにデータ保存から抽出され得る。このような保存情報は、未知サンプルを検出、同定、および/または定量化するために使用され得る。
【0154】
ここに示される技術に関連して、1回の注入で同じ保持時間を有する複数の前駆体が、わずかに異なる保持時間を有することが分かり、および複写条件下でさえ他の注入は、例えば、Bateman技術を利用して測定され得るとおりである。したがって、複数の前駆体と関連した産物イオンは、第一の注入で単一の保持時間を有する可能性があり、および複数の前駆体は、他の注入でわずかではあるが、しかし測定可能な異なる保持時間を有し得る。結果として、第一の注入での第一の保持時間を有し得る産物イオンは、複写条件下でさえ、連続注入でわずかに異なる保持時間を有し得る。ここに示される技術は、前駆体および産物イオンの間の測定された保持時間での差が、特定数の実験について誤差または閾値の特化された保持時間枠以内である限り、これにより産物イオンは、前駆体と結合し得るという事実を有利に利用する。さらに、ここで示される技術は、未関連産物イオンが、特定数の実験についての前述の保持時間枠または閾値内にとどまらないという事実を利用する。したがって、保持時間整合についての前述の技術は、前駆体に関して未関連であるものから関連している産物イオンを分離するために準備する。
【0155】
前述の技術は、入力データ集合またはスペクトル内でのスペクトルピークの質量値を比較することに注目すべきである。前駆体および/または産物イオンのための質量値またはm/z値に関する先行の知識で、必要とされるものはない。さらに、ここに示される技術は、データベースまたはカタログをさらに注釈付けするために使用され得るが、所与のタンパク質についての配列の先行技術で、サンプルに関してここに示される技術を利用するために必要とされるものはない。
【0156】
ここで示される技術の結果として発生される出力は、スペクトルの形態にあり得る。スペクトルは、Venn交点を決定するための結果として含まれる前駆体および1つ以上の産物イオンを含み得る。生じる出力スペクトルは、未知ペプチドを同定するために検索に関連して保存、表示、使用され、保持時間は、様々の注入の間の強度比などに関連して書き込まれ、使用される。1つの実施形態では、複数の出力スペクトルが、同じ対の前駆体および産物イオンについて決定され得る。例えば、第一の実験は、第一の強度を有する第一の出力スペクトルを決定し得る。第二の実験は、第二の出力スペクトルを生じる複写条件下で様々の強度を有する同じサンプルについて行われ得る。大きな強度を有する出力スペクトルが保存され得る。
【0157】
ここで図10および図11に関して、示されるのは、前駆体およびこれの関連産物イオンの保持時間整合を行うことに関連して実施形態で使用され得るプロセシング段階の流れ図である。図10および図11の段階は、ちょうど示されたプロセシングを要約する。段階1002で、入力データ集合を得る。ここに示されるとおり、入力データ集合は、複数の注入から得られるデータを含み得る。スペクトルは、例示のための流れ図1000および1050の段階に含まれるが、入力データ集合は、イオンのリストおよびスペクトルを含む多様な異なる形態のいずれか1つ以上にあり得る。段階1004で、入力データ集合の第一のスペクトルを選択する。第一のスペクトルは、参照スペクトルとして照会され得る。第一のスペクトルを得る上で使用された注入は、参照注入としてここに参照され得る。参照スペクトルについての前駆体を決定する。1つの実施形態では、1つ以上の前駆体が、最大質量および強度を有するイオンのものとして決定され得る。流れ図1000および1050に関連して例示の目的のために、単一の前駆体のみが、入力データ集合の各スペクトルに含まれることが推測される。ここで示されるとおり、Bateman技術に関連しているように、様々の方法論が、目的の選択された前駆体の質量を決定するために利用され得る。Bateman技術に関して、前駆体の質量は、LE走査を使用して発生される得られたスペクトルを試験することによって決定され得る。
【0158】
この第一のスペクトルまたは参照スペクトルで、予測される保持時間誤差枠または閾値内の第一の保持時間を有する産物イオンは、前駆体についての産物イオン候補として特徴付けられ得る。ここに示される共通の保持時間整合技術のプロセシングを行った後、産物イオン候補の内のどれが、前駆体イオンと整合または結合されるかが分かる。
【0159】
参照注入の前駆体と同じ保持時間で起こる参照注入の産物イオンを決定するときに、保持時間の予測される誤差枠内で起こる全産物イオンを考慮する。例えば、前駆体は、参照注入でT1の保持時間を有し得る。第一の産物イオンは、T1およびT1+/−予測される誤差枠または保持時間枠内に入る保持時間を有し得る。第一の産物イオンは、前駆体についての産物イオン候補として考慮される。第一の産物イオンが、T1+/−予測された誤差枠または保持時間枠の範囲の外側にある測定された保持時間を有する場合、これにより、第一の産物イオンは、候補として考慮されない。前述の予測された誤差枠は、ここで示されるVenn交点プロセシングを行うときに、標的注入で前駆体に産物イオンを整合させることに関連した連続プロセシング段階でも使用される。標的注入は、参照注入以外の入力データの注入に言及し得る。標的注入は、頂上試験段階1006で形成されるループ中での流れ図1000でプロセシングされる残りのスペクトルを発生する上で使用され得る。
【0160】
段階1006で、決定は、入力データ集合での全スペクトルがプロセシングされたかどうかについてなされる。そうでなくても、制御は、可変性最新スペクトルが、入力データ集合での次のスペクトルに割り当てられる段階1010に前進する。段階1012で、最新スペクトルについて前駆体および産物イオンを決定する。参照スペクトルの前駆体として同じ質量および保持時間(第二の閾値または枠内で)を有するイオンについて最新スペクトルを検索する。参照スペクトルに存在する産物イオンが、最新スペクトルでも現れることに注意すべきである。
【0161】
ある実施形態は、段階1012プロセシングでのような標的注入での特定の質量を有する前駆体を検索するときに使用される時間の枠を表す前述の第二の閾値または枠も利用し得る。例えば、保持時間T1で質量m1を有する前駆体が、参照注入で決定され得る。連続標的注入に関して、プロセシングは、同じ質量m1およびT1+/−第二の枠または閾値の保持時間を有するイオンについて検索する。第二の閾値または枠は、経験的に決定され得て、および実施形態によって変化し得る。例えば、実施形態は、2−3クロマトグラフィーピーク幅に基づくような当初の値を第二の閾値に割り当て得る。第二の閾値は、システムの経験的な実験によって修飾または改良され得る。例えば、実施形態は、多量の誤差または雑音を導入するシステムまたは方法論を利用する場合、第二の閾値または枠が増大され得る。
【0162】
段階1012プロセシングに関連して、最新のスペクトルでの前駆体は、質量であると識別され、および同じ質量を有する段階1004の参照または第一のスペクトルでの前駆体に整合されることにも注意すべきである。第一のスペクトルでの前駆体の第一の質量は、第一の質量が、第二の質量の特定の質量許容内にある場合、最新のスペクトルでの前駆体の第二の質量と同じ質量であるとみなされ得る。
【0163】
段階1014で、最新のスペクトルの前駆体を、参照スペクトルの前駆体と時間調整でき、および最新のスペクトル中の全産物イオンを、適切に、およびそれ相当に時間移行させる。例えば、参照スペクトル中の前駆体の保持時間は、10.0分であり、および最新のスペクトル中の前駆体の保持時間は、9.8分である場合、最新のスペクトル中の前駆体および産物イオンの保持時間は、+0.2分移行される。いったん移行が完了すると、制御は、誤差または閾値許容の予測保持枠以内にある最新スペクトル中の産物イオンが、測定される段階1020に進行する。段階1020で、誤差の予測枠内にある特定の産物イオンは、後期プロセシング段階で使用するために記録され得る。
【0164】
流れ図1000および1050のプロセシング段階は、産物イオンが前駆体を整合されるように定量化するために含まれなければならないというスペクトルの所定の数または部分を特定するために使用され得る段階を説明することに注意すべきである。所定の数または部分は、入力データ集合中のスペクトルの総数に等しいか、またはより少ない可能性がある。例えば、ここで示されるとおり、実施形態は、入力データ集合での総数より少ないスペクトルの閾値または最小数を特定し得る。候補の産物イオンが、少なくとも、前駆体の保持時間についての誤差の予測枠内でスペクトルの特定の閾値数に含まれる場合、これにより候補産物イオンは、前駆体と結合していると決定され得る。
【0165】
その後、制御は、段階1020から段階1006に進行する。
【0166】
段階1006での決定が「はい」と評価する場合、制御は、段階1051に進行する。段階1051では、所定の質量許容枠による特徴的な産物イオンのリストを決定する。段階1020で測定されるとおり入力データ集合の第一または参照スペクトルおよび連続スペクトル中に含まれる産物イオンを試験する。第一の質量および第二の質量が、所定の質量許容枠内にある場合、第一の質量を有する1つのスペクトル中の第一の産物イオンは、第二のスペクトル中の別の産物イオンと同じ質量を有するとみなされ得る。ここに示される技術と関連して、第一および第二の産物イオンは、2つの異なるスペクトル中の同じ産物イオンであるとみなされ得る。段階1051から、制御は、段階1052に進行する。段階1051で決定されるとおり各産物イオンについては、各産物イオンが、誤差の保持時間枠内に前駆体の保持時間を有すると決定される入力データ集合から得られるスペクトルの数が要約される。段階1054で、最新産物イオン変数は、第一の産物イオンに設定される。段階1056で、測定は、産物イオンが、スペクトルの閾値または所定の数について前駆体(例えば、誤差の保持時間枠内)と実質的に同じ保持時間を有するかどうかについて行われる。言い換えると、実施形態が、「M」でのスペクトルの閾値数を特定する場合、産物イオンは、「はい」と評価する段階1056の順序で、「M」スペクトルについての保持時間枠内の前駆体と同じ保持時間を有しなければならないことを示す。段階1056が「はい」と評価する場合、制御は、産物イオンが前駆体との結合または整合を決定される段階1058に進行する。段階1058から、制御は、段階1062に進行する。段階1056が「いいえ」と評価する場合、制御は、産物イオンが、前駆体と結合または整合されないと決定される段階1060に進行する。
【0167】
制御は、候補産物イオンが全て、プロセシングされたかどうかについて決定がなされる段階1062に進行する。そうである場合、制御は、出力スペクトルを発生する段階1064に進行する。ここでどこかで示されるとおり、発生された出力は、イオンのリストのようなスペクトル以外の形態であり得る。段階1064で発生される出力スペクトルまたは他の出力は、前駆体と実質的に同じ保持時間およびピーク形状を有することによって前駆体と結合されると決定された産物イオンを含み得る。ここに示されるとおり、産物イオンは、入力データ集合から閾値数のスペクトルを含む条件によって決定された候補である。候補産物イオンが、閾値数のスペクトルについての誤差の保持時間の予測枠内の保持時間を有すると決定される場合、候補産物イオンは、保持時間を有する前駆体と同じ保持時間を有するとみなされる。段階1062が、「いいえ」と評価する場合、制御は、最新産物イオン変数が、実験されるべき次の産物イオンに割り当てられる段階1066に進行する。
【0168】
ここに示される技術は、ここで、別の図面で示される。例示の簡素化のために、ここに示される技術が、複数の前駆体が共通の保持時間を有するサンプルと結合して使用され得るが、単一の前駆体のみが示される。
【0169】
ここで図12に関して、示されるのは、参照注入のグラフ表現である。この例1100では、前駆体1102および産物イオン1102、1104、1106、1108、1110および1112は、1114によって示されるとおり1102の保持時間を有する。予測誤差の保持時間枠内の測定された保持時間を有する全イオンが考慮されることに注意すべきである。
【0170】
ここで図13Aに関して、示されるのは、別の注入のグラフ表現である。例1120の注入は、第一の標的注入に言及し得る。この例1120では、標的注入についてのデータは、参照注入から得られる前駆体と同じ質量について、保持時間を検索される。保持時間についての検索は、上述のとおり第二の閾値または所定の枠に関して行われる。例1120で、前駆体1102は、1124によって示される保持時間を有するとおり示される。図13Bでは、示されるのは、参照注入から得られる前駆体の保持時間によって、第一の標的注入の調整または正規化である。参照注入および第一の標的注入から得られる前駆体を割り当てる。したがって、産物イオンも、移行される。参照注入について示されるとおり、標的注入の前駆体は、最大の質量および強度を有する1つ以上のイオンのものとして決定され得ることに注意すべきである。例1124に関連して、産物イオン1104および1106は、前駆体と同じ1114の保持時間を有しないことに注意を払うこと。残りの産物イオン1108、1110および1112は、保持時間の誤差の予測枠内で保持時間1114を有する。
【0171】
ここで図14Aに関して、示されるのは、第二の標的注入のグラフ表現である。この例1140で、第二の標的注入についてのデータは、前駆体イオンを決定するために、参照注入から得られる前駆体と同じ質量について保持時間を検索される。前駆体イオンを決定するための前述の検索は、図13Aと関連して示されるとおりのものと類似の方法で行われる。例1140では、前駆体1102が、1142の保持時間および図13A中の前駆体1102として実質的に同じ質量(例えば、質量許容内で)として示される。図14Bでは、示されるのは、参照注入から得られる前駆体の保持時間による第二の標的注入の調整または正規化である。参照注入および第二の標的注入から得られる前駆体を、保持時間1114で調整し、したがって、産物イオンの各々も移行される。例1144では、産物イオン1106が、例えば、ここのどこかに示されるとおり質量スペクトルピークの+/−1/10番目FWHMを使用して測定され得るときに、予測誤差の保持時間枠内に保持時間1114を有しないように示されることに注意を払うこと。
【0172】
ここに示される技術を使用して決定されるとおり前駆体および結合産物イオンを含む出力スペクトルの例は、図15で示される。
【0173】
前述の例に基づいて、産物イオン1108、1110および1112のみが、1122によって示される保持時間を有する前駆体イオン1102と整合または結合されることが決定され得る。産物イオン1104および1106は、第一の標的注入での1114に関して予測誤差の保持時間枠内になかった。産物イオン1106は、第二の標的注入での1114に関して予測誤差の保持時間枠内になかった。
【0174】
保持時間整合を行うための前述の技術は、ペプチドカタログのようなデータベースまたはカタログを注釈付けするために使用され得る。当分野で既知のとおり、例えば、タンパク質配列データベースは、最初に得られ、およびデータ保存デバイスに保存され得る。データベースは、ちょうど示された技術を使用して注釈付けされ得る。ペプチドデータベースは、特定のペプチドを含むイオンのもののような情報を含む。ここで示される技術は、例えば、タンパク質を特徴付けまたは同定するために、データベースに列挙されるもののイオンのどれがタンパク質プロファイルと関連して使用されるかをさらに同定するデータベースを注釈付けするために使用され得る。例えば、タンパク質を含み、およびタンパク質の配列中の20のトリプシンペクチドを同定するペプチドデータベースがあり得る。これらの20のペプチドの例えば10のような部分のみがイオン化され、およびタンパク質を同定するために前駆体として使用され得ることがあり得る。ここに示される技術を使用して、ペプチドデータベースは、10の内の3つの最大強度前駆体を示すために注釈付けされ得る。3つの最大強度前駆体は、ここでどこかで示されるのと同じくらいプロファイリングと関連して、タンパク質を同定するために使用され得る。ペプチドデータベースは、例えば、ここに示されるようにVenn交点プロセシングを用いた保持時間整合技術を使用して同定もされるほど前駆体の各々について産物イオンを同定するためにさらに注釈付けされ得る。
【0175】
単一のスペクトルが、同じ保持時間を有する1つより多い前駆体を有する入力データ集合と関連して、参照注入が決定され得る。このようなスペクトルは、例えば、分析された混成サンプルと関連して発生され得る。各前駆体の質量は、参照注入から測定され得る。例として、第一の質量m1を、第一の前駆体と結合させ、および第二の質量m2を、第二の前駆体と結合させる。複数の標的注入は、各前駆体に関して試験され得る。標的注入は、質量m1を有し、および特定の第二枠または閾値内の保持時間を有するイオンについて検索され得る。このようなイオンは、標的注入で第一の前駆体であることが決定される。標的注入での第一の前駆体についての保持時間を測定し、および参照注入での第一の前駆体の保持時間で調整される。調整および他のプロセシング段階は、どの産物イオンが第一の前駆体と結合または整合されるかを決定するために、標的注入の各々についてここで示されるとおりに行われ得る。同じ集合の標的注入は、質量m2を有する第二の前駆体に関してもプロセシングされ得る。質量m1を示す第一の前駆体に関して説明されるとおりのものに類似の方法で、標的注入は、質量m2を有し、およびここのどこかに示されるとおり第二枠または閾値内の保持時間を有するイオンを検索し得る。標的注入での第二の前駆体についての保持時間を測定し、および参照注入における第二の前駆体の保持時間で調整される。調整および他のプロセシング段階は、どの産物イオンが、第二の前駆体と結合または整合されるかを決定するために、標的注入の各々についてここで示されるとおりに行われ得る。このように、標的注入の各々で、前駆体の各々と実質的に同じ保持時間で生じる適切な産物イオンを試験およびプロセシングし得る。
【0176】
1つより多い前駆体を含むスペクトルを用いたこれらの技術の使用をさらに示すために、図16および図17を参照する。
【0177】
図16において、示されるのは、参照注入について発生され得る例のスペクトルである。例1200では、要素1202および1204が、1240によって示される保持時間を有する前駆体であることを決定し得る。要素1202および1204は、他のイオン1208、1210および1212と関連してこれらの大質量および強度によって前駆体であることが決定されるイオンを表し得る。参照注入では、どの産物イオン1208、1210および1212が、どの前駆体と結合し得るかはまだ明らかでない。第一の標的注入は、図17でグラフで示される。前駆体1202について第一の標的注入のプロセシングを行うときに、第一の注入は、1202の質量を有し、および1240によって表される保持時間の第二枠または閾値内の保持時間を有するイオンについて検索され得る。この第一の標的注入で、1202の質量を有する前駆体は、保持時間1240でも起こる。しかし、この標的注入では、1208ではなく、産物イオン1210および1212のみが、予測誤差の特定枠内の保持時間1240で起こる。このようなものとして、産物イオン1208は、前駆体1202と結合または整合させられないかもしれない。前駆体1204に関して第一の標的注入を使用して分析を行うとき、第一の標的注入を、1204の質量を有し、および1240によって示される保持時間の特定枠内の保持時間を有するイオンについて検索する。この例では、1204の質量を有するイオンは、保持時間1260で起こる。産物イオン1208のみが、予測誤差の特定枠内の保持時間1260で起こる。このようなものとして、産物イオン1210および1212は、前駆体1204と結合または整合されないかもしれない。
【0178】
異なる保持時間を有する2つの前駆体、並びに産物イオンは、1回の注入で同じ測定保持時間を有し得る。しかし、2つの前駆体、並びにこれらの個別の産物イオンは、繰返し実験で1/10番目ピーク幅のような誤差の枠の外側で異なる測定保持時間を有する。したがって、単一の注入で外見上は関連があるイオンの一部は、繰返される実験を通して関係がないことが示され得る。
【0179】
同じ保持時間およびピーク形状を有する前駆体イオンおよびこれの1つ以上の関連産物イオンが、共通の保持時間実体(CRTE)と称される。保持時間整合についてここで示される技術を使用して、単一の注入で単一のCRTE中に外見上は含まれるイオンは、連続注入の保持時間での差に基づいた2つ以上の分類またはCRTEを含むために示され得る。
【0180】
ここで示されるとおり、実施形態は、場合により、質量分析計によってプロセシングする前に、入力サンプルのプロセシングを行い得る。このようなプロセシングは、実施形態での液体クロマトグラフィー分離により分離を完了または置換し得る。1つの実施形態では、サンプルは、ペプチドまたはタンパク質のような1つ以上の分子の混合物であり得る。質量分析を行う前に、実施形態は、二次元ゲル電気泳動(2DE)を使用して混合物中の種々のタンパク質を分離し得る。生じたスポットは、タンパク質を、切除および消化して、より短いポリペプチド鎖に分解し得る。これらの消化物は、質量分析を介して分析され得る。この特定の例では、物質は、例えばペプチドまたはタンパク質のような1つ以上の分子の混合物であり得る。タンパク質を含む入力サンプルまたは物質は、酵素的消化プロセシングの一部として消化され得る。この酵素的消化プロセシングは、サンプル中のタンパク質をより短いポリペプチド鎖に分解する1つの型の分離プロセシングである。続いて、消化物は、その後、例えば、上に示されるとおりの液体クロマトグラフィー(LC)、2Dゲル分離などのような別の分離プロセシング技術を使用してさらに分離され得る。一般に、いずれかの分離技術および/または消化技術は、例えば分子量、電界などによって種々のポリペプチドを分離するために使用され得ることを注意すべきである。前述の分離は、場合により、質量分析を受ける前に、サンプルに、実施形態で行われ、およびスペクトルまたは保持時間整合のために入力データ集合中に含まれ得る他の形態のデータを発生し得る。
【0181】
ここで使用される場合、2つの測定保持時間は、2つの測定保持時間が、前駆体を産物イオンと整合させる際に使用するために上で示されるような予測誤差の枠内にある場合に、実質的に同じと特徴付けられ得ることに注意すべきである。前駆体および産物イオンは、実際の測定保持時間が予測誤差の枠内で変化し得る場合でさえ同じ保持時間を有するようにみなし得る。
【0182】
保持時間整合のための技術は、例えばタンパク質混合物の分画のようなここで示される分画技術を使用してプロセシングされるサンプルに適用され得ることにも注意すべきである。
【0183】
図10および図11で示されるような実施形態で行われるプロセシング段階は、コンピュータプロセッサによって実施されるコードの結果として行われ得る。コードは、多様な異なる形態のコンピュータ読取可能媒体、メモリーなどの内のいずれか1つに保存され得る。
【0184】
1つの実施形態でここで示される技術に関連して、混合物中の分子を、液体クロマトグラフィーで分離し、および未修飾形態で溶出し得る。前述の分子は、LC/MSシステムで1つ以上のイオンを発生でき、および当初の分子とも称され得る。電気噴霧または他のイオン化プロセシング、並びに実施形態で含まれ得るような他の任意のプロセシングにかけるときに、当初の分子の生じる質量スペクトルは、1つより多いイオンを含み得る。複数のイオンは、例えば分子のアイソトープ分布、イオン化によって発生される異なる荷電状態、および/またはイオンに適用される断片化機構、または続いてLCから溶出することが課される他の修飾から生じ得る。したがって、当初の分子は、1つ以上のイオンを発生し得る。ここで示される技術に関連して、同じ当初の分子から誘導されるイオンのピーク形状および保持時間は、一致し、および同じとみなされる保持時間を含む測定値を有する。
【0185】
ここで技術に関連して示されるとおりのイオンのリストは、1つ以上の生のデータを含み得る。1つの実施形態では、イオンリスト中の各生データは、イオンを示す保持時間、質量/電荷、および強度を含む。イオンリスト中の各イオンについてのデータは、多様な異なる技術の内のいずれか1つを使用して得られ得る。例えば、1つ以上のイオンについてのデータは、LEまたはHE状態でのBateman技術を使用して得られ得る。イオンリストは、各生データが、LEまたはHE獲得状態を使用して得られ得るような保持時間、mwHプラス、強度、および荷電状態を含む正確な質量保持時間実体(「AMRT」)としてここに関連して実体のリストにも言及する。AMRTは、Silvaらによる「Quantitative Proteomic Analysis by Accurate Mass Retention Time Pairs」、Anal.Chem.、77巻、2187から2200頁(2005)でさらに詳細に説明される。
【0186】
保持時間整合のためにここで示される技術に関連して使用される入力データ集合で含まれるスペクトルは、イオン(またはAMRT)のリストを含有でき、各々は、m/z(またはmwHプラス)および強度によって示される。実施形態は、質量分析計によって収集されるとおり単回走査で得たデータを含む第一の技術を使用して入力データ集合にスペクトルを得ることができる。この場合には、スペクトルについてのイオンリストは、スペクトルで見られ得るとおり、質量スペクトルピークに対応し、およびスペクトルの保持時間は、スペクトル走査の獲得時間である。代わりに、スペクトルは、2005年2月11日に提出され、Gorensteinらによる「Apparatus and Method for Identifying Peaks in Liquid Chromatography/Mass Spectrometry Data and for Forming Spectra and Chromatograms」と題されるPCT国際出願第PCT US2005/004180号で示されるとおり、保持時間および保持時間枠を選択すること、およびこの保持時間が示されるとおりこの枠内に入るイオンリストから全イオンを収集することによって得られ得る。スペクトルの保持時間は、例えば、FWHMで測定されるクロマトグラフィーピーク幅の+/−1/10として表される枠の中間にある保持時間であると決定され得る。
【0187】
ここで示される保持時間整合技術に関連して使用される入力データ集合に含まれるスペクトルは、例えばこの質量または強度が特定の範囲外に入るイオンを除去することによる(またはAMRTS)ように濾過され得ることに注意すべきである。
【0188】
ここで保持整合技術に関連して、出力スペクトルは、1つ以上の出力規則による形態で発生され得る。例えば、上に示されるとおり、第一のスペクトルでの産物イオンは、第一の測定質量を有することができ、および入力データ集合の第二のスペクトル中の同じ産物イオンは、第二の測定質量を有し得る。第一および第二の測定質量は、これらが定義された質量許容内にある場合、同じ質量であるとみなされ得る。出力スペクトルでは、産物イオンについての質量は、例えば、出力スペクトルでの質量出力が第一および第二の測定質量の平均でありうるような規則により出力され得る。出力スペクトルは、例えば、第一または第二のスペクトルのいずれかから得られる質量から唯一なり得る。他の実施形態は、出力スペクトルに含まれる値を決定するために他の技術を使用し得る。
【0189】
保持整合技術で使用される入力データ集合に含まれる1つ以上のスペクトルは、多様な異なる源から来る可能性がある。上に示されるとおり、スペクトルは、1つ以上の実験から多様な異なる方法で発生され得る。スペクトル、または入力データ集合中に含まれる他の形態のデータは、データベースまたは他のデータ保存からも来る可能性がある。例えば、先の実験から得られるデータは、データベース中に保存され得る。データベースから得られる先の実験データは、単独で、または追加の新たなデータと合わせて、入力データ集合中に含まれ得る。データベースまたは他のデータ保存中に含まれるデータは、ここに示される技術と関連して使用するための理論的または模倣実験データを含み得る。例えばMS/MSスペクトルのデータ依存性獲得(DDA)を使用して獲得されるスペクトルが含まれる。
【0190】
入力データ集合を得るために使用されるサンプルがタンパク質の混成混合物である実施形態では、異なるタンパク質から得られるイオンは、保持時間で重複し得る。このようなデータについては、単独注入での最大強度を選択すること、およびこの最大強度イオンの保持時間枠内の全イオンのスペクトルを形成することによって、保持時間整合技術が適用され得る。したがって、この最大強度イオンは、ここに示されるとおり両方の注入での前駆体についての質量および保持時間(例えば、上で示されるとおり特定された質量許容内の各注入の質量、および第二の閾値または枠内にある各注入の保持時間)を整合させることによって、タンパク質の実質的に同じ混合物の連続注入で見られ得る。
【0191】
ここで示されるものの多様性、修飾、および他の手段は、請求された本発明の精神および範囲から逸脱することなく、通常の当業者においても起こり得る。したがって、本発明は、前述の例示の説明によってではなく、その代わりに、請求項の精神および範囲によって定義されるべきである。
【図面の簡単な説明】
【0192】
【図1】本発明の1つの実施形態による化合物の化学分析を行う方法の流れ図である。
【図2】図1の方法に関連する方法の部分的流れ図である。
【図3】本発明の1つの実施形態による化学分析の方法の流れ図である。
【図4】本発明の1つの実施形態により、サンプルトランスアロダーゼから得られる例のプロファイルの三次元画像図である。
【図5】イオン質量の関数として前駆体イオンおよび産物イオンの強度を示す、図4のプロファイルの二次元棒グラフである。
【図6】保持時間の関数として前駆体イオンおよび産物イオンの強度を示す、図4のプロファイルの二次元棒グラフである。
【図7】図4のプロファイルの包括図に対応する二次元プロットである。
【図8】本発明の1つの実施形態による化学分析の方法の流れ図である。
【図9A】本発明の1つの実施形態によるLC/MSシステムのブロック図である。
【図9B】本発明の1つの実施形態による質量スペクトルの収集を示す3つの関連グラフを示す。
【図10】本発明の1つの実施形態による、前駆体およびこれの関連産物イオンの保持時間整合性に関するプロセシング段階の流れ図である。
【図11】本発明の1つの実施形態による、前駆体およびこれの関連産物イオンの保持時間整合性に関するプロセシング段階の流れ図である。
【図12】本発明の1つの実施形態による、参照注入のグラフ表示である。
【図13A】本発明の1つの実施形態による、第一の標的注入のグラフ表示である。
【図13B】共通の前駆体による、図13Aの第一の標的注入および図12の参照注入の調整または正規化のグラフ表示である。
【図14A】第二の標的注入のグラフ表示が示される。
【図14B】共通の前駆体による、図14Aの第二の標的注入および図12の参照注入の調整または正規化のグラフ表示である。
【図15】本発明の1つの実施形態による、前駆体および関連産物イオンを含む出力スペクトルのグラフ表示である。
【図16】本発明の1つの実施形態による、参照注入のグラフ表示である。
【図17】図16の参照注入を用いた分析のための第一の標的注入のグラフ表示である。

【特許請求の範囲】
【請求項1】
前駆体イオンを、1つ以上の関連産物イオンと整合させる方法であり、複数の注入から得られる複数の入力データ集合(複数のデータ集合の各々は前駆体イオンおよび1つ以上の産物イオンを含む)を提供すること、
前記前駆体イオンについての単一の保持時間によって、前記複数の入力データ集合を正規化すること、
前記複数の入力データ集合の各々について、どの産物イオンが、前記前駆体イオンについての前記単一の保持時間に関して所定の保持時間枠内にあるかを決定すること、および
産物イオンが、特定数の前記複数の入力データ集合について所定の保持時間枠内にある場合、前記産物イオンが、前記単一の保持時間を有する前記前駆体イオンに関連していると決定することを含む、方法。
【請求項2】
前記複数のデータ集合の各々が、複数の前駆体イオンを含み、および
前記正規化することが、さらに、
前記単一の保持時間で、前記複数の入力データ集合の各々の中の各前駆体イオンを整列すること、および前記各前駆体イオンが、前記整列することによって移行される量によって、前記複数の入力データ集合の前記各々中に産物イオンを合わせて移行させることを含む、請求項1の方法。
【請求項3】
前記所定の保持時間枠が、幅および閾値を使用して決定される、請求項1の方法。
【請求項4】
前記幅が、前駆体イオンの質量スペクトルピークの半値全幅ピークとして決定されたクロマトグラフィーピーク幅である、請求項3の方法。
【請求項5】
前記閾値が、前記幅の1/10であること、および前記所定の保持時間枠が、前記幅から前記閾値を引くことによって決定される下部限界を有すること、および前記所定の保持時間枠が、前記幅に前記閾値を加えることよって決定される上部限界を有する、請求項3の方法。
【請求項6】
前記複数の注入が3である、請求項1の方法。
【請求項7】
さらに、現存のデータ保存を、前記前駆体イオンおよび前記1つ以上の産物イオンについての情報で注釈することを含む、請求項1の方法。
【請求項8】
前記複数の注入についてと同じ質量値、および各注入内の前記所定の保持時間枠内の同じ保持時間を有する質量の集合を見出す、請求項1の方法。
【請求項9】
前記質量の集合が、1つ以上の前記複数の注入で異なる保持時間を有する、請求項8の方法。
【請求項10】
さらに、同じサンプルを使用して複数の反復注入を行うことを含む、請求項1の方法。
【請求項11】
さらに、複数の注入を行うことを含み、前記複数の注入の各々が異なるサンプルを利用する、請求項1の方法。
【請求項12】
前記複数の入力データ集合が、タンパク質混合物であるサンプルを使用して得られる、請求項1の方法。
【請求項13】
前記複数の入力データ集合が、血清であるサンプルを使用して取得される、請求項1の方法。
【請求項14】
前記複数の入力データ集合が、組織サンプルであるサンプルを使用して得られる、請求項1の方法。
【請求項15】
前記複数の入力データ集合が、複数のタンパク質を含むサンプルを使用して得られる、請求項1の方法。
【請求項16】
前記複数の入力データ集合が、単一のポリペプチドであるサンプルを使用して得られる、請求項1の方法。
【請求項17】
前記複数の入力データ集合の一部は、第一の低フラグメント化方式および第二の高フラグメント化方式を交互に行うこと、および前記第一の低フラグメント化方式についての第一のスペクトル、および前記第二の高フラグメント化方式についての第二のスペクトルを得ることによって、前記前駆体イオンを質量分析することによって生成される、請求項1の方法。
【請求項18】
前記複数の入力データ集合が、消化タンパク質であるサンプルを使用して得られ、および、さらに、
前記消化タンパク質についてLC/MSを行うことを含む、請求項17の方法。
【請求項19】
前記複数の入力データ集合が、タンパク質を含まないサンプルを使用して得られる、請求項17の方法。
【請求項20】
前記複数の入力データ集合の少なくとも一部が、スペクトルである、請求項1の方法。
【請求項21】
前記複数のデータ集合の少なくとも一部が、イオンのリストであり、前記イオンのリスト中の各イオンが、前記各イオンについての保持時間、強度、および質量または質量荷電比を含む情報で注釈される、請求項1の方法。
【請求項22】
前記複数の入力データ集合の少なくとも一部が、データビニング技術を使用して発生される、請求項1の方法。
【請求項23】
前記複数の入力データ集合の前記特定数が、3である、請求項1の方法。
【請求項24】
前記特定数が、前記複数の入力データ集合中の全入力データ集合より少ない、請求項1の方法。
【請求項25】
前記特定数が、前記複数の入力データ集合中の全入力データ集合である、請求項1の方法。
【請求項26】
前記複数の入力データ集合が、第一のタンパク質を含む少なくとも1つのサンプルを使用して得られ、およびさらに、
タンパク質プロファイルのカタログ(タンパク質プロファイルの各々が、タンパク質の同一性によって定義され、カタログが、前記第一のタンパク質についてのプロファイルを含む)を提供すること;および
第一のタンパク質についての情報(情報が、前記前駆体イオンおよび前記1つ以上の関連産物イオンについてのデータを含む)を加えることによって前記カタログを更新することを含む、請求項1の方法。
【請求項27】
さらに、前記カタログを使用して未知サンプルの1つ以上の未知タンパク質を同定することを含む、請求項26の方法。
【請求項28】
前記同定することが、
前記未知サンプルについての第一のデータを取得すること、および
前記第一のデータの一部を、前記カタログ中に含まれる前記前駆体イオンおよび前記1つ以上の関連産物イオンについての前記データと整合させて、前記第一のタンパク質を前記未知サンプル中に含まれているとして同定することを含む請求項27の方法。
【請求項29】
第一の質量を有する第一の入力データ集合中の第一の産物イオン、および第二の質量を有する第二の入力データ集合中の第二の産物イオンは、前記第一の質量が前記第二の質量の所定の質量許容枠内である場合に、同じ産物イオンであると決定される、請求項1の方法。
【請求項30】
サンプルを分析する装置であり、
クロマトグラフィーモジュール;
前記クロマトグラフィーモジュールと連携している質量分析計モジュール;および
前記クロマトグラフィーモジュールおよび前記質量分析計モジュールと連携している制御ユニットを含み、前記制御ユニットが、少なくとも1つのプロセッサ、および前記プロセッサによって実行される複数の指示を保存するためのメモリーを含み、前記複数の指示は、プロセッサに、
複数の注入から得られる複数の入力データ集合(複数のデータ集合の各々が、前駆体イオンおよび1つ以上の産物イオンを含む)を提供すること;
前記前駆体イオンについての単一の保持時間によって、前記複数の入力データ集合を正規化させること;
前記複数の入力データ集合の各々について、どの産物イオンが、前記単一の保持時間に関して所定の保持時間枠内にあるかを決定すること;および
産物イオンが、前記複数の入力データ集合の特定数について所定の保持時間枠内にある場合、前記産物イオンが、前記単一の保持時間を有する前駆体に関連していると決定することを実行させる、装置。
【請求項31】
前駆体イオンを、1つ以上の関連産物イオンと整合させるためのコードを搭載するコンピュータ可読媒体であり、
複数の注入から得られる複数の入力データ集合(複数のデータ集合の各々が、前駆体イオンおよび1つ以上の産物イオンを含む)を提供すること、
前記前駆体イオンについての単一の保持時間によって前記複数の入力データ集合を正規化させること、
前記複数の入力データ集合の各々について、どの産物イオンが、前記単一の保持時間に関して所定の保持時間枠内にあるかを決定すること;および
産物イオンが、前記複数の入力データ集合の特定数について所定の保持時間枠内にある場合、前記産物イオンが、前記単一の保持時間を有する前駆体に関連していると決定することのためのコードを含む、コンピュータ可読媒体。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9A】
image rotate

【図9B】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13A】
image rotate

【図13B】
image rotate

【図14A】
image rotate

【図14B】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate


【公表番号】特表2008−545972(P2008−545972A)
【公表日】平成20年12月18日(2008.12.18)
【国際特許分類】
【出願番号】特願2008−514969(P2008−514969)
【出願日】平成18年6月5日(2006.6.5)
【国際出願番号】PCT/US2006/021919
【国際公開番号】WO2006/133191
【国際公開日】平成18年12月14日(2006.12.14)
【出願人】(504438255)ウオーターズ・インベストメンツ・リミテツド (80)
【Fターム(参考)】