説明

混合物中のタンパク質を同定する方法および装置

試料102が、液体クロマトグラフ104で分離され、続いて質量分析計112で分析される、質量分析のためのシステムおよび方法。
【その他】 本願に係る特許出願人の国際段階での記載名称は「ウオーターズ・インベストメント・リミテツド」ですが、識別番号504438255を付与された国内書面に記載の名称が適正な名称表記であります。

【発明の詳細な説明】
【技術分野】
【0001】
本出願は、本明細書にその全体が参照によって組み込まれる、2004年5月20日出願の米国特許仮出願第60/572532号の利益を主張するものである。
【0002】
本出願は、「選択されたイオンクロマトグラムを用いて、前駆体およびフラグメントイオンをグループ化するシステムおよび方法」と題された、代理人文書番号WAA−393号を有する同時係属出願第PCT/US05/ 号に関連する。
【0003】
本発明は、一般にプロテオミクスに関する。より具体的には、本発明は、質量分析と組み合わせた液体クロマトグラフィを用いて、タンパク質および複合混合物中のペプチドを同定および定量することに加え、質量分析計において前駆体およびフラグメントイオンを生成する複合混合物中の分子を同定および定量することに関する。また、本発明は、質量分析と組み合わせた液体クロマトグラフィを用いて、混合複合物中のペプチドの保持時間を追跡することにも関する。さらに重要なことは、本発明は、前駆イオンの質量の存在を必要としないペプチド同定の方法を提供する。これによって、方法は、化学的に修飾されたペプチドおよび翻訳後に修飾されたペプチドの両方、対立遺伝子の違い、点突然変異体を含んだペプチドの他、照会されるデータベースに蓄積された配列の他のあらゆる修飾を同定することが可能となる。
【背景技術】
【0004】
プロテオミクスは、一般に、タンパク質の複合混合物に係わる研究に関する。プロテオミクスの分野には、生物系におけるタンパク質を研究することおよびカタログ化することを含む。プロテオミクス研究は、典型的には、タンパク質の同定、異なる条件間の相対存在量の差の決定、またはその両方に目を向けている。複合生体試料中のタンパク質を同定および定量することは、プロテオミクスにおいては基本的な問題である。
【0005】
質量分析と組み合わせた液体クロマトグラフィ(LC/MS)は、プロテオミクス研究において基本的なツールになっている。液体クロマトグラフィ(LC)により未処理のタンパク質またはそのプロテオライズされた(proteolyzed)ペプチド産物を分離し、次に質量分析(MS)により分析することは、多くの共通のプロテオミクスの方法論の基礎となる。タンパク質の発現レベルの変化を測定する方法は、バイオマーカーを見出すことおよび臨床診断法の基礎を成しうるので非常に関心がある。
【0006】
従来のプロテオミクス研究では、典型的には、未処理のタンパク質を直接研究するよりもむしろ、対象のタンパク質をまず消化して、タンパク質分解性のペプチドの特定のセットを生成する。次いで、得られたペプチドを、プロテオミクス分析中に特徴付けする。そのような消化に用いる共通の酵素はトリプシンである。トリプシン消化では、複合混合物中に存在するタンパク質は、開裂されてタンパク質分解酵素の切断特異性によって決定されるようにペプチドを生成する。観察されたペプチドの正体および濃度から、当技術分野では知られているアルゴリズムが、親タンパク質の正体および濃度を推定することができる。
【0007】
LC/MS分析では、このペプチド消化は、オンライン液体クロマトグラフィ(LC)分離に続いて、オンライン質量分析(MS)によって分離および分析される。理想的には、十分な精度で測定される単一のペプチドの質量は、ペプチドを一意的に同定するのに十分である。しかし実際には、達成される質量精度は、典型的には約10ppm以上である。一般に、そのような質量精度は、質量測定だけに基づいてペプチドを一意的に同定するのには十分でない。例えば、10ppmの質量精度では、約10個のペプチド配列は、典型的なデータベース検索で同定される。質量精度に関する検索の制限を下げて、化学的修飾または翻訳後修飾、HOまたはNHの損失、点突然変異等を考慮すれば、この配列数は著しく増大するであろう。配列のリポジトリは、典型的には、ホモロジーによって知られている基質へ注釈付けされた翻訳されたDNA配列を含む。したがって、ペプチドの配列を、欠失または置換のいずれかによって修飾する場合、前駆体質量のみによってそのペプチドに仮同定することは誤りになるはずである。
【0008】
さらに、2個のペプチドは、同じアミノ酸組成を有するが、配列は異なり得る。質量精度だけで、組成ではなく配列の異なるペプチドを区別するのに十分ではない。ペプチドをフラグメントイオンに破壊するフラグメント化法が知られている。これらのフラグメントは、元のペプチドのサブ配列に相当し得るが、他のタイプのフラグメントイオンが観察されるかもしれない。このデータのフラグメント質量を用いて、前駆体配列を確認または推定することができる。
【0009】
ペプチド前駆体の場合、サブ配列は、前駆体の単一ペプチド結合においてフラグメント化することにより生じ得る。このようなフラグメント化によって、2個のサブ配列が得られる。ペプチドC末端を含んだフラグメントがイオン化されると、Yイオンと呼ばれ、ペプチドN末端を含んだフラグメントがイオン化されると、Bイオンと呼ばれる。
【0010】
知られているタンパク質同定法は、LC/MS試験から得られた前駆体およびフラグメントの正確な質量保持時間(AMRT)データを用いてデータベースを検索する。例えば、そのようなデータを取得する方法は、Batemanへの米国特許第6717130号(以下「Bateman」)に記載されており、その全体を本明細書に参照によって組み込む。Batemanでは、ペプチド混合物の1回の注入のLC/MS分析の一部として適用される、高エネルギーおよび低エネルギー切り換えプロトコルを用いて、そのようなデータを取得することができる。このようなデータでは、低エネルギースペクトルは、主にフラグメント化されていない前駆体からのイオンを含み、高エネルギースペクトルは、主にフラグメント化された前駆体からのイオンを含む。
【0011】
そのようなデータにおいてタンパク質の存在を同定するために、(ペプチドまたはフラグメントからのそれらのイオンを実験的に記載する)AMRTが、低エネルギーデータから選択される。トリプシンが消化に用いられる場合、このAMRTは、トリプシン前駆体であると仮定される。このAMRTデータを用いて、知られている方法が、ペプチド質量のデータベースを検索して、質量が質量検索窓または閾値内にあるトリプシンペプチドを求める。
【0012】
データベースからの理論的なペプチド質量が、データ内で測定されたある前駆体の質量の質量検索窓内にある場合、ヒットしたとみなされる。すなわち、データの前駆体が、データベースのペプチドによってヒットした、または別法として、データベースのペプチドが、データの前駆体によってヒットした。
【0013】
この検索によって、データベースから一致する可能性のあるペプチドのヒットリストが得られる。これらの一致する可能性のあるデータベースのペプチドを、統計学的要因によって重み付けしてもよいし、しなくてもよい。このような検索の考えられる結果としては、一致する可能性のあるデータベースペプチドは、同定されないか、一致する可能性のある1つのデータベースペプチドが、同定されるか、あるいは一致する可能性のある2つ以上のデータベースペプチドが、同定されるということである。MSの分解能が高くなるほど、適した器具較正が想定され、ppm閾値が小さくなるほど、したがって同定の誤りは少なくなる。
【0014】
データベース中の理論上のペプチドに対して1つ以上のヒットがある場合、従来の検索は、高エネルギーのAMRTからのデータを用いて、可能性のある一致するデータベースのペプチドを検証する。高エネルギーのAMRTが、最初に検索されて、検証中の低エネルギーのAMRTと同じ保持時間にて生じる高エネルギーのAMRTを分離する。典型的には、分離された高エネルギーのAMRTは、保持時間が検証中の低エネルギーのAMRTと実質的に同じであるAMRTである。
【0015】
ヒットリストのデータベースのペプチド各々について、そのアルゴリズムは、前駆体の衝突誘起解離を通して取得され得る可能性のあるすべてのYイオンおよびBイオンの質量を決定する。対で、この分離された高エネルギーのAMRTデータが、これらのYイオンおよびBイオン各々について検索される。最大のヒット数を有するかまたは他の基準を満たすペプチド配列が、正確にヒットしたもの、すなわち標的前駆体の同定として戻される。この結果は、保存および表示され得る。
【0016】
消化混合物中の低エネルギーの各AMRTについて、この工程を繰り返すことができる。結果を格納し、結果を表示し、結果を定量し、他の注入の結果と結果を組み合わせることを含むさらなる分析を、結果に対して行うことができる。
【0017】
検索中、複数の電荷状態および複数の同位体を、検索することができる。また、イオン、すなわち電荷が減少されたAMRTを検索してもよい。さらに、実験的に生成された信頼規則を適用して、有効なヒットを同定することを支援し、より高い数の高エネルギーヒットを用いれば、さらに良い信頼が得られる。
【発明の開示】
【発明が解決しようとする課題】
【0018】
要約すると、LC/MSシステムによって取得されたデータのセットを考えると、知られたタンパク質同定法は、理論上のタンパク質配列のデータベースを検索して、そのデータ中のタンパク質を同定する。すなわち、知られたタンパク質同定法は、そのデータとともに開始され、データベースを検索する。対照的に、以下に記載の本発明は、データベースとともに開始され、データを検索する。
【課題を解決するための手段】
【0019】
従来のタンパク質同定法とは対照的に、本発明の実施形態は、(常にではないが一般に、タンパク質データベースから取得される)理論上のペプチド配列とともに開始され、該理論上のペプチド配列に相当する前駆体およびフラグメントイオンの証拠がないかどうかデータを検索する。十分な数のそのような質量が、共通の保持時間でデータ中に見付かれば、データ中でペプチド配列が同定される。この方法が、データ中に所与のタンパク質に関連する1つ以上のペプチド配列を見付けた場合、そのタンパク質は、試料中で同定されるとみなされる。
【0020】
本発明の実施形態は、事前に選択されたデータベースを利用してLC/MSシステムを用いて取得されたデータを検索する。例えば、本発明の一実施形態では、液体クロマトグラフ(LC)によって出力される溶離液が、ESIインターフェースを介して質量分析計(MS)に導入される。MSの第1の四重極(Ql)は、単にイオンガイドとして機能する。交流電圧が、衝突セルに印加される。スペクトルは、Batemanに記載されたような交流様式で、すべての前駆体およびそのフラグメントのすべてにおいて収集される。
【0021】
より具体的には、本発明の実施形態は、スペクトル低エネルギーモードと高エネルギーモードとの間で時間において均一に交番するスペクトルを収集する。高エネルギーのフラグメント化の前に適用されるMSスペクトルの選択はない。該高エネルギーモードスペクトルは、すべての前駆イオンのフラグメントイオンを含む。この交番するモードのデータ取得のデューティサイクルは高いので、検出された前駆体およびフラグメントすべてのクロマトグラフプロファイルが保存される。このデータ取得モードは、保持時間の決定または測定の他、低エネルギーモードおよび高エネルギーモードにおいて見られるすべてのイオンのm/zおよび強度決定または測定を可能にする。
【0022】
低エネルギーモードは、従来のLC/MS取得に相当する。高エネルギーモードは、本明細書では代替的に上昇エネルギーモードと呼ぶ。高エネルギーまたは上昇エネルギーモードは、LC/MS取得に相当する。低エネルギーモードは、一次前駆イオンのスペクトルを含む。高エネルギーモードは、一次フラグメントイオンのスペクトルを含む。
【0023】
用語
本明細書で用いられるように、以下の用語は指定された意味を有する。
タンパク質:単一ポリペプチドとしてまとめられたアミノ酸の特異的な一次配列。
ペプチド:タンパク質の一次配列内に含まれる、単一ポリペプチドとしてまとめられたアミノ酸の特異的配列。
トリプシンペプチド:トリプシンによるタンパク質の酵素学的切断から得られる、タンパク質配列から生成されるペプチド。これに続く説明では、消化ペプチドは、便宜上トリプシンペプチドと呼ぶ。しかし、本発明の実施形態は、ペプチド消化のための他の方法に適用されることを理解されたい。
前駆体ペプチド:タンパク質切断プロトコルを用いて直接生成される、トリプシンペプチド(または他のタンパク質切断産物)。試料からの前駆体ペプチドは、クロマトグラフで分離され、質量分析計に送られる。質量分析計では、イオン源が、これらの前駆体ペプチドをイオン化して、正電荷のタンパク化合された前駆体の形態を生成する。このような正電荷のタンパク化合された形態の質量は、前駆体のmwHPlusまたはMH+と呼ぶことができる。以下では、「前駆体質量」という用語を使用し、これは一般にイオン化されたペプチド前駆体のタンパク化合されたmwHPlusまたはMH+質量を指す。
フラグメント:複数のタイプのフラグメントが、MSスペクトルで生じ得る。トリプシンペプチド前駆体の場合、フラグメントは、未処理のペプチド前駆体の衝突フラグメント化から生成され、そのアミノ酸一次配列が元の前駆体ペプチド内に含まれた、ポリペプチドイオンを含み得る。YイオンおよびBイオンは、そのようなペプチドフラグメントの例である。トリプシンペプチドのフラグメントは、アンモニウムイオン、リン酸イオン(PO)などの官能基、特定の分子または分子のクラスから切断された質量標識、または前駆体からの水(HO)分子またはアンモニア(NH)分子「ニュートラルロス」も含み得る。
【0024】
YイオンおよびBイオン:ペプチドがペプチド結合においてフラグメント化する場合、また電荷がN末端フラグメントに保持される場合、そのフラグメントイオンは、Bイオンと呼ばれる。電荷がC末端フラグメントに保持される場合、そのフラグメントイオンは、Yイオンと呼ばれる。可能性のあるフラグメントおよびその命名のよりわかりやすいリストは、RoepstorffとFohlman、Biomed Mass Spectrom、1984年、11(11):601、およびJohnsonら、Anal.Chem1987年、59(21):2621:2625に提供されており、本明細書にともに参照によって組み込まれる。
【0025】
クロマトグラフプロファイル:LC/MS分析において、単一の前駆体またはフラグメントイオンに相当する単一の質量におけるクロマトグラフピークの強度対時間である。質量クロマトグラムは、そのような1つ以上のイオンのクロマトグラフプロファイルを含み得る。
【0026】
頂点保持時間またはクロマトグラフ保持時間:LC/MS分析中に、エンティティがその最大強度に達するときのクロマトグラフプロファイルのポイントである。
【0027】
イオン:各ペプチドは、構成要素の同位体の天然存在度に起因するイオンの集団として出現する。イオンは、保持時間およびm/z値を有する。質量分析計(MS)は、イオンのみを検出する。このLC/MS法は、検出されたどのイオンについても種々の観察された測定値を生成する。これには、電荷対質量比(m/z)m、保持時間、およびそのイオンの信号強度を含む。
【0028】
mwHPlus:ペプチドの中性のモノアイソトピック質量+1つのプロトンの重量1.007825amu。
【0029】
AMRT:正確な質量保持時間である。AMRTは、その質量、保持時間、および総強度の点のペプチドの経験的記載である。ペプチドがクロマトグラフカラムから溶出するとき、ペプチドは、特定の保持時間間隔にわたって溶出し、単一の保持時間(頂点保持時間)においてその最大信号に達する。イオン化および(場合によっては)フラグメント化の後に、ペプチドは、関連するイオンのセットとして出現する。このセット中の異なるイオンは、共通のペプチドの異なる同位体組成および電荷に相当する。この関連するイオンのセット内の各イオンは、単一の頂点保持時間およびピーク形状を生成する。これらのイオンは、共通のペプチドから生じるので、各イオンの頂点保持時間およびピーク形状は、ある程度の測定許容値内で同一である。各ペプチドのMS取得は、ある程度の測定許容値内ですべて同じ頂点保持時間およびピーク形状を共有する、すべての同位体および電荷状態に対して複数のイオン検出を生成する。
【0030】
LC/MS分離では、単一ペプチド(前駆体またはフラグメント)は、多数のイオン検出を生成し、複数の電荷状態ではイオンのクラスタとして出現する。そのようなクラスタからのこれらのイオン検出のデコンボリューションは、特定の保持時間においては、AMRTを生じながら、電荷状態の測定された信号強度の固有のモノアイソトピック質量の単一体が存在することを示唆する。
【0031】
その配列が、何であるのかは言うまでもなく、それが前駆体であるのか、フラグメントであるのか、または化学修飾されたペプチドであるのかを、AMRTから直接推定することはできない。ペプチド以外の分子を、AMRTを用いて記載することができる。
【0032】
タンパク質データベース:本発明の実施形態では、ユーザは、タンパク質のデータベースを選択するか、または供給する。あるいは、デフォルトのデータベースまたは他の所定のデータベースを用いてよい。各タンパク質は、アミノ酸のその一次配列によって記載される。どのデータベース(またはデータベースサブセット)を選択して、データと比較するのかはユーザの責任である。ユーザは、研究中のタンパク質と密接に一致することが意図されるデータベースを選択してもよい。例えば、大腸菌データベースは、大腸菌の細胞溶解物から得られたデータと比較されよう。同様に、ヒト血清データベースは、ヒト血清から得られたデータと比較されよう。ユーザは、サブセットデータベースを選択してよい。ユーザは、SwissProtに記載の全タンパク質などのスーパーセットデータベースを選択してよい。ユーザは、アミノ酸の無作為な配列によって記載された、シミュレートしたタンパク質を含むデータベースを選択してよい。このような無作為のデータベースを対照試験に用いて、タンパク質同定システムを評価および較正し、アルゴリズムを検索する。ユーザは、自然に存在する配列または人工配列の両方を組み合わせたデータベースを使用してよい。
【0033】
タンパク質データベースから、ソフトウェアが、その前駆体から生じるであろう、トリプシン前駆イオン、YおよびBイオン、ならびに可能性のある他のフラグメントイオンの配列および質量を各配列から推定することができる。
【発明を実施するための最良の形態】
【0034】
図1は、本発明の一実施形態による、生体学的な複合混合物中のタンパク質を同定および定量するシステムの略図である。試料102が、インジェクタ106を介して液体クロマトグラフ104に注入される。ポンプ108は、カラム110を介して試料を圧送して、カラムを通る保持時間に従って混合物を構成要素に分解する。
【0035】
カラムからの出力は、質量分析計112に入力されて分析に供される。最初に、試料は、脱溶媒和/イオン化装置114によって脱溶媒和およびイオン化される。脱溶媒和は、例えば、ヒータ、ガス、ガスと組み合わせたヒータ、または他の脱溶媒和法を含む、脱溶媒和のための任意の方法であってよい。イオン化は、例えば、エレクトロスプレーイオン化(ESI)、大気圧化学イオン化(APCI)、マトリックス支援レーザ脱離(MALDI)または、他のイオン化法を含む任意のイオン化であってよい。イオン化から得られるイオンは、イオンガイド116に印加されている電圧勾配によって衝突セル118に供給される。衝突セル118を用いて、イオン(低エネルギー)を通すことができるか、またはイオン(高エネルギー)をフラグメント化することができる。例えば、Batemanに記載されているように、交流電圧を衝突セル118に印加して、フラグメント化を生じさせる。スペクトルが、低エネルギー(衝突なし)の前駆体および高エネルギー(衝突の結果)のフラグメントについて収集される。
【0036】
衝突セル118の出力は、質量分析器120に入力される。質量分析器120は、四重極型、飛行時間型(TOF)、イオントラップ型、磁場型の質量分析器の他、これらを組み合わせたものを含む、任意の質量分析器であってよい。検出器122は、質量分析器122から出てくるイオンを検出する。検出器122は、質量分析器120と一体であり得る。例えば、TOF型質量分析器の場合、検出器122は、イオンの強度を計数する、すなわち検出器に衝突するイオン数を計数する、マイクロチャネルプレート検出器であり得る。
【0037】
記憶媒体124は、分析のためにイオン計数値を格納するための永久記録装置を提供する。例えば、記憶媒体124は、内蔵または外付けコンピュータディスクであってよい。分析コンピュータ126は、その格納されたデータを分析する。記憶媒体124に格納しなくても、データをリアルタイムに分析することもできる。実時間解析では、検出器122は、被分析データを、最初にそれを永久記録装置に格納せずに直接コンピュータ126に送る。
【0038】
衝突セル118は、前駆イオンのフラグメント化を実行する。フラグメント化を用いて、あるペプチドの一次配列を決定し、続いてその元のタンパク質を同定することができる。
【0039】
衝突セル118は、ヘリウム、アルゴン、窒素、空気、またはメタンなどのガスを含む。帯電したペプチドが、ガス原子と相互作用すると、その結果生じる衝突が、1つ以上の特徴的結合に該ペプチドを破壊することによって、該ペプチドをフラグメント化し得る。得られる最も共通するフラグメントが、YイオンまたはBイオンと記載される。このようなフラグメント化は、ペプチド前駆体のMSスペクトルを取得する低電圧状態(低エネルギー<5V)と、衝突で誘起される前駆体のフラグメントのMSスペクトルを取得する高電圧状態(高エネルギー>15V)との間で、衝突セル内の電圧を切り換えることによってオンラインフラグメント化として達成することができる。高電圧または低電圧をそれぞれ用いて、イオンに運動エネルギーを付与するので、高電圧および低電圧を高エネルギーおよび低エネルギーと呼ぶ。
【0040】
種々のプロトコルを用いて、そのようなMS/MS取得を取得するために、いつおよびどのように電圧を切り換えるのかを決定することができる。例えば、従来の方法は、標的モードかデータ依存モード(データ依存性解析、DDA)かのいずれかで、電圧をトリガする。これらの方法は、結合された、標的の前駆体の気相分離(または事前選択)も含む。低エネルギースペクトルを取得し、ソフトウェアによってリアルタイムで検証する。所望の質量が、低エネルギースペクトルにおいて指定の強度値に達すると、衝突セル内の電圧が、高エネルギー状態に切り換えられる。次いで、高エネルギースペクトルが、事前に選択された前駆イオンのために取得される。これらのスペクトルは、低エネルギーにて見られた前駆体ペプチドのフラグメントを含む。十分な高エネルギースペクトルが収集された後、高エネルギー衝突分析に適した強度で前駆体質量を継続して検索するために、そのデータ取得は低エネルギーに戻る。
【0041】
従来の切り換え法を用いることができるが、本発明の実施形態は、電圧が、単純な交番周期で切り換えられる新規なフラグメント化プロトコルを用いることが好ましい。この切り換えは、複数の高エネルギースペクトルおよび複数の低エネルギースペクトルが、単一のクロマトグラフピークに含まれるように、十分に高い頻度で行われる。従来の切り換えプロトコルと違い、この周期は、データの内容とは無関係である。
【0042】
要約すると、各試料102が、LC/MSシステムに注入される。LC/MSシステムは、スペクトルの2つのセット、つまり低エネルギースペクトルのセットおよび高エネルギースペクトルのセットを生成する。低エネルギースペクトルのセットは、前駆体に関連するイオンを主に含む。高エネルギースペクトルのセットは、フラグメントに関連するイオンを主に含む。これらのスペクトルは、記憶媒体124に格納される。データ取得後、これらのスペクトルを記憶媒体から引き出し、表示し、分析コンピュータ126で取得後アルゴリズムによって処理することができる。
【0043】
高低プロトコルによって取得されたデータは、低エネルギーモードおよび高エネルギーモードで収集されたすべてのイオンおよびAMRTの保持時間、質量対電荷比、および強度を、正確に決定することを可能にする。一般に、異なるイオンは、2つの異なるモードで見られ、次いで、各モードで取得されたスペクトルを、別個に分析して、それぞれのモードで観察されたイオンの保持時間、質量電荷比、および強度が決定される。
【0044】
1つのモードまたは両モードで見られるような共通の前駆体からのイオンは、同じ保持時間およびピーク形状を共有する。高低プロトコルは、モード内またはモード間でイオンの保持時間およびピーク形状の意味のある比較を可能にする。次いで、この比較を用いて、低エネルギースペクトルおよび高エネルギースペクトルの両方で見られたイオンを、それらの共通の保持時間およびピーク形状によってグループ化することができる。図2、図8、および図9、ならびに以下の考察は、低エネルギースペクトルおよび高エネルギースペクトルを用いて、共通の保持時間およびピーク形状を有するイオンをどのように見付け出すことができるかを示す。
【0045】
図2は、本発明の一実施形態による、交番に低エネルギーモードおよび高エネルギーモードを印加することにより得られるピークの溶出中にスペクトルが得られた時間を示している。図2は、クロマトグラフプロファイルおよび前駆体に関連するイオンの保持時間を、高エネルギーおよび低エネルギー両方のスペクトルデータに再構築することができることを示す。
【0046】
ピーク202は、単一の前駆体のクロマトグラフの溶出プロファイルを表す。横軸は溶出時間である。縦軸は任意であり、クロマトグラフカラムから溶出するときの前駆体の時間で変わる濃度、クロマトグラフプロファイルを表す。
【0047】
図2のプロット204a(低エネルギー)および204b(高エネルギー)は、同じクロマトグラフピーク202を表しており、横軸は時間を表し、縦軸はイオンの強度を表す。
【0048】
質量分析計に通される溶出分子は、低および高の両方のエネルギーモードでイオンを生成する。低エネルギーモードで生成されたイオンは、主に、可能性のある異なった同位体状態および電荷状態にある前駆イオンのイオンである。プロテオミクス研究では、前駆イオンは、未処理のタンパク質の酵素消化(典型的にはトリプシン消化)から生成されたペプチドである。高エネルギーモードでは、イオンは、主に異なった同位体およびそれら前駆体のフラグメントイオンの電荷状態である。高エネルギーモードは、上昇エネルギーモードと呼ぶこともできる。
【0049】
ピーク202のプロットでは、交番の異なる密度のグラフは、示したクロマトグラフピークの溶出中に、低エネルギー電圧および高エネルギー電圧を用いてスペクトルを収集したときの時間を表す。このバーは、時間毎に均一に交番に入れ替わっている。プロット204aは、低エネルギー電圧を衝突セルに印加して、その結果低エネルギースペクトルが得られたときの時間を例示的に示している。プロット204bは、高エネルギー電圧を衝突セルに印加して、その結果、高エネルギースペクトルが得られたときの時間を示している。図において204aおよび204bに示すように、クロマトグラフピークは、高エネルギーモードおよび低エネルギーモードによって複数回サンプリングされる。これらの複数の試料から、ピークに関連し、高エネルギースペクトルおよび低エネルギースペクトルにおいて観察されるイオンすべての正確な保持時間を、推定することができる。これらの正確な保持時間は、個々のスペクトルによってサンプリングされた強度を内挿することによって得られる。
【0050】
ある保持時間tにて溶出する分子の場合、関連するすべてのイオンは、ある程度の測定精度内で正確に同じ保持時間で溶出するのが観察されよう。この現象を、図8A〜図8Bおよび図9A〜図9Cに示す。共通の前駆体に関連するイオンは、同一のクロマトグラフピーク形状を有する。図8A〜図8Bは、Z=+2イオンである同位体を含んだ72.5分で抽出した例示的なスペクトルを示す。図8A〜図8Bに示した6個のイオン802a〜802f(質量740amu〜742.5amuで出現する)は、ヒト血清中のセロトランスフェリン前駆体タンパク質からのトリプシンペプチドの同位体である。このペプチドの配列は、MYLGYEYVTAIRである。このイオンの質量対電荷比(m/z)間の間隔は、0.5amuであり、イオンの電荷がZ=2であることを示す。Z=2では、12Cモノアイソトピックイオンのm/z値は、739.96amuである。
【0051】
図8Bは、図8Aに示した6個のイオン各々に相当する一続きの質量クロマトグラムを示している。垂直方向線804で示すように、各イオンの保持時間は、同じ値72.53分を有しており、各イオンのクロマトグラフの頂点は、同じ1回の走査に入ることを示している。矢印のある垂直方向線804は、6つのクロマトグラフピーク812a〜812f各々の保持時間が、同じであることを示しており、一番上のプロットに見られるイオンは、共通の前駆体に関連していることが裏付けられる。
【0052】
図9Aは、多数のスペクトルピーク910〜916を示す例示的な高エネルギースペクトルのプロットである。図9Cは、図9Aに出現するピークのいくつかに相当するクロマトグラフプロファイルを示す一続きのプロットである。スペクトルピーク910、911、912、および913は、ピーク920、921、922、および923のような、図9Cに描かれたものに相当するクロマトグラフピークを有する。これらの4つのスペクトルピークのクロマトグラフピークは、実質的に同じピーク形状および保持時間を有し、それらが同じペプチドからのものであるという仮説と一致する。スペクトルピーク914、915、および916は、クロマトグラフピーク924、925、および926に相当する。ピーク924、925、および926の保持時間は、それらのピーク形状と実質的に同じであり、スペクトルピーク914、915、および916が、同じペプチドからのものであるという仮説と一致する。
【0053】
図9Bは、ピーク910の保持時間と同一の保持時間を有するスペクトルピークのみを描いている。したがって、ピーク910、911、912、および913のみを、図9Bの垂直方向線930、931、932、および933のように再度描いている。保持時間の一致が外れているので、図9Aの他のピークはすべて除外し、図9Bには描いていない。この例は、クロマトグラフ情報を用いて、関連するペクトルピークを選択することができるか、または関連しないピークを除外することができることを実証している。以下に記載のように、本発明の実施形態のPDSアルゴリズムは、低エネルギーおよび高エネルギー両方のスペクトルにおいて見られるような前駆体とそのフラグメントとの間の保持時間の一致に依存する。
【0054】
図3A〜図3Cは、本発明の一実施形態のペプチド同定方法のフローチャートである。参照しやすいように、本発明の方法を、ペプチドデータ検索(PDS)アルゴリズムと呼ぶ。正確な質量データベース中のあるタンパク質に相当するペプチド配列を考えると、本発明の実施形態は、そのデータを検索して当該ペプチド配列が存在するかどうか決定する。ペプチドの保持時間に関するこれまでの知識は、必要とされない。しかし、ペプチドが溶出する時間の範囲がわかれば、検索されるデータAMRTの数を低減するのに役立つ。この低減によって計算が速くなり、偽陽性検出率は下がる。これは、またより低い検出閾値(以下に記載)を検出クロマトグラムに適用することを可能にする。
【0055】
データを検索する前に、低エネルギーおよび高エネルギー両方のデータから、イオンまたはAMRTを取得しなければならない。図3Aは、本発明の一実施形態によるイオンまたはAMRTを取得する方法のフローチャートである。図3Aの方法を低エネルギーおよび高エネルギーのデータに適用して、所要のイオンまたはAMRTを取得する。
【0056】
工程302では、収集されるスペクトルが、ハードドライブから読み取られる。工程304では、イオンがスペクトルから検出される。例えば、本明細書に参照によって組み込まれる、Bateman(米国特許第6717130号)に記載のような、スペクトルクロマトグラムおよび質量のクロマトグラムに適用されるピーク発見アルゴリズムによって、または「液体クロマトグラフィ/質量分析データにおいてピークを同定し、スペクトルおよびクロマトグラムを生成する装置および方法」と題する、2005年2月11日出願の同時係属の国際特許出願第PCT/US05/04180号(「国際特許出願第4180号」)に記載の2次元畳み込み法によって、イオンを検出することができる。本発明の一実施形態では、測定されるイオンの特性は、その保持時間、質量対電荷比(m/z)、および強度である。工程304は、これらのイオン特性のリストをテーブルに格納する。このテーブルから、これらのイオンおよびそれらの特性のリストが、方法306に入力される。方法306は、正確な質量保持時間(AMRT)を決定し、AMRTパラメータをテーブルに書き込み、これらのパラメータを格納する。
【0057】
LC/MS試験では、ペプチドは、イオンのセットとして出現し、各イオンは、異なった同位体および電荷状態にあるペプチドに相当する。AMRTは、ペプチドによって生成されたイオンのセットである。AMRTの特性は、AMRTを含んだそのイオンのセットから決定される。
【0058】
あるAMRTは、工程304において取得されたイオンリストからのイオンのセットに相当する。したがって、方法306は、イオンリストをイオンのセットに分解する。ここで各セットはAMRTである。ARMTの特性が、そのようなセットから決定される。AMRTは、4個のパラメータ、すなわち、保持時間、mwHPlus、強度、および部分電荷状態によって記載される。AMRTは、少なくとも2個以上のイオンのセットからなる。その電荷を確立するため、故にARMTのmwHPlusを確立するためには、2個以上イオンが必要である。
【0059】
AMRTの保持時間およびmwHPlusは、最小の質量、つまりそのセット中のモノアイソトピックイオンの保持時間およびmwHPlusである。AMRTの強度は、そのセット中のイオンの強度の合計である。部分電荷状態として知られた性能指数を、各AMRTについて導くことも可能である。この部分電荷状態は、AMRT強度に対するそのイオンの部分強度によって重み付けされた各イオンの電荷の合計である。セットへとまとめられないイオンは、それらの保持時間、m/z、および強度によって記載される単一イオンとして扱われる。単一イオンは、そのイオンに対する電荷が、規則によって仮定または割り当てられる場合、AMRTであると効果的にみなすことができる。
【0060】
ペプチドのmwHPlusは、中性で、そのペプチドのモノアイソトピック質量に1個のプロトンの質量を加えたものであり、[M+H]、またはmwHPlus、あるいはMHと呼ばれる。その原子が、すべてその最も低い質量、最も豊富な同位体状態にあるときには、そのモノアイソトピック質量Mが、ペプチドの質量である。
【0061】
ペプチドに適用されるようなPDSおよびEDAアルゴリズム(以下に記載)は、入力として、AMRTの保持時間、mwHPlus、および強度を取る。この単一イオンのリストは、AMRTリストとともに格納される。単一イオンは、そのイオンに対する電荷が、規則によって仮定または割り当てられる場合、AMRTであると効果的にみなすことができる。したがって、PDSおよびEDAアルゴリズムへの入力として、場合によっては、単一イオンをARMTリストとともに含むことができる。あるいは、工程306を飛ばして工程304において取得されるように、PDSおよびEDAアルゴリズム(以下に記載のような)を、そのイオンのみに適用することができる。
【0062】
工程306で実施されるアルゴリズムは、ペプチドの質量分析特性の知られた特性を利用する。ペプチドは、異なる値m/zでイオンのセットとして、質量スペクトルで出現することが知られている。そのようなスペクトルの例は、本明細書に参照によって組み込まれる、Barbara Seliger Larsen(編集)、Charles N.McEwen(編集)、Marcel Dekkerによる、Mass Spectrometry of Biological Materials、第2版(1998年3月1日)、34〜46頁に記載されている。
【0063】
ぺプチドイオンは、m/z=[M+Z×H+N×1.003]/Z=[M+N×1.00335]/Z+Hの可能性のある質量対電荷比を有し得る。式中、Mは、中性ペプチド、H=1.00728amuのモノアイソトピック質量であり、ペプチドの電荷によるプロトンの質量であり、Zは、ぺプチドの電荷であり、Nは、ペプチドの同位体数(整数)であり、1.00335amuは、13C同位体と12C同位体との間の質量差である。この質量差は、同じペプチドの同位体間で生じる実際の質量差の近似値である。
【0064】
N=0に対する値は、このモノアイソトピック状態に相当する。次いで、N=0およびZ=1に対するペプチドのモノアイソトピック質量は、[M+H]である。
【0065】
図8Aは、単一のペプチドに関連する6個のイオンのセット802a〜802fを含む質量スペクトルの一部を示している。このようなセットは、共通してクラスタ、またはイオンクラスタと呼ばれる。このクラスタのイオン間のm/zの間隔は、0.5amuであり、そのイオンが、電荷Z=2を有するペプチドの異なった同位体状態であるという証拠である。最小質量のイオンが、モノアイソトープであり、m/z=739.96で出現する。このペプチドのmwHPlusは、739.96×2−1.00739=1478.91amuであると推定される。このペプチドが電荷Z=1で出現する場合、そのモノアイソトープは、1478.91amuというm/zで出現し、そのペプチドがZ=3で出現する場合、そのモノアイソトープは、(1478.91+2)/3=493.64amuで出現する。ペプチドの質量スペクトルは、1つ以上のイオンのクラスタからなるものとして表すことができる。各クラスタは、同じ電荷のイオンに相当する。異なるクラスタは、異なる電荷状態にあるイオンに相当する。
【0066】
ここで生成されたLC/MSデータでは、AMRTは、イオンのセットとして出現する(ここで、各イオンは、保持時間、m/z、および強度によって表される)。工程304で取得されたイオンリストから、イオンのセットを推定することは容易である(ここで、各セットは、AMRTに相当し、このようなAMRTの各々は、ペプチドに相当すると推定される)。各AMRTはペプチドから由来するものと仮定されるので、規則を利用してそのようなセットに達することができる。例えば、(Batemanが記載のように)ペプチドからのイオンは、共通の保持時間で生じるはずであり、そのようなセットのイオン間の質量対電荷関係は、上記規則に一致しなければならない。次いで、方法306は、特性がそのような規則を満たすイオンのセットを収集する。そのようなセットの各々は、AMRTに相当し、そのようなAMRTの各々は、ペプチドに相当すると推定される。
【0067】
次いで306における方法を、低エネルギースペクトルから取得されたイオンリストに適用して低エネルギーAMRTを取得する。高エネルギースペクトルから取得された高エネルギーイオンリストに方法を別個に適用して、高エネルギーAMRTを取得することも可能である。
【0068】
要約すると、工程306は、AMRTが、セットの各イオンが単一の共通のペプチドから生じると推定されるイオンのセットであると決定する。該ペプチドは、前駆体またはフラグメントであり得る。工程306は、上に記載し説明したようなペプチドスペクトルの知られた特性、およびそのようなイオンの共通の保持時間を利用して、AMRTに相当するイオンのセットを推定する。次いで、工程306は、各イオンセットからAMRTパラメータ(保持時間、mwHPlus、強度、および部分電荷状態)を計算し、そのパラメータを格納し、各イオンセットを含むイオンを記録する。
【0069】
それらの電荷状態ZおよびmwHPlusを推定するために、知られているアルゴリズムが、イオンが見られたペプチドスペクトルをデコンボリューションする。そのようなアルゴリズムの一例は、Karl R.Clauser、Peter Baker、およびAlma L.Burlingameの「Role of Accurate Mass Measurement(+/−10ppm)in Protein Identification Strategies Employing MS or MS/MS and Database Searching」、Anal.Chem.1999年、第71号、2871〜2882頁に記載されている。そのような別のアルゴリズムは、Zhongqi ZhangとAlan G.Marshallの「A Universal Algorithm for Fast and Automated Charge State Deconvolution of Electrospray Mass−to−Charge Ratio Spectra」、J.Am Soc.Mass Spectrom.1998年、第9号、224〜233頁である。これらを、各々本明細書に参照によって組み込む。
【0070】
しかし、これらの知られているアルゴリズムは、単一のスペクトルのみで働く。したがって、そのようなアルゴリズムは、スペクトルに観察された各ペプチドの電荷状態およびmwHPlusを決定することができるが、そのようなペプチドに関する正確な保持時間を決定することはできない。
【0071】
イオンリストからAMRTを取得するために工程306で用いる方法は、新規なものであり、図17A〜図17Cに記載されている。図17Aは、その方法を要約したものである。工程1704は、イオンリスト1702を取り、イオンクラスタのセットを決定する。各イオンクラスタは、同じ電荷Zおよび保持時間を有するイオンを含む。最も低い質量を有するこのクラスタのイオンが、そのペプチドのモノアイソトピックイオンである。このクラスタのリストは、1706でリストに格納され、このリストは、工程1708に入力される。
【0072】
工程1708は、このリストを検証し、どのクラスタが、同じ保持時間およびmwHPlusであるが、異なる電荷状態を有しているかを決定する。同じ保持時間およびmwHPlusならびに異なる電荷状態を有するいくつかのクラスタが出現する場合、1708は、これらのクラスタは同じペプチドからのものであるはずであると推定する。該クラスタは、単一のセットにまとめられ、この組み合わされたセットは、単一ペプチドに対するAMRTである。固有の保持時間およびmwHPlusを有するクラスタが出現する場合、それに対応するペプチドが、唯一のクラスタを生成したと推定し、1708は、該1つのクラスタがAMRTであることを決定する。工程1710は、AMRTおよびクラスタにまとめられなかったイオンを格納する。PDSおよびEDAアルゴリズムに入力されるのは、この組み合わされたリストである。
【0073】
図17Bは、工程1704が、イオンリスト1702からイオンクラスタをどのように同定するかを示している。入れ子式の反復ループが、2つの検索パラメータZmおよびNmを減少させる。これらの検索パラメータの初期値は、ZmaxおよびNmaxである。各パスにおいては、Zmはそのクラスタの電荷であり、Nmはクラスタに存在するのに必要なイオンの最小数である。低エネルギーイオンの場合、初期値パラメータは、Zmax=6およびNmax=8である。高エネルギーイオンについては、これらの初期パラメータは、Zmax=3およびNmax=8である。
【0074】
工程1736は、リスト中の全イオンにわたり、同じ保持時間を有しかつ1.00335/Zmだけm/zで分離されるイオンのすべての対を見付け出す。この値1.00335amuは、13C同位体と12C同位体との間の質量差である。この質量差は、同じペプチドの同位体間で生じる実際の質量差の近似値である。(以下に記載のように)20ppmの質量閾値を用いると、この単一の近似値は、1対のイオンが、共通のペプチドの同位体であるかどうかを決定するのに十分である。
【0075】
工程1738は、イオン対をクラスタにまとめる。したがって、イオン7が、イオン10と対になっており、イオン10が、イオン15と対になっている場合、イオン7、10、および15は、あるクラスタを形成する。イオン15が、別のイオンと対になっている場合、そのクラスタは、その1つの付加的なイオンだけ拡大される。標識がつけられていない場合に限り、イオンは対になることが考慮される。最初は、イオンには標識が付けられておらず、すべてのイオンが考慮される。以下に記載のように、次の工程でイオンには標識が付けられる。工程1738は、ペアリング要件を満たす可能性のあるすべてのクラスタを決定する。
【0076】
工程1736において適用される保持時間要件は、保持時間窓によって決定され、工程1736において適用されるm/z要件は、ppm窓によって決定される。保持時間窓は、クロマトグラフピーク幅(FWHM)の20%であり、0.5分(FWHM)のクロマトグラフピーク幅に対して+/−0.1分である。分解能15000のTOFにおけるppm窓は、+/−20ppmである。すなわち、それらの保持時間の差がこの窓内に入り、上記のm/zモデルからのそれらの質量差がそのppm窓内にある場合に限り、イオンは対にされる。
【0077】
工程1738では、イオンのセットがクラスタとして記録され、2つの付加的な条件を満たす場合に標識が付けられる。該クラスタ中のイオンの数は、Nm以上でなければならず、N=1およびN=0のイオンの強度比は、そのようなイオンについて想定される値の範囲内になければならない。rを、N=1のイオン対N=0のモノアイソトピックイオンの強度比と定める。クラスタのイオンの強度分布は、よく知られており、上記で引用した参照文献に記載されている。本明細書に記載の方法では、名目上の強度比rは、r0=(mwHPlus/20)×0.0107によって概算される。式中(mwHPlus/20)は、ペプチドの炭素原子数の概算値であり、0.0107は、12C原子対13C原子の概算の存在度である。強度比N=1対N=0のイオンの許容範囲は、40%またはr0×1.4およびr0/1.4である。したがって、r>r0/1.4およびr<r0×1.4であることを必要とする。
【0078】
これら2つの規則を満たさない場合、工程1740および工程1742は、イオンに標識を付けず、後に反復する際にそれらイオンを考慮する。これらの規則を適用して、関連しないペプチドからのイオンの偶然のペアを考慮して検出しかつ除去する。
【0079】
工程1744は、工程1738で取得されかつ工程1740および工程1742で受け取られたクラスタに対するクラスタパラメータを取得する。クラスタパラメータは、保持時間、mwHPlus、強度、および電荷である。クラスタの保持時間およびmwHPlusは、そのクラスタの最小質量の保持時間およびmwHPlusである。このクラスタの強度は、該クラスタのイオンの強度の合計である。クラスタの電荷は、Zmパラメータである。イオンクラスタが受け取られる場合、工程1744は、これらのイオンが最早次の反復中に考慮されないようにイオンに標識を付ける。工程1746は、受け取られたクラスタに対するクラスタを形成するイオンを含むクラスタパラメータを格納する。
【0080】
次の反復は、電荷パラメータZmを減少させる。したがって、第2の反復では、電荷Zm=Zmax−1を有しかつNm=Nmax以上のイオンを有するクラスタが見付けられる。反復を継続して、Zm=1に達するまでZmを減少させる。Zm=1に達すると、Nm=Nmax以上のイオンを含むすべての電荷状態のクラスタが同定される。Zm=1に達した後、次の反復がZm=Zmaxをリセットし、Nm=Nmax−1となるようにNmaxを1だけ減少させる。この入れ子式の反復は、Nm=2になるまで進む。したがって、反復は、外部ループのNmについては最大値から最小値まで進み、内部ループのZmについて最高値から最小値まで進む。
【0081】
工程1750は、元のイオンリストで見付けられた全クラスタ(クラスタパラメータおよび関連するイオン)、およびクラスタに存在することが見付けられない全イオンを格納する。
【0082】
工程1708の動作を、図17Cに記載する。イオンクラスタのリストをループオーバする1750。増分変数ncは、クラスタ数を指し、1に初期化される。工程1776は、クラスタncと同じ保持時間およびmwHPlusを有する全クラスタを見付け出す。工程1778が、そのような他のクラスタが存在しないと決定すると、工程1780は、クラスタncがAMRTであることを記録し、そのパラメータを工程1786で格納する。したがって、所与の保持時間では、所与のmwHPlus値を有する唯一のクラスタが存在すれば、そのクラスタは、ペプチドのAMRTであると考えられる。すなわち、単一クラスタとして出現するペプチドが存在する。そのAMRTが、AMRTリストに加えられる。AMRTパラメータは、クラスタパラメータと同じである。
【0083】
工程1778は、1つ以上のクラスタが、クラスタncと同じ保持時間およびmwHPlusを有していると決定すると、工程1782は、このクラスタのセットはAMRTであると記録する。工程1784は、これらのクラスタを単一のAMRTにまとめ、それらのパラメータを取得し、1786がその結果を蓄積する。すなわち、同じmwHPlusを有する複数のクラスタが存在する場合、ペプチドが、これらの異なる電荷状態および同位体状態で出現する複数のイオンを有するデータに存在すると推論する。AMRTパラメータは、最も強いクラスタの保持時間、最も強いクラスタのmwHPlusであり、強度は、全クラスタの強度の合計であり、部分電荷状態は、各クラスタの部分的な強度によって重み付けされたクラスタの電荷の合計である。
【0084】
工程1778において適用される保持時間要件は、保持時間窓によって決定され、工程1778において適用されるm/z要件は、ppm窓によって決定される。これらのパラメータは、上記のイオン対決定の場合と同じ様式で取得されかつ適用される。
【0085】
すべてのクラスタがループオーバされると、ループは終了し、結果がすべて格納される。最終結果は、全AMRTパラメータおよびそれらAMTSに関連するイオンの他、クラスタの一部ではなかったイオンを含んだAMRTリストである。PDSおよびEDAアルゴリズムに入力されるのはこの最終リストである。
【0086】
PDSおよびEDAアルゴリズムへのその他の入力は、標的ペプチド前駆体の配列およびそれらのフラグメント配列である。図3Bは、タンパク質配列の選択されたデータベースを用いて、標的前駆体ペプチドを選択する方法のフローチャートである。工程310では、適したデータベースが選択される。データベースは、試料中に存在するか存在しやすい可能性のあるすべてのタンパク質に相当するタンパク質配列を含むことが好ましい。データベースでは、各タンパク質は、アミノ酸のその一次配列によって記載される。このような配列から、消化プロトコルの他、疎水性および電荷状態などの他の特性から生じるペプチドを予測することが可能である。例えば、トリプシン消化は、知られているアミノ酸KおよびRで配列を切断する。これらの切断産物に基づいて、YイオンおよびBイオンフラグメントならびに衝突フラグメント化から得られる相当する質量を、予測することができる。したがって、このデータベースは、質量のモデルおよび低エネルギーおよび高エネルギーのスペクトルで生じ得る他の物理的属性を提供する。
【0087】
タンパク質同定中、データに見られるAMRTまたはイオンを、データベースに含まれた質量と比較して、取得されたLC/MSデータに存在するペプチドの信頼できる同定をもたらす。理想的には、データ中のすべてのデータベースペプチドが、誤差なしで同定される。
【0088】
工程312では、インシリコ消化が、データベースのタンパク質配列の1つ以上で実行されて、そのデータベースにおいて前駆体ペプチドを生成する。インシリコ消化は、上記のものなどの知られている消化特性に基づいた合成消化である。工程314では、前駆体ペプチドの正確な質量は、前駆体ペプチドを構成するアミノ酸配列を見ることによって決定される。前駆体ペプチドに対応する正確な質量および配列は、後で使用するのに保存される。
【0089】
図3Cは、本発明の一実施形態の混合物中のペプチドを同定する方法のフローチャートである。方法は、データベースから前駆体ペプチド(標的前駆体)を選択することから開始される。選択されたデータベースのペプチドを用いて、選択されたペプチドに相当するYイオンおよびBイオンのフラグメントの質量が、決定されるかまたはデータベースから取得される。このようにして、質量のリストがまとめられる。この質量のリストは、(おそらくは、最低の質量YイオンおよびBイオンを除外した)Yイオン、Bイオン各々に相当する質量の他、フラグメント化されていない前駆体自身に関連する固有の質量を含む。
【0090】
前駆体ペプチドを化学修飾したものに相当するものなどの他の前駆体質量およびフラグメント質量を考慮してもよい。このような修飾の例は、グリコシレーションまたはリン酸化によるものがある。YまたはB結合以外のペプチド結合におけるフラグメント化などの他のフラグメント質量を考慮してもよい。
【0091】
次いで、このリストの各質量について、LC/MSおよびLC/MSデータからの低エネルギーおよび高エネルギー両方のAMRTを検索する。一致する質量、すなわちヒットは、データベース(前駆体またはフラグメント)からの質量が、(低エネルギーまたは高エネルギーにおいて)データ中で測定された質量の質量検索窓内にあるときに発生する。ヒットしたすべてのAMRTは、それらの質量、保持時間、および強度とともに記録される。一致する質量、すなわちヒットは、複数の保持時間値域の各々について蓄積される。検出閾値を超える蓄積を有する値域は、標的前駆体と関連しているとみなされる。
【0092】
以下に記載のように、本方法は、低エネルギーおよび高エネルギーにて見られるAMRTの保持時間合致を決定的に使用する。また以下に記載のように、本方法は、データベースのペプチドに関連するが同一ではないデータ中のAMRTを同定することができる。データベースからのペプチドフラグメントに関連する質量が、実質的に同一の保持時間でデータ中に見付けられたAMRTと有意に重なり合うときに、このような同定を行うことができる。
【0093】
図3Cを参照すると、工程350では、前駆体ペプチド(例えば、トリプシンペプチド)は、インシリコ消化ペプチドから選択される。代替的には標的配列または標的前駆体と呼ばれるこのペプチドは、その質量(mwHPlus)、および工程352でのそのYイオンおよびBイオンの質量(mwHPlus)によって記載される。データベース中のどのペプチドも、工程350の標的前駆体として選択することができる。
【0094】
工程352では、標的配列およびそのYイオンおよびBイオンの正確な質量のリストが決定される。工程354では、標的、前駆体配列、およびそのYイオンおよびBイオンの質量を用いて、検索許容値(例えば、20ppm)内にmwHPlusを有する高エネルギーおよび低エネルギーのリスト中で、データ内の全AMRTを検索する。工程356では、データベースから検索許容値内までで質量リストの質量と一致するAMRTを、記録するか、標識を付けるか、あるいは同定する。検索許容値は、ユーザ指定のものであり得るか、知られている統計学的手段によってデータから自動的に決定することができる。mwHPlus許容値を決定する自動の方法を、以下に記載する。
【0095】
理想的には、低エネルギースペクトルは、前駆イオンのみを含む。実際、前駆イオンは、イオン源においてフラグメント化することができ、その結果、低エネルギースペクトルは、前駆体のフラグメントイオンを含み得る。このようなイオンは、インソースフラグメントと呼ばれ、一般に減衰された強度で出現する。
【0096】
理想的には、高エネルギースペクトルは、フラグメントイオンのみを含む。しかし、実際には、前駆イオンの衝突フラグメント化が、完了されていない恐れがあるので、その結果、高エネルギースペクトルは前駆イオンを含み得る。一般にそのような前駆イオンは、低エネルギーモードのそれらの強度に対して減衰された高エネルギーモードの強度で出現する。
【0097】
したがって、前駆体またはフラグメントの質量は、低エネルギーまたは高エネルギーのいずれかのデータまたはその両方で出現し得る。リストの質量が、低エネルギーAMRTデータにおいて出現する場合、PDSアルゴリズムは、そのモードのそのデータにおいて出現するものとして、記録するか、標識を付けるか、あるいは同定する。リストのある質量が、高エネルギーAMRTデータにおいて出現する場合、PDSアルゴリズムは、そのモードのそのデータにおいて出現するものとして、記録するか、標識を付けるか、あるいは同定する。したがって、本発明は、そのようなイオンが生成または検出されたモードに関係なく、共通の前駆体分子に由来する全イオンを利用する。
【0098】
工程358では、検出クロマトグラムが形成される。検出可能なレベルのイオンを有する配列が、データ中に存在すると仮定すると、そのような全てのイオンには、工程356において実行される検索中に標識が付けられる。しかし、その配列に相当しない他の多くのイオンにも標識が付けられる。検出クロマトグラムは、保持時間インターバル内で標識が付けられるイオン(低エネルギーおよび高エネルギー両方)の数を示し、各保持時間について、垂直方向の信号は、保持時間インターバル中に観察された標識の数である。偽陽性標識の効果は、ベースラインノイズを発生することである。
【0099】
本発明の一実施形態によれば、検出クロマトグラムは、単純なヒストグラムである。ヒストグラムは、値域のシリーズであり、各値域の中心は、保持時間に相当し、値域の幅は、保持時間インターバルに相当する。ヒストグラムは、単純なワンアップ計数で各ヒットによって形成され、値域は、ヒットした質量の保持時間を含んでいた特定の保持時間インターバルに相当する。
【0100】
本発明の第2の実施形態によれば、検出クロマトグラムは、蓄積されたガウス形状のピークを用いて導出される。この本発明の第2の実施形態では、ヒットした各AMRTは、検出クロマトグラム中でガウス形状のピークで表される。図14は、第2の実施形態による検出クロマトグラムを生成する方法のフローチャートである。
【0101】
工程1402では、検出ピーク幅が確立される。検出ピーク幅は、各ヒットについて検出クロマトグラムに加えられるガウス形状のピークの幅である。加えられたガウスのピーク(以降、検出ガウスまたは検出ガウスのピークと呼ぶ)の幅を、データ中のクロマトグラフピークのFWHMの指定された部分に設定する。本発明の一実施形態によれば、この部分は10%である。したがって、典型的なクロマトグラフピークのFWHMピーク幅は、0.5分であるなら、検出ガウスのFWHMは、0.05分である。
【0102】
検出クロマトグラムの時間範囲は、分離の時間範囲に相当する。典型的なクロマトグラフピークのFWHMピーク幅が、0.5分である場合、例えば、検出クロマトグラムのサンプル期間は、その幅の約1%、すなわち0.005分になるように選択される。工程1404では、検出クロマトグラムが初期化される。検出クロマトグラムにおけるすべての地点の初期値は、ゼロに設定される。ヒットした(工程350で見付けられた)AMRTのリストが、横断(ループオーバ)される。
【0103】
工程1406では、ヒットに相当する検出ガウスのピークが加えられる。これは、ヒットした低エネルギーおよび高エネルギーAMRTをすべて分析することによって行われる。ヒットした低エネルギーおよび高エネルギーのAMRT各々について、(検出ピーク幅の幅を有する)単位高さの単一の検出ガウスが、AMRTまたはイオンのそれぞれの保持時間において検出クロマトグラムに加えられる。
【0104】
異なる質量を有する2つのAMRTが、同時に溶出する場合、それらの検出ガウスは、ピーク高さ2を有するピークに達する。異なる質量を有するN個のAMRTが、同時に溶出する場合、それらの検出ガウスは、ピーク高さNを有するあるピークに達する。
【0105】
検出ガウスの幅は、ピークの保持時間を測定するのに用いる標準誤差に相当する。保持時間の測定の標準誤差を決定する方法を、以下に記載する。
【0106】
図3に戻ると、工程362では、検出クロマトグラムの極大を同定する。ペプチド検出閾値を決定する。ペプチド検出閾値は、ペプチドが同定されたかどうかを決定する。検出閾値を決定することのできる方法を、以下に指定する。例えば、ペプチド検出閾値は、4つのAMRTになるように選択されてよい。したがって、少なくとも4つのAMRTが、同じ保持時間窓に存在する場合、ペプチドは同定されたとみなされる。低エネルギーまたは高エネルギースペクトル両方で検出されたAMRTは、この計数に役立ち得る。
【0107】
すなわち、工程362では、(A)AMRTの閾値数以上が、見付けられた場合、(B)AMRTの関連する保持時間が、+/−0.05分以内にある場合、および(C)AMRTのmwHPlus値のすべてが、選択されたペプチドデータベース中のフラグメントの分子量および前駆体の分子量の20ppm以内にある場合、データベースの標的ペプチドは、データ中に存在すると決定される。本発明の一実施形態では、検出クロマトグラムは、(A)が真の場合、極大に寄与する質量も、(B)および(C)を満たさなければならないというように構築される。この点に対するPDSアルゴリズムは、存在する場合には、この条件を満たし、これによって選択された前駆体(標的前駆体)が存在することを示唆するAMRTを同定する。
【0108】
検出閾値を超えるどの極大も、選択されたペプチドがデータ中に存在するか、またはあるペプチドが、選択されたペプチドに密接に関連するデータに存在するかのいずれかを示唆する。この文脈で用いられる場合「密接に関連する」という用語は、データベースペプチドと保持時間tにてデータ中に見付けられたペプチドとの間に有意な配列の一致が存在することを意味する。前駆体分子量(mwHPlus)を有するあるAMRTが、見付けられたかどうかのそのような検出を行うことができることに留意されたい。したがって、1つ以上の保持時間を見付けることができる。
【0109】
図15は、本発明の一実施形態による、工程362において使用することのできる配列同定およびそれらの保持時間を同定する方法のフローチャートである。図15に示した方法が終了すると、低エネルギーのLC/MSデータ中で見付けられた標的前駆体の他、配列が、該標的前駆体の配列と関連している(しかし同一でない)低エネルギーのLC/MSデータ中に見付けられた前駆体も同定される。
【0110】
工程1502では、検出閾値が確立される。検出閾値は、検出クロマトグラムに見付けられたすべての極大から決定することができる。検出クロマトグラムの各極大は、ある値を有する。これらの値から、中央値が得られる。検出閾値は、典型的には中間値の約4倍に設定される。この検出閾値は、単なる偶然で検出ピーク幅内に入る可能性があるフラグメントの最大数に相当する。検出閾値の典型的な値は、0.05分の検出ピーク幅当たり5個から10個のフラグメントイオンで変わる。
【0111】
工程1504では、閾値を超える検出クロマトグラム中のすべてのピークが記録される。標的ペプチド(または標的のピークに関連する配列を有するあるペプチド)が、そのデータに存在しない場合、ピークは、検出クロマトグラム中に検出されない。他方では、標的ペプチドまたはその標的に関連するある配列を有するあるペプチド、あるいはその両方が、十分な濃度で存在する場合、その検出閾値を超える1つ以上の極大値が存在し得る。
【0112】
工程1506では、閾値を超える検出ピークの保持時間は、そのペプチドの保持時間として取得される。標的ペプチド(または配列に関連する標的ペプチド)が検出されたときのその保持時間の値は、tである。検出クロマトグラムの高さは、標的ペプチド(または配列に関連する標的ペプチド)について検出されたイオンの概算数を与え、極大の時間における場所は、標的ペプチド(または配列に関連する標的ペプチド)が、クロマトグラフカラムから溶出したときの保持時間である。
【0113】
図3に戻ると、工程364では、各同定のための低エネルギーおよび高エネルギーのAMRTが収集される。これらのAMRTは、次の規則にしたがって収集される。すなわち、検出クロマトグラムからの値tが、ペプチドの溶出時間であると仮定すると、ヒットリストに存在し、検出幅、つまり実験では+/−0.05分のt内にあるすべてのAMRTが、記録されるか、標識が付けられるか、あるいは収集される。したがって、次いで、これらの収集されたAMRTは、2つの条件、(A)AMRTの関連する保持時間は、tの+/−0.05分にあること、および(B)AMRTのmwHPlus値はすべて、選択されたペプチドデータベース中のフラグメントの分子量および前駆体の分子量の20ppm内にあることを満たす。
【0114】
この規則によって収集されたAMRTの数は、tにおける検出クロマトグラムの高さに近接するであろうが、必ずしもそれと同じではない。ペプチドに関連するAMRTは、測定誤差のために僅かに異なった保持時間を有し得るので、検出ガウスのピークは、正確には一致しないかもしれない。AMRTの保持時間が同じ値を有さない場合、検出閾値を超える検出クロマトグラム中の検出ピークの高さは、整数以外になり得る。しかし、上記の規則によって収集されたAMRTの数は、明らかに整数の値でなければならない。
【0115】
工程366では、この収集されたAMRTが格納される。必要に応じて、収集されたAMRTのスペクトルを表示することができる。工程368では、必要に応じて、工程350に戻ることによって、検索は、次の前駆体ペプチドについて繰り返される。この検索を繰り返さない場合、工程370においてさらに分析を行うことができる。このようなさらなる分析は、結果を他の注入からの結果と組み合わせるか、または同定されたペプチドを定量しながら、その結果を表示することができる。
【0116】
他の注入からの結果を組み合わせることは、同じペプチドが2回以上の注入で出現するときの保持時間を比較することからなり得る。他の注入からの結果を組み合わせることは、2回以上の注入において見付けられた相当するAMRTの強度を比較することからなり得る。これらの注入は、同じ混合物の反復注入、または異なる条件下で行われた2つの試料の注入であってよい。
【0117】
反復注入からの保持時間および強度を、一致するかどうか比較して、ペプチドが正確に同定されたかをさらに確認することができる。この注入が異なる試料(または条件)からの場合、保持時間を一致するかどうか比較して、ペプチドが正確に同定されたかをさらに確認することができ、強度を比較または比率化して、2つの条件間での試料中のペプチドの量の変化を明らかにすることができる。
【0118】
ペプチド同定のリストに規則を適用して、どのタンパク質が元の試料中に存在するかを推定することができる。
【0119】
図16は、同定された配列各々に関連するAMRTおよびイオンを収集するためのフローチャートである。工程1602では、ある保持時間窓が確立される。一般に、保持時間窓は、検出ピーク幅に等しく設定される、この幅は、上の例では+/−0.05分である。工程1604では、保持時間が検出保持時間t上に中心がある保持時間窓閾値内にある、標識の付いたすべての低エネルギーおよび高エネルギーのAMRTが収集される。検出ピークは、ペプチドが溶出するための保持時間を提供する。保持時間が、検出保持時間tに中心がある保持時間窓閾値内にあるイオンは、そのペプチドついて検出されたイオンである。このイオンの収集は、低エネルギーおよび高エネルギーでヒットした全イオンまたはAMRTを含む。これらのイオンは、標的前駆体に相当する質量を含むかもしれないし、含まないかもしれない。
【0120】
この結果は、検出ピークの頂点に中心がある保持時間窓中で見付けられたイオンである。これらのイオンは、ペプチドフラグメント質量に相当する質量を有し、常にというわけではないが一般に標的前駆体の質量を含む。工程1606では、この結果は、記憶装置に格納される。また、工程1606では、この結果を、ユーザに表示することができる。
【0121】
図4Aは、高エネルギーにおいて見付けられたすべてのAMRTを示す例示的なプロットである。図4Bは、低エネルギーにおいて見付けられたすべてのAMRTを示す例示的なプロットである。図4Aおよび図4Bでは、縦軸は、AMRTのmwHPlusであり、横軸は、保持時間である。図4Cは、図4Aおよび4Bに示したデータから導出された例示的な検出クロマトグラムであり、所与のペプチド配列についての前駆体質量およびフラグメント質量に相当する保持時間当たりのヒット数を示している。図4Cは、ヒット発生のピークが約78分近くにあることを明白に示している。このピークは、データ中で見付けられた前駆体ペプチドを含む。図4Cに観察できる分布は、ヒット発生のピークの重要性を判断することができる、ノイズバックグラウンドを示す。
【0122】
図5Aは、所与のペプチド配列についての前駆体質量およびフラグメントの質量に相当する、図4Aの高エネルギープロットのAMRTのヒットのみを示す例示的なプロットである。図5Bは、所与のペプチド配列についての前駆体質量およびフラグメントの質量に相当する、図4Bの低エネルギープロットのAMRTのヒットのみを示す例示的なプロットである。図5Cは、所与のペプチド配列についての前駆体質量およびフラグメントの質量に相当する、図5Aおよび図5Bの高エネルギーおよび低エネルギープロットのヒットのヒストグラムプロットである。図5Cは、図4Cに類似する例示的な検出クロマトグラムであるが、閾値502を加えている。閾値502は、ペプチドの存在を示すのに必要なヒット数を示している。配列に関連する明白な前駆体ペプチド506が、約78分の保持時間において同定され、ここでは40個以上のヒットが計数されている。可能性のある配列に関連するペプチド504は、43分の保持時間において同定される。フラグメント質量に対して低エネルギーAMRTがヒットしていることは、インソースフラグメント化を裏付けるものである。前駆イオンをインソースフラグメント化すれば、低エネルギースペクトルで観察されるフラグメントイオンが得られる。
【0123】
ピーク特性を用いて、ペプチド同定をさらに支援することができる。そのような1つの特性は、ピーク形状である。同じ前駆体ペプチドに関連するすべてのクロマトグラフピークは、同じピーク形状およびピーク幅を有さなければならない。しかし、異なるペプチドに関連するクロマトグラフピークは、同じピーク形状および幅を有さないかもしれない。したがって、2種類のペプチドは、同じクロマトグラフ保持時間にて溶出するが、異なるピーク形状および/または幅を有することが可能である。このため、ピーク形状を用いて、別の場合には誤って同定することになるかもしれない同時発生を排除することができる。このピーク形状の特性を用いて、閾値を低減させること、すなわち、同じ保持時間で一致するのに必要なイオン数を用いて、標的ペプチドの存在を示唆することができる。同様に、ピーク形状は、AMRT間の関係を確認することができる。
【0124】
同じ前駆体ペプチドに関連するすべてのクロマトグラフピークは、同じピーク形状およびピーク幅を本質的に有していなければならないが、そのようなピーク形状または幅の変化は、測定誤差に起因して生じるのが観察されるかもしれない。変化の別の源は、前駆体に関連しない他のピークによる干渉である。
【0125】
図6A〜図6Bに示すように、ピークには、比較してピーク幅およびピーク形状を決定することのできるいくつかの時間がある。これらは、頂点時間(保持時間)、上昇勾配変曲点の時間、および下降勾配変曲点の時間を含む。変曲点は、ピーク形状の2次導関数のゼロ交差の時間から求めることができる。2次導関数は、Savitzky−Golayフィルタまたは関連する多項式フィルタにより求めることができる。図6Aは、例示的なクロマトグラフピーク602を示している。図6Bは、クロマトグラフピーク602の2次導関数のプロットを示している。2次導関数のトレースの頂点604ならびに変曲点606aおよび606bの時間を示している。これらの時間を、ピーク形状および幅と比較することができる。参照として、一番下のプロットに見られる時間に相当する一番上のプロットのピークの点を、点線で示している。
【0126】
下降勾配の変曲点と上昇勾配の変曲点との時間差は、ピーク幅を表す。ガウスのクロマトグラフピークについて、この幅は、ガウスの標準偏差の2倍である。上昇勾配変曲点および下降勾配変曲点のピークの高さの比は、ピーク非対称性またはピーク形状の付加的な尺度である。頂点時間と上昇勾配変曲点および下降勾配変曲点の時間との間の時間差の大きさは、ピーク幅の他の尺度である。これらの時間の比は、ピーク形状または非対称性の尺度である。
【0127】
ピーク形状を考慮すると、検出クロマトグラムの付加的な処理を行うことができる。上記のように、検出クロマトグラムの極大が見付けられる。その極大中に一致するピークの形状および幅を比較する。その幅または形状が外れ値である場合、ピークが拒否される。
【0128】
図7は、本発明の一実施形態によるピーク形状およびピーク幅を比較する方法のフローチャートである。工程702では、ピークの保持時間が比較される。工程704では、ピークの変曲幅が比較される。ピークの変曲幅は、その変曲点間の時間である。例えば、図6A〜図6Bの変曲点606aと606bとの間の時間は、ピーク602の変曲幅である。工程706では、頂点時間と上昇勾配の変曲時間との差の大きさが比較される。工程708では、頂点時間と下降勾配の変曲時間との差の大きさが比較される。
【0129】
工程710では、この時間を分析して、それらが時間閾値に入るかどうかを決定する。本発明の一実施形態では、比較各々の時間閾値は、0.05分の検出幅である。したがって、そのピークを同じペプチドに相当するものとして考えるには、すべての時間比較は、0.05分以内に入らなければならない。この閾値は、ユーザ指定のものであるか、または統計学的に決定されてよい。ユーザ指定の閾値または統計学的に決定された閾値は、絶対時間またはピーク幅の一部であり得る。
【0130】
ピーク形状およびサイズを比べるのに使用される好適なピークは、ペプチドに関連するイオンのクラスタの12Cモノアイソトピックピークである。この12Cのモノアイソトープは、すべての同位体がそれらの最も豊富な状態である最低の質量ピークである。イオンのペプチドクラスタの他のピークを、同様に用いることができる。さらに、保持時間ならびに上昇勾配変曲および下降勾配変曲時間の平均値を、ピーク形状および幅の比較に使用することができる。
【0131】
本発明の第2の実施形態では、AMRTを検索する代わりに、またはAMRTを検索することに加えて、前駆体、フラグメント、およびそれらの同位体に相当するイオンが、検索される。イオンを用いることのある利点は、低強度のペプチドに関し、ペプチドが単一イオンとして出現するかもしれないことである。例えば、AMRTを用いるとき、AMRTを検出しその電荷状態を確立するためには、少なくとも2個のイオンが必要である。
【0132】
このイオンベースの検索は、多くの点で上記のAMRT検索に類似している。図10は、本発明の一実施形態によるイオンを用いて、複合混合物中のペプチドを同定する方法のフローチャートである。イオンを用いたPDSアルゴリズムにおける工程の要約は、以下の通りである。
【0133】
工程1002では、低エネルギーおよび高エネルギーのイオンが、ペプチド混合物の1回の注入から得られる。ペプチド混合物は、一般にタンパク質試料の消化物から取得される。低エネルギーおよび高エネルギーデータは、上記のような高電圧/低電圧切り換え技術を用いて取得される。工程1004では、タンパク質のデータベースが選択される。工程1006では、データベースのタンパク質に相当するペプチドのリストが、ペプチド消化用の規則を用いて取得される。
【0134】
工程1008では、標的前駆体が、データベース(例えば、トリプシンペプチド)から選択される。このペプチドは、その質量(mwHPlus)ならびにそのYイオンおよびBイオンの質量(mwHPlus)から説明される。工程1009では、データが、選択された前駆体の質量に相当する質量について検索される。これらの質量を考える場合、工程1010では、検索許容値(例えば、20ppm以内)内の質量を有する高エネルギーリストおよび低エネルギーリストのデータ中のすべてのイオンが記録される。イオンを検索基準として用いる場合、検索は、複数の電荷状態および同位体数より多くなければならない。電荷状態は、一般に高エネルギーフラグメントについては1個〜3個に制限される。電荷状態は、一般に低エネルギーについては1個〜6個に制限される。
【0135】
このイオンベースの検索の好適な実施形態では、低エネルギースペクトルから取得されたすべてのイオンの電荷状態は、Z=2と仮定され、高エネルギースペクトルから取得されたすべてのイオンの電荷状態は、Z=1と仮定される。Z=2が、最も一般的に観察されるペプチドの低エネルギーの変化であり、Z=1が、最も一般的に観察されるペプチドの高エネルギーの変化であるので、これらの割り付けが行われる。また、全イオンの同位体数は、N=0と仮定される。すなわち、全イオンは、そのモノアイソトピック状態にあると仮定される。それぞれのイオンのmwHPlus値を決定するために、これらの電荷状態および同位体割り付けが必要である。以下に記載のように、次いで工程1009において、データベースから取得された質量と比較されるのがこれらのmwHPlus値である。
【0136】
工程1012では、ヒットした各イオンの保持時間が記録される。この段階の出力が、データベースのペプチドからのある質量とヒットした高エネルギーおよび低エネルギーのデータからのイオンのリストである。
【0137】
上記のような工程1016では、合成の検出クロマトグラムが生成される。本発明の一実施形態では、ヒットした各イオンは、以下のように、検出ガウスのピークによって表される。クロマトグラムの時間範囲は、分離の時間範囲に相当する。クロマトグラムのFWHMピーク幅が、0.5分の場合、例えば、本発明の一実施形態では、検出クロマトグラムのサンプル期間は、その幅の約1%、すなわち0.005分になるように選択される。検出クロマトグラムの全ての点の初期値は、0に設定される。ヒットしたイオンのリストが、横断(ループオーバ)される。リストの各入力について、ガウス形状のピーク(検出ガウスのピーク)が、検出クロマトグラムに加えられる。検出ガウスのピークの幅は、データのクロマトグラフピークのFWHMの指定の部分に設定される。本発明の一実施形態では、この部分は10%である。したがって、検出ガウスのFWHMは0.05分である。検出ガウスのピークの幅は、ピークの保持時間を測定するのに用いる標準誤差に相当する。
【0138】
異なる質量を有する2個のイオンが、同時に溶出する場合、それらの検出ガウスは、ピーク高さ2を有する新たなピークに達する。異なる質量を有するN個のイオンが、同時に溶出する場合、それらの検出ガウスは、ピーク高さNを有する新たなピークに達する。
【0139】
工程1018〜工程1026は、上記の図3Cの工程362〜工程370と同様である。検出クロマトグラムの極大は、工程1018に見付けられる。閾値が決定される。検出閾値を決定することのできる方法は、以下のように指定される。閾値に対して可能性のある値は、同じ保持時間窓に存在する4個以上のイオン(低エネルギーでのAMRTを高エネルギーでのAMRTと合計することによって得られる)である。
【0140】
検出閾値を超える全ての極大は、データベースのペプチドと同一であるかまたはそれと密接に関連するかのいずれかのあるペプチドがデータ中に存在することを示唆する。極大は、検出の保持時間を決定する。相当な数のイオンを含んだ保持時間は、標的ペプチドがそのデータ中に存在するという示唆である。この保持時間を考えると、この保持時間の閾値内にあり、かつ質量の閾値内にある低エネルギーおよび高エネルギー両方のイオンはすべて、工程1020において選択される。付加的な閾値を適用して、これらの要件を満たすイオンの数を決定することができる。工程1022では、閾値を超えるイオンのグループが記録される。これらのグループは、ペプチド同定を示唆する。工程1024では、付加的な前駆体がある場合、工程1008に戻ることによって、次の前駆体ペプチドについて検索が繰り返される。工程1026では、結果の分析がさらに実行され得る。
【0141】
検出クロマトグラムを生成する際、関連のあるイオンならどれもあるヒットとして含むために、12Cイオンは、電荷および同位体クラスタの各々について見られるという付加的な要件を課してもよい。すなわち、13Cが見られる場合、同じ電荷状態の12Cが見られない限り計数されない。
【0142】
上記のPDSアルゴリズムは、従来のペプチド同定法に対して多数の利点を有する。先行技術の問題の1つは、それが、低エネルギーのAMRT(またはイオン)は、前駆体ペプチドのみであると仮定することにある。しかし、フラグメント化は、イオン化およびフォーカシング工程の一部として低エネルギー(インソースフラグメント化)で起こり得る。このため、従来のシステムでは、実際は前駆体ではないAMRTによって、検索を開始することができる。そのような検索は、結果として標的へのヒットにならないか、または標的へのヒットは、結果として誤った偽の同定になるかのいずれかである。このような誤った同定は、偽陽性と呼ばれる。
【0143】
しかし、本発明の実施形態を用いれば、例えば、図5Bからわかるように、低エネルギーにおいて出現するインソースフラグメントが検出される。本発明の実施形態は、低エネルギーおよび高エネルギーのデータのAMRTを検出するので、実際にはフラグメント(トリプシン前駆体ではない)である低エネルギーのAMRTがすべて同定される。
【0144】
本発明の実施形態の別の利点は、検索を行うことができ、かつ前駆体質量を検出しなくても、ペプチド配列を同定することができることにある。すなわち、データベースからのペプチドは、前駆体分子量(mwHPlus)Mを有し得る。従来の方法では、検索は、分子量(mwHPlus)Mを有するペプチドを、データベース中に見付けることによって開始される。データベースが、この分子量を有するペプチドを含んでいない場合、従来のシステムは同定を行わない。
【0145】
しかし、ペプチド混合物は、データベースから取得されたペプチドに関連しているが同一ではないペプチドを含んでいるかもしれない。例えば、ペプチドは、データベースのペプチドに化学的に関連する試料中に存在するかもしれない。この場合、Yおよび/またはBイオンは存在するかもしれないが、その前駆体mwHPlusは存在しないかもしれない。本発明の実施形態を用いれば、共通の保持時間において過剰に豊富な(検出閾値を超える)イオンは、標的前駆体の配列に密接に関連する分子が、試料中に存在することが裏付けられる。そのような状況を生じ得る工程の例は、タンパク質の一次配列の修飾、またはタンパク質の翻訳後修飾であるか、あるいは消化後に、ペプチドの一末端または他方末端が修飾されるかクリップされる可能性がある。
【0146】
修飾タンパク質の一次配列の一例は、単一ヌクレオチド多型(SNP)であり、これは、DNA配列中の単一塩基の違いである。SNPは、1つの変化/100個の塩基の頻度で生じ得る。ある有機体では、SNPは、タンパク質データベースから導出された理論上の配列とは、ある単一アミノ酸だけ異なるトリプシンペプチドを生じ得る。この単一アミノ酸の置換は、未修飾の配列の理論上の質量に関連して、前駆体の質量を変えるのに十分である。この置換は、ペプチド配列の残りを無傷のままにしておく。特に、アミノ酸置換のポイントまでは、修飾されたペプチドのYイオンおよびBイオンのシリーズは、未修飾の配列のシリーズと同一である。
【0147】
したがって、mwHPlus質量Mを有するデータベース中のペプチドと実質的に同じ配列を有する、試料混合物中のペプチドが生じるかもしれない。しかし、試料中のペプチドの配列または化学組成が変わると、一般に、その質量の前駆体が変化する。したがって、質量Mの前駆体は、そのデータ中に存在しないであろうが、データベースから導出された質量に相当する配列の相当な数のYイオンおよびBイオンは、試料データ中に存在する。これらのサブ配列イオンに相当するイオンは、データ中に実質的に同じ保持時間で出現する。したがって、ヒットの蓄積は、データベース中の前駆体の理論上の質量が、そのデータ中に存在することを必要としない。
【0148】
修飾された配列の保持時間は、一般に、標的配列(存在する場合)の保持時間とは異なる。修飾された配列および標的配列は、異なる2個のペプチド分子に由来する。この2個の分子の各々は、クロマトグラフ分離において異なって保持される。したがって、修飾されたペプチドおよび(未修飾の)標的ペプチドが、ともに試料中に存在する場合、標的配列のための検出クロマトグラムでは、各ペプチドについて1つである2つの検出ピークが出現する。これらの検出ピークの保持時間は、それぞれの分子の保持時間を反映する。
【0149】
ヒットの質量許容値が、そのデータの固有の質量精度を反映し得ることは、本発明にとって注目に値する。すなわち、質量許容値を広げて、前駆体質量に影響を及ぼすと考えられる配列修飾を考慮する必要はない。修飾された配列の場合、データの固有の質量精度を反映する狭い質量許容値を使用する本発明は、前駆体の理論上の質量を排除する。しかし、そのような狭い質量許容値は、データベースから取得されたYおよびBの理論上の質量に相当するデータに存在する、YイオンおよびBイオンにヒットすることをさらに可能にする。
【0150】
したがって、十分なヒットが、修飾されたペプチドの溶出の保持時間において蓄積すると、YイオンおよびBイオンのみとの一致が、十分なヒットを生成して、そのデータ中に修飾されたペプチドが存在することを検出することができるので、修飾されたペプチドが検出される。本発明は、未修飾のペプチドの理論上のフラグメント質量を用いることによって、修飾されたペプチド配列を検出することができる。
【0151】
したがって、検索を実行することができるとともに、データベース中のペプチドに関連する試料データ中で、ペプチドを見付けることができる。さらに、試料データは、ヒットしたイオンから部分配列情報を提供することができる。したがって、データベースペプチドのモノアイソトープは、LC/MSまたはLC/MS−Eデータには存在しないかもしれないが、本発明の実施形態は、データベースペプチドが、可能性のある修飾された形態で試料中に存在することをさらに同定し得る。
【0152】
修飾されたペプチドの検出を考えると、その保持時間に溶出するデータ中の質量を続いて調査すれば、修飾されたペプチドの正確な配列および質量を明らかにすることができる。例えば、アブイニシオシーケンスアルゴリズムを、データの質量に適用してペプチド配列を決定することができる。
【0153】
図11は、約87分において、データにあることが検出されたデータベースからのペプチドを示している。この保持時間において見られたmwHPlusの最高値は、その前駆体のmwHPlusと一致している。図11は、(それが閾値を超えるときには、ノイズに対して想定されるよりも多くの)相当な数のヒットを有すると思われるが、データベース中には前駆体が存在しない、約49分におけるペプチドの一例も示している。具体的には、約49分では、約5個のイオンが、共通の保持時間49分で観察される。ペプチドに関連するmwHPlusを有するイオンは見られない。これは、試料中に存在し、かつデータベースのペプチドに化学的に関連する、ペプチドの一例であり得る。該2つのペプチドは、異なった保持時間において溶出し、このことは異なった化学組成を示唆していることに留意されたい。
【0154】
したがって、図11のプロットによって示したように、ペプチド混合物は、データベースから取得されたペプチドに関連するがそれと同一ではないペプチドを含み得る。
【0155】
要約すると、本発明の実施形態は、従来のシステムに対して多数の利点を提供する。これらは、知られたペプチド質量のあるデータベースを用いてデータを検索することを含む。本発明の実施形態は、低エネルギーフラグメントを低エネルギー(トリプシン)前駆体として誤って同定することなく、低エネルギーデータ中のペプチドフラグメント(先行技術は、各低エネルギーAMRTは前駆体であると誤って推定する)を同定することができる。
【0156】
データのアーカイブ検索を実行するように、本発明の実施形態を構成することができる。MSの質量分解能が十分に高く、保持時間分解能が十分に高く、高/低切り換えプロトコルを用いてデータが得られる限り、ペプチドを同定することができるはずである。次いで、これらのペプチドの強度および保持時間を、データ中のヒットしたイオンから測定することができる。
【0157】
さらに、本発明の実施形態は、データのグローバル検索を可能にする。例えば、高エネルギーデータは、世界中でアーカイブすることができ、またこのアルゴリズムを用いてレトロスペクティブに検索することができる。
【0158】
本発明の実施形態は、共有された配列が同一でない場合、または共有が完全ではない場合であっても、データベース中のペプチドと配列を共有するデータ中のペプチドを検出することができる。例えば、YイオンおよびBイオンの部分配列の存在は、典型的には、AMRTをデータベースからのペプチドに関連しているものとして同定するのに十分である。
【0159】
また、本発明の実施形態は、データベースのペプチドと同じ配列を有するが、化学的に修飾されたデータ中のペプチドを検出する。YイオンおよびBイオンの部分配列の存在は、AMRTを、データベースからのペプチドに関連するものとして同定するのに十分である。
【0160】
本発明の実施形態は、高/低切り換えMS分析において保持時間合致を用いる。クロマトグラフ分解能の改善は、ペプチドを同定する能力の改善に直接つながる。例えば、クロマトグラフピーク幅が低減される(分解能は増大した)ので、検出閾値が低減され得る。本発明の実施形態は、ピーク形状および幅一致をさらに使用して、高/低MS分析を調整する。
【0161】
本発明の実施形態は、保持時間特異性を用いて、前駆体、例えば、アンモニア分子などの中性の水分子を失ったペプチドを有するペプチドの化学修飾であるイオンを、さらに同定することができる。ペプチドがデータ中に存在していると同定された後、そのペプチドに関連するすべてのイオンを同定することができる。その結果、これらのより低いレベルのペプチドは、前駆体あるいはYフラグメントまたはBフラグメントであると誤って同定されない。
【0162】
本発明の実施形態は、バックグラウンドノイズの測定を提供する。その結果、データの統計的挙動に基づいて、同定の有意性または信頼性を算出することができる。ヒストグラムよりはむしろ、保持時間インターバルにおけるヒットの数、検出クロマトグラムは、保持時間インターバル内のヒットの最長の連続する配列のみを計数することができる。すなわち、Y2、Y4、Y5、Y6、Y7、Y10がヒットした場合、これらの4個のイオン(Y4、Y5、Y6、Y7)だけが、Yイオンの連続するある配列を形成する。検出ヒストグラムは、保持時間において4個のイオンを含むであろう。検出閾値の有意性は、モンテカルロ手段によって評価することができるか、またはデータからバックグラウンドヒットの統計的特性を取得することによって評価することができる。また、データベースにおけるペプチドの分布を用いてヒットの有意性を評価するように、本発明の実施形態を構成することができる。
【0163】
本発明の実施形態は、データベース検索において強度規則および配列規則を使用するように構成することもできる。例えば、候補前駆体AMRTが、高エネルギーおよび低エネルギー両方のスペクトルで見られる場合、高エネルギースペクトルにおける前駆体の強度を、低エネルギースペクトルにおいて見られる前駆体の強度と比較することができる。AMRTがある前駆体である場合、高エネルギーにおけるその強度は、低エネルギーにおける強度未満でなければならない。高エネルギーにおける強度が、低エネルギーにおける強度を超えると測定された場合、低エネルギーおよび高エネルギーにおいて見られるAMRTは、実際には恐らくさらに別の前駆体フラグメントである。この場合、PDSアルゴリズムは、低エネルギーAMRTを可能性のある前駆体として排除するように構成することができ、これにより可能性のある偽陽性同定が除去される。
【0164】
別の規則の一例として、フラグメントAMRTの強度が、その前駆体と関連する可能性のある他のフラグメントARMTの強度に対して、外れた値であると判断された場合、所与の前駆体とのヒットは削除される。
【0165】
別の規則の一例として、特定の前駆体配列について、アミノ酸組成は、その前駆体の特定のYイオンまたはBイオンが、効果的にイオン化するべきであるということを示すことが考えられる。フラグメントAMRTの相対強度または絶対強度が、イオン化効率のそのようなモデルと一致しない場合、その不一致は、配列の同定を排除するための根拠を提供し得る。他方では、フラグメントAMRTの相対強度または絶対強度が、そのようなイオン化効率のモデルと一致する場合、これは、配列の同定を裏付け得る。
【0166】
AMRTを分析することに関する問題は、それらの強度のダイナミックレンジである。データのセットのAMRTは、大きなダイナミックレンジにわたる強度とともに生じ得る。この強度のダイナミックレンジは、1:1000以上であり得る。MS技術の進歩が、このダイナミックレンジを1:10,000以上まで拡大することができる。大きなダイナミックレンジは、2つの効果から生じる。第1に、ペプチドの組成の変化は、イオン化効率の変化を生じるので、試料中の所与のタンパク質は、ダイナミックレンジが1:100以上かもしれないAMRTを生成し得る。その結果、いくつかのAMRTは、他のものよりも効果的にイオン化し得る。第2に、濃度のダイナミックレンジが大きい異なるタンパク質が、試料中に生じ得る。
【0167】
したがって、低強度AMRTは、複数の源から生成され得る。例えば、低強度AMRTは、ペプチドのイオン化が弱い高濃度のタンパク質から、またはペプチドが効果的にイオン化する低濃度のタンパク質から生じ得る。
【0168】
したがって、強度の大きいダイナミックレンジは、偽陽性同定の可能性のある源である。イオン化が弱い高濃度のタンパク質からのAMRTまたはイオンは、低濃度のタンパク質からの高度にイオン化するペプチドから生じるものと誤って解釈される恐れがある。
【0169】
ダイナミックレンジによって生じるこの複雑さに対処する方法が、開示されている。該方法は、Electronic Depletion Algorithm(EDA)と呼ばれ、低濃度のタンパク質が分析される前に、高濃度のタンパク質に関連するイオンをすべて同定かつ除去する。高濃度のタンパク質に関連するAMRTを除去すれば、試料中の高強度のすべてのAMRTの他、高濃度のタンパク質から来る試料中の低強度のすべてのイオンも除去される。したがって、高濃度のタンパク質からの低強度AMRTは、効果的にイオン化する低濃度のタンパク質からのAMRTと混同されない。
【0170】
高濃度のタンパク質に関連する低い強度のAMRTおよびイオンを除去すれば、偽陽性の重要な源が低減される。例えば、低強度AMRTの変化は、低濃度のタンパク質のバイオマーカーの証拠として誤って解釈されるかもしれない。実際、この場合、それは、誤って同定された、高濃度のタンパク質のイオン化の弱いフラグメントである。
【0171】
図12は、本発明の一実施形態によるEDAを実行する方法のフローチャートである。工程1202では、データの全てのAMRTは、上記PDSを用いて同定される。工程1203では、AMRTに相当するペプチドが同定される。同定されたAMRTは、最高の強度から最低の強度まで強度として工程1204において格納され、リストに格納される。
【0172】
工程1206では、リストに残っている最も強いペプチド(リストの一番上の項目)が選択される。工程1208では、PDSを用いて、そのペプチドに関連する前駆体、YイオンおよびBイオンの各々に、ペプチドで標識が付けられる。工程1210では、工程1208において標識を付けた前駆体、YイオンおよびBイオンに関連する各ニュートラルロスAMRTに、ペプチドで標識が付けられる。工程1212では、標識の付いた全てのAMRTは、データから除去される。工程1214において、決定される所定の強度閾値より高い強度を有するAMRTが存在しない場合、方法は工程1216で終了する。他方では、強度閾値よりも高い強度を有する別のAMRTが存在する場合、処理は、最も高い強度を有する残りのペプチドを用いて工程1206で継続する。
【0173】
本発明の実施形態は、保持時間およびmwHPlusの標準誤差を測定するように構成することができる。この方法に関連する保持時間の測定誤差は、単一のペプチドに共通するAMRTおよびイオンの誤差である。したがって、この誤差は溶出誤差ではない。この誤差は、保持時間を測定し得るのに用いる制限のみに起因する。
【0174】
本発明の実施形態に関連するmwHPlusの測定誤差は、正確に質量測定されたタンパク質およびペプチドのデータベースに関連する誤差である。この誤差は、m/zを質量分析計で測定し得るのに用いる制限に起因する。このm/zの誤差には、2つの源があり、それらは、統計的ノイズと較正誤差である。
【0175】
これらの誤差を用いて、どのAMRTがヒットを構成するのかを決定する際、および場合によっては上記のPDS法の検出クロマトグラムを構成する際に使用される閾値を設定するので、保持時間誤差およびmwHPlus誤差を、推定しなければならない。
【0176】
保持時間誤差およびmwHPlus誤差は、誤差分布の標準偏差として測定される。該標準偏差を考えると、どのAMRTがヒットを構成するかを決定する際に使用され、かつ検出クロマトグラムにおいて相当数のヒットを有する閾値は、標準偏差の数倍である。典型的な値は、3シグマすなわち1/1000の偽陽性率に対しては3であるかもしれないし、あるいは6シグマすなわち1/1000000の公式の偽陽性率を指定するかもしれない。
【0177】
本発明の一実施形態によれば、保持時間誤差およびmwHPlus誤差を決定するために、低エネルギーおよび高エネルギーにおいて共通であるイオンが同定される。例えば、低エネルギーにおいて出現するトリプシン前駆体は、低減された強度であるにもかかわらず、高エネルギーでも出現する。イオン間の保持時間の名目上の差は、必然的にゼロである。mwHPlusの名目上の差はゼロである。
【0178】
これらイオン間の観察された保持時間の差は、保持時間の誤差の尺度である。そのような多くの対からの誤差を組み合わせることによって決定されるような、この誤差の標準偏差は、保持時間の標準誤差の測定の基礎となる。
【0179】
上記に基づけば、図13は、本発明の一実施形態による、保持時間誤差およびmwHPlus誤差を決定する方法である。工程1302では、低エネルギーのすべてのAMRTS(またはイオン)をループする。質量および保持時間に大きな閾値(例えば、それぞれ50ppmおよび0.5分)を用いて、工程1304で一致する高エネルギーのすべてのAMRT(またはイオン)を見付ける。工程1306では、保持時間とmwHPlusとの一致間の誤差が分析される。工程1308では、中央値フィルタリングなどの標準的な技術を用いて、外れた値が除去される。工程1310では、得られた分布に対する標準偏差が算出される。工程1312では、mwHPlusの標準偏差を、統計的因子(3〜6)と掛け合わせて、どのAMRTがPDSアルゴリズムにおいてヒットするかを決定する際に使用することのできる分子量閾値を確立する。工程1314では、保持時間の標準偏差を、統計的因子(3〜6)と掛け合わせて、PDSアルゴリズムの検出クロマトグラムを生成する工程において使用することのできるある保持時間閾値を確立する。
【0180】
ペプチドがデータ中に存在するか否かを決定する際に使用される検出閾値は、以下の様式で決定することができる。N個以上のAMRT(またはイオン)が見付かった場合、データベース中のペプチドは、そのデータ中で検出されたと考えられる。この数Nは、試料の複雑さに応じる。試料が複雑になるほど、Nは大きくなるはずである。ヒットのバックグラウンドを検証することによって、データから実験的にNを決定することができる。標準的なヒストグラムまたは他の統計的技術を用いて、Nを確立することができる。実際、4〜6のNの値は、高/低データにおいて見付けられたAMRTに対して受容可能な検出閾値であることが判明した。
【0181】
本発明から得られた結果は、試料中で同定されたペプチドのリストである。リスト中のそのようなペプチドの各々は、データベースからのペプチド配列、および前駆体の測定された保持時間、測定されかつ理論上の質量、前駆体の測定された強度を含む他、データ中に見付けられかつ前駆体に関連する、フラグメントイオンの測定された保持時間、強度および質量も含む。これらの結果は、プロテオミクス分野で高い有用性を有するであろうことが期待される。例えば、そのようなプロテオミクスの4つの用途は、試料中のタンパク質の同定、試料間のペプチドの保持時間の追跡、および試料間のペプチドおよびタンパク質の定量である。
【0182】
この方法によって同定されるペプチドは、元のタンパク質配列が試料中に発生したことの証拠となる。例えば、本発明によって同定されたトリプシンペプチドに相当するタンパク質のリストは、試料中に存在するタンパク質を同定する1つの方法である。観察されたペプチドの同定および濃度から、当技術分野で知られているアルゴリズムが、親タンパク質の同定および濃度を推定することもできる。
【0183】
このリスト上のエントラントは、偽陽性を含んでいるかもしれない。すなわち、ペプチドの同定を誤ると、タンパク質の同定を誤る恐れがある。先行技術で知られているいくつかの手段の1つを用いれば、偽陽性を低減または除去することが可能である。あるタンパク質を同定するには、そのタンパク質に対して2個以上のペプチドを本発明の方法によって同定することを要求することができる。ユーザは、N>1の場合にそのようなペプチドが検出されるように指定してよい。あるいは、そのユーザは、最小のパーセンテージの範囲(アミノ酸による)のタンパク質配列が、該タンパク質に対して1個以上のペプチドを検出することによって達成するように指定してよい。また、ユーザは、試料を数回反復してLC/MS分析する各々において、タンパク質が同定されるように要求してよい。当該分野で知られている可能性のある他の規則を適用して、タンパク質の偽陽性同定を低減することもできる。
【0184】
本発明は、同じかまたは異なったLC/MSシステムで分析された複数の試料から取得されたデータに適用することができる。データベースからのペプチド配列が、2つ以上のそのような試料または分析で見られた場合、各試料または分析からのそのペプチドの保持時間を比較することができる。したがって、本発明は、ペプチドの保持時間を注入毎に追跡する手段を提供する。また、異なるLC分離方法論を利用した、異なる器具によって取得されたデータ中にペプチドを検出することもできる。したがって、そのペプチドの保持時間を、そのような異なる器具とLC分離との間で比較することもできる。
【0185】
同じかまたは異なる器具での複数の注入において見られるような同じ配列の保持時間の一致を検証することができる。このような一致の検証を用いて、偽陽性同定を検出しかつ削除することができる。
【0186】
所与の混合物の反復注入において見られるような、または異なる条件下で試料を注入する際に見られるような、同じペプチドの強度を考える場合、先行技術の方法を適用して強度を較正し、ペプチドおよびタンパク質の発現の変化を決定することができる。例えば、2つの試料の注入間で、同じペプチド配列が検出された場合、相当する前駆体の強度の比を計算することもできる。これらのペプチドが、較正用の標準タンパク質からのものである場合、比は、それぞれの注入の相対的濃度較正または絶対的濃度較正を可能にする。ペプチドが、試料に内在性のタンパク質からのものである場合、比を用いて、ペプチドまたは元のタンパク質の発現レベルの変化を決定することができる。
【0187】
本発明の方法を、ペプチドの混合物以外の混合物に適用することができる。(1)分子の任意の混合物、および(2)それら分子およびそれらのフラグメントの質量を含んだデータベースを考える場合、本方法を用いて、試料中でその分子を同定することができる。
【0188】
適用される方法について、試料は、記載のLC/MSシステムによって分析される。上記方法による前駆体分子のフラグメント、ならびに前駆体およびフラグメントの理論上の質量は、知られている。これらの条件が満たされると、本発明の方法によって前駆体を同定することができる。上記の方法の考察では、前駆体は、低エネルギーで見られるイオンの質量を参照する。フラグメントは、高エネルギーまたは場合によっては低エネルギーで見られる前駆体のフラグメントの質量を参照する。次いで、本方法は、カラムで分離される元の分子を同定する。
【0189】
したがって、例えば、代謝試験は、本発明から利益を受けることができる。消化の工程は、代謝の分子には必要でない。本発明に必要なのは、前駆体およびそれに関連するフラグメントに相当する正確な理論上の質量のリストだけである。そのようなリストを用いれば、本方法は、質量のそのセットまたはサブセットの存在、および元の前駆体分子が、クロマトグラフカラムから溶出したときの保持時間を検出することができる。
【0190】
好適な一実施形態では、PDSアルゴリズムおよびEADアルゴリズムは、高エネルギーモードおよび低エネルギーモードを交番することで収集されたスペクトルにより取得されたデータに適用される。しかし、これらのアルゴリズムの両方を、1つのモードのみで、すなわち、固定されたエネルギーモードで収集されたスペクトルに適用することができる。したがって、例えば、これらのアルゴリズムを、低エネルギースペクトルまたは高エネルギースペクトルの一方だけに適用することができる。すなわち、原則的には、両モードが収集されてもいいが、単一モードのみに適用されるPDSまたはEDAアルゴリズムを用いて、ペプチドを同定することができる。前駆イオンのいくつかのフラグメント化が、単一エネルギーモードのみで行われる限り、これらのアルゴリズムを適用すれば、データ中の前駆体および/またはそのフラグメントの存在を検出するであろう。図5Cおよび図11Cに明らかなインソースフラグメント化は、PDSまたはEDAアルゴリズムを、低エネルギーデータのみに適用してもよいことを示している。
【0191】
したがって、データが、2つのモードで収集される要件が好ましいが、PDSまたはEDAアルゴリズムの適用にとって必ずしも必要ではない。
【0192】
単一の固定されたエネルギーのみで意図的に取得されたスペクトルデータに、PDSまたはEDAアルゴリズムを適用することができることにも留意されたい。実際、低エネルギーまたは高エネルギー取得に典型的に用いられる電圧の中間の電圧に相当するように、固定されたエネルギーモードで電圧(または電圧ステップ)を調整することも有利であろう。この目的は、前駆体およびフラグメントの最適な混合物を含むスペクトルを収集することであろう。このような取得は、PDSまたはEDAアルゴリズムを使用して、ペプチドの同定にも役立つであろう。
【0193】
本発明の好適な実施形態の上記開示は、例示および説明のためのものである。包括的であること、または本発明を開示した厳密な形態に限定することを意図したものではない。上記開示を考慮すれば、本明細書に記載の実施形態の多数の変形および改変が、当業者には明白であろう。本発明の範囲は、添付の特許請求の範囲およびその同等物によってのみ定められる。
【0194】
また、代表的な本発明の実施形態を記載において、本明細書は、本発明の方法および/またはプロセスを、特定の工程の順序として示したかもしれない。しかし、本方法またはプロセスが、本明細書に記載した特定の工程の順序に応じない程度まで、本方法またはプロセスは、記載した特定の工程の順序に限定されるべきではない。当業者であれば理解するであろうが、他の工程の順序も可能である。したがって、本明細書に記載の特定の工程の順序は、特許請求の範囲を限定するものと解釈されるべきではない。また、本発明の方法および/またはプロセスに向けられた特許請求の範囲は、書かれた順序のそれらの工程の性能に限定されるべきではなく、当業者であれば、その順序は変化されてよいとともに本発明の精神および範囲に依然としてあることを容易に理解することができる。
【図面の簡単な説明】
【0195】
【図1】本発明の一実施形態による、生物学的な複合混合物中のタンパク質を同定および定量するシステムを示す略図である。
【図2】例示的なスペクトルを取得したときの時間を示すグラフである。これらのスペクトルは、本発明の一実施形態による交番する低エネルギーモードおよび高エネルギーモードを適用した結果得られたものである。
【図3A】本発明の一実施形態による、ペプチド同定方法を示すフローチャートである。
【図3B】本発明の一実施形態による、ペプチド同定方法を示すフローチャートである。
【図3C】本発明の一実施形態による、ペプチド同定方法を示すフローチャートである。
【図4A】高エネルギーで見られたすべてのAMRTを示す例示的プロットである。
【図4B】低エネルギーで見られたすべてのAMRTを示す例示的プロットである。
【図4C】図4Aおよび図4Bに示したデータから導出した例示的な検出クロマトグラムであり、あるデータベースからの理論上の所与のペプチドに関する保持時間当たりのヒット数を示す。図4Cは、約78分において相当な数のヒットを有するように見える、データベース中の前駆体ペプチド配列の一例を示す。
【図5A】図4Aの高エネルギープロットにおけるAMRTのヒットのみを示す例示的プロットである。
【図5B】図4Bの低エネルギープロットにおけるAMRTのヒットのみを示す例示的プロットである。
【図5C】図5Aおよび図5Bの高エネルギーおよび低エネルギーのプロットのヒットを示すヒストグラムプロットである。図5Cは、約78分において相当な数のヒットを有するように見える、データベース中の前駆体ペプチド配列の一例を示す。
【図6A】クロマトグラフピークの第2の導関数ゼロ交差がどのように得られるかを示す。
【図6B】クロマトグラフピークの第2の導関数ゼロ交差がどのように得られるかを示す。
【図7】本発明の一実施形態による、ピーク形状およびピーク幅を比較する方法を示すフローチャートである。
【図8A】あるペプチドの例示的スペクトルを示す。
【図8B】図8Aに示した6個のイオン各々に相当する質量クロマトグラムのシリーズを示すグラフである。
【図9A】多数のスペクトルピークを示す例示的な高エネルギースペクトルのプロットである。
【図9B】図9Aに示したピークの1つの保持時間と同一の保持時間を有するスペクトルピークのみを示すプロットである。
【図9C】図9Aに出現するピークの大半に相当するクロマトグラフプロファイルを示すプロットのシリーズである。
【図10】本発明の一実施形態による、イオンを用いて複合混合物中のペプチドを同定する方法を示すフローチャートである。
【図11】相当数のヒットを有するように見えるが、データベース中には前駆体が存在しない、約49分におけるペプチドの一例を示すプロットである。
【図12】本発明の一実施形態による、electronic depletion algorithm(EDA)を実行する方法を示すフローチャートである。
【図13】本発明の一実施形態による、保持時間誤差およびmwHPlus誤差を決定する方法を示すフローチャートである。
【図14】検出ガウスのピークを加えた検出クロマトグラムを生成する方法を示すフローチャートである。
【図15】本発明の一実施形態による、配列同定およびそれらの保持時間を同定する方法を示すフローチャートである。
【図16】本発明の一実施形態による、各配列同定に関連するAMRTおよびイオンを収集する方法を示すフローチャートである。
【図17A】本発明の一実施形態による、イオンリストからAMRTを決定する方法を示すフローチャートである。
【図17B】本発明の一実施形態による、イオンリストからAMRTを決定する方法を示すフローチャートである。
【図17C】本発明の一実施形態による、イオンリストからAMRTを決定する方法を示すフローチャートである。

【特許請求の範囲】
【請求項1】
混合物中のタンパク質を同定する方法であって、
混合物を消化してペプチド混合物を得る工程と、
消化された混合物をLC/MSシステムに適用する工程と、
LC/MSシステムの質量分析計部分において低エネルギーモードを適用する工程と、
LC/MSシステムの質量分析計部分において高エネルギーモードを適用してデータをフラグメント化する工程と、
低エネルギーモード中に取得されたペプチド前駆体のデータから、質量情報および保持時間情報を取得する工程と、
高エネルギーモード中に取得されたフラグメントデータから、質量情報および保持時間情報を取得する工程と、
タンパク質のデータベースから標的前駆体を選択する工程と、
標的前駆体に関連する質量を決定する工程と、
標的前駆体に相当するYイオンおよびBイオン各々に関連する質量を決定する工程と、
標的前駆体に関連する質量、およびYイオンおよびBイオンに関連する質量を、ペプチドの前駆体データおよびフラグメントデータに関連する質量情報と比較する工程と、
比較から得られる質量の一致を検出する工程と、
質量の一致の保持時間を決定する工程と、
検出された質量の一致および検出された質量の一致の保持時間に基づいて、標的ペプチドが混合物中に存在するか否かを同定する工程とを含む方法。
【請求項2】
クロマトグラフピーク幅の間に、高エネルギーモードおよび低エネルギーモード各々が複数回適用されるように、高エネルギーモードおよび低エネルギーモードの適用を十分な頻度で交番するプロトコルに従って、高エネルギーモードと低エネルギーモードとを切り換える工程をさらに含む、請求項1に記載の方法。
【請求項3】
検出クロマトグラムを生成する工程をさらに含む、請求項1に記載の方法。
【請求項4】
検出クロマトグラムを生成するために、質量の一致に相当する検出ガウスのピークを個々の保持時間値域に加える工程をさらに含む、請求項3に記載の方法。
【請求項5】
検出閾値を決定する工程と、
特定の保持インターバル中の質量の一致の計数が、検出閾値を超えるか否かに基づいて、ペプチドが存在するかどうかを決定する工程とをさらに含む、請求項1に記載の方法。
【請求項6】
検出閾値に関連するノイズフロアを推定する工程と、
計数およびノイズフロアの推定に基づいて、ペプチド同定の有意性を分析する工程とをさらに含む、請求項5に記載の方法。
【請求項7】
低エネルギーモードが、LC/MSシステムの質量分析計部分の衝突セルにおいて低電圧を印加することによって適用され、高エネルギーモードが、LC/MSシステムの質量分析計部分の衝突セルにおいて高電圧を印加することによって適用される、請求項1に記載の方法。
【請求項8】
データベースとして、混合物中で見付けられる可能性があるタンパク質を有する特化されたデータベースを選択する工程をさらに含む、請求項1に記載の方法。
【請求項9】
ピーク特性を用いて、特定のクロマトグラフピークが標的前駆体に関連しているかどうかを決定する工程をさらに含む、請求項1に記載の方法。
【請求項10】
ピーク特性がピーク形状である、請求項9に記載の方法。
【請求項11】
ピーク形状が、ピークの頂点、上昇勾配変曲点、および下降勾配変曲点の分析を含む、請求項10に記載の方法。
【請求項12】
混合物中のタンパク質を同定するシステムであって、
混合物を消化してペプチド混合物を得る手段と、
混合物を適用して混合物を分離する液体クロマトグラフと、
液体クロマトグラフによって出力された分離された混合物中の質量を測定するための質量分析計とを備え、該質量分析計が、ペプチドをフラグメント化する衝突セルと、フラグメント化されたペプチドおよびフラグメント化されていないペプチドに関連する質量情報を決定する質量分析装置とを備え、前記システムがさらに、
標的前駆体が選択されるタンパク質のデータベースと、
データベースおよび質量分析計出力に結合され、分析コンピュータで実行されるソフトウェアを有する分析コンピュータとを備え、前記ソフトウェアは、分析コンピュータに、標的前駆体ペプチドに関連する質量を決定させ、標的前駆体ペプチドに対応するYイオンおよびBイオン各々に関する質量を決定させ、標的前駆体ペプチドならびにYイオンおよびBイオンに関連する質量を、ペプチドデータおよびフラグメントデータに関連する質量情報と比較させ、比較から得られる質量の一致を検出させ、質量の一致の保持時間を決定させ、検出された質量の一致および検出された質量の一致の保持時間に基づいて、標的ペプチドが混合物中にあるか否かを同定させる、システム。
【請求項13】
高電圧を衝突セルに印加してデータをフラグメント化し、低電圧を印加してフラグメン化されないデータを提供する、請求項12に記載のシステム。
【請求項14】
衝突セルは、クロマトグラフピーク幅の間に、高エネルギーモードおよび低エネルギーモード各々が複数回適用されるように、高エネルギーモードおよび低エネルギーモードの適用を十分な頻度で交番するプロトコルに従って、高エネルギーモードと低エネルギーモードとを切り換えるように構成された、請求項12に記載のシステム。
【請求項15】
コンピュータソフトウェアが、コンピュータに、さらに検出クロマトグラムを生成させる、請求項12に記載のシステム。
【請求項16】
コンピュータソフトウェアが、コンピュータに、さらに質量の一致に相当する検出ガウスのピークを個々の保持時間値域に加えて、検出クロマトグラムを生成させる、請求項15に記載のシステム。
【請求項17】
コンピュータソフトウェアが、コンピュータにさらに、
検出閾値を決定させ、
特定の保持インターバル中の質量の一致の計数が、検出閾値を超えるか否かに基づいて、ペプチドが存在するかどうかを決定させる、請求項12に記載のシステム。
【請求項18】
コンピュータソフトウェアが、コンピュータにさらに、
検出閾値に関連するノイズフロアを推定させ、
計数およびノイズフロアの推定に基づいて、ペプチド同定の有意性を分析させる、請求項17に記載のシステム。
【請求項19】
低エネルギーモードが、LC/MSシステムの質量分析計部分の衝突セルにおいて低電圧を印加することによって適用され、高エネルギーモードが、LC/MSシステムの質量分析計部分の衝突セルにおいて高電圧を印加することによって適用される、請求項12に記載の方法。
【請求項20】
データベースが、混合物中で見付けられる可能性があるタンパク質を有する特化されたデータベースである、請求項12に記載のシステム。
【請求項21】
コンピュータソフトウェアが、コンピュータに、ピーク特性を用いて特定のクロマトグラフピークが標的前駆体に関連しているかどうかを決定させる、請求項12に記載のシステム。
【請求項22】
コンピュータソフトウェアが、コンピュータに、ピーク形状を用いて特定のクロマトグラフピークが標的前駆体に関連しているかどうかを決定させる、請求項21に記載のシステム。
【請求項23】
コンピュータソフトウェアが、コンピュータに、ピークの頂点、上昇勾配変曲点、および下降勾配変曲点を分析させる、請求項22に記載のシステム。
【請求項24】
混合物中の前駆体を同定する方法であって、
液体クロマトグラフ部分および質量分析計部分を有するLC/MSシステムに混合物を適用する工程と、
LC/MSシステムの質量分析計部分において低エネルギーモードを適用する工程と、
LC/MSシステムの質量分析計部分において高エネルギーモードを適用してデータをフラグメント化する工程と、
低エネルギーモード中に取得された前駆体のデータから質量情報および保持時間情報を取得する工程と、
高エネルギーモード中に取得されたフラグメントデータから質量情報および保持時間情報を取得する工程と、
データベースから標的前駆体を選択する工程と、
標的前駆体に関連する質量を決定する工程と、
標的前駆体に相当するフラグメントイオンに関連する質量を決定する工程と、
標的前駆体に関連する質量およびフラグメントイオンに関連する質量を、前駆体データおよびフラグメントデータに関連する質量情報と比較する工程と、
比較から得られる質量の一致を検出する工程と、
質量の一致の保持時間を決定する工程と、
検出された質量の一致および検出された質量の一致の保持時間に基づいて、標的前駆体が混合物中に存在するか否かを同定する工程とを含む方法。
【請求項25】
混合物中の前駆体を同定する方法であって、
液体クロマトグラフ部分および質量分析計部分を有するLC/MSシステムに混合物を適用する工程と、
LC/MSシステムの質量分析計部分において固定エネルギーモードを適用する工程と、
固定エネルギーモード中に取得された前駆体およびフラグメントのデータから、質量情報および保持時間情報を取得する工程と、
データベースから標的前駆体を選択する工程と、
標的前駆体に関連する質量を決定する工程と、
標的前駆体に相当するフラグメントイオンに関連する質量を決定する工程と、
標的前駆体に関連する質量およびフラグメントイオンに関連する質量を、前駆体データおよびフラグメントデータに関連する質量情報と比較する工程と、
比較から得られる質量の一致を検出する工程と、
質量の一致の保持時間を決定する工程と、
検出された質量の一致および検出された質量の一致の保持時間に基づいて、標的前駆体が混合物中に存在するか否かを同定する工程とを含む方法。

【図1】
image rotate

【図2】
image rotate

【図3A】
image rotate

【図3B】
image rotate

【図3C】
image rotate

【図4A】
image rotate

【図4B】
image rotate

【図4C】
image rotate

【図5A】
image rotate

【図5B】
image rotate

【図5C】
image rotate

【図6A】
image rotate

【図6B】
image rotate

【図7】
image rotate

【図8A】
image rotate

【図8B】
image rotate

【図9A】
image rotate

【図9B】
image rotate

【図9C】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17A】
image rotate

【図17B】
image rotate

【図17C】
image rotate


【公表番号】特表2007−538260(P2007−538260A)
【公表日】平成19年12月27日(2007.12.27)
【国際特許分類】
【出願番号】特願2007−527477(P2007−527477)
【出願日】平成17年5月20日(2005.5.20)
【国際出願番号】PCT/US2005/017742
【国際公開番号】WO2005/114930
【国際公開日】平成17年12月1日(2005.12.1)
【出願人】(504438255)ウオーターズ・インベストメンツ・リミテツド (80)
【Fターム(参考)】