説明

多重タンデム質量分析法

本発明は、少なくとも2つの前駆体を含む被分析試料の多重タンデム質量分析方法に関する。少なくとも2つの単純化された多重MS-MSスペクトルの各々は、前記試料の少なくとも2つの選ばれた前駆体から得られる。当該方法は:各選ばれた前駆体について、前記単純化された多重MS-MSスペクトルのフラグメントイオンを選ぶことによって、前記単純化された多重MS-MSスペクトルから個々のMS-MSスペクトルを生成する手順であって、前記フラグメントイオンは前記前駆体から得られる可能性のあるフラグメントイオンである、MS-MSスペクトル生成手順;前記MS-MSスペクトル生成手順の個々のMS-MSスペクトルを、スコア閾値条件又は低スコア閾値条件が存在しないスコアリング処理を用いることにより現実のデータベース及び囮のデータベース検索へ提出することで、候補となる前駆体及び該前駆体のフラグメントイオンを同定するデータベース検索提出手順;前記データベース検索提出手順の現実のデータベース検索の結果同定された候補となる前駆体から現実の個々のMS-MSスペクトルを生成する現実のMS-MSスペクトル生成手順;前記データベース検索提出手順の囮のデータベース検索の結果同定された候補となる前駆体から囮の個々のMS-MSスペクトルを生成する囮のMS-MSスペクトル生成手順;並びに、前記現実の個々のMS-MSスペクトル及び囮の個々のMS-MSスペクトルを、スコア閾値条件が存在する他のスコアリング処理へ提出することで、現実の個々のMS-MSスペクトル及び囮の個々のMS-MSスペクトルについてのスコアを決定する手順を有する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、質量分析の一般的な分野に関する。
【背景技術】
【0002】
質量分析(MS)は概して、その種類によらず、試料中に存在する分子が、イオン源中で電離され、加速され、かつ、質量分析装置中に注入された後に、これらの分子の質量を測定することによって、これらの分子を分析するのに用いられる手順を有する。
【0003】
質量分析装置は、生成されたイオンの質量対電荷比(m/z)の値の関数として、分析される試料中に含まれる様々な分子の質量スペクトルを生成する。
【0004】
特に、タンデム質量分析装置(MS-MS)は、分子の同定及び評価のための強力な道具として周知で、かつ一般的には、1次質量スペクトルでは生成されたイオンの同定が不可能なときに用いられる。
【0005】
タンデム質量分析装置は一般的に、空間的に連続して動作する2つの質量分析装置で構成され、かつ、解離装置又は時間的に連続して動作する1つのマスアナライザによって隔てられている。
【0006】
タンデム質量分析装置は一般的に、第1質量分析装置による、分析される試料中に存在するイオン化した分子(前駆体イオンとも呼ばれる)の1次質量スペクトル(MS)の生成、たとえば質量選択窓を介して1次質量スペクトル(MS)中の前駆体質量を選択する手順の実行、続いて前記の選択された前駆体質量の前駆体イオンを分裂する−すなわち解離装置による解離−のに必要な手順を有する。その後第2質量分析装置によって、前駆体イオンの解離により生成されるフラグメントイオンの解離質量スペクトル(MS-MS)として記述される質量スペクトルが生成される。
【0007】
これらの手順は、選択された前駆体質量と同数のMS-MSスペクトルを生成する1次MSスペクトルの選択された前駆体質量の各々について繰り返される。
【0008】
MS-MSスペクトルが次々に生成されることで、一般的には各MS-MSスペクトルを生成するように実装される前駆体質量の選択は、タンデム質量分析装置の取得上の不利益を制限する。
【0009】
前駆体質量の選択はまた、MSスペクトルの生成と比較して、MS-MSスペクトルの生成に用いられる試料の量を顕著に増大させる。イオン源によって供される残りの未選択前駆体は、選択された1次イオンのMS-MSスペクトルの生成のために実際に除去される。
【0010】
連続する前駆体質量の選択に起因したスループットにおけるこの第1の制限に加えて、第2の制限は、各MS-MSスペクトルを生成する質量選択窓あたりに2つ以上の前駆体の選択が可能なことである。
【0011】
このような意図しない多重質量選択は、MS-MSスペクトルの幅を生成するのに用いられる質量選択窓の幅に起因する。質量選択幅は、質量分析装置−特に高分解能の質量分析装置−の分解能よりも広い。MSイオン選択装置がタンデム質量分析装置における前駆体の選択に用いられるため、質量選択窓の幅はMSの分解能よりも広い。
【0012】
複数の選択された前駆体イオンのフラグメントイオンは、生成されたMS-MSスペクトルの複雑さを増大させ、かつ、一般的には、MS-MSスペクトルの分析による前駆体質量の選択の目的である前駆体の同定効率を減少させる。
【0013】
よって単純化されたMS及びMS-MSスペクトルは一般的に、様々な手法−たとえばデアイソトーピング(deisotoping)、電荷除去、校正等−によるピークから生成される。前記様々な手法では、MS及びMS-MSスペクトルは、前駆体を同定する最終的な分析に用いられる。
【0014】
単純化されたMS及びMS-MSスペクトルは、質量対電荷比m/zの値のリストである。各最大強度値は、MS及びMS-MSスペクトルのピークに対応する。MS及びMS-MSスペクトルが決定されるときには、イオン電荷も用いられる。
【0015】
標準的なタンデム質量分析装置の上述の制限は特に、たとえばエレクトロスプレーイオン化イオン源(ESIイオン源)を備えるタンデム質量分析装置と結合した液体クロマトグラフィ(LC-MS-MS)を用いた、消化されたタンパク質から得られたペプチドの複雑な混合物のタンパク質分析(「ボトムアップ」プロテオミクス)において特に深刻である。
【0016】
「ボトムアップ」プロテオミクスでは、分析されるタンパク質の混合物は、LC分離前にペプチドを生成する、切断試薬(cleavage reagent)−たとえばトリプシン、シアノゲン、臭化物等−によって洗浄されて切断される。
【0017】
この手法は、ペプチドのLC分離、並びに、各LCピークについて、ペプチドのイオン化(前駆体イオン)に続いて選択されたペプチドの解離後に、そのペプチドの1次MSスペクトルの生成、タンデム質量分析装置によるMS-MSスペクトルの生成、及び、生成されたMS-MSスペクトルによる選択されたペプチド(及びその親タンパク質)のタンパク質配列データベース検索による同定を含む。
【0018】
少数のタンパク質を含む試料についてのLC-MS-MS取得の間、MSスペクトルにおける各ペプチド(前駆体)は、対応するMS-MSスペクトルを生成するように選択されて良い。
【0019】
しかし複雑なタンパク質試料の分析では、LC-MS-MS法のMS-MSスループットは、LCピークの限られた溶出期間−これは典型的には1〜30秒間である−の範囲内で、MSスペクトルの選択された前駆体の各々のMS-MSスペクトルを順次取得するのに必要な時間によって明らかに制限される。
【0020】
従って、タンパク質の複雑な混合物のLC-MS-MS分析中では、ペプチドのほんの一部しか同定できない。
【0021】
各LCピーク後の対応するMS-MSスペクトルを生成する限られた数の前駆体を選択するのに利用される最も一般的な手法は、「データ依存」分析である。この「データ依存」分析では、MSスペクトルの最も強いMSピークが自動的に、MS-MS用に最初に選ばれる。
【0022】
一般的には、データベース検索は、上述の単純化されたMS及びMS-MSスペクトルを用いて実行される。データベース検索はまた、たとえばアミノ酸配列のほんのわずかな部分(「タグ」)が生成される「配列タグ付け(sequence tagging)」のようなMS-MSスペクトルの前処理と共に、又は、完全なアミノ酸配列がMS-MSスペクトルから直接計算される「新規シーケンシング(De Novo sequencing)」と共に実行されても良い。
【0023】
データベース検索は一般的に、たとえばMascot又はSequest検索ツールのようなスコア付け法を用いた自動コンピュータ検索によって実行される。
【0024】
多くのタンパク質データベース−たとえばSwissprot、NCBInr、MSDB等−は、自動コンピュータ検索に用いられて良い。
【0025】
データベース検索中、データベースのタンパク質は、LC-MS-MSデータ生成のためにユーザーによって利用される同一の切断試薬によって電子的に切断される(「イン・シリコ消化切断」)。切断されたタンパク質の各々に対応するペプチドを有するペプチドリストが生成される。可能性のあるペプチドの候補のサブリストが、ユーザーによって選択されるMS精度の範囲内で、LC-MS-MSデータ生成中に選択される実験用MS前駆体の各々について選択される。
【0026】
可能性のあるペプチド候補の各々の可能性あるペプチドパターンのすべてが、LC-MS-MS分析用にユーザーによって選択されるパラメータ(MSとMS-MSの精度、フラグメンテーションエネルギー、使用されるタンデム質量分析装置、生成されるフラグメントイオンの種類等)の関数としての対応する理論MS-MSスペクトルを生成するように計算される。
【0027】
実験により得られた各MS-MSスペクトルのフラグメントイオンは、理論的なMS-MSスペクトルのフラグメントイオンと比較される。
【0028】
同定されたペプチド候補(及び対応するタンパク質)のリストが、データベース検索に提出された各MS-MSスペクトルの対応する同定スコアによって生成される。最高スコアは通常、最善の候補の同定に対応する。
【0029】
ユーザーによってペプチドスコアの閾値が選ばれた後、すべての同定されたペプチドと、分析された試料についての完全なLC-MS-MS取得のうちの最高同定スコアとを結合させた、同定されたタンパク質候補の最終リストが生成される(通常は各MS-MSスペクトルの最もよく同定されたペプチド候補)。
【0030】
ペプチド候補(及び対応するタンパク質)の最終リストは、スコア閾値よりも大きなスコアを有する正同定を有する。この最終リストは、ペプチド候補の真の正同定だけではなく、ペプチド候補の偽の正同定も含む。
【0031】
スコア閾値未満の同定は偽の負同定と真の負同定である。
【0032】
意図しない偽の正同定及び真の負同定を引き起こすのには多くの原因−たとえば不十分な質のMS-MSスペクトル、検索パラメータに含まれない翻訳後修飾(PTM)によるタンパク質に対応するペプチドの選択等−がある。
【0033】
分析される試料のタンパク質の組成は一般的に、ユーザーには未知であるか、又は一部しか知られていない。従って最終的なペプチド(及び対応するタンパク質)のリスト内での偽の正同定の数は、個別ではなく、たとえば囮のデータベース検索のような統計的手法を用いて決定されうる。
【0034】
囮のデータベースは実際のデータベースから構築される。囮のデータベースのタンパク質は、実際のデータベースのタンパク質のアミノ酸配列を逆にするか又はランダムにすることによって得られる。囮のデータベース検索は、実際のデータベース検索において同一の検索パラメータを用いて実行される。
【0035】
実際のデータベース検索の正同定は、真の正同定と偽の正同定を合わせた数を与える。同一の検索パラメータ及びスコア閾値条件を用いる囮のデータベース検索の正同定は、実際のデータベース検索における偽の正同定の数の推定値を与える。ペプチド(及び対応するタンパク質)の同定における信頼性レベルは、実際のデータベース検索の正同定数と、実際のデータベース検索の正同定数との比によって定義されるFDR(False Discovery Rate)値によって与えられる。FDRの値が小さければ小さいほど、同定の信頼性レベルは高くなる。
【0036】
ユーザーは、スコア閾値を単純に増大させることによってFDR値を減少させて良い。少なくとも2つの異なるペプチドが同定される正のタンパク質同定の選択のような、より洗練された分析が用いられても良い。
【0037】
タンパク質の複雑な試料のLC-MS-MSでは、2つ以上の前駆体が、MS-MSスペクトルを生成するための所与の前駆体の質量付近で、質量選択窓によって意図せずに選ばれてしまうことがよくある。
【0038】
複数の選択された前駆体のフラグメントイオンは、生成されたMS-MSスペクトルの複雑さを増大させ、かつ、所与の前駆体についてスコア付け法を用いるデータベース検索によって得られる同定スコアを減少させる恐れがある。
【0039】
さらにデータベース検索は一般的に、最も強力なピークを有する所与のMS前駆体についてのみ実行され、他の選択された前駆体は考慮されない。
【0040】
複数のMS-MSスペクトルを同時に生成することによってタンデム質量分析のMS-MSスループットを増大させるための様々な解決法が提案されてきた。
【0041】
一の解決法は、複数のMS-MSスペクトルをハードウエアによって同時生成することである。ここで各MS-MSスペクトルは、MSスペクトル内で選択された単一の前駆体の標準的なMS-MSスペクトルに対応する。同時に生成されたMS-MSスペクトルは、空間的に分離され(MS-MS)、かつ時間的に分離される(MS)(非特許文献1と特許文献1を参照)。
【0042】
他の解決法は、多重化されたMS-MSスペクトルあたりにつきMSスペクトル内で選択される複数の前駆体から生成される多重MS-MSスペクトルの生成である。選択された前駆体のフラグメントイオンは故意に混合される。
【0043】
個々のMS-MSスペクトル−各々は単一の選択された前駆体に対応する−は、様々なフラグメント−前駆体同定方法を用いることによって、多重MS-MSスペクトル分析から生成されうる(特許文献3乃至7を参照のこと)。
【0044】
特許文献3乃至7では、フラグメント−前駆体同定方法は全て、同じ複数の前駆体のうちの少なくとも2つ(以上)の多重MS-MSスペクトルの比較を利用する。これらのMS-MSスペクトルは、2つの連続するMS-MS取得間に使用されたタンデム質量分析装置の一の実験パラメータの調節によって順次生成される。特許文献1乃至7及び非特許文献1に記載された解決法はすべてハードウエアの解決法である。これらの解決法は、使用されるタンデム質量分析装置の種類に依存し、かつ、他の既存のタンデム質量分析装置へ拡張できない。
【0045】
「ボトムアップ」プロテオミクス用に、多重MS-MSスペクトルを故意に又は意図せずに分析する純粋なソフトウエアによる解決法が提案されてきた(非特許文献2及び特許文献8と9を参照のこと)。非特許文献2及び特許文献8と9に記載の解決法は、特にタンデム質量分析装置の種類に依存せず、かつ、フラグメント−前駆体同定のために選択された複数の前駆体の多重MS-MSスペクトルを1つ生成することしか必要としない。しかしこれらの方法では、MSとMS-MSのいずれにも高い精度が必要とされる。
【0046】
非特許文献2の前駆体−フラグメント同定方法は、多重MS-MSスペクトルの過去のアルゴリズム解析を用いることなく、複数の選択された前駆体の質量対電荷比の値と電荷を有する多重MS-MSスペクトルを、データベース検索へ提出する手順で構成される。
【0047】
このMS-MS多重化方法は、MS-MS精度及び検出されたフラグメントの数によって制限される(非特許文献2を参照のこと)。このMS-MS多重化方法は、高いMS-MS精度を有するタンデム質量分析装置−たとえばFT-MS(フーリエ変換質量分析装置)−に使用されるときだけは効率的に用いられ得る。
【0048】
選択された前駆体数が増加するときに、スコア付け法を用いたデータベース検索によって解析される多重MS-MSスペクトルの複数の選択された前駆体の同定スコアは減少する。
【0049】
このスコアの減少効果は、解析される多重MS-MSスペクトルの複数の選択された前駆体間でのMSスペクトルの強度ダイナミックレンジが大きくなるにつれてひどくなる。なぜなら、既存のスコア付け法は一般的に、データベース検索を行うのに、多重MS-MSスペクトルのうちの最も強度の大きいピークを選択するからである。
【0050】
たとえばMSスペクトルの小さな強度ピークが、大きな強度ピークと共に選択されうるとき、スコア付け法を用いた対応多重MS-MSスペクトルのデータベース検索は、良好なスコアを有するMSスペクトルの大きな強度ピークに対応する前駆体を同定し、かつ、小さな強度ピークに対応する前駆体については低スコアを生成するか、又は同定を行わない。
【0051】
特許文献8と9の多重MS-MS法は、データベース検索へ提出する前に、前駆体−フラグメント同定用のアルゴリズムによるフラグメントを用いた既存のスコア付け法によるデータベース検索を可能にする。
【0052】
特許文献8と9で使用されるアルゴリズムによるフラグメントフィルタは、各選択された前駆体の各異なる解離経路に対応する多重MS-MSスペクトル内の相補的フラグメントイオン対又はマルチプレットの同定に基づく。MS-MS精度範囲内のフラグメント対又はマルチプレットの質量の合計は、対応する選択された前駆体の質量に等しい。
【0053】
特許文献8と9の多重MS-MS法は、高MS-MS精度のタンデム質量分析装置によってしか効率的に用いられない。そのため、偽の相補的フラグメントイオン対の同定数は制限される。偽の相補的フラグメント対又はマルチプレットの同定は、データベース検索の同定スコアを減少させる。
【0054】
特許文献8と9の多重MS-MS法により得られる同定スコアもまた、使用されるソフトウエアフラグメントフィルタにより同定されるフラグメントMS-MSピークの数によって制限される。その理由は、各選択された前駆体のフラグメントイオンのほんの一部しか、フラグメント対を生成せず、かつ、対応する多重MS-MSスペクトルにおいて同定され得ないからである。
【0055】
MALDI(マトリックス支援レーザー脱離イオン化法)により順次生成されるMS-MSスペクトルの数は、LC-ESI-MS-MSのように溶出時間によっては制限されず、レーザーショットによる標的表面のアブレーションによって制限される。
【0056】
前述のタンデム質量分析装置の制限は、「ボトムアップ」プロテオミクスでの応用だけではなく、未切断のタンパク質及びたとえばメタボロミクス又は汚染物の同定における小さな分子を用いる「トップダウン」プロテオミクスにも関連する。
【先行技術文献】
【特許文献】
【0057】
【特許文献1】米国特許第4472631号明細書
【特許文献2】PCT/US2004/008424号明細書
【特許文献3】米国特許第5206508号明細書
【特許文献4】米国特許出願公開第2005/0098721号明細書
【特許文献5】米国特許第7141784号明細書
【特許文献6】PCT/EP2008/056428号明細書
【特許文献7】欧州特許第1385194号明細書
【特許文献8】PCT/EP2007/05059号明細書
【特許文献9】PCT/EP2008/068271号明細書
【非特許文献】
【0058】
【非特許文献1】J.D.Pinston他、Rev.Sci.lnstrum.、第57巻、1983年、pp.583
【非特許文献2】C.Masselon他、Proteomics、第3巻、2003年、pp.1279
【発明の概要】
【発明が解決しようとする課題】
【0059】
従って本発明の目的は、上述した従来技術の課題を解決することで、スコア付け方法によって多重MS-MSスペクトル並びに実際のデータベース検索及び囮のデータベース検索を用いることで、前駆体の同定を改善することである。
【0060】
特に本発明の一の目的は、すべてのタンデム質量分析装置と相性の良い多重タンデム(MS-MS)質量分析法を提案することである。
【課題を解決するための手段】
【0061】
この目的のため、本発明は、請求項1に記載の方法を供する。
【0062】
当該方法は複数の前駆体の同定を可能にする。前記複数の前駆体は、対応するフラグメントイオンの同定後に、多重MS-MSスペクトルを生成するように同時に選択される。
【0063】
各選択された前駆体に対応する第1複数の各独立したMS-MSスペクトルが生成される。前記生成の際には、前記多重MS-MSスペクトルからの過去のフラグメントのフィルタリングが行われても良いし、又は行われなくても良い。
【0064】
続いて前記第1複数の各独立したMS-MSスペクトルは、スコア閾値条件のないデータベース検索へ提出される。
【0065】
各独立したMS-MSスペクトルは、スコア閾値のないスコア付け法を用いる第1の実際のデータベース検索と囮のデータベース検索に送られる。
【0066】
前記第1の実際のデータベース検索と囮のデータベース検索のすべての正同定は、対応する補正された実際のMS-MSスペクトルと囮のMS-MSスペクトルを構築するのに用いられる。
【0067】
より詳細には、前記多重MS-MSスペクトルのフラグメントイオンは、前記の同定された前駆体から計算された理論上の実際のMS-MSスペクトルと囮のMS-MSスペクトルのフラグメントイオンと比較される。正同定は、前記第1の実際のデータベース検索と囮のデータベース検索から得られた。
【0068】
続いて、前記補正された実際のMS-MSスペクトルの各々は、スコア閾値条件を有するスコア付け法を用いた第2の実際のデータベース検索へ送られる。前記補正された囮のMS-MSスペクトルの各々は、スコア閾値条件を有するスコア付け法を用いた第2の囮のデータベース検索へ送られる。
【0069】
前記実際のデータベース検索の偽の正同定の推定を与えるFDR(誤り発見率)が、前記第2の実際のデータベース検索と第2の囮のデータベース検索の両方のスコア閾値よりも大きな正同定を用いて決定される。
【0070】
他の特徴は、他の独立請求項及び従属請求項にて与えられる。
【0071】
本発明の他の態様、目的、及び利点は、添付図面を参照しながら非限定的な例によって与えられる本発明の以降の記載からより明確になる。
【図面の簡単な説明】
【0072】
【図1】本発明の多重タンデム質量分析装置の好適実装方法のフローチャートである。
【図2】大腸菌タンパク質試料のLC-MS-MS取得によって生成されたLCピークからのペプチドの単純化されたMSスペクトル例である。ここでダルトン(Da)単位の質量対電荷比m/zの値が横軸上に表示され、対応する最大強度値が縦軸に表示される。
【図3】図2に対応するMSスペクトルから選択される2つの前駆体の解離により生成される単純化された多重MS-MSスペクトルを図示している。ここでダルトン(Da)単位の質量対電荷比m/zの値が横軸上に表示され、対応する最大強度値が縦軸に表示される。
【図4】本発明の実施例の実施に適した質量分析装置の一例のブロック図を表している。
【発明を実施するための形態】
【0073】
最初に、多重解離質量(MS-MS)スペクトルとは、1次(MS)質量スペクトルにおいて選択される複数の前駆体により生成される解離質量(MS-MS)スペクトルであることに留意して欲しい。解離質量(MS-MS)スペクトル内には、選択された前駆体のフラグメントイオンが混合されている。
【0074】
選択された前駆体の各々が他から分離して分析されるとしたときに得られる各独立したMS-MSスペクトルのピークは、生成された多重MS-MSスペクトル内で混合される。
【0075】
具体的に図1を参照すると、どの質量分析装置でも実施される本発明の方法では、第1手順(a1)は、電離後の前駆体の1次(MS)スペクトルを供給する手順を有する。前駆体は、同定される分子から得られる。
【0076】
解離することなく生成された、1次イオンピークを含む1次(MS)質量スペクトルは、当業者に知られているように、荷電粒子源内で同定される分子を電離し、かつ、その分子がタンデム質量分析装置へ注入される前に、大きな電場により加速されることによって得ることができる。
【0077】
1次MSスペクトルはまた、過去に保存されたデータベース−たとえばサードパーティ製のデータベース−から読み取ることによって得ることもできる。
【0078】
当業者に知られているように、手順(a2)では、質量対電荷比m/zと1次MSスペクトルの各ピークの対応する最大強度値のリストを含む単純化されたMSスペクトルが一般的に、生成される。イオンの電荷値もまた、決定されたときに、そのリストに加えられる。
【0079】
手順(a1)と(a2)は以降、まとめて1つの手順(a)として指称されて良い。
【0080】
手順(b)では、複数の前駆体が故意又は意図せずに1次MSスペクトルから選択され、かつ、質量対電荷比(m/z)の値と選択された前駆体の各々の電荷値は、手順(a)の1次MSスペクトル又は使用される質量選択窓から決定される。
【0081】
手順(c1)では、複数の選択された前駆体イオンがタンデム質量分析装置内において複数のフラグメントイオンに解離して、かつ、複数の選択された前駆体の多重MS-MSスペクトルが、タンデム質量分析装置によるフラグメントイオンにより生成されて、選択された前駆体のうちの1つ以上のフラグメントの検出に対応するピークを有する。
【0082】
手順(c2)では、単純化された多重MS-MSスペクトルが、質量対電荷比m/zの値と多重MS-MSスペクトルのピークの対応する最大強度値のリストとして生成される。場合によっては、イオンの電荷値が、既知であるときには、そのリストに加えられる。
【0083】
多重MS-MSスペクトルはまた、過去に保存されたデータベース−たとえばサードパーティ製のデータベース−から読み取ることによって得ることもできる。
【0084】
手順(c1)と(c2)は以降、まとめて1つの手順(c)として指称されて良い。
【0085】
手順(d)では、複数の各独立したMS-MSスペクトルが、手順(c)の多重MS-MSスペクトルから生成される。各独立したMS-MSスペクトルは、MSスペクトルから選択される1つの前駆体にのみ対応する。
【0086】
各独立するMS-MSスペクトルは、単純化された多重MS-MSスペクトルの電荷対質量比(m/z)の値、対応する最大強度値、及び電荷値(決定されたときの)、並びに、MSスペクトルから選択される唯一の前駆体に対応する電荷対質量比(m/z)の値、及び、電荷値(決定されたときの)を有する。
【0087】
手順(d)の各独立するMS-MSスペクトルはまた、単純化された多重MS-MSスペクトルのフラグメントイオンのフィルタリング後に生成されても良い。
【0088】
フラグメントイオンをフィルタリングすることなく、選択された前駆体の各々について、手順(d)の各独立するMS-MSスペクトルは、同一で、かつ、手順(c)の単純化された多重MS-MSスペクトルに厳密に対応する。
【0089】
フラグメントイオンをフィルタリングすることによって、フラグメントフィルタによって選択された単純化された多重MS-MSスペクトルのフラグメントイオンのみが、手順(d)の各独立したMS-MSスペクトルを生成するのに用いられる。
【0090】
選択されるMS前駆体の数が増大するにつれて、フィルタリング法は、手順(d)において生成される各独立するMS-MSスペクトルを明確にする本発明の方法にとって、より有用となる。
【0091】
本発明の方法は、前駆体質量に対する依存性の如何によらず、すべての考えられ得るフラグメントイオンのフィルタリング法と相性が良い。フラグメントイオンのフィルタリングの非限定的例は、「配列タグ付け(sequence tagging)」、「新規シーケンシング(De Novo sequencing)」、又は、相補的フラグメント対及びマルチプレット法である(特許文献8及び9を参照のこと)。
【0092】
手順(e)では、手順(d)の各独立したMS-MSスペクトルの各々は、スコア閾値条件のないスコア付け法を用いる第1の実際のデータベース検索、及び、前記第1の実際のデータベース検索と同一の検索パラメータを用いた、前記第1の実際のデータベース検索に対応する第1の囮のデータベース検索に提出される。
【0093】
本発明においては、「スコア閾値条件のない」とは、データベース検索によって得られるすべての同定が、各同定について得られるスコアを考慮することなく考慮されると解されなければならない。
【0094】
実際のデータベース検索と囮のデータベース検索の結果は、候補となる前駆体を同定する。これらの候補となる前駆体は、後述するようにさらに確認される。
【0095】
変形例として、スコア付け法は低スコア閾値条件で実行され、この低スコア閾値条件は、通常用いられているスコア閾値条件よりも低い(たとえば10よりも低く、より有利には5よりも低い)。当業者によって知られているように、囮のデータベース検索は一般的に、プロテオミクス用途において、第1の実際のデータベース検索の正同定のうちの偽の正同定(と対応するタンパク質)の数を推定するのに用いられる。
【0096】
ペプチドにおける信頼性レベル及び対応するタンパク質の同定は、FDR(誤り発見率)の値によって与えられる。FDR値は、囮のデータベース検索からの正同定の数と、実際のデータベース検索からの正同定の数との比によって定義される。FDRが小さければ小さいほど、同定の信頼性レベルは高くなる。
【0097】
標準的な分析とは異なり、本発明の方法は、手順(e)に続く手順において、標準的な分析において用いられる閾値スコア未満の通常は拒絶される値を含むデータベース検索のすべての正同定を利用する。
【0098】
手順(f)では、実際のデータベース検索と囮のデータベース検索がそれぞれ、実際の正同定と囮の正同定を生成する各独立したMS-MSスペクトルについては、各独立したMS-MSスペクトルは、これらの正同定から生成される。実際の各独立したMS-MSスペクトルと囮の各独立したMS-MSスペクトルは、各独立する「補正」MS-MSスペクトルと指称されて良い。
【0099】
実際の各独立するMS-MSスペクトルは、手順(e)の実際のデータベース検索の結果得られた候補となる前駆体のフラグメントイオンの質量対電荷比(m/z)の値と、対応する最大強度値を有する。
【0100】
囮の各独立するMS-MSスペクトルは、手順(e)の囮のデータベース検索の結果得られた候補となる前駆体のフラグメントイオンの質量対電荷比(m/z)の値と、対応する最大強度値を有する。
【0101】
手順(f)の第1実施例では、補正された各独立するMS-MSスペクトルを生成するため、質量対電荷比m/zの値のリストが、手順(e)において同定された候補から計算される。質量対電荷比m/zの値は、候補となる前駆体の理論上のフラグメントイオンに対応する。続いて、多重MS-MSスペクトルのすべてのフラグメントイオン−その質量対電荷比m/zの値がリストに含まれる−は、補正された各独立するMS-MSスペクトルを生成するように選択される。よって選択は、装置のMS-MS精度の範囲内で行われる。
【0102】
手順(f)の第2実施例では、実際の各独立するMS-MSスペクトルと囮の各独立するMS-MSスペクトルがそれぞれ、単純化された多重MS-MSスペクトル内でフラグメントイオンを選択することによって生成される。前記実際の各独立するMS-MSスペクトルと囮の各独立するMS-MSスペクトルは、候補となる前駆体のフラグメントイオンと一致する。前記候補となる前駆体のフラグメントイオンは、実際の各独立するMS-MSスペクトルと囮の各独立するMS-MSスペクトルをそれぞれ用いることによって手順(e)において同定される。
【0103】
この手順(f)の第2実施例は、この手順の補正された各独立するMS-MSスペクトルの生成の期間を減少させる。しかし使用される検索アルゴリズムのパラメータが、過去に計算された比較と比較してMSピーク強度が低すぎると言った、使用される検索アルゴリズムのパラメータに起因して、一部のフラグメントイオンは、第1データベース検索の同定において無視されることがある。
【0104】
手順(e)の実際のデータベース検索結果及び囮のデータベース検索結果にそれぞれ対応する2つの異なる組の補正された各独立するMS-MSスペクトルは、手順(f)において生成される。
【0105】
手順(g)の第1実施例では、手順(f)の補正された各独立するMS-MSスペクトル及び対応する前駆体のm/z値と電荷値からなる2つの組が実際のデータベース検索と囮のデータベース検索へ提出される。実際のデータベース検索と囮のデータベース検索は、いずれにおいても同一のスコア閾値条件と同一の検索パラメータを有するスコア付け法を用いる
つまり実際の各独立するMS-MSスペクトルと囮の各独立するMS-MSスペクトルの組はそれぞれ、実際のデータベース検索と囮のデータベース検索へ提出される。
【0106】
手順(g)のデータベース検索は、手順(e)において用いられる同一のスコア付け法とデータベースにより実行されるか、又は、他のスコア付け法及び/若しくはデータベースにより実行されて良い。最善の結果は、手順(e)及び(g)についての同一のスコア付け法及びデータベースを用いることによって得られる。
【0107】
手順(g)のデータベース検索は、標準的ではないが、本発明の方法にとって固有である。特に実際のデータベース検索と囮のデータベース検索は、同一組の各独立するMS-MSスペクトルを利用しないが、各々が手順(e)の実際のデータベース検索と囮のデータベース検索の結果にそれぞれ対応する各独立するMS-MSスペクトルからなる2つの異なる組を利用する。
【0108】
後続の実際のデータベース検索と囮のデータベース検索のため、手順(e)の第1の実際のデータベース検索の正同定から生成される各独立した実際のMS-MSスペクトルからなる同一の組を用いる標準的なデータベース検索法は、バイアス効果のため、第2の実際のデータベース検索の偽の正同定を過小に見積もる。
【0109】
偽の正同定の正確な統計上の見積もりは、実際のデータベース検索と囮のデータベース検索についての補正された各独立するMS-MSスペクトルからなる2つの異なる組を有する方法の手順(g)によって得られる。
【0110】
手順(g)の第2実施例では、この手順は、第2の実際のデータベース検索と囮のデータベース検索を行うことなく、手順(f)の補正された各独立するMS-MSスペクトルからなる2つの組のスコア閾値と、手順(e)の第1の実際のデータベース検索と囮のデータベース検索の同定結果を有するスコア付け法を用いることによって実行される。
【0111】
係るスコア付け法の非限定的例は、補正された各独立するMS-MSスペクトルの各々についての同定スコアの生成である。同定スコアは、補正された各独立するMS-MSスペクトルを、手順(e)において同定された候補となる前駆体から決定された理論上考えられ得るフラグメントイオンの数で除することによって得られる。
【0112】
手順(g)の第2実施例は第2データベース検索を回避することで、処理を短くする。
【0113】
第1実施例に戻ると、手順(h)では、多重MS-MSスペクトルの前駆体は、選ばれたスコア閾値よりも大きい手順(g)の実際のデータベース検索の正同定結果を用いることによって同定され、かつ、偽の正同定の数は、スコア閾値よりも大きい手順(g)の囮のデータベース検索の正同定の数によって推定される。スコア同定閾値条件及び検索パラメータは、実際のデータベース検索と囮のデータベース検索で同一である。
【0114】
第2実施例、つまり手順(g)の第2データベース検索を行わない場合において、手順(h)では、正の前駆体同定は、実際の各独立するMS-MSスペクトルの組を有する手順(g)のスコア付け方法に用いられるスコア閾値よりも大きい同定を選択することによって得られる。
【0115】
偽の正同定は、囮の各独立するMS-MSスペクトルの組を有する手順(g)のスコア付け方法に用いられる同一のスコア閾値よりも大きい同定を選択することによって推定される。
【0116】
第1実施例において、手順(i)では、実際のデータベース検索の前駆体の正同定の信頼性レベルを与えるFDR(誤り発見率)が、手順(h)の囮のデータベース検索の正同定の数と、手順(h)の実際のデータベース検索の正同定の数との比によって決定される。
【0117】
標準的な分析で行われているように、本発明の方法の手順(e)乃至(i)は、様々なスコア付け法、及び、Mascot、Sequest、X!Tandem等を用いた様々なデータベースによって順次実行されて良い。様々な検索ツールによって得られる前駆体の正同定は、前駆体の正同定の数を増大させるように結合されて良い。
【0118】
FDR値は、単純に対応するスコア閾値を選択するか、又は、より複雑な条件を用いることによって、ユーザーによって選択されて良い。前記より複雑な条件とはたとえば、「ボトムアップ」プロテオミクスにおいてLC-MS-MSデータを用いること、ペプチド同定のスコア閾値と、タンパク質同定用のタンパク質毎に同定された少なくとも2つのペプチドとを組み合わせることである。
【0119】
本発明の方法の完全な実施は典型的には、適切なプログラムを実行するデジタルコンピュータ−たとえばDSP(デジタル信号処理装置)−によって実現可能であることに留意して欲しい。
【0120】
より実際的には、既存のタンデム質量分析装置に追加され、かつこの装置の他のソフトウエアのインターフェースとなるソフトウエアモジュールで本発明は実施されて良い。
【0121】
如何なる場合でも、当業者は、1次MSスペクトルと、タンデム質量分析装置により得られる多重MS-MSスペクトルが生成されることで、本発明の方法を用いることにより、選択された前駆体を同定できる可能性が与えられることを理解する。
【0122】
生成された多重MS-MSスペクトルあたりについて1つの前駆体を用いる標準的な分析によって、当該方法のMS-MSスループットと対応する前駆体の同定は、各多重MS-MSスペクトルについて選択された前駆体の数に比例して増大する。
【0123】
非限定的な例として、生成される多重MS-MSスペクトルあたり平均で3つの前駆体が選択される場合、最終的なMS-MSスループットは、本発明の方法を用いることによって3倍改善される。
【0124】
本方法の手順(f)乃至(i)は、標準的なMS-MS法で得られた(スコア閾値未満のスコアである)真の負同定の大部分を、(スコア閾値よりも大きいスコアである)真の正同定へ変換する。
【0125】
本発明の方法は、1次イオンとフラグメントイオンの質量対電荷比m/zの測定に用いられる質量分析法に依存しない。質量対電荷比m/zの値は、飛行時間、磁場中での偏向、周波数等を用いて測定されて良い。
【0126】
本発明の方法は、すべての種類のタンデム質量分析装置との相性が良く、かつ、MSとMS-MS分解能及び精度が高くても低くても実行可能である。
【0127】
標準的な分析で行われているように、同数の生成される多重MS-MSスペクトルを考慮するとき、本発明の方法は、MSとMS-MS分解能及び精度が低い場合よりも、MSとMS-MS分解能及び精度が低い場合において、より多くの前駆体の正同定を生成する。なぜならデータベース検索によって生成される偽の正同定が少なくなるためである。
【0128】
本願においては、質量対電荷比(m/z)の値は質量の値に置き換えることが可能で、かつ逆も同様であることに留意して欲しい。
【0129】
[本発明の方法を実施するタンデム質量分析装置の構成及び動作]
本発明の多重タンデム質量分析法を実施する好適なタンデム質量分析装置の構成と動作について、非限定的な例示により詳細に説明する。本発明の方法の実施に適したタンデム質量分析装置の非限定的な例が図4に図示されている。
【0130】
タンデム質量分析装置による複雑な試料の分析は一般的に、そのタンデム質量分析装置へ導入する前に、試料の分子を分離する手段1を必要とする。
【0131】
分離段階の後、被分析試料の分子が、電離されるイオン源2へ導入される。
【0132】
イオン源2での被分析試料の分子の電離後、1次イオンが質量分析装置5へ導入されることで、1次MSスペクトルが生成される。
【0133】
各MSスペクトルの生成後、関心対称の1次イオンが、MSスペクトル中の前駆体として、前駆体質量選択装置3によって選択されることで、多重MS-MSスペクトルが生成される。
【0134】
選択された1次イオンは、多重MS-MSスペクトルを生成するのに利用されるフラグメントイオンを生成するように、解離装置4内で解離される。
【0135】
フラグメントイオンが質量分析装置5へ導入されることで、多重MS-MSスペクトルが生成される。
【0136】
本発明の方法は、当業者によって知られている既存のすべてのタンデム質量分析装置で実施されて良い。既存のすべてのタンデム質量分析装置とは、空間的に連続して動作する、解離装置によって分離された2つの質量分析装置で構成されるか、又は、時間的に連続して動作する1つのマスアナライザで構成される。
【0137】
本発明の方法で利用可能な空間的に分離された複数の既存のタンデム質量分析装置は、Q-q-MSタンデム質量分析装置である。ここで、Qは前駆体MS選択装置3として用いられる四重極質量分析装置で、qは解離装置4で、一般的にはCID(衝突誘導解離)解離法を用いた気体を含む多重極導波路で、かつ、MSは、直交注入システムを用いたTOF(飛行時間)質量分析装置5(OTOF)、四重極(Q)質量分析装置5、静磁場を用いるFT-ICR(フーリエ変換イオンサイクロトロン共鳴)質量分析装置5、又は、線形イオントラップ(IT)質量分析装置5である。
【0138】
MSスペクトルと多重MS-MSスペクトルは、使用される第2質量分析装置(Q、TOF、IT、又はFT-ICR)内で生成される。
【0139】
第1四重極Qは、MSスペクトル内での前駆体イオンの選択に用いられることで、CID(衝突誘導解離)又は他のフラグメンテーション法により多重極導波路内での選択された1次イオンの解離後に、多重MS-MSスペクトルが生成される。
【0140】
本発明の方法で利用可能な空間的に分離された他のタンデム質量分析装置はMALDI-TOF-TOFである。MALDI-TOF-TOFとは、MALDI(マトリックス支援レーザー脱離イオン化法)イオン源を備え、かつ、MS選択装置3として用いられるブラッドバリー・ニールセン(Bradbury-Nielson)ゲートを備える第1線形TOF(飛行時間)質量分析装置、高い運動エネルギーのCIDを利用して解離を起こす衝突セル4、及び、反射手段を有する第2軸TOF質量分析装置(RTOF)5で構成される。
【0141】
MSスペクトルとMS-MSスペクトルは、第2RTOF質量分析装置内で生成される。ブラッドバリー・ニールセンゲートは、第1線形TOF質量分析装置内でのTOF分離後に、MSスペクトル内での前駆体イオンの選択に用いられる。選択された前駆体イオンは、高運動エネルギーCIDによって衝突セル内で解離されることで、第2RTOF質量分析装置内での選択された前駆体の多重MS-MSスペクトルが生成される。
【0142】
本発明の方法で利用可能な時間的に連続動作する既存の単一タンデム質量分析装置は、線形の2D若しくは3Dのイオントラップ(IT)質量分析装置又はフーリエ変換(FT-MS)質量分析装置(FT-ICR又はOrbitrap(登録商標))である。
【0143】
MSスペクトルの生成、前駆体の選択、CID又は他の解離法による前駆体イオンの解離、及び、MS-MSスペクトル生成は、当業者に知られているように、使用されたIT質量分析装置又はFT-MS質量分析装置によって順次生成される。
【0144】
他の既存のタンデム質量分析装置IT-MSは、空間的分離及び時間的な連続動作を、ITとしての3Dイオン又はMS質量分析装置としての直交注入RTOF、及び、ITとしての線形2Dイオントラップ及びMS質量分析装置としてのFT質量分析装置(FT-ICR又はOrbitrap(登録商標))とを組み合わせる。
【0145】
MSスペクトルは、軸若しくは直交注入RTOF又はFT質量分析装置内に生成される。前駆体イオンの選択及び解離段階は、3D及び2DのIT内で順次生成される。MS-MSスペクトルは最終的に、使用されるIT又はMS質量分析装置(軸又は直交注入RTOF又はFT-MS)内で生成される。
【0146】
上述のように時間的に連続動作する既存の単一タンデム質量分析装置は、当業者に知られているように、MSnモードにおいて順次選択されたMS-MSピークの連続多重MS-MSスペクトルを生成しうる。
【0147】
本発明の方法は、分離手段1(LC-MS-MS)として液体クロマトグラフィ(LC)を用いた用途に非常に適している。しかし本発明の方法は、たとえば1D又は2Dのゲル電気泳動(PAGE)分離のようなタンデム質量分析装置への導入前に調査された分子を分離する既存の方法すべてと相性が良い。
【0148】
非限定的な例として、LCは一般的にESI(電子スプレイ電離)イオン源と結合し、1D又は2DのPAGEは一般的に、MALDI(マトリックス支援レーザー脱離イオン化法)で用いられる。
【0149】
本発明の方法は、すべての既存のイオン源2で用いられて良い。使用されるイオン源は、ESI(電子スプレイ電離)イオン源、MALDI(マトリックス支援レーザー脱離イオン化法)パルスレーザーイオン源、DESI(脱離電子スプレイ電離)イオン源、APCI(大気圧化学電離)イオン源、APPI(大気圧光電離)イオン源、DART(実時間直接解析)イオン源、LDI(レーザー脱離電離)イオン源、ICP(誘導結合プラズマ)イオン源、EI(電子衝突)イオン源、CI(化学電離)イオン源、FI(電場による電離)イオン源、FAB(高速原子衝突)イオン源、LSIMS(液体2次イオン質量分析)イオン源、API(大気圧電離)イオン源、FD(電場による脱離)イオン源、DIOS(シリコン上での脱離による電離)イオン源、又は他の任意の種類の1次イオンを生成するイオン源で用いられて良い。
【0150】
当業者によって知られているように、タンデム質量分析装置において用いられる最も一般的な前駆体質量選択装置3は、四重極(Q)、線形2D又は3Dイオントラップ(IT)、ブラッドバリー・ニールセンゲート、フーリエ変換質量分析装置(FT-ICR又はOrbitrap(登録商標))である。
【0151】
本発明の方法を用いるタンデム質量分析装置による多重MS-MSスペクトルの生成を行うための解離装置3内でのフラグメンテーションは、CID/CAD(衝突誘導解離/衝突活性化解離)による解離を可能にする気体を含む衝突チャンバ、イオン源内で電離される1次分子の内部エネルギーの増大後での若しくは光電離による飛行時間経路にわたっての同時解離(PSDすなわちポストソース分解)を可能にする飛行時間空間、又は、SID(表面誘起解離)法、ECD(電子捕獲解離)法、ETD(電子輸送解離)法、IRMPD(赤外多光子解離)法、PD(光解離)法、BIRD(黒体赤外解離)法、若しくは、他の1次イオンのフラグメンテーション法によって実施されて良い。
【0152】
本発明の方法に必要な多重MS-MSスペクトルを生成する様々な手法は、上述した既存のタンデム質量分析装置で用いられて良い。
【0153】
第1の手法は、ソース内解離(ISD)法である。ISD法では、様々な種類の前駆体すべての1次イオンが、MSスペクトル内での1次質量の選択を行うことなく、質量分析装置へ注入される前に、イオン源2内で開裂される。
【0154】
ISD法は、MALDIターゲット上でのレーザー出力密度を増大させて、MALDIイオン源内での迅速なフラグメンテーションを起こすことによるタンパク質試料のトップダウン(純粋なタンパク質)分析又はボトムアップ(ペプチド)分析を行うMALDIイオン源で用いられて良い。
【0155】
質量分析装置への注入前に、ESIイオン源によって生成される多価イオンの気体との衝突フラグメンテーションを用いたタンパク質試料のトップダウン(純粋なタンパク質)分析又はボトムアップ(ペプチド)分析を行うESIイオン源で用いられても良い。
【0156】
多重MS-MSスペクトルを生成する第2の手法は、1つの前駆体だけではなく、1次MSスペクトル内において2つ以上の前駆体を選択するのに用いられる質量分析装置の前駆体質量選択窓の幅を増大させる手順で構成される。
【0157】
上述のすべての既存タンデム質量分析装置は、前駆体のMSピーク選択のために広い質量選択窓を用いることによって多重MS-MSスペクトルを生成する方法を用いて良い。
【0158】
既存のタンデム質量分析装置において用いられる前駆体質量選択窓の最小幅が一般的には全託された前駆体質量の値の約0.1〜0.2%で、かつ、実際の用途では、典型的には選択された前駆体質量の値の0.5〜1%であってよいことを考慮すると、標準的なタンデム質量分析装置において生成されるMS-MSスペクトルのかなりの部分が一般的には、2つ以上の選択された前駆体を有する多重MS-MSスペクトルである。
【0159】
従って本発明の方法は、標準的な質量分析データの分析にも用いられて良い。
【0160】
多重MS-MSスペクトルを生成する第3の手法は、各独立して選択された前駆体のすべてのフラグメントの混合物からなる単一の多重MS-MSスペクトルを生成する前に、使用された質量分析装置の1次質量選択窓によって各独立して選ばれる(他の選択された前駆体に隣接している/いないにかかわらず)複数の異なる前駆体を連続的に解離することである。
【0161】
MSが線形の2DのIT(LIT)又はFT-ICRである上述したQ-q-MSタンデム質量分析装置は、多重MSスペクトルを生成する第3の方法を用いて良い。
【0162】
Q-q-LIT分析装置は、LIT内のフラグメント混合物の対応する単一の多重MS-MSスペクトルを生成する前に、Qによって各前駆体のMSを順次選択し、q内で選択された前駆体を開裂させ、かつ、LIT内に、各選択された前駆体の解離したフラグメントイオンを順次記憶してよい。
【0163】
Q-q-FT-ICR分析装置は、FT-ICR内にすべての選択された前駆体の解離したフラグメントの混合物を注入することで、フラグメント混合物の対応する単一の多重MS-MSスペクトルを生成する前に、Qによって各前駆体を選択し、q内で選択された前駆体を開裂させ、かつ、q内での各選択された前駆体の解離したフラグメントイオンを順次記憶して良い。
【0164】
ITが線形イオントラップで、かつ、MSが上述したフーリエ変換質量分析装置(FT-ICR又はOrbitrap(登録商標))5であるIT-MS分析装置は、多重MSスペクトルを生成する第3の方法を用いて良い。
【0165】
FT-MS(FT-ICR又はOrbitrap(登録商標))内で共に注入されることで多重MS-MSスペクトルが生成される前に、各前駆体は、IT内又は他の外部セル内で開裂される前にITによって順次選択され、各異なる選択された複数の前駆体のフラグメントイオンは最終的に中間セルに記憶される。
【0166】
上述のMALDI-TOF-TOF質量分析装置は、多重MSスペクトルを生成する第3の方法を用いて良い。
【0167】
MALDI上での各レーザーショットでMSスペクトル内において1つの前駆体しか選択しない代わりに、複数の異なる前駆体の1次イオンが、第1の線形TOF分析装置内で分離された後に、各レーザーショットで、ブラッドバリー・ニールセンゲートによって順次選択される。それにより、すべてのレーザーショットの検出されたフラグメントを蓄積することによって各異なる選択された前駆体の多重MS-MSスペクトルが生成される。本発明の方法は、当業者によって知られているすべての既存のフラグメンテーション法により生成される全ての異なる種類のフラグメントイオン−たとえばa,b,c,y,z,x,wフラグメントイオン−との相性がよい。
【0168】
本発明の方法の非限定的用途は、たとえばMascot又はSequestのような検索ツールを用いたスコア付け法を行うデータベース検索を利用するタンデム質量分析装置で、LC-ESI、2DのPAGE-MALDI、又はLC-MALDIを用いることによって、ペプチド(ボトムアッププロテオミクス)及び純粋なタンパク質(トップダウンプロテオミクス)の複雑な試料の分析である。
【0169】
本発明の方法は、メタボロミクス又は汚染物の同定のような小さな分子の用途にも用いられてよい。
【0170】
[第1例]
ここで本発明の方法の非限定的な第1実施例について、図4を参照しながら説明する。
【0171】
LC-ESI-Q-q-TOF質量分析装置を用いたLC-MS-MS分析用の大腸菌のタンパク質試料が、当業者に知られているように準備された。
【0172】
100ngのタンパク質試料が、トリプシンを用いる切断されることで、LC毛管カラム1内に注入される前に、ペプチド混合物が生成される。
【0173】
溶出期間中、各LCピークでは、MSスペクトルが生成された。各MSスペクトルは、第2のMS-MS生成法で述べたように、Q-q-TOF質量分析装置を用いることによって、多重MS-MSスペクトルを含む対応MS-MSスペクトルから得られる。
【0174】
各MSスペクトルは、四重極分析装置3による前駆体の選択後に、RTOF質量分析装置5内に生成される。選択された1次イオンは、各多重MS-MSスペクトルが生成されるようにRTOF質量分析装置5内に注入される前に、衝突セルq4内においてCIDによって解離される。
【0175】
1次MSスペクトル内での前駆体の選択に用いられる質量選択窓の幅は、選択された前駆体の質量対電荷比(m/z)の値の約0.5〜1%で、かつ、標準的なLC-MS-MSにおいて用いられる値に近かった。
【0176】
分析において用いられるMS精度及びMS-MS精度は20ppmであった。
【0177】
図2は、表1で与えられた、MS質量対電荷比(m/z)の値と、対応する最大強度値のリストに対応する単純化されたMSスペクトルの例を表している。表1は、LCピークからのペプチドのMSピークを含む1次MSスペクトルから得られる。LCピークは大腸菌タンパク質試料のLC-MS-MS取得により生成され、かつ、LC-MS-MS取得は本発明による方法の手順(a)に対応する。
【0178】
多価1次イオンの特別な場合では、前駆体イオンの電荷は、決定される場合には、表1の例に示されているように、質量対電荷比m/zと対応する最大強度の値に追加される。
【0179】
当業者は、質量分析において通常用いられている同定手法により、前駆体としてMSスペクトル内で選択された各1次質量ピークに対応する1次イオンの電荷を決定することができる。
【0180】
図3は、手順(b)と(c)に従って得られた単純化された多重MS-MSスペクトルの例を表している。MS-MS質量対電荷比(m/z)の値と対応する最大強度の値の対応するリストが表2に表されている。手順(b)と(c)に従って、単純化されたMS-MSスペクトルが、図2のMSスペクトル内において同時に選択された2つのMSピークの1次イオンの解離により生成された多重MS-MSスペクトルから得られる。2つの選択されたMSピークの対応する質量対電荷比(m/z)と最大強度の値が、表1内において太字で書かれている。
【0181】
質量分析の当業者によって従来用いられてきた発表用のグラフ(しかしこれに限定されるわけではない)によると、1次MS質量スペクトルと多重MS-MS質量スペクトルは一般的に、図2及び図3の例のように、2つの軸で表される。前記2つの軸のうち、横軸は質量対電荷比m/zの値を表し、縦軸は対応する強度値を表す。
【0182】
手順(d)では、各独立する2つのMS-MSスペクトルが、表1内の太字で列挙された2つの選択された前駆体の各々の質量対電荷比(m/z)及び対応する電荷の値と、表2の単純化されたMS-MSスペクトルを用いることによって、フラグメントフィルタリング法を用いることなく生成される。
【0183】
手順(e)では、手順(d)で生成された、2つの各独立するMS-MSスペクトルと、それらに対応する前駆体の質量対電荷比(m/z)と電荷の値が、Mascotスコア同定閾値を用いる実際のデータベース検索と対応する囮のデータベース検索へ提出された。
【0184】
20ppmのMS精度及び0.05DaのMS-MS精度が、Mascot検索のパラメータとして用いられた。
【0185】
実際のデータベース検索のMascotの正同定の結果が、表3aの第2列に表されている。質量対電荷比m/zの値が652.3905Daと650.3741Daのペプチド前駆体はそれぞれ、63と15のスコア同定を得た。
【0186】
囮のデータベース検索のMascotの正同定の結果が、表3bの第2列に表されている。ここで、質量対電荷比m/zの値が650.3741Daと652.3905Daのペプチド前駆体のスコア同定はそれぞれ3と4だった。
【0187】
図2と図3の例の2つの選択されたペプチド前駆体の手順(e)の実際のデータベース検索のMascot同定に対応する、すべての考えられ得る理論上のフラグメントイオンの質量対電荷比(m/z)の値が、表4aと表4bに表されている。2つの対応する同定されたペプチドのアミノ酸配列が、表4aと表4bに表されている。
【0188】
図2と図3の例の2つの選択されたペプチド前駆体の手順(e)の囮のデータベース検索のMascot同定に対応する、すべての考えられ得る理論上のフラグメントイオンの質量対電荷比(m/z)の値が、表5aと表5bに表されている。2つの対応する偽の同定ペプチドのアミノ酸配列が、表5aと表5bの第1列に表されている。
【0189】
表4a、表4b、表5a、及び表5bに列挙された種類のフラグメントは当業者には知られている。これらのフラグメントは、 (b,y)フラグメントと、前駆体イオンの解離中に中性損失(H2O,NH3,CO)を有する同一のフラグメントを有する。
【0190】
手順(e)の実際のデータベース検索の選択された前駆体の各々についての同定された実験によるMS-MS質量対電荷比(m/z)の値に対応する理論上のMS-MS質量対電荷比(m/z)の値が、表4aと表4bの両方に列挙されている。
【0191】
手順(e)の囮のデータベース検索の選択された前駆体の各々についての同定された実験によるMS-MS質量対電荷比(m/z)の値に対応する理論上のMS-MS質量対電荷比(m/z)の値が、表5aと表5bの両方に列挙されている。
【0192】
手順(f)では、手順(e)の実際のデータ検索の結果に対応する2つの選択された前駆体の2つの実際の各独立したMS-MSスペクトルが、生成され、かつ、表6aと表6bに列挙されている。
【0193】
手順(f)で生成された表6aと表6bの2つの実際の各独立したMS-MSスペクトルは、表2の単純化されたMS-MSスペクトルの実験によるMS-MS質量対電荷比(m/z)の値と、表4aと表4bの理論上の質量対電荷比(m/z)の値との、20ppmの精度の範囲内での比較により同定されたイオンフラグメントの、MS-MS質量対電荷比(m/z)の値と、対応する最大強度の値で構成される。
【0194】
手順(f)では、手順(e)の囮のデータ検索結果に対応する2つの選択された前駆体の各独立した2つの囮のMS-MSスペクトルが、生成され、かつ、表7a及び表7bに列挙される。
【0195】

手順(f)で生成された表7aと表7bの2つの囮の各独立したMS-MSスペクトルは、表2の単純化されたMS-MSスペクトルの実験によるMS-MS質量対電荷比(m/z)の値と、表5aと表5bの理論上の質量対電荷比(m/z)の値との、20ppmの精度の範囲内での比較により同定されたイオンフラグメントの、MS-MS質量対電荷比(m/z)の値と、対応する最大強度の値で構成される。手順(g)では、2つの選択されたペプチド前駆体の対応する質量対電荷比(m/z)の値と電荷の値を有する表6aと表6bの各独立する2つの実際のMS-MSスペクトルが、スコア同定閾値条件を有するMascotを用いることによって、実際のデータベース検索へ提出された。
【0196】
対応するMascotの正同定結果は、表3aの第3列に表されている。質量対電荷比(m/z)の値が652.3905Daである選択されたペプチド前駆体は107の同定スコアを得て、質量対電荷比(m/z)の値が650.3741Daである選択されたペプチド前駆体は77の同定スコアを得た。
【0197】
手順(g)では、2つの選択された前駆体の対応する質量対電荷比(m/z)の値と電荷の値を有する表7aと表7bの各独立する2つの囮のMS-MSスペクトルが、実際のデータベース検索において用いられるのと同一のスコア同定閾値条件を有するMascotを用いることによって、囮のデータベース検索へ提出された。
【0198】
対応するMascotの偽の正同定結果が、表3bの第3列に表されている。m/z値が652.3905Daである選択されたペプチド前駆体は、51の偽の同定スコアを得た。m/z値が650.3741Daである選択されたペプチド前駆体は、31の偽の同定スコアを得た。
【0199】
表3の例の第3列の実際のデータベース検索の同定スコアはいずれも、すべてのLC-MS-MSデータのMascot解析のスコア同定閾値−この値は44で、0.5%のFDRペプチド値に相当する−よりも顕著に大きい。
【0200】
表3aのペプチド(及びそれらの親タンパク質)の2つの例は、実際のデータベース検索結果を利用することによって、本発明の方法の手順(h)と(i)において正同定される。
【0201】
表3bの例の第3列の囮のデータベース検索の大きな同定スコア−これは652.3905Daに等しい質量対電荷比(m/z)の値を有する選択された前駆体に相当する−は、すべてのLC-MS-MSデータにより得られるMascot解析のスコア同定閾値−これは44に等しい−よりも大きい。
【0202】
手順(g)の囮のデータベース検索の正同定は、手順(g)の実際のデータベース検索の偽の正同定の数を推定する偽の正同定として用いられる。
【0203】
表3bの例の第3列の囮のデータベース検索の小さな同定スコア−これは650.3741Daに等しい質量対電荷比(m/z)の値を有する選択された前駆体に相当する−は、すべてのLC-MS-MSデータにより得られるMascot解析のスコア同定閾値−これは44に等しい−よりも小さい。
【0204】
囮のデータベース検索の結果得られた負同定は、実際のデータベース検索における偽の正同定の数を統計的に推定する偽の正同定としては用いられない。
【0205】
表3aと表3bの例において用いられる44の同定スコア閾値−これは0.5%のFDR値に相当する−が、後述するように本発明の方法を用いた完全なLC-MS-MSデータ解析から得られた。
【0206】
本発明の方法を用いることなく−つまり高強度の多重スペクトルを有する選択された前駆体のみが解析において用いられたときに−得られた標準的なデータベース検索のMascotの結果は、標準的な解析においてすべてのLC-MS-MSデータを用いることによって、0.5%のFDR値に相当する25の閾値よりも大きな、(質量対電荷比(m/z)の値が652.3905Daである)唯一の前駆体の正同定を与える。本発明の方法の最終結果に対応する表3aの第3列の結果は、本発明の方法が、同一のFDR値である0.5%に相当する44の同定スコア閾値を有する2つの選択されたペプチド前駆体の同定を可能にすることを示している。
【0207】
本発明の方法を利用しない標準的な解析では、各生成されたMS-MSスペクトルについて最も強力な前駆体が考慮される。本発明の方法を利用しない、上述した大腸菌試料の完全なLC-MS-MS取得の解析のMascotの結果は、3896の同定されたペプチドと、674の対応する同定されたタンパク質を与える。これらの結果は、標準的なMascotの実際のデータベース検索と囮のデータベース検索に用いられる、ペプチド同定のための約0.5%のFDR値に相当する25のスコア閾値を有するように得られる。
【0208】
多重MS-MSスペクトルの一例について上述した本発明の方法の手順(a)乃至(d)が、大腸菌のLC-MS-MS取得の多重MS-MSスペクトルのすべてに適用された。
【0209】
LC-MS-MS取得において生成される実験による多重MS-MSスペクトルの合計数は8690だった。本発明の方法の手順(a)乃至(d)を用いることによって生成されるMS-MSスペクトル数は33325だった。これは、本発明の方法を用いることによって、約3.8倍にMS-MSスループットが増大したことに相当する。
【0210】
実際のデータベース検索によって本発明の方法の手順(a)乃至(d)を用いることによって得られた正同定のMascotの結果は、6055の同定されたペプチドと、828の対応する同定されたタンパク質だった。これらの結果は、標準的なMascotの実際のデータベース検索と囮のデータベース検索に用いられる、ペプチド同定のための約0.5%のFDR値に相当する44のスコア閾値を有するように得られる。
【0211】
Q-q-TOF質量分析装置により生成される同一の大腸菌のLC-MS-MSデータを解析するのに本発明の方法を用いることによって、データベース検索に同一のMascotパラメータ
を用いる標準的な解析及び約0.5%である同一のFDR値と比較して、同定されたペプチド数で約55%増大し、かつ、同定されたタンパク質の数で約23%増大した。
【0212】
【表1】

【0213】
【表2】

【0214】
【表3】

【0215】
【表4a】

【0216】
【表4b】

【0217】
【表5a】

【0218】
【表5b】

【0219】
【表6a】

【0220】
【表6b】

【0221】
【表7a】

【0222】
【表7B】

[第2例]
ここで本発明の方法の非限定的な第2例について、図4を参照しながら説明する。
【0223】
LC-ESI-IT(LTQ)-FT-MS(Orbitrap(登録商標))質量分析装置を用いたLC-MS-MS分析用に、当業者に知られているように、ヒトの細胞のタンパク質試料が準備された。
【0224】
1μgのタンパク質試料がトリプシンを用いて切断されることで、LC毛管コラム1内へ注入される前に、ペプチドの混合物が生成された。LCコラム1からの使用されたIT-FT-MS質量分析装置5への流出物は、ESIイオン源2によって電子スプレイされることで、ペプチド混合物のMS及び多重MS-MSスペクトルが生成される。
【0225】
溶出期間中、各LCピークでは、MSスペクトルは、FT-MS質量分析装置を用いて生成された。それに続いて、上述した多重MS-MSの第2生成法に対応する多重MS-MSスペクトルの生成が行われた。
【0226】
各MSスペクトルはFT-MS質量分析装置内で生成される。IT3による前駆体の各選択後に、選択された1次イオンは、CIDにより解離されるため、各多重MS-MSスペクトルを生成するようにFT-MS質量分析装置5へ注入される前に、衝突セル(HCD)4へ注入される。
【0227】
MSスペクトル内での前駆体の選択に用いられる質量選択窓の幅は、使用されるIT-FT-MS質量分析装置での標準的なLC-MS-MSにおいて通常用いられる3Daの幅ではなく、約6Daだった。
【0228】
MSスペクトルの生成に用いられるMSの分解能は30000で、MS-MSの分解能は7500だった。解析において用いられる対応するMS及びMS-MSの精度はそれぞれ4ppm及び10ppmだった。
【0229】
上述したヒトの細胞試料の完全なLC-MS-MS取得の解析についてのMascotの結果は、本発明の方法を用いなければ、2838の同定されたペプチドと、761の対応する同定されたタンパク質を供する。これらの結果は、標準的な実際のデータベース検索及び囮のデータベース検索について用いられる、ペプチド同定の約0.85%のFDR値に相当する37のスコア閾値で得られた。
【0230】
上述した本発明の方法の手順(a)〜(d)は、LC-MS-MS取得の多重MS-MSスペクトルのすべてに適用された。
【0231】
LC-MS-MS取得において生成された実験の多重MS-MSスペクトルの合計数は15242だった。本発明の方法の手順(a)〜(d)を用いることによって手順(d)で生成されたMS-MSスペクトルの合計数は49605だった。この数字は、本発明の方法を用いることによって、約3.25倍MS-MSスループットが増大したことに相当する。
【0232】
実際のデータベース検索で本発明の方法の手順(a)〜(d)を用いることによって得られた正同定のMascotの結果は、9742の同定されたペプチドと、1318の対応する同定されたタンパク質を与えた。これらの結果は、標準的な実際のデータベース検索及び囮のデータベース検索について用いられる、ペプチド同定の約0.86%のFDR値に相当する66のスコア閾値で得られた。
【0233】
4ppmのMSの精度及び0.01DaのMS-MS精度が、Mascot検索のパラメータとして用いられた。
【0234】
LTQ-Orbitrapにより生成された同一のヒトの細胞のLC-MS-MSデータを解析するのに本発明の方法を用いることによって、データベース検索に同一のMascotパラメータ
を用いる標準的な解析及び約0.85%である同一のFDR値と比較して、同定されたペプチド数で約243%増大し、かつ、同定されたタンパク質の数で約73%増大した。

【特許請求の範囲】
【請求項1】
少なくとも2つの前駆体を含む被分析試料の多重タンデム質量分析方法であって、
少なくとも2つの単純化された多重MS-MSスペクトルの各々が、前記試料の少なくとも2つの選ばれた前駆体から得られ、
当該方法は:
各選ばれた前駆体について、前記単純化された多重MS-MSスペクトルのフラグメントイオンを選ぶことによって、前記単純化された多重MS-MSスペクトルから個々のMS-MSスペクトルを生成する手順であって、前記フラグメントイオンは前記前駆体から得られる可能性のあるフラグメントイオンである、MS-MSスペクトル生成手順;
前記MS-MSスペクトル生成手順の個々のMS-MSスペクトルを、スコア閾値条件又は低スコア閾値条件が存在しないスコアリング処理を用いることにより実際のデータベース及び囮のデータベース検索へ提出することで、候補となる前駆体及び該前駆体のフラグメントイオンを同定する第1データベース検索提出手順;
前記データベース検索提出手順の実際のデータベース検索の結果同定された候補となる前駆体から現実の個々のMS-MSスペクトルを生成する実際のMS-MSスペクトル生成手順;
前記データベース検索提出手順の囮のデータベース検索の結果同定された候補となる前駆体から囮の個々のMS-MSスペクトルを生成する囮のMS-MSスペクトル生成手順;並びに、
前記実際の個々のMS-MSスペクトル及び囮の個々のMS-MSスペクトルを、スコア閾値条件が存在する他のスコアリング処理へ提出することで、実際の個々のMS-MSスペクトル及び囮の個々のMS-MSスペクトルについてのスコアを決定する第2データベース検索提出手順;
を有する方法。
【請求項2】
前記単純化された多重MS-MSスペクトルが、質量分析装置を用いることによって得られ、
前記実際のMS-MSスペクトル生成手順と囮のMS-MSスペクトル生成手順は:
前記実際のデータベース検索と囮のデータベース検索を用いることによって前記第1データベース検索提出手順において同定された候補となる前駆体から、該候補となる前駆体の理論上のフラグ塩とイオンに対応する質量対電荷比m/zの値のリストを計算する手順;
前記質量分析装置のMS-MS精度の範囲内で、前記リストの質量対電荷比m/zの値と一致する値を有する、前記単純化された多重MS-MSスペクトルのフラグメントイオンをすべて選択する手順;
を有する、
請求項1に記載の方法。
【請求項3】
前記実際のMS-MSスペクトル生成手順と囮のMS-MSスペクトル生成手順が:
前記候補となる前駆体のフラグメントイオンと一致する、前記単純化された多重MS-MSスペクトルのフラグメントイオンを選択する手順であって、前記候補となる前駆体のフラグメントイオンは、前記実際のデータベース検索と囮のデータベース検索を用いることによって、前記第1データベース検索提出手順において同定される、
請求項1に記載の方法。
【請求項4】
前記第2データベース検索提出手順が、スコア閾値を有するスコア付け処理を用いることによって、前記実際の個々のMS-MSスペクトルと囮の個々のMS-MSスペクトルを、実際のデータベース検索と囮のデータベース検索に提出する手順を有する、請求項1乃至3のいずれかに記載の方法。
【請求項5】
前記第1データベース検索提出手順、前記実際のMS-MSスペクトル生成手順、前記囮のMS-MSスペクトル生成手順、及び前記第2データベース検索提出手順において用いられる前記実際のデータベース検索と囮のデータベース検索が、同一である、請求項4に記載の方法。
【請求項6】
前記第1データベース検索提出手順、前記実際のMS-MSスペクトル生成手順、前記囮のMS-MSスペクトル生成手順、及び前記第2データベース検索提出手順において用いられる前記実際のデータベース検索と囮のデータベース検索が、それぞれ異なる、請求項4に記載の方法。
【請求項7】
前記第1データベース検索提出手順、前記実際のMS-MSスペクトル生成手順、前記囮のMS-MSスペクトル生成手順、及び前記第2データベース検索提出手順において用いられる前記スコア付け処理が、閾値条件の有無にかかわらず、同一の処理である、請求項1乃至6のいずれかに記載の方法。
【請求項8】
前記第1データベース検索提出手順、前記実際のMS-MSスペクトル生成手順、前記囮のMS-MSスペクトル生成手順、及び前記第2データベース検索提出手順において用いられる前記スコア付け処理が、それぞれ異なる、請求項1乃至6のいずれかに記載の方法。
【請求項9】
前記第2データベース検索提出手順において実際の個々のMS-MSスペクトル及び囮の個々のMS-MSスペクトルのスコアを決定する手順が、前記第1データベース検索提出手順において同定された前記候補となる前駆体の理論上考えられ得るすべてのフラグメントイオンの数で、前記実際の個々のMS-MSスペクトルと囮の個々のMS-MSスペクトルのフラグメントイオンの数で除する手順を有する、請求項1乃至3のいずれかに記載の方法。
【請求項10】
選択された前駆体の各々について、前記MS-MSスペクトル生成手順の個々のMS-MSスペクトルが、前記選択された前駆体の単純化された多重MS-MSスペクトル及び質量又は質量対電荷比(m/z)の値を有する、請求項1乃至9のいずれかに記載の方法。
【請求項11】
前記MS-MSスペクトル生成手順の前に、前記単純化された多重MS-MSスペクトルのフラグメントイオンの質量からフラグメントイオン対又はマルチプレットを生成する手順をさらに有する、請求項1乃至9のいずれかに記載の方法であって、
少なくとも2つのフラグメントイオンの質量の合計が一の所与の選択された前駆体の質量に等しいときには、前記少なくとも2つのフラグメントイオンは、フラグメントイオン対又はマルチプレットを生成し、かつ、前記所与の選択された前駆体に割り当てられ、かつ、
前記MS-MSスペクトル生成手順において、前記所与の選択された前駆体の個々のMS-MSスペクトルが、前記の割り当てられたフラグメントイオン対及び/又はマルチプレットと、前記所与の選択された前駆体の質量若しくは質量対電荷比(m/z)の値を有する、
請求項1乃至9のいずれかに記載の方法。
【請求項12】
タンデム質量分析システムにおいて実装されるように設計されたコンピュータプログラムであって、
前記タンデム質量分析システム内で実行されるときに、前記タンデム質量分析システムが請求項1乃至11のいずれかに記載の方法を実行するように、前記タンデム質量分析システムを制御する一組の命令を有する、
コンピュータプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate


【公表番号】特表2013−512419(P2013−512419A)
【公表日】平成25年4月11日(2013.4.11)
【国際特許分類】
【出願番号】特願2012−540347(P2012−540347)
【出願日】平成22年10月29日(2010.10.29)
【国際出願番号】PCT/EP2010/066508
【国際公開番号】WO2011/064068
【国際公開日】平成23年6月3日(2011.6.3)
【出願人】(512140348)フィジクロン ソシエテアノニム (1)
【Fターム(参考)】