説明

質量分析法

方法は、
(a) 質量スペクトルの第1ピークを選択する、
(b) 前記第1ピークを生じることが可能な第1荷電状態を有する第1モノアイソトピック参照イオンを選択する、
(c) 前記第1参照イオンの1つ以上の他の同位体形態に対して前記質量スペクトル中で1つ以上の更なる予想ピークを決定する、
(d) 前記1つ以上の決定された更なる予想ピークに合致する1つ以上のピークが前記質量スペクトル中に存在するかどうかを決定するために、前記1つ以上の決定された更なる予想ピークを前記質量スペクトルと比較する、
(e) 前記1つ以上の決定された更なる予想ピークが前記質量スペクトル中の1つ以上のピークと合致すれば、前記第1ピークをデータピークとして指定し、及び任意で前記質量スペクトルに存在する前記1つ以上の決定された更なる予想ピークに合致する1つ以上のピークをデータピークとして指定する、
(f) 前記決定された更なる予想ピークが前記質量スペクトル中のピークに合致しなければ、1つ以上の更なる参照イオンを1つ以上の更なる荷電状態で、前記工程(b)から前記工程(e)を繰り返す、
(g) 任意で、前記第1荷電状態にある参照イオンあるいは更なる荷電状態にある更なる参照イオンについて、前記第1ピークがデータピークとして指定可能でなければ、前記第1ピークを非データピークとして指定する、
(h) 任意で、前記質量スペクトル中の1つ以上の更なるピークのために前記工程(a)から前記工程(g)を繰り返す、
工程を含むことを特徴とする試料から作成される質量スペクトルデータを処理する方法。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、質量スペクトルの翻訳に役立つ質量スペクトルのデコンボリューション又は簡略化に有効な方法に関する。より詳細には、本発明は、調査中の試料由来のイオンに起因するスペクトル中のピークと、バックグラウンド放射線、ノイズ、又は他の非データ源に起因するスペクトル中のピークの同定方法に関する。特に、この方法は様々な同位体の特異的分布を有するピーク群を同定する。従って、本発明は、前もって決定しておいた同位体分布テンプレートと比較することにより、特徴的な同位体分布に基づきイオンの迅速な同定を可能たらしめる。これらの方法は、特に飛行時間型質量分析法で得たデータ分析にとって非常に有用である。
【背景技術】
【0002】
質量分析法は、大きい生体分子の分析、特にペプチド、及びタンパク質の分析のための好ましいツールとして頭角を現している。例えば、Mannとその共同研究者たちは、衝突誘起性のペプチド解離により決定される、単一のペプチド質量および部分的な配列情報が、その由来するタンパク質の同定に十分であることを示した(非特許文献1)。結果として、混合物中の各タンパク質から特定ペプチドが分離される新しい方法が開発される。理論的には、複合ポリペプチド混合物の分析に対する最も簡潔な取り組みは、ポリペプチド混合物がプロテアーゼで消化され、全ての消化ペプチドが液体クロマトグラフィー質量分析(LC−MS)により解析されるMudPIT法に見られる(非特許文献2及び3)。MudPIT法による取り組みは、高分解能多次元クロマトグラフィーを用いてこれらのペプチド全ての分離を試みることで試料の複雑性の問題を克服するが、しかし、クロマトグラフィーカラムから多くのペプチドが同時に溶出するのは希ではない。液体クロマトグラフィー分離は、一般的にエレクトロスプレーイオン化源による質量分析法と併用される。エレクトロスプレーイオン化法は、液相から気相へイオンを得る非常に「穏やかな」手法であるが、大きい生体分子のイオン化は多重荷電状態にあるイオンを生じ、結果として生じる質量スペクトルを複雑にする傾向がある(特許文献4)。従って、MudPIT法及びエレクトロスプレー質量分析法の組合せから生じる質量スペクトルは、非常に複雑である。
【0003】
「試料採取」方法は、成分を同定するために元試料に関する十分な情報を保持すると同時に、小さいペプチド集団を扱って作成される質量スペクトルの複雑性を低減するために必要な調整方法として注目され始めている。ICAT法(非特許文献5)は、システインを含有するペプチドを捕捉するために、チオールに反応するビオチンリンカー同位体対である「同位体標識アフィニティータグ」を使用する。ICAT法において、第1の源由来のタンパク質試料を「軽」同位体ビオチンリンカーで反応させ、また他方では、第2の源由来のタンパク質試料は、「重」同位体ビオチンリンカーで反応させる。そして、2つの試料を、プールしエンドペプチダーゼで開裂させる。ビオチン化システイン含有ペプチドは、質量分析法による次の分析のためにアビジン化ビーズ上に単離可能である。2つの試料は、定量的に比較され得る:対応するペプチド対が相互基準としての役目をし、2つの試料の比が定量化可能になる。ICAT法の試料採取は、MudPIT法よりも複雑でない試料源を表すペプチド混合物を生成するが、しかし大量のペプチドは依然として単離しており、LC−MS/MSによるペプチド分析が複雑なスペクトルを作成する。
【0004】
マトリックス支援レーザー脱離イオン化飛行時間型質量分析装置(MALDI TOF)(非特許文献6〜8)を使用するペプチドマスフィンガープリンティング法は、二次元ゲルを用いて分離したタンパク質の分析に広く使用されている質量分析技術であり(非特許文献9〜11)、タンパク質を同定するための強力な方法である。MALDI TOFは、大きい生体分子が+1状態だけを与えてイオン化する傾向があるため、比較的単純な質量スペクトルを作成する非常に穏やかなイオン化法である(非特許文献12)。MALDIにおいて、ペプチドに関する情報をより多く得るため、特徴的な同位体分布をペプチドに付与するタグでのペプチド標識に基づくいくつかの有効な技術が開発されてきた(非特許文献13)。これにより、標識ペプチドは、特異的な同位体の特徴により同定可能となる。しかしながら、手作業で行うには遅すぎるタスクであるため、そのようなスペクトルの自動翻訳用ソフトが必要とされている。
【0005】
従って、特にペプチド混合物のエレクトロスプレーイオン化法により作成されるこれらの複雑なスペクトルを迅速にデコンボリューションし、スペクトル中の特定イオンクラスを同定するためのソフトウェアが必要とされている。ペプチドは、比較的予測可能な炭素、窒素、酸素、及び水素分布であるため、特徴的な同位体分布を有する。ある種の要素、例えばハロゲン原子等は一般的にペプチドには存在しないが、他の要素である硫黄、及びリン等は時々存在する。これらの様々な原子組成は、一般的にペプチドを含む元素が同位体存在比において天然の差異があるため、ペプチドに対して特徴的な同位体組成を生じる。そのような分布は、主に質量スペクトルデータで検出可能であるが、この目的のための効果的なソフトウェアは無い。同様に、ペプチドを標識することで、変更された分布を創出できる。しかしながら、複雑なスペクトルである特徴的な同位体存在比分布でイオンを同定するためにスペクトルの自動処理に使用可能なソフトウェアは無い。
【0006】
【非特許文献1】Mann, M.; Wilm, M. Anal Chem 1994, 66, 4390−4399
【非特許文献2】Washburn, M. P.; Wolters, D.; Yates, J. R. Nat Biotechnol 2001, 19, 242−247
【非特許文献3】Washburn, M. P.; Ulaszek, R.; Deciu, C.; Schieltz, D. M.; Yates, J. R., 3rd Anal Chem 2002, 74, 1650−1657
【非特許文献4】Gaskell, S. Journal of Mass Spectrometry 1997, 32, 677−688
【非特許文献5】Gygi, S. P.; Rist, B.; Gerber, S. A.; Turecek, F.; Gelb, M. H.; Aebersold, R. Nat Biotechnol 1999, 17, 994−999
【非特許文献6】Karas, M.; Hillenkamp, F. Anal Chem 1988, 60, 2299−2301
【非特許文献7】Hillenkamp, F.; Karas, M. Methods Enzymol 1990, 193, 280−295
【非特許文献8】Hillenkamp, F.; Karas, M.; Beavis, R. C.; Chait, B. T. Anal Chem 1991, 63, 1193A−1203A
【非特許文献9】Pappin, D. J. C.; Hoejrup, P.; A.J., B. Curr Biol 1993, 3, 372−332
【非特許文献10】Mann, M.; Hojrup, P.; Roepstorff, P. Biol Mass Spectrom 1993, 22, 338−345
【非特許文献11】Yates, J. R., 3rd; Speicher, S.; Griffin, P. R.; Hunkapiller, T. Anal Biochem 1993, 214, 397−408
【非特許文献12】Karas, M.; Gluckmann, M.; Schafer, J. J Mass Spectrom 2000, 35, 1−12
【非特許文献13】Sechi, S.; Chait, B. T. Anal Chem 1998, 70, 5150−5158
【発明の開示】
【発明が解決しようとする課題】
【0007】
本発明の目的は、前記先行技術に関する問題を解決することである。特に、本発明の目的は、質量スペクトルをデコンボリューション及び/又は簡略化するために、調査中の試料由来の質量スペクトル中のピークと試料由来でないピーク間の識別方法を提供することである。特に、本発明の目的はイオンが広く様々な質量を有し、及び多荷電状態に存在しても、質量スペクトルにおいて特徴的な同位体分布でイオンを同定する方法を提供することである。
【0008】
本発明の更なる目的は、スペクトルに存在するイオンを同定及び定量化するスペクトルの自動翻訳方法を提供することである。
【課題を解決するための手段】
【0009】
従って、本発明は、試料から作成される質量スペクトルデータを処理する方法を提供し、該方法は下記工程を含む。
(a) 質量スペクトルの第1ピークを選択する。
(b) 前記第1ピークを生じることが可能な第1荷電状態を有する第1モノアイソトピック参照イオンを選択する。
(c) 前記第1参照イオンの1つ以上の他の同位体形態に対して前記質量スペクトル中で1つ以上の更なる予想ピークを決定する。
(d) 前記1つ以上の決定された更なる予想ピークに合致する1つ以上のピークが前記質量スペクトル中に存在するかどうかを決定するために、前記1つ以上の決定された更なる予想ピークを前記質量スペクトルと比較する。
(e) 前記1つ以上の決定された更なる予想ピークが前記質量スペクトル中の1つ以上のピークと合致すれば、前記第1ピークをデータピークとして指定し、及び任意で、前記質量スペクトルに存在する前記1つ以上の決定された更なる予想ピークに合致する1つ以上のピークをデータピークとして指定する。
(f) 前記決定された更なる予想ピークが前記質量スペクトル中のピークに合致しなければ、で1つ以上の更なる参照イオンを1つ以上の更なる荷電状態で、工程(b)から工程(e)を繰り返す。
(g) 任意で、前記第1荷電状態にある参照イオンあるいは更なる荷電状態にある更なる参照イオンについて、前記第1ピークがデータピークとして指定可能でなければ、前記第1ピークを非データピークとして指定する。
(h) 任意で、前記質量スペクトル中の1つ以上の更なるピークのために前記工程(a)から前記工程(g)を繰り返す。
【0010】
前記工程(a)において、ある第1ピークが質量スペクトルの調査のために選択、又は同定される。この方法を実施する際に、スペクトル中でいずれのピークも初めに選択され得る。しかし、好ましくは、スペクトル中の最低質量、及び/又は最高荷電状態に相当するピークが選択される。なぜならば、そのようなピークは、一般的に、分析器によりしばしば最も正確に分離されるためである。最高精度を維持するために全ての質量/電荷比が、最高質量/電荷比に関連するのが好ましい。必要であれば、スペクトルデータはスペクトル中のピーク同定を活用して平滑化等の前処理がなされる。
【0011】
上記の予備的分析後、必要であれば指定のデータピークにモデルが適合される。ピークは、特定の幅と高さを有し、特徴的な形状を与える。この形状は、用いる分析器の種類を含む多数の因子に依存する。従って、同一のイオンであっても、全く同じ質量/電荷比値で全てが記録される訳ではない。飛行時間型分析器において、いくつかは僅かに前に到着し、又は他は遅れて到着する。ピークに特徴的な形状が与えられるのはこのためである。この形状は適切な機能を使用してモデル化されるが、下記に説明するようにガウス、ローレンツ、及びフォークト関数が好ましい。このモデル化から、より正確なピーク形状が決定可能であり、従って、各ピークのより正確な質量/電荷比値を決定することが可能となる。これは、下記に記載する続くピーク分析、及びスペクトル帰属の大きな助けとなる。
【0012】
選択される参照イオンは、理論上第1ピークになりうる、特定の質量及び荷電状態を有する任意のイオンである。参照イオンは、そのようなイオンのデータベースから選択可能であるか、又は処理時間で算出可能である。この段階では、選択されたイオンは、最も普通に存在する同位体を構成原子に各々有するのが好ましい。なぜならば、このイオンは天然に存在しうる同位体中で最も豊富なイオンであり、従って、スペクトルに最大に寄与するからである。そのようなイオンは、本発明に関連してモノアイソトピックイオンと称される。場合によっては、第1ピークに関与可能である1つよりも多いモノアイソトピックイオンが同じ荷電状態や異なる荷電状態で存在する。本発明において、方法を1度以上繰り返す間に、まず初めに同じ荷電状態(通常、最高荷電状態)のモノアイソトピックイオンが検討され、他の荷電状態は個別に調査されるのが好ましい。
【0013】
第1イオンはモノアイソトピック形態で選択された後、該イオンに対する同位体分布が決定され得る。各構成原子の異なる同位体は、天然で異なる存在度であり、これらの存在度は、同じ化学構造を有し異なる同位体で存在する可能性のあるイオンの全ての量に影響する。ある固有のイオンに存在する同位体が普通には存在しなければしないほど、対応するモノアイソトピックイオンと比較して、そのイオンはより存在しない傾向がある。同じ化学構造であるが、異なる同位体分布を有する各イオンは、本発明に関連して同じイオン群であると言える。
【0014】
イオン群を構成する同位体の質量が異なるため、イオン群は質量スペクトル中で様々なピークを形成し、通常はイオン群のモノアイソトピックメンバーに対応する最強(最も密度の濃い)ピーク付近でクラスタ化する。モノアイソトピックメンバー以外の同位体は、その存在比は様々であるが、同位体の存在比に相関してそのピークの強度を有するはずであり、これは天然の同位体存在比が公知であるため算出可能である。これらが、スペクトル中で決定された更なる予想ピークである。これは、イオンに対するピークテンプレートの形態等のデータベースで事前に算出した情報で比較して決定することもできるし、又は必要に応じて計測と同時に算出して決定し得る。複数のモノアイソトピックイオンがピークに関与する場合、存在すると考えられる各イオンの相対的比率が、各イオン同位体に対するピーク強度の加重平均を得るために使用可能である。例えば、存在し得る2つのモノアイソトピックイオン(2つのイオン群)は、等量(比率50:50)で存在し、単一イオン群だけが存在するピークと比較して、各群に対して算出された更なる予想ピークは、強度が半分になると仮定される。例えば、比率が60:40の場合は、1つの群の強度が3/5、及びもう1つの強度が2/5となる。これらの比率は試料源に基づいて推測されるべきだ。すなわち、ある化合物は、他の化合物よりも生体試料中により存在する傾向があることを考慮に入れなければならない。
【0015】
上記のとおり、計算は同時に行われるか又は事前に行われ得る。データベースから最初に選択されるイオンの場合、事前に算出したイオン群のテンプレートが用いられ、該テンプレートは算出した分布中に同位体ピークを含む。1つよりも多いイオン群に対して、イオンが存在すると考えられるいずれの比率にもテンプレートは重ねられ得る。
【0016】
算出されたピーク及び/又はテンプレートは、テンプレートが適合されるスペクトルにピークが存在するかどうかを確かめるためにスペクトルと比較される。「実際の」ピーク付近の同位体分布は実際のデータの特徴を有するのに対し、ノイズ、宇宙線、装置のアーチファクト、又は他の干渉から生じる偽のピークはそのような分布を表示しない。従って、「データ」ピークは「非データ」ピークから分離可能である。マッチング方法は、好ましくは、予想ピーク間及び/又は予想ピークの相対強度間の分離を、スペクトル中のピークと比較し、あるしきい値に達すれば、合致したと記録される。しきい値は、ユーザがどの程度感度が良い方法を必要とするかによって変更可能である。他のパラメータは、必要に応じてピーク幅、又は形等の比較に使用できる。パラメータ等のモデル化機能は当技術分野で公知であり下記に考察する。
【0017】
本発明に関連して、下記に言及するテンプレートマッチング方法は、スペクトル中のピークから決定される一連のパラメータを既知のイオンクラスからのピークの予想パラメータに適合する方法を意味し、この過程でマッチング方法における自由パラメータは無い。
【0018】
また本発明の文脈においては、モデル適合方法は、費用関数を使用して、モデルと実数データの間の局所的な最低誤差をもたらす一連の自由パラメータを予測して、既知のイオンクラス由来のモデルを質量スペクトル中の一連のピークに適合を試みる方法を意味する。費用関数は、データができるだけ厳密にモデルを適合することを確実にするように選択される。
これらの数学的方法は当技術分野で公知であり、信号処理テキストで広範囲に検討されてきた。
【0019】
第1ピークは、実際のデータピークとして同定されるか、又は合致するものが見つからず、スペクトルを帰属する際にピークが検討から外されるまで繰り返され得る。一般的に次の荷電状態における新しい参照イオンの選択が繰り返され、全ての荷電状態がテストされる。一旦、全ての荷電状態がテストされると第1ピークにおける反復工程が終了する。全ての処理手順は、データピークとして既に指定されていないピーク、例えば、第2ピーク、第3ピーク、第4ピーク等に対して、と続けて全てのピークをテストするか、あるいは又は希望する数のピークについて繰り返される。好ましくは、用いられた分析計において分離できるもっとも普通の荷電状態で最も質量ピークの低いものが最初に使用される。ピークは質量電荷比(m/z)として測定されるため、これは最低質量、及び最高電荷で始まり、電荷が最小値に達するまで、毎回1単位低い電荷で繰り返される。そして、スペクトル中の次のピークが選択され、処理手順が繰り返される。該して、飛行時間型(TOF)分析計の場合、分離される最高荷電状態は+6であるが、場合によっては+8もあり得る。従って、好ましくは、方法は荷電状態が+8で始まり次々に+1にまで低下する。より好ましくは、方法は荷電状態が+6で始まり次々に+1にまで低下する。また代わりに、陰イオンの状態も用いられ得る。この場合、方法は−8で始まり−1に進み、又は−6で始まり−1に進む。
【0020】
一旦、スペクトルが処理されてデータピークが同定されると、スペクトルを同じ荷電状態、好ましくは+1又は−1状態に存在するイオンを代表するスペクトルに変換するのが望ましい。従って、本発明のいくつかの実施形態において、方法は、スペクトルに同じ分子種の異なる荷電状態が存在するかどうかを決定する、及びこれらの多荷電状態から生じるピークを単一荷電状態から生じるピークへ還元させる更なる工程を含む。新しく形成されるピークの強度は、個別の荷電状態から分子種の電荷に寄与する強度の合計である。このような方法で、スペクトル中でピークの数は非常に減少し、ピークの帰属を促進する。同様の取り組みが同じイオンの多数のアイソトポマーのピークに関して行われる。これらの減少により、化学的及び生物学的観点からは重要でない電荷、又は同位体差異に関係なく、存在する各化学種の量が直接比較可能になる。
【0021】
一旦、データピークが決定されると、スペクトルの最終帰属は非常に簡潔化された方法で実施され得る。
【0022】
本発明は、また、質量スペクトルデータ処理用コンピュータプログラムを提供し、コンピュータプログラムは、下記工程を行うよう準備される。
(a) 質量スペクトルの第1ピークに寄与できる第1荷電状態を有する第1モノアイソトピック参照イオンを選択する。
(b) 前記第1参照イオンの1つ以上の他の同位体形態に対して前記質量スペクトル中で1つ以上の更なる予想ピークを決定する。
(c) 前記1つ以上の決定された更なる予想ピークに合致する1つ以上のピークが前記質量スペクトル中に存在するかどうかを決定するために、前記1つ以上の決定された更なる予想ピークを前記質量スペクトルと比較する。
(d) 前記1つ以上の決定された更なる予想ピークが前記質量スペクトル中の1つ以上のピークと合致すれば、前記第1ピークをデータピークとして指定し、及び任意で前記質量スペクトルに存在する前記1つ以上の決定された更なる予想ピークに合致する1つ以上のピークをデータピークとして指定する。
【0023】
コンピュータプログラムは、好ましくはデータ処理手段に上記工程のいくつか、又は全てを実行させるための指示を含む。
【0024】
本発明は、また、試料から作成される質量スペクトルの翻訳方法を提供し、該方法は下記工程を含む。
(a) 上記に定義する方法により質量スペクトルデータを処理する。
(b) データピークだけに基づいて質量スペクトルを翻訳する。
【0025】
本発明は、また、上記に定義する質量スペクトルの翻訳方法を含むMudPIT法を実施する方法、及び上記に定義する質量スペクトルの翻訳方法を含むICAT法を実施する方法を含む。
【発明を実施するための最良の形態】
【0026】
第1の特徴的な態様において、本発明は、質量スペクトル中において特徴的な同位体存在比分布を示す分子種に相当するイオン群の同定方法を提供し、該質量スペクトルは、既知の質量電荷比のイオンに対応するピークとして同定されたピークリストを含み、該方法は下記工程を含む。
1. スペクトル中の1つ以上のピークに対して、異なる所定のイオンクラスに特有の、電荷及び質量に依存する同位体存在比分布テンプレートを、それら所定のイオンクラスに対応するピーク同定に使用するために算出する。
2. 所定のイオンクラスに対する個別のテンプレートを含む、算出された一連の質量、及び電荷に依存する該同位体分布テンプレートを連続的に適用し、該テンプレート中の各イオンは最高予想荷電状態のものに対応するものから始め、これにより同位体テンプレートに適合する質量スペクトル領域を速やかに同定する。
3. 予備的同定を確認するために、テンプレートマッチング法により同定されたイオンに対して、予想同位体分布のモデルを適合する。
4. 任意で、単一イオンの多数のアイソトポマーに対応するピークを単一モノアイソトピックピークに還元させる。
5. 任意で、スペクトル中で同じ分子種の異なる荷電状態があるかどうかを判別して、これらを同じ分子種の単一荷電状態へと還元させ、該単一荷電状態の強度は、該分子種の統合された荷電状態の強度の合計となるようにする。
【0027】
第2の特徴的な態様において、本発明は、下記工程を含む飛行時間型質量分析器データにおける特徴的な同位体分布でイオンを同定する方法を提供する。
1. 飛行時間型質量分析計の1つ以上のイオンのドリフト領域の飛行時間を含むデータを得る。
2. 該ドリフト領域の飛行時間と各々複数の異なる経過時間を有するイオン数とを含むデータを処理し、特定の経過時間を有するイオン数を表すデータを含む少なくとも1つの実測質量スペクトルを作成する。
3. 質量ピークに相当する該データを該実測質量スペクトル部中に認識する。
4. 所定のイオンクラスを同定するためにイオンクラスに特有な所定の電荷、及び質量依存同位体分布テンプレートを使用する。
5. 予備的同定を確認するために、テンプレートマッチング法により同定されたイオンに対して、予想同位体分布のモデルを適合する。
6. 任意で、単一イオンの多数のアイソトポマーに対応するピークを単一モノアイソトピックピークに還元させる。
7. 任意で、スペクトル中で同じ分子種の異なる荷電状態があるかどうかを判別して、これらを単一荷電状態へと還元させ、該単一荷電状態の強度は、該分子種の統合された荷電状態の強度の合計となるようにする。
【0028】
本発明の第3の特徴的な態様は、コンピュータ可読記憶媒体に対して質量スペクトル翻訳用コンピュータプログラムの複数のコピーを提供し、各コンピュータ可読記憶媒体がプロセッサグループの1つに取り付けられ、及び各プロセッサは通信手段によりグループ内の他の全てのプロセッサに接続する。グループ内の全てのプロセッサもまたネットワーク上でマスタープロセッサに接続する。マスタープロセッサはまた、質量スペクトルをサブスペクトルに分離し、コンピュータにクラスタ化してそれらを分配するためのプログラムがあるコンピュータ可読記憶媒体に接続される。更に、マスタープロセッサに取り付けられるコンピュータ可読記憶媒体に関するプログラムは、前記グループのプロセッサに分析された後、翻訳されたサブスペクトルを再構築可能である。
【0029】
第4の特徴的な態様において、本発明は、質量スペクトル中で特定アミノ酸を含むペプチドの同定方法を提供し、下記工程を含む。
1. ペプチドの1つ以上の反応性官能基と反応するタグでペプチドの複合混合物を反応させ、該タグはタグを付加されたペプチドの同位体分布に変化を生じさせる。
2. スペクトル中で1つ以上のイオンに対して一連のタグ、電荷、及び質量に依存する同位体分布テンプレートを算出する。該テンプレートは荷電状態、質量範囲、及びペプチドに存在するタグの数の各予想組合せに対して存在する。
3. タグを付加されたペプチドの分析により作成された質量スペクトル中のイオンに対し、質量及び電荷に依存する該同位体分布テンプレートを連続的に適用し、予想される最高のタグ数及び荷電状態に対するテンプレートから始めて、同位体テンプレートに適合する質量スペクトル領域を探す。
4. 任意で、予備的同定を確認するために、テンプレートマッチング法により同定されたペプチドイオンに対して、予想同位体分布のモデルを適合することで、ペプチドの荷電状態、及びペプチドで反応させたタグの数を同定する。
【0030】
本発明の第1の特徴的な態様により、質量及び電荷依存性のテンプレートリストが算出される。本発明の目的のために、様々な質量及び荷電状態にある多数の異なるペプチド群について、同位体の存在比あるいは強度の平均分布状態を決定することにより、テンプレートは算出される。ペプチドの同位体存在比分布は、ペプチドを構成する原子の天然における同位体存在比、及び様々な天然同位体が分子集団に分配されうる組み合わせの数により決定される。あるペプチドの同位体存在比分布は、ペプチドの原子組成を算出し、次いで異なる同位体を含むと予測されるペプチド分子集団の比率を決定するために組合せ確率モデルを適用することで決定される。そのようなモデルを使用し、ペプチド原子組成からペプチド同位体存在比分布を算出する方法、及び既知の天然同位体存在比は、Gay等により開示されている(後掲の参照文献14参照)。所定のモノアイソトピック質量のペプチドの平均同位体存在比分布を決定するためには、その質量の多数の様々なペプチドの同位体分布の決定が必要である。配列を不規則に作成し、それらのモノアイソトピック質量を算出し、そして配列を同じ質量でグループに分類することで、所定の質量の多数のペプチド配列は作成可能である。各質量の算出されたペプチドリストは、平均ペプチド同位体分布の決定に使用可能である。あるいは、ペプチドは通常は酵素消化によりタンパク質から生成されるので、SWISS−PROT(後掲の参照文献15及び16参照)、又はProtein Information Resource(後掲の参照文献17及び18参照)等の公共データベースのタンパク質配列を、トリプシン等の任意のプロテアーゼで擬似消化することにより作成される仮想ペプチド配列を導き出すことで、多数のペプチドが生成可能である。予測フラグメントは、質量により分類可能であり、これらのペプチドの平均同位体分布が算出可能である。後者の方法は、公共データベースが天然アミノ酸存在比を示すので好ましい。該データベースはまた生物により検索可能であるので、決定すべきペプチドが由来する生物種のためのタンパクを供給することができ、従って、該生物に特異的なアミノ酸存在比を反映させることができる。同様に、標識生体分子の原子組成のデータベースは、存在するデータベースから直ぐに導き出すことが可能であり、例えば、標識ペプチドの原子組成は、予想標識アミノ酸の原子組成を非修飾ペプチドの配列に置換することで作成可能である。さらに、同位体テンプレートを定義するのに重要であるので、データベース中の所定の質量電荷比を有するイオンの同位体の強度の予測される変動範囲もまた決定されるべきである。同様に、本発明で使用される質量分析計が記録する同位体の強度の変動範囲もまたテンプレートの算出に考慮され得る。
【0031】
ペプチドの質量は、同位体分布の形状を決定する。図5a及び5bは、特徴的な公的データベースに由来するペプチドの平均同位体分布を示し、ペプチドの質量、及び荷電状態が分布形状に劇的に影響するのが見られる。明らかに、荷電状態が増加するにつれ、異なる同位体間の質量電荷比の差は、それに従い小さくなる。例えば、2+状態に対して第1及び第2同位体ピーク間のm/zの差異はm/z単位の半分となり、また、3+状態に対して第1及び第2同位体ピーク間のm/zの差は、m/z単位の3分の1となる。また、ペプチドの質量が増加するにつれ、より質量の大きい異性同位体が優勢なものが増加する。質量スペクトルスクリーニングにおいて、TOF質量分析器は機器分解能に限界があるので+6よりも大きい荷電状態は通常観察されないことが分かっているため、算出するために必要なテンプレートの数は、機器の能力により決定され、これに伴い必要とされる演算処理量は適宜調整可能である。
【0032】
実際のテンプレートは、第1ピークの高さに対する様々な同位体ピーク最高値の強度比を測定した、平均同位体分布から決定される。ペプチド質量増加が及ぼす、第1ピークの強度とより高い同位体種の強度との間の比率への影響が図6aに示される。図6aはまた、もう一つの重要な点、決定されるべき予想同位体強度の範囲、を明らかにしている。同位体強度の変動範囲もまた図6aに示す。従って、各荷電状態、及び質量に対するテンプレートは、実際に許容すべき平均値からの同位体存在比の予想偏差を伴う同位体ピーク分離、及び同位体存在比における予想差異からなり、各同位体ピークに対する質量電荷比における予想差異と組み合わされる。算出された同位体強度の偏差よりも僅かに大きい偏差は、実測値における不規則変動であると考慮されるべきである。同様に、機器の質量精度は、互いに関連する各同位体ピークの位置を決定するために考慮しなければならない。テンプレートの概念及び許容値は図6bに図形で示される。
【0033】
図3は、質量、及び電荷依存テンプレートがどのように質量スペクトルS(x,y)に適用されるかを図示したフローチャートである。スペクトルS(x,y)は、測定した質量電荷比の順番に分類した、質量電荷比をx、強度をyとするイオンリストを含む。スペクトル中の各イオンピークに対して、測定した質量電荷比において、一連のテンプレートが算出され、該一連のテンプレートは測定した質量電荷比における、イオンの様々な可能性のある荷電状態に対するテンプレートからなる。標識ペプチドの場合、タグが様々な数であることを考慮して、テンプレートは各可能性のある標識種に対して算出される。データベースを使用する場合は、所定の荷電状態で(及び標識ペプチドの場合は所定数のタグで)測定した質量電荷比のイオンを生じさせることができる、データベース上の全てのエントリーが、各テンプレートの算出に使用され、これは、すでに考察したとおり、強度及びピーク分離における予想変動を考慮に入れた、与えられたピークを生じさせることができるイオンの平均同位体存在比分布を表す。予想最高荷電状態に対応するテンプレートが、最初にスペクトルに適用される。イオンは、質量スペクトルS(x,y)に記録された中で最も質量電荷比の低いイオンから選択される。該イオンをテンプレートと比較するにあたり、スペクトルS(x,y)において、次のイオンが、テンプレートにおいて第2同位体ピークの差異に相当する質量電荷比の差異を、許容値内で有するかどうかについて照合される。S(x,y)における次のイオンが、適切な質量電荷比を有する場合、第2ピークに対する第1ピークの強度比が算出される。これがテンプレートの許容範囲内である場合、第3同位体ピークに相当するかどうかを検討するために、S(x,y)からの次のイオンが同様にテンプレートに対してテストされる。必要に応じてより多くのピークが使用可能であるが、一般的には、最初の3つの同位体ピークの強度比のみが照合されれば十分である。従って、第1の3つのイオンがテンプレートの基準を満たせば、それらは、事前ヒットリスト(H)に追加される。そして、第1テンプレートに対して全てのイオンが照合されるまで、S(x,y)における次のイオンに対して処理が繰り返される。このようにして、スペクトルS(x,y)中に、所定の特性のイオンを含む領域を速やかにスクリーニングすることが可能である。
【0034】
次に、ヒットリストHにおいて可能ありとされたイオン群は、より高級な同位体分布のモデルを適用して確認される。該モデルにおいては、各イオンに対して記録したピークにおいて、測定した誤差を考慮する。このモデル化工程はより時間がかかるため、上記に示したより早いテンプレートスクリーニング方法が必要である。しかし、スペクトルに存在する該イオン量を定量するのに必須である、ピーク面積及びピークの質量電荷比の測定値といった適合されたモデルにおけるキーパラメータを決定するために適合されたモデルは使用されるから、正確なモデル化は重要である。例えば、TOFスペクトル中で各ピークは、同じ原子組成のイオンを含むと仮定される。検出器における到達時間は、イオンに与えられたエネルギーにより変化し、記録される到達時間に散らばりが生じる。イオンエネルギーの分布は、ガウス密度関数により概算可能である。また、ローレンツ、又はフォークト関数は、イオンピークの形状をモデル化するために使用可能である。同様に、様々な機器構成により、イオンエネルギー分布で典型的に変化する、特徴的形状のイオンピークを生じる。イオンエネルギー分布は、イオン化方法と質量分析機構の間の相互作用から生じる複雑な関数である。これらのイオンピーク形状は、ほとんどの場合、ガウス、ローレンツ、又はフォークト関数に対するパラメータを推測することでモデル化可能である。従って、前記テンプレートで重要なイオンに対応可能なスペクトルの領域同定の後、これらの予備的な同定は、より正確なイオンピーク形状のモデルにより確認される。本発明の好適な実施形態において、同位体分布のガウスモデルは、スペクトルS(x,y)における各ピーク(事前ヒットリストHからの同定)に適合され、測定したデータがモデルにいかによく適合するかを決定するために最小二乗誤差が計算される。これらの正確なモデルのグラフを図5bに示す。誤差が事前に定義したしきい値よりも小さければ、予備的ヒットはヒットとして確定される。そして、より複雑なモデル化の基準を満たすHからのピークは、確認したヒットHの第2リストに移動する。Hに加えられたピークに対するデータもまたスペクトルS(x,y)から排除される。Hだけが各ピーク及び同位体強度の合計に対するモノアイソトピック質量を記録するように、Hにおけるより高い同位体ピーク領域が第1同位体に追加される。質量電荷比及びピーク領域等のパラメータは、Hにおけるモノアイソトピックイオンで記録した各ピークに対する適合されたモデルにより決定される。更に、同位体ピークが適合されたテンプレート、又はモデルにより決定される荷電状態は、モノアイソトピック強度で記録される。
【0035】
所定の荷電状態に対してテンプレートがテストされると、+1荷電状態のテンプレートが照合されるまで、次に最も低い荷電状態に対するテンプレートが質量スペクトルに、連続的に適用される。テンプレートで同定された確認済イオン群は確認済ヒットリストHに追加され、該イオン群に相当するピークは、スペクトルS(x,y)から排除される。所定のイオンに対して全てのテンプレートが照合されると、スペクトル中の次のイオンが同様に分析される。この処理の最終結果は、質量電荷比、荷電状態、及び強度を伴う確認済モノアイソトピックイオンリストである。
【0036】
本発明のいくつかの実施形態において、同定されたモノアイソトピックイオン種のスペクトルは、スペクトルに存在する分子種のいずれかに多荷電状態があるかどうかを決定するために分析される。これを行う方法は、図4にフローチャートとして示され、本発明の第1の態様のテンプレートマッチング法により形成される確認済モノアイソトピックイオンピークのヒットリストHで始まる。最終質量リストMは、Hを使用して初期化される。最終質量リストは、荷電状態+1のH由来のイオンで初期化される。Mに追加されるイオンデータはHから排除される。そして、方法はHにおいて検出された最高荷電状態のイオンで始まる。最高荷電状態の各イオンに対して、+1状態の同イオンの予想質量電荷比が算出される。そして、最終質量リストは、この+1荷電状態に相当するイオンが存在する(より低いイオン質量の質量電荷比の決定における事前定義の誤差内)かどうかを決定するために検索される。そのようなイオンが最終質量リストMに見つかれば、より高い荷電状態として同じ分子種に相当すると仮定される。より高い荷電状態種のイオン強度が決定されて、Mにおいて適合する+1種に加えられ、より高い荷電状態種はヒットリストHから排除される。イオン強度の決定は、機器に依存しており、例えば四重極型において、強度は単に各ゲートにおけるイオンカウントであり、他方、TOF質量分析器において、各イオンのピーク面積を積分しなければならない。+1状態が発見されなければ、不適合種の荷電状態は+1状態に変えられてより高い荷電状態がHから排除される。即ち、高い荷電状態種は+1状態における同じ強度のイオンを伴う種で置き換えられ、Mに追加される。処理は、スペクトルの、イオンリストにおいて次により低い荷電状態のイオンについて行われ、+2荷電状態のイオンに至るまで、繰り返される。最終結果は、全てが+1荷電状態であるモノアイソトピック種を含む最終質量リストMであり、その強度は、該イオンの荷電状態包絡線を構成する全てのイオンの強度の合計に相当する。この荷電状態のデコンボリューション処理は、イオンを特徴づける更なる情報を提供し、いくつかの実施形態においては、所定のイオンの各荷電状態の強度は、+1荷電状態でデコンボリューションされたモノアイソトピック種において記録される。この荷電状態包絡線データは、特に、クロマトグラフ分離から溶出する試料材料から多くのスペクトルが生成される液体クロマトグラフィー分析において、スペクトルを比較するために使用可能である。ほとんどの機器の質量精度は、より低い質量電荷比の種に対してより優れているのに対し、所定のイオンのより高い荷電状態の質量電荷比は、質量分析計でより正確に測定される傾向がある。よって、念入りな荷電状態のデコンボリューションにより+1状態の質量電荷比測定が改良される。
【0037】
本発明のいくつかの形態において、同位体存在比分布テンプレートは、「オンザフライ」、すなわち必要になってから、計算される。他の実施形態において、テンプレートは事前に算出可能で、及び必要な場合にアクセス可能な形態で記憶可能である。これが可能となるのは、例えば、あるペプチド配列データベースの中から、ペプチドが分析され、テンプレートが計算される場合である。なぜなら、データベース中には、所定の質量電荷比でイオンを生じさせることができるイオン種の数は限られているからである。よって、ペプチドデータベース中のすべての要素毎に、予想される全ての荷電状態に相当するテンプレートは、予め算出可能である。
【0038】
飛行時間型データの処理
本発明の第1の態様で提供される方法を質量スペクトルデータに適用するために、データはこの方法に適合する形式でなければならない。データが質量電荷比が知られているイオン強度のリストを含むことが必要である。質量分析器の様々な型は様々な形式の生データを生成するので、これらは、質量電荷比に関連付けられるイオン強度のリストとなるように処理されなければならない。
【0039】
飛行時間型質量分析計において、狭い分布の運動エネルギーを有するイオンのパルスは、電場のないドリフト領域に入れられる。機器のドリフト領域においては、各パルスにおける異なる質量電荷比を伴うイオンは、異なる速度で移動するため、ドリフト領域の最後に位置するイオン検出器に様々な時間の後に到達する。到達イオンに反応する検出器により生成されるアナログ信号は、時間デジタル変換器によりすぐにデジタル化される。イオン飛行時間を測定して各到達イオンの質量電荷比を決定する。飛行時間型機器には多くの様々な設計がある。設計は、イオン源の性質によりある程度決定される。マトリックス支援レーザー脱離イオン化飛行時間型(MALDI TOF)質量分析装置において、イオンパルスは、金属ターゲットに対して結晶化した試料材料のレーザー励起により生成される。これらのパルスは飛行管の一端で形成され、そこから加速される。
【0040】
エレクトロスプレーイオン源から質量スペクトルを得るためには、直交軸TOF(oaTOF)ジオメトリが使用される。エレクトロスプレーイオン源に生成されるイオンパルスは、「押出し」板による連続流れから抽出される。押出し板は、直交して配置された飛行管にイオン源からのイオンを加速する過渡的な電位差を使用して飛行時間型質量分析器にイオンを注入する。押出し板から検出器への飛行時間は、質量電荷比に対するイオン到達数のヒストグラムを作成するために記録される。このデータは、時間デジタル変換器を使用して、デジタル処理で記録される。
【0041】
MALDI−TOF及びESI−oaTOFにおいて、完全なスペクトルを得るために、一般的に約1,000イオンパルスが約100ミリ秒の合計時間の間に分析される。各パルスからの信号はヒストグラムに追加され、よって、生のデジタル化されたTOFスペクトルを作成する。
【0042】
本発明の第2の態様は、飛行時間型質量分析計により作成された質量スペクトデータを処理することにより、目的とするイオンのリストを作成する方法を提供する。図1は、処理の概要のフローチャートを示す。分析方法は、生のデジタル化された飛行時間型データに対して用いられる。生のTOFスペクトルを処理する方法は、大まかに3工程ある。スペクトルは第2工程に適合するスペクトルにするように前処理され、該第2工程では、所定の同位体パターン及び荷電状態でスペクトル中でイオンを同定する。処理の最終工程は、多荷電状態のスペクトルに存在するイオンを同定し、これらの状態を単一+1荷電状態にデコンボリューションする。この分析処理の最終生成物は、+1荷電状態のモノアイソトピックイオン強度リストを含むスペクトルであり、イオンはスペクトルに適用する同位体分布テンプレートの基準を全て満たす。
【0043】
飛行時間型データの前処理は、通常、ESI−TOF、及びQ−TOF測定を作動させるために、機器の製造業者により供給されるソフトウェア、例えば、Micromassにより供給されるMassLynx software(マンチェスター、イギリス)により行われる。しかし、データを直接処理できることが時々好ましく、及び本発明の方法と適合可能にするためにTOFデータの処理に必要な工程の概要を図2に示す。下記で考察する標準デジタル信号処理技術のいくつかを再考するために、例えば、「The Scientist and Engineer’s Guide to Digital Signal Processing」を参照されたい(後掲の参照文献19参照)。
【0044】
TOF質量分析器からのデジタル信号は、一般的に低レベルのランダムノイズで汚染されている。このノイズは、好ましくは、更なる分析に先がけて排除されるべきである。ノイズを除去するために様々な方法が適用可能である。概して、イオン信号に比べてノイズレベルは非常に低い。従って、最も簡単なノイズ消去方法は、しきい値強度を設定し、それ以下の信号を無視する(または排除する)ものである。しかしながら、飛行時間型質量分析器に対するノイズレベルは、質量電荷比の増加につれて変化することが分かったため、様々な質量電荷比に対して変化するしきい値を適用するのがよい。標準しきい値関数は、所定の機器に対してノイズと質量電荷比の相関を決定可能であり、これは強度のしきい値レベルよりも低い信号を排除するために使用可能である。しかし、より好ましい方法は、各スペクトルに対する様々な質量電荷比に対して、データごとにノイズを推定することである。というのは、これにより個別の機器を用いた分析間のあらゆる変化に対応でき、この方法を使用した機器に依存しなくするからである。これは、生のスペクトルをビンに分解し、各ビンごとにノイズを推測することで可能である。よって、適切なカーブを示す補間式又はスプライン関数を、各ビンに対して推定されるノイズに適合させて、スペクトルの質量電荷比の全範囲上において、様々な値をとる適応しきい値を得ることができる。これにより、算出されたしきい値よりも低い信号は、スペクトルから排除される。
【0045】
ランダムバックグラウンドノイズが除去された後、デジタル信号は、データにおけるイオンピークを見つけようと試みる前に平滑化されなければならない。平滑化は様々な方法で達成可能である。一般的に、デジタル質量スペクトルデータは、低帯域フィルタでコンボリューションされる。低帯域フィルタは、一般的に信号の移動平均を効果的に割り出すことでデジタル信号を平滑にする。これにより各イオンに対するデジタル化信号強度における小さな不規則変数に相当する非常に高周波の信号をデータから排除する。デジタル信号は、簡単な二乗関数等の平滑化効果を有する多くの様々なフィルタカーネルでのコンボリューションが可能であり、移動平均における点毎に均等な加重で移動平均が適用される補正スペクトルを作成する。より好ましいフィルタカーネルは、移動平均における中心点により高い荷重を適用する。適切なフィルタカーネルは、窓関数であるsinc関数、ブラックマン窓、及びハミング窓から算出されるフィルタを含む。より好ましい実施形態において、TOFスペクトルは、ガウス関数から算出されるフィルタカーネルでコンボリューションすることで平滑化される。
【0046】
デジタル信号におけるピーク同定は、本質的に連続信号と同じである。連続信号においては、一次および二次の微分が計算される。信号の最大値と最小値、いわゆる、ピークとトラフは一次微分が0である点として同定され、同時に二次微分がマイナスであれば、最大値であると同定される。明らかな信号に対しては、デジタル信号におけるピーク検出を容易にする適当な微分方程式をラプラシアンフィルタにより決定することができる。
【0047】
質量電荷比に対応するピークリストがTOFデータから同定されれば、本発明の第1の態様で提供される方法が、このピークリストに適用可能である。この処理の最終結果は、既知の質量電荷比、荷電状態、及び強度を伴う確認済モノアイソトピックイオンリストである。
【0048】
図1に示すTOFデータ処理における最終工程において、同定されたモノアイソトピックイオン種のスペクトルは、スペクトルに存在するいずれかの分子種の多荷電状態であるかどうかを決定するために分析される。これを実施するための方法は、図4にフローチャートとして示しており、本発明の第1の態様のテンプレートマッチング法により形成される確認済モノアイソトピックイオンピークのヒットリストHから始まる。最終質量リストMは、Hを使用して初期化される。最終質量リストは、荷電状態+1のH由来のイオンで初期化される。Mに追加されるイオンデータはHから排除される。そして、方法はHにおいて検出された最高荷電状態のイオンで始まる。最高荷電状態の各イオンに対して、+1状態の同イオンの予想質量電荷比が計算される。そして、最終質量リストは、この+1荷電状態に相当するイオンが存在する(より低いイオン質量の質量電荷比の決定における事前定義の誤差内)かどうかを決定するために検索される。そのようなイオンが最終質量リストMに見つかれば、より高い荷電状態として同じ分子種に相当すると仮定される。より高い荷電状態種のイオン強度は、TOFデータのイオンのピーク面積を積分することで決定される。それから、積分されたピーク強度は、Mにおいて適合する+1種に加えられ、より高い荷電状態種はヒットリストHから排除される。+1状態が発見されなければ、不適合種の荷電状態は+1状態に変えられてより高い荷電状態がHから排除される。即ち、高い荷電状態種は+1状態における同じ強度のイオンを伴う種で置き換えられ、Mに追加される。処理は、スペクトルから次により低い荷電状態のイオンリストで+2荷電状態のイオンに至り繰り返される。最終結果は、全てが+1荷電状態であるモノアイソトピック種を含む最終質量リストMであり、その強度は、該イオンの荷電状態包装を構成する全てのイオンの強度の合計に相当する。
【0049】
荷電状態のデコンボリューション処理をする際に、該分子イオン種において、各荷電状態の強度を記録するのが望ましい。というのは、このデータはイオンを特徴づけるため、又は元スペクトルを再構成するために有効であるからである。
【0050】
他の質量分析器
本発明の方法は、飛行時間型質量分析器を含まない機器で作成されるスペクトルにも同様に適用可能であるが、しかし、TOF質量分析器は、高い質量分解能を有し、より高い電荷(>+4)のイオンを分割可能であるので好ましい。四重極型機器は、一般的にTOF型機器よりも質量分解能、及び質量精度が劣るが、生データは本発明の方法により分析可能である。ただし、より高い荷電状態種がこれらの機器ではよく分離されない。四重極データの利点は、スペクトルが一般的に平滑化を必要としないことである。ノイズ除去方法は、TOFに対して示す方法と同様である。セクタ型もまた、高い質量分解能を有すが、対応するTOF質量分析器よりも感度が低い傾向がある。フーリエ変換イオンサイクロトロン共鳴型(FT−ICR)質量スペクトルもまた、本発明の方法を使用して分析可能である。これらの機器は、高い荷電状態を分離可能である非常に高い分解能データを生成可能であり、及びまた本発明と共に使用するのが好ましい。
【0051】
ソフトウェア
本発明の好適な実施形態において、質量スペクトルの翻訳方法は、本発明の方法をコンピュータが自動で実行可能にするためにコンピュータ可読媒体に対するコンピュータプログラムの形態で提供される。
【0052】
同位体テンプレートマッチングソフトウェアの並列化
上記に考察するように、本発明の方法は、コンピュータ可読媒体に対してプログラムとして導入可能であり、コンピュータの演算処理装置により実行される。単一プロセッサコンピュータ上で実行するそのようなアルゴリズムは導入されている。この種のソフトウェアにおけるアルゴリズムの導入は、完全に機能的であり、数千の独立したTOFスペクトルを作成するペプチド試料の一般的な液体クロマトグラフィー分析を処理するのには比較的遅い(約1分/スペクトルを要する)。従って、分析時間が質量分析システムの処理能力における制限要因ではなくするためには、分析速度を向上する手段を有するのが望ましい。テンプレートマッチング法は、同一の分子の多くの荷電状態が1つのスペクトルに存在するにもかかわらず、各イオン種を独立の実体として扱う。これはアルゴリズムが処理すべきスペクトルの異なる部分を対象としていくつかの演算処理装置が並行して、アルゴリズムを処理することが、容易に可能であることを意味する。同様に、異なるスペクトルは、各プロセッサに分配可能である。1つの実施形態において、ソフトウェアは、ネットワーク、例えば、イーサネット(R)スイッチ上でいくつかの異なるコンピュータ「ノード」を一般的に含むLINUXクラスタ上にロードされるフロントエンドと呼ばれる特別なノードコンピュータ(時々、「ノード」は「スレーブ」と、「フロントエンド」は「マスター」と称される)に接続される。フロントエンドは、一般的に、フロントエンドコンピュータに接続されたキーボード、モニター、及びマウスを含み、人間をクラスタと連動可能にする。従って、クラスタは、フロントエンドを介して制御される。フロントエンドコンピュータの役割は、各質量スペクトルを分割し、質量電荷比の小さな範囲を含むサブスペクトルへと処理することである。各サブスペクトルは、ネットワーク接続上で本発明のソフトウェアをデータに適用する様々なコンピュータに送られる。一旦、各コンピュータがアルゴリズムの実行を完了すると、結果はネットワーク上のマスターコンピュータに戻り、テンプレートマッチングソフトウェアの基準を満たす全イオンが質量スペクトル全体上で同定される単一スペクトルに再構築される。そして、マスターコンピュータは、全再構築スペクトルに対して実行しなければならない荷電状態のデコンボリューションなどの追加的な処理を実行する。
【0053】
LINUXクラスタ等のUNIX(R)ベースの並行処理システムに対して、並列化は容易な方法で達成可能である:本発明のソフトウェアのコピーを質量スペクトル処理のためにクラスタの各ノードにインストールする。フロントエンドコンピュータに追加プログラムをインストールする。この追加プログラムが質量スペクトルをサブスペクトルに分割し、サブスペクトルをノードに分配し、ノードに指示を与えて質量スペクトル処理ソフトウェアを実行し、及びノードに指示を与えてフロントエンドにデータを戻す。第1工程の実行後、フロントエンドに対するプログラムは、データが戻るのを待ち、そして、戻ったデータを単一スペクトルに合成する。
【0054】
本発明のこの態様の他の実施形態において、イオン検出用ソフトウェアは、市販されているParallel Virtual Machineソフトウェアパッケージに対して支援するC等の言語でコード化可能である(後掲の参照文献20参照)。このソフトウェアパッケージは、本来は、Oak Ridge National Laboratory(テネシー、アメリカ合衆国)で開発され、ネットワーク上でリンクするUnix(R)及び/又はWindows(R)コンピュータの異機種の集まりを単一の大きな並列コンピュータとして使用可能にする。
【0055】
本発明の方法の用途
ペプチドは特徴的な同位体存在比を有するが、しばしば特別な特徴を同定可能にするためにペプチドの同位体存在比を変更する価値がある。ICAT法(後掲の参照文献5参照)は、例えば、混合物の各タンパク質から小さい特定のペプチド試料を得る方法として生体物質からシステイン含有ペプチドを単離する。ICAT法は、複合ペプチド混合物を特徴づけるためにシステイン含有ペプチドの分析の有用性を実証する。もう1つのシステイン含有ペプチドの同定方法は、特徴的な同位体分布をペプチドに与えるラベルでシステインをタグ付けすることである。多くのラベル、及びタグ付け方法がこの目的のために開発されてきた(後掲の参照文献13、及び21〜23参照)。これら全ての論文に記載の方法は、MSデータの手動翻訳が必要とされたようである。本発明の方法は、第4の態様でそのような同位体タグ付種の質量スペクトル翻訳に対して自動化方法を提示する可能性がある。従って、本発明の第4の態様の実施形態において、下記工程を含むシステイン含有ペプチドの同定方法を提供する。
1. 特徴的な同位体分布を伴うシステイン反応性タグでペプチド混合物をタグ付けする。例えば、ジクロロベンジルヨードアセトアミド(dichlorobenzyliodoacetamide)(後掲の参照文献21参照)。
2. 分析される生体のデータベース由来のシステイン含有ペプチドに対するテンプレートを算出する。該テンプレートは荷電状態、質量範囲、及びペプチドに存在するタグの数の各予想組合せに対して存在する。
3. 標識ペプチドイオンを含む質量スペクトルにタグ、質量、及び電荷依存同位体分布テンプレートを連続的に適用し、質量スペクトルの各イオンに対してタグの最高予想数、及び荷電状態に対するテンプレートで始めて、同位体テンプレートを適合する質量スペクトル領域を探す。
4. 事前同定を確認するためのテンプレートマッチング法により同定されたペプチドイオンに対して予想同位体分布を適合することで、ペプチドの荷電状態、及びペプチドで反応させたタグの数を同定する。
【0056】
同様に、タンパク質におけるアミノ基の標識が可能になり、リジンのε−アミノ基及び/又はペプチドN−末端のα−アミノ基のどちらも標識される。国際公開第02/099436号パンフレット及び国際公開第02/099124号パンフレットは、ピリジル、プロペニル、スルホン等のε−アミノ基の選択的に標識するタグを開示している。試薬は、硫黄原子を含み、特徴的な同位体存在比分布を標識ペプチドに与えている。更に、英国特許出願第0306756.8号はペプチドにおけるα−アミノ基及びε−アミノ基を同時に標識するために使用可能であり、また、標識ペプチドに特徴的な同位体存在比分布も与えるアミン反応性タグを開示している。従って、本発明の第4の態様による更なる実施形態は、下記工程を含むアミノ基を標識してペプチドを同定する方法を提供する。
1. 例えば、ピリジル、プロペニル、スルホン等の特徴的な同位体分布を伴うアミノ反応性タグでペプチド混合物をタグ付けする。
2. 分析される生体のデータベース由来の標識アミノ基を含むペプチドに対するテンプレートを算出する。該テンプレートは荷電状態、質量範囲、及びペプチドに存在するタグの数の各予想組合せに対して存在する。
3. 標識ペプチドイオンを含む質量スペクトルにタグ、質量、及び電荷依存同位体分布テンプレートを連続的に適用し、質量スペクトルの各イオンに対してタグの最高予想数、及び荷電状態に対するテンプレートで始めて、同位体テンプレートを適合する質量スペクトル領域を探す。
4. 事前同定を確認するためのテンプレートマッチング法により同定されたペプチドイオンに対して予想同位体分布を適合することで、ペプチドの荷電状態、及びペプチドで反応させたタグの数を同定する。
【図面の簡単な説明】
【0057】
本発明は、次の図を参照してより詳細に検討される。
【図1】図1は、質量分析装置データの分析のために本発明により提供される分析方法に使用する工程の概要を説明するフローチャートを示す。
【図2】図2は、本発明の方法による分析のためのスペクトルを準備するために使用する一般的な一連の前処理工程を図示し、スペクトルSはピークのm/z比が既知でありm/z=x、及び強度y等を有するピークからなることを意味する。
【図3】図3は、荷電状態を徐々に低下させる方法の繰り返しを示す質量スペクトルに対して本発明の同位体テンプレートを適用して使用する工程の概要を説明するフローチャートを示す。
【図4】図4は、全てのイオンが同じ荷電状態(好ましくは+1)で存在すると仮定するならば、本発明の処理方法により得た多荷電状態データを得られたスペクトルに相当するデータに変換する方法を示し、よって、モノアイソトピックイオンピークのヒットリストにおけるイオンリストの荷電状態を、既知の質量電荷比、及び既知の荷電状態でデコンボリューションするために使用する工程の概要を説明するフローチャートを示す。
【図5a】図5aは、荷電状態が+1と適度な質量のペプチドに対する理論的なペプチド同位体分布比を示す。
【図5b】図5bは、飛行時間型質量分析計におけるイオン到達時間のガウス模型を使用して導き出した多くの様々な荷電状態での3つの異なる質量のペプチド同位体存在比分布の平均予想をいくつか示す。
【図6a】図6aは、ペプチドの質量で異なるペプチド同位体ピークの強度比がどのように変わるかを示す。
【図6b】図6bは、発明を実施するための最良の形態に示す高速テンプレート適合処理の概念を示す。
【0058】
(参照文献)
(1)Mann, M.; Wilm, M. Anal Chem 1994, 66, 4390-4399.
(2)Washburn, M. P.; Wolters, D.; Yates, J. R. Nat Biotechnol 2001, 19, 242-247.
(3)Washburn, M. P.; Ulaszek, R.; Deciu, C.; Schieltz, D. M.; Yates, J. R., 3rd Anal Chem 2002, 74, 1650-1657.
(4)Gaskell, S. Journal of Mass Spectrometry 1997, 32, 677-688.
(5)Gygi, S. P.; Rist, B.; Gerber, S. A.; Turecek, F.; Gelb, M. H.; Aebersold, R. Nat Biotechnol 1999, 17, 994-999.
(6)Karas, M.; Hillenkamp, F. Anal Chem 1988, 60, 2299-2301.
(7)Hillenkamp, F.; Karas, M. Methods Enzymol 1990, 193, 280-295.
(8)Hillenkamp, F.; Karas, M.; Beavis, R. C.; Chait, B. T. Anal Chem 1991, 63, 1193A-1203A.
(9)Pappin, D. J. C.; Hoejrup, P.; A.J., B. Curr Biol 1993, 3, 372-332.
(10)Mann, M.; Hojrup, P.; Roepstorff, P. Biol Mass Spectrom 1993, 22, 338-345.
(11)Yates, J. R., 3rd; Speicher, S.; Griffin, P. R.; Hunkapiller, T. Anal Biochem 1993, 214, 397-408.
(12)Karas, M.; Gluckmann, M.; Schafer, J. J Mass Spectrom 2000, 35, 1-12.
(13)Sechi, S.; Chait, B. T. Anal Chem 1998, 70, 5150-5158.
(14)Gay, S.; Binz, P. A.; Hochstrasser, D. F.; Appel, R. D. Electrophoresis 1999, 20, 3527-3534.
(15)Bairoch, A.; Apweiler, R. Nucleic Acids Res 2000, 28, 45-48.
(16)Gasteiger, E.; Jung, E.; Bairoch, A. Curr Issues Mol Biol 2001, 3, 47-55.
(17)Barker, W. C.; Garavelli, J. S.; Huang, H.; McGarvey, P. B.; Orcutt, B.C.; Srinivasarao, G. Y.; Xiao, C.; Yeh, L. S.; Ledley, R. S.; Janda, J. F.; Pfeiffer, F.; Mewes, H. W.; Tsugita, A.; Wu, C. Nucleic Acids Res 2000, 28, 41-44.
(18)Barker, W. C.; Garavelli, J. S.; Hou, Z.; Huang, H.; Ledley, R. S.; McGarvey, P. B.; Mewes, H. W.; Orcutt, B. C.; Pfeiffer, F.; Tsugita, A.; Vinayaka, C. R.; Xiao, C.; Yeh, L. S.; Wu, C. Nucleic Acids Res 2001, 29, 29-32.
(19)Smith, S. W. The Scientist and Engineer's Guide to Digital Signal Processing: California Technical Publishing, 1997.
(20)Geist, A.; Beguelin, A.; Dongarra, J.; Jiang, W.; Manchek, R.; Sunderam, V. PVM: Parallel Virtual Machine A Users' Guide and Tutorial for Networked Parallel Computing; MIT Press, 1994.
(21)Goodlett, D. R.; Bruce, J. E.; Anderson, G. A.; Rist, B.; Pasa-Tolic, L.; Fiehn, O.; Smith, R. D.; Aebersold, R. Anal Chem 2000, 72, 1112-1118.
(22)Sechi, S. Rapid Commun Mass Spectrom 2002, 16, 1416-1424.
(23)Adamczyk, M.; Gebler, J. C.; Wu, J. Rapid Commun Mass Spectrom 1999, 13, 1813-1817.

【特許請求の範囲】
【請求項1】
試料から作成される質量スペクトルデータを処理する方法であって、
(a) 質量スペクトルの第1ピークを選択する、
(b) 前記第1ピークを生じることが可能な第1荷電状態を有する第1モノアイソトピック参照イオンを選択する、
(c) 前記第1参照イオンの1つ以上の他の同位体形態に対して前記質量スペクトル中で1つ以上の更なる予想ピークを決定する、
(d) 前記1つ以上の決定された更なる予想ピークに合致する1つ以上のピークが前記質量スペクトル中に存在するかどうかを決定するために、前記1つ以上の決定された更なる予想ピークを前記質量スペクトルと比較する、
(e) 前記1つ以上の決定された更なる予想ピークが前記質量スペクトル中の1つ以上のピークと合致すれば、前記第1ピークをデータピークとして指定し、及び任意で前記質量スペクトルに存在する前記1つ以上の決定された更なる予想ピークに合致する1つ以上のピークをデータピークとして指定する、
(f) 前記決定された更なる予想ピークが前記質量スペクトル中のピークに合致しなければ、1つ以上の更なる参照イオンを1つ以上の更なる荷電状態で、前記工程(b)から前記工程(e)を繰り返す、
(g) 任意で、前記第1荷電状態にある参照イオンあるいは更なる荷電状態にある更なる参照イオンについて、前記第1ピークがデータピークとして指定可能でなければ、前記第1ピークを非データピークとして指定する、
(h) 任意で、前記質量スペクトル中の1つ以上の更なるピークのために前記工程(a)から前記工程(g)を繰り返す、
工程を含むことを特徴とする試料から作成される質量スペクトルデータを処理する方法。
【請求項2】
前記第1荷電状態は、質量スペクトルが作成される質量分析計型で分離可能な、通常の最も高い荷電状態である請求項1に記載の質量スペクトルデータを処理する方法。
【請求項3】
前記工程(f)において、質量スペクトルが作成される前記質量分析計型で分離可能な最低荷電状態に達するまで、次に低い荷電状態に対して各々繰り返し実行される請求項2に記載の方法。
【請求項4】
前記荷電状態が正、又は負である請求項2又は3に記載の方法。
【請求項5】
質量スペクトル中で1つ以上の指定されたデータピークは、ガウス関数、ローレンツ関数、及び/又はフォークト関数を使用してモデル化される請求項1から4のいずれかに記載の方法。
【請求項6】
1つ以上のピークの質量電荷比の精度をあげるために、1つ以上のモデル化したピークの質量中心を決定することを更に含む請求項5に記載の方法。
【請求項7】
前記工程(b)において前記第1ピークに寄与可能な複数の参照イオンが選択され、前記工程(c)において前記複数の参照イオンのそれぞれの他の同位体形態に対して、前記複数の参照イオンのそれぞれに対して前記質量スペクトル中の1つ以上の更なる予想ピークが決定される請求項1から6のいずれかに記載の方法。
【請求項8】
前記複数の参照イオンのそれぞれの相対存在比に基づいて、前記複数の参照イオンのそれぞれに対する更なる予想ピークの強度が平均化される請求項7に記載の方法。
【請求項9】
参照イオンについての予想同位体存在比分布を決定するために原子組成を使用して、前記参照イオンに対する前記質量スペクトル中の更なる予想ピークが決定される請求項1から8のいずれかに記載の方法。
【請求項10】
質量スペクトル中で更なる予想ピークは、参照イオンに対して事前算出されたテンプレートを使用して前記参照イオンに対して決定される請求項1から9のいずれかに記載の方法。
【請求項11】
前記方法は、1つ以上の参照イオンの各同位体に対するデータピークを前記参照イオンに対する単一モノアイソトピックイオンの代表ピークに還元させることを更に含む請求項1から10のいずれかに記載の方法。
【請求項12】
各参照イオンに対して、単一モノアイソトピックイオンの代表ピークの強度は、各個別の同位体の対応するピーク強度の合計として算出される請求項13に記載の方法。
【請求項13】
1つ以上の参照イオンに対して複数の荷電状態が前記スペクトルに存在すれば、前記方法は各参照イオンに対するデータピークを単一荷電状態の代表ピークに還元することを更に含む請求項1から12のいずれかに記載の方法。
【請求項14】
各参照イオンに対して、前記単一荷電状態の代表ピークの強度は、各個別の荷電状態から対応するピーク強度の合計として算出される請求項11に記載の方法。
【請求項15】
前記質量スペクトルは、エレクトロスプレーイオン化、又はMALDIを使用して作成される請求項1から14のいずれかに記載の方法。
【請求項16】
前記試料は、タンパク質、ポリペプチド、ペプチド、及び/又はアミノ酸を含む請求項1から15のいずれかに記載の方法。
【請求項17】
前記試料は、クロマトグラフ分離技術を使用して生成される請求項1から16のいずれかに記載の方法。
【請求項18】
前記決定された更なるピークはコンピュータプログラムを使用して算出される請求項1から17のいずれかに記載の方法。
【請求項19】
算出された更なるピークの前記質量スペクトルとのマッチングは、コンピュータプログラムを使用して行われる請求項1から18のいずれかに記載の方法。
【請求項20】
試料から作成される質量スペクトルの翻訳方法であって、
(a) 請求項1から19のいずれかに記載の方法により質量スペクトルデータを処理する、
(b) データピークだけに基づいてスペクトルを翻訳する、
ことを特徴とする試料から作成される質量スペクトルの翻訳方法。
【請求項21】
質量スペクトル翻訳方法を含むMudPIT法を実施する請求項20に記載の方法。
【請求項22】
質量スペクトル翻訳方法を含むICAT法を実施する請求項20に記載の方法。
【請求項23】
質量スペクトルデータを処理するためのコンピュータプログラムであって、コンピュータプログラムは、
(a) 質量スペクトルの第1ピークを生じることが可能な第1荷電状態を有する第1モノアイソトピック参照イオンを選択する、
(b) 前記第1参照イオンの1つ以上の他の同位体形態に対して前記質量スペクトル中で1つ以上の更なる予想ピークを決定する、
(c) 前記1つ以上の決定された更なる予想ピークに合致する1つ以上のピークが前記質量スペクトル中に存在するかどうかを決定するために、前記1つ以上の決定された更なる予想ピークを前記質量スペクトルと比較する、
(d) 前記1つ以上の決定された更なる予想ピークが前記質量スペクトル中の1つ以上のピークと合致すれば、前記第1ピークをデータピークとして指定し、及び任意で前記質量スペクトルに存在する前記1つ以上の決定された更なる予想ピークに合致する1つ以上のピークをデータピークとして指定する、
工程を行うように操作されることを特徴とする質量スペクトルデータを処理するためのコンピュータプログラム。
【請求項24】
更なる工程、
(e) 前記決定された更なる予想ピークが前記質量スペクトル中のピークに合致しなければ、1つ以上の更なる参照イオンを1つ以上の更なる荷電状態で、前記工程(a)から前記工程(d)を繰り返す、
(f) 任意で、前記第1荷電状態にある参照イオンあるいは更なる荷電状態にある更なる参照イオンについて、前記第1ピークがデータピークとして指定可能でなければ、前記第1ピークを非データピークとして指定する、
(g) 任意で、前記質量スペクトル中の1つ以上の更なるピークのために前記工程(a)から前記工程(f)を繰り返す、
工程を行うように操作される請求項23に記載のコンピュータプログラム。
【請求項25】
1つ以上の前記第1参照イオンの他の同位体形態に対して、情報データベースを使用して前記質量スペクトル中で1つ以上の更なる予想ピークを決定し、該情報は複数の荷電状態における複数のイオンに対する質量電荷比を含む工程を行うように手配される請求項23又は24に記載のコンピュータプログラム。
【請求項26】
プログラムは複数のコンピュータに並行して実行するように手配される請求項23から25のいずれかに記載のコンピュータプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図5】
image rotate

【図6】
image rotate

【図6】
image rotate

【図6】
image rotate

【図6】
image rotate

【図6】
image rotate


【公表番号】特表2007−503001(P2007−503001A)
【公表日】平成19年2月15日(2007.2.15)
【国際特許分類】
【出願番号】特願2006−530493(P2006−530493)
【出願日】平成16年5月13日(2004.5.13)
【国際出願番号】PCT/GB2004/002059
【国際公開番号】WO2004/102180
【国際公開日】平成16年11月25日(2004.11.25)
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.Linux
【出願人】(505423678)エレクトロフォレティクス リミテッド (7)
【Fターム(参考)】