説明

質量スペクトルデータの解析

生のスペクトルデータを処理するによって、較正された連続スペクトルデータを得ること(210);較正されたライブラリーデータを形成するために処理されているライブラリースペクトルデータを得ること(240);及び生のスペクトルデータを生成した試料中の成分の濃度を測定するために(280)、較正された連続スペクトルデータと較正されたライブラリーデータの間で、好ましくは、マトリックス操作を用いて最少二乗フィッティングを実施すること(270)(式1);を含む、質量分析計からのデータを解析する方法。その方法に従って操作する質量分析計システム、変換された質量スペクトルのデータライブラリー、及びそのデータライブラリーを生成させるための方法。

【発明の詳細な説明】
【技術分野】
【0001】
本出願は、2006年5月26日に出願された米国仮出願番号60/809,135からの優先権を主張し、その全文は本明細書に参照により組み込まれる。
【0002】
関連特許出願/特許の相互参照
下記の文書の全ての内容は、その全文が本明細書に参照により組み込まれる。
米国特許第6,983,213号;2004年4月28日に出願された国際特許出願PCT/US2004/013096;2005年10月28日に出願された米国特許出願番号11/261,440;2005年10月28日に出願された国際特許出願PCT/US2005/039186;及び2006年4月11日に出願された国際特許出願PCT/US2006/013723。
【0003】
本発明は、質量分析法システムに関する。より詳しくは、本発明は、蛋白質又はペプチドのような大きな有機分子、環境汚染物質、医薬品及びそれらの代謝物、及び石油化学化合物を含む分子の複雑な混合物の解析のために有用な質量分析法システム、そこで使用される解析の方法、及びコンピュータ又はコンピュータと質量分析計の組合せにそのような解析を働きかけるために、そこで具現化されたコンピュータコードを有するコンピュータプログラム製品に関する。
【背景技術】
【0004】
タンデム質量分析法と接続した液体クロマトグラフィー(LC/MS/MS)は、蛋白質の配列決定のために選ばれる方法となってきている(Yates Jr. et al., Anal.Chem.67,
1426-1436(1995))。この方法は、蛋白質の消化、蛋白質の消化から生じるペプチド混合物のLC分離、得られたペプチドのMS/MS解析、及び蛋白質同定のためのデータベース探索を含む2,3のプロセスを含む。LC/MS/MSを用いて効果的に蛋白質を同定するための鍵は、データベース探索中に信頼できるマッチングを可能とするため、できるだけ多くの高品質MS/MSスペクトルを生成させることである。これは、四重極又はイオントラップ機器におけるデータ依存型走査技術によって達せられる。この技術を用いて、質量分析計が、フル走査MSスペクトルにおける最も豊富なイオン(類)の強度とシグナル/ノイズ比をチェックし、そして最も豊富なイオンの強度とシグナル/ノイズ比が事前に設定した又は事前に定められた閾値を超えるときに、MS/MS実験を実行する。MS/MS実験のために3個より多くのイオンを選択すると、現にLCから質量分析計に溶出している他の適正なペプチドを、ことによると見逃す結果となるため、通常、配列情報を最大化し、所要時間を最小化するために、生成イオンの走査に対して3つの最も豊富なイオンが選ばれる。
【0005】
蛋白質の同定に対するLC/MS/MSの成功は、大きくはその多くの顕著な解析的特性が背景となっている。第一に、それが優れた再現性を有する非常に頑健な技術である点である。それは蛋白質の同定のためのハイスループットLC/MS/MSにとって信頼性があることが示されている。第二に、ナノスプレーイオン化を用いる場合、この技術がサブフェムトモルレベルでペプチドの高品質MS/MSスペクトルを提供する点である。第三に、MS/MSスペクトルがC−末端及びN−末端の両方の配列情報を保持する点である。この価値ある情報は、蛋白質の同定のためのみならず、蛋白質に翻訳後の修飾(PTM)が生じているか、どのアミノ酸残基上でそのPTMが生じているかを特定するためにも使用できる。
【0006】
マトリックス支援レーザー脱離イオン化(MALDI)は、電導性試料板上でマトリックス化合物と共結晶化した標的試料を照射するために集束レーザービームを利用する。イオン化された分子は、パルス技術としてのそれらの共有特性故に、通常、飛行時間型(TOF)質量分析計によって検出される。
【0007】
MALDI/TOFは、その優れた速度、高い感度、広い質量範囲、高い分解能、及び夾雑物許容性故に、2DEにより分離された無傷の蛋白質を検出するために一般的に使用される。遅延引き出し及び反射イオン光学系の能力を有するMALDI/TOFは、ペプチドの精密な解析に対して、1から10ppmの卓越した質量精度、及び10000から15000のm/Δmでの質量分解能を達成することができる。しかしながら、MALDI/TOFにおいてはMS/MS能力の不足が、プロテオミクス用途におけるその使用の主要な制約の一つになっている。MALDI/TOFにおけるポストソース分解(PSD)は、ペプチドについての配列様のMS/MS情報を生成するにはするが、PSDの操作はしばしばトリプル四重極又はイオントラップ質量分析計のようには頑健でない。更に、PSDデータの取得及び解析は、フラグメント化がペプチド又は配列依存型でさえあり得るため、自動化が時々困難である。
【0008】
新しく開発されたMALDI TOF/TOFシステム(T. Rejtar et al., J. Proteomr. Res. 1(2)171-179(2002))は多くの魅力的な特徴を与えてくれる。このシステムは二つのTOF及び一つの衝突セルから成り、タンデム四重極システムの構成に類似している。第一のTOFは、セル内で衝突誘起解離(CID)を行ってフラグメントイオンを発生する前駆イオンを選択するために使用される。次いで、これらのフラグメントイオンが第二のTOFによって検出される。魅力的な特徴の一つは、TOF/TOFが必要なだけ多くのデータ依存型MS/MS実験を実行できる点であり、これに対して典型的なLC/MS/MSシステムは、実験の2,3の豊富なイオンのみを選択する。このユニークな開発によって、TOF/TOFが工業的規模でプロテオーム解析を実行することが可能となる。この提案された解決策は、2DLC実験からのフラクションを集めてそのフラクションをMS/MS用MALDI板の上にスポットすることである。その結果、TOF/TOFにおける高エネルギーCIDによって生成されたMS/MSスペクトルの品質がPSDスペクトルよりもはるかに良好である故に、データベース探索によるより信頼性がある蛋白質同定のため、より多くのMS/MSスペクトルが取得可能となる。
【0009】
フーリエ変換イオン−サイクロトロン共鳴MS(FTICR−MS又はより一般的にはFTMS)が、高い感度、高い質量分解能、広い質量範囲、及び高い質量精度を供することができる強力な技術であることはよく認識されている。最近、LCと組合せたFTICR−MSが、精密質量タグ(AMT)を通して、プロテオーム解析に対する目覚しい能力を示した(Smith, R. D et al.; Proteomics. 2, 513-523, (2002))。AMTは、蛋白質を専ら同定するのに使用することができる位のペプチドの精密なm/z値である。AMT法を用いて、単独のLC/FTICR−MS解析が、1ppmより良好な質量精度で105より多くの蛋白質を潜在的に同定できることが示されている。それにも拘わらず、ATM単独では、アミノ酸残基をペプチドの特定の翻訳後の修飾に特定するには十分でないかもしれない。また、本機器は、高いメンテナンス要求を伴ない、一般的なコストが65万ドル又はそれ以上と、非常に高価である。
【0010】
このように、過去100年、高処理能力、高分解能、及び高感度作業用に設計され構築された、多くの異なるタイプの機器でMS計装にもたらされた驚異的な進歩を目の当たりに見てきた。この計装は、異なる同位体に由来するイオンフラグメントの観察を可能とするユニットマス分解能を有する大部分の市販のMSシステム上で、単独のイオン検出がルーチン的に遂行できる段階にまで発展している。ハードウエアにおける高度化とは著しく対照的に、最新のMS計装によって生成される大量のMSデータを体系的にそして効果的に解析することはほとんど為されてこなかった。
【0011】
典型的な質量分析計において、ユーザーには通常、関心のある物質の質量スペクトルm/z範囲をカバーする幾つかの既知のイオンを有する標準物質が供給される。ベースライン効果、同位体干渉、質量分解能、及び分解能のm/z依存性に従って、これらの標準イオンのピーク位置が、ピークトップでの低次多項式フィット法を通して、質量中心(centroid)又はピーク最大のいずれかに関して測定される。次いで、これらのピーク位置を、一次又はその他のより高次の多項式フィット法を通して、既知のピーク位置にフィットさせ、質量(m/z)軸を較正する。
【0012】
質量軸較正後、次いで、典型的な質量スペクトルデータトレースをピーク解析にかけ、そこでピーク(イオン)を同定する。このピーク検出ルーチンは非常に経験的で複合化プロセスであり、ここでピークの肩、データトレースにおけるノイズ、化学的背景又は不純物混入に起因するベースライン、同位体ピーク干渉等が考慮される。
【0013】
同定されたピークに対して、積分されたピーク面積及びピーク位置の計算を試みるために、セントロイド処置と呼ばれるプロセスが一般的に適用される。上に概略述べた多くの干渉因子、及び他のピーク及び/又はベースライン存在下でピーク面積を測定する際の本質的な困難性に起因して、これは、セントロイド処理品質の客観的尺度のない同位体ピークの出現又は消失を作りかねない多くの調整パラメーターによって悩まされるプロセスである。
【0014】
このように、現在のアプローチには幾つかの著しい不利な点が存在する。それらには以下の点が含まれる:
【0015】
質量精度の欠如。現在使用されている質量較正は、従来のユニットマス分解能(有意性がある同位体ピークの存在又は非存在を可視化する能力)を有するMSシステムに対して、通常、0.1amu(m/z単位)よりもよい質量測定精度を提供しない。より高い質量精度を達成し、そして蛋白質同定のためのペプチドマッピングなどの分子フィンガープリント法において不明確さを低減するためには、極めて高いコストがかかる四重極TOF(qTOF)又はFTMSのような、より高い分解能を有するMSシステムに切替えることが必要である。
【0016】
大きなピーク積分誤差。質量スペクトルピーク形状、その変動性、同位体ピーク、ベースライン及び他のバックグラウンドのシグナル、並びにランダムノイズの寄与に起因して、現在のピーク面積積分は、強い又は弱い質量スペクトルピークのいずれかについて、大きな誤差(系統誤差及び偶然誤差の両方)を有する。
【0017】
同位体ピークに伴う困難性。現在のアプローチには、ユニットマス分解能を有する従来のMSシステムに関して、通常、部分的に重なる質量スペクトルピークを有する種々の同位体からの寄与を切り離すためのよい方法を提供することはない。使用された経験的アプローチは、隣接する同位体ピークからの寄与を無視するか、又はそれらを過剰評価する結果、支配的な同位体ピークに関して誤差をもたらし、そして弱い同位体ピークに関して大きなバイアスをもたらすか、又は弱い同位体ピークを完全に無視にさえつながった。多くの電荷を有するイオンが関係する場合、隣接する同位体ピーク間の質量単位におけるまさにその切り離しの低下に起因して、事態は更に悪化する。
【0018】
非線形操作。現在のアプローチは、各段階中多くの経験的に調節可能なパラメーターを有する多段階に分断されたプロセスを使用する。各段階で系統誤差(バイアス)が発生し、制御不良で予測不可能なそして非線形状態で、後の段階へそれが伝播するため、アルゴリズムがデータ処理の品質及び信頼性の指標として意味ある統計量を報告することができなくなる。
【0019】
支配的な系統誤差。工業的プロセス制御及び環境モニタリングから蛋白質同定又はバイオマーカーの発見の範囲の、ほとんどのMSの用途において、機器の感度又は検出限界が常に焦点となってきており、多くの機器システムにおいて測定誤差又は信号におけるノイズの寄与を最小化するために多大な努力が払われてきた。残念ながら、現在使用されているピーク処理のアプローチは、生データにおけるランダムノイズよりも大きくさえある系統誤差の源を作り出すため、従ってそれらが機器の感度又は信頼性における限界要因となっている。
【0020】
数学的及び統計的矛盾。現在使用される多くの経験的アプローチは、質量スペクトルピークの処理全体を、数学的又は統計的に矛盾したものにしている。このピーク処理の結果は、ランダムノイズが全く無くごくわずかに異なるデータ、又はごくわずかに異なるノイズを有する同じ合成データに関して、劇的に変わり得る。言い換えれば、ピーク処理の結果は頑健ではなく、特定の実験又はデータ収集に依存して不安定になり得る。
【0021】
機器間ばらつき。機械的、電磁気的、又は環境的許容誤差における変動故に、異なるMS機器類から得られた生の質量スペクトルデータを直接比較することは通常、困難であった。生データに適用されているその場限りのピーク処理は、異なるMS機器類からの結果を定量的に比較する困難性を付加するのみである。他方、不純物検出又は確立されたMSライブラリーにおける探索を通した蛋白質同定の目的で、生の質量スペクトルデータを直接比較すること、又は異なる機器又は異なるタイプの機器からのピーク処理結果を比較することのニーズがしだいに増大している。
【0022】
ほとんどすべての質量分析法の用途において、イオン又はイオンフラグメントの同定の目的で、既知のデータベースから、又は理論的な同位体計算から別々に取得された既知の質量スペクトル質量中心データと比較されるのは、質量中心の質量スペクトルデータの形である。取得された質量中心データの一つの形が、先に取得された又は異なる機器で取得されたもう一つの形と比較される場合、質量測定及びピーク面積積分(セントロイド処理)に伴う上述の誤差が、実際の比較より前に二回現れる(各機器に対して一度)。この取得された質量中心データが理論的に計算された正確な質量中心と比較される場合でさえ、特に、ユニットマス分解能システムのようなより低い分解能の機器では、大きなセントロイド処理誤差を反映するために充分大きな許容値(例えば、公称質量窓(mass window)の範囲内の質量ビニング(binning)及び/又は脱アイソトープ(de-isotoping))を持って実際の比較を実行する必要がある。このより大きな許容値のせいで、疑いなく比較/探索の品質(信頼性レベル)が低下し、そして評価されねばならないより多くのヒット故に著しく計算が遅くなる(計算性能)。
【0023】
MS/MS、電子衝撃(EI)イオン化、エレクトロスプレーイオン化(ESI)、及びポストソース分解(PSD)の使用を伴うなどの質量分析法の多くの用途において、試料中のイオンは、多くのフラグメントイオン、又は異なる荷電状態を有する同じイオンが創出される、又は両者のため、一般的には複数のm/z(又は質量)位置で観察され得る。上述の低レベルで処理された質量中心データを用いる場合でさえ、複数のフラグメントからの追加情報があれば、探索中にヒット数を一般的に低減でき、一方、探索の信頼を増すことができる。こうして質量分析法の幾つかの重要な用途が可能とした。
【0024】
−実際のGC/MSデータ及びEIフラグメント化データベース、例えば、S. E. Stein, J. Am. Soc. Mass Spectrom. 1999, 10, 770によって述べられているような、National Institute of Standards and Technology(NST)から入手可能な広く使用されているライブラリーに基づく化合物の同定。
−米国特許第5,300,771号及び第6,118,120号に記載されているようなESIを用いた複数荷電デコンボリューションを通した天然の蛋白質の同定。
−例えば、米国特許第5,538,897号に記載されているSequestアルゴリズムを用いたMS/MSデータによる蛋白質又はペプチドデータベースの探索。
−例えば、A. L. Yergey, J. Am. Soc. Mass. Spectrom. 2002, 13, 784によって述べられているような、蛋白質又はペプチドデータベースを必要としない、蛋白質又はペプチドのアミノ酸配列を決定するためのMS/MSデータを用いた新しい蛋白質又はペプチド配列決定。
【0025】
残念ながら、より必要な同定情報が追加される一方、一般的に観察される種々のフラグメントイオンは、非常に変化する量を有し、いくつかのフラグメントは観察されないことさえある。フラグメントイオンのこの変化する量は、上述の及び現在広く使用される「最初にセントロイド処理しそして二番目に探索又は比較する」アプローチにいくつかの独特の課題をもたらす。このセントロイド処理は典型的には、それに伴う大きなピーク積分誤差を有し、それは実験的に変化する量によって更に複雑になる問題である。この結果、典型的には、例えば、米国特許第5,538,897号に記載されたような正規化のある形を通して、ピーク面積又は信号強度を無視するというアルゴリズムに導かれる。正規化は計算的には容易な解決を提供する一方、必然的に考慮中の特定のイオンフラグメントの尤度に関する価値ある情報の損失という結果をもたらす。もし、イオンカウンティングノイズが、イオン又はフラグメント検出における典型的な支配的ノイズ源であるとすれば、より高い強度又は信号レベルが、特定のイオンフラグメントの存在に関してより高い確率に直接変換することになる。事態を悪くすることには、全ての強度正規化スキームは、イオンとその複数のフラグメントの間の固有の統計的関係を破壊して、考慮中のイオンの存在又は非存在を統計的に評価することを(不可能にはしないとしても)困難にする。その結果、実際に、全ての統計的指標が取得された質量スペクトル自体から直接導かれる場合、数百又は数千の「典型的な」質量スペクトルについての探索アルゴリズムの「訓練」を通して発見的評価が使用される。
【0026】
このように、現在の質量分析計測が提供できることと、既存の質量スペクトル解析技術を用いて現在達成されつつあることとの間には著しいギャップが存在する。
【発明の概要】
【発明が解決しようとする課題】
【0027】
本発明の一つの目的は、質量分析法システム、及び本明細書に述べられた方法に従い、上述の不都合を克服する質量分析法システムの操作方法を提供することである。
【0028】
本発明のもう一つの目的は、本発明による方法を実施するための質量分析法システムを実行させるための、コンピュータが読み取り可能なプログラムコードをその上に有する記憶媒体を提供することである。
【0029】
本発明の更なる目的は、より情報に富む、そして現在のスティックスペクトルライブラリーよりももっと精密な質量分析法ライブラリーを提供することである。
【0030】
本発明のさらなる側面は、一般に、コンピュータを含むデータ解析部分を有する質量分析計システムと共に使用するためのコンピュータが読み取り可能なプログラムコードをその上に有する、コンピュータが読み取り可能なプログラム媒体であって、このコンピュータが読み取り可能なコードは、本明細書に述べられた方法を実行することによって、コンピュータにデータを解析させるためのものである。好ましくは、コンピュータ読み取り可能な媒体は、少なくとも一つの記述された特定の方法をコンピュータに実施させるための、コンピュータ読み取り可能なコードを更に含む。
【0031】
特に重要なものとして、本発明は一般的に、化学的組成を解析するための質量分析計システムにも関し、このシステムは質量分析計部及びデータ解析システムを含むものであり、このデータ解析システムは、一般的に本明細書に述べられた方法に従い生のスペクトルデータを処理することによって、較正された連続スペクトルデータ得ることによって操作される。このデータ解析部は、これらの方法の特定事項に従って操作されるように構成されてもよい。好ましくは、この質量分析計システムは、解析しようとする試料を調製するための試料調製部、及び解析しようとする試料の最初の分離を実行するための試料分離部を更に含む。この分離部分は、試料を種々の成分に分離するための、少なくとも一つの電気泳動装置、化学親和性チップ、又はクロマトグラフを含んでもよい。
【0032】
本発明の上述の側面およびその他の特徴を、添付図面と関連付けながら以下の記述において説明する:
【図面の簡単な説明】
【0033】
【図1】本発明による質量分析計のブロック図である。
【図2】図1のシステムによって使用される解析における工程のフローチャートである。
【発明を実施するための形態】
【0034】
図1を参照すると、上述の通り、本発明の特徴を組込んだ、蛋白質又はその他の分子を解析するために使用され得る解析システム10のブロック図が示されている。本発明は図に示された単一の実施態様を参照して述べられるが、本発明は実施態様の多くの代替形において具現化できると理解されるべきである。また、如何なる適切な種類の構成要素も使用可能である。
【0035】
解析システム10は、試料調製部12、質量分析計部14、デ−タ解析システム16、及びコンピュータシステム18を有する。試料調製部12は、関心対象の蛋白質又はペプチドを含有する試料をシステム10に導入するタイプの、Thermo Electron Corporation of Waltham, MA, USA.によって製造されたFinnegan LCQ Data XP Maxのような試料導入ユニット20を含んでもよい。この試料調製部12は、システム10によって解析しようとする蛋白質のような検体の予備的分離を実行するために使用される検体分離ユニット22を含んでもよい。検体分離ユニット22は、Hercules, CA のBio-Rad Laboratories, Inc. によって製造され、そして業界でよく知られたゲルベースの分離ユニットのようなクロマトグラフィーカラム、電気泳動分離ユニットの任意の一つのものであってもよい。一般に、このユニットに電圧を印加し、細管を通る移動速度、等電点焦点(Hannesh, S. M., Electrophoresis 21, 1202-1209 (2000))、のような一つ又はそれより多くの変数の関数として、又は質量(一次元分離)、又は等電点焦点によって及び質量によってなどの一つより多くのこれらの変数によって蛋白質を分離させる。後者の例は二次元電気泳動として公知である。
【0036】
質量分析計部14は従来の質量分析計であってもよく、そして入手できる如何なるものであってもよいが、好ましくはMALDI−TOF、四重極MS、イオントラップMS、qTOF、TOF/TOF又はFTMSの一つである。もし、それがMALDI又はエレクトロスプレーイオン化イオン源を有するならば、そのようなイオン源は質量分析計部14への試料導入用に供してもよい。一般に、質量分析計部14はイオン源24、イオン源24によって生じたイオンを質量/電荷比によって分離するための質量分析部26、質量分析部26からのイオンを検出するためのイオン検出部28、及び質量分析計14を効率的に操作するために十分な真空を維持するための真空システム30を含んでよい。もし質量分析計14がイオン移動度分光計である場合、一般的に、真空システムは必要なく、そして生じたデータは、質量スペクトルの代わりに一般的にはプラズマグラムと呼ばれる。
【0037】
デ−タ解析システム16はデータ取得部32を含み、それはイオン検出部28からの信号をデジタルデータに変換するための、一つ又は一連のアナログからデジタルへの変換機(図示されていない)を含んでよい。このデジタルデータはリアルタイムデータ処理部34に供給され、そこでデジタルデータが、合算及び/又は平均化のような操作を通して処理される。リアルタイムデータ処理部34からのデータのライブラリー探索、データ保存、及びデータ報告を含む追加処理を行うために、後処理部36が使用されてもよい。
【0038】
コンピュータシステム18は、下記のように試料調製部12、質量分析計14及びデ−タ解析システム16の制御を提供する。コンピュータシステム18は、データを適切な画面表示装置上に入力させ、実行された解析の結果を表示するために、従来のコンピュータモニター40を有してもよい。コンピュータシステム18は、例えば、Windows(登録商標)、又はUNIX(登録商標)操作システム、又はその他の任意の操作システムでも操作される、任意の適切なパーソナルコンピュータに基づいてよい。コンピュータシステム18は典型的には、下記のデータ解析を実行するための操作システム及びプログラムがその上に保存されるハードドライブ42を有する。CD又はフロッピディスクを受容れるためのドライブ44が、本発明に従ってコンピュータシステム18上にプログラムを搭載するために使用される。試料調製部12及び質量分析計14を制御するためのプログラムは典型的にはシステム10のこれらの部分に対するファームウエアとしてダウンロードされる。デ−タ解析システム16は、以下に論じられる処理工程を実行するために、C++,JAVA又はVisual Basicのような幾つかのプログラム言語の中の任意のもので書かれたプログラムであってもよい。
【0039】
所定の質量スペクトルに対して、以下の基本モデルが構築できる:
r=Kc+e 式1
ここで、rは、試料について測定されたプロファイルモードの質量スペクトルデータの、n、m/z値でデジタル化された、(n×1)マトリックス;cは、試料中のpイオン又はフラグメントの濃度を表す、回帰係数の(p×1)マトリックス;Kは、全て同じn、m/z点でrとして採取された、p成分に対するプロファイルモードの質量スペクトル応答で構成された(n×p)マトリックス;そしてeは、ランダムノイズ及びこのモデルからのいずれかの系統偏差から生じるフィッティング残余の(n×1)マトリックスである。
【0040】
マトリックスKの行中に配列された成分は、ピーク成分と呼ばれ、それらは、平坦なベースラインのための行1、又は傾いたベースラインに対する等差級数のような既知の機能性の如何なるベースラインも任意に含む。マトリックスK中の鍵となるピーク成分は、関心対象のあるイオン又はフラグメントに対する既知の質量スペクトル応答であり、それは実験的に測定されるか又は理論的に計算される。
【0041】
既知元素組成を用いて関心対象のイオン又はフラグメントが同定されているとき、マトリックスK内のピーク成分を、理論的同位体分布及び既知の質量スペクトルピーク形状関数の畳込みとして計算することが好ましい。この既知の質量スペクトルピーク形状関数は、質量スペクトルデータの部分から直接測定されてもよいし、デコンボリューションを通して実際の測定から数学的に計算されてもよいし、又はもし、広範囲の質量スペクトル較正が既に適用されておれば、目標ピーク形状関数によって与えられてもよく、全ては米国特許6,983,213号及び2004年10月20日に出願された国際特許出願PCT/US2004/034618において概略記載されているアプローチを用いる。
【0042】
関心対象のイオン又はフラグメントがまだ同定されていない場合(未知の元素組成を有する場合)、実際の測定されたプロファイルモードのMSデータを、Kにおけるピーク成分として使用してよい。この実際の測定されたプロファイルモードのMSデータは、例えば、好ましくはより高い分解能及び品質の異なった機器(又は機器類)で測定された、多くのイオン又はフラグメントの確立されたライブラリーからのものであり得る。これらのライブラリー質量スペクトルは、質量スペクトルのピーク形状関数に関して、rとKの間のできるだけ近い整合性を確保するためのピーク形状関数を含む、上述の広範囲質量スペクトル較正プロセスを用いた較正であることが好ましい。あるいは、S. E. Stein, J. Am. Soc. Mass Spectrom. 1999, 10, 770によって述べられているNISTからのEIライブラリーのようなライブラリーからのセントロイド処理データを、r中のスペクトルについてKに含まれるためのピーク成分を作出するピーク形状関数マッチングを用いて畳込みし得る。
【0043】
尚、Kにおけるピーク成分とrにおける試料測定の間でのベースラインの如何なる違いも、Kにも含まれるベースライン成分によって完全に補償されるので、r又はKにおける実際の測定された質量スペクトルデータに関して、如何なるベースライン補正も実行する必要はないことに留意すべきである。
【0044】
また、Kに含まれるピーク成分を、純粋なイオン又はフラグメントに対応させる必要もないことにも留意すべきである。それは、同位体標識蛋白質又はペプチドフラグメントがMS/MS実験に含まれる場合がそうであるように、2,3のイオン又はフラグメントの線形組合せであり得る。この場合、各イオン又はフラグメントについての同位体パターンは、同位体パターンをKにおける単独ピーク成分を形成するある濃度比で組合せる前に、計算ができ又は別々に測定ができる。
【0045】
場合によっては、rとKの間の如何なる相対的質量スペクトル誤差をも明らかにするために、ピーク成分の導関数(derivative)それに対応する一つ又はそれより多くの第一の導関数、幾つかのピーク成分の既知の線形組合せ、又は測定された質量スペクトルデータrが、ピーク成分マトリックスK中に追加されてよい。
【0046】
一旦、適切なピーク成分マトリックスが、如何なる既知の干渉イオン及びもし適用される場合は、標識同位体を含めて、マトリックスK中に配列されたら、回帰プロセスで、ある質量スペクトル応答rの濃度ベクトルcに対して上記モデルを解くことができる。
c=K+r 式2
ここで、K+はKの逆数の形であり、それは例えば、最小二重の解として以下の形をとり得る。
+=(KTK)-1T
この解はJohn Neter et al., Applied Linear Regression, 2nd Ed., Irwin, 1989, p.206によって述べられており、その全ての開示は本明細書に参照により組み込まれる。
【0047】
この濃度ベクトルcは、自動的に測定された如何なるベースライン寄与も含む全ての含有ピーク成分の濃度情報を含む。含まれた誘導体について、濃度ベクトルcにおける対応する係数は、ピーク成分マトリックス中に含まれるある成分についての相対的質量誤差情報を含む。
【0048】
質量スペクトル応答rにおけるノイズが典型的にはイオンショットノイズから由来する大部分の質量分析法用途について、各質量サンプリングポイントでの重みが、この質量スペクトルサンプリングポイントでのシグナル分散、つまりrにおける質量スペクトル強度、に逆比例することになる上記モデルにおいて、加重回帰を使用することは有利である。この点は、John Neter et al., Applied Linear Regression, 2ndEd., Irwin, 1989, p.418によって更に述べられており、その全ての開示は本明細書に参照により組み込まれる。
【0049】
定量的解析には重要な定量的情報を含む、式2から推定されるcに加えて、t−統計手段を通したKにおける各ピーク成分に対する統計的有意性レベルのような、同じ回帰解析を通して、質量スペクトルデータrから由来し得る、その他の同等に重要な定性的情報がある。
*=ci/si 式3
ここで、siは、濃度推定値ciにおける特定のピーク成分iについての標準偏差推定値であり、全ては、米国特許6,983,213号及び2004年10月20日に出願された国際特許出願PCT/US2004/034618において概略記載されているアプローチを使用する。
【0050】
このt−統計に関して、p−値は、予測される濃度が0であって存在しないイオンが、式3において又は式4において与えられるt値を有する、十分高い信号を発生し得る確率として定義され得る。
p[t(df)>t*] 式4
つまり、このイオン又はフラグメントに対する偽の正の確率である。式4において、t(df)は、ある自由度dfでの濃度推定値のt分布である。典型的には、式3におけるt−統計が高いほど、p−値がより小さくなり、このイオン又はフラグメントが存在する可能性が高くなる。これらのt−分布、p−値及び自由度dfは全てJohn Neter et al.,
Applied Linear Regression, 2nd Ed., Irwin, 1989, p.8, p.12及びp.7によって述べられており、その全ての開示は本明細書に参照により組み込まれる。
【0051】
イオン又はフラグメントの信号が非常に高くはない場合、特に、イオンの量が低レベルの場合、式4からのp−値が、あるイオン又はフラグメントの存在のもっともらしさに関して、十分な統計的信頼を与えるほどに十分小さくないことがある。幸いなことに、多くのMS用途に対して、EI、タンデムMS/MS実験、ポストソース分解(PSD)又はその他の分解のようなイオン源におけるイオンフラグメント化、又は水の脱離又はナトリウムアダクト形成のような質量分析器内部のイオン反応故に、同じイオンについて複数の記録が入手できる。蛋白質又はペプチドのような大きな生体分子のエレクトロスプレーイオン化(ESI)においては、同じイオンが、全て同じ実験において複数の荷電状態で荷電され得るため、種々のm/z値又は質量で、複数の観察できる信号が生じる。
【0052】
上記モデル、その解、及びその関連する統計値は容易に適合され得て、複数の観察できるイオン又はフラグメントを有する全体的質量スペクトル範囲を含む一方、それは、2004年4月28日に出願された国際特許出願PCT/US2004/013096において指摘されているように、種々のフラグメントの間で、変化するイオン化又はフラグメント化の効率に悩まされることになる。好ましいアプローチは、変化するイオン化/フラグメント化の効率の問題を効果的に回避し、そして各フラグメント又はイオンjについてのp−値pjに到達するために、フラグメント単位又はイオン単位ベースでの限られた質量スペクトル範囲において、式1から4の上記アプローチを適用することであろう。各p−値、pj、は、同じ出発イオンから得られる対応するj−番目のイオン又はフラグメントに対する偽の正の確率を表す。pjは、その測定におけるその量とノイズに依存して、イオン又はフラグメント毎に広く変化し得る一方、全体的な偽の正の統計値は、個別のpjに基づいて以下の式を通して確立され得る。
p=p1.p2…pJ 式5
ここで、Jは同じ出発イオンから観察されるイオン又はフラグメントの総数である。あるいは、ある出発イオンの存在についての確率は、1−pとして計算できる。
【0053】
複数のイオン又はフラグメントを通して出発イオンを測定する利益は今や直ぐに見ることができ、ここで個々のp−値の増加故に、全体のp−値又は偽の正の確率が劇的に減少される。加えて、蛋白質又はペプチドのタンデムMS/MS解析においてよく知られている如く、正確に同じ元素組成(及び正確に同じ質量)を有し、同じMS信号を有する非常に異なるアミノ酸配列を有するかもしれない多くのペプチドがあるため、それらを互いに区別することが不可能になる。例えば、3つのペプチド、TIYTPGSTVLYR,SKDVFLNSVFSK,及びQSDFTFGKVTIK、は全て同じ要素成分C631001519+を有し、完全に同じ質量1370.7320Daを有するため、高分解能のFTMSシステム上であってもそれらを区別することは不可能である。しかしながら、タンデムMS/MSモードにおいて解析すると、式5において非常に異なるpj値を有するこれらのペプチドから、非常に異なるフラグメントが生じるため、非常に異なる全体的p値が得られ、互いを明確に識別できる結果となる。
【0054】
現在使用されている又は提案されている他の代替法と比較すると、この方法は、著しい利点を有する、MS解析への新しいそして迅速なアプローチを表わす。
a.そのしっかりした数学的及び統計的な根拠故に、この方法は、現在の質量スペクトル処理及び蛋白質/ペプチドライブラリー探索における多くのその場しのぎの操作や非線形操作を排除するため、プロテオミクスへの一般的なMS解析の応用に対して、理論的に優雅なプロセスをもたらす。
b.この解析は、この単一のMS測定自体から誘導される全ての確率測度を用いる、ある関心対象のイオンに伴う複数のイオン又はフラグメントの単一の従来のMS測定に基づいて遂行できる。
c.このアプローチは、自動的に内臓されているノイズフィルタリング及びスペクトル平準化を用いて、複雑な、間違い易いそしてその場しのぎの質量スペクトルピーク検出プロセス全てをバイパスする。
d.データベース、又はセントロイド処理誤差を有しない実際の測定された質量スペクトルプロファイルからの全ての既知のそして有意性のある同位体を用いて作業することによって、解析又は探索において全ての同位体パターンが自動的に含まれた完全なデータ統合が保存される。
e.本発明における時間アプローチでの一つのイオン又はフラグメントは、変化するイオン又はフラグメントの量の問題を回避するのみならず、次いで、関心対象の出発イオンに対する全体的確率測度に組合せることができる個々の確率測度をもたらす。
f.その場しのぎのスコア化の替りに、試料中のその存在又は非存在を検定するために、そして、蛋白質/ペプチド同定又はデータベース探索を含む化合物の同定のための可能性のある候補をランク付けするのに使用するために、t−統計又はp−値のような統計的に厳密な信頼性レベルが、所与のイオンについて確立できる。
【0055】
このように、このアプローチは、複数のイオン又はフラグメントの使用を通した一般的な化合物の同定のための、新規な蛋白質又はペプチドの配列決定又はデータベース探索に応用できる、容易な、迅速なかつ数学的にしっかりしたそして統計的に頑健な手段を提供する。
【0056】
図2の工程210を参照すると、生の連続質量スペクトルデータが、例えば、あるペプチドの多くのフラグメントに対応する多くの同位体パターン又はクラスターを含むタンデムMS/MSスペクトルを含有する試料について得られる。上述のように、ほとんどの市販技術はスティックスペクトルデータを利用するが、全体的な生のスペクトルを使用すると、データの特徴の早過ぎる総簡略化に起因するデータの損失がないことを意味することは認識されるであろう。しかしながら、この生のスペクトルは、検出器に達するかもしれない偽のイオン及び中性粒子に起因する、機器のピーク形状関数、機器の分解能及びベースラインのばらつきに係わる特性を有する。更に、これらの潜在的因子全てに関して、質量依存性があり得る。例えば、その存在を減少させるあらゆる試みにも拘わらず、幾つかは検出器に達するマトリックス材料のイオンに主として起因する、MALDIシステムにおける増加するm/zの関数としてのベースライン変位の指数関数的分解がある。
【0057】
工程220では、工程210において取得された生データが、生の連続体データを標準化するように、内部及び/又は外部の標準に基づく質量分析計の完全較正に付される。こうすることで、ピークが適切なm/z値で並べられ、そしてピーク形状が適切に定義されて数学的にわかるように保証する。これは、好ましくは米国特許第6,983,213号及び2004年10月20日に出願された国際特許出願PCT/US2004/034618に示された手順によって遂行され、その全ての内容は本明細書に参照により組み込まれる。完全な質量スペクトル較正の代わりに、探索過程での質量精度の低下を犠牲にして、ピーク形状関数を計算することができ、そしてそれを以下の質量スペクトル探索プロセスにおいて使用できる。
【0058】
工程230では、質量スペクトルにおいて観察された同位体パターン又はクラスターとマッチングさせるために、候補イオンフラグメントが選択されそして提案される。この段階で候補イオン又はフラグメントを選択するために使用できる幾つかの方法がある。
【0059】
a.如何なるデータベースも存在しない時のペプチド/蛋白質のMS/MS探索に対して、MS/MSスペクトル内での複数のフラグメントが、関心対象のペプチドについてのアミノ酸配列を推定させるための重要な情報、つまり新規配列決定を提供する。質量スペクトルの一つの端部で出発して、必要ならば、最初の又は最後の同位体クラスターの正確なモノアイソトープの質量を測定することができる。この最初の又は最後の同位体クラスターは、典型的には20個の既知のアミノ酸の一つに対応するはずである。時折生ずる不完全なフラグメント化故に、これら二つの同位体クラスターは、置き換えで20個の既知のアミノ酸のプールから引出された二つのアミノ酸に一致する可能性がある。その他の場合では、これらの二つの同位体クラスターは、酸化(メチオニンへの酸素原子又は酸素分子の添加)、水の脱離(水の消失)、リン酸化(チロシン、セリン及びトレオニン上へのHPO3の添加)、硫酸化(チロシンのO上)、及びグリコシル化のような幾つかの修飾がなされた一つの又は2,3のアミノ酸を含有する場合がある。どの場合においても、2005年10月28日に出願された国際特許出願PCT/US2005/039186において記載された元素組成探索を通した予備フィルターとしての正確なモノアイソトープの質量測定を用いて又は用いずに、候補フラグメントを計算的に効率よく選択できる。一つより多い候補フラグメントを選択して出発してもよく、そして幾つかの明らかに不正確なものを、その後で落としてもよく、一方でより多くのフラグメントを処理し、又は工程300で解析が完了して残ったものを選択するまでそれらを全て保持してもよい。現在の同位体クラスターの解析が完了した後、測定した同位体クラスターとマッチングするための新しいフラグメントを提案することによって次の同位体クラスターへ進む。この新しいフラグメントは、前のフラグメントへの新しいセグメントの追加、又はそれからの排除によって形成できる。この新しいセグメントは典型的には、修飾及び不完全なフラグメント化のような可能性のある複雑さを含む20個の既知のアミノ酸の一つ又は数個で構成される。新しいフラグメントを選択し提案するために、同じ元素組成探索が用いられることになる。末端での同位体タグ又は酵素的修飾のような他の修飾も組込まれ得る。鎖中にA,G,T及びC塩基で構成されるDNA分子を含む他のより一般的な又は特定のポリマーに対して、類似の方法が適用できる。
【0060】
b.データベースを通したペプチド/蛋白質のMS/MS探索に関して、フラグメントを選択し提案するために、既知の酵素を用いたコンピューター内(in silico)で消化の後、蛋白質又はペプチドのデータベースにおいて限られた既知の配列しか利用できないことに起因して、各段階で20個のアミノ酸の全部が可能であるとはいえないこと以外は、新規配列決定に対して上述の方法と同じ方法が使用できる。探索スペースにおける更なる削減が、MS/MSフラグメントを発生するペプチド、つまり、前駆イオンに関する精密な質量測定を通して達成でき、そうすることで、タイトで精密なマスウィンドウ内の精密な質量を有するようなペプチドだけに探索が制限される。幾つかの修飾がアミノ酸又は配列に特定なものであり、既知の配列に基づいて排除できるために、既知の配列及び可能な修飾を用いる探索もより容易になる。端部に対する同位体タグ又は酵素的修飾のような他の修飾が明らかに組込まれ得る。例えば、ゲノミクスライブラリーによって与えられた鎖中にA,G,T及びC塩基で構成されるDNA分子のような既知のライブラリーにおける探索のために、他のより一般的な又は特定のポリマーに対して類似の方法が適用できる。
【0061】
c.例えば、米国特許第5,300,771号及び第6,118,120号において記載されている如く、蛋白質又はペプチドデータベースの存在下におけるESI実験からの複数に荷電した蛋白質又はペプチドについて、そのシリーズにおいて各々観察されるイオンの荷電状態が測定される必要があり、無傷の蛋白質又はペプチドの質量の計算に使用される必要がある。次いで、この計算された蛋白質又はペプチドの質量が、可能性のある蛋白質又はペプチドのリストをデータベースから生成させるために使用できる。ある電荷を伴うこれらの可能性のある蛋白質/ペプチドの各々が、候補イオンして選択でき、一方、異なる電荷を有する同じ蛋白質/ペプチドが次の候補イオンとして選択されることになる。
【0062】
d.例えば、GC/MS用途又はPSD、又は質量分析法システム内の他のタイプのフラグメント化におけるEIフラグメント化のようなインソースフラグメンテーションについては、これらフラグメントの各々、並びにその元素組成が候補フラグメントとして使用できるように、元素組成の点で明らかになった全ての観察されたフラグメントを有することが理想的となる。しかしながら、100,000を超える化合物の全てのEIフラグメントが質量中心モードにおいて実験的に測定されてはいるが、元素組成の点では明らかになっていない、NIST EI質量スペクトルライブラリーを用いる場合がそうであるように、これが常に可能であるとは限らない。
【0063】
e.NIST EIライブラリーのように、質量中心モードにおいて実験的なフラグメント化データが入手できる場合、各フラグメントの質量中心データが次の段階の処理に対する候補フラグメントとして採用できる。しかしながら、当然ながら、データの統合性を維持するためには、全ての入手できる同位体での質量中心データが好ましい。NIST EIライブラリーにおいては、化合物の種々のフラグメントに対する相対的強度データも入手でき、そして現在入手できる探索アルゴリズムにおいて使用されてきた。しかしながら、この探索が適切に働くためには、例えば、デカフルオロトリフェニルホスフィン(DFTPP)を調節化合物として使用する米国環境保護局(USEPA)の方法525.2のQC手順によって命じられているように、ピーク比を期待値の20から30%の誤差限界範囲内に確保するよう、MS機器は労を惜しまずに調整されなければならない。当業者にとっては、フラグメントの量比が、機器条件と同様、化合物毎に大きく変わること、従って良く調整された機器上でさえそれを維持することが非常に困難であるのは周知のことである。当然ながら、本発明においては、ライブラリーにおけるフラグメントの相対強度がもはや適切でなく、そして、あるフラグメントの確率を評価するために、実際の測定されたフラグメント強度が使用された後全てのフラグメントに基づいて全体的確率が確立される。
【0064】
f.連続モードにおいて実験的なフラグメント化データが入手できる場合、より良いデータ統合性及び性能が期待でき、特に実験データが工程210において使用されたものよりも高い分解能を有する質量分析計上に集められている場合、及び/又は好ましくは、米国特許第6,983,213号、及び2004年10月20日に出願された国際特許出願PCT/US2004/034618において概略記載されている方法を用いて、実験的フラグメント化データについての完全な質量スペクトル較正が入手可能である場合がそうである。この場合においては、観察された同位体パターンを所望のピーク形状関数に合わせるために、実験的に測定された同位体パターン又は観察された各フラグメントに対するパターンを畳込み又は較正工程の後で候補フラグメントとして使用することができる。
【0065】
g.実験的に測定されるフラグメント化データが、qTOF又はFTMS、又は米国特許第6,983,213号、及び2004年10月20日に出願された国際特許出願PCT/US2004/034618において概略記載されているような、包括的な質量スペクトル較正を有するユニットマス分解能システムのような高い質量精度を有する機器から由来する場合、市販品として入手できる数式探索アルゴリズム、又は好ましくは2005年10月28日に出願された国際特許出願PCT/US2005/039186において概略記載されているようなアプローチを用いて、観察された各フラグメントに対して元素組成の測定が実行できる。
【0066】
工程240で、候補イオン/フラグメントに対する精密な質量位置が、もし入手できればその元素組成に基づいて計算される。これは、理論的に計算された同位体分布を含み、それは米国特許第6,983,213号及び2004年10月20日に出願された国際特許出願PCT/US2004/034618において記載されているように考慮される。あるいは、実験的に測定された及び/又はライブラリーからの質量中心データを、その同位体分布として用いることができる。
【0067】
工程250で、候補イオン/フラグメントに対する計算された同位体パターン(質量スペクトル連続体)を得るために、工程220において全て与えられた、完全な質量スペクトル較正において標的のピーク形状関数として計算され又は特定されたピーク形状関数を用いて、同位体分布が畳込まれる。この目的に対して及びその他の目的で、本明細書を通して使用される用語の畳込みは、マトリックス操作又はフーリエ変換空間におけるポイント毎の操作、又は伝統的タイプであれそうでないタイプであれその他の如何なるタイプの畳込み、フィルタリング又は相関を意味し得る。
【0068】
工程240及び250の替りとして、工程240A及び250Aが、機器から測定された又はライブラリーからの、プロファイル又は連続モードにおける同位体パターンを取り、計算された(実際のピーク形状関数)又は工程220において(標的ピーク形状関数)に変換されたものと一致する所望のピーク形状関数を有するように、その同位体パターンを変換する。これは、この同位体パターンに関して、丁度工程220におけるものと同じように実行された別の完全質量スペクトル較正によって、又は本明細書のより高分解能のシステムで、工程220からのピーク形状関数を用いて測定された同位体パターンの畳込みを通して達成される。同位体パターンが高分解能で測定される場合、その中で観察される元のピーク形状関数が、工程220におけるピーク形状関数と比較して有意性がなくなる。
【0069】
工程260でマトリックスKが発生し、それは既知のそして時々、質量依存型のベースライン関数、及び候補イオン/フラグメントに対する同位体パターンを含む。可能性のあるベースライン関数の例には、平坦な線、及び線形又は二次項のような幾つかのより低次の項が挙げられる。これらのより低次の項の組合せによって、非線形項を明確に組込み、そして代わりに非線形解を求めることを選択してもよいものの、指数的に減衰するベースラインが小さな質量スペクトル範囲内に適切に補正でき、そして工程270において、計算的に効率的な線形解に達するのを助ける。マトリックスKは、フラグメントの同位体標識体を含む共存するイオン又はフラグメントからの同位体パターンのような、候補フラグメントの同位体パターンと干渉する、如何なる他の成分を任意に含んでもよい。r及びKにおける成分の間の可能性のある質量オフセットをモデル化するために、Kにおける成分の第一誘導体又は試料測定rの第一誘導体も含まれていてよい。
【0070】
工程260において生じたマトリックスの成分が、式1から2において与えられた形で、工程220の取得された及び/又は較正された質量スペクトルデータにフィットするように、工程270で、古典的な最小二乗回帰(又は、全ての重みが1に等しい加重最小二乗回帰)が実行される。
【0071】
工程280で、回帰係数(cにおける値)が、式3から4において与えられたt−統計又はp−値の形での確率測度と共に、マトリックスKに含まれる成分に対する相対的濃度として報告される。
【0072】
工程290で、t−統計、p−値又はF−統計などの他の手段に基づいて統計的検定が実行され、マトリックスKに含まれる如何なる又は全ての成分が有意であるかどうかが定められる。この点に関して、あたかも試料中に見出されたもう一つの化合物であるかの如く、ベースラインが解析において処理されてもよい(工程220において生み出されたデータにおいて)。もし、如何なる成分も有意性がない場合、次に工程290Aへと分岐され、そして、この成分がマトリックスKから除かれた後工程270に戻って次の繰返しを行う(そして工程280と工程290へと続く)。全体的フィットの一部としての、可能性のある成分の寄与を最初に推定するこの工程は、それに続いて有意性がないベースライン成分が除去され、マトリックスK及び式1への更なる成分の不必要な導入なしのベースラインを含む、成分の偏らない補正の目的に役立つ。典型的には、より多くの成分がマトリックスKに追加されるにつれて、その調整がより悪化し、その結果、より不正確な濃度の推定及びその他の統計的信頼の悪化をもたらす。しかしながら、プロセスにおいて全ての有意性がない成分を除去することによって、Kマトリックスの調整が改善され、cについてのより正確な濃度推定及びより高い統計的信頼へと導かれる。この時点での幾つかの成分のこの繰返し除去はオプションである。
【0073】
全ての有意性がない成分が除去された時、工程290Bで、残りe(式1)についての統計的検定が実施され、マトリックスK中に見損じた他の成分がないかどうかチェックされ観察され、予想を上回る残りが生じた場合、もう一回の繰返しのために工程270に戻る前に、工程290Cにおいてより多くの成分が追加され得る。これらの成分は関与するフラグメントの同位体標識体であってもよく、又はLC/MS/MS実験の探索走査中に、時間及び質量において分離されなかった、干渉する前駆イオンからのフラグメントであってもよい。
【0074】
統計的に有意性がない残りを有し、全ての成分に有意性がありそうな場合、次のイオン/フラグメントの解析のために、工程290Dを通って工程230に戻ることになる。全てのイオン/フラグメントが解析されたら、各イオン/フラグメントに関連する個々の確率測度を組合せて、工程290Eのrにおいて観察されるこれらのフラグメントを発生させるイオンに対する全体的確率測度を形成することができる。上述の式5は、個々のp−値から全体的p−値にどのように進むかの一例を示す。
【0075】
対応するフラグメントと共に、複数の可能性のあるイオンが考慮される場合、工程300においてこれらのイオンをランク付けるために、そしてこれを解析又は探索の結果として報告するために、それらの全体的確率測度が使用できる。
【0076】
可能性のあるイオンの既知のライブラリー又はリストが存在しない場合、工程300において報告された結果が、新規配列決定を含む未知の化合物の同定に対して使用でき、そこで、その前に未知であったペプチド又は蛋白質に対するアミノ酸配列を決定することができる。蛋白質/ペプチドライブラリーのようなライブラリーが存在する場合、そのライブラリーから選択された可能性のあるペプチド又は蛋白質を、スコアーとしてのそれらの全体的確率測度に基づいて探索報告書に保存することができる。入手可能なライブラリーにおける探索の前にアミノ酸配列を決定するために、あたかも入手できる既知の蛋白質又はペプチドライブラリーが存在しないかのように、つまり、新規配列探索が存在しないかのように、常に解析を実行するというような、種々の工程の幾つかの組合せが当業者によって想定でき、この場合、BLASTのような既知の計算技法の使用を通して、配列についての単純かつ非常に迅速なテキスト文字列探索が実行できる。
【0077】
これらの確率測度は、モニター40上に表示されることによって及び/又はコンピュータ18に付随するプリンター(図示されていない)上に印刷されることによってコンピュータ18(図1)によって報告される。
【0078】
上述の全ての解析に対して、米国特許第6,983,213号及び2004年10月20日に出願された国際特許出願PCT/US2004/034618において指摘されている如く、前もって、m/z軸をもう一つのより適切な軸に変換し、そしてその変換された軸において均一なピーク形状関数を用いた解析を可能ならしめることが有利である。
【0079】
qTOF又はFTMSのような高分解能MSシステム上では、同じイオンの種々の同位体サテライトが、互いにスペクトル的に良く分離され、他のイオンの同位体サテライトとの間に交互配置され、イオン検出器応答曲線の異なる非線形部分に位置する強度を有し、空間電荷のせいで異なる質量シフトを有し、そして異なるベースラインなどを有し得る。これらの理由から、上述の解析法方の特別な場合として、イオンの解析を完了するように組合せる前に、各同位体サテライトが別々に処理されるように、その多くのサテライト同位体を個々に解析することを通してイオンを解析することは有利である。一つのサテライト同位体はモノアイソトープであり、これはその単純性故に、最初の可能性のある元素組成を提案し、全ての観察できるサテライト同位体に基づいて後で確認してランク付けするために有利に使用できる。この場合、各追加候補イオン(本明細書でいうサテライト同位体)は、その元素組成において一つ又はそれより多くの同位体を変更することによって、他の候補イオン(やはりサテライト同位体)から誘導されるその元素組成を有することになろう。
【0080】
上述のプロセスは、例示目的でそして完全であるために、かなり包括的な一連の工程を含む。しかしながら、ある工程を省略すること、又はある工程を前もって又はオフラインで実施することを含む、このプロセスを変え得る多くの方法がある。例えば、較正を一度実行し、同じ機器を用いてその較正をしばらくの期間使用することが出来る。加えて、あまり望ましくないことだが、図2の工程220を省略して、質量精度が初歩レベルである従来の多点質量軸較正のみを使用して、推定のピーク形状関数を用いて作業してもよい。更に、ライブラリーにおけるスペクトル上で実行される操作は一度だけ実行される必要があり、そしてある目標ピーク形状関数を有する、得られた較正されたライブラリースペクトルを全ての機器類、又は同じ目標ピーク形状関数になるように完全に較正された機器タイプに対してさえ使用してもよい。この点に関して、本発明に従って生成された較正ライブラリーは、同じピーク形状関数に関して標準化された、異なる質量分析計システムの異なるユーザーに対して、高い固有値を有するため、別々に販売可能な非常に貴重な商品である。
【0081】
逆に、ある工程を組合せてもよく、又は他の工程と同時に実施してもよい。例えば、もし一つ又はそれより多くの既知の化合物又はフラグメントが試料における内部標準として入手できるならば、それらは、米国特許第6,983,213号及び2004年10月20日に出願された国際特許出願PCT/US2004/034618において記載されているように、オン−ザ−フライ完全質量スペクトル較正を実行するために使用できる既知のスペクトルを生成するであろう。
【0082】
当然ながら、幾つかの場合、試料中の全てのイオン又はフラグメントがライブラリーにおいて必ずしも見出されるとは限らない。新しい分子が発見される。この場合は、余分の成分又は、少なくとも初期においては、濃度を定めることができない成分等が存在することになり、そのことは未知種の同一性及び化学組成が決定されるまでは、式1における残りeのフィッティングを測定ノイズレベルまで減少させるであろう。次いで、スティックスペクトルのライブラリーか又は事前に計算された連続スペクトルのライブラリーが、関連するライブラリーに既に含有されてはいない新しい化合物からのイオン又はフラグメントによって、将来の解析のために論じられ得る。
【0083】
尚、用語「質量」及び「質量対電荷比」は、情報又は処理能力の関連において、質量分析計の質量対電荷の比の軸と定義されるものとして、いくらか互換的に用いられる。これは、科学文献及び科学的議論における共通の慣行であり、そしてこれらの用語が当業者によってこの文脈で読まれる場合に、何の不明確さも起こさない。
【0084】
本発明の解析方法は、ハードウエア、ソフトウエア又はハードウエアとソフトウエアの組合せにおいて実現できる。如何なる種類のコンピュータシステム―又は本明細書に述べられた方法及び/又は機能を実行するために適合された他の装置―も適切である。ハードウエアとソフトウエアの典型的な組合せは、それが搭載されて実行される時にコンピュータシステムを制御し、次いでそれが解析システムを制御し、そのシステムが本明細書に述べた方法を実行するように、計算機プログラムを有する汎用コンピュータシステムであり得る。本発明は、本明細書に述べたアプローチの実行を可能ならしめる全ての特徴を含み―そしてそれがコンピュータシステムに組み込まれた(次いでそれが解析システムを制御する)時に―これらの方法を実行可能な計算機プログラム製品に組み込むことができる。
【0085】
この意味でのコンピュータプログラム手段又はコンピュータプログラムは、直接又は他の言語、符号又は表記に変換した後で特別な機能を実行するための情報処理能力、及び/又は異なる材料の形での再生をシステムに持たせることを意図した一組の指示書の如何なる表現、如何なる言語、コード又は表記をも含む。
【0086】
このように、本発明は、上述の機能を果たすために、その中に組み込まれたコンピュータ読み取り可能なプログラムコード手段を有する、コンピュータが使用できる媒体を含む製品を含む。製品におけるコンピュータ読み取り可能なプログラムコード手段は、コンピュータに本発明のアプローチの工程を実行させるための、計算機が読めるプログラムコード手段を含む。同様に、本発明は、上述の機能を果たすために、その中に組み込まれた、コンピュータ読み取り可能なプログラムコード手段を有する、コンピュータが使用できる媒体を含むコンピュータプログラム製品として実行できる。コンピュータプログラム製品におけるコンピュータ読み取り可能なプログラムコード手段は、コンピュータに本発明の一つ又はそれより多くの機能を発揮させるための、コンピュータ読み取り可能なプログラムコード手段を含む。更に、本発明は機械によって読むことができ、本発明の一つ又はそれより多くの機能を果たすための方法工程を実施するための、機械によって実行可能な指示書のプログラムを明白に具現化する、機械によって読み取り可能なプログラム記憶装置として実行され得る。
【0087】
尚、上記では本発明の幾つかのより適切な目的及び実施態様を概略述べていることに留意されたい。本発明の概念は多くの用途に対して使用できる。従って、この記述が特別な配置及び方法に対してなされているが、本発明の意図及び概念は、他の配置及び方法に対しても適切であり応用可能である。当業者にとって、開示された実施態様についての他の改良が本発明の趣旨と範囲を逸脱することなく成し得ることは明白であろう。記述された実施態様は、本発明のより卓越した特徴及び用途の幾つかの単なる例示であると見なされるべきである。従って、先の記述が本発明の単なる例示に過ぎないことは理解するべきである。当業者によって、本発明から逸脱することなく種々の代替及び改良が工夫できる。開示された発明を異なる方法において適用することによって、又は本発明を当業者に公知の方法において改良することによって、他の有益な結果が実現可能である。従って、当然ながら本実施態様が一例として提供されており、限定として提供されたものではない。従って、本発明は添付された請求項の範囲に入る全ての代替、改良及び変更を包含するものとする。

【特許請求の範囲】
【請求項1】
少なくとも2つのイオン又はフラグメントが存在するときにイオンを解析する方法であって、
少なくとも一つの候補イオン又はフラグメントについての同位体パターンを取得すること;
該同位体パターンを含むピーク成分マトリックスを構築すること;
測定された質量スペクトル応答を取得すること;
測定されたプロファイルモードの質量スペクトル応答とピーク成分マトリックスの間での回帰を実行すること;
上記候補イオン又はフラグメントについての確率測度を報告すること;
可能性のある整合イオン又はフラグメントとしての確率測度に基づいて少なくとも一つの候補イオン又はフラグメントを選択すること;
少なくとも二つの上記整合イオン又はフラグメントの上記確率測度を統合してイオンについての全体的確率測度とすること;
の工程を含む、上記方法。
【請求項2】
同位体パターンが所望のピーク形状関数を有する請求項1記載の方法。
【請求項3】
所望のピーク形状関数が、推定されたピーク形状関数、測定され及び計算されたものの一つとしての実際のピーク形状関数、及び標的ピーク形状関数の一つである請求項2記載の方法。
【請求項4】
同位体パターンがプロファイルモードで測定される請求項2記載の方法。
【請求項5】
測定がより高いMS分解能で実行される請求項4記載の方法。
【請求項6】
測定された同位体パターンが所望のピーク形状関数を持つように変換されている請求項4記載の方法。
【請求項7】
所望のピーク形状関数が、推定されたピーク形状関数、測定された及び計算されたものの一つとしての実際のピーク形状関数、及びピーク形状を含む質量スペクトル較正からの標的ピーク形状関数の一つである請求項6記載の方法。
【請求項8】
同位体パターンが、少なくとも二つのイオン又はフラグメントの線形の組合せである請求項2記載の方法。
【請求項9】
少なくとも二つのイオン又はフラグメントが天然の及び同位体標識されたバージョンのイオン又はフラグメントを含む請求項8記載の方法。
【請求項10】
測定された質量スペクトル応答が、所望のピーク形状関数を持つよう較正されている請求項1記載の方法。
【請求項11】
所望のピーク形状関数が、推定されたピーク形状関数、測定された及び計算されたものの一つとしての実際のピーク形状関数、及びピーク形状を含む質量スペクトル較正からの標的ピーク形状関数の一つである請求項10記載の方法。
【請求項12】
同位体パターンが、同位体分布及び所望のピーク形状関数の畳込みを通して理論的に計算される請求項1記載の方法。
【請求項13】
所望のピーク形状関数が、推定されたピーク形状関数、測定された及び計算されたものの一つとしての実際のピーク形状関数、及びピーク形状を含む質量スペクトル較正からの標的ピーク形状関数の一つである請求項12記載の方法。
【請求項14】
同位体分布が少なくとも一つの元素組成から理論的に計算される請求項12記載の方法。
【請求項15】
元素組成が、測定された質量スペクトル応答を用いて、可能性のある元素組成の探索を通して得られる請求項12記載の方法。
【請求項16】
同位体分布が質量中心モードにおける実際のMS測定の典型である請求項12記載の方法。
【請求項17】
同位体分布が予め測定され又は計算された質量中心MSデータの既知のライブラリーに準拠して決定される請求項12記載の方法。
【請求項18】
少なくとも二つのイオン又はフラグメントが、タンデム質量分析、イン−ソースフラグメンテーション、ポストソース分解、イオントラップ、質量分析器内でのイオン反応(電子衝撃イオン化及びエレクトロスプレーイオン化を含む)の一つを含むものから生成する請求項1記載の方法。
【請求項19】
イオン又はフラグメントが少なくとも一つのペプチド又は蛋白質から導き出される請求項1記載の方法。
【請求項20】
イオン又はフラグメントが無傷のイオン、ナトリウムで形成されるアダクトイオン、及び脱水後の修飾されたイオンを含む、元のイオンから生成したイオンの組合せから導き出される請求項1記載の方法。
【請求項21】
イオン又はフラグメントがポリマーの一部から導き出される請求項1記載の方法。
【請求項22】
ポリマーがDNA分子由来のものである請求項21記載の方法。
【請求項23】
ピーク成分マトリックスが、少なくとも一つの線形及び非線形の性質のものであるベースライン成分を含有する請求項1記載の方法。
【請求項24】
ピーク成分マトリックスが、少なくとも一つの測定された質量スペクトル応答及びピーク成分マトリックス中に既に含まれる同位体パターンの最初の誘導体を含む請求項1記載の方法。
【請求項25】
ピーク成分マトリックスが、少なくとも一つの同位体パターン及び任意の干渉イオンの最初の誘導体を含む請求項1記載の方法。
【請求項26】
回帰が重回帰である請求項1記載の方法。
【請求項27】
回帰が重み付き回帰である請求項1記載の方法。
【請求項28】
重みが全て1である請求項27記載の方法。
【請求項28】
重みが質量スペクトル分散に逆比例する請求項27記載の方法。
【請求項29】
質量スペクトル分散が質量スペクトル強度に比例する請求項28記載の方法。
【請求項30】
確率測度がp−値である請求項1記載の方法。
【請求項31】
全体的確率測度が、イオン内の全ての整合フラグメントについての個々のp−値のである請求項1記載の方法。
【請求項32】
候補イオン又はフラグメントが、既知の蛋白質又はペプチドのリスト又はデータベースの一つに基づいて生成する請求項1記載の方法。
【請求項33】
蛋白質又はペプチドのリスト又はデータベースの一つが、トリプシンのような酵素の効果をシミュレーションすることによって、コンピュータを用いてコンピュータ的に消化されている請求項32記載の方法。
【請求項34】
全体的確率測度が、既知イオンのリスト及びデータベースの一つから採られた候補イオンをランク付けするために使用される請求項1記載の方法。
【請求項35】
考慮すべき第一候補イオン又はフラグメントが、可能性のある候補内の探索の結果である請求項1記載の方法。
【請求項36】
可能性のある候補が、蛋白質又はペプチドにおける全ての可能性のあるアミノ酸の少なくとも一つを含むフラグメントである請求項35記載の方法。
【請求項37】
少なくとも一つアミノ酸が可能性のある化学修飾を含む請求項36記載の方法。
【請求項38】
可能性のある修飾が、酸化、脱水、リン酸化、硫酸化、及びグリコシル化の一つを含む請求項37記載の方法。
【請求項39】
新規配列決定の目的でアミノ酸の配列をランク付けするために全体的確率測度を使用することを更に含む請求項1記載の方法。
【請求項40】
リスト又はデータベースの一つのテキスト探索のために取得されたアミノ酸の配列を使用することを更に含む請求項39記載の方法。
【請求項41】
可能性のある候補イオン又はフラグメントが、測定された質量スペクトル応答からの精密な質量測定の使用を通して換算される請求項1記載の方法。
【請求項42】
考慮すべき候補イオン又はフラグメントが、予め考慮されたイオン又はフラグメントに基づく、可能性のある追加又は削除のリストからのものである請求項1記載の方法。
【請求項43】
追加又は削除が、可能性のあるイオン又はフラグメントのリストからのものである請求項42記載の方法。
【請求項44】
可能性のあるイオン又はフラグメントが、蛋白質又はペプチドにおけるアミノ酸の少なくとも一つを含む請求項43記載の方法。
【請求項45】
少なくとも一つアミノ酸が可能性のある化学修飾を含む請求項44記載の方法。
【請求項46】
可能性のある修飾が、酸化、脱水、リン酸化、硫酸化、及びグリコシル化の一つを含む請求項45記載の方法。
【請求項47】
候補イオン又はフラグメントがポリマーの可能性のある部分から採られる請求項1記載の方法。
【請求項48】
ポリマーがDNA分子由来のものである請求項36記載の方法。
【請求項49】
ポリマーの可能性のある部分が、少なくとも一つの可能性のある修飾のリストによって修飾される請求項48記載の方法。
【請求項50】
確率測度が、イオン又はフラグメントの存在、非存在及び尤度の一つを評価するために使用される請求項1記載の方法。
【請求項51】
確率測度が、可能性のあるイオン又はフラグメントのリストをランク付けするために使用される請求項1記載の方法。
【請求項52】
全体的確率測度が、イオンの存在、非存在及び尤度の一つを評価するために使用される請求項1記載の方法。
【請求項53】
全体的確率測度が、可能性のあるイオンのリストをランク付けするために使用される請求項1記載の方法。
【請求項54】
ピーク成分マトリックスが、マトリックス中の成分の追加又は削除によって更新されそして回帰が繰返される請求項1記載の方法。
【請求項55】
成分の追加又は削除が、回帰から得られる確率測度に基づく請求項54記載の方法。
【請求項56】
質量スペクトル応答が、イオン移動度分光法におけるプラズマグラムを含む請求項1記載の方法。
【請求項57】
質量軸が、線形及び非線形関数の一つを通して変換されている請求項1記載の方法。
【請求項58】
少なくとも二つのイオンが、イオンの少なくとも二つのサテライト同位体であり、そしてイオンの解析がその質量スペクトル的に分析されたサテライト同位体に基づく請求項1記載の方法。
【請求項59】
少なくとも二つのサテライト同位体がモノアイソトープを含む請求項58記載の方法。
【請求項60】
請求項1〜59の何れか1項に記載の方法を実行するためにプログラムされたコンピュータ。
【請求項61】
コンピュータによって解析される質量スペクトルデータを取得するための質量分析計と組合せた請求項60記載のコンピュータ。
【請求項62】
請求項1〜59の何れか1項に記載の方法をコンピュータに実行させるための、コンピュータ読み取り可能なコードをその上に有する、コンピュータ読み取り可能な媒体。
【請求項63】
質量分析計によって生成されたデータのデータ解析機能を実行するためのコンピュータを伴う質量分析計であって、このコンピュータが請求項1〜62の何れか1項に記載の方法を実行する質量分析計。

【図1】
image rotate

【図2】
image rotate


【公表番号】特表2009−539068(P2009−539068A)
【公表日】平成21年11月12日(2009.11.12)
【国際特許分類】
【出願番号】特願2009−512334(P2009−512334)
【出願日】平成19年5月28日(2007.5.28)
【国際出願番号】PCT/US2007/069832
【国際公開番号】WO2007/140355
【国際公開日】平成19年12月6日(2007.12.6)
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.JAVA
【出願人】(505401366)セルノ・バイオサイエンス・エルエルシー (7)
【Fターム(参考)】