説明

質量分析データ処理方法、質量分析データ処理装置、及び質量分析装置

【課題】或るMS1ピークをプリカーサイオンとしたMS2分析を実行する前にそのMS2分析結果を利用した物質同定の確率を定量的に推定することにより、同定作業の効率向上を図る。
【解決手段】同定確率推定モデル構築部32は、既知試料から得られた多数の分画試料をMS1、MS2分析し、同定を行った結果(成功/失敗)から、同定成功の確率が高いMS1ピークのm/z及びSN比を把握し、MS1ピークを順位付けするパラメータと、その順位に従ってMS2分析及び同定を行った場合の分析累積数と同定成功数との関係を示す同定確率推定モデルを表すパラメータを求め、記憶部33に記憶しておく。目的試料中の物質同定に際しては、分析により得られたMS1ピークについてMS1ピーク順位付けパラメータを用いて近似順位を求め、同定確率推定モデルを参照して近似順位から同定確率推定値を求める。例えば同定確率がを基にMS1ピークを選択しMS2分析することで効率良く網羅的同定が可能である。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、MSn分析を行うことが可能な質量分析装置で収集されたMSnスペクトルデータを処理して試料中の物質を同定するための質量分析データ処理方法、該データ処理方法を利用した質量分析データ処理装置、及び質量分析装置に関する。
【背景技術】
【0002】
生命科学の研究や医療、医薬品開発などの分野においては、生体試料を対象として、タンパク質、ペプチド、核酸、糖鎖など様々な物質を網羅的に同定することがますます重要になってきている。特にタンパク質やペプチドを対象とするこうした網羅的な解析手法はショットガン・プロテオミクス(Shotgun Proteomics)と呼ばれている。こうした解析のためには、LC(液体クロマトグラフ)やCE(キャピラリ電気泳動)などのクロマトグラフィと、MSn型質量分析装置(タンデム型質量分析装置)とを組み合わせた分析手法が非常に威力を発揮している。
【0003】
MSn型質量分析装置を用いた生体試料中の各種物質の一般的な網羅的同定手法の手順は次のとおりである。
[ステップ1]分析対象である試料に含まれる各種物質をLC、CE等により分離し、その溶出液を分取・分画して多数のサンプルを調製する(以下、分取・分画により得られた個々のサンプルを「分画試料」と呼ぶ)。なお、試料を分取・分画する際には、予め決めた一定の時間間隔で分画を行う又は一定量の試料液を採取するように分画を行うことにより、該試料中の物質ができるだけ漏れなくいずれかの分画試料に含まれるようにする。
【0004】
[ステップ2]各分画試料に対するMS1スペクトルをそれぞれ取得し、該MS1スペクトル上で同定対象の物質群に由来すると考えられるピークを選択する。
[ステップ3]上記ステップ2で選択したピークをプリカーサイオンに設定して当該分画試料に対しMS2分析を実行し、その結果に基づいてデータベース検索やデノボシーケンスサーチを行い、分画試料に含まれる物質を同定する。
【0005】
[ステップ4]十分な確度で特定の物質が同定されなかった場合には、MS1スペクトル上で見つけた別のピークをプリカーサイオンに設定してMS2分析を実行するか、或いは、MS2スペクトル上で観測される特定のイオンをプリカーサイオンとした高次(つまりnが3以上)のMSn分析を実行し、その結果に基づくデータベース検索やデノボシーケンスサーチなどにより、分画試料に含まれる物質を同定する。
[ステップ5]上記ステップ2〜4の処理を複数の分画試料それぞれに対して行い、元の試料に含まれている様々な物質を網羅的に同定する。
【0006】
上記のような網羅的同定において、高い確度で以て物質を同定するには、同一の分画試料に含まれる物質の種数が少ない(できれば1種類のみである)ことが望ましい。しかしながら、そのためには1つの分画の時間を短くする必要があり、分画数自体が非常に多くなってしまう。そこで、限られた時間でできるだけ多くの物質を同定するためには、つまり、網羅的同定のスループットを向上させるには、同定に成功する確率(以下「同定確率」という)が高いプリカーサイオンを優先的にMSn分析する必要がある。
【0007】
或る試料に対して得られたMS1スペクトル上で観測されるピークの中からMS2分析のためのプリカーサイオンを選択する方法としては、ピーク強度が高いものから順に選択する方法が従来知られている(特許文献1等参照)。或る1つの試料に対するMS2分析を行う時間に制約がある場合には、ピーク強度の高い順に所定個数のピークに対応するイオンをプリカーサイオンとする等の制御が行われる。また、選択個数に制約を設けずにピーク強度が所定閾値以上であるピークを全て抽出してプリカーサイオンとする方法も知られている。
【0008】
これらの方法はあくまでも、ピーク強度の高いイオンが同定確率が大きいものとの仮定に基づいていると考えられる。この仮定自体は定性的に誤っているわけではないものの、ピーク強度の高さは必ずしも同定確率の値を示すものではない。そのため、例えばプリカーサイオンとして選択し得るピークが複数存在するときに、いずれのピークでも高確率で同定に至る場合と一部のピークしか同定に至ることが期待できない場合とがあるが、その区別を事前に(つまりMS2分析実行前に)定量的に判定することができない。このことが網羅的同定の効率を下げる一因となっている。
【先行技術文献】
【特許文献】
【0009】
【特許文献1】特許第3766391号公報
【非特許文献】
【0010】
【非特許文献1】アレクセイ・ナコルチェフスキー(Aleksey Nakorchevsky)、ほか1名、「エクスプローリング・データ-デペンデント・アクイジション・ストラテジーズ・ウィズ・ジ・インストゥルメント・コントロール・ライブラリーズ・フォー・ザ・サーモ・サイエンティフィック・インストゥルメンツ(Exploring Data-Dependent Acquisition Strategies with the Instrument Control Libraries for the Thermo Scientific Instruments)」、ASMS 2010
【発明の概要】
【発明が解決しようとする課題】
【0011】
上記問題はMSn-1スペクトル上の各ピークに対する同定確率が定量的に評価されておらず、そうした定量結果に基づいたプリカーサイオンの選択がなされていないことに起因する。
【0012】
本発明はこうした課題を解決するためになされたものであり、その目的とするところは、MSnスペクトルデータに基づくデータベース検索等による物質同定を行う際に、MSn-1スペクトル上のピーク毎に同定確率を定量的に把握することができる質量分析データ処理方法及び質量分析データ処理装置を提供することにある。
【0013】
また、本発明の別の目的は、定量化された同定確率に基づいて、例えば同定確率の高いプリカーサイオンを優先的にMSn分析して該分析の結果を利用して同定を行う、又は同定確率が一定以上であるプリカーサイオンのみを選択しMSn分析して該分析の結果を利用して同定を行う、などの制御及び処理により、同定の精度向上と同定の効率化を達成することができる質量分析装置を提供することにある。
【課題を解決するための手段】
【0014】
上記課題を解決するために成された第1発明は、各種物質が含まれる試料を分離用パラメータに従って分離し分画することで得られた複数の分画試料に対しMSn分析(nは2以上の整数)をそれぞれ実行することで得られたMSnスペクトルに基づいて、各分画試料に含まれる物質を同定する質量分析データ処理方法であって、
a)所定の試料から得られた複数の分画試料に対するMSn-1分析により求まるMSn-1ピークの情報、及び該各MSn-1ピークをプリカーサイオンとして実行されたMSn分析の結果に基づく物質同定の結果を利用して、MSn-1ピークの順位を決めるための順位付け情報を求めるとともに、同種試料に由来する複数のMSn-1ピークを前記順位に従ってプリカーサイオンとして選択してMSn分析及び同定を実行していったときのMSnピークの累積数と同定成功数との関係に基づく同定確率推定モデルを求め、前記順位付け情報及び前記同定確率推定モデルを表現する同定確率推定モデル情報を記憶する同定確率推定モデル構築ステップと、
b)同定対象である試料から得られた少なくとも1つの分画試料に対するMSn-1分析により求まるMSn-1ピークについて、前記順位付け情報を利用してその順位を算出するピーク順位算出ステップと、
c)前記同定確率推定モデル情報より求まる同定確率推定モデルを参照して、前記ピーク順位算出ステップで算出されたMSn-1ピークの順位から該MSn-1ピークの同定確率推定値を算出する同定確率推定ステップと、
を有し、同定対象である試料から得られた分画試料に対するMSn分析前に、該分画試料に対するMSn-1ピークをプリカーサイオンとしたMSn分析及び同定を行ったとしたときの同定確率推定値を得られるようにしたことを特徴としている。
【0015】
ここで、試料に含まれる各種物質を分離する手段はLC、CEなどである。該手段がLCなどカラムを用いたものである場合には、上記分離用パラメータとは時間(保持時間)である。また、該手段がCEである場合には、上記分離用パラメータとは移動度である。
【0016】
また、MSnスペクトルに基づいて物質を同定する同定方法は特に限定されず、例えばデノボシーケンス、MS/MSイオンサーチ、など任意のアルゴリズムを用いることができる。
【0017】
第1発明に係る質量分析データ処理方法において同定確率推定モデル構築ステップでは、MSn分析及びその分析結果を利用した同定結果が全て得られている、いわば既知のデータを用いて、MSn-1ピークの順位付け情報と同定確率推定モデル情報とを求める。少ない数のMSn-1ピークに対するMSn分析及び同定によって、試料に含まれる多数の物質のうちできるだけ多くの物質を同定するという観点では、同定に成功するMSn-1ピークができるだけ上位の順位に集中するように、MSn-1ピークの順位付けがなされることが好ましい。ただし、単にMSn-1ピークの同定確率を推定するためであれば、上述したようなMSn-1ピークの順位付けの制約はない。
【0018】
好ましい順位付けを行うために、上記同定確率推定モデル構築ステップでは例えば、質量電荷比とSN比とに基づくMSn-1ピークの分布を調べ、同定に成功したMSn-1ピークが高い密度で分布している領域に存在するMSn-1ピークに対する順位が高くなるように順位付けを行うようにするとよい。ここで、或るMS1ピークのSN比は、そのMS1ピークの強度と、該ピークが存在するMS1スペクトル(ノイズ除去などの加工がされていないプロファイル)から求めたノイズレベルとから求まるものとすることができる。
【0019】
一方、順位付けされたMSn-1ピークをその順位に従ってプリカーサイオンとして選択してMSn分析及び同定を実行していったときのMSnピークの累積数と同定成功数との関係を求めると、例えば上述したように同定に成功したMSn-1ピークが上位に集中する順位付けがなされていれば、MSnピークの累積数つまり順位と同定成功数との関係は階段状に増加する形状になる。そこで、上記同定確率推定モデル構築ステップでは例えば、MSnピークの累積数と同定成功数との連続的な関係を求めるべくフィッティングを行って滑らかなフィッティングカーブを求め、さらにこのカーブをMSnピークの順位と同定確率との関係にするために該カーブを微分するとよい。これにより、MSnピークの順位に対して同定確率を導出可能な同定確率推定モデルが得られる。
【0020】
なお、MSn-1ピークの適切な順位付け及び適切な同定確率推定モデルは試料の種類、より厳密には試料に含まれる各種物質の種類に依存する。換言すれば、同定対象の物質の種類が同一又は類似していれば、同一のMSn-1ピーク順位付け情報及び同定確率推定モデル情報を用いることができる。例えば生体試料中のタンパク質を同定するといった目的に対しては、同定済みの各種タンパク質を含む試料について得られたMSn-1ピーク等に基づいてMSn-1ピーク順位付け情報及び同定確率推定モデル情報を取得しておけばよい。
【0021】
含有物質が未知である試料から得られた或る分画試料に対してMSn-1分析を行うことで求まったMSn-1ピークについてMSn分析を実行する前に同定確率を知りたい場合、ピーク順位算出ステップでは、既に求まっているMSn-1ピーク順位付け情報を利用して目的とするMSn-1ピークの順位を算出する。なお、MSn-1ピーク順位付け情報算出元のデータはあくまでも特定のMSn-1ピークのデータであり順位は整数(離散値)である。これに対し任意のMSn-1ピークの同定確率をより適切に求めるには順位は離散値ではなく連続値であるほうがよいから、例えば補間などの方法により、各MSn-1ピークに対する近似的な順位を算出するとよい。同定確率推定ステップでは、同定確率推定モデル情報より求まる同定確率推定モデルを参照して、上記のように算出されたMSn-1ピークの順位から該MSn-1ピークの同定確率推定値を算出する。これにより、実際に或るMSn-1ピークに対するMSn分析を行うことなく、そのMSn分析を実行した結果に基づく同定可否の確率を定量的に推定することができる。
【0022】
第1発明に係る質量分析データ処理方法を利用して物質を同定する場合に、上記同定確率推定モデル構築ステップで得られる情報を予め保持してさえいれば、その情報作成時に用いられた試料と類似した試料に含まれる物質を同定する際に、保持されている上記情報を利用して各MSn-1ピークの同定確率を定量的に評価することが可能である。
【0023】
即ち、上記課題を解決するためになされた第2発明に係る質量分析データ処理装置は、第1発明に係る質量分析データ処理方法を利用して物質を同定する質量分析データ処理装置であって、
a)前記順位付け情報及び前記同定確率推定モデルを表現する同定確率推定モデル情報が記憶されている同定確率推定情報記憶手段と、
b)同定対象である試料から得られた少なくとも1つの分画試料に対するMSn-1分析により求まるMSn-1ピークについて、前記同定確率推定情報記憶手段に記憶されている順位付け情報を利用してその順位を算出するピーク順位算出手段と、
c)前記同定確率推定情報記憶手段に記憶されている同定確率推定モデル情報より求まる同定確率推定モデルを参照して、前記ピーク順位算出手段で算出されたMSn-1ピークの順位から該MSn-1ピークの同定確率推定値を算出する同定確率推定手段と、
を備えることを特徴としている。
【0024】
もちろん、第2発明に係る質量分析データ処理装置は、所定の試料から得られた複数の分画試料に対するMSn-1分析により求まるMSn-1ピークの情報、及び該各MSn-1ピークをプリカーサイオンとして実行されたMSn分析の結果に基づく物質同定の結果を利用して、MSn-1ピークの順位を決めるための順位付け情報を求めるとともに、MSn-1ピークを前記順位に従ってプリカーサイオンとして選択してMSn分析及び同定を実行していったときのMSnピークの累積数と同定成功数との関係に基づく同定確率推定モデルを求め、前記順位付け情報及び前記同定確率推定モデルを表現する同定確率推定モデル情報を前記同定確率推定情報記憶手段に記憶させる同定確率推定モデル構築手段をさらに備える構成としてもよい。
【0025】
また、第1発明に係る質量分析データ処理方法及び第2発明に係る質量分析データ処理装置において算出される同定確率推定値は、質量分析装置において物質同定のためのMSn分析を実行する際の該装置の制御に利用可能である。同定確率推定値を利用した制御には様々な態様が考えられる。
【0026】
即ち、第2発明に係る質量分析データ処理装置を含む質量分析装置の一態様は、
d)同定対象である試料から得られた分画試料に対するMSn分析前に、該分画試料に対するMSn-1ピークをプリカーサイオンとしたMSn分析及び同定を行ったとしたときの同定確率推定値を前記同定確率推定手段により取得し、その結果に基づいて該MSn-1ピークをプリカーサイオンとしたMSn分析を実行するか否かを決定するプリカーサイオン選択手段と、
e)前記プリカーサイオン選択手段によりMSn分析を実行すると決定されたMSn-1ピークをプリカーサイオンに設定してMSn分析を実行する分析制御手段と、
を備えることを特徴としている。
【0027】
具体的には、例えば、プリカーサイオン選択手段は複数のMSn-1ピークの同定確率推定値を比較し、同定確率推定値が高いものから順にMSn-1ピークを選択し、プリカーサイオンに設定してMSn分析を実行するようにするとよい。これにより、比較的少ない回数のMSn分析の実行によって、より多数の物質を同定することができる。この場合、全てのMSn-1ピークに対するMSn分析を実行せずに、所定回数のMSn分析を実行した時点で当該試料に対する同定処理を打ち切る、或いは、同定された物質の数が所定個数に達したり同定された物質の数の増加の程度が大きく減じたりした場合に当該試料に対する同定処理を打ち切る、といった制御を行ってもよい。また、プリカーサイオン選択手段は同定確率推定値が所定値以上であるMS1ピークのみを選択し、該ピークをプリカーサイオンに設定してMSn分析を実行するようにしてもよい。
【発明の効果】
【0028】
第1発明に係る質量分析データ処理方法及び第2発明に係る質量分析データ処理装置によれば、MSn-1ピークに対するMSn分析を行って得られる結果を用いて物質同定を行うときに同定が可能である確率を、実際にそのMSn分析や同定処理を行うことなく定量的に推定することが可能となる。そのため、例えば、複数のMSnピークの中のいずれのMSnピークをプリカーサイオンとして選択すれば同定に有利であるのかを、定量的に判断することができる。それ故に、例えば或るMSn-1ピークの強度が高い場合であっても該MSn-1ピークの同定確率が低い場合には、該MSn-1ピークに対するMSn分析を回避する、或いはより同定確率の高いMSn-1ピークに対するMSn分析を優先的に行う、といった質量分析装置の制御が可能となり、従来に比べて短時間でより多くの物質を同定することができるようになる。
【図面の簡単な説明】
【0029】
【図1】本発明に係る質量分析データ処理方法を実施する質量分析システムの概略構成図。
【図2】本発明に係る質量分析データ処理方法における同定確率推定モデル構築の際の処理フローチャート。
【図3】本発明に係る質量分析データ処理方法において同定確率推定モデルに基づく同定確率推定処理のフローチャート。
【図4】ノイズレベル評価処理を説明するためのMS1プロファイル(マススペクトル)の一例を示す図。
【図5】2つのMS1プロファイルに対するノイズレベル算出結果例を示す図。
【図6】質量電荷比m/zとSN比とに対するMS1ピークの分布状況を示す図。
【図7】MS1ピークの特徴量dの算出方法の説明図。
【図8】同定に成功したMS1ピークの累積値の求め方の説明図。
【図9】同定に成功したMS1ピークの累積値の変化と該変化に対するフィッティング結果を示す図。
【図10】同定確率推定モデルのパラメータσの相違によるフィッティング関数の相違を示す図。
【図11】MS1ピーク順位付けパラメータであるθと同定確率推定モデルのパラメータσとの関係の一例を示す図。
【図12】近似順位付けのための連続関数n(d)及びそれを平滑化した関数*n(d)を示す図。
【図13】最適化用MS1ピークに対する同定確率の推定値を示す図。
【図14】任意の質量電荷比m/z及びSN比に対する同定確率の推定値を示す図。
【発明を実施するための形態】
【0030】
以下、本発明に係る質量分析データ処理方法及び装置、並びに該方法を利用する質量分析装置の一実施例について、添付の図面を参照して詳細に説明する。
【0031】
本発明に係る質量分析データ処理方法は、目的試料からLC等により分離・分画されることで得られた多数の分画試料に対してそれぞれMSn-1分析を実行して得られるMSn-1スペクトル上に現れる1又は複数のピークをプリカーサイオンに選出して該プリカーサイオンに対するMSn分析を行い、その結果得られるMSnスペクトルを利用して目的試料に含まれる各種物質を同定する質量分析システムにおいて、実際にMSn分析を実行する前に、MSn-1スペクトル上のMS1ピークについて、該ピークをプリカーサイオンに選出したときに物質の同定が成功する確率を定量的に推定する同定確率推定処理に特徴を有する。
【0032】
まず、本発明に特徴的である同定確率推定処理方法を具体例を挙げて説明する。この例による方法では、予備的に、つまり実際の同定確率推定に先立って、目的試料と同種の同定確率推定モデル構築用試料(以下、単に「モデル構築用試料」という)から得られる多数の分画試料に対するMS1スペクトル上で観測されるMS1ピークをプリカーサイオンとしてそれぞれMS2分析を行い、そのMS2分析結果に基づいて同定を試みる。そして、その予備実験の結果(同定に成功/失敗)から、MS1ピークを順位付けするためのパラメータの最適値と同定確率推定モデルのパラメータの最適値とを求めて記憶しておく。目的試料から得られる分画試料に対するMS1スペクトルが取得されたときには、記憶されているMS1ピーク順位付けパラメータ及び同定確率推定モデルパラメータを参照して、任意のMS1ピークをプリカーサイオンとしたMS2分析に対する同定確率の値を事前に推定する。したがって、この同定確率推定処理方法は、与えられた同定確率推定モデル構築用のMS1スペクトルデータに基づいて同定確率推定モデルを構築し、上記のようなパラメータを算出しておく事前の処理(同定確率推定モデル構築処理)と、与えられたMS1スペクトルデータに基づいて、特定のMS1ピークに対する同定確率を推定し該推定結果を出力する推定処理と、に大別される。
【0033】
図2は同定確率推定モデル構築処理の手順を示すフローチャートである。図2に従って処理手順を説明する。
【0034】
[ステップS11]同定確率推定モデル構築用データの収集
まず、モデル構築用試料から得られた多数の分画試料に対するMS1分析が実施され、MS1分析データが収集される。さらに、このMS1分析データに基づいて抽出される各MS1ピークに対してMS2分析が実施されてMS2分析データが収集され、そのMS2分析データを用いた同定処理が試みられる。上述したように保持時間に応じて分画された各分画試料に含まれる物質を同定する場合には、各分画試料のMS1スペクトルを保持時間順に並べて3次元的なMS1スペクトルを求め、該スペクトルに対して質量電荷比m/z−保持時間の2次元平面上でピーク検出を行ってMS1ピークを抽出し、該ピークの質量電荷比をプリカーサイオンとしてMS2分析を行いMS2スペクトルを取得する。そして、そのMS2スペクトルに基づいて所定の同定アルゴリズム(例えばデノボシーケンスやMS/MSイオンサーチなど)により物質の同定を試みる。この同定はMS1ピーク毎に行われるから、3次元MS1スペクトルから抽出されるMS1ピーク毎に同定の成功又は失敗(同定できず)が決まる。
【0035】
[ステップS12]MS1スペクトルのノイズレベルの評価
後述する同定確率はMS1スペクトルのノイズレベルの影響を受ける。そこで、モデル構築用試料に対するMS1スペクトルのノイズレベルを評価する。本例では、次のステップS121〜S123の手順により、 MS1分析により得られた生データ(加工されていないデータ)であるMS1ロー(raw)プロファイル(以下、単に「ロープロファイル」という)からノイズレベルを分画試料毎に、つまりMS1スペクトル毎に評価する。以下の説明では、離散化されたロープロファイルの信号強度をRmとおく。ただし、m=0、1、…は評価対象である試料のロープロファイルのサンプリング点の質量電荷比の順序を示す番号である。ロープロファイルに含まれるサンプリング点全体の集合はMで表すものとする。
【0036】
[ステップS121]ピーク部分及びピーク近傍の情報の除外
ロープロファイルの最大ピーク強度をP(max)とおく。つまり、次の(1)式のようにおく。
(max)=max Rm …(1)
(ただしm∈M)
ここで、ピーク近傍の判定用閾値μ(0<μ<1)を適切に選び、強度がP(max)のμ倍以上であるサンプリング点をピークの一部分であるとみなす。そして、ピーク部分に含まれるサンプリング点、つまりμP(max)以上であるサンプリング点からの距離がw以内であるサンプリング点、を除いたサンプリング点の集合M’(w,μ)を求める。図4はMS1スペクトルのロープロファイルに対してサンプリング点集合M’(w,μ)を求めた例であり、(b)は(a)のm/z 1070-m/z 1075の範囲の拡大図である。
【0037】
[ステップS122]局所的な変動量の算定
次に、ピーク部分及びピーク近傍を除外したサンプリング点集合M’(w,μ)において、通過帯域が半値幅wであるフィルタによりロープロファイルを平滑化した、平滑化プロファイル*m(w,μ)を求める。つまり、*m(w,μ)は次の(2)式で求まる。
*m(w,μ)={1/(2w+1)}ΣRm' …(2)
(ただしm∈M’(w,μ))
ここで、Σはm’=−wからwまでの総和である。この平滑化プロファイル*m(w,μ)と元のロープロファイルとの差を局所的な変動量と定義し、ΔRm(w,μ)で表す。つまり、ΔRm(w,μ)は次の(3)式で求まる。
ΔRm(w,μ)=Rm*m(w,μ) …(3)
【0038】
[ステップS123]局所的な変動量に基づくノイズレベルの算定
ここでは、上記局所的な変動量ΔRm(w,μ)の2乗平均のc倍をノイズレベルN(Rm;w,μ)と定義する。cはノイズレベルを定義するための適当な定数である。つまり、N(Rm;w,μ)の定義式は次の(4)式である。
N(Rm;w,μ) =c・√{ΣΔRm(w,μ)2'} …(4)
なお、ノイズレベルの定義は上記説明のものに限定されず、MS1スペクトルのノイズレベルを適切に定義できる方法でありさえすればよい。
実際の2つのMS1ロープロファイルに基づいて上記方法によりノイズレベルN(Rm;w,μ)を算定した結果の例を図5に示す。
【0039】
[ステップS13]同定成功MS1ピークの抽出
図6はモデル構築用試料由来の全てのMS1ピークの質量電荷比m/zとSN比とをプロットした結果の例である。ここで、SN比はピーク強度とステップS12で求めたノイズレベルとの比である。図6に●印で示したプロット点はMS1ピークを示している。また、●印に□印を重ねて示したプロット点は、そのMS1ピークをプリカーサイオンとしたMS2分析によって物質同定が可能であった、即ち、同定に成功したMS1ピークを示している。図6を見ると、この例では、SN比が大きいほど同定に成功するMS1ピークが多い傾向があり、さらに、同じSN比であっても質量電荷比m/zが小さいほうが同定に成功する傾向が高いことも分かる。即ち、本例では、同定に成功するMS1ピークは質量電荷比m/zとSN比とを座標軸とする平面上で左上部の領域に多く存在していることが分かる。
【0040】
[ステップS14]MS1ピークの順位付け
次に、上記のような質量電荷比m/z及びSN比を2軸とする平面上における全MS1ピークの分布結果を利用して、各MS1ピークを順位付けする。ここでは、MS1ピークを順位付けするために、各MS1ピークを特徴付ける特徴量(スカラー値)を以下のように定義する。
即ち、図7に示すように、質量電荷比m/z、SN比をそれぞれ、x軸、y軸に割り当てる。その上で、角度θ(0°≦θ≦180°)を或る値に固定し、原点を始点とする法線ベクトル(cosθ,sinθ)に直交する直線群xcosθ+ysinθ=dを考える。つまり、角度θが固定されていれば、全ての直線xcosθ+ysinθ=dは平行である。このとき、図7中に示すように、dは原点と直線xcosθ+ysinθ=dとの(符号付き)距離となり、x−y平面上で直線xcosθ+ysinθ=dが上方に平行移動するほどdは大きくなる。なお、最適な角度θの選び方については後述する。上記のように直線群を定義した上で、各MS1ピークのプロット点を通る直線と原点との間の距離dを各MS1ピークの特徴量とする。そして、MS1ピークをこの特徴量、つまり距離dの大きい順に並べることにより、MS1ピークを順位付けする。
【0041】
[ステップS15]同定成功MS1ピークの累積による同定成功数プロファイル作成
上記順位付けされた順番にMS1ピークを1つずつプリカーサイオンに選出してそれぞれMS2分析を実行した場合に、そのうちの何個のMS1ピークにおいて同定に成功するかを考える。例えば、図8に示した例では、直線Pを上から下方に移動させながら、順位#5までの5個のMS1ピークに対してMS2分析を行うと、そのうちの3個のMS1ピークで同定に成功する。このように順位順にMS1ピークを選出してMS2分析を行い同定を試みたときに、同定に成功したMS1ピークの個数の累積値を求めると、図9に実線で示すような階段状のプロファイルが得られる。
【0042】
[ステップS16]同定確率推定モデルとパラメータの算出
続いて、上記階段状のプロファイルに対し解析的な関数を用いてフィッティングを行い、MS1ピークの累積数と同定成功累積数との滑らかなカーブ状の関係を求める。ここでは、フィッティング関数の形状として、次の(5)式の双曲線関数を用いた。
(ident)tanh(n/N(all)σ) …(5)
ただし、nは或る順位よりも上位順位であるMS1ピーク数であり、N(all)及びN(ident)はそれぞれMS1ピークの総数及び同定に成功したMS1ピークの総数である。また、σはフィッティング関数の立ち上がりの速さを定めるパラメータであり、先に求めた階段状のプロファイルにフィットするように算出する。図9中に階段状のプロファイルにフィットさせたカーブを一点鎖線で示している。このカーブが同定確率推定モデルであり、σはこのモデルを規定するパラメータである。
【0043】
[ステップS17]同定確率推定モデルの最適化
ステップS16で求めた同定確率推定モデルには、角度θの選び方に任意性が残っている。例えば、θ=90°である場合は、質量電荷比m/zに依存せず、単にSN比が大きい順に順位付けすることに相当する。少ないMS2実行回数でできるだけ多くの物質を同定するという観点においては、同定に成功するMS1ピークが順位上位に集中するほうが優れたMS2分析順序であるといえる。そこで、(5)式で示したフィッティング関数の立ち上がりが早くなるように、即ちσが小さくなるように角度θを選ぶことが望ましい。図10はσの相違によるフィッティングカーブの相違の例を示した図である。実際には、図7におけるθを変化させながら、つまりは直線xcosθ+ysinθ=dの傾きを変化させながら、(5)式におけるσを求めることにより、σが最小となるθを求めることができる。図11は図8に示した例に基づくθとσとの関係を示す図である。この例ではθ=157°付近でσが最小であり、θ=157°における同定確率推定モデルが最適であるといえる。
【0044】
以上のようにして、同定確率推定モデルを定めるパラメータσとMS1ピークを順位付けするためのパラメータθを算出することができるから、同定確率を推定するためにはこれらのパラメータを記憶しておけばよい(ステップS18)。
【0045】
次に、上記のようなパラメータが予め用意されている状況の下で、任意の目的試料から得られた分画試料をMS1分析して求まるMS1スペクトルに基づいて同定確率を推定する際の処理手順を図3に示すフローチャートに従って説明する。
【0046】
[ステップS21]目的試料由来のMS1分析データの収集
まず、目的試料から得られた多数の分画試料に対するMS1分析データが収集される。そして、各分画試料のMS1スペクトルを保持時間順に並べて3次元的なMS1スペクトルを求め、該スペクトルに対して質量電荷比m/z−保持時間の2次元平面上でピーク検出を行ってMS1ピークを抽出する。
【0047】
[ステップS22]MS1スペクトルのノイズレベルの評価
次に、上記ステップS12と同様にして、各分画試料に対するMS1スペクトルのノイズレベルをそれぞれ評価する。
【0048】
[ステップS23]MS1ピークの近似順位算出
上述した(5)式に基づくMS1ピークの順位付けは、最適なθ及びσを求めるために用いたMS1ピーク(以下、「最適化用MS1ピーク」という)に基づいて引かれた直線で定まるdによる順位値が用いられており、これをそれ以外のMS1ピークにそのまま適用とすることはできない。そこで、任意の質量電荷比m/z及びSN比を有するMS1ピークに対する適切な順位付けを行うために、図6又は図8において任意の質量電荷比m/z及びSN比に対応するプロット点を通る直線xcosθ+ysinθ=dと原点との距離dを用いる連続関数n(d)を導入する。この連続関数n(d)では、例えば、最適化用MS1ピークでのn(d)の値が(5)式に基づく順位に等しいものとし、それ以外の点は補間によって求めるようにすればよい。また、実用的には、近似順位がより滑らかな値になるように、n(d)を平滑化した関数*n(d)を用いることが望ましい。図12は近似順位付けのための連続関数n(d)とそれを平滑化した関数*n(d)の一例を示す図である。
【0049】
ステップS21で抽出された各MS1ピークの近似順位値を求めるために、図8に示したような質量電荷比m/zとSN比とを2軸とする2次元平面上にMS1ピークを位置付ける。パラメータσとともにMS1ピーク順位付けパラメータθも記憶されているから、これにより図8上で順位付けのために描かれる直線Pの傾きも定まる。こうして得られる直線Pが各MS1ピークのプロット点を通過するように該直線を平行移動させ、その直線と原点との最短距離から各MS1ピークに対する距離dを算出する。そして、求めた距離dを図12に示したような関数n(d)又は*n(d)に適用することにより、各MS1ピークの近似順位値を算出する。
【0050】
[ステップS24]MS1ピークの同定確率推定
(5)式のフィッティング関数の傾きが1であるということは100%、その傾きが0.5であるということは50%の確率で以て同定に成功することを示している。したがって、フィッティング関数の微分である次の(6)式により、最適化用MS1ピークに対し、その順位値nから同定に成功する確率を推定することができる。
(N(ident)/N(all)σ)sech2(n/N(all)σ) …(6)
図13は図9に上記微分関数で示される推定確率を重ねて示したものであり、右目盛りが同定成功の推定確率である。
【0051】
任意の質量電荷比m/z及びSN比を示すMS1ピークの同定確率は、上述したn(d)又は*n(d)による求まる近似順位値を用いて、(7)式又は(8)式により推定することができる。
(N(ident)/N(all)σ)sech2{n(d)/N(all)σ} …(7)
(N(ident)/N(all)σ)sech2*n(d)/N(all)σ} …(8)
即ち、上述したステップS11〜S18の処理によって既に同定確率推定モデルは構築されているので、同定確率を推定したいMS1ピークの近似順位値さえ求まれば、このMS1ピークの同定確率は簡単な演算で推定可能である。図14は上記例における任意の質量電荷比m/z及びSN比を示すMS1ピークについての距離dと同定確率推定値との関係を示す図であり、図中、n(d)は(7)式に基づく場合、*n(d)は(8)式に基づく場合である。
【0052】
以上のようにして、本発明に係る質量分析データ処理方法によれば、同定確率推定モデルのパラメータとMS1ピーク順位付けのパラメータとを予め求めておくことにより、簡易な演算によって、任意のMS1ピークをプリカーサイオンとしたMS2分析結果を利用した同定の成功確率を、MS2分析を実行することなく定量的に推定することができる。このように推定される同定確率を具体的にどのように利用可能であるのかについては、後述する装置の動作説明の中で述べる。
【0053】
次に、上記データ処理方法を実施するデータ処理装置を用いた質量分析装置の一実施例を図1により説明する。図1は本実施例による質量分析装置の概略構成図である。
図1において、分析部1は、液体試料中の各種物質を保持時間に応じて分離するLC部11と、LC部11で分離された物質を含む試料を分取・分画してそれぞれ異なる分画試料を調製する分取分画部12と、複数の分画試料のうちの1つを選択して該分画試料に対する質量分析を実行するMS部13と、を含む。MS部13は、MALDIイオン源、イオントラップ、飛行時間型質量分析計を含むMALDI−IT−TOFMSであり、MS1分析だけでなく、イオン選択とイオン解離とを繰り返すMSn分析が可能となっている。ただし、MS1分析及びMS2分析のみを実行すればよい場合(nが3以上のMSn分析が不要である場合)には、三連四重極型質量分析計のような、より簡単な構成の質量分析装置を利用することができる。
【0054】
制御部2は上記分析部1の動作を制御する。また、分析部1のMS部13で得られたデータはデータ処理部3に入力され、データ処理部3で処理されて例えばその結果が表示部4に出力される。データ処理部3は機能ブロックとして、MS1分析データやMSn分析データを収集するスペクトルデータ収集部31、上記ステップS12〜S18に対応した処理を実行する同定確率推定モデル構築部32、同定確率推定モデル構築部32により求められたパラメータを記憶しておく同定確率推定パラメータ記憶部33、上記ステップS22〜S23に対応した処理を実行するMS1ピーク近似順位算出部34、上記ステップS24に対応した処理を実行する同定確率推定値算出部35、及び同定処理を実行する同定処理部36を含む。なお、データ処理部3や制御部2は、例えばパーソナルコンピュータをハードウエア資源とし、該パーソナルコンピュータにインストールされた専用の制御・処理ソフトウエアを実行することにより、上記のような各機能ブロックが具現化される構成とすることができる。
【0055】
目的試料に対する網羅的同定を実行する際に、データ処理部3において同定確率推定値算出部35は上述したように任意のMS1ピークに対する同定確率推定値を算出して出力する。例えば、制御部2が各分画試料に対して観測されるMS1ピークを自動的にプリカーサイオンとして選出してMS2分析を実行する制御を行う場合には、MS1ピークに対する同定確率推定値が得られたならば制御部2は閾値に基づいてその推定値を判定してMS2分析実行の適否を判断する。それにより、物質同定の確率が低いMS1ピークに対するMS2分析を実行せずに済み、効率的に多くの物質を同定することが可能である。また、1つずつMS1ピークの同定確率推定値を判定するのではなく、MS2分析実行前に当該目的試料に対して得られた全てのMS1ピークの同定確率推定値を算出し、同定確率推定値の高い順に所定個数のMS1ピークを抽出し、抽出されたMS1ピークが存在する分画試料を順次選択してMS2分析を実行するようにしてもよい。
【0056】
もちろん、制御部2が同定確率推定値に基づいて自動的にMS1ピークを選択するのではなく、表示部4に表示された各MS1ピークの同定確率推定値をユーザ(分析担当者)が判断して該MS1ピークをプリカーサイオンとしたMS2分析を実行するか否かを指示するようにしてもよい。即ち、手動操作により同定確率推定値に基づく分析制御を行ってもよい。
【0057】
なお、上記実施例では説明を簡単にするためにMS1ピークの同定確率を推定する場合について説明したが、これを拡張してMSn-1ピークをプリカーサイオンとしたMSn分析を実行する前に、そのMSn-1ピーク毎の同定確率を推定するようにしてもよいことは明らかである。
【0058】
また、上記実施例は本発明の一実施例であり、本発明の趣旨の範囲で適宜変形、修正、追加を行っても本願特許請求の範囲に包含されることは当然である。
【符号の説明】
【0059】
1…分析部
11…LC部
12…分取分画部
13…MS部
2…制御部
3…データ処理部
31…スペクトルデータ収集部
32…同定確率推定モデル構築部
33…同定確率推定パラメータ記憶部
34…MS1ピーク近似順位算出部
35…同定確率推定値算出部
36…同定処理部
4…表示部

【特許請求の範囲】
【請求項1】
各種物質が含まれる試料を分離用パラメータに従って分離し分画することで得られた複数の分画試料に対しMSn分析(nは2以上の整数)をそれぞれ実行することで得られたMSnスペクトルに基づいて、各分画試料に含まれる物質を同定する質量分析データ処理方法であって、
a)所定の試料から得られた複数の分画試料に対するMSn-1分析により求まるMSn-1ピークの情報、及び該各MSn-1ピークをプリカーサイオンとして実行されたMSn分析の結果に基づく物質同定の結果を利用して、MSn-1ピークの順位を決めるための順位付け情報を求めるとともに、同種試料に由来する複数のMSn-1ピークを前記順位に従ってプリカーサイオンとして選択してMSn分析及び同定を実行していったときのMSnピークの累積数と同定成功数との関係に基づく同定確率推定モデルを求め、前記順位付け情報及び前記同定確率推定モデルを表現する同定確率推定モデル情報を記憶する同定確率推定モデル構築ステップと、
b)同定対象である試料から得られた少なくとも1つの分画試料に対するMSn-1分析により求まるMSn-1ピークについて、前記順位付け情報を利用してその順位を算出するピーク順位算出ステップと、
c)前記同定確率推定モデル情報より求まる同定確率推定モデルを参照して、前記ピーク順位算出ステップで算出されたMSn-1ピークの順位から該MSn-1ピークの同定確率推定値を算出する同定確率推定ステップと、
を有し、同定対象である試料から得られた分画試料に対するMSn分析前に、該分画試料に対するMSn-1ピークをプリカーサイオンとしたMSn分析及び同定を行ったとしたときの同定確率推定値を得られるようにしたことを特徴とする質量分析データ処理方法。
【請求項2】
請求項1に記載の質量分析データ処理方法であって、
前記同定確率推定モデル構築ステップは、質量電荷比とSN比とに基づくMSn-1ピークの分布を調べ、同定に成功したMSn-1ピークが高い密度で分布している領域に存在するMSn-1ピークに対する順位が高くなるように順位付けを行うことを特徴とする質量分析データ処理方法。
【請求項3】
請求項1又は2に記載の質量分析データ処理方法を利用して物質を同定する質量分析データ処理装置であって、
a)前記順位付け情報及び前記同定確率推定モデルを表現する同定確率推定モデル情報が記憶されている同定確率推定情報記憶手段と、
b)同定対象である試料から得られた少なくとも1つの分画試料に対するMSn-1分析により求まるMSn-1ピークについて、前記同定確率推定情報記憶手段に記憶されている順位付け情報を利用してその順位を算出するピーク順位算出手段と、
c)前記同定確率推定情報記憶手段に記憶されている同定確率推定モデル情報より求まる同定確率推定モデルを参照して、前記ピーク順位算出手段で算出されたMSn-1ピークの順位から該MSn-1ピークの同定確率推定値を算出する同定確率推定手段と、
を備えることを特徴とする質量分析データ処理装置。
【請求項4】
請求項3に記載の質量分析データ処理装置を含む質量分析装置であって、
d)同定対象である試料から得られた分画試料に対するMSn分析前に、該分画試料に対するMSn-1ピークをプリカーサイオンとしたMSn分析及び同定を行ったとしたときの同定確率推定値を前記同定確率推定手段により取得し、その結果に基づいて該MSn-1ピークをプリカーサイオンとしたMSn分析を実行するか否かを決定するプリカーサイオン選択手段と、
e)前記プリカーサイオン選択手段によりMSn分析を実行すると決定されたMSn-1ピークをプリカーサイオンに設定してMSn分析を実行する分析制御手段と、
を備えることを特徴とする質量分析装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate