説明

質量分析を用いたペプチド同定方法

【課題】ペプチドの開裂に伴い生じる複数種のフラグメントイオン強度の予測値を高い精度で且つ効率良く求める。
【解決手段】フラグメントイオンを構成するアミノ酸残基のそれぞれについて原子数にスケーリング因子を乗じた有効原子数を考え、各アミノ酸残基の有効原子数の和をフラグメントイオンの有効原子数とし(S1)、この有効原子数を所定の対数式に代入してプロトン親和力を求める(S2)。アミノ酸配列の特異性などに応じてスケーリング因子を変えることで、これにより、たとえアミノ酸残基の構成が同じでもプロトン親和力が変化する場合がある。同じフラグメント化反応で生じる複数のフラグメントイオンのプロトン親和力に応じて、活性化エネルギーから計算されるフラグメントイオン総量を分配し、より精度の高いフラグメントイオン強度を求める。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ペプチド混合物を含む試料を質量分析し、これにより得られた質量スペクトルデータを用いて各ペプチドのアミノ酸配列を同定するための方法に関する。
【背景技術】
【0002】
近年、ポストゲノム研究としてタンパク質の構造や機能の解析が急速に進められている。このようなタンパク質の構造・機能解析手法(プロテオーム解析)の一つとして、質量分析装置を用いたタンパク質の発現解析や一次構造解析が広く行われるようになってきており、四重極型イオントラップや衝突誘起分解(CID)などによって特定のピークの捕捉と開裂を行う、いわゆるMS分析(nは2以上の整数)が威力を発揮している。一般にMS(=MS/MS)分析では、まず、分析対象物から特定の質量電荷比(m/z)を有するイオンをプリカーサイオンとして選別し、該プリカーサイオンをCIDによって開裂させる。その後、開裂によって生成したイオン(プロダクトイオン)を質量分析することによって、目的とするイオンの質量や化学構造についての情報を得ることができる。
【0003】
上記のようなMS分析によってタンパク質のアミノ酸配列を決定する場合には、まず、タンパク質を適当な酵素で消化してペプチド断片の混合物としてから、該ペプチド混合物を質量分析する。このとき、各ペプチドを構成する元素には質量の異なる安定同位体が存在するため、同一のアミノ酸配列から成るペプチドであっても、その同位体組成の違いによって質量電荷比の異なる複数のピークを生じる。該複数のピークは、天然存在比が最大の同位体のみで構成されたイオン(主イオン)のピークと、それ以外の同位体を含むイオン(同位体イオン)のピークから成り、これらは1Daから数Da間隔で並んだ複数本のピークから成るピーク群を形成する。
【0004】
続いて、上記のようなペプチド混合物の質量スペクトルデータの中から、単一のペプチドに由来する一組の同位体ピーク群をプリカーサイオンとして選択し、該プリカーサイオンを開裂させて得られたイオン(プロダクトイオン)の質量分析(MS分析)を行う。
【0005】
以上のようにして得られたプロダクトイオンのスペクトルパターンや、上記プリカーサイオンのスペクトルパターンをデータベース検索に供することによって、被検ペプチドのアミノ酸配列を決定することができる。このように質量分析により得られた質量スペクトルデータに基づいてペプチドを同定するための標準的なソフトウエアが従来より利用されている。例えば代表的なプロテオーム解析用データベース検索エンジンとして、マトリックスサイエンス社が提供しているマスコット(MASCOT)がよく知られている。
【0006】
MASCOTを用いた解析では、まず得られた質量スペクトルに出現しているフラグメントイオンの質量をキーとして、データベースに登録されているペプチドの中から質量がマッチするペプチドを検索し、検索により得られた複数の候補ペプチド名をマッチ度順にランク付けしてリストアップする。分析者はこのリストを参考にしてペプチドを推定する。しかしながら、実際には候補ペプチドのリスト上で最高ランクのものが正解の物質でないことがよくあり、上記ソフトウエアによる検索は必ずしも信頼性が高いものではない。その理由として、上記ソフトウエアではフラグメントイオンの質量のマッチングは考慮されているものの、フラグメントイオンのピーク強度とのマッチングは全く又は殆ど考慮されていないことに拠るものと考えられる。
【0007】
また、MASCOTとは別にサーモ・エレクトロン社が提供するシークエスト(SEQUEST)というデータベース検索エンジンも利用されている。このソフトウエアでは、フラグメントイオン質量とそのピーク強度との両方のマッチングが考慮されている。しかしながら、基本的にはMASCOTと同様に、データベースとしては質量に関するものしか備えておらず、強度に関しては非常に簡易的な強度予測(具体的にはb/yイオン強度は全て50、aイオンや脱水・脱塩イオン強度は10)の下で候補ペプチドのフラグメントイオン強度を与えて測定により得られた質量スペクトルデータとのマッチングを評価しているだけである。したがって、強度マッチングに関してはあまり信頼性を期待できない。
【0008】
前述のような従来の問題に鑑み、本発明者は、候補ペプチドとして与えられたアミノ酸配列に対して質量スペクトルパターンを予測し、実測のフラグメントイオン強度との相関を計算することで、候補ペプチドの信頼性を評価してペプチドを同定するという手法を提案している(非特許文献1など参照)。こうした手法では、質量スペクトルパターンを予測するためにペプチドのフラグメント強度を高い精度で予測することが重要である。従来のペプチドのフラグメント強度の基本的な予測方法を説明する。
【0009】
ペプチド分子イオンの開裂の過程は単分子反応と呼ばれる化学反応として知られており、その反応速度は、或る温度での化学反応の予測式であるアレニウス(Arrhenius)の式を用いて与えられる。
フラグメントイオン強度∝反応定数=A・exp(−E/R・T) …(1)
ここでEは見かけ上の活性化エネルギー、Rは気体定数、Tは絶対温度、Aは頻度因子と呼ばれる値である。或いは、活性化エネルギーEの代わりにギブスの自由エネルギーΔGを用い、
フラグメントイオン強度∝A・exp(−ΔG/R・T) …(2)
として表すこともできる。ここではAが頻度因子である。(2)式は(1)式の変形であって、この変形によって形式上ではあるが頻度因子が異なってくる。
【0010】
このようなフラグメント化反応は一種類ではなく、ペプチド分子イオンが幾つかのフラグメントイオンに開裂する際には、それぞれの開裂に対応したフラグメント化反応が存在する。その中には、bフラグメントイオンやyフラグメントイオンのように、同じ結合の開裂によるフラグメント化反応で生成されるフラグメントイオンもある。
【0011】
多くのフラグメント化反応では、アミノ酸配列の長さこそ違え、前述したようにyタイプとbタイプのフラグメントイオンが同時に発生することが多い。そして、このフラグメントイオンの総量から個々のフラグメントイオンの強度、即ち、上記例におけるyフラグメントイオンとbフラグメントイオンの強度に分配するために、カイネティック法(Kinetic Method)と呼ばれる分子運動論的な方法で分配する方法が知られている(非特許文献2参照)。
【0012】
一方、最近、数十個のパラメータから成る数学的な算出モデルを仮定し、この仮定の下でフラグメントイオン強度のスペクトルパターンを予測する手段を与えることで、フラグメントイオンの質量と強度とを合わせたマッチングを行う手法が、非特許文献3において提案されている。この文献に記載されている計算モデルにおいては、上記アレニウスの式、及びカイネティック法に形式上合ったモデル式を採用しており、基本的に以下のような手法でペプチドの質量スペクトル強度を求めることができる。
【0013】
基本式は次の(3)式である。
〔フラグメントイオン強度〕=〔関係するフラグメント化反応で生じるフラグメントイオンの総量〕×〔フラグメントイオンへの気相塩基性度に応じた配分〕 …(3)
ここで、気相塩基性度(Gas-phase basicity、以下GBと略す)は気相での塩基の強さを表す指標である。上記(3)式の右辺の2つの項は次のような手順で求める。
【0014】
〔第1ステップ:関係する結合位置でのフラグメント化反応で生じるフラグメントイオンの総量の計算〕
関係するフラグメント化反応で生じるフラグメントイオンの総量は、着目するフラグメント化反応が起こる前提となる分子配置(以下、反応配置という)となる確率に、反応位置から活性化状態へ励起される割合を乗じることにより求める。反応位置となる確率は、フラグメント化反応で開裂するペプチド結合に対する気相塩基性度から求める。一方、反応位置から活性化状態へ励起される割合は、活性化エネルギーをアレニウスの式に適用することで求める。そして、得られた割合の値を上記反応位置となる確率に乗じることで、着目する結合位置で開裂したフラグメントイオン総量を求める。
【0015】
〔第2ステップ:フラグメントイオンへの気相塩基性度に応じた配分の計算〕
着目しているフラグメント化反応で発生した複数のフラグメントイオンの発生量を個別に求めるために、上記第1ステップで求めたフラグメントイオン総量をカイネティック法に基づく手法、即ち、フラグメントイオンの気相塩基性度の大きさに応じて、exp{GB/(R・Teff)}(但し、Teffは有効温度と呼ばれ、衝突ガスの種類や圧力、ペプチド分子の大きさ、分解前のイオンの電荷数等に依存する値)の重みを付与して各フラグメントイオンに配分する。この際、フラグメントイオンの気相塩基性度はアミノ酸残基の気相塩基性度を用い、次の(4)式を仮定して求められるものとしている。
exp{GB/(R・Teff)}=Σexp{GB/(R・Teff)} …(4)
ここでGBは求めようとするフラグメントイオンの気相塩基性度で、iはいま想定しているペプチド分子を構成するアミノ酸残基に付与した連番である。つまり、GBはi番目のアミノ酸残基の気相塩基性度を意味する。以下の説明においても、便宜上、連番はN末端側のアミノ酸残基から順番に付与されているものとする。
【0016】
以上のように非特許文献3に記載の手法では、気相塩基性度や活性化エネルギー、有効温度などの物理的な量を用いてフラグメントイオン強度を計算している。そして、簡単な計算式や評価式で上記物理量を算出できるようにし、さらに、仮定した計算式にこれら物理量を代入することによりペプチド分子の質量スペクトル強度を求めることができるようにしている。この際、これら物理量を求めるための簡単な計算式や評価式に用いるパラメータは予め、幾つかのフラグメントイオン強度の観測事例に矛盾しないようにパラメータフィッティングなどの手法で決められる。また、仮定した計算式の下でできるだけ多くの事例に対応できるように、一つの物理量を二つ以上のパラメータに分割し、パラメータフィッティングによってそれらパラメータ値を決めるようにしている。
【0017】
しかしながら、上述した従来のフラグメントイオン強度の算出方法では、計算式や評価式を立てる上での幾つかの仮定や簡単化に無理があり、それ故に正確性を損ねるおそれがあると思われる。具体的には次のようなことが挙げられる。
〔1〕単一アミノ酸の気相塩基性度の評価値は標準的な文献データと矛盾する。例えば、非特許文献3に基づけば、グリシン、アラニンやイソロイシンの気相塩基性度の評価値はお互いの差が1kJ/mol程度でしかないが、NISTで公開されている標準データ(非特許文献4参照)で比べるとその差がグリシンとアラニンとで15kJ/mol程度、グリシンとイソロイシンとで30kJ/mol程度、と大きく相違する。
〔2〕フラグメントイオンの気相塩基性度のフラグメントイオンの種類への依存性について例を挙げて言えば、同じアミノ酸配列であれば、bタイプのフラグメントイオンとyフラグメントイオンの気相塩基性度は末端のNH2とCOOHの寄与について若干考慮されているのみで、bタイプのフラグメントイオンの持つ特徴的なC末端構造による寄与を十分には反映できていない。
【0018】
〔3〕(4)式はフラグメントイオンを構成するアミノ酸残基の種類の依存性のみを考慮し、アミノ酸残基の配列の依存性についてはあまり考慮していない。即ち、C末端側に隣り合うアミノ酸残基の影響を僅かに考慮しているだけである。しかしながら、これは明らかに一般性に欠けるものである。例えばプロリン(ピロリジン−2−カルボン酸)のように、他のアミノ酸と大きく異なり環の中にアミノ基の窒素を含む形態の分子構造を持つような特徴的な分子結合を示すアミノ酸残基が含まれている場合には、そのアミノ酸残基(例えばプロリン)がアミノ酸配列の中でどこに位置するのかによって、イオン化のエネルギー状態は異なる筈である。したがって、少なくとも上記のような特異なアミノ酸残基を含む場合には、アミノ酸残基の配列によって気相塩基性度も変わると考えるのが妥当である。
【0019】
表1は、プロリン(P)を含む各種ジペプチドについて、プロリンがN末端側に存在する場合(P−Xのアミノ酸配列)とC末端側に存在する場合(X−Pのアミノ酸配列)のプロトン親和力(プロトンを引きつける力)PAをそれぞれ分子動力学法による計算で求めた結果を示している。
【表1】

この表により、同じアミノ酸の組み合わせであってもプロリンの位置によってプロトン親和力が相違することは明らかであり、同様のことは気相塩基性度についても予想される。なお、この表において、P−XとX−PとのPAの値の開きは大きな場合で10〜15kcal/mol即ち40〜60kJ/molほどあり、このような大きな相違は非特許文献3による評価方法では説明できない。また非特許文献3に基づいて、G−P、A−P、I−P、L−PやV−Pなどの気相塩基性度を評価しても、互いの評価値には殆ど差がなく1kJ/mol程度であるが、表1に示すPAの計算結果ではその差が最大13kcal/mol即ち50kJ/molほどにも及ぶ。
【0020】
【非特許文献1】梶原、石田、竹内、「第一原理計算を利用したペプチドフラグメント予測法と定性分析への応用」、第54回質量分析総合討論会、大阪、2006
【非特許文献2】ラスキン(Julia Laskin)ほか1名、「ザ・セオリティカル・ベイシス・オブ・ザ・カイネマティック・メソッド・フロム・ザ・ポイント・オブ・ビュー・オブ・フィニット・ヒート・バス・セオリー(The Theoretical Basis of the Kinematic Method from the Point of the View of Finite heat bath Theory)」、ジャーナル・オブ・フィジックス・ケミストリー・エー(J. Phys. Chem. A)、2000、pp.8829-8837
【非特許文献3】ジャン(Z.Zhang)、「プレディケイション・オブ・ロー−エナジー・コリジョン−インデュースド・ディソシエイション・スペクトラ・オブ・ペプチドズ(Predication of Low-Energy Collision-Induced Dissociation Spectra of Peptides)」、アナリティカル・ケミストリー(Analytical Chemistry)、 Vol.76、No.14、July 15, 2004、 pp.3908-3922
【非特許文献4】「ナショナル・インスティテュート・オブ・スタンダーズ・アンド・テクノロジー(National Institute of Standards and Technology)」、NIST、[平成18年11月15日検索]、インターネット<URL : http://webbook.nist.gov/>
【発明の開示】
【発明が解決しようとする課題】
【0021】
本発明は上記課題を解決するために成されたものであり、その目的とするところは、与えられたペプチドのフラグメントイオン強度を従来よりも正確に予測することにより、質量スペクトルデータに基づくタンパク質やペプチドのアミノ酸配列の決定精度を一層高めることができるペプチド同定方法を提供することである。
【課題を解決するための手段】
【0022】
上記課題を解決するために成された本発明は、MS分析により取得された質量スペクトルデータに基づいて被検試料中のペプチド混合物のアミノ酸配列を決定するペプチド同定方法であって、候補ペプチドのフラグメントイオン強度を予測して質量スペクトルパターンを求め、これと実測の質量スペクトルとの比較により候補ペプチドの妥当性を判断するペプチド同定方法において、ペプチドのフラグメント化反応で生じる複数種のフラグメントイオン毎のフラグメントイオン強度を予測するために、
a)フラグメント化反応で生じるフラグメントイオンの強度を求める強度計算ステップと、
b)該フラグメントイオン強度をフラグメントイオン種類毎に与えられるプロトン親和力又は気相塩基性度に応じて分配する分配ステップと、
とを含み、フラグメントイオン種類毎のプロトン親和力又は気相塩基性度を計算する際に、フラグメントイオンを構成するアミノ酸残基のそれぞれについて実際の原子数にアミノ酸配列の特異性を反映した補正係数を乗じた有効原子数を求め、アミノ酸残基毎の有効原子数の和から求まる該フラグメントイオンの有効原子数を、所定の近似計算式に適用してプロトン親和力又は気相塩基性度を算出するようにしたことを特徴としている。
【0023】
本発明に係るペプチド同定方法の一態様として、前記所定の近似計算式は、有効原子数とプロトン親和力又は気相塩基性度との非線形関係を対数で近似した式とすることができる。
【発明の効果】
【0024】
或るアミノ酸配列のペプチド分子についてのフラグメント化反応で生じるフラグメントイオン種類(例えばyタイプとbタイプのフラグメントイオン)毎のフラグメントイオン強度を算出する際に、各フラグメントイオンのプロトン親和力(又は気相塩基性度)が必要となるが、従来、プロトン親和力や気相塩基性度といった値はかなり大まかにしか与えられなかった。これに対し本発明に係るペプチド同定方法では、プロトン親和力や気相塩基性度を従来よりも高い精度で、且つ実用的な計算量や計算時間で求める方法を提供する。
【0025】
即ち、アミノ酸残基毎に原子数に適当な補正係数を乗じた有効原子数なるものを考え、アミノ酸配列に含まれるアミノ酸残基の種類がたとえ同じであっても、その配列順序によってプロトン親和力や気相塩基性度が影響を受けるような場合には、補正係数をそれぞれに合わせて修正することで有効原子数を変え、それによってプロトン親和力や気相塩基性度も変化するようにした。具体的には、例えば、アミノ酸配列中に塩基性アミノ酸が存在する場合に、該塩基性アミノ酸がN末端に存在するか否かで異なる補正係数を与えるようにするとよい。また、アミノ酸配列中にプロリンが存在する場合に、該プロリンと隣接する他のアミノ酸残基との組み合わせで該プロリンがN末端に存在するか否かで異なる補正係数を与えるようにするとよい。
【0026】
また同一のフラグメント化反応から生じるフラグメントイオンでもそのタイプによって有効原子数を変えることで、プロトン親和力や気相塩基性度の精度をさらに上げることができる。例えばb−yフラグメント化反応ではyフラグメントイオンとbフラグメントイオンとが生成されるが、同じアミノ酸配列であっても後者は前者より原子数が3個少ないためにそれを有効原子数に反映させる。
【0027】
従来、(4)式にあるように、気相塩基性度(プロトン親和力も同様)はフラグメントイオンの種類やアミノ酸残基の配列の影響を考慮していないものであったが、本発明に係るペプチド同定方法によれば、プロトン親和力や気相塩基性度をフラグメントイオンの種類やアミノ酸残基の配列の影響を考慮してより高い精度で求めることができる。それにより、ペプチドのフラグメント化反応で生じるフラグメントイオン種類毎にフラグメントイオン強度を高い精度で計算することができ、それ故に、これに基づいたペプチドの同定の信頼性を向上させることができる。
【0028】
また、上記のような補正係数は特にプロトン親和力や気相塩基性度に対する影響が大きいものについてのみ異なる値を用意しておけばよく、さらに同定処理の際に一々計算するのではなく、予め計算しておいた値をデータベース化して同定処理の際にはデータベース検索により適当な値を得るようにすることができる。したがって、上記のような精度向上を図りながら、コンピュータ上での計算量や計算時間が膨大になることを回避でき、効率的な同定処理を実行してスループットの向上を図ることができる。
【発明を実施するための最良の形態】
【0029】
本発明の一実施形態によるペプチド同定方法の全体の手順をまず説明する。図1は本実施形態のペプチド同定方法における解析処理の概略フローチャートである。実際には、この解析処理は、新規のプロテオーム解析用ソフトウエアをコンピュータ上で動作させることにより実行される。
【0030】
まず分析対象の物質(ペプチド)を例えばイオントラップ飛行時間型質量分析装置で質量分析(MS分析)して質量スペクトルデータを収集する(ステップS1)。次いで、この質量スペクトルデータに対し、既存のプロテオーム解析用データベース検索ソフトウエア(例えばMASCOT)を利用して解析処理を実行する。即ち、質量スペクトルに出現しているフラグメントイオンの質量(厳密には質量電荷比、m/z値)をキーとして、データベースに登録されているペプチドの中から質量がマッチするペプチドを検索する(ステップS2)。そして、検索により得られた複数のペプチド分子をマッチ度順にランク付けしてリストアップする(ステップS3)。従来は、このリストアップされたペプチド分子の中から、分析者自らの判断(例えば最もスコアが高いものを選択する等)により同定を行う必要があったが、本発明に係る解析処理によれば、ステップS4以降の処理によりさらに候補の絞り込み(換言すればより確度の高い判断材料の提供)を行うことができる。
【0031】
即ち、リストアップされた候補ペプチドの中で他と比べて明らかにスコアが高い複数の候補ペプチドを選定し、各候補のそれぞれのアミノ酸配列についてフラグメントイオン強度を計算することで質量スペクトルパターンを予測する。そのために、まずフラグメント化反応で生じるフラグメントイオン総量を計算し(ステップS4)、さらに計算により求まるプロトン親和力(又は気相塩基性度)に応じて同一のフラグメント化反応で生じる複数のフラグメントイオンへの強度の配分を行ってフラグメントイオン強度を求める(ステップS5)。こうして求められたフラグメントイオン強度から各候補ペプチドの質量スペクトルパターンを予測し、実測により得られた質量スペクトルとの相関による強度マッチング評価を行う(ステップS6)。そして、その相関性の評価結果を比べて最も可能性の高い候補ペプチドを選定して例えばモニタの表示画面上等に提示する(ステップS7)。このステップS4〜S7による新規の機能が、従来の標準的なデータベース検索ソフトウエアによる機能と組み合わせられ、これにより従来よりも信頼度の高い同定結果が期待できる。
【0032】
本実施形態によるペプチド同定方法は、特にステップS4及びS5の処理に特徴を有している。これらについて以下に詳しく説明する。
【0033】
(1)フラグメント化反応で生じるフラグメントイオン総量の計算方法
図3はフラグメントイオン強度の計算方法をエネルギー準位で示した原理説明図であり、(a)はプロトン親和力をベースにした、(b)は気相塩基性度をベースにした原理説明図である。表現は異なるが、いずれも(1)式で示したアレニウスの反応式に基づいたフラグメントイオン強度計算式を利用している。
【0034】
CID等のフラグメント化反応で生じるフラグメントイオンの総量は、(1)式に示したアレニウスの反応式を用いて求める。その際、パラメータの1つとして関連フラグメントの活性化エネルギーEを与える必要がある、活性化エネルギーは、ペプチドの初期状態から、着目しているフラグメントイオンの活性化状態、即ち遷移状態までのエネルギーの差として直接計算で求めることも可能であるが、ここでは二つの状態エネルギー差の和で考える。即ち、例えば図3(a)に示すように、初期状態であるプリカーサイオン(XY−H)の状態から開裂するペプチド結合位置(反応分子位置と呼ぶ)までプロトン(H)が移動するための移動エネルギーEと、反応分子位置(X−H−Y)から遷移状態(X−H−Y)に移行するためのエネルギー変化量(以下、活性化エネルギーE’と呼ぶ)とに分けて計算を行う。
【0035】
このようにエネルギーを分割した上で、近似計算として、活性化エネルギーE’は開裂するペプチド結合の両側に存在する2又は3個のアミノ酸配列分子モデルに簡単化して求める。このように簡単化できる理由は、フラグメント化反応がペプチド結合付近の局所的な反応であるとみて構わないためである。また、プロトンの移動エネルギーEに関しては、移動の初めと最後にプロトンの存在するアミノ酸を組み合わせてできるジペプチドに分子モデルを簡単化して求める。このように分子モデルを簡単化できるのは、プロトンはそれ自身近くの原子と強く結合していて、遠くに存在する原子や分子との結合力は無視できるものとし、プロトンとの結合に直接関与しない部分を省略しても構わないためである。
【0036】
上述したように2又は3個のアミノ酸配列分子モデルに簡単化して活性化エネルギーE’やプロトンの移動エネルギーEを求めるためには、予めアミノ酸配列の組み合わせ毎に活性化エネルギーE’、プロトン移動エネルギーEを計算してデータベース化しておき、結合を与えるとそのデータベースから対応したエネルギーE’、Eが導出されるようにしておくとよい。共通アミノ酸の種類はたかだか20種類であるが、例えば5個のアミノ酸配列の組み合わせを考えただけでも、bフラグメントイオン、yフラグメントイオンの2種を考えると、エネルギーの計算対象は205×2=64×105と膨大な数となり、これを全て計算するのには膨大な時間を要する。これに対し、上記のように2又は3個のアミノ酸配列分子モデルに簡単化することで、計算対象の数を大幅に減らすことができ、コンピュータを用いて比較的短時間で計算することができるので、活性化エネルギーE’、プロトン移動エネルギーEを呼び出すためのデータベースを比較的容易に構築することができる。
【0037】
なお、過去の研究により、フラグメント化反応は大別して、モバイルプロトンモデル又はリモートプロトンモデルと呼ばれる2つの反応メカニズムのいずれかで行われることが知られており、リモートプロトンモデルではフラグメント化反応においてプロトンが移動しない場合がある(それらの反応メカニズムの詳細については例えば特願2006−4553号など参照)。この場合にはプロトンの移動エネルギーEの計算は行わずに直接、活性化エネルギーEのみを計算するが、その場合でも計算方法はE’の計算方法に準じればよい。
【0038】
また、フラグメント化反応の過程をプロトン親和力でなく気相塩基性度で考える場合には、図3(a)と対比した図3(b)に示すように、プロトンの移動エネルギーEに代えたプロトンの移動自由エネルギー(ΔG)、E’に代えた反応分子位置(X−H−Y)から遷移状態(X−H−Y)を経て分解するときの活性化自由エネルギー(ΔG’)の和で活性化自由エネルギー(ΔG)を表せばよい。
【0039】
以上のようにして活性化エネルギーE(又は活性化自由エネルギーΔG)が求まれば、他のパラメータ、気体定数R、温度T、頻度因子A(又はA)は既知であるから、アレニウスの反応式によりフラグメントイオン強度、つまりはフラグメント化反応で同時に生じるXイオンとYイオンのフラグメントイオンの総量を算出することができる。
【0040】
(2)複数種のフラグメントイオンへのプロトン親和力(又は気相塩基性度)に応じたフラグメントイオン強度の配分計算方法
質量スペクトルパターンを求めるには、着目しているフラグメント化反応で発生した複数種類のフラグメントイオンの発生量を種類毎(例えばbフラグメントイオンとyフラグメントイオン)に個別に求める必要がある。そこで、ステップS4で求めたフラグメントイオン総量をカイネティック法に基づく手法、即ち、フラグメントイオンのプロトン親和力PA(又は気相塩基性度GB)の大きさに応じて、exp{PA/(R・Teff)}(又はexp{GB/(R・Teff)})の重みでもって各フラグメントイオンに配分する。
【0041】
例えば代表的なフラグメント化反応プロセスであるb−yフラグメント化反応では、bフラグメントイオンとyフラグメントイオンとが発生するが、bフラグメントイオン、yフラグメントイオンのプロトン親和力(又は気相塩基性度)をそれぞれPAb、PAy(又はGBb、GBy)としたとき、配分比は、
bフラグメントイオン配分比=expPAb/(expPAb+expPAy) …(5)
yフラグメントイオン配分比=expPAy/(expPAb+expPAy) …(6)
となる。気相塩基性度GBを用いる場合には、上記(5)、(6)式においてPAb、PAyの代わりにGBb、GByを使用すればよい。この配分方法自体はカイネテッィク法そのものであるが、この計算に用いるフラグメントイオンのプロトン親和力(又は気相塩基性度)を次のような特徴的な方法で求める。
【0042】
過去の研究(ジョン・ホーメス、ほか2名(John L. Hohmes, Christiane Aubry, and Paul M. Mayer)、「プロトン・アフィニティーズ・オブ・プライマリー・アルカノールズ:アン・アプレイザル・オブ・ザ・カイネマティック・メソッド(Proton Affinities of Primary Alkanols: An Appraisal of the Kinematic Method)」、ジャーナル・フィジックス・ケミストリー(J. Phys. Chem.)、A,103, pp.705-709(1999)参照)によれば、同一系列の一級アルカノール(Primary Alkanols) 化合物について、原子数とプロトン親和力との間には一つの曲線関係が存在すると仮定し、この曲線を利用して同一系列に属する未知のアルカノールのプロトン親和力を予測している。
【0043】
本実施形態によるペプチド同定方法でも基本的にはこの原理を利用してフラグメントイオンの原子数からプロトン親和力を求めるが、単なる原子数ではなくアミノ酸残基の種類や配列などを考慮した有効原子数という新たな概念を導入する。即ち、フラグメントイオンを構成するアミノ酸残基のそれぞれについて、原子数に補正係数(以下、スケーリング因子と呼ぶ)を乗じた有効原子数を与え、各アミノ酸残基の有効原子数の和をフラグメントイオンの有効原子数とする。また、フラグメントイオンのプロトン親和力(又は気相塩基性度)と有効原子数との非線形関係を対数式で表しておき、この対数式に有効原子数を代入することでプロトン親和力(又は気相塩基性度)を簡単に求められるようにする。
【0044】
具体的には、例えばyフラグメントイオンの場合について考えると、yフラグメントイオンは一般にn個のアミノ酸残基から成るペプチド分子イオンの構造を有しているので、次の(7)式により有効原子数Nを表す。
N=P・L+P・L+…+P・L+3 …(7)
ここでL及びPはそれぞれ、アミノ酸配列のN末端側から数えてi番目のアミノ酸残基の原子数及びスケーリング因子である。全てのスケーリング因子Pが1ならば、有効原子数Nはyフラグメントイオンの原子数と同じとなる。ここで、(7)式の右辺右端の「3」は、C末端に結合する水酸基(−OH)とN末端に結合する水素基(−H)の原子数である。そして(7)式で定義した有効原子数Nを用いて、yフラグメントイオンのプロトン親和力を次の(8)式で表す。
PA=a・ln{b・(N−3)}=a・ln{b・(P・L+P・L+…+P・L)} …(8)
ここでa、bは定数であり、実際のプロトン親和力の値とできるだけマッチングするように予めパラメータフィッティングで決められる。
【0045】
なお、(8)式に示した対数式において、有効原子数Nをそのまま用いずに(N−3)を変数としているが、これはNとしても構わない。但し、その場合には定数a、bを新たなパラメータフィッティングで決めればよい。
【0046】
一方、bフラグメントイオンの場合には、次の(9)式によりプロトン親和力PAbを計算する。
PAb=a・ln{b・(N−6)}=a・ln{b・(P・L+P・L+…+P・L−3)} …(9)
同じアミノ酸残基から成るyフラグメントイオンとbフラグメントイオンとでは、bフラグメントイオンのほうが原子数が3個少ないため、(9)式ではこれを考慮した式としている。
【0047】
上記(8)、(9)式においては、フラグメントイオンを構成するアミノ酸残基の種類には依存するものの、その序列には依存しない形式としてプロトン親和力を定義している。但し、プロトン親和力の値がアミノ酸残基の序列にも多少の影響を受けることは、従来から知られている。特にアミノ酸配列の両端であるN末端、C末端は分子構造が途切れることからプロトン親和力が影響を受け易いと考えられ、その中でもN末端はモバイルプロトンモデルにおいては、フラグメント化反応の初期にプロトンのいる分子位置であることから、このN末端にプロリンや塩基性アミノ酸などの特定のアミノ酸が存在するとプロトン親和力が無視できない程度に変化することが予想される。
【0048】
そこで、特に分子構造の途切れるN末端での影響の大きさを考慮し、N末端に塩基性アミノ酸が存在する場合にはN末端にそうしたアミノ酸が無い場合とは異なるスケーリング因子を割り当てるようにする。また、プロリンのような他のアミノ酸とは異なる特徴的な分子構造を持つアミノ酸については、隣接するアミノ酸との組み合わせによってもプロトン親和力が影響を受けると考えられる。そこで、プロリンのような特異なアミノ酸が存在する場合には、そのプロリンと隣接するアミノ酸との組み合わせ一つ一つについて異なるスケーリング因子を与えるものとする。このようにスケーリング因子が変わると、仮に元の原子数は同じであっても有効原子数は変わり、それに伴いプロトン親和力も変化することになる。
【0049】
気相塩基性度GBに対してもプロトン親和力PAと同様に表すことができる。即ち、yフラグメントイオン及びbフラグメントイオンについてそれぞれ次式で気相塩基性度GBy、GBbを表すものとする。
GBy=a’・ln{b’・(P’・L+P’・L+…+P’・L)} …(10)
GBb=a’・ln{b’・(P’・L+P’・L+…+P’・L−3)} …(11)
ここでa’、b’は定数であり、実際の気相塩基性度とできるだけマッチするようにカーブフィッティングで予め決めておく。P’、Lはそれぞれi番目のアミノ酸残基の原子数、スケーリング因子である。そしてプロトン親和力と同様に、特定のアミノ酸がN末端にある場合とそうでない場合とで異なるスケーリング因子を割り当てて気相塩基性度が変化するようにする。またプロリンについても同様である。
【0050】
具体的には、(8)〜(11)式で用いられるスケーリング因子P(又はP’)は定数a、b(又はa’、b’)とともに実験データとマッチングするように決められるべき定数であるから、これらの値は多くの観測データと比較して最小二乗法により予め求めておくことができる。そうした求めた値を例えばテーブル形式でデータベース化しておき、与えられたアミノ酸配列に応じて適当な値を読み出して来て上記のような計算式を用いて、フラグメントイオン毎にプロトン親和力(又は気相塩基性度)を算出することができる。
【0051】
また、別の方法でスケーリング因子Pを決めることもできる。即ち、n=1の場合、yフラグメントイオンはアミノ酸イオンであることに着目すれば、アミノ酸のプロトン親和力はよく知られているので、逆にアミノ酸のプロトン親和力からスケーリング因子を求めることができる。この場合は、(8)式においてi番目のアミノ酸残基一つのみから成るyフラグメントイオン(=アミノ酸イオン)を想定し、そのアミノ酸イオンのプロトン親和力をPAと置けば、(8)式は
PA=a・ln(b・P・L) …(12)
つまり、
={1/(b・L)}exp(PA/a) …(13)
と変形することができる。したがって、実験や理論的な考察などから得られるアミノ酸イオンのプロトン親和力PAの値を(13)式に代入すれば、スケーリング因子Pを求めることができる。
【0052】
また(8)式を変形すると、
exp(PA/a)=b・(P・L+P・L+…+P・L) …(14)
のようになる。この式に上記(13)式を代入すれば、
exp(PA/a)=exp(PA/a)+exp(PA/a)+…+exp(PA/a) …(15)
となる。この式は形式上は(4)式と似ているが、意味するところは全く相違する。即ち、(15)式の指数因子の分母aは定数であり、一方、(4)式の指数因子の分母R・Teffで有効温度Teffはペプチド分子の質量電荷比、m/z値等に依存する値であって定数ではない(上記非特許文献3参照)。
【0053】
なお、必ずしも(13)式を用いてスケーリング因子Pを決める必要はなく、できるだけ実際のフラグメントイオンのプロトン親和力(又は気相塩基性度)にマッチするようにパラメータフィッティング等で決めればよい。
【0054】
上述の方法でフラグメントイオン毎のプロトン親和力を算出する際の具体例を説明する。表2はポリグリシン(G、GG、GGG、GGGG、GGGGG)やポリアラニン(A、AA、AAA、AAAA)など、分子量の小さなアミノ酸の配列から構成されるペプチドのプロトン親和力を、B3LYP/6−311+G(2d,p)のレベルでの密度汎関数法を用いた分子動力学計算で求めた結果を示している。
【表2】

【0055】
この結果を利用して、(8)式にあるパラメータa、bを、横軸を原子数N−3、縦軸をプロトン親和力とした曲線のカーブフィッティングから決めることができる。即ち、グリシン(G)やアラニン(A)などのアミノ酸のスケーリング因子Pをともに1であると仮定してカーブフィッティングを行うと、その結果は、
PA[kcal/mol]=11.395・ln(N−3)+190.86 …(16)
と得られる。これを(8)式の形に変形すれば、定数a、bは、
a=11.395[kcal/mol]、b=1.88016×10
と求まる。
【0056】
表3はグリシン、アラニン以外の各種アミノ酸に対して上記定数a、bの値を用い、アミノ酸のプロトン親和力の値からスケーリング因子を求めた例である。ここで示していないアミノ酸についても同様にしてスケーリング因子を求めることができる。
【表3】

このように定数a、b及びスケーリング因子Pを決めておけば、(8)式を用いて任意のyフラグメントイオンのプロトン親和力を、(9)式を用いて任意のbフラグメントイオンのプロトン親和力をそれぞれ予測値として計算することができる。
【0057】
表4は上記結果を利用して2個のアミノ酸から成るyフラグメントイオン、換言すればジペプチドイオンに対するプロトン親和力PAの予測値を算出した例である。この例では、アラニン(A)を含むジペプチドのプロトン親和力を予測しているが、B3LYP/6−311+G(2d,p)のレベルでの密度汎関数法を用いた分子動力学計算から求めた結果と比較的良好に一致しており、上述のような本実施形態におけるプロトン親和力の予測方法が実用的に有効であることを確認することができる。
【表4】

【0058】
表5は、(9)式を利用して2個のグリシン(G)から成るbフラグメントイオンのプロトン親和力を予測し、それを分子動力学による計算値と比較した結果である。この場合にも両者は比較的良好に一致していることが分かる。
【表5】

【0059】
前述のように表1はプロリン(P)とその他のアミノ酸の組み合わせによるジペプチドについてプロトン親和力の分子動力学的計算値を示したものであるが、この表1の結果から求められたプロリンのスケーリング因子を表6に示す。
【表6】

プロリン以外のアミノ酸残基のスケーリング因子は既に決定されているものとし、表1に示したジペプチドのプロトン親和力を(8)式に代入することにより、プロリンのスケーリング因子を決定することができる。
【0060】
N末端にプロリンが存在する場合のプロリンのスケーリング因子は、表1中のP−X態様のジペプチドのプロトン親和力の値を(8)式に代入して得ることができる。そして、表6中の左側に示したスケーリング因子が、プロリンと結合するアミノ酸残基の種類に応じて与えられる。またプロリンがN末端に無い場合のスケーリング因子は、表1中のX−P態様のジペプチドのプロトン親和力の値を(8)式に代入して得ることができ、表6中の右側に示したスケーリング因子が、プロリンと結合するアミノ酸残基の種類に応じて与えられる。
【0061】
以上例示したように、アミノ酸配列に応じて適宜のスケーリング因子を決定することができる。図2は実際にコンピュータでフラグメントイオン強度の配分計算を行う際の処理手順を示すフローチャートである。即ち、評価対象のペプチド分子が与えられると、そのアミノ酸配列に応じて所定のアルゴリズムに従ってスケーリング因子が決定される(ステップS11)。具体的には、例えばアミノ酸配列が入力されると、例えば上述したようにスケーリング因子に影響を与える条件が抽出され、その条件に応じたデータベース検索によりアミノ酸残基毎のスケーリング因子が求まる。次に、各アミノ酸残基のスケーリング因子と原子数とから、(8)、(9)式に基づいて各フラグメントイオンのプロトン親和力を計算する(ステップS12)。或いは、(10)、(11)式に基づいて各フラグメントイオンの気相塩基性度を計算してもよい。
【0062】
そうして各フラグメントイオンのプロトン親和力又は気相塩基性度が求まったならば、例えばb−yフラグメントであれば(5)、(6)式に基づいてフラグメントイオン強度を配分する(ステップS13)。もちろん、b−yフラグメントでなくても同様に配分できることは当然である。
【0063】
以上説明したように本発明に係るペプチド同定方法によれば、よく知られた化学反応の標準的な理論、即ちアレニウスの反応速度式やカイネテッィク法に沿う形で、フラグメントイオン強度を簡単なモデル式により近似計算で求めることができる。こうしたモデル式を用いず直接コンピュータでフラグメントイオン強度を求めようとすると、一般にペプチドのアミノ酸配列のサイズは大きいため、計算量が膨大になって実用的な時間での処理は困難になる。これに対し、上記実施形態で採用しているような方法によれば、計算に必要な活性化エネルギーやプロトン親和力(又は気相塩基性度)をペプチド分子に対して効率的に、つまり実用的な時間の範囲で求めることが可能となる。特にプロトン親和力(又は気相塩基性度)はアミノ酸配列のサイズが大きくなるほど大きくなる傾向にあり、一定の値に収束する傾向はない。そのため、プロトン親和力や気相塩基性度を簡単な評価式から少ない計算量で求めることができることは非常に有効であると言える。
【0064】
また、各フラグメントイオンのプロトン親和力を計算する際に、そのフラグメントイオンの種類やアミノ酸配列の特異性(例えばプロリンの存在や存在位置など)を考慮して値が修正されるので、より高い精度でもってフラグメントイオン強度を求めることができ、ひいてはペプチドの同定の正確性の向上が期待できる。
【0065】
なお、上記実施形態は本発明の一例にすぎず、本発明の趣旨の範囲で適宜変形、修正、追加等を行っても本願特許請求の範囲に包含されることは当然である。
【図面の簡単な説明】
【0066】
【図1】本発明の一実施形態によるペプチド同定方法における解析処理の概略フローチャート。
【図2】フラグメントイオン強度の配分計算を行う際の処理手順を示すフローチャート。
【図3】フラグメントイオン強度の計算方法を反応経路に沿ったエネルギープロファイルで示した原理説明図。

【特許請求の範囲】
【請求項1】
MS分析により取得された質量スペクトルデータに基づいて被検試料中のペプチド混合物のアミノ酸配列を決定するペプチド同定方法であって、候補ペプチドのフラグメントイオン強度を予測して質量スペクトルパターンを求め、これと実測の質量スペクトルとの比較により候補ペプチドの妥当性を判断するペプチド同定方法において、ペプチドのフラグメント化反応で生じる複数種のフラグメントイオン毎のフラグメントイオン強度を予測するために、
a)フラグメント化反応で生じるフラグメントイオンの強度を求める強度計算ステップと、
b)該フラグメントイオン強度をフラグメントイオン種類毎に与えられるプロトン親和力又は気相塩基性度に応じて分配する分配ステップと、
を含み、フラグメントイオン種類毎のプロトン親和力又は気相塩基性度を計算する際に、フラグメントイオンを構成するアミノ酸残基のそれぞれについて実際の原子数にアミノ酸配列の特異性を反映した補正係数を乗じた有効原子数を求め、アミノ酸残基毎の有効原子数の和から求まる該フラグメントイオンの有効原子数を、所定の近似計算式に適用してプロトン親和力又は気相塩基性度を算出するようにしたことを特徴とする、質量分析を用いたペプチド同定方法。
【請求項2】
前記所定の近似計算式は、有効原子数とプロトン親和力又は気相塩基性度との非線形関係を対数で近似した式であることを特徴とする、請求項1に記載の質量分析を用いたペプチド同定方法。
【請求項3】
アミノ酸配列中に塩基性アミノ酸が存在する場合に、該塩基性アミノ酸がN末端に存在するか否かで異なる補正係数を与えることを特徴とする、請求項1又は2に記載の質量分析を用いたペプチド同定方法。
【請求項4】
アミノ酸配列中にプロリンが存在する場合に、該プロリンと隣接する他のアミノ酸残基との組み合わせで該プロリンがN末端に存在するか否かで異なる補正係数を与えることを特徴とする、請求項1又は2に記載の質量分析を用いたペプチド同定方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate