説明

質量分析法を用いたアミノ酸配列同定方法

【課題】計算処理の効率化を図り、精度の高いアミノ酸配列同定方法を提供する。
【解決手段】 マススペクトルを入力する入力手段と、プレカーサーの質量より考えられるアミノ酸組合せを算出し、アミノ酸の理論質量値と、上記入力手段から入力したマススペクトルのうち特定のマススペクトルの質量電荷比から算出される実測質量値との差を算出し、算出した差のなかで所定の範囲内にあるものを同定し、同定した差を算出するのに使用したN個のアミノ酸をd+1〜d+N番目のアミノ酸の候補アミノ酸とする候補アミノ酸検索手段と、アミノ酸の組合せに従いながらアミノ酸同定候補を絞り込み、各候補アミノ酸に関してイオン強度より算出した正規化相対イオン強度とアミノ酸巻の切れやすさの確率を評価関数に用いてそれぞれ評価値を演算する評価値演算手段と、評価値を用いてペプチド断片におけるアミノ酸配列を同定する同定手段とを備えるアミノ酸配列同定装置。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、質量分析法により得られたマススペクトルを用いてアミノ酸配列を同定する新規な方法に関する。
【背景技術】
【0002】
質量分析(マススペクトロメトリー)とは、分子等の粒子を気体状のイオンとし、このイオンを真空の電磁界中で運動させることでイオンの質量電荷比(m/z)に応じて分離・検出する技術である。また、その測定を行う装置を質量分析器(マススペクトロメーター)、これによって得られた検出シグナルを質量電荷比に対するイオン強度のグラフとして表したものをマススペクトルと呼ぶ。
【0003】
質量分析を用いたタンパク質の同定解析(非特許文献1参照)では、タンパク質分解酵素によって消化したペプチド断片を質量分析器に導入して、それぞれのペプチド分子イオンの質量電荷比を測定する。使用する酵素によって、タンパク質のアミノ酸配列上で消化される位置は特定のいくつかの場所に限定される。タンパク質の消化生成物として得られるペプチドのMSスペクトルからペプチド分子の質量が決まれば、アミノ酸配列データベースを用いることで、アミノ酸配列が予測できる。この手法は、ペプチド・マス・フィンガープリント法と呼ばれる。しかし、この手法で一意に配列を決定することが困難なため、通常はMS/MSスペクトルも併用したペプチド・シークエンス・タグ法が使用される。
【0004】
MS/MSスペクトルは、質量分析器中に導入された分子イオン(プレカーサーイオン)を、衝突誘起解離(CID)等によってランダムに分解(切断)し、得られた分解物のイオン(プロダクトイオン)を質量分析することで得られ、分解前の分子の構造に関する情報が含まれている。 アミノ酸が複数個直鎖上につながったペプチドはCIDにより、図3に示されるペプチド結合位置b-y、a-xもしくはc-zの3箇所で切断され易いことが知られている。
【0005】
この切断が一様にペプチド鎖上に起こったならば、末端からa-x, b-y, c-z切断部位までの質量に相当する全てのMS/MSスペクトルが得られることになる。末端から切断部位までのMS/MSスペクトルは、各々のアミノ酸を組み合わせた質量を示すことから、ペプチドの部分配列を予測することが出来る。実際は、全ての切断可能部位において一様な確率で切断が起こることはないため、ペプチド・マス・フィンガープリント法に加えて、部分的に読み取られたアミノ酸配列を用いてアミノ酸配列データベース検索を行う方法が、ペプチド・シークエンス・タグ法である。
【0006】
一方、データベースをまったく使用することなく、MS/MSスペクトル中に存在するa,b,c-またはx,y,z-系列のシグナルを可能な限り読み取ることで相当するアミノ酸配列を推定するde novo sequencing法も存在する。すなわち、既存のde novo sequencing法では、得られたMS/MSスペクトル全体から、個々のアミノ酸残基に相当するスペクトルを、グラフ理論及びダイナミックプログラミング法を用いた組合せ計算により同定し、ペプチドのアミノ酸配列を同定する。しかしながら、既存のde novo sequencing法には、膨大な計算処理を必要とし、またロイシンとイソロイシンといった同質量のアミノ酸を分別して同定することができないといった問題がある。
【0007】
【非特許文献1】プロテオーム解析法―タンパク質発現・機能解析の先端技術とゲノム医学・創薬研究 ISBN:4897069335, 羊土社 (2000-07-10出版) Page: 129-136
【発明の開示】
【発明が解決しようとする課題】
【0008】
そこで、本発明は、上述したような従来のアミノ酸配列同定方法の諸問題に鑑み、計算処理の効率化を図り、精度の高いアミノ酸配列同定方法を提供することを目的とする。
【課題を解決するための手段】
【0009】
そこで、本発明者らは、上述した問題を解決するために鋭意検討した結果、既存のde novo sequencing法とは異なり、MS/MSスペクトルのイオン強度及びアミノ酸間の結合強度から導かれる“切れ易さ”を用いることで高精度にアミノ酸配列を同定できることを見いだし、本発明を完成するに至った。
【0010】
また、本発明者は、MS/MSスペクトルから得られるプレカーサーイオンの質量とアミノ酸毎の質量値を格納した記憶手段と用いて、プレカーサーイオンを構成するアミノ酸の組合せを同定できることを見いだし、本発明を完成するに至った。
【0011】
すなわち、本発明は以下を包含する。
(1) 配列同定対象のペプチドを含む試料から得られる、質量電荷比とイオン強度からなるマススペクトルを入力する入力手段と、アミノ酸の理論質量値をアミノ酸毎に記憶した記憶手段から、d番目(dは0以上の整数)までのペプチド断片のアミノ酸配列に基づいて推定質量値を算出し、算出した推定質量値にアミノ酸の理論質量値をそれぞれ加算して得られるd+N番目(Nは探索アミノ酸数であり、1以上の整数)までのペプチド断片の推定質量値をそれぞれ算出し、d+N番目までのペプチド断片の推定質量値と上記入力手段から入力したマススペクトルのうち特定のマススペクトルの質量電荷比から算出される実測質量値との差を算出し、算出した差のなかで所定の範囲内にあるものを同定し、同定した差を算出するのに使用したN個のアミノ酸をd+1〜d+N番目のアミノ酸の候補アミノ酸とする候補アミノ酸検索手段と、候補アミノ酸検索手段で検索した各候補アミノ酸に関して、上記同定した差に対して、上記特定のマススペクトルのイオン強度が高い場合及びd番目のアミノ酸と当該候補アミノ酸との間が切れ易い場合を正に評価する評価関数を用いてそれぞれ評価値を演算する評価値演算手段と、得られた評価値を用いて上記候補アミノ酸から1の候補アミノ酸を同定することで、上記ペプチドにおけるd+N番目までのペプチド断片におけるアミノ酸配列を同定する同定手段とを備える、アミノ酸配列同定装置。
【0012】
(2) 上記入力手段で入力したマススペクトルに含まれるイオン強度を確率変数内で均一に分散させるようにスケーリングするイオン強度確率値演算手段を更に備え、上記評価値演算手段は、上記イオン強度確率値演算手段によって算出されたイオン強度確率値を用いて評価値を算出することを特徴とする(1)記載のアミノ酸配列同定装置。
【0013】
(3) 上記アミノ酸間の切れ易さとして、アミノ酸間の切れ易さの統計値を確率値として算出したアミノ酸間開裂強度確率値を格納した記憶手段を更に備え、上記評価値演算手段は、上記記憶手段から読み出したアミノ酸間開裂強度確率値を用いて評価値を演算することを特徴とする(1)記載のアミノ酸配列同定装置。
【0014】
(4) 上記記憶手段に格納されたアミノ酸の理論質量値を用いて、配列同定対象のペプチドの質量に基づいて、当該ペプチドに含まれるアミノ酸の種類及び個数で表される組合せを演算する組合せ演算手段を更に備え、上記同定手段は、最も高く評価される評価値を示す候補アミノ酸をd+N番目のアミノ酸としたペプチド断片に含まれるアミノ酸の種類及び個数を、上記組合せ演算手段で算出した組合せと照合し、これら組合せの中に当該ペプチド断片のアミノ酸の種類及び個数を含む組合せが存在しないと判断した場合には、当該候補アミノ酸を除く候補アミノ酸から、上記ペプチドにおけるd+N番目のアミノ酸を同定することを特徴とする(1)記載のアミノ酸配列同定装置。
【0015】
(5) 上記アミノ酸の理論質量値には、1つのアミノ酸に関して、ペプチド結合の切断位置に対応した複数の値が含まれていることを特徴とする(1)記載のアミノ酸配列同定装置。
(6) 上記アミノ酸の理論質量値には、1つのアミノ酸に関して、化学的修飾を有する場合を想定した複数の値が含まれていることを特徴とする(1)記載のアミノ酸配列同定装置。
【0016】
(7) 上記記憶手段に格納されたアミノ酸の理論質量値を用いて、配列同定対象のペプチドの質量に基づいて、当該ペプチドに含まれるアミノ酸の種類及び個数で表される組合せを演算する組合せ演算手段を更に備え、上記組合せ演算手段は、上記入力手段で入力される配列同定対象のペプチドの質量が特定の閾値より大きい場合には、上記入力手段で入力したマススペクトルを複数に分割して処理することを特徴とする(1)記載のアミノ酸配列同定装置。
【0017】
(8) 上記組合せ演算手段は、制限付き組合せ問題を解くアルゴリズムを適用した処理を行うことを特徴とする(4)又は(7)記載のアミノ酸配列同定装置。
(9) 上記d+N番目の候補アミノ酸に対する評価値は、d番目までのペプチドを同定するまでに使用した評価値の累積値であることを特徴とする(1)記載のアミノ酸配列同定装置。
【0018】
(10) 配列同定対象のペプチドを含む試料から得られる、当該ペプチドの質量値を入力する入力手段と、アミノ酸の理論質量値をアミノ酸毎に記憶した記憶手段から読み出したアミノ酸の理論質量値を用いて、上記入力手段で入力した配列同定対象のペプチドの質量に基づいて、当該ペプチドに含まれるアミノ酸の種類及び個数で表される組合せを演算する組合せ演算手段と、上記組合せ演算手段で演算された組合せの中から、配列同定対象のペプチドに関するアミノ酸配列を同定するアミノ酸配列同定手段とを備える、アミノ酸配列同定装置。
【0019】
(11) 上記アミノ酸配列同定手段は、既知ペプチドに関するアミノ酸配列配列を格納したデータベースを用いて配列同定対象のペプチドに関するアミノ酸配列を同定することを特徴とする(10)記載のアミノ酸配列同定装置。
(12) 上記組合せ演算手段は、制限付き組合せ問題を解くアルゴリズムを適用した処理を行うことを特徴とする(10)記載のアミノ酸配列同定装置。
【発明の効果】
【0020】
本発明によれば、配列同定対象のペプチドについて高速且つ、高精度にアミノ酸配列を同定することができるアミノ酸配列同定装置、アミノ酸配列同定方法及びアミノ酸配列同定プログラムを提供することができる。
【発明を実施するための最良の形態】
【0021】
以下、本発明に係るアミノ酸配列同定装置、アミノ酸配列同定方法及びアミノ酸配列同定プログラムを、図面を参照して詳細に説明する。本発明に係るアミノ酸配列同定装置は、タンパク質、オリゴペプチド及びポリペプチド等のアミノ酸配列を同定対象とし、質量分析装置で得られる同定対象ペプチドのマススペクトルを用いてアミノ酸配列を同定する装置である。
【0022】
<本発明に係るアミノ酸配列同定装置>
先ず、図1を用いて、本発明に係るアミノ酸配列同定装置1のハードウェア構成を説明する。アミノ酸配列同定装置1は、システム全体を制御するCPU101と、ブートプログラム等を記憶したROM102と、CPU101のワークエリアとして使用されるRAM103と、プログラムやデータ等が格納されたハードディスク(HD)104と、CPU101の制御に従ってHD104に対するデータのリード/ライトを制御するハードディスクドライブ(HDD)105と、ドキュメント、画像、機能情報等のデータに関するウインドウを表示するディスプレイ106と、外部の機器等とのインターフェイスを司る外部端子107とを備えている。また、各部はバス100により接続されている。
【0023】
なお、アミノ酸配列同定装置1は、通信回線網を介してネットワークに接続されるものでも良い。この場合、アミノ酸配列同定装置1は、ネットワークと内部のインターフェイスを司るインターフェイス(I/F)を備える。
【0024】
次に、図2を用いて、本発明に係るアミノ酸配列同定装置1の機能的構成について説明する。アミノ酸配列同定装置1は、質量分析装置8で出力された質量電荷比とイオン強度とからなるマススペクトル・データを入力する入力処理部2と、候補アミノ酸検索処理部3と、評価値演算処理部4と、同定処理部5とを含む構成である。
【0025】
また、アミノ酸配列同定装置1は、ROM102、RAM103又はHD104に記憶した、アミノ酸の理論質量値をアミノ酸毎に記憶したアミノ酸質量テーブルを有する。アミノ酸質量テーブルの一例としては、表1に示すように、20種類のアミノ酸とその質量とを関連付けたテーブルを例示することができる。
【0026】
【表1】

【0027】
なお、表1において、“Average”の欄は各アミノ酸を構成している原子の同位体の存在比率により算出した各アミノ酸の質量であり、“Monoisotopic”の欄は同位体の存在比率が最も大きい質量をもとに算出した各アミノ酸の質量である。
【0028】
図3に示すように、ペプチド結合が切断される位置としては複数箇所考えることができ、切断箇所に依存して開裂したアミノ酸の質量が異なることを考慮したアミノ酸質量テーブルを使用することが好ましい。このようなアミノ酸質量テーブルとして、一例を表2に示す。
【0029】
【表2】

【0030】
表2に示したアミノ酸質量テーブルにおいて、N(a)の列は、図3におけるa-xのラインでペプチドが開裂してN末端側に存在する場合の質量(“a-ion”の質量)である。同様に、N(b)の列は図3におけるb-yのラインでペプチドが開裂してN末端側に存在する場合の質量(“b-ion”の質量)、N(c)の列は図3におけるc-zのラインでペプチドが開裂してN末端側に存在する場合の質量(“c-ion”の質量)である。また、C(x)の列は図3におけるa-xのラインでペプチドが開裂してC末端側に存在する場合の質量(“x-ion”の質量)、C(y)の列は図3におけるb-yのラインでペプチドが開裂してC末端側に存在する場合の質量(“y-ion”の質量)、C(z)の列は図3におけるc-zのラインでペプチドが開裂してC末端側に存在する場合の質量(“z-ion”の質量)である。この表は、単一アミノ酸が末端に現れた場合の質量を示すが、複数個のアミノ酸が検出される場合には、表1より複数のアミノ酸の質量を計算し、以下の表3に基づき末端に存在する場合の質量を計算する。なお、表3の括弧内は、N末端に起こりやすいアセチル化した場合の質量を示している。
【0031】
【表3】

【0032】
また、アミノ酸質量テーブルは、表1及び表2に示すように、20種類のアミノ酸を含むものに限定されず、例えば、アミノ酸が受け易いと考えられる修飾を考慮したアミノ酸質量を含むものであっても良い。修飾を考慮したアミノ酸の質量として表4に一例を示すが、アミノ酸の脱水、脱アミノ等、これらに限定されない。
【0033】
【表4】

【0034】
すなわち、上述した表1及び2には、表4に示したような修飾アミノ酸とその質量とが含まれていても良い。なお、表1〜4に示したアミノ酸及び修飾アミノ酸の質量は質量電荷比で表されている。
【0035】
さらに、アミノ酸配列同定装置1は、ROM102、RAM103又はHD104に記憶した、アミノ酸間の切れ易さを意味する値を格納することができる。アミノ酸間の切れ易さを意味する値とは、例えば、アミノ酸間の切れ易さの統計値を確率値として算出したアミノ酸間開裂強度確率値を使用することができる。
【0036】
下記式は、Kapp, E.A., Schutz, F., Reid, G.E., Eddes, J.S., Moritz, R.L., O'Hair, R.A., Speed, T.P. and Simpson, R.J., Mining a Tandem Mass Spectrometry Database To Determine the Trends and Global Factors Influencing Peptide Fragmentation, Anal. Chem., 75, 6251-6264, 2003.により示されたアミノ酸間の切れやすさを論じた統計値の算出法である。アミノ酸間開裂強度確率値は、例えば下記式に従って算出した値を0〜1の確率変数として均一にスケーリングして算出することができる。
【0037】
【数1】

【0038】
なお、上記式では、ペプチド・シーケンス・タグ方において検出されたb-ion、もしくは、y-ionからなるペプチドフラグメントの出現回数により、図3に示したb-yラインにおける切れ易さを算出する。上記式においてbsj+はアミノ酸間(s)においてj価で検出されたb-ionの出現回数を意味し、ysj+はアミノ酸間(s)においてj価で検出されたy-ion出現回数を意味する。このCIRSの値を、20種類のアミノ酸から選ばれる一対の組合せ毎に切れ易さを統計値として纏めた例として図4を示す。
【0039】
すなわち、アミノ酸配列同定装置は、20種類のアミノ酸から選ばれる一対の組合せに対して、上記式に従って算出されたCIRs値を関連付けたテーブルとしてROM102、RAM103又はHD104に記憶している。なお、アミノ酸間開裂強度確率値を算出する式としては、上記式に限定されず、例えば、非経験的分子軌道法により、アミノ酸間の結合強度を算出し、各アミノ酸間の結合強度を相対比として表すことも可能である。
【0040】
また、アミノ酸配列同定装置1は、入力処理部2で入力したマススペクトル・データに含まれるマススペクトル(各ピーク)のイオン強度を確率値として演算するイオン強度確率値演算処理部6と、同定対象のペプチドの質量に基づいてペプチドに含まれるアミノ酸の種類及び個数で表される組合せを演算する組合せ演算手段7と、同定処理部5において同定したアミノ酸配列の累積質量Mを演算する質量累積演算処理部9を備える構成であってもよい。
【0041】
入力処理部2は、例えば外部端子107を介して接続された質量分析装置8から出力されたマススペクトル・データを入力する。入力処理部2は、CD-ROMやDVD-ROM等の情報記録媒体に記録されたマススペクトル・データを入力するものであっても良いし、サーバに格納されたマススペクトル・データをネットワークを介して入力するものであっても良い。
【0042】
本発明において、入力として使用するマススペクトルを得る質量分析装置8としては、特に限定されず、如何なる質量分析装置を用いていても良い。ここで、質量分析装置8としては、分子等の粒子を気体状のイオンとし、このイオンを真空の電磁界中で運動させることでイオンの質量電荷比(m/z)に応じて分離・検出する装置である。質量分析装置8は、一般的に、試料に含まれる分子をイオン化するためのイオン源と、生じたイオンを質量電荷比に依存して分離する質量分析部と、質量分析部で分離したイオンを検出するイオン検出部とを備える。
【0043】
イオン源としては、マトリックス支援レーザ脱離イオン化法(MALDI)を採用したもの、エレクトロンスプレーイオン化法(ESI)を採用したもの、電子衝突法(EI)を採用したもの、化学イオン化法(CI)を採用したもの、高速原子衝突法(FAB)を採用したもの、誘導結合プラズマ法(ICP)を採用したもの、サーモスプレーを採用したもの、大気圧化学イオン化法(APCI)を採用したものを使用できる。特に、本発明においては、ペプチド又はタンパク質をイオン化するため、ソフトイオン化であるMALDI又はESIを採用したイオン源を有する質量分析装置が好ましい。
【0044】
また、質量分析部としては、単収束磁場偏向型質量分析計、四重極型質量分析計、イオントラップ型質量分析計、飛行時間型質量分析計、フーリエ変換型質量分析計及び二重収束型質量分析計等を挙げることができる。さらに、質量分析部をタンデムに連結することで、イオン源で生成した全イオンを第1の質量分析計で分離するとともに選択したプレカーサーイオンのみを通過させてフラグメント化し、フラグメント化されたプロダクトイオンを第2の質量分析計において分析するタンデム型質量分析装置(以降、MS/MSと呼ぶ)を挙げることができる。なお、イオントラップ型質量分析計は、それ単独でMS/MSスペクトルの測定が可能である。また、飛行時間型質量分析計では、イオン源を出たイオンが、飛行中に分解するポストソース分解(PSD)を起こすことで、プレカーサーイオンと同時にそのフラグメント化されたプロダクトイオンの測定が可能なものもある。
【0045】
本発明においては、プレカーサーイオンおよびそのフラグメント化されたプロダクトイオンのスペクトルを得ることが出来る質量分析装置、つまり、質量分析部に、イオントラップ型質量分析計、PSDスペクトルの測定が可能である飛行時間型質量分析計、タンデム型質量分析計等を有する質量分析装置が必要である。
【0046】
また、候補アミノ酸検索処理部3は、設定された探索アミノ酸数Nに一致する数のアミノ酸(ペプチド)を、配列同定対象のペプチドにおけるd番目までのアミノ酸に続くd+1〜d+N番目の候補アミノ酸(候補ペプチド)として検索する。候補アミノ酸検索処理部3は、候補アミノ酸として1又は複数のアミノ酸を検索する。評価値演算処理部4は、候補アミノ酸検索処理部3で検索した単数又は複数の候補アミノ酸に関して、詳細を後述する評価関数を用いて評価値を算出する。ここで、評価関数とは、詳細を後述するが、d+N番目のアミノ酸をある候補アミノ酸とした場合に算出される質量値(推定質量値)と、入力処理部2で入力したマススペクトルにおいて実測される質量値(実測質量値)との差を、実測質量値を算出したマススペクトルのイオン強度が高い場合及びd番目のアミノ酸と当該候補アミノ酸との間が切れ易い場合を正に評価する関数である。「正に評価」とは、評価関数に従って算出される評価値が小さいほど高く評価される場合には、上記差をより小さな値とするように反映させることを意味する。イオン強度確率値演算処理部6は、入力処理部2で入力したマススペクトルにおいて、イオン強度を相対値とし当該相対値を確率変数内で均一に分散させるようにスケーリングする処理を実行する。イオン強度確率値演算処理部6によって算出されたイオン強度確率値を評価関数に使用することができる。
【0047】
同定処理部5は、候補アミノ酸検索処理部3で検索した候補アミノ酸について、評価演算処理部4において算出した評価値を用いてd+N番目のアミノ酸を同定する。詳細は後述するが、同定処理部5は、原則的に評価値が最も小さい値を示す候補アミノ酸をd+N番目のアミノ酸と同定するが、必ずしも、最も小さい評価値を示す候補アミノ酸をd+N番目のアミノ酸と同定しなくてもよい。
【0048】
また、組合せ演算処理部7は、配列同定対象のペプチドの質量に基づいて、当該ペプチドに含まれるアミノ酸の種類及び個数で表される組合せを演算することができる。組合せ演算処理部7は、例えば、MS/MSの第1の質量分析計から出力されるプレカーサーイオンの電荷質量比、つまり、MSスペクトルから得られる質量電荷比から算出したプレカーサーイオンの質量値に基づいて、記憶手段に格納されたアミノ酸の理論質量値を用いてプレカーサーイオン(ペプチド)に含まれるアミノ酸の種類及び個数で表される組合せを演算することができる。組合せ演算処理部7は、いわゆるナップザック問題を例とした制限付き組合せ問題の解法アルゴリズムを適用した処理によってアミノ酸の種類及び個数で表される組合せを演算することができる。
【0049】
さらに、同定処理部5は、評価演算処理部4において算出した評価値とともに、組合せ演算処理部7で演算された組合せを用いることによってd+N番目のアミノ酸を同定することができる。
【0050】
<本発明に係るアミノ酸配列同定方法及びプログラム>
以下、本発明に係るアミノ酸配列同定装置1における具体的な処理について、図5に示すフローチャートを用いて説明する。本例では、質量分析装置8としてMS/MSスペクトルを検出可能な装置を例示して説明する。すなわち、所定のタンパク質消化酵素によってタンパク質を分解して得られたペプチド断片を第1の質量分析計に導入し、第1の質量分析計によってプレカーサーイオンの質量が測定される。その後、第2の質量分析計によって、特定のプレカーサーイオンの分解産物に由来するスペクトル・データを出力する。
【0051】
また、本例で説明するアミノ酸配列同定装置1においては、表2に示したアミノ酸質量テーブルを記憶手段に格納し、アミノ酸間の切れ易さの統計値を確率値として算出したアミノ酸間開裂強度確率値(上記式に従って算出されたCIRs値)を一対のアミノ酸の組合せに関連付けたテーブルを記憶手段に格納している。また、以下の例では、アミノ酸配列が既知のウシ血清アルブミン(BSA)をTrypsinで消化することで得られるペプチド断片のうち、ペプチド“AEFVEVTK”(検出質量電荷比(2価):462.022)のアミノ酸配列同定を実施例として以下に例示する。また、質量分析装置1としては、具体的に、Finnigan LTQ (ThermoFinnigan)を用いた。また、液体クロマトグラフィー装置としては、Paradigm MS4 (Michrom BioResources)を用いた。得られたMS/MSスペクトルを図6に示す。
【0052】
また、本例で説明するアミノ酸配列同定装置1における処理に先立って、イオン強度確率値演算処理部6は、入力処理部2で入力したマススペクトル・データに含まれるピークの高さとして表されるイオン強度を確率値として演算し、各ピークの位置として表される電荷質量比と、各ピークのイオン強度確率値とを関連付けたイオン強度テーブルを記憶手段に格納する。イオン強度テーブルの一例としては、表5に示すように、マススペクトル・データに含まれるピークにおける質量電荷比(表中「m/z」)と、当該ピークについて実測されたイオン強度(表中「Intensity」)と、当該イオン強度中の最大値で各イオン強度を割って算出される相対イオン強度(表中「Relative Intensity」)と、当該相対イオン強度の各値を0〜1の確率変数として均一にスケーリングして算出される正規化相対イオン強度(表中「Normalized RI」)とを関連付けたテーブルを挙げることができる。
【0053】
【表5】



【0054】
なお、上記スケーリング方法は、MS/MS装置及び測定条件等に依存して種々変更可能である。本例におけるスケーリングに際しては、f(x)=1-exp(-0.192*x)〔ここで、xは相対イオン強度を示す〕で表されるスケーリング関数を使用している。
【0055】
本例で説明するアミノ酸配列同定装置1は、上述したように作成されたイオン強度確率値テーブルを記憶手段に格納した後、以下の処理を実行する。
【0056】
先ず、ステップ1(図5において「S1」と記する。以下のステップも同様)では、質量累積演算処理部9によって、質量累計値Mを初期化する(M=0と設定する)、すなわち、質量累積演算処理部9がM=0を記憶手段に記憶する。
【0057】
次に、ステップ2において、候補アミノ酸検索処理部3によって、探索アミノ酸数Nを初期化、すなわちN=1にセットする。すなわち、候補アミノ酸検索処理部3がN=1を記憶手段に記憶する。
【0058】
次に、ステップ3では、質量累積演算処理部9によって、質量累計値Mに対して探索アミノ酸数Nにより指定された残基数のアミノ酸質量を加算し、質量累計値Mを更新する。例えば、C末端の候補アミノ酸を探索する場合は、本ステップでは、表2に示したアミノ酸質量テーブルのうち、C(y)の列で表される質量(図3におけるb-yのラインでペプチドが開裂してC末端側に存在する場合の質量)を質量累計値Mに加算する。なお、C末端のアミノ酸を探索する場合は、表2におけるC(x)やC(z)の列で表される質量をマススペクトル・データと照合しても良い。仮に、N末端のアミノ酸を探索する場合は、表2におけるN(a)、N(b)及びN(c)の列で表される質量のいずれを加算しても良い。
【0059】
ステップ3において、質量累積値Mとしては表2に示したアミノ酸質量テーブルに含まれる20種類全てのアミノ酸を用いて質量累積値Mを更新することもできるし、当該アミノ酸質量テーブルに含まれる一部のアミノ酸を用いて質量累積値Mを更新することもできる。また、第1の質量分析計に導入するペプチド断片を、特定のアミノ酸残基を認識して消化するタンパク質消化酵素によって得た場合には末端に存在しうるアミノ酸を限定することができる。従って、この場合には、アミノ酸質量テーブルを検索し、末端に存在しうるアミノ酸について優先的に質量累積値Mを更新することが好ましい。
【0060】
次に、ステップ4では、候補アミノ酸検索処理部3によって、入力処理部2で入力したマススペクトル・データ又はイオン強度確率値演算処理部6で構築したイオン強度テーブル(例えば、表5に示すテーブル)を検索し、ステップ3で更新された質量累積値Mに相当する質量電荷比を有するマススペクトル・データのピークを同定する。本ステップでは、質量累積値Mに対して予め質量誤差を設定し、当該質量誤差の範囲内に質量電荷比を有するマススペクトル・データのピークを同定することができる。なお、本ステップでは、ステップ3において更新した質量累積値Mのうち、複数の質量累積値Mについてマススペクトル・データを同定する場合もある。マススペクトル・データを同定することができた質量累積値Mを示すアミノ酸は、候補アミノ酸として記憶手段に記憶される。
【0061】
ステップ4において、質量累積値Mに相当する質量電荷比を有するマススペクトル・データのピークを同定した場合にはステップ5に進み、同定しなかった場合については後述する。
【0062】
次に、ステップ5では、先ず評価値演算処理部4によって、評価関数を用いて各候補アミノ酸について評価値を算出する。ここで、評価関数としては、推定質量値と実測質量値との差、すなわち、質量累積値Mとマススペクトル・データから算出される質量値との差に対して、同定したマススペクトル・データにおけるイオン強度が高い場合及び既定のアミノ酸と候補アミノ酸との間が切れ易い場合を正に評価するような関係を示す下記式を使用することができる。
【0063】
【数2】

【0064】
上記式で算出されるScoreが評価値である。上記式中、Mdiff(i)は推定質量値と実測質量値との差として算出される値である。上記式中、Ipeak(i)は上記表5に示したイオン強度確率値テーブルから読み出される値である。上記式中、ACIR(i)はCIRs値を関連付けたテーブルから読み出される値である。また、上記式において、iは検索の深度を意味する。
【0065】
なお、ステップ5において、候補アミノ酸が末端に位置する場合は、アミノ酸間の切れ易さは全ての候補アミノ酸において同等に評価する。すなわち、評価値演算処理部4は、各候補アミノ酸について評価値を算出するに際して上記評価関数におけるACIR(i)を全て1に固定して演算する。また、評価値演算処理部4で算出された候補アミノ酸についての評価値は、候補アミノ酸と関連付けて記憶手段に記憶する。
【0066】
ステップ5では、次に同定処理部5によって、評価値演算処理部4で算出された候補アミノ酸についての評価値に基づいて、C末端のアミノ酸を同定する。具体的には、最も小さい評価値を示す候補アミノ酸をC末端のアミノ酸として同定する。ステップ5では、次に質量累積演算処理部9によって、質量累積値Mを同定処理部5で同定したアミノ酸の質量に更新する。
【0067】
次に、ステップ6では、同定処理部5によって、ステップ5で更新した質量累積値Mとプレカーサーイオンの質量値とを比較する。比較の結果、同定処理部5が、ステップ5で更新した質量累積値Mとプレカーサーイオンの質量値とが所定の誤差範囲内で一致すると判断した場合には検索を終了し、一致しないと判断した場合にはステップ3に戻る。
【0068】
ステップ6において、質量累積値Mとプレカーサーイオンの質量値とが所定の誤差範囲内で一致すると判断するまで、ステップ3〜6を繰り返し実行することによって配列同定対象のペプチドのアミノ酸配列を同定することができる。ステップ3〜6を繰り返し実行する際、ステップ3においては、質量累積演算処理部9が、表1で表される質量を質量累計値Mに対して加算する。また、ステップ3〜6を繰り返し実行する場合、ステップ5において、評価値演算処理部4は、評価値Scoreを上記式で算出する際に候補アミノ酸毎にアミノ酸間の切れ易さを、アミノ酸間開裂強度確率値を一対のアミノ酸の組合せに関連付けたテーブルから読み出し、上記評価関数におけるACIR(i)を代入して演算する。
【0069】
なお、末端からの探索開始による最初に行うステップ4において、ステップ3で更新した質量累積値Mに相当する質量電荷比を有するマススペクトル・データのピークを同定しなかった場合、ステップ7に進む。ステップ7では、候補アミノ酸検索処理部3における探索アミノ酸数Nを2に更新する。すなわち、探索アミノ酸数Nを1として検索しても、検索開始末端に位置するアミノ酸を同定できないと判断(ステップ4)したため、検索開始末端に位置するアミノ酸が開裂しなかったものと考えられる。そこで、ステップ7においては、検索開始末端に位置するアミノ酸を含むジペプチドをステップ7以降の処理で検出すべく候補アミノ酸検索処理部3における探索アミノ酸数Nを2にセットする。
【0070】
また、ステップ3〜6を繰り返し実行する際にステップ7に進んだ場合も同様に、候補アミノ酸検索処理部3における探索アミノ酸数Nを2に更新する。すなわち、ステップ3〜6を繰り返し実行することで同定されたアミノ酸配列の次のアミノ酸残基が単独で開裂しなかったものと考えられる。そこで、ステップ7においては、次の検索対象のアミノ酸をジペプチドとして検出すべく候補アミノ酸検索処理部3における探索アミノ酸数Nを2にセットする。
【0071】
ステップ7の後にステップ8では、候補アミノ酸検索処理部3によって、ステップ7で更新した探索アミノ酸数Nが予め設定した閾値Nthを超過する値であるか否か判断する。すなわち、ステップ8において、候補アミノ酸検索処理部3は、ステップ7でセットした探索アミノ酸数Nを閾値Nthと照合し、探索アミノ酸数Nを閾値Nthとを比較する。ステップ8において、探索アミノ酸数Nが閾値Nthを超過していないと判断した場合には、ステップ3に進み、ステップ7でセットした探索アミノ酸数Nでステップ3以降の処理を同様に実行する。一方、ステップ8において、探索アミノ酸数Nが閾値Nthを超過していると判断した場合には、ステップ9に進む。すなわち、ステップ7〜ステップ4の処理(ステップ5及び6の処理も含む)を繰り返す場合には、探索アミノ酸数Nは2以上の値となり、探索アミノ酸数Nが閾値Nthを超過するまでステップ7〜ステップ4の処理(ステップ5及び6の処理も含む)を繰り返すこととなる。
【0072】
なお、探索アミノ酸数Nが2以上の場合、ステップ4では、候補アミノ酸検索処理部3によって、N個のアミノ酸からなるペプチドの推定質量値を入力処理部2で入力したマススペクトル・データ(図6)の質量電荷比と照合する。このとき、ステップ4では、N個のアミノ酸からなるペプチドの中で、図4に示した統計値を用いて算出された各アミノ酸間のアミノ酸間開裂強度確率値は、N-1個目までの累積値が低く、N個目においての値が小さいペプチドから順にマススペクトル・データ(図6)の質量電荷比と照合することが望ましい。つまり、N−1個目までのアミノ酸が検出されないことは、N-1個目までのアミノ酸が開裂しづらく(切れにくく)、N個目では開裂しやすい(切れやすい)ことを想定することを意味している。
【0073】
一方、ステップ9では、質量累積演算処理部9によって、質量累積値Mを再検索すべき位置までのアミノ酸配列の質量値に戻す。すなわち、質量累積演算処理部9は、質量累積値Mから、検索開始末端とは反対の末端側のアミノ酸の質量を減算した値に更新する。ステップ9の後、ステップ2において探索アミノ酸数Nを1に初期化する。その後、ステップ3では、質量累積演算処理部9によって、上述したように質量累積値Mを更新するが、ステップ9において減算したアミノ酸以外のアミノ酸を候補アミノ酸とし、これら候補アミノ酸について質量累積値Mを更新する。なお、ステップ9の後に実行されるステップ3では、記憶手段に記憶されたそれまでに算出した評価値を検索して候補アミノ酸を選択してもよい。
【0074】
以上、図5に示したフローチャートに従った処理を実行することによって、アミノ酸配列同定装置1は、質量分析装置8から出力されたスペクトル・データを用いて特定のプレカーサーイオンのアミノ酸配列を同定することができる。アミノ酸配列同定装置1は、ステップ5において、候補アミノ酸毎に隣接するアミノ酸との間の切れ易さ及び候補アミノ酸毎にマススペクトル・データにおけるイオン強度を反映させて評価値Scoreを算出している。また、ステップ5では、候補アミノ酸毎の評価値Scoreに基づいて、同定対象のアミノ酸を同定している。一般に、例えばイソロイシンとロイシンについては、それぞれ質量が同じであるためにマススペクトル・データの質量電荷比のみから判別することは不可能である。しかしながら、上述したステップ5によれば、候補アミノ酸がイソロイシンである場合の評価値と、候補アミノ酸がロイシンである場合の評価値とを比較することによって、より可能性の高いアミノ酸配列を同定することができる。
【0075】
このように、図5に示したフローチャートに従った処理を実行することによって、アミノ酸配列同定装置1は、アミノ酸配列等を格納した既存のデータベースを使用することなく、配列同定対象のペプチドのアミノ酸配列を決定することができる。
【0076】
特に、図5に示したフローチャートに従った処理は、予めプレカーサーイオンの電荷質量比から当該プレカーサーイオンの質量を演算し、当該質量からプレカーサーイオン(配列同定対象のペプチド)に含まれるアミノ酸の種類及び個数で表される組合せを演算するステップを含む処理であってもよい。この処理は、組合せ演算処理部7によって行われる。組合せ演算処理部7は、表1〜4に示したアミノ酸質量テーブルから、制限付き組合せ問題の解法の一つであるナップザック問題を解くアルゴリズムを適用した処理によってアミノ酸の種類及び個数で表される組合せを演算することができる。ナップザック問題を解くアルゴリズムとは、特定の容量のナップサックに、それぞれ異なる大きさと価値を持つ数種類の荷物をナップサックに詰め込むときに、総価値が最大になるような品物の組合せを選択するという問題として知られている。組合せ演算処理部7は、ナップサックの容量をプレカーサーイオンの質量に見立て、詰め込む荷物を各アミノ酸の質量と個数に見立てて、この問題を“ナップサック問題”の解法によってペプチドの構成、つまり、アミノ酸の種類及び個数からなる組合せを算出する。また、組合せ演算処理部7は、ナップサックの容量に相当するプレカーサーイオンの質量に対して誤差を設定し、当該誤差を加算した質量に収まるアミノ酸の種類及び個数の組合せを全て列挙する。
【0077】
なお、コンピュータアルゴリズムとしてナップサック問題の解法を例にあげ説明を行ったが、組合せ演算処理部7は、所与の制約条件を満たす全解探索問題を解くコンピュータアルゴリズムを適用することでアミノ酸の組合せ全てを列挙することも可能である。なお、組合せ演算処理部7で算出したアミノ酸の種類及び個数の組合せは、例えばRAM103等の記憶手段に格納しておく。
【0078】
組合せ演算処理部7がアミノ酸の種類及び個数の組合せを演算することによって、ステップ4において候補アミノ酸検索処理部3は、質量累積値Mに相当する質量電荷比を有するマススペクトル・データのピークを同定して候補アミノ酸を検索する際に、記憶手段に格納した上記組合せのデータと照合し、当該組合せを満足しうる候補アミノ酸を同定する。これにより、ステップ4において検索する候補アミノ酸を絞り込むことができるため処理速度を向上させることができ、また、アミノ酸配列同定結果の精度を向上させることができる。
【0079】
なお、組合せ演算処理部7がアミノ酸の種類及び個数の組合せを演算するステップは、ステップ1に先立って実行してもよいし、ステップ1〜3と平行して実行しても良い。但し、本ステップは、ステップ4において候補アミノ酸検索処理部3が複数の候補アミノ酸から特定のアミノ酸を同定する前に実行される。
【0080】
ところで、本発明に係るアミノ酸配列同定装置10は、図7に示すように、組合せ演算処理部7と、組合せ演算手段7で演算された組合せの中から、配列同定対象のペプチドに関するアミノ酸配列を同定するアミノ酸配列同定部11とを備えるものであってもよい。組合せ演算処理部7は、上述した図2に示した組合せ演算処理部7と同様であり、詳細な説明は省略する。また、アミノ酸配列同定処理部10は、上述した図2に示した候補アミノ酸検索処理部3、評価値演算処理部4、同定処理部5及び質量累積演算処理部9からなるものであっても良いし、ペプチド・シーケンス・タグ法を実行するものであっても良い。
【0081】
このように構成されたアミノ酸配列同定装置10は、図8に示すフローチャートに従って配列同定対象のペプチド(プレカーサーイオン)のアミノ酸配列を同定することができる。本例においても、質量分析装置8としてMS/MSスペクトルを検出可能な装置を例示して説明する。
【0082】
先ず、ステップ11(図8において「S11」と記す。以下のステップも同様)において、質量分析装置8の第1の質量分析計から出力された、特定のプレカーサーイオンの質量電荷比を入力処理部2で入力し、入力したプレカーサーイオンの質量電荷比からプレカーサーイオンの質量を算出する。
【0083】
第1の質量分析計で測定したプレカーサーイオンの質量は、質量分析装置8の第1の質量分析計で測定したプレカーサーイオンの質量電荷比を用いて、入力処理部2において、荷電していないペプチドの質量を算出する。具体的にペプチドの質量は、プレカーサーイオンの質量電荷比からプロトンの質量を差し引き、電荷との積を計算することで求められる。
【0084】
次に、ステップ12では、算出したプレカーサーイオン質量を、予め設定してROM102等の記憶手段に格納した閾値Mthと照合し、当該プレカーサーイオン質量がMthより大きいか判断する。プレカーサーイオン質量がMthより大きいと判断した場合にはステップ13に進み、プレカーサーイオン質量がMthより以下であると判断した場合にはステップ14に進む。
【0085】
ここで、閾値Mthは、コンピュータリソースに大きく掛かる負担を考慮して適宜決定することができる。すなわち、コンピュータリソースが増大すれば、閾値Mthとしては、より大きな値を設定することができる。例えば、後述の図9−1〜9−5で用いる2価のプレカーサーの質量電荷比462.022、つまり質量922.028にMthを設定した場合は、少なくとも図9−1〜9−5に示される492通りのアミノ酸の組合せがRAM103に蓄えられる必要があるが、RAM103に十分な容量とそこに蓄えられるアミノ酸の組合せを十分処理可能なコンピュータリソースが得られれば、Mthをより大きなものに設定が可能になる。
【0086】
次に、ステップ13では、ステップ11で入力した、プレカーサーイオンの分解産物に由来するスペクトル・データを所定の位置で複数に分割(例えば、2分割)する。ここで、分割する位置は、入力したスペクトル・データにおける質量電荷比を示すピーク位置と、イオン強度を示すピーク高さとから最適に位置を選択する。例えば、分割後の配列同定対象ペプチドの質量が上記閾値Mthを超えないようなピーク位置で分割する。
【0087】
次に、ステップ14において、組合せ演算処理部7によって、第1の質量分析計で測定したプレカーサーイオンの質量、若しくは、ステップ13で分割した分割後の質量から配列同定対象のペプチドに含まれるアミノ酸の種類及び個数で表される組合せ(以降、候補アミノ酸セットと呼ぶ)を演算する。
【0088】
組合せ演算処理部7における候補アミノ酸セットの演算では、プレカーサーの質量に対して任意の誤差を与えた質量を持つことを想定し、コンピュータアルゴリズムを用いて候補アミノ酸セットを算出する。コンピュータアルゴリズムとしては、例えば、いわゆるナップザック問題を解く際に使用されるアルゴリズムを適用することができる。任意の誤差としては、プレカーサーイオンの質量電荷比に対して±0.005を設定することができる。より具体的に、プレカーサーイオンの質量電荷比が462.022(電荷;2価)の場合には、質量電荷比462.017から462.027までの質量に相当するペプチドを構成するアミノ酸の種類及び個数の組合せ(492通り)を算出した結果を図9−1〜9−5に示す。
【0089】
また、配列同定対象のペプチドがタンパク質消化酵素等の処理により取得したものである場合には、当該消化酵素の認識配列を考慮することで、算出結果の組合せを絞り込むことも可能となり、図9−1〜9−5はこれを考慮した結果である。
【0090】
ナップザック問題は、特定の容量のナップサックに、それぞれ異なる大きさと価値を持つ数種類の荷物をナップサックに詰め込むときに、総価値が最大になるような品物の組合せを選択するという問題として知られている。組合せ演算処理部7においては、ナップサック容量をプレカーサーの質量に見立て、詰め込む荷物を各アミノ酸の質量と個数に見立てて、プレカーサーイオンを構成するアミノ酸の種類と個数を算出する。組合せ演算処理部7における処理において、ナップサック問題の解法を利用する場合は、実際のナップサック問題の解法と違い、ナップサック容量に相当するプレカーサーイオンの質量に対して誤差を設定し、容量誤差内(質量誤差内)に収まる荷物(アミノ酸)の組合せを全て列挙する。
【0091】
また、組合せ演算処理部7では、ナップサック問題の解法アルゴリズムを適用する処理に限定されず、所与の制約条件を満たす全解探索問題を解くコンピュータアルゴリズムを適用する処理を行うことで、プレカーサーイオンを構成するアミノ酸の種類及び個数の組合せ全てを列挙することもできる。なお、組合せ演算処理部7で算出したアミノ酸の種類及び個数の組合せは、例えばRAM103等の記憶手段に格納しておく。
【0092】
次に、ステップ15では、適用する配列同定方法を選択する。ステップ14において算出され、記憶手段に格納されたアミノ酸の種類及び個数の組合せを用いる場合(方法1)にはステップ16に進み、配列同定対象ペプチドのアミノ酸配列を同定する手法としては、上述した図5に示したフローチャートに従った処理を挙げることができる。また、記憶手段に格納されたアミノ酸の種類及び個数の組合せを用いる場合、いわゆるペプチド・シーケンス・タグ法を適用して、配列同定対象ペプチドのアミノ酸配列を同定することもできる(方法2)。
【0093】
ペプチド・シーケンス・タグ法では、ステップ17において、先ず、アミノ酸の種類及び個数からなる組合せを格納した記憶手段をデータベースとして用いるため、組合せから想定される全てのアミノ酸の順列を算出する。順列算出時には、消化酵素を踏まえ、所定のアミノ酸を末端として有するように考慮して、アミノ酸配列を列挙する。例えば、図9−1〜9−5に示した組合せ(492通り)のなかで、組合せ”AE(2)FKTV(2)”を例に取ると、以下を含む1,260種類のアミノ酸配列が得られる。ペプチド・シーケンス・タグ法では、これらの配列をアミノ酸配列データベースと見立てることで、アミノ酸配列同定に使用する。
【0094】
【表6】

【0095】
次に、ステップ16において、このように構築したアミノ酸配列の順列をデータベースとすることでペプチド・シーケンス・タグ法によるアミノ酸配列同定を行うことができる。ここで、ペプチド・シーケンス・タグ法とは、質量分析計中で特定のプレカーサーイオンを選択後、更に、選択したプレカーサーイオンから得られるプロダクトイオンのスペクトル(MS/MSスペクトル)を用い、ステップ17により算出したアミノ酸配列をデータベースとして、データベースサーチを行う方法を意味する。衝突によるペプチドイオンの開裂はほぼ決まった位置(主に主鎖:図2参照)で起こる為、ステップ17におけるアミノ酸配列のプロダクトイオン質量は予測可能である。そこで、本例におけるペプチド・シーケンス・タグ法では、ステップ17により算出したアミノ酸配列から想定されるプロダクトイオンの質量とMS/MSスペクトルの示す質量値を比較する。
【0096】
具体的に、アミノ酸配列が既知のウシ血清アルブミン(BSA)をTrypsinにて消化することで得られるペプチド断片 “AEFVEVTK”(検出質量電荷比(2価):462.022) の質量分析結果をもとに、アミノ酸配列同定を実施した。ステップ17により求められたアミノ酸配列が質量分析結果として得られる場合の各イオンの質量電荷比(Average)、つまり、プロダクトイオンの質量電荷比と、表5に示したms/ms ピークリストに±0.5の誤差を与えた質量電荷比を比較することで、以下の’AEFVEVTK’といったアミノ酸配列を同定した。例として、ステップ17において算出されたペプチド配列中の”AVFVEVTK”が、b-ion、y-ion、またそれらが多価イオン、脱水、脱アミノとして検出された場合の質量の内、表5と±0.5の誤差で一致した質量値を表7に示す。
【0097】
【表7】

【0098】
ステップ17において算出されたアミノ酸配列のうち”AEFVEVTK”が配列全体に渡り、表5のMS/MSSピークリストと一致していることにより、配列同定結果として認められる。なお、表7において、y、b は各開裂イオン系列を示し、++は2価イオン、*は脱アミノ、Oは脱水時の質量を示す。
【図面の簡単な説明】
【0099】
【図1】本発明に係るアミノ酸配列同定装置のハードウェア構成を説明するための概略構成図である。
【図2】本発明に係るアミノ酸配列同定装置1の機能的構成について説明するための概略ブロック図である。
【図3】ペプチド結合における切断位置と、切断後に生成される開裂アミノ酸の分子構造を説明するための図である。
【図4】一対のアミノ酸間における切れ易さを示す特性図である。
【図5】本発明に係るアミノ酸配列同定方法及びプログラムを適用した具体的な処理の一例を示すフローチャートである。
【図6】ウシ血清アルブミン(BSA)をTrypsinで消化することで得られるペプチド断片のうち、ペプチド“AEFVEVTK”(検出質量電荷比(2価):462.022)をプレカーサーイオンとして得られたMS/MSスペクトルを示す特性図である。
【図7】本発明に係るアミノ酸配列同定装置10の機能的構成について説明するための概略ブロック図である。
【図8】本発明に係るアミノ酸配列同定方法及びプログラムを適用した具体的な処理の他の例を示すフローチャートである。
【図9−1】質量電荷比462.017から462.027までの質量に相当するペプチドを構成するアミノ酸の種類及び個数の組合せ(492通り)を算出した結果を示す図である。
【図9−2】質量電荷比462.017から462.027までの質量に相当するペプチドを構成するアミノ酸の種類及び個数の組合せ(492通り)を算出した結果を示す図である。
【図9−3】質量電荷比462.017から462.027までの質量に相当するペプチドを構成するアミノ酸の種類及び個数の組合せ(492通り)を算出した結果を示す図である。
【図9−4】質量電荷比462.017から462.027までの質量に相当するペプチドを構成するアミノ酸の種類及び個数の組合せ(492通り)を算出した結果を示す図である。
【図9−5】質量電荷比462.017から462.027までの質量に相当するペプチドを構成するアミノ酸の種類及び個数の組合せ(492通り)を算出した結果を示す図である。
【符号の説明】
【0100】
1…アミノ酸配列同定装置、2…入力処理部、3…候補アミノ酸検索処理部、4…評価値演算処理部、5…同定処理部

【特許請求の範囲】
【請求項1】
配列同定対象のペプチドを含む試料から得られる、質量電荷比とイオン強度からなるマススペクトルを入力する入力手段と、
アミノ酸の理論質量値をアミノ酸毎に記憶した記憶手段から、d番目(dは0以上の整数)までのペプチド断片のアミノ酸配列に基づいて推定質量値を算出し、算出した推定質量値にアミノ酸の理論質量値をそれぞれ加算して得られるd+N番目(Nは探索アミノ酸数であり、1以上の整数)までのペプチド断片の推定質量値をそれぞれ算出し、d+N番目までのペプチド断片の推定質量値と上記入力手段から入力したマススペクトルのうち特定のマススペクトルの質量電荷比から算出される実測質量値との差を算出し、算出した差のなかで所定の範囲内にあるものを同定し、同定した差を算出するのに使用したN個のアミノ酸をd+1〜d+N番目のアミノ酸の候補アミノ酸とする候補アミノ酸検索手段と、
候補アミノ酸検索手段で検索した各候補アミノ酸に関して、上記同定した差に対して、上記特定のマススペクトルのイオン強度が高い場合及びd番目のアミノ酸と当該候補アミノ酸との間が切れ易い場合を正に評価する評価関数を用いてそれぞれ評価値を演算する評価値演算手段と、
得られた評価値を用いて上記候補アミノ酸から1の候補アミノ酸を同定することで、上記ペプチドにおけるd+N番目までのペプチド断片におけるアミノ酸配列を同定する同定手段とを備える、アミノ酸配列同定装置。
【請求項2】
上記入力手段で入力したマススペクトルに含まれるイオン強度を確率変数内で均一に分散させるようにスケーリングするイオン強度確率値演算手段を更に備え、
上記評価値演算手段は、上記イオン強度確率値演算手段によって算出されたイオン強度確率値を用いて評価値を算出することを特徴とする請求項1記載のアミノ酸配列同定装置。
【請求項3】
上記アミノ酸間の切れ易さとして、アミノ酸間の切れ易さの統計値を確率値として算出したアミノ酸間開裂強度確率値を格納した記憶手段を更に備え、
上記評価値演算手段は、上記記憶手段から読み出したアミノ酸間開裂強度確率値を用いて評価値を演算することを特徴とする請求項1記載のアミノ酸配列同定装置。
【請求項4】
上記記憶手段に格納されたアミノ酸の理論質量値を用いて、配列同定対象のペプチドの質量に基づいて、当該ペプチドに含まれるアミノ酸の種類及び個数で表される組合せを演算する組合せ演算手段を更に備え、
上記同定手段は、最も高く評価される評価値を示す候補アミノ酸をd+N番目のアミノ酸としたペプチド断片に含まれるアミノ酸の種類及び個数を、上記組合せ演算手段で算出した組合せと照合し、これら組合せの中に当該ペプチド断片のアミノ酸の種類及び個数を含む組合せが存在しないと判断した場合には、当該候補アミノ酸を除く候補アミノ酸から、上記ペプチドにおけるd+N番目のアミノ酸を同定することを特徴とする請求項1記載のアミノ酸配列同定装置。
【請求項5】
上記アミノ酸の理論質量値には、1つのアミノ酸に関して、ペプチド結合の切断位置に対応した複数の値が含まれていることを特徴とする請求項1記載のアミノ酸配列同定装置。
【請求項6】
上記アミノ酸の理論質量値には、1つのアミノ酸に関して、化学的修飾を有する場合を想定した複数の値が含まれていることを特徴とする請求項1記載のアミノ酸配列同定装置。
【請求項7】
上記記憶手段に格納されたアミノ酸の理論質量値を用いて、配列同定対象のペプチドの質量に基づいて、当該ペプチドに含まれるアミノ酸の種類及び個数で表される組合せを演算する組合せ演算手段を更に備え、
上記組合せ演算手段は、上記入力手段で入力される配列同定対象のペプチドの質量が特定の閾値より大きい場合には、上記入力手段で入力したマススペクトルを複数に分割して処理することを特徴とする請求項1記載のアミノ酸配列同定装置。
【請求項8】
上記組合せ演算手段は、制限付き組合せ問題を解くアルゴリズムを適用した処理を行うことを特徴とする請求項4又は7記載のアミノ酸配列同定装置。
【請求項9】
上記d+N番目の候補アミノ酸に対する評価値は、d番目までのペプチドを同定するまでに使用した評価値の累積値であることを特徴とする請求項1記載のアミノ酸配列同定装置。
【請求項10】
配列同定対象のペプチドを含む試料から得られる、当該ペプチドの質量値を入力する入力手段と、
アミノ酸の理論質量値をアミノ酸毎に記憶した記憶手段から読み出したアミノ酸の理論質量値を用いて、上記入力手段で入力した配列同定対象のペプチドの質量に基づいて、当該ペプチドに含まれるアミノ酸の種類及び個数で表される組合せを演算する組合せ演算手段と、
上記組合せ演算手段で演算された組合せの中から、配列同定対象のペプチドに関するアミノ酸配列を同定するアミノ酸配列同定手段とを備える、アミノ酸配列同定装置。
【請求項11】
上記アミノ酸配列同定手段は、既知ペプチドに関するアミノ酸配列配列を格納したデータベースを用いて配列同定対象のペプチドに関するアミノ酸配列を同定することを特徴とする請求項10記載のアミノ酸配列同定装置。
【請求項12】
上記組合せ演算手段は、制限付き組合せ問題を解くアルゴリズムを適用した処理を行うことを特徴とする請求項10記載のアミノ酸配列同定装置。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9−1】
image rotate

【図9−2】
image rotate

【図9−3】
image rotate

【図9−4】
image rotate

【図9−5】
image rotate


【公開番号】特開2006−162556(P2006−162556A)
【公開日】平成18年6月22日(2006.6.22)
【国際特許分類】
【出願番号】特願2004−358487(P2004−358487)
【出願日】平成16年12月10日(2004.12.10)
【出願人】(503119030)株式会社メディカル・プロテオスコープ (5)
【Fターム(参考)】