説明

質量分析を用いたアミノ酸配列解析方法、アミノ酸配列解析装置、アミノ酸配列解析用プログラム、及びアミノ酸配列解析用プログラムを記録した記録媒体

【課題】デノボ・シーケンスによるアミノ酸配列の推定の信頼性を向上させる。
【解決手段】マススペクトルデータに基づいてアミノ酸配列候補を選定する際に、その信頼度を示すスコアを最大化するアミノ酸配列候補を見い出す問題を、一方向の軸がアミノ酸配列上の位置、他方向の軸がマススペクトルの質量である2次元的な非巡回的グラフ上の最長路問題として定式化する。そして、被検ペプチドに由来するピークの質量と強度とを集めたピークリストに基づいて経路探索を実行することでピーク強度を加算したスコアを求め、スコアの大きなものを選択して経路を逆に辿りながら各アミノ酸を特定し、アミノ酸配列を求める。この方法によれば、高速の演算処理が可能であるため、正しいアミノ酸配列が漏れないように多数の候補を挙げることができる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ペプチド混合物を含む目的試料を質量分析し、これにより得られたマススペクトルデータを用いて各ペプチドのアミノ酸配列を推定するためのアミノ酸配列解析方法、アミノ酸配列解析装置、アミノ酸配列解析用プログラム、及びアミノ酸配列解析用プログラムを記録した記録媒体に関する。
【背景技術】
【0002】
近年、ポストゲノム研究としてタンパク質の構造や機能の解析が急速に進められている。このようなタンパク質の構造・機能解析手法(プロテオーム解析)の一つとして、質量分析装置を用いたタンパク質の発現解析や一次構造解析が広く行われるようになってきており、四重極型イオントラップや衝突誘起分解(CID)などによって特定のピークの捕捉と開裂を行う、いわゆるMS分析(nは2以上の整数)が威力を発揮している。一般にMS2(=MS/MS)分析では、まず、分析対象物から特定の質量電荷比(質量m/電荷z)を有するイオンをプリカーサイオンとして選別し、該プリカーサイオンをCIDによって開裂させる。その後、開裂によって生成したイオン(プロダクトイオン)を質量分析することによって、目的とするイオンの質量や化学構造についての情報を得ることができる。
【0003】
上記のようなMS分析によってタンパク質のアミノ酸配列を同定する場合には、まず、タンパク質を適当な酵素で消化してペプチド断片の混合物としてから、該ペプチド混合物を質量分析する。このとき、各ペプチドを構成する元素には質量の異なる安定同位体が存在するため、同一のアミノ酸配列から成るペプチドであっても、その同位体組成の違いによって質量電荷比の異なる複数のピークを生じる。該複数のピークは、天然存在比が最大の同位体のみで構成されたイオン(主イオン)のピークと、それ以外の同位体を含むイオン(同位体イオン)のピークから成り、これらはイオンの価数が1の場合には1Da間隔で並んだ複数本のピークから成る同位体ピーク群を形成する。
【0004】
続いて、上記のようなペプチド混合物のマススペクトルデータの中から、単一のペプチドに由来する一組の同位体ピーク群をプリカーサイオンとして選択し、該プリカーサイオンを開裂させて得られたイオン(プロダクトイオン)の質量分析(MS分析)を行う。また、1回の開裂操作では十分に小さな断片に開裂しない場合には、開裂操作を複数回行うことも考えられる。
【0005】
以上のようにして得られたプロダクトイオンのマススペクトルパターンや上記プリカーサイオンのマススペクトルパターンを基に、例えばマトリックスサイエンス社が提供しているマスコット(MASCOT)等の検索エンジンを利用してアミノ酸配列同定用データベース検索を実行することにより、被検ペプチドのアミノ酸配列を決定することができる。しかしながら、データベースに登録されていない新規なタンパク質の場合には上記方法を利用できないため、デノボ(De Novo)・シーケンスと呼ばれる方法でマススペクトルからアミノ酸配列を推定する方法が採られている。簡単に言うと、デノボ・シーケンスは、マススペクトルに現れる複数のピークの間の質量差に一致する質量のアミノ酸を探索することで被検ペプチドのアミノ酸配列を推定する方法である。このための探索のアルゴリズムは従来より各所で検討されており、グラフ理論を利用した方法、動的計画法を利用した方法などが開発・提案されている。そうした方法の1つとして非特許文献1に記載の動的計画法に基づくアルゴリズムがある。
【0006】
この非特許文献1に記載のアルゴリズムのポイントは、チャミー・ペア(Chummy Pair)と名付けられた、特異的なN末端側アミノ酸配列AとC末端側アミノ酸配列A’とによるサンドウィッチ(Sandwich)アルゴリズムである。ここでは、同定対象である未知のペプチドPのアミノ酸配列は、チャミー・ペアを利用しA−a−A’とサンドウィッチ形式で表される。いま、N末端側アミノ酸配列Aの質量をx、アミノ酸aの質量を‖a‖ 、C末端側アミノ酸配列A’の質量をy、エラー境界をδと表すと、アミノ酸配列の推定は|x+y+‖a‖−M|≦δの関係を満たすペプチドを見つけることに帰着される。但し、質量Mは、正しいアミノ酸質量の総和+N末端質量(Nterm=H=1.00782Da)+C末端質量(Cterm=OH+H+H=19.0184Da)である。こうして複数個のアミノ酸配列の候補が複数挙げられるから、それらは所定のスコアリング手法により順序付けされる。
【0007】
スコアリング手法としては例えば非特許文献2に記載の方法を用いることができる。このスコアリング手法では次の(1)式のスコアリング関数が用いられている。
f(h/h)×f(h/h)×f(h/h)×exp{−[(m’−m)/Δ]}×logh …(1)
ここで、hはb/yイオンの強度、h、hはサポーティング・イオン(supporting ions=neutral lossと副シリーズ)の強度、m’は測定質量、mは理論質量、Δは測定質量m’の許容誤差(tolerance)である。即ち、これは、b/yイオンが存在すればサポーティング・イオンに応じてその強度にボーナス点を付与する方法であると理解できる。なお、ボーナス点を与えるための関数fは経験的に与えられている。
【0008】
【非特許文献1】ビン・マ(Bin Ma)ほか、「アン・エフェクティブ・アルゴリズム・フォー・ザ・ペプチド・デ・ノボ・シーケンシング・フロム・エムエス/エムエス・スペクトラム(An Effective Algorithm for the Peptide De Novo Sequencing from MS/MS Spectrum)」、シンポジウム・コンビナトリアル・パターン・マッチング(Symp. Comb. Pattern Matching)、2003、pp.266-pp.277
【非特許文献2】ビン・マ(Bin Ma)ほか、「ピークス:ア・パワフル・ソフトウエア・フォー・ペプチド・デ・ノボ・シーケンシング・バイ・エムエス/エムエス(PEAKS: A Powerful Software for Peptide De Novo Sequencing by MS/ MS)」、ラピッド・コミュニケーション・オブ・スペクトロメトリ(Rapid Communication of Mass Spectrometry)、17, 20 (2003), pp.2337-pp.2342
【発明の開示】
【発明が解決しようとする課題】
【0009】
しかしながら、本願発明者の検討によれば、上述したような非特許文献1、2に基づく従来のアミノ酸配列推定方法によっても、正しいアミノ酸配列を推定できる確率は必ずしも高くないことが明らかになっている。その理由の1つは、上述のような動的計画法のアルゴリズムでは複数の候補が挙げられるが、その中に正しいアミノ酸配列が含まれない場合があるからである。また他の理由は、動的計画法で得られた複数の候補の中に正しいアミノ酸配列が含まれていたとしても、上述したようなスコアリング法ではこれを必ずしも最上位にランキングできない場合があるからである。
【0010】
特に、最初のアミノ酸配列候補の選定の段階で正しいアミノ酸配列が落ちてしまうと、その後のスコアリングの精度をいくら向上させても意味がない。その点で、マススペクトルデータに基づいて、正しいアミノ酸配列が含まれるようにその候補を選定するという演算処理は非常に重要である。本発明はこうした点に鑑みて成されたものであり、その目的とするところは、従来の動的計画法では正しい推定ができないようなデータに対しても正しい推定を行うことができ、安定して信頼度の高いデノボ・シーケンスを実行することができるアミノ酸配列解析方法、アミノ酸配列解析装置、アミノ酸配列解析用プログラム、及びアミノ酸配列解析用プログラムを記録した記録媒体を提供することにある。
【課題を解決するための手段】
【0011】
上記課題を解決するために成された第1発明に係るアミノ酸配列解析方法は、質量分析により得られたマススペクトルデータに基づいて目的試料のアミノ酸配列を推定するためのアミノ酸配列解析方法であって、
a)マススペクトルデータに基づいて目的試料に由来するピークの質量とピーク強度とを集めたピークリストを作成するピークリスト作成ステップと、
b)前記ピークリストに含まれるデータを元に動的計画法によるアルゴリズムを利用したデノボ・シーケンス解析を行って複数のアミノ酸配列候補を選出するアミノ酸配列候補決定ステップと、
c)前記複数のアミノ酸配列候補のそれぞれについて、マススペクトルデータを利用し、そのアミノ酸配列が目的試料のアミノ酸配列に合致する確からしさを示す確度情報を算出する確度算出ステップと、
d)前記確度情報により複数のアミノ酸配列候補を選別して又は序列を決めて提示する提示ステップと、
を有し、前記アミノ酸配列候補決定ステップでは、ピークリストに挙げられているピークの中で順次選択するピークの強度を加算して算出されるスコアを最大化する又はより大きくするようなアミノ酸配列候補の選定を、アミノ酸配列上の結合位置とマススペクトルの質量とをそれぞれ異なる方向の軸とする非巡回的グラフにおける最長路及びより長い有向路を見い出す問題として定式化し、ピークリストを利用して前記非巡回的グラフ上でアミノ酸配列末端で且つ質量が小さい側を出発点として各アミノ酸結合位置毎に有向路を探索するようにしたことを特徴としている。
【0012】
また第2発明に係るアミノ酸配列解析装置は、コンピュータ上で上記第1発明に係るアミノ酸配列解析方法を実現するための装置であって、
a)マススペクトルデータに基づいて目的試料に由来するピークの質量とピーク強度とを集めたピークリストを作成するピークリスト作成手段と、
b)前記ピークリストに含まれるデータを元に動的計画法によるアルゴリズムを利用したデノボ・シーケンス解析を行って複数のアミノ酸配列候補を選出するアミノ酸配列候補決定手段と、
c)前記複数のアミノ酸配列候補のそれぞれについて、マススペクトルデータを利用し、そのアミノ酸配列が目的試料のアミノ酸配列に合致する確からしさを示す確度情報を算出する確度算出手段と、
d)前記確度情報により複数のアミノ酸配列候補を選別して又は序列を決めて提示する情報提示手段と、
を備え、前記アミノ酸配列候補決定手段では、ピークリストに挙げられているピークの中で順次選択するピークの強度を加算して算出されるスコアを最大化する又はより大きくするようなアミノ酸配列候補の選定を、アミノ酸配列上の結合位置とマススペクトルの質量とをそれぞれ異なる方向の軸とする非巡回的グラフにおける最長路及びより長い有向路を見い出す問題として定式化し、ピークリストを利用して前記非巡回的グラフ上でアミノ酸配列末端で且つ質量が小さい側を出発点として各アミノ酸結合位置毎に有向路を探索する処理を実行することを特徴としている。
【0013】
また第3発明に係るアミノ酸配列解析用プログラムは、コンピュータ上で上記第1発明に係るアミノ酸配列解析方法を実現するためのプログラムであって、
a)マススペクトルデータに基づいて目的試料に由来するピークの質量とピーク強度とを集めたピークリストを作成するピークリスト作成ステップと、
b)前記ピークリストに含まれるデータを元に動的計画法によるアルゴリズムを利用したデノボ・シーケンス解析を行って複数のアミノ酸配列候補を選出するアミノ酸配列候補決定ステップと、
c)前記複数のアミノ酸配列候補のそれぞれについて、マススペクトルデータを利用し、そのアミノ酸配列が目的試料のアミノ酸配列に合致する確からしさを示す確度情報を算出する確度算出ステップと、
d)前記確度情報により複数のアミノ酸配列候補を選別して又は序列を決めて提示する提示ステップと、
をコンピュータに実行させるものであり、前記アミノ酸配列候補決定ステップでは、ピークリストに挙げられているピークの中で順次選択するピークの強度を加算して算出されるスコアを最大化する又はより大きくするようなアミノ酸配列候補の選定を、アミノ酸配列上の結合位置とマススペクトルの質量とをそれぞれ異なる方向の軸とする非巡回的グラフにおける最長路及びより長い有向路を見い出す問題として定式化し、ピークリストを利用して前記非巡回的グラフ上でアミノ酸配列末端で且つ質量が小さい側を出発点として各アミノ酸結合位置毎に有向路を探索するようにしたことを特徴としている。
【0014】
さらにまた第4発明に係るアミノ酸配列解析用プログラムを記録した記録媒体は、上記第3発明に係るアミノ酸配列解析用プログラムを記録したコンピュータ読み取り可能な記録媒体であって、
a)マススペクトルデータに基づいて目的試料に由来するピークの質量とピーク強度とを集めたピークリストを作成するピークリスト作成ステップと、
b)前記ピークリストに含まれるデータを元に動的計画法によるアルゴリズムを利用したデノボ・シーケンス解析を行って複数のアミノ酸配列候補を選出するアミノ酸配列候補決定ステップと、
c)前記複数のアミノ酸配列候補のそれぞれについて、マススペクトルデータを利用し、そのアミノ酸配列が目的試料のアミノ酸配列に合致する確からしさを示す確度情報を算出する確度算出ステップと、
d)前記確度情報により複数のアミノ酸配列候補を選別して又は序列を決めて提示する提示ステップと、
をコンピュータに実行させるものであり、前記アミノ酸配列候補決定ステップでは、ピークリストに挙げられているピークの中で順次選択するピークの強度を加算して算出されるスコアを最大化する又はより大きくするようなアミノ酸配列候補の選定を、アミノ酸配列上の結合位置とマススペクトルの質量とをそれぞれ異なる方向の軸とする非巡回的グラフにおける最長路及びより長い有向路を見い出す問題として定式化し、ピークリストを利用して前記非巡回的グラフ上でアミノ酸配列末端で且つ質量が小さい側を出発点として各アミノ酸結合位置毎に有向路を探索するようにしたことを特徴としている。
【0015】
ここでマススペクトルデータとは、通常、目的とする被検ペプチドをプリカーサイオンとして、これを1乃至複数段階に開裂させることで発生したプロダクトイオンを検出するMS分析により得られたマススペクトルデータである。
【0016】
第1発明に係るアミノ酸配列解析方法では、アミノ酸配列候補決定ステップにおいて、推定されるアミノ酸配列の確からしさをスコアで以て判断するが、そのスコアを最大化するアミノ酸配列候補を見い出す問題を非巡回的グラフ上の最長路問題として定式化する。その際に、非巡回的グラフとして、一方向の軸がアミノ酸配列上の結合位置、他方向の軸がマススペクトルの質量である2次元的なグラフを考える。一般的に動的計画法により最長路問題を解く際に問題となるのは、有向路の数が多く計算に時間が掛かりすぎて実用的でなくなることにある。これに対し、上述のような2次元的な非巡回的グラフ上で有向路の探索を行えば、アミノ酸配列で結合しているアミノ酸の数はたかだか30個程度であるため、1つアミノ酸配列のための探索経路中の有向路の数もそれと同程度に収まる。したがって、短い時間で1つアミノ酸配列のための探索経路を見い出すことができる。
【0017】
その探索に伴って算出されるスコアの精度が高ければ最長路のみを求めればよいが、実際にはこのスコアが最大のものが正解のアミノ酸配列となるとは限らない。そこで、最長路のみならず、2番目、3番目、…、K番目に長い経路も求め、これに対応したアミノ酸配列を候補として挙げる。なお、ここでKの値は例えば計算時間と推定精度との兼ね合いで決めればよく、一例としては2000とすることができる。このように最長路に次ぐ幾つかの経路を効率的に、つまりは実用上十分に短い時間で探索するためには、デビッド・エプステイン(David Eppstein)、「ファインディング・ザ・k・ショーテスト・パスズ(Finding The k Shortest Paths)」、SiAM J. Computing、Vol.28、 No.2、pp.652-673 (1998)、に開示されている方法を利用することができる。
【発明の効果】
【0018】
第1乃至第4発明に係るアミノ酸配列解析方法、アミノ酸配列解析装置、アミノ酸配列解析用プログラム、及びアミノ酸配列解析用プログラムを記録した記録媒体によれば、上述のような動的計画法によりより大きなスコアを与えるアミノ酸配列候補の選定を迅速に行うことができる。それにより、実用的な計算時間において多数の候補を挙げることができ、正しいアミノ酸配列が候補から漏れることを回避することができる。その結果、デノボ・シーケンスの信頼性を向上させ、アミノ酸配列の同定精度を従来よりも高めることができる。
【発明を実施するための最良の形態】
【0019】
以下、本発明に係るアミノ酸配列解析方法、アミノ酸配列解析装置、アミノ酸配列解析用プログラム、及びアミノ酸配列解析用プログラムを記録した記録媒体について図面を参照して説明する。図1は本実施例のアミノ酸配列解析方法の概略フローチャートである。このアミノ酸配列解析方法は、アミノ酸配列解析用プログラムを記録した、例えばCD−ROM(CD−R、CD−RW)、MO、DVD−RAM、メモリカード、FDなどの着脱自在の記録媒体、HDDなどの一般的に着脱自在ではない記録媒体など、様々な記録媒体をコンピュータで読み取らせ、このプログラムを実行することで達成されるものである。
【0020】
まず、例えばMALDI−イオントラップ型TOFMSなどのMS/MS質量分析装置により、目的とする被検ペプチドを含む試料の質量分析(MS分析)を行って、検出されたイオンの質量(厳密には質量電荷比)と強度との関係を示すマススペクトルデータを収集する(ステップS1)。実質的にコンピュータにより構成されるデータ解析装置には、収集されたマススペクトルデータが入力されることになる。通常、マススペクトルデータに基づいて得られるマススペクトルには図2(a)に示すようにノイズを含めて多数のピークが出現する。
【0021】
次に、マススペクトルの中で目的とする被検ペプチド由来のピークを選択し、解析対象となるピークの質量と強度とを集めたピークリストを作成する(ステップS2)。ここでピークの選択は、例えば、ロビン・グラス(Robin Gras)ほか、「インプルービング・プロテイン・アイデンティフィケイション・フロム・ペプチド・マス・フィンガープリンティング・スルー・ア・パラメタライズド・マルチ−レベル・スコアリング・アルゴリズム・アンド・アン・オプティマイズド・ピーク・デテクション(Improving protein identification from peptide mass fingerprinting through a parameterized multi-level scoring algorithm and an optimized peak detection)」、エレクトロフォレシス(Electrophoresis)、20、 pp.3535-3550 (1999)、に開示されている方法を利用することができる。即ち、同位体ピーククラスタ(同一の元素組成を有するイオンに由来し、イオン中の同位体組成の相違によって異なる質量電荷比を示す複数本のピークから成るピーク群)の強度比を理論値と測定値とで比較することにより、不所望のノイズのピークを除外して解析対象とすべきピークを選択することができる。
【0022】
次いで、上述のように作成されたピークリストを用い、動的計画法による所定のアルゴリズムに従ってアミノ酸配列の候補を求める(ステップS3)。このアルゴリズムの原理について説明する。ここでは、アミノ酸配列候補にその確からしさを類推する指標としてスコアを与え、そのスコアを最大化する候補を見い出す問題を非巡回的グラフ(有向閉路を含まないグラフ)における最長路問題(longest path problem)として定式化することで、動的計画法による解法を可能とした。即ち、図3に示すように、互いに直交する一方向(図3では上から下へ向かう縦方向)に質量mをとり、他の一方向(図3では左から右へ向かう横方向)にアミノ酸配列末端から1個ずつのアミノ酸結合位置(a1、a2、…、a10)をとった2次元的な非巡回的グラフを考える。
【0023】
この非巡回的グラフにおいて、次のような手順でアミノ酸配列の候補を見い出す。即ち、図3において左端の縦軸が配列末端であり、この軸上が探索の出発点となる。図2(a)に示すようにマススペクトル上で(実際にはピークリストの中で)質量が小さい側から順に、ピークの質量に相当するアミノ酸が存在するかどうかを調べ、存在する場合にはその質量を図3に示すグラフの配列末端の軸上にプロットする。例えば図2(b)においてピークP1の質量m1に相当するアミノ酸が存在する場合には配列末端の軸上の質量m1の位置に探索経路の出発点をプロットする。
【0024】
次に、マススペクトル上でピークP1と隣接する次のピークとの質量の差に相当するアミノ酸が存在するかどうかを調べ、存在する場合には先のアミノ酸の質量にこの2番目のアミノ酸の質量を加算した値を図3に示すグラフのa1とa2の間の縦線上に次の点としてプロットする。もし、ピークP1と隣接する次のピークとの質量の差に相当するアミノ酸が存在しなければ、更に高質量側に隣接するピークとの質量の差に相当するアミノ酸が存在するかどうかを調べる。例えば図2(b)の例では、ピークP1とピークP4との質量の差m4に相当するアミノ酸が存在したものとすると、図3のグラフで質量m1+m4の位置に次の点をプロットする。その際に、選択した各ピークの強度を加算してスコアとするから、ピークP4が選択された時点でスコアはi1+i4となる。
【0025】
上記のようにして、図2(b)に示すマススペクトル上では質量の小さなものから順にアミノ酸の質量に適合するピークを調べ、図3に示すグラフ上では配列末端から順にアミノ酸質量の和に従って探索の有向路を延ばしていく。それと共にピーク強度を加算することでスコアを増加させていく。そして、選択したアミノ酸の個数が、(プリカーサイオン質量)/(アミノ酸の最小質量)より多くなれば、それ以上アミノ酸を選択することはできないから経路探索を停止する。なお、1つのアミノ酸配列に対し、前述の(1)式と同様に、サポーティング・イオンを含む複数のピークの強度がスコアに加算されるようにする。
【0026】
図3の例では、3つの探索経路R1、R2、R3が見い出されており、探索経路R1は9個のアミノ酸が選択されて合計のスコアが390、探索経路R3は同じく9個のアミノ酸が選択されて合計のスコアが360、探索経路R2は10個のアミノ酸が選択されて合計のスコアが460である。なお、一般的に、こうした経路探索では、複数経路が同一地点を通るとそれ以前の経路の中で古いもの又はスコアが小さいものが消去されるが、ここでは複数経路の全てが保存される。その場合でも、上述したデビッド・エプステインの文献に記載の方法を利用して探索時間が長くなることを回避することができる。
【0027】
図3の例では3本の探索経路R1、R2、R3のみが記載されているが、実際には、多くの場合、かなり多数の探索経路が見出されることになり、その中でスコアの高い幾つかの経路に対し、図4に例示するように終点から逆向きに経路を辿ることで各配列位置に対応するアミノ酸を特定していく。図4では、LVVYPWTQRいうアミノ酸配列が特定されている。こうして複数の探索経路についてアミノ酸配列を特定することで、アミノ酸配列候補を決定する。
【0028】
次に、上記のようにして得られた複数のアミノ酸配列候補のそれぞれについて、精密なスコアを算出する(ステップS4)。即ち、上記ステップS3でもスコアを算出しているが、それはあくまでもアミノ酸配列候補を絞るための目安としての概算値であり、ステップS4におけるスコアは候補をランキングするためのより精密な値である。具体的には、基本的にピーク強度の加算によりスコアを求めるのは同じであるが、アミノ酸配列を仮定したときのフラグメントパターンを考慮し、サポーティング・イオンなど複数種のフラグメントイオンに相当するピークの強度はスコアに1回しか加算しないようにする。また、プリカーサイオンの種類は同一であってもフラグメントパターンの態様は質量分析装置の種類などに依存して相違する。そこで、例えば実験的にフラグメントパターンの出方を調べておき、それに基づいてスコアに加算するフラグメントイオンの種類の組み合わせを選択したり加算時の重み付けを変更したりするとよい。さらに非特許文献2に記載のように、スコアにおいて質量誤差を考慮することも考えられる。さらにまた、アミノ酸配列の長さに応じたペナルティ(又はボーナス)を加えるようにしてもよい。これは、アミノ酸配列の長いペプチドでは結合が切れる個所が多いために、アミノ酸配列の短いものに比べてスコアが大きくなる傾向にあるためである。
【0029】
ステップS3で選定したアミノ酸配列候補についてのみステップS4で精密なスコア計算を行えばよいので、複雑な計算を行っても、実用上十分に短い時間で各候補の精密なスコアを算出することができる。
【0030】
そして最後に、上述のように算出された精密なスコアに従い、全て又は信頼度の高いとみなせるアミノ酸配列候補をランキング付けして表示する(ステップS5)。このときには、マススペクトルと推定したアミノ酸配列の対応も併せて表示するとよい。
【0031】
上記のような手順で実行したアミノ酸配列解析結果の一例を図5に示す。ここでは、測定されたマススペクトルを上段に示し、その下の左端列にはランク1−20位のアミノ酸配列を、右端列にそれらアミノ酸配列のスコアを示している。また図5中に記した○+×印の種類はフラグメントイオン種類を表わし、大きさはそのイオン質量に相当するピーク強度の大きさを示している。本例では、ランク1位で推定されたアミノ酸配列(EFTPVLQADFQK)が実際に測定したヘモグロビン(Hemoglobin)のアミノ酸配列と一致することが確認できた。
【0032】
なお、上記実施例は本発明の一例にすぎず、本発明の趣旨の範囲で適宜変形、修正、追加等を行っても本願特許請求の範囲に包含されることは当然である。即ち、本発明の特徴は図1中のステップS3におけるアルゴリズムや演算処理にあるから、それ以外の各ステップにおける演算処理は上記説明のものに限らず、従来から知られている各種の方法を利用することができる。
【図面の簡単な説明】
【0033】
【図1】本発明の一実施例であるアミノ酸配列解析方法の概略フローチャート。
【図2】本実施例のアミノ酸配列解析方法における動的計画法によるアミノ酸配列推定処理の説明図。
【図3】本実施例のアミノ酸配列解析方法における動的計画法によるアミノ酸配列推定処理の説明図。
【図4】本実施例のアミノ酸配列解析方法における動的計画法によるアミノ酸配列推定処理の説明図。
【図5】本実施例のアミノ酸配列解析方法に従って得られたアミノ酸配列解析結果の一例を示す図。

【特許請求の範囲】
【請求項1】
質量分析により得られたマススペクトルデータに基づいて目的試料のアミノ酸配列を推定するためのアミノ酸配列解析方法であって、
a)マススペクトルデータに基づいて目的試料に由来するピークの質量とピーク強度とを集めたピークリストを作成するピークリスト作成ステップと、
b)前記ピークリストに含まれるデータを元に動的計画法によるアルゴリズムを利用したデノボ・シーケンス解析を行って複数のアミノ酸配列候補を選出するアミノ酸配列候補決定ステップと、
c)前記複数のアミノ酸配列候補のそれぞれについて、マススペクトルデータを利用し、そのアミノ酸配列が目的試料のアミノ酸配列に合致する確からしさを示す確度情報を算出する確度算出ステップと、
d)前記確度情報により複数のアミノ酸配列候補を選別して又は序列を決めて提示する提示ステップと、
を有し、前記アミノ酸配列候補決定ステップでは、ピークリストに挙げられているピークの中で順次選択するピークの強度を加算して算出されるスコアを最大化する又はより大きくするようなアミノ酸配列候補の選定を、アミノ酸配列上の結合位置とマススペクトルの質量とをそれぞれ異なる方向の軸とする非巡回的グラフにおける最長路及びより長い有向路を見い出す問題として定式化し、ピークリストを利用して前記非巡回的グラフ上でアミノ酸配列末端で且つ質量が小さい側を出発点として各アミノ酸結合位置毎に有向路を探索するようにしたことを特徴とする、質量分析を用いたアミノ酸配列解析方法。
【請求項2】
質量分析により得られたマススペクトルデータに基づいて目的試料のアミノ酸配列を推定するためのアミノ酸配列解析装置であって、
a)マススペクトルデータに基づいて目的試料に由来するピークの質量とピーク強度とを集めたピークリストを作成するピークリスト作成手段と、
b)前記ピークリストに含まれるデータを元に動的計画法によるアルゴリズムを利用したデノボ・シーケンス解析を行って複数のアミノ酸配列候補を選出するアミノ酸配列候補決定手段と、
c)前記複数のアミノ酸配列候補のそれぞれについて、マススペクトルデータを利用し、そのアミノ酸配列が目的試料のアミノ酸配列に合致する確からしさを示す確度情報を算出する確度算出手段と、
d)前記確度情報により複数のアミノ酸配列候補を選別して又は序列を決めて提示する情報提示手段と、
を備え、前記アミノ酸配列候補決定手段では、ピークリストに挙げられているピークの中で順次選択するピークの強度を加算して算出されるスコアを最大化する又はより大きくするようなアミノ酸配列候補の選定を、アミノ酸配列上の結合位置とマススペクトルの質量とをそれぞれ異なる方向の軸とする非巡回的グラフにおける最長路及びより長い有向路を見い出す問題として定式化し、ピークリストを利用して前記非巡回的グラフ上でアミノ酸配列末端で且つ質量が小さい側を出発点として各アミノ酸結合位置毎に有向路を探索する処理を実行することを特徴とする、質量分析を用いたアミノ酸配列解析装置。
【請求項3】
質量分析により得られたマススペクトルデータに基づき、コンピュータを用いて目的試料のアミノ酸配列を推定するためのプログラムであって、
a)マススペクトルデータに基づいて目的試料に由来するピークの質量とピーク強度とを集めたピークリストを作成するピークリスト作成ステップと、
b)前記ピークリストに含まれるデータを元に動的計画法によるアルゴリズムを利用したデノボ・シーケンス解析を行って複数のアミノ酸配列候補を選出するアミノ酸配列候補決定ステップと、
c)前記複数のアミノ酸配列候補のそれぞれについて、マススペクトルデータを利用し、そのアミノ酸配列が目的試料のアミノ酸配列に合致する確からしさを示す確度情報を算出する確度算出ステップと、
d)前記確度情報により複数のアミノ酸配列候補を選別して又は序列を決めて提示する提示ステップと、
をコンピュータに実行させるものであり、前記アミノ酸配列候補決定ステップでは、ピークリストに挙げられているピークの中で順次選択するピークの強度を加算して算出されるスコアを最大化する又はより大きくするようなアミノ酸配列候補の選定を、アミノ酸配列上の結合位置とマススペクトルの質量とをそれぞれ異なる方向の軸とする非巡回的グラフにおける最長路及びより長い有向路を見い出す問題として定式化し、ピークリストを利用して前記非巡回的グラフ上でアミノ酸配列末端で且つ質量が小さい側を出発点として各アミノ酸結合位置毎に有向路を探索するようにしたことを特徴とする、質量分析を用いたアミノ酸配列解析用プログラム。
【請求項4】
質量分析により得られたマススペクトルデータに基づき、コンピュータを用いて目的試料のアミノ酸配列を推定するためのプログラムを記録した記録媒体であって、
a)マススペクトルデータに基づいて目的試料に由来するピークの質量とピーク強度とを集めたピークリストを作成するピークリスト作成ステップと、
b)前記ピークリストに含まれるデータを元に動的計画法によるアルゴリズムを利用したデノボ・シーケンス解析を行って複数のアミノ酸配列候補を選出するアミノ酸配列候補決定ステップと、
c)前記複数のアミノ酸配列候補のそれぞれについて、マススペクトルデータを利用し、そのアミノ酸配列が目的試料のアミノ酸配列に合致する確からしさを示す確度情報を算出する確度算出ステップと、
d)前記確度情報により複数のアミノ酸配列候補を選別して又は序列を決めて提示する提示ステップと、
をコンピュータに実行させるものであり、前記アミノ酸配列候補決定ステップでは、ピークリストに挙げられているピークの中で順次選択するピークの強度を加算して算出されるスコアを最大化する又はより大きくするようなアミノ酸配列候補の選定を、アミノ酸配列上の結合位置とマススペクトルの質量とをそれぞれ異なる方向の軸とする非巡回的グラフにおける最長路及びより長い有向路を見い出す問題として定式化し、ピークリストを利用して前記非巡回的グラフ上でアミノ酸配列末端で且つ質量が小さい側を出発点として各アミノ酸結合位置毎に有向路を探索するようにしたことを特徴とする、質量分析を用いたアミノ酸配列解析用プログラムを記録したコンピュータ読み取り可能な記録媒体。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate


【公開番号】特開2008−145221(P2008−145221A)
【公開日】平成20年6月26日(2008.6.26)
【国際特許分類】
【出願番号】特願2006−331621(P2006−331621)
【出願日】平成18年12月8日(2006.12.8)
【出願人】(000001993)株式会社島津製作所 (3,708)
【出願人】(304023318)国立大学法人静岡大学 (416)
【Fターム(参考)】