質量分析を用いた修飾タンパク質同定方法及び同定装置

【課題】翻訳後修飾を受けたタンパク質の同定を可能としたシステムにおいて非修飾タンパク質の同定性能の低下を防止するとともに同定時間の短縮化を図る。
【解決手段】公的なアミノ酸配列データベース等の登録情報など、既知のタンパク質のアミノ酸配列情報と翻訳後修飾情報とに基づいて、既知の修飾タンパク質のアミノ酸配列を含む同定用ＤＢ５を予め構築する。この際に、修飾されたアミノ酸を通常のアミノ酸と重複しない特定の記号で表記する。検索条件入力部４４から同定対象のデータと翻訳後修飾を含む検索条件が指定されると、ＤＢ検索部４３は指定されたデータを同定用ＤＢ５と照合してペプチドの候補を抽出する。修飾タンパク質は既知のものに限られるため検索空間はそれほど拡大しない。それによって、高い同定性能を確保しながら検索時間を短縮することができる。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、タンパク質由来のペプチド混合物を含む被検試料を質量分析し、これにより得られた質量分析データを用いてペプチドのアミノ酸配列を推定することによってタンパク質を同定する方法及び装置に関し、特に、リン酸化などの翻訳後修飾を受けたタンパク質の同定を行う方法及び装置に関する。
【背景技術】
【０００２】
近年、ポストゲノム研究としてタンパク質の構造や機能の解析が急速に進められている。このようなタンパク質の構造・機能解析手法（プロテオーム解析）の一つとして、質量分析計を用いたタンパク質の発現解析や一次構造解析が広く行われるようになってきており、四重極型イオントラップや衝突誘起分解（ＣＩＤ）などによって特定のピークの捕捉と開裂を行う、いわゆるＭＳⁿ分析（ｎは２以上の整数）が威力を発揮している。一般にＭＳ²分析では、まず、分析対象物から特定の質量電荷比を有するイオンをプリカーサイオンとして選別し、該プリカーサイオンをＣＩＤによって開裂させる。その後、開裂によって生成したプロダクトイオンを質量分析することによって、目的とするイオンの質量や化学構造についての情報を得ることができる。
【０００３】
上記のようなＭＳⁿ分析を利用してタンパク質を同定する場合、まず、タンパク質を適当な酵素で消化してペプチド断片の混合物としてから、該ペプチド混合物を質量分析してマススペクトルを取得する。続いて、ペプチド混合物のマススペクトルデータの中から、例えば単一のペプチドに由来する一組の同位体ピーク群をプリカーサイオンとして選択し、該プリカーサイオンをＣＩＤにより開裂させて生成されたプロダクトイオンの質量分析、つまりＭＳ²分析を行う。また、１回の開裂操作では十分に小さな断片に開裂しない場合には、開裂操作を複数回行うこともある。以上のようにして１段又は２以上の多段の開裂操作により得られたプロダクトイオンのＭＳⁿスペクトルパターンやプロダクトイオンの質量電荷比を収集したリストを基に、既存のアミノ酸配列データベースとの照合処理を実行することによって、被検ペプチドのアミノ酸配列を決定し元のタンパク質を同定する。
【０００４】
上記のようなデータベース検索によるアミノ酸配列同定手法はＭＳ／ＭＳイオンサーチ法と呼ばれる。図８は、マトリクスサイエンス社が提供している検索エンジンであるマスコット（Mascot）に含まれるＭＳ／ＭＳイオンサーチの検索設定画面１００の一例である（特許文献１、非特許文献１参照）。このＭＳ／ＭＳイオンサーチの検索設定画面１００においてユーザが設定すべき主な検索項目としては、照合に使用するデータベースの種類（Database）１０１、タンパク質の分解に使用した消化酵素の種類（エンザイム：Enzyme）１０２、後述するフィックスド・モディフィケイション（Fixed modification）１０３、やバリアブル・モディフィケイション（Variable modification）１０４、質量分析の精度の許容値（MS/MS tol.）１０５などがある。これら検索項目のいくつかはプルダウンメニューとなっており、そのメニューの中からユーザが適宜に指定できるようになっている。
【０００５】
ユーザがこれら検索条件を適宜設定した上で「スタートサーチ（Start Search）」ボタン１０６をクリック操作して検索の実行を指示すると、コンピュータにおいて設定検索条件の下で与えられたプロダクトイオン情報とデータベースとの照合が実行され、最終的には検索上で確度が高いペプチド候補がリストアップされる。
【０００６】
一般にＭＳ／ＭＳイオンサーチでは、試料イオンとデータベース中のペプチドの一致度をスコアで表しているが、このスコアは恣意的に定められた式によって計算されている。このため、一つの試料についてそれに含まれるイオンの一致度を比較するのに用いることは可能であるが、これはその結果の絶対的な信頼性（確度）を表す指標ではないので、異なった検索結果の比較に用いることはできない。そこで信頼性を表すために、確率論における期待値が併用される。即ち、実は正しくない結果であるにも拘わらず偶然そのようなスコアが出てしまう確率を、期待値を用いて表す。したがって、期待値は小さいほうがより適切な結果である。また、スコアが高いほど期待値は小さくなるので、スコアではなく期待値のみで結果の適切さを評価することが可能である。それ故に、ＭＳ／ＭＳイオンサーチの結果は期待値を用いて評価されるのが一般的である。マスコットの場合には、期待値はエクスペクト（Expect）と呼ばれている。
なお、ＭＳ／ＭＳイオンサーチ法は、マスコット以外の他のアミノ酸配列解析用ソフトウエア、例えばX!Tandemなどにも搭載されている。
【０００７】
ところで、タンパク質は様々な要因により翻訳後修飾を受け、その修飾の種類も非常に多様である。こうした翻訳後修飾を受けたタンパク質（本明細書では、これを単に「修飾タンパク質」という）は生体組織における生体活動に重要な役割を果たしていることも多い。例えば典型的な翻訳後修飾の一つであるリン酸化は生体内での情報伝達に大きな役割を果たしていることが知られており、タンパク質のリン酸化・脱リン酸化を調べることは各種疾病の診断、疾病の要因解明、などに非常に重要である。
【０００８】
上述したＭＳ／ＭＳイオンサーチにも、修飾タンパク質を同定する機能が備えられており、そのための検索条件が上述したフィックスド・モディフィケイションとバリアブル・モディフィケイションである。前者は一つのペプチドの同じ種類のアミノ酸に対し確定的に起こる修飾であり、後者は、一つのペプチドの同じ種類のアミノ酸であっても発生する部位と発生しない部位を同時に含む可能性があることを意味する修飾である。したがって、バリアブル・モディフィケイションが設定された場合には、対象となるアミノ酸が修飾を受ける場合と受けない場合の全ての組み合わせに対して検索を行うことになる。
【０００９】
図８の例では、バリアブル・モディフィケイションとしてリン酸化（Phospho）が指定され、さらにリン酸化を受け得るアミノ酸として、Ｓ（セリン）、Ｔ（スレオニン）、Ｙ（チロシン）の３種類が指定されている。したがって、この検索条件の下では、様々なペプチドのアミノ酸配列中にＳ、Ｔ又はＹのアミノ酸が存在する場合に、そのアミノ酸がリン酸化を受けたと仮定した場合についても検索が行われることになる。
【００１０】
ＭＳ／ＭＳイオンサーチでは、上記のような様々な検索条件に従ってデータベース検索を行った後、一致度が高い（つまりエクスペクトが小さい）ペプチドがリストアップされて検索結果画面として表示される。図９は或る試料に対してＭＳ／ＭＳイオンサーチによりデータベース検索を実行して得られた結果の一例を示す図である。この結果では、図中の符号１１０で示すように、順位１位でタンパク質β−カゼイン（Beta-casein）由来のペプチド＜ＦＱＳＥＥＱＱＱＴＥＤＥＬＱＤＫ＞がエクスペクト０．００１２でヒットしている。アミノ酸配列中の左から３番目のＳ（セリン）はリン酸化を受けている。これはアミノ酸配列中の文字Ｓにアンダーラインが付されていることから分かる。
【００１１】
上述したようにＭＳ／ＭＳイオンサーチにおいてバリアブル・モディフィケイションを指定することにより、翻訳後修飾を受けたアミノ酸配列を同定することが可能である。しかしながら、上記のような従来の修飾タンパク質同定方法には次のような問題がある。
【００１２】
即ち、ＭＳ／ＭＳイオンサーチの検索条件においてバリアブル・モディフィケイションが指定された場合（つまり翻訳後修飾が起こり得るとの検索条件が設定された場合）とバリアブル・モディフィケイションが指定されない場合（つまり翻訳後修飾がないとの検索条件が設定された場合）とで、非修飾ペプチド（翻訳後修飾を受けていないペプチド）に対するエクスペクトは本来等しくなることが望ましいが、本願発明者の検討によれば、上記従来の同定方法では非修飾ペプチドに対するエクスペクトが変化してしまうことが判明した。通常、算出されたエクスペクトに基づいて、ヒットしたペプチドを順位付けしたり、或いは、可能性の高いペプチドのリストへの取捨選択を行ったりするため、直接関連しない検索条件の影響でエクスペクトが変動すると同定結果の信頼度の低下に繋がる。特に、複数個のバリアブル・モディフィケイションが指定されると、非修飾ペプチドの同定結果の信頼度低下が顕著であり、擬陽性エラー、擬陰性エラーの増加が確認される。また、バリアブル・モディフィケイションが指定された場合には、検索に要する処理時間が著しく増加し、解析のスループット低下を招くという問題もある。
【先行技術文献】
【特許文献】
【００１３】
【特許文献１】特開２０１０−３８６６４号公報
【非特許文献】
【００１４】
【非特許文献１】「マスコット・サーチ（Mascot Search）」、[online]、英国マトリックス・サイエンス社（Matrix Science Ltd.）、[平成２３年８月１１日検索]、インターネット＜URL : http://www.matrixscience.com/search_form_select.html＞
【発明の概要】
【発明が解決しようとする課題】
【００１５】
本発明は上記課題を解決するために成されたものであり、その目的とするところは、検索のための処理時間の増大をできるだけ抑えつつ、修飾タンパク質の同定精度を向上させるとともに、従来の手法では翻訳後修飾なしの条件の下での検索に比べて低下していた非修飾タンパク質に対する同定精度の低下を回避し、高い精度で以て非修飾タンパク質も同定することができる修飾タンパク質同定方法及び同定装置を提供することにある。
【課題を解決するための手段】
【００１６】
上述した非修飾ペプチドの同定信頼度の低下や検索処理時間の増大といった問題は、バリアブル・モディフィケイションが指定されたときの検索空間の大幅な拡大に起因するものと考えられる。即ち、ＭＳ／ＭＳイオンサーチでバリアブル・モディフィケイションが指定された場合、指定された翻訳後修飾の全ての組み合わせ（翻訳後修飾の種類と該修飾の有無、修飾されるアミノ酸）について検索が行われるが、通常、その組み合わせは非常に多数になり、結果的に検索空間が翻訳後修飾なしである場合に比べて大きく拡大する。検索空間のサイズが拡大すると、例えばアミノ酸配列は全く異なるものの偶然に質量が近いものが存在するといった可能性が拡がるため、候補ペプチドのエクスペクトは検索空間のサイズに依存して変わることになる。
【００１７】
従来の修飾タンパク質同定方法では、バリアブル・モディフィケイションが指定された後に、その指定条件の下で想定される全ての翻訳後修飾されたアミノ酸配列を計算により求めることになるが、そうして挙げられたアミノ酸配列には未知の、つまりは存在が確認されていない修飾ペプチドも数多く含まれる。これら未知の修飾ペプチドを解析することは現在のタンパク質研究の大きな目標の一つではあるが、実際に未知の修飾ペプチドが観測されるケースはそれほど多くない。また未知の修飾ペプチドを含む場合でも、そのサンプル中には既知の修飾ペプチドが同時に多数含まれていることが多いので、一般的には既知の修飾ペプチドのみが同定できるだけでも研究効率の向上に寄与し、十分に実用的であるといえる。修飾ペプチドの検索範囲を既知のものに限れば、非修飾ペプチドのみから修飾ペプチドにまで検索範囲を拡げたとしても、その検索範囲の拡大はかなり抑えられると予測できる。
【００１８】
第１発明はこうした知見に基づいてなされたものであり、ＭＳⁿ分析（ｎ≧１）により収集された質量分析データに基づいて被検試料中の翻訳後修飾を受けた修飾タンパク質を同定する質量分析を用いた修飾タンパク質同定方法であって、
既知であるタンパク質のアミノ酸配列情報及び翻訳後修飾情報に基づいて作成された、修飾を受けたアミノ酸を擬似的な一つのアミノ酸とみなして所定の規則に則って記号化された既知の修飾タンパク質のアミノ酸配列を含む修飾タンパク質データベースを使用し、
与えられた質量分析データに基づくプロダクトイオン情報を、前記修飾タンパク質データベースに含まれるそれぞれのアミノ酸配列から生成された対応するプロダクトイオン情報と照合することによって、アミノ酸配列の候補を抽出し、
その抽出されたアミノ酸配列候補に基づいて、前記擬似的な一つのアミノ酸とみなされた修飾を受けたアミノ酸については非修飾のアミノ酸に対応した記号に戻した上で、アミノ酸配列、修飾部位、修飾の種類を含む情報を出力することを特徴としている。
【００１９】
また第２発明に係る修飾タンパク質同定方法は、上記第１発明における修飾タンパク質データベースを構築するステップを有するものであり、ＭＳⁿ分析（ｎ≧１）により収集された質量分析データに基づいて被検試料中の翻訳後修飾を受けた修飾タンパク質を同定する質量分析を用いた修飾タンパク質同定方法であって、
a)既知であるタンパク質のアミノ酸配列情報及び翻訳後修飾情報に基づいて、生じ得る全ての修飾タンパク質について修飾を受けたアミノ酸を擬似的な一つのアミノ酸とみなして所定の規則に則って記号化された既知の修飾タンパク質のアミノ酸配列を生成し、該既知の修飾タンパク質のアミノ酸配列を含む修飾タンパク質データベースを構築するデータベース構築ステップと、
b)前記データベース構築ステップにより構築された修飾タンパク質データベースと同種の翻訳後修飾が検索条件の一つとして指定された検索が指示されたときに、与えられた質量分析データに基づくプロダクトイオン情報を、前記修飾タンパク質データベースに含まれるそれぞれのアミノ酸配列から生成された対応するプロダクトイオン情報と照合することによって、アミノ酸配列の候補を抽出するデータベース検索実行ステップと、
c)前記データベース検索実行ステップにより抽出されたアミノ酸配列候補に基づいて、前記擬似的な一つのアミノ酸とみなされた修飾を受けたアミノ酸については非修飾のアミノ酸に対応した記号に戻した上で、修飾タンパク質についてはアミノ酸配列、修飾部位、修飾の種類を含む情報を出力する検索結果出力ステップと、
を有することを特徴としている。
【００２０】
また第３発明は第１発明に係る修飾タンパク質同定方法を具現化するための装置であり、ＭＳⁿ分析（ｎ≧１）により収集された質量分析データに基づいて被検試料中の翻訳後修飾を受けた修飾タンパク質を同定する質量分析を用いた修飾タンパク質同定装置であって、
a)既知であるタンパク質のアミノ酸配列情報及び翻訳後修飾情報に基づいて作成された、修飾を受けたアミノ酸を擬似的な一つのアミノ酸とみなして所定の規則に則って記号化された既知の修飾タンパク質のアミノ酸配列を含む修飾タンパク質データベースと、
b)与えられた質量分析データに基づくプロダクトイオン情報を前記修飾タンパク質データベースに含まれるそれぞれのアミノ酸配列から生成された対応するプロダクトイオン情報と照合することによってアミノ酸配列の候補を抽出するデータベース検索実行手段と、
c)その抽出されたアミノ酸配列候補に基づいて、前記擬似的な一つのアミノ酸とみなされた修飾を受けたアミノ酸については非修飾のアミノ酸に対応した記号に戻した上で、アミノ酸配列、修飾部位、修飾の種類を含む情報を出力する検索結果出力手段と、
を備えることを特徴としている。
【００２１】
また第４発明は第２発明に係る修飾タンパク質同定方法を具現化するための装置であり、ＭＳⁿ分析（ｎ≧１）により収集された質量分析データに基づいて被検試料中の翻訳後修飾を受けた修飾タンパク質を同定する質量分析を用いた修飾タンパク質同定装置であって、
a)既知であるタンパク質のアミノ酸配列情報及び翻訳後修飾情報に基づいて、生じ得る全ての修飾タンパク質について修飾を受けたアミノ酸を擬似的な一つのアミノ酸とみなして所定の規則に則って記号化された既知の修飾タンパク質のアミノ酸配列を生成し、該既知の修飾タンパク質のアミノ酸配列を含む修飾タンパク質データベースを構築するデータベース構築手段と、
b)前記データベース構築手段により構築された修飾タンパク質データベースと同種の翻訳後修飾が検索条件の一つとして指定された検索が指示されたときに、与えられた質量分析データに基づくプロダクトイオン情報を前記修飾タンパク質データベースに含まれるそれぞれのアミノ酸配列から生成された対応するプロダクトイオン情報と照合することによってアミノ酸配列の候補を抽出するデータベース検索実行手段と、
c)前記データベース検索実行手段により抽出されたアミノ酸配列候補に基づいて、前記擬似的な一つのアミノ酸とみなされた修飾を受けたアミノ酸については非修飾のアミノ酸に対応した記号に戻した上で、修飾タンパク質についてはアミノ酸配列、修飾部位、修飾の種類を含む情報を出力する検索結果出力手段と、
を備えることを特徴としている。
【００２２】
上述したように、被検試料中のタンパク質を同定する際には、該タンパク質を酵素消化等によってペプチド断片に分解した上で、該ペプチドのアミノ酸配列を推定するのが一般的である。したがって、本明細書でいう「タンパク質」の同定とは実質的にペプチドの同定と同義である。
【００２３】
修飾タンパク質データベースを作成する際に利用される既知のタンパク質のアミノ酸配列情報は、既存のタンパク質データベース（例えばスイスバイオインフォマティクス研究所（略称：SIB）等が提供している「Swiss-Prot」、米国国立生物工学情報センター（略称：NCBI）が提供している「NCBI Nr」など）に登録されているアミノ酸配列情報をそのまま用いることができる。また、既知の翻訳後修飾情報とは、存在や由来が確認されている翻訳後修飾であって、例えばリン酸化、アルキル化、カルバミル化といった翻訳後修飾の種類、翻訳後修飾されるアミノ酸配列構造と修飾されるアミノ酸などの情報を含む。こうした情報も上記のような公開されているデータベースから収集することができる。ただし、いずれのデータベースでも既知の翻訳後修飾情報が全て網羅されているわけではないから、本発明における「既知」とは既知である全てを意味するものではなく、あくまでも既知であって入手可能なものを意味する。
【発明の効果】
【００２４】
第１乃至第４発明に係る修飾タンパク質同定方法及び同定装置では、既知の、つまりその存在や由来が確認されている修飾タンパク質に限ったアミノ酸配列情報を含む修飾タンパク質データベースに登録されているデータに限定した検索が、データベース検索実行ステップ（又は手段）により行われる。換言すれば、存在や由来が確認されていない未知の翻訳後修飾を受けたアミノ酸配列までは検索の範囲が拡げられないので、従来のデータベース検索による修飾タンパク質同定方法に比べると検索空間がかなり絞られることになる。その結果、第１乃至第４発明に係る修飾タンパク質同定方法及び同定装置によれば、目的のタンパク質（非修飾タンパク質、修飾タンパク質ともに）アミノ酸配列は全く異なるものの偶然にプロダクトイオンの質量が近いものが存在するといった可能性が小さくなるため、例えば同定対象が非修飾タンパク質である場合に、ヒットするペプチドのエクスペクトへの影響が小さくなり、擬陽性や擬陰性となる可能性が低くなる。また、同定対象が既知の修飾タンパク質である場合にも、擬陽性や擬陰性となる確率が下がる。これによって、非修飾タンパク質、既知の修飾タンパク質ともに、同定結果の信頼度が向上する。
【００２５】
また、従来の修飾タンパク質同定方法では、データベースに登録されているタンパク質のアミノ酸配列や酵素消化等により切断されたペプチド断片のアミノ酸配列の全てに対してバリアブル・モディフィケイションとして指定された翻訳後修飾が起こり得る組み合わせを総当たり的に計算していたが、第１乃至第４発明によればこうした起こり得る全ての組み合わせを計算する処理過程が必要なくなり、さらに上述したように検索空間が狭くなることも相まって、検索処理に要する時間を短縮することが可能となる。
【００２６】
また、第１乃至第４発明に係る質量分析を用いたタンパク質同定方法及び同定装置の一態様として、修飾タンパク質データベースに含まれる既知の修飾タンパク質のアミノ酸配列は、修飾を受けたアミノ酸を既存の（既に割り当てられている）１文字の記号と重複しない別の記号に置換することで生成されたものとするとよい。
【００２７】
この態様によれば、従来から使用されているアミノ酸配列検索ソフトウエアをほぼそのままデータベース検索実行手段として使用することができる。そのため、例えば既存のタンパク質同定装置に本発明を適用することが容易であり、その導入のためのコストも抑えることができる。
【００２８】
また、第１乃至第４発明に係る質量分析を用いたタンパク質同定方法及び同定装置において、修飾タンパク質データベースには、修飾タンパク質のアミノ酸配列情報それぞれに対し、該修飾タンパク質に関するアテノーション情報が格納されているようにするとよい。上記アノテーション情報とはその修飾タンパク質に関連した様々な付随情報であり、例えば、該タンパク質の機能情報、該タンパク質について過去に発表された学会論文などの書誌情報、公共データベースにおけるエントリ名などを含むようにすることができる。
【００２９】
従来の修飾タンパク質同定方法であれば、こうしたアノテーション情報は、アミノ酸配列をデータベース検索により求めたあと、その結果を用いてさらに別の配列データベース検索作業を行い、得られたエントリ中に記述された情報を読んで内容を確認して初めて得られるものであった。それに対し第１乃至第４発明では、修飾タンパク質データベースには既知の修飾タンパク質のみが登録されるので、予め公共データベース等から収集したアテノーション情報をそれぞれに対応付けて格納しておくことができ、検索により抽出されたアミノ酸配列から即座に関連するアノテーション情報を得ることができる。それにより、タンパク質の解析作業が効率良く行えるようになる。
【図面の簡単な説明】
【００３０】
【図１】本発明の一実施例である修飾タンパク質同定システムの全体構成図。
【図２】本実施例の修飾タンパク質同定システムにおけるデータベース作成処理手順を示すフローチャート。
【図３】本実施例の修飾タンパク質同定システムにおける修飾タンパク質同定の手順を示すフローチャート。
【図４】翻訳後修飾がリン酸化である場合のアミノ酸配列中の記号置換の一例を示す図。
【図５】本発明に基づくリン酸化タンパク質同定方法と従来法との同定結果比較の一例を示す図。
【図６】非リン酸化ペプチドに対する検索結果の比較を示す図。
【図７】リン酸化ペプチドに対する検索結果の比較を示す図。
【図８】マスコットによるＭＳ／ＭＳイオンサーチの検索設定画面の一例を示す図。
【図９】或る試料に対してＭＳ／ＭＳイオンサーチによりデータベース検索を実行して得られた結果の一例を示す図。
【発明を実施するための形態】
【００３１】
以下、本発明に係る修飾タンパク質同定方法を利用したシステムの一実施例について、添付の図面を参照して説明する。図１は本実施例の修飾タンパク質同定システムの全体構成図、図２は本システムにおけるデータベース作成処理手順を示すフローチャート、図３は本システムにおけるタンパク質同定処理手順を示すフローチャートである。
【００３２】
本実施例の修飾タンパク質同定システムは、質量分析計１、スペクトルデータ収集部２、データ格納部３、及び、同定処理部４を含み、同定処理部４は、データベース作成・管理部４１、既知情報読込部４２、データベース検索部４３、検索条件入力部４４、表示部４５、同定用データベース５を含む。同定用データベース５は大別して、非修飾タンパク質情報記憶部５１、修飾タンパク質情報記憶部５２、翻訳後修飾関連情報記憶部５３を備える。質量分析計１以外は、コンピュータを中心に構成することができ、主要な機能はコンピュータにインストールされた専用のソフトウエアをコンピュータ上で実行することにより実現される。
【００３３】
質量分析計１は例えばイオントラップ飛行時間型質量分析計であり、図示しないが、目的試料中の分子や原子をイオン化するイオン源と、発生したイオンを一時的に捕捉し、必要に応じて質量電荷比m/zに応じたイオンの選別とＣＩＤによるイオンの開裂とを実行する３次元四重極型のイオントラップと、該イオントラップから射出された各種イオンを質量電荷比m/zに応じて分離して検出する飛行時間型質量分析器（ＴＯＦＭＳ）と、を備える。生体試料を対象としたイオン化を行うイオン源としては、マトリクス支援レーザ脱離イオン化法（ＭＡＬＤＩ）によるもの、エレクトロスプレイイオン化法（ＥＳＩ）によるもの、などが一般的である。
【００３４】
非修飾タンパク質情報記憶部５１は、非修飾タンパク質のアミノ酸配列、プロダクトイオン情報などを含むデータベースであり、既存の公共データベースの情報をそのまま又はその一部を抽出して用いることができる。一方、修飾タンパク質情報記憶部５２はデータベース作成・管理部４１によって作成される特定の（既知の）修飾タンパク質のアミノ酸配列、プロダクトイオン情報などを含むデータベースである。また、翻訳後修飾関連情報記憶部５３は特に修飾タンパク質情報記憶部５２に登録される各修飾タンパク質（ペプチド）について、公共データベース等から収集される当該タンパク質に関連したアノテーション情報を格納しておくものである。一般的には、アノテーション情報としては、タンパク質の機能情報、タンパク質について過去に発表された学会論文などの書誌情報、公共データベースにおけるエントリ名などを含むが、その情報内容はシステムの設計上又は該システムを利用するユーザの要望に応じて任意に定めることができる。
【００３５】
次に、図１に加えて図２〜図４を参照して、本実施例の修飾タンパク質同定システムにおける同定処理動作を説明する。ここでは、翻訳後修飾の一例として比較的簡単な修飾であって且つ生体機能において重要な修飾であるリン酸化を挙げる。即ち、この例では、修飾タンパク質情報記憶部５２はリン酸化タンパク質情報記憶部であり、翻訳後修飾関連情報記憶部５３はリン酸化関連情報記憶部である。
【００３６】
本システムによる同定作業を実施するに先立って、図２のフローチャートに示したような、同定用データベース５を構築する作業が予め必要となる。まず、図示しない制御部からデータベース構築指示を受けると、データベース作成・管理部４１は既知情報読込部４２を通して、既知のタンパク質のアミノ酸配列情報や翻訳後修飾（リン酸化）情報を取得する（ステップＳ１）。具体的には、既知情報読込部４２はインターネットを通じて外部からデータを受領する機能を有し、「Swiss-Prot」等の公開されているデータベースから非修飾タンパク質のアミノ酸配列情報や既知のリン酸化情報を収集する。一般的に、一つのデータベースに全ての既知の情報が揃っているわけではないから、複数のデータベースから収集した情報を統合することにより情報をより充実させることができる。
【００３７】
リン酸化情報としては、例えば、既知のリン酸化タンパク質（ペプチド）として、どのようなアミノ酸配列の中のどの部位（アミノ酸）にリン酸化が生じるかといった情報が得られる。こうした既知のリン酸化情報が得られるとデータベース作成・管理部４１は、該情報に基づいて、アミノ酸配列中においてリン酸化されるアミノ酸を示す１文字の記号を特定の記号に置換した、修飾タンパク質の擬似的なアミノ酸配列を生成する（ステップＳ２）。即ち、これは、リン酸化されたアミノ酸と同じ質量電荷比を持った仮想的なアミノ酸を仮定したアミノ酸配列である。置換された記号は厳密にはアミノ酸を示すものではなく、リン酸化されたアミノ酸を示すものであるため、生成されるものは厳密な意味ではアミノ酸配列ではなく擬似的（仮想的）なものであるが、ここでは単にアミノ酸配列という。
【００３８】
リン酸化は、アミノ酸Ｓ、Ｔ、Ｙに対して起こるものが殆どであり、実質的にそれらを考慮すれば十分である。そこで、本実施例では、アミノ酸Ｓ、Ｔ、Ｙがリン酸化を受けた場合に、それぞれＢ、Ｏ、Ｚという記号で置換することとした。なお、これらＢ、Ｏ、Ｚなどの文字は出現頻度が極めて低く、実験的に２つのアミノ酸のどちらなのかが判定できない場合などに用いられる。そこでこれらの文字を含むアミノ酸配列については、可能性のある両方のアミノ酸に対応するアミノ酸配列に書き換えることによって、これら３つの文字がデータベース中で全く割り当てられていないようにした。このようにして、上述したように修飾を受けたアミノ酸を既存の（既に割り当てられている）１文字の記号と重複しない別の記号に置換した。
【００３９】
即ち、ここでは、アミノ酸配列において「Ｂ」はリン酸化されたセリン、「Ｏ」はリン酸化されたスレオニン、「Ｚ」はリン酸化されたチロシンを示す。したがって、図４（ａ）に示すように、例えば、アミノ酸配列が＜ＦＱＳＥＥＱＱＱＴＥＤＥＬＱＤＫ＞であるペプチドにおいて２個のアミノ酸Ｓ、Ｔが同時にリン酸化されたものが既知であるとのリン酸化情報が得られていれば、該既知情報が与えられているセリンＳがリン酸化される場合とされない場合、またスレオニンＴがリン酸化される場合とされない場合とがあり得るから、リン酸化ペプチドのアミノ酸配列として、＜ＦＱＢＥＥＱＱＱＴＥＤＥＬＱＤＫ＞、＜ＦＱＳＥＥＱＱＱＯＥＤＥＬＱＤＫ＞及び＜ＦＱＢＥＥＱＱＱＯＥＤＥＬＱＤＫ＞の３種類が生成される。また、図４（ｂ）に示すように、例えばアミノ酸配列＜ＦＱＳＥＳＱＱＱＴＥＤＥＬＱＤＫ＞のように２個のセリンＳと１個のスレオニンを含む場合でも、最初のＳとＴにのみ既知情報がある（つまり２番目のＳには既知情報がない）のであれば、リン酸化ペプチドのアミノ酸配列として、＜ＦＱＢＥＳＱＱＱＴＥＤＥＬＱＤＫ＞、＜ＦＱＳＥＳＱＱＱＯＥＤＥＬＱＤＫ＞、＜ＦＱＢＥＳＱＱＱＯＥＤＥＬＱＤＫ＞の３種類のみを生成することになる。
【００４０】
こうしてデータベース作成・管理部４１は収集された既知情報に基づいてリン酸化タンパク質のアミノ酸配列を生成し、それに対応したプロダクトイオン情報を求め、通常のデータベース検索エンジンで検索可能な形式として修飾タンパク質情報記憶部５２に格納する。また、それら生成した各アミノ酸配列に、タンパク質名、アミノ酸配列中のリン酸化の位置、リン酸化の生理的意義、リン酸化を行う酵素、文献情報などの既知のアノテーション情報を対応付けて翻訳後修飾関連情報記憶部５３に格納する。こうしてデータベース作成・管理部４１により一体的に管理される同定用データベース５が構築される（ステップＳ３）。
【００４１】
次に、上記同定用データベース５を利用して目的のタンパク質を同定する際の処理手順を説明する。目的のタンパク質を質量分析計１によりＭＳ分析、ＭＳ²分析することで得られたデータが、データ格納部３に保存されているものとする。ユーザは、検索条件入力部４４から同定対象である目的タンパク質のデータを指定するとともに、翻訳後修飾を含む検索条件を指定する（ステップＳ１１）。この検索条件の指定は例えば既に説明した図８に示すような画面上で、照合に使用するデータベースの種類１０１として、目的とする翻訳後修飾を格納したデータベースを指定すればよい。
【００４２】
データベース検索部４３は、検索条件として指定された翻訳後修飾を格納したデータベースが既に存在しているかをチェックする（ステップＳ１２）。上述のように指定された翻訳後修飾がリン酸化であれば、既にリン酸化タンパク質に対する同定用データベース５が存在しているから、ステップＳ１２ではＹｅｓと判定されてＳ１３へ進む。指定された翻訳後修飾に対応したデータベースが構築されていない場合には、検索が実施できないため、ステップＳ１５へ進んで指定された翻訳後修飾に対応したデータベース構築処理を行うか、或いは参照すべきデータベースがない旨をユーザに知らせる報知のみを実行する。
【００４３】
ステップＳ１３では、データベース検索部４３は指定されたデータをデータ格納部３から読み込み、該データから求まるプロダクトイオン情報（プロダクトイオンの質量電荷比m/z）を同定用データベース５に含まれるそれぞれのアミノ酸配列から生成された対応するプロダクトイオン情報と照合することにより、一致する可能性の高いタンパク質（ペプチド）を候補として抽出する。即ち、従来法のように検索条件として指定されたリン酸化の全ての組み合わせについて検索が実行されるのではなく、通常の、つまり翻訳後修飾がない場合と同様の、単にデータベースに登録されている情報に対する検索が実行されるだけである。また、上述のようにリン酸化されたアミノ酸は他のアミノ酸と同様の１文字の記号で表されているので、データベース検索部４３は既存のマスコットやX!tandemなどの検索エンジンを用いることができる。候補となったタンパク質が非修飾である場合には、得られたアミノ酸配列をそのまま出力情報とすることができるが、候補となったタンパク質が修飾タンパク質である場合には、得られたアミノ酸配列には上記の置換された記号を含む。そこで、置換された記号を元のアミノ酸の記号に戻すとともに、そのアミノ酸がリン酸化部位であることを示す情報を付す。そうして、検索結果として、候補タンパク質のアミノ酸配列等の情報を表示部４５から出力する（ステップＳ１４）。
【００４４】
次に、上述した修飾タンパク質同定方法により実際に検索を実行した結果の一例について説明する。実際の検索では、検索エンジンとしてマスコットではなくX!tandemを用いた。図５は、従来法と本発明方法との検索結果の比較のまとめである。図５において（ａ）は、既存の「Swiss-Prot」データベースを用い、バリアブル・モディフィケイションでリン酸化を指定せずにデータベース検索を行った場合の結果である。（ｂ）は同じく既存の「Swiss-Prot」データベースを用い、バリアブル・モディフィケイションでリン酸化を指定してデータベース検索を行った場合の結果である。即ち、（ａ）はリン酸化ペプチドの検索を行わない場合、（ｂ）は従来法によってリン酸化ペプチドを検索した場合である。（ｂ）の結果を見ると、６６個のリン酸化ペプチドが同定されているが、計算時間はリン酸化の指定なしの場合に比べて８０分以上延びている。この延びた時間が、実質的にリン酸化ペプチドの同定のために利用された時間であると考えることができる。
【００４５】
図５において（ｃ）は本発明方法による検索結果であり、既存の「Swiss-Prot」データベースとこれから求めた既知のリン酸化タンパク質データベース「e.boz」の両方に対してデータベース検索を行った結果である。この場合、同定されたリン酸化ペプチドの数は（ｂ）の場合よりもやや多くなっている程度である。一方、（ａ）と（ｃ）とを比較すると、リン酸化ペプチドに対応した検索のために追加で要した時間は僅か４分弱にすぎず、従来方法でリン酸化ペプチドの検索に８０分以上を要したのと比較すると、その所要時間の短縮効果は明らかである。これは、「Swiss-Prot」データベースに登録されている全てのタンパク質と指定されたリン酸化との全ての組み合わせを計算する時間が不要になること、及び、修飾タンパク質の検索空間が既知のものに限られていることに依るものと考えられる。
【００４６】
また、上述したようにリン酸化ペプチドをデータベース検索する場合に、そのためのデータベースの変更等の作業に伴って、非リン酸化ペプチドの同定に影響が及ぶことは望ましくない。即ち、リン酸化ペプチドの検索を可能としたことによって、非リン酸化ペプチドに対する検索の結果が変化してはならない。しかしながら、前述したように、バリアブル・モディフィケイションを指定した従来の検索では検索空間が大きく拡大するため、検索エンジンによって求まるエクスペクトが変動し、結果的に非リン酸化ペプチドに対する同定の判定が変わるケースが多く見られる。
【００４７】
図６及び図７は非リン酸化ペプチド及びリン酸化ペプチドに対する従来法と本発明方法との検索結果の具体例を示す図である。図６及び図７中の通常検索、従来法、本発明法はそれぞれ図５中の（ａ）、（ｂ）、（ｃ）に対応する。また図６及び図７中の数値はX!tandemで求まるエクスペクトであり、このエクスペクトは小さいほど同定結果の信頼性が高い。ここでは同定判定の閾値は１０^-2に設定されており、エクスペクトが１０^-2以下であればそのペプチドが同定ペプチドであると判断する。
【００４８】
図６に示した非リン酸化ペプチドの検索結果をみると、擬陽性エラーとして示した４種のペプチドが、通常検索では元々「同定されない（エクスペクトが閾値よりも大きい）」と判定されているにも拘わらず、従来法ではエクスペクトが減少して閾値よりも小さくなった結果、「同定」と誤判定されている（つまり「擬陽性エラー」となっている）。これに対し、本発明法によるこれらペプチドに対する検索結果では、エクスペクトは閾値よりも大きいままであり、通常検索の場合と同様に「同定されない」と正しく判定されている。この４種のペプチドのうち一番下に示したアミノ酸配列＜ＥＧＡ…ＧＭＭ＞であるペプチドから、従来法によって同定されたタンパク質は「Vibrio harveyi（海棲動物の消化器官の中に共生する細菌）」のタンパク質であるが、測定対象の試料はヒト由来のHeLa細胞抽出物であり、この同定が実際に誤りであることを強く示唆している。
【００４９】
また、擬陰性エラーとして示した１３種のペプチドが、通常検索では元々「同定」と判定されたにもかかわらず、従来法ではエクスペクトが逆に増加した結果、「同定されない」と誤判定されている（つまり「擬陰性エラー」となっている）。これらについても同様に、本発明法では通常検索の結果と同様に「同定」との判定結果となっている。即ち、従来法で生じた４個の擬陽性エラーと１３個の擬陰性エラーは本発明法では起こらないことが分かる。一方、従来法では擬陽性エラーを生じなかったにも拘わらず本発明法によって擬陽性エラーを生じたペプチドは１種のみにすぎず、擬陰性エラーを生じたペプチドは存在しなかった。図５をみると、非リン酸化ペプチドに対する同定数は従来法では１５８個で、通常検索の結果の１６７個よりも９個少ない。これは、上述したように、擬陽性エラーで１３個少なく、擬陰性エラーで４個多いという結果と符合する。一方、本発明法による同定数は、通常検索の１６７個プラス上記の擬陽性エラーであるペプチド１個の合計１６８個である。
【００５０】
以上の結果が示すように、従来法にみられる、検索空間が大きく拡大する結果としてエクスペクトが通常検索の際と大きく変化し、結果的に同定の判定を誤るというケースは、本発明法では大幅に減少している。即ち、本発明法におけるリン酸化ペプチドを同定するための新たなデータベースの構築が、非リン酸化ペプチドの同定結果に殆ど影響を与えないことが確認できる。
【００５１】
図７はリン酸化ペプチドの検索結果であり、当然のことながら通常検索では同定されないので通常検索の結果は除いている。また、図７の下に示すのは、同定された各ペプチドに対応して出力されるアノテーション情報である。上の２種のペプチドは従来法のみで同定されたものであり、元の「Swiss-Prot」データベースに情報がない未知のリン酸化ペプチドである。本発明法は既知のリン酸化ペプチドしか検索対象としていないため、未知のリン酸化ペプチドを検出できないのは当然の結果である。下の６種のペプチドは本発明法のみで同定されたものであり、全て「Swiss-Prot」データベースに情報がある既知のリン酸化ペプチドである。これらは８種のペプチドは、ヒト、マウス、又はヒツジの、つまりは非常に近縁である哺乳類のタンパク質であるので、いずれも妥当な同定結果であると考えられる。図５をみると、本発明法によるリン酸化ペプチドに対する同定数は従来法に比べて４個多い７０個となっているが、これは、上述のように、従来法では同定されなかったペプチドが新たに６個同定され、本発明法の検索対象外である未知の（データベースに収録されていない）リン酸化ペプチドが従来法で２個同定されたことに符合している。
【００５２】
なお、図６に示した本発明法のみで同定された６種のペプチドのうちの３種は、アミノ酸配列が全く同一である。これは、その配列に続く「RT」の数値で示しているように、質量分析計での測定に先立って行われる試料分離過程である液体クロマトグラフでの保持時間が異なるピークに同じタンパク質が帰属された例である。こうした現象が起こる理由は明確ではないが、例えば、当該タンパク質が別のタンパク質と凝集していたために疎水性が変化した、或いは、当該タンパク質のうち一定の量が翻訳後に切断を受けて全長が変わり疎水性も変化していた、等の理由が考え得る。
【００５３】
上記実測例では、本発明法では従来法に比べてリン酸化ペプチドの同定性能は向上しているものの、顕著な向上であるとまではいえない。一方、非リン酸化ペプチドに対しては従来法に比べて明確に同定性能が改善されており、また、データベース検索のための計算時間の短縮も顕著である。こうしたことから、本発明法は従来法と比較して明らかに優れていると結論付けることができる。
【００５４】
なお、上記実施例では、翻訳後修飾としてリン酸化を挙げていたが、それ以外の各種翻訳後修飾を受けたタンパク質の同定に本発明を適用できることは明らかである。ただし、翻訳後修飾されるアミノ酸の種類が多い場合には、アミノ酸配列を示すためにアミノ酸に置換し得る１文字の記号が不足するため、既存の検索エンジンをそのまま利用することは難しく、例えば修飾されたアミノ酸を表す特殊な記号を取り扱えるように検索エンジンを適宜修正する必要がある。
【００５５】
また、上記実施例では、検索に利用される同定用データベース５が同定システムの内部に設けられていたが、例えば同定用データベース５はサーバ内に構築され、該サーバに接続された端末からサーバにアクセスしてタンパク質同定を行うようなシステム構成を採ることもできる。
【００５６】
また、同定用データベース５は、収集されたデータ中の一部データを特定のキーに対応して取り出せるようにしたものでありさえすればよいから、ＸＭＬデータベースやＪＳＯＮ（JavaScript（登録商標） Object Notation）技術を利用したものも広い意味でデータベースの一種である。例えばＪＳＯＮ技術を利用する場合には、まず上述したように同定用データベースを構築した上で、ＪＳＯＮ技術を利用して、修飾タンパク質のアミノ酸配列と翻訳後修飾情報とを関連づけたファイルを作成する。そして、データベース検索の結果得られた候補ペプチドの翻訳後修飾情報を得るために同定用データベースを参照するのでなく、上記のＪＳＯＮ形式のファイルを参照する。この場合、複雑なデータベース管理システムが不要であり、同定用データベースを備えていないコンピュータでも、検索結果の表示を簡便に行うことができる。したがって、複雑なデータベース管理システムのインストールや構築が不要になるというメリットがある。さらに、データベース検索結果ファイル内に翻訳後修飾情報を組み込むことも可能である。
【００５７】
また、上記実施例は本発明の一例にすぎず、本発明の趣旨の範囲で適宜変形、修正、追加等を行っても本願特許請求の範囲に包含されることは当然である。
【符号の説明】
【００５８】
１…質量分析計
２…スペクトルデータ収集部
３…データ格納部
４…同定処理部
４１…データベース作成・管理部
４２…既知情報読込部
４３…データベース検索部
４４…検索条件入力部
４５…表示部
５…同定用データベース
５１…非修飾タンパク質情報記憶部
５２…修飾タンパク質情報記憶部
５３…翻訳後修飾関連情報記憶部

【特許請求の範囲】
【請求項１】
ＭＳⁿ分析（ｎ≧１）により収集された質量分析データに基づいて被検試料中の翻訳後修飾を受けた修飾タンパク質を同定する質量分析を用いた修飾タンパク質同定方法であって、
既知であるタンパク質のアミノ酸配列情報及び翻訳後修飾情報に基づいて作成された、修飾を受けたアミノ酸を擬似的な一つのアミノ酸とみなして所定の規則に則って記号化された既知の修飾タンパク質のアミノ酸配列を含む修飾タンパク質データベースを使用し、
与えられた質量分析データに基づくプロダクトイオン情報を前記修飾タンパク質データベースに含まれるそれぞれのアミノ酸配列から生成された対応するプロダクトイオン情報と照合することによってアミノ酸配列の候補を抽出し、
その抽出されたアミノ酸配列候補に基づいて、前記擬似的な一つのアミノ酸とみなされた修飾を受けたアミノ酸については非修飾のアミノ酸に対応した記号に戻した上で、アミノ酸配列、修飾部位、修飾の種類を含む情報を出力することを特徴とする質量分析を用いた修飾タンパク質同定方法。
【請求項２】
ＭＳⁿ分析（ｎ≧１）により収集された質量分析データに基づいて被検試料中の翻訳後修飾を受けた修飾タンパク質を同定する質量分析を用いた修飾タンパク質同定方法であって、
a)既知であるタンパク質のアミノ酸配列情報及び翻訳後修飾情報に基づいて、生じ得る全ての修飾タンパク質について修飾を受けたアミノ酸を擬似的な一つのアミノ酸とみなして所定の規則に則って記号化された既知の修飾タンパク質のアミノ酸配列を生成し、該既知の修飾タンパク質のアミノ酸配列を含む修飾タンパク質データベースを構築するデータベース構築ステップと、
b)前記データベース構築ステップにより構築された修飾タンパク質データベースと同種の翻訳後修飾が検索条件の一つとして指定された検索が指示されたときに、与えられた質量分析データに基づくプロダクトイオン情報を前記修飾タンパク質データベースに含まれるそれぞれのアミノ酸配列から生成された対応するプロダクトイオン情報と照合することによってアミノ酸配列の候補を抽出するデータベース検索実行ステップと、
c)前記データベース検索実行ステップにより抽出されたアミノ酸配列候補に基づいて、前記擬似的な一つのアミノ酸とみなされた修飾を受けたアミノ酸については非修飾のアミノ酸に対応した記号に戻した上で、修飾タンパク質についてはアミノ酸配列、修飾部位、修飾の種類を含む情報を出力する検索結果出力ステップと、
を有することを特徴とする質量分析を用いた修飾タンパク質同定方法。
【請求項３】
請求項１又は２に記載の質量分析を用いた修飾タンパク質同定方法であって、
前記修飾タンパク質データベースに含まれる既知の修飾タンパク質のアミノ酸配列は、修飾を受けたアミノ酸を既存の１文字の記号と重複しない別の記号に置換することで生成されたものであることを特徴とする質量分析を用いた修飾タンパク質同定方法。
【請求項４】
請求項１〜３のいずれかに記載の質量分析を用いた修飾タンパク質同定方法であって、
前記修飾タンパク質データベースには、修飾タンパク質のアミノ酸配列情報それぞれに対し、該修飾タンパク質に関するアテノーション情報が格納されていることを特徴とする質量分析を用いた修飾タンパク質同定方法。
【請求項５】
ＭＳⁿ分析（ｎ≧１）により収集された質量分析データに基づいて被検試料中の翻訳後修飾を受けた修飾タンパク質を同定する質量分析を用いた修飾タンパク質同定装置であって、
a)既知であるタンパク質のアミノ酸配列情報及び翻訳後修飾情報に基づいて作成された、修飾を受けたアミノ酸を擬似的な一つのアミノ酸とみなして所定の規則に則って記号化された既知の修飾タンパク質のアミノ酸配列を含む修飾タンパク質データベースと、
b)与えられた質量分析データに基づくプロダクトイオン情報を前記修飾タンパク質データベースに含まれるそれぞれのアミノ酸配列から生成された対応するプロダクトイオン情報と照合することによってアミノ酸配列の候補を抽出するデータベース検索実行手段と、
c)その抽出されたアミノ酸配列候補に基づいて、前記擬似的な一つのアミノ酸とみなされた修飾を受けたアミノ酸については非修飾のアミノ酸に対応した記号に戻した上で、アミノ酸配列、修飾部位、修飾の種類を含む情報を出力する検索結果出力手段と、
を備えることを特徴とする質量分析を用いた修飾タンパク質同定装置。
【請求項６】
ＭＳⁿ分析（ｎ≧１）により収集された質量分析データに基づいて被検試料中の翻訳後修飾を受けた修飾タンパク質を同定する質量分析を用いた修飾タンパク質同定装置であって、
a)既知であるタンパク質のアミノ酸配列情報及び翻訳後修飾情報に基づいて、生じ得る全ての修飾タンパク質について修飾を受けたアミノ酸を擬似的な一つのアミノ酸とみなして所定の規則に則って記号化された既知の修飾タンパク質のアミノ酸配列を生成し、該既知の修飾タンパク質のアミノ酸配列を含む修飾タンパク質データベースを構築するデータベース構築手段と、
b)前記データベース構築手段により構築された修飾タンパク質データベースと同種の翻訳後修飾が検索条件の一つとして指定された検索が指示されたときに、与えられた質量分析データに基づくプロダクトイオン情報を前記修飾タンパク質データベースに含まれるそれぞれのアミノ酸配列から生成された対応するプロダクトイオン情報と照合することによってアミノ酸配列の候補を抽出するデータベース検索実行手段と、
c)前記データベース検索実行手段により抽出されたアミノ酸配列候補に基づいて、前記擬似的な一つのアミノ酸とみなされた修飾を受けたアミノ酸については非修飾のアミノ酸に対応した記号に戻した上で、修飾タンパク質についてはアミノ酸配列、修飾部位、修飾の種類を含む情報を出力する検索結果出力手段と、
を備えることを特徴とする質量分析を用いた修飾タンパク質同定装置。
【請求項７】
請求項５又は６に記載の質量分析を用いた修飾タンパク質同定装置であって、
前記修飾タンパク質データベースに含まれる既知の修飾タンパク質のアミノ酸配列は、修飾を受けたアミノ酸を既存の１文字の記号と重複しない別の記号に置換することで生成されたものであることを特徴とする質量分析を用いた修飾タンパク質同定装置。
【請求項８】
請求項５〜７のいずれかに記載の質量分析を用いた修飾タンパク質同定装置であって、
前記修飾タンパク質データベースには、修飾タンパク質のアミノ酸配列情報それぞれに対し、該修飾タンパク質に関するアテノーション情報が格納されていることを特徴とする質量分析を用いた修飾タンパク質同定装置。

【図１】

【図２】

【図３】

【図４】

【図５】

【図６】

【図７】

【図８】

【図９】

【公開番号】特開２０１３−４７６２４（Ｐ２０１３−４７６２４Ａ）
【公開日】平成２５年３月７日（２０１３．３．７）
【国際特許分類】

物理学 (1,541,580)
- 測定；試験 (294,940)
  - 材料の化学的または物理的性質の決定による材料の調査または分析 (128,275)
    - 電気的，電気化学的，または磁気的手段の利用による材料の調査また... (17,622)
      - ガスのイオン化の調査によるもの；放電の調査によるもの，例．陰極... (3,117)

【出願番号】特願２０１１−１８５７１１（Ｐ２０１１−１８５７１１）
【出願日】平成２３年８月２９日（２０１１．８．２９）
【出願人】（０００００１９９３）株式会社島津製作所 (3,708)
【出願人】（５０６１３７１４７）エーザイ・アール・アンド・ディー・マネジメント株式会社 (215)
【Ｆターム（参考）】

その他の電気的手段による材料の調査、分析 (22,023)

[ Back to top ]

質量分析を用いた修飾タンパク質同定方法及び同定装置

メニュー

スポンサーリンク

次の公報 »

« 前の公報

質量分析を用いた修飾タンパク質同定方法及び同定装置

メニュー

スポンサー リンク

次の公報 »

« 前の公報

スポンサーリンク