説明

解析支援システムおよび解析支援方法

【課題】 複数の方法で測定された質量分析データを用いた試料の同定を支援する。
【解決手段】 第一方法に基づく質量分析により試料の第一測定スペクトルを取得するとともに、第二方法に基づく質量分析により試料の第二測定スペクトルを取得する(S103、S109)。第一測定スペクトルに基づいて試料の同定を行い、試料の第一候補タンパク質を抽出する(S105)。第一候補タンパク質の配列データに基づき、第二方法により得られる第一候補タンパク質の第二理論スペクトルを取得する(S107)。そして、第一候補タンパク質の第二理論スペクトルを第二測定スペクトルとともに重ね合わせて表示する(S111)。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、試料の質量分析により得られた測定スペクトルの解析を支援するシステムおよび方法に関する。
【背景技術】
【0002】
特定の細胞、組織、または器官の中で生産されるタンパク質全体を解析するプロテオーム解析では、細胞等の中に存在するタンパク質を網羅的に同定しなければならない。プロテオーム解析において汎用されているタンパク質の同定手法はペプチドマスフィンガープリント(PMF)法である(非特許文献1)。PMF法においては、二次元電気泳動などにより分離精製されたタンパク質を酵素分解し、その消化断片ペプチド群の質量分析を行う。そして、質量分析により得られたスペクトルを、データベース等に格納されている既知のタンパク質のアミノ酸配列に関する情報から予測される理論的ピークパターンと照合し、試料タンパク質に対応している遺伝子とタンパク質の候補の同定が行われている。
【非特許文献1】Wenzhu Zhang、Brian T. Chait、「ProFound:An Expert System for Protein Identification Using Mass Spectrometric Peptide Mapping Information」、2000年、Analytical Chemistry、72巻、p.2482−2489
【発明の開示】
【発明が解決しようとする課題】
【0003】
上述した質量分析を用いたタンパク質の同定において、測定スペクトルから予測された理論スペクトルを求めた後、この理論スペクトルのピークパターンと測定スペクトルのピークパターンとを照合して、理論スペクトルと質量が一致するところに測定スペクトルのピークがあるかどうかを比較する再解析の作業が行われる。
【0004】
ところが、再解析において、測定スペクトルと理論スペクトルとの照合作業は、従来作業者の手作業で行われる。このため、実際には作業に長時間を要し、同定作業の効率が低下する原因となっていた。
【0005】
また、同定の確度をさらに向上させるためには、一つの試料について、たとえばイオン化方法の異なる複数の方法の測定を行うことが考えられる。ところが、複数の測定を行った場合、同じ試料を用いても、それぞれの測定により得られる測定スペクトルデータの横軸すなわちm/zのピッチが異なったり、位置ずれが生じたりする。このため、測定スペクトル同士を単純に重ね合わせて比較することが困難な場合があった。また、測定ステップの軸のスケールを調整したり、横軸方向の位置を調整したりして、測定スペクトル同士を重ね合わせようとしても、すべてのピークについて、位置を整合させることが困難であった。このような場合、それぞれの測定スペクトルについて、同定作業を行った後で、両方の結果を比較対照して、再解析作業を行わなわなければならない。このため、測定方法によって異なる候補タンパク質が得られた場合等、再解析がさらに複雑になる懸念があった。
【0006】
一方、一つの測定スペクトルを用いた解析においても、測定スペクトルと理論スペクトルとの照合作業において、試料中の共存物質由来のピーク等を試料のピークと認定すると、擬陽性ピークが発生してしまう。反対に、試料由来のピークをノイズと判断すると、試料スペクトル中に未検出の擬陰性ピークが発生してしまう。擬陽性ピークや擬陰性ピークが生じると、解析精度が低下するため、再解析の作業を確実に行うためには、測定者にある程度の熟練が必要とされていた。
【0007】
擬陽性ピークや擬陰性ピークの発生原因として、タンパク質の翻訳後修飾等により、データベースに記憶された候補物質の構造式と、試料の構造式との間に変化が生じている場合が挙げられる。以下、タンパク質の翻訳後修飾の場合を例に説明する。生体内において実際に発現しているタンパク質は、翻訳後修飾、アミノ酸配列変化、またはスプライシングの様式の変化等により、既知のあるいは遺伝子情報から予測されるタンパク質とは異なる一次構造や修飾状態を有していることがある。さらに、翻訳後修飾の受けやすさは、タンパク質の立体構造における位置により異なり、アミノ酸残基の修飾のされやすさが一分子内においても異なる。タンパク質の表面に存在するアミノ酸残基ほど修飾を受けやすい。スペクトル中のピークの信頼性がピークごとに異なり、修飾を受けやすいペプチドに対応するピークほど、翻訳後修飾によるピーク位置のずれが生じやすい。既知のあるいは遺伝子から予測されるタンパク質のアミノ酸配列由来のデータとの照合を行う従来の方法では、こうした修飾の有無および修飾のされやすさが考慮されていないため、解析精度が低下してしまう懸念があった。
【0008】
本発明は上記事情に鑑みてなされたものであり、複数の方法で測定された質量分析データを用いた試料の同定を支援する技術を提供する。また、本発明の別の目的は、質量分析を用いた試料の同定を高い確度で効率的に行う技術を提供することにある。
【課題を解決するための手段】
【0009】
本発明によれば、
試料の質量分析スペクトルの解析を支援するシステムであって、
第一方法に基づく前記試料の第一測定スペクトルのデータと、第二方法に基づく前記試料の第二測定スペクトルのデータとを取得するデータ取得手段と、
前記第一測定スペクトルに基づき前記試料の第一候補物質を抽出するとともに、前記第一候補物質を前記第二方法により測定した際に得られると予測される前記第一候補物質の第二理論スペクトルのデータを取得する同定支援部と、
前記同定支援部で取得された前記第一候補物質の前記第二理論スペクトルと、前記試料の前記第二測定スペクトルとをともに表示する統合表示部と、
を含む解析支援システムが提供される。
【0010】
また、本発明によれば、
試料の質量分析スペクトルの解析を支援する方法であって、
第一方法に基づく質量分析により前記試料の第一測定スペクトルを取得するとともに、第二方法に基づく質量分析により前記試料の第二測定スペクトルを取得するステップと、
前記第一測定スペクトルに基づいて、前記試料の第一候補物質を抽出するステップと、
前記第一候補物質を前記第二方法により測定した際に得られると予測される前記第一候補物質の第二理論スペクトルを取得するステップと、
前記第一候補物質の前記第二理論スペクトルと前記試料の前記第二測定スペクトルとをともに表示するステップと、
を含む解析支援方法が提供される。
【0011】
この発明によれば、第一方法で得られた第一測定スペクトルに基づいて抽出された第一候補物質について、第二測定方法により得られると予測される第二理論スペクトルが取得され、第二理論スペクトルが第二測定スペクトルとともに表示される。このため、第一測定スペクトルと第二測定スペクトルとを直接比較する必要がない。また、第一測定スペクトルから得られた情報を第二測定スペクトルとともに表示するため、ユーザが第一方法による測定で得られた結果を考慮しながら第二方法で得られたデータの解析を行うことができる。このため、ユーザが効率よく解析作業を進めることができる。なお、本発明において、前記第一方法と前記第二方法とは、たとえばイオン化方法が異なる方法とすることができる。
【0012】
本発明において、第一理論スペクトルとは、構造式が既知の所定の候補物質を、第一方法により測定した際に得られると想定される理論的なスペクトルのことである。また、第二理論スペクトルとは、構造式が既知の所定の候補物質を、第二方法により測定した際に得られると想定される理論的なスペクトルのことである。ここで、所定の候補物質とは、たとえば第一測定スペクトルに基づいて抽出された第一候補物質である。
【0013】
また、本発明において、前記試料は、たとえばタンパク質である。また、本発明において、前記測定スペクトルは、前記タンパク質を所定の位置で選択的に断片化して得られる複数のペプチド断片に由来するピークを含んでもよい。こうすれば、PMF等におけるタンパク質の同定をさらに効率よく行うことが可能となる。
【0014】
本発明の解析支援システムにおいて、前記同定支援部が、前記第二測定スペクトルに基づき前記試料の第二候補物質を抽出するとともに、前記第一候補物質と前記第二候補物質とに共通する物質を共通候補物質として抽出し、前記第一候補物質のうち、前記共通候補物質を前記第二方法により測定した際に得られると予測される第二理論スペクトルのデータを取得し、前記統合表示部が、前記共通候補物質の前記第二理論スペクトルと前記試料の前記第二測定スペクトルとをともに表示することができる。
また、本発明の解析支援方法において、前記第二測定スペクトルに基づいて、前記試料の第二候補物質を抽出するステップをさらに含み、第一候補物質の配列データに基づき、第一候補物質の第二理論スペクトルを取得する前記ステップが、前記第一候補物質のうち、前記第二候補物質と共通する共通候補物質を前記第二方法により測定した際に得られると予測される前記共通候補物質の第二理論スペクトルを取得するステップであって、第一候補物質の第二理論スペクトルと試料の第二測定スペクトルとをともに表示する前記ステップが、前記共通候補物質の前記第二理論スペクトルと前記試料の前記第二測定スペクトルとをともに表示するステップであってもよい。
【0015】
この構成においては、二つの測定の両方にて抽出された候補物質を抽出して測定スペクトルと比較する。このため、それぞれの測定から複数の候補物質が抽出される場合にも、方法によらずに抽出された共通の候補物質をさらに効率よく選択し、測定スペクトルとともにユーザに提示することができる。よって、ユーザが解析作業をさらに効率よく進めるように支援することができる。
【0016】
本発明の解析支援システムにおいて、前記同定支援部が、前記共通候補物質の前記第二理論スペクトルのデータとともに、前記共通候補物質を前記第一方法により測定した際に得られると予測される第一理論スペクトルのデータを取得し、前記統合表示部が、前記共通候補物質の前記第二理論スペクトルと前記試料の前記第二測定スペクトルとをともに表示するとともに、前記共通候補物質の前記第一理論スペクトルと前記試料の前記第一測定スペクトルとをともに表示する構成とすることができる。
また、本発明の解析支援方法において、前記共通候補物質を前記第一方法により測定した際に得られると予測される前記共通候補物質の第一理論スペクトルを取得するステップをさらに含み、第一候補物質の第二理論スペクトルと試料の第二測定スペクトルとをともに表示する前記ステップが、前記共通候補物質の前記第二理論スペクトルと前記試料の前記第二測定スペクトルとをともに表示するとともに、前記共通候補物質の前記第一理論スペクトルと前記試料の前記第一測定スペクトルとをともに表示するステップであってもよい。
【0017】
この構成においては、二つの測定スペクトルのそれぞれについて、一方の測定で得られた測定スペクトルに、他方の測定に基づき取得された理論スペクトルを重ね合わせて表示する。このため、二つの測定スペクトルを用いたユーザの解析作業をさらに効率化するように支援することが可能となる。
【0018】
試料の質量分析スペクトルの解析を支援するシステムであって、
前記試料の質量分析により得られた測定スペクトルのデータを取得するデータ取得手段と、
前記測定スペクトルに基づき、前記試料の候補物質を抽出するとともに、前記候補物質の理論スペクトルのデータを取得して、前記理論スペクトルに含まれる複数のピークについて、前記候補物質の立体構造を考慮して前記候補物質の修飾の指標を算出し、前記ピークのデータに関連づける同定支援部と、
前記試料の前記測定スペクトルと、前記候補物質の前記理論スペクトルと、前記指標とをともに表示する統合表示部と、
を含む解析支援システムが提供される。
【0019】
また、本発明によれば、
試料の質量分析スペクトルの解析を支援する方法であって、
前記試料の質量分析により得られた測定スペクトルに基づき、前記試料の候補物質を抽出するステップと、
前記候補物質の理論スペクトルのデータを取得するステップと、
前記候補物質の前記理論スペクトルに含まれる複数のピークについて、前記候補物質の立体構造を考慮して、前記候補物質の修飾の指標を算出し、前記ピークのデータに関連づけるステップと、
前記候補物質の前記理論スペクトルと前記指標とを前記測定スペクトルととともに表示するステップと、
を含む解析支援方法が提供される。
【0020】
この発明によれば、理論スペクトルに含まれる複数のピークについて、候補物質の立体構造を考慮して、候補物質の修飾の指標を算出し、ピークのデータに関連づけて表示するため、ユーザに修飾の受けやすさに関する情報をわかりやすく示すことができる。このため、ユーザが、ピークごとの修飾の容易性も考慮しながら効率よく解析作業を進められるように支援することができる。
【0021】
本発明において、前記試料がタンパク質であって、前記指標が前記タンパク質の翻訳後修飾の指標であってもよい。
【0022】
本発明の解析支援システムにおいて、前記同定支援部が、前記候補物質の立体構造のデータを取得して、前記候補物質の前記理論スペクトルに含まれる前記ピークの前記候補物質の表面からの距離を反映する位置パラメータを前記指標として取得する構成とすることができる。
【0023】
また、本発明の解析支援方法において、候補物質の修飾の指標を算出し、ピークのデータに関連づける前記ステップが、前記候補物質の立体構造のデータを取得して、前記立体構造のデータに基づき、前記候補物質の前記理論スペクトルに含まれる前記ピークの前記候補物質の表面からの距離を反映する位置パラメータを取得するステップを含んでもよい。
【0024】
本発明において、候補物質の表面からの距離が近いものは修飾を受けやすいと予測されるため、このようにすれば、ユーザがさらに効率よくスペクトルのピークの位置ずれの可能性を把握することができる。このため、解析作業において、擬陽性ピークまたは擬陰性ピークをさらに効率よく除去することができる。
【0025】
以上、本発明について説明したが、これらの構成要素の任意の組み合わせや、本発明の構成要素や表現を方法、装置、プログラムの間で相互に置換したものもまた、本発明の態様として有効である。
【0026】
たとえば、本発明によれば、コンピュータシステムを上述の解析支援システムとして機能させるためのプログラムが提供される。
【発明の効果】
【0027】
本発明によれば、複数の方法で測定された質量分析データを用いた試料の同定を支援することができる。また、本発明によれば、質量分析を用いた試料の同定を高い確度で効率的に行うことができる。
【発明を実施するための最良の形態】
【0028】
以下、本発明の実施の形態について、図面を用いて説明する。なお、すべての図面において、同様な構成要素には同様の符号を付し、適宜説明を省略する。
【0029】
以下の実施形態では、本発明の解析支援システムをタンパク質の同定に適用する場合を例に説明するが、本発明において、試料はタンパク質には限られない。以下の例では、試料の質量分析により得られた質量分析データは、タンパク質を所定の位置で選択的に断片化して得られる複数のペプチド断片に由来するピークを含む。
【0030】
また、以下の解析支援システムは、スペクトルの形状や、分子生物学的な観点に基づく補助データを取得して、試料の測定スペクトルとともにこれを表示し、解析を支援する。補助データは、測定スペクトルとともに表示されるデータであって、ユーザの解析作業の支援となるデータである。第一〜第四の実施形態では、補助データは、同一試料の他の測定データに基づき抽出された候補物質のスペクトルに関する情報である。また、第五〜第六の実施形態では、補助データは、測定データに基づき抽出された候補物質の修飾の指標である。
【0031】
まず、第一〜第四の実施形態において、複数の測定スペクトルを用いた試料の同定作業を支援するシステムについて説明する。第一〜第四の実施形態では、イオン化方法の異なる複数の方法で得られた試料の質量分析スペクトルを用いた解析を行う場合を例に説明する。
【0032】
(第一の実施形態)
図1は、本実施形態における分析方法の手順を示すフローチャートである。
本実施形態では、試料の質量分析を複数の方法で行い(S103、S109)、一方の方法で得られた測定スペクトルを用いた同定結果(S105、S107)を、他方の方法で得られた測定スペクトルに重ね合わせ表示する(S111)。これにより、複数の測定を行った際の解析効率と同定の確度を向上させる。本実施形態の質量分析スペクトルの解析支援方法は、以下のステップを含む。
第一方法に基づく質量分析により試料の第一測定スペクトルを取得するとともに、第二方法に基づく質量分析により試料(タンパク質)の第二測定スペクトルを取得するステップ(S103、S109)、
第一測定スペクトルに基づいて、試料の第一候補物質(第一候補タンパク質)を検索し、抽出するステップ(S105)、
第一候補タンパク質の配列データに基づき、第一候補タンパク質を第二方法により測定した際に得られると予測される第一候補タンパク質の第二理論スペクトルを取得するステップ(S107)、および
第一候補タンパク質の第二理論スペクトルを第二測定スペクトルとともに重ね合わせて表示するステップ(S111)。
【0033】
以下、さらに具体的に説明する。
まず、同定対象のタンパク質の抽出を行い、試料を得る(S101)。このステップは、必要に応じて行えばよく、適宜省略することができる。具体的な抽出方法としては、まず、分析対象のタンパク質を含む試料から2次元電気泳動などにより目的のタンパク質を分離する。そして、化学的または酵素的な断片化を行う。酵素的な断片化には、たとえばトリプシン消化を用いることができる。こうすれば、塩基性アミノ酸残基のC末端側でタンパク質を選択的に断片化することができる。本実施形態および本明細書の他の実施形態においては、分析対象のタンパク質がトリプシンにより断片化されている場合を例に説明する。
【0034】
次に、測定系にて、試料タンパク質の質量分析測定を行う。このとき、イオン化の異なる二種類の方法で測定を行う。イオン化法として、エレクトロスプレーイオン化法(ESI法)、マトリックス支援レーザー脱離イオン化(MALDI)法、高速原子衝突イオン化(FAB)法などが挙げられる。また、質量分析計として、たとえば、イオントラップ質量分析計、四重極型質量分析計、磁場型質量分析計、飛行時間(TOF)型質量分析計、フーリエ変換型質量分析計などを用いることができる。
【0035】
つづいて、第一方法を用いた質量分析により得られた第一測定スペクトルのデータを測定系から取得する(S103)。そして、測定スペクトルに含まれる複数のピークの中から、所定の強度を有するピークを選別し、そのピークリストに基づき、既存のデータベースを用いて第一候補タンパク質の検索を行う(S105)。このとき、一または二以上の第一候補タンパク質が抽出されることになる。そして、各候補タンパク質の配列に関するデータを変換し、第二方法で第一候補タンパク質を測定した際に得られると予測される理論スペクトルのデータとして、第二理論スペクトルのデータを取得する(S107)。
【0036】
なお、本実施形態および以降の実施形態において、理論スペクトルは、候補物質を試料と同じ測定方法を用いて測定した際に得られると予測される理論的なスペクトルである。理論スペクトルは、候補物質に関する既知の構造式のデータまたは構造式に関連づけられるデータに基づき予測される。たとえば、候補物質がタンパク質である場合には、既知のデータとして、当該タンパク質のアミノ酸配列または遺伝子配列の配列情報を用いることができる。また、本実施形態および第二〜第四の実施形態において、第二理論スペクトルは、候補タンパク質を第二方法で測定した際に得られると予測される理論スペクトルであり、後出する第一理論スペクトルは、候補タンパク質を第一方法で測定した際に得られると予測される理論スペクトルである。
【0037】
さらに、測定系から第二方法を用いた質量分析により得られた第二測定スペクトルのデータを取得し(S109)、第二理論スペクトルと第二測定スペクトルとを重ね合わせて表示する(S111)。以上により、第一方法による測定結果を踏まえて第二測定スペクトルを用いた試料の同定を行うことが可能となり、解析効率および解析確度を向上させることができる。
【0038】
本実施形態における分析方法は、分析システムにより実行することができる。図2は、本実施の形態における分析システムの構成を示す機能ブロック図である。図2に示した分析システム120は、質量分析データを用いて試料の同定を行うシステムであって、測定系101および解析支援システム130を含む。
【0039】
解析支援システム130は、複数の方法で測定された測定データを用いた同定を支援するシステムであって、インターフェイス103、同定支援部105および記憶部107を備える。インターフェイス103は、データ受付部109および統合表示部111を含む。以下、図2および図3を参照して、分析システム120の各部の構成をさらに詳細に説明する。図3は、図2に示した分析システム120の各部の詳細構成の一例を示す機能ブロック図である。
【0040】
分析システム120は、タンパク質の質量分析スペクトルの解析を支援するシステムである。
分析システム120は、第一方法に基づく試料の第一測定スペクトルのデータと、第二方法に基づく試料の第二測定スペクトルのデータとを取得するデータ取得手段(データ受付部109)と、試料の同定を支援する同定支援部105と、理論スペクトルデータ取得部137で取得された前記第二理論スペクトルを、第二測定スペクトルとともに表示する統合表示部111と、を含む。
同定支援部105は、第一測定スペクトルに基づき試料の第一候補タンパク質を抽出する候補物質抽出部135と、候補物質抽出部135で抽出された第一候補タンパク質について、第二方法により得られる第二理論スペクトルのデータを取得する理論スペクトルデータ取得部137と、を含む。
また、分析システム120は、第一方法に基づく試料の第一測定スペクトルのデータと、第二方法に基づく試料の第二測定スペクトルのデータとを記憶する記憶部107をさらに備える。
【0041】
測定系101は、質量分析データを取得する機器群により構成される。測定系101は、第一測定系119と第二測定系121とから構成され、これらはイオン化方法が異なる。たとえば第一測定系119のイオン化方法をMALDI法とし、第二測定系121のイオン化方法をESI法とする。測定系101は、同定対象の試料の質量分析測定を行うとともに、取得された質量分析データをインターフェイス103内のデータ受付部109に送出する。なお、質量分析データには、質量分析により得られた質量電荷比に対応する強度のデータや、そのイオン化方法等の測定条件に関するデータが含まれる。
【0042】
(記憶部)
記憶部107は、測定データ記憶部113、リファレンスデータ記憶部115および補助データ記憶部117を含む。
測定データ記憶部113は、第一測定系119で測定された測定スペクトルのデータを格納する第一測定データ記憶部127と、第二測定系121で測定された測定スペクトルのデータを格納する第二測定データ記憶部129とから構成される。
【0043】
リファレンスデータ記憶部115は、既知物質の構造情報を格納したタンパク質配列データベースである。タンパク質の配列は、アミノ酸配列であってもよいし、遺伝子配列であってもよい。
【0044】
補助データ記憶部117は、同定支援における補助データを記憶する。補助データとして、具体的には、リファレンスデータ記憶部115に格納されたタンパク質を測定系101による測定に供した際に得られると予測される理論スペクトルのデータが挙げられる。理論スペクトルのデータは、リファレンスデータ記憶部115に格納されたタンパク質の配列情報を、所定変換式に基づき変換することにより取得される。このときに用いられる変換式が補助データ記憶部117にあわせて格納されていてもよい。補助データ記憶部117に格納された理論スペクトルは、統合表示部111にて測定スペクトルとともに表示される。
【0045】
補助データ記憶部117は、第一理論データ記憶部131および第二理論データ記憶部133を含む。第一理論データ記憶部131は、リファレンスデータ記憶部115に格納されたタンパク質の配列情報を、第一測定系119による測定で得られると予測される第一理論スペクトルに変換する変換式のデータおよび変換式により変換された第一理論スペクトルのデータを記憶する。第二理論データ記憶部133は、リファレンスデータ記憶部115に格納されたタンパク質の配列情報を、第二測定系121による測定で得られると予測される第二理論スペクトルに変換する変換式のデータおよび変換式により変換された第二理論スペクトルのデータを記憶する。なお、記憶部107が補助データ記憶部117を有しておらず、所定の変換式に基づき変換された各理論スペクトルのデータがリファレンスデータ記憶部115に保存されていてもよい。
【0046】
(インターフェイス)
インターフェイス103は、ユーザまたは他の解析システムとのデータの授受を行う。インターフェイス103を介して入出力されたデータは、同定支援部105内で処理される。インターフェイス103は、データ受付部109および統合表示部111により構成される。
【0047】
データ受付部109は、第一測定系119で測定された第一測定スペクトルのデータを受け付ける第一受付部123と、第二測定系121で測定された第二測定スペクトルのデータを受け付ける第二受付部125とから構成される。第一測定系119および第二測定系121で測定された測定スペクトルのデータは、それぞれ、第一受付部123および第二受付部125から同定支援部105に送出されるとともに、記憶部107の第一測定データ記憶部127および第二測定データ記憶部129にそれぞれ格納される。
【0048】
統合表示部111は、同定支援部105にて作成された統合表示データを受け付けて、ユーザに提示する。具体的には、モニタや紙面等の上に、第二測定系121で得られた第二測定スペクトルと、同定支援部105にて作成された第一理論スペクトルとを重ね合わせて表示する。
【0049】
(同定支援部)
図3に示したように、同定支援部105は、候補物質抽出部135、理論スペクトルデータ取得部137および統合表示データ作成部139から構成される。
【0050】
候補物質抽出部135は、データ受付部109から送出される第一測定スペクトルのピークデータとリファレンスデータ記憶部115に格納されたタンパク質配列データベースとのマッチングを行い、同定候補となるタンパク質を抽出する。
【0051】
理論スペクトルデータ取得部137は、補助データ記憶部117の第二理論データ記憶部133を参照し、候補物質抽出部135で抽出された候補タンパク質の第二理論スペクトルを取得する。このとき、第二理論データ記憶部133に理論スペクトルのデータが候補タンパク質名に関連づけて格納されていてもよい。また、リファレンスデータ記憶部115に格納された候補タンパク質の配列情報から、理論スペクトルデータ取得部137にて理論スペクトルを作成してもよい。理論スペクトルデータ取得部137は、取得した第二理論スペクトルのデータを、統合表示データ作成部139に送出する。また、これとともに、第二理論スペクトルのデータを第二理論データ記憶部133に格納してもよい。
【0052】
統合表示データ作成部139は、測定データ記憶部113および必要に応じて補助データ記憶部117を参照し、第二測定系121で測定された第二測定スペクトルと第二理論スペクトルとを重ね合わせた統合表示データを作成し、統合表示部111に送出する。
【0053】
次に、本実施形態の作用効果を説明する。
本実施形態では、複数のイオン化方法に基づく測定スペクトルを用いて同定を行うことにより、試料の同定をさらに確実に行うことができる。たとえば、MALDIとESIでは、試料によりイオン化のされやすさが異なる。また、たとえばMALDIでは結晶化されやすいタンパク質の測定に適しているのに対し、ESIは、水やアルコール等の溶媒に溶解しやすいタンパク質の測定に適している。このように、イオン化方法により、スペクトルの取得しやすさや、ピークの現れやすさやが異なるため、一つの測定方法のみに基づいて同定を行う場合、擬陽性ピークまたは擬陰性ピークの判別作業が繁雑となり、同定作業の効率が低下したり、同定の確度が低下する懸念があった。これに対し、本実施形態では、これらの両方の測定結果を用いて同定作業を行うことができるため、同定を確実に行うことができる。
【0054】
ところで、複数の方法で得られた質量分析測定結果を用いて解析作業を行うことは、従来行われていなかった。また、複数の方法で得られた測定結果を用いて解析を行おうとしても、測定スペクトル同士を直接重ねあわせて表示したり、直接比較することは、ユーザにとっては困難であった。たとえば、MALDIを用いた場合、スペクトルの横軸すなわちm/zがほぼ分子量に対応するのに対し、ESIを用いた場合、イオンの価数により横軸の値が変動し、直接分子量に対応しないため、ユーザが両方のスペクトルを対照して、それぞれのスペクトルに出現しているピークを比較対照するには熟練を要する。
【0055】
そこで、本実施形態では、第一の方法で得られた測定スペクトルを用いて第一候補タンパク質を抽出した後、第一候補タンパク質の配列データを、第二方法により得られると考えらえる第一候補タンパク質の理論スペクトルに変換して、第二測定スペクトルに重ね合わせて表示する。理論スペクトルの変換を行うことで、イオン化方法の異なる複数の方法により一つの試料を測定した際に得られた測定スペクトル同士を直接比較することが困難な場合にも、ユーザが両方の測定結果に基づき効率よく試料の同定を行うことができる。このように、本実施形態では、複数の測定により得られた結果を集約してユーザに提示し、ユーザの同定作業を支援することができる。
【0056】
なお、本実施形態では、インターフェイス103のデータ受付部109がそれぞれの各測定系に対応する第一受付部123および第二受付部125を有する場合を例に説明したが、インターフェイス103が各測定系に共通に用いられる受付部を有してもよい。また、本実施形態では、測定系101がイオン化方法の異なる二つの測定系から構成される場合を例に説明したが、測定系101が三つ以上の測定系を含む構成としてもよい。また、イオン化方法が異なる場合に限らず、たとえば、分離方法、検出方法、または測定条件の異なる複数の測定スペクトルを用いた解析に解析支援システム130を適用することもできる。
【0057】
以下の実施形態では、第一の実施形態と異なる点を中心に説明する。
【0058】
(第二の実施形態)
本実施形態は、第一の実施形態の分析システム120(図2)を用いた解析支援方法に関する。図4は、本実施形態の解析支援手順を説明する図である。図4は、同一由来のサンプル中のタンパク質について、測定原理の異なる質量分析計で同定を行う手順を示している。
【0059】
まず、未知サンプル100からタンパク質の抽出処理110を行い、第1法でのスペクトル検出210が行われる。得られた第1法のスペクトル310を用いて、タンパク質同定検索330が行われ、第一候補タンパク質が抽出される。ここでは、第一候補タンパク質として、候補タンパク質A400および候補タンパク質B410が抽出された場合を例示している。
【0060】
一方、タンパク質抽出処理110後の試料は、第2法でのスペクトル検出220にも供される。得られた第2法のスペクトル320を用いて、タンパク質同定検索340が行われ、第二候補タンパク質が抽出される。ここでは、第二候補タンパク質として、候補タンパク質A400が抽出された場合を例示している。
【0061】
その後、候補タンパク質の理論スペクトルデータが作成される。このとき、第二理論スペクトルデータを作成する理論スペクトル作成部1200にて、第一候補タンパク質として抽出された候補タンパク質A400および候補タンパク質B410の理論スペクトルがそれぞれ作成され、候補タンパク質A理論スペクトル500および候補タンパク質B理論スペクトル510が得られる。これらの理論スペクトルの一部または全部が、第2法のスペクトル320とともに理論MSスペクトル統合表示部2000にて表示される。図4には、候補タンパク質A理論スペクトル500が第2法のスペクトル320とともに理論MSスペクトル統合表示部2000にて表示される場合が例示されている。
【0062】
また、本実施形態において、候補タンパク質の第二理論スペクトルのピークごとに、第二測定スペクトル中のピークとの対応付けの分類を行い、分類情報をさらに重ね合わせて表示してもよい。図5(a)〜図5(c)は、理論MSスペクトル統合表示部2000に表示される情報を示す図である。
【0063】
イオン化法の異なる2種類の質量分析計で同じ由来の試料を計測した場合、第1法による第一測定スペクトルに基づき抽出された候補タンパク質Aの第二理論スペクトルが、第2法により検出された第二測定スペクトルに重ね合わせて表示される。このとき、候補タンパク質Aの理論スペクトルのピークと、第一測定スペクトルのピークとの対照処理により、理論スペクトルの各ピークに分類情報が関連づけられる。分類情報は、たとえば、
A:候補蛋白質Aの理論スペクトルのピークのうち、第1法で検出されたピーク、
B:候補蛋白質Aの理論スペクトルのピークのうち、第1法で検出されなかったピーク、
とする(図5(a)、図5(b))。
【0064】
理論MSスペクトル統合表示部2000は、第二測定スペクトルと理論スペクトルとを重ね合わせて表示する。さらに、理論MSスペクトル統合表示部2000は、理論スペクトルについて、上述した分類情報をあわせて表示する。図5(c)は、第二測定スペクトルと候補蛋白質Aの第二理論スペクトルとをピークの分類情報を含めて重ね合わせて表示した図である。図5(c)に示したように、理論スペクトルの各ピークが第一測定スペクトル中に検出されたものであるかどうかを区別して表示することにより、第2法で出力される共存物質由来(候補蛋白質A)の擬陽性ピークの判断をさらに容易にすることができる。
【0065】
なお、図5(a)に示したように、理論MSスペクトル統合表示部2000は第1法による第一測定スペクトルに基づき抽出された候補タンパク質Aの第一理論スペクトルを試料の第一測定スペクトルとともに表示してもよい。
【0066】
(第三の実施形態)
第一の実施形態では、第一測定系119による測定結果から求められた候補タンパク質の第一理論スペクトルを、第二測定系121による測定結果とともに表示する例を説明したが、分析システム120において、第一測定系119および第二測定系121のそれぞれの測定結果から、それぞれの候補タンパク質を抽出し、両測定に共通する候補タンパク質をさらに抽出して測定スペクトルとともに表示することもできる。
【0067】
図6は、本実施形態における分析方法の解析支援の手順を示すフローチャートである。本実施形態の解析支援方法は、第二測定スペクトルに基づいて、試料の第二候補物質(第二候補タンパク質)を抽出するステップ(S113)をさらに含む。第一候補タンパク質の配列データに基づき、第二方法により得られる第一候補タンパク質の第二理論スペクトルを取得するステップ(図1のS107)が、第一候補タンパク質のうち、第二候補タンパク質と共通する共通候補物質(共通候補タンパク質)の第二理論スペクトルを取得するステップ(S117)である。また、第一候補タンパク質の第二理論スペクトルを第二測定スペクトルとともに表示するステップ(S111)が、共通候補タンパク質の第二理論スペクトルを第二測定スペクトルとともに表示するステップである。
また、共通候補タンパク質を第一方法により測定した際に得られると予測される前記タンパク質の第一理論スペクトルを作成するステップと、第一測定スペクトルとともに共通候補タンパク質を表示するステップと、をさらに含んでもよい。たとえば、第一候補タンパク質の第二理論スペクトルと試料の第二測定スペクトルとをともに表示するステップが、共通候補タンパク質の第二理論スペクトルと試料の第二測定スペクトルとをともに表示するとともに、共通候補タンパク質の第一理論スペクトルと試料の第一測定スペクトルとをともに表示するステップであってもよい。このとき、第一測定スペクトルと第二測定スペクトルとを、同一画面内に並べて表示してもよい。
【0068】
以下、本実施形態の解析支援の手順をさらに詳細に説明する。
図6において、ステップ101〜ステップ105まで、第一の実施形態の手順を用いる。ステップ105で得られるタンパク質を、第一候補タンパク質と呼ぶ。その後、候補物質抽出部135は、第二測定データ記憶部129を参照し第二測定系121で測定された第二測定スペクトルのデータと、リファレンスデータ記憶部115に記憶されたデータとを取得して、第二候補タンパク質を抽出する(S113)。さらに、候補物質抽出部135は、第一候補タンパク質と第二候補タンパク質とを比較して、これらに共通するタンパク質を共通候補タンパク質として抽出する(S115)。
【0069】
その後、理論スペクトルデータ取得部137は、候補物質抽出部135を参照し、共通候補タンパク質の名称に関連づけられた共通候補タンパク質の第一共通理論スペクトルおよび第二共通理論スペクトルのデータを取得する(S117)。また、ステップ117において、理論スペクトルデータ取得部137が、リファレンスデータ記憶部115に記憶された共通候補タンパク質の配列情報を取得して、補助データ記憶部117を参照し、第一測定系119および第二測定系121のそれぞれで測定した際に得られると予測される各理論スペクトル(第一共通理論スペクトルおよび第二共通理論スペクトル)を作成することもできる。
【0070】
そして、統合表示データ作成部139において、第一測定スペクトルと第一共通理論スペクトルとの重ね合わせデータを作成するとともに、第二測定スペクトルと第二共通理論スペクトルとの重ね合わせデータを作成し、統合表示部111に送出する。統合表示部111は、統合表示データ作成部139で作成された重ね合わせデータを受け付けて、第二理論スペクトルを第二測定スペクトルとともに表示するとともに、第一理論スペクトルを第一測定スペクトルとともに表示する。これらの重ね合わせデータは、たとえば一画面中に並べて表示される。
【0071】
本実施形態によれば、二つの測定方法で共通する候補タンパク質のみを選別して測定スペクトルに重ね合わせ表示するため、ユーザにさらに確実に同定を行わせることができる。また、二つの測定スペクトルを一画面に並べて表示することにより、ユーザの同定作業の効率をさらに向上させることができる。
【0072】
(第四の実施形態)
本実施形態は、第二の実施形態で前述した解析支援手順(図4)の別の態様に関する。本実施形態では、理論スペクトルデータを作成する際に、第一理論スペクトルデータを作成する理論スペクトル作成部1100および理論スペクトル作成部1200にて、第一候補タンパク質および第二候補タンパク質に共通する候補タンパク質A400について、候補タンパク質A理論スペクトル500として、第一理論スペクトルおよび第二理論スペクトルを得る。理論MSスペクトル統合表示部2000は、得られた第一理論スペクトルおよび第二理論スペクトルを、それぞれ、第1法のスペクトル310および第2法のスペクトル320とともに表示する。このように、本実施形態では、両法に共通する候補蛋白質Aの理論スペクトルの変換データを二種類作成する。また、理論スペクトルを検出ピーク毎に分類してそれぞれのスペクトルに重ねて表示する。
【0073】
なお、本実施形態において、共通候補タンパク質の理論スペクトルのピークごとに、測定スペクトル中のピークとの対応付けの分類を行い、分類情報をさらに重ね合わせて表示してもよい。図7(a)〜図7(c)は、理論MSスペクトル統合表示部2000に表示されるスペクトルを示す図である。
【0074】
イオン化法の異なる2種類の質量分析計で同じ由来の試料を計測し、抽出された共通候補タンパク質である候補蛋白質Aの理論スペクトルを各測定スペクトルに重ねて表示する。理論MSスペクトル統合表示部2000は、共通候補タンパク質の理論スペクトルのピークと、各測定スペクトルのピークとを対照し、理論スペクトルの各ピークに分類情報を関連づけて表示する。分類情報は、たとえば、
A:候補蛋白質Aの理論スペクトルのピークのうち、第1法および第2法で検出されたピーク
B:候補蛋白質Aの理論スペクトルのピークのうち、第1法および第2法で検出されたピーク
C:候補蛋白質Aの理論スペクトルのピークのうち、第2法でのみ検出されたピーク
D:候補蛋白質Aの理論スペクトルのピークのうち、第1法および第2法で検出されなかったピーク
とする(図7(a))。理論MSスペクトル統合表示部2000は、測定スペクトルと理論スペクトルとを重ね合わせ、さらに理論スペクトルのピークの分類情報をあわせて表示する。図7(b)は、第1法で検出された第一測定スペクトルと候補蛋白質Aの第一理論スペクトルとを分類情報を含めて重ね合わせて表示した図であり、図7(c)は、第2法で検出された第二測定スペクトルと候補蛋白質Aの第二理論スペクトルとを分類情報を含めて重ね合わせて表示した図である。図7(b)および図7(c)に示したように、重ねた理論スペクトルの各ピークがどちらの解析法で検出されたものであるかを区別して表示することにより、擬陽性ピークや擬陰性ピークの判断を容易にすることができる。
【0075】
なお、以上説明した第一〜第四の実施形態に適用可能な試料は、複数の方法で測定スペクトルが取得可能な物質であればよく、タンパク質には限られない。たとえば、複数のイオン化方法で取得可能な物質と例として、タンパク質の他に、ペプチド、核酸、糖、脂質、ポリマー、低分子量の有機化合物、および無機化合物が挙げられる。これらの物質についても、以上の実施形態に記載の解析支援システムに適用可能である。
【0076】
以下の実施形態では、一つの測定スペクトルに基づく同定作業を支援するシステムについて説明する。
【0077】
(第五の実施形態)
本実施形態は、測定スペクトルと理論スペクトルとを重ね合わせて表示し、さらに理論スペクトル中のピークごとに、立体構造上の位置情報をあわせて表示し、翻訳後修飾によるスペクトル解析を支援するものである。
【0078】
図8は、本実施形態におけるタンパク質の質量分析スペクトルの解析支援方法の手順を示すフローチャートである。本実施形態の解析支援方法は、以下の手順を含む。
試料の質量分析により得られた測定スペクトルに基づき、試料の候補物質(候補タンパク質)を検索し、抽出するステップ(S155)、
候補タンパク質の配列データに基づき、候補タンパク質の理論スペクトルのデータを取得するステップ(S157)、
理論スペクトルに含まれる複数のピークについて、候補タンパク質の立体構造を考慮して、候補タンパク質の修飾(翻訳後修飾)の指標を算出し、ピークの識別子に関連づけるステップ(S159)、および
候補タンパク質の理論スペクトルと指標とを測定スペクトルとともに表示するステップ(S161)。
ステップ161の測定スペクトルとともに表示するステップは、さらに、理論スペクトルのピークの配列情報をあわせて表示するステップである。
また、ステップ159の候補タンパク質の翻訳後修飾の指標を算出し、ピークのデータに関連づけるステップは、候補タンパク質の立体構造のデータを取得して、立体構造のデータに基づき、候補タンパク質に含まれるピークの候補タンパク質の表面からの距離を反映する位置パラメータを取得するステップを含む。
【0079】
以下、本実施形態の解析支援の手順をさらに詳細に説明する。
まず、同定対象のタンパク質の抽出を行い、試料を得る(S151)。このステップは、必要に応じて行えばよく、適宜省略することができる。具体的な抽出方法としては、まず、同定対象のタンパク質を含む試料から2次元電気泳動などにより目的のタンパク質を分離する。そして、化学的または酵素的な断片化を行う。酵素的な断片化には、たとえばトリプシン消化を用いることができる。こうすれば、塩基性アミノ酸残基のC末端側でタンパク質を選択的に断片化することができる。以下の実施形態においては、同定対象のタンパク質がトリプシンにより断片化されている場合を例に説明する。
【0080】
次に、測定系にて、試料タンパク質の質量分析測定を行う。質量分析におけるイオン化法は、試料に応じて適宜選択することができる。イオン化方法としては、たとえば、エレクトロスプレーイオン化法(ESI法)、マトリックス支援レーザー脱離イオン化(MALDI)法、高速原子衝突イオン化(FAB)法などが挙げられる。また、質量分析計として、たとえば、イオントラップ質量分析計、四重極型質量分析計、磁場型質量分析計、飛行時間(TOF)型質量分析計、フーリエ変換型質量分析計などを用いることができる。
【0081】
つづいて、測定系から第一方法を用いた質量分析により得られた第一測定スペクトルのデータを取得する(S153)。そして、測定スペクトルに含まれる複数のピークの中から、所定の強度を有するピークを選別し、そのピークリストに基づき、既存のデータベースを用いて候補タンパク質の検索を行う(S155)。このとき、一または二以上の候補タンパク質が抽出されることになる。そして、各候補タンパク質の配列に関するデータに基づき、試料と同じ方法で候補タンパク質を測定した際に得られる理論スペクトルのデータを取得する(S157)。
【0082】
次いで、理論スペクトルに含まれる複数のピークの中から、所定の強度を有するピークを抽出し(S159)、そのそれぞれについて、対応するペプチドの翻訳後修飾の指標を算出する(S161)。ステップ161において、具体的には、候補タンパク質の表面からの距離を数値化した位置パラメータを翻訳後修飾の可能性の指標として用いる。そして、測定スペクトル、理論スペクトル、およびステップ161にて算出された理論スペクトル中のピークごとの指標を重ね合わせて表示する(S163)。以上により、翻訳後修飾の可能性を踏まえて理論スペクトルと測定スペクトルとを比較することができるため、試料の同定を行う際の解析効率および解析確度を向上させることができる。
【0083】
本実施形態における解析支援方法は、解析支援システムにより実行することができる。図9は、本実施の形態における分析システムの構成を示す機能ブロック図である。図9に示した分析システム150は、質量分析データを用いて試料の同定を行うシステムであって、測定系101および解析支援システム160を含む。
【0084】
測定系101は、質量分析データを取得する機器群により構成される。たとえば測定系101は、同定対象の試料の質量分析測定を行うとともに、取得された質量分析データをインターフェイス103内のデータ受付部109に送出する。なお、質量分析データには、質量分析により得られた質量電荷比に対応する強度のデータや、そのイオン化方法等の測定条件に関するデータが含まれる。
【0085】
解析支援システム160は、質量分析により得られた測定データを用いた同定を支援するシステムであって、インターフェイス103、同定支援部105および記憶部107を備える。インターフェイス103は、データ受付部109および統合表示部111を含む。以下、図9および図10を参照して、解析支援システム160の各部の構成をさらに詳細に説明する。図10は、図9に示した解析支援システム160の各部の詳細構成の一例を示す機能ブロック図である。
【0086】
分析システム150は、タンパク質の質量分析スペクトルの解析を支援するシステムである。
分析システム150は、試料の質量分析により得られた測定スペクトルのデータを取得するデータ取得手段(データ受付部109)と、試料の同定を支援する同定支援部105と、理論スペクトルと指標と測定スペクトルのデータとをともに表示する統合表示部111と、を含む。
同定支援部105は、測定スペクトルに基づき、試料の候補タンパク質を抽出する候補物質抽出部135と、候補物質抽出部135で抽出された候補タンパク質の理論スペクトルのデータを取得する理論スペクトルデータ取得部137と、理論スペクトルに含まれる複数のピークについて、候補タンパク質の立体構造を考慮して、候補タンパク質の翻訳後修飾の指標を算出し、ピークのデータに関連づける翻訳後修飾指標算出部161と、を含む。
翻訳後修飾指標算出部161は、候補タンパク質の立体構造のデータを取得して、候補タンパク質に含まれるピークの候補タンパク質の表面からの距離を反映する位置パラメータを取得する。
また、分析システム150は、試料の質量分析により得られた測定スペクトルのデータを記憶する記憶部107をさらに備える。
【0087】
(記憶部)
記憶部107は、測定データ記憶部113、リファレンスデータ記憶部115および補助データ記憶部117を含む。
【0088】
リファレンスデータ記憶部115は、配列データ記憶部175および修飾データ記憶部177を含む。配列データ記憶部175は、既知物質の構造情報を、立体構造の情報とともに格納したタンパク質配列データベースである。タンパク質の配列情報は、アミノ酸配列であってもよいし、遺伝子情報であってもよい。また、修飾データ記憶部177は、タンパク質の翻訳後修飾に関する情報を記憶する。翻訳後修飾に関する情報は、たとえば、翻訳後修飾を受けるアミノ酸配列、修飾基の種類、増減する分子量の数のデータリストである。
【0089】
補助データ記憶部117は、同定支援の補助データを記憶する。補助データとしては、たとえば理論スペクトルおよび翻訳後修飾に関する情報が挙げられる。これらは、統合表示部111にて測定スペクトルとともに表示される。補助データ記憶部117は、理論データ記憶部169、座標データ記憶部171および位置パラメータ算出データ記憶部173を含む。
【0090】
理論データ記憶部169は、同定支援を補助するデータとして、リファレンスデータ記憶部115に格納されたタンパク質の配列情報を、当該タンパク質を測定系101による測定に供した際に得られると予測される理論スペクトルデータに変換する変換式のデータを格納する。なお、記憶部107が補助データ記憶部117を有する構成にかえて、リファレンスデータ記憶部115に変換式を用いて変換した理論スペクトルのデータが保存されている構成としてもよい。
【0091】
座標データ記憶部171は、候補タンパク質の理論スペクトル中のピークに対応するペプチドの座標を算出する算出式を記憶する。候補タンパク質表面からの座標は、たとえば、ペプチドの重心の座標として算出される。また、座標データ記憶部171に、算出式を用いて算出した候補タンパク質中のペプチドの座標のデータが保存されていてもよい。
【0092】
位置パラメータ算出データ記憶部173は、理論スペクトル中のピークに対応するペプチドの座標と、配列データ記憶部175に格納された候補タンパク質の立体構造に関する情報とを用いて、当該ペプチドの候補タンパク質表面からの距離の指標である位置パラメータを算出する算出式を記憶する。また、位置パラメータ算出データ記憶部173に、算出式を用いて算出した位置パラメータが保存されていてもよい。
【0093】
(インターフェイス)
インターフェイス103は、ユーザまたは他の解析システムとのデータの授受を行う。インターフェイス103を介して入出力されたデータは、同定支援部105内で処理される。インターフェイス103は、データ受付部109および統合表示部111により構成される。測定系101で測定された測定スペクトルのデータは、データ受付部109から同定支援部105に送出されるとともに、記憶部107の測定データ記憶部113に格納される。
【0094】
統合表示部111は、同定支援部105にて作成された統合表示データを受け付けて、ユーザに提示する。具体的には、モニタや紙面等の上に、測定系101で得られた測定スペクトルと同定支援部105にて作成された理論スペクトルとを重ね合わせ、理論スペクトル中のピークの翻訳後修飾に関する指標とともに表示する。
【0095】
(同定支援部)
同定支援部105は、候補物質抽出部135、理論スペクトルデータ取得部137、翻訳後修飾指標算出部161および統合表示データ作成部139から構成される。
【0096】
候補物質抽出部135は、データ受付部109から送出される測定スペクトルのピークデータとリファレンスデータ記憶部115の配列データ記憶部175に格納されたタンパク質配列データベースとのマッチングを行い、同定候補となるタンパク質を抽出する。
【0097】
理論スペクトルデータ取得部137は、記憶部107を参照し、候補物質抽出部135で抽出された候補タンパク質の理論スペクトルを取得する。このとき、リファレンスデータ記憶部115に理論スペクトルのデータが候補タンパク質名に関連づけて格納されていてもよい。また、リファレンスデータ記憶部115に格納された候補タンパク質の配列情報および補助データ記憶部117に格納された変換式のデータから、理論スペクトルデータ取得部137にて理論スペクトルを作成してもよい。理論スペクトルデータ取得部137は、取得した理論スペクトルのデータを、統合表示データ作成部139に送出する。また、これとともに、理論スペクトルのデータを理論データ記憶部169に格納してもよい。
【0098】
翻訳後修飾指標算出部161は、理論スペクトルピークデータ取得部163、ピーク座標算出部165および位置パラメータ算出部167を含む。
理論スペクトルピークデータ取得部163は、理論スペクトルデータ取得部137で取得された理論スペクトルのピークデータを取得する。理論スペクトルピークデータ取得部163は、作成した理論スペクトルのデータを、統合表示データ作成部139に送出する。また、これとともに、理論スペクトルのデータを理論データ記憶部169に格納してもよい。
【0099】
ピーク座標算出部165は、理論スペクトルピークデータ取得部163にて取得された理論スペクトル中から所定の強度以上のピークを抽出する。そして、配列データ記憶部175に格納された候補タンパク質の配列情報と抽出されたピークとを比較して、ピークが候補タンパク質のアミノ酸配列中のどの部分に対応するかを求める。そして、配列データ記憶部175に格納された候補タンパク質の立体構造に関する情報を参照するとともに、座標データ記憶部171に格納された座標の算出式を参照して、ピークの座標を算出する。
【0100】
位置パラメータ算出部167は、ピーク座標算出部165で算出されたピークの座標と、配列データ記憶部175に格納された候補タンパク質の立体構造に関する情報を参照するとともに、位置パラメータ算出データ記憶部173に格納された距離の算出式を参照して、ピークに対応するペプチドの候補タンパク質表面からの距離に対応する位置パラメータを算出する。算出された距離の指標を、翻訳後修飾の受けやすさに関する指標として、統合表示データ作成部139に送出する。また、得られた距離の指標を位置パラメータ算出データ記憶部173に記憶させてもよい。
【0101】
統合表示データ作成部139は、測定データ記憶部113および必要に応じて補助データ記憶部117を参照し、測定系101で測定された測定スペクトルと理論スペクトルとを重ね合わせたデータを作成する。さらに、理論スペクトル中の各ピークについて、位置パラメータ算出部167にて算出されたペプチドの翻訳後修飾の指標を対応づける。そして、これらを統合表示部111に送出する。また、統合表示データ作成部139は、さらに、理論スペクトル中の各ピークのアミノ酸配列の情報を各ピークに関連づけて統合表示部111に送出してもよい。こうすれば、ユーザの解析操作をさらに容易にすることができる。
【0102】
次に、本実施形態の作用効果を説明する。
本実施形態では、質量分析計で計測した結果から候補タンパク質を抽出し、候補タンパク質の理論スペクトル作成し、これを測定スペクトルに重ねて表示する。このため、測定スペクトル中の擬陽性ピークや擬陰性ピークの判別を容易にすることができる。
【0103】
本実施形態では、さらに、測定スペクトルと理論スペクトルとを重ね合わせて表示する際に、理論スペクトル中のそれぞれのピークに該当するペプチドを特定し、候補タンパク質が、立体構造において、どれだけ表面に近い場所に存在するかの指標を表示する。理論スペクトルについて表面に近く配置されるものほど翻訳後修飾の影響を受けやすく、検出された理論スペクトルが擬陽性である確率が高い。あるいは、一定質量数シフトさせた場所にスペクトルが得られる可能性が高い。このため、タンパク質の外表面からの位置に関する位置パラメータを表示することにより、翻訳後修飾の受けやすさに対応する情報をスペクトルとともにユーザに提示することができる。よって、ユーザが翻訳後修飾の可能性を考慮しながらスペクトル中のピークを効率よく取捨選択することができる。よって、ユーザの解析操作の効率を向上させるとともに、ピークの抽出精度を向上させることができる。
【0104】
(第六の実施形態)
本実施形態では、第五の実施形態と異なる点を中心に説明する。
本実施形態は、図9に示した分析システムを用いたの別の解析支援手順に関する。図11は、本実施形態の分析システムを用いた解析支援手順を説明する図である。
図11において、まず、未知サンプルからタンパク質の抽出処理を行い、スペクトル検出210を行う。得られたスペクトル310を用いて、タンパク質同定検索330を行い、候補タンパク質を抽出する。ここでは候補タンパク質として、候補タンパク質A400が抽出された場合を例示している。
【0105】
その後、理論スペクトル作成部1100にて、理論スペクトルデータを作成し、候補タンパク質A理論スペクトル500を得る。得られた理論スペクトルは、理論MSスペクトル統合表示部2000にて表示される。
【0106】
また、理論スペクトル中のピークについて、候補タンパク質Aの立体構造600の情報と、候補タンパク質Aアミノ酸配列情報420とに基づき、立体構造情報解析部3000において、候補タンパク質A400の立体構造が解析される。そして、理論スペクトル中の各ピークの配列情報が、立体配置情報610に基づき、立体配置変換部4000にて座標データに変換される。そして、各ピークについて、タンパク質表面からの距離指標6000が算出される。また、図11に示した態様においては、距離指標6000をさらに翻訳後修飾の受けやすさを示す別の指標に換算する翻訳後修飾指標算出部5000が設けられており、翻訳後修飾指標算出部5000にて算出された翻訳後修飾指標7000が理論MSスペクトル統合表示部2000にて表示される。
【0107】
図12〜図13は、理論MSスペクトル統合表示部2000に表示されるスペクトルを示す図である。図12(a)は、スペクトル310の一例を示す図である。図12(b)は、候補タンパク質A理論スペクトル500を示す図である。候補タンパク質A理論スペクトル500は、ピーク1〜ピーク6の6本の主要ピークを有し、ピーク1、3、4および5がスペクトル310にて検出されたピークであり、ピーク2および6が未検出のピークである。これらのピークについて、理論スペクトルから得られるアミノ酸配列情報を元に候補タンパク質A中の立体配置を特定する。図13(a)は、図12(b)に示した各ピークに対応するペプチドのアミノ酸配列(一文字表記)および各ペプチドの候補タンパク質A中での座標(X、Y、Z)を示す図である。
【0108】
さらに、各ピークに対応するペプチドの座標データを用いて、表面からの距離を数値化して、翻訳後修飾の指標となる位置パラメータを算出する。このパラメータがゼロである場合、タンパク質の表面に局在しており、数値が小さいほど翻訳後修飾を受けやすいことを示している。また、位置パラメータとともに、各ピークに対応するペプチドの配列情報も同時に表示することで修飾判定の支援を行う。
【0109】
図13(b)は、理論MSスペクトル統合表示部2000に表示される情報を示す。図13(b)においては、図12(a)および図12(b)のスペクトルを重ね合わせて表示するとともに、ピーク1〜6のそれぞれについて、候補タンパク質Aの立体構造の表面からの距離の指標および対応するペプチドのアミノ酸配列を表示している。さらに、理論スペクトルについては、測定スペクトル中に検出されているものとされていないものとを区別して表示している。
【0110】
図13(b)に示したように統合表示することにより、ユーザは、理論スペクトルのピークと測定スペクトルのピークとを効率よく比較するとともに、スペクトルを取捨選択する際に、各理論スペクトルのピークに対応するアミノ酸配列および表面からの距離を踏まえて、当該ペプチドの修飾のされやすさを考慮しながら作業を行うことができる。このため、同定をさらに確実に行うことができる。
【0111】
また、図11に示した手順において、翻訳後修飾の修飾残基によるスペクトル変化の予測を支援する態様とすることもできる。図14は、こうした手順を示す図である。図14において、理論スペクトルの各ピークについて、翻訳後修飾指標算出部5000にて算出された翻訳後修飾指標7000と、候補タンパク質Aアミノ酸配列情報420とに基づき、翻訳後修飾種別判定部7100において、翻訳後修飾の種別を判定する。そして、得られた翻訳後修飾種別測定結果8000が、理論MSスペクトル統合表示部2000に表示される。
【0112】
図15(a)は、理論MSスペクトル統合表示部2000に表示されるスペクトルを示す図である。また、図15(b)は、図15(a)で表示される理論スペクトルの各ピークの配列番号、各ピークに対応するペプチドのアミノ酸配列、および当該ペプチドの座標を示す図である。
【0113】
図15(a)に示すように、図14を参照した解析支援においては、理論スペクトルから得られるペプチド情報の立体配置および配列情報から、予測される翻訳後修飾によるスペクトル変化の予測を支援する。たとえば、検出されなかった理論スペクトルのピーク2およびピーク5の位置パラメータの値が小さく、立体配置的に翻訳後修飾を受けやすいピークであると考えられる。
【0114】
ここで、理論スペクトル中の翻訳後修飾を受けやすいピークに由来する配列に一定の配列(KまたはRの近くにSP)が存在すると、リン酸化されることが予想される。ピーク2はこの配列を有するため、この場合、80Da大きい理論リン酸化スペクトルが表示される。
【0115】
一方、検出された理論スペクトル中のピーク5は脱リン酸化されると予想される。この場合、理論スペクトル5の配列にセリンあるいはスレオニンが含まれるなら98Da小さいその副スペクトルが表示され、理論スペクトル5の配列にチロシンが含まれるなら80Da小さい脱リン酸化副理論スペクトルが表示される。これにより、副スペクトルの検出が支援される。
【0116】
なお、第五および第六の実施形態に適用可能な試料は、候補物質の立体構造とその修飾や構造変化との関係が推測される物質であればよく、タンパク質には限られない。たとえば、タンパク質の他に、ペプチド、核酸、糖、およびポリマーが挙げられる。これらの物質についても、第五および第六の実施形態の実施形態に記載の解析支援システムに適用可能である。
【0117】
以上、本発明を実施形態に基づいて説明した。これらの実施形態は例示であり、それらの各構成要素や各処理プロセスの組み合わせにいろいろな変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者に理解されるところである。
【0118】
たとえば、第一〜第四の実施形態の構成と、第五〜第六の実施形態の構成は、組み合わせて用いてもよい。
【0119】
また、以上の実施形態において、統合表示部111が、測定スペクトルとともに、理論スペクトルの優先度を示す他の指標を表示してもよい。優先度を示す指標として、たとえば以下のものが挙げられ、これらのうち、いずれか一つを表示してもよいし、所定の複数の指標を重ね合わせて表示してもよい。
(i)補正式からの理論スペクトルの距離
測定スペクトルと、これに対応する理論スペクトルとを用いて、測定スペクトルを補正する式を算出する。そして、その補正式からの理論スペクトルの距離を測定スペクトルとともに表示する。補正式の算出方法として、たとえば、最小自乗法等が挙げられる。また、このとき、記憶部107が、補正式算出データ記憶部を含み、同定支援部105が、距離算出部を含んでもよい。距離算出部は、測定データ記憶部113と補正式算出データ記憶部とを参照して、測定スペクトルを補正した補正式を作成し、当該補正式と補助データ記憶部117に格納された理論スペクトルデータとを照合して距離を算出し、統合表示部に距離のデータを送出する。
(ii)理論スペクトルの同位体由来のスペクトル
同定支援部105は、理論スペクトル中のピークについて、タンパク質を構成する炭素や窒素の数を考慮して、これらの元素の同位体に由来する理論副スペクトル成分を算出し、統合表示部111に送出する。統合表示部111では、この理論スペクトル成分を測定スペクトルに重ねて表示する。または、同定支援部105が、理論副スペクトルを含む理論スペクトルと測定スペクトルとの類似度を求めて適合度を算出する適合度算出部を有し、統合表示部111が、算出された適合度を測定スペクトルとともに表示する態様とすることもできる。
(iii)ピークの優位差検定に関するパラメータ
たとえば、同定支援部105において、一つの理論ピークと、当該理論ピークを中心に分布している一つの測定ピークの強度とを優位差検定したり、その棄却率を算出する。そして、得られた結果を優先度を示す指標として測定スペクトルとともに表示する。
(iv)正規分布曲線との一致率
記憶部107は、正規分布曲線のピークデータを記憶する正規分布曲線データ記憶部を有する。同定支援部105は、正規分布曲線データ記憶部を参照して正規分布曲線のピークデータを取得して、測定スペクトル中のピークと、正規分布曲線とを比較し、一致率を算出する一致率算出部を有する。
(v)S/N比
同定支援部105が、S/N比算出部を有する。S/N比算出部は、測定スペクトルのS/N比を算出し、得られた結果を優先度の指標として統合表示部111に送出する。
【0120】
また、以上の実施形態における補助データ記憶部117が、上記(i)〜(v)に関する情報を記憶し、理論スペクトルデータ取得部137において、上記(i)〜(v)のうちの所定の複数の指標を用いて理論スペクトル中の複数のピークに優先順位の情報をたとえば一致度(%)として各ピーク情報に関連づけてもよい。このとき、統合表示部111にて、理論スペクトルと一致度とをあわせて表示してもよい。こうすれば、ユーザが理論スペクトル中の個々のピークを採用すべきかどうかを判断する際に、その作業をさらに確実に行えるよう支援することができる。
【0121】
また、以上の実施形態において、統合表示部111に表示された結果を印刷部により出力させることができる。この場合、印刷物上に同定候補となるタンパク質が提示される。
【0122】
また、試料の同定における候補タンパク質の抽出は、たとえばインターネット等のネットワークを介して他の端末上で行うこともできる。この場合、同定プログラムとして、たとえば、MS−FITやProFound等を利用することができる。
【図面の簡単な説明】
【0123】
【図1】本実施形態に係る解析支援手順を示すフローチャートである。
【図2】本実施形態に係る分析システムの構成を示す機能ブロック図である。
【図3】本実施形態に係る分析システムの構成を示す機能ブロック図である。
【図4】本実施形態に係る解析支援システムを説明する図である。
【図5】本実施形態に係る解析支援システムの表示例を示す図である。
【図6】本実施形態に係る解析支援手順を示すフローチャートである。
【図7】本実施形態に係る解析支援システムの表示例を示す図である。
【図8】本実施形態に係る解析支援方法の手順を示すフローチャートである。
【図9】本実施形態に係る分析システムの構成を示す機能ブロック図である。
【図10】本実施形態に係る分析システムの構成を示す機能ブロック図である。
【図11】本実施形態に係る解析支援システムを説明する図である。
【図12】本実施形態に係る解析支援システムの表示例を示す図である。
【図13】本実施形態に係る解析支援システムの表示例を示す図である。
【図14】本実施形態に係る解析支援システムを説明する図である。
【図15】本実施形態に係る解析支援システムの表示例を示す図である。
【符号の説明】
【0124】
100 未知サンプル
101 測定系
103 インターフェイス
105 同定支援部
107 記憶部
109 データ受付部
110 タンパク質抽出処理
111 統合表示部
113 測定データ記憶部
115 リファレンスデータ記憶部
117 補助データ記憶部
119 第一測定系
120 分析システム
121 第二測定系
123 第一受付部
125 第二受付部
127 第一測定データ記憶部
129 第二測定データ記憶部
130 解析支援システム
131 第一理論データ記憶部
133 第二理論データ記憶部
135 候補物質抽出部
137 理論スペクトルデータ取得部
139 統合表示データ作成部
150 分析システム
160 解析支援システム
161 翻訳後修飾指標算出部
163 理論スペクトルピークデータ取得部
165 ピーク座標算出部
167 位置パラメータ算出部
169 理論データ記憶部
171 座標データ記憶部
173 位置パラメータ算出データ記憶部
175 配列データ記憶部
177 修飾データ記憶部
210 第1法でのスペクトル検出
220 第2法でのスペクトル検出
310 第1法のスペクトル
320 第2法のスペクトル
330 タンパク質同定検索
340 タンパク質同定検索
400 候補タンパク質A
410 候補タンパク質B
500 候補タンパク質A理論スペクトル
510 候補タンパク質B理論スペクトル
600 立体構造
610 立体配置情報
1100 理論スペクトル作成部
1200 理論スペクトル作成部
2000 理論MSスペクトル統合表示部
3000 立体構造情報解析部
4000 立体配置変換部
5000 翻訳後修飾指標算出部
6000 距離指標
7000 翻訳後修飾指標
7100 翻訳後修飾種別判定部
8000 翻訳後修飾種別測定結果

【特許請求の範囲】
【請求項1】
試料の質量分析スペクトルの解析を支援するシステムであって、
第一方法に基づく前記試料の第一測定スペクトルのデータと、第二方法に基づく前記試料の第二測定スペクトルのデータとを取得するデータ取得手段と、
前記第一測定スペクトルに基づき前記試料の第一候補物質を抽出するとともに、前記第一候補物質を前記第二方法により測定した際に得られると予測される前記第一候補物質の第二理論スペクトルのデータを取得する同定支援部と、
前記同定支援部で取得された前記第一候補物質の前記第二理論スペクトルと、前記試料の前記第二測定スペクトルとをともに表示する統合表示部と、
を含む解析支援システム。
【請求項2】
請求項1に記載の解析支援システムにおいて、
前記同定支援部が、
前記第二測定スペクトルに基づき前記試料の第二候補物質を抽出するとともに、前記第一候補物質と前記第二候補物質とに共通する物質を共通候補物質として抽出し、
前記第一候補物質のうち、前記共通候補物質を前記第二方法により測定した際に得られると予測される第二理論スペクトルのデータを取得し、
前記統合表示部が、前記共通候補物質の前記第二理論スペクトルと前記試料の前記第二測定スペクトルとをともに表示する解析支援システム。
【請求項3】
請求項2に記載の解析支援システムにおいて、
前記同定支援部が、前記共通候補物質の前記第二理論スペクトルのデータとともに、前記共通候補物質を前記第一方法により測定した際に得られると予測される第一理論スペクトルのデータを取得し、
前記統合表示部が、前記共通候補物質の前記第二理論スペクトルと前記試料の前記第二測定スペクトルとをともに表示するとともに、前記共通候補物質の前記第一理論スペクトルと前記試料の前記第一測定スペクトルとをともに表示する解析支援システム。
【請求項4】
試料の質量分析スペクトルの解析を支援するシステムであって、
前記試料の質量分析により得られた測定スペクトルのデータを取得するデータ取得手段と、
前記測定スペクトルに基づき、前記試料の候補物質を抽出するとともに、前記候補物質の理論スペクトルのデータを取得して、前記理論スペクトルに含まれる複数のピークについて、前記候補物質の立体構造を考慮して前記候補物質の修飾の指標を算出し、前記ピークのデータに関連づける同定支援部と、
前記試料の前記測定スペクトルと、前記候補物質の前記理論スペクトルと、前記指標とをともに表示する統合表示部と、
を含む解析支援システム。
【請求項5】
請求項4に記載の解析支援システムにおいて、
前記同定支援部が、前記候補物質の立体構造のデータを取得して、前記候補物質の前記理論スペクトルに含まれる前記ピークの前記候補物質の表面からの距離を反映する位置パラメータを前記指標として取得する解析支援システム。
【請求項6】
請求項1乃至5いずれかに記載の解析支援システムにおいて、前記試料がタンパク質である解析支援システム。
【請求項7】
コンピュータシステムを、請求項1乃至6いずれかに記載の解析支援システムとして機能させるためのプログラム。
【請求項8】
試料の質量分析スペクトルの解析を支援する方法であって、
第一方法に基づく質量分析により前記試料の第一測定スペクトルを取得するとともに、第二方法に基づく質量分析により前記試料の第二測定スペクトルを取得するステップと、
前記第一測定スペクトルに基づいて、前記試料の第一候補物質を抽出するステップと、
前記第一候補物質を前記第二方法により測定した際に得られると予測される前記第一候補物質の第二理論スペクトルを取得するステップと、
前記第一候補物質の前記第二理論スペクトルと前記試料の前記第二測定スペクトルとをともに表示するステップと、
を含む解析支援方法。
【請求項9】
請求項8に記載の解析支援方法において、前記第一方法と前記第二方法のイオン化方法が異なる解析支援方法。
【請求項10】
請求項8または9に記載の解析支援方法において、
前記第二測定スペクトルに基づいて、前記試料の第二候補物質を抽出するステップをさらに含み、
第一候補物質の配列データに基づき、第一候補物質の第二理論スペクトルを取得する前記ステップが、前記第一候補物質のうち、前記第二候補物質と共通する共通候補物質を前記第二方法により測定した際に得られると予測される前記共通候補物質の第二理論スペクトルを取得するステップであって、
第一候補物質の第二理論スペクトルと試料の第二測定スペクトルとをともに表示する前記ステップが、前記共通候補物質の前記第二理論スペクトルと前記試料の前記第二測定スペクトルとをともに表示するステップである解析支援方法。
【請求項11】
請求項10に記載の解析支援方法において、
前記共通候補物質を前記第一方法により測定した際に得られると予測される前記共通候補物質の第一理論スペクトルを取得するステップをさらに含み、
第一候補物質の第二理論スペクトルと試料の第二測定スペクトルとをともに表示する前記ステップが、前記共通候補物質の前記第二理論スペクトルと前記試料の前記第二測定スペクトルとをともに表示するとともに、前記共通候補物質の前記第一理論スペクトルと前記試料の前記第一測定スペクトルとをともに表示するステップである解析支援方法。
【請求項12】
試料の質量分析スペクトルの解析を支援する方法であって、
前記試料の質量分析により得られた測定スペクトルに基づき、前記試料の候補物質を抽出するステップと、
前記候補物質の理論スペクトルのデータを取得するステップと、
前記候補物質の前記理論スペクトルに含まれる複数のピークについて、前記候補物質の立体構造を考慮して、前記候補物質の修飾の指標を算出し、前記ピークのデータに関連づけるステップと、
前記候補物質の前記理論スペクトルと前記指標とを前記測定スペクトルととともに表示するステップと、
を含む解析支援方法。
【請求項13】
請求項12に記載の解析支援方法において、候補物質の修飾の指標を算出し、ピークのデータに関連づける前記ステップが、
前記候補物質の立体構造のデータを取得して、前記立体構造のデータに基づき、前記候補物質の前記理論スペクトルに含まれる前記ピークの前記候補物質の表面からの距離を反映する位置パラメータを取得するステップを含む解析支援方法。
【請求項14】
請求項8乃至13いずれかに記載の解析支援方法において、前記試料がタンパク質である解析支援方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate


【公開番号】特開2007−10509(P2007−10509A)
【公開日】平成19年1月18日(2007.1.18)
【国際特許分類】
【出願番号】特願2005−192304(P2005−192304)
【出願日】平成17年6月30日(2005.6.30)
【出願人】(000004237)日本電気株式会社 (19,353)
【Fターム(参考)】