説明

タンパク質相対定量方法、そのプログラム及びそのシステム

【課題】タンパク質の相対定量を行うのに適したMSデータを選出する。
【解決手段】同じアミノ酸配列を持つが異なる同位体が導入された二以上のタンパク質から得られるペプチド断片の混合物をLC/MS/MS装置に供することにより得られたMSデータに基づくタンパク質の相対定量を、コンピュータソフトウェアを用いて行う。具体的には、ペプチド断片を決定する際に用いられたMSデータを暫定基準MSデータとし(S310)、そのLC保持時間の前後所定の範囲に存在するMSデータの各々につき明確性指標を算出し、その最も大きな値を基準値とする(S315〜S340)。その基準値の算出に用いられたMSデータ(基準MSデータ)のLC保持時間の前後に存在するMSデータの各々につき明確性指標を算出し、算出した明確性指標と基準値とに基づいてタンパク質の相対定量に用いるMSデータを選出する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、タンパク質相対定量方法、そのプログラム及びそのシステムに関する。
【背景技術】
【0002】
近年の質量分析技術の進展に伴い、液体クロマトグラフィ(LC)装置とタンデム型の質量分析(MS)装置とを連結させたLC/MS/MS装置が使用されるようになった。MSスペクトルデータはノイズを含め複数のピークを有する非常に複雑なスペクトルデータである。また、LC装置と連結したことにより、大量のスペクトルデータが容易に得られるようになったが、これらのスペクトルデータを解析する手法は手作業で行われている。この作業は熟練した技術と多くの手間が必要となるため、データ解析の自動化・高速化が求められており、従来よりスペクトルを解析する手法が開発されてきた。例えば、特許文献1に記載された解析手法では、MSスペクトルデータが与えられたときに、自動でピークを同定することができる。
【特許文献1】特開2006−170710号公報
【発明の開示】
【発明が解決しようとする課題】
【0003】
ところで、LC/MS/MSを用いてタンパク質の相対定量を行うためには、LC/MS/MSスペクトル測定で得られるスペクトルデータはLC保持時間毎に連続するデータであるため、従来の手法で精度よく相対定量を行うためには、どのLC保持時間のMSスペクトルを解析するかをユーザ自身が選出し、その選出したMSスペクトルデータのそれぞれについてスペクトル解析を行う必要がある。なぜなら、LC/MS/MSスペクトル測定で得られるデータは、連続したスペクトルデータであり、精度の高い解析を行うためには、個々のスペクトルデータだけでなく前後のスペクトルデータをも合わせた総合的な解析を行う必要があるためである。しかしながら、既に述べたように、MSスペクトルデータは非常に複雑なデータであるため、連続する大量のデータを解析するのは、非常に手間のかかる作業である。
【0004】
本発明は、このような課題に鑑みてなされたものであり、分析装置により得られたMSデータのうちタンパク質相対定量を行うのに適したMSデータを選出するタンパク質相対定量方法、そのプログラム及びそのシステムを提供することを目的の一つとする。また、同じアミノ酸配列を持つが異なる同位体が導入された二以上のタンパク質の量比を容易に求めることができるタンパク質相対定量方法、そのプログラム及びそのシステムを提供することを目的の一つとする。
【課題を解決するための手段】
【0005】
本発明は、上述の目的の少なくとも一つを達成するために以下の手段を採った。
【0006】
本発明のタンパク質相対定量方法は、
同じアミノ酸配列を持つが異なる同位体が導入された二以上のタンパク質から得られるペプチド断片の混合物をLC装置とMS装置とを含む分析装置に供することにより得られたMSデータに基づく前記タンパク質の相対定量を、コンピュータソフトウェアを用いて行うタンパク質相対定量方法であって、
(a)前記ペプチド断片を決定する際に用いられたMSデータを暫定基準MSデータとして選出するステップと、
(b)前記暫定基準MSデータのLC保持時間の前後所定の範囲に存在するMSデータの各々につき、所定のm/z領域の全範囲の強度の積分値Ltotalを求めると共に同じアミノ酸配列のペプチド断片であって異なる質量の同位体が導入されたもののピーク強度の積分値の合計ΣPを求め、両者の比Lrate(=ΣP/Ltotal)を明確性指標として算出し、該明確性指標のうち最も大きな値を明確性指標の基準値emaxとするステップと、
(c)前記基準値emaxの算出に用いられたMSデータを基準MSデータとし、該基準MSデータのLC保持時間の前後に存在するMSデータの各々につき前記明確性指標を算出し、算出した明確性指標と基準値emaxとに基づいて前記タンパク質の相対定量に用いるMSデータを選出するステップと
を含むものである。
【0007】
このタンパク質相対定量方法では、同じアミノ酸配列を持つが異なる同位体が導入された二以上のタンパク質から得られるペプチド断片の混合物をLC装置とマススペクトル装置とを含む分析装置に供することにより得られたMSデータの中から、そのタンパク質の相対定量に用いるのに相応しいMSデータを選出するが、前提として、そのタンパク質を構成する各ペプチド断片がどのようなアミノ酸配列を有しているかは分析装置から得られたMSデータに基づいて予め予測されているものとする。さて、このタンパク質相対定量方法では、まず、ペプチド断片を予測する際に用いられたMSデータを暫定基準MSデータとして選出する。次いで、選出した暫定基準MSデータのLC保持時間の前後所定の範囲に存在するMSデータの各々につき明確性指標を算出し、該明確性指標のうち最も大きな値を明確性指標の基準値emaxとする。そして、この基準値emaxの算出に用いられたMSデータを基準MSデータとし、該基準MSデータのLC保持時間の前後に存在するMSデータの各々につき明確性指標を算出し、算出した明確性指標と基準値emaxとに基づいてタンパク質の相対定量に用いるMSデータを選出する。こうすることにより、非常に複雑で膨大なMSデータの中からタンパク質の相対定量を行うに適したMSデータを人手を介することなく適切かつ迅速に得ることができる。また、人手を介する場合にはその人の意思を排除できないため誰が作業をするかによって選出されるMSデータが変わり、それがタンパク質の相対定量の精度低下の一因となっていたが、そのような精度低下を招くこともない。
【0008】
なお、同位体としては、安定同位体が好ましく、例えば炭素原子であれば12Cと13C、窒素原子であれば14Nと15N、酸素原子であれば16Oと18Oが好ましい。
【0009】
本発明のタンパク質相対定量方法において、前記ステップ(b)では、前記暫定基準MSデータのLC保持時間の前後所定の範囲に存在するMSデータを、LC保持時間の長さ順に並べた前記MSデータのうち前記暫定基準MSデータのLC保持時間を中心とした前後所定数のMSデータとしてもよい。こうすれば、明確性指標の基準値emaxを算出するためのMSデータを容易に選出することができる。なお、前後所定の範囲とは、特に限定するものではないが、例えば前後3個の範囲から前後10個の範囲までの中から適宜決めてもよい。
【0010】
本発明のタンパク質相対定量方法において、前記ステップ(b)では、前記同じアミノ酸配列のペプチド断片であって異なる同位体が導入されたもののピークの強度の積分値を求めるにあたり、天然同位体の存在も考慮して該ピークの強度の積分値を求めてもよい。こうすれば、天然同位体の存在を考慮しない場合に比べて明確性指標の値の信頼性が高くなり、ひいてはタンパク質の相対定量の精度が高くなる。
【0011】
本発明のタンパク質相対定量方法において、前記ステップ(c)では、前記算出した明確性指標と基準値emaxとに基づいて前記タンパク質の相対定量に用いるMSデータを選出するにあたり、前記算出した明確性指標が基準値emaxに予め定められた1未満の係数を乗じた値を閾値とし該閾値を超えるか又は該閾値以上のときに該明確性指標の算出に用いたMSデータを前記タンパク質の相対定量に用いるMSデータとして選出してもよい。こうすれば、タンパク質の相対定量を行うに相応しいMSデータを容易に選出することができる。
【0012】
本発明のタンパク質相対定量方法において、前記ステップ(c)では、前記タンパク質の相対定量に用いるMSデータを選出するにあたり、前記基準MSデータのLC保持時間の前後所定の範囲に存在するMSデータを超えて選出しないようにしてもよい。こうすれば、不必要に多くのMSデータを対象として明確性指標を算出することがなくなるため、処理時間が短くなる。ここで、前後所定の範囲は、例えばある範囲を超えたMSデータの明確性指標については基準値emaxとの関係からしてタンパク質の相対定量に用いるMSデータとして選出する必要がほとんどゼロであるということが経験的に判明している場合には、その範囲を所定の範囲として設定すればよい。
【0013】
本発明のタンパク質相対定量方法は、前記ステップ(a)〜(c)に加えて、(d)前記ステップ(c)で選出した前記タンパク質の相対定量に用いるMSデータの各々につき、同じアミノ酸配列を持つが異なる同位体が導入された二以上のペプチド断片のピークの強度の積分値の比を同位体比として算出し、該同位体比に基づいて前記タンパク質の量比を求めるステップを含んでいてもよい。こうすれば、同じアミノ酸配列を持つが異なる同位体が導入された二以上のタンパク質の量比を容易に求めることができる。この態様を採用した本発明のタンパク質相対定量方法において、前記ステップ(d)では、前記同位体比に基づいて前記タンパク質の相対定量を行うにあたり、前記タンパク質を構成する各ペプチド断片について前記同位体比を算出し該算出した同位体比に統計的な処理を施した値(例えば平均値など)を前記タンパク質の量比としてもよい。
【0014】
本発明のタンパク質相対定量方法において、前記分析装置は、LC装置と該LC装置で分離された成分が供されるタンデム型のMS/MS装置とで構成されるLC/MS/MS装置であり、前記MSデータは、前記タンデム型のMS/MS装置の一つ目の質量分析計で得られるMSデータであってもよい。LC/MS/MS装置の一つ目の質量分析計で得られるMSデータは膨大な量であることが多いため、本発明を適用する意義が高い。また、本発明は、後述する実施形態で説明するStable Isotope Labeling by Amino Acids in Cell Calture法(SILAC法)のほか、ICAT(University of Washington社の登録商標)法やiTRAQ(Applera Corporation社の登録商標)法、an approach based on the use of culture−derved isotope tags法(CDIT法)などに適用可能である。
【0015】
本発明のプログラムは、上述したいずれかのタンパク質相対定量方法を1又は複数のコンピュータに実行させるためのプログラムである。このプログラムは、コンピュータが読み取り可能な記録媒体(例えばハードディスク、ROM、FD、CD、DVDなど)に記録されていてもよいし、伝送媒体(インターネットやLANなどの通信網)を介してあるコンピュータから別のコンピュータへ配信されてもよいし、その他どのような形で授受されてもよい。このプログラムを一つのコンピュータに実行させるか又は複数のコンピュータに各ステップを分担して実行させれば、上述したいずれかのタンパク質相対定量方法と同様の効果が得られる。
【0016】
本発明のタンパク質相対定量システムは、
同じアミノ酸配列を持つが異なる同位体が導入された二以上のタンパク質から得られるペプチド断片の混合物をLC装置とMS装置とを含む分析装置に供することにより得られたMSデータに基づく前記タンパク質の相対定量を行うタンパク質相対定量システムであって、
前記ペプチド断片を決定する際に用いられたMSデータを暫定基準MSデータとして選出する暫定基準データ選出手段と、
前記暫定基準MSデータのLC保持時間の前後所定の範囲に存在するMSデータの各々につき、所定のm/z領域の全範囲の強度の積分値Ltotalを求めると共に同じアミノ酸配列のペプチド断片であって異なる質量の同位体が導入されたもののピーク強度の積分値の合計ΣPを求め、両者の比Lrate(=ΣP/Ltotal)を明確性指標として算出し、該明確性指標のうち最も大きな値を明確性指標の基準値emaxとする基準値算出手段と、
前記基準値emaxの算出に用いられたMSデータを基準MSデータとし、該基準MSデータのLC保持時間の前後に存在するMSデータの各々につき、前記明確性指標を算出し、算出した明確性指標と基準値emaxとに基づいて前記タンパク質の相対定量に用いるMSデータを選出する相対定量用データ選出手段と、
を備えたものである。
【0017】
このタンパク質相対定量システムでは、同じアミノ酸配列を持つが異なる同位体が導入された二以上のタンパク質から得られるペプチド断片の混合物をLC装置とMS装置とを含む分析装置に供することにより得られたMSデータの中から、そのタンパク質の相対定量に用いるのに相応しいMSデータを選出するが、前提として、そのタンパク質を構成する各ペプチド断片がどのようなアミノ酸配列を有しているかは分析装置から得られたMSデータに基づいて予め予測されているものとする。さて、このタンパク質相対定量システムでは、まず、ペプチド断片を予測する際に用いられたMSデータを暫定基準MSデータとして選出する。次いで、選出した暫定基準MSデータのLC保持時間の前後所定の範囲に存在するMSデータの各々につき明確性指標を算出し、該明確性指標のうち最も大きな値を明確性指標の基準値emaxとする。そして、この基準値emaxの算出に用いられたMSデータを基準MSデータとし、該基準MSデータのLC保持時間の前後に存在するMSデータの各々につき明確性指標を算出し、算出した明確性指標と基準値emaxとに基づいてタンパク質の相対定量に用いるMSデータを選出する。こうすることにより、非常に複雑で膨大なMSデータの中からタンパク質の相対定量に用いるMSデータを人手を介することなく適切かつ迅速に得ることができる。また、人手を介する場合にはその人の意思を排除できないため誰が作業をするかによって選出されるMSデータが変わり、それがタンパク質の相対定量の精度低下の一因となっていたが、そのような精度低下を招くこともない。
【0018】
本発明のタンパク質定量システムは、更に、前記タンパク質の相対定量に用いるMSデータの各々につき、同じアミノ酸配列を持つが異なる同位体が導入された二以上のペプチド断片のピーク強度の積分値の比を同位体比として算出し、該同位体比に基づいて前記タンパク質の量比を求める量比算出手段を備えていてもよい。こうすれば、同じアミノ酸配列を持つが異なる同位体が導入された二以上のタンパク質の量比を容易に求めることができる。このとき、量比算出手段は、前記同位体比に基づいて前記タンパク質の相対定量を行うにあたり、前記タンパク質を構成する各ペプチド断片について前記同位体比を算出し該算出した同位体比の平均値を前記タンパク質の量比としてもよい。
【発明を実施するための最良の形態】
【0019】
次に、本発明の実施形態を図面に基づいて説明する。図1は、本発明の一実施形態であるタンパク質相対定量化システム20の概略を表す構成図である。本実施形態のタンパク質相対定量化システム20は、各種処理プログラムを実行するCPU22と、各種処理プログラムを記憶したROM23と、一時的に生じる中間データなどを記憶するRAM24と、入出力データなどを記憶したハードディスクドライブ25と、ユーザからの指令を入力する入力装置26と、結果を表示する表示装置27と、外部機器との情報のやりとりを行う入出力インターフェース(入出力I/F)28と、外部からの外部ネットワークとの情報のやりとりを行う通信制御インターフェイス(通信制御I/F)29とを備えており、バス21を介してそれぞれが接続されている。ROM23には、各種I/Fを制御するためのプログラム等が記憶されている。RAM24には、CPU22が各種処理プログラムを実行する過程で一時的に生じる中間データなどが記憶される。ハードディスクドライブ25には、質量分析測定によって得られたスペクトルデータなどの入力データや後述するメイン処理ルーチンなどの各種処理プログラム、解析結果の出力データなどが記憶される。入力装置26は、マウスやキーボードであり、入出力I/F28を介して、外部からの指令を入力する。表示装置27は、液晶ディスプレイであり、CPU22が各種処理プログラムを実行した結果を表示する。このタンパク質相対定量化システム20には、LC/MS/MS装置10で測定されたMS/MSスペクトルデータが入出力I/F28を介して入力されるほか、インターネット等の通信ネットワーク上に公開されたMS/MSスペクトルデータが通信制御I/F29を介して入力され、ハードディスクドライブ25に記憶される。
【0020】
LC/MS/MS装置10は、LC装置10aと2つの質量分離部が結合したタンデム型のMS/MS装置10bとを連結したものである。このLC/MS/MS装置10では、制限酵素で消化されたペプチド断片をLC装置10aで分離し、分離したペプチド断片のそれぞれについて、MS/MS装置10bでスペクトルを測定する。LC装置10aは、固定層に網目構造のゲル粒子を、移動層に液体を用いる。固定層のゲル粒子は表面から内部に向かって狭くなる多孔質の素材でできているため、多孔質のサイズが問題になるほど巨大な分子の場合、固定相内部まで分散侵入することができない。言い換えると小分子は担体内部にまで拡散できるが、大分子は担体の外部を流れ去るだけである。このように試料のサイズにより見かけの固定相容積が異なるので、巨大分子が先に、小分子が後に流出してくる。タンデム型のMS/MS装置10bは、第一のMS装置の質量分離部をQフィルタ型にし、第二のMS装置の質量分離部にTOF型を配した、Qq−TOFMS/MS装置である。なお、Qフィルタ型のMS装置は、平衡に並べた4本の円柱電極を用いて、その間に直流電流と交流電流とを印加して得られる四重極電場により、イオンを質量分離する方式のMS装置である。四重極にかける電圧を変動させてスキャンすることにより質量分析スペクトルが得られ、電圧を固定させることにより、特定のm/zの値を有するイオンだけを通過、いわゆるマスフィルタさせることができる。一方、TOF型のMS装置は、イオンのm/zの値の違いによって、イオンが一定の長さの真空分析管を通過するのに必要な時間が異なることを利用した、イオンを質量分離する方式のMS装置である。また、以下の説明において第一のMS装置で得られた測定データ(生データ)をMS−1、第二のMS装置で得られた測定データ(生データ)をMS−2という。
【0021】
本実施形態のLC/MS/MS装置10で測定する試料はSILAC法により調製したものを用いることとする。具体的には、炭素原子を人為的に安定同位体で置換したアルギニン(13C614N4−Arg)、炭素原子と窒素原子を人為的に安定同位体で置換アルギニン(13C615N4−Arg)、人為的に安定同位体を導入していないアルギニン(12C614N4−Arg)をそれぞれ含む3種類の培地でそれぞれ細胞を培養する。この細胞はアルギニンを細胞内で合成することができないため、成長過程においてアルギニンを細胞内に取り込むことになる。細胞内で取り込まれたアルギニンは、タンパク質合成に用いられるため、タンパク質を安定同位体で容易に標識することができる。このようにして3種類の培地で培養したそれぞれの細胞に、薬剤をそれぞれ添加し、薬剤添加後0分後に12C614N4−Argを含む培地で培養した細胞からタンパク質を抽出し、薬剤添加後1分後に13C614N4−Argを含む培地で培養した細胞からタンパク質を抽出し、薬剤添加後5分後に13C615N4−Argを含む培地で培養した細胞からタンパク質を抽出する。次に、抽出したそれぞれのタンパク質を混合し、制限酵素を用いて断片化する。こうすることで、薬剤添加後の経過時間が異なる細胞に由来したペプチド断片を得ることができる。これらのペプチド断片は、同一のアミノ酸配列でありながら、安定同位体の有無により質量の異なるものである。このため、こうして得られた試料を測定すると、LC装置によってペプチド断片毎に分離され、そのそれぞれのペプチド断片毎にMS/MSスペクトルを得ることができる。このように、タンパク質を安定同位体で容易に標識すること、混合後に制限酵素を用いて断片化することで制限酵素による断片化率の差異を考慮する必要がないこと、それぞれのペプチド断片比からタンパク質の比率、さらには細胞内におけるタンパク質の発現量の比率を求めることができること、がSILAC法の特徴である。なお、制限酵素とは、例えば、アルギニンやリジンのC末側を特異的に切断するトリプシンのように、タンパク質の特定部位を認識して特異的に切断する酵素のことをいい、タンパク質の発現量とは、細胞内でタンパク質がどれだけ合成されているかを示す値のことをいう。また、以下の説明において、2価イオンにイオン化されたペプチド由来のスペクトルデータを例示して説明するが、ペプチドのイオン化が2価に限定されるものでないことは言うまでもない。
【0022】
ここで、タンパク質相対定量化システム20に入力されるデータについて説明する。タンパク質相対定量化システム20に入力されるデータはLC/MS/MS装置10で測定された生データファイル及び生データから生成されるMascotHTMLファイルの2種類のファイルである。MascotHTMLファイルとは、Matrix Science社の製品であるMascotによって生成される出力ファイルである。また、MascotとはNCBInrやSWISS−PROT等のインターネット上に公開されている配列データベースに含まれるデータより予測したMS/MSスペクトルの測定結果と実測したMS/MSスペクトルデータとを比較し、確率論に基づいて実測したデータのアミノ酸配列を予測し、予測結果やその予測結果の蓋然性指標等を出力するソフトであり、現在タンパク質のMS/MS測定で得られたデータを解析するにあたり、標準的に使用されているソフトである。
【0023】
次に、こうして構成された本実施形態のタンパク質相対定量化システム20の動作の概要について説明する。図2は、CPU22により実行されるメイン処理ルーチンの一例を表すフローチャートである。このメイン処理ルーチンはハードディスクドライブ25に記憶され、ユーザが入力装置26を介してタンパク質相対定量の実行を指令することにより、CPU22によって実行される。
【0024】
メイン処理ルーチンが開始されると、図2に示すように、CPU22はハードディスクドライブ25に記憶されているMascotHTMLファイルを読み込み、MascotHTMLファイルより必要な情報を抽出する(ステップS100)。ここで、MascotHTMLファイルより抽出するデータは、測定を行ったタンパク質及びそのペプチド断片の総数、そのペプチド断片のm/zの値、Mascotがペプチド断片の配列を予測するために使用したスペクトルのデータ番号、Mascotが予測したペプチド断片の配列に関する情報である。なお、測定を行ったタンパク質には1番から順に番号が付されているものとし、測定を行ったペプチド断片にも1番から順に番号が付されているものとする。ここで、ペプチド断片の配列に関する情報について説明する。図3は、MascotHTMLファイルのペプチド断片情報部分からLC保持時間の取得を取得する流れ及びペプチド断片の配列に関する情報の一例を示す説明図である。ペプチド断片の配列に関する情報とは、図3中のPeptideの欄に記載された情報であり、配列情報に加えて、その配列中に安定同位体を含むときには、その旨の情報も記載されている。例えば、図3中のPeptideの欄に記載の「Arginine−13C6(R−13C6)」は炭素原子を安定同位体(13C)に置換したものであることを意味し、「Arginine−13C615N4(R−full)」は、炭素原子と窒素原子をそれぞれ安定同位体(13C及び15N)に置換したものであることを意味している。次に、CPU22は、タンパク質の番号を示す変数mに値1を代入し(ステップS110)、ペプチド断片の番号を示す変数nに値1を代入する(ステップS115)。次に、CPU22はハードディスクドライブ25に記憶されている生データより、m番目のタンパク質のn番目のペプチド断片に対応するスペクトル情報を抽出し、RAM24に記憶する(ステップS120)。
【0025】
次に、CPU22は、基準スペクトルデータ選出処理を行う(ステップS130)。具体的には、後述する基準スペクトルデータ選出処理ルーチンを実行し、最も明確性指標の高いスペクトルデータを基準スペクトルデータとして選出するとともに、該スペクトルデータにおける同位体比R1及び同位体比R2を算出する。ここで、明確性指標とは、後述する明確性指標算出処理ルーチンで算出されるスペクトルデータの明確性を表す指標であり、同位体比R1とは、炭素原子のみを人為的に安定同位体で置換したアミノ酸を含むペプチド断片(以下、同位体ペプチド断片p1)由来のピークの占める強度の積分値が人為的に安定同位体を導入していないアミノ酸を含むペプチド断片(以下、天然体ペプチド断片p0)由来のピークの占める強度の積分値に対する割合であり、同位体比R2とは、炭素原子と窒素原子の両方を人為的に安定同位体で置換したアミノ酸を含むペプチド断片(以下、同位体ペプチド断片p2)由来のピークの占める強度の積分値が天然体ペプチド断片p0由来のピークの占める強度の積分値に対する割合のことである。MSスペクトル測定で得られる波形データは横軸に分子量に準ずる量に相当するm/zを、縦軸に分子数に準ずる量に相当する相対存在量を表したスペクトルとして得られるため、ピークの占める強度の積分値は相対質量を表す。このため、それぞれのペプチド断片p0,p1,p2に由来するピークが占める強度の積分値の割合を算出することで、ペプチド断片p0,p1,p2の相対定量を行うことができる。なお、ピークの占める強度の積分値とはピークに含まれるそれぞれのm/zの値に対応する強度の値の総和である。
【0026】
ここで、基準スペクトルデータ選出処理ルーチンについて詳しく説明する。図4は基準スペクトルデータ選出処理ルーチンの一例を表すフローチャートである。図4に示すように、このルーチンが開始されると、CPU22は、ステップS100で抽出したMascotが今回のペプチド断片の配列を予測するために使用したデータの情報からそのペプチド断片に対応するMS−2のスペクトルデータのLC保持時間とMS−1時のm/zの値を読み取り、生データであるMS−1の中から、読み取ったLC保持時間に最も近いLC保持時間に相当するデータを暫定基準スペクトルデータとして選択し、該暫定基準スペクトルデータのスペクトル番号の値を変数iの値に代入する(ステップS310)。具体的には、図3に示すように、Mascotが今回のペプチド断片の配列を予測するために使用したデータのQueryの項目内に記憶されているScan NumberとFunction Numberを読み取る。例えば、Mascotが今回のペプチド断片の配列を予測するために使用したデータのQueryが「144」であるとすると、これに対応するフロート情報の中にScan NumberとFunction Numberが存在するのでそれを読み取る。ここでは、読み取ったScan Numberを「235」、Function Numberを「2」とする。Function Numberが「2」である場合、該データのScan NumberはMS−2からのデータであることを示すため、生データであるMS−2の中から、Scan Numberが「235」であるデータブロックを検索する。MS−2のデータブロックには、このデータがMS−2であることを表すFunction Number2のほか、Scan Number,Retention Time,Set Massなどが含まれている。そして、検索されたScan Numberが「235」のMS−2のデータブロックからRetention Time「63.171」を読み取り、生データであるMS−1の中から、この値に最も近いRetention Timeを持つデータに最も近いLC保持時間を持つデータを検索する。その結果、Retention Timeが「63.38」のデータが得られたとする。このデータを暫定基準スペクトルデータとして選択し、暫定基準スペクトルデータのスペクトル番号である「2677」を変数iの値に代入する。なお、暫定基準スペクトルデータには、このデータがMS−1であることを表すFunction Number1のほか、Scan Number,Retention Time,Sample Sizeなどが含まれ、更に各ピークのm/zの値とその強度とが対応づけて記述されている。
【0027】
続いて、CPU22は、変数jの値に変数i−3の値を代入し(ステップS315)、スペクトル番号jのスペクトルデータの明確性指標を後述する明確性指標算出処理ルーチンを用いて算出し(ステップS320)、RAM24に記憶する。続いて、CPU22は、変数jの値に値1を加算し(ステップS325)、変数jの値と変数i+3の値とを比較し(ステップS330)、変数jの値が変数i−3の値以下であるときは、ステップS320を実行する。
【0028】
一方、ステップS330で、変数jの値が変数i−3の値より大きいときには、RAM24に合計7つの明確性指標が記憶されているため、CPU22は、これら7つの明確性指標の値を比較し、それらのうち最も大きな値を基準値emaxとしてRAM24に記憶すると共にその値を持つMS−1を基準スペクトルデータとしてRAM24に記憶する(ステップS340)。図5は、MS−1の一例を示す説明図である。例えば、図3に示すMS−1が今回の暫定基準データだったとすると、変数iの値に「2677」が代入され、これを含む前後7つのデータつまりスキャン番号「2674」から「2680」までのデータについて明確性指標を算出し、算出した7つの明確性指標のうち最も大きな値を基準値emaxとすると共にその値を持つMS−1を基準スペクトルデータとすることになる。続いて、CPU22は、後述する明確性指標算出処理ルーチンで算出した、MS/MS測定で検出された天然体ペプチド断片p0、同位体ペプチド断片p1及び同位体ペプチド断片p2のそれぞれのピークの強度の積分値P0,P1,P2から、基準スペクトルとして選択したデータの同位体比R1及び同位体比R2を計算し、RAM24に基準同位体比R1及び基準同位体比R2としてそれぞれ記憶し(ステップS350)、基準スペクトルデータ選出処理ルーチンを終了する。
【0029】
ここで、明確性指標算出処理ルーチンについて詳しく説明する。図6は明確性指標算出処理ルーチンの一例を表すフローチャートである。図6に示すように、このルーチンが開始されると、CPU22は、ステップS100で抽出した、Mascotがペプチド断片の配列に予測するために使用したMS−1時のm/zの値を読み取る(ステップS410)。続いて、CPU22は、ステップS410で読み取ったm/zの値が、同位体ペプチド断片p1由来であるか否かをMascotが予測したペプチド断片の配列情報より判定する(ステップS420)。具体的には、図3中のPeptideの欄に「Arginine−13C6(R−13C6)」の記載があるときに、ステップS410で読み取ったm/zの値が同位体ペプチド断片p1由来であると判定する。続いて、CPU22が、ステップS410で読み取ったm/zの値が同位体ペプチド断片p1によるものであると判定したときは、ステップS410で読み取ったm/zの値を基準として、MS−1より同位体ペプチド断片p1のピークの強度の積分値P1を算出し、RAM24に記憶する(ステップS430)。ここで、同位体ペプチド断片p1のピークの強度の積分値P1とは、ステップS410で読み取ったm/zの値を基準とする一定の範囲(例えば、±0.1)の強度の積分値に、天然に存在する同位体由来のピークの強度の積分値を加算したものである。天然に存在する同位体由来のピークの強度の積分値とは、基準としたm/zの値から+1Da及び+2Daシフトした値を中心に一定の範囲(例えば、±0.1)の強度の積分値を加算したものである。このように天然に存在する同位体由来のピーク強度の積分値を加算することで、最終的に行うタンパク質の相対定量の精度が向上する。なお、本実施例では、2価にイオン化したイオンを例に挙げて説明しているため、1Da分のシフト量は0.5となる。
【0030】
続いて、CPU22は、MS−1より同位体ペプチド断片p2由来のピークの強度の積分値P2を算出し、RAM24に記憶する(ステップS440)。同位体ペプチド断片p2のピークの強度の積分値P2とは、ステップS410で読み取ったm/zの値から+4Da分シフトしたm/zの値を基準とする一定の範囲(例えば、±0.1)の強度の積分値に、天然に存在する同位体由来のピークの強度の積分値を加算した値である。ここで、ピークシフトについて説明する。図7は、MSスペクトルデータのグラフを表す一例である。図7に示すように、同位体ペプチド断片p2(図7中の13C615N4−Arg)由来のピークは、同位体ペプチド断片p1(図7中の13C614N4)由来のピークに比べて+4Da分シフトする。その理由は以下のとおりである。すなわち、同位体ペプチド断片p2は、同位体ペプチド断片p1に比べて、アルギニン中の窒素原子が15Nで置換されている分だけ質量が大きくなる。また、アルギニン中には窒素が4原子含まれる。このため、同位体ペプチド断片p2由来のピークは、同位体ペプチド断片p1由来のピークに比べて、14Nと15Nの質量の差1とアルギニン中に含まれる窒素原子の数4を乗じた値である+4Da分シフトすることになるのである。
【0031】
続いて、CPU22は、MS−1より天然体ペプチド断片p0由来のピークの強度の積分値P0を算出し、RAM24に記憶する(ステップS450)。天然体ペプチド断片p0のピークの強度の積分値P0とは、ステップS410で読み取ったm/zの値から−6Da分シフトしたm/zの値を基準とする一定の範囲(例えば、±0.1)のピークの強度の積分値に、天然に存在する同位体由来のピークの強度の積分値を加算した値である。図7に示すように、天然体ペプチド断片p0(図7中の12C614N4−Arg)由来のピークは、同位体ペプチド断片p1(図7中の13C614N4)由来のピークに比べて−6Da分シフトする。その理由は以下のとおりである。すなわち、天然体ペプチド断片p0は、同位体ペプチド断片p1に比べて、アルギニン中の窒素原子が12Cで置換されている分だけ質量が小さくなる。また、アルギニン中には炭素が6原子含まれる。このため、天然体ペプチド断片p0由来のピークは、同位体ペプチド断片p1由来のピークに比べて、13Cと12Cの質量の差(1)とアルギニン中に含まれる炭素原子の数(6)を乗じた値である−6Da分シフトすることになるのである。
【0032】
続いて、CPU22は、ステップS430、ステップS440、ステップS450で算出したそれぞれのピーク強度の積分値P0,P1,P2の和ΣPを算出し、RAM24に記憶する(ステップS460)。続いて、CPU22は、ステップS460で算出した和ΣPをステップS410で読み取ったm/zの値から一定の領域(例えば、読み取ったm/zの値の±5の領域)の全範囲の強度の積分値Ltotalで除算して比Lrate(=ΣP/Ltotal)を算出し、これを明確性指標としてハードディスクドライブ25に記憶し(ステップS470)、このルーチンを終了する。
【0033】
一方、ステップS420で、ステップS410で読み取ったm/zの値が同位体ペプチド断片p1によるものでないと判定したときには、CPU22は、ステップS410で読み取ったm/zの値が、同位体ペプチド断片p2に由来するものであるか否かをMascotが予測したペプチド断片の配列情報より判定する(ステップS425)。具体的には、図3中のPeptideの欄に「Arginine−13C615N4(R−full)」の記載があるときに、ステップS410で読み取ったm/zの値が同位体ペプチド断片p1由来であると判定する。続いて、ステップS425で、ステップS410で読み取ったm/zの値が同位体ペプチド断片p2によるものであると判定したときは、CPU22は、ステップS410で読み取ったm/zの値を基準として、MS−1よりペプチド断片2由来のピークの強度の積分値P2を計算し、RAM24に記憶する(ステップS435)。ここで、同位体ペプチド断片p2のピークの強度の積分値P2とは、ステップS410で読み取ったm/zを基準とする一定の範囲(例えば、±0.1)のピークの強度の積分値に、天然に存在する同位体由来のピークの強度の積分値を加算したものである。続いて、CPU22は、MS−1より同位体ペプチド断片p1由来のピークの強度の積分値P1を算出し、RAM24に記憶する(ステップS445)。ここで、同位体ペプチド断片p2から同位体ペプチド断片p1までのm/zの値の差は、図7に示すように、−4Daであるため、同位体ペプチド断片p1のピークの強度の積分値P1は、ステップS410で読み取ったm/zの値から−4Da分シフトしたm/zの値を求め、その値を基準とする一定の範囲(例えば、±0.1)のピークの強度の積分値に、天然に存在する同位体由来のピークの強度の積分値を加算した値となる。続いて、CPU22は、MS−1より天然体ペプチド断片p0由来のピークの強度の積分値P0を算出し、RAM24に記憶する(ステップS455)。ここで、同位体ペプチド断片p2から天然体ペプチド断片p0までのm/zの差は、図7に示すように、−10Daであるため、天然体ペプチド断片p0由来のピークの強度の積分値P0は、基準m/zから−10Da分シフトしたm/zを基準とする一定の範囲(例えば、±0.1)のピークの強度の積分値に、天然に存在する同位体由来のピークの強度の積分値を加算した値となる。続いて、CPU22は、ステップS435、ステップS445、ステップS455で算出したそれぞれのピークの強度の積分値P0,P1,P2の和ΣPを算出し、RAM24に記憶する(ステップS465)。続いて、前述したステップS470を実行し、このルーチンを終了する。
【0034】
一方、ステップS425で、ステップS410で読み取ったm/zが同位体ペプチド断片p2によるものでないと判定したときは、何ら処理を行うことなく明確性指標算出処理ルーチンを終了する。このように、明確性指標はピーク部分の占める強度の積分値の割合を表しているため、この値が大きいほどピーク部分の占める強度の積分値の割合が大きいと言える。言い換えると、明確性指標の高いLC保持時間のスペクトルデータはノイズ部分の割合が少ないスペクトルデータである。
【0035】
さて、図2に戻り、ステップS130で基準スペクトルデータ選出処理を行ったあと、CPU22は平均同位体比算出処理を行い(ステップS140)、該スペクトルデータの同位体比R1及び同位体比R2のそれぞれの平均値を算出する(ステップS140)。この同位体比の平均値は、各ペプチド断片における平均同位体比に相当する。ここで、平均同位体比算出処理ルーチンについて詳しく説明する。図8は平均同位体比算出処理ルーチンの一例を表すフローチャートである。図8に示すように、CPU22は、基準スペクトルデータ選出処理ルーチンで選出した基準スペクトルのデータ番号、基準値emax、基準同位体比R1、基準同位体比R2をそれぞれRAM24より読み取り、基準スペクトルのデータ番号を変数kの値に代入する(ステップS510)。続いて、CPU22は、変数kの値から値1を減算し(ステップS515)、MS−1より基準スペクトルのデータ番号の値がkであるスペクトルデータを選択し、前述した明確性指標算出処理ルーチンにより、明確性指標を算出し、RAM24に記憶する(ステップS520)。続いて、CPU22は、基準値emaxに予め定められた1未満の係数(例えば、0.8)を乗じた値を閾値に設定し、ステップS520で算出した明確性指標とこの閾値とを比較し(ステップS530)、算出した明確性指標が閾値以上であるとき、同位体比R1及び同位体比R2のそれぞれの値を算出してRAM24に記憶し(ステップS540)、変数kの値から値1を減算し(ステップS545)、ステップS520に戻る。
【0036】
一方、ステップS530で、ステップS520で算出した明確性指標の値が前出の閾値未満であるときには、CPU22は、変数kの値にMS−1より読み取った基準スペクトルデータの番号を代入する(ステップS550)。続いて、CPU22は、変数kの値に値1を加算し(ステップS555)、MS−1より基準スペクトルのデータ番号の値がkであるスペクトルデータを選択し、前述した明確性指標算出処理ルーチンにより、明確性指標を算出し、RAM24に記憶する(ステップS560)。続いて、CPU22は、ステップS560で算出した明確性指標と前出の閾値とを比較し(ステップS570)、算出した明確性指標の値が閾値以上であるとき、同位体比R1及び同位体比R2のそれぞれの値を算出してRAM24に記憶し(ステップS580)、変数kの値に値1を加算し(ステップS585)、ステップS560に戻る。
【0037】
ステップS570で、ステップS560で算出した明確性指標の値が前出の閾値未満であるときには、CPU22は、ステップS540及びステップS580で算出した同位体比R1及び同位体比R2の値のそれぞれの平均値を算出し、それぞれの値を平均同位体比AR1、平均同位体比AR2としてハードディスクドライブ25に記憶し(ステップS590)、平均同位体比算出処理ルーチンを終了する。なお、平均同位体比AR1,AR2は後述するようにタンパク質の相対定量に用いられることから、MS−1のスペクトルデータのうち明確性指標が閾値以上のものはタンパク質の相対定量に用いられるスペクトルデータといえる。図9は図5と同様のMS−1の一例を表す説明図である。例えば、図9に示すように、最も大きな明確性指標の値を持つMS−1のスペクトルデータのスキャン番号が「2678」だったとすると、MS−1のうちスキャン番号が「2678」よりも小さいものにつき順次明確性指標を算出し、その明確性指標が閾値以上のものをタンパク質の相対定量に用いるスペクトルデータとして選出する。また、スキャン番号が「2678」よりも大きいものについても順次明確性指標を算出し、その明確性指標が閾値以上のものをタンパク質の相対定量に用いるスペクトルデータとして選出する。
【0038】
さて、図2に戻り、ステップS140で平均同位体算出処理を行ったあと、CPU22は、変数nの値に値1を加算し(ステップS150)、n番目のペプチド断片のデータがMascotHTMLファイルに存在するか否かを判定する(ステップS160)。ステップS160で、n番目のペプチド断片のデータがあるときには、n番目のペプチド断片のデータに対して、ステップS120〜S150の処理を行う。一方、ステップS160で、n番目のペプチド断片のデータがないときには、CPU22は、ステップS140で算出した各ペプチド断片毎の平均同位体比AR1,AR2の平均値AVAR1,AVAR2及び平均同位体比AR1,AR2の標準偏差値σAR1,σAR2を算出し、ハードディスクドライブ25に記憶する(ステップS170)。
【0039】
次に、CPU22は、変数mの値に値1を加算し(ステップS180)、m番目のタンパク質のデータがMascotHTMLファイルに存在するか否かを判定する(ステップS190)。ステップS180で、m番目のタンパク質のデータがあるときには、m番目のタンパク質のデータに対して、ステップS115〜S180の処理を行う。一方、ステップS180で、m番目のタンパク質のデータがないときには、ステップ170で算出した各タンパク質の平均質量比AVAR1,AVAR2及び標準偏差値σAR1,σAR2をハードディスクドライブ25に記憶し、表示装置27に表示する(ステップS200)。これにより、データに含まれる全てのタンパク質のそれぞれについて、安定同位体を人為的に導入したタンパク質の割合及び標準偏差を自動で算出することができる。
【0040】
本実施形態では、前述のとおり、3種類の細胞に薬剤をそれぞれ添加し、0分、1分、5分後のそれぞれの時間経過後の細胞から抽出したタンパク質由来のペプチド断片を用いて、LC/MS/MSを行っている。このため、メイン処理ルーチンを実行することにより、0分、1分、5分後のそれぞれの時間におけるタンパク質の割合を算出することができる。つまり、薬剤の添加により細胞内のタンパク質の発現量が経時的にどのような割合に変化しているかを算出することができるため、薬剤のタンパク質に対する作用効果を知ることができる。
【0041】
ここで、本実施形態の構成要素と本発明の構成要素との対応関係について説明する。本実施形態のステップS310が本発明のステップ(a)及び本発明の暫定基準データ選出手段の処理に相当し、ステップS315〜S340がステップ(b)及び基準値算出手段の処理に相当し、ステップS510〜S590がステップ(c)及び相対定量用データ選出手段の処理に相当し、ステップS170がステップ(d)及び量比算出手段の処理に相当する。
【0042】
以上詳述した本実施形態のタンパク質相対定量化システム20によれば、非常に複雑で膨大なMSデータの中からタンパク質の相対定量を行うに適したMSデータを人手を介することなく適切かつ迅速に得ることができる。また、人手を介する場合にはその人の意思を排除できないため誰が作業をするかによって選出されるMSデータが変わり、それがタンパク質の相対定量の精度低下の一因となっていたが、そのような精度低下を招くこともない。
【0043】
また、暫定基準MSデータのLC保持時間の前後所定の範囲に存在するMSデータを、LC保持時間の長さ順に並べたMSデータのうち暫定基準MSデータのLC保持時間を中心として前後7つのMSデータとしているため、明確性指標の基準値emaxを算出するためのMSデータを容易に選出することができる。
【0044】
更に、同じアミノ酸配列のペプチド断片であって異なる同位体が導入されたもののピークの強度の積分値を求めるにあたり、天然同位体の存在も考慮して該ピークの強度の積分値を求めているため、天然同位体の存在を考慮しない場合に比べて明確性指標の値の信頼性が高くなり、ひいてはタンパク質の相対定量の精度を高くすることができる。
【0045】
更にまた、算出した明確性指標と基準値emaxとに基づいてタンパク質の相対定量に用いるMSデータを選出するにあたり、算出した明確性指標が基準値emaxに予め定められた値0.8を乗じた値を閾値とし該閾値以上のときに該明確性指標の算出に用いたMSデータを前記タンパク質の相対定量に用いるMSデータとして選出しているため、タンパク質の相対定量を行うに相応しいMSデータを容易に選出することができる。
【0046】
そしてまた、タンパク質の相対定量に用いるMSデータの各々につき、同じアミノ酸配列を持つが異なる同位体が導入された二以上のペプチド断片のピークの強度の積分値の比を同位体比として算出し、該同位体比に基づいてタンパク質の量比を求めているため、同じアミノ酸配列を持つが異なる同位体が導入された二以上のタンパク質の量比を容易に求めることができる。また、同位体比に基づいてタンパク質の相対定量を行うにあたり、タンパク質を構成する各ペプチド断片について同位体比を算出し該算出した同位体比の平均値を前記タンパク質の量比としているため、ペプチド断片毎の誤差による精度低下を防ぐことができる。
【0047】
なお、本発明は上述した実施形態に何ら限定されることはなく、本発明の技術的範囲に属する限り、種々の様態で実施し得ることは言うまでもない。
【0048】
例えば、上述した実施形態では、3種類の細胞由来のタンパク質の相対定量を行うものとしたが、あらかじめこれらのタンパク質のうちの1種類のタンパク質を他の方法で定量して標準サンプルとし、その標準サンプルに基づいて他のタンパク質の定量を行うものであってもよい。こうすれば、相対定量だけでなくタンパク質の絶対定量を行うことができる。
【0049】
上述した実施形態の平均同意体比算出処理ルーチンにおいて、ステップS530のあとに該ステップS530で繰り返し肯定判定された回数が一定回数(例えば10回)以下であるか否かを判定し、一定回数以下のときにはステップS540以降の処理を実行し、一定回数を超えたときにはステップS550へ進むようにし、また、ステップS570のあとに該ステップS570で繰り返し肯定判定された回数が一定回数(例えば10回)以下であるか否かを判定し、一定回数以下のときにはステップS580以降の処理を実行し、一定回数を超えたときにはステップS590へ進むようにしてもよい。こうすれば、不必要に多くのMSデータを対象として明確性指標を算出することがなくなるため、処理時間を短くできる。ここで、一定の回数とは、例えばある範囲を超えたMSデータの明確性指標については基準値emaxとの関係からしてタンパク質の相対定量に用いるMSデータとして選出する必要性がほとんどゼロであるということが経験的に判明している場合には、その範囲を所定の範囲として設定すればよい。
【0050】
上述した実施形態の明確性指標算出処理ルーチンにおいて、天然に存在する同位体由来のピークの強度の積分値を算出するときに、天然に存在する同位体由来のピークを基準となるピークのm/zから+1Da及び+2Daシフトした位置であるとし、該当するm/zの値から一定の範囲(例えば、±0.1)の強度の積分値を算出することとしたが、それぞれのm/zから+1Da及び+2Daの値付近の強度を探索し、最も強度の高い位置から一定の範囲(例えば、±0.1)の強度の積分値を算出することとしてもよい。こうすれば、ピークのずれを補正することができ、より精度よく解析することができる。
【0051】
上述した実施形態の明確性指標算出処理ルーチンにおいて、天然に存在する同位体由来のピークの強度の積分値を算出するときに、天然に存在する同位体由来のピークを+1Da及び+2Daシフトした2種類のみを選択し、それぞれの強度の積分値を加算することとしたが、3種類以上の天然に存在する同位体由来のピークを選択し、それぞれの強度の積分値を加算することにしてもよい。こうすれば、3種類以上の同位体が天然に存在する場合であっても、より精度よく解析することができる。
【0052】
上述した実施形態では、タンパク質の相対比を計算するときにおいて、複数のペプチドから求めた量比の平均値を用いているが、中央値などのロバスト推定法やペプチドのスコアによる加重平均値を用いてもよい。こうすれば、より精度よく解析することができる。
【0053】
上述した実施形態では、LC/MS/MS装置10で測定したデータを直接タンパク質相対定量化システム20に入力し、結果を表示装置27に表示することにしたが、通信制御I/F29を介して、インターネット等のネットワークから入力し、通信制御I/F29を介して、インターネット等のネットワークで接続された先に出力してもよい。こうすれば、タンパク質相対定量化システム20をインターネット等のネットワークを介して場所を選ぶことなく使用することができる。また、持ち運び可能な記憶媒体(CD−ROMやFDなどのリムーバルディスク)を介して入力してもよい。こうすれば、他者が公開したデータや過去のデータなどについても解析することができる。
【0054】
上述した実施形態では、入力するデータはSILAC法を用いて調製した3種類の細胞由来の試料を用いて測定したLC/MS/MSスペクトルデータとしたが、由来となる細胞は3種類に限定されるものではない。2種類の細胞由来の試料を用いてもよいし、4種類以上の細胞由来の試料を用いてもよい。
【0055】
上述した実施形態では、入力するデータはSILAC法を用いて調製した3種類の細胞由来の試料を用いて測定したLC/MS/MSスペクトルデータとしたが、SILAC法に限定されるものではなく、同一のアミノ酸配列を有し質量数の異なるタンパク質を含む試料を用いて測定したLC/MS/MSスペクトルデータであればよい。例えば、化学修飾等を施したタンパク質を含む試料を測定したLC/MS/MSスペクトルデータであってもよい。こうすれば、安定同位体を導入することができない細胞におけるタンパク質の発現量変化を観察することができる。
【図面の簡単な説明】
【0056】
【図1】タンパク質相対定量化システム20の構成の概略を示す構成図。
【図2】メイン処理ルーチンの一例を示すフローチャート。
【図3】MascotHTMLファイルからの情報抽出の一例を示す説明図。
【図4】基準スペクトルデータ選出処理ルーチンの一例を示すフローチャート。
【図5】MS−1の一例を示す説明図。
【図6】明確性指標算出処理ルーチンの一例を示すフローチャート。
【図7】MSスペクトルデータの一例を表すグラフ。
【図8】平均同位体比算出処理ルーチンの一例を示すフローチャート。
【図9】MS−1の一例を示す説明図。
【符号の説明】
【0057】
10 LC/MS/MS装置、10a LC装置、10b MS/MS装置、20 タンパク質相対定量化システム、21 バス、22 CPU、23 ROM、24 RAM、25 ハードディスクドライブ、26 入力装置、27 表示装置、28 入出力I/F、29 通信制御I/F。

【特許請求の範囲】
【請求項1】
同じアミノ酸配列を持つが異なる同位体が導入された二以上のタンパク質から得られるペプチド断片の混合物を液体クロマトグラフィ(LC)装置とマススペクトル(MS)装置とを含む分析装置に供することにより得られたMSデータに基づく前記タンパク質の相対定量を、コンピュータソフトウェアを用いて行うタンパク質相対定量方法であって、
(a)前記ペプチド断片を決定する際に用いられたMSデータを暫定基準MSデータとして選出するステップと、
(b)前記暫定基準MSデータのLC保持時間の前後所定の範囲に存在するMSデータの各々につき、所定のm/z領域の全範囲の強度の積分値Ltotalを求めると共に同じアミノ酸配列のペプチド断片であって異なる同位体が導入されたもののピーク強度の積分値の合計ΣPを求め、両者の比Lrate(=ΣP/Ltotal)を明確性指標として算出し、該明確性指標のうち最も大きな値を明確性指標の基準値emaxとするステップと、
(c)前記基準値emaxの算出に用いられたMSデータを基準MSデータとし、該基準MSデータのLC保持時間の前後に存在するMSデータの各々につき前記明確性指標を算出し、算出した明確性指標と基準値emaxとに基づいて前記タンパク質の相対定量に用いるMSデータを選出するステップと
を含むタンパク質相対定量方法。
【請求項2】
前記ステップ(b)では、前記暫定基準MSデータのLC保持時間の前後所定の範囲に存在するMSデータを、LC保持時間の長さ順に並べた前記MSデータのうち前記暫定基準MSデータのLC保持時間を中心とした前後所定数のMSデータとする、
請求項1に記載のタンパク質相対定量方法。
【請求項3】
前記ステップ(b)では、前記同じアミノ酸配列のペプチド断片であって異なる同位体が導入されたもののピーク強度の積分値を求めるにあたり、天然同位体の存在も考慮して該ピーク強度の積分値を求める、
請求項1又は2に記載のタンパク質相対定量方法。
【請求項4】
前記ステップ(c)では、前記算出した明確性指標と基準値emaxとに基づいて前記タンパク質の相対定量に用いるMSデータを選出するにあたり、前記算出した明確性指標が基準値emaxに予め定められた1未満の係数を乗じた値を閾値とし該閾値を超えるか又は該閾値以上のときに該明確性指標の算出に用いたMSデータを前記タンパク質の相対定量に用いるMSデータとして選出する、
請求項1〜3のいずれかに記載のタンパク質相対定量方法。
【請求項5】
前記ステップ(c)では、前記タンパク質の相対定量に用いるMSデータを選出するにあたり、前記基準MSデータのLC保持時間の前後所定の範囲に存在するMSデータを超えて選出しない、
請求項1〜4のいずれかに記載のタンパク質相対定量方法。
【請求項6】
請求項1〜5のいずれかに記載のタンパク質相対定量方法であって、
(d)前記ステップ(c)で選出した前記タンパク質の相対定量に用いるMSデータの各々につき、同じアミノ酸配列を持つが異なる同位体が導入された二以上のペプチド断片のピーク強度の積分値の比を同位体比として算出し、該同位体比に基づいて前記タンパク質の量比を求めるステップ
を含むタンパク質相対定量方法。
【請求項7】
前記ステップ(d)では、前記同位体比に基づいて前記タンパク質の相対定量を行うにあたり、前記タンパク質を構成する各ペプチド断片について前記同位体比を算出し該算出した同位体比に統計的な処理を施した値を前記タンパク質の量比とする、
請求項6に記載のタンパク質相対定量方法。
【請求項8】
前記分析装置は、LC装置と該LC装置で分離された成分が供されるタンデム型のMS/MS装置とで構成されるLC/MS/MS装置であり、前記MSデータは、前記タンデム型のMS/MS装置の一つ目の質量分析計で得られるMSデータである、
請求項1〜7のいずれかに記載のタンパク質相対定量方法。
【請求項9】
請求項1〜8のいずれかに記載のタンパク質相対定量方法を1又は複数のコンピュータに実行させるためのプログラム。
【請求項10】
同じアミノ酸配列を持つが異なる同位体が導入された二以上のタンパク質から得られるペプチド断片の混合物を液体クロマトグラフィ(LC)装置とマススペクトル(MS)装置とを含む分析装置に供することにより得られたMSデータに基づく前記タンパク質の相対定量を行うタンパク質相対定量システムであって、
前記ペプチド断片を決定する際に用いられたMSデータを暫定基準MSデータとして選出する暫定基準データ選出手段と、
前記暫定基準MSデータのLC保持時間の前後所定の範囲に存在するMSデータの各々につき、所定のm/z領域の全範囲の強度の積分値Ltotalを求めると共に同じアミノ酸配列のペプチド断片であって異なる同位体が導入されたもののピークの強度の積分値の合計ΣPを求め、両者の比Lrate(=ΣP/Ltotal)を明確性指標として算出し、該明確性指標のうち最も大きな値を明確性指標の基準値emaxとする基準値算出手段と、
前記基準値emaxの算出に用いられたMSデータを基準MSデータとし、該基準MSデータのLC保持時間の前後に存在するMSデータの各々につき、前記明確性指標を算出し、算出した明確性指標と基準値emaxとに基づいて前記タンパク質の相対定量に用いるMSデータを選出する相対定量用データ選出手段と、
を備えたタンパク質相対定量システム。
【請求項11】
請求項10に記載のタンパク質定量システムであって、
前記タンパク質の相対定量に用いるMSデータの各々につき、同じアミノ酸配列を持つが異なる同位体が導入された二以上のペプチド断片のピークの強度の積分値の比を同位体比として算出し、該同位体比に基づいて前記タンパク質の量比を求める量比算出手段
を備えたタンパク質相対定量システム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate


【公開番号】特開2008−107305(P2008−107305A)
【公開日】平成20年5月8日(2008.5.8)
【国際特許分類】
【出願番号】特願2006−292930(P2006−292930)
【出願日】平成18年10月27日(2006.10.27)
【出願人】(504137912)国立大学法人 東京大学 (1,942)
【Fターム(参考)】