質量分析法による指数関数的に変換されたタンパク質発現量指標に基づくタンパク質含有量の絶対定量
本発明者は、ナノLC−MSMSデータを用いてタンパク質混合物溶液中のタンパク質含有量を決定するべくタンパク質発現指標(PAI,π)を確立した。消化されたペプチドはナノLCMS/MSによって分析され、得られた結果はタンデム質量スペクトルに基づいてマスコット(Mascot)タンパク質同定アルゴリズムに適用された。PAIは、1タンパク質あたりの検出されうるペプチドの数で検出されたペプチドの数を除したものとして定義づけされる。異なる濃度の血清アルブミンからのPAIは、タンパク質濃度の対数に対する線形関係を示した。これは、単一回のナノLC−MS/MSにより分析されたマウス全細胞溶解物中の47のタンパク質についても有効であった。一方で、マスコットタンパク質スコア並びにタンパク質あたりの同定されたペプチド数は、タンパク質発現量に対する相関関係が悪かった。絶対定量のためには、PAIは、タンパク質混合物中のタンパク質含有量に比例する指数関数的に修正されたPAI(EMPAI,mπ)に転換された。全溶解物中の47のタンパク質について、実際値に対するEMPAIベースの濃度の偏差百分率は平均63%以内であった。EMPAIは包括的タンパク質発現分析にうまく適用され、HCT116ヒトガン細胞における遺伝子とタンパク質発現との間の比較研究を実施した。本発明は、タンパク質発現量指標に基づいてタンパク質含有量を定量するための方法及びコンピュータプログラムを提供する。
【発明の詳細な説明】
【技術分野】
【0001】
技術分野
本発明は、一般的には、質量分析法を用いたタンパク質含有量の解析に関し、より具体的には、プロテオミクスにおいて質量分析法によるタンパク質発現指標に基づいてタンパク質含有量の定量を行うための方法及びコンピュータプログラムに関する。
【背景技術】
【0002】
背景技術
今日ゲノム注釈付きデータベースと組合わされているプロテオーム液体クロマトグラフィ質量分析法(以下、「LC−MS」という。)アプローチは、1つのタンパク質混合物溶液から何千ものタンパク質を同定できるようにする[文献1]。これらのアプローチは、安定した同位元素標識を用いた相対的定量に対しても同様に適用されてきた[文献2−4]。近年になって、2つの状態の間の包括的な定量研究のみならず[文献5、6]、タンパク質−タンパク質間[文献7、8]、タンパク質−ペプチド間[文献9]及びタンパク質−薬物間[文献10]の相互作用分析も広範に報告されてきている。しかしながら、これまでのところ、1つの試料溶液中のタンパク質濃度についての包括的なアプローチは、なおも確立されていなかった。細胞タンパク質の反応速度論/力学論は特定の領域内でのタンパク質の濃度の変化として記述されることから、タンパク質濃度は定量プロテオミクスにおいて最も基本的かつ重要なパラメータの1つである。さらに、濃度差が大き過ぎて同位体に基づく相対的定量を実施できない場合でも、2つの試料間の相対的定量のためにも試料中のタンパク質濃度を使用することができる。これまで同位体標識された合成ペプチドは、問題の特定のタンパク質の絶対定量のための内部標準として使用されてきた[文献11、12]。このアプローチは、包括的な解析に適用可能であるが、同位体標識されたペプチドのコスト及びゲル内でタンパク質の定量的消化を行なうことの困難さが問題となっている[文献13]。
【0003】
ナノLC−MS/MSの単一回の解析でさえ、データベース探索の助けを得ると、容易に長い同定されたタンパク質リストを生成し、同定におけるヒットランキング、確率評点、タンパク質あたりの同定済みペプチド数及び同定済みペプチドのイオン計数といったような付加的な情報が、生データを用いてこのリストから抽出される。定性的には、ヒットランク、評定及びタンパク質あたりのペプチド数[文献14]といったような一部のパラメータが、解析対象の試料中のタンパク質発現量についての一種の指標となる。なかでも、ペプチドのイオン計数が、発現量を描写するための最も直接的なパラメータと思われ、異なる状態でのタンパク質発現のために使用された[文献15]。しかしながら、検出器としての質量分析計は、制限された線形性及びバックグラウンドでのイオン化抑制効果に関して吸光度検出器ほど汎用性あるものではない[文献16]。従って、信頼性ある定量的情報を得るためには、これらのパラメータを正規化する必要がある。この戦略に沿った第1のアプローチは、本発明者らが知るかぎり、タンパク質発現量指標(以下「PAI」と呼ばれる)と命名され、ヒトスプライセオソーム複合体分析に適用された[文献17]。相対的定量のためにはLC/LC−MS/MS分析におけるスペクトル計数及びペプチド数が使用されるという類似の概念が近年報告された[文献18]。同様に、本発明者は、各タンパク質の平均イオン計数を算出するために少なくとも3つのペプチドが使用される正規化されたイオン計数ベースのアプローチも同様に開発した[文献19]。このアプローチは、ペプチド相関関係プロファイリングにおける相対的定量のためにも使用されてきた[文献20]。
【発明の開示】
【発明が解決しようとする課題】
【0004】
発明の開示
しかしながら、このアプローチの適用可能性は、それが正確さを保つために3つのペプチドを必要とすることを理由として、制限されていた。ここでは、本発明者はナノLC−MS/MS実験からタンパク質発現量を判定するためにPAI戦略を検討している。
【0005】
本発明の目的は、生体材料の試料中で指数関数的に修正されたPAI(以下、「EMPAI」という。)に基づいてタンパク質含有量の定量を行うための方法を提供することにある。
【0006】
本発明の一の実施形態においては、例えばコンピュータによって読取り可能でありかつ生体材料の試料中の上述のEMPAIに基づいてタンパク質含有量の定量を行うためのコンピュータプログラムを記憶するコンピュータ読取り可能媒体といったようなコンピュータプログラム製品も提供されている。
【0007】
本発明の別の実施形態においては、生体材料の試料中の上述のEMPAIに基づいてタンパク質含有量の定量を行うためのコンピュータプログラムも提供されている。
【0008】
また、本発明のさらなる実施形態においては、生体材料の試料中の上述のEMPAIに基づいてタンパク質含有量の定量を行うための解析用装置も提供されている。
【課題を解決するための手段】
【0009】
上述の目的を達成するため、本発明は、生体材料の試料中のタンパク質含有量の定量を行うための方法であって、(a)質量分析法により定量化すべきタンパク質を同定するステップと;(b)前記タンパク質あたりの検出されたペプチドの数(Nobsd)を測定するステップと;(c)タンパク質あたりの検出されうるペプチドの数(Nobsbl)を算出するステップと;(d)EMPAIを得るために、EMPAI=10Nobsd/Nobsbl−1
という式により計算するステップと、を含む方法を提供する。
【0010】
本発明に係る方法の1つの好ましい態様においては、該方法は、
【数1】
により、EMPAIの値に基づいてタンパク質含有量(モル%)を算出するステップをさらに含み、ここで、Σ(EMPAI)は、全ての同定されたタンパク質のEMPAI値の総和を表す。
【0011】
本発明に係る方法のもう1つの好ましい態様においては、該方法は、
【数2】
により、EMPAIの値に基づいてタンパク質含有量(重量%)を算出するステップをさらに含み、ここで、Σ(EMPAI)は、全ての同定されたタンパク質についてのEMPAI値の総和であり、MWは、同定された各タンパク質の分子量を表わす。
【0012】
本発明に係る方法のさらなる好ましい態様においては、質量分析法は、液体クロマトグラフィ質量分析法を含む。
【0013】
また、本発明は、生体材料の試料中のタンパク質含有量の定量を行うためのコンピュータプログラム製品であって、(a)質量分析法により定量化すべきタンパク質を同定するステップと;(b)前記タンパク質あたりの検出されたペプチドの数(Nobsd)を測定するステップと;(c)タンパク質あたりの検出されうるペプチドの数(Nobsbl)を算出するステップと;(d) EMPAIを得るために、EMPAI=10Nobsd/Nobsbl−1
という式により計算するステップと、を実行するため、記録媒体上に保存されたコンピュータプログラムを有するコンピュータ読取り可能な記憶媒体を含む、コンピュータプログラム製品を提供する。
【0014】
本発明に係るコンピュータプログラム製品の1つの好ましい態様においては、該プログラムは、
【数3】
により、EMPAIの値に基づいてタンパク質含有量(モル%)を算出するステップをさらに含み、ここで、Σ(EMPAI)は、全ての同定されたタンパク質についてのEMPAI値の総和である。
【0015】
本発明に係るコンピュータプログラム製品のもう1つの好ましい態様においては、該プログラムは、
【数4】
により、EMPAIの値に基づいてタンパク質含有量(重量%)を算出するステップをさらに含み、ここで、Σ(EMPAI)は、全ての同定されたタンパク質についてのEMPAI値の前記総和であり、MWは、同定された各タンパク質の分子量を表わす。
【0016】
本発明に係るコンピュータプログラム製品のさらなる態様においては、製品は、コンピュータにより読取ることのできるコンピュータ読取り可能記録媒体である。
【0017】
さらに、本発明は、生体材料の試料中のタンパク質含有量の定量を行うコンピュータプログラムであって、(a)質量分析法により定量化すべきタンパク質を同定するステップと;(b)前記タンパク質あたりの検出されたペプチドの数(Nobsd)を測定するステップと;(c)タンパク質あたりの検出されうるペプチドの数(Nobsbl)を算出するステップと;(d)EMPAIを得るために、EMPAI=10Nobsd/Nobsbl−1
という式により計算するステップ、を実施するステップを含むプログラムを提供する。
【0018】
本発明に係るコンピュータプログラムの態様においては、該プログラムは、
【数5】
により、EMPAIの値に基づいてタンパク質含有量(モル%)を算出するステップをさらに含み、ここで、Σ(EMPAI)は、全ての同定されたタンパク質についてのEMPAI値の総和である。
【0019】
本発明に係るコンピュータプログラムのもう1つの態様では、該プログラムは、
【数6】
により、EMPAIの値に基づいてタンパク質含有量(重量%)を算出するステップをさらに含み、ここで、Σ(EMPAI)は、全ての同定されたタンパク質についてのEMPAI値の総和であり、MWは、同定された各タンパク質の分子量を表わす。
【0020】
本発明に係るコンピュータプログラムは、このプログラムが本発明によるタンパク質含有量の定量化方法のそれぞれのステップをコンピュータによって実施させることを特徴としている。また、該コンピュータプログラムは、該プログラムが記憶される記憶媒体の形でも提供され得、かつ、インターネットといったような伝送媒体を介して供給され得る。
【0021】
さらに、本発明は、生体材料の試料中のタンパク質含有量の定量を行うための解析用装置であって、質量分析法により得られたタンパク質の質量分析データに関する情報を受信し、質量分析法により定量化すべきタンパク質を同定するための同定手段と;前記タンパク質あたりの検出されたペプチドの数(Nobsd)を測定するための測定手段と;タンパク質あたりの検出されうるペプチドの数(Nobsbl)を算出するための算出手段と;EMPAIを得るために、EMPAI=10Nobsd/Nobsbl−1という式により計算するための計算手段と、を備える解析用装置を提供する。
【0022】
本発明に係る解析用装置の一の態様においては、該計算手段は、
【数7】
により、EMPAIの値に基づいてタンパク質含有量(モル%)を算出するステップをさらに含み、ここで、Σ(EMPAI)は、全ての同定されたタンパク質についてのEMPAI値の総和である。
【0023】
本発明に係る解析用装置の一の態様においては、該計算手段は、
【数8】
によりEMPAIの値に基づいてタンパク質含有量(重量%)を算出するステップをさらに含み、ここで、Σ(EMPAI)は、全ての同定されたタンパク質についてのEMPAI値の総和であり、MWは、同定された各タンパク質の分子量を表わす。
【0024】
本発明に係る解析用装置のさらなる態様においては、質量分析法は、液体クロマトグラフィ質量分析法を含んでいる。
【0025】
本発明の1つの利点は、絶対的タンパク質発現量のための尺度、すなわち指数関数的に修正されたタンパク質発現指標が確立され、これがプロテオミクスにおけるタンパク質含有量の絶対定量のために使用できるという点にある。
【0026】
本発明の上述の目的及び特徴は、添付図面を参考にして好ましい実施形態についての以下の記述からより明らかになることであろう。
【発明を実施するための最良の形態】
【0027】
本発明は、タンパク質含有量の定量を行うための方法及び該方法を実施するためのコンピュータプログラムを含めた実施例を用いて詳細に説明される。
【0028】
図1は、本発明のLC−MSによる上述のEMPAIに基づいたタンパク質含有量の定量を実施するコンピュータのためのハードウェア構造の図面を示す。本発明によるEMPAIに基づくタンパク質含有量の定量を行うための解析用装置10は、全てCPU12とバス24を介して相互接続されている、中央処理ユニット12(以下「CPU」と略される)、メモリー14、表示デバイス16、ユーザーインターフェース18及び通信インターフェース22を備える。装置10は、外部記憶媒体駆動ユニット20に接続されたCD−ROM又は磁気媒体といったような外部記憶装置(図1には例示せず)をさらに備える。装置10は、通信インターフェース22を通してNCBInr(hhtp://www.ncbi.nlm.nh.gov/)などのような外部データベースに接続可能である。また、装置10は、タンパク質の分析を実施する通信インターフェース22を介して質量分析装置にも接続可能である。
【0029】
図2は、本発明によるEMPAIに基づくタンパク質含有量の定量を行うための解析用装置10の構成を説明するのに用いられるブロック図を示す。図2に示されているように、装置10は、IF(インターフェース)手段30と制御手段40を含む。装置10は、これらの手段30,40が、この装置を利用するユーザー及び/又は質量分析法からの質量分析データといった入力を受け、ユーザー及び/又は質量分析法へと情報を出力するような形で構築されている。通常のパーソナルコンピュータを該装置10として使用することができる。質量分析データの例としては、質量スペクトル、質量クロマトグラム及びMSMSデータなどが含まれる。
【0030】
IF手段30は、情報をキーボード、質量分析法などといった入力デバイス及びディスプレイ、プリンタなどといった出力デバイスとの関係において入力及び出力できるような形で構築されている。IF手段30を介して、解析すべき質量分析データは制御手段40へと伝送される。
【0031】
制御手段40は、同定手段42、測定手段44、計算手段46及び計算手段48を備える。本発明においては、同定手段42は、IF手段30を介してタンパク質の質量分析データに関する情報を受信でき、質量分析法により定量されるべきタンパク質を同定する。次に、質量分析データに基づいて、測定手段44は同定手段42により同定された該タンパク質あたりの検出されたペプチドの数(Nobsd)を測定する。一方で、定量化すべきタンパク質の同定に基づいて、算出手段46は、タンパク質あたりの検出されうるペプチドの数を計算する(Nobsbl)。ここで、「タンパク質あたりの検出されたペプチドの数」という用語は、質量分析法によって実際に検出された定量化すべき1タンパク質あたりのペプチド数を意味する。「タンパク質あたりの検出されうるペプチドの数」という用語は、ここでは該タンパク質あたりの理論的ペプチド数を意味する。なお、これらの数は、文書[17]中で定義されている。
【0032】
本発明に係る方法では、Nobsd及びNobsbl値に基づいて、Nobsd及びNobsblに関する情報を受ける計算手段48は、EMPAIを得るために、以下の式によりEMPAIを算出する:
EMPAI=10Nobsd/Nobsbl−1
【0033】
その結果、本発明によれば、タンパク質含有量を決定するために、指数関数的に修正されたタンパク質発現量指標(「EMPAI」)がタンパク質混合物中のタンパク質含有量に対して比例することが立証される。
【0034】
さらに、計算手段48は、以下の2つの式により、タンパク質含有量(モル%)とタンパク質含有量(重量%)を算出する。
【数9】
【数10】
なお、式中、Σ(EMPAI)は全ての同定されたタンパク質についてのEMPAI値の総和であり、MWは同定された各タンパク質の分子量を表わしている。
【0035】
必要に応じて、図2に示されていないメモリー手段内に計算された及び/又は算出されたデータを記憶することができる。
【0036】
図3は、本発明によるEMPAIに基づくタンパク質含有量の定量を行うためのフローチャートを示す。ステップS10では、MS方法により生体材料の試料の質量分析法を実施した後、同定手段42により対象とするタンパク質が同定される。このMS方法には、ペプチドマスフィンガープリント法及びMS/MS方法が含まれる。当業者であれば、以下の文書(その全体が参照により援用されている、Proc.Natl.Acad.Sci.USA.1993年、第90号、5011−5015頁;J.Curr.Biol.1993年、第3号、327−332頁;Biol.Mass.Spectrom.1993年、第22号、338−345頁;Nat Genet.1998年、第20号、46−50頁;J Cell Biol.1998年、第141号、967−977頁;J Cell Biol.2000年、第148号、635−651頁;Nature、2002年、第415号、141−147頁;Nature、2002年、第415号、180−183頁;Curr Opin Cell Biol.2003年、第15号、199−205頁;Curr Opin Chem Biol.2003年、第7号、21−27頁)で開示されていることから容易に理解できる。次のステップS11では、上記で同定されたタンパク質あたりの検出されたペプチドの数は、MSデータを用いることで測定手段44によって測定される。その後、タンパク質あたりの検出されうるペプチドの数は、(ステップS12に示されているように)上記で同定されたタンパク質の構造に基づいて算出手段46により算出される。該タンパク質あたりの検出されたペプチドの測定に先立ちタンパク質あたりの検出されうるペプチドの数を計算することが可能である。
【0037】
図4は、本発明で使用される該タンパク質あたりの検出されうるペプチドの数を算出するためのフローチャートの一の実施例を示す。ステップS121では、質量範囲は、検出されたペプチド及び質量分析計のスキャン範囲を用いることにより決定される。次のステップS122では、各々の検出されたペプチド内の予測された保持時間は、ミーク(Meek)式(文献[23]で記述されている通り)に基づいて算出される。なお、各検出されたペプチドのアミノ酸配列を、例えばMS/MS方法によって決定することができ、ミーク式に従って既知のアミノ酸配列と液体クロマトグラフィ内の保持時間との間には関係が存在するという点に留意されたい。このとき、ステップS123において、予測された保持時間範囲は、上述のミーク式に基づいて検出されたペプチドの保持時間を用いることによって決定される。このとき、トリプシンにより完全消化されたペプチドは、コンピュータ内で算出される(ステップS124中)。より具体的には、トリプシンは、ペプチド結合をタンパク質中のリジン残基及びアルギニン残基のカルボキシル側で選択的に切断可能な有名なプロテアーゼであることから、トリプシンにより完全消化されたペプチドのアミノ酸配列が決定されている。かくして、このステップS124では、トリプシン消化されたペプチドの分子量(MW)及び予測保持時間がコンピュータ内で算出される。次のステップS125では、MW及び予測保持時間に従って検出されうるペプチドが分類される。最後に、ステップS126で、検出されうるペプチドのMW及び予測保持時間が共に質量範囲(S121内)及び保持時間範囲(S123内)内に入ることを基礎として、タンパク質あたりの検出されうるペプチドの数が計数される。
【0038】
なお、本発明においては、図4のフローチャートに従って実施される検出されうるペプチドの数の算出に制限は全くないという点に留意すべきである。
【0039】
タンパク質あたりの検出されたペプチドの数(Nobsd)及びタンパク質あたりの検出されうるペプチドの数(Nobsbl)の数を使用することにより、以下の通り、算出手段48によりEMPAIが算出される(ステップS13中)。
EMPAI=10Nobsd/Nobsbl−1
【0040】
EMPAIの値を用いて、モル及び重量百分率でのタンパク質含有量が以下のように表わされる:
【数11】
【数12】
なお、式中、MWは、同定された各タンパク質の分子量であり、Σ(EMPAI)は、全ての同定されたタンパク質についてのEMPAI値の総和である(ステップ14及び15に示されている通りである。)。
【0041】
以上で説明されている図3中に例示されたタンパク質含有量の解析の流れを実行するプログラムが、外部記憶媒体駆動ユニット20を介して外部記憶装置又はメモリー14内に記憶される、又はプログラムがCD−ROMといったような外部記憶媒体内に記憶されている場合にはCPU12まで直接転送される。
【0042】
なお、本発明による定量に先立ち、該タンパク質は通信インターフェース22を通して、NCBInrデータベースといったような外部データベースを参照することにより同定されることに留意すべきである。必要に応じて、表示デバイス16はユーザーインターフェース18を介して本発明による定量の結果を表示する。
【0043】
このようにして、本発明は、EMPAIに基づいてタンパク質含有量の定量を行うための方法及びこの方法を実施するためのコンピュータプログラムを提供する。
【0044】
以下では、本発明の態様による典型的実施例に関して記するが、本発明の範囲はこれらに制限されるようには意図されていない。
【実施例】
【0045】
材料及び方法
細胞溶解物の調製
オング(Ong)ら[文献4]のSILACプロトコルに従って、13C6−Leu(ケンブリッジ・アイソトープ・ラボラトリーズ(Cambridge Isotope Laboratories)、Andover、マサチューセッツ州)を含有するRPMI−1640培地(ギブコ(Gibco)BRL、Grand Island、ニューヨーク州)を調製した。この培地内での13C6−Leu標識のため、マウス神経芽細胞腫neuro2a細胞を培養した。プロテアーゼ阻害物質カクテル(ロシュ・ダイアグノスティックス(Roche Diagnostics)、Basel、スイス)を添加し、超音波処理を用いて全タンパク質を溶解させた。説明されている通り[文献10]、正常なRPMI1640培地の中でHCT116−C9細胞を成長させた。プロテアーゼ阻害物質と5mMのジチオトレイトールを含む5mLのM−PER(ピアース(Pierce)、Rockford、イリノイ州、米国)で全タンパク質を抽出した。
【0046】
LCMSMSのためのペプチド混合物の調製
細胞からのタンパク質を吸引乾燥させ、8Mの尿素を含有する50mMのトリス−HCl緩衝液(pH9.0)により再懸濁させた。これらの混合物を説明されている通り[文献6]、その後減量させ、アルキル化させ、Lys−C(和光(Wako)、大阪、日本)及びトリプシン(プロメガ(Promega)、Madison、ウィスコンシン州、米国))により消化させた。消化された溶液をTFAで酸性化させ、脱塩し、Empore C18ディスク(3M、ミネソタ州、米国)で完全自動計器(日京テクノス(Nikkyo Technos)、東京、日本)により調製されたC18−ステージ Tips[文献21]で濃縮させた。少なくとも1つのロイシン及び1つのチロシンを含有するペプチド合成用候補を、neuro 2a細胞中で発現されるタンパク質からのトリプシンペプチドの配列を考慮に入れて選択した。試料調製中の酸化の問題を回避するため、メチオニン及びトリプトファンを含有するペプチドを除去した。さらに、トリプシンによる頻繁な切断ミスを考慮して、二重塩基性残基を伴うペプチドを除去した。選択された54のペプチドは、F−moc化学で島津(Shimadzu)PSSM−8(京都、日本)を用いて合成し、分取HPLCで精製させた。純度及び構造解明のためにアミノ酸分析、ペプチド質量測定及びHPLC−UVを実施した。neuro 2a細胞からのペプチド混合物に対し異なる量のこれらのペプチドを添加し、上述のとおりのステージ Tipにより精製した。
【0047】
ナノLC−MS/MS分析
QSTARパルサーI(ABI/MDS−シーエックス(Sciex)、Toronto、カナダ)又はShimadzu LC10勾配ポンプを備えたFinnigan LCQ Advantage(サーモエレクトロン(Thermoelectron)、San Jose、カリフォルニア州、米国)、及び150μmの流路系を有するValco C2バルブを取付けるHTC−PALオートサンプラー(CTCアナリティックス(Analytics)AG、Zwingen、スイス)を用いて、ナノLC−MS/MSによって全ての試料を分析した。「Stone arch」フリットで分析カラム用針を調製するべく、窒素加圧型カラムローダーセル(日京)を伴う自動引抜き針(内径100μm、開口6μm、長さ150mm)の中に、Repro Sil C18材料(3μm、マイシュ博士(Dr.Maisch)、Ammerbuch、ドイツ)を詰め込んだ[文献22]。Proxeon x−y−zナノスプレーインターフェース(Odense、デンマーク))上にテフロンコーティングの施されたカラムホルダー(日京)を取付け、カラム針を保持しかつ適切なスプレー位置を調整するために磁石付きのValco金属コネクタを使用した。注射体積は3μLであり、流量はティースプリッタの後250nL/分であった。移動相は、(A)0.5%の酢酸及び(B)0.5%の酢酸及び80%のアセトニトリルで構成されていた。この研究を通して、5分で5%B〜10%、60分で10%〜30%、5分で30%〜100%、そして10分で100%という3段階線形勾配を利用した。説明されている通り[文献22]、金属コネクタを介して2400Vのスプレー電圧を印加した。より速い走査モードを伴うQSTARについては、3つの強いピークを選択するために1秒間MS走査を実施し、各々0.55秒間ずつ、後続する3回のMSMS走査を実施した。以前に走査された親イオンを排除するため、情報依存性捕捉(IDA)機能が3分間活動状態にあった。より低速の走査モードについては、1回のMS走査(1秒)あたり4回のMSMS走査(各1.5秒)が実施された。LCQについては、1回のMS走査につき2回のMSMS走査がAGCモードで実施された。平均走査サイクルはそれぞれ、1回のMSについて1.19秒、1回のMSMSについては1.17秒であった。走査範囲は、QSTAR及びLCQの両方についてm/z300−1400であった。
【0048】
DATA分析
LCQ及びQSTARの両方の生データファイルから全てのピークを抽出するために、特注のSpiceと呼ばれるソフトウェア(三井情報開発(Mitsui Knowledge Industry)、東京、日本)を使用し、結果のピークファイルを、Swiss−Protタンパク質データベースに対するタンパク質同定のためにMascot verl.9データベースサーチエンジン(その全体が本明細書に参照により援用されているマトリックスサイエンス(Matrix Sciences)、London、英国;D.M.パーキンス(Perkins)、D.J.パピン(Pappin)、D.M.クリーシー(Creasy)、J.S.コットレル(Cottrell)、Electrophoresis第20号(1999年)、3551頁)に提出した。許容できる不完全消化部位の数は1に設定され、同一性を標示するためのペプチドスコアが、MSMSスペクトルの手作業検査無しでペプチド同定のために使用された。http://msquant.sourceforge.net/からMSQuant ver1.4aをダウンロードし、合成ペプチドの既知の量を用いてタンパク質の絶対濃度についてクロマトグラム中のイオン計数を判定する目的で13C6Leu SILACについてそれをカスタマイズした。
【0049】
タンパク質発現量の決定
タンパク質あたりの検出されうるペプチド数を算出するため、タンパク質をコンピュータ内で消化させ、得られたペプチドを質量分析計の測定走査範囲と比較した。さらに、発明者らのナノLC条件下での保持時間は、約3000個のペプチドに基づいて発明者ら独自の係数でミーク[文献23]及びサカモトら[文献24]による手順に従って算出し、過度の親水性又は疎水性をもつペプチドは除去した。ペプチド数を算出するために以下の等式(1)〜(4)に基づいた組織内PHPプログラムを書き、これを用いてMicrosoft Excelに全てのデータを送り出した。タンパク質あたりの検出されたペプチド数に関しては、(1)ユニーク親イオンを計数すること、(2)ユニーク配列を計数すること及び(3)不完全消化によって引き起こされる部分的修正及び重複無くユニーク配列を計数すること、といったような3つの計数方法を利用した。MSQuantの「全ペプチドのエクスポート(Export All Peptides)」機能を用いてMascot htmlファイルからExcelスプレッドシートまでこれらの数を送り出した。
【0050】
PAIが、式中Nobsd及びNobsblがそれぞれタンパク質あたりの検出されたペプチド数及びタンパク質あたりの検出されうるペプチド数であるものとして
【数13】
として定義される[文献17]。次いで、EMPAIが、
EMPAI=10PAI−1 (2)
として定義される。
【0051】
かくして、モル及び重量百分率でのタンパク質含有量は、
【数14】
(3)
【数15】
として記述され、ここで、MWは、同定された各タンパク質の分子量であり、ΣEMPAIは全ての同定されたタンパク質についてのEMPAI値の総和である。
【0052】
DNAマイクロアレイ分析
10mLの培地を有する直径10cmの皿の中で1皿あたり5.0×106細胞の割合で、HCT116−C9細胞を平板固定した。24時間のプレインキュベーションの後、細胞を0.015%のDMSOで12時間処理した。確立されたプロトコルに従って、Affymetrix HuGene FLアレイを用いてデュプリケート実験を実施した。遺伝子シグナル強度を抽出するためにAffymetrix GeneChipソウトウェアを用い、遺伝子記号に基づいて2つのデータセットを分類し平均をとった。
【0053】
異なる濃度を有する単一のタンパク質からの同定されたタンパク質の数
ナノLC−ESI−MS/MSにより異なる量のヒト血清アルブミン(HSA)トリプシンペプチドを分析し、同定されたペプチドの数を計数した。図5Aに示されているように、ピーク面積及び同定されたペプチド数の両方共が、注入量の増加につれて増大したが、より高いHSA濃度で両方の曲線共飽和した。しかしながら、ピーク面積が線形である領域においてさえ、ペプチド数はタンパク質量に対し線形関係をもたない。興味深いことに、ペプチド数は、3fmol〜500fmolの注入量の対数に対し線形関係を示す(図5B)。より低速の走査を伴うLCQから同じデータを得た。このことは、すなわち、各ピークが時間的に充分分離しており、より低速の走査により引き起こされる「ランダムサンプリング」の影響がこの条件下で起こらなかったということを意味している。この場合、ペプチドを計数するために、3つの方法、すなわち(1)同じペプチド配列からの異なる電荷状態を含む全ての親イオン、(2)メチオニン酸化といったような部分的修正、異なる電荷状態を除く全てのペプチド、(3)不完全消化により重複したペプチドを除く冗長性のない配列を伴うペプチド、が用いられた。これらのうち、異なる親イオン数に基づくペプチド数は、タンパク質発現量の対数に対して最高の相関関係を提供する。結果は特定の条件の下でのものではなくより一般的な現象であると考えられている。最近、2つの独立したグループがペプチド数とタンパク質濃度との間の類似した曲線を提示した。その両方共がタンパク質の対数を分析していなかったが、発明者の結果によれば、それらのデータからも同様にタンパク質濃度の対数とペプチド数との間の線形関係が観察された。タンパク質濃度の対数が何故消化されたペプチド数と相関関係を有するかは明らかでないが、それは化学ポテンシャルが濃度対数と比例し、ペプチドのイオン化に必要なエネルギーが化学ポテンシャルの増大に伴って線形的に増大するという事実により説明されるであろう。
【0054】
複合度の高い混合物溶液中の47のタンパク質のPAI
次に、本発明者は、全細胞溶解物中で量が既知である54のタンパク質について調査した。13C6−Leuで標識されたマウス神経芽細胞腫neuro 2a細胞からのトリプシンペプチドを、QSTARを用いて実行された単一のLC−MS/MSによって測定し、336のタンパク質を1462個のペプチドに基づいて同定した。本発明者は、12C6−Leuを含有する54の合成ペプチドをこの試料溶液に添加し、13C6−Leuを含有する対応するトリプシンペプチドを定量した。抽出されたイオンクロマトグラム(XIC)内で重複したピークを提供したことから、7個のペプチドは定量されなかった。その結果、分子量で13K−229KDaの47個のタンパク質が、表1A及び1Bに列挙されている通り試料溶液中30fmol〜1.8pmol/μLの範囲内で定量された。
【0055】
【表1A】
【0056】
【表1B】
【0057】
この場合、2つの付加的な因子を考慮に入れるべきである。1つはペプチド数に対するタンパク質のサイズの影響である。一般にタンパク質が大きくなればなるほどより多くの検出可能なペプチドが生成される。したがって、保持時間に関する付加的な基準を除いて前述のとおりに、正規化のために検出されうるペプチドを使用した。この場合、多大な数のペプチドが試料中に存在していた。よって、検出されたペプチドの数は或る程度、イオン化抑制効果並びにMSMS事象についてのランダム選択により影響されることになると思われた。図6Aは、異なるタンパク質が1つのグラフにプロットされた場合でさえ、タンパク質あたりの検出されうるペプチド数によって正規化された検出されたペプチドの数とlog[タンパク質]との間には同様に線形関係が存在するということを示している。Mascotスコア及びペプチド数といったようなその他のパラメータは、タンパク質発現量と充分な相関関係をもたず、ペプチド数をタンパク質の分子量で除したものは、図6B−Dに示されているように、タンパク質含有量の対数に対する適度な相関関係を提供している。
【0058】
この場合、本発明者は、バックグラウンドの影響を最小限におさえるためQSTARの最高のMSMS走査速度を使用した。より低い走査速度が使用された場合、相関関係は低減させられた(r=0.90から0.81へ)。例えば、図7Aを参照してみる。この効果は、イオントラップ計器が使用された場合により顕著であった(r=0.77)。これは、トラップ能力の量の制限がより発現量が多いタンパク質についてのより偏向したピーク選択を引き起こすことに起因すると思われ、実際図7Bにおいてタンパク質発現量が多くなればより大きな偏差がみられた。走査がさらに速くより能力の高い線形イオントラップの最近の開発が、より高速の走査モードを伴うQSTARに対して類似の結果を提供することになると思われる。
【0059】
さらに、試料の複合性の影響は、LC/LC−MS/MS[文献25]及びGeL CMS(ゲル増強LC−MS、1D−ゲルとそれに続くスライシング、消化及びLCMC分析)アプローチ[文献15]といったようなMSMS分析に先立ち、多次元分離を用いることによって最小限になると思われる。
【0060】
EMPAI計算の実施例
EMPAI値を算出するための全プロトコルは以下の通りである:
(1) LC−MS/MS分析を実施する;
(2) Mascotといったようなサーチエンジンを用いてタンパク質を同定する;
(3) タンパク質あたりのユニーク親イオン数を抽出する;
(4) タンパク質あたりの検出されうるペプチドの数を計数する;及び
(5) (3)及び(4)を用いてEMPAI値を算出する。
【0061】
以下に記すのは、表2中の1つの標準的な実施例を使用することによるEMPAI算出の実施例である。
【0062】
【表2】
【0063】
(3) 検出されたユニーク親イオンの抽出;
上述のプロトコル(1)及び(2)に従って、検出されたユニーク親イオンの抽出を実施した。上述の抽出の結果は、表3中で集計されている。Mascotスコアの結果に基づいて、表3中の「諾否(Accept or not)」の欄では、「Yes(はい)」という語は抽出が実施されることを意味し、「No(いいえ)」という語は検出された親イオンが、小さなMascotスコアに起因して抽出されなかったことを意味している。
【0064】
【表3】
【0065】
(4) タンパク質あたりの検出されうるペプチド数の計数
図4で上述した通り、この算出は以下のステップ1〜6に従って実施された。
【0066】
ステップ1(図4中のS121を参照のこと): 検出されたペプチド及び質量分析の走査範囲を用いた質量範囲の決定。このステップは、ペプチドの実際の観察された質量分析法、すなわち検出されたペプチド及び質量分析の走査範囲を使用することによって実施された。
【0067】
ステップ2(図4中のS122を参照のこと): ミークの式に基づく各々の検出されたペプチドの中の予測された保持時間の算出;図4のS122で説明されているように、各々の検出されたペプチドのアミノ酸配列は一般にMS/MS方法により決定可能であることがわかっているため、検出されたペプチドの保持時間を、既知のアミノ酸配列と保持時間との間の関係が存在するミークの式に従って算出することができた。
【0068】
ステップ3(図4中のS123を参照のこと): 検出されたペプチドを用いた保持時間範囲の決定;同様に、このステップはミークの式を使用して実施された。
【0069】
ステップ4(図4中のS124を参照のこと): コンピュータ内でのトリプシンにより完全消化されたペプチドの算出;図4のS124中で記されているように、トリプシン消化されたペプチドの分子量(MW)及び予測保持時間は、コンピュータ内でトリプシン判定された消化されたペプチドのアミノ酸配列から算出可能であった。
【0070】
ステップ5(図4中のS125を参照のこと): 検出されうるペプチドは、S124の結果を使用してMW及び予測保持時間に従って選別された。
【0071】
ステップ6(図4中のS126を参照のこと): タンパク質あたりの検出されうるペプチドの数は、検出されうるペプチドのMW及び予測保持時間が共に質量範囲(ステップ121)及び予測保持時間(ステップ123)内に入ることを基礎として計数された。
【0072】
表2中の試料を用いた結果に従って、表4にあるように、質量範囲及び保持時間範囲を決定した。
【0073】
【表4】
【0074】
上述の計数の結果は表4に集計されている。コンピュータ内での検出されうるペプチドの算出の結果に基づいて、表2中の「諾否」の欄では、「はい」という語は、検出されうるペプチドが質量範囲及び保持時間範囲の両方に入ることを意味し、「いいえ」という語は、検出されうるペプチドが質量範囲又は保持時間範囲のいずれかの外にあることを意味する。
【0075】
(5) (3)及び(4)を用いたEMPAI値の算出
以上の式(1)及び(2)に従って、上述の(3)及び(4)の結果を使用することによってEMPAIを算出した。EMPAIの結果は、表5に集計されている。表5から明らかなように、表2中の試料を用いたEMPAIの値は8.345であった。
【0076】
【表5】
【0077】
EMPAIを用いた絶対定量
PAIはタンパク質間の発現量関係を推定することができるものの、モル分率を直接表現することはできない。したがって、本発明者は、式(2)としてタンパク質発現量の決定のセクションで説明した通り、図8は示されているようなタンパク質含有量に正比例する新しいパラメータEMPAIをPAIから導出した。絶対濃度を算出するために、BCA検定により重量単位で合計タンパク質量を測定し、336のneuro2aタンパク質の中の47のタンパク質の重量分率を、式(4)を用いて算出した。図9に示されているように、EMPAIベースの濃度は、実際値(y=0.97x、r=0.93)ときわめて一貫性をもつものであり、実際値に対する偏差百分率は3%〜260%の範囲にあり、平均は63%であった。本発明者は合計タンパク質量についてBCA検定を使用したことから、これらの値は容易に変更された。にもかかわらず、このEMPAIアプローチは、包括的絶対定量のためのきわめて正確な指標を提供する。
【0078】
包括的タンパク質発現分析に対する適用
PAIは、ただ1回のLCMSMSの実行からタンパク質発現データを生成するのに実に便利である。本発明者は、HCT116ヒト癌細胞中の遺伝子発現とそれを比較するためにこのアプローチを適用する。DNAマイクロアレイは4971個の遺伝子の発現データを提供し、一方、単一回のLCMS実行はユニーク配列をもつ1811のペプチドに基づき402個の同定されたタンパク質を提供した。遺伝子記号とタンパク質登録番号を橋かけすることで、発現比較研究のために利用される合計227の遺伝子/タンパク質が結果としてもたらされた。予測通り、酵母についての以前の研究から予想されるようなわずかな相関関係が観察された[文献18,26]。興味深いことに、外れ値の大部分がリポソームタンパク質であった(図10参照)。E.coli(大腸菌)といったような原核生物とは異なり、哺乳動物細胞が転写によってのみならずmRNAの輸送、翻訳及びrRNAと未会合の過剰量のタンパク質の分解によってもリポソームタンパク質の発現レベルを調節できるということは周知である[文献27,28]。また、本発明者は、E.coliについて、EMPAIを用いて遺伝子とタンパク質発現との間の比較研究を行なったが、リポソームタンパク質のこのような偏差を発見しなかった[文献29]。遺伝子及びタンパク質の発現データに両方共、例えば10%の差を弁別するほどに正確ではないが、それは以上で示されたような簡単な概要を得るためにはきわめて有用である。
【産業上の利用可能性】
【0079】
産業上の利用可能性
本発明によれば、EMPAIと命名された絶対タンパク質発現量のための尺度が確立される。EMPAIは、Mascotといったようなデータベースサーチエンジンの出力情報から容易に算出されることから、いかなる付加的なステップも無く定量的情報を追加するために、以前に測定された又は公表されたデータセットにこのアプローチを適用することが可能である。また、EMPAIは、特に比率の正確な測定には定量的変化が大きすぎること、代謝標識が不可能であること、又は感受性の制約のため化学的標識技術が許容されないことを理由として同位元素ベースのアプローチを適用できない場合において、相対的定量のためにも使用可能である。このような場合には、1つの試料中のタンパク質のEMPAI値は、もう1つの試料中のものと比較でき、2つの試料間のEMPAI相関関係からの外れ値を、増大する又は減少するタンパク質として判定することができる。
【0080】
このEMPAIアプローチは、1つのタンパク質から同定されるペプチド数を増やすために多次元分離−MSMSに適用され得る。m/z領域に対するイオン化依存性といったようなMS計器依存性パラメータを考慮するために、さらなる改善も可能であると思われる。EMPAI指標は単純なスクリプトで算出できタンパク質同定実験におけるさらなる実験を必要としないことから、発明者らはプロテオミクス結果の報告におけるその日常的使用を提案する。
【0081】
参考文献
本書に引用されている以下の参考文献は、その全体が本明細書に参照により援用されている。
[1] R. Aebersold, M. Mann, Nature 422 (2003) 198.
[2] Y. Oda, K. Huang, F.R. Cross, D. Cowburn, B.T. Chait, Proc Natl Acad Sci U S A 96 (1999) 6591.
[3] S.P. Gygi, B. Rist, S.A. Gerber, F. Turecek, M.H. Gelb, R. Aebersold, Nat Biotechnol 17 (1999) 994.
[4] S.E. Ong, B. Blagoev, I. Kratchmarova, D.B. Kristensen, H. Steen, A. Pand ey, M. Mann, Mol Cell Proteomics 1 (2002) 376.
[5] M.J. MacCoss, C.C. Wu, H. Liu, R. Sadygov, J.R. Yates, 3rd, Anal Chem 75 (2003) 6912.
[6] L.J. Foster, C.L. De Hoog, M. Mann, Proc Natl Acad Sci U S A 100 (2003) 5 813.
[7] B. Blagoev, I. Kratchmarova, S.E. Ong, M. Nielsen, L.J. Foster, M. Mann, Nat Biotechnol 21 (2003) 315.
[8] J.A. Ranish, E.C. Yi, D.M. Leslie, S.O. Purvine, D.R. Goodlett, J. Eng, R . Aebersold, Nat Genet 33 (2003) 349.
[9] W.X. Schulze, M. Mann, J Biol Chem 279 (2004) 10756.
[10] Y. Oda, T. Owa, T. Sato, B. Boucher, S. Daniels, H. Yamanaka, Y. Shinohar a, A. Yokoi, J. Kuromitsu, T. Nagasu, Anal Chem 75 (2003) 2159.
[11] J.R. Barr, V.L. Maggio, D.G. Patterson, Jr., G.R. Cooper, L.O. Henderson, W.E. Turner, S.J. Smith, W.H. Hannon, L.L. Needham, E.J. Sampson, Clin Ch em 42 (1996) 1676.
[12] S.A. Gerber, J. Rush, O. Stemman, M.W. Kirschner, S.P. Gygi, Proc Natl Ac ad Sci U S A 100 (2003) 6940.
[13] J. Havlis, A. Shevchenko, Anal Chem 76 (2004) 3029.
[14] R.W. Corbin, O. Paliy, F. Yang, J. Shabanowitz, M. Platt, C.E. Lyons, Jr. , K. Root, J. McAuliffe, M.I. Jordan, S. Kustu, E. Soupene, D.F. Hunt, Pro c Natl Acad Sci U S A 100 (2003) 9232.
[15] E. Lasonder, Y. Ishihama, J.S. Andersen, A.M. Vermunt, A. Pain, R.W. Saue rwein, W.M. Eling, N. Hall, A.P. Waters, H.G. Stunnenberg, M. Mann, Nature 419 (2002) 537.
[16] Y. Shen, R. Zhao, S.J. Berger, G.A. Anderson, N. Rodriguez, R.D. Smith, A nal Chem 74 (2002) 4235.
[17] J. Rappsilber, U. Ryder, A.I. Lamond, M. Mann, Genome Res 12 (2002) 1231.[18] H. Liu, R.G. Sadygov, J.R. Yates, Anal Chem (2004) 76, 4193-4201.
[19] J. Rappsilber, Y. Ishihama, G. Mittler, P. Mortensen, L. Foster, M. Mann, in Proceedings of 51st ASMS Conference on Mass Spectrometry, Montreal, Ca nada, 2003.
[20] J.S. Andersen, C.J. Wilkinson, T. Mayor, P. Mortensen, E.A. Nigg, M. Mann , Nature 426 (2003) 570.
[21] J. Rappsilber, Y. Ishihama, M. Mann, Anal Chem 75 (2003) 663.
[22] Y. Ishihama, J. Rappsilber, J.S. Andersen, M. Mann, J Chromatogr A 979 (2 002) 233.
[23] J.L. Meek, Proc Natl Acad Sci U S A 77 (1980) 1632.
[24] Y. Sakamoto, N. Kawakami, T. Sasagawa, J Chromatogr 442 (1988) 69.
[25] A.J. Link, J. Eng, D.M. Schieltz, E. Carmack, G.J. Mize, D.R. Morris, B.M . Garvik, J.R. Yates, 3rd, Nat Biotechnol 17 (1999) 676.
[26] S.P. Gygi, Y. Rochon, B.R. Franza, R. Aebersold, Mol Cell Biol 19 (1999) 1720.
[27] K. Tsurugi, Seikagaku 61 (1989) 271.
[28] W.H. Mager, Biochim Biophys Acta 949 (1988) 1.
[29] Y. Ishihama, D. Frishman, M. Mann, Unpublished data.
【図面の簡単な説明】
【0082】
本発明の目的及び特徴が、添付図面を参照するとともに、好ましい実施形態の説明から明らかである。
【図1】本発明による前記EMPAIに基づいてタンパク質含有量の定量を行うコンピュータのハードウェア構造の図面を示す。
【図2】本発明によるEMPAIに基づいてタンパク質含有量の定量を行うための解析用装置の構成を例示するためのブロック図を示す。
【図3】本発明によるEMPAIに基づいてタンパク質含有量の定量を行うためのフローチャートを示す。
【図4】タンパク質あたりの検出されうるペプチドの数を計算するためのフローチャートの一の実施例を示す。
【図5】ヒト血清アルブミン(HSA)の注入量に対するペプチド数及びピーク面積の依存性を例示している。図5Aは、ピーク面積及びペプチドのユニーク親イオン数対(HSA)の注入量の関係を示す。図5Bは、3つの異なるペプチド数とHSA注入量の関係を示す。
【図6】neuro2a細胞中の47個のタンパク質についての異なるパラメータとタンパク質濃度の関係を示す。図6Aは、タンパク質濃度とPAIの関係を示す。図6Bは、タンパク質濃度とペプチド数をタンパク質分子量で除したものの関係を示す。図6Cは、タンパク質濃度とMascotスコアの関係を示す。図6Dは、タンパク質濃度と検出されたペプチド(ユニーク親イオン)の数の関係を示す。
【図7】PAIとlog[タンパク質]との間の線形関係に対するMS測定条件の影響を示す。図7Aは、より低速の走査を伴う飛行時間型の質量分析法(QSTAR)を示す。図7Bは、より低速の走査を伴うイオントラップ型の質量分析法(LCQ)を示す。
【図8】neuro2a細胞中の47のタンパク質についてのタンパク質濃度とEMPAIとの間の関係を示す。
【図9】本発明によるEMPAIを用いたneuro2a中の47のタンパク質の絶対定量の結果を示す。
【図10】本発明の一の実施形態によるHCT116細胞中の遺伝子とタンパク質発現との間の比較を示す。
【技術分野】
【0001】
技術分野
本発明は、一般的には、質量分析法を用いたタンパク質含有量の解析に関し、より具体的には、プロテオミクスにおいて質量分析法によるタンパク質発現指標に基づいてタンパク質含有量の定量を行うための方法及びコンピュータプログラムに関する。
【背景技術】
【0002】
背景技術
今日ゲノム注釈付きデータベースと組合わされているプロテオーム液体クロマトグラフィ質量分析法(以下、「LC−MS」という。)アプローチは、1つのタンパク質混合物溶液から何千ものタンパク質を同定できるようにする[文献1]。これらのアプローチは、安定した同位元素標識を用いた相対的定量に対しても同様に適用されてきた[文献2−4]。近年になって、2つの状態の間の包括的な定量研究のみならず[文献5、6]、タンパク質−タンパク質間[文献7、8]、タンパク質−ペプチド間[文献9]及びタンパク質−薬物間[文献10]の相互作用分析も広範に報告されてきている。しかしながら、これまでのところ、1つの試料溶液中のタンパク質濃度についての包括的なアプローチは、なおも確立されていなかった。細胞タンパク質の反応速度論/力学論は特定の領域内でのタンパク質の濃度の変化として記述されることから、タンパク質濃度は定量プロテオミクスにおいて最も基本的かつ重要なパラメータの1つである。さらに、濃度差が大き過ぎて同位体に基づく相対的定量を実施できない場合でも、2つの試料間の相対的定量のためにも試料中のタンパク質濃度を使用することができる。これまで同位体標識された合成ペプチドは、問題の特定のタンパク質の絶対定量のための内部標準として使用されてきた[文献11、12]。このアプローチは、包括的な解析に適用可能であるが、同位体標識されたペプチドのコスト及びゲル内でタンパク質の定量的消化を行なうことの困難さが問題となっている[文献13]。
【0003】
ナノLC−MS/MSの単一回の解析でさえ、データベース探索の助けを得ると、容易に長い同定されたタンパク質リストを生成し、同定におけるヒットランキング、確率評点、タンパク質あたりの同定済みペプチド数及び同定済みペプチドのイオン計数といったような付加的な情報が、生データを用いてこのリストから抽出される。定性的には、ヒットランク、評定及びタンパク質あたりのペプチド数[文献14]といったような一部のパラメータが、解析対象の試料中のタンパク質発現量についての一種の指標となる。なかでも、ペプチドのイオン計数が、発現量を描写するための最も直接的なパラメータと思われ、異なる状態でのタンパク質発現のために使用された[文献15]。しかしながら、検出器としての質量分析計は、制限された線形性及びバックグラウンドでのイオン化抑制効果に関して吸光度検出器ほど汎用性あるものではない[文献16]。従って、信頼性ある定量的情報を得るためには、これらのパラメータを正規化する必要がある。この戦略に沿った第1のアプローチは、本発明者らが知るかぎり、タンパク質発現量指標(以下「PAI」と呼ばれる)と命名され、ヒトスプライセオソーム複合体分析に適用された[文献17]。相対的定量のためにはLC/LC−MS/MS分析におけるスペクトル計数及びペプチド数が使用されるという類似の概念が近年報告された[文献18]。同様に、本発明者は、各タンパク質の平均イオン計数を算出するために少なくとも3つのペプチドが使用される正規化されたイオン計数ベースのアプローチも同様に開発した[文献19]。このアプローチは、ペプチド相関関係プロファイリングにおける相対的定量のためにも使用されてきた[文献20]。
【発明の開示】
【発明が解決しようとする課題】
【0004】
発明の開示
しかしながら、このアプローチの適用可能性は、それが正確さを保つために3つのペプチドを必要とすることを理由として、制限されていた。ここでは、本発明者はナノLC−MS/MS実験からタンパク質発現量を判定するためにPAI戦略を検討している。
【0005】
本発明の目的は、生体材料の試料中で指数関数的に修正されたPAI(以下、「EMPAI」という。)に基づいてタンパク質含有量の定量を行うための方法を提供することにある。
【0006】
本発明の一の実施形態においては、例えばコンピュータによって読取り可能でありかつ生体材料の試料中の上述のEMPAIに基づいてタンパク質含有量の定量を行うためのコンピュータプログラムを記憶するコンピュータ読取り可能媒体といったようなコンピュータプログラム製品も提供されている。
【0007】
本発明の別の実施形態においては、生体材料の試料中の上述のEMPAIに基づいてタンパク質含有量の定量を行うためのコンピュータプログラムも提供されている。
【0008】
また、本発明のさらなる実施形態においては、生体材料の試料中の上述のEMPAIに基づいてタンパク質含有量の定量を行うための解析用装置も提供されている。
【課題を解決するための手段】
【0009】
上述の目的を達成するため、本発明は、生体材料の試料中のタンパク質含有量の定量を行うための方法であって、(a)質量分析法により定量化すべきタンパク質を同定するステップと;(b)前記タンパク質あたりの検出されたペプチドの数(Nobsd)を測定するステップと;(c)タンパク質あたりの検出されうるペプチドの数(Nobsbl)を算出するステップと;(d)EMPAIを得るために、EMPAI=10Nobsd/Nobsbl−1
という式により計算するステップと、を含む方法を提供する。
【0010】
本発明に係る方法の1つの好ましい態様においては、該方法は、
【数1】
により、EMPAIの値に基づいてタンパク質含有量(モル%)を算出するステップをさらに含み、ここで、Σ(EMPAI)は、全ての同定されたタンパク質のEMPAI値の総和を表す。
【0011】
本発明に係る方法のもう1つの好ましい態様においては、該方法は、
【数2】
により、EMPAIの値に基づいてタンパク質含有量(重量%)を算出するステップをさらに含み、ここで、Σ(EMPAI)は、全ての同定されたタンパク質についてのEMPAI値の総和であり、MWは、同定された各タンパク質の分子量を表わす。
【0012】
本発明に係る方法のさらなる好ましい態様においては、質量分析法は、液体クロマトグラフィ質量分析法を含む。
【0013】
また、本発明は、生体材料の試料中のタンパク質含有量の定量を行うためのコンピュータプログラム製品であって、(a)質量分析法により定量化すべきタンパク質を同定するステップと;(b)前記タンパク質あたりの検出されたペプチドの数(Nobsd)を測定するステップと;(c)タンパク質あたりの検出されうるペプチドの数(Nobsbl)を算出するステップと;(d) EMPAIを得るために、EMPAI=10Nobsd/Nobsbl−1
という式により計算するステップと、を実行するため、記録媒体上に保存されたコンピュータプログラムを有するコンピュータ読取り可能な記憶媒体を含む、コンピュータプログラム製品を提供する。
【0014】
本発明に係るコンピュータプログラム製品の1つの好ましい態様においては、該プログラムは、
【数3】
により、EMPAIの値に基づいてタンパク質含有量(モル%)を算出するステップをさらに含み、ここで、Σ(EMPAI)は、全ての同定されたタンパク質についてのEMPAI値の総和である。
【0015】
本発明に係るコンピュータプログラム製品のもう1つの好ましい態様においては、該プログラムは、
【数4】
により、EMPAIの値に基づいてタンパク質含有量(重量%)を算出するステップをさらに含み、ここで、Σ(EMPAI)は、全ての同定されたタンパク質についてのEMPAI値の前記総和であり、MWは、同定された各タンパク質の分子量を表わす。
【0016】
本発明に係るコンピュータプログラム製品のさらなる態様においては、製品は、コンピュータにより読取ることのできるコンピュータ読取り可能記録媒体である。
【0017】
さらに、本発明は、生体材料の試料中のタンパク質含有量の定量を行うコンピュータプログラムであって、(a)質量分析法により定量化すべきタンパク質を同定するステップと;(b)前記タンパク質あたりの検出されたペプチドの数(Nobsd)を測定するステップと;(c)タンパク質あたりの検出されうるペプチドの数(Nobsbl)を算出するステップと;(d)EMPAIを得るために、EMPAI=10Nobsd/Nobsbl−1
という式により計算するステップ、を実施するステップを含むプログラムを提供する。
【0018】
本発明に係るコンピュータプログラムの態様においては、該プログラムは、
【数5】
により、EMPAIの値に基づいてタンパク質含有量(モル%)を算出するステップをさらに含み、ここで、Σ(EMPAI)は、全ての同定されたタンパク質についてのEMPAI値の総和である。
【0019】
本発明に係るコンピュータプログラムのもう1つの態様では、該プログラムは、
【数6】
により、EMPAIの値に基づいてタンパク質含有量(重量%)を算出するステップをさらに含み、ここで、Σ(EMPAI)は、全ての同定されたタンパク質についてのEMPAI値の総和であり、MWは、同定された各タンパク質の分子量を表わす。
【0020】
本発明に係るコンピュータプログラムは、このプログラムが本発明によるタンパク質含有量の定量化方法のそれぞれのステップをコンピュータによって実施させることを特徴としている。また、該コンピュータプログラムは、該プログラムが記憶される記憶媒体の形でも提供され得、かつ、インターネットといったような伝送媒体を介して供給され得る。
【0021】
さらに、本発明は、生体材料の試料中のタンパク質含有量の定量を行うための解析用装置であって、質量分析法により得られたタンパク質の質量分析データに関する情報を受信し、質量分析法により定量化すべきタンパク質を同定するための同定手段と;前記タンパク質あたりの検出されたペプチドの数(Nobsd)を測定するための測定手段と;タンパク質あたりの検出されうるペプチドの数(Nobsbl)を算出するための算出手段と;EMPAIを得るために、EMPAI=10Nobsd/Nobsbl−1という式により計算するための計算手段と、を備える解析用装置を提供する。
【0022】
本発明に係る解析用装置の一の態様においては、該計算手段は、
【数7】
により、EMPAIの値に基づいてタンパク質含有量(モル%)を算出するステップをさらに含み、ここで、Σ(EMPAI)は、全ての同定されたタンパク質についてのEMPAI値の総和である。
【0023】
本発明に係る解析用装置の一の態様においては、該計算手段は、
【数8】
によりEMPAIの値に基づいてタンパク質含有量(重量%)を算出するステップをさらに含み、ここで、Σ(EMPAI)は、全ての同定されたタンパク質についてのEMPAI値の総和であり、MWは、同定された各タンパク質の分子量を表わす。
【0024】
本発明に係る解析用装置のさらなる態様においては、質量分析法は、液体クロマトグラフィ質量分析法を含んでいる。
【0025】
本発明の1つの利点は、絶対的タンパク質発現量のための尺度、すなわち指数関数的に修正されたタンパク質発現指標が確立され、これがプロテオミクスにおけるタンパク質含有量の絶対定量のために使用できるという点にある。
【0026】
本発明の上述の目的及び特徴は、添付図面を参考にして好ましい実施形態についての以下の記述からより明らかになることであろう。
【発明を実施するための最良の形態】
【0027】
本発明は、タンパク質含有量の定量を行うための方法及び該方法を実施するためのコンピュータプログラムを含めた実施例を用いて詳細に説明される。
【0028】
図1は、本発明のLC−MSによる上述のEMPAIに基づいたタンパク質含有量の定量を実施するコンピュータのためのハードウェア構造の図面を示す。本発明によるEMPAIに基づくタンパク質含有量の定量を行うための解析用装置10は、全てCPU12とバス24を介して相互接続されている、中央処理ユニット12(以下「CPU」と略される)、メモリー14、表示デバイス16、ユーザーインターフェース18及び通信インターフェース22を備える。装置10は、外部記憶媒体駆動ユニット20に接続されたCD−ROM又は磁気媒体といったような外部記憶装置(図1には例示せず)をさらに備える。装置10は、通信インターフェース22を通してNCBInr(hhtp://www.ncbi.nlm.nh.gov/)などのような外部データベースに接続可能である。また、装置10は、タンパク質の分析を実施する通信インターフェース22を介して質量分析装置にも接続可能である。
【0029】
図2は、本発明によるEMPAIに基づくタンパク質含有量の定量を行うための解析用装置10の構成を説明するのに用いられるブロック図を示す。図2に示されているように、装置10は、IF(インターフェース)手段30と制御手段40を含む。装置10は、これらの手段30,40が、この装置を利用するユーザー及び/又は質量分析法からの質量分析データといった入力を受け、ユーザー及び/又は質量分析法へと情報を出力するような形で構築されている。通常のパーソナルコンピュータを該装置10として使用することができる。質量分析データの例としては、質量スペクトル、質量クロマトグラム及びMSMSデータなどが含まれる。
【0030】
IF手段30は、情報をキーボード、質量分析法などといった入力デバイス及びディスプレイ、プリンタなどといった出力デバイスとの関係において入力及び出力できるような形で構築されている。IF手段30を介して、解析すべき質量分析データは制御手段40へと伝送される。
【0031】
制御手段40は、同定手段42、測定手段44、計算手段46及び計算手段48を備える。本発明においては、同定手段42は、IF手段30を介してタンパク質の質量分析データに関する情報を受信でき、質量分析法により定量されるべきタンパク質を同定する。次に、質量分析データに基づいて、測定手段44は同定手段42により同定された該タンパク質あたりの検出されたペプチドの数(Nobsd)を測定する。一方で、定量化すべきタンパク質の同定に基づいて、算出手段46は、タンパク質あたりの検出されうるペプチドの数を計算する(Nobsbl)。ここで、「タンパク質あたりの検出されたペプチドの数」という用語は、質量分析法によって実際に検出された定量化すべき1タンパク質あたりのペプチド数を意味する。「タンパク質あたりの検出されうるペプチドの数」という用語は、ここでは該タンパク質あたりの理論的ペプチド数を意味する。なお、これらの数は、文書[17]中で定義されている。
【0032】
本発明に係る方法では、Nobsd及びNobsbl値に基づいて、Nobsd及びNobsblに関する情報を受ける計算手段48は、EMPAIを得るために、以下の式によりEMPAIを算出する:
EMPAI=10Nobsd/Nobsbl−1
【0033】
その結果、本発明によれば、タンパク質含有量を決定するために、指数関数的に修正されたタンパク質発現量指標(「EMPAI」)がタンパク質混合物中のタンパク質含有量に対して比例することが立証される。
【0034】
さらに、計算手段48は、以下の2つの式により、タンパク質含有量(モル%)とタンパク質含有量(重量%)を算出する。
【数9】
【数10】
なお、式中、Σ(EMPAI)は全ての同定されたタンパク質についてのEMPAI値の総和であり、MWは同定された各タンパク質の分子量を表わしている。
【0035】
必要に応じて、図2に示されていないメモリー手段内に計算された及び/又は算出されたデータを記憶することができる。
【0036】
図3は、本発明によるEMPAIに基づくタンパク質含有量の定量を行うためのフローチャートを示す。ステップS10では、MS方法により生体材料の試料の質量分析法を実施した後、同定手段42により対象とするタンパク質が同定される。このMS方法には、ペプチドマスフィンガープリント法及びMS/MS方法が含まれる。当業者であれば、以下の文書(その全体が参照により援用されている、Proc.Natl.Acad.Sci.USA.1993年、第90号、5011−5015頁;J.Curr.Biol.1993年、第3号、327−332頁;Biol.Mass.Spectrom.1993年、第22号、338−345頁;Nat Genet.1998年、第20号、46−50頁;J Cell Biol.1998年、第141号、967−977頁;J Cell Biol.2000年、第148号、635−651頁;Nature、2002年、第415号、141−147頁;Nature、2002年、第415号、180−183頁;Curr Opin Cell Biol.2003年、第15号、199−205頁;Curr Opin Chem Biol.2003年、第7号、21−27頁)で開示されていることから容易に理解できる。次のステップS11では、上記で同定されたタンパク質あたりの検出されたペプチドの数は、MSデータを用いることで測定手段44によって測定される。その後、タンパク質あたりの検出されうるペプチドの数は、(ステップS12に示されているように)上記で同定されたタンパク質の構造に基づいて算出手段46により算出される。該タンパク質あたりの検出されたペプチドの測定に先立ちタンパク質あたりの検出されうるペプチドの数を計算することが可能である。
【0037】
図4は、本発明で使用される該タンパク質あたりの検出されうるペプチドの数を算出するためのフローチャートの一の実施例を示す。ステップS121では、質量範囲は、検出されたペプチド及び質量分析計のスキャン範囲を用いることにより決定される。次のステップS122では、各々の検出されたペプチド内の予測された保持時間は、ミーク(Meek)式(文献[23]で記述されている通り)に基づいて算出される。なお、各検出されたペプチドのアミノ酸配列を、例えばMS/MS方法によって決定することができ、ミーク式に従って既知のアミノ酸配列と液体クロマトグラフィ内の保持時間との間には関係が存在するという点に留意されたい。このとき、ステップS123において、予測された保持時間範囲は、上述のミーク式に基づいて検出されたペプチドの保持時間を用いることによって決定される。このとき、トリプシンにより完全消化されたペプチドは、コンピュータ内で算出される(ステップS124中)。より具体的には、トリプシンは、ペプチド結合をタンパク質中のリジン残基及びアルギニン残基のカルボキシル側で選択的に切断可能な有名なプロテアーゼであることから、トリプシンにより完全消化されたペプチドのアミノ酸配列が決定されている。かくして、このステップS124では、トリプシン消化されたペプチドの分子量(MW)及び予測保持時間がコンピュータ内で算出される。次のステップS125では、MW及び予測保持時間に従って検出されうるペプチドが分類される。最後に、ステップS126で、検出されうるペプチドのMW及び予測保持時間が共に質量範囲(S121内)及び保持時間範囲(S123内)内に入ることを基礎として、タンパク質あたりの検出されうるペプチドの数が計数される。
【0038】
なお、本発明においては、図4のフローチャートに従って実施される検出されうるペプチドの数の算出に制限は全くないという点に留意すべきである。
【0039】
タンパク質あたりの検出されたペプチドの数(Nobsd)及びタンパク質あたりの検出されうるペプチドの数(Nobsbl)の数を使用することにより、以下の通り、算出手段48によりEMPAIが算出される(ステップS13中)。
EMPAI=10Nobsd/Nobsbl−1
【0040】
EMPAIの値を用いて、モル及び重量百分率でのタンパク質含有量が以下のように表わされる:
【数11】
【数12】
なお、式中、MWは、同定された各タンパク質の分子量であり、Σ(EMPAI)は、全ての同定されたタンパク質についてのEMPAI値の総和である(ステップ14及び15に示されている通りである。)。
【0041】
以上で説明されている図3中に例示されたタンパク質含有量の解析の流れを実行するプログラムが、外部記憶媒体駆動ユニット20を介して外部記憶装置又はメモリー14内に記憶される、又はプログラムがCD−ROMといったような外部記憶媒体内に記憶されている場合にはCPU12まで直接転送される。
【0042】
なお、本発明による定量に先立ち、該タンパク質は通信インターフェース22を通して、NCBInrデータベースといったような外部データベースを参照することにより同定されることに留意すべきである。必要に応じて、表示デバイス16はユーザーインターフェース18を介して本発明による定量の結果を表示する。
【0043】
このようにして、本発明は、EMPAIに基づいてタンパク質含有量の定量を行うための方法及びこの方法を実施するためのコンピュータプログラムを提供する。
【0044】
以下では、本発明の態様による典型的実施例に関して記するが、本発明の範囲はこれらに制限されるようには意図されていない。
【実施例】
【0045】
材料及び方法
細胞溶解物の調製
オング(Ong)ら[文献4]のSILACプロトコルに従って、13C6−Leu(ケンブリッジ・アイソトープ・ラボラトリーズ(Cambridge Isotope Laboratories)、Andover、マサチューセッツ州)を含有するRPMI−1640培地(ギブコ(Gibco)BRL、Grand Island、ニューヨーク州)を調製した。この培地内での13C6−Leu標識のため、マウス神経芽細胞腫neuro2a細胞を培養した。プロテアーゼ阻害物質カクテル(ロシュ・ダイアグノスティックス(Roche Diagnostics)、Basel、スイス)を添加し、超音波処理を用いて全タンパク質を溶解させた。説明されている通り[文献10]、正常なRPMI1640培地の中でHCT116−C9細胞を成長させた。プロテアーゼ阻害物質と5mMのジチオトレイトールを含む5mLのM−PER(ピアース(Pierce)、Rockford、イリノイ州、米国)で全タンパク質を抽出した。
【0046】
LCMSMSのためのペプチド混合物の調製
細胞からのタンパク質を吸引乾燥させ、8Mの尿素を含有する50mMのトリス−HCl緩衝液(pH9.0)により再懸濁させた。これらの混合物を説明されている通り[文献6]、その後減量させ、アルキル化させ、Lys−C(和光(Wako)、大阪、日本)及びトリプシン(プロメガ(Promega)、Madison、ウィスコンシン州、米国))により消化させた。消化された溶液をTFAで酸性化させ、脱塩し、Empore C18ディスク(3M、ミネソタ州、米国)で完全自動計器(日京テクノス(Nikkyo Technos)、東京、日本)により調製されたC18−ステージ Tips[文献21]で濃縮させた。少なくとも1つのロイシン及び1つのチロシンを含有するペプチド合成用候補を、neuro 2a細胞中で発現されるタンパク質からのトリプシンペプチドの配列を考慮に入れて選択した。試料調製中の酸化の問題を回避するため、メチオニン及びトリプトファンを含有するペプチドを除去した。さらに、トリプシンによる頻繁な切断ミスを考慮して、二重塩基性残基を伴うペプチドを除去した。選択された54のペプチドは、F−moc化学で島津(Shimadzu)PSSM−8(京都、日本)を用いて合成し、分取HPLCで精製させた。純度及び構造解明のためにアミノ酸分析、ペプチド質量測定及びHPLC−UVを実施した。neuro 2a細胞からのペプチド混合物に対し異なる量のこれらのペプチドを添加し、上述のとおりのステージ Tipにより精製した。
【0047】
ナノLC−MS/MS分析
QSTARパルサーI(ABI/MDS−シーエックス(Sciex)、Toronto、カナダ)又はShimadzu LC10勾配ポンプを備えたFinnigan LCQ Advantage(サーモエレクトロン(Thermoelectron)、San Jose、カリフォルニア州、米国)、及び150μmの流路系を有するValco C2バルブを取付けるHTC−PALオートサンプラー(CTCアナリティックス(Analytics)AG、Zwingen、スイス)を用いて、ナノLC−MS/MSによって全ての試料を分析した。「Stone arch」フリットで分析カラム用針を調製するべく、窒素加圧型カラムローダーセル(日京)を伴う自動引抜き針(内径100μm、開口6μm、長さ150mm)の中に、Repro Sil C18材料(3μm、マイシュ博士(Dr.Maisch)、Ammerbuch、ドイツ)を詰め込んだ[文献22]。Proxeon x−y−zナノスプレーインターフェース(Odense、デンマーク))上にテフロンコーティングの施されたカラムホルダー(日京)を取付け、カラム針を保持しかつ適切なスプレー位置を調整するために磁石付きのValco金属コネクタを使用した。注射体積は3μLであり、流量はティースプリッタの後250nL/分であった。移動相は、(A)0.5%の酢酸及び(B)0.5%の酢酸及び80%のアセトニトリルで構成されていた。この研究を通して、5分で5%B〜10%、60分で10%〜30%、5分で30%〜100%、そして10分で100%という3段階線形勾配を利用した。説明されている通り[文献22]、金属コネクタを介して2400Vのスプレー電圧を印加した。より速い走査モードを伴うQSTARについては、3つの強いピークを選択するために1秒間MS走査を実施し、各々0.55秒間ずつ、後続する3回のMSMS走査を実施した。以前に走査された親イオンを排除するため、情報依存性捕捉(IDA)機能が3分間活動状態にあった。より低速の走査モードについては、1回のMS走査(1秒)あたり4回のMSMS走査(各1.5秒)が実施された。LCQについては、1回のMS走査につき2回のMSMS走査がAGCモードで実施された。平均走査サイクルはそれぞれ、1回のMSについて1.19秒、1回のMSMSについては1.17秒であった。走査範囲は、QSTAR及びLCQの両方についてm/z300−1400であった。
【0048】
DATA分析
LCQ及びQSTARの両方の生データファイルから全てのピークを抽出するために、特注のSpiceと呼ばれるソフトウェア(三井情報開発(Mitsui Knowledge Industry)、東京、日本)を使用し、結果のピークファイルを、Swiss−Protタンパク質データベースに対するタンパク質同定のためにMascot verl.9データベースサーチエンジン(その全体が本明細書に参照により援用されているマトリックスサイエンス(Matrix Sciences)、London、英国;D.M.パーキンス(Perkins)、D.J.パピン(Pappin)、D.M.クリーシー(Creasy)、J.S.コットレル(Cottrell)、Electrophoresis第20号(1999年)、3551頁)に提出した。許容できる不完全消化部位の数は1に設定され、同一性を標示するためのペプチドスコアが、MSMSスペクトルの手作業検査無しでペプチド同定のために使用された。http://msquant.sourceforge.net/からMSQuant ver1.4aをダウンロードし、合成ペプチドの既知の量を用いてタンパク質の絶対濃度についてクロマトグラム中のイオン計数を判定する目的で13C6Leu SILACについてそれをカスタマイズした。
【0049】
タンパク質発現量の決定
タンパク質あたりの検出されうるペプチド数を算出するため、タンパク質をコンピュータ内で消化させ、得られたペプチドを質量分析計の測定走査範囲と比較した。さらに、発明者らのナノLC条件下での保持時間は、約3000個のペプチドに基づいて発明者ら独自の係数でミーク[文献23]及びサカモトら[文献24]による手順に従って算出し、過度の親水性又は疎水性をもつペプチドは除去した。ペプチド数を算出するために以下の等式(1)〜(4)に基づいた組織内PHPプログラムを書き、これを用いてMicrosoft Excelに全てのデータを送り出した。タンパク質あたりの検出されたペプチド数に関しては、(1)ユニーク親イオンを計数すること、(2)ユニーク配列を計数すること及び(3)不完全消化によって引き起こされる部分的修正及び重複無くユニーク配列を計数すること、といったような3つの計数方法を利用した。MSQuantの「全ペプチドのエクスポート(Export All Peptides)」機能を用いてMascot htmlファイルからExcelスプレッドシートまでこれらの数を送り出した。
【0050】
PAIが、式中Nobsd及びNobsblがそれぞれタンパク質あたりの検出されたペプチド数及びタンパク質あたりの検出されうるペプチド数であるものとして
【数13】
として定義される[文献17]。次いで、EMPAIが、
EMPAI=10PAI−1 (2)
として定義される。
【0051】
かくして、モル及び重量百分率でのタンパク質含有量は、
【数14】
(3)
【数15】
として記述され、ここで、MWは、同定された各タンパク質の分子量であり、ΣEMPAIは全ての同定されたタンパク質についてのEMPAI値の総和である。
【0052】
DNAマイクロアレイ分析
10mLの培地を有する直径10cmの皿の中で1皿あたり5.0×106細胞の割合で、HCT116−C9細胞を平板固定した。24時間のプレインキュベーションの後、細胞を0.015%のDMSOで12時間処理した。確立されたプロトコルに従って、Affymetrix HuGene FLアレイを用いてデュプリケート実験を実施した。遺伝子シグナル強度を抽出するためにAffymetrix GeneChipソウトウェアを用い、遺伝子記号に基づいて2つのデータセットを分類し平均をとった。
【0053】
異なる濃度を有する単一のタンパク質からの同定されたタンパク質の数
ナノLC−ESI−MS/MSにより異なる量のヒト血清アルブミン(HSA)トリプシンペプチドを分析し、同定されたペプチドの数を計数した。図5Aに示されているように、ピーク面積及び同定されたペプチド数の両方共が、注入量の増加につれて増大したが、より高いHSA濃度で両方の曲線共飽和した。しかしながら、ピーク面積が線形である領域においてさえ、ペプチド数はタンパク質量に対し線形関係をもたない。興味深いことに、ペプチド数は、3fmol〜500fmolの注入量の対数に対し線形関係を示す(図5B)。より低速の走査を伴うLCQから同じデータを得た。このことは、すなわち、各ピークが時間的に充分分離しており、より低速の走査により引き起こされる「ランダムサンプリング」の影響がこの条件下で起こらなかったということを意味している。この場合、ペプチドを計数するために、3つの方法、すなわち(1)同じペプチド配列からの異なる電荷状態を含む全ての親イオン、(2)メチオニン酸化といったような部分的修正、異なる電荷状態を除く全てのペプチド、(3)不完全消化により重複したペプチドを除く冗長性のない配列を伴うペプチド、が用いられた。これらのうち、異なる親イオン数に基づくペプチド数は、タンパク質発現量の対数に対して最高の相関関係を提供する。結果は特定の条件の下でのものではなくより一般的な現象であると考えられている。最近、2つの独立したグループがペプチド数とタンパク質濃度との間の類似した曲線を提示した。その両方共がタンパク質の対数を分析していなかったが、発明者の結果によれば、それらのデータからも同様にタンパク質濃度の対数とペプチド数との間の線形関係が観察された。タンパク質濃度の対数が何故消化されたペプチド数と相関関係を有するかは明らかでないが、それは化学ポテンシャルが濃度対数と比例し、ペプチドのイオン化に必要なエネルギーが化学ポテンシャルの増大に伴って線形的に増大するという事実により説明されるであろう。
【0054】
複合度の高い混合物溶液中の47のタンパク質のPAI
次に、本発明者は、全細胞溶解物中で量が既知である54のタンパク質について調査した。13C6−Leuで標識されたマウス神経芽細胞腫neuro 2a細胞からのトリプシンペプチドを、QSTARを用いて実行された単一のLC−MS/MSによって測定し、336のタンパク質を1462個のペプチドに基づいて同定した。本発明者は、12C6−Leuを含有する54の合成ペプチドをこの試料溶液に添加し、13C6−Leuを含有する対応するトリプシンペプチドを定量した。抽出されたイオンクロマトグラム(XIC)内で重複したピークを提供したことから、7個のペプチドは定量されなかった。その結果、分子量で13K−229KDaの47個のタンパク質が、表1A及び1Bに列挙されている通り試料溶液中30fmol〜1.8pmol/μLの範囲内で定量された。
【0055】
【表1A】
【0056】
【表1B】
【0057】
この場合、2つの付加的な因子を考慮に入れるべきである。1つはペプチド数に対するタンパク質のサイズの影響である。一般にタンパク質が大きくなればなるほどより多くの検出可能なペプチドが生成される。したがって、保持時間に関する付加的な基準を除いて前述のとおりに、正規化のために検出されうるペプチドを使用した。この場合、多大な数のペプチドが試料中に存在していた。よって、検出されたペプチドの数は或る程度、イオン化抑制効果並びにMSMS事象についてのランダム選択により影響されることになると思われた。図6Aは、異なるタンパク質が1つのグラフにプロットされた場合でさえ、タンパク質あたりの検出されうるペプチド数によって正規化された検出されたペプチドの数とlog[タンパク質]との間には同様に線形関係が存在するということを示している。Mascotスコア及びペプチド数といったようなその他のパラメータは、タンパク質発現量と充分な相関関係をもたず、ペプチド数をタンパク質の分子量で除したものは、図6B−Dに示されているように、タンパク質含有量の対数に対する適度な相関関係を提供している。
【0058】
この場合、本発明者は、バックグラウンドの影響を最小限におさえるためQSTARの最高のMSMS走査速度を使用した。より低い走査速度が使用された場合、相関関係は低減させられた(r=0.90から0.81へ)。例えば、図7Aを参照してみる。この効果は、イオントラップ計器が使用された場合により顕著であった(r=0.77)。これは、トラップ能力の量の制限がより発現量が多いタンパク質についてのより偏向したピーク選択を引き起こすことに起因すると思われ、実際図7Bにおいてタンパク質発現量が多くなればより大きな偏差がみられた。走査がさらに速くより能力の高い線形イオントラップの最近の開発が、より高速の走査モードを伴うQSTARに対して類似の結果を提供することになると思われる。
【0059】
さらに、試料の複合性の影響は、LC/LC−MS/MS[文献25]及びGeL CMS(ゲル増強LC−MS、1D−ゲルとそれに続くスライシング、消化及びLCMC分析)アプローチ[文献15]といったようなMSMS分析に先立ち、多次元分離を用いることによって最小限になると思われる。
【0060】
EMPAI計算の実施例
EMPAI値を算出するための全プロトコルは以下の通りである:
(1) LC−MS/MS分析を実施する;
(2) Mascotといったようなサーチエンジンを用いてタンパク質を同定する;
(3) タンパク質あたりのユニーク親イオン数を抽出する;
(4) タンパク質あたりの検出されうるペプチドの数を計数する;及び
(5) (3)及び(4)を用いてEMPAI値を算出する。
【0061】
以下に記すのは、表2中の1つの標準的な実施例を使用することによるEMPAI算出の実施例である。
【0062】
【表2】
【0063】
(3) 検出されたユニーク親イオンの抽出;
上述のプロトコル(1)及び(2)に従って、検出されたユニーク親イオンの抽出を実施した。上述の抽出の結果は、表3中で集計されている。Mascotスコアの結果に基づいて、表3中の「諾否(Accept or not)」の欄では、「Yes(はい)」という語は抽出が実施されることを意味し、「No(いいえ)」という語は検出された親イオンが、小さなMascotスコアに起因して抽出されなかったことを意味している。
【0064】
【表3】
【0065】
(4) タンパク質あたりの検出されうるペプチド数の計数
図4で上述した通り、この算出は以下のステップ1〜6に従って実施された。
【0066】
ステップ1(図4中のS121を参照のこと): 検出されたペプチド及び質量分析の走査範囲を用いた質量範囲の決定。このステップは、ペプチドの実際の観察された質量分析法、すなわち検出されたペプチド及び質量分析の走査範囲を使用することによって実施された。
【0067】
ステップ2(図4中のS122を参照のこと): ミークの式に基づく各々の検出されたペプチドの中の予測された保持時間の算出;図4のS122で説明されているように、各々の検出されたペプチドのアミノ酸配列は一般にMS/MS方法により決定可能であることがわかっているため、検出されたペプチドの保持時間を、既知のアミノ酸配列と保持時間との間の関係が存在するミークの式に従って算出することができた。
【0068】
ステップ3(図4中のS123を参照のこと): 検出されたペプチドを用いた保持時間範囲の決定;同様に、このステップはミークの式を使用して実施された。
【0069】
ステップ4(図4中のS124を参照のこと): コンピュータ内でのトリプシンにより完全消化されたペプチドの算出;図4のS124中で記されているように、トリプシン消化されたペプチドの分子量(MW)及び予測保持時間は、コンピュータ内でトリプシン判定された消化されたペプチドのアミノ酸配列から算出可能であった。
【0070】
ステップ5(図4中のS125を参照のこと): 検出されうるペプチドは、S124の結果を使用してMW及び予測保持時間に従って選別された。
【0071】
ステップ6(図4中のS126を参照のこと): タンパク質あたりの検出されうるペプチドの数は、検出されうるペプチドのMW及び予測保持時間が共に質量範囲(ステップ121)及び予測保持時間(ステップ123)内に入ることを基礎として計数された。
【0072】
表2中の試料を用いた結果に従って、表4にあるように、質量範囲及び保持時間範囲を決定した。
【0073】
【表4】
【0074】
上述の計数の結果は表4に集計されている。コンピュータ内での検出されうるペプチドの算出の結果に基づいて、表2中の「諾否」の欄では、「はい」という語は、検出されうるペプチドが質量範囲及び保持時間範囲の両方に入ることを意味し、「いいえ」という語は、検出されうるペプチドが質量範囲又は保持時間範囲のいずれかの外にあることを意味する。
【0075】
(5) (3)及び(4)を用いたEMPAI値の算出
以上の式(1)及び(2)に従って、上述の(3)及び(4)の結果を使用することによってEMPAIを算出した。EMPAIの結果は、表5に集計されている。表5から明らかなように、表2中の試料を用いたEMPAIの値は8.345であった。
【0076】
【表5】
【0077】
EMPAIを用いた絶対定量
PAIはタンパク質間の発現量関係を推定することができるものの、モル分率を直接表現することはできない。したがって、本発明者は、式(2)としてタンパク質発現量の決定のセクションで説明した通り、図8は示されているようなタンパク質含有量に正比例する新しいパラメータEMPAIをPAIから導出した。絶対濃度を算出するために、BCA検定により重量単位で合計タンパク質量を測定し、336のneuro2aタンパク質の中の47のタンパク質の重量分率を、式(4)を用いて算出した。図9に示されているように、EMPAIベースの濃度は、実際値(y=0.97x、r=0.93)ときわめて一貫性をもつものであり、実際値に対する偏差百分率は3%〜260%の範囲にあり、平均は63%であった。本発明者は合計タンパク質量についてBCA検定を使用したことから、これらの値は容易に変更された。にもかかわらず、このEMPAIアプローチは、包括的絶対定量のためのきわめて正確な指標を提供する。
【0078】
包括的タンパク質発現分析に対する適用
PAIは、ただ1回のLCMSMSの実行からタンパク質発現データを生成するのに実に便利である。本発明者は、HCT116ヒト癌細胞中の遺伝子発現とそれを比較するためにこのアプローチを適用する。DNAマイクロアレイは4971個の遺伝子の発現データを提供し、一方、単一回のLCMS実行はユニーク配列をもつ1811のペプチドに基づき402個の同定されたタンパク質を提供した。遺伝子記号とタンパク質登録番号を橋かけすることで、発現比較研究のために利用される合計227の遺伝子/タンパク質が結果としてもたらされた。予測通り、酵母についての以前の研究から予想されるようなわずかな相関関係が観察された[文献18,26]。興味深いことに、外れ値の大部分がリポソームタンパク質であった(図10参照)。E.coli(大腸菌)といったような原核生物とは異なり、哺乳動物細胞が転写によってのみならずmRNAの輸送、翻訳及びrRNAと未会合の過剰量のタンパク質の分解によってもリポソームタンパク質の発現レベルを調節できるということは周知である[文献27,28]。また、本発明者は、E.coliについて、EMPAIを用いて遺伝子とタンパク質発現との間の比較研究を行なったが、リポソームタンパク質のこのような偏差を発見しなかった[文献29]。遺伝子及びタンパク質の発現データに両方共、例えば10%の差を弁別するほどに正確ではないが、それは以上で示されたような簡単な概要を得るためにはきわめて有用である。
【産業上の利用可能性】
【0079】
産業上の利用可能性
本発明によれば、EMPAIと命名された絶対タンパク質発現量のための尺度が確立される。EMPAIは、Mascotといったようなデータベースサーチエンジンの出力情報から容易に算出されることから、いかなる付加的なステップも無く定量的情報を追加するために、以前に測定された又は公表されたデータセットにこのアプローチを適用することが可能である。また、EMPAIは、特に比率の正確な測定には定量的変化が大きすぎること、代謝標識が不可能であること、又は感受性の制約のため化学的標識技術が許容されないことを理由として同位元素ベースのアプローチを適用できない場合において、相対的定量のためにも使用可能である。このような場合には、1つの試料中のタンパク質のEMPAI値は、もう1つの試料中のものと比較でき、2つの試料間のEMPAI相関関係からの外れ値を、増大する又は減少するタンパク質として判定することができる。
【0080】
このEMPAIアプローチは、1つのタンパク質から同定されるペプチド数を増やすために多次元分離−MSMSに適用され得る。m/z領域に対するイオン化依存性といったようなMS計器依存性パラメータを考慮するために、さらなる改善も可能であると思われる。EMPAI指標は単純なスクリプトで算出できタンパク質同定実験におけるさらなる実験を必要としないことから、発明者らはプロテオミクス結果の報告におけるその日常的使用を提案する。
【0081】
参考文献
本書に引用されている以下の参考文献は、その全体が本明細書に参照により援用されている。
[1] R. Aebersold, M. Mann, Nature 422 (2003) 198.
[2] Y. Oda, K. Huang, F.R. Cross, D. Cowburn, B.T. Chait, Proc Natl Acad Sci U S A 96 (1999) 6591.
[3] S.P. Gygi, B. Rist, S.A. Gerber, F. Turecek, M.H. Gelb, R. Aebersold, Nat Biotechnol 17 (1999) 994.
[4] S.E. Ong, B. Blagoev, I. Kratchmarova, D.B. Kristensen, H. Steen, A. Pand ey, M. Mann, Mol Cell Proteomics 1 (2002) 376.
[5] M.J. MacCoss, C.C. Wu, H. Liu, R. Sadygov, J.R. Yates, 3rd, Anal Chem 75 (2003) 6912.
[6] L.J. Foster, C.L. De Hoog, M. Mann, Proc Natl Acad Sci U S A 100 (2003) 5 813.
[7] B. Blagoev, I. Kratchmarova, S.E. Ong, M. Nielsen, L.J. Foster, M. Mann, Nat Biotechnol 21 (2003) 315.
[8] J.A. Ranish, E.C. Yi, D.M. Leslie, S.O. Purvine, D.R. Goodlett, J. Eng, R . Aebersold, Nat Genet 33 (2003) 349.
[9] W.X. Schulze, M. Mann, J Biol Chem 279 (2004) 10756.
[10] Y. Oda, T. Owa, T. Sato, B. Boucher, S. Daniels, H. Yamanaka, Y. Shinohar a, A. Yokoi, J. Kuromitsu, T. Nagasu, Anal Chem 75 (2003) 2159.
[11] J.R. Barr, V.L. Maggio, D.G. Patterson, Jr., G.R. Cooper, L.O. Henderson, W.E. Turner, S.J. Smith, W.H. Hannon, L.L. Needham, E.J. Sampson, Clin Ch em 42 (1996) 1676.
[12] S.A. Gerber, J. Rush, O. Stemman, M.W. Kirschner, S.P. Gygi, Proc Natl Ac ad Sci U S A 100 (2003) 6940.
[13] J. Havlis, A. Shevchenko, Anal Chem 76 (2004) 3029.
[14] R.W. Corbin, O. Paliy, F. Yang, J. Shabanowitz, M. Platt, C.E. Lyons, Jr. , K. Root, J. McAuliffe, M.I. Jordan, S. Kustu, E. Soupene, D.F. Hunt, Pro c Natl Acad Sci U S A 100 (2003) 9232.
[15] E. Lasonder, Y. Ishihama, J.S. Andersen, A.M. Vermunt, A. Pain, R.W. Saue rwein, W.M. Eling, N. Hall, A.P. Waters, H.G. Stunnenberg, M. Mann, Nature 419 (2002) 537.
[16] Y. Shen, R. Zhao, S.J. Berger, G.A. Anderson, N. Rodriguez, R.D. Smith, A nal Chem 74 (2002) 4235.
[17] J. Rappsilber, U. Ryder, A.I. Lamond, M. Mann, Genome Res 12 (2002) 1231.[18] H. Liu, R.G. Sadygov, J.R. Yates, Anal Chem (2004) 76, 4193-4201.
[19] J. Rappsilber, Y. Ishihama, G. Mittler, P. Mortensen, L. Foster, M. Mann, in Proceedings of 51st ASMS Conference on Mass Spectrometry, Montreal, Ca nada, 2003.
[20] J.S. Andersen, C.J. Wilkinson, T. Mayor, P. Mortensen, E.A. Nigg, M. Mann , Nature 426 (2003) 570.
[21] J. Rappsilber, Y. Ishihama, M. Mann, Anal Chem 75 (2003) 663.
[22] Y. Ishihama, J. Rappsilber, J.S. Andersen, M. Mann, J Chromatogr A 979 (2 002) 233.
[23] J.L. Meek, Proc Natl Acad Sci U S A 77 (1980) 1632.
[24] Y. Sakamoto, N. Kawakami, T. Sasagawa, J Chromatogr 442 (1988) 69.
[25] A.J. Link, J. Eng, D.M. Schieltz, E. Carmack, G.J. Mize, D.R. Morris, B.M . Garvik, J.R. Yates, 3rd, Nat Biotechnol 17 (1999) 676.
[26] S.P. Gygi, Y. Rochon, B.R. Franza, R. Aebersold, Mol Cell Biol 19 (1999) 1720.
[27] K. Tsurugi, Seikagaku 61 (1989) 271.
[28] W.H. Mager, Biochim Biophys Acta 949 (1988) 1.
[29] Y. Ishihama, D. Frishman, M. Mann, Unpublished data.
【図面の簡単な説明】
【0082】
本発明の目的及び特徴が、添付図面を参照するとともに、好ましい実施形態の説明から明らかである。
【図1】本発明による前記EMPAIに基づいてタンパク質含有量の定量を行うコンピュータのハードウェア構造の図面を示す。
【図2】本発明によるEMPAIに基づいてタンパク質含有量の定量を行うための解析用装置の構成を例示するためのブロック図を示す。
【図3】本発明によるEMPAIに基づいてタンパク質含有量の定量を行うためのフローチャートを示す。
【図4】タンパク質あたりの検出されうるペプチドの数を計算するためのフローチャートの一の実施例を示す。
【図5】ヒト血清アルブミン(HSA)の注入量に対するペプチド数及びピーク面積の依存性を例示している。図5Aは、ピーク面積及びペプチドのユニーク親イオン数対(HSA)の注入量の関係を示す。図5Bは、3つの異なるペプチド数とHSA注入量の関係を示す。
【図6】neuro2a細胞中の47個のタンパク質についての異なるパラメータとタンパク質濃度の関係を示す。図6Aは、タンパク質濃度とPAIの関係を示す。図6Bは、タンパク質濃度とペプチド数をタンパク質分子量で除したものの関係を示す。図6Cは、タンパク質濃度とMascotスコアの関係を示す。図6Dは、タンパク質濃度と検出されたペプチド(ユニーク親イオン)の数の関係を示す。
【図7】PAIとlog[タンパク質]との間の線形関係に対するMS測定条件の影響を示す。図7Aは、より低速の走査を伴う飛行時間型の質量分析法(QSTAR)を示す。図7Bは、より低速の走査を伴うイオントラップ型の質量分析法(LCQ)を示す。
【図8】neuro2a細胞中の47のタンパク質についてのタンパク質濃度とEMPAIとの間の関係を示す。
【図9】本発明によるEMPAIを用いたneuro2a中の47のタンパク質の絶対定量の結果を示す。
【図10】本発明の一の実施形態によるHCT116細胞中の遺伝子とタンパク質発現との間の比較を示す。
【特許請求の範囲】
【請求項1】
生体材料の試料中のタンパク質含有量の定量を行うための方法であって、
(a)質量分析法により定量化すべきタンパク質を同定するステップと;
(b)前記タンパク質あたりの検出されたペプチドの数(Nobsd)を測定するステップと;
(c)タンパク質あたりの検出されうるペプチドの数(Nobsbl)を算出するステップと;
(d)EMPAIを得るために、
EMPAI=10Nobsd/Nobsbl−1
という式により計算するステップと、
を含む方法。
【請求項2】
【数1】
により、EMPAIの値に基づいてタンパク質含有量(モル%)を算出するステップをさらに含み、ここで、Σ(EMPAI)は、全ての同定されたタンパク質についてのEMPAI値の総和である、請求項1に記載の方法。
【請求項3】
【数2】
により、EMPAIの値に基づいてタンパク質含有量(重量%)を算出するステップをさらに含み、ここで、Σ(EMPAI)は、全ての同定されたタンパク質についてのEMPAI値の総和であり、MWは、同定された各タンパク質の分子量を表わす、請求項1に記載の方法。
【請求項4】
前記質量分析法が、液体クロマトグラフィ質量分析法を含む、請求項1〜3のいずれか一項に記載の方法。
【請求項5】
生体材料の試料中のタンパク質含有量の定量を行うためのコンピュータプログラム製品であって、
(a)質量分析法により定量化すべきタンパク質を同定するステップと;
(b)前記タンパク質あたりの検出されたペプチドの数(Nobsd)を測定するステップと;
(c)タンパク質あたりの検出されうるペプチドの数(Nobsbl)を算出するステップと;
(d)EMPAIを得るために、
EMPAI=10Nobsd/Nobsbl−1
という式により計算するステップと、
を実行するため、記録媒体上に保存されたコンピュータプログラムを有するコンピュータ読取り可能な記憶媒体を含む、コンピュータプログラム製品。
【請求項6】
【数3】
により、EMPAIの値に基づいてタンパク質含有量(モル%)を算出するステップをさらに含み、ここで、Σ(EMPAI)は、全ての同定されたタンパク質についてのEMPAI値の総和である、請求項5に記載のコンピュータプログラム製品。
【請求項7】
【数4】
により、EMPAIの値に基づいてタンパク質含有量(重量%)を算出するステップをさらに含み、ここで、Σ(EMPAI)は、全ての同定されたタンパク質についてのEMPAI値の前記総和であり、MWは、同定された各タンパク質の分子量を表わす、請求項5に記載のコンピュータプログラム製品。
【請求項8】
前記製品が、コンピュータにより読取ることのできるコンピュータ読取り可能記録媒体である、請求項5〜8のいずれか一項に記載のコンピュータプログラム製品。
【請求項9】
生体材料の試料中のタンパク質含有量の定量を行うコンピュータプログラムであって、
(a)質量分析法により定量化すべきタンパク質を同定するステップと;
(b)前記タンパク質あたりの検出されたペプチドの数(Nobsd)を測定するステップと;
(c)タンパク質あたりの検出されうるペプチドの数(Nobsbl)を算出するステップと;
(d)EMPAIを得るために、
EMPAI=10Nobsd/Nobsbl−1
という式により計算するステップ、
を実施するステップを含むプログラム。
【請求項10】
【数5】
により、EMPAIの値に基づいてタンパク質含有量(モル%)を算出するステップをさらに含み、ここで、Σ(EMPAI)は、全ての同定されたタンパク質についてのEMPAI値の総和である、請求項9に記載のプログラム。
【請求項11】
【数6】
により、EMPAIの値に基づいてタンパク質含有量(重量%)を算出するステップをさらに含み、ここで、Σ(EMPAI)は、全ての同定されたタンパク質についてのEMPAI値の総和であり、MWは、同定された各タンパク質の分子量を表わす、請求項9に記載のプログラム。
【請求項12】
生体材料の試料中のタンパク質含有量の定量を行うための解析用装置であって、
質量分析法により得られたタンパク質の質量分析データに関する情報を受信し、質量分析法により定量化すべきタンパク質を同定するための同定手段と;
前記タンパク質あたりの検出されたペプチドの数(Nobsd)を測定するための測定手段と;
タンパク質あたりの検出されうるペプチドの数(Nobsbl)を算出するための算出手段と;
EMPAIを得るために、
EMPAI=10Nobsd/Nobsbl−1
という式により計算するための計算手段と、
を備える解析用装置。
【請求項13】
【数7】
により、EMPAIの値に基づいてタンパク質含有量(モル%)を算出するステップをさらに含み、ここで、Σ(EMPAI)は、全ての同定済みタンパク質についてのEMPAI値の総和である、請求項12に記載の装置。
【請求項14】
【数8】
によりEMPAIの値に基づいてタンパク質含有量(重量%)を算出するステップをさらに含み、ここで、Σ(EMPAI)は、全ての同定済みタンパク質についてのEMPAI値の総和であり、MWは、同定された各タンパク質の分子量を表わす、請求項12に記載の装置。
【請求項15】
前記質量分析法が、液体クロマトグラフィ質量分析法を含む、請求項12〜14のいずれか一項に記載の装置。
【請求項1】
生体材料の試料中のタンパク質含有量の定量を行うための方法であって、
(a)質量分析法により定量化すべきタンパク質を同定するステップと;
(b)前記タンパク質あたりの検出されたペプチドの数(Nobsd)を測定するステップと;
(c)タンパク質あたりの検出されうるペプチドの数(Nobsbl)を算出するステップと;
(d)EMPAIを得るために、
EMPAI=10Nobsd/Nobsbl−1
という式により計算するステップと、
を含む方法。
【請求項2】
【数1】
により、EMPAIの値に基づいてタンパク質含有量(モル%)を算出するステップをさらに含み、ここで、Σ(EMPAI)は、全ての同定されたタンパク質についてのEMPAI値の総和である、請求項1に記載の方法。
【請求項3】
【数2】
により、EMPAIの値に基づいてタンパク質含有量(重量%)を算出するステップをさらに含み、ここで、Σ(EMPAI)は、全ての同定されたタンパク質についてのEMPAI値の総和であり、MWは、同定された各タンパク質の分子量を表わす、請求項1に記載の方法。
【請求項4】
前記質量分析法が、液体クロマトグラフィ質量分析法を含む、請求項1〜3のいずれか一項に記載の方法。
【請求項5】
生体材料の試料中のタンパク質含有量の定量を行うためのコンピュータプログラム製品であって、
(a)質量分析法により定量化すべきタンパク質を同定するステップと;
(b)前記タンパク質あたりの検出されたペプチドの数(Nobsd)を測定するステップと;
(c)タンパク質あたりの検出されうるペプチドの数(Nobsbl)を算出するステップと;
(d)EMPAIを得るために、
EMPAI=10Nobsd/Nobsbl−1
という式により計算するステップと、
を実行するため、記録媒体上に保存されたコンピュータプログラムを有するコンピュータ読取り可能な記憶媒体を含む、コンピュータプログラム製品。
【請求項6】
【数3】
により、EMPAIの値に基づいてタンパク質含有量(モル%)を算出するステップをさらに含み、ここで、Σ(EMPAI)は、全ての同定されたタンパク質についてのEMPAI値の総和である、請求項5に記載のコンピュータプログラム製品。
【請求項7】
【数4】
により、EMPAIの値に基づいてタンパク質含有量(重量%)を算出するステップをさらに含み、ここで、Σ(EMPAI)は、全ての同定されたタンパク質についてのEMPAI値の前記総和であり、MWは、同定された各タンパク質の分子量を表わす、請求項5に記載のコンピュータプログラム製品。
【請求項8】
前記製品が、コンピュータにより読取ることのできるコンピュータ読取り可能記録媒体である、請求項5〜8のいずれか一項に記載のコンピュータプログラム製品。
【請求項9】
生体材料の試料中のタンパク質含有量の定量を行うコンピュータプログラムであって、
(a)質量分析法により定量化すべきタンパク質を同定するステップと;
(b)前記タンパク質あたりの検出されたペプチドの数(Nobsd)を測定するステップと;
(c)タンパク質あたりの検出されうるペプチドの数(Nobsbl)を算出するステップと;
(d)EMPAIを得るために、
EMPAI=10Nobsd/Nobsbl−1
という式により計算するステップ、
を実施するステップを含むプログラム。
【請求項10】
【数5】
により、EMPAIの値に基づいてタンパク質含有量(モル%)を算出するステップをさらに含み、ここで、Σ(EMPAI)は、全ての同定されたタンパク質についてのEMPAI値の総和である、請求項9に記載のプログラム。
【請求項11】
【数6】
により、EMPAIの値に基づいてタンパク質含有量(重量%)を算出するステップをさらに含み、ここで、Σ(EMPAI)は、全ての同定されたタンパク質についてのEMPAI値の総和であり、MWは、同定された各タンパク質の分子量を表わす、請求項9に記載のプログラム。
【請求項12】
生体材料の試料中のタンパク質含有量の定量を行うための解析用装置であって、
質量分析法により得られたタンパク質の質量分析データに関する情報を受信し、質量分析法により定量化すべきタンパク質を同定するための同定手段と;
前記タンパク質あたりの検出されたペプチドの数(Nobsd)を測定するための測定手段と;
タンパク質あたりの検出されうるペプチドの数(Nobsbl)を算出するための算出手段と;
EMPAIを得るために、
EMPAI=10Nobsd/Nobsbl−1
という式により計算するための計算手段と、
を備える解析用装置。
【請求項13】
【数7】
により、EMPAIの値に基づいてタンパク質含有量(モル%)を算出するステップをさらに含み、ここで、Σ(EMPAI)は、全ての同定済みタンパク質についてのEMPAI値の総和である、請求項12に記載の装置。
【請求項14】
【数8】
によりEMPAIの値に基づいてタンパク質含有量(重量%)を算出するステップをさらに含み、ここで、Σ(EMPAI)は、全ての同定済みタンパク質についてのEMPAI値の総和であり、MWは、同定された各タンパク質の分子量を表わす、請求項12に記載の装置。
【請求項15】
前記質量分析法が、液体クロマトグラフィ質量分析法を含む、請求項12〜14のいずれか一項に記載の装置。
【図1】
【図2】
【図3】
【図4】
【図5A】
【図5B】
【図6A】
【図6B】
【図6C】
【図6D】
【図7A】
【図7B】
【図8】
【図9】
【図10】
【図2】
【図3】
【図4】
【図5A】
【図5B】
【図6A】
【図6B】
【図6C】
【図6D】
【図7A】
【図7B】
【図8】
【図9】
【図10】
【公表番号】特表2008−508500(P2008−508500A)
【公表日】平成20年3月21日(2008.3.21)
【国際特許分類】
【出願番号】特願2006−554389(P2006−554389)
【出願日】平成17年7月4日(2005.7.4)
【国際出願番号】PCT/JP2005/012705
【国際公開番号】WO2006/011351
【国際公開日】平成18年2月2日(2006.2.2)
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.テフロン
【出願人】(506137147)エーザイ・アール・アンド・ディー・マネジメント株式会社 (215)
【Fターム(参考)】
【公表日】平成20年3月21日(2008.3.21)
【国際特許分類】
【出願日】平成17年7月4日(2005.7.4)
【国際出願番号】PCT/JP2005/012705
【国際公開番号】WO2006/011351
【国際公開日】平成18年2月2日(2006.2.2)
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.テフロン
【出願人】(506137147)エーザイ・アール・アンド・ディー・マネジメント株式会社 (215)
【Fターム(参考)】
[ Back to top ]