LC/MSを用いるタンパク質を絶対定量するためのシステムおよび方法
特定のタンパク質のペプチドに対して実測されるN個の最高のイオン化強度の和または平均を較正標準と比較することにより試料中のタンパク質の絶対定量がもたらされる。この較正標準は、1つ以上の所定のタンパク質を用いて行われる先行のタンパク質ペプチド分析により生成されるテーブルの形のものであることができる。この比較は、イオン化強度の実測された和または平均に基づいてタンパク質の対応する絶対量を求めるのに使用される。単純な変換係数を較正標準値に適用して、試料中のタンパク質の絶対量を求めることができる。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、一般的には、タンパク質混合物のLC/MS分析に関する。さらに具体的には、本発明は、単純な混合物または複雑な混合物中の酵素的に消化されたタンパク質のLC/MS分析によるタンパク質の絶対定量に関する。
【背景技術】
【0002】
タンパク質の研究は、タンパク質の同定による疾患の理解および闘い、疾患のバイオマーカーの発見、特定の代謝経路におけるタンパク質の関与の研究および薬剤の発見におけるタンパク質標的の同定を含む多数の分野において重要である。これらの研究においてしばしば使用される重要な方法は、単純および複雑な混合物中に存在するペプチドおよびタンパク質を定量および同定するのにエレクトロスプレーイオン化質量分析と組み合わされた液体クロマトグラフィ(ESI−LC/MS)である。
【0003】
単純な混合物および複雑な混合物中のペプチドおよびタンパク質を定量するための一つのアプローチは、2つの実験条件の間の対応する相対存在量を求めることを伴う。これらの実験時には、特定のタンパク質のペプチドの相対比を正確に求めるために、同一の成分を2つの実験の間で比較することが重要である。このようにすることにより、所与のタンパク質の各ペプチドに対するマルチ相対存在量値を入手して、異なる生理学的条件の間のタンパク質の発現差異を定量的に特性化することができる。
【0004】
タンパク質の定量的研究へのもう一つのアプローチは、所与のタンパク質試料の酵素消化から生じるペプチドおよび/またはタンパク質の絶対的な濃度を求めることである。このアプローチにおいては、プロテアーゼ、例えばトリプシンを用いるタンパク質試料の消化は、各々が特異的な一次アミノ酸配列を有する多数のより小さいポリペプチドを生じる。タンパク質分解的消化が完結まで進行させられる場合には、所与のモル量のタンパク質は各トリプシンペプチド解裂生成物に対して同一のモル量を生じるということが知られている。このようにして、所与のタンパク質のトリプシンペプチドのモル量を求めることによって、試料中の元のタンパク質のモル量を求めることが可能となる。次いで、消化物混合物中のこのタンパク質のペプチドの絶対量を求めることにより、タンパク質の絶対定量を行うことができる。
【0005】
通常、タンパク質の絶対定量は、所与のタンパク質からの特異的なポリペプチドに対する較正応答曲線を生成するのに使用される1つ以上の外部参照ペプチドを必要とする(すなわち、合成トリプシンポリペプチド生成物)。所定のタンパク質の絶対定量は、較正曲線中で生成されるものと比較した試料中の特異的なポリペプチドに対する実測シグナル応答から求められる。多数の異なるタンパク質の絶対定量を求める場合には、各タンパク質についての各特異外部参照ペプチドに対して別々の較正曲線が生成される。
【0006】
Gygiらへの米国特許出願No.2004/0229283(「Gygi」)は、合成された模倣ペプチドを標準として使用する複雑な混合物中のタンパク質を絶対定量するための慣用的な方法を述べている。模倣ペプチドは、所与のタンパク質の天然起源ペプチドと化学的に同一であるペプチドである。この模倣ペプチドが複雑な混合物に導入される。この混合物はLC/MSを用いて分析されて、模倣ペプチドに対するイオン化強度を生じる。この強度シグナル応答は、導入される合成分子を用いて作り出される強度較正曲線と比較され、混合物中の模倣タンパク質の量を求められる。合成ペプチドを使用する難点は、基準試料を合成すること、およびタンパク質それ自体の絶対量を求めることができる前に合成標準を後で「スパイク」する余計なステップが必要とされるということである。
【0007】
タンパク質を絶対定量するもう一つの方法は、S35−メチオニンまたは比活性が既知である放射能ラベルの他のタイプを使用する。この放射能ラベル法においては、放射能ラベルされたアミノ酸、例えばS35−メチオニンが細胞に与えられる。タンパク質の合成時、このタンパク質はメチオニンの代わりにS35−メチオニンを組み込む。放射能ラベルの組み込みの程度に基づいて、ペプチドまたはタンパク質の絶対量を求めることができる。放射能ラベルを使用する難点は、ある場合、例えばヒトまたは他の生物についての研究においては、放射能給餌またはドーピングは費用がかかり、被験者に危険を伴い、このため非実用的であり得るということである。結果として、放射能ラベル法を用いてタンパク質の絶対定量を求めることは、消耗性の生物系、例えば微生物および植物に限定される。
【0008】
他のタンパク質定量方法は、2つの試料の間のタンパク質の量の相対定量を提供する。相対定量は、特異タンパク質の存在量が擾乱(環境誘起、薬剤誘起、疾患誘起の)によりどのように変化するかについての情報を提供する。しかし、このような相対定量方法は、試料中に存在する特定のタンパク質の絶対量を提供しない。
【発明の開示】
【発明が解決しようとする課題】
【0009】
結果として、先行技術の難点または要求に悩まされない試料中のタンパク質の絶対量を求める方法が必要とされる。
【課題を解決するための手段】
【0010】
本発明の実施形態は、外部参照ペプチドの合成または放射能ラベル法の実施を必要とせずに、化学的もしくは酵素的に生成されるペプチドの単純な混合物または複雑な混合物のLC/MSデータからのタンパク質の絶対定量を提供する。本発明の実施形態は、すべての他のタンパク質の以降の絶対定量に適用可能である単一の較正標準を使用する。
【0011】
本発明のある実施形態においては、1つ以上の所定の較正標準タンパク質は、対応するポリペプチド解裂生成物に化学的もしくは酵素的に分解される。得られるポリペプチド生成物はLC/MSにより分析される。1つ以上の所定の較正標準タンパク質と関連する上位N個の最も効率的にイオン化するペプチドの平均シグナル応答の較正標準テーブルが既知量(モル)の関数として作り出される。実際の実験時には、混合物中のタンパク質は、対応するポリペプチド解裂生成物に化学的もしくは酵素的に分解され、および得られるポリペプチド生成物がLC/MSにより分析される。存在する各タンパク質に対して、上位N個の最も強いポリペプチドが選択され、およびこれらの対応する強度が平均化される。試料中の所与のタンパク質の上位N個の最も効率的にイオン化するポリペプチドからの平均シグナル応答値は、較正標準テーブル中に注記された平均シグナル応答値と比較されて、存在する各タンパク質の絶対量が定量される。平均シグナル応答値が較正標準テーブル中にない場合には、変換係数または内挿法を使用して、存在するタンパク質の絶対量を定量することができる。
【0012】
本発明のある実施形態においては、1つ以上の所定のタンパク質を用いて、較正標準テーブルが生成される。このタンパク質は、化学的もしくは酵素的に処理されて、特性的なポリペプチド解裂生成物の組を生じる。このポリペプチド混合物はLC/MSにより分析されて、ポリペプチド質量およびこれらの対応するシグナル応答の一覧表を生成する。このLC/MS分析は、1つ以上の既知の絶対量の1つ以上の較正標準タンパク質と共に行われる。上位N個の最も効率的にイオン化するポリペプチドのシグナル応答は、各較正タンパク質から選択され、平均シグナル応答が較正テーブルの中に組み込まれる。ペプチドイオン化の和または平均を計算する更なる較正標準タンパク質を使用することは、統計誤差を低減する。
【0013】
一つの実施形態においては、本発明は、試料中のタンパク質を絶対定量するための方法である。実施形態の方法は、試料を消化して、試料中のタンパク質と関連するペプチドを入手すること、およびLC/MS装置を用いて消化生成物を分析して、特定のタンパク質に対する実測されるシグナル応答と一緒にペプチド質量に対応する一覧表を得ることを含む。更には、実施形態の方法は、特定のタンパク質に対してLC/MS分析から実測されるN個の最も効率的にイオン化するペプチドを求めること、およびN個の最も効率的にイオン化するポリペプチドに対する和または平均のシグナル応答を計算することを含む。加えて、実施形態の方法は、計算される和または平均のシグナル応答を較正標準と比較すること、および比較基準で試料中に存在する特定のタンパク質の絶対量を求めることを含む。
【0014】
もう一つの実施形態においては、本発明は、試料中のタンパク質を絶対定量するためのシステムである。このシステムは、試料中の特定のタンパク質に対応するシグナル応答と一緒にポリペプチド質量の一覧表を生成する質量分析計、およびコンピューターを含む。このコンピューターは、各々の入力がタンパク質の量、およびこのタンパク質のN個の最も強いポリペプチドに対する平均シグナル応答の1つを有する1つ以上のタンパク質に対する入力を有する較正標準テーブルを保存するためのメモリーを含む。更には、このコンピューターは、コンピューターが特定のタンパク質のペプチドに対応するイオン化データを質量分析計から入手し、入手したペプチドイオン化データを分析し、上位N個の最高の実測ペプチド強度の和および平均の1つを計算し、および計算された和または平均を較正標準テーブル中の1つ以上の入力と比較することにより、試料中に存在する特定のタンパク質の絶対量を求めることを可能にするためのコンピューター上で実行されるソフトウエアを含む。
【発明を実施するための最良の形態】
【0015】
タンパク質は、大きな、単一のポリペプチドを共に生じるアミノ酸の線状配列からできている。通常、タンパク質の定量研究時には、元のタンパク質分子は、より小さい解裂ペプチド(例えば、トリプシンペプチド)に化学的もしくは酵素的に分解される。例えば、酵素トリプシンを用いる消化は、アミノ酸のリジンおよびアルギニンのC末端側でタンパク質を切断することにより、タンパク質をトリプシンペプチドに破断する。
【0016】
得られるペプチドは一般に質量分析計を用いて分析可能であるが、異なるペプチドは異なるイオン化効率を有するために、構成成分のペプチドのシグナル応答はいかなる特定のタンパク質に対しても同一でない。すなわち、あるペプチドは、他のペプチドよりもプロトン化/イオン化を受け易い。しかしながら、いかなる所与のタンパク質に対しても、トリプシンペプチドのシグナル応答は、ガウス分布を呈するように順序付け可能である。結果として、特定のタンパク質内でペプチドのシグナル応答を比較することにより、タンパク質の相対存在量が定量可能である。
【0017】
本発明の発明者らは、等モルレベルの非関連タンパク質の段階希釈から、タンパク質のN個(ここで、Nは整数である)の最も効率的にイオン化するペプチドからの平均応答がすべてのタンパク質にわたって類似であるということを見出した。酵素消化から生じるポリペプチドの数以外には、開始タンパク質のサイズに関して影響はないように思われ、各タンパク質からの上位N個のイオン化ペプチドの平均シグナル応答は、無処理のタンパク質の分子量に無関係に+/−20%以内で類似している。
【0018】
この知識を用いて、本発明の発明者らは、試料中のタンパク質を絶対定量するためのシステムおよび方法を開発した。本発明の実施形態にしたがえば、特定のタンパク質に対する上位N個のペプチドシグナル応答は平均化される。等モル量のタンパク質を仮定すると、すべてのタンパク質に対して平均は同一(若干の誤差内で)でなければならない。結果として、平均を所定の較正標準平均(ペプチドの量に対応する)と比較して、対象のタンパク質の絶対量が求められる。
【0019】
前出の例として、牛からのヘモグロビン(分子量14,000);酵母からのアルコールデヒドロゲナーゼ(分子量25,000);酵母からのエノラーゼ(分子量50,000);牛からの血清アルブミン(分子量70,000);およびグリコーゲンホスホリラーゼ(分子量97,000)の5つの普通のタンパク質を試験した。このタンパク質の実質的にすべてのペプチドを得るのに充分高いレベルでこれらのタンパク質を分析した。
【0020】
図1から6は、分析されるタンパク質の各々の種々の濃度に対するシグナル応答(カウント)の棒グラフである。図1から6の各々のx軸は、タンパク質中のペプチドに対応する(これらのアミノ酸配列により表される)。図1から6の各々のy軸は、ペプチド混合物のLC/MS分析に対する実測イオン化シグナル応答である。特に、これらの種々の濃度は、5ピコモル、2ピコモル、1ピコモル、0.5ピコモル、0.25ピコモルおよび0.10ピコモルである。特に、図1はトリプシンを用いて消化される酵母エノラーゼ(eno)からの特徴付けられたペプチドの棒グラフであり;図2は、トリプシンを用いて消化される酵母アルコールデヒドロゲナーゼ(adh)からの特徴付けられたペプチドの棒グラフであり;図3は、トリプシンを用いて消化されるウサギグリコーゲンホスホリラーゼ(gp)からの特徴付けられたペプチドの棒グラフであり;図4は、トリプシンを用いて消化されるウシ血清アルブミン(bs)からの特徴付けられたペプチドの棒グラフであり;図5は、トリプシンを用いて消化されるウシのヘモグロビン(α鎖)(ha)からの特徴付けられたペプチドの棒グラフであり;および図6は、トリプシンを用いて消化されるウシのヘモグロビン(β鎖)(hb)からの特徴付けられたペプチドの棒グラフである。
【0021】
図1から6に見られるように、特定のタンパク質に対するペプチドに関連するシグナル応答は、ガウス分布を呈するように配列可能である。この分布は、高イオン化のもの、中間イオン化のもの、および低イオン化のものといった、イオン化効率の幅広い区分を特定のタンパク質のペプチドに対して確定することができるということを示唆する。このイオン化効率は、実測されるシグナル応答に直接に関連する。イオン化効率は、ある特定のアミノ酸またはアミノ酸の配列の存在の関数であると更に考えられる。すなわち、低イオン化のペプチドよりも高イオン化のペプチド中である特定のアミノ酸またはアミノ酸の配列が更に優勢である。
【0022】
図16は、試験されるタンパク質の各濃度に対する図1から6中のタンパク質の各々に対する上位3個(すなわち、この例においてはN=3)のペプチドシグナル応答を示すテーブル1600である。図17および18は、それぞれ、テーブル1600中のタンパク質の各々に対する和および平均を表に作成したテーブル1700および1800である。テーブル1700および1800中では、ヘモグロビンは等しい量のhaおよびhbを含有するために、和および平均のシグナル応答に対してhaおよびhbのシグナル応答値が一緒に加えられる。以上のように、このタンパク質は異なる生物に由来しており、異なる分子量を有するが、上位3個のイオン化ペプチドの平均シグナル応答は、実質的に同一である。
【0023】
図7から11は、図1から6のタンパク質の各々についての3つの最も効率的にイオン化するペプチドに対する平均シグナル応答のタンパク質濃度を関数としたプロットである。図12は図7から11の合成正規化プロットである。図13は図7から11の複合正規化プロットである。応答は実質的に直線的であるということが観察される。更には、図13は、正規化応答がタンパク質に無関係に実質的に同一であるということを示す。これらの特性の両方によって、選択される1つ以上の較正標準タンパク質に対する上位のN個の最も効率的にイオン化するペプチドに関連するシグナル応答を用いて、タンパク質の絶対量の信頼性のある定量を行うことができるという結論が支持される。
【0024】
このようにして、テーブル1700および1800は、任意のペプチドに対しても特徴的なモル応答を提供する。例えば、アルブミンが較正標準として選択可能である。別のタンパク質、例えばエノラーゼの質量分析を用いて、N個(例えば、3個)の最も効率的にイオン化するペプチドが同定可能である。次いで、N個の最も効率的にイオン化するペプチドのシグナル応答をアルブミン標準と比較することにより、存在するエノラーゼの量を求めることができる。
【0025】
もう一つの例として、Nが3であり、N個の最高のイオン化ペプチドの和がMS分析から900,000千カウントのオーダーである場合には、テーブル1700から5ピコモル(pmol)のエノラーゼが存在するということが推定される。同様に、N個の最も効率的にイオン化するペプチドの平均が300,000カウントのオーダーである場合には、テーブル1800から存在するエノラーゼの量は5ピコモルであると求められる。エノラーゼのN個の最も効率的にイオン化するペプチドのカウント数が100,000カウント(平均33333カウント)のオーダーであったとすると、存在するエノラーゼの量に対するテーブル1700またはテーブル1800からの推定値は、0.5ピコモルである。テーブル1700および1800から、ほぼ180,000カウント(平均60,000カウント)/ピコモル(N個の最も効率的にイオン化するペプチド基準で存在する特定のタンパク質の)が存在するということが判る。一般に、特定のカウントに対しては、存在するタンパク質の量の推定値は、和を使用する場合には式(1)により、ならびに平均を使用する場合には式(2)により次の通り与えられる。
【0026】
【数1】
【0027】
【数2】
【0028】
例えば、特定のタンパク質に対するN個の最も効率的にイオン化するペプチドの平均強度シグナル応答が650,000カウントの平均カウントを生じる場合には、式2およびテーブル1800を使用して、このタンパク質の絶対量の推定値は、650,000/324,800*5ピコモル=10ピコモルにより与えられる。値324,800は、テーブル1800から5ピコモルに対応する較正標準平均のデータ値である。同様に、0.50ピコモル濃度の使用は、650,000/31,800*0.5ピコモル=l0.2ピコモルを生じる。単一モルの較正標準値を使用することによって、対応する濃度が単一、つまり1であるために掛け算の必要性が無くなる。例えば、テーブル1800から1.00ピコモル値を使用することによって、650,000/62,800=10.4ピコモルが得られる。これらの値は相互の許容し得る誤差内にある。
【0029】
別法としては、周知の内挿法(例えば、直線、二次、多項式、三次スプラインなど)を使用して、特定のカウントに対応するモル濃度を求めることができる。
【0030】
これらの推定値の精度は、統計分析により提供可能である。周知の統計分析を行って、推定値に対する信頼水準を提供することができる。例えば、テーブル1700および1800は、濃度のいずれかに対するカウントに対する変動係数が20パーセント以内にあるということを示す。これは許容し得る範囲である。
【0031】
図14は、較正標準テーブル、例えば本発明の実施形態によるテーブル1700および1800を生成するための方法のフローチャートである。ステップ1402においては、較正標準に使用される1つ以上の較正標準タンパク質が同定される。ステップ1404においては、既知量(ピコモルの)の各々同定されている較正標準タンパク質が分解されて、構成成分のペプチドを生成する。例えば、このような分解は、酵素トリプシンを用いる消化であることができる。この既知量は、また、調製された消化物、例えばWaters Corporation(Milford,Massachusetts)から入手し得るMassPREP(商標)ペプチド消化標準品(例えばホスホリラーゼb、酵母エノラーゼ、ウシのヘモグロビン、酵母アルコールデヒドロゲナーゼおよびウシの血清アルブミンなどのタンパク質に対して入手し得る)を用いても入手可能である。ステップ1406においては、この分解結果に対して質量分析が行われる。ステップ1408においては、N個の最も効率的にイオン化するペプチドが同定される。ステップ1410においては、N個の最も効率的にイオン化するペプチドの和または平均が求められる。ステップ1412においては、対応する量のタンパク質と一緒に例えばテーブル、テーブル1700または1800など中にこの和または平均が保存される。この方法は、種々の濃度のタンパク質に対して反復可能である。本発明の実施形態においては、このテーブルは、また、テーブル中の濃度の各々に対する全部のタンパク質にわたる和または平均、すなわち複合和または平均も含む。
【0032】
この方法は、多数の異なる量のタンパク質に対して反復されて、較正標準テーブル、例えばテーブル1700または1800を生成する。較正標準には1つのみのタンパク質を使用する必要があるが、この方法の統計を改善するには、複数の選択された較正標準タンパク質に対する平均値が望ましい。この較正標準テーブルは、また、各較正標準タンパク質に対応する平均の和または平均のみ、ならびに場合により平均の和または平均の共分散を有することもできる。
【0033】
任意の数のペプチドもN個の最も効率的にイオン化するペプチドの組として使用可能である。しかしながら、3個以下を使用することは、不充分な統計を生じ得、正確でない。説明の通り、平均または和を使用して、較正標準テーブルを生成することができる。任意の1つ以上のタンパク質が較正標準タンパク質の組として使用可能である。較正標準テーブルを生成するのに、任意の1つ以上の異なる量のタンパク質が使用可能である。更なるタンパク質を使用することは、変動係数の推定値を提供して、以降の分析における更なる信頼度をもたらす。
【0034】
ペプチドがより多いと、より高いイオン化効率を生じるアミノ酸配列を有する可能性が増すので、より多数のペプチドを有するより大きなタンパク質は、より高いイオン化を示す、より多いペプチドを有する可能性が高い。より少数のトリプシンペプチドを生成するより小さいタンパク質は、高イオン化効率を示すアミノ酸配列を含む多くのペプチドを有する可能性が少ない。結果として、大きなタンパク質を分析する場合には、Nは高く設定され得る可能性がある。
【0035】
テーブル1700の保存は、各実験に対して較正標準テーブルを生成する必要性を排除する。更には、この較正標準テーブルは公表可能であるか、もしくは他人の使用に供することができる。例えば、このテーブルは、ジャーナルに公表可能であるか、もしくは関心のある使用者にディスクにより配布可能である。更には、このテーブルは、テーブルの版またはウエブサイトからダウンロード可能なテーブルにより配布を容易にすることができるインターネットウエブサイト上で公表可能である。このような較正標準テーブルを配布するための多数の他の方法は、当業者には周知である。この方法での公表は、特定の使用者の共同体が1つ以上のタンパク質を較正標準として使用することに同意する場合、特に有利であり得る。
【0036】
この較正標準テーブルは、また、特定の装置に対する較正の提供も行う。すなわち、この較正は、特定の装置に対して所与のタンパク質に対する1モル当りの実測カウント数を決める。この値は装置ごとに変わり得る。しかしながら、較正により決められると、この値は、特定の装置から生成されるすべてのタンパク質の絶対定量に適用可能である。
【0037】
図15は、本発明の実施形態にしたがって生成された較正標準テーブルを使用するための方法のフローチャートである。ステップ1502においては、タンパク質またはタンパク質の複雑な混合物を含有する試料は、構成成分のペプチドに分解され、およびLCMS中に通され、データを収集する。上記のように、この分解は、酵素トリプシンを用いる消化であることができる。ステップ1504においては、この分解結果に対して質量分析が行われる。ステップ1506においては、タンパク質が同定される。ステップ1508においては、ステップ1506で同定される各タンパク質に対してN個の最も効率的にイオン化するペプチドが同定される。ステップ1510においては、N個の最も効率的にイオン化するペプチドの和または平均(使用される較正標準テーブルに依って)がタンパク質の各々に対して求められる。ステップ1512においては、和(または平均)は較正標準テーブルと比較される。和(または平均)が存在する場合には、タンパク質の対応する量が数として使用される。
【0038】
和または平均が存在しない場合には、この比較は比較に基づいてタンパク質の絶対量を計算することを含む。このような計算は、式(1)または(2)において上述の変換を適用することを含むことができるか、もしくは他の周知の内挿法(例えば、直線、二次、多項式、三次スプラインを含む)を使用して、カウントに基づいてタンパク質のモル量を推定することができる。別法としては、較正標準テーブルがタンパク質の単一のモルに対応するカウントデータを含む場合には、この計算は、実測カウントを1モルに対応する較正標準テーブル中のカウントで割って、存在する特定のタンパク質のモル量の推定値を得ることができる。
【0039】
標準テーブルの生成については、N個の最も効率的にイオン化するペプチドの組として任意の数のペプチドも使用可能である。しかしながら、3個以下を使用することは、不充分な統計を生じ得、正確でない。
【0040】
テーブルの生成の場合またはテーブルの使用の場合のいずれにおいても、平均を使用する場合には、Nは異なるタンパク質に対しては異なることができる。このことは、より大きなタンパク質を使用する場合変動係数を低減し、したがって絶対定量の推定値の信頼度を増加し得る。
【0041】
図19は、本発明の実施形態にしたがった絶対定量のためのシステムの概略図である。このシステムは、質量分析計1901に結合されている液体クロマトグラフ1952を含む。質量分析計1901はコンピューター1914に結合されている。また、液体クロマトグラフ1952はコンピューター1914にも結合可能である。図19に図示した本発明の例示の実施形態においては、質量分析計1901は、Waters Corp.(Milford,Massachusetts)から入手し得るQ−TOF装置である。図19に図示した本発明の例示の実施形態においては、液体クロマトグラフ1952は、nanoACQUITY(商標)UPLCシステムまたはWaters Corp.(Milford,Massachusetts)から入手し得るWater CapLCである。
【0042】
操作においては、タンパク質混合物は、ペプチド成分に化学的もしくは酵素的に分解され、これによりペプチド混合物1950を形成する。ペプチド混合物1950はLC1952で分離される。この分離成分は質量分析計1901に導入される。このような導入の一つの方法は、検体スプレー1902を生じさせるためにエレクトロスプレーイオン化を使用することである。
【0043】
検体スプレー1902は、質量分析計1901の四重極区分1903に導入される。四重極区分においては、四重極1904は、質量分析計1901の飛行時間区分1905において引き続いて分析するために特定のイオンを選択するように調整されている。選択されたイオンは、衝突セル1906中で断片化される。このフラグメントは飛行時間区分1905の中に導入される。飛行時間区分1905においては、プッシャー1908は、フラグメントをリフレクトロン1910に向けて推進する。リフレクトロン1910は、イオンを検出器1912に反射する。検出器1912はイオン強度を検出し、引き続いて分析するためにイオンをコンピューター1914に送る。コンピューター1914はソフトウエアを実行して、上述の本発明の実施形態にしたがってフラグメントを分析する。コンピューター1914は、本明細書中で述べられる本発明の実施のために構成可能な任意のコンピューターおよびコンピューター装置であることができる。また、コンピューター1914は、較正標準テーブル、例えば較正標準テーブル1700を保存するためにメモリー1916も含む。メモリー1916は、例えば、RAM、ROM、PROM、EPROM、EEPROM、磁気ディスク、光ディスクまたはCD−ROMを含む、テーブル1700を保存することができるいかなる内部メモリーまたは外部メモリーであることもできる。スクリーンまたはディスプレイ1918は、情報を使用者に表示するためにコンピューター1914に結合される。キーボード1920もまた、使用者がデータを入力することができるように、コンピューター1914に結合される。キーボード1920はまた、使用者がコンピューター1914を周知の方法で操作するのを助けるように結合されているマウスまたは他のポインティングデバイスを有することもできる。コンピューター、例えばコンピューター1914およびこのメモリー1916ならびにコンピューター周辺装置、例えばディスプレイ1918、キーボード1920およびポインティングデバイス1922は、当業者には周知であり、更に説明する必要はない。
【0044】
本発明は、試料中のタンパク質の絶対量を求めるためのシステムおよび方法のみならず、定量を実証するための方法も提供する。例えば、タンパク質グリコーゲンホスホリラーゼの絶対定量が本発明の実施形態を用いて得られたと仮定する。5個のみの高イオン化効率ペプチドが実測されたとういうことを更に仮定する。図3は、グリコーゲンホスホリラーゼが8個の高イオン化効率のペプチドを有するべきであるということを図示する。結果として、5個のみのこのようなペプチドの実測は、実験における起こり得る誤差を示す。
【0045】
本発明の好ましい実施形態の前出の開示は、例示および説明の目的で提示されてきた。これは、網羅的であるように、もしくは本発明を開示されている精確な形に限定するように意図されていない。本明細書中で述べられている実施形態の多数の変形および改変は、上記の開示を照らせば当業者には明白である。本発明の範囲は、添付の特許請求の範囲のみによって、ならびにこの同等物によって規定されるべきである。
【0046】
更には、本発明の代表的な実施形態の説明において、本明細書は、本発明の方法を特定のステップの配列として提示してきたかもしれない。しかしながら、本方法が本明細書中で説明した特定のステップの順序によらない程度では、この方法は、説明した特定のステップの配列に限定されるべきでない。当業者ならば認識するように、他のステップの配列が可能であり得る。このため、本明細書中で説明した特定のステップの順序は、特許請求の範囲に対する限定と解釈されるべきでない。加えて、本発明の方法に関する特許請求の範囲は、書かれている順序のステップの性能に限定されるべきでなく、配列は変えられ得ること、ならびに本発明の精神および範囲内になお存在し得るということを当業者ならば容易に認識することができる。
【図面の簡単な説明】
【0047】
【図1】種々の量の酵母エノラーゼからのペプチドのシグナル応答を示す棒グラフである。
【図2】種々の量の酵母アルコールデヒドロゲナーゼからのペプチドのシグナル応答を示す棒グラフである。
【図3】は、種々の量のウサギグリコーゲンホスホリラーゼからのペプチドのシグナル応答を示す棒グラフである。
【図4】種々の量のウシの血清アルブミンからのペプチドのシグナル応答を示す棒グラフである。
【図5】種々の量のウシのヘモグロビン(α鎖)からのペプチドのシグナル応答を示す棒グラフである。
【図6】種々の量のウシのヘモグロビン(β鎖)からのペプチドのシグナル応答を示す棒グラフである。
【図7】図1に図示する量に対する酵母エノラーゼの上位3個の最も強いペプチドシグナル応答の平均のプロットである。
【図8】図2に図示する量に対する酵母アルコールデヒドロゲナーゼの上位3個の最も強いペプチドシグナル応答の平均のプロットである。
【図9】図3に図示する量に対するウサギグリコーゲンホスホリラーゼの上位3個の最も強いペプチドシグナル応答の平均のプロットである。
【図10】図4に図示する量に対するウシの血清アルブミンの上位3個の最も強いペプチドシグナル応答の平均のプロットである。
【図11】図5および6に図示する量に対するウシのヘモグロビン(αおよびβ鎖)の上位3個の最も強いペプチドシグナル応答の平均のプロットである。
【図12】図7から11に示すシグナル応答の複合プロットである。
【図13】図7から11に示すシグナル応答の複合正規化プロットである。
【図14】本発明の実施形態にしたがって較正標準テーブルを生成するための方法のフローチャートである。
【図15】本発明の実施形態にしたがって生成された較正標準テーブルを使用するための方法のフローチャートである。
【図16】試験されるタンパク質の各量に対して図1から6中のタンパク質の各々の上位3個の最も強いペプチドシグナル応答を示すテーブルである。
【図17】図16のテーブル中のタンパク質の各々に対するシグナル応答の和を表に作成したテーブルである。
【図18】図16のテーブル中のタンパク質の各々に対するシグナル応答の平均を表に作成したテーブルである。
【図19】本発明の実施形態にしたがって絶対定量するためのシステムの概略図である。
【技術分野】
【0001】
本発明は、一般的には、タンパク質混合物のLC/MS分析に関する。さらに具体的には、本発明は、単純な混合物または複雑な混合物中の酵素的に消化されたタンパク質のLC/MS分析によるタンパク質の絶対定量に関する。
【背景技術】
【0002】
タンパク質の研究は、タンパク質の同定による疾患の理解および闘い、疾患のバイオマーカーの発見、特定の代謝経路におけるタンパク質の関与の研究および薬剤の発見におけるタンパク質標的の同定を含む多数の分野において重要である。これらの研究においてしばしば使用される重要な方法は、単純および複雑な混合物中に存在するペプチドおよびタンパク質を定量および同定するのにエレクトロスプレーイオン化質量分析と組み合わされた液体クロマトグラフィ(ESI−LC/MS)である。
【0003】
単純な混合物および複雑な混合物中のペプチドおよびタンパク質を定量するための一つのアプローチは、2つの実験条件の間の対応する相対存在量を求めることを伴う。これらの実験時には、特定のタンパク質のペプチドの相対比を正確に求めるために、同一の成分を2つの実験の間で比較することが重要である。このようにすることにより、所与のタンパク質の各ペプチドに対するマルチ相対存在量値を入手して、異なる生理学的条件の間のタンパク質の発現差異を定量的に特性化することができる。
【0004】
タンパク質の定量的研究へのもう一つのアプローチは、所与のタンパク質試料の酵素消化から生じるペプチドおよび/またはタンパク質の絶対的な濃度を求めることである。このアプローチにおいては、プロテアーゼ、例えばトリプシンを用いるタンパク質試料の消化は、各々が特異的な一次アミノ酸配列を有する多数のより小さいポリペプチドを生じる。タンパク質分解的消化が完結まで進行させられる場合には、所与のモル量のタンパク質は各トリプシンペプチド解裂生成物に対して同一のモル量を生じるということが知られている。このようにして、所与のタンパク質のトリプシンペプチドのモル量を求めることによって、試料中の元のタンパク質のモル量を求めることが可能となる。次いで、消化物混合物中のこのタンパク質のペプチドの絶対量を求めることにより、タンパク質の絶対定量を行うことができる。
【0005】
通常、タンパク質の絶対定量は、所与のタンパク質からの特異的なポリペプチドに対する較正応答曲線を生成するのに使用される1つ以上の外部参照ペプチドを必要とする(すなわち、合成トリプシンポリペプチド生成物)。所定のタンパク質の絶対定量は、較正曲線中で生成されるものと比較した試料中の特異的なポリペプチドに対する実測シグナル応答から求められる。多数の異なるタンパク質の絶対定量を求める場合には、各タンパク質についての各特異外部参照ペプチドに対して別々の較正曲線が生成される。
【0006】
Gygiらへの米国特許出願No.2004/0229283(「Gygi」)は、合成された模倣ペプチドを標準として使用する複雑な混合物中のタンパク質を絶対定量するための慣用的な方法を述べている。模倣ペプチドは、所与のタンパク質の天然起源ペプチドと化学的に同一であるペプチドである。この模倣ペプチドが複雑な混合物に導入される。この混合物はLC/MSを用いて分析されて、模倣ペプチドに対するイオン化強度を生じる。この強度シグナル応答は、導入される合成分子を用いて作り出される強度較正曲線と比較され、混合物中の模倣タンパク質の量を求められる。合成ペプチドを使用する難点は、基準試料を合成すること、およびタンパク質それ自体の絶対量を求めることができる前に合成標準を後で「スパイク」する余計なステップが必要とされるということである。
【0007】
タンパク質を絶対定量するもう一つの方法は、S35−メチオニンまたは比活性が既知である放射能ラベルの他のタイプを使用する。この放射能ラベル法においては、放射能ラベルされたアミノ酸、例えばS35−メチオニンが細胞に与えられる。タンパク質の合成時、このタンパク質はメチオニンの代わりにS35−メチオニンを組み込む。放射能ラベルの組み込みの程度に基づいて、ペプチドまたはタンパク質の絶対量を求めることができる。放射能ラベルを使用する難点は、ある場合、例えばヒトまたは他の生物についての研究においては、放射能給餌またはドーピングは費用がかかり、被験者に危険を伴い、このため非実用的であり得るということである。結果として、放射能ラベル法を用いてタンパク質の絶対定量を求めることは、消耗性の生物系、例えば微生物および植物に限定される。
【0008】
他のタンパク質定量方法は、2つの試料の間のタンパク質の量の相対定量を提供する。相対定量は、特異タンパク質の存在量が擾乱(環境誘起、薬剤誘起、疾患誘起の)によりどのように変化するかについての情報を提供する。しかし、このような相対定量方法は、試料中に存在する特定のタンパク質の絶対量を提供しない。
【発明の開示】
【発明が解決しようとする課題】
【0009】
結果として、先行技術の難点または要求に悩まされない試料中のタンパク質の絶対量を求める方法が必要とされる。
【課題を解決するための手段】
【0010】
本発明の実施形態は、外部参照ペプチドの合成または放射能ラベル法の実施を必要とせずに、化学的もしくは酵素的に生成されるペプチドの単純な混合物または複雑な混合物のLC/MSデータからのタンパク質の絶対定量を提供する。本発明の実施形態は、すべての他のタンパク質の以降の絶対定量に適用可能である単一の較正標準を使用する。
【0011】
本発明のある実施形態においては、1つ以上の所定の較正標準タンパク質は、対応するポリペプチド解裂生成物に化学的もしくは酵素的に分解される。得られるポリペプチド生成物はLC/MSにより分析される。1つ以上の所定の較正標準タンパク質と関連する上位N個の最も効率的にイオン化するペプチドの平均シグナル応答の較正標準テーブルが既知量(モル)の関数として作り出される。実際の実験時には、混合物中のタンパク質は、対応するポリペプチド解裂生成物に化学的もしくは酵素的に分解され、および得られるポリペプチド生成物がLC/MSにより分析される。存在する各タンパク質に対して、上位N個の最も強いポリペプチドが選択され、およびこれらの対応する強度が平均化される。試料中の所与のタンパク質の上位N個の最も効率的にイオン化するポリペプチドからの平均シグナル応答値は、較正標準テーブル中に注記された平均シグナル応答値と比較されて、存在する各タンパク質の絶対量が定量される。平均シグナル応答値が較正標準テーブル中にない場合には、変換係数または内挿法を使用して、存在するタンパク質の絶対量を定量することができる。
【0012】
本発明のある実施形態においては、1つ以上の所定のタンパク質を用いて、較正標準テーブルが生成される。このタンパク質は、化学的もしくは酵素的に処理されて、特性的なポリペプチド解裂生成物の組を生じる。このポリペプチド混合物はLC/MSにより分析されて、ポリペプチド質量およびこれらの対応するシグナル応答の一覧表を生成する。このLC/MS分析は、1つ以上の既知の絶対量の1つ以上の較正標準タンパク質と共に行われる。上位N個の最も効率的にイオン化するポリペプチドのシグナル応答は、各較正タンパク質から選択され、平均シグナル応答が較正テーブルの中に組み込まれる。ペプチドイオン化の和または平均を計算する更なる較正標準タンパク質を使用することは、統計誤差を低減する。
【0013】
一つの実施形態においては、本発明は、試料中のタンパク質を絶対定量するための方法である。実施形態の方法は、試料を消化して、試料中のタンパク質と関連するペプチドを入手すること、およびLC/MS装置を用いて消化生成物を分析して、特定のタンパク質に対する実測されるシグナル応答と一緒にペプチド質量に対応する一覧表を得ることを含む。更には、実施形態の方法は、特定のタンパク質に対してLC/MS分析から実測されるN個の最も効率的にイオン化するペプチドを求めること、およびN個の最も効率的にイオン化するポリペプチドに対する和または平均のシグナル応答を計算することを含む。加えて、実施形態の方法は、計算される和または平均のシグナル応答を較正標準と比較すること、および比較基準で試料中に存在する特定のタンパク質の絶対量を求めることを含む。
【0014】
もう一つの実施形態においては、本発明は、試料中のタンパク質を絶対定量するためのシステムである。このシステムは、試料中の特定のタンパク質に対応するシグナル応答と一緒にポリペプチド質量の一覧表を生成する質量分析計、およびコンピューターを含む。このコンピューターは、各々の入力がタンパク質の量、およびこのタンパク質のN個の最も強いポリペプチドに対する平均シグナル応答の1つを有する1つ以上のタンパク質に対する入力を有する較正標準テーブルを保存するためのメモリーを含む。更には、このコンピューターは、コンピューターが特定のタンパク質のペプチドに対応するイオン化データを質量分析計から入手し、入手したペプチドイオン化データを分析し、上位N個の最高の実測ペプチド強度の和および平均の1つを計算し、および計算された和または平均を較正標準テーブル中の1つ以上の入力と比較することにより、試料中に存在する特定のタンパク質の絶対量を求めることを可能にするためのコンピューター上で実行されるソフトウエアを含む。
【発明を実施するための最良の形態】
【0015】
タンパク質は、大きな、単一のポリペプチドを共に生じるアミノ酸の線状配列からできている。通常、タンパク質の定量研究時には、元のタンパク質分子は、より小さい解裂ペプチド(例えば、トリプシンペプチド)に化学的もしくは酵素的に分解される。例えば、酵素トリプシンを用いる消化は、アミノ酸のリジンおよびアルギニンのC末端側でタンパク質を切断することにより、タンパク質をトリプシンペプチドに破断する。
【0016】
得られるペプチドは一般に質量分析計を用いて分析可能であるが、異なるペプチドは異なるイオン化効率を有するために、構成成分のペプチドのシグナル応答はいかなる特定のタンパク質に対しても同一でない。すなわち、あるペプチドは、他のペプチドよりもプロトン化/イオン化を受け易い。しかしながら、いかなる所与のタンパク質に対しても、トリプシンペプチドのシグナル応答は、ガウス分布を呈するように順序付け可能である。結果として、特定のタンパク質内でペプチドのシグナル応答を比較することにより、タンパク質の相対存在量が定量可能である。
【0017】
本発明の発明者らは、等モルレベルの非関連タンパク質の段階希釈から、タンパク質のN個(ここで、Nは整数である)の最も効率的にイオン化するペプチドからの平均応答がすべてのタンパク質にわたって類似であるということを見出した。酵素消化から生じるポリペプチドの数以外には、開始タンパク質のサイズに関して影響はないように思われ、各タンパク質からの上位N個のイオン化ペプチドの平均シグナル応答は、無処理のタンパク質の分子量に無関係に+/−20%以内で類似している。
【0018】
この知識を用いて、本発明の発明者らは、試料中のタンパク質を絶対定量するためのシステムおよび方法を開発した。本発明の実施形態にしたがえば、特定のタンパク質に対する上位N個のペプチドシグナル応答は平均化される。等モル量のタンパク質を仮定すると、すべてのタンパク質に対して平均は同一(若干の誤差内で)でなければならない。結果として、平均を所定の較正標準平均(ペプチドの量に対応する)と比較して、対象のタンパク質の絶対量が求められる。
【0019】
前出の例として、牛からのヘモグロビン(分子量14,000);酵母からのアルコールデヒドロゲナーゼ(分子量25,000);酵母からのエノラーゼ(分子量50,000);牛からの血清アルブミン(分子量70,000);およびグリコーゲンホスホリラーゼ(分子量97,000)の5つの普通のタンパク質を試験した。このタンパク質の実質的にすべてのペプチドを得るのに充分高いレベルでこれらのタンパク質を分析した。
【0020】
図1から6は、分析されるタンパク質の各々の種々の濃度に対するシグナル応答(カウント)の棒グラフである。図1から6の各々のx軸は、タンパク質中のペプチドに対応する(これらのアミノ酸配列により表される)。図1から6の各々のy軸は、ペプチド混合物のLC/MS分析に対する実測イオン化シグナル応答である。特に、これらの種々の濃度は、5ピコモル、2ピコモル、1ピコモル、0.5ピコモル、0.25ピコモルおよび0.10ピコモルである。特に、図1はトリプシンを用いて消化される酵母エノラーゼ(eno)からの特徴付けられたペプチドの棒グラフであり;図2は、トリプシンを用いて消化される酵母アルコールデヒドロゲナーゼ(adh)からの特徴付けられたペプチドの棒グラフであり;図3は、トリプシンを用いて消化されるウサギグリコーゲンホスホリラーゼ(gp)からの特徴付けられたペプチドの棒グラフであり;図4は、トリプシンを用いて消化されるウシ血清アルブミン(bs)からの特徴付けられたペプチドの棒グラフであり;図5は、トリプシンを用いて消化されるウシのヘモグロビン(α鎖)(ha)からの特徴付けられたペプチドの棒グラフであり;および図6は、トリプシンを用いて消化されるウシのヘモグロビン(β鎖)(hb)からの特徴付けられたペプチドの棒グラフである。
【0021】
図1から6に見られるように、特定のタンパク質に対するペプチドに関連するシグナル応答は、ガウス分布を呈するように配列可能である。この分布は、高イオン化のもの、中間イオン化のもの、および低イオン化のものといった、イオン化効率の幅広い区分を特定のタンパク質のペプチドに対して確定することができるということを示唆する。このイオン化効率は、実測されるシグナル応答に直接に関連する。イオン化効率は、ある特定のアミノ酸またはアミノ酸の配列の存在の関数であると更に考えられる。すなわち、低イオン化のペプチドよりも高イオン化のペプチド中である特定のアミノ酸またはアミノ酸の配列が更に優勢である。
【0022】
図16は、試験されるタンパク質の各濃度に対する図1から6中のタンパク質の各々に対する上位3個(すなわち、この例においてはN=3)のペプチドシグナル応答を示すテーブル1600である。図17および18は、それぞれ、テーブル1600中のタンパク質の各々に対する和および平均を表に作成したテーブル1700および1800である。テーブル1700および1800中では、ヘモグロビンは等しい量のhaおよびhbを含有するために、和および平均のシグナル応答に対してhaおよびhbのシグナル応答値が一緒に加えられる。以上のように、このタンパク質は異なる生物に由来しており、異なる分子量を有するが、上位3個のイオン化ペプチドの平均シグナル応答は、実質的に同一である。
【0023】
図7から11は、図1から6のタンパク質の各々についての3つの最も効率的にイオン化するペプチドに対する平均シグナル応答のタンパク質濃度を関数としたプロットである。図12は図7から11の合成正規化プロットである。図13は図7から11の複合正規化プロットである。応答は実質的に直線的であるということが観察される。更には、図13は、正規化応答がタンパク質に無関係に実質的に同一であるということを示す。これらの特性の両方によって、選択される1つ以上の較正標準タンパク質に対する上位のN個の最も効率的にイオン化するペプチドに関連するシグナル応答を用いて、タンパク質の絶対量の信頼性のある定量を行うことができるという結論が支持される。
【0024】
このようにして、テーブル1700および1800は、任意のペプチドに対しても特徴的なモル応答を提供する。例えば、アルブミンが較正標準として選択可能である。別のタンパク質、例えばエノラーゼの質量分析を用いて、N個(例えば、3個)の最も効率的にイオン化するペプチドが同定可能である。次いで、N個の最も効率的にイオン化するペプチドのシグナル応答をアルブミン標準と比較することにより、存在するエノラーゼの量を求めることができる。
【0025】
もう一つの例として、Nが3であり、N個の最高のイオン化ペプチドの和がMS分析から900,000千カウントのオーダーである場合には、テーブル1700から5ピコモル(pmol)のエノラーゼが存在するということが推定される。同様に、N個の最も効率的にイオン化するペプチドの平均が300,000カウントのオーダーである場合には、テーブル1800から存在するエノラーゼの量は5ピコモルであると求められる。エノラーゼのN個の最も効率的にイオン化するペプチドのカウント数が100,000カウント(平均33333カウント)のオーダーであったとすると、存在するエノラーゼの量に対するテーブル1700またはテーブル1800からの推定値は、0.5ピコモルである。テーブル1700および1800から、ほぼ180,000カウント(平均60,000カウント)/ピコモル(N個の最も効率的にイオン化するペプチド基準で存在する特定のタンパク質の)が存在するということが判る。一般に、特定のカウントに対しては、存在するタンパク質の量の推定値は、和を使用する場合には式(1)により、ならびに平均を使用する場合には式(2)により次の通り与えられる。
【0026】
【数1】
【0027】
【数2】
【0028】
例えば、特定のタンパク質に対するN個の最も効率的にイオン化するペプチドの平均強度シグナル応答が650,000カウントの平均カウントを生じる場合には、式2およびテーブル1800を使用して、このタンパク質の絶対量の推定値は、650,000/324,800*5ピコモル=10ピコモルにより与えられる。値324,800は、テーブル1800から5ピコモルに対応する較正標準平均のデータ値である。同様に、0.50ピコモル濃度の使用は、650,000/31,800*0.5ピコモル=l0.2ピコモルを生じる。単一モルの較正標準値を使用することによって、対応する濃度が単一、つまり1であるために掛け算の必要性が無くなる。例えば、テーブル1800から1.00ピコモル値を使用することによって、650,000/62,800=10.4ピコモルが得られる。これらの値は相互の許容し得る誤差内にある。
【0029】
別法としては、周知の内挿法(例えば、直線、二次、多項式、三次スプラインなど)を使用して、特定のカウントに対応するモル濃度を求めることができる。
【0030】
これらの推定値の精度は、統計分析により提供可能である。周知の統計分析を行って、推定値に対する信頼水準を提供することができる。例えば、テーブル1700および1800は、濃度のいずれかに対するカウントに対する変動係数が20パーセント以内にあるということを示す。これは許容し得る範囲である。
【0031】
図14は、較正標準テーブル、例えば本発明の実施形態によるテーブル1700および1800を生成するための方法のフローチャートである。ステップ1402においては、較正標準に使用される1つ以上の較正標準タンパク質が同定される。ステップ1404においては、既知量(ピコモルの)の各々同定されている較正標準タンパク質が分解されて、構成成分のペプチドを生成する。例えば、このような分解は、酵素トリプシンを用いる消化であることができる。この既知量は、また、調製された消化物、例えばWaters Corporation(Milford,Massachusetts)から入手し得るMassPREP(商標)ペプチド消化標準品(例えばホスホリラーゼb、酵母エノラーゼ、ウシのヘモグロビン、酵母アルコールデヒドロゲナーゼおよびウシの血清アルブミンなどのタンパク質に対して入手し得る)を用いても入手可能である。ステップ1406においては、この分解結果に対して質量分析が行われる。ステップ1408においては、N個の最も効率的にイオン化するペプチドが同定される。ステップ1410においては、N個の最も効率的にイオン化するペプチドの和または平均が求められる。ステップ1412においては、対応する量のタンパク質と一緒に例えばテーブル、テーブル1700または1800など中にこの和または平均が保存される。この方法は、種々の濃度のタンパク質に対して反復可能である。本発明の実施形態においては、このテーブルは、また、テーブル中の濃度の各々に対する全部のタンパク質にわたる和または平均、すなわち複合和または平均も含む。
【0032】
この方法は、多数の異なる量のタンパク質に対して反復されて、較正標準テーブル、例えばテーブル1700または1800を生成する。較正標準には1つのみのタンパク質を使用する必要があるが、この方法の統計を改善するには、複数の選択された較正標準タンパク質に対する平均値が望ましい。この較正標準テーブルは、また、各較正標準タンパク質に対応する平均の和または平均のみ、ならびに場合により平均の和または平均の共分散を有することもできる。
【0033】
任意の数のペプチドもN個の最も効率的にイオン化するペプチドの組として使用可能である。しかしながら、3個以下を使用することは、不充分な統計を生じ得、正確でない。説明の通り、平均または和を使用して、較正標準テーブルを生成することができる。任意の1つ以上のタンパク質が較正標準タンパク質の組として使用可能である。較正標準テーブルを生成するのに、任意の1つ以上の異なる量のタンパク質が使用可能である。更なるタンパク質を使用することは、変動係数の推定値を提供して、以降の分析における更なる信頼度をもたらす。
【0034】
ペプチドがより多いと、より高いイオン化効率を生じるアミノ酸配列を有する可能性が増すので、より多数のペプチドを有するより大きなタンパク質は、より高いイオン化を示す、より多いペプチドを有する可能性が高い。より少数のトリプシンペプチドを生成するより小さいタンパク質は、高イオン化効率を示すアミノ酸配列を含む多くのペプチドを有する可能性が少ない。結果として、大きなタンパク質を分析する場合には、Nは高く設定され得る可能性がある。
【0035】
テーブル1700の保存は、各実験に対して較正標準テーブルを生成する必要性を排除する。更には、この較正標準テーブルは公表可能であるか、もしくは他人の使用に供することができる。例えば、このテーブルは、ジャーナルに公表可能であるか、もしくは関心のある使用者にディスクにより配布可能である。更には、このテーブルは、テーブルの版またはウエブサイトからダウンロード可能なテーブルにより配布を容易にすることができるインターネットウエブサイト上で公表可能である。このような較正標準テーブルを配布するための多数の他の方法は、当業者には周知である。この方法での公表は、特定の使用者の共同体が1つ以上のタンパク質を較正標準として使用することに同意する場合、特に有利であり得る。
【0036】
この較正標準テーブルは、また、特定の装置に対する較正の提供も行う。すなわち、この較正は、特定の装置に対して所与のタンパク質に対する1モル当りの実測カウント数を決める。この値は装置ごとに変わり得る。しかしながら、較正により決められると、この値は、特定の装置から生成されるすべてのタンパク質の絶対定量に適用可能である。
【0037】
図15は、本発明の実施形態にしたがって生成された較正標準テーブルを使用するための方法のフローチャートである。ステップ1502においては、タンパク質またはタンパク質の複雑な混合物を含有する試料は、構成成分のペプチドに分解され、およびLCMS中に通され、データを収集する。上記のように、この分解は、酵素トリプシンを用いる消化であることができる。ステップ1504においては、この分解結果に対して質量分析が行われる。ステップ1506においては、タンパク質が同定される。ステップ1508においては、ステップ1506で同定される各タンパク質に対してN個の最も効率的にイオン化するペプチドが同定される。ステップ1510においては、N個の最も効率的にイオン化するペプチドの和または平均(使用される較正標準テーブルに依って)がタンパク質の各々に対して求められる。ステップ1512においては、和(または平均)は較正標準テーブルと比較される。和(または平均)が存在する場合には、タンパク質の対応する量が数として使用される。
【0038】
和または平均が存在しない場合には、この比較は比較に基づいてタンパク質の絶対量を計算することを含む。このような計算は、式(1)または(2)において上述の変換を適用することを含むことができるか、もしくは他の周知の内挿法(例えば、直線、二次、多項式、三次スプラインを含む)を使用して、カウントに基づいてタンパク質のモル量を推定することができる。別法としては、較正標準テーブルがタンパク質の単一のモルに対応するカウントデータを含む場合には、この計算は、実測カウントを1モルに対応する較正標準テーブル中のカウントで割って、存在する特定のタンパク質のモル量の推定値を得ることができる。
【0039】
標準テーブルの生成については、N個の最も効率的にイオン化するペプチドの組として任意の数のペプチドも使用可能である。しかしながら、3個以下を使用することは、不充分な統計を生じ得、正確でない。
【0040】
テーブルの生成の場合またはテーブルの使用の場合のいずれにおいても、平均を使用する場合には、Nは異なるタンパク質に対しては異なることができる。このことは、より大きなタンパク質を使用する場合変動係数を低減し、したがって絶対定量の推定値の信頼度を増加し得る。
【0041】
図19は、本発明の実施形態にしたがった絶対定量のためのシステムの概略図である。このシステムは、質量分析計1901に結合されている液体クロマトグラフ1952を含む。質量分析計1901はコンピューター1914に結合されている。また、液体クロマトグラフ1952はコンピューター1914にも結合可能である。図19に図示した本発明の例示の実施形態においては、質量分析計1901は、Waters Corp.(Milford,Massachusetts)から入手し得るQ−TOF装置である。図19に図示した本発明の例示の実施形態においては、液体クロマトグラフ1952は、nanoACQUITY(商標)UPLCシステムまたはWaters Corp.(Milford,Massachusetts)から入手し得るWater CapLCである。
【0042】
操作においては、タンパク質混合物は、ペプチド成分に化学的もしくは酵素的に分解され、これによりペプチド混合物1950を形成する。ペプチド混合物1950はLC1952で分離される。この分離成分は質量分析計1901に導入される。このような導入の一つの方法は、検体スプレー1902を生じさせるためにエレクトロスプレーイオン化を使用することである。
【0043】
検体スプレー1902は、質量分析計1901の四重極区分1903に導入される。四重極区分においては、四重極1904は、質量分析計1901の飛行時間区分1905において引き続いて分析するために特定のイオンを選択するように調整されている。選択されたイオンは、衝突セル1906中で断片化される。このフラグメントは飛行時間区分1905の中に導入される。飛行時間区分1905においては、プッシャー1908は、フラグメントをリフレクトロン1910に向けて推進する。リフレクトロン1910は、イオンを検出器1912に反射する。検出器1912はイオン強度を検出し、引き続いて分析するためにイオンをコンピューター1914に送る。コンピューター1914はソフトウエアを実行して、上述の本発明の実施形態にしたがってフラグメントを分析する。コンピューター1914は、本明細書中で述べられる本発明の実施のために構成可能な任意のコンピューターおよびコンピューター装置であることができる。また、コンピューター1914は、較正標準テーブル、例えば較正標準テーブル1700を保存するためにメモリー1916も含む。メモリー1916は、例えば、RAM、ROM、PROM、EPROM、EEPROM、磁気ディスク、光ディスクまたはCD−ROMを含む、テーブル1700を保存することができるいかなる内部メモリーまたは外部メモリーであることもできる。スクリーンまたはディスプレイ1918は、情報を使用者に表示するためにコンピューター1914に結合される。キーボード1920もまた、使用者がデータを入力することができるように、コンピューター1914に結合される。キーボード1920はまた、使用者がコンピューター1914を周知の方法で操作するのを助けるように結合されているマウスまたは他のポインティングデバイスを有することもできる。コンピューター、例えばコンピューター1914およびこのメモリー1916ならびにコンピューター周辺装置、例えばディスプレイ1918、キーボード1920およびポインティングデバイス1922は、当業者には周知であり、更に説明する必要はない。
【0044】
本発明は、試料中のタンパク質の絶対量を求めるためのシステムおよび方法のみならず、定量を実証するための方法も提供する。例えば、タンパク質グリコーゲンホスホリラーゼの絶対定量が本発明の実施形態を用いて得られたと仮定する。5個のみの高イオン化効率ペプチドが実測されたとういうことを更に仮定する。図3は、グリコーゲンホスホリラーゼが8個の高イオン化効率のペプチドを有するべきであるということを図示する。結果として、5個のみのこのようなペプチドの実測は、実験における起こり得る誤差を示す。
【0045】
本発明の好ましい実施形態の前出の開示は、例示および説明の目的で提示されてきた。これは、網羅的であるように、もしくは本発明を開示されている精確な形に限定するように意図されていない。本明細書中で述べられている実施形態の多数の変形および改変は、上記の開示を照らせば当業者には明白である。本発明の範囲は、添付の特許請求の範囲のみによって、ならびにこの同等物によって規定されるべきである。
【0046】
更には、本発明の代表的な実施形態の説明において、本明細書は、本発明の方法を特定のステップの配列として提示してきたかもしれない。しかしながら、本方法が本明細書中で説明した特定のステップの順序によらない程度では、この方法は、説明した特定のステップの配列に限定されるべきでない。当業者ならば認識するように、他のステップの配列が可能であり得る。このため、本明細書中で説明した特定のステップの順序は、特許請求の範囲に対する限定と解釈されるべきでない。加えて、本発明の方法に関する特許請求の範囲は、書かれている順序のステップの性能に限定されるべきでなく、配列は変えられ得ること、ならびに本発明の精神および範囲内になお存在し得るということを当業者ならば容易に認識することができる。
【図面の簡単な説明】
【0047】
【図1】種々の量の酵母エノラーゼからのペプチドのシグナル応答を示す棒グラフである。
【図2】種々の量の酵母アルコールデヒドロゲナーゼからのペプチドのシグナル応答を示す棒グラフである。
【図3】は、種々の量のウサギグリコーゲンホスホリラーゼからのペプチドのシグナル応答を示す棒グラフである。
【図4】種々の量のウシの血清アルブミンからのペプチドのシグナル応答を示す棒グラフである。
【図5】種々の量のウシのヘモグロビン(α鎖)からのペプチドのシグナル応答を示す棒グラフである。
【図6】種々の量のウシのヘモグロビン(β鎖)からのペプチドのシグナル応答を示す棒グラフである。
【図7】図1に図示する量に対する酵母エノラーゼの上位3個の最も強いペプチドシグナル応答の平均のプロットである。
【図8】図2に図示する量に対する酵母アルコールデヒドロゲナーゼの上位3個の最も強いペプチドシグナル応答の平均のプロットである。
【図9】図3に図示する量に対するウサギグリコーゲンホスホリラーゼの上位3個の最も強いペプチドシグナル応答の平均のプロットである。
【図10】図4に図示する量に対するウシの血清アルブミンの上位3個の最も強いペプチドシグナル応答の平均のプロットである。
【図11】図5および6に図示する量に対するウシのヘモグロビン(αおよびβ鎖)の上位3個の最も強いペプチドシグナル応答の平均のプロットである。
【図12】図7から11に示すシグナル応答の複合プロットである。
【図13】図7から11に示すシグナル応答の複合正規化プロットである。
【図14】本発明の実施形態にしたがって較正標準テーブルを生成するための方法のフローチャートである。
【図15】本発明の実施形態にしたがって生成された較正標準テーブルを使用するための方法のフローチャートである。
【図16】試験されるタンパク質の各量に対して図1から6中のタンパク質の各々の上位3個の最も強いペプチドシグナル応答を示すテーブルである。
【図17】図16のテーブル中のタンパク質の各々に対するシグナル応答の和を表に作成したテーブルである。
【図18】図16のテーブル中のタンパク質の各々に対するシグナル応答の平均を表に作成したテーブルである。
【図19】本発明の実施形態にしたがって絶対定量するためのシステムの概略図である。
【特許請求の範囲】
【請求項1】
試料中のタンパク質を絶対定量するための方法であり、
試料を消化して試料中のタンパク質に関連するペプチドを入手し;
LC/MS装置を用いて消化生成物を分析して、特定のタンパク質に対するペプチドイオン化強度を得;
特定のタンパク質に対してN個の最高のペプチドイオン化強度を求め;
N個の最高の実測ペプチド強度の和および平均の1つを計算し;
計算された和または平均を較正標準と比較し;
比較に基づいて試料中に存在する特定のタンパク質の絶対量を求める
ことを含む、方法。
【請求項2】
Nが3以上である、請求項1に記載の方法。
【請求項3】
較正標準を生成することを更に含む、請求項1に記載の方法。
【請求項4】
(a)較正標準混合物中の所定のタンパク質の既知の量を入手し;
(b)較正標準混合物を消化して、前記タンパク質に関連するペプチドを入手し;
(c)前記ペプチドを分析して、前記ペプチドに対応するペプチドイオン化強度を求め;
(d)N個の最高のペプチド強度を選択し;
(e)選択されたN個の最高のペプチド強度の和および平均の1つを計算し;および
(f)較正標準として後で使用するために計算された和または平均をテーブル中に保存する
ことを更に含む、請求項3に記載の方法。
【請求項5】
Nが3以上である、請求項4に記載の方法。
【請求項6】
1つ以上の更なる所定のタンパク質に対してステップ(a)から(f)を繰り返すことを含む、請求項4に記載の方法。
【請求項7】
1つ以上の既知の濃度の所定のタンパク質に対してステップ(a)から(f)を繰り返すことを含む、請求項4に記載の方法。
【請求項8】
特定のタンパク質を同定することを更に含む、請求項1に記載の方法。
【請求項9】
内挿を用いて特定のタンパク質の量を計算することを更に含む、請求項1に記載の方法。
【請求項10】
較正標準中の量に基づいて実測量を転換することを更に含む、請求項1に記載の方法。
【請求項11】
試料中のタンパク質を絶対定量するための方法であり、
1つ以上のタンパク質に対する入力を有する較正標準テーブル(各々の入力がタンパク質の量およびこのタンパク質に対する対応する和または平均シグナル応答の1つを有する)を作り出し;
試料中のタンパク質に対応するペプチドを入手し;
質量分析計を用いて入手されたペプチドを分析して、前記ペプチドに対応するイオン化強度を得;
N個の最高の実測ペプチド強度の和および平均の1つを計算し;
計算された和または平均を較正標準テーブル中の1つ以上の入力と比較することにより、試料中に存在する特定のタンパク質の絶対量を求める
ことを含む、方法。
【請求項12】
Nが3以上である、請求項11に記載の方法。
【請求項13】
較正標準テーブルを作り出すことが、
(a)較正標準混合物中の所定のタンパク質の既知の量を入手し;
(b)較正標準混合物を消化して、前記タンパク質に関連するペプチドを入手し;
(c)前記ペプチドを分析して、前記ペプチドに対応するイオン化強度を求め;
(d)N個の最高のイオン化強度を選択し;
(e)選択されたN個の最高のペプチド強度の和および平均の1つを計算し;および
(f)計算された和または平均を較正標準テーブル中に保存する
ことを含む、請求項11に記載の方法。
【請求項14】
Nが3以上である、請求項13に記載の方法。
【請求項15】
1つ以上の更なる所定のタンパク質に対してステップ(a)から(f)を繰り返すことを含む、請求項13に記載の方法。
【請求項16】
較正標準テーブルを配布することを更に含む、請求項11に記載の方法。
【請求項17】
インターネットウエブサイト上の配布に使用可能である較正標準テーブルを作成することを更に含む、請求項11に記載の方法。
【請求項18】
試料中のタンパク質を絶対定量するためのシステムであり、
試料中の特定のタンパク質に対応するペプチドに対するイオン化強度を生成する質量分析計および;
1つ以上のタンパク質に対する入力を有する較正標準テーブル(各々の入力がタンパク質の量およびこのタンパク質に対する対応する和または平均シグナル応答の1つを有する)を保存するためのメモリー;および
コンピューターが特定のタンパク質のペプチドに対応するイオン化データを、質量分析計から入手し;
入手したペプチドイオン化データを分析し;
N個の最高の実測ペプチド強度の和および平均の1つを計算し;および
計算された和または平均を較正標準テーブル中の1つ以上の入力と比較することにより、試料中に存在する特定のタンパク質の絶対量を求めることを可能にするためにコンピューター上で実行されるコンピューターソフトウエアを含むコンピューター
を含む、システム。
【請求項19】
以降の分析のために試料を構成成分のタンパク質に分離するために液体クロマトグラフを更に含む、請求項18に記載のシステム。
【請求項20】
Nが3以上である、請求項18に記載のシステム。
【請求項1】
試料中のタンパク質を絶対定量するための方法であり、
試料を消化して試料中のタンパク質に関連するペプチドを入手し;
LC/MS装置を用いて消化生成物を分析して、特定のタンパク質に対するペプチドイオン化強度を得;
特定のタンパク質に対してN個の最高のペプチドイオン化強度を求め;
N個の最高の実測ペプチド強度の和および平均の1つを計算し;
計算された和または平均を較正標準と比較し;
比較に基づいて試料中に存在する特定のタンパク質の絶対量を求める
ことを含む、方法。
【請求項2】
Nが3以上である、請求項1に記載の方法。
【請求項3】
較正標準を生成することを更に含む、請求項1に記載の方法。
【請求項4】
(a)較正標準混合物中の所定のタンパク質の既知の量を入手し;
(b)較正標準混合物を消化して、前記タンパク質に関連するペプチドを入手し;
(c)前記ペプチドを分析して、前記ペプチドに対応するペプチドイオン化強度を求め;
(d)N個の最高のペプチド強度を選択し;
(e)選択されたN個の最高のペプチド強度の和および平均の1つを計算し;および
(f)較正標準として後で使用するために計算された和または平均をテーブル中に保存する
ことを更に含む、請求項3に記載の方法。
【請求項5】
Nが3以上である、請求項4に記載の方法。
【請求項6】
1つ以上の更なる所定のタンパク質に対してステップ(a)から(f)を繰り返すことを含む、請求項4に記載の方法。
【請求項7】
1つ以上の既知の濃度の所定のタンパク質に対してステップ(a)から(f)を繰り返すことを含む、請求項4に記載の方法。
【請求項8】
特定のタンパク質を同定することを更に含む、請求項1に記載の方法。
【請求項9】
内挿を用いて特定のタンパク質の量を計算することを更に含む、請求項1に記載の方法。
【請求項10】
較正標準中の量に基づいて実測量を転換することを更に含む、請求項1に記載の方法。
【請求項11】
試料中のタンパク質を絶対定量するための方法であり、
1つ以上のタンパク質に対する入力を有する較正標準テーブル(各々の入力がタンパク質の量およびこのタンパク質に対する対応する和または平均シグナル応答の1つを有する)を作り出し;
試料中のタンパク質に対応するペプチドを入手し;
質量分析計を用いて入手されたペプチドを分析して、前記ペプチドに対応するイオン化強度を得;
N個の最高の実測ペプチド強度の和および平均の1つを計算し;
計算された和または平均を較正標準テーブル中の1つ以上の入力と比較することにより、試料中に存在する特定のタンパク質の絶対量を求める
ことを含む、方法。
【請求項12】
Nが3以上である、請求項11に記載の方法。
【請求項13】
較正標準テーブルを作り出すことが、
(a)較正標準混合物中の所定のタンパク質の既知の量を入手し;
(b)較正標準混合物を消化して、前記タンパク質に関連するペプチドを入手し;
(c)前記ペプチドを分析して、前記ペプチドに対応するイオン化強度を求め;
(d)N個の最高のイオン化強度を選択し;
(e)選択されたN個の最高のペプチド強度の和および平均の1つを計算し;および
(f)計算された和または平均を較正標準テーブル中に保存する
ことを含む、請求項11に記載の方法。
【請求項14】
Nが3以上である、請求項13に記載の方法。
【請求項15】
1つ以上の更なる所定のタンパク質に対してステップ(a)から(f)を繰り返すことを含む、請求項13に記載の方法。
【請求項16】
較正標準テーブルを配布することを更に含む、請求項11に記載の方法。
【請求項17】
インターネットウエブサイト上の配布に使用可能である較正標準テーブルを作成することを更に含む、請求項11に記載の方法。
【請求項18】
試料中のタンパク質を絶対定量するためのシステムであり、
試料中の特定のタンパク質に対応するペプチドに対するイオン化強度を生成する質量分析計および;
1つ以上のタンパク質に対する入力を有する較正標準テーブル(各々の入力がタンパク質の量およびこのタンパク質に対する対応する和または平均シグナル応答の1つを有する)を保存するためのメモリー;および
コンピューターが特定のタンパク質のペプチドに対応するイオン化データを、質量分析計から入手し;
入手したペプチドイオン化データを分析し;
N個の最高の実測ペプチド強度の和および平均の1つを計算し;および
計算された和または平均を較正標準テーブル中の1つ以上の入力と比較することにより、試料中に存在する特定のタンパク質の絶対量を求めることを可能にするためにコンピューター上で実行されるコンピューターソフトウエアを含むコンピューター
を含む、システム。
【請求項19】
以降の分析のために試料を構成成分のタンパク質に分離するために液体クロマトグラフを更に含む、請求項18に記載のシステム。
【請求項20】
Nが3以上である、請求項18に記載のシステム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【公表番号】特表2008−542763(P2008−542763A)
【公表日】平成20年11月27日(2008.11.27)
【国際特許分類】
【出願番号】特願2008−514916(P2008−514916)
【出願日】平成18年6月2日(2006.6.2)
【国際出願番号】PCT/US2006/021517
【国際公開番号】WO2006/132994
【国際公開日】平成18年12月14日(2006.12.14)
【出願人】(504438255)ウオーターズ・インベストメンツ・リミテツド (80)
【Fターム(参考)】
【公表日】平成20年11月27日(2008.11.27)
【国際特許分類】
【出願日】平成18年6月2日(2006.6.2)
【国際出願番号】PCT/US2006/021517
【国際公開番号】WO2006/132994
【国際公開日】平成18年12月14日(2006.12.14)
【出願人】(504438255)ウオーターズ・インベストメンツ・リミテツド (80)
【Fターム(参考)】
[ Back to top ]