説明

質量分析バイオマーカーアッセイ

本発明は、サンプル中の1つ以上のポリペプチドバイオマーカーの存在を決定する方法であって、以下のステップ:(a)サンプルを質量分光(MS)分析に供し、検出される各シグナルについて、保持時間指数と対応する質量とを記録するステップ;(b)各シグナルに対応する質量を参照データベースのバイオマーカーの質量と関連付けて、各シグナルと参照バイオマーカーとの相関関係を形成し、参照バイオマーカーの質量と相関しない質量のシグナルを棄てるステップ;(c)参照バイオマーカーと相関する質量のシグナルを保存するステップ;(d)類似性測度を用いて各シグナルのMSスペクトルをデータベース中の参照バイオマーカーのMSスペクトルとマッチングさせることにより、保存された各シグナルと参照バイオマーカーとの相関関係を確認し、正相関シグナルのセットを定義するステップ;(d)各正相関シグナルの強度を測定し、その絶対シグナル強度または相対シグナル強度を、判別関数を用いてスコア化するステップ;(e)判別関数から得られたスコア値に閾値を適用し、バイオマーカーの存在または不在を決定するステップ、
を含んでなる、上記方法を提供する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、バイオマーカーのアッセイに関する。特に本発明は、質量分析によりサンプル中のバイオマーカーの存在を自動的にスクリーニングすることができる多重アッセイについて記載する。
【背景技術】
【0002】
バイオマーカーとして知られる様々な生物学的マーカーが同定され、医学的状態および毒物学的状態への生化学および分子生物学の適用を通じて研究されている。バイオマーカーは、組織と生体液のいずれにおいても発見され得る。血液は、バイオマーカー研究に使用される最も一般的な生体液である。
【0003】
バイオマーカーは予測力を有することが可能であり、またそれ自体、特定の症状または疾患の存在、レベル、種類または段階(特定の微生物または毒素の存在またはレベルを含む)、特定の症状または疾患に対する感受性(遺伝的感受性を含む)、または特定の治療(薬物治療)に対する応答性を予測または検出するために使用することができる。バイオマーカーは、研究開発プログラムの効率の改善により、創薬および薬剤開発の未来においてますます重要な役割を果たすだろうと考えられる。バイオマーカーは、診断薬、疾患進行のモニター、治療のモニターおよび臨床転帰の予測因子として使用することができる。例えば、様々なバイオマーカー研究プロジェクトが、特定の癌のマーカーならびに特定の心臓血管疾患および免疫疾患のマーカーの同定を試みている。
【0004】
インタクトなタンパク質は、ゲルベースの技術ならびに液相分離技術の両方を利用する多数の方法でアッセイすることができる。二次元ゲル電気泳動は、可溶化タンパク質混合物を用いて使用され、ここで該タンパク質は、電荷と大きさに基づいて分離される。このタンパク質は、異性体ならびに翻訳後修飾の両方が分離するように分離される。タンパク質の定量は染色技術によって行われ、染色前技術と染色後技術のいずれも利用し得る。代謝標識もまた、線形範囲を5桁まで延ばし、フェムトモル範囲の感度を与えることを可能とする。タンパク質の同定は、切り出されたゲルスポットから行う。このタンパク質は、化学的分解および化学的修飾の後消化される。結果として得られたペプチド混合物は、単離されたゲルサンプルから抽出され、その後質量分析によって同定される。
【0005】
多次元HPLC(高性能液体クロマトグラフィー)は、タンパク質またはペプチドの分離の優れた代替手段として使用することができる。タンパク質またはペプチドの混合物は、高い分解能を与えるクロマトグラフィーの固定相または次元を通過する。HPLCは、多くの実験法に対して適応性があり、目的とする特定のタンパク質種またはペプチド種の分離における適性のため、また互いの適合性ならびに下流の検出および同定の質量分析法との適合性のために、様々な固定相および移動相を選択することができる。高性能液体クロマトグラフィーは、現在、溶質分離の最良の方法であり、高度な再現性を有する自動運転も可能である。これらの種類のマルチメカニズム分離プラットフォームのオンラインコンフィギュレーションは、一般に、プロテオミクス研究の範囲内で用いられる。
【0006】
質量分析(MS)も、プロテオミクス分野の重要な構成要素である。実際、MSは、この分野において精製タンパク質を研究し、特徴付けるために使用される主要なツールである。何百または何千のタンパク質を示すプロテオミクスとMSとのインターフェースリンクはゲル技術によって構築され、高分解能を単一ゲル上で達成することができる。研究者らは、プロテオミクスを最初に推進した二次元ゲルに取って代えるために、MSの能力を上手く利用する。
【0007】
液相分離技術および/またはゲルベースの分離技術によって分離されたタンパク質またはペプチドを同定するための質量分析(MS)の応用および開発は、タンパク質およびペプチドの発現分析において、顕著な技術的進歩をもたらしている。タンパク質およびペプチドの質量分析による特性解析には、2つの主要な方法:マトリックス支援レーザー脱離イオン化(MALDI)とエレクトロスプレーイオン化(ESI)がある。ペプチドの質量または配列を決定するために、様々な方法を用いて、MALDIおよびESIのイオン源を飛行時間型(TOF)または他の種類の質量分析器と組み合わせることができる。
【0008】
MALDIでは、ペプチドをマトリックスと共結晶化し、レーザーで振動させる。この処理は、ペプチドを気化およびイオン化させる。その後、荷電したペプチドの分子量(質量)をTOF分析器で測定する。この装置中で、電場は荷電分子を検出器の方へ加速させ、イオン化ペプチドが検出器に到達するのに要する時間(ペプチドの飛行時間)の長さの差は、このペプチドの分子量を示し;小さなペプチドはより速く検出器に到達する。この方法は、ペプチド混合物の質量プロファイル(すなわち混合物中のペプチドの分子量および量のプロファイル)を生じさせる。その後、これらのプロファイルは、タンパク質配列データベースから既知のタンパク質を同定するために使用することができる。
【0009】
液体クロマトグラフィーに対してESI−MSインターフェースを構築する(LC/MS/MS)ことにより、LC−カラムから溶出したペプチドは、質量分析計のイオン源に導入される。極細針に電圧を印加する。その後、この針は質量分析器中に液滴を噴霧し、この液滴は分析器中で気化して、細分化された様々な荷電状態に応じてペプチドイオンが放出され、ここから配列を決定することができる。LC/MS/MSでは、研究者らは、ペプチドを最初に分離するためにマイクロキャピラリーLC装置を使用する。
【0010】
質量分析(MS)は、生体分子の固有の特性、その質量を極めて高感度で測定することから、重要な分析技術である。このためMSは、広範囲の分子種(タンパク質、ペプチド、または任意の他の生体分子)および広範囲のサンプル種/生物学的物質を測定するために用いることができる。MSシグナルの生成ならびにスペクトル分解および感度には、正確なサンプル調製が重要であることが知られている。従って、サンプル調製は、分析の全体的な実現可能性および感度のための重要な部分である。
【0011】
タンパク質は、クロマトグラフィーカラム物質の粒子(固定相)内での好ましくない物質移動のため、液相クロマトグラフィー分離技術による分離が難しい生体高分子である。しかし、タンパク質は、2つの隣接するアミノ酸を結合しているペプチド結合を切断することによって、さらに小単位(ペプチドまたはポリペプチド)の形態にすることができる。これは、プロテアーゼ(他のタンパク質と相互作用し、そのペプチド結合を分解することができるタンパク質)による酵素的切断によって達成することができる。トリプシンは、最も一般的に用いられるプロテアーゼであり、タンパク質発現解析研究で使用される。酵素的分解の後、結果として得られたペプチドの複合混合物は、キャピラリークロマトグラフィーによって分離および分画される。サンプル中で消化されたタンパク質の和である全ペプチドは、この段階では分解されない。対応するタンパク質から生成したペプチドは、クロマトグラフィー分画ステップ中の一単位としては分離されず、むしろサンプル中の他の全てのタンパク質から結果として得られたペプチドと一緒に分離される。高度に分解および分離された、キャピラリーから溶出したペプチドは、最も一般的には電荷および疎水性に基づいて分画される。分離されたペプチドは、プラットフォームのクロマトグラフィー部分から質量分析計へとオンラインで導入され、これによりコンタミネーションの可能性を回避する。その後、所定の時間窓に含まれる全ペプチドを捕捉するため、これらのペプチドの質量を測定する(m/z)。次に、配列決定(MS/MS)のため、所定の時間窓中の存在量に基づいて、多数のペプチドの質量を選択する。これは、エレクトロスプレーイオン化イオントラップ質量分析計システムによる新たなイオンサンプリングインターフェースによって行われる。このインターフェースは、トラップの性能を強化するためのイオンガイドおよびイオントラップとして線形四重極を用いる。線形四重極中のトラッピングイオンは、システムのデューティーサイクルを向上させるために示される。線形四重極に捕捉されたイオンの双極子励起は、不要なイオンを排出するために用いられる。
【0012】
1990年に成功した計測手段が初出した後、エレクトロスプレーイオン化(ESI)を用いたイオントラップ質量分析は、微量成分分析のための広範囲に用いられる手段となっている。エレクトロスプレーは、ペプチド、およびタンパク質などの重要なアナライトをイオン化し得る穏やかな源である。ESI中で生成された、高度に荷電したイオンは、質量分析器の幅を広げ得る。トラップ質量分析計は、フレキシブルタンデムMS性能(MS n.....)などの好ましい性能を有する。このイオン化プロセスでは、前駆体イオンは、形成されるフラグメントイオンの一部が質量選択的線形イオントラップ中で不安定となる条件下で、該トラップへの加速によって活性化される。時間遅延後、上記イオントラップの安定度パラメータは、以前は不安定であったフラグメントの捕捉を可能とするように変化する。その結果物は、改変された内部エネルギー分布を伴って前駆体イオンから生じるプロダクトイオンスペクトルである。線形イオントラップへの前駆体イオンのアドミッタンスの後、数ミリ秒間、前駆内部エネルギー分布の展開を追うことができる。時間遅延フラグメンテーションプロダクトイオンスペクトルは、典型的には、より簡単に解釈されるスペクトルを生じさせる低減連続フラグメンテーション生成物を示す。時間遅延フラグメンテーションのためには大切な、幾つかの重要な実験パラメータが同定され、且つ検討されている。この技術は、小さな前駆体イオンと多価ペプチドの両方に応用される。
【0013】
タンデム質量分析(MS/MS)は、多くの、現代の複合混合物の質量分析研究の中心にある。フラグメンテーションは、標的ガスとの衝突による前駆体イオンの活性化を伴い、荷電した中性のフラグメントを生成し得る。フラグメントイオンの性質ならびにそれらの強度は、前駆体イオンの構造を示すことが多く、このようにして未知のアナライトの同定について有用な情報を与え、また異なる種類のアナライトに対する有用なスクリーニング技術を提供することができる。多重衝突による活性化は、活性化時間を延長し、また前駆体イオン中により高いエネルギーを蓄積させることも可能とする。高い衝突ガス圧力はまた、高い衝突緩和率をも意味する。
【0014】
2次元ゲル電気泳動によるタンパク質分離と、質量分光分析による分析との組み合わせがバイオマーカー分析に有用であることが証明されているが、現在のところ、幾つかのバイオマーカーを分析し得る多重システムが実験段階にある。
【0015】
多くの疾患が、バイオマーカーの複雑なパターンと関連していることが示されており、このパターンは、当該疾患の診断となり、または薬物療法に対する患者の応答性を示すことができる。これらのパターンは幾つかのバイオマーカーを含むことが多く、多重同時分析を必要とする。従って、同時に多数のバイオマーカーをアッセイし得るシステムが必要とされている。理想的には、このシステムは自動化することができる。
【発明の概要】
【発明が解決しようとする課題】
【0016】
本発明は、自動化され且つ正確な、生物学的サンプル中のバイオマーカー用のアッセイを提供する。このアッセイは、バイオマーカーを同定するための質量分析に依存するものであり、本明細書中では質量分析バイオマーカーアッセイ(MSBA)と呼ぶ。
【課題を解決するための手段】
【0017】
本発明は、好ましくはヒト試験サンプル中の1つ以上のポリペプチドバイオマーカーの存在を決定する方法であって、該サンプルが非ヒト試験サンプル(典型的には、一定量の組織、血液、または他の臨床的に得られた検体に含まれる天然のタンパク質およびペプチドを含有する一定量の生体液に限られる)を含み得る、上記方法を提供する。
【0018】
本発明の方法は、好ましくは、以下のステップ:
(a)サンプルを質量分光(MS)分析に供し、検出される各シグナルについて、保持時間指数と対応する質量とを記録するステップ;
(b)各シグナルに対応する質量を、既知の疾患または生物学的変化から得られたバイオマーカーの質量のマスターセットを保持する参照データベースと関連付けて、各試験サンプルのシグナルと参照データベース内のバイオマーカーのマスターセットから得られるバイオマーカーとの相関関係を形成し、マスターデータセット内の参照バイオマーカーの質量と相関しない質量の試験シグナルを棄てるステップ;
(c)マスターデータ中の参照バイオマーカーと相関する質量の試験サンプルシグナルを保存するステップ;
(d)類似性測度を用いて各シグナルのMSスペクトルをデータベース中の参照バイオマーカーのMSスペクトルとマッチングさせることにより、保存された各シグナルと参照バイオマーカーとの相関関係を確認し、正相関シグナルのセットを定義するステップ;
(d)保存された各試験シグナルの正相関シグナルの強度を測定し、その絶対シグナル強度または相対シグナル強度を、判別関数を用いてスコア化するステップ;
(e)判別関数から得られたスコア値に閾値を適用し、バイオマーカーの存在または不在を決定するステップ、
を含んでなる。
【0019】
好ましくは、本発明の方法は、試験サンプルのスクリーニング段階で、マスターデータセットを用いる。
【0020】
有利には、本発明の方法は、マスターデータセット中の特定の同定されたタンパク質配列に関連する電荷、質量、配列スペクトルの固有の特性の各々に基づくデータセットの、質量と配列同一性をフィルタし、スクリーニングする。
【0021】
従って、第1の態様において、本発明は、サンプル中の1つ以上のポリペプチドバイオマーカーの存在を決定する方法であって、以下のステップ:
(a)サンプルを質量分光(MS)分析に供し、検出される各シグナルについて、保持時間指数と対応する質量とを記録するステップ;
(b)各シグナルに対応する質量を、バイオマーカーの質量の参照データベースと関連付けて、各シグナルと参照バイオマーカーとの相関関係を形成し、参照バイオマーカーの質量と相関しない質量のシグナルを棄てるステップ;
(c)参照バイオマーカーと相関する質量のシグナルを保存するステップ;
(d)類似性測度を用いて各シグナルのMSスペクトルをデータベース中の参照バイオマーカーのMSスペクトルとマッチングさせることにより、保存された各シグナルと参照バイオマーカーとの相関関係を確認し、正相関シグナルのセットを定義するステップ;
(d)各正相関シグナルの強度を測定し、その絶対シグナル強度または相対シグナル強度を、判別関数を用いてスコア化するステップ;
(e)判別関数から得られたスコア値に閾値を適用し、バイオマーカーの存在または不在を決定するステップ、
を含んでなる、上記方法を提供する。
【0022】
本発明の方法は、使用者が、サンプル中の何百または何千のバイオマーカーを同時に分析することを可能とする。この方法は、疾患と関連することが示されているバイオマーカーのデータベースであって、各バイオマーカーの質量およびスペクトルのデータを含み、MSBAソフトウェアによって、所定のサンプル中で該バイオマーカーを正確に同定することを可能とする上記データベースに依存する。サンプル中に存在するペプチドをスクリーニングし、ペプチドがMS検出器に到達する時間に相関する保持時間指数に基づいて不要な配列を除去することにより、数分で30,000配列以上を分析し、所定のバイオマーカーを高信頼度で同定することができる。本発明の方法は自動化可能であり、ハイスループットであり、比較的熟練していない技術者が操作することができる。
【0023】
このサンプルは、事前に分離手順を行うことなくMS分析に供することができる。このような実施形態において、サンプルは、好ましくは静電ナノエレクトロスプレー法、フローインジェクション分析またはサンプル濃縮を伴うフローインジェクションを用いた直接注入によって分析される。
【0024】
有利には、サンプルはMS分析の前に処理され、好ましくは、MSにかける前にサンプル成分を分離するために処理される。例えば、サンプル処理は、一段階または多段階の高圧液体クロマトグラフィー(HPLC)によるサンプル分離を含む。
【0025】
MSシステム自体は、好ましくは、エレクトロスプレーイオン化(ESI)MS、マトリックス支援レーザー脱離イオン化−飛行時間型(MALDI−TOF)MSまたは表面増強レーザー脱離イオン化−飛行時間型(SELDI−TOF)MSである。
【0026】
本発明による方法は、有利には、自動化され、コンピューター制御下で行われる。サンプル中のバイオマーカーの同定は、該バイオマーカーについて参照データと比較することにより行われる;好ましくは、複数のバイオマーカーについて、参照質量およびMSスペクトルデータがコンピューターに保存される。
【0027】
定義されたバイオマーカーの参照MSスペクトルは、好ましくは、クラスタリング計算によって得られた実データおよび測定データから得られた平均スペクトルである。
【0028】
本発明の方法は、2つの方法で実施することができる:内部標準を用いてシグナル強度を定量するための参照を提供する方法と、このような標準を用いない方法である。このように、1つの実施形態において、MSによる分析の前に、1つ以上の内部標準がサンプルに加えられる。好ましくは、この内部標準は標識されている。
【0029】
このような本発明の実施において、各バイオマーカーシグナルの絶対シグナル強度は、バイオマーカーシグナルの強度を測定し、それを1つ以上の既知の内部標準のシグナル強度と比較することによってスコア化される。
【0030】
別の実施において、サンプルは、内部標準の添加を行わずに処理される。このような実施形態において、相対シグナル強度は、1人の患者の個々のバイオマーカーのシグナル強度と、患者グループの参照シグナル強度との間の比を測定することによってスコア化される。
【0031】
バイオマーカーは、「正常な生物学的プロセス、病理学的プロセス、または治療的介入に対する薬理反応の指標として客観的に測定および評価される特性」と説明される。バイオマーカーは、特定の症状または疾患に関連する任意の識別可能且つ測定可能な指標であり、バイオマーカーの存在またはレベルと、症状または疾患の一部の態様(症状もしくは疾患に対する感受性、または症状もしくは疾患を治療するために使用する薬剤に対する反応性の存在、レベルもしくは変化レベル、種類、段階を含む)との間には相関関係がある。この相関関係は、定性的、定量的、または定性的且つ定量的であり得る。典型的には、バイオマーカーは化合物、化合物フラグメントまたは一群の化合物である。このような化合物は、生物中に見出される、または生物によって生産される任意の化合物(タンパク質(およびペプチド)、核酸ならびに他の化合物など)であり得る。
【0032】
サンプルは、任意の目的とする生物学的物質であってよいが、有利には生物学的組織であり、好ましくは、血液または血漿などの生体液である。
【0033】
本発明の方法は、観測されるMSシグナルと、既知のバイオマーカーの参照質量およびMSスペクトルとの相関関係に依存する。参照データは、好ましくは、コンピューターサーバー上に保存され、全ての手順をコンピューター制御下で実行することを可能とする。
【0034】
シグナルは、例えば本明細書中に記載される計算関数を用いて、比較により参照標準と関連付けられる。好ましくは、シグナルは、類似性閾値レベルが達成されるか否かに応じて、「陽性」または「陰性」と特徴付けられる;陰性で類似性閾値レベルを達成しないシグナルは、MSBA工程において棄てられるが、陽性シグナルはバイオマーカーと一致し、生物学的サンプル中の該バイオマーカーの存在の診断をもたらす。
【0035】
シグナル強度は、MSBAアッセイの実施に応じて、生物学的サンプルに添加される既知の対照標準を基準にして、または患者グループ全体で計算される参照強度との比較を基準にして測定される。
【0036】
標準を用いた実施の場合、バイオマーカーシグナルのMSBAスコアリングは、サンプル中に存在するバイオマーカーのシグナルと、サンプルに添加された内部標準との比によって計算される。多重アッセイ中の全バイオマーカーは、同様に分析され、最終のMSBAスコアリングファクターを生じる。
【0037】
MSBA方法中に絶対定量法を組み込むためには、内部較正標準の使用が好ましい。このような標準は、例えば、タンパク質配列に関してアッセイの読出しを極めて正確にし、また絶対定量に関して有利とする同位体標識である。MSBAスクリーニング中に組み込まれた較正配列は、血液、または任意の他の臨床サンプル中の絶対タンパク質バイオマーカーレベルの測定を可能とする。
【0038】
多重読出しを用いてタンパク質配列バイオマーカーを検出し且つ定量するための、多数の関連したステップからなる新たな方法が提供され、この方法では、2〜100個のバイオマーカー(限定するものではない)の発現レベルを単一のMSBA読出し中にマッピングすることができる。MSBAシステムは、単一線診断マッピングを扱い得る液相プラットフォーム上、またはサンプルの同時並行処理を伴う多重フローコンフィギュレーション上に構築され、これによりシステムの能力とスループットを増大させる。MSBA法の検出様式は、正確な質量同定および配列決定であり、その後の質量分光分析による定量である。
【0039】
この方法は、液体形態の、あるいは液体形態に変換し得る任意の種類の生物学的サンプルに適用することができる。MSBA法はまた、任意の種類の細胞プロセスまたはバイオテクノロジー工程に由来するサンプルを処理することも可能であり、例えば、長時間の動的プロファイルが測定される。この長時間にわたる分析は、その後長時間かけて、MSBAプラットフォームにサンプルを自動的に導入することによって行われる。MSBA診断プロファイリングの全分析能力は、質量シグナル評価、配列分析、識別を比較することによる多重定量および最終的なMSBAスコア診断を含め、完全にコンピューター制御である。このプラットフォーム上で行われるMSBAサイクル中の全ての中間ステップは、任意の所与の生物学的サンプルから得られる、MSBA分析の各サイクルで生成される大量のデータから得られる正確な決定を行う専用のアルゴリズムによって評価される。
【0040】
本発明のMSBA方法は、独立に存在する、あるいはタンパク質およびペプチドの複合混合物中に存在する、特定のペプチドならびにその生化学的に改変された変異体の同定をもたらす。各ペプチドは、その正確な質量、または所定の免疫試薬に対するその固有の免疫親和性結合特性のいずれかによって選択的に同定し得る特定のアミノ酸配列によって定義することができる。
【0041】
本発明の方法は、統計的に有意なタンパク質同一性およびその改変型の同定を可能とする。さらに、内部標準を使用せずともサンプル中の各バイオマーカーの相対量を測定することができる。別法として、任意の所与の生物学的サンプルにおいて、内部標準を使用することによって各バイオマーカーの絶対定量を個別に行うことが可能であり、ここで、これらの内部標準(例えば、n=1〜20)は、当該バイオマーカーのタンパク質配列である。その後、これらの内部標準は、非放射性のアミノ酸配列として、または放射性標識されたアミノ酸配列として作成することができる。この標準は、標識化の可能性を除いて、選択されたバイオマーカーと同一の配列を有する。
【0042】
本発明の方法は、生物学的物質サンプル中に存在する固有のタンパク質配列の特定の処理、分離、単離、および同定をもたらす幾つかの重要なステップを組み合わせるものである。本発明の方法は、ヒト臨床サンプルに適用することができる。本発明の方法は、非ヒト動物に由来するサンプルに適用することもできる。
【0043】
発明者らは、所与のサンプルの所与の多重バイオマーカーグループ(その大きさは、例えば、2〜100個の範囲であり得る)中で定量的変化を有することが示されている生物学的サンプルから得られた実体の原子質量単位として存在する固有のタンパク質配列の同一性を同定するための多段階法を提供する。
【0044】
発明者らは、さらに、任意の特定の生物学的サンプル中のバイオマーカーが、臨床サンプル、細胞サンプルまたは任意の他の種類のサンプル中で、予め決定されたタンパク質配列のバイオマーカーセットの多重定量的変化を有することを決定または確認する方法を提供する。この定量的変化は、最終的にはMSBAアルゴリズムで計算され、診断読出しとなるMSBAスコアを生成する。
【0045】
さらに、統計的に有意な類似性を検出し、固有のタンパク質配列同一性または多重ペプチド同一性として登録することができる。統計的に有意な類似性の決定は、公的に入手可能なタンパク質および遺伝子の配列データベース、ならびにMSBA法の要求を満たすために特に開発されたアルゴリズムを使用するステップを含む。
【0046】
バイオマーカー同定のためのプロセスステップの統合は、有利である。統合されたプロセスは、以下の方式に依存する:1)高品質な生物医学的臨床物質、2)再現可能且つ高速なサンプル処理およびその後の液相分離、3)正確な、バイオマーカーの多重セットの定量的且つ定性的な決定、および4)データ生成を制御し、多重タンパク質配列グループ中のバイオマーカーを1つずつ計算し、単離することを可能とするアルゴリズム。
【図面の簡単な説明】
【0047】
【図1】MSBA法の概略図を示す。
【図2】MSBAに含まれるデータ処理をさらに詳細に例示する。
【図3】肺疾患患者に由来する血液サンプルから得られた質量スペクトルを示す。サンプル中で多重バイオマーカーが同定される。
【図4】図4は、多重アッセイから作成された、MSスペクトルで示されるバイオマーカーのアノテーションの例を示し、この例では、バイオマーカーは、MSBAソフトウェア、および結果として得られたCVLFPYGGCQGNGNKバイオマーカーを表す追加MS/MSスペクトルによって認識された。
【図5】実施例2に記載される、19人の患者のサンプルデータ上で11個のバイオマーカーシグナルを用いたMSBAモデルの予測可能性評価の例を示す。10の症例と9の対照を、盲検サンプルのようにして用いた。式5を用いて、各被験体のMSBAスコアを計算した。この例では、MSBAスコアが1以上の被験体は症例(赤丸)と診断した。そうでない場合、被験体は対照(青丸)と考えられた。予測精度は100%であった。
【図6】実施例3に記載される、96人の患者のサンプルデータ上で10個のシグナルを用いてMSBAモデルを使用した自動判別の結果を示す。各点は1人の患者を表し、縦軸は、式6を用いて計算した判別スコア(z)を表す。このスコアが0を越える場合、疾患の症例(赤丸)であると判断した。そうでない場合、被験体は対照(青丸)と考えられた。予測精度は83.3%であった。
【発明を実施するための形態】
【0048】
バイオマーカー
FDAの定義するバイオマーカーとは、「正常な生物学的プロセス、病理学的プロセス、または治療的介入に対する薬理学的反応の指標として客観的に測定および評価される特性」である。
【0049】
本明細書中で使用される用語「バイオマーカー」は、上記のFDAの定義と一致する、疾患の存在または進行をモニターするために使用し得るポリペプチドを指す。
【0050】
バイオマーカーは、診断薬、疾患進行のモニター、治療のモニターおよび臨床転帰の予測因子として使用することができる。例えば、様々なバイオマーカーの研究プロジェクトが、特定の癌のマーカーおよび特定の心臓血管疾患および免疫疾患のマーカーの同定を試みている。
【0051】
これらの疾患関連タンパク質の一部は新規な薬剤標的として同定することが可能であり、また一部は疾患進行のバイオマーカーとして有用であり得る。このようなバイオマーカーは、新たな薬の臨床開発を改善するため、または特定の疾患の新たな診断法を開発するために使用することができる。
【0052】
疾患関連タンパク質は当技術分野において公知であり、疾患のバイオマーカーとしてのこれらの使用は確立されている。かかるバイオマーカーは、本発明を用いてモニターすることができる。しかし、新規な疾患関連タンパク質を同定する可能性もある。疾患関連タンパク質の検出は、例えば以下の方法によって達成し得る。タンパク質サンプルを、一人の患者または患者のグループから採取する。これらのサンプルは、タンパク質および/またはペプチドの構成成分を抽出し、濃縮するように処理された細胞、組織、または生体液であってよい。この処理は、一般的には液相への分配を必要とするが、固体マトリクスに結合したタンパク質および/またはペプチド成分の確立も含み得る。分離と分析(プロテオミクス、ペプチドミクス)の後、定性的測定および定量的測定によって、疾患のある被験体および健康な被験体の両方についてタンパク質発現フィンガープリントが作成される。これらのフィンガープリントは、個体を識別し、ならびに/または特定の自然のプロセスもしくは疾患のプロセスを確立しおよび/または追跡するための固有の識別子として使用することができる。これらのプロトタイプフィンガープリントは、個々のサンプル/被験体のそれぞれについて確立され、コンピューターデータベース中に数値として記録される。その後、このフィンガープリントは、プロトタイプフィンガープリント中に存在し、その発現が健康な被験体および疾患のある被験体に由来するサンプル中に異なって存在していてもよいし、異なって存在していなくともよいタンパク質またはペプチドを同定および選択するために、バイオインフォマティクスツールを用いて分析される。その後、これらのタンパク質/ペプチドはさらに特徴付けられ、当該タンパク質またはペプチドの特徴的な物理的特性を同定する詳細なプロファイルが作成される。単一のタンパク質/ペプチドまたはタンパク質/ペプチドのグループのいずれも、特定の自然のプロセスまたは疾患のプロセスと顕著に関連していると決定することができる。
【0053】
質量分析
質量分析は、タンパク質およびペプチドの分析のための選択法である。現代のバイオマーカー発見の研究は、2つの主要な質量分析法を用いている:タンパク質が結晶状態で分析されるMALDI−TOF(マトリックス支援レーザー脱離イオン化飛行時間型)質量分析と、タンパク質が液体状態で分析されるESI(エレクトロスプレーイオン化)質量分析である。さらにMALDIの、表面増強されたチップの利用(表面増強レーザー脱離イオン化(SELDI)と呼ばれる)は、バイオマーカー発見の研究において広範囲に用いられている。例えば、Petricoin et al., Lancet, 16, 572-577, 2002;Alexe et al., Proteomics. 2004, 4766-4783;およびLiotta et al., Endocr Relat Cancer. 2004 Dec;11(4):585-7を参照のこと。
【0054】
表面増強レーザー脱離イオン化(SELDI)−TOF−MS技術は、アッセイ標的プレートに結合されたクロマトグラフィー面を使用する。その後、このプレート上のタンパク質が結合した物質を、MALDI−MSによって直接分析する。SELDIは、ペプチドおよびタンパク質を主に低分子質量範囲内でアッセイする。この技術は、好適な最新の精製スキームが統一されていない、主要な中量のペプチドおよびタンパク質に適用することができる。このSELDI技術は主に、ペプチドのMALDI−TOF−TOF同定を用いて配列決定を行い得るパターンを生じさせる。
【0055】
マルチメカニズム分離プラットフォームは、エレクトロスプレーイオン化質量分析とオンラインで、またはマトリックス支援レーザー脱離イオン化質量分析などのイオン化法とオフラインで形成された、高分解能ペプチド分離を可能とする。例えば、Aebersold,R. & Goodlett,D.R. Chem. Rev. 2001, 101, 269-295;Mann, et al., Annu. Rev. Biochem, 2001. 70, 437-473;Wolters, et al., Anal. Chem. 73, 5683-5690 (2001);およびWashburn, et al., Nat. Biotechnol. 19, 242-247 (2001)を参照のこと。
【0056】
質量分析(MS)は、プロテオミクス分野の重要な要素でもある。実際、MSは、この分野においてタンパク質の構造および配列を研究し、特徴付けるために用いられる主要なツールである。Aebersold, R. & Mann, M. Mass spectrometry-based proteomics. Nature 422, 198-207 (2003);Steen, H. and M. Mann (2004). Nat Rev Mol Cell Biol 5(9): 699-711;ならびにOlsen, J. V. and M. Mann (2004) Proc Natl Acad Sci USA 101(37): 13417-22を参照のこと。
【0057】
研究者らは、プロテオミクスを最初に推進した二次元ゲルに取って代えるために、MSの能力を上手く利用している。ESIと液体クロマトグラフィー(LC)/MS/MSを使用する場合、ペプチド混合物を含む極細針に電圧を印加し、ペプチド配列を生成し、LCカラムから溶出させる。その後、この針は質量分析装置中に液滴を噴霧し、ここで該液滴は蒸発してペプチドイオンが放出される。LC/MS/MSでは、研究者らは、マイクロキャピラリーLC装置を使用してペプチドを最初に分離する。
【0058】
質量分析(MS)は、生体分子の固有の特性、その質量を極めて高感度で測定することから、有用な分析技術である。このためMSは、広範囲のサンプル種/生物学的物質中の、広範囲の分子種(タンパク質、ペプチド、または任意の他の生体分子)を測定するために使用することができる。
【0059】
正確なサンプル調製は、MSのシグナル生成ならびにスペクトル分解能および感度に影響を与え得る。一次元高圧液体クロマトグラフィー(LC)および多次元液体クロマトグラフィー(LC/LC)などの高分解能分離システムは、質量分析と直接結合することができる。この結合は、生成された質量スペクトルの範囲内での定量ならびに配列情報の両方を示す大きなデータセットの、高速で自動化された取得および収集を可能とする。この統合されたショットガンプロテオミクス技術は、MudPIT(多次元タンパク質同定技術)として知られている。Eng et al., J Am Soc Mass Spectrom 1994, 5: 976-989;Link et al., Nat Biotechnol. 1999 Jul;17(7):676-82;Washburn et al., Nat Biotechnol. 2001 Mar;19(3):242-7;Lin et al., American Genomic/Proteomic Technology, 2001 1(1): 38-46;およびTabb et al., J. Proteome Res. 2002 1:21-26を参照のこと。
【0060】
ショットガンプロテオミクス法では、インタクトなタンパク質よりはむしろ、トリプシンならびに他のエンド−、およびエキソ−ペプチダーゼ/プロテイナーゼなどの特定のタンパク質消化酵素によって生成されたペプチドが分析される。このフラグメンテーションは、様々な物理的および化学的特性を有する非常に大きなタンパク質(例えば、極めて疎水性、または極めて塩基性のタンパク質)であっても分析し得るという事実から明確な有利点を提供する。このようなタンパク質種は、他の方法では取り扱いが困難である可能性がある。これらのタンパク質は、正確なタンパク質のアノテーション(注釈付け)および同定を可能とするのに十分な大きさおよび数の、結果として得られたペプチド混合物を生じさせる。しかし幾つかのペプチドは、各タンパク質からそれぞれ生成されるため、分析対象の混合物の複雑度は増大する。結果的に、ショットガン法にはかなりの機器時間および計算能力が必要となる。しかし、タンパク質発現情報の豊富さは広範であり、完全に自動化された設定で、同時リアルタイムタンパク質同定を用いて生成される。
【0061】
様々な疾患の程度を示す様々な患者のサンプルを扱うことを可能とするため、様々な方法を利用して、結果として得られた液体クロマトグラフィーのクロマトグラムおよび質量スペクトルを調整し整列させることができる。この正規化はソフトウェア法によって行うことが可能であり、これにより、全実験から作成された全シグナル生成を使用し、分析した様々な患者のサンプルのシグナルと比較する。全てのシグナルの平均値および共通点が並べられ、示差定量が可能となる。
【0062】
第2の方法では、所定量のペプチド標準をサンプルに加える。この添加は、サンプル消化の前および後の両方、または、サンプル消化の前もしくは後のいずれかに行う。使用する標準は、放射性標識した配列として合成され、あるいは放射性標識せずに合成される実際のバイオマーカー配列であり、サンプルに加える。
【0063】
定量的臨床タンパク質調節の研究のための、プロテオミクス分野の範囲内での標識化技術の使用は極めて一般的である。様々な標識化技術が開発され、多様な結合化学を利用して用いられている。プロテオミクス分野の範囲内で最も一般的に使用されている標識は、ICAT標識とITRAQ標識である。Parker et al., Mol. Cell. Proteomics, 625-659, 3, 2004;Ross et al., Cell. Proteomics, 3, 1153-1169, 2004;およびDeSouza et al., J. Proteome Res., 2005, 4, 377-386を参照のこと。
【0064】
サンプル分離
シングルHPLC(高性能液体クロマトグラフィー)、または多次元HPLCは、タンパク質またはペプチド分離の好適な代替として使用される。タンパク質またはペプチドの混合物は、より高い分解能を与える一連のクロマトグラフィー固定相または次元を通過する。HPLCは、多くの実験法に適合させることが可能であり、目的とする特定のタンパク質種またはペプチド種の分離における適性について、さらに相互の、また下流の検出および同定の質量分析法との適合性について、様々な固定相および移動相を選択することができる。HPLCは、タンパク質分解酵素によって消化され、対応する酵素反応生成物(ペプチド混合物)が生成される臨床サンプルを分離するために使用される。サンプル調製法は、血液、組織、または任意の他の種類の生体液などのタンパク質サンプルに適用される。例えば、Schulte et al., Expert Rev. Diagn., 5(2), 2005, 145-157;Chertov et al., Expert Rev. Diagn., 5(2), 2005, 139-145;Adkins et al., Mol. Cell. Proteomics, 1 (12), 2002 947-955;Pieper et al., Proteomics. 2003 Jul;3(7):1345-64;およびAnderson, N. L. & Anderson, N. G. Mol. Cell Proteom.2002 1, 845-867を参照のこと。
【0065】
対応するペプチド混合物は、高い分解能を与える一連のクロマトグラフィー固定相または次元を通過する。HPLCは、多くの実験法に対して適応性がある;本発明の設定では、ヒト血液サンプル中で発現しているタンパク質の多量の画分を特異的に除去する最適化がなされ、これにより中量、および低量の領域中のタンパク質の濃縮が行われる。ペプチドおよびタンパク質の分離は、ペプチド配列、ペプチド配列の官能基、ならびに物理的特性に基づく。
【0066】
MSBA操作法
多くの場合、サンプルをMSBAにかける前に、サンプルの処理および調製のステップが必要とされる。MSBA法の前にこのステップを導入する目的は、阻害剤とマトリックス成分を除去し、それにより全体の検出能の向上を促進し、アノテーションならびに全体の感度の増加をもたらすことである。しかしながら、特定の実施形態では、特にバイオマーカーが多量に存在し、サンプルの複雑度が低い場合、サンプル調製は省いてもよい。当業者であれば、調製ステップが必須であるか否かを決定することができるだろう。
【0067】
MSBAプラットフォームは、多数の異なる方法で操作することが可能であり、その方法は、主にサンプルの性質およびその複雑度によって決定される。
【0068】
バイオマーカータンパク質配列は、患者サンプル中で、多重分析によって定性的および定量的に決定される。可能性のある2つの方法(内部標準添加法および内部標準を用いない方法)によるMSBAアッセイの構成を用いて、標識MSBA法および非標識MSBA法のいずれも使用することができる。
【0069】
一般的方法
サンプル調製の後、サンプルをMSBAプラットフォームに注入する。
【0070】
次に、以下の操作を行う;
ステップ1A
最初に、サンプル中でバイオマーカーMSシグナルを同定する必要性がある。
【0071】
バイオマーカーの所定のリストは、保持時間指数と相関する+/−1ダルトンの質量を収載し、各バイオマーカーの対応する質量が生体液サンプル中でスクリーニングされる。ほとんどのMSBAアッセイで得られる相対保持時間指数は、分で定義され、約+/−2%の変動性を有するが、この数字は変化し得る。
【0072】
これらのステップは、図1に示すように、MSBA参照スペクトルのリポジトリに対するリアルタイム質量スペクトルマッチングによって実施される。
【0073】
次に、MSスペクトル中の質量を、バイオマーカーの参照リストの質量と、約+/−1ダルトンまで比較する。
【0074】
ステップ1B
バイオマーカー候補の質量が、+/−1ダルトンの範囲内で、参照リスト中のマッチングMSスペクトルを有するバイオマーカーの質量であると確認された場合、その情報はMSBAサーバー上に保存される。この質量が不正確な場合、MSBAスクリーニングは、スペクトルファイルのサーバーへの保存を行わない。
【0075】
これらの操作は、ファイル共有およびプロセス間通信(例えば、クライアント/サーバー型通信)メカニズムによって実行される。
【0076】
ステップ2A;
MSスペクトルの質量の同一性が確認された場合、質量同定および配列同一性分析を開始する。
【0077】
MSBAソフトウェア中のパターンマッチングステップは、特定の類似性測度(例えば、コサイン相関)を同定する。類似性測度を用いて、正確なタンパク質配列を確認する。この確認は、スペクトルマッチングによってなされる。スペクトルマッチングは、サンプルのスペクトルと、MSBAデータベース中の参照スペクトルとの比較により行われる。この段階での正の同一性について、正確なタンパク質配列を確認するため、0.8以上の高いコサイン相関因子が必要とされる。当業者には、代替的類似性測度の対応する閾値は明らかであろう。
【0078】
参照スペクトルの比較および評価は、以下の方法で行う。
【0079】
MS/MSスペクトルは、二重項(m,v)のリストとして表され、ここで、mは質量と電荷の比を表し、vはイオンシグナル強度値を意味する。mを、m(m=周波数番号(ビン(bin))の実際の幅)の区間と合算(ビニング(binning))することにより、MS/MSスペクトルをベクトル
【数1】

【0080】
で表現することも可能であり、ここでその長さ(n)はビンの数と等しく、各エレメントの値は各ビン内の全シグナル強度の和である。これは、MS/MSスペクトルのプロファイル表現である。
【0081】
2つの異なるMS/MSスペクトル
【数2】

【0082】
のコサイン相関(S)は、式1;
【数3】

【0083】
で表されるコサイン相関として計算することができる。
【0084】
Sの値は0〜1.0Aまで変化し、値0は2つのベクトルが完全に独立していることを示し;Sベクトルの値が1である場合、これは2つのベクトルの方向が同じであることを示す。
【0085】
ここで、2つのMS/MSスペクトルベクトルが同一のビニングを有していなければならないことに留意すべきである。すなわち、一方のベクトルのmのビニングが500−501、501−502、...1999−2000である場合、他方のスペクトルは、同様に合算(binned)されていなければならない。したがって、2つのベクトルの長さは同じでなければならない。
【0086】
測定されたMSシグナルが正確なバイオマーカーであるか否かを判断するために、測定されたシグナルのMS/MS部分を抽出し、例えば、上記のコサイン相関を用いてサンプルのMS/MS参照スペクトルと比較する。
【0087】
コサイン相関値Sが、所定の閾値(例えば0.8)以上である場合、その後、測定されたシグナルは、参照セット中の推定バイオマーカーに由来すると判断される。
【0088】
以下の項では、多数の個々の患者からグループ特異的スペクトルとして得られた参照スペクトルの構築方法について説明する。
【0089】
各候補バイオマーカーについて、このようなバイオマーカーが確立されたら、いくつかのMS/MSスペクトルをまとめて参照MS/MSスペクトルマップを構築する必要がある。これは、実際の測定されたデータセットから作成された平均スペクトルであり、クラスタリング計算によって得られる。
【0090】
このような参照スペクトルの構築の例は、以下のとおりである:
(1)標的バイオマーカーの多重MS/MSスペクトルの収集。これらのMS/MSスペクトルは、所定の信頼レベルを有するMASCOT、SEQUESTまたは他のプログラムによって、標的バイオマーカーに由来するものであると確認されなければならない。
【0091】
(2)収集された、上記の類似点を有する各MS/MSスペクトルの類似性の検討を行う。これは、類似性測度を用いたクラスタリング計算によって実施する。クラスタリング計算は、類似性測度が所定の閾値まで減少する点まで行う。これらのクラスタリング計算の後、残りの全てのタンパク質配列イオンのサマリーリストを作成する。次のステップは、クラスター計算から、サマリーリスト中の残りのタンパク質配列イオンを除くことである。
【0092】
(3)クラスターに由来する、確立および認定された概略MS/MSスペクトルを用いて、スペクトルベクトルの各エレメントの相加平均を計算することが可能である。こうして平均ベクトルをMS/MS参照スペクトルとして使用することができる。
【0093】
(4)クラスタリングプロセス中、患者グループに由来する2つ以上の参照を生じる結果を出すことができる。
【0094】
a)この場合、MS/MSスペクトルプロファイルマップ中に差分を含むクラスターが2つ以上存在する。これらの状況には、これらのグループが信頼できる標的バイオマーカーの同定を必要とするという基準が設定される。その後、1つの標的について2つ以上の参照スペクトルを生成して利用することが可能となる。このような事例は、グループ間では異なるが、同一のアノテートされたタンパク質とは相関するMS/MSフラグメントイオンが存在する場合に現れるだろう。
【0095】
b)バイオマーカープロファイルマップ中に差分があるクラスター分析データを有する状態に到達することもできる。これは、患者集団から幾つかの個別のグループ(例えば、異なる表現型)を確立し得ることを意味する。これらの場合、比較多重パターンは表現型特異的である。しかし、表現型間でバイオマーカーが重複している可能性もあるだろう。
【0096】
これらの確認アルゴリズムは、以下に例示するMSBAプラットフォームのハイスループットスクリーニング操作の範囲内でリアルタイムに適用および使用される。
【0097】
ステップ2B
陽性のバイオマーカーの質量が一旦同定されると、質量分析計(例えば、Finnigan LTQ)は、そのバイオマーカーイオンシグナルを反復走査するために該質量標的を追尾し続ける。走査数は、特定の各タンパク質配列について生成されるスコアマッチによって決まるが、バイオマーカーの正の同一性に対して調整される。走査窓は、MSBAソフトウェアによって自動的に測定される。
【0098】
正相関関係の基準は、コサイン相関類似性測度で0.8以上でなければならない。
【0099】
次に続くステップは、MASCOTもしくはSEQUESTなどの市販の検索エンジンまたはタンパク質データベースを有する他の任意の検索エンジンを利用することによって統計的に有意なタンパク質配列の識別を作成し、正確なバイオマーカーの識別であると確認することである。
【0100】
MSBAシステムは、当該バイオマーカーの質量および配列領域の範囲内のシグナルとデータファイルを保存および保管するに過ぎない。このアッセイから生じた他の全てのデータは、MSBAデータベースには移行されない。
【0101】
ステップ3
多重バイオマーカーアッセイの読出しの計算
多重バイオマーカーアッセイの読出しの計算は、診断MSBAスコアを計算する判別関数からなるMSBAアルゴリズムの適用によって行われる。
【0102】
判別関数は、x,...,x,の関数として定義され、ここでxは、i番目のバイオマーカーの絶対シグナル強度または相対シグナル強度を表す。診断結果により、判別関数の出力は正の値または負の値のいずれかになるはずである。例えば、診断が陽性であれば、判別関数の出力値は正となるはずであり、逆もまた同様である。
【0103】
例えば式2では、使用される判別関数は:
【数4】

【0104】
(式中、nは、診断に使用される多重バイオマーカーの数である。xは、i番目のバイオマーカーの絶対シグナル強度または相対シグナル強度であり、xtotalは、MS測定の全シグナル強度である)
と概略される。
【0105】
MSBAソフトウェアのアルゴリズムには、重み因子も含まれる。
【0106】
ベクトル{a,..., a, aθ}は、n−次元のシグナル強度空間を2つ(診断陽性と診断陰性)に分ける分割超平面の正常なベクトルの方向を決定する重みベクトルである。重みベクトルを決定する手順の例は後述するが、様々な種類のアルゴリズム(例えば、Support Vector Machine、Artificial Neural Network、その他)を使用して、重みベクトルを決定することができる。
【0107】
判別関数の別の例はMSBAアルゴリズムに含まれ、以下のとおりに定義される。
【数5】

【0108】
関数fとfは、診断を受ける患者において測定されたバイオマーカーのセットと、MSBAサーバー中の参照バイオマーカーシグナルのセットとの間の類似性または距離のいずれかの基準を与える不定関数である。fは、診断陽性参照との類似性関数または差分関数を表し、fは、診断陰性参照との類似性関数または差分関数を表す。
【0109】
αとβは、診断陽性基準と診断陰性基準を不均等に重み付けするために使用し得る係数である。
【0110】
関数fとfが類似性測度を与える場合、その後、式3が正の値を生じると患者サンプルが陽性と診断される。これらの関数が距離測度を与える場合、式3の正の値は、診断が陰性であることを意味する。
【0111】
このような関数の一例はユークリッド距離である:
【数6】

【0112】
(式中、yは、診断を受ける患者のi番目のバイオマーカーのシグナル強度であり、xは、参照セットのi番目のバイオマーカーのシグナル強度である)。
【0113】
別の例は、回帰における予測値の標準誤差である:
【数7】

【0114】
(式中、nはバイオマーカーシグナルの数であり、xは、測定された患者サンプルのi番目のシグナル強度であり、yは、測定されたx’のシグナルと参照シグナル間の最小二乗フィッティングによって計算された線形回帰線を用いて各xから得た予測値である。
【0115】
上記の方法の範囲内で特定の各ステップを制御するアルゴリズムを含む全ソフトウェアスキームは、図2に概略される。
【0116】
ステップ4
バイオマーカーのアノテーションおよび定量
MSBAアッセイプラットフォームは:
A)分離法
B)非分離法
に基づくものであり、非分離法の場合、以下の方法によってバイオマーカーのアノテーションおよび定量を行うことができる。
【0117】
(a)直接MS分析
(i) 静電ナノエレクトロスプレー法の使用による生物学的サンプルの直接注入。各ナノエレクトロスプレー針が1つの生物学的サンプルにのみ曝される使い捨てナノスプレー針を使用し、これによりサンプルの過負荷と記憶効果を回避している。
【0118】
(ii)サンプルをプラグとして注入するフローインジェクション分析法。このプラグの範囲内で選択されるサンプル量は、各バイオマーカーのタンパク質配列のシグナル強度と直接関連している。低量のバイオマーカーを多量(数ml)のサンプル注入量に使用することにより、質量分析計のイオンシグナル効率の飽和(定常状態)に達することも可能である。
【0119】
(iii)クロマトグラフィー固相抽出濃縮カラムを利用した、MS分析によるサンプル濃縮を伴うフローインジェクション。このステップは、サンプル中のマトリックス成分を除去することによる同時精製と、バイオマーカーの微量濃縮とを可能にする。この方法の利点は、複雑度の高いサンプル源(例えば組織抽出物)からバイオマーカーを分析することが可能となることである。
【0120】
また、サンプル濃縮法(iii)では、2個〜500個(限定するものではない)に及ぶシグナル増幅因子を生成することができる。さらに、この方法は、低レベルで発現しているバイオマーカーの検出能を改善し、またタンパク質配列アノテーションの精度も改善する。
【0121】
B)分離分析では、バイオマーカーの同定を組み込んだ液体クロマトグラフィー(LC)は、単一カラムモード(図xを参照)、またはサンプルが連続モードで分析されることによりサンプル処理能力が向上するカラムスイッチングを利用する多重カラムモードで操作し得るLCの高分解能に依存する。
【0122】
MSBAプログラミング
この項では、Support Vector Machineアルゴリズムを用いて重みベクトル(またはモデル)を計算し、診断を予測するためのコア部分のコード(またはモデル)の一例を示す。このコードはR言語で書かれている。モデル(model)は、トレーニングデータセット(train)から構築され、その後、所定のテストデータセット(test)の予測(pred)を作成するために利用される。データセットであるtrainおよびtestは、複数のデータポイントを含むデータフレームであり、該データポイントは、診断結果(カテゴリ値:“陽性”または“陰性”のいずれか。predの場合はこの値は空である)を含むオブジェクトDiagと、各バイオマーカーのシグナル強度および全シグナル強度を含むベクトルとで構成される。MSBAプログラミングは、バイオマーカーが生成された2つの患者グループで行われるタンパク質配列スクリーニングから生成されるデータに依存する。
【0123】
MSBAソフトウェア中のプログラミングは、以下の方法で実行される;
【数8】

【0124】
## 上記の式でmodelを計算することはできるが、式2を反映するには単純すぎるだろう。
【0125】
## 選択したサポートベクトルは:model$SV
## また重みベクトルは:model$coefs
【数9】

【実施例】
【0126】
以下の実施例は、ヒト血液サンプル中のLC−MSタンパク質プロファイリング
によって行われた肺癌研究からの例示である。2つの患者グループ(症例(CASE)および対照(CONTROL)の癌グループ)を、示差的タンパク質発現の解析された差を用いて分析した。
【0127】
(実施例1)
実験の詳細
ヘパリンナトリウム塩を含有するサンプリングチューブに、各患者から約6mlの血液を採取し、2〜3回ひっくり返して混合した。次いで、このチューブを4℃において2,000×gで10分間遠心分離にかけた。上清から3mlの血漿を得た。このサンプルを−80℃で凍結保存した。次に、血漿からタンパク質を抽出し、豊富なヒト血漿アルブミンおよびIgGを枯渇させた後、トリプシン消化した。その後、分画された血漿サンプルのアリコートを、以前に記載されたとおり(国際公開第06/100446号パンフレット)、LC−MSによって分析し、MS/MSによって配列決定した。
【0128】
MSBAのプロット
多重バイオマーカーのサマリープロットは、肺癌研究の範囲内で、患者のバイオマーカーの多重発現データを示す。
【0129】
MSBA法から生成された10個の多重バイオマーカーの診断読出しは、各々の、そして全てのバイオマーカーを個別に示す(図3参照)。定量的差異、すなわち既知の、MSBAデータベース中に保存された(図1参照)フォールド変化の差を定性的差異と共に使用して、バイオマーカーをアッセイする。肺癌研究から作成されたバイオマーカーデータは、診断多重MSBA読出しから、これらの患者全員が陽性であると正確に同定する。
【0130】
これら10人の患者全員のスコアリングは、0.80〜1.0の範囲内にあることが分かった。
【0131】
図4は、MSスペクトルで示される、多重アッセイから作成されたバイオマーカーのアノテーションの例を示し、この例では、バイオマーカーはMSBAソフトウェア、および結果として得られたCVLFPYGGCQGNGNKバイオマーカーを表す追跡MS/MSスペクトル(図4参照)によって認識された。MSBAデータベース中の参照バイオマーカースペクトルを用いて、コサイン相関を利用するMSBAマッチングは、コサイン相関因子が0.8以上となることを示す。
【0132】
表1は、規定されたバイオマーカーの所定の質量を分析する、MSBAデータ作成の詳細を示す。
【表1】


【0133】
(実施例2)
以下に記載される別の例は、ヒト血液サンプル中のLC−MSタンパク質プロファイリングによって行われた肺疾患の症例対照(CASE−CONTROL)研究に由来する。示差的タンパク質発現分析を用いて、2つの患者グループ(症例(CASE)および対照(CONTROL)の肺疾患グループ)を分析した。
【0134】
実験の詳細
血漿サンプルの収集および調製の方法は、上記の例と同じであった。
【0135】
MSBAモデルの構築および評価
10人の症例者と36人の対照者からなる46人の患者のサンプルデータを使用して、MSBAモデルを構築した。発明者らは、それぞれ14、8、26、8、および11個のシグナルを含む、5つの異なるMSBAモデルを構築した。この5つのモデルを組み合わせた後、最後の(5番目の)MSBAモデルが主な識別能力を有することが明らかになった。このため発明者らは、次のステップでは5番目のモデルのみを使用した。この最後のモデルの11個のシグナルのLC−MS情報(保持時間(分)/MS値(m/z))は以下のとおり:11.6/485.2、12.5/608.1、18.3/547.0、20.2/681.3、21.1/575.1、21.3/531.5、25.5/561.6、23.1/514.5、32.5/682.2、44.0/985.2、48.7/945.8。
【0136】
このモデルの予測可能性を評価するため、発明者らは、10人の症例者と9人の対照者を盲検サンプルのように用いて、症例(CASE)/対照(CONTROL)の予測を試みた。上記のMSBA診断法(図2にも例示)に従って、各試験サンプルについて11個の多重バイオマーカーシグナルを同定し、各ピークシグナルの定量を行った。11個の多重シグナル全ての量から、上記の式(式5)を用いて各被験体のMSBAスコアを計算した。この例では、MSBAスコアが1以上の被験体は症例であると診断された(表2、MSBA診断)。結果的に、発明者らは全てのサンプルを正確に予測することができた。すなわち、識別能は100%であった(図5参照)。
【0137】
(実施例3)
以下の例も、2つの患者グループ(症例者(CASE)と対照者(CONTROL))を用いたヒト血液サンプル中のLC−MSタンパク質プロファイリングによって行われた肺疾患の症例対照(CASE−CONTROL)研究に由来するものであった。この例では、異なる患者のさらに大きなサイズのデータセットを用いて、別セットの多重バイオマーカーを使用してMSBAモデルを構築した。
【0138】
実験の詳細
血漿サンプルの収集および調製の方法は、上記の例と同じであった。
【0139】
MSBAモデルの構築および評価
トレーニングデータセットとして、21人の症例者と75人の対照者からなる96人の患者のサンプルデータを使用した。サンプル数が増加すればするほど、サンプルの変動性も増加した。このため発明者らは、最初にSmirnov試験を利用して異常値シグナルを除去した。結果的に、非常に多くの異常値を含む5つのサンプルも分析セットから除去された。発明者らは、t検定の結果を用いて、100個の候補バイオマーカーシグナルを含む最初のMSBAモデルを構築した。その後、判別分析を再帰的に適用して判別モデルから最小寄与シグナルを除去することにより、発明者らは、最終的に10個のシグナルを有するMSBAモデルを得た。10個の多重マーカーシグナルのリストについて、表3を参照のこと。
【0140】
この例では、判別スコア(z)を計算するため、発明者らは以下の式で表される別のスコアリング関数を使用した。
【0141】
z=Σa・x+C (式6)
(x:シグナル強度、aおよびC:表3に記載される係数)
【0142】
スコア値が陽性の場合は症例(CASE)と判断され、そうでない場合は対照(CONTROL)と判断される。
【0143】
このモデルの予測可能性を評価するため、発明者らは同じデータセット(21人の症例者+75人の対照者、合計96人)を用いて症例(CASE)/対照(CONTROL)の予測を試みた。上記のMSBA診断法(図2にも例示)に従って、各サンプルにつき10個の多重バイオマーカーシグナルを同定し、各ピークシグナルの定量を行った。10個の多重シグナル全ての量から、上記の式(式6)を用いて各被験体のMSBAスコアを計算した。この例では、MSBAスコアが0以上であった被験体は、症例であると診断された。表4と図6は自動判別結果を示す。図6において、各点は1人の患者を表し、縦軸は判別スコア(z)を表す。この例では、感度は85.7%、特異性は82.7%、また予測精度は83.3%であった。
【表2】

【表3】

【表4】



【特許請求の範囲】
【請求項1】
サンプル中の1種以上のポリペプチドバイオマーカーの存在を決定する方法であって、以下のステップ:
(a)サンプルを質量分光(MS)分析に供し、検出される各シグナルについて、保持時間指数と対応する質量とを記録するステップ;
(b)各シグナルに対応する質量を参照データベースのバイオマーカーの質量と関連付けて、各シグナルと参照バイオマーカーとの相関関係を形成し、参照バイオマーカーの質量と相関しない質量のシグナルを棄てるステップ;
(c)参照バイオマーカーと相関する質量のシグナルを保存するステップ;
(d)類似性測度を用いて各シグナルのMSスペクトルをデータベース中の参照バイオマーカーのMSスペクトルとマッチングさせることにより、保存された各シグナルと参照バイオマーカーとの相関関係を確認し、正相関シグナルのセットを定義するステップ;
(d)各正相関シグナルの強度を測定し、その絶対シグナル強度または相対シグナル強度を、判別関数を用いてスコア化するステップ;
(e)判別関数から得られたスコア値に閾値を適用し、バイオマーカーの存在または不在を決定するステップ、
を含んでなる、上記方法。
【請求項2】
事前に分離手順を行うことなく試験サンプルをMS分析に供する、請求項1に記載の方法。
【請求項3】
静電ナノエレクトロスプレー法、フローインジェクション分析またはサンプル濃縮を伴うフローインジェクションを用いた直接注入によって試験サンプルを分析する、請求項2に記載の方法。
【請求項4】
MS分析の前に試験サンプルを処理する、請求項1に記載の方法。
【請求項5】
サンプル処理が、一段階または多段階の高圧液体クロマトグラフィー(HPLC)によるサンプル分離を含む、請求項4に記載の方法。
【請求項6】
MSが、エレクトロスプレーイオン化(ESI)MS、マトリックス支援レーザー脱離イオン化−飛行時間型(MALDI−TOF)MSまたは表面増強レーザー脱離イオン化−飛行時間型(SELDI−TOF)MSである、請求項1〜5のいずれか1項に記載の方法。
【請求項7】
複数のバイオマーカーの参照質量とMSスペクトルデータが、電子的形態または紙形態で保存されている、請求項1〜6のいずれか1項に記載の方法。
【請求項8】
定義されたバイオマーカーの参照MSスペクトルが、クラスタリング計算によって得られた実データおよび測定データから得られた平均スペクトルである、請求項1〜7のいずれか1項に記載の方法。
【請求項9】
MSによる分析の前に、1つ以上の参照ペプチドの内部標準がサンプルに加えられる、請求項1〜8のいずれか1項に記載の方法。
【請求項10】
内部標準が分子タグで標識されている、請求項9に記載の方法。
【請求項11】
内部標準が標識され、且つマスターデータセットに含まれている、請求項9に記載の方法。
【請求項12】
バイオマーカーシグナル強度を測定し、それを1つ以上の既知の内部標準のシグナル強度と比較することによって絶対シグナル強度をスコア化する、請求項11に記載の方法。
【請求項13】
内部標準の添加を行わずにサンプルを処理する、請求項1〜9のいずれか1項に記載の方法。
【請求項14】
患者における個々のバイオマーカーシグナル強度と、患者グループの参照シグナル強度との比を測定することによって相対シグナル強度をスコア化する、請求項13に記載の方法。
【請求項15】
完全に自動化されている、請求項13に記載の方法。
【請求項16】
MSシグナル強度から前記スコアを計算するための判別関数が、場合により臨床検査結果および/または臨床的観察の表現型および/または医療記録などの任意の臨床的変数の使用を含む、請求項1に記載の方法。
【請求項17】
試験サンプルのタンパク質配列バイオマーカーを、表1に特定されるペプチドを含む参照バイオマーカーと比較するステップを含んでなる、疾患の存在を決定するための診断方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate


【公表番号】特表2009−540319(P2009−540319A)
【公表日】平成21年11月19日(2009.11.19)
【国際特許分類】
【出願番号】特願2009−514893(P2009−514893)
【出願日】平成19年6月13日(2007.6.13)
【国際出願番号】PCT/GB2007/002187
【国際公開番号】WO2007/144606
【国際公開日】平成19年12月21日(2007.12.21)
【出願人】(502097090)アストラゼネカ ユーケー リミテッド (4)
【出願人】(503119030)株式会社メディカル・プロテオスコープ (5)
【Fターム(参考)】