説明

卵巣癌検出のための多重高解像度血清プロテオミック特性

卵巣癌の存在について認められかつ評価された女性由来の十分に制御された血清試験セット(n=248)を、血清プロテオミックパターン分析をより高度の解像度質量分光計プラットフォームに拡大するために用い、同一質量スペクトルに存在する複数識別高度診断特性の存在を探究した。複数高精度質量診断プロテオミック特性セットは、ヒト血清質量スペクトル内に存在する。高解像度質量スペクトルデータを用いて、試験及び検証において85%を越える感度及び特異性を達成する、少なくとも56の異なったパターンを発見した。これらの特性セットの中の4つは、盲検証で100%の感度及び特異性を示した。高解像度質量スペクトルデータから得られた診断モデルの感度及び特異性は、同一のインプット試料を用いる低解像度質量スペクトルデータから得られたものよりも優れていた(P<0.00001)。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、質量スペクトル(MS)による血清プロテオミックパターン解析に関する。
【背景技術】
【0002】
背景
質量スペクトル(MS)による血清プロテオミックパターン解析は、バイオマーカー疾患プロファイルを特定するために用いられる浮上した技術である。このMS-系アプローチを用いて、血清試料の訓練セットから得られた質量スペクトルを、バイオインフォマティックアルゴリズムによって解析し、主要質量/電荷(m/z)種までの下位集合及びそれらの相対的強度から成る診断用兆候パターンを特定する。続いて、未知試料由来の質量スペクトルは、訓練セットに用いられる質量スペクトルに見られるパターとの類似性によって、分類される。混合相対的強度がパターンを特定する主要m/z種の数は、任意の所与の血清質量スペクトルに存在する総種数の非常に小さな集団を表す。
【0003】
卵巣癌、乳癌及び前立腺癌の診断に関して、MSプロテオミックパターン解析を用いる実現可能性が証明されてきた。研究者は、パターン発見に、様々な異なったバイオインフォマティクアルゴリズムを使用してきたが、ほとんどの一般的解析プラットフォームは、試料を表面活性化レーザー脱着イオン化(SELDI)によってイオン化する、低解像度飛行時間型(TOP)質量分析計、及びアレイ上に保持された検体の直接的質量スペクトル分析を可能にする、タンパク質チップアレイ型クロマトグラフィー保持法から成る。
【0004】
卵巣癌は、婦人科の悪性腫瘍の筆頭原因であり、女性の癌関連死亡の5番目の最も一般的原因である。米国癌協会は、2002年は、卵巣癌の新規ケースは23,300で、死亡が13,900であると概算している。不幸なことに、通常の上皮卵巣癌の女性の約80%は、疾患のステージが進行するまで、すなわち、上腹部(ステージIII)又はそれ以上(ステージIV)に広がるまで、診断されない。これらの女性の5年生存率は、15〜20%に過ぎないが、ステージIの卵巣癌の5年生存率は、外科的インターベンションにより約95%にまで近づいている。そのため、卵巣癌の初期診断は、この癌により死亡数を劇的に減少させることができた。
【0005】
最も幅広く用いられている卵巣癌の診断バイオマーカーは、モノクローナル抗体OC125によって検出される、癌抗原125(CA125)である。卵巣癌患者の80%は、高レベルのCA125を有しているが、ステージIの患者の50〜60%だけが上昇しているに過ぎず、これは、10%の陽性-予測値をもたらす。更に、CA125は、他の非-婦人科で良性の症状でも上昇する。超音波検査法と併せたCA125決定の方策は、陽性-予測値を約20%まで増加させる。
【0006】
低解像度SELDI-TOF MSデータ由来の低分子量血清プロテオミックパターンは、卵巣内の、新生疾患と非新生疾患とを識別することができる。Petricoin, E. F. III他を参照されたい。卵巣癌を特定するための、血清中のプロテオミックパターンの使用。The Lancet 359,572-577 (2002)。プロテオミックパターンは、監視システムの体力テスト(遺伝的アルゴリズム)として、非監視システム(自己組織化集団マッピング)を用いる人工知能バイオインフォマティクス手段の適用により、特定することができる。n-空間にプロットされたm/z特性(及びその相対的強度)の最も適合した組み合わせが、訓練に用いられる集団と確実に識別できるように、非罹患女性又は卵巣癌の女性のいずれかから得られる血清由来のSELDI-TOF質量スペクトルを含む訓練セットは使用される。「訓練」アルゴリズムは、マスクした試料セットに適用され、100%の感度及び95%の特異性をもたらす。この技術は、国際公開WO 02/06829 A2号パンフレットに更に詳細に記載されている。「生物的データ由来の隠れパターンに基づく生物状態間の識別」(「隠れパターン」)は、参考文献として本明細書に組み込まれている開示である。
【0007】
この技術は首尾よく動くが、低解像度質量分光分析計及びその分光計から得られるデータは、規定の臨床的使用のためのプロテオミックパターンに対して得られる再現性、感度及び特異性を制限することがある。
【発明の開示】
【0008】
概要
隠れパターンのタンパク質パターン分析概念は、高解像度MSプラットフォームに拡張され、より安定なスペクトルを発生するフォーマット上により高い感度及び特異性を有する診断用モデルをつくる。このモデルは、真の飛行時間型質量精度を有し、質量精度を向上させるために、機械的にもかつ日々においても本質的に再現性がある。大規模な十分に制御された卵巣癌スクリーニング訓練由来の血清を使用し、そして、有効な解像度及び質量精度の点で相違する2つの質量スペクトルプラットフォーム上で、プロテオミックパターン解析を同一試料について行った。データを分析し、現れる一連の診断モデルの感度及び特異性を分類した。
【0009】
同一のSELDI タンパク質チップアレイに適用し及び分析した同一の患者血清試料を用い、高解像度及び低解像度質量分析計から得られたスペクトルを比較した。高解像度マススペクトルは、より識別可能な診断特性セットを生じるが、データの複雑性の増加及びデータの次元性の増加は、有意義なパターン発見の尤度を減少させる。診断プロテオミック特性は、臨床的に関連のある患者試験セット由来の高解像度スペクトル中で識別することができ、2つの機器プラットフォーム間のモデル結果を比較することができる。データマイニング操作から現れる診断モデルの数及び特徴を分類することができる。卵巣癌の改良早期診断のためのハイブリッド型四重極飛行時間型(Qq-TOF)MSを用いる複数、高精度モデルの作成のために、血清プロテオミックパターン解析を、使用することができる。
【0010】
詳細な説明
血清試料の分析
総248血清試料は、ノースウェスタン大学病院(Chicago, Illinois)の国立卵巣癌早期検出プログラム(NOCEDP)診察室から提供された。試料を処理し、そのプロテオミックパターンを下記の使用方法の説明に記載されたMSにより得た。SELDI タンパク質チップアレイ・インターフェースで固定されたPBS-II及びQq-TOF MSによって、本試験の血清試料を分析した。両機器から得られるスペルトルは定性的には類似しているが、Qq-TOF MSによって得られた高解像度は図1から明白である。この高い解像度により、PBS-II TOF MSによって分解されないm/z付近の種を、Qq-TOF質量スペクトルではっきりと観察することができる。実際に、シミュレーションは、m/z 0.375のみが異なる種(例えばm/z 3000)を完全に分解するQq-TOF MSの能力を証明するが、PBS-II TOF MS(規定の解像度は約150)による種の完全分解はm/z 20が異なる種についてのみ可能である(シミュレーションは表示せず)。
【0011】
質量スペクトルは、m/z及びPBS-II TOF又はQq-TOF質量スペクトルのいずれかの強度値から成るASCIIファイルをインプットとして使用する、ProteomeQuest(登録商標)バイオインフォマティクス手段を使用して分析した。各スペクトルの特性数を7,084に正確に特定するために、Qq-TOF MSを用いて得られた質量スペクトルデータを予備推定(bin)した。各特性は、予備推定m/z及び振幅値を含む。アルゴリズムはデータを調べ、n-空間内の混合、標準化相対的強度値が、訓練セットから得られたデータを最も良く分離する正確な予備推定m/z値に、一連の特性を見出す。同一試料セット由来の、Qq-TOF及びPBS-II TOF機器で得られた質量スペクトルは、2つのプラットフォーム間の直接的比較のためには、m/zを700〜11,893の範囲に限定した。血清試料から得られたスペクトルの全セットを3データセットに分割した:a)隠れ診断パターンを発見するために用いられる訓練セット、b)試験セット、及びc)検証セット。このアプローチにより、訓練セットを用いて特定されたm/z値の主要小集団の標準化強度のみを、試験セット及び検証セットを分類するために使用し、アルゴリズムは、試験セット及び検証セットでは当該スペクトルをこれまで「読め」なかった。
【0012】
訓練セットは、28人の非罹患女性及び56に卵巣癌の女性の血清を含んだ。訓練及び試験セット質量スペクトルをバイオインインフォマティクスアルゴリズムにより解析し、以下のセットモデル化パラメータ下で、一連のモデルを作成した:a)集団分類に関しては、類似性85%、90%又は95%の類似空間;b)混合強度が各パターンを含む、5、10又は15のランダムm/z値の特性セットサイズ;及びc)遺伝的アルゴリズムによるパターン世代に関しては、0.1%、0.2%又は0.3%の学習率。27順列の各々についてランダムに作成したモデルの4セットは、同一の試験セットから得られ、同一の試験セットを用いて問い合わせた。図2A及び2に示すように、108モデルの各々についての感度及び特異性試験結果(27順列の各々について4ラウンドの訓練)が得られた。これらの結果は、モデル化条件の範囲において、Qq-TOF MSデータが低解像度スペクトルよりも優れた結果を与えた、ことを示す(P<0.00001、傾向については正確なコクラン・アーミテッジ(Cochran-Armitage)試験を使用(Agresti A. Categorieal Data Analysis New York: John Wiley and Sons (1990)を参照))。
【0013】
複数のモデは上記のモデル化パラメータの全範囲を用いて作成されかつ分類されるので、試験及び検証用の最上実行モデルを作成する能力は統計的に評価した。訓練セット由来のモデルを、31人の非罹患及び6人の卵巣癌血清試料から成る試験セットを用いて、有効であると確認した。卵巣癌を診断する能力を更に有効とするために、先に考察した訓練で見出されたモデルに対して、追加の37人の標準及び40人の卵巣癌血清質量スペクトルから成る盲検試料質量スペクトルの1セットを試験した。図3A及び3Bから明らかなように、結果は、高解像度Qq-TOF MS由来の質量スペクトルの能力を示し、低解像度PBS-II質量スペクトルよりも統計的に有意な(P<0.00001)モデルを作成することができる。
【0014】
15モデルは、卵巣癌に罹患した女性と非罹患女性を正確に識別する能力において100%の感度であることが判った。これらのモデルは、試験セットにおいて識別する女性では100%特異的であり、検証セットでは少なくとも97%特異的であった。これらのモデルは、別表Aに示され、モデル1〜モデル15と特定した。これらのモデルの中で、4モデルは、両セットに関し、100%の感度及び特異性であることが判明した(モデル、4、9、10及び15)。
【0015】
【表1】

【0016】
【表2】

【0017】
【表3】

【0018】
【表4】

【0019】
【表5】

【0020】
【表6】

【0021】
【表7】

【0022】
【表8】

【0023】
【表9】

【0024】
【表10】

【0025】
【表11】

【0026】
【表12】

【0027】
【表13】

【0028】
【表14】

【0029】
【表15】

【0030】
【表16】

【0031】
【表17】

【0032】
【表18】

【0033】
【表19】

【0034】
別表Aは、各モデルについて以下の情報を特定する。第一に、各モデルの特異性及び感度を試験セット及び検証セットについて示す。次いで、各試験及び検証試験について、対応するセットにおける総試料数と比較して、モデルが「健常状態」(すなわち、卵巣癌でない)及び「卵巣癌状態」と正確に分類した試料数を示す。例えば、モデル1では、このモデルは、検証試験において健常状態の37人の女性の中の36人を正確に特定した。
【0035】
最後に、各モデルについて、表は、モデルを含む構成「パターン」を示すように記載されている。各パターンはモデルに含まれるN個のm/z値(又は「特性」)によって特定されるN-次元空間内の点又はノードに対応する。従って、各パターンは、1組の特性であり、各特性は振幅を有する。そのため、別表Aは、構成パターンを含む表を各モデルについて示し、各パターンは、「ノード」数によって一列に特定される。表はまた、パターンの構成特性の欄を含み、欄の上部には、特定された各パターンのm/z値が記載されている。振幅は、各特性、各パターンについて示され、1.0に標準化される。各表の残った4つの欄は、「カウント(Count)」、「状態(State)」、「状態合計(StateSum)」及び「エラー(Error)」と称される。「カウント」は、特定されたノードに対応する訓練セットにおける試料数である。「状態」は、ノードの状態であり、1は疾患者(この場合、卵巣癌に罹患)を示し、及び0は健常者(疾患を有さない)を示す。「状態合計」は、表示ノードの正確に分類された全てのメンバーの状態値の合計であり、「エラー」は、表示ノードの不正確に分類されたメンバーの数である。従って、モデル1のノード5については、13試料を当該ノードに割り当てたが、11試料は実際に疾患者であった。従って、状態合計は、(13よりむしろ)11であり、エラーは2である。
【0036】
4つの最上実行モデル(モデル4、9、10及び15)を含む主要m/z特性の試験は、これらのモデルにおいて分類詞として一致して存在する、ある特性(すなわち、m/zビン 7060.121、8605.678及び8706.065内にある)を明らかにする。
【0037】
Qq-TOF MSを用いる健常及び癌患者から得られたプロテオミックパターンは、(図4A及び4Bを比較すると判るように)非常に類似しているが、生の質量スペクトルデータを注意深く検討すると、予備推定m/z値 7060.121及び8605.678内のピークは、非罹患個体に比べ、卵巣癌患者から得られた血清試料の選択が明確に豊富であり、及び選択されたProteomeQuest(登録商標)ソフトウェアが「真」の特性であり、ノイズでない、ことが明らかとなる。図4A及び4Bにおける挿入図は、アルゴリズムにより至適識別パターンに属すると特定された、m/zビン 7060.121及び8605.678(張り出しで表示)内のピークの著しい強度の相違を強調する拡大m/z領域を示す。これらの結果は、これらのMSピークが卵巣癌の存在の一致した指標である種から生じる、ことを示す。しかしながら、単一血清プロテオミックm/z特性のみに基づく、非罹患個体又は卵巣癌個体由来の血清を識別する能力は、血清試験セット全体では不可能である。単一の主要なm/z種は非罹患及び卵巣癌患者の全てを総体的に識別するには十分ではないが、主要イオンの混合ピーク強度を併せると2つのデータセットを完全に識別することができる。
【0038】
盲検試験及び検証試験に100%の感度かつ特異性である4つの最上実行モデルを更なる分析のために選択した。表1は、最上実行モデルを用いるプロテオミックパターン分類によるマスク試験及び検証セットから得られる、血清試料のバイオインフォマティク分類結果を示す。
【0039】
【表20】

【0040】
これらのモデルの各々は、罹患女性由来の血清試料の全てにおいて、卵巣癌の存在を首尾よく診断することができた。更に、これらの最上実行モデルでは、偽陽性又は偽陰性分類は起こらなかった。
【0041】
考察
個々の癌のバイオマーカーの制限は、大きな不均一集団に適用される場合には、感度及び特異性に欠ける。バイオマーカーパターン分析は、個々のバイオマーカーの制限を解消する必要がある。血清プロテオミクスパターン分析は、早期診断、治療モニタリング及び転帰分析の新規ツールを提供することができる。その有用性は、生物的不均一及び方法的バックグラウンド「ノイズ」を越える、選択された特性セットの能力により増加される。この診断目標は、自己編成集団分析と組み合わせた遺伝的アルゴリズムを用いることにより支援され、高解像度Qq-TOF質量スペクトルデータ内に含まれるm/z特性の診断下位集団及び相対的強度を発見する。
【0042】
診断血清プロテオミクス特性セットは、小タンパク質及びペプチド群内に存在する、と考えられている。所与の代表的パターンは、標的組織の生理的及び病的症状の変化を反映する。癌マーカーに関しては、血清診断パターンは、腫瘍-宿主微環境複合体の産物である。診断特性のセットは、部分的には、癌細胞から専ら発するというよりも、複数の修飾宿主タンパク質から得られる、とおそらく考えられる。バイオマーカープロファイルは、腫瘍-宿主相互作用によって増幅することができる。この増幅は例えば、腫瘍又は宿主プロテアーゼによるペプチド開裂産物の生成を含む。根底の組織病理学を反映する多数の依存的又は別個のタンパク質/ペプチドセットが存在する。従って、血中の疾患関連プロテオミックパターン情報量は、前もって予想されたよりも豊富である。「最上」特性セットよりも、高精度識別及び診断力を達成する、複数プロテオミック特性セットが存在し得る。この可能性は上記データによって支持される。
【0043】
低分子量の血清プロテオームは、MSが分析には最もよく適合する質量領域であるにもかかわらず、未研究のアーカイブである。疾患関連種は、少ダルトンのように低分子量で変動する低分子量ペプチド/タンパク質種を含む、とおそらく考えられる。従って、より高解像度質量分光計は、より低解像度機器によって分解され得ないパターンを識別しかつ発見すると予想される。Qq-TOF MSによって生じるスペクトルをCiphergen PBS-II TOF MSによるものと比較した。得られる規定の解像度は、Qq-TOF MSについては8000 (m/z=1500)、PBS-II TOF質量スペクトルについては150(m/z=1500)を越える。両機器がタンパク質チップアレイベイト表面の一定の領域上の同一試料を分析するように、SELDI源を用いた。全体的なスペクトルプロファイルは類似するが、PBS-II TOF MSの単一ピークは、多数のQq-TOF MSのピークに分解される(図1A及び1Bの、図4A及び4Bとの比較により判る)。更に、質量分析器をSELDI源から切り離したより高解像度機器による質量精度の本質的向上は、より鮮明なスペクトルを提供するだろう。これは、交絡準安定イオンを抑制し、より低質量が終始ドリフトするスペクトルを生じ、同時に、より複雑な高分解データを生じる機器を形成するためである。
【0044】
第一相の比較では、同一の訓練セットから得られ、高及び低解像度質量分光計に生じた質量スペクトル由来のプロテオミックパターンを、一連のモデル化制約を越えてその全体的な感度及び特異性について綿密に調べた。その制約は、パターンが、形成されるべき自己編成集団のための類似性空間の3種の次数、選択される特性サイズの3種のセット、及び全27のモデル化順列のための3種の突然変異率を用いて得られる、ことである。108モデルの各々についての感度及び特異性の試験結果(図2A及び2Bに示す)は、27の順列の各々について4ラウンドの訓練から得られ、Qq-TOF MS生成スペクトルは、使用したモデル化基準とは無関係に、より低解像度TOF-MSスペクトル(P<0.00001)より常に優れていた。
【0045】
より高解像度プラットフォーム由来のスペクトルは、より高レベルの感度及び特異性を有するパターンを生じるので、これらのスペクトルは、より高程度の感度及び特異性を有するより精密なモデルを作成することができた、すなわち、最上の診断モデルを作成することができた。これらの結果は、より緊縮基準を用いる場合でさえ得られ、追加のマスク検証セットを試験後に使用し、全体的精度を決定した。より高い解像度スペクトルは、試験及び検証研究において見られるような、著しくより精密なモデルを常に作成した(図3A及び3Bに示す)。Qq-TOF MSから得られたモデルは、常に、PBS-II TOF MSから得られるものよりもより感受性でかつ特異的であった(P<0.00001)。試験及び検証において100%の感度及び特異性が得られる4モデルを作成した。4つの最上診断モデルで分類詞として用いた主要m/z値の数は、5〜9の範囲であった。3つのm/zビン値をこれらの4モデルの内の2つで見出し、2つのm/zビンをこれらの4最上モデルの内の3つで見出した。反復するm/zビン 7060.121、8605.678及び8706.065に存在する明確なピークは、主要な疾患進行指標である、血清中の低分子量成分用の優れた候補である。
【0046】
これらのデータは、卵巣癌を正確に識別することができる多数の高精密かつ明確なプロテオミック特性の存在を支持する。卵巣癌等の相対的に低罹患率の疾患を選別するために、診断試験は、好ましくは、偽陽性を最小限に抑えるために、99%を越える感度及び特異性を有し、同時に、偽陽性が存在する場合に、初期ステージ疾患を正確に検出する。上記のように、高解像度Qq-TOF MSデータを用いて得られる4モデルは、100%の感度及び特異性を達成した。盲検試験及び検証研究では、22/22ステージI卵巣癌、81/81卵巣癌ステージII、III及びIV、及び68/68良性疾患対照を正確に識別するために、これらのモデルの任意の1つを使用した。
【0047】
従って、臨床試験は、同一のデータ・ストリームから付随して生じる高精密診断プロテオミックパターンのいくつかの組み合わせを同時に使用することができた、総合すれば、臨床試験は、試料品質及び操作における大集団の不均一及び潜在的検証と直面するだろうスクリーニング設定では、より高度の精度を達成することができた。従って、本研究で用いた高解像度システム、例えばQq-TOF MSは、本結果に基づいて好ましい。
【0048】
方法
試験試料:試験試料は、ノースウェスタン大学病院(Chicago, Illinois)の国立卵巣癌早期検出プログラム(NOCEDP)診察室から入手した。248試料をBiomek 2000ロボット液体ハンドラー(Beckman Coulter, Inc., Palo Alto, California)を用いて調製した。全ての分析をタンパク質チップである弱カチオン交換相互作用チップ(WCX2, Ciphergen Biosystems Inc., Fremont, California)を用いて実行した。試料調製及び質量分光計機能の品質管理として、各タンパク質アレイ上の1点に、対照試料を無作為に適用した。対照試料、SRM1951Aは、プールヒト血清から成るが、国立標準技術研究所(NIST)から提供を受けた。
【0049】
試料調製:WCX2 タンパク質チップアレイを、タンパク質チップアレイバイオプロセッサー(Ciphergen Biosystems Inc.)を利用するために変更したBiomek Laboratoryワークステーション(Beckman-Coulter)を用いて、並行して処理した。バイオプロセッサーは、12個のタンパク質チップを保持し、各チップは、クロマトグラフ「点」を有し、96試料を並行して処理することができた。100 μlの10 mM HCLをWCX2タンパク質アレイに添加し、5分間、インキュベートした。HClを吸引廃棄し、100 μlの蒸留脱イオン水(ddH2O)を加え、1分間インキュベートした。このddH2Oを吸引廃棄し、更に1分間インキュベートした。100 μlの0.1% Triton X-100を含む10 mM NH4HCO3を表面に添加し、5分間インキュベートした後、溶液を吸引廃棄した。二回目の100 μlの0.1% Triton X-100を含む10 mM NH4HCO3を加え、5分間インキュベートした後、タンパク質チップアレイベイト表面を吸引した。5 μlの生の非希釈血清を各タンパク質チップ WCX2ベイト表面に添加し、55分間インキュベートした。各タンパク質チップアレイをダルベッコリン酸緩衝生理食塩水(PBS)及びddH2Oで3回洗浄した。各洗浄については、150 μlのPBS又はddH20を順次分配し、吸引によって混合し、バイオプロセッサー中で計10回、分配した後、溶液を吸引廃棄した。この洗浄プロセスを合計6洗浄/タンパク質チップアレイベイト表面、反復した。タンパク質チップアレイベイト表面を減圧乾燥し、バイオプロセッサーパッキンを除いた時の汚染を防いだ。バイオプロセッサーパッキンを除いた後、α-シアノ-5-ヒドロキシコハク酸の50% (v/v)アセトニトリル、0.5% (v/v) トリフルオロ酢酸の飽和溶液1.0 μlを、タンパク質チップアレイ上の各点に2回添加し、添加中、溶液を乾燥させた。
【0050】
PBS-II分析:タンパク質チップアレイを、Protein Biological System II飛行時間型質量分光計(PBS-II, Ciphergen Biosystems Inc.)に置き、質量スペクトルを以下の設定を用いて記録した:ポジモードで集めた195レーザーショット/スペクトル、レーザー強度220、検出器感度5、検出器電圧1850及び質量中心6,000 Da。PBS-IIを「オール・イン・ワン」ペプチド質量標準((Ciphergen Biosystems, Inc.)を用いて外部から校正した。
【0051】
Qq-TOF MS分析:タンパク質チップアレイ・インターフェース(Ciphergen Biosystems Inc., Fremont, California)に取り付けた、ハイブリッド型四重極飛行時間型(Qq-TOF)質量分光計(QSTAR pulsar i, Applied Biosystems Inc., Framingham, Massachusetts)を用いて分析した。30 Hzで作動する337 nmパルスの窒素レーザー(ThermoLaser Sciences model VSL-337-ND-S, Waltham, Massachusetts)で、試料をイオン化した。約20 mTorrの窒素ガスを衝突イオン冷却に使用した。各スペクトルは、100マルチチャンネル平均スキャンを示す((1.667分 獲得/スペクトル)。既知ペプチドの混合物を用いて、質量分光計を外部から校正した。
【0052】
プロテオミックパターン解析:Qq-TOF質量スペクトルから得られた生データを、約350,000データポイント/スペクトルを生じたタブで区切ったフォーマットに転送することによって、プロテオミックパターン解析を実行した。全てのデータファイルが同一のm/z値(例えば、m/z 700での0.28からm/z 12,000での4.75に直線的に増加したm/zビンサイズ)を有するように、データファイルを400パーツ・パー・ミリオン(ppm)の関数を用いて予備推定した。各400 ppmビンでの強度を合計した。この予備推定プロセスは、データポイントの数を正確に7,084ポイント/試料に凝縮する。訓練、試験及び盲検証について約3つの等しい群に保存スペクトルデータを分離した。訓練セットは、28人の健常及び56人の卵巣癌試料から成った。ProteomeQuest(登録商標)(Correlogic Systems Inc., Bethesda, Maryland)を用いて訓練セットに、及び30人の健常及び57人の卵巣癌試料から成る試験試料を用いて検証セットにモデルを作った。このモデルは、37人の健常及び40人の卵巣癌試料から盲検試料を用いて検証した。卵巣癌患者由来の血清を非罹患個体の血清と識別するために用いられる分類詞であることが判った当該m/z値は、保存データに基づき、生の質量スペクトル由来の実際のm/z値には基づかない。
【0053】
モデルは互いに無関係に構築されるため、傾向については正確なコクラン・アーミテッジ(Cochran-Armitage)試験を用いて、Qq-TOF及びPBS-II MSを用いて得られる結果の統計的有意を実行し、評価された、2つの機器プラットフォーム間の特異性及び感度の値の分布を比較した。
【図面の簡単な説明】
【0054】
【図1A】図1A及び1Bは、WCX2 タンパク質チップアレイ上で調製した対照血清由来の質量スペクトルを比較し、PBS-11 TOF (図A)又はPBS-11 TOF質量分析計で分析した。
【図1B】図1Bは、図1A及び1Bは、WCX2 タンパク質チップアレイ上で調製した対照血清由来の質量スペクトルを比較し、PBS-11 TOF (図A)又はQq-TOF (図B)質量分析計で分析した。
【図2A】図2Aは、Qq-TOF又はPBS-11 TOF質量分析計のいずれかで得られたMSデータの108モデルの感度(2A)及び特異性(2B)の試験結果を示すヒストグラムを示す。
【図2B】図2Bは、Qq-TOF又はPBS-11 TOF質量分析計のいずれかで得られたMSデータの108モデルの感度(2A)及び特異性(2B)の試験結果を示すヒストグラムを示す。
【図3A】図3Aは、Qq-TOF又はPBS-11 TOF質量分析計のいずれかで得られたMSデータの108モデルの感度(3A)及び特異性(3B)の試験結果及び盲検結果を示すヒストグラムを示す。
【図3B】図3Bは、Qq-TOF又はPBS-11 TOF質量分析計のいずれかで得られたMSデータの108モデルの感度(3A)及び特異性(3B)の試験結果及び盲検結果を示すヒストグラムを示す。
【図4A】図4Aは、非罹患個体(4A)及び卵巣癌患者(4B)由来の血清のSELDI Qq-TOF質量スペクトルを比較する。
【図4B】図4Bは、非罹患個体(4A)及び卵巣癌患者(4B)由来の血清のSELDI Qq-TOF質量スペクトルを比較する。

【特許請求の範囲】
【請求項1】
患者から採取した生物試料が、当該患者が卵巣癌を有することを示すか否か、を決定する際に使用できるモデルであって、以下:
少なくとも3つの次元を有するベクトル空間;及び
当該ベクトル空間内で定義される少なくとも1つの診断集団であって、当該診断集団が疾患集団及び健常集団の内の1つに対応する集団
を含み、
ここで、
当該ベクトル空間は、質量スペクトル由来の電荷率値に対する第1質量に対応する1次元を有し、電荷率値に対する当該第1質量は約7060であり、
当該ベクトル空間は、質量スペクトル由来の電荷率値に対する第2質量に対応する2次元を有し、電荷率値に対する当該第2質量は約8605であり、及び
当該ベクトル空間は、質量スペクトル由来の電荷率値に対する第3質量に対応する3次元を有し、電荷率値に対する当該第3質量は約8706である、前記モデル。
【請求項2】
前記ベクトル空間が、少なくとも4つの次元を有し、当該ベクトル空間が質量スペクトル由来の電荷率値に対する第4質量に対応する4次元を有し、電荷率値に対する当該第4質量が約6548である、請求項1記載のモデル。
【請求項3】
患者から採取した生物試料が、当該患者が卵巣癌を有することを示すか否か、を決定する際に使用できるモデルであって、以下:
少なくとも3つの次元を有するベクトル空間;及び
当該ベクトル空間内で定義される少なくとも1つの診断集団であって、当該診断集団が疾患集団及び健常集団の内の1つに対応する集団
を含み、
ここで、当該ベクトル空間は、質量スペクトル由来の電荷率値に対する第1質量に対応する1次元を有し、電荷率値に対する当該第1質量は約9807であり、
当該ベクトル空間は、質量スペクトル由来の電荷率値に対する第2質量に対応する2次元を有し、電荷率値に対する当該第2質量は約2374であり、及び
当該ベクトル空間は、質量スペクトル由来の電荷率値に対する第3質量に対応する3次元を有し、電荷率値に対する当該第3質量は約1276である、前記モデル。
【請求項4】
前記ベクトル空間が、少なくとも4つの次元を有し、当該ベクトル空間が質量スペクトル由来の電荷率値に対する第4質量に対応する4次元を有し、電荷率値に対する当該第4質量が約4292である、請求項2記載のモデル。
【請求項5】
患者から採取した生物試料が、当該患者が卵巣癌を有することを示すか否か、を決定する方法であって、以下:
a. データ・ストリームを抽出して、診断集団を含む規定のベクトル空間内のデータ・ストリームを特徴付ける試料ベクトルを作成するステップであって、当該診断集団は卵巣癌集団であり、当該卵巣癌集団は卵巣癌の存在に対応する、ステップ;
b. 当該試料ベクトルが当該卵巣癌集団内に置かれているか否かを決定するステップ;及び
c. 当該試料ベクトルが当該卵巣癌集団内に置かれている場合には、当該生物試料が卵巣癌を有する患者から採取されたものであると特定するステップ、
を含む、前記方法。

【図1A】
image rotate

【図1B】
image rotate

【図2A】
image rotate

【図2B】
image rotate

【図3A】
image rotate

【図3B】
image rotate

【図4A】
image rotate

【図4B】
image rotate


【公表番号】特表2007−501380(P2007−501380A)
【公表日】平成19年1月25日(2007.1.25)
【国際特許分類】
【出願番号】特願2006−522041(P2006−522041)
【出願日】平成16年7月30日(2004.7.30)
【国際出願番号】PCT/US2004/024413
【国際公開番号】WO2005/011474
【国際公開日】平成17年2月10日(2005.2.10)
【出願人】(502456389)コレロジック システムズ,インコーポレイティド (2)
【出願人】(506035429)ザ ユナイテッド ステイツ オブ アメリカ アズ レプレゼンテッド バイ ザ セクレタリー オブ ザ デパートメント オブ ヘルス アンド ヒューマン サービシズ (1)
【Fターム(参考)】