生物試料を分類するための組成物及び方法

本発明は、自己抗体、及びペプチドエピトープによるその検出に関する。本発明はまた、自己抗体パターン及び生物的クラス分けとの相関関係に関する。

【発明の詳細な説明】
【背景技術】
【０００１】
癌は、米国では、第二の死因である。慣用的な診断薬及び治療薬における集中的研究にも関わらず、５年生存率は、過去25年で僅かに改善されたに過ぎないより需要のある、効率的な診断薬及び治療薬の開発及び商品化には、用語の複雑さのより良い理解が求められている。
【０００２】
観察されたヒト腫瘍への免疫応答に基づいて、血清自己抗体（「aAB」）が癌の診断に使用できることが示唆されている (Fernandez-Madrid et al., Clin Cancer Res. 5: 1393-400 (1999))。例えば、特定の血清aABの存在は、報告されているところによれば、リスクのある患者の中で肺癌の兆候（Lubin et al., Nat Med. 1995; 1: 701-2)、及び非-小細胞肺癌（NSCLC)患者の予後（Blaes et al., Ann Thorac Surg. 2000; 69: 254-8)を予測することができる。しかしながら、特筆すべきは、このような癌研究は、癌の存在又は非存在を決定しない少数のマーカーについて報告されているにすぎず、癌患者の癌-関連血清aAB及びその腫瘍-関連抗原の出現に常に焦点が当てられてきた（Vernino et al., Clin. Cancer Res. 10: 7270-5 (2004); Metcalfe et al., Breast Cancer Res. 2: 438-43 (2000); Tan, J. Clin. Invest. 108: 1411-5 (2001); Lubin et al., Nat Med. 1: 701-2 (1995); Torchilin et al., Trends Immunol. 22: 424-7 (2001); Koziol et al., Clin. Cancer Res. 9: 5120-5126, (2003); Zhang et al., Clin. Exp. Immunol. 125: 3-9, (2001))。更に、任意の個体の腫瘍-関連抗原に特異的な自己抗体が検出される低い頻度は、有用な診断マーカーとしての自己抗体の使用を不可能にしてきた。
【０００３】
疾患症状でのaABの多重分析に関する研究は、ほとんど報告されていない。当該分野でのRobinson et al.による先駆的研究が2002年に発表され、様々な生体分子を認識し、全身性紅斑性狼瘡及びリウマチ様関節炎を含む８つの異なったヒト自己免疫疾患に存在する、多数のaABを記載している（Robinson et al., Nat Med. 8: 295-301 (2002))。癌に関する同様の研究は報告されていない。
【０００４】
現在使用されているaAB検出法のすべては、本質的な利点と弱点を有する。例えば、ELISAによる個々のaABの検出は、容易性を与える。しかしながら、この方法の主な弱点は、他の潜在的に有用な（informative）aABに関してサイレント（silent）であり、そのため、その予測に限定されることである。SEREX分析（発現cDNAライブラリーの血清分析）は、公知の特異性から、種々のaABの同時識別を可能にする（Gure et al., Cancer Res. 58: 1034-41 (1998))。しかしながら、この方法は、時間と労力を要し、そのため臨床的試験には不向きである。患者血清を用いるウェスタンブロッティングは、タンパク質試料中の可能性のある自己抗原のサイズを迅速に特定するが、使用されるタンパク質試料、及び自己抗体：抗原複合体の限定された分解により、その情報能力が制限され、自己抗原に関する更なる情報を与えない（Fernandez-Madrid et al., Clin Cancer Res. 5: 1393-400 (1999))。
【０００５】
結論として、癌、癌のサブクラス、及び疾患のその他の局面に決定的な自己抗体パターンは、記載されていない。更に、癌の診断及び特徴付けに相関する自己抗体及び生物試料中の自己抗体パターンを検出するためのハイ-スループット分析手段は、非常に有益であろう。
【発明の開示】
【０００６】
本発明は、生物試料中の自己抗体（aAB）の検出に関し、自己抗体プロファイリングにより決定される、免疫状態の相違を利用して、生理的状態又は表現型（本明細書ではクラスと称する）を識別し、診断的及び予後の情報を得る。本発明は、抗原-抗体結合を真似るためにペプチドエピトープを使用し、免疫状態の半定量的測定として生物試料中の自己抗体結合活性（自己抗体プロファイリング）を決定する。診断的及び予後の決定を含む、自己抗体プロファイリング及びクラス予測に役立つ有用なエピトープ集団、並びに特定の疾患クラスの識別に役立つ有用なエピトープ集団を選択する方法を提供する。１つの例では、本明細書で開示されるように、様々な腫瘍状態を有する患者は、診断的関連を有する、血清aABプロファイルの検出可能な差を有する。合成ペプチド群は、癌及び非-癌性試料中の自己抗体結合活性を測定するために使用され、有用なエピトープの亜集団は、特定され、そして癌に関連する免疫状態を特徴付け、高度に正確な癌診断約を提供するために使用される。本明細書に開示されている別の実施例では、肺癌のサブクラスを識別するために役立つ一組の有用なエピトープを提供する。有利なことに、本発明は、自己抗体結合活性パターン認識及び有用なエピトープ集団を使用する。組成物としての多数の自己抗体結合活性の組合せは、単一aABを含む典型的な単一-体バイオマーカーに比べて、正確に癌を特徴付けるより高い可能性を有する。
【０００７】
様々な癌の診断薬である自己抗体結合活性パターンを検出するために使用することができる有用なエピトープ集団に加えて、本発明は、有用なエピトープ集団により検出された自己抗体結合活性パターンに基づいて、疾患の特定のステージ又は腫瘍の組織病理学的表現型を決定するために用いることができる有用なエピトープ集団を提供する。追加的に、本明細書では、有用なエピトープ集団により検出された自己抗体結合活性パターンに基づいて、ある試料を、疾患の兆候が高リスクにある個体由来のものとして分類するために用いることができる、有用なエピトープ集団を提供する。特筆すべきは、遺伝子-アレイとは異なり、本明細書に開示されるaAB-試験のために使用される生物試料は、生検又は時間のかかる試料精製を必要としない。
【０００８】
重要なことに、本発明は、エピトープのタンパク質全体又はフラグメントよりもむしろエピトープを自己抗体用のプローブ試料に利用する。本明細書で説明するように、単一タンパク質の異なったフラグメントに対応するエピトープは、異なったクラス由来の試料間でその結合活性の不一致な差を示し得る。結果として、タンパク質又はそのフラグメント（すなわち、多数のエピトープの混合物）を有する自己抗体検出は、クラス分けに関して情報価値がないが、単一タンパク質内の個々のエピトープの使用は、有益性が高いかもしれない。例えば、第一エピトープは、非-癌試料中に特定の頻度で存在するエピトープ結合活性を有することがあり、小細胞肺癌患者由来の試料中の検出可能なエピトープ結合活性を欠くかもしれない。第二エピトープ、これは、同一のタンパク質に対応し、第一エピトープと重複しないが、通常試料及び癌試料の両方で同一の頻度で存在する多数のエピトープ結合活性を有することがある。この場合、第一エピトープは、本明細書で議論するように、有用なものであるが、第二エピトープ及びエピトープ全体は、これらの結果に基づく情報を与えないだろう。
【０００９】
本明細書に開示されている診断的及び予後的方法の別の重要な局面は、特に、通常の試料に存在し、疾患試料では減少するエピトープ結合活性を含む、様々な区分の自己抗体を考慮することである。すなわち、本方法は、疾患-関連自己抗原の発現に反応して疾患症状において現れる自己抗体に単に焦点を当てるものではない。むしろ、本発明は、様々なエピトープを利用し、それらの多くは、特定の頻度での通常試料中の高レベルのエピトープ結合活性を検出し、疾患症状に対応する試料中の、低い又は検出不可能なレベルのエピトープ結合活性を明らかにする。このようなエピトープと結合することができる自己抗体が疾患試料中で頻繁に検出できないという事実にもかかわらず、これらのエピトープは、クラス分けに関して情報を与え、本明細書に開示されている診断及び予後の方法に有用である。
【００１０】
従って、１つの局面では、本発明は、一組の有用なエピトープを識別する方法を提供し、一組のエピトープの自己抗体結合活性は試料間のクラス分けと相関する。本方法は、試料中のその自己抗体結合活性がクラス分けと相関する程度によりエピトープを分類し、そして、当該相関関係が期せずして予想されるよりも強いか否かを決定すること、を含む。自己抗体結合活性が期せずして予想されるよりも強いクラス分けに相関するためのエピトープは、有用なエピトープである。一組の有用なエピトープは、同定される。１つの実施態様では、クラス分けは、公知のクラス間で決定される。好ましくは、クラス分けは、疾患クラスと非-疾患クラスとを識別するものであり、より好ましくは、癌クラスと通常クラスとを識別する。別の好ましい実施態様では、クラス分けは、高リスククラスと非-疾患クラスとを、より好ましくは高リスク癌クラスと非-癌クラスとを識別する。公知のクラスは、化学療法にうまく反応する個体クラスでも、又は化学療法にうまく反応しない個体クラスでもよい。
【００１１】
別の実施態様では、公知のクラス分けは、疾患のクラス分けであり、好ましくは癌のクラス分けであり、更により好ましくは肺癌クラス分け、乳癌クラス分け、胃腸癌クラス分け、又は前立腺癌クラス分けである。１つの実施態様では、公知のクラス分けは、SCLCクラスとNSCLCクラスとの間の肺癌クラス分けである。
【００１２】
試料中のその自己抗体結合活性がクラス分けと相関する程度によってエピトープを分類することは、第一クラスでは均一に高く、第二クラスでは均一に低い自己抗体結合活性である、理想化された自己抗体結合活性パターンを特定し、そして、等価なランダムパターンに比べて、自己抗体結合活性が理想化パターンに類似しているための高密度のエピトープが存在するか否かを決定することを含む、近接性分析（例えば、シグナルを、ノイズルーチン、ピアソン相関ルーチン又はユークリッド距離ルーチンに用いること）により実行することができる。シグナル対ノイズルーチンは、下記式：
【００１３】
【数１】

【００１４】
[式中、
gは、エピトープの自己抗体結合活性値であり；
cは、クラス分けであり；μ₁(g)は、第一クラスについてのgの自己抗体結合活性値の平均であり；
μ₁(g)は、第一クラスのgの自己抗体結合活性値の平均であり；
μ₂(g)は、第二クラスのgの自己抗体結合活性値の平均であり；
σ₁(g)は、第一クラスの標準偏差であり；及び
σ₂(g)は、第二クラスの標準偏差である。]
で表される。
【００１５】
１つの実施態様では、ノイズルーチンに対するシグナルは、近接性分析を用いずに、癌の分類のための、有用なエピトープについての重み付き多数決を決定するために使用される。
【００１６】
本発明の別の局面では、重み付き多数決方式を用いてつくられたモデルに従って、クラスの内の１つについて、１以上の有用なエピトープ（例えば、20、50、100、150超）の重み付き多数決を決定し、ここで、各多数決（vote）の大きさは、所与のエピトープの試料の自己抗体結合活性、及び所与のエピトープの自己抗体結合活性とクラス分けとの相関度に依拠する；並びに、多数決を合計して勝利（winning）クラスを決定すること、を含む、公知の又は推定上のクラスに試料を帰属する方法である。重み付き多数決方式は下記式：
【００１７】
【数２】

【００１８】
[式中、
V₉は、エピトープgの重み付き多数決であり；
a_gは、エピトープの自己抗体結合活性とクラス分けとの相関関係であり、本明細書でP(g,c)と定義される；
b_g = (μ₁(g)+μ₂(g))/2、これは、第一クラスと第二クラスにおけるエピトープの平均log₁₀自己抗体結合活性値の平均であり、
x_gは、試験される試料におけるエピトープのlog₁₀自己抗体結合活性値であり；
正のV値は、第一クラスの多数決を示し、負のV値は、第一クラスの負の値を示す（第二クラスの多数決）。]
で表される。予測強度も決定することができる。ここで、予測強度が特定の閾値、例えば0.3よりも大きい場合に、試料を勝利クラスに帰属する。予測強度は下記式：
【００１９】
【数３】

【００２０】
[式中、V_win及びV_loseは、勝利クラス及び負け（losing）クラスの総多数決である。]
により決定される。
【００２１】
本発明はまた、１以上の有用なエピトープ用のクラスの内の１つの重み付き多数決を決定すること、ここで、各多数決の大きさは、エピトープの試料の自己抗体結合活性、及びエピトープの自己抗体結合活性とクラス分けとの相関度に依拠する、を含む、試料の分類において使用される、有用なエピトープの重み付き多数決を決定する方法を包含する。多数決は、勝利クラスを決定するために合計することができる。
【００２２】
本発明の更に別の実施態様は、推定上のクラスをつくるために自己抗体結合活性により試料を集団化し；そして推定上のクラスに基づくクラス予測を行うことにより、推定上のクラスが有効であるか否かを決定し；及びクラス予測が高い予測強度を有するか否かを評価すること、を含む、２以上の試料から多数の分類を確認する方法である。試料の集合化は、例えば、自己組織化マップに従って行うことができる。自己組織化マップは、多数のノード、Nからつくられ、マップは、競争的学習ルーチンに従うベクトルを集団化する。競争的学習ルーチンは、下記式：
【００２３】
【数４】

【００２４】
[式中、
i = 繰り返し数；
N = 自己組織化マップのノード；
τ = 学習速度；
P = 対象ワーキングベクトル；
d= 距離；
Np = Pに最も近くマッピングされるノード；及び
f_i(N) はiでのNの位置である。]
で表される。推定上のクラスが重み付き多数決方式をつくるための有効なステップか否かを決定することは、本明細書に記載されるように行うことができ、クラス予測は試料で行うことができる。
【００２５】
本発明はまた、少なくとも１つのエピトープについての自己抗体結合活性について試料を評価し；そして、重み付き多数決方式でつくられたモデルを用いて、モデルの自己抗体結合活性に関して、試料の自己抗体結合活性の関数として試料を分類すること、を含む、個体から得られた試料をクラスに分類する方法に関する。
【００２６】
本発明はまた、個体から得られた試料を分類するための、例えば、コンピュータ装置における使用のための、方法に関する。本方法は、重み付き多数決方式によりつくられたモデルを提供し；少なくとも１つのエピトープの自己抗体結合活性について試料を評価して、それによって、各エピトープの自己抗体結合活性値を得；重み付き多数決方式を用いつくられたモデルを用いて、試料の自己抗体結合活性をモデルと比較することを含む試料の分類をし、それによって分類を得；及び分類の出力表示を提供すること、を含む。重み付き多数決方式のルーチン及び近接性分析を本明細書に記載する。本方法は、試料の一連の自己抗体結合活性値を示すベクトルを用いて実行することができる。ベクトルは、コンピュータ装置により提供され、次いで上記のステップに供される。本方法は、モデルの相互検証を更に含む。モデルの相互検証は、モデルをつくるために使用される試料を除き又は保留し；重み付き多数決ルーチンを用いて、除いた試料なしで分類するための相互検証モデルをつくり；相互検証モデルを用いて、除いた試料の自己抗体結合活性値を、相互検証モデルの自己抗体結合活性値と比較することにより、除いた試料を勝利クラスに分類し；及び、除いた試料の相互検証モデル分類に基づいて、除いた試料の勝利クラスの予測強度を決定すること、を含む。本方法は、取るに足らない変化を示す試料中の自己抗体結合化性値を除き；ベクトルの自己抗体結合活性を標準化し；及び/又は当該値を設計し直すことを更に含むことができる。本方法は、集団（例えば、形成されたワーキングクラスタ）を示す出力を提供することを更に含む。
【００２７】
本発明はまた、試験される少なくとも１つの試料が分類される、少なくとも１つの従来知られていないクラス（例えば、癌クラス）を確認する方法であって、試料が個体から得られる、前記方法を包含する。本方法は、２つ以上の試料由来の多数のエピトープの自己抗体結合活性値を得；試料の各々のベクターを形成し、ここで、各ベクトルは、対応する試料中の自己抗体結合活性を示す一連の自己抗体結合活性値である；及び、クラスタリングルーチンを用い；同様の自己抗体結合活性を示すベクターが一緒に集団化されて（例えば、自己組織化マップを用いて）、ワーキングクラスタを形成するように、試料のベクトルをグループ化すること、ここで、ワーキングクラスタは少なくとも１つの従来知られていないクラスを特定する、を含む。従来知られていないクラスは、本明細書に記載の重み付き多数決方式のための方法を用いて確認される。自己組織化マップは、多数のノード、Nから形成され、競争的学習ルーチンに従うベクトルを集団化する。競争的学習ルーチンは、下記式：
【００２８】
【数５】

【００２９】
[式中、
i = 繰り返し数；
N = 自己組織化マップのノード；
τ = 学習速度；
P = 対象ワーキングベクトル；
d= 距離；
Np = Pに最も近くマッピングされるノード；及び
f_i(N)はiでのNの位置である。]
で表される。
【００３０】
本発明はまた、特定のクラス予測に役立つ有用なエピトープの数を増加させる方法を提供する。本方法は、エピトープの自己抗体結合活性とクラス分けとの相関関係を決定し、エピトープが有用なエピトープであるか否かを決定することを、を含む。１つの実施態様では、本発明は、ノイズルーチンに対するシグナルの使用を含む、エピトープが有用なものであると決定される場合、すなわち、有意な予測を有する場合には、他の有用なエピトープと組み合わせることができ、クラス予測のために、本明細書に記載の重み付き多数決方式モデルに従って使用することができる。
【００３１】
１つの実施態様では、第一クラスの試料についての２以上のエピトープの平均抗体結合活性（±SEM）を、第二クラスの試料についての２以上のエピトープの平均抗体結合活性（±SEM）と比較する。両側スチューデントt-検定を用いる近接性分析は、有用なエピトープを同定するために行う。
【００３２】
１つの実施態様では、本発明は、試料間のクラス分けと相関する自己抗体結合活性を有する一組の有用なエピトープを識別する方法であって、以下のステップ：
（a）２以上のクラスの各々の多数の試料における多数のエピトープの自己抗体結合活性を決定し；
(b）エピトープの集団と、多数の試料由来の同一のクラスの試料中における自己抗体結合活性を有する多数のエピトープとを識別し、ここで、エピトープの集団は、多数の試料由来の様々なクラスの試料間のクラス分けに相関する自己抗体結合活性を有する；及び
（c）相関関係が期せずして予想されるよりも強いか否かを決定すること；
ここで、期せずして予想されるよりも強いクラス分けと相関する自己抗体結合活性を有するエピトープの集団は、一組の有用なエピトープである、
を含む、前記方法を提供する。
【００３３】
好ましい実施態様では、パターン認識アルゴリズムは、２以上のクラスの各々のための多数の試料における多数のエピトープの自己抗体結合活性を用いて、一組の有用なエピトープを識別するために使用される。パターン認識アルゴリズムは、試料間のクラスを識別するために使用することができる自己抗体結合活性の集団を認識する。好ましい実施態様では、パターン認識アルゴリズムは、得られたパターンを確認するために使用される。好ましい実施態様では、神経回路網パターン認識アルゴリズムが使用される。別の好ましい実施態様では、サポートベクタマシンアルゴリズムがパターン認識のために使用される。小数の試料が使用されるとき、サポートベクタマシンアルゴリズムが好ましく使用される。トレーニングは、例えば、識別されることになる任意のクラス由来の試料、例えば癌試料又は対照試料、を使用することができる。
【００３４】
本発明はまた、試料をクラスに分類するためのコンピュータ装置に関する。ここで、試料は個体から得られ、当該装置は以下：試料の自己抗体結合活性値のソース；ソースからの自己抗体結合活性値を受けるように連結された、デジタルプロセッサによって実行されるプロセッサルーチン、ここで、構成されたモデルに対する試料の自己抗体結合活性値を、重み付き多数決方式又はパターン認識アルゴリズム及びトレーニング試料と比較することにより、プロセッサルーチンは、試料の分類を決定する；並びに、試料の分類の指標を提供するための、デジタルプロセッサに連結されたアウトプットアセンブリ、を含む。モデルは、本明細書に記載の重み付き多数決方式、又は本明細書に記載のパターン認識アルゴリズム及びトレーニング試料を用いて構成される。アウトプットアセンブリは、分類の表示を含む。
【００３５】
更に別の実施態様では、試験される少なくとも１つの試料を分類するためのモデルを構築するためのコンピュータ装置である。ここで、当該装置は、２以上のクラスに属する２以上の試料由来の自己抗体結合活性値のベクトルソース、ここで、当該ベクトルは、試料の一連の自己抗体結合活性値である；及び、ソース由来のベクトルの自己抗体結合活性値を受けるように連結された、デジタルプロセッサにより実行されるプロセッサルーチン、ここで、当該プロセッサルーチンは、自己抗体結合活性値に基づいて試料を分類し、かつ重み付き多数決方式を利用して関連エピトープの一部分を有するモデルを構築するための、関連するエピトープを決定する、を含む。装置は、取るに足らない変化を示す試料における自己抗体結合活性値を除去するための、ソースとプロセッサルーチンとを連結した、フィルタ；及び、自己抗体結合活性値を標準化するための、フィルタに連結された正規化群、を更に含むことができる。アウトプットアセンブリは、グラフ表示でよい。
【００３６】
本発明はまた、試験される少なくとも１つの試料を分類するためのモデルを構築するためのコンピュータ装置を含む。ここで、当該モデルは、パターン認識アルゴリズム及びトレーニング試料の使用により構築される自己抗体結合活性パターンに基づく。
【００３７】
本発明はまた、試料をクラスに分類するための機械可読コンピュータアセンブリを含む。ここで、当該試料は個体から得られ、当該コンピュータアセンブリは、試料の自己抗体結合活性値のソース；ソース由来の自己抗体結合活性値を受けるように連結された、デジタルプロセッサにより実行されるプロセッサルーチン、ここで、当該プロセッサルーチンは、構成されるモデルに対する試料の自己抗体結合活性値を、重み付き多数決方式を比較することにより、試料の分類を決定する；及び、試料の分類の指標を提供するための、デジタルプロセッサに連結された、アウトプットアセンブリ、を含む。本発明はまた、試験される少なくとも１つの試料を分類するためのモデルを構築するための、機械可読コンピュータアセンブリを含む。ここで、当該コンピュータアセンブリは、２以上のクラスに属する２以上の試料由来の自己抗体結合活性値のベクトルソース、当該ベクトルは、試料の一連の自己抗体結合活性値である；及び、ソース由来のベクトルの自己抗体結合活性値を受けるように連結された、デジタルプロセッサにより実行されるプロセッサルーチン、ここで、当該プロセッサルーチンは、試料を分類し、かつ重み付き多数決方式を利用して関連エピトープの一部分を有するモデルを構築するための、関連するエピトープを決定する、を含む。
【００３８】
本発明はまた、デジタルプロセッサにより実行されるプロセッサルーチンを含む、試料をクラスに分類するための機械可読コンピュータアセンブリを含む。ここで、当該プロセッサルーチンは、パターン認識アルゴリズム及びトレーニング試料の使用により構築された自己抗体結合活性パターンに基づいて、試料の自己抗体結合活性とモデルとを比較することにより、試料の分類を決定する。
【００３９】
１つの実施態様では、本発明は、疾患を有する個体のための治療プランを決定する方法であって、以下：個体から試料を得；少なくとも１つのエピトープについての試料の自己抗体結合活性を評価し；重み付き多数決方式を用いて構築されたコンピュータモデルを使用し；モデル試料に関する自己抗体結合活性の関数として試料を疾患クラスに分類し；及び、疾患クラスを使用して、治療プランを決定すること、を含む、前記方法を含む。別の適用は、個体由来の試料が得られるその個体の診断法又は個体の診断を助ける方法であって、以下：少なくとも１つのエピトープのための自己抗体結合活性用試料を評価し；及び重み付き多数決方式を用いて構築されたコンピュータモデルを用いて、試料を、モデルの自己抗体結合活性について試料の自己抗体結合活性を評価することを含む疾患クラスに分類し；及び、個体を診断する又は個体の診断を助けること、を含む、前記方法である。本発明は、疾患クラスを治療するためにデザインされた薬物の有効性を決定する方法であって、個体を薬物に供し、以下：薬物に供した個体由来の試料を得；少なくとも１つのエピトープについて自己抗体結合活性用の試料を評価し；及び、重み付き多数決方式を用いて構築されたモデルを用いて、モデルの自己抗体結合活性と比較して試料の自己抗体結合活性を評価することを含む、試料を疾患クラスに分類すること、を含む、前記方法を含む。更に別の適用は、個体由来の試料を得；少なくとも１つのエピトープについて自己抗体結合活性用の試料を評価し；及び、重み付き多数決方式を用いて構築されたモデルを用いて、モデルの自己抗体結合活性と比較して試料の自己抗体結合活性を評価することを含む、試料を疾患クラスに分類すること、を含む、個体が表現型クラスに属するか否かを決定する方法である。
【００４０】
別の実施態様では、治療プランを決定する方法が、パターン認識アルゴリズム及びトレーニング試料の使用により構築された自己抗体結合活性パターンに基づいて、コンピュータモデルを用いて２以上のエピトープについて患者試料の自己抗体結合活性を評価することを含む。
【００４１】
１つの局面では、本発明は、乳癌診断のために一組の有用なエピトープを提供する。好ましい実施態様では、本発明は、図２に開示されているものからなる群より選ばれる、1〜27、より好ましくは2〜27、より好ましくは5〜27、より好ましくは10〜27、より好ましくは15〜27、より好ましくは20〜27、より好ましくは25〜27の、有用なエピトープを含む、エピトープが乳癌のために有益である、一組の有用なエピトープを提供する。好ましい実施態様では、一組の有用なエピトープは、図２に開示されているものを含む。別の好ましい実施態様では、一組の有用なエピトープは、図２に開示されているものを含む。別の好ましい実施態様では、一組の有用なエピトープは、図２に開示されているものから本質的になる。
【００４２】
別の好ましい実施態様では、本発明は、一組の有用なエピトープであって、表２に開示されているものからなる群より選ばれる、1〜51、より好ましくは2〜51、より好ましくは5〜51、より好ましくは10〜51、より好ましくは15〜51、より好ましくは20〜51、より好ましくは25〜51、より好ましくは30〜51、より好ましくは35〜51、より好ましくは40〜51、より好ましくは45〜51の、有用なエピトープを含む、エピトープが肺癌、特にNSCLCのために有益である、一組の有用なエピトープを提供する。好ましい実施態様では、一組の有用なエピトープは、表２に開示されているものを含む。別の好ましい実施態様では、一組の有用なエピトープは、表２に開示されているものから本質的になる。
【００４３】
１つの局面では、本発明は、NSCLCとSCLCとを識別するために一組の有用なエピトープを提供する。好ましい実施態様では、本発明は、図３に開示されているものからなる群より選ばれる、1〜28、より好ましくは2〜28、より好ましくは5〜28、より好ましくは10〜28、より好ましくは15〜28、より好ましくは20〜28、より好ましくは25〜28の、有用なエピトープを含む、エピトープが肺癌、特にNSCLCとSCLCとを識別するために有益である、一組の有用なエピトープを提供する。好ましい実施態様では、一組の有用なエピトープは、図３に開示されているものを含む。別の好ましい実施態様では、一組の有用なエピトープは、図３に開示されているものから本質的になる。
【００４４】
１つの局面では、本発明は、NSCLCとSCLCとを識別するために一組の有用なエピトープを提供する。好ましい実施態様では、本発明は、表２に開示されているものからなる群より選ばれる、1〜51、より好ましくは2〜51、より好ましくは5〜51、より好ましくは10〜51、より好ましくは15〜51、より好ましくは20〜51、より好ましくは25〜51、より好ましくは30〜51、より好ましくは35〜51、より好ましくは40〜51、より好ましくは45〜51の、有用なエピトープを含む、エピトープがNSCLCとSCLCとを識別するために有益である、一組の有用なエピトープを提供する。好ましい実施態様では、一組の有用なエピトープは、表２に開示されているものを含む。別の好ましい実施態様では、一組の有用なエピトープは、表２に開示されているものから本質的になる。
【００４５】
別の好ましい実施態様では、本発明は、表11に開示されているものからなる群より選ばれる、1〜25、より好ましくは2〜25、より好ましくは5〜25、より好ましくは10〜25、より好ましくは15〜25、より好ましくは20〜25の、有用なエピトープを含む、エピトープが肺癌、特にNSCLCの診断に有益である、一組の有用なエピトープを提供する。好ましい実施態様では、一組の有用なエピトープは、表11に開示されているものを含む。別の好ましい実施態様では、一組の有用なエピトープは、表11に開示されているものから本質的になる。
【００４６】
１つの局面では、本発明はまた、特定のクラス分けのための一組の有用なエピトープを識別するために有用であるペプチド群を提供する。１つの実施態様では、ペプチド群は、表１に開示されているペプチドの群から選ばれる、1〜1448、より好ましくは2〜1448、より好ましくは5〜1448、より好ましくは10〜1448、より好ましくは25〜1448、より好ましくは50〜1448、より好ましくは100〜1448、より好ましくは250〜1448、より好ましくは500〜1448、より好ましくは750〜1448、より好ましくは1000〜1448、より好ましくは1250〜1448ペプチド、及び/又は、表10に開示されているペプチドの群から選ばれる、1〜31、より好ましくは2〜31、より好ましくは5〜31、より好ましくは10〜31、より好ましくは15〜31、より好ましくは20〜31、より好ましくは25〜31ペプチド、及び/又は、表９に開示されているペプチドの群から選ばれる、1〜83、より好ましくは2〜83、より好ましくは5〜83、より好ましくは10〜83、より好ましくは15〜83、より好ましくは20〜83、より好ましくは25〜83、より好ましくは50〜83、より好ましくは75〜83ペプチド、及び/又は、表８に開示されているペプチドの群から選ばれる、1〜42、より好ましくは2〜42、より好ましくは5〜42、より好ましくは10〜42、より好ましくは15〜42、より好ましくは20〜42、より好ましくは25〜42、より好ましくは30〜42、より好ましくは35〜42ペプチド、及び/又は表７に開示されているペプチドの群から選ばれる、1〜52、より好ましくは2〜52、より好ましくは5〜52、より好ましくは10〜52、より好ましくは15〜52、より好ましくは20〜52、より好ましくは25〜52、より好ましくは30〜52、より好ましくは35〜52、より好ましくは40〜52、より好ましくは45〜52ペプチドを含む。
【００４７】
１つの局面では、本発明は、生物試料の多数のクラス間を識別するためのエピトープマイクロアレイを提供する。ここで、当該マイクロアレイは多数のペプチドを含み、各ペプチドは独立に、多数の特定のクラスから選択される特定のクラスに特徴的な試料において、対応するエピトープ結合活性を有し；総合すると、多数のペプチドは多数の特定のクラスのすべてに包括的に特徴的である多数の試料において、対応するエピトープ結合活性を有し；各ペプチドの自己抗体結合活性は独立して、多数の特定のクラスの内の他の１つに特徴的な試料よりも、多数の特定のクラスの内の１つに特徴的な試料では高い。
【００４８】
好ましい実施態様では、本発明は、生物試料について第一クラスと第二クラスとを識別するためのエピトープマイクロアレイを提供する。エピトープマイクロアレイは、多数のペプチドを含み、各ペプチドは、独立して、第一クラスに特徴的な試料又は第二クラスに特徴的な試料において対応するエピトープ結合活性を有し；総合すれば、多数のペプチドは、第一クラス及び第二クラスに包括的に特徴的である試料において対応するエピトープ結合活性を有し；各ペプチドの自己抗体結合活性は独立して、他のクラスに特徴的な試料におけるその自己抗体結合活性に比較して、第一クラス又は第二クラスのいずれかに特徴的な試料において高い。
【００４９】
好ましい識別可能なクラスは、非-疾患クラスと疾患クラス、より好ましくは非-癌クラスと癌クラスを含み、後者は、好ましくは肺癌、乳癌、胃腸癌又は前立腺癌である。他の好ましい識別可能なクラスは、高リスクのクラスと非-疾患クラスであり、好ましくは高リスクの癌クラスと非-癌クラスである。他の好ましい識別可能なクラスは、識別可能な癌クラス、例えば識別可能な肺癌クラス、例えばNSCLCとSCLCである。他の好ましい識別可能な癌クラスは、転移性癌と非-転移性癌のクラスである。
【００５０】
好ましい実施態様では、エピトープマイクロアレイの２以上のペプチドは、単一タンパク質の異なった部位、好ましくは単一タンパク質の非-重複部位に対応する。
【００５１】
別の好ましい実施態様では、本発明は、肺癌、特にNSCLCの診断に有用なエピトープマイクロアレイを提供する。ここで、当該アレイは、表11に開示されているものからなる群より選ばれる、1-25、より好ましくは2〜25、より好ましくは5〜25、より好ましくは10〜25、より好ましくは15〜25、より好ましくは20〜25の、有用なエピトープを含む。好ましい実施態様では、一組の有用なエピトープは、表11に開示されているものを含む。別の好ましい実施態様では、一組の有用なエピトープは、表11に開示されているものから本質的になる。
【００５２】
別の好ましい実施態様では、本発明は、肺癌、特にNSCLCの診断に有用なエピトープマイクロアレイを提供する。ここで、当該アレイは、表２に開示されているものからなる群より選ばれる、1〜51、より好ましくは2〜51、より好ましくは5〜51、より好ましくは10〜51、より好ましくは15〜51、より好ましくは20〜51、より好ましくは25〜51、より好ましくは30〜51、より好ましくは35〜51、より好ましくは40〜51、より好ましくは45〜51の、有用なエピトープを含む。好ましい実施態様では、一組の有用なエピトープは、表２に開示されているものを含む。別の好ましい実施態様では、一組の有用なエピトープは、表２に開示されているものから本質的になる。
【００５３】
別の好ましい実施態様では、本発明は、乳癌の診断に有用なエピトープマイクロアレイを提供する。ここで、当該アレイは、図２に開示されているものからなる群より選ばれる、1〜27、より好ましくは2〜27、より好ましくは5〜27、より好ましくは10〜27、より好ましくは15〜27、より好ましくは20〜27、より好ましくは25〜27の、有用なエピトープを含む。好ましい実施態様では、一組の有用なエピトープは、図２に開示されているものを含む。別の好ましい実施態様では、一組の有用なエピトープは、図２に開示されているものから本質的になる。
【００５４】
別の好ましい実施態様では、本発明は、NSCLCとSCLCとを識別するために有用なエピトープマイクロアレイを提供する。ここで、当該アレイは、表２に開示されているものからなる群より選ばれる、1〜51、より好ましくは2〜51、より好ましくは5〜51、より好ましくは10〜51、より好ましくは15〜51、より好ましくは20〜51、より好ましくは25〜51、より好ましくは30〜51、より好ましくは35〜51、より好ましくは40〜51、より好ましくは45〜51の、有用なエピトープを含む。好ましい実施態様では、一組の有用なエピトープは、表２に開示されている有用なものを含む。別の好ましい実施態様では、一組の有用なエピトープは、表２に開示されているものから本質的になる。
【００５５】
別の好ましい実施態様では、本発明は、NSCLCとSCLCとを識別するために有用なエピトープマイクロアレイを提供する。当該アレイは、図３に開示されているものからなる群より選ばれる、1〜28、より好ましくは2〜28、より好ましくは5〜28、より好ましくは10〜28、より好ましくは15〜28、より好ましくは20〜28、より好ましくは25〜28の、有用なエピトープを含む。好ましい実施態様では、一組の有用なエピトープは、図３に開示されているものを含む。別の好ましい実施態様では、一組の有用なエピトープは、図３に開示されているものから本質的になる。
【００５６】
好ましい実施態様では、本発明は、特定のクラス分けのための有用なエピトープを識別するために有用なエピトープマイクロアレイを提供する。エピトープマイクロアレイは、表１に開示されているペプチドの群より選ばれる、1〜1448、より好ましくは2〜1448、より好ましくは5〜1448、より好ましくは10〜1448、より好ましくは25〜1448、より好ましくは50〜1448、より好ましくは100〜1448、より好ましくは250〜1448、より好ましくは500〜1448、より好ましくは750〜1448、より好ましくは1000〜1448、より好ましくは1250〜1448のペプチド、及び/又は表10に開示されているペプチド群の群より選ばれる、1〜31、より好ましくは2〜31、より好ましくは5〜31、より好ましくは10〜31、より好ましくは15〜31、より好ましくは20〜31、より好ましくは25〜31のペプチド、及び/又は表９に開示されているペプチド群の群より選ばれる、1〜83、より好ましくは2〜83、より好ましくは5〜83、より好ましくは10〜83、より好ましくは15〜83、より好ましくは20〜83、より好ましくは25〜83、より好ましくは50〜83、より好ましくは75〜83のペプチド、及び/又は表８に開示されているペプチドの群より選ばれる、1-42、より好ましくは2〜42、より好ましくは5〜42、より好ましくは10〜42、より好ましくは15〜42、より好ましくは20〜42、より好ましくは25〜42、より好ましくは30〜42、より好ましくは35〜42のペプチド、及び/又は表７に開示されているペプチドの群より選ばれる、1〜52、より好ましくは2〜52、より好ましくは5〜52、より好ましくは10〜52、より好ましくは15〜52、より好ましくは20〜52、より好ましくは25〜52、より好ましくは30〜52、より好ましくは35〜52、より好ましくは40〜52、より好ましくは45〜52のペプチドを含む。
【００５７】
１つの実施態様では、本発明は、本明細書に開示されている方法を用いて選択されるクラス分けのための一組の有用なエピトープを含む、２以上のクラス間を識別するために有用な、よって、試料の分類を予測するために有用なエピトープマイクロアレイを提供する。
【００５８】
詳細な説明
「自己抗体結合活性」及び「自己抗体結合活性値」は、所与のエピトープと所与の試料中の自己抗体との結合相関関係の指標を称し、これは、試料中のエピトープ-結合自己抗体の量を反映する半定量的な指標である。本明細書で用いる「試料の」、「試料中の」、「試料を用いて」、又は「試料のための」の自己抗体結合活性は、所与のエピトープと所与の試料中の自己抗体との結合相関関係の指標を称する。
【００５９】
本明細書で用いる「エピトープ結合活性」は、試料中のエピトープ-結合自己抗体を称する。特定のエピトープの「対応するエピトープ結合活性」は、特定のエピトープと特異的に結合する自己抗体である。
【００６０】
「自己抗体」（「aAB」）は、それらを産生する同一の体の成分と特異的に結合する。改変血清自己抗体組成物は、乳癌を含む多数の様々な癌（Metcalfe et al., Breast Cancer Res. 2:438-43 (2000)) and lung cancer (Lubin et al., Nat Med. 1: 701-2 (1995); Blaes et al., Ann Thorac Surg. 69: 254-8 (2000); Gure et al., Cancer Res. 58: 1034-41 (1998))、及び紅斑性狼瘡、シェーグレン症、強皮症、皮膚性/多発性筋炎、I型糖尿病、腫瘍随伴性天疱瘡、炎症性腸疾患及び甲状腺内分泌障害を含む他の様々な疾患において注目されてきた（Schwarz, Autoimmunity and Autoimmune Disease, In: Fundamental Immunology, 3rd ed. (Ed. Paul WE) pp. 1033-99 Raven Press, New York, 1993参照）。
【００６１】
本明細書に開示されている方法は、一般的に、２つの分野：クラス予測及びクラス発見に関する。クラス予測は、現在の状態、素因又は更に結果を反映するかもしれない定義されたクラスへの、特定の試料の帰属を称する。クラス発見は、１以上の従来認識されていない生物的クラスを定義することを称する。
【００６２】
１つの局面では、本発明は、自己抗体結合活性が試料間のクラス分けと相関するような、一組の有用なエピトープを特定することを含む、試料の分類を予測し又は決定することに関する。１つの実施態様では、本方法は、試料の全てに関する自己抗体結合がクラス分けと相関する程度により、エピトープを分類すること、及び次いで、相関関係が期せずして予想したよりも強いか否か（すなわち、統計的に有意である）を決定すること、を含む。自己抗体結合活性のクラス分けとの相関関係が、統計的に有意である場合には、当該エピトープは、「有用な」又は「関連する」エピトープと考えられる。
【００６３】
遺伝子発現プロファイリングに基づく関連する分類法は、先に記載されている。本明細書に参照としてその全体が明確に引用されている、米国特許第6,647,341号明細書を参照。特に、本発明は、本分類スキーム及び方法が、遺伝子発現の指標を含まない点で、Golub et al.の開示とは異なる。むしろ、本方法は、ペプチドエピトープに関する生物試料中の自己抗体結合に基づく、免疫状態の指標を含む。本発明は、有用なエピトープの好適な群を考えると、試料の自己抗体結合活性により証明される免疫状態が、生物的クラス分けの点で有用性が高い、ことの発見に端を発する。
【００６４】
一組の有用なエピトープが一度特定されると、各々の有用なエピトープにより提供される情報に付与される重み付きが決定される。各多数決は、自己抗体結合活性の新規な試料のレベルが、特定のクラス由来のトレーニング試料中の自己抗体結合活性の典型的なレベルとどのくらい類似しているかの指標である。自己抗体結合活性がクラス分けとより強く関連すればするほど、エピトープが提供する情報に重み付きはより多く付与される。すなわち、特定のエピトープへの自己抗体結合がクラス分けに強く相関する場合には、エピトープは、試料が属するクラスを決定する点で、相当の重み付きを有するだろう。逆に、特定のエピトープへの自己抗体結合が、クラス分けと弱く相関するに過ぎない場合には、エピトープは、試料が属するクラスを決定する点で、ほとんど重み付きを有さないだろう。一組の有用なエピトープから使用される各々の有用なエピトープは、重み付きを割り当てられる。一組の有用なエピトープ全体を使用する必要はない；必要ならば、有用なエピトープ全ての亜集団を使用することができる。このプロセスを用いて、重み付き多数決方式は決定することができ、クラス分けのための予測又はモデルは、一組の有用なエピトープから創製することができる。
【００６５】
本発明の更なる局面は、有用なエピトープのための試料の自己抗体結合活性を評価することにより、公知の又は推定上のクラス（すなわち、クラス予測）に生物試料を帰属させることを含む。各々の有用なエピトープについて、１又は他のクラスの多数決は、試料の自己抗体結合活性に基づいて決定される。次いで、各多数決は、上記の重み付き多数決方式に従って重み付きされ、重み付き多数決は、試料について勝利クラスを決定するために合計される。勝利クラスは、最大の多数決が投じられるクラスであると定義される。場合により、勝利クラスの予測強度（PS）も決定することができる。予測強度は、0〜1の範囲の勝利クラスの勝利限界である。１つの実施態様では、PSがある閾値（例えば、0.3）を超える場合にのみ、試料を勝利クラスに帰属することができる；そうでない場合には、評価は変わりやすいと考えられる。
【００６６】
別の実施態様では、パターン認識アルゴリズムは、特定のクラス特徴的なトレーニング試料を用いて使用される。用いられる試料の特定のクラスは、その間で識別されるものの任意の１つでよい。例えば、癌クラスに特徴的な試料、又は非-癌クラスに特徴的な試料は、癌試料と非-癌試料とを識別するために有用なモデルをつくるために、パターン認識アルゴリズムを用いて使用することができる。
【００６７】
１つの実施態様では、サポートベクタマシンアルゴリズムが使用される。別の実施態様では、神経回路網アルゴリズムが使用される。好ましくは、少数のトレーニング試料が使用される場合、サポートベクタマシンアルゴリズムが使用される。
【００６８】
本発明の別の実施態様は、推定上のクラスを得るために（すなわち、クラス発見）、自己抗体結合活性に基づいて試料を集団化することにより、試料由来の２以上のクラスを発見し又は確認する方法に関する。推定上のクラスは、上記のように、クラス予測ステップを実行することにより評価される。好ましい実施態様では、本方法の１以上のステップは、好適なプロセシング手段、例えばコンピュータを用いて行われる。
【００６９】
１つの実施態様では、本発明の方法は、特定の疾患クラス又は特定の疾患クラス内のサブクラスに関して、試料を分類するために使用される。本発明は、癌、自己免疫疾患、感染症、神経変性疾患等に限定されない、任意の疾患、症状又は症候について実質的に試料を分類する点で、有用である。すなわち、本発明は、試料が、特定の疾患クラス（例えば、非-癌に対して、肺癌の兆候の高リスクに対して、現存する肺癌）に属するか（又はそれに分類されるか）否か、及び/又は特定の疾患（例えば、非-小細胞肺癌 (「NSCLC」) クラスに対して、小細胞肺癌 (「SCLC」) クラス）内のあるクラスに属するか否かを決定するために使用することができる。
【００７０】
本明細書で用いる用語「クラス」及び「サブクラス」は、１以上の特徴を共有する群を意味するものとする。例えば、疾患クラスは、広範（例えば、増殖性疾患）でも、中度（例えば、癌）でも又は狭く（例えば、肺癌）てもよい。用語「サブクラス」は、クラスを更に特定又は識別することを意図する。例えば、肺癌のクラスにおいて、NSCLC及びSCLCは、サブクラスの例である；しかしながら、NSCLC及びSCLCは、その中のクラスであり、そしてクラスそのものであるとも考えられる。これらの用語は、群のメンバーの数の点から、任意の特定の制限をするものではない。むしろ、生物識別をするときに、群の種々の集合及び亜集合を組織化する構築するのを補助するに過ぎない。
【００７１】
本発明は、実質的に任意のクラス又は反応に関して試料間のクラス又はサブクラスを特定するために使用することができ、当該クラス又は反応に関して所与の試料を分類するために使用することができる。１つの実施態様では、クラス又はサブクラスは従来知られている。例えば、本発明は、自己抗体結合活性に基づいて、”ウイルス性（例えば、HIV、ヒト乳頭腫ウイルス、髄膜炎）又は細菌性（例えば、クラミジア、ブドウ球菌、連鎖球菌）感染症により感受性である個体からの試料”対”このような感染症にほとんど感受性でない個体からの試料”を分類するために使用することができる。本発明は、癌、肥満症、糖尿病、高血圧、化学療法への反応等を含むがこれらに限定されない、任意の表現型又は生理学的型に基づいて、試料を分類するために使用することができる。本発明は、従来知られていない生物的クラスを特定するために更に使用することができる。
【００７２】
具体的な実施態様では、クラス予測は、研究されている疾患の型又はクラスを有する公知の個体由来の試料、及び疾患を有さない又は疾患の異なった型もしくはクラスを有する個体由来の試料を用いて実行される。このことは、表現型の完全な範囲に渡って自己抗体結合活性パターンを評価する能力を提供する。本明細書に記載の方法を用いて、分類モデルは、これらの試料由来の自己抗体結合活性により構築される。
【００７３】
１つの実施態様では、このモデルは、試料における自己抗体結合活性が予測されるクラス分けと相関するような、有用な又は関連するエピトープの集合を特定することにより創製される。例えば、エピトープは、その自己抗体結合活性がクラス分けと相関する程度により分類され、このデータは、観察された相関関係が、予想されるよりも期せずして強いか（例えば、統計的に有意である）否かを決定するために評価される。特定のエピトープの相関関係が統計的に有意である場合には、エピトープは、有用なエピトープであると考えられる。相関関係が統計的に有意でなければ、エピトープは、有用なエピトープであるとは考えられない。
【００７４】
自己抗体結合活性とクラス分けとの相関関係の程度は、多数の方法を用いて評価することができる。好ましい実施態様では、各エピトープは、自己抗体結合活性ベクトル v(g) = (a₁、a₂、. . . 、a_n)（式中、a_iは、試料の初期集団（複数）のi番目の試料中のエピトープの自己抗体結合活性gを示す）により表される。クラス分けは、理想化された自己抗体結合活性パターン c = (c₁、c₂、. . . 、cn)（式中、i番目の試料がクラス１又はクラス２に属するか否かに従い、c_i = +1又は0である。）により表される。エピトープとクラス分けとの相関関係は、様々な方法において測定することができる。例えば、このような方法は、ピアソン相関r(g,c)、又は標準化されたべクトル（ここで、ベクトルg^*及びc^*は、平均0及び標準偏差1を有するように標準化されている）間のユークリッド距離d(g^*,c^*)を含む。
【００７５】
好ましい実施態様では、相関関係は、予測としてエピトープを用いて、「シグナル対ノイズ」比を強調する相関関係の指標を用いて評価される。本実施態様では、（μ₁(g),σ₁(g)）及び（μ₂(g),σ₂(g)）は、各々、クラス１及びクラス２における試料についてのエピトープの自己抗体結合活性gのlog10の平均及び標準偏差を称する。P(g,c) = (μ₁(g)-μ₂(g))/(σ₁(g)+σ₂(g))は、クラス内の標準偏差に対するクラス間の差を反映する。|P(g,c)|の大きな値は、自己抗体結合活性とクラス分けとの強い相関関係を示すが、|P(g,c)|の小さな値は、自己抗体結合活性とクラス分けとの弱い相関関係を示す。正又は負であるP(g,c)の符号は、各々、クラス１又はクラス２において、より大きな自己抗体結合活性を有するgに相当する。P(g,c)は、標準的なピアソン相関係数とは異なり、[-1,+1]の範囲に制限されない、ことに留意されたい。N₁(c,r)が、P(g,c)> = rのような遺伝子集合を意味し、N₂(c,r)が、P(g,c)<=rのような一組のエピトープを意味する場合には、N₁(c,r)及びN₂(c,r)は、クラス１及びクラス２の周囲の半径rの近接性である。近接性内の並はずれた多数のエピトープは、多くのエピトープが、クラスベクトルに密接に相関する自己抗体結合活性パターンを有する、ことを示す。
【００７６】
観察された相関関係が期せずして予想されるよりも強いか否かの評価は、最も好ましくは、「隣接性分析」を用いて実行される。本方法では、１つのクラスにおいて一様に高く、他のクラスに一様に低い、自己抗体結合活性相当する理想化されたパターンが定義され、当該方法は、等価なランダムパターンよりもむしろ理想化されたパターンの「近接の」又は「近接性にある」、すなわちこのパターンにより類似している、著しく高い密度の自己抗体結合活性が存在するか否かを試験する。近接性自己抗体結合活性の密度が予想されるよりも統計的に有意に高いか否かの決定は、統計的に有意な差を決定する公知の方法を用いて実行することができる。１つの好ましい方法は、近接性（近接）の自己抗体結合活性の数を、座標cを並べ替えることにより得られる、ランダムクラス分けに対応する理想化されたパターンの周囲の類似の近接性における自己抗体結合活性の数と比較する、並べ替え検定である。
【００７７】
評価された試料は、エピトープ-結合自己抗体を含むことができる任意の試料でよい。好ましい試料は、個体からの血清試料である。滑液又は脳脊髄液の試料も好ましい。本明細書に記載の方法を用いて、多数のエピトープの自己抗体結合活性は、同時に測定することができる。多数の自己抗体結合活性（自己抗体プロファイリング）の評価は、試料を分類するのに役立ち得るより高い自己抗体結合活性が存在するので、試料のより正確な評価を提供する。
【００７８】
自己抗体結合活性は、例えば、試料を好適なエピトープマイクロアレイと接触させ、そしてマイクロアレイ上のエピトープに対する試料中の自己抗体の結合度を決定することにより得られる。試料の自己抗体結合活性が得られると、その活性は、モデルと比較されるか又は評価され、次いで、試料は分類される。試料の評価は、試料が試験される特定のクラスに属するべきか否かを決定する。
【００７９】
測定又は評価される自己抗体結合活性は、自己抗体結合活性レベルを測定することができる装置から得られた多数の値である。自己抗体結合活性値は、本明細書に記載されている、所与のエピトープについて検出された自己抗体結合の量を意味する。当該値は、装置からの生の値、又は、場合により、設計し直され、フィルタされ及び/又は標準化される値である。かかるデータは、例えば、蛍光分析-系又は比色分析の自己抗体検出法を用いて、エピトープマイクロアレイプラットフォームから得られる。
【００８０】
データは、場合により、以下：設計し直されたデータ、フィルタされたデータ及び標準化されたデータの組合せを用いて、作成することができる。自己抗体結合活性値は、実験又は条件の変数を説明するために、又はアレイ密度全体における些細な差を調整するために、設計し直すことができる。このような変数は、検索者が選択する実験的デザインに依拠する。データの作製は、時には、自己抗体結合活性値を集合化に供する前の値をフィルタし及び/又は標準化することも含む。
【００８１】
自己抗体結合活性値のフィルタリングは、自己抗体結合活性が、試料に何の変化も示さないか又は取るに足らない変化を示す、任意のベクトルを削除することを含む。エピトープの自己抗体結合活性がフィルタされると、残っているエピトープ/自己抗体結合活性の亜集団は、本明細書では「ワーキングベクトル」と称される。
【００８２】
本発明は、自己抗体結合活性値のレベルを標準化することを含むこともできる。自己抗体結合活性値の標準化は、必ずしも必要ではなく、自己抗体結合活性とクラス分けとの相関関係を決定するために使用される形式又はアルゴリズムに依拠する。自己抗体結合活性の絶対レベルは、自己抗体結合活性が特定のクラスについて有する相関度ほど、重要ではない。標準化は、下記式：
【００８３】
【数６】

【００８４】
[式中、
NWは、標準値であり；
ABVは、試料の自己抗体結合活性値であり；
AABVは、試料の平均自己抗体結合活性値であり；及び
SDVは、自己抗体結合活性値の標準偏差である。]
を用いて起こる。
【００８５】
自己抗体結合活性値が作成されると、データは分類され、又は分類のモデルを構築するために使用される。分類に関連するエピトープが先ず決定される。用語「関連するエピトープ」は、自己抗体結合活性がクラス分けと相関するそのエピトープを称する。分類と関連するエピトープも、本明細書では、「有用なエピトープ」と称される。自己抗体結合活性とクラス分けとの相関関係は、様々な方法を用いて決定することができる；例えば、近接性分析が使用できる。近接性分析は、並べ替え検定を行い、そしてランダムクラス分けの近接性と比較して、クラス分けの近接性の遺伝子数の見込みを決定することを含む。近接性のサイズ又は半径は、距離メートルを用いて決定される。例えば、近接性分析は、ピアソン係数、ユークリッド係数、又はシグナル対ノイズ係数を採用することができる。関連するエピトープは、例えば、１つのクラスでは一様に高く、他のクラス（複数）では一様に低い自己抗体結合活性に相当する、理想化された自己抗体結合活性パターンを定義する、近接性分析を用いることにより決定される。１つのクラスにおける自己抗体結合活性のレベルを他のクラスと比較すると、自己抗体結合活性の相違が存在する。かかるエピトープは、その自己抗体結合活性に基づいて、試料を評価し、分類するための優れた表示である。１つの実施態様では、近接性分析は、下記式：
【００８６】
【数７】

【００８７】
[式中、
gは、所与のエピトープの自己抗体結合活性値であり；
cは、クラス分けであり；
μ₁(g)は、第一クラスについてgの自己抗体結合活性の平均であり；
μ₂(g)は、第二クラスについてgの自己抗体結合活性の平均であり；
σ₁(g)は、第一クラスについてgの標準偏差であり；及び
σ₂(g)は、第二クラスについての標準偏差である。]
のシグナル対ノイズルーチンを利用する。本発明は、２つのクラスのうちの１つに試料を分類し、又は多数（複数）のクラスのうちの１つに試料を分類することを含む。
【００８８】
特に関連するエピトープは、試料を分類するために最も好適であるエピトープである。関連するエピトープを決定するステップは、クラスの出現に潜在的に関連する免疫原性タンパク質、例えば、病原に関連するタンパク質を特定するために使用することができる抗体を単離する手段も提供する。従って、本発明の方法は、エピトープ結合自己抗体に特異的に結合し、試験されるクラス（例えば、疾患）及び本方法により決定される薬物そのものに関連する、免疫原性タンパク質に基づいて、薬物標的（複数）を決定することにも関する。
【００８９】
エピトープを分類するための次のステップは、試験されるべき試料を分類するために使用することができるモデル又は予測を作製し又は構築することを含む。本明細書で「最初のデータセット」と称される、分類が既に確認されている試料を用いてモデルを構築する。モデルが構築されると、試験されるべき試料は、そのモデルについて評価される（例えば、モデルの自己抗体結合活性に関して、試料の相対的自己抗体結合活性の関数として分類される）。
【００９０】
上記で決定された、関連するエピトープの一部は、モデルを構築するために選択することができる。エピトープのすべてを使用する必要はない。モデルを構築するために使用される関連するエピトープの数は、当業者により決定することができる。例えば、クラス分けに対して自己抗体結合活性の高い相関関係を証明する1000エピトープのうちで、これらのエピトープの25、50、75又は100以上がモデルを構築するために使用できる。
【００９１】
モデル又は予測は、「重み付き多数決方式」又は「重み付き多数決ルーチン」を用いて構築される。重み付き多数決方式は、これらの有用なエピトープに、クラスの１つについての重み付き多数決を投じさせる（cast）。多数決の大きさは、自己抗体結合活性レベル、及び自己抗体結合活性とクラス分けとの相関度の両方に依拠する。１つのクラスからの自己抗体結合活性と次のクラスからの自己抗体結合活性との相違又は差が大きくなればなるほど、エピトープが投じる（cast）多数決は大きくなる。より大きな差を有するエピトープは、クラス分けのより優れた表示であり、そのため、より大きな多数決を投じる。
【００９２】
モデルは、下記式：
【００９３】
【数８】

【００９４】
[式中、
V_gは、エピトープgの重み付き多数決であり；
A_gは、エピトープの自己抗体結合活性とクラス分けとの相関関係であり、本明細書でP(g,c)と定義される；
b_g = (μ₁(g)+μ₂(g))/2、これは、第一クラス及び第二クラスにおける平均log10自己抗体結合活性値であり；及び
x_gは、試験される試料におけるlog10自己抗体結合活性値である。]
の重み付き多数決ルーチンに従って構築される。正の重み付き多数決は、第一クラスにおける新規な試料の構成員についての多数決であり、負の重み付き多数決は、第二クラスにおける新規な試料の構成員についての多数決である。第一クラス用の総多数決V₁は、有用なエピトープを超える正の多数決の絶対値を合計することにより得られるが、第二クラス用の総多数決V₂は、負の多数決の絶対値を合計することにより得られる。
【００９５】
モデルが試験される試料を分類する信頼度を決定するために、予測強度も測定することができる。予測強度は、試料の分類の信頼度を伝え、試料が分類できないときに評価する。試料が試験される例も存在するが、特定のクラスに属さない。このことは、所定の閾値未満を記録する試料が分類できる試料でない（例えば、「ノーコール」）、という閾値を利用することによりなされる。例えば、試料が２つの肺癌クラスのうちの１つに属するか否かを決定するために、モデルが構築されるが、肺癌を有さない個体から試料が採取される場合には、試料は、「ノーコール」ということになり、分類できないだろう。予測強度閾値は、偽陽性分類の値対「ノーコール」を含むがこれに限定されない、公知の因子に基づいて当業者により決定することができる。
【００９６】
モデルが構築されると、モデルの有効性は、当該分野で公知の方法を用いて試験することができる。モデルの有効性を試験するための１つの方法は、データセットの相互検証による。相互検証を実行するために、上記のように、試料の１つが削除され、削除された試料なしで、モデルが構築され、「相互検証モデル」を形成する。次いで、削除された試料は、本明細書に記載の、モデルに従って分類される。このプロセスは、最初のデータセットの試料全てについて行われ、エラー率が決定される。次いで、モデルの正確度が評価される。このモデルは、公知のクラスについて高い正確性で試験される試料を分類するはずであり、又はクラスは、予め確認されているかもしくはクラス発見により構築されている。モデルを確認する別の方法は、独立したデータセットにモデルを適用することである。公知の又はこれから開発される、他の標準的な生物的又は医学的研究方法は、クラス発見又はクラス予測を確認するために使用することができる。
【００９７】
本発明はまた、特定のクラス分けのために有用な、有用なエピトープの数を増加させる方法を提供する。本方法は、エピトープの自己抗体結合活性とクラス分けとの相関関係を決定し、エピトープが有用なエピトープであるかどうかを決定することを含む。１つの実施態様では、本方法は、シグナル対ノイズルーチンの使用を含む。エピトープが有用であると決定される場合、すなわち有意な予測を有する場合には、当該エピトープは、他の有用なエピトープと組み合わせることができ、クラス予測のために本明細書に記載されている重み付け多数決方式に従って使用することができる。
【００９８】
本発明はまた、エピトープが特定の生物的クラス分けに有用であるか否かを決定するための代替的手段を提供する。例えば、１つの実施態様では、第一クラスの試料についての２以上のエピトープの平均抗体結合活性（±SEM）を、第二クラスの試料についての２以上のエピトープの平均抗体結合活性（±SEM）と比較し、有用なエピトープを特定するために両側スチューデントt-検定を行う。
【００９９】
本発明の局面はまた、これまで知られていないクラスを確認し又は発見すること、あるいはこれまで仮定されていたクラスを確認する（validate）ことを含む。このプロセスは、本明細書では、「クラス発見」と称する。本発明のこの実施態様は、これまで知られていないクラス（複数）を決定すること、及びクラス決定を確認する（例えば、クラス決定が正確であることを検証することを含む。
【０１００】
これまで知られていない又は認識されてないクラスを確認するために、あるいは他の発見に基づいて提案されているクラスを確認する（validate）ために、自己抗体結合活性に基づいて試料をグループ化し又は集団化する。ある試料の自己抗体結合活性パターン（すなわち、aABプロファイル）と、類似の自己抗体結合活性パターンを有する試料の自己抗体結合活性パターンとを、グループ化し又は一緒に集団化する。試料の群又は集団は、クラスを特定する。このクラスタリング法は、自己抗体結合活性パターンに基づいてクラスが異なる任意のクラスを特定するために適用することができる。
【０１０１】
これまで知られていなかったクラスの決定は、クラスタリングルーチンを用いて本発明の方法により行われる。本発明は、これまで知られていないクラスを確認するための数種類のクラスタリングルーチン、例えば、Bayesianクラスタリング、k-手段クラスタリング、階層的クラスタリング及び自己組織化マップ（SOM）クラスタリングを利用することができる。
【０１０２】
自己抗体結合活性値が作製されると、データは集団化されるか又はグループ化される。本発明の１つの特定の局面は、自己抗体結合活性パターンを集団化するための、SOM、競争的学習ルーチンを利用して、クラスを確認する。SOMは、「関連」集団又はクラスを定義する傾向がある近接性ノードにより、データに構造を強いる。
【０１０３】
SOMは、「ノード」の幾何学を先ず選択することにより構築される。好ましくは、２次元グリッド（例えば、３x２グリッド）が使用されるが、他の幾何学も使用できる。ノードは、k-次元空間に先ずランダムにマップされ、次いで対話形式で調整される。各反復は、ベクトルをランダムに選択し、当該ベクトルの方向にノードを移動することを含む。最接近ノードが最も移動し、一方、他のノードは、初期幾何学における最接近ノードからの距離に依拠して少し、移動する。この形式において、最初の幾何学における近接点は、k-次元空間の接近点にマップされる傾向がある。プロセスは、いくつも（例えば、20,000〜50,000）の反復を続ける。
【０１０４】
SOMにおけるノード数は、データに従って変化し得る。例えば、ユーザーは、より多くの集団を得るためにノード数を増加させることができる。集団の適切な数は、試料の特定の集団のより良くかつより区別可能な表示を可能にする。グリッドサイズは、ノード数に対応する。例えば、３x２グリッドは６ノードを含み。４x５は20ノードを含む。SOMアルゴリズムが自己抗体結合活性データに基づいて試料に適用されるので、ノードは、いくつもの反復において試料集団に向かって移動する。ノード数は、集団数に直接関連する。そのため、ノード数の増加は、集団数の増加を生じる。わずかな数のノードは、区別可能なパターンを作成できない。追加の集団は、自己抗体結合活性の区別可能な、堅固な集団を生じる。この点を超える更に多くの集団の追加は、基本的に新しいパターンを生じない。例えば、３x２、４x５及び/又は６x７グリッドを選択し、最も好適なグリッドサイズを決定するためのアウトプットを試験することができる。
【０１０５】
自己抗体結合活性ベクトルに従う試料を集団化することができる様々なSOMアルゴリズムが存在する。本発明は、任意のSOMルーチン（例えば、自己抗体結合活性パターンを集団化する競争的学習ルーチン）を利用し、好ましくは、以下：
【０１０６】
【数９】

【０１０７】
[式中、
i = 繰り返し数；
N = 自己組織化マップのノード；
τ = 学習速度；
P = 対象ワーキングベクトル；
d= 距離；
Np = Pに最も近くマッピングされるノード；及び
f_i(N)はiでのNの位置である。]
のSOMルーチンを使用する。
【０１０８】
試料がクラスタリングルーチンを用いてクラスにグループ化されると、推定上のクラスが確認される。試料の分類ステップ（例えば、クラス予測）は、クラスを検証するために使用することができる。本明細書に記載されている、重み付き多数決方式に基づくモデルは、クラス発見が行われる同一の試料からの自己抗体結合活性データを用いて構築される。クラスが好適に決定され又は確認されているときには、かかるモデルは、（例えば、相互検証により及び別個の試料を分類することにより）うまく機能するだろう。新しく発見されたクラスが好適に決定されていない場合には、モデルはうまく機能しないだろう（例えば、ほとんどのクラスにより予測されるよりもうまくは機能しないだろう）。選ばれたクラス発見法によって発見されたクラスのペアのすべてを比較することができる。各ペア、C1、C2について、Sは、C1又はC2のいずれかの試料集合である。クラス構成員（C1又はC2のいずれか）は、本明細書に記の相互検証法により、Sにおける各試料について予測される。クラス分けをどのくらい予測できるかの指標である、平均PS（|S|予測における）は、所与のデータから得られる。低平均PS値（例えば、0.3近く）は、見せ掛けのクラス分け、又は真の区別を支持する不十分なデータ量のいずれかを示す。高平均PS値（例えば、0.8）は、強く、予測可能なクラス分けを示す。
【０１０９】
上記のクラス発見法は、任意の疾患、例えば癌、の基本的なサブタイプを特定するために使用することができる。クラス発見法は、癌の区別可能なタイプに影響を及ぼす基本的免疫機構を研究するために使用することもできる。例えば、様々な癌（例えば、乳癌及び前立腺癌）を単一データセットに合体させ、エピトープ結合活性に基づく試料を集団化することができる。更に、好ましい実施態様では、本明細書に記載のクラス予測は、本明細書に記載の好適なエピトープマイクロアレイと共に、臨床的状況に適合される。
【０１１０】
試料の分類は、多数のエピトープの自己抗体結合活性の分析又は評価に基づいて、試料が属する分類についての医療サービス提供者情報を付与する。この方法は、典型的な試験について行われる１又は２のマーカーを分析することとは対照的に、多数の自己抗体結合活性又はマーカーが分析されるため、典型的な試験よりもより正確な評価を提供する。
本発明により提供される情報は、単独で又は他の試験結果と組み合わせて、個体の診断における医療サービス提供者を助ける。
【０１１１】
また、本発明は、治療計画を決定するための方法を提供する。医療提供者が、その試料及び個体がいずれの疾患に属するかを分かると、医療提供者は、個体の十分な治療計画を決定することができる。様々な疾患クラスは、通常、異なった治療を必要とする。個体の疾患クラスを正確に診断し及び理解することは、より良い、より成功的な治療及び診断を可能にする。
【０１１２】
本発明の他の適用は、特定の薬物又はレジメでの成功的治療を有するらしいクラスを確認し、特定の薬物又はレジメでの成功的治療を有するらしい人を分類することを含む。薬物の効力を決定することに興味を有する人は、本発明の方法を利用することができる。試験される薬物又は治療の試験中に、疾患を有する個体は、薬物又は治療にうまく反応することがあり、中には反応しない個体もある。試料は、試験される薬物に供される個体、及び治療に所定の反応を有する個体から得られる。モデルは、本明細書に記載の重み付き多数決方式を用いて、関連するエピトープの一部分から構築することができる。次いで、試験される試料はモデルに対して評価し、治療が成功的であるか又は失敗であるかに基づいて分類することができる。薬物を試験する会社は、薬物が最も有用である個体のクラスに関するより正確な情報を提供することができる。この情報はまた、個体の最善の治療計画を決定する点で、医療サービス提供者を補助する。
【０１１３】
本発明の別の適用は、特定の疾患又は症状が個体に現れる可能性を決定するための、個体からの試料の分類である。例えば、心臓病又は高血圧に罹患する可能性の高い人は、これらの疾患にほとんど罹患しそうにない人とは異なった自己抗体結合活性プロファイルを有し得る。本明細書に記載の方法を用いて、モデルは、重み付き多数決方式を用いて、心臓病又は高血圧を有する個体、及び有さない個体から構築することができる。モデルが構築されると、個体由来の試料を試験し、試料がいずれかのクラスに属するかを決定するために当該モデルについて評価することができる。疾患を有する個体のクラスに属する個体は、予防的手段（例えば、運動、アスピリン等）を講じることができる。心臓病及び高血圧は、分類することができる疾患の例であるが、本発明は、癌の素因を含む、実質的に任意の疾患の試料を分類するために使用することができる。
【０１１４】
疾患の素因を特定し及び予測するための好ましい実施態様は、特定の疾患症状を有さないがそのリスクが高い個体からの試料を用いて、本明細書に記載の方法を用いて重み付き多数決方式を構築することを含む。かかる個体の例は、肺癌を示さない長期間、高頻度での喫煙者、又は家系が家族に特有の疾患の発症を予測するような家族であるが、この疾患を示したことがない個体であろう。モデルが構築されると、個体由来の試料を試験し、試料がいずれのクラスに属するかを決定するために、モデルについて評価することができる。疾患に罹患しやすい個体のクラスに属する個体は、予防的手段（例えば、運動、アスピリン、喫煙の中止等）を講じることができる。
【０１１５】
より一般的には、クラス予測は、様々な設定において有用であることがある。第一に、クラス予測は、腫瘍細胞の起源、段階又は等級を反映する、公知の病原分類のため構築することができる。かかる予測は、診断的確認を提供し、又は異常なケースを明確にすることができる。第二に、クラス予測の技術は、将来の臨床的結果、例えば薬物反応又は生存、に関連する区別に適用することができる。
【０１１６】
エピトープマイクロアレイ
１つの局面では、本発明は、アレイに固定された自己抗体-結合ペプチド（エピトープ）の位置的にアドレス可能なアレイである、エピトープマイクロアレイを提供する。当該アレイは、２〜無数のエピトープ、より好ましくは10〜1,500、より好ましくは20〜1000、より好ましくは50〜500エピトープを含む。使用されるエピトープは、他の長さのエピトープも使用できるが、好ましくは、約３〜約20、より好ましくは約15アミノ酸長である。結合剤、好ましくは、試料中に存在する自己抗体に特異的に結合する第二抗体は、アレイのエピトープに特異的に結合された自己抗体の存在を検出するために使用される。検出剤は、好ましくは、エピトープアレイでインキュベーションする前に、検出可能な標識で標識される（例えば、³²P、比色分析用インジケーター又は蛍光標識）。
【０１１７】
自己抗体検出及びエピトープマイクロアレイのために使用されるエピトープの選択は、所望のクラス分けに依拠することがある。代替的には、ランダムペプチド集団を使用することができ、当該集団内の有用なエピトープは、本明細書に開示されている方法を用いて特定することができる。
【０１１８】
好ましい実施態様では、本発明は、癌の診断に有用なエピトープマイクロアレイを提供し、かかるマイクロアレイ上に存在するペプチドは、以下のスキームに基づいて設計された集団から選択される。当該集団のエピトープの第一グループは、胎児性組織中に現れ、そして成人組織中での異常な発現が体液性免疫反応を誘発することができる、タンパク質に相当する。これらは、胎児性発達において活性である転写因子（TF）を含み、また免疫反応を誘起し、同時に腫瘍細胞中に発現する。例えば、SOX-ファミリー転写因子のメンバーに対するaAbは、小細胞肺癌（SLCL）患者の血清中で特定されている（Gure et al.、前掲)。SOX-ファミリーTFのメンバーは、発達中の神経系において一般的に発現され、その発現は、通常の肺上皮組織中では報告されていない (Gure et al.、前掲)。更に、胎児性神経系において役割を担う基本的なヘリックス-ループ-ヘリックス（bHLH）ファミリーTFのメンバーの発現は、NSCLC及びSCLCにおいて記録されている (Chen et al., Proc Natl Acad Sci USA. (1997) 94: 5355-60)。
【０１１９】
加えて、癌診断エピトープマイクロアレイは、好ましくは、先に公表されたB-細胞エピトープ、及び主要組織適合性複合体クラスIIの様々なアイソフォームと結合すると予測されるエピトープを組み込む。公然と入手できるMHC II結合アルゴリズム、例えばProPred及びRankPeptを使用することができる。エピトープ設計における特別な注意は、自己抗体が癌に関連しているタンパク質に向けられる。これらは、p53、及びSOX、FOX、IMP、ELAV/HU及び他のファミリーの様々なメンバーを含む (Tan, J Clin Invest. (2001) 108: 1411-5)。また、好ましくは、T-免疫原性とB-免疫原性との重複が先の研究から推論され得るので、癌診断マイクロアレイ上の、T-細胞反応を引き起こすことが知られているエピトープも含まれる (Scanlan et al., Cancer Immun. (2001) 1：4; Chen et al., Proc Natl Acad Sci USA. (1998) 95: 6919-23)。公知のT-細胞エピトープの卓越した集合は、Cancer Immunityデータベースに存在する。従って、非常に好ましい癌診断エピトープマイクロアレイは、先に特定された免疫原性配列を、上記の胎児性因子エピトープ設計と組み合わせる。ペプチドを合成し、公知の方法を用いてマイクロアレイ上にプリントすることができる。例えば、Robinson et al.、前掲を参照。
【０１２０】
乳癌の診断のための好ましい有用なエピトープは、図２に開示されているものを含む。
【０１２１】
NSCLとSCLCとを識別するための好ましい有用なエピトープは、図３、７及び１３に開示されているものを含む。
【０１２２】
NSCLの診断のための好ましい有用なエピトープは、図７及び１３に開示されているものを含む。
【０１２３】
クラス分けを予測するための好ましい有用なエピトープを選択することから得られる好ましいエピトープは、図６、７、９、10、11、12及び13に開示されているものを含む。
【０１２４】
1つの局面では、本発明は、生物的試料について多数のクラス間を識別するためのエピトープマイクロアレイを提供する。ここで、当該マイクロアレイは、多数のペプチドを含み、各ペプチドは、多数の特定のクラスから選択される特定のクラスに特徴的な試料において対応するエピトープ結合活性を有し；総合すれば、多数のペプチドは、多数の特定のクラスの全てに包括的に特徴的である多数の試料において対応するエピトープ結合活性を有し；各ペプチドの自己抗体結合活性は、独立して、多数の特定のクラスのうちのもう１つに特徴的な試料よりも、多数の特定のクラスのうちの１つに特徴的な試料において高い。
【０１２５】
好ましい実施態様では、本発明は、生物的試料について第一クラスと第二クラスとを識別するためのエピトープマイクロアレイを提供する。エピトープマイクロアレイは、多数のペプチドを含み、ここで、各ペプチドは、独立して、第一クラスに特徴的な試料において又は第二クラスに特徴的な試料において対応するエピトープ結合活性を有し；総合すれば、多数のペプチドは、第一及び第二クラスに包括的に特徴的な試料において対応するエピトープ結合活性を有し；各ペプチドの自己抗体結合活性は、独立して、他のクラスに特徴的な試料における自己抗体結合活性に比べて、第一クラス又は第二クラスのいずれかに特徴的な試料において高い。
【０１２６】
１つの実施態様では、本発明は、多数のペプチドを含むエピトープマイクロアレイを提供する。ここで、各ペプチドは、第一試料又は第二試料における対応する自己抗体結合活性を有し；各ペプチドの自己抗体結合活性は、第二試料に比べて、第一試料では高いか又は低く；第一試料及び第二試料は識別可能なクラスに対応する。
【０１２７】
好ましい実施態様では、エピトープマイクロアレイの少なくとも第一ペプチドは、第二クラスに対応する第二試料での自己抗体結合活性に比べて、第一クラスに対応する第一試料ではより高い自己抗体結合活性を有し；マイクロアレイの少なくとも第二ペプチドは、第一クラスに対応する第一試料での自己抗体結合活性に比べて、第二クラスに対応する第二試料ではより高い自己抗体結合活性を有する。
【０１２８】
任意の特定のエピトープの自己抗体結合活性が検出される頻度は低いかもしれず、特定のクラスに特徴的な試料における特定のエピトープ-結合自己抗体の可能性は低いかもしれないが、エピトープマイクロアレイ上に含まれる各ペプチドは、クラス分けと相関する自己抗体結合活性を示す。それでもなお、かかるエピトープは、本明細書に開示されているように、組み合わせて使用するときに、診断に有用である。
【０１２９】
好ましい識別可能なクラスは、非-疾患クラスと疾患クラス、より好ましくは非-癌クラスと癌クラスを含み、後者は好ましくは肺癌、乳癌、胃腸癌又は前立腺癌である。他の好ましい識別可能なクラスは、高リスククラスと非-癌クラスであり、好ましくは高リスク癌と非-癌クラスである。他の好ましい識別可能なクラスは、識別可能な癌クラス、例えば識別可能な肺癌クラス、例えばNSCLCとSCLCである。他の好ましい識別可能な癌クラスは、転移性癌クラスと非-転移性癌クラスである。
【０１３０】
好ましい実施態様では、エピトープマイクロアレイの２以上のペプチドは、単一タンパク質の識別可能な部位、好ましくは単一タンパク質の非-重複部位に対応する。
【０１３１】
本明細書に開示されている、単一タンパク質の種々の断片に対応するエピトープは、種々のクラスからの試料間のその結合活性において、相容れない差異を示すことがある。理論に拘束されるものではないが、同一のタンパク質に対応するエピトープ間の自己抗体結合活性のこの不一致は、一部には、クラス分けに寄与する、タンパク質改変及び次のエピトープ改変に起因し得る。支持として、胎児性転写因子をコードするmRNAを含む非常に多くのmRNAのスプライス変異体が、様々な癌において特定されている。
【０１３２】
１つの実施態様では、アレイの１以上のペプチドは、第一クラスでは特定の遺伝子の転写に関して存在するか又は優勢であるが、第二クラスでは存在しないか又はわずかであり、代わりにスプライスされたmRNAのタンパク質産物と特異的に結合する自己抗体に指向している。
【０１３３】
本明細書に記載のエピトープマイクロアレイの少なくとも第一ペプチドは、第二クラスに相当する第二試料についての自己抗体結合活性に比べて、第一クラスに相当する第一試料について高い自己抗体結合活性を有し、エピトープマイクロアレイの少なくとも第二ペプチドは、第一クラスに相当する第一試料についての自己抗体結合活性に比べて、第二クラスに相当する第二試料について高い自己抗体結合活性を有する。従って、２つの識別可能なクラス間では、各々のクラスでより高い自己抗体結合活性が、本明細書の好ましいマイクロアレイを用いて検出できる。癌診断に関しては、好ましい癌診断マイクロアレイは、癌試料よりも非-癌試料においてより高い自己抗体結合活性を検出することができるエピトープ、及び非-癌試料よりも癌試料においてより高い自己抗体結合活性を検出することができるエピトープを含み、後者は、癌を有する個体における腫瘍-関連抗原の出現に潜在的に起因する。
【０１３４】
アレイ-結合エピトープへの自己抗体の結合、及び固定化された自己抗体への検出剤の結合が起こると、アレイは、結合パターンを検出することができるスキャナに挿入される。自己抗体結合データは、アレイに結合された検出剤の標識群から放される光として、収集することができる。アレイ上の各エピトープの位置は知られているので、特定の自己抗体結合活性が決定される。スキャナにより検出される光量は、本発明が適用し利用する生データとなる。エピトープアレイは、生の自己抗体結合活性データを得る１つの例に過ぎない。当該分野で公知の自己抗体結合活性を決定するための他の方法（例えば、ELISA、ファージディスプレイ等）、又はこれから開発される自己抗体結合活性を決定するための他の方法は、本発明を用いて使用することができる。
【０１３５】
ペプチドエピトープ及びマイクロアレイ作製
本明細書に記載のペプチドは、修飾ペプチド、例えばリン酸ペプチドを含む。ペプチドは、当業者により理解されるように、多数の起源の任意から得られる。例えば、ランダムペプチドは、当該分野で公知の発現系により作製することができる。ペプチドは、広範囲のタンパク質断片化により作製することができる。好ましくは、ペプチドは、当該分野で周知の方法に従って合成される。例えば、Methods in Enzymology, Volume 289: Solid-Phase Peptide Synthesis, J. Abelson et al., Academic Press, 第1版, November 15, 1997, ISBN 0121821900を参照。好ましい実施態様では、Perkin-Elmer Applied Biosystems 433Aペプチドシンセサイザーが、ペプチドを合成するために使用され、修飾ペプチドの合成を可能にする。
【０１３６】
エピトープマイクロアレイは、当該分野で周知の方法に従って作製することができる。例えば、Protein Microarray Technology, D. Kambhampati (著), John Wiley & Sons, March 5, 2004, ISBN 3527305971; Protein Microarrays, M. Schena, Jones & Bartlett Publishers, July, 2004, ISBN 0763731277; 及びProtein Arrays: Methods and Protocols (Methods in Molecular Biology), E. Fung, Humana Press, April 1, 2004, ISBN 158829255を参照。好ましい実施態様では、Perkin Elmer製の非接触型ピエゾ式スポッティングシステムが製造者の仕様書に従って使用される。
【０１３７】
試料起源及び取扱い
試料は、自己抗体を含む任意の試料でよい。好ましい試料は、血液、血漿、脳脊髄液及び滑液を含む。
【０１３８】
血液は、静脈穿刺により各個体から回収することができる。血清又は血漿を調製するために0.1〜0.5 mlを使用すればよい。血清は、採血直後に調製すればよい。170 x gで５分間遠心して血清を除いた後、４時間室温で試験管を静置すればよい。血清はアリコートし、-20℃で保存すればよい。血漿は、EDTA（5 mMの終濃度）を血液試料に加えることにより調製することができる。血液試料は、170 x gで５分間遠心し、上清を除き-20℃で保存すればよい。
【０１３９】
表１−有用なエピトープ1,448ペプチドエピトープ、並びに対応するタンパク質名、Genbank受入番号及びペプチド部位を開示する。これらのエピトープは、自己抗体プロファイリングのために最初の集団として使用することができる。これらの内で、1,253は、肺癌試料における自己抗体結合活性を測定するための最初の集団として使用した。実施例を参照。
【０１４０】
【表１】

【０１４１】
【表２】

【０１４２】
【表３】

【０１４３】
【表４】

【０１４４】
【表５】

【０１４５】
【表６】

【０１４６】
【表７】

【０１４７】
【表８】

【０１４８】
【表９】

【０１４９】
【表１０】

【０１５０】
【表１１】

【０１５１】
【表１２】

【０１５２】
【表１３】

【０１５３】
【表１４】

【０１５４】
【表１５】

【０１５５】
【表１６】

【０１５６】
【表１７】

【０１５７】
【表１８】

【０１５８】
【表１９】

【０１５９】
【表２０】

【０１６０】
【表２１】

【０１６１】
【表２２】

【０１６２】
【表２３】

【０１６３】
【表２４】

【０１６４】
【表２５】

【０１６５】
【表２６】

【０１６６】
【表２７】

【０１６７】
【表２８】

【０１６８】
【表２９】

【０１６９】
【表３０】

【０１７０】
【表３１】

【０１７１】
【表３２】

【０１７２】
【表３３】

【０１７３】
【表３４】

【０１７４】
表２−NSCLCとSCLCと対照とを識別するために有用であると決定された表１の1,448ペプチドエピトープの集団から、51ペプチドエピトープを開示する。実施例を参照。
【０１７５】
【表３５】

【０１７６】
【表３６】

【０１７７】
表３〜６は、NSCLC、SCLC及び対照試料における表２の51エピトープを用いて自己抗体プロファイリングの結果を開示する。実施例を参照。
【０１７８】
【表３７】

【０１７９】
【表３８】

【０１８０】
【表３９】

【０１８１】
【表４０】

【０１８２】
【表４１】

【０１８３】
【表４２】

【０１８４】
【表４３】

【０１８５】
表７は、自己抗体プロファイリングのために使用することができる、分化抗原に対応する追加のエピトープを開示する。
【０１８６】
【表４４】

【０１８７】
【表４５】

【０１８８】
表８は、自己抗体プロファイリングのために使用することができる、腫瘍において過剰発現する抗原に対応する追加のエピトープを開示する。
【０１８９】
【表４６】

【０１９０】
【表４７】

【０１９１】
表９は、自己抗体プロファイリングのために使用することができる、複数の腫瘍種において発現する抗原に対応する追加のエピトープを開示する。
【０１９２】
【表４８】

【０１９３】
【表４９】

【０１９４】
【表５０】

【０１９５】
表10は、自己抗体プロファイリングのために使用することができる、突然変異により生じる腫瘍抗原に対応する追加のエピトープを開示する。
【０１９６】
【表５１】

【０１９７】
表11は、表１の1,448ペプチドエピトープの集団のうちで、25の好ましい肺癌決定エピトープを開示する。
【０１９８】
【表５２】

【０１９９】
表12は、NSCLC対照試料における表11の25エピトープを用いる、自己抗体プロファイリングの結果を開示する。
【０２００】
【表５３】

【実施例】
【０２０１】
我々は、乳癌及び肺癌に関する予備実験を行った。我々の乳癌試験では、我々は、16人の乳癌患者及び16人の性別が合致した非-癌の対照個体において、血清aAB組成を決定した。肺癌試験は、肺癌の２つの主な種類間の相違を検出するために、NSCLC及びSCLC血清に関する比較試験として行った。これらの予備試験はいずれも。エピトープの同一集団と同時に行った。この集団は、135の異なったタンパク質を示す、428の異なったエピトープを含んだ。増加/減少（I/D）シグナル二分法に基づいて、有用なエピトープを２つの群に分類した。すなわち、我々は、乳癌について癌対非-癌の比較、及び近接性分析を用いて、肺癌についてNSCLC対SCLC比較を行った。この方法は、大規模の遺伝子-発現試験（Golub et al., Science (1999) 286: 531-7）から採用し、有用なペプチドエピトープを特定する。有用なエピトープは、患者血清の別の群と比較して、患者血清の１つの群において有意差シグナルを生じるエピトープである。
【０２０２】
乳癌：有用なエピトープ
乳癌予備試験は、増加/減少（I/D）二分法を示す27の一組の有用なエピトープを作製した（図２）。興味深いことに、減少シグナルを作製したエピトープの亜集団は、非-癌対照と比べて乳癌では、増加シグナルを作製したエピトープの亜集団よりも大きかった。有用なエピトープの両亜集団について、高度に有意なp-値は、EB対EC比較において決定した（図２）。
【０２０３】
有用な乳癌エピトープのI/D-二分法は、著しく偏っている。選別されていない有用なエピトープについて決定すると、EBは、ECよりも著しく小さかった（各々、22±0.8対30±1.3; p = 0.00000183)。よって、有用な乳癌エピトープにより証明されるように、血清aABとのin vitro免疫反応をつくるペプチドエピトープの能力は、非-癌対照と比べて乳癌では小さい（図２）。我々は、この結果を、乳癌血清が、対照血清に比べて、低い力価aAB又は低い親和性aABのいずれかを含むと、解釈している。事実、我々は、乳癌における「in vitro免疫反応」のこの「減退」は、弱まったB-細胞免疫を示すと、仮定している。それにもかかわらず、乳癌血清において顕著に増加したin vitro免疫反応をつくった有用なエピトープの亜集団を検出したので、我々は、抗-腫瘍性体液性免疫反応が乳癌において現れるとも考えている（図２）。
【０２０４】
肺癌：NSCLC対SCLC：有用なエピトープ
肺癌予備試験は、NSCLCとSCLCとの血清aAB差を特徴付ける、28の、有用なエピトープを作製した。有用な乳癌エピトープと同様に、有用な肺癌エピトープは、著しく偏ったI/D-二分法を示した（図３）。具体的には、ESは、ENよりも著しく小さかった（28.4±1.0対32.5±0.9; p = 0.006)。我々の乳癌試験及び癌生存率に関する公表されたデータを考慮すると、以下の仮説を出すことができる：乳癌及びSCLCにおける、減少した平均の有用なエピトープ強度[E]は、乳癌及びSCLC患者の免疫不全状態をその参照群に比べて示す。この弱まった免疫状態は、非-癌対照及びNSCLC患者とそれぞれ比較して、乳癌及びSCLCにおいて生存率が低いことを説明する。Mayo肺癌プロジェクトにより証明されるように、NSCLCに比べてSCLCでは、平均生存は短く、５-年生存率が低い（Marcus et al., J Natl Cancer Inst. (2000) 92: 1308-16)。更に、上の仮説の点から、妥当なことだが、非-癌個体は一般的に、癌患者よりも生活の向上の見込みを有するため、EB及びECに比べて、ESとENとの間では差が小さかった。
【０２０５】
エピトープマイクロアレイは、有用な癌エピトープ間で高いオーダーを示す：
(i) 重複した有用なエピトープ
上の２つの試験は、重複を明らかにした（図４）。我々は、乳癌及び肺癌に有用な３つのエピトープを検出した（図４）。興味深いことに、これらの重複エピトープの３つ全ては、癌生存率についての公表された知識に関して同一のI/D-二分法を示した。具体的には、ZFP-200は、非-癌対照及びNSCLCに比べて、それぞれ、乳癌及びSCLCの両方において増加したシグナルを生成した；MAGE4a/14及びSOX2/5は、非-癌対照及びNSCLCに比べて、乳癌及びSCLCにおいて減少したシグナルを生成した。
【０２０６】
(ii) 重複した有用なタンパク質
我々は、重複しなかったが同一のタンパク質を与えた、有用なエピトープも検出した（図４）。４つの非-重複エピトープ、MAGE4a、NY-ESO、SOX-1及びSOX-2は、乳癌及び肺癌の両方のための情報シグナルを生成した。公表された癌生存率データ（Marcus et al., J Natl Cancer Inst. (2000) 92: 1308-16）に関するこれらのタンパク質の４つ全てのI/D-二分法は、それら全てが、低い生存群において減少したin vitro免疫反応を示した点で、同一であった（図４）。従って、癌の種間のaAB関連性及び潜在的に共通の病原メカニズムを明らかにするための、有用なエピトープ及びタンパク質のクラスタリングは、エピトープマイクロアレイを用いて可能であるようである。
【０２０７】
エピトープ確認
我々の癌エピトープマイクロアレイについて、(1) 胎児性組織中発現される転写因子（Gure et al.、掲; Chen et al.、(1997）前掲)、(2) 癌においてB-細胞反応を引き起こすことが知られているタンパク質 (Tan、前掲、Lubin、前掲)、及び (3) 腫瘍特異的細胞溶解性T-細胞を活性化することが知られている胎児性/精巣/腫瘍特異性を有するタンパク質（Van Der Bruggen et al., Immunol Rev. (2002) 188: 51-64; Boon et al., Annu Rev Immunol. (1994) 12: 337-65）に焦点を当てた。我々の予備試験は、乳癌及び肺癌の両方について有用なエピトープが、SOX-ファミリーのメンバー（胎児性特異的転写因子)、p53、IMP及びHuD-ファミリーのメンバー（癌におけるB-細胞反応の公知のインデューサ）、並びに腫瘍/精巣/癌タンパク質、例えばMAGE及びNY-ESOファミリーのメンバーを含む点で、このアプローチは効果を生ずるように見える、ことを示している（図２〜４）。
【０２０８】
エピトープシグナル分析
有用なエピトープを決定するために近接性分析（Golub et al.、前掲）を用いた。我々は、データ分析においてシグナル頻度及び強度を含めた。ある群における特定のエピトープ当たりのシグナル強度の平均±SEMは、エピトープシグナルと称する。エピトープを評価するために、我々は、エピトープシグナルに等分散（図５）を想定する両側スチューデントt-検定を行った。両側比較において有意に異なるエピトープシグナルをつくるエピトープは全て、有用なエピトープであると考えた。図５の例は、エピトープの評価を示す。エピトープシグナルに加えて、以下の終点を計算し、データ分析で評価した：
ΣP−個々の試験対象当たりの、全ての有用なエピトープのコンポジット信号強度；
E−患者の群当たりの、平均の有用なエピトープ強度；
【０２０９】
【数１０】

【０２１０】
[式中、Nは、群の患者数を示す。]。このパラメータは、選別されていない及び選別されたデータの両方について計算する。
【０２１１】
シグナル検出及び定量化
比色分析に基づくアルカリフォスファターゼ（「AP」）及びCy3-系蛍光分析に関する我々の予備的な比較実験は、バックグラウンド比におけるシグナルが、APの代わりにCy3を使用するときにより大きなオーダーに至る、ことを示している（データ非表示）。この結果は、蛍光-系標識化が典型的な色彩-生成標識化（Boon et al.、前掲）を超える優れた動的シグナルをつくる、ことを示す先の試験と一致する。
【０２１２】
我々の現存の比色分析-系データは、99%のケースで、３の最大範囲を有する。比色分析データに基づくエピトープの重要度の過小評価及び過大評価を少なくするために、Cy3-蛍光-系実験は、近接性分析を用いて行う。多少の異なった一組の有用なエピトープが現れることがある。感度が強ければ強いほど、蛍光分析-系視覚化プラットフォームの非常に関連する利益として、アッセイ当たりに必要とされる血清量は、より少なくなると予想される；マイクロアレイ上のエピトープ密度が増加すると、重要度が増加する利益。
【０２１３】
データ標準化
図１に記載されているように、シグナル定量化及び標準化は、ヒトIgGの逐次希釈に基づく内部調整を行うことにより改善される。この内部調整は、単一濃度系シグナル定量化に比べて、個々のペプチド：aAB相互作用のうちの各１つのより正確な標準化を可能にする。結果として、個々のペプチドエピトープ/aAB-結合活性は、ヒトIgGのx-量の免疫反応性の等価物として表すことができる。この特定の標準化の特徴の導入は、異なった実験及び試験部位からのデータの適格性を改善するだろう。
【０２１４】
データ分析
t-検定において最大の分散をつくるエピトープは、最もはずれるエピトープの値を決定するために、分類される。我々の予備データは、個々のペプチド/自己抗体結合反応の全ての約1%が、ある場合には、陽性対照さえも超える非常に強いシグナルをつくる、ことを示している（データ非表示）。これらの珍しく非常に強いシグナルは、あるエピトープが、特定の高-親和性抗-腫瘍血清aABを検出する場合を表しているかもしれない。Cy3-系蛍光分析的検出は、それがエピトープマイクロアレイの大きな動的範囲を形成するので、有効である。Cy3の使用は、高力価及び高親和性抗-腫瘍血清aABを特定するエピトープを明らかにする。比色分析-及び蛍光分析-により得られたデータは分析され、相互検証される。相互検証は、p-値及び分散-系分析を含む。
【０２１５】
個々のaAB及びaABパターンの能力
使用する系は、（1）有用なエピトープの各１つの個々の診断力を決定し、及び（2）有用なエピトープの様々な組合せの診断力を確認する（aABパターン）。前者は、Golub et al.、前掲によって記載されている「重み付き多数決」の原則を用いて達成することができるが、後者は、様々なパターン認識アルゴリズムを用い、次いで得られたパターンを個別に確認することにより達成することができる。すなわち、個々のエピトープの診断力を解明するために、「重み付き多数決」のシステムが使用できる。この種のシステムでは、ある腫瘍を予測するための有用なエピトープの能力は、（1）有用なエピトープ群の診断力を変更するその能力、及び（2）盲検試験での腫瘍クラスを予測するその能力、に依拠する。具体的には、エピトープ群の診断力を変える個々のエピトープの能力が大きければ大きいほど、このエピトープは、ある腫瘍を予測することが可能になる。最大の個々の予測力を有するエピトープは、盲検試験における最も有効なマーカーでもあるだろう。癌の巨大な遺伝的複雑性及び免疫反応と抗原提示の可変性のため、様々なaABパターンの診断的有用性は、個々のエピトープの診断的有用性を超える。
【０２１６】
同一抗原に相当する異なったエピトープは、異なった診断値を有する
抗原としてのタンパク質は、免疫原性が等価でなく、抗原提示細胞及び腫瘍細胞により同等に提示されない、非常に多数のエピトープを有する。
【０２１７】
例えば、22のKIA0373エピトープのうちで、２つ（KIAA0373-1107-RKFAVIRHQQSLLYK; 及びKIAA0373-1193-MKKILAENSRKITVL）は、一致した自己抗体結合活性を示し、NSCLCに強い診断値を示す。個々のエピトープ間の診断値の同様な識別は、NISCH、SDCCAG3、ZNF292、RBPSUH及び多くの他のタンパク質について観察される。
【０２１８】
結論として、我々の分析は、同一のタンパク質抗原からの異なったエピトープが、異なったそして反対でさえある診断値を有することがある、ことを証明した。例えば、エピトープSOX3/7（ペプチド-PAMYSLLETELKNPV）を認識する抗体は存在し、NSCLCに特徴的であり、エピトープSOX3/14（ペプチド-DEAKRLRAVHMKEYP）はSCLCに特徴的である。
【０２１９】
肺癌患者の大規模自己抗体プロファイリング：自己抗体パターンの診断値
本試験は、３群の患者を有する：
１．非常な愛煙の歴史を有する健常患者（32患者）
２．非小細胞肺癌患者（36患者）
３．小細胞肺癌患者（26患者）。
【０２２０】
表１に開示されている1,448のペプチドエピトープのうちの1,253を有するペプチドエピトープアレイを用いて、全ての試験個体からの血清を分析した。
【０２２１】
Array-Pro Analyzer (Media Cybernetics)を用いてアレイ画像を分析し、画像データをGeneMaths XT (Applied Maths)を用いて分析して、癌患者に特徴的でありかつ診断ツールとして使用することができる自己抗体結合活性のパターンを得た（表３〜６）。
【０２２２】
神経回路網及びサポートベクタマシンソフトウェアを用いる分析は、自己抗体の別々の群が各患者クラスに存在することを証明した。この特定の試験個体群では、非小細胞癌患者は、83〜85%の特異性でグループ化することができるが、対照患者は、5%未満の可能性でこの群に属する（表３〜６）。
【０２２３】
肺癌患者の自己抗体プロファイリング：肺癌決定ペプチド
上記の試料を用いて、ほとんどの有用なエピトープのうちの25を含むペプチドアレイ（表11）を使用した。このアレイは、表１に開示されている1,448ペプチドエピトープのうちの1,253を有する大規模スクリーニングにおいて、非-小細胞肺癌（NSCLC）と対照試料との最善の識別をしたペプチドを含んだ。我々は、これらを、高度に正確な肺癌診断エピトープ集団として使用することができる、「肺癌決定ペプチド」と称する。我々は、パターン認識アルゴリズムとしてサポートベクタマシンを使用した。第一に、我々は、分類辞を構成するためにNSCLC試料の全てを使用し、次いでNSCLC及び対照試料にこの分類辞を適用した。NSCLC試料とNSCLC分類辞との平均類似性は、約95%であり、対照試料とNSCLC分類辞との平均類似性は、12.5%であることが判明した（表12）。
【０２２４】
自己抗体の検出：カバースリップ上でニトロセルロースパッドを用いる、ペプチドマイクロアレイプロトコール
マイクロアレイスライドは、例えばSchleicher & Schuellから商業的に入手可能である。プロトコールは以下のとおりである：
【０２２５】
１．Superblock、TBS系（pH 7.4）、(Pierce Cat番号37535)、0.05% Tween 20で、室温で１時間ブロッキングする。ウェル（16パッドスライド）当たり、100〜150 μlのブロッキング溶液を用いる。
２．TBS、pH 7.4及び0.05% Tween 20で室温で２回、各２分洗浄する。各洗浄は150 μl。
３．1：10に希釈したSuperblock及び0.05% Tween 20を含む、TBS、pH 7.4で、血清を1：15に希釈する。
４．150 μlの希釈血清でアレイを40℃で終夜インキュベートする（最少16時間）。
５．0.05% Tween 20を含むTBS、pH 7.4を用いて、室温で５回、各５分洗浄する。各洗浄は150 μl。
６．1：10に希釈したSuperblock及び0.05% Tween 20を含む、TBS、pH 7.4で1：3000に希釈した第二抗体（アルカリフォスファターゼコンジュゲート抗ヒトIgA、IgM、IgG；ChemiconAP120A、lot 23091469）で、室温で１時間インキュベートする。体積150 μl。
７．0.05% Tween 20を含むTBS、pH 7.4を用い室温で５回、各５分洗浄する。各洗浄は150 μl。
８．アルカリフォスファターゼ基質（Pierce 1-Step NBT/BCIP, 製品番号34042）を用いて自己抗体を視覚化する。反応生成物が見えるまでに15〜30分間かかるだろう。インキュベートしすぎないこと。長いインキュベーション時間はバックグラウンドを高くするだろう。
９．水で濯いで反応を停止する。
10．スライドを乾燥し、分析する。
【０２２６】
Perkin Elmerピエゾ式アレイを用いるペプチドプリントプロトコール
調製：
0.1% TweenのPBS緩衝液
HPLC用の水
50 mM NaOH
Repel-Silane ES
HPLCメタノール。
【０２２７】
方法：
任意の実行の前に、以下を行う：
１）プライムユーティリティ（Prime Utility）を用いてチップを処理する；
２）事前のNaOHクリーニングユーティリティを用いて50 mM NaOHでチップを洗浄する；
３）プライムユーティリティを用いてチップを処理する；
４）シラネート（Silanate）ユーティリティを用いてシップをシラネート化する。最初の４つのウェルは、100%HPLC用メタノールで充填し；タンパク質沈殿は、NaOH洗浄に起因して起こらない；最後の４つのウェルは、Repel-Silane ES溶液を含む；
５）プライムユーティリティを用いてチップを処理する；
６）チューニングユーティリティを用いてチップを調整する；
７）標準洗浄を行う。
【０２２８】
プロトコールの設定：
１）洗浄設定は、以下のように設定する：シリンジ洗浄体積は400 μl、ペリポンプ時間は10秒、及び超音波は「イエス」に設定する；
２）プロトコール設定は、洗浄溶液を使用する；溶液は、1% TweenのPBS溶液である；接触時間は35秒であり、フラッシュ体積は400 μlであり、吸引体積は15 μlである；
３）アレイは、16パッドファストスライド上に２点又は110スポットで、55試料をプリントする；
４）エラーの際には、無視する前に１回、再試行を行う。
【０２２９】
プリント：
１）ペプチド試料（2 mg/mlのH₂O）及び対照を96ウェルプレートに近づけ、必要に応じて線源ホルダ内に適切に置く；
２）プリント後に、スライドを全て適切に標識しなければならない。
【０２３０】
上記を繰り返して、次のプリントのために洗浄する。
【０２３１】
本明細書に引用される全ての参考文献及び特許は、参照としてその全体が本明細書に明らかに援用される。
【図面の簡単な説明】
【０２３２】
【図１Ａ】図１Ａは、エピトープマイクロアレイ設計を示す。２つのアレイは、同一の血清、及び（A）アルカリフォスファターゼ又は（B）Cy3のいずれかにコンジュゲートされた第二抗-ヒトIgによって検出されるペプチド-aAB複合体とハイブリダイズした。これらの２つの別個の検出法を用いて同様なシグナルパターンが得られた。従って、エピトープマイクロアレイは、異なった検出法と適合する。（C）データ標準化のためのIgG逐次希釈。PC−陽性対照；NC−陰性対照。
【図１Ｂ】図１Ｂは、エピトープマイクロアレイ設計を示す。２つのアレイは、同一の血清、及び（A）アルカリフォスファターゼ又は（B）Cy3のいずれかにコンジュゲートされた第二抗-ヒトIgによって検出されるペプチド-aAB複合体とハイブリダイズした。これらの２つの別個の検出法を用いて同様なシグナルパターンが得られた。従って、エピトープマイクロアレイは、異なった検出法と適合する。（C）データ標準化のためのIgG逐次希釈。PC−陽性対照；NC−陰性対照。
【図１Ｃ】図１Ｃは、エピトープマイクロアレイ設計を示す。２つのアレイは、同一の血清、及び（A）アルカリフォスファターゼ又は（B）Cy3のいずれかにコンジュゲートされた第二抗-ヒトIgによって検出されるペプチド-aAB複合体とハイブリダイズした。これらの２つの別個の検出法を用いて同様なシグナルパターンが得られた。従って、エピトープマイクロアレイは、異なった検出法と適合する。（C）データ標準化のためのIgG逐次希釈。PC−陽性対照；NC−陰性対照。
【図２Ａ】図２Ａは、乳癌の有用なエピトープの試料集団を示す。乳癌の一組の有用なエピトープは、等分散を仮定する両側t-検定を用いて決定し、I/Dシグナル二分法に基づいて２群に分類した。実施例に記載のようにEB及びECを決定した。
【図２Ｂ】図２Ｂは、乳癌の有用なエピトープの試料集団を示す。乳癌の一組の有用なエピトープは、等分散を仮定する両側t-検定を用いて決定し、I/Dシグナル二分法に基づいて２群に分類した。実施例に記載のようにEB及びECを決定した。
【図３Ａ】図３Ａは、肺癌の有用なエピトープの試料集団を示す。肺癌の一組の有用なエピトープは、スチューデントt-検定を用いて決定し、I/Dシグナル二分法に基づいて２群に分類した。実施例に記載のようにEN及びESを決定した。
【図３Ｂ】図３Ｂは、肺癌の有用なエピトープの試料集団を示す。肺癌の一組の有用なエピトープは、スチューデントt-検定を用いて決定し、I/Dシグナル二分法に基づいて２群に分類した。実施例に記載のようにEN及びESを決定した。
【図４Ａ】図４Ａは、先に公表された癌生存率データと比較した我々の結果のクラスタリングを示す（Marcus et al., J Natl Cancer Inst. 92: 1308-16 (2000) 参照）。
【図４Ｂ】図４Ｂは、先に公表された癌生存率データと比較した我々の結果のクラスタリングを示す（Marcus et al., J Natl Cancer Inst. 92: 1308-16 (2000) 参照）。
【図５Ａ】図５Ａは、エピトープ評価及びシグナル分析を示す。各患者及び対照個体におけるシグナル強度を５のスケールに示す。次いで、ペアワイズエピトープシグナル比較を、それぞれ各々のエピトープについて行う。次いで、有意差シグナル（p ≦.05）を生成するエピトープのみを用いて、２つの群間を識別するマーカー集団を構築した。それらのエピトープは全て、非-癌対照と比べて、乳癌において有意差を有するシグナルを生成したので、この図のエピトープは全て、乳癌に有用であると考えられる。
【図５Ｂ】図５Ｂは、エピトープ評価及びシグナル分析を示す。各患者及び対照個体におけるシグナル強度を５のスケールに示す。次いで、ペアワイズエピトープシグナル比較を、それぞれ各々のエピトープについて行う。次いで、有意差シグナル（p ≦.05）を生成するエピトープのみを用いて、２つの群間を識別するマーカー集団を構築した。それらのエピトープは全て、非-癌対照と比べて、乳癌において有意差を有するシグナルを生成したので、この図のエピトープは全て、乳癌に有用であると考えられる。

【特許請求の範囲】
【請求項１】
試料間のクラス分けと相関する自己抗体結合活性を有する一組の有用な（informative）エピトープを同定する方法であって、以下のステップ：
a）２以上のクラスの各々について多数の試料における多数のエピトープの自己抗体結合活性を測定し；
b）当該多数の試料におけるその自己抗体結合活性がクラス分けと相関する程度により、当該エピトープを分類し；及び
c）当該相関関係が期せずして予想されるよりも強いか否かを決定すること、
を含み、
ここで、期せずして予想されるよりも強く、クラス分けと相関する自己抗体結合活性を有するエピトープは、有用なエピトープであり、それにより一組の有用なエピトープを同定する、前記方法。
【請求項２】
試料間のクラス分けと相関する自己抗体結合活性を有する有用な一組のエピトープを同定する方法であって、以下のステップ：
a）２以上のクラスの各々についての多数の試料における多数のエピトープの自己抗体結合活性を測定し；
b）エピトープ集団を、当該多数の試料と同一のクラスの試料における自己抗体結合活性を有する多数のエピトープから同定し、ここで、当該エピトープ集合は、当該多数の試料とは異なるクラスの試料間のクラス分けと相関する自己抗体結合活性を有する；及び
c）当該相関関係が期せずして予想されるよりも強いか否かを決定すること、
を含み、
ここで、期せずして予想されるよりも強く、クラス分けに相関する自己抗体結合活性を有するエピトープ集団は、一組の有用なエピトープである、前記方法。
【請求項３】
多数のペプチドを含む、生物試料の多数のクラス間を識別するためのエピトープマイクロアレイであって、
当該ペプチドの各々は、独立に、多数の特定のクラスから選択される特定のクラスに特徴的な試料において対応するエピトープ結合活性を有し、
これらを合わせると、当該多数のペプチドは、当該多数の特定のクラスのすべてに包括的に特徴的な多数の試料において対応するエピトープ結合活性を有し、
ここで、当該ペプチドの各々の自己抗体結合活性は、独立に、当該多数の特定のクラスのもう１つに特徴的な試料よりも、当該多数の特定のクラスの１つに特徴的な試料において高い、前記マイクロアレイ。

【図１Ａ】

【図１Ｂ】

【図１Ｃ】

【図２Ａ】

【図２Ｂ】

【図３Ａ】

【図３Ｂ】

【図４Ａ】

【図４Ｂ】

【図５Ａ】

【図５Ｂ】

【公表番号】特表２００８−５３２０１４（Ｐ２００８−５３２０１４Ａ）
【公表日】平成２０年８月１４日（２００８．８．１４）
【国際特許分類】

【出願番号】特願２００７−５５７１５９（Ｐ２００７−５５７１５９）
【出願日】平成１８年２月２４日（２００６．２．２４）
【国際出願番号】ＰＣＴ／ＵＳ２００６／００６４３１
【国際公開番号】ＷＯ２００６／０９１７３４
【国際公開日】平成１８年８月３１日（２００６．８．３１）
【出願人】（５０７２８２１４１）セマインズ，インコーポレイティド (1)
【Ｆターム（参考）】

ペプチド又は蛋白質 (143,989)

[ Back to top ]

生物試料を分類するための組成物及び方法

メニュー

スポンサーリンク

次の公報 »

« 前の公報

生物試料を分類するための組成物及び方法

メニュー

スポンサー リンク

次の公報 »

« 前の公報

スポンサーリンク