説明

自己免疫疾患の検出方法

本発明は診断分野、特に慢性関節リウマチなどの自己免疫疾患の検出に関する。より詳細には、本発明は、慢性関節リウマチまたはその疾病素質の存在または不存在を検出するための方法、免疫系に関連した標的遺伝子の発現データを用いて対象者における慢性関節リウマチのモニタリングを行うための方法、並びにバイオインフォマティックスのための手段を提供する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は診断分野、特に関節リウマチなどの自己免疫疾患の検出に関する。より詳細には、本発明は、関節リウマチまたはその疾病素質の存在または不存在を検出するための方法、あるいは免疫系に関連した標的遺伝子の発現データを用いて対象者における関節リウマチのモニタリングを行うための方法を提供する。
【背景技術】
【0002】
自己免疫疾患と潜在的に関連する多くの遺伝子が既知であり、最近では、こういった標的遺伝子の発現プロファイルを、患者における種々の自己免疫疾患またはその疾病素質の存在を評価するために用いることが提案されている(例えば、WO 2004/056866およびUS 2005/0048574を参照)。
【0003】
関節リウマチは、多種の臓器および組織を冒す自己免疫疾患であるが、主に滑膜性関節の炎症によって特徴付けられている。滑膜性関節の炎症は、痛みを伴う症状をもたらし、しばしば、重度の身体障害に至る。人口の約1%が関節リウマチを患っており、女性の患者数は男性の約3倍である。疾病の初期段階で治療を開始することによって最も高い効果が得られることから、関節リウマチの早期および迅速な診断は患者にとって非常に有益である。更に、最も効果的な治療は積極的且つ高価であるため、患者は正しく診断され、必要な場合にのみ治療を受けるべきである。
【0004】
関節リウマチは、以下の理由により、初期段階の診断が困難である。第1に、この疾患のための単一の試験は存在しない。痛み、こわばりおよび関節機能、更にこれらの経時変化に関する患者からの説明が、医師による疾患の初期判断に重要である。患者の身体検査、レントゲン、およびリウマチ因子、白血球数、赤血球沈降速度およびc反応性タンパク質などに関する臨床試験は、起こりうる関節炎に関する情報を提供する。しかし、現在使用されている上記臨床的変数の予測精度を上回ったり、予測精度を向上させたりすることのできるバイオマーカーは未だ見出されていない。
【0005】
複雑なシステム生物学を説明するためのバイオインフォマティックスの手段は、診断手段の探索において成功を収めている。線形回帰分析、人工ニューラルネットワーク(ANN)および非線形パターン認識技術は、医療分野の意思決定において急速に認知度を高めている。ANNは、例えば、以下の態様において成功を収めている: 末端肝疾患に対する成果の予測(Cucchetti, Vivarelli et al. 2007)、急性心筋梗塞の診断(Heden, Ohlin et al. 1997)、結腸腫瘍の診断(Selaru, Xu et al. 2002)、ならびに乳癌の解析(Papadopoulos, Fotiadis et al. 2005)および治療(Eden, Ritz et al. 2004)。ANNは、急性すい臓炎やすい臓癌の予測にも使用されている(Bartosch-Harlid, Andersson et al. 2008に総説有)。本研究は、非関節リウマチ(非RA)患者から、関節リウマチ(RA)患者を臨床的に区別するための方法を探索することを目的とした。本発明の方法は、全血試料由来の免疫関連遺伝子に関する定量RT−PCRデータを使用する。このデータを、ANN、線形回帰、線形判別、k近傍分類(KNN)および決定木といった予測法の組み合わせによって解析する。これら働きの異なる手段の使用は、RAおよび非RAを同定するためのより確固とした予測結果をもたらすため有利である。
【0006】
US 2005/0003394は、血液試料から関節リウマチ関連遺伝子の転写産物が検出可能であると開示している。関節リウマチに関連した遺伝子群またはそれらに対応するマイクロアレイが、例えば、以下の特許文献に開示されている:US 2008/0108077、US 2006/0127963、US 2005/0048574、US 2007/0196835、US 2008/0113346、US 2003/0154032、US 2007/0298518およびWO 2007/137405。しかしながら、関節リウマチ患者の迅速且つ正確な診断を可能にする新規方法を求める継続的な需要が存在する。本発明は、関節リウマチまたはその発症傾向があると疑われる患者に由来する全血試料から効率よく関節リウマチを判断するための、免疫系に関連した臨床マーカーのパターンおよびバイオインフォマティックスのための手段を提供する。
【発明を実施するための形態】
【0007】
発明の詳細な説明
本発明は、対象者における自己免疫疾患の存在または不存在の検出に関する。本発明の関連する自己免疫疾患としては、関節リウマチおよび強直性脊椎炎などのリウマチ様疾患、ならびに炎症性腸疾患が挙げられる。特に本発明は、関節リウマチの存在または不存在の検出方法を提供する。別の態様においては、本発明の方法を関節リウマチの疾病素質の評価に使用することも可能であり、その結果、関節リウマチの発症傾向がある対象者を検出することが可能となる。更に別の態様においては、患者における関節リウマチの進行をモニタリングするために本発明の方法を使用することも可能であり、その結果、例えば、医師による処方薬の効果の追跡が可能となる。
【0008】
更に詳細には、本発明の方法は以下の工程a)〜c)を包含する。
a)患者から採取した全血試料から総RNAまたはmRNAを単離し、
b)工程a)で単離した総RNAまたはmRNAについて、少なくともその一部がC3遺伝子、CR1遺伝子、CD25遺伝子、Foxp3遺伝子、ガレクチン−9遺伝子、GATA−3遺伝子、GITR遺伝子、ICOS遺伝子、IFN−γ遺伝子、IL−2遺伝子、IL−4R遺伝子、IL−12Rb12遺伝子、INOS遺伝子、TBET遺伝子およびTIM−3遺伝子からなる群より選ばれた遺伝子である標的遺伝子群のそれぞれの遺伝子に対応するmRNA産物を定量し、そして
c)対象者における所望の該自己免疫疾患の存在または不存在、あるいは対象者が該自己免疫疾患を発症する傾向にあるかどうかを検出するように訓練した識別器に、工程b)で得たmRNA産物の定量データを入力するが、該識別器は、健康な対照者および該自己免疫疾患を発症している患者からなる、病態が既知の対象者群から得たデータによって訓練されており、訓練データは、工程b)で使用した標的遺伝子と実質的に同じ遺伝子のmRNA発現結果に基づくデータである。
【0009】
工程b)においてmRNA産物の量を求める際には、以下の遺伝子群a)〜f)よりなる群から選ばれる少なくとも1種を定量することが好ましい。
a)IFN−γ遺伝子とCR1遺伝子;
b)IFN−γ遺伝子、CR1遺伝子とGITR遺伝子;
c)IFN−γ遺伝子、CR1遺伝子とC3遺伝子;
d)IFN−γ遺伝子、CR1遺伝子、GITR遺伝子とC3遺伝子;
e)CR1遺伝子とGITR遺伝子;および
f)CR1遺伝子、GITR遺伝子とC3遺伝子。
【0010】
更に工程b)において使用する遺伝子群としては、
g)IFN−γ遺伝子、CR1遺伝子とTIM−3遺伝子;
h)IFN−γ遺伝子、C3遺伝子とTIM−3遺伝子;および
i)IFN−γ遺伝子、CR1遺伝子、C3遺伝子とTIM−3遺伝子
が挙げられ、これらは工程c)においてANNで解析することが好ましい。
【0011】
工程b)において使用する更なる遺伝子群としては、
j)IFN−γ遺伝子、Foxp3遺伝子とGITR遺伝子
が挙げられ、これらは工程c)において線形回帰または線形判別で解析することが好ましい。
【0012】
本発明で使用するマーカー遺伝子の大部分がT細胞マーカーである(表1を参照)。関節リウマチなどの自己免疫性炎症性リウマチ性疾患の免疫病因においては、CD4 T細胞が支配的な役割を担っていると考えられる証拠が存在する(総説についてはSkapenko, Lipsky et al. 2006を参照)。胸腺から発生するCD4 T細胞は、ナイーブT細胞プールに属するものである。正常な活性化によって、ナイーブT細胞は増殖し、特定のエフェクター細胞に分化する。CD4 T細胞は、Th1細胞、Th2細胞、Th17細胞またはTreg細胞に分類される、特化したエフェクター細胞に分化することができる。CD4 T細胞の各分化プログラムについて、特異的な転写因子が主要調節因子として同定されている。TBETはTh1細胞、GATA−3はTh2細胞、ROR−gamma tはTh17細胞、そしてFoxp3はTreg細胞の転写因子である。本研究においては、コピー数が低すぎて、試料の大部分において信頼性の高い検出が不可能だったROR−gamma tを除いた上記全ての転写因子について研究した。
【0013】
更に、補体カスケードの2つの遺伝子、即ち、補体成分3(C3)遺伝子および補体受容体1(CR1)遺伝子、を本研究に含めた。古典的補体経路および補体副経路の両方がRAにおいては病理学的に活性化されることを示す説得力の高い証拠が存在する(Okroj, Heinegard et al. 2007)。補体の活性化の中心を担うのはC3の開裂である。補体カスケードは速やかに活性化され、宿主にとっては潜在的に破壊的である。従って、補体の活性化を正しく制御することが炎症において本質的に重要である。CR1は、補体活性化制御因子(RCA)遺伝子クラスターに属する膜結合補体阻害因子である。
【0014】
本発明の別の態様においては、工程b)をRT−PCR、例えば、逆転写リアルタイム定量ポリメラーゼ連鎖反応(RTqPCR)で実施することが好ましい。
【0015】
しかし、RT−PCRに基づく定量的遺伝子発現研究の重要な課題は、十分な量の使用可能なメッセンジャーリボ核酸(mRNA)を抽出すること、そしてその分解を防止し、転写産物の正確な数を計算するための解析を可能にすることである。試料の採取、輸送、処理および保存の各工程が、mRNAの著しい分解に繋がることがある(Hartel, Bein et al. 2001)。臨床試料中のmRNAが易変性なので、逆転写リアルタイム定量ポリメラーゼ連鎖反応(RTqPCR)およびマイクロアレイ解析などのダウンストリームアプリケーションによる処理を実施する前には、mRNAの完全性を調べることが必須である。いずれの技術も非常に高感度であり、細やか且つ一貫した試料処理に依存する(Lockhart and Winzeler 2000、Stordeur, Zhou et al. 2003)。転写産物存在量の正しい判断のためには、遺伝子発現の再現可能な検出を達成するために重要な、試料採取の時点ならびに保存中および輸送中のトランスクリプトームの安定化が必要である(Thach, Lin et al. 2003)。
【0016】
本発明の方法のための高品質RNAは、PAXgeneTM 血液RNAシステム(PAXgeneTM Blood RNA System)というキット(ドイツ国、QIAGEN社、PreAnalytiX製)を用いて採取することが好ましい。このキットには、安定化添加剤の入った真空血液回収チューブであるPAXgeneTM 血液RNAチューブ(PAXgeneTM Blood RNA Tube)、および複数の試料処理用試薬を含むPAXgeneTM 血液RNAキット(PAXgeneTM Blood RNA Kit)が含まれる。PAXgeneTM チューブに入った添加剤は、真空チューブ内の2.5mLの血液中のRNA分解を減少させる。更には、全血中のRNAが、室温で5日間の保存後、−20℃または−80℃で12ヶ月間の保存後、あるいは凍結融解を繰り返した後でも安定であることが示されている(Rainen, Oelmueller et al. 2002)。
【0017】
特定の遺伝子発現の量は、相対定量値に対する比較閾値サイクル(Ct)法によって解析することが可能であり、この方法の実施に際しては、遺伝子発現結果を正規化しなければならない。正規化においては、18S遺伝子(Hs99999901_s1)、ACTB遺伝子(Hs99999903_m1)、B2M遺伝子(Hs99999907_m1)、GAPDH遺伝子(Hs99999905_m1)、GUSB遺伝子(Hs99999908_m1)、HMBS遺伝子(Hs00609297_m1)、HPRT1遺伝子(Hs99999909_m1)、IPO8遺伝子(Hs00183533_m1)、PGK1遺伝子(Hs99999906_m1)、POLR2A遺伝子(Hs00172187_m1)、PPIA遺伝子(Hs99999904_m1)、RPLP0遺伝子(Hs99999902_m1)、TBP遺伝子(Hs99999910_m1)、TFRC遺伝子(Hs99999911_m1)、UBC遺伝子(Hs00824723_m1)、YWHAZ遺伝子(Hs00237047_m1)などの公知のハウスキーピング遺伝子、他の遺伝子、またはそれらの組み合わせのCT値をマーカー遺伝子のCT値から減じ、デルタCT(dCT)値を得る。次にこれらデルタCT値を統計処理に使用する。しかし、未処理の(plain)CT値、即ち、正規化度が0のCT値を、統計解析の出発材料として用いることもできる。
【0018】
本発明においては、工程c)を、得られた結果のコンピューター解析によって実施する。このようなコンピューター解析は、線形予測法または非線形予測法で実施することが好ましい。線形予測法としては、回帰分析や線形判別分析が挙げられるが、これらに限定されるものではない。また、非線形予測法としては、人工ニューラルネットワーク(ANN)が挙げられるが、これに限定されるものではない。上記およびその他の本発明において有用な統計解析方法は、例えば、以下の特許出願に記載されている: WO 01/31579、WO 02/06829、WO 02/42733、US 2004/0073376、US 2004/0137471、US 2006/0195269、US 2007/0198198およびUS 2007/0094168。
【0019】
本発明の好ましい態様においては、統計解析方法は学習相と識別相に分かれている。学習相においては、識別すべき種々のクラスに属するメンバーを含むデータセットに学習アルゴリズムを適用する。このデータセットは、例えば、関節リウマチと診断された患者から得た複数の試料に関するデータ、および健常な対照者(即ち、自己免疫疾患または他の進行性炎症性疾患に罹患していない個体)から得た複数の試料に関するデータを含むものである。データの解析に使用する方法には、人工ニューラルネットワーク、回帰、フィッシャー判別および分類・回帰木解析が含まれるが、これらに限定されるものではない。これらの方法は、例えば、上述した先行技術文献に記載されている。学習アルゴリズムは識別アルゴリズムを生成する。識別器は、未知の試料を2つのクラスのいずれかに識別することが可能なデータ成分、例えば、特定のマーカーおよびマーカーの特定の強度、通常はこれらの組み合わせに同調させる。その後、識別器を診断試験に使用する。データーにおけるこのようなパターンを解析するためのソフトウエアとしては、市販のものとフリーウエアの両方が容易に入手可能である。
【0020】
従って本発明の方法は、対象者における自己免疫疾患の存在または不存在を検出するために識別器を使用する。識別器は、mRNA発現結果に基づく遺伝子マーカープロファイルを包含する入力データを受け取った後に、対象者における自己免疫疾患の存在または不存在を示す出力データを提供することができる限り、いかなる適切なパターン認識方法(即ち、統計方法)に基づくものでもよい。識別器は、始めに、病態が既知の対象者群(即ち、健康な対照者および所望の自己免疫疾患を発症している患者からなる群)から得たmRNA発現結果に基づく訓練データによって訓練する。訓練データは、各対象者について、a)適切な生物学的試料(例えば、対象者から得た全血試料)に含まれる遺伝子産物の測定値を包含するマーカープロファイル、およびb)対象者の病態(即ち、所望の自己免疫疾患に罹患しているか、あるいは健康な対照であるか)に関する情報を包含する。その後、訓練された識別器は、別の対象者における自己免疫疾患の存在または不存在に関する指標を生成させるために使用することができるが、但し、識別器に導入する入力データが該別の対象者の適切な試料から誘導したものであり、且つ訓練相においても使用したマーカー遺伝子のmRNA発現結果を包含しなければならない。
【0021】
本発明の特定の態様においては、発現レベルの変化が関節リウマチと最も高い相関性を示す遺伝子転写産物を同定するために、以下の手法を使用した。始めに識別器を構築し、訓練するために、対照例の発現パターンおよび患者試料の発現パターンを訓練セットとして使用した。次に、最大6個の隠れ端末を有するMLP−ANN、線形判別、線形回帰、KNNおよび決定木を使用し、発現レベルが訓練セットの識別ベクトル特性と最も高い相関性を示す遺伝子を同定した。続いて、可能な全ての遺伝子の組み合わせを含む予想セットを「一つ抜き交差検定」(LOOCV)で評価することで、訓練セット内の試料の識別について最も高い精度を示す予想セットを同定した。IFN−γ遺伝子、CR1遺伝子、GITR遺伝子およびC3遺伝子は、最も精度の高い識別器において他の遺伝子よりも頻繁に存在が確認された上位の遺伝子である。更に、IFN−γ遺伝子、Foxp3遺伝子およびGITR遺伝子は、線形判別法および線形回帰法において頻繁に存在が確認された上位の遺伝子であり、IFN−γ遺伝子、CR1遺伝子、C3遺伝子およびTIM−3遺伝子は、MLP−ANNにおいて頻繁に存在が確認された上位の遺伝子である。
【0022】
一つ抜き交差検定(LOOCV)および受信者動作特性(ROC)解析によって測定したところ、本発明においてデータ解析法として最も優れていたのは線形回帰法および線形判別法であり、続いてANNであった。発現結果と関節リウマチとの相関性が確立されるのは、ROC解析によって得られる曲線下面積が少なくとも0.8、好ましくは少なくとも0.9、より好ましくは少なくとも0.91または0.92の場合である。
【0023】
本発明の特に好ましい態様は、少なくともC3遺伝子、CR1遺伝子、Foxp3遺伝子、GITR遺伝子、ICOS遺伝子、IFN−γ遺伝子、IL−2遺伝子、IL−12Rb12遺伝子およびTIM−3遺伝子を含む標的遺伝子群のそれぞれの遺伝子に対応するmRNA産物を定量し、そして得られたデータを線形予測法(回帰分析および線形判別分析を含む線形回帰モデルなど)に基づく識別器に入力することを包含する方法である。
【0024】
本願明細書に引用した出版物および特許出願について、本記載をもってそれらの内容が本願明細書に組み込まれたものとし、これは、各出版物および各特許出願について、具体的且つ個別にその内容を本願明細書に記載して組み込んだ場合と同様とみなす。次の実施例は、本発明およびその原理や利点を当業者がより深く理解するのを助けるものである。実施例は本発明を例証するためのものであり、その範囲を減縮するためのものではない。
【実施例】
【0025】
材料と方法
新たに慢性関節リウマチと診断された患者(n=36)および健康な成人(n=38)の末梢全血試料(2.5mL)を、PAXgene 血液RNAチューブ(Becton Dickinson製)に導入した。試料をゆっくりと反転させた後、室温で2時間放置し、−20℃で最大6ヶ月間保存した。
【0026】
RNA抽出に先立ち、試料を−20℃から取り出し、室温で2時間インキュベートすることで完全な融解を確実にした。総RNAは、製造者のマニュアルに従って使用するPAXgene 血液RNAシステムキット(Qiagen製)および追加のDNaseオプション(Qiagen製)を用いて抽出した。RNAの収率と純度は、NanoDrop ND-1000 分光光度計(英国、リングマー、Labtech International製)によって決定した。
【0027】
濃度10ng/μlのRNAの逆転写は、TaqMan 逆転写試薬(米国、カリフォルニア州、フォスターシティー、Applied Biosystems製)を用いて行った。
【0028】
リアルタイム定量PCRは、TaqMan ユニバーサルPCRマスターミックスのプロトコルに従い、ABI 7700 シーケンス検出システム(Sequence Detection System)(Applied Biosystems製)で行った。ヒト遺伝子用のプライマーおよびTaqMan プローブは、TaqMan 遺伝子発現アッセイの一部としてApplied Biosystemsより入手した(表2)。52μlの反応混合物を、各15μlずつ3つのPCRプレートにピペッテイングした。反応混合物は、2μlのcDNA産物(但し、INOS遺伝子とIL−2遺伝子は20μl)、26μlのTaqMan 2×ユニバーサルPCRマスターミックス、および2.6μlの20× TaqMan 遺伝子発現アッセイマスターミックスからなり、反応容積の残りは脱イオン水とした。PCRサイクルのパラメータは次のように設定した:95℃で10分、続いて95℃で15秒を40サイクル、そして60℃で1分。外因性cDNAプール標準物質をPHAで刺激したPBMCから回収し、各プレートにおいて測定するアッセイ間アッセイ用標準とした。
【0029】
特定遺伝子の発現量は、相対的定量のための比較閾値サイクル(Ct)法で解析した。発現量の正規化については、ハウスキーピング遺伝子l8Sを標的遺伝子のCT値から減じてデルタCT(dCT)値を得た。デルタCT値を統計解析に用いた。
【0030】
INOS遺伝子においては、72試料中の合計17試料が信頼できる検出限界を超えていた。検出は、3重に行ったPCRの全てにおいて得られたCT値とそのSD値が1未満の時に、信頼性があるとみなした。検出限界を超えた試料には人為的dCT値(26.5)を付与した。本研究においては、この人為的dCT値は、INOS遺伝子について得られた最も低い遺伝子コピーレベルを表している。
【0031】
データ解析
データセットは、74例の試料(患者が36例と対照が38例)から測定した、15個の遺伝子とハウスキーピング遺伝子18Sからなる。
【0032】
解析の目的は、個別の患者例または対照例にとって最適な識別器を見つけることである。種々の診断研究に個別に用いられている予測法(ニューラルネットワーク、決定木、k近傍分類、線形判別および線形回帰)のスペクトルに対して、一つ抜き交差検定スキーマを使用した。
【0033】
ANN
ANNは入力変数の組み合わせの影響を受けやすく、自動次元削減を実施することはできないことが知られているが(Haykin 1998)、例えば、決定木なら実施可能である。従って、ANNの訓練のために、32,767通りの遺伝子の全組み合わせを用いる方法を使用した。使用したANN法は、多層パーセプトロン(MLP)ニューラルネットワーク(Haykin, 1998)である。MLPにおいて重要なパラメータは、隠れ端末の数である。各遺伝子の組み合わせについて、入力遺伝子数と同じ数の隠れ端末について試験したが、但し、入力遺伝子数が6を超えた場合には、6個の隠れ端末についてのみ試験した。その結果、合計193,952個のMLPニューラルネットワークを訓練した。各ネットワークについて、入力データ(LOOCV訓練データ)の95%をMLPネットワークの訓練に使用し、5%を、過学習を防止するために、MLPの訓練を止める時期を決定する試験に使用した。MLPネットワークを訓練した後には、訓練から省いた試料にそれを適用した。MLPネットワーク用の他のパラメータについては次に説明する。tansig変換関数を使用し、出力を最も近い成績に概数した(−1は対照例を意味し、+1は患者例を意味した)。ニューラルネットワークについては、訓練データはLOOCVループ内で−1と1の間でスケーリングし(Haykin 1998)、変換パラメータは保存した。LOOCV用の試料は、保存したスケーリングパラメータを用いてスケーリングし、次に、MLPニューラルネットワークに適用した。可能な遺伝子の組み合わせの全てについて、上記パラメータを含むMLPネットワークを用いたLOOCVによって解析した。ネットワークの初期化に使用したものと同じシードを用いて、MLP識別器をMATLAB v.7.4.0.287およびニューラルネットワークツールボックス v.5.0.2に構築した(9.85337161E8)。ネットワークは、‘newff’コマンドで作製し、試験セットに使用したデータポイントの割合は5%だった。試験セットは、起こりうる過学習のモニタリングおよびそのような現象が検出された際には訓練を停止するために使用した。開始したネットワークは、コマンド‘train’で訓練した。訓練から省いた試料のクラスは、訓練したネットワークとコマンド‘sim’で決定した。
【0034】
他の識別器のパラメーターは次の通りである。
1.判別解析: MATLABコマンド‘classify’を使用した。
2.回帰分析: MATLABコマンド‘regress’を使用した(回帰式中の定数項を考慮するために、1で埋めた列を有するデータ行列を追加した)。
3.kNN: ‘相互(correlation)’距離測定および‘ボリューム(volumetric)’最終決定法によってkNN識別器を組み立てた。
4.決定木: 分類木アルゴリズムと共にMATLAB関数‘treefit’、およびジニ係数分裂判定基準を使用した。少なくとも15個の観察が分裂には必要だった。
【0035】
最適な識別器を同定するためのLOOCV推定に、ROC解析を使用した。基準は曲線下面積(AUC)だった。AUCは0から1の間であり、1は完璧な試験を表し、0.5は無意味な試験を表す。別の基準は精度、即ち、表3に示したような正しく識別された試料の数である。
【0036】
臨床的に妥当な識別器が、線形判別法および線形回帰法のみならず、人工ニューラルネットワーク(ANN)法によっても得られた。これらは、一つ抜き交差検定(LOOCV)および受信者動作特性(ROC)解析によって測定した結果である(表3)。
【0037】
線形回帰は、独立変数(X、遺伝子)と依存変数(Y、RAの存在または不存在)の間に、線形回帰式によって関係を築く(Hastie, Tibshirani et al. 2001)。数学的には、y=Xbであり、Xはn×p型の計画行列であり、但し、行は観測値に対応し、列は予測変数に対応するものであり、yは応答観測のn×1ベクトルであり、そしてbは回帰係数であり、典型的には最小二乗法解析によって推定した値である(Xの第1列は、モデルに定数項が含まれることを確実にするために、1で埋めている)。本研究において最適な線形回帰(表3)を達成するためのbベクトルを、次に列挙する。
【0038】
係数 遺伝子
0.4865 定数項
−0.1321 Foxp3
−0.2120 TIM−3
−0.1806 IFN−γ
0.1463 IL−2
0.1671 L−12Rβ2
0.0921 GITR
0.0692 ICOS
0.1521 C3
−0.2566 CR1
【0039】
線形判別分析の目的は、最適な2つの出力クラス(ここではRAと健常例)を分離することのできる変数の線形結合を見出すことにある。線形判別関数は、以下の式によって定義されている。
【0040】
【数1】

【0041】
但し、上記式中のSyの二乗は、次の式で表される、変数の統計的な推定値である。
【0042】
【数2】

【0043】
線形判別の出力は分散行列である。本願において最適な識別器は、表3に示した遺伝子によって得られたものである。
【0044】
【表1】

【0045】
表1に列挙したマーカー遺伝子の塩基配列は、公共のデータベースより入手可能である。表1には、アクセッションナンバーと共に各配列の名称を記載した。GenBankに登録されている遺伝子については、本記載をもって、本願出願日におけるそれらの配列の全てが本願明細書に組み込まれたものとする(www.ncbi.nlm.nih.gov を参照)。
【0046】
【表2】

【0047】
【表3】

【先行技術文献】
【非特許文献】
【0048】
【非特許文献1】Bartosch-Harlid, A., B. Andersson, U. Aho, J. Nilsson and R. Andersson (2008). "Artificial neural networks in pancreatic disease." Br J Surg 95(7): 817-26.
【非特許文献2】Cucchetti, A., M. Vivarelli, N. D. Heaton, S. Phillips, F. Piscaglia, L. Bolondi, G. La Barba, M. R. Foxton, M. ReIa, J. OGrady and A. D. Pinna (2007). "Artificial neural network is superior to MELD in predicting mortality of patients with end-stage liver disease." Gut 56(2): 253-8.
【非特許文献3】Eden, P., C. Ritz, C. Rose, M. Ferno and C. Peterson (2004). "‘Good Old’clinical markers have similar power in breast cancer prognosis as microarray gene expression profilers." Eur J Cancer 40(12): 1837-41.
【非特許文献4】Hartel, C, G. Bein, M. Muller-Steinhardt and H. Kluter (2001). "Ex vivo induction of cytokine mRNA expression in human blood samples." J Immunol Methods 249(1-2): 63-71.
【非特許文献5】Hastie, T., R. Tibshirani and J. Friedman (2001). The elements of statistical learning: data mining, interference, and prediction, Springer.
【非特許文献6】Haykin, S. (1998). Neural Networks: A Comprehensive Foundation, Prentice Hall.
【非特許文献7】Heden, B., H. Ohlin, R. Rittner and L. Edenbrandt (1997). "Acute myocardial infarction detected in the 12-lead ECG by artificial neural networks." Circulation 96(6): 1798-802.
【非特許文献8】Lockhart, D. J. and E. A. Winzeler (2000). "Genomics, gene expression and DNA arrays." Nature 405(6788): 827-36.
【非特許文献9】Okroj, M., D. Heinegard, R. Holmdahl and A. M. Blom (2007). "Rheumatoid arthritis and the complement system." Ann Med 39(7): 517-30.
【非特許文献10】Papadopoulos, A., D. I. Fotiadis and A. Likas (2005). "Characterization of clustered microcalcifications in digitized mammograms using neural networks and support vector machines." Artif Intell Med 34(2): 141-50.
【非特許文献11】Rainen, L., U. Oelmueller, S. Jurgensen, R. Wyrich, C. Ballas, J. Schram, C. Herdman, D. Bankaitis-Davis, N. Nicholls, D. Trollinger and V. Tryon (2002). "Stabilization of mRNA expression in whole blood samples." Clin Chem 48(11): 1883-90.
【非特許文献12】Selaru, F. M., Y. Xu, J. Yin, T. Zou, T. C. Liu, Y. Mori, J. M. Abraham, F. Sato, S. Wang, C. Twigg, A. Olaru, V. Shustova, A. Leytin, P. Hytiroglou, D. Shibata, N. Harpaz and S. J. Meltzer (2002). "Artificial neural networks distinguish among subtypes of neoplastic colorectal lesions." Gastroenterology 122(3): 606-13.
【非特許文献13】Skapenko, A., P. E. Lipsky and H. Schulze-Koops (2006). "T cell activation as starter and motor of rheumatic inflammation." Curr Top Microbiol Immunol 305: 195-211.
【非特許文献14】Stordeur, P., L. Zhou, B. ByI, F. Brohet, W. Burny, D. de Groote, T. van der Poll and M. Goldman (2003). "Immune monitoring in whole blood using real-time PCR." J Immunol Methods 276(1-2): 69-77.
【非特許文献15】Thach, D. C, B. Lin, E. Walter, R. Kruzelock, R. K. Rowley, C. Tibbetts and D. A. Stenger (2003). "Assessment of two methods for handling blood in collection tubes with RNA stabilizing agent for surveillance of gene expression profiles with high density microarrays." J Immunol Methods 283(1-2): 269-79.

【特許請求の範囲】
【請求項1】
対象者における自己免疫疾患またはその疾病素質の存在または不存在を検出するための、以下の工程a)〜c)を包含する方法。
a)対象者から採取した全血試料から総RNAまたはmRNAを単離し、
b)工程a)で単離した総RNAまたはmRNAについて、少なくともC3遺伝子、CR1遺伝子、Foxp3遺伝子、GITR遺伝子、ICOS遺伝子、IFN−γ遺伝子、IL−2遺伝子、IL−12Rb12遺伝子およびTIM−3遺伝子を含む標的遺伝子群のそれぞれの遺伝子に対応するmRNA産物を定量し、そして
c)対象者における該自己免疫疾患の存在または不存在、あるいは対象者が該自己免疫疾患を発症する傾向にあるかどうかを検出するように訓練した識別器に、工程b)で得たmRNA産物の定量データを入力する。
【請求項2】
該識別器が、健康な対照者および自己免疫疾患を発症している患者からなる、病態が既知の対象者群から得たデータによって訓練されており、訓練データは、工程b)で使用した標的遺伝子と実質的に同じ遺伝子のmRNA発現結果に基づくデータであることを特徴とする、請求項1に記載の方法。
【請求項3】
工程b)で使用する標的遺伝子群が、CD25遺伝子、ガレクチン−9遺伝子、GATA−3遺伝子、IL−4R遺伝子、INOS遺伝子およびTBET遺伝子からなる群より選ばれる少なくとも1種の遺伝子を更に包含することを特徴とする、請求項1に記載の方法。
【請求項4】
自己免疫疾患が関節リウマチであることを特徴とする、請求項1に記載の方法。
【請求項5】
工程b)を、逆転写リアルタイム定量ポリメラーゼ連鎖反応(RTqPCR)で実施することを特徴とする、請求項1に記載の方法。
【請求項6】
工程c)で使用する識別器が、線形予測法であることを特徴とする、請求項1に記載の方法。
【請求項7】
該線形予測法が、回帰分析および線形判別分析を含む線形回帰モデルであることを特徴とする、請求項6に記載の方法。
【請求項8】
患者における関節リウマチの進行のモニタリング用である、請求項1に記載の方法。
【請求項9】
対象者における自己免疫疾患またはその疾病素質の存在または不存在の検出を目的とした識別器を構築するための、以下の工程a)〜e)を包含する方法。
a)少なくともC3遺伝子、CR1遺伝子、Foxp3遺伝子、GITR遺伝子、ICOS遺伝子、IFN−γ遺伝子、IL−2遺伝子、IL−12Rb12遺伝子およびTIM−3遺伝子を含む標的遺伝子群を選択し、
b)健康な対照者および所望の自己免疫疾患を発症している患者からなる、病態が既知の対象者群のそれぞれの対象者から全血試料を採取し、総RNAまたはmRNAを単離し、
c)工程b)で単離した総RNAまたはmRNAについて、工程a)で選択した標的遺伝子群のそれぞれの遺伝子に対応するmRNA産物を定量することによって、mRNAプロファイルを包含する試験データを提供し、
d)多重データ識別器に試験データを入力し、
e)工程d)で得られる結果をまとめることによって、識別器の訓練には使用していない別の患者試料から得た、工程c)のmRNAプロファイルと実質的に類似した患者mRNAプロファイルに基づいて、該自己免疫疾患の存在または不存在を検出することが可能な訓練された識別器を得る。
【請求項10】
工程d)の多重データ識別器が、人工ニューラルネットワーク、分類木と回帰木、k近傍分類法および回帰法を包含することを特徴とする、請求項9に記載の方法。
【請求項11】
対象者における自己免疫疾患またはその疾病素質の存在または不存在を検出するための、以下の工程a)〜c)を包含する方法。
a)対象者から採取した全血試料から総RNAまたはmRNAを単離し、
b)工程a)で単離した総RNAまたはmRNAについて、少なくともその一部がC3遺伝子、CR1遺伝子、CD25遺伝子、Foxp3遺伝子、ガレクチン−9遺伝子、GATA−3遺伝子、GITR遺伝子、ICOS遺伝子、IFN−γ遺伝子、IL−2遺伝子、IL−4R遺伝子、IL−12Rb12遺伝子、INOS遺伝子、TBET遺伝子およびTIM−3遺伝子からなる群より選ばれる遺伝子である標的遺伝子群のそれぞれの遺伝子に対応するmRNA産物を定量し、そして
c)対象者における該自己免疫疾患の存在または不存在、あるいは対象者が該自己免疫疾患を発症する傾向にあるかどうかを検出するように訓練した識別器に、工程b)で得たmRNA産物の定量データを入力する。
【請求項12】
該識別器が、健康な対照者および自己免疫疾患を発症している患者からなる、病態が既知である対象者群から得たデータによって訓練されており、訓練データは、工程b)で使用した標的遺伝子と実質的に同じ遺伝子のmRNA発現結果に基づくデータであることを特徴とする、請求項11に記載の方法。
【請求項13】
自己免疫疾患が関節リウマチであることを特徴とする、請求項11に記載の方法。
【請求項14】
対象者における自己免疫疾患またはその疾病素質の存在または不存在の検出を目的とした識別器を構築するための、以下の工程a)〜e)を包含する方法。
a)標的遺伝子群の少なくとも一部を、C3遺伝子、CR1遺伝子、CD25遺伝子、Foxp3遺伝子、ガレクチン−9遺伝子、GATA−3遺伝子、GITR遺伝子、ICOS遺伝子、IFN−γ遺伝子、IL−2遺伝子、IL−4R遺伝子、IL−12Rb12遺伝子、INOS遺伝子、TBET遺伝子およびTIM−3遺伝子からなる群より選択し、
b)健康な対照者および所望の自己免疫疾患を発症している患者からなる、病態が既知の対象者群のそれぞれの対象者から全血試料を採取し、総RNAまたはmRNAを単離し、
c)工程b)で単離した総RNAまたはmRNAについて、工程a)で選択した標的遺伝子群のそれぞれの遺伝子に対応するmRNA産物を定量することによって、mRNAプロファイルを包含する試験データを提供し、
d)多重データ識別器に試験データを入力し、
e)工程d)で得られる結果をまとめることによって、識別器の訓練には使用していない別の患者試料から得た、工程c)のmRNAプロファイルと実質的に類似した患者mRNAプロファイルに基づいて、該自己免疫疾患の存在または不存在を検出することが可能な訓練された識別器を得る。
【請求項15】
工程d)の多重データ識別器が、人工ニューラルネットワーク、分類木と回帰木、k近傍分類法および回帰法を包含することを特徴とする、請求項14に記載の方法。

【公表番号】特表2012−510265(P2012−510265A)
【公表日】平成24年5月10日(2012.5.10)
【国際特許分類】
【出願番号】特願2011−538017(P2011−538017)
【出願日】平成21年12月1日(2009.12.1)
【国際出願番号】PCT/FI2009/050966
【国際公開番号】WO2010/063886
【国際公開日】平成22年6月10日(2010.6.10)
【出願人】(511131848)
【Fターム(参考)】