説明

血液白血球中の遺伝子発現サインが、急性感染の差次的診断を可能にする

【課題】本発明は、遺伝子発現データを使用して、宿主免疫応答の程度、型及び性質並びに感染症の性質を早期に検出し一貫して決定するための組成物、システム及び方法を含む。
【解決手段】感染症の疑いのあるヒト対象を同定する方法であって、複数の遺伝子を含むバイオマーカーの発現レベルを決定するステップを含み、発現レベルを決定するステップがmRNAの量、タンパク質の量及びそれらの組合せを測定することによって実施される方法。試料が末梢血単核細胞を含み、黄色ブドウ球菌(S. aureus)感染による感染と大腸菌(E. coli)感染による感染とを判別するステップを含む方法。更に、細菌感染とウイルス感染とを判別することによって、感染症の疑いのあるヒト対象を同定する方法を含む。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、一般に、感染症の診断の分野、より具体的には、急性及び慢性の感染症の診断、予後診断及び追跡のためのシステム、方法及び装置に関する。
【0002】
長尺の表
本特許出願は、11個の補足表を含む。
【背景技術】
【0003】
本発明の範囲を制限することなく、その背景を、感染症の検出、評価、追跡及び予後診断のための診断方法に関して記載する。
【0004】
急性感染は、世界における、特に小児の間の死亡の主たる原因である(Fauci, A.S. 2005. The global challenge of infectious diseases: the evolving role of the National Institutes of Health in basic and clinical research. Nat Immunol 6:743-747)。それに付随して、感染病原体を同定する能力は、特に、生物体が血液(又はその他の入手可能な組織)中に存在しない場合には、不十分なままである。白血球が、感染の結果として上昇する場合であっても、このことにより、グラム陽性及びグラム陰性細菌並びに/又はウイルスの間の識別が可能となるわけではない。こうした診断上の障害によって、適切な治療の開始が遅れる恐れがあり、その結果、不必要な罹患及び死亡にさえ至る場合がある(Relman, D.A. 2002. New technologies, human-microbe interactions, and the search for previously unrecognized pathogens. J Infect Dis 186 Suppl 2:S254-258)。さらに、新興病原体が引き起こした最近の大流行(Fauci, A.S. 2005. The global challenge of infectious diseases: the evolving role of the National Institutes of Health in basic and clinical research. Nat Immunol 6:743-747;Fauci, A.S. 2004. Emerging infectious diseases: a clear and present danger to humanity. Jama 292:1887-1888)、及び生物的脅威の危険増大によって、感染症の診断を改善する必要性が高まっている。
【0005】
異なるクラスの病原体が、白血球上で差次的に発現する、特異的なパターン認識受容体(PRR,pattern-recognition receptor)を誘導する(Medzhitov, R., and C.A. Janeway, Jr. 1997. Innate immunity: the virtues of a nonclonal system of recognition. Cell 91:295-298;Medzhitov, R., and C. Janeway, Jr. 2000. Innate immune recognition: mechanisms and pathways [In Process Citation]. Immunol Rev 173:89-97)。白血球は、自然免疫系(顆粒球、ナチュラルキラー細胞)、適応免疫系(Tリンパ球及びBリンパ球)、又は両方(単核球及び樹状細胞)の成分である。血液は、感染病原体、アレルゲン、腫瘍、移植片又は自己免疫反応に暴露された可能性があるこれらの細胞の貯蔵場所でもあり、移動する区画でもある。したがって、血液白血球は、臨床的に関連のある情報の入手しやすい源であり、こうした細胞の包括的な分子表現型を、遺伝子発現マイクロアレイを使用して得ることができる。遺伝子発現の技術によって、癌の診断及び予後診断において新たな展望がすでに開けており(Alizadeh, A.A., M.B. Eisen, R.E. Davis, C. Ma, I.S. Lossos, A. Rosenwald, J.C. Boldrick, H. Sabet, T. Tran, X. Yu, J.I. Powell, L. Yang, G.E. Marti, T. Moore, J. Hudson, Jr., L. Lu, D.B. Lewis, R. Tibshirani, G. Sherlock, W.C. Chan, T.C. Greiner, D.D. Weisenburger, J.O. Armitage, R. Warnke, R. Levy, W. Wilson, M.R. Grever, J.C. Byrd, D. Botstein, P.O. Brown, and L.M. Staudt. 2000. Distinct types of diffuse large B-cell lymphoma identified by gene expression profiling. Nature 403:503-511;Golub, T.R., D.K. Slonim, P. Tamayo, C. Huard, M. Gaasenbeek, J.P. Mesirov, H. Coller, M.L. Loh, J.R. Downing, M.A. Caligiuri, C.D. Bloomfield, and E.S. Lander. 1999. Molecular classification of cancer: class discovery and class prediction by gene expression monitoring. Science 286:531-537;van de Vijver, M.J., Y.D. He, L.J. van't Veer, H. Dai, A.A. Hart, D.W. Voskuil, G.J. Schreiber, J.L. Peterse, C. Roberts, M.J. Marton, M. Parrish, D. Atsma, A. Witteveen, A. Glas, L. Delahaye, T. van der Velde, H. Bartelink, S. Rodenhuis, E.T. Rutgers, S.H. Friend, and R. Bernards. 2002. A gene-expression signature as a predictor of survival in breast cancer. N Engl J Med 347:1999-2009)、血液白血球中の遺伝子発現サインの解析から、疾患の発症及び治療に対する応答の機構についてよりよく理解されてきた(Bennett, L., A.K. Palucka, E. Arce, V. Cantrell, J. Borvak, J. Banchereau, and V. Pascual. 2003. Interferon and granulopoiesis signatures in systemic lupus erythematosus blood. J Exp Med 197:711-723;Rubins, K.H., L.E. Hensley, P.B. Jahrling, A.R. Whitney, T.W. Geisbert, J.W. Huggins, A. Owen, J.W. Leduc, P.O. Brown, and D.A. Relman. 2004. The host response to smallpox: analysis of the gene expression program in peripheral blood cells in a nonhuman primate model. Proc Natl Acad Sci U S A 101:15190-15195;Baechler, E.C., F.M. Batliwalla, G. Karypis, P.M. Gaffney, W.A. Ortmann, K.J. Espe, K.B. Shark, W.J. Grande, K.M. Hughes, V. Kapur, P.K. Gregersen, and T.W. Behrens. 2003. Interferon-inducible gene expression signature in peripheral blood cells of patients with severe lupus. Proc Natl Acad Sci U S A 100:2610-2615)。
【先行技術文献】
【非特許文献】
【0006】
【非特許文献1】1. Fauci, A.S. 2005. The global challenge of infectious diseases: the evolving role of the National Institutes of Health in basic and clinical research. Nat Immunol 6:743-747.
【非特許文献2】2. Relman, D.A. 2002. New technologies, human-microbe interactions, and the search for previously unrecognized pathogens. J Infect Dis 186 Suppl 2:S254-258.
【非特許文献3】3. Fauci, A.S. 2004. Emerging infectious diseases: a clear and present danger to humanity. Jama 292:1887-1888.
【非特許文献4】4. Medzhitov, R., and C.A.Janeway, Jr. 1997. Innate immunity: the virtues of a nonclonal system of recognition. Cell 91:295-298.
【非特許文献5】5. Medzhitov, R., and C. Janeway, Jr. 2000. Innate immune recognition: mechanisms and pathways [In Process Citation]. Immunol Rev 173:89-97.
【非特許文献6】6. Alizadeh, A.A., M.B. Eisen, R.E. Davis, C. Ma, I.S. Lossos, A. Rosenwald, J.C. Boldrick, H. Sabet, T. Tran, X. Yu, J.I. Powell, L. Yang, G.E. Marti, T. Moore, J. Hudson, Jr., L. Lu, D.B. Lewis, R. Tibshirani, G. Sherlock, W.C. Chan, T.C. Greiner, D.D. Weisenburger, J.O. Armitage, R. Warnke, R. Levy, W. Wilson, M.R. Grever, J.C. Byrd, D. Botstein, P.O. Brown, and L.M. Staudt. 2000. Distinct types of diffuse large B-cell lymphoma identified by gene expression profiling. Nature 403:503-511.
【非特許文献7】7. Golub, T.R., D.K. Slonim, P. Tamayo, C. Huard, M. Gaasenbeek, J.P. Mesirov, H. Coller, M.L. Loh, J.R. Downing, M.A. Caligiuri, C.D. Bloomfield, and E.S. Lander. 1999. Molecular classification of cancer: class discovery and class prediction by gene expression monitoring. Science 286:531-537.
【非特許文献8】8. van de Vijver, M.J., Y.D. He, L.J. van't Veer, H. Dai, A.A. Hart, D.W. Voskuil, G.J. Schreiber, J.L. Peterse, C. Roberts, M.J. Marton, M.Parrish, D. Atsma, A. Witteveen, A. Glas, L. Delahaye, T. van der Velde, H. Bartelink, S. Rodenhuis, E.T. Rutgers, S.H. Friend, and R. Bernards. 2002. A gene-expression signature as a predictor of survival in breast cancer. N Engl J Med 34 7:1999-2009.
【非特許文献9】9. Bennett, L., A.K. Palucka, E. Arce, V. Cantrell, J. Borvak, J. Banchereau, and V. Pascual. 2003. Interferon and granulopoiesis signaturesin systemic lupus erythematosus blood. J Exp Med 197:711-723.
【非特許文献10】10. Rubins, K.H., L.E. Hensley, P.B. Jahrling, A.R. Whitney, T.W. Geisbert, J.W. Huggins, A. Owen, J.W. Leduc, P.O. Brown, and D.A. Relman. 2004. The host response to smallpox: analysis of the gene expression program in peripheral blood cells in a nonhuman primate model. Proc Natl Acad Sci U S A 101:15190-15195.
【非特許文献11】11. Baechler, E.C., F.M. Batliwalla, G. Karypis, P.M. Gaffney, W.A. Ortmann, K.J. Espe, K.B. Shark, W.J. Grande, K.M. Hughes, V. Kapur, P.K. Gregersen, and T.W. Behrens. 2003. Interferon-inducible gene expression signature in peripheral blood cells of patients with severe lupus. Proc Natl Acad SciU S A 100:2610-2615.
【発明の概要】
【発明が解決しようとする課題】
【0007】
本発明は、感染症の予後診断及び診断のために、複数の変動する遺伝子発現の解析を使用して試料を解析するためのシステム及び方法を含む。残存する遺伝子発現の差は、高い信頼性で、対応のない変動に起因し得る。こうして同定した遺伝子発現の差を、例えば、感染症に対する宿主応答を診断するため、生理学的な状態を同定するため、免疫細胞の活性化を同定、追跡及びモニターするため、薬物を設計するため、且つ治療をモニターするために使用することができる。
【課題を解決するための手段】
【0008】
一実施形態では、本発明は、感染性、例えば、ウイルス性、細菌性、寄生虫様、寄生虫性、真菌性等の病原体に罹患した恐れのあるヒト対象の免疫応答を、バイオマーカーの発現レベルを決定することによって同定する方法を含む。
【0009】
バイオマーカーの追加の例として、感染病原体又はそれによって引き起こされる疾患及びそれらの組合せに関連する遺伝子が挙げられる。バイオマーカーは、バイオマーカーのmRNA、タンパク質又はmRNA及びタンパク質の両方のレベルを定量化することによってスクリーニングすることができる。バイオマーカーがmRNAのレベルである場合、これは、ポリメラーゼ連鎖反応、リアルタイムポリメラーゼ連鎖反応、逆転写酵素ポリメラーゼ連鎖反応、ハイブリダイゼーション、プローブハイブリダイゼーション及び遺伝子発現アレイから選択された方法によって定量化することができる。スクリーニングの方法はまた、バイオマーカー中の多型の検出を含むこともできる。別法として、スクリーニングのステップは、ポリメラーゼ連鎖反応、ヘテロデュプレックス解析、一本鎖高次構造多型解析、リガーゼ連鎖反応、比較ゲノムハイブリダイゼーション、サザンブロット法、ノーザンブロット法、ウエスタンブロット法、酵素結合免疫吸着測定法、蛍光共鳴エネルギー移動及び配列決定からなる群から選択される少なくとも1つの技法を使用して達成することができる。本発明と共に使用する場合には、試料は、いくつかの免疫細胞、例えば、白血球又はその小成分のうちのいずれであってもよい。
【0010】
別の実施形態は、組織試料から感染症に対する宿主応答を診断するための方法を含み、これは、免疫組織試料から遺伝子発現プロフィールを得るステップを含み、以下の遺伝子、例えば、補足表1〜11及びそれらの組合せのうち2種以上の発現を測定する。本明細書に並行して提出した長尺の表は、参照により本明細書に完全に組み込まれている。本発明の一例では、遺伝子発現プロフィール又はトランスクリプトーム値ベクターは、本開示の一部を形成する表1、4、5及び補足表1〜11、並びにそれらの組合せに列挙した遺伝子のうちのいずれかを含んでよい。例えば、特定の遺伝子が、トランスクリプトームのベクター(複数のベクター)の一部を形成することができ、これを使用して、細菌感染と比較して、インフルエンザ感染とより高い相関性がある遺伝子、例えば、ウイルスに対する応答(例えば、cig5;DNAPTP6;IFI27;IFI35;IFI44;OAS1);免疫応答(例えば、BST2;G1P2;LY6E;MX1);抗アポトーシス(例えば、SON);細胞の増殖及び/又は維持(例えば、TRIM14)に関与する遺伝子;並びにその他の遺伝子(例えば、APOBEC3C;C1orf29;FLJ20035;FLJ38348;HSXIAPAF1;KIAA0152;PHACTR2;及びUSP18)を判別する。インフルエンザと比較して、細菌感染とより高い相関性がある遺伝子の判別では、翻訳伸長(例えば、EEF1G);翻訳開始調節(例えば、EIF3S5;EIF3S7;EIF4B);タンパク質生合成(例えば、QARS;RPL31;RPL4);転写調節(例えば、PFDN5);細胞接着(例えば、CD44);代謝(例えば、HADHA;PCBP2)に関与する遺伝子;及びdJ507I15.1等のその他の遺伝子に注目することができる。バイオマーカー、例えば、RNAの供給源のために使用する組織は、血液であってよい。1つの具体的な実施形態では、遺伝子プロフィールを得、それを患者と対照との間ではなく患者群間で比較する。
【0011】
別の実施形態は、組織試料から特異的な感染症に対する宿主応答を診断するための方法を含み、これは、免疫組織試料から遺伝子発現プロフィール又はトランスクリプトームを得るステップを含み、以下の遺伝子、例えば、シグナル伝達遺伝子(例えば、CXCL1;JAG1;RGS2);代謝(例えば、GAPD);PPIB;PSMA7;MMP9;p44S10;タンパク質ターゲティング(例えば、TRAM2);細胞内タンパク質輸送(例えば、SEC24C);並びにその他の遺伝子(例えば、ACTG1;CGI−96;MGC2963;及びSTAU)のうち2種以上の発現を使用して、黄色ブドウ球菌(S. aureus)による感染と大腸菌(E. coli)による感染とを判別することができる。一方、黄色ブドウ球菌感染ではなく、大腸菌感染と相関することが、最も頻繁に見い出される遺伝子、例えば、細胞内シグナル伝達(例えば、RASA1;SNX4);翻訳開始調節(例えば、AF1Q);転写調節(例えば、SMAD2);細胞接着(例えば、JUP);代謝(例えば、PP;MAN1C1);及びその他の遺伝子(例えば、FLJ10287;FLJ20152;LRRN3;SGPP1;UBAP2L)が存在する場合がある。バイオマーカー、例えば、RNAの供給源のために使用する組織は、血液であってよい。遺伝子プロフィールを得、それを患者と対照との間ではなく患者群間で比較する。
【0012】
本発明の方法では、発現レベルを決定するステップは、一連の遺伝子によって発現したmRNAの量を測定し、且つ/又は一連の遺伝子によって発現したタンパク質の量を測定することによって実施する。発現レベルを決定するステップは、オリゴヌクレオチドアレイを使用することによって実施する、例えば、核酸である1又は複数のバイオマーカーを試料から単離して、それを固体の支持体上で既知の核酸とハイブリダイズさせることができる。また、発現レベルを決定するステップは、ヒト細胞から収集したmRNAを鋳型として使用して作製されるcDNAを使用して実施することもできる。いくつかの実施形態では、検出可能な標識を使用して、バイオマーカー及び/又は発現レベルを決定するために使用するバイオマーカーの結合に関する標的(例えば、抗体)を標識することができる。スクリーニングするステップは、バイオマーカーのmRNA、タンパク質又はmRNA及びタンパク質の両方のレベルを定量化することによって達成することができる。しばしば、バイオマーカーは、mRNAレベルで検出することができ、ポリメラーゼ連鎖反応、リアルタイムポリメラーゼ連鎖反応、逆転写酵素ポリメラーゼ連鎖反応、ハイブリダイゼーション、プローブハイブリダイゼーション及び遺伝子発現アレイからなる群から選択された方法によって定量化することができる。また、バイオマーカー中の多型の検出によってスクリーニングするのが有用である場合もある。発現レベルを決定するためのその他の方法は、ポリメラーゼ連鎖反応、ヘテロデュプレックス解析、一本鎖高次構造多型解析、リガーゼ連鎖反応、比較ゲノムハイブリダイゼーション、サザンブロット法、ノーザンブロット法、ウエスタンブロット法、酵素結合免疫吸着測定法、蛍光共鳴エネルギー移動及び配列決定からなる群から選択された、少なくとも1つの技法を使用して達成することができる。試料はしばしば血液であるが、いくつかの細胞のうちのいずれか、例えば、白血球、生検細胞、体液又は分泌物中の細胞、及びその他も使用してよい。いくつかの実施形態では、バイオマーカーは、血液から抽出したタンパク質であってよい。
【0013】
本発明のさらに別の実施形態は、記載した標的に関する以下の遺伝子:ウイルス感染と比較して、細菌感染の結果として過剰発現した遺伝子:翻訳伸長;EEF1G;翻訳開始調節;EIF3S5;EIF3S7;EIF4B;タンパク質生合成;QARS;RPL31;RPL4;転写調節;PFDN5;細胞接着;CD44;代謝;HADHA;PCBP2;その他;dJ507I15.1のうち1又は複数を有するバイオマーカーの発現レベルを決定することにより、感染症の疑いのあるヒト対象を同定する方法を含む。発現レベルを決定するステップは、一連の遺伝子によって発現したmRNAの量を測定することによって、又は一連の遺伝子によって発現したタンパク質の量を測定することによっても実施する。
【0014】
以下の遺伝子の過剰発現が黄色ブドウ球菌感染を示す、感染症の疑いのあるヒト対象を同定するさらに別の方法:シグナル伝達;CXCL1;JAG1;RGS2;代謝;GAPD;PPIB;PSMA7;MMP9;p44S10;タンパク質ターゲティング;TRAM2;細胞内タンパク質輸送;SEC24C;その他;ACTG1;CGI−96;MGC2963;STAU。
【0015】
以下の遺伝子の過剰発現が大腸菌感染を示す、感染症の疑いのあるヒト対象を同定するさらに別の方法:細胞内シグナル伝達;RASA1;SNX4;翻訳開始調節;AF1Q;転写調節;SMAD2;細胞接着;JUP;代謝;PP;MAN1C1;その他;FLJ10287;FLJ20152;LRRN3;LRRN3;SGPP1;UBAP2L。
【0016】
本発明のさらに別の方法は、複数の試料プローブ強度を得、試料プローブ強度に基づいて感染症を診断し、試料プローブ強度と参照プローブ強度との間の線形相関係数を計算し、線形相関係数が閾値を超える場合には、暫定的な遺伝子型を試料の遺伝子型として受け入れることにより、試料の遺伝子型を決定するための、コンピュータが実行する方法を含む。特定の実施形態では、閾値は、約0.7と約1以上との間でよいが、特定の閾値は、少なくとも0.8;少なくとも0.9及び/又は少なくとも0.95を含む。プローブ強度は、組織試料からの遺伝子発現プロフィールから選択することができ、以下の遺伝子のうち2種以上の発現を、記載した標的に関して測定する:
【0017】
黄色ブドウ球菌:シグナル伝達;CXCL1;JAG1;RGS2;代謝;GAPD;PPIB;PSMA7;MMP9;p44S10;タンパク質ターゲティング;TRAM2;細胞内タンパク質輸送;SEC24C;その他;ACTG1;CGI−96;MGC2963;STAU;及びそれらの組合せ;
【0018】
大腸菌:細胞内シグナル伝達;RASA1;SNX4;翻訳開始調節;AF1Q;転写調節;SMAD2;細胞接着;JUP;代謝;PP;MAN1C1;その他;FLJ10287;FLJ20152;LRRN3;LRRN3;SGPP1;UBAP2L;及びそれらの組合せ;
【0019】
インフルエンザ:ウイルスに対する応答;cig5;DNAPTP6;IFI27;IFI35;IFI44;IFI44;OAS1;免疫応答;BST2;G1P2;LY6E;MX1;抗アポトーシス;SON;細胞の増殖及び/又は維持;TRIM14;その他;APOBEC3C;C1orf29;FLJ20035;FLJ38348;HSXIAPAF1;KIAA0152;PHACTR2;USP18;ZBP1;及びそれらの組合せ。
【0020】
本発明の別の実施形態は、試料の遺伝子型を決定するための方法を実施するためのコンピュータ実行可能命令を含むコンピュータ可読媒体であり、この方法は、複数の試料プローブ強度を得るステップと、表1、4、5及び/又は補足表1〜11、並びにそれらの組合せに列挙した遺伝子から選択される6種以上の遺伝子に関する試料プローブ強度に基づいて感染症を診断するステップと、試料プローブ強度と参照プローブ強度との間の線形相関係数を計算し、線形相関係数が閾値を超える場合には、暫定的な遺伝子型を試料の遺伝子型として受け入れるステップとを含む。
【0021】
本発明の別の実施形態は、感染症に対する宿主免疫応答を同定するためのシステムであり、これは、遺伝子発現を検出するためのマイクロアレイを含み、当該マイクロアレイが、表1、4、5及び補足表1〜11、並びにそれらの組合せに列挙した遺伝子から選択される4種以上のバイオマーカーを含み、当該マイクロアレイから得た遺伝子発現データが、感染症に対する宿主免疫応答とある閾値で相関する。
【0022】
本発明の別の実施形態は、マイクロアレイから遺伝子発現データを得、表1、4及び/又は5から選択される4種以上の遺伝子からなる群から選択された4種以上のバイオマーカーの発現を決定することにより、感染症を診断するためのシステムであり、当該マイクロアレイから得た遺伝子発現データが、感染症に対する宿主免疫応答と、少なくとも0.8の閾値で相関する。本発明のシステムと共に使用する場合には、バイオマーカーを、5、6、7、8、9、10、11、12又は13の遺伝子又は遺伝子モジュール、及び参照によって本明細書に組み込まれている補足表のうちの1又は複数並びにそれらの組合せから選択することができる。
【0023】
別の実施形態は、カスタマイズされた遺伝子アレイである予後徴候遺伝子アレイであり、これは、1又は複数の転写モジュールを代表する遺伝子の組合せを含み、カスタマイズされた遺伝子アレイと接触させる患者のトランスクリプトームが、SLEの予後徴候である。このアレイを使用して、SLEについての治療に対する患者の応答をモニターすることができる。また、このアレイを使用して、自己免疫疾患、ウイルス感染、細菌感染、癌及び移植片拒絶を区別することもできる。特定の直接的な測定のためには、アレイを2種以上の転写モジュールに編成することもでき、これを視覚的に走査して、発現の程度を光学的、例えば、裸眼で且つ/又は画像処理装置を用いて解析することができる。例えば、本明細書に開示するように、5、6、7、8、9、10、11、12又は13種の遺伝子又は遺伝子モジュール、且つ補足表のうちの1又は複数及びそれらの組合せから選択される1又は複数のサブモジュールを有する3種の転写モジュールにアレイを編成することができ、前記遺伝子のうちの1又は複数に特異的に結合するプローブが、3種以上のモジュールから選択され、かつ感染症又はその他の疾病の指標となる。
【0024】
本発明の別の実施形態は、将来の患者のトランスクリプトームを得て、前記トランスクリプトームと臨床試験で治療される疾患又は疾病を示す1又は複数の転写モジュールとを比較し、臨床試験において首尾よく相関する1又は複数の転写モジュールに属する患者のトランスクリプトーム中で発現する1又は複数の遺伝子の存在、非存在又はレベルに基づいて、患者が臨床試験の良好な候補である可能性を決定することにより、臨床試験のための患者を選択するための方法を含む。この方法と共に使用する場合には、各モジュールは、試料中の転写物の比の和と相関するベクター;1又は複数の疾患又は疾病が、1又は複数のベクターと関係があるベクター;各モジュール内の1又は複数の遺伝子の発現レベルと相関するベクター、並びに/或いは健常者と比較して、感染症、又は先天性、変性、後天性若しくはその他の疾患を有する患者を、検出、特徴付け、診断、予後診断及び/又はモニターするためのモジュールを含むベクターを含むことができる。
【0025】
本発明の特色及び利点をより完全に理解するために、添付する図と一緒に、本発明の詳細な説明を以下に記載する。
【図面の簡単な説明】
【0026】
【図1】A型インフルエンザウイルス感染を有する患者と細菌感染を有する患者を判別することが可能であることを示す図である。図1aは、2つの群:A型インフルエンザ感染(Inf A,influenza A、11個の試料、緑色の長方形)と、大腸菌(E.coli,Escherichia coli、6個の試料)又は肺炎連鎖球菌(S.pn,Streptococcus pneumoniae、6個の試料)による細菌感染との間のマンホイットニーの順位検定比較(p<0.01)から得た854種の遺伝子の階層的なクラスタリングを示す。変換した発現レベルを、カラースケールによって示し、各遺伝子の全ドナーにわたる発現の中央値と比較して、赤色は、相対的に高い発現を示し、青色は、相対的に低い発現を示す。黒色のバーは、インターフェロン誘導型遺伝子(IFN)を示し、青色のバーは、タンパク質の生合成に関与する遺伝子を示す。遺伝子を、補足表2に示す。図1bは、管理された学習アルゴリズムからの結果を使用して、2つのクラスを識別する最も高い能力を示す35種の遺伝子を同定した様子を示す(表1及び補足表3)。35種の遺伝子を有するトレーニングセットの一点除外交差検証は、試料を91%の正確度で分類した。予測されたクラスを、明るい色の実線の長方形で示す(A型インフルエンザについては緑色及び細菌については赤色)。細菌感染を有する2人の患者が、誤って分類された。図1cは、こうして同定した35種の分類指標遺伝子を、A型インフルエンザ感染を有する7人(緑色)、大腸菌感染を有する23人(赤色)及び肺炎連鎖球菌感染を有する7人の新しい患者を含む独立したセットの患者(中抜きの長方形)について試験した概要を示す。この試験セット中の37個の試料が、95%の正確度で分類された(予測されたクラスを、明るい色の長方形によって示す)。クラス予測において、1人の患者は、誤って分類され、1人の患者は、分類できなかった(灰色のボックス)。図1dは、7bで同定し、A型インフルエンザ(Inf A)感染を有する7人及び黄色ブドウ球菌(S. aureus)感染を有する31人の新しい患者を含む独立したセットの患者(中抜きの正方形)について試験した35種の分類指標遺伝子を示す図である。この38個の試料は、87%の正確度で分類された。
【図2】A型インフルエンザ感染を有する患者を、細菌感染を有する患者と識別する35種の分類指標遺伝子の発現レベルを示す図である。スケーリングした遺伝子発現の値(強度の平均差)を、図7bに示した、A型インフルエンザ感染を有する患者からの試料(11個の試料、緑色の正方形)と、細菌感染を有する患者からの試料(大腸菌を有する6つの試料及び肺炎連鎖球菌を有する6つの試料、赤色のひし形)とを識別する35種の分類指標遺伝子についてプロットしている。各プロットは、1つの試料を示し、線は、発現の中央値を示す。
【図3A】黄色ブドウ球菌感染を有する患者と大腸菌感染を有する患者を判別することが可能であることを示す図である。図9aは、2つの群:黄色ブドウ球菌感染(Staphylococcus aureus,S. aureus、10個の試料、赤色の長方形)と大腸菌感染(Escherichia coli、E. coli、10個の試料、青色の長方形)との間のマンホイットニーの順位検定比較(p<0.01)から得た211種の遺伝子の階層的なクラスタリングを示す。変換した発現レベルを、カラースケールによって示し、各遺伝子の全ドナーにわたる発現の中央値と比較して、赤色は、相対的に高い発現を示し、青色は、相対的に低い発現を示す。遺伝子を、補足表4に列挙する。図3bは、管理された学習アルゴリズムからの結果を使用して、2つのクラスを識別する最も高い能力を示す30種の遺伝子を同定した様子を示す(補足表6も参照)。30種の分類指標遺伝子を有するトレーニングセットの一点除外交差検証は、試料を95%の正確度でグループ化した。図3cは、こうして同定した30種の分類指標遺伝子を、黄色ブドウ球菌感染を有する21人及び大腸菌感染を有する19人の新しい患者を含む独立したセットの患者(中抜きの長方形)について試験した様子を示す。この試験セット中の40個の試料が、85%の正確度で予測された(予測されたクラスを、明るい色の長方形によって示す)。これらの40個の試料のうち、わずか2個が誤って分類され、4個のその他の試料のクラスは、決定することができなかった(中抜きの長方形)。
【図3B】図3d及び3eは、差次的に発現した遺伝子の、リアルタイムRT−PCRによる検証を示す。図3dは、黄色ブドウ球菌(Sa)感染を有する患者又は大腸菌(Ec)感染を有する患者から得た試料中の9種の遺伝子の発現レベルをリアルタイムRT−PCRによって測定した様子を示す(RGS2、FCAR及びALOZ以外を対数変換した、健常な対照に対する遺伝子発現の倍数変化)。各プロットは、1つの試料を示し、線は、発現の中央値を示す。図9eは、リアルタイムRT−PCR解析によって得た発現値(横軸)と、マイクロアレイ解析(縦軸、リアルタイムRT−PCRのデータを標準化した同一の健常な対照からの試料における発現に対して標準化した;対数目盛)との間の相関関係を示す。詳細については、補足表5を参照されたい。
【図4A】大腸菌感染を有する患者を、黄色ブドウ球菌感染を有する患者と識別する30種の分類指標遺伝子の発現レベルを示す図である。スケーリングした遺伝子発現の値(強度の平均差)を、図3bに示した、大腸菌感染を有する患者からの試料(10個の試料、青色の正方形)と、黄色ブドウ球菌感染を有する患者からの試料(10個の試料、赤色のひし形)とを識別する30種の分類指標遺伝子についてプロットしている。各プロットは、1つの試料を示し、線は、発現の中央値を示す。
【図4B】図4Bは、本発明を使用して、細菌感染を有する患者間を見分けることができる様子を示す。図4Bは、大腸菌感染を有する患者群(11個の試料)と肺炎連鎖球菌感染を有する患者群(11個の試料)との間のマンホイットニーの順位検定比較(p<0.01)から得た242種の遺伝子の階層的なクラスタリングを示す。変換した発現レベルを、カラースケールによって示し、各遺伝子の全ドナーにわたる発現の中央値と比較して、赤色は、相対的に高い発現を示し、青色は、相対的に低い発現を示す。遺伝子を、補足表7に列挙する。
【図4C】図4Cは、本発明を使用して、細菌感染を有する患者間を見分けることができる様子を示す。図4Cは、管理された学習アルゴリズムからの結果を使用して、2つのクラスを識別する最も高い能力を示す遺伝子を同定した様子を示す。45種の予測遺伝子を有するトレーニングセットの一点除外交差検証は、試料を85%(20/22)の正確度で分類した。分類指標遺伝子を、補足表8に列挙する。
【図4D】図4Dは、本発明を使用して、細菌感染を有する患者間を見分けることができる様子を示す。図4Dは、黄色ブドウ球菌感染を有する患者群(12個の試料)と肺炎連鎖球菌感染を有する患者群(11個の試料)との間のマンホイットニーの順位検定比較(p<0.01)から得た127種の遺伝子の管理されていない階層的なクラスタリングからの結果を示す図である。変換した発現レベルを、カラースケールによって示し、各遺伝子の全ドナーにわたる発現の中央値と比較して、赤色は、相対的に高い発現を示し、青色は、相対的に低い発現を示す。遺伝子を、補足表9に列挙する。
【図4E】図4Eは、本発明を使用して、細菌感染を有する患者間を見分けることができる様子を示す。図4Eは、管理された学習アルゴリズムを使用して、2つのクラスを識別する最も高い能力を示す遺伝子を同定した様子を示す。30種の遺伝子を有するトレーニングセットの一点除外交差検証は、試料を83%(19/23)の正確度で分類した。分類指標遺伝子を、補足表10に列挙する。
【図5】急性呼吸器感染を有する患者から得た循環中の白血球中での遺伝子発現の特徴的なパターンを示す図である。図5aでは、黄色ブドウ球菌を大腸菌と識別することが見い出された30種の分類指標遺伝子(ベン図、右:Sa対Ec;図2及び補足表6)を使用して、黄色ブドウ球菌を肺炎連鎖球菌と識別する30種の遺伝子(ベン図、左:Sa対Sp;図5a及び補足表10)、並びに大腸菌を肺炎連鎖球菌と識別する45種の遺伝子(ベン図、下:Ec対Sp;補充図5b及び補足表8)を同定している。わずか3種の遺伝子が、これらの群のうちのいずれかの間で共通したに過ぎない。図5bでは、図5a中に示した、細菌感染を有する患者からの試料を識別することが見い出された3つの群の遺伝子を統合し(102種の特有の遺伝子、ベン図、左)、A型インフルエンザ感染を細菌感染と識別するために使用した分類指標遺伝子(35種の遺伝子、ベン図、右;図5b及び補足表3)と比較した。これらの2つの群の間では、共通した遺伝子は1つもなかった。図5cは、A型インフルエンザ感染を細菌感染と区別する137種の分類指標遺伝子と、3つの群の異なる細菌感染を有する患者とを統合して、呼吸器感染を有する27人の患者及び7人の健常なボランティアの間において、発現の識別力のあるパターンを生成するために使用した様子を示す。値を、各遺伝子の全ドナーにわたる発現の中央値に対して標準化した。条件のクラスタリングによって、試料が、4つの主要な群に分割された。A型インフルエンザ群に属する4つの試料及び黄色ブドウ球菌群からの1つの試料が、混合性のサイン()によって特徴付けられる明確に区別できるサブグループを形成した。
【図6】感染症のモニタリングに関する有意差のパターンの解析を示す図である。各群の患者において測定した遺伝子発現レベルを、健常なボランティアによって形成された対照群において得た結果と比較した(マンホイットニーU検定)。次いで、選択基準を、A型インフルエンザ(FLU)を有する患者又は全身性エリテマトーデス(SLE)を有する患者について得たp値に適用した。左の列:過剰発現した遺伝子;右の列:過小発現した遺伝子;上の行:FLU及びSLEの両方において有意に変化した(p<0.01);中央の行:SLEにおいては有意に変化した(p<0.01)が、FLUではそうではなかった(P>0.5);下の行:FLUにおいては有意に変化した(p<0.01)が、SLEではそうではなかった(P>0.5)。遺伝子を、p値の階層的なクラスタリングによって配置した。カラースケール:緑色は、低いp値を示し、黄色及び白色は、高いp値を示す。系統樹の青色の枝は、疾患に特異的なサインを示す(C1〜C4;詳細は、補足表11を参照)。
【図7】モジュールレベルでの転写の変化の地図を作製するために使用することができる遺伝子ベクターが、疾患に特異的なパターンを同定する様子を示す図である。
【図8】急性感染を有する患者における疾患重症度の評価のためのマイクロアレイのスコアを示す図である。
【図9】図9a〜9cは、マイクロアレイのプラットフォームにわたる独立した確認及び検証の概要を示す図である。
【発明を実施するための形態】
【0027】
本発明の種々の実施形態の作製及び使用を、以下に詳細に議論するが、本発明は、多種多様な特異的な状況において具体化することができる、多くの応用可能な発明概念を提供することを理解されたい。本明細書で議論する具体的な実施形態は、本発明を作製及び使用するための特異的な方法を単に説明するに過ぎず、本発明の範囲を定めるものではない。
【0028】
本発明の理解を手助けするために、いくつかの用語を以下に定義する。本明細書で定義する用語は、本発明に関連する分野の当業者に通常理解される意味を有する。「a」、「an」及び「the」等の用語は、単一の実体を指す意図はないが、そのうちの特異的な例を、説明のために使用することができる一般的なクラスを含む。本明細書中の専門用語は、本発明の具体的な実施形態を説明するために使用するが、特許請求の範囲に要点を述べる場合以外は、専門用語の使用が、本発明を定めるものではない。別段の記載がない限り、本明細書で使用する全ての科学技術用語は、本発明が属する分野の当業者に通常理解される意味を有する。以下の参考文献は、当業者に、本発明において使用する用語のうちの多くの一般的な定義を提供している:Singleton, et al., Dictionary Of Microbiology And Molecular Biology (2d ed. 1994);The Cambridge Dictionary Of Science And Technology (Walker ed., 1988);The Glossary Of Genetics, 5th Ed., R. Rieger et al. (eds.), Springer Verlag (1991);及びHale & Marham, The Harper Collins Dictionary Of Biology (1991)。
【0029】
多様な生化学的及び分子生物学的な方法が、当技術分野で周知である。例えば、核酸の単離及び精製の方法が、国際公開第97/10365号パンフレット、国際公開第97/27317号パンフレット、Chapter 3 of Laboratory Techniques in Biochemistry and
Molecular Biology: Hybridization With Nucleic Acid Probes, Part I. Theory and Nucleic Acid Preparation, (P. Tijssen, ed.) Elsevier, N.Y. (1993);Chapter 3 of Laboratory Techniques in Biochemistry and Molecular Biology: Hybridization With Nucleic Acid Probes, Part 1. Theory and Nucleic Acid Preparation, (P. Tijssen, ed.) Elsevier, N.Y. (1993);及びSambrook et al., Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Press, N.Y., (1989);並びにsupplement 46 (April 1999)等の追加を含む、Current Protocols in Molecular Biology, (Ausubel, F. M. et al., eds.) John Wiley & Sons, Inc., New York (1987-1999)に詳細に記載されている。
【0030】
バイオインフォマティクスの定義
本明細書で使用される、「オブジェクト」は、いずれかの注目する事項又は情報(一般に、名詞、動詞、形容詞、副詞、句、文、記号、数字等をはじめとするテキスト)を指す。したがって、オブジェクトは、関係を形成することができる何らか、並びに源から入手、同定及び/又は検索することができる何らかである。「オブジェクト」として、これらに限定されないが、注目する実体、例として、遺伝子、タンパク質、疾患、表現型、機構、薬物等が挙げられる。いくつかの態様では、オブジェクトは、以下にさらに記載するように、データであることができる。
【0031】
本明細書で使用される、「関係」は、同一のユニット(例えば、句、文、2行以上のテキスト、段落、ウェブページのセクション、ページ、雑誌、研究論文、本等)内のオブジェクトの共起性を指す。これは、テキスト、記号、数、及びそれらの組合せであってよい。
【0032】
本明細書で使用される、「メタデータコンテンツ」は、データ源中のテキストの編成に関する情報を指す。メタデータは、ダブリンコアメタデータ等の標準的なメタデータを含んでもよく、又はコレクションに特異的であってもよい。メタデータフォーマットの例として、これらに限定されないが、図書館の目録のために使用されるマシーンリーダブルカタログ(MARC,Machine Readable Catalog)記録、リソースディスクリプションフォーマット(RDF,Resource Description Format)、及び拡張マークアップ言語(XM
L,Extensible Markup Language)が挙げられる。メタオブジェクトは、手作業で又は自動化された情報抽出アルゴリズムを通して生成することができる。
【0033】
本明細書で使用される、「エンジン」は、その他のプログラムのために中核的な又は必須の機能を果たすプログラムを指す。例えば、エンジンは、その他のプログラムの全体的な動作を統合する、オペレーティングシステム又はアプリケーションプログラム中の中心となるプログラムである場合がある。「エンジン」という用語はまた、変化させることができるアルゴリズムを含有するプログラムも指す。例えば、知識発見エンジンの、関係を同定するアプローチを変化させて、関係を同定してランク付けする新しい規則を反映することができるように、知識発見エンジンを設計することができる。
【0034】
本明細書で使用される、「統計的解析」は、各項目(単語、語根、語幹、n-gram、句等)の発生回数の集計に基づいた技法を指す。対象に関して非制限的なコレクションの場合、異なる文脈で使用された同一の句が、異なる概念を表わす場合がある。句の共起性の統計的解析は、語の意味の曖昧さを解消するのに役立つことができる。「構文解析」を使用して、品詞解析によって曖昧さをさらに低下させることができる。本明細書で使用する場合、そのような解析のうちの1又は複数を、より一般的には「字句解析」と呼ぶ。人工知能(AI,artificial intelligence)は、コンピュータ等の非ヒト装置に、ヒトが特筆
すべき又は「知的である」とみなすタスクを行わせる方法を指す。例として、絵の同定、話し言葉又は書かれた文書の理解、及び問題の解決が挙げられる。
【0035】
本明細書で使用される、「データベース」という用語は、種々の情報ファセットをデータフィールド内で見い出すことができる場合であっても、生又はコンパイル済みのデータのための収納場所を指す。データベースは、典型的には、その内容にアクセス、それを管理及びアップデートすることができるように編成される(例えば、データベースは、動的である)。「データベース」及び「源」という用語はまた、本発明では、互換的に使用する。これは、データ及び情報の主要な源が、データベースであるからである。しかし、「源のデータベース」又は「源のデータ」は、一般に、オブジェクトを同定して、関係を決定するためにシステムに入力するデータ、例えば、非構造化テキスト及び/又は構造化データを指す。源のデータベースは、リレーショナルデータベースであっても、又はそうでなくてもよい。しかし、システムデータベースは、通常、リレーショナルデータベース、又はオブジェクト間の関係に関する値を保存する、何らかの同等のタイプのデータベースを含む。
【0036】
本明細書で使用される、「システムデータベース」及び「リレーショナルデータベース」は、互換的に使用し、あらかじめ設定したカテゴリーに適合するデータを含有する表のセットとして編成された1又は複数のデータのコレクションを指す。例えば、データベース表は、列(例えば、属性)によって定義された1又は複数のカテゴリーを含むことができ、一方、データベースの行は、列によって定義されたカテゴリーに特有のオブジェクトを含有することができる。したがって、遺伝子の同一性等のオブジェクトは、遺伝子の存在、非存在及び/又は発現レベルに関する列を有する場合があろう。リレーショナルデータベースの行はまた、「セット」とも呼び、一般に、その列の値によって定義される。リレーショナルデータベースに照らした「ドメイン」は、列等のフィールドが含むことができる有効値の範囲である。
【0037】
本明細書で使用される、「知識ドメイン(domain of knowledge)」は、システムが動
作する研究領域、例えば、全ての生物医学的なデータを指す。いくつかのドメインからのデータ、例えば、生物医学的なデータと工学的なデータとを組み合せる利点があることを指摘すべきである。これは、多様性のあるデータは、時に、1つの領域又は調査/研究(1つのドメイン)に限って詳しい通常の研究者には、統合することができないことを関連付けることができる場合があるからである。「分散データベース」は、ネットワーク中の異なる点間で、分散又は複製することができるデータベースを指す。
【0038】
「データ」及び「情報」等の用語はしばしば、「情報」及び「知識」と同様に、互換的に使用する。本明細書で使用する場合、「データ」は、最も基本的なユニットであり、実験に基づいた測定結果又は一連の測定結果である。データは、コンパイルされて、情報に寄与するが、データは、根本的に、情報には依存しない。対照的に、情報は、関心から引き出され、例えば、データ(ユニット)は、心血管疾患の危険と相関する変数を見い出すために、人種、性別、身長、体重及び食餌について収集することができる。しかし、同一のデータを使用して、処方を開発する、又は食餌の好み、すなわち、スーパーマーケットの特定の製品が販売のより高い可能性を有する可能性に関する「情報」を生成することもできよう。
【0039】
本明細書で使用される、「情報」は、数、文字、一連の数、一連の文字、又は一連のデータから得た若しくは引き出した結論を含むことができるデータセットを指す。ひいては、「データ」は、測定結果又は統計値であり、情報の基本的なユニットである。「情報」はまた、その他のタイプのデータ、例として、単語、記号、非構造化フリーテキスト等のテキスト、コード等も含むことができる。「知識」とは、原因と結果をモデル化するのに系の十分な理解を与える一連の情報と大まかに定義する。先の例を延長すると、人口統計、性別及び購買歴についての情報を使用して、食品販売のためのマーケティングの地域戦略を開発することができ、一方、国民性についての情報は、製品の輸入のためのガイドラインとして仕入れ担当者が使用することができる。データ、情報及び知識の間に厳密な境界はなく、これら3つの事項が、時には、同等であるとみなされることがある点に注目することは重要である。一般に、データは調査することによって得られ、情報は相関させることによって得られ、知識はモデリングによって得られる。
【0040】
本明細書で使用される、「プログラム」又は「コンピュータプログラム」は、一般に、特定のプログラミング言語の規則に適合し、特定の機能、タスク又は問題を、解決又は実行するのに必要な「コードセグメント」に分割可能な宣言及び命令文又は命令でできている構文ユニットを指す。プログラミング言語は、一般に、プログラムを表現するための人工言語である。
【0041】
本明細書で使用される、「システム」又は「コンピュータシステム」は、一般に、データ処理を行う1又は複数のコンピュータ、周辺機器及びソフトウエアを指す。「ユーザー」又は「システムオペレーター」は、一般に、データ処理及び情報交換のために、「ユーザーの装置」(例えば、コンピュータ、ワイヤレス装置等)を通してアクセスしたコンピュータネットワークを使用するヒトを含む。「コンピュータ」は、一般に、多数の算術演算及び論理演算をはじめとする、実質的な計算を、ヒトの介入なしで行う機能性ユニットである。
【0042】
本明細書で使用される、「アプリケーションソフトウエア」又は「アプリケーションプログラム」は、一般に、適用問題の解決に特異的であるソフトウエア又はプログラムを指す。「適用問題」は、一般に、エンドユーザーによって提出され、その解決のために情報処理が必要となる問題である。
【0043】
本明細書で使用される、「自然言語(natural language)」は、その規則が、特異的に規定されることなく、現在の使用に基づく言語、例えば、英語、スペイン語又は中国語を指す。本明細書で使用される、「人工言語(artificial language)」は、その規則が、使用
に先立って、明確に確立されている言語、例として、C、C++、Java(登録商標)、BASIC、FORTRAN又はCOBOLを指す。
【0044】
本明細書で使用される、「統計的関連性」は、ランク付けスキーム(O/E比、強度等)のうちの1又は複数を使用して、偶然により予想されるよりも有意に頻繁に発生する場合、関係が、統計的に関連があると決定することを指す。
【0045】
本明細書で使用される「協調的に調節された遺伝子」又は「転写モジュール」という用語は、互換的に使用して、特異的な遺伝子の遺伝子発現のグループ化したプロフィール(例えば、特異的な遺伝子配列と関係があるシグナル値)を指す。値を、1又は複数の「協調的に調節された遺伝子」の組合せに割り当てて、単一の値として表現することができる「トランスクリプトーム値ベクター」又は「トランスクリプトームベクター」を提供することができる。例えば、値は、数値として、スパイダーチャートにプロットして、種々の強度、色(複数の色)、値でプロットして、又は等高線、例えば、立面プロットとして提供することができる。各転写モジュールを、1又は複数のデータ、例えば、文献検索部分及び遺伝子マイクロアレイから得た実際の実験に基づいた遺伝子発現値データと相関させることができる。転写モジュールに選択する遺伝子のセットは、遺伝子発現データの解析(上記のモジュール抽出アルゴリズム)に基づく。追加のステップは、関連部分が参照によって本明細書に組み込まれているChaussabel, D. & Sher, A. Mining microarray expression data by literature profiling. Genome Biol 3, RESEARCH0055 (2002), (http://genomebiology.com/2002/3/10/research/0055)によって教示されており、発現データは
、注目する疾患又は状態、例えば、全身性エリテマトーデス、関節炎、リンパ腫、細胞腫、メラノーマ、急性感染、自己免疫障害、自己炎症性障害等から得る。
【0046】
以下の表に、文献検索の部分又は転写モジュールに対する寄与を開発するために使用したキーワードの例を列挙する。当業者であれば、その他の用語を、その他の状態、例えば、特異的な癌、特異的な感染症、移植等に関して容易に選択することができることを認識するであろう。例えば、T細胞活性化と関係がある遺伝子に関する遺伝子及びシグナルは、本明細書中以下に、モジュールID「M2.8」として記載し、そこでは、特定のキーワード(例えば、リンパ腫、T細胞、DC4、CD8、TCR、胸腺、リンパ系、IL2)を使用して、主要なT細胞関連遺伝子、例えば、T細胞表面マーカー(CD5、CD6、CD7、CD26、CD28、CD96);リンパ系細胞が発現する分子(リンホトキシンベータ、IL−2誘導型T細胞キナーゼ、TCF7;及びT細胞分化タンパク質mal、GATA3、STAT5B)を同定した。次に、患者集団からのデータをこれらの遺伝子について(プラットフォーム、存在/非存在、及び/又は上方若しくは下方制御にかかわらず)相関させて、転写モジュールを生成することによって、完全なモジュールを開発する。場合によっては、遺伝子プロフィールは、(この時点では)これらの疾患状態及びデータに関する、いずれの特定の遺伝子のクラスタリングとも一致しないが、特定の生理学的経路(例えば、cAMPシグナル伝達、ジンクフィンガータンパク質、細胞表面マーカー等)が、「未決定」モジュール内に見い出される。事実、遺伝子発現データセットを使用して、キーワード検索との一致の前に、協調的な発現を有している遺伝子を抽出することができる、すなわち、第2のデータセットとの相互参照の前に、いずれかのデータセットが相関する場合がある。
【0047】
【表1】




【0048】
生物学的な定義
本明細書で使用される、「アレイ」という用語は、固体の支持体又は基板を指し、この支持体には、1又は複数のペプチド又は核酸のプローブが結合している。アレイは、典型的には、異なる、既知の場所で基板の表面に結合している1又は複数の異なる核酸又はペプチドのプローブを有する。こうしたアレイはまた、「マイクロアレイ」、「遺伝子チップ」又はDNAチップとも記載され、これは、10,000;20,000,30,000;又は40,000種の異なる、既知のゲノム、例えば、ヒトゲノムに基づいて同定可能な遺伝子を有することができる。こうした汎アレイを使用して、全体的な「トランスクリプトーム」、又は試料中に発現する若しくは見い出される遺伝子、例えば、RT及び/若しくはRT−PCRにかけて、DNAレプリコンの相補的なセットを作製することができるRNA、mRNA及びその他として発現する核酸の転写プールを検出する。アレイは、非リソグラフィー法及び/又はホトリソグラフィー法と固相合成法との組合せを組み込む機械的な合成方法、光誘導合成方法及びその他を使用して製造することができる。3ミクロンのビーズに結合させた50塩基長のオリゴヌクレオチドプローブを含むビーズアレイを使用することができる。これらのビーズは、例えば、スライドガラスの表面のマイクロウエル内に埋め込まれ、又は液相浮遊アレイ(例えば、Luminex又はIllumina)の一部
をなす。液相浮遊アレイは、液相中のデジタルビーズアレイであり、「バーコードを付けた」ガラス棒を、検出及び同定のために使用する。
【0049】
こうした核酸アレイの合成のための種々の技法が記載されており、例えば、実質的にいずれの形状の表面上にも又は多重表面上にでさえも加工されている。アレイは、ビーズ、ゲル、ポリマー表面、光ファイバー等の繊維、ガラス又はいずれかのその他の適切な基板の上のペプチド又は核酸であることができる。アレイを、包括的なデバイスの診断法又はその他の操作が可能になるようにパッケージしてもよい。例えば、関連部分が参照によって本明細書に組み込まれている米国特許第6955788号明細書を参照されたい。
【0050】
本明細書で使用される、「疾患」という用語は、細胞の何らかの異常な生物学的状態を有する生物体の生理学的な状態を指す。疾患として、これらに限定されないが、細胞、組織、身体機能、系又は臓器の中断、休止又は障害が挙げられ、それらは、固有のもの、遺伝性のもの、感染によって引き起こされたもの、異常な細胞機能、異常な細胞分裂及びその他によって引き起こされたものであることができる。「病的状態」に至る疾患は、一般に、生物学的な系、すなわち、疾患の宿主にとって有害である。本発明に関しては、感染(例えば、ウイルス性、細菌性、真菌性、寄生虫様等)、炎症、自己炎症、自己免疫、アナフィラキシー、アレルギー、前悪性、悪性、外科的なもの、移植、生理学的なもの、及び疾患又は障害に関係があるその他等、いずれの生物学的状態も、病的状態であるとみなされる。病理学的状態は、一般に、病的状態と等価である。
【0051】
病的状態はまた、異なるレベルの病的状態に分類することもできる。本明細書で使用する場合、疾患又は病的状態のレベルは、疾患又は病的状態の進行、並びに治療時、治療の間及び治療後の生理学的な応答を反映した自由裁量の評価基準である。一般に、疾患又は病的状態は、レベル又は段階を経て進行し、疾患の影響は、次第に重度になる。病的状態のレベルが、試料中の細胞の生理学的状態によって影響を受ける場合がある。
【0052】
本明細書で使用される、「治療」又は「治療計画」という用語は、病的状態を緩和する又は変化させるためにとる医学的ステップ、例えば、疾患の影響又は症状を、薬学的な、外科的な、食餌的な及び/又はその他の技法を使用して低減又は除去することを意図した治療コースを指す。治療計画は、1又は複数の薬物の処方された用量又は手術を含む場合がある。治療は、ほとんどの場合、有益であり、病的状態を低減するが、多くの場合、治療の効果が、望まれない影響又は副作用を有する。治療の効果はまた、宿主の生理学的な状態、例えば、年齢、性別、遺伝的特徴、体重、その他の病的状態等によっても影響を受ける。
【0053】
本明細書で使用される、「薬学的状態」又は「薬学的状況」という用語は、試料中の1又は複数の核酸の薬学的状態に影響を及ぼすことができる1又は複数の薬物、手術及びその他を用いて、今後治療する、現在治療している及び/又は過去に治療した試料、例えば、薬学的介入の結果として、新たに転写した、安定化した及び/又は不安定化した試料を指す。試料の薬学的状態は、薬物治療の前、間及び/又は後の生物学的状況の変化に関係し、本明細書で教示するように、診断又は予後診断の機能として役立つ場合がある。薬物治療又は手術の後のいくつかの変化は、病的状態と関連がある場合もあれば、且つ/又は治療に関係のない副作用である場合もある。薬学的状態の変化は、治療期間、処方された薬物の型及び用量、所与の治療コースの服薬遵守の程度、並びに/又は摂取した処方されていない薬物の起こり得る結果である。
【0054】
本明細書で使用される、「生物学的状態」という用語は、発現変化の解析のために単離及び精製した細胞試料の(RNA転写物の全コレクションである)トランスクリプトームの状態を指す。生物学的状態は、試料中の細胞の生理学的状態を、細胞成分の存在量及び/若しくは活性を測定すること、形態学的な表現型に従って特徴付けること、又は転写物の検出のための方法の組合せによって反映する。
【0055】
本明細書で使用される、「発現プロフィール」という用語は、RNA、DNA若しくはタンパク質の存在量の存在比、又は活性レベルを指す。発現プロフィールは、いくつかの方法により、多数の遺伝子チップ、遺伝子アレイ、ビーズ、マルチプレックスPCR、定量的PCR、ランオンアッセイ、ノーザンブロット解析、ウエスタンブロット解析、タンパク質発現、蛍光標識細胞分取(FACS,fluorescence activated cell sorting)、酵素結合免疫吸着測定法(ELISA,enzyme linked immunosorbent assay)、化学発光研究、酵素アッセイ、増殖研究、又は市販され容易に入手できる、遺伝子発現の決定及び/若しくは解析のためのいずれかのその他の方法、装置及びシステムのうちのいずれかを使用して得られる、例えば、転写状態又は翻訳状態の測定結果でよい。
【0056】
本明細書で使用される、試料の「転写状態」という用語は、RNA種、特に、試料中に存在するmRNAの同一性及び存在比を含む。試料の全体的な転写状態は、RNAの同一性と存在比との組合せであり、これはまた、本明細書では、トランスクリプトームとも呼ぶ。一般に、試料中のRNA種の全セットのうちの関係のある成分の全てのかなりの部分が測定される。
【0057】
本明細書で使用される、「転写ベクター」、「発現ベクター」及び「ゲノムベクター」という用語は、(互換的に使用し)「差次的に発現した遺伝子の割合」を反映する転写発現データを指す。例えば、各モジュールについて、少なくとも2つの群の間(例えば、健常な対象対患者)の差次的に発現した転写物の割合。このベクターは、2つの群の試料の比較から導く。最初の解析ステップを、各モジュール内で転写物の疾患に特異的なセットを選択するために使用する。次に、「発現レベル」がある。所与の疾患に関する群の比較は、各モジュールの差次的に発現した転写物のリストを提供する。異なる疾患は、異なるサブセットの、モジュール式の転写物をもたらすことが見い出された。次いで、この発現レベル内では、単一の試料について、各モジュール(複数のモジュール)のベクターを、差次的に発現していると同定された、疾患に特異的なサブセットの遺伝子の発現値を平均することによって計算することが可能である。このアプローチによって、単一の試料についてのモジュール式の発現ベクター、例えば、本明細書で公開するモジュール地図において記載したモジュール式の発現ベクターの地図の生成が可能になる。こうしたベクターモジュール地図は、(差次的に発現した遺伝子の割合の代わりに)各モジュールについての平均した発現レベルを表わす。この平均した発現レベルは、各試料について導くことができる。こうした複合の「発現ベクター」は、1)研究群にわたって有意に変化したモジュール、及び2)研究群にわたって有意に変化する、これらのモジュール内の遺伝子の選択を連続して複数回行うことによって形成する。続いて、各ベクターを形成するサブセットの転写物について得た値を平均することによって、発現レベルを導く。次いで、患者プロフィールを、これらのベクターのそれぞれについて得た発現レベルを、グラフ上(例えば、レーダープロット上)にプロットすることによって表わすことができる。したがって、最初にモジュールレベルで、次いで遺伝子レベルでの2回の選択の結果、1つのセットのベクターを得る。ベクター発現値は、ベクターを形成する転写物の平均発現値から導く構築による複合物である。
【0058】
本発明を使用すると、疾患を、モジュールレベルにおいてだけでなく、遺伝子レベルにおいても同定及び識別することが可能になる。すなわち、2つの疾患は、同一のベクター(差次的に発現した転写物の同一の割合、すなわち、同一の「方向性」)を有し得るが、それにもかかわらず、発現ベクターの遺伝子組成は、疾患に特異的であり得る。この疾患に特異的なカスタマイズ化によって、使用者が、所与のセットのマーカーの性能を、その特異性を向上させることによって最適化することが可能になる。
【0059】
モジュールの基礎としての使用は、発現ベクターを、最小量のノイズを含有する、統一性のある機能及び転写のユニットとして樹立する。さらに、本発明は、複合転写マーカーを活用する。本明細書で使用する場合、「複合転写マーカー」という用語は、個々の遺伝子をマーカーとして使用する場合に対して(これらのマーカーの複合物は、疾患に特異的であり得る)、複数の遺伝子の平均発現値(サブセットのモジュール)を指す。複合転写マーカーのアプローチは、特有である。これは、使用者が、多変数のマイクロアレイのスコアを開発して、例えば、ウイルス性、細菌性若しくはその他の感染症を有する患者における疾患の重症度を評価すること、又は本明細書に開示する発現ベクターを導くことができることによる。発現ベクターが複合体である(すなわち、転写物の組合せによって形成される)という事実は、これらのマーカーの安定性にさらに寄与する。最も重要なのは、本発明の複合モジュール式転写マーカーを使用すると、本明細書で見出された結果は、マイクロアレイのプラットフォームにわたって再現可能であることが見い出されており、したがって、これは、規制認可に関するより高い信頼性を提供する。確かに、ベクター発現値は、マイクロアレイのプラットフォームにわたって得られた優れた再現性、及び独立したセットの小児狼瘡患者において得られた検証結果が示すように、非常に安定していることが証明された。これらの結果は、重要である。これは、マイクロアレイのデータの信頼性の改善は、診療の場でのこの技術の広範な使用に向けての前提条件であるからである(例えば、アレイプラットフォームわたる再現性の確立を目指すFDA MAQCプログラムを参照)。
【0060】
本発明と共に用いるための遺伝子発現のモニタリングシステムは、制限された及び/又は基本的な数の遺伝子を有するカスタマイズされた遺伝子アレイを含むことができ、こうした遺伝子は、1又は複数の標的疾患に特異的であり、且つ/又はそれについてカスタマイズされている。通例使用される一般的な全ゲノムアレイとは異なり、本発明は、遡及的な遺伝子及びゲノムの解析のために、特異的なプラットフォームを必要とせずに、これらの一般的な汎アレイの使用を提供するだけでなく、より重要なことには、本発明は、何千個ものその他の関連性のない遺伝子を必要としない、解析のために最適な遺伝子のセットを提供するカスタマイズされたアレイの開発を提供する。現存技術を上回る、本発明の最適化されたアレイ及びモジュールの1つの確固たる利点は、財務費用(例えば、1アッセイあたりのコスト、材料、機器、時間、人員、トレーニング等)であり、より重要なことには、ほとんど大部分のデータに関連性がない、汎アレイの製造の環境コストの低減である。本発明のモジュールによって、最小の数のプローブを用いて最適なデータを提供し、一方、シグナル対ノイズの比を最大化する、簡便なカスタムアレイの設計が始めて可能になる。解析する全部の数の遺伝子を入れないことによって、例えば、膨大な量の関連性のないデータを提供する全遺伝子チップの製造の間の、ホトリソグラフィーのための何千個もの高価な白金製のマスクを製造する必要性を排除することが可能である。例えば、デジタル式の光学的な化学アレイ、ボールビーズアレイ、ビーズ(例えば、Luminex)、マルチプレックスPCR、定量的PCR、ランオンアッセイ、ノーザンブロット解析、又はさらにはタンパク質解析、例えば、ウエスタンブロット解析、2−D及び3−Dゲルタンパク質発現、MALDI、MALDI−TOF、蛍光標識細胞分取(FACS)(細胞表面若しくは細胞内)、酵素結合免疫吸着測定法(ELISA)、化学発光研究、酵素アッセイ、増殖研究、或いは市販され容易に入手できる、遺伝子発現の決定及び/又は解析のためのいずれかのその他の方法、装置及びシステムと共に、本発明の制限されたプローブのセット(複数のセット)を使用した場合には、本発明を使用して、マイクロアレイの必要性を完全に回避することが可能である。
【0061】
本発明の「分子フィンガープリンティングシステム(molecular finger printing system)」を使用して、その他の疾患及び/又は正常細胞の対照に対する、異なる細胞若しくは組織、同一の細胞若しくは組織の異なる亜集団、同一の細胞若しくは組織の異なる生理学的状態、同一の細胞若しくは組織の異なる発生の段階、又は同一組織の異なる細胞集団における発現の比較解析を、促進及び実施することができる。場合によっては、正常な又は野生型の発現データは、同時若しくはほぼ同時に解析した試料からであってもよいし、又はデータは、現存する遺伝子アレイ発現データベース、例えば、NCBI Gene Expression Omnibusデータベース等の公開データベースから入手若しくは選抜した発現データであってもよい。
【0062】
本明細書で使用される、「差次的に発現した(differentially expressed)」という用語は、2つ以上の試料、例えば、疾患の試料と正常な試料との間において異なる、細胞成分(例えば、核酸、タンパク質、酵素活性及びその他)の測定結果を指す。細胞成分は、オン若しくはオフ(存在若しくは非存在)である、参照に対して上方制御されている、又は参照に対して下方制御されている場合がある。遺伝子チップ又は遺伝子アレイと共に使用する場合には、核酸、例えば、mRNA又はその他のRNA(miRNA、siRNA、hnRNA、rRNA、tRNA等)の差次的な遺伝子発現を使用して、細胞型間又は核酸間を識別することができる。最も一般的には、細胞の転写状態の測定結果は、定量的逆転写酵素(RT)及び/又は定量的逆転写酵素−ポリメラーゼ連鎖反応(RT−PCR)、ゲノム発現解析、翻訳後解析、ゲノムDNAに対する修飾、転座、インサイツハイブリダイゼーション並びにその他によって得られる。
【0063】
いくつかの病的状態の場合、特に病的状態の早期のレベルにおいては、細胞性の又は形態学的な差を同定することが可能である。本発明は、細胞自体の遺伝子のモジュール、又はより重要なことには、通常の生理学的な状況の範囲内で、すなわち、免疫活性化、免疫寛容又はさらには免疫アネルギーの間に作用している免疫エフェクター細胞からの遺伝子の細胞性RNA発現のモジュールに注目することによって、特異的な変異又は1種若しくは複数の遺伝子を同定する必要性を回避する。遺伝子の変異の結果、一群の遺伝子の発現レベルの劇的な変化に至る場合があるが、生物学的な系はしばしば、変化を、その他の遺伝子の発現を変化させることによって代償する。こうした内在的な代償応答の結果として、多くの動揺が、系の観察可能な表現型に対しては、最小の影響しか及ぼさないが、細胞成分の組成に対しては、多大な影響を及ぼす場合がある。同様に、遺伝子転写物の実際のコピーには増減があり得ないが、転写物の寿命又は半減期が影響を受けて、タンパク質生成の大幅な増加に至る場合もある。本発明は、実際のメッセージを検出する必要性を、一実施形態では、単一のメッセージ及び/又は変異ではなく、エフェクター細胞(例えば、白血球、リンパ球及び/又はそれらの亜集団)に注目することによって排除する。
【0064】
当業者であれば、試料を、例えば、単一細胞、細胞、組織、細胞培養物のコレクション、及びその他をはじめとする、多様な源から得ることができることを容易に理解するであろう。特定の場合には、例えば、尿、血液、唾液、組織、生検の試料及びその他の中に見い出される細胞から、十分なRNAを単離することさえ可能である。特定の状況では、十分な細胞及び/又はRNAを、粘膜分泌物、糞便、涙液、血漿、腹水、間質液、硬膜内、脳脊髄液、汗又はその他の体液から得ることができる。例えば、組織又は細胞の源からの核酸源として、組織生検試料、1種若しくは複数の分取細胞集団、細胞培養物、細胞のクローン、形質転換細胞、生検又は単一細胞が挙げられる。組織源として、例えば、脳、肝臓、心臓、腎臓、肺、脾臓、網膜、骨、ニューロン、リンパ節、内分泌腺、生殖器官、血液、神経、血管組織及び嗅上皮が挙げられる。
【0065】
本発明は、以下の基本的な成分、すなわち、1つ若しくは複数のデータマイニングのアルゴリズム;1種若しくは複数のモジュールレベルの解析プロセス;血液白血球の転写モジュールの特徴付け;ヒト疾患の分子による診断/予後診断のための多変数解析における一括したモジュール式のデータの使用;及び/又はモジュールレベルのデータ及び結果の可視化を含み、これらは、単独で又は組み合せて使用することができる。本発明を使用すると、複合転写マーカーを開発及び解析することもまた可能である。複合転写マーカーは、単一の多変数のスコアにさらに一括することができる。
【0066】
本発明者らは、現在のマイクロアレイの基づいた研究が、「雑音」が高いことで悪名高いデータの解析に関して深刻な難問に直面していることを認識している。すなわち、データは、解釈することが困難であり、実験室間及びプラットフォーム間で良好に比較できない。マイクロアレイのデータの解析のための広く受け入れられているアプローチでは、研究群間で差次的に発現したサブセットの遺伝子の同定から始まる。次に、使用者は続いて、パターン発見アルゴリズムを使用して、得られた遺伝子のリストと、現存する科学知識との「つじつまを合わせ」ようとする。
【0067】
プラットフォームにわたる大きな変動性を取扱うのではなく、本発明は、解析の早期における生物学的に関連性のある遺伝子の選択を強調した戦略の開発に至った。手短にいうと、この方法は、所与の生物学的な系を特徴付ける転写成分を同定するステップを含む。この系について、協調的に発現した遺伝子のグループ又は転写モジュールを、データの大きなコレクションから解析及び抽出するための改善されたデータマイニングのアルゴリズムを開発した。
【0068】
本明細書に記載するバイオマーカー発見戦略は、地球規模で得られたマイクロアレイのデータの開拓に特に良好に適合する。約44,000個の転写物から開始し、約5000個の転写物で構成される28種のモジュールの1つのセットを定義した。次いで、複数のセットの疾患に特異的な複合発現ベクターを導いた。ベクター発現値(発現ベクター)は、マイクロアレイのプラットフォームにわたって得られた優れた再現性が示すように、非常に安定していることが証明された。マイクロアレイのデータの信頼性の改善は、診療の場でのこの技術の広範な使用に向けての前提条件であるから、この知見は、注目に値する。最後に、続いて、発現ベクターを組み合せて、特有の多変数スコアを得、したがって、大方の診療に対応できる形態で結果を供給することができる。興味深いことに、多変数スコアは、個々のマーカーの変化ではなく、変化の全体的なパターンを概括する。そのような「全体的なバイオマーカー」の開発を、診断及び薬理ゲノミクスの両方の分野で使用することができる。
【0069】
一実施例では、4742個のプローブのセットを再グループ化する28種の転写モジュールを、239個の血液白血球の転写プロフィールから得た。これらのモジュールを形成する遺伝子間の機能の収束が、文献プロファイリングを通して実証された。第2ステップは、転写システムの動揺を、モジュール単位で研究することからなった。この概念を説明すると、健常なボランティア及び患者から得た白血球転写プロフィールを、入手して、比較及び解析した。この遺伝子のフィンガープリンティング戦略のさらなる検証を、公開されているマイクロアレイのデータセットの解析を通して得た。注目すべきことに、先在するデータを使用した本発明のモジュール式の転写の装置、システム及び方法は、2つの市販のマイクロアレイのプラットフォームにわたり高度な再現性を示した。
【0070】
本発明は、転写システムのモジュール式解析のために設計された広く適用可能な、2段階のマイクロアレイのデータマイニング戦略の実行を含む。この新規のアプローチを使用して、血液白血球の転写サインを特徴付けた。血液白血球は、臨床的に関連性のある情報の最も入手しやすい源である。
【0071】
本明細書で実証するように、たとえ2つの疾患についてのベクターが同一(+/+)、例えば、SLE及びFLUの両方について、M1.3=53%低下であっても、2種のベクターに基づいて、2つの疾患間の差を決定及び/又は区別することが可能である。これは、それにもかかわらず、各ベクターの組成を使用して、それらの疾患を判別することができるからである。例えば、差次的に発現した転写物の割合及び方向性が、M1.3については、2つの疾患の間では同一である場合であっても、遺伝子組成は、それにもかかわらず、疾患に特異的であり得る。遺伝子レベルの解析とモジュールレベルの解析との組合せは、分解能をかなり増加させることができる。さらに、疾患を判別するために、2、3、4、5、10、15、20、25又は28種以上のモジュールを使用することもできる。
【0072】
「遺伝子」という用語は、ポリペプチド(例えば、)、前駆体又はRNA(例えば、mRNA)の産生に必要なコード配列を含む核酸(例えば、DNA)の配列を指す。ポリペプチドは、完全長のコード配列によってコードされても、又は完全長若しくは断片の所望の活性若しくは機能特性(例えば、酵素活性、リガンド結合性、シグナル伝達、免疫原性等)が保持される限り、コード配列のいずれかの部分によってコードされてもよい。この用語はまた、構造遺伝子のコード領域、並びに5’末端上及び3’末端上の両方でコード領域に隣接して存在する、各末端上で約2kb以上の距離にわたる配列も包含し、したがって、遺伝子は、完全長のmRNA及び遺伝子の転写特性に影響を与える5’制御配列の長さに対応する。コード領域の5’に位置し、mRNA上に存在する配列は、5’非翻訳配列と呼ばれる。5’非翻訳配列は、通常、制御配列を含有する。コード領域の3’又は下流に位置し、mRNA上に存在する配列は、3’非翻訳配列と呼ばれる。「遺伝子」という用語は、遺伝子のcDNAの形態及びゲノムの形態の両方を包含する。ゲノムの形態又は遺伝子のクローンは、「イントロン」又は「介在領域」又は「介在配列」と呼ばれる非コード配列が割り込むコード領域を含有する。イントロンは、核内RNA(hnRNA)に転写される、遺伝子のセグメントである。イントロンは、エンハンサー等の制御エレメントを含有する場合がある。イントロンは、核内又は一次の転写物から除去又は「スプライシングで切り出」される。したがって、イントロンは、メッセンジャーRNA(mRNA,messenger RNA)の転写物中には存在しない。このmRNAは、翻訳の間に機能し
て、新生ポリペプチド中の配列又はアミノ酸の順番を特定する。
【0073】
本明細書で使用される、「核酸」という用語は、これらに限定されないが、DNA、cDNA及びRNAをはじめとする、いずれかの核酸を含有する分子を指す。特に、「表X中の遺伝子」という用語は、本明細書中以下に見い出されるように、特定の表中に列挙する少なくとも一部又は完全長の配列を指す。遺伝子は、ゲノムの形態として見い出す又は検出することもできる。すなわち、遺伝子は、1又は複数のイントロンを含む。遺伝子のゲノムの形態はまた、RNA転写物上に存在する、コード配列の5’末端上及び3’末端上の両方に位置する配列も含む。これらの配列を、「隣接」配列又は「隣接」領域と呼ぶ。5’隣接領域は、遺伝子の転写を制御する又はそれに影響を及ぼすプロモーター及びエンハンサー等の制御配列を含有する場合がある。3’隣接領域は、転写終結、転写後の切断、mRNAの安定性及びポリアデニル化に影響を及ぼす配列を含有する場合がある。
【0074】
本明細書で使用される、「野生型」という用語は、天然に存在する源から単離した遺伝子又は遺伝子産物を指す。野性型遺伝子は、集団中で最も頻繁に観察される遺伝子であり、したがって、遺伝子の「正常な」又は「野生型の」形態として恣意的に呼ばれる。対照的に、「改変された」又は「変異の」という用語は、野生型の遺伝子又は遺伝子産物と比較して、配列及び/又は機能特性における改変(すなわち、変化した特徴)を示す遺伝子又は遺伝子産物を指す。天然に存在する変異体を単離することができることに注目されたい。これらは、野生型の遺伝子又は遺伝子産物と比較して、(変化した核酸配列をはじめとする)変化した特徴を有するという事実によって同定される。
【0075】
本明細書で使用される、「多型」という用語は、希有な対立遺伝子の頻度が、再発性の変異単独によって説明できる場合を超えた(典型的には1%超)、単一の異種交配集団における遺伝子の2つ以上の対立遺伝子の定型的な同時発生を指す。
【0076】
本明細書で使用される、「をコードする核酸分子」、「をコードするDNA配列」及び「をコードするDNA」、という用語は、デオキシリボ核酸の鎖に沿ったデオキシリボヌクレオチドの順番又は配列を指す。こうしたデオキシリボヌクレオチドの順番が、ポリペプチドタンパク質の鎖に沿ったアミノ酸の順番を決定する。したがって、DNA配列は、アミノ酸配列をコードする。
【0077】
本明細書で使用される、「相補的な」又は「相補性」という用語は、塩基対合則によって関係付けられたポリヌクレオチド(すなわち、ヌクレオチド配列)に関して使用する。例えば、配列「A−G−T」は、配列「T−C−A」に相補的である。相補性は、「部分的」である場合があり、この場合には、核酸の塩基のうちのいくつかのみが、塩基対合則に従ってマッチする。或いは、核酸間に「完全」又は「全体的」な相補性が存在する場合がある。核酸の鎖間の相補性の程度は、核酸の鎖間のハイブリダイゼーションの効率及び強度に対して顕著な影響を及ぼす。これは、増幅反応、及び核酸間の結合に依存する検出方法において、特に重要である。
【0078】
本明細書で使用すされる、「ハイブリダイゼーション」という用語は、相補的な核酸の対形成に関して使用する。ハイブリダイゼーション及びハイブリダイゼーションの強度(すなわち、核酸間の結合の強度)は、核酸間の相補性の程度、関与する条件のストリンジェンシー、形成したハイブリッドのTm及び核酸内のG:Cの比等の要因によって影響を受ける。相補的な核酸の対形成をその構造内に含有する単一分子は、「自己ハイブリダイズした」といわれる。
【0079】
本明細書で使用される、「ストリンジェンシー」という用語は、核酸ハイブリダイゼーションを行う、温度、イオン強度、及び有機溶媒等のその他の化合物の存在の条件に関して使用する。「低いストリンジェンシーの条件」下では、注目する核酸配列は、その的確な相補体、単一塩基のミスマッチを有する配列、密接に関連する配列(例えば、90%以上の相同性を有する配列)、及び部分的な相同性のみを有する配列(例えば、50〜90%の相同性を有する配列)とハイブリダイズする。「中等度のストリンジェンシーの条件」下では、注目する核酸配列は、その的確な相補体、単一塩基のミスマッチを有する配列、及び密接に関連する配列(例えば、90%以上の相同性)とのみハイブリダイズする。「高いストリンジェンシーの条件」下では、注目する核酸配列は、その的確な相補体、及び(温度等の条件に依存して)単一塩基のミスマッチを有する配列とのみハイブリダイズする。すなわち、高いストリンジェンシーの条件下では、単一塩基のミスマッチを有する配列とのハイブリダイゼーションを排除するように、温度を上げることができる。
【0080】
本明細書で使用される、「プローブ」という用語は、注目する別のオリゴヌクレオチドにハイブリダイズすることができるオリゴヌクレオチド(すなわち、ヌクレオチド配列)を指し、これは、精製した制限消化物中等に天然に存在するもの、又は合成、組換え若しくはPCR増幅によって産生したもののいずれかである。プローブは、一本鎖であっても、又は二本鎖であってもよい。プローブは、特定の遺伝子配列の検出、同定及び単離において有用である。本発明で使用するいずれのプローブも、何らかの「レポーター分子」で標識することができ、それによって、プローブを、これらに限定されないが、酵素システム(例えば、ELISA及び酵素に基づいた組織化学的アッセイ)、蛍光システム、放射性システム、発光システム並びにその他をはじめとする、いずれかの検出システム中で検出することができる。本発明を、いずれかの特定の検出システム又は標識によって制限する意図はない。
【0081】
本明細書で使用される、「標的」という用語は、プライマーが結合する核酸の領域を指す。したがって、「標的」は、捜し求められて、その他の核酸配列から選抜される。「セグメント」とは、標的配列内の核酸の領域と定義する。
【0082】
本明細書で使用される、「サザンブロット法」という用語は、アガロース又はアクリルアミドのゲル上で、サイズに従ってDNAを分画するDNA解析を指す。分画後、DNAをゲルからニトロセルロース又はナイロン製膜等の固体の支持体に移す。次いで、固定化したDNAを、標識したプローブを用いて探索して、使用したプローブに相補的なDNA種を検出する。DNAを、電気泳動の前に、制限酵素で切断してよい。電気泳動後、DNAを、固体の支持体へ移動させる前又はその間に、部分的に脱プリン化及び変性させることができる。サザンブロット法は、分子生物学者の標準的な手段である(Sambrook et al., Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Press, NY, pp 9.31-9.58, 1989)。
【0083】
本明細書で使用される、「ノーザンブロット法」という用語は、アガロース上で、サイズに従ってRNAを分画するRNAの電気泳動によるRNA解析を指す。分画後に、RNAを、ゲルからニトロセルロース又はナイロン製膜等の固体の支持体へ移動させる。次いで、固定化したRNAを、標識したプローブを用いて探索して、使用したプローブに相補的なRNA種を検出する。ノーザンブロット法は、分子生物学者の標準的な手段である(Sambrook, et al., 上記, pp 7.39-7.52, 1989)。
【0084】
本明細書で使用される、「ウエスタンブロット法」という用語は、ニトロセルロース又は膜等の支持体上に固定化したタンパク質(複数のタンパク質)(又はポリペプチド)の解析を指す。タンパク質をアクリルアミドゲル上で移動させて、タンパク質を分離する。次に、タンパク質を、ゲルからニトロセルロース又はナイロン製膜等の固体の支持体へ移動させる。次いで、固定化したタンパク質を、注目する抗原に対する反応性を有する抗体に暴露させる。抗体の結合を、放射標識した抗体の使用をはじめとする、種々の方法によって検出することができる。
【0085】
本明細書で使用される、「ポリメラーゼ連鎖反応」(「PCR」)という用語は、K. B. Mullis(参照によって本明細書に組み込まれている米国特許第4683195号、第4683202号及び第4965188号明細書)の方法を指す。これは、クローニング及び精製なしで、ゲノムDNAの混合物中の標的配列のセグメントの濃度を増加させるための方法を記載している。標的配列を増幅するためのこの方法は、大過剰量の2つのオリゴヌクレオチドプライマーを、所望の標的配列を含有するDNA混合物に導入するステップと、その後、DNAポリメラーゼの存在下で正確な配列の温度サイクルを行うステップとからなる。2つのプライマーは、二本鎖標的配列のそれぞれの鎖に相補的である。増幅を起こすためには、混合物を変性させ、次いで、プライマーを、標的分子内のそれらに相補的な配列にアニールさせる。アニーリングの後、プライマーを、ポリメラーゼを用いて伸長して、相補鎖の新しい対を形成させる。高濃度の所望の標的配列の増幅されたセグメントを得るために、変性のステップ、プライマーのアニーリングのステップ及びポリメラーゼによる伸長のステップを、多数回繰り返すことができる(すなわち、変性、アニーリング及び伸長が、1回の「サイクル」を構成し;多数回の「サイクル」が存在してよい)。所望の標的配列の増幅されたセグメントの長さは、相互のプライマーの相対的な位置によって決定され、したがって、この長さは、制御可能なパラメータである。こうした過程を繰り返す態様によって、この方法は、「ポリメラーゼ連鎖反応」(以下「PCR」)と呼ばれる。標的配列の所望の増幅されたセグメントが、混合物中の(濃度に関して)主たる配列になることから、これは、「PCR増幅された」といわれる。
【0086】
本明細書で使用される、「PCR産物」、「PCR断片」及び「増幅産物」という用語は、変性、アニーリング及び伸長のPCRのステップを2サイクル以上完了した後に得られた化合物の混合物を指す。これらの用語は、1又は複数の標的配列の1又は複数のセグメントが増幅されている事例を包含する。
【0087】
本明細書で使用される、本明細書で使用するように「リアルタイムPCR」という用語は、増幅を、反応完了後ではなく、反応の間に測定する種々のPCRの適用例を指す。本発明のリアルタイムPCRの実施形態における使用に適した試薬は、これらに限定されないが、TaqManプローブ、分子ビーコン、Scorpionsプライマー又は二本鎖DNA結合色素を含む。
【0088】
本明細書で使用すされる、「転写上方制御」、「過剰発現」及び「過剰発現した」という用語は、DNA鋳型を使用するRNAポリメラーゼによるRNA合成の増加を指す。例えば、本発明の方法に関して使用する場合、「転写上方制御」という用語は、SLEに罹患した恐れのない個人から得た試料中に検出された、注目する遺伝子に対応するmRNAの量と比較して、SLEに罹患した恐れのある個人から得た試料中に検出された、注目する遺伝子に対応するmRNAの量が、約1倍、2倍、2〜3倍、3〜10倍及びさらには10倍超増加することを指す。しかし、システム及び評価は、十分に特異的であり、2倍未満の検出すべき発現の変化が必要であるに過ぎない。さらに、発現の変化は、細胞レベルであり得(単一細胞若しくは細胞集団内の発現の変化)、又は遺伝子を発現している細胞の数に変化がある場合には、組織レベルで評価することさえできる。組織の解析に照らした、遺伝子発現の変化は、遺伝子活性の調節又は細胞成分の相対的な変化のいずれかに起因させることができる。特に有用な差は、統計的に有意である差である。
【0089】
一方、「転写下方制御」、「過小発現」及び「過小発現した」という用語は、互換的に使用し、DNA鋳型を使用するRNAポリメラーゼによるRNA合成の減少を指す。例えば、本発明に関して使用する場合、「転写下方制御」という用語は、SLEに罹患した恐れのない個人から得た試料中に検出された、注目する遺伝子に対応するmRNAの量と、又は野生型及び/若しくは正常な対照、例えば、線維筋痛症に関する情報のデータベースと比較して、SLEに罹患した恐れのある個人から得た試料中に検出された、注目する遺伝子に対応するmRNAの量が、少なくとも1倍、2倍、2〜3倍、3〜10倍及びさらには10倍超減少することを指す。ここでも、システム及び評価は、十分に特異的であり、2倍未満の検出すべき発現の変化が必要であるに過ぎない。特に有用な差は、統計的に有意である差である。
【0090】
転写「上方制御/過剰発現」及び転写「下方制御/過小発現」の両方はまた、注目する遺伝子に対応する翻訳産物又はタンパク質のレベルの測定を通して間接的にモニターすることができる。本発明は、転写の上方制御及び下方制御に関する、いかなる所与の機構にも制限されない。
【0091】
本明細書で使用される、「真核細胞」という用語は、膜結合性の、構造的に別々の核及びその他の良好に発生した細胞内区画を有する細胞又は生物体を指す。真核生物は、ウイルス、細菌及びラン藻を除く全ての生物体を含む。
【0092】
本明細書で使用される、「インビトロ転写」という用語は、生存している細胞又は生物体の外で行われる、プロモーターを含有する精製したDNA鋳型、リボヌクレオチド三リン酸、還元剤とカチオン、例えば、DTT及びマグネシウムイオンとを含む緩衝系、並びに適切なRNAポリメラーゼを含む、転写反応を指す。
【0093】
本明細書で使用される、「増幅試薬」という用語は、プライマー、核酸鋳型及び増幅酵素以外の増幅に必要な試薬(デオキシリボヌクレオチド三リン酸、緩衝液等)を指す。典型的には、増幅試薬は、その他の反応成分と一緒にして、反応槽(試験管、マイクロウエル等)中に入れて収容する。
【0094】
本明細書で使用する場合、「診断」という用語は、疾患の症例の性質の決定を指す。本発明のいくつかの実施形態では、感染症の源である感染性病原体又は病原体の決定を可能にする診断を実施するための方法を提供する。特定の実施形態では、本発明の解析は、病的状態、例えば、自己免疫疾患、自己炎症性疾患、癌、移植片拒絶、ウイルス感染、細菌感染、寄生虫様又は寄生虫感染及びその他の性質の決定のために、関連部分が参照によって本明細書に組み込まれている同時係争中の特許出願第60748884号、第11446825号及び第_____号明細書の1又は複数のモジュールと組み合せることができる。
【0095】
本発明を、単独で又は疾患治療と組み合せて使用して、疾患の進行及び/又は患者管理をモニターすることができる。例えば、患者を1回又は複数回試験して、最良の治療コースを決定する、治療が意図する医学的な効果を有しているか否か、患者が特定の治療の候補であるか否か、及びそれらの組合せを決定することができる。当業者であれば、発現ベクターのうちの1又は複数が、1又は複数の疾患を示すことができ、急性にしろ、慢性にしろ、その他の状態の影響を受ける場合があることを認識するであろう。
【0096】
本明細書で使用される、「遺伝薬理学試験」という用語は、例えば、薬物の吸収及び体内動態(薬物動態)又は薬物の作用(薬力学)に関係するDNA配列中の個人間の変化を研究することを意図するアッセイを指す。こうした変化は、例えば、トランスポーター、代謝酵素、受容体及びその他のタンパク質の機能をコードする、1又は複数の多型の変化を含むことができる。
【0097】
本明細書で使用される、「薬理ゲノミクス試験」という用語は、全ゲノム又は候補遺伝子中の個人間の変化、例えば、一塩基多型(SNP,single-nucleotide polymorphism)地図又はハプロタイプマーカー、及び薬理学的機能及び治療応答と相関する場合がある遺伝子の発現又は不活性化変化を研究するために使用するアッセイを指す。
【0098】
本明細書で使用される、「発現プロフィール」は、複数の細胞成分の存在比の測定結果を指す。そのような測定結果として、例えば、RNA又はタンパク質の存在量又は活性レベルが挙げられる。発現プロフィールは、例えば、転写状態又は翻訳状態の測定結果であり得る。関連部分が参照によって本明細書に組み込まれている米国特許第6040138号、第5800992号、第6020135号、第6033860号明細書を参照されたい。遺伝子発現のモニタリングシステムは、核酸プローブアレイ、膜ブロット(例として、ノーザン、サザン、ドット及びその他等のハイブリダイゼーション解析中で使用されるもの)、又はマイクロウエル、試験管、ゲル、ビーズ若しくは繊維(若しくは結合した核酸を含む何らかの固体の支持体)を含む。例えば、関連部分が参照によって本明細書に組み込まれている米国特許第5770722号、第5874219号、第5744305号、第5677195号及び第5445934号明細書を参照されたい。遺伝子発現のモニタリングシステムまた、溶液中の核酸プローブを含むこともできる。
【0099】
本発明による遺伝子発現のモニタリングシステムを使用して、異なる細胞若しくは組織、同一の細胞若しくは組織の異なる亜集団、同一の細胞若しくは組織の異なる生理学的状態、同一の細胞若しくは組織の異なる発生の段階、又は同一組織の異なる細胞集団における発現の比較解析を促進することができる。
【0100】
本明細書で使用する場合、「差次的に発現した」という用語は、2つ以上の試料において異なる細胞成分の測定結果を指す。細胞成分は、参照と比較して、試験試料中で上方制御される、又は1又は複数の参照と比較して、試験試料中で下方制御されるのいずれかであることができる。差次的な遺伝子発現はまた、細胞型間又は核酸間を識別するために使用することもできる。関連部分が参照によって本明細書に組み込まれている米国特許第5800992号明細書を参照されたい。
【0101】
治療又は治療計画:病的状態を緩和する又は変化させるために、治療又は治療計画がしばしば始められる。本明細書で使用する場合、治療又は治療計画は、疾患の影響又は症状を低減又は除去することを意図する治療コースを指す。治療計画は、これらに限定されないが、典型的には、1又は複数の薬物の処方された用量又は手術を含む。治療は、理想的には、有益であり、病的状態を低減するが、多くの場合、治療の効果が、望まれない影響もまた有する。治療の効果はまた、試料の生理学的な状態によっても影響を受ける。
【0102】
本明細書で使用される、「薬学的状態」又は「薬学的状況」という用語は、試料中の1又は複数の核酸の薬学的状態に影響を及ぼすことができる1又は複数の薬物、手術及びその他を用いて、今後治療する、現在治療している及び/又は過去に治療した試料、例えば、薬学的介入の結果として、新たに転写した、安定化した又は不安定化した試料を指す。試料の薬学的状態は、薬物治療の前、間及び/又は後の生物学的状況の変化に関係し、本明細書で教示するように、診断又は予後診断の機能として役立つ場合がある。薬物治療又は手術の後のいくつかの変化は、病的状態と関連がある場合もあれば、且つ/又は治療に関係がない副作用である場合もある。薬学的状態の変化は、治療期間、処方された薬物の型及び用量、所与の治療コースの服薬遵守の程度、並びに/又は摂取した処方されていない薬物の起こり得る結果である。
【0103】
各病原体が、特異的なパターン認識受容体(PRR)と相互作用して、Pathogen Associated Molecular Patterns(PAMP)の特有の組合せを表わすので、本発明は、急性感染を有する患者の末梢血液から単離した白血球が特有の転写のサインを保有するか否かを決定した。保有するのであれば、病原体の識別が可能になる。この仮説を試験するために、i)A型インフルエンザ、RNAウイルス;(ii)黄色ブドウ球菌(Staphylococcus aureus);及びiii)肺炎連鎖球菌(Streptococcus pneumoniae)、2種のグラム陽性細菌;並びに(iv)大腸菌(Escherichia coli)、グラム陰性細菌の4種の一般的なヒト病原体によって引き起こされた急性感染を有する患者からの血液白血球中の遺伝子発現パターンを解析した。
【0104】
【表2】







【0105】
【表3】

【0106】
【表4】

【0107】
【表5】

【0108】
患者の特徴。大腸菌感染を有する29人の患者、黄色ブドウ球菌感染を有する51人の患者、肺炎連鎖球菌感染を有する25人の患者、及びA型インフルエンザ感染を有する36人の患者からのPBMC。合併症及びそれに付随する治療が、年齢が上の成人より少ないことから、我々は、若年の患者を選んだ。免疫抑制が内在する患者、副腎皮質ステロイドをはじめとする、免疫調節治療を投与されている患者、又は顕著な慢性の医学的問題を有する患者は、除外した。採血時の入院期間の中央値(範囲)は、3日(0〜9日)間であり、症状の持続時間の中央値(範囲)は、6日(2〜22日)間であった。臨床診断は、急性呼吸器感染、菌血症、局所性膿瘍、骨及び関節の感染、尿路感染、並びに髄膜炎を含んだ(表1)。患者を、標準的な病院のプロトコールに従って治療し、したがって、救急部では、抗菌剤治療を即座に開始した。
【0109】
段階的なデータ解析の戦略。急性感染を有する患者から単離した血液白血球が、病原体の型の間の識別を可能にする遺伝子発現のサインを保有するか否かを決定するために、段階的な解析を行った。(1)統計的な群の比較:差次的に発現した遺伝子を、非パラメトリックなマンホイットニーの検定を使用した対比較において同定した。階層的なクラスタリングによって、遺伝子を、その発現レベルに従って順序付けると、2つの群の間の相反性の発現パターンが明らかとなった。(2)試料の分類:2つの群の患者を識別することができる遺伝子、すなわち、分類指標を、同程度の年齢の範囲にあり、類似の抗菌剤で治療した患者群(トレーニングセット)の比較を通して同定した。次いで、これらの遺伝子を、同一セットの患者内で、一点除外交差検証スキームにおいて評価した。(3)分類指標遺伝子の独立した検証:同一の遺伝子を、独立した群の患者(試験セット)を分類する能力について試験した。潜在的な交絡因子を回避するために、分類指標遺伝子の同定のために使用したトレーニングセットに含んだ患者を、非常に注意深く選択した。こうした注意深い選択の後、次いで、分類指標遺伝子(また、転写マーカーとも記載する)を、新しい群の患者において評価した。この群は、不均一であり、したがって、現実の臨床状況により近かった(試験セット)。(4)マイクロアレイのプラットフォームにわたる独立した検証:次いで、結果を、別の独立したセットの患者において、異なるマイクロアレイのプラットフォーム(Illumina BeadChip)を使用してさらに評価した。
【0110】
転写のサインが、A型インフルエンザ感染を有する患者を、細菌感染を有する患者と識別する。インフルエンザ感染又は細菌感染のいずれかを有する患者からの試料間で差次的に発現した遺伝子を同定するために、A型インフルエンザ感染を有する11人の患者、及び大腸菌感染又は肺炎連鎖球菌感染を有する12人の患者を、トレーニングセットとして、類似の年齢群及び抗生物質のクラスの治療に基づいて選択した。A型インフルエンザ感染トレーニング群と細菌感染トレーニング群との間には、年齢の中央値[範囲](11月[1〜20月]齢対4月[2月〜23月]齢;P=0.22;)、又は試料収集までの入院日数(2日[1〜2日]対2.5日[2〜5日]、P=0.06)における有意な差はなかった。A型インフルエンザ感染を有する11人の患者の全てが、一方、細菌感染群では12人中10人が、βラクタム抗生物質を投与されていた(P=0.16)。これら2つの群からのPBMC中の好中球、リンパ球及び単核球の相対的な割合における統計的な有意な差はなかった(補足表1)。
【0111】
A型インフルエンザ感染を有する患者と細菌感染を有する患者との群の統計的な比較から、854種の差次的に発現した遺伝子を得た(P<0.01)(補足表2)。このうち、394種が、A型インフルエンザ感染において相対的に過剰発現し、一方、460種が細菌感染において過剰発現した。A型インフルエンザを有する患者は、ミクソウイルス耐性遺伝子(MX1、MX2);2’−5’−オリゴアデニル酸シンテターゼ(OAS(oligoadenylate synthetase)1、OAS2);GBP1(guanylate binding protein 1)(グアニル酸結合タンパク質1);及びGIG5(ビペリン、ウイルス阻害性タンパク質、小胞体関連、インターフェロン誘導型)等の抗ウイルス分子をコードする遺伝子をはじめとする、顕著なI型インターフェロン(IFN,interferon)のサインを示した(図1a)。転写及び翻訳を調節する遺伝子が、細菌感染群においてより高いレベルで発現した460種のプローブセットのうちの25%までを占める。
【0112】
k−NNアルゴリズムが、急性インフルエンザ感染を有する患者を急性細菌感染と識別する35種の遺伝子を同定した(図2、表2及び補足表3)。このトレーニングセットの一点除外交差検証は、23個の試料のうちの21個を、A型インフルエンザ感染群又は細菌感染群のいずれかに正確に分類した(91%の正確度)(図1b)。
【0113】
次いで、同定した分類指標遺伝子の、A型インフルエンザ感染を細菌感染と識別する能力を、独立したセットの試料(試験セット)を用いて検証した。第1の試験セットの患者は、A型インフルエンザ感染を有する7人の新しい患者、及び細菌感染を有する30人の患者(肺炎連鎖球菌感染を有する7人及び大腸菌感染を有する23人)を含んだ。患者を、試験セットに、年齢及び抗生物質治療の型を問わず含めた(年齢[範囲];A型インフルエンザ、4歳[3週〜36歳]齢;大腸菌、2月[2週〜16歳]齢)。予測遺伝子が、37個の試料のうちの35個を正確に分類した(95%の正確度)(図1c)。1つの試料(INF48)は、誤って分類され、1つの試料は、分類できなかった(INF120)。
【0114】
次いで、35個の分類指標遺伝子を、A型インフルエンザ感染を有する7人の患者及び黄色ブドウ球菌感染を有する31人の患者からなる第2の試験セットにおいて評価し、識別の87%の正確度を得た(図1d)。試験セットを、年齢及び抗生物質治療の型を問わず再度選択した(年齢[範囲];A型インフルエンザ、4歳[3週〜36歳]齢;黄色ブドウ球菌、7歳[3月〜15歳]齢)。5つの黄色ブドウ球菌試料が、誤って分類された(INF62、INF70、INF89、INF221及びINF242)。
【0115】
細菌感染を有する患者の約3分の1が、インターフェロン関連遺伝子の上昇した発現レベルを示した。しかし、このサインは、分類の結果に対して、限られた影響しか及ぼさなかった。これは、細菌感染を有する患者から得た試料が、インフルエンザ感染に特徴的な、相反性の発現サイン(細菌感染と比較して、インフルエンザにおいては過小発現した遺伝子)を欠いたからであり、またひとつには、インターフェロン誘導型遺伝子の発現レベルが、細菌感染の状況では、より低かったからでもある(図1c)。インターフェロン誘導型遺伝子の上昇した発現レベルの原因は、立証されている細菌感染自体(Hoebe, K., and B. Beutler. 2004. LPS, dsRNA and the interferon bridge to adaptive immune responses: Trif, Tram, and other TIR adaptor proteins. J Endotoxin Res 10:130-136)、又は診断されていない若しくは以前のウイルス感染に対する応答である可能性がある。したがって、インフルエンザ感染及び細菌感染に対する宿主応答の転写のサインを同定することができる。こうしたサインは、これらの原因病原体間の識別を可能にする。
【0116】
転写のサインが、大腸菌感染を有する患者を、黄色ブドウ球菌感染を有する患者と識別する。大腸菌感染を有する患者と黄色ブドウ球菌感染を有する患者との間で差次的に発現した遺伝子を同定するために、各群10人の患者を、トレーニングセットとして選択した。大腸菌感染トレーニング群と黄色ブドウ球菌感染トレーニング群との間には、年齢の中央値[範囲](2月[3.5月〜16歳]齢対12月[4月〜10歳]齢;P=0.06;)における有意な差はなかった。各群は、βラクタム抗生物質を用いて治療された6人の患者及びその他の抗生物質のクラスを用いて治療された4人の患者を含んだ。これらの2つの群の間では、全末梢白血球数及び末梢血液細胞の型の相対的な割合が、有意に異なることはなかった(補足表1)。試料収集までの入院日数の中央値は、大腸菌群の場合2日、及び黄色ブドウ球菌群の場合4日であり(P=0.01)、 有意な差を示し、これは、微生物学的な確定診断のために典型的に必要な時間間隔で説明することができる。
【0117】
群の統計的な比較から、有意に異なる発現レベルを有する211種の遺伝子を得た(P<0.01);(補足表4及び図3a)。選択した遺伝子の発現レベルを、リアルタイムPCRによって独立に確認した(図3d及び3e)。大腸菌と比較して黄色ブドウ球菌において過剰発現したいくつかの遺伝子は、CXCL1(CXCケモカインリガンド1、GRO−1)及びPPIB(シクロフィリンB)等の化学誘引物質分子をはじめとする、好中球の活性と関係がある(Yurchenko, V., M. O'Connor, W.W. Dai, H. Guo, B. Toole, B. Sherry, and M. Bukrinsky. 2001. CD147 is a signaling receptor for cyclophilin B. Biochem Biophys Res Commun 288:786-788、Geiser, T., B. Dewald, M.U. Ehrengruber, I. Clark-Lewis, and M. Baggiolini. 1993. The interleukin-8-related chemotactic cytokines GRO alpha, GRO beta, and GRO gamma activate human neutrophil and basophil leukocytes. J Biol Chem 268:15419-15424)。さらに、マトリックスメタプロテイナーゼ9(MMM9、matrix metalloproteinase 9)は、好中球の血管外遊走及び遊走において重要な役割を担い(Nagaoka, I., and S. Hirota. 2000. Increased expression of matrix metalloproteinase-9 in neutrophils in glycogen-induced peritoneal inflammation of guinea pigs. Inflamm Res 49:55-62);PRG1(分泌顆粒プロテオグリカン1)は、ヒト好中球中での顆粒タンパク質のパッケージングに関与し(Niemann, C.U., J.B. Cowland, P. Klausen, J. Askaa, J. Calafat, and N. Borregaard. 2004. Localization of serglycin in human neutrophil granulocytes and their precursors. J Leukoc Biol 76:406-415);ALOX5APは、アラキドン酸5−リポキシゲナーゼを
活性化し、好中球のロイコトリエンを合成する能力を延長させる(Pouliot, M., P.P. McDonald, P. Borgeat, and S.R. McColl. 1994. Granulocyte/macrophage colony-stimulating factor stimulates the expression of the 5-lipoxygenase-activating protein (FLAP) in human neutrophils. J Exp Med 179:1225-1232)。最後に、好中球は、最近に
なって、黄色ブドウ球菌感染モデルにおけるS100A8及びS100A9(カルグラニュリンA及びB、別名MRP8及び14)の主たる源として同定されている(Herndon, B.L., S. Abbasi, D. Bennett, and D. Bamberger. 2003. Calcium-binding proteins MRP 8 and 14 in a Staphylococcus aureus infection model: role of therapy, inflammation, and infection persistence. J Lab Clin Med 141:110-120)。これらの結果は、好中球の活性が、部分的には、大腸菌感染を有する患者から得た試料と黄色ブドウ球菌感染を有する患者から得た試料との間の遺伝子発現レベルの差を説明することができることを示唆している。全身性エリテマトーデス(SLE,systemic lupus erythematosus)を有する患者における以前の研究では、類似のサインが、密度勾配遠心分離の間に単核球と同時に精製された、低密度の未熟な好中球の存在に由来することが突き止められた(Bennett, L., A.K. Palucka, E. Arce, V. Cantrell, J. Borvak, J. Banchereau, and V. Pascual. 2003. Interferon and granulopoiesis signatures in systemic lupus erythematosus blood. J Exp Med 197:711-723)。興味深いことに、より迅速な好中球の代謝回転速度に対応する、この「顆粒球生成のサイン」はまた、SLEを有する患者中の全血から得た発現プロフィールにおいても観察することができる(未公開の観察)。
【0118】
大腸菌感染を有する患者のトレーイングセットと黄色ブドウ球菌感染を有する患者のトレーイングセットとを識別する30種の分類指標遺伝子を同定した(図4及び表3並びに補足表6)。一点除外交差検証において、20個の試料のうちの19個が、正確に分類された(95%の正確度)(図3bもまた参照)。黄色ブドウ球菌感染を有する1人の患者(INF89)は、誤って分類された。分類指標遺伝子を、独立したセットの黄色ブドウ球菌感染を有する患者(n=21)及び大腸菌感染を有する患者(n=19)を用いて検証した。これらの患者は、年齢及び抗生物質治療の型を問わず再度選択した(黄色ブドウ球菌:9歳[10月〜18歳]齢;大腸菌:2月[2週〜5月]齢)。30種の遺伝子が、40個の試料のうちの34個を正確に分類した(85%の正確度;図3c)。2つの試料(INF175及びINF206)が、誤って分類され、4つの試料(INF168、INF220、INF281及びINF315)は、分類できなかった。誤って分類する特異的なパターンは明らかにはならなかったが、黄色ブドウ球菌感染を有する患者が示す臨床疾患及び重症度の不均一性が大きいほど、この群に関する、より低い予測の正確さに寄与する可能性がある。
【0119】
したがって、これらの結果は、血液白血球の転写のサインが、黄色ブドウ球菌又は大腸菌によって引き起こされた急性感染を有する患者における疾患の原因を区別することを実証している。さらに、識別力のあるサインの間における顕著な機能の収束を同定した。すなわち、インターフェロン誘導型の遺伝子が、A型インフルエンザを有する患者において過剰発現した遺伝子の間に見い出され、一方、好中球に関係がある遺伝子は、大腸菌と比較して黄色ブドウ球菌においてより高いレベルで発現した。
【0120】
急性のA型インフルエンザ、大腸菌、黄色ブドウ球菌又は肺炎連鎖球菌の感染を有する患者からの試料を識別する分類指標遺伝子は、最小限の重複を示す。本発明者らは、今までに、細菌感染を有する患者と比較してA型インフルエンザ感染を有する患者、及び黄色ブドウ球菌感染を有する患者と比較して大腸菌感染を有する患者を識別する分類指標遺伝子のセットを定義してきた。分類指標遺伝子のパネルを完成させるために、追加の対比較を行って、肺炎連鎖球菌感染を有する患者を識別する遺伝子のセットを同定した。大腸菌感染群(n=11)と肺炎連鎖球菌感染群(n=11)との比較から、264種の有意に差次的に発現した遺伝子(P<0.01)、及び45種の分類指標遺伝子を得た(図4b及び4c並びに補足表7及び8)。試料のクラスは、トレーニングセットの一点除外交差検証において、22個の試料中20個について正確に割り当てられた(91%の正確度)。黄色ブドウ球菌感染群(n=12)と肺炎連鎖球菌感染群(n=11)との比較から、127種の差次的に発現した遺伝子(P<0.01)、及び34種の分類指標遺伝子を得た(図4d及び4e並びに補足表9及び10)。試料のクラスは、トレーニングセットの一点除外交差検証において、23個の試料中19個について正確に割り当てられた(83%の正確度)。
【0121】
各対比較解析について得た分類指標遺伝子のセットを、系統的に比較すると、これらのセットがほとんど相互に排他的であることが見い出される(図5a)。さらに、ある細菌の種をその他と識別した102種の遺伝子のいずれもが、A型インフルエンザを細菌感染と区別するためには必要でなかった(図5b)。したがって、複数の感染症の原因を、独立したセットの転写のサインを使用して判別することができる。
【0122】
異なる病原体によって引き起こされた急性呼吸器感染を有する患者における明確に区別できる発現パターン。同一の臨床所見を示す、混合性のコホートの患者における遺伝子発現パターンを検討した。この研究を通して同定した分類指標遺伝子のセット(図5a及び5b)を統合し、下気道感染を有するサブセットの患者(表1に列挙した27個の試料)についての発現パターンを生成するために使用した。健常なボランティアから収集した7個の試料を、参照として使用した(表1)。遺伝子及び試料の階層的クラスタリングによって、4種の原型的な発現のサインを同定した。すなわち、健常な対照を、全ての感染症群と、PBMC発現プロフィールに基づいて明確に区別することができた。分類指標を生成するために使用したトレーニングセットのいずれもが、健常なボランティアからの試料を含まなかったことから、この知見は、それ自体、注目に値する。第2のサイン(インターフェロン誘導型遺伝子をはじめとする)は、A型インフルエンザ感染を有する患者からの試料と関係があり、黄色ブドウ球菌及び肺炎連鎖球菌によって引き起こされた感染を特徴付ける第3のサイン(好中球関連遺伝子をはじめとする)とは明らかに異なった。これら2種のグラム陽性細菌の間の区別は、3種の主なクラスの試料を判別するサインの明らかな優位性によって最小化された。
【0123】
興味深いことに、A型インフルエンザ群に属する4つの試料及び黄色ブドウ球菌群からの1つの試料が、以前のサインのエレメントを組み合せた、第4のサインによって特徴付けられた(インターフェロン誘導型遺伝子及び好中球関連遺伝子:図5c、アスタリスクによって示されている)。この知見は、1)混合性のサインは、日常的な診断方法によっては検出することができなかったであろう同時感染の結果として生じる、又は2)PBMCの転写のサインの解析が、異なる患者のサブグループの存在を明らかにすることができるの、少なくとも2つの可能性のうちの1つを示唆している。より大きな患者のコホートが、これらの可能性を調査し、潜在的な臨床上の係わり合いを同定するためには必要であろう。混合性のサインを有する5人の患者の医学的な記録をさらに再調査して、肺炎の放射線学的な証拠並びにそれぞれ11%、16%及び28%のバンドを有する血液細胞の白血球百分率を示した、インフルエンザを有する3人の患者(#101、#128及び#132)を同定した。この証拠は、これら3つの症例における同時感染の可能性を示唆している。これらの結果は、差別的な血液白血球の転写パターンを、類似の症状を示す患者から得ることができることを明らかに実証している。
【0124】
結果を、新規の独立したセットの試料において、及びマイクロアレイのプラットフォームにわたって再現することができる。研究デザインは、分類指標の同定のためのトレーニングセット(図1b;インフルエンザ対細菌;n=23個の試料)、並びにこれらの知見を独立に検証するための試験セット(図1c;インフルエンザ対細菌;n=37個の試料;及び図1d;黄色ブドウ球菌に感染した追加の31人の患者)を含む。これらのデータを、全部で91人の患者から得、Affymetrix社製のU133A及びU133B GeneChipを使用して生成した。データの検証は、これらの知見をさらに確認するために、さらに別のステップをとり、追加のセットの患者について、類似の解析を、異なるマイクロアレイのプラットフォームを使用して行った。新しいコホートの、急性のインフルエンザ感染/細菌感染を有する22人の患者を募り、PBMCの試料を、最新版のAffymetrix社製のGeneChip(U133 plus 2.0)を使用して解析した。
【0125】
図9a〜9cは、マイクロアレイのプラットフォームにわたる独立した確認及び検証の概要を示す。図9aは、Affymetrix社製のU133 plus 2.0 GeneChipを使用した、急性インフルエンザを有する患者(n=10)又は細菌感染を有する患者(黄色ブドウ球菌;n=6;肺炎連鎖球菌:n=6)の新しいセットからの結果を示す。A型インフルエンザを細菌感染と識別するために使用した分類指標遺伝子(35種の遺伝子、ベン図、右;図1及び補足表3)を使用して、この新しいセットの試料をクラスタリングした。図9bでは、図9a中に含む急性呼吸器感染を有する患者からの14個の試料のサブセットを、図5からの137種の転写物のリストを使用してクラスタリングした。図9cは、別の独立したセットの試料からの結果(これらの試料はいずれも、以前の解析のいずれにおいても使用されていなかった)を、Illumina Sentrix Hu6全ゲノムBeadChipを使用して解析した、急性インフルエンザを有する患者(n=8)又は細菌感染を有する患者(黄色ブドウ球菌;n=13;肺炎連鎖球菌:n=3)の新しいセットから得たことを示す。A型インフルエンザ感染を細菌感染と識別するために使用した分類指標遺伝子(35種の遺伝子、ベン図、右;図1及び補足表3)を使用して、この新しいセットの試料をクラスタリングした。変換した発現レベルを、カラースケールによって示し、各遺伝子の全ドナーにわたる発現の中央値と比較して、赤色は、相対的に高い発現を示し、青色は、相対的に低い発現を示す。
【0126】
本発明は、黄色ブドウ球菌又は肺炎連鎖球菌によって引き起こされた感染を、インフルエンザによって引き起こされた感染とほとんど完全に区別すること(図9a;細菌感染のクラスターにグループ化された、1個のインフルエンザ試料)、並びに急性呼吸器感染を有する患者において差別的なサインを得ることができた(図9b)。マイクロアレイのデータは、全く異なるプラットフォームにわたっては比較することが困難であることで悪名高い(Chaussabel, D., R.T. Semnani, M.A. McDowell, D. Sacks, A. Sher, and T.B. Nutman. 2003. Unique gene expression profiles of human macrophages and dendritic cells to phylogenetically distinct parasites. Blood 102:672-681、Bammler T, Beyer RP, Bhattacharya S, et al. Standardizing global gene expression analysis between laboratories and across platforms. Nat Methods. 2005;2:351-356、Irizarry RA, Warren D, Spencer F, et al. Multiple-laboratory comparison of microarray platforms. Nat Methods. 2005;2:345-350、Larkin JE, Frank BC, Gavras H, Sultana R, Quackenbush J. Independenceand reproducibility across microarray platforms. Nat Methods. 2005;2:337-344))が、本発明は、新しいセットの24個の試料を、Illumina社製の全ゲノムSentrix Hu6 BeadChipを使用して解析すると、ここでも再度最初の結果を再現することができた(図9c;インフルエンザ試料と共にクラスタリングされた、細菌感染群からの1個の試料)。このコホートにおいては、黄色ブドウ球菌群又は肺炎連鎖球菌群に属する2人の患者のみが、急性呼吸器感染を示した。
【0127】
したがって、急性感染を有する患者から収集した試料上での141回を含む、148回のマイクロアレイ解析を実施した。リアルタイムPCRによって得た確認(図3d)と共に、独立したデータの検証を、マイクロアレイのプラットフォームにわたって行い、これらの知見の正確さを裏付けた。
【0128】
明確に区別できる転写のサインが、急性感染を有する患者を、自己免疫疾患を有する患者と区別する。インターフェロン誘導型遺伝子が、急性インフルエンザ感染を有する患者において過剰発現していることを見い出した。インターフェロンのサインはまた、全身性エリテマトーデスを有する患者の血液白血球中でも、以前に同定された(Bennett, L., A.K. Palucka, E. Arce, V. Cantrell, J. Borvak, J. Banchereau, and V. Pascual. 2003. Interferon and granulopoiesis signatures in systemic lupus erythematosus blood. J Exp Med 197:711-723)。次に、血液白血球中の遺伝子発現パターンが、それにもかかわらず、インフルエンザ感染とSLEとの判別を可能にするか否かを決定した。SLE患者から得た試料を、それぞれの健常な対照群と比較した。同様に、種々の感染症群からの患者を、健常なボランティアの適切なコホートと比較した(9人の健常な対照と比較して、各群11人:A型インフルエンザ、大腸菌、黄色ブドウ球菌、肺炎連鎖球菌)。それぞれの比較(全体として、5セットの患者対それらのそれぞれの対照群)について得たp値を、集めて、集合的に解析した。このアプローチは、複数の研究及び多数の試料にわたって観察された変化を概括し、特に、全ての潜在的な交絡因子を説明できない場合(例えば、SLE発生率が女性においてはるかに高い)に、非常に便利である。有意差のパターンを、インフルエンザ群に関して得た遺伝子発現のサインとSLE群に関して得た遺伝子発現のサインとの間の重複を評価するために解析した(図6)。フィルタリング基準を適用して、両群の患者において、それらのそれぞれの対照群と比較して、過剰発現又は過小発現した転写物を選択した(図6、上のパネル)。過剰発現した転写物の間では、インターフェロン誘導型遺伝子を含むクラスター(図6:上のパネル−IFN;補足表11)は、インフルエンザ群及びSLE群の両方において有意に変化するが、細菌感染を有する患者においてはそうでないことが見い出された。一方、健常な対照と比較して、一方の群では有意に変化する(FLU又はSLE、p<0.01)が、他方の群ではそうでない(p>0.5;図6、中央及び下のパネル)遺伝子を同定することもまたできた。このアプローチによって、疾患に特異的なサインが明らかになった(データを示さず)。A型インフルエンザ患者を独自に特徴付けるいくつかのクラスターを、図6及び補足表1〜11中に見い出すことができる。これらの結果は、血液白血球の転写プロフィールの動揺が疾患に特異的であることをさらに実証している。
【0129】
(32種の研究を包含する)宿主−病原体のマイクロアレイのデータベースの一覧表の比較解析が、感染に対する共通の宿主転写応答及び病原体に特異的なサインの両方を同定した(Jenner RG, Young RA. Insights into host responses against pathogens from transcriptional profiling. Nat Rev Microbiol. 2005;3:281-294)。広範な類似性が存在し、例えば、真菌感染、細菌感染又はウイルス感染の状況において観察されている免疫細胞の活性化及び動員に関与するサイトカイン及びケモカインの動的なカスケードが伴う30〜34。しかし、2つの要因:1)病原体の認識に関与する分子機構の多様性;及び2)宿主応答の病原体による変化が、感染に対する転写応答の特異性に寄与する。活性化されると、トール様受容体(TLR,Toll-like receptor)ファミリーメンバーが、転写応答の特異性を担う特有の特徴を保持する一方で、共通の成分を共有するシグナル伝達経路を引き起こす。したがって、TLR2及びTLR4によってそれぞれ認識されるグラム陽性細菌及びグラム陰性細菌に対する応答における定性的及び定量的な差が、観察されている。さらに、(TLR3を通して)インフルエンザウイルスに、(TLR4を通して)大腸菌に、且つ(TLR2/TRL4を通して)カンジダに暴露された樹状細胞中で測定した応答もまた、顕著に異なることが見い出された。宿主細胞の病原体によるリプログラミングもまた、感染に対する転写応答の多様化に顕著に寄与する。マイクロアレイによって測定されたように、マイコバクテリアの産物は、例えば、マクロファージ中のインターフェロンガンマが誘導する遺伝子の調節を阻害することができる(Pai RK, Pennini ME, Tobian AA, Canaday DH, Boom WH, Harding CV. Prolonged toll-like receptor signaling by Mycobacterium tuberculosis and its 19-kilodalton lipoprotein inhibits gamma interferon-induced regulation of selected genes in macrophages. Infect Immun. 2004;72:6603-6614)。同様に、マイクロアレイによる研究は、宿主の効果的な抗ウイルス応答を起こす能力を、多様な機構によって制限する、ヘルペスウイルス、仮狂犬病ウイルス、C型肝炎ウイルス、水痘帯状疱疹ウイルス又はライノウイルスの能力を実証している。要するに、過去何年かにわたって蓄積された非常に多数の実験データは、宿主が、感染に対して病原体に特異的な転写応答を開始することができることを示唆している。
【0130】
いくつかの研究が、異なる転写プログラムを、免疫細胞の種々の病原体へのインビボにおける暴露後に引き起こすことができることを示している(Chaussabel, D., R.T. Semnani, M.A. McDowell, D. Sacks, A. Sher, and T.B. Nutman. 2003. Unique gene expression profiles of human macrophages and dendritic cells to phylogenetically distinct parasites. Blood 102:672-681、Nau, G.J., J.F. Richmond, A. Schlesinger, E.G. Jennings, E.S. Lander, and R.A. Young. 2002. Human macrophage activation programs induced by bacterial pathogens. Proc Natl Acad Sci U S A 99:1503-1508、Boldrick, J.C., A.A. Alizadeh, M. Diehn, S. Dudoit, C.L. Liu, C.E. Belcher, D. Botstein, L.M. Staudt, P.O. Brown, and D.A. Relman. 2002. Stereotyped and specific gene expression programs in human innate immune responses to bacteria. Proc Natl Acad
Sci U S A 99:972-977、Huang, Q., D. Liu, P. Majewski, L.C. Schulte, J.M. Korn, R.A. Young, E.S. Lander, and N. Hacohen. 2001. The plasticity of dendritic cell responses to pathogens and their components. Science 294:870-875)。ここでは、血液白血球中の遺伝子発現のパターンを使用して、小児の入院の原因になる最も一般的な感染に属する、A型インフルエンザウイルス;グラム陰性細菌である大腸菌;並びにグラム陽性細菌である黄色ブドウ球菌及び肺炎連鎖球菌の4種の異なる病原体によって引き起こされる急性感染を区別することができることを実証した。
【0131】
2つのパラメータによって、血液白血球中で観察された遺伝子発現レベルの差を説明することができるであろう。すなわち、1)転写活性の変化(例えば、インターフェロン誘導型遺伝子の上方制御)、及び/又は2)血液試料の変化した細胞成分(例えば、好中球のサイン)である。これらのパラメータの1つ又は両方のいずれかによって引き起こされる発現の変化は、病原体が誘導した分子又は宿主が放出した第2の因子(例えば、サイトカイン)の作用によって直接媒介される可能性がある。異なる群の患者から得た血液試料の細胞成分に、重要な変化が観察された。確かに、診療の場では、日常的な白血球数及び白血球百分率が、ウイルス感染と細菌感染とを区別することができず、グラム陽性細菌によって引き起こされた感染とグラム陰性細菌によって引き起こされた感染はいっそう区別することができないことが十分に確立されている。しかし、本発明は、PBMC調製物中に存在する低密度の好中球の増強された流出によって引き起こされる全身性エリテマトーデスにおける好中球のサインによって例証されるように、微妙な差が、観察された転写のサインを説明し得るであろうことを見い出すに至った。疾患の関与する部位もまた、血液白血球中で観察された発現プロフィールに影響を及ぼす可能性があり、異なる感染部位に関する、特定の種の病原体の偏向を反映する。例えば、大腸菌は、尿路感染を引き起こす可能性がより高く、一方、黄色ブドウ球菌の最も一般的な臨床所見は、皮膚/軟組織の感染及び骨髄炎である。しかし、本発明で得られた結果は、明確に区別できる発現のサインを、疾患の単一の所見として見い出すことができることを示唆している。確かに、下気道の感染を有する患者からの試料を解析すると、異なる病原体によって引き起こされた感染間に明確な分離が観察され、病原体と関係がある転写のサインの存在が確認された。
【0132】
急性感染に関与する原因病原体を同定する能力は、残念なことには、多くの臨床的な状況下では依然として低く、血液白血球の転写プロフィールの解析は、感染症の診断を一変させる可能性を有する。微生物培養、血清学的アッセイ又はさらにはPCRに基づいた試験とは対照的に、白血球の遺伝子発現の結果は、疾患の関与する部位にかかわらず、迅速に且つ信頼して得ることができる。この情報は、適切な抗感染治療の迅速な開始及び適切な感染制御の方策の確立を可能にするはずである。さらに、血液白血球の転写解析は、疾患の診断のために、並びにおそらく疾患の進行及び予後のマーカーとして使用することができる、患者に関する情報も提供する。伝統的に疾患の進行の指標として使用されている白血球数、赤血球沈降速度及びC反応性タンパク質等の炎症性のマーカーと比較して、遺伝子発現アレイは、組織の相対的な細胞組成のみならず、進行中の免疫反応及び/又は病原体への暴露の結果として生じた遺伝子の調節もまた反映する包括的な分子の実態を提供する。
【0133】
これらの結果は、血液白血球中の転写サインの解析には、急性、慢性又は両方の感染症の結果の単一の現場での解析、並びにまたその検出、決定、評価、予後診断、診断及び予測の両方のための感染症の診断の補助的な方法としての価値があることを実証している。大規模の複数機関にわたる研究が、多数の試料を収集して、独立に評価し、最終的に、血液白血球の遺伝子発現プロファイリングを、日常的な臨床診断の適用に近づけるために必要であろう。
【0134】
患者情報。血液試料を、大腸菌感染を有する29人の患者(年齢の中央値:2月齢;範囲:2週〜16歳齢)、黄色ブドウ球菌感染を有する31人の患者(7歳齢;3月〜18歳齢)、肺炎連鎖球菌を有する13人の患者(2歳齢;2月〜16歳齢)、A型インフルエンザ感染を有する18人の患者(1.5歳齢;3週〜36歳齢)、及び7人の健常な対照(11月齢;3月〜22月齢)から得た。患者を、年齢及び抗生物質による治療に従って、トレーニングセットと試験セットとに分けた(表1)。急性感染を有する全ての対象及びそれらの対照は、Children's Medical Center Dallas (CMC)において募り、一方、SLE患者及びそのそれぞれの対照は、Texas Scottish Rite Hospitalにおいて募った。研究は、Institutional Review Boardsによって承認され、インフォームドコンセントを、全ての患者から得た。微生物学的診断は、関連の組織検体又は血液の標準的な細菌の培養、並びに直接的な蛍光抗原検査及びウイルスの培養によって確立した。全ての潜在的な適格な患者を、研究者が、微生物学的検査室のデータベース及び入院患者の入院記録の両方から日々同定した。次いで、病歴、臨床所見、細菌及びウイルスの培養、並びに免疫蛍光検査に基づいて適格性を確認する第2のステップをとった。(臨床所見により)疑わしい若しくは(微生物学的検査により)立証された多微生物性の感染を有する患者、免疫不全を有する患者、慢性疾患を有する患者、又はステロイド若しくはその他の免疫調節剤を投与されている患者は、除外した。確認された微生物学的診断が確立したら、患者を登録した。細菌感染を有する73人の患者のうちの60人(82%)において、研究の開始後、付随するウイルス感染の存在についての系統的な検査を開始し、呼吸器のウイルスの培養を行った。対照の試料を、選択的外科手技を受けることが予定されている健常な個人及び健常な外来診察患者から得た。
【0135】
血液試料の処理。全ての血液試料を、Children's Medical Center又はTexas Scottish Rite Hospital, Dallas、テキサス州において、酸性クエン酸デキストロースチューブ(BD Vacutainer)中に収集し、直ちに処理のために、Baylor Institute for Immunology Research, Dallas、テキサス州に室温で届けた。3〜4mlの血液から、末梢血単核球(PBMC,peripheral blood mononuclear cell)を、Ficoll gradientにより単離し、ベータ−メルカプトエタノール(BME,beta-mercaptoethanol)を有するRLT試薬(Qiagen社製、Valencia、カリフォルニア州)中で直ちに溶解させ、RNA試料の質及び取扱いを標準化するために同一の検査室において、同一のチームによって、(採血時から4〜6時間以内に)−80℃で保存した。
【0136】
マイクロアレイアッセイ。全RNAを、RNeasyキット(Qiagen社製、Valencia、カリフォルニア州)を使用して、製造者の指示にしたがって単離し、RNAの完全性を、Agilent 2100 Bioanalyzer(Agilent社製、Palo Alto、カリフォルニア州)を使用して評価した。二本鎖cDNAを、2〜5マイクログラムの全RNAから生成し、次に、AffymetrixRNA転写標識キット(Affymetrix Inc社製、Santa Clara、カリフォルニア州)を使用してビオチンで標識したヌクレオチドを用い、インビトロでの転写を1回行った。ビオチン化cRNA標的を、Sample Cleanup Module(Affymetrix社製)を使用して精製し、続いて、(22,283種のプローブセットを含有する)Affymetrix HGU133A GeneChipに、製造者の標準的なプロトコールに従ってハイブリダイズさせた。アレイを、Affymetrix社製の共焦点レーザースキャナーを使用して走査した。遺伝子のセットの発現の結果を、リアルタイムPCRによって確認した。
【0137】
リアルタイムRT−PCR解析。全RNAに、TURBO DNA-freeキット(Ambion Inc. 社製、Austin, テキサス州)を用いて第2のデオキシリボヌクレアーゼ処理にかけた。cDNAを、Two-Cycle cDNA Synthesisキット(Affymetrix社製)を使用して合成し、次に、インビトロでの転写(MEGAscript T7キット、Ambion, Inc. 社製、Austin、テキサス州)を行った。2段階RT−PCRを、Applied Biosystems TaqMan Assay on Demandのプローブ及びプライマーのセットを使用して、製造者の指示に従って行った。逆6転写を、High Capacity cDNA Archive Kit(Applied Biosystems社製)を使用して実施した。リアルタイムPCRを、ABI Prism 7700 Sequence Detection System上で行った。ヒトβグルクロニダーゼ(GUSB)を、10種のヒトの内因性の対照のパネルから、試料中で最も構成的に発現した対照として選び、したがって、標準化のための参照遺伝子として使用した。相対的なmRNAの発現を、比較サイクル時間(CT)法を、製造者の指示に従って使用して計算した。結果を、発現が全ての健常なドナーの平均に最も近いベースラインとしての1人の健常なドナーと比較した、感染を有する所与の患者についてのCTの基準化した差として計算した(ΔΔCT)。
【0138】
Illumina BeadChip:このマイクロアレイは、3μmのビーズに結合した50塩基長の
オリゴヌクレオチドのプローブからなり、このビーズは、スライドガラスの表面のマイクロウエル内に埋め込まれている。試料を処理し、データをIllumina Inc.社(San Diego、カリフォルニア州)から得た。標的を、Illumina RNA増幅キット (Ambion社製、Austin、テキサス州)を使用して調製した。cRNA標的を、Sentrix Hu6 BeadChip(>46,000種のプローブ)にハイブリダイズさせ、これを、Illumina BeadStation 500上で走査した。Illumina社製Beadstudioソフトウエアを使用して、蛍光ハイブリダイゼーションのシグナルを評価した。
【0139】
解析した148個の全試料について得た生データは、GEOとして預託されている(www.ncbi.nlm.nih.gov/geo/)(受託番号________)。
【0140】
マイクロアレイのデータ解析。Microarray Suite, Version 5.0(MAS5.0;Affymetrix社製)のソフトウエアを使用して、蛍光ハイブリダイゼーションのシグナルを評価し、シグナルを標準化して、シグナルの発呼の検出を評価した。各プローブセットについての生のシグナル強度を、MAS5.0中のアルゴリズムによって解析した。技術的なばらつきを最小化するために、最大で8個の試料を、ハイブリダイゼーション及び染色に、1日に1回無作為に割り当てた。
【0141】
チップ1個あたりのシグナルの値の標準化を、GeneChip1個あたり500の標的強度の値に対して、MAS5.0の全体的なスケーリングの方法を使用して行った。P(present)の発呼を、評価した少なくとも1つの患者のクラスにおいて少なくとも75%のGeneChip中で得たプローブセット(品質管理プローブ)に、解析を制限した。遺伝子発現解析ソフトウエアプログラムであるGeneSpring, Version 7.1 (Agilent社製)を使用して、試料の統計的な解析、階層的なクラスタリング及び分類を行った。非パラメトリックな一変量検定(マンホイットニーU検定又はフィッシャーの直接確率検定)を使用して、遺伝子を、患者のあらかじめ定義した群間を識別するその能力に基づいてランク付けした。トップにランク付けされた(すなわち、分類指標の)遺伝子の、あらかじめ定義したクラスの病原体を識別する能力を、K近傍(kNN,K-Nearest Neighbors)法によって決定し
た(Silicon Genetics Inc. 2002. Class prediction)。
【0142】
K近傍(kNN)法:(1)アルゴリズムが、遺伝子を、その予測される強度、非パラメトリックな検定によって決定したp値の負の自然対数によってランク付けし;(2)一点除外交差検証を使用して、試験試料として使用するために1人のドナーを既知の試料から系統的に取り出すことによって、予測のエラー率(又は正確度)を推定した。この過程を、全てのドナーが「検定される」まで繰り返す。マンホイットニーU検定及びフィッシャーの直接確率検定の両方からの識別遺伝子のリストを組み合せて、試料のクラス間の識別のために使用した。(3)試料のクラスを割り当てるために、アルゴリズムが、クラスを、標準化した発現強度のユークリッド距離に基づいて未知のクラスの試料に最も近傍の既知のクラスの数を検定することによって評価し、p値を計算する。最低のp値を有するクラスを、未知の試料に割り当てる。0.5のp値比のカットオフを、全ての識別解析において使用した。予測したクラスからのp値が、その他のクラスより少なくとも2倍小さい場合には、クラスは、試料に割り当てられる(例えば、A型インフルエンザのクラスのp値/細菌のクラスのp値)。
【0143】
有意差パターンの解析。患者の各群とそれぞれの健常な対照群との間の統計的な比較を行った(マンホイットニーの順位検定)。有意に変化した遺伝子(p<0.01)を、2つのセットに分けた。すなわち、2つの参照群(FLU及びSLE)について、過剰発現対対照及び過小発現対対照。遺伝子のセットを、選択基準をこれらの群(複数の群)に適用することによって同定した(例えば、FLUではP<0.01、及びSLEではP>0.5)。これらの遺伝子に関するp値を、その他の疾患に照らして得た(比較群:黄色ブドウ球菌、肺炎連鎖球菌、大腸菌)。遺伝子発現の変化が、参照群の遺伝子発現の変化と反対である場合には、比較群に関するp値を、1に設定した。p値のデータを、GeneSpring, Version 7.2(Agilent社製)を用いて処理した。このソフトウエアを使用して、有意差のパターンに基づいて、遺伝子の階層的なクラスタリングを行って、遺伝子をグループ化した。
【0144】
転写のサインが、A型インフルエンザ感染を有する患者を、細菌感染を有する患者と識別する。図1Cに示すように、標準的な遺伝子レベルでの解析を使用して、マイクロアレイの解析を使用して、ウイルス感染(A型インフルエンザ)を、細菌感染(大腸菌及び肺炎連鎖球菌)と識別することができることを見い出した。図1Cは、遺伝子発現のサインが、A型インフルエンザ感染を、細菌感染と区別することを示す。次いで、トレーニングセットにおいて、A型インフルエンザウイルス感染を有する患者を細菌感染(大腸菌又は黄色ブドウ球菌)を有する患者と91%(21/23)の正確度で最も良好に識別する35種の分類指標遺伝子を、試験セット(n=37)において独立して検証した。これら35種の予測因子は、試験セットを、95%(35/37)の正確度で分類した。
【0145】
モジュールレベルのマイクロアレイのデータの解析。この戦略は、大型のマイクロアレイ遺伝子発現データセット(8種の疾患、約250個の試料×44,000種の転写物)からの28種のセットの協調的に発現した遺伝子(約5000種の転写物を再グループ化する)又は転写モジュールの最初の抽出に基づく。次に、モジュールを基本単位として、最初に、文献解析を通して機能を解釈し、次いで、健常な対象から得た試料と急性感染を有する患者から得た試料との間で群比較を行う解析のための構成単位として、これらのモジュールを使用した。
【0146】
図7は、モジュールレベルでの転写変化の地図を作製するために使用することができる遺伝子ベクターが、疾患に特異的なパターンを同定する様子を示す。群比較を、患者と未感染の個人との間で、モジュールを基本単位として行った。点は、モジュール内で有意に過剰発現(赤色)又は過小発現(青色)した遺伝子の割合を示す。この情報を、グリッド上に、28個のモジュールIDのうちのlつに対応する座標を用いて示す(例えば、モジュールM3.1は、第3行と第1列の交差点にある)。
【0147】
遺伝子ベクター及びマッピングのアプローチは、ノイズのレベルの低減を可能にし、データの解釈を促進する。Dallasのグループはまた、モジュール式の転写データが、マイクロアレイのプラットフォームにわたって再現可能であることも実証している。
【0148】
患者の血液中の診断マーカーの同定。モジュールレベルでの全体的な転写の変化の地図を作製することは、患者のPBMC転写プロフィールの解釈に役立っている。これはまた、モジュールの変化の疾患に特異的な組合せも明らかにした。これは、グラム陽性細菌及びグラム陰性細菌によって引き起こされた感染にわたって、モジュールM3.1の変化(インターフェロン、緑色で囲まれている、赤色の点及び青色の点でそれぞれ示されている差次的に過剰又は過小に発現した転写物の割合)を比較する図7に示されている。差はまた、2つの種のグラム陽性細菌の間でも見い出された(図7、橙色の丸)。最も興味深いのは、インフルエンザのモジュール式プロフィール及びRSVのモジュール式プロフィールにおいて、これらのウイルス感染が類似の臨床所見を有するという事実にもかかわらず、顕著な差が見い出されたことである。RSVを有する患者においてインターフェロン誘導型の転写物の誘導が全く存在しない点は、患者の強力なインターフェロン応答と関係があるインフルエンザ感染(M3.1)とは、特筆すべき差であった。その他の差も観察され、最も特筆すべきは、モジュールM1.4及びM1.7であった(図7中、紫色で強調されている)。
【0149】
疾患重症度のマーカーの同定:感染症の診断に現在利用できる手段は、病原体の直接的な検出に頼っている(例えば、培養、染色又はPCRによる)。これらの方法と比較して、患者の免疫細胞の遺伝子の発現変化をモニターすることによって、疾患の重症度を予測できる可能性を提供する。確かに、モジュール式の発現レベル(転写物にわたる平均値)は、疾患重症度の臨床的指標と相関した。次いで、重症度と(正又は負に)相関するモジュールを、(「Uスコア」を生成する)U統計学に基づいて、多変数解析を行って、単一のスコアに一本化した(黄色ブドウ球菌及びインフルエンザについての結果を、図8に示す)。
【0150】
図8は、急性感染を有する患者における疾患重症度の評価に関するマイクロアレイのスコアを示す。モジュールレベルのマイクロアレイの発現データを、U統計学に基づいて、多変数解析を通して、単一のスコアに組み合せた。こうして得たマイクロアレイのスコアは、疾患重症度に関連性のある指標(例えば、発熱、低血圧、アシドーシス)で構成した臨床のスコアと相関した。マーカーを、トレーニングセットにおいて同定し、独立したセットの患者(試験セット)において検証した。したがって、特有のマイクロアレイに基づいた血液アッセイは、(1)疾患の原因を決定するため;且つ(2)急性感染を有する患者の疾患重症度を評価するために使用することができる臨床情報を生成する。図9a〜9cは、マイクロアレイのプラットフォームにわたる独立した確認及び検証の概要を示す。
【0151】
本明細書に記載する特定の実施形態は、説明のために示すのであって、本発明を制限するものではないことが理解されよう。本発明の主要な特色は、本発明の範囲から逸脱することなく、種々の実施形態で利用することができる。当業者であれば、本明細書に記載する特異的な手順の多数の等価物を、認識し、又は日常的な実験を越えるものを使用せずとも、確認することができるであろう。そのような等価物は、本発明の範囲に属するとみなされ、特許請求の範囲によって包含されている。
【0152】
本明細書中で言及した全ての刊行物及び特許出願は、本発明が属する技術分野の当業者の技術レベルを示す。全ての刊行物及び特許出願は、あたかも個々それぞれの刊行物又は特許出願が、特異的且つ個別に参照によって組み込まれているのを示すのと同一のレベルで、参照によって本明細書に組み込まれている。
【0153】
本明細書において開示及び請求する組成物及び/又は方法の全ては、本発明の開示に照らして、過度の実験をせずとも作製及び実行することができる。本発明の組成物及び方法を、好ましい実施形態に関して説明してきたが、本発明の概念、精神及び範囲から逸脱することなく、変形形態が、本明細書に記載する組成物及び/又は方法に、且つ本明細書に記載する方法のステップ又は一連のステップに適用できることが当業者には明らかであろう。より具体的には、化学的及び生理学的の両方で関連性のある特定の病原体で、本明細書に記載した病原体を置き換えることができ、それでも同一又は類似の結果が達成されることが明らかであろう。当業者に明らかな、そのような類似の置換形態及び改変形態は全て、付随の特許請求の範囲によって定義される本発明の精神、範囲及び概念に属するとみなす。
(参考文献)
1. Fauci, A.S. 2005. The global challenge of infectious diseases: the evolving role of the National Institutes of Health in basic and clinical research. Nat Immunol 6:743-747.
2. Relman, D.A. 2002. New technologies, human-microbe interactions, and the search for previously unrecognized pathogens. J Infect Dis 186 Suppl 2:S254-258.
3. Fauci, A.S. 2004. Emerging infectious diseases: a clear and present danger to humanity. Jama 292:1887-1888.
4. Medzhitov, R., and C.A. Janeway, Jr. 1997. Innate immunity: the virtues of a nonclonal system of recognition. Cell 91:295-298.
5. Medzhitov, R., and C. Janeway, Jr. 2000. Innate immune recognition: mechanisms and pathways [In Process Citation]. Immunol Rev 173:89-97.
6. Alizadeh, A.A., M.B. Eisen, R.E. Davis, C. Ma, I.S. Lossos, A. Rosenwald, J.C. Boldrick, H. Sabet, T. Tran, X. Yu, J.I. Powell, L. Yang, G.E. Marti, T. Moore, J. Hudson, Jr., L. Lu, D.B. Lewis, R. Tibshirani, G. Sherlock, W.C. Chan, T.C.
Greiner, D.D. Weisenburger, J.O. Armitage, R. Warnke, R. Levy, W. Wilson, M.R. Grever, J.C. Byrd, D. Botstein, P.O. Brown, and L.M. Staudt. 2000. Distinct types of diffuse large B-cell lymphoma identified by gene expression profiling. Nature 403:503-511.
7. Golub, T.R., D.K. Slonim, P. Tamayo, C. Huard, M. Gaasenbeek, J.P. Mesirov, H. Coller, M.L. Loh, J.R. Downing, M.A. Caligiuri, C.D. Bloomfield, and E.S. Lander. 1999. Molecular classification of cancer: class discovery and class prediction by gene expression monitoring. Science 286:531-537.
8. van de Vijver, M.J., Y.D. He, L.J. van't Veer, H. Dai, A.A. Hart, D.W. Voskuil, G.J. Schreiber, J.L. Peterse, C. Roberts, M.J. Marton, M. Parrish, D. Atsma, A. Witteveen, A. Glas, L. Delahaye, T. van der Velde, H. Bartelink, S. Rodenhuis, E.T. Rutgers, S.H. Friend, and R. Bernards. 2002. A gene-expression signature as a predictor of survival in breast cancer. N Engl J Med 347:1999-2009.
9. Bennett, L., A.K. Palucka, E. Arce, V. Cantrell, J. Borvak, J. Banchereau, and V. Pascual. 2003. Interferon and granulopoiesis signatures in systemic lupus erythematosus blood. J Exp Med 197:711-723.
10. Rubins, K.H., L.E. Hensley, P.B. Jahrling, A.R. Whitney, T.W. Geisbert, J.W. Huggins, A. Owen, J.W. Leduc, P.O. Brown, and D.A. Relman. 2004. The host response to smallpox: analysis of the gene expression program in peripheral blood cells in a nonhuman primate model. Proc Natl Acad Sci U S A 101:15190-15195.
11. Baechler, E.C., F.M. Batliwalla, G. Karypis, P.M. Gaffney, W.A. Ortmann, K.J. Espe, K.B. Shark, W.J. Grande, K.M. Hughes, V. Kapur, P.K. Gregersen, and T.W.
Behrens. 2003. Interferon-inducible gene expression signature in peripheral blood cells of patients with severe lupus. Proc Natl Acad Sci U S A 100:2610-2615.
12. Hoebe, K., and B. Beutler. 2004. LPS, dsRNA and the interferon bridge to adaptive immune responses: Trif, Tram, and other TIR adaptor proteins. J Endotoxin Res 10:130-136.
13. Yurchenko, V., M. O'Connor, W.W. Dai, H. Guo, B. Toole, B. Sherry, and M. Bukrinsky. 2001. CD147 is a signaling receptor for cyclophilin B. Biochem Biophys Res Commun 288:786-788.
14. Geiser, T., B. Dewald, M.U. Ehrengruber, I. Clark-Lewis, and M. Baggiolini. 1993. The interleukin-8-related chemotactic cytokines GRO alpha, GRO beta, and GRO gamma activate human neutrophil and basophil leukocytes. J Biol Chem 268:15419-15424.
15. Nagaoka, I., and S. Hirota. 2000. Increased expression of matrix metalloproteinase-9 in neutrophils in glycogen-induced peritoneal inflammation of guinea pigs. Inflamm Res 49:55-62.
16. Niemann, C.U., J.B. Cowland, P. Klausen, J. Askaa, J. Calafat, and N. Borregaard. 2004. Localization of serglycin in human neutrophil granulocytes and their
precursors. J Leukoc Biol 76:406-415.
17. Pouliot, M., P.P. McDonald, P. Borgeat, and S.R. McColl. 1994. Granulocyte/macrophage colony-stimulating factor stimulates the expression of the 5-lipoxygenase-activating protein (FLAP) in human neutrophils. J Exp Med 179:1225-1232.
18. Herndon, B.L., S. Abbasi, D. Bennett, and D. Bamberger. 2003. Calcium-binding proteins MRP 8 and 14 in a Staphylococcus aureus infection model: role of therapy, inflammation, and infection persistence. J Lab Clin Med 141:110-120.
19. Chaussabel, D., R.T. Semnani, M.A. McDowell, D. Sacks, A. Sher, and T.B. Nutman. 2003. Unique gene expression profiles of human macrophages and dendritic cells to phylogenetically distinct parasites. Blood 102:672-681.
20. Nau, G.J., J.F. Richmond, A. Schlesinger, E.G. Jennings, E.S. Lander, and R.A. Young. 2002. Human macrophage activation programs induced by bacterial pathogens. Proc Natl Acad Sci U S A 99:1503-1508.
21. Boldrick, J.C., A.A. Alizadeh, M. Diehn, S. Dudoit, C.L. Liu, C.E. Belcher, D. Botstein, L.M. Staudt, P.O. Brown, and D.A. Relman. 2002. Stereotyped and specific gene expression programs in human innate immune responses to bacteria. Proc Natl Acad Sci U S A 99:972-977.
22. Huang, Q., D. Liu, P. Majewski, L.C. Schulte, J.M. Korn, R.A. Young, E.S. Lander, and N. Hacohen. 2001. The plasticity of dendritic cell responses to pathogens and their components. Science 294:870-875.
23. Silicon Genetics Inc. 2002. Class prediction.
24. Bammler T, Beyer RP, Bhattacharya S, et al. Standardizing global gene expression analysis between laboratories and across platforms. Nat Methods. 2005;2:351-356.
25. Irizarry RA, Warren D, Spencer F, et al. Multiple-laboratory comparison of microarray platforms. Nat Methods. 2005;2:345-350.
26. Larkin JE, Frank BC, Gavras H, Sultana R, Quackenbush J. Independence and reproducibility across microarray platforms. Nat Methods. 2005;2:337-344.
27. Jenner RG, Young RA. Insights into host responses against pathogens from transcriptional profiling. Nat Rev Microbiol. 2005;3:281-294.
28. Pai RK, Pennini ME, Tobian AA, Canaday DH, Boom WH, Harding CV. Prolonged toll-like receptor signaling by Mycobacterium tuberculosis and its 19-kilodalton lipoprotein inhibits gamma interferon-induced regulation of selected genes in macrophages. Infect Immun. 2004;72:6603-6614.

【特許請求の範囲】
【請求項1】
感染症の疑いのあるヒト対象を同定する方法であって、cig5;DNAPTP6;IFI27;IFI35;IFI44;OAS1;BST2;G1P2;LY6E;MX1;SON;TRIM14;APOBEC3C;C1orf29;FLJ20035;FLJ38348;HSXIAPAF1;KIAA0152;PHACTR2;及びUSP18のうち1又は複数の遺伝子を含むバイオマーカーの発現レベルを決定するステップを含む方法。
【請求項2】
発現レベルを決定するステップが、mRNAの量、タンパク質の量及びそれらの組合せを測定することによって実施される、請求項1に記載の方法。
【請求項3】
発現レベルを決定するステップが、固体の支持体上での核酸のハイブリダイゼーション、オリゴヌクレオチドアレイ、配列決定及びそれらの組合せを使用して実施される、請求項1に記載の方法。
【請求項4】
発現レベルを決定するステップが、ヒト細胞から収集したmRNAを鋳型として使用して作製されるcDNAを使用して実施される、請求項1に記載の方法。
【請求項5】
バイオマーカーが、mRNAのレベルを含み、かつポリメラーゼ連鎖反応、リアルタイムポリメラーゼ連鎖反応、逆転写酵素ポリメラーゼ連鎖反応、ハイブリダイゼーション、プローブハイブリダイゼーション及び遺伝子発現アレイからなる群から選択される方法によって定量化される、請求項1に記載の方法。
【請求項6】
発現レベルを決定するステップが、ポリメラーゼ連鎖反応、ヘテロデュプレックス解析、一本鎖高次構造多型解析、リガーゼ連鎖反応、比較ゲノムハイブリダイゼーション、サザンブロット法、ノーザンブロット法、ウエスタンブロット法、酵素結合免疫吸着測定法、蛍光共鳴エネルギー移動及び配列決定からなる群から選択される少なくとも1つの技法を使用して達成される、請求項1に記載の方法。
【請求項7】
試料が末梢血単核細胞を含む、請求項1に記載の方法。
【請求項8】
感染症の疑いのあるヒト対象を同定する方法であって、EEF1G;EIF3S5;EIF3S7;EIF4B;QARS;RPL31;RPL4;PFDN5;CD44;HADHA;PCBP2;及びdJ507I15.1のうち1又は複数の遺伝子を含むバイオマーカーの発現レベルを決定するステップを含む方法。
【請求項9】
発現レベルを決定するステップが、mRNAの量、タンパク質の量及びそれらの組合せを測定することによって実施される、請求項1に記載の方法。
【請求項10】
発現レベルを決定するステップが、固体の支持体上での核酸のハイブリダイゼーション、オリゴヌクレオチドアレイ、配列決定及びそれらの組合せを使用して実施される、請求項1に記載の方法。
【請求項11】
発現レベルを決定するステップが、ヒト細胞から収集したmRNAを鋳型として使用して作製されるcDNAを使用して実施される、請求項1に記載の方法。
【請求項12】
バイオマーカーが、mRNAのレベルを含み、かつポリメラーゼ連鎖反応、リアルタイムポリメラーゼ連鎖反応、逆転写酵素ポリメラーゼ連鎖反応、ハイブリダイゼーション、プローブハイブリダイゼーション及び遺伝子発現アレイからなる群から選択される方法によって定量化される、請求項1に記載の方法。
【請求項13】
発現レベルを決定するステップが、ポリメラーゼ連鎖反応、ヘテロデュプレックス解析、一本鎖高次構造多型解析、リガーゼ連鎖反応、比較ゲノムハイブリダイゼーション、サザンブロット法、ノーザンブロット法、ウエスタンブロット法、酵素結合免疫吸着測定法、蛍光共鳴エネルギー移動及び配列決定からなる群から選択される少なくとも1つの技法を使用して達成される、請求項1に記載の方法。
【請求項14】
試料が末梢血単核細胞を含む、請求項1に記載の方法。
【請求項15】
感染症の疑いのあるヒト対象を同定する方法であって、CXCL1;JAG1;RGS2;GAPD;PPIB;PSMA7;MMP9;p44S10;TRAM2;SEC24C;ACTG1;CGI−96;MGC2963;及びSTAUのうち1又は複数の遺伝子を含むバイオマーカーの発現レベルを決定することにより、黄色ブドウ球菌(S. aureus)感染による感染と大腸菌(E. coli)感染による感染とを判別するステップを含む方法。
【請求項16】
発現レベルを決定するステップが、RASA1;SNX4;AF1Q;SMAD2;JUP;PP;MAN1C1;FLJ10287;FLJ20152;LRRN3;SGPP1;及びUBAP2Lのうちの1又は複数の遺伝子を含むバイオマーカーの発現レベルを決定することにより、黄色ブドウ球菌と比較して大腸菌感染を検出するために使用される、請求項15に記載の方法。
【請求項17】
発現レベルを決定するステップが、mRNAの量、タンパク質の量及びそれらの組合せを測定することによって実施される、請求項1に記載の方法。
【請求項18】
発現レベルを決定するステップが、固体の支持体上での核酸のハイブリダイゼーション、オリゴヌクレオチドアレイ、配列決定及びそれらの組合せを使用して実施される、請求項1に記載の方法。
【請求項19】
発現レベルを決定するステップが、ヒト細胞から収集したmRNAを鋳型として使用して作製されるcDNAを使用して実施される、請求項1に記載の方法。
【請求項20】
バイオマーカーが、mRNAのレベルを含み、かつポリメラーゼ連鎖反応、リアルタイムポリメラーゼ連鎖反応、逆転写酵素ポリメラーゼ連鎖反応、ハイブリダイゼーション、プローブハイブリダイゼーション及び遺伝子発現アレイからなる群から選択される方法によって定量化される、請求項1に記載の方法。
【請求項21】
発現レベルを決定するステップが、ポリメラーゼ連鎖反応、ヘテロデュプレックス解析、一本鎖高次構造多型解析、リガーゼ連鎖反応、比較ゲノムハイブリダイゼーション、サザンブロット法、ノーザンブロット法、ウエスタンブロット法、酵素結合免疫吸着測定法、蛍光共鳴エネルギー移動及び配列決定からなる群から選択される少なくとも1つの技法を使用して達成される、請求項1に記載の方法。
【請求項22】
試料が末梢血単核細胞を含む、請求項1に記載の方法。
【請求項23】
EEF1G;EIF3S5;EIF3S7;EIF4B;QARS;RPL31;RPL4;PFDN5;CD44;HADHA;PCBP2;及びdJ507I15.1のうち1又は複数の遺伝子を有するバイオマーカーの発現レベルを決定して、細菌感染とウイルス感染とを判別することによって、感染症の疑いのあるヒト対象を同定する方法。
【請求項24】
試料の表現型を決定するための、コンピュータが実行する方法であって、
試料から、1又は複数のプローブ強度を得るステップと、
プローブ強度に基づいて感染症を診断するステップと、
プローブ強度と参照プローブ強度との間の線形相関係数を計算するステップと、
線形相関係数が閾値を超える場合には、暫定的な表現型を試料の遺伝子型として受け入れるステップと
を含む方法。
【請求項25】
試料のトランスクリプトームを決定するための方法を実施するためのコンピュータ実行可能命令を含むコンピュータ可読媒体であって、前記方法が、
複数の試料プローブ強度を得るステップと、
表2、表3、補足表1〜11及びそれらの組合せに列挙した遺伝子から選択される6以上の遺伝子に関する試料プローブ強度に基づいて感染症を診断するステップと、
試料プローブ強度と参照プローブ強度との間の線形相関係数を計算し、線形相関係数が閾値を超える場合には、暫定的な遺伝子型を試料の遺伝子型として受け入れるステップと
を含む媒体。
【請求項26】
バイオマーカーが、5、6、7、8、9、10、11又は12以上の遺伝子から選択される、請求項25に記載のシステム。
【請求項27】
バイオマーカーが、補足表1〜11及びそれらの組合せに列挙した1又は複数の遺伝子から選択される、請求項25に記載のシステム。
【請求項28】
個人における感染症の存在と相関するデータセットを生成するためのコンピュータに基づいた方法であって、コンピュータが実行する、
個人から複数の遺伝子プローブ強度を得るステップと、
表2、表3、補足表1〜11及びそれらの組合せに列挙した遺伝子から選択される6以上の遺伝子に関するプローブ強度を決定するステップと、
6以上の遺伝子のそれぞれに関して、試料プローブ強度と参照プローブ強度との間の線形相関係数を計算するステップであって、前記6以上の遺伝子の相関係数を平均して、感染症の存在又は非存在と相関するトランスクリプトーム発現ベクトルを計算するステップとを含む方法。

【図1】
image rotate

【図2】
image rotate

【図3A】
image rotate

【図3B】
image rotate

【図4A】
image rotate

【図4B】
image rotate

【図4C】
image rotate

【図4D】
image rotate

【図4E】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate


【公開番号】特開2013−66474(P2013−66474A)
【公開日】平成25年4月18日(2013.4.18)
【国際特許分類】
【出願番号】特願2012−255823(P2012−255823)
【出願日】平成24年11月22日(2012.11.22)
【分割の表示】特願2009−524013(P2009−524013)の分割
【原出願日】平成19年8月10日(2007.8.10)
【出願人】(509004712)ベイラー リサーチ インスティテュート (38)
【氏名又は名称原語表記】BAYLOR RESEARCH INSTITUTE
【出願人】(500039463)ボード・オブ・リージエンツ,ザ・ユニバーシテイ・オブ・テキサス・システム (115)
【Fターム(参考)】