疾患の罹患の判定方法

【課題】被験者が判定対象疾患に罹患しているか否かの判定を正確に安定して行うことができる方法を提供することを目的とする。
【解決手段】判定対象疾患の罹患が疑われる被験者から採取された生体試料中の、該疾患と関連する遺伝子群に属する少なくとも１つの遺伝子の転写産物の発現量を測定し、健常者から得られる生体試料中の対応する遺伝子の転写産物の発現量からの偏差を表す値を取得し、この偏差を表す値を遺伝子群内で平均化し、少なくとも２つのカテゴリーについて求めた平均化された値を用いて判定する方法により、上記の課題を解決する。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、被験者が判定対象の疾患に罹患しているか否かを判定するための方法に関する。より具体的には、本発明は、被験者から採取された生体試料中のある特定の遺伝子の転写産物の発現量の測定に基づいて、該被験者が判定対象の疾患に罹患しているか否かを判定できる方法に関する。
【背景技術】
【０００２】
多数の遺伝子またはそれらの転写産物の発現量の網羅的解析は、ある特定の疾患に関連して発現量が変化する遺伝子を見出すことができるので、該疾患の罹患を判定するのに利用できる可能性が期待されている。そのため、そのような網羅的解析のデータに基づいて、被験者がある特定の疾患に罹患しているか否かを判定する方法についての研究が、これまでに数多く行われてきた。
しかしながら、遺伝子またはその転写産物の発現量の網羅的解析においては、偽陽性の遺伝子も多数検出されることや、測定系による誤差、遺伝子発現の再現性の不良などのため、真に有意な発現量の変化を示す遺伝子を抽出することは困難であるという問題が存在する。
【０００３】
一方、そのような問題を解決するために、現在までに解析データに対する様々な統計的手法が研究および開発されてきた。
例えば、特開２００５−３２３５７３号公報（特許文献１）は、DNAマイクロアレイから得た遺伝子の発現量データを多変量解析することで、異なる２条件間での遺伝子発現が有意に異なるかを判定する方法を開示している。
また、特表２００７−５２４４０８号公報（特許文献２）は、細胞内グルタチオンレベルの調節に関与する遺伝子の発現レベルに基づいて、精神障害を診断する方法を開示している。
【先行技術文献】
【特許文献】
【０００４】
【特許文献１】特開２００５−３２３５７３号公報
【特許文献２】特表２００７−５２４４０８号公報
【発明の概要】
【発明が解決しようとする課題】
【０００５】
このように、真に有意な発現量の変化を示す遺伝子を抽出するための研究が数多くなされているにもかかわらず、疾患の罹患の判定に普遍的に有効な統計的手法は、未だ得られていないのが現状である。
そこで、本発明は、判定対象の疾患の罹患が疑われる被験者が、該疾患に罹患しているか否かの判定を正確に安定して行うことができる方法を提供することを目的とする。
【課題を解決するための手段】
【０００６】
本発明者らは、上記の課題を解決するために鋭意研究を重ねた結果、判定対象の疾患の罹患が疑われる被験者からの生体試料中のある特定のカテゴリー（遺伝子群）に属する少なくとも１つの遺伝子の転写産物の発現量を測定し、健常者から得られる生体試料中の対応する遺伝子の転写産物の発現量からの偏差を表す値を取得し、この偏差を表す値をカテゴリー内で平均化し、少なくとも２つのカテゴリーについて求めた平均化された値を用いることにより、判定対象疾患に罹患している被験者を、健常者から明確に安定して区別できることを見出して、本発明を完成した。
【０００７】
よって、本発明は、
（１）判定対象疾患の罹患が疑われる被験者から得られた生体試料中の、前記疾患と関連する少なくとも２つの疾患判定用遺伝子群それぞれにおいて、遺伝子群に属する少なくとも１つの遺伝子の転写産物の発現量を測定する工程と、
（２）前記発現量を複数の健常者における対応する遺伝子の転写産物の発現量に基づいて標準化することにより、偏差を表わす値を取得する工程と、
（３）前記遺伝子群それぞれにおいて、遺伝子群に属する遺伝子についての偏差を表す値の平均値を取得する工程と、
（４）前記平均値を用いて、前記被験者が対象疾患に罹患しているか否かを判定する工程と
を含む、疾患の罹患判定方法を提供する。
【０００８】
また、本発明は、コンピュータを、
判定対象疾患の罹患が疑われる被験者から得られた生体試料中の、前記疾患と関連する少なくとも２つの疾患判定用遺伝子群それぞれにおいて、遺伝子群に属する少なくとも１つの遺伝子の転写産物の発現量を受け付ける受付手段、
前記発現量を複数の健常者における対応する遺伝子の発現量に基づいて標準化することにより偏差を表わす値を取得する偏差取得手段、
前記遺伝子群それぞれにおいて、遺伝子群に属する遺伝子の偏差を表す値の平均値を取得する平均値取得手段、
前記平均値を用いて、被験者が対象疾患に罹患しているか否かを判定する判定手段、
判定手段の判定結果を出力する出力手段
として機能させるための疾患の罹患判定用プログラムも提供する。
【発明の効果】
【０００９】
本発明の判定方法によると、判定対象疾患の罹患が疑われる被験者が該疾患に罹患しているか否かを、該被験者からの生体試料を用いて簡便に判定できるとともに、客観的な判定手段を提供できる。また、本発明の判定方法は、従来の方法に比較して、判定対象疾患の診断の助けとなるより精度の高い指標を安定に提供することを可能にする。
【図面の簡単な説明】
【００１０】
【図１】本発明のプログラムが用いられる判定対象疾患の罹患の判定用装置の一例を示す図である。
【図２】本発明のプログラムを実行するコンピュータシステムの一例を示す図である。
【図３】本発明のプログラムによる具体的な動作のフローチャートである。
【図４】疾患判定用遺伝子群を同定する場合の本発明のプログラムによる具体的な動作のフローチャートである
【図５】Ｇタンパク質関連遺伝子群、血液凝固関連遺伝子群、酸化ストレス関連遺伝子群、ファゴサイトーシス関連遺伝子群および脂肪酸化関連遺伝子群に属する遺伝子の転写産物の発現量から求めた健常者およびクローン病患者のＺスコアの平均値の分布を示す。
【図６】（Ａ）クローン病判定用遺伝子群のそれぞれにおける、該遺伝子群の同定に用いた健常者およびクローン病患者の遺伝子の転写産物の発現量データから求めたＺスコアの平均値を用いて、判定を行った結果を示す。（Ｂ）クローン病判定用遺伝子群のそれぞれにおける、該遺伝子群の同定に用いたデータとは異なる健常者およびクローン病患者の遺伝子の転写産物の発現量データから求めたＺスコアの平均値を用いて、判定を行った結果を示す。
【図７】（Ａ）クローン病判定用遺伝子群に属する遺伝子における、該遺伝子群の同定に用いた健常者およびクローン病患者の遺伝子の転写産物の発現量データを用いて、判定を行った結果を示す。（Ｂ）クローン病判定用遺伝子群に属する遺伝子における、該遺伝子群の同定に用いたデータとは異なる健常者およびクローン病患者の遺伝子の転写産物の発現量データを用いて、判定を行った結果を示す。
【図８】クローン病判定用遺伝子群の同定に用いた健常者およびクローン病患者の遺伝子の転写産物の発現量データから同定した、健常者とクローン病患者との間に有意差のある遺伝子の発現量の分布を示す。
【図９】（Ａ）健常者とクローン病患者との間に有意差のある遺伝子における、クローン病判定用遺伝子群の同定に用いた健常者およびクローン病患者の遺伝子の転写産物の発現量データを用いて、判定を行った結果を示す。（Ｂ）健常者とクローン病患者との間に有意差のある遺伝子における、クローン病判定用遺伝子群の同定に用いたデータとは異なる健常者およびクローン病患者の遺伝子の転写産物の発現量データを用いて、判定を行った結果を示す。
【図１０】微小管関連遺伝子群、ミトコンドリア関連遺伝子群およびプロスタグランジン関連遺伝子群に属する遺伝子の転写産物の発現量から求めた健常者およびハンチントン病患者のＺスコアの平均値の分布を示す。
【図１１】（Ａ）ハンチントン病判定用遺伝子群のそれぞれにおける、該遺伝子群の同定に用いた健常者およびハンチントン病患者の遺伝子の転写産物の発現量データから求めたＺスコアの平均値を用いて、判定を行った結果を示す。（Ｂ）ハンチントン病判定用遺伝子群のそれぞれにおける、該遺伝子群の同定に用いたデータとは異なる健常者およびハンチントン病患者の遺伝子の転写産物の発現量データから求めたＺスコアの平均値を用いて、判定を行った結果を示す。
【図１２】（Ａ）ハンチントン病判定用遺伝子群に属する遺伝子における、該遺伝子群の同定に用いた健常者およびハンチントン病患者の遺伝子の転写産物の発現量データを用いて、判定を行った結果を示す。（Ｂ）ハンチントン病判定用遺伝子群に属する遺伝子における、該遺伝子群の同定に用いたデータとは異なる健常者およびハンチントン病患者の遺伝子の転写産物の発現量データを用いて、判定を行った結果を示す。
【図１３】ハンチントン病判定用遺伝子群の同定に用いた健常者およびハンチントン病患者の遺伝子の転写産物の発現量データから同定した、健常者とハンチントン病患者との間に有意差のある遺伝子の発現量の分布を示す。
【図１４】（Ａ）健常者とハンチントン病患者との間に有意差のある遺伝子における、ハンチントン病判定用遺伝子群の同定に用いた健常者およびハンチントン病患者の遺伝子の転写産物の発現量データを用いて、判定を行った結果を示す。（Ｂ）健常者とハンチントン病患者との間に有意差のある遺伝子における、ハンチントン病判定用遺伝子群の同定に用いたデータとは異なる健常者およびハンチントン病患者の遺伝子の転写産物の発現量データを用いて、判定を行った結果を示す。
【図１５】サイトカイン合成経路関連遺伝子群、サイトカイン媒介シグナル関連遺伝子群およびイムノグロブリン媒介免疫反応関連遺伝子群に属する遺伝子の転写産物の発現量から求めた正常組織および子宮内膜症の病変部組織のＺスコアの平均値の分布を示す。
【図１６】（Ａ）子宮内膜症判定用遺伝子群のそれぞれにおける、該遺伝子群の同定に用いた正常組織および子宮内膜症の病変部組織の遺伝子の転写産物の発現量データから求めたＺスコアの平均値を用いて、判定を行った結果を示す。（Ｂ）子宮内膜症判定用遺伝子群のそれぞれにおける、該遺伝子群の同定に用いたデータとは異なる正常組織および子宮内膜症の病変部組織の遺伝子の転写産物の発現量データから求めたＺスコアの平均値を用いて、判定を行った結果を示す。
【図１７】（Ａ）子宮内膜症判定用遺伝子群に属する遺伝子における、該遺伝子群の同定に用いた正常組織および子宮内膜症の病変部組織の遺伝子の転写産物の発現量データを用いて、判定を行った結果を示す。（Ｂ）子宮内膜症判定用遺伝子群に属する遺伝子における、該遺伝子群の同定に用いたデータとは異なる正常組織および子宮内膜症の病変部組織の遺伝子の転写産物の発現量データを用いて、判定を行った結果を示す。
【図１８】子宮内膜症判定用遺伝子群の同定に用いた正常組織および子宮内膜症の病変部組織の遺伝子の転写産物の発現量データから同定した、正常組織と子宮内膜症の病変部組織との間に有意差のある遺伝子の発現量の分布を示す。
【図１９】（Ａ）正常組織と子宮内膜症の病変部組織との間に有意差のある遺伝子における、子宮内膜症判定用遺伝子群の同定に用いた正常組織および子宮内膜症の病変部組織の遺伝子の転写産物の発現量データを用いて、判定を行った結果を示す。（Ｂ）正常組織と子宮内膜症の病変部組織との間に有意差のある遺伝子における、子宮内膜症判定用遺伝子群の同定に用いたデータとは異なる正常組織および子宮内膜症の病変部組織の遺伝子の転写産物の発現量データを用いて、判定を行った結果を示す。
【発明を実施するための形態】
【００１１】
本発明の判定方法では、まず、判定対象疾患の罹患が疑われる被験者から得られた生体試料中の、前記疾患と関連する少なくとも２つの疾患判定用遺伝子群それぞれにおいて、遺伝子群に属する少なくとも１つの遺伝子の転写産物の発現量を測定する。
【００１２】
本発明の判定方法において判定の対象となる疾患（判定対象疾患）は、特に限定されないが、例えば、診断のためにCTやMRIなどの高度な医療設備を要する疾患、特異な症状または所見に乏しいために除外診断が一般に行われている疾患などであり得る。そのような疾患としては、例えば、癌（肺癌、乳癌、胃癌、大腸癌、子宮頚癌、メラノーマなど）、自己免疫疾患（リウマチ、全身性エリテマトーデス、シェーグレン症候群、ギランバレー症候群、潰瘍性大腸炎など）、感染症（マラリア、日本脳炎、コレラ、チフス、赤痢など）、精神または神経系疾患（統合失調症、双極性障害、アルツハイマー病、ハンチントン病など）、原因不明の疾患（クローン病、子宮内膜症など）が挙げられる。
【００１３】
本明細書において、判定対象疾患の罹患が疑われる被験者（以下、単に「被験者」ともいう）とは、上記のような判定対象疾患に罹患している可能性があり、本発明の判定方法により罹患の有無が判定されることになる被験者を意味する。
生体試料は、そこから遺伝子の転写産物を抽出可能な生体から採取される試料であれば特に限定されず、被験者の血液（全血、血漿、血清を含む）、唾液、尿、体毛などを用いることができる。
【００１４】
本明細書において、「判定対象疾患と関連する疾患判定用遺伝子群」とは、判定対象疾患と関連することが、医学的、生物学的または統計学的に明らかである遺伝子群を意味する。そのような関連が明らかであれば、本発明の判定方法に用いる疾患判定用遺伝子群は、特に限定されない。なお、本発明の判定方法においては、後述する手順により同定される遺伝子群を、判定対象疾患と関連する疾患判定用遺伝子群として用いることができる。
【００１５】
本明細書において、遺伝子の転写産物とは、遺伝子が転写されることにより得られる産物のことであり、リボ核酸（RNA）、具体的にはメッセンジャーRNA（mRNA）である。
また、本明細書において、「遺伝子の転写産物の発現量」とは、上記の生体試料中の遺伝子の転写産物の存在量または該存在量を反映する物質の量のことである。よって、本発明の判定方法では、遺伝子の転写産物（mRNA）の量、またはmRNAから得られる相補デオキシリボ核酸（cDNA）もしくは相補RNA（cRNA）の量を測定できる。通常、生体試料中のmRNAは微量であるので、そこから逆転写およびインビトロ転写（IVT）により得られるcDNAまたはcRNAの量を測定することが好ましい。
【００１６】
生体試料から遺伝子の転写産物を抽出する方法は、当該技術において知られるRNA抽出法を用いて行うことができる。例えば、生体試料を遠心分離して、RNAを含む細胞を沈殿させ、該細胞を物理的または酵素的に破壊し、細胞破片を除去することによりRNA抽出物を得ることができる。RNAの抽出は、市販のRNA抽出キットなどを用いて行うこともできる。
【００１７】
上記のようにして得られた遺伝子の転写産物の抽出物から、遺伝子の転写産物の発現量の測定時に混入していないことが好ましい生体試料由来の混入成分、例えば、生体試料が血液である場合はグロビンのmRNAなどを除去するための処理を行うこともできる。
【００１８】
上記のようにして得られた遺伝子の転写産物の抽出物について、判定対象疾患との関連が既知である少なくとも２つの疾患判定用遺伝子群それぞれにおいて、遺伝子群に属する少なくとも１つの遺伝子の転写産物の発現量を測定する。
【００１９】
遺伝子の転写産物の発現量の測定は、それ自体公知の方法に従って行うことができるが、多数の遺伝子の転写産物の発現解析を行うことができる点で、定量PCR法や核酸チップを用いる測定方法が好ましい。
核酸チップを用いて遺伝子の転写産物の発現量を測定する場合、例えば、基板上に固定された20〜25 mer程度の核酸プローブに、遺伝子の転写産物の抽出物または遺伝子の転写産物から作製したcDNAもしくはcRNAを接触させ、ハイブリッドの形成の有無を蛍光、発色、電流などの指標の変化を測定することにより、目的の遺伝子の転写産物の発現量を測定できる。
上記の核酸プローブは、１つの遺伝子の転写産物に対して少なくとも１つ用いればよく、遺伝子の転写産物の長さなどに応じて、複数のプローブを用いることもできる。プローブの配列は、測定しようとする遺伝子の転写産物の配列に応じて当業者が適宜決定できる。
核酸チップを用いる遺伝子の転写産物の発現量の測定方法としては、例えば、Affymetrix社により提供されるGeneChipシステムを用いることができる。
【００２０】
核酸チップを用いる場合、遺伝子の転写産物またはそのcDNAもしくはcRNAは、核酸プローブとのハイブリッド形成を容易にするために、断片化してよい。断片化は、当該技術において公知の方法により行うことができ、例えば、リボヌクレアーゼ、デオキシリボヌクレアーゼなどの核酸分解酵素を用いて行うことができる。
【００２１】
核酸チップにおいて核酸プローブと接触させる遺伝子の転写産物またはそのcDNAもしくはcRNAは、通常、5〜20μg程度であればよい。接触条件は、通常、４５℃にて１６時間程度である。
【００２２】
核酸プローブと接触させてハイブリッドを形成した遺伝子の転写産物またはそのcDNAもしくはcRNAは、そのハイブリッド形成の有無およびハイブリッド形成した量について、蛍光物質、色素またはハイブリッド形成したことによる核酸チップ上を流れる電流量の変化などに基づいて検出することができる。
ハイブリッドの形成を、蛍光物質または色素の検出により測定する場合、遺伝子の転写産物またはそのcDNAもしくはcRNAが、蛍光物質または色素の検出のための標識物質で標識されていることが好ましい。このような標識物質は、当該技術において通常用いられるものを用いることができる。通常、ビオチン化ヌクレオチドまたはビオチン化リボヌクレオチドを、cDNAまたはcRNAを合成するときのヌクレオチドまたはリボヌクレオチド基質として混合しておくことにより、得られるcDNAまたはcRNAがビオチンで標識されることができる。cDNAまたはcRNAがビオチン標識されていると、核酸チップ上で、ビオチンに対する結合パートナーであるアビジンまたはストレプトアビジンが結合できる。アビジンまたはストレプトアビジンが、適切な蛍光物質または色素と結合していることにより、ハイブリッドの形成が検出できる。蛍光物質としては、フルオレセインイソチオシアネート（FITC）、グリーン蛍光タンパク質（GFP）、ルシフェリン、フィコエリスリンなどが挙げられる。通常、フィコエリスリン−ストレプトアビジンのコンジュゲートが市販されているので、これを用いることが簡便である。
また、アビジンまたはストレプトアビジンに対する標識抗体を、アビジンまたはストレプトアビジンと接触させ、標識抗体の蛍光物質または色素を検出することもできる。
【００２３】
この工程で得られる遺伝子の転写産物の発現量は、生体試料中の各遺伝子の転写産物の存在量を相対的に表す値であれば、特に限定されない。上記の核酸チップにより測定を行う場合、発現量は、蛍光強度、発色強度、電流量などに基づく核酸チップから得られるシグナルであり得る。
これらのシグナルは、核酸チップ用の測定装置を用いて測定できる。
【００２４】
次いで、測定された発現量を、複数の健常者における対応する遺伝子の転写産物の発現量に基づいて標準化することにより、偏差を表す値を取得する。
本明細書において、「対応する遺伝子の転写産物」とは、被験者について発現量を測定したものと同じ遺伝子の転写産物を意味する。
複数の健常者における対応する遺伝子の転写産物の発現量は、上記の被験者からの生体試料について行ったのと同様の方法に従って、健常者から採取された生体試料を用い、測定対象の遺伝子の転写産物の発現量を測定することにより、得ることができる。
本明細書において、「健常者」とは、本発明の判定方法以外の基準に基づいて、判定対象疾患に罹患していないことが確認できる者のことである。例えば、判定対象疾患が、癌である場合は、組織診、CT、MRI、腫瘍マーカーなどにより、自己免疫疾患である場合は、血液検査などにより、感染症である場合は、血液検査などにより、精神または神経系疾患である場合は、脳画像診断、遺伝子検査、問診、質問紙などにより、クローン病の場合は、内視鏡検査、消化管造影検査などにより、子宮内膜症の場合は、CT、MRI、内視鏡検査などにより、判定対象疾患に罹患していないことが確認できる者のことである。
また、本明細書において、「複数の健常者」とは、統計学的に十分な人数の健常者を意味し、３０名以上、好ましくは４０名以上の人数であればよい。
【００２５】
本明細書において、「複数の健常者における対応する遺伝子の転写産物の発現量に基づいて標準化する」とは、次の式により偏差を表す値を求めることを意味する。
偏差を表す値＝（被験者での遺伝子の転写産物の発現量−複数の健常者での対応する遺伝子の転写産物の発現量の平均値）／複数の健常者での対応する遺伝子の転写産物の発現量の標準偏差
上記の偏差を表す値は、Ｚスコアとしても知られる値であり、複数の健常者における遺伝子の転写産物の発現量から、被験者の遺伝子の転写産物の発現量がどの程度かけ離れているかを示す値である。
【００２６】
また、本発明の判定方法においては、被験者での遺伝子の転写産物の発現量を、複数の健常者での対応する遺伝子の転写産物の発現量の平均値で除算することにより、健常者に対する被験者の発現量比を表す値を取得し、上記の偏差を表す値に代えて、該発現比を表す値を次工程で用いてもよい。
上記の発現量比を表す値は、複数の健常者での対応する遺伝子の転写産物の発現量の平均値に対して、被験者の遺伝子の転写産物の発現量がどの程度大きいかを示す値である。
【００２７】
次いで、選択された疾患判定用遺伝子群それぞれにおいて、遺伝子群に属する遺伝子の偏差を表す値の平均値を取得する。
なお、本明細書において、「平均値」とは、平均値を取得しようとする上記の遺伝子群の中で１つの遺伝子についての偏差を表す値しか得られていない場合は、その１つの遺伝子についての偏差を表す値を意味し、２つ以上の遺伝子についての偏差を表す値が得られている場合は、それらの偏差を表す値を平均した値を意味する。
【００２８】
上記の平均値は、判定対象疾患との関連が既知である疾患判定用遺伝子群から選択される少なくとも２つの遺伝子群について取得する。なお、選択される遺伝子群の数は、多いほど好ましい。
【００２９】
上記のようにして得られた平均値を用いて、被験者が判定対象疾患であるか否かを判定する。
この判定は、上記のようにして被験者から取得された平均値を、健常者から採取された生体試料を用いて上記の各工程と同様にして予め得られた平均値と、判定対象疾患の患者から採取された生体試料を用いて上記の各工程と同様にして予め得られた平均値とに基づいて得られる判定式に入力することにより行うことができる。
【００３０】
上記の判定式は、それ自体公知の判別分析の手法を用いて作成することができる。判別分析の手法とは、事前に与えられたデータが互いに異なる２つの群に別れることが明らかな場合において、新たに得られたデータが該２つの群のいずれに属するものであるかを判別するための基準を得る統計学的手法である。そのような判別分析の手法としては、例えば、サポートベクターマシン（SVM）、線形判別分析、ニューラルネットワーク、ｋ近傍識別器、決定木、ランダムフォレストなどが挙げられる。これらの判別分析の手法の中でも、統計解析ソフトGeneSpringにも搭載されているSVMを用いて、上記の判定式を作成することが好ましい。
上記のような健常者からの平均値と、判定対象疾患の患者からの平均値とが予め入力され、判定式が作成されたSVMに、被験者から採取された生体試料から求めた平均値を入力することにより、この被験者が判定対象疾患に罹患しているか否かを判定することができる。
【００３１】
上記のとおり、本発明の判定方法には、「判定対象疾患と関連する疾患判定用遺伝子群」を用いるが、そのような遺伝子群の一例として、判定対象疾患と統計学的に関連する遺伝子群が挙げられる。この判定対象疾患と統計学的に関連する遺伝子群の同定は、例えば、以下の工程を含む手順により行うことができる：
（ａ）判定対象疾患に罹患した複数の患者のそれぞれおよび複数の健常者のそれぞれから得られた生体試料中の遺伝子の転写産物の発現量を測定する工程と、
（ｂ）前記複数の患者のそれぞれについての発現量を、前記複数の健常者における対応する遺伝子の転写産物の発現量に基づいて標準化することにより、前記複数の患者のそれぞれについての偏差を表す値を取得し、
前記複数の健常者のそれぞれについての発現量を標準化することにより、前記複数の健常者のそれぞれについての偏差を表す値を取得する工程と、
（ｃ）前記発現量を測定した遺伝子を、遺伝子がコードする分子の機能に基づく分類系統を用いて、少なくとも２つの遺伝子群に分類し、
前記複数の患者のそれぞれおよび前記複数の健常者のそれぞれについて、
前記遺伝子群それぞれにおいて、遺伝子群に属する遺伝子の偏差を表す値の平均値を前記遺伝子群の平均値として取得する工程と、
（ｄ）前記複数の患者についての各遺伝子群の平均値と前記複数の健常者についての対応する各遺伝子群の平均値との間の有意確率を取得する工程と、
（ｅ）前記有意確率が０．０５以下である遺伝子群を判定対象疾患と関連する疾患判定用遺伝子群として同定する工程。
【００３２】
まず、判定対象疾患に罹患した複数の患者および複数の健常者からそれぞれ得られた生体試料中の遺伝子の転写産物の発現量を測定する。
本明細書において、「判定対象疾患に罹患した患者」（以下、単に「患者」ともいう）とは、本発明の判定方法以外の基準に基づいて、判定対象疾患に罹患していることが確認できる者のことである。例えば、判定対象疾患が、癌である場合は、組織診、CT、MRI、腫瘍マーカーなどにより、自己免疫疾患である場合は、血液検査により、感染症である場合は、血液検査により、精神または神経系疾患である場合は、脳画像診断、遺伝子検査、問診などにより、クローン病の場合は、内視鏡検査、消化管造影検査などにより、子宮内膜症の場合は、CT、MRI、内視鏡検査などにより、判定対象疾患に罹患していることが確認できる人のことである。
また、本明細書において、「複数の患者」とは、統計学的に十分な人数の患者を意味し、３０名以上、好ましくは４０名以上の人数であればよい。なお、「健常者」および「複数の健常者」の定義については、上記のとおりである。
また、この工程における遺伝子の転写産物の抽出および該産物の発現量の測定については、判定対象疾患に罹患した複数の患者のそれぞれ、および複数の健常者のそれぞれから得られた生体試料を用いて、上記の本発明の判定方法の各工程と同様にして行うことができる。
【００３３】
次いで、複数の患者のそれぞれについての発現量を、複数の健常者における対応する遺伝子の転写産物の発現量に基づいて標準化することにより、複数の患者のそれぞれの偏差を表す値を取得する。
本明細書において、「複数の患者のそれぞれについての発現量を、複数の健常者における対応する遺伝子の転写産物の発現量に基づいて標準化する」とは、次の式により、複数の患者の全員の偏差を表す値を求めることを意味する。
患者についての偏差を表す値＝（各患者についての遺伝子の転写産物の発現量−複数の健常者での対応する遺伝子の転写産物の発現量の平均値）／複数の健常者での対応する遺伝子の転写産物の発現量の標準偏差
【００３４】
また、複数の健常者のそれぞれについての発現量を標準化することにより、複数の健常者のそれぞれについての偏差を表す値を取得する。
この場合の「標準化する」とは、統計学の分野において通常用いられるのと同じ意味を有する。すなわち、次の式により、複数の健常者の全員の偏差を表す値を取得できる。
健常者についての偏差を表す値＝（各健常者での遺伝子の転写産物の発現量−複数の健常者での遺伝子の転写産物の発現量の平均値）／複数の健常者での遺伝子の転写産物の発現量の標準偏差
【００３５】
なお、上記の健常者に対する被験者の発現量比を表す値を求めるのと同様にして、健常者の平均値に対する複数の患者および複数の健常者のそれぞれの発現量比を求め、これらの値を、それぞれ複数の患者についての偏差を表す値および複数の健常者についての偏差を表す値に代えて用いることができる。
【００３６】
次いで、発現量を測定した遺伝子を、遺伝子がコードする分子の機能に基づく分類系統を用いて、少なくとも２つの遺伝子群に分類し、複数の患者のそれぞれおよび複数の健常者のそれぞれについて、該遺伝子群それぞれにおいて、遺伝子群に属する遺伝子の偏差を表す値の平均値を前記遺伝子群の平均値として取得する。
【００３７】
本明細書において、「遺伝子がコードする分子の機能に基づく分類系統」とは、遺伝子がコードする分子の機能により遺伝子を分類したデータベースを意味する。そのようなデータベースはそれ自体が公知のものを用いることができ、例えば、ジーンオントロジー（Gene Ontology（GO））、京都エンサイクロペディアオブジーンズアンドゲノムス（Kyoto Encyclopedia of Genes and Genomes（KEGG））、メタシック（MetaCyc）、ジンマップ（GenMAPP）、バイオカルタ（BioCarta）、キーモルネット（KeyMolnet）、オンラインメンデリアンインヘリタンスインマン（Online Mendelian Inheritance in Man（OMIM））などが挙げられるが、この中でも「GO Term」と呼ばれる遺伝子群を定義するGene Ontologyを用いることが好ましい。
なお、これらのデータベースは、以下の表１に示すURLから入手または利用可能である。
【００３８】
【表１】

【００３９】
この工程においては、まず、上記の分類系統を用いて、発現量を測定した遺伝子を少なくとも２つの遺伝子群に分類する。そして、上記の被験者についての平均値を取得する工程と同様にして、分類された各遺伝子群における複数の患者および複数の健常者についての平均値を取得する。
【００４０】
次いで、複数の患者についての各遺伝子群の平均値と複数の健常者についての対応する各遺伝子群の平均値との間の有意確率を取得する。
本明細書において、「対応する遺伝子群」とは、複数の患者について平均値を取得したのと同じ遺伝子群を意味する。
複数の患者についての各遺伝子群の平均値と複数の健常者についての対応する各遺伝子群の平均値との間の有意確率（以下、「ｐ値」ともいう）は、Ｔ検定により取得することができる。
【００４１】
そして、上記で得られたｐ値が0.05以下である遺伝子群を、判定対象疾患と関連する疾患判定用遺伝子群として同定する。
本発明の判定方法においては、上記の手順により同定された遺伝子群から任意に選択される少なくとも２つを、判定対象疾患と関連する疾患判定用遺伝子群として用いる。なお、選択される疾患判定用遺伝子群の数は、多いほど好ましい。
【００４２】
本発明の判定方法では、遺伝子の転写産物の発現量自体を用いるのではなく、該発現量から偏差を表す値を取得し、この偏差を表す値を上記の疾患判定用遺伝子群で平均値を取得し、得られた平均値を用いることにより、判定対象疾患に罹患している被験者を、健常者から明確に安定して区別できる。
また、本発明の判定方法は、例えば、クローン病、ハンチントン病、子宮内膜症などの罹患の判定に特に好適である。
【００４３】
クローン病は、潰瘍や線維化を伴う肉芽腫性炎症性病変からなり、口腔から肛門までの消化管全域に発症し得る原因不明の疾患である。日本国内では、現在２万人以上が罹患している。症状としては、腹痛、下痢、体重減少、発熱、肛門病変がよく見られる。クローン病の確定診断は内視鏡検査によって行なわれるが、血液検査などの侵襲度の低い検査によるスクリーニング検査を行なうことで早期発見が可能になると考えられる。本発明の判定方法により、クローン病の罹患が疑われる被験者を判定すれば、診断の指標として信頼できる判定結果を得ることができる。
本発明の判定方法によりクローン病の罹患を判定する場合、疾患判定用遺伝子群としては、例えば、Ｇタンパク質関連遺伝子群、血液凝固関連遺伝子群、酸化ストレス関連遺伝子群、ファゴサイトーシス関連遺伝子群および脂肪酸化関連遺伝子群が挙げられる。
上記の５つの遺伝子群は、GO Termにおいて、それぞれ「heterotrimeric G-protein complex」（GO：0005834）、「blood coagulation」（GO：GO:0007596）、「response to oxidative stress」（GO：0006979）、「phagocytosis, engulfment」（GO：GO:0006911）および「fatty acid oxidation」（GO：0019395）に分類される遺伝子のカテゴリーである。
【００４４】
ハンチントン病は、舞踏病運動を主体とする不随意運動、ならびに精神症状および認知症を主な症状とする慢性進行性神経変性疾患である。診断においては、脳出血などの脳血管障害による症候性舞踏病、抗精神病薬などによる薬剤性舞踏病、ウィルソン病などの疾患と鑑別することが必要である。そのため、本発明の判定方法により、ハンチントン病の罹患が疑われる被験者を判定すれば、診断の指標としてより信頼できる判定結果を得ることができる。
本発明の判定方法によりハンチントン病の罹患を判定する場合、疾患判定用遺伝子群としては、例えば、微小管関連遺伝子群、ミトコンドリア関連遺伝子群およびプロスタグランジン関連遺伝子群が挙げられる。
上記の３つの遺伝子群は、GO Termにおいて、それぞれ「microtube」（GO：0005874）、「mitochondrion」（GO：0005739）および「signal transduction」（GO：0007165）に分類される遺伝子のカテゴリーである。
【００４５】
子宮内膜症は、子宮内膜またはそれに類似した組織が子宮内腔や子宮体部以外に増殖する疾患である。子宮内膜症の主な症状が月経痛および月経困難であるため、子宮内膜症は月経困難症との鑑別が難しい疾患である。そのため、本発明の判定方法により、子宮内膜症の罹患が疑われる被験者を判定すれば、診断の指標としてより信頼できる判定結果を得ることができる。
本発明の判定方法により子宮内膜症の罹患を判定する場合、疾患判定用遺伝子群としては、例えば、サイトカイン合成経路関連遺伝子群、サイトカイン媒介シグナル関連遺伝子群およびイムノグロブリン媒介免疫反応関連遺伝子群が挙げられる。
上記の３つの遺伝子群は、GO Termにおいて、それぞれ「cytokine biosynthetic process」（GO：0042089）、「cytokine-mediated signaling pathway」（GO：0019221）および「immunoglobulin mediated immune response」（GO：0016064）に分類される遺伝子のカテゴリーである。
【００４６】
本発明の判定方法は、判定対象疾患の患者を「陽性」であると判定する感度が、好ましくは８０％以上、より好ましくは８５％以上、さらに好ましくは９０％以上である。また、本発明の判定方法は、健常者を「陰性」であると判定する特異度が、好ましくは８０％以上、より好ましくは８５％以上、さらに好ましくは９０％以上である。
本発明の判定方法は、このように高い感度および特異度を示すので、判定対象疾患の診断の助けとなるより精度の高い指標を安定に提供することができる。
【００４７】
上記の本発明の判定方法をコンピュータにより行うための疾患の罹患判定用プログラムも、本発明の１つである。すなわち、本発明のプログラムは、コンピュータを、
判定対象疾患の罹患が疑われる被験者から得られた生体試料中の、前記疾患と関連する少なくとも２つの疾患判定用遺伝子群それぞれにおいて、遺伝子群に属する少なくとも１つの遺伝子の転写産物の発現量を受け付ける受付手段、
前記発現量を複数の健常者における対応する遺伝子の発現量に基づいて標準化することにより偏差を表わす値を取得する偏差取得手段、
前記疾患判定用遺伝子群それぞれにおいて、遺伝子群に属する遺伝子の偏差を表す値の平均値を取得する平均値取得手段、
前記平均値を用いて、被験者が対象疾患に罹患しているか否かを判定する判定手段、
判定手段の判定結果を出力する出力手段
として機能させるための疾患の罹患判定用プログラムである。
【００４８】
また、上記の本発明のプログラムは、コンピュータを、疾患判定用遺伝子を同定する手段としてさらに機能させることもできる。すなわち、本発明のプログラムは、コンピュータを、
判定対象疾患に罹患した複数の患者のそれぞれおよび複数の健常者のそれぞれから得られた生体試料中の遺伝子の転写産物の発現量を受け付ける受付手段、
前記複数の患者のそれぞれについての発現量を、前記複数の健常者における対応する遺伝子の転写産物の発現量に基づいて標準化することにより、前記複数の患者のそれぞれの偏差を表わす値を取得し、前記複数の健常者のそれぞれについての発現量を標準化することにより、前記複数の健常者のそれぞれの偏差を表わす値を取得する偏差取得手段、
前記発現量を測定された遺伝子を、遺伝子がコードする分子の機能に基づく分類系統に従って、少なくとも２つの遺伝子群に分類し、前記複数の患者のそれぞれおよび前記複数の患者のそれぞれについて、前記遺伝子群それぞれにおいて、遺伝子群に属する遺伝子の偏差を表す値の平均値を前記遺伝子群の平均値として取得する平均値取得手段、
前記複数の患者についての各遺伝子群の平均値と前記複数の健常者についての対応する各遺伝子群の平均値との間の有意確率を取得する有意確率取得手段、
前記有意確率が0.05以下である遺伝子群を判定対象疾患と関連する疾患判定用遺伝子群として同定する遺伝子群同定手段
としてさらに機能させる疾患の罹患判定用プログラムである。
【００４９】
図１に、本発明のプログラムが用いられる判定対象疾患の罹患判定用装置の一例を示す。該装置は、遺伝子の転写産物発現量測定装置１と、コンピュータ２と、これらを接続するケーブル３とから構成される。遺伝子の転写産物発現量測定装置１で測定される蛍光強度、電流量などに基づくシグナルなどの発現量のデータは、ケーブル３を介してコンピュータ２に送ることができる。また、遺伝子の転写産物発現量測定装置１は、コンピュータ２と接続されていなくてもよく、この場合、発現量のデータをコンピュータに入力して上記のプログラムを作動させることができる。
コンピュータ２では、得られた発現量から、上記の偏差を表す値を取得し、得られた偏差を表す値を、少なくとも２つの遺伝子群のそれぞれにおける平均値として取得し、該平均値に基づいて、被験者が判定対象疾患に罹患しているか否かを判定する。
【００５０】
本発明のプログラムは、中央処理装置、記憶部、コンパクトディスクやフロッピー（登録商標）ディスクなどの記録媒体の読取装置、キーボードなどの入力部、およびディスプレイなどの出力部を備えるコンピュータ２と協働して、上記の本発明の判定方法を実現することができる。上記の方法を実施するための、より具体的なコンピュータシステムの一例を、図２に示す。
【００５１】
図２に示されたコンピュータ２は、本体１１０と、ディスプレイ１２０と、入力部１３０とから主として構成されている。本体１１０は、ＣＰＵ１１０ａと、ＲＯＭ１１０ｂと、ＲＡＭ１１０ｃと、ハードディスク１１０ｄと、読出装置１１０ｅと、入出力インタフェース１１０ｆと、画像出力インタフェース１１０ｇとから主として構成されており、ＣＰＵ１１０ａ、ＲＯＭ１１０ｂ、ＲＡＭ１１０ｃ、ハードディスク１１０ｄ、読出装置１１０ｅ、入出力インタフェース１１０ｆ、および画像出力インタフェース１１０ｇは、バス１１０ｈによってデータ通信可能に接続されている。
【００５２】
ＣＰＵ１１０ａは、ＲＯＭ１１０ｂに記憶されているコンピュータプログラムおよびＲＡＭ１１０ｃにロードされたコンピュータプログラムを実行することが可能である。
ＲＯＭ１１０ｂは、マスクＲＯＭ、ＰＲＯＭ、ＥＰＲＯＭ、ＥＥＰＲＯＭなどによって構成されており、ＣＰＵ１１０ａに実行されるコンピュータプログラムおよびこれに用いるデータなどが記録されている。
【００５３】
ＲＡＭ１１０ｃは、ＳＲＡＭまたはＤＲＡＭなどによって構成されている。ＲＡＭ１１０ｃは、ＲＯＭ１１０ｂおよびハードディスク１１０ｄに記録されているコンピュータプログラムの読み出しに用いられる。また、これらのコンピュータプログラムを実行するときに、ＣＰＵ１１０ａの作業領域として利用される。
【００５４】
ハードディスク１１０ｄは、オペレーティングシステムおよびアプリケーションプログラムなど、ＣＰＵ１１０ａに実行させるための種々のコンピュータプログラムおよび該コンピュータプログラムの実行に用いるデータが格納されている。本実施形態におけるハードディスク１１０ｄに格納されているデータには、複数の健常者における対応する遺伝子の転写産物の発現量に関するデータ（以下、「格納発現量データ」という）、疾患判定用遺伝子群に関するデータ（以下、「疾患判定用遺伝子群データ」という）および被験者が判定対象疾患であるか否かを判定するための判定式が含まれている。ここで、該判定式は、上記の判別分析の手法を用いて、健常者から採取された生体試料を用いて求められる予め得られた平均値と、判定対象疾患の患者から採取された生体試料を用いて求められる予め得られた平均値とに基づいて得られた判定式である。なお、後述するアプリケーションプログラム１４０ａも、このハードディスク１１０ｄにインストールされている。
【００５５】
読出装置１１０ｅは、フレキシブルディスクドライブ、ＣＤ−ＲＯＭドライブ、またはＤＶＤ−ＲＯＭドライブなどによって構成されており、可搬型記録媒体１４０に記録されたコンピュータプログラムまたはデータを読み出すことができる。また、可搬型記録媒体１４０には、コンピュータに本実施形態の方法を実行させるためのアプリケーションプログラム１４０ａが格納されており、ＣＰＵ１１０ａが当該可搬型記録媒体１４０から本発明に係るアプリケーションプログラム１４０ａを読み出し、該アプリケーションプログラム１４０ａをハードディスク１１０ｄにインストールすることが可能である。
【００５６】
なお、上記のアプリケーションプログラム１４０ａは、可搬型記録媒体１４０によって提供されるのみならず、電気通信回線（有線、無線を問わない）によってコンピュータ本体１１０と通信可能に接続された外部の機器から前記電気通信回線を通じて提供することも可能である。例えば、上記のアプリケーションプログラム１４０ａがインターネット上のサーバコンピュータのハードディスク内に格納されており、このサーバコンピュータにＣＰＵ１１０aがアクセスして、該アプリケーションプログラムをダウンロードし、これをハードディスク１１０ｄにインストールすることも可能である。
【００５７】
また、ハードディスク１１０ｄには、例えば米国マイクロソフト社が製造販売するＷｉｎｄｏｗｓ（登録商標）などのグラフィカルユーザインタフェース環境を提供するオペレーティングシステムがインストールされている。以下の説明においては、本実施形態に係るアプリケーションプログラム１４０ａは、該オペレーティングシステム上で動作するものとしている。
【００５８】
入出力インタフェース１１０ｆは、例えば、ＵＳＢ、ＩＥＥＥ１３９４、ＲＳ−２３２Ｃなどのシリアルインタフェース、ＳＣＳＩ、ＩＤＥ、ＩＥＥＥ１２８４などのパラレルインタフェース、およびＤ／Ａ変換器、Ａ／Ｄ変換器などからなるアナログインタフェースなどから構成されている。入出力インタフェース１１０ｆには、転写産物発現量測定装置１が、ケーブル３を介して接続されており、転写産物発現量測定装置１で測定される発現量のデータを、コンピュータ本体１１０に入力することが可能である。また、入出力インタフェース１１０ｆには、キーボードおよびマウスからなる入力部１３０が接続されており、ユーザが該入力部１３０を使用することにより、コンピュータ本体１１０にデータを入力することが可能である。
【００５９】
画像出力インタフェース１１０ｇは、ＬＣＤまたはＣＲＴなどで構成されたディスプレイ１２０に接続されており、ＣＰＵ１１０ａから与えられた画像データに応じた映像信号をディスプレイ１２０に出力するようになっている。ディスプレイ１２０は、入力された映像信号にしたがって、画像（画面）を表示する。
【００６０】
本発明のプログラムによる手段としてのより具体的なコンピュータ２の動作のフローチャートを、図３に示す。
まず、遺伝子の転写産物発現量測定装置１で遺伝子の転写産物の発現量が測定されると、転写産物発現量測定装置１が、コンピュータ２に、測定された発現量に関するデータ（以下、「測定発現量データ」という）を出力する。ＣＰＵ１１０aは、出力された測定発現量データを受け付け、ＲＡＭ１１０ｃに記憶する（ステップＳ１１）。
【００６１】
次いで、ＣＰＵ１１０aは、ハードディスク１１０ｄに予め格納された格納発現量データを読み出し、入力された測定発現量データおよび格納発現量データに基づいて、偏差を表す値を示すデータ（以下、「偏差データ」という）を取得する（ステップＳ１２）。
【００６２】
次いで、ＣＰＵ１１０aは、ハードディスク１１０ｄに予め格納された疾患判定用遺伝子群データを読み出し、偏差データに対応する遺伝子が疾患判定用遺伝子群か否かを判定することで、取得された偏差データを、疾患判定用遺伝子群により分類する（ステップＳ１３）。
【００６３】
次いで、ＣＰＵ１１０aは、疾患判定用遺伝子群により分類された偏差データを用いて、それぞれの疾患判定用遺伝子群毎に、偏差を表す値の平均値を示すデータ（以下、「平均値データ」という）を取得する（ステップＳ１４）。
【００６４】
次いで、ＣＰＵ１１０aは、ハードディスク１１０ｄに予め格納された判定式を読み出し、平均値データを該判定式に適用して、被験者が判定対象疾患であるか否かを判定する（ステップＳ１５）。
【００６５】
そして、ＣＰＵ１１０aは、判定式からの該被験者が判定対象疾患であるか否かを判定した結果を、ＲＡＭ１１０ｃに格納するとともに、画像出力インタフェース１１０ｇを介してコンピュータのディスプレイ１２０に表示する（ステップＳ１６）。
【００６６】
なお、本実施形態においては、ＣＰＵ１１０aは、測定発現量データを、転写産物発現量測定装置１から、入出力インタフェース１１０ｆを介して取得したが、これに限定されるものではない。例えば、コンピュータ２とは独立した転写産物発現量測定装置で得られた遺伝子の転写産物の発現量を、操作者が、入力部１３０を用いてコンピュータ２に入力することで、コンピュータ２に測定発現量データを入力することもできる。
【００６７】
また、コンピュータを、疾患判定用遺伝子を同定する手段としてさらに機能させる場合の本発明のプログラムによる、具体的なコンピュータ２の動作のフローチャートを、図４に示す。なお、本実施形態におけるハードディスク１１０ｄには、遺伝子がコードする分子の機能に基づく分類系統に関するデータ（以下、「分類系統データ」という）が格納されている。
【００６８】
まず、遺伝子の転写産物発現量測定装置１で複数の患者および複数の健常者の遺伝子の転写産物の発現量が測定されると、転写産物発現量測定装置１が、コンピュータ２に、複数の患者の測定された発現量に関するデータ（以下、「患者測定発現量データ」という）および複数の健常者の測定された発現量に関するデータ（以下、「健常者測定発現量データ」という）を出力する。ＣＰＵ１１０aは、出力された患者測定発現量データおよび健常者測定発現量データを受け付け、ＲＡＭ１１０ｃに記憶する（ステップＳ２１）。
【００６９】
次いで、ＣＰＵ１１０aは、入力された複数の患者のそれぞれについての患者測定発現量データを複数の健常者における対応する遺伝子の転写産物の健常者測定発現量データに基づいて標準化することにより、複数の患者のそれぞれについての偏差を表す値を示すデータ（以下、「患者偏差データ」という）を取得し、また、複数の健常者のそれぞれについての測定発現量データを標準化することにより、複数の健常者のそれぞれについての偏差を表す値を示すデータ（以下、「健常者偏差データ」という）を取得する（ステップＳ２２）。
【００７０】
そして、ＣＰＵ１１０aは、ハードディスク１１０ｄに予め格納された分類系統データを読み出し、患者偏差データを、患者偏差データに対応する遺伝子に基づいて、遺伝子群により分類する。同様に、ＣＰＵ１１０aは、健常者偏差データを、健常者偏差データに対応する遺伝子に基づいて、遺伝子群により分類する。（ステップＳ２３）。
【００７１】
次いで、ＣＰＵ１１０aは、遺伝子群により分類された患者偏差データを用いて、それぞれの遺伝子群毎に、偏差を表す値の平均値を示すデータ（以下、「患者平均値データ」という）を取得する。同様に、ＣＰＵ１１０aは、遺伝子群により分類された健常者偏差データを用いて、それぞれの遺伝子群毎に、偏差を表す値の平均値を示すデータ（以下、「患者平均値データ」という）を取得する（ステップＳ２４）。
【００７２】
次に、ＣＰＵ１１０aは、得られた各遺伝子群の患者平均値データおよび健常者平均値データを用いて、複数の患者についての平均値と複数の健常者についての平均値との間の有意確率を示すデータ（以下、「有意確率データ」という）を取得する（ステップＳ２５）。
【００７３】
次に、ＣＰＵ１１０aは、得られた有意確率データを用いて、有意確率が０．０５以下の遺伝子群を同定する（ステップＳ２６）。
【００７４】
そして、ＣＰＵ１１０aは、同定された遺伝子群を、ＲＡＭ１１０ｃに格納するとともに、画像出力インタフェース１１０ｇを介してコンピュータのディスプレイ１２０に表示する（ステップＳ２７）。
【００７５】
なお、本実施形態においては、ＣＰＵ１１０aは、患者測定発現量データおよび健常者測定発現量データを、転写産物発現量測定装置１から、入出力インタフェース１１０ｆを介して取得したが、これに限定されるものではない。例えば、コンピュータ２とは独立した転写産物発現量測定装置で得られた、複数の患者および複数の健常者の遺伝子の転写産物の発現量を、操作者が入力部１３０を用いてコンピュータ２に入力することで、コンピュータ２に患者測定発現量データおよび健常者測定発現量データを入力することもできる。
【００７６】
また、本実施形態では、ステップＳ２７において、同定された遺伝子群をディスプレイ１２０に表示しているが、該同定された遺伝子群に関するデータを、疾患判定用遺伝子群データとして、ＲＡＭ１１０ｃに格納するだけでもよい。該格納された疾患判定用遺伝子群データは、例えば、図２に示したコンピュータ２の動作において、使用することもできる。
【実施例】
【００７７】
以下の実施例において、本発明をより詳細に説明するが、本発明は、以下の態様に限定されることを意図しない。
【００７８】
実施例１クローン病の罹患の判定方法
（１）クローン病判定用遺伝子群の同定
実施例１においては、クローン病患者および健常者の血液中の遺伝子の転写産物の発現量データとして、遺伝子発現データバンクであるthe Gene Expression Omnibus（GEO；http://www.ncbi.nlm.nih.gov/geoから利用可能）により提供されるデータを用いた。なお、該データは、測定したシグナルの生データを正規化処理したものとして、http://www.ncbi.nlm.nih.gov/sites/GDSbrowser?acc=GDS1615から入手することができる。
（1-1）検体の選択およびプローブセットの絞り込み
上記のデータから、クローン病患者１（29検体）のデータおよび健常者１（21検体）のデータをランダムに選択し、これらのデータをクローン病判定用遺伝子群の同定のためのデータとした。
上記のGEOから入手したクローン病患者および健常者についてのデータは、DNAチップであるGeneChip（登録商標）U133A（Affimetrix社）を用いた解析により得られたものである。このDNAチップには、22283個のプローブセットが配置されているが、これらのプローブセットには、同一の遺伝子に対する複数のプローブセットも含まれる。
そこで、上記のDNAチップのプローブセットに対応する遺伝子において、同一の遺伝子に対する複数のプローブセットが含まれる遺伝子については、最大のシグナル値を示したプローブセットのみを抽出した。さらに、シグナル値が50以下のプローブセットは、測定値の再現性が低いと考えられるので除外した。この結果、9331個のプローブセットに対応する遺伝子について、以下の解析を行った。
【００７９】
（1-2）発現量のＺスコア化
上記のようにして選択された9331個のプローブセットに対応する遺伝子の転写産物について、健常者１（21検体）から得られたシグナル値全てを用いて平均値および標準偏差を取得した。この値を用いて、9331個の遺伝子それぞれについて、以下の式を用いて、該遺伝子それぞれの偏差を表す値（Ｚスコア）を求めた。
Ｚスコア＝（各遺伝子の転写産物のシグナル値−健常者１（21検体）の対応する遺伝子の転写産物のシグナル値の平均値）／健常者１（21検体）の対応する遺伝子の転写産物のシグナル値の標準偏差
【００８０】
（1-3）遺伝子の分類および各遺伝子群での平均値の取得
Gene Ontology（http://www.geneontology.org/index.shtmlから閲覧可能）の分類に基づいて、上記の9331個の遺伝子を遺伝子群（GO Term）に分類し、各GO Term内の遺伝子について上記（1-2）で求めたクローン病患者１（29検体）のＺスコアを平均して、平均値を求めた。
また、健常者１（21検体）についても、上記と同様にして、各GO Termでの平均値を求めた。
【００８１】
（1-4）健常者とクローン病患者との間で有意差のある遺伝子群の選択
上記のようにして得られた健常者とクローン病患者の各GO Termについての平均値を用いてＴ検定を行い、有意確率（ｐ値）を取得した。
用いたGO Termから、得られたｐ値が0.05以下（ｐ値≦5.0E-02）であったGO Termを抽出した。
次に、抽出したGO Termに含まれる全ての遺伝子についてのＺスコアを用いて階層型クラスタリングを行い、同調して変動する遺伝子のクラスタを選択した。なお、クラスタリングには、ソフトウェアCluster3.0（http://bonsai.ims.u-tokyo.ac.jp/^〜mdehoon/software/cluster/software.htmから入手可能）を、その結果の表示にはJavaTreeView (http://sourceforge.net/projects/jtreeview/files/から入手可能)を用いた。
各クラスタに含まれる遺伝子のＺスコアの平均値をクラスタのスコアとし、健常者１（21検体）と、クローン病患者１（29検体）とについてＴ検定を行った。得られたｐ値が0.05以下であったクラスタから、Ｇタンパク質関連遺伝子群、血液凝固関連遺伝子群、酸化ストレス関連遺伝子群、ファゴサイトーシス関連遺伝子群および脂肪酸化関連遺伝子群をクローン病判定用遺伝子群として選択した。これらの遺伝子群ならびに各群に属する遺伝子および各群のｐ値を、表２に示す。
上記の選択された各遺伝子群における健常者１およびクローン病患者１についてのＺスコアの平均値の分布を、図５に示す。
【００８２】
【表２】

【００８３】
（２）本発明の判定方法の精度の評価
（2-1）クローン病判定用遺伝子群の同定に用いた検体についての判定
上記の５つのクローン病判定用遺伝子群のそれぞれにおける健常者１（21検体）およびクローン病患者１（29検体）についての平均値を、それぞれ、サポートベクターマシン（SVM；統計解析ソフトGeneSpringに搭載）に入力した。そして、これらの50検体の平均値が入力されたSVMを用いて、各検体が陽性である（クローン病である）か、または陰性である（健常である）かを、判定した。
この結果を、図６Ａに示す。図６Ａにおいて、「感度」とは、クローン病患者を「陽性」であると判定する割合であり、「特異度」とは、健常者を健常者であると判定する割合である。また、「一致率」とは、クローン病患者を「陽性（＋）」であると判定し、健常者を「陰性（−）」であると判定する割合である。この結果から、本発明の判定方法によれば、９０％以上の感度および特異度で、クローン病患者および健常者を同定できることがわかる。
【００８４】
（2-2）本発明の判定方法の再現性の評価
さらに、本発明の判定方法の再現性を評価するために、上記（1-1）で選択されたデータとは異なるクローン病患者２（30検体）のデータおよび健常者２（21検体）のデータを用いた。そして、これらのデータについて、上記（2-1）でクローン病判定用遺伝子群の同定に用いた検体の平均値が入力されたSVMを用いて判定を行った。
この結果を、図６Ｂに示す。この結果から、本発明の判定方法によれば、クローン病判定用遺伝子群の同定に用いた検体とは異なる検体についても、９５％以上の感度および９０％以上の特異度で、安定して健常者とクローン病患者とを区別できることがわかる。
【００８５】
比較例１従来の判定方法によるクローン病の判定
ここでは、従来の判定方法として、健常者および患者の遺伝子の転写産物の発現量自体に基づいて疾患の罹患を判定する方法を用いた。このような、従来の判定方法を用いて、クローン病の罹患を判定した場合の判定の精度を評価した。
（１）クローン病判定用遺伝子群に属する遺伝子を用いた判定
（1-1）クローン病判定用遺伝子群の同定に用いた検体について
表１の26遺伝子のそれぞれにおける上記の健常者１（21検体）およびクローン病患者１（29検体）についての発現量を、それぞれSVMに入力した。そして、これらの50検体の発現量が入力されたSVMを用いて、各検体が陽性と判定されるか、または陰性と判定されるかについて、判定の精度の評価を行った。
この結果を、図７Ａに示す。この結果から、従来の判定方法によると、１００％の感度および特異度で、クローン病患者および健常者を同定できることがわかる。
【００８６】
（1-2）従来の判定方法の再現性の評価
次いで、従来の判定方法の再現性を評価するために、上記のクローン病患者２（30検体）のデータおよび健常者２（21検体）のデータを用いた。そして、これらの検体について、上記（1-1）で健常者１（21検体）およびクローン病患者１（29検体）についての発現量が入力されたSVMを用いて判定を行った。
この結果を、図７Ｂに示す。この結果から、クローン病判定用遺伝子群の同定に用いた検体とは異なる検体について、従来の判定方法の感度は９０％以上であったが、特異度は６５％以下に低下した。したがって、従来の判定方法では、健常者をクローン病患者であるとして誤った判定結果を示す可能性が、本発明の判定方法よりも高いことがわかる。
【００８７】
（２）クローン病判定用遺伝子群に属する遺伝子とは異なる遺伝子を用いた判定
（2-1）クローン病判定用遺伝子群の同定に用いた検体について
クローン病判定用遺伝子群に属する遺伝子（表１の26遺伝子）とは異なる遺伝子を用いた場合についても検討するため、そのような遺伝子を新たに同定した。具体的には、上記の健常者１（21検体）についての発現量とクローン病患者１（29検体）についての発現量との間の有意確率（ｐ値）をＴ検定により求め、得られたｐ値が0.05以下であった発現量の遺伝子を判定に用いる遺伝子とした。その結果、5個の遺伝子を同定した。これらの遺伝子および各遺伝子のｐ値を、表３に示す。また、各遺伝子における健常者１とクローン病患者１とについて、遺伝子の転写産物の発現量の分布を、図８に示す。
【００８８】
【表３】

【００８９】
これらの遺伝子のそれぞれにおける上記の健常者１（21検体）およびクローン病患者１（29検体）についての発現量を、それぞれSVMに入力した。そして、これらの50検体の発現量が入力されたSVMを用いて、各検体が陽性と判定されるか、または陰性と判定されるかについて、判定の精度の評価を行った。
この結果を、図９Ａに示す。この結果から、クローン病判定用遺伝子群に属する遺伝子とは異なる遺伝子を用いた従来の判定方法によれば、９５％以上の感度および特異度で、クローン病患者および健常者を同定できることがわかる。
【００９０】
（2-2）従来の判定方法の再現性の評価
次いで、上記の5遺伝子を用いる従来の判定方法の再現性を評価するために、上記のクローン病患者２（30検体）のデータおよび健常者２（21検体）のデータを用いた。そして、これらの検体について、上記（2-1）で健常者１（21検体）およびクローン病患者１（29検体）についての発現量が入力されたSVMを用いて判定を行った。
この結果を、図９Ｂに示す。この結果から、クローン病判定用遺伝子群の同定に用いた検体とは異なる検体について、従来の判定方法の感度は９０％以上であったが、特異度は４０％以下に低下していた。したがって、クローン病判定用遺伝子群に属する遺伝子とは異なる遺伝子を用いた従来の判定方法では、健常者をクローン病患者であるとして誤った判定結果を示す可能性が、本発明の判定方法よりも高いことがわかる。
【００９１】
実施例１および比較例１の結果から、本発明の判定方法は、健常者およびクローン病患者の遺伝子の転写産物の発現量自体に基づいてクローン病の罹患を判定する通常の方法よりも、高い精度の判定を安定して行い得ることがわかる。
【００９２】
実施例２ハンチントン病の罹患の判定方法
（１）ハンチントン病判定用遺伝子群の同定
実施例２においては、ハンチントン病患者および健常者の血液中の遺伝子の転写産物の発現量データとして、GEOから入手したデータを用いた。なお、該データは、測定したシグナルの生データを正規化処理したものとして、http://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE1751から入手することができる。
（1-1）検体の選択およびプローブセットの絞り込み
上記のデータから、ハンチントン病患者１（6検体）のデータおよび健常者３（7検体）のデータをランダムに選択し、これらのデータをハンチントン病判定用遺伝子群の同定のためのデータとした。
上記のGEOから入手したハンチントン病患者および健常者についてのデータは、GeneChip（登録商標）U133A（Affimetrix社）を用いた解析により得られたものである。実施例１の（1-1）と同様に、上記のDNAチップのプローブセットに対応する遺伝子において、同一の遺伝子に対する複数のプローブセットが含まれる遺伝子については、最大のシグナル値を示したプローブセットのみを抽出した。さらに、シグナル値が50以下のプローブセットは、測定値の再現性が低いと考えられるので除外した。この結果、8370個のプローブセットに対応する遺伝子について、以下の解析を行った。
【００９３】
（1-2）発現量のＺスコア化
上記のようにして選択された8370個のプローブセットに対応する遺伝子の転写産物について、健常者３（7検体）から得られたシグナル値全てを用いて平均値および標準偏差を取得した。この値を用いて、8370個の遺伝子それぞれについて、以下の式を用いて、該遺伝子それぞれの偏差を表す値（Ｚスコア）を求めた。
Ｚスコア＝（各遺伝子の転写産物のシグナル値−健常者３（7検体）の対応する遺伝子の転写産物のシグナル値の平均値）／健常者３（7検体）の対応する遺伝子の転写産物のシグナル値の標準偏差
【００９４】
（1-3）遺伝子の分類および各遺伝子群での平均値の取得
Gene Ontologyの分類に基づいて、上記の8370個の遺伝子を遺伝子群（GO Term）に分類し、各GO Term内の遺伝子について上記（1-2）で求めたハンチントン病患者１（6検体）のＺスコアを平均して、平均値を求めた。
また、健常者３（7検体）についても、上記と同様にして、各GO Termでの平均値を求めた。
【００９５】
（1-4）健常者とハンチントン病患者との間で有意差のある遺伝子群の選択
上記のようにして得られた健常者とハンチントン病患者の各GO Termについての平均値を用いてＴ検定を行い、有意確率（ｐ値）を取得した。
用いたGO Termから、得られたｐ値が0.05以下（ｐ値≦5.0E-02）であったGO Termを抽出した。
次に、抽出したGO Termに含まれる全ての遺伝子についてのＺスコアを用いて階層型クラスタリングを行い、同調して変動する遺伝子のクラスタを選択した。なお、クラスタリングには、ソフトウェアCluster3.0（http://bonsai.ims.u-tokyo.ac.jp/^〜mdehoon/software/cluster/software.htmから入手可能）を、その結果の表示にはJavaTreeView (http://sourceforge.net/projects/jtreeview/files/から入手可能)を用いた。
各クラスタに含まれる遺伝子のＺスコアの平均値をクラスタのスコアとし、健常者３（7検体）と、ハンチントン病患者１（6検体）とについてＴ検定を行った。得られたｐ値が0.05以下であったクラスタから、微小管関連遺伝子群、ミトコンドリア関連遺伝子群およびプロスタグランジン関連遺伝子群を、ハンチントン病判定用遺伝子群として選択した。これらの遺伝子群ならびに各群に属する遺伝子および各群のｐ値を、表４に示す。
上記選択された各遺伝子群における健常者３およびハンチントン病患者１についてのＺスコアの平均値の分布を、図１０に示す。
【００９６】
【表４】

【００９７】
（２）本発明の判定方法の精度の評価
（2-1）ハンチントン病判定用遺伝子群の同定に用いた検体についての判定
上記の３つのハンチントン病判定用遺伝子群のそれぞれにおける健常者３（7検体）およびハンチントン病患者１（6検体）についての平均値を、それぞれ、SVMに入力した。そして、これらの13検体の平均値が入力されたSVMを用いて、各検体が陽性である（ハンチントン病である）か、または陰性である（健常である）かを、判定した。
この結果を、図１１Ａに示す。この結果から、本発明の判定方法によれば、１００％の感度および特異度で、ハンチントン病患者および健常者を同定できることがわかる。
【００９８】
（2-2）本発明の判定方法の再現性の評価
さらに、本発明の判定方法の再現性を評価するために、上記（1-1）で選択されたデータとは異なるハンチントン病患者２（6検体）のデータおよび健常者４（7検体）のデータを用いた。そして、これらのデータについて、上記（2-1）でハンチントン病判定用遺伝子群の同定に用いた検体の平均値が入力されたSVMを用いて判定を行った。
この結果を、図１１Ｂに示す。この結果から、本発明の判定方法によると、ハンチントン病判定用遺伝子群の同定に用いた検体とは異なる検体についても、８０％以上の感度および１００％の特異度で、安定して健常者とハンチントン病患者とを区別できることがわかる。
【００９９】
比較例２従来の判定方法によるハンチントン病の判定
ここでは、従来の判定方法として、健常者および患者の遺伝子の転写産物の発現量自体に基づいて疾患の罹患を判定する方法を用いた。このような、従来の判定方法を用いて、ハンチントン病の罹患を判定した場合の判定の精度を評価した。
（１）ハンチントン病判定用遺伝子群に属する遺伝子を用いた判定
（1-1）ハンチントン病判定用遺伝子群の同定に用いた検体について
表３の27遺伝子のそれぞれにおける上記の健常者３（7検体）およびハンチントン病患者１（6検体）についての発現量を、それぞれSVMに入力した。そして、これらの13検体の発現量が入力されたSVMを用いて、各検体が陽性と判定されるか、または陰性と判定されるかについて、判定の精度の評価を行った。
この結果を、図１２Ａに示す。この結果から、従来の判定方法によれば、１００％の感度および特異度で、ハンチントン病患者および健常者を同定できることがわかる。
【０１００】
（1-2）従来の判定方法の再現性の評価
次いで、従来の判定方法の再現性を評価するために、上記のハンチントン病患者２（6検体）のデータおよび健常者4（7検体）のデータを用いた。そして、これらの検体について、上記（1-1）で健常者３（7検体）およびハンチントン病患者１（6検体）についての発現量が入力されたSVMを用いて判定を行った。
この結果を、図１２Ｂに示す。この結果から、ハンチントン病判定用遺伝子群の同定に用いた検体とは異なる検体について、従来の判定方法の特異度は１００％であったが、感度は７０％以下に低下した。したがって、従来の判定方法では、ハンチントン病患者を健常者であるとして誤った判定結果を示す可能性が、本発明の判定方法よりも高いことがわかる。
【０１０１】
（２）ハンチントン病判定用遺伝子群に属する遺伝子とは異なる遺伝子を用いた判定
（2-1）ハンチントン病判定用遺伝子群の同定に用いた検体について
ハンチントン病判定用遺伝子群に属する遺伝子（表３の27遺伝子）とは異なる遺伝子を用いた場合についても検討するため、そのような遺伝子を新たに同定した。具体的には、上記の健常者３（7検体）についての発現量とハンチントン病患者１（6検体）についての発現量との間の有意確率（ｐ値）をＴ検定により求め、得られたｐ値が0.05以下であった発現量の遺伝子を判定に用いる遺伝子とした。その結果、10個の遺伝子を同定した。これらの遺伝子および各遺伝子のｐ値を、表５に示す。また、各遺伝子における健常者３とハンチントン病患者１とについて、遺伝子の転写産物の発現量の分布を、図１３に示す。
【０１０２】
【表５】

【０１０３】
これらの遺伝子のそれぞれにおける上記の健常者３（7検体）およびハンチントン病患者１（6検体）についての発現量を、それぞれSVMに入力した。そして、これらの13検体の発現量が入力されたSVMを用いて、各検体が陽性と判定されるか、または陰性と判定されるかについて、判定の精度の評価を行った。
この結果を、図１４Ａに示す。この結果から、ハンチントン病判定用遺伝子群に属する遺伝子とは異なる遺伝子を用いた従来の判定方法によれば、１００％の感度および特異度で、ハンチントン病患者および健常者を同定できることがわかる。
【０１０４】
（2-2）従来の判定方法の再現性の評価
次いで、上記の10遺伝子を用いる従来の判定方法の再現性を評価するために、上記のハンチントン病患者２（6検体）のデータおよび健常者４（7検体）のデータを用いた。そして、これらの検体について、上記（2-1）で健常者３（7検体）およびハンチントン病患者１（6検体）についての発現量が入力されたSVMを用いて判定を行った。
この結果を、図１４Ｂに示す。この結果から、ハンチントン病判定用遺伝子群の同定に用いた検体とは異なる検体について、従来の判定方法の特異度は１００％であったが、感度は５０％に低下していた。したがって、ハンチントン病判定用遺伝子群に属する遺伝子とは異なる遺伝子を用いた従来の判定方法では、ハンチントン病患者を健常者であるとして誤った判定結果を示す可能性が、本発明の判定方法よりも高いことがわかる。
【０１０５】
実施例２および比較例２の結果から、本発明の判定方法は、健常者およびハンチントン病患者の遺伝子の転写産物の発現量自体に基づいてハンチントン病の罹患を判定する通常の方法よりも、高い精度の判定を安定して行い得ることがわかる。
【０１０６】
実施例３子宮内膜症の罹患の判定方法
（１）子宮内膜症判定用遺伝子群の同定
実施例３においては、子宮内膜症患者の病変部組織および正常組織のそれぞれから得た遺伝子の転写産物の発現量データとして、GEOから入手したデータを用いた。なお、該データは、測定したシグナルの生データを正規化処理したものとして、http://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE7305およびhttp://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE6364から入手することができる。
（1-1）検体の選択およびプローブセットの絞り込み
上記のデータから、病変部組織１（9検体）のデータおよび正常組織１（8検体）のデータをランダムに選択し、これらのデータを子宮内膜症判定用遺伝子群の同定のためのデータとした。
上記のGEOから入手した病変部組織および正常組織についてのデータは、DNAチップであるGeneChip（登録商標）U133 plus2.0（Affimetrix社）を用いた解析により得られたものである。このDNAチップには、54675個のプローブセットが配置されているが、これらのプローブセットには、同一の遺伝子に対する複数のプローブセットも含まれる。
そこで、上記のDNAチップのプローブセットに対応する遺伝子において、同一の遺伝子に対する複数のプローブセットが含まれる遺伝子については、最大のシグナル値を示したプローブセットのみを抽出した。さらに、シグナル値が100以下のプローブセットは、測定値の再現性が低いと考えられるので除外した。この結果、16207個のプローブセットに対応する遺伝子について、以下の解析を行った。
【０１０７】
（1-2）発現量のＺスコア化
上記のようにして選択された16207個のプローブセットに対応する遺伝子の転写産物について、正常組織１（8検体）から得られたシグナル値全てを用いて平均値および標準偏差を取得した。この値を用いて、16207個の遺伝子それぞれについて、以下の式を用いて、該遺伝子それぞれの偏差を表す値（Ｚスコア）を求めた。
Ｚスコア＝（各遺伝子の転写産物のシグナル値−正常組織１（8検体）の対応する遺伝子の転写産物のシグナル値の平均値）／正常組織１（8検体）の対応する遺伝子の転写産物のシグナル値の標準偏差
【０１０８】
（1-3）遺伝子の分類および各遺伝子群での平均値の取得
Gene Ontologyの分類に基づいて、上記の16207個の遺伝子を遺伝子群（GO Term）に分類し、各GO Term内の遺伝子について上記（1-2）で求めた病変部組織１（9検体）のＺスコアを平均して、平均値を求めた。
また、正常組織１（8検体）についても、上記と同様にして、各GO Termでの平均値を求めた。
【０１０９】
（1-4）正常組織と病変部組織との間で有意差のある遺伝子群の選択
上記のようにして得られた正常組織および病変部組織の各GO Termについての平均値を用いてＴ検定を行い、有意確率（ｐ値）を取得した。
用いたGO Termから、得られたｐ値が0.05以下（ｐ値≦5.0E-02）であったGO Termを抽出した。
次に、抽出したGO Termに含まれる全ての遺伝子についてのＺスコアを用いて階層型クラスタリングを行い、同調して変動する遺伝子のクラスタを選択した。なお、クラスタリングには、ソフトウェアCluster3.0（http://bonsai.ims.u-tokyo.ac.jp/^〜mdehoon/software/cluster/software.htmから入手可能）を、その結果の表示にはJavaTreeView (http://sourceforge.net/projects/jtreeview/files/から入手可能)を用いた。
各クラスタに含まれる遺伝子のＺスコアの平均値をクラスタのスコアとし、正常組織１（8検体）と、病変部組織１（9検体）とについてＴ検定を行った。得られたｐ値が0.05以下であったクラスタから、サイトカイン合成経路関連遺伝子群、サイトカイン媒介シグナル関連遺伝子群およびイムノグロブリン媒介免疫反応関連遺伝子群を、子宮内膜症判定用遺伝子群として選択した。これらの遺伝子群ならびに各群に属する遺伝子および各群のｐ値を、表６に示す。
上記の選択された各遺伝子群における正常組織１および病変部組織１についてのＺスコアの平均値の分布を、図１５に示す。
【０１１０】
【表６】

【０１１１】
（２）本発明の判定方法の精度の評価
（2-1）子宮内膜症判定用遺伝子群の同定に用いた検体についての判定
上記の３つの子宮内膜症判定用遺伝子群のそれぞれにおける正常組織１（8検体）および病変部組織１（9検体）についての平均値を、それぞれ、SVMに入力した。そして、これらの17検体の平均値が入力されたSVMを用いて、各検体が陽性である（子宮内膜症である）か、または陰性である（健常である）かを、判定した。
この結果を、図１６Ａに示す。この結果から、本発明の判定方法によれば、８５％以上の感度および１００％の特異度で、正常組織および病変部組織についての検体を同定できることがわかる。
【０１１２】
（2-2）本発明の判定方法の再現性の評価
さらに、本発明の判定方法の再現性を評価するために、上記（1-1）で選択されたデータとは異なる病変部位組織２（9検体）のデータおよび正常組織２（8検体）のデータを用いた。そして、これらのデータについて、上記（2-1）で子宮内膜症判定用遺伝子群の同定に用いた検体の平均値が入力されたSVMを用いて判定を行った。
この結果を、図１６Ｂに示す。この結果から、本発明の判定方法によれば、子宮内膜症判定用遺伝子群の同定に用いた検体とは異なる検体についても、７５％の感度および８５％以上の特異度で、安定して正常組織についての検体と病変部組織についての検体とを区別できることがわかる。
【０１１３】
比較例３従来の判定方法による子宮内膜症の判定
ここでは、従来の判定方法として、健常者および患者の遺伝子の転写産物の発現量自体に基づいて疾患の罹患を判定する方法を用いた。このような、従来の判定方法を用いて、子宮内膜症の病変部組織についての検体を判定した場合の判定の精度を評価した。
（１）子宮内膜症判定用遺伝子群に属する遺伝子を用いた判定
（1-1）子宮内膜症病判定用遺伝子群の同定に用いた検体について
表５の39遺伝子のそれぞれにおける上記の正常組織１（8検体）および病変部組織１（9検体）についての発現量を、それぞれSVMに入力した。そして、これらの17検体の発現量が入力されたSVMを用いて、各検体が陽性と判定されるか、または陰性と判定されるかについて、判定の精度の評価を行った。
この結果を、図１７Ａに示す。この結果から、従来の判定方法によれば、１００％の感度および特異度で、正常組織および病変部組織についての検体を同定できることがわかる。
【０１１４】
（1-2）従来の判定方法の再現性の評価
次いで、従来の判定方法の再現性を評価するために、上記の正常組織２（8検体）および病変部組織２（9検体）のデータを用いた。そして、これらの検体について、上記（1-1）で正常組織１（8検体）および病変部組織１（9検体）についての発現量が入力されたSVMを用いて判定を行った。
この結果を、図１７Ｂに示す。この結果から、子宮内膜症判定用遺伝子群の同定に用いた検体とは異なる検体について、従来の判定方法の特異度は１００％であったが、感度は６５％以下に低下した。したがって、従来の判定方法では、子宮内膜症患者を健常者であるとして誤った判定結果を示す可能性が、本発明の判定方法よりも高いことがわかる。
【０１１５】
（２）子宮内膜症判定用遺伝子群に属する遺伝子とは異なる遺伝子を用いた判定
（2-1）子宮内膜症判定用遺伝子群の同定に用いた検体について
子宮内膜症判定用遺伝子群に属する遺伝子（表５の39遺伝子）とは異なる遺伝子を用いた場合についても検討するため、そのような遺伝子を新たに同定した。具体的には、上記の正常組織１（8検体）についての発現量と病変部組織１（9検体）についての発現量との間の有意確率（ｐ値）をＴ検定により求め、得られたｐ値が0.05以下であった発現量の遺伝子を判定に用いる遺伝子とした。その結果、10個の遺伝子を同定した。これらの遺伝子および各遺伝子のｐ値を、表７に示す。また、各遺伝子における健常者３と子宮内膜症患者１とについて、遺伝子の転写産物の発現量の分布を、図１８に示す。
【０１１６】
【表７】

【０１１７】
これらの遺伝子のそれぞれにおける上記の正常組織１（8検体）および病変部組織１（9検体）についての発現量を、それぞれSVMに入力した。そして、これらの17検体の発現量が入力されたSVMを用いて、各検体が陽性と判定されるか、または陰性と判定されるかについて、判定の精度の評価を行った。
この結果を、図１９Ａに示す。この結果から、子宮内膜症判定用遺伝子群に属する遺伝子とは異なる遺伝子を用いた従来の判定方法によれば、１００％の感度および特異度で、正常組織および病変部組織についての検体を同定できることがわかる。
【０１１８】
（2-2）従来の判定方法の再現性の評価
次いで、上記の10遺伝子を用いる従来の判定方法の再現性を評価するために、上記の正常組織２（8検体）のデータおよび正常組織２（8検体）のデータを用いた。そして、これらの検体について、上記（2-1）で健常者３（7検体）および子宮内膜症患者１（6検体）についての発現量が入力されたSVMを用いて判定を行った。
この結果を、図１９Ｂに示す。この結果から、子宮内膜症判定用遺伝子群の同定に用いた検体とは異なる検体について、従来の判定方法の特異度は１００％であったが、感度は０％に低下していた。したがって、子宮内膜症判定用遺伝子群に属する遺伝子とは異なる遺伝子を用いた従来の判定方法では、子宮内膜症患者を健常者であるとして誤った判定結果を示す可能性が、本発明の判定方法よりも極めて高いことがわかる。
【０１１９】
実施例３および比較例３の結果から、本発明の判定方法は、健常者および子宮内膜症患者の遺伝子の転写産物の発現量自体に基づいて子宮内膜症の罹患を判定する通常の方法よりも、高い精度の判定を安定して行い得ることがわかる。
【符号の説明】
【０１２０】
１遺伝子の転写産物発現量測定装置
２コンピュータ
３ケーブル
１１０本体
１１０ａＣＰＵ
１１０ｂＲＯＭ
１１０ｃＲＡＭ
１１０ｄハードディスク
１１０ｅ読出装置
１１０ｆ入出力インタフェース
１１０ｇ画像出力インタフェース
１１０ｈバス
１２０ディスプレイ
１３０入力部

【特許請求の範囲】
【請求項１】
（１）判定対象疾患の罹患が疑われる被験者から得られた生体試料中の、前記疾患と関連する少なくとも２つの疾患判定用遺伝子群それぞれにおいて、遺伝子群に属する少なくとも１つの遺伝子の転写産物の発現量を測定する工程と、
（２）前記発現量を複数の健常者における対応する遺伝子の転写産物の発現量に基づいて標準化することにより、偏差を表わす値を取得する工程と、
（３）前記対象疾患判定用遺伝子群それぞれにおいて、遺伝子群に属する遺伝子の偏差を表す値の平均値を取得する工程と、
（４）前記平均値を用いて、前記被験者が対象疾患に罹患しているか否かを判定する工程と
を含む、疾患の罹患判定方法。
【請求項２】
請求項１の第１工程における疾患判定用遺伝子群が、
（ａ）判定対象疾患に罹患した複数の患者のそれぞれおよび複数の健常者のそれぞれから得られた生体試料中の遺伝子の転写産物の発現量を測定する工程と、
（ｂ）前記複数の患者のそれぞれについての発現量を、前記複数の健常者における対応する遺伝子の転写産物の発現量に基づいて標準化することにより、前記複数の患者のそれぞれについての偏差を表す値を取得し、
前記複数の健常者のそれぞれについての発現量を標準化することにより、前記複数の健常者のそれぞれについての偏差を表す値を取得する工程と、
（ｃ）前記発現量を測定した遺伝子を、遺伝子がコードする分子の機能に基づく分類系統を用いて、少なくとも２つの遺伝子群に分類し、
前記複数の患者のそれぞれおよび前記複数の健常者のそれぞれについて、
前記遺伝子群それぞれにおいて、遺伝子群に属する遺伝子の偏差を表す値の平均値を前記遺伝子群の平均値として取得する工程と、
（ｄ）前記複数の患者についての各遺伝子群の平均値と前記複数の健常者についての対応する各遺伝子群の平均値との間の有意確率を取得する工程と、
（ｅ）前記有意確率が０．０５以下である遺伝子群を判定対象疾患と関連する疾患判定用遺伝子群として同定する工程と
により同定される請求項１に記載の方法。
【請求項３】
遺伝子がコードする分子の機能に基づく分類系統が、ジーンオントロジー（Gene Ontology）、京都エンサイクロペディアオブジーンズアンドゲノムス（Kyoto Encyclopedia of Genes and Genomes（KEGG））、メタシック（MetaCyc）、ジンマップ（GenMAPP）、バイオカルタ（BioCarta）、キーモルネット（KeyMolnet）またはオンラインメンデリアンインヘリタンスインマン（Online Mendelian Inheritance in Man（OMIM））である請求項２に記載の方法。
【請求項４】
判定対象疾患が、クローン病、ハンチントン病または子宮内膜症から選択される請求項１〜３のいずれか１項に記載の方法。
【請求項５】
判定対象疾患がクローン病であり、疾患判定用遺伝子群が、Ｇタンパク質関連遺伝子群、血液凝固関連遺伝子群、酸化ストレス関連遺伝子群、ファゴサイトーシス関連遺伝子群または脂肪酸化関連遺伝子群から選択される少なくとも２つである請求項１〜４のいずれか１項に記載の方法。
【請求項６】
判定対象疾患がハンチントン病であり、疾患判定用遺伝子群が、微小管関連遺伝子群、ミトコンドリア関連遺伝子群またはプロスタグランジン関連遺伝子群から選択される少なくとも２つである請求項１〜４のいずれか１項に記載の方法。
【請求項７】
判定対象疾患が子宮内膜症であり、疾患判定用遺伝子群が、サイトカイン合成経路関連遺伝子群、サイトカイン媒介シグナル関連遺伝子群またはイムノグロブリン媒介免疫反応関連遺伝子群から選択される少なくとも２つである請求項１〜４のいずれか１項に記載の方法。
【請求項８】
遺伝子の転写産物の発現量を測定する工程において、少なくとも３つの疾患判定用遺伝子群それぞれにおいて、遺伝子群に属する少なくとも１つの遺伝子の発現量を測定する請求項１〜７のいずれか１項に記載の方法。
【請求項９】
Ｇタンパク質関連遺伝子群の遺伝子が、遺伝子シンボルで表してGNG3、GNG7、GNA15、GNB5、GNAS、GNG5、GNG11、GNB1およびGNG4で表される遺伝子からなる群より選択され、
血液凝固関連遺伝子群の遺伝子が、遺伝子シンボルで表してGP1BA、GP1BB、ITGB3、GP9およびF13A1で表される遺伝子からなる群より選択され、
酸化ストレス関連遺伝子群の遺伝子が、遺伝子シンボルで表してGPX1、PTGS1、CLUおよびPDLIM1で表される遺伝子からなる群より選択され、
ファゴサイトーシス関連遺伝子群の遺伝子が、遺伝子シンボルで表してFCER1G、CLEC7A、VAMP7およびFCGR1Aで表される遺伝子からなる群より選択され、
脂肪酸化関連遺伝子群の遺伝子が、遺伝子シンボルで表してACOX1、ADIPOR2、ADIPOR1およびALOX12で表される遺伝子からなる群より選択される、
請求項５に記載の方法。
【請求項１０】
微小管関連遺伝子群の遺伝子が、遺伝子シンボルで表してDYNC1LI1、DYNLL1、DYNLT1、およびDYNLT3で表される遺伝子からなる群より選択され、
ミトコンドリア関連遺伝子群の遺伝子が、遺伝子シンボルで表してATP5F1、ATP5J、ATP5L、ATP5C1、ATP5O、COX6A1、COX7A2、CYCS、MRPL18、MRPS35、NDUFA4、NDUFA9、NDUFB1、NDUFB3、NDUFB5、NDUFC1、NDUFS4、TIMM17A、TIMM8B、TOMM20、TOMM7、UQCRH、UQCRおよびUQCRQで表される遺伝子からなる群より選択され、
プロスタグランジン関連遺伝子群の遺伝子が、遺伝子シンボルで表してPTGER2、PTGER4およびPTGES3で表される遺伝子からなる群より選択される、
請求項６に記載の方法。
【請求項１１】
サイトカイン合成経路関連遺伝子群の遺伝子が、遺伝子シンボルで表してCEBPEおよびCD28で表される遺伝子からなる群より選択され、
サイトカイン媒介シグナル関連遺伝子群の遺伝子が、遺伝子シンボルで表してEREG、STAT3、STAT5A、STAT5B、SOCS1、SOCS5、RELA、CEBPA、DUOX2、DUOX1、STAT4、ZNF675、IL2RB、IRAK3、KIT、LRP8、TNFRSF1A、PLP2、TNFRSF1B、TGM2、CCR1、CCR2、PF4、CX3CL1、IL1R1、CSF2RB、CLCF1およびNUP85で表される遺伝子からなる群より選択され、
イムノグロブリン媒介免疫反応関連遺伝子群の遺伝子が、遺伝子シンボルで表してIGHG3、IGHM、CD74、FCER1G、BCL10、PRKCD、CD27、MYD88およびTLR8で表される遺伝子からなる群より選択される、
請求項７に記載の方法。
【請求項１２】
生体試料が、血液である請求項１〜１１のいずれか１項に記載の方法。
【請求項１３】
判定工程が、判定対象疾患の罹患が疑われる被験者から取得された平均値を、健常者から採取された生体試料を用いて前記測定工程および取得工程と同様にして予め得られた平均値と、判定対象疾患に罹患した患者から採取された生体試料を用いて前記測定工程および取得工程と同様にして予め得られた平均値とに基づいて得られる判定式に入力することにより行われる請求項１〜１２のいずれか１項に記載の方法。
【請求項１４】
判定式が、判別分析の手法を用いて作成される請求項１３に記載の方法。
【請求項１５】
判別分析の手法が、サポートベクターマシン、線形判別分析、ニューラルネットワーク、ｋ近傍識別器、決定木またはランダムフォレストである、請求項１４に記載の方法。
【請求項１６】
コンピュータを、
判定対象疾患の罹患が疑われる被験者から得られた生体試料中の、前記疾患と関連する少なくとも２つの疾患判定用遺伝子群それぞれにおいて、遺伝子群に属する少なくとも１つの遺伝子の転写産物の発現量を受け付ける受付手段、
前記発現量を複数の健常者における対応する遺伝子の発現量に基づいて標準化することにより偏差を表わす値を取得する偏差取得手段、
前記疾患判定用遺伝子群それぞれにおいて、遺伝子群に属する遺伝子の偏差を表す値の平均値を取得する平均値取得手段、
前記平均値を用いて、被験者が対象疾患に罹患しているか否かを判定する判定手段、
判定手段の判定結果を出力する出力手段
として機能させるための疾患の罹患判定用プログラム。
【請求項１７】
コンピュータを、
判定対象疾患に罹患した複数の患者のそれぞれおよび複数の健常者のそれぞれから得られた生体試料中の遺伝子の転写産物の発現量を受け付ける受付手段、
前記複数の患者のそれぞれについての発現量を、前記複数の健常者における対応する遺伝子の転写産物の発現量に基づいて標準化することにより、前記複数の患者のそれぞれの偏差を表わす値を取得し、前記複数の健常者のそれぞれについての発現量を標準化することにより、前記複数の健常者のそれぞれの偏差を表わす値を取得する偏差取得手段、
前記発現量を測定された遺伝子を、遺伝子がコードする分子の機能に基づく分類系統による分類に従って、少なくとも２つの遺伝子群に分類し、前記複数の患者のそれぞれおよび前記複数の患者のそれぞれについて、前記遺伝子群それぞれにおいて、遺伝子群に属する遺伝子の偏差を表す値の平均値を前記遺伝子群の平均値として取得する平均値取得手段、
前記複数の患者についての各遺伝子群の平均値と前記複数の健常者についての対応する各遺伝子群の平均値との間の有意確率を取得する有意確率取得手段、
前記有意確率が0.05以下である遺伝子群を判定対象疾患と関連する疾患判定用遺伝子群として同定する遺伝子群同定手段、
としてさらに機能させる請求項１６に記載のプログラム。
【請求項１８】
判定手段が判別分析の手法を含む請求項１６または１７に記載のプログラム。

【図１】