疾患の罹患の判定方法
【課題】被験者が判定対象疾患に罹患しているか否かの判定を正確に安定して行うことができる方法を提供することを目的とする。
【解決手段】判定対象疾患の罹患が疑われる被験者から採取された生体試料中の、該疾患と関連する遺伝子群に属する少なくとも1つの遺伝子の転写産物の発現量を測定し、健常者から得られる生体試料中の対応する遺伝子の転写産物の発現量からの偏差を表す値を取得し、この偏差を表す値を遺伝子群内で平均化し、少なくとも2つのカテゴリーについて求めた平均化された値を用いて判定する方法により、上記の課題を解決する。
【解決手段】判定対象疾患の罹患が疑われる被験者から採取された生体試料中の、該疾患と関連する遺伝子群に属する少なくとも1つの遺伝子の転写産物の発現量を測定し、健常者から得られる生体試料中の対応する遺伝子の転写産物の発現量からの偏差を表す値を取得し、この偏差を表す値を遺伝子群内で平均化し、少なくとも2つのカテゴリーについて求めた平均化された値を用いて判定する方法により、上記の課題を解決する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、被験者が判定対象の疾患に罹患しているか否かを判定するための方法に関する。より具体的には、本発明は、被験者から採取された生体試料中のある特定の遺伝子の転写産物の発現量の測定に基づいて、該被験者が判定対象の疾患に罹患しているか否かを判定できる方法に関する。
【背景技術】
【0002】
多数の遺伝子またはそれらの転写産物の発現量の網羅的解析は、ある特定の疾患に関連して発現量が変化する遺伝子を見出すことができるので、該疾患の罹患を判定するのに利用できる可能性が期待されている。そのため、そのような網羅的解析のデータに基づいて、被験者がある特定の疾患に罹患しているか否かを判定する方法についての研究が、これまでに数多く行われてきた。
しかしながら、遺伝子またはその転写産物の発現量の網羅的解析においては、偽陽性の遺伝子も多数検出されることや、測定系による誤差、遺伝子発現の再現性の不良などのため、真に有意な発現量の変化を示す遺伝子を抽出することは困難であるという問題が存在する。
【0003】
一方、そのような問題を解決するために、現在までに解析データに対する様々な統計的手法が研究および開発されてきた。
例えば、特開2005−323573号公報(特許文献1)は、DNAマイクロアレイから得た遺伝子の発現量データを多変量解析することで、異なる2条件間での遺伝子発現が有意に異なるかを判定する方法を開示している。
また、特表2007−524408号公報(特許文献2)は、細胞内グルタチオンレベルの調節に関与する遺伝子の発現レベルに基づいて、精神障害を診断する方法を開示している。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2005−323573号公報
【特許文献2】特表2007−524408号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
このように、真に有意な発現量の変化を示す遺伝子を抽出するための研究が数多くなされているにもかかわらず、疾患の罹患の判定に普遍的に有効な統計的手法は、未だ得られていないのが現状である。
そこで、本発明は、判定対象の疾患の罹患が疑われる被験者が、該疾患に罹患しているか否かの判定を正確に安定して行うことができる方法を提供することを目的とする。
【課題を解決するための手段】
【0006】
本発明者らは、上記の課題を解決するために鋭意研究を重ねた結果、判定対象の疾患の罹患が疑われる被験者からの生体試料中のある特定のカテゴリー(遺伝子群)に属する少なくとも1つの遺伝子の転写産物の発現量を測定し、健常者から得られる生体試料中の対応する遺伝子の転写産物の発現量からの偏差を表す値を取得し、この偏差を表す値をカテゴリー内で平均化し、少なくとも2つのカテゴリーについて求めた平均化された値を用いることにより、判定対象疾患に罹患している被験者を、健常者から明確に安定して区別できることを見出して、本発明を完成した。
【0007】
よって、本発明は、
(1)判定対象疾患の罹患が疑われる被験者から得られた生体試料中の、前記疾患と関連する少なくとも2つの疾患判定用遺伝子群それぞれにおいて、遺伝子群に属する少なくとも1つの遺伝子の転写産物の発現量を測定する工程と、
(2)前記発現量を複数の健常者における対応する遺伝子の転写産物の発現量に基づいて標準化することにより、偏差を表わす値を取得する工程と、
(3)前記遺伝子群それぞれにおいて、遺伝子群に属する遺伝子についての偏差を表す値の平均値を取得する工程と、
(4)前記平均値を用いて、前記被験者が対象疾患に罹患しているか否かを判定する工程と
を含む、疾患の罹患判定方法を提供する。
【0008】
また、本発明は、コンピュータを、
判定対象疾患の罹患が疑われる被験者から得られた生体試料中の、前記疾患と関連する少なくとも2つの疾患判定用遺伝子群それぞれにおいて、遺伝子群に属する少なくとも1つの遺伝子の転写産物の発現量を受け付ける受付手段、
前記発現量を複数の健常者における対応する遺伝子の発現量に基づいて標準化することにより偏差を表わす値を取得する偏差取得手段、
前記遺伝子群それぞれにおいて、遺伝子群に属する遺伝子の偏差を表す値の平均値を取得する平均値取得手段、
前記平均値を用いて、被験者が対象疾患に罹患しているか否かを判定する判定手段、
判定手段の判定結果を出力する出力手段
として機能させるための疾患の罹患判定用プログラムも提供する。
【発明の効果】
【0009】
本発明の判定方法によると、判定対象疾患の罹患が疑われる被験者が該疾患に罹患しているか否かを、該被験者からの生体試料を用いて簡便に判定できるとともに、客観的な判定手段を提供できる。また、本発明の判定方法は、従来の方法に比較して、判定対象疾患の診断の助けとなるより精度の高い指標を安定に提供することを可能にする。
【図面の簡単な説明】
【0010】
【図1】本発明のプログラムが用いられる判定対象疾患の罹患の判定用装置の一例を示す図である。
【図2】本発明のプログラムを実行するコンピュータシステムの一例を示す図である。
【図3】本発明のプログラムによる具体的な動作のフローチャートである。
【図4】疾患判定用遺伝子群を同定する場合の本発明のプログラムによる具体的な動作のフローチャートである
【図5】Gタンパク質関連遺伝子群、血液凝固関連遺伝子群、酸化ストレス関連遺伝子群、ファゴサイトーシス関連遺伝子群および脂肪酸化関連遺伝子群に属する遺伝子の転写産物の発現量から求めた健常者およびクローン病患者のZスコアの平均値の分布を示す。
【図6】(A)クローン病判定用遺伝子群のそれぞれにおける、該遺伝子群の同定に用いた健常者およびクローン病患者の遺伝子の転写産物の発現量データから求めたZスコアの平均値を用いて、判定を行った結果を示す。(B)クローン病判定用遺伝子群のそれぞれにおける、該遺伝子群の同定に用いたデータとは異なる健常者およびクローン病患者の遺伝子の転写産物の発現量データから求めたZスコアの平均値を用いて、判定を行った結果を示す。
【図7】(A)クローン病判定用遺伝子群に属する遺伝子における、該遺伝子群の同定に用いた健常者およびクローン病患者の遺伝子の転写産物の発現量データを用いて、判定を行った結果を示す。(B)クローン病判定用遺伝子群に属する遺伝子における、該遺伝子群の同定に用いたデータとは異なる健常者およびクローン病患者の遺伝子の転写産物の発現量データを用いて、判定を行った結果を示す。
【図8】クローン病判定用遺伝子群の同定に用いた健常者およびクローン病患者の遺伝子の転写産物の発現量データから同定した、健常者とクローン病患者との間に有意差のある遺伝子の発現量の分布を示す。
【図9】(A)健常者とクローン病患者との間に有意差のある遺伝子における、クローン病判定用遺伝子群の同定に用いた健常者およびクローン病患者の遺伝子の転写産物の発現量データを用いて、判定を行った結果を示す。(B)健常者とクローン病患者との間に有意差のある遺伝子における、クローン病判定用遺伝子群の同定に用いたデータとは異なる健常者およびクローン病患者の遺伝子の転写産物の発現量データを用いて、判定を行った結果を示す。
【図10】微小管関連遺伝子群、ミトコンドリア関連遺伝子群およびプロスタグランジン関連遺伝子群に属する遺伝子の転写産物の発現量から求めた健常者およびハンチントン病患者のZスコアの平均値の分布を示す。
【図11】(A)ハンチントン病判定用遺伝子群のそれぞれにおける、該遺伝子群の同定に用いた健常者およびハンチントン病患者の遺伝子の転写産物の発現量データから求めたZスコアの平均値を用いて、判定を行った結果を示す。(B)ハンチントン病判定用遺伝子群のそれぞれにおける、該遺伝子群の同定に用いたデータとは異なる健常者およびハンチントン病患者の遺伝子の転写産物の発現量データから求めたZスコアの平均値を用いて、判定を行った結果を示す。
【図12】(A)ハンチントン病判定用遺伝子群に属する遺伝子における、該遺伝子群の同定に用いた健常者およびハンチントン病患者の遺伝子の転写産物の発現量データを用いて、判定を行った結果を示す。(B)ハンチントン病判定用遺伝子群に属する遺伝子における、該遺伝子群の同定に用いたデータとは異なる健常者およびハンチントン病患者の遺伝子の転写産物の発現量データを用いて、判定を行った結果を示す。
【図13】ハンチントン病判定用遺伝子群の同定に用いた健常者およびハンチントン病患者の遺伝子の転写産物の発現量データから同定した、健常者とハンチントン病患者との間に有意差のある遺伝子の発現量の分布を示す。
【図14】(A)健常者とハンチントン病患者との間に有意差のある遺伝子における、ハンチントン病判定用遺伝子群の同定に用いた健常者およびハンチントン病患者の遺伝子の転写産物の発現量データを用いて、判定を行った結果を示す。(B)健常者とハンチントン病患者との間に有意差のある遺伝子における、ハンチントン病判定用遺伝子群の同定に用いたデータとは異なる健常者およびハンチントン病患者の遺伝子の転写産物の発現量データを用いて、判定を行った結果を示す。
【図15】サイトカイン合成経路関連遺伝子群、サイトカイン媒介シグナル関連遺伝子群およびイムノグロブリン媒介免疫反応関連遺伝子群に属する遺伝子の転写産物の発現量から求めた正常組織および子宮内膜症の病変部組織のZスコアの平均値の分布を示す。
【図16】(A)子宮内膜症判定用遺伝子群のそれぞれにおける、該遺伝子群の同定に用いた正常組織および子宮内膜症の病変部組織の遺伝子の転写産物の発現量データから求めたZスコアの平均値を用いて、判定を行った結果を示す。(B)子宮内膜症判定用遺伝子群のそれぞれにおける、該遺伝子群の同定に用いたデータとは異なる正常組織および子宮内膜症の病変部組織の遺伝子の転写産物の発現量データから求めたZスコアの平均値を用いて、判定を行った結果を示す。
【図17】(A)子宮内膜症判定用遺伝子群に属する遺伝子における、該遺伝子群の同定に用いた正常組織および子宮内膜症の病変部組織の遺伝子の転写産物の発現量データを用いて、判定を行った結果を示す。(B)子宮内膜症判定用遺伝子群に属する遺伝子における、該遺伝子群の同定に用いたデータとは異なる正常組織および子宮内膜症の病変部組織の遺伝子の転写産物の発現量データを用いて、判定を行った結果を示す。
【図18】子宮内膜症判定用遺伝子群の同定に用いた正常組織および子宮内膜症の病変部組織の遺伝子の転写産物の発現量データから同定した、正常組織と子宮内膜症の病変部組織との間に有意差のある遺伝子の発現量の分布を示す。
【図19】(A)正常組織と子宮内膜症の病変部組織との間に有意差のある遺伝子における、子宮内膜症判定用遺伝子群の同定に用いた正常組織および子宮内膜症の病変部組織の遺伝子の転写産物の発現量データを用いて、判定を行った結果を示す。(B)正常組織と子宮内膜症の病変部組織との間に有意差のある遺伝子における、子宮内膜症判定用遺伝子群の同定に用いたデータとは異なる正常組織および子宮内膜症の病変部組織の遺伝子の転写産物の発現量データを用いて、判定を行った結果を示す。
【発明を実施するための形態】
【0011】
本発明の判定方法では、まず、判定対象疾患の罹患が疑われる被験者から得られた生体試料中の、前記疾患と関連する少なくとも2つの疾患判定用遺伝子群それぞれにおいて、遺伝子群に属する少なくとも1つの遺伝子の転写産物の発現量を測定する。
【0012】
本発明の判定方法において判定の対象となる疾患(判定対象疾患)は、特に限定されないが、例えば、診断のためにCTやMRIなどの高度な医療設備を要する疾患、特異な症状または所見に乏しいために除外診断が一般に行われている疾患などであり得る。そのような疾患としては、例えば、癌(肺癌、乳癌、胃癌、大腸癌、子宮頚癌、メラノーマなど)、自己免疫疾患(リウマチ、全身性エリテマトーデス、シェーグレン症候群、ギランバレー症候群、潰瘍性大腸炎など)、感染症(マラリア、日本脳炎、コレラ、チフス、赤痢など)、精神または神経系疾患(統合失調症、双極性障害、アルツハイマー病、ハンチントン病など)、原因不明の疾患(クローン病、子宮内膜症など)が挙げられる。
【0013】
本明細書において、判定対象疾患の罹患が疑われる被験者(以下、単に「被験者」ともいう)とは、上記のような判定対象疾患に罹患している可能性があり、本発明の判定方法により罹患の有無が判定されることになる被験者を意味する。
生体試料は、そこから遺伝子の転写産物を抽出可能な生体から採取される試料であれば特に限定されず、被験者の血液(全血、血漿、血清を含む)、唾液、尿、体毛などを用いることができる。
【0014】
本明細書において、「判定対象疾患と関連する疾患判定用遺伝子群」とは、判定対象疾患と関連することが、医学的、生物学的または統計学的に明らかである遺伝子群を意味する。そのような関連が明らかであれば、本発明の判定方法に用いる疾患判定用遺伝子群は、特に限定されない。なお、本発明の判定方法においては、後述する手順により同定される遺伝子群を、判定対象疾患と関連する疾患判定用遺伝子群として用いることができる。
【0015】
本明細書において、遺伝子の転写産物とは、遺伝子が転写されることにより得られる産物のことであり、リボ核酸(RNA)、具体的にはメッセンジャーRNA(mRNA)である。
また、本明細書において、「遺伝子の転写産物の発現量」とは、上記の生体試料中の遺伝子の転写産物の存在量または該存在量を反映する物質の量のことである。よって、本発明の判定方法では、遺伝子の転写産物(mRNA)の量、またはmRNAから得られる相補デオキシリボ核酸(cDNA)もしくは相補RNA(cRNA)の量を測定できる。通常、生体試料中のmRNAは微量であるので、そこから逆転写およびインビトロ転写(IVT)により得られるcDNAまたはcRNAの量を測定することが好ましい。
【0016】
生体試料から遺伝子の転写産物を抽出する方法は、当該技術において知られるRNA抽出法を用いて行うことができる。例えば、生体試料を遠心分離して、RNAを含む細胞を沈殿させ、該細胞を物理的または酵素的に破壊し、細胞破片を除去することによりRNA抽出物を得ることができる。RNAの抽出は、市販のRNA抽出キットなどを用いて行うこともできる。
【0017】
上記のようにして得られた遺伝子の転写産物の抽出物から、遺伝子の転写産物の発現量の測定時に混入していないことが好ましい生体試料由来の混入成分、例えば、生体試料が血液である場合はグロビンのmRNAなどを除去するための処理を行うこともできる。
【0018】
上記のようにして得られた遺伝子の転写産物の抽出物について、判定対象疾患との関連が既知である少なくとも2つの疾患判定用遺伝子群それぞれにおいて、遺伝子群に属する少なくとも1つの遺伝子の転写産物の発現量を測定する。
【0019】
遺伝子の転写産物の発現量の測定は、それ自体公知の方法に従って行うことができるが、多数の遺伝子の転写産物の発現解析を行うことができる点で、定量PCR法や核酸チップを用いる測定方法が好ましい。
核酸チップを用いて遺伝子の転写産物の発現量を測定する場合、例えば、基板上に固定された20〜25 mer程度の核酸プローブに、遺伝子の転写産物の抽出物または遺伝子の転写産物から作製したcDNAもしくはcRNAを接触させ、ハイブリッドの形成の有無を蛍光、発色、電流などの指標の変化を測定することにより、目的の遺伝子の転写産物の発現量を測定できる。
上記の核酸プローブは、1つの遺伝子の転写産物に対して少なくとも1つ用いればよく、遺伝子の転写産物の長さなどに応じて、複数のプローブを用いることもできる。プローブの配列は、測定しようとする遺伝子の転写産物の配列に応じて当業者が適宜決定できる。
核酸チップを用いる遺伝子の転写産物の発現量の測定方法としては、例えば、Affymetrix社により提供されるGeneChipシステムを用いることができる。
【0020】
核酸チップを用いる場合、遺伝子の転写産物またはそのcDNAもしくはcRNAは、核酸プローブとのハイブリッド形成を容易にするために、断片化してよい。断片化は、当該技術において公知の方法により行うことができ、例えば、リボヌクレアーゼ、デオキシリボヌクレアーゼなどの核酸分解酵素を用いて行うことができる。
【0021】
核酸チップにおいて核酸プローブと接触させる遺伝子の転写産物またはそのcDNAもしくはcRNAは、通常、5〜20μg程度であればよい。接触条件は、通常、45℃にて16時間程度である。
【0022】
核酸プローブと接触させてハイブリッドを形成した遺伝子の転写産物またはそのcDNAもしくはcRNAは、そのハイブリッド形成の有無およびハイブリッド形成した量について、蛍光物質、色素またはハイブリッド形成したことによる核酸チップ上を流れる電流量の変化などに基づいて検出することができる。
ハイブリッドの形成を、蛍光物質または色素の検出により測定する場合、遺伝子の転写産物またはそのcDNAもしくはcRNAが、蛍光物質または色素の検出のための標識物質で標識されていることが好ましい。このような標識物質は、当該技術において通常用いられるものを用いることができる。通常、ビオチン化ヌクレオチドまたはビオチン化リボヌクレオチドを、cDNAまたはcRNAを合成するときのヌクレオチドまたはリボヌクレオチド基質として混合しておくことにより、得られるcDNAまたはcRNAがビオチンで標識されることができる。cDNAまたはcRNAがビオチン標識されていると、核酸チップ上で、ビオチンに対する結合パートナーであるアビジンまたはストレプトアビジンが結合できる。アビジンまたはストレプトアビジンが、適切な蛍光物質または色素と結合していることにより、ハイブリッドの形成が検出できる。蛍光物質としては、フルオレセインイソチオシアネート(FITC)、グリーン蛍光タンパク質(GFP)、ルシフェリン、フィコエリスリンなどが挙げられる。通常、フィコエリスリン−ストレプトアビジンのコンジュゲートが市販されているので、これを用いることが簡便である。
また、アビジンまたはストレプトアビジンに対する標識抗体を、アビジンまたはストレプトアビジンと接触させ、標識抗体の蛍光物質または色素を検出することもできる。
【0023】
この工程で得られる遺伝子の転写産物の発現量は、生体試料中の各遺伝子の転写産物の存在量を相対的に表す値であれば、特に限定されない。上記の核酸チップにより測定を行う場合、発現量は、蛍光強度、発色強度、電流量などに基づく核酸チップから得られるシグナルであり得る。
これらのシグナルは、核酸チップ用の測定装置を用いて測定できる。
【0024】
次いで、測定された発現量を、複数の健常者における対応する遺伝子の転写産物の発現量に基づいて標準化することにより、偏差を表す値を取得する。
本明細書において、「対応する遺伝子の転写産物」とは、被験者について発現量を測定したものと同じ遺伝子の転写産物を意味する。
複数の健常者における対応する遺伝子の転写産物の発現量は、上記の被験者からの生体試料について行ったのと同様の方法に従って、健常者から採取された生体試料を用い、測定対象の遺伝子の転写産物の発現量を測定することにより、得ることができる。
本明細書において、「健常者」とは、本発明の判定方法以外の基準に基づいて、判定対象疾患に罹患していないことが確認できる者のことである。例えば、判定対象疾患が、癌である場合は、組織診、CT、MRI、腫瘍マーカーなどにより、自己免疫疾患である場合は、血液検査などにより、感染症である場合は、血液検査などにより、精神または神経系疾患である場合は、脳画像診断、遺伝子検査、問診、質問紙などにより、クローン病の場合は、内視鏡検査、消化管造影検査などにより、子宮内膜症の場合は、CT、MRI、内視鏡検査などにより、判定対象疾患に罹患していないことが確認できる者のことである。
また、本明細書において、「複数の健常者」とは、統計学的に十分な人数の健常者を意味し、30名以上、好ましくは40名以上の人数であればよい。
【0025】
本明細書において、「複数の健常者における対応する遺伝子の転写産物の発現量に基づいて標準化する」とは、次の式により偏差を表す値を求めることを意味する。
偏差を表す値=(被験者での遺伝子の転写産物の発現量−複数の健常者での対応する遺伝子の転写産物の発現量の平均値)/複数の健常者での対応する遺伝子の転写産物の発現量の標準偏差
上記の偏差を表す値は、Zスコアとしても知られる値であり、複数の健常者における遺伝子の転写産物の発現量から、被験者の遺伝子の転写産物の発現量がどの程度かけ離れているかを示す値である。
【0026】
また、本発明の判定方法においては、被験者での遺伝子の転写産物の発現量を、複数の健常者での対応する遺伝子の転写産物の発現量の平均値で除算することにより、健常者に対する被験者の発現量比を表す値を取得し、上記の偏差を表す値に代えて、該発現比を表す値を次工程で用いてもよい。
上記の発現量比を表す値は、複数の健常者での対応する遺伝子の転写産物の発現量の平均値に対して、被験者の遺伝子の転写産物の発現量がどの程度大きいかを示す値である。
【0027】
次いで、選択された疾患判定用遺伝子群それぞれにおいて、遺伝子群に属する遺伝子の偏差を表す値の平均値を取得する。
なお、本明細書において、「平均値」とは、平均値を取得しようとする上記の遺伝子群の中で1つの遺伝子についての偏差を表す値しか得られていない場合は、その1つの遺伝子についての偏差を表す値を意味し、2つ以上の遺伝子についての偏差を表す値が得られている場合は、それらの偏差を表す値を平均した値を意味する。
【0028】
上記の平均値は、判定対象疾患との関連が既知である疾患判定用遺伝子群から選択される少なくとも2つの遺伝子群について取得する。なお、選択される遺伝子群の数は、多いほど好ましい。
【0029】
上記のようにして得られた平均値を用いて、被験者が判定対象疾患であるか否かを判定する。
この判定は、上記のようにして被験者から取得された平均値を、健常者から採取された生体試料を用いて上記の各工程と同様にして予め得られた平均値と、判定対象疾患の患者から採取された生体試料を用いて上記の各工程と同様にして予め得られた平均値とに基づいて得られる判定式に入力することにより行うことができる。
【0030】
上記の判定式は、それ自体公知の判別分析の手法を用いて作成することができる。判別分析の手法とは、事前に与えられたデータが互いに異なる2つの群に別れることが明らかな場合において、新たに得られたデータが該2つの群のいずれに属するものであるかを判別するための基準を得る統計学的手法である。そのような判別分析の手法としては、例えば、サポートベクターマシン(SVM)、線形判別分析、ニューラルネットワーク、k近傍識別器、決定木、ランダムフォレストなどが挙げられる。これらの判別分析の手法の中でも、統計解析ソフトGeneSpringにも搭載されているSVMを用いて、上記の判定式を作成することが好ましい。
上記のような健常者からの平均値と、判定対象疾患の患者からの平均値とが予め入力され、判定式が作成されたSVMに、被験者から採取された生体試料から求めた平均値を入力することにより、この被験者が判定対象疾患に罹患しているか否かを判定することができる。
【0031】
上記のとおり、本発明の判定方法には、「判定対象疾患と関連する疾患判定用遺伝子群」を用いるが、そのような遺伝子群の一例として、判定対象疾患と統計学的に関連する遺伝子群が挙げられる。この判定対象疾患と統計学的に関連する遺伝子群の同定は、例えば、以下の工程を含む手順により行うことができる:
(a)判定対象疾患に罹患した複数の患者のそれぞれおよび複数の健常者のそれぞれから得られた生体試料中の遺伝子の転写産物の発現量を測定する工程と、
(b)前記複数の患者のそれぞれについての発現量を、前記複数の健常者における対応する遺伝子の転写産物の発現量に基づいて標準化することにより、前記複数の患者のそれぞれについての偏差を表す値を取得し、
前記複数の健常者のそれぞれについての発現量を標準化することにより、前記複数の健常者のそれぞれについての偏差を表す値を取得する工程と、
(c)前記発現量を測定した遺伝子を、遺伝子がコードする分子の機能に基づく分類系統を用いて、少なくとも2つの遺伝子群に分類し、
前記複数の患者のそれぞれおよび前記複数の健常者のそれぞれについて、
前記遺伝子群それぞれにおいて、遺伝子群に属する遺伝子の偏差を表す値の平均値を前記遺伝子群の平均値として取得する工程と、
(d)前記複数の患者についての各遺伝子群の平均値と前記複数の健常者についての対応する各遺伝子群の平均値との間の有意確率を取得する工程と、
(e)前記有意確率が0.05以下である遺伝子群を判定対象疾患と関連する疾患判定用遺伝子群として同定する工程。
【0032】
まず、判定対象疾患に罹患した複数の患者および複数の健常者からそれぞれ得られた生体試料中の遺伝子の転写産物の発現量を測定する。
本明細書において、「判定対象疾患に罹患した患者」(以下、単に「患者」ともいう)とは、本発明の判定方法以外の基準に基づいて、判定対象疾患に罹患していることが確認できる者のことである。例えば、判定対象疾患が、癌である場合は、組織診、CT、MRI、腫瘍マーカーなどにより、自己免疫疾患である場合は、血液検査により、感染症である場合は、血液検査により、精神または神経系疾患である場合は、脳画像診断、遺伝子検査、問診などにより、クローン病の場合は、内視鏡検査、消化管造影検査などにより、子宮内膜症の場合は、CT、MRI、内視鏡検査などにより、判定対象疾患に罹患していることが確認できる人のことである。
また、本明細書において、「複数の患者」とは、統計学的に十分な人数の患者を意味し、30名以上、好ましくは40名以上の人数であればよい。なお、「健常者」および「複数の健常者」の定義については、上記のとおりである。
また、この工程における遺伝子の転写産物の抽出および該産物の発現量の測定については、判定対象疾患に罹患した複数の患者のそれぞれ、および複数の健常者のそれぞれから得られた生体試料を用いて、上記の本発明の判定方法の各工程と同様にして行うことができる。
【0033】
次いで、複数の患者のそれぞれについての発現量を、複数の健常者における対応する遺伝子の転写産物の発現量に基づいて標準化することにより、複数の患者のそれぞれの偏差を表す値を取得する。
本明細書において、「複数の患者のそれぞれについての発現量を、複数の健常者における対応する遺伝子の転写産物の発現量に基づいて標準化する」とは、次の式により、複数の患者の全員の偏差を表す値を求めることを意味する。
患者についての偏差を表す値=(各患者についての遺伝子の転写産物の発現量−複数の健常者での対応する遺伝子の転写産物の発現量の平均値)/複数の健常者での対応する遺伝子の転写産物の発現量の標準偏差
【0034】
また、複数の健常者のそれぞれについての発現量を標準化することにより、複数の健常者のそれぞれについての偏差を表す値を取得する。
この場合の「標準化する」とは、統計学の分野において通常用いられるのと同じ意味を有する。すなわち、次の式により、複数の健常者の全員の偏差を表す値を取得できる。
健常者についての偏差を表す値=(各健常者での遺伝子の転写産物の発現量−複数の健常者での遺伝子の転写産物の発現量の平均値)/複数の健常者での遺伝子の転写産物の発現量の標準偏差
【0035】
なお、上記の健常者に対する被験者の発現量比を表す値を求めるのと同様にして、健常者の平均値に対する複数の患者および複数の健常者のそれぞれの発現量比を求め、これらの値を、それぞれ複数の患者についての偏差を表す値および複数の健常者についての偏差を表す値に代えて用いることができる。
【0036】
次いで、発現量を測定した遺伝子を、遺伝子がコードする分子の機能に基づく分類系統を用いて、少なくとも2つの遺伝子群に分類し、複数の患者のそれぞれおよび複数の健常者のそれぞれについて、該遺伝子群それぞれにおいて、遺伝子群に属する遺伝子の偏差を表す値の平均値を前記遺伝子群の平均値として取得する。
【0037】
本明細書において、「遺伝子がコードする分子の機能に基づく分類系統」とは、遺伝子がコードする分子の機能により遺伝子を分類したデータベースを意味する。そのようなデータベースはそれ自体が公知のものを用いることができ、例えば、ジーンオントロジー(Gene Ontology(GO))、京都エンサイクロペディア オブ ジーンズ アンド ゲノムス(Kyoto Encyclopedia of Genes and Genomes(KEGG))、メタシック(MetaCyc)、ジンマップ(GenMAPP)、バイオカルタ(BioCarta)、キーモルネット(KeyMolnet)、オンライン メンデリアン インヘリタンス イン マン(Online Mendelian Inheritance in Man(OMIM))などが挙げられるが、この中でも「GO Term」と呼ばれる遺伝子群を定義するGene Ontologyを用いることが好ましい。
なお、これらのデータベースは、以下の表1に示すURLから入手または利用可能である。
【0038】
【表1】
【0039】
この工程においては、まず、上記の分類系統を用いて、発現量を測定した遺伝子を少なくとも2つの遺伝子群に分類する。そして、上記の被験者についての平均値を取得する工程と同様にして、分類された各遺伝子群における複数の患者および複数の健常者についての平均値を取得する。
【0040】
次いで、複数の患者についての各遺伝子群の平均値と複数の健常者についての対応する各遺伝子群の平均値との間の有意確率を取得する。
本明細書において、「対応する遺伝子群」とは、複数の患者について平均値を取得したのと同じ遺伝子群を意味する。
複数の患者についての各遺伝子群の平均値と複数の健常者についての対応する各遺伝子群の平均値との間の有意確率(以下、「p値」ともいう)は、T検定により取得することができる。
【0041】
そして、上記で得られたp値が0.05以下である遺伝子群を、判定対象疾患と関連する疾患判定用遺伝子群として同定する。
本発明の判定方法においては、上記の手順により同定された遺伝子群から任意に選択される少なくとも2つを、判定対象疾患と関連する疾患判定用遺伝子群として用いる。なお、選択される疾患判定用遺伝子群の数は、多いほど好ましい。
【0042】
本発明の判定方法では、遺伝子の転写産物の発現量自体を用いるのではなく、該発現量から偏差を表す値を取得し、この偏差を表す値を上記の疾患判定用遺伝子群で平均値を取得し、得られた平均値を用いることにより、判定対象疾患に罹患している被験者を、健常者から明確に安定して区別できる。
また、本発明の判定方法は、例えば、クローン病、ハンチントン病、子宮内膜症などの罹患の判定に特に好適である。
【0043】
クローン病は、潰瘍や線維化を伴う肉芽腫性炎症性病変からなり、口腔から肛門までの消化管全域に発症し得る原因不明の疾患である。日本国内では、現在2万人以上が罹患している。症状としては、腹痛、下痢、体重減少、発熱、肛門病変がよく見られる。クローン病の確定診断は内視鏡検査によって行なわれるが、血液検査などの侵襲度の低い検査によるスクリーニング検査を行なうことで早期発見が可能になると考えられる。本発明の判定方法により、クローン病の罹患が疑われる被験者を判定すれば、診断の指標として信頼できる判定結果を得ることができる。
本発明の判定方法によりクローン病の罹患を判定する場合、疾患判定用遺伝子群としては、例えば、Gタンパク質関連遺伝子群、血液凝固関連遺伝子群、酸化ストレス関連遺伝子群、ファゴサイトーシス関連遺伝子群および脂肪酸化関連遺伝子群が挙げられる。
上記の5つの遺伝子群は、GO Termにおいて、それぞれ「heterotrimeric G-protein complex」(GO:0005834)、「blood coagulation」(GO:GO:0007596)、「response to oxidative stress」(GO:0006979)、「phagocytosis, engulfment」(GO:GO:0006911)および「fatty acid oxidation」(GO:0019395)に分類される遺伝子のカテゴリーである。
【0044】
ハンチントン病は、舞踏病運動を主体とする不随意運動、ならびに精神症状および認知症を主な症状とする慢性進行性神経変性疾患である。診断においては、脳出血などの脳血管障害による症候性舞踏病、抗精神病薬などによる薬剤性舞踏病、ウィルソン病などの疾患と鑑別することが必要である。そのため、本発明の判定方法により、ハンチントン病の罹患が疑われる被験者を判定すれば、診断の指標としてより信頼できる判定結果を得ることができる。
本発明の判定方法によりハンチントン病の罹患を判定する場合、疾患判定用遺伝子群としては、例えば、微小管関連遺伝子群、ミトコンドリア関連遺伝子群およびプロスタグランジン関連遺伝子群が挙げられる。
上記の3つの遺伝子群は、GO Termにおいて、それぞれ「microtube」(GO:0005874)、「mitochondrion」(GO:0005739)および「signal transduction」(GO:0007165)に分類される遺伝子のカテゴリーである。
【0045】
子宮内膜症は、子宮内膜またはそれに類似した組織が子宮内腔や子宮体部以外に増殖する疾患である。子宮内膜症の主な症状が月経痛および月経困難であるため、子宮内膜症は月経困難症との鑑別が難しい疾患である。そのため、本発明の判定方法により、子宮内膜症の罹患が疑われる被験者を判定すれば、診断の指標としてより信頼できる判定結果を得ることができる。
本発明の判定方法により子宮内膜症の罹患を判定する場合、疾患判定用遺伝子群としては、例えば、サイトカイン合成経路関連遺伝子群、サイトカイン媒介シグナル関連遺伝子群およびイムノグロブリン媒介免疫反応関連遺伝子群が挙げられる。
上記の3つの遺伝子群は、GO Termにおいて、それぞれ「cytokine biosynthetic process」(GO:0042089)、「cytokine-mediated signaling pathway」(GO:0019221)および「immunoglobulin mediated immune response」(GO:0016064)に分類される遺伝子のカテゴリーである。
【0046】
本発明の判定方法は、判定対象疾患の患者を「陽性」であると判定する感度が、好ましくは80%以上、より好ましくは85%以上、さらに好ましくは90%以上である。また、本発明の判定方法は、健常者を「陰性」であると判定する特異度が、好ましくは80%以上、より好ましくは85%以上、さらに好ましくは90%以上である。
本発明の判定方法は、このように高い感度および特異度を示すので、判定対象疾患の診断の助けとなるより精度の高い指標を安定に提供することができる。
【0047】
上記の本発明の判定方法をコンピュータにより行うための疾患の罹患判定用プログラムも、本発明の1つである。すなわち、本発明のプログラムは、コンピュータを、
判定対象疾患の罹患が疑われる被験者から得られた生体試料中の、前記疾患と関連する少なくとも2つの疾患判定用遺伝子群それぞれにおいて、遺伝子群に属する少なくとも1つの遺伝子の転写産物の発現量を受け付ける受付手段、
前記発現量を複数の健常者における対応する遺伝子の発現量に基づいて標準化することにより偏差を表わす値を取得する偏差取得手段、
前記疾患判定用遺伝子群それぞれにおいて、遺伝子群に属する遺伝子の偏差を表す値の平均値を取得する平均値取得手段、
前記平均値を用いて、被験者が対象疾患に罹患しているか否かを判定する判定手段、
判定手段の判定結果を出力する出力手段
として機能させるための疾患の罹患判定用プログラムである。
【0048】
また、上記の本発明のプログラムは、コンピュータを、疾患判定用遺伝子を同定する手段としてさらに機能させることもできる。すなわち、本発明のプログラムは、コンピュータを、
判定対象疾患に罹患した複数の患者のそれぞれおよび複数の健常者のそれぞれから得られた生体試料中の遺伝子の転写産物の発現量を受け付ける受付手段、
前記複数の患者のそれぞれについての発現量を、前記複数の健常者における対応する遺伝子の転写産物の発現量に基づいて標準化することにより、前記複数の患者のそれぞれの偏差を表わす値を取得し、前記複数の健常者のそれぞれについての発現量を標準化することにより、前記複数の健常者のそれぞれの偏差を表わす値を取得する偏差取得手段、
前記発現量を測定された遺伝子を、遺伝子がコードする分子の機能に基づく分類系統に従って、少なくとも2つの遺伝子群に分類し、前記複数の患者のそれぞれおよび前記複数の患者のそれぞれについて、前記遺伝子群それぞれにおいて、遺伝子群に属する遺伝子の偏差を表す値の平均値を前記遺伝子群の平均値として取得する平均値取得手段、
前記複数の患者についての各遺伝子群の平均値と前記複数の健常者についての対応する各遺伝子群の平均値との間の有意確率を取得する有意確率取得手段、
前記有意確率が0.05以下である遺伝子群を判定対象疾患と関連する疾患判定用遺伝子群として同定する遺伝子群同定手段
としてさらに機能させる疾患の罹患判定用プログラムである。
【0049】
図1に、本発明のプログラムが用いられる判定対象疾患の罹患判定用装置の一例を示す。該装置は、遺伝子の転写産物発現量測定装置1と、コンピュータ2と、これらを接続するケーブル3とから構成される。遺伝子の転写産物発現量測定装置1で測定される蛍光強度、電流量などに基づくシグナルなどの発現量のデータは、ケーブル3を介してコンピュータ2に送ることができる。また、遺伝子の転写産物発現量測定装置1は、コンピュータ2と接続されていなくてもよく、この場合、発現量のデータをコンピュータに入力して上記のプログラムを作動させることができる。
コンピュータ2では、得られた発現量から、上記の偏差を表す値を取得し、得られた偏差を表す値を、少なくとも2つの遺伝子群のそれぞれにおける平均値として取得し、該平均値に基づいて、被験者が判定対象疾患に罹患しているか否かを判定する。
【0050】
本発明のプログラムは、中央処理装置、記憶部、コンパクトディスクやフロッピー(登録商標)ディスクなどの記録媒体の読取装置、キーボードなどの入力部、およびディスプレイなどの出力部を備えるコンピュータ2と協働して、上記の本発明の判定方法を実現することができる。上記の方法を実施するための、より具体的なコンピュータシステムの一例を、図2に示す。
【0051】
図2に示されたコンピュータ2は、本体110と、ディスプレイ120と、入力部130とから主として構成されている。本体110は、CPU110aと、ROM110bと、RAM110cと、ハードディスク110dと、読出装置110eと、入出力インタフェース110fと、画像出力インタフェース110gとから主として構成されており、CPU110a、ROM110b、RAM110c、ハードディスク110d、読出装置110e、入出力インタフェース110f、および画像出力インタフェース110gは、バス110hによってデータ通信可能に接続されている。
【0052】
CPU110aは、ROM110bに記憶されているコンピュータプログラムおよびRAM110cにロードされたコンピュータプログラムを実行することが可能である。
ROM110bは、マスクROM、PROM、EPROM、EEPROMなどによって構成されており、CPU110aに実行されるコンピュータプログラムおよびこれに用いるデータなどが記録されている。
【0053】
RAM110cは、SRAMまたはDRAMなどによって構成されている。RAM110cは、ROM110bおよびハードディスク110dに記録されているコンピュータプログラムの読み出しに用いられる。また、これらのコンピュータプログラムを実行するときに、CPU110aの作業領域として利用される。
【0054】
ハードディスク110dは、オペレーティングシステムおよびアプリケーションプログラムなど、CPU110aに実行させるための種々のコンピュータプログラムおよび該コンピュータプログラムの実行に用いるデータが格納されている。本実施形態におけるハードディスク110dに格納されているデータには、複数の健常者における対応する遺伝子の転写産物の発現量に関するデータ(以下、「格納発現量データ」という)、疾患判定用遺伝子群に関するデータ(以下、「疾患判定用遺伝子群データ」という)および被験者が判定対象疾患であるか否かを判定するための判定式が含まれている。ここで、該判定式は、上記の判別分析の手法を用いて、健常者から採取された生体試料を用いて求められる予め得られた平均値と、判定対象疾患の患者から採取された生体試料を用いて求められる予め得られた平均値とに基づいて得られた判定式である。なお、後述するアプリケーションプログラム140aも、このハードディスク110dにインストールされている。
【0055】
読出装置110eは、フレキシブルディスクドライブ、CD−ROMドライブ、またはDVD−ROMドライブなどによって構成されており、可搬型記録媒体140に記録されたコンピュータプログラムまたはデータを読み出すことができる。また、可搬型記録媒体140には、コンピュータに本実施形態の方法を実行させるためのアプリケーションプログラム140aが格納されており、CPU110aが当該可搬型記録媒体140から本発明に係るアプリケーションプログラム140aを読み出し、該アプリケーションプログラム140aをハードディスク110dにインストールすることが可能である。
【0056】
なお、上記のアプリケーションプログラム140aは、可搬型記録媒体140によって提供されるのみならず、電気通信回線(有線、無線を問わない)によってコンピュータ本体110と通信可能に接続された外部の機器から前記電気通信回線を通じて提供することも可能である。例えば、上記のアプリケーションプログラム140aがインターネット上のサーバコンピュータのハードディスク内に格納されており、このサーバコンピュータにCPU110aがアクセスして、該アプリケーションプログラムをダウンロードし、これをハードディスク110dにインストールすることも可能である。
【0057】
また、ハードディスク110dには、例えば米国マイクロソフト社が製造販売するWindows(登録商標)などのグラフィカルユーザインタフェース環境を提供するオペレーティングシステムがインストールされている。以下の説明においては、本実施形態に係るアプリケーションプログラム140aは、該オペレーティングシステム上で動作するものとしている。
【0058】
入出力インタフェース110fは、例えば、USB、IEEE1394、RS−232Cなどのシリアルインタフェース、SCSI、IDE、IEEE1284などのパラレルインタフェース、およびD/A変換器、A/D変換器などからなるアナログインタフェースなどから構成されている。入出力インタフェース110fには、転写産物発現量測定装置1が、ケーブル3を介して接続されており、転写産物発現量測定装置1で測定される発現量のデータを、コンピュータ本体110に入力することが可能である。また、入出力インタフェース110fには、キーボードおよびマウスからなる入力部130が接続されており、ユーザが該入力部130を使用することにより、コンピュータ本体110にデータを入力することが可能である。
【0059】
画像出力インタフェース110gは、LCDまたはCRTなどで構成されたディスプレイ120に接続されており、CPU110aから与えられた画像データに応じた映像信号をディスプレイ120に出力するようになっている。ディスプレイ120は、入力された映像信号にしたがって、画像(画面)を表示する。
【0060】
本発明のプログラムによる手段としてのより具体的なコンピュータ2の動作のフローチャートを、図3に示す。
まず、遺伝子の転写産物発現量測定装置1で遺伝子の転写産物の発現量が測定されると、転写産物発現量測定装置1が、コンピュータ2に、測定された発現量に関するデータ(以下、「測定発現量データ」という)を出力する。CPU110aは、出力された測定発現量データを受け付け、RAM110cに記憶する(ステップS11)。
【0061】
次いで、CPU110aは、ハードディスク110dに予め格納された格納発現量データを読み出し、入力された測定発現量データおよび格納発現量データに基づいて、偏差を表す値を示すデータ(以下、「偏差データ」という)を取得する(ステップS12)。
【0062】
次いで、CPU110aは、ハードディスク110dに予め格納された疾患判定用遺伝子群データを読み出し、偏差データに対応する遺伝子が疾患判定用遺伝子群か否かを判定することで、取得された偏差データを、疾患判定用遺伝子群により分類する(ステップS13)。
【0063】
次いで、CPU110aは、疾患判定用遺伝子群により分類された偏差データを用いて、それぞれの疾患判定用遺伝子群毎に、偏差を表す値の平均値を示すデータ(以下、「平均値データ」という)を取得する(ステップS14)。
【0064】
次いで、CPU110aは、ハードディスク110dに予め格納された判定式を読み出し、平均値データを該判定式に適用して、被験者が判定対象疾患であるか否かを判定する(ステップS15)。
【0065】
そして、CPU110aは、判定式からの該被験者が判定対象疾患であるか否かを判定した結果を、RAM110cに格納するとともに、画像出力インタフェース110gを介してコンピュータのディスプレイ120に表示する(ステップS16)。
【0066】
なお、本実施形態においては、CPU110aは、測定発現量データを、転写産物発現量測定装置1から、入出力インタフェース110fを介して取得したが、これに限定されるものではない。例えば、コンピュータ2とは独立した転写産物発現量測定装置で得られた遺伝子の転写産物の発現量を、操作者が、入力部130を用いてコンピュータ2に入力することで、コンピュータ2に測定発現量データを入力することもできる。
【0067】
また、コンピュータを、疾患判定用遺伝子を同定する手段としてさらに機能させる場合の本発明のプログラムによる、具体的なコンピュータ2の動作のフローチャートを、図4に示す。なお、本実施形態におけるハードディスク110dには、遺伝子がコードする分子の機能に基づく分類系統に関するデータ(以下、「分類系統データ」という)が格納されている。
【0068】
まず、遺伝子の転写産物発現量測定装置1で複数の患者および複数の健常者の遺伝子の転写産物の発現量が測定されると、転写産物発現量測定装置1が、コンピュータ2に、複数の患者の測定された発現量に関するデータ(以下、「患者測定発現量データ」という)および複数の健常者の測定された発現量に関するデータ(以下、「健常者測定発現量データ」という)を出力する。CPU110aは、出力された患者測定発現量データおよび健常者測定発現量データを受け付け、RAM110cに記憶する(ステップS21)。
【0069】
次いで、CPU110aは、入力された複数の患者のそれぞれについての患者測定発現量データを複数の健常者における対応する遺伝子の転写産物の健常者測定発現量データに基づいて標準化することにより、複数の患者のそれぞれについての偏差を表す値を示すデータ(以下、「患者偏差データ」という)を取得し、また、複数の健常者のそれぞれについての測定発現量データを標準化することにより、複数の健常者のそれぞれについての偏差を表す値を示すデータ(以下、「健常者偏差データ」という)を取得する(ステップS22)。
【0070】
そして、CPU110aは、ハードディスク110dに予め格納された分類系統データを読み出し、患者偏差データを、患者偏差データに対応する遺伝子に基づいて、遺伝子群により分類する。同様に、CPU110aは、健常者偏差データを、健常者偏差データに対応する遺伝子に基づいて、遺伝子群により分類する。(ステップS23)。
【0071】
次いで、CPU110aは、遺伝子群により分類された患者偏差データを用いて、それぞれの遺伝子群毎に、偏差を表す値の平均値を示すデータ(以下、「患者平均値データ」という)を取得する。同様に、CPU110aは、遺伝子群により分類された健常者偏差データを用いて、それぞれの遺伝子群毎に、偏差を表す値の平均値を示すデータ(以下、「患者平均値データ」という)を取得する(ステップS24)。
【0072】
次に、CPU110aは、得られた各遺伝子群の患者平均値データおよび健常者平均値データを用いて、複数の患者についての平均値と複数の健常者についての平均値との間の有意確率を示すデータ(以下、「有意確率データ」という)を取得する(ステップS25)。
【0073】
次に、CPU110aは、得られた有意確率データを用いて、有意確率が0.05以下の遺伝子群を同定する(ステップS26)。
【0074】
そして、CPU110aは、同定された遺伝子群を、RAM110cに格納するとともに、画像出力インタフェース110gを介してコンピュータのディスプレイ120に表示する(ステップS27)。
【0075】
なお、本実施形態においては、CPU110aは、患者測定発現量データおよび健常者測定発現量データを、転写産物発現量測定装置1から、入出力インタフェース110fを介して取得したが、これに限定されるものではない。例えば、コンピュータ2とは独立した転写産物発現量測定装置で得られた、複数の患者および複数の健常者の遺伝子の転写産物の発現量を、操作者が入力部130を用いてコンピュータ2に入力することで、コンピュータ2に患者測定発現量データおよび健常者測定発現量データを入力することもできる。
【0076】
また、本実施形態では、ステップS27において、同定された遺伝子群をディスプレイ120に表示しているが、該同定された遺伝子群に関するデータを、疾患判定用遺伝子群データとして、RAM110cに格納するだけでもよい。該格納された疾患判定用遺伝子群データは、例えば、図2に示したコンピュータ2の動作において、使用することもできる。
【実施例】
【0077】
以下の実施例において、本発明をより詳細に説明するが、本発明は、以下の態様に限定されることを意図しない。
【0078】
実施例1 クローン病の罹患の判定方法
(1)クローン病判定用遺伝子群の同定
実施例1においては、クローン病患者および健常者の血液中の遺伝子の転写産物の発現量データとして、遺伝子発現データバンクであるthe Gene Expression Omnibus(GEO;http://www.ncbi.nlm.nih.gov/geoから利用可能)により提供されるデータを用いた。なお、該データは、測定したシグナルの生データを正規化処理したものとして、http://www.ncbi.nlm.nih.gov/sites/GDSbrowser?acc=GDS1615から入手することができる。
(1-1)検体の選択およびプローブセットの絞り込み
上記のデータから、クローン病患者1(29検体)のデータおよび健常者1(21検体)のデータをランダムに選択し、これらのデータをクローン病判定用遺伝子群の同定のためのデータとした。
上記のGEOから入手したクローン病患者および健常者についてのデータは、DNAチップであるGeneChip(登録商標)U133A(Affimetrix社)を用いた解析により得られたものである。このDNAチップには、22283個のプローブセットが配置されているが、これらのプローブセットには、同一の遺伝子に対する複数のプローブセットも含まれる。
そこで、上記のDNAチップのプローブセットに対応する遺伝子において、同一の遺伝子に対する複数のプローブセットが含まれる遺伝子については、最大のシグナル値を示したプローブセットのみを抽出した。さらに、シグナル値が50以下のプローブセットは、測定値の再現性が低いと考えられるので除外した。この結果、9331個のプローブセットに対応する遺伝子について、以下の解析を行った。
【0079】
(1-2)発現量のZスコア化
上記のようにして選択された9331個のプローブセットに対応する遺伝子の転写産物について、健常者1(21検体)から得られたシグナル値全てを用いて平均値および標準偏差を取得した。この値を用いて、9331個の遺伝子それぞれについて、以下の式を用いて、該遺伝子それぞれの偏差を表す値(Zスコア)を求めた。
Zスコア=(各遺伝子の転写産物のシグナル値−健常者1(21検体)の対応する遺伝子の転写産物のシグナル値の平均値)/健常者1(21検体)の対応する遺伝子の転写産物のシグナル値の標準偏差
【0080】
(1-3)遺伝子の分類および各遺伝子群での平均値の取得
Gene Ontology(http://www.geneontology.org/index.shtmlから閲覧可能)の分類に基づいて、上記の9331個の遺伝子を遺伝子群(GO Term)に分類し、各GO Term内の遺伝子について上記(1-2)で求めたクローン病患者1(29検体)のZスコアを平均して、平均値を求めた。
また、健常者1(21検体)についても、上記と同様にして、各GO Termでの平均値を求めた。
【0081】
(1-4)健常者とクローン病患者との間で有意差のある遺伝子群の選択
上記のようにして得られた健常者とクローン病患者の各GO Termについての平均値を用いてT検定を行い、有意確率(p値)を取得した。
用いたGO Termから、得られたp値が0.05以下(p値≦5.0E-02)であったGO Termを抽出した。
次に、抽出したGO Termに含まれる全ての遺伝子についてのZスコアを用いて階層型クラスタリングを行い、同調して変動する遺伝子のクラスタを選択した。なお、クラスタリングには、ソフトウェアCluster3.0(http://bonsai.ims.u-tokyo.ac.jp/〜mdehoon/software/cluster/software.htmから入手可能)を、その結果の表示にはJavaTreeView (http://sourceforge.net/projects/jtreeview/files/から入手可能)を用いた。
各クラスタに含まれる遺伝子のZスコアの平均値をクラスタのスコアとし、健常者1(21検体)と、クローン病患者1(29検体)とについてT検定を行った。得られたp値が0.05以下であったクラスタから、Gタンパク質関連遺伝子群、血液凝固関連遺伝子群、酸化ストレス関連遺伝子群、ファゴサイトーシス関連遺伝子群および脂肪酸化関連遺伝子群をクローン病判定用遺伝子群として選択した。これらの遺伝子群ならびに各群に属する遺伝子および各群のp値を、表2に示す。
上記の選択された各遺伝子群における健常者1およびクローン病患者1についてのZスコアの平均値の分布を、図5に示す。
【0082】
【表2】
【0083】
(2)本発明の判定方法の精度の評価
(2-1)クローン病判定用遺伝子群の同定に用いた検体についての判定
上記の5つのクローン病判定用遺伝子群のそれぞれにおける健常者1(21検体)およびクローン病患者1(29検体)についての平均値を、それぞれ、サポートベクターマシン(SVM;統計解析ソフトGeneSpringに搭載)に入力した。そして、これらの50検体の平均値が入力されたSVMを用いて、各検体が陽性である(クローン病である)か、または陰性である(健常である)かを、判定した。
この結果を、図6Aに示す。図6Aにおいて、「感度」とは、クローン病患者を「陽性」であると判定する割合であり、「特異度」とは、健常者を健常者であると判定する割合である。また、「一致率」とは、クローン病患者を「陽性(+)」であると判定し、健常者を「陰性(−)」であると判定する割合である。この結果から、本発明の判定方法によれば、90%以上の感度および特異度で、クローン病患者および健常者を同定できることがわかる。
【0084】
(2-2)本発明の判定方法の再現性の評価
さらに、本発明の判定方法の再現性を評価するために、上記(1-1)で選択されたデータとは異なるクローン病患者2(30検体)のデータおよび健常者2(21検体)のデータを用いた。そして、これらのデータについて、上記(2-1)でクローン病判定用遺伝子群の同定に用いた検体の平均値が入力されたSVMを用いて判定を行った。
この結果を、図6Bに示す。この結果から、本発明の判定方法によれば、クローン病判定用遺伝子群の同定に用いた検体とは異なる検体についても、95%以上の感度および90%以上の特異度で、安定して健常者とクローン病患者とを区別できることがわかる。
【0085】
比較例1 従来の判定方法によるクローン病の判定
ここでは、従来の判定方法として、健常者および患者の遺伝子の転写産物の発現量自体に基づいて疾患の罹患を判定する方法を用いた。このような、従来の判定方法を用いて、クローン病の罹患を判定した場合の判定の精度を評価した。
(1)クローン病判定用遺伝子群に属する遺伝子を用いた判定
(1-1)クローン病判定用遺伝子群の同定に用いた検体について
表1の26遺伝子のそれぞれにおける上記の健常者1(21検体)およびクローン病患者1(29検体)についての発現量を、それぞれSVMに入力した。そして、これらの50検体の発現量が入力されたSVMを用いて、各検体が陽性と判定されるか、または陰性と判定されるかについて、判定の精度の評価を行った。
この結果を、図7Aに示す。この結果から、従来の判定方法によると、100%の感度および特異度で、クローン病患者および健常者を同定できることがわかる。
【0086】
(1-2)従来の判定方法の再現性の評価
次いで、従来の判定方法の再現性を評価するために、上記のクローン病患者2(30検体)のデータおよび健常者2(21検体)のデータを用いた。そして、これらの検体について、上記(1-1)で健常者1(21検体)およびクローン病患者1(29検体)についての発現量が入力されたSVMを用いて判定を行った。
この結果を、図7Bに示す。この結果から、クローン病判定用遺伝子群の同定に用いた検体とは異なる検体について、従来の判定方法の感度は90%以上であったが、特異度は65%以下に低下した。したがって、従来の判定方法では、健常者をクローン病患者であるとして誤った判定結果を示す可能性が、本発明の判定方法よりも高いことがわかる。
【0087】
(2)クローン病判定用遺伝子群に属する遺伝子とは異なる遺伝子を用いた判定
(2-1)クローン病判定用遺伝子群の同定に用いた検体について
クローン病判定用遺伝子群に属する遺伝子(表1の26遺伝子)とは異なる遺伝子を用いた場合についても検討するため、そのような遺伝子を新たに同定した。具体的には、上記の健常者1(21検体)についての発現量とクローン病患者1(29検体)についての発現量との間の有意確率(p値)をT検定により求め、得られたp値が0.05以下であった発現量の遺伝子を判定に用いる遺伝子とした。その結果、5個の遺伝子を同定した。これらの遺伝子および各遺伝子のp値を、表3に示す。また、各遺伝子における健常者1とクローン病患者1とについて、遺伝子の転写産物の発現量の分布を、図8に示す。
【0088】
【表3】
【0089】
これらの遺伝子のそれぞれにおける上記の健常者1(21検体)およびクローン病患者1(29検体)についての発現量を、それぞれSVMに入力した。そして、これらの50検体の発現量が入力されたSVMを用いて、各検体が陽性と判定されるか、または陰性と判定されるかについて、判定の精度の評価を行った。
この結果を、図9Aに示す。この結果から、クローン病判定用遺伝子群に属する遺伝子とは異なる遺伝子を用いた従来の判定方法によれば、95%以上の感度および特異度で、クローン病患者および健常者を同定できることがわかる。
【0090】
(2-2)従来の判定方法の再現性の評価
次いで、上記の5遺伝子を用いる従来の判定方法の再現性を評価するために、上記のクローン病患者2(30検体)のデータおよび健常者2(21検体)のデータを用いた。そして、これらの検体について、上記(2-1)で健常者1(21検体)およびクローン病患者1(29検体)についての発現量が入力されたSVMを用いて判定を行った。
この結果を、図9Bに示す。この結果から、クローン病判定用遺伝子群の同定に用いた検体とは異なる検体について、従来の判定方法の感度は90%以上であったが、特異度は40%以下に低下していた。したがって、クローン病判定用遺伝子群に属する遺伝子とは異なる遺伝子を用いた従来の判定方法では、健常者をクローン病患者であるとして誤った判定結果を示す可能性が、本発明の判定方法よりも高いことがわかる。
【0091】
実施例1および比較例1の結果から、本発明の判定方法は、健常者およびクローン病患者の遺伝子の転写産物の発現量自体に基づいてクローン病の罹患を判定する通常の方法よりも、高い精度の判定を安定して行い得ることがわかる。
【0092】
実施例2 ハンチントン病の罹患の判定方法
(1)ハンチントン病判定用遺伝子群の同定
実施例2においては、ハンチントン病患者および健常者の血液中の遺伝子の転写産物の発現量データとして、GEOから入手したデータを用いた。なお、該データは、測定したシグナルの生データを正規化処理したものとして、http://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE1751から入手することができる。
(1-1)検体の選択およびプローブセットの絞り込み
上記のデータから、ハンチントン病患者1(6検体)のデータおよび健常者3(7検体)のデータをランダムに選択し、これらのデータをハンチントン病判定用遺伝子群の同定のためのデータとした。
上記のGEOから入手したハンチントン病患者および健常者についてのデータは、GeneChip(登録商標)U133A(Affimetrix社)を用いた解析により得られたものである。実施例1の(1-1)と同様に、上記のDNAチップのプローブセットに対応する遺伝子において、同一の遺伝子に対する複数のプローブセットが含まれる遺伝子については、最大のシグナル値を示したプローブセットのみを抽出した。さらに、シグナル値が50以下のプローブセットは、測定値の再現性が低いと考えられるので除外した。この結果、8370個のプローブセットに対応する遺伝子について、以下の解析を行った。
【0093】
(1-2)発現量のZスコア化
上記のようにして選択された8370個のプローブセットに対応する遺伝子の転写産物について、健常者3(7検体)から得られたシグナル値全てを用いて平均値および標準偏差を取得した。この値を用いて、8370個の遺伝子それぞれについて、以下の式を用いて、該遺伝子それぞれの偏差を表す値(Zスコア)を求めた。
Zスコア=(各遺伝子の転写産物のシグナル値−健常者3(7検体)の対応する遺伝子の転写産物のシグナル値の平均値)/健常者3(7検体)の対応する遺伝子の転写産物のシグナル値の標準偏差
【0094】
(1-3)遺伝子の分類および各遺伝子群での平均値の取得
Gene Ontologyの分類に基づいて、上記の8370個の遺伝子を遺伝子群(GO Term)に分類し、各GO Term内の遺伝子について上記(1-2)で求めたハンチントン病患者1(6検体)のZスコアを平均して、平均値を求めた。
また、健常者3(7検体)についても、上記と同様にして、各GO Termでの平均値を求めた。
【0095】
(1-4)健常者とハンチントン病患者との間で有意差のある遺伝子群の選択
上記のようにして得られた健常者とハンチントン病患者の各GO Termについての平均値を用いてT検定を行い、有意確率(p値)を取得した。
用いたGO Termから、得られたp値が0.05以下(p値≦5.0E-02)であったGO Termを抽出した。
次に、抽出したGO Termに含まれる全ての遺伝子についてのZスコアを用いて階層型クラスタリングを行い、同調して変動する遺伝子のクラスタを選択した。なお、クラスタリングには、ソフトウェアCluster3.0(http://bonsai.ims.u-tokyo.ac.jp/〜mdehoon/software/cluster/software.htmから入手可能)を、その結果の表示にはJavaTreeView (http://sourceforge.net/projects/jtreeview/files/から入手可能)を用いた。
各クラスタに含まれる遺伝子のZスコアの平均値をクラスタのスコアとし、健常者3(7検体)と、ハンチントン病患者1(6検体)とについてT検定を行った。得られたp値が0.05以下であったクラスタから、微小管関連遺伝子群、ミトコンドリア関連遺伝子群およびプロスタグランジン関連遺伝子群を、ハンチントン病判定用遺伝子群として選択した。これらの遺伝子群ならびに各群に属する遺伝子および各群のp値を、表4に示す。
上記選択された各遺伝子群における健常者3およびハンチントン病患者1についてのZスコアの平均値の分布を、図10に示す。
【0096】
【表4】
【0097】
(2)本発明の判定方法の精度の評価
(2-1)ハンチントン病判定用遺伝子群の同定に用いた検体についての判定
上記の3つのハンチントン病判定用遺伝子群のそれぞれにおける健常者3(7検体)およびハンチントン病患者1(6検体)についての平均値を、それぞれ、SVMに入力した。そして、これらの13検体の平均値が入力されたSVMを用いて、各検体が陽性である(ハンチントン病である)か、または陰性である(健常である)かを、判定した。
この結果を、図11Aに示す。この結果から、本発明の判定方法によれば、100%の感度および特異度で、ハンチントン病患者および健常者を同定できることがわかる。
【0098】
(2-2)本発明の判定方法の再現性の評価
さらに、本発明の判定方法の再現性を評価するために、上記(1-1)で選択されたデータとは異なるハンチントン病患者2(6検体)のデータおよび健常者4(7検体)のデータを用いた。そして、これらのデータについて、上記(2-1)でハンチントン病判定用遺伝子群の同定に用いた検体の平均値が入力されたSVMを用いて判定を行った。
この結果を、図11Bに示す。この結果から、本発明の判定方法によると、ハンチントン病判定用遺伝子群の同定に用いた検体とは異なる検体についても、80%以上の感度および100%の特異度で、安定して健常者とハンチントン病患者とを区別できることがわかる。
【0099】
比較例2 従来の判定方法によるハンチントン病の判定
ここでは、従来の判定方法として、健常者および患者の遺伝子の転写産物の発現量自体に基づいて疾患の罹患を判定する方法を用いた。このような、従来の判定方法を用いて、ハンチントン病の罹患を判定した場合の判定の精度を評価した。
(1)ハンチントン病判定用遺伝子群に属する遺伝子を用いた判定
(1-1)ハンチントン病判定用遺伝子群の同定に用いた検体について
表3の27遺伝子のそれぞれにおける上記の健常者3(7検体)およびハンチントン病患者1(6検体)についての発現量を、それぞれSVMに入力した。そして、これらの13検体の発現量が入力されたSVMを用いて、各検体が陽性と判定されるか、または陰性と判定されるかについて、判定の精度の評価を行った。
この結果を、図12Aに示す。この結果から、従来の判定方法によれば、100%の感度および特異度で、ハンチントン病患者および健常者を同定できることがわかる。
【0100】
(1-2)従来の判定方法の再現性の評価
次いで、従来の判定方法の再現性を評価するために、上記のハンチントン病患者2(6検体)のデータおよび健常者4(7検体)のデータを用いた。そして、これらの検体について、上記(1-1)で健常者3(7検体)およびハンチントン病患者1(6検体)についての発現量が入力されたSVMを用いて判定を行った。
この結果を、図12Bに示す。この結果から、ハンチントン病判定用遺伝子群の同定に用いた検体とは異なる検体について、従来の判定方法の特異度は100%であったが、感度は70%以下に低下した。したがって、従来の判定方法では、ハンチントン病患者を健常者であるとして誤った判定結果を示す可能性が、本発明の判定方法よりも高いことがわかる。
【0101】
(2)ハンチントン病判定用遺伝子群に属する遺伝子とは異なる遺伝子を用いた判定
(2-1)ハンチントン病判定用遺伝子群の同定に用いた検体について
ハンチントン病判定用遺伝子群に属する遺伝子(表3の27遺伝子)とは異なる遺伝子を用いた場合についても検討するため、そのような遺伝子を新たに同定した。具体的には、上記の健常者3(7検体)についての発現量とハンチントン病患者1(6検体)についての発現量との間の有意確率(p値)をT検定により求め、得られたp値が0.05以下であった発現量の遺伝子を判定に用いる遺伝子とした。その結果、10個の遺伝子を同定した。これらの遺伝子および各遺伝子のp値を、表5に示す。また、各遺伝子における健常者3とハンチントン病患者1とについて、遺伝子の転写産物の発現量の分布を、図13に示す。
【0102】
【表5】
【0103】
これらの遺伝子のそれぞれにおける上記の健常者3(7検体)およびハンチントン病患者1(6検体)についての発現量を、それぞれSVMに入力した。そして、これらの13検体の発現量が入力されたSVMを用いて、各検体が陽性と判定されるか、または陰性と判定されるかについて、判定の精度の評価を行った。
この結果を、図14Aに示す。この結果から、ハンチントン病判定用遺伝子群に属する遺伝子とは異なる遺伝子を用いた従来の判定方法によれば、100%の感度および特異度で、ハンチントン病患者および健常者を同定できることがわかる。
【0104】
(2-2)従来の判定方法の再現性の評価
次いで、上記の10遺伝子を用いる従来の判定方法の再現性を評価するために、上記のハンチントン病患者2(6検体)のデータおよび健常者4(7検体)のデータを用いた。そして、これらの検体について、上記(2-1)で健常者3(7検体)およびハンチントン病患者1(6検体)についての発現量が入力されたSVMを用いて判定を行った。
この結果を、図14Bに示す。この結果から、ハンチントン病判定用遺伝子群の同定に用いた検体とは異なる検体について、従来の判定方法の特異度は100%であったが、感度は50%に低下していた。したがって、ハンチントン病判定用遺伝子群に属する遺伝子とは異なる遺伝子を用いた従来の判定方法では、ハンチントン病患者を健常者であるとして誤った判定結果を示す可能性が、本発明の判定方法よりも高いことがわかる。
【0105】
実施例2および比較例2の結果から、本発明の判定方法は、健常者およびハンチントン病患者の遺伝子の転写産物の発現量自体に基づいてハンチントン病の罹患を判定する通常の方法よりも、高い精度の判定を安定して行い得ることがわかる。
【0106】
実施例3 子宮内膜症の罹患の判定方法
(1)子宮内膜症判定用遺伝子群の同定
実施例3においては、子宮内膜症患者の病変部組織および正常組織のそれぞれから得た遺伝子の転写産物の発現量データとして、GEOから入手したデータを用いた。なお、該データは、測定したシグナルの生データを正規化処理したものとして、http://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE7305およびhttp://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE6364から入手することができる。
(1-1)検体の選択およびプローブセットの絞り込み
上記のデータから、病変部組織1(9検体)のデータおよび正常組織1(8検体)のデータをランダムに選択し、これらのデータを子宮内膜症判定用遺伝子群の同定のためのデータとした。
上記のGEOから入手した病変部組織および正常組織についてのデータは、DNAチップであるGeneChip(登録商標)U133 plus2.0(Affimetrix社)を用いた解析により得られたものである。このDNAチップには、54675個のプローブセットが配置されているが、これらのプローブセットには、同一の遺伝子に対する複数のプローブセットも含まれる。
そこで、上記のDNAチップのプローブセットに対応する遺伝子において、同一の遺伝子に対する複数のプローブセットが含まれる遺伝子については、最大のシグナル値を示したプローブセットのみを抽出した。さらに、シグナル値が100以下のプローブセットは、測定値の再現性が低いと考えられるので除外した。この結果、16207個のプローブセットに対応する遺伝子について、以下の解析を行った。
【0107】
(1-2)発現量のZスコア化
上記のようにして選択された16207個のプローブセットに対応する遺伝子の転写産物について、正常組織1(8検体)から得られたシグナル値全てを用いて平均値および標準偏差を取得した。この値を用いて、16207個の遺伝子それぞれについて、以下の式を用いて、該遺伝子それぞれの偏差を表す値(Zスコア)を求めた。
Zスコア=(各遺伝子の転写産物のシグナル値−正常組織1(8検体)の対応する遺伝子の転写産物のシグナル値の平均値)/正常組織1(8検体)の対応する遺伝子の転写産物のシグナル値の標準偏差
【0108】
(1-3)遺伝子の分類および各遺伝子群での平均値の取得
Gene Ontologyの分類に基づいて、上記の16207個の遺伝子を遺伝子群(GO Term)に分類し、各GO Term内の遺伝子について上記(1-2)で求めた病変部組織1(9検体)のZスコアを平均して、平均値を求めた。
また、正常組織1(8検体)についても、上記と同様にして、各GO Termでの平均値を求めた。
【0109】
(1-4)正常組織と病変部組織との間で有意差のある遺伝子群の選択
上記のようにして得られた正常組織および病変部組織の各GO Termについての平均値を用いてT検定を行い、有意確率(p値)を取得した。
用いたGO Termから、得られたp値が0.05以下(p値≦5.0E-02)であったGO Termを抽出した。
次に、抽出したGO Termに含まれる全ての遺伝子についてのZスコアを用いて階層型クラスタリングを行い、同調して変動する遺伝子のクラスタを選択した。なお、クラスタリングには、ソフトウェアCluster3.0(http://bonsai.ims.u-tokyo.ac.jp/〜mdehoon/software/cluster/software.htmから入手可能)を、その結果の表示にはJavaTreeView (http://sourceforge.net/projects/jtreeview/files/から入手可能)を用いた。
各クラスタに含まれる遺伝子のZスコアの平均値をクラスタのスコアとし、正常組織1(8検体)と、病変部組織1(9検体)とについてT検定を行った。得られたp値が0.05以下であったクラスタから、サイトカイン合成経路関連遺伝子群、サイトカイン媒介シグナル関連遺伝子群およびイムノグロブリン媒介免疫反応関連遺伝子群を、子宮内膜症判定用遺伝子群として選択した。これらの遺伝子群ならびに各群に属する遺伝子および各群のp値を、表6に示す。
上記の選択された各遺伝子群における正常組織1および病変部組織1についてのZスコアの平均値の分布を、図15に示す。
【0110】
【表6】
【0111】
(2)本発明の判定方法の精度の評価
(2-1)子宮内膜症判定用遺伝子群の同定に用いた検体についての判定
上記の3つの子宮内膜症判定用遺伝子群のそれぞれにおける正常組織1(8検体)および病変部組織1(9検体)についての平均値を、それぞれ、SVMに入力した。そして、これらの17検体の平均値が入力されたSVMを用いて、各検体が陽性である(子宮内膜症である)か、または陰性である(健常である)かを、判定した。
この結果を、図16Aに示す。この結果から、本発明の判定方法によれば、85%以上の感度および100%の特異度で、正常組織および病変部組織についての検体を同定できることがわかる。
【0112】
(2-2)本発明の判定方法の再現性の評価
さらに、本発明の判定方法の再現性を評価するために、上記(1-1)で選択されたデータとは異なる病変部位組織2(9検体)のデータおよび正常組織2(8検体)のデータを用いた。そして、これらのデータについて、上記(2-1)で子宮内膜症判定用遺伝子群の同定に用いた検体の平均値が入力されたSVMを用いて判定を行った。
この結果を、図16Bに示す。この結果から、本発明の判定方法によれば、子宮内膜症判定用遺伝子群の同定に用いた検体とは異なる検体についても、75%の感度および85%以上の特異度で、安定して正常組織についての検体と病変部組織についての検体とを区別できることがわかる。
【0113】
比較例3 従来の判定方法による子宮内膜症の判定
ここでは、従来の判定方法として、健常者および患者の遺伝子の転写産物の発現量自体に基づいて疾患の罹患を判定する方法を用いた。このような、従来の判定方法を用いて、子宮内膜症の病変部組織についての検体を判定した場合の判定の精度を評価した。
(1)子宮内膜症判定用遺伝子群に属する遺伝子を用いた判定
(1-1)子宮内膜症病判定用遺伝子群の同定に用いた検体について
表5の39遺伝子のそれぞれにおける上記の正常組織1(8検体)および病変部組織1(9検体)についての発現量を、それぞれSVMに入力した。そして、これらの17検体の発現量が入力されたSVMを用いて、各検体が陽性と判定されるか、または陰性と判定されるかについて、判定の精度の評価を行った。
この結果を、図17Aに示す。この結果から、従来の判定方法によれば、100%の感度および特異度で、正常組織および病変部組織についての検体を同定できることがわかる。
【0114】
(1-2)従来の判定方法の再現性の評価
次いで、従来の判定方法の再現性を評価するために、上記の正常組織2(8検体)および病変部組織2(9検体)のデータを用いた。そして、これらの検体について、上記(1-1)で正常組織1(8検体)および病変部組織1(9検体)についての発現量が入力されたSVMを用いて判定を行った。
この結果を、図17Bに示す。この結果から、子宮内膜症判定用遺伝子群の同定に用いた検体とは異なる検体について、従来の判定方法の特異度は100%であったが、感度は65%以下に低下した。したがって、従来の判定方法では、子宮内膜症患者を健常者であるとして誤った判定結果を示す可能性が、本発明の判定方法よりも高いことがわかる。
【0115】
(2)子宮内膜症判定用遺伝子群に属する遺伝子とは異なる遺伝子を用いた判定
(2-1)子宮内膜症判定用遺伝子群の同定に用いた検体について
子宮内膜症判定用遺伝子群に属する遺伝子(表5の39遺伝子)とは異なる遺伝子を用いた場合についても検討するため、そのような遺伝子を新たに同定した。具体的には、上記の正常組織1(8検体)についての発現量と病変部組織1(9検体)についての発現量との間の有意確率(p値)をT検定により求め、得られたp値が0.05以下であった発現量の遺伝子を判定に用いる遺伝子とした。その結果、10個の遺伝子を同定した。これらの遺伝子および各遺伝子のp値を、表7に示す。また、各遺伝子における健常者3と子宮内膜症患者1とについて、遺伝子の転写産物の発現量の分布を、図18に示す。
【0116】
【表7】
【0117】
これらの遺伝子のそれぞれにおける上記の正常組織1(8検体)および病変部組織1(9検体)についての発現量を、それぞれSVMに入力した。そして、これらの17検体の発現量が入力されたSVMを用いて、各検体が陽性と判定されるか、または陰性と判定されるかについて、判定の精度の評価を行った。
この結果を、図19Aに示す。この結果から、子宮内膜症判定用遺伝子群に属する遺伝子とは異なる遺伝子を用いた従来の判定方法によれば、100%の感度および特異度で、正常組織および病変部組織についての検体を同定できることがわかる。
【0118】
(2-2)従来の判定方法の再現性の評価
次いで、上記の10遺伝子を用いる従来の判定方法の再現性を評価するために、上記の正常組織2(8検体)のデータおよび正常組織2(8検体)のデータを用いた。そして、これらの検体について、上記(2-1)で健常者3(7検体)および子宮内膜症患者1(6検体)についての発現量が入力されたSVMを用いて判定を行った。
この結果を、図19Bに示す。この結果から、子宮内膜症判定用遺伝子群の同定に用いた検体とは異なる検体について、従来の判定方法の特異度は100%であったが、感度は0%に低下していた。したがって、子宮内膜症判定用遺伝子群に属する遺伝子とは異なる遺伝子を用いた従来の判定方法では、子宮内膜症患者を健常者であるとして誤った判定結果を示す可能性が、本発明の判定方法よりも極めて高いことがわかる。
【0119】
実施例3および比較例3の結果から、本発明の判定方法は、健常者および子宮内膜症患者の遺伝子の転写産物の発現量自体に基づいて子宮内膜症の罹患を判定する通常の方法よりも、高い精度の判定を安定して行い得ることがわかる。
【符号の説明】
【0120】
1 遺伝子の転写産物発現量測定装置
2 コンピュータ
3 ケーブル
110 本体
110a CPU
110b ROM
110c RAM
110d ハードディスク
110e 読出装置
110f 入出力インタフェース
110g 画像出力インタフェース
110h バス
120 ディスプレイ
130 入力部
【技術分野】
【0001】
本発明は、被験者が判定対象の疾患に罹患しているか否かを判定するための方法に関する。より具体的には、本発明は、被験者から採取された生体試料中のある特定の遺伝子の転写産物の発現量の測定に基づいて、該被験者が判定対象の疾患に罹患しているか否かを判定できる方法に関する。
【背景技術】
【0002】
多数の遺伝子またはそれらの転写産物の発現量の網羅的解析は、ある特定の疾患に関連して発現量が変化する遺伝子を見出すことができるので、該疾患の罹患を判定するのに利用できる可能性が期待されている。そのため、そのような網羅的解析のデータに基づいて、被験者がある特定の疾患に罹患しているか否かを判定する方法についての研究が、これまでに数多く行われてきた。
しかしながら、遺伝子またはその転写産物の発現量の網羅的解析においては、偽陽性の遺伝子も多数検出されることや、測定系による誤差、遺伝子発現の再現性の不良などのため、真に有意な発現量の変化を示す遺伝子を抽出することは困難であるという問題が存在する。
【0003】
一方、そのような問題を解決するために、現在までに解析データに対する様々な統計的手法が研究および開発されてきた。
例えば、特開2005−323573号公報(特許文献1)は、DNAマイクロアレイから得た遺伝子の発現量データを多変量解析することで、異なる2条件間での遺伝子発現が有意に異なるかを判定する方法を開示している。
また、特表2007−524408号公報(特許文献2)は、細胞内グルタチオンレベルの調節に関与する遺伝子の発現レベルに基づいて、精神障害を診断する方法を開示している。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2005−323573号公報
【特許文献2】特表2007−524408号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
このように、真に有意な発現量の変化を示す遺伝子を抽出するための研究が数多くなされているにもかかわらず、疾患の罹患の判定に普遍的に有効な統計的手法は、未だ得られていないのが現状である。
そこで、本発明は、判定対象の疾患の罹患が疑われる被験者が、該疾患に罹患しているか否かの判定を正確に安定して行うことができる方法を提供することを目的とする。
【課題を解決するための手段】
【0006】
本発明者らは、上記の課題を解決するために鋭意研究を重ねた結果、判定対象の疾患の罹患が疑われる被験者からの生体試料中のある特定のカテゴリー(遺伝子群)に属する少なくとも1つの遺伝子の転写産物の発現量を測定し、健常者から得られる生体試料中の対応する遺伝子の転写産物の発現量からの偏差を表す値を取得し、この偏差を表す値をカテゴリー内で平均化し、少なくとも2つのカテゴリーについて求めた平均化された値を用いることにより、判定対象疾患に罹患している被験者を、健常者から明確に安定して区別できることを見出して、本発明を完成した。
【0007】
よって、本発明は、
(1)判定対象疾患の罹患が疑われる被験者から得られた生体試料中の、前記疾患と関連する少なくとも2つの疾患判定用遺伝子群それぞれにおいて、遺伝子群に属する少なくとも1つの遺伝子の転写産物の発現量を測定する工程と、
(2)前記発現量を複数の健常者における対応する遺伝子の転写産物の発現量に基づいて標準化することにより、偏差を表わす値を取得する工程と、
(3)前記遺伝子群それぞれにおいて、遺伝子群に属する遺伝子についての偏差を表す値の平均値を取得する工程と、
(4)前記平均値を用いて、前記被験者が対象疾患に罹患しているか否かを判定する工程と
を含む、疾患の罹患判定方法を提供する。
【0008】
また、本発明は、コンピュータを、
判定対象疾患の罹患が疑われる被験者から得られた生体試料中の、前記疾患と関連する少なくとも2つの疾患判定用遺伝子群それぞれにおいて、遺伝子群に属する少なくとも1つの遺伝子の転写産物の発現量を受け付ける受付手段、
前記発現量を複数の健常者における対応する遺伝子の発現量に基づいて標準化することにより偏差を表わす値を取得する偏差取得手段、
前記遺伝子群それぞれにおいて、遺伝子群に属する遺伝子の偏差を表す値の平均値を取得する平均値取得手段、
前記平均値を用いて、被験者が対象疾患に罹患しているか否かを判定する判定手段、
判定手段の判定結果を出力する出力手段
として機能させるための疾患の罹患判定用プログラムも提供する。
【発明の効果】
【0009】
本発明の判定方法によると、判定対象疾患の罹患が疑われる被験者が該疾患に罹患しているか否かを、該被験者からの生体試料を用いて簡便に判定できるとともに、客観的な判定手段を提供できる。また、本発明の判定方法は、従来の方法に比較して、判定対象疾患の診断の助けとなるより精度の高い指標を安定に提供することを可能にする。
【図面の簡単な説明】
【0010】
【図1】本発明のプログラムが用いられる判定対象疾患の罹患の判定用装置の一例を示す図である。
【図2】本発明のプログラムを実行するコンピュータシステムの一例を示す図である。
【図3】本発明のプログラムによる具体的な動作のフローチャートである。
【図4】疾患判定用遺伝子群を同定する場合の本発明のプログラムによる具体的な動作のフローチャートである
【図5】Gタンパク質関連遺伝子群、血液凝固関連遺伝子群、酸化ストレス関連遺伝子群、ファゴサイトーシス関連遺伝子群および脂肪酸化関連遺伝子群に属する遺伝子の転写産物の発現量から求めた健常者およびクローン病患者のZスコアの平均値の分布を示す。
【図6】(A)クローン病判定用遺伝子群のそれぞれにおける、該遺伝子群の同定に用いた健常者およびクローン病患者の遺伝子の転写産物の発現量データから求めたZスコアの平均値を用いて、判定を行った結果を示す。(B)クローン病判定用遺伝子群のそれぞれにおける、該遺伝子群の同定に用いたデータとは異なる健常者およびクローン病患者の遺伝子の転写産物の発現量データから求めたZスコアの平均値を用いて、判定を行った結果を示す。
【図7】(A)クローン病判定用遺伝子群に属する遺伝子における、該遺伝子群の同定に用いた健常者およびクローン病患者の遺伝子の転写産物の発現量データを用いて、判定を行った結果を示す。(B)クローン病判定用遺伝子群に属する遺伝子における、該遺伝子群の同定に用いたデータとは異なる健常者およびクローン病患者の遺伝子の転写産物の発現量データを用いて、判定を行った結果を示す。
【図8】クローン病判定用遺伝子群の同定に用いた健常者およびクローン病患者の遺伝子の転写産物の発現量データから同定した、健常者とクローン病患者との間に有意差のある遺伝子の発現量の分布を示す。
【図9】(A)健常者とクローン病患者との間に有意差のある遺伝子における、クローン病判定用遺伝子群の同定に用いた健常者およびクローン病患者の遺伝子の転写産物の発現量データを用いて、判定を行った結果を示す。(B)健常者とクローン病患者との間に有意差のある遺伝子における、クローン病判定用遺伝子群の同定に用いたデータとは異なる健常者およびクローン病患者の遺伝子の転写産物の発現量データを用いて、判定を行った結果を示す。
【図10】微小管関連遺伝子群、ミトコンドリア関連遺伝子群およびプロスタグランジン関連遺伝子群に属する遺伝子の転写産物の発現量から求めた健常者およびハンチントン病患者のZスコアの平均値の分布を示す。
【図11】(A)ハンチントン病判定用遺伝子群のそれぞれにおける、該遺伝子群の同定に用いた健常者およびハンチントン病患者の遺伝子の転写産物の発現量データから求めたZスコアの平均値を用いて、判定を行った結果を示す。(B)ハンチントン病判定用遺伝子群のそれぞれにおける、該遺伝子群の同定に用いたデータとは異なる健常者およびハンチントン病患者の遺伝子の転写産物の発現量データから求めたZスコアの平均値を用いて、判定を行った結果を示す。
【図12】(A)ハンチントン病判定用遺伝子群に属する遺伝子における、該遺伝子群の同定に用いた健常者およびハンチントン病患者の遺伝子の転写産物の発現量データを用いて、判定を行った結果を示す。(B)ハンチントン病判定用遺伝子群に属する遺伝子における、該遺伝子群の同定に用いたデータとは異なる健常者およびハンチントン病患者の遺伝子の転写産物の発現量データを用いて、判定を行った結果を示す。
【図13】ハンチントン病判定用遺伝子群の同定に用いた健常者およびハンチントン病患者の遺伝子の転写産物の発現量データから同定した、健常者とハンチントン病患者との間に有意差のある遺伝子の発現量の分布を示す。
【図14】(A)健常者とハンチントン病患者との間に有意差のある遺伝子における、ハンチントン病判定用遺伝子群の同定に用いた健常者およびハンチントン病患者の遺伝子の転写産物の発現量データを用いて、判定を行った結果を示す。(B)健常者とハンチントン病患者との間に有意差のある遺伝子における、ハンチントン病判定用遺伝子群の同定に用いたデータとは異なる健常者およびハンチントン病患者の遺伝子の転写産物の発現量データを用いて、判定を行った結果を示す。
【図15】サイトカイン合成経路関連遺伝子群、サイトカイン媒介シグナル関連遺伝子群およびイムノグロブリン媒介免疫反応関連遺伝子群に属する遺伝子の転写産物の発現量から求めた正常組織および子宮内膜症の病変部組織のZスコアの平均値の分布を示す。
【図16】(A)子宮内膜症判定用遺伝子群のそれぞれにおける、該遺伝子群の同定に用いた正常組織および子宮内膜症の病変部組織の遺伝子の転写産物の発現量データから求めたZスコアの平均値を用いて、判定を行った結果を示す。(B)子宮内膜症判定用遺伝子群のそれぞれにおける、該遺伝子群の同定に用いたデータとは異なる正常組織および子宮内膜症の病変部組織の遺伝子の転写産物の発現量データから求めたZスコアの平均値を用いて、判定を行った結果を示す。
【図17】(A)子宮内膜症判定用遺伝子群に属する遺伝子における、該遺伝子群の同定に用いた正常組織および子宮内膜症の病変部組織の遺伝子の転写産物の発現量データを用いて、判定を行った結果を示す。(B)子宮内膜症判定用遺伝子群に属する遺伝子における、該遺伝子群の同定に用いたデータとは異なる正常組織および子宮内膜症の病変部組織の遺伝子の転写産物の発現量データを用いて、判定を行った結果を示す。
【図18】子宮内膜症判定用遺伝子群の同定に用いた正常組織および子宮内膜症の病変部組織の遺伝子の転写産物の発現量データから同定した、正常組織と子宮内膜症の病変部組織との間に有意差のある遺伝子の発現量の分布を示す。
【図19】(A)正常組織と子宮内膜症の病変部組織との間に有意差のある遺伝子における、子宮内膜症判定用遺伝子群の同定に用いた正常組織および子宮内膜症の病変部組織の遺伝子の転写産物の発現量データを用いて、判定を行った結果を示す。(B)正常組織と子宮内膜症の病変部組織との間に有意差のある遺伝子における、子宮内膜症判定用遺伝子群の同定に用いたデータとは異なる正常組織および子宮内膜症の病変部組織の遺伝子の転写産物の発現量データを用いて、判定を行った結果を示す。
【発明を実施するための形態】
【0011】
本発明の判定方法では、まず、判定対象疾患の罹患が疑われる被験者から得られた生体試料中の、前記疾患と関連する少なくとも2つの疾患判定用遺伝子群それぞれにおいて、遺伝子群に属する少なくとも1つの遺伝子の転写産物の発現量を測定する。
【0012】
本発明の判定方法において判定の対象となる疾患(判定対象疾患)は、特に限定されないが、例えば、診断のためにCTやMRIなどの高度な医療設備を要する疾患、特異な症状または所見に乏しいために除外診断が一般に行われている疾患などであり得る。そのような疾患としては、例えば、癌(肺癌、乳癌、胃癌、大腸癌、子宮頚癌、メラノーマなど)、自己免疫疾患(リウマチ、全身性エリテマトーデス、シェーグレン症候群、ギランバレー症候群、潰瘍性大腸炎など)、感染症(マラリア、日本脳炎、コレラ、チフス、赤痢など)、精神または神経系疾患(統合失調症、双極性障害、アルツハイマー病、ハンチントン病など)、原因不明の疾患(クローン病、子宮内膜症など)が挙げられる。
【0013】
本明細書において、判定対象疾患の罹患が疑われる被験者(以下、単に「被験者」ともいう)とは、上記のような判定対象疾患に罹患している可能性があり、本発明の判定方法により罹患の有無が判定されることになる被験者を意味する。
生体試料は、そこから遺伝子の転写産物を抽出可能な生体から採取される試料であれば特に限定されず、被験者の血液(全血、血漿、血清を含む)、唾液、尿、体毛などを用いることができる。
【0014】
本明細書において、「判定対象疾患と関連する疾患判定用遺伝子群」とは、判定対象疾患と関連することが、医学的、生物学的または統計学的に明らかである遺伝子群を意味する。そのような関連が明らかであれば、本発明の判定方法に用いる疾患判定用遺伝子群は、特に限定されない。なお、本発明の判定方法においては、後述する手順により同定される遺伝子群を、判定対象疾患と関連する疾患判定用遺伝子群として用いることができる。
【0015】
本明細書において、遺伝子の転写産物とは、遺伝子が転写されることにより得られる産物のことであり、リボ核酸(RNA)、具体的にはメッセンジャーRNA(mRNA)である。
また、本明細書において、「遺伝子の転写産物の発現量」とは、上記の生体試料中の遺伝子の転写産物の存在量または該存在量を反映する物質の量のことである。よって、本発明の判定方法では、遺伝子の転写産物(mRNA)の量、またはmRNAから得られる相補デオキシリボ核酸(cDNA)もしくは相補RNA(cRNA)の量を測定できる。通常、生体試料中のmRNAは微量であるので、そこから逆転写およびインビトロ転写(IVT)により得られるcDNAまたはcRNAの量を測定することが好ましい。
【0016】
生体試料から遺伝子の転写産物を抽出する方法は、当該技術において知られるRNA抽出法を用いて行うことができる。例えば、生体試料を遠心分離して、RNAを含む細胞を沈殿させ、該細胞を物理的または酵素的に破壊し、細胞破片を除去することによりRNA抽出物を得ることができる。RNAの抽出は、市販のRNA抽出キットなどを用いて行うこともできる。
【0017】
上記のようにして得られた遺伝子の転写産物の抽出物から、遺伝子の転写産物の発現量の測定時に混入していないことが好ましい生体試料由来の混入成分、例えば、生体試料が血液である場合はグロビンのmRNAなどを除去するための処理を行うこともできる。
【0018】
上記のようにして得られた遺伝子の転写産物の抽出物について、判定対象疾患との関連が既知である少なくとも2つの疾患判定用遺伝子群それぞれにおいて、遺伝子群に属する少なくとも1つの遺伝子の転写産物の発現量を測定する。
【0019】
遺伝子の転写産物の発現量の測定は、それ自体公知の方法に従って行うことができるが、多数の遺伝子の転写産物の発現解析を行うことができる点で、定量PCR法や核酸チップを用いる測定方法が好ましい。
核酸チップを用いて遺伝子の転写産物の発現量を測定する場合、例えば、基板上に固定された20〜25 mer程度の核酸プローブに、遺伝子の転写産物の抽出物または遺伝子の転写産物から作製したcDNAもしくはcRNAを接触させ、ハイブリッドの形成の有無を蛍光、発色、電流などの指標の変化を測定することにより、目的の遺伝子の転写産物の発現量を測定できる。
上記の核酸プローブは、1つの遺伝子の転写産物に対して少なくとも1つ用いればよく、遺伝子の転写産物の長さなどに応じて、複数のプローブを用いることもできる。プローブの配列は、測定しようとする遺伝子の転写産物の配列に応じて当業者が適宜決定できる。
核酸チップを用いる遺伝子の転写産物の発現量の測定方法としては、例えば、Affymetrix社により提供されるGeneChipシステムを用いることができる。
【0020】
核酸チップを用いる場合、遺伝子の転写産物またはそのcDNAもしくはcRNAは、核酸プローブとのハイブリッド形成を容易にするために、断片化してよい。断片化は、当該技術において公知の方法により行うことができ、例えば、リボヌクレアーゼ、デオキシリボヌクレアーゼなどの核酸分解酵素を用いて行うことができる。
【0021】
核酸チップにおいて核酸プローブと接触させる遺伝子の転写産物またはそのcDNAもしくはcRNAは、通常、5〜20μg程度であればよい。接触条件は、通常、45℃にて16時間程度である。
【0022】
核酸プローブと接触させてハイブリッドを形成した遺伝子の転写産物またはそのcDNAもしくはcRNAは、そのハイブリッド形成の有無およびハイブリッド形成した量について、蛍光物質、色素またはハイブリッド形成したことによる核酸チップ上を流れる電流量の変化などに基づいて検出することができる。
ハイブリッドの形成を、蛍光物質または色素の検出により測定する場合、遺伝子の転写産物またはそのcDNAもしくはcRNAが、蛍光物質または色素の検出のための標識物質で標識されていることが好ましい。このような標識物質は、当該技術において通常用いられるものを用いることができる。通常、ビオチン化ヌクレオチドまたはビオチン化リボヌクレオチドを、cDNAまたはcRNAを合成するときのヌクレオチドまたはリボヌクレオチド基質として混合しておくことにより、得られるcDNAまたはcRNAがビオチンで標識されることができる。cDNAまたはcRNAがビオチン標識されていると、核酸チップ上で、ビオチンに対する結合パートナーであるアビジンまたはストレプトアビジンが結合できる。アビジンまたはストレプトアビジンが、適切な蛍光物質または色素と結合していることにより、ハイブリッドの形成が検出できる。蛍光物質としては、フルオレセインイソチオシアネート(FITC)、グリーン蛍光タンパク質(GFP)、ルシフェリン、フィコエリスリンなどが挙げられる。通常、フィコエリスリン−ストレプトアビジンのコンジュゲートが市販されているので、これを用いることが簡便である。
また、アビジンまたはストレプトアビジンに対する標識抗体を、アビジンまたはストレプトアビジンと接触させ、標識抗体の蛍光物質または色素を検出することもできる。
【0023】
この工程で得られる遺伝子の転写産物の発現量は、生体試料中の各遺伝子の転写産物の存在量を相対的に表す値であれば、特に限定されない。上記の核酸チップにより測定を行う場合、発現量は、蛍光強度、発色強度、電流量などに基づく核酸チップから得られるシグナルであり得る。
これらのシグナルは、核酸チップ用の測定装置を用いて測定できる。
【0024】
次いで、測定された発現量を、複数の健常者における対応する遺伝子の転写産物の発現量に基づいて標準化することにより、偏差を表す値を取得する。
本明細書において、「対応する遺伝子の転写産物」とは、被験者について発現量を測定したものと同じ遺伝子の転写産物を意味する。
複数の健常者における対応する遺伝子の転写産物の発現量は、上記の被験者からの生体試料について行ったのと同様の方法に従って、健常者から採取された生体試料を用い、測定対象の遺伝子の転写産物の発現量を測定することにより、得ることができる。
本明細書において、「健常者」とは、本発明の判定方法以外の基準に基づいて、判定対象疾患に罹患していないことが確認できる者のことである。例えば、判定対象疾患が、癌である場合は、組織診、CT、MRI、腫瘍マーカーなどにより、自己免疫疾患である場合は、血液検査などにより、感染症である場合は、血液検査などにより、精神または神経系疾患である場合は、脳画像診断、遺伝子検査、問診、質問紙などにより、クローン病の場合は、内視鏡検査、消化管造影検査などにより、子宮内膜症の場合は、CT、MRI、内視鏡検査などにより、判定対象疾患に罹患していないことが確認できる者のことである。
また、本明細書において、「複数の健常者」とは、統計学的に十分な人数の健常者を意味し、30名以上、好ましくは40名以上の人数であればよい。
【0025】
本明細書において、「複数の健常者における対応する遺伝子の転写産物の発現量に基づいて標準化する」とは、次の式により偏差を表す値を求めることを意味する。
偏差を表す値=(被験者での遺伝子の転写産物の発現量−複数の健常者での対応する遺伝子の転写産物の発現量の平均値)/複数の健常者での対応する遺伝子の転写産物の発現量の標準偏差
上記の偏差を表す値は、Zスコアとしても知られる値であり、複数の健常者における遺伝子の転写産物の発現量から、被験者の遺伝子の転写産物の発現量がどの程度かけ離れているかを示す値である。
【0026】
また、本発明の判定方法においては、被験者での遺伝子の転写産物の発現量を、複数の健常者での対応する遺伝子の転写産物の発現量の平均値で除算することにより、健常者に対する被験者の発現量比を表す値を取得し、上記の偏差を表す値に代えて、該発現比を表す値を次工程で用いてもよい。
上記の発現量比を表す値は、複数の健常者での対応する遺伝子の転写産物の発現量の平均値に対して、被験者の遺伝子の転写産物の発現量がどの程度大きいかを示す値である。
【0027】
次いで、選択された疾患判定用遺伝子群それぞれにおいて、遺伝子群に属する遺伝子の偏差を表す値の平均値を取得する。
なお、本明細書において、「平均値」とは、平均値を取得しようとする上記の遺伝子群の中で1つの遺伝子についての偏差を表す値しか得られていない場合は、その1つの遺伝子についての偏差を表す値を意味し、2つ以上の遺伝子についての偏差を表す値が得られている場合は、それらの偏差を表す値を平均した値を意味する。
【0028】
上記の平均値は、判定対象疾患との関連が既知である疾患判定用遺伝子群から選択される少なくとも2つの遺伝子群について取得する。なお、選択される遺伝子群の数は、多いほど好ましい。
【0029】
上記のようにして得られた平均値を用いて、被験者が判定対象疾患であるか否かを判定する。
この判定は、上記のようにして被験者から取得された平均値を、健常者から採取された生体試料を用いて上記の各工程と同様にして予め得られた平均値と、判定対象疾患の患者から採取された生体試料を用いて上記の各工程と同様にして予め得られた平均値とに基づいて得られる判定式に入力することにより行うことができる。
【0030】
上記の判定式は、それ自体公知の判別分析の手法を用いて作成することができる。判別分析の手法とは、事前に与えられたデータが互いに異なる2つの群に別れることが明らかな場合において、新たに得られたデータが該2つの群のいずれに属するものであるかを判別するための基準を得る統計学的手法である。そのような判別分析の手法としては、例えば、サポートベクターマシン(SVM)、線形判別分析、ニューラルネットワーク、k近傍識別器、決定木、ランダムフォレストなどが挙げられる。これらの判別分析の手法の中でも、統計解析ソフトGeneSpringにも搭載されているSVMを用いて、上記の判定式を作成することが好ましい。
上記のような健常者からの平均値と、判定対象疾患の患者からの平均値とが予め入力され、判定式が作成されたSVMに、被験者から採取された生体試料から求めた平均値を入力することにより、この被験者が判定対象疾患に罹患しているか否かを判定することができる。
【0031】
上記のとおり、本発明の判定方法には、「判定対象疾患と関連する疾患判定用遺伝子群」を用いるが、そのような遺伝子群の一例として、判定対象疾患と統計学的に関連する遺伝子群が挙げられる。この判定対象疾患と統計学的に関連する遺伝子群の同定は、例えば、以下の工程を含む手順により行うことができる:
(a)判定対象疾患に罹患した複数の患者のそれぞれおよび複数の健常者のそれぞれから得られた生体試料中の遺伝子の転写産物の発現量を測定する工程と、
(b)前記複数の患者のそれぞれについての発現量を、前記複数の健常者における対応する遺伝子の転写産物の発現量に基づいて標準化することにより、前記複数の患者のそれぞれについての偏差を表す値を取得し、
前記複数の健常者のそれぞれについての発現量を標準化することにより、前記複数の健常者のそれぞれについての偏差を表す値を取得する工程と、
(c)前記発現量を測定した遺伝子を、遺伝子がコードする分子の機能に基づく分類系統を用いて、少なくとも2つの遺伝子群に分類し、
前記複数の患者のそれぞれおよび前記複数の健常者のそれぞれについて、
前記遺伝子群それぞれにおいて、遺伝子群に属する遺伝子の偏差を表す値の平均値を前記遺伝子群の平均値として取得する工程と、
(d)前記複数の患者についての各遺伝子群の平均値と前記複数の健常者についての対応する各遺伝子群の平均値との間の有意確率を取得する工程と、
(e)前記有意確率が0.05以下である遺伝子群を判定対象疾患と関連する疾患判定用遺伝子群として同定する工程。
【0032】
まず、判定対象疾患に罹患した複数の患者および複数の健常者からそれぞれ得られた生体試料中の遺伝子の転写産物の発現量を測定する。
本明細書において、「判定対象疾患に罹患した患者」(以下、単に「患者」ともいう)とは、本発明の判定方法以外の基準に基づいて、判定対象疾患に罹患していることが確認できる者のことである。例えば、判定対象疾患が、癌である場合は、組織診、CT、MRI、腫瘍マーカーなどにより、自己免疫疾患である場合は、血液検査により、感染症である場合は、血液検査により、精神または神経系疾患である場合は、脳画像診断、遺伝子検査、問診などにより、クローン病の場合は、内視鏡検査、消化管造影検査などにより、子宮内膜症の場合は、CT、MRI、内視鏡検査などにより、判定対象疾患に罹患していることが確認できる人のことである。
また、本明細書において、「複数の患者」とは、統計学的に十分な人数の患者を意味し、30名以上、好ましくは40名以上の人数であればよい。なお、「健常者」および「複数の健常者」の定義については、上記のとおりである。
また、この工程における遺伝子の転写産物の抽出および該産物の発現量の測定については、判定対象疾患に罹患した複数の患者のそれぞれ、および複数の健常者のそれぞれから得られた生体試料を用いて、上記の本発明の判定方法の各工程と同様にして行うことができる。
【0033】
次いで、複数の患者のそれぞれについての発現量を、複数の健常者における対応する遺伝子の転写産物の発現量に基づいて標準化することにより、複数の患者のそれぞれの偏差を表す値を取得する。
本明細書において、「複数の患者のそれぞれについての発現量を、複数の健常者における対応する遺伝子の転写産物の発現量に基づいて標準化する」とは、次の式により、複数の患者の全員の偏差を表す値を求めることを意味する。
患者についての偏差を表す値=(各患者についての遺伝子の転写産物の発現量−複数の健常者での対応する遺伝子の転写産物の発現量の平均値)/複数の健常者での対応する遺伝子の転写産物の発現量の標準偏差
【0034】
また、複数の健常者のそれぞれについての発現量を標準化することにより、複数の健常者のそれぞれについての偏差を表す値を取得する。
この場合の「標準化する」とは、統計学の分野において通常用いられるのと同じ意味を有する。すなわち、次の式により、複数の健常者の全員の偏差を表す値を取得できる。
健常者についての偏差を表す値=(各健常者での遺伝子の転写産物の発現量−複数の健常者での遺伝子の転写産物の発現量の平均値)/複数の健常者での遺伝子の転写産物の発現量の標準偏差
【0035】
なお、上記の健常者に対する被験者の発現量比を表す値を求めるのと同様にして、健常者の平均値に対する複数の患者および複数の健常者のそれぞれの発現量比を求め、これらの値を、それぞれ複数の患者についての偏差を表す値および複数の健常者についての偏差を表す値に代えて用いることができる。
【0036】
次いで、発現量を測定した遺伝子を、遺伝子がコードする分子の機能に基づく分類系統を用いて、少なくとも2つの遺伝子群に分類し、複数の患者のそれぞれおよび複数の健常者のそれぞれについて、該遺伝子群それぞれにおいて、遺伝子群に属する遺伝子の偏差を表す値の平均値を前記遺伝子群の平均値として取得する。
【0037】
本明細書において、「遺伝子がコードする分子の機能に基づく分類系統」とは、遺伝子がコードする分子の機能により遺伝子を分類したデータベースを意味する。そのようなデータベースはそれ自体が公知のものを用いることができ、例えば、ジーンオントロジー(Gene Ontology(GO))、京都エンサイクロペディア オブ ジーンズ アンド ゲノムス(Kyoto Encyclopedia of Genes and Genomes(KEGG))、メタシック(MetaCyc)、ジンマップ(GenMAPP)、バイオカルタ(BioCarta)、キーモルネット(KeyMolnet)、オンライン メンデリアン インヘリタンス イン マン(Online Mendelian Inheritance in Man(OMIM))などが挙げられるが、この中でも「GO Term」と呼ばれる遺伝子群を定義するGene Ontologyを用いることが好ましい。
なお、これらのデータベースは、以下の表1に示すURLから入手または利用可能である。
【0038】
【表1】
【0039】
この工程においては、まず、上記の分類系統を用いて、発現量を測定した遺伝子を少なくとも2つの遺伝子群に分類する。そして、上記の被験者についての平均値を取得する工程と同様にして、分類された各遺伝子群における複数の患者および複数の健常者についての平均値を取得する。
【0040】
次いで、複数の患者についての各遺伝子群の平均値と複数の健常者についての対応する各遺伝子群の平均値との間の有意確率を取得する。
本明細書において、「対応する遺伝子群」とは、複数の患者について平均値を取得したのと同じ遺伝子群を意味する。
複数の患者についての各遺伝子群の平均値と複数の健常者についての対応する各遺伝子群の平均値との間の有意確率(以下、「p値」ともいう)は、T検定により取得することができる。
【0041】
そして、上記で得られたp値が0.05以下である遺伝子群を、判定対象疾患と関連する疾患判定用遺伝子群として同定する。
本発明の判定方法においては、上記の手順により同定された遺伝子群から任意に選択される少なくとも2つを、判定対象疾患と関連する疾患判定用遺伝子群として用いる。なお、選択される疾患判定用遺伝子群の数は、多いほど好ましい。
【0042】
本発明の判定方法では、遺伝子の転写産物の発現量自体を用いるのではなく、該発現量から偏差を表す値を取得し、この偏差を表す値を上記の疾患判定用遺伝子群で平均値を取得し、得られた平均値を用いることにより、判定対象疾患に罹患している被験者を、健常者から明確に安定して区別できる。
また、本発明の判定方法は、例えば、クローン病、ハンチントン病、子宮内膜症などの罹患の判定に特に好適である。
【0043】
クローン病は、潰瘍や線維化を伴う肉芽腫性炎症性病変からなり、口腔から肛門までの消化管全域に発症し得る原因不明の疾患である。日本国内では、現在2万人以上が罹患している。症状としては、腹痛、下痢、体重減少、発熱、肛門病変がよく見られる。クローン病の確定診断は内視鏡検査によって行なわれるが、血液検査などの侵襲度の低い検査によるスクリーニング検査を行なうことで早期発見が可能になると考えられる。本発明の判定方法により、クローン病の罹患が疑われる被験者を判定すれば、診断の指標として信頼できる判定結果を得ることができる。
本発明の判定方法によりクローン病の罹患を判定する場合、疾患判定用遺伝子群としては、例えば、Gタンパク質関連遺伝子群、血液凝固関連遺伝子群、酸化ストレス関連遺伝子群、ファゴサイトーシス関連遺伝子群および脂肪酸化関連遺伝子群が挙げられる。
上記の5つの遺伝子群は、GO Termにおいて、それぞれ「heterotrimeric G-protein complex」(GO:0005834)、「blood coagulation」(GO:GO:0007596)、「response to oxidative stress」(GO:0006979)、「phagocytosis, engulfment」(GO:GO:0006911)および「fatty acid oxidation」(GO:0019395)に分類される遺伝子のカテゴリーである。
【0044】
ハンチントン病は、舞踏病運動を主体とする不随意運動、ならびに精神症状および認知症を主な症状とする慢性進行性神経変性疾患である。診断においては、脳出血などの脳血管障害による症候性舞踏病、抗精神病薬などによる薬剤性舞踏病、ウィルソン病などの疾患と鑑別することが必要である。そのため、本発明の判定方法により、ハンチントン病の罹患が疑われる被験者を判定すれば、診断の指標としてより信頼できる判定結果を得ることができる。
本発明の判定方法によりハンチントン病の罹患を判定する場合、疾患判定用遺伝子群としては、例えば、微小管関連遺伝子群、ミトコンドリア関連遺伝子群およびプロスタグランジン関連遺伝子群が挙げられる。
上記の3つの遺伝子群は、GO Termにおいて、それぞれ「microtube」(GO:0005874)、「mitochondrion」(GO:0005739)および「signal transduction」(GO:0007165)に分類される遺伝子のカテゴリーである。
【0045】
子宮内膜症は、子宮内膜またはそれに類似した組織が子宮内腔や子宮体部以外に増殖する疾患である。子宮内膜症の主な症状が月経痛および月経困難であるため、子宮内膜症は月経困難症との鑑別が難しい疾患である。そのため、本発明の判定方法により、子宮内膜症の罹患が疑われる被験者を判定すれば、診断の指標としてより信頼できる判定結果を得ることができる。
本発明の判定方法により子宮内膜症の罹患を判定する場合、疾患判定用遺伝子群としては、例えば、サイトカイン合成経路関連遺伝子群、サイトカイン媒介シグナル関連遺伝子群およびイムノグロブリン媒介免疫反応関連遺伝子群が挙げられる。
上記の3つの遺伝子群は、GO Termにおいて、それぞれ「cytokine biosynthetic process」(GO:0042089)、「cytokine-mediated signaling pathway」(GO:0019221)および「immunoglobulin mediated immune response」(GO:0016064)に分類される遺伝子のカテゴリーである。
【0046】
本発明の判定方法は、判定対象疾患の患者を「陽性」であると判定する感度が、好ましくは80%以上、より好ましくは85%以上、さらに好ましくは90%以上である。また、本発明の判定方法は、健常者を「陰性」であると判定する特異度が、好ましくは80%以上、より好ましくは85%以上、さらに好ましくは90%以上である。
本発明の判定方法は、このように高い感度および特異度を示すので、判定対象疾患の診断の助けとなるより精度の高い指標を安定に提供することができる。
【0047】
上記の本発明の判定方法をコンピュータにより行うための疾患の罹患判定用プログラムも、本発明の1つである。すなわち、本発明のプログラムは、コンピュータを、
判定対象疾患の罹患が疑われる被験者から得られた生体試料中の、前記疾患と関連する少なくとも2つの疾患判定用遺伝子群それぞれにおいて、遺伝子群に属する少なくとも1つの遺伝子の転写産物の発現量を受け付ける受付手段、
前記発現量を複数の健常者における対応する遺伝子の発現量に基づいて標準化することにより偏差を表わす値を取得する偏差取得手段、
前記疾患判定用遺伝子群それぞれにおいて、遺伝子群に属する遺伝子の偏差を表す値の平均値を取得する平均値取得手段、
前記平均値を用いて、被験者が対象疾患に罹患しているか否かを判定する判定手段、
判定手段の判定結果を出力する出力手段
として機能させるための疾患の罹患判定用プログラムである。
【0048】
また、上記の本発明のプログラムは、コンピュータを、疾患判定用遺伝子を同定する手段としてさらに機能させることもできる。すなわち、本発明のプログラムは、コンピュータを、
判定対象疾患に罹患した複数の患者のそれぞれおよび複数の健常者のそれぞれから得られた生体試料中の遺伝子の転写産物の発現量を受け付ける受付手段、
前記複数の患者のそれぞれについての発現量を、前記複数の健常者における対応する遺伝子の転写産物の発現量に基づいて標準化することにより、前記複数の患者のそれぞれの偏差を表わす値を取得し、前記複数の健常者のそれぞれについての発現量を標準化することにより、前記複数の健常者のそれぞれの偏差を表わす値を取得する偏差取得手段、
前記発現量を測定された遺伝子を、遺伝子がコードする分子の機能に基づく分類系統に従って、少なくとも2つの遺伝子群に分類し、前記複数の患者のそれぞれおよび前記複数の患者のそれぞれについて、前記遺伝子群それぞれにおいて、遺伝子群に属する遺伝子の偏差を表す値の平均値を前記遺伝子群の平均値として取得する平均値取得手段、
前記複数の患者についての各遺伝子群の平均値と前記複数の健常者についての対応する各遺伝子群の平均値との間の有意確率を取得する有意確率取得手段、
前記有意確率が0.05以下である遺伝子群を判定対象疾患と関連する疾患判定用遺伝子群として同定する遺伝子群同定手段
としてさらに機能させる疾患の罹患判定用プログラムである。
【0049】
図1に、本発明のプログラムが用いられる判定対象疾患の罹患判定用装置の一例を示す。該装置は、遺伝子の転写産物発現量測定装置1と、コンピュータ2と、これらを接続するケーブル3とから構成される。遺伝子の転写産物発現量測定装置1で測定される蛍光強度、電流量などに基づくシグナルなどの発現量のデータは、ケーブル3を介してコンピュータ2に送ることができる。また、遺伝子の転写産物発現量測定装置1は、コンピュータ2と接続されていなくてもよく、この場合、発現量のデータをコンピュータに入力して上記のプログラムを作動させることができる。
コンピュータ2では、得られた発現量から、上記の偏差を表す値を取得し、得られた偏差を表す値を、少なくとも2つの遺伝子群のそれぞれにおける平均値として取得し、該平均値に基づいて、被験者が判定対象疾患に罹患しているか否かを判定する。
【0050】
本発明のプログラムは、中央処理装置、記憶部、コンパクトディスクやフロッピー(登録商標)ディスクなどの記録媒体の読取装置、キーボードなどの入力部、およびディスプレイなどの出力部を備えるコンピュータ2と協働して、上記の本発明の判定方法を実現することができる。上記の方法を実施するための、より具体的なコンピュータシステムの一例を、図2に示す。
【0051】
図2に示されたコンピュータ2は、本体110と、ディスプレイ120と、入力部130とから主として構成されている。本体110は、CPU110aと、ROM110bと、RAM110cと、ハードディスク110dと、読出装置110eと、入出力インタフェース110fと、画像出力インタフェース110gとから主として構成されており、CPU110a、ROM110b、RAM110c、ハードディスク110d、読出装置110e、入出力インタフェース110f、および画像出力インタフェース110gは、バス110hによってデータ通信可能に接続されている。
【0052】
CPU110aは、ROM110bに記憶されているコンピュータプログラムおよびRAM110cにロードされたコンピュータプログラムを実行することが可能である。
ROM110bは、マスクROM、PROM、EPROM、EEPROMなどによって構成されており、CPU110aに実行されるコンピュータプログラムおよびこれに用いるデータなどが記録されている。
【0053】
RAM110cは、SRAMまたはDRAMなどによって構成されている。RAM110cは、ROM110bおよびハードディスク110dに記録されているコンピュータプログラムの読み出しに用いられる。また、これらのコンピュータプログラムを実行するときに、CPU110aの作業領域として利用される。
【0054】
ハードディスク110dは、オペレーティングシステムおよびアプリケーションプログラムなど、CPU110aに実行させるための種々のコンピュータプログラムおよび該コンピュータプログラムの実行に用いるデータが格納されている。本実施形態におけるハードディスク110dに格納されているデータには、複数の健常者における対応する遺伝子の転写産物の発現量に関するデータ(以下、「格納発現量データ」という)、疾患判定用遺伝子群に関するデータ(以下、「疾患判定用遺伝子群データ」という)および被験者が判定対象疾患であるか否かを判定するための判定式が含まれている。ここで、該判定式は、上記の判別分析の手法を用いて、健常者から採取された生体試料を用いて求められる予め得られた平均値と、判定対象疾患の患者から採取された生体試料を用いて求められる予め得られた平均値とに基づいて得られた判定式である。なお、後述するアプリケーションプログラム140aも、このハードディスク110dにインストールされている。
【0055】
読出装置110eは、フレキシブルディスクドライブ、CD−ROMドライブ、またはDVD−ROMドライブなどによって構成されており、可搬型記録媒体140に記録されたコンピュータプログラムまたはデータを読み出すことができる。また、可搬型記録媒体140には、コンピュータに本実施形態の方法を実行させるためのアプリケーションプログラム140aが格納されており、CPU110aが当該可搬型記録媒体140から本発明に係るアプリケーションプログラム140aを読み出し、該アプリケーションプログラム140aをハードディスク110dにインストールすることが可能である。
【0056】
なお、上記のアプリケーションプログラム140aは、可搬型記録媒体140によって提供されるのみならず、電気通信回線(有線、無線を問わない)によってコンピュータ本体110と通信可能に接続された外部の機器から前記電気通信回線を通じて提供することも可能である。例えば、上記のアプリケーションプログラム140aがインターネット上のサーバコンピュータのハードディスク内に格納されており、このサーバコンピュータにCPU110aがアクセスして、該アプリケーションプログラムをダウンロードし、これをハードディスク110dにインストールすることも可能である。
【0057】
また、ハードディスク110dには、例えば米国マイクロソフト社が製造販売するWindows(登録商標)などのグラフィカルユーザインタフェース環境を提供するオペレーティングシステムがインストールされている。以下の説明においては、本実施形態に係るアプリケーションプログラム140aは、該オペレーティングシステム上で動作するものとしている。
【0058】
入出力インタフェース110fは、例えば、USB、IEEE1394、RS−232Cなどのシリアルインタフェース、SCSI、IDE、IEEE1284などのパラレルインタフェース、およびD/A変換器、A/D変換器などからなるアナログインタフェースなどから構成されている。入出力インタフェース110fには、転写産物発現量測定装置1が、ケーブル3を介して接続されており、転写産物発現量測定装置1で測定される発現量のデータを、コンピュータ本体110に入力することが可能である。また、入出力インタフェース110fには、キーボードおよびマウスからなる入力部130が接続されており、ユーザが該入力部130を使用することにより、コンピュータ本体110にデータを入力することが可能である。
【0059】
画像出力インタフェース110gは、LCDまたはCRTなどで構成されたディスプレイ120に接続されており、CPU110aから与えられた画像データに応じた映像信号をディスプレイ120に出力するようになっている。ディスプレイ120は、入力された映像信号にしたがって、画像(画面)を表示する。
【0060】
本発明のプログラムによる手段としてのより具体的なコンピュータ2の動作のフローチャートを、図3に示す。
まず、遺伝子の転写産物発現量測定装置1で遺伝子の転写産物の発現量が測定されると、転写産物発現量測定装置1が、コンピュータ2に、測定された発現量に関するデータ(以下、「測定発現量データ」という)を出力する。CPU110aは、出力された測定発現量データを受け付け、RAM110cに記憶する(ステップS11)。
【0061】
次いで、CPU110aは、ハードディスク110dに予め格納された格納発現量データを読み出し、入力された測定発現量データおよび格納発現量データに基づいて、偏差を表す値を示すデータ(以下、「偏差データ」という)を取得する(ステップS12)。
【0062】
次いで、CPU110aは、ハードディスク110dに予め格納された疾患判定用遺伝子群データを読み出し、偏差データに対応する遺伝子が疾患判定用遺伝子群か否かを判定することで、取得された偏差データを、疾患判定用遺伝子群により分類する(ステップS13)。
【0063】
次いで、CPU110aは、疾患判定用遺伝子群により分類された偏差データを用いて、それぞれの疾患判定用遺伝子群毎に、偏差を表す値の平均値を示すデータ(以下、「平均値データ」という)を取得する(ステップS14)。
【0064】
次いで、CPU110aは、ハードディスク110dに予め格納された判定式を読み出し、平均値データを該判定式に適用して、被験者が判定対象疾患であるか否かを判定する(ステップS15)。
【0065】
そして、CPU110aは、判定式からの該被験者が判定対象疾患であるか否かを判定した結果を、RAM110cに格納するとともに、画像出力インタフェース110gを介してコンピュータのディスプレイ120に表示する(ステップS16)。
【0066】
なお、本実施形態においては、CPU110aは、測定発現量データを、転写産物発現量測定装置1から、入出力インタフェース110fを介して取得したが、これに限定されるものではない。例えば、コンピュータ2とは独立した転写産物発現量測定装置で得られた遺伝子の転写産物の発現量を、操作者が、入力部130を用いてコンピュータ2に入力することで、コンピュータ2に測定発現量データを入力することもできる。
【0067】
また、コンピュータを、疾患判定用遺伝子を同定する手段としてさらに機能させる場合の本発明のプログラムによる、具体的なコンピュータ2の動作のフローチャートを、図4に示す。なお、本実施形態におけるハードディスク110dには、遺伝子がコードする分子の機能に基づく分類系統に関するデータ(以下、「分類系統データ」という)が格納されている。
【0068】
まず、遺伝子の転写産物発現量測定装置1で複数の患者および複数の健常者の遺伝子の転写産物の発現量が測定されると、転写産物発現量測定装置1が、コンピュータ2に、複数の患者の測定された発現量に関するデータ(以下、「患者測定発現量データ」という)および複数の健常者の測定された発現量に関するデータ(以下、「健常者測定発現量データ」という)を出力する。CPU110aは、出力された患者測定発現量データおよび健常者測定発現量データを受け付け、RAM110cに記憶する(ステップS21)。
【0069】
次いで、CPU110aは、入力された複数の患者のそれぞれについての患者測定発現量データを複数の健常者における対応する遺伝子の転写産物の健常者測定発現量データに基づいて標準化することにより、複数の患者のそれぞれについての偏差を表す値を示すデータ(以下、「患者偏差データ」という)を取得し、また、複数の健常者のそれぞれについての測定発現量データを標準化することにより、複数の健常者のそれぞれについての偏差を表す値を示すデータ(以下、「健常者偏差データ」という)を取得する(ステップS22)。
【0070】
そして、CPU110aは、ハードディスク110dに予め格納された分類系統データを読み出し、患者偏差データを、患者偏差データに対応する遺伝子に基づいて、遺伝子群により分類する。同様に、CPU110aは、健常者偏差データを、健常者偏差データに対応する遺伝子に基づいて、遺伝子群により分類する。(ステップS23)。
【0071】
次いで、CPU110aは、遺伝子群により分類された患者偏差データを用いて、それぞれの遺伝子群毎に、偏差を表す値の平均値を示すデータ(以下、「患者平均値データ」という)を取得する。同様に、CPU110aは、遺伝子群により分類された健常者偏差データを用いて、それぞれの遺伝子群毎に、偏差を表す値の平均値を示すデータ(以下、「患者平均値データ」という)を取得する(ステップS24)。
【0072】
次に、CPU110aは、得られた各遺伝子群の患者平均値データおよび健常者平均値データを用いて、複数の患者についての平均値と複数の健常者についての平均値との間の有意確率を示すデータ(以下、「有意確率データ」という)を取得する(ステップS25)。
【0073】
次に、CPU110aは、得られた有意確率データを用いて、有意確率が0.05以下の遺伝子群を同定する(ステップS26)。
【0074】
そして、CPU110aは、同定された遺伝子群を、RAM110cに格納するとともに、画像出力インタフェース110gを介してコンピュータのディスプレイ120に表示する(ステップS27)。
【0075】
なお、本実施形態においては、CPU110aは、患者測定発現量データおよび健常者測定発現量データを、転写産物発現量測定装置1から、入出力インタフェース110fを介して取得したが、これに限定されるものではない。例えば、コンピュータ2とは独立した転写産物発現量測定装置で得られた、複数の患者および複数の健常者の遺伝子の転写産物の発現量を、操作者が入力部130を用いてコンピュータ2に入力することで、コンピュータ2に患者測定発現量データおよび健常者測定発現量データを入力することもできる。
【0076】
また、本実施形態では、ステップS27において、同定された遺伝子群をディスプレイ120に表示しているが、該同定された遺伝子群に関するデータを、疾患判定用遺伝子群データとして、RAM110cに格納するだけでもよい。該格納された疾患判定用遺伝子群データは、例えば、図2に示したコンピュータ2の動作において、使用することもできる。
【実施例】
【0077】
以下の実施例において、本発明をより詳細に説明するが、本発明は、以下の態様に限定されることを意図しない。
【0078】
実施例1 クローン病の罹患の判定方法
(1)クローン病判定用遺伝子群の同定
実施例1においては、クローン病患者および健常者の血液中の遺伝子の転写産物の発現量データとして、遺伝子発現データバンクであるthe Gene Expression Omnibus(GEO;http://www.ncbi.nlm.nih.gov/geoから利用可能)により提供されるデータを用いた。なお、該データは、測定したシグナルの生データを正規化処理したものとして、http://www.ncbi.nlm.nih.gov/sites/GDSbrowser?acc=GDS1615から入手することができる。
(1-1)検体の選択およびプローブセットの絞り込み
上記のデータから、クローン病患者1(29検体)のデータおよび健常者1(21検体)のデータをランダムに選択し、これらのデータをクローン病判定用遺伝子群の同定のためのデータとした。
上記のGEOから入手したクローン病患者および健常者についてのデータは、DNAチップであるGeneChip(登録商標)U133A(Affimetrix社)を用いた解析により得られたものである。このDNAチップには、22283個のプローブセットが配置されているが、これらのプローブセットには、同一の遺伝子に対する複数のプローブセットも含まれる。
そこで、上記のDNAチップのプローブセットに対応する遺伝子において、同一の遺伝子に対する複数のプローブセットが含まれる遺伝子については、最大のシグナル値を示したプローブセットのみを抽出した。さらに、シグナル値が50以下のプローブセットは、測定値の再現性が低いと考えられるので除外した。この結果、9331個のプローブセットに対応する遺伝子について、以下の解析を行った。
【0079】
(1-2)発現量のZスコア化
上記のようにして選択された9331個のプローブセットに対応する遺伝子の転写産物について、健常者1(21検体)から得られたシグナル値全てを用いて平均値および標準偏差を取得した。この値を用いて、9331個の遺伝子それぞれについて、以下の式を用いて、該遺伝子それぞれの偏差を表す値(Zスコア)を求めた。
Zスコア=(各遺伝子の転写産物のシグナル値−健常者1(21検体)の対応する遺伝子の転写産物のシグナル値の平均値)/健常者1(21検体)の対応する遺伝子の転写産物のシグナル値の標準偏差
【0080】
(1-3)遺伝子の分類および各遺伝子群での平均値の取得
Gene Ontology(http://www.geneontology.org/index.shtmlから閲覧可能)の分類に基づいて、上記の9331個の遺伝子を遺伝子群(GO Term)に分類し、各GO Term内の遺伝子について上記(1-2)で求めたクローン病患者1(29検体)のZスコアを平均して、平均値を求めた。
また、健常者1(21検体)についても、上記と同様にして、各GO Termでの平均値を求めた。
【0081】
(1-4)健常者とクローン病患者との間で有意差のある遺伝子群の選択
上記のようにして得られた健常者とクローン病患者の各GO Termについての平均値を用いてT検定を行い、有意確率(p値)を取得した。
用いたGO Termから、得られたp値が0.05以下(p値≦5.0E-02)であったGO Termを抽出した。
次に、抽出したGO Termに含まれる全ての遺伝子についてのZスコアを用いて階層型クラスタリングを行い、同調して変動する遺伝子のクラスタを選択した。なお、クラスタリングには、ソフトウェアCluster3.0(http://bonsai.ims.u-tokyo.ac.jp/〜mdehoon/software/cluster/software.htmから入手可能)を、その結果の表示にはJavaTreeView (http://sourceforge.net/projects/jtreeview/files/から入手可能)を用いた。
各クラスタに含まれる遺伝子のZスコアの平均値をクラスタのスコアとし、健常者1(21検体)と、クローン病患者1(29検体)とについてT検定を行った。得られたp値が0.05以下であったクラスタから、Gタンパク質関連遺伝子群、血液凝固関連遺伝子群、酸化ストレス関連遺伝子群、ファゴサイトーシス関連遺伝子群および脂肪酸化関連遺伝子群をクローン病判定用遺伝子群として選択した。これらの遺伝子群ならびに各群に属する遺伝子および各群のp値を、表2に示す。
上記の選択された各遺伝子群における健常者1およびクローン病患者1についてのZスコアの平均値の分布を、図5に示す。
【0082】
【表2】
【0083】
(2)本発明の判定方法の精度の評価
(2-1)クローン病判定用遺伝子群の同定に用いた検体についての判定
上記の5つのクローン病判定用遺伝子群のそれぞれにおける健常者1(21検体)およびクローン病患者1(29検体)についての平均値を、それぞれ、サポートベクターマシン(SVM;統計解析ソフトGeneSpringに搭載)に入力した。そして、これらの50検体の平均値が入力されたSVMを用いて、各検体が陽性である(クローン病である)か、または陰性である(健常である)かを、判定した。
この結果を、図6Aに示す。図6Aにおいて、「感度」とは、クローン病患者を「陽性」であると判定する割合であり、「特異度」とは、健常者を健常者であると判定する割合である。また、「一致率」とは、クローン病患者を「陽性(+)」であると判定し、健常者を「陰性(−)」であると判定する割合である。この結果から、本発明の判定方法によれば、90%以上の感度および特異度で、クローン病患者および健常者を同定できることがわかる。
【0084】
(2-2)本発明の判定方法の再現性の評価
さらに、本発明の判定方法の再現性を評価するために、上記(1-1)で選択されたデータとは異なるクローン病患者2(30検体)のデータおよび健常者2(21検体)のデータを用いた。そして、これらのデータについて、上記(2-1)でクローン病判定用遺伝子群の同定に用いた検体の平均値が入力されたSVMを用いて判定を行った。
この結果を、図6Bに示す。この結果から、本発明の判定方法によれば、クローン病判定用遺伝子群の同定に用いた検体とは異なる検体についても、95%以上の感度および90%以上の特異度で、安定して健常者とクローン病患者とを区別できることがわかる。
【0085】
比較例1 従来の判定方法によるクローン病の判定
ここでは、従来の判定方法として、健常者および患者の遺伝子の転写産物の発現量自体に基づいて疾患の罹患を判定する方法を用いた。このような、従来の判定方法を用いて、クローン病の罹患を判定した場合の判定の精度を評価した。
(1)クローン病判定用遺伝子群に属する遺伝子を用いた判定
(1-1)クローン病判定用遺伝子群の同定に用いた検体について
表1の26遺伝子のそれぞれにおける上記の健常者1(21検体)およびクローン病患者1(29検体)についての発現量を、それぞれSVMに入力した。そして、これらの50検体の発現量が入力されたSVMを用いて、各検体が陽性と判定されるか、または陰性と判定されるかについて、判定の精度の評価を行った。
この結果を、図7Aに示す。この結果から、従来の判定方法によると、100%の感度および特異度で、クローン病患者および健常者を同定できることがわかる。
【0086】
(1-2)従来の判定方法の再現性の評価
次いで、従来の判定方法の再現性を評価するために、上記のクローン病患者2(30検体)のデータおよび健常者2(21検体)のデータを用いた。そして、これらの検体について、上記(1-1)で健常者1(21検体)およびクローン病患者1(29検体)についての発現量が入力されたSVMを用いて判定を行った。
この結果を、図7Bに示す。この結果から、クローン病判定用遺伝子群の同定に用いた検体とは異なる検体について、従来の判定方法の感度は90%以上であったが、特異度は65%以下に低下した。したがって、従来の判定方法では、健常者をクローン病患者であるとして誤った判定結果を示す可能性が、本発明の判定方法よりも高いことがわかる。
【0087】
(2)クローン病判定用遺伝子群に属する遺伝子とは異なる遺伝子を用いた判定
(2-1)クローン病判定用遺伝子群の同定に用いた検体について
クローン病判定用遺伝子群に属する遺伝子(表1の26遺伝子)とは異なる遺伝子を用いた場合についても検討するため、そのような遺伝子を新たに同定した。具体的には、上記の健常者1(21検体)についての発現量とクローン病患者1(29検体)についての発現量との間の有意確率(p値)をT検定により求め、得られたp値が0.05以下であった発現量の遺伝子を判定に用いる遺伝子とした。その結果、5個の遺伝子を同定した。これらの遺伝子および各遺伝子のp値を、表3に示す。また、各遺伝子における健常者1とクローン病患者1とについて、遺伝子の転写産物の発現量の分布を、図8に示す。
【0088】
【表3】
【0089】
これらの遺伝子のそれぞれにおける上記の健常者1(21検体)およびクローン病患者1(29検体)についての発現量を、それぞれSVMに入力した。そして、これらの50検体の発現量が入力されたSVMを用いて、各検体が陽性と判定されるか、または陰性と判定されるかについて、判定の精度の評価を行った。
この結果を、図9Aに示す。この結果から、クローン病判定用遺伝子群に属する遺伝子とは異なる遺伝子を用いた従来の判定方法によれば、95%以上の感度および特異度で、クローン病患者および健常者を同定できることがわかる。
【0090】
(2-2)従来の判定方法の再現性の評価
次いで、上記の5遺伝子を用いる従来の判定方法の再現性を評価するために、上記のクローン病患者2(30検体)のデータおよび健常者2(21検体)のデータを用いた。そして、これらの検体について、上記(2-1)で健常者1(21検体)およびクローン病患者1(29検体)についての発現量が入力されたSVMを用いて判定を行った。
この結果を、図9Bに示す。この結果から、クローン病判定用遺伝子群の同定に用いた検体とは異なる検体について、従来の判定方法の感度は90%以上であったが、特異度は40%以下に低下していた。したがって、クローン病判定用遺伝子群に属する遺伝子とは異なる遺伝子を用いた従来の判定方法では、健常者をクローン病患者であるとして誤った判定結果を示す可能性が、本発明の判定方法よりも高いことがわかる。
【0091】
実施例1および比較例1の結果から、本発明の判定方法は、健常者およびクローン病患者の遺伝子の転写産物の発現量自体に基づいてクローン病の罹患を判定する通常の方法よりも、高い精度の判定を安定して行い得ることがわかる。
【0092】
実施例2 ハンチントン病の罹患の判定方法
(1)ハンチントン病判定用遺伝子群の同定
実施例2においては、ハンチントン病患者および健常者の血液中の遺伝子の転写産物の発現量データとして、GEOから入手したデータを用いた。なお、該データは、測定したシグナルの生データを正規化処理したものとして、http://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE1751から入手することができる。
(1-1)検体の選択およびプローブセットの絞り込み
上記のデータから、ハンチントン病患者1(6検体)のデータおよび健常者3(7検体)のデータをランダムに選択し、これらのデータをハンチントン病判定用遺伝子群の同定のためのデータとした。
上記のGEOから入手したハンチントン病患者および健常者についてのデータは、GeneChip(登録商標)U133A(Affimetrix社)を用いた解析により得られたものである。実施例1の(1-1)と同様に、上記のDNAチップのプローブセットに対応する遺伝子において、同一の遺伝子に対する複数のプローブセットが含まれる遺伝子については、最大のシグナル値を示したプローブセットのみを抽出した。さらに、シグナル値が50以下のプローブセットは、測定値の再現性が低いと考えられるので除外した。この結果、8370個のプローブセットに対応する遺伝子について、以下の解析を行った。
【0093】
(1-2)発現量のZスコア化
上記のようにして選択された8370個のプローブセットに対応する遺伝子の転写産物について、健常者3(7検体)から得られたシグナル値全てを用いて平均値および標準偏差を取得した。この値を用いて、8370個の遺伝子それぞれについて、以下の式を用いて、該遺伝子それぞれの偏差を表す値(Zスコア)を求めた。
Zスコア=(各遺伝子の転写産物のシグナル値−健常者3(7検体)の対応する遺伝子の転写産物のシグナル値の平均値)/健常者3(7検体)の対応する遺伝子の転写産物のシグナル値の標準偏差
【0094】
(1-3)遺伝子の分類および各遺伝子群での平均値の取得
Gene Ontologyの分類に基づいて、上記の8370個の遺伝子を遺伝子群(GO Term)に分類し、各GO Term内の遺伝子について上記(1-2)で求めたハンチントン病患者1(6検体)のZスコアを平均して、平均値を求めた。
また、健常者3(7検体)についても、上記と同様にして、各GO Termでの平均値を求めた。
【0095】
(1-4)健常者とハンチントン病患者との間で有意差のある遺伝子群の選択
上記のようにして得られた健常者とハンチントン病患者の各GO Termについての平均値を用いてT検定を行い、有意確率(p値)を取得した。
用いたGO Termから、得られたp値が0.05以下(p値≦5.0E-02)であったGO Termを抽出した。
次に、抽出したGO Termに含まれる全ての遺伝子についてのZスコアを用いて階層型クラスタリングを行い、同調して変動する遺伝子のクラスタを選択した。なお、クラスタリングには、ソフトウェアCluster3.0(http://bonsai.ims.u-tokyo.ac.jp/〜mdehoon/software/cluster/software.htmから入手可能)を、その結果の表示にはJavaTreeView (http://sourceforge.net/projects/jtreeview/files/から入手可能)を用いた。
各クラスタに含まれる遺伝子のZスコアの平均値をクラスタのスコアとし、健常者3(7検体)と、ハンチントン病患者1(6検体)とについてT検定を行った。得られたp値が0.05以下であったクラスタから、微小管関連遺伝子群、ミトコンドリア関連遺伝子群およびプロスタグランジン関連遺伝子群を、ハンチントン病判定用遺伝子群として選択した。これらの遺伝子群ならびに各群に属する遺伝子および各群のp値を、表4に示す。
上記選択された各遺伝子群における健常者3およびハンチントン病患者1についてのZスコアの平均値の分布を、図10に示す。
【0096】
【表4】
【0097】
(2)本発明の判定方法の精度の評価
(2-1)ハンチントン病判定用遺伝子群の同定に用いた検体についての判定
上記の3つのハンチントン病判定用遺伝子群のそれぞれにおける健常者3(7検体)およびハンチントン病患者1(6検体)についての平均値を、それぞれ、SVMに入力した。そして、これらの13検体の平均値が入力されたSVMを用いて、各検体が陽性である(ハンチントン病である)か、または陰性である(健常である)かを、判定した。
この結果を、図11Aに示す。この結果から、本発明の判定方法によれば、100%の感度および特異度で、ハンチントン病患者および健常者を同定できることがわかる。
【0098】
(2-2)本発明の判定方法の再現性の評価
さらに、本発明の判定方法の再現性を評価するために、上記(1-1)で選択されたデータとは異なるハンチントン病患者2(6検体)のデータおよび健常者4(7検体)のデータを用いた。そして、これらのデータについて、上記(2-1)でハンチントン病判定用遺伝子群の同定に用いた検体の平均値が入力されたSVMを用いて判定を行った。
この結果を、図11Bに示す。この結果から、本発明の判定方法によると、ハンチントン病判定用遺伝子群の同定に用いた検体とは異なる検体についても、80%以上の感度および100%の特異度で、安定して健常者とハンチントン病患者とを区別できることがわかる。
【0099】
比較例2 従来の判定方法によるハンチントン病の判定
ここでは、従来の判定方法として、健常者および患者の遺伝子の転写産物の発現量自体に基づいて疾患の罹患を判定する方法を用いた。このような、従来の判定方法を用いて、ハンチントン病の罹患を判定した場合の判定の精度を評価した。
(1)ハンチントン病判定用遺伝子群に属する遺伝子を用いた判定
(1-1)ハンチントン病判定用遺伝子群の同定に用いた検体について
表3の27遺伝子のそれぞれにおける上記の健常者3(7検体)およびハンチントン病患者1(6検体)についての発現量を、それぞれSVMに入力した。そして、これらの13検体の発現量が入力されたSVMを用いて、各検体が陽性と判定されるか、または陰性と判定されるかについて、判定の精度の評価を行った。
この結果を、図12Aに示す。この結果から、従来の判定方法によれば、100%の感度および特異度で、ハンチントン病患者および健常者を同定できることがわかる。
【0100】
(1-2)従来の判定方法の再現性の評価
次いで、従来の判定方法の再現性を評価するために、上記のハンチントン病患者2(6検体)のデータおよび健常者4(7検体)のデータを用いた。そして、これらの検体について、上記(1-1)で健常者3(7検体)およびハンチントン病患者1(6検体)についての発現量が入力されたSVMを用いて判定を行った。
この結果を、図12Bに示す。この結果から、ハンチントン病判定用遺伝子群の同定に用いた検体とは異なる検体について、従来の判定方法の特異度は100%であったが、感度は70%以下に低下した。したがって、従来の判定方法では、ハンチントン病患者を健常者であるとして誤った判定結果を示す可能性が、本発明の判定方法よりも高いことがわかる。
【0101】
(2)ハンチントン病判定用遺伝子群に属する遺伝子とは異なる遺伝子を用いた判定
(2-1)ハンチントン病判定用遺伝子群の同定に用いた検体について
ハンチントン病判定用遺伝子群に属する遺伝子(表3の27遺伝子)とは異なる遺伝子を用いた場合についても検討するため、そのような遺伝子を新たに同定した。具体的には、上記の健常者3(7検体)についての発現量とハンチントン病患者1(6検体)についての発現量との間の有意確率(p値)をT検定により求め、得られたp値が0.05以下であった発現量の遺伝子を判定に用いる遺伝子とした。その結果、10個の遺伝子を同定した。これらの遺伝子および各遺伝子のp値を、表5に示す。また、各遺伝子における健常者3とハンチントン病患者1とについて、遺伝子の転写産物の発現量の分布を、図13に示す。
【0102】
【表5】
【0103】
これらの遺伝子のそれぞれにおける上記の健常者3(7検体)およびハンチントン病患者1(6検体)についての発現量を、それぞれSVMに入力した。そして、これらの13検体の発現量が入力されたSVMを用いて、各検体が陽性と判定されるか、または陰性と判定されるかについて、判定の精度の評価を行った。
この結果を、図14Aに示す。この結果から、ハンチントン病判定用遺伝子群に属する遺伝子とは異なる遺伝子を用いた従来の判定方法によれば、100%の感度および特異度で、ハンチントン病患者および健常者を同定できることがわかる。
【0104】
(2-2)従来の判定方法の再現性の評価
次いで、上記の10遺伝子を用いる従来の判定方法の再現性を評価するために、上記のハンチントン病患者2(6検体)のデータおよび健常者4(7検体)のデータを用いた。そして、これらの検体について、上記(2-1)で健常者3(7検体)およびハンチントン病患者1(6検体)についての発現量が入力されたSVMを用いて判定を行った。
この結果を、図14Bに示す。この結果から、ハンチントン病判定用遺伝子群の同定に用いた検体とは異なる検体について、従来の判定方法の特異度は100%であったが、感度は50%に低下していた。したがって、ハンチントン病判定用遺伝子群に属する遺伝子とは異なる遺伝子を用いた従来の判定方法では、ハンチントン病患者を健常者であるとして誤った判定結果を示す可能性が、本発明の判定方法よりも高いことがわかる。
【0105】
実施例2および比較例2の結果から、本発明の判定方法は、健常者およびハンチントン病患者の遺伝子の転写産物の発現量自体に基づいてハンチントン病の罹患を判定する通常の方法よりも、高い精度の判定を安定して行い得ることがわかる。
【0106】
実施例3 子宮内膜症の罹患の判定方法
(1)子宮内膜症判定用遺伝子群の同定
実施例3においては、子宮内膜症患者の病変部組織および正常組織のそれぞれから得た遺伝子の転写産物の発現量データとして、GEOから入手したデータを用いた。なお、該データは、測定したシグナルの生データを正規化処理したものとして、http://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE7305およびhttp://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE6364から入手することができる。
(1-1)検体の選択およびプローブセットの絞り込み
上記のデータから、病変部組織1(9検体)のデータおよび正常組織1(8検体)のデータをランダムに選択し、これらのデータを子宮内膜症判定用遺伝子群の同定のためのデータとした。
上記のGEOから入手した病変部組織および正常組織についてのデータは、DNAチップであるGeneChip(登録商標)U133 plus2.0(Affimetrix社)を用いた解析により得られたものである。このDNAチップには、54675個のプローブセットが配置されているが、これらのプローブセットには、同一の遺伝子に対する複数のプローブセットも含まれる。
そこで、上記のDNAチップのプローブセットに対応する遺伝子において、同一の遺伝子に対する複数のプローブセットが含まれる遺伝子については、最大のシグナル値を示したプローブセットのみを抽出した。さらに、シグナル値が100以下のプローブセットは、測定値の再現性が低いと考えられるので除外した。この結果、16207個のプローブセットに対応する遺伝子について、以下の解析を行った。
【0107】
(1-2)発現量のZスコア化
上記のようにして選択された16207個のプローブセットに対応する遺伝子の転写産物について、正常組織1(8検体)から得られたシグナル値全てを用いて平均値および標準偏差を取得した。この値を用いて、16207個の遺伝子それぞれについて、以下の式を用いて、該遺伝子それぞれの偏差を表す値(Zスコア)を求めた。
Zスコア=(各遺伝子の転写産物のシグナル値−正常組織1(8検体)の対応する遺伝子の転写産物のシグナル値の平均値)/正常組織1(8検体)の対応する遺伝子の転写産物のシグナル値の標準偏差
【0108】
(1-3)遺伝子の分類および各遺伝子群での平均値の取得
Gene Ontologyの分類に基づいて、上記の16207個の遺伝子を遺伝子群(GO Term)に分類し、各GO Term内の遺伝子について上記(1-2)で求めた病変部組織1(9検体)のZスコアを平均して、平均値を求めた。
また、正常組織1(8検体)についても、上記と同様にして、各GO Termでの平均値を求めた。
【0109】
(1-4)正常組織と病変部組織との間で有意差のある遺伝子群の選択
上記のようにして得られた正常組織および病変部組織の各GO Termについての平均値を用いてT検定を行い、有意確率(p値)を取得した。
用いたGO Termから、得られたp値が0.05以下(p値≦5.0E-02)であったGO Termを抽出した。
次に、抽出したGO Termに含まれる全ての遺伝子についてのZスコアを用いて階層型クラスタリングを行い、同調して変動する遺伝子のクラスタを選択した。なお、クラスタリングには、ソフトウェアCluster3.0(http://bonsai.ims.u-tokyo.ac.jp/〜mdehoon/software/cluster/software.htmから入手可能)を、その結果の表示にはJavaTreeView (http://sourceforge.net/projects/jtreeview/files/から入手可能)を用いた。
各クラスタに含まれる遺伝子のZスコアの平均値をクラスタのスコアとし、正常組織1(8検体)と、病変部組織1(9検体)とについてT検定を行った。得られたp値が0.05以下であったクラスタから、サイトカイン合成経路関連遺伝子群、サイトカイン媒介シグナル関連遺伝子群およびイムノグロブリン媒介免疫反応関連遺伝子群を、子宮内膜症判定用遺伝子群として選択した。これらの遺伝子群ならびに各群に属する遺伝子および各群のp値を、表6に示す。
上記の選択された各遺伝子群における正常組織1および病変部組織1についてのZスコアの平均値の分布を、図15に示す。
【0110】
【表6】
【0111】
(2)本発明の判定方法の精度の評価
(2-1)子宮内膜症判定用遺伝子群の同定に用いた検体についての判定
上記の3つの子宮内膜症判定用遺伝子群のそれぞれにおける正常組織1(8検体)および病変部組織1(9検体)についての平均値を、それぞれ、SVMに入力した。そして、これらの17検体の平均値が入力されたSVMを用いて、各検体が陽性である(子宮内膜症である)か、または陰性である(健常である)かを、判定した。
この結果を、図16Aに示す。この結果から、本発明の判定方法によれば、85%以上の感度および100%の特異度で、正常組織および病変部組織についての検体を同定できることがわかる。
【0112】
(2-2)本発明の判定方法の再現性の評価
さらに、本発明の判定方法の再現性を評価するために、上記(1-1)で選択されたデータとは異なる病変部位組織2(9検体)のデータおよび正常組織2(8検体)のデータを用いた。そして、これらのデータについて、上記(2-1)で子宮内膜症判定用遺伝子群の同定に用いた検体の平均値が入力されたSVMを用いて判定を行った。
この結果を、図16Bに示す。この結果から、本発明の判定方法によれば、子宮内膜症判定用遺伝子群の同定に用いた検体とは異なる検体についても、75%の感度および85%以上の特異度で、安定して正常組織についての検体と病変部組織についての検体とを区別できることがわかる。
【0113】
比較例3 従来の判定方法による子宮内膜症の判定
ここでは、従来の判定方法として、健常者および患者の遺伝子の転写産物の発現量自体に基づいて疾患の罹患を判定する方法を用いた。このような、従来の判定方法を用いて、子宮内膜症の病変部組織についての検体を判定した場合の判定の精度を評価した。
(1)子宮内膜症判定用遺伝子群に属する遺伝子を用いた判定
(1-1)子宮内膜症病判定用遺伝子群の同定に用いた検体について
表5の39遺伝子のそれぞれにおける上記の正常組織1(8検体)および病変部組織1(9検体)についての発現量を、それぞれSVMに入力した。そして、これらの17検体の発現量が入力されたSVMを用いて、各検体が陽性と判定されるか、または陰性と判定されるかについて、判定の精度の評価を行った。
この結果を、図17Aに示す。この結果から、従来の判定方法によれば、100%の感度および特異度で、正常組織および病変部組織についての検体を同定できることがわかる。
【0114】
(1-2)従来の判定方法の再現性の評価
次いで、従来の判定方法の再現性を評価するために、上記の正常組織2(8検体)および病変部組織2(9検体)のデータを用いた。そして、これらの検体について、上記(1-1)で正常組織1(8検体)および病変部組織1(9検体)についての発現量が入力されたSVMを用いて判定を行った。
この結果を、図17Bに示す。この結果から、子宮内膜症判定用遺伝子群の同定に用いた検体とは異なる検体について、従来の判定方法の特異度は100%であったが、感度は65%以下に低下した。したがって、従来の判定方法では、子宮内膜症患者を健常者であるとして誤った判定結果を示す可能性が、本発明の判定方法よりも高いことがわかる。
【0115】
(2)子宮内膜症判定用遺伝子群に属する遺伝子とは異なる遺伝子を用いた判定
(2-1)子宮内膜症判定用遺伝子群の同定に用いた検体について
子宮内膜症判定用遺伝子群に属する遺伝子(表5の39遺伝子)とは異なる遺伝子を用いた場合についても検討するため、そのような遺伝子を新たに同定した。具体的には、上記の正常組織1(8検体)についての発現量と病変部組織1(9検体)についての発現量との間の有意確率(p値)をT検定により求め、得られたp値が0.05以下であった発現量の遺伝子を判定に用いる遺伝子とした。その結果、10個の遺伝子を同定した。これらの遺伝子および各遺伝子のp値を、表7に示す。また、各遺伝子における健常者3と子宮内膜症患者1とについて、遺伝子の転写産物の発現量の分布を、図18に示す。
【0116】
【表7】
【0117】
これらの遺伝子のそれぞれにおける上記の正常組織1(8検体)および病変部組織1(9検体)についての発現量を、それぞれSVMに入力した。そして、これらの17検体の発現量が入力されたSVMを用いて、各検体が陽性と判定されるか、または陰性と判定されるかについて、判定の精度の評価を行った。
この結果を、図19Aに示す。この結果から、子宮内膜症判定用遺伝子群に属する遺伝子とは異なる遺伝子を用いた従来の判定方法によれば、100%の感度および特異度で、正常組織および病変部組織についての検体を同定できることがわかる。
【0118】
(2-2)従来の判定方法の再現性の評価
次いで、上記の10遺伝子を用いる従来の判定方法の再現性を評価するために、上記の正常組織2(8検体)のデータおよび正常組織2(8検体)のデータを用いた。そして、これらの検体について、上記(2-1)で健常者3(7検体)および子宮内膜症患者1(6検体)についての発現量が入力されたSVMを用いて判定を行った。
この結果を、図19Bに示す。この結果から、子宮内膜症判定用遺伝子群の同定に用いた検体とは異なる検体について、従来の判定方法の特異度は100%であったが、感度は0%に低下していた。したがって、子宮内膜症判定用遺伝子群に属する遺伝子とは異なる遺伝子を用いた従来の判定方法では、子宮内膜症患者を健常者であるとして誤った判定結果を示す可能性が、本発明の判定方法よりも極めて高いことがわかる。
【0119】
実施例3および比較例3の結果から、本発明の判定方法は、健常者および子宮内膜症患者の遺伝子の転写産物の発現量自体に基づいて子宮内膜症の罹患を判定する通常の方法よりも、高い精度の判定を安定して行い得ることがわかる。
【符号の説明】
【0120】
1 遺伝子の転写産物発現量測定装置
2 コンピュータ
3 ケーブル
110 本体
110a CPU
110b ROM
110c RAM
110d ハードディスク
110e 読出装置
110f 入出力インタフェース
110g 画像出力インタフェース
110h バス
120 ディスプレイ
130 入力部
【特許請求の範囲】
【請求項1】
(1)判定対象疾患の罹患が疑われる被験者から得られた生体試料中の、前記疾患と関連する少なくとも2つの疾患判定用遺伝子群それぞれにおいて、遺伝子群に属する少なくとも1つの遺伝子の転写産物の発現量を測定する工程と、
(2)前記発現量を複数の健常者における対応する遺伝子の転写産物の発現量に基づいて標準化することにより、偏差を表わす値を取得する工程と、
(3)前記対象疾患判定用遺伝子群それぞれにおいて、遺伝子群に属する遺伝子の偏差を表す値の平均値を取得する工程と、
(4)前記平均値を用いて、前記被験者が対象疾患に罹患しているか否かを判定する工程と
を含む、疾患の罹患判定方法。
【請求項2】
請求項1の第1工程における疾患判定用遺伝子群が、
(a)判定対象疾患に罹患した複数の患者のそれぞれおよび複数の健常者のそれぞれから得られた生体試料中の遺伝子の転写産物の発現量を測定する工程と、
(b)前記複数の患者のそれぞれについての発現量を、前記複数の健常者における対応する遺伝子の転写産物の発現量に基づいて標準化することにより、前記複数の患者のそれぞれについての偏差を表す値を取得し、
前記複数の健常者のそれぞれについての発現量を標準化することにより、前記複数の健常者のそれぞれについての偏差を表す値を取得する工程と、
(c)前記発現量を測定した遺伝子を、遺伝子がコードする分子の機能に基づく分類系統を用いて、少なくとも2つの遺伝子群に分類し、
前記複数の患者のそれぞれおよび前記複数の健常者のそれぞれについて、
前記遺伝子群それぞれにおいて、遺伝子群に属する遺伝子の偏差を表す値の平均値を前記遺伝子群の平均値として取得する工程と、
(d)前記複数の患者についての各遺伝子群の平均値と前記複数の健常者についての対応する各遺伝子群の平均値との間の有意確率を取得する工程と、
(e)前記有意確率が0.05以下である遺伝子群を判定対象疾患と関連する疾患判定用遺伝子群として同定する工程と
により同定される請求項1に記載の方法。
【請求項3】
遺伝子がコードする分子の機能に基づく分類系統が、ジーンオントロジー(Gene Ontology)、京都エンサイクロペディア オブ ジーンズ アンド ゲノムス(Kyoto Encyclopedia of Genes and Genomes(KEGG))、メタシック(MetaCyc)、ジンマップ(GenMAPP)、バイオカルタ(BioCarta)、キーモルネット(KeyMolnet)またはオンライン メンデリアン インヘリタンス イン マン(Online Mendelian Inheritance in Man(OMIM))である請求項2に記載の方法。
【請求項4】
判定対象疾患が、クローン病、ハンチントン病または子宮内膜症から選択される請求項1〜3のいずれか1項に記載の方法。
【請求項5】
判定対象疾患がクローン病であり、疾患判定用遺伝子群が、Gタンパク質関連遺伝子群、血液凝固関連遺伝子群、酸化ストレス関連遺伝子群、ファゴサイトーシス関連遺伝子群または脂肪酸化関連遺伝子群から選択される少なくとも2つである請求項1〜4のいずれか1項に記載の方法。
【請求項6】
判定対象疾患がハンチントン病であり、疾患判定用遺伝子群が、微小管関連遺伝子群、ミトコンドリア関連遺伝子群またはプロスタグランジン関連遺伝子群から選択される少なくとも2つである請求項1〜4のいずれか1項に記載の方法。
【請求項7】
判定対象疾患が子宮内膜症であり、疾患判定用遺伝子群が、サイトカイン合成経路関連遺伝子群、サイトカイン媒介シグナル関連遺伝子群またはイムノグロブリン媒介免疫反応関連遺伝子群から選択される少なくとも2つである請求項1〜4のいずれか1項に記載の方法。
【請求項8】
遺伝子の転写産物の発現量を測定する工程において、少なくとも3つの疾患判定用遺伝子群それぞれにおいて、遺伝子群に属する少なくとも1つの遺伝子の発現量を測定する請求項1〜7のいずれか1項に記載の方法。
【請求項9】
Gタンパク質関連遺伝子群の遺伝子が、遺伝子シンボルで表してGNG3、GNG7、GNA15、GNB5、GNAS、GNG5、GNG11、GNB1およびGNG4で表される遺伝子からなる群より選択され、
血液凝固関連遺伝子群の遺伝子が、遺伝子シンボルで表してGP1BA、GP1BB、ITGB3、GP9およびF13A1で表される遺伝子からなる群より選択され、
酸化ストレス関連遺伝子群の遺伝子が、遺伝子シンボルで表してGPX1、PTGS1、CLUおよびPDLIM1で表される遺伝子からなる群より選択され、
ファゴサイトーシス関連遺伝子群の遺伝子が、遺伝子シンボルで表してFCER1G、CLEC7A、VAMP7およびFCGR1Aで表される遺伝子からなる群より選択され、
脂肪酸化関連遺伝子群の遺伝子が、遺伝子シンボルで表してACOX1、ADIPOR2、ADIPOR1およびALOX12で表される遺伝子からなる群より選択される、
請求項5に記載の方法。
【請求項10】
微小管関連遺伝子群の遺伝子が、遺伝子シンボルで表してDYNC1LI1、DYNLL1、DYNLT1、およびDYNLT3で表される遺伝子からなる群より選択され、
ミトコンドリア関連遺伝子群の遺伝子が、遺伝子シンボルで表してATP5F1、ATP5J、ATP5L、ATP5C1、ATP5O、COX6A1、COX7A2、CYCS、MRPL18、MRPS35、NDUFA4、NDUFA9、NDUFB1、NDUFB3、NDUFB5、NDUFC1、NDUFS4、TIMM17A、TIMM8B、TOMM20、TOMM7、UQCRH、UQCRおよびUQCRQで表される遺伝子からなる群より選択され、
プロスタグランジン関連遺伝子群の遺伝子が、遺伝子シンボルで表してPTGER2、PTGER4およびPTGES3で表される遺伝子からなる群より選択される、
請求項6に記載の方法。
【請求項11】
サイトカイン合成経路関連遺伝子群の遺伝子が、遺伝子シンボルで表してCEBPEおよびCD28で表される遺伝子からなる群より選択され、
サイトカイン媒介シグナル関連遺伝子群の遺伝子が、遺伝子シンボルで表してEREG、STAT3、STAT5A、STAT5B、SOCS1、SOCS5、RELA、CEBPA、DUOX2、DUOX1、STAT4、ZNF675、IL2RB、IRAK3、KIT、LRP8、TNFRSF1A、PLP2、TNFRSF1B、TGM2、CCR1、CCR2、PF4、CX3CL1、IL1R1、CSF2RB、CLCF1およびNUP85で表される遺伝子からなる群より選択され、
イムノグロブリン媒介免疫反応関連遺伝子群の遺伝子が、遺伝子シンボルで表してIGHG3、IGHM、CD74、FCER1G、BCL10、PRKCD、CD27、MYD88およびTLR8で表される遺伝子からなる群より選択される、
請求項7に記載の方法。
【請求項12】
生体試料が、血液である請求項1〜11のいずれか1項に記載の方法。
【請求項13】
判定工程が、判定対象疾患の罹患が疑われる被験者から取得された平均値を、健常者から採取された生体試料を用いて前記測定工程および取得工程と同様にして予め得られた平均値と、判定対象疾患に罹患した患者から採取された生体試料を用いて前記測定工程および取得工程と同様にして予め得られた平均値とに基づいて得られる判定式に入力することにより行われる請求項1〜12のいずれか1項に記載の方法。
【請求項14】
判定式が、判別分析の手法を用いて作成される請求項13に記載の方法。
【請求項15】
判別分析の手法が、サポートベクターマシン、線形判別分析、ニューラルネットワーク、k近傍識別器、決定木またはランダムフォレストである、請求項14に記載の方法。
【請求項16】
コンピュータを、
判定対象疾患の罹患が疑われる被験者から得られた生体試料中の、前記疾患と関連する少なくとも2つの疾患判定用遺伝子群それぞれにおいて、遺伝子群に属する少なくとも1つの遺伝子の転写産物の発現量を受け付ける受付手段、
前記発現量を複数の健常者における対応する遺伝子の発現量に基づいて標準化することにより偏差を表わす値を取得する偏差取得手段、
前記疾患判定用遺伝子群それぞれにおいて、遺伝子群に属する遺伝子の偏差を表す値の平均値を取得する平均値取得手段、
前記平均値を用いて、被験者が対象疾患に罹患しているか否かを判定する判定手段、
判定手段の判定結果を出力する出力手段
として機能させるための疾患の罹患判定用プログラム。
【請求項17】
コンピュータを、
判定対象疾患に罹患した複数の患者のそれぞれおよび複数の健常者のそれぞれから得られた生体試料中の遺伝子の転写産物の発現量を受け付ける受付手段、
前記複数の患者のそれぞれについての発現量を、前記複数の健常者における対応する遺伝子の転写産物の発現量に基づいて標準化することにより、前記複数の患者のそれぞれの偏差を表わす値を取得し、前記複数の健常者のそれぞれについての発現量を標準化することにより、前記複数の健常者のそれぞれの偏差を表わす値を取得する偏差取得手段、
前記発現量を測定された遺伝子を、遺伝子がコードする分子の機能に基づく分類系統による分類に従って、少なくとも2つの遺伝子群に分類し、前記複数の患者のそれぞれおよび前記複数の患者のそれぞれについて、前記遺伝子群それぞれにおいて、遺伝子群に属する遺伝子の偏差を表す値の平均値を前記遺伝子群の平均値として取得する平均値取得手段、
前記複数の患者についての各遺伝子群の平均値と前記複数の健常者についての対応する各遺伝子群の平均値との間の有意確率を取得する有意確率取得手段、
前記有意確率が0.05以下である遺伝子群を判定対象疾患と関連する疾患判定用遺伝子群として同定する遺伝子群同定手段、
としてさらに機能させる請求項16に記載のプログラム。
【請求項18】
判定手段が判別分析の手法を含む請求項16または17に記載のプログラム。
【請求項1】
(1)判定対象疾患の罹患が疑われる被験者から得られた生体試料中の、前記疾患と関連する少なくとも2つの疾患判定用遺伝子群それぞれにおいて、遺伝子群に属する少なくとも1つの遺伝子の転写産物の発現量を測定する工程と、
(2)前記発現量を複数の健常者における対応する遺伝子の転写産物の発現量に基づいて標準化することにより、偏差を表わす値を取得する工程と、
(3)前記対象疾患判定用遺伝子群それぞれにおいて、遺伝子群に属する遺伝子の偏差を表す値の平均値を取得する工程と、
(4)前記平均値を用いて、前記被験者が対象疾患に罹患しているか否かを判定する工程と
を含む、疾患の罹患判定方法。
【請求項2】
請求項1の第1工程における疾患判定用遺伝子群が、
(a)判定対象疾患に罹患した複数の患者のそれぞれおよび複数の健常者のそれぞれから得られた生体試料中の遺伝子の転写産物の発現量を測定する工程と、
(b)前記複数の患者のそれぞれについての発現量を、前記複数の健常者における対応する遺伝子の転写産物の発現量に基づいて標準化することにより、前記複数の患者のそれぞれについての偏差を表す値を取得し、
前記複数の健常者のそれぞれについての発現量を標準化することにより、前記複数の健常者のそれぞれについての偏差を表す値を取得する工程と、
(c)前記発現量を測定した遺伝子を、遺伝子がコードする分子の機能に基づく分類系統を用いて、少なくとも2つの遺伝子群に分類し、
前記複数の患者のそれぞれおよび前記複数の健常者のそれぞれについて、
前記遺伝子群それぞれにおいて、遺伝子群に属する遺伝子の偏差を表す値の平均値を前記遺伝子群の平均値として取得する工程と、
(d)前記複数の患者についての各遺伝子群の平均値と前記複数の健常者についての対応する各遺伝子群の平均値との間の有意確率を取得する工程と、
(e)前記有意確率が0.05以下である遺伝子群を判定対象疾患と関連する疾患判定用遺伝子群として同定する工程と
により同定される請求項1に記載の方法。
【請求項3】
遺伝子がコードする分子の機能に基づく分類系統が、ジーンオントロジー(Gene Ontology)、京都エンサイクロペディア オブ ジーンズ アンド ゲノムス(Kyoto Encyclopedia of Genes and Genomes(KEGG))、メタシック(MetaCyc)、ジンマップ(GenMAPP)、バイオカルタ(BioCarta)、キーモルネット(KeyMolnet)またはオンライン メンデリアン インヘリタンス イン マン(Online Mendelian Inheritance in Man(OMIM))である請求項2に記載の方法。
【請求項4】
判定対象疾患が、クローン病、ハンチントン病または子宮内膜症から選択される請求項1〜3のいずれか1項に記載の方法。
【請求項5】
判定対象疾患がクローン病であり、疾患判定用遺伝子群が、Gタンパク質関連遺伝子群、血液凝固関連遺伝子群、酸化ストレス関連遺伝子群、ファゴサイトーシス関連遺伝子群または脂肪酸化関連遺伝子群から選択される少なくとも2つである請求項1〜4のいずれか1項に記載の方法。
【請求項6】
判定対象疾患がハンチントン病であり、疾患判定用遺伝子群が、微小管関連遺伝子群、ミトコンドリア関連遺伝子群またはプロスタグランジン関連遺伝子群から選択される少なくとも2つである請求項1〜4のいずれか1項に記載の方法。
【請求項7】
判定対象疾患が子宮内膜症であり、疾患判定用遺伝子群が、サイトカイン合成経路関連遺伝子群、サイトカイン媒介シグナル関連遺伝子群またはイムノグロブリン媒介免疫反応関連遺伝子群から選択される少なくとも2つである請求項1〜4のいずれか1項に記載の方法。
【請求項8】
遺伝子の転写産物の発現量を測定する工程において、少なくとも3つの疾患判定用遺伝子群それぞれにおいて、遺伝子群に属する少なくとも1つの遺伝子の発現量を測定する請求項1〜7のいずれか1項に記載の方法。
【請求項9】
Gタンパク質関連遺伝子群の遺伝子が、遺伝子シンボルで表してGNG3、GNG7、GNA15、GNB5、GNAS、GNG5、GNG11、GNB1およびGNG4で表される遺伝子からなる群より選択され、
血液凝固関連遺伝子群の遺伝子が、遺伝子シンボルで表してGP1BA、GP1BB、ITGB3、GP9およびF13A1で表される遺伝子からなる群より選択され、
酸化ストレス関連遺伝子群の遺伝子が、遺伝子シンボルで表してGPX1、PTGS1、CLUおよびPDLIM1で表される遺伝子からなる群より選択され、
ファゴサイトーシス関連遺伝子群の遺伝子が、遺伝子シンボルで表してFCER1G、CLEC7A、VAMP7およびFCGR1Aで表される遺伝子からなる群より選択され、
脂肪酸化関連遺伝子群の遺伝子が、遺伝子シンボルで表してACOX1、ADIPOR2、ADIPOR1およびALOX12で表される遺伝子からなる群より選択される、
請求項5に記載の方法。
【請求項10】
微小管関連遺伝子群の遺伝子が、遺伝子シンボルで表してDYNC1LI1、DYNLL1、DYNLT1、およびDYNLT3で表される遺伝子からなる群より選択され、
ミトコンドリア関連遺伝子群の遺伝子が、遺伝子シンボルで表してATP5F1、ATP5J、ATP5L、ATP5C1、ATP5O、COX6A1、COX7A2、CYCS、MRPL18、MRPS35、NDUFA4、NDUFA9、NDUFB1、NDUFB3、NDUFB5、NDUFC1、NDUFS4、TIMM17A、TIMM8B、TOMM20、TOMM7、UQCRH、UQCRおよびUQCRQで表される遺伝子からなる群より選択され、
プロスタグランジン関連遺伝子群の遺伝子が、遺伝子シンボルで表してPTGER2、PTGER4およびPTGES3で表される遺伝子からなる群より選択される、
請求項6に記載の方法。
【請求項11】
サイトカイン合成経路関連遺伝子群の遺伝子が、遺伝子シンボルで表してCEBPEおよびCD28で表される遺伝子からなる群より選択され、
サイトカイン媒介シグナル関連遺伝子群の遺伝子が、遺伝子シンボルで表してEREG、STAT3、STAT5A、STAT5B、SOCS1、SOCS5、RELA、CEBPA、DUOX2、DUOX1、STAT4、ZNF675、IL2RB、IRAK3、KIT、LRP8、TNFRSF1A、PLP2、TNFRSF1B、TGM2、CCR1、CCR2、PF4、CX3CL1、IL1R1、CSF2RB、CLCF1およびNUP85で表される遺伝子からなる群より選択され、
イムノグロブリン媒介免疫反応関連遺伝子群の遺伝子が、遺伝子シンボルで表してIGHG3、IGHM、CD74、FCER1G、BCL10、PRKCD、CD27、MYD88およびTLR8で表される遺伝子からなる群より選択される、
請求項7に記載の方法。
【請求項12】
生体試料が、血液である請求項1〜11のいずれか1項に記載の方法。
【請求項13】
判定工程が、判定対象疾患の罹患が疑われる被験者から取得された平均値を、健常者から採取された生体試料を用いて前記測定工程および取得工程と同様にして予め得られた平均値と、判定対象疾患に罹患した患者から採取された生体試料を用いて前記測定工程および取得工程と同様にして予め得られた平均値とに基づいて得られる判定式に入力することにより行われる請求項1〜12のいずれか1項に記載の方法。
【請求項14】
判定式が、判別分析の手法を用いて作成される請求項13に記載の方法。
【請求項15】
判別分析の手法が、サポートベクターマシン、線形判別分析、ニューラルネットワーク、k近傍識別器、決定木またはランダムフォレストである、請求項14に記載の方法。
【請求項16】
コンピュータを、
判定対象疾患の罹患が疑われる被験者から得られた生体試料中の、前記疾患と関連する少なくとも2つの疾患判定用遺伝子群それぞれにおいて、遺伝子群に属する少なくとも1つの遺伝子の転写産物の発現量を受け付ける受付手段、
前記発現量を複数の健常者における対応する遺伝子の発現量に基づいて標準化することにより偏差を表わす値を取得する偏差取得手段、
前記疾患判定用遺伝子群それぞれにおいて、遺伝子群に属する遺伝子の偏差を表す値の平均値を取得する平均値取得手段、
前記平均値を用いて、被験者が対象疾患に罹患しているか否かを判定する判定手段、
判定手段の判定結果を出力する出力手段
として機能させるための疾患の罹患判定用プログラム。
【請求項17】
コンピュータを、
判定対象疾患に罹患した複数の患者のそれぞれおよび複数の健常者のそれぞれから得られた生体試料中の遺伝子の転写産物の発現量を受け付ける受付手段、
前記複数の患者のそれぞれについての発現量を、前記複数の健常者における対応する遺伝子の転写産物の発現量に基づいて標準化することにより、前記複数の患者のそれぞれの偏差を表わす値を取得し、前記複数の健常者のそれぞれについての発現量を標準化することにより、前記複数の健常者のそれぞれの偏差を表わす値を取得する偏差取得手段、
前記発現量を測定された遺伝子を、遺伝子がコードする分子の機能に基づく分類系統による分類に従って、少なくとも2つの遺伝子群に分類し、前記複数の患者のそれぞれおよび前記複数の患者のそれぞれについて、前記遺伝子群それぞれにおいて、遺伝子群に属する遺伝子の偏差を表す値の平均値を前記遺伝子群の平均値として取得する平均値取得手段、
前記複数の患者についての各遺伝子群の平均値と前記複数の健常者についての対応する各遺伝子群の平均値との間の有意確率を取得する有意確率取得手段、
前記有意確率が0.05以下である遺伝子群を判定対象疾患と関連する疾患判定用遺伝子群として同定する遺伝子群同定手段、
としてさらに機能させる請求項16に記載のプログラム。
【請求項18】
判定手段が判別分析の手法を含む請求項16または17に記載のプログラム。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【公開番号】特開2011−92137(P2011−92137A)
【公開日】平成23年5月12日(2011.5.12)
【国際特許分類】
【出願番号】特願2009−251017(P2009−251017)
【出願日】平成21年10月30日(2009.10.30)
【出願人】(390014960)シスメックス株式会社 (810)
【Fターム(参考)】
【公開日】平成23年5月12日(2011.5.12)
【国際特許分類】
【出願日】平成21年10月30日(2009.10.30)
【出願人】(390014960)シスメックス株式会社 (810)
【Fターム(参考)】
[ Back to top ]