説明

糖尿病疾患感受性遺伝子、及び糖尿病罹患の難易を検出する方法

【課題】ヒト2型糖尿病疾患感受性遺伝子、及び糖尿病罹患の難易を検出し判定する方法を提供する。またこの検出方法の実施にあたり有効に使用することができる糖尿病易罹患性診断マーカー、プローブ、プライマー並びに試薬キットを提供する。さらに糖尿病発症のリスク低減に有効な成分をスクリーニングする方法を提供する。
【解決手段】ヒト2型糖尿病疾患感受性遺伝子としてFLJ20003遺伝子及びTACC2遺伝子を、また、糖尿病疾患感受性SNPマーカーとしてSNP531を提供する。さらに、糖尿病罹患の難易を検出する方法として、下の工程(a)及び(b)を含む糖尿病罹患の難易を検出する方法を提供する:(a)検体中のゲノムDNAを抽出する工程、及び(b)抽出したゲノムDNAを対象として、その塩基配列について、ヒト第10染色体上のFLJ20003遺伝子とTACC2遺伝子のIntergenic領域に位置するSNP531部位の塩基を検出し、CかGの別を識別する工程。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、糖尿病、特にヒト2型糖尿病疾患感受性遺伝子に関する。また本発明は、糖尿病罹患の難易を検出し判定する方法に関する。当該方法は、より詳細にはヒトゲノムDNAを含む試料から、糖尿病の罹患に関連したSNPs(単一塩基多型)を検出することにより、該試料提供者(被験者)が糖尿病に罹患する潜在的な危険度を有するか否かを検出し、判定する方法である。さらに本発明は、かかる検出方法の実施にあたり有効に使用することができる糖尿病易罹患性診断マーカー、プローブ、プライマー並びに試薬キットに関する。また本発明は、糖尿病発症のリスク低減に有効な成分をスクリーニングする方法に関する。
【背景技術】
【0002】
糖尿病は近年その患者数が増加しており、成人病のひとつとして注目されている疾患である。糖尿病はインスリン依存型の1型糖尿病とインスリン非依存性の2型糖尿病の二タイプに分別できるが、特に後者の2型糖尿病は日本人の糖尿病患者の9割以上を占める疾患であり、早期発見及び早期治療がその予後の点から重要である。
【0003】
2型糖尿病の原因としては、インスリンの分泌低下またはインスリン感受性機構の異常によるインスリン作用の低下が挙げられる。欧米では多くは後者、すなわちインスリン抵抗性が主な原因であるが、日本の糖尿病患者の多くは前者のインスリン分泌低下が主な原因であるといわれている。しかしながら、このようなインスリン作用の低下を招く要因は多様であり、予想される原因についての知見は乏しいのが現状である。
【0004】
また糖尿病は高血糖状態が持続することによって代謝異常を生じる疾患であるため、同時に眼、腎臓、神経系、心血管系及び皮膚などに種々の合併症を伴う。例えば糖尿病患者が腎症を併発すると腎障害が原因となって高血圧症や高脂血症を悪化させ、患者の予後を更に悪化させる。こうした糖尿病合併症を招かないためにも糖尿病の発症を事前に予防することが必要である。
【0005】
ところで、近年のゲノム解析技術の飛躍的進歩に伴って、疾患と遺伝子との関連性が徐々に解明されつつある。例えば、疾患の原因となる遺伝的変異に関するものとして遺伝子多型〔例えば、SNPs(single nucleotide polymorphisms;単一塩基多型)〕が注目されており、遺伝子多型と疾患の関連性の探究が世界中で精力的に行われている。
【0006】
同様に糖尿病に関しても遺伝子変異と糖尿病発症との関連が検討されている。現在までに明らかになっている、単独の異常によって糖尿病を発症するとされている遺伝子としては、インスリン、インスリン受容体、インスリンプロモーター因子、グルコキナーゼ、ヘパトサイトニュークレアーファクター、アミリン、骨格筋グリコーゲン合成酵素、およびミトコンドリア遺伝子などがある。また、2型糖尿病の発症に関与すると考えられる遺伝子として、インスリン受容体サブストレイト、グルコーストランスポーター、ミトコンドリアグリセロリン酸デヒドロゲナーゼ、脂肪酸結合タンパク質、アドレナリンレセプター、グルカゴンレセプター、カリウムチャンネル、及びCD38等が挙げられる(例えば、非特許文献1参照のこと)。また最近、CD38におけるArg140Trp多型は、糖尿病のリスクを上昇させることが報告されており(例えば、非特許文献2参照のこと)、この多型は日本人の糖尿病患者の約13%の頻度で見いだされていることから、糖尿病のリスク診断に有用であると考えられている。
【0007】
しかし、2型糖尿病は遺伝的な素因(しかも多数の遺伝子が関連している)と環境的な素因とが共に関与して発症にいたる多因子疾患(Multifactorial Disease)であるため、一遺伝子の変異や異常からその罹患リスクを判断することは困難である。こうした中で、最近、連鎖解析の結果から、ヒトのゲノムDNAには、民族または人種を越えて繰り返し連鎖している2型糖尿病疾患感受性領域が存在していることが明らかになり、その領域内に各人種に共通な2型糖尿病発症に関する原因変異、すなわち共通祖先遺伝子(Common Disease − Common Variant − Common Origin仮説を満たす疾患感受性遺伝子)が存在している可能性が指摘されている(例えば、非特許文献3〜8等参照のこと)。
【0008】
しかし、連鎖解析で得られる2型糖尿病疾患感受性領域は広範囲にわたり、連鎖の原因となる「2型糖尿病疾患感受性SNPs」と「連鎖解析」との直接の関係は未だ充分に解明されていない。
【非特許文献1】門脇孝編、「糖尿病の最前線」、羊土社、東京(1997)
【非特許文献2】ダイアベトロジア(Diabetologia)、41、p.1024-1028(1998)
【非特許文献3】クリニカル・ジェネティクス(Clinical Genetics)、2001年10月、第60巻、第4号、243-254
【非特許文献4】Bektas A et al., ダイアベテス(Diabetes), 48 (11), p.2246-2251 (1999)
【非特許文献5】Bektas A et al., ダイアベテス(Diabetes) 50 (1), p.204-208 (2001)
【非特許文献6】Pratley RE et al., J. Clin. Invest. 101 (8), p.1757-1764 (1998)
【非特許文献7】Ehm MG et al., Am. J. Hum. Genet 66(6), p.1871-1881 (2000)
【非特許文献8】Wiltsjore S et al., Am. J. Hum. Genet 69 (3), p.553-569 (2001)
【発明の開示】
【発明が解決しようとする課題】
【0009】
本発明の目的は、人種の壁を超えて複数の民族に共通し得る糖尿病、特にヒト2型糖尿病の発症に関連する遺伝子多型並びに2型糖尿病疾患感受性遺伝子を提供し、さらにこれらの情報をもとにして個々の被験者について糖尿病、特にヒト2型糖尿病の発症危険度を判定するための方法を提供することである。さらに本発明の目的は、当該方法を簡便に実施するために有用な試薬および試薬キットを提供することである。
【0010】
また本発明は、上記ヒト2型糖尿病の発症に関連する遺伝子多型並びにヒト2型糖尿病疾患感受性遺伝子に関する知見をもとに、糖尿病、特にヒト2型糖尿病の予防剤もしくは改善剤の有効成分を探索する方法を提供することを目的とする。
【課題を解決するための手段】
【0011】
本発明者らは、糖尿病、特にヒト2型糖尿病の発症に関与する遺伝子多型を見いだすことを目的として、糖尿病患者及び健常者から単離したDNA試料を対象として、ヒト第10染色体上に存在する遺伝子について遺伝子多型の頻度を調べた結果、当該ヒト第10染色体上のFLJ20003遺伝子とTACC2遺伝子との遺伝子間(Intergenic)領域に糖尿病患者にとりわけ高い頻度で現れる特定の遺伝子多型が1つ存在することを見いだした。そして、個々の被験者について当該遺伝子多型を検出することにより、糖尿病を発症する潜在的な危険度が高い確率で検出できることを見いだし、本発明を完成するにいたった。
【0012】
すなわち、本発明は下記の発明を提供するものである:
項1.ヒト第10染色体を対象とした糖尿病疾患感受性SNPマーカーに対する連鎖不平衡解析において、当該染色体領域内で連鎖不平衡が認められる領域であって、かつ糖尿病疾患感受性SNPマーカーを含む領域である下記に示すハプロタイプブロックにオーバーラップする遺伝子であって、当該ハプロタイプブロックの塩基配列の一部またはすべてを含有する糖尿病疾患感受性遺伝子:
− ヒト第10染色体のゲノム配列中、配列番号1に記載の塩基配列において301番 目の塩基と、配列番号2に記載の塩基配列において301番目の塩基とで挟まれてな る47,235bpからなるハプロタイプブロック。
項2.FLJ20003遺伝子またはTACC2遺伝子である、項1記載の糖尿病疾患感受性遺伝子。
項3.ヒト第10染色体上のFLJ20003遺伝子とTACC2遺伝子のIntergenic領域を含む塩基配列において、塩基CまたはGを挟んで、5'側及び3'側にそれぞれ配列番号3記載の塩基配列及び配列番号4記載の塩基配列を含有する最長601塩基長のオリゴまたはポリヌクレオチドからなる、糖尿病易罹患性診断マーカー。
項4.以下の工程(a)及び(b)を含む糖尿病罹患の難易を検出する方法:
(a) 検体中のゲノムDNAを抽出する工程、及び
(b) 抽出したゲノムDNAを対象として、その塩基配列に、配列番号3記載の塩基配列と配列番号4記載の塩基配列により挟まれた塩基を検出し、識別する工程。
項5.さらに下記の工程(c)を含む、項4記載の糖尿病罹患の難易を検出する方法:
(c) 配列番号3記載の配列と配列番号4記載の配列により挟まれた塩基がCであるかGであるかを識別し、Cである場合に糖尿病易罹患性、またはGである場合に糖尿病難罹患性であると判定する工程。
項6.糖尿病がヒト2型糖尿病である、項4または5に記載する糖尿病罹患の難易を検出する方法。
項7.ヒト第10染色体上のFLJ20003遺伝子とTACC2遺伝子のIntergenic領域にオーバーラップする配列番号5に記載する塩基配列において、301番目に位置するヌクレオチドを含む16〜500塩基長の連続したオリゴ若しくはポリヌクレオチド(但し、当該オリゴ若しくはポリヌクレオチドがRNAである場合、配列表中の塩基記号「t」は「u」に読み替えるものとする)にハイブリダイズする16〜500塩基長のオリゴ若しくはポリヌクレオチド、またはその標識物。
項8.糖尿病罹患の難易を判定するために用いられる、項7のオリゴ若しくはポリヌクレオチド、またはその標識物からなるプローブ。
項9.ヒト第10染色体上のFLJ20003遺伝子とTACC2遺伝子のIntergenic領域において、配列番号5に記載する塩基配列の301番目に位置する塩基を検出し識別するために用いられる、項8に記載するプローブ。
項10.任意の固相に固定してなる固相化プローブである項8または9に記載するプローブ。
項11.ヒト第10染色体上のFLJ20003遺伝子とTACC2遺伝子のIntergenic領域にオーバーラップする配列番号5に記載する塩基配列において、301番目に位置するヌクレオチドを含む16塩基長以上の連続したオリゴ若しくはポリヌクレオチド(但し、当該オリゴ若しくはポリヌクレオチドがRNAである場合、配列表中の塩基記号「t」は「u」に読み替えるものとする)にハイブリダイズし、当該オリゴ若しくはポリヌクレオチドを特異的に増幅するために用いられる15〜30塩基長のオリゴヌクレオチド、またはその標識物。
項12.糖尿病罹患の難易を判定するために用いられる、項11のオリゴヌクレオチドまたはその標識物からなるプライマー。
項13.ヒト第10染色体上のFLJ20003遺伝子とTACC2遺伝子のIntergenic領域において、配列番号5に記載する塩基配列の301番目に位置するヌクレオチドを検出し識別するために用いられる、項12に記載するプライマー。
項14.項8乃至10のいずれかに記載するプローブ、または/及び項12または13に記載するプライマーを含む、糖尿病易罹患性検出用試薬、または当該試薬を含むキット。
項15.下記の工程を有する、糖尿病発症のリスク低減に有効な成分をスクリーニングする方法:
(1) ヒト第10染色体のFLJ20003遺伝子とTACC2遺伝子のIntergenic領域、またはその領域の一部を含む領域であって、少なくとも、塩基Cを挟んで5'側及び3'側にそれぞれ配列番号6記載の塩基配列及び配列番号7記載の塩基配列を含有するポリヌクレオチドを含有する細胞に対して、被験物質を投与する工程、及び
(2) 投与した被験物質の中から、当該細胞中の上記ポリヌクレオチドの配列番号6記載の塩基配列と配列番号7記載の塩基配列に挟まれた塩基CをGに変換させる物質を、候補物質として選択する工程。
【0013】
以下、本発明についてより詳細に説明する。
【0014】
1.本発明で使用する用語の定義
本明細書における塩基配列(ヌクレオチド配列)、核酸などの略号による表示は、IUPAC−IUBの規定〔IUPAc-IUB communication on Biological Nomenclature, Eur. J. Biochem., 138; 9 (1984)〕、「塩基配列又はアミノ酸配列を含む明細書等の作製のためのガイドライン」(特許庁編)及び当該分野における慣用記号に従うものとする。
【0015】
本明細書中において「遺伝子」は、特に言及しない限り、ヒトゲノムDNAを含む2本鎖DNA、及び1本鎖DNA(センス鎖)、並びに当該センス鎖と相補的な配列を有する1本鎖DNA(アンチセンス鎖)、及びそれらの断片のいずれもが含まれる、また、本明細書で「遺伝子」とは、特に言及しない限り、調節領域、コード領域、エクソン、及びイントロンを区別することなく示すものとする。
【0016】
また、本明細書中において、「ヌクレオチド」、「オリゴヌクレオチド」及び「ポリヌクレオチド」は、核酸と同義であって、DNAおよびRNAの両方を含むものとする。また、これらは2本鎖であっても1本鎖であってもよく、ある配列を有する「ヌクレオチド」(または「オリゴヌクレオチド」、「ポリヌクレオチド」)といった場合、特に言及しない限り、これに相補的な配列を有する「ヌクレオチド」(または「オリゴヌクレオチド」及び「ポリヌクレオチド」)も包括的に意味するものとする。さらに、「ヌクレオチド」(または「オリゴヌクレオチド」及び「ポリヌクレオチド」)がRNAである場合、配列表に示される塩基記号「T」は「U」と読み替えられるものとする。
【0017】
本明細書において「Intergenic領域」とは、ゲノムDNA上の、構造遺伝子と構造遺伝子の遺伝子間(Intergenic)領域を意味する。
【0018】
本明細書において「遺伝子多型」とは、2つ以上の遺伝的に決定された対立遺伝子がある場合にそれらの対立遺伝子を指す。具体的には、ヒトの集団において、ある一個体のゲノム配列を基準として、他の1または複数の個体ゲノム中の特定部位に、1又は複数のヌクレオチドの置換、欠失、挿入、転移、逆位などの変異が存在するとき、その変異が当該1または複数の個体に生じた突然変異でないことが統計学的に確実か、または当該個体内特異変異でなく、1%以上の頻度で集団内に存在することが家系的に証明される場合、その変異を「遺伝子多型」とする。本明細書で用いる「遺伝子多型」の意味には、単一のヌクレオチドの変化によって引き起こされる多型であるいわゆる1塩基多型〔Single Nucleotide Polymorphism:SNP(又はSNPs)〕と連続した複数ヌクレオチドにわたる多型の両方が含まれる。「一塩基多型」とは、単一の核酸の変化によって引き起こされる多型である。多型は選択された集団の1%より大きな頻度、好ましくは10%以上の頻度で存在する。
【0019】
本明細書において「糖尿病疾患感受性遺伝子」(又は「2型糖尿病疾患感受性遺伝子」)とは、多遺伝子性疾患である糖尿病(2型糖尿病)に罹りやすい体質を決める遺伝子のことをいう。
【0020】
また、本明細書において「遺伝子頻度」とは、一つの遺伝子の座位について、集団中に存在する全遺伝子数のうち、その対立遺伝子が占める割合をいう。
【0021】
本明細書において「連鎖不平衡」とは、集団における任意の対立遺伝子の組み合わせの頻度について、偶然によって期待されるよりも、より頻繁に近傍の特定対立と出現する関係のことをいう。例えば、遺伝子座Xが対立遺伝子a及びb(これらの等しい頻度で存在する)を有し、近傍の遺伝子座Yが対立遺伝子c及びd(これらは等しい頻度で存在する)を有する場合、別の遺伝子多型の組み合わせであるハプロタイプacは、集団において0.25の頻度で存在することが期待される。ハプロタイプacがこうした期待値よりも大きい場合、つまりacという特定の遺伝子型が頻繁に出現する場合、対立遺伝子acは連鎖不平衡にあるという。連鎖不平衡は、対立遺伝子の特定の組み合わせの自然選択または集団に導入された時期が進化的にみて最近であることによって生じたもので、連鎖する対立遺伝子同士が平衡に達していないことから生じ得る。従って、民族や人種などのように、別の集団においては連鎖不平衡の様式は異なり、ある集団においてacが連鎖不平衡である場合でも、別の集団でadが連鎖不平衡の関係である場合もある。連鎖不平衡における遺伝子多型の検出は、当該多型そのものが直接疾患を引き起こさないにも拘わらず、疾患に対する感受性を検出するのに有効である。例えば、ある遺伝子座Xの対立遺伝子aについて、それが疾患の原因遺伝子要素ではないが、遺伝子座Yの対立遺伝子cとの連鎖不平衡により、疾患感受性を示し得ることがある。
【0022】
本明細書において「連鎖不平衡解析」とは、ゲノム領域における連鎖不平衡の強さの度合いを解析することをいう。実施例では、2つのマーカー間での連鎖不平衡の強さを示す連鎖不平衡係数|D'|を非血縁健常者(対照者)164例のタイピングデータから算出することで連鎖不平衡解析を実施している。
【0023】
本明細書において「マイナーアレル」とは、一つの遺伝子の座位について2つの対立遺伝子が存在する場合において、遺伝子頻度の低い対立遺伝子(アレル)をいう。
【0024】
なお、本明細書において、各塩基番号はCeleraの位置情報に基づくものである。
【0025】
2.糖尿病疾患感受性遺伝子の同定
本発明者らは、SNPsと糖尿病、特にヒト2型糖尿病との関連に着目し、ヒト第10染色体を対象として、ある程度の間隔を有するようにSNPsをスクリーニングすることによって、糖尿病疾患感受性遺伝子と連鎖不平衡状態にあるSNPsを効果的に選択することができ、その結果、そのSNPsを含むハプロタイプブロックに存在する遺伝子を糖尿病疾患感受性遺伝子、特にヒト2型糖尿病疾患感受性遺伝子として同定することに成功した。
【0026】
そこで、本発明はかかる糖尿病疾患感受性遺伝子、特にヒト2型糖尿病疾患感受性遺伝子を提供する。
【0027】
なお、本発明の糖尿病疾患感受性遺伝子の同定は、実施例に記載するように、下記の工程を有する同定方法を実施することによって行われた。
(i) 健常対照者由来の試料を用いて、糖尿病疾患感受性遺伝子の候補領域内に、該候補領域全体にわたって偏在しない複数のSNPsマーカーを選定する工程、
(ii) 工程(i)で選定したSNPsマーカーについて、健常対照者集団と糖尿病罹患者集団とを統計学的処理により比較し、有意差の認められるSNPsマーカーを選択する工程、
(iii)工程(ii)で選択したSNPsマーカーについて、工程(ii)と異なる健常対照者集団と糖尿病罹患者集団とを統計学的処理により比較し、有意差の認められるSNPsマーカーを糖尿病疾患感受性SNPsマーカーとして特定する工程、及び
(iv) 糖尿病疾患感受性SNPsマーカーに対して連鎖不平衡解析を行い、対象候補領域内で連鎖不平衡が認められる領域であって、かつ糖尿病疾患感受性SNPsマーカーを含む領域(ハプロタイプブロック)を特定することにより、遺伝子を同定する工程。
【0028】
上記工程(i)は、対象候補領域について健常対照者の試料からタイピングされたSNPsマーカーを選定する工程である。なお、本発明では、対象候補領域としてヒト第10染色体上の遺伝子領域を用いた。ここで、試料としては、ゲノムDNAを含むものであれば特に限定されない。例として、末梢血などの血液、唾液、汗等の体液、体細胞およびそれを含む組織または器官等を挙げることができる。
【0029】
なお、上記同定の全工程を通じて、用いる健常対照者集団および糖尿病罹患者集団は、糖尿病疾患感受性遺伝子を特定する人種と同じ人種で構成されている必要があり、例えば、日本人の糖尿病疾患感受性遺伝子を同定するには、対照集団は日本人健常者で構成されている必要がある。SNPsマーカーは、米国のdbSNPデータベース、東京大学医科学研究所および科学技術振興財団によるデータベース(JSNP)などのSNPsに関する各種データベースを用いて選定することも可能である。しかし、同一人種、同一民族など、比較的遺伝的に均質な母集団に対して、正確に遺伝子同定を行なうには、対象候補領域に対し、所望の母集団に属する健常対照者由来の試料に対し、SNPsタイピングすることが好ましい。
【0030】
SNPsタイピングの方法としては、PCR−SSCP、PCR−RFLP、PCR−SSO、PCR−ASP、ダイレクトシークエンス法、SNaPshot、dHPLC、Sniper法、MALDI−TOF/MS法等の当業者に周知の方法(例えば、「ゲノム創薬の最前線」p44−p54、野島 博 編、羊土社、参照)を用いることができるが、特に、Assays−on−Demand(登録商標;アプライドバイオシステムズ製)を利用し、TaqManシステムを利用したSNPsタイピング法を採用することが効果的である。
【0031】
本発明では、健常対照者由来の試料について対象候補領域内のSNPsタイピングした結果を基に、選択の指標として遺伝子頻度を利用して、糖尿病疾患感受性遺伝子の同定に有用なSNPsを選択した。具体的には、マイナーアレルの遺伝子頻度が10%以上、好ましくは15%以上のSNPsを選択する。このような遺伝子頻度のSNPsを用いることにより、信頼性の高いSNPsマーカーを選定することができる。また、この遺伝子頻度が高いと、30〜50例程度の比較的少ない健常対照者のサンプル数で良好なSNPsマーカーが選定できるという利点もある。
【0032】
なお、比較的少ないサンプル数で選定したマーカーについては、さらに別途健常対照者の試料を用いて選定したSNPsマーカーと比較することで確認したり、またハーディ−ワインベルグ(Hardy−Weinberg)平衡検定によりサンプリングの妥当性およびアッセイの妥当性を評価することにより、充分に信頼性の高いSNPsマーカーを対象候補領域内に選定することができる。
【0033】
ここで別途の健常対照者の試料を用いて選定したSNPsマーカーと比較する場合は、マイナーアレルの遺伝子頻度を指標に、選定したSNPsマーカーが別途の健常対照者の試料についても重複して選定できるか否かを確認することが望ましい。
【0034】
また、ハーディ−ワインベルグ平衡検定によって評価する場合は、選定したSNPsマーカーについて検定を行なう。ハーディ−ワインベルグ平衡とは、ゲノム統計学の分野ではよく知られており、遺伝子型のタイピングエラーを評価およびサンプリングの妥当性の評価をする検定である。SNPsなどのように2つの対立遺伝子(例えばAとC)が存在し、集団におけるそれぞれの頻度がpとqのとき(p+q=1)、A/Aホモ、A/Cヘテロ、C/Cホモの遺伝子型頻度はそれぞれp2、2pq、q2となる(p2+2pq+q2=1)。健常対照者集団においてハーディ−ワインベルグ平衡が成立することが望ましいが、ハーディ−ワインベルグ平衡からのずれが統計学的に有意な差をもつものの個数が有意水準(典型的にはα=0.01〜0.05)における予想範囲内であれば、選定したSNPsマーカーが妥当であると評価できる。
【0035】
なお、遺伝子頻度を指標にSNPsマーカーを選定した場合、SNPsマーカーが特定の狭い領域に偏在する場合がある。このような場合、選定した全てのSNPsマーカーを糖尿病疾患感受性遺伝子の同定に用いると、実験が煩雑になり、また、互いに近傍のSNPsは連鎖不平衡状態にあることも多く、効率的ではない。そこで、本発明では、おおよそある程度の間隔をもってSNPsマーカーを選択して選定した。このように、ある間隔をもたせて、マーカーの偏在をなくすことによって、対象候補領域(ヒト第10染色体遺伝子領域)全体にわたって網羅的な関連解析を行うことが可能となり、糖尿病疾患感受性遺伝子の同定を容易にすることができる。このように選定する互いに隣接するSNPsマーカー間の距離は、好ましくは5kb以上であり、特に好ましくは、5kb〜10kbである。この距離が長すぎると、SNPsマーカー間の互いの連鎖不平衡の強さの程度が確認できない領域が生じる可能性がある。また、この距離が短すぎると、互いに強い連鎖不平衡が認められるSNPsが多く、後の連鎖不平衡解析において実験量が増大し効率的でない。
【0036】
対象候補領域全体にわたって網羅的にSNPsマーカーを選定する上で、このSNPsマーカー間の距離とは別に、マーカーの対象候補領域内での散らばり具合、すなわちゲノムの単位距離あたりのマーカー個数を「マーカー密度」として表現することができる。本発明で選定したSNPsマーカーのマーカー密度は、ゲノム10kbあたり0.5SNP以上、好ましくは1SNP以上、特に好ましくは1SNP〜2SNPsである。マーカー密度が低すぎると、マーカー間の距離が長すぎ、前述するようにSNPsマーカー間の連鎖不平衡の強さの程度が確認できない領域が生じる可能性がある。一方、マーカー密度が高すぎると、マーカー間の距離が短すぎ、前述するように、マーカーが過密に選定されて糖尿病疾患感受性遺伝子を同定する場合に実験量が多くなり効率的ではなくなる。
【0037】
次いで工程(ii)及びそれに続く工程(iii)は、上記工程(i)により、対象候補領域内(ヒト第10染色体上の遺伝子領域)に偏在することなく、ある間隔をあけて選定したSNPsマーカーについて、健常対照者集団と糖尿病罹患者集団の間で観察される遺伝子頻度を比較することにより、糖尿病とSNPsマーカーの関連解析を行ない、糖尿病に関連するSNPsを選択する工程である。
【0038】
関連解析は、典型的には、各SNPsマーカーの遺伝子頻度を糖尿病罹患者集団と健常対照者集団とで比較し、頻度の差が統計学的に有意なものであるか否かについてχ2検定(統計学入門−基礎統計学I,東京大学教養学部統計学教室編、東大出版会、参照)することによるが、各SNPsマーカーについての遺伝子型頻度、対立遺伝子陽性率での頻度によっても行うことができる。また、χ2検定以外にも、糖尿病罹患者集団と健常対照者集団とで比較すること、即ち、それについて複数集団に分けられる疾患等の表現形質と遺伝子多型の関連を検定することが可能であれば、他の周知の統計学的処理によって行なうことができる。
【0039】
本発明では、糖尿病罹患者集団と健常対照者集団のそれぞれについて同一母集団由来の異なるサンプリング集団で関連解析を行なった。最初(1次)の関連解析では有意水準を緩くすることで検出力を上げ、偽陽性検出も含めて幅広く検出し、引き続いて実施される第2次関連解析については1次解析で選択されたマーカーSNPsのみを対象に通常の有意水準で疾患感受性SNPsを検出し特定する(工程(ii))。2次解析には1次解析で選択されたマーカーSNPsのみを対象とすることにより多重検定による偽陽性率の増加を効果的に抑えられる(工程(iii))。
【0040】
より具体的には次のように行なわれる(遺伝子頻度と疾患の独立性を検定するχ2検定の場合)。
【0041】
まず、罹患者集団D1と健常対照者集団H1とから得られたそれぞれの試料について、対象候補領域内に選定したSNPsマーカーに対する関連解析(遺伝子頻度と疾患の独立性を検定するχ2検定)を行なう(工程(ii))。D1とH1との間で統計学的に有意な遺伝子頻度の差を示すSNPs、好ましくは有意水準α≦0.10で有意差を示すSNPs(P<0.10)、さらに好ましくは、有意水準α≦0.07で有意差を示すSNPs(P<0.07)を、疾患感受性SNPsの候補SNPsとして選択する。またP値について、P値が大きければ糖尿病との関連性が低く、小さければ関連性が高いことを示す。しかし、候補SNPsを選択する場合に、P値のあまりに小さいものだけを選択すると、糖尿病疾患感受性SNPsマーカーの検出力を著しく低下させ、候補SNPsの数が少なくなりすぎる危険がある。この段階での候補SNPsの選択は、糖尿病疾患感受性を示す可能性のあるマーカーSNPsを統計学的偽陽性によって検出されたものも含めて幅広く拾い上げることである。
【0042】
次に、この選択された候補SNPsについて、先の集団D1および集団H1とは異なる糖尿病罹患者集団D2および健常対照者集団H2に由来する試料を用いて、関連解析を行なう(工程(iii))。この関連解析は、先の関連解析と完全に独立して行なわれることが好ましいが、集団D2のサンプル数が集団D1のサンプル数よりも大きければ、完全に独立していなくても行なうことも可能である。また、集団H2のサンプル数は、集団H1のサンプル数よりも大きいことが好ましい。集団D2と集団H2についての関連解析(遺伝子頻度と糖尿病の独立性を検定するχ2検定)は、集団D1と集団H1についての関連解析の結果得られた候補SNPsに対して行なう。ここで、D2とH2との間で統計学的に有意な遺伝子頻度の差を示すSNPsを糖尿病疾患感受性SNPsマーカーとして特定する。
【0043】
このように2つの関連解析を独立して行ない、先に候補SNPsを穏やかな条件で選択し、後に厳しい条件で疾患感受性SNPsマーカーを特定することで、2回の検定で連続して関連が検出されたより確実性の高いSNPsマーカーだけを特定でき、1次解析において偽陽性として検出されてきたSNPs群は2次解析において排除することができる。ここで、「穏やかな条件」および「厳しい条件」とは、独立に行なった2つの関連解析の相対的な条件である。例えば、先の関連解析の有意水準の値α1と、後の関連解析の有意水準の値α2を比較して、α1>α2であれば、先の関連解析が「穏やかな条件」で行なわれ、後の関連解析が「厳しい条件」で行なわれたことを示す。一般に、有意水準はα=1×10-3、α=1×10-4など小さければ小さいほど信頼性の高いSNPsマーカーを選択することができるが、α1>α2の条件下で、先の関連解析の有意水準をα1≦0.10、好ましくはα1≦0.07、さらに好ましくはα1≦0.05である定数に定め、後の関連解析の有意水準をα2<0.10、α2<0.05、さらに好ましくはα2<0.01である定数とすることによって、より確実性の高いSNPsマーカーだけを特定することが可能になる。
【0044】
次いで行われる工程(iv)は、上記で特定された糖尿病疾患感受性SNPsマーカーを用いて、連鎖不平衡解析により糖尿病疾患感受性遺伝子を同定する工程である。
【0045】
連鎖不平衡解析は、当業者に周知の方法であって、従来行なわれている各種の連鎖不平衡解析(例えば、「ポストゲノム時代の遺伝統計学」、p.183-201、鎌谷直之編、羊土社、参照)で行なうことができる。連鎖不平衡解析を行なうにあたり、例えば、SNP疾患関連解析ソフト「SNPAlyze ver. 2.1」(株式会社ダイナコム製)などの市販のプログラムを用いることができる。より具体的には、EM法による連鎖不平衡解析により、連鎖不平衡係数|D'|(pair−wise LD coefficient)を算出して解析することができる。連鎖不平衡解析は、上記で特定した糖尿病疾患感受性SNPsマーカーとその近傍にある他のマーカーについて行なうが、先に対象候補領域内に選定したSNPsマーカーについて行なうことが好ましい。用いるマーカーの個数は、糖尿病疾患感受性SNPsマーカーを含めて、4SNPs以上、好ましくは20SNPs以上、特に好ましくは32SNPs以上であり、これら複数のSNPsマーカーを含む一連のSNPsマーカー群に対して行なう。
【0046】
該SNPsマーカー群のマーカー数は、同定する糖尿病疾患感受性遺伝子と関連するハプロタイプブロック(連鎖不平衡ブロック)を形成する領域の大きさによって、適宜、変更することができる。また、予めブロックの切れ目が予想されている場合は、そのブロックをはさんで6SNPs程度で行なうことも可能である。さらに、はじめに疾患感受性SNPsマーカーをはさみ両側に5SNPsの合計11SNPsに対して連鎖不平衡解析を行ない、必要に応じて、解析するマーカー数を増やしていってもよい。
【0047】
連鎖不平衡解析の結果、対象候補領域内でSNPsが連鎖している領域(互いに強い連鎖不平衡が認められるSNPsマーカー群を含むハプロタイプブロック)を特定する。ハプロタイプブロックの特定は、連鎖不平衡の強度により、当業者が適宜なすことができるが、例えば、ガブリエルらの報告〔Gabriel SB et al., Science 296 (5576):2225-2229 (2002)〕に準じて行なうことができる。なお、本発明では「ハプロタイプブロック」を、ほとんど歴史的組み換えが認められないゲノムを分割する範囲であって、その範囲内に強い連鎖不平衡が存在する領域と規定する。ここで「強い連鎖不平衡」とは、|D'|の95%信頼区間上限が0.98を超え、95%信頼区間下限が0.7より上である状態をいい、「強い歴史的組み換えの証拠がある」とは、|D'|の95%信頼区間上限が0.9未満である状態をいう。
【0048】
本発明では、特に、選定されたSNPsマーカーについて全ての2SNPs間の組み合わせについて連鎖不平衡係数|D'|を算出し、|D'|>0.9を示した組み合わせを選択し、そのうち、もっとも遠いSNPsで挟まれる領域を含む一連の領域を「ハプロタイプブロック」と考え、ハプロタイプブロックの外で連続する3SNPsは、ハプロタイプブロック内のSNPとは、いずれの組み合わせでも|D'|は0.9以下であることを確認できた領域とした。
【0049】
このようにしてハプロタイプブロックが特定されれば、例えば、その領域について、ゲノムに関するデータベース等を利用し、注目するハプロタイプブロックに存在する遺伝子を特定することができる。なお、データベースを利用しない場合でも、ハプロタイプブロック領域内に存在するSNPsマーカー近傍の塩基配列を常法により決定し、その塩基配列から遺伝子を特定することも可能である。
【0050】
斯くして同定した糖尿病疾患感受性遺伝子、好適にはヒト2型糖尿病疾患感受性遺伝子は、ヒト第10染色体を対象とした糖尿病疾患感受性マーカーに対する連鎖不平衡解析において、当該染色体領域内で連鎖不平衡が認められる領域であって、かつ糖尿病疾患感受性SNPsマーカーを含む領域である「ハプロタイプブロック」にオーバーラップする遺伝子であり、当該ハプロタイプブロックの塩基配列の一部またはすべてを含有する遺伝子として特定される。ここでハプロタイプブロックは、ヒト第10染色体のゲノム領域中、配列番号1に記載する塩基配列において301番目の塩基と、配列番号2に記載する塩基配列において301番目の塩基とで挟まれてなる塩基長47,235bpからなる領域である。ここで「ハプロタイプブロックにオーバーラップする遺伝子」とは、ハプロタイプブロックの一部の領域と同じ塩基配列を有するか、またはハプロタイプブロックの全領域の塩基配列と同じ塩基配列を有する遺伝子の両方を意味する。
【0051】
かかるハプロタイプブロックにオーバーラップする遺伝子として、好適には図1に示すように、ヒト第10染色体上のFLJ20003遺伝子およびTACC2遺伝子を挙げることができる。なお、FLJ20003遺伝子は、ヒト第10染色体のゲノム配列中、塩基番号123,720,551位から123,739,533位に位置する18,982bpの遺伝子であり(Genbank Sequence Accession IDs: NM_017615、Gene Name: AF258584(Homo sapiens PP4762 mRNA,compleate cds)、その123,729,865位から123,739,533位の塩基領域が上記ハプロタイプブロックとオーバーラップする。また、TACC2遺伝子は、ヒト第10染色体のゲノム配列中、塩基番号123,754,558位から123,844,477位に位置する89,919bpの遺伝子であり(Genbank Sequence Accession IDs: NM_206862、Gene Name: AF095791(transforming, acidic coiled-coil containing protein 2)、その123,777,100位から123,844,477位の塩基領域が上記ハプロタイプブロックとオーバーラップする。
【0052】
ここで糖尿病疾患感受性SNPマーカー(特にヒト2型糖尿病疾患感受性SNPマーカー)は、ハプロタイプブロック内に位置する123,739,772位のC(シトシン)またはG(グアニン)である(以下、かかる糖尿病疾患感受性SNPマーカーを単に「SNP531」とも称する)。
【0053】
よって、本発明は、糖尿病疾患感受性遺伝子、特にヒト2型糖尿病疾患感受性遺伝子として、FLJ20003遺伝子およびTACC2遺伝子を提供する。なお、FLJ20003遺伝子の蛋白質コード領域の塩基配列を配列番号8に、またTACC2遺伝子の蛋白質コード領域の塩基配列を配列番号9に示す。
【0054】
3.糖尿病罹患性診断マーカー
本発明は、ヒト第10染色体を対象とした糖尿病疾患感受性マーカーに対する連鎖不平衡解析において、当該染色体領域内で連鎖不平衡が認められる領域であって、かつ当該糖尿病疾患感受性SNPマーカーを含む領域である上記の「ハプロタイプブロック」に存在する糖尿病疾患感受性SNPマーカー(SNP531)を含み、且つヒトゲノム上で特異的に認識されるオリゴまたはポリヌクレオチドを、糖尿病易罹患性診断マーカーとして提供する。
【0055】
これらのオリゴまたはポリヌクレオチドの長さ(塩基長)は、ヒトゲノム上で特異的に認識される長さであればよく、その限りにおいて特に制限されない。通常10塩基長以上、好ましくは20塩基長以上である。従って、ヒト第10染色体上のFLJ20003遺伝子(Genbank Sequence Accession IDs: NM_017615、123,720,551位〜123,739,533位)とTACC2遺伝子(Genbank Sequence Accession IDs: NM_206862、123,754,558位〜123,844,477位)のIntergenic領域(123,739,534位〜123,754,557位の15,024bp)の一部とオーバーラップする塩基配列において、上記ハプロタイプブロックに存在する糖尿病疾患感受性SNPマーカー(SNP531、123,739,772位)を中心として、必要に応じて、51塩基(SNP531の5'側及び3'側各25塩基ずつ)、201塩基(SNP531の5'側及び3'側各100塩基ずつ)、601塩基(SNP531の5'側及び3'側各300塩基ずつ)などとすることができる。具体的には、ヒト第10染色体上のFLJ20003遺伝子とTACC2遺伝子のIntergenic領域にオーバーラップする塩基配列において、塩基CまたはG(SNP531)を挟んで、5'側及び3'側にそれぞれ配列番号3記載の塩基配列及び配列番号4記載の塩基配列を含有する、塩基長が51〜601の範囲にあるポリヌクレオチドを例示することができる。
【0056】
ここで「Intergenic領域にオーバーラップする塩基配列」には、FLJ20003遺伝子とTACC2遺伝子との遺伝子間(Intergenic)領域に位置する全部または一部の塩基配列、及びIntergenic領域の全部または一部とそれに連続するヒト第10染色体上の領域の塩基配列が含まれる。
【0057】
これらの塩基配列で特定されるオリゴまたはポリヌクレオチド(DNA断片)は、糖尿病、特にヒト2型糖尿病の遺伝的素因マーカーである。ゆえに、当該マーカーを含む遺伝子を検出することにより、被験者における糖尿病、特にヒト2型糖尿病発症の遺伝的素因を検査・診断することができる。この意味で、上記オリゴまたはポリヌクレオチドは、糖尿病易罹患性診断マーカーとして規定され、かつ使用することができる。
【0058】
これらの糖尿病易罹患性診断マーカーの具体例としては、例えば塩基長51のマーカーの例として、配列番号10に示す塩基配列を有するポリヌクレオチドからなる糖尿病罹患性診断マーカーを、また塩基長601のマーカーの例として、配列番号11に示す塩基配列を有するポリヌクレオチドからなる糖尿病罹患性診断マーカーをそれぞれ例示することができる。
【0059】
4.糖尿病罹患の難易を検出する方法
本発明は、また被験者について糖尿病罹患の難易(糖尿病に罹り易いか罹り難いかの別)を検出する方法を提供する。本発明の糖尿病罹患の難易検出方法は、以下の工程(a)及び(b)を有するものであり、その限りにおいて、特に制限されるものではない:
(a) 検体中のゲノムDNAを抽出する工程、及び
(b) 抽出したゲノムDNAを対象として、その塩基配列に存在する、配列番号3(好ましくは配列番号6)記載の塩基配列と配列番号4(好ましくは配列番号7)記載の塩基配列により挟まれた塩基を検出し識別する工程。
【0060】
ここで、配列番号3または配列番号6で示される塩基配列は、ヒト第10染色体上のFLJ20003遺伝子とTACC2遺伝子のIntergenic領域にオーバーラップする塩基配列において、前述する糖尿病疾患感受性SNPマーカー(SNP531)(123,739,772位)の塩基の5'側(上流側)に位置する、それぞれ25塩基長または300塩基長の塩基配列に該当し、配列番号4または配列番号7で示される塩基配列は、ヒト第10染色体上のFLJ20003遺伝子とTACC2遺伝子のIntergenic領域にオーバーラップする塩基配列において、上記糖尿病疾患感受性SNPマーカー(SNP531)の塩基の3'側(下流側)に位置する、それぞれ25塩基長または300塩基長の塩基配列に該当する。すなわち、検出する対象の塩基は、配列番号3(または配列番号6)及び配列番号4(または配列番号7)で示される各塩基配列に挟まれた、糖尿病疾患感受性SNPマーカーであるSNP531(123,739,772位)の塩基である。
【0061】
当該検出によって、SNP531の塩基がC(シトシン)である場合、当該ゲノムDNA試料を提供した被験者は糖尿病、特にヒト2型糖尿病に罹患しやすい(糖尿病を発症する危険度が相対的に高い)と判断することができる。逆に、SNP531の塩基がG(グアニン)である場合、当該ゲノムDNA試料を提供した被験者は糖尿病、特にヒト2型糖尿病に罹患しにくい(糖尿病を発症する危険度が相対的に低い)と判断することができる。
【0062】
上記本発明の方法は、さらに下記の工程(c)を有することが好ましい:
(c) 配列番号3記載の塩基配列と配列番号4記載の塩基配列により挟まれた塩基がCであるかGであるかを識別し、Cである場合に糖尿病罹患に罹りやすい(糖尿病易罹患性)、またはGである場合に糖尿病罹患に罹りにくい(糖尿病難罹患性)と判定する工程。
【0063】
当該方法によれば、糖尿病易罹患性及び糖尿病難罹患性の別、すなわち糖尿病発症危険度を判定することができる。当該糖尿病発症危険度の判定は、SNP531のG→C変異を判断基準(判断指標)として医師等の専門知識を有する者の判断を要することなく、機械的に行なうことができる。このため、本発明の方法は、糖尿病の発症危険度の検出方法と言うこともできる。
【0064】
なお、上記工程(a)(ゲノムDNAの抽出)と工程(b)(目的塩基の検出)は、公知の方法〔例えば、Bruce, et al., Geneme Analysis/A laboratory Manual (vol.4), Cold Spring Harbor Laboratory, NY., (1999)〕を用いて行うことができる。
【0065】
工程(a)においてゲノムDNAの抽出を行う検体は、被験者および臨床検体等から単離されたあらゆる細胞(培養細胞を含む。但し生殖細胞は除く)、組織(培養組織を含む)、臓器、または体液(例えば、唾液、リンパ液、気道粘膜、精液、汗、尿等)などを材料とすることができる。該材料としては末梢血から分離した白血球または単核球が好ましく、特に白血球が最も好適である。これらの材料は、臨床検査において通常用いられる方法に従って単離することができる。
【0066】
例えば白血球を材料とする場合、まず被験者より単離した末梢血から常法に従って白血球を分離する。次いで、得られた白血球にプロティナーゼKとドデシル硫酸ナトリウム(SDS)を加えてタンパク質を分解、変性させた後、フェノール/クロロホルム抽出を行うことによりゲノムDNA(RNAを含む)を得る。RNAは、必要に応じてRNaseにより除去することができる。なお、ゲノムDNAの抽出は、上記の方法に限定されず、当該技術分野で周知の方法(例えば、Sambrook J. et. al., "Molecular Cloning: A Laboratry Manual (2nd Ed.)"Cold Spring Harbor Laboratory, NY)や、市販のDNA抽出キット等を利用して行なうことができる。さらに必要に応じて、ヒト第10染色体上の少なくともFLJ20003遺伝子とTACC2遺伝子のIntergenic領域のDNAを単離してもよい。当該DNAの単離は、FLJ20003遺伝子とTACC2遺伝子のIntergenic領域のDNAにハイブリダイズするプライマーを用いて、ゲノムDNAを鋳型としたPCR等によって行うことができる。
【0067】
工程(b)において、上記のようにして得られたヒトゲノムDNAを含む抽出物から、糖尿病、特にヒト2型糖尿病に極めて関連性の深い糖尿病疾患感受性SNPマーカー、すなわち上記(1)で詳説したSNP531の塩基を検出する。なお、当該塩基の検出は、ヒトゲノムDNAを含む試料からさらに単離したヒト第10染色体上のFLJ20003遺伝子とTACC2遺伝子のIntergenic領域の塩基配列を直接決定し、FLJ20003遺伝子のlocation end(Genbank Sequence Accession ID: NM_017615の配列中、123,739,533位の塩基)から上流(3'側領域)239番目、またはTACC2遺伝子のlocation begin(Genbank Sequence Accession ID: NM_206862の配列中、123,754,558位の塩基)から上流(5'側領域)14786番目に位置する塩基の変異(C/G)を調べる方法によってもよい。
【0068】
例えば目的の塩基を検出する方法としては、上記のように該当領域の遺伝子配列を直接決定する方法の他に、多型配列が制限酵素認識部位である場合は、制限酵素切断パターンの相違を利用して、遺伝子型を決定する方法(以下、RFLPという)、多型特異的なプローブを用いハイブリダイゼーションを基本とする方法(例えば、チップやガラススライド、ナイロン膜上に特定なプローブを張り付け、それらのプローブに対するハイブリダイゼーション強度の差を検出することによって、多型の種類を決定する、または、特異的なプローブのハイブリダイゼーションの効率を、鋳型2本鎖増幅時にポリメレースが分解するプローブの量を検出することにより遺伝子型を特定する方法、ある種の2本鎖特異的な蛍光色素が発する蛍光を温度変化を追うことにより2本鎖融解の温度差を検出し、これにより多型を特定する方法、多型部位特異的なオリゴプローブの両端に相補的な配列を付け、温度によって該当プローブが自己分子内で2次構造をつくるか、ターゲット領域にハイブリダイズするかの差を利用して遺伝子型を特定する方法など)がある。また、さらに鋳型特異的なプライマーからポリメレースによって塩基伸長反応を行わせ、その際に多型部位に取り込まれる塩基を特定する方法(ダイデオキシヌクレオタイドを用い、それぞれを蛍光標識し、それぞれの蛍光を検出する方法、取り込まれたダイデオキシヌクレオタイドをマススペクトロメトリーにより検出する方法)、さらに鋳型特異的なプライマーに続いて変異部位に相補的な塩基対または非相補的な塩基対の有無を酵素によって認識させる方法などがある。
【0069】
以下、従来公知の代表的な遺伝子多型の検出方法を列記するが、本発明はこれらに何ら限定されるものではない。
【0070】
(a)RFLP(制限酵素切断断片長多型)法、(b)PCR−SSCP法(一本鎖DNA高次構造多型解析)〔Biotechniques, 16, 296-297 (1994)、及びBiotechniques, 21, 510-514 (1996)〕、(c)ASO(Allele Specific Oligonucleotide)ハイブリダイゼーション法〔Clin. Chim. Acta, 189, 153-157 (1990)〕、(d)ダイレクトシークエンス法〔Biotechniques, 11, 246-249 (1991)〕、(e)ARMS(Amplification Refracting Mutation System)法〔Nuc. Acids. Res., 19, 3561-3567 (1991);Nuc. Acids. Res., 20, 4831-4837 (1992)〕、(f)変性剤濃度勾配ゲル電気泳動(Denaturing Gradient Gel Electrophoresis;DGGE)法〔Biotechniques, 27, 1016-1018 (1999)〕、(g)RNaseA切断法〔DNA Cell. Biol., 14, 87-94 (1995)〕、(h)化学切断法〔Biotechniques, 21, 216-218 (1996)〕、(i)DOL(Dye-labeled Oligonucleotide Ligation)法〔Genome Res., 8, 549-556 (1998)〕、(j)TaqMan−PCR法〔Genet. Anal., 14, 143-149 (1999);J. Clin. Microbiol., 34, 2933-2936 (1996)〕、(k)インベーダー法〔Science, 5109, 778-783 (1993);J.Biol.Chem., 30,21387-21394 (1999);Nat. Biotechnol., 17, 292-296 (1999)〕、(l)MALDI−TOF/MS法(Matrix Assisted Laser Desorption-time of Flight/Mass Spectrometry)法〔Genome Res., 7, 378-388 (1997);Eur.J.Clin.Chem.Clin.Biochem., 35, 545-548 (1997)〕、(m)TDI(Template-directed Dye-terminator Incorporation)法〔Proc. Natl. Acad. Sci. USA, 94, 10756-10761 (1997)〕、(n)モレキュラー・ビーコン(Molecular Beacons)法〔Nat. Biotechnol., 1, p49-53 (1998);遺伝子医学、4, p46-48 (2000)〕、(o)ダイナミック・アレル−スペシフィック・ハイブリダイゼーション(Dynamic Allele-Specific Hybridization;DASH)法〔Nat.Biotechnol.,1.p.87-88 (1999);遺伝子医学,4, 47-48 (2000)〕、(p)パドロック・プローブ(Padlock Probe)法〔Nat. Genet.,3,p225-232 (1998) ;遺伝子医学,4, p50-51 (2000)〕、(q)UCAN法〔タカラ酒造株式会社ホームぺージ( HYPERLINK "http://www.talara.co.jp" http://www.takara.co.jp)参照〕、(r)DNAチップまたはDNAマイクロアレイ(「SNP遺伝子多型の戦略」松原謙一・榊佳之、中山書店、p128-135)、(s)ECA法〔Anal. Chem., 72, 1334-1341, (2000)〕。
【0071】
以上は代表的な遺伝子多型検出方法であるが、本発明の糖尿病発症危険度の判定には、これらに限定されず、他の公知または将来開発される遺伝子多型検出方法を広く用いることができる。また、本発明の遺伝子多型検出に際して、これらの遺伝子多型検出方法を単独で使用してもよいし、また2以上を組み合わせて使用することもできる。
【0072】
なお、SNP587のタイピングには、実施例で示すように、好適には、順方向のプライマーとして配列番号12に記載する塩基配列を有するオリゴヌクレオチドを、逆方向のプライマーとして配列番号13に記載する塩基配列を有するオリゴヌクレオチドを、VICプローブとして配列番号14に記載する塩基配列を有するオリゴヌクレオチドを、さらにFAMプローブとして配列番号15に記載する塩基配列を有するオリゴヌクレオチドを用いて、TaqMan法を行うことによって実施することができる(実施例参照)。
【0073】
本発明の方法によって、糖尿病を発症する潜在的な危険度が相対的に高いことが判明した被験者に対しては、その旨を告知し、予め糖尿病の発症を防ぐための的確な対策を講じることができる。従って、本発明は、糖尿病の発症を予防するための、さらには糖尿病合併症の予防のための検査方法として極めて有用である。
【0074】
5.糖尿病易罹患性検出用試薬、これを含むキット
(1)プローブ
目的とする塩基(糖尿病疾患感受性SNPマーカー、SNP531)並びに当該塩基を含むヌクレオチドの検出には、ヒト第10染色体のFLJ20003遺伝子とTACC2遺伝子のIntergenic領域の、糖尿病疾患感受性SNPマーカー(SNP531)を含むオリゴまたはポリヌクレオチドに特異的にハイブリダイズし、当該SNPマーカー(SNP531)を検出することができるオリゴまたはポリヌクレオチドが用いられる。かかるオリゴまたはポリヌクレオチドは、上記FLJ20003遺伝子とTACC2遺伝子のIntergenic領域の、SNP531を含む16〜500塩基長、好ましくは20〜200塩基長、より好ましくは20〜50塩基長の連続した遺伝子領域と、特異的にハイブリダイズするように、上記塩基長を有するオリゴまたはポリヌクレオチドとして設計される。
【0075】
ここで「特異的にハイブリダイズする」とは、通常のハイブリダイゼーション条件下、好ましくはストリンジェントなハイブリダイゼーション条件下(例えば、サムブルックら、Molecular Cloning, Cold Spring Harbour Laboratory Press, New York, USA, 第2版、1989に記載の条件)において、他のDNAとクロスハイブリダイゼーションを有意に生じないことを意味する。好適には当該オリゴまたはポリヌクレオチドは、上記検出するSNP531を含む遺伝子領域の塩基配列に対して相補的な塩基配列を有することが望ましいが、かかる特異的なハイブリダイゼーションが可能であれば、完全に相補的である必要はない。
【0076】
かかるオリゴまたはポリヌクレオチドとしては、ヒト第10染色体上のFLJ20003遺伝子とTACC2遺伝子のIntergenic領域にオーバーラップする配列番号5に記載する塩基配列において、301番目に位置するヌクレオチドを含む16〜500塩基長の連続したオリゴまたはポリヌクレオチド(但し、当該ヌクレオチドがRNAである場合、配列表中の塩基記号「t」は「u」に読み替えるものとする)にハイブリダイズする16〜500塩基長のオリゴまたはポリヌクレオチドを挙げることができる。
【0077】
当該オリゴまたはポリヌクレオチドは、被験者について糖尿病、特にヒト2型糖尿病に対する易罹患性の有無を判定するために、ヒト第10染色体上のFLJ20003遺伝子とTACC2遺伝子のIntergenic領域に位置する糖尿病疾患感受性SNPマーカー(SNP531)を含むオリゴヌクレオチドに特異的にハイブリダイズするオリゴまたはポリヌクレオチド「プローブ」として設計される。なお、これらのオリゴまたはポリヌクレオチドは、ヒト第10染色体上のFLJ20003遺伝子とTACC2遺伝子のIntergenic領域の塩基配列に基づいて、例えば市販のヌクレオチド合成機によって常法に従って作成することができる。
【0078】
さらに好ましくは、当該プローブは、SNP531を含むオリゴヌクレオチドが検出できるように、放射性物質、蛍光物質、化学発光物質、または酵素等で標識される(後述)。
【0079】
上記プローブ(オリゴまたはポリヌクレオチド)は任意の固相に固定化して用いることもできる。このため本発明はまた、上記プローブ(オリゴまたはポリヌクレオチド)を固定化プローブ(例えばプローブを固定化した遺伝子チップ、cDNAマイクロアレイ、オリゴDNAアレイ、メンブレンフィルター等)として提供するものである。当該プローブは、好適には糖尿病疾患感受性遺伝子検出用のDNAチップとして利用することができる。
【0080】
固定化に使用される固相は、オリゴまたはポリヌクレオチドを固定化できるものであれば特に制限されることなく、例えばガラス板、ナイロンメンブレン、マイクロビーズ、シリコンチップ、キャピラリーまたはその他の基板等を挙げることができる。固相へのオリゴまたはポリヌクレオチドの固定は、予め合成したオリゴまたはポリヌクレオチドを固相上に載せる方法であっても、また目的とするオリゴまたはポリヌクレオチドを固相上で合成する方法であってもよい。固定方法は、例えばDNAマイクロアレイであれば、市販のスポッター(Amersham社製など)を利用するなど、固定化プローブの種類に応じて当該技術分野で周知である〔例えば、photolithographic技術(Affymetrix社)、インクジェット技術(Rosetta Inpharmatics社)によるオリゴヌクレオチドのin situ合成等〕。
【0081】
例えば、ASO法の一例であるTaqMan PCR法〔Livak KJ. Gene Anal 14, 143 (1999), Morris T et al., J Clin Microbiol 34, 2933 (1996)〕の場合、糖尿病疾患感受性SNPマーカー(SNP531)を含む領域に相補的な20塩基長程度のオリゴヌクレオチドがプローブとして設計される。当該プローブは、5'末端を蛍光色素、3'末端を消光物質により標識され、検体DNAと特異的にハイブリダイズするが、そのままでは発光せず、別に加えられたPCRプライマーの上流からの伸長反応により5'側の蛍光色素結合が切断され、遊離した蛍光色素により検出される。
【0082】
ASO法の別の1例であるInvade法〔Lyamichev V. et al., Nat Biotechnol 17, 292 (1999)〕では、多型部位に隣接する配列(3'側と5'側の2種)に相補的なオリゴヌクレオチドがプローブとして設計される。検出は、これら2種のプローブと検体とは無関係な第3のプローブによって達成される。
【0083】
(2)プライマー
本発明は、またヒト第10染色体のFLJ20003遺伝子とTACC2遺伝子のIntergenic領域に存在する糖尿病疾患感受性SNPマーカー(SNP531)を含む配列領域を特異的に増幅するためのプライマーとして用いられるオリゴヌクレオチドを提供する。
【0084】
このようなプライマー(オリゴヌクレオチド)は、FLJ20003遺伝子とTACC2遺伝子のIntergenic領域において、SNP531のヌクレオチドを含む連続したオリゴまたはポリヌクレオチドの1部に特異的にハイブリダイズし、当該オリゴまたはポリヌクレオチドを特異的に増幅するための15〜30塩基長、好ましくは18〜25塩基長程度のオリゴヌクレオチドとして設計される。増幅するオリゴまたはポリヌクレオチドの長さは、用いられる検出方法に応じて適宜設定されるが、一般的には15〜1000塩基長、好ましくは20〜500塩基長、より好ましくは20〜200塩基長である。
【0085】
以上のことから、ヒト第10染色体のFLJ20003遺伝子とTACC2遺伝子のIntergenic領域上の、糖尿病疾患感受性SNPマーカー(SNP531)近傍の15塩基以上連続した塩基配列に特異的にハイブリダイズする塩基配列を有するオリゴヌクレオチドは、本発明においてプライマーとして利用することができる。なお、これらのオリゴヌクレオチドは、FLJ20003遺伝子とTACC2遺伝子のIntergenic領域の塩基配列に基づいて、例えば市販のヌクレオチド合成機によって常法に従って作成することができる。
【0086】
Mass Array法にMALDI-TOF/MS(Matrix-Assisted Laser Desorption Ionization Time-Of-Flight Mass Spectrometry)を応用した方法〔Haff LA et al. Genome Res 7, 378 (1997), Little DP et al., Nature Medicine vol.3, No.12, 1413-1416, (1997)〕を例にとって、プライマーの具体的な利用方法を説明する。この場合、シリコンチップ上に固定した検体DNAに前記プライマーをハイブリダイズさせ、ddNTPを添加して一塩基だけを伸長させる。次いで、一塩基伸長産物を分離し、質量分析法により多型を検出する。この方法では、プライマーは通常15塩基長以上で可能な限り短く設計することが望ましい。
【0087】
(3)標識物
上記本発明のプローブまたはプライマーには、遺伝子多型検出のための適当な標識物、例えば蛍光色素、酵素、タンパク質、放射性同位体、化学発光物質、ビオチン等が付加されたものが含まれる。
【0088】
なお、本発明において用いられる蛍光色素としては、一般にヌクレオチドを標識して、核酸の検出や定量に用いられるものが好適に使用でき、例えば、HEX(4,7,2',4',5',7'-hexachloro-6-carboxylfluorescein、緑色蛍光色素)、フルオレセイン(fluorescein)、NED(商品名、アプライドバイオシステムズ社製、黄色蛍光色素)、あるいは、6−FAM(商品名、アプライドバイオシステムズ社製、黄緑色蛍光色素)、ローダミン(rhodamin)またはその誘導体〔例えば、テトラメチルローダミン(TMR)〕を挙げることができるが、これらに限定されない。蛍光色素でヌクレオチドを標識する方法は、公知の標識法のうち適当なものを使用することができる〔Nature Biotechnology, 14, 303-308 (1996)参照〕。また、市販の蛍光標識キットを使用することもできる(例えば、アマシャム・ファルマシア社製、オリゴヌクレオチドECL 3'−オリゴラベリングシステム等)。
【0089】
また、本発明のプライマーには、その末端に多型検出のためのリンカー配列が付加されたものも含まれる。このようなリンカー配列としては、例えば、前述したインベーダー法で用いられるオリゴヌクレオチド5'末端に付加される、フラップ(多型近傍の配列とは全く無関係な配列)等が挙げられる。
【0090】
本発明の1つの実施形態である、遺伝子多型検出法としてTaqMan−PCR法を用いる場合、糖尿病疾患感受性SNPマーカー(SNP531)を含む塩基配列を検出するためのフォワードプライマー(順方向のプライマー)としては、好適には配列番号12に示す塩基配列を有するオリゴヌクレオチドの他、配列番号5に示す塩基配列において1〜300番の領域に位置する塩基配列にハイブリダイズする15塩基長以上(好ましくは15〜30塩基長)の連続した塩基配列を有するオリゴヌクレオチドを例示することができる。また、リバースプライマー(逆方向のプライマー)としては、好適には配列番号13に示す塩基配列を有するオリゴヌクレオチドの他、配列番号5に示す塩基配列において302〜601番の領域に位置する塩基配列にハイブリダイズする15塩基長以上(好ましくは15〜30塩基長)の連続した塩基配列を有するオリゴヌクレオチドを例示することができる。
【0091】
以上の、プローブまたはプライマー(標識されていてもよい)は、糖尿病易罹患性検出用試薬として利用することができる。
【0092】
(4)糖尿病易罹患性検出用試薬キット
本発明はまた、上記糖尿病易罹患性検出用試薬をキットとして提供するものである。当該キットは、上記プローブまたはプライマーとして用いられるオリゴまたはポリヌクレオチド(なお、これらは標識されていても、また固相に固定化されていてもよい)を少なくとも1つ含むものである。本発明のキットは上記プローブまたはプライマーの他、必要に応じてハイブリダイゼーション用の試薬、プローブの標識、ラベル体の検出剤、緩衝液など、本発明の方法の実施に必要な他の試薬、器具などを適宜含んでいてもよい。
【0093】
6.糖尿病発症リスク低減方法
上記に説明するように、本発明によりヒト第10染色体のFLJ20003遺伝子とTACC2遺伝子のIntergenic領域に位置する糖尿病疾患感受性SNPマーカー(SNP531)(123,739,772位)の塩基の変異(G→C)が糖尿病、特にヒト2型糖尿病の発症(易罹患性)に大きく関わっていることが判明した。このことから、当該SNP531部位の変異(G→C)を正常な状態に戻す(C→G)ことによって、糖尿病、特にヒト2型糖尿病の発症危険度(易罹患性)を低減することができる。
【0094】
こうした考えのもとで、本発明は糖尿病発症リスク低減方法並びに当該糖尿病発症リスク低減に有効な成分を提供するものでもある。なお、糖尿病発症リスク低減方法は、同様の考えのもと、糖尿病の発症を予防する方法(糖尿病予防方法)並びに糖尿病を改善する方法(糖尿病改善方法)として位置づけることができる(本発明における「糖尿病発症リスク低減方法」には、「糖尿病予防方法」及び「糖尿病改善方法」がいずれも含まれるものとする)。当該方法は、被験者のゲノムDNAのヒト第10染色体のFLJ20003遺伝子とTACC2遺伝子のIntergenic領域に位置する糖尿病疾患感受性SNPマーカー(SNP531)(123,739,772位)に位置する塩基をC(シトシン)からG(グアニン)に変異させることによって達成できる。上記目的が達成できる方法であれば、具体的な手法は特に制限されず、従来公知の方法並びに将来開発される手法がいずれも使用できる。
【0095】
7.糖尿病発症リスク低減に有効な成分をスクリーニングする方法
また、本発明は、上記糖尿病発症リスク低減方法(糖尿病予防方法、糖尿病改善方法)を実現するために有用な医薬品や食品を開発するために有効な方法、具体的には糖尿病発症リスクを低減させるのに(糖尿病を予防または糖尿病を改善するために)有効な候補物質を選別するための方法(スクリーニング方法)を提供する。
【0096】
当該スクリーニングは、例えば下記の工程によって実施することができる:
(1) ヒト第10染色体のFLJ20003遺伝子とTACC2遺伝子のIntergenic領域、またはその領域の一部を含む領域であって、少なくとも塩基C(シトシン)を挟んで5'側及び3'側にそれぞれ配列番号6記載の塩基配列及び配列番号7に記載の塩基配列を含有するポリヌクレオチドを含有する細胞に対して、被験物質を投与する工程、及び
(2) 投与した被験物質の中から、当該細胞中の上記ポリヌクレオチドの配列番号6記載の塩基配列と配列番号7記載の塩基配列に挟まれた塩基C(シトシン)をG(グアニン)に変換させる物質を、候補物質として選択する工程。
【0097】
なお、上記(2)の工程(候補物質の選択工程)は、ヒト第10染色体のFLJ20003遺伝子とTACC2遺伝子のIntergenic領域に位置する糖尿病疾患感受性SNPマーカー(SNP531)(123,739,772位)の塩基の変換(C→G)を直接評価する方法に限らず、間接的にそれが評価できる方法であればよい。例えば、当該SNP531部位の塩基がCからGに変換することによって、生じる(増加する)〔または消失(低下)する〕機能、活性または特定の蛋白質量を測定する方法を例示することができる。
【0098】
上記工程(1)で使用される細胞は、ヒト第10染色体のFLJ20003遺伝子とTACC2遺伝子のIntergenic領域、またはその領域の一部を有する塩基配列を導入することができ、且つそれを安定に保有し得る細胞であればよく、その由来(例えば、原核細胞及び真核成分の別や、昆虫細胞及び動物細胞の別など)は特に制限されない。なお、遺伝子導入や細胞培養等は、当業界において従来公知の方法を任意に使用して実施することができる〔例えば、Maniatis, T. et al., "Molecular Cloning- A Laboratory Manual", Cold Spring Harbor Laboratry, NY, 1982; WO2002-52000;「新生化学実験講座18 細胞培養技術」日本生化学会編、東京化学同人、1990等〕。当該細胞は、糖尿病発症リスクを低減させるのに有効な候補物質を選別するための方法(スクリーニング方法)においてスクリーニングツールとして有効に利用することができる。
【0099】
当該方法で用いられる被験物質としても特に制限されない。例えば、天然化合物、有機化合物、無機化合物、タンパク質及びペプチド等の単一化合物;並びに化合物ライブラリー、遺伝子ライブラリーの発現産物、細胞抽出物、細胞培養上清、発酵微生物産生物、海洋生物抽出物、植物抽出物等の組成物を例示することができる。
【0100】
(2)の工程(候補物質の選択工程)で選択された候補物質は、必要に応じてさらに他の薬理試験や臨床試験並びに毒性試験を経ることによって、よりヒトに対して有効で且つ安全な糖尿病発症のリスク低減剤(糖尿病予防薬、糖尿病の改善薬、健康食品)の有効成分として取得することができる。
【0101】
斯くして得られる候補物質は、公知の方法によって処方並びに製剤化することによって糖尿病発症のリスク低減剤(糖尿病予防薬、糖尿病の改善薬、または健康食品)として提供することができる。
【発明の効果】
【0102】
本発明によれば、糖尿病、特に2型糖尿病を発症する相対的な危険度を簡便に判定することができる。本発明の判定方法は、in vitroでしかも医師等の専門的な知識を要することなく簡単に実施することができる方法である。本発明の判定方法によって糖尿病を発症する潜在的な危険度が相対的に高いことが判明した被験者に対しては、その旨を告知し、予め糖尿病の発症を防ぐための的確な対策を講じることができる。従って、本発明は、糖尿病の発症を予防するための、さらには糖尿病合併症の予防のための検査方法として極めて有用である。
【0103】
さらに本発明は上記判定法において使用される試薬を提供するものであり、これにより上記方法を簡便に実施することが可能となる。
【0104】
また本発明によれば、本発明によって得られた糖尿病の発症に関連した新規遺伝子多型を利用した糖尿病発症リスク低減方法が提供できる。当該リスクの低減は、糖尿病の発症を予防したり、また発症した糖尿病の改善に有効に利用することができる。さらに本発明は糖尿病発症リスクを低減する有効成分のスクリーニング方法を提供するものであり、当該方法によれば有効成分の取得によって、糖尿病発症リスクの低減、ひいては糖尿病予防又は治療に有効な医薬品を開発することが可能である。
【発明を実施するための最良の形態】
【0105】
以下、本発明を実施例により更に具体的に説明する。但し、本発明はこれらの実施例によって何ら限定されるものではない。
【実施例1】
【0106】
ヒト2型糖尿病遺伝子の同定
ヒト2型糖尿病は、従来から熱心に研究がされており、特にその連鎖解析は多数報告されている〔Bektas A et al., Diabetes 48(11) 2246-51 (1999); Bektas A et al., Diabetes 50(1) 204-8 (2001); Pratley RE et al., J Clin Invest 101(8) 1757-64 (1998); Ehm MG et al., Am J Hum Genet 66(6) 187-81 (2000); Wiltshire S et al., Am J Hum Genet 69(3) 553-69 (2001)〕。
【0107】
本発明では、ヒト第10染色体の10q25−10q26の領域を、複数の異なる研究・異なる人種で共通して認められるヒト2型糖尿病疾患感受性領域を同定するための対象候補領域として用いて、以下の実験を行った。
【0108】
1.試料
健常者集団(対照集団)及び糖尿病罹患者集団は、糖尿病疾患感受性遺伝子を特定する人種と同じ人種で構成されている必要があり、例えば、日本人の糖尿病疾患感受性遺伝子を同定するには、対照集団もまた日本人の健常者で構成されている必要がある。こうした観点から、本発明では日本人非血縁2型糖尿病患者及び日本人非血縁健常者(対照者)を対象とし、これらの対象者から末梢血を採取し、常法により全ゲノムDNAを抽出したものを試料とした。
【0109】
2. 日本人非血縁健常者(対照者)についてのSNPsタイピング
日本人非血縁健常者(対照者)に由来する試料46例について、対象候補領域に対してSNPsタイピングを行った。SNPsタイピングは、一部Assay-on-Demand(登録商標:アプライドバイオシステムズ製)を利用し、TaqMan法によって行った。また、Dual384-well GeneAmp(登録商標)PCR System 9700(アプライドバイオシステムズ製)及びABI PROSM(登録商標)7900HT Sequence Detection System(アプライドバイオシステムズ製)の機器を用いた。
【0110】
なお、反応条件はABI PRISM(登録商標)7900HT Sequence Detection System(アプライドバイオシステムズ製)に添付の説明書に従った。反応系組成及びPCRの条件は、それぞれ表1及び表2に示すとおりである。
【0111】
【表1】

【0112】
【表2】

【0113】
SNPsタイピングの結果、対象候補領域内に、マイナーアレルの遺伝子頻度が15%以上であり、かつ各SNP間の距離が10kb程度のSNPが924個選択された(Japanese Common SNPs)。
【0114】
3.関連解析
次いで、信頼性が確認されたSNPsマーカー(Japanese Common SNPs)及びタイピングデータを用いて関連解析を行った。なお、このSNPsマーカー(Japanese Common SNPs)は、これまで当業界で比較的多用されているエクソン領域に偏って設定されたマーカーとは異なり、イントロン、非翻訳領域、遺伝子上流・下流領域を含めてほぼ等間隔に設定されたマーカーセットであり、その遺伝子領域の連鎖不平衡等の情報を効率的に把握することができるものである。
【0115】
なお、関連解析は、多重検定による偽陽性率の増加を抑制するために2つのステージに分けて行った。具体的には、下記に示すように、2型糖尿病患者集団と健常者(対照者)集団をそれぞれ2つの独立したパネルセット(第1セットと第2セットの2セット)に分割し、第1セットについて1次関連解析を行い、さらに第2セットについて2次関連解析を行った。詳細には、最初の1次関連解析(第1ステージ)では有意水準を緩くすることで検出力を上げ、偽陽性検出も含めて幅広く検出し、そして、引き続いて実施する2次関連解析(第2ステージ)では1次関連解析で選択されたSNPsマーカーのみを対象として、通常の有意水準で糖尿病感受性SNPsを検出し、特定する。2次関連解析で1次関連解析で選択されたSNPsマーカーのみを対象とした。こうすることによって、多重検定による偽陽性率の増加を効果的に抑えることが可能となる。
【0116】
(1)1次関連解析:第1ステージ
先に得られた924SNPs(100%)を対象に、日本人非血健常者(対照者)由来の試料164例および日本人非血縁2型糖尿病患者由来の試料164例について関連解析(第1ステージ;遺伝子頻度でのχ2検定)を行った。
【0117】
その結果、P<0.05となったのは55SNPs、P<0.01となったのは18SNPsであった。これを含めP<0.10を示した125SNPs(全体の13.52%)を、次の関連解析(第2ステージ)の対象候補SNPsとした。なお、かかるP値は、値が大きければ疾患との関連性が低く、小さければ関連性が高いことを示す。しかし、P値があまりにも小さいものだけを選択すると、糖尿病感受性SNPsマーカーの検出力を著しく低下させ、候補SNPsの数が少なくなりすぎる危険がある。従って第1ステージでの候補SNPsの選択は、当該疾患感受性を示す可能性のあるマーカーSNPsを統計学的偽陽性によって検出されたものをも含めて幅広く広い上げた。
【0118】
なお、各SNPsのタイピングは、Assays-on-Demand(登録商標;アプライドバイオシステムズ製)を利用したり、dbSNPデータベース等を用いて、当該SNPsの周辺配列を知り、適宜、プライマー等を設計し、常法により行うことができる。
【0119】
(2)2次関連解析;第2ステージ
上記で選択された125個(全体の13.52%)の候補SNPsについて、上記第1ステージで用いた集団とは異なる日本人非血縁健常者(対照者)集団に由来する試料262例および日本人非血縁2型糖尿病患者集団に由来する試料204例を対象に2次関連解析(第2ステージ)を行った。ここではより厳しい条件である、P<0.05を採用した。その結果、2型糖尿病疾患感受性SNPとして4つのSNPs(全体の0.43%)が選択された。
【0120】
そこで、総サンプル〔日本人非血縁健常者(対照者)集団に由来する試料368例、および日本人非血縁2型糖尿病患者集団に由来する試料426例〕の関連解析にて糖尿病と遺伝子多型の関連の有無を確認した結果、3SNPs(全体の0.32%)が糖尿病疾患感受性SNPsであると判断された。
【0121】
下記表3に、選択された3つのSNPsのうち、SNP531について、アレル含有率(アレル1、アレル2)、ハーディ−ワインベルグ平衡検定におけるP値(HWE-P)、ローリスクアレルに対するハイリスクアレルのオッズ比(OR)を示す。当該SNP531は、ハーディ−ワインベルグ平衡状態を満たし、ヒト2型糖尿病との関連が確認された。
【0122】
【表3】

【0123】
【表4】

【0124】
6.連鎖不平衡解析
次いで、連鎖不平衡解析により2型糖尿病感受性遺伝子を同定する。
【0125】
本発明では、上記で選択された2型糖尿病疾患感受性SNPマーカー(SNP531)について、その近傍にある20個のSNPs(SNP525−SNP530、SNP532−SNP545)とともに、連鎖不平衡解析を行った。
【0126】
解析対象サンプルとして、日本人非血縁健常者(対照者)由来の試料164例を用いた。なお、解析には、SNP疾患関連解析ソフト「SNPA1yze ver.2.1」(株式会社ダイナコム製)を用い、一部EM法を利用した連鎖不平衡係数|D'|(pair-wise LD coefficient)を算出して解析をした。
【0127】
(1)SNP531及びSNP531近傍での連鎖不平衡解析
解析対象SNPsとしてSNP525−SNP545の21個のSNPsを用いて連鎖不平衡解析を行った。結果を図2に示す。図2は、2SNPs間の連鎖不平衡係数|D'|の一覧と、各SNPsの相対的な位置を示す模式図である。
【0128】
この結果から、対象候補領域内でSNPsが連鎖している領域(互いに強い連鎖不平衡が認められるSNPsマーカー群を含むハプロタイプブロック)を特定した。当該ハプロタイプブロックの特定は、連鎖不平衡の強度を指標として当業者が適宜行うことができるが、例えばガブリエルらの報告〔Gabriel SB et al., Science 296 (5576): 2225-2229 (2002)〕に準じて行うことができる。特定するハプロタイプブロックは、殆ど歴史的組み換えが認められないゲノム範囲であり、その領域内では強い連鎖不平衡が存在すると考えられる。通常、|D'|の95%信頼区間の上限が0.9未満の場合、その領域は「歴史的組み換えの証拠がある」領域として判断され、一方、|D'|の95%信頼区間の上限が0.98を超え、その下限が0.7より上である場合、その領域は「強い連鎖不平衡が存在する」領域として判断できる。斯くしてハプロタイプブロックが特定されれば、例えばその領域について対象としたゲノムに関するデータベース等を利用して、当該ハプロタイプブロックに存在する遺伝子を特定することができる。
【0129】
本発明では、2型糖尿病疾患感受性SNPマーカー(SNP531)を含むSNP525−SNP545の21個のSNPsマーカーについて、全て2SNPs間の組み合わせについて連鎖不平衡係数|D'|を算出し、|D'|>0.90を示す組み合わせを選択した。図1に示すように、少なくともSNP530からSNP534を含む47.235kb程度に亘り、|D'|>0.90を示す連鎖不平衡の非常に強いハプロタイプブロックが形成されていることが示された。このハプロタイプブロックは、ゲノム解析上、ヒト第10染色体に存在するFLJ20003遺伝子及びTACC2遺伝子の一部を含む領域であることがわかった。斯くして、FLJ20003遺伝子及びTACC2遺伝子は、ヒト2型糖尿病感受性遺伝子であることが同定された。
【実施例2】
【0130】
ヒト2型糖尿病疾患感受性遺伝子の解析
実施例1で同定されたヒト2型糖尿病疾患感受性遺伝子は、ヒト第10染色体上に位置するFLJ20003遺伝子(Genbank Sequence Accession 番号:NM_017615)またはTACC2遺伝子(Genbank Sequence Accession 番号:NM_206862)であることがわかった。FLJ20003遺伝子及びTACC2遺伝子の塩基配列はいずれも、Genbankにおいて公表されている。
【実施例3】
【0131】
FLJ20003遺伝子とTACC2遺伝子のIntergenic領域に位置する多型と糖尿病との関連
ヒト第10染色体のFLJ20003遺伝子とTACC2遺伝子のIntergenic領域に存在する遺伝子多型(SNP531)と2型糖尿病との関連を関連解析法(アソシーエーション法)により解析した。有意差検定には、χ2乗法を用いた(フィッシャーら、バイオスタティスティクス(Biostatistics)、John Willey & Sons社、1993年、「基礎医学統計学 改訂第4版」、加納克己、高橋秀人共著、南江堂、1995年)。有意水準は危険率5%とし、危険率5%未満のものを有意差ありと判断した。
【0132】
◇2型糖尿病とFLJ20003遺伝子とTACC2遺伝子のIntergenic領域に位置するSNP531との関係
日本人の健常者426名、日本人のヒト2型糖尿病患者367名について、FLJ20003遺伝子またはTACC2遺伝子のIntergenic領域に位置するSNP531部位におけるアレル頻度を算出し、アソシエーション法によりヒト2型糖尿病との関連を解析した。結果を表5に示す。
【0133】
【表5】

【0134】
表5において、FLJ20003遺伝子とTACC2遺伝子のIntergenic領域に位置するSNP531の塩基がシトシンの場合は「C」、グアニンの場合は「G」として記載されている。表5の結果から、健常者とヒト2型糖尿病患者との間において、SNP531の塩基の多型のアレル頻度が統計的に有意に異なることが示された。このことは、FLJ20003遺伝子とTACC2遺伝子のIntergenic領域に位置するSNP531の塩基の多型を調べることによって、糖尿病を発症する相対的危険度を判定できることを確かに示すものである。
【図面の簡単な説明】
【0135】
【図1】ヒト第10染色体上の糖尿病疾患感受性遺伝子(FLJ20003遺伝子、TACC2遺伝子)、糖尿病疾患感受性SNPマーカー(SNP531)、及びハプロタイプブロックの位置関係を示す模式図である。
【図2】糖尿病疾患感受性SNPマーカー(SNP531)を含む、2SNPs間の連鎖不平衡係数|D'|の一覧および各SNPsの相対的な位置を示す模式図を示す図である。

【特許請求の範囲】
【請求項1】
ヒト第10染色体を対象とした糖尿病疾患感受性SNPマーカーに対する連鎖不平衡解析において、当該染色体領域内で連鎖不平衡が認められる領域であって、かつ糖尿病疾患感受性SNPマーカーを含む領域である下記に示すハプロタイプブロックにオーバーラップする遺伝子であって、当該ハプロタイプブロックの塩基配列の一部またはすべてを含有する糖尿病疾患感受性遺伝子:
− ヒト第10染色体のゲノム配列中、配列番号1に記載の塩基配列において301番 目の塩基と、配列番号2に記載の塩基配列において301番目の塩基とで挟まれてな る47,235bpからなるハプロタイプブロック。
【請求項2】
FLJ20003遺伝子またはTACC2遺伝子である、請求項1記載の糖尿病疾患感受性遺伝子。
【請求項3】
ヒト第10染色体上のFLJ20003遺伝子とTACC2遺伝子のIntergenic領域を含む塩基配列において、塩基CまたはGを挟んで、5'側及び3'側にそれぞれ配列番号3記載の塩基配列及び配列番号4記載の塩基配列を含有する最長601塩基長のオリゴまたはポリヌクレオチドからなる、糖尿病易罹患性診断マーカー。
【請求項4】
以下の工程(a)及び(b)を含む糖尿病罹患の難易を検出する方法:
(a) 検体中のゲノムDNAを抽出する工程、及び
(b) 抽出したゲノムDNAを対象として、その塩基配列に、配列番号3記載の塩基配列と配列番号4記載の塩基配列により挟まれた塩基を検出し、識別する工程。
【請求項5】
さらに下記の工程(c)を含む、請求項4記載の糖尿病罹患の難易を検出する方法:
(c) 配列番号3記載の配列と配列番号4記載の配列により挟まれた塩基がCであるかGであるかを識別し、Cである場合に糖尿病易罹患性、またはGである場合に糖尿病難罹患性であると判定する工程。
【請求項6】
糖尿病がヒト2型糖尿病である、請求項4または5に記載する糖尿病罹患の難易を検出する方法。
【請求項7】
ヒト第10染色体上のFLJ20003遺伝子とTACC2遺伝子のIntergenic領域にオーバーラップする配列番号5に記載する塩基配列において、301番目に位置するヌクレオチドを含む16〜500塩基長の連続したオリゴ若しくはポリヌクレオチド(但し、当該オリゴ若しくはポリヌクレオチドがRNAである場合、配列表中の塩基記号「t」は「u」に読み替えるものとする)にハイブリダイズする16〜500塩基長のオリゴ若しくはポリヌクレオチド、またはその標識物。
【請求項8】
糖尿病罹患の難易を判定するために用いられる、請求項7のオリゴ若しくはポリヌクレオチド、またはその標識物からなるプローブ。
【請求項9】
ヒト第10染色体上のFLJ20003遺伝子とTACC2遺伝子のIntergenic領域において、配列番号5に記載する塩基配列の301番目に位置する塩基を検出し識別するために用いられる、請求項8に記載するプローブ。
【請求項10】
任意の固相に固定してなる固相化プローブである請求項8または9に記載するプローブ。
【請求項11】
ヒト第10染色体上のFLJ20003遺伝子とTACC2遺伝子のIntergenic領域にオーバーラップする配列番号5に記載する塩基配列において、301番目に位置するヌクレオチドを含む16塩基長以上の連続したオリゴ若しくはポリヌクレオチド(但し、当該オリゴ若しくはポリヌクレオチドがRNAである場合、配列表中の塩基記号「t」は「u」に読み替えるものとする)にハイブリダイズし、当該オリゴ若しくはポリヌクレオチドを特異的に増幅するために用いられる15〜30塩基長のオリゴヌクレオチド、またはその標識物。
【請求項12】
糖尿病罹患の難易を判定するために用いられる、請求項11のオリゴヌクレオチドまたはその標識物からなるプライマー。
【請求項13】
ヒト第10染色体上のFLJ20003遺伝子とTACC2遺伝子のIntergenic領域において、配列番号5に記載する塩基配列の301番目に位置するヌクレオチドを検出し識別するために用いられる、請求項12に記載するプライマー。
【請求項14】
請求項8乃至10のいずれかに記載するプローブ、または/及び請求項12または13に記載するプライマーを含む、糖尿病易罹患性検出用試薬、または当該試薬を含むキット。
【請求項15】
下記の工程を有する、糖尿病発症のリスク低減に有効な成分をスクリーニングする方法:
(1) ヒト第10染色体のFLJ20003遺伝子とTACC2遺伝子のIntergenic領域、またはその領域の一部を含む領域であって、少なくとも、塩基Cを挟んで5'側及び3'側にそれぞれ配列番号6記載の塩基配列及び配列番号7記載の塩基配列を含有するポリヌクレオチドを含有する細胞に対して、被験物質を投与する工程、及び
(2) 投与した被験物質の中から、当該細胞中の上記ポリヌクレオチドの配列番号6記載の塩基配列と配列番号7記載の塩基配列に挟まれた塩基CをGに変換させる物質を、候補物質として選択する工程。


【図1】
image rotate

【図2】
image rotate


【公開番号】特開2006−254738(P2006−254738A)
【公開日】平成18年9月28日(2006.9.28)
【国際特許分類】
【出願番号】特願2005−74074(P2005−74074)
【出願日】平成17年3月15日(2005.3.15)
【出願人】(304020292)国立大学法人徳島大学 (307)
【Fターム(参考)】