説明

二段階プール法による形質関連塩基配列の性質の探索法

【課題】二段階プール法による形質関連塩基配列の性質の探索法の提供。
【解決手段】1.選択した複数の形質について、形質ごとにDNAプール(第一段階プール)を作成し、2.これを試料として形質ごとに特異的なDNA断片プール(第二段階プール)を作成し、3.高速シークエンサーによってDNA断片の塩基配列を決定した後に、塩基配列の類似性に基づき、その由来するDNAプール(第一段階プール)とターゲット塩基配列を特定する二段階プール法による形質関連塩基配列の性質の探索法。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、二段階プール法による形質関連塩基配列の性質の探索法に関する。さらに詳しくは、1.選択した複数の形質について一つの形質の一つの表現型ごとにDNAプール(第一段階プール)を作成し、2.これを試料としてPCRにより、形質ごとに特異的なDNA断片を得た上で、複数の形質の表現型に由来するDNA断片を混合したDNA断片プール(第二段階プール)を作成し、3.高速シークエンサーによってDNA断片の塩基配列を決定した後に、塩基配列の類似性に基づき、その由来するDNAプール(第一段階プール)とターゲット塩基配列を特定することによる二段階プール法による形質関連塩基配列の性質の探索法に関する。
【背景技術】
【0002】
ヒトゲノムの塩基配列は約3ギガあることが知られており、この全塩基配列の決定のために、従来、年単位での解析事業が行われてきた。しかし、近年、高速シークエンサー(次世代シークエンサー、高速並列シークエンサー、ギガシークエンサーなどとも呼ばれる)の開発が進み、高速シークエンサーであれば、1週間以内にヒトゲノムの全塩基配列決定が可能となる等、以前より高速にDNAの塩基配列を決定することが可能となってきた。高速シークエンサーについての技術革新は日進月歩で行われており、塩基配列決定速度はさらに速くなることが期待されており、1週間に1テラ(10の12乗)の塩基配列決定も夢ではないといわれている。
【0003】
しかし、これらの塩基配列決定機の用途には課題が多く、少数の人間の全ゲノムを決定しても、それだけでは有用な遺伝子が見出される可能性は低い。それは、約千塩基に一つのSNP(single−nucleotide polymorphism)が見られる等、個人間のゲノムの塩基配列は極めて多様であり、この違いが表現型の違いに関連しているか否かを決めることが難しいためである。例えば、3ギガのゲノムの塩基配列の中に約300万個の塩基配列の違いがあるとき、そのどれが表現型と関連するかを決定することは困難を極めた作業になる。
従って、ゲノムの塩基配列から特定の形質に関連する遺伝子を特定するためには多数の患者と対照者(コントロール)のゲノムの塩基配列を比較する必要があるが、この多数の個人の全ゲノム塩基配列を決定するためには、現在のシステムでは膨大な時間と資金が必要であるという問題がある。そこで、より効率的に表現型に関連する関連遺伝子の塩基配列の性質が探索できる方法の提供が望まれている。
【0004】
表現型に関する関連遺伝子の塩基配列の性質を探索できる方法として、化学物質等で変異を加えたトマトについて、DNAプールを作成し、これを試料として標的配列を増幅させ、増幅産物のライブラリーを作成した後、シークエンシングを使用してヌクレオチド配列を決定することで、変異させた集団における標的配列中の変異を検出する方法が開発されている。しかし、この方法は、変異を加えるという点から、ヒト以外を対象とするものであり、また、複数の変異を形質として、各DNAプールから増幅されたDNA断片を混合して異なった形質を含むDNA断片プールを作成するという発想はなく、効率的に表現型に関連する関連遺伝子の塩基配列の性質が探索できる方法であるとはいえない。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特表2009−509527号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
本発明は、二段階プール法による形質関連塩基配列の性質の探索法の提供を課題とする。
【課題を解決するための手段】
【0007】
本発明者らは上記課題を解決するために鋭意検討を行ったところ、1.選択した複数の形質について、一つの形質の一つの表現型ごとにDNAプール(第一段階プール)を作成し、2.これを試料としてPCRにより、形質ごとに特異的なDNA断片を得た上で、複数の形質の表現型に由来するDNA断片を混合しDNA断片プール(第二段階プール)を作成し、3.高速シークエンサーによってDNA断片の塩基配列を決定した後に、決定した塩基配列の類似性に基づき、その由来するDNAプール(第一段階プール)とターゲット塩基配列を特定することにより、効率的に表現型に関連する関連遺伝子の塩基配列が探索できることを見出し、本発明を完成するに至った。表現型に関連する関連遺伝子や、その塩基配列は複数存在するため、それぞれの塩基配列をまとめることで、本発明の方法により、形質関連塩基配列の性質を探索することができる。
【0008】
本発明の探索法は、第一に、DNAプール(第一段階プール)の作成によって、同一形質の同一表現型を持った複数の個体のDNAを混合する。第二に、混合したDNAプール(第一段階プール)を試料として、この形質に特異的な複数のPCRプライマーペアを用いてPCRを行うことで、この形質に特異的な複数のDNA断片を作成し、さらにそれとは異なる様々な形質についても特異的な複数のDNA断片を作成し、これらのDNA断片を一定のルールの下に混合することで、DNA断片のプール(第二段階プール)を作成する。そして、このDNA断片プールについて、高速シークエンサーを用いDNA断片の塩基配列を決定した後に、決定した塩基配列の類似性に基づき、その由来するDNAプールとターゲット塩基配列を特定することで、迅速に特定のDNAプールに由来するターゲット塩基配列を決定することを可能にする方法である。
DNA断片プール(第二段階プール)は、同一形質の異なった表現型のDNAに由来するDNA断片を混合しないという条件に従えば、複数の形質の表現型のDNAプールから、形質ごとに特異的なPCRプライマーペアを用いてPCRを行い、形質ごとに増幅されたDNA断片を混合した、形質混合DNA断片プールとすることもできる。そして、この形質混合DNA断片プールを用いることにより、さらに各形質の、各DNAプールとターゲット塩基配列に特有な塩基配列の特定を迅速化することができる。
【0009】
すなわち、本発明は次の二段階プール法による形質関連塩基配列の性質の探索法に関する。
(1)次の1)〜6)の工程を含む、二段階プール法による形質関連塩基配列の性質の探索法、
1)形質ごとに関連する候補遺伝子リストを作成する工程、
2)上記1)の候補遺伝子リストに挙げられた候補遺伝子について、形質ごとに特異的な排他的PCRプライマーペアセットを作成する工程、
3)同一形質・同一表現型を有する複数の個体由来のDNAからなるDNAプール(第一段階プール)を作成する工程、
4)上記3)で作成したDNAプールを試料として、上記2)で作成した排他的PCRプライマーペアセットを用いてPCRを行い、候補遺伝子のターゲット塩基配列を増幅し、同一形質の異なった表現型に由来するDNA断片を混合しないというルールに従ってDNA断片プール(第二段階プール)を作成する工程、
5)上記4)において作成したDNA断片プールを試料として、高速シークエンサーにかけ、塩基配列決定を行う工程、
6)上記5)において決定された塩基配列について、上記2)で作成した排他的PCRプライマーペアセットによって増幅される可能性のある、すべての候補遺伝子のターゲット塩基配列をreference(参照)して、決定された塩基配列がどの候補遺伝子のターゲット塩基配列に類似しているかを調べ、さらに高速シークエンサーにかけて得られた、同一形質の複数の表現型由来の塩基配列を比較することにより、各形質における形質関連塩基配列の性質を探索する工程。
【発明の効果】
【0010】
本発明の二段階プール法による形質関連塩基配列の性質の探索法により、複数の形質において、各形質に関連する塩基配列や、その由来するDNAプールを迅速に特定することができることから、遺伝的関連研究の効率化に役立つ。
【図面の簡単な説明】
【0011】
【図1】本発明の二段階プール法による形質関連塩基配列の性質の探索法および試験例の概要を示した図である(実施例、試験例)。
【発明を実施するための形態】
【0012】
本発明の「二段階プール法による形質関連塩基配列の性質の探索法」とは、例えば、肺癌、肝臓癌、大腸癌、糖尿病、高血圧、薬物Aに対する反応性などの様々な形質の異なった表現型間で異なる遺伝子の塩基配列を「形質関連塩基配列」として1つ以上見出し、その性質を探索することをいう。
【0013】
本発明の「二段階プール法」とは、ある形質において、同一形質・同一表現型を有する複数の個体由来のDNAからなるDNAプールを第一段階プールとして作成し、さらに、このDNAプールを試料として、候補遺伝子のターゲット塩基配列を増幅し、得られた複数の形質に由来するDNA断片を混合したDNA断片プールを第二段階プールとして作成する方法のことをいう。
第一段階のDNAプールでは、同一形質・同一表現型の複数の個人のDNAのみを混合してDNAプールを作成する。また、第二段階のDNA断片プールでは、「同一形質の異なった表現型に由来するDNA断片を混合しない」というルールに従いさえすれば、複数のDNAプールに由来するDNA断片を混合して作成することもできる。
【0014】
本発明の「二段階プール法による形質関連塩基配列の性質の探索法」において、対象とする「形質」には、上記のような様々な疾患や、薬物に対する反応性等が挙げられる。
一つの「形質」は複数の互いに排他の「表現型」の集合である。「表現型」とは、個体の特徴のことをいい、「特定の疾患(例えば、糖尿病)の有無」という形質においては、「疾患(例えば、糖尿病)で有る」、「疾患(例えば、糖尿病)で無い」という個体の特徴が、「表現型」としてそれぞれ挙げられる。血液型が「A型である」、「B型である」、「AB型である」、または「O型である」などの場合や「Dという薬が効く」、「効かない」、「副作用が出る」、「出ない」、なども「表現型」のひとつとして挙げられる。即ち、複数で有限数のカテゴリーに、個体をその特徴により分類できる場合、一つのカテゴリーを表現型とする。
本発明においては、量的形質ではなく、質的形質を取り扱うことが好ましく、また量的表現型より、質的表現型を取り扱うことが好ましい。
【0015】
本発明の「二段階プール法による形質関連塩基配列の性質の探索法」は、本発明の二段階プール法を用い、形質または形質と表現型の組み合わせにおける形質関連塩基配列の性質が探索できる方法であればいずれの方法を用いても良いが、例えば、次のような工程1〜6を経ることで行うことができる。
工程1:形質ごとに関連する候補遺伝子リストを作成する工程、
工程2:候補遺伝子リストに挙げられた候補遺伝子について、形質ごとに特異的な排他的PCRプライマーペアセットを作成する工程、
工程3:同一形質・同一表現型を有する複数の個体由来のDNAからなるDNAプール(第一段階プール)を作成する工程、
工程4:DNAプールを試料として、排他的PCRプライマーペアセットを用いてPCRを行い、候補遺伝子のターゲット塩基配列を増幅し、同一形質の異なった表現型に由来するDNA断片を混合しないというルールに従ってDNA断片プール(第二段階プール)を作成する工程、
工程5:DNA断片プールを試料として、高速シークエンサーにかけ、塩基配列決定を行う工程、
工程6:決定された塩基配列について、排他的PCRプライマーペアセットによって増幅される可能性のある、すべての候補遺伝子のターゲット塩基配列をreference(参照)して、決定された塩基配列がどの候補遺伝子のターゲット塩基配列に類似しているかを調べ、各形質における形質関連塩基配列の性質を探索する工程。
【0016】
この「二段階プール法による形質関連塩基配列の性質の探索法」の各工程には、さらに、工程6において、決定された塩基配列がどの候補遺伝子のターゲット塩基配列に類似しているかを調べた後、さらに、同様に得られた同一形質の複数の表現型由来の塩基配列を比較することにより、各形質における形質関連塩基配列の性質を探索してもよい。
【0017】
このうち、工程1は「工程1.候補遺伝子リストの作成」として、例えば、肺癌、糖尿病、高血圧、薬物Aに対する反応性などの様々な形質のうち、複数の形質を選択し、形質ごとに関連する候補遺伝子をリストアップして、候補遺伝子リストを作成することをいう。
【0018】
工程2は、「工程2.プライマーペアセットの作成」として、工程1で選択した複数の形質のうち、ある形質のある候補遺伝子について、5’−flanking region、exon−intron junction、exon、3’−flanking regionなど、塩基配列の変化が形質に直接関連する可能性がある塩基配列を増幅するPCRのプライマーペアを設定することをいう。
プライマーペアセットの作成ルールとしては、1)ある形質について、工程1で作成した候補遺伝子リストに挙げられているすべての候補遺伝子について、PCRのプライマーペアを作成し、これらを全て含む集合を、その形質のPCRプライマーペアセットとし、2)異なった形質のPCRプライマーペアセットは互いに排他となるように作成する(排他的PCRプライマーペアセット)。これによって、形質ごとにプライマーペアにより増幅される領域が異なり、塩基配列が異なることになる。
さらに、プライマーペアセットの作成ルールとして、3)上記1)、2)に加え、排他的PCRプライマーペアセットをいくつかのサブセットに分割してもよい。これは、プライマーペアによってPCRの温度条件などが異なる場合において、同一条件のプライマーペアを同じサブセットに入れることで、PCR効率をあげることが可能となるためである。
【0019】
工程3は「工程3.DNAプールの作成」として、工程1で選択した複数の形質のうち、形質ごとに、同一形質・同一表現型の複数の個体のDNAを集め、DNAプール(第一段階プール)を作成することをいう。
このDNAプールの作成においては、各個人のDNAの濃度を測定した後に、DNAが同じ量等になるように混合することが好ましいが、混合比は必ずしも1:1に限定されない。また、同一形質・同一表現型については、それに属する全ての個体のDNAを混合することもあるが、いくつかのサブセットに分割して混合してもよい。
【0020】
工程4は「工程4.DNA断片プールの作成」として、工程3で作成したDNAプールを試料として、工程2で作成した排他的PCRプライマーペアを用いてPCRを行い、増幅した候補遺伝子のDNA断片について、DNA断片プール(第二段階プール)を作成することをいう。
DNA断片プールの作成にあたっては、同一形質の異なる表現型のDNAプールに由来するDNA断片を混合しないことが重要である。同一形質の異なった表現型のDNAプールに由来するDNA断片を混合した場合、ゲノム塩基配列がどのDNAプールに由来するかを特定することが不可能になるからである。
一方で、異なった形質のDNAプールに由来するDNA断片は混合しても良い。これは、形質ごとに排他的PCRプライマーペアセットによって増幅される候補遺伝子のターゲット塩基配列が異なるため、形質ごとに異なったDNA断片が得られることになり、これらのDNA断片を混合したところで、由来する個体の形質について混同する可能性がないためである。
このDNA断片プールの作成においては、増幅されたDNA断片の混合比率は特に限定されないが、一個人由来のDNA断片すべてが等モル濃度になるように混合することが好ましい。
【0021】
このDNA断片プールの作成において、候補遺伝子のターゲット塩基配列の増幅のために行うPCRは、一つのプライマーペアセットごとに行う以外に、それぞれのPCRプライマーペアごとに別々に行った後に生成されたDNA断片を混合しても良い。この混合する前に何らかの方法でDNA断片を精製することも可能である。一つのプライマーペアセットは複数のプライマーペアを含むのでこれを用いてPCRを同じ溶液で行えば複数の断片を同じ溶液の中で同時に増幅するマルチプレックスPCRということになる。PCRによって増幅された候補遺伝子のターゲット塩基配列は、増幅されたか否かを電気泳動などで確認することができる。
【0022】
工程5は「工程5.シークエンス」として、工程4において作成したDNA断片プールを試料として高速シークエンサーにかけ、塩基配列決定を行うことをいう。
このシークエンスには、ロッシュ社製の454、ABI社製のSolid、イルミナ社製のGenome analyzerなどを使用することができるが、これに限定されない。シークエンサーによる塩基配列決定の前に、高速シークエンサーのシステムに合わせてDNA断片を精製したり、DNA断片をさらに断片化したり、アダプター配列やoverhanging sequenceを結合したりすることが好ましい。
【0023】
工程6は「工程6.形質関連塩基配列の性質の探索」として、工程5において決定された塩基配列(決定塩基配列)について、工程2において設定した排他的プライマーペアセットによって増幅される可能性のある、すべての候補遺伝子のターゲット塩基配列をreference(参照)して、塩基配列の類似性により、由来するDNAプール、ひいてはそれに関連する形質を特定することをいう。
そして、さらに同様の工程によって得られた同一形質の複数の表現型由来の塩基配列を比較することにより、同一の形質における各表現型に特徴的な塩基配列の性質をそれぞれ特定することをいう。
【0024】
本発明の「二段階プール法による形質関連塩基配列の性質の探索法」は、コンピュータを用いて行うことができ、コンピュータ上でのシミュレートによっても行うことができる。
この場合、工程1には、選択した複数の形質に対し、形質ごとに関連する候補遺伝子自体や、その遺伝子の染色体の位置、塩基配列等の情報を入力する工程や、入力した情報をリスト化する工程も含むことができる。
工程2には、工程1で選択した複数の形質のうち、ある形質のある候補遺伝子について、その候補遺伝子の塩基配列の情報から、塩基配列の変化が形質に直接関連する可能性がある塩基配列を増幅するPCRのプライマーペアをPrimer3(Steve Rozen and Helen Skaletsky (Whitehead Institute および ハワード・ヒューズ医学研究所)等のソフトウェエアを用いてコンピュータ上で設定する工程も含むことができる。
工程3には、工程1で選択した複数の形質のうち、形質ごとに集めた同一形質・同一表現型の複数の個体のDNAの情報をコンピュータに入力し、DNAプール(第一段階プール)としてプール化する工程も含むことができる。
【0025】
工程5には、工程4において作成したDNA断片プールを高速シークエンサーにかけた場合に、シークエンサーから得られる塩基配列の情報をコンピュータ上で予測する工程も含むことができる。シークエンサーから得られる塩基配列のほとんどは、設定されたプライマーペアによって増幅される塩基配列であると考えられるが、プライマーペアの塩基配列情報を用いてホモロギー検索により全ゲノムから探すことも可能である。
さらに、工程6には、工程5において予測された塩基配列について、工程2において設定した排他的プライマーペアセットによって増幅される可能性のある、すべての候補遺伝子のターゲット塩基配列をreference(参照)して、決定された塩基配列がどの候補遺伝子のターゲット塩基配列に類似しているかを調べ、これらの塩基配列が対応する形質塩基配列の類似性により、由来するDNAプール、ひいてはそれに関連する形質をコンピュータ上で特定する工程も含むことができる。
【0026】
このような工程を経て行われる、本発明の「二段階プール法による形質関連塩基配列の性質の探索法」の原理は次のようなものである。
即ち、
1.高速シークエンサーは一分子のDNA塩基配列を読むことから、複数の形質について形質関連塩基配列を混合しても一つ一つ塩基配列を読む、
2.各形質に互いに排他のプライマリーペアセットを用いることにより、塩基配列が由来したDNAプールに関係する形質を特定できる、
3.極めて低頻度で存在するプライマーペアセットのターゲットとなっていない望まない塩基配列についても最終的にDNA断片プールの中に存在すると思われるが、PCRにより増幅されたDNAに比較すると無視できるほど少ないと考えられる、
従って、
4.「同一形質の異なった表現型に由来するDNA断片を混合しない」というルールを守りさえすれば、同一形質における表現型の異なる個体由来の塩基配列を混同することはない。
【0027】
本発明のこの原理によって、次の様な利点が生じると考えられる。即ち、高速シークエンサーは膨大な塩基配列情報を同時に読むことができるので、数多くの形質の注目する塩基配列の解析を速く、低価格で行うことができる。
また、増幅されたDNA断片の濃度にはばらつきがあるが、試料となるDNAプール(第一段階プール)を作成するときに同一の割合で混合されるように注意すれば、最終的に得られた塩基配列が特定の個体に由来する確率は、同じDNAプールの個体の間でほぼ同一と考えられる等である。
【0028】
以下、試験例、実施例をあげて本発明をさらに詳細に説明するが、本発明は何らこれらに限定されるものではない。
【実施例】
【0029】
<二段階プール法による形質関連塩基配列の性質の探索法>
本発明の二段階プール法による形質関連塩基配列の性質の探索法は、次の1.〜6.の工程によって行うことができる。これらの工程によって、同一形質の異なった表現型について形質関連塩基配列を得て、表現型ごとの形質関連塩基配列を比較することにより、各表現型に特徴的な形質関連塩基配列の性質を特定することができる。
【0030】
工程1.候補遺伝子リストの作成
複数の形質を選択し、それぞれの形質に関連する候補遺伝子をリストアップして、候補遺伝子リストを作成する。
【0031】
工程2.プライマーペアセットの作成
工程1で選択した複数の形質のうち、ある形質のある候補遺伝子について、塩基配列の変化が形質に直接関連する可能性がある塩基配列を増幅する、排他的なPCRのプライマーペアを設定する。
【0032】
<プライマーペアセットの作成ルール>
1)ある形質について、工程1で作成した候補遺伝子リストに挙げられているすべての候補遺伝子について、PCRのプライマーペアを作成し、これらを全て含む集合を、その形質のPCRプライマーペアセットとする。
2)PCRプライマーペアセットは形質とは異なる他の形質のPCRプライマーペアセットとは排他となるように作成する(排他的PCRプライマーペアセット)。これによって、形質ごとにプライマーペアにより増幅される領域が異なり、同じ塩基配列を持たないことになる。
3)さらに、上記1)、2)に加え、排他的PCRプライマーペアセットをいくつかのサブセットに分割してもよい。サブセットは一つのプライマーペアしか含まなくても良い。
【0033】
工程3.DNAプールの作成
工程1で選択した複数の形質のうち、同一形質の同一表現型(例:形質(A)の表現型(a))の複数の個体のDNAを集め、DNAプール(第一段階プール)を作成する。
【0034】
工程4.DNA断片プールの作成
工程3で作成したDNAプールを試料として、工程2で作成した排他的PCRプライマーペアを用いてPCRを行い、候補遺伝子のターゲット塩基配列を増幅する。
PCRが終了した後、目的とするDNA断片の精製を行い、DNA濃度を測定する。増幅・精製されたDNA断片を混合し、DNA断片プール(第二段階プール)を作成する。DNA断片が等モル濃度になるように混合することが望ましい。
【0035】
<DNA断片プールの作成ルール>
「同一形質の異なった表現型に由来するDNA断片を混合してはならない。」このルールが満足される限り、異なった形質のDNAプールに由来するどのようなDNA断片、あるいはDNA断片のプールを混合しても良い。
【0036】
工程5.シークエンス
工程4において作成したDNA断片プールを試料として高速シークエンサーにかけ、塩基配列決定を行う。
【0037】
工程6.形質関連塩基配列の性質の探索
工程5において決定された塩基配列について、設定したプライマーペアによって増幅される可能性のある、すべての候補遺伝子のターゲット塩基配列をreference(参照)して、決定された塩基配列がどの候補遺伝子のターゲット塩基配列に類似しているかを調べる。類似塩基配列の定義は、塩基配列が90%以上一致しているなどの基準を定めることができるが、この基準にはとらわれない。
一つのターゲット塩基配列は特定の形質に対応するため、そのターゲット塩基配列と照合することにより、決定された塩基配列に由来する形質が特定できる。これによって、一つの形質の一つの表現型を保有する個体のDNAプールに由来する塩基配列を得ることができる。
【0038】
さらに、同一の形質において異なった表現型(例:形質(A)の表現型(b))がある場合には、工程4〜6を繰り返すことで、同一の形質の異なった表現型について形質関連塩基配列を得ることができる。これらの各表現型の形質関連塩基配列を比較することにより、同一の形質における各表現型に特徴的な形質関連塩基配列の性質をそれぞれ特定することができる。
本発明の二段階プール法による形質関連塩基配列の性質の探索法および試験例の概要を図1に示した。
【0039】
[試験例]
以下の工程について、コンピュータシミュレーションと公知の事実を用い、本発明の実現性の検証を行った。
工程1.候補遺伝子リストの作成
3つの異なった疾患(疾患A:肺癌、疾患B:大腸癌、疾患C:肝癌)をそれぞれ形質として選択した。この場合、例えば「肺癌」が一つの形質となり、「肺癌である」と、「肺癌でない」がこの形質の2つの表現型ということになる。次に、それぞれの形質ごとに候補遺伝子をリストアップして、候補遺伝子リストを作成した。これらの3つの形質の候補遺伝子は重なりがないという必要条件を満たしていた。選択した形質および候補遺伝子を表1に示した。
【0040】
【表1】

【0041】
工程2.プライマーペアセットの作成
実施例1のプライマーペアセットの作成ルールに従い、各形質の各候補遺伝子に対し、PCRのプライマーペアセットを作成した。表2〜4に各候補遺伝子の情報および該遺伝子に関するプライマーペアセットを示した。各候補遺伝子のターゲット塩基配列はUniSTS(ユニークなsequence tagged sites (STSs))の各ID(UniSTS_ID)によって示され、インターネットのNCBIサイト、NCBI ftpサイト内にある、human.sts というファイル内の塩基配列の情報より得ることができる(ftp://ftp.ncbi.nih.gov/repository/UniSTS/ )。
表2〜4における「開始位置」および「終止位置」は染色体上の位置を示している。この情報は、NCBI ftpサイト内にある、seq_sts.mdというファイル内より情報を得ることができる(ftp://ftp.ncbi.nih.gov/genomes/H_sapiens/mapview )。また、primer symbolはUniSTSを増幅するためのプライマーペアの名称を示し、同じインターネットサイトより得られる。
疾患A(肺癌)の候補遺伝子(31個)に関するプライマーペアセットの配列番号を表2に、疾患B(大腸癌)の候補遺伝子(39個)に関するプライマーペアセットの配列番号を表3(表3−1、3−2)に、疾患C(肝癌)の候補遺伝子(60個)に関するプライマーペアセットの配列番号を表4(表4−1、4−2)に示した。
【0042】
【表2】

【0043】
【表3−1】

【表3−2】

【0044】
【表4−1】

【表4−2】

【0045】
工程3.DNAプールの作成
疾患A(肺癌)、疾患B(大腸癌)、疾患C(肝癌)について、それぞれ、患者(30人)のDNAの塩基配列の、それぞれ疾患A、B、Cに対応するプライマーペアセットで増幅される部分を、HapMap日本人のSNP情報にあるアレル頻度情報を閾値として使用し、乱数を発生させて閾値を‘越えた/越えていない’とすることで SNP の塩基を決定してシミュレートし、疾患A、B、CのそれぞれについてDNAプールを作成した。
【0046】
工程4.DNA断片プールの作成
工程3で作成した各疾患の患者のDNAプール(30人分)を試料として、工程2で作成した各疾患のPCRプライマーペアを用いてPCR反応を行い、疾患A、B、Cのそれぞれについて候補遺伝子のターゲット塩基配列を増幅し、増幅されたDNA断片を精製した後、疾患A、B、Cの患者について増幅したDNA断片をすべて混合し、患者のDNA断片プールを作成する。
シミュレーションではDNA断片の塩基配列をプールし、DNA断片プールを作成した。
【0047】
工程5.シークエンス
工程4において作成した患者のDNA断片プールを試料として高速シークエンサーにかけ、塩基配列決定を行うことにより患者のDNA断片の決定塩基配列を得る。
シミュレーションではタイピングのエラーを10−5して患者のDNA断片の決定塩基配列をシミュレートした。その結果の一例を表5に示した。表5のEX_IDとは、患者のDNA断片の決定塩基配列として、高速シークエンサーが出力する約50塩基の塩基配列のIDをそれぞれ示したものである。全結果をファイルし、約56ギガbp(プリントすると3万7000ページになる)のデータを得たが、全結果の塩基配列を示すのは困難なので、以下にその最初の一部を示した。
【0048】
【表5】

【0049】
工程6.形質関連塩基配列の性質の探索
工程5においてシミュレートされた患者のDNA断片の決定塩基配列について、表2〜5において設定したプライマーペアによって増幅される可能性のある、すべての候補遺伝子のターゲット塩基配列をreference(参照)して、各決定塩基配列がどの候補遺伝子のターゲット塩基配列に類似しているかを、BLASTソフトウェア(NCBI BLAST、 http://www.ncbi.nlm.nih.gov/BLAST/)を用いたホモロジー検索により調べた。
表6(表6−1〜6−3)にreference(参照)した各候補遺伝子のターゲット塩基配列の配列番号(具体的な塩基配列は配列表に示した)およびこの候補遺伝子に関連する形質を示した。
【0050】
【表6−1】

【表6−2】

【表6−3】

【0051】
工程5においてシミュレートされた患者のDNA断片の決定塩基配列と、各候補遺伝子のターゲット塩基配列とのホモロジー検索の結果と、表6の各候補遺伝子に関連する疾患の情報を照合し、患者のDNA断片の決定塩基配列が由来する各DNAプールに対応する形質(肺癌:lung、肝癌:liverまたは大腸癌:colon)を記載したファイルを得た。
その結果の一部を表7に示した。(全結果はプリントすると8万7千ページとなり、全表示は不可能であった)。表7の「EX_ID」は、表5で示されたそれぞれの患者のDNA断片の決定塩基配列のIDを示したものであり、表7の「reference」とは、表6で示された各候補遺伝子のターゲット塩基配列のUniSTS IDを示したものである。「塩基番号」は、各候補遺伝子のターゲット塩基配列のうち、ホモロジー検索を行う開始塩基番号と終了塩基番号を示したものである。
この結果より、例えば、患者のDNA断片の決定塩基配列であるEX_ID1は候補遺伝子のターゲット塩基配列であるUniSTS:156281、UniSTS:156967およびUniSTS:157263と98%の類似率を示したことから、形質として肝癌(liver)に関連することが示唆された。
なお、一つのEX_IDが複数の候補遺伝子のターゲット塩基配列に対応するのは、候補遺伝子のターゲット塩基配列が重なっていることによるものであり、問題はない。
【0052】
【表7】

【0053】
工程7.同一の形質の異なった表現型の個体群間の塩基配列の比較
比較のために、疾患A、B、Cそれぞれに対するコントロール(非患者)の個体(30人)から得たDNAを集め、3つのDNAプールを作成するシミュレーションを行い、作成したDNAプール(30人分)の塩基配列をもとに、工程2で作成した、それぞれの形質に特異なPCRプライマーペアを用いてPCRを行い、疾患A、B、Cそれぞれの候補遺伝子のターゲット塩基配列を増幅する。
このように作成した、疾患A、B、Cそれぞれのコントロール(非患者)ついてのDNA断片をすべて混合し、コントロールのDNA断片プールを作成し、これを試料として高速シークエンサーにかけ、塩基配列を決定し、コントロールのDNA断片の決定塩基配列を得る。
シミュレーションではタイピングのエラーを10−5としてコントロールのDNA断片の決定塩基配列をシミュレートした。
引き続き、このように決定されたコントロールのDNA断片の決定塩基配列について、表2〜5において設定したプライマーペアによって増幅される可能性のある、すべての候補遺伝子のターゲット塩基配列をreference(参照)して、各決定塩基配列がどの候補遺伝子のターゲット塩基配列に類似しているかを、ホモロジー検索により調べた。
コントロールのDNA断片の決定塩基配列と、各候補遺伝子のターゲット塩基配列とのホモロジー検索の結果と、各候補遺伝子に関連する疾患の情報を照合し、疾患A,B,Cそれぞれのコントロールに由来する決定塩基配列とした。
しかる後に、このようにして得られた、疾患A,B,CそれぞれのコントロールDNA断片の決定塩基配列を、工程6で得られた疾患A、B、Cそれぞれの患者のDNA断片の決定塩基配列と比較し、その違いの特徴を検索した。
【0054】
以上の試験では、高速シークエンサーを2回用いて、DNA断片試料の塩基配列決定を行っている。しかし、従来の方法では、3つの形質(肺癌、大腸癌、肝癌)に特徴的なゲノムの塩基配列の性質を調べるために、高速シークエンサーを6回用いてDNA断片試料の塩基配列決定を行う必要がある。即ち、疾患Aの試料、疾患Aのコントロールの試料、疾患Bの試料、疾患Bのコントロールの試料、疾患Cの試料、疾患Cのコントロールの試料の計6回である。
本発明の方法により、高速シークエンサーの使用回数を従来の方法の3分の1とすることができた。高速シークエンサーの使用は1回につき極めて高価なので大幅に検査費用を節約できたことになる。また、高速シークエンサーの1回の検査には時間もかかるので(約1週間)、本発明の方法により時間も3分の1に節約できることになる。
【産業上の利用可能性】
【0055】
本発明の二段階プール法による形質関連塩基配列の性質の探索法により、複数の形質において、各形質に特異的な形質関連塩基配列や、各形質の各表現型に特異的な形質関連塩基配列を迅速に特定することが可能となることから、数多くの形質において注目する塩基配列の解析を迅速かつ低価格で提供することが可能となる。

【特許請求の範囲】
【請求項1】
次の1)〜6)の工程を含む、二段階プール法による形質関連塩基配列の性質を探索する方法、
1)形質ごとに関連する候補遺伝子リストを作成する工程、
2)上記1)の候補遺伝子リストに挙げられた候補遺伝子について、形質ごとに特異的な排他的PCRプライマーペアセットを作成する工程、
3)同一形質・同一表現型を有する複数の個体由来のDNAからなるDNAプール(第一段階プール)を作成する工程、
4)上記3)で作成したDNAプールを試料として、上記2)で作成した排他的PCRプライマーペアセットを用いてPCRを行い、候補遺伝子のターゲット塩基配列を増幅して得たDNA断片を、同一形質の異なった表現型に由来するDNA断片を混合しないというルールに従って混合し、DNA断片プール(第二段階プール)を作成する工程、
5)上記4)において作成したDNA断片プールを試料として、高速シークエンサーにかけ、塩基配列決定を行う工程、
6)上記5)において決定された塩基配列について、上記2)で作成した排他的PCRプライマーペアセットによって増幅される可能性のある、すべての候補遺伝子のターゲット塩基配列をreferenceして、決定された塩基配列がどの候補遺伝子のターゲット塩基配列に類似しているかを調べ、各形質における形質関連塩基配列の性質を探索する工程。

【図1】
image rotate


【公開番号】特開2011−92053(P2011−92053A)
【公開日】平成23年5月12日(2011.5.12)
【国際特許分類】
【出願番号】特願2009−247821(P2009−247821)
【出願日】平成21年10月28日(2009.10.28)
【出願人】(503168256)株式会社スタージェン (8)
【Fターム(参考)】