説明

遺伝子情報の表示方法及び表示装置

【課題】 DNA断片のPCR増幅産物の電気泳動実験から得られる蛍光分析結果の波形データにおいて、真のピークとノイズピークとを正しく判別して表示することができる表示方法及び表示装置を提供する。
【解決手段】 DNAマーカーの配列情報を基に複合ピーク波形が生じるかどうかを判定し、複合ピーク波形が生じる場合には、複合ピーク波形専用のピーク判定アルゴリズムを適用する。このピーク判定アルゴリズムは、基本波形の当てはめの際に、1つ目の基本波形の当てはめ位置と1つ目の基本波形の当てはめ位置との間隔をunit長より長く取ることにより、ピークの誤判定を避けることを特徴としている。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、個体の疾患や外形的特徴などの表現型に関与している遺伝子を特定するための解析作業に用いる遺伝子情報の表示方法及び表示装置に関し、特に、解析対象の遺伝子が含まれるDNA断片をPCRや電気泳動などにより抽出し検出する際に、解析対象からのシグナルとノイズシグナルとを的確に判別して表示することができる方法及び装置に関するものである。
【背景技術】
【0002】
ヒトゲノムの完全解読後、遺伝子の機能解析研究が活発に行われている。そのなかでも特定の疾患の有無、薬物の効果の程度、副作用の有無などの表現型に関与する遺伝子の探索での基盤となる、遺伝子型決定の自動化が特に注目されている。
【0003】
マイクロサテライト
通常、同種の生物のゲノムはほぼ似通った塩基配列を有しているが、いくつかの個所では異なった塩基を有している。例えば、1つの遺伝子座において、ある個体はAを有しており、他の個体はTを有している場合などがある。このように個体間でゲノム上の単一の塩基に多型性が見られることをSNP(Single Nucleotide Polymorphism)と言う。
【0004】
一方、生物のゲノム中には、2塩基から6塩基の短い配列パターンが数回〜数十回繰り返されて表れる箇所が非常に多く(数万箇所以上)存在する。この特徴的な配列パターンのことをマイクロサテライトと呼んでいる。ゲノム上に現れるマイクロサテライトの例を図18に示す。マイクロサテライトにおける繰り返し単位をunitと呼び、unitの塩基数をunit長と呼んでいる。例えば、図18に示すATATATAT...というマイクロサテライトでは、unitは『AT』であり、unit長は2塩基である。図18に示すように、マイクロサテライトは、個体間でunit及びunit長が同じであっても、その繰り返し回数が個体によって異なることがある。
【0005】
上記したようにSNP及びマイクロサテライトは個体間で異なり得るので、ゲノム上で他の塩基配列と区別がしやすい部分であり、実験的にも検出が容易である。また、生物種によっては、ゲノム上のSNP及びマイクロサテライトが存在するおおよその位置が判っているので、ゲノム上の位置を示す指標として用いることができる。このような性質から、SNPやマイクロサテライトのことをDNAマーカーと呼んでいる。特に、マイクロサテライトは複数の塩基を含んでいるので、SNPよりも多くの情報量を有しており、DNAマーカーとして頻繁に用いられている。
【0006】
ところで、図18に示すように、多くの生物の個体は、雌性配偶子と雄性配偶子に由来する1組のゲノム(相同染色体)を有している。1組のゲノム上の互いに対応する部位に存在する遺伝子を、それぞれ対立遺伝子(allele)と言い、これらの組み合わせを遺伝子型(genotype)と言う。上記したように、ゲノム上のSNPやマイクロサテライトは、個体間で塩基配列が異なり得る部分であるので、一般的に、SNPには2つ又は3つの対立遺伝子が存在し、マイクロサテライトには数種類〜20種類以上の対立遺伝子が存在する。図18に示す例では、個体Aは、『AT』というunitを5回繰り返したものと7回繰り返したものとを有しており、個体Bは、『AT』というunitを6回繰り返したものを2つ有している。ここで、個体Aのように異なる種類の対立遺伝子を1つずつ持っている状態をヘテロ接合と言い、個体Bのように同じ種類の対立遺伝子を2つ持っている状態をホモ接合と言う。
【0007】
PCR及び電気泳動実験
DNAマーカーとしてマイクロサテライトを用いる場合、ゲノム上のマイクロサテライトが現れている箇所を抽出して検出するための実験としてPCR(Polymerase Chain Reaction)や電気泳動などの実験が行われる。PCRは、マイクロサテライトの両端においてプライマー配列と呼ばれる一対の塩基配列を指定することで、それらの間にはさまれるマイクロサテライト部分のみをDNA断片として繰り返し複製することにより、一定量のサンプルを取得する実験技術である。電気泳動には、ゲル電気泳動やキャピラリ電気泳動などの手法があり、増幅したDNA断片を荷電された泳動路で泳動させて、長さの異なるDNA断片を分離する実験技術である。電気泳動は、DNA断片の長さによって泳動路における泳動速度が異なる(長いDNA断片ほど泳動速度が小さい)ことを利用したサンプル分離手法である。
【0008】
図19は、PCR及びゲル電気泳動により、マイクロサテライト部分のDNA断片を抽出し増幅する実験手順を模式的に示す図である。まず、対象となるマイクロサテライトを挟んで一対のプライマー配列1900及び1901を指定し、マイクロサテライト及びプライマー配列を含んだゲノム領域1902がPCR実験により増幅される。図19に示す例では、2本の相同染色体上でのマイクロサテライトの繰り返し数が異なるヘテロ接合であり、それぞれマイクロサテライト部分の長さが異なるため、それぞれから長さの異なる2種類のPCR増幅産物すなわちDNA断片(66塩基および58塩基)が得られる。これらを板状のゲル上で一定時間電気泳動させると、上記2種類のPCR増幅産物はそのDNA断片の長さの違いによって分離されることとなる。各DNA断片には蛍光色素をつけておき、電気泳動後に各DNA断片の位置を検出することにより、図19左下の図に示すような模様が得られる。また、PCR増幅産物とともに、長さがあらかじめ分かっているDNA断片(サイズマーカーと呼ばれる)を電気泳動させておけば、それらサイズマーカーの検出位置を基準として各PCR増幅産物の長さを知ることができる。
【0009】
尚、上記ではゲル電気泳動を用いた実験手法について述べたが、キャピラリ電気泳動によっても同様のことを行うことができる。キャピラリ電気泳動では、サンプルにゲルを詰めた細い管の中を泳動させ、各種サンプルが一定距離(通常はキャピラリの終端まで)を泳動し終わるまでに要した時間を計測して、DNA断片の長さを調べる手法である。キャピラリ電気泳動の結果として、図19右下の図に示すような、横軸にDNA断片の長さ・縦軸にシグナル強度をプロットした波形(ピークの集合)が得られる。キャピラリ電気泳動においては、ゲル中のサンプルからの蛍光シグナルをスキャンするのではなく、キャピラリ終端に備えた蛍光シグナル検出器によりサンプルを検出するのが一般的である。
【0010】
PCR及び電気泳動実験において生じるノイズ
上記の図19に示した実験結果は、PCR及び電気泳動が理想的な過程で行われた場合に得られるものであり、実際の実験においては様々なノイズが生じることがある。PCR及び電気泳動の実験過程で生じる代表的なノイズである、Stutterピークと+Aピークについて、図20を参照しながら以下に説明する。簡単のため、図20では、図19に示した長さ66塩基のDNA断片(『TA』が12回繰り返されたマイクロサテライトを含む)のみを例に挙げている。
【0011】
Stutterピークとは、PCR反応の際にslipped-strand mispairing(スリップ鎖誤対合;マイクロサテライトの繰り返し部分にずれが生じること)が起こることによって、複製対象のDNA断片のうちマイクロサテライト部分の繰り返し回数が増加又は減少してしまう現象が原因で生じるノイズであり、蛍光分析において繰り返し回数が増加又は減少したDNA断片がノイズピークとして観測されるものである。図20に示すように、『TA』が12回繰り返された正常なマイクロサテライトを含んだDNA断片2000のほか、『TA』が11回又は13回繰り返された異常なマイクロサテライトを含んだDNA断片2001又は2002が生成されて、蛍光分析においてStutterピークとして観測されることとなる。さらに多くの繰り返し回数の増減が起こることもあるので、PCRを行うことにより、複製元のDNA断片と同じ長さのDNA断片(66塩基)のほかに、マイクロサテライトのunit長の整数倍だけ長さが増加又減少したDNA断片が生成される可能性がある。
【0012】
+Aピークとは、PCRによりDNA断片を複製する際に、DNA断片に余分な塩基(通常はA)が1つ付加されてしまう現象が原因で生じるノイズであり、蛍光分析において1塩基付加されたDNA断片がノイズピークとして観測されるものである。図20に示すように、正常に複製されたDNA断片2000に1塩基付加されたDNA断片2003が生じるほか、slipped-strand mispairingによりマイクロサテライト部分の繰り返し回数が増加又は減少されてしまった異常なDNA断片2001及び2002にも1塩基付加されたDNA断片2004及び2005が生じることがある。これらの1塩基付加されたDNA断片2003,2004及び2005は、蛍光分析においてそれぞれ異なる+Aピークとして観測されることとなる。
【0013】
図20の蛍光分析結果を示すグラフでは、複製元のDNA断片と同じ長さである66塩基のDNA断片が本来観察されるべきピーク(以下、「真のピーク」と呼ぶ)であり、その他のピークは全てノイズピークである。この真のピークに対して、マイクロサテライトのunit長分の間隔を置いて(62塩基、64塩基、68塩基の位置に)Stutterピークが現れていることが分かる。さらに、真のピーク又はStutterピークのそれぞれよりも1塩基長い位置(63塩基、65塩基、67塩基、69塩基の位置)には+Aピークが現れていることが分かる。すなわち、63塩基、65塩基、67塩基、69塩基の位置に現れる+Aピークは、それぞれ、塩基長が62塩基、64塩基、66塩基、68塩基のDNA断片に1塩基付加されたDNA断片に対応していることになる。以下において、ある+Aピークに対して、その+Aピークが生じる元となった1塩基付加されていないDNA断片に対応する真のピーク又はStutterピークのことを「元のピーク」と呼ぶ。
【0014】
PCR及び電気泳動の実験過程においては、蛍光分析において観測される複数のピークのうち真のピークを他のノイズピークから判別することが非常に重要である。上記したStutterピーク及び+Aピークの2種類のノイズピークに関しては、そのようなピークが起こる分子生物学的理由が広く研究されており、ピークの高さの特徴の調査も行われている。その結果、蛍光分析結果の波形データからStutterピーク及び+Aピークを自動的に判別し除去するための様々な手法が開発されている。
【0015】
第1の手法として、波形データ中の1番高いピークを真のピークとし、その前後数塩基(ユーザが範囲を指定できる)にあるピークは、ノイズピーク(Stutterピーク又は+Aピーク)であると判断して捨てるという手法がある。例えば、ABI社のソフトウェア「GenoTyper」はこの手法を採用している。
【0016】
第2の手法として、マーカー毎、個体毎にノイズピーク(Stutterピーク、+Aピーク)の出方をモデル化してピーク判定を行う手法がある。その方法について図21を参照しながら説明する。図21の上段には、真のピークとそれに対するSutterピーク、さらにそれらのピークに対する+Aピークを含んだ波形モデル(以後、「基本波形と呼ぶ」)を示している。ここで、モデル化されているのは真のピークに対するSutterピーク及び+Aピークの相対的な高さ(シグナル強度)である。図21に示す例では、真のピーク(塩基長Xの位置)の高さを1000とするとき、真のピークに対する+Aピーク(塩基長X + 1の位置)の高さは500となり、真のピークの1unit左のStutterピーク(塩基長X−unit長の位置)の高さは600となっている。
【0017】
この基本波形を用いて、図21の中段に示すような実際に観察された波形データのピーク判定を行う。図21の下段には、中段の実際に観察された波形データに基本波形を当てはめた結果を示している。この当てはめは、観察された波形データのうち最も高いピーク(Pmax)を選び、これが基本波形における最も高いピーク(すなわち真のピーク)に相当するものとして、基本波形の最も高いピークがPmaxと同じ高さになるように基本波形全体の高さを調整して(基本波形の各ピーク間の相対的高さ関係は変化しない)、観察された波形データに重ね合わせることにより行う。図21の下段では、当てはめた基本波形を白い三角形で示しており、観察された波形データとのピーク高さの相違を上下方向の矢印で示している。
【0018】
ところで、1対のゲノム上のマイクロサテライトにはホモ接合体とヘテロ接合体とがある。抽出したDNA断片がホモ接合体である場合にはグラフに真のピークが1つだけ現れ、ヘテロ接合体である場合にはグラフに真のピークが2つ現れることになっている。このため、ヘテロ接合体に関しては、2つの真のピーク位置で2つの基本波形を重ねて当てはめることが必要となる。そこで、上記の基本波形当てはめを行った後に、当てはめた基本波形と観察された波形とのピーク高さの差が最大となるピーク(Pmax’)に着目する。このPmax’の位置にさらに基本波形(Pmax’の位置でのピーク高さを合わせたもの)を当てはめ、その結果、基本波形を1つ当てはめたときよりもよく当てはまっているならば、抽出したDNA断片はヘテロ接合体であると判定し、基本波形を1つ当てはめたときよりも当てはまり具合が悪ければ、抽出したDNA断片はホモ接合体であると判定する。
【0019】
図21の例では、基本波形を1つ当てはめたときのほうが当てはまり具合が良いので、ここで抽出したDNA断片に含まれるマイクロサテライトは、78塩基のホモ接合体であることが分かる。すなわち、78塩基の位置に現れたものが当該マイクロサテライト由来の真のピークである。一方、図22の例では、基本波形(図21に示したのと同じものである)を2つ当てはめたときのほうがよく当てはまっているので、ここで抽出したDNA断片に含まれるマイクロサテライトは、66塩基と74塩基のヘテロ接合体であることが分かる。すなわち、66塩基及び74塩基に現れたものが当該マイクロサテライト由来の真のピークである。
【0020】
例えば、特許文献1〜5、非特許文献1〜4などではこの第2の方法を採用している。
【特許文献1】米国特許第5,541,067号
【特許文献2】米国特許第5,580,728号
【特許文献3】米国特許第5,876,933号
【特許文献4】米国特許第6,054,268号
【特許文献5】米国特許第6,274,317号
【非特許文献1】Perlin, M. W., et al., “Toward Fully Automated Genotyping: Allele Assignment, Pedigree Construction, Phase Determination, and Recombination Detection in Duchenne Muscular Dystrophy”, Am. J. Hum. Genet. 55, 1994, p777-787
【非特許文献2】Perlin, M. W., et al., “Toward Fully Automated Genotyping: Genotyping Microsatellite Markers by Deconvolution”, Am. J. Hum. Genet. 57, 1995, p1199-1210
【非特許文献3】Palsson, B., et al., “Using Quality Measures to Facilitate Allele Calling in High-Throughput Genotyping”, Genome Research 9, 1999, p1002-1012
【非特許文献4】Stoughton, R., et al., “Data-adaptive algorithms for calling alleles in repeat polymorphisms”, Electrophoresis 18, 1997, p1-5
【非特許文献5】Smith, J. R., et al., “Approach to Genotyping Errors Caused by Nontemplated Nucleotide Addition by Taq DNA Polymerase”, Genome Research 5, 1995、p312-317
【発明の開示】
【発明が解決しようとする課題】
【0021】
しかしながら、上記した第1の手法では、1番高いピークを常に真のピークであるとするため、図23に示すように真のピークよりも高い+Aピークが出現してしまった場合には、ピーク判別を誤ってしまうことになる。尚、このような現象が起こりうることは、非特許文献5に報告されている。
【0022】
一方、上記した第2の手法では、Stutterピークと+Aピーク以外のノイズピークには対処することができないという問題点がある。DNA断片の電気泳動実験から得られる蛍光分析結果の波形データにおいて、Stutterピークと+Aピーク以外のノイズピークが現れる例を、図24及び図25を参照しながら説明する。図24において、PCR増幅反応の鋳型として用いられるDNA断片2401には、「GCTA」というunitの繰り返しからなるマイクロサテライト部分の他に、1塩基「G」の繰り返し部分が存在している。「GCTA」は12回繰り返し、「G」は15回繰り返しで、全体として100塩基のDNA断片となっている。このDNA断片2401をPCR実験により増幅すると、実験ノイズとして、マイクロサテライトのunit繰り返し数が変化したもの2402、末端に「A」が付加されたもの2403の他、1塩基「G」の繰り返し回数が変化したもの2404が生じることが知られている。これらのノイズとして増幅されたDNA断片2402、2403、2404は、それぞれ、電気泳動実験の波形データにおいて塩基長96、101、99の位置にノイズピークとして観察されることとなる。塩基長96、101の位置に現れたものがそれぞれStutterピーク、+Aピークであり、塩基長99の位置に現れたのはマイクロサテライトではない1塩基繰り返し部分に由来するノイズピークである。一方、図25には、「GCTA」というunitの繰り返しからなるマイクロサテライト部分の他に、2塩基「CA」の繰り返し部分が存在するDNA断片2501をPCR増幅反応の鋳型として用いている。この鋳型をPCR増幅した結果、実験ノイズとして、マイクロサテライトのunit繰り返し数が変化したもの2502、末端に「A」が付加されたもの2503の他、2塩基「CA」の繰り返し回数が変化したもの2504やその末端に「A」がさらに付加されたもの2505などが生じることが分かっている。これらのノイズとして増幅されたDNA断片2502、2503、2504、2505は、それぞれ、電気泳動実験の波形データにおいて塩基長96、101、98、99の位置にノイズピークとして観察されることとなる。
【0023】
従来技術(上記した第2の手法など)では、Stutterピークと+Aピーク以外のノイズピークが現れることを想定していないので、図24及び図25に示すようなノイズピークを含んだ波形データに対しては、正しいピーク判別を行うことができないという問題点があった。これについて、図26及び図27を参照しながら説明する。図26の上段に示す波形データは、図24で示したものと同じであり、99塩基の位置にStutterピーク、+Aピーク以外のノイズピークが出現している。この波形データに対して上記の第2の手法を適用すると、最大ピークPmaxに基本波形を当てはめた後、当てはめた基本波形と観察された波形とのピーク高さの差が最大となるピークPmax’として、99塩基の位置のノイズピークが選択されてしまう。その結果、100塩基の位置のピークと99塩基の位置のピークとが真のピークであると誤判定してしまうことになる。図27には、ヘテロ接合体の波形データを示している。100塩基及び108塩基の位置に真のピークが現れており、99塩基及び107塩基の位置にStutterピーク、+Aピーク以外のノイズピークが現れている。この波形データに対して上記の第2の手法を適用した場合にも、108塩基の位置の真のピークよりも高い99塩基の位置のノイズピークをPmax’としてしまうため、99塩基の位置のノイズピークが真のピークであるという誤判定をしてしまうことになる。
【0024】
本発明は、このような実情に鑑みてなされたものであり、DNA断片のPCR増幅産物の電気泳動実験から得られる蛍光分析結果の波形データにおいて、真のピークとノイズピークとを正しく判別して表示することができる表示方法及び表示装置を提供しようとするものである。特に、従来よく知られているStutterピークや+Aピーク以外のノイズピークが現れていても、真のピークを正しく判別することができる表示方法及び表示装置を提供しようとするものである。
【課題を解決するための手段】
【0025】
上記解決課題に鑑みて鋭意研究の結果、上記したように従来よく知られたStutterピークや+Aピークに加えて、PCR増幅反応の鋳型となるDNA断片にマイクロサテライト以外の繰り返し部分が存在することが原因で生じるノイズピークを含んだ波形(以下、「複合ピーク波形」と呼ぶ)データに対して、正しいピーク判別を行うための手段として、本発明者は、以下の3つの特徴を有するピーク判定手法を考えた。
特徴1)DNAマーカー(PCR増幅反応の鋳型)の配列情報から、複合ピーク波形を生ずるDNAマーカーであるかどうかを判定し、複合ピーク波形を生ずるDNAマーカーに対しては複合ピーク波形専用のピーク判定アルゴリズムを適用する。
特徴2)複合ピーク波形を生ずるDNAマーカーであるかどうかは、複合ピーク波形を生ずる原因となるマイクロサテライト以外の繰り返し部分の繰り返し回数が所定の閾値を越えているかどうかにより判定する。
特徴3)複合ピーク波形のピーク判定では、基本波形の当てはめの際に、1つ目の基本波形の当てはめ位置と1つ目の基本波形の当てはめ位置との間隔をunit長より長く取る。
【0026】
上記の特徴1について詳しく説明する。例えば、4塩基「GCTA」をunitとするマイクロサテライトを含んだ、
「…ATGCTAGCTAGCTAGCTAGCTAGCTAGCTAGCTAGCTAGCTAGCTAGCTACTGGGGGGGGGGGGGGGCG…」
という配列のDNAマーカーがあったとする。このDNAマーカーには、「GCTA」をunitとするマイクロサテライトの他に、1塩基「G」の繰り返し配列が含まれていることが配列情報から分かる。このような場合には、複合ピーク波形を生ずるDNAマーカーであると判定し、複合ピーク波形専用のピーク判定アルゴリズム(以下の特徴3を採用したピーク判定アルゴリズムである)を適用してピーク判定を行うこととする。複合ピーク波形を生じないDNAマーカーについては、従来のピーク判別手法を適用すればよい。
【0027】
上記の特徴2について詳しく説明する。DNAマーカーに含まれるマイクロサテライト以外の繰り返し部分が含まれている場合、その部分の繰り返し回数が何回以上であれば複合ピーク波形を生じるかという閾値を予め設定しておく。この閾値は、DNAマーカーの種類、実験環境、実験プロトコルなどにより異なり得るものであり、ユーザが経験的に決めた値を設定すればよい(本発明者は約10回程度を閾値とした)。また、繰り返し部分の繰り返し単位の長さ(塩基長)によっても異なり得るものである。このため、繰り返し単位の塩基長ごとに異なる閾値を指定できるようにしておくのが好ましい。例えば、1塩基単位の繰り返しについては閾値を12回、2塩基単位の繰り返しについては閾値を10回と設定するなどである。
上記の特徴3についは、後に本発明の実施形態として詳しく説明する。
【0028】
したがって、本発明によれば、上記の特徴1及び2により、電気泳動実験から得られる波形データが複合ピーク波形を生ずるDNAマーカーの波形データであるかどうかを適切に判定し、複合ピーク波形を生ずるDNAマーカーである場合には上記の特徴3により複合ピーク波形に特化したピーク判定アルゴリズムを用いてピーク判定を行うことができる。い、それ以外のマーカーに対しては既存技術による真のピーク判定を行うように、複数種類の真のピーク判定技術を使い分けることができる。また、第三の特徴により、複合ピーク波形を生ずるマーカーにおいて観察される波形に対しても、適切に真のピーク判定を行える。これにより、複合ピーク波形を生ずるマーカーに対しても、それ以外のマーカーに対しても、常に正しく真のピーク判定を行うことが可能となる。
【0029】
上記の特徴1〜3を具体的に実現するための手段として、本発明は、マイクロサテライトを含むDNA断片のPCR増幅産物について長さを分析した結果を表示する装置であって、前記PCR増幅産物の検出シグナルにおいて、前記DNA断片のマイクロサテライトの繰り返し単位が増加又は減少したPCR増幅産物の検出シグナルに相当するstutterピーク、及び前記DNA断片に1つのアデニンが付加したPCR増幅産物の検出シグナルに相当する+Aピーク以外のノイズピークが発生するかどうかを、前記DNA断片の配列情報に基づいて判定する複合ピーク波形判定部と、DNA断片の種類ごとにPCR増幅産物の検出シグナルにおけるstutterピーク及び+Aピークの出現パターンをモデル化した基本波形を、前記PCR増幅産物の検出シグナルに対して当てはめることにより、前記DNA断片のPCR増幅産物の検出シグナルに相当する真のピークを判別するピーク判別処理部と、前記ピーク判別処理部による真のピーク判別結果を表示する表示処理部とを有しており、前記ピーク判別処理部は、前記複合ピーク波形判定部により前記PCR増幅産物の検出シグナルにstutterピーク及び+Aピーク以外のノイズピークが発生すると判定された場合には、当該stutterピーク及び+Aピーク以外のノイズピークと推定されるピークを基本波形の当てはめ対象から除外することを特徴とする表示装置を提供するものである。
【0030】
本発明の表示装置において、前記複合ピーク波形判定部は、前記DNA断片に含まれるマイクロサテライト以外の1塩基以上を単位とする繰り返し配列が存在するかどうかに基づいて、前記PCR増幅産物の検出シグナルにstutterピーク及び+Aピーク以外のノイズピークが発生するかどうかを判定することを特徴とする。
【0031】
本発明の表示装置は、前記複合ピーク波形判定部における判定条件として、前記マイクロサテライト以外の繰り返し配列について、繰り返し単位の塩基長及び繰り返し回数の閾値をユーザに設定させるユーザ条件設定部をさらに有していることを特徴とする。
【0032】
本発明の表示装置において、前記ピーク判別処理部は、前記PCR増幅産物の検出シグナルに対して1つ目の基本波形を当てはめた後さらに2つ目の基本波形を当てはめる際に、1つ目の基本波形の当てはめ位置と2つ目の基本波形の当てはめ位置とを、前記DNA断片に含まれるマイクロサテライトのunit長以上離隔させて当てはめを行うことにより、stutterピーク及び+Aピーク以外のノイズピークと推定されるピークを基本波形の当てはめ対象から除外することを特徴とする。
【0033】
本発明の表示装置において、前記表示処理部は、前記PCR増幅産物の検出シグナルのグラフ、前記DNA断片の配列情報、及び前記複合ピーク波形判定部による判定結果とともに前記ピーク判別処理部による真のピーク判別結果を表示することを特徴とする。
【0034】
本発明は、また、マイクロサテライトを含むDNA断片のPCR増幅産物について長さを分析した結果を表示する方法であって、前記PCR増幅産物の検出シグナルにおいて、前記DNA断片のマイクロサテライトの繰り返し単位が増加又は減少したPCR増幅産物の検出シグナルに相当するstutterピーク、及び前記DNA断片に1つのアデニンが付加したPCR増幅産物の検出シグナルに相当する+Aピーク以外のノイズピークが発生するかどうかを、前記DNA断片の配列情報に基づいて判定する複合ピーク波形判定ステップと、DNA断片の種類ごとにPCR増幅産物の検出シグナルにおけるstutterピーク及び+Aピークの出現パターンをモデル化した基本波形を、前記PCR増幅産物の検出シグナルに対して当てはめることにより、前記DNA断片のPCR増幅産物の検出シグナルに相当する真のピークを判別するピーク判別処理ステップと、前記ピーク判別処理ステップにおける真のピーク判別結果を表示する表示処理ステップとを有しており、前記ピーク判別処理ステップでは、前記複合ピーク波形判定ステップにおいて前記PCR増幅産物の検出シグナルにstutterピーク及び+Aピーク以外のノイズピークが発生すると判定された場合には、当該stutterピーク及び+Aピーク以外のノイズピークと推定されるピークを基本波形の当てはめ対象から除外することを特徴とする表示方法を提供するものである。
【0035】
本発明の表示方法の前記複合ピーク波形判定ステップでは、前記DNA断片に含まれるマイクロサテライト以外の1塩基以上を単位とする繰り返し配列が存在するかどうかに基づいて、前記PCR増幅産物の検出シグナルにstutterピーク及び+Aピーク以外のノイズピークが発生するかどうかを判定することを特徴とする。
【0036】
本発明の表示方法は、前記複合ピーク波形判定ステップにおける判定条件として、前記マイクロサテライト以外の繰り返し配列について、繰り返し単位の塩基長及び繰り返し回数の閾値をユーザに設定させるユーザ条件設定ステップをさらに有していることを特徴とする。
【0037】
本発明の表示方法の前記ピーク判別処理ステップでは、前記PCR増幅産物の検出シグナルに対して1つ目の基本波形を当てはめた後さらに2つ目の基本波形を当てはめる際に、1つ目の基本波形の当てはめ位置と2つ目の基本波形の当てはめ位置とを、前記DNA断片に含まれるマイクロサテライトのunit長以上離隔させて当てはめを行うことにより、stutterピーク及び+Aピーク以外のノイズピークと推定されるピークを基本波形の当てはめ対象から除外することを特徴とする。
【0038】
本発明の表示方法の前記表示処理ステップでは、前記PCR増幅産物の検出シグナルのグラフ、前記DNA断片の配列情報、及び前記複合ピーク波形判定部による判定結果とともに前記ピーク判別処理ステップにおける真のピーク判別結果を表示することを特徴とする。
【0039】
本発明は、また、表示装置において上記したいずれかの表示方法を実行するためのプログラムを提供するものである。
【発明の効果】
【0040】
以上、説明したように、本発明の遺伝子情報の表示方法及び表示装置によれば、DNA断片のPCR増幅産物の電気泳動実験から得られる蛍光分析結果の波形データにおいて、DNA断片の配列情報に基づきStutterピークや+Aピーク以外のノイズピークを含んだ波形(複合ピーク波形)であるかどうかを判定し、その判定結果にもとづいて適切なピーク判定アルゴリズムを用いて真のピークの判定を行うことができる。また、複合ピーク波形であるかどうかを判定する基準をユーザが任意に設定できるので、解析対象のDNAマーカーごとに最適な判定条件を設定すれば、真のピーク判定処理の精度を大幅に向上することができる。
【発明を実施するための最良の形態】
【0041】
以下、添付図面を参照しながら、本発明の遺伝子情報の表示方法及び表示装置を実施するための最良の形態を詳細に説明する。図1〜図17は、本発明の実施の形態を例示する図であり、これらの図において、同一の符号を付した部分は同一物を表わし、基本的な構成及び動作は同様であるものとする。
【0042】
図1は、本発明の一実施形態として構築される遺伝子情報表示システムの内部構成を概略的に示す機能ブロック図である。この遺伝子情報表示システムは、PCR及び電気泳動実験の後PCR増幅産物を蛍光分析した結果得られる波形データをマーカーDNAごとに記憶した波形データDB100、マーカーDNAの配列情報を記憶した配列データDB101、波形データ及びその解析結果をグラフ表示するための表示装置102、表示されたグラフに対して個体やピークを選択するなどの操作を行うためのキーボード103とマウスなどのポインティングデバイス104、必要な演算処理、制御処理等を行う中央処理装置105、中央処理装置105での処理に必要なプログラムを格納するプログラムメモリ106、中央処理装置105での処理に必要なデータを格納するデータメモリ107を備えている。
【0043】
プログラムメモリ106は、ピーク判定対象とするDNAマーカーの波形データをデータメモリ107から読み込む波形データ読み込み部108と、波形データを読み込んだDNAマーカーのDNA配列情報をデータメモリ107から読み込む配列データ読み込み部109と、ピーク判定対象のDNAマーカーの配列情報からそのDNAマーカーが複合ピーク波形を生じるものであるかどうかを判定する基準となる条件をユーザに指定させるユーザ条件設定部110と、ユーザが指定した条件に従って、ピーク判定対象のDNAマーカーの配列データを参照し、そのDNAマーカーが複合ピーク波形を生じるものであるかどうかを判定する複合ピーク波形判定部111と、複合ピーク波形の判定結果に応じてDNAマーカーの波形データに対してピーク判定処理を行うピーク判定部112と、ピーク判定の結果を表示する表示処理部113とを含んでいる。
【0044】
データメモリ107は、DNAマーカーごとに複数個体の波形データを保持する波形データ114と、各マーカーの配列データ115とを含んでいる。波形データ114及び配列データ115は、それぞれ、波形データDB100及び配列データDB101から読み出されてデータメモリ107に保持されるものである。
【0045】
図2〜図4は、データメモリ107に含まれる波形データ114のデータ構造を示す図である。図2に示すデータ構造体MarkerData[]は、j個のDNAマーカーについて、各DNAマーカーを識別するためのマーカーID200、個体ごとに現れる波形データをインデックスした個体データPersonalWaveData[]へのポインタ201、複合ピーク波形が現れるかどうかを示す複合波形フラグ202、含まれるマイクロサテライトのunit203及びそのunit長204を示すデータ含んでいる。尚、データ202については、計算がまだ行われていない場合にはNULL値を持つものとする。図3に示すデータ構造体PersonalWaveData[]は、k個の個体について、各個体を識別するための個体ID300及び各個体の波形データPeakData[]へのポインタ301を示すデータ含んでいる。図4に示すデータ構造体PeakData[]は、l個のピークについて、各ピークが現われる位置(塩基長)400、各ピークの高さ401及びピークが真のピークであるかノイズピーク(Stutterピーク、+Aピーク、あるいは他のピーク)であるかを表すピークラベル402を示すデータ含んでいる。尚、データ402については、解析がまだ行われていない場合にはNULL値を持つものとする。
【0046】
図5は、データメモリ107に含まれる配列データ115のデータ構造を示す図である。図5に示すデータ構造体SequenceData[]は、m個のDNAマーカーについて、各DNAマーカーを識別するためのマーカーID500及び各DNAマーカーの塩基配列501を示すデータを含んでいる。
【0047】
図6は、本実施形態の遺伝子情報表示システムにおいて、DNAマーカーの波形データに対してピーク判定を行う処理全体の流れを示すフローチャートである。以下に説明する各ステップは、プログラムメモリ106の各処理部108〜113により実行されるものである。図6において、まず、波形データ読み込み部108は、ピーク判定処理の対象とする1つのDNAマーカーの波形データをデータメモリ107から取得する(ステップ600)。図2に示すデータ構造体MarkerData[]1つに相当するデータが読み込まれることになる。配列データ読み込み部109は、ステップ600で読み込んだDNAマーカーの配列データをデータメモリ107から取得する(ステップ601)。図5に示すデータ構造体SequenceData[]1つに相当するデータが読み込まれることになる。ユーザ条件設定部110は、ピーク判定対象のDNAマーカーの配列情報からそのDNAマーカーが複合ピーク波形を生じるものであるかどうかを判定する基準となる条件をユーザに指定させる(ステップ602)。具体的には、図7に示すようなユーザインタフェース画面を表示装置102に表示して、ユーザにキーボード103及びマウス104を用いた入力操作を促すものである。
【0048】
図7の画面には、ステップ600で波形データを読み込んだDNAマーカーのマーカーID700、同DNAマーカーが有するマイクロサテライトのunit701、そのunit長702、同DNAマーカーの配列703、並びにユーザが条件を指定するためのチェックボックス704及びプルダウンメニュー705が表示されている。表示項目701〜703は、波形データ構造体MarkerData[]や配列データ構造体SequenceData[]から取得されるものである。この画面において、ユーザはDNAマーカーの配列703を見て、マイクロサテライト以外にも1塩基「G」の余分な繰り返し配列が含まれていることがわかるので、一番上のチェックボックスにチェックを入れることができる。ユーザがチェックボックスにチェックするとその項目のプルダウンメニューが有効となり、複合ピーク波形発生の判定のための閾値となる繰り返し配列の繰り返し回数を設定することができる。この繰り返し回数はデフォルトで10回に設定されているものとする。また、DNAマーカーに含まれるマイクロサテライトのunit長と同じ塩基長の繰り返し配列に関しては指定することができないようになっている(図中、4塩基の項目のみ灰色で示している)。これは、そのような繰り返し配列により生じるノイズピークが真のピークに対するStutterピークと同じ位置に現れるので、Stutterピークと区別してピーク判定する必要がないからである。尚、図7の画面において、条件設定をする際の判断材料として、DNAマーカーの配列やマイクロサテライトunitの情報を表示するほか、プライマー配列や対立遺伝子の頻度等の情報を表示してもよい。以上が、図6に示すフローチャートのステップ602に関する説明である。
【0049】
続いて、複合ピーク波形判定部111は、ステップ602で設定されたマイクロサテライト以外の繰り返し配列に関する条件に従って、ステップ601で読み込んだDNAマーカーの配列データから複合ピーク波形が生じるかどうかを判定する(ステップ603)。この判定処理については、後に詳細に説明する。
【0050】
ステップ603において、複合ピーク波形が生じると判定された場合には、ピーク判定部112は、複合ピーク波形専用のピーク判定アルゴリズム(詳細は後述する)を用いて、波形データのピーク判定を行う(ステップ604)。ステップ603において、複合ピーク波形が生じないと判定された場合には、ピーク判定部112は、従来のピーク判定アルゴリズムを用いて、波形データのピーク判定を行う(ステップ605)。ここで、従来のピーク判定アルゴリズムとは、例えば、特許文献1〜5、非特許文献1〜4などに記載されているピーク判定手法を基にコンピュータ上で自動的にピーク判定を行うものである。尚、いずれのピーク判定アルゴリズムを用いる場合でも、ステップ600で読み込んだDNAマーカーの波形データ中に現れる各ピークが、真のピーク、+Aピーク、Stutterピークのいずれであるかを判定するものとする。このピーク判定結果は、図4に示すデータ構造体PeakData[]のピークラベル402に書き込まれる。
【0051】
その後、表示処理部113は、個体ごとに波形データのグラフ及びピーク判定結果を表示装置102に表示する(ステップ606)。図8は、波形データのグラフ及びピーク判定結果の表示画面の例を示す図である。図8に示す画面には、DNAマーカーのunit及び配列と、波形データと、波形データについてのピーク判定結果及び判定の根拠とが表示されている。ピーク判定結果については、波形データ中の真のピークであると判定したピーク(図では100塩基のピーク)を着色して表示する方法をとっており、また、この波形データが複合ピーク波形データであること及びその根拠を表示している。しかしながら、上記したようにピーク判定部112は、真のピーク、+Aピーク、Stutterピークを判別しているので、それぞれを表示するようにしてもよい。
【0052】
図9は、図6に示すフローチャートにおける複合ピーク波形発生の判定処理(ステップ603)を詳細に示すフローチャートである。図9において、まず、図6のステップ600及び601で読み込んだDNAマーカーの波形データ(データ構造体MarkerData[])及び配列データ(データ構造体SequenceData[])からマイクロサテライトのunit及びunit長とDNAマーカーの配列とを取得する(ステップ900)。取得したDNAマーカーの配列中のマイクロサテライト部分をマスクする(ステップ901)。このマスク処理の具体的態様を図10に示す。図10の(a)に示す例では、unitが「GCTA」、unit長が4塩基であるので、配列中の「GCTA」を「N」に置き換える処理を行う。図10の(b)に示す例では、unitが「CA」、unit長が2塩基であるが、このような場合には、マイクロサテライトのunitである「CA」と、それ以外の繰り返し配列の単位である「AT」とを両方マスクする。これにより、後の処理においてこのDNAマーカーの配列にはマイクロサテライト以外の繰り返し配列が含まれないと判定されることとなる。これは、「AT」の繰り返し回数が変化することにより生じるノイズピークも、マイクロサテライト部分の繰り返し回数が変化することにより生じるノイズピーク(Stutterピーク)も同じ塩基長の位置に現れるので、複合波形データであると判定する必要はないからである。
【0053】
続いて、図6のステップ602でユーザが設定した条件を取得する(ステップ902)。具体的には、図7に示す画面でユーザがチェックボックス704及びプルダウンメニュー705で指定した内容、すなわち、マイクロサテライト以外の繰り返し配列に関して、塩基長ごとに設定された繰り返し回数の閾値を取得する。取得したユーザ設定条件から、DNAマーカーの配列に適用するためのマッチング条件を生成する(ステップ903)。例えば、塩基長が1塩基で繰り返し回数の閾値が10回という条件が設定されている場合には、Aの10回以上の繰り返し、Tの10回以上の繰り返し、Gの10回以上の繰り返し、Cの10回以上の繰り返しというマッチング条件が生成されることになる。塩基長が2塩基で繰り返し回数が10回という条件が設定されている場合には、AT,AC,AG,TA,TC,TG,CA,CT,CG,GA,GT,GCのいずれかの10回以上の繰り返しというマッチング条件が生成されることになる。
【0054】
ステップ901でマスク処理したDNAマーカー配列がステップ903で生成されたマッチング条件に適合するかどうかを判定する(ステップ904)。例えば、マッチング条件が「A,T,G,Cのいずれかの10回以上の繰り返し」である場合には、図10(a)に示すマスク後の配列「…ATNNNNNNNNNNNNCTGGGGGGGGGGGGGGGCG……」は、このマッチング条件に適合することになる。マッチング条件に適合するということは、そのDNAマーカーが複合ピーク波形を生じるものであるということである。このマッチング処理の結果は、波形データのデータ構造体MarkerData[]の複合ピーク波形フラグに保存される(ステップ905)。DNAマーカー配列がマッチング条件に適合した場合には、複合ピーク波形フラグをtrueとし、適合しなかった場合には複合ピーク波形フラグをfalseとする。
【0055】
図11は、図6に示すフローチャートにおける複合ピーク波形に対するピーク判定処理(ステップ604)を詳細に示すフローチャートである。図11において、まず、ステップ600で取得したDNAマーカーの波形データに予め設定してある基本波形を当てはめる(ステップ1100)。当てはめられた基本波形のピーク高さとの差が最大となるピークをPmax’とする(ステップ1101)。次に、選択されたPmax’の位置と、基本波形の当てはめで1つめの真のピークとしたピークの位置との間の距離がマイクロサテライトのunit長未満であるかどうかを判定する(ステップ1102)。例えば、unit長が4塩基であり、基本波形の当てはめで真のピークを当てはめた位置が100塩基であった場合には、選択されたPmax’の位置が97塩基〜103塩基であるかどうかによって、以降の処理が分岐することになる。1つめの真のピークとPmax’との距離がunit長と同じかそれより長に場合には、Pmax’の位置を2つ目の真のピークとしてさらに基本波形を当てはめる(ステップ1103)。
【0056】
ステップ1102において、1つめの真のピークとPmax’との距離がunit長未満であるには、さらに、波形データ中の全てのピークについて、波形データのピークの高さと当てはめた基本波形のピーク高さとの差を計算し、その値がPmax’におけるピーク高さの差よりも小さいピークがあるかどうかを判定する(ステップ1104)。そのようなピークがない場合には、2つ目の基本波形の当てはめは行わずに真のピーク判定処理に進む。波形データ中に、基本波形とのピーク高さの差がPmax’のそれよりも小さいピークがある場合には、その高さの差の値が最も大きいピークを選び、これをPmax’として再定義し、ステップ1102に戻る(ステップ1105)。このようにしてステップ1102〜ステップ1105で1つ又は2つの基本波形の当てはめを行った後、その結果に基づいて真のピークを判定する(ステップ1106)。尚、ステップ1103において2つ目の基本波形を当てはめた場合には、基本波形を1つ当てはめた場合と2つ当てはめた場合とを比較して、当てはまり具合のよい方を採用する(ホモ接合体かヘテロ接合体かを決定する)のは、従来技術のピーク判定手法と同様である。また、ステップ1100,1101,1103,1106等における処理は、上記した従来技術と同様にして実行される。
【0057】
図12〜図14は、図11に示すフローチャートに従って実際にDNAマーカーの波形データを解析する手順を示す図である。ここでは、マイクロサテライトのunit長を4塩基とし、基本波形では真のピークが最も高いピークであるものとする。図12では、塩基長100の位置にPmaxをとって基本波形の当てはめを行うと、塩基長108の位置にPmax’をとることになり、1つの目の真のピークと推定したピーク(すなわちPmax)とPmax’との間の距離がunit長よりも大きいので、図11のステップ1102からステップ1103へと進み、Pmax’に2つ目の基本波形を当てはめている。2つの基本波形の当てはまり具合から、この波形データにおいて、塩基長100におけるピークと塩基長108におけるピークとが真のピークであると判定される。
【0058】
図13では、塩基長100の位置にPmaxをとって基本波形の当てはめを行うと、塩基長99の位置にPmax’をとることになり、1つの目の真のピークと推定したピーク(すなわちPmax)とPmax’との間の距離がunit長以内であるから、図11のステップ1102からステップ1104,1105へと進み、基本波形とのピーク高さの差が次に大きい塩基長101の位置のピークを新たなPmax’に再設定する。ところが、この新たなPmax’もPmax との距離がunit長以内であるので、ステップ1102からステップ1104へと進み他のピークを探すが、波形データ中に、基本波形とのピーク高さの差がPmax’のそれよりも小さいピークがもはや存在しないので、1つ目の基本波形を当てはめたのみで、ピーク判定処理へと進む。
【0059】
図14では、塩基長100の位置にPmaxをとって基本波形の当てはめを行うと、塩基長99の位置にPmax’をとることになる。1つの目の真のピークと推定したピーク(すなわちPmax)とPmax’との間の距離がunit長以内であるから、図11のステップ1102からステップ1104,1105へと進み、基本波形とのピーク高さの差が次に大きい塩基長108の位置のピークを新たなPmax’に再設定する。この新たなPmax’はPmax との距離がunit長よりも大きいので、ステップ1102からステップ1103へと進み、Pmax’に2つ目の基本波形を当てはめている。2つの基本波形の当てはまり具合から、この波形データにおいて、塩基長100におけるピークと塩基長108におけるピークとが真のピークであると判定される。
【0060】
図12〜図14に示す手順によりDNAマーカーの波形データの解析を行った際のピーク判定結果の表示画面の例を、それぞれ、図15〜図17に示す。このように、DNAマーカーの波形データと配列の両方を表示することにより、ユーザは単にピーク判定結果を受け取るのみならず、ノイズピークの原因となる配列を容易に確認することができる。これは、ユーザが、DNAマーカーの配列と現れる波形との関係についての知見を得るのにも役立つ。
【0061】
図12〜図17に示す本実施形態の遺伝子情報表示システムによるピーク判定結果と、図26及び図27に示す従来技術のピーク判定手法によるピーク判定結果と比較すると、本実施形態の遺伝子情報表示システムでは、Stutterピークと+Aピーク以外のノイズピークの出現によりピークを誤判定してしまうという従来技術の問題点が解消されており、DANマーカーがホモ接合体であるかヘテロ接合体であるかに関わらず、真のピークを正しく判定することが可能であることが分かる。尚、図12〜図17では、真のピークが他のノイズピークよりも高い基本波形を用いているが、+Aピークが真のピークよりも高く現れるDANマーカーを解析対象とする場合には、そのような基本波形を用いればよい。これにより、1番高いピークが真のピークであるかノイズピークであるかを問わず、正しくピーク判定を行うことができる。
【0062】
以上、本発明の遺伝子情報の表示方法及び表示装置について、具体的な実施の形態を示して説明したが、本発明はこれらに限定されるものではない。当業者であれば、本発明の要旨を逸脱しない範囲内において、上記各実施形態又は他の実施形態にかかる発明の構成及び機能に様々な変更・改良を加えることが可能である。
【0063】
尚、本発明の遺伝子情報の表示方法及び表示装置は、疾患などの表現型に関与する遺伝子の探索を目的とする個体の遺伝子型推定技術に応用することができるほか、疾患以外の表現型に関与する遺伝子の探索を目的とする個体の遺伝子型推定技術・DNA鑑定における遺伝子型推定技術などについても応用可能である。また、ヒトのみならず農産物・水産物などの遺伝子を対象とすることができる。
【0064】
また、上記の説明では、PCRで増幅したマーカーDNA断片を電気泳動する場合について述べたが、これ以外の実験手法にも本発明を応用することは可能である。例えば、PCR増幅産物をレーザー光照射によりイオン化し質量を決定するMALDI-TOF-MS(Matrix Assisted Laser Desorption Ionization Time Of Flight Mass Spectrometry、マトリックス支援レーザー脱離イオン化飛行時間型質量分析計)において得られる波形データの解析においても、本発明の遺伝子情報の表示方法及び表示装置を用いて、ノイズピークを適切に処理することができる。
【産業上の利用可能性】
【0065】
本発明の遺伝子情報の表示方法及び表示装置は、例えば、実験データ解析装置として用いられるパーソナルコンピュータなどに実装されて利用され得るものである。
【図面の簡単な説明】
【0066】
【図1】本発明の一実施形態として構築される遺伝子情報表示システムの内部構成を概略的に示す機能ブロック図である。
【図2】図1に示す遺伝子情報表示システムのデータメモリに含まれる波形データのデータ構造を示す図である。
【図3】図1に示す遺伝子情報表示システムのデータメモリに含まれる波形データのデータ構造を示す図である。
【図4】図1に示す遺伝子情報表示システムのデータメモリに含まれる波形データのデータ構造を示す図である。
【図5】図1に示す遺伝子情報表示システムのデータメモリに含まれる配列データのデータ構造を示す図である。
【図6】図1に示す遺伝子情報表示システムにおいて、DNAマーカーの波形データに対してピーク判定を行う処理全体の流れを示すフローチャートである。
【図7】ユーザに繰り返し配列に関する条件の入力を促すために表示装置にユーザインタフェース画面を示す図である。
【図8】ピーク判定処理の結果として、波形データのグラフ及びピーク判定結果を表示する画面の例を示す図である。
【図9】図6に示すフローチャートにおける複合ピーク波形発生の判定処理(ステップ603)を詳細に示すフローチャートである。
【図10】図10に示すフローチャートにおけるDNAマーカーの配列中のマイクロサテライト部分をマスクする処理(ステップ901)の具体的態様を示す図である。
【図11】図6に示すフローチャートにおける複合ピーク波形に対するピーク判定処理(ステップ604)を詳細に示すフローチャートである。
【図12】図11に示すフローチャートに従って実際にDNAマーカーの波形データを解析する手順を示す図である。
【図13】図11に示すフローチャートに従って実際にDNAマーカーの波形データを解析する手順を示す図である。
【図14】図11に示すフローチャートに従って実際にDNAマーカーの波形データを解析する手順を示す図である。
【図15】図12に示す手順によりDNAマーカーの波形データの解析を行った際のピーク判定結果の表示画面の例を示す図である。
【図16】図13に示す手順によりDNAマーカーの波形データの解析を行った際のピーク判定結果の表示画面の例を示す図である。
【図17】図14に示す手順によりDNAマーカーの波形データの解析を行った際のピーク判定結果の表示画面の例を示す図である。
【図18】ゲノム上に表れるマイクロサテライトについて説明する図である。
【図19】PCR及び電気泳動により、マイクロサテライト部分のDNA断片を抽出し増幅する実験手順を模式的に示す図である。
【図20】PCR及び電気泳動の実験過程で生じる代表的なノイズである、Stutterピークと+Aピークについて説明する図である。
【図21】DNA断片の電気泳動実験から得られる蛍光分析結果の波形データに対して、ノイズピークの現れ方をモデル化した波形を用いてノイズピークを判別する従来技術の手法を説明する図である。
【図22】DNA断片の電気泳動実験から得られる蛍光分析結果の波形データに対して、ノイズピークの現れ方をモデル化した波形を用いてノイズピークを判別する従来技術の手法を説明する図である。
【図23】DNA断片の電気泳動実験から得られる蛍光分析結果の波形データにおいて真のピークよりも高い+Aピークが出現する例を示す図である。
【図24】DNA断片の電気泳動実験から得られる蛍光分析結果の波形データにおいて、Stutterピークと+Aピーク以外のノイズピークが現れる例を示す図である。
【図25】DNA断片の電気泳動実験から得られる蛍光分析結果の波形データにおいて、Stutterピークと+Aピーク以外のノイズピークが現れる例を示す図である。
【図26】従来技術によるピーク判定方法の問題点を説明する図である。
【図27】従来技術によるピーク判定方法の問題点を説明する図である。
【符号の説明】
【0067】
100 波形データDB
101 配列データDB
102 表示装置
103 キーボード
104 ポインティングデバイス(マウス)
105 中央処理装置
106 プログラムメモリ
107 データメモリ
108 波形データ読み込み部
109 配列データ読み込み部
110 ユーザ条件設定部
111 複合ピーク波形判定部
112 ピーク判定部
113 表示処理部
114 波形データ
115 配列データ

【特許請求の範囲】
【請求項1】
マイクロサテライトを含むDNA断片のPCR増幅産物について長さを分析した結果を表示する装置であって、
前記PCR増幅産物の検出シグナルにおいて、前記DNA断片のマイクロサテライトの繰り返し単位が増加又は減少したPCR増幅産物の検出シグナルに相当するstutterピーク、及び前記DNA断片に1つのアデニンが付加したPCR増幅産物の検出シグナルに相当する+Aピーク以外のノイズピークが発生するかどうかを、前記DNA断片の配列情報に基づいて判定する複合ピーク波形判定部と、
DNA断片の種類ごとにPCR増幅産物の検出シグナルにおけるstutterピーク及び+Aピークの出現パターンをモデル化した基本波形を、前記PCR増幅産物の検出シグナルに対して当てはめることにより、前記DNA断片のPCR増幅産物の検出シグナルに相当する真のピークを判別するピーク判別処理部と、
前記ピーク判別処理部による真のピーク判別結果を表示する表示処理部とを有しており、
前記ピーク判別処理部は、前記複合ピーク波形判定部により前記PCR増幅産物の検出シグナルにstutterピーク及び+Aピーク以外のノイズピークが発生すると判定された場合には、当該stutterピーク及び+Aピーク以外のノイズピークと推定されるピークを基本波形の当てはめ対象から除外することを特徴とする表示装置。
【請求項2】
前記複合ピーク波形判定部は、前記DNA断片に含まれるマイクロサテライト以外の1塩基以上を単位とする繰り返し配列が存在するかどうかに基づいて、前記PCR増幅産物の検出シグナルにstutterピーク及び+Aピーク以外のノイズピークが発生するかどうかを判定することを特徴とする請求項1に記載の表示装置。
【請求項3】
前記複合ピーク波形判定部における判定条件として、前記マイクロサテライト以外の繰り返し配列について、繰り返し単位の塩基長及び繰り返し回数の閾値をユーザに設定させるユーザ条件設定部をさらに有していることを特徴とする請求項2に記載の表示装置。
【請求項4】
前記ピーク判別処理部は、前記PCR増幅産物の検出シグナルに対して1つ目の基本波形を当てはめた後さらに2つ目の基本波形を当てはめる際に、1つ目の基本波形の当てはめ位置と2つ目の基本波形の当てはめ位置とを、前記DNA断片に含まれるマイクロサテライトのunit長以上離隔させて当てはめを行うことにより、stutterピーク及び+Aピーク以外のノイズピークと推定されるピークを基本波形の当てはめ対象から除外することを特徴とする請求項1から3のいずれか1項に記載の表示装置。
【請求項5】
前記表示処理部は、前記PCR増幅産物の検出シグナルのグラフ、前記DNA断片の配列情報、及び前記複合ピーク波形判定部による判定結果とともに前記ピーク判別処理部による真のピーク判別結果を表示することを特徴とする請求項1から4のいずれか1項に記載の表示装置。
【請求項6】
マイクロサテライトを含むDNA断片のPCR増幅産物について長さを分析した結果を表示する方法であって、
前記PCR増幅産物の検出シグナルにおいて、前記DNA断片のマイクロサテライトの繰り返し単位が増加又は減少したPCR増幅産物の検出シグナルに相当するstutterピーク、及び前記DNA断片に1つのアデニンが付加したPCR増幅産物の検出シグナルに相当する+Aピーク以外のノイズピークが発生するかどうかを、前記DNA断片の配列情報に基づいて判定する複合ピーク波形判定ステップと、
DNA断片の種類ごとにPCR増幅産物の検出シグナルにおけるstutterピーク及び+Aピークの出現パターンをモデル化した基本波形を、前記PCR増幅産物の検出シグナルに対して当てはめることにより、前記DNA断片のPCR増幅産物の検出シグナルに相当する真のピークを判別するピーク判別処理ステップと、
前記ピーク判別処理ステップにおける真のピーク判別結果を表示する表示処理ステップとを有しており、
前記ピーク判別処理ステップでは、前記複合ピーク波形判定ステップにおいて前記PCR増幅産物の検出シグナルにstutterピーク及び+Aピーク以外のノイズピークが発生すると判定された場合には、当該stutterピーク及び+Aピーク以外のノイズピークと推定されるピークを基本波形の当てはめ対象から除外することを特徴とする表示方法。
【請求項7】
前記複合ピーク波形判定ステップでは、前記DNA断片に含まれるマイクロサテライト以外の1塩基以上を単位とする繰り返し配列が存在するかどうかに基づいて、前記PCR増幅産物の検出シグナルにstutterピーク及び+Aピーク以外のノイズピークが発生するかどうかを判定することを特徴とする請求項6に記載の表示方法。
【請求項8】
前記複合ピーク波形判定ステップにおける判定条件として、前記マイクロサテライト以外の繰り返し配列について、繰り返し単位の塩基長及び繰り返し回数の閾値をユーザに設定させるユーザ条件設定ステップをさらに有していることを特徴とする請求項7に記載の表示方法。
【請求項9】
前記ピーク判別処理ステップでは、前記PCR増幅産物の検出シグナルに対して1つ目の基本波形を当てはめた後さらに2つ目の基本波形を当てはめる際に、1つ目の基本波形の当てはめ位置と2つ目の基本波形の当てはめ位置とを、前記DNA断片に含まれるマイクロサテライトのunit長以上離隔させて当てはめを行うことにより、stutterピーク及び+Aピーク以外のノイズピークと推定されるピークを基本波形の当てはめ対象から除外することを特徴とする請求項6から8のいずれか1項に記載の表示方法。
【請求項10】
前記表示処理ステップでは、前記PCR増幅産物の検出シグナルのグラフ、前記DNA断片の配列情報、及び前記複合ピーク波形判定部による判定結果とともに前記ピーク判別処理ステップにおける真のピーク判別結果を表示することを特徴とする請求項6から9のいずれか1項に記載の表示方法。
【請求項11】
表示装置において、請求項6から10のいずれか1項に記載の表示方法を実行するためのプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate

【図21】
image rotate

【図22】
image rotate

【図23】
image rotate

【図24】
image rotate

【図25】
image rotate

【図26】
image rotate

【図27】
image rotate


【公開番号】特開2006−79334(P2006−79334A)
【公開日】平成18年3月23日(2006.3.23)
【国際特許分類】
【出願番号】特願2004−262431(P2004−262431)
【出願日】平成16年9月9日(2004.9.9)
【国等の委託研究の成果に係る記載事項】(出願人による申告)平成15年度、独立行政法人新エネルギー・産業技術総合開発機構「遺伝子多様性モデル解析事業」に係る委託研究、産業再生法第30条の適用を受ける特許出願
【出願人】(000233055)日立ソフトウエアエンジニアリング株式会社 (1,610)