遺伝子情報の表示方法及び表示装置
【課題】 PCR増幅産物の蛍光分析結果データから真のシグナルとノイズシグナルとを的確に判別して表示することができる表示方法及び表示装置を提供する。
【解決手段】 同一の蛍光分析結果データ中では元のピークと+Aピークとの高さ比が一定であるという特徴を利用して、蛍光シグナルの複数のピークについて、1塩基離れた2つのピークを元のピークと+Aピークの対として組分けして表示する。
【解決手段】 同一の蛍光分析結果データ中では元のピークと+Aピークとの高さ比が一定であるという特徴を利用して、蛍光シグナルの複数のピークについて、1塩基離れた2つのピークを元のピークと+Aピークの対として組分けして表示する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、個体の疾患や外形的特徴などの表現型に関与している遺伝子を特定するための解析作業に用いる遺伝子情報の表示方法及び表示装置に関し、特に、解析対象の遺伝子が含まれるDNA断片をPCRや電気泳動などにより抽出し検出する際に、解析対象からのシグナルとノイズシグナルとを的確に判別して表示することができる方法及び装置に関するものである。
【背景技術】
【0002】
ヒトゲノムの完全解読後、遺伝子の機能解析研究が活発に行われている。そのなかでも特定の疾患の有無、薬物の効果の程度、副作用の有無などの表現型に関与する遺伝子の探索での基盤となる、遺伝子型決定の自動化が特に注目されている。
【0003】
マイクロサテライト
通常、同種の生物のゲノムはほぼ似通った塩基配列を有しているが、いくつかの個所では異なった塩基を有している。例えば、1つの遺伝子座において、ある個体はAを有しており、他の個体はTを有している場合などがある。このように個体間でゲノム上の単一の塩基に多型性が見られることをSNP(Single Nucleotide Polymorphism)と言う。
【0004】
一方、生物のゲノム中には、2塩基から6塩基の短い配列パターンが数回〜数十回繰り返されて表れる箇所が非常に多く(数万箇所以上)存在する。この特徴的な配列パターンのことをマイクロサテライトと呼んでいる。ゲノム上に現れるマイクロサテライトの例を図18に示す。マイクロサテライトにおける繰り返し単位をunitと呼び、unitの塩基数をunit長と呼んでいる。例えば、図18に示すATATATAT...というマイクロサテライトでは、unitは『AT』であり、unit長は2塩基である。図18に示すように、マイクロサテライトは、個体間でunit及びunit長が同じであっても、その繰り返し回数が個体によって異なることがある。
【0005】
上記したようにSNP及びマイクロサテライトは個体間で異なり得るので、ゲノム上で他の塩基配列と区別がしやすい部分であり、実験的にも検出が容易である。また、生物種によっては、ゲノム上のSNP及びマイクロサテライトが存在するおおよその位置が判っているので、ゲノム上の位置を示す指標として用いることができる。このような性質から、SNPやマイクロサテライトのことをDNAマーカーと呼んでいる。特に、マイクロサテライトは複数の塩基を含んでいるので、SNPよりも多くの情報量を有しており、DNAマーカーとして頻繁に用いられている。
【0006】
ところで、図18に示すように、多くの生物の個体は、雌性配偶子と雄性配偶子に由来する1組のゲノム(相同染色体)を有している。1組のゲノム上の互いに対応する部位に存在する遺伝子を、それぞれ対立遺伝子(allele)と言い、これらの組み合わせを遺伝子型(genotype)と言う。上記したように、ゲノム上のSNPやマイクロサテライトは、個体間で塩基配列が異なり得る部分であるので、一般的に、SNPには2つ又は3つの対立遺伝子が存在し、マイクロサテライトには数種類〜20種類以上の対立遺伝子が存在する。図18に示す例では、個体Aは、『AT』というunitを5回繰り返したものと7回繰り返したものとを有しており、個体Bは、『AT』というunitを6回繰り返したものを2つ有している。ここで、個体Aのように異なる種類の対立遺伝子を1つずつ持っている状態をヘテロ接合と言い、個体Bのように同じ種類の対立遺伝子を2つ持っている状態をホモ接合と言う。
【0007】
PCR及び電気泳動実験
DNAマーカーとしてマイクロサテライトを用いる場合、ゲノム上のマイクロサテライトが現れている箇所を抽出して検出するための実験としてPCR(Polymerase Chain Reaction)や電気泳動などの実験が行われる。PCRは、マイクロサテライトの両端においてプライマー配列と呼ばれる一対の塩基配列を指定することで、それらの間にはさまれるマイクロサテライト部分のみをDNA断片として繰り返し複製することにより、一定量のサンプルを取得する実験技術である。電気泳動には、ゲル電気泳動やキャピラリ電気泳動などの手法があり、増幅したDNA断片を荷電された泳動路で泳動させて、長さの異なるDNA断片を分離する実験技術である。電気泳動は、DNA断片の長さによって泳動路における泳動速度が異なる(長いDNA断片ほど泳動速度が小さい)ことを利用したサンプル分離手法である。
【0008】
図19は、PCR及びゲル電気泳動により、マイクロサテライト部分のDNA断片を抽出し増幅する実験手順を模式的に示す図である。まず、対象となるマイクロサテライトを挟んで一対のプライマー配列1900及び1901を指定し、マイクロサテライト及びプライマー配列を含んだゲノム領域1902がPCR実験により増幅される。図19に示す例では、2本の相同染色体上でのマイクロサテライトの繰り返し数が異なるヘテロ接合であり、それぞれマイクロサテライト部分の長さが異なるため、それぞれから長さの異なる2種類のPCR増幅産物すなわちDNA断片(66塩基および58塩基)が得られる。これらを板状のゲル上で一定時間電気泳動させると、上記2種類のPCR増幅産物はそのDNA断片の長さの違いによって分離されることとなる。各DNA断片には蛍光色素をつけておき、電気泳動後に各DNA断片からの蛍光シグナルの強度及び位置を検出することにより、図19に示すように、横軸にDNA断片の長さ(すなわち泳動した距離)、縦軸に蛍光シグナル強度(すなわちDNA断片の存在量)をプロットしたグラフが得られる。また、PCR増幅産物とともに、長さがあらかじめ分かっているDNA断片(サイズマーカーと呼ばれる)を電気泳動させておき、これらの蛍光シグナルも検出すれば、サイズマーカーの検出位置を基準として各PCR増幅産物の長さを知ることができる。
【0009】
尚、上記ではゲル電気泳動を用いた実験手法について述べたが、キャピラリ電気泳動によっても同様のことを行うことができる。キャピラリ電気泳動では、サンプルにゲルを詰めた細い管の中を泳動させ、各種サンプルが一定距離(通常はキャピラリの終端まで)を泳動し終わるまでに要した時間を計測して、DNA断片の長さを調べる手法である。キャピラリ電気泳動においては、ゲル中のサンプルからの蛍光シグナルをスキャンするのではなく、キャピラリ終端に備えた蛍光シグナル検出器によりサンプルを検出するのが一般的である。
【0010】
PCR及び電気泳動実験において生じるノイズ
上記の図19に示した実験結果は、PCR及び電気泳動が理想的な過程で行われた場合に得られるものであり、実際の実験においては様々なノイズが生じることがある。PCR及び電気泳動の実験過程で生じる代表的なノイズである、Stutterピークと+Aピークについて、図20を参照しながら以下に説明する。簡単のため、図20では、図19に示した長さ66塩基のDNA断片(『TA』が12回繰り返されたマイクロサテライトを含む)のみを例に挙げている。
【0011】
Stutterピークとは、PCR反応の際にslipped-strand mispairingが起こることによって、複製対象のDNA断片のうちマイクロサテライト部分の繰り返し回数が増加又は減少してしまう現象が原因で生じるノイズであり、蛍光分析において繰り返し回数が増加又は減少したDNA断片がノイズピークとして観測されるものである。図20に示すように、『TA』が12回繰り返された正常なマイクロサテライトを含んだDNA断片2000のほか、『TA』が11回又は13回繰り返された異常なマイクロサテライトを含んだDNA断片2001又は2002が生成されて、蛍光分析においてStutterピークとして観測されることとなる。さらに多くの繰り返し回数の増減が起こることもあるので、PCRを行うことにより、複製元のDNA断片と同じ長さのDNA断片(66塩基)のほかに、マイクロサテライトのunit長の整数倍だけ長さが増加又減少したDNA断片が生成される可能性がある。
【0012】
+Aピークとは、PCRによりDNA断片を複製する際に、DNA断片に余分な塩基(通常はA)が1つ付加されてしまう現象が原因で生じるノイズであり、蛍光分析において1塩基付加されたDNA断片がノイズピークとして観測されるものである。図20に示すように、正常に複製されたDNA断片2000に1塩基付加されたDNA断片2003が生じるほか、slipped-strand mispairingによりマイクロサテライト部分の繰り返し回数が増加又は減少されてしまった異常なDNA断片2001及び2002にも1塩基付加されたDNA断片2004及び2005が生じることがある。これらの1塩基付加されたDNA断片2003,2004及び2005は、蛍光分析においてそれぞれ異なる+Aピークとして観測されることとなる。
【0013】
図20の蛍光分析結果を示すグラフでは、複製元のDNA断片と同じ長さである66塩基のDNA断片が本来観察されるべきピーク(以下、「真のピーク」と呼ぶ)であり、その他のピークは全てノイズピークである。この真のピークに対して、マイクロサテライトのunit長分の間隔を置いて(62塩基、64塩基、68塩基の位置に)Stutterピークが現れていることが分かる。さらに、真のピーク又はStutterピークのそれぞれよりも1塩基長い位置(63塩基、65塩基、67塩基、69塩基の位置)には+Aピークが現れていることが分かる。すなわち、63塩基、65塩基、67塩基、69塩基の位置に現れる+Aピークは、それぞれ、塩基長が62塩基、64塩基、66塩基、68塩基のDNA断片に1塩基付加されたDNA断片に対応していることになる。以下において、ある+Aピークに対して、その+Aピークが生じる元となった1塩基付加されていないDNA断片に対応する真のピーク又はStutterピークのことを「元のピーク」と呼ぶ。
【0014】
PCR及び電気泳動の実験過程においては、蛍光分析において観測される複数のピークのうち真のピークを他のノイズピークから判別することが非常に重要である。上記したノイズピークのうち、Stutterピークに関してはその判別方法が広く研究されており、特許文献1〜5、非特許文献1〜4などに開示されている方法により的確な判別が行えるようになっている。また、Stutterピークを判別し除去する処理を行うソフトウェアとしては、Cybergenetics社のソフトウェア「TrueAllele」、LI-COR社のソフトウェア「SAGA」、ABI社のソフトウェア「GenoTyper」、ABI社のソフトウェア「GeneMapper」などが知られている。
【特許文献1】米国特許第5,541,067号
【特許文献2】米国特許第5,580,728号
【特許文献3】米国特許第5,876,933号
【特許文献4】米国特許第6,054,268号
【特許文献5】米国特許第6,274,317号
【非特許文献1】Perlin, M. W., et al., “Toward Fully Automated Genotyping: Allele Assignment, Pedigree Construction, Phase Determination, and Recombination Detection in Duchenne Muscular Dystrophy”, Am. J. Hum. Genet. 55, 1994, p777-787
【非特許文献2】Perlin, M. W., et al., “Toward Fully Automated Genotyping: Genotyping Microsatellite Markers by Deconvolution”, Am. J. Hum. Genet. 57, 1995, p1199-1210
【非特許文献3】Palsson, B., et al., “Using Quality Measures to Facilitate Allele Calling in High-Throughput Genotyping”, Genome Research 9, 1999, p1002-1012
【非特許文献4】Stoughton, R., et al., “Data-adaptive algorithms for calling alleles in repeat polymorphisms”, Electrophoresis 18, 1997, p1-5
【非特許文献5】Smith, J. R., et al., “Approach to Genotyping Errors Caused by Nontemplated Nucleotide Addition by Taq DNA Polymerase”, Genome Research 5, 1995、p312-317
【発明の開示】
【発明が解決しようとする課題】
【0015】
一方、蛍光シグナルのグラフ波形から+Aピークを判別するのは、Stutterピークを判別するのに比べて困難である。その理由は、+Aピークが元のピークより高くなる場合も低くなる場合もあるためであり、また、同一のマイクロサテライトについて同一のサンプル(同一個体)で複数回実験を行った場合であっても、+Aピークの現れ方(元のピークに対する+Aピークの相対的高さ)が変動するためである。非特許文献5では、真のピークとそれに対する+Aピークとの高さの比に着目して実験及び解析を行っているが、上記した+Aピークの判別の困難さを克服することはできていない。
【0016】
ところで、1組のゲノム上のマイクロサテライトにはホモ接合体とヘテロ接合体とがあるが、抽出したDNA断片がいずれであるかによって、蛍光シグナルのグラフ波形が大きく異なってくる。ホモ接合体の場合にはグラフに真のピークが1つだけ現れ、ヘテロ接合体の場合にはグラフに真のピークが2つ現れることになっている。しかしながら、図20の蛍光分析結果を示すグラフからも明らかなように、ホモ接合体であっても多数のピークが現れることがあるので、蛍光シグナルのグラフ波形やピークの数から、抽出したDNA断片がホモ接合体であるかヘテロ接合体であるかを判断することは不可能である。
【0017】
さらに、ヘテロ接合体の場合には、ピーク同士が重なり合うことと、2つの真のピークの高さが完全に等しいとは限らないことから、波形が非常に複雑なものとなってしまう。以下、図21を参照しながらホモ接合体及びヘテロ接合体それぞれに現れる波形について説明する。まず、ホモ接合体の場合に現れる波形を図21の(a)及び(b)に示す。(a)は66塩基のDNA断片から得られる波形であり、(b)は68塩基のDNA断片から得られる波形である。次に、ヘテロ接合体の場合に現れる波形を図21の(c)及び(d)に示す。このヘテロ接合体からのPCR増幅産物として、66塩基のDNA断片と68塩基のDNA断片とが得られるものとする。(c)は、PCR増幅産物に含まれる66塩基のDNA断片により現れる真のピークと、68塩基のDNA断片により現れる真のピークとが等しい高さであると仮定して、両者の波形(点線で示す波形と破線で示す波形)を合成して得られる波形である。一方、(d)は、PCR増幅産物に含まれる66塩基のDNA断片により現れる真のピークと、68塩基のDNA断片により現れる真のピークとが異なる高さである場合の合成波形である。(c)では66塩基及び68塩基におけるピークが他のピークよりも比較的高いので、これらが真のピークであると推測することが容易であるが、(d)では66塩基におけるピークが他のピークに比べて突出して高いので、66塩基に1つの真のピークを有するホモ接合体であると誤判断してしまう可能性がある。あるいは、ヘテロ接合体であることが分かっているとしても、多数現れている比較的高いピークのうちいずれの2つを真のピークとするかの判断が困難である。
【0018】
PCR増幅産物を蛍光分析して得られる波形データはこのように複雑であるため、真のピークの個数及び真のピークの位置を正しく判断するのは非常に困難である。この判断を的確に行う手法は存在しておらず、現状では波形データの解析には熟練した研究者の勘に頼るところが大きく、遺伝子の機能解析研究のボトルネックとなっている。
【0019】
本発明は、このような実情に鑑みてなされたものであり、PCR増幅産物の蛍光分析結果データから真のシグナルとノイズシグナルとを的確に判別して表示することができる表示方法及び表示装置を提供しようとするものである。
【課題を解決するための手段】
【0020】
本発明者は、まず、PCR増幅産物の蛍光分析結果を示すグラフにおいて現れる波形及び+Aピークに関して、以下のような特徴があることを発見した。
・特徴1 1個体について1度の実験で得られた波形の中では、+Aピークの現れ方(元のピークに対する+Aピークの相対的高さ)はほぼ一定である。すなわち、図1に示すように、真のピークと比較してその+Aピークの高さがx倍であれば、他のStutterピークに対する+Aピークの高さの比もほぼx倍となる。また、ヘテロ接合体においては2つの真のピークがあるが、一方の真のピークとそれに対する+Aピークの高さの比がx倍であれば、他方の真のピークとそれに対する+Aピークの高さの比もほぼx倍となる。
・特徴2 +Aピークの現れ方はマイクロサテライトによって異なる。
・特徴3 1つのマイクロサテライトについて、個体により+Aピークの現れ方は変動する。さらに、同じ個体であっても複数回実験を行うと+Aピークの現れ方は変動する。しかしながら、個体間又は実験間における+Aピークの現れ方の変動幅及びの変動幅は、マイクロサテライト間における+Aピークの現れ方の変動幅よりも小さい。
【0021】
そこで、本発明者は上記の特徴を考慮した上で、PCR増幅産物の蛍光分析結果を示すグラフにおいて真のピークとノイズピークとを的確に判別して表示するために以下のような機能を実現することに想到した。
【0022】
機能1−グラフに現れた波形を+Aピークとその元のピークの対に組分けする
上記の特徴1を考慮して、元のピークに対する+Aピークの相対的高さに着目することにより、長さが1塩基異なる1対のピークのうちいずれが+Aピークでありいずれが元のピークであるかを判別することができる。この判別方法の例を図2に示す。図2の例では、62塩基の元のピークとそれに対する+Aピーク、64塩基の元のピークとそれに対する+Aピーク、66塩基の元のピークとそれに対する+Aピーク、68塩基の元のピークとそれに対する+Aピークが判別されている。ところで、図3に示すように、長さが1塩基異なるごとにピークが現れている場合には、+Aピーク及び元のピークの組分け方法が2通り存在することとなる。そこで、それぞれの組分け方法で元のピークとそれに対する+Aピークとを判別した後、各組の+Aピークの高さとその元のピークの高さの比(+Aピークの高さ÷その元のピークの高さ)を計算する。続いて、それぞれの組分け方法について、計算した各組の高さ比の分散を計算し、分散が小さい方の組分け方法を正しい組分け方法として選択する。
【0023】
以上のようにして、PCR増幅産物の蛍光分析結果を示すグラフに現れた波形を+Aピークとその元のピークの対に組分けした結果を図4に示すような表示画面として出力することができる。この表示画面には、PCR増幅産物の蛍光分析結果を示すグラフ400と、グラフに現れたピークのうちいずれのピークが+Aピークであるかを示す表示401と、各組の+Aピーク及び元のピークの高さ比の分散値402とが表示されている。また、+Aピーク及び元のピークの組分け方法が2通り存在する場合には、現在選択している組分け方法とは異なる組分け方法を採用した場合の各組の+Aピーク及び元のピークの高さ比の分散値も表示されるようになっている。
【0024】
この機能によれば、+Aピークの方が元のピークより常に低く現れるマイクロサテライトのみならず、+Aピークの方が元のピークより高く現れるマイクロサテライトについても、+Aピーク及び元のピークの判別を的確に行うことができる。また、+Aピークと元のピークがほぼ同程度の高で現れるマイクロサテライトについても、同様である。従来技術では、+Aピークが元のピークよりも常に低く現れると仮定することが多いため、元のピークの方が高いマイクロサテライトや、個体によって+Aピークの方が高く現れたり、元のピークの方が高く現れたりするようなマイクロサテライトについては適切な判断を行うことができなかったが、本機能によりそのような問題点は解決されることとなる。
【0025】
さらに、この機能によれば、抽出したDNA断片がホモ接合体であるかヘテロ接合体であるかに関わらず、+Aピーク及び元のピークの判別を的確に行うことができる。図5を参照しながらその理由を説明する。図5に示すグラフには、長さ66塩基の点線で示すDNA断片と、長さ68塩基の破線で示すDNA断片とが合成された波形として現れている。ここで、長さ66塩基の点線で示すDNA断片の66塩基における真のピーク500(高さh1とする)とそれに対する+Aピーク501、長さ68塩基の破線で示すDNA断片の66塩基におけるstutterピーク502(高さh2とする)とそれに対する+Aピーク503があるとする。このグラフ中では+Aピークと元のピークの高さ比はほぼ一定であるから、その値をxと近似すると、真のピーク500に対する+Aピーク501の高さはh1×xとなり、stutterピーク502に対する+Aピーク503の高さはh2×xとなる。そうすると、合成された波形の66塩基におけるピーク504はh1+h2となり、合成された波形の67塩基におけるピーク505は(h1×x)+(h2×x)=(h1+h2)×xとなる。すなわち、ヘテロ接合体の場合に得られる異なる塩基長のDNA断片からの合成波形についても、+Aピークとその元のピークとの高さ比は一定(x倍)であるという関係が成り立つことが分かる。したがって、この機能によって+Aピーク及び元のピークの判別を行うために、抽出したDNA断片がホモ接合体であるかヘテロ接合体であるかを判断することが必要となることはない。
【0026】
機能2−元のピーク及び+Aピークの高さ比の値を他の個体のそれと比較する機能
上記の特徴2及び3を考慮して、ある個体のあるマイクロサテライトについて算出された元のピーク及び+Aピークの高さ比と、他の個体の同一マイクロサテライトについての同高さ比とを比較し、それらの値がかけ離れている場合には、+Aピーク及び元のピークの組分け方法を間違えている可能性があるとして、ユーザに警告を表示することができる。この機能によって、PCR増幅産物の蛍光分析結果を示すグラフに現れた波形を+Aピークとその元のピークの対に組分けした結果とともに、必要に応じて上記の警告を図6に示すような表示画面として出力することができる。
【0027】
この表示画面には、PCR増幅産物の蛍光分析結果を示すグラフ600と、グラフに現れたピークのうちいずれのピークが+Aピークであるかを示す表示601と、各組の+Aピーク及び元のピークの高さ比の分散値(並びに、現在選択している組分け方法とは異なる組分け方法を採用した場合の各組の+Aピーク及び元のピークの高さ比の分散値)602とが表示されている。さらに、他の個体の同一マイクロサテライトについての元のピーク及び+Aピークの高さ比のデータが保持されている場合には、それらのヒストグラム603が表示されるようになっている。また、ヒストグラム603において、解析対象である個体の元のピークとその+Aピークの高さの比(例えば平均値)が他の個体のそれとかけ離れた値である場合には、所定の警告が表示されるようになっている。
【0028】
この機能によれば、解析対象のマイクロサテライトについて他の様々な個体に対する解析により蓄積されている元のピーク及び+Aピークの高さ比のデータを活用して、新たな個体の解析において+Aピーク及び元のピークの組分けを誤って設定してしまうのを防ぐことができる。
【0029】
この機能は、特に図7に示すように、PCR増幅産物の蛍光分析結果を示すグラフにおいて+Aピークは全く現れず、真のピーク及びStutterピークのみが現れている場合に、ピークの判別を確実に行うのに有用である。図7に示すグラフでは、1塩基ずつ間隔を置いてstutterピークb,d及び真のピークfが現れており、それらのピークが現れない箇所にはバックグラウンドノイズが現れている。バックグラウンドノイズによるピークa,c,eがstutterピークb,dや真のピークfの1塩基隣に現れているため、あたかも+Aピークが現れているかのように観測され得る。ここで上記の機能1により、これらのピークを+Aピーク及び元のピークの組に組分けすると、ピークfを真のピークと正しく解釈した場合(組分け方法1)の元のピーク及び+Aピークの高さ比の分散値は99.84となり(ピークaの左およびピークfの右にはピークがないので、仮想的に高さ1のピークがあるとして計算した)、ピークeを真のピークと誤って解釈した場合(組分け方法2)の元のピーク及び+Aピークの高さ比の分散値は0となる。そうすると、機能1によれば、分散値がより小さくなる組分け方法2を適切な組分け方法として選択してしまうことになる。
【0030】
ここで、機能1によるピーク判別により選択されたな組分け方法における真のピークと+Aピークとの高さ比を、同一マイクロサテライトの他の個体における同高さ比とを比較して、他の個体とかけ離れた値であった場合には、バックグラウンドノイズによるピークを誤って+Aピークと解釈してしまったことが分かる。すなわち、機能1によるピーク判別方法と、機能2による個体間でのデータ比較とを併用することにより、より正確なピーク判別を行うことが可能となる。
【0031】
機能3−グラフに現れた各ピークの判別結果を表示する
上記の機能1及び2による処理結果に基づいて、PCR増幅産物の蛍光分析結果を示すグラフに現れた各ピークを真のピーク、Stutterピーク、+Aピークのいずれであるか判別し、その結果を表示することができる。表示画面の例を図8に示す。
【0032】
この表示画面には、PCR増幅産物の蛍光分析結果を示すグラフ800と、グラフに現れた各ピークが真のピーク、Stutterピーク、+Aピークのうちいずれであるかを示す表示801と、各組の+Aピーク及び元のピークの高さ比の分散値(並びに、現在選択している組分け方法とは異なる組分け方法を採用した場合の各組の+Aピーク及び元のピークの高さ比の分散値)802と、真のピークとその+Aピークとの高さ比803が表示されている。ユーザはこの表示画面により、PCR増幅産物の複製元のDNA断片の長さを知ることができる。
【0033】
尚、元のピークのうちいずれが真のピークであるかを判定するにあたっては、従来の技術(特許文献1〜5、非特許文献1〜4などに開示されている方法)が利用されるものとする。
【0034】
以上の機能を実現するための手段として、本発明は、DNA断片のPCR増幅産物について長さを分析した結果を表示する装置であって、それぞれ長さの異なるPCR増幅産物の検出シグナルをグラフ表示する処理部と、DNA断片に1つのアデニンが付加したPCR増幅産物の検出シグナルに対応する+Aピークと、該+Aピーク以外のピークとを判別する処理部と、+Aピークと+Aピーク以外のピークとを判別した結果をグラフとともに表示する処理部とを有する表示装置を提供するものである。
【0035】
本発明の表示装置では、長さの異なるPCR増幅産物の検出シグナルとしてグラフに現れる複数のピークを、長さが1塩基離れた2つのピークを対として組分けし、各対において一方のピークと他方のピークとの高さの比が所定の範囲内である場合には、それぞれ長さが大きい方のピークを+Aピーク、長さが小さい方のピークをその元のピークとして判別することを特徴とする。
【0036】
本発明の表示装置では、長さの異なるPCR増幅産物の検出シグナルとしてグラフに現れる複数のピークを、長さが1塩基離れた2つのピークを対として組分けし、各対において一方のピークと他方のピークとの高さの比を算出し、算出された高さの比の分散が所定の範囲内である場合には、それぞれ長さが大きい方のピークを+Aピーク、長さが小さい方のピークをその元のピークとして判別することを特徴とする。
【0037】
本発明の表示装置では、長さの異なるPCR増幅産物の検出シグナルとしてグラフに現れる複数のピークを、長さが1塩基離れた2つのピークを対として組分けする組分け方法が2通りある場合には、第1の組分け方法に従ってピークを組分けした場合の、各対における一方のピークと他方のピークとの高さの比の分散と、第2の組分け方法に従ってピークを組分けした場合の、各対における一方のピークと他方のピークとの高さの比の分散とを比較し、分散が小さくなる方の組分け方法を採用することを特徴とする。
【0038】
本発明の表示装置では、長さの異なるPCR増幅産物の検出シグナルとしてグラフに現れる複数のピークを、長さが1塩基離れた2つのピークを対として組分けし、各対において一方のピークと他方のピークとの高さの比を算出し、それらの高さの比が他の個体において同様に算出された高さの比と類似しない場合には、所定の警告を表示することを特徴とする。
【0039】
本発明の表示装置では、+Aピーク以外のピークであると判別されたピークについて、増幅元のDNA断片と同じ長さのPCR増幅産物の検出シグナルとしてグラフに現れる真のピークであるか、増幅元のDNA断片と異なる長さのPCR増幅産物の検出シグナルとしてグラフに現れるstutterピークであるかをさらに判別することを特徴とする。
【0040】
本発明の表示装置では、真のピークとその+Aピークとの高さの比が、他の個体における真のピークとその+Aピークとの高さの比と類似しない場合には、所定の警告を表示することを特徴とする。
【0041】
本発明は、また、DNA断片のPCR増幅産物について長さを分析した結果を表示する方法であって、それぞれ長さの異なるPCR増幅産物の検出シグナルをグラフ表示するステップと、DNA断片に1つのアデニンが付加したPCR増幅産物の検出シグナルに対応する+Aピークと、該+Aピーク以外のピークとを判別するステップと、+Aピークと+Aピーク以外のピークとを判別した結果をグラフとともに表示するステップとを有する表示方法を提供するものである。
【0042】
本発明の表示方法では、長さの異なるPCR増幅産物の検出シグナルとしてグラフに現れる複数のピークを、長さが1塩基離れた2つのピークを対として組分けし、各対において一方のピークと他方のピークとの高さの比が所定の範囲内である場合には、それぞれ長さが大きい方のピークを+Aピーク、長さが小さい方のピークをその元のピークとして判別することを特徴とする。
【0043】
本発明の表示方法では、長さの異なるPCR増幅産物の検出シグナルとしてグラフに現れる複数のピークを、長さが1塩基離れた2つのピークを対として組分けし、各対において一方のピークと他方のピークとの高さの比を算出し、算出された高さの比の分散が所定の範囲内である場合には、それぞれ長さが大きい方のピークを+Aピーク、長さが小さい方のピークをその元のピークとして判別することを特徴とする。
【0044】
本発明の表示方法では、長さの異なるPCR増幅産物の検出シグナルとしてグラフに現れる複数のピークを、長さが1塩基離れた2つのピークを対として組分けする組分け方法が2通りある場合には、第1の組分け方法に従ってピークを組分けした場合の、各対における一方のピークと他方のピークとの高さの比の分散と、第2の組分け方法に従ってピークを組分けした場合の、各対における一方のピークと他方のピークとの高さの比の分散とを比較し、分散が小さくなる方の組分け方法を採用することを特徴とする。
【0045】
本発明の表示方法では、長さの異なるPCR増幅産物の検出シグナルとしてグラフに現れる複数のピークを、長さが1塩基離れた2つのピークを対として組分けし、各対において一方のピークと他方のピークとの高さの比を算出し、それらの高さの比が他の個体において同様に算出された高さの比と類似しない場合には、所定の警告を表示することを特徴とする。
【0046】
本発明の表示方法では、+Aピーク以外のピークであると判別されたピークについて、増幅元のDNA断片と同じ長さのPCR増幅産物の検出シグナルとしてグラフに現れる真のピークであるか、増幅元のDNA断片と異なる長さのPCR増幅産物の検出シグナルとしてグラフに現れるstutterピークであるかをさらに判別することを特徴とする。
【0047】
本発明の表示方法では、真のピークとその+Aピークとの高さの比が、他の個体における真のピークとその+Aピークとの高さの比と類似しない場合には、所定の警告を表示することを特徴とする。
【発明の効果】
【0048】
以上、説明したように、本発明の遺伝子情報の表示方法及び表示装置によれば、PCR増幅産物の蛍光分析結果を示すグラフにおいて、+Aピークと元のピークとが自動的に判別され、バックグラウンドノイズにより誤ったピーク判別を行ってしまう可能性が低減され、さらにいずれのピークが真のピークであるかが自動的に判別される。これにより、ユーザは、PCR増幅産物の複製元のDNA断片の長さを正確に知ることができ、それに基づいてマイクロサテライトの解析を行うことができる。また、複製元のDNA断片がマイクロサテライトのホモ接合体を含んでいるかヘテロ接合体を含んでいるかに関らず、各ピークを正確に判別することができる。
【発明を実施するための最良の形態】
【0049】
以下、添付図面を参照しながら、本発明の遺伝子情報の表示方法及び表示装置を実施するための最良の形態を詳細に説明する。図9〜図17は、本発明の実施の形態を例示する図であり、これらの図において、同一の符号を付した部分は同一物を表わし、基本的な構成及び動作は同様であるものとする。
【0050】
図9は、本発明の一実施形態として構築される遺伝子情報表示システムの内部構成を概略的に示す機能ブロック図である。この遺伝子情報表示システムは、PCR及び電気泳動実験の後PCR増幅産物を蛍光分析した結果得られる波形データを保存した波形データDB900、波形データ及びその解析結果をグラフ表示するための表示装置901、表示されたグラフに対して個体やピークを選択するなどの操作を行うためのキーボード902とマウスなどのポインティングデバイス903、必要な演算処理、制御処理等を行う中央処理装置904、中央処理装置904での処理に必要なプログラムを格納するプログラムメモリ905、中央処理装置904での処理に必要なデータを格納するデータメモリ906を備えている。
【0051】
プログラムメモリ905は、上記の機能1、すなわち波形データに現れるピークを元のピークと+Aピークの対に組分けする+Aピーク分離処理部907と、上記の機能3、すなわち元のピークが真のピークであるかStutterピークであるかを判別する真のピーク分離処理部908と、上記の機能2、すなわち元のピークとその+Aピークとの高さ比が他の個体における同高さ比から大きく外れているのを検出し警告を表示する警告表示処理部909とを含んでいる。
【0052】
データメモリ906は、個体ごとに波形データを保持する個体データ910と、各波形データについてピークデータを保持する波形データ911とを含んでいる。
【0053】
図10は、データメモリ906に含まれる波形データDB900のデータ構造を示す図である。このデータ構造体WaveFormData[]は、j個の個体について、各個体を識別するための個体ID1000、各個体の波形データ1001、波形データ中の真のピークとその+Aピークとの高さ比1002、選択した組分け方法による元のピークとその+Aピークとの高さ比の分散1003、1003における組分け方法とは異なる組分け方法による元のピークとその+Aピークとの高さ比の分散1004を示すデータ含んでいる。尚、データ1002,1003及び1004については、計算がまだ行われていない場合にはNULL値を持つものとする。
【0054】
図11は、データメモリ906に含まれる波形データ911のデータ構造を示す図である。このデータ構造体PeakFormData[]は、k個のピークについて、各ピークが現われる位置(塩基長)1100、各ピークの高さ1101、ピークが真のピークであるか、Stutterピークであるか、+Aピークであるかを表すラベル1102、ピークとその+Aピークとの高さ比1103を示すデータ含んでいる。尚、データ1102については、解析がまだ行われていない場合にはNULL値を持つものとする。また、データ1103については、解析がまだ行われていない場合、あるいはそのピークが元のピークではない場合(すなわち+Aピークである場合)にはNULL値を持つものとする。
【0055】
次に、この遺伝子情報表示システムにおいて行われる処理の流れについて、図12に示すフローチャートを参照しながら説明する。
【0056】
まず、波形データDB900から、各個体の波形データが読み込まれる(ステップ1200)。ここでは、波形データDB900に記憶されている全個体についての1つのマイクロサテライトの波形データが読み込まれ、データメモリ906において個体データ910及び波形データ911として保持されることとなる。次に、それぞれの個体について、+Aピークと元のピークとを組分けする(ステップ1201)。この処理は、プログラムメモリ905の+Aピーク分離処理部907により実行されるものであり、+Aピークと判断されたピークについては波形データ911のピークラベル1102に+Aピークであることを示す値が書き込まれ、また、元のピークと判断されたピークについては波形データ911のデータ1103にその+Aピークとの高さ比が書き込まれる。また、各個体の全ての波形データについて組分けが完了すると、個体データ910のデータ1002〜1004にそれぞれ算出された値が書き込まれる。尚、この+Aピーク分離処理部907による処理については、後に詳しく説明する。
【0057】
このようにして各個体の波形データに含まれるピークを+Aピークと元のピークとに組分けした結果は、図13に示すようにしてグラフ表示される(ステップ1202)。図13に示す表示画面には、ある個体の波形データについて各ピークを+Aピークと元のピークとに組分けした結果1300と、各ピークの組の高さ及び高さ比1301と、それぞれの組分け方法による各組の高さ比の分散1302とが表示されている。
【0058】
さらに、ステップ1201において+Aピーク以外のピーク(元のピーク)であると判別されたピークのそれぞれについて、真のピークであるかStutterピークであるかが判別される(ステップ1203)。この処理は、プログラムメモリ905の真のピーク分離処理部908により実行されるものであり、ピークの判別方法は従来技術を利用したものである。各ピークの判別結果は、波形データ911のラベルを1102に書き込まれる。また、各個体について真のピークとその+Aピークとの高さ比が算出され、個体データ910のデータ1002にその値が書き込まれる。
【0059】
このようにして各個体の波形データに含まれる元のピークを真のピークとStutterピークとに判別した結果は、図14に示すようにしてグラフ表示される(ステップ1204)。図14に示す表示画面には、ある個体の波形データについて各ピークを+Aピークと真のピークとStutterピークとに判別した結果1400と、各ピークの組の高さ及び高さ比1401と、+Aピークと元のピークの2通りの組分け方法による両ピークの高さ比の分散1402と、真のピークとその+Aピークとの高さ比1403とが表示されている。
【0060】
また、ステップ1204における処理の結果、真のピークとその+Aピークとの高さ比が他の個体における同高さ比から大きく外れている場合には、プログラムメモリ905の警告表示処理部909により、所定の警告が表示される(ステップ1205)。尚、この警告表示処理部909による処理については、後に詳しく説明する。
【0061】
この警告の表示画面の例を図15に示す。図15に示す表示画面には、ある個体の波形データについて各ピークを+Aピークと真のピークとStutterピークとに判別した結果1500と、各ピークの組の高さ及び高さ比1501と、+Aピークと元のピークの2通りの組分け方法による両ピークの高さ比の分散1502と、真のピークとその+Aピークとの高さ比1503と、この個体及び他の個体における真のピークとその+Aピークとの高さ比のヒストグラムと所定の警告表示1504とが表示されている。
【0062】
図16は、図12のステップ1201における+Aピーク分離処理部による処理を詳細に示すフローチャートである。このフローチャートでは1個体分の処理を示している。まず、個体の波形データに含まれるピークのうち、最も高いピークを探す(ステップ1600)。このピークの位置をpとおく。次に、整数iに対して比『{p±(unit長×i)+1}の位置にあるピークの高さ÷{p±(unit長×i)}の位置にあるピークの高さ』を求める。求めた比の分散をV1とおく(ステップ1601)。これは、最も高いピークを元のピークと仮定(+Aピークではないと仮定)した場合の比および分散に対応する。最も高いピークが元のピークであるとすれば、そこからマイクロサテライトのunit長の整数倍離れた位置にあるピークも、元のピークであるとすることができる。また、それらのピークより1塩基長い位置にあるピークは、それぞれの+Aピークであるとすることができる。その後、整数iに対して比『{p±(unit長×i)}の位置にあるピークの高さ÷{p±(unit長×i)−1}の位置にあるピークの高さ』を求める。求めた比の分散をV2とおく(ステップ1602)。これにより、ステップ1601とは逆に、最も高いピークを+Aピークと仮定した場合の比および分散を求めたことになる。
【0063】
続いて、上記ステップ1601および1602で求めたV1およびV2を比較して(ステップ1603)、最も高いピークが+Aピークであるか元のピークであるかを判断する。V1≦V2であれば、ステップ1601での仮定の方が妥当であったと判断される。すなわち、最も高いピーク及びそこからunit長の整数倍離れた位置にあるピークは元のピーク(真のピークまたはStutterピーク)であり、それらのピークより1塩基長い位置にあるピークはそれぞれの+Aピークであると判断される(ステップ1604)。したがって、整数iに対し{p±(unit長×i)+1}の位置にあるピークは+Aピークであるとして、各+Aピークについては波形データ911のピークラベル1102に+Aピークであることを示す値が書き込まれ、各元のピークについてはデータ1103にV1を求めるために用いた比の値が書き込まれる。また、個体データ910のデータ1003及び1004に、それぞれ、V1及びV2の値が書き込まれる。
【0064】
一方、V1> V2であれば、ステップ1602での仮定の方が妥当であったと判断される。すなわち、最も高いピーク及びそこからunit長の整数倍離れた位置にあるピークが+Aピークであり、それらのピークより1塩基短い位置にあるピークはそれぞれの元のピークであると判断される(ステップ1605)。したがって、整数iに対し{p±(unit長×i)}の位置にあるピークは+Aピークであるとして、各+Aピークについては波形データ911のピークラベル1102に+Aピークであることを示す値が書き込まれ、各元のピークについてはデータ1103にV2を求めるために用いた比の値が書き込まれる。また、個体データ910のデータ1003及び1004に、それぞれ、V2及びV1の値が書き込まれる。
【0065】
図17は、図12のステップ1205における警告処理部による処理を詳細に示すフローチャートである。このフローチャートでは1個体分の処理を示している。まず、全ての個体について真のピークとその+Aピークとの高さ比の値(図12のステップ1203における処理で算出され、個体データ910のデータ1002に格納されている)を集計し、平均と標準偏差を求める。ここで平均をE、標準偏差をσとおく(ステップ1700)。次に、現在処理している個体について算出された真のピークとその+Aピークとの高さ比が、E−1.96σ以上でかつE+1.96σ以下であるかどうかを調べる(ステップ1701)。真のピークとその+Aピークの高さ比が正規分布に従うと仮定した場合、真のピークとその+Aピークとの高さ比がこの範囲外であれば、低い方または高い方から2.5%に含まれることになるので、他の個体における比から離れた値を持つと判断し、所定の警告表示を行う(ステップ1702)。
【0066】
尚、上記では、真のピークとその+Aピークの高さ比が他の個体から大きく外れているかどうかを判定する閾値を標準偏差により定めているが、これ以外の方法で閾値を決定しても構わない。例えば、典型的な波形を表している個体を数個体あらかじめ選んでおき、その個体における比の範囲の上限および下限を閾値としてもよいし、予めユーザが閾値を入力しておくなどして、閾値を定義することもできる。また、1つの個体における元のピークとその+Aピークの高さの比の代表値として、真のピークとその+Aピークの高さの比を用いたが、元のピークとその+Aピークの高さの比の平均値・中央値・最頻値を用いるなどしてもよい。
【0067】
以上、本発明の遺伝子情報の表示方法及び表示装置について、具体的な実施の形態を示して説明したが、本発明はこれらに限定されるものではない。当業者であれば、本発明の要旨を逸脱しない範囲内において、上記各実施形態又は他の実施形態にかかる発明の構成及び機能に様々な変更・改良を加えることが可能である。
【0068】
上記した実施形態では、電気泳動(ゲル電気泳動またはキャピラリ電気泳動)を用いた疾患などの表現型に関与する遺伝子の探索を目的とする個体の遺伝子型推定技術について述べたが、電気泳動ではなくMALDI−TOF/MSなど別の実験手法によりPCR増幅産物の長さまたは分子量・質量を調べる場合についても、本発明の方法及び装置を応用することが可能である。また、疾患以外の表現型に関与する遺伝子の探索を目的とする個体の遺伝子型推定技術・DNA鑑定における遺伝子型推定技術などについても、農産物・水産物など、ヒト以外の遺伝子型推定技術についても同様である。
【産業上の利用可能性】
【0069】
本発明の遺伝子情報の表示方法及び表示装置は、例えば、実験データ解析装置として用いられるパーソナルコンピュータなどに実装されて利用され得るものである。
【図面の簡単な説明】
【0070】
【図1】本発明者が発見したPCR増幅産物の蛍光分析結果を示すグラフにおける+Aピークの現れ方の特徴を示す図である。
【図2】本発明者が発見した+Aピークの現れ方の特徴を利用して、長さが1塩基異なる1対のピークのうちいずれが+Aピークでありいずれが元のピークであるかを判別する方法の例を示す図である。
【図3】長さが1塩基異なるごとにピークが現れている場合の+Aピーク及び元のピークの組分け方法を示す図である。
【図4】グラフに現れた波形を+Aピークとその元のピークの対に組分けした結果を表す表示画面を示す図である。
【図5】ヘテロ接合体から得られるグラフにおいて+Aピーク及び元のピークの判別を行う方法を示す図である。
【図6】グラフに現れた波形を+Aピークとその元のピークの対に組分けした結果とともに、必要に応じて組分け方法が間違っているという警告を表す表示画面を示す図である。
【図7】+Aピークは全く現れず、真のピーク及びStutterピークのみが現れているグラフにおいてピークの判別を行う方法を示す図である。
【図8】グラフに現れた各ピークを真のピーク、Stutterピーク、+Aピークのいずれであるか判別した結果を表示する画面の例を示す図である。
【図9】本発明の一実施形態として構築される遺伝子情報表示システムの内部構成を概略的に示す機能ブロック図である。
【図10】図9に示す遺伝子情報表示システムのデータメモリ906に含まれる個体データ910のデータ構造を示す図である。
【図11】図9に示す遺伝子情報表示システムのデータメモリ906に含まれる波形データ911のデータ構造を示す図である。
【図12】図9に示す遺伝子情報表示システムにおいて行われる処理の流れを示すフローチャートである。
【図13】+Aピーク分離処理部により各個体の波形データについて各ピークを+Aピークと元のピークとに組分けした結果をグラフ表示する画面を示す図である。
【図14】真のピーク分離処理部により各個体の波形データに含まれる元のピークを真のピークとStutterピークとに判別した結果をグラフ表示する画面を示す図である。
【図15】真のピークとその+Aピークとの高さ比が他の個体における同高さ比から大きく外れている場合に、警告表示処理部により所定の警告を表示する画面の例を示す図である。
【図16】図12のステップ1201における+Aピーク分離処理部による処理を詳細に示すフローチャートである。
【図17】図12のステップ1205における警告処理部による処理を詳細に示すフローチャートである。
【図18】ゲノム上に表れるマイクロサテライトについて説明する図である。
【図19】PCR及び電気泳動により、マイクロサテライト部分のDNA断片を抽出し増幅する実験手順を模式的に示す図である。
【図20】PCR及び電気泳動の実験過程で生じる代表的なノイズである、Stutterピークと+Aピークについて説明する図である。
【図21】ホモ接合体及びヘテロ接合体それぞれについて、蛍光分析結果のグラフに現れる波形を示す図である。
【符号の説明】
【0071】
900 波形データDB
901 表示装置
902 キーボード
903 ポインティングデバイス
904 中央処理装置
905 プログラムメモリ
906 データメモリ
907 +Aピーク分離処理部
908 真のピーク分離処理部
909 警告表示処理部
910 個体データ
911 波形データ
1900,1901 プライマー配列
1902 マイクロサテライト及びプライマー配列を含んだゲノム領域
2000,2001,2003,2004 DNA断片
【技術分野】
【0001】
本発明は、個体の疾患や外形的特徴などの表現型に関与している遺伝子を特定するための解析作業に用いる遺伝子情報の表示方法及び表示装置に関し、特に、解析対象の遺伝子が含まれるDNA断片をPCRや電気泳動などにより抽出し検出する際に、解析対象からのシグナルとノイズシグナルとを的確に判別して表示することができる方法及び装置に関するものである。
【背景技術】
【0002】
ヒトゲノムの完全解読後、遺伝子の機能解析研究が活発に行われている。そのなかでも特定の疾患の有無、薬物の効果の程度、副作用の有無などの表現型に関与する遺伝子の探索での基盤となる、遺伝子型決定の自動化が特に注目されている。
【0003】
マイクロサテライト
通常、同種の生物のゲノムはほぼ似通った塩基配列を有しているが、いくつかの個所では異なった塩基を有している。例えば、1つの遺伝子座において、ある個体はAを有しており、他の個体はTを有している場合などがある。このように個体間でゲノム上の単一の塩基に多型性が見られることをSNP(Single Nucleotide Polymorphism)と言う。
【0004】
一方、生物のゲノム中には、2塩基から6塩基の短い配列パターンが数回〜数十回繰り返されて表れる箇所が非常に多く(数万箇所以上)存在する。この特徴的な配列パターンのことをマイクロサテライトと呼んでいる。ゲノム上に現れるマイクロサテライトの例を図18に示す。マイクロサテライトにおける繰り返し単位をunitと呼び、unitの塩基数をunit長と呼んでいる。例えば、図18に示すATATATAT...というマイクロサテライトでは、unitは『AT』であり、unit長は2塩基である。図18に示すように、マイクロサテライトは、個体間でunit及びunit長が同じであっても、その繰り返し回数が個体によって異なることがある。
【0005】
上記したようにSNP及びマイクロサテライトは個体間で異なり得るので、ゲノム上で他の塩基配列と区別がしやすい部分であり、実験的にも検出が容易である。また、生物種によっては、ゲノム上のSNP及びマイクロサテライトが存在するおおよその位置が判っているので、ゲノム上の位置を示す指標として用いることができる。このような性質から、SNPやマイクロサテライトのことをDNAマーカーと呼んでいる。特に、マイクロサテライトは複数の塩基を含んでいるので、SNPよりも多くの情報量を有しており、DNAマーカーとして頻繁に用いられている。
【0006】
ところで、図18に示すように、多くの生物の個体は、雌性配偶子と雄性配偶子に由来する1組のゲノム(相同染色体)を有している。1組のゲノム上の互いに対応する部位に存在する遺伝子を、それぞれ対立遺伝子(allele)と言い、これらの組み合わせを遺伝子型(genotype)と言う。上記したように、ゲノム上のSNPやマイクロサテライトは、個体間で塩基配列が異なり得る部分であるので、一般的に、SNPには2つ又は3つの対立遺伝子が存在し、マイクロサテライトには数種類〜20種類以上の対立遺伝子が存在する。図18に示す例では、個体Aは、『AT』というunitを5回繰り返したものと7回繰り返したものとを有しており、個体Bは、『AT』というunitを6回繰り返したものを2つ有している。ここで、個体Aのように異なる種類の対立遺伝子を1つずつ持っている状態をヘテロ接合と言い、個体Bのように同じ種類の対立遺伝子を2つ持っている状態をホモ接合と言う。
【0007】
PCR及び電気泳動実験
DNAマーカーとしてマイクロサテライトを用いる場合、ゲノム上のマイクロサテライトが現れている箇所を抽出して検出するための実験としてPCR(Polymerase Chain Reaction)や電気泳動などの実験が行われる。PCRは、マイクロサテライトの両端においてプライマー配列と呼ばれる一対の塩基配列を指定することで、それらの間にはさまれるマイクロサテライト部分のみをDNA断片として繰り返し複製することにより、一定量のサンプルを取得する実験技術である。電気泳動には、ゲル電気泳動やキャピラリ電気泳動などの手法があり、増幅したDNA断片を荷電された泳動路で泳動させて、長さの異なるDNA断片を分離する実験技術である。電気泳動は、DNA断片の長さによって泳動路における泳動速度が異なる(長いDNA断片ほど泳動速度が小さい)ことを利用したサンプル分離手法である。
【0008】
図19は、PCR及びゲル電気泳動により、マイクロサテライト部分のDNA断片を抽出し増幅する実験手順を模式的に示す図である。まず、対象となるマイクロサテライトを挟んで一対のプライマー配列1900及び1901を指定し、マイクロサテライト及びプライマー配列を含んだゲノム領域1902がPCR実験により増幅される。図19に示す例では、2本の相同染色体上でのマイクロサテライトの繰り返し数が異なるヘテロ接合であり、それぞれマイクロサテライト部分の長さが異なるため、それぞれから長さの異なる2種類のPCR増幅産物すなわちDNA断片(66塩基および58塩基)が得られる。これらを板状のゲル上で一定時間電気泳動させると、上記2種類のPCR増幅産物はそのDNA断片の長さの違いによって分離されることとなる。各DNA断片には蛍光色素をつけておき、電気泳動後に各DNA断片からの蛍光シグナルの強度及び位置を検出することにより、図19に示すように、横軸にDNA断片の長さ(すなわち泳動した距離)、縦軸に蛍光シグナル強度(すなわちDNA断片の存在量)をプロットしたグラフが得られる。また、PCR増幅産物とともに、長さがあらかじめ分かっているDNA断片(サイズマーカーと呼ばれる)を電気泳動させておき、これらの蛍光シグナルも検出すれば、サイズマーカーの検出位置を基準として各PCR増幅産物の長さを知ることができる。
【0009】
尚、上記ではゲル電気泳動を用いた実験手法について述べたが、キャピラリ電気泳動によっても同様のことを行うことができる。キャピラリ電気泳動では、サンプルにゲルを詰めた細い管の中を泳動させ、各種サンプルが一定距離(通常はキャピラリの終端まで)を泳動し終わるまでに要した時間を計測して、DNA断片の長さを調べる手法である。キャピラリ電気泳動においては、ゲル中のサンプルからの蛍光シグナルをスキャンするのではなく、キャピラリ終端に備えた蛍光シグナル検出器によりサンプルを検出するのが一般的である。
【0010】
PCR及び電気泳動実験において生じるノイズ
上記の図19に示した実験結果は、PCR及び電気泳動が理想的な過程で行われた場合に得られるものであり、実際の実験においては様々なノイズが生じることがある。PCR及び電気泳動の実験過程で生じる代表的なノイズである、Stutterピークと+Aピークについて、図20を参照しながら以下に説明する。簡単のため、図20では、図19に示した長さ66塩基のDNA断片(『TA』が12回繰り返されたマイクロサテライトを含む)のみを例に挙げている。
【0011】
Stutterピークとは、PCR反応の際にslipped-strand mispairingが起こることによって、複製対象のDNA断片のうちマイクロサテライト部分の繰り返し回数が増加又は減少してしまう現象が原因で生じるノイズであり、蛍光分析において繰り返し回数が増加又は減少したDNA断片がノイズピークとして観測されるものである。図20に示すように、『TA』が12回繰り返された正常なマイクロサテライトを含んだDNA断片2000のほか、『TA』が11回又は13回繰り返された異常なマイクロサテライトを含んだDNA断片2001又は2002が生成されて、蛍光分析においてStutterピークとして観測されることとなる。さらに多くの繰り返し回数の増減が起こることもあるので、PCRを行うことにより、複製元のDNA断片と同じ長さのDNA断片(66塩基)のほかに、マイクロサテライトのunit長の整数倍だけ長さが増加又減少したDNA断片が生成される可能性がある。
【0012】
+Aピークとは、PCRによりDNA断片を複製する際に、DNA断片に余分な塩基(通常はA)が1つ付加されてしまう現象が原因で生じるノイズであり、蛍光分析において1塩基付加されたDNA断片がノイズピークとして観測されるものである。図20に示すように、正常に複製されたDNA断片2000に1塩基付加されたDNA断片2003が生じるほか、slipped-strand mispairingによりマイクロサテライト部分の繰り返し回数が増加又は減少されてしまった異常なDNA断片2001及び2002にも1塩基付加されたDNA断片2004及び2005が生じることがある。これらの1塩基付加されたDNA断片2003,2004及び2005は、蛍光分析においてそれぞれ異なる+Aピークとして観測されることとなる。
【0013】
図20の蛍光分析結果を示すグラフでは、複製元のDNA断片と同じ長さである66塩基のDNA断片が本来観察されるべきピーク(以下、「真のピーク」と呼ぶ)であり、その他のピークは全てノイズピークである。この真のピークに対して、マイクロサテライトのunit長分の間隔を置いて(62塩基、64塩基、68塩基の位置に)Stutterピークが現れていることが分かる。さらに、真のピーク又はStutterピークのそれぞれよりも1塩基長い位置(63塩基、65塩基、67塩基、69塩基の位置)には+Aピークが現れていることが分かる。すなわち、63塩基、65塩基、67塩基、69塩基の位置に現れる+Aピークは、それぞれ、塩基長が62塩基、64塩基、66塩基、68塩基のDNA断片に1塩基付加されたDNA断片に対応していることになる。以下において、ある+Aピークに対して、その+Aピークが生じる元となった1塩基付加されていないDNA断片に対応する真のピーク又はStutterピークのことを「元のピーク」と呼ぶ。
【0014】
PCR及び電気泳動の実験過程においては、蛍光分析において観測される複数のピークのうち真のピークを他のノイズピークから判別することが非常に重要である。上記したノイズピークのうち、Stutterピークに関してはその判別方法が広く研究されており、特許文献1〜5、非特許文献1〜4などに開示されている方法により的確な判別が行えるようになっている。また、Stutterピークを判別し除去する処理を行うソフトウェアとしては、Cybergenetics社のソフトウェア「TrueAllele」、LI-COR社のソフトウェア「SAGA」、ABI社のソフトウェア「GenoTyper」、ABI社のソフトウェア「GeneMapper」などが知られている。
【特許文献1】米国特許第5,541,067号
【特許文献2】米国特許第5,580,728号
【特許文献3】米国特許第5,876,933号
【特許文献4】米国特許第6,054,268号
【特許文献5】米国特許第6,274,317号
【非特許文献1】Perlin, M. W., et al., “Toward Fully Automated Genotyping: Allele Assignment, Pedigree Construction, Phase Determination, and Recombination Detection in Duchenne Muscular Dystrophy”, Am. J. Hum. Genet. 55, 1994, p777-787
【非特許文献2】Perlin, M. W., et al., “Toward Fully Automated Genotyping: Genotyping Microsatellite Markers by Deconvolution”, Am. J. Hum. Genet. 57, 1995, p1199-1210
【非特許文献3】Palsson, B., et al., “Using Quality Measures to Facilitate Allele Calling in High-Throughput Genotyping”, Genome Research 9, 1999, p1002-1012
【非特許文献4】Stoughton, R., et al., “Data-adaptive algorithms for calling alleles in repeat polymorphisms”, Electrophoresis 18, 1997, p1-5
【非特許文献5】Smith, J. R., et al., “Approach to Genotyping Errors Caused by Nontemplated Nucleotide Addition by Taq DNA Polymerase”, Genome Research 5, 1995、p312-317
【発明の開示】
【発明が解決しようとする課題】
【0015】
一方、蛍光シグナルのグラフ波形から+Aピークを判別するのは、Stutterピークを判別するのに比べて困難である。その理由は、+Aピークが元のピークより高くなる場合も低くなる場合もあるためであり、また、同一のマイクロサテライトについて同一のサンプル(同一個体)で複数回実験を行った場合であっても、+Aピークの現れ方(元のピークに対する+Aピークの相対的高さ)が変動するためである。非特許文献5では、真のピークとそれに対する+Aピークとの高さの比に着目して実験及び解析を行っているが、上記した+Aピークの判別の困難さを克服することはできていない。
【0016】
ところで、1組のゲノム上のマイクロサテライトにはホモ接合体とヘテロ接合体とがあるが、抽出したDNA断片がいずれであるかによって、蛍光シグナルのグラフ波形が大きく異なってくる。ホモ接合体の場合にはグラフに真のピークが1つだけ現れ、ヘテロ接合体の場合にはグラフに真のピークが2つ現れることになっている。しかしながら、図20の蛍光分析結果を示すグラフからも明らかなように、ホモ接合体であっても多数のピークが現れることがあるので、蛍光シグナルのグラフ波形やピークの数から、抽出したDNA断片がホモ接合体であるかヘテロ接合体であるかを判断することは不可能である。
【0017】
さらに、ヘテロ接合体の場合には、ピーク同士が重なり合うことと、2つの真のピークの高さが完全に等しいとは限らないことから、波形が非常に複雑なものとなってしまう。以下、図21を参照しながらホモ接合体及びヘテロ接合体それぞれに現れる波形について説明する。まず、ホモ接合体の場合に現れる波形を図21の(a)及び(b)に示す。(a)は66塩基のDNA断片から得られる波形であり、(b)は68塩基のDNA断片から得られる波形である。次に、ヘテロ接合体の場合に現れる波形を図21の(c)及び(d)に示す。このヘテロ接合体からのPCR増幅産物として、66塩基のDNA断片と68塩基のDNA断片とが得られるものとする。(c)は、PCR増幅産物に含まれる66塩基のDNA断片により現れる真のピークと、68塩基のDNA断片により現れる真のピークとが等しい高さであると仮定して、両者の波形(点線で示す波形と破線で示す波形)を合成して得られる波形である。一方、(d)は、PCR増幅産物に含まれる66塩基のDNA断片により現れる真のピークと、68塩基のDNA断片により現れる真のピークとが異なる高さである場合の合成波形である。(c)では66塩基及び68塩基におけるピークが他のピークよりも比較的高いので、これらが真のピークであると推測することが容易であるが、(d)では66塩基におけるピークが他のピークに比べて突出して高いので、66塩基に1つの真のピークを有するホモ接合体であると誤判断してしまう可能性がある。あるいは、ヘテロ接合体であることが分かっているとしても、多数現れている比較的高いピークのうちいずれの2つを真のピークとするかの判断が困難である。
【0018】
PCR増幅産物を蛍光分析して得られる波形データはこのように複雑であるため、真のピークの個数及び真のピークの位置を正しく判断するのは非常に困難である。この判断を的確に行う手法は存在しておらず、現状では波形データの解析には熟練した研究者の勘に頼るところが大きく、遺伝子の機能解析研究のボトルネックとなっている。
【0019】
本発明は、このような実情に鑑みてなされたものであり、PCR増幅産物の蛍光分析結果データから真のシグナルとノイズシグナルとを的確に判別して表示することができる表示方法及び表示装置を提供しようとするものである。
【課題を解決するための手段】
【0020】
本発明者は、まず、PCR増幅産物の蛍光分析結果を示すグラフにおいて現れる波形及び+Aピークに関して、以下のような特徴があることを発見した。
・特徴1 1個体について1度の実験で得られた波形の中では、+Aピークの現れ方(元のピークに対する+Aピークの相対的高さ)はほぼ一定である。すなわち、図1に示すように、真のピークと比較してその+Aピークの高さがx倍であれば、他のStutterピークに対する+Aピークの高さの比もほぼx倍となる。また、ヘテロ接合体においては2つの真のピークがあるが、一方の真のピークとそれに対する+Aピークの高さの比がx倍であれば、他方の真のピークとそれに対する+Aピークの高さの比もほぼx倍となる。
・特徴2 +Aピークの現れ方はマイクロサテライトによって異なる。
・特徴3 1つのマイクロサテライトについて、個体により+Aピークの現れ方は変動する。さらに、同じ個体であっても複数回実験を行うと+Aピークの現れ方は変動する。しかしながら、個体間又は実験間における+Aピークの現れ方の変動幅及びの変動幅は、マイクロサテライト間における+Aピークの現れ方の変動幅よりも小さい。
【0021】
そこで、本発明者は上記の特徴を考慮した上で、PCR増幅産物の蛍光分析結果を示すグラフにおいて真のピークとノイズピークとを的確に判別して表示するために以下のような機能を実現することに想到した。
【0022】
機能1−グラフに現れた波形を+Aピークとその元のピークの対に組分けする
上記の特徴1を考慮して、元のピークに対する+Aピークの相対的高さに着目することにより、長さが1塩基異なる1対のピークのうちいずれが+Aピークでありいずれが元のピークであるかを判別することができる。この判別方法の例を図2に示す。図2の例では、62塩基の元のピークとそれに対する+Aピーク、64塩基の元のピークとそれに対する+Aピーク、66塩基の元のピークとそれに対する+Aピーク、68塩基の元のピークとそれに対する+Aピークが判別されている。ところで、図3に示すように、長さが1塩基異なるごとにピークが現れている場合には、+Aピーク及び元のピークの組分け方法が2通り存在することとなる。そこで、それぞれの組分け方法で元のピークとそれに対する+Aピークとを判別した後、各組の+Aピークの高さとその元のピークの高さの比(+Aピークの高さ÷その元のピークの高さ)を計算する。続いて、それぞれの組分け方法について、計算した各組の高さ比の分散を計算し、分散が小さい方の組分け方法を正しい組分け方法として選択する。
【0023】
以上のようにして、PCR増幅産物の蛍光分析結果を示すグラフに現れた波形を+Aピークとその元のピークの対に組分けした結果を図4に示すような表示画面として出力することができる。この表示画面には、PCR増幅産物の蛍光分析結果を示すグラフ400と、グラフに現れたピークのうちいずれのピークが+Aピークであるかを示す表示401と、各組の+Aピーク及び元のピークの高さ比の分散値402とが表示されている。また、+Aピーク及び元のピークの組分け方法が2通り存在する場合には、現在選択している組分け方法とは異なる組分け方法を採用した場合の各組の+Aピーク及び元のピークの高さ比の分散値も表示されるようになっている。
【0024】
この機能によれば、+Aピークの方が元のピークより常に低く現れるマイクロサテライトのみならず、+Aピークの方が元のピークより高く現れるマイクロサテライトについても、+Aピーク及び元のピークの判別を的確に行うことができる。また、+Aピークと元のピークがほぼ同程度の高で現れるマイクロサテライトについても、同様である。従来技術では、+Aピークが元のピークよりも常に低く現れると仮定することが多いため、元のピークの方が高いマイクロサテライトや、個体によって+Aピークの方が高く現れたり、元のピークの方が高く現れたりするようなマイクロサテライトについては適切な判断を行うことができなかったが、本機能によりそのような問題点は解決されることとなる。
【0025】
さらに、この機能によれば、抽出したDNA断片がホモ接合体であるかヘテロ接合体であるかに関わらず、+Aピーク及び元のピークの判別を的確に行うことができる。図5を参照しながらその理由を説明する。図5に示すグラフには、長さ66塩基の点線で示すDNA断片と、長さ68塩基の破線で示すDNA断片とが合成された波形として現れている。ここで、長さ66塩基の点線で示すDNA断片の66塩基における真のピーク500(高さh1とする)とそれに対する+Aピーク501、長さ68塩基の破線で示すDNA断片の66塩基におけるstutterピーク502(高さh2とする)とそれに対する+Aピーク503があるとする。このグラフ中では+Aピークと元のピークの高さ比はほぼ一定であるから、その値をxと近似すると、真のピーク500に対する+Aピーク501の高さはh1×xとなり、stutterピーク502に対する+Aピーク503の高さはh2×xとなる。そうすると、合成された波形の66塩基におけるピーク504はh1+h2となり、合成された波形の67塩基におけるピーク505は(h1×x)+(h2×x)=(h1+h2)×xとなる。すなわち、ヘテロ接合体の場合に得られる異なる塩基長のDNA断片からの合成波形についても、+Aピークとその元のピークとの高さ比は一定(x倍)であるという関係が成り立つことが分かる。したがって、この機能によって+Aピーク及び元のピークの判別を行うために、抽出したDNA断片がホモ接合体であるかヘテロ接合体であるかを判断することが必要となることはない。
【0026】
機能2−元のピーク及び+Aピークの高さ比の値を他の個体のそれと比較する機能
上記の特徴2及び3を考慮して、ある個体のあるマイクロサテライトについて算出された元のピーク及び+Aピークの高さ比と、他の個体の同一マイクロサテライトについての同高さ比とを比較し、それらの値がかけ離れている場合には、+Aピーク及び元のピークの組分け方法を間違えている可能性があるとして、ユーザに警告を表示することができる。この機能によって、PCR増幅産物の蛍光分析結果を示すグラフに現れた波形を+Aピークとその元のピークの対に組分けした結果とともに、必要に応じて上記の警告を図6に示すような表示画面として出力することができる。
【0027】
この表示画面には、PCR増幅産物の蛍光分析結果を示すグラフ600と、グラフに現れたピークのうちいずれのピークが+Aピークであるかを示す表示601と、各組の+Aピーク及び元のピークの高さ比の分散値(並びに、現在選択している組分け方法とは異なる組分け方法を採用した場合の各組の+Aピーク及び元のピークの高さ比の分散値)602とが表示されている。さらに、他の個体の同一マイクロサテライトについての元のピーク及び+Aピークの高さ比のデータが保持されている場合には、それらのヒストグラム603が表示されるようになっている。また、ヒストグラム603において、解析対象である個体の元のピークとその+Aピークの高さの比(例えば平均値)が他の個体のそれとかけ離れた値である場合には、所定の警告が表示されるようになっている。
【0028】
この機能によれば、解析対象のマイクロサテライトについて他の様々な個体に対する解析により蓄積されている元のピーク及び+Aピークの高さ比のデータを活用して、新たな個体の解析において+Aピーク及び元のピークの組分けを誤って設定してしまうのを防ぐことができる。
【0029】
この機能は、特に図7に示すように、PCR増幅産物の蛍光分析結果を示すグラフにおいて+Aピークは全く現れず、真のピーク及びStutterピークのみが現れている場合に、ピークの判別を確実に行うのに有用である。図7に示すグラフでは、1塩基ずつ間隔を置いてstutterピークb,d及び真のピークfが現れており、それらのピークが現れない箇所にはバックグラウンドノイズが現れている。バックグラウンドノイズによるピークa,c,eがstutterピークb,dや真のピークfの1塩基隣に現れているため、あたかも+Aピークが現れているかのように観測され得る。ここで上記の機能1により、これらのピークを+Aピーク及び元のピークの組に組分けすると、ピークfを真のピークと正しく解釈した場合(組分け方法1)の元のピーク及び+Aピークの高さ比の分散値は99.84となり(ピークaの左およびピークfの右にはピークがないので、仮想的に高さ1のピークがあるとして計算した)、ピークeを真のピークと誤って解釈した場合(組分け方法2)の元のピーク及び+Aピークの高さ比の分散値は0となる。そうすると、機能1によれば、分散値がより小さくなる組分け方法2を適切な組分け方法として選択してしまうことになる。
【0030】
ここで、機能1によるピーク判別により選択されたな組分け方法における真のピークと+Aピークとの高さ比を、同一マイクロサテライトの他の個体における同高さ比とを比較して、他の個体とかけ離れた値であった場合には、バックグラウンドノイズによるピークを誤って+Aピークと解釈してしまったことが分かる。すなわち、機能1によるピーク判別方法と、機能2による個体間でのデータ比較とを併用することにより、より正確なピーク判別を行うことが可能となる。
【0031】
機能3−グラフに現れた各ピークの判別結果を表示する
上記の機能1及び2による処理結果に基づいて、PCR増幅産物の蛍光分析結果を示すグラフに現れた各ピークを真のピーク、Stutterピーク、+Aピークのいずれであるか判別し、その結果を表示することができる。表示画面の例を図8に示す。
【0032】
この表示画面には、PCR増幅産物の蛍光分析結果を示すグラフ800と、グラフに現れた各ピークが真のピーク、Stutterピーク、+Aピークのうちいずれであるかを示す表示801と、各組の+Aピーク及び元のピークの高さ比の分散値(並びに、現在選択している組分け方法とは異なる組分け方法を採用した場合の各組の+Aピーク及び元のピークの高さ比の分散値)802と、真のピークとその+Aピークとの高さ比803が表示されている。ユーザはこの表示画面により、PCR増幅産物の複製元のDNA断片の長さを知ることができる。
【0033】
尚、元のピークのうちいずれが真のピークであるかを判定するにあたっては、従来の技術(特許文献1〜5、非特許文献1〜4などに開示されている方法)が利用されるものとする。
【0034】
以上の機能を実現するための手段として、本発明は、DNA断片のPCR増幅産物について長さを分析した結果を表示する装置であって、それぞれ長さの異なるPCR増幅産物の検出シグナルをグラフ表示する処理部と、DNA断片に1つのアデニンが付加したPCR増幅産物の検出シグナルに対応する+Aピークと、該+Aピーク以外のピークとを判別する処理部と、+Aピークと+Aピーク以外のピークとを判別した結果をグラフとともに表示する処理部とを有する表示装置を提供するものである。
【0035】
本発明の表示装置では、長さの異なるPCR増幅産物の検出シグナルとしてグラフに現れる複数のピークを、長さが1塩基離れた2つのピークを対として組分けし、各対において一方のピークと他方のピークとの高さの比が所定の範囲内である場合には、それぞれ長さが大きい方のピークを+Aピーク、長さが小さい方のピークをその元のピークとして判別することを特徴とする。
【0036】
本発明の表示装置では、長さの異なるPCR増幅産物の検出シグナルとしてグラフに現れる複数のピークを、長さが1塩基離れた2つのピークを対として組分けし、各対において一方のピークと他方のピークとの高さの比を算出し、算出された高さの比の分散が所定の範囲内である場合には、それぞれ長さが大きい方のピークを+Aピーク、長さが小さい方のピークをその元のピークとして判別することを特徴とする。
【0037】
本発明の表示装置では、長さの異なるPCR増幅産物の検出シグナルとしてグラフに現れる複数のピークを、長さが1塩基離れた2つのピークを対として組分けする組分け方法が2通りある場合には、第1の組分け方法に従ってピークを組分けした場合の、各対における一方のピークと他方のピークとの高さの比の分散と、第2の組分け方法に従ってピークを組分けした場合の、各対における一方のピークと他方のピークとの高さの比の分散とを比較し、分散が小さくなる方の組分け方法を採用することを特徴とする。
【0038】
本発明の表示装置では、長さの異なるPCR増幅産物の検出シグナルとしてグラフに現れる複数のピークを、長さが1塩基離れた2つのピークを対として組分けし、各対において一方のピークと他方のピークとの高さの比を算出し、それらの高さの比が他の個体において同様に算出された高さの比と類似しない場合には、所定の警告を表示することを特徴とする。
【0039】
本発明の表示装置では、+Aピーク以外のピークであると判別されたピークについて、増幅元のDNA断片と同じ長さのPCR増幅産物の検出シグナルとしてグラフに現れる真のピークであるか、増幅元のDNA断片と異なる長さのPCR増幅産物の検出シグナルとしてグラフに現れるstutterピークであるかをさらに判別することを特徴とする。
【0040】
本発明の表示装置では、真のピークとその+Aピークとの高さの比が、他の個体における真のピークとその+Aピークとの高さの比と類似しない場合には、所定の警告を表示することを特徴とする。
【0041】
本発明は、また、DNA断片のPCR増幅産物について長さを分析した結果を表示する方法であって、それぞれ長さの異なるPCR増幅産物の検出シグナルをグラフ表示するステップと、DNA断片に1つのアデニンが付加したPCR増幅産物の検出シグナルに対応する+Aピークと、該+Aピーク以外のピークとを判別するステップと、+Aピークと+Aピーク以外のピークとを判別した結果をグラフとともに表示するステップとを有する表示方法を提供するものである。
【0042】
本発明の表示方法では、長さの異なるPCR増幅産物の検出シグナルとしてグラフに現れる複数のピークを、長さが1塩基離れた2つのピークを対として組分けし、各対において一方のピークと他方のピークとの高さの比が所定の範囲内である場合には、それぞれ長さが大きい方のピークを+Aピーク、長さが小さい方のピークをその元のピークとして判別することを特徴とする。
【0043】
本発明の表示方法では、長さの異なるPCR増幅産物の検出シグナルとしてグラフに現れる複数のピークを、長さが1塩基離れた2つのピークを対として組分けし、各対において一方のピークと他方のピークとの高さの比を算出し、算出された高さの比の分散が所定の範囲内である場合には、それぞれ長さが大きい方のピークを+Aピーク、長さが小さい方のピークをその元のピークとして判別することを特徴とする。
【0044】
本発明の表示方法では、長さの異なるPCR増幅産物の検出シグナルとしてグラフに現れる複数のピークを、長さが1塩基離れた2つのピークを対として組分けする組分け方法が2通りある場合には、第1の組分け方法に従ってピークを組分けした場合の、各対における一方のピークと他方のピークとの高さの比の分散と、第2の組分け方法に従ってピークを組分けした場合の、各対における一方のピークと他方のピークとの高さの比の分散とを比較し、分散が小さくなる方の組分け方法を採用することを特徴とする。
【0045】
本発明の表示方法では、長さの異なるPCR増幅産物の検出シグナルとしてグラフに現れる複数のピークを、長さが1塩基離れた2つのピークを対として組分けし、各対において一方のピークと他方のピークとの高さの比を算出し、それらの高さの比が他の個体において同様に算出された高さの比と類似しない場合には、所定の警告を表示することを特徴とする。
【0046】
本発明の表示方法では、+Aピーク以外のピークであると判別されたピークについて、増幅元のDNA断片と同じ長さのPCR増幅産物の検出シグナルとしてグラフに現れる真のピークであるか、増幅元のDNA断片と異なる長さのPCR増幅産物の検出シグナルとしてグラフに現れるstutterピークであるかをさらに判別することを特徴とする。
【0047】
本発明の表示方法では、真のピークとその+Aピークとの高さの比が、他の個体における真のピークとその+Aピークとの高さの比と類似しない場合には、所定の警告を表示することを特徴とする。
【発明の効果】
【0048】
以上、説明したように、本発明の遺伝子情報の表示方法及び表示装置によれば、PCR増幅産物の蛍光分析結果を示すグラフにおいて、+Aピークと元のピークとが自動的に判別され、バックグラウンドノイズにより誤ったピーク判別を行ってしまう可能性が低減され、さらにいずれのピークが真のピークであるかが自動的に判別される。これにより、ユーザは、PCR増幅産物の複製元のDNA断片の長さを正確に知ることができ、それに基づいてマイクロサテライトの解析を行うことができる。また、複製元のDNA断片がマイクロサテライトのホモ接合体を含んでいるかヘテロ接合体を含んでいるかに関らず、各ピークを正確に判別することができる。
【発明を実施するための最良の形態】
【0049】
以下、添付図面を参照しながら、本発明の遺伝子情報の表示方法及び表示装置を実施するための最良の形態を詳細に説明する。図9〜図17は、本発明の実施の形態を例示する図であり、これらの図において、同一の符号を付した部分は同一物を表わし、基本的な構成及び動作は同様であるものとする。
【0050】
図9は、本発明の一実施形態として構築される遺伝子情報表示システムの内部構成を概略的に示す機能ブロック図である。この遺伝子情報表示システムは、PCR及び電気泳動実験の後PCR増幅産物を蛍光分析した結果得られる波形データを保存した波形データDB900、波形データ及びその解析結果をグラフ表示するための表示装置901、表示されたグラフに対して個体やピークを選択するなどの操作を行うためのキーボード902とマウスなどのポインティングデバイス903、必要な演算処理、制御処理等を行う中央処理装置904、中央処理装置904での処理に必要なプログラムを格納するプログラムメモリ905、中央処理装置904での処理に必要なデータを格納するデータメモリ906を備えている。
【0051】
プログラムメモリ905は、上記の機能1、すなわち波形データに現れるピークを元のピークと+Aピークの対に組分けする+Aピーク分離処理部907と、上記の機能3、すなわち元のピークが真のピークであるかStutterピークであるかを判別する真のピーク分離処理部908と、上記の機能2、すなわち元のピークとその+Aピークとの高さ比が他の個体における同高さ比から大きく外れているのを検出し警告を表示する警告表示処理部909とを含んでいる。
【0052】
データメモリ906は、個体ごとに波形データを保持する個体データ910と、各波形データについてピークデータを保持する波形データ911とを含んでいる。
【0053】
図10は、データメモリ906に含まれる波形データDB900のデータ構造を示す図である。このデータ構造体WaveFormData[]は、j個の個体について、各個体を識別するための個体ID1000、各個体の波形データ1001、波形データ中の真のピークとその+Aピークとの高さ比1002、選択した組分け方法による元のピークとその+Aピークとの高さ比の分散1003、1003における組分け方法とは異なる組分け方法による元のピークとその+Aピークとの高さ比の分散1004を示すデータ含んでいる。尚、データ1002,1003及び1004については、計算がまだ行われていない場合にはNULL値を持つものとする。
【0054】
図11は、データメモリ906に含まれる波形データ911のデータ構造を示す図である。このデータ構造体PeakFormData[]は、k個のピークについて、各ピークが現われる位置(塩基長)1100、各ピークの高さ1101、ピークが真のピークであるか、Stutterピークであるか、+Aピークであるかを表すラベル1102、ピークとその+Aピークとの高さ比1103を示すデータ含んでいる。尚、データ1102については、解析がまだ行われていない場合にはNULL値を持つものとする。また、データ1103については、解析がまだ行われていない場合、あるいはそのピークが元のピークではない場合(すなわち+Aピークである場合)にはNULL値を持つものとする。
【0055】
次に、この遺伝子情報表示システムにおいて行われる処理の流れについて、図12に示すフローチャートを参照しながら説明する。
【0056】
まず、波形データDB900から、各個体の波形データが読み込まれる(ステップ1200)。ここでは、波形データDB900に記憶されている全個体についての1つのマイクロサテライトの波形データが読み込まれ、データメモリ906において個体データ910及び波形データ911として保持されることとなる。次に、それぞれの個体について、+Aピークと元のピークとを組分けする(ステップ1201)。この処理は、プログラムメモリ905の+Aピーク分離処理部907により実行されるものであり、+Aピークと判断されたピークについては波形データ911のピークラベル1102に+Aピークであることを示す値が書き込まれ、また、元のピークと判断されたピークについては波形データ911のデータ1103にその+Aピークとの高さ比が書き込まれる。また、各個体の全ての波形データについて組分けが完了すると、個体データ910のデータ1002〜1004にそれぞれ算出された値が書き込まれる。尚、この+Aピーク分離処理部907による処理については、後に詳しく説明する。
【0057】
このようにして各個体の波形データに含まれるピークを+Aピークと元のピークとに組分けした結果は、図13に示すようにしてグラフ表示される(ステップ1202)。図13に示す表示画面には、ある個体の波形データについて各ピークを+Aピークと元のピークとに組分けした結果1300と、各ピークの組の高さ及び高さ比1301と、それぞれの組分け方法による各組の高さ比の分散1302とが表示されている。
【0058】
さらに、ステップ1201において+Aピーク以外のピーク(元のピーク)であると判別されたピークのそれぞれについて、真のピークであるかStutterピークであるかが判別される(ステップ1203)。この処理は、プログラムメモリ905の真のピーク分離処理部908により実行されるものであり、ピークの判別方法は従来技術を利用したものである。各ピークの判別結果は、波形データ911のラベルを1102に書き込まれる。また、各個体について真のピークとその+Aピークとの高さ比が算出され、個体データ910のデータ1002にその値が書き込まれる。
【0059】
このようにして各個体の波形データに含まれる元のピークを真のピークとStutterピークとに判別した結果は、図14に示すようにしてグラフ表示される(ステップ1204)。図14に示す表示画面には、ある個体の波形データについて各ピークを+Aピークと真のピークとStutterピークとに判別した結果1400と、各ピークの組の高さ及び高さ比1401と、+Aピークと元のピークの2通りの組分け方法による両ピークの高さ比の分散1402と、真のピークとその+Aピークとの高さ比1403とが表示されている。
【0060】
また、ステップ1204における処理の結果、真のピークとその+Aピークとの高さ比が他の個体における同高さ比から大きく外れている場合には、プログラムメモリ905の警告表示処理部909により、所定の警告が表示される(ステップ1205)。尚、この警告表示処理部909による処理については、後に詳しく説明する。
【0061】
この警告の表示画面の例を図15に示す。図15に示す表示画面には、ある個体の波形データについて各ピークを+Aピークと真のピークとStutterピークとに判別した結果1500と、各ピークの組の高さ及び高さ比1501と、+Aピークと元のピークの2通りの組分け方法による両ピークの高さ比の分散1502と、真のピークとその+Aピークとの高さ比1503と、この個体及び他の個体における真のピークとその+Aピークとの高さ比のヒストグラムと所定の警告表示1504とが表示されている。
【0062】
図16は、図12のステップ1201における+Aピーク分離処理部による処理を詳細に示すフローチャートである。このフローチャートでは1個体分の処理を示している。まず、個体の波形データに含まれるピークのうち、最も高いピークを探す(ステップ1600)。このピークの位置をpとおく。次に、整数iに対して比『{p±(unit長×i)+1}の位置にあるピークの高さ÷{p±(unit長×i)}の位置にあるピークの高さ』を求める。求めた比の分散をV1とおく(ステップ1601)。これは、最も高いピークを元のピークと仮定(+Aピークではないと仮定)した場合の比および分散に対応する。最も高いピークが元のピークであるとすれば、そこからマイクロサテライトのunit長の整数倍離れた位置にあるピークも、元のピークであるとすることができる。また、それらのピークより1塩基長い位置にあるピークは、それぞれの+Aピークであるとすることができる。その後、整数iに対して比『{p±(unit長×i)}の位置にあるピークの高さ÷{p±(unit長×i)−1}の位置にあるピークの高さ』を求める。求めた比の分散をV2とおく(ステップ1602)。これにより、ステップ1601とは逆に、最も高いピークを+Aピークと仮定した場合の比および分散を求めたことになる。
【0063】
続いて、上記ステップ1601および1602で求めたV1およびV2を比較して(ステップ1603)、最も高いピークが+Aピークであるか元のピークであるかを判断する。V1≦V2であれば、ステップ1601での仮定の方が妥当であったと判断される。すなわち、最も高いピーク及びそこからunit長の整数倍離れた位置にあるピークは元のピーク(真のピークまたはStutterピーク)であり、それらのピークより1塩基長い位置にあるピークはそれぞれの+Aピークであると判断される(ステップ1604)。したがって、整数iに対し{p±(unit長×i)+1}の位置にあるピークは+Aピークであるとして、各+Aピークについては波形データ911のピークラベル1102に+Aピークであることを示す値が書き込まれ、各元のピークについてはデータ1103にV1を求めるために用いた比の値が書き込まれる。また、個体データ910のデータ1003及び1004に、それぞれ、V1及びV2の値が書き込まれる。
【0064】
一方、V1> V2であれば、ステップ1602での仮定の方が妥当であったと判断される。すなわち、最も高いピーク及びそこからunit長の整数倍離れた位置にあるピークが+Aピークであり、それらのピークより1塩基短い位置にあるピークはそれぞれの元のピークであると判断される(ステップ1605)。したがって、整数iに対し{p±(unit長×i)}の位置にあるピークは+Aピークであるとして、各+Aピークについては波形データ911のピークラベル1102に+Aピークであることを示す値が書き込まれ、各元のピークについてはデータ1103にV2を求めるために用いた比の値が書き込まれる。また、個体データ910のデータ1003及び1004に、それぞれ、V2及びV1の値が書き込まれる。
【0065】
図17は、図12のステップ1205における警告処理部による処理を詳細に示すフローチャートである。このフローチャートでは1個体分の処理を示している。まず、全ての個体について真のピークとその+Aピークとの高さ比の値(図12のステップ1203における処理で算出され、個体データ910のデータ1002に格納されている)を集計し、平均と標準偏差を求める。ここで平均をE、標準偏差をσとおく(ステップ1700)。次に、現在処理している個体について算出された真のピークとその+Aピークとの高さ比が、E−1.96σ以上でかつE+1.96σ以下であるかどうかを調べる(ステップ1701)。真のピークとその+Aピークの高さ比が正規分布に従うと仮定した場合、真のピークとその+Aピークとの高さ比がこの範囲外であれば、低い方または高い方から2.5%に含まれることになるので、他の個体における比から離れた値を持つと判断し、所定の警告表示を行う(ステップ1702)。
【0066】
尚、上記では、真のピークとその+Aピークの高さ比が他の個体から大きく外れているかどうかを判定する閾値を標準偏差により定めているが、これ以外の方法で閾値を決定しても構わない。例えば、典型的な波形を表している個体を数個体あらかじめ選んでおき、その個体における比の範囲の上限および下限を閾値としてもよいし、予めユーザが閾値を入力しておくなどして、閾値を定義することもできる。また、1つの個体における元のピークとその+Aピークの高さの比の代表値として、真のピークとその+Aピークの高さの比を用いたが、元のピークとその+Aピークの高さの比の平均値・中央値・最頻値を用いるなどしてもよい。
【0067】
以上、本発明の遺伝子情報の表示方法及び表示装置について、具体的な実施の形態を示して説明したが、本発明はこれらに限定されるものではない。当業者であれば、本発明の要旨を逸脱しない範囲内において、上記各実施形態又は他の実施形態にかかる発明の構成及び機能に様々な変更・改良を加えることが可能である。
【0068】
上記した実施形態では、電気泳動(ゲル電気泳動またはキャピラリ電気泳動)を用いた疾患などの表現型に関与する遺伝子の探索を目的とする個体の遺伝子型推定技術について述べたが、電気泳動ではなくMALDI−TOF/MSなど別の実験手法によりPCR増幅産物の長さまたは分子量・質量を調べる場合についても、本発明の方法及び装置を応用することが可能である。また、疾患以外の表現型に関与する遺伝子の探索を目的とする個体の遺伝子型推定技術・DNA鑑定における遺伝子型推定技術などについても、農産物・水産物など、ヒト以外の遺伝子型推定技術についても同様である。
【産業上の利用可能性】
【0069】
本発明の遺伝子情報の表示方法及び表示装置は、例えば、実験データ解析装置として用いられるパーソナルコンピュータなどに実装されて利用され得るものである。
【図面の簡単な説明】
【0070】
【図1】本発明者が発見したPCR増幅産物の蛍光分析結果を示すグラフにおける+Aピークの現れ方の特徴を示す図である。
【図2】本発明者が発見した+Aピークの現れ方の特徴を利用して、長さが1塩基異なる1対のピークのうちいずれが+Aピークでありいずれが元のピークであるかを判別する方法の例を示す図である。
【図3】長さが1塩基異なるごとにピークが現れている場合の+Aピーク及び元のピークの組分け方法を示す図である。
【図4】グラフに現れた波形を+Aピークとその元のピークの対に組分けした結果を表す表示画面を示す図である。
【図5】ヘテロ接合体から得られるグラフにおいて+Aピーク及び元のピークの判別を行う方法を示す図である。
【図6】グラフに現れた波形を+Aピークとその元のピークの対に組分けした結果とともに、必要に応じて組分け方法が間違っているという警告を表す表示画面を示す図である。
【図7】+Aピークは全く現れず、真のピーク及びStutterピークのみが現れているグラフにおいてピークの判別を行う方法を示す図である。
【図8】グラフに現れた各ピークを真のピーク、Stutterピーク、+Aピークのいずれであるか判別した結果を表示する画面の例を示す図である。
【図9】本発明の一実施形態として構築される遺伝子情報表示システムの内部構成を概略的に示す機能ブロック図である。
【図10】図9に示す遺伝子情報表示システムのデータメモリ906に含まれる個体データ910のデータ構造を示す図である。
【図11】図9に示す遺伝子情報表示システムのデータメモリ906に含まれる波形データ911のデータ構造を示す図である。
【図12】図9に示す遺伝子情報表示システムにおいて行われる処理の流れを示すフローチャートである。
【図13】+Aピーク分離処理部により各個体の波形データについて各ピークを+Aピークと元のピークとに組分けした結果をグラフ表示する画面を示す図である。
【図14】真のピーク分離処理部により各個体の波形データに含まれる元のピークを真のピークとStutterピークとに判別した結果をグラフ表示する画面を示す図である。
【図15】真のピークとその+Aピークとの高さ比が他の個体における同高さ比から大きく外れている場合に、警告表示処理部により所定の警告を表示する画面の例を示す図である。
【図16】図12のステップ1201における+Aピーク分離処理部による処理を詳細に示すフローチャートである。
【図17】図12のステップ1205における警告処理部による処理を詳細に示すフローチャートである。
【図18】ゲノム上に表れるマイクロサテライトについて説明する図である。
【図19】PCR及び電気泳動により、マイクロサテライト部分のDNA断片を抽出し増幅する実験手順を模式的に示す図である。
【図20】PCR及び電気泳動の実験過程で生じる代表的なノイズである、Stutterピークと+Aピークについて説明する図である。
【図21】ホモ接合体及びヘテロ接合体それぞれについて、蛍光分析結果のグラフに現れる波形を示す図である。
【符号の説明】
【0071】
900 波形データDB
901 表示装置
902 キーボード
903 ポインティングデバイス
904 中央処理装置
905 プログラムメモリ
906 データメモリ
907 +Aピーク分離処理部
908 真のピーク分離処理部
909 警告表示処理部
910 個体データ
911 波形データ
1900,1901 プライマー配列
1902 マイクロサテライト及びプライマー配列を含んだゲノム領域
2000,2001,2003,2004 DNA断片
【特許請求の範囲】
【請求項1】
DNA断片のPCR増幅産物について長さを分析した結果を表示する装置であって、
それぞれ長さの異なるPCR増幅産物の検出シグナルをグラフ表示する処理部と、
DNA断片に1つのアデニンが付加したPCR増幅産物の検出シグナルに対応する+Aピークと、該+Aピーク以外のピークとを判別する処理部と、
+Aピークと+Aピーク以外のピークとを判別した結果をグラフとともに表示する処理部とを有する表示装置。
【請求項2】
長さの異なるPCR増幅産物の検出シグナルとしてグラフに現れる複数のピークを、長さが1塩基離れた2つのピークを対として組分けし、各対において一方のピークと他方のピークとの高さの比が所定の範囲内である場合には、それぞれ長さが大きい方のピークを+Aピーク、長さが小さい方のピークをその元のピークとして判別することを特徴とする請求項1に記載の表示装置。
【請求項3】
長さの異なるPCR増幅産物の検出シグナルとしてグラフに現れる複数のピークを、長さが1塩基離れた2つのピークを対として組分けし、各対において一方のピークと他方のピークとの高さの比を算出し、算出された高さの比の分散が所定の範囲内である場合には、それぞれ長さが大きい方のピークを+Aピーク、長さが小さい方のピークをその元のピークとして判別することを特徴とする請求項1に記載の表示装置。
【請求項4】
長さの異なるPCR増幅産物の検出シグナルとしてグラフに現れる複数のピークを、長さが1塩基離れた2つのピークを対として組分けする組分け方法が2通りある場合には、第1の組分け方法に従ってピークを組分けした場合の、各対における一方のピークと他方のピークとの高さの比の分散と、第2の組分け方法に従ってピークを組分けした場合の、各対における一方のピークと他方のピークとの高さの比の分散とを比較し、分散が小さくなる方の組分け方法を採用することを特徴とする請求項2又は3に記載の表示装置。
【請求項5】
長さの異なるPCR増幅産物の検出シグナルとしてグラフに現れる複数のピークを、長さが1塩基離れた2つのピークを対として組分けし、各対において一方のピークと他方のピークとの高さの比を算出し、それらの高さの比が他の個体において同様に算出された高さの比と類似しない場合には、所定の警告を表示することを特徴とする請求項1から4のいずれか1項に記載の表示装置。
【請求項6】
+Aピーク以外のピークであると判別されたピークについて、増幅元のDNA断片と同じ長さのPCR増幅産物の検出シグナルとしてグラフに現れる真のピークであるか、増幅元のDNA断片と異なる長さのPCR増幅産物の検出シグナルとしてグラフに現れるstutterピークであるかをさらに判別ことを特徴とする請求項1から5のいずれか1項に記載の表示装置。
【請求項7】
真のピークとその+Aピークとの高さの比が、他の個体における真のピークとその+Aピークとの高さの比と類似しない場合には、所定の警告を表示することを特徴とする請求項6に記載の表示装置。
【請求項8】
DNA断片のPCR増幅産物について長さを分析した結果を表示する方法であって、
それぞれ長さの異なるPCR増幅産物の検出シグナルをグラフ表示するステップと、
DNA断片に1つのアデニンが付加したPCR増幅産物の検出シグナルに対応する+Aピークと、該+Aピーク以外のピークとを判別するステップと、
+Aピークと+Aピーク以外のピークとを判別した結果をグラフとともに表示するステップとを有する表示方法。
【請求項9】
長さの異なるPCR増幅産物の検出シグナルとしてグラフに現れる複数のピークを、長さが1塩基離れた2つのピークを対として組分けし、各対において一方のピークと他方のピークとの高さの比が所定の範囲内である場合には、それぞれ長さが大きい方のピークを+Aピーク、長さが小さい方のピークをその元のピークとして判別することを特徴とする請求項8に記載の表示方法。
【請求項10】
長さの異なるPCR増幅産物の検出シグナルとしてグラフに現れる複数のピークを、長さが1塩基離れた2つのピークを対として組分けし、各対において一方のピークと他方のピークとの高さの比を算出し、算出された高さの比の分散が所定の範囲内である場合には、それぞれ長さが大きい方のピークを+Aピーク、長さが小さい方のピークをその元のピークとして判別することを特徴とする請求項8に記載の表示方法。
【請求項11】
長さの異なるPCR増幅産物の検出シグナルとしてグラフに現れる複数のピークを、長さが1塩基離れた2つのピークを対として組分けする組分け方法が2通りある場合には、第1の組分け方法に従ってピークを組分けした場合の、各対における一方のピークと他方のピークとの高さの比の分散と、第2の組分け方法に従ってピークを組分けした場合の、各対における一方のピークと他方のピークとの高さの比の分散とを比較し、分散が小さくなる方の組分け方法を採用することを特徴とする請求項9又は10に記載の表示方法。
【請求項12】
長さの異なるPCR増幅産物の検出シグナルとしてグラフに現れる複数のピークを、長さが1塩基離れた2つのピークを対として組分けし、各対において一方のピークと他方のピークとの高さの比を算出し、それらの高さの比が他の個体において同様に算出された高さの比と類似しない場合には、所定の警告を表示することを特徴とする請求項8から11のいずれか1項に記載の表示方法。
【請求項13】
+Aピーク以外のピークであると判別されたピークについて、増幅元のDNA断片と同じ長さのPCR増幅産物の検出シグナルとしてグラフに現れる真のピークであるか、増幅元のDNA断片と異なる長さのPCR増幅産物の検出シグナルとしてグラフに現れるstutterピークであるかをさらに判別ことを特徴とする請求項8から12のいずれか1項に記載の表示方法。
【請求項14】
真のピークとその+Aピークとの高さの比が、他の個体における真のピークとその+Aピークとの高さの比と類似しない場合には、所定の警告を表示することを特徴とする請求項13に記載の表示方法。
【請求項1】
DNA断片のPCR増幅産物について長さを分析した結果を表示する装置であって、
それぞれ長さの異なるPCR増幅産物の検出シグナルをグラフ表示する処理部と、
DNA断片に1つのアデニンが付加したPCR増幅産物の検出シグナルに対応する+Aピークと、該+Aピーク以外のピークとを判別する処理部と、
+Aピークと+Aピーク以外のピークとを判別した結果をグラフとともに表示する処理部とを有する表示装置。
【請求項2】
長さの異なるPCR増幅産物の検出シグナルとしてグラフに現れる複数のピークを、長さが1塩基離れた2つのピークを対として組分けし、各対において一方のピークと他方のピークとの高さの比が所定の範囲内である場合には、それぞれ長さが大きい方のピークを+Aピーク、長さが小さい方のピークをその元のピークとして判別することを特徴とする請求項1に記載の表示装置。
【請求項3】
長さの異なるPCR増幅産物の検出シグナルとしてグラフに現れる複数のピークを、長さが1塩基離れた2つのピークを対として組分けし、各対において一方のピークと他方のピークとの高さの比を算出し、算出された高さの比の分散が所定の範囲内である場合には、それぞれ長さが大きい方のピークを+Aピーク、長さが小さい方のピークをその元のピークとして判別することを特徴とする請求項1に記載の表示装置。
【請求項4】
長さの異なるPCR増幅産物の検出シグナルとしてグラフに現れる複数のピークを、長さが1塩基離れた2つのピークを対として組分けする組分け方法が2通りある場合には、第1の組分け方法に従ってピークを組分けした場合の、各対における一方のピークと他方のピークとの高さの比の分散と、第2の組分け方法に従ってピークを組分けした場合の、各対における一方のピークと他方のピークとの高さの比の分散とを比較し、分散が小さくなる方の組分け方法を採用することを特徴とする請求項2又は3に記載の表示装置。
【請求項5】
長さの異なるPCR増幅産物の検出シグナルとしてグラフに現れる複数のピークを、長さが1塩基離れた2つのピークを対として組分けし、各対において一方のピークと他方のピークとの高さの比を算出し、それらの高さの比が他の個体において同様に算出された高さの比と類似しない場合には、所定の警告を表示することを特徴とする請求項1から4のいずれか1項に記載の表示装置。
【請求項6】
+Aピーク以外のピークであると判別されたピークについて、増幅元のDNA断片と同じ長さのPCR増幅産物の検出シグナルとしてグラフに現れる真のピークであるか、増幅元のDNA断片と異なる長さのPCR増幅産物の検出シグナルとしてグラフに現れるstutterピークであるかをさらに判別ことを特徴とする請求項1から5のいずれか1項に記載の表示装置。
【請求項7】
真のピークとその+Aピークとの高さの比が、他の個体における真のピークとその+Aピークとの高さの比と類似しない場合には、所定の警告を表示することを特徴とする請求項6に記載の表示装置。
【請求項8】
DNA断片のPCR増幅産物について長さを分析した結果を表示する方法であって、
それぞれ長さの異なるPCR増幅産物の検出シグナルをグラフ表示するステップと、
DNA断片に1つのアデニンが付加したPCR増幅産物の検出シグナルに対応する+Aピークと、該+Aピーク以外のピークとを判別するステップと、
+Aピークと+Aピーク以外のピークとを判別した結果をグラフとともに表示するステップとを有する表示方法。
【請求項9】
長さの異なるPCR増幅産物の検出シグナルとしてグラフに現れる複数のピークを、長さが1塩基離れた2つのピークを対として組分けし、各対において一方のピークと他方のピークとの高さの比が所定の範囲内である場合には、それぞれ長さが大きい方のピークを+Aピーク、長さが小さい方のピークをその元のピークとして判別することを特徴とする請求項8に記載の表示方法。
【請求項10】
長さの異なるPCR増幅産物の検出シグナルとしてグラフに現れる複数のピークを、長さが1塩基離れた2つのピークを対として組分けし、各対において一方のピークと他方のピークとの高さの比を算出し、算出された高さの比の分散が所定の範囲内である場合には、それぞれ長さが大きい方のピークを+Aピーク、長さが小さい方のピークをその元のピークとして判別することを特徴とする請求項8に記載の表示方法。
【請求項11】
長さの異なるPCR増幅産物の検出シグナルとしてグラフに現れる複数のピークを、長さが1塩基離れた2つのピークを対として組分けする組分け方法が2通りある場合には、第1の組分け方法に従ってピークを組分けした場合の、各対における一方のピークと他方のピークとの高さの比の分散と、第2の組分け方法に従ってピークを組分けした場合の、各対における一方のピークと他方のピークとの高さの比の分散とを比較し、分散が小さくなる方の組分け方法を採用することを特徴とする請求項9又は10に記載の表示方法。
【請求項12】
長さの異なるPCR増幅産物の検出シグナルとしてグラフに現れる複数のピークを、長さが1塩基離れた2つのピークを対として組分けし、各対において一方のピークと他方のピークとの高さの比を算出し、それらの高さの比が他の個体において同様に算出された高さの比と類似しない場合には、所定の警告を表示することを特徴とする請求項8から11のいずれか1項に記載の表示方法。
【請求項13】
+Aピーク以外のピークであると判別されたピークについて、増幅元のDNA断片と同じ長さのPCR増幅産物の検出シグナルとしてグラフに現れる真のピークであるか、増幅元のDNA断片と異なる長さのPCR増幅産物の検出シグナルとしてグラフに現れるstutterピークであるかをさらに判別ことを特徴とする請求項8から12のいずれか1項に記載の表示方法。
【請求項14】
真のピークとその+Aピークとの高さの比が、他の個体における真のピークとその+Aピークとの高さの比と類似しない場合には、所定の警告を表示することを特徴とする請求項13に記載の表示方法。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【図20】
【図21】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【図20】
【図21】
【公開番号】特開2006−17461(P2006−17461A)
【公開日】平成18年1月19日(2006.1.19)
【国際特許分類】
【出願番号】特願2004−192559(P2004−192559)
【出願日】平成16年6月30日(2004.6.30)
【出願人】(000233055)日立ソフトウエアエンジニアリング株式会社 (1,610)
【Fターム(参考)】
【公開日】平成18年1月19日(2006.1.19)
【国際特許分類】
【出願日】平成16年6月30日(2004.6.30)
【出願人】(000233055)日立ソフトウエアエンジニアリング株式会社 (1,610)
【Fターム(参考)】
[ Back to top ]