質量分析によるゲノム上でＲＮＡ配列を同定するシステム

【課題】微量RNA分子を同定する、特にそのRNA分子量情報からインシリコでRNA分子をゲノム配列上に同定する装置、その方法等の提供。
【解決手段】任意の生物種の任意のゲノム配列、および、当該配列を切断することができるDNA分解酵素またはRNA分解酵素もしくはその両方の切断メカニズムに関するデータを格納する記憶手段（１０）、前記分解酵素と同様な分解酵素で切断されることが可能な少なくとも１つの対象RNA断片を測定して得たその対象RNA断片分子量を読み込む入力手段（２０）と、読み込まれた少なくとも１つの対象RNA断片分子量を記憶手段（１０）にある配列データおよび切断メカニズムに関するデータと照合させ、当該対象RNA断片が記憶手段（１０）の配列の上に存在する候補領域を算出する算出手段（３０）と、からなる当該少なくとも１つの対象RNA断片を含む任意のRNA分子を任意のゲノム配列上で標記し同定するRNA分子検索装置。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、対象RNA断片を含む任意のRNA分子を任意の生物種の任意のゲノム配列上で標記し同定するRNA分子検索装置およびその検索方法、そして、コンピュータに対象RNA断片を含む任意のRNA分子を任意の生物種の任意のゲノム配列上で標記し同定する機能を実現させる、対象RNA検索プログラムおよびそのプログラムを記載したコンピュータ読み取り可能な記録媒体に関する。
【背景技術】
【０００２】
最近、RNA干渉やマイクロRNAの発見によって、タンパク質をコードしないRNA（機能性RNA）が担う新しい機能は注目されている。機能性RNAはそれ自身が遺伝子の最終産物であり、これらが機能性高分子として振る舞い、遺伝子の発現調節から、発生や分化など高次生命現象に関わる重要な働きを担っていることが次第に明らかになりつつある。また、最近機能性RNAの異常が疾患の原因になっているという例が報告されつつあり、疾患の原因としてタンパク質の異常のみならずRNAの異常も視野に入れる必要がある。機能性RNA研究を強力に推進するためには、従来から行われてきたRNAを「情報」として捉えるアプローチでは不十分であり、RNAを「分子」として捉える新しい方法論の開発が不可欠である。
【０００３】
しかしながら、これまでのRNAの解析法では、逆転写PCRによりcDNAを増幅し配列を決定する方法などが主流であるが、この手法ではRNAが持つ配列情報のみしか読み取ることができない。RNAの転写後プロセシングや修飾などの質的な情報を得るためには不十分である。また、PCRによるバイアスを考慮するとその方法は決して定量的な解析であるとは言い難い。放射性同位体によって標識し、複数の塩基配列特異的リボヌクレアーゼを用いて配列を解析する方法（ドニスケラー法）や修飾塩基を含めた解析法である口野らのポストラベル法なども用いられているが、いずれも熟練した技術と時間と手間がかかる方法であり、汎用的ではない。
【０００４】
一方、ノーベル化学賞を受賞した島津製作所の田中耕一氏が発明した生体高分子の２大イオン化法のうちの一つ（MALDI法）は、質量分析法によるタンパク質研究に大きな貢献を寄与した。それによって、タンパク質の質量測定法であるペプチドマスフィンガープリント(PMF)法が確立された。
【０００５】
微量タンパク質の同定が飛躍的に進歩した背景には、質量分析の進歩に加え、ゲノム解析による遺伝子データベースの充実が挙げられる。もはや、タンパク質の同定にN末や内部ペプチドのシーケンスをする必要がなく、SDS-PAGEなどで分離したタンパク質をトリプシンなどのアミノ酸残基特異的プロテアーゼで消化しペプチドの質量を測定するだけで同定することができる。ペプチドマスフィンガープリント(PMF)法では、解析対象とする生物種由来の全タンパク質の配列をインシリコでトリプシンを切断することを想定し、リジン(K)とアルギニン(R)で切断したペプチドをリスト化し各ペプチドの分子量を、仮想的データベースとして利用する。
【０００６】
このデータベースに対し、実際の解析したペプチドの分子量セットを参照し最も類似性の高いタンパク質を検索することで同定することが可能である。複数のペプチドが1種類のタンパク質の配列内に落ちる可能性は低いことから、必ずしも全てのペプチドが帰属できなくとも正解率が高く、PMF法は今やプロテオミクス研究には欠かすことのできない重要な技術である。
【発明の開示】
【発明が解決しようとする課題】
【０００７】
ペプチドマスフィンガープリント法により簡便に微量タンパク質を同定することが可能となったが、微量RNAの簡便な同定法は存在していない。従来、RNA分子はタンパク質と比べイオン化が難しく、RNA分子の質量分析による高感度検出は困難であったが、本発明者らによりRNA分子の高感度質量分析が可能となり、微量RNA分子同定のための質量分析データが得られるようになった。しかしながら、ペプチドとRNAではモノマーの種類の数が違うこと、検索対象とすべきデータベースが違うことなどから、分子量リストからペプチドマスフィンガープリント法のデータ処理部分のままではRNA分子を同定することはできない。そのため、微量RNA分子を同定する、特にそのRNA分子量情報からインシリコでRNA分子をゲノム配列上に同定する新手法が望まれる。
【課題を解決するための手段】
【０００８】
本発明者は、ペプチドマスフィンガープリント法と同等な同定法をRNA分子に使用することができるように鋭に努力した結果、RNA断片間の分子量差に着目し、測定した分子量リストとゲノム配列データベースを加工した仮想的な分子量リストの類似性を評価し、スコア化することでRNA分子を同定することができる本願発明であるRNAマスフィンガープリント法（RMF法）を見出した。
【０００９】
本発明（RNAマスフィンガープリント法）は、高感度質量分析によって解析された微量RNAの分子量データを用いて、ゲノムデータベースから迅速にRNA遺伝子を同定する方法で、RNA断片間の分子量の差分に基づく。図４に示すように、大腸菌と酵母のゲノム塩基配列を所定のRNA分解酵素でRNAを切断したときにできる断片の分子量を塩基の組成ごとにまとめ、分子量順にソートした結果について調査を行った。ゲノム塩基配列をGで切断したときにできる断片間の最小の分子量差は、大腸菌、酵母共に0.21(Da)であった。質量分析計の誤差が0.1（Da）であるため、大腸菌と酵母では断片分子量により組成をしぼりこむことが可能であることがわかった。
【００１０】
一方、タンパク質をトリプシンで切断（RとKで切断）したときの断片の分子量を算出すると、各組成の分子量差が小さいものが多く、0.05(Da)以下の分子量差のものが80%を越えているため、分子量のみから組成を絞り込むことは非常に困難である。特徴としてゲノム断片は、タンパク質と比べて分子量から組成へ帰属しやすいと言える。また、マウス、ヒトなどのゲノムサイズの大きい高等生物種では、組成の組み合わせパターンが増え、理論上の塩基配列の組み合わせに近づくことが予想される為、35塩基までの組成間の分子量の差の算出を行った。断片間の分子量差の最小値は0.17（Da）であり、精度の高い質量分析計であればマウス、ヒトなどのゲノムサイズの大きい高等生物であっても、分子量から組成を絞り込むことが可能であることが判明した。
【００１１】
したがって、本発明は、任意の生物種の任意のゲノム配列、および、当該配列を切断することができるDNA分解酵素またはRNA分解酵素もしくはその両方の切断メカニズムに関するデータを格納する記憶手段（１０）、前記分解酵素と同様な分解酵素で切断されることが可能な少なくとも１つの対象RNA断片を測定して得たその対象RNA断片分子量を読み込む入力手段（２０）と、読み込まれた少なくとも１つの対象RNA断片分子量を記憶手段（１０）にある配列データおよび切断メカニズムに関するデータと照合させ、当該対象RNA断片が記憶手段（１０）の配列の上に存在する候補領域を算出する算出手段（３０）と、からなる当該少なくとも１つの対象RNA断片を含む任意のRNA分子を任意のゲノム配列上で標記し同定するRNA分子検索装置に関する。
【００１２】
また、本発明は、任意の生物種の任意のゲノム配列、および、当該配列を切断することができるDNA分解酵素またはRNA分解酵素もしくはその両方の切断メカニズムに関するデータを格納する記憶ステップ（１０）、前記分解酵素と同様な分解酵素で切断されることが可能な少なくとも１つの対象RNA断片を測定して得たその対象RNA断片分子量を読み込む入力ステップ（２０）と、読み込まれた少なくとも１つの対象RNA断片分子量を記憶ステップ（１０）にある配列データおよび切断メカニズムに関するデータと照合させ、当該対象RNA断片が記憶ステップ（１０）の配列の上に存在する候補領域を算出する算出ステップ（３０）と、からなる当該少なくとも１つの対象RNA断片を含む任意のRNA分子を任意のゲノム配列上で標記し同定するRNA分子検索方法に関する。
【００１３】
さらに、本発明は、コンピュータに、任意の生物種の任意のゲノム配列、および、当該配列を切断することができるDNA分解酵素またはRNA分解酵素もしくはその両方の切断メカニズムに関するデータを格納する記憶機能（１０）、前記分解酵素と同様な分解酵素で切断されることが可能な少なくとも１つの対象RNA断片を測定して得たその対象RNA断片分子量を読み込む入力機能（２０）と、読み込まれた少なくとも１つの対象RNA断片分子量を記憶機能（１０）にある配列および切断メカニズムに関するデータと照合させ、当該対象RNA断片が記憶機能（１０）の配列の上に存在する候補領域を算出する算出機能（３０）と、を実現させる、当該少なくとも１つの対象RNA断片を含む任意のRNA分子を任意のゲノム配列上に標記し同定するRNA分子検索プログラム、または、そのプログラムを記載したコンピュータ読み取り可能な記録媒体に関する。
【発明の効果】
【００１４】
本発明は、微量なRNAをPCRによる増幅やラジオアイソトープによる標識なしに、高感度質量分析法を用いて直接測定することで、その分子量情報からインシリコでRNA遺伝子の配列を同定することができ、抗体で免疫沈降した細胞内に存在する微量なRNA−タンパク質複合体（RNP）に含まれるRNAを迅速かつ定量的に測定することができるため、RNA−タンパク質の相互作用解析のまったく新しい基盤技術となりうるもので、将来的にRNA-タンパク質の相互作用ネットワーク作りにも大きく貢献することが期待される。
【産業上の利用可能性】
【００１５】
本発明のプログラムをはじめとする方法および装置によれば、RNAの質量分析法は次世代のRNA研究を支える重要な基盤技術となりうるものであり、この技術を生かすためにはＲＭＦが不可欠である。装置メーカー、バイオインフォマティクス産業、創薬ベンチャー、国家プロジェクトなどを巻き込んで大規模に展開できる可能性がある。
【発明を実施するための最良の形態】
【００１６】
〔用語定義〕
本発明の内容をよりわかりやすくするために明細書に記載の用語をここで定義する。本発明における「組成」とは、配列の順序に関係なく、断片に含まれる塩基種類およびその数を表した用語である。例えば、A1U0C2G1で表される断片の組成はアデニンを１残基、ウラシルを０残基、シトシンを２残基、グアニンを１残基含む断片であることを意味し、その配列の順序とは無関係である。また、本発明における「分子量」とは、実際の分子量もしくは質量分析機から得られるデータである質量電荷比(m/z)および電荷(z)に基づいて公知の方法で算出した測定対象となる物質の分子量のいずれかを表し、分子量あるいはそれに準ずるデータを表した用語である。
【００１７】
本発明における「ゲノム配列」とは、本特許出願時に公知された任意の生物種の任意のゲノムの２本鎖にそれぞれ対応する一本鎖のRNAの配列、また、たとえばRNAのゲノムを持つウイルスの場合ではその２本鎖RNA、１本鎖RNAの配列をも含み、さらに、１本鎖DNAのゲノムではその対応するRNAの配列を表した用語で、「ゲノム断片」とは、本特許出願時に実際に存在する任意のRNA分解酵素またはDNA分解酵素もしくはその両方の切断メカニズムにしたがって、仮想的に前記ゲノム配列を切断した場合にできるゲノム断片を表した用語で、「ゲノム断片分子量」とは、ゲノム断片の分子量を表した用語で、「ゲノム断片組成」とは、仮想的に切断されたゲノム配列の断片の組成を表した用語で、「ゲノム断片位置」とは、ゲノム配列の上にそのゲノム断片の存在する場所を示す位置データを表した用語で、「ゲノム断片数」とは、ゲノム配列の上にある同じゲノム断片組成を有するゲノム断片の数を表した用語である。
【００１８】
本発明における「対象RNA」とは、ゲノム配列の上同定しようとするある特定のRNA分子、特に機能性RNA分子を表した用語で、「対象RNA断片」とは、前記ゲノム断片を得るために用いたRNA分解酵素と同じもので対象RNAを実際に切断して得た断片を表した用語で、「対象RNA断片番号」とは、切断された対象RNA断片に付ける番号を表した用語で、「対象RNA断片分子量」とは、対象RNA断片の分子量を表した用語で、「対象RNA断片組成」とは対象RNA断片分子量と同じ分子量を有するゲノム断片組成を表した用語で、「対象RNA断片数」とは、ゲノム配列の上にある、対象RNA断片組成と同じ組成を有するゲノム断片数を表した用語で、「対象RNA断片位置」とは、ゲノム配列の上にある、対象RNA断片組成と同じ組成を有するゲノム断片位置を表した用語である。
〔本発明の実施態様〕
本発明の少なくとも１つの対象RNA断片を含む任意のRNA分子を任意のゲノム配列上で標記し同定するRNA分子検索装置は、任意の生物種の任意のゲノム配列、および、当該配列を切断することができるDNA分解酵素またはRNA分解酵素もしくはその両方の切断メカニズムに関するデータを格納する記憶手段（１０）、前記分解酵素と同様な分解酵素で切断されることが可能な少なくとも１つの対象RNA断片を測定して得たその対象RNA断片分子量を読み込む入力手段（２０）と、読み込まれた少なくとも１つの対象RNA断片分子量を記憶手段（１０）にある配列データおよび切断メカニズムに関するデータと照合させ、当該対象RNA断片が記憶手段（１０）の配列の上に存在する候補領域を算出する算出手段（３０）とからなる。
【００１９】
記憶手段（１０）に記憶する、当該配列を切断することができるDNA分解酵素またはRNA分解酵素もしくはその両方の切断メカニズムに関するデータは、RNA分解酵素を例にすると、グアニン（G）を特異的に切断するRNaseT1、シトシン（C）を特異的に切断するRNaseCL3や、UもしくはCを特異的に切断するRNaseA、そしてAもしくはGを特異的に切断するRNaseU2などのデータを含む。また、記憶手段（１０）は、記憶領域（たとえばメモリ上）に格納されるその分解酵素の切断メカニズムに関するデータによって、記憶領域（たとえばメモリ）に展開される記憶手段（１０）で記憶する任意の生物種の任意のゲノム配列を仮想的に切断した断片の関するデータを記憶することができる。
【００２０】
本発明は、その任意のゲノム配列を仮想的に切断した断片に関するデータに一例として、ゲノム断片分子量、ゲノム断片組成、ゲノム断片数およびゲノム断片位置からなる１組のデータが挙げられ、また、記憶領域（たとえばメモリ）上での格納スペースを節約するために図２に示すように当該１組のデータの中少なくとも２つのデータを格納する記憶手段（１１）をさらに含むことができる。また、別の例として、同図にあるテーブルＥに示すように下記誤差を修正する修正手段（２２）に関するデータを格納することもできる。
【００２１】
本発明における入力手段（２０）は、前記分解酵素と同様な分解酵素で切断されることが可能な少なくとも１つの対象RNA断片を測定して得たその対象RNA断片分子量を読み込む入力手段であり、ここでは、対象RNA断片を特にRNA分解酵素で実際切断する必要はなく、その分子量が既知の場合はその分子量を、その分子量が未知の場合は、直接に分子量を、たとえばLC/MS（液体クロマトグラフィー/マススペクトロメトリー）あるいはMALDI-TOF MS（マトリックス支援レーザ脱離イオン化法/飛行時間型質量分析計）で測定し入力することができる。
【００２２】
本発明は、より正確に対象RNA断片を同定するために、前記分解酵素と同様な分解酵素で実際に対象RNAを切断して得られた少なくとも１つの対象RNA断片を測定して得たその対象RNA断片分子量を読み込む入力手段（２１）をさらに含むができる。たとえば、実際に切断された対象RNA断片のそれぞれの分子量を配列I(n)（nは１以上の整数で対象RNA断片番号を示す）として入力することができる。
【００２３】
本発明における算出手段（３０）は、読み込まれた少なくとも１つの対象RNA断片分子量を記憶手段（１０）にある配列データおよび切断メカニズムに関するデータと照合させ、当該対象RNA断片が記憶手段（１０）の配列の上に存在する候補領域を算出する算出手段であり、たとえば、対象RNA断片分子量を記憶領域に格納されている仮想的に切断されたゲノム配列断片に関するデータと照合し、その対象RNA断片がゲノム配列上に存在する候補領域を算出することができる。
【００２４】
本発明は、より正確に対象RNAがゲノム配列上に存在する候補領域を算出するために、読み込まれた少なくとも１つの対象RNA断片分子量を記憶手段（１０）または記憶手段（１１）もしくはその両方のデータと照合させた後、さらに、対象RNA断片組成を抽出する抽出手段（３１）をさらに含むことができる。具体的には、対象RNA断片分子量と一致する分子量をもつゲノム断片分子量に対応する、該ゲノム断片分子量と同じ組にあるゲノム断片組成を対象RNA断片組成としてたとえば、行列H(n)（nは１以上の整数で対象RNA断片番号を示す）の形式で定義し記憶領域（媒体も含む）に格納する。
【００２５】
しかしながら、対象RNA断片の分子量をLC/MS（液体クロマトグラフィー/マススペクトロメトリー）あるいはMALDI-TOF MS（マトリックス支援レーザ脱離イオン化法/飛行時間型質量分析計）で測定しても修飾基などの様々な要因によってゲノム断片分子量との誤差が生じる。その原因として、(1) RNAフラグメントの末端リン酸基の形状による誤差、(2)組成中のU/C数の内訳の誤りによる誤差、(3)修飾により仮想的な切断が実際には起こらないことによる誤差、(4)元RNAの両末端フラグメントによる誤差、(5)天然同位体の影響等で抽出すべき質量を誤ってしまう誤差などが考えられる。
【００２６】
本発明は、より正確な対象RNA分子量を入力させるために、入力手段（２１）で読込まれた少なくとも１つの対象RNA断片分子量に対する誤差を修正する修正手段（２２）をさらに含み、様々なケースにおいて、誤差を持つ対象RNA断片分子量の扱いを包括的に規定できる。たとえば、本特許出願現在RNA塩基配列生じうる全ての分子量変化を予め所定のデータベースに格納して記憶させる。メモリ上展開した対象RNA断片分子量とゲノム断片分子量との照合結果一致しないときには、対象RNA断片に誤差を生じる原因が存在すると判断し、その誤差を生じていると思われる対象RNA断片分子量に対し、分子量の誤差修正を行う。
【００２７】
本発明は、より正確に対象RNA断片分子がゲノム配列上に存在する候補領域を算出するために、前記算出手段（３０）に、得られた対象RNA断片組成をさらに記憶手段（１０）または記憶手段（１１）もしくはその両方のデータと照合させ、当該ゲノム配列の上にある少なくとも１つ対象RNA断片数を抽出する抽出手段（３２）を含ませることができる。具体的には、対象RNA断片組成と一致するゲノム断片組成に対応する、該ゲノム断片組成と同じ組にあるゲノム断片数を対象RNA断片数としてたとえば、行列F(n)（nは１以上の整数で対象RNA断片番号を示す）の形式で定義し記憶領域（媒体も含む）に格納する。
【００２８】
本発明は、より正確に対象RNA断片分子がゲノム配列上に存在する候補領域を算出するために、前記算出手段（３０）に、得られた対象RNA断片組成をさらに記憶手段（１０）または記憶手段（１１）もしくはその両方のデータと照合させ、当該ゲノム配列の上にある少なくとも一箇所の対象RNA断片位置を抽出する抽出手段（３３）をさらに含ませることができる。具体的には、対象RNA断片組成と一致するゲノム断片組成に対応する、該ゲノム断片組成と同じ組にあるゲノム断片位置を対象RNA断片位置としてたとえば、行列L(n)（nは１以上の整数で対象RNA断片番号を示す）の形式で定義し記憶領域（媒体も含む）に格納する。それによって、対象RNA断片がゲノム上の存在する可能性の高い場所を特定することができる。
【００２９】
本発明は、より正確に対象RNA断片分子がゲノム配列上に存在する候補領域を算出するために、前記算出手段（３０）に、得られた少なくとも一箇所の対象RNA断片位置からゲノム配列の所定方向に所定の塩基長で設けられるフレーム内のゲノム配列組成を走査させる走査手段（３４）をさらに含ませることができる。ゲノム配列の上に対象RNA断片組成が存在することは、そのあたりに対象RNA存在の可能性が高いことを示すので、ゲノム配列上にある全ての対象RNA断片位置から所定のフレームを設け、そのフレーム内の全ゲノム配列組成を対象RNA断片組成で走査することにより、対象RNA断片組成が全て入っているフレームをゲノム配列上に検出することができる。
【００３０】
本発明におけるフレームの長さは、限定されたものではない。好ましくは対象RNA塩基長である。対象RNAの塩基配列の長さをフレームとすることで、そのフレームに対象RNA断片組成の全てが入ればそのフレーム自体が同定しようとする対象RNAである可能性が極めて高く、対象RNAがゲノム配列の上に存在する位置をほぼ突き止めることになる。また、本発明においては、たとえば電気泳動等の他の手段で対象RNAの塩基の長さを測定してフレームの長さを決めることが好ましい。また、本願特許出願時における公知した対象RNAの塩基配列の長さを測定することができる方法の全てを本発明で用いることができる。
【００３１】
本発明は、算出したゲノム配列上に存在する対象RNA断片分子の候補領域を数字化するために、前記算出手段（３０）に、得られたフレーム内の組成と一致する少なくとも１つの対照RNA断片組成の数（対象RNA断片数）をもとに、フレーム内のその対象RNA断片の出現確率を算出する算出手段（３５）をさらに含ませることができる。本発明において、出現確率を算出する好ましい算出手段として、出現頻度比率法または二項分布法が挙げられる。
【００３２】
本発明で用いる出現頻度比率法とは、ゲノムを仮想的に切断して得られたRNA断片の総数をF_total、そのゲノム断片の中数が最も多い２塩基以上のある所定のゲノム断片のゲノム断片数をF_max、ゲノム配列の上に存在するある対象RNA断片数をFn（nは１以上の整数で対象RNA断片番号を示す）としたとき、その対象RNA断片のゲノム配列上での出現頻度比率（P(n)）を以下の式で算出し、これをフレーム内での組成断片出現確立としてスコアの計算に使用する方法である。
【００３３】
P(a)=Fa / F_total÷F_max / F_total
【００３４】
例えば、RNA分解酵素としてRNaseT1を用いる場合、スコアに反映させる塩基長を３塩基以上とするときには、その中で最も出現頻度の高いAOU1C1G1という３塩基の組成の断片の数をF_maxとして用いればよい。
【００３５】
本発明は、出現頻度比率法以外に二項分布法を用いることもできる。ここで二項分布法とは、ゲノム上の任意の１点における特定の組成が現れる確率p（p = 特定の組成の出現頻度/ゲノム長）を用いる方法である。あるフレーム内に特定の組成が特定の回数現れる確率はpを成功確率、フレーム長を試行回数とした二項分布に従うと考えられる。ここでは、フレーム長をlとするときに確率変数Xが二項分布に従い、B(p,l)に対し、すなわちX 〜 B(p,l )で、pは組成の理論的な出現確率を使用しても良い。このような二項分布、またはこれを近似するポアソン分布から導かれる確率をフレーム内での組成断片出現確率としてスコアの計算に使用することができる。
【００３６】
本発明は、算出したゲノム配列上に存在する対象RNAの候補領域をさらに明確した数字で表すために、前記算出手段（３５）に、フレーム内の前記対象RNA断片の出現確率よりスコアを算出する算出手段（３６）をさらに含ませることができる。本発明は、前記出現頻度比率法または二項分布法を用いて算出した、フレーム内に入っている全ての対象RNA断片の出現確率もしくは比率であるP(n)のログ（log）を足しあわせた値を、もしくは出現確率もしくは比率であるP(n)を掛け合せた積に対してログ（log）を取った値を、そのフレーム内に対象RNA断片が存在する可能性を示すスコアにある。
【００３７】
このスコアの値は、フレーム内にある対象RNA断片の出現確率もしくは比率（0<P(n)<1）の積であるため、フレームに対象RNA断片が多ければその１より小さい正数の積は小さくなり、全ての断片が一つのフレームにあれば、その積は最小値になる。また、わかり易くするためにその積に対してマイナスログ（-log）を取ることで、スコアの値が大きければフレーム内対照RNAの出現頻度が高くなる。また、出現頻度のP(n)に対しマイナスログ（-log）を取ってから足し算でスコアを求めることは数学的な観点からすれば全く同じであるため、本発明はスコアの算出におけるその順番に限定を設けない。
【００３８】
たとえば、あるフレーム内に特定の組成がk回現れる確率はP[X=k]をPfと表し、すなわち、Pf = P[X=k] である。-log(Pf)を特定の組成に対するスコアとする。フレーム内に出現する異なった組成ごとにスコアを算出し、その和をフレームのスコアとすることができる。
【００３９】
本発明のフレームは、ゲノム配列の上に出現する対象RNA断片位置から設けられているので、その位置の数ほどのフレームが設けられていることになり、またフレーム１つに対して１つのスコアが算出することになる。よって、最も大きなスコアを順に並びかえることで上位スコアを抽出することができる。ゲノム配列の上に複数の対象RNAが存在する場合は、その上位スコアは１つに限らず、複数のスコアの存在はあり得る。
【００４０】
対象RNA断片を含む任意のRNA分子を任意のゲノム配列上で標記し同定する本発明は、特にマウス、ヒト等の哺乳動物、特にヒトのある特定の対象RNA断片を含む任意のRNA分子をヒトのゲノム上に標記し同定することができる。
【００４１】
また、本発明は、RNAを「分子」としてその分子量、その組成に基づいて構成される。RNAと１つ塩基しか違わないDNAも「分子」として捕らえ、RNAの分子量および組成と大差のないDNA分子量および組成に基づいて本発明で対照DNA断片を含む任意のDNA分子を任意のゲノム配列上で標記し同定することができる。この場合には、RNA分解酵素に代わりにDNA分解酵素が用いられる。
【００４２】
つまり、本発明は、対象DNA断片を含む任意のDNA分子を任意の生物種の任意のゲノム配列上で標記し同定するDNA分子検索装置およびその検索方法、そして、コンピュータを用いて対象DNA断片を含む任意のDNA分子を任意の生物種の任意のゲノム配列上で標記し同定する機能を実現させるプログラムおよびそのプログラムを記載したコンピュータ読み取り可能な記録媒体に関する。本発明は、上述したRNAに関する本発明の記載はそのまま対象DNA断片に適応することができる。
【００４３】
本発明は、対象RNA断片を含む任意のRNA分子を任意の生物種の任意のゲノム配列上で標記し同定するRNA分子検索装置のみならず、その検索方法、そして、コンピュータを用いて対象RNA断片を含む任意のRNA分子を任意の生物種の任意のゲノム配列上で標記し同定する機能を実現させる、RNA分子検索プログラムおよびそのプログラムを記載したコンピュータ読み取り可能な記録媒体に関するものである。
【００４４】
また、本発明は、対象RNA断片を含む任意のRNA分子を任意の生物種の任意のゲノム配列上で標記し同定するRNA分子検索装置を構成する諸手段である、記憶手段（１０）、入力手段（２０）、算出手段（３０）、そして、記憶手段（１１）、入力手段（２１）、修正手段（２２）、抽出手段（３１）、抽出手段（３２）、抽出手段（３３）、走査手段（３４）、算出手段（３５）および算出手段（３６）を、それぞれ検索方法を構成するそれぞれのステップに対応させ、RNA分子検索方法を提供することができる。
【００４５】
また、本発明は、上記手段を、コンピュータを用いて対象RNA断片を含む任意のRNA分子を任意の生物種の任意のゲノム配列上で標記し同定する機能を実現させる、RNA分子検索プログラムおよびそのプログラムを記載したコンピュータ読み取り可能な記録媒体を構成するそれぞれの機能に対応させることができる。
【００４６】
本発明は、RNA分子検索装置に関する実施態様のみ記載したが、その検索方法、そして、コンピュータを用いて対象RNA断片を含む任意のRNA分子を任意の生物種の任意のゲノム配列上で標記し同定する機能を実現させる、RNA分子検索プログラムおよびそのプログラムを記載したコンピュータ読み取り可能な記録媒体に関する実施態様についても、RNA分子検索装置に関する実施態様の記載に対応して読みかえることができるので、ここで開示したこととなる。
【００４７】
本発明の最も好ましい実施態様は図１で示す。
【００４８】
図中、１１は、記憶手段（１０）に含まれている、ゲノム配列を切断することができるDNA分解酵素またはRNA分解酵素もしくはその両方の切断メカニズムにしたがって当該任意の生物種の任意のゲノム配列を仮想的に切断し、ゲノム断片分子量、ゲノム断片組成、ゲノム断片数およびゲノム断片位置からなる１組のデータの中少なくとも２つのデータを格納する記憶手段（１１）を示す（図２参照）。
【００４９】
この本発明の実施態様は、まず図２に示すように、任意の生物種類の任意のゲノム配列に対応するRNA配列を所定の特異的にRNAを分解するRNA分解酵素の切断メカニズムにしたがって仮想的に切断し、ゲノム断片分子量、ゲノム断片組成、ゲノム断片数およびゲノム断片位置からなる１組のデータが格納された記憶手段（１１）を有する。
【００５０】
図２のゲノム断片データベース２０には、少なくとも、公知された配列、たとえば、市販のNCBInrやTrEMBLデータベースなどから入手することができるゲノム配列２本鎖（表裏）に対応するゲノム配列を特異的なRNA分解酵素の切断メカニズムにしたがって、たとえばコンピュータ上インシリコ（in silico）で仮想的に切断し、そのゲノム断片分子量、ゲノム断片組成、ゲノム断片位置、ゲノム断片数を一組のデータとして格納するテーブルを含む。
【００５１】
図２に示すテーブルＤ（２４）のように、仮想的に切断されたゲノム断片のゲノム断片組成、ゲノム断片分子量、ゲノム断片数およびゲノム断片位置は、同じテーブルに一組のデータとして格納されてもよく、また、テーブルＡ乃至Ｃ（２１、２２および２３）のように、ゲノム断片組成を中心に他のデータと一組にして別のテーブルに格納してもよい。本発明は、当該データをメモリ上に展開するときに容量を小さく抑えるために、図２の２１、２２および２３に示すように、ゲノム断片組成、ゲノム断片分子量、ゲノム断片数およびゲノム断片位置をそれぞれ別のテーブルに格納することが好ましい。
【００５２】
本願特許出願時に公知されたすべてのRNA分解酵素の特異的な切断は、本発明の仮想的にRNA配列切断に用いることができる、たとえば、グアニン（G）を特異的に切断するRNaseT1、シトシンを特異的に切断するRNaseCL3や、UもしくはCを特異的に切断するRNaseA、そしてAもしくはGを特異的に切断するRNaseU2などがある。本発明に用いる特異的に切断RNA分解酵素は上記例に限らない。
【００５３】
この本発明の実施態様のゲノム断片データベースに使用されるゲノムは、任意の生物種の任意のゲノムであり、大腸菌、酵母から各種の哺乳動物、そしてヒトまで特に限定されない。本実施態様をより分かりやすく説明するために、大腸菌および酵母のゲノムを用いたが、それには限定されない。ここで使用される大腸菌ゲノムには、たとえば、大腸菌K12 MG1655株等があげられ、酵母のゲノムには、たとえば、出芽酵母Saccharomyces_cerevisiae等があげられる。また、大腸菌の遺伝子産物の名前として、5S rRNA、6S RNA、4.5S RNA、23S rRNA、16S rRNA等、また、出芽酵母の遺伝子の名前として、snR9、scR1、snR128、snR190、snR14、snR6等がある
図中、１２は、記憶手段（２０）に含まれている、前記分解酵素と同様な分解酵素で実際に切断して得られた少なくとも１つの対象RNA断片を測定して得たその対象RNA断片分子量を行列I(n)（nは１以上の整数で対象RNA断片番号を示す）として読み込む入力手段（２１）を示す（図３参照）。
【００５４】
本実施態様は、実際に存在する配列等が未知のRNA分子をゲノム配列の上に同定することを目的とし、対象RNAを前記分解酵素と同様な分解酵素で対象RNAを実際に切断して得た少なくとも１つの対象RNA断片を測定して得たその対象RNA断片分子量およびその対象RNA断片番号からなる１組のデータを読み込む。
【００５５】
具体的には、Gを特異的に切断するRNaseT1で図３の３０のような配列未知の対象RNA分子を３１のような対象RNA断片に切断する。次いで、たとえばLC/MS（液体クロマトグラフィー/マススペクトロメトリー）あるいはMALDI-TOF MS（マトリックス支援レーザ脱離イオン化法/飛行時間型質量分析計）ですべての対象RNA断片分子量を測定し、３２のようにその対象RNA断片番号とそれに対応する対象RNA断片分子量をたとえばテーブルＹに配列I(n)（nは１以上の整数で対象RNA断片番号を示す）の形式で記憶領域（媒体も含む）に格納する。
【００５６】
図中、１３および１４は、入力手段（２１）で読込まれた少なくとも１つの対象RNA断片分子量に対する誤差を修正する修正手段（２２）を示す。本実施態様は本特許出願現在RNA塩基配列に対して生じうる全ての分子量変化を予め図２のテーブルＥ（２５）のように所定のデータベースに格納して記憶させる。メモリ上展開した対象RNA断片分子量とゲノム断片分子量との照合結果一致しないときには、対象RNA断片に誤差を生じる原因が存在すると判断され（図１の１３参照）、その誤差を生じていると思われる対象RNA断片分子量に対し、分子量の誤差修正を行う（図１の１４参照）。
【００５７】
図中、１５は、前記算出手段（３０）に含まれている、読み込まれた少なくとも１つの対象RNA断片分子量を記憶手段（１０）または記憶手段（１１）もしくはその両方のデータと照合させた後、さらに、対象RNA断片組成を行列H(n)（nは１以上の整数で対象RNA断片番号を示す）として抽出する抽出手段（３１）を示す。
【００５８】
本実施態様は、図３のテーブルＹおよび図２にあるテーブルＡ（２１）を計算領域、たとえばメモリ上に展開し、対象RNA断片分子量をゲノム断片分子量と照合させ、一致する場合対象RNA断片分子量と同じ分子量を持つゲノム組成を対象RNA断片組成として定義し、たとえば、対象RNA断片番号とを一組のデータとして、たとえばテーブルＹに行列H(n)（nは１以上の整数で対象RNA断片番号を示す）の形式で記憶領域（媒体も含む）に格納する。この手段により、実際に切断された対象RNAの各断片の組成情報を知ることができる。
【００５９】
図中、１６は、前記算出手段（３０）に含まれている、得られた対象RNA断片組成をさらに記憶手段（１０）または記憶手段（１１）もしくはその両方のデータと照合させ、当該ゲノム配列の上にある少なくとも１つ対象RNA断片数を行列F(n)（nは１以上の整数で対象RNA断片番号を示す）として抽出する抽出手段（３２）を示す。対象RNA断片組成を図２のテーブルＣにあるゲノム断片組成と照合させ、一致する場合ゲノム配列の上にある、対象RNA断片組成と同じ組成を有するゲノム断片数をゲノム配列の上にある対象RNA断片数と定義し、たとえば対象RNA断片番号とを一組のデータとして、たとえば、行列F(n)（nは１以上の整数で対象RNA断片番号を示す）のようにメモリ上に格納する。
【００６０】
図中、１７は、前記算出手段（３０）が、得られた対象RNA断片組成をさらに記憶手段（１０）または記憶手段（１１）もしくはその両方のデータと照合させ、当該ゲノム配列の上にある少なくとも一箇所の対象RNA断片位置をL(n)（nは１以上の整数で対象RNA断片番号を示す）として抽出する抽出手段（３３）を示す。対象RNA断片組成を図２のテーブルＢにあるゲノム断片組成と照合させ、一致する場合ゲノム配列の上にある、対象RNA断片組成と同じ組成を有するゲノム断片位置を対象RNA断片位置として定義し、たとえば対象RNA断片番号とを一組のデータとして、たとえば、行列L(n)（nは１以上の整数で対象RNA断片番号を示す）のようにメモリ上に格納することができる。それによって、対象RNA断片がゲノム上の存在する可能性の高い場所を特定することができる。
【００６１】
図中、１８は、ゲノム配列の上のフレーム内に対象RNA断片組成の存在を、該RNA断片組成の出現頻度で表そうとし、前記フレーム内に存在する少なくとも１つの対象RNA断片数F(n)をもとに二項分布法でフレーム内のその対象RNA断片の出現頻度P(n)を算出する算出手段（３５）を示す。
【００６２】
図中、１９は、前記抽出手段（５）で得た少なくとも一箇所の対象RNA断片位置からゲノム配列の所定方向に当該対象RNAの塩基長で設けられるフレーム内のゲノム配列組成が走査される走査手段（３４）を示す。ゲノム配列の上に対象RNA断片組成が存在することは、そのあたりに対象RNA分子が存在する可能性があることを示すので、対象RNA断片組成が存在する全ての対象RNA断片位置から所定のフレームを設け、そのフレーム内の全ゲノム配列を走査することにより、対象RNA断片組成が全て入っているフレームをゲノム配列上に検出することができる。図５参照。
【００６３】
図中、２１または２２は、前記算出手段（３５）に含まれる、フレーム内の前記対象RNA断片の出現確率よりスコアを算出する算出手段（３６）を示す。また、２３および２４は、得られたスコアのリストに登録して、そのリストを表示することを示す（図６および図７参照）。
【実施例】
【００６４】
実施例１
本発明は、上述した記載に基づいて、精製した大腸菌5SリボソームRNA分子にRNase T1を作用させて作成したフラグメントのLC/MSによる測定データから、A1U2C5G1、
A1U2C5G1、A2U1C4G1、A3U1C2G1、A3U0C1G1、A3U0C1G1、A2U1C1G1、A2U1C1G1、A1U0C2G1、A1U0C2G1、A0U1C2G1、A0U1C2G1、A2U0C0G1、A1U1C0G1、A1U1C0G1、A0U0C2G1、に相当する組成の一部乃至大部分が大腸菌5SリボソームRNA遺伝子領域に含まれることを見出し、大腸菌（K12 MG1655株）
（ftp://ftp.ncbi.nih.gov/genomes/Bacteria/Escherichia_coli_K12/よりダウンロード
可能）をゲノム配列とし、上記RNA断片を対象RNA断片としてそのゲノム中での位置を同定
し、大腸菌に8ヶ所存在する5SリボソームRNA遺伝子の帰属に成功した。8遺伝子のうちの1
つは、最も出現頻度の低いフラグメントの組成が異なるため、他の7遺伝子と異なるスコ
アが算出されている。その結果を図６（ａ）乃至（ｃ）、に示す。
【００６５】
実施例２
本発明は、上述した記載に基づいて、精製した出芽酵母5SリボソームRNA分子にRNase T1を作用させて作成したフラグメントのLC/MSによる測定データから、A4U4C4G1、A4U3C5G1、A4U1C2G1、A3U1C3G1、A2U4C1G1、A2U3C2G1、A2U2C2G1、A2U2C2G1、A0U3C3G1、A3U1C1G1、A2U2C1G1、A1U3C1G1、A0U3C2G1、A3U1C0G1、A2U2C0G1、A1U1C2G1、A0U1C3G1、A0U2C2G1、A3U0C0G1、A2U1C0G1、A2U1C0G1、A1U1C1G1、A1U0C2G1、A0U1C2G1、A0U1C2G1、A1U1C0G1、に相当する組成の一部乃至大部分が5SリボソームRNA遺伝子領域に含まれることを見出し、出芽酵母（ftp://ftp.ncbi.nih.gov/genomes/Saccharomyces_cerevisiaeよりダウンロード可能）をゲノム配列とし、上記RNA断片を対象RNA断片としてそのゲノム中での位置を同定し、出芽酵母に6ヶ所存在する5SリボソームRNA遺伝子の帰属に成功した。その結果を図７（ａ）乃至（ｃ）、に示す。
【図面の簡単な説明】
【００６６】
【図１】本発明ゲノム配列の上で対象RNA断片を同定する手段順を示すフローチャート。
【図２】ゲノム断片分子量、ゲノム断片組成、ゲノム断片数およびゲノム断片位置をデータベースに格納することを示す模式図。
【図３】対象RNA断片の生成および対象RNA断片番号順で対象RNA断片分子量を格納することを示す模式図。
【図４】ゲノム断片間の分子量の差がペプチド断片間の分子量の差と異なることを示すグラフ。
【図５】ゲノム配列の上設けたフレームでフレーム内のゲノム配列組成を走査する模式図。
【図６ａ】実施例１における対象RNA断片が大腸菌ゲノム配列の上に存在するスコアを順に並べた表。
【図６ｂ】実施例１における対象RNA断片が大腸菌ゲノム配列の上に存在するスコアを順に並べた表。
【図６ｃ】実施例１における対象RNA断片が大腸菌ゲノム配列の上に存在するスコアを順に並べた表。
【図７ａ】実施例２における対象RNA断片が酵母ゲノム配列の上に存在するスコアを順に並べた表。
【図７ｂ】実施例２における対象RNA断片が酵母ゲノム配列の上に存在するスコアを順に並べた表。
【図７ｃ】実施例２における対象RNA断片が酵母ゲノム配列の上に存在するスコアを順に並べた表。

【特許請求の範囲】
【請求項１】
任意の生物種の任意のゲノム配列、および、当該配列を切断することができるDNA分解酵素またはRNA分解酵素もしくはその両方の切断メカニズムに関するデータを格納する記憶手段（１０）、前記分解酵素と同様な分解酵素で切断されることができる少なくとも１つの対象RNA断片を測定して得たその対象RNA断片分子量を読み込む入力手段（２０）と、読み込まれた少なくとも１つの対象RNA断片分子量を記憶手段（１０）にある配列および切断メカニズムに関するデータと照合させ、当該対象RNA断片が記憶手段（１０）の配列の上に存在する候補領域を算出する算出手段（３０）と、からなる当該少なくとも１つの対象RNA断片を含む任意のRNA分子を任意のゲノム配列上に標記し同定するRNA分子検索装置。
【請求項２】
前記記憶手段（１０）が、ゲノム配列を切断することができるDNA分解酵素またはRNA分解酵素もしくはその両方の切断メカニズムにしたがって当該任意の生物種の任意のゲノム配列を仮想的に切断し、ゲノム断片分子量、ゲノム断片組成、ゲノム断片数およびゲノム断片位置からなる１組のデータの中少なくとも２つのデータを格納する記憶手段（１１）をさらに含むことを特徴とする請求項１に記載のRNA分子検索装置。
【請求項３】
前記入力手段（２０）が、前記分解酵素と同様な分解酵素で実際に切断して得られた少なくとも１つの対象RNA断片を測定して得たその対象RNA断片分子量を読み込む入力手段（２１）をさらに含むであることを特徴とする請求項１乃至請求項２に記載のRNA分子検索装置。
【請求項４】
前記入力手段（２０）が、入力手段（２１）で読込まれた少なくとも１つの対象RNA断片分子量に対する誤差を修正する修正手段（２２）をさらに含むことを特徴とする請求項３に記載のRNA分子検索装置。
【請求項５】
前記算出手段（３０）が、読み込まれた少なくとも１つの対象RNA断片分子量を記憶手段（１０）または記憶手段（１１）もしくはその両方のデータと照合させた後、さらに、少なくとも１つの対象RNA断片組成を抽出する抽出手段（３１）を含むことを特徴とする請求項1乃至請求項４に記載のRNA分子検索装置。
【請求項６】
前記算出手段（３０）が、得られた対象RNA断片組成をさらに記憶手段（１０）または記憶手段（１１）もしくはその両方のデータと照合させ後、さらに、少なくとも１つの対象RNA断片数を抽出する抽出手段（３２）を含む請求項５に記載のRNA分子検索装置。
【請求項７】
前記算出手段（３０）が、得られた対象RNA断片組成をさらに記憶手段（１０）または記憶手段（１１）もしくはその両方のデータと照合させ後、さらに、少なくとも一箇所の対象RNA断片位置を抽出する抽出手段（３３）を含む請求項６に記載のRNA分子検索装置。
【請求項８】
前記算出手段（３０）が、得られた少なくとも一箇所の対象RNA断片位置からゲノム配列上の所定方向に所定の塩基長で設けられるフレーム内のゲノム配列組成を走査させる走査手段（３４）をさらに含む請求項７に記載のRNA分子検索装置。
【請求項９】
前記走査手段（３４）が、対象RNAの塩基長をフレームの所定の塩基長として設けることを特徴とする請求項８に記載のRNA分子検索装置。
【請求項１０】
前記算出手段（３０）が、得られたフレーム内の組成と一致する少なくとも１つの対照RNA断片組成の数（対象RNA断片数）をもとに、フレーム内のその対象RNA断片の出現確率を算出する算出手段（３５）をさらに含む請求項８または請求項９に記載のRNA分子検索装置。
【請求項１１】
前記算出手段（３５）が、出現頻度比率法によってフレーム内のその対象RNA断片の出現確率を算出することを特徴とする請求項１０に記載のRNA分子検索装置。
【請求項１２】
前記算出手段（３５）が、二項分布法によってフレーム内のその対象RNA断片の出現確率を算出することを特徴とする請求項１０に記載のRNA分子検索装置。
【請求項１３】
前記算出手段（３５）が、フレーム内の前記対象RNA断片の出現確率をもとにスコアを算出する算出手段（３６）をさらに含む請求項１０乃至請求項１２に記載のRNA分子検索装置。
【請求項１４】
前記任意の生物種の任意のゲノム配列がヒトの任意ゲノム配列であることを特徴とする請求項１乃至１３に記載のRNA分子検索装置。
【請求項１５】
前記対象RNA断片がDNA断片であることを特徴とする請求項１乃至１４に記載のDNA分子検索装置。
【請求項１６】
任意の生物種の任意のゲノム配列、および、当該配列を切断することができるDNA分解酵素またはRNA分解酵素もしくはその両方の切断メカニズムに関するデータを格納する記憶ステップ（１０）、前記分解酵素と同様な分解酵素で切断されることができる少なくとも１つの対象RNA断片を測定して得たその対象RNA断片分子量を読み込む入力ステップ（２０）と、読み込まれた少なくとも１つの対象RNA断片分子量を記憶ステップ（１０）にある配列および切断メカニズムに関するデータと照合させ、当該対象RNA断片が記憶ステップ（１０）の配列の上に存在する候補領域を算出する算出ステップ（３０）と、からなる当該少なくとも１つの対象RNA断片を含む任意のRNA分子を任意のゲノム配列上に標記し同定するRNA分子検索方法。
【請求項１７】
前記記憶ステップ（１０）が、ゲノム配列を切断することができるDNA分解酵素またはRNA分解酵素もしくはその両方の切断メカニズムにしたがって当該任意の生物種の任意のゲノム配列を仮想的に切断し、ゲノム断片分子量、ゲノム断片組成、ゲノム断片数およびゲノム断片位置からなる１組のデータの中少なくとも２つのデータを格納する記憶ステップ（１１）をさらに含むことを特徴とする請求項１６に記載のRNA分子検索方法。
【請求項１８】
前記入力ステップ（２０）が、前記分解酵素と同様な分解酵素で実際に切断して得られた少なくとも１つの対象RNA断片を測定して得たその対象RNA断片分子量を読み込む入力ステップ（２１）をさらに含むであることを特徴とする請求項１６乃至請求項１７に記載のRNA分子検索方法。
【請求項１９】
前記入力ステップ（２０）が、入力ステップ（２１）で読込まれた少なくとも１つの対象RNA断片分子量に対する誤差を修正する修正ステップ（２２）をさらに含むことを特徴とする請求項１８に記載のRNA分子検索方法。
【請求項２０】
前記算出ステップ（３０）が、読み込まれた少なくとも１つの対象RNA断片分子量を記憶ステップ（１０）または記憶ステップ（１１）もしくはその両方のデータと照合させた後、さらに、少なくとも１つの対象RNA断片組成を抽出する抽出ステップ（３１）を含むことを特徴とする請求項1６乃至請求項１９に記載のRNA分子検索方法。
【請求項２１】
前記算出ステップ（３０）が、得られた対象RNA断片組成をさらに記憶ステップ（１０）または記憶ステップ（１１）もしくはその両方のデータと照合させ後、さらに、少なくとも１つの対象RNA断片数を抽出する抽出ステップ（３２）を含む請求項２０に記載のRNA分子検索方法。
【請求項２２】
前記算出ステップ（３０）が、得られた対象RNA断片組成をさらに記憶ステップ（１０）または記憶ステップ（１１）もしくはその両方のデータと照合させ後、さらに、少なくとも一箇所の対象RNA断片位置を抽出する抽出ステップ（３３）を含む請求項２１に記載のRNA分子検索方法。
【請求項２３】
前記算出ステップ（３０）が、得られた少なくとも一箇所の対象RNA断片位置からゲノム配列上の所定方向に所定の塩基長で設けられるフレーム内のゲノム配列組成を走査させる走査ステップ（３４）をさらに含む請求項２２に記載のRNA分子検索方法。
【請求項２４】
前記走査ステップ（３４）が、対象RNAの塩基長をフレームの所定の塩基長として設けることを特徴とする請求項２３に記載のRNA分子検索方法。
【請求項２５】
前記算出ステップ（３０）が、得られたフレーム内の組成と一致する少なくとも１つの対照RNA断片組成の数（対象RNA断片数）をもとに、フレーム内のその対象RNA断片の出現確率を算出する算出ステップ（３５）をさらに含む請求項２３または請求項２４に記載のRNA分子検索方法。
【請求項２６】
前記算出ステップ（３５）が、出現頻度比率法によってフレーム内のその対象RNA断片の出現確率を算出することを特徴とする請求項２５に記載のRNA分子検索方法。
【請求項２７】
前記算出ステップ（３５）が、二項分布法によってフレーム内のその対象RNA断片の出現確率を算出することを特徴とする請求項２５に記載のRNA分子検索方法。
【請求項２８】
前記算出ステップ（３５）が、フレーム内の前記対象RNA断片の出現確率をもとにスコアを算出する算出ステップ（３６）をさらに含む請求項２５乃至請求項２７に記載のRNA分子検索方法。
【請求項２９】
前記任意の生物種の任意のゲノム配列がヒトの任意ゲノム配列であることを特徴とする請求項１６乃至２８に記載のRNA分子検索方法。
【請求項３０】
前記対象RNA断片がDNA断片であることを特徴とする請求項１６乃至２９に記載のDNA分子検索方法。
【請求項３１】
コンピュータに、任意の生物種の任意のゲノム配列、および、当該配列を切断することができるDNA分解酵素またはRNA分解酵素もしくはその両方の切断メカニズムに関するデータを格納する記憶機能（１０）、前記分解酵素と同様な分解酵素で切断されることができる少なくとも１つの対象RNA断片を測定して得たその対象RNA断片分子量を読み込む入力機能（２０）と、読み込まれた少なくとも１つの対象RNA断片分子量を記憶機能（１０）にある配列および切断メカニズムに関するデータと照合させ、当該対象RNA断片が記憶機能（１０）の配列の上に存在する候補領域を算出する算出機能（３０）と、を実現させる、当該少なくとも１つの対象RNA断片を含む任意のRNA分子を任意のゲノム配列上に標記し同定するRNA分子検索プログラム。
【請求項３２】
前記記憶機能（１０）が、ゲノム配列を切断することができるDNA分解酵素またはRNA分解酵素もしくはその両方の切断メカニズムにしたがって当該任意の生物種の任意のゲノム配列を仮想的に切断し、ゲノム断片分子量、ゲノム断片組成、ゲノム断片数およびゲノム断片位置からなる１組のデータの中少なくとも２つのデータを格納する記憶機能（１１）をさらに含むことを特徴とする請求項３１に記載のRNA分子検索装置。
【請求項３３】
前記入力機能（２０）が、前記分解酵素と同様な分解酵素で実際に切断して得られた少なくとも１つの対象RNA断片を測定して得たその対象RNA断片分子量を読み込む入力機能（２１）をさらに含むであることを特徴とする請求項３１乃至請求項３２に記載のRNA分子検索プログラム。
【請求項３４】
前記入力機能（２０）が、入力機能（２１）で読込まれた少なくとも１つの対象RNA断片分子量に対する誤差を修正する修正機能（２２）をさらに含むことを特徴とする請求項３３に記載のRNA分子検索プログラム。
【請求項３５】
前記算出機能（３０）が、読み込まれた少なくとも１つの対象RNA断片分子量を記憶機能（１０）または記憶機能（１１）もしくはその両方のデータと照合させた後、さらに、少なくとも１つの対象RNA断片組成を抽出する抽出機能（３１）を含むことを特徴とする請求項３１乃至請求項３４に記載のRNA分子検索プログラム。
【請求項３６】
前記算出機能（３０）が、得られた対象RNA断片組成をさらに記憶機能（１０）または記憶機能（１１）もしくはその両方のデータと照合させ後、さらに、少なくとも１つの対象RNA断片数を抽出する抽出機能（３２）を含む請求項３５に記載のRNA分子検索プログラム。
【請求項３７】
前記算出機能（３０）が、得られた対象RNA断片組成をさらに記憶機能（１０）または記憶機能（１１）もしくはその両方のデータと照合させ後、さらに、少なくとも一箇所の対象RNA断片位置を抽出する抽出機能（３３）を含む請求項３６に記載のRNA分子検索プログラム。
【請求項３８】
前記算出機能（３０）が、得られた少なくとも一箇所の対象RNA断片位置からゲノム配列上の所定方向に所定の塩基長で設けられるフレーム内のゲノム配列組成を走査させる走査機能（３４）をさらに含む請求項３７に記載のRNA分子検索プログラム。
【請求項３９】
前記走査機能（３４）が、対象RNAの塩基長をフレームの所定の塩基長として設けることを特徴とする請求項３８に記載のRNA分子検索プログラム。
【請求項４０】
前記算出機能（３０）が、得られたフレーム内の組成と一致する少なくとも１つの対照RNA断片組成の数（対象RNA断片数）をもとに、フレーム内のその対象RNA断片の出現確率を算出する算出機能（３５）をさらに含む請求項３８または請求項３９に記載のRNA分子検索プログラム。
【請求項４１】
前記算出機能（３５）が、出現頻度比率法によってフレーム内のその対象RNA断片の出現確率を算出することを特徴とする請求項４０に記載のRNA分子検索プログラム。
【請求項４２】
前記算出機能（３５）が、二項分布法によってフレーム内のその対象RNA断片の出現確率を算出することを特徴とする請求項４０に記載のRNA分子検索プログラム。
【請求項４３】
前記算出機能（３５）が、フレーム内の前記対象RNA断片の出現確率をもとにスコアを算出する算出機能（３６）をさらに含む請求項４０乃至請求項４２に記載のRNA分子検索プログラム。
【請求項４４】
前記任意の生物種の任意のゲノム配列がヒトの任意ゲノム配列であることを特徴とする請求項３１乃至４３に記載のRNA分子検索プログラム。
【請求項４５】
前記対象RNA断片がDNA断片であることを特徴とする請求項３１乃至４４に記載のDNA分子検索プログラム。
【請求項４６】
請求項３１から請求項４５のいずれかに記載のプログラムを記載した媒体。

【図１】

【図２】

【図３】

【図４】

【図５】

【図６ａ】

【図６ｂ】

【図６ｃ】

【図７ａ】

【図７ｂ】

【図７ｃ】

【公開番号】特開２００８−２１２６０（Ｐ２００８−２１２６０Ａ）
【公開日】平成２０年１月３１日（２００８．１．３１）
【国際特許分類】

【出願番号】特願２００６−１９４７８０（Ｐ２００６−１９４７８０）
【出願日】平成１８年７月１４日（２００６．７．１４）
【国等の委託研究の成果に係る記載事項】（出願人による申告）平成１７年度、経済産業省、戦略的技術開発委託費（機能性ＲＮＡプロジェクトに係るもの）に関する委託研究、産業再生法第３０条の適用を受ける特許出願　　　　　　　　　　　　　平成１８年度、国等の委託研究の成果に係る特許出願（平成１８年度独立行政法人新エネルギー・産業技術総合開発機構　機能性ＲＮＡプロジェクト委託研究、産業活力再生特別措置法第３０条の適用を受ける特許出願）
【出願人】（５０４１３７９１２）国立大学法人　東京大学 (1,942)
【Ｆターム（参考）】

[ Back to top ]

質量分析によるゲノム上でＲＮＡ配列を同定するシステム

メニュー

スポンサーリンク

次の公報 »

« 前の公報

質量分析によるゲノム上でＲＮＡ配列を同定するシステム

メニュー

スポンサー リンク

次の公報 »

« 前の公報

スポンサーリンク