微生物菌種推定システム及び方法
【課題】 高い精度で簡便に菌種推定を行うことができるシステムを提供する。
【解決手段】 被検菌由来の塩基配列と既知微生物由来の塩基配列との間に見られる相同性から、該被検菌の菌種を推定する菌種推定システムにおいて、既知微生物の保存性の高い遺伝子について、少なくともその塩基配列及び由来生物種名を含む配列データを記載した配列データベースと、被検菌の保存性の高い遺伝子の塩基配列と、上記配列データベースに記載された塩基配列とを比較し、該配列データベースの中から被検菌の塩基配列と相同性の高い配列データを検索する相同性検索手段とを設ける。
【解決手段】 被検菌由来の塩基配列と既知微生物由来の塩基配列との間に見られる相同性から、該被検菌の菌種を推定する菌種推定システムにおいて、既知微生物の保存性の高い遺伝子について、少なくともその塩基配列及び由来生物種名を含む配列データを記載した配列データベースと、被検菌の保存性の高い遺伝子の塩基配列と、上記配列データベースに記載された塩基配列とを比較し、該配列データベースの中から被検菌の塩基配列と相同性の高い配列データを検索する相同性検索手段とを設ける。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、塩基配列に基づく相同性比較や系統解析によって微生物の菌種を推定するシステム、及び該システムを用いた菌種推定方法に関する。
【背景技術】
【0002】
近年、未知の微生物(細菌及び真菌類)の菌種を推定する方法として、被検菌のリボソーマルRNA(rRNA)遺伝子やその周辺領域(本発明では、これらを総称してrRNA遺伝子関連領域、又はリボソーマルRNA遺伝子関連領域と呼ぶ)の配列を決定してGenbankやEMBL、DDBJ等の公共データベースを用いた相同性検索を行い、被検菌のものと相同性の高かった配列が由来する菌種を該被検菌と同一種又は近縁種と判定すると共に、該相同性検索の結果に基づいて被検菌種及びその近縁種の塩基配列に基づく系統樹を作成することで該被検菌の系統学的な位置を推定するといった手法が広く用いられるようになっている(非特許文献1)。
【0003】
上記rRNA遺伝子関連領域は全生物に高い保存性で存在しているが、それらの中でも微生物の菌種推定に利用される領域は、どの程度詳細なレベルでの推定を行うかによって異なっている。一般に、カビなどの真核生物の場合、18SrRNAは、綱・目レベル、D2rRNA(28SrRNA遺伝子中の配列)やITS(Internal Transcribed Spacer)領域(18Sと26(28)SrRNAの間の配列)は、その下の属・種レベルの分類に有効とされており、予め解析するレベルを決定した上で、適当なrRNA領域のシーケンスを行い、該領域の塩基配列に基づいた相同性検索や系統解析が行われる。
【0004】
また、上記のような、rRNA遺伝子関連領域の配列決定や相同性検索による、細菌や真菌類の菌種推定、及び系統解析を行うためのキットやシステムも市販されている。
【0005】
【非特許文献1】篠田吉史、加藤暢夫、森田直樹、「16SrRNA遺伝子解析による細菌の系統分類法」、島津評論、vol.57, No.1-2, pp.121-132,(2000)
【発明の開示】
【発明が解決しようとする課題】
【0006】
上記のような公共のデータベースを用いた相同性検索によって微生物の同定を行う場合、該公共データベースには膨大な数の配列データが登録されており、中には解析精度の低いデータや該配列の由来する生物種が十分に同定されていないものもある。また、微生物以外の配列データを含む膨大なデータに対しても相同性検索が行われるため、必ずしも、精度の高い検索結果が得られない場合があった。
【0007】
そのため、相同性検索の結果得られた各配列データについて、一つ一つデータベースに登録されたデータの信憑性を確認した上で、微生物の分類表などを基に近縁の微生物のデータを収集して系統樹の作成を行う必要があり、非常に手間が掛かっていた。また、しばしば既存の分類体系と矛盾した系統樹が作成され、菌種の判断が困難となることがあった。
【0008】
更に、真核生物の菌種推定を行う場合には、予め形態学的特徴などの他の因子を基に綱・目などを絞り込んでおき、相同性検索の結果などから系統樹を作成して菌種の判断を行うため、手間が掛かる上に作業者による差が大きくなるという問題があった。
【0009】
また、上記のような現在市販されている微生物菌種推定システムでは、解析対象とする配列データが短く、十分な解析精度を得られない場合があった。
【0010】
更に、ITS領域やD2rRNAによる相同性比較のみでは、全ての菌種を特定できるレベルでなく、対象となる配列が短いために精度の点で問題があるため、しばしば系統的に矛盾のある系統樹が作成されるという問題がある。また、18SrRNA、D2rRNA、ITS領域についてそれぞれ配列解析を行い、既存のデータベースを用いて相同性検索を行った場合、各領域と相同性の高い配列として、それぞれ異なる菌種に由来する配列データが得られることが多く、菌種推定の判断が困難となっていた。
【0011】
そこで、本発明が解決しようとする課題は、高精度な菌種推定を簡便に行うことができる菌種推定システム、及び菌種推定方法を提供することである。
【課題を解決するための手段】
【0012】
上記課題を解決するために成された本発明に係る微生物の菌種推定システムは、被検菌由来の塩基配列と既知微生物由来の塩基配列との間に見られる相同性から、該被検菌の菌種を推定する菌種推定システムであって、
a)既知微生物の保存性の高い遺伝子について、少なくともその塩基配列及び由来生物種名を含む配列データを記載した配列データベースと、
b)被検菌の保存性の高い遺伝子の塩基配列と、上記配列データベースに記載された塩基配列とを比較し、該配列データベースの中から被検菌の塩基配列と相同性の高い配列データを検索する相同性検索手段と、
を備えることを特徴とする。
【0013】
なお、上記保存性の高い遺伝子としては、上述のような16S,18S,5S, 5.8S,23S,25S, 26S,28SリボソーマルRNA遺伝子、ゲノム上のリボソーマルRNA遺伝子の間に存在するスペーサ領域(ITS領域又はIGS領域)等のリボソーマルRNA遺伝子関連領域、及びミトコンドリアDNA、gryB遺伝子、キチン合成酵素(CHS)遺伝子、チトクロームb遺伝子、recA遺伝子、elongation factor 1A遺伝子、 tubulin遺伝子、rpoB遺伝子、pks遺伝子、actin遺伝子、fus遺伝子の中から選ばれる1又は2種類以上の遺伝子を用いることが望ましい。
【0014】
また、本発明の微生物菌種推定システムは、更に、
c)既知微生物の種名及びその分類情報を記載した分類データベース、
を備え、上記配列データベースに記載された配列データと、該分類データベースに記載された分類情報とが互いに関連づけられているものとすることが望ましい。
【0015】
また、本発明の微生物菌種推定システムは、更に、
d)上記分類データベースに記載された分類情報の中から任意の分類群を指定する分類群指定手段と、
e)該分類群指定手段で指定された分類群に属する菌種由来の配列データを上記配列データベースから抽出してサブデータベースを作成するサブデータベース作成手段と、
f)該サブデータベースを対象に、被検菌由来の保存性の高い遺伝子の塩基配列との相同性検索を行うサブデータベース検索手段と、
を備えるものとすることが望ましい。
【0016】
ここで、上記分類群指定手段は、上記相同性検索手段における検索によって被検菌と相同性が高いとされた分類群が自動的に指定されるものであってもよく、上記相同性検索手段による相同性検索の結果等を参考に、操作者が所定の入力手段を用いて適当な分類群を指定するものとしてもよい。これにより、例えば、上記相同性検索手段による相同性検索結果を基にサブデータベースを作成し、該サブデータベースを対象として再び相同性検索を行って菌種の絞り込みを行うことにより、精度の高い菌種推定を行うことが可能となる。
【0017】
上記のようなサブデータベース検索手段等を備えた菌種推定システムの場合、上記相同性検索手段においては、被検菌の保存性の高い遺伝子の塩基配列として、18SリボソーマルRNA遺伝子の塩基配列を使用し、上記サブデータベース検索手段においては、被検菌由来の保存性の高い遺伝子の塩基配列としてITS領域又はIGS(InterGenic Spacer)領域の塩基配列を使用することがより望ましい。
【0018】
これにより、18SリボソーマルRNA遺伝子を用いた相同性検索の結果に基づいてサブデータベースを作成し、これに対して18SリボソーマルRNA遺伝子よりも多様性の頻度が比較的高いITS領域やIGS領域の塩基配列を用いた相同性検索を行うことで菌種を絞り込むことができ、より詳細な菌種推定が可能となる。
【0019】
また更に、本発明の微生物菌種推定システムは、上記サブデータベースに記載された塩基配列に基づいて系統樹を作成する系統樹作成手段を備えたものとしてもよく、この場合、該系統樹作成手段が、被検菌由来の塩基配列を含む系統樹と被検菌由来の塩基配列を含まない系統樹とを作成できるものとすることがより望ましい。
【0020】
上記のような菌種推定システムを用いた本発明の菌種推定方法は、被検菌由来の塩基配列と既知微生物由来の塩基配列との間に見られる相同性から、該被検菌の菌種を推定する菌種推定方法であって、
a)既知微生物の保存性の高い遺伝子の塩基配列を記載した配列データベースに対して、被検菌の保存性の高い遺伝子の塩基配列を用いた相同性検索を行って、該被検菌の属する大まかな分類群を推定するステップと、
b)既知微生物の種名及びその分類情報を記載した分類データベースの中から上記相同性検索によって推定された分類群を指定して、該分類群に関する配列データを前記配列データベースから抽出した検索用サブデータベースを作成するステップと、
c)同一被検菌に由来する上記とは異なる保存性の高い遺伝子の塩基配列を用いて、前記検索用サブデータベースを対象とした相同性検索を行って菌種の絞り込みを行うステップと、
を有することを特徴とする。
【0021】
上記のような本発明の菌種推定方法においては、被検菌として真核生物を使用し、該被検菌の18SリボソーマルRNA遺伝子の塩基配列を用いて上記配列データベースに対する相同性検索を行い、該被検菌のITS領域又はIGS領域の塩基配列を用いて上記検索用サブデータベースに対する相同性検索を行うことが望ましい。
【0022】
また、本発明の菌種推定方法は、更に、
d)上記検索用サブデータベースを対象とした相同性検索の結果に基づき、上記分類データベースの中から適当な分類群を指定して、該分類群に関する配列データを上記配列データベースから抽出した系統樹作成用サブデータベースを作成するステップと、
e)前記系統樹作成用サブデータベースに記載された塩基配列を用いて被検菌の塩基配列を含む系統樹と被検菌の塩基配列を含まない系統樹を作成し、両者の間に矛盾がないかどうかを確認するステップ、
を有するものとすることが望ましい。
【発明の効果】
【0023】
本発明の菌種推定システムによれば、微生物の保存性の高い遺伝子の配列データを記載したデータベースと各微生物の分類上の関係について記載したデータベースを利用して相同性検索を行うことで、より精度の高い菌種推定が行えるようになると共に、分類表などの必要なデータを収集する手間を省くことができ、より簡便に被検菌の系統的な位置を解析することができるようになる。また、従来の市販の菌種推定システムよりも長い配列を用いて解析を行うことができるため、相同性検索の精度を向上することができる。
【発明を実施するための最良の形態】
【0024】
以下、実施例を用いて本発明の微生物菌種推定システム及び該システムを用いた菌種推定方法について説明する。
【0025】
[実施例1]
本実施例の微生物菌種推定システムの概略構成を図2に示す。本実施例の微生物菌種推定システムは、配列データベース11a及び分類データベース11dを記憶した記憶部11と、相同性検索や系統樹作成等を実行する制御部12から成り、該制御部12にはキーボードやマウスなどの入力部13と、モニタなどの出力部14が接続されている。
【0026】
上記配列データベース11aは、微生物由来の16S,18S,5S, 5.8S,23S,25S, 26S,28SリボソーマルRNA遺伝子、ゲノム上のリボソーマルRNA遺伝子の間に存在するスペーサ領域(ITS領域及びIGS領域)等のリボソーマルRNA遺伝子関連領域の塩基配列、及び該配列に関連する情報(該配列が由来する菌種名や、該配列の生物学的特徴、遺伝子の機能など)を含む配列データを記載したものであり、細菌由来の配列データを記載した細菌データベース11bと、真菌由来の配列データを記載した真菌データベース11cから成る。
【0027】
このような配列データベース11aは、例えば、上述のような公共データベースから、細菌及び真菌に由来するリボソーマルRNA遺伝子関連領域に関する情報を抽出することによって作成することができる。なお、本発明の配列データベース11aを作成する際には、塩基配列の解読精度の低いデータや、配列の由来する生物種が十分に特定できないものを除外し、有効性の高いデータのみでデータベースを構成するようにする。
【0028】
また、上記分類データベース11dは、配列データベース11aに記載されている各配列データが由来する菌種名と、各菌種の分類情報が記載されたものであり、例えば、上記配列データベース11aと同様に、公共のデータベース(例えば、Unified Taxonomy Database)から、細菌及び真菌に関する情報を抽出することなどによって作成することができる。上記配列データベース11aに記載された配列データと該分類データベース11dに記載された分類情報とは互いに関連づけられており、配列データベース11aにおいて特定の配列データを選択することで該配列が由来する菌種の分類情報を分類データベース11dから読み出すことができると共に、分類データベース11dに記載された微生物の分類情報の中から特定の分類群を選択することで、該分類群に属する菌種のリボソーマルRNA遺伝子関連領域の配列データを配列データベース11aから抽出することができる。
【0029】
上記制御部12は、相同性検索部12a、分類群指定部12b、サブデータベース作成部12c、系統樹作成部12dを備えている。相同性検索部12aは上記配列データベース11a又は後述のサブデータベース11eに記載された塩基配列と被検菌由来の塩基配列とを比較することで、該被検菌の配列と相同性の高い配列を検索するためのものであり、例えば、BLASTやFASTAなどの既存の解析プログラムや、これらを改良したプログラム、あるいはこれらのアルゴリズムに相当するアルゴリズムを用いたプログラムなどを利用することができる。
【0030】
分類群指定部12bは上記分類データベース11dに記載された分類情報の中から任意の分類群を指定するものであり、上記相同性検索部12aによる相同性検索の結果、被検菌と相同性が高かった配列、例えば相同性スコアが250以上、もしくは連続してマッチした配列が100塩基対以上でかつ同一性(Identity)が90%以上程度の相同性、より望ましくは相同性スコアが300以上、もしくは連続してマッチした配列が150塩基対以上でかつIdentityが95%以上程度の相同性を有する配列、が由来する菌種の属する分類群、あるいは、操作者が入力部13を用いて指定した分類群を、後述のサブデータベース作成の対象として指定するものである。サブデータベース作成部12cは、上記分類群指定部12bで指定された分類群に属する菌種由来の配列データを上記配列データベース11aから抽出して検索用サブデータベース11e、又は系統樹用サブデータベース11fを作成するものである。
【0031】
系統樹作成部12dは、上記系統樹用サブデータベース11fに記載された複数の配列データを用いてマルチプルアライメント(多重整列)処理を行い、その結果に基づいて系統樹を作成するものであり、例えばCLUSTAL Wなどの既存の解析プログラムや、これらを改良したプログラム、あるいはこれらのアルゴリズムに相当するアルゴリズムを用いたプログラムなどを利用することができる。なお、該系統樹作成部12dは、被検菌を含む系統樹と含まない系統樹とを作成するものとし、両者の枝の長さから解析結果に矛盾がないかどうかを確かめることができるようにする。
【0032】
続いて、本実施例の菌種推定システムを用いた菌種推定の方法について説明する。図1は、本実施例の菌種推定方法の手順を示すフローチャートである。ここでは一例として、真菌を対象とし、18SrRNA遺伝子の塩基配列とスペーサ領域(ITS又はIGS)の塩基配列を用いて菌種推定を行う方法について説明する。図15に示すように、ITS領域やIGS領域はゲノム上のrRNA遺伝子間に存在しており、配列相同性の高い18SrRNAなどのrRNA遺伝子に比べて多様性の頻度が高いといわれている。従って、このようなITS領域やIGS領域を利用することにより、変種間や株レベルでの推定等の詳細な菌種推定を行うことが可能となる。
【0033】
まず、予め菌種を特定したい微生物(被検菌)の18SrRNA遺伝子及びITS領域のシーケンスを行い、これらの領域の塩基配列を取得しておく。このとき、できるだけ広い範囲の配列決定を行うことが望ましく、18SrRNAは1800塩基程度、ITS領域は250-800塩基程度とすることが望ましい。
【0034】
操作者によって本実施例の菌種推定システムが起動されると、図3のような相同性検索設定画面30が表示される。問い合わせ名入力欄31及び、問い合わせ配列入力欄32にはそれぞれ適当な名称と、上記によって取得された被検菌の18SrRNA配列を入力する。データベース選択欄33は、相同性検索を行うデータベースとして、上記細菌データベース11b又は真菌データベース11cのいずれかを選択するものであり、ここでは真菌データベース11cを選択する。検索パラメータ設定欄34は、Expect(期待値),WordSize(文字列の長さ),Number of hits(表示するデータの数)等の、相同性検索に関するパラメータを設定するものである。問い合わせ配列の入力及び検索パラメータの設定(S1)が完了したら操作者がOKボタン35をクリックすることにより、配列データベース11a(ここではそのうちの真菌データベース11c)に対する相同性検索が実行される(S2)。
【0035】
相同性検索が完了すると、図4のようなサブデータベース選択画面40が表示される。該サブデータベース選択画面40は、検索結果を表示する検索結果欄42と、該相同性検索の結果を基に、次に検索を行うサブデータベースの選択を行うためのサブデータベース選択欄41から成る。検索結果欄42は問い合わせ配列と相同性の高かった配列をリスト表示するリスト表示欄43と、問い合わせ配列と上記リスト表示された配列とのアライメントを表示するアライメント表示欄44から成る。リスト表示欄43には、各配列データのアクセッションナンバー(登録番号)、Definition(配列の名称やその他の情報)、相同性の高さを示すスコア、及び検索の統計的な有意性を示すE-Valueが表示される。
【0036】
サブデータベース選択欄41は「科」選択欄41a、「属」選択欄41b、及び選択済みデータ表示欄41cから成る。「科」選択欄41aは、分類データベース11dに記載されている微生物(ここでは真菌)の科名の一覧から、後述の「属」選択欄41bに表示させるものを選択するものであり、デフォルトでは上記相同性検索の結果で最も相同性スコアの高かった配列データの由来菌種が属する科が指定されている。該「科」選択欄41aで適当な科名を選択すると、その科に含まれる属名の一覧が「属」選択欄41bに表示される。該「属」選択欄41bに表示された中から適当な属名をクリックして選択ボタン41dを押すと選択した属名が選択済みデータ表示欄41cに表示される。また選択済みデータ表示欄41cに表示されたデータ名をクリックして選択解除ボタン41eを押すことで該データを選択済みデータ表示欄41cから削除することもできる。このような属の選択(S3)が完了したら、OKボタン45を押すことによって、選択された属に含まれる菌種の配列データが配列データベース11a(ここでは真菌データベース11c)から抽出されて検索用サブデータベース11eが作成される(S4)。
【0037】
続いて、図5のようなサブデータベース検索設定画面50が表示されるので、上記被検菌のITS領域の配列データを問い合わせ配列として入力し、検索パラメータの設定を行う(S5)。OKボタン54をクリックすると上記で作成された検索用サブデータベース11eに対して相同性検索が実行される(S6)。
【0038】
このように、本実施例に係る菌種推定方法では、始めに18SrRNA遺伝子の塩基配列を用いて大まかな菌種の推定を行い、その結果を基に作成した検索用サブデータベースに対して、更に、ITS領域の塩基配列を用いた相同性検索を行うことで菌種の絞り込みを行う。なお、菌種の絞り込みには上記ITS領域のほか、IGS領域の塩基配列を使用してもよい。
【0039】
検索用サブデータベース11eに対する相同性検索が完了すると、図6のようなマルチプルアライメント設定画面60が表示される。該マルチプルアライメント設定画面60は、上記サブデータベース設定画面40と同様に、相同性検索の結果を示す検索結果表示欄62、及びサブデータベース選択欄61から成る。ここで、サブデータベース設定欄61は、マルチプルアライメントに使用するデータを選択するためのものであり、検索結果表示欄62に表示された相同性検索の結果に基づいて、適当な属を選択する(S7)ことにより、その属に含まれるデータをマルチプルアライメントに使用することができる。また、リスト表示欄63の各配列の前に設けられたチェックボックス63aをチェックすることで、相同性検索でヒットした配列をマルチプルアライメントの対象に加えることもできる。設定ボタン65を押すとマルチプルアライメントに使用するデータを選別する際の閾値を設定するためのウィンド(図示略)が表示される。該ウィンドで被検菌配列との相同性スコア又は同一性(Identity)の閾値を設定し、チェックボックス67でマルチプルアライメントに問い合わせ配列(被検菌の配列)を使用するか否かを選択(S8)したうえで、OKボタン66を押せば、「属」選択欄61bで選択された属に含まれるデータ、及び上記リスト表示欄63で検索結果の中から選択されたデータが配列データベース11aから抽出されて系統樹用サブデータベース11fが作成され(S9)、その中から上記閾値以上のデータが選別されてマルチプルアライメント処理が実行される(S10)。このとき、「問い合わせ配列を使用する」のチェックボックス67がチェックされていた場合には、被検菌のデータを含んだマルチプルアライメントが実行され、チェックボックス67がチェックされていなかった場合には、被検菌のデータを含まないマルチプルアライメントが実行される。
【0040】
マルチプルアライメントが完了すると、図7のようなマルチプルアライメント結果表示画面70が表示され、保存ボタン71を押すことでマルチプルアライメントに使用した配列データのファイルとアライメント結果ファイルが作成されて保存される。また、入力部13で所定の操作を行うことにより、該マルチプルアライメントの結果に基づく系統樹を表示させることができ、問い合わせ配列を含む系統樹と含まない系統樹の2種類を作成しておくことで、両者を比較して系統的に矛盾がないことを確認することができる(S11)。
【0041】
[実施例2]
本発明の微生物菌種推定システムの有効性を示すため、菌種未知の微生物に対し18SrDNAとITS領域の塩基配列に基づく相同性検索、及び系統樹作成を行った。
【0042】
カビと考えられるサンプルよりDNAを定法により抽出し、18SrDNAとITS領域を増幅するためのPCRテンプレートとした。PCRは、プライマーとして図8に示すE21f、Ef4(18SrRNA)、ITS1、ITS4(ITS)を使用し、EX Taq(Takara)を用いて行った。アガロースゲル電気泳動により、それぞれ目的の産物を確認した後、それぞれのプライマーとFung5を用いてシーケンスを行った。シーケンス反応はBigDye Terminator Ver 3.1を使用して行い、ABI3730を用いて泳動した。
【0043】
まず、18SrDNAのPCR産物の3本のシーケンスのアライメントを行い、全長の配列を決定した(図9)。このような配列について、BLASTによる相同性検索を行い、図10のような検索結果を得た。検索結果上位のNeocosmospora vasinfectaについて、分類上の位置を確認すると、
Lineage (full): root; cellular organisms; Eukaryota; Fungi/Metazoa group; Fungi; Ascomycota; Pezizomycotina; Sordariomycetes; class" Hypocreomycetidae; Hypocreales; Nectriaceae; Nectria
となっており、ここでは、Nectriaよりも細かい分類については、推定することができなかった。
【0044】
次に、ITS1とITS4によって決定されたシーケンスデータ(図11)から、BLAST検索を行った(図12)。検索結果上位のFusarium solaniについて、分類上の位置を確認すると、
Lineage (full): root; cellular organisms; Eukaryota; Fungi/Metazoa group; Fungi; Ascomycota; Pezizomycotina; Sordariomycetes; Hypocreomycetidae; Hypocreales; Nectriaceae; Nectria; Nectria haematococca; mitosporic Nectria haematococca; Fusarium solani complex
となっており、これによって上記のNectriaよりも細かい分類群を知ることができた。
【0045】
上記18SrDNAとITS領域のシーケンスデータを用いた相同性検索の結果に基づき、それぞれ被検菌のデータを含む系統樹と、被検菌のデータを含まない系統樹の作成を行った(図13、14)。ITSシーケンスデータを用いたBLAST検索の上位に属する配列データを収集して系統樹作成を行った結果、Nectria haematococcaが最も近い菌種と推定された(図14a)。これはBLAST検索の結果とは異なるものであった。検体のシーケンスデータを含まずに系統解析を行い、検体を含んだものと比較すると、両者の間に相違が見られ(図14の矢印で示した箇所)、このことから、Fusarium solaniやNectria haemtococcaのそれぞれの菌種における系統的な関係は、完全に分離されているわけではなく、分子レベルでの分類がまだ整理できていないことが確認できた。
【0046】
18SrDNAの相同性検索の結果と、サブデータベースとITSシーケンスデータを利用した系統樹の結果から、本検体は、Fusarium solaniやNectria haematococcaに近縁であると推定された。従来であれば、Nectria属という大きな分類群か、ITSでのBLAST結果上位であるFusarium solaniを検体の属する菌種と推定していた。しかしながら、この指標を用いた解析では、Fusarium solaniやNectria haematococcaの2菌種のいずれかであると推定することになり、より詳細な結果を得ることができた。このことから、18SrDNAを用いて被検菌の大まかな分類を推定し、更にITS情報に基づいて結果の絞り込みを行う本発明の菌種推定方法の有用性が確かめられた。
【図面の簡単な説明】
【0047】
【図1】本発明の実施例である菌種推定システムによる微生物の菌種推定方法を示すフローチャート。
【図2】同実施例の菌種推定システムの概略構成を示すブロック図。
【図3】同実施例の菌種推定システムに係る 相同性検索設定画面を示す図。
【図4】同実施例の菌種推定システムに係る、サブデータベース選択画面を示す図。
【図5】同実施例の菌種推定システムに係る、サブデータベース検索設定画面を示す図。
【図6】同実施例の菌種推定システムに係る、マルチプルアライメント設定画面を示す図。
【図7】同実施例の菌種推定システムに係る、マルチプルアライメント結果表示画面を示す図。
【図8】被検菌の配列解析に使用したプライマーの配列を示す図。
【図9】被検菌の18SrRNA遺伝子の塩基配列を示す図。
【図10】上記18SrRNA遺伝子の塩基配列を使用した相同性検索の結果を示す図。
【図11】被検菌のITS領域の塩基配列を示す図。
【図12】上記ITS領域の塩基配列を使用した相同性検索の結果を示す図。
【図13】上記18SrRNA遺伝子を用いた相同性検索の結果に基づく系統樹を示す図、(a)被検菌由来の配列を含むもの、(b)被検菌由来の配列を含まないもの。
【図14】上記ITS領域を用いた相同性検索の結果に基づく系統樹を示す図、(a)被検菌由来の配列を含むもの、(b)被検菌由来の配列を含まないもの。
【図15】rRNA遺伝子とITS領域又はIGS領域との位置関係の例を示す模式図であり、(a)はArxula adeninivoransの18SrRNA、5.8SrRNA、25SrRNA、及びその間にあるITS1、ITS2を、(b)はTricholoma matsutakeの25SrRNA、5SrRNA、及びIGSを、(c)はEncephalitozoon cuniculiの5SrRNAとそれを挟む2つのIGS、及びguanylyltransferase遺伝子の一部を示す。
【符号の説明】
【0048】
11…記憶部
11a…配列データベース
11b…細菌データベース
11c…真菌データベース
11d…分類データベース
11e…検索用サブデータベース
11f…系統樹用サブデータベース
12…制御部
12a…相同性検索部
12b…分類群指定部
12c…サブデータベース作成部
12d…系統樹作成部
13…入力部
14…出力部
30…相同性検索設定画面
40…サブデータベース選択画面
50…サブデータベース検索設定画面
60…マルチプルアライメント設定画面
70…マルチプルアライメント結果表示画面
【技術分野】
【0001】
本発明は、塩基配列に基づく相同性比較や系統解析によって微生物の菌種を推定するシステム、及び該システムを用いた菌種推定方法に関する。
【背景技術】
【0002】
近年、未知の微生物(細菌及び真菌類)の菌種を推定する方法として、被検菌のリボソーマルRNA(rRNA)遺伝子やその周辺領域(本発明では、これらを総称してrRNA遺伝子関連領域、又はリボソーマルRNA遺伝子関連領域と呼ぶ)の配列を決定してGenbankやEMBL、DDBJ等の公共データベースを用いた相同性検索を行い、被検菌のものと相同性の高かった配列が由来する菌種を該被検菌と同一種又は近縁種と判定すると共に、該相同性検索の結果に基づいて被検菌種及びその近縁種の塩基配列に基づく系統樹を作成することで該被検菌の系統学的な位置を推定するといった手法が広く用いられるようになっている(非特許文献1)。
【0003】
上記rRNA遺伝子関連領域は全生物に高い保存性で存在しているが、それらの中でも微生物の菌種推定に利用される領域は、どの程度詳細なレベルでの推定を行うかによって異なっている。一般に、カビなどの真核生物の場合、18SrRNAは、綱・目レベル、D2rRNA(28SrRNA遺伝子中の配列)やITS(Internal Transcribed Spacer)領域(18Sと26(28)SrRNAの間の配列)は、その下の属・種レベルの分類に有効とされており、予め解析するレベルを決定した上で、適当なrRNA領域のシーケンスを行い、該領域の塩基配列に基づいた相同性検索や系統解析が行われる。
【0004】
また、上記のような、rRNA遺伝子関連領域の配列決定や相同性検索による、細菌や真菌類の菌種推定、及び系統解析を行うためのキットやシステムも市販されている。
【0005】
【非特許文献1】篠田吉史、加藤暢夫、森田直樹、「16SrRNA遺伝子解析による細菌の系統分類法」、島津評論、vol.57, No.1-2, pp.121-132,(2000)
【発明の開示】
【発明が解決しようとする課題】
【0006】
上記のような公共のデータベースを用いた相同性検索によって微生物の同定を行う場合、該公共データベースには膨大な数の配列データが登録されており、中には解析精度の低いデータや該配列の由来する生物種が十分に同定されていないものもある。また、微生物以外の配列データを含む膨大なデータに対しても相同性検索が行われるため、必ずしも、精度の高い検索結果が得られない場合があった。
【0007】
そのため、相同性検索の結果得られた各配列データについて、一つ一つデータベースに登録されたデータの信憑性を確認した上で、微生物の分類表などを基に近縁の微生物のデータを収集して系統樹の作成を行う必要があり、非常に手間が掛かっていた。また、しばしば既存の分類体系と矛盾した系統樹が作成され、菌種の判断が困難となることがあった。
【0008】
更に、真核生物の菌種推定を行う場合には、予め形態学的特徴などの他の因子を基に綱・目などを絞り込んでおき、相同性検索の結果などから系統樹を作成して菌種の判断を行うため、手間が掛かる上に作業者による差が大きくなるという問題があった。
【0009】
また、上記のような現在市販されている微生物菌種推定システムでは、解析対象とする配列データが短く、十分な解析精度を得られない場合があった。
【0010】
更に、ITS領域やD2rRNAによる相同性比較のみでは、全ての菌種を特定できるレベルでなく、対象となる配列が短いために精度の点で問題があるため、しばしば系統的に矛盾のある系統樹が作成されるという問題がある。また、18SrRNA、D2rRNA、ITS領域についてそれぞれ配列解析を行い、既存のデータベースを用いて相同性検索を行った場合、各領域と相同性の高い配列として、それぞれ異なる菌種に由来する配列データが得られることが多く、菌種推定の判断が困難となっていた。
【0011】
そこで、本発明が解決しようとする課題は、高精度な菌種推定を簡便に行うことができる菌種推定システム、及び菌種推定方法を提供することである。
【課題を解決するための手段】
【0012】
上記課題を解決するために成された本発明に係る微生物の菌種推定システムは、被検菌由来の塩基配列と既知微生物由来の塩基配列との間に見られる相同性から、該被検菌の菌種を推定する菌種推定システムであって、
a)既知微生物の保存性の高い遺伝子について、少なくともその塩基配列及び由来生物種名を含む配列データを記載した配列データベースと、
b)被検菌の保存性の高い遺伝子の塩基配列と、上記配列データベースに記載された塩基配列とを比較し、該配列データベースの中から被検菌の塩基配列と相同性の高い配列データを検索する相同性検索手段と、
を備えることを特徴とする。
【0013】
なお、上記保存性の高い遺伝子としては、上述のような16S,18S,5S, 5.8S,23S,25S, 26S,28SリボソーマルRNA遺伝子、ゲノム上のリボソーマルRNA遺伝子の間に存在するスペーサ領域(ITS領域又はIGS領域)等のリボソーマルRNA遺伝子関連領域、及びミトコンドリアDNA、gryB遺伝子、キチン合成酵素(CHS)遺伝子、チトクロームb遺伝子、recA遺伝子、elongation factor 1A遺伝子、 tubulin遺伝子、rpoB遺伝子、pks遺伝子、actin遺伝子、fus遺伝子の中から選ばれる1又は2種類以上の遺伝子を用いることが望ましい。
【0014】
また、本発明の微生物菌種推定システムは、更に、
c)既知微生物の種名及びその分類情報を記載した分類データベース、
を備え、上記配列データベースに記載された配列データと、該分類データベースに記載された分類情報とが互いに関連づけられているものとすることが望ましい。
【0015】
また、本発明の微生物菌種推定システムは、更に、
d)上記分類データベースに記載された分類情報の中から任意の分類群を指定する分類群指定手段と、
e)該分類群指定手段で指定された分類群に属する菌種由来の配列データを上記配列データベースから抽出してサブデータベースを作成するサブデータベース作成手段と、
f)該サブデータベースを対象に、被検菌由来の保存性の高い遺伝子の塩基配列との相同性検索を行うサブデータベース検索手段と、
を備えるものとすることが望ましい。
【0016】
ここで、上記分類群指定手段は、上記相同性検索手段における検索によって被検菌と相同性が高いとされた分類群が自動的に指定されるものであってもよく、上記相同性検索手段による相同性検索の結果等を参考に、操作者が所定の入力手段を用いて適当な分類群を指定するものとしてもよい。これにより、例えば、上記相同性検索手段による相同性検索結果を基にサブデータベースを作成し、該サブデータベースを対象として再び相同性検索を行って菌種の絞り込みを行うことにより、精度の高い菌種推定を行うことが可能となる。
【0017】
上記のようなサブデータベース検索手段等を備えた菌種推定システムの場合、上記相同性検索手段においては、被検菌の保存性の高い遺伝子の塩基配列として、18SリボソーマルRNA遺伝子の塩基配列を使用し、上記サブデータベース検索手段においては、被検菌由来の保存性の高い遺伝子の塩基配列としてITS領域又はIGS(InterGenic Spacer)領域の塩基配列を使用することがより望ましい。
【0018】
これにより、18SリボソーマルRNA遺伝子を用いた相同性検索の結果に基づいてサブデータベースを作成し、これに対して18SリボソーマルRNA遺伝子よりも多様性の頻度が比較的高いITS領域やIGS領域の塩基配列を用いた相同性検索を行うことで菌種を絞り込むことができ、より詳細な菌種推定が可能となる。
【0019】
また更に、本発明の微生物菌種推定システムは、上記サブデータベースに記載された塩基配列に基づいて系統樹を作成する系統樹作成手段を備えたものとしてもよく、この場合、該系統樹作成手段が、被検菌由来の塩基配列を含む系統樹と被検菌由来の塩基配列を含まない系統樹とを作成できるものとすることがより望ましい。
【0020】
上記のような菌種推定システムを用いた本発明の菌種推定方法は、被検菌由来の塩基配列と既知微生物由来の塩基配列との間に見られる相同性から、該被検菌の菌種を推定する菌種推定方法であって、
a)既知微生物の保存性の高い遺伝子の塩基配列を記載した配列データベースに対して、被検菌の保存性の高い遺伝子の塩基配列を用いた相同性検索を行って、該被検菌の属する大まかな分類群を推定するステップと、
b)既知微生物の種名及びその分類情報を記載した分類データベースの中から上記相同性検索によって推定された分類群を指定して、該分類群に関する配列データを前記配列データベースから抽出した検索用サブデータベースを作成するステップと、
c)同一被検菌に由来する上記とは異なる保存性の高い遺伝子の塩基配列を用いて、前記検索用サブデータベースを対象とした相同性検索を行って菌種の絞り込みを行うステップと、
を有することを特徴とする。
【0021】
上記のような本発明の菌種推定方法においては、被検菌として真核生物を使用し、該被検菌の18SリボソーマルRNA遺伝子の塩基配列を用いて上記配列データベースに対する相同性検索を行い、該被検菌のITS領域又はIGS領域の塩基配列を用いて上記検索用サブデータベースに対する相同性検索を行うことが望ましい。
【0022】
また、本発明の菌種推定方法は、更に、
d)上記検索用サブデータベースを対象とした相同性検索の結果に基づき、上記分類データベースの中から適当な分類群を指定して、該分類群に関する配列データを上記配列データベースから抽出した系統樹作成用サブデータベースを作成するステップと、
e)前記系統樹作成用サブデータベースに記載された塩基配列を用いて被検菌の塩基配列を含む系統樹と被検菌の塩基配列を含まない系統樹を作成し、両者の間に矛盾がないかどうかを確認するステップ、
を有するものとすることが望ましい。
【発明の効果】
【0023】
本発明の菌種推定システムによれば、微生物の保存性の高い遺伝子の配列データを記載したデータベースと各微生物の分類上の関係について記載したデータベースを利用して相同性検索を行うことで、より精度の高い菌種推定が行えるようになると共に、分類表などの必要なデータを収集する手間を省くことができ、より簡便に被検菌の系統的な位置を解析することができるようになる。また、従来の市販の菌種推定システムよりも長い配列を用いて解析を行うことができるため、相同性検索の精度を向上することができる。
【発明を実施するための最良の形態】
【0024】
以下、実施例を用いて本発明の微生物菌種推定システム及び該システムを用いた菌種推定方法について説明する。
【0025】
[実施例1]
本実施例の微生物菌種推定システムの概略構成を図2に示す。本実施例の微生物菌種推定システムは、配列データベース11a及び分類データベース11dを記憶した記憶部11と、相同性検索や系統樹作成等を実行する制御部12から成り、該制御部12にはキーボードやマウスなどの入力部13と、モニタなどの出力部14が接続されている。
【0026】
上記配列データベース11aは、微生物由来の16S,18S,5S, 5.8S,23S,25S, 26S,28SリボソーマルRNA遺伝子、ゲノム上のリボソーマルRNA遺伝子の間に存在するスペーサ領域(ITS領域及びIGS領域)等のリボソーマルRNA遺伝子関連領域の塩基配列、及び該配列に関連する情報(該配列が由来する菌種名や、該配列の生物学的特徴、遺伝子の機能など)を含む配列データを記載したものであり、細菌由来の配列データを記載した細菌データベース11bと、真菌由来の配列データを記載した真菌データベース11cから成る。
【0027】
このような配列データベース11aは、例えば、上述のような公共データベースから、細菌及び真菌に由来するリボソーマルRNA遺伝子関連領域に関する情報を抽出することによって作成することができる。なお、本発明の配列データベース11aを作成する際には、塩基配列の解読精度の低いデータや、配列の由来する生物種が十分に特定できないものを除外し、有効性の高いデータのみでデータベースを構成するようにする。
【0028】
また、上記分類データベース11dは、配列データベース11aに記載されている各配列データが由来する菌種名と、各菌種の分類情報が記載されたものであり、例えば、上記配列データベース11aと同様に、公共のデータベース(例えば、Unified Taxonomy Database)から、細菌及び真菌に関する情報を抽出することなどによって作成することができる。上記配列データベース11aに記載された配列データと該分類データベース11dに記載された分類情報とは互いに関連づけられており、配列データベース11aにおいて特定の配列データを選択することで該配列が由来する菌種の分類情報を分類データベース11dから読み出すことができると共に、分類データベース11dに記載された微生物の分類情報の中から特定の分類群を選択することで、該分類群に属する菌種のリボソーマルRNA遺伝子関連領域の配列データを配列データベース11aから抽出することができる。
【0029】
上記制御部12は、相同性検索部12a、分類群指定部12b、サブデータベース作成部12c、系統樹作成部12dを備えている。相同性検索部12aは上記配列データベース11a又は後述のサブデータベース11eに記載された塩基配列と被検菌由来の塩基配列とを比較することで、該被検菌の配列と相同性の高い配列を検索するためのものであり、例えば、BLASTやFASTAなどの既存の解析プログラムや、これらを改良したプログラム、あるいはこれらのアルゴリズムに相当するアルゴリズムを用いたプログラムなどを利用することができる。
【0030】
分類群指定部12bは上記分類データベース11dに記載された分類情報の中から任意の分類群を指定するものであり、上記相同性検索部12aによる相同性検索の結果、被検菌と相同性が高かった配列、例えば相同性スコアが250以上、もしくは連続してマッチした配列が100塩基対以上でかつ同一性(Identity)が90%以上程度の相同性、より望ましくは相同性スコアが300以上、もしくは連続してマッチした配列が150塩基対以上でかつIdentityが95%以上程度の相同性を有する配列、が由来する菌種の属する分類群、あるいは、操作者が入力部13を用いて指定した分類群を、後述のサブデータベース作成の対象として指定するものである。サブデータベース作成部12cは、上記分類群指定部12bで指定された分類群に属する菌種由来の配列データを上記配列データベース11aから抽出して検索用サブデータベース11e、又は系統樹用サブデータベース11fを作成するものである。
【0031】
系統樹作成部12dは、上記系統樹用サブデータベース11fに記載された複数の配列データを用いてマルチプルアライメント(多重整列)処理を行い、その結果に基づいて系統樹を作成するものであり、例えばCLUSTAL Wなどの既存の解析プログラムや、これらを改良したプログラム、あるいはこれらのアルゴリズムに相当するアルゴリズムを用いたプログラムなどを利用することができる。なお、該系統樹作成部12dは、被検菌を含む系統樹と含まない系統樹とを作成するものとし、両者の枝の長さから解析結果に矛盾がないかどうかを確かめることができるようにする。
【0032】
続いて、本実施例の菌種推定システムを用いた菌種推定の方法について説明する。図1は、本実施例の菌種推定方法の手順を示すフローチャートである。ここでは一例として、真菌を対象とし、18SrRNA遺伝子の塩基配列とスペーサ領域(ITS又はIGS)の塩基配列を用いて菌種推定を行う方法について説明する。図15に示すように、ITS領域やIGS領域はゲノム上のrRNA遺伝子間に存在しており、配列相同性の高い18SrRNAなどのrRNA遺伝子に比べて多様性の頻度が高いといわれている。従って、このようなITS領域やIGS領域を利用することにより、変種間や株レベルでの推定等の詳細な菌種推定を行うことが可能となる。
【0033】
まず、予め菌種を特定したい微生物(被検菌)の18SrRNA遺伝子及びITS領域のシーケンスを行い、これらの領域の塩基配列を取得しておく。このとき、できるだけ広い範囲の配列決定を行うことが望ましく、18SrRNAは1800塩基程度、ITS領域は250-800塩基程度とすることが望ましい。
【0034】
操作者によって本実施例の菌種推定システムが起動されると、図3のような相同性検索設定画面30が表示される。問い合わせ名入力欄31及び、問い合わせ配列入力欄32にはそれぞれ適当な名称と、上記によって取得された被検菌の18SrRNA配列を入力する。データベース選択欄33は、相同性検索を行うデータベースとして、上記細菌データベース11b又は真菌データベース11cのいずれかを選択するものであり、ここでは真菌データベース11cを選択する。検索パラメータ設定欄34は、Expect(期待値),WordSize(文字列の長さ),Number of hits(表示するデータの数)等の、相同性検索に関するパラメータを設定するものである。問い合わせ配列の入力及び検索パラメータの設定(S1)が完了したら操作者がOKボタン35をクリックすることにより、配列データベース11a(ここではそのうちの真菌データベース11c)に対する相同性検索が実行される(S2)。
【0035】
相同性検索が完了すると、図4のようなサブデータベース選択画面40が表示される。該サブデータベース選択画面40は、検索結果を表示する検索結果欄42と、該相同性検索の結果を基に、次に検索を行うサブデータベースの選択を行うためのサブデータベース選択欄41から成る。検索結果欄42は問い合わせ配列と相同性の高かった配列をリスト表示するリスト表示欄43と、問い合わせ配列と上記リスト表示された配列とのアライメントを表示するアライメント表示欄44から成る。リスト表示欄43には、各配列データのアクセッションナンバー(登録番号)、Definition(配列の名称やその他の情報)、相同性の高さを示すスコア、及び検索の統計的な有意性を示すE-Valueが表示される。
【0036】
サブデータベース選択欄41は「科」選択欄41a、「属」選択欄41b、及び選択済みデータ表示欄41cから成る。「科」選択欄41aは、分類データベース11dに記載されている微生物(ここでは真菌)の科名の一覧から、後述の「属」選択欄41bに表示させるものを選択するものであり、デフォルトでは上記相同性検索の結果で最も相同性スコアの高かった配列データの由来菌種が属する科が指定されている。該「科」選択欄41aで適当な科名を選択すると、その科に含まれる属名の一覧が「属」選択欄41bに表示される。該「属」選択欄41bに表示された中から適当な属名をクリックして選択ボタン41dを押すと選択した属名が選択済みデータ表示欄41cに表示される。また選択済みデータ表示欄41cに表示されたデータ名をクリックして選択解除ボタン41eを押すことで該データを選択済みデータ表示欄41cから削除することもできる。このような属の選択(S3)が完了したら、OKボタン45を押すことによって、選択された属に含まれる菌種の配列データが配列データベース11a(ここでは真菌データベース11c)から抽出されて検索用サブデータベース11eが作成される(S4)。
【0037】
続いて、図5のようなサブデータベース検索設定画面50が表示されるので、上記被検菌のITS領域の配列データを問い合わせ配列として入力し、検索パラメータの設定を行う(S5)。OKボタン54をクリックすると上記で作成された検索用サブデータベース11eに対して相同性検索が実行される(S6)。
【0038】
このように、本実施例に係る菌種推定方法では、始めに18SrRNA遺伝子の塩基配列を用いて大まかな菌種の推定を行い、その結果を基に作成した検索用サブデータベースに対して、更に、ITS領域の塩基配列を用いた相同性検索を行うことで菌種の絞り込みを行う。なお、菌種の絞り込みには上記ITS領域のほか、IGS領域の塩基配列を使用してもよい。
【0039】
検索用サブデータベース11eに対する相同性検索が完了すると、図6のようなマルチプルアライメント設定画面60が表示される。該マルチプルアライメント設定画面60は、上記サブデータベース設定画面40と同様に、相同性検索の結果を示す検索結果表示欄62、及びサブデータベース選択欄61から成る。ここで、サブデータベース設定欄61は、マルチプルアライメントに使用するデータを選択するためのものであり、検索結果表示欄62に表示された相同性検索の結果に基づいて、適当な属を選択する(S7)ことにより、その属に含まれるデータをマルチプルアライメントに使用することができる。また、リスト表示欄63の各配列の前に設けられたチェックボックス63aをチェックすることで、相同性検索でヒットした配列をマルチプルアライメントの対象に加えることもできる。設定ボタン65を押すとマルチプルアライメントに使用するデータを選別する際の閾値を設定するためのウィンド(図示略)が表示される。該ウィンドで被検菌配列との相同性スコア又は同一性(Identity)の閾値を設定し、チェックボックス67でマルチプルアライメントに問い合わせ配列(被検菌の配列)を使用するか否かを選択(S8)したうえで、OKボタン66を押せば、「属」選択欄61bで選択された属に含まれるデータ、及び上記リスト表示欄63で検索結果の中から選択されたデータが配列データベース11aから抽出されて系統樹用サブデータベース11fが作成され(S9)、その中から上記閾値以上のデータが選別されてマルチプルアライメント処理が実行される(S10)。このとき、「問い合わせ配列を使用する」のチェックボックス67がチェックされていた場合には、被検菌のデータを含んだマルチプルアライメントが実行され、チェックボックス67がチェックされていなかった場合には、被検菌のデータを含まないマルチプルアライメントが実行される。
【0040】
マルチプルアライメントが完了すると、図7のようなマルチプルアライメント結果表示画面70が表示され、保存ボタン71を押すことでマルチプルアライメントに使用した配列データのファイルとアライメント結果ファイルが作成されて保存される。また、入力部13で所定の操作を行うことにより、該マルチプルアライメントの結果に基づく系統樹を表示させることができ、問い合わせ配列を含む系統樹と含まない系統樹の2種類を作成しておくことで、両者を比較して系統的に矛盾がないことを確認することができる(S11)。
【0041】
[実施例2]
本発明の微生物菌種推定システムの有効性を示すため、菌種未知の微生物に対し18SrDNAとITS領域の塩基配列に基づく相同性検索、及び系統樹作成を行った。
【0042】
カビと考えられるサンプルよりDNAを定法により抽出し、18SrDNAとITS領域を増幅するためのPCRテンプレートとした。PCRは、プライマーとして図8に示すE21f、Ef4(18SrRNA)、ITS1、ITS4(ITS)を使用し、EX Taq(Takara)を用いて行った。アガロースゲル電気泳動により、それぞれ目的の産物を確認した後、それぞれのプライマーとFung5を用いてシーケンスを行った。シーケンス反応はBigDye Terminator Ver 3.1を使用して行い、ABI3730を用いて泳動した。
【0043】
まず、18SrDNAのPCR産物の3本のシーケンスのアライメントを行い、全長の配列を決定した(図9)。このような配列について、BLASTによる相同性検索を行い、図10のような検索結果を得た。検索結果上位のNeocosmospora vasinfectaについて、分類上の位置を確認すると、
Lineage (full): root; cellular organisms; Eukaryota; Fungi/Metazoa group; Fungi; Ascomycota; Pezizomycotina; Sordariomycetes; class" Hypocreomycetidae; Hypocreales; Nectriaceae; Nectria
となっており、ここでは、Nectriaよりも細かい分類については、推定することができなかった。
【0044】
次に、ITS1とITS4によって決定されたシーケンスデータ(図11)から、BLAST検索を行った(図12)。検索結果上位のFusarium solaniについて、分類上の位置を確認すると、
Lineage (full): root; cellular organisms; Eukaryota; Fungi/Metazoa group; Fungi; Ascomycota; Pezizomycotina; Sordariomycetes; Hypocreomycetidae; Hypocreales; Nectriaceae; Nectria; Nectria haematococca; mitosporic Nectria haematococca; Fusarium solani complex
となっており、これによって上記のNectriaよりも細かい分類群を知ることができた。
【0045】
上記18SrDNAとITS領域のシーケンスデータを用いた相同性検索の結果に基づき、それぞれ被検菌のデータを含む系統樹と、被検菌のデータを含まない系統樹の作成を行った(図13、14)。ITSシーケンスデータを用いたBLAST検索の上位に属する配列データを収集して系統樹作成を行った結果、Nectria haematococcaが最も近い菌種と推定された(図14a)。これはBLAST検索の結果とは異なるものであった。検体のシーケンスデータを含まずに系統解析を行い、検体を含んだものと比較すると、両者の間に相違が見られ(図14の矢印で示した箇所)、このことから、Fusarium solaniやNectria haemtococcaのそれぞれの菌種における系統的な関係は、完全に分離されているわけではなく、分子レベルでの分類がまだ整理できていないことが確認できた。
【0046】
18SrDNAの相同性検索の結果と、サブデータベースとITSシーケンスデータを利用した系統樹の結果から、本検体は、Fusarium solaniやNectria haematococcaに近縁であると推定された。従来であれば、Nectria属という大きな分類群か、ITSでのBLAST結果上位であるFusarium solaniを検体の属する菌種と推定していた。しかしながら、この指標を用いた解析では、Fusarium solaniやNectria haematococcaの2菌種のいずれかであると推定することになり、より詳細な結果を得ることができた。このことから、18SrDNAを用いて被検菌の大まかな分類を推定し、更にITS情報に基づいて結果の絞り込みを行う本発明の菌種推定方法の有用性が確かめられた。
【図面の簡単な説明】
【0047】
【図1】本発明の実施例である菌種推定システムによる微生物の菌種推定方法を示すフローチャート。
【図2】同実施例の菌種推定システムの概略構成を示すブロック図。
【図3】同実施例の菌種推定システムに係る 相同性検索設定画面を示す図。
【図4】同実施例の菌種推定システムに係る、サブデータベース選択画面を示す図。
【図5】同実施例の菌種推定システムに係る、サブデータベース検索設定画面を示す図。
【図6】同実施例の菌種推定システムに係る、マルチプルアライメント設定画面を示す図。
【図7】同実施例の菌種推定システムに係る、マルチプルアライメント結果表示画面を示す図。
【図8】被検菌の配列解析に使用したプライマーの配列を示す図。
【図9】被検菌の18SrRNA遺伝子の塩基配列を示す図。
【図10】上記18SrRNA遺伝子の塩基配列を使用した相同性検索の結果を示す図。
【図11】被検菌のITS領域の塩基配列を示す図。
【図12】上記ITS領域の塩基配列を使用した相同性検索の結果を示す図。
【図13】上記18SrRNA遺伝子を用いた相同性検索の結果に基づく系統樹を示す図、(a)被検菌由来の配列を含むもの、(b)被検菌由来の配列を含まないもの。
【図14】上記ITS領域を用いた相同性検索の結果に基づく系統樹を示す図、(a)被検菌由来の配列を含むもの、(b)被検菌由来の配列を含まないもの。
【図15】rRNA遺伝子とITS領域又はIGS領域との位置関係の例を示す模式図であり、(a)はArxula adeninivoransの18SrRNA、5.8SrRNA、25SrRNA、及びその間にあるITS1、ITS2を、(b)はTricholoma matsutakeの25SrRNA、5SrRNA、及びIGSを、(c)はEncephalitozoon cuniculiの5SrRNAとそれを挟む2つのIGS、及びguanylyltransferase遺伝子の一部を示す。
【符号の説明】
【0048】
11…記憶部
11a…配列データベース
11b…細菌データベース
11c…真菌データベース
11d…分類データベース
11e…検索用サブデータベース
11f…系統樹用サブデータベース
12…制御部
12a…相同性検索部
12b…分類群指定部
12c…サブデータベース作成部
12d…系統樹作成部
13…入力部
14…出力部
30…相同性検索設定画面
40…サブデータベース選択画面
50…サブデータベース検索設定画面
60…マルチプルアライメント設定画面
70…マルチプルアライメント結果表示画面
【特許請求の範囲】
【請求項1】
被検菌由来の塩基配列と既知微生物由来の塩基配列との間に見られる相同性から、該被検菌の菌種を推定する菌種推定システムであって、
a)既知微生物の保存性の高い遺伝子について、少なくともその塩基配列及び由来生物種名を含む配列データを記載した配列データベースと、
b)被検菌の保存性の高い遺伝子の塩基配列と、上記配列データベースに記載された塩基配列とを比較し、該配列データベースの中から被検菌の塩基配列と相同性の高い配列データを検索する相同性検索手段と、
を備えることを特徴とする菌種推定システム。
【請求項2】
上記保存性の高い遺伝子が、既知微生物の16S,18S,5S, 5.8S,23S,25S, 26S,28SリボソーマルRNA遺伝子、ゲノム上のリボソーマルRNA遺伝子の間に存在するスペーサ領域(ITS領域又はIGS領域)、ミトコンドリアDNA、gryB遺伝子、キチン合成酵素(CHS)遺伝子、チトクロームb遺伝子、recA遺伝子、elongation factor 1A遺伝子、 tubulin遺伝子、rpoB遺伝子、pks遺伝子、actin遺伝子、fus遺伝子の中から選ばれる1又は2種類以上の遺伝子であることを特徴とする請求項1に記載の菌種推定システム。
【請求項3】
更に、
c)既知微生物の種名及びその分類情報を記載した分類データベース、
を備え、上記配列データベースに記載された配列データと、該分類データベースに記載された分類情報とが互いに関連づけられていることを特徴とする請求項1又は2に記載の菌種推定システム。
【請求項4】
更に、
d)上記分類データベースに記載された分類情報の中から任意の分類群を指定する分類群指定手段と、
e)該分類群指定手段で指定された分類群に属する菌種由来の配列データを上記配列データベースから抽出してサブデータベースを作成するサブデータベース作成手段と、
f)該サブデータベースを対象に、被検菌由来の保存性の高い遺伝子の塩基配列との相同性検索を行うサブデータベース検索手段と、
を備えることを特徴とする請求項1〜3のいずれかに記載の菌種推定システム。
【請求項5】
上記相同性検索手段が、被検菌の保存性の高い遺伝子の塩基配列として、18SリボソーマルRNA遺伝子の塩基配列を用いるものであり、
上記サブデータベース検索手段が、被検菌由来の保存性の高い遺伝子の塩基配列としてITS領域又はIGS領域の塩基配列を用いるものであることを特徴とする請求項4に記載の菌種推定システム。
【請求項6】
更に、
g)上記サブデータベースに記載された塩基配列に基づいて系統樹を作成する系統樹作成手段、
を備えることを特徴とする請求項4又は5に記載の菌種推定システム。
【請求項7】
上記系統樹作成手段が、被検菌由来の塩基配列を含む系統樹と被検菌由来の塩基配列を含まない系統樹とを作成できることを特徴とする請求項6に記載の菌種推定システム。
【請求項8】
被検菌由来の塩基配列と既知微生物由来の塩基配列との間に見られる相同性から、該被検菌の菌種を推定する菌種推定方法であって、
a)既知微生物の保存性の高い遺伝子の塩基配列を記載した配列データベースに対して、被検菌の保存性の高い遺伝子の塩基配列を用いた相同性検索を行って、該被検菌の属する大まかな分類群を推定するステップと、
b)既知微生物の種名及びその分類情報を記載した分類データベースの中から上記相同性検索によって推定された分類群を指定して、該分類群に関する配列データを前記配列データベースから抽出した検索用サブデータベースを作成するステップと、
c)同一被検菌に由来する上記とは異なる保存性の高い遺伝子の塩基配列を用いて、前記検索用サブデータベースを対象とした相同性検索を行って菌種の絞り込みを行うステップと、
を有することを特徴とする菌種推定方法。
【請求項9】
被検菌として真核生物を使用し、該被検菌の18SリボソーマルRNA遺伝子の塩基配列を用いて上記配列データベースに対する相同性検索を行い、該被検菌のITS領域又はIGS領域の塩基配列を用いて上記検索用サブデータベースに対する相同性検索を行うことを特徴とする請求項8に記載の菌種推定方法。
【請求項10】
更に、
d)上記検索用サブデータベースを対象とした相同性検索の結果に基づき、上記分類データベースの中から適当な分類群を指定して、該分類群に関する配列データを上記配列データベースから抽出した系統樹作成用サブデータベースを作成するステップと、
e)前記系統樹作成用サブデータベースに記載された塩基配列を用いて被検菌の塩基配列を含む系統樹と被検菌の塩基配列を含まない系統樹を作成し、両者の間に矛盾がないかどうかを確認するステップと、
を有することを特徴とする請求項8又は9に記載の菌種推定方法。
【請求項1】
被検菌由来の塩基配列と既知微生物由来の塩基配列との間に見られる相同性から、該被検菌の菌種を推定する菌種推定システムであって、
a)既知微生物の保存性の高い遺伝子について、少なくともその塩基配列及び由来生物種名を含む配列データを記載した配列データベースと、
b)被検菌の保存性の高い遺伝子の塩基配列と、上記配列データベースに記載された塩基配列とを比較し、該配列データベースの中から被検菌の塩基配列と相同性の高い配列データを検索する相同性検索手段と、
を備えることを特徴とする菌種推定システム。
【請求項2】
上記保存性の高い遺伝子が、既知微生物の16S,18S,5S, 5.8S,23S,25S, 26S,28SリボソーマルRNA遺伝子、ゲノム上のリボソーマルRNA遺伝子の間に存在するスペーサ領域(ITS領域又はIGS領域)、ミトコンドリアDNA、gryB遺伝子、キチン合成酵素(CHS)遺伝子、チトクロームb遺伝子、recA遺伝子、elongation factor 1A遺伝子、 tubulin遺伝子、rpoB遺伝子、pks遺伝子、actin遺伝子、fus遺伝子の中から選ばれる1又は2種類以上の遺伝子であることを特徴とする請求項1に記載の菌種推定システム。
【請求項3】
更に、
c)既知微生物の種名及びその分類情報を記載した分類データベース、
を備え、上記配列データベースに記載された配列データと、該分類データベースに記載された分類情報とが互いに関連づけられていることを特徴とする請求項1又は2に記載の菌種推定システム。
【請求項4】
更に、
d)上記分類データベースに記載された分類情報の中から任意の分類群を指定する分類群指定手段と、
e)該分類群指定手段で指定された分類群に属する菌種由来の配列データを上記配列データベースから抽出してサブデータベースを作成するサブデータベース作成手段と、
f)該サブデータベースを対象に、被検菌由来の保存性の高い遺伝子の塩基配列との相同性検索を行うサブデータベース検索手段と、
を備えることを特徴とする請求項1〜3のいずれかに記載の菌種推定システム。
【請求項5】
上記相同性検索手段が、被検菌の保存性の高い遺伝子の塩基配列として、18SリボソーマルRNA遺伝子の塩基配列を用いるものであり、
上記サブデータベース検索手段が、被検菌由来の保存性の高い遺伝子の塩基配列としてITS領域又はIGS領域の塩基配列を用いるものであることを特徴とする請求項4に記載の菌種推定システム。
【請求項6】
更に、
g)上記サブデータベースに記載された塩基配列に基づいて系統樹を作成する系統樹作成手段、
を備えることを特徴とする請求項4又は5に記載の菌種推定システム。
【請求項7】
上記系統樹作成手段が、被検菌由来の塩基配列を含む系統樹と被検菌由来の塩基配列を含まない系統樹とを作成できることを特徴とする請求項6に記載の菌種推定システム。
【請求項8】
被検菌由来の塩基配列と既知微生物由来の塩基配列との間に見られる相同性から、該被検菌の菌種を推定する菌種推定方法であって、
a)既知微生物の保存性の高い遺伝子の塩基配列を記載した配列データベースに対して、被検菌の保存性の高い遺伝子の塩基配列を用いた相同性検索を行って、該被検菌の属する大まかな分類群を推定するステップと、
b)既知微生物の種名及びその分類情報を記載した分類データベースの中から上記相同性検索によって推定された分類群を指定して、該分類群に関する配列データを前記配列データベースから抽出した検索用サブデータベースを作成するステップと、
c)同一被検菌に由来する上記とは異なる保存性の高い遺伝子の塩基配列を用いて、前記検索用サブデータベースを対象とした相同性検索を行って菌種の絞り込みを行うステップと、
を有することを特徴とする菌種推定方法。
【請求項9】
被検菌として真核生物を使用し、該被検菌の18SリボソーマルRNA遺伝子の塩基配列を用いて上記配列データベースに対する相同性検索を行い、該被検菌のITS領域又はIGS領域の塩基配列を用いて上記検索用サブデータベースに対する相同性検索を行うことを特徴とする請求項8に記載の菌種推定方法。
【請求項10】
更に、
d)上記検索用サブデータベースを対象とした相同性検索の結果に基づき、上記分類データベースの中から適当な分類群を指定して、該分類群に関する配列データを上記配列データベースから抽出した系統樹作成用サブデータベースを作成するステップと、
e)前記系統樹作成用サブデータベースに記載された塩基配列を用いて被検菌の塩基配列を含む系統樹と被検菌の塩基配列を含まない系統樹を作成し、両者の間に矛盾がないかどうかを確認するステップと、
を有することを特徴とする請求項8又は9に記載の菌種推定方法。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【公開番号】特開2006−191922(P2006−191922A)
【公開日】平成18年7月27日(2006.7.27)
【国際特許分類】
【出願番号】特願2005−216546(P2005−216546)
【出願日】平成17年7月26日(2005.7.26)
【出願人】(000001993)株式会社島津製作所 (3,708)
【出願人】(597000618)株式会社 ワールドフュージョン (2)
【Fターム(参考)】
【公開日】平成18年7月27日(2006.7.27)
【国際特許分類】
【出願日】平成17年7月26日(2005.7.26)
【出願人】(000001993)株式会社島津製作所 (3,708)
【出願人】(597000618)株式会社 ワールドフュージョン (2)
【Fターム(参考)】
[ Back to top ]