説明

遺伝子相互作用データベース装置、遺伝子相互作用検索プログラムおよび遺伝子相互作用検索方法

【課題】Zスコア(統計情報)や動特性や遺伝子などを検索条件にしてエッジの検索結果一覧表320を表示する。
【解決手段】検索条件入力部110はエッジの推定のために行われた複数の実験の情報を検索画面に表示し、利用者に指定された検索条件310aとしてZスコア、動特性、遺伝子などを入力する。検索部120はエッジのZスコア、動特性、遺伝子などの情報が設定されたエッジテーブル220に基づいて検索条件310aに合致するエッジを特定する。検索結果出力部130は特定されたエッジの情報を検索結果一覧表320にして表示する。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、例えば、バイオインフォマティクスにおいて遺伝子間相互作用の検索に用いる遺伝子相互作用データベース装置、遺伝子相互作用検索プログラムおよび遺伝子相互作用検索方法に関するものである。
【背景技術】
【0002】
従来のデータベースは、論文に記載された遺伝子間の相互作用に関する個別の定性的知見を人手で集めたLiterature−orientedデータベースであり(例えば、“kegg”、[online]、[2007年10月29日]、インターネット<URL:http://www.genome.jp/kegg/>、京都大学)。
そのため、従来のデータベースで集められた相互作用は客観性・統一性にかけているともいえる。また、集められた各相互作用がどの程度、統計的に有意であるのかを示す指標もなかった。
【特許文献1】特開2001−221792号公報
【特許文献2】特開2003−079399号公報
【特許文献3】特開2003−238587号公報
【特許文献4】特開2006−268268号公報
【発明の開示】
【発明が解決しようとする課題】
【0003】
本発明は、例えば、客観的・統一的に推定された相互作用を検索するデータベースを提供できるようにすることを目的とする。
【課題を解決するための手段】
【0004】
本発明の遺伝子相互作用データベース装置は、特定の遺伝子群の発現を制御すると推定される上流遺伝子群と、前記上流遺伝子群により発現が制御されると推定される前記特定の遺伝子群である下流遺伝子群との発現の作用関係を示すエッジの情報として、前記上流遺伝子群を識別する上流遺伝子群ID(Identifier)と、前記下流遺伝子群を識別する下流遺伝子群IDと、前記上流遺伝子群により前記下流遺伝子群の発現が制御される統計的有意性を示すZスコアとを含むエッジ情報を複数含むエッジデータを記憶機器を用いて記憶するエッジ記憶部と、特定の統計的有意性を示すZスコア条件を前記エッジの検索条件として入力機器から入力する検索条件入力部と、前記検索条件入力部により入力された前記Zスコア条件に合致する前記エッジ情報を、CPU(Central Processing Unit)を用いて、前記エッジ記憶部に記憶されている前記エッジデータから抽出する検索部と、前記検索部により抽出された前記エッジ情報の前記上流遺伝子群IDと前記下流遺伝子群IDとを含む情報を前記エッジの検索結果として出力機器に出力する検索結果出力部とを備える。
【0005】
前記遺伝子相互作用データベース装置において、前記エッジ記憶部は、前記上流遺伝子群の制御が前記下流遺伝子群の促進と前記下流遺伝子群の抑制とのいずれであるかを示す動特性を前記エッジ情報に含めて前記エッジデータを記憶し、前記検索条件入力部は、促進と抑制とのいずれかを示す動特性条件を前記エッジの検索条件に含めて入力し、前記検索部は、前記検索条件入力部により入力された前記動特性条件に合致する前記エッジ情報を前記エッジ記憶部に記憶されている前記エッジデータから抽出する。
【0006】
前記遺伝子相互作用データベース装置は、前記上流遺伝子群に含まれる遺伝子を識別する遺伝子IDと前記下流遺伝子群に含まれる遺伝子を識別する遺伝子IDとを含む遺伝子群データを記憶機器を用いて記憶する遺伝子群記憶部を備え、前記検索条件入力部は、特定の遺伝子を識別する遺伝子IDを示す遺伝子条件を前記エッジの検索条件に含めて入力し、前記検索部は、前記検索条件入力部により入力された前記遺伝子条件により示される前記遺伝子IDで識別される遺伝子を前記上流遺伝子群と前記下流遺伝子群とのいずれかに含む前記エッジ情報を、前記遺伝子群記憶部に記憶されている前記遺伝子群データに基づいて、前記エッジ記憶部に記憶されている前記エッジデータから抽出する。
【0007】
前記遺伝子相互作用データベース装置は、前記上流遺伝子群に含まれる遺伝子を識別する遺伝子IDと前記下流遺伝子群に含まれる遺伝子を識別する遺伝子IDとを含む遺伝子群データを記憶機器を用いて記憶する遺伝子群記憶部を備え、前記エッジ記憶部は、特定の観測条件で観測された複数の遺伝子群の発現量に基づいて推定された複数の前記エッジを示す複数の前記エッジ情報を、ネットワークIDを付してネットワークデータとして、複数含めて前記エッジデータを記憶し、前記検索条件入力部は、複数のネットワークIDを示すネットワーク条件を前記エッジの検索条件に含めて入力し、前記検索部は、前記検索条件入力部により入力された前記ネットワーク条件により示される複数のネットワークIDに対応する複数のネットワークデータを前記エッジ記憶部に記憶されている前記エッジデータから複数の指定ネットワークとして特定し、複数の指定ネットワーク全てにおいて前記上流遺伝子群に共通の遺伝子が含まれると共に、複数の指定ネットワーク全てにおいて前記下流遺伝子群に共通の遺伝子が含まれる複数の指定ネットワークそれぞれのエッジ情報を、前記遺伝子群記憶部に記憶されている前記遺伝子群データに基づいて、複数の指定ネットワークそれぞれから抽出する。
【0008】
前記遺伝子相互作用データベース装置において、前記検索結果出力部は、前記検索部により複数の指定ネットワークそれぞれから抽出されたエッジ情報毎に、前記ネットワークIDと前記上流遺伝子群IDと前記下流遺伝子群IDとを含めた行を出力すると共に、複数の指定ネットワーク全てにおいて前記上流遺伝子群に含まれる前記共通の遺伝子の数と、複数の指定ネットワーク全てにおいて前記下流遺伝子群に含まれる前記共通の遺伝子の数とを含めた行を出力する。
【0009】
本発明の遺伝子相互作用データベース装置は、特定の遺伝子群の発現を制御すると推定される上流遺伝子群と、前記上流遺伝子群により発現が制御されると推定される前記特定の遺伝子群である下流遺伝子群との発現の作用関係を示すエッジの情報として、前記上流遺伝子群を識別する上流遺伝子群ID(Identifier)と、前記下流遺伝子群を識別する下流遺伝子群IDと、前記上流遺伝子群の制御が前記下流遺伝子群の促進と前記下流遺伝子群の抑制とのいずれであるかを示す動特性とを含むエッジ情報を複数含むエッジデータを記憶機器を用いて記憶するエッジ記憶部と、促進と抑制とのいずれかを示す動特性条件を前記エッジの検索条件として入力機器から入力する検索条件入力部と、前記検索条件入力部により入力された前記動特性条件に合致する前記エッジ情報を、CPU(Central Processing Unit)を用いて、前記エッジ記憶部に記憶されている前記エッジデータから抽出する検索部と、前記検索部により抽出された前記エッジ情報の前記上流遺伝子群IDと前記下流遺伝子群IDとを含む情報を前記エッジの検索結果として出力機器に出力する検索結果出力部とを備える。
【0010】
本発明の遺伝子相互作用データベース装置は、特定の遺伝子群の発現を制御すると推定される上流遺伝子群と、前記上流遺伝子群により発現が制御されると推定される前記特定の遺伝子群である下流遺伝子群との発現の作用関係を示すエッジの情報として、前記上流遺伝子群を識別する上流遺伝子群ID(Identifier)と、前記下流遺伝子群を識別する下流遺伝子群IDとを含むエッジ情報を複数含むエッジデータを記憶機器を用いて記憶するエッジ記憶部と、前記上流遺伝子群に含まれる遺伝子を識別する遺伝子IDと前記下流遺伝子群に含まれる遺伝子を識別する遺伝子IDとを含む遺伝子群データを記憶機器を用いて記憶する遺伝子群記憶部と、特定の遺伝子を識別する遺伝子IDを示す遺伝子条件を前記エッジの検索条件として入力機器から入力する検索条件入力部と、前記検索条件入力部により入力された前記遺伝子条件により示される前記遺伝子IDで識別される遺伝子を前記上流遺伝子群と前記下流遺伝子群とのいずれかに含む前記エッジ情報を、前記遺伝子群記憶部に記憶されている前記遺伝子群データに基づいて、前記エッジ記憶部に記憶されている前記エッジデータからCPU(Central Processing Unit)を用いて抽出する検索部と、前記検索部により抽出された前記エッジ情報の前記上流遺伝子群IDと前記下流遺伝子群IDとを含む情報を前記エッジの検索結果として出力機器に出力する検索結果出力部とを備える。
【0011】
本発明の遺伝子相互作用データベース装置は、特定の遺伝子群の発現を制御すると推定される上流遺伝子群と、前記上流遺伝子群により発現が制御されると推定される前記特定の遺伝子群である下流遺伝子群との発現の作用関係を示すエッジの情報として、前記上流遺伝子群を識別する上流遺伝子群ID(Identifier)と、前記下流遺伝子群を識別する下流遺伝子群IDとを含むエッジ情報を複数含むエッジデータであり、特定の観測条件で観測された複数の遺伝子群の発現量に基づいて推定された複数の前記エッジを示す複数の前記エッジ情報を、ネットワークIDを付してネットワークデータとして、複数含むエッジデータを記憶機器を用いて記憶するエッジ記憶部と、前記上流遺伝子群に含まれる遺伝子を識別する遺伝子IDと前記下流遺伝子群に含まれる遺伝子を識別する遺伝子IDとを含む遺伝子群データを記憶機器を用いて記憶する遺伝子群記憶部と、複数のネットワークIDを示すネットワーク条件を前記エッジの検索条件として入力機器から入力する検索条件入力部と、前記検索条件入力部により入力された前記ネットワーク条件により示される複数のネットワークIDに対応する複数のネットワークデータを前記エッジ記憶部に記憶されている前記エッジデータから複数の指定ネットワークとして特定し、複数の指定ネットワーク全てにおいて前記上流遺伝子群に共通の遺伝子が含まれると共に、複数の指定ネットワーク全てにおいて前記下流遺伝子群に共通の遺伝子が含まれる複数の指定ネットワークそれぞれのエッジ情報を、前記遺伝子群記憶部に記憶されている前記遺伝子群データに基づいて、CPU(Central Processing Unit)を用いて抽出する検索部と、前記検索部により抽出された前記エッジ情報の前記上流遺伝子群IDと前記下流遺伝子群IDとを含む情報を前記エッジの検索結果として出力機器に出力する検索結果出力部とを備える。
【0012】
前記遺伝子相互作用データベース装置において、前記検索結果出力部は、前記検索部により抽出された前記エッジ情報を抽出エッジ情報として、前記抽出エッジ情報の前記上流遺伝子群IDと、前記抽出エッジ情報の前記上流遺伝子群IDで識別される前記上流遺伝子群を表す遺伝子群記号と、前記抽出エッジ情報の前記下流遺伝子群IDと、前記抽出エッジ情報の前記下流遺伝子群IDで識別される前記下流遺伝子群を表す遺伝子群記号と、作用線として前記上流遺伝子群を表す前記遺伝子群記号と前記下流遺伝子群を表す前記遺伝子群記号とを接続する線とを表示する。
【0013】
前記遺伝子相互作用データベース装置において、前記検索結果出力部は、前記上流遺伝子群を表す前記遺伝子群記号と前記下流遺伝子群を表す前記遺伝子群記号とのそれぞれをそれぞれの遺伝子群記号に接続する前記作用線の数に応じた大きさで表示する。
【0014】
前記遺伝子相互作用データベース装置において、前記検索結果出力部は、前記上流遺伝子群の制御が前記下流遺伝子群の促進である場合と前記上流遺伝子群の制御が前記下流遺伝子群の抑制である場合とで異なる記号を前記作用線の前記下流遺伝子群側に表示する。
【0015】
前記遺伝子相互作用データベース装置において、前記検索結果出力部は、前記上流遺伝子群の制御が前記下流遺伝子群の促進である場合と前記上流遺伝子群の制御が前記下流遺伝子群の抑制である場合とで異なる色を用いて前記作用線を表示する。
【0016】
前記遺伝子相互作用データベース装置は、前記上流遺伝子群に含まれる遺伝子と前記下流遺伝子群に含まれる遺伝子との発現量を時系列に示す発現プロファイルを記憶機器を用いて記憶するプロファイル記憶部を備え、前記検索結果出力部は、前記検索部により抽出された前記エッジ情報を抽出エッジ情報として、前記抽出エッジ情報の前記上流遺伝子群IDで識別される前記上流遺伝子群に含まれる遺伝子の前記発現プロファイルと前記抽出エッジ情報の前記下流遺伝子群IDで識別される前記下流遺伝子群に含まれる遺伝子の前記発現プロファイルとを前記プロファイル記憶部から取得し、取得した前記発現プロファイルに基づいて時系列に遺伝子の発現量を表すグラフを表示する。
【0017】
本発明の遺伝子相互作用検索プログラムは、特定の遺伝子群の発現を制御すると推定される上流遺伝子群と、前記上流遺伝子群により発現が制御されると推定される前記特定の遺伝子群である下流遺伝子群との発現の作用関係を示すエッジの情報として、前記上流遺伝子群を識別する上流遺伝子群ID(Identifier)と、前記下流遺伝子群を識別する下流遺伝子群IDと、前記上流遺伝子群により前記下流遺伝子群の発現が制御される統計的有意性を示すZスコアとを含むエッジ情報を複数含むエッジデータを記憶機器を用いて記憶するエッジ記憶部を使用させ、検索条件入力部が、特定の統計的有意性を示すZスコア条件を前記エッジの検索条件として入力機器から入力する検索条件入力処理と、検索部が、前記検索条件入力部により入力された前記Zスコア条件に合致する前記エッジ情報を、CPU(Central Processing Unit)を用いて、前記エッジ記憶部に記憶されている前記エッジデータから抽出する検索処理と、検索結果出力部が、前記検索部により抽出された前記エッジ情報の前記上流遺伝子群IDと前記下流遺伝子群IDとを含む情報を前記エッジの検索結果として出力機器に出力する検索結果出力処理とをコンピュータに実行させる。
【0018】
前記遺伝子相互作用検索プログラムにおいて、前記エッジ記憶部は、前記上流遺伝子群の制御が前記下流遺伝子群の促進と前記下流遺伝子群の抑制とのいずれであるかを示す動特性を前記エッジ情報に含めて前記エッジデータを記憶し、前記検索条件入力部は、促進と抑制とのいずれかを示す動特性条件を前記エッジの検索条件に含めて入力し、前記検索部は、前記検索条件入力部により入力された前記動特性条件に合致する前記エッジ情報を前記エッジ記憶部に記憶されている前記エッジデータから抽出する。
【0019】
前記遺伝子相互作用検索プログラムは、遺伝子前記上流遺伝子群に含まれる遺伝子を識別する遺伝子IDと前記下流遺伝子群に含まれる遺伝子を識別する遺伝子IDとを含む遺伝子群データを記憶機器を用いて記憶する遺伝子群記憶部を使用させ、前記検索条件入力部は、特定の遺伝子を識別する遺伝子IDを示す遺伝子条件を前記エッジの検索条件に含めて入力し、前記検索部は、前記検索条件入力部により入力された前記遺伝子条件により示される前記遺伝子IDで識別される遺伝子を前記上流遺伝子群と前記下流遺伝子群とのいずれかに含む前記エッジ情報を、前記遺伝子群記憶部に記憶されている前記遺伝子群データに基づいて、前記エッジ記憶部に記憶されている前記エッジデータから抽出する。
【0020】
前記遺伝子相互作用検索プログラムは、前記上流遺伝子群に含まれる遺伝子を識別する遺伝子IDと前記下流遺伝子群に含まれる遺伝子を識別する遺伝子IDとを含む遺伝子群データを記憶機器を用いて記憶する遺伝子群記憶部を使用させ、前記エッジ記憶部は、特定の観測条件で観測された複数の遺伝子群の発現量に基づいて推定された複数の前記エッジを示す複数の前記エッジ情報を、ネットワークIDを付してネットワークデータとして、複数含めて前記エッジデータを記憶し、前記検索条件入力部は、複数のネットワークIDを示すネットワーク条件を前記エッジの検索条件に含めて入力し、前記検索部は、前記検索条件入力部により入力された前記ネットワーク条件により示される複数のネットワークIDに対応する複数のネットワークデータを前記エッジ記憶部に記憶されている前記エッジデータから複数の指定ネットワークとして特定し、複数の指定ネットワーク全てにおいて前記上流遺伝子群に共通の遺伝子が含まれると共に、複数の指定ネットワーク全てにおいて前記下流遺伝子群に共通の遺伝子が含まれる複数の指定ネットワークそれぞれのエッジ情報を、前記遺伝子群記憶部に記憶されている前記遺伝子群データに基づいて、複数の指定ネットワークそれぞれから抽出する。
【0021】
前記遺伝子相互作用検索プログラムにおいて、前記検索結果出力部は、前記検索部により複数の指定ネットワークそれぞれから抽出されたエッジ情報毎に、前記ネットワークIDと前記上流遺伝子群IDと前記下流遺伝子群IDとを含めた行を出力すると共に、複数の指定ネットワーク全てにおいて前記上流遺伝子群に含まれる前記共通の遺伝子の数と、複数の指定ネットワーク全てにおいて前記下流遺伝子群に含まれる前記共通の遺伝子の数とを含めた行を出力する。
【0022】
本発明の遺伝子相互作用検索プログラムは、特定の遺伝子群の発現を制御すると推定される上流遺伝子群と、前記上流遺伝子群により発現が制御されると推定される前記特定の遺伝子群である下流遺伝子群との発現の作用関係を示すエッジの情報として、前記上流遺伝子群を識別する上流遺伝子群ID(Identifier)と、前記下流遺伝子群を識別する下流遺伝子群IDと、前記上流遺伝子群の制御が前記下流遺伝子群の促進と前記下流遺伝子群の抑制とのいずれであるかを示す動特性とを含むエッジ情報を複数含むエッジデータを記憶機器を用いて記憶するエッジ記憶部を使用させ、検索条件入力部が、促進と抑制とのいずれかを示す動特性条件を前記エッジの検索条件として入力機器から入力する検索条件入力処理と、検索部が、前記検索条件入力部により入力された前記動特性条件に合致する前記エッジ情報を、CPU(Central Processing Unit)を用いて、前記エッジ記憶部に記憶されている前記エッジデータから抽出する検索処理と、検索結果出力部が、前記検索部により抽出された前記エッジ情報の前記上流遺伝子群IDと前記下流遺伝子群IDとを含む情報を前記エッジの検索結果として出力機器に出力する検索結果出力処理とをコンピュータに実行させる。
【0023】
本発明の遺伝子相互作用検索プログラムは、特定の遺伝子群の発現を制御すると推定される上流遺伝子群と、前記上流遺伝子群により発現が制御されると推定される前記特定の遺伝子群である下流遺伝子群との発現の作用関係を示すエッジの情報として、前記上流遺伝子群を識別する上流遺伝子群ID(Identifier)と、前記下流遺伝子群を識別する下流遺伝子群IDとを含むエッジ情報を複数含むエッジデータを記憶機器を用いて記憶するエッジ記憶部を使用させ、前記上流遺伝子群に含まれる遺伝子を識別する遺伝子IDと前記下流遺伝子群に含まれる遺伝子を識別する遺伝子IDとを含む遺伝子群データを記憶機器を用いて記憶する遺伝子群記憶部を使用させ、検索条件入力部が、特定の遺伝子を識別する遺伝子IDを示す遺伝子条件を前記エッジの検索条件として入力機器から入力する検索条件入力処理と、検索部が、前記検索条件入力部により入力された前記遺伝子条件により示される前記遺伝子IDで識別される遺伝子を前記上流遺伝子群と前記下流遺伝子群とのいずれかに含む前記エッジ情報を、前記遺伝子群記憶部に記憶されている前記遺伝子群データに基づいて、前記エッジ記憶部に記憶されている前記エッジデータからCPU(Central Processing Unit)を用いて抽出する検索処理と、検索結果出力部が、前記検索部により抽出された前記エッジ情報の前記上流遺伝子群IDと前記下流遺伝子群IDとを含む情報を前記エッジの検索結果として出力機器に出力する検索結果出力処理とをコンピュータに実行させる。
【0024】
本発明の遺伝子相互作用検索プログラムは、特定の遺伝子群の発現を制御すると推定される上流遺伝子群と、前記上流遺伝子群により発現が制御されると推定される前記特定の遺伝子群である下流遺伝子群との発現の作用関係を示すエッジの情報として、前記上流遺伝子群を識別する上流遺伝子群ID(Identifier)と、前記下流遺伝子群を識別する下流遺伝子群IDとを含むエッジ情報を複数含むエッジデータであり、特定の観測条件で観測された複数の遺伝子群の発現量に基づいて推定された複数の前記エッジを示す複数の前記エッジ情報を、ネットワークIDを付してネットワークデータとして、複数含むエッジデータを記憶機器を用いて記憶するエッジ記憶部を使用させ、前記上流遺伝子群に含まれる遺伝子を識別する遺伝子IDと前記下流遺伝子群に含まれる遺伝子を識別する遺伝子IDとを含む遺伝子群データを記憶機器を用いて記憶する遺伝子群記憶部を使用させ、検索条件入力部が、複数のネットワークIDを示すネットワーク条件を前記エッジの検索条件として入力機器から入力する検索条件入力処理と、検索部が、前記検索条件入力部により入力された前記ネットワーク条件により示される複数のネットワークIDに対応する複数のネットワークデータを前記エッジ記憶部に記憶されている前記エッジデータから複数の指定ネットワークとして特定し、複数の指定ネットワーク全てにおいて前記上流遺伝子群に共通の遺伝子が含まれると共に、複数の指定ネットワーク全てにおいて前記下流遺伝子群に共通の遺伝子が含まれる複数の指定ネットワークそれぞれのエッジ情報を、前記遺伝子群記憶部に記憶されている前記遺伝子群データに基づいて、CPU(Central Processing Unit)を用いて抽出する検索処理と、検索結果出力部が、前記検索部により抽出された前記エッジ情報の前記上流遺伝子群IDと前記下流遺伝子群IDとを含む情報を前記エッジの検索結果として出力機器に出力する検索結果出力処理とをコンピュータに実行させる。
【0025】
前記遺伝子相互作用検索プログラムにおいて、前記検索結果出力部は、前記検索部により抽出された前記エッジ情報を抽出エッジ情報として、前記抽出エッジ情報の前記上流遺伝子群IDと、前記抽出エッジ情報の前記上流遺伝子群IDで識別される前記上流遺伝子群を表す遺伝子群記号と、前記抽出エッジ情報の前記下流遺伝子群IDと、前記抽出エッジ情報の前記下流遺伝子群IDで識別される前記下流遺伝子群を表す遺伝子群記号と、作用線として前記上流遺伝子群を表す前記遺伝子群記号と前記下流遺伝子群を表す前記遺伝子群記号とを接続する線とを表示する。
【0026】
前記遺伝子相互作用検索プログラムにおいて、前記検索結果出力部は、前記上流遺伝子群を表す前記遺伝子群記号と前記下流遺伝子群を表す前記遺伝子群記号とのそれぞれをそれぞれの遺伝子群記号に接続する前記作用線の数に応じた大きさで表示する。
【0027】
前記遺伝子相互作用検索プログラムにおいて、前記検索結果出力部は、前記上流遺伝子群の制御が前記下流遺伝子群の促進である場合と前記上流遺伝子群の制御が前記下流遺伝子群の抑制である場合とで異なる記号を前記作用線の前記下流遺伝子群側に表示する。
【0028】
前記遺伝子相互作用検索プログラムにおいて、前記検索結果出力部は、前記上流遺伝子群の制御が前記下流遺伝子群の促進である場合と前記上流遺伝子群の制御が前記下流遺伝子群の抑制である場合とで異なる色を用いて前記作用線を表示する。
【0029】
前記遺伝子相互作用検索プログラムは、前記上流遺伝子群に含まれる遺伝子と前記下流遺伝子群に含まれる遺伝子との発現量を時系列に示す発現プロファイルを記憶機器を用いて記憶するプロファイル記憶部を使用させ、前記検索結果出力部は、前記検索部により抽出された前記エッジ情報を抽出エッジ情報として、前記抽出エッジ情報の前記上流遺伝子群IDで識別される前記上流遺伝子群に含まれる遺伝子の前記発現プロファイルと前記抽出エッジ情報の前記下流遺伝子群IDで識別される前記下流遺伝子群に含まれる遺伝子の前記発現プロファイルとを前記プロファイル記憶部から取得し、取得した前記発現プロファイルに基づいて時系列に遺伝子の発現量を表すグラフを表示する。
【0030】
本発明の遺伝子相互作用検索方法は、特定の遺伝子群の発現を制御すると推定される上流遺伝子群と、前記上流遺伝子群により発現が制御されると推定される前記特定の遺伝子群である下流遺伝子群との発現の作用関係を示すエッジの情報として、前記上流遺伝子群を識別する上流遺伝子群ID(Identifier)と、前記下流遺伝子群を識別する下流遺伝子群IDと、前記上流遺伝子群により前記下流遺伝子群の発現が制御される統計的有意性を示すZスコアとを含むエッジ情報を複数含むエッジデータを記憶機器を用いて記憶するエッジ記憶部を使用し、検索条件入力部が、特定の統計的有意性を示すZスコア条件を前記エッジの検索条件として入力機器から入力する検索条件入力処理を行い、検索部が、前記検索条件入力部により入力された前記Zスコア条件に合致する前記エッジ情報を、CPU(Central Processing Unit)を用いて、前記エッジ記憶部に記憶されている前記エッジデータから抽出する検索処理を行い、検索結果出力部が、前記検索部により抽出された前記エッジ情報の前記上流遺伝子群IDと前記下流遺伝子群IDとを含む情報を前記エッジの検索結果として出力機器に出力する検索結果出力処理を行う。
【0031】
本発明の遺伝子相互作用検索方法は、特定の遺伝子群の発現を制御すると推定される上流遺伝子群と、前記上流遺伝子群により発現が制御されると推定される前記特定の遺伝子群である下流遺伝子群との発現の作用関係を示すエッジの情報として、前記上流遺伝子群を識別する上流遺伝子群ID(Identifier)と、前記下流遺伝子群を識別する下流遺伝子群IDと、前記上流遺伝子群の制御が前記下流遺伝子群の促進と前記下流遺伝子群の抑制とのいずれであるかを示す動特性とを含むエッジ情報を複数含むエッジデータを記憶機器を用いて記憶するエッジ記憶部を使用し、検索条件入力部が、促進と抑制とのいずれかを示す動特性条件を前記エッジの検索条件として入力機器から入力する検索条件入力処理を行い、検索部が、前記検索条件入力部により入力された前記動特性条件に合致する前記エッジ情報を、CPU(Central Processing Unit)を用いて、前記エッジ記憶部に記憶されている前記エッジデータから抽出する検索処理を行い、検索結果出力部が、前記検索部により抽出された前記エッジ情報の前記上流遺伝子群IDと前記下流遺伝子群IDとを含む情報を前記エッジの検索結果として出力機器に出力する検索結果出力処理を行う。
【0032】
本発明の遺伝子相互作用検索方法は、特定の遺伝子群の発現を制御すると推定される上流遺伝子群と、前記上流遺伝子群により発現が制御されると推定される前記特定の遺伝子群である下流遺伝子群との発現の作用関係を示すエッジの情報として、前記上流遺伝子群を識別する上流遺伝子群ID(Identifier)と、前記下流遺伝子群を識別する下流遺伝子群IDとを含むエッジ情報を複数含むエッジデータを記憶機器を用いて記憶するエッジ記憶部を使用し、前記上流遺伝子群に含まれる遺伝子を識別する遺伝子IDと前記下流遺伝子群に含まれる遺伝子を識別する遺伝子IDとを含む遺伝子群データを記憶機器を用いて記憶する遺伝子群記憶部を使用し、検索条件入力部が、特定の遺伝子を識別する遺伝子IDを示す遺伝子条件を前記エッジの検索条件として入力機器から入力する検索条件入力処理を行い、検索部が、前記検索条件入力部により入力された前記遺伝子条件により示される前記遺伝子IDで識別される遺伝子を前記上流遺伝子群と前記下流遺伝子群とのいずれかに含む前記エッジ情報を、前記遺伝子群記憶部に記憶されている前記遺伝子群データに基づいて、前記エッジ記憶部に記憶されている前記エッジデータからCPU(Central Processing Unit)を用いて抽出する検索処理を行い、検索結果出力部が、前記検索部により抽出された前記エッジ情報の前記上流遺伝子群IDと前記下流遺伝子群IDとを含む情報を前記エッジの検索結果として出力機器に出力する検索結果出力処理を行う。
【0033】
本発明の遺伝子相互作用検索方法は、特定の遺伝子群の発現を制御すると推定される上流遺伝子群と、前記上流遺伝子群により発現が制御されると推定される前記特定の遺伝子群である下流遺伝子群との発現の作用関係を示すエッジの情報として、前記上流遺伝子群を識別する上流遺伝子群ID(Identifier)と、前記下流遺伝子群を識別する下流遺伝子群IDとを含むエッジ情報を複数含むエッジデータであり、特定の観測条件で観測された複数の遺伝子群の発現量に基づいて推定された複数の前記エッジを示す複数の前記エッジ情報を、ネットワークIDを付してネットワークデータとして、複数含むエッジデータを記憶機器を用いて記憶するエッジ記憶部を使用し、前記上流遺伝子群に含まれる遺伝子を識別する遺伝子IDと前記下流遺伝子群に含まれる遺伝子を識別する遺伝子IDとを含む遺伝子群データを記憶機器を用いて記憶する遺伝子群記憶部を使用し、検索部が、検索条件入力部が、複数のネットワークIDを示すネットワーク条件を前記エッジの検索条件として入力機器から入力する検索条件入力を行い、前記検索条件入力部により入力された前記ネットワーク条件により示される複数のネットワークIDに対応する複数のネットワークデータを前記エッジ記憶部に記憶されている前記エッジデータから複数の指定ネットワークとして特定し、複数の指定ネットワーク全てにおいて前記上流遺伝子群に共通の遺伝子が含まれると共に、複数の指定ネットワーク全てにおいて前記下流遺伝子群に共通の遺伝子が含まれる複数の指定ネットワークそれぞれのエッジ情報を、前記遺伝子群記憶部に記憶されている前記遺伝子群データに基づいて、CPU(Central Processing Unit)を用いて抽出する検索処理を行い、検索結果出力部が、前記検索部により抽出された前記エッジ情報の前記上流遺伝子群IDと前記下流遺伝子群IDとを含む情報を前記エッジの検索結果として出力機器に出力する検索結果出力処理を行う。
【発明の効果】
【0034】
本発明によれば、例えば、Zスコア(統計情報、スタンダードスコア)や動特性を検索条件にして、エッジ(相互作用)を構成する遺伝子群に含まれる遺伝子を検索条件にして、また、異なる実験で推定されたエッジ間で共通する遺伝子が含まれることを検索条件にしてエッジを検索する遺伝子相互作用データベースを提供することができる。
【発明を実施するための最良の形態】
【0035】
実施の形態1.
図1は、実施の形態1における遺伝子相互作用データベース装置100の機能構成図である。
実施の形態1における遺伝子相互作用データベース装置100の機能構成について、図1に基づいて以下に説明する。
【0036】
遺伝子相互作用データベース装置100は、検索条件入力部110、検索部120、検索結果出力部130、ネットワーク図出力部140、波形グラフ出力部150および遺伝子データ記憶部190を備える。
【0037】
遺伝子データ記憶部190(エッジ記憶部、遺伝子群記憶部、プロファイル記憶部)は、入力機器から入力されたネットワークテーブル210、エッジテーブル220、クラスタテーブル230および発現プロファイル240を記憶機器を用いて記憶する。
【0038】
エッジテーブル220(エッジデータ)は、特定の遺伝子群の発現を制御すると推定される上流遺伝子群と、前記上流遺伝子群により発現が制御されると推定される前記特定の遺伝子群である下流遺伝子群との発現の作用関係を示すエッジ(遺伝子間相互作用)の情報として、前記上流遺伝子群を識別する上流遺伝子群ID(Identifier)と、前記下流遺伝子群を識別する下流遺伝子群IDと、Zスコア226として前記上流遺伝子群が前記下流遺伝子群の発現を制御する統計的有意性とを含むエッジレコード220a(エッジ情報)を複数含む。
また、エッジテーブル220は、特定の観測条件(実験条件)で観測された複数の遺伝子群の発現量に基づいて推定された複数の前記エッジを示す複数のエッジレコード220aを、ネットワークID221を付してネットワークデータ220bとして、複数含む。「ネットワーク」は実験および実験に関する情報を意味する。ネットワークID221とはネットワークを識別する情報である。
また、エッジテーブル220は、前記上流遺伝子群の制御が前記下流遺伝子群の(発現量の変化の)促進と前記下流遺伝子群の(発現量の変化の)抑制とのいずれであるかを示す動特性をエッジレコード220aに含む。
ここで、遺伝子群の(発現量の変化の)促進とは、遺伝子を促進する作用関係のことであり、上流遺伝子の発現量の増加が下流遺伝子の発現量を増加させ、上流遺伝子の減少が下流遺伝子の発現量を減少させる作用関係を意味する。
また、遺伝子群の(発現量の変化の)抑制とは、遺伝子を抑制する作用関係のことであり、上流遺伝子の発現量の増加が下流遺伝子の発現量を減少させ、上流遺伝子の減少が下流遺伝子の発現量を増加させる作用関係を意味する。
【0039】
また、クラスタテーブル230(遺伝子群データ)は、前記上流遺伝子群に含まれる遺伝子を識別する遺伝子ID232と前記下流遺伝子群に含まれる遺伝子を識別する遺伝子ID232とを含む。
【0040】
また、発現プロファイル240は、前記上流遺伝子群に含まれる遺伝子と前記下流遺伝子群に含まれる遺伝子との発現量を時系列に示す。発現プロファイル240はタイムコースデータ、波形データともいう。
【0041】
また、ネットワークテーブル210は、エッジの推定がなされた実験に関する情報(例えば、特定の観測条件)を示すネットワークレコード210aを複数含む。ネットワークレコード210aはネットワークID211で識別される。
【0042】
検索条件入力部110は、Zスコア条件、動特性条件、遺伝子条件、ネットワーク条件の少なくともいずれかを含む検索条件310aを入力機器(例えば、キーボード902、マウス903)から入力する。
Zスコア条件は、特定の統計的有意性(Zスコア、確率量、統計値)を示す。
動特性条件は、促進と抑制とのいずれかを示す。
遺伝子条件は、特定の遺伝子を識別する遺伝子IDを示す。
ネットワーク条件は、複数のネットワークIDを示す。
【0043】
検索部120は、検索条件入力部110により入力された検索条件310aに合致するエッジレコード220aを、CPU(Central Processing Unit)を用いて、遺伝子データ記憶部190に記憶されているエッジテーブル220から抽出する。
例えば、検索部120は、Zスコア条件および動特性条件に合致するエッジレコード220aを抽出する。
また例えば、検索部120は、遺伝子条件により示される遺伝子IDで識別される遺伝子を上流遺伝子群と下流遺伝子群とのいずれかに含むエッジのエッジレコード220aを抽出する。
また例えば、検索部120は、ネットワーク条件により示される複数のネットワークIDに対応する複数のネットワークデータ220bを複数の指定ネットワークとして特定し、複数の指定ネットワーク全てにおいて上流遺伝子群に共通の遺伝子が含まれると共に、複数の指定ネットワーク全てにおいて下流遺伝子群に共通の遺伝子が含まれる複数の指定ネットワークそれぞれのエッジレコード220aを抽出する。
【0044】
検索結果出力部130は、検索部120により抽出されたエッジレコード220aに基づいて検索結果一覧表320(上流遺伝子群IDと下流遺伝子群IDとを含む情報の一例)を出力機器(例えば、表示装置901、プリンタ装置906)に出力する。
【0045】
例えば、検索結果出力部130は、検索部120により複数の指定ネットワークそれぞれから抽出されたエッジレコード220a毎に、ネットワークID221と上流遺伝子群IDと下流遺伝子群IDとを含めた行を出力する。さらに、検索結果出力部130は、複数の指定ネットワーク全てにおいて上流遺伝子群に含まれる共通の遺伝子の数と、複数の指定ネットワーク全てにおいて下流遺伝子群に含まれる共通の遺伝子の数とを含めた行を出力する。
【0046】
ネットワーク図出力部140(検索結果出力部の一例)は、複数のエッジの関係図(ネットワーク図330)を表示する。
例えば、ネットワーク図出力部140は、検索部120により抽出されたエッジレコード220aを抽出エッジ情報として、抽出エッジ情報の上流遺伝子群IDと、抽出エッジ情報の上流遺伝子群IDで識別される上流遺伝子群を表すノード331(遺伝子群記号の一例)と、抽出エッジ情報の下流遺伝子群IDと、抽出エッジ情報の下流遺伝子群IDで識別される下流遺伝子群を表すノード331と、上流遺伝子群を表すノード331と下流遺伝子群を表すノード331とを接続する作用線332とを表示する。
また例えば、ネットワーク図出力部140は、上流遺伝子群を表すノード331と下流遺伝子群を表すノード331とのそれぞれをそれぞれのノード331に接続する作用線332の数に応じた大きさで表示する。
また例えば、ネットワーク図出力部140は、上流遺伝子群の制御が下流遺伝子群の促進である場合と上流遺伝子群の制御が下流遺伝子群の抑制である場合とで異なる記号を作用線332の下流遺伝子群側に表示する。
また例えば、ネットワーク図出力部140は、上流遺伝子群の制御が下流遺伝子群の発現の促進である場合と上流遺伝子群の制御が下流遺伝子群の発現の抑制である場合とで異なる色を用いて作用線332を表示する。
【0047】
波形グラフ出力部150(検索結果出力部の一例)は、発現プロファイル240をグラフ表示する。
例えば、検索結果出力部130は、検索部120により抽出されたエッジレコード220aを抽出エッジ情報として、抽出エッジ情報の上流遺伝子群IDで識別される上流遺伝子群に含まれる遺伝子の発現プロファイル240と、抽出エッジ情報の下流遺伝子群IDで識別される下流遺伝子群に含まれる遺伝子の発現プロファイル240とを遺伝子データ記憶部190から取得し、取得した発現プロファイル240に基づいて時系列に遺伝子の発現量を表す発現量波形グラフ340を表示する。
【0048】
以下、遺伝子群を「クラスタ」という。
【0049】
図2は、実施の形態1における遺伝子相互作用データベース装置100の外観の一例を示す図である。
図2において、遺伝子相互作用データベース装置100は、システムユニット910、CRT(Cathode・Ray・Tube)やLCD(液晶)の表示画面を有する表示装置901、キーボード902(Key・Board:K/B)、マウス903、FDD904(Flexible・Disk・Drive)、CDD905(コンパクトディスク装置)、プリンタ装置906、スキャナ装置907などのハードウェア資源を備え、これらはケーブルや信号線で接続されている。
システムユニット910は、コンピュータであり、ファクシミリ機932、電話器931とケーブルで接続され、また、LAN942(ローカルエリアネットワーク)、ゲートウェイ941を介してインターネット940に接続されている。
【0050】
図3は、実施の形態1における遺伝子相互作用データベース装置100のハードウェア資源の一例を示す図である。
図3において、遺伝子相互作用データベース装置100は、プログラムを実行するCPU911(Central・Processing・Unit、中央処理装置、処理装置、演算装置、マイクロプロセッサ、マイクロコンピュータ、プロセッサともいう)を備えている。CPU911は、バス912を介してROM913、RAM914、通信ボード915、表示装置901、キーボード902、マウス903、FDD904、CDD905、プリンタ装置906、スキャナ装置907、磁気ディスク装置920と接続され、これらのハードウェアデバイスを制御する。磁気ディスク装置920の代わりに、光ディスク装置、メモリカード読み書き装置などの記憶装置でもよい。
RAM914は、揮発性メモリの一例である。ROM913、FDD904、CDD905、磁気ディスク装置920の記憶媒体は、不揮発性メモリの一例である。これらは、記憶機器、記憶装置あるいは記憶部の一例である。また、入力データが記憶されている記憶機器は入力機器、入力装置あるいは入力部の一例であり、出力データが記憶される記憶機器は出力機器、出力装置あるいは出力部の一例である。
通信ボード915、キーボード902、スキャナ装置907、FDD904などは、入力機器、入力装置あるいは入力部の一例である。
また、通信ボード915、表示装置901、プリンタ装置906などは、出力機器、出力装置あるいは出力部の一例である。
【0051】
通信ボード915は、ファクシミリ機932、電話器931、LAN942等に接続されている。通信ボード915は、LAN942に限らず、インターネット940、ISDN等のWAN(ワイドエリアネットワーク)などに接続されていても構わない。インターネット940或いはISDN等のWANに接続されている場合、ゲートウェイ941は不用となる。
【0052】
磁気ディスク装置920には、OS921(オペレーティングシステム)、ウィンドウシステム922、プログラム群923、ファイル群924が記憶されている。プログラム群923のプログラムは、CPU911、OS921、ウィンドウシステム922により実行される。
【0053】
上記プログラム群923には、実施の形態において「〜部」として説明する機能を実行するプログラムが記憶されている。プログラムは、CPU911により読み出され実行される。
【0054】
ファイル群924には、実施の形態において、「〜部」の機能を実行した際の「〜の判定結果」、「〜の計算結果」、「〜の処理結果」などの結果データ、「〜部」の機能を実行するプログラム間で受け渡しするデータ、その他の情報やデータや信号値や変数値やパラメータが、「〜ファイル」や「〜データベース」の各項目として記憶されている。ネットワークテーブル210、エッジテーブル220、クラスタテーブル230、発現プロファイル240、検索条件310a、検索結果一覧表320などはファイル群924に含まれるものの一例である。
「〜ファイル」や「〜データベース」は、ディスクやメモリなどの記録媒体に記憶される。ディスクやメモリなどの記憶媒体に記憶された情報やデータや信号値や変数値やパラメータは、読み書き回路を介してCPU911によりメインメモリやキャッシュメモリに読み出され、抽出・検索・参照・比較・演算・計算・処理・出力・印刷・表示などのCPUの動作に用いられる。抽出・検索・参照・比較・演算・計算・処理・出力・印刷・表示のCPUの動作の間、情報やデータや信号値や変数値やパラメータは、メインメモリやキャッシュメモリやバッファメモリに一時的に記憶される。
また、実施の形態において説明するフローチャートの矢印の部分は主としてデータや信号の入出力を示し、データや信号値は、RAM914のメモリ、FDD904のフレキシブルディスク、CDD905のコンパクトディスク、磁気ディスク装置920の磁気ディスク、その他光ディスク、ミニディスク、DVD(Digital・Versatile・Disc)等の記録媒体に記録される。また、データや信号値は、バス912や信号線やケーブルその他の伝送媒体によりオンライン伝送される。
【0055】
また、実施の形態において「〜部」として説明するものは、「〜回路」、「〜装置」、「〜機器」であってもよく、また、「〜ステップ」、「〜手順」、「〜処理」であってもよい。すなわち、「〜部」として説明するものは、ROM913に記憶されたファームウェアで実現されていても構わない。或いは、ソフトウェアのみ、或いは、素子・デバイス・基板・配線などのハードウェアのみ、或いは、ソフトウェアとハードウェアとの組み合わせ、さらには、ファームウェアとの組み合わせで実施されても構わない。ファームウェアとソフトウェアは、プログラムとして、磁気ディスク、フレキシブルディスク、光ディスク、コンパクトディスク、ミニディスク、DVD等の記録媒体に記憶される。プログラムはCPU911により読み出され、CPU911により実行される。すなわち、プログラムは、「〜部」としてコンピュータを機能させるものである。あるいは、「〜部」の手順や方法をコンピュータに実行させるものである。
【0056】
図4は、実施の形態1における遺伝子相互作用データベース装置100の遺伝子相互作用検索方法を示すフローチャートである。
遺伝子相互作用データベース装置100が実行する遺伝子相互作用検索方法について、図4に基づいて以下に説明する。
遺伝子相互作用データベース装置100の各部は、以下に説明する各処理をCPU911を用いて実行する。
【0057】
まず、検索条件入力部110は検索条件指定フォーム310を表示し(S110:検索画面表示処理)、検索条件指定フォーム310で利用者に指定された検索条件310aを入力する(S120:検索条件入力処理)。次に、検索部120は検索条件310aに合致するエッジレコード220aをエッジテーブル220から抽出する(S130:検索処理)。そして、検索結果出力部130は抽出されたエッジレコード220aに基づいて検索結果一覧表320を生成し(S140:結果一覧生成処理)、生成した検索結果一覧表320を表示する(S150:検索結果出力処理)。
【0058】
以下に、各処理の詳細について説明する。
【0059】
<S110:検索画面表示処理>
まず、検索条件入力部110は利用者に検索条件310aを指定させる検索条件指定フォーム310を表示する。
【0060】
図5は、実施の形態1における検索条件指定フォーム310を示す図である。
検索画面表示処理(S110)において、検索条件入力部110は、図5に示すような検索条件指定フォーム310を遺伝子間相互作用(エッジ)の検索画面として表示装置901に表示する。
図5において、検索条件指定フォーム310は、エッジの推定がなされた実験に関する情報を示すネットワーク情報312を含んでいる。
【0061】
以下に、ネットワーク情報312について説明する。
【0062】
図6は、実施の形態1におけるネットワークテーブル210を示す図である。
遺伝子データ記憶部190には図6に示すようなネットワークテーブル210が記憶されており、検索条件入力部110は遺伝子データ記憶部190に記憶されているネットワークテーブル210の情報(全てのネットワークレコード210a)をネットワーク情報312として検索条件指定フォーム310に含めて表示する。
【0063】
ネットワークテーブル210は、ネットワークID211、クラスタ数212、エッジ数213、生物種214、実験種別215、組織種別216、サンプル種別217、時点数218、データソースID219およびデータ番号219aを含み、エッジの推定がなされた実験に関する情報を示す。
【0064】
ネットワークID211は、エッジの推定がなされた実験(ネットワーク、ケース)を識別する情報を示す。
クラスタ数212は、当該実験において観測された複数の遺伝子の発現量に基づいて発現量の時系列変化の特徴に応じてグループ分けされた遺伝子グループ(クラスタ、遺伝子群)の数を示す。
エッジ数213は、当該実験において観測された複数の遺伝子の発現量に基づいて推定されたエッジの数を示す。
生物種214は、当該実験に用いられた生物種を識別する情報を示す。
実験種別215は、当該実験において遺伝子に与えられた負荷について表す情報である。
組織種別216は、当該実験に用いられた細胞組織を識別する情報を示す。
サンプル種別217は、当該実験に用いられた遺伝子サンプルを識別する情報を示す。
時点数218は、当該実験において遺伝子の発現量の観測が行われた時点の数(回数)を示す。
データソースID219は、当該実験において観測された遺伝子発現量を時点毎に示す発現プロファイル240の提供元データベースを示す。
データ番号219aは、データソースID219により示されるデータベースにおける当該発現プロファイル240の識別情報を示す。
【0065】
生物種214〜データ番号219aは、遺伝子発現量の観測条件(特定の観測条件、実験条件)の一例である。
ネットワークテーブル210は、一つの実験に関する情報(ネットワークID211〜データ番号219a)をネットワークレコード210aとして示す。
以下、実験および実験に関する情報を「ネットワーク」という。
【0066】
図5において、検索条件指定フォーム310は、相互作用の検索対象とするネットワーク(ネットワーク条件)の指定に用いられるチェックボックス311を含んでいる。
チェックボックス311aは表示されている全てのネットワーク(スクロールバー312aによるスクロールにより表示されるネットワークも含む)の指定時に選択される。チェックボックス311bは“N”で識別されるネットワークの指定時に選択される。以下、“N”で識別されるネットワークを「ネットワークN」と記す。同様に、チェックボックス311cはネットワークNの指定時に選択され、チェックボックス311dはネットワークNの指定時に選択される。
図5は、チェックボックス311bとチェックボックス311cとがチェックされているので、ネットワークNとネットワークNとが相互作用の検索対象に指定されていることを示している。
相互作用の検索対象として、1つ以上のネットワークがチェックボックス311で指定される。
【0067】
スクロールバー312aは、ネットワーク情報312のスクロール表示の要求に用いられる。
【0068】
検索条件指定フォーム310は、検索種別の指定に用いられるオプションボタン313を含んでいる。
オプションボタン313aは後述する「ネットワーク単位」の検索の指定時に選択される。オプションボタン313bは後述する「ネットワーク間」の検索の指定時に選択される。
検索種別として、「ネットワーク単位」と「ネットワーク間」とのいずれかがオプションボタン313で指定される。
【0069】
検索条件指定フォーム310は、遺伝子条件の指定に用いられるテキストボックス314を含んでいる。
テキストボックス314aは上流遺伝子の指定時に上流遺伝子を識別する情報(以下、上流遺伝子IDとする)が入力される。テキストボックス314bは下流遺伝子の指定時に下流遺伝子を識別する情報(以下、下流遺伝子IDとする)が入力される。
上流遺伝子IDと下流遺伝子IDとは一方が指定されても良いし、両方が指定されても良いし、両方とも指定されなくても良い。また、複数の遺伝子IDが上流遺伝子IDや下流遺伝子IDとして指定されても良い。
【0070】
検索条件指定フォーム310は、Zスコア条件の指定に用いられるテキストボックス315を含んでいる。
Zスコアは指定されても、指定されなくても良い。
Zスコアは、当該エッジにより示される作用関係の統計的有意性を示す値(その作用関係の適合度が作用関係全体の平均値よりもどれだけ偏っているか)である。
【0071】
検索条件指定フォーム310は、動特性条件の指定に用いられるオプションボタン316を含んでいる。
オプションボタン316aは「促進」の指定時に選択される。オプションボタン316bは「抑制」の指定時に選択される。オプションボタン316cは動特性の指定が無い場合に選択される。
動特性として、「促進」と「抑制」と「指定しない」とのいずれかが指定される。
【0072】
検索条件指定フォーム310は、相互作用の検索開始の要求時に押下される検索ボタン319aと、指定された検索条件310a(ネットワーク条件、検索種別、遺伝子条件、Zスコア条件、動特性条件)のリセット時に押下されるリセットボタン319bとを含んでいる。
【0073】
図4に戻り、遺伝子相互作用検索方法の検索画面表示処理(S110)後の処理について説明する。
【0074】
<S120:検索条件入力処理>
検索条件入力部110は、利用者が検索条件指定フォーム310を用いて指定した検索条件310aを入力する。
【0075】
<S130:検索処理>
検索部120は、検索条件入力部110から検索条件310aを入力し、入力した検索条件310aに合致するエッジレコード220aをエッジテーブル220から抽出する。
実施の形態1では、「ネットワーク単位」の検索処理について説明する。
検索条件310aに検索種別として「ネットワーク単位」が指定されている場合(オプションボタン313aが選択されている場合)、検索部120は以下に説明する検索処理[ネットワーク単位](S130)を実行する。
【0076】
図7は、実施の形態1における検索処理[ネットワーク単位](S130)を示すフローチャートである。
検索部120が実行する検索処理[ネットワーク単位](S130)について、図7に基づいて以下に説明する。
【0077】
<S131>
検索部120は、検索条件310aに含まれているネットワーク条件に基づいて検索対象のネットワークを特定し、検索対象のネットワークで推定されたエッジの情報を示すエッジレコード220aを指定ネットワークデータ220bとしてエッジテーブル220から抽出する。
【0078】
図8は、実施の形態1におけるエッジテーブル220を示す図である。
遺伝子データ記憶部190には図8に示すようなエッジテーブル220が記憶されており、検索部120は遺伝子データ記憶部190に記憶されているエッジテーブル220から指定ネットワークデータ220bを抽出する。
【0079】
エッジテーブル220は、ネットワークID221、エッジID222、上流クラスタID223、下流クラスタID224、動特性種別225およびZスコア226を含み、各ネットワークで推定されたエッジに関する情報を示す。
【0080】
ネットワークID221は、ネットワーク(実験、ケース)の識別情報を示す。
エッジID222は、当該ネットワークで推定されたエッジを識別する情報を示す。図8では、エッジID222の一例として、ネットワークNのn番目のエッジを「Ex_n」と表記している。
上流クラスタID223は、当該エッジの上流クラスタを識別する情報を示す。上流クラスタは下流クラスタ(被制御クラスタ)に属する遺伝子(下流遺伝子)の発現を制御する遺伝子(上流遺伝子)が属するクラスタである。
下流クラスタID224は、当該エッジの下流クラスタを識別する情報を示す。下流クラスタは上流クラスタ(制御クラスタ)に属する遺伝子(上流遺伝子)に制御される遺伝子(下流遺伝子)が属するクラスタである。
動特性種別225は、当該エッジの動特性を識別する情報を示す。図8では、動特性種別225の一例として、促進を「+」で示し、抑制を「−」で示している。例えば、“E1_1”で識別されるエッジは、“C”で識別されるクラスタに属する遺伝子が“C”で識別されるクラスタに属する遺伝子を促進する(上流遺伝子の発現量の増加または減少が下流遺伝子の発現量を増加または減少させる)という作用関係を示している。以下、“Ex_y”で識別されるエッジを「エッジEx_y」と記し、“C”で識別されるクラスタを「クラスタC」と記す。同様に、エッジE1_2は、クラスタCに属する遺伝子がクラスタCに属する遺伝子を抑制する(上流遺伝子の発現量の増加または減少が下流遺伝子の発現量を減少または増加させる)という作用関係を示している。
Zスコア226は、当該エッジにより示される作用関係の統計的有意性を示す値(その作用関係の適合度が作用関係全体の平均値よりもどれだけ偏っているか)を示す。図8では、Zスコア226の数値が大きいほど、エッジにより示される作用関係が成り立つ可能性が高いことを示している。例えば、Zスコア226は、特開2006−268268号公報で開示されている計算方法により算出することができる。例えば、Zスコア226は正規化した観測残差に基づいて与えられる。Zスコア226は推定されたエッジがどの程度統計的に有意であるかを表す指標となる。
【0081】
エッジテーブル220は、一つのエッジに関する情報(ネットワークID221〜Zスコア226)をエッジレコード220aとして示す。
以下、特定のネットワークにおいて推定された全てのエッジのエッジレコード220aをまとめてネットワークデータ220bという。例えば、ネットワークNで359個のエッジが推定された場合、ネットワークNのネットワークデータ220bには359個のエッジレコード220aが含まれる。
【0082】
検索部120は、図7のS131において、検索条件310aに含まれているネットワーク条件により示されるネットワークIDを検索キーとしてエッジテーブル220を検索し、該当する全てのエッジレコード220aを指定ネットワークデータ220bとして取得する。
例えば、検索条件310aにネットワーク条件としてネットワークNとネットワークNとが指定された場合、ネットワークNのネットワークデータ220bとネットワークNのネットワークデータ220bとが指定ネットワークデータ220bとなる。
【0083】
次に、図7に示す検索処理[ネットワーク単位](S130)のS131後の処理について説明する。
【0084】
<S132>
検索部120は、エッジカウンタx(変数)に「1」を設定する。エッジカウンタxは指定ネットワークデータ220bに含まれる複数のエッジレコード220aを区別する添え字として用いられる。
【0085】
<S133:ネットワーク単位条件判定処理>
検索部120は、S133a〜S133cにより、指定ネットワークデータ220bから検索条件310aに合致するエッジレコード220aを抽出する。
【0086】
<S133a:Zスコア判定処理>
検索部120は、指定ネットワークデータ220bからx番目のエッジレコード220aを選択し、x番目のエッジレコード220aにより示されるZスコア226と検索条件310aにZスコア条件として指定されているZスコア(テキストボックス315に入力されたZスコア)(以下、指定Zスコアとする)とを大小比較する。Zスコア条件が指定されていない場合、この処理はスキップされ、次に、動特性判定処理(133b)が実行される。以下、x番目のエッジレコード220aをエッジレコード220a[x]と記す。
エッジレコード220a[x]のZスコア226が指定Zスコア以上である場合、次に、動特性判定処理(133b)が実行される。
また、エッジレコード220a[x]のZスコア226が指定Zスコア未満である場合、次に、S135が実行される。
【0087】
<S133b:動特性判定処理>
検索部120は、エッジレコード220a[x]により示される動特性種別225と検索条件310aに動特性条件として指定されている動特性種別(以下、指定動特性種別とする)とが一致しているか否かを判定する。動特性条件が指定されていない場合、この処理はスキップされ、次に、遺伝子判定処理(S133c)が実行される。
エッジレコード220a[x]の動特性種別225と指定動特性種別とが一致している場合、次に、遺伝子判定処理(S133c)が実行される。
また、エッジレコード220a[x]の動特性種別225と指定動特性種別とが一致していない場合、次に、S135が実行される。
【0088】
<S133c:遺伝子判定処理>
検索部120は、エッジレコード220a[x]により示される上流クラスタID223で識別されるクラスタ(以下、上流クラスタとする)に、検索条件310aに遺伝子条件として指定されている上流遺伝子(テキストボックス314aに入力された遺伝子IDで識別される遺伝子)(以下、指定上流遺伝子とする)が属しているか否かを判定する。
また、検索部120は、エッジレコード220a[x]により示される下流クラスタID224で識別されるクラスタ(以下、下流クラスタとする)に、検索条件310aに遺伝子条件として指定されている下流遺伝子(テキストボックス314bに入力された遺伝子IDで識別される遺伝子)(以下、指定下流遺伝子とする)が属しているか否かを判定する。
【0089】
遺伝子条件として上流遺伝子と下流遺伝子との両方が指定されている場合、実行される次の処理は以下のように決まる。
上流クラスタに指定上流遺伝子が属し、さらに、下流クラスタに指定下流遺伝子が属している場合、次に、S134が実行され、それ以外の場合、次に、S135が実行される。
【0090】
また、遺伝子条件として上流遺伝子のみが指定されている場合、次に実行される処理は以下のように決まる。
上流クラスタに指定上流遺伝子が属している場合、次に、S134が実行され、上流クラスタに指定上流遺伝子が属していない場合、次に、S135が実行される。
【0091】
また、遺伝子条件として下流遺伝子のみが指定されている場合、次に実行される処理は以下のように決まる。
下流クラスタに指定下流遺伝子が属している場合、次に、S134が実行され、下流クラスタに指定下流遺伝子が属していない場合、次に、S135が実行される。
【0092】
また、遺伝子条件として上流遺伝子と下流遺伝子との両方とも指定されていない場合、次に、S134が実行される。
【0093】
以下に、指定された遺伝子がクラスタに属しているか否かの判定方法について説明する。
【0094】
図9は、実施の形態1におけるクラスタテーブル230を示す図である。
遺伝子データ記憶部190には図9に示すようなクラスタテーブル230が記憶されている。
検索部120は、図7の遺伝子判定処理(S133c)において、遺伝子データ記憶部190に記憶されているクラスタテーブル230に基づいて、上流クラスタに指定上流遺伝子が属しているか、また、下流クラスタに指定下流遺伝子が属しているかを判定する。
【0095】
クラスタテーブル230は、クラスタID231および遺伝子ID232を含み、各クラスタに属している遺伝子を示す。
【0096】
クラスタID231は、クラスタを識別する情報を示す。
遺伝子ID232は、当該クラスタに属している遺伝子を識別する情報を示す。
【0097】
図9は、クラスタCに“g”で識別される遺伝子と“g”で識別される遺伝子とが含まれていることを示している。以下、“g”で識別される遺伝子を「遺伝子g」と記す。図9は、同様に、クラスタCに遺伝子gが属していることを示している。
【0098】
クラスタテーブル230は、特定のクラスタに属する一つの遺伝子を示す情報を遺伝子レコード230aとする。
【0099】
図10、図11および図12は、実施の形態1における発現プロファイル240を示す図である。
発現プロファイル240は特定のネットワークで観測された遺伝子の各時点の発現量を示している。つまり、発現プロファイル240は遺伝子発現量の時系列データである。横軸で時間を表し、縦軸で発現量を表した場合、複数の遺伝子の発現プロファイル240は図10〜図12に示すような発現量波形グラフ340(折れ線グラフ)を示す。図10〜図12は、複数の遺伝子の波形(個別波形341)と複数の遺伝子を代表する波形(代表波形342)とを示している。代表波形342は、図10〜図12において、各時点の発現量が「○」で示されていると共に、太線で示されている。例えば、代表波形342は選択された一つの個別波形341でもよいし、複数の個別波形341の平均値を示す波形であってもよい。
【0100】
クラスタは、この発現プロファイル240により示される波形の特徴の共通する遺伝子の集まり、つまり、波形の類似する遺伝子の集まりである。
クラスタテーブル230は、波形の類似する複数の遺伝子が同じクラスタに属することを示している。
【0101】
例えば、図10に波形が示される複数の遺伝子が一つのクラスタを構成する。また例えば、図11に波形が示される複数の遺伝子が別のクラスタを構成する。また例えば、図12に波形が示される複数の遺伝子がさらに別のクラスタを構成する。
図10に示す各波形は、共通して、発現量の増加ピーク(時点t1)を1つ示すという特徴を有する。また、図11に示す各波形は、観測の開始時点(t0)から観測の終了時点(t6)まで発現量が減少し続け、発現量のピークが無いという特徴を有する。また、図12に示す各波形は、発現量の増加ピーク(時点t1)と減少ピーク(時点t2)とを1つずつ示すという特徴を有する。ピークとは発現量が増加から減少に転じる時点または発現量が減少から増加に転じる時点を示す。
【0102】
図7に戻り、ネットワーク単位条件判定処理(S133)後の処理について説明する。
【0103】
<S134>
検索部120は、検索結果にエッジレコード220a[x]により示されるエッジID222を設定する。検索結果にエッジID222が設定されるエッジレコード220a[x]は検索条件310aに合致するものである。
【0104】
<S135>
次に、検索部120は、エッジカウンタxと指定ネットワークデータ220bに含まれる全てのネットワークデータ220bのエッジレコード220aの総数(以下、指定ネットワークデータ220bのエッジレコード220aの総数とする)とを大小比較する。
エッジカウンタxが指定ネットワークデータ220bのエッジレコード220aの総数未満である場合、つまり、指定ネットワークデータ220bに含まれる全てのネットワークデータ220bのエッジレコード220aのうちネットワーク単位条件判定処理(S133)のされていないエッジレコード220aが有る場合、次に、S136が実行される。
エッジカウンタxが指定ネットワークデータ220bのエッジレコード220aの総数以上である場合、つまり、指定ネットワークデータ220bに含まれる全てのネットワークデータ220bの全てのエッジレコード220aに対してネットワーク単位条件判定処理(S133)がされた場合、検索処理[ネットワーク単位](S130)は終了する。
【0105】
<S136>
検索部120は、エッジカウンタxに「1」を加える。
その後、検索部120は、エッジレコード220a[x]に対してネットワーク単位条件判定処理(S133)を実行する。
こうして、指定ネットワークデータ220bに含まれる全てのネットワークデータ220bの全てのエッジレコード220aに対してネットワーク単位条件判定処理(S133)がされるまでS133〜S136の処理を繰り返す。
【0106】
図4に戻り、遺伝子相互作用検索方法の検索処理(S130)後の処理について説明する。
【0107】
<S140:結果一覧生成処理>
検索結果出力部130は、検索部120から検索結果を入力し、入力した検索結果により示されるエッジID222を検索キーとしてエッジテーブル220を検索し、該当するエッジレコード220aを取得し、取得したエッジレコード220aに基づいて検索結果一覧表320を生成する。検索結果出力部130により取得されたエッジレコード220aは、検索条件310aに該当するエッジレコード220aとして検索部120により抽出されたものである。
【0108】
図13は、実施の形態1における検索結果一覧表320を示す図である。
検索結果出力部130は、図4の結果一覧生成処理(S140)において、図13に示すような検索結果一覧表320を生成する。
【0109】
検索結果一覧表320は、ネットワークID321、上流クラスタID322、遺伝子数323、下流クラスタID324、遺伝子数325、動特性種別326およびZスコア327を含み、検索条件310aに合致するエッジレコード220aの情報を示す。
【0110】
ネットワークID321、上流クラスタID322、下流クラスタID324、動特性種別326およびZスコア327は、エッジレコード220aに設定されている情報を示す。
遺伝子数323は、上流クラスタID322で識別されるクラスタに属する遺伝子の数を示す。
遺伝子数325は、下流クラスタID324で識別されるクラスタに属する遺伝子の数を示す。
【0111】
検索結果出力部130は、取得したエッジレコード220aに設定されている情報をネットワークID321、上流クラスタID322、下流クラスタID324、動特性種別326およびZスコア327に設定する。
また、検索結果出力部130は、上流クラスタID322を検索キーとしてクラスタテーブル230を検索し、該当した遺伝子レコード230aの数を遺伝子数323に設定する。
また、検索結果出力部130は、下流クラスタID324を検索キーとしてクラスタテーブル230を検索し、該当した遺伝子レコード230aの数を遺伝子数325に設定する。
【0112】
例えば、検索条件310aにネットワーク条件としてネットワークNとネットワークNとが設定されている場合、検索結果一覧表320にはネットワークID221に“N”または“N”が設定されているエッジレコード220aの情報が示される。
また例えば、検索条件310aに遺伝子条件として上流遺伝子gと下流遺伝子gとが設定されている場合、検索結果一覧表320には遺伝子gの属するクラスタを上流クラスタとすると共に、遺伝子gの属するクラスタを下流クラスタとするエッジの情報が示される。
また例えば、検索条件310aに動特性条件として「抑制(+)」が設定されている場合、検索結果一覧表320には動特性種別225に「+」が設定されているエッジレコード220aの情報が示される。
また例えば、検索条件310aにZスコア条件として「2」が設定されている場合、検索結果一覧表320にはZスコア226に2以上の値が設定されているエッジレコード220aの情報が示される。
【0113】
図4に戻り、遺伝子相互作用検索方法の結果一覧生成処理(S140)後の処理について説明する。
【0114】
<S150:検索結果出力処理>
検索結果出力部130は、図13に示すように、結果一覧生成処理(S140)で生成した検索結果一覧表320を表示装置901に表示する。図13において、スクロールバー329は検索結果一覧表320のスクロール要求に用いられる。
【0115】
実施の形態1では、例えば、以下のような特徴を有する遺伝子相互作用データベース装置100について説明した。
エッジ(相互作用)が検索対象としてエッジテーブル220に記憶されている。
各エッジには統計的有意性を示すZスコアが付与されている。
Zスコア値を条件にした検索ができる。
各エッジには動特性(促進または抑制)を示す符号情報が付いている。
動特性を条件にした検索ができる。
遺伝子の条件を他の条件と組み合わせた検索ができる。例えば、ある遺伝子を下流クラスタに持つエッジを探すことができる。
【0116】
実施の形態2.
実施の形態2では、遺伝子相互作用検索方法の検索処理(S130)として「ネットワーク間」の検索処理について説明する。
以下、実施の形態1と異なる事項について主に説明し、説明を省略する事項については実施の形態1と同様であるものとする。
【0117】
検索条件310aに検索種別として「ネットワーク間」が指定されている場合(オプションボタン313bが選択されている場合)、検索部120は以下に説明する検索処理[ネットワーク間](S130)を実行する。
【0118】
図14は、実施の形態2における検索処理[ネットワーク間](S130)を示すフローチャートである。
検索部120が実行する検索処理[ネットワーク間](S130)について、図14に基づいて以下に説明する。
検索条件310aにネットワーク条件として2つのネットワークIDが指定されているものとする。
【0119】
<S131B>
検索部120は、検索条件310aにネットワーク条件として指定されている2つのネットワークIDそれぞれを検索キーとしてエッジテーブル220を検索し、1つ目のネットワークIDに該当するネットワークデータ220bを第1のネットワークデータ220bとして取得し、2つ目のネットワークIDに該当するネットワークデータ220bを第2のネットワークデータ220bとして取得する。
【0120】
<S132B>
検索部120は、第1エッジカウンタy(変数)に「1」を設定すると共に、第2エッジカウンタz(変数)に「1」を設定する。第1エッジカウンタyは第1のネットワークデータ220bに含まれる複数のエッジレコード220aを区別する添え字として用いられ、第2エッジカウンタzは第2のネットワークデータ220bに含まれる複数のエッジレコード220aを区別する添え字として用いられる。
【0121】
<S133B:ネットワーク間条件判定処理>
検索部120は、S133Ba〜S133Bbにより、第1のネットワークデータ220bと第2のネットワークデータ220bとの間で上流クラスタに共通する遺伝子を有すると共に、下流クラスタに共通する遺伝子を有するエッジのエッジレコード220aを抽出する。
【0122】
<S133Ba>
検索部120は、第1のネットワークデータ220bからエッジレコード220a[y]を選択し、エッジレコード220a[y]により示される上流クラスタID223を検索キーとしてクラスタテーブル230を検索し、該当する複数の遺伝子レコード230aを第1の上流遺伝子レコード群として取得する。さらに、検索部120は、第2のネットワークデータ220bからエッジレコード220a[z]を選択し、エッジレコード220a[z]により示される上流クラスタID223を検索キーとしてクラスタテーブル230を検索し、該当する複数の遺伝子レコード230aを第2の上流遺伝子レコード群として取得する。
次に、検索部120は、第1の上流遺伝子レコード群と第2の上流遺伝子レコード群とを比較し、第1の上流遺伝子レコード群と第2の上流遺伝子レコード群とに共通する遺伝子レコード230aが含まれているか否かを判定する。
第1の上流遺伝子レコード群と第2の上流遺伝子レコード群とに共通する遺伝子レコード230aが含まれている場合、次に、S133Bbが実行される。
また、第1の上流遺伝子レコード群と第2の上流遺伝子レコード群とに共通する遺伝子レコード230aが含まれていない場合、次に、S135Bが実行される。
【0123】
<S133Bb>
検索部120は、エッジレコード220a[y]により示される下流クラスタID224を検索キーとしてクラスタテーブル230を検索し、該当する複数の遺伝子レコード230aを第1の下流遺伝子レコード群として取得する。さらに、検索部120は、エッジレコード220a[z]により示される下流クラスタID224を検索キーとしてクラスタテーブル230を検索し、該当する複数の遺伝子レコード230aを第2の下流遺伝子レコード群として取得する。
次に、検索部120は、第1の下流遺伝子レコード群と第2の下流遺伝子レコード群とを比較し、第1の下流遺伝子レコード群と第2の下流遺伝子レコード群とに共通する遺伝子レコード230aが含まれているか否かを判定する。
第1の下流遺伝子レコード群と第2の下流遺伝子レコード群とに共通する遺伝子レコード230aが含まれている場合、次に、S134Bが実行される。
また、第1の下流遺伝子レコード群と第2の下流遺伝子レコード群とに共通する遺伝子レコード230aが含まれていない場合、次に、S135Bが実行される。
【0124】
<S134B>
検索部120は、検索結果にエッジレコード220a[y]により示されるエッジID222とエッジレコード220a[z]により示されるエッジID222と共通の遺伝子レコード230aの数と共通の遺伝子レコード230aにより示される遺伝子ID232とを設定する。
【0125】
<S135B>
検索部120は、エッジカウンタzと第2のネットワークデータ220bに含まれるエッジレコード220aの数とを大小比較する。
エッジカウンタzが第2のネットワークデータ220bに含まれるエッジレコード220aの数未満である場合、つまり、第2のネットワークデータ220bに含まれるエッジレコード220aのうちエッジレコード220a[y]を比較対象としてネットワーク間条件判定処理(S133B)のされていないエッジレコード220aが有る場合、次に、S136Bが実行される。
エッジカウンタzが第2のネットワークデータ220bに含まれるエッジレコード220aの数以上である場合、つまり、第2のネットワークデータ220bに含まれる全てのエッジレコード220aに対してエッジレコード220a[y]を比較対象としてネットワーク間条件判定処理(S133B)がされた場合、次に、S137Bが実行される。
【0126】
<S136B>
検索部120は、エッジカウンタzに「1」を加える。
その後、検索部120は、エッジレコード220a[z]とエッジレコード220a[y]とに対してネットワーク間条件判定処理(S133B)を実行する。
【0127】
<S137B>
検索部120は、エッジカウンタyと第1のネットワークデータ220bに含まれるエッジレコード220aの数とを大小比較する。
エッジカウンタyが第1のネットワークデータ220bに含まれるエッジレコード220aの数未満である場合、つまり、第1のネットワークデータ220bに含まれるエッジレコード220aのうち第2のネットワークデータ220bに含まれるエッジレコード220aを比較対象としてネットワーク間条件判定処理(S133B)のされていないエッジレコード220aが有る場合、次に、S138Bが実行される。
エッジカウンタyが第1のネットワークデータ220bに含まれるエッジレコード220aの数以上である場合、つまり、第1のネットワークデータ220bに含まれる全てのエッジレコード220aに対して第2のネットワークデータ220bに含まれるエッジレコード220aを比較対象としてネットワーク間条件判定処理(S133B)がされた場合、検索処理[ネットワーク間](S130)は終了する。
【0128】
<S138B>
検索部120は、エッジカウンタyに「1」を加えると共に、エッジカウンタzに「1」を設定する。
その後、検索部120は、エッジレコード220a[y]とエッジレコード220a[z]とに対してネットワーク間条件判定処理(S133B)を実行する。
【0129】
ここで、検索処理[ネットワーク間](S130)で検索結果に設定されるエッジの具体例について説明する。
【0130】
図15は、実施の形態2における遺伝子データ記憶部190に記憶されている情報の関係図である。
例えば、遺伝子データ記憶部190に記憶されているエッジテーブル220およびクラスタテーブル230が図15のような関係を示しているとする。
図15において、「ex_y」は、クラスタCを上流クラスタとし、クラスタCを下流クラスタとするエッジを示す。
ネットワークNでは、エッジとして、e10_11、e10_12、e10_13、e11_13、e12_13およびe13_14が推定されている。
また、ネットワークNでは、e20_21、e20_22、e20_23、e21_23、e22_23およびe22_24が推定されている。
なお、図15において、上流クラスタと下流クラスタを結んだ線(以下、作用線という)の下流クラスタ側の端部に矢印が示されているエッジ(例えば、e10_11)は動特性種別が「促進」であることを示している。また、作用線の下流クラスタ側の端部に作用線と直交する線(以下、停止線という)が示されているエッジ(例えば、e10_12)は動特性種別が「抑制」であることを示している。
これらの情報はエッジテーブル220により示される。
【0131】
クラスタC10とクラスタC20とには遺伝子gが共通して属している。
また、クラスタC11とクラスタC21とには遺伝子g11、遺伝子g12および遺伝子g13が共通して属している。
また、クラスタC13とクラスタC23とには遺伝子g31および遺伝子g33が共通して属している。
また、クラスタC13とクラスタC22とには遺伝子g32が共通して属している。
また、クラスタC14とクラスタC24とには遺伝子g41が共通して属している。
これらの情報はクラスタテーブル230により示される。
【0132】
ネットワークNのエッジe10_11とネットワークNのエッジe20_21とは、上流クラスタに遺伝子gが共通して属していると共に、下流クラスタに遺伝子g11、遺伝子g12および遺伝子g13が共通して属している。
また、ネットワークNのエッジe10_13とネットワークNのエッジe20_23とは、上流クラスタに遺伝子gが共通して属していると共に、下流クラスタに遺伝子g31および遺伝子g33が共通して属している。
また、ネットワークNのエッジe11_13とネットワークNのエッジe21_23とは、上流クラスタに遺伝子g11、遺伝子g12および遺伝子g13が共通して属していると共に、下流クラスタに遺伝子g31および遺伝子g33が共通して属している。
また、ネットワークNのエッジe13_14とネットワークNのエッジe22_24とは、上流クラスタに遺伝子g32が共通して属していると共に、下流クラスタに遺伝子g41が共通して属している。
【0133】
ネットワークNのエッジとネットワークNのエッジとのその他の組み合わせには、上流クラスタに共通の遺伝子が属していると共に、下流クラスタに共通の遺伝子が属しているものは無い。
【0134】
図15に示すようなネットワークNとネットワークNとがネットワーク条件である場合、検索処理[ネットワーク間](S130)において、検索部120は、エッジe10_11とエッジe20_21との組、エッジe10_13とエッジe20_23との組、エッジe11_13とエッジe21_23との組、エッジe13_14とエッジe22_24との組のエッジID222を検索結果に設定する。また、検索部120は、エッジの組毎に、上流クラスタで共通している遺伝子の情報および下流クラスタで共通している遺伝子の情報として、共通している遺伝子の数と共通している遺伝子の遺伝子ID232とを設定する。
【0135】
図16は、実施の形態2における検索結果一覧表320を示す図である。
検索結果出力部130は、検索処理[ネットワーク間](S130)の後、検索結果に基づいて図16に示すような検索結果一覧表320を生成し(S140:結果一覧生成処理)、生成した検索結果一覧表320を表示装置901に表示する(S150:検索結果出力処理)。
【0136】
検索結果一覧表320は、第1のネットワークデータ220bに含まれるエッジレコード220aの情報を示す第1ネットワーク行320a、第2のネットワークデータ220bに含まれるエッジレコード220aの情報を示す第2ネットワーク行320bおよび第1のネットワークのエッジと第2のネットワークのエッジとで共通する遺伝子の数を示す共通遺伝子数行320cの3行を一組として、エッジの検索結果(ネットワーク間)を示す。
【0137】
第1ネットワーク行320aおよび第2ネットワーク行320bは、エッジレコード220aに設定されているネットワークID321、上流クラスタID322、下流クラスタID324、動特性種別326およびZスコア327を示している。
また、第1ネットワーク行320aおよび第2ネットワーク行320bは、上流クラスタID322で識別されるクラスタに属する遺伝子の数(遺伝子数323)および下流クラスタID324で識別されるクラスタに属する遺伝子の数(遺伝子数325)を示す。
【0138】
検索結果出力部130は、検索結果により示されるエッジID222を検索キーとしてエッジテーブル220を検索し、該当する第1のネットワークのエッジレコード220aに設定されている情報を第1ネットワーク行320aに設定し、該当する第2のネットワークのエッジレコード220aに設定されている情報を第2ネットワーク行320bに設定する。
また、検索結果出力部130は、第1のネットワークのエッジレコード220aと第2のネットワークのエッジレコード220aとのそれぞれに対して、エッジレコード220aにより示される上流クラスタID223を検索キーとしてクラスタテーブル230を検索し、該当する遺伝子レコード230aの数を遺伝子数323に設定する。
また、検索結果出力部130は、第1のネットワークのエッジレコード220aと第2のネットワークのエッジレコード220aとのそれぞれに対して、エッジレコード220aにより示される下流クラスタID224を検索キーとしてクラスタテーブル230を検索し、該当する遺伝子レコード230aの数を遺伝子数325に設定する。
【0139】
共通遺伝子数行320cは、第1ネットワーク行320aと第2ネットワーク行320bとの間に位置している。
また、共通遺伝子数行320cは、第1ネットワーク行320aと第2ネットワーク行320bとで上流クラスタID322が示される列に“AND”が表記されている。
また、共通遺伝子数行320cは、第1ネットワーク行320aと第2ネットワーク行320bとで遺伝子数323を示す列に第1のネットワークの上流クラスタと第2のネットワークの上流クラスタとで共通する遺伝子の数が示されている。
また、共通遺伝子数行320cは、第1ネットワーク行320aと第2ネットワーク行320bとで遺伝子数325を示す列に第1のネットワークの下流クラスタと第2のネットワークの下流クラスタとで共通する遺伝子の数が示されている。
【0140】
検索結果出力部130は、検索結果に設定されている共通遺伝子の数を共通遺伝子数行320cに設定する。
【0141】
上記では検索条件310aにネットワーク条件として2つのネットワークIDが指定されている場合について説明したが、ネットワーク条件として指定されるネットワークIDは3つ以上であってもよい。
検索部120は、指定された3つ以上のネットワーク全てにおいて上流クラスタに共通の遺伝子が属すると共に、指定された3つ以上のネットワーク全てにおいて下流クラスタに共通の遺伝子が属するエッジの組み合わせを検索する。
【0142】
また、検索条件310aにはZスコア条件や動特性条件や遺伝子条件が指定されていても良い。
例えば、検索部120は、実施の形態1で説明した検索処理[ネットワーク単位](S130)を実行してZスコア条件、動特性条件および遺伝子条件に合致するエッジレコード220aを抽出し、抽出したエッジレコード220aを対象として検索処理[ネットワーク間](S130)を実行する。
【0143】
実施の形態2では、例えば、以下のような特徴を有する遺伝子相互作用データベース装置100について説明した。
エッジレコード220aは実験単位(ネットワーク)毎に記憶されている。
異なる実験単位(例えば、サンプル1とサンプル2、乾燥ストレス実験と高温ストレス実験)のエッジレコード220aを跨ってエッジを検索することができる。例えば、乾燥ストレス、高温ストレスに共通に見られる相互作用を探すことができる。
【0144】
実施の形態3.
実施の形態3では、クラスタ間の発現相互作用の関係図(ネットワーク図330)を図示する遺伝子相互作用データベース装置100について説明する。
以下、実施の形態1および実施の形態2と異なる事項について主に説明し、説明を省略する事項については実施の形態1または実施の形態2と同様である。
【0145】
図17は、実施の形態3における遺伝子相互作用データベース装置100が表示するネットワーク図330を示す図である。
遺伝子相互作用検索方法の検索結果出力処理(S150)において、ネットワーク図出力部140は、検索処理(S130)で抽出されたエッジレコード220a(以下、抽出エッジレコード220aとする)により示される情報に基づいて、図17に示すようなネットワーク図330を表示装置901に表示する。
【0146】
ネットワーク図330は、ネットワーク毎、且つ、抽出エッジレコード220a毎に、上流クラスタを識別するクラスタID333、上流クラスタを表すノード331、下流クラスタを識別するクラスタID333、下流クラスタを表すノード331および上流クラスタのノード331と下流クラスタのノード331とを接続する作用線332とを示す。
【0147】
また、ネットワーク図330は、上流クラスタのノード331と下流クラスタのノード331とを、接続する作用線332の数が多いほど大きく示し、接続する作用線332の数が少ないほど小さく示している。
【0148】
また、ネットワーク図330は、抽出エッジレコード220aの動特性種別225が「促進(+)」を示す場合、作用線332の下流クラスタ側の先端に下流クラスタ側を指す矢印記号を示し、抽出エッジレコード220aの動特性種別225が「抑制(−)」を示す場合、作用線332の下流遺伝子側の先端に作用線332と直交する停止線を示している。作用線332と停止線とは「T」字状の記号を形成する。
【0149】
また、ネットワーク図330は、抽出エッジレコード220aの動特性種別225が「促進(+)」を示す場合、作用線332を赤色で示し、抽出エッジレコード220aの動特性種別225が「抑制(−)」を示す場合、作用線332を青色で示している。
【0150】
例えば、図17において、作用線332aは、“c30”で識別される上流クラスタに属する遺伝子が“c17”で識別される下流クラスタに属する遺伝子を「促進」するということを示している。なお、作用線332aは赤色で示されている。
また、作用線332bは、“c30”で識別される上流クラスタに属する遺伝子が“c9”で識別される下流クラスタに属する遺伝子を「抑制」するということを示している。なお、作用線332bは青色で示されている。
また、“c30”で識別されるクラスタのノード331aは、作用線332が“c1”と“c3”と“c12”と“c17”と“c9”との5つのクラスタと接続しているため、作用線332が“c30”と“c17”との2つのクラスタと接続しているクラスタ“c9”のノード331cより大きく示されている。
【0151】
図18は、実施の形態3における遺伝子相互作用データベース装置100が表示する検索結果一覧表320とネットワーク図330とを示す図である。
ネットワーク図出力部140は、図18に示すように、検索結果一覧表320(図13、図16参照)と並べてネットワーク図330を表示しても良い。
例えば、検索結果一覧表320に対してマウスのポインタでいずれかのネットワークID321が指定された場合、ネットワーク図出力部140は、検索結果一覧表320に示されているエッジのうちネットワークID321が指定されたものと一致するエッジについてネットワーク図330を生成し、生成したネットワーク図330を検索結果一覧表320に重畳させて表示する。
【0152】
また、ネットワーク図出力部140は、検索条件310aに合致するものとして抽出されたエッジに限らず、指定されたネットワークで推定された全てのエッジについてネットワーク図330を生成し、生成したネットワーク図330を表示しても良い。
また、ネットワークID321は検索条件指定フォーム310で指定されても良い。
【0153】
これにより、遺伝子相互作用データベース装置100は相互作用の関係を視覚的に分かりやすく示すことができる。
【0154】
実施の形態4.
実施の形態4では、発現プロファイル240の発現量波形グラフ340を図示する遺伝子相互作用データベース装置100について説明する。
以下、実施の形態1〜実施の形態3と異なる事項について主に説明し、説明を省略する事項については実施の形態1〜実施の形態3の少なくともいずれかと同様である。
【0155】
図19は、実施の形態4において遺伝子相互作用データベース装置100が表示する検索結果一覧表320と発現量波形グラフ340とを示す図である。
波形グラフ出力部150は、図19に示すように、検索結果一覧表320(図13、図16参照)と並べて発現量波形グラフ340(図10〜図12参照)を表示する。
例えば、検索結果一覧表320に対してマウスのポインタでいずれかの上流クラスタID322や下流クラスタID324を指定された場合、波形グラフ出力部150は、指定されたクラスタIDを検索キーとして遺伝子データ記憶部190を検索し、該当するクラスタの発現プロファイル240を取得し、取得したの発現プロファイル240に基づいて発現量波形グラフ340を生成し、生成した発現量波形グラフ340を検索結果一覧表320に重畳させて表示する。
【0156】
図20は、実施の形態4において遺伝子相互作用データベース装置100が表示するネットワーク図330と発現量波形グラフ340とを示す図である。
波形グラフ出力部150は、図20に示すように、ネットワーク図330と並べて発現量波形グラフ340を表示しても良い。
例えば、ネットワーク図330に対してマウスのポインタでいずれかのノード331を指定された場合、波形グラフ出力部150は、指定されたノード331に対応するクラスタIDを検索キーとして遺伝子データ記憶部190を検索し、該当するクラスタの発現プロファイル240を取得し、取得したの発現プロファイル240に基づいて発現量波形グラフ340を生成し、生成した発現量波形グラフ340をネットワーク図330に重畳させて表示する。
【0157】
これにより、遺伝子相互作用データベース装置100はクラスタの特徴を視覚的に分かりやすく示すことができる。
【図面の簡単な説明】
【0158】
【図1】実施の形態1における遺伝子相互作用データベース装置100の機能構成図。
【図2】実施の形態1における遺伝子相互作用データベース装置100の外観の一例を示す図。
【図3】実施の形態1における遺伝子相互作用データベース装置100のハードウェア資源の一例を示す図。
【図4】実施の形態1における遺伝子相互作用データベース装置100の遺伝子相互作用検索方法を示すフローチャート。
【図5】実施の形態1における検索条件指定フォーム310を示す図。
【図6】実施の形態1におけるネットワークテーブル210を示す図。
【図7】実施の形態1における検索処理[ネットワーク単位](S130)を示すフローチャート。
【図8】実施の形態1におけるエッジテーブル220を示す図。
【図9】実施の形態1におけるクラスタテーブル230を示す図。
【図10】実施の形態1における発現プロファイル240を示す図。
【図11】実施の形態1における発現プロファイル240を示す図。
【図12】実施の形態1における発現プロファイル240を示す図。
【図13】実施の形態1における検索結果一覧表320を示す図。
【図14】実施の形態2における検索処理[ネットワーク間](S130)を示すフローチャート。
【図15】実施の形態2における遺伝子データ記憶部190に記憶されている情報の関係図。
【図16】実施の形態2における検索結果一覧表320を示す図。
【図17】実施の形態3における遺伝子相互作用データベース装置100が表示するネットワーク図330を示す図。
【図18】実施の形態3における遺伝子相互作用データベース装置100が表示する検索結果一覧表320とネットワーク図330とを示す図。
【図19】実施の形態4における遺伝子相互作用データベース装置100が表示する検索結果一覧表320と発現量波形グラフ340とを示す図。
【図20】実施の形態4における遺伝子相互作用データベース装置100が表示するネットワーク図330と発現量波形グラフ340とを示す図。
【符号の説明】
【0159】
100 遺伝子相互作用データベース装置、110 検索条件入力部、120 検索部、130 検索結果出力部、140 ネットワーク図出力部、150 波形グラフ出力部、190 遺伝子データ記憶部、210 ネットワークテーブル、210a ネットワークレコード、211 ネットワークID、212 クラスタ数、213 エッジ数、214 生物種、215 実験種別、216 組織種別、217 サンプル種別、218 時点数、219 データソースID、219a データ番号、220 エッジテーブル、220a エッジレコード、220b ネットワークデータ、221 ネットワークID、222 エッジID、223 上流クラスタID、224 下流クラスタID、225 動特性種別、226 Zスコア、230 クラスタテーブル、230a 遺伝子レコード、231 クラスタID、232 遺伝子ID、240 発現プロファイル、310 検索条件指定フォーム、310a 検索条件、311,311a,311b,311c,311d チェックボックス、312 ネットワーク情報、312a スクロールバー、313,313a,313b オプションボタン、314,314a,314b テキストボックス、315 テキストボックス、316,316a,316b,316c オプションボタン、319a 検索ボタン、319b リセットボタン、320 検索結果一覧表、320a 第1ネットワーク行、320b 第2ネットワーク行、320c 共通遺伝子数行、321 ネットワークID、322 上流クラスタID、323 遺伝子数、324 下流クラスタID、325 遺伝子数、326 動特性種別、327 Zスコア、329 スクロールバー、330 ネットワーク図、331,331a,331b,331c ノード、332,332a,332b 作用線、333 クラスタID、340 発現量波形グラフ、341 個別波形、342 代表波形、901 表示装置、902 キーボード、903 マウス、904 FDD、905 CDD、906 プリンタ装置、907 スキャナ装置、910 システムユニット、911 CPU、912 バス、913 ROM、914 RAM、915 通信ボード、920 磁気ディスク装置、921 OS、922 ウィンドウシステム、923 プログラム群、924 ファイル群、931 電話器、932 ファクシミリ機、940 インターネット、941 ゲートウェイ、942 LAN。

【特許請求の範囲】
【請求項1】
特定の遺伝子群の発現を制御すると推定される上流遺伝子群と、前記上流遺伝子群により発現が制御されると推定される前記特定の遺伝子群である下流遺伝子群との発現の作用関係を示すエッジの情報として、前記上流遺伝子群を識別する上流遺伝子群ID(Identifier)と、前記下流遺伝子群を識別する下流遺伝子群IDと、前記上流遺伝子群により前記下流遺伝子群の発現が制御される統計的有意性を示すZスコアとを含むエッジ情報を複数含むエッジデータを記憶機器を用いて記憶するエッジ記憶部と、
特定の統計的有意性を示すZスコア条件を前記エッジの検索条件として入力機器から入力する検索条件入力部と、
前記検索条件入力部により入力された前記Zスコア条件に合致する前記エッジ情報を、CPU(Central Processing Unit)を用いて、前記エッジ記憶部に記憶されている前記エッジデータから抽出する検索部と、
前記検索部により抽出された前記エッジ情報の前記上流遺伝子群IDと前記下流遺伝子群IDとを含む情報を前記エッジの検索結果として出力機器に出力する検索結果出力部と
を備えたことを特徴とする遺伝子相互作用データベース装置。
【請求項2】
前記エッジ記憶部は、前記上流遺伝子群の制御が前記下流遺伝子群の促進と前記下流遺伝子群の抑制とのいずれであるかを示す動特性を前記エッジ情報に含めて前記エッジデータを記憶し、
前記検索条件入力部は、促進と抑制とのいずれかを示す動特性条件を前記エッジの検索条件に含めて入力し、
前記検索部は、前記検索条件入力部により入力された前記動特性条件に合致する前記エッジ情報を前記エッジ記憶部に記憶されている前記エッジデータから抽出する
ことを特徴とする請求項1記載の遺伝子相互作用データベース装置。
【請求項3】
前記遺伝子相互作用データベース装置は、
前記上流遺伝子群に含まれる遺伝子を識別する遺伝子IDと前記下流遺伝子群に含まれる遺伝子を識別する遺伝子IDとを含む遺伝子群データを記憶機器を用いて記憶する遺伝子群記憶部を備え、
前記検索条件入力部は、特定の遺伝子を識別する遺伝子IDを示す遺伝子条件を前記エッジの検索条件に含めて入力し、
前記検索部は、前記検索条件入力部により入力された前記遺伝子条件により示される前記遺伝子IDで識別される遺伝子を前記上流遺伝子群と前記下流遺伝子群とのいずれかに含む前記エッジ情報を、前記遺伝子群記憶部に記憶されている前記遺伝子群データに基づいて、前記エッジ記憶部に記憶されている前記エッジデータから抽出する
ことを特徴とする請求項1〜請求項2いずれかに記載の遺伝子相互作用データベース装置。
【請求項4】
前記遺伝子相互作用データベース装置は、
前記上流遺伝子群に含まれる遺伝子を識別する遺伝子IDと前記下流遺伝子群に含まれる遺伝子を識別する遺伝子IDとを含む遺伝子群データを記憶機器を用いて記憶する遺伝子群記憶部を備え、
前記エッジ記憶部は、特定の観測条件で観測された複数の遺伝子群の発現量に基づいて推定された複数の前記エッジを示す複数の前記エッジ情報を、ネットワークIDを付してネットワークデータとして、複数含めて前記エッジデータを記憶し、
前記検索条件入力部は、複数のネットワークIDを示すネットワーク条件を前記エッジの検索条件に含めて入力し、
前記検索部は、前記検索条件入力部により入力された前記ネットワーク条件により示される複数のネットワークIDに対応する複数のネットワークデータを前記エッジ記憶部に記憶されている前記エッジデータから複数の指定ネットワークとして特定し、複数の指定ネットワーク全てにおいて前記上流遺伝子群に共通の遺伝子が含まれると共に、複数の指定ネットワーク全てにおいて前記下流遺伝子群に共通の遺伝子が含まれる複数の指定ネットワークそれぞれのエッジ情報を、前記遺伝子群記憶部に記憶されている前記遺伝子群データに基づいて、複数の指定ネットワークそれぞれから抽出する
ことを特徴とする請求項1〜請求項3いずれかに記載の遺伝子相互作用データベース装置。
【請求項5】
前記検索結果出力部は、
前記検索部により複数の指定ネットワークそれぞれから抽出されたエッジ情報毎に、前記ネットワークIDと前記上流遺伝子群IDと前記下流遺伝子群IDとを含めた行を出力すると共に、
複数の指定ネットワーク全てにおいて前記上流遺伝子群に含まれる前記共通の遺伝子の数と、複数の指定ネットワーク全てにおいて前記下流遺伝子群に含まれる前記共通の遺伝子の数とを含めた行を出力する
ことを特徴とする請求項4記載の遺伝子相互作用データベース装置。
【請求項6】
特定の遺伝子群の発現を制御すると推定される上流遺伝子群と、前記上流遺伝子群により発現が制御されると推定される前記特定の遺伝子群である下流遺伝子群との発現の作用関係を示すエッジの情報として、前記上流遺伝子群を識別する上流遺伝子群ID(Identifier)と、前記下流遺伝子群を識別する下流遺伝子群IDと、前記上流遺伝子群の制御が前記下流遺伝子群の促進と前記下流遺伝子群の抑制とのいずれであるかを示す動特性とを含むエッジ情報を複数含むエッジデータを記憶機器を用いて記憶するエッジ記憶部と、
促進と抑制とのいずれかを示す動特性条件を前記エッジの検索条件として入力機器から入力する検索条件入力部と、
前記検索条件入力部により入力された前記動特性条件に合致する前記エッジ情報を、CPU(Central Processing Unit)を用いて、前記エッジ記憶部に記憶されている前記エッジデータから抽出する検索部と、
前記検索部により抽出された前記エッジ情報の前記上流遺伝子群IDと前記下流遺伝子群IDとを含む情報を前記エッジの検索結果として出力機器に出力する検索結果出力部と
を備えたことを特徴とする遺伝子相互作用データベース装置。
【請求項7】
特定の遺伝子群の発現を制御すると推定される上流遺伝子群と、前記上流遺伝子群により発現が制御されると推定される前記特定の遺伝子群である下流遺伝子群との発現の作用関係を示すエッジの情報として、前記上流遺伝子群を識別する上流遺伝子群ID(Identifier)と、前記下流遺伝子群を識別する下流遺伝子群IDとを含むエッジ情報を複数含むエッジデータを記憶機器を用いて記憶するエッジ記憶部と、
前記上流遺伝子群に含まれる遺伝子を識別する遺伝子IDと前記下流遺伝子群に含まれる遺伝子を識別する遺伝子IDとを含む遺伝子群データを記憶機器を用いて記憶する遺伝子群記憶部と、
特定の遺伝子を識別する遺伝子IDを示す遺伝子条件を前記エッジの検索条件として入力機器から入力する検索条件入力部と、
前記検索条件入力部により入力された前記遺伝子条件により示される前記遺伝子IDで識別される遺伝子を前記上流遺伝子群と前記下流遺伝子群とのいずれかに含む前記エッジ情報を、前記遺伝子群記憶部に記憶されている前記遺伝子群データに基づいて、前記エッジ記憶部に記憶されている前記エッジデータからCPU(Central Processing Unit)を用いて抽出する検索部と、
前記検索部により抽出された前記エッジ情報の前記上流遺伝子群IDと前記下流遺伝子群IDとを含む情報を前記エッジの検索結果として出力機器に出力する検索結果出力部と
を備えたことを特徴とする遺伝子相互作用データベース装置。
【請求項8】
特定の遺伝子群の発現を制御すると推定される上流遺伝子群と、前記上流遺伝子群により発現が制御されると推定される前記特定の遺伝子群である下流遺伝子群との発現の作用関係を示すエッジの情報として、前記上流遺伝子群を識別する上流遺伝子群ID(Identifier)と、前記下流遺伝子群を識別する下流遺伝子群IDとを含むエッジ情報を複数含むエッジデータであり、特定の観測条件で観測された複数の遺伝子群の発現量に基づいて推定された複数の前記エッジを示す複数の前記エッジ情報を、ネットワークIDを付してネットワークデータとして、複数含むエッジデータを記憶機器を用いて記憶するエッジ記憶部と、
前記上流遺伝子群に含まれる遺伝子を識別する遺伝子IDと前記下流遺伝子群に含まれる遺伝子を識別する遺伝子IDとを含む遺伝子群データを記憶機器を用いて記憶する遺伝子群記憶部と、
複数のネットワークIDを示すネットワーク条件を前記エッジの検索条件として入力機器から入力する検索条件入力部と、
前記検索条件入力部により入力された前記ネットワーク条件により示される複数のネットワークIDに対応する複数のネットワークデータを前記エッジ記憶部に記憶されている前記エッジデータから複数の指定ネットワークとして特定し、複数の指定ネットワーク全てにおいて前記上流遺伝子群に共通の遺伝子が含まれると共に、複数の指定ネットワーク全てにおいて前記下流遺伝子群に共通の遺伝子が含まれる複数の指定ネットワークそれぞれのエッジ情報を、前記遺伝子群記憶部に記憶されている前記遺伝子群データに基づいて、CPU(Central Processing Unit)を用いて抽出する検索部と、
前記検索部により抽出された前記エッジ情報の前記上流遺伝子群IDと前記下流遺伝子群IDとを含む情報を前記エッジの検索結果として出力機器に出力する検索結果出力部と
を備えたことを特徴とする遺伝子相互作用データベース装置。
【請求項9】
前記検索結果出力部は、
前記検索部により抽出された前記エッジ情報を抽出エッジ情報として、
前記抽出エッジ情報の前記上流遺伝子群IDと、
前記抽出エッジ情報の前記上流遺伝子群IDで識別される前記上流遺伝子群を表す遺伝子群記号と、
前記抽出エッジ情報の前記下流遺伝子群IDと、
前記抽出エッジ情報の前記下流遺伝子群IDで識別される前記下流遺伝子群を表す遺伝子群記号と、
作用線として前記上流遺伝子群を表す前記遺伝子群記号と前記下流遺伝子群を表す前記遺伝子群記号とを接続する線と
を表示することを特徴とする請求項1〜請求項8いずれかに記載の遺伝子相互作用データベース装置。
【請求項10】
前記検索結果出力部は、
前記上流遺伝子群を表す前記遺伝子群記号と前記下流遺伝子群を表す前記遺伝子群記号とのそれぞれをそれぞれの遺伝子群記号に接続する前記作用線の数に応じた大きさで表示する
ことを特徴とする請求項9記載の遺伝子相互作用データベース装置。
【請求項11】
前記検索結果出力部は、
前記上流遺伝子群の制御が前記下流遺伝子群の促進である場合と前記上流遺伝子群の制御が前記下流遺伝子群の抑制である場合とで異なる記号を前記作用線の前記下流遺伝子群側に表示する
ことを特徴とする請求項9〜請求項10いずれかに記載の遺伝子相互作用データベース装置。
【請求項12】
前記検索結果出力部は、
前記上流遺伝子群の制御が前記下流遺伝子群の促進である場合と前記上流遺伝子群の制御が前記下流遺伝子群の抑制である場合とで異なる色を用いて前記作用線を表示する
ことを特徴とする請求項9〜請求項11いずれかに記載の遺伝子相互作用データベース装置。
【請求項13】
前記遺伝子相互作用データベース装置は、
前記上流遺伝子群に含まれる遺伝子と前記下流遺伝子群に含まれる遺伝子との発現量を時系列に示す発現プロファイルを記憶機器を用いて記憶するプロファイル記憶部を備え、
前記検索結果出力部は、前記検索部により抽出された前記エッジ情報を抽出エッジ情報として、前記抽出エッジ情報の前記上流遺伝子群IDで識別される前記上流遺伝子群に含まれる遺伝子の前記発現プロファイルと前記抽出エッジ情報の前記下流遺伝子群IDで識別される前記下流遺伝子群に含まれる遺伝子の前記発現プロファイルとを前記プロファイル記憶部から取得し、取得した前記発現プロファイルに基づいて時系列に遺伝子の発現量を表すグラフを表示する
ことを特徴とする請求項1〜請求項12いずれかに記載の遺伝子相互作用データベース装置。
【請求項14】
特定の遺伝子群の発現を制御すると推定される上流遺伝子群と、前記上流遺伝子群により発現が制御されると推定される前記特定の遺伝子群である下流遺伝子群との発現の作用関係を示すエッジの情報として、前記上流遺伝子群を識別する上流遺伝子群ID(Identifier)と、前記下流遺伝子群を識別する下流遺伝子群IDと、前記上流遺伝子群により前記下流遺伝子群の発現が制御される統計的有意性を示すZスコアとを含むエッジ情報を複数含むエッジデータを記憶機器を用いて記憶するエッジ記憶部を使用させ、
検索条件入力部が、特定の統計的有意性を示すZスコア条件を前記エッジの検索条件として入力機器から入力する検索条件入力処理と、
検索部が、前記検索条件入力部により入力された前記Zスコア条件に合致する前記エッジ情報を、CPU(Central Processing Unit)を用いて、前記エッジ記憶部に記憶されている前記エッジデータから抽出する検索処理と、
検索結果出力部が、前記検索部により抽出された前記エッジ情報の前記上流遺伝子群IDと前記下流遺伝子群IDとを含む情報を前記エッジの検索結果として出力機器に出力する検索結果出力処理と
をコンピュータに実行させる遺伝子相互作用検索プログラム。
【請求項15】
前記エッジ記憶部は、前記上流遺伝子群の制御が前記下流遺伝子群の促進と前記下流遺伝子群の抑制とのいずれであるかを示す動特性を前記エッジ情報に含めて前記エッジデータを記憶し、
前記検索条件入力部は、促進と抑制とのいずれかを示す動特性条件を前記エッジの検索条件に含めて入力し、
前記検索部は、前記検索条件入力部により入力された前記動特性条件に合致する前記エッジ情報を前記エッジ記憶部に記憶されている前記エッジデータから抽出する
ことを特徴とする請求項14記載の遺伝子相互作用検索プログラム。
【請求項16】
遺伝子前記上流遺伝子群に含まれる遺伝子を識別する遺伝子IDと前記下流遺伝子群に含まれる遺伝子を識別する遺伝子IDとを含む遺伝子群データを記憶機器を用いて記憶する遺伝子群記憶部を使用させ、
前記検索条件入力部は、特定の遺伝子を識別する遺伝子IDを示す遺伝子条件を前記エッジの検索条件に含めて入力し、
前記検索部は、前記検索条件入力部により入力された前記遺伝子条件により示される前記遺伝子IDで識別される遺伝子を前記上流遺伝子群と前記下流遺伝子群とのいずれかに含む前記エッジ情報を、前記遺伝子群記憶部に記憶されている前記遺伝子群データに基づいて、前記エッジ記憶部に記憶されている前記エッジデータから抽出する
ことを特徴とする請求項14〜請求項15いずれかに記載の遺伝子相互作用検索プログラム。
【請求項17】
前記上流遺伝子群に含まれる遺伝子を識別する遺伝子IDと前記下流遺伝子群に含まれる遺伝子を識別する遺伝子IDとを含む遺伝子群データを記憶機器を用いて記憶する遺伝子群記憶部を使用させ、
前記エッジ記憶部は、特定の観測条件で観測された複数の遺伝子群の発現量に基づいて推定された複数の前記エッジを示す複数の前記エッジ情報を、ネットワークIDを付してネットワークデータとして、複数含めて前記エッジデータを記憶し、
前記検索条件入力部は、複数のネットワークIDを示すネットワーク条件を前記エッジの検索条件に含めて入力し、
前記検索部は、前記検索条件入力部により入力された前記ネットワーク条件により示される複数のネットワークIDに対応する複数のネットワークデータを前記エッジ記憶部に記憶されている前記エッジデータから複数の指定ネットワークとして特定し、複数の指定ネットワーク全てにおいて前記上流遺伝子群に共通の遺伝子が含まれると共に、複数の指定ネットワーク全てにおいて前記下流遺伝子群に共通の遺伝子が含まれる複数の指定ネットワークそれぞれのエッジ情報を、前記遺伝子群記憶部に記憶されている前記遺伝子群データに基づいて、複数の指定ネットワークそれぞれから抽出する
ことを特徴とする請求項14〜請求項16いずれかに記載の遺伝子相互作用検索プログラム。
【請求項18】
前記検索結果出力部は、
前記検索部により複数の指定ネットワークそれぞれから抽出されたエッジ情報毎に、前記ネットワークIDと前記上流遺伝子群IDと前記下流遺伝子群IDとを含めた行を出力すると共に、
複数の指定ネットワーク全てにおいて前記上流遺伝子群に含まれる前記共通の遺伝子の数と、複数の指定ネットワーク全てにおいて前記下流遺伝子群に含まれる前記共通の遺伝子の数とを含めた行を出力する
ことを特徴とする請求項17記載の遺伝子相互作用検索プログラム。
【請求項19】
特定の遺伝子群の発現を制御すると推定される上流遺伝子群と、前記上流遺伝子群により発現が制御されると推定される前記特定の遺伝子群である下流遺伝子群との発現の作用関係を示すエッジの情報として、前記上流遺伝子群を識別する上流遺伝子群ID(Identifier)と、前記下流遺伝子群を識別する下流遺伝子群IDと、前記上流遺伝子群の制御が前記下流遺伝子群の促進と前記下流遺伝子群の抑制とのいずれであるかを示す動特性とを含むエッジ情報を複数含むエッジデータを記憶機器を用いて記憶するエッジ記憶部を使用させ、
検索条件入力部が、促進と抑制とのいずれかを示す動特性条件を前記エッジの検索条件として入力機器から入力する検索条件入力処理と、
検索部が、前記検索条件入力部により入力された前記動特性条件に合致する前記エッジ情報を、CPU(Central Processing Unit)を用いて、前記エッジ記憶部に記憶されている前記エッジデータから抽出する検索処理と、
検索結果出力部が、前記検索部により抽出された前記エッジ情報の前記上流遺伝子群IDと前記下流遺伝子群IDとを含む情報を前記エッジの検索結果として出力機器に出力する検索結果出力処理と
をコンピュータに実行させる遺伝子相互作用検索プログラム。
【請求項20】
特定の遺伝子群の発現を制御すると推定される上流遺伝子群と、前記上流遺伝子群により発現が制御されると推定される前記特定の遺伝子群である下流遺伝子群との発現の作用関係を示すエッジの情報として、前記上流遺伝子群を識別する上流遺伝子群ID(Identifier)と、前記下流遺伝子群を識別する下流遺伝子群IDとを含むエッジ情報を複数含むエッジデータを記憶機器を用いて記憶するエッジ記憶部を使用させ、
前記上流遺伝子群に含まれる遺伝子を識別する遺伝子IDと前記下流遺伝子群に含まれる遺伝子を識別する遺伝子IDとを含む遺伝子群データを記憶機器を用いて記憶する遺伝子群記憶部を使用させ、
検索条件入力部が、特定の遺伝子を識別する遺伝子IDを示す遺伝子条件を前記エッジの検索条件として入力機器から入力する検索条件入力処理と、
検索部が、前記検索条件入力部により入力された前記遺伝子条件により示される前記遺伝子IDで識別される遺伝子を前記上流遺伝子群と前記下流遺伝子群とのいずれかに含む前記エッジ情報を、前記遺伝子群記憶部に記憶されている前記遺伝子群データに基づいて、前記エッジ記憶部に記憶されている前記エッジデータからCPU(Central Processing Unit)を用いて抽出する検索処理と、
検索結果出力部が、前記検索部により抽出された前記エッジ情報の前記上流遺伝子群IDと前記下流遺伝子群IDとを含む情報を前記エッジの検索結果として出力機器に出力する検索結果出力処理と
をコンピュータに実行させる遺伝子相互作用検索プログラム。
【請求項21】
特定の遺伝子群の発現を制御すると推定される上流遺伝子群と、前記上流遺伝子群により発現が制御されると推定される前記特定の遺伝子群である下流遺伝子群との発現の作用関係を示すエッジの情報として、前記上流遺伝子群を識別する上流遺伝子群ID(Identifier)と、前記下流遺伝子群を識別する下流遺伝子群IDとを含むエッジ情報を複数含むエッジデータであり、特定の観測条件で観測された複数の遺伝子群の発現量に基づいて推定された複数の前記エッジを示す複数の前記エッジ情報を、ネットワークIDを付してネットワークデータとして、複数含むエッジデータを記憶機器を用いて記憶するエッジ記憶部を使用させ、
前記上流遺伝子群に含まれる遺伝子を識別する遺伝子IDと前記下流遺伝子群に含まれる遺伝子を識別する遺伝子IDとを含む遺伝子群データを記憶機器を用いて記憶する遺伝子群記憶部を使用させ、
検索条件入力部が、複数のネットワークIDを示すネットワーク条件を前記エッジの検索条件として入力機器から入力する検索条件入力処理と、
検索部が、前記検索条件入力部により入力された前記ネットワーク条件により示される複数のネットワークIDに対応する複数のネットワークデータを前記エッジ記憶部に記憶されている前記エッジデータから複数の指定ネットワークとして特定し、複数の指定ネットワーク全てにおいて前記上流遺伝子群に共通の遺伝子が含まれると共に、複数の指定ネットワーク全てにおいて前記下流遺伝子群に共通の遺伝子が含まれる複数の指定ネットワークそれぞれのエッジ情報を、前記遺伝子群記憶部に記憶されている前記遺伝子群データに基づいて、CPU(Central Processing Unit)を用いて抽出する検索処理と、
検索結果出力部が、前記検索部により抽出された前記エッジ情報の前記上流遺伝子群IDと前記下流遺伝子群IDとを含む情報を前記エッジの検索結果として出力機器に出力する検索結果出力処理と
をコンピュータに実行させる遺伝子相互作用検索プログラム。
【請求項22】
前記検索結果出力部は、
前記検索部により抽出された前記エッジ情報を抽出エッジ情報として、
前記抽出エッジ情報の前記上流遺伝子群IDと、
前記抽出エッジ情報の前記上流遺伝子群IDで識別される前記上流遺伝子群を表す遺伝子群記号と、
前記抽出エッジ情報の前記下流遺伝子群IDと、
前記抽出エッジ情報の前記下流遺伝子群IDで識別される前記下流遺伝子群を表す遺伝子群記号と、
作用線として前記上流遺伝子群を表す前記遺伝子群記号と前記下流遺伝子群を表す前記遺伝子群記号とを接続する線と
を表示することを特徴とする請求項14〜請求項21いずれかに記載の遺伝子相互作用検索プログラム。
【請求項23】
前記検索結果出力部は、
前記上流遺伝子群を表す前記遺伝子群記号と前記下流遺伝子群を表す前記遺伝子群記号とのそれぞれをそれぞれの遺伝子群記号に接続する前記作用線の数に応じた大きさで表示する
ことを特徴とする請求項22記載の遺伝子相互作用検索プログラム。
【請求項24】
前記検索結果出力部は、
前記上流遺伝子群の制御が前記下流遺伝子群の促進である場合と前記上流遺伝子群の制御が前記下流遺伝子群の抑制である場合とで異なる記号を前記作用線の前記下流遺伝子群側に表示する
ことを特徴とする請求項22〜請求項23いずれかに記載の遺伝子相互作用検索プログラム。
【請求項25】
前記検索結果出力部は、
前記上流遺伝子群の制御が前記下流遺伝子群の促進である場合と前記上流遺伝子群の制御が前記下流遺伝子群の抑制である場合とで異なる色を用いて前記作用線を表示する
ことを特徴とする請求項22〜請求項24いずれかに記載の遺伝子相互作用検索プログラム。
【請求項26】
前記上流遺伝子群に含まれる遺伝子と前記下流遺伝子群に含まれる遺伝子との発現量を時系列に示す発現プロファイルを記憶機器を用いて記憶するプロファイル記憶部を使用させ、
前記検索結果出力部は、前記検索部により抽出された前記エッジ情報を抽出エッジ情報として、前記抽出エッジ情報の前記上流遺伝子群IDで識別される前記上流遺伝子群に含まれる遺伝子の前記発現プロファイルと前記抽出エッジ情報の前記下流遺伝子群IDで識別される前記下流遺伝子群に含まれる遺伝子の前記発現プロファイルとを前記プロファイル記憶部から取得し、取得した前記発現プロファイルに基づいて時系列に遺伝子の発現量を表すグラフを表示する
ことを特徴とする請求項14〜請求項25いずれかに記載の遺伝子相互作用検索プログラム。
【請求項27】
特定の遺伝子群の発現を制御すると推定される上流遺伝子群と、前記上流遺伝子群により発現が制御されると推定される前記特定の遺伝子群である下流遺伝子群との発現の作用関係を示すエッジの情報として、前記上流遺伝子群を識別する上流遺伝子群ID(Identifier)と、前記下流遺伝子群を識別する下流遺伝子群IDと、前記上流遺伝子群により前記下流遺伝子群の発現が制御される統計的有意性を示すZスコアとを含むエッジ情報を複数含むエッジデータを記憶機器を用いて記憶するエッジ記憶部を使用し、
検索条件入力部が、特定の統計的有意性を示すZスコア条件を前記エッジの検索条件として入力機器から入力する検索条件入力処理を行い、
検索部が、前記検索条件入力部により入力された前記Zスコア条件に合致する前記エッジ情報を、CPU(Central Processing Unit)を用いて、前記エッジ記憶部に記憶されている前記エッジデータから抽出する検索処理を行い、
検索結果出力部が、前記検索部により抽出された前記エッジ情報の前記上流遺伝子群IDと前記下流遺伝子群IDとを含む情報を前記エッジの検索結果として出力機器に出力する検索結果出力処理を行う
ことを特徴とする遺伝子相互作用検索方法。
【請求項28】
特定の遺伝子群の発現を制御すると推定される上流遺伝子群と、前記上流遺伝子群により発現が制御されると推定される前記特定の遺伝子群である下流遺伝子群との発現の作用関係を示すエッジの情報として、前記上流遺伝子群を識別する上流遺伝子群ID(Identifier)と、前記下流遺伝子群を識別する下流遺伝子群IDと、前記上流遺伝子群の制御が前記下流遺伝子群の促進と前記下流遺伝子群の抑制とのいずれであるかを示す動特性とを含むエッジ情報を複数含むエッジデータを記憶機器を用いて記憶するエッジ記憶部を使用し、
検索条件入力部が、促進と抑制とのいずれかを示す動特性条件を前記エッジの検索条件として入力機器から入力する検索条件入力処理を行い、
検索部が、前記検索条件入力部により入力された前記動特性条件に合致する前記エッジ情報を、CPU(Central Processing Unit)を用いて、前記エッジ記憶部に記憶されている前記エッジデータから抽出する検索処理を行い、
検索結果出力部が、前記検索部により抽出された前記エッジ情報の前記上流遺伝子群IDと前記下流遺伝子群IDとを含む情報を前記エッジの検索結果として出力機器に出力する検索結果出力処理を行う
ことを特徴とする遺伝子相互作用検索方法。
【請求項29】
特定の遺伝子群の発現を制御すると推定される上流遺伝子群と、前記上流遺伝子群により発現が制御されると推定される前記特定の遺伝子群である下流遺伝子群との発現の作用関係を示すエッジの情報として、前記上流遺伝子群を識別する上流遺伝子群ID(Identifier)と、前記下流遺伝子群を識別する下流遺伝子群IDとを含むエッジ情報を複数含むエッジデータを記憶機器を用いて記憶するエッジ記憶部を使用し、
前記上流遺伝子群に含まれる遺伝子を識別する遺伝子IDと前記下流遺伝子群に含まれる遺伝子を識別する遺伝子IDとを含む遺伝子群データを記憶機器を用いて記憶する遺伝子群記憶部を使用し、
検索条件入力部が、特定の遺伝子を識別する遺伝子IDを示す遺伝子条件を前記エッジの検索条件として入力機器から入力する検索条件入力処理を行い、
検索部が、前記検索条件入力部により入力された前記遺伝子条件により示される前記遺伝子IDで識別される遺伝子を前記上流遺伝子群と前記下流遺伝子群とのいずれかに含む前記エッジ情報を、前記遺伝子群記憶部に記憶されている前記遺伝子群データに基づいて、前記エッジ記憶部に記憶されている前記エッジデータからCPU(Central Processing Unit)を用いて抽出する検索処理を行い、
検索結果出力部が、前記検索部により抽出された前記エッジ情報の前記上流遺伝子群IDと前記下流遺伝子群IDとを含む情報を前記エッジの検索結果として出力機器に出力する検索結果出力処理を行う
ことを特徴とする遺伝子相互作用検索方法。
【請求項30】
特定の遺伝子群の発現を制御すると推定される上流遺伝子群と、前記上流遺伝子群により発現が制御されると推定される前記特定の遺伝子群である下流遺伝子群との発現の作用関係を示すエッジの情報として、前記上流遺伝子群を識別する上流遺伝子群ID(Identifier)と、前記下流遺伝子群を識別する下流遺伝子群IDとを含むエッジ情報を複数含むエッジデータであり、特定の観測条件で観測された複数の遺伝子群の発現量に基づいて推定された複数の前記エッジを示す複数の前記エッジ情報を、ネットワークIDを付してネットワークデータとして、複数含むエッジデータを記憶機器を用いて記憶するエッジ記憶部を使用し、
前記上流遺伝子群に含まれる遺伝子を識別する遺伝子IDと前記下流遺伝子群に含まれる遺伝子を識別する遺伝子IDとを含む遺伝子群データを記憶機器を用いて記憶する遺伝子群記憶部を使用し、
検索部が、検索条件入力部が、複数のネットワークIDを示すネットワーク条件を前記エッジの検索条件として入力機器から入力する検索条件入力を行い、
前記検索条件入力部により入力された前記ネットワーク条件により示される複数のネットワークIDに対応する複数のネットワークデータを前記エッジ記憶部に記憶されている前記エッジデータから複数の指定ネットワークとして特定し、複数の指定ネットワーク全てにおいて前記上流遺伝子群に共通の遺伝子が含まれると共に、複数の指定ネットワーク全てにおいて前記下流遺伝子群に共通の遺伝子が含まれる複数の指定ネットワークそれぞれのエッジ情報を、前記遺伝子群記憶部に記憶されている前記遺伝子群データに基づいて、CPU(Central Processing Unit)を用いて抽出する検索処理を行い、
検索結果出力部が、前記検索部により抽出された前記エッジ情報の前記上流遺伝子群IDと前記下流遺伝子群IDとを含む情報を前記エッジの検索結果として出力機器に出力する検索結果出力処理を行う
ことを特徴とする遺伝子相互作用検索方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate


【公開番号】特開2009−169831(P2009−169831A)
【公開日】平成21年7月30日(2009.7.30)
【国際特許分類】
【出願番号】特願2008−9308(P2008−9308)
【出願日】平成20年1月18日(2008.1.18)
【出願人】(591102095)三菱スペース・ソフトウエア株式会社 (148)
【Fターム(参考)】