説明

シグナルパスウェイネットワークの特性を推定する方法およびコンピュータプログラム

【課題】パスウェイネットワークの特性を効率よく推定できるようにする。
【解決手段】この方法は、パスウェイネットワークを構成する反応物と、反応物間の相互作用とをそれぞれノードおよびエッジとするグラフ表現を準備するステップ162と、シグナル伝達を、反応物間の相互作用に所定のパラメータ値を割当ててシミュレートした結果を検証して、所定の条件を充足する相互作用に対応するエッジのみを選択的に残すようにグラフを更新するステップ164、166と、ステップ164、166を、各パラメータに複数通りの値を設定して繰返し実行し、各パラメータの各値に対して、当該パラメータに対応するエッジであってかつ更新するステップの結果、グラフ中に残ったエッジの数の分布を推定するステップ168、172、174と、推定するステップで推定されたエッジの数の分布に基づいて、パラメータの値の範囲を推定するステップ176とを含む。

【発明の詳細な説明】
【技術分野】
【0001】
この発明は細胞内におけるシグナル伝達のメカニズムを効率的に推定するための方法に関し、特に、細胞内におけるシグナル伝達のパスウェイネットワークの各経路において、クロストークが存在する場合のシグナル伝達の特性を推定するための方法に関する。
【背景技術】
【0002】
生物細胞には、外部から与えられた信号を細胞核またはその他の細胞内要素に伝達するためのシグナル伝達の仕組みが備えられている。シグナル伝達は、酵素によるたんぱく質のリン化および脱リン化による活性化・不活性化に伴う連鎖的な生化学変化によって行なわれる。図1に、その中で低分子量GTPase(GTP結合たんぱく質)であるRhoの活性化によるMLC(ミオシン軽鎖)のリン酸化を伴うシグナル伝達の例を示す。
【0003】
図1を参照して、外部シグナルである特定の活性化因子により活性化されたRho22は、酵素であるRhoキナーゼ20と結合して、これを活性化させる(Rhoキナーゼ24で示す。)。活性化されたRhoキナーゼ24はMLC26をリン酸化し、リン酸化されたMLC30が形成される。このようにしてMLCのリン酸化レベルが上昇すると、細胞内にストレスファイバが形成されたりする結果になると考えられている。
【0004】
このように、シグナル伝達にはたんぱく質のリン酸化および脱リン酸化が大きな役割を果たしている。ところで、あるたんぱく質と別のたんぱく質との間でのこのシグナル伝達の経路(パスウェイ)において、これらたんぱく質の間にどのような生化学変化上の関係があるかを考える。そのために、図2に、二種のたんぱく質(i,j)のリン酸化(PiおよびPj)、および脱リン酸化(dPiおよびdPj)の間での相互関係を示す。
【0005】
図2を参照して、たんぱく質iのリン酸化40およびたんぱく質jのリン酸化42、たんぱく質iのリン酸化40およびたんぱく質jの脱リン酸化46、たんぱく質iの脱リン酸化44およびたんぱく質jのリン酸化42、ならびにたんぱく質iの脱リン酸化44およびたんぱく質jの脱リン酸化46の間には、それぞれ生化学変化により及ぼされる相互関係50、52、54、および56が存在する。これら4個の相互関係50、52、54および56はいずれも二方向の関係である。したがって、たんぱく質iとたんぱく質jとの間の一つのパスウェイは、4×2=8=23個の関係によって定まる。
【0006】
実際の細胞内では、シグナル伝達に関係するたんぱく質の種類は2種類ではなくはるかに多い。その場合、パスウェイを形成するたんぱく質相互の関係は非常に複雑になる。例えば、上記したRhoに関連するRhoファミリと、MLCおよびMBS(ミオシン結合サブユニット)との3種のたんぱく質の間での関係を図示すると図3のとおりとなる。
【0007】
図3を参照して、Rho60およびMLC62、MLC62およびMBS64、ならびにMBS64およびRho60の間には、それぞれパスウェイ70、74および72が考えられる。これらパスウェイ70、74および72の各々について、図2に示すとおり、生化学変化と考慮すべき8=23個の相互関係がある。したがって、図3に示す3種のたんぱく質が関係するパスウェイネットワークでは、23×23×23=29個、すなわち512個の相互関係が存在する。
【発明の開示】
【発明が解決しようとする課題】
【0008】
上述したとおり、一つのシグナルパスウェイについても考慮すべき相互関係が多いのに加え、パスウェイには他の反応からの影響(クロストーク)も存在する。図3に示すRho60、MLC62、およびMBS64の各々に対して23通りのクロストークを考えると、図3のパスウェイネットワークで考慮すべき関係は29×29=218個、すなわち262,144となり、非常に複雑なものとなる。
【0009】
実際のパスウェイネットワークでは、さらに多数のシグナルパスウェイが関係し、考慮しなければならない要素がさらに多く、さらに複雑になる。図4を参照して、図2に示したようなシグナルパスウェイを一つのモチーフで表すものとする。すなわち、あるたんぱく質120のリン酸化124が酵素などの要因122により生ずるものとし、脱リン酸化128が別の要因126により生じるものとする。すると、一つのモチーフにつき前述したとおり、考慮すべき関係が29通り存在する。実際のパスウェイネットワーク90が、複数個(n個とする。)のモチーフ100、102、104,…,108を含むものとすれば、考慮すべき関係は23nとなる。このパスウェイネットワークにおいて、各モチーフにおける生化学変化の間の関係を推定することはNP完全問題であって、解くことができるようなアルゴリズムが得られたとしても、その実行には莫大な時間がかかり事実上不可能である。一方で、例えば生体においてこうしたシグナル伝達の仕組みを用いて、ある種のたんぱく質の生成を防止したりすることができる薬剤などを開発しようとする場合、パスウェイネットワークの特性がどのようなものであるかを短時間に解析することが必要となる。
【0010】
しかし、従来はそのようにパスウェイネットワークの特性を効率よく推定する方法はなく、したがってシグナル伝達の仕組みを利用した薬剤を効率よく得ることはできなかった。
【0011】
それゆえに本発明の目的は、パスウェイネットワークの特性を効率よく推定することができる方法を提供することである。
【課題を解決するための手段】
【0012】
本発明の第1の局面に係る方法は、シグナルパスウェイネットワークの特性を推定する方法であって、パスウェイネットワークを構成する反応物と、反応物間の相互作用とをそれぞれノードおよびエッジとするグラフ表現を準備するステップと、パスウェイネットワークにおけるシグナル伝達を、反応物間の相互作用に所定のパラメータ値を割当ててシミュレートした結果を検証して、所定の条件を充足する相互作用に対応するエッジのみを選択的に残すようにグラフを更新するステップと、グラフを更新するステップを、各パラメータに複数通りの値を設定して繰返し実行し、各パラメータの各値に対して、当該パラメータに対応するエッジであってかつ更新するステップの結果グラフ中に残ったエッジの数の分布を推定するステップと、推定するステップで推定されたエッジの数の分布に基づいて、パラメータの値の範囲を推定するステップとを含む。
【0013】
シグナルパスウェイネットワークの特性を推定するにあたり、最初に当該シグナルパスウェイネットワークのグラフ表現を準備する。各エッジに、反応物間の相互作用に対するパラメータを割当て、各パラメータにある値を設定してシグナル伝達をシミュレートし、所定の条件を充足する相互作用に対応するエッジのみを残すようにグラフを残す。この操作を、パラメータの値を変えて複数回行なう。その結果、各パラメータごとに、各値に対しグラフ中に対応のエッジが残っている場合の数が得られ、その分布が推定される。分布が推定されるとその分布に対し、そのパラメータの値が、その分布にしたがって適切に選ばれた範囲に設定される。したがって、グラフを用いた有限回の操作により、シグナルパスウェイネットワークの特性を信頼性を持って推定できる。
【0014】
好ましくは、反応物は、Rhoファミリのシグナルパスウェイを構成する反応物である。
【0015】
さらに好ましくは、グラフを更新するステップは、反応物間の相互作用に所定のパラメータ値を割当ててパスウェイネットワークにおけるシグナル伝達をシミュレートするステップと、シミュレートするステップで得られた結果を検証し、クロストークのあるパスウェイの制約にしたがうパスウェイのみを選択的に残すようにグラフを更新するステップとを含む。
【0016】
本発明の第2の局面に係るコンピュータプログラムは、コンピュータにより実行されると、上記したいずれかのシグナルパスウェイネットワークの特性を推定する方法の全てのステップを実行するようにコンピュータを制御するものである。
【発明を実施するための最良の形態】
【0017】
以下、本発明の一実施の形態に係るパスウェイネットワークの特性の推定方法について図面を参照しながら説明する。以下の図において、同じ部品または処理工程(ステップ)については同じ参照番号を付し、それらの詳細な説明の繰返しは省略する。
【0018】
一般に、図5に示したように、パスウェイを構成する反応物Xと反応物Yとの関係140、および反応物X’と反応物Y’との関係142が存在する場合、式144のように各反応物の濃度x、y、x’およびy’の時間的な変化の間には、所定の相互関係が存在する。例えば反応物Xの濃度xが減少するのに応じて反応物Yの濃度yが増加するような場合であれば、図5に示す式144のうち上の式の定数αは負となる。同様に、反応物X’の濃度x’が増加すれば反応物Y’の濃度y’も増加するのであれば、式144の下式の定数βは正となる。こうした変化は一般に反応物のリン酸化および脱リン酸化という生化学反応を介して生じる。
【0019】
本実施の形態では、パスウェイを構成するたんぱく質などの反応物の間に、上記したようなリン酸化および脱リン酸化と、それに伴う濃度の変化という相互関係が生じるものと想定する。そして、対象となるパスウェイネットワークを構成するたんぱく質相互の間に式144で示されるような、パラメータを含む関係を最初に想定し、それをグラフ表現する。すなわち、反応物をノード、反応物間の関係をエッジとするグラフ表現を考える。各エッジには、その相互関係の特性を表すパラメータが変数として割当てられる。
【0020】
次に、各パラメータについてある値の組合せで、上記したグラフにしたがってシグナル伝達をシミュレートする。シミュレートした結果を、実際の実験結果を用いて検証し、上記した反応物間の相互関係の中で、クロストークによる制約を充足する相互関係のみ選択し、それ以外のあり得ない相互関係を取除く。そして、グラフ中ではその取り除かれた相互関係に対応するエッジを削除し、クロストークによる制約を充足するエッジを残してグラフを再構成する。その結果に基づいて、そのパラメータの値の組合せに対するグラフの各エッジの存在/不存在を記録する。
【0021】
こうした処理を、パラメータの値の組合せを様々に変えて繰返し行ない、それらの各々に対しグラフの各エッジの存在/不存在を記録する。その結果、各パラメータに対し、その各値について、対応するエッジがグラフ中で存在していた場合の数が得られる。
【0022】
パラメータの値の組合せについて、予め定めていた全ての値を用いて上記した処理を行なった後、その結果から各パラメータについて、その値に対し残っていたエッジの数の分布を推定し、その分布に対し統計的に適切と思われるパラメータの値の範囲を決定し、最初のパスウェイネットワーク内の各パスウェイ(グラフ内のエッジ)に特性として付与する。
【0023】
以上が本実施の形態に係るパスウェイネットワーク特性の推定方法の概略である。この方法は、実際上、コンピュータを用いて実現することになる。図6に、そのためのコンピュータプログラムのメイン処理のフローチャートを示す。図6を参照して、まずステップ160で、パスウェイネットワークのパラメータの初期値を定める。次に、ステップ162において、予め準備されていた、パスウェイネットワークをグラフ表現する場合の論理形式を読込む。ステップ164で、このパスウェイネットワークで、設定されたパラメータを用いた各反応物の濃度変化をシミュレートする。ステップ166で、このシミュレーションの結果を、予め準備している実際の実験で部分的に得られた結果を用いて検証する。そして、実験結果から見てクロストークの制約を充足せず、存在しないと考えられる経路を特定し、その経路に対応するエッジをグラフから削除し、グラフを更新する。
【0024】
更新したグラフの形状に基づき、パラメータ値と、グラフのパス形状とを記録する(ステップ168)。より具体的には、図7に示すように、予めパス形状とパラメータ値との記憶領域200を設けておく。シミュレーションごとに、そのときのパラメータの値と、各エッジ(パス)の存在/不存在とを記録する。例えばパラメータαについての記憶領域210では、α=α1,α2,…,αmのときのパスPATH1〜PATHnの存在/不存在が1/0の形式で記録される。α1〜αmについては、互いに同じ値であることもあり得る。同様に他のパラメータについても記憶領域212,…,220にパラメータの値と、そのときのパスPATH1〜PATHnの存在/不存在が記録される。
【0025】
再び図6を参照して、ステップ170において、パラメータの値の全ての組合せについてステップ162〜168の処理が終了したか否かを判定する。もしも終了していれば制御はステップ174に進む。それ以外の場合には制御はステップ172に進む。
【0026】
ステップ172では、パラメータの値の組合せを変えるために、特定のパラメータを所定の変化量で変化させる。その後ステップ162に戻る。
【0027】
ステップ170で全てのパラメータの組合せに対して処理が終了したと判定されると、ステップ174で各パラメータの値に対して存在するパスの分布を推定する。具体的には、図8に示すように、例えばあるパラメータαの値ごとに、シミュレーションとその検証との結果、検証後のグラフにこのパラメータαに対応するエッジ(パス)が残っていたか否かを調べる。そして、パラメータαの各値に対して対応するエッジがどれだけのケースにおいて残っていたかをヒストグラム化する。そして、このヒストグラムからその分布曲線240がどのような分布を表しているかを推定する。例えば分布としては正規分布、ポアソン分布、t分布、F分布などを想定し、分布曲線240がそれらのうちのどの分布を表しているかを決定する。
【0028】
ステップ176において、推定された分布の型に応じ、それぞれパラメータの値の範囲として適切な範囲を分布曲線から決定する。例えば、図9に示すように、分布曲線240が正規分布を表し、その平均が一点鎖線250で示される値mであり、標準偏差がσと計算できたものとする。この場合には、αの値を、m±3σの範囲252に決定する。このようにして各パラメータごとに決定した値の範囲をステップ178で出力する。すなわち、最初に想定されたパスウェイネットワークの各エッジに、それらエッジに対応するパラメータの範囲を割当てる。これにより、パスウェイネットワークの特性が推定されたことになる。
【0029】
このようにして、本実施の形態に依れば、パスウェイネットワークの各シグナルパスについて、反応の特性を示すパラメータを決定できる。この決定のアルゴリズムのための手順は有限回で済み、かつその回数はパラメータの値の変化の選び方により制御できる。したがって、パスウェイネットワークのように複雑な系の振る舞いを特定する値を、比較的短い時間の間に推定することができる。このパラメータの値にしたがってシグナル伝達をシミュレートすることで、薬剤により細胞内に生じる変化を効率よく推定できる。
【0030】
[コンピュータによる実現]
この実施の形態に係るパスウェイネットワーク特性の推定方法は、コンピュータハードウェアと、そのコンピュータハードウェアにより実行されるプログラムと、コンピュータハードウェアに格納されるデータとにより実現することができる。図10はこのコンピュータシステム330の外観を示し、図11はコンピュータシステム330の内部構成を示す。
【0031】
図10を参照して、このコンピュータシステム330は、FD(フレキシブルディスク)ドライブ352およびCD−ROM(コンパクトディスク読出専用メモリ)ドライブ350を有するコンピュータ340と、キーボード346と、マウス348と、モニタ342とを含む。
【0032】
図11を参照して、コンピュータ340は、FDドライブ352およびCD−ROMドライブ350に加えて、CPU(中央処理装置)356と、CPU356、FDドライブ352およびCD−ROMドライブ350に接続されたバス366と、ブートアッププログラム等を記憶する読出専用メモリ(ROM)358と、バス366に接続され、プログラム命令、システムプログラム、および作業データ等を記憶するランダムアクセスメモリ(RAM)360とを含む。コンピュータシステム330はさらに、プリンタ344を含んでいる。
【0033】
ここでは示さないが、コンピュータ340はさらにローカルエリアネットワーク(LAN)への接続を提供するネットワークアダプタボードを含んでもよい。
【0034】
コンピュータシステム330に上記したパスウェイネットワーク特性の推定方法を実行させるためのコンピュータプログラムは、CD−ROMドライブ350またはFDドライブ352に挿入されるCD−ROM362またはFD364に記憶され、さらにハードディスク354に転送される。または、プログラムは図示しないネットワークを通じてコンピュータ340に送信されハードディスク354に記憶されてもよい。プログラムは実行の際にRAM360にロードされる。CD−ROM362から、FD364から、またはネットワークを介して、直接にRAM360にプログラムをロードしてもよい。
【0035】
このプログラムは、コンピュータ340にこの実施の形態に係る方法を実行させる複数の命令を含む。ただし、この方法を行なわせるのに必要な基本的機能のいくつかはコンピュータ340上で動作するオペレーティングシステム(OS)またはサードパーティのプログラム、もしくはコンピュータ340にインストールされる各種ツールキットのモジュールにより提供される。従って、このプログラムはこの実施の形態に係る方法を実現するのに必要な機能全てを必ずしも含まなくてよい。このプログラムは、命令のうち、所望の結果が得られるように制御されたやり方で適切な機能または「ツール」を呼出すことにより、上記した方法を実行する命令のみを含んでいればよい。コンピュータシステム330の動作は周知であるので、ここでは繰り返さない。
【0036】
今回開示された実施の形態は単に例示であって、本発明が上記した実施の形態のみに制限されるわけではない。本発明の範囲は、発明の詳細な説明の記載を参酌した上で、特許請求の範囲の各請求項によって示され、そこに記載された文言と均等の意味および範囲内でのすべての変更を含む。
【図面の簡単な説明】
【0037】
【図1】シグナル伝達の一例を示す図である。
【図2】パスウェイにおいて考慮すべき反応物間の関係を模式的に示す図である。
【図3】Rhoファミリにおけるシグナルパスウェイのネットワークの例を示す図である。
【図4】パスウェイネットワーク特性の推定の複雑さを説明するための図である。
【図5】パスウェイネットワーク特性を推定するために想定される、反応物の濃度の時間的変化の間に想定される式およびパラメータの例を示す図である。
【図6】パスウェイネットワーク特性を推定するためのコンピュータプログラムのメインルーチンを示すフローチャートである。
【図7】パスの存在/不存在とパラメータの値との記憶領域を示す図である。
【図8】パラメータの値に対するパスの分布曲線の推定を示すグラフである。
【図9】推定された分布曲線からのパラメータの値の範囲の決定方法を説明するための図である。
【図10】本発明の一実施の形態に係る方法およびシステムを実現するコンピュータシステムの外観図である。
【図11】図10に示すコンピュータのブロック図である。
【符号の説明】
【0038】
20,24 Rhoキナーゼ、22,60 Rho、26,62 MLC、30 リン酸化されたMLC、64 MBS

【特許請求の範囲】
【請求項1】
シグナルパスウェイネットワークの特性を推定する方法であって、
前記パスウェイネットワークを構成する反応物と、反応物間の相互作用とをそれぞれノードおよびエッジとするグラフ表現を準備するステップと、
前記パスウェイネットワークにおけるシグナル伝達を、反応物間の相互作用に所定のパラメータ値を割当ててシミュレートした結果を検証して、所定の条件を充足する相互作用に対応するエッジのみを選択的に残すように前記グラフを更新するステップと、
前記グラフを更新するステップを、各パラメータに複数通りの値を設定して繰返し実行し、各パラメータの各値に対して、当該パラメータに対応するエッジであってかつ更新するステップの結果前記グラフ中に残ったエッジの数の分布を推定するステップと、
前記推定するステップで推定されたエッジの数の分布に基づいて、パラメータの値の範囲を推定するステップとを含む、シグナルパスウェイネットワークの特性を推定する方法。
【請求項2】
前記反応物は、Rhoファミリのシグナルパスウェイを構成する反応物である、請求項1に記載のシグナルパスウェイネットワークの特性を推定する方法。
【請求項3】
前記グラフを更新するステップは、
反応物間の相互作用に所定のパラメータ値を割当てて前記パスウェイネットワークにおけるシグナル伝達をシミュレートするステップと、
前記シミュレートするステップで得られた結果を検証し、クロストークのあるパスウェイの制約にしたがうパスウェイのみを選択的に残すように前記グラフを更新するステップとを含む、請求項1または請求項2に記載のシグナルパスウェイネットワークの特性を推定する方法。
【請求項4】
コンピュータにより実行されると、請求項1〜請求項3のいずれかに記載のシグナルパスウェイネットワークの特性を推定する方法の全てのステップを実行するように前記コンピュータを制御する、コンピュータプログラム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate


【公開番号】特開2006−59285(P2006−59285A)
【公開日】平成18年3月2日(2006.3.2)
【国際特許分類】
【出願番号】特願2004−243129(P2004−243129)
【出願日】平成16年8月24日(2004.8.24)
【国等の委託研究の成果に係る記載事項】(出願人による申告)平成16年度独立行政法人情報通信研究機構、研究テーマ「人間情報コミュニケーションの研究開発」に関する委託研究、産業活力再生特別措置法第30条の適用を受ける特許出願
【出願人】(393031586)株式会社国際電気通信基礎技術研究所 (905)