説明

たんぱく質のX線構造解析で構築したモデルの修正用プログラムおよびコンピュータシステム

【課題】 たんぱく質の結晶構造解析のモデルを修正して、水素結合とファンデルワールス(VDW)結合による水のネットワークを分断することなく表し、かつ、たんぱく質分子と水のネットワークとの結合を全て表すモデルとするプログラムおよびコンピュータシステムを提供する。
【解決手段】 水チェックプログラム21は、モデル内の個々の水を、空間群の全ての対称操作によって単位格子内で移動させ、かつ、並進操作によって隣接する単位格子に移動させて、水素結合またはVDW結合によって相互に繋がる1以上の水のネットワークを検出するとともに、ネットワーク内の水が水素結合またはVDW結合をするアミノ酸残基またはリガンドを検出して、モデル内の水の位置をアミノ酸残基またはリガンドに結合するネットワークに含まれる位置に変更する。コンピュータシステム1は、上記プログラム21を記憶する記憶部11と、その処理を実行する演算部12を備える。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、たんぱく質のX線結晶構造解析に関し、より詳しくは、構築したモデルの修正を行うプログラムおよびコンピュータシステムに関する。
【背景技術】
【0002】
近年、ゲノム科学研究はめざましい進歩を遂げている。この進歩により、実験モデル生物を含め数々の生物種で、膨大な遺伝情報が明らかになりつつある。しかし、遺伝情報の生物学的意味を明らかにするためには、遺伝情報から翻訳されたたんぱく質の機能を解明する必要がある。たんぱく質の機能を解明するための1つの有力な分析手段として立体構造決定があり、X線結晶構造解析は最も有力な立体構造決定手段の1つとなっている。
【0003】
X線結晶構造解析の手順は、たんぱく質試料取得以降、結晶化実験、X線回折実験、位相計算、モデルの構築、モデルの精密化の段階に分類できる。近年、Protein Data Bank(以下、PDBと略記する)においては、X線構造解析によって得られたたんぱく質の結晶構造の登録数が極めて増加している。これは、最近のX線結晶構造解析技術の進展で、大規模にかつ簡単にX線結晶構造解析を行うことができるようになったことも1つの要因である。
【0004】
たとえば、結晶化実験の段階では、自動結晶化ロボット(たとえば、特許文献1)、X線回折実験の段階では、理化学研究所構造ゲノムビームラインBL26B2での SPring
-8 Precise Automatic Cryo-sample Exchanger(SPACE)、位相計算の段階では、複数のコンピュータを用いて並列的に位相計算を自動で行う自動位相計算システム(PERON)が開発されている。しかしながら、結晶構造のPDBへの登録、つまり社会への公開のための最終構造を得るには、残された問題がある。それは、構築したモデルの修正と精密化の段階である。
【0005】
モデルの構築および修正と精密化の段階は、極めて高分解能のデータなど構造解析を行う上で非常に良好な条件が整っていてさえ、自動で行うことはできない。モデルの構築作業は、一般的には、経験と専門的知識をもつ熟練した研究者が、モデル構築ソフトウェア(たとえば、Quanta:アクセルリス社)を用いて手動で行う。モデルの修正と精密化をするモデル評価作業は、モデル評価ソフトウェア(たとえば、WHATCHECK)を用いて、知識と経験を活用して行う。このため、登録され社会に公開される立体構造の質は、結晶解析を行う研究者の質に大きく依存する。これは、公開された立体構造を将来利用する際に、大きな問題になると考えられる。
【0006】
モデル構築評価作業は、アミノ酸残基と、水と、リガンドの確認作業に分類できる。アミノ酸残基の認識作業では、各アミノ酸残基が電子密度に適合していることを確認するのみならず、幾何学的情報などを確認する必要がある。特に手動でモデルの修正を行う場合、熟練者でもロイシン(Leu)残基などの幾何学的情報を誤りやすい。
【0007】
さらに、アスパラギン(Asn)残基、グルタミン(Gln)残基、ヒスチジン(His)残基では、側鎖の向きを反転(180゜回転)させても電子密度に適合するため、水素結合を考慮して側鎖の向きを適切にしなければならない。しかしながら、これらの残基の側鎖の向きの適否を調べるために水素結合を考慮するにしても、構築したモデルが全ての水素結合を表しているとは限らず、判断に誤りが生じやすい。これは、結晶構造解析固有の結晶学的対称性(結晶が属する空間群の対称性)のために、分子間の水素結合が現れない等価点に、水分子が設定されることが多いからである。
【0008】
また、X線構造解析で同定できる水分子の数は(0.301−9.5×0.01×R)×N程度であるということが知られている(非特許文献1)。ここで、Rは分解能、Nはたんぱく質の非水素原子の数である。たとえば、分解能が2.0Åの場合、同定可能な水の数は、アミノ酸残基の数とほぼ同じである。モデルの修正作業は、これらの大量の水の結合のネットワークを考慮に入れて行う必要がある。
【0009】
発明者の属するたんぱく質構造解析研究チームでは、過去4年間で、100構造以上の解析を行ってきた。社会的有用性を考慮して、解析した構造の数のみならず、構築したモデルの質を確保するために、解析途中でモデルを評価することに加え、最終段階では、解析を担当した研究者以外の熟練した研究者が、モデルの質を確認している。この二重作業によりヒューマンエラーが回避される。しかしながら、大規模かつ高速に構造解析を行うためには、人手でモデルの評価を行うことは適していない。
【0010】
【特許文献1】特開2006−083126号公報
【非特許文献1】O. Carugo and D. Bordo, “How many water molecules can be detected by protein crystallography”, Acta. Crystallographica, International Union of Crystallography, 1999、D55、p.479-483
【発明の開示】
【発明が解決しようとする課題】
【0011】
X線結晶構造解析の結果をたんぱく質の機能の解明に利用するためには、構築したモデルに誤りがないことはもとより、構築したモデルが、たんぱく質分子と水分子、リガンド分子と水分子、および水分子と水分子の、水素結合およびファンデルワールス(VDW)結合(VDW力による結合)を、判りやすく表すものでなければならない。さもなければ、機能解明の研究において、機能発現に関与するたんぱく質の部位と水分子との水素結合が読み取れず、たんぱく質と他の物質の分子との相互作用を誤って解釈したり、解釈ができなくなったりする。また、構築したモデルが、水素結合による水のネットワークを分断して表していたのでは、生体内において水のネットワークの代わりに入り得る他の物質を、推測することができなくなる。しかしながら、水のネットワークを分断することなく表し、かつ、たんぱく質分子と水のネットワークとの結合を全て表したモデルを提供するプログラムは開発されていない。
【0012】
また、Asn残基、Gln残基、His残基は、たんぱく質の機能発現に関与する部位に存在することが多い。このため、構築したモデルが、これらの残基の側鎖の向きを正しく表していなければ、これらの残基が機能発現に関与しているにもかかわらず、機能発現に関与しないという結論を導き出したり、逆に、これらの残基が機能発現に関与してないにもかかわらず、機能発現に関与するという結論を導き出したりする、誤りが生じる可能性がある。しかし、これらの側鎖の向きが適切なモデルを提供する方法は提案されていないのが現状である。
【0013】
さらに、X線結晶構造解析の効率を高めて、多くのたんぱく質の立体構造を明らかにするためには、モデルの修正と精密化の段階を自動化して、人手による作業をできるだけ減少させることが望ましい。しかも、モデルの修正と精密化に携わる研究者の熟練度によらず、解析で得られるモデルの質が一様に高いことが望ましい。
【0014】
本発明の目的は、水素結合およびVDW結合による水のネットワークを分断することなく表し、かつ、たんぱく質分子と水のネットワークとの結合を全て表したモデルを提供するプログラムおよびコンピュータシステムを実現することにある。また、本発明の目的は、Asn残基、Gln残基、His残基の側鎖の向きが適切なモデルを提供するプログラムおよびコンピュータシステムを実現することにある。さらに、本発明の目的は、モデルの修正と精密化に携わる研究者の熟練度によらず、解析で得られるモデルの質を一様に高くすることが可能なプログラムおよびコンピュータシステムを実現することにある。
【課題を解決するための手段】
【0015】
本発明は、たんぱく質のX線構造解析で構築したモデルの水の位置を修正するためのプログラムであって、
モデル内の個々の水を、X線構造解析に用いた結晶が属する空間群の全ての対称操作によって単位格子内で移動させ、かつ、並進操作によって隣接する単位格子に移動させて、水素結合またはファンデルワールス結合によって相互に繋がる1以上の水のネットワークを検出する手順と、
各ネットワークに含まれているいずれかの水が水素結合またはファンデルワールス結合をするたんぱく質分子のアミノ酸残基またはリガンドを検出する手順と、
モデル内の水の位置を、アミノ酸残基またはリガンドに結合するネットワークに含まれる位置に変更する手順、または、モデル内の水の位置を、アミノ酸残基またはリガンドに結合するネットワークに含まれる位置に変更すべきことを使用者に提示する手順とを
コンピュータに実行させることを特徴とするプログラムである。
【0016】
本発明はまた、検出したネットワークに1つの水のみが含まれているときに、その水を削除する手順、または、その水を削除すべきことを使用者に提示する手順をコンピュータに実行させることを特徴とする。
【0017】
本発明はまた、検出したネットワークに含まれているいずれの水も、水素結合またはファンデルワールス結合によって、アミノ酸残基およびリガンドに結合しないときに、そのネットワークに含まれている全ての水を削除する手順、または、そのネットワークに含まれている全ての水を削除すべきことを使用者に提示する手順をコンピュータに実行させることを特徴とする。
【0018】
本発明はまた、検出したネットワークに含まれている水からアミノ酸残基またはリガンドまでの距離が所定距離以下のときに、その水を削除する手順、または、その水を削除すべきことを使用者に提示する手順をコンピュータに実行させることを特徴とする。
【0019】
本発明は、検出したネットワークに含まれている水同士の距離が所定距離以下のときに、所定の基準に基づいて、一方の水を削除しもしくはその位置を変更する手順、または、一方の水を削除しもしくはその位置を変更すべきことを使用者に提示する手順をコンピュータに実行させることを特徴とする。
【0020】
本発明は、たんぱく質のX線構造解析で構築したモデルのAsn残基、Gln残基およびHis残基の側鎖の向きを修正するためのプログラムであって、
モデル内の個々のAsn残基、Gln残基およびHis残基を、X線構造解析に用いた結晶が属する空間群の全ての対称操作によって単位格子内で移動させ、かつ、並進操作によって隣接する単位格子に移動させて、水素結合またはファンデルワールス結合によって相互に繋がる1以上のAsn残基、Gln残基およびHis残基のネットワークを検出する手順と、
各ネットワークに含まれている全てのAsn残基、Gln残基およびHis残基の側鎖の向きを個別に反転させて、側鎖の向きが異なる全ての修飾モデルを作成し、各修飾モデルの水、アミノ酸残基およびリガンド間の水素結合を検出して、各ネットワークに含まれているAsn残基、Gln残基およびHis残基の側鎖の向きを、水素結合の総数が最も多い修飾モデルにおける向きに変更する手順、または、変更すべきことを使用者に提示する手順とを
コンピュータに実行させることを特徴とするプログラムである。
【0021】
本発明はまた、ネットワークを検出する手順において、ネットワークに含まれているAsn残基、Gln残基またはHis残基が、Asn残基、Gln残基およびHis残基以外のアミノ酸残基と水素結合またはワンデルワールス結合をし、かつ、そのアミノ酸残基が他のAsn残基、Gln残基またはHis残基と水素結合またはワンデルワールス結合をするときに、そのアミノ酸残基と他のAsn残基、Gln残基またはHis残基をネットワークに含めることをコンピュータに実行させることを特徴とする。
【0022】
本発明は、たんぱく質のX線構造解析で構築したモデルを修正するためのコンピュータシステムであって、
モデルを記憶するモデル記憶部と、
上記のいずれかのプログラムを記憶するプログラム記憶部と、
プログラム記憶部に記憶されたプログラムの手順を実行する実行部と
を含むことを特徴とするモデルを修正するコンピュータシステムである。
【発明の効果】
【0023】
本発明によれば、モデル内の個々の水を、空間群の全ての対称操作によって単位格子内で移動させ、かつ、並進操作によって隣接する単位格子に移動させて、水素結合またはVDW結合によって相互に繋がる水のネットワークを検出するので、水のネットワークが分断されることなく検出される。しかも、各ネットワークに含まれているいずれかの水が水素結合またはVDW結合をするたんぱく質分子のアミノ酸残基またはリガンドを検出して、モデル内の水の位置を、アミノ酸残基またはリガンドに結合するネットワークに含まれる位置に変更し、または、モデル内の水の位置を、アミノ酸残基またはリガンドに結合するネットワークに含まれる位置に変更すべきことを使用者に提示するので、たんぱく質分子およびリガンドと水のネットワークとの結合が表されたモデルが得られる。
【0024】
また、本発明によれば、検出したネットワークに1つの水のみが含まれているときに、その水を削除し、または、その水を削除すべきことを使用者に提示するので、孤立している水の除去が可能である。
【0025】
また、本発明によれば、検出したネットワークに含まれているいずれの水も、水素結合またはVDW結合によって、アミノ酸残基およびリガンドに結合しないときに、そのネットワークに含まれている全ての水を削除し、または、そのネットワークに含まれている全ての水を削除すべきことを使用者に提示するので、アミノ酸残基およびリガンドに結合しない浮遊したネットワークの除去が可能である。
【0026】
また、本発明によれば、検出したネットワークに含まれている水からアミノ酸残基またはリガンドまでの距離が所定距離以下のときに、その水を削除し、または、その水を削除すべきことを使用者に提示するので、アミノ酸残基またはリガンドに対して近すぎる位置にある水の除去が可能である。
【0027】
また、本発明によれば、検出したネットワークに含まれている水同士の距離が所定距離以下のときに、所定の基準に基づいて、一方の水を削除しもしくはその位置を変更し、または、一方の水を削除しもしくはその位置を変更すべきことを使用者に提示するので、相互に近すぎる位置にある水の削除またはその位置の修正が可能である。ネットワークには、対称操作および並進操作で位置が変わらなかった水と、それらの操作で位置が変わった水の双方が含まれ得る。本来特異点上に位置する水が誤って特異点からわずかにずれた位置でモデルに含まれていたときには、その水は、位置の異なる別の水として、同一のネットワークに含まれることになり、両者の距離は極めて短くなる。このような水を特異点上に位置させることも可能である。
【0028】
本発明によれば、モデル内の個々のAsn残基、Gln残基およびHis残基を、空間群の全ての対称操作によって単位格子内で移動させ、かつ、並進操作によって隣接する単位格子に移動させて、水素結合またはVDW結合によって相互に繋がる1以上のAsn残基、Gln残基およびHis残基のネットワークを検出するので、異なるたんぱく質分子(サブユニット)間に水素結合またはVDW結合があり、構築したモデルにそれが現れていないときでも、異なるたんぱく質分子のAsn残基、Gln残基およびHis残基も1つのネットワークに含めることができる。
【0029】
そして、各ネットワークに含まれている全てのAsn残基、Gln残基およびHis残基の側鎖の向きを個別に反転させて、側鎖の向きが異なる全ての修飾モデルを作成し、各修飾モデルの水、アミノ酸残基およびリガンド間の水素結合を検出して、各ネットワークに含まれているAsn残基、Gln残基およびHis残基の側鎖の向きを、水素結合の総数が最も多い修飾モデルにおける向きに変更し、または、変更すべきことを使用者に提示するので、最もエネルギー的に安定なAsn残基、Gln残基およびHis残基のネットワークが得られ、各残基の側鎖の向きが適切になる。側鎖の向きが異なる全ての修飾モデルの数は、Asn残基、Gln残基およびHis残基の総数をNとすると、2である。
【0030】
また、本発明によれば、ネットワークを検出する手順において、ネットワークに含まれているAsn残基、Gln残基またはHis残基が、Asn残基、Gln残基およびHis残基以外のアミノ酸残基と水素結合またはワンデルワールス結合をし、かつ、そのアミノ酸残基が他のAsn残基、Gln残基またはHis残基と水素結合またはワンデルワールス結合をするときに、そのアミノ酸残基と他のAsn残基、Gln残基またはHis残基をネットワークに含めるため、直接には繋がらないが、ただ1つのアミノ残基を介して相互に繋がるAsn残基、Gln残基またはHis残基は、同一のネットワークに含まれることになる。その結果、個々のネットワークの規模が大きくなって、修飾モデルの水素結合の数も多くなり、エネルギー的により安定なネットワークが得られ易くなって、各残基の向きが一層適切になる。
【0031】
本発明によれば、上記のいずれかのプログラムの手順を実行する実行部をコンピュータシステムに備えているので、解析効率が高まり、しかも、モデルの修正と精密化に携わる研究者の熟練度によらず、モデルの質が一様に高い解析結果を提供し得る。
【発明を実施するための最良の形態】
【0032】
図1は本発明の実施の一形態であるコンピュータシステム1の構成を模式的に示すブロック図である。コンピュータシステム1は、記憶部11、演算部12、表示部13、入力部14、出力部15およびネットワークインターフェース部16を有している。
【0033】
記憶部11は、半導体メモリ、ハードディスク(HD)、コンパクトディスク(CD)、デジタルバーサタイルユーティリティディスク(DVD)、ブルーレイディスク(BD)、などの記憶装置から成り、X線結晶構造解析で構築したたんぱく質のモデル11a、解析に用いた結晶の格子定数、空間群の対称操作などの結晶情報11bのほか、以下に詳述する本発明のモデルチェックプログラム11cを記憶している。演算部12は、中央処理ユニット(CPU)などの演算装置から成り、記憶部11に記憶されているモデルチェックプログラム11cが表す処理を実行する。
【0034】
表示部13は、カラー液晶表示装置(LCD)などの表示装置から成り、演算部12からの指示に応じて、結晶構造のモデルの画像およびモデルに関する種々の情報を表示する。入力部14は、キーボードなどの文字数字入力装置と、マウス、ジョイスティックなどのポインティング装置から成り、使用者の操作を受け付けて演算部12に伝達する。表示部13と入力部14とにより、グラフィックユーザインターフェース(GUI)が実現される。出力部15は、インクジェットプリンタなどの印刷装置から成り、演算部12からの指示に応じて、モデルの画像およびモデルに関する種々の情報を印刷出力する。ネットワークインターフェース部16はコンピュータシステム1を、ローカルエリアネットワーク、インターネットなどのコンピュータネットワークに接続する。
【0035】
図2はモデルチェックプログラム11cの機能を示すブロック図である。モデルチェックプログラム11cは、機能よって、水チェック21、側鎖チェック22、パッキングチェック23、ジオメトリチェック24、シーケンスチェック25およびフォーマットチェック26の各プログラムに分類される。
【0036】
水チェックプログラム21は、構築したモデルに含まれる水のネットワークを検出して、水の位置のチェックと修正を行う。側鎖チェックプログラム22は、たんぱく質分子のAsn残基、Gln残基およびHis残基の側鎖の向きのチェックと修正を行う。パッキングチェックプログラム23は、結晶構造におけるたんぱく質分子の配置のチェックを行う。ジオメトリチェックプログラム24は、たんぱく質分子のアミノ酸残基の幾何学的構造、たとえば、環状の側鎖の平面性、隣り合う結合の二面角などをチェックする。シーケンスチェックプログラム25は、たんぱく質分子におけるアミノ酸残基の1次配列をチェックする。フォーマットチェックプログラム26は、モデルの記述様式がPDBのフォーマットに適合しているか否かをチェックする。
【0037】
以下、本発明の特徴である水チェックプログラム21と側鎖チェックプログラム22について、詳細に説明する。
【0038】
まず、水チェックプログラム21について説明する。水チェックプログラム21は、モデルに含まれる個々の水を、X線結晶構造解析に用いた結晶が属する空間群の対称操作により単位格子内で移動させ、さらに、並進操作により隣接する単位格子に移動させて、水素結合またはVDW結合によって繋がる1以上のネットワークを検出する。なお、空間群の対称操作には、座標(x,y,z)の原子を同じ座標(x,y,z)に移動させる、すなわち位置を変えない操作も含まれており、したがって、検出されたネットワークには、移動により位置が変わった水と、位置が変わらない水の双方が含まれる。水チェックプログラム21は、また、各ネットワークに含まれる個々の水が、たんぱく質のアミノ酸残基またはリガンドに、水素結合またはVDW結合によって繋がるか否かを判定する。
【0039】
図3は水のネットワークを模式的に示す図である。水のネットワークは(a)〜(d)に分類される。(a)は、1つの水のみを含み、その水がアミノ酸残基またはリガンドに繋がらないネットワークである。このネットワークの水を孤立水という。孤立水は、モデル構築の段階で、電子密度のノイズを誤って水と判断したときなどに生じる。孤立水はモデルから除去すべきである。
【0040】
(b)は、2つ以上の水を含み、それらの水がいずれもアミノ酸残基またはリガンドに繋がらないネットワークである。このネットワークを浮遊ネットワークという。浮遊ネットワークも電子密度のノイズを誤って水と判断したときに生じるが、電子密度にいずれかの水が現れていなかったときや、いずれかの水の位置に誤りがあったときにも生じる。浮遊ネットワークは、モデルから除去するか、いずれかの水の位置を修正するか、あるいは、欠落している水を新たに加えるべきものである。
【0041】
(c)、(d)は、2つ以上の水を含み、いずれかの水がアミノ酸残基またはリガンドに繋がるネットワークである。
【0042】
(c)のネットワークに含まれる水は、全て、対称操作および並進操作によって位置が変化しなかった水である。水素結合およびVDW結合のうち、結合している2原子が共に、対称操作および並進操作によって位置が変化しなかったものである場合の結合(太線で示す)を、本結合という。
【0043】
(d)のネットワークに含まれる水のいくつかは、対称操作および並進操作によって位置が変化しなかった水であり、他の水は、対称操作および並進操作によって位置が変化した水である。水素結合およびVDW結合のうち、結合している2原子の少なくとも一方が、対称操作および並進操作によって位置が変化したものである場合の結合(細線で示す)を、SYMM結合という。なお、(d)において、1つの水はSYMM結合によって、自己に結合している。
【0044】
水チェックプログラム21は、図3の(d)のように、水素結合またはVDW結合によってたんぱく質のアミノ酸残基またはリガンドに繋がり、しかも、SYMM結合をしている水を含むネットワークが存在するときに、モデル内のその水の位置を、そのSYMM結合をする位置に修正すべきであるとする。そして、修正を実行し、または、修正すべきことを表示部13に表示して使用者に示す。
【0045】
水チェックプログラム21は、自動修正モードと手動修正モードを有しており、これらのモードは、使用者が入力部14からの入力によって、選択することができる。自動修正モードでは、SYMM結合をする位置への修正が実行され、手動修正モードでは、修正すべきことの提示がなされる。
【0046】
図4は、水チェックプログラム21が手動修正モードにおいて表示部13に表示する画面の概略を示している。表示画面30は、構造表示ウィンドウ31、水リスト表示ウィンドウ32、水ネットワークリスト表示ウィンドウ33、水ネットワーク表示ウィンドウ34、および修正候補表示ウィンドウ35を有する。構造表示ウィンドウ31には水のネットワークの立体構造を表示する。水リスト表示ウィンドウ32にはモデル内の全ての水のリストを表示する。水ネットワークリスト表示ウィンドウ33には全てのネットワークを表示する。水ネットワーク表示ウィンドウ34には1つのネットワークの構造を模式的な態様で表示する。図5の(a)〜(d)は、それぞれ、構造表示ウィンドウ31、水リスト表示ウィンドウ32、水ネットワークリスト表示ウィンドウ33、および水ネットワーク表示ウィンドウ34の表示例を示す。
【0047】
修正候補表示ウィンドウ35には位置を修正すべき水を、修正前の位置、修正後の位置および後述する属性と共に、表示する。削除すべき水も表示する。図6は、修正前の修正候補表示ウィンドウ35の表示例(a)と、対応する水ネットワーク表示ウィンドウ34の表示例(b)を示す。これは修正候補が1つのみのときのものである。図7は、図6の(a)の修正を行った後の修正候補表示ウィンドウ35の表示例(a)と、対応する水ネットワーク表示ウィンドウ34の表示例(b)を示す。修正候補がなくなったため、図7(a)の修正候補表示ウィンドウ35には修正候補が表示されていない。また、図6(b)では細線で表示されていたSYMM結合が、図7(b)では太線で表示されている。これは、修正後の水、すなわち位置を変更した水は、もはやSYMM結合で他の水分子に繋がっているのではなく、本結合で繋がっていることを表している。
【0048】
水チェックプログラム21が行う水チェックの処理を、図8〜図13のフローチャートを参照して説明する。図8は水チェック処理全体を示すフローチャートである。まず、構築されたモデルを読み込み(ステップS2)、未処理リストを用意して、これにモデル内の全ての水を入れる(S4)。そして、ネットワークの番号を1にして(S6)、未処理リストから水を1つ取り出す(S8)。
【0049】
次いで、水のネットワークを作成する(S10)。このネットワーク作成処理については後に詳述する。ネットワーク作成後、ネットワークに含まれる水を未処理リストから削除し(S12)、未処理リストに水があるか否かを判定する(S14)。未処理リストに水があるときは、ネットワーク番号を更新(1を加える)して(S16)、ステップS8に戻り、ステップS14までの処理を繰返す。以上で、水の全てのネットワークが検出される。
【0050】
ステップS14の判定で未処理リストに水がないときは、ネットワーク番号を1にし(S18)、修正候補を検出する(S20)。修正候補検出処理については後に詳述する。修正候補検出処理の後、修正候補があるか否かを判定し(S22)、修正候補がなければステップS34に進む。修正候補があるときは、自動修正が指示されているか否か、つまり自動修正モードに設定されているか否かを判定し(S24)、自動修正が指示されているときは、自動修正を行う(S26)。そして、修正が成功したか否かを判定し(S28)、成功したときはステップS20に戻り、成功しなかったときは、ステップS34に進む。自動修正および修正の成否については後述する。
【0051】
ステップS24の判定で自動修正が指示されていないとき、つまり手動修正モードに設定されているときは、手動修正(S30)を行う。手動修正の処理については後述する。手動修正処理の後、使用者により終了が指示されたか否かを判定し(S32)、終了が指示されていないときはステップS20に戻り、終了が指示されているときはステップS34に進む。
【0052】
ステップS34ではネットワーク番号を更新(1を加える)する。そして、その番号のネットワークが存在するか否かを判定して(S36)、存在するときはステップS20に戻り、存在しないときは水のチェック処理を終了する。以上で、検出した各ネットワークについて、修正すべき水の検出と修正の実行がなされる。
【0053】
図9Aおよび図9Bは、図8のステップS10で行う水のネットワークの作成処理を示すフローチャートである。まず、モデルの立体構造を読み込み(ステップS102)、参照リストと複数のネットワークリストとを用意して、図8のステップS8で未処理リストから取り出した水を、参照リストとネットワークリストに入れる(S104)。そして、参照リストから1つの水Wtを取り出す(S106)。取り出した水Wtは参照リストから削除する。最初は、ステップS104で入れた水を取り出すことになる。
【0054】
次いで、水Wtの等価水Wiを発生させる(S108)。等価水とは、空間群の対称操作で移動させ、さらに、並進操作で隣接する単位格子に移動させた水のことである。したがって、等価水Wiには水Wtそのものも含まれる。等価水の総数をnとする。等価水の発生処理については後に詳述する。
【0055】
等価水Wiを発生させた後、水Wtが水素結合またはVDW結合によって自己結合をしているか否か、つまり水Wtといずれかの等価水Wiとが水素結合またはVDW結合をしているか否かを判定する(S110)。ただし、水Wtと座標が同一の等価水Wiは無視する。自己結合をしているときは、ネットワークリストに水Wtと等価水Wiとの自己結合を加える(S112)。
【0056】
次いで、等価水Wiの番号iを1とし(S114)、等価水Wiと水素結合またはVDW結合をしている全ての水Sjを検出する(S116)。そして、水Sjの番号jを1とし(S118)、水Sjがネットワークリストに存在するか否かを判定する(S120)。水Sjがネットワークリストに存在しないときは、水Sjをネットワークリストに加え(S122)、さらに参照リストにも加える(S124)。また、等価水Wiと水Sjとの結合がネットワークリストに存在するか否かを判定し(S126)、存在しなければその結合をネットワークリストに加える(S128)。
【0057】
このとき、等価水Wiが水Wtと同じであれば、ネットワークリストに加える結合を本結合とし、等価水Wiが水Wtと異なれば、ネットワークリストに加える結合をSYMM結合とする。また、等価水Wiと水Sjの距離が1.5Å未満のときは、ネットワークリストに加える結合をショート結合とする。
【0058】
その後、番号jに1を加えて(S130)、番号jが等価水Wiに結合している水Sjの総数mを超えているか否かを判定し(S132)、超えていなければステップS120に戻り、超えているときはステップS134に進む。
【0059】
ステップS134では、等価水Wiと水素結合またはVDW結合をしている全てのアミノ酸残基およびリガンドUkを検出する。そして、アミノ酸残基またはリガンドUkの番号kを1とし(S136)、アミノ酸残基またはリガンドUkがネットワークリストに存在するか否かを判定する(S138)。アミノ酸残基またはリガンドUkがネットワークリストに存在しないときは、アミノ酸残基またはリガンドUkをネットワークリストに加える(S140)。
【0060】
次いで、等価水Wiとアミノ酸残基またはリガンドUkとの水素結合またはVDW結合がネットワークリストに存在するか否かを判定し(S142)、存在しなければその結合をネットワークリストに加える(S144)。ここでも、ステップS128と同様に、等価水Wiが水Wtと同じであれば、ネットワークリストに加える結合を本結合とし、等価水Wiが水Wtと異なれば、ネットワークリストに加える結合をSYMM結合とする。また、等価水Wiとアミノ酸残基またはリガンドUkの距離が1.5Å未満のときは、ネットワークリストに加える結合をショート結合とする。
【0061】
その後、番号kに1を加えて(S146)、番号kが検出されたアミノ酸残基およびリガンドの総数pを超えているか否かを判定し(S148)、超えていなければステップS138に戻る。
【0062】
番号pが総数pを超えているときは、等価水Wiの番号iに1を加えて(S150)、番号iが等価水Wiの総数nを超えているか否かを判定し(S152)、超えていなければステップS116に戻る。番号iが等価水Wiの総数nを超えているときは、参照リストに水が存在するか否かを判定する(S154)。参照リストに水が存在するときはステップS106に戻り、存在しないときは、ネットワーク作成処理を終了して、図8の処理に戻る。
【0063】
ステップS106からS152までの処理で、1つの水のネットワークを形成する水が全て検出されて、ネットワークリストに加えられていく。また、そのネットワークと水素結合またはVDW結合をするアミノ酸残基およびリガンドもネットワークリストに加えられていく。
【0064】
水素結合をするか否かの判定は、原子間距離と、一方の原子がドナーに、他方の原子がアクセプタになり得るか否かに基づいて行う。水素結合となり得る原子間距離は2.2Å〜3.5Åである。水は、ドナーにもアクセプタにもなり得る。アミノ酸残基のどの原子がドナーまたはアクセプタになり得るかを、表1に示す。VDW結合をするか否かの判定は、原子間距離のみに基づいて行う。VDW結合となり得る原子間距離は2.65Å〜4.0Åである。
【0065】
【表1】

【0066】
図10Aおよび図10Bは、図9AのステップS108で行う等価水の発生処理を示すフローチャートである。まず、モデル、格子定数および空間群を読み込み(ステップS202)、等価水リストを用意して初期化(クリア)する(S204)。また、等価水の番号iを1とし(S206)、対称操作の番号jを1とする(S208)。
【0067】
そして、たんぱく質分子Pに空間群の対称操作OPj(R,T)を適用して、たんぱく質の等価分子P’jを生成する(S210)。ここで、Rは回転操作を表す3×3の行列であり、Tは並進操作を表す3×1の行列である。操作前の分率座標をV、操作後の分率座標をV‘で表すと、V’=RV+Tとなる。
【0068】
対称操作の後、等価分子P’jを並進操作で隣接する単位格子に移動させて、分子Pの原子が最も多く含まれる格子内にP’jの原子が最も多く含まれるようになる並進操作を検出し、その並進操作をT’とする(S212)。これは、後の処理(ステップS220)で、並進操作T’を対称操作後の水の移動に用いて、対称操作後の水をできるだけたんぱく質分子Pに近づけるためである。
【0069】
次いで、分率座標に適用する並進操作の移動量a、bおよびcをいずれも−1とし(S214、S216、S218)、水Wtに対称操作OPj(R,T)を適用し、さらに並進操作T’と並進操作T”(a,b,c)を適用して、等価水Wiを生成する(S220)。生成した等価水Wiを等価水リストに加えて(S222)、等価水の番号iに1を加える(S224)。
【0070】
その後、並進操作の移動量cに1を加えて(S226)、移動量cが1を超えているか否かを判定し(S228)、超えていなければステップS220に戻る。移動量cが1を超えているときは、並進操作の移動量bに1を加えて(S230)、移動量bが1を超えているか否かを判定し(S232)、超えていなければステップS218に戻る。移動量bが1を超えているときは、並進操作の移動量aに1を加えて(S234)、移動量aが1を超えているか否かを判定し(S236)、超えていなければステップS216に戻る。
【0071】
移動量aが1を超えているときは、対称操作の番号jに1を加えて(S238)、番号jが空間群の対称操作の総数を超えているか否かを判定し(S240)、超えていなければステップS210に戻る。対称操作の番号jが空間群の対称操作の総数を超えているときは、等価水の発生処理を終了して、図9Aの処理に戻る。
【0072】
以上の処理で、たんぱく質分子Pを含む単位格子を中心とする3×3×3(=27)の単位格子それぞれに、空間群の対称操作の総数に等しい等価水が生成される。
【0073】
図8のステップS20における修正候補の検出処理について説明する。修正候補には、修正操作、属性、修正前の水の位置、および修正後の水の位置が含まれる。修正操作には、削除、対称操作および並進操作による等価点への移動、および特異点への移動の3種がある。属性は、その修正の必要性の程度を表すもので、「true」と「false」の2つがある。自動修正モードでは、属性trueの修正が実行され、属性falseの修正は実行されない。手動修正モードでは、修正候補表示ウィンドウで使用者が属性を変更することが可能であり、使用者が実行を指示したときに属性trueとなっている修正が実行される。
【0074】
図11Aおよび図11Bは、図8のステップS20で行う修正候補の検出処理を示すフローチャートである。まず、モデルとネットワークリストを読み込み(ステップS302)、修正候補リストを用意して初期化(クリア)する(S304)。
【0075】
また、ネットワークリストが水を1つのみ含むか否か、すなわち、孤立水であるか否かを判定し(S306)、孤立水のときは、さらに、その孤立水の等価水を図10Aおよび図10Bと同様の処理で発生させて、各等価水から4.2Å以内に他の原子が存在するか否かを判定する(S308)。これは、VDW結合の最大距離(4.0Å)から0.2Å以内の距離に原子が存在するか否かを判断するためである。他の原子が存在するときは、属性をtrueとして孤立水の削除を修正候補リストに加え(S310)、他の原子が存在しないときは、属性をfalseとして孤立水の削除を修正候補リストに加える(S312)。
【0076】
次いで、ネットワークリストが浮遊ネットワークのものであるか否かを判定し(S314)、浮遊ネットワークのときは、属性をfalseとして、浮遊ネットワークに含まれる全ての水の削除を修正候補リストに加える(S316)。
【0077】
その後、ネットワークリスト内の水の番号iを1として(S318)、ネットワークリスト内にアミノ酸残基またはリガンドが存在するか否かを判定する(S320)。アミノ酸残基またはリガンドが存在しないときには、ステップS330に進み、存在するときには、水Wiからアミノ酸残基またはリガンドに至る経路にSYMM結合が1つのみ存在するか否かを判定する(S322)。その経路上の本結合の数は、考慮せず、つまり0以上であればよい。SYMM結合が1つのみ存在しないとき、すなわちSYMM結合が全く存在しないか2以上存在するときには、ステップS330に進み、SYMM結合が1つのみ存在するときには、そのSYMM結合が水Wiの結合であるか否かを判定する(S324)。
【0078】
SYMM結合が水Wiの結合でないときには、ステップS330に進み、SYMM結合が水Wiの結合であるときには、そのSYMM結合を経由せずに、水Wiからアミノ酸残基またはリガンドに至る他の経路が存在するか否かを判定する(S326)。他の経路が存在するときには、ステップS330に進む。他の経路が存在しないときには、水Wiの対称操作および並進操作後の位置への移動を、属性trueとして修正候補リストに加えて(S328)、ステップS330に進む。
【0079】
ステップS330では、水Wiの結合がショート結合であるか否か、すなわち水Wiがショートコンタクトをしているか否かを判定する。水Wiがショートコンタクトをしているときには、そのショート結合が自己との結合であるか否か、すなわち自己コンタクトであるか否かを判定する(S332)。ショートコンタクトが自己コンタクトのときには、水Wiの特異点への移動を、属性trueとして修正候補リストに加える(S334)。
【0080】
ショートコンタクトが自己コンタクトでないときには、属性をtrueとして、水Wiまたは相手原子の削除を修正候補リストに加える(S336)。ここで、水Wiと相手原子のどちらの削除を修正候補リストに加えるかは、次の条件に従って決定する。相手原子がアミノ酸残基またはリガンドの原子のときは、水Wiを削除の候補とする。相手原子が水Wcのときは、次の(1)〜(5)のようにする。
【0081】
(1):水Wiから、水素結合またはVDW結合を経由して、アミノ酸残基またはリガンドに至る経路が存在し、かつ、水Wcから、水素結合またはVDW結合を経由して、アミノ酸残基またはリガンドに至る経路が存在しないときは、水Wcを削除の候補とする。
(2):水Wiから、水素結合またはVDW結合を経由して、アミノ酸残基またはリガンドに至る経路が存在せず、かつ、水Wcから、水素結合またはVDW結合を経由して、アミノ酸残基またはリガンドに至る経路が存在するときは、水Wiを削除の候補とする。
(3):(1)、(2)以外の場合で、ネットワーク中の水素結合およびVDW結合の総数が、水Wiの方が水Wcよりも多いときは、水Wcを削除の候補とする。
(4):(1)、(2)以外の場合で、ネットワーク中の水素結合およびVDW結合の総数が、水Wcの方が水Wiよりも多いときは、水Wiを削除の候補とする。
(5):(1)〜(4)以外の場合は、ネットワークリストに加えた順序が早い方を削除の候補とする。
【0082】
なお、(1)〜(5)で削除の候補とする水が、既に削除の候補になっているときは、重ねて削除の候補とすることはしない。
【0083】
ショートコンタクトの判定および処理の後、水の番号iに1を加えて(S338)、番号iがネットワークリスト内の水の総数を超えているか否かを判定し(S340)、超えていなければステップS320に戻り、超えているときは、修正候補の検出処理を終えて、図8の処理に戻る。
【0084】
この修正候補の検出処理は、図8の水チェック処理からの1度の呼出しで、ネットワーク内の全ての水について1回行われる。したがって、SYMM結合をしている第1の水からたんぱく質分子またはリガンドに至る経路に、SYMM結合をしている第2の水が存在する場合、第1の水については、ステップS322の判定結果が偽となり、ステップS328の修正候補リストへの追加処理は行われない。しかしながら、修正候補の検出処理は水チェック処理から何度も呼び出されるため、第2の水が修正候補リストに加えられ、その修正が実行された後は、第1の水についてのステップS322の判定結果は真となり、第1の水も修正候補リストに加えられて、修正が実行されることになる。
【0085】
図12は、図8のステップS26で行う自動修正の処理を示すフローチャートである。まず、修正候補リストに矛盾がある場合に対処するために、ステップS402とS404の2つの判定を行う。ステップS402では、修正候補リストに、同一の水について、属性がtrueの削除の修正候補と、属性がtrueの対称操作および並進操作後の位置への移動の修正候補があるか否かを判定する。また、ステップS404では、修正候補リストに、同一の水について、属性がtrueの削除の修正候補と、属性がtrueの特異点への移動の修正候補があるか否かを判定する。そして、どちらのステップでも、同一の水について2つの修正候補があるときは、ステップS406に進んで修正不可能として、処理を終えて、図8の処理に戻る。
【0086】
修正候補リストに矛盾がない場合、修正候補の番号jを1とし(S408)、修正候補Mjの属性がtrueであるか否かを判定して(S410)、属性がtrueの場合に限り、修正を実行する(S412)。そして、番号jに1を加えて(S414)、番号jが修正候補の総数を超えているか否かを判定し(S416)、超えていなければステップS410に戻り、超えていれば、修正成功として(S418)、処理を終えて、図8の処理に戻る。
【0087】
図13は、図8のステップS30で行う手動修正の処理を示すフローチャートである。まず、修正候補を、修正候補表示ウィンドウ35に表示して、使用者に提示する(S502)。これに応じて、使用者は修正候補リストの属性を任意に変更する。次いで、使用者から修正実行の指示が与えられたか否かを判定し(S504)、キャンセルが指示されたときは、ステップS520に進んで修正成功として、処理を終えて、図8の処理に戻る。
【0088】
修正実行の指示が与えられたときは、修正候補リストに矛盾がある場合に対処するために、ステップS506とS508の2つの判定を行う。ステップS506では、修正候補リストに、同一の水について、属性がtrueの削除の修正候補と、属性がtrueの対称操作および並進操作後の位置への移動の修正候補があるか否かを判定する。ステップS508では、修正候補リストに、同一の水について、属性がtrueの削除の修正候補と、属性がtrueの特異点への移動の修正候補があるか否かを判定する。そして、どちらのステップでも、同一の水について2つの修正候補があるときは、ステップS502に戻る。
【0089】
次いで、修正候補の番号jを1とし(S510)、修正候補Mjの属性がtrueであるか否かを判定して(S512)、属性がtrueの場合に限り、修正を実行する(S514)。そして、番号jに1を加えて(S516)、番号jが修正候補の総数を超えているか否かを判定し(S518)、超えていなければステップS512に戻り、超えていれば、修正成功として(S520)、処理を終えて、図8の処理に戻る。
【0090】
次に、側鎖チェックプログラム22について説明する。側鎖チェックプログラム22は、モデルのたんぱく質分子に含まれる個々のAsn残基、Gln残基およびHis残基を、X線結晶構造解析に用いた結晶が属する空間群の対称操作により単位格子内で移動させ、さらに、並進操作により隣接する単位格子に移動させて、水素結合またはVDW結合によって繋がる1以上のネットワークを検出する。なお、空間群の対称操作には、位置を変えない操作も含まれており、したがって、検出されたネットワークには、移動により位置が変わった残基と、位置が変わらない残基の双方が含まれる。ネットワークには、水素結合またはVDW結合によってAsn残基、Gln残基またはHis残基に直接繋がる他のアミノ酸残基(20種)も含める。
【0091】
そして、各ネットワーク内のAsn残基、Gln残基およびHis残基の側鎖を個別に反転(180゜回転)させて、側鎖の向きが異なる全ての修飾モデルを作成するとともに、作成した修飾モデルにおける水素結合を検出して、Asn残基、Gln残基およびHis残基の側鎖の向きを、水素結合の総数が最も多い修飾モデルにおける向きにする。1つのネットワークに含まれるAsn残基、Gln残基およびHis残基の総数をNとするとき、1つのネットワークについて作成される修飾モデルの数は2となる。通常、ネットワークに含まれるこれら3種のアミノ酸残基の数Nは、5〜6個程度まで、多くても10個程度である。したがって、修飾モデルの数は1000程度以下となり、膨大な数にはならない。
【0092】
Asn残基、Gln残基およびHis残基の側鎖のうち反転させる部分は、次のとおりである。Asn残基においては、CβとCγの結合に関して、Oδ1およびNδ2を反転させ、Gln残基においては、CγとCδの結合に関して、Oε1およびNε2を反転させる。また、His残基においては、CβとCγの結合に関して、Nδ1、Cδ2、Cε1およびNε2を反転させる。
【0093】
側鎖チェックプログラム22は、自動修正モードと手動修正モードを有しており、これらのモードは、使用者が入力部14からの入力によって、選択することができる。自動修正モードでは、Asn残基、Gln残基およびHis残基の側鎖の反転が実行され、手動修正モードでは、側鎖を反転すべきことの提示がなされる。
【0094】
図14は、側鎖チェックプログラム22が手動修正モードおいて表示部13に表示する画面の概略を示している。表示画面40は、構造表示ウィンドウ41、残基リスト表示ウィンドウ42、ネットワーク表示ウィンドウ43、および修正候補表示ウィンドウ44を有する。構造表示ウィンドウ41には、Asn残基、Gln残基およびHis残基のネットワークの立体構造を表示する。残基リスト表示ウィンドウ42には、Asn、GlnおよびHisの各残基が含まれるネットワーク番号と、そのネットワークに含まれる水素結合およびVDW結合の数を表示する。ネットワーク表示ウィンドウ43には、1つのネットワークの構造を模式的な態様で表示する。
【0095】
修正候補表示ウィンドウ44には、修正候補の、つまりいずれかの側鎖を反転させるのが好ましいネットワークと、修正した場合のそのネットワークにおける、反転させた側鎖の数と、水素結合の数を表示する。
【0096】
図15の(a)〜(c)は、それぞれ、構造表示ウィンドウ41、ネットワーク表示ウィンドウ43および修正候補表示ウィンドウ44の表示例を示す。この例では、修正候補表示ウィンドウ44には、同一のネットワークについて2つの修正候補が示されている。使用者は、修正候補を選択して、選択した修正候補に対応する立体構造および模式的構造を、それぞれ、構造表示ウィンドウ41およびネットワーク表示ウィンドウ43に表示させることができる。図15の(a)、(b)は一方の修正候補を使用者が選択したときのものである。図16に、他方の修正候補を使用者が選択したときの構造表示ウィンドウ41、ネットワーク表示ウィンドウ43、および修正候補表示ウィンドウ44の表示例を示す。
【0097】
側鎖チェックプログラム22が行うAsn残基、Gln残基およびHis残基の側鎖チェックの処理を、図17〜図21のフローチャートを参照して説明する。図17は側鎖チェック処理全体を示すフローチャートである。まず、モデルを読み込み(ステップS602)、未処理リストを用意して、これにモデル内の全てのAsn残基、Gln残基およびHis残基を入れる(S604)。そして、ネットワークの番号を1にして(S606)、未処理リストから水を1つ取り出す(S608)。
【0098】
次いで、Asn残基、Gln残基およびHis残基のネットワークを作成する(S610)。このネットワーク作成処理については後に詳述する。ネットワーク作成後、ネットワークに含まれるAsn残基、Gln残基およびHis残基を未処理リストから削除し(S612)、未処理リストにアミノ酸残基があるか否かを判定する(S614)。未処理リストにアミノ酸残基があるときは、ネットワーク番号を更新(1を加える)して(S616)、ステップS608に戻り、ステップS614までの処理を繰返す。以上で、全てのネットワークが検出される。
【0099】
ステップS614の判定で未処理リストにアミノ酸残基がないときは、ネットワーク番号を1にし(S618)、修正候補を検出する(S620)。修正候補検出処理については後に詳述する。修正候補検出処理の後、修正候補があるか否かを判定し(S622)、修正候補がなければステップS632に進む。修正候補があるときは、自動修正が指示されているか否か、つまり自動修正モードに設定されているか否かを判定し(S624)、自動修正が指示されているときは自動修正を行う(S626)。自動修正が指示されていないとき、つまり手動修正モードに設定されているときは、手動修正(S628)を行う。自動修正および手動修正の処理については後述する。
【0100】
その後、終了指示が与えられたか否かを判定し(S630)、終了指示がないときはステップS620に戻る。終了指示があったときは、ネットワーク番号を更新(1を加える)して(S632)、その番号のネットワークが存在するか否かを判定し(S634)、存在するときはステップS620に戻り、存在しないときは側鎖のチェック処理を終了する。以上で、検出した各ネットワークについて、修正すべきAsn残基、Gln残基およびHis残基の検出と修正の実行がなされる。
【0101】
図18Aおよび図18Bは、図17のステップS610で行うネットワークの作成処理を示すフローチャートである。まず、モデルの立体構造を読み込み(ステップS702)、参照リストと複数のネットワークリストとを用意して初期化(クリア)し(S704)、図17のステップS608で未処理リストから取り出したアミノ酸残基を、参照リストとネットワークリストに入れる(S706)。そして、参照リストから1つのアミノ酸残基Rを取り出す(S708)。取り出したアミノ酸残基Rは参照リストから削除する。最初は、ステップS706で入れたアミノ酸残基を取り出すことになる。
【0102】
そして、そのアミノ酸残基Rについて、側鎖と主鎖とが水素結合またはVDW結合をしているか否か、つまり自己結合をしているか否かを判定し(S710)、しているときはネットワークリストに、その自己結合を本結合として加える(S712)。ただし、結合距離が1.5Å以下のときはショート結合とする。なお、本結合は、前述のように、水素結合およびVDW結合のうち、結合している2原子が共に、対称操作および並進操作によって位置が変化しなかったものである場合の結合のことである。
【0103】
次いで、アミノ酸残基Rの等価残基Riを発生させる(S714)。等価残基とは、空間群の対称操作で移動させ、さらに、並進操作で隣接する単位格子に移動させたアミノ酸残基のことである。したがって、等価残基Riにはアミノ酸残基Rそのものも含まれる。等価残基の総数をnとする。等価残基の発生処理は、水のネットワークに関して図10Aおよび図10Bに示した等価水の発生処理と、同様である。
【0104】
等価残基Riを発生させた後、アミノ酸残基Rが自己結合をしているか否か、つまりアミノ酸残基Rといずれかの等価残基Riとが水素結合またはVDW結合をしているか否かを判定する(S716)。ただし、アミノ酸残基Rと座標が同一の等価残基Riは無視する。自己結合をしているときは、ネットワークリストにアミノ酸残基Rと等価残基Riとの自己結合をSYMM結合として加える(S718)。ただし、結合距離が1.5Å以下のときはショート結合とする。なお、SYMM結合は、前述のように、水素結合およびVDW結合のうち、結合している2原子の少なくとも一方が、対称操作および並進操作によって位置が変化したものである場合の結合である。
【0105】
次いで、等価残基Riの番号iを1とし(S720)、等価残基Riと水素結合またはVDW結合をしている全てのアミノ酸残基Sjを検出する(S722)。ここで、アミノ酸残基の種類は問わず、Asn残基、Gln残基およびHis残基以外のアミノ酸残基も対象とする。また、水素結合またはVDW結合をする部位は問わず、側鎖同士、主鎖同士、側鎖と主鎖の結合を対象とする。
【0106】
そして、アミノ酸残基Sjの番号jを1とし(S724)、アミノ酸残基Sjがネットワークリストに存在するか否かを判定する(S726)。アミノ酸残基Sjがネットワークリストに存在しないときは、アミノ酸残基Sjをネットワークリストに加え(S728)、さらに、アミノ酸残基SjがAsn残基、Gln残基またはHis残基であるか否かを判定する(S730)。アミノ酸残基Sjがこれら3種のいずれかのアミノ酸残基であるときは、アミノ酸残基Sjを参照リストにも加える(S732)。
【0107】
また、等価残基Riとアミノ酸残基Sjとの結合がネットワークリストに存在するか否かを判定し(S734)、存在しなければその結合をネットワークリストに加える(S736)。このとき、等価残基Riがアミノ酸残基Rと同じであれば、ネットワークリストに加える結合を本結合とし、等価残基Riがアミノ酸残基Rと異なれば、ネットワークリストに加える結合をSYMM結合とする。また、等価残基Riとアミノ酸残基Sjの距離が1.5Å未満のときは、ネットワークリストに加える結合をショート結合とする。
【0108】
その後、番号jに1を加えて(S738)、番号jが等価残基Riに結合しているアミノ酸残基Sjの総数mを超えているか否かを判定し(S740)、超えていなければステップS726に戻り、超えているときはステップS742に進む。
【0109】
ステップS742では、等価残基Riと水素結合またはVDW結合をしている全ての水およびリガンドUkを検出する(S742)。そして、水またはリガンドの番号Ukの番号kを1とし(S744)、水またはリガンドUkがネットワークリストに存在するか否かを判定する(S746)。水またはリガンドUkがネットワークリストに存在しないときは、水またはリガンドUkをネットワークリストに加える(S748)。
【0110】
次いで、等価残基Riと水またはリガンドUkとの水素結合またはVDW結合がネットワークリストに存在するか否かを判定し(S750)、存在しなければその結合をネットワークリストに加える(S752)。ここでも、ステップS736と同様に、等価残基Riがアミノ酸残基Rと同じであれば、ネットワークリストに加える結合を本結合とし、等価残基Riがアミノ酸残基Rと異なれば、ネットワークリストに加える結合をSYMM結合とする。また、等価残基Riと水またはリガンドUkの距離が1.5Å未満のときは、ネットワークリストに加える結合をショート結合とする。
【0111】
その後、番号kに1を加えて(S754)、番号kが検出された水およびリガンドの総数pを超えているか否かを判定し(S756)、超えていなければステップS746に戻る。
【0112】
番号kが水およびリガンドの総数pを超えているときは、等価残基Riの番号iに1を加えて(S758)、番号iが等価残基Riの総数nを超えているか否かを判定し(S760)、超えていなければステップS722に戻る。番号iが等価残基Riの総数nを超えているときは、参照リストに水が存在するか否かを判定する(S762)。参照リストに水が存在するときはステップS708に戻り、存在しないときは、ネットワーク作成処理を終了して、図17の処理に戻る。
【0113】
ステップS708からS760までの処理で、1つのネットワークを形成するAsn残基、Gln残基およびHis残基が全て検出されて、ネットワークリストに加えられていく。また、そのネットワークと直接水素結合またはVDW結合をするアミノ酸残基、水およびリガンドもネットワークリストに加えられていく。
【0114】
図19は、図17のステップS620で行う修正候補の検出処理を示すフローチャートである。まず、モデルとネットワークリストを読み込む(ステップS802)。そして、読み込んだネットワークGに含まれる全てのAsn残基、Gln残基およびHis残基の総数をNとし、各アミノ酸残基の側鎖の向きを個別に反転させる組合せROTATEj(bi)を作成する(S804)。ここで、jは組合せの番号であり、1〜2の値をとる。また、iはネットワークG内でのアミノ酸残基の番号を表す。biは、番号iのアミノ酸残基の側鎖を反転させるか否かを示すフラグであって、trueまたはfalseの値をとる。
【0115】
次いで、修正候補リストを用意して初期化(クリア)し(S806)、ネットワークG内およびネットワークGとモデルの他の部分(そのネットワークに含まれていないアミノ酸残基、水およびリガンド)との水素結合を検出して(S808)、検出した水素結合の数HBiniを記憶する(S810)。
【0116】
その後、組合せの番号jを1とし(S812)、ネットワークGと同一のネットワークGjを作成する(S814)。ネットワークGjの作成後、アミノ酸残基の番号iを1とし(S816)、組合せROTATEjのi番目のフラグbiがtrueであるか否かを判定して(S818)、フラグbiがtrueのときは、ネットワークGjのi番目のアミノ酸残基の側鎖を反転させる(S820)。そして、番号iに1を加えて(S822)、番号iがアミノ酸残基の総数Nを超えているか否かを判定し(S824)、超えていなければステップS818に戻る。ステップS812〜S824の処理により、ネットワークGjは修飾されたネットワークとなり、ネットワークGに代えてネットワークGjを含むモデルは、修飾されたモデルとなる。
【0117】
番号iがアミノ酸残基の総数Nを超えているときは、ネットワークGj内およびネットワークGjとモデルの他の部分との水素結合を検出して(S826)、検出した水素結合の数HBjがステップS810で記憶した水素結合の数HBini以上であるか否かを判定する(S828)。水素結合数HBjが水素結合数HBini以上のときには、ネットワークGjと水素結合の数HBjを修正候補リストに加える(S830)。
【0118】
次いで、組合せの番号jに1を加えて(S832)、番号jが組合わせの総数2を超えているか否かを判定し(S834)、超えていなければステップS814に戻る。番号jが総数2を超えているときは、修正候補リストを水素結合の数HBjが多い順に並び替えて(S836)、修正候補の検出処理を終了し、図17の処理に戻る。
【0119】
図20は、図17のステップS626で行う自動修正の処理を示すフローチャートである。まず、修正候補リストとネットワークGを読み込み(ステップS902)、組合せの番号sを1とする(S904)。これで水素結合の数HBjが最も多かった組合せが指定される。そして、ネットワーク内のアミノ酸残基の番号iを1として(S906)、組合せROTATEsのi番目のフラグbiがtrueであるか否かを判定し(S908)、フラグbiがtrueのときは、ネットワークGのi番目のアミノ酸残基の側鎖を反転させる(S910)。
【0120】
その後、番号iに1を加えて(S912)、番号iがネットワーク内の3種のアミノ酸残基の数Nを超えているか否かを判定し(S914)、超えていなければステップS908に戻る。番号iがアミノ酸残基の数Nを超えているときは、自動修正の処理を終了して、図17の処理に戻る。
【0121】
図21は、図17のステップS628で行う手動修正の処理を示すフローチャートである。まず、修正候補リストとネットワークGを読み込み(ステップS1002)、修正候補リストを、修正候補表示ウィンドウ44に表示して、使用者に提示する(S1004)。これに応じて、使用者は、任意の修正候補を選択して修正実行の指示を与え、またはキャンセルの指示を与える。次いで、修正実行の指示が与えられたか否かを判定し(S1006)、キャンセルが指示されたときは、処理を終えて、図17の処理に戻る。
【0122】
修正実行の指示が与えられたときは、選択された修正候補の番号を組合せROTATEの番号sとする(S1008)。そして、ネットワーク内のアミノ酸残基の番号iを1として(S1010)、組合せROTATEsのi番目のフラグbiがtrueであるか否かを判定し(S1012)、フラグbiがtrueのときは、ネットワークGのi番目のアミノ酸残基の側鎖を反転させる(S1014)。
【0123】
その後、番号iに1を加えて(S1016)、番号iがネットワーク内の3種のアミノ酸残基の数Nを超えているか否かを判定し(S1018)、超えていなければステップS1012に戻る。番号iがアミノ酸残基の数Nを超えているときは、手動修正の処理を終了して、図17の処理に戻る。
【0124】
上述の水チェック処理とAsn、GlnおよびHisの各アミノ酸残基の側鎖チェック処理は、一方の結果が他方に影響を与える。したがって、水チェック処理と側鎖チェック処理は交互に何度か行うのが好ましい。図2に示した水チェックプログラム21と側鎖チェックプログラム22とを、交互に呼び出す上位のプログラムを用意して、水チェックプログラム21と側鎖チェックプログラム22を自動修正モードで動作させることも可能である。このようにすると、水のネットワークおよびAsn残基、Gln残基およびHis残基の側鎖の向きを、容易に適切にすることができる。なお、図2に示したプログラムは、CDなどの着脱可能な記録媒体に記録して、あるいは、インターネットなどのネットワークを介して、配布することができる。
【図面の簡単な説明】
【0125】
【図1】本発明の実施の一形態であるコンピュータシステム1の構成を模式的に示すブロック図である。
【図2】モデルチェックプログラム11cの機能を示すブロック図である。
【図3】水のネットワークを模式的に示す図である。
【図4】水チェックプログラム21が表示部13に表示する画面の概略を示す図である。
【図5】構造表示ウィンドウ31、水リスト表示ウィンドウ32、水ネットワークリスト表示ウィンドウ33、および水ネットワーク表示ウィンドウ34のそれぞれの表示例を示す図である。
【図6】修正前の修正候補表示ウィンドウ35の表示例と、対応する水ネットワーク表示ウィンドウ34の表示例を示す図である。
【図7】図6の修正を行った後の修正候補表示ウィンドウ35の表示例と、対応する水ネットワーク表示ウィンドウ34の表示例を示す図である。
【図8】水チェック処理全体を示すフローチャートである。
【図9A】図8のステップS10で行う水のネットワークの作成処理を示すフローチャートの前半である。
【図9B】図8のステップS10で行う水のネットワークの作成処理を示すフローチャートの後半である。
【図10A】図9AのステップS108で行う等価水の発生処理を示すフローチャートの前半である。
【図10B】図9AのステップS108で行う等価水の発生処理を示すフローチャートの後半である。
【図11A】図8のステップS20で行う修正候補の検出処理を示すフローチャートの前半である。
【図11B】図8のステップS20で行う修正候補の検出処理を示すフローチャートの後半である。
【図12】図8のステップS26で行う自動修正の処理を示すフローチャートである。
【図13】図8のステップS30で行う手動修正の処理を示すフローチャートである。
【図14】側鎖チェックプログラム22が表示部13に表示する画面の概略を示す図である。
【図15】構造表示ウィンドウ41、ネットワーク表示ウィンドウ43および修正候補表示ウィンドウ44の表示例を示す図である。
【図16】構造表示ウィンドウ41、ネットワーク表示ウィンドウ43および修正候補表示ウィンドウ44の他の表示例を示す図である。
【図17】側鎖チェック処理全体を示すフローチャートである。
【図18A】図17のステップS610で行うネットワークの作成処理を示すフローチャートの前半である。
【図18B】図17のステップS610で行うネットワークの作成処理を示すフローチャートの後半である。
【図19】図17のステップS620で行う修正候補の検出処理を示すフローチャートである。
【図20】図17のステップS626で行う自動修正の処理を示すフローチャートである。
【0126】
【図21】図17のステップS628で行う手動修正の処理を示すフローチャートである。
【符号の説明】
【0127】
1 コンピュータシステム
11 記憶部
11a 構築モデル
11b 結晶情報
11c モデルチェックプログラム
12 演算部
13 表示部
14 入力部
15 出力部
16 ネットワークインターフェース部
21 水チェックプログラム
22 側鎖チェックプログラム
23 パッキングチェックプログラム
24 ジオメトリチェックプログラム
25 シーケンスチェックプログラム
26 フォーマットチェックプログラム
30 表示画面
31 構造表示ウィンドウ
32 水リスト表示ウィンドウ
33 水ネットワークリスト表示ウィンドウ
34 水ネットワーク表示ウィンドウ
35 修正候補表示ウィンドウ
40 表示画面
41 構造表示ウィンドウ
42 残基リスト表示ウィンドウ
43 ネットワーク表示ウィンドウ
44 修正候補表示ウィンドウ

【特許請求の範囲】
【請求項1】
たんぱく質のX線構造解析で構築したモデルの水の位置を修正するためのプログラムであって、
モデル内の個々の水を、X線構造解析に用いた結晶が属する空間群の全ての対称操作によって単位格子内で移動させ、かつ、並進操作によって隣接する単位格子に移動させて、水素結合またはファンデルワールス結合によって相互に繋がる1以上の水のネットワークを検出する手順と、
各ネットワークに含まれているいずれかの水が水素結合またはファンデルワールス結合をするたんぱく質分子のアミノ酸残基またはリガンドを検出する手順と、
モデル内の水の位置を、アミノ酸残基またはリガンドに結合するネットワークに含まれる位置に変更する手順、または、モデル内の水の位置を、アミノ酸残基またはリガンドに結合するネットワークに含まれる位置に変更すべきことを使用者に提示する手順とを
コンピュータに実行させることを特徴とするプログラム。
【請求項2】
検出したネットワークに1つの水のみが含まれているときに、その水を削除する手順、または、その水を削除すべきことを使用者に提示する手順をコンピュータに実行させることを特徴とする請求項1記載のプログラム。
【請求項3】
検出したネットワークに含まれているいずれの水も、水素結合またはファンデルワールス結合によって、アミノ酸残基およびリガンドに結合しないときに、そのネットワークに含まれている全ての水を削除する手順、または、そのネットワークに含まれている全ての水を削除すべきことを使用者に提示する手順をコンピュータに実行させることを特徴とする請求項1記載のプログラム。
【請求項4】
検出したネットワークに含まれている水からアミノ酸残基またはリガンドまでの距離が所定距離以下のときに、その水を削除する手順、または、その水を削除すべきことを使用者に提示する手順をコンピュータに実行させることを特徴とする請求項1記載のプログラム。
【請求項5】
検出したネットワークに含まれている水同士の距離が所定距離以下のときに、所定の基準に基づいて、一方の水を削除しもしくはその位置を変更する手順、または、一方の水を削除しもしくはその位置を変更すべきことを使用者に提示する手順をコンピュータに実行させることを特徴とする請求項1記載のプログラム。
【請求項6】
たんぱく質のX線構造解析で構築したモデルのAsn残基、Gln残基およびHis残基の側鎖の向きを修正するためのプログラムであって、
モデル内の個々のAsn残基、Gln残基およびHis残基を、X線構造解析に用いた結晶が属する空間群の全ての対称操作によって単位格子内で移動させ、かつ、並進操作によって隣接する単位格子に移動させて、水素結合またはファンデルワールス結合によって相互に繋がる1以上のAsn残基、Gln残基およびHis残基のネットワークを検出する手順と、
各ネットワークに含まれている全てのAsn残基、Gln残基およびHis残基の側鎖の向きを個別に反転させて、側鎖の向きが異なる全ての修飾モデルを作成し、各修飾モデルの水、アミノ酸残基およびリガンド間の水素結合を検出して、各ネットワークに含まれているAsn残基、Gln残基およびHis残基の側鎖の向きを、水素結合の総数が最も多い修飾モデルにおける向きに変更する手順、または、変更すべきことを使用者に提示する手順とを
コンピュータに実行させることを特徴とするプログラム。
【請求項7】
ネットワークを検出する手順において、ネットワークに含まれているAsn残基、Gln残基またはHis残基が、Asn残基、Gln残基およびHis残基以外のアミノ酸残基と水素結合またはワンデルワールス結合をし、かつ、そのアミノ酸残基が他のAsn残基、Gln残基またはHis残基と水素結合またはワンデルワールス結合をするときに、そのアミノ酸残基と他のAsn残基、Gln残基またはHis残基をネットワークに含めることをコンピュータに実行させることを特徴とする請求項6記載のプログラム。
【請求項8】
たんぱく質のX線構造解析で構築したモデルを修正するためのコンピュータシステムであって、
モデルを記憶するモデル記憶部と、
請求項1〜7のいずれかに記載のプログラムを記憶するプログラム記憶部と、
プログラム記憶部に記憶されたプログラムの手順を実行する実行部と
を含むことを特徴とするモデルを修正するコンピュータシステム。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9A】
image rotate

【図9B】
image rotate

【図10A】
image rotate

【図10B】
image rotate

【図11A】
image rotate

【図11B】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18A】
image rotate

【図18B】
image rotate

【図19】
image rotate

【図20】
image rotate

【図21】
image rotate


【公開番号】特開2008−9939(P2008−9939A)
【公開日】平成20年1月17日(2008.1.17)
【国際特許分類】
【出願番号】特願2006−182529(P2006−182529)
【出願日】平成18年6月30日(2006.6.30)
【国等の委託研究の成果に係る記載事項】(出願人による申告)国等の委託研究の成果に係る特許出願(平成18年度、文部科学省、タンパク3000委託研究「タンパク質基本構造の網羅的解析プログラム」、産業活力再生特別措置法第30条の適用を受けるもの)
【出願人】(503359821)独立行政法人理化学研究所 (1,056)
【出願人】(000233055)日立ソフトウエアエンジニアリング株式会社 (1,610)
【Fターム(参考)】