説明

分子もしくは分子集合体の立体構造の構造地図作成方法および装置、ならびにプログラムおよびそれを記録した媒体

【課題】非線形性が高くあるいは主成分の寄与が小さい分子もしくは分子集合体の運動を解析するために当該分子もしくは分子集合体がとり得る立体構造の類似度を表す構造地図を作成する。
【解決手段】本発明に係る分子構造の構造地図作成方法、装置、あるいはプログラムによれば、立体構造について操作者が設定した複数の部分である特徴部分が平面で近似され、その平面間の相対的な関係をハミルトンの四元数を用いて記述することにより前記分子もしくは分子集合体の複数種類の立体構造が記述され、該立体構造記述工程によって記述された複数種類の立体構造のそれぞれに対応する複数の表示点を該複数種類の立体構造間の類似度を示すように平面上又は曲面上または3次元空間上に表示されるので、好適に構造地図を作成することができる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、分子もしくは分子集合体のとり得る複数種類の立体構造間の類似度を平面上又は曲面上または3次元空間上に示す構造地図の作成方法、装置、コンピュータが実行可能なプログラムおよび該プログラムを記録したコンピュータ読み取り可能な媒体に関するものである。
【背景技術】
【0002】
分子もしくは分子集合体の立体構造(以下、「分子構造」ともいう)やその分子運動の様子を示すダイナミクスは、生体分子や分子集合体(クラスタ)の物性や機能と密接に関わっており、たとえば、新規薬剤設計や新規物性予測などにおいて効果を発揮するものとして、その特徴を効果的に解析し把握することが求められている。
【0003】
従来においては、分子のとり得る複数種類の立体構造の出現頻度やそれらの時系列変化であるダイナミクスを解析する方法として、たとえば分子内の二面角や原子間距離のような個別のパラメータの分布や時系列変化を局所的に独立して解析するか、それらについて主成分解析を行う等の手法が広く用いられてきた。
【0004】
しかしながら、これら従来の方法においては、たとえば、ある分子における特定の二面角や2つの原子の原子間距離が同一であっても、前記分子の分子構造が同一であるとは限らず、分子の立体構造の類似度を評価することができないといったように、個々の構造パラメータを独立に調べても分子全体がどのような構造をどれほどの頻度でとり、どのように動いているかを把握することができない。また、分子構造の自由度が大きく、そのダイナミクスにおける非線形性が高いような分子あるいは分子集合体を扱う場合は、主成分解析を用いても分子全体に及ぼす主成分の影響が少なく、主成分解析によってもダイナミクスの特徴を効果的に抽出することが難しい。
【0005】
Choi氏は、分子を回転可能な複数の部分に分割し、これら複数の部分の並進および回転の関係のそれぞれを3次元ベクトルおよびハミルトンの四元数を用いて表現することを提案した(非特許文献4)。この方法によれば、分子構造は、四元数の配列によって表現されることができ、分子の立体構造を、その分子を構成する個々の原子の3次元座標を全て記載することなしに把握することが可能となった。
【0006】
一方、自己組織化マップ(Self Organizing Map;SOM)はT.コホネン氏によって提案された、高次元の入力データを高次元空間から低次元空間へ非線形に写像することにより高次元空間内における入力データの類似関係を保ったまま低次元空間へ写像を行うことができる手法である(たとえば非特許文献1、2参照)。この応用例として、特許文献1においては、上記SOMを塩基配列の分類システムなどに適用している。ここで、分子または分子集合体の立体構造は高次元のデータで表され得ることから、分子または分子集合体の立体構造の解析に前記SOMを用いることができれば、分子または分子集合体の立体構造の類似関係をたとえば2次元平面上に表現することができ、その解析が容易になることが期待されている(非特許文献3)。
【0007】
【非特許文献1】T.コホネン著、徳高平蔵、岸田悟、藤村喜久郎訳、「自己組織化マップ」、シュプリンガー・フェアラーク東京株式会社、2005年6月7日発行
【非特許文献2】徳高平蔵、岸田悟、藤村喜久郎著、「自己組織化マップの応用−多次元情報の2次元可視化」、海文堂出版株式会社、1999年2月20日
【非特許文献3】Marja T.Hyvonen他、”Application of Self−Organizing Maps in Conformational Analysis of Lipids”、JOURNAL OF AMERICAN CHEMICAL SOCIETY、(米国)、AMERICAN CHEMICAL SOCIETY、2001年、123巻、51号、p.810−816
【非特許文献4】Vicky Choi、”On Updating Torsion Angles of Molecular Conformations”、JOURNAL OF AMERICAN CHEMICAL INFORMATION ANDCOMPUTER SCIENCES、(米国)、AMERICAN CHEMICAL SOCIETY、2006年、46巻、6号、p.438−444
【特許文献1】特開2005−092786号公報
【発明の開示】
【発明が解決しようとする課題】
【0008】
しかしながら、このSOMを分子の構造の解析に適用する場合に、分子を構成するすべての原子についての情報、たとえばすべての原子の3次元座標をSOMの入力ベクトルとすることは、高分子化合物の分子構造を解析する場合、膨大な量の計算の実行を必要とすることになり、望ましいものではない。また、この方法では、たとえ同じ分子構造であっても分子全体が回転した場合に同一の入力ベクトルとはならない問題がある。この問題を防ぐため、分子全体が回転した結果同じ分子構造になった場合に回転前後の入力ベクトルを同じものとする処理である重ね合わせ処理を実行することにすると、さらに膨大な量の計算が必要となる。そのため、上述のChoiらに提案された、分子構造の四元数配列による表現をSOMの入力とすることにより、計算量を削減することが考えられる。
【0009】
ところで、有限個の入力ベクトルからSOMを作成する際には、SOMの学習方法として、その有限個の入力ベクトルを各ノード、すなわち各表示点に振り分けてから一斉に全ノードの重みベクトルを更新する方法すなわちバッチ学習を用いることが、計算量が少なく格段に高速な方法として有効である。このバッチ学習を行う際には、その過程において、各ノードに振り分けられた複数の入力ベクトルの平均が必要である。しかしながら、従来技術においては、2つの四元数配列の平均については、2つの四元数の平均値を求める手法に基づき算出することができるものの、3つ以上の四元数の平均を求める方法はなく、3つ以上の四元数配列の平均を算出することができなかった。したがって、上記分子構造の四元数配列による表現をSOMの入力とすることができず、すなわち、四元数配列により表現された分子構造の構造地図をSOMのバッチ学習によって作成することはできなかった。
【0010】
また、上記SOMのバッチ学習を行う際には、SOMの入力ベクトルを、最も近い重みベクトルを有するノードに対応する集合に振り分ける必要がある。上述の四元数配列によって表現された分子構造をSOMの入力ベクトルおよび重みベクトルとする場合には、四元数配列である入力ベクトルと重みベクトルの近さすなわち類似度を示す指標が必要となる。2つの四元数配列間の近さは、2つの四元数の擬似的な距離に基づいて数学的に評価することが出来る。そして、この2つの四元数間の擬似的な距離として片方の逆四元数による回転(逆回転)と他方の四元数による回転を合成した回転の回転角度の大きさによる定義がなされている。しかしながら、この定義によると、回転角度の算出には逆余弦関数の計算を含むため、計算量が大きくなるという問題があった。
【0011】
本発明は、以上の事情を背景としてなされたもので、その目的とするところは、分子もしくは分子集合体の運動を解析することができる、四元数配列によって表現された分子構造を用いて、分子もしくは分子集合体のとりうる複数種類の立体構造間の類似度を表す構造地図を作成する構造地図作成方法を提供することにある。
【課題を解決するための手段】
【0012】
本発明者は、上記目的を達成するために種々検討を重ね、分子もしくは分子集合体のとりうる立体構造について、以下の点を見いだした。すなわち、3以上の複数の四元数の平均値についての定式化を行うことができれば、四元数配列で表現された分子構造をSOMの入力ベクトルとすることにより、SOMのバッチ学習を用いて分子構造の構造地図を作成することが可能であること、および従来手法よりも計算量が少ない2つの四元数間の距離の新たな定義を行うことができれば、計算量を少なくすることにより、より高速にSOMを用いた分子構造の構造地図を作成し得るというものである。本発明はこのような知見に基づいてなされたものである。
【0013】
すなわち、前記目的を達成するための請求項1または請求項11に係る発明は、分子もしくは分子集合体のとり得る複数の立体構造の類似度を平面上または曲面上または3次元空間上に示す構造地図作成方法または装置であって、(a)前記分子もしくは分子集合体の立体構造内に予め設定された複数の特徴部分の相対的配置関係をハミルトンの四元数を用いて数値化する事により、前記分子もしくは分子集合体の複数種類の立体構造のそれぞれを記述する立体構造記述工程と、(b)該立体構造記述工程によって記述された複数種類の立体構造のそれぞれに対応する複数の表示点を該複数種類の立体構造間の類似度を示すように平面上又は曲面上または3次元空間上に表示する事によって構造地図を作成する構造地図出力工程と、を有することを特徴とする。
【発明の効果】
【0014】
本発明に係る分子構造の構造地図作成方法、装置、あるいはプログラムによれば、立体構造内について操作者が設定した複数の部分である特徴部分の相対的な関係をハミルトンの四元数を用いて記述することにより前記分子もしくは分子集合体の複数種類の立体構造が記述され、該立体構造記述工程または立体構造記述手段によって記述された複数種類の立体構造のそれぞれに対応する複数の表示点を該複数種類の立体構造間の類似度を示すように平面上又は曲面上または3次元空間上に表示されるので、好適に構造地図を作成することができる。また、このとき前記立体構造記述工程または立体構造記述手段において用いられる、前記立体構造内の複数の特徴部分間の相対的な関係は、前記立体構造内の複数の特徴部分間の相対的傾きであり、該複数の特徴部分間の相対的関係はハミルトンの四元数を用いて記述されることから、前記複数の立体構造中の特徴部分である、たとえば分子または分子集合体内の複数の平面構造、たとえば芳香環などの環構造の相対的な関係を、回転の関係を表す正確かつ単純な形式で記述でき、分子または分子集合体の複数種類の立体構造を数値により表現し、解析することができる。
【0015】
また、好適には、請求項2または請求項12に係る発明は、前記ハミルトンの四元数のそれぞれは、重み付けがなされていることを特徴とする。この重み付けは、該四元数によって相対関係が記述される二つの特徴部分の重要性を考慮するものであり、たとえば特徴部分の大きさや、操作者にとってのその部分の重要性を考慮した重み付けである。このようにすれば、前記設定された立体構造中の特徴部分間の回転が、分子全体の立体構造に与える影響を考慮した一層詳細な分子または分子集合体の構造類似性の評価をすることができる。
【0016】
また、好適には、請求項3または請求項13に係る発明は、前記分子構造の構造地図作成方法または装置によって作成される構造地図は、SOMを用いて作成されるものである。このようにすれば、SOMは高次元の入力データを高次元空間から低次元空間へ非線形に写像することにより高次元空間内における入力データの類似関係を保ったまま低次元空間へ写像を行うことができるため、高次元のデータである分子または分子集合体の複数種類の立体構造の前記立体構造記述工程または立体構造記述手段による記述の類似関係を2次元平面または曲面あるいは3次元のSOMマップに構造地図として写像することができ、該構造地図において前記類似関係を評価することができる。
【0017】
また、請求項4または請求項14に係る発明は、前記構造地図出力工程または構造地図出力手段において構造地図の作成に用いられるSOMにおいては、その内部において、分子のとり得る複数の立体構造の平均構造の算出が行われることを特徴とする。このとき、好適には、前記立体構造の平均構造の算出は、前記立体構造記述工程または立体構造記述手段における記述と、その立体構造記述工程または立体構造記述手段において用いられるハミルトンの四元数の周期性とを考慮して算出されるものである。このようにすれば、分子の一部が回転した結果、同一の構造となった場合であっても、立体構造の平均構造の算出においては同一の構造として算出することができ、一層正確な、すなわち実際の分子または分子集合体の立体構造に近い立体構造の平均構造の算出が可能となる。
【0018】
また、好適には、請求項5または請求項15に係る発明は、前記構造地図出力工程または構造地図出力手段における該複数種類の立体構造間の類似度は、前記立体構造記述工程または立体構造記述手段における記述と、重みと、前記立体構造記述工程において用いられる該四元数の周期性とを考慮して算出されることを特徴とする。前記重みとは、たとえばその立体構造記述工程または立体構造記述手段において用いられるハミルトンの四元数がその関係を記述する2つの特徴部分の分子全体の構造に与える影響の大きさによって決定される。このようにすれば、前記設定された立体構造中の特徴部分の分子または分子集合体の全体に与える影響をより一層考慮した類似度が算出され、該類似度に基づいて立体構造間の類似判断を行うことができるので、より正確な類似判断を行うことができる。
【0019】
さらに、好適には、請求項6または請求項16に係る発明は、前記分子構造の構造地図作成方法または構造地図作成手段は、前記構造地図において、分子運動の様子であるダイナミクスについての情報を表示するダイナミクス表示工程またはダイナミクス表示手段をさらに有することを特徴とする。このようにすれば前記構造地図において、複数種類の立体構造の類似度についての情報と、分子または分子集合体の運動の様子についての情報が合わせて表示されるので、分子または分子集合体の運動の様子を、その分子または分子集合体が取り得る立体構造の類似度と関連づけて把握することができる。
【0020】
好適には、請求項7または請求項17に係る発明は、前記ダイナミクス表示工程またはダイナミクス表示手段は、前記構造地図において、シミュレーションによって得られた分子運動の軌跡を表示するものであることを特徴とする。このようにすれば、前記構造地図において、複数種類の立体構造の類似度についての情報と、分子または分子集合体が、ある立体構造をとった後、所定の時間経過後にどの立体構造をとり得るかという情報とが合わせて表示されるので、より詳細な分子または分子集合体の立体構造のダイナミクスの解析ができる。
【0021】
好適には、請求項8または請求項18に係る発明は、前記ダイナミクス表示工程またはダイナミクス表示手段は、前記構造地図において、前記複数種類の立体構造について、各立体構造ごとにその立体構造をとり得る頻度を表示するものであることを特徴とする。このようにすれば、前記構造地図において、複数種類の立体構造の類似度についての情報と、各立体構造を取り得る頻度についての方法とが合わせて表示されるので、より詳細な分子または分子集合体の立体構造のダイナミクスの解析ができる。
【0022】
また、好適には、請求項9または請求項19に係る発明は、前記ダイナミクス表示工程またはダイナミクス表示手段は、前記構造地図において、前記複数種類の立体構造のうちの任意の立体構造をとった分子もしくは分子集合体が所定の時間経過後にとり得る立体構造について、いかなる立体構造へ遷移しやすいかを予測し、その結果を表示するものであることを特徴とする。このようにすれば、前記構造地図において、複数種類の立体構造の類似度についての情報と、分子または分子集合体が、ある分子構造をとった後にどの分子構造をとりやすいかについての情報とが合わせて表示されるので、より詳細な分子または分子集合体の立体構造のダイナミクスの解析ができる。
【0023】
また、好適には、請求項10または20に係る発明においては、前記構造地図出力工程により作成される構造地図上の表示点は、対応するそれぞれの分子の立体構造や、物理化学的特徴を反映するように表示されているので、複数種類の立体構造の類似度と、それぞれの立体構造の特徴や、物理化学的特徴を関連付けて把握する事ができる。
【0024】
また、請求項21に係る発明は、請求項1乃至10のいずれかに係る分子構造の構造地図作成方法をコンピュータに実行させる分子構造の構造地図作成プログラムであることを特徴とする。
【0025】
また、請求項22に係る発明は、請求項1乃至10のいずれかに係る分子構造の構造地図作成方法をコンピュータに実行させる分子構造の構造地図作製プログラムが記録された記録媒体であることを特徴とする。
【発明を実施するための最良の形態】
【0026】
以下、本発明の好適な実施の形態について図面を参照しつつ詳細に説明する。
【実施例】
【0027】
図1は、本発明の一実施例である所謂コンピュータから主体的に構成される分子構造の構造地図作成装置10を示している。この構造地図作成装置10は、よく知られたCPU、ROM、RAM、HDD、入出力インターフェースを有する本体12、入力操作装置14および画像表示装置16等を備えており、CPUは入力操作装置14の操作に応答して予め媒体20に記録されたプログラムを読み込むなどによって記憶されたプログラムを実行し、演算結果を画像表示装置16の画面に表示させる。
【0028】
図3は、本実施例において上記装置10が分子のダイナミクスを解析する対象物質の一例である、メチオニンエンケファリンの分子式である。図3に示されるように、メチオニンエンケファリンは分子量が高く、75個という多くの原子より構成されているため、その立体構造が高次元の自由度を持ち、その分子運動においては、複雑で非線形な挙動を呈する。したがって、従来の手法である二面角などの構造パラメータの時系列変化やそれらの主成分解析などによっては、局所的な解析しか行うことができず、そのダイナミクスの特徴を効果的に解析することはできなかった。
【0029】
図2は、図1の構造地図作成装置10を、予め媒体20に記憶された分子構造の構造地図作成プログラムを該媒体20から読み込むことにより実行可能とすることにより得られる機能の要部を表す機能ブロック線図と共に模式的に示している。データ格納手段46には、構造地図を作成しようとする分子または分子集合体の立体構造について、そのとり得る立体構造についての情報や、各立体構造をとり得る頻度についての情報、および、各立体構造の後続いてどの構造をとり得るか(「構造変化軌跡」とも称する。)についての情報等が格納されている。これらの情報は、たとえば、予めコンピュータによって分子または分子集合体の立体構造の時系列変化について、分子または分子集合体を構成する各原子についてその動きを動力学的に解析した分子動力学シミュレーションを行うことによって求められる。本実施例においては、分子動力学シミュレーションによって得られた前記メチオニンエンケファリンの複数の立体構造が、分子を構成する各原子の三次元座標の形式でデータ格納手段46に格納されており、その分子のとり得る立体構造についての情報として使用される。さらにデータ格納手段46には、予め行われた別の分子動力学シミュレーションによって得られたメチオニンエンケファリンを構成する各原子の、各時刻における三次元座標すなわち時系列データが格納されており、構造変化軌跡や構造出現頻度の情報として使用される。
【0030】
情報読み出し手段38は、データ格納手段46に格納された情報を必要に応じてデータ格納手段46から読み出す。
【0031】
オプション設定手段52では、構造地図作成装置10を実行するにあたり、任意で選択できる数値等を設定がされる。前記任意で選択できる数値等とは、たとえば、後述する立体構造分類手段36において、分類に用いるSOMのノードの個数、SOMの学習回数などの数値や、あるいは、後述する構造地図出力手段50において出力する構造地図中に重ね合わせて表示する方法についてであり、操作者は事前に入力操作装置14などを用いることにより入力し設定する。
【0032】
平面設定手段32は、操作者が任意にした指定に従って、分子または分子集合体内の複数の特徴部分をそれぞれ近似するような平面を設定する。該平面は、後述する立体構造記述手段34において用いられる。後述する立体構造記述手段34においては、前記複数の特徴部分間の相対的な関係は、前記特徴部分のそれぞれを近似した平面どうしの相対関係で記述されるため、特徴部分を近似した平面を設定する必要があるためである。ここで、前記平面は、特徴部分が3つの原子によって構成される場合は当該3つの原子によって構成される平面とされればよい一方、各特徴部分に4以上の原子が含まれる場合には、たとえば、当該4以上の原子のうち、3つの原子を用いて平面を設定することができる。どの3原子を用いて平面を設定するかは予めオプション設定手段52において適宜設定される。そのとき、なるべくその3原子がその特徴部分の全体に広く分散して位置するような、すなわち、その3原子が特徴部分の一部分に偏らないようなとり方が望ましい。なお、上記のように3原子から定義される平面は、3原子をそれぞれ点と見立てた場合の3点のうち、第1点から第2点への方向を第1軸とし、第1軸から前記3点のうち、第1点、第2点のいずれでもない第3点へ延ばした垂線方向を第2軸として、平面の垂線方向のみならず、平面内部での向きも特定する。3原子に対応する3点のうちどの原子を第1点、第2点とみなすかは、予めオプション設定手段52において適宜設定される。その他の平面設定方法としては、たとえば、特徴部分に含まれる各原子の位置および質量などを考慮して算出した特徴部分の第1慣性主軸と第2慣性主軸により形成される平面を自動的に設定することもできる。この場合も平面の垂線方向と平面内部での向きとの両方が特定される。平面設定手段32において、上述のいずれの方法により平面が設定されるかは、オプション設定手段52によって設定される。さらには、対象とする分子もしくは分子集合体について、上記の方法を特徴部分ごとに使い分けることもできる。どの特徴部分にどの平面設定方法を使用するかについても、オプション設定手段52によって自由に選択できる。
【0033】
なお、特徴部分の指定は予め操作者によって行われるが、その際、分子全体、もしくは分子中の注目する部分の姿勢を示すための複数個の特徴的構成部分(パーツ)として機能できるように、その特徴部分としては分子運動中もその内部ではあまり構造が変化しないという特徴を有する複数箇所の各部分を指定する事が望ましい。たとえば分子中における芳香環構造や複数の水分子の集合体における一個の水分子等がその例である。そのほかにも原子間に二重結合が生じていることにより運動が大きく制約される部分もこれに該当する。また、特徴部分の内部にさらに特徴部分を設定することもでき、さらには、ある特徴部分の一部が他の特徴部分の一部となるように、すなわち、ある特徴部分の一部を他の特徴部分が共有するように設定することもできる。
【0034】
図3のメチオニンエンケファリンにおいては、たとえば、図の分子式において点線で囲んだ部分の原子によって構成される7つの部分f1乃至f7が特徴部分として指定される。f1およびf4は、芳香環を構成する炭素原子とそれらに結合した水素原子などからなる部分である。また、f2、f3、f5、f6はペプチド結合を構成する炭素原子と酸素原子と窒素原子と水素原子からなる部分である。これらの特徴部分はメチオニンエンケファリンの分子の動きにかかわらず大きく構造が変化することのない部分である。
【0035】
このように指定された特徴部分f1乃至f7について、平面設定手段32は、各特徴部分内にそれぞれ平面を設定する。各特徴部分内には、いずれも4以上の原子が含まれるが、*印が付された3つの原子によって形成される平面p1乃至p7が設定されている。*印に隣接する1乃至3の数字は、それぞれの原子を第何点とするかを示している。これは、特徴部分f2乃至f3およびf5乃至f7についてはいずれも特徴部分の構成においてあまり大きな影響とならない水素原子以外の3つの原子である炭素原子、酸素原子、窒素原子によって構成される平面p2乃至p3およびp5乃至p7が設定され、一方、平面f4においては、芳香環を構成する原子のうち、その構成においてあまり大きな影響とならない水素原子を除いた部分、すなわち、要部である6つの炭素原子のうち、特徴部分の一部分に偏らないように1つおきに選択された3つの炭素原子によって構成される平面p4が設定され、平面f1においては、その要部である6つの炭素原子と1つの酸素原子のうち、その端部に位置する酸素原子と、特徴部分の一部分に偏らないように選択された2つの炭素原子によって構成される平面p1が設定される。
【0036】
立体構造記述手段34では、前記分子または分子集合体の複数の特徴部分について、その相対的な関係を用いて前記分子または分子集合体の複数の立体構造を記述される。特徴部分間の相対的な関係は、たとえば、平面設定手段32によって設定されるそれぞれの特徴部分に対応する平面どうしの回転関係である。立体構造記述手段34は、このように設定された当該平面どうしの関係を記述するのに、たとえばハミルトンの四元数を用いて数学的に表現する。
【0037】
立体構造記述手段34では、まず平面設定手段32において設定された複数の特徴部分内の平面に対し、分子の立体構造を記述する方法を決定する。例えば前記複数の平面のそれぞれを三次元座標において数学的に特定し、それらのうち一つの平面を基準として、その一の平面と別の平面との回転関係(以下、「相対傾き」ともいう)が、四元数を用いて表現される。このように各平面間の関係を逐次数学的に表現していき、複数平面の全てについて他のいずれかの平面との相対的な回転関係を数学的に表現することにより、分子全体の構造が記述される。このようにすれば、分子構造は、複数個の四元数により記述できることとなる。1つの特徴部分に対応する平面に対して、複数の特徴部分に対応する平面を回転関係で結びつけることもできる。基準となる平面に対し、どの平面を回転関係で結びつけるかについては、予めオプション設定手段52において適宜設定される。また、分子全体ではなく、分子内のある部分の立体構造に注目している場合は、注目する部分に関係する特徴部分に対応した平面のみを回転関係で結びつければよい。
【0038】
図3のメチオニンエンケファリンにおいては、7つの特徴部分f1乃至f7のそれぞれについて、各特徴部分内に、*印が付された3つの原子によって形成される平面p1乃至p7が設定されている。そこで、立体構造記述手段34においては、例えば、まず平面p1が基準となる平面に選ばれ、p1とp1に隣接するp2との関係がr1で記述され、続いてp2とp3との関係がr2で記述され、p3とp5との関係がr3で記述され、p5とp4との関係がr4で記述され、p5とp6との関係がr5で記述され、p6とp7との関係がr6でそれぞれ記述されることが決定される。このようにすれば、すべての平面間の関係が記述される。この関係は図3において矢印で表された関係r1乃至r6で表される。
【0039】
続いて立体構造記述手段34では、上記決定された記述方法に従って、データ格納手段46に格納された分子または分子集合体がとり得る複数の立体構造についての情報が表す各立体構造のそれぞれが、ハミルトンの四元数配列を用いて数学的に表現される。
【0040】
本実施例においては、データ格納手段46には、メチオニンエンケファリンのとり得る複数の立体構造について、その各立体構造におけるメチオニンエンケファリンを構成する各原子の3次元座標についてのデータが格納されており、これらをもとに、たとえば、該3次元座標についての座標系において平面p1乃至p7が数学的に表現され、つづいて、これらの平面間の相対傾きが上記r1乃至r6に対応する6個の四元数を用いた表現で書き表される。
【0041】
ここで、ハミルトンの四元数(以下、単に「四元数」ともいう。)qとは、4つの実数a,b,c,dおよび3つの虚数単位i,j,kを用いて、q=a+bi+cj+dkで定義される数である。このとき、四元数qは、q=(a,b,c,d)の様に4次元のベクトルとしても表現できる。この四元数qは、3次元における回転を容易に表現できるという特徴を有する。すなわち、n=(n,n,n)なる3次元単位ベクトルを回転軸、θを回転角度とする回転は、
q=(cos(θ/2),nsin(θ/2),nsin(θ/2),nsin(θ/2))
なる四元数によって表現することができ、このときq=(θ,n)とも表現する。このハミルトンの四元数を用いることにより、2つの平面の相対的な位置関係を回転角度と回転軸により表現することができる。
【0042】
このようにすれば、四元数の総数をnRとすれば、分子または分子集合体の立体構造は、
m=(q,q,…,qnR
のように記述できることとなる。また、これらnR個の四元数に対して、たとえば、各四元数がその関係を記述する2つの特徴部分の大きさに基づき、大きな特徴部分の回転ほど分子全体の構造変化に対する影響が大きいなどといった現象を考慮しつつ、各四元数に重み付けをする場合や、操作者にとっての前記特徴部分間の回転の重要性によって各四元数に重み付けをする場合は、分子または分子集合体の立体構造は、各四元数q,q,…,qnRに対応する重みw,w,…,wnRを用いて、
m=(w ,w ,…,wnRnR
のように記述できることとなる。図3のメチオニンエンケファリンにおいては、上述のように7つの平面p1乃至p7を設定し、それらの関係r1乃至r6がそれぞれ四元数q乃至qに相当することから、メチオニンエンケファリンの立体構造は、
m=(w,w,…,w
のように重み付けされた四元数配列として表される。なお、どのような重み付けをするかについては、オプション選択手段52によって操作者が自由に設定できる。たとえば、四元数が相対関係を結ぶ特徴部分それぞれに含まれる原子数の積を重みとする場合、図3においては、w乃至wはそれぞれ、p1とp2、p2とp3、p3とp5、p5とp4、p5とp6、p6とp7の各特徴部分に含まれる原子数の積である48、16、16、44、16、32となる。ここで、四元数は前述のように4次元のベクトルとして表されるので、メチオニンエンケファリンの立体構造mは24次元のベクトルとなる。すなわち、メチオニンエンケファリンを各原子の3次元座標によりその姿勢を記述しようとする場合には、75個の原子により構成されるため、225次元のベクトルが必要となる一方、たとえば図3において矢印で表された関係r1乃至r6を用いれば、本実施例による立体構造記述手段34によれば24次元のベクトルで記述でき、その後の計算において大幅な計算量の低減となる。
【0043】
ここで、準備のため2つの四元数q,qの共通度cおよび二乗距離d2をたとえば、それぞれ次の式(1)(2)のように定義する。ここで、wは前記四元数にかけられる重みである。
【0044】
【数1】

【0045】
なお、上記四元数qを扱うにあたり、四元数qは三角関数を含むことから、周期性を有することを考慮しなければならない。すなわち、本発明においては、分子または分子集合体の各時刻における瞬間的な立体構造のみに着目するのであって、どのように変化したか(どのような動きをしてその構造をとったか)については着目しないのであるから、たとえば、ある立体構造と、その一部が一回転することにより同じ構造となった立体構造は、当該一部を表す四元数が、たとえば、
q=(cos(θ/2),nsin(θ/2),nsin(θ/2),nsin(θ/2))
と、
q’=(cos((θ+2π)/2),nsin((θ+2π)/2),nsin((θ+2π)/2),nsin((θ+2π)/2))
=(−cos(θ/2),−nsin(θ/2),−nsin(θ/2),−nsin(θ/2))
=−q
という互いに正負が逆の四元数により表現されるが、これらはいずれも
q=(cos(θ/2),nsin(θ/2),nsin(θ/2),nsin(θ/2))
と同じ回転を表すという意味で同値となり、このような周期性を考慮した類似度の計算および平均の計算を行う。
【0046】
また、四元数の集合Aについての、ある四元数qを基準とする平均A(q) ̄は、たとえば次の式(3)のように定義される。なお、表記の制限上、次式(3)の左辺の記号と同じものをあらわすものとして記号「A(q) ̄」が用いられており、以下についても同様である。
【0047】
【数2】

【0048】
なお、式(3)において|A|は集合Aに属する要素の個数を表す。また、四元数の対数関数および指数関数は、たとえばそれぞれ次の式(4)(5)によって定義される。
【0049】
【数3】

【0050】
つまり、ある四元数は基準となる四元数qとの共通度cについて負か負でないかの二種類の数値のいずれかを取り得るが、cが負となる四元数xに対してはxと同値であってcが正となる四元数(−x)を平均の計算に用いる。
【0051】
立体構造分類手段36は構造地図作成工程を実行する手段の一部であり、データ格納手段46に格納された分子または分子集合体がとり得る複数種類の立体構造についての情報であって、立体構造記述手段34により記述された情報について、その記述に基づいて前記複数種類の立体構造間の類似度が判断され、該類似度に基づいて前記複数種類の立体構造が分類される。また、構造地図出力手段48においては、前記分子または分子集合体の複数種類の立体構造のそれぞれに対応する表示点を、該立体構造分類工程36により分類された結果に基づき平面上又は曲面上または3次元空間上に配置することによって作成された構造地図が出力され、画像表示装置16に表示させられる。
【0052】
立体構造分類手段36および構造地図出力手段48は、前述のSOMにより、一の手段としてまとめることができ、この場合、立体構造分類手段36と構造地図出力手段48を合わせたものが構造地図出力工程を実行する。すなわち、SOMを利用することにより、立体構造記述手段34により記述された分子または分子集合体がとり得る複数種類の立体構造についての情報について、その記述に基づいて前記複数種類の立体構造間の類似度が判断され、その類似度に基づいて前記複数種類の立体構造が分類され、前記分子または分子集合体の複数種類の立体構造のそれぞれに対応する表示点が、前記立体構造分類工程により分類された結果に基づき平面上又は曲面上または3次元空間上に配置されることによって構造地図が作成される工程を一括して行うことができる。
【0053】
SOMを利用するにあたり、SOMを作成するために必要となる、分子または分子集合体の取り得る、複数の立体構造についての情報(以下、「入力サンプル」ともいう)は、たとえば、立体構造記述手段34において記述された分子または分子集合体の立体構造であって、四元数を用いた記述mの形式で記述されたものが用いられる。
【0054】
SOMにおいては、2次元平面または曲面上または3次元空間上に、前記表示点に相当するノードが複数配置される。また、各ノードにそれぞれ対応する分子の立体構造、すなわち参照構造は、入力ベクトルと同次元であり、適当な値で初期化されている。本実施例においては、SOMは2次元平面で作成され、各ノードは六角格子状に配列される。たとえば、図4における六角形で表された各セル70にそれぞれノードが配列される。そして、参照構造は学習に応じ、類似度に応じて入力サンプルと対応づけられる。また、SOMのノードの数および学習回数は、オプション設定手段52において、作成されるマップの詳細さ、マップ作成に要する時間などを考慮して予め設定された値が用いられる。なお、この入力サンプルおよび参照構造は、一般的なSOMにおいては、それぞれ、入力ベクトルおよび重みベクトルに相当するものである。
【0055】
本実施例においては、参照構造と入力サンプルは、メチオニンエンケファリンの分子構造を記述する、四元数の配列からなる多次元のベクトルmである。当該複数の多次元のベクトルが類似しているか否かの判断は、2つのベクトル間の距離の近さによって判断され、2つのベクトル間の距離が小さい程類似していると判断される。すなわち、SOMの学習における測度として、前記ベクトル間の距離が用いられる。ここで、2つのベクトルm,m間の距離d(m,m;w)は、たとえば次の式(6)で定義される。
【0056】
【数4】

【0057】
ここで、wは前述のように、立体構造を記述する四元数の重み付けをするための零または正の実数であり、wはその配列である。
【0058】
SOM作成過程における参照構造の学習は次のように行われる。SOMのノードの集合をNとする。まず入力サンプルxのそれぞれについて、すべてのノードに対応する参照構造mnkと比較が行われ、一般的な距離測度において最もxとベクトルが類似しているノードに結びつけられる、すなわち、各ノードに結びつけられた部分集合Stに複写される。ここで、前述の通り、類似とは距離測度が小さいことをいい、本実施例においては距離測度は前記式(6)で表される。このとき、部分集合Stは次の式(7)および(8)で表される。
【0059】
【数5】

【0060】
このようにしてすべてのxがそれぞれのノードに結びつけられた部分集合に分配された後に、ノードnの近傍集合Nが定義される。NはSOMマップ上のノードnからある半径の距離rに含まれるすべてのノードからなる。ここで、この半径を近傍半径という。近傍半径は、t に従って単調減少するよう定義される。続いて、集合N中に属するすべてのノードnに対応する入力サンプルの部分集合における入力サンプルの平均値Ak ,t ̄が算出される。この様子は次の式(10)および(11)で示される
【0061】
【数6】

【0062】
平均値Ak  ̄の算出方法は入力サンプルの形式により様々であるが、例えば当該発明のように四元数で記述された多次元ベクトルの平均値を算出するにあたっては式(12)で表される定義が用いられる。
【0063】
【数7】

【0064】
この手順がすべてのノードnに対して行われ、それぞれのnに対して平均値Ak ,t ̄が算出されて記憶される。この操作がすべて終了したら、各ノードnは次の学習に備えて、式(9)のように、参照構造mt+1nkが一斉にAk ,t ̄へと更新される。ここまでをもって一回の学習とする。このような、参照構造がすべてのノードについて算出され終わってから一斉に更新される方法であるバッチ学習を行うことにより、予め与えられた有限個の入力の元でSOM作成を高速に行うことができる。
【0065】
最初はでたらめな値を持っていた参照構造は、SOM作成過程において学習が行われるにしたがって、近傍のノードの参照構造と近い値を持つように更新される。当該発明においては、より近いノードは、より分類がされた分子の立体構造に対応するように参照構造が更新されることを意味している。
【0066】
次の学習も同様の手順で参照構造が更新されてゆくが、ノードnの近傍集合Nをとるときの近傍半径rは、学習回数にしたがって小さくされていく。すなわち、近傍が狭められてゆく。そして、最終的には近傍半径が0となるように、すなわち、学習によって参照構造が自身に対応する部分集合のみの平均によって更新されるようにするのである。
【0067】
これが予めオプション設定手段52において設定された回数だけ繰り返されることにより、最終的に、あるサンプルは、最も距離が近い(似ている)参照構造を持つノードに属するため、入力サンプル(多次元ベクトルデータ)は二次元平面上に、構造の類似性に従って配置されることができる。また、近傍半径の初期値についても、オプション設定手段52により設定されることができる。
【0068】
出力されるSOMは、各ノード間の構造地図における表示上の距離が各ノードに対応する参照構造間の距離、すなわち数学的に評価された類似度に比例関係もしくはそれに準ずる関係となるように各ノードが配置される、いわゆるサモンマップによって構造地図が作成されても良いし、各ノードは均等な間隔で構造地図に配列されて、ノードに対応する参照構造と、そのノードに隣接する複数のノードに対応するそれぞれの参照構造との距離、すなわち数学的に評価された類似度が色の濃淡で表される、いわゆるグレーマップによって作成されてもよい。また、各ノードの構造地図上における表示法としては、それぞれのノードが対応する参照構造の立体構造や物理化学的特徴をあらわすような色付け、模様付け、記号付けなどを、ノードに施すことによって作成されてもよい。ここで、参照構造の立体構造の特徴とは、たとえば分子の末端間の距離や表面積などである。また、参照構造の物理化学的特徴とは、その分子構造が持つ構造エネルギーや電子状態などである。色、模様、記号は、これらの特徴の一つを反映させたものでもよいし、いくつかの特徴の組み合わせを反映したものでもよい。たとえば、色の三原色である赤、青、緑の混合率をそれぞれ分子の末端間距離、表面積、構造エネルギーの大きさによって決定することで得られる色で、各ノードを着色する方法などでもよい。これによって、複数種類の立体構造の類似度と、立体構造の特徴や、物理化学的特徴を関連付けて把握する事が出来る。各ノードをどのような形式でSOM上に表示させるかについては、オプション設定手段52によって選択できる。
【0069】
軌跡表示手段40においては、立体構造分類手段36によって出力されるSOMマップ50上に、データ格納部46に格納された分子または分子集合体の立体構造の時系列変化の様子についての情報に基づいて、たとえばSOMマップ50上における分子または分子集合体の各立体構造に対応する表示点72のうち、各時刻における立体構造に対応する表示点72が直線で結ばれることにより、SOMマップ50上に分子または分子集合体の立体構造の時系列変化の様子が構造変化軌跡を用いて示され、画像表示装置16に表示される。なお、表示点72は一般的なSOMにおいてはノードに対応するものである。
【0070】
図4は、分子動力学シミュレーションによって得られたメチオニンエンケファリンのとり得る一万個の構造がその類似度に応じて配置されたSOMマップ50において、上記とは別の予め分子動力学シミュレーション等により得られた、メチオニンエンケファリンの、ある時刻から一定時間における分子構造の時系列変化の様子を示す軌跡74を表示した実施例である。本実施例においては、メチオニンエンケファリン全体の構造のうち、ペプチド主鎖に注目してSOMマップを作成するために、分子構造を図3において矢印で表された関係r2、r3、r5、r7、r8、r9に対応する6個の四元数を用いて表現している。各四元数に与える重みはすべて1としている。各六角形のセル70が表示点、すなわちSOMの各ノードに対応し、各ノードはメチオニンエンケファリンの一分子構造に対応する参照構造を有している。本実施例においては、メチオニンエンケファリンの末端間距離、すなわち図3における原子CA1と原子CA5の距離に比例して黒色の混合率が高くなるように各表示点に色付けが施されている。すなわち、分子が直鎖状に伸びている参照構造を持つノードほど黒色に近い色を持っている。本実施例においては、データ格納部46には、上記SOMマップ50を作成するために用いたメチオニンエンケファリンのとり得る一万個の構造情報の他に、予め行われた別の分子動力学シミュレーションによって得られたメチオニンエンケファリンを構成する各原子の各時刻における三次元座標すなわち時系列データが格納されており、これを用いる事で、SOMマップ50上に分子のダイナミクスを表示する。点72は前記時系列データ中のある時刻にメチオニンエンケファリンがとっていた分子構造に対応する参照構造を有する表示点を表し、軌跡74はその後メチオニンエンケファリンがとった分子構造の変化を示している。すなわち、メチオニンエンケファリンが前記ある時刻の後に順次とった分子構造のそれぞれに最も類似する参照構造を有するSOMマップ50上の表示点を順次直線で結んだものとなっている。分子または分子集合体の立体構造の時系列変化すなわち分子のダイナミクスに関する情報のうち、どの時間帯からどれ程の間隔でいくつの情報を読み取りSOM上に投影するかについては、予めオプション設定手段52において適宜設定されることができる。
【0071】
構造遷移予測手段42では、立体構造分類手段によって出力されるSOMマップ50上に、データ格納部46に格納された分子または分子集合体がある立体構造をとった後、一定時間経過後にどの構造をとり得るかについての情報に基づいて、たとえばSOMマップ50上における分子または分子集合体の各立体構造に対応する表示点72のうち、ある時刻における立体構造に対応する表示点72から所定の時間経過後にとり得る立体構造に対応する表示点を直線で結ぶ際に、その所定の時間経過後にとり得る各立体構造に変化をする確率である遷移確率が算出され、その直線の太さをその構造変化の遷移確率に応じて変化させるなどの方法により、画像表示装置16に表示されたSOMマップ50上に、ある立体構造をとった後にどの立体構造をとりやすいか、すなわち立体構造の遷移確率が表示される。所定の時間とは、分子のダイナミクスの解析の目的に応じて、たとえば予めオプション設定手段52によって設定される。
【0072】
本実施例においては、予め行われた分子動力学シミュレーション等により得られた、メチオニンエンケファリンの各分子構造についての時系列データが解析されることにより、ある分子構造をとった後にとる分子構造について、どのような分子構造をどれくらいの頻度でとるかについての情報が得られる。図5は、この情報がSOMマップ50において表示された表示例である。図5(a)は、前記ある分子構造に対応する表示点72からある一定時間の後にとる分子構造に対応する表示点までがそれぞれその遷移確率に応じた太さの直線76で結んで表示された例である。図5(b)は、前記ある分子構造に対応する表示点72に対し、所定の時間経過後にとり得る分子構造に対応する表示点を有するセル70がその遷移確率に応じた色、たとえば遷移確率が高いほど濃い色で色分けすることにより表示された例である。
【0073】
頻度表示手段44では、立体構造分類手段によって出力されるSOMマップ50上に、データ格納部46に格納された情報から、分子または分子集合体が各立体構造をとり得る頻度についての情報、例えば、特定の温度などの一定の条件下、一定時間において、分子または分子集合体が各立体構造をとった回数が算出され、たとえば、SOMマップ50上における分子または分子集合体の各立体構造に対応する表示点の大きさが、その立体構造をとり得る頻度に応じて変化される等の方法により、画像出力装置16に表示されたSOMマップ50上に分子または分子集合体が各立体構造をとり得る頻度が表示される。
【0074】
図6は、本実施例において、予め行われた分子動力学シミュレーションにより得られた、メチオニンエンケファリンの各分子構造のそれぞれを、既に得られているSOMマップ50の最も類似するSOMマップ50の各表示点72すなわちノードに対応する参照構造毎に分類し、その結果分類された分子構造の多さに応じて、表示点72に描画された円の大きさが大きく表示された例を示している。(a)は温度27℃の純水中におけるメチオニンエンケファリンの分子構造の出現頻度を、(b)は温度97℃の純水中におけるメチオニンエンケファリンの分子構造の出現頻度を、SOMマップ50上に示した図である。
【0075】
図7は、構造地図作成装置10の作動を示すフローチャートである。以下、本フローチャートを用いて本実施例について説明する。本図において、オプション設定手段52に対応するステップ(以下「ステップ」を省略する。)SA1においては、まず、以下の一連の構造地図作成工程において必要となる設定が行われる。すなわち、立体構造分類工程において分類を行う際の条件すなわちSOMのノードの個数や学習回数、構造地図出力出力工程により作成された構造地図に軌跡表示工程、構造遷移予測表示工程、頻度表示工程のそれぞれによって作成される表示を重ねて表示するか否かについての設定が行われる。
【0076】
前記情報読み出し手段38或いは情報読み出し工程に対応するSA2では、まず、事前のコンピュータによる分子動力学シミュレーションなどにより生成され、データ格納手段46に格納されたメチオニンエンケファリンのとり得る構造についての情報が取り出される。
【0077】
続く前記平面設定手段32或いは平面設定工程および前記立体構造記述手段34或いは立体構造記述工程に対応するSA3においては、分子中の複数の特徴部分内に平面が設定され、当該平面の相互の関係を記述する方法として、たとえば四元数が決定される。そして、SA2でデータ格納手段46から取り出された情報であるメチオニンエンケファリンの各立体構造について、上記決定された方法を用いて、記述し直される。
【0078】
前記立体構造分類手段36或いは立体構造分類工程に対応するSA4においては、SA3で記述し直されたメチオニンエンケファリンの各立体構造が、各立体構造間の類似度をたとえばSOMを用いて判断することにより分類される。
【0079】
前記構造地図出力手段48或いは構造地図出力工程に対応するSA5においては、SA4において分類された各立体構造に対応する表示点すなわちノードを分類された結果に基づき平面または曲面上または3次元空間上に配置することによって構造地図が作成される。各ノードの配置方式や、表示方法は、オプション設定手段52によって選択される。
【0080】
続くSA6においては、SA5において作成された構造地図に、軌跡表示工程、構造遷移予測表示工程、頻度表示工程による演算が重ねて表示するか否かについての場合分けが行われる。この場合分けはSA1において行われた設定に基づいて行われる。SA1において重ね合わせ表示を行わない旨が設定された場合は、フローチャートは終了する。重ねあわせを行う旨が設定されていた場合は、続くSA7乃至SA11が実行される。
【0081】
前記情報読み出し手段38或いは情報読み出し工程に対応するSA7においては、データ格納手段46に格納された、メチオニンエンケファリンの分子の立体構造の時系列変化の様子についてのデータのうち、続く前記軌跡表示手段40或いは軌跡表示工程に対応するSA8、前記構造遷移予測表示手段42或いは構造遷移予測表示工程に対応するSA9、前記頻度表示手段44或いは頻度表示工程に対応するSA10で必要となるデータを読み出す。
【0082】
前記軌跡表示手段40或いは軌跡表示工程に対応するSA8においては、SA7で取り出されたメチオニンエンケファリンの分子構造の時系列変化についてのデータをもとに、ある時刻における分子構造から所定の時間の間に分子構造が変化することでとった分子構造について、SA5で作成された構造地図上に、それぞれの立体構造に対応する構造地図上の表示点を直線で結ぶことにより軌跡を表示する。
【0083】
前記構造遷移予測表示手段42或いは構造遷移予測表示工程に対応するSA9においては、SA7で取り出されたメチオニンエンケファリンの分子構造の時系列変化についてのデータから、ある構造をとった後にどのような構造をどのくらいの頻度でとり得るかが解析される。そしてその結果をSA5で出力された構造地図における、前記ある分子構造に対応する表示点から所定の時間経過後にとる分子構造に対応する表示点までをそれぞれその頻度に応じた太さの直線あるいは矢印つき直線で結んで表示される。
【0084】
前記頻度表示手段44或いは頻度表示工程に対応するSA10においては、SA7で取り出されたメチオニンエンケファリンの分子構造の時系列変化についてのデータから、所定の時間において、どのような構造をどのくらいの頻度でとり得るかが解析される。そしてその結果は、SA5で出力された構造地図における、それぞれの分子構造に対応する表示点に、その分子構造をとる頻度に応じた大きさの円を描画することにより表示される。
【0085】
SA11においては、SA1でなされた設定に応じ、SA6において作成された構造地図50にSA8〜SA10において算出された演算結果に基づく表示を重ね合わせた構造地図50が作成され、画像表示装置16の画面に出力される。
【0086】
図8は、本発明の分子構造の構造地図作成装置10によって作成された構造地図50などが表示される画像表示装置16における表示の一例を示した図である。図中において、オプション表示部82においては、オプション設定手段52において設定された内容が表示される。また、構造地図表示部84においては、構造地図出力手段48によって出力された構造地図50が表示される。分子構造表示部86においては、たとえば、前記構造地図表示部84に表示された構造地図50における各表示点72を入力操作装置14で指定した場合に、その表示点72に対応する参照構造である分子構造の様子を描画し表示する。このように、構造地図表示部84と分子構造表示部86が隣接して表示されることで、構造地図の各表示点72の構造地図内における位置と、その表示点72に対応する分子構造とを容易に参照することができる。また、時刻表示部88は、時系列的に分子構造の変化を参照する場合にその時刻を表示するのに用いられ、さらに、入力操作装置14により、その時刻にとる分子構造を参照したい時刻を指定するのにも用いられる。このように構造地図表示部84と分子構造表示部86および時刻表示部88が併せて表示されることで、分子構造の時系列変化の様子と、その変化する分子構造の相互の類似度を同時に参照することができる。
【0087】
本実施例の分子構造の構造地図作成装置10によれば、立体構造記述手段34によりメチオニンエンケファリンの立体構造を記述するのに適した該立体構造中の複数の特徴部分間を近似した平面の相対的な関係である相対的傾きがハミルトンの四元数を用いて記述されることでメチオニンエンケファリンの複数種類の立体構造が記述されるので、メチオニンエンケファリンの複数の特徴部分の相対的な関係が、回転の関係を表す正確かつ単純な形式で記述され、メチオニンエンケファリンの複数種類の立体構造が数値により表現され、解析される。また、立体構造分類手段36および構造地図出力手段48により前記ハミルトンの四元数によって記述された複数種類の立体構造内の特徴部分間の相対的な関係に基づいて、前記複数種類の立体構造のそれぞれに対応する複数の表示点が該複数種類の立体構造の類似度を示すように平面上または曲面上または3次元空間上に表示されるので、好適に構造地図50を作成することができる。
【0088】
また、本実施例の構造地図作成装置10によれば、前記ハミルトンの四元数は、メチオニンエンケファリンの分子全体の構造を考慮した重み付けがなされているので、前記設定された立体構造中の特徴部分のメチオニンエンケファリンの分子全体に与える影響が考慮された、一層詳細なメチオニンエンケファリンの立体構造のダイナミクスの評価がされる。
【0089】
また、本実施例の構造地図作成装置10によって作成される構造地図50は、SOMを用いて作成されるので、高次元のデータである分子または分子集合体の複数種類の立体構造の前記立体構造記述工程34による記述の類似関係を2次元平面または3次元のSOMマップに構造地図として写像することができ、該構造地図において前記類似関係を評価することができる。
【0090】
また、本実施例の立体構造分類手段36においては、SOM法が用いられるが、その際SOM法において行われる、メチオニンエンケファリンのとり得る複数の立体構造の平均構造の算出は、立体構造記述手段34における記述と、その立体構造記述工程34において用いられるハミルトンの四元数の周期性とを考慮して算出されるので、分子が回転することにより同一の構造となった場合であっても、立体構造の平均構造の算出においては同一の構造として算出することができ、一層正確な、すなわち実際の分子または分子集合体の立体構造に近い立体構造の平均構造の算出が可能となる。
【0091】
また、本実施例の立体構造分類手段36においては、メチオニンエンケファリンのとり得る複数種類の立体構造間の類似度に基づいて複数種類の立体構造が分類されたが、その類似度は前記分子立体構造記述手段34における記述と、その立体構造記述手段34において用いられるハミルトンの四元数の分子全体の構造に与える影響の大きさである重みと、周期性を考慮して算出されるので、より実際のメチオニンエンケファリンの立体構造に即した、正確な類似判断を行うことができる。
【0092】
また、本実施例の構造地図作成装置10は、構造地図50において、シミュレーションによって得られた分子運動の軌跡を表示する軌跡表示手段40をさらに有するので、構造地図50において、複数種類の立体構造の類似度についての情報と、メチオニンエンケファリンが、ある立体構造をとった後にどの立体構造をとり得るかという情報とが合わせて表示されるので、より詳細なメチオニンエンケファリンの立体構造のダイナミクスの解析ができる。
【0093】
また、本実施例の分子構造の構造地図作成装置10は、前記構造地図50において、前記複数種類の立体構造について、各立体構造をとり得る頻度を算出し表示する頻度表示手段44をさらに有するので、構造地図50において、複数種類の立体構造の類似度についての情報と、各立体構造を取り得る頻度についての方法とが合わせて表示されるので、より詳細なメチオニンエンケファリンのダイナミクスの解析ができる。
【0094】
また、本実施例の分子構造の構造地図作成装置10は、前記構造地図50において、前記複数種類の立体構造のうちの任意の立体構造から所定の時間経過後ににとり得る立体構造のうち、いかなる立体構造へ遷移しやすいかを予測し、その結果を表示する構造遷移予測表示手段42をさらに有するので、構造地図50において、複数種類の立体構造の類似度についての情報と、メチオニンエンケファリンが、ある分子構造をとった後にどの分子構造をとりやすいかについての情報とが合わせて表示さるので、より詳細なメチオニンエンケファリンの解析ができる。
【0095】
また、本実施例の構造地図作成装置10によって作成される構造地図50上の表示点は、対応するそれぞれの分子の立体構造や、物理化学的特徴を反映するような色付け、記号付け、模様付けなどが施されているので、複数種類の立体構造の類似度と、それぞれの立体構造の特徴や、物理化学的特徴を関連付けて把握する事ができる。
【0096】
以上、本発明の実施例を図面に基づいて詳細に説明したが、本発明はその他の態様においても適用される。
【0097】
例えば、本実施例においては、メチオニンエンケファリンの分子構造を解析したが、これに限られず、これより高分子量の分子を対象としてもよく、また、低分子量の分子を対象としてもよい。また、複数の分子が集合することによって構成される分子集合体を対象としてもよい。
【0098】
また、本実施例においては、セルの形状は6角形を用いて表示されたが、その他の図形、例えば、三角形や円等の平面図形や、直方体などの立体図形を用いてもよい。さらに、それらの中心に配置されたノードの配列については、六角格子状の配列のみならず、たとえば正方格子状の配列や、不規則な配列にしてもよい。また、ノード全体の配置については、平面上のみに限らず、球面や、その他の曲面上もしくは3次元空間上に配置されてもよい。
【0099】
本実施例においては、各立体構造の出現頻度をノード上に表示した円の大きさで示したが、これに限られず、たとえば、ノードの大きさや立体図形で表現されたノードの高さで示してもよい。上記の手段によって、決定された各ノードの高さをなめらかに補完した曲面によって示してもよい。
【0100】
また、構造遷移予測表示手段42による遷移予測表示は、直線76の太さやセル70の色の濃さを用いて表示されたが、これに限られず、例えば、一定時間後にどの構造へと移っていくかを平均化して構造地図上にベクトル表示することや、ある一定以上の頻度で遷移した経路のみを表示することにより行ってもよい。
【0101】
平面設定手段32においては、特徴部分内に含まれる原子のうち3個の原子を選択し、その3個の原子によって構成される平面を設定したが、必ずしも平面の設定は平面設定手段32によらなくともよく、操作者によって任意に指定することもできる。この場合、平面設定手段32は必要とされない。
【0102】
立体構造分類手段36においては、より広範囲の構造地図を作成するには、より多くの分子立体構造についての情報が必要となる。このとき、メチオニンエンケファリンがとり得る分子構造についての情報は、メチオニンエンケファリンの分子を構成する原子の動力学シミュレーションによって作成されるものに限られず、幾何学的に生成されるものであってもよく、あるいは実験的に得られるデータであってもよい。
【0103】
また、本実施例においては、データ格納手段46は構造地図作成装置10の内部に設けられていたが、これに限られず、構造地図作成装置10の外部に設けられていてもよい。また、データ格納手段46には、メチオニンエンケファリンの立体構造の時系列データが格納されており、これを解析することで各立体構造をとる頻度についての情報、各立体構造間の軌跡すなわちある立体構造をとった後に所定の時間経過後にどの立体構造をとるかについての情報を得たが、予めこれらの情報についてもデータ格納手段46に格納されていてもよい。
【0104】
また、本実施例においては、軌跡表示手段40、構造遷移予測表示手段42および頻度表示手段44において使用されるメチオニンエンケファリンがとり得る構造の情報は、データ格納手段46に格納された時系列情報としての情報が情報読み出し手段38によって読み出されるが、このとき、必要に応じて、どの時刻から始まるどれだけの時間分のデータを読み出すか選択することができ、さらに、どれくらいの時間間隔のデータとして読み出すかについても選択することができる。これらの選択は例えばオプション選択手段52によってなされる。このようにすれば、操作者の目的に応じて軌跡表示、構造遷移予測表示、頻度表示などを行うことができる。
【0105】
前記メチオニンエンケファリンの実施例においては、一つ一つの特徴部分間の回転関係のみを用いて構造地図を作成する例を示したが、たとえば、複数の小さな特徴部分を内包する大きな特徴部分を設定してもよい。図9は、この大きな特徴部分の一例を示す図である。上述の実施例においては、特徴部分としてp1乃至p7を設定し、それらの相対傾きr1乃至r7を四元数を用いて記述したが、これに加え、p1乃至p3を含む大きな特徴部分P1および、p4乃至p7を含む大きな特徴部分P2を設定することができる。そして、大きな特徴部分P1およびP2の相対傾きR1を、前記r1乃至r7に加えて用いることにより、メチオニンエンケファリンの立体構造を記述することもできる。この場合、大きな特徴部分P1およびP2の各特徴部分中、「+」が付された各3つの原子によって形成される平面F1およびF2について、矢印R1で表されるそれらの大きな特徴部分間の回転関係も考慮することで、局所的な類似性のみではなく、分子全体の形状を考慮した構造地図を作成することが可能となる。なお、図中+印に隣接する1乃至3の数字は、それぞれの原子を第何点とするかを示している。さらには、それぞれの四元数には、重み付けを行うことができるので、例えば、大きな特徴部分間を結ぶ四元数には大きな重みを付け、それぞれに内包される小さな四元数には小さな重みを付けることによって、分子全体の形状の類似性をより重んじた構造地図が作成できる。この場合、どれだけ全体的な分子の形状の類似性を重んじるかは、それぞれの重み付けを変えることで調節が可能である。
【0106】
また、本実施例においては、四元数の共通度C が式(1)で、四元数の二乗距離d2が式(2)で、四元数の平均A(q) ̄が式(3)で、四元数の対数関数が式(4)で、四元数の指数関数が式(5)で、SOMにおけるベクトル間の距離が式(6)でそれぞれ定義されたが、これらの定義に限られず、他の定義によってもよい。
【図面の簡単な説明】
【0107】
【図1】本発明の構造地図作成プログラムが実行されたコンピュータの機能の概要を模式的に示した図である。
【図2】図2は、本発明の構造地図作成装置の機能の要部を表す機能ブロック線図である。
【図3】本発明の実施例においてその構造の解析の対象とするメチオニンエンケファリンの分子構造を示した図であって、特徴となる平面とその平面間の関係を示した図である。
【図4】本発明による構造地図に、分子構造の軌跡を表示した図である。
【図5】本発明による構造地図に、分子がある構造をとった後、所定の時間経過後にどの構造をとるかを頻度と共に表示した図である。
【図6】本発明による構造地図に、分子が一定期間にどの構造をとるかを頻度と共に表示した図である。
【図7】本発明の構造地図の作成プログラムの作動を示すフローチャートである。
【図8】本発明の構造地図の作成プログラムによって表示される画面の一例である。
【図9】本発明の実施例においてその構造の解析の対象とするメチオニンエンケファリンの分子構造において、大きな特徴部分を設定した様子を示す図である。
【符号の説明】
【0108】
10:構造地図作成装置
20:媒体
46:データ格納手段
50:SOMマップ(構造地図)
SA1:オプション設定工程
SA2:立体構造記述工程
SA3:立体構造分類手段
SA8:軌跡表示工程
SA9:構造遷移予測工程
SA10:頻度表示手段
SA11:構造地図出力工程

【特許請求の範囲】
【請求項1】
分子もしくは分子集合体のとり得る複数の立体構造の類似度を平面上または曲面上または3次元空間上に示す構造地図作成方法であって、
前記分子もしくは分子集合体の立体構造内に予め設定された複数の特徴部分の相対的配置関係をハミルトンの四元数を用いて数値化する事により、前記分子もしくは分子集合体の複数種類の立体構造のそれぞれを記述する立体構造記述工程と、
該立体構造記述工程によって記述された複数種類の立体構造のそれぞれに対応する複数の表示点を該複数種類の立体構造間の類似度を示すように平面上又は曲面上または3次元空間上に表示する事によって構造地図を作成する構造地図出力工程と
を有することを特徴とする分子構造の構造地図作成方法。
【請求項2】
前記立体構造記述工程において用いられるハミルトンの四元数のそれぞれは重み付けがなされていること
を特徴とする請求項1に記載の分子構造の構造地図作成方法。
【請求項3】
前記構造地図出力工程により作成される構造地図は、自己組織化マップ法を用いて作成されるものであること
を特徴とする請求項1または2のいずれかに記載の分子構造の構造地図作成方法。
【請求項4】
前記構造地図出力工程において用いられる自己組織化マップ法において用いられる分子のとり得る複数の立体構造の平均構造は、前記立体構造記述工程における記述と、その立体構造記述工程において用いられるハミルトンの四元数の周期性を考慮して算出されること
を特徴とする請求項3に記載の構造地図の作成方法。
【請求項5】
前記構造地図出力工程における該複数種類の立体構造間の類似度は、前記分子立体構造記述工程における記述と、重みと、前記立体構造記述工程において用いられるハミルトンの四元数の周期性を考慮して算出されること
を特徴とする請求項1乃至4のいずれかに記載の分子構造の構造地図作成方法。
【請求項6】
前記構造地図作成方法は、前記構造地図において、分子運動の様子であるダイナミクスについての情報を表示するダイナミクス表示工程をさらに有すること
を特徴とする請求項1乃至5のいずれかに記載の分子構造の構造地図作成方法。
【請求項7】
前記ダイナミクス表示工程は、前記構造地図において、分子運動の軌跡を表示するものであること
を特徴とする請求項6に記載の分子構造の構造地図作成方法。
【請求項8】
前記ダイナミクス表示工程は、前記構造地図において、前記分子もしくは分子集合体がとり得る前記複数種類の立体構造について、各立体構造ごとにその立体構造をとり得る頻度を表示するものであること
を特徴とする請求項6または7のいずれかに記載の分子構造の構造地図作成方法。
【請求項9】
前記ダイナミクス表示工程は、前記構造地図において、前記複数種類の立体構造のうちの任意の立体構造をとった分子もしくは分子集合体が所定の時間の経過後にとり得る立体構造について、前記複数の立体構造のうちいかなる立体構造へ遷移しやすいかを予測し、その結果を前記構造地図において表示するものであること
を特徴とする請求項6乃至8のいずれかに記載の分子構造の構造地図作成方法。
【請求項10】
前記構造地図出力工程により作成される構造地図上の表示点のそれぞれは、対応する分子の、立体構造や物理化学的性質の特徴をあらわすように表示されている事を特徴とする請求項1乃至9のいずれかに記載の分子構造の構造地図作成方法。
【請求項11】
分子もしくは分子集合体のとり得る複数の立体構造の類似度を平面上または曲面上または3次元空間上に示す構造地図作成装置であって、
前記分子もしくは分子集合体の立体構造内に予め設定された複数の特徴部分の相対的配置関係をハミルトンの四元数を用いて数値化する事により、前記分子もしくは分子集合体の複数種類の立体構造のそれぞれを記述する立体構造記述手段と、
該立体構造記述手段によって記述された複数種類の立体構造のそれぞれに対応する複数の表示点を該複数種類の立体構造間の類似度を示すように平面上又は曲面上または3次元空間上に表示する事によって構造地図を作成する構造地図出力手段と
を有することを特徴とする分子構造の構造地図作成装置。
【請求項12】
前記立体構造記述手段において用いられるハミルトンの四元数のそれぞれは重み付けがなされていること
を特徴とする請求項11に記載の分子構造の構造地図作成装置。
【請求項13】
前記構造地図出力手段により作成される構造地図は、自己組織化マップ法を用いて作成されるものであること
を特徴とする請求項11または12のいずれかに記載の分子構造の構造地図作成装置。
【請求項14】
前記構造地図出力手段において用いられる自己組織化マップ法において用いられる分子のとり得る複数の立体構造の平均構造は、前記立体構造記述手段における記述と、その立体構造記述手段において用いられるハミルトンの四元数の周期性を考慮して算出されること
を特徴とする請求項13に記載の構造地図の作成装置。
【請求項15】
前記構造地図出力手段における該複数種類の立体構造間の類似度は、前記分子立体構造記述手段における記述と、重みと、前記立体構造記述工程において用いられるハミルトンの四元数の周期性を考慮して算出されること
を特徴とする請求項11乃至14のいずれかに記載の分子構造の構造地図作成装置。
【請求項16】
前記構造地図作成装置は、前記構造地図において、分子運動の様子であるダイナミクスについての情報を表示するダイナミクス表示手段をさらに有すること
を特徴とする請求項11乃至15のいずれかに記載の分子構造の構造地図作成装置。
【請求項17】
前記ダイナミクス表示手段は、前記構造地図において、分子運動の軌跡を表示するものであること
を特徴とする請求項16に記載の分子構造の構造地図作成装置。
【請求項18】
前記ダイナミクス表示手段は、前記構造地図において、前記分子もしくは分子集合体がとり得る前記複数種類の立体構造について、各立体構造ごとにその立体構造をとり得る頻度を表示するものであること
を特徴とする請求項16または17のいずれかに記載の分子構造の構造地図作成装置。
【請求項19】
前記ダイナミクス表示手段は、前記構造地図において、前記複数種類の立体構造のうちの任意の立体構造をとった分子もしくは分子集合体が所定の時間の経過後にとり得る立体構造について、前記複数の立体構造のうちいかなる立体構造へ遷移しやすいかを予測し、その結果を前記構造地図において表示するものであること
を特徴とする請求項16乃至18のいずれかに記載の分子構造の構造地図作成装置。
【請求項20】
前記構造地図出力手段により作成される構造地図上の表示点のそれぞれは、対応する分子の、立体構造や物理化学的性質の特徴をあらわすように表示されている事を特徴とする請求項11乃至19のいずれかに記載の分子構造の構造地図作成装置。
【請求項21】
請求項1乃至10のいずれかに記載の方法をコンピュータに実行させる分子構造の構造地図作成プログラム。
【請求項22】
請求項1乃至10のいずれかに記載の方法をコンピュータに実行させる分子構造の構造地図作成プログラムを記録したコンピュータ読み取り可能な記録媒体。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate


【公開番号】特開2007−277234(P2007−277234A)
【公開日】平成19年10月25日(2007.10.25)
【国際特許分類】
【出願番号】特願2007−69381(P2007−69381)
【出願日】平成19年3月16日(2007.3.16)
【出願人】(504139662)国立大学法人名古屋大学 (996)
【Fターム(参考)】