説明

立体配座相同性評価装置及び評価方法並びに構造パターン解析装置及び解析方法

【課題】X線結晶構造解析から得られた分子モデルと理論計算から得られた分子モデルとの立体配座構造について、分子構造の揺れを許容する相同性比較を行う評価方法及び装置並びに構造パターン解析方法及び装置、並びに、構造相同性の高いアミノ酸配列パターンの抽出方法を提供する。
【解決手段】処理部が、入力を受け付けた分子モデルに基づき、各々の化学結合部位に対応する立体配座表記(以下、符号化立体配座表記と示す)により、注目する化学結合部位の表記を残して不要な表記を省略した符号化立体配座表記を前記分子モデルから抽出するとともに、選択された二面角分類コードと共にその両側の二面角分類コードを抽出して、要素として連続して隣り合った3個の二面角分類コードを要素とする集合を作成し、
各解析対象化合物中の前記位置における集合の要素を対比させ、相同性を判定する演算処理を行う操作を繰り返すことを特徴とする立体配座相同性評価方法。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、薬効や安全性などに関連する分子の構造変化を、その立体配座構造の相同性比較により簡便にかつより精緻に評価する装置及び方法に関する。
【背景技術】
【0002】
ポストゲノム研究の進展に伴い、製薬業界において抗体医薬をはじめとするバイオ医薬品の開発が進められている。この抗体医薬はタンパク質と非常に深い関わりを持っており、もともと自然界に存在するものとは構造の異なる物質を人為的に設計していることから、さらなる安全性を保証する品質管理手法の確立が求められてきている。例えば抗体医薬の液体製剤化プロセス中に凍結乾燥工程があるが、その凍結乾燥前後の溶液中で抗体医薬の構造変化が起きていないことを簡易に確認する手段が求められている(非特許文献1)。
【0003】
一方で、創薬の観点から、タンパク質とリガンドの相互作用の理解が重要であるため、数多くのタンパク質のX線結晶構造解析例が報告され、その一部は日本蛋白質構造データバンク(PDBj)などにおいてインターネットを介して公開されており(http://www.pdbj.org/)、近年のグラフィカルインターフェースの進歩と相まってリガンドとの相互作用によるタンパク質の構造変化の仕組みが解明され始めている。
【0004】
しかしながら、X線結晶構造解析ではその安定構造の一つを観測しているにすぎず、実際には液相中で機能が発現されており、平衡に基づく立体配座変化が絶えず起こっている。
すなわち、液相中ではタンパク質の立体構造に揺れが存在するが、これらの揺れをアミノ酸配列、直交座標系やZ-matrixを用いて簡易に表記することは出来なかった。
【0005】
特に、安全性を保証する品質管理の観点から、平衡に基づく立体配座変化と非可逆的な構造変化を明確に区別するためのツールが必要とされていた。
【0006】
本発明者らは、生体分子をはじめとするキラリティーを有する物質の赤外円二色性(VCD)バンドが立体配座に対して極めて敏感であることを見出し(非特許文献2−5)、新たな立体配座解析手法を提案するとともに(特許文献1)、その単純化モデル分子のアイデアから発想を得て、有機分子の立体配座を簡便に表記するためのコード化装置及び方法に関する提案を行っている(特許文献2−4)。
【0007】
その中で、前記の液相中での分子構造の揺れの問題を解決するため、360度を6分割して符号を付し、それぞれの部位をさらに2分割して別の符号を付すことで構造の相同性評価を行っていたが、符号の一致による単純な演算処理では完全には分子構造の揺れの問題に対処できない課題があることがわかった。
【0008】
また、密度汎関数法計算から得られた最適化構造分子モデルとX線結晶構造解析から得られた分子モデルの構造相同性比較を行う場合に、X線結晶構造データでは水素原子の位置が決められていないことから、前記のコード化方法では座標位置が定まらない水素原子が関与する二面角分類コードにおいて、せっかく構造相同性比較が可能な構造情報が含まれていながら、その構造情報を十分に活用できない問題があることがわかった(非特許文献1)。
【0009】
さらに、解析対象化合物がタンパク質あるいはペプチドの場合にアミノ酸配列が異なっていながら、構造相同性は非常に高いケースが存在しているが、従来の立体配座解析法によっては、そのアミノ酸配列パターンを詳細な立体配座表記と結びつけて抽出することができない。そのため、分子構造の揺れの影響を最小限に留めて、特徴的な分子構造を有するアミノ酸配列パターンの有効な抽出手法の構築が望まれていた。特に、αへリックス型、βシート型等の特徴的な分子構造パターンを示すフラグメント領域を決定し抽出するための解析手法が望まれていた。同様に、1本鎖のRNAの場合も種々の特徴的な立体構造をとることが知られ、これらのX線結晶構造データが豊富に存在するので、これらRNAなど1本鎖のポリヌクレオチドにおいても、同様の解析手法が適用できることが期待される。
【0010】
そこで、これらの問題を解決するために、立体配座相同性を電算機処理するための評価技術が求められていた。
【先行技術文献】
【特許文献】
【0011】
【特許文献1】特許第3991106明細書
【特許文献2】WO2008/117570(PCT/JP2008/051673)
【特許文献3】特開2009−265855号公報
【特許文献4】US-2009-0248321-A1(US/12/385856)
【非特許文献】
【0012】
【非特許文献1】和泉 博、ファームテクジャパン,2009,25,19
【非特許文献2】H.Izumi 他、J.Am.Chem.Soc.,2004,126,194
【非特許文献3】H.Izumi 他、J.Org.Chem.,2007,72,277
【非特許文献4】H.Izumi 他、J.Org.Chem.,2008,73,2367
【非特許文献5】H.Izumi 他、J.Org.Chem.,2009,74,1231
【発明の概要】
【発明が解決しようとする課題】
【0013】
本発明は、このような従来技術の実状及び要望に鑑みてなされたもので、符号の一致による単純な演算処理では完全には分子構造の揺れの問題に対処できない場合においても、簡便に立体配座構造の相同性の比較を行うことができる評価方法、水素原子の位置情報を持たないX線結晶構造解析から得られた分子モデルと理論計算から得られた分子モデルとの比較を行うことができる評価方法、解析対象化合物がタンパク質あるいはペプチドの場合にアミノ酸配列が異なっていながら、構造相同性は非常に高いアミノ酸配列パターンを詳細な立体配座表記とともに抽出することができる立体配座相同性評価方法、及びそれらの装置を提供し、あわせて、αへリックス型、βシート型等のフラグメント構造パターンに関してコード情報を用いて評価、解析することができる構造パターン解析方法及びその装置を提供することを課題とする。
【課題を解決するための手段】
【0014】
上記課題を解決するため、以前に本発明者らが開発した立体配座相同性評価装置及び評価方法(特許文献4など)による構造相同性比較にX線結晶構造解析データを適用させるための新たな優先則を作成し、X線結晶構造解析データのような水素原子の位置情報が無い場合でも一義的に表記できるようにした。
このことで、各種ペプチド、タンパク質を含む膨大な化学物質に関する立体構造データを比較することが可能となった。
そして、その化学物質を構成する各分子の立体配座構造ごとに対応するボンド位置の二面角分類コードを要素とする集合を作成し、該集合の要素が二面角分類コードのうち連続して隣り合った3個の二面角分類コードに必ず含まれ、かつ少なくとも該集合の要素の1個は前記連続して隣り合った3個の二面角分類コードの中央の二面角分類コードである条件を満たす場合には相同性が高く、それ以外は相同性が低いと判定して演算処理する「揺れ許容演算解析法」を開発し、当該解析法に従って比較を行うこととした。
そのことにより、同一の立体構造でも液相中での「揺れ」が原因で、従来の評価方法(特許文献4など)では適切な相同性評価ができなかったものが、ほぼ正確に評価可能になった。また、抗体(免疫グロブリン)中のCDR領域以外のフレームワーク領域内や定常領域内にも立体構造が大きく変化する位置があることが実証でき、正常プリオンと異常プリオンの立体構造変化を決定づける本質的領域を文字情報で示すことができた。
さらに、「揺れ許容演算解析法」の1部に改良を加え、アミノ酸フラグメントやヌクレオチドフラグメントのような数多くのフラグメントからなる生体高分子の、特徴的な分子構造の領域に対応するフラグメント、例えば、タンパク質のαへリックスフラグメント、βへリックスフラグメント、RNAの二重らせん構造に特徴的なステムフラグメントのみの符号化立体配座表記を構成する二面角位置コードそれぞれにおいて、最も出現頻度の高い二面角分類コードを取り出し、これらフラグメントに対応した立体配座コードを参照するテンプレートとし、解析対象化合物の解析しようとする領域に対して、前記改良「揺れ許容演算解析法」を適用して構造相同性比較を行うことにより、それぞれの構造パターンを持ったフラグメントを、それ以外のフラグメントから分離抽出することができた。
以上の知見を得たことで本発明を完成することができた。
【0015】
具体的には、本発明は、第1には、
処理部が、複数の解析対象化合物それぞれの立体配座構造の分子モデルの入力を受け付け、
前記処理部が、入力を受け付けた分子モデルに基づき、各々の化学結合部位に対応する二面角位置コードと、360度を12分割して定められた二面角分類コードの組み合わせからなる立体配座表記(以下、符号化立体配座表記と示す)により、一つの該符号化立体配座表記で立体配座を一義的に決定できる構造について、前記立体配座表記に必要となる、注目する化学結合部位の表記を残して不要な表記を省略した符号化立体配座表記を前記分子モデルから抽出するとともに、抽出した符号化立体配座表記を記憶部に記憶させ、
前記処理部が、前記記憶部から複数の前記符号化立体配座表記を取り出し、
対応関係にある二面角位置におけるそれぞれの位置において、選択された二面角分類コードと共にその両側の二面角分類コードを抽出して、要素として連続して隣り合った3個の二面角分類コードを要素とする集合を作成し、
各解析対象化合物中の前記位置における集合の要素を対比させ、
それぞれの化合物に帰属する集合の要素のうちで少なくとも1個の要素は全ての化合物において共通しており、かつ当該共通した要素が少なくとも1つの化合物に帰属する集合における中央の要素であるという条件を満たすか否かを検索し、
満たす場合には相同性が高く、それ以外は相同性が低いと判定する演算処理を行う操作を繰り返すことを特徴とする立体配座相同性評価方法を提供する。
【0016】
また、第2には、上記第1の方法において、
比較する解析対象化合物の少なくとも1つの立体配座構造がX線結晶構造解析による分子モデルの場合であって、かつIUPAC命名法に準拠した二面角分類コードを決定する標準則によると座標位置が定まらないために水素原子が関与する二面角分類コードが決定できないときに、下記(A)〜(C)の優先則に従い、前記符号化立体配座表記を選択することを特徴とする立体配座相同性評価方法を提供する。
(A)立体配座に関するIUPAC命名法の規則に準拠して、水素原子を除いた場合でも優先する置換基あるいは原子が決定できる場合にはその優先する置換基あるいは原子を選択する、
(B)立体配座に関するIUPAC命名法のうち下記[0038]に記載の(2)一つだけが他と違うときは順位に関係なくそのものを選択するという規則で水素が選択される場合には、本来存在するべき水素原子を紙面手前に置き、二面角位置コードのボンドを紙面向こう側に紙面に対して垂直に置き、水素原子と二面角位置コードのボンドのなす面と置換基あるいは原子と二面角位置コードのボンドのなす面による二面角が水素原子からみて時計回りに一番小さくなる置換基あるいは原子を選択する、
(C)その他の水素原子を除いた場合に優先する置換基あるいは原子が決定できない場合には、二面角が一番小さくなる置換基あるいは原子を選択する。
【0017】
また、第3には、上記第1又は第2の方法において、
比較する解析対象化合物がタンパク質又はペプチドの場合に、各アミノ酸残基を結合する主鎖を基準に選択して接頭辞に各アミノ酸残基を用い、アミノ酸配列と対応させた前記符号化立体配座表記を行うものであり、主鎖のみについて構造相同性評価を行うことを特徴とする立体配座相同性評価方法を提供する。
【0018】
また、第4には、上記第3の方法において、
解析対象化合物となるタンパク質又はペプチド間において、構造相同性は高いがアミノ酸配列は異なっている前記符号化立体配座表記及びアミノ酸配列パターンを抽出することを特徴とする立体配座相同性評価方法を提供する。
【0019】
また、第5には、上記第1〜4のいずれかの方法において、
比較する解析対象化合物同士で同一のフラグメントを有する場合において、そのフラグメントの接頭辞を含めた二面角位置コードの表記が完全に一致しており、そのうちの1つを基準となる化合物として選択できる場合に、当該化合物の立体配座構造の二面角分類コードを、連続して隣り合った3個のうち中央のコードとし、構造相同性評価を行う化合物の対応する二面角位置における二面角分類コードの集合のすべての要素が、基準となる該二面角分類コードの中央値あるいはそれと隣り合った二面角分類コードに一致すれば相同性が高く、それ以外は相同性が低いと判定して演算処理を行うことを特徴とする立体配座相同性評価方法を提供する。
【0020】
さらに、本発明は、第6には、
表示部、入力部、処理部、主記憶部、出力部、I/O部、データベース部及び各部を接続するバスから構成される立体配座相同性評価装置であって、
入力部において、入力操作に従い、複数の解析対象化合物それぞれの立体配座構造の分子モデルをデータベース部から取り出して処理部に送り、
前記処理部において、入力を受け付けた各々の分子モデルに対して、
注目する化学結合部位に対応する二面角位置コードを表記すると共に、各二面角位置コードのそれぞれに、360度を12分割して定められた二面角分類コードを組み合わせて表記する符号化立体配座表記を施すことで、各分子モデルに関する立体配座を一義的に決定し、
次いで、構造相同性評価のための演算に必要な注目する化学結合部位の表記以外の不要な表記を省略した符号化立体配座表記を抽出し、
抽出した各符号化立体配座表記を記憶部に記憶させ、
前記処理部において、前記記憶部から前記複数の解析対象化合物に対応する各々の前記符号化立体配座表記を取り出し、
対応関係にある二面角位置における最初の位置において、選択された二面角分類コードと共にその両側の二面角分類コードを抽出して、要素として連続して隣り合った3個の二面角分類コードを要素とする集合を作成し、
各解析対象化合物中の前記位置における集合の要素を対比させ、
それぞれの化合物に帰属する集合の要素のうちで少なくとも1個の要素は全ての化合物において共通しており、かつ当該共通した要素が少なくとも1つの化合物に帰属する集合における中央の要素であるという条件を満たすか否かを検索し、
満たす場合には相同性が高く、それ以外は相同性が低いと判定し、
続いて次の位置における同様の操作を行い、全ての対応する位置についての操作を繰り返して完了したときに、出力部に送り、
前記出力部において、各二面角位置コードのそれぞれに対応させた揺れ許容評価を相同性が高い場合には○、相同性が低い場合には×という符号を表示する、及び/又は全二面角位置コード数あたりの揺れ許容評価が○の割合を計算して揺れ許容相同性の価として表示することを特徴とする立体配座相同性評価装置を提供する。
【0021】
また、第7には、上記第6の装置において、
前記処理部において各分子モデルに関する符号化立体配座表記を決定するにあたり、前記入力を受け付けた各々の分子モデルの少なくとも1つがX線結晶構造解析による分子モデルの場合であって、かつIUPAC命名法に準拠した二面角分類コードを決定する標準則によると座標位置が定まらないために水素原子が関与する二面角分類コードが決定できない場合に、下記(A)〜(C)の優先則に従い、前記符号化立体配座表記を選択する工程を設けることを特徴とする立体配座相同性評価装置を提供する。
(A)立体配座に関するIUPAC命名法の規則に準拠して、水素原子を除いた場合でも優先する置換基あるいは原子が決定できる場合にはその優先する置換基あるいは原子を選択する、
(B)立体配座に関するIUPAC命名法の(2)一つだけが他と違うときは順位に関係なくそのものを選択するという規則で水素が選択される場合には、本来存在するべき水素原子を紙面手前に置き、二面角位置コードのボンドを紙面向こう側に紙面に対して垂直に置き、水素原子と二面角位置コードのボンドのなす面と置換基あるいは原子と二面角位置コードのボンドのなす面による二面角が水素原子からみて時計回りに一番小さくなる置換基あるいは原子を選択する、
(C)その他の水素原子を除いた場合に優先する置換基あるいは原子が決定できない場合には、二面角が一番小さくなる置換基あるいは原子を選択する。
【0022】
また、第8には、上記第6又は第7の装置において、
比較する解析対象化合物同士で同一のフラグメントを有する場合において、そのフラグメントの接頭辞を含めた二面角位置コードの表記が完全に一致しており、そのうちの1つを基準となる化合物として選択できる場合に、当該化合物の立体配座構造の二面角分類コードを、連続して隣り合った3個のうち中央のコードとし、構造相同性評価を行う化合物の対応する二面角位置における二面角分類コードの集合のすべての要素が、基準となる該二面角分類コードの中央値あるいはそれと隣り合った二面角分類コードに一致すれば相同性が高く、それ以外は相同性が低いと判定する演算処理を行わせることを特徴とする立体配座相同性評価装置を提供する。
【0023】
また、第9には、
処理部が、1つ又は複数の基準となる構造パターンに対応するフラグメントの立体配座構造の分子モデルの入力を受け付け、
前記処理部が、入力を受け付けた分子モデルに対して、注目する化学結合部位に対応する二面角位置コードを表記すると共に、各二面角位置コードのそれぞれに、360度を12分割して定められた二面角分類コードを組み合わせて表記する符号化立体配座表記を施すことで、各分子モデルに関する立体配座を一義的に決定し、
次いで、構造相同性評価のための演算に必要な注目する化学結合部位の表記以外の不要な表記を省略した符号化立体配座表記を抽出し、
抽出した符号化立体配座表記をそれぞれ基準構造パターンとしてあらかじめ記憶部に記憶させ、
別途、解析対象化合物の立体配座構造の分子モデルの入力を受け付け、
前記処理部において、入力を受け付けた解析対象化合物の分子モデルに対して、
注目する化学結合部位に対応する二面角位置コードを表記すると共に、各二面角位置コードのそれぞれに、360度を12分割して定められた二面角分類コードを組み合わせて表記する符号化立体配座表記を施すことで、各分子モデルに関する立体配座を一義的に決定し、
次いで、構造パターン解析のための演算に必要な注目する化学結合部位の表記以外の不要な表記を省略した符号化立体配座表記を抽出し、
抽出した各符号化立体配座表記を記憶部に記憶させ、
前記処理部において、前記記憶部から前記解析対象化合物の符号化立体配座表記を取り出すと共に、あらかじめ記憶部に記憶させていた前記基準構造パターンのうちで、比較しようとする基準構造パターンを選択し、当該構造パターンに一致する前記符号化立体配座表記を比較対象の参照として取り出し、
対応関係にある二面角位置における最初の位置において、選択された二面角分類コードと共にその両側の二面角分類コードを抽出して、要素として連続して隣り合った3個の二面角分類コードを要素とする集合を作成し、
前記解析対象化合物及び参照となる構造パターン中の前記位置における集合の要素を対比させ、
各二面角分類コードが帰属する集合の要素のうちで少なくとも1個の要素が基準の構造パターンと共通しているという条件を満たすか否かを検索し、
満たす場合には、基準の構造パターンに一致するとして判定し、満たさない場合には、それ以外の構造パターンに該当すると判定する演算処理を行い、
続いて次の位置における同様の演算処理を行う操作を行い、全ての対応する位置についての操作を繰り返すことを特徴とする構造パターン解析方法を提供する。
【0024】
また、第10には、
表示部、入力部、処理部、主記憶部、出力部、I/O部、データベース部及び各部を接続するバスから構成される立体配座相同性評価装置であって、
入力部において、入力操作に従い、1つ又は複数の基準となる構造パターンに対応するフラグメントの立体配座構造の分子モデルの入力を受け付け、
各々の構造パターンの立体配座構造の分子モデルをデータベース部から取り出して処理部に送り、
処理部において、入力を受け付けた各々の構造パターンの分子モデルに対して、
注目する化学結合部位に対応する二面角位置コードを表記すると共に、各二面角位置コードのそれぞれに、360度を12分割して定められた二面角分類コードを組み合わせて表記する符号化立体配座表記を施すことで、各分子モデルに関する立体配座を一義的に決定し、
次いで、構造相同性評価のための演算に必要な注目する化学結合部位の表記以外の不要な表記を省略した符号化立体配座表記を抽出し、
抽出した符号化立体配座表記をそれぞれ基準構造パターンとしてあらかじめ記憶部に記憶させ、
別途、解析対象化合物の立体配座構造の分子モデルの入力を受け付け、
前記処理部において、入力を受け付けた解析対象化合物の分子モデルに対して、
注目する化学結合部位に対応する二面角位置コードを表記すると共に、各二面角位置コードのそれぞれに、360度を12分割して定められた二面角分類コードを組み合わせて表記する符号化立体配座表記を施すことで、各分子モデルに関する立体配座を一義的に決定し、
次いで、構造相同性評価のための演算に必要な注目する化学結合部位の表記以外の不要な表記を省略した符号化立体配座表記を抽出し、
抽出した各符号化立体配座表記を記憶部に記憶させ、
前記処理部において、前記記憶部から前記解析対象化合物の符号化立体配座表記を取り出すと共に、あらかじめ記憶部に記憶させていた前記基準構造パターンのうちで、比較しようとする基準構造パターンを選択し、当該構造パターンに一致する前記符号化立体配座表記を比較対象の参照として取り出し、
対応関係にある二面角位置における最初の位置において、選択された二面角分類コードと共にその両側の二面角分類コードを抽出して、要素として連続して隣り合った3個の二面角分類コードを要素とする集合を作成し、
前記解析対象化合物及び参照となる構造パターン中の前記位置における集合の要素を対比させ、
各二面角分類コードが帰属する集合の要素のうちで少なくとも1個の要素が基準の構造パターンと共通しているという条件を満たすか否かを検索し、
満たす場合には、基準の構造パターンに一致するとして判定し、満たさない場合には、それ以外の構造パターンに該当すると判定する演算処理を行い、
続いて次の位置における同様の演算処理を行う操作を行い、全ての対応する位置についての操作を繰り返して完了したときに、出力部に送り、
前記出力部において、各二面角位置コードのそれぞれに対応させた揺れ許容評価を基準の構造パターンに一致するとして判定した場合には○、それ以外の構造パターンに該当すると判定した場合には×という符号を表示する、及び/又は全二面角位置コード数あたりの揺れ許容評価が○の割合を計算して揺れ許容相同性の価として表示することを特徴とする立体配座相同性評価装置を提供する。
【発明の効果】
【0025】
本発明によれば、符号の一致による単純な演算処理では完全には分子構造の揺れの問題に対処できない場合においても、簡便に立体配座構造の相同性の比較及び構造パターン解析を行うことができる。
すなわち、本発明によれば、対応する二面角位置における一つの前記二面角分類コードに関して、該二面角分類コードと隣接する二面角分類コードの組み合わせは相同性が高く、残りの二面角分類コードは相同性が低いと判定して演算処理するようにしたので、符号の一致による単純な演算処理では不可能であった立体配座構造の相同性の比較を簡便に行うことができる。
【0026】
また、本発明によれば、水素原子の位置情報を持たないX線結晶構造解析から得られた分子モデルと理論計算から得られた分子モデルとの比較を行うことができ、解析対象化合物がタンパク質あるいはペプチドの場合にアミノ酸配列が異なっていながら、構造相同性は非常に高いアミノ酸配列パターンを詳細な立体配座表記とともに抽出することができる。さらに、αへリックス型、βシート型等のフラグメント構造パターンについてコードを用いて簡便な操作で取り出すことができる。同様に、リボソームRNA,siRNAなど各種RNAにおいても、ステム構造、ループ構造などの二次構造を形成するフラグメントの構造パターンが抽出できる。加えて、この手法を適用することで、アミノ酸配列レベルでは相同性の低い各種タンパク質の間で、又は塩基配列レベルでは相同性の低い各種RNAの間で共通してみられる二次構造を形成するような新規構造パターンを見つけるためにも有用である。
【0027】
したがって、本発明は、例えば抗体医薬の液体製剤化プロセス中に凍結乾燥工程があるが、その凍結乾燥前後の溶液中で抗体医薬の構造変化が起きていないことを、前記符号化立体配座表記を用いた構造相同性比較により簡易に確認することができる。また、本発明は、機能発現にかかわるタンパク質の構造変化の追跡に利用できることから、オーファン受容体タンパク質の構造相同性機能解析による新規薬剤設計などに活用することができる。
【図面の簡単な説明】
【0028】
【図1】本発明の立体配座相同性評価装置のシステム構成図である。なお、図中の数字の意味は以下の通りである。1 表示部、2 入力部、3 処理部、4 主記憶部、5 出力部、6 外部インターフェース(I/O)部、7 データベース、8 バス
【図2】本発明に係る解析処理のフローチャートである。
【図3】タンパク質分子のアミノ酸配列に対応した二面角位置コードの定義を示す図である。
【図4】符号化立体配座表記に用いる二面角分類コードを表す符号の分類を示す図である。
【図5】1つの符号化立体配座表記で複数の分子モデルが対応する場合に相対的な位置関係に基づくσ(シス)、τ(トランス)のような符号を用いて、一義的に立体配座を表記できるようにした例示を示す図である。
【図6】1つの分子モデルにおいて複数の符号化立体配座表記が可能となる場合の優先則を説明するための例示となる図である。
【図7】X線結晶構造データ2immの分子モデルを示す図である。
【図8】アミノ酸配列14-15番目における2immと2mcpの構造の違いを示す図である。
【図9】X線結晶構造データ1a7oの分子モデルを示す図である。
【図10】アミノ酸配列76-77番目における1a7oと3iy2の構造の違いを示す図である。
【図11】X線結晶構造データ1kidの分子モデルを示す図である。
【図12】X線結晶構造データ1srvの分子モデルを示す図である。
【図13】アミノ酸配列224-225番目における1srvと1kidの構造の違いを示す図である。
【図14】X線結晶構造データ6gst_Iの分子モデルを示す図である。
【図15】理論計算から求められたグルタチオン(I)の分子モデルを示す図である。
【図16】X線結晶構造データ1i4mの分子モデルを示す図である。
【図17】X線結晶構造データ2w9eのプリオンタンパク質部分の分子モデルを示す図である。
【図18】アミノ酸配列141-143番目における1i4mと2w9eの構造の違いを示す図である。
【図19】アミノ酸配列190-198番目における1i4mと2w9eの構造の違いを示す図である。
【図20】プリオンタンパク質と免疫グロブリンが相互作用しているX線結晶構造データ2w9eの分子モデルを示す図である。
【図21】アミノ酸配列150-158番目における2mcpと2w9eの構造の違いを示す図である。
【図22】抽出されたプリオンタンパク質と免疫グロブリン軽鎖が相互作用している領域のX線結晶構造データ2w9eの分子モデルを示す図である。
【図23】アミノ酸配列90-92番目における2w9eと2w9dの構造の違いを示す図である。
【図24】アミノ酸配列151-152番目における2w9eと1i4mの構造の違いを示す図である。
【図25】2ihrと2wh1の中の遊離因子RF2の分子全体の構造の違いを示す図である。
【図26】2wrnと2wh1の中のリボソームRNAの分子全体の構造の違いを示す図である。
【図27】2wrnにおいて、リボソームRNAと伸長因子EF-Tuが相互作用している分子構造を示す図である。
【図28】2wrnと2wh1の中のリボソームRNAのC366-C372における構造の違いを示す図である。
【図29】SARCIN-RICIN LOOPに特徴的なRNA主鎖の構造パターンを示す図である。
【発明を実施するための形態】
【0029】
以下、本発明を好ましい実施形態に基づいて詳細に説明する。
なお、本明細書中に引用した技術文献、特許公報中の記載内容は、本発明の記載内容として参照されるものとする。
1.本発明の立体配座相同性評価装置
図1は、本発明の立体配座相同性評価装置のシステム構成図である。この立体配座相同性評価装置は、表示部1、入力部2、処理部3、主記憶部4、出力部5、外部インターフェース(I/O)部6、データベース7よりなり、各部はバス8により接続されている。このような立体配座相同性評価装置は、例えば、構造相同性評価を行うためのプログラムを取り込んだパーソナルコンピュータ等により構築することができる。
【0030】
表示部1は、CRTや液晶ディスプレイ等よりなり、立体配座構造相同性評価のための画面表示を行う。入力部2は、キーボード等の各種入力手段よりなり、ユーザが必要なデータや情報を入力するために用いる。処理部3は、CPUより構成することができ、立体配座相同性評価のための各種制御、演算等を行う。主記憶部4は構造相同性評価のためのプログラム等を格納している。出力部5は、プリンタ等よりなり、ユーザに処理結果等を出力する。外部インターフェース(I/O)部6は、LANやインターネット等により他の端末機器等への接続を行う。データベース7は、立体配座相同性評価のための各種データ等を書き換え可能に記憶する。
【0031】
2.本発明の解析対象となる化合物
本発明の立体配座相同性評価装置では、基本的にはIUPAC命名法に準拠した規則より厳密に二面角の符号化を定義するようにした表記法を用いるため、本発明の解析対象となる化合物は、原則として化学構造式又はアミノ酸配列などで表記できる化合物である。化学構造式で表記できる有機化合物であれば、構造の一部に鎖状構造、環状構造いずれを有していても構わない。さらに、メチル基、イソプロピル基などのアルキル基、エステル基、カルボニル基、ヒドロキシル基、カルボキシル基、フェニル基、ヒドロキシフェニル基、グアニジノ基、チオール基、セレノール基、イミダゾイル基、アミノ基、インドリル基、アルケン、アミド、ジスルフィド、ハロゲン、酸素原子、窒素原子、リン原子、硫黄原子のような官能基で置換されていてもかまわない。また、共有結合ではない、例えば水素結合、配位結合で金属イオンに結合した構造を有していてもかまわない。本発明は、アミノ酸が2〜10程度結合したオリゴペプチド、10〜100程度結合したポリペプチドのみならずタンパク質及び修飾タンパク質に対しても、アミノ酸配列で表記できる場合には適用可能であり、その際の構成アミノ酸は、グリシン(Gly)、アラニン(Ala)、バリン(Val)、ロイシン(Leu)、イソロイシン(Ile)、フェニルアラニン(Phe)、チロシン(Tyr)、トリプトファン(Trp)、セリン(Ser)、トレオニン(Thr)、システイン(Cys)、シスチン(CyS-SCy)、メチオニン(Met)、アスパラギン酸(Asp)、アスパラギン(Asn)、グルタミン酸(Glu)、グルタミン(Gln)、リシン(Lys)、アルギニン(Arg)、ヒスチジン(His)、プロリン(Pro)、セレノシステイン(Sec)、ヒドロキシプロリン、チロキシン、O-ホスホセリン、β-アラニン、等任意のアミノ酸がペプチド結合されていてよく、それぞれの構成アミノ酸がさらに他の官能基により修飾されていても良い。さらに、本発明は、ヌクレオチドが2〜3000程度結合したリボ核酸(RNA)及び修飾RNAに対しても、核酸塩基配列で表記できる場合には適用可能であり、その際の核酸塩基は、アデニン(A)、グアニン(G)、ウラシル(U)、シトシン(C)等任意の核酸塩基が五炭糖に結合されていてよく、それぞれの構成ヌクレオチドがさらに他の官能基により修飾されていても良い。また、デオキシリボ核酸(DNA)にも適用できる。
また、本発明は、アミノ酸配列と対応関係にある前記符号化立体配座表記を組み合わせて、構造相同性は高いがアミノ酸配列は異なっている前記符号化立体配座表記及びアミノ酸配列パターンを抽出する場合を包含するが、その場合に対象となる化合物は、上記ペプチド類、タンパク質などのペプチド結合化合物に限定される。
【0032】
このような有機化合物としては、例えば、以下のような化合物を例示することができる。
典型的なタンパク質としては、インシュリン等のタンパク質ホルモン、サイトカイン類、グルタチオン-S-トランスフェラーゼ、グルタチオン還元酵素、シクロオキシゲナーゼ等の各種酵素類、免疫グロブリンまたはその機能的フラグメント、Gタンパク質共役受容体等各種受容体、イオンチャネル、トランスポーター類の他、シャペロニン、分子シャペロン、人血清アルブミン、βアミロイドタンパク質、プリオンタンパク質、ロドプシン、Gタンパク質等があげられる。典型的なRNAとしては、伝令RNA(mRNA)、転移RNA(tRNA)、リボソームRNA(rRNA)、microRNA、mRNA-like non-coding RNA、small nuclear RNA、small nucleolar RNA、signal recognition particle RNA等があげられる。タンパク質、RNA以外の典型的な有機化合物としては、グルタチオン、酸化型グルタチオン、イブプロフェン、イブプロフェン二量体、2-フェニルプロピオン酸、レボフロキサシン、ピペラジン、サリドマイド、サリドマイド二量体、5'-ヒドロキシサリドマイド、フタルイミド、ジオキソピペリジン、パクリタキセル、パクリタキセルtail、パクリタキセルtailメチルエステル、バッカチンIII、ベンズアミド、マラチオン、ジエチルサクシネート、2-メルカプトジエチルサクシネート、2-ブタノール、2-ペンタノール、2-ヘキサノール、2-ヘプタノール、2-オクタノール、2-ノナノール、2-デカノール、2-メチル-1-ブタノール、3-メチル-1-ペンタノール、4-メチル-1-ヘキサノール、5-メチル-1-ヘプタノール、6-メチル-1-オクタノール、cis-ペルメトリン、cis-3-(2,2-ジクロロビニル)-2,2-ジメチルシクロプロパンカルボン酸ベンジルエステル、cis-3-(2,2-ジクロロビニル)-2,2-ジメチルシクロプロパンカルボン酸メチルエステル、3-フェノキシベンジルアルコール、コレステロールアセテート、コレステロールプロピオネート、n-ブチリックアシッドコレステロールエステル、コレステロールn-バレレート、コレステロールn-ヘキサノエート、コレステロールn-ヘプタノエート、コレステロールn-カプリレート、コレステロールぺラルゴネート、コレステロールn-カプレート、コレステロールラウレート、コレステロールミリステート、コレステロールパルミテート、コレステロール、β-コレスタノール、コレステリルクロライド、コレステリルブロマイド、コレステロールメチルカルボネート、コレステロールエチルカルボネート、コレステロール-n-ブチルカルボネート、コレステロール-n-アミルカルボネート、コレステロール-n-ヘキシルカルボネート、コレステロール-n-ヘプチルカルボネート、コレステロール-n-ノニルカルボネート、コレステロールオレイルカルボネート、アデニンヌクレオシド、グアニンヌクレオシド、ウラシルヌクレオシド、シトシンヌクレオシド、チミンヌクレオシド、アデノシン5’-リン酸、グアノシン5’-リン酸、ウリジン5’-リン酸、シチジン5’-リン酸、デオキシアデノシン一リン酸、デオキグアノシン一リン酸、デオキシチミジン一リン酸、デオキシシチジン一リン酸があげられる。
【0033】
3.立体配座相同性評価の概要
本実施形態の立体配座相同性評価装置による立体配座相同性評価の概要を以下に述べる。
まず、処理部3が、解析対象化合物の分子モデルの入力を受け付ける。
次に、処理部3は、入力を受け付けた分子モデルに基づき、各々の化学結合部位に対応する二面角位置コードと、360度を12分割して定められた二面角分類コードの組み合わせからなる前記符号化立体配座表記により、一つの該符号化立体配座表記で立体配座を一義的に決定できる構造について、前記立体配座表記に必要となる、注目する化学結合部位の表記を残して不要な表記を省略した符号化立体配座表記を前記分子モデルから抽出するとともに、抽出した符号化立体配座表記をデータベース7に記憶させる。
ここで、前記立体配座表記に必要となる、注目する化学結合部位の表記を残して不要な表記を省略した符号化立体配座表記を前記分子モデルから抽出するとは、例えば、免疫グロブリンにおいて、軽鎖の超可変領域の構造相同性評価を行う場合には、対応する軽鎖の超可変領域の符号化立体配座表記のみ抽出するが、軽鎖及び重鎖を含めたタンパク質分子全体の相同性評価を行う場合には、免疫グロブリン分子全体の符号化立体配座表記を抽出することを意味する。
【0034】
このとき、解析対象化合物の立体配座構造がX線結晶構造解析から得られた構造データであり、水素原子の座標位置の構造情報が含まれていない構造データと構造相同性を比較する必要がある場合には、前記入力を受け付けた分子モデルについて、座標位置が定まらない水素原子が関与する前記二面角分類コードにおいてあらかじめ定められた優先則に従い、立体配座を一義的に決定可能な符号化立体配座表記を前記分子モデルから抽出するとともに、抽出した符号化立体配座表記をデータベース7に記憶させる。
【0035】
次に、処理部3は、データベース7から立体配座相同性評価を行うための複数の前記符号化立体配座表記を取り出し、相同性比較が可能な形に前記符号化立体配座表記のコードの並べ替えを行い、形式を揃える。引き続き、対応する二面角位置において、ある一つの二面角分類コードに関して、該二面角分類コードと隣接する二面角分類コードの組み合わせは相同性が高く、残りの二面角分類コードは相同性が低いと判定して演算処理を行い、立体配座相同性評価結果をデータベース7に記憶させる。より具体的には、対応関係にある二面角位置における一つの前記二面角分類コードに関して、構造相同性比較を行う前記二面角分類コードの集合を作成し、該集合の要素が360度を12分割して定められた二面角分類コードのうち連続して隣り合った3個の二面角分類コードに必ず含まれ、かつ少なくとも該集合の要素の1個は前記連続して隣り合った3個の二面角分類コードの中央の二面角分類コードである条件を満たす場合には相同性が高く、それ以外は相同性が低いと判定して演算処理を行い、立体配座相同性評価結果をデータベース7に記憶させる。順次、二面角位置を変えて前記二面角分類コードの集合を作成し、同様の演算処理を行い、立体配座相同性評価結果をデータベース7に記憶させる。このとき、必要に応じて、相同性比較が可能な形に並べ替えを行われた形式において、360度を12分割して定められた二面角分類コードそのものだけが相同性が高く、それ以外の二面角分類コードは相同性が低いと判定して演算処理を行い、立体配座相同性評価結果をデータベース7に記憶させる。処理部3は、相同性の評価結果を前記符号化立体配座表記とともにデータベース7から取り出して表示部1に表示するとともに必要に応じて出力部5に出力あるいは外部インターフェース(I/O)部6を介してデータ転送を行う。
【0036】
比較対象となる解析対象化合物がタンパク質あるいはペプチドの場合には、必要に応じて、処理部3は、相同性比較が可能な形に並べ替えを行われた形式において、アミノ酸配列と対応関係にある前記符号化立体配座表記を組み合わせて、構造相同性は高いがアミノ酸配列は異なっている符号化立体配座表記及びアミノ酸配列パターンを抽出する演算処理を行い、処理結果をデータベース7に記憶させるとともに表示部1に表示する。処理部3は、必要に応じて出力部5に出力あるいは外部インターフェース(I/O)部6を介してデータ転送を行う。
【0037】
図2のフローチャートに従い、各ステップごとに、以下詳細に説明する。
3−1.分子モデルの入力工程(S1及び2)
本発明においては、まず分子モデルの入力を行う(ステップS1〜S2)。入力する分子モデルは、X線結晶構造解析データ、密度汎関数法計算等の理論計算により構造最適化されたデータ(非特許文献1−5)、あるいは赤外円二色性スペクトル等から求められた実験値データ(非特許文献1−5)のいずれの分子構造データを用いてもかまわない。この場合、例えばあらかじめ化合物名、化学構造式および分子モデルを対応させてデータベース7にその情報を記憶させておき、ユーザが入力部2より化合物名あるいは化学構造式を入力すると、対応する分子モデルに変換できるようにしておいてよい。複数の解析対象化合物それぞれの立体配座構造の分子モデルの入力を行うには、例えば、ビヨンド・コンピューティング社製MolWorksソフトウェアを用いて前記分子構造データファイルを選択し、ファイルを開く操作により実現することが出来る。
【0038】
3−2.符号化立体配座表記へのコード変換及びコードの並べ替え(S3〜6)
次に、密度汎関数法計算等の理論計算により構造最適化された分子モデルのように、結合している水素原子の情報も含まれているデータ同士での構造相同性比較行う場合には、特許文献4記載の符号化立体配座表記へのコード変換を行う(ステップS3〜S4)。なお、比較の対象とする分子モデルとしてX線結晶構造データを利用する場合であって、優先則に従った際に水素原子が選ばれる等水素原子が関与する場合は、X線結晶構造データに水素原子に関する情報がないので、ステップS5に移行する。
符号化立体配座表記は、各々の化学結合部位に対応する「二面角位置コード」と、360度を12分割して定められた「二面角分類コード」の組み合わせからなり、「二面角分類コード」が優先則により決定される場合には「二面角位置コード」の中の指定されたコードに「二面角分類コード」の符号が代入されることにより使用される(特許文献4)。
ここで、「二面角分類コードを決定する優先則」としては、IUPAC命名法に準拠する。すなわち、IUPAC命名法においては、注目する化学結合のそれぞれの端に結合したリガンド(置換基あるいは原子)がなす二面角に基づいて立体配座を表すことが定められており、そのリガンドの優先則として、
(1)リガンドが全部違うときはR/S表示で決められた順位則によって最も優位のもの、
(2)一つだけが他と違うときは順位に関係なくそのもの、
(3)全部が同じときは二面角が一番小さくなるものを優先することが定められている。
前記二面角分類コードを決定するには、上記優先則に従い置換基あるいは原子を選択し、置換基あるいは原子がなす二面角の角度を求め、特許文献4記載の「符号化立体配座表記方法」に従い二面角の角度に対応するコードを選択する。なお、二面角の角度情報から前記二面角分類コードへの変換には、独立行政法人産業技術総合研究所が所有する符号化立体配座表記法プロトタイプアプリケーション(H21PRO-1028)(非特許文献1)を用いることができる。
【0039】
<二面角位置コードの付与例>
具体例を挙げると、特許文献4に記載の通り、環構造をもつ場合など一個の立体配座表記で立体配座を一義的に決定できる構造がある場合には、注目する化学結合部位の表記を残し不要な表記を省略して、立体配座を一義的に示す符号化立体配座表記へのコード変換を行う(ステップS4)。データベース化の観点から化合物をフラグメント毎に区切り表記した方が簡便な場合にはフラグメントの接頭辞と化学結合部位の二面角位置を示す符号を組み合わせた二面角位置コードを用いることができる。タンパク質分子の場合は、そのような表記方法が適する場合であり、例えば、図3に示すように、アミノ酸配列に対応した接頭辞とそれぞれのアミノ酸の主鎖及び側鎖に必要となる二面角位置を示す符号を組み合わせることで二面角位置コードを表すことができる。その際、優先則による二面角分類の判定に水素原子の詳細な位置情報が関与する二面角位置を表記する必要があり、しかもX線結晶構造解析データなど水素原子の位置が決められないデータを利用する場合には、優先則による二面角分類の判定をもとにした予め定めた二面角分類コードの符号を用いることができないので、その代わりに対応する二面角位置だけを意味する二面角位置コードの符号を用いることとする。
【0040】
一例として、下記のインシュリンA鎖のアミノ酸配列を文字列として表記する際の手順を示す。
「GLY ILE VAL GLU GLN CYS CYS THR SER ILE CYS SER LEU TYR GLN LEU GLU ASN TYR CYS ASN」(配列番号1)
インシュリンA鎖の二面角位置コードは、アミノ酸配列に対応した接頭辞とそれぞれのアミノ酸の主鎖(A,B,C)及び側鎖(a,b,c,d等)の二面角位置を示す符号を組み合わせて、以下のように記載することができる。
「GLY-ABC-ILE-A-ab-BC-VAL-A-a-BC-GLU-A-abcd-BC-GLN-A-abcd-BC-CYS-A-ab(c)-BC-CYS-A-ab-BC-THR-A-ab-BC-SER-A-ab-BC-ILE-A-ab-BC-CYS-A-ab(c)-BC-SER-A-ab-BC-LEU-A-ab-BC-TYR-A-abc-BC-GLN-A-abcd-BC-LEU-A-ab-BC-GLU-A-abcd-BC-ASN-A-abc-BC-TYR-A-abc-BC-CYS-A-ab-BC-ASN-A-abc-B」
以下に述べる手法により、さらにそれぞれのアミノ酸の主鎖及び側鎖の二面角位置を示す符号に二面角分類コードの符号を代入することにより、一義的に立体配座構造を文字列として表記することができる。
【0041】
<二面角分類コードの符号例>
ここで、360度を12分割して定められた二面角分類コードの符号を付す方法の一例を示す。通常は特許文献4記載のように、360度を6分割し、その分割された部位に図4に示す1-6のような予め定めた符号を付し、主にこの符号を用いて二面角分類を表記する。まれにこの分類では2種類の違った立体配座と判断すべき立体配座が同一のコードとして表記される場合があるため、その場合にはさらにその6分割された各々の部位をさらに2分割し、2分割された部位にα(a、時計回り)、β(b、反時計回り)のような予め定めた符号を付し、主にこれらの2種類の符号のような組み合わせを用いて図4に示す12分割された部位に対応する符号を用いて二面角分類を表記する。さらに、対応する二面角が偶然その境界線上に位置する場合に備えて、境界線上では図4に示す符号を用いてもかまわない。
【0042】
<σ(シス)およびτ(トランス)の符号について>
さらに、特許文献4記載のように、IUPAC命名法に準拠した規則において、(3)全部の置換基あるいは原子が同じときは二面角が一番小さくなるものを選択した場合において、1つの符号化立体配座表記で複数の分子モデルが対応する場合が起こりうるため、その場合には新たに相対的な位置関係に基づくσ(s、シス)、τ(t、トランス)のような符号を用いて、一義的に立体配座を表記できるようにする。例えば、(S)-イブプロフェンにおいてプロピオン酸部位の結合した芳香環において二面角を決める場合には(3)全部の置換基あるいは原子が同じときは二面角が一番小さくなるものを選択した場合に該当するが、ibut-3α2α(phpa-3α2α)という符号化立体配座表記では図5に示す同一の表記で表される2種類の立体配座構造が存在する。その場合には注目する結合間の相対位置関係を用いて、σ(シス)およびτ(トランス)の符号を用いて区別する。
【0043】
また、特許文献4記載のように、IUPAC命名法に準拠した規則において、(3)全部の置換基あるいは原子が同じときは二面角が一番小さくなるものを選択した場合に時計回りあるいは反時計回りかで、区別できない置換基あるいは原子の二面角のなす角度が同じになることが起こりうる。その場合、1つの分子モデルにおいて複数の符号化立体配座表記が可能となるため、時計回りで二面角が一番小さくなるものを優先する。例えば、レボフロキサシンにおいて図6に示すピペラジン環の二面角では、ピペラジン環自体が左右対称であるため置換基の二面角のなす角度が正負逆で絶対値は同じになっており、2種類の符号化立体配座表記をとりうる。優先則を適用することによりlevo-2β-1β5α(pipa-1β1β)と一義的に立体配座の表記を定義する。
【0044】
本実施形態の立体配座相同性評価装置では、解析対象化合物の立体配座構造がX線結晶構造解析から得られた構造データであり、水素原子の座標位置の構造情報が含まれていない構造データと構造相同性を比較する必要がある場合には、入力を受け付けた分子モデルについて、座標位置が定まらない水素原子が関与する前記二面角分類コードにおいてあらかじめ定められた優先則に従い、立体配座を一義的に決定可能な符号化立体配座表記を該分子モデルから抽出し、コード変換を行う(ステップS3〜S5)。すなわち、ステップS4のコード化のための規則に代えて、下記の優先則に従い、符号化立体配座表記へのコード変換を行う(ステップS5)。なお、当該優先則をあてはめても決められない場合であっても対応する二面角位置だけで比較すればよい。そのことを示すために、決められないことを「X」などの符号を用いて表記しておく。
<水素原子の位置が定まらない場合のコード化のための優先則>
(A)立体配座に関するIUPAC命名法の規則に準拠して、水素原子を除いた場合でも優先する置換基あるいは原子が決定できる場合にはその優先する置換基あるいは原子を選択する。
(B)立体配座に関するIUPAC命名法の(2)一つだけが他と違うときは順位に関係なくそのものを選択するという規則で水素が選択される場合には、本来存在するべき水素原子を紙面手前に置き、二面角位置コードのボンドを紙面向こう側に紙面に対して垂直に置き、水素原子と二面角位置コードのボンドのなす面と置換基あるいは原子と二面角位置コードのボンドのなす面による二面角が水素原子からみて時計回りに一番小さくなる置換基あるいは原子を選択する。
(C)その他の水素原子を除いた場合に優先する置換基あるいは原子が決定できない場合には、二面角が一番小さくなる置換基あるいは原子を選択する。
【0045】
前述のインシュリンA鎖の例では、前記二面角位置コードに、順次PDBjに登録されているインシュリンのX線結晶構造データ「2c8r」から変換された二面角分類コードの符号を代入することにより、
「GLY-X4α4α-ILE-3α-1α1β-5α4β-VAL-3β-3β-5α4β-GLU-3β-3β2α2βX-5α4α-GLN-3β-3α3α5αX-1β4α-CYS-5β-3β6α(2α)-1β4α-CYS-5α-1βX-5α4β-THR-3β-2βX-1β4β-SER-6β-2αX-4β4α-ILE-3β-3β1β-3α4β-CYS-1β-1α2β(2α)-4β4β-SER-6β-2αX-4β4β-LEU-3β-1β1α-5α4β-TYR-3α-1α3βX-5α4α-GLN-3β-3β1α5βX-5α4β-LEU-3α-3β3β-5α4α-GLU-3β-3β1α3αX-1β4β-ASN-3β-3β1βX-1β4β-TYR-6α-3β3βX-1β4β-CYS-1β-3αX-3α4β-ASN-3β-3β3αX-4β」
として表すことが出来、一義的に立体配座構造を文字列として表記することができる。ここで、X線結晶構造データ向けの符号化立体配座表記であっても、特許文献4記載の方法に従って立体配座表記と関連づけて解析を行ったのちに必要となる物性値などの情報とともに符号化立体配座表記を表示してもかまわない。すなわち、符号化立体配座表記に対応する分子モデルについて、赤外円二色性スペクトルの解析のような実測の物性値との比較や密度汎関数法計算のような理論計算から求められた最適化構造の物性値の相同性の比較を行ってもかまわない。
【0046】
次に、複数の保存された符号化立体配座表記のデータをデータベースから取り出し、二面角位置コードの対応関係に従ってデータを揃え、二面角分類コードの相同性の比較が行うことのできる形式に並べ替えを行う(ステップS6)。並べ替えは、個々のフラグメント毎、個々の二面角位置コード毎、複数のフラグメントあるいは二面角位置コードの組み合わせ毎に行ってもかまわない。特許文献4記載の方法に従って、並べ替えが行われる符号化立体配座表記に伴って実測の物性値や理論計算からの予測値などの立体配座と関連を持つ解析対象化合物のデータが伴っていてもよい。
【0047】
3−3.「揺れ許容演算解析法」による立体配座相同性評価について
さらに、本実施形態の立体配座相同性評価装置では、並べ替えが行われた符号化立体配座表記の中の、対応関係にある二面角分類コードの相同性評価が行われる(ステップS7〜S9)。生理活性を有するリガンド分子の多くは溶液状態において複数の安定な立体配座構造を持ち、その平衡状態を受容体との相互作用にうまく利用している(非特許文献4、5)ので、これら分子の各立体配座表記は、その結晶構造における多形とも関連する構造の揺れを許容できる特徴を有しているはずである。そのため、本実施形態の立体配座相同性評価装置では、分子構造の揺れの問題に対処できるように、対応関係にある二面角分類コードにおいて、その二面角分類コード自体と隣接する二面角分類コードの組み合わせは相同性が高く、残りの二面角分類コードは相同性が低いと判定して演算処理を行い、相同性の評価を行う(ステップS7)。
【0048】
すなわち、対応関係にある二面角位置における一つの前記二面角分類コードに関して、構造相同性評価を行う前記二面角分類コードの集合を作成し、該集合の要素が360度を12分割して定められた二面角分類コードのうち連続して隣り合った3個の二面角分類コードに必ず含まれ、かつ少なくとも該集合の要素の1個は、前記連続して隣り合った3個の二面角分類コードのうち中央の二面角分類コードである条件を満たす場合には相同性が高く、それ以外は相同性が低いと判定して演算処理を行い、相同性の評価を行う(ステップS7)。ステップS7の工程は、対応関係にある二面角位置におけるそれぞれの位置において、選択された二面角分類コードと共にその両側の二面角分類コードを抽出して、要素として連続して隣り合った3個の二面角分類コードを要素とする集合を作成し、各解析対象化合物中の前記位置における集合の要素を対比させ、それぞれの化合物に帰属する集合の要素のうちで少なくとも1個の要素は全ての化合物において共通しており、かつ当該共通した要素が少なくとも1つの化合物に帰属する集合における中央の要素であるという条件を満たすか否かを検索し、
満たす場合には相同性が高く、それ以外は相同性が低いと判定する演算処理を行い、相同性の評価を行うことで実現することができる。
【0049】
より具体的には、図4に示す12分割された部位に対応する符号を用いて二面角分類を表記する場合には、連続して隣り合った3個の二面角分類コードの集合をXとすると、
X={4α,2β,2α},{2β,2α,5β},{2α,5β,5α},{5β,5α,1β},{5α,1β,1α},{1β,1α,6β},{1α,6β,6α},{6β,6α,3β},{6α,3β,3α},{3β,3α,4β},{3α,4β,4α},{4β,4α,2β}
と表される。ここで、集合Xのある1個の組み合わせを簡略化して、
Y={p,q,r},Y⊂X
と表すことにする。対応関係にある二面角位置における一つの前記二面角分類コードに関して、相同性評価を行う前記二面角分類コードの集合を作成し、該集合の要素が360度を12分割して定められた二面角分類コードのうち連続して隣り合った3個の二面角分類コードに必ず含まれ、かつ少なくとも該集合の要素の1個は、前記連続して隣り合った3個の二面角分類コードのうち中央の二面角分類コードである条件を満たす場合には相同性が高く、それ以外は相同性が低いと判定するには、相同性評価を行う前記二面角分類コードの集合の要素をxとすると、すべてのxが、集合Xのある1個の組み合わせYとの関係において、
x∈Y
かつ、xのうちの少なくとも1個は
x=q
を満たすときには相同性が高く、それ以外の場合はすべて相同性が低いと判定するような演算処理を行えばよい。尚、対応する二面角が偶然4β,4αの境界線上に位置する場合には4α,2β,2αの境界線上に位置する場合には2α,5β,5αの境界線上に位置する場合には5α,1β,1αの境界線上に位置する場合には1β,6β,6αの境界線上に位置する場合には6β,3β,3αの境界線上に位置する場合には3βの分類に属するものと帰属すればよい。
【0050】
さらに、並べ替えが行われた符号化立体配座表記において、二面角位置を変えて、相同性評価を行う1カ所の前記二面角位置コードまたは複数カ所の前記二面角位置コードの組み合わせについて、二面角分類コードの集合を作成し、順次同様の二面角分類コードに関する演算処理を行い、構造相同性の評価を行う。複数カ所の前記二面角位置コードの組み合わせについて構造相同性の評価を行う場合には、個々の前記二面角位置コードにおいて、前記二面角分類コードに関する相同性の演算処理を行った後に、複数カ所の前記二面角位置コードの組み合わせの論理積(AND)の論理演算を行えばよい。このとき、同時に構造相同性の評価結果を用いて、相同性の高さの比率を演算処理してもかまわない。
【0051】
また、結晶多形において分子構造の細かな違いを検証する場合等、必要に応じて、360度を12分割して定められた二面角分類コードそのものだけが相同性が高く、それ以外の二面角分類コードは相同性が低いと判定して演算処理を行い、相同性の評価を行う(ステップS9)。このとき、同時に相同性の高さの比率を演算処理してもかまわない。
【0052】
さらに、構造変化を伴うリガンド分子とタンパク質分子の相互作用部位の構造相同性評価のような場合には必要に応じて、構造の揺れに対処しかつ側鎖の構造相同性比較も行うため、対応する二面角位置における一つの二面角分類コードに関して、1)その二面角分類コードと隣接する二面角分類コードの組み合わせは相同性が高い(○)、2)一つの二面角分類コードをはさんだ比較的近い二面角分類コードの組み合わせの相同性は中程度(△)、3)それ以外の二面角分類コードの組み合わせの相同性は低い(×)と判定して演算処理し構造相同性評価を行ってもよい。
【0053】
すなわち、対応関係にある二面角位置における一つの前記二面角分類コードに関して、構造相同性評価を行う前記二面角分類コードの集合を作成し、1)該集合の要素が360度を12分割して定められた二面角分類コードのうち連続して隣り合った3個の二面角分類コードに必ず含まれ、かつ少なくとも該集合の要素の1個は、前記連続して隣り合った3個の二面角分類コードのうち中央の二面角分類コードである条件を満たす場合には相同性が高い(○)、2)該集合の要素が360度を12分割して定められた二面角分類コードのうち連続して隣り合った3個の二面角分類コードに必ず含まれ、かつ該集合のすべての要素が、前記連続して隣り合った3個の二面角分類コードのうち中央の二面角分類コードではない条件を満たす場合には、相同性は中程度(△)、それ以外は相同性が低い(×)と判定して演算処理し構造相同性評価を行ってもよい。
【0054】
より具体的には、図4に示す12分割された部位に対応する符号を用いて二面角分類を表記する場合には、連続して隣り合った3個の二面角分類コードの集合をXとすると、
X={4α,2β,2α},{2β,2α,5β},{2α,5β,5α},{5β,5α,1β},{5α,1β,1α},{1β,1α,6β},{1α,6β,6α},{6β,6α,3β},{6α,3β,3α},{3β,3α,4β},{3α,4β,4α},{4β,4α,2β}
と表される。ここで、集合Xのある1個の組み合わせを簡略化して、
Y={p,q,r},Y⊂X
と表すことにする。対応関係にある二面角位置における一つの前記二面角分類コードに関して、構造相同性評価を行う前記二面角分類コードの集合を作成し、1)該集合の要素が360度を12分割して定められた二面角分類コードのうち連続して隣り合った3個の二面角分類コードに必ず含まれ、かつ少なくとも該集合の要素の1個は、前記連続して隣り合った3個の二面角分類コードのうち中央の二面角分類コードである条件を満たす場合には相同性が高い(○)、2)該集合の要素が360度を12分割して定められた二面角分類コードのうち連続して隣り合った3個の二面角分類コードに必ず含まれ、かつ該集合のすべての要素が、前記連続して隣り合った3個の二面角分類コードのうち中央の二面角分類コードではない条件を満たす場合には、相同性は中程度(△)、それ以外は相同性が低い(×)と判定するには、相同性評価を行う前記二面角分類コードの集合の要素をxとすると、すべてのxが、集合Xのある1個の組み合わせYとの関係において、
x∈Y
かつ、xのうちの少なくとも1個は
x=q
を満たすときには相同性が高い(○)、
すべてのxが、集合Xのある1個の組み合わせYとの関係において、
x∈Y
かつ、すべてのxが、
x≠q
を満たすときには相同性は中程度(△)、
それ以外の場合はすべて相同性が低い(×)と判定するような演算処理を行えばよい。尚、対応する二面角が偶然4β,4αの境界線上に位置する場合には4α,2β,2αの境界線上に位置する場合には2α,5β,5αの境界線上に位置する場合には5α,1β, 1αの境界線上に位置する場合には1β,6β,6αの境界線上に位置する場合には6β,3β,3αの境界線上に位置する場合には3βの分類に属するものと帰属すればよい。
【0055】
3−4.比較する解析対象化合物中で基準となる立体配座構造を選定できる場合の「揺れ許容演算解析法」の適用
あるタンパク質分子が構造変化を起こしているか否かを判定する場合など、アミノ酸配列としては変化がない場合には、立体配座構造のみの相同性比較を行えばよく、つまり、変化前のタンパク質分子など選択された特定のタンパク質分子の符号化立体配座表記を基準値として、別の1個あるいは複数のタンパク質分子の符号化立体配座表記との相同的な比較を行えばよい。その際には、例えば、変化前のタンパク質分子の立体配座構造などを常に基準として選択することで、当該立体配座構造の二面角分類コードは、全て必ず連続して隣り合った3個のうち中央の二面角分類コードとなる。それに対して構造相同性評価を行うタンパク質分子の、対応する二面角位置における二面角分類コードの集合のすべての要素が、基準となる該二面角分類コードの中央値あるいはそれと隣り合った二面角分類コードに一致すれば相同性が高く、それ以外は相同性が低いと判定して演算処理を行い、相同性の評価を行うことで、演算処理の負荷が少なくなる利点がある。
【0056】
すなわち、具体的には、基準となる、ある特定のタンパク質分子の符号化立体配座表記から選択された、対応する二面角位置における、構造相同性評価を行う二面角分類コードをvとし、連続して隣り合った二面角分類コードがZ={u,v,w}の集合の順に並んでいたとする。すべての連続して隣り合った3個の二面角分類コードの集合をXとして、図4に示す12分割された部位に対応する符号を用いて二面角分類を表記する場合には、
X={4α,2β,2α},{2β,2α,5β},{2α,5β,5α},{5β,5α,1β},{5α,1β,1α},{1β,1α,6β},{1α,6β,6α},{6β,6α,3β},{6α,3β,3α},{3β,3α,4β},{3α,4β,4α},{4β,4α,2β}
と表され、
Z⊂X
の関係にあり、Zは集合Xの中のいずれか1個の表記として表すことができる。対応する二面角位置における一つの二面角分類コードに関して、該特定タンパク質分子の二面角分類コードを常に基準として選択し、対応する二面角位置における、構造相同性評価を行う二面角分類コードの集合のすべての要素が、基準となる該二面角分類コードあるいは該二面角分類コードに隣り合った二面角分類コードに一致すれば相同性が高く、それ以外は相同性が低いと判定するには、該特定タンパク質分子の選択された二面角分類コードを含む、対応する二面角位置における、相同性評価を行う前記二面角分類コードの集合を作成し、その要素をyとすると、すべてのyについて、
y=u
あるいは
y=v
あるいは
y=w
の条件を満たすときには相同性が高く、それ以外の場合はすべて相同性が低いと判定するような演算処理を行えばよい。尚、対応する二面角が偶然4β,4αの境界線上に位置する場合には4α,2β,2αの境界線上に位置する場合には2α,5β,5αの境界線上に位置する場合には5α,1β,1αの境界線上に位置する場合には1β,6β,6αの境界線上に位置する場合には6β,3β,3αの境界線上に位置する場合には3βの分類に属するものと帰属すればよい。
【0057】
3−5.二次構造に対応する符号化立体配座表記を伴ったアミノ酸配列パターンの抽出
タンパク質、ペプチドの周知の二次構造であるαへリックス、βシートなどにおいて、アミノ酸配列が全く異なっていても同一のパターンを形成することはよく知られていることである。
本発明の「揺れ許容演算解析法」を用いることで、アミノ酸配列が異なっていながら、揺れの許容範囲内でランダムコイルなどのαへリックス、βシート以外の構造も含めて同じ二次構造をとることの可能なコード化データ(アミノ酸配列+構造情報)や意味情報が抽出できる。有用なタンパク質もしくはペプチドにおいて、その活性ドメインの立体構造を変化させることなくアミノ酸配列を改変するために、アミノ酸の置き換えが可能な候補となるコード化データが取得できる。これらのコード化データを集めてデータベース化しておくことは、特に、各種酵素活性の改善、ヒト化抗体(CDR抗体)、キメラ抗体などの作製の際などに利用できる。
そのため、本実施形態の立体配座相同性評価装置では、比較対象となる解析対象化合物がタンパク質あるいはペプチドの場合において、必要に応じて、分子構造の揺れを考慮して構造相同性が高いアミノ酸配列パターンを抽出し、その中でアミノ酸配列が一致しないものを取り出し、αへリックス、βシート、ランダムコイルなどのその他の二次構造に対応する符号化立体配座表記を伴ったアミノ酸配列パターンを抽出する(ステップS10〜S11)。このとき、特許文献4記載の方法に従って、その符号化立体配座表記に伴って、抽出されたアミノ酸配列パターンに関連する実測の物性値や理論計算からの予測値などのデータあるいは相同性解析結果が伴っていてもよい。
【0058】
3−6.立体配座相同性評価の最終工程(S12及び13)
最後に、ステップS1〜S11までの工程を必要回数行った後に(ステップS12)、相同性評価結果等の必要データの表示及び/あるいは出力を行う(ステップS13)。
【0059】
なお、ステップS7〜S9までの工程は前後してもかまわない。また、例えば、特許文献4記載の方法に従い、タンパク質に取り込まれた生理活性リガンド分子の立体配座構造のような、タンパク質とリガンド分子が相互作用している立体配座構造について、前記工程に従った立体配座相同性評価を行ってもかまわない。
【0060】
3−7.改良型「揺れ許容演算解析法」による構造パターン解析について
3−6までの立体配座相同性評価では、構造相同性評価は行えてもαへリックス、βシート、ランダムコイルなどの二次構造そのもののフラグメント構造情報は、分子構造の揺れのためコード自体からそのまま抽出することはできない。
タンパク質フラグメントにおけるαへリックス、βシート、ランダムコイルなどの二次構造及びRNAフラグメントにおけるステム構造やループ構造などの情報を抽出するには以下のようにすればよい。
【0061】
まず、解析対象となるαへリックス、βシート、ランダムコイルなどの二次構造又はステム構造、ループ構造などを有することが知られている分子モデルについて、当該特徴的な構造領域に対応するフラグメントのみを、3−1の工程に従って分子モデルを入力し、引き続き3−2の工程に従って、符号化立体配座表記へのコード変換及びコードの並べ替えを行う。
次に、前記フラグメントを構成するそれぞれの二面角位置コードにおいて最も出現頻度の高い二面角分類コードを抽出し、抽出した符号化立体配座表記をαへリックス、βシート、ランダムコイル、ステム構造、又はループ構造等の構造パターンのテンプレートとして記憶部に記憶させる。
【0062】
別途、解析対象化合物の立体配座構造の分子モデルについて、3−1の工程に従って分子モデルを入力し、引き続き3−2の工程に従って、符号化立体配座表記へのコード変換及びコードの並べ替えを行う。
【0063】
前記3−5.で述べたアミノ酸配列パターンの抽出法の場合は、基本的には前記3−4.の「揺れ許容演算解析法」を適用しているため、より厳格に定義された、αへリックス、βシート、ランダムコイル、ステム構造、ループ構造等の構造パターンに一致するアミノ酸配列や核酸塩基配列情報を抽出することに主眼がおかれており、そのような場合に適した手法となっている。
それに対して、この項では、きわめて数多くのアミノ酸フラグメントやヌクレオチドフラグメントのようなフラグメントからなる解析対象化合物が、その領域の1部に、より広義の意味でのαへリックス、βシート、ランダムコイル、ステム構造、ループ構造等に共通する既知の特徴的な構造パターンを有しているかどうかを評価、解析することを主な目的としているため、前記3−4.の「揺れ許容演算解析法」を1部改良した以下の演算処理を行う。
【0064】
すなわち、前記記憶部からそれぞれの構造パターンに一致する前記符号化立体配座表記及び解析対象化合物の符号化立体配座表記を取り出し、それぞれの構造パターンに一致する前記符号化立体配座表記を比較対象の参照とし、
対応関係にある二面角位置におけるそれぞれの位置において、選択された二面角分類コードと共にその両側の二面角分類コードを抽出して、要素として連続して隣り合った3個の二面角分類コードを要素とする集合を作成し、
各解析対象化合物及び参照となる構造パターン中の前記位置における集合の要素を対比させ、
それぞれのフラグメントに帰属する集合の要素のうちで少なくとも1個の要素は全てのフラグメントにおいて共通しているという条件を満たすか否かを検索し、
満たす場合には、それぞれの構造パターンに一致するフラグメントとして、満たさない場合には、それ以外の構造パターンをもつフラグメントとして判定する演算処理を行う。
【0065】
具体的な解析方法としては、以下の手順に従う。
処理部が、1つ又は複数の基準となる構造パターンに対応するフラグメントの立体配座構造の分子モデルの入力を受け付け、
前記処理部が、入力を受け付けた分子モデルに対して、注目する化学結合部位に対応する二面角位置コードを表記すると共に、各二面角位置コードのそれぞれに、360度を12分割して定められた二面角分類コードを組み合わせて表記する符号化立体配座表記を施すことで、各分子モデルに関する立体配座を一義的に決定し、
次いで、構造相同性評価のための演算に必要な注目する化学結合部位の表記以外の不要な表記を省略した符号化立体配座表記を抽出し、
抽出した符号化立体配座表記をそれぞれ基準構造パターンとしてあらかじめ記憶部に記憶させ、
別途、解析対象化合物の立体配座構造の分子モデルの入力を受け付け、
前記処理部において、入力を受け付けた解析対象化合物の分子モデルに対して、
注目する化学結合部位に対応する二面角位置コードを表記すると共に、各二面角位置コードのそれぞれに、360度を12分割して定められた二面角分類コードを組み合わせて表記する符号化立体配座表記を施すことで、各分子モデルに関する立体配座を一義的に決定し、
次いで、構造パターン解析のための演算に必要な注目する化学結合部位の表記以外の不要な表記を省略した符号化立体配座表記を抽出し、
抽出した各符号化立体配座表記を記憶部に記憶させ、
前記処理部において、前記記憶部から前記解析対象化合物の符号化立体配座表記を取り出すと共に、あらかじめ記憶部に記憶させていた前記基準構造パターンのうちで、比較しようとする基準構造パターンを選択し、当該構造パターンに一致する前記符号化立体配座表記を比較対象の参照として取り出し、
対応関係にある二面角位置における最初の位置において、選択された二面角分類コードと共にその両側の二面角分類コードを抽出して、要素として連続して隣り合った3個の二面角分類コードを要素とする集合を作成し、
前記解析対象化合物及び参照となる構造パターン中の前記位置における集合の要素を対比させ、
各二面角分類コードが帰属する集合の要素のうちで少なくとも1個の要素が基準の構造パターンと共通しているという条件を満たすか否かを検索し、
満たす場合には、基準の構造パターンに一致するとして判定し、満たさない場合には、それ以外の構造パターンに該当すると判定する演算処理を行い、
続いて次の位置における同様の演算処理を行う操作を行い、全ての対応する位置についての操作を繰り返す。
【0066】
より具体的には、図4に示す12分割された部位に対応する符号を用いて二面角分類を表記する場合には、連続して隣り合った3個の二面角分類コードの集合をXとすると、
X={4α,2β,2α},{2β,2α,5β},{2α,5β,5α},{5β,5α,1β},{5α,1β,1α},{1β,1α,6β},{1α,6β,6α},{6β,6α,3β},{6α,3β,3α},{3β,3α,4β},{3α,4β,4α},{4β,4α,2β}
と表される。ここで、集合Xのある1個の組み合わせを簡略化して、
Y={p,q,r},Y⊂X
と表すことにする。対応関係にある二面角位置におけるそれぞれの位置において、選択された二面角分類コードと共にその両側の二面角分類コードを抽出して、要素として連続して隣り合った3個の二面角分類コードを要素とする集合を作成し、
各解析対象化合物及び参照となる構造パターン中の前記位置における集合の要素を対比させ、
それぞれのフラグメントに帰属する集合の要素のうちで少なくとも1個の要素は全てのフラグメントにおいて共通しているという条件を満たすか否かを検索し、
満たす場合には、それぞれの構造パターンに一致するフラグメントとして、満たさない場合には、それ以外の構造パターンをもつフラグメントとして判定するには、
構造パターン解析を行うフラグメント中の対応関係にある二面角位置における最初の位置において二面角分類コードの集合を作成し、構造パターン解析を行う前記二面角分類コードの集合の要素をxとすると、すべてのxが、集合Xのある1個の組み合わせYとの関係において、
x∈Y
を満たすときには、最初の位置における基準の構造パターンに一致するフラグメントとして、満たさない場合には、基準以外の構造パターンをもつフラグメントとして判定するような演算処理を行えばよい。さらに、二面角位置を変えて、必要に応じて構造パターン解析を行う1カ所の前記二面角位置コードまたは複数カ所の前記二面角位置コードの組み合わせについて、二面角分類コードの集合を作成し、順次同様の二面角分類コードに関する演算処理を行い、構造パターン解析を行う。複数カ所の前記二面角位置コードの組み合わせについて構造パターン解析を行う場合には、個々の前記二面角位置コードにおいて、前記二面角分類コードに関する相同性の演算処理を行った後に、複数カ所の前記二面角位置コードの組み合わせの論理積(AND)の論理演算を行えばよい。最終的に、フラグメント中の対応関係にあるすべての二面角位置コードの組み合わせの論理積(AND)の論理演算において一致するという演算結果が得られた場合、すなわち、フラグメント中の対応関係にあるすべての二面角位置において基準の構造パターンに一致するという演算結果が得られた場合には、基準の構造パターンに完全に一致するフラグメントとして判定するような演算処理を行えばよい。このとき、同時に構造パターンの解析結果を用いて、相同性の高さの比率を演算処理してもかまわない。尚、対応する二面角が偶然4β,4αの境界線上に位置する場合には4α,2β,2αの境界線上に位置する場合には2α,5β,5αの境界線上に位置する場合には5α,1β,1αの境界線上に位置する場合には1β,6β,6αの境界線上に位置する場合には6β,3β,3αの境界線上に位置する場合には3βの分類に属するものと帰属すればよい。
【0067】
3−7.に示した改良型「揺れ許容演算解析法」は、上述のように、主には既知の構造パターンとの比較解析に用いるが、新規な構造パターンの抽出、解析にも適用可能であるし、さらには複数の解析対象化合物における立体配座構造の相同性評価に用いることもできる。また、同じ解析対象に対して、3−7.に示した改良型「揺れ許容演算解析法」を、従来法(特許文献4)による相同性解析法、3−3.に示した「揺れ許容演算解析法」、3−4.に示した「揺れ許容演算解析法」の少なくとも1つと共に並行して適用し、得られた演算結果に関してそれぞれ、論理積、論理和、否定論理積、否定論理和、排他的論理和等の演算処理を行ってもよい。
【0068】
最後に、以上のような操作を必要回数行った後に、構造パターン解析結果等の必要データの表示及び/あるいは出力を行う。なお、3−7.に示した改良型「揺れ許容演算解析法」、従来法(特許文献4)による相同性解析法、3−3.に示した「揺れ許容演算解析法」、3−4.に示した「揺れ許容演算解析法」を用いた評価、解析を行うには、独立行政法人産業技術総合研究所が所有する「揺れ許容演算解析法テンプレート」(H22PRO-1102)を用いることができる。
【実施例】
【0069】
次に本発明を実施例によりさらに詳細に説明するが、本発明は以下の例に限定されるものではない。
【0070】
(実施例1)インシュリンA鎖及びB鎖のX線結晶構造データへの揺れ許容演算解析法の適用
PDBjに登録されているインシュリンのX線結晶構造データ2vk0_ABと2c8rについて、前記特許文献4記載の方法を用いて、入力を受け付けた分子モデルに基づき、各々の化学結合部位に対応する二面角位置コードと、360度を12分割して定められた二面角分類コードの組み合わせからなる前記符号化立体配座表記にコード化変換を行った。
インシュリンは21アミノ酸残基のA鎖と、30アミノ酸残基のB鎖が2つのジスルフィド結合を介してつながったものであるため、A鎖及びB鎖をそれぞれ別々に分けてコード化変換を行った。このとき、バリン(Val)側鎖やロイシン(Leu)側鎖の末端の二面角位置において、二面角分類コードを決定するための優先置換基が(2)一つだけが他と違うときは順位に関係なくそのものを選択するというケースにあたるため水素が選択されるが、水素原子の位置が決められていないことからコード化を行うことができなかった。そこで、X線結晶構造データを比較する際に定められた、(B)本来存在するべき水素原子を紙面手前に置き、二面角位置コードのボンドを紙面向こう側に紙面に対して垂直に置き、水素原子と二面角位置コードのボンドのなす面と置換基あるいは原子と二面角位置コードのボンドのなす面による二面角が水素原子からみて時計回りに一番小さくなる置換基あるいは原子を選択するという優先則に従いコード化変換を行った。また、アルギニン(Arg)側鎖、アスパラギン酸(Asn)側鎖及びグルタミン酸(Glu)側鎖の末端の二面角位置において、水素原子の位置が決められていないことから水素原子が結合している方の置換基を判定できず、二面角分類コードを決定するための優先置換基を選択することができなかった。そこで、X線結晶構造データを比較する際に定められた、(C)その他の水素原子を除いた場合に優先する置換基あるいは原子が決定できない場合には、二面角が一番小さくなる置換基あるいは原子を選択するという優先則に従いコード化変換を行った。得られたX線結晶構造データを比較するための前記符号化立体配座表記を、文字列テキストデータとしてデータベースに保存した。その際の2c8rのA鎖の文字列は以下の通りとなる。
「GLY-X4α4α-ILE-3α-1α1β-5α4β-VAL-3β-3β-5α4β-GLU-3β-3β2α2βX-5α4α-GLN-3β-3α3α5αX-1β4α-CYS-5β-3β6α(2α)-1β4α-CYS-5α-1βX-5α4β-THR-3β-2βX-1β4β-SER-6β-2αX-4β4α-ILE-3β-3β1β-3α4β-CYS-1β-1α2β(2α)-4β4β-SER-6β-2αX-4β4β-LEU-3β-1β1α-5α4β-TYR-3α-1α3βX-5α4α-GLN-3β-3β1α5βX-5α4β-LEU-3α-3β3β-5α4α-GLU-3β-3β1α3αX-1β4β-ASN-3β-3β1βX-1β4β-TYR-6α-3β3βX-1β4β-CYS-1β-3αX-3α4β-ASN-3β-3β3αX-4β」
【0071】
次に、表計算ソフトウェアによりデータ読み込みを行い、アミノ酸配列毎に、側鎖をはさんでN末端側の主鎖、C末端側の主鎖及び側鎖を分けて構造相同性比較が行えるように処理を行った。アミノ酸配列が完全に一致しているにもかかわらず、2vk0_ABと2c8rとでは360度を12分割して定められた二面角分類コードによるN末端側の主鎖の構造相同性比較では、60.0%(A鎖)、80.0%(B鎖)程度の相同性しかなく、C末端側の主鎖の構造相同性比較でも19.0%(A鎖)、52.0%(B鎖)程度の相同性しかなく、X線結晶構造データにおいてペプチド構造に揺れが存在していた。
そこで、構造の揺れに対処するため、対応する二面角位置における一つの二面角分類コードに関して、その二面角分類コードと隣接する二面角分類コードの組み合わせは相同性が高く、残りの二面角分類コードは相同性が低いと判定して演算処理し構造相同性比較を行ったところ、N末端側の主鎖の構造相同性比較では、95.0%(A鎖)、100.0%(B鎖)の相同性、C末端側の主鎖の構造相同性比較でも95.2%(A鎖)、96.0%(B鎖)の相同性、主鎖全体としても90.5%(A鎖)、96.2%(B鎖)の相同性となっており、構造の揺れを考慮した相同性比較が行えることがわかった。インシュリン(2vk0_AB,2c8r)A鎖の符号化立体配座表記及び相同性の解析結果を表1に、インシュリン(2vk0_AB,2c8r)B鎖の符号化立体配座表記及び相同性の解析結果を表2に示す。(表中、最初の「相同性/aa配列」は、「アミノ酸配列相同性(同一性)」を指し、「相同性/12分割」は、従来法(特許文献4)により解析した相同性、「相同性/揺許容」及び「主鎖の相同性」は、本発明の「揺れ許容演算解析法」により計算した相同性を表す。また、表中の二面角分類コードにおいて、演算処理の負荷を減らすためにαという符号の代わりにaという符号を、βという符号の代わりにbという符号を用いている。)
あわせて、四角で囲ったαへリックス及びβシートに対応するアミノ酸配列に関して、構造の揺れを考慮した演算処理を行えばそれぞれの二次構造を符号化立体配座表記により、αへリックスであればN末端側の主鎖(二面角位置コードA)においては、{6α,3β,3α}という符号(CYSのみ優先則から選択されるボンドが異なるため例外となり、{5β,5α,1β}という符号で表される)で、C末端側の主鎖(二面角位置コードBC)においては、{5β4β,5β4α,5α4β,5α4α,1β4β,1β4α}という符号のいずれかの表記を中心に、βシートであればN末端側の主鎖(二面角位置コードA)においては、{1α,6β,6α,3β}という符号(CYSのみ優先則から選択されるボンドが異なるため例外となり、{2α,5β,5α}という符号で表される)で、C末端側の主鎖(二面角位置コードBC)においては、{3β4β,3β4α,3α4β,3α4α,4β4β,4β4α}という符号のいずれかの表記を中心に構成されており、タンパク質の二次構造がパターン認識できることがわかった。さらに、B鎖との結合位置にあるA鎖の11番目のCYSのみで若干の構造の違いが存在することが抽出された。
このことは、インシュリンにおいては、同じ機能を発現できる立体配座に起因する結晶多形が存在することを明確に示している。
【0072】
[表1]インシュリン(2vk0_AB,2c8r)A鎖の符号化立体配座表記と解析結果

【0073】
[表2]インシュリン(2vk0_AB,2c8r)B鎖の符号化立体配座表記と解析結果

【0074】
(実施例2)アミノ酸配列の相同性が高い免疫グロブリン軽鎖における二次構造の相違の存在
PDBjに登録されているアミノ酸配列の相同性が高い免疫グロブリン軽鎖(MUS MUSCULUS、HOUSE MOUSE)のX線結晶構造データ2immと2mcpについて、前記特許文献4記載の方法を用いて、入力を受け付けた分子モデルに基づき、各々の化学結合部位に対応する二面角位置コードと、360度を12分割して定められた二面角分類コードの組み合わせからなる前記符号化立体配座表記にコード化変換を行った。X線結晶構造データ2immの分子モデルを図7に示す。このとき、バリン(Val)側鎖やロイシン(Leu)側鎖の末端の二面角位置において、二面角分類コードを決定するための優先置換基が(2)一つだけが他と違うときは順位に関係なくそのものを選択するというケースにあたるため水素が選択されるが、水素原子の位置が決められていないことからコード化を行うことができなかった。そこで、X線結晶構造データを比較する際に定められた、(B)本来存在するべき水素原子を紙面手前に置き、二面角位置コードのボンドを紙面向こう側に紙面に対して垂直に置き、水素原子と二面角位置コードのボンドのなす面と置換基あるいは原子と二面角位置コードのボンドのなす面による二面角が水素原子からみて時計回りに一番小さくなる置換基あるいは原子を選択するという優先則に従いコード化変換を行った。また、アルギニン(Arg)側鎖、アスパラギン酸(Asn)側鎖及びグルタミン酸(Glu)側鎖の末端の二面角位置において、水素原子の位置が決められていないことから水素原子が結合している方の置換基を判定できず、二面角分類コードを決定するための優先置換基を選択することができなかった。そこで、X線結晶構造データを比較する際に定められた、(C)その他の水素原子を除いた場合に優先する置換基あるいは原子が決定できない場合には、二面角が一番小さくなる置換基あるいは原子を選択するという優先則に従いコード化変換を行った。得られたX線結晶構造データを比較するための前記符号化立体配座表記を、文字列テキストデータとしてデータベースに保存した。
次に、表計算ソフトウェアによりデータ読み込みを行い、アミノ酸配列毎に、側鎖をはさんでN末端側の主鎖、C末端側の主鎖及び側鎖を分けて構造相同性比較が行えるように処理を行った。アミノ酸配列の相同性が99.1%にもかかわらず、2immと2mcpとでは360度を12分割して定められた二面角分類コードによるN末端側の主鎖の構造相同性比較では、54.9%程度の相同性しかなく、C末端側の主鎖の構造相同性比較でも27.4%程度の相同性しかなく、X線結晶構造データにおいてタンパク質構造に揺れが存在していた。
そこで、構造の揺れに対処するため、対応する二面角位置における一つの二面角分類コードに関して、その二面角分類コードと隣接する二面角分類コードの組み合わせは相同性が高く、残りの二面角分類コードは相同性が低いと判定して演算処理し構造相同性比較を行ったところ、N末端側の主鎖の構造相同性比較では、92.0%の相同性、C末端側の主鎖の構造相同性比較でも95.6%の相同性、主鎖全体としても89.5%の相同性となっており、構造の揺れを考慮した相同性比較が行えることがわかった。免疫グロブリン軽鎖(2imm,2mcp)の符号化立体配座表記及び相同性の解析結果を表3に示す。(表中、最初の「相同性/aa配列」は、「アミノ酸配列相同性(同一性)」を指し、「相同性/12分割」は、従来法(特許文献4)により解析した相同性、「相同性/揺許容」及び「主鎖の相同性」は、本発明の「揺れ許容演算解析法」により計算した相同性を表す。また、表中の二面角分類コードにおいて、演算処理の負荷を減らすためにαという符号の代わりにaという符号を、βという符号の代わりにbという符号を用いている。)
あわせて、四角で囲ったαへリックス及びβシートに対応するアミノ酸配列に関して、構造の揺れを考慮した演算処理を行えばそれぞれの二次構造を符号化立体配座表記により、αへリックスであればN末端側の主鎖(二面角位置コードA)においては、{6α,3β,3α}という符号(CYSのみ優先則から選択されるボンドが異なるため例外となり、{5β,5α,1β}という符号で表される)で、C末端側の主鎖(二面角位置コードBC)においては、{5β4β,5β4α,5α4β,5α4α,1β4β,1β4α}という符号のいずれかの表記を中心に、βシートであればN末端側の主鎖(二面角位置コードA)においては、{1α,6β,6α,3β}という符号(CYSのみ優先則から選択されるボンドが異なるため例外となり、{2α,5β,5α}という符号で表される)で、C末端側の主鎖(二面角位置コードBC)においては、{3β4β,3β4α,3α4β,3α4α,4β4β,4β4α}という符号のいずれかの表記を中心に構成されており、タンパク質の二次構造がパターン認識できることがわかった。さらに、詳細な解析から14-15、50-51番目のアミノ酸に非常に大きな二次構造の違いをとることの可能な部位が存在することが見出された。超可変領域(表3のアミノ酸配列番号において四角で囲った部分)との比較では、非常に大きな二次構造の違いをとるアミノ酸配列部位の一つがCDR2の領域に一致していたが、超可変領域以外でも非常に大きな二次構造の違いをとることの可能な部位(アミノ酸配列14-15番目)が存在することがわかった。アミノ酸配列14-15番目における2immと2mcpの構造の違いを図8に示す。
【0075】
[表3]免疫グロブリン軽鎖(2imm,2mcp)の符号化立体配座表記と解析結果



【0076】
(実施例3)各種免疫グロブリン軽鎖における構造上の揺れを許容した二次構造パターンの抽出とCDR以外にも観測されるきわめて変化の大きい領域の抽出
PDBjに登録されている免疫グロブリン軽鎖(MUS MUSCULUS、HOUSE MOUSE)のX線結晶構造データ2imm、2mcp、1a7o及び3iy2について、前記特許文献4記載の方法を用いて、入力を受け付けた分子モデルに基づき、各々の化学結合部位に対応する二面角位置コードと、360度を12分割して定められた二面角分類コードの組み合わせからなる前記符号化立体配座表記にコード化変換を行った。X線結晶構造データ1a7oの分子モデルを図9に示す。このとき、バリン(Val)側鎖やロイシン(Leu)側鎖の末端の二面角位置において、二面角分類コードを決定するための優先置換基が(2)一つだけが他と違うときは順位に関係なくそのものを選択するというケースにあたるため水素が選択されるが、水素原子の位置が決められていないことからコード化を行うことができなかった。
そこで、X線結晶構造データを比較する際に定められた、(B)本来存在するべき水素原子を紙面手前に置き、二面角位置コードのボンドを紙面向こう側に紙面に対して垂直に置き、水素原子と二面角位置コードのボンドのなす面と置換基あるいは原子と二面角位置コードのボンドのなす面による二面角が水素原子からみて時計回りに一番小さくなる置換基あるいは原子を選択するという優先則に従いコード化変換を行った。また、アルギニン(Arg)側鎖、アスパラギン酸(Asn)側鎖及びグルタミン酸(Glu)側鎖の末端の二面角位置において、水素原子の位置が決められていないことから水素原子が結合している方の置換基を判定できず、二面角分類コードを決定するための優先置換基を選択することができなかった。そこで、X線結晶構造データを比較する際に定められた、(C)その他の水素原子を除いた場合に優先する置換基あるいは原子が決定できない場合には、二面角が一番小さくなる置換基あるいは原子を選択するという優先則に従いコード化変換を行った。得られたX線結晶構造データを比較するための前記符号化立体配座表記を、文字列テキストデータとしてデータベースに保存した。
次に、表計算ソフトウェアによりデータ読み込みを行い、アミノ酸配列毎に、側鎖をはさんでN末端側の主鎖、C末端側の主鎖及び側鎖を分けて構造相同性比較が行えるように処理を行った。構造の揺れに対処するため、対応する二面角位置における一つの二面角分類コードに関して、その二面角分類コードと隣接する二面角分類コードの組み合わせは相同性が高く、残りの二面角分類コードは相同性が低いと判定して演算処理し構造相同性比較を行ったところ、アミノ酸配列の相同性が50.5%と非常に低いにもかかわらず、N末端側の主鎖の構造相同性比較では、94.2%の相同性、C末端側の主鎖の構造相同性比較でも92.2%の相同性、主鎖全体としても89.2%の相同性となっており、実施例2のアミノ酸配列の相同性が非常に高い場合とほとんど変わらない程度の二次構造の相同性をとることが確認された。免疫グロブリン軽鎖(2imm,2mcp,1a7o,3iy2)の符号化立体配座表記及び相同性の解析結果を表4に示す。(表中、最初の「相同性/aa配列」は、「アミノ酸配列相同性(同一性)」を指し、「相同性/揺許容」及び「主鎖の相同性」は、本発明の「揺れ許容演算解析法」により計算した相同性を表す。また、表中の二面角分類コードにおいて、演算処理の負荷を減らすためにαという符号の代わりにaという符号を、βという符号の代わりにbという符号を用いている。)四角で囲った部分はαへリックス及びβシートに対応するアミノ酸配列を示している。
このことから、αへリックス及びβシート以外のランダムコイルなどの二次構造についても符号化立体配座表記により構造のパターン認識ができるとともに、2imm及び2mcpのアミノ酸配列中の52番目から75番目「SER THR ARG GLU SER GLY VAL PRO ASP ARG
PHE THR GLY SER GLY SER GLY THR ASP PHE THR LEU THR ILE(配列番号2)」に対応する1a7oの「THR THR LEU ALA ASP GLY VAL PRO SER ARG PHE SER GLY SER GLY SER GLY THR GLN TYR SER LEU LYS ILE(配列番号3)」及び3iy2の「LYS THR LEU THR GLU GLY VAL PRO SER ARG PHE SER GLY SER GLY SER GLY THR GLN PHE SER LEU LYS ILE(配列番号4)」のように、アミノ酸配列の相同性は低くても構造の揺れを考慮した構造相同性の高いタンパク質構造をとることのできるアミノ酸配列パターンを、αへリックス及びβシート以外のランダムコイルなどの二次構造パターンを含んだ形で抽出できることがわかった。
さらに、詳細な解析から14-15、30-31、50-51、76-77、92-94番目のアミノ酸に非常に大きな二次構造の違いをとることの可能な部位が存在することが見出された。超可変領域(表4のアミノ酸配列番号において四角で囲った部分)との比較では、非常に大きな二次構造の違いをとるアミノ酸配列の3個の部位(30-31、50-51、92-94番目)が、それぞれ、CDR1、CDR2及びCDR3の領域に対応していた。それ以外にも、超可変領域ではないフレームワーク領域においても非常に大きな二次構造の違いをとることの可能な部位(14-15、76-77番目)が存在することがわかった。アミノ酸配列76-77番目における1a7oと3iy2の構造の違いを図10に示す。
【0077】
[表4]免疫グロブリン軽鎖(2imm,2mcp,1a7o,3iy2)の符号化立体配座表記と解析結果


【0078】
(実施例4)アミノ酸配列の相同性が高いシャペロニンGroELにおける構造上の揺れを許容した相同性比較
PDBjに登録されているアミノ酸配列の相同性が高いシャペロニンGroELのX線結晶構造データ1kidと1jonについて、前記特許文献4記載の方法を用いて、入力を受け付けた分子モデルに基づき、各々の化学結合部位に対応する二面角位置コードと、360度を12分割して定められた二面角分類コードの組み合わせからなる前記符号化立体配座表記にコード化変換を行った。X線結晶構造データ1kidの分子モデルを図11に示す。このとき、バリン(Val)側鎖やロイシン(Leu)側鎖の末端の二面角位置において、二面角分類コードを決定するための優先置換基が(2)一つだけが他と違うときは順位に関係なくそのものを選択するというケースにあたるため水素が選択されるが、水素原子の位置が決められていないことからコード化を行うことができなかった。そこで、X線結晶構造データを比較する際に定められた、(B)本来存在するべき水素原子を紙面手前に置き、二面角位置コードのボンドを紙面向こう側に紙面に対して垂直に置き、水素原子と二面角位置コードのボンドのなす面と置換基あるいは原子と二面角位置コードのボンドのなす面による二面角が水素原子からみて時計回りに一番小さくなる置換基あるいは原子を選択するという優先則に従いコード化変換を行った。また、アルギニン(Arg)側鎖、アスパラギン酸(Asn)側鎖及びグルタミン酸(Glu)側鎖の末端の二面角位置において、水素原子の位置が決められていないことから水素原子が結合している方の置換基を判定できず、二面角分類コードを決定するための優先置換基を選択することができなかった。そこで、X線結晶構造データを比較する際に定められた、(C)その他の水素原子を除いた場合に優先する置換基あるいは原子が決定できない場合には、二面角が一番小さくなる置換基あるいは原子を選択するという優先則に従いコード化変換を行った。得られたX線結晶構造データを比較するための前記符号化立体配座表記を、文字列テキストデータとしてデータベースに保存した。
次に、表計算ソフトウェアによりデータ読み込みを行い、アミノ酸配列毎に、側鎖をはさんでN末端側の主鎖、C末端側の主鎖及び側鎖を分けて構造相同性比較が行えるように処理を行った。アミノ酸配列の相同性が100.0%にもかかわらず、1kidと1jonとでは360度を12分割して定められた二面角分類コードによるN末端側の主鎖の構造相同性比較では、76.3%程度の相同性しかなく、C末端側の主鎖の構造相同性比較でも48.2%程度の相同性しかなく、X線結晶構造データにおいてタンパク質構造に揺れが存在していた。
そこで、構造の揺れに対処するため、対応する二面角位置における一つの二面角分類コードに関して、その二面角分類コードと隣接する二面角分類コードの組み合わせは相同性が高く、残りの二面角分類コードは相同性が低いと判定して演算処理し構造相同性比較を行ったところ、N末端側の主鎖の構造相同性比較では、99.3%の相同性、C末端側の主鎖の構造相同性比較でも99.3%の相同性、主鎖全体としても97.9%の相同性となっており、構造の揺れを考慮した相同性比較が行えることがわかった。シャペロニンGroEL(1kid,1jon)の符号化立体配座表記及び相同性の解析結果を表5に示す。(表中、最初の「相同性/aa配列」は、「アミノ酸配列相同性(同一性)」を指し、「相同性/12分割」は、従来法(特許文献4)により解析した相同性、「相同性/揺許容」及び「主鎖の相同性」は、本発明の「揺れ許容演算解析法」により計算した相同性を表す。また、表中の二面角分類コードにおいて、演算処理の負荷を減らすためにαという符号の代わりにaという符号を、βという符号の代わりにbという符号を用いている。)
あわせて、四角で囲ったαへリックス及びβシートに対応するアミノ酸配列に関して、構造の揺れを考慮した演算処理を行えばそれぞれの二次構造を符号化立体配座表記により、αへリックスであればN末端側の主鎖(二面角位置コードA)においては、{6α,3β,3α}という符号(CYSのみ優先則から選択されるボンドが異なるため例外となり、{5β,5α,1β}という符号で表される)で、C末端側の主鎖(二面角位置コードBC)においては、{5β4β,5β4α,5α4β,5α4α,1β4β,1β4α}という符号のいずれかの表記を中心に、βシートであればN末端側の主鎖(二面角位置コードA)においては、{1α,6β,6α,3β}という符号(CYSのみ優先則から選択されるボンドが異なるため例外となり、{2α,5β,5α}という符号で表される)で、C末端側の主鎖(二面角位置コードBC)においては、{3β4β,3β4α,3α4β,3α4α,4β4β,4β4α}という符号のいずれかの表記を中心に構成されており、タンパク質の二次構造がパターン認識できることがわかった。
【0079】
[表5]シャペロニンGroEL(1kid,1jon)の符号化立体配座表記と解析結果



【0080】
(実施例5)アミノ酸配列の相同性が低いシャペロニンGroELにおいて、構造上の揺れを許容した二次構造パターンが保存され構造相同性が高いことの確認
PDBjに登録されているシャペロニンGroELのX線結晶構造データ1srvと1kidについて、前記特許文献4記載の方法を用いて、入力を受け付けた分子モデルに基づき、各々の化学結合部位に対応する二面角位置コードと、360度を12分割して定められた二面角分類コードの組み合わせからなる前記符号化立体配座表記にコード化変換を行った。X線結晶構造データ1srvの分子モデルを図12に示す。このとき、バリン(Val)側鎖やロイシン(Leu)側鎖の末端の二面角位置において、二面角分類コードを決定するための優先置換基が(2)一つだけが他と違うときは順位に関係なくそのものを選択するというケースにあたるため水素が選択されるが、水素原子の位置が決められていないことからコード化を行うことができなかった。そこで、X線結晶構造データを比較する際に定められた、(B)本来存在するべき水素原子を紙面手前に置き、二面角位置コードのボンドを紙面向こう側に紙面に対して垂直に置き、水素原子と二面角位置コードのボンドのなす面と置換基あるいは原子と二面角位置コードのボンドのなす面による二面角が水素原子からみて時計回りに一番小さくなる置換基あるいは原子を選択するという優先則に従いコード化変換を行った。また、アルギニン(Arg)側鎖、アスパラギン酸(Asn)側鎖及びグルタミン酸(Glu)側鎖の末端の二面角位置において、水素原子の位置が決められていないことから水素原子が結合している方の置換基を判定できず、二面角分類コードを決定するための優先置換基を選択することができなかった。そこで、X線結晶構造データを比較する際に定められた、(C)その他の水素原子を除いた場合に優先する置換基あるいは原子が決定できない場合には、二面角が一番小さくなる置換基あるいは原子を選択するという優先則に従いコード化変換を行った。得られたX線結晶構造データを比較するための前記符号化立体配座表記を、文字列テキストデータとしてデータベースに保存した。
次に、表計算ソフトウェアによりデータ読み込みを行い、アミノ酸配列毎に、側鎖をはさんでN末端側の主鎖、C末端側の主鎖及び側鎖を分けて構造相同性比較が行えるように処理を行った。構造の揺れに対処するため、対応する二面角位置における一つの二面角分類コードに関して、その二面角分類コードと隣接する二面角分類コードの組み合わせは相同性が高く、残りの二面角分類コードは相同性が低いと判定して演算処理し構造相同性比較を行ったところ、アミノ酸配列の相同性が69.0%と低いにもかかわらず、N末端側の主鎖の構造相同性比較では、99.3%の相同性、C末端側の主鎖の構造相同性比較でも99.3%の相同性、主鎖全体としても97.9%の相同性となっており、実施例4のアミノ酸配列の相同性が一致する場合とほぼ同一の二次構造の相同性をとることが確認された。シャペロニンGroEL(1srv,1kid)の符号化立体配座表記及び相同性の解析結果を表6に示す。(表中、最初の「相同性/aa配列」は、「アミノ酸配列相同性(同一性)」を指し、「相同性/揺許容」及び「主鎖の相同性」は、本発明の「揺れ許容演算解析法」により計算した相同性を表す。また、表中の二面角分類コードにおいて、演算処理の負荷を減らすためにαという符号の代わりにaという符号を、βという符号の代わりにbという符号を用いている。)四角で囲った部分はαへリックス及びβシートに対応するアミノ酸配列を示している。
このことから、αへリックス及びβシート以外のランダムコイルなどの二次構造についても符号化立体配座表記により構造のパターン認識ができるとともに、1srvのアミノ酸配列中の193番目から223番目「TYR GLN PHE ASP LYS GLY TYR ILE SER PRO TYR PHE VAL THR ASN PRO GLU THR MET GLU ALA VAL LEU GLU ASP ALA PHE ILE LEU ILE VAL(配列番号5)」に対応する1kidの「MET GLN PHE ASP ARG GLY TYR LEU SER PRO TYR PHE ILE ASN LYS PRO GLU THR GLY ALA VAL GLU LEU GLU SER PRO PHE ILE LEU LEU ALA(配列番号6)」のように、アミノ酸配列の相同性は低くても構造の揺れを考慮した構造相同性の高いタンパク質構造をとることのできるアミノ酸配列パターンを、αへリックス及びβシート以外のランダムコイルなどの二次構造パターンを含んだ形で抽出できることがわかった。
さらに、主鎖の構造において224-225番目のアミノ酸に若干の構造の違いが存在することが抽出された。アミノ酸配列224-225番目における1srvと1kidの構造の違いを図13に示す。
【0081】
[表6]シャペロニンGroEL(1srv,1kid)の符号化立体配座表記と解析結果



【0082】
(実施例6)グルタチオン-S-トランスフェラーゼに取り込まれたグルタチオンのX線結晶構造データと密度汎関数法による構造最適化分子モデルに対する「揺れ許容演算解析法」の適用
PDBjに登録されているグルタチオン-S-トランスフェラーゼ(GST)のX線結晶構造データ6gstにおいて、2分子の下記化学構造式(I)で表せるグルタチオンが取り込まれているが、その6gst_Iについて、前記特許文献4記載の方法を用いて、入力を受け付けた分子モデルに基づき、各々の化学結合部位に対応する二面角位置コードと、360度を12分割して定められた二面角分類コードの組み合わせからなる前記符号化立体配座表記にコード化変換を行った。X線結晶構造データ6gst_Iの分子モデルを図14に示す。このとき、cglu側鎖の末端及びgly主鎖の末端の二面角位置において、水素原子の位置が決められていないことから水素原子が結合している方の置換基を判定できず、二面角分類コードを決定するための優先置換基を選択することができなかった。そこで、X線結晶構造データを比較する際に定められた、(C)その他の水素原子を除いた場合に優先する置換基あるいは原子が決定できない場合には、二面角が一番小さくなる置換基あるいは原子を選択するという優先則に従いコード化変換を行った。得られたX線結晶構造データを比較するための前記符号化立体配座表記を、文字列テキストデータとしてデータベースに保存した。
一方で、6gst_Iの保存された符号化立体配座表記を基に、不足している水素原子位置の予測を立て、立体配座の異なるいくつかのグルタチオン(I)の分子モデルを作成した後、密度汎関数法(B3LYP/6-31G*)を用いて構造最適化及び振動数計算を行った。その中で、もっとも安定な立体配座構造を選択し、X線結晶構造データと比較するために定義された、
(A)立体配座に関するIUPAC命名法の規則に準拠して、水素原子を除いた場合でも優先する置換基あるいは原子が決定できる場合にはその優先する置換基あるいは原子を選択する。
(B)立体配座に関するIUPAC命名法の(2)一つだけが他と違うときは順位に関係なくそのものを選択するという規則で水素が選択される場合には、本来存在するべき水素原子を紙面手前に置き、二面角位置コードのボンドを紙面向こう側に紙面に対して垂直に置き、水素原子と二面角位置コードのボンドのなす面と置換基あるいは原子と二面角位置コードのボンドのなす面による二面角が水素原子からみて時計回りに一番小さくなる置換基あるいは原子を選択する。
(C)その他の水素原子を除いた場合に優先する置換基あるいは原子が決定できない場合には、二面角が一番小さくなる置換基あるいは原子を選択する。
という優先則に従いコード化変換を行った後、その符号化立体配座表記を、文字列テキストデータとしてデータベースに保存した。
次に、表計算ソフトウェアによりデータ読み込みを行い、アミノ酸配列毎に、側鎖をはさんでN末端側の主鎖、C末端側の主鎖及び側鎖を分けて構造相同性比較が行えるように処理を行った。アミノ酸配列が完全に一致しているにもかかわらず、6gst_IとB3LYP計算から得られた分子モデルとでは、360度を12分割して定められた二面角分類コードによる主鎖の構造相同性比較ではあまり相同性は高くなく、ペプチド性チオール構造に揺れが存在していた。
そこで、構造の揺れに対処するため、対応する二面角位置における一つの二面角分類コードに関して、その二面角分類コードと隣接する二面角分類コードの組み合わせは相同性が高く、残りの二面角分類コードは相同性が低いと判定して演算処理し構造相同性比較を行ったところ、N末端側の主鎖の構造相同性比較、C末端側の主鎖の構造相同性比較とも100.0%の相同性となっており、X線結晶構造データと理論計算から求められた構造データとの間で、構造の揺れを考慮した相同性比較が行えることがわかった。理論計算から求められたグルタチオン(I)の分子モデルを図15に示す。グルタチオン(I)(6gst_I,B3LYP計算)の符号化立体配座表記及び相同性の解析結果を表7に示す。(表中、最初の「相同性/aa配列」は、「アミノ酸配列相同性(同一性)」を指し、「相同性/12分割」は、従来法(特許文献4)により解析した相同性、「相同性/揺許容」及び「主鎖の相同性」は、本発明の「揺れ許容演算解析法」により計算した相同性を表す。また、表中の二面角分類コードにおいて、演算処理の負荷を減らすためにαという符号の代わりにaという符号を、βという符号の代わりにbという符号を用いている。)
【0083】
【化1】

【0084】
[表7]グルタチオン(I) (6gst_I,B3LYP計算)の符号化立体配座表記と解析結果

【0085】
(実施例7)ヒト血清アルブミン(HSA)に取り込まれた(S)-イブプロフェンのX線結晶構造データと赤外円二色性(VCD)スペクトル解析から求められた分子モデルに対する「揺れ許容演算解析法」の適用
PDBjに登録されているヒト血清アルブミン(HSA)のX線結晶構造データ2bxgにおいて、4分子の下記化学構造式(II)で表せる(S)-イブプロフェンが取り込まれているが、その2bxg_A1、2bxg_A2、2bxg_B1及び2bxg_B2について、前記特許文献4記載の方法を用いて、入力を受け付けた分子モデルに基づき、各々の化学結合部位に対応する二面角位置コードと、360度を12分割して定められた二面角分類コードの組み合わせからなる前記符号化立体配座表記にコード化変換を行った。このとき、二面角位置コードAのイソプロピル基において、二面角分類コードを決定するための優先置換基が(2)一つだけが他と違うときは順位に関係なくそのものを選択するというケースにあたるため水素が選択されるが、水素原子の位置が決められていないことからコード化を行うことができなかった。そこで、X線結晶構造データを比較する際に定められた、(B)本来存在するべき水素原子を紙面手前に置き、二面角位置コードのボンドを紙面向こう側に紙面に対して垂直に置き、水素原子と二面角位置コードのボンドのなす面と置換基あるいは原子と二面角位置コードのボンドのなす面による二面角が水素原子からみて時計回りに一番小さくなる置換基あるいは原子を選択するという優先則に従いコード化変換を行った。また、二面角位置コードDのカルボキシル基において、水素原子の位置が決められていないことから水素原子が結合している方の置換基を判定できず、二面角分類コードを決定するための優先置換基を選択することができなかった。そこで、X線結晶構造データを比較する際に定められた、(C)その他の水素原子を除いた場合に優先する置換基あるいは原子が決定できない場合には、二面角が一番小さくなる置換基あるいは原子を選択するという優先則に従いコード化変換を行った。得られたX線結晶構造データを比較するための前記符号化立体配座表記を、それぞれ文字列テキストデータとしてデータベースに保存した。
一方で、前記特許文献4の実施例8に記載の、赤外円二色性(VCD)スペクトルの密度汎関数法(B3LYP/6-31G*)を用いた解析から求められた重クロロホルム溶液中で存在比の大きい(S)-イブプロフェン(II)の立体配座構造の分子モデルを、保存していたデータベースから読み込み、X線結晶構造データと比較するために新たに定義された、
(A)立体配座に関するIUPAC命名法の規則に準拠して、水素原子を除いた場合でも優先する置換基あるいは原子が決定できる場合にはその優先する置換基あるいは原子を選択する。
(B)立体配座に関するIUPAC命名法の(2)一つだけが他と違うときは順位に関係なくそのものを選択するという規則で水素が選択される場合には、本来存在するべき水素原子を紙面手前に置き、二面角位置コードのボンドを紙面向こう側に紙面に対して垂直に置き、水素原子と二面角位置コードのボンドのなす面と置換基あるいは原子と二面角位置コードのボンドのなす面による二面角が水素原子からみて時計回りに一番小さくなる置換基あるいは原子を選択する。
(C)その他の水素原子を除いた場合に優先する置換基あるいは原子が決定できない場合には、二面角が一番小さくなる置換基あるいは原子を選択する。
という優先則に従いコード化変換を行った後、そのX線結晶構造データ比較用符号化立体配座表記を、文字列テキストデータとしてデータベースに保存した。
次に、表計算ソフトウェアによりデータ読み込みを行い、二面角位置コード毎に構造相同性比較が行えるように処理を行った。360度を12分割して定められた二面角分類コードによる二面角位置コード毎の構造相同性比較では、X線結晶構造データ同士及びX線結晶構造データと理論計算から求められた構造データの組み合わせともあまり相同性は高くなく、構造に揺れが存在していた。
そこで、構造の揺れに対処するため、対応する二面角位置における一つの二面角分類コードに関して、その二面角分類コードと隣接する二面角分類コードの組み合わせは相同性が高く、残りの二面角分類コードは相同性が低いと判定して演算処理し構造相同性比較を行ったところ、4個のX線結晶構造データ(2bxg_A1,2bxg_A2,2bxg_B1,2bxg_B2)と理論計算から求められた構造データ(B3LYP計算)との間で、12分割相同性では、25.0%であるのに対して本発明の演算処理を行うと、相同性75.0%と評価され、構造の揺れを考慮した相同性比較が行えることがわかった。
また、重クロロホルム溶液において複数存在する、存在比の大きい(S)-イブプロフェン(II)の立体配座構造の中に構造の揺れを考慮した相同性が一致するものが存在し、その符号化立体配座表記を抽出できることがわかった。(S)-イブプロフェン(II) (2bxg_A1,2bxg_A2,2bxg_B1,2bxg_B2,B3LYP計算)の符号化立体配座表記及びそれらの組み合わせによる相同性の解析結果を表8に示す。(表中、「相同性/12分割」は、従来法(特許文献4)により解析した相同性、「相同性」は、本発明の「揺れ許容演算解析法」により計算した相同性を表す。また、表中の二面角分類コードにおいて、演算処理の負荷を減らすためにαという符号の代わりにaという符号を、βという符号の代わりにbを、τという符号の代わりにtという符号という符号を用いている。)
さらに、2bxg_B1、2bxg_B2及びB3LYP計算の構造データにおいて、構造の揺れを考慮した相同性は非常に高いが、特に2bxg_A1のみphpa-CDの部位の立体配座の構造が大きく異なっていることがわかった。
【0086】
【化2】

【0087】
[表8](S)-イブプロフェン(II) (2bxg_A1,2bxg_A2,2bxg_B1,2bxg_B2,B3LYP計算)の符号化立体配座表記及びそれらの組み合わせによる相同性の解析結果

【0088】
(実施例8)プリオンタンパク質における免疫グロブリンとの相互作用の有無での構造の揺れを考慮した構造相同性比較
PDBjに登録されているプリオンタンパク質(HOMO SAPIENS、HUMAN)のX線結晶構造データ1i4mとプリオンタンパク質(HOMO SAPIENS、HUMAN)が免疫グロブリン(MUS MUSCULUS、HOUSE MOUSE)と相互作用しているX線結晶構造データ2w9eについて、前記特許文献4記載の方法を用いて、入力を受け付けた分子モデルに基づき、各々の化学結合部位に対応する二面角位置コードと、360度を12分割して定められた二面角分類コードの組み合わせからなる前記符号化立体配座表記にコード化変換を行った。プリオンタンパク質のX線結晶構造データ1i4m及び2w9eの分子モデルをそれぞれ、図16及び図17に示す。このとき、バリン(Val)側鎖やロイシン(Leu)側鎖の末端の二面角位置において、二面角分類コードを決定するための優先置換基が(2)一つだけが他と違うときは順位に関係なくそのものを選択するというケースにあたるため水素が選択されるが、水素原子の位置が決められていないことからコード化を行うことができなかった。そこで、X線結晶構造データを比較する際に定められた、(B)本来存在するべき水素原子を紙面手前に置き、二面角位置コードのボンドを紙面向こう側に紙面に対して垂直に置き、水素原子と二面角位置コードのボンドのなす面と置換基あるいは原子と二面角位置コードのボンドのなす面による二面角が水素原子からみて時計回りに一番小さくなる置換基あるいは原子を選択するという優先則に従いコード化変換を行った。また、アルギニン(Arg)側鎖、アスパラギン酸(Asn)側鎖及びグルタミン酸(Glu)側鎖の末端の二面角位置において、水素原子の位置が決められていないことから水素原子が結合している方の置換基を判定できず、二面角分類コードを決定するための優先置換基を選択することができなかった。そこで、X線結晶構造データを比較する際に定められた、(C)その他の水素原子を除いた場合に優先する置換基あるいは原子が決定できない場合には、二面角が一番小さくなる置換基あるいは原子を選択するという優先則に従いコード化変換を行った。得られたX線結晶構造データを比較するための前記符号化立体配座表記を、文字列テキストデータとしてデータベースに保存した。
次に、表計算ソフトウェアによりデータ読み込みを行い、アミノ酸配列毎に、側鎖をはさんでN末端側の主鎖、C末端側の主鎖及び側鎖を分けて構造相同性比較が行えるように処理を行った。アミノ酸配列は同一であるが、1i4mにおいてタンパク質分子中のジスルフィド結合が切れており、図16及び17で示されるように分子全体としても非常に構造は異なっていた。さらに、1i4mと2w9eとでは360度を12分割して定められた二面角分類コードによるN末端側の主鎖の構造相同性比較では、48.0%程度の相同性しかなく、C末端側の主鎖の構造相同性比較でも42.9%程度の相同性しかなく、X線結晶構造データにおいて、分子全体の構造の違いとともにタンパク質構造に揺れも同時に存在していた。
そこで、構造の揺れの影響を除くため、対応する二面角位置における一つの二面角分類コードに関して、その二面角分類コードと隣接する二面角分類コードの組み合わせは相同性が高く、残りの二面角分類コードは相同性が低いと判定して演算処理し構造相同性比較を行ったところ、N末端側の主鎖の構造相同性比較では、91.8%程度の相同性、C末端側の主鎖の構造相同性比較でも90.8%程度の相同性、主鎖全体としても86.9%程度の相同性となっており、構造の揺れを考慮した構造変化相同性比較が行えることがわかった。プリオンタンパク質(1i4m,2w9e)の符号化立体配座表記及び相同性の解析結果を表9に示す。(表中、最初の「相同性/aa配列」は、「アミノ酸配列相同性(同一性)」を指し、「相同性/12分割」は、従来法(特許文献4)により解析した相同性、「相同性/揺許容」及び「主鎖の相同性」は、本発明の「揺れ許容演算解析法」により計算した相同性を表す。また、表中の二面角分類コードにおいて、演算処理の負荷を減らすためにαという符号の代わりにaという符号を、βという符号の代わりにbという符号を用いている。)
このことから、αへリックス、βシート、ランダムコイルなどのその他の二次構造に対応するアミノ酸配列に関して、構造の揺れを考慮した演算処理を行えばそれぞれの二次構造を符号化立体配座表記によりパターン認識できるとともに、分子全体として大きく構造は異なっていてもアミノ酸配列に対応する構造相同性は86.9%程度と高いことがわかった。
さらに、詳細な解析から141-143、190-198番目のアミノ酸に非常に大きな二次構造の違いをとることの可能な部位が存在することが見出された。アミノ酸配列141-143番目における1i4mと2w9eの構造の違いを図18に示す。特に、αへリックスの大きな二次構造変化が可能なアミノ酸配列パターンとして、1i4m及び2w9eのアミノ酸配列中の190番目から193番目「THR THR THR THR(配列番号7)」及び1i4m及び2w9eのアミノ酸配列中の195番目から198番目「GLY GLU ASN PHE(配列番号8)」のフラグメントが抽出された。アミノ酸配列190-198番目における1i4mと2w9eの構造の違いを図19に示す。
【0089】
[表9]プリオンタンパク質(1i4m,2w9e)の符号化立体配座表記と解析結果


【0090】
(実施例9)各種免疫グロブリンにおけるプリオンタンパク質との相互作用の有無での構造の揺れを考慮した構造相同性比較
PDBjに登録されている免疫グロブリン(MUS MUSCULUS、HOUSE MOUSE)のX線結晶構造データ2mcpとプリオンタンパク質(HOMO SAPIENS、HUMAN)が免疫グロブリン(MUS MUSCULUS、HOUSE MOUSE)と相互作用しているX線結晶構造データ2w9eについて、可変領域とアミノ酸配列がよく保存されている定常領域を含む軽鎖の全領域に関して、前記特許文献4記載の方法を用いて、入力を受け付けた分子モデルに基づき、各々の化学結合部位に対応する二面角位置コードと、360度を12分割して定められた二面角分類コードの組み合わせからなる前記符号化立体配座表記にコード化変換を行った。プリオンタンパク質と免疫グロブリンが相互作用しているX線結晶構造データ2w9eの分子モデルを図20に示す。このとき、バリン(Val)側鎖やロイシン(Leu)側鎖の末端の二面角位置において、二面角分類コードを決定するための優先置換基が(2)一つだけが他と違うときは順位に関係なくそのものを選択するというケースにあたるため水素が選択されるが、水素原子の位置が決められていないことからコード化を行うことができなかった。そこで、X線結晶構造データを比較する際に定められた、(B)本来存在するべき水素原子を紙面手前に置き、二面角位置コードのボンドを紙面向こう側に紙面に対して垂直に置き、水素原子と二面角位置コードのボンドのなす面と置換基あるいは原子と二面角位置コードのボンドのなす面による二面角が水素原子からみて時計回りに一番小さくなる置換基あるいは原子を選択するという優先則に従いコード化変換を行った。また、アルギニン(Arg)側鎖、アスパラギン酸(Asn)側鎖及びグルタミン酸(Glu)側鎖の末端の二面角位置において、水素原子の位置が決められていないことから水素原子が結合している方の置換基を判定できず、二面角分類コードを決定するための優先置換基を選択することができなかった。そこで、X線結晶構造データを比較する際に定められた、(C)その他の水素原子を除いた場合に優先する置換基あるいは原子が決定できない場合には、二面角が一番小さくなる置換基あるいは原子を選択するという優先則に従いコード化変換を行った。得られたX線結晶構造データを比較するための前記符号化立体配座表記を、文字列テキストデータとしてデータベースに保存した。
次に、表計算ソフトウェアによりデータ読み込みを行い、アミノ酸配列毎に、側鎖をはさんでN末端側の主鎖、C末端側の主鎖及び側鎖を分けて構造相同性比較が行えるように処理を行った。アミノ酸配列の相同性が78.8%の2mcpと2w9eとでは360度を12分割して定められた二面角分類コードによるN末端側の主鎖の構造相同性比較では、52.1%程度の相同性しかなく、C末端側の主鎖の構造相同性比較でも31.8%程度の相同性しかなく、X線結晶構造データにおいてタンパク質構造に揺れが存在していた。
そこで、構造の揺れに対処するため、対応する二面角位置における一つの二面角分類コードに関して、その二面角分類コードと隣接する二面角分類コードの組み合わせは相同性が高く、残りの二面角分類コードは相同性が低いと判定して演算処理し構造相同性比較を行ったところ、N末端側の主鎖の構造相同性比較では、89.6%の相同性、C末端側の主鎖の構造相同性比較でも91.5%の相同性、主鎖全体としても84.4%の相同性となっており、構造の揺れを考慮した相同性比較によりアミノ酸配列の相同性程度の構造の相同性が確認された。免疫グロブリン軽鎖(2mcp,2w9e)の符号化立体配座表記及び相同性の解析結果を表10に示す。(表中、最初の「相同性/aa配列」は、「アミノ酸配列相同性(同一性)」を指し、「相同性/12分割」は、従来法(特許文献4)により解析した相同性、「相同性/揺許容」及び「主鎖の相同性」は、本発明の「揺れ許容演算解析法」により計算した相同性を表す。また、表中の二面角分類コードにおいて、演算処理の負荷を減らすためにαという符号の代わりにaという符号を、βという符号の代わりにbという符号を用いている。)
詳細な解析から、可変領域では14-15、29-31、41-42、50-51番目のアミノ酸に非常に大きな二次構造の違いをとることの可能な部位が存在することが見出され、そのうちの2カ所が超可変領域(表10のアミノ酸配列番号において四角で囲った部分)のCDR1とCDR2の領域に一致していた。さらに、定常領域のアミノ酸配列はほぼ一致しているにもかかわらず、2mcp及び2w9eのアミノ酸配列中の150番目から158番目「ILE ASP GLY SER GLU ARG GLN ASN GLY(配列番号9)」のような比較的長いペプチド鎖間で、非常に大きな二次構造の違いをとることの可能な部位が存在することがわかった。アミノ酸配列150-158番目における2mcpと2w9eの構造の違いを図21に示す。
【0091】
[表10]免疫グロブリン軽鎖(2mcp,2w9e)の符号化立体配座表記と解析結果




【0092】
(実施例10)免疫グロブリンと相互作用をしているプリオンタンパク質の側鎖を含む相互作用部位に対する「揺れ許容演算解析法」の適用
PDBjに登録されているプリオンタンパク質(HOMO SAPIENS、HUMAN)が免疫グロブリン(MUS MUSCULUS、HOUSE MOUSE)と相互作用しているX線結晶構造データ2w9eとそのアミノ酸配列が一致する免疫グロブリン(MUS MUSCULUS、HOUSE MOUSE)のみのX線結晶構造データ2w9dについて、超可変領域を含む、プリオンタンパク質と免疫グロブリンが相互作用している軽鎖の領域のみを抽出して、前記特許文献4記載の方法を用いて、入力を受け付けた分子モデルに基づき、各々の化学結合部位に対応する二面角位置コードと、360度を12分割して定められた二面角分類コードの組み合わせからなる前記符号化立体配座表記にコード化変換を行った。抽出されたプリオンタンパク質と免疫グロブリン軽鎖が相互作用している領域のX線結晶構造データ2w9eの分子モデルを図22に示す。このとき、バリン(Val)側鎖やロイシン(Leu)側鎖の末端の二面角位置において、二面角分類コードを決定するための優先置換基が(2)一つだけが他と違うときは順位に関係なくそのものを選択するというケースにあたるため水素が選択されるが、水素原子の位置が決められていないことからコード化を行うことができなかった。そこで、X線結晶構造データを比較する際に定められた、(B)本来存在するべき水素原子を紙面手前に置き、二面角位置コードのボンドを紙面向こう側に紙面に対して垂直に置き、水素原子と二面角位置コードのボンドのなす面と置換基あるいは原子と二面角位置コードのボンドのなす面による二面角が水素原子からみて時計回りに一番小さくなる置換基あるいは原子を選択するという優先則に従いコード化変換を行った。また、アルギニン(Arg)側鎖、アスパラギン酸(Asn)側鎖及びグルタミン酸(Glu)側鎖の末端の二面角位置において、水素原子の位置が決められていないことから水素原子が結合している方の置換基を判定できず、二面角分類コードを決定するための優先置換基を選択することができなかった。そこで、X線結晶構造データを比較する際に定められた、(C)その他の水素原子を除いた場合に優先する置換基あるいは原子が決定できない場合には、二面角が一番小さくなる置換基あるいは原子を選択するという優先則に従いコード化変換を行った。得られたX線結晶構造データを比較するための前記符号化立体配座表記を、文字列テキストデータとしてデータベースに保存した。
次に、表計算ソフトウェアによりデータ読み込みを行い、アミノ酸配列毎に、側鎖をはさんでN末端側の主鎖、C末端側の主鎖及び側鎖を分けて構造相同性比較が行えるように処理を行った。アミノ酸配列が一致する2w9eと2w9dとでは360度を12分割して定められた二面角分類コードによるN末端側の主鎖の構造相同性比較では、72.2%程度の相同性しかなく、C末端側の主鎖の構造相同性比較でも51.9%程度の相同性しかなく、X線結晶構造データにおいてタンパク質構造に揺れが存在していた。
そこで、構造の揺れに対処しかつ側鎖の構造相同性比較も行うため、対応する二面角位置における一つの二面角分類コードに関して、1)その二面角分類コードと隣接する二面角分類コードの組み合わせは相同性が高い(○)、2)一つの二面角分類コードをはさんだ比較的近い二面角分類コードの組み合わせの相同性は中程度(△)、3)それ以外の二面角分類コードの組み合わせの相同性は低い(×)と判定して演算処理し構造相同性比較を行ったところ、N末端側の主鎖の構造相同性比較では、98.1%の相同性、C末端側の主鎖の構造相同性比較で100.0%の相同性となっており、構造の揺れを考慮した相同性比較によりプリオンタンパク質が相互作用しても免疫グロブリン軽鎖の超可変領域付近の主鎖に大きな二次構造の変化は起こらないことが確認された。抽出された領域の免疫グロブリン軽鎖(2w9e,2w9d)の符号化立体配座表記及び相同性の解析結果を表11に示す。(表中、最初の「相同性/aa配列」は、「アミノ酸配列相同性(同一性)」を指し、「相同性/(厳密)」は、従来法(特許文献4)により解析した相同性、「相同性/揺許容」は、本発明の「揺れ許容演算解析法」により計算した相同性を表す。また、表中の二面角分類コードにおいて、演算処理の負荷を減らすためにαという符号の代わりにaという符号を、βという符号の代わりにbという符号を用いている。)
詳細な解析から、免疫グロブリン軽鎖のアミノ酸側鎖においても構造の揺れを考慮すると、プリオンタンパク質が相互作用しても78.7%の構造相同性をとることが見出された。特に、プリオンタンパク質と直接相互作用している31番目のTYR、49番目のASP、90番目のTRP、91番目のARG及び95番目のTYRにおいて、91番目のARGの二カ所の二面角分類コードを除いて、構造の揺れを考慮して構造相同性は高いことがわかった。さらに、アミノ酸側鎖において大きな構造の違いをとることの可能な部位が抽出された。アミノ酸配列90-92番目における2w9eと2w9dの構造の違いを図23に示す。
さらに、抽出された領域のプリオンタンパク質側についても実施例8の解析結果を用いて、2w9eと1i4mのアミノ酸側鎖の構造相同性比較もあわせて行った。抽出された領域のプリオンタンパク質(2w9e,1i4m)の符号化立体配座表記及び相同性の解析結果を表12A(主鎖)及び表12B(側鎖)に示す。(表12A中、最初の「相同性/aa配列」は、「アミノ酸配列相同性(同一性)」を指し、「相同性/(厳密)」は、従来法(特許文献4)により解析した相同性、「相同性/揺許容」は、本発明の「揺れ許容演算解析法」により計算した相同性を表す。表12B中、最初の「相同性/aa配列」は、「アミノ酸配列相同性(同一性)」を指し、「相同性/(厳密)」は、従来法(特許文献4)により解析した相同性、「相同性/揺許容」は、本発明の「揺れ許容演算解析法」により計算した相同性を表す。また、表12A及び表12B中の二面角分類コードにおいて、演算処理の負荷を減らすためにαという符号の代わりにaという符号を、βという符号の代わりにbという符号を用いている。)特に、免疫グロブリン軽鎖と直接相互作用している148番目のARG及び151番目のARGにおいて、構造の揺れを考慮して主鎖のみならず側鎖についても構造相同性は非常に高いことがわかった。また、アミノ酸側鎖の根本の部分のみの二面角分類コードの比較では、抽出された領域において構造の揺れを考慮して92.0%の構造相同性が見出された。アミノ酸配列151-152番目における2w9eと1i4mの構造の違いを図24に示す。
【0093】
[表11]抽出された領域の免疫グロブリン軽鎖(2w9e,2w9d)の符号化立体配座表記と解析結果

【0094】
[表12A]抽出された領域のプリオンタンパク質(2w9e,1i4m)の符号化立体配座表記と解析結果(主鎖)

[表12B]抽出された領域のプリオンタンパク質(2w9e,1i4m)の符号化立体配座表記と解析結果(側鎖)

【0095】
(実施例11)遊離因子RF2におけるαへリックス及びβシート構造パターン解析
実施例8のαへリックスフラグメントの多い、プリオンタンパク質(HOMO SAPIENS、HUMAN)のX線結晶構造データ1i4mとプリオンタンパク質(HOMO SAPIENS、HUMAN)から、主鎖(ABC)のαへリックス構造パターンとして、3β5α4βを抽出した。
一方で、実施例9のβシートフラグメントの多い、免疫グロブリン(MUS MUSCULUS、HOUSE MOUSE)のX線結晶構造データ2mcpとプリオンタンパク質(HOMO SAPIENS、HUMAN)が免疫グロブリン(MUS MUSCULUS、HOUSE MOUSE)と相互作用しているX線結晶構造データ2w9eから、主鎖(ABC)のβシート構造パターンとして、6α4β4βを抽出した。
次にPDBjに登録されているリボソームRNA(THERMUS THERMOPHILUS)が遊離因子RF2(THERMUS THERMOPHILUS)と相互作用しているX線結晶構造データ2wh1とそのアミノ酸配列の相同性が高い遊離因子RF2(THERMUS THERMOPHILUS)のみのX線結晶構造データ2ihrについて、実施例8と同様の方法を用いてコード化変換を行った。得られたX線結晶構造データを比較するための前記符号化立体配座表記を、文字列テキストデータとしてデータベースに保存した。
表計算ソフトウェアによりデータ読み込みを行い、アミノ酸配列毎に、側鎖をはさんでN末端側の主鎖、C末端側の主鎖及び側鎖を分けて構造相同性比較が行えるように処理を行った。2ihrについて、主鎖(ABC)のαへリックス構造パターンとの前記3−7.の改良した「揺れ許容演算解析法」を用いた解析を行ったところ、表13に示すようにαへリックス構造パターンは59.4%程度存在することが確認でき、それ以外の領域ではαへリックス以外の構造パターンが抽出された。同様に、2ihrについて、主鎖(ABC)のβシート構造パターンとの前記3−7.の改良した「揺れ許容演算解析法」を用いた解析を行ったところ、表14に示すようにβシート構造パターンは30.0%程度存在することが確認でき、それ以外の領域ではβシート以外の構造パターンが抽出された。
さらに、大きな立体配座構造の違いのみ取り出すために、遊離因子RF2単独の場合の構造データ2ihrと、リボソームRNA分子との相互作用によって分子構造中の比較的大きな揺れが予想される2wh1の構造データについて、前記3−7.の改良した「揺れ許容演算解析法」を適用した構造相同性評価を行った。当該構造相同性評価によれば、表15に示すように、88.9%程度の構造相同性をとることが確認された。(なお、表13〜15中、最初の「相同性/aa配列」は、「アミノ酸配列相同性(同一性)」を指し、「相同性/12分割」は、従来法(特許文献4)により解析した相同性、「主鎖の相同性」は、本発明の前記3−7.の改良した「揺れ許容演算解析法」により計算した相同性を表す。また、表13〜15中の二面角分類コードにおいて、演算処理の負荷を減らすためにαという符号の代わりにaという符号を、βという符号の代わりにbという符号を用いている。)さらに、先に抽出された、αへリックス以外の構造パターン及びβシート以外の構造パターンの解析結果と組み合わせて、2ihrのαへリックス及びβシート以外の構造パターンにおける主鎖の構造変化フラグメントが抽出された(表15)。分子モデルの重ね合わせによる、2ihrと2wh1の中の遊離因子RF2の分子全体の構造の違いを図25に示す。図25に示されるように、2ihrと2wh1では複数箇所での構造変化が同時に起こっており、従来の分子モデルの重ね合わせによる解析では構造の違いを把握することは困難であるが、表15に示される解析結果から、他分子との相互作用により起こる分子構造変化において、本質的に機能するフラグメントの構造変化領域をコード化により理解できることが立証された。
【0096】
[表13]遊離因子RF2(2ihr)の符号化立体配座表記とαへリックス構造パターン解析結果





【0097】
[表14]遊離因子RF2(2ihr)の符号化立体配座表記とβシート構造パターン解析結果





【0098】
[表15]遊離因子RF2(2ihr,2wh1)の符号化立体配座表記と解析結果





【0099】
(実施例12)リボソームRNAにおけるステム型構造パターンの確認と伸長因子EF-Tu及び遊離因子RF2の違いにより生じるリボソームRNAの構造変化に特徴的な構造パターンの抽出
PDBjに登録されているステム型の二重らせん構造を有する合成されたRNAのX線結晶構造データ1r9fについて、下記化学構造式(III)で表せるRNAを構成するフラグメントの二面角位置コードの定義に基づき、実施例8と同様の方法を用いてコード化変換を行った。1r9fから、主鎖(ABC-D-EF)のステム型構造パターンとして、3β1β3β-1α-1α3βを抽出した。
次にPDBjに登録されているリボソーム(THERMUS THERMOPHILUS)が伸長因子EF-Tu(THERMUS THERMOPHILUS)と相互作用しているX線結晶構造データ2wrnとリボソーム(THERMUS THERMOPHILUS)が遊離因子RF2(THERMUS THERMOPHILUS)と相互作用しているX線結晶構造データ2wh1のそれぞれのリボソームRNAの分子構造データについて、下記化学構造式(III)で表せるRNAを構成するフラグメントの二面角位置コードの定義に基づき、実施例8と同様の方法を用いてコード化変換を行った。得られたX線結晶構造データを比較するための前記符号化立体配座表記を、文字列テキストデータとしてデータベースに保存した。
表計算ソフトウェアによりデータ読み込みを行い、核酸塩基配列毎に、主鎖及び側鎖を分けて構造相同性比較が行えるように処理を行った。2wrnについて、主鎖(ABC-D-EF)ステム型構造パターン3β1β3β-1α-1α3βとの前記3−7.の改良した「揺れ許容演算解析法」を用いた解析を行ったところ、ステム型構造パターンは63.6%程度存在し、ステム型以外の構造パターンが抽出された。
さらに、大きな立体配座構造の違いのみ取り出すために、2wrnと2wh1の中のリボソームRNAの構造データについて、前記3−7.の改良した「揺れ許容演算解析法」を用いた構造相同性評価を行った。前記3−7.の改良した「揺れ許容演算解析法」を用いた構造相同性評価では表16に示すように、88.5%程度の構造相同性をとることが確認された。(表中、最初の「相同性/base配列」は、「核酸塩基配列相同性(同一性)」を指し、「相同性/12分割」は、従来法(特許文献4)により解析した相同性、「主鎖の相同性」は、本発明の前記3−7.の改良した「揺れ許容演算解析法」により計算した相同性を表す。また、表中の二面角分類コードにおいて、演算処理の負荷を減らすためにαという符号の代わりにaという符号を、βという符号の代わりにbという符号を用いている。)さらに、先に抽出された、ステム型以外の構造パターンの解析結果と組み合わせて、2wrnのステム型以外の構造パターンにおける主鎖の構造変化フラグメントが抽出された(表16)。分子モデルの重ね合わせによる、2wrnと2wh1の中のリボソームRNAの分子全体の構造の違いを図26に示す。図26に示されるように、リボソームRNA のような巨大生体高分子になると、従来の分子モデルの重ね合わせによる解析では構造の違いを把握することは困難であるが、表16に示される解析結果から、他分子との相互作用により起こる分子構造変化において、本質的に機能するフラグメントの構造変化領域をコード化により理解できることが立証された。
さらに、2wrnにおいて図27に示す伸長因子EF-Tuと相互作用している周縁部に焦点を当てて詳細な解析を行ったところ、A55、C366-U368及びC372において、それぞれステム型以外の、A-1β5β2α-6α-3β6α、C-3α1β3β-6α-3β1α-U-2α1α2β-6α-3β3β-U-3β5β2α-6α-6β2α及びC-3β5β2β-6α-6α1βという主鎖の構造パターンを持ち、2wh1にみられる構造とは異なる構造パターンを取りうるRNAフラグメントであることがわかった。分子モデルの重ね合わせによる、2wrnと2wh1の中のリボソームRNAのC366-C372における構造の違いを図28に示す。このように、従来の分子モデルの重ね合わせによる解析では構造の違いを把握することは困難であるが、他分子との相互作用により起こる分子構造変化において、機能に関与する特徴的な構造パターンがコード化により理解できることが立証された。
【0100】
【化3】

【0101】
[表16]リボソームRNA
(2wrn,2wh1)の符号化立体配座表記と解析結果





















【0102】
(実施例13)small interfering RNA(siRNA)における特徴的な新規構造パターンの抽出
PDBjに登録されているsmall interfering RNA(siRNA)のX線結晶構造データ1di2_C、1di2_D、1di2_E、1di2_G、1r9f_B、1r9f_C、1rpu_CA、1rpu_CB、1rpu_DA、1rpu_DB、1si2_B、1si3_B、1zbh_E、1zbh_F、2bgg_P、2bgg_Q、2bgg_R、2bgg_S、2f8s_C、2f8s_D、2f8t_C、2f8t_D、2g92_A、2g92_B、3cz3_EA、3cz3_EB、3cz3_FA、3cz3_FB、3cz3_GA、3cz3_GB、3cz3_HA、3cz3_HBについて、実施例12と同様の方法を用いてRNAを構成するフラグメントの二面角位置コードの定義に基づきコード化変換を行った。得られた、新規構造パターンを抽出するための前記符号化立体配座表記を、文字列テキストデータとしてデータベースに保存した。
表計算ソフトウェアにより、データベースに保存された、新規構造パターンを抽出するための前記符号化立体配座表記及び実施例12の1r9fから抽出された、主鎖(ABC-D-EF)のステム型構造パターン(3β1β3β-1α-1α3β)のデータ読み込みを行い、核酸塩基配列毎に、主鎖及び側鎖を分けて構造相同性比較が行えるように処理を行った。新規構造パターンを抽出するための、siRNAの前記符号化立体配座表記について、主鎖(ABC-D-EF)ステム型構造パターン3β1β3β-1α-1α3βとの前記3−7.の改良した「揺れ許容演算解析法」を用いた解析を行ったところ、ステム型構造パターン3β1β3β-1α-1α3βと相同性が高い構造パターンは72.6%程度存在し、それ以外の構造パターンが抽出された。
それ以外の構造パターンの中から、出現頻度の高い構造パターン1β1α2β-1α-6α3βを抽出し、前記3−7.の改良した「揺れ許容演算解析法」を用いて、ステム型構造パターン3β1β3β-1α-1α3βとは異なる構造パターンであることを確認した。次に、新規構造パターンを抽出するための、siRNAの前記符号化立体配座表記について、構造パターン1β1α2β-1α-6α3βとの前記3−7.の改良した「揺れ許容演算解析法」を用いた解析を行ったところ、構造パターン1β1α2β-1α-6α3βと相同性が高い構造パターンは10.8%程度存在し、それ以外の構造パターンが抽出された。
ステム型構造パターン3β1β3β-1α-1α3β及び構造パターン1β1α2β-1α-6α3β以外の構造パターンの中から、前記3−7.の改良した「揺れ許容演算解析法」を用いて、新規構造パターンであることを確認した上で、前記新規構造パターン抽出処理を繰り返したところ、21個の構造パターンが抽出され、解析を行ったsiRNAのX線結晶構造データはすべてこれら21個の構造パターンのいずれかに属する構造パターンを有していた。抽出された21個の構造パターンの分類を、出現頻度の高い順に表17に示す。(表中の二面角分類コードにおいて、αという符号の代わりにaという符号を、βという符号の代わりにbという符号を用いている。)
【0103】
[表17]siRNAにみられる構造パターンの分類

【0104】
(実施例14)SARCIN-RICIN LOOPを有するRNAにおける特徴的な新規構造パターンの抽出と評価
PDBjに登録されているSARCIN-RICIN LOOPを有するRNA(SACCHAROMYCES CEREVISIAE、BAKER'S YEAST、FRAGMENT 2684-2711)のX線結晶構造データ2x7n_Aについて、実施例12と同様の方法を用いてRNAを構成するフラグメントの二面角位置コードの定義に基づきコード化変換を行った。得られたX線結晶構造データを比較するための前記符号化立体配座表記を、文字列テキストデータとしてデータベースに保存した。
表計算ソフトウェアにより、データベースに保存された前記符号化立体配座表記及び実施例13で抽出された21個の構造パターンのデータ読み込みを行い、核酸塩基配列毎に、主鎖及び側鎖を分けて構造相同性比較が行えるように処理を行った。2x7n_Aの前記符号化立体配座表記について、主鎖(ABC-D-EF)ステム型構造パターン3β1β3β-1α-1α3βとの前記3−7.の改良した「揺れ許容演算解析法」を用いた解析を行ったところ、ステム型構造パターン3β1β3β-1α-1α3βと相同性が高い構造パターンは74.1%程度存在し、それ以外の構造パターンが抽出された。
それ以外の構造パターンについて、siRNAにみられる残り20個の構造パターンの分類を用いて、前記3−7.の改良した「揺れ許容演算解析法」を用いた解析を行ったところ、実施例13の表17で示した構造パターン5と相同性が高い構造パターンが1個、構造パターン6と相同性が高い構造パターンが2個、構造パターン10と相同性が高い構造パターンが1個存在していた。また、A8及びG9において、SARCIN-RICIN LOOPに特徴的な主鎖の構造パターンA-1β5α3β-3β-6α1β及びG-3β2α2β-6α-1α5αが見出された。表18に示すように、これら2個の新規構造パターンは、siRNAにみられる21個の構造パターンと前記3−7.の改良した「揺れ許容演算解析法」を用いた相同性評価を行っても、構造相同性は全く確認されなかった。2x7n_Aの構造パターン解析結果を表19に示す。(表18及び表19中、最初の「相同性/12分割」は、従来法(特許文献4)により解析した相同性、「主鎖の相同性」は、本発明の前記3−7.の改良した「揺れ許容演算解析法」により計算した相同性を表す。また、表18及び表19中の二面角分類コードにおいて、演算処理の負荷を減らすためにαという符号の代わりにaという符号を、βという符号の代わりにbという符号を用いている。)表19に示される解析結果から、グラフィカルインターフェースをまったく使用せずともSARCIN-RICIN LOOPに特徴的な主鎖の構造パターンをコード化により理解できることが立証された。図29にSARCIN-RICIN LOOPに特徴的な主鎖の構造パターンを示すための2x7n_Aの分子モデルを示す。(図中の分子モデルにおいて、分子全体はリボン表示を用い、SARCIN-RICIN LOOPに特徴的な主鎖の新規構造パターンのみスティック表示を用いて示している。)
【0105】
[表18]siRNAにみられる構造パターンとSARCIN-RICIN LOOPに特徴的な構造パターンとの主鎖の構造相同性評価

【0106】
[表19]SARCIN-RICIN LOOPを有するRNA(2x7n_A)の符号化立体配座表記と構造パターン解析結果

【産業上の利用可能性】
【0107】
本発明に係る前記立体配座相同性評価装置は、符号の一致による単純な演算処理では完全には分子構造の揺れの問題に対処できない場合においても、対応する二面角位置における一つの前記二面角分類コードに関して、該二面角分類コードと隣接する二面角分類コードの組み合わせは相同性が高く、残りの二面角分類コードは相同性が低いと判定して演算処理するようにしたので、平衡に基づく分子構造の揺れの問題を考慮した立体配座構造の相同性の評価を簡便に行うことができる。従って、例えば抗体医薬の液体製剤化プロセス中に凍結乾燥工程があるが、その凍結乾燥前後の溶液中で抗体医薬の構造変化が起きていないことを、前記符号化立体配座表記を用いた構造相同性比較により簡易に確認することができる。
【0108】
また、本発明によれば、水素原子の位置情報を持たないX線結晶構造解析から得られた分子モデルと理論計算から得られた分子モデルとの比較を行うことができ、解析対象化合物がタンパク質あるいはペプチドの場合にアミノ酸配列が異なっていながら、構造相同性は非常に高いアミノ酸配列パターンを詳細な立体配座表記とともに抽出することができる。また、リガンド分子とタンパク質分子の相互作用部位について、構造相同性評価によりその構造変化をアミノ酸側鎖も含めた詳細な立体配座表記により簡便に記述することができる。さらに、αへリックス型、βシート型等のフラグメントの特徴的な構造パターンについての解析が、コードを用いて簡便な操作で行うことができる。同様に、各種RNAにおいても、ステム構造、ループ構造など特徴的な二次構造に対応する構造パターンが抽出でき、さらに、タンパク質、RNAなどにおける新規な構造パターンを見つけることもできる。
したがって、例えば、未だその機能が明らかにされていないオーファン受容体タンパク質の構造相同性解析により、その機能解明に役立てることができることから、新規薬剤設計などに活用することができる。
【0109】
よって、本発明は、バイオ医薬品のさらなる安全性を保証する品質管理手法、薬理プロテオミクスによる創薬、構造活性相関等を活用した、有害物質の人体への影響評価などの応用面での展開が充分に期待されるものである。
【配列表フリーテキスト】
【0110】
配列番号1:インシュリンA鎖
配列番号2:免疫グロブリン軽鎖(52〜75aa)2imm,2mcp
配列番号3:免疫グロブリン軽鎖(52〜75aa)1a7o
配列番号4:免疫グロブリン軽鎖(52〜75aa)3iy2
配列番号5:シャペロニンGroEL(193〜223aa)1srv
配列番号6:シャペロニンGroEL(193〜223aa)1kid
配列番号7:プリオンタンパク質(190〜193aa)1i4m,2w9e
配列番号8:プリオンタンパク質(195〜198aa)1i4m,2w9e
配列番号9:免疫グロブリン軽鎖(150〜158aa)2mcp,2w9e

【特許請求の範囲】
【請求項1】
処理部が、複数の解析対象化合物それぞれの立体配座構造の分子モデルの入力を受け付け、
前記処理部が、入力を受け付けた分子モデルに基づき、各々の化学結合部位に対応する二面角位置コードと、360度を12分割して定められた二面角分類コードの組み合わせからなる立体配座表記(以下、符号化立体配座表記と示す)により、一つの該符号化立体配座表記で立体配座を一義的に決定できる構造について、前記立体配座表記に必要となる、注目する化学結合部位の表記を残して不要な表記を省略した符号化立体配座表記を前記分子モデルから抽出するとともに、抽出した符号化立体配座表記を記憶部に記憶させ、
前記処理部が、前記記憶部から複数の前記符号化立体配座表記を取り出し、
対応関係にある二面角位置におけるそれぞれの位置において、選択された二面角分類コードと共にその両側の二面角分類コードを抽出して、要素として連続して隣り合った3個の二面角分類コードを要素とする集合を作成し、
各解析対象化合物中の前記位置における集合の要素を対比させ、
それぞれの化合物に帰属する集合の要素のうちで少なくとも1個の要素は全ての化合物において共通しており、かつ当該共通した要素が少なくとも1つの化合物に帰属する集合における中央の要素であるという条件を満たすか否かを検索し、
満たす場合には相同性が高く、それ以外は相同性が低いと判定する演算処理を行う操作を繰り返すことを特徴とする立体配座相同性評価方法。
【請求項2】
比較する解析対象化合物の少なくとも1つの立体配座構造がX線結晶構造解析による分子モデルの場合であって、かつIUPAC命名法に準拠した二面角分類コードを決定する標準則によると座標位置が定まらないために水素原子が関与する二面角分類コードが決定できないときに、下記(A)〜(C)の優先則に従い、前記符号化立体配座表記を選択することを特徴とする請求項1に記載の立体配座相同性評価方法;
(A)立体配座に関するIUPAC命名法の規則に準拠して、水素原子を除いた場合でも優先する置換基あるいは原子が決定できる場合にはその優先する置換基あるいは原子を選択する、
(B)立体配座に関するIUPAC命名法の(2)一つだけが他と違うときは順位に関係なくそのものを選択するという規則で水素が選択される場合には、本来存在するべき水素原子を紙面手前に置き、二面角位置コードのボンドを紙面向こう側に紙面に対して垂直に置き、水素原子と二面角位置コードのボンドのなす面と置換基あるいは原子と二面角位置コードのボンドのなす面による二面角が水素原子からみて時計回りに一番小さくなる置換基あるいは原子を選択する、
(C)その他の水素原子を除いた場合に優先する置換基あるいは原子が決定できない場合には、二面角が一番小さくなる置換基あるいは原子を選択する。
【請求項3】
比較する解析対象化合物がタンパク質又はペプチドの場合に、各アミノ酸残基を結合する主鎖を基準に選択して接頭辞に各アミノ酸残基を用い、アミノ酸配列と対応させた前記符号化立体配座表記を行うものであり、主鎖のみについて構造相同性評価を行うことを特徴とする、請求項1又は請求項2に記載の立体配座相同性評価方法。
【請求項4】
解析対象化合物となるタンパク質又はペプチド間において、構造相同性は高いがアミノ酸配列は異なっている前記符号化立体配座表記及びアミノ酸配列パターンを抽出することを特徴とする、請求項3に記載の立体配座相同性評価方法。
【請求項5】
比較する解析対象化合物同士で同一のフラグメントを有する場合において、そのフラグメントの接頭辞を含めた二面角位置コードの表記が完全に一致しており、そのうちの1つを基準となる化合物として選択できる場合に、当該化合物の立体配座構造の二面角分類コードを、連続して隣り合った3個のうち中央のコードとし、構造相同性評価を行う化合物の対応する二面角位置における二面角分類コードの集合のすべての要素が、基準となる該二面角分類コードの中央値あるいはそれと隣り合った二面角分類コードに一致すれば相同性が高く、それ以外は相同性が低いと判定して演算処理を行うことを特徴とする、請求項1〜4のいずれかに記載の立体配座相同性評価方法。
【請求項6】
表示部、入力部、処理部、主記憶部、出力部、I/O部、データベース部及び各部を接続するバスから構成される立体配座相同性評価装置であって、
入力部において、入力操作に従い、複数の解析対象化合物それぞれの立体配座構造の分子モデルをデータベース部から取り出して処理部に送り、
前記処理部において、入力を受け付けた各々の分子モデルに対して、
注目する化学結合部位に対応する二面角位置コードを表記すると共に、各二面角位置コードのそれぞれに、360度を12分割して定められた二面角分類コードを組み合わせて表記する符号化立体配座表記を施すことで、各分子モデルに関する立体配座を一義的に決定し、
次いで、構造相同性評価のための演算に必要な注目する化学結合部位の表記以外の不要な表記を省略した符号化立体配座表記を抽出し、
抽出した各符号化立体配座表記を記憶部に記憶させ、
前記処理部において、前記記憶部から前記複数の解析対象化合物に対応する各々の前記符号化立体配座表記を取り出し、
対応関係にある二面角位置における最初の位置において、選択された二面角分類コードと共にその両側の二面角分類コードを抽出して、要素として連続して隣り合った3個の二面角分類コードを要素とする集合を作成し、
各解析対象化合物中の前記位置における集合の要素を対比させ、
それぞれの化合物に帰属する集合の要素のうちで少なくとも1個の要素は全ての化合物において共通しており、かつ当該共通した要素が少なくとも1つの化合物に帰属する集合における中央の要素であるという条件を満たすか否かを検索し、
満たす場合には相同性が高く、それ以外は相同性が低いと判定し、
続いて次の位置における同様の操作を行い、全ての対応する位置についての操作を繰り返して完了したときに、出力部に送り、
前記出力部において、各二面角位置コードのそれぞれに対応させた揺れ許容評価を相同性が高い場合には○、相同性が低い場合には×という符号を表示する、及び/又は全二面角位置コード数あたりの揺れ許容評価が○の割合を計算して揺れ許容相同性の価として表示することを特徴とする立体配座相同性評価装置。
【請求項7】
前記処理部において各分子モデルに関する符号化立体配座表記を決定するにあたり、前記入力を受け付けた各々の分子モデルの少なくとも1つがX線結晶構造解析による分子モデルの場合であって、かつIUPAC命名法に準拠した二面角分類コードを決定する標準則によると座標位置が定まらないために水素原子が関与する二面角分類コードが決定できない場合に、下記(A)〜(C)の優先則に従い、前記符号化立体配座表記を選択する工程を設けることを特徴とする、請求項6に記載の立体配座相同性評価装置;
(A)立体配座に関するIUPAC命名法の規則に準拠して、水素原子を除いた場合でも優先する置換基あるいは原子が決定できる場合にはその優先する置換基あるいは原子を選択する、
(B)立体配座に関するIUPAC命名法の(2)一つだけが他と違うときは順位に関係なくそのものを選択するという規則で水素が選択される場合には、本来存在するべき水素原子を紙面手前に置き、二面角位置コードのボンドを紙面向こう側に紙面に対して垂直に置き、水素原子と二面角位置コードのボンドのなす面と置換基あるいは原子と二面角位置コードのボンドのなす面による二面角が水素原子からみて時計回りに一番小さくなる置換基あるいは原子を選択する、
(C)その他の水素原子を除いた場合に優先する置換基あるいは原子が決定できない場合には、二面角が一番小さくなる置換基あるいは原子を選択する。
【請求項8】
比較する解析対象化合物同士で同一のフラグメントを有する場合において、そのフラグメントの接頭辞を含めた二面角位置コードの表記が完全に一致しており、そのうちの1つを基準となる化合物として選択できる場合に、当該化合物の立体配座構造の二面角分類コードを、連続して隣り合った3個のうち中央のコードとし、構造相同性評価を行う化合物の対応する二面角位置における二面角分類コードの集合のすべての要素が、基準となる該二面角分類コードの中央値あるいはそれと隣り合った二面角分類コードに一致すれば相同性が高く、それ以外は相同性が低いと判定する演算処理を行わせることを特徴とする、請求項6又は7に記載の立体配座相同性評価装置。
【請求項9】
処理部が、1つ又は複数の基準となる構造パターンに対応するフラグメントの立体配座構造の分子モデルの入力を受け付け、
前記処理部が、入力を受け付けた分子モデルに対して、注目する化学結合部位に対応する二面角位置コードを表記すると共に、各二面角位置コードのそれぞれに、360度を12分割して定められた二面角分類コードを組み合わせて表記する符号化立体配座表記を施すことで、各分子モデルに関する立体配座を一義的に決定し、
次いで、構造相同性評価のための演算に必要な注目する化学結合部位の表記以外の不要な表記を省略した符号化立体配座表記を抽出し、
抽出した符号化立体配座表記をそれぞれ基準構造パターンとしてあらかじめ記憶部に記憶させ、
別途、解析対象化合物の立体配座構造の分子モデルの入力を受け付け、
前記処理部において、入力を受け付けた解析対象化合物の分子モデルに対して、
注目する化学結合部位に対応する二面角位置コードを表記すると共に、各二面角位置コードのそれぞれに、360度を12分割して定められた二面角分類コードを組み合わせて表記する符号化立体配座表記を施すことで、各分子モデルに関する立体配座を一義的に決定し、
次いで、構造パターン解析のための演算に必要な注目する化学結合部位の表記以外の不要な表記を省略した符号化立体配座表記を抽出し、
抽出した各符号化立体配座表記を記憶部に記憶させ、
前記処理部において、前記記憶部から前記解析対象化合物の符号化立体配座表記を取り出すと共に、あらかじめ記憶部に記憶させていた前記基準構造パターンのうちで、比較しようとする基準構造パターンを選択し、当該構造パターンに一致する前記符号化立体配座表記を比較対象の参照として取り出し、
対応関係にある二面角位置における最初の位置において、選択された二面角分類コードと共にその両側の二面角分類コードを抽出して、要素として連続して隣り合った3個の二面角分類コードを要素とする集合を作成し、
前記解析対象化合物及び参照となる構造パターン中の前記位置における集合の要素を対比させ、
各二面角分類コードが帰属する集合の要素のうちで少なくとも1個の要素が基準の構造パターンと共通しているという条件を満たすか否かを検索し、
満たす場合には、基準の構造パターンに一致するとして判定し、満たさない場合には、それ以外の構造パターンに該当すると判定する演算処理を行い、
続いて次の位置における同様の演算処理を行う操作を行い、全ての対応する位置についての操作を繰り返すことを特徴とする構造パターン解析方法。
【請求項10】
表示部、入力部、処理部、主記憶部、出力部、I/O部、データベース部及び各部を接続するバスから構成される立体配座相同性評価装置であって、
入力部において、入力操作に従い、1つ又は複数の基準となる構造パターンに対応するフラグメントの立体配座構造の分子モデルの入力を受け付け、
各々の構造パターンの立体配座構造の分子モデルをデータベース部から取り出して処理部に送り、
処理部において、入力を受け付けた各々の構造パターンの分子モデルに対して、
注目する化学結合部位に対応する二面角位置コードを表記すると共に、各二面角位置コードのそれぞれに、360度を12分割して定められた二面角分類コードを組み合わせて表記する符号化立体配座表記を施すことで、各分子モデルに関する立体配座を一義的に決定し、
次いで、構造相同性評価のための演算に必要な注目する化学結合部位の表記以外の不要な表記を省略した符号化立体配座表記を抽出し、
抽出した符号化立体配座表記をそれぞれ基準構造パターンとしてあらかじめ記憶部に記憶させ、
別途、解析対象化合物の立体配座構造の分子モデルの入力を受け付け、
前記処理部において、入力を受け付けた解析対象化合物の分子モデルに対して、
注目する化学結合部位に対応する二面角位置コードを表記すると共に、各二面角位置コードのそれぞれに、360度を12分割して定められた二面角分類コードを組み合わせて表記する符号化立体配座表記を施すことで、各分子モデルに関する立体配座を一義的に決定し、
次いで、構造相同性評価のための演算に必要な注目する化学結合部位の表記以外の不要な表記を省略した符号化立体配座表記を抽出し、
抽出した各符号化立体配座表記を記憶部に記憶させ、
前記処理部において、前記記憶部から前記解析対象化合物の符号化立体配座表記を取り出すと共に、あらかじめ記憶部に記憶させていた前記基準構造パターンのうちで、比較しようとする基準構造パターンを選択し、当該構造パターンに一致する前記符号化立体配座表記を比較対象の参照として取り出し、
対応関係にある二面角位置における最初の位置において、選択された二面角分類コードと共にその両側の二面角分類コードを抽出して、要素として連続して隣り合った3個の二面角分類コードを要素とする集合を作成し、
前記解析対象化合物及び参照となる構造パターン中の前記位置における集合の要素を対比させ、
各二面角分類コードが帰属する集合の要素のうちで少なくとも1個の要素が基準の構造パターンと共通しているという条件を満たすか否かを検索し、
満たす場合には、基準の構造パターンに一致するとして判定し、満たさない場合には、それ以外の構造パターンに該当すると判定する演算処理を行い、
続いて次の位置における同様の演算処理を行う操作を行い、全ての対応する位置についての操作を繰り返して完了したときに、出力部に送り、
前記出力部において、各二面角位置コードのそれぞれに対応させた揺れ許容評価を基準の構造パターンに一致するとして判定した場合には○、それ以外の構造パターンに該当すると判定した場合には×という符号を表示する、及び/又は全二面角位置コード数あたりの揺れ許容評価が○の割合を計算して揺れ許容相同性の価として表示することを特徴とする立体配座相同性評価装置。


【図1】
image rotate

【図2】
image rotate

【図4】
image rotate

【図3】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate

【図10】
image rotate

【図11】
image rotate

【図12】
image rotate

【図13】
image rotate

【図14】
image rotate

【図15】
image rotate

【図16】
image rotate

【図17】
image rotate

【図18】
image rotate

【図19】
image rotate

【図20】
image rotate

【図21】
image rotate

【図22】
image rotate

【図23】
image rotate

【図24】
image rotate

【図25】
image rotate

【図26】
image rotate

【図27】
image rotate

【図28】
image rotate

【図29】
image rotate


【公開番号】特開2011−193868(P2011−193868A)
【公開日】平成23年10月6日(2011.10.6)
【国際特許分類】
【出願番号】特願2010−116862(P2010−116862)
【出願日】平成22年5月21日(2010.5.21)
【新規性喪失の例外の表示】特許法第30条第1項適用申請有り 発行所名 (株)じほう 刊行物名 PHARM TECH JAPAN 12月号(第25巻14号) 発行日 平成21年12月1日
【出願人】(301021533)独立行政法人産業技術総合研究所 (6,529)
【Fターム(参考)】