独立下部構造分析を実行するためのコンピュータ・システムの操作方法

【課題】独立下部構造分析を実行するための方法の提供。
【解決手段】上記方法は、分子構造情報と、生物特性および／または化学特性とによって検索可能な分子構造のデータベース（110、115）にアクセスするステップ（210、220）；このデータベース内で、所定の生物特性・化学特性を有する分子群を同定するステップ（220）；この分子群の中で分子の断片を決定するステップ（230）；それぞれの断片について、上記所定の生物特性および／または化学特性に対する個々の断片の寄与を表わす点数を計算するステップ（230）、決定された断片と計算された点数を分析することにより（250）繰り返しプロセスを実行し（240、250）、上記の生物特性および／または化学特性への寄与が大きいことを示す点数を有する少なくとも1つの断片を選択し、次いで前記アクセスステップ、同定ステップ、決定ステップ、計算ステップを繰り返すことを含む。

【発明の詳細な説明】
【背景技術】
【０００１】
本発明は、独立下部構造分析を実行することのできるコンピュータ・システムと、その操作方法に関する。この分析により、生物活性および／または化学活性などの所定の特性を有する分子をコンピュータを用いて同定することが可能になる。コンピュータ制御された独立下部構造分析は、医薬品の発見に利用できるほか、生物活性、薬理活性、毒物活性、殺虫活性、除草活性、触媒活性などを持つ化合物を同定することが興味の対象であるような他の分野でも利用することができる。
【０００２】
例えば医療化学の分野における進歩は、生物活性のある分子を同定できるかどうかにかかっている。多くの場合、研究プログラムは、標的となる既知の酵素または受容体と相互作用することになる小さな有機分子を合成して望む薬理効果を生み出すことに向けられている。このような化合物の少なくとも一部は既知の天然物質の活性を真似ること、あるいは抑制することができるが、より強力な作用および／またはより選択性のある作用を提供することが目標とされている。このタイプの研究から生まれる化合物には、関係のある天然物質のある種の構造的特徴を組み込むことができる。
【０００３】
研究プログラムは、自然界で入手できる供給源（例えば土壌サンプルや植物抽出液）をスクリーニングした結果として見つかった天然化合物に基づいて構成することもできる。このようにして発見された活性化合物は、合成化学のプログラムを構成する上で有効なきっかけになる可能性がある。
【０００４】
近年、新しくて有効な生物活性分子を同定しようとする圧力が高まっており、その結果、リード化合物を生成する新しい方法が開発されている。この点に関し、コンビナトリアル化学とハイスループット・スクリーニング（HTS）の2つが特に重要である。
【０００５】
コンビナトリアル化学では、自動化技術または人手を利用して小さなスケールの化学反応を多数起こさせる。それぞれの化学反応では異なる組み合わせの試薬が同時に、すなわち“並行して”用いられ、スクリーニングのための多彩な化合物が生成する。この方法によって生成した化合物の集合は、“ライブラリ”として知られている。新規なリード化合物を生成するためのライブラリは、通常、可能な限り多様性のあるものになっている。しかし場合によっては、最終化合物に特別な構造特性を与えるための試薬を選択することにより、ライブラリを特定の薬理標的に合うように偏らせること、すなわち方向付けることや、特定の化学分野に焦点の合ったものにすることができる。
【０００６】
ハイスループット・スクリーニングでは、1つ以上の生物標的に対する多数の化合物のインビトロでの活性を迅速に調べるため、生化学アッセイが利用される。この方法は、コンビナトリアル化学で生成される大きな化合物ライブラリのスクリーニングには理想的である。
【０００７】
新しいリード構造を生成する上でコンビナトリアル化学とHTSが好ましいことは疑いがないが、これらの方法には欠点がいくつかある。バイアスのないコンビナトリアル・ライブラリ中の化合物の多くは、役に立つ活性を持たない。したがって役に立つリード化合物の発見は、偶然および／またはテストする化合物の数に依存している。的を絞ったライブラリは活性化合物の割合がより大きい可能性があるが、それも選択基準次第であり、最適化合物を得ることに失敗する可能性さえある。さらに、どちらの方法もかなりの設備と資金、ならびに実験能力を必要とする。
【０００８】
所定の化合物群の中から活性分子を発見できるチャンスまたは確率を大きくするには、テストする化合物の合計数（すなわち化合物群のサイズ）を大きくするか、あるいは同じ化合物群に含まれる活性化合物の割合を高めるとよい。活性分子の発見確率を大きくするには、テストする化合物の合計数を単に大きくするよりも1つの化合物群に含まれる活性化合物の割合を高めるほうが効果的であることがわかる。後者の方法だと、製造してテストする必要のある化合物の数を減らすことができるため、例えば生物活性分子の発見に必要な資源という点からしても好ましい。
【０００９】
医薬品設計問題への1つのアプローチとしての下部構造分析は、Richard D. Cramer III他、J. Med. Chem.、第17巻、553〜535ページ、1974年に開示されている。この論文には、ある分子の生物活性その他の特性は、その構造要素（下部構造）と、分子内相互作用および分子間相互作用からの寄与との組み合わせによって説明されるべきであることが記載されている。所定の下部構造が活性に寄与する確率は、この下部構造を含む化合物を以前にテストしたときのデータから得ることができる。第1段階は、入手可能なデータをまとめた下部構造“実験表”を用意することである。それぞれの下部構造について、その下部構造を含む化合物のうちでテストしたものの数に対してその下部構造を含む活性化合物の数がどれだけであったかを示す比の値として“下部構造活性頻度”（SAF）が定義される。SAFは、ある化合物が活性である確率へのその下部構造からの寄与を表わしていると言える。そこで、それぞれの化合物について、その化合物中に存在している下部構造のSAF値の算術平均を計算する。
【００１０】
この従来法によってSAF値をもとにして化合物をランク付けすることができるが、このような値を得るには、化合物中に存在している各下部構造のSAF値の算術平均を計算する必要がある。しかもこの計算に必要なSAF値は、テストした各分子の中に存在する下部構造の評価を含む計算をあらかじめ行なった結果である。したがってこの方法を用いるとかなりの計算コストがかかるため、現在入手可能で分子構造解析を行なうための情報源として利用できるような大きなデータ・セットには適用できない。それでおもこのクレーマー法では、ある下部構造が活性にどのように寄与しているかを実際に評価することはできない。
【００１１】
このようなわけで、化学構造の分析に関する分野には、さらに別の従来法が多数存在している。
【００１２】
EP 938 055Aには、化合物を“活性”にする構造特性の同定を、ハイスループット・スクリーニングで得られたデータをもとにして行なうことにより、構造と活性の定量的な関係を得る方法が記載されている。この方法は、生物活性化合物についての統計モデルを確立するために考案されたものである。この方法では、まず最初に、さまざまな化学的記述子を所定の化合物の集合と関係付け、次に、この化合物の集合の一部であって生物活性が既知の化合物群を用いてモデルを鍛え、新しい化合物が生物活性を有するかどうかを予測する。
【００１３】
SheridanとKearsley、J. Chem. Inf. Compt. Sci.、第35巻、310〜320ページ、1995年には、コンビナトリアル・ライブラリを構成する際に断片の集合を選択するにあたって遺伝アルゴリズムを用いる方法が記載されている。この方法は、類似プローブ法またはトレンド・ベクトル法のいずれかを用い、特別な記述子（例えば原子対やトポロジカルな捩じれ）に基づいて分子断片の集合から分子集団を生成し、各分子について点数を計算する操作を含んでいる。遺伝的アルゴリズムを利用してさらに別の集団を生成し、点数化する。その結果は、最高点の分子群中に存在する断片のリストになる。これら分子は、コンビナトリアル・ライブラリを構成するための基礎として使用できる。
【００１４】
WO 99/26901 A1には、分子などの化学物質を設計する方法が開示されている。1つの化合物は、1つの骨格と多数の結合部位からなる。この方法では、結合部位のための候補要素を選択し、予測用に設計したアレイPADを作り出すところから出発する。PADの一例は、所定のコンビナトリアル条件を満たす多数の仮想化合物である。次に、これら化合物を合成し、その生物活性をテストする。次に、あるアルゴリズムを実行し、合成しなかった化合物の全体的生物活性を予測する。この目的で、候補要素について、個々の候補要素がそれぞれ活性にどれくらい寄与しているかを表わす特性寄与値を計算する。さらに、特定の結合部位における各置換基が生物活性にどれくらい寄与するかの平均値を計算する。こうした寄与をどのように計算するかの一例を示すことにする。
【００１５】
H. Gao他、J. Chem. Inf. Comput. Sci.、第39巻、164〜168ページ、1999年は、医薬品を発見するという問題にQSAR（構造−活性定量関係）法を適用することを記載した論文である。生物活性のある化合物を選択した後、その生物活性を最適化する。QSARは生物活性と分子構造の間の関係についての仮説に基づいているので、この方法は、化合物を活性にする構造特性を明らかにして活性な類似体と不活性な類似体を予測することに関する。
【００１６】
WO 00/41060 A1には、物質の活性を物質の構造特性と関係付ける方法が開示されている。“特性”という用語は、あるパターンと一致する構造を有する分子および結合と関係している。第1段階では、一群の物質の中から、所定の構造特性と特性の制約を満足する物質を明らかにする。この物質群を活性に応じていくつかのグループに分けた後、各グループについて予想される活性を計算する。そして構造特性ごとに、活性−特性ビット・ベクトルの集合を作る。このベクトルは、所定の構造特性を持っていて所定の活性グループに含まれる物質の数を表わしている。この文献は、生物活性に関係があり、さらに医薬品の発見にも関係している。
【００１７】
アメリカ合衆国特許第6,185,506号B1には、多様性が最適化された小分子のライブラリを、有効性が確認された分子構造記述子に基づいて選択する方法が開示されている。さまざまな化学構造とそれに付随する活性が記載されたデータを多数の文献から取り出して利用する。活性は、生物活性でも化学活性でもよい。この方法は、医薬品の文脈で説明されている。さらに、特別な反応分子と一般的なコア分子からコンビナトリアル合成で製造することのできる可能なあらゆる製品分子について、製品分子の一部を選択する方法が開示されている。背景技術を記述している部分では、生物学的に特異なライブラリに言及されている。このライブラリは、活性を有することがわかっている分子構造体から抽出した構造断片の幾何学的配置に関する知見をもとに設計されたものである。合理的に設計されたより小さなスクリーニング用ライブラリのうち、コンビナトリアル法で製造可能な化合物の多様性を相変わらず維持しているものを使用することが絶対に必要であることが述べられている。
【００１８】
WO 00/49539 A1には、分子群をスクリーニングし、分子の特徴のうちで特定の活性と関係している可能性のある一群の特徴を同定する方法が開示されている。特徴という用語は、化学的下部構造と関係している。分子群を、一群の記述子で特徴づけられる分子構造に従って分類する。次に、活性の大きなグループがどれであるかを明らかにし、そのグループ内の分子から、観察された活性レベルと関係していると考えるのが合理的である最も一般的な下部構造を見つけ出す。共通した特徴を含む分子からなるデータ・セットが、最初のデータ・セットから得られる。この方法は、データ・セットを自動解析するための、コンピュータに基づいたシステムの形態で記述されている。
【００１９】
アメリカ合衆国特許第5,463,564号には、複数の化合物を自動的に合成し、分析することによって多数の化合物を自動的に生成するのをコンピュータを利用して行なう方法が開示されている。この方法は繰り返して実行されるもので、所定の活性を有する化合物群を生成することを目的としている。複数の化合物が含まれる、目的が明確で多様性を持った化合物ライブラリが合成される。構造−活性データは、合成された化合物を自動的に分析することによって得られる。各化合物に割り当てた評価因子を示すフィールドを含むデータベースが多数開示されている。評価因子は、それぞれの化合物について、その化合物の活性が望む活性にどれだけ近いかに基づいて決める。
【００２０】
上記の方法はどれも“予測”モデルであり、活性のあるリード化合物の生成率を十分に向上させることや、所定の化合物群の中で活性化合物を発見する確率を大きくすることがまだできない。さらに、こうした従来法は、開発工程に入れるようなヒット化合物やリード化合物となる分子の数を増やすとともにそのような分子の質も高めたいという要求に応えることができない。
【００２１】
したがって本発明の目的は、生物活性および／または化学活性のある新しい分子を発見する機会を増大させることのできるコンピュータ・システムの操作方法と、対応するコンピュータ・システムを提供することである。
【００２２】
この目的は、独立項において主張したように、本発明によって解決される。
【００２３】
好ましい実施態様は従属項に示す。
【００２４】
本発明の1つの利点は、望む活性を持つことがまだ知られていない所定の化合物群に含まれる活性化合物の割合を高めることのできるコンピュータ・システムとその操作方法が提供されることである。これは、知識ベースの方法を適用し、中でもコンピュータで分子を発見するシステムを構築し、新規なヒットや一連のリード化合物を同定することによって実現される。
【００２５】
本発明の別の利点は、分子構造と生物特性および／または化学特性によって検索可能なデータベースを分析することによって費用のかかる実験を回避できることである。したがって本発明による発見プロセスは合理化できるため、従来よりも費用をかけずに医薬品を発見できることになる。
【００２６】
また、本発明により発見プロセスを短縮できるため、望む所定の特性を有する分子を従来法よりも短い時間で同定することができる。
【００２７】
また、本発明は生化学の分野で特に有効である。これまでに、DNAシークエンシング、中でもゲノム・シークエンシングにより、アミノ酸配列の総合的なデータベースが得られている。それを出発点として利用し、本発明を実行することができる。したがって本発明では、生物活性のある化学的決定基を探すために分析した構造リストを用いて得られる結果に基づいてペプチド配列を予測することにより、既知のリガンドおよび／またはオーファン・リガンドおよび／またはオーファン・リガンド−受容体ペアを同定することができる。ペプチド配列は、データベース内で該当するものを探し出し、発現させた後、生化学アッセイによりテストすることができる。したがって本発明では、好ましいことに、所定の標的に対する活性がすでに明らかになっている化学分子のリストと比較することによって生物学的構造を導出することができる。したがって本発明は1つの同定（バックシークエンシング）法となる。
【００２８】
添付の図面を参照し、これから本発明をさらに詳しく説明する。
【００２９】
これから本発明をさらに詳しく説明する。それに加え、本発明の好ましい実施態様も添付の図面を参照して説明する。さらに、本発明を化合物の発見に関する多くの分野にどのように適用できるかを示す多数の実施例も提示する。
【００３０】
本発明によれば、コンピュータ・システムを操作して独立下部構造分析を実行する。分子構造データベースにアクセスする。このデータベースは、分子情報および／または化学特性によって検索することが可能である。分子構造情報とは、ある分子の分子構造を決定するのに適したあらゆる情報である。生物特性および／または化学特性としては、生化学特性、薬理特性、毒物特性、殺虫特性、除草特性、触媒特性などが挙げられる。
【００３１】
本発明の方法では、データベースを用い、所定の生物特性および／または化学特性を有する分子群を同定する。次に、この分子群の中から分子の断片を決定する。“断片”という用語は分子を構成する任意のサブユニットと関係しており、その中には、簡単な官能基、二次元下部構造とそのファミリー、簡単な原子または結合が含まれるほか、二次元または三次元の分子空間内における構造記述子の任意の集合も含まれる。当業者であれば、断片が、従来の化学では意味が知られていない分子下部構造であってもよいことが理解できよう。
【００３２】
分子群に存在する分子構造を断片に分解した後、それぞれの断片について、所定の生物特性および／または化学特性への各断片の寄与を示す点数を計算する。すなわち本発明により、分子の生物特性および／または化学特性に関する既知の知見に基づいて断片に点数を割り当てることができる。以下の説明では、分子、構造、下部構造は、所定の性質を有するときに“活性である”と言う。活性でない分子、構造、下部構造は、“不活性である”と言われる。したがって、本発明により、生物特性および／または化学特性に関する独立した情報に基づいて下部構造分析がなされる。そこで本発明の主要プロセスを今後は独立下部構造分析（DSA）と呼ぶことにする。
【００３３】
本発明によると断片には所定の生物特性および／または化学特性への寄与を示す点数が付随しているため、断片は、所定の生物特性および／または化学特性にとって重要な化学的決定基と見なすことができる。断片の同定は、DSAプロセスそのものに固有の一連の論理的な規則（アルゴリズム）に従ってなされる。この場合、点数は、
（a）活性分子群における化学的決定基の割合と、
（b）対象とする化合物リスト全体におけるこの化学的決定基の割合
の関数となる。
【００３４】
次に、この定義に基づき、本発明の方法により、点数化関数の1つ以上の極値を明らかにする。これら極値に対応する化学的決定基は、望む生物特性に対する全体的または部分的な化学的解を表わしている。与えられたデータ・セット内で点数化関数が到達可能な最大値を求めることは、最も生物活性の大きな分子からなる分子群に含まれる化学的決定基を同定することと等価である。なお、この化学的決定基がこの分子群の中に偶然に存在する確率はほとんどゼロである。
【００３５】
これから、図面、中でも図1を参照して本発明を説明する。図1は、本発明によるコンピュータ・システムの好ましい一実施態様を示している。このコンピュータ・システムは、ユーザー・インターフェイス105によって制御される中央処理ユニット100を備えている。中央処理ユニット100およびユーザー・インターフェイス105としては任意のコンピュータ・システムが可能であり、具体的にはワークステーションやパーソナル・コンピュータが挙げられる。このコンピュータ・システムは、マルチタスク・オペレーティング・システムが走っているマイクロプロセッサ・システムであることが好ましい。
【００３６】
中央処理ユニット100は、プログラム記憶装置130に接続されている。このプログラム記憶装置130には、本発明に従ってDSAプロセスを実行するための命令群を含む実行可能なプログラム・コードを記憶させてある。これら命令群に含まれているのは、分子構造を断片へと分解する断片化関数135、点数を計算するための点数化関数140、一般化可能なアイテムを断片構造の中に配置してこれらアイテムを一般化された表現で置換することにより一般的な下部構造を生成するための一般化関数145（例えば異性体を探し出す）、仮想的なスクリーニングを実行する仮想的スクリーニング関数150、本発明の断片アニーリング法を実行するアニーリング関数155である。個々の関数と、これら関数を実行する際に中央処理ユニット100によって駆動されるプロセッサについては、あとで詳しく説明する。
【００３７】
中央処理ユニット100はさらに、分子構造や生物特性および／または化学特性に関する情報を検索するための構造−活性データベースまたは化合物活性リスト115に接続されている。この情報は、外部データ源へのアクセスを可能にするデータ入力ユニット110から受け取ることもできる。
【００３８】
データ入力ユニット110および／または化合物活性リスト115にアクセスすることにより、構造および／または生物特性によって検索できる利用可能な任意の情報源（例えば私有または公共のデータベース）から分子構造の集合を得ることができる。公共データベースとしては、MDDR、ファルマプロジェクト、メルク・インデックス、SciFinder、ダーウェントの名称のものがあるが、これがすべてではない。分子群は、化合物を合成してテストすることによっても得られる。分子は、一般に完全な化合物を含んでいるが、分子断片であってもよい。所定の任意の生物特性または化学特性に関し、分子群は、その特性を持たない化合物（例えば、活性のない（あるいは活性が所定の閾値以下の）化合物）と、その特性を持つ化合物（例えば、望む活性を有する（すなわち活性が所定の閾値を超える）化合物）を含んでいる。活性のないすべての化合物が問題であり、したがって分析を行なう。
【００３９】
中央処理ユニット100は、内部データまたは外部データにアクセスし、プログラム記憶装置130に記憶されている関数を用いてDSAプロセスを実行した後、分子の決定された断片とそれに付随する点数を含む断片ライブラリ120を記憶させる。
【００４０】
本発明の好ましい一実施態様では、断片ライブラリ120は、本発明の主要プロセスを実行した結果として得られる。すると、例えば化学者、生物学者、エンジニアは、断片ライブラリ120を貴重な情報源として使用し、何らかの発見プロセスに役立てることができるようになる。
【００４１】
別の好ましい実施態様では、断片ライブラリ120は本発明の主要プロセスの中間結果であるため、揮発性メモリと不揮発性メモリに記憶させるとよい。中央処理ユニット100は、この実施態様の断片ライブラリ120を読んでプログラム記憶装置130に記憶されているさらに別の関数を実行し、化合物の集合125を生成することができる。
【００４２】
化合物の集合125は、本発明の方法によって望む生物特性および／または化学特性を有するかどうかが明らかにされた分子の集合である。化合物の集合125の分子は、すでに知られているものでも、以前に合成されたことのない仮想的な構造のものでもよい。いずれの場合も、化合物の集合125の分子は、独立下部構造分析によって断片に与えられた点数を評価した結果である。
【００４３】
図1からわかるように、中央処理ユニット100はさらにデータ用メモリ160にも接続されている。このデータ用メモリ160には、化合物群165、断片群170、点数175が記憶されている。データ用メモリ160は、関数135〜155を呼び出すときの入力パラメータを記憶させておくためのデータ、またはこれら関数の値を記憶させておくためのデータの記憶用に設けてある。
【００４４】
ここでDSAの主要プロセスの好ましい実施態様を示した図2を参照すると、図1のコンピュータ・システムの操作者は、まず最初にステップ210で活性を1つ選択することがわかる。すでに説明したように、活性とは生物特性および／または化学特性のことであり、その中に生化学特性、薬理特性、毒物特性、殺虫特性、除草特性、触媒特性が含まれる。さらに、本発明を利用してオーファン・リガンドを同定する場合には、活性は、興味の対象であるタンパク質に対する所定の効果（一般的には結合）であってもよい。
【００４５】
この明細書では、特定の特性（例えば生物活性）について述べたことは、特に断わらない限り、他のタイプの生物特性および／または化学特性にも拡張して適用することができる。さらに、疑問を避けるため述べておくと、“化合物”、“分子”、“分子構造”というどの用語にも、文脈に応じて分子下部構造と完全な化合物が含まれる。
【００４６】
ステップ210で活性を1つ選択した後、ステップ220で化合物の集合125を選択する。選択した化合物の集合は、どの断片が選択した活性に寄与するかを調べるための分子群である。あとで詳しく説明するように、ステップ220で選択した化合物の集合は、活性であることが知られている分子と、不活性であることが知られている分子を含んでいる。
【００４７】
活性と化合物の集合を選択した後、ステップ230で断片ライブラリ120を生成する。断片ライブラリの生成プロセスは、既知の構造からなる集合の中で分子断片が化学特性および／または生物特性に及ぼす効果に重みを付けるプロセスとして記述することができる。このプロセスは、以下のステップを含むことができる。
I．興味の対象である化学特性および／または生物特性と関係した所定の特性を有する1つ以上の分子群を同定するステップと；
II．上記の1つ以上の分子群に存在する分子の断片を含む予備ライブラリを生成するステップと；
III．興味の対象である化学特性および／または生物特性に関するこれら断片の寄与を評価するためのアルゴリズムを適用するステップと；
IV．このアルゴリズムを適用した個々の断片に関する点数を取得するステップ。この点数は、大きさの順番にランク付けることができる。こうすることにより、興味の対象である化学特性および／または生物特性に最も寄与していると思われる断片を、例えば上位ランクの点数と関係付ける。
【００４８】
すでに説明したように、断片ライブラリ120は、断片と、その断片に関して得られた点数を含んでいる。ステップ230で断片ライブラリ120が生成すると、ステップ240で繰り返しを実行するかしないかを判断する。
【００４９】
DSAプロセスを繰り返すことにより、コンピュータ資源を非常に効率的に利用することができる。例えば、このプロセスは小さな断片から始まることが好ましい。分子構造内において可能な断片の数は、調べる断片の最大サイズが大きくなるにつれてほぼ指数関数的に大きくなるため、この最大サイズは、最初は比較的小さな値に設定し、非常に多数の分子構造であっても処理できるようにする。
【００５０】
ステップ210〜230により、望む活性に大きく寄与する断片が明らかになる。次に、明らかになった断片を次のラウンド（またはサイクル）で用いてより大きなサイズ（すなわち分子量がより大きな）の断片を見つけ出す。繰り返しプロセスの一例を図3に示してある。第1ラウンドでは、断片C=Oが望む活性に大きく寄与することが見い出された。次に、この断片を用い、この断片を含んでいて、しかも第1ラウンドで得られたよりも大きなサイズの断片を探す。図3の実施例では、望む活性に関して断片N-C=Oが第2ラウンドにおけるこのサイズでの最高の断片であることが示してある。この繰り返しプロセスを継続することによって断片のサイズを大きくする。すると、望む生物特性および／または化学特性をおそらく持っていて望みの用途に適した化合物が得られる可能性がある。
【００５１】
ここで再び図2に戻ると、ステップ240で次のラウンドまたはサイクルを実行することにした場合には、ステップ230で生成した断片ライブラリ120をステップ250で分析した後、ステップ220に戻る。ステップ250で断片ライブラリ120をいかにして分析するかの具体例は、あとで詳しく説明する。繰り返しプロセスにより、一般化関数145やアニーリング関数155などの高等な関数を適用して独立下部構造分析を利用した発見プロセスをさらに改善できることが理解されよう。
【００５２】
最後に、ステップ240で繰り返しを行なわないことにした場合には、あるいは繰り返しプロセスが終点に来た場合には、ステップ260で化合物の集合125を生成する。
【００５３】
ここで断片ライブラリ120を生成するステップ230に戻り、図4〜図6を参照してこの生成プロセスのサブステップの好ましい一実施態様について説明することにする。まず最初に、内部データベース115および／または外部データ源にアクセスして分子群を同定した後、同定した分子に関する構造−活性データをステップ410で受け取る。次に、ステップ420でこの分子群に含まれる分子の断片を決定する。
【００５４】
分子は、多数ある従来法を利用して断片化することができる。例えば、1つのアルゴリズムを用い、互いに結合する原子の組み合わせをすべて見つけ出すことができる。断片化関数135では、断片の最小サイズと最大サイズを利用することができる。別の例を挙げると、断片化アルゴリズムに対し、原子が直線状に並んだ構成の断片を省く指示を与えることができる。さらに、アルゴリズムに対し、ある種の結合を含める、あるいは除外するという制約を与えることもできる。当業者が容易に利用できる断片化関数には異なった多数の適用法が存在しているであろう。
【００５５】
つまりそれぞれの分子構造は、頭の中で一連の独立した下部構造または断片にすることができる（ステップ420）。断片として可能なのは、単純な官能基（例えばNO₂、COOH、CHO、CONH₂）；厳密に2Dの下部構造（例えばo-ニトロフェノール）；定義が厳密にはなされてない下部構造ファミリー（例えばR-OH）；単純な原子または結合；2Dまたは3D化学空間内の構造記述子の任意の集合である。
【００５６】
ステップ420で分子を断片にした後、ステップ430においてそれぞれの断片について点数を計算し、その計算値を断片と関係付けることにより、断片の点数を得る。次に、ステップ440で最高点の断片群を明らかにし、ステップ450でその断片群を記憶させる。
【００５７】
最高点の断片群を決定する方法を図5に示してある。この例では、得られた点数を、それぞれの断片を含む化合物の番号に対してプロットしてある。このグラフでは、それぞれの断片を1つの点で表わしてある。ステップ440でこのグラフを利用すると、点数を比較して単純に最高点の断片群を選択するよりも多くの情報が得られる。というのもこのグラフでは、それぞれの断片を含む化合物の番号に関する情報も合わせて利用しているからである。
【００５８】
可能な最高点を見つけるプロセスは、所定の生物活性および／または化学特性に対応したヒエラルキー型分子断片からなる系統発生メッシュを生成することと等価であると見なすことができる。この設定では、メッシュの節点に断片そのものを供給する。任意の1つの断片が生物活性の基礎になっている確率は、原点（すなわちメッシュそのもののベース）から対応する節点までの距離で与えられる。したがって、断片の点数が大きくなるほど、対応する節点が格子の原点から離れ、その断片が、例えば興味の対象である標的によって認識される医薬部分に対する化学的解を表わす確率が高くなる。
【００５９】
ここで図6を参照し、断片の点数を決めるステップ430についてさらに詳しく説明する。点数化関数140を適用することは、上記の一群の論理的規則、または計算ステップに対応している。本発明のDSA法は、好ましい一実施態様では、各断片の占有率に関係した変数を、任意の断片について点数を評価するための1つ以上の数学的関数に組み込むステップを含んでいる。
【００６０】
このアルゴリズムは、
（a）1つの分子群の中で、望む特性に関して所定の閾値に合致し、しかも所定の断片を含んでいる分子の数x；
（b）この分子群の中で、上記断片を含んでいるが、上記閾値に合致していてもいなくてもよい分子の数y；
（c）この分子群の中で、上記閾値に合致しているが、上記断片を含んでいてもいなくてもよい分子の数z；
（d）この集団内の全分子数N
の関数になっている。
【００６１】
（a）に記載のある特性としては、化合物の活性に関係した望む任意のパラメータが可能であり、例えば、生物活性、生化学活性、薬理活性、毒物活性などのうちのいずれか、またはこれらの任意の組み合わせが挙げられる。データ・セット内のそれぞれの化合物または分子を、望むパラメータが所定の閾値（例えば活性が特定のレベルにあること）にあるかどうかを基準にして分析する。閾値は、望む任意のレベルに設定することができる。以下の説明では、“活性”化合物は望む閾値に合致している化合物であり、“不活性”化合物はこの閾値に合致していない化合物である。これらの用語は、問題にしている化合物の何らかの絶対的な特性を表現するものではない。
【００６２】
1つの断片の寄与は、変数x、y、z、Nに対して関連性指標または点数化関数140を適用することによって明らかにすることができる。当業者にはよく知られているように、可能な多数の関連性指標が存在している。関連性指標は、以下のような主に3つのカテゴリーに分類される：
減算指標：例えば、 Nx-yz；
比指標：例えば、 x(N-y-z-x)/(z-x)(y-x)；
混合指標：例えば、 (x/z)-(z-x)/(N-z)。
【００６３】
関連性指標は任意のものを選択できること、また、当業者であれば適切な選択を容易にできることが理解できよう。
【００６４】
したがってステップ430で適用するアルゴリズムは、以下のステップを含んでいる（図6を参照のこと）。
（i）化合物群の中で、興味の対象である化学特性または生物特性に関して所定の閾値に合致し、しかも所定の化学的決定基を含んでいる化合物の数xを評価するステップ（ステップ610）；
（ii）この化合物群の中で、上記化学的決定基を含んでいるが、上記閾値に合致していてもいなくてもよい化合物の数yを評価するステップ（ステップ620）；
（iii）この化合物群の中で、上記閾値に合致しているが、上記化学的決定基は含んでいてもいなくてもよい化合物の数zを評価するステップ（ステップ630）；
（iv）この化合物群の中にある化合物の総数Nを評価するステップ（ステップ640）；
（v）関連性指標を、変数x、y、z、Nのうちの2つ以上に対して適用するステップ（ステップ650）。しかし好ましいのは3つまたは4つの変数に対して適用することであり、最も好ましいのは、4つの変数x、y、z、Nすべてに対して適用することである。
【００６５】
所定の断片からの寄与に対応する点数を決定する際に、関連性指標を直接適用することができる。しかし関連性指標を点数化関数へと発展させ、下部構造が特性に寄与する確率を評価できるようにすることが好ましい。こうすることにより、分析する断片全体について得られた点数のランク付けがより明確になる。関連性指標は、従来技術で周知の方法により点数化関数へと発展させることができる。その方法は、例えば、限界比法（z）；フィッシャーの直接法、ピアソンのカイ二乗法；マンテル・ヘンツェルのカイ二乗法；勾配に関する推論に基づく方法といった統計的方法の中から容易に選択することができる。しかし統計的検定以外の方法を利用することもできる。そのような方法として、正確な信頼区間を計算して比較する方法、大まかな信頼区間を計算して比較する方法、相関係数を計算して比較する方法、上記の変数x、y、z、Nのうちの1〜4個の任意の組み合わせからなる関連性指標を含む任意の関数を計算して比較する方法などが挙げられる。
【００６６】
関連性指標または点数化関数を表わす数式のうちで本発明において利用可能なものとして、以下のものが挙げられる。
【数１】

【００６７】
当業者であれば、点数化関数（VII）が、この式には明示されていない2つの二値変数の間に共通する分散の程度を反映する積率相関係数であることがわかるであろう。
【００６８】
当業者であれば、点数化関数（VIII）が、2つの二値変数の間に存在する分散の程度を表わす回帰直線の勾配を用いたリスク・オッズ比の評価と関係していることがわかるであろう。
【００６９】
当業者であれば、点数化関数（IX）が、さまざまな混合因子用に変更した、カイ二乗と関係した統計であることがわかるであろう。例えば対数スケールにした積の2番目の商の分子にあるN/2は、正規分布近似を二項分布に合わせるための調整項である。これは、比較的小さな値のx、y、z、Nを取り扱うのに有効な変更である。当業者であれば、式（I）、（II）で表現した関連性指標および／または点数化関数と同じ目的を実現するのに代わりのものを使用できることがわかるであろう。本発明の意味でこれらの式でにおいて最も重要なのは、変数x、y、z、Nのうちの1、2、3、4つをさまざまに組み合わせたものが含まれることである。
【００７０】
当業者であれば、点数化関数（X）が、指標（III）の95％信頼区間の下限値を評価するための方法であることがわかるであろう。この評価を行なうため、対数変換を利用して比の分布が正規分布により近くなるようにするとともに、テイラー級数近似の一次のオーダーを利用し、その比の対数の分散を評価している。
【００７１】
当業者であれば、点数化関数（XI）が、オッズ比を比較する方法であることがわかるであろう。この比較により、ある標的において、別の標的におけるよりも非常に選択されやすい化学的決定基を同定することができる。
【００７２】
当業者であれば、点数化関数（XII）が、関連性指標に関する複数の検定を組み合わせた方法であることがわかるであろう。この方法により、同時に2つ以上の所定の特性に及ぼす効果が最も大きいと思われる化学的決定基を同定することができる。
【００７３】
当業者であれば、点数化関数を変更し、分子の材料に関係した変数や、生物特性および／または化学特性および／または物理化学特性に関係した変数がさらに含まれるようにできることがわかるであろう。そのような変更としては、例えば、化合物の力価、選択性、毒性、生体利用性、安定性（代謝安定性または化学的安定性）、合成可能性、純度、市場での入手可能性、合成用の適切な試薬の入手可能性、コスト、分子量、モル屈折性、モル体積、LogP（計算値または測定値）、水素結合を受け入れる基の数、水素結合を供与する基の数、電荷（部分的電荷または見かけ電荷）、プロトン化定数、追加の化学的キーまたは化学的記述子を含む分子の数、回転可能な結合の数、たわみ指数、分子形状指数、並び方の類似性、重なった体積などが挙げられる。
【００７４】
したがって、例えば点数化関数（VIII）をさらに以下のように変更し、対象とするそれぞれの化学的決定基の分子量（MW）が考慮されるようにすることができる。
【数２】

【００７５】
同様に、生物活性ができるだけ大きな化学的決定基を分析中に1つだけ同定するため、点数化関数（IX）を以下のように変更し、変数MWと[S]が含まれるようにすることができる。なお、MWは、対象とする化学的決定基の分子量を表わしており、[S]は、その化学的決定基が活性化合物xの集合内に現われる回数を表わしている。
【数３】

【００７６】
アルゴリズムのステップ650からは、対象とする断片の点数が得られる。アルゴリズムのステップ610〜650は、データ中の選択された断片それぞれについて繰り返すことができる。選択されたすべての断片について点数が計算されると、その結果は、分析した各断片の潜在的な性能に対応する点数になっている。この点数は、大きさの順にランク付けすることができる。すると、興味の対象である化学特性および／または生物特性に最も寄与する断片が、例えば大きな点数と関係付けられる。そのため、ステップ440において点数化関数の数値の極値を1つ以上同定することが可能になる。その極値に対応する化学的決定基が、望む化学特性または生物特性に対する全体的または部分的な化学的解を表わすことになる。任意のデータ・セット内で実現可能な最高点を見い出すことは、望む特性を有する分子群の中に含まれる化学的決定基を同定することと等価である（この化学的決定基がこの分子群の中に偶然に存在する確率はほとんどゼロである）。望む特性が所定の生物活性である場合には、最高点の断片または化学的決定基が、生物活性のある医薬部分を表わす。
【００７７】
ここで図2に戻り、断片ライブラリ120を分析するステップ250の好ましい実施態様をこれから説明する。
【００７８】
断片ライブラリ120を分析するための1つの方法を図7に示してある。前のラウンドで決定された点数に基づいて断片を選択するステップ710からスタートする。次に、ステップ720において、選択された断片を含む前の分子群から化合物を抽出する。ステップ710では望む活性への寄与が大きな断片が選択されたので、ステップ720で抽出される化合物は活性化合物であると見なすことができる。次のステップ730においては、不活性な化合物群を、前の分子群から、あるいはデータベースやそれ以外の供給源から選択する。次に、活性化合物と不活性化合物をステップ740において合体させ、新しい化合物群を形成する。この新しい化合物群は、ステップ220において、次のラウンドに進んで繰り返しを行なうための化合物群として選択される。
【００７９】
ここで図8を参照し、ステップ730を実行する好ましい一実施態様について説明する。この実施態様では、次のラウンド用に新しい化合物群を選択するのに、一般的な下部構造を用いる。
【００８０】
図8に示したプロセスは、ステップ710で選択した断片の構造を分析するステップ810からスタートする。本発明の一般的な特徴を利用すると、ステップ710で選択する断片は、前のラウンドで計算した点数を評価することによって選択することができる。さらに、断片の選択は、断片が一般化のための出発点として適切であるかどうかに影響を与える別の因子に依存するようにすることができる。この適切さは、原子または結合の数の関数、原子がどのように結合しているかの関数、それぞれの断片の三次元構造の関数などになる可能性がある。
【００８１】
選択した断片の構造をステップ810で分析した後、ステップ820において、一般化されたアイテムを断片構造内に位置させる。このアイテムは、ステップ830において一般化された表現で置き換えられ、その結果として一般的な下部構造（例えば生体等電子体を発見するため）が得られる。その一例は以下のようなものである。
【化１】

ここでは、選択された断片の中に一般化された2つのアイテムが存在しており、それが一般的な表現[Ar]とAで置き換えられる（[Ar]は芳香族環を表わし、AはCまたはSを表わす）。
【００８２】
次に、ステップ830で生成した一般的な下部構造を用いて仮想的スクリーニングを行ない、この一般的な下部構造に合致する新しい化合物を発見する。“仮想的スクリーニング”という用語は、データのみを用いてスクリーニングを行なうことにより、化合物を合成せねばならない状況を回避するあらゆるスクリーニング・プロセスを意味する。次に、ステップ850において、仮想的スクリーニングによって明らかになった新しい化合物を用い、次の繰り返しラウンドで使用することのできる新しい化合物群を構成する。
【００８３】
図9からわかるように、仮想的スクリーニング・プロセスは、一般的な下部構造を利用することによる断片の内部領域の修飾と外部領域の修飾に分けることができる。ステップ910で実行される内部領域の修飾には、断片を構成する原子の置換、挿入、欠失、転位が含まれる。上に説明した具体的な断片から出発し、この断片を一般的な下部構造へと一般化すると、以下のような3つの異なった置換体が得られる。
【化２】

【００８４】
ステップ920で実行する領域外修飾は、断片の置換体を変化させることからなる。そうした変化としては、ランダムな変化、目的が明確な変化などが可能である。
【化３】

【００８５】
目的が明確な化合物群は、一般的な下部構造を1つ以上修飾することによって得られる分子の集合である。
【化４】

【００８６】
図9では内部領域の修飾を実行するステップと外部領域の修飾を実行するステップを連続して実行するようにしてあるが、当業者であれば、これらの異なるタイプの修飾のうちの一方だけを実行すること、あるいは両方を別々に実行することや、両方を並行して実行することさえ本発明の範囲に含まれることが理解できよう。仮想的スクリーニングの結果は、活性である可能性の高い多様な化合物の集合であることを理解する必要がある。というのも、これら化合物は、活性と関係した下部構造を豊富に含んでいるからである。
【００８７】
ステップ710では、一般化関数145を適用して一般的な下部構造を得るための基礎となる断片を選択するが、大きな点数の断片をより多く選択して一般的な下部構造を生成する、というのも別の好ましい実施態様である。例えば以下の断片は、望む活性への寄与が大きいことがわかっているもので、ステップ710で選択することができる。
【化５】

【００８８】
次に、選択されたこれら断片は以下のように還元され、大きな点数の一般的な下部構造になる。
【化６】

【００８９】
次に、一般的な下部構造を用い、市販のデータベースまたは私企業の化合物の集合に対する仮想的スクリーニングを行なう。
【化７】

【００９０】
計算上の理由で繰り返しプロセスが好ましい（というのも、小さな断片からスタートして断片のサイズをラウンドごとに大きくするのが有効であるから）と説明するとともに、発見能力は繰り返しプロセスにおいて一般的な性質を用いると大きくできることを示したが、本発明の独立下部構造分析法をさらに改善するためのさらに別の方法が本発明には存在している。このさらに別の方法はアニーリング技術に基づいているものであり、それを図10を参照してこれから説明する。
【００９１】
図10に示した好ましい実施態様では、前のラウンドで生成した断片ライブラリを分析するステップ250は、第1の断片を選択するステップ1010および第2の断片を選択するステップ1020からスタートする。どちらの断片も計算された点数に基づいて選択され、寄与の大きな断片であると見なすことができる。
【００９２】
次のステップ1030では、第1の断片と第2の断片を接続するアニーリング関数155を適用する。断片を接続するとは、両方の断片を含む分子構造または分子下部構造を明確にすることを意味する。この目的で、多数の異なるアニーリング関数155を用いることができる。これらアニーリング関数は、いくつかのアニーリング・パラメータをどのようにして評価し、使用するかの具体的な方法が異なっている。アニーリング・パラメータを具体的に挙げるならば、第1の断片と第2の断片の（あらかじめ決められた）距離、第1の断片と第2の断片の三次元空間内での方向、断片間に挟まれる原子の数、断片同士を接着するのに用いられる結合の数、結合および原子の種類などである。
【００９３】
さらに、アニーリング法は、すでに説明した一般的な特徴と組み合わせることが好ましい。例えばステップ1010と1020で大きな点数であることがわかっている断片F1とF2を選択する場合には、ステップ1030で選択してステップ1040で走らせるアニーリング関数では、断片を接続するための一般的な表現として以下のような表現を用いることができよう。
F1-[G]-F2
一般的な表現[G]は、所定の特性およびアニーリング・パラメータを有する分子下部構造と同じ意味であり、使用するアニーリング関数に依存している。
【００９４】
具体的な表現または一般的な表現によって断片同士が接続されると、両方の断片を含む新しい化合物群がステップ1040で生成される。新しい化合物群の分子の一例を図11に示してある。これは二次元の相対寄与マップであり、局所的な配位結合に関する相対的寄与を示している。この図11からわかるように、断片F1とF2のおおまかな点数1.2と1.7に対応する2つの極大値が存在している。
【００９５】
アニーリング法は、2つの理由で好ましい。第1の利点は、望む活性への寄与が大きな2つの断片を接続することで、大きな点数の2つ以上の断片が含まれたさらに大きな分子が得られることである。したがって得られる構造は、2つの断片の最高点よりも大きな点数になる可能性が大きい。
【００９６】
例えば図11に示した構造では、得られる化合物は、点数が1.2と1.7の断片を含んでいるが、全体構造の合計点数は例えば2.1になる可能性がある。したがってアニーリング法により、活性のより大きな化合物を発見することができる。
【００９７】
第2の利点は、アニーリング法により計算プロセスにおけるデッドロックを回避できることである。図11からわかるように、相対寄与値は、2つの極大値を示している。小さな断片から出発し、それぞれの繰り返しにおいてラウンドごとに断片のサイズを大きくするという図3に示した繰り返しプロセスを実行する場合には、選択された断片が中間ステップの1つにおいて極大値のところに位置していると、デッドロックが発生する可能性がある。
【００９８】
例えば第2ラウンドの終わりに断片N-C=Oを選択してこの断片を極大値に位置させると、次のラウンドはうまくいかないであろう。すでに説明したように、次のラウンドの断片は、前のラウンドの選択された断片をもとにして断片のサイズを段階的に大きくすることによって構成することが好ましい。したがって、選択された断片にどのような原子が付加されても、次のラウンドではその断片が極大値からずれるであろう。つまりこの場合には、得られる断片はすべて、前のラウンドの選択された断片よりも小さな点数になる。
【００９９】
このデッドロックを避けるには、アニーリング法を適用して好ましい2つの断片を前のラウンドで選択し、これら断片を接続し、点数を計算してプロセスを継続するとよい。これは、ラウンドごとに定期的に行なうことや、デッドロックが検出されたときに行なうことができる。
【０１００】
多数の好ましい実施態様を用いて本発明を説明してきたが、当業者であれば、本発明がこれら実施態様に限定されないことが理解できよう。例えばフローチャートに示したステップの順番は変更可能であるし、順番に実行するように示してあるステップを並列して実行することさえできよう。例えば図10に示したプロセスのステップ1010と1020がそうである。
【０１０１】
さらに、当業者には、図示したステップのすべてがどの場合でも必ず必要であるというわけではないことが明らかであろう。例えば図6の点数化プロセスでは、点数化関数で使用されないパラメータは計算する必要がない。さらに、パラメータは、マルチタスクまたはマルチスレッドのオペレーティング・システムを利用して並列に計算することもできよう。
【０１０２】
本発明のさらに別の実施態様をこれから具体的に説明する。
【０１０３】
例えばステップ230で生成される断片ライブラリは、理論上は、可能なすべての断片とその組み合わせを含んでいる可能性がある。これは、実際には、ライブラリをコンピュータで生成する場合に実現することができる。しかしライブラリを手作業で生成する場合には、ライブラリに可能な全断片のほんの一部しか含まれていない可能性が大きい。したがって断片の組み合わせ、中でも以前の分析で高い点数が得られた断片の組み合わせを用いてこの方法を繰り返すとよい。
【０１０４】
したがって、断片を最初に分析した後、興味の対象である化学特性および／または生物特性に最も寄与していると思われる断片を組み合わせ、上に説明したアルゴリズムを適用して、その組み合わせた断片が、興味の対象である化学特性および／または生物特性に対してどれくらい寄与しているかを評価するとよい。得られた点数を個々の断片の点数と比較することにより、組み合わせた結果が、興味の対象である化学特性および／または生物特性に対する寄与を改善しているかどうかを確認することができる。
【０１０５】
本発明のさらに別の実施態様では、興味の対象である化学特性および／または生物特性に最も寄与する断片群の中から共通する構造を取り出し、その共通構造の寄与が出発時の断片と同じかそれ以になっていることを確認できる可能性がある。
【０１０６】
最高点の断片群は、所定の化学特性または生物特性への寄与に関して最大の重みを有する化学的決定基または分子フィンガープリントを備えている。
【０１０７】
このフィンガープリントを同定すると、この化学的決定基を含む化合物ライブラリを作ることができる。化合物は、問題にしている構造的特徴に関する合成プログラムによって得ることができる。別の方法として、化学的決定基を含む化合物は、市販品のカタログから同定することや、適切な供給元から購入することができる。化合物は、必ずしも医薬品用に調製されたものである必要はなく、いろいろな供給元から入手することができよう。
【０１０８】
望むライブラリができ上がると、それを興味の対象である標的に関してスクリーニングすることができる。スクリーニングの結果により、開発をさらに進めるのに十分な活性を有する化合物を同定することや、合成プログラムのためのリード化合物を得ることができる。本発明のDSA法により、特定の生物標的または医薬標的に関し、多彩でありながら目的が非常に明確なライブラリを生成することができる。したがって、活性化合物および／または有用なリード化合物をスクリーニングできる可能性がはるかに大きくなる。
【０１０９】
本発明のさらに別の実施態様では、望む所定の特性を有する分子（例えば生物活性のある分子）を同定する方法が提供される。この方法は、以下のステップを含んでいる。
・すでに説明したように、分子群の中で、分子断片が所定の化学特性または生物特性に寄与する程度を見積もるステップと、
・寄与が最大である1つ以上の断片を同定するステップと、
・そのような断片を1つ以上含む化合物群を集めるステップと、必要に応じてさらに
・望む特性に関してこの化合物をテストするステップ。
【０１１０】
この方法を用いて望ましくない特性（例えば生物への好ましくない副作用）につながる断片を同定し、その結果としてそのような断片を含む化合物を考慮の対象から外すことも可能であることが理解できよう。
【０１１１】
したがって本発明の方法により、構造に関する仮説（断片）が得られる。この仮説を用いて所定の生物特性、生化学特性、薬理特性、毒物特性をどの程度よく説明できるかは、点数を計算することによって評価される。製薬会社は、所定の断片についての点数を考慮することにより、どの方法が望む目標（例えば、より強力な化合物の同定、新しい一連の活性化合物の発見、選択性または生体利用性がより大きな化合物の同定、毒性効果の排除など）に到達するのに最も適切であるかについての決断を、情報に基づいて下すことができる。
【０１１２】
本発明の方法では、興味の対象である化合物群の中に存在している断片に焦点を絞ることにより、広い範囲にわたるが関係が薄いと思われる化学分野についての退屈な計算を省略している。その結果、所定の生物特性を取り扱う上で必要な計算ステップの数が少なくなるが、その一方で、生物活性のある化学的決定基の存在を推定するのに必要な分子に関する理解の基本的なレベルは維持している。
【０１１３】
すでに説明したように、本発明の方法には、1つ以上の関数の極値を求める操作が含まれる。関数は、極値が一般的な統計表に与えられている確率に対応するようなものを容易に選択することができる。こうすることにより、化学特性または生物特性に対する所定の断片からの潜在的寄与を評価するエレガントな方法が提供される。しかし本発明を実施する上で分析を統計的な理論に基づいて行なう必要はない。
【０１１４】
本発明のDSA法は、医薬品の発見に関する広範な分野で利用することができる。すでに説明したように、この方法により、所定の生物活性に寄与する確率が大きい医薬部分（例えば7-TM受容体アンタゴニスト、キナーゼ阻害剤、ホスファターゼ阻害剤、イオン・チャネル・ブロッカー、プロテアーゼ阻害剤）や、天然に存在するペプチド性リガンドの活性部分を同定することができる。
【０１１５】
この方法により、医薬標的の内在性モジュレータも同定することができる。そのため、医薬品を用いた新しい治療方針を明確にすることや、以前は欠けていた新しい薬理特性を分子の中に合理的に組み込むことが容易になる。
【０１１６】
この方法は、データ・セットの中で間違って陽性または陰性になった結果（例えばハイスループット・スクリーニングで得られる間違った結果）を同定するのに利用することもできる。DSAは、例えば望ましくない潜在的な副作用を同定することによって化合物の選択性を予測するのにも役立つ。
【０１１７】
同様に、この方法は、ある化合物の“親毒性”化学的決定基を同定することによってその化合物の毒性効果を予測するもに用いることもできる。これを上記のことと合わせると、化合物の選択において非常に役に立つ化学的決定基のデータベースを構成することができる。同様に、この方法により、以前は欠けていた新しい薬理特性を分子の中に合理的に組み込むこともできる。最後に、DSA法にはスクリーニング中にテストする必要のある分子の多様性の最適なレベルを明確にする性能が備わっているため、この方法により、合理的な大量、並列、自動化ハイスループット・スクリーニングを効率的に行なうことができる。これは、現在のHTPによる発見法と比べて顕著な改善である。
【０１１８】
上記の方法において少なくとも1つのステップをコンピュータ制御されたシステムで実行できることが理解できよう。したがって、例えばデータベースから得られた値x、y、z、Nを適切にプログラムされたコンピュータに入力して処理することができる。したがって本発明は、そのようなコンピュータ制御された方法やコンピュータを用いて実現された方法にも拡張することができる。
【０１１９】
上記の説明から、本発明により、所定の望ましい特性を有する分子（例えば生物活性のある分子）を迅速に同定する新しい方法が提供されることが明らかであろう。中でも本発明は、分子構造の効果を見積って分子構造の生物活性部分を同定し、これらの部分を用いて目的が明確な化合物の集合を設計することにより、より迅速かつよりコスト効率よく医薬品を発見する方法に関する。
【０１２０】
望む生物活性を有することがまだ知られていない所定の化合物の集合に含まれる生物活性化合物の割合を高める方法が提供される。この方法では、構造−活性の定量的な関係（QSAR）を決定するためのさまざまな数学的方法が適用される。独立下部構造分析（DSA）と名づけることのできるこの新しい方法により、例えば薬理学的なパターン認識の問題、すなわち所定の化合物に関し、所定の化学特性または生物特性（例えば生物活性、生化学活性、薬理活性、化学活性、毒物活性）にとって重要な化学的決定基（CD）を同定する問題に対する1つの解が提供される。
【０１２１】
本発明の方法には広範な応用があり、この方法が医薬品の分野に限定されることはない。生物活性化合物に関しては、この方法を例えば殺虫剤や除草剤の分野でも用いることができる。その場合、望む生物活性は、それぞれ殺虫活性、除草活性である。この方法は、望む特性が生物特性ではなく化学特性である、反応のモデル化の分野（例えば触媒の調製）でも使用することができる。
【０１２２】
1つの集合内、または異なる集合間で、興味の対象である化学特性および／または生物特性に対する寄与が最も大きいと思われる断片群を組み合わせ、興味の対象である化学特性および／または生物特性に対するこの組み合わせた断片の寄与をあるアルゴリズムを適用して評価し、得られた点数を個々の断片の点数と比較し、断片を組み合わせた結果として興味の対象である化学特性および／または生物特性への寄与が改善されているかどうかを確認するのが本発明の方法であることが理解できよう。
【０１２３】
さらに、本発明により、興味の対象である化学特性および／または生物特性に対する寄与が最大の断片群から共通部分を取り出し、この共通部分の寄与が出発断片と同じかそれ以上であるかどうかを確認することができる。
【０１２４】
さらに、関連性指標を使用する。関連性指標は、減算指標、比指標、混合指標のいずれかを選択することが好ましい。関連性指標が点数化関数に組み込まれていること、あるいは関連性指標を点数化関数に発展させることが好ましい。点数化関数は、限界比法；フィッシャーの直接法、ピアソンのカイ二乗法；マンテル・ヘンツェルのカイ二乗法；勾配に関する推論に基づく方法といった中から選択した統計的方法を用いて開発することができる。別の好ましい実施態様では、点数化関数の開発を、正確な信頼区間を計算して比較する方法、大まかな信頼区間を計算して比較する方法、相関係数を計算して比較する方法、上記の変数x、y、z、Nのうちの1〜4個の任意の組み合わせからなる関連性指標を含む任意の関数を計算して比較する方法の中から選択した方法を用いて行なう。
【０１２５】
潜在的なリガンドとして最高ランクの断片群を含む分子を選択し、必要に応じてその分子を医薬標的のモジュレータとしてテストするステップを本発明で実行することが好ましい。本発明の方法を利用して間違って陽性および／または陰性になった実験結果を同定することが好ましい。これ以外の好ましい応用は、類似性検索、多様性分析、立体配座分析を実行することである。
【０１２６】
以下の部分で、本発明のDSA法を応用した多数の実施例を提示する。実施例は本発明の好ましい実施態様であって単に本発明を説明するためのものであり、本発明がこれら実施例に限定されると考えてはならない。
【０１２７】
実施例1−受容体に対する新規で選択的なリガンドの合理的な同定法
組み換え膜を調製し、放射性標識したペプチドを用いることにより、細胞表面の受容体に対する競合結合アッセイを開発した。このアッセイでテストする化合物の集合を構成し、テストし、受容体に対する新規なリガンドを本発明の方法で同定した。第1ステップでは、現在ある科学文献を調べることにより、この受容体のアンタゴニストの構造208種を含むリストを作成した。第2ステップでは、これら208種の受容体リガンドに含まれる生物活性のある化学的決定基を同定した。この目的で、この受容体に対する効果を持たない101,130種の構造を含む追加リストを生成し、最初のリストに加えた。次に、その結果得られる101,338種の構造を含むリストを、減算関連性指標（I）を選択することによって分析し、生物活性のある化学的決定基が存在しているかどうかを明らかにした。この式において、xは、興味の対象である化学的決定基を含む活性な化学構造の数であり、yは、その化学的決定基を含む化学構造の合計数であり、zは、N個の分子からなる集合内の活性な化学構造の合計数であり（すなわちz=208）、Nは、分析する化学構造の合計数である（すなわちN=101,338）。
（I） Nx-yz
【０１２８】
次に、関連性指標（I）を点数化関数（II）へと発展させた。当業者であれば、この関数が、さまざまな混合因子用に変形した存在確率の間接的な指標であることが理解できよう。例えば対数スケールにした積の2番目の商の分子にあるN/2は、正規分布近似を二項分布に合わせるための調整項である。この変形は、比較的小さな値のx、y、z、Nを取り扱うのに有効である。変数MWと[S]（MWは、対象とする化学的決定基の分子量を表わしており、[S]は、その化学的決定基が活性な化合物群xの中に現われる回数を表わしている）は、分析中に生物活性のあるできるだけ大きな単一の化学的決定基が同定しやすくなるよう、点数化関数に含めた。当業者であれば、同じことを実現するのに式（I）や式（II）とは異なる関連性指標および／または点数化関数を利用できることが理解できよう。本発明の意味で最も重要なのは、変数x、y、z、Nのうちの2、3、4つをさまざまに組み合わせたものが含まれることである。
【数４】

【０１２９】
当業者であれば、点数化関数（II）を変更し、分子の材料に関係した変数や、生物特性および／または化学特性および／または物理化学特性に関係した変数がさらに含まれるようにできることがわかるであろう。そのような変更としては、例えば、化合物の力価、選択性、毒性、生体利用性、安定性（代謝安定性または化学的安定性）、合成可能性、純度、市場での入手可能性、合成用の適切な試薬の入手可能性、コスト、分子量、モル屈折性、モル体積、LogP（計算値または測定値）、医薬様分子の集合に含まれる所定の下部構造の占有率、原子の数および／またはタイプの合計数、化学結合および／または軌道の数および／またはタイプの合計数、水素結合を受け入れる基の数、水素結合を供与する基の数、電荷（部分的電荷または見かけ電荷）、プロトン化定数、追加の化学的キーまたは記述子を含む分子の数、回転可能な結合の数、たわみ指数、分子形状指数、並び方の類似性、重なった体積などが挙げられる。
【０１３０】
101,338種の構造を分析することで、分子量が150〜230Daの範囲にわたる明確に異なる8つの化学的決定基が同定された。単純に確率で考えると、活性な化学構造の集合の中に1万分の1未満しか含まれていないことになる（p<0.0001）。したがってこれら8つの化学的決定基が、文献から得られた208種の受容体リガンドの1つ以上の活性部分を代表していると認定し、第4のリストにまとめた。次に、式（II）を用いた計算を繰り返し、8つの断片の任意のものの組み合わせ、またはこれら断片の拡張から生じるより大きな化学的決定基が同定できるかを確認した。この追加計算において発見された統計的に有意な最大の化学的決定基は、分子量が335Daであった。この化学的決定基を、代表的な骨格として、あるいは薬理活性を有する“フィンガープリント”として選択し、後に続く化合物の選択と合成において使用した。第3ステップでは、この代表的な骨格を鋳型として用いて仮想的スクリーニングと化合物の選択を行なった。この目的で、計算されたフィンガープリントとその断片の両方を用い、市販されている600,000を超える化合物からなるデータベースで下部構造の検索を行なった。この検索により、合計で1360種の化合物が得られた。また、それ以外の1280種の化合物を、同じ供給源から対照としてランダムに選択した。
【０１３１】
第4ステップと第5ステップは、このプロセスの最終段階であり、並列に実行した。第4ステップでは、上記の2つの化合物群を放射性リガンド結合アッセイでテストする。代表的な骨格に基づいて選択された1360種の分子のうち、1〜10μMの濃度でテストしたときに205種の分子が競合活性を示し、0.1〜1μMの濃度でテストしたときに21種の化合物が活性を示し、化合物Aと名付けた1つの化合物が、受容体に対するアフィニティ（Ki）として8.1±1.05nM（n=12）の値を示した。ランダムに選択した1280種の化合物のそれぞれは、10μMの濃度でテストしたときには受容体結合特性を示さなかった。このように、代表的な骨格に基づいて集めた化合物群は、ランダムに選択した化合物群と比べ、活性分子を供給することに関して少なくとも21倍効率的だった（p<0.0001）。
【０１３２】
化合物Aは、興味の対象である受容体の阻害剤の新しい（これまで報告されていない）クラスを代表することがわかった。図12は、化合物Aが受容体を媒介としたイノシトール三リン酸の生成に及ぼす効果を示している。興味の対象である受容体を発現する細胞にあらかじめ放射性標識したイノシトールを付着させ、濃度を少しずつ増やした化合物Aの存在下で受容体アゴニストに曝露した。放射性標識した細胞イノシトールリン酸をアフィニティ・カラムから溶離させ、イノシトール三リン酸（IP₃）の生成を測定した。化合物Aは、アゴニストによって誘導されるIP₃の生成を抑制し、IC₅₀は22nMであった。この値は、受容体に対するこの化合物のアフィニティと整合している。
【０１３３】
図12に示したように、化合物Aは、細胞をベースとした機能アッセイにおいて、受容体を媒介としたイノシトールリン酸の生成を有意に減少させた（IC₅₀=22nM）。この知見は、受容体に対するこの化合物のアフィニティと、上記の計算で受容体のアゴニストを使用したことのどちらとも整合している。最後に、化合物Aは、興味の対象である受容体に対する選択性が非常に大きいことが明らかになった。というのも、20を超える他の放射性リガンド結合アッセイにより10μMの濃度でテストした範囲では、有意な抑制活性を示さなかったからである。
【０１３４】
第5ステップでは、受容体結合活性を有する新しい分子を同定することを目的として、物質の組成に関し、上記の代表的な骨格を用いて新しい化合物の机上設計と合成を行なった。この目的で、化学反応物と反応生成物のリストを作った。このリストにおいて、生物活性のある上記の代表的な骨格またはその断片が、反応物の化学構造または得られた反応生成物のいずれかに含まれていた。2000通りを超える反応物の組み合わせを選択し、対応する反応生成物を合成してテストした。これら化合物を受容体結合アッセイでテストしたところ、物質の組成という意味で新しいクラスの化合物が同定された。そのうちの代表的なものの多くは、IC₅₀が50〜500nMの範囲であった。
【０１３５】
実施例2−新規で選択的なキナーゼ阻害剤の合理的な同定法
炎症に関係するヒト・キナーゼに対する酵素アッセイを開発した。このキナーゼに対する阻害剤が以前に文献に報告されたことはない。このアッセイでテストする化合物を集め、テストし、本発明の方法で新しいキナーゼ阻害剤を同定した。第1ステップでは、プリン・ヌクレオチド結合タンパク質の阻害剤の化学構造2367種を科学文献から集めてリストを作成した。その中には、他のキナーゼ、ホスホジエステラーゼ、プリン・ヌクレオチド結合受容体、プリン・ヌクレオチド調節イオン・チャネル（今後はこれらを“代理標的”と呼ぶ）を阻害することがわかっている化合物の構造が含まれている。第2ステップでは、これら2367種の化学構造に含まれていてしかも生物活性のある化学的決定基を同定した。この目的で、上記の代理標的に対する効果がないことが知られている98,971種の構造を含む別のリストを作り、第1のリストに追加した。その結果得られる101,338種の構造を含むリストを、比関連性指標（III）を選択することによって分析し、生物活性のある化学的決定基が存在しているかどうかを明らかにした。この式において、xは、興味の対象である化学的決定基を含む活性な化学構造の数であり、yは、その化学的決定基を含む化学構造の合計数であり、zは、N個の分子からなる集合内の活性な化学構造の合計数であり（すなわちz=2367）、Nは、分析する化学構造の合計数である（すなわちN=101,338）。
【数５】

【０１３６】
次に、関連性指標（III）を点数化関数（IV）へと発展させた。当業者であれば、点数化関数（IV）が、指標（III）の95％信頼区間の下限値を評価する方法であることがわかるであろう。この評価を行なうため、対数変換を利用して比の分布が正規分布により近くなるようにするとともに、テイラー級数近似の一次のオーダーを利用し、その比の対数の分散を評価している。ここでは、点数化関数でx、y、z、N以外の変数は使用しなかった。しかし当業者にとって、すでに指摘したように、式（IV）を変更し、分子の材料に関係した変数や、生物特性および／または化学特性および／または物理化学特性に関係した変数（実施例1で挙げたもの）がさらに含まれるようにできることは明らかであろう。同じことを実現するのに式（III）や式（IV）とは異なる関連性指標および／または点数化関数を利用できることが理解できよう。本発明の意味で最も重要なのは、変数x、y、z、Nのうちの2、3、4つをさまざまに組み合わせたものが含まれることである。
【数６】

【０１３７】
式（IV）を用いて一連の化学的決定基を点数化することにより、さまざまな生物活性を有することがわかっている101,338種の化学構造を分析し、1つ以上のグループの化学的決定基が、1よりも大きな点数の要素を含むことを確認した。これは、単純に確率で考えると活性な化学構造の集合の中に20分の1未満しか含まれていないことに対応していた（p<0.05）。そこでこれら化学的決定基が、文献に記載されている代理標的阻害剤の薬理活性を有する1つ以上の部分を代表していると認定し、第4のリストにまとめた。ここでは実施例1で説明したようにこれら化学的決定基の組み合わせで最高点になるものを探すのではなく、これら構造を、代表的な骨格として、あるいは薬理活性を有する“フィンガープリント”として、後に続く化合物の選択と合成においてそのまま使用した。
【０１３８】
第3ステップでは、代表的なこれら骨格を鋳型として用いて仮想的スクリーニングと化合物の選択を行なった。この目的で、計算されたフィンガープリント、断片、およびこれらの組み合わせのすべてを用い、市販されている250,000を超える化合物からなるデータベースで下部構造の検索を行なった。この検索により、合計で2846種の化合物が得られた。対照としては、実施例1に記載したのと同じ1280種のランダムに選択した化合物を用いた。
【０１３９】
第4ステップと第5ステップは、このプロセスの最終段階であり、並列に実行した。第4ステップでは、得られた化合物を酵素アッセイでテストした。代表的な骨格に基づいて選択した2846種の分子のうち、88種の分子が、5μMの濃度でテストしたとき抑制活性を示した。これらのうち、6つの分子のIC₅₀が0.2〜2μMの範囲になり、化合物Bと名付けた1つの化合物のIC₅₀が164nMになった（図13）。
【０１４０】
図13は、化合物Bがキナーゼに依存したタンパク質のリン酸化に及ぼす効果を示している。興味の対象であるキナーゼを、濃度を少しずつ増やした化合物Bの存在下で放射性標識したATPおよびペプチド基質とともにインキュベートした。タンパク質のリン酸化は、標準的な放射線測定技術を用いて測定した。化合物Bは、キナーゼに依存したタンパク質基質のリン酸化を有意に抑制し、IC₅₀は164nMであった。
【０１４１】
対照としてテストしたランダム選択による1280種の化合物のうち、3つだけがスクリーニング・アッセイにおいて抑制活性を示した。そのうちの最も強力なものは、IC₅₀がわずかに7.8μMであった。このように、代表的なフィンガープリントをもとにして集めた化合物群は、ランダムに選択した化合物群よりも活性分子を供給する能力が13.2倍であった（p<0.0001）。さらに、化合物Bは、ATP競合キナーゼ阻害剤の新しい（これまで報告されていない）クラスを代表することがわかった。この化合物Bは、構造と機能の両方に関係する別のキナーゼを用いた選択性アッセイでテストしたとき、興味の対象であるキナーゼに対する選択性が250倍以上になった。
【０１４２】
第5ステップでは、キナーゼ抑制活性を有する新しい分子を同定することを目的として、物質の組成に関し、上記の代表的な骨格を1つ以上用いて新しい化合物の机上設計と合成を行なった。この目的で、化学反応物と反応生成物のリストを作った。このリストにおいて、生物活性のある上記の代表的な骨格またはその断片が、反応物の化学構造または得られた反応生成物のいずれかに含まれていた。4000通りを超える反応物の組み合わせを選択し、対応する反応生成物を合成してテストした。これら化合物をスクリーニング・アッセイでテストしたところ、物質の組成という意味で新しい2つのクラスの化合物が同定された。そのうちの代表的なものの多くは、IC₅₀が100〜500nMの範囲であった。
【０１４３】
実施例3−新規で選択的なイオン・チャネル・ブロッカーの合理的な同定法
神経変性においてある役割を演じていると考えられているイオン・チャネルのためのアッセイを開発した。このイオン・チャネルに対する阻害剤が以前に文献に報告されたことはない。このアッセイでテストする化合物を集め、テストし、本発明の方法で新しい阻害剤を同定した。第1ステップでは、興味の対象であるチャネルの阻害剤の化学的決定基を同定するのに必要な構造データを生成した。これは、まず最初にわれわれの会社が収集した3680種の化合物を5μMの濃度でスクリーニング・アッセイによりテストし、リストにあるそれぞれの構造に抑制活性に関する注釈を付けることによって実現した。分類のための閾値としてカットオフを40％抑制にすることにより、36種の構造が活性であると判定し、残りの3644種の化合物は不活性であると判定した。
【０１４４】
第2ステップでは、36種の阻害剤の構造に含まれる生物活性のある化学的決定基を同定した。この目的で、すでに説明した相関性指標（I）を選択することにより、注釈の付いた3680種の化合物を分析した。この式において、xは、興味の対象である化学的決定基を含む活性な化学構造の数であり、yは、その化学的決定基を含む化学構造の合計数であり、zは、N個の分子からなる集合内の活性な化学構造の合計数であり（すなわちz=36）、Nは、分析する化学構造の合計数である（すなわちN=3680）。次に、相関性指標（I）を点数化関数（V）へと発展させた。当業者であれば、点数化関数（V）が、この式には明示されていない2つの二値変数の間に共通する分散の程度を反映する積率相関係数であることがわかるであろう。
【数７】

【０１４５】
この場合、点数化関数でx、y、z、N以外の変数は使用しなかった。しかし当業者にとって、すでに指摘したように、式（V）を変更し、分子の材料に関係した変数や、生物特性および／または化学特性および／または物理化学特性に関係した変数（実施例1で挙げたもの）がさらに含まれるようにできることは明らかであろう。特に点数化関数（V）は、研究設計におけるさまざまな変化に対して、および／またはy、（N-y）、z、（N-z）の分布に対して不変ではないため、同じことを実現するのに式（I）や式（V）とは異なる関連性指標および／または点数化関数を利用できることが理解できよう。本発明の意味で最も重要なのは、変数x、y、z、Nのうちの2、3、4つをさまざまに組み合わせたものが含まれることである。
【０１４６】
以下の図には、分析に用いるとともに追試のために選択した化学的決定基の具体例を示してある。チャネル抑制活性に関して注釈の付いた合計で3680種の構造を、図Aに示した5つの化学的決定基を含む化学的決定基群を用いてテストし、生物活性のある構造が存在しているかどうかを明らかにした。これら5つの化学的決定基のうちで第4番が最高点を示した。これは、この化学的決定基がチャネル抑制活性の基礎になっていた可能性が最も大きいことを示唆する。そこで化学的決定基第4番を含む構造に関して計算を繰り返したところ、図Bに示した化学構造が、36種の阻害剤に含まれる統計的に有意な最大の化学的決定基であることが確認された。そこでこの化学構造を追試のために選択した。記号Aは、C、N、O、Sのいずれかを表わし、記号Bは、HまたはOHを表わす。
【化８】

【０１４７】
式（V）を用いて一連の化学的決定基を点数化し、ゼロでない正の最大値になる構造を残すことにより、注釈の付いた3680種の構造を分析した。この方法で使用した化学的決定基の具体例と計算値をいくつか図Aに示してある。これらのうちで化学的決定基第4番が最高点を示した。この化学的決定基第4番は、単純に確率で考えるとチャネル・ブロッキング構造の集合の中に100分の1未満しか含まれていないことになる（p<0.01）。そこで化学的決定基第4番が36種の阻害剤の生物活性部分を代表していると認定した。次に、式（V）を用いて計算を繰り返し、より大きな化学的決定基が同定できるかどうかを確認した。この追加計算によって見い出された統計的に有意な最大の化学的決定基を図Bに示してある。この構造を、代表的な骨格として、あるいは薬理活性を有する“フィンガープリント”として選択し、あとで化合物の選択と合成に使用した。
【０１４８】
第3ステップでは、図Bに示した代表的な骨格を鋳型として使用し、仮想的スクリーニングと化合物の選択を行なった。この目的で、計算されたフィンガープリント、断片、およびこれらの組み合わせのすべてを用い、市販されている400,000を超える化合物からなるデータベースで下部構造の検索を行なった。この検索により、合計で1760種の化合物が得られた。対照としては、実施例1に記載したのと同じ1280種のランダムに選択した化合物を用いた。
【０１４９】
第4ステップと第5ステップは、このプロセスの最終段階であり、並列に実行した。第4ステップでは、得られた化合物を酵素アッセイでテストした。代表的な骨格に基づいて選択した1760種の分子のうち、84種の分子が、5μMの濃度でテストしたとき少なくとも40％の抑制活性を示した。これらのうち、8つの分子のIC₅₀がμM未満の範囲になり、化合物Cと名付けた1つの化合物のIC₅₀が400nMになった。これらチャネル阻害化合物のうちの2つを以下に示す。両方とも、薬理活性を有する具体的な“フィンガープリント”として図Bに示したものを含んでいる。
【化９】

【０１５０】
これら2つのチャネル阻害化合物を選択し、本発明の方法を利用してテストした。どちらの分子も興味の対象であるチャネルを有意に抑制した。これら2つの化合物の化学構造は、黒で強調した下部構造からわかるように、本発明の方法によって同定された活性な化学的決定基を含んでいる。この化学的決定基は、上の図Bに示したものである。
【０１５１】
対照としてテストしたランダム選択による1280種の化合物のうち、合計で33分子だけがスクリーニング・アッセイにおいて少なくとも40％の抑制活性を示した。このように、図Bに示した代表的なフィンガープリントをもとにして集めた化合物群は、ランダムに選択した化合物群よりも活性分子を供給する能力が1.8倍大きかった（p<0.005）。図Bに示した代表的なフィンガープリントをもとにして集めた化合物群は、われわれの会社が収集した最初の3680種の化合物よりも活性分子を供給する能力が4.9倍大きかった（p<0.0001）。
【０１５２】
第5ステップでは、チャネル阻害特性に関して新しい分子を同定することを目的として、物質の組成に関し、図Bに示した代表的な骨格を用いて新しい化合物の机上設計と合成を行なった。この目的で、薬理活性を有する上記120種の阻害剤のうちの1つを追試用に選択し、以前に得られたスクリーニングの肯定的な結果と否定的な結果を構造−活性の情報源として用いてその阻害剤を化学的に修飾した。この作業により、物質の組成という意味で新しい（これまで報告されていない）クラスのイオン・チャネル・ブロッカーが合成され、同定された。そのうちの代表的なものの多くは、IC₅₀が100〜500nMの範囲であった。選択性テストにより、興味の対象であるチャネルに対するこの化合物の選択性は、他の30種の医薬標的に対する選択性を上回ることがわかり、さらに、この化合物は、神経増殖因子が引っ込むことによってアポトーシスが誘導されるというモデルにおける細胞死を抑制することがわかった。
【０１５３】
実施例4−新規で選択的なプロテアーゼ阻害剤の合理的な同定法
虚血によるダメージと怪我において重要な役割を演じていると考えられているプロテアーゼのための酵素アッセイを開発した。問題のプロテアーゼは、密接な関係のある酵素のファミリーの一員であり、それ自身が治療を行なう際の興味深い唯一の標的となっている。このアッセイでテストする化合物を集め、テストし、本発明の方法で新しい酵素阻害剤を同定した。第1ステップでは、酵素の阻害剤の化学的決定基を同定するのに必要な構造データを生成した。これは、1680種の化合物を3μMの濃度でスクリーニング・アッセイによりテストし、それぞれの構造に抑制活性に関する注釈を付けることによって実現した。分類のための閾値としてカットオフを40％抑制にすることにより、17種の構造が活性であると判定し、残りの1663種の化合物は不活性であると判定した。
【０１５４】
第2ステップでは、17種の阻害剤の構造に含まれる生物活性のある化学的決定基を同定した。この目的で、以下に説明する混合相関性指標（VI）を選択することにより、注釈の付いた1680種の化合物を分析した。この式において、xは、興味の対象である化学的決定基を含む活性な化学構造の数であり、yは、その化学的決定基を含む化学構造の合計数であり、zは、N個の分子からなる集合内の活性な化学構造の合計数であり（すなわちz=17）、Nは、分析する化学構造の合計数である（すなわちN=1680）。この場合、相関性指標（VI）を、興味の対象である17種の阻害剤に含まれる生物活性のある化学的決定基を同定するための点数化関数としてそのまま使用した。
【数８】

【０１５５】
ここでは、点数化関数でx、y、z、N以外の変数は使用しなかった。しかし当業者にとって、すでに指摘したように、式（V）を変更し、分子の材料に関係した変数や、生物特性および／または化学特性および／または物理化学特性に関係した変数（実施例1で挙げたもの）がさらに含まれるようにできることは明らかであろう。
【０１５６】
当業者であれば、同じことを実現するのに式（VI）とは異なる関連性指標および／または点数化関数を利用できることも理解できよう。というのも、特にこの関連性指標（VI）をそのまま使用する場合には、所定の化学的決定基が生物活性の基礎になっているらしいことの相対評価しかできないからである。本発明の意味でこれらの代替法において最も重要なのは、変数x、y、z、Nのうちの2、3、4つをさまざまに組み合わせたものを含んでいることである。
【０１５７】
式（VI）を用いて一連の化学的決定基を点数化し、ゼロでない正の最大値になる構造を残すことにより、注釈の付いた1680種の構造を分析した。この方法で使用した化学的決定基の具体例と計算値をいくつか下の図Aに示してある。これらのうちで化学的決定基第7番と第8番が高い点数を示したため、それらが17種の阻害剤の多くの部分に含まれる生物活性のある1つ以上の部分を代表していると認定した。次に、式（VI）を用いて計算を繰り返してより大きな化学的決定基を同定できるかどうかを確認したが、利用可能な17種の構造を用いた場合には同定できなかった。化学的決定基第7番と第8番をまとめると、下の図Bに示すような代表的な骨格、または薬理活性を有する“フィンガープリント”になった。この構造を使用して化合物の選択と合成を行なった。
【化１０】

【０１５８】
この図には、分析に用いるとともに追試のために選択した化学的決定基の具体例を示してある。プロテアーゼ抑制活性に関して注釈の付いた合計で1680種の構造を、図Aに示した4つの化学的決定基を含む化学的決定基群を用いてテストし、生物活性のある構造が存在しているかどうかを明らかにした。これら4つの化学的決定基のうちで第7番と第8番が高い点数を示した。これは、これらの化学的決定基がプロテアーゼ抑制活性の基礎になっていた可能性が最も大きいことを示唆する。比較のため挙げておくと、単純なベンゼン環からなる化学的決定基は、点数が0.02であった。化学的決定基第7番と第8番に関して計算を繰り返したときにより大きな点数の構造は同定できなかったため、これら2つの構造をまとめて図Bに示した化学的モチーフにした。次に、この化学的モチーフを薬理活性を有する“フィンガープリント”として用い、仮想的スクリーニングと化合物の選択を行なった。記号Aは、CまたはSを表わし、記号Bは、H、C、N、O、または任意のハロゲン原子を表わす。
【０１５９】
第3ステップでは、図Bに示した代表的な骨格を鋳型として使用し、仮想的スクリーニングと化合物の選択を行なった。この目的で、専用に計算されたフィンガープリントとその断片の両方を用い、市販されている150,000を超える化合物からなるデータベースで下部構造の検索を行なった。この検索により、合計で589種の化合物が得られた。
【０１６０】
第4ステップと最終ステップでは、得られた化合物を酵素アッセイでテストした。代表的な骨格に基づいて選択した589種の分子のうち、52種の分子が、3μMの濃度でテストしたとき少なくとも40％の抑制活性を示した。これらのうち、12の分子のIC₅₀がμM未満の範囲になり、化合物Dと名付けた1つの化合物のIC₅₀が65nMになった。これらプロテアーゼ阻害化合物のうちの6つを以下に示す。いずれも薬理活性を有する図Bに示した“フィンガープリント”を少なくとも1つ含んでいる。
【化１１】

【０１６１】
プロテアーゼを抑制するこれら6つの化合物を選択し、本発明の方法を用いてテストした。それぞれの分子が、興味の対象であるタンパク質を有意に抑制し、IC₅₀は0.15〜15μMの範囲になった。黒で強調した下部構造からわかるように、6つの化合物のそれぞれの構造は、本発明の方法によって同定された活性な化学的決定基を含んでいる。この化学的決定基は、上の図Bに示したものである。これら化合物のうちのいくつかは、実際にはフィンガープリントの変異体を2つ以上含んでいる。それは例えば、上図の右下隅に示したテトラ環式構造である。
【０１６２】
このように、図Bに示した代表的なフィンガープリントをもとにして集めた化合物群は、最初にテストした1680種の化合物群よりも活性分子を供給する能力が8.7倍大きかった（p<0.0001）。しかも合理的に同定した52種の化合物は、興味の対象であるプロテアーゼに対する選択性を有することがわかった。しかし大部分（>90％）は、同じ酵素ファミリーに属する関連したプロテアーゼに対して5μMの濃度でテストしたときと、他の12種の医薬標的に対するのと同じ条件でテストしたときには、抑制活性を示さなかった。
【０１６３】
実施例5−新規で選択的なホスファターゼ阻害剤の合理的な同定法
受容体の感作と調節において重要な役割を演じていると考えられているホスファターゼのための酵素アッセイを開発した。このアッセイでテストする化合物を集め、テストし、本発明の方法で新しい酵素阻害剤を同定した。第1ステップでは、酵素の阻害剤の化学的決定基を同定するのに必要な構造データを生成した。これは、12,160種の化合物を3μMの濃度でスクリーニング・アッセイによりテストし、それぞれの構造に抑制活性に関する注釈を付けることによって実現した。分類のための閾値としてカットオフを50％抑制にすることにより、全部で15種の構造が活性であると判定し、残りの12,145種の化合物は不活性であると判定した。
【０１６４】
第2ステップでは、15種の阻害剤の構造に含まれる生物活性のある化学的決定基を同定した。この目的で、混合相関性指標（VII）を選択することにより、注釈の付いた12,160種の化合物を分析した。この式において、xは、興味の対象である化学的決定基を含む活性な化学構造の数であり、yは、その化学的決定基を含む化学構造の合計数であり、zは、N個の分子からなる集合内の活性な化学構造の合計数であり（すなわちz=15）、Nは、分析する化学構造の合計数である（すなわちN=12,160）。
（VII） (x/z)-(z-x)/(N-z)
【０１６５】
次に、相関性指標（VII）を点数化関数（VIII）へと発展させた。当業者であれば、点数化関数（VIII）が、2つの二値変数の間に存在する分散の程度を表わす回帰直線の勾配を用いたリスク・オッズ比の評価と関係しており、対象とする各化学的決定基の分子量（MW）を含むように変更されたものであることがわかるであろう。
【数９】

【０１６６】
ここでは、点数化関数でx、y、z、N以外の変数は使用しなかった。しかし当業者にとって、すでに指摘したように、式（VIII）を変更し、分子の材料に関係した変数や、生物特性および／または化学特性および／または物理化学特性に関係した変数（実施例1で挙げたもの）がさらに含まれるようにできることは明らかであろう。当業者であれば、同じことを実現するのに式（VIII）とは異なる関連性指標および／または点数化関数を利用できることも理解できよう。というのも、特に、勾配を比較しても2つの密接に関係した化学的決定基を十分に区別できないことがあるからである。本発明の意味でこれら点数化関数において最も重要なのは、変数x、y、z、Nのうちの2、3、4つをさまざまに組み合わせたものを含んでいることである。
【０１６７】
式（VI）を用いて一連の化学的決定基を点数化し、点数が最大の構造を残すことにより、注釈の付いた12,160種の化合物を分析した。すると分子量が120〜220Daの範囲にわたる明確に異なる3つの化学的決定基が同定された。単純に確率で考えると、活性な化学構造群の中に10分の1未満しか含まれていないことになる（p<0.1）。そこでこれら3つの化学的決定基が、スクリーニングにより同定された15種の酵素阻害剤の1つ以上の活性部分を代表していると認定し、第4のリストにまとめた。次に、式（VIII）を用いた計算を繰り返し、3つの断片の任意のものの組み合わせ、またはこれら断片の拡張から生じるより大きな化学的決定基を同定できるかを確認した。この追加計算において発見された統計的に有意な最大の化学的決定基は分子量が255Daであり、それを、代表的な骨格として、あるいは薬理活性を有する“フィンガープリント”として選択し、後に続く化合物の選択と合成で使用した。
【０１６８】
第3ステップでは、この代表的な骨格を鋳型として用いて仮想的スクリーニングと化合物の選択を行なった。この目的で、計算されたフィンガープリントとその断片の両方を用い、市販されている800,000を超える化合物からなるデータベースで下部構造の検索を行なった。この検索により、合計で1242種の化合物が得られた。また、実施例1に記載したのと同じ1280種の化合物を、対照としてランダムに選択した。
【０１６９】
第4ステップと最終ステップでは、得られた化合物を酵素アッセイでテストした。代表的な骨格に基づいて選択した1242種の分子のうち、34種の分子が、3μMの濃度でテストしたとき少なくとも50％の抑制活性を示した。これらのうち、8つの分子のIC₅₀がμM未満の範囲になり、化合物Eと名付けた1つの化合物のIC₅₀が87nMになった（図14）。
【０１７０】
図14は、化合物Eがホスファターゼに依存したタンパク質の脱リン酸化に及ぼす効果を示している。興味の対象であるホスファターゼを、濃度を少しずつ増やした化合物Eの存在下で脱リン酸化したペプチド基質とともにインキュベートした。基質の脱リン酸化は、遊離したリン酸が反応媒体の中に放出されるのをマラカイトグリーンを用いて測定することによって評価した。化合物Eは、ホスファターゼに依存した脱リン酸化を有意に抑制し、IC₅₀は87nMであった。
【０１７１】
対照としてテストしたランダム選択による1280種の化合物のうち、2つだけがスクリーニング・アッセイにおいて抑制活性を示した。そのうちで最も強力なものは、IC₅₀が1.8μMであった。このように、図Bに示した代表的なフィンガープリントをもとにして集めた化合物群は、ランダムに選択した化合物群よりも活性分子を供給する能力が17.5倍大きく（p<0.005）、われわれの会社が収集した最初の12160種の化合物よりも活性分子を供給する能力が22.3倍大きかった（p<0.00001）。
【０１７２】
最後に、化合物Eは、興味の対象である受容体の阻害剤の新しい（これまで報告されていない）クラスのホスファターゼ阻害剤を代表することがわかった。この化合物Eは、構造と機能の両方に関係する別のホスファターゼを用いた選択性アッセイでテストしたとき、興味の対象である標的に対する選択性が20倍を超える値になった。
【０１７３】
実施例6−化合物群の性能向上
本発明を利用して化合物群の性能を向上させることもできる。そのことを具体的に示すため、1251種の化合物の集合を3μMの濃度でプロテアーゼ・アッセイによりテストした。すると25種の化合物が少なくとも40％の抑制活性を示した。構造の分析を実施例1に記載したようにして行なったところ、多数の化学的決定基が同定された。そのうちの1つは、単純に確率で考えると25種のプロテアーゼ阻害剤のうちの7つにおいて1万分の1未満しか含まれていないことになる（p<0.0001）。残念なことに、この化学的決定基を含む7種の化合物は、中程度の抑制活性（平均IC₅₀=3.4μM±1.34μM、n=7）しか示さなかったため、化学的追試を行なうだけの魅力はなかった。そこで問題の化学的決定基が、興味の対象である阻害剤の生物活性部分を代表すると認定し、化合物の追加選択のための代表的な骨格として、あるいは薬理活性を有する“フィンガープリント”としてそのまま使用した。
【０１７４】
この目的で、市販されている100,000を超える化合物からなるデータベースで興味の対象である化学的決定基のスクリーニングを行なった。すると142種の分子が選択されたため、これらの分子に対してさらにテストを行なった。これら142種の分子のうち、11種がμM未満の範囲で抑制活性を示し、平均IC₅₀は0.48μM±0.09μM（n=11、平均IC₅₀は、p<0.05で以前の値よりも有意に小さい）になった。このように、本発明の方法により、化合物群の薬理学的性能を有意に向上させることができる。
【０１７５】
実施例7−化合物群の選択性向上
本発明を利用して化合物群の選択性を向上させることもできる。そのことを具体的に示すため、3360種の化合物の集合を3μMの濃度でキナーゼ・アッセイ（キナーゼ・アッセイ第1番と呼ぶ）によりテストした。すると22種の化合物が少なくとも40％の抑制活性を示した。構造の分析を実施例2に記載したようにして行なったところ、多数の化学的決定基が同定された。そのうちの1つ（化学的決定基第10番）は、単純に確率で考えると22種のプロテアーゼ阻害剤のうちの3つにおいて約20分の1未満しか含まれていないことが推定された（p<0.05）。残念なことに、他の4つのキナーゼに対して選択性アッセイを行なったところ、化学的決定基第10番は別のキナーゼ（キナーゼ第2番と呼ぶ）の阻害剤の重要な構成要素でもあることがわかった。これは、化学的決定基第10番だけに基づいてキナーゼ第1番の選択的阻害剤を開発するのが不可能であることを示唆している。実際、化学的決定基第10番を含む3つの構造は、上記の2つのキナーゼに対する効果が等しく、平均IC₅₀は、キナーゼ第1番に対して7.2μM±3.81μM（n=3）、キナーゼ第2番に対して21.5μM±9.29μM（n=3）であった。これは、キナーゼ第1番に対する選択性がほんの2.98倍だけ有利になっていることを示している。
【０１７６】
このことを考慮し、キナーゼ第1番に対してテストした3360種の化合物を3μMの濃度でキナーゼ第2番に対して再びテストした。すると92種の化合物が少なくとも40％の抑制活性を示した。次に、3360種の構造からなるリストをキナーゼ第1番とキナーゼ第2番の両方の活性に関して注釈付けし、相関性指標（III）を選択してそれを点数化関数（IX）へと発展させることにより、本発明の方法に従って分析を行なった。この式において、x₁は、興味の対象である化学的決定基を含んでいてキナーゼ第1番に対して活性な化学構造の数であり、x₂は、興味の対象である化学的決定基を含んでいてキナーゼ第2番に対して活性な化学構造の数であり、yは、その化学的決定基を含む化学構造の合計数であり、z₁は、N個の分子からなる集合内にあってキナーゼ第1番に対して活性な化学構造の合計数であり（すなわちz₁=22）、z₂は、N個の分子からなる集合内にあってキナーゼ第2番に対して活性な化学構造の合計数であり（すなわちz₂=92）、Nは、分析する化学構造の合計数である（すなわちN=3360）。
【数１０】

【０１７７】
当業者であれば、点数化関数（IX）が相対リスクを比較する方法であり、この点数化関数（IX）により、1つのキナーゼに対する選択性が他のキナーゼに対する選択性よりも非常に大きい化学的決定基を同定できることが理解できよう。同様に、当業者にとって、式（IX）を変更し、分子の材料に関係した変数や、生物特性および／または化学特性および／または物理化学特性に関係した変数（実施例1で挙げたもの）がさらに含まれるようにできることは明らかであろう。最後に、同じことを実現するのに式（III）や式（IX）とは異なる関連性指標および／または点数化関数を利用可能であることが理解できよう。例えば関連性指標（I）を点数化関数（II）で使用し、キナーゼ第2番の活性に関して得られた点数をキナーゼ第1番の活性に関して得られた点数から差し引くことや、逆に、キナーゼ第1番の活性に関して得られた点数をキナーゼ第2番の活性に関して得られた点数で割ることができよう。これ以外の方法も多数あるが、本発明の意味で最も重要なのは、変数x、y、z、Nのうちの2、3、4つをさまざまに組み合わせたものが含まれることである。
【０１７８】
式（IX）を用いて一連の化学的決定基を点数化することで、キナーゼ第1番に対する選択性を有する化学的決定基が多数同定された。そのうちの1つ（化学的決定基第11番と呼ぶ）は、追加の化学的モチーフで置換された化学的決定基第10番であった。そこで化学的決定基第11番が、キナーゼ第1番の選択的な阻害剤の薬理活性を有する部分を表わすと認定し、それを、代表的な骨格として、あるいは薬理活性を有する“フィンガープリント”として、あとに続けて行なう化合物の選択に使用した。この目的で、化学的決定基第11番とその断片を用い、市販されている400,000を超える化合物からなるデータベースで下部構造の検索を行なった。合計で498種の化合物が得られたため、これらの化合物に対して2つのアッセイを行なった。すると、化学的決定基第10番を含む3つの阻害剤が得られた。その平均IC₅₀は、キナーゼ・アッセイ第1番において0.94μM±0.52μM（n=3）、キナーゼ・アッセイ第2番において31.6μM±4.41μM（n=3）であった。この結果は、化合物群がキナーゼ第1番を選択する割合がキナーゼ第2番を選択する割合よりも11倍大きくなったことを示している（2.98から33.6へ、p<0.05）。これは、本発明の方法によって興味の対象である化合物群の薬理学的選択性を向上させうることを示している。
【０１７９】
実施例8−多数の薬理学的効果を伴った化合物群の合理的同定法
免疫応答においてある役割を果たしていると考えられているリガンド依存性イオン・チャネルについての機能アッセイを開発した。このアッセイでテストする化合物の集合を構成し、テストし、新規なイオン・チャネル・ブロッカーを本発明の方法で同定した。調べたチャネルは、ナトリウム・イオンが通過し、プリン・ヌクレオチドによって活性化され、ある種のナトリウム・チャネル・ブロッカーによって抑制される標的ファミリーに属することがわかっている。そこで、興味の対象であるリガンド依存性イオン・チャネルの阻害剤を迅速に同定する確率を大きくするため、プリン・ヌクレオチドを真似ると同時にナトリウム・チャネルを抑制するという二重の性能を持った薬理学的フィンガープリントを同定することにした。
【０１８０】
第1ステップでは、現在ある文献を検索することにより、化学構造のリストを2つ作った。第1のリストは、文献に記載されている79種のナトリウム・チャネル阻害剤の構造を含んでいた。第2のリストは、2367種のプリン・ヌクレオチド結合タンパク質阻害剤の構造を含んでいた（詳細に関しては実施例2を参照のこと）。第2ステップでは、生物活性のある化学的決定基のうちで、化学構造を記載した両方のリストに同時に含まれるものを同定した。この目的で、興味の対象である代理標的に対して効果がないことがわかっている100,000種を超える分子をそれぞれのリストに追加し、実施例1に示したように減算相関性指標（I）を選択してそれを点数化関数（X）へと発展させることにより、分析を行なった。この式において、x₁は、ナトリウム・チャネルにおいて活性で、興味の対象である化学的決定基を含んでいる化学構造の数であり、x₂は、プリン・ヌクレオチド結合タンパク質において活性で、その化学的決定基を含んでいる化学構造の数であり、y₁は、ナトリウム・チャネルの阻害効果を有することが知られている構造のリスト中にあって化学的決定基を含んでいる化学構造の合計数であり、y₂は、プリン・ヌクレオチド結合タンパク質の抑制効果を有することが知られている構造のリスト中にあって化学的決定基を含んでいる化学構造の合計数であり、z₁は、N₁個からなる分子群のうちでナトリウム・チャネルを阻害する化学構造の合計数であり（すなわちz₁=79）、z₂は、N₂個からなる分子群のうちでプリン・ヌクレオチド結合タンパク質において作用する化学構造の合計数であり（すなわちz₂=2367）、N₁とN₂は、注釈の付いた構造に関するそれぞれのリスト中にあって分析することになる化学構造の合計数である。
【数１１】

【０１８１】
当業者であれば、点数化関数（X）が、2つの異なる相関性テストを組み合わせる方法であり、この点数化関数（X）により、ナトリウム・チャネルとプリン・ヌクレオチド結合タンパク質の両方に同時に効果をもたらす可能性が最も大きい化学的決定基を同定できることが理解できよう。同様に、当業者にとって、すでに指摘したように、式（X）を変更し、分子の材料に関係した変数や、生物特性および／または化学特性および／または物理化学特性に関係した変数（実施例1で挙げたもの）がさらに含まれるようにできることは明らかであろう。また、同じことを実現するのに式（I）や式（X）とは異なる関連性指標および／または点数化関数を利用できることも理解できよう。というのも、特に、点数化関数（X）では2つのデータ・セットの割合の間に存在する差の方向が考慮されていないにもかかわらず、この割合が同じ程度であることが要求され、さらにN1がN2と同じ程度であることと、両方の値が20を超えることが要求されているからである。例えば、サンプルのサイズが大きく異なっているデータ・セットが複数ある場合には、割合の差の重み付き平均に基づいた点数化関数を用いることにより、結果に重みを付けるとよかろう（後出の実施例21を参照のこと）。別の方法として、計算で第3、第4、第iの薬理学的特性のうちのいずれかを考慮することもできよう。この場合、式（X）を拡張してより一般的な形（XI）（ただしdは、分析する化合物リストの数である）にできることは明らかであろう。すると、得られた点数を標準的な正規分布の表と直接比較することで、対象となっているすべての薬理特性の基礎になっている1つ以上の化学的決定基が見い出される確率を明らかにすることができる。これ以外の方法も多数あるが、本発明の意味で最も重要なのは、変数x、y、z、Nのうちの2、3、4つをさまざまに組み合わせたものが含まれることである。
【数１２】

【０１８２】
式（X）を用いて一連の化学的決定基を点数化し、最大値が2よりも大きな構造を残すことにより、注釈の付いた構造からなる2つのリストを分析した。その結果、生物活性のある構造群のいずれでも化学的決定基が同定されたが、見つかる可能性は、単純に確率で考えると20分の1未満であった（p<0.05）。そこでこの化学的決定基（“化学的決定基第12番”と呼ぶ）がナトリウム・チャネルとプリン・ヌクレオチド結合タンパク質の両方の阻害剤の1つ以上の生物活性部分を代表していると認定し、それを、代表的な骨格として、あるいは薬理活性を有する“フィンガープリント”として、後に続く化合物の選択においてそのまま使用した。
【０１８３】
第3ステップでは、代表的な骨格を鋳型として用いて仮想的スクリーニングを行なった。この目的で、専用の化学的決定基第12番とその断片を用い、市販されている250,000を超える化合物からなるデータベースで下部構造の検索を行なった。この検索により、合計で800種の化合物が得られた。また、実施例1に記載したのと同じ1280種の化合物を、対照としてランダムに選択した。
【０１８４】
第4ステップと最終ステップでは、得られた化合物をイオン・チャネル・アッセイによりテストした。化学的決定基第12番に基づいて選択した800種の分子のうち、23種の化合物が、3μMの濃度でテストしたときに少なくとも40％の抑制活性を示した。これら化合物のうち、3つのIC₅₀がμM未満の範囲になり、化合物Fと名付けた1つの化合物のIC₅₀が145nM±56nM（n=4）になった。対照としてテストしたランダムに選択した1280種の化合物のうち、たった1つの分子だけが小さなμMの範囲で有意な抑制活性を示した。その化学構造には、実際に化学的決定基第12番のかなり多くの部分が含まれていた。興味深いことに、同じ800種の化合物を、やはり免疫応答においてある役割を果たしていると考えられているキナーゼに対してテストしたところ、8つの化合物が、5μMの濃度でテストしたときに少なくとも40％の抑制活性を示した。化合物FのIC₅₀は1.2nMになり、別の化合物（化合物Gと呼ぶ）はIC₅₀が137nM±48nM（n=4）になった。さらに、化合物FおよびGと、構造中にやはり化学的決定基第12番を含んでいる密接に関係した多数の分子がナトリウム・チャネルを抑制し、典型的には1μMで50〜100％の抑制を示すことが見い出された。これらの結果を合わせると、本発明の方法により、多因子疾患状態（例えば炎症など）を治療する医薬品を開発する上で興味深い可能性のある多くの薬理特性を有する化合物を選択および／または設計できることがわかる。また、類推から、この方法を用い、新しい薬理特性を、これまではそのような特性が欠けていた化合物群に組み込めることも明らかである。
【０１８５】
実施例9−生物活性のある化学的決定基のリスト作成
本発明の好ましい一実施態様では、本発明の方法を用いて生物活性のある化学的決定基のリストを作成することもできる。するとこのリストを、例えば医薬品化学で使用されるコンピュータ制御による決定プログラムなどにおいて参照データベースとして用い、合理的な医薬品の設計を行なうことができる。そのことを具体的に示すため、科学文献を検索し、薬理活性のある分子のリストを25通り集めた。それぞれのリストには、所定の薬理特性（例えば、σ受容体への結合に対するアンタゴニズム、ドーパミンD₂受容体に対するアンタゴニズム、エストロゲン受容体に対するアンタゴニズムなど）を示す化合物の化学構造が含まれている。次に、実施例2に記載したようにして相関性指標（III）を選択し、それを関数（IV）へと発展させることにより、それぞれのリストを本発明に従って分析した。この関数（IV）は、分析している1つ以上のリストに含まれるさまざまな化学的決定基を点数化するのに使用した。こうした計算により、薬理活性のある多数の化学的決定基が同定された。そのうちの3つを、得られたマトリックスの一部として以下の表に示す。
【表１】

【０１８６】
この表は、薬理活性のある化学的決定基の参照リストである。異なる25の薬理特性のうちの1つを有することが知られている分子を含む構造について25通りのリストを作り、相関性指標（III）と点数化関数（IV）を用いて本発明の方法に従って分析した。25通りの特性としては、σ受容体への結合能力（σリガンド）、ドーパミンD₂受容体に対するアゴニズム（D₂のアゴニスト）、エストロゲン受容体に対するアンタゴニスム（エストロゲン受容体のアゴニスト）などが挙げられる。得られた26のマトリックスのほんの一部を上の表に示してある。1より大きな数値は、所定の化学的決定基が、同じ薬理特性を共通に有する分子群の中で20分の1未満の確率でしか現われないことを示す。これは、この化学的決定基が、この特性の分子的基礎になっている可能性が最も大きいことを示唆している。上に示したような表は、生物活性のある化学的決定基または“フィンガープリント”を記録しておく場所になる。この表は、医薬品の発見や開発の際に情報を得た上で決定を下すための参照リストして利用することができる。
【０１８７】
得られた表は以下のように解釈する。化学構造に化学的決定基第13番が含まれる化合物は、8.12>1.85>0.05であるため、σ受容体への結合特性やエストロゲン受容体に対するアンタゴニストとしての特性と比べてドーパミンD₂受容体に対するアゴニストとしての特性をより強く示している。逆に、化学的決定基第13番は、8.12>2.93>0.00であるため、ドーパミンD₂受容体の潜在的アゴニストの集合を構成するのに好ましい化学的決定基である。同様にして、化学構造に化学的決定基第14番が含まれる化合物は、2.4>0.00=0.00であるため、ドーパミン受容体に対するアゴニストやエストロゲン受容体に対するアンタゴニストではなくσ受容体のリガンドである可能性が大きい。また、化学的決定基第14番は、2.40>1.85>0.91であるため、σ受容体のリガンド群を構成するための好ましい化学的決定基である。最後に、化学構造に化学的決定基第15番が含まれる化合物は、28.17>2.93>0.91であるため、エストロゲン受容体を抑制する特性を示す可能性が最も大きい。つまり化学的決定基第15番は、28.17>0.05>0.00であるため、エストロゲン受容体に対する潜在的アンタゴニストの集合を構成するための好ましいフィンガープリントである。
【０１８８】
当業者にとって、このような表を作るのに式（III）や（IV）に関して説明したのとは異なる相関性指標および／または点数化関数を使用できることは明らかであろう。また、使用する点数化関数が、分子の材料に関係した変数や、生物特性および／または化学特性および／または物理化学特性に関係した別の変数（実施例1で挙げたもの）をさらに含むようにできることも理解できよう。さらに、個々の点数を互いに比較することがより簡単になるよう、点数化関数または点数化プロセスを変更して重み付けステップまたは規格化ステップが含まれるようにできることも明らかであろう。これがまさに上の表のケースであり、似たサイズの3つのサンプルを用いて表を構成してある。しかし他のデータ・セットにはこのことが当てはまらない可能性がある。最後に、同じ方法を利用し、発見プロセスにおいて興味の対象となる他の特性（例えば、一般的な治療の用途、毒性、吸収、分配、代謝、分泌など）をそれぞれの構造について点数化したものからなる参照リストを構成しうることも明らかであろう。
【０１８９】
実施例10−分子の二次的薬理作用の予測
本発明を利用することにより、さらに、分子の二次作用を予測することができる。そのことを示すため、実施例3に示したようにしてイオン・チャネル・ブロッカーの新しいクラスを同定した。このチャネルの他の阻害剤についてすでに説明したように、新しい化学的阻害剤の基本的な化学構造には、実施例3の図Bに示した化学的決定基、中でも実施例3の図Aに示した化学的決定基第5番の形態をした化学的決定基が含まれていた。化学的決定基第5番を上記の表に含まれる化学的決定基と比較することにより、特に化学的決定基第5番の化学構造が化学的決定基第14番の化学構造と同じであることがわかり、そのために興味の対象である阻害剤がσ受容体と結合する確率が非常に大きいことが推定された。そこで化学的決定基第5番を含むチャネル・ブロッカーをσ1受容体結合アッセイとσ2受容体結合アッセイによりテストし、このブロッカーが、両方の結合部位においてμM未満のアフィニティを示すことを見い出した。このように、これらの結果から、本発明の方法を用いて得られる点数によって化合物群の二次作用を予測できることがわかる。これは、医薬品化学において化合物群の性能を向上させるのに極めて有効である。
【０１９０】
実施例11−分子の毒性作用の同定と予測
これまでに示した実施例から、本発明の方法を用いると、病虫害防除剤、除草剤、殺虫剤などに含まれる親毒性化学的決定基を同定でき、しかも薬理活性の代わりに毒性に関する注釈の付いた構造を集めたリストを分析するだけでそれが可能になることが明らかである。同様に、本発明を、例えば作物保護のために農業化学プログラムで用いられる、より強力な、および／またはより選択性がある、および／またはより作用範囲の広い毒性化合物群に直接適用することもできる。
【０１９１】
また、本発明を利用し、実施例9で説明したのと同様にして、毒性化学的決定基の参照リストまたはデータベースを作ることもできる。このようなリストを用いると、例えば食品添加物や環境化学薬品のスクリーニングにおいて、ある化合物群が所定の毒性効果を示すかどうかを評価することができる。
【０１９２】
薬理学の研究において毒性効果を予測できることを示すため、炎症の治療において興味深い細胞のリン酸に対して4480種の化合物をテストした。合計で25種の化合物が、10μMの濃度でテストしたとき、少なくとも40％の抑制活性を示した。これらはすべて、IC₅₀が数μMの範囲であった。結果を本発明の方法に従って分析したところ、薬理活性の基礎になっている可能性が最も大きい明確に異なる2つの化学的決定基が同定された（化学的決定基第16番、化学的決定基第17番と呼ぶ）。これら2つの化学的決定基は同じ性能の分子として存在しており、両方とも、化学的追試が同程度に容易に行なえる化合物群を生成させると考えられたため、2つのうちのどちらを選択するかは、予測される毒性副作用に基づいて決定することにした。
【０１９３】
この目的で、化学的決定基第16番と第17番の構造を毒性データベースに含まれる構造と比較した。すると、構造中に化学的決定基第16番を含む分子が、化学的決定基第17番だけを含む化合物よりも細胞毒性が有意に大きい可能性のあることが見い出された。つまり化学的決定基第16番を含むホスファターゼ阻害剤は、薬理学的フィンガープリントの固有細胞毒性のため、性能向上にとってあまり興味深くないことを意味する。この仮説を実験的に検証するため、1μMの濃度にした両方のクラスの阻害剤に培養した細胞を曝露し、標準的なMTTアッセイを用いて細胞生存率を測定した。すると、化学的決定基第16番を含むすべての化合物が、添加後24時間以内に細胞死を誘導した。化学的決定基第17番を含む化合物の大部分では、このようなことはなかった。このように、これらの結果は、本発明の方法により、所定の設定において毒性特性を示す可能性の大きい化合物群を同定および／または予測できることをはっきりと示している。同様に、例えば突然変異誘発のデータ（エイムス試験）やP450アイソザイム抑制のデータ、あるいは他の関係した毒性テストからのデータを利用して同じ計算を実行できることも明らかであろう。
【０１９４】
実施例12−受容体リガンドの生物活性部分の同定
細胞表面の受容体を、所定の内分泌疾患を制御するための標的として選択した。この受容体は、下垂体が産生するナノペプチド・ホルモンによって生体内で活性化されることが知られている。科学文献を検索することにより、この受容体のリガンドとして知られている化学構造のリストを作った。次に、このリストを本発明の方法に従って分析した。そのとき用いたのは、相関性指標と、点数化関数（IV）と、20種類の一般的なアミノ酸（グリシン、アラニン、バリン、ロイシン、イソロイシン、プロリン、セリン、トレオニン、チロシン、フェニルアラニン、トリプトファン、リシン、アルギニン、ヒスチジン、アスパラギン酸、グルタミン酸、アスパラギン、グルタミン、システイン、メチオニン）の断片からなる化学的決定基のリストのほか、ペプチド骨格構造(NH-CH-CO-)₃の断片である。これら化学的決定基の具体例を以下に示す。
【化１２】

【０１９５】
これらが、アミノ酸とペプチド骨格に由来する化学的決定基として分析に用いたものの具体例である。科学文献を検索することにより受容体リガンドのリストを作り、本発明の方法に従って分析した。その際、相関性指標（III）と、点数化関数（IV）と、20種類の一般的なアミノ酸のさまざまな断片からなる化学的決定基のリストに加え、ペプチド骨格構造(-NH-CH-CO-) ₃の断片を用いた。トリプトファンに由来する化学的決定基の具体例をいくつか最初の2行に示してある。これらは、正確な断片（例えば化学的決定基第18番、第19番、第20番、第21番、第26番）、正確な断片の組み合わせ（例えば化学的決定基第22番）、不正確な断片（例えば化学的決定基第23番、第24番、第25番）、正確な断片と不正確な断片の組み合わせ（図示せず）のいずれかである。下の2行は、ペプチド骨格構造(NH-CH-CO-) ₃に由来する化学的決定基の具体例であり、正確な断片（例えば化学的決定基第29番、第31番、第32番）と、不正確な断片（例えば化学的決定基第27番、第28番、第30番、第33番）を表わしている。記号Aは、CまたはSを表わし、記号Bは、CまたはNを表わし、記号Eは、C、N、O、Sのいずれかを表わす。
【０１９６】
式（IV）を用いて断片を点数化すると、点数が1を超える多数の化学的決定基が同定された。これは、対応する構造が、単純に確率で考えると薬理活性のある化合物の集合の中に20分の1未満しか含まれていないことを意味する（p<0.05）。このような化学的決定基の具体例とそれぞれの点数を以下に示す。
【化１３】

【０１９７】
これらは、最初のラウンドで同定された点数の大きい化学的決定基の具体例である。点数化関数（IV）を用いてすでに示した化学的決定基とそれ以外の多くの化学的決定基を点数化することにより、受容体リガンドの集合を本発明の方法に従って分析した。1より大きな点数は、化学的決定基が、単純に確率で考えると受容体リガンドの集合の中に20分の1未満しか含まれていないことを意味する。上の図は、この方法で同定された点数のより大きな化学的決定基を示している。
【０１９８】
そこでこれらの化学的決定基を、ペプチド・ホルモンの一次配列に含まれる1つ以上のアミノ酸を代表していると認定し、第2のリストにまとめた。次に、式（IV）を用いて計算を繰り返し、これらの新しい化学的決定基の組み合わせで最高点になるものを同定した。多くのものの点数が10を超えた。次に、最高ランクの化学的決定基（化学的決定基第42番と呼ぶ）の構造を、20種類のアミノ酸のさまざまな組み合わせからなる800種のジペプチドの構造と比較したところ、1つのジペプチド配列（A₁-A₂と呼ぶ）だけが化学的決定基第42番の全体を含んでいることがわかった。この結果は、興味の対象であるホルモンがその一次構造中のどこかにA₁-A₂配列を含んでいる可能性が非常に大きいことと、これら2つのアミノ酸の少なくとも一方が、内在性リガンドが対応する受容体に結合する際に重要な役割を果たしていることを意味していると考えられれた。このホルモンの配列を確認したところ、予測されたA₁-A₂配列が実際に含まれていることが明らかになった。これは、計算によると、単純に確率で考えた場合には0.019の確率でしか起こらない事象である。興味深いことに、別の研究によると、A₁-A₂配列のA₂位置に突然変異を含むペプチド（A₁-A₂ではなく例えばA₁-A₃またはA₁-A₄になっている（ただしA₁、A₂、A₃、A₄は異なるアミノ酸である））は、この受容体に対して顕著に低いアフィニティを示すことが示された。これは、予測される2つの残基の少なくとも一方が、興味の対象であるホルモンの生物的機能の基礎となる重要な部分を実際に担っていることを示している。これらの結果を合わせると、本発明の方法により、ペプチド・リガンドの生物活性部分を同定できることがわかる。これは、例えばペプチドを真似た酵素阻害剤および／または受容体リガンドの合理的設計を目標とした医薬品化学プログラムにおいて有効である。
【０１９９】
実施例13−タンパク質−タンパク質相互作用の予測
本発明により、これまでに示した実施例で説明したのと同様の方法でタンパク質−タンパク質相互作用の存在を予測することもできる。そのことを示すため、イオン・チャネルのスクリーニングを実施例3に記載したようにして実現した。すると5μMの濃度でテストしたとき、少なくとも40％の抑制活性を示す分子が2ダース以上同定された。これら阻害剤の化学構造をリストにし、実施例12で説明したようにして分析した。すると、アミノ酸とペプチド骨格に由来する高い点数の一連の化学的決定基が同定された。これらをさらに分析したところ、興味の対象であるチャネルが、ある特定のジペプチド配列（A₅-A₆と呼ぶ）を含む抑制性ペプチドまたはタンパク質と相互作用する可能性が最も大きいことが見い出された。興味深いことに、このような抑制性タンパク質は、過去にすでに文献に記載されており、それらのすべては、まさに予測されたA₅-A₆ジペプチド配列を含む20アミノ酸“チャネル抑制”領域を含んでいた。単純に確率で考えると、20個のアミノ酸からなる任意の配列は、所定の2つの残基が所定の配列になったものを含む確率はわずかに0.046であるため、この実施例と前の実施例では、2つの互いに無関係なタンパク質に2つの異なるジペプチド配列が存在することを正確に予測できる確率は、1097分の1未満であると推定することができる。しかし正確な予測が両方の場合になされ、本発明により、所定のタイプのタンパク質−タンパク質相互作用の存在が同定および／または予測された。これは、単純に、薬理活性のある構造の集合から同定されたできるだけ大きな化学的決定基を含むアミノ酸配列を同定し、次いで興味の対象であるアミノ酸配列を含むタンパク質を配列データベースの中で検索することによって実行できる。この方法に関する説明は、以下の実施例14で行なう。同様に、当業者にとって、この方法が単にジペプチド配列の同定に限定されることはなく、分析している薬理活性化合物の構造によってはトリペプチド配列、さらにはテトラペプチド配列を検出できることも明らかであろう。また、同様の方法を非ペプチド・リガンドに用いうること、すなわちこの方法を、例えば炭化水素配列（すなわち糖）やヌクレオチドなどの検出に適用できることも明らかであろう。
【０２００】
実施例14−オーファン・リガンド−受容体ペアの同定
本発明は、さらに、オーファン・リガンドおよび／またはオーファン・リガンド−受容体ペアの同定に応用することもできる。この方法は、研究をしている時点でまだリガンドが知られていない興味の対象であるタンパク質（典型的には結合タンパク質）に対して所定の効果がある化学構造のリストを構成することから始まる。この情報は、多数の方法で得ることができる。例えば、NMR実験を行なうこと、円二色性によって立体配座の変化を測定すること、表面プラズモン共鳴によってタンパク質−リガンド相互作用を測定することなどによって、あるいはオーファン受容体の場合には、興味の対象である受容体の構成的に活性化された突然変異体に対してアッセイを行なうことなどによって情報を得る。
【０２０１】
この考え方を説明するため、上記のタイプの実験をオーファン受容体に対して行なったと仮定することにしよう。すると以下のような構造が得られる。
【化１４】

【０２０２】
これは、生物活性のある化学的決定基を探すために分析した構造の仮想的なリストである。実施例12に記載した本発明の方法に従い、上に示した9つの構造を分析した。その際、アミノ酸とペプチド骨格に由来する化学的決定基に関する前出のリストを利用した。
【０２０３】
実施例12で説明したようにして構造を分析すると、アミノ酸とペプチド骨格に由来する化学的決定基で点数が1を超えるものが多数同定される。そのような化学的決定基の具体例を、対応する点数とともに以下に示す。
【化１５】

【０２０４】
これらは、第1ラウンドの分析で同定された高い点数の化学的決定基の具体例である。実施例12の最初の図に示した化学的決定基とそれ以外の多数の化学的決定基を点数化関数（IV）を用いて点数化することにより、仮想的な受容体リガンドの集合を本発明に従って分析した。1より大きな数値は、単純に確率で考えると化学的決定基がリガンドの集合の中に20分の1未満しか含まれていないことを意味する。上に示したのは、この方法で同定された点数の大きな2つの化学的決定基である。
【０２０５】
これらの具体例から、化学的決定基第43番と第44番だけが、フェニルアラニンとチロシンというアミノ酸からなる化学構造に含まれうることが明らかである。このように、オーファン受容体と相互作用するペプチドは、その配列中にチロシン残基またはフェニルアラニン残基のいずれかを含んでいる可能性が大きいことと、これら残基が、リガンドの結合および／またはこれらペプチドによる受容体の活性化に重要な役割を果たしているらしいことが推測される。大きな点数の化学的決定基第43番と第44番を再度分析し、他のアミノ酸の断片との組み合わせがより大きな点数を生み出すかどうかを調べる場合には、以下の図Aに示す化学的決定基第45番のような断片がさらに同定される可能性がある。
【化１６】

【０２０６】
これらの図は、第2ラウンドの分析で同定された点数の大きい化学的決定基を示している。以前に説明したような化学的決定基を本発明に従って再度分析し、他のアミノ酸の断片との組み合わせがさらに大きな点数の構造を生み出すかどうかを明らかにした。これらのうちの1つ（化学的決定基第45番（図A）と呼ぶ）は、点数が40よりも大きかった。興味深いことに、化学的決定基第45番の全体が、チロシン−グリシン（図B）ジペプチド配列の構造に含まれている。したがって興味の対象であるオーファン標的の内在性リガンドは、その一次構造の中にチロシン−グリシン・ジペプチド配列を含んでいることが推測される。
【０２０７】
チロシン−グリシン・ジペプチド配列の構造に化学的決定基第45番の全体が含まれていることは明らかであるため、われわれが探しているオーファン・リガンドは、その一次構造内のどこかにチロシン−グリシン配列を含んでいる可能性が非常に大きい。この情報をもとにしてアミノ酸配列データベースをスクリーニングし、予測されるチロシン−グリシン配列を含む既知のリガンドおよび／またはオーファン・リガンドを同定することができる。このリガンドは、選択して発現させた後、最初の生化学スクリーニング・アッセイによりテストすることができる。別の方法として、潜在的なチロシン−グリシン類似物の集合を構成するのに化学的決定基第45番をそのまま用いることもできる。
【０２０８】
最後に、この実施例で使用した化学構造が実際には文献から選択したオピオイド受容体のアゴニストであること、また、オピオイド受容体の天然のアゴニストであるダイノルフィンA、β-エンドルフィン、ロイシンエンケファリン、メチオニンエンケファリンはすべて、予測されたチロシン−グリシン配列をその一次構造の中に含んでいることを指摘しておくのは価値があろう。チロシン残基はオピオイドのアゴニストの活性にとって絶対に必要であるため、この実施例からは、本発明を利用して受容体リガンドの生物活性部分を同定できることもわかる。また、例えばフィッシャーの直接法において変数x、y、z、Nを利用した別のアルゴリズムを用いることにより、上記の推測の精度を高められることも理解できよう。実際には、小さなサンプル・サイズに関する十分な補正をしていない方法を用いることにより、9つの構造だけを分析した。したがって、化学的決定基第45番の点数は幾分か過大評価されている可能性がある。
【０２０９】
実施例15−医薬標的の内在性モジュレータの同定
当業者にとって、医薬標的の内在性モジュレータの同定に本発明を適用できることは明らかであろう。そのことを具体的に示すため、神経変性疾患の治療における興味の対象であるイオン・チャネルに関し、機能アッセイを開発した。化合物の集合をスクリーニングし、得られた阻害剤のリストを分析し、実施例2に記載したようにして生物活性のある化学的決定基が存在しているかどうかを調べた。その結果、大きな点数の化学的決定基が同定された。この化学的決定基は、真核細胞の内部で産生される分子の集合に含まれることが見い出された。次に、対応する化合物を追跡し、上記アッセイでテストしたところ、興味の対象であるチャネルが、μM未満の濃度の特定のサブクラスの細胞リン脂質によって選択的に抑制されることが見い出された。さらに興味深いのは、この細胞リン脂質が、他の基によって未知のメカニズムを通じてニューロンのアポトーシスと以前に関係付けられていたことである。これらの結果を合わせると、本発明によって医薬標的の内在性モジュレータを同定できることがわかる。
【０２１０】
実施例16−間違って陽性になった実験結果の同定
免疫応答において重要な役割を果たしていると考えられているタンパク質キナーゼに関し、酵素アッセイを開発した。この標的に対するスクリーニング用の化合物の集合を、本発明の特に実施例2に説明したようにして構成した。次に、この化合物の集合を5μMの濃度で上記アッセイによりテストしたところ、少なくとも40％の抑制活性を示す35種の分子が同定された。これら化合物の構造を、式（II）を簡単化した式を点数化関数として用いて分析した。対応する点数を統計表の点数と直接比較した。その結果、所定の化学的決定基が35種の薬理活性化合物の中に存在する確率の推定値が得られた。
【０２１１】
存在確率の閾値をp<0.05にしたところ、35種の阻害剤のうちの14種が間違って陽性の結果になった可能性の大きいことが明らかになった。これら14種の化合物を上記アッセイで再度テストしたところ、この仮説が確認された。これは、本発明により、間違って陽性になった実験結果を同定できることを示している。
【０２１２】
実施例17−間違って陰性になった実験結果の同定
実施例16で説明したのと同様の計算を実行することにより、本発明を利用して、間違って陰性になった実験結果を同定することができる。そのことを具体的に示すため、実施例16に記載したようにして一連のホスファターゼ阻害剤の化学構造を分析し、薬理活性のある化学的決定基が存在しているかどうかを調べた。得られた大きな点数の化学的決定基を、薬理活性を有する“フィンガープリント”として使用し、このアッセイで最初にテストした化合物に対応する化学構造のリスト内で下部構造の検索を行なった。その結果、上記の化学的決定基を1つ以上含む多数の分子が明らかになったが、これらは、スクリーニング・アッセイにおいて陰性であることが示された。対応する分子をこのアッセイにより再度テストしたところ、15％を超える分子が間違って陰性になったことがわかった。しかも1つの化合物は、μM未満の抑制活性を示しさえした。これらの結果は、本発明の方法により、間違って陰性になった実験結果の同定が可能であることをはっきりと示している。
【０２１３】
実施例18−立体配置と立体配座の定量的分析の実行
本発明のさらに改良された実施態様では、変数x、y、z、Nのさまざまな組み合わせを含むアルゴリズムを利用して立体配座および／または立体配置の定量分析を行なうこともできる。このことが可能であるのは、実施例4に示した結果から明らかである。というのも、実施例4の図Bに示した薬理活性のあるプロテアーゼ抑制“フィンガープリント”の構造では立体配置も立体配座も規定されていないからである。実際、構造の表現からは、2つのカルボニル基またはスルホニル基に関し、薬理活性を持つのがフィンガープリントの単一結合バージョンのトランス-オイド立体配座なのかシス-オイド立体配座なのかを区別することは不可能であり、さらに、同じ構造の二重結合バージョンの場合に薬理活性を持つのがフィンガープリントの（E）立体配置なのか（Z）立体配置なのかを区別することは不可能である。その理由は、実施例4で行なった計算が、プロテアーゼ抑制活性の基礎になる可能性が最も大きい化学的決定基を同定することを目的としており、そのような化学的決定基が取りうる立体配座および／または立体配置は考慮していないからである。薬理活性のある多数の構造が二重結合および／または環系を含んでおり、これらが回転可能な結合の合計数を減らすことによって立体配座に関して化学的決定基に制約を与えているという事実に照らすと、本発明を利用して、所定の化学的決定基のどの立体配座および／または立体配置が最も薬理活性が大きいかを明らかにすることができる。
【０２１４】
このことを具体的に示すため、実施例4の図Bに示した構造に由来する一連の化学的決定基を、立体配座と立体配置を規定した上で点数化関数（IV）を用いて点数化することにより、実施例4に示した6つの（プロテアーゼ抑制）構造を分析した。
【化１７】

【０２１５】
この図は、プロテアーゼ抑制化学的決定基の立体配座および／または立体配置を定量的に分析した結果を示している。立体配座と立体配置が規定された化学的決定基のリストを用い、実施例4に示した6つの構造を本発明に従って分析した。
【０２１６】
化学的決定基第46番は、最高点になったものの1つであった。その横には点数が低い化学的決定基第47番が示してある。したがって、フィンガープリントの二重結合バージョンの（Z）立体配置が、興味の対象であるプロテアーゼ阻害剤の化学構造に含まれる好ましい配置であるらしいことが推測される。次に、ハイスループット・スクリーニングを行なうことによってこの仮説を検証した。このスクリーニングにより、薬理活性のあるフィンガープリントが実際に（Z）または“シス-オイド”立体配座になっている多数のプロテアーゼ阻害剤が得られた。そうなっていなかったのは、ほんのわずかのものだけだった。
【０２１７】
これらの結果を合わせると、本発明の方法により、化学的決定基の生物活性のある立体配座および／または立体配置を同定できることがわかる。最後に、このような計算は、変数x、y、z、Nのさまざまな組み合わせを利用した別の多数のアルゴリズムで実行できることがわかる。同様に、上記の推定は、追加の変数（例えば、化学構造の薬理学的な性能を考慮した変数など）をさまざまな点数化関数に含めることによってさらに精度を向上させうることを指摘しておく価値がある。
【０２１８】
実施例19−類似性検索の実行
これまでに示した実施例から、分子の類似性という考え方は、本発明の方法という観点からすると、この用語について一般に認識されているのとは非常に異なった意味を持つことが明らかであろう。例えば実施例14の仮想的リストに含まれる化合物は互いに非常に異なっているため、従来のクラスター化法を用いてその9つの分子を単一の化学ファミリーに分類する明白な方法はない。しかしわれわれは、実施例14において、これら化合物が実際に極端なほど互いに似ていることを示した。というのも、これら化合物のそれぞれが、チロシンというアミノ酸の断片からなる化学的決定基を少なくとも1つ含んでいるからである。以下の図を参照のこと。
【化１８】

【０２１９】
これは、チロシンというアミノ酸の断片がオピオイド受容体の9つのアゴニストの構造に含まれていることを示す図である。上に示した構造は互いに異なっているため、従来のクラスター化法を利用して単一の化学ファミリーにまとめることは難しい。しかしこれらは、本発明の意味では互いに非常に似ている。というのも、どれもが、チロシンというアミノ酸の断片からなる化学的決定基を少なくとも1つ含んでいるからである。なおその断片部分は、太線と太字で強調してある。
【０２２０】
このように、本発明を利用して、分子の類似性の測定、および／または異なる化合物群相互の間に存在している可能性のある類似性の比較を簡単に行なうことができる。この考え方を簡単にまとめると、化学構造のリストから1つ以上の参照分子を選択し、所定の化学的決定基が存在しているかどうかを分析し、存在している場合にはその化学的決定基を同定した後にその化学的決定基を用いて1つ以上の新しい分子の中で1つ以上の下部構造を探索し、それらが最初のものと似ているかどうかを確認するというものであることが容易にわかるであろう。これまでに示した実施例で説明したタイプの点数化関数を用いて対応する化学的決定基を点数化し、新しい化学構造を、例えばその化学構造に含まれている可能性のある異なる化学的決定基の数に基づいて点数化することにより、テストしている分子に、もとになる参照化合物群との類似度を反映した点数を割り当てることができる。この方法は、医薬品を発見するための目的が明確な化合物群を設計する上で非常に有用である。というのも、この方法により、薬理活性のある参照化合物と本発明の意味で非常に似た化合物を研究者が迅速に同定することができるからである。
【０２２１】
実施例20−化合物群の多様性の分析
本発明を利用すると、さらに、化合物の集合の多様性を、これまでに示した実施例で説明したのと同様の方法で分析することができる。同様に、当業者にとって、化学的決定基という考え方を利用すると、所定の化合物群を容易に別の任意の化合物群と比較できることは明らかであろう。例えばハイスループット・スクリーニング用の1つの化合物群を選択するには、化学構造に関する対応するリストを本発明に従って分析するとよい。ここでは、メルク・インデックス、ダーウェント、MDDR、ファルマプロジェクツなどのデータベースに含まれる参照用の化学構造の集合を“医薬様”分子の参照集合として利用する。この場合、構造のほとんどが点数の低い化学的決定基で構成されている分子は、“医薬様”と見なされる。というのも、この化学的決定基が参照構造の中に大きな割合で存在しているからである。逆に、構造のほとんどが点数の大きい化学的決定基で構成されている分子は、“非医薬様”と見なされる。というのも、この化学的決定基は、参照化合物群の中でほんのわずかな割合しか占めていないからである。この情報は、スクリーニングする化合物の集合に含めるべき化学構造、またはその集合から除外すべき化学構造を研究者が同定する際に役立つため、発見実験を設計する上で非常に有用である。同様に、この目的で、変数x、y、z、Nのさまざまな組み合わせを含む別の多数のアルゴリズムを利用できることも明らかであろう。
【０２２２】
実施例21−特殊なアルゴリズム
これまでに示した実施例からは、独立下部構造分析の実行に用いうる変数x、y、z、Nのさまざまな組み合わせを利用したアルゴリズムをすべて列挙したリストが得られないことが明らかであろう。同様に、当業者にとって、点数化関数（XII）、（XIII）、（XIV）を利用すると、これまでに示した実施例に現われた多数の問題に対処できることも明らかであろう。実際、場合によっては、統計的な意味で、実施例に明らかな形で示した式の代わりにこれらの式のうちの1つを使用するほうが適切なことさえある。しかし本発明は、主として、所定の生物学的効果の基礎となる可能性が大きい化学構造のリストに含まれる化学的決定基を同定するように設計されているため、われわれは、化学的決定基の相対点数化と、それに続くランク化に主に興味がある。しかし次のようなときのために式（XII）、（XIII）、（XIV）を下方に示しておく。すなわち、a）小さなサンプル群用に正確な存在確率が必要なとき（式（XII）を参照のこと。ただしsは、変数x、(y-x)、(z-x)、(N-y-z+x)のうちの最小値に対応する）；b）2つの化学的決定基からの同時寄与を比例方式で重み付けることが実施例8においてより適切であると感じられるとき（式（XIII）を参照のこと。ただしdは、独立な化学的決定基の数に対応する）；c）互いに関係した2つの化学的決定基からの同時寄与を評価するときに順番の効果が重要であると考えられるとき（式（XIV）を参照のこと）。なお変数x、y、z、Nの定義は、すでに記載したのと正確に同じである。
【数１３】

【０２２３】
最後に、当業者にとって、生物活性のある化学的決定基の同定用に設計した点数化関数および／またはアルゴリズム（これまでに示した実施例でははっきりとは説明しなかった）においていくつかの変数を使用することは、変数x、y、z、Nのさまざまな組み合わせを利用することと数学的に等価であることも明らかであろう。それをこれから示す。変数q（化学構造中に所定の化学的決定基を含んでいる不活性な分子の数と定義される）を用いた点数化関数は、xとyをq=y-xとして使用することと等価である。同様に、変数r（所定の化学的決定基を含まない活性化合物の合計数と定義される）を用いた点数化関数は、容易にわかるように、変数xとzをr=z-xとして用いることと代数的に等価である。また、変数s（所定の化学的決定基を含まない不活性化合物の合計数と定義される）を用いた点数化関数は、変数x、y、z、Nをs=N-y-z+xとして使用することと等価である。最後に、変数tとu（それぞれ、構造中に所定の化学的決定基を含まない分子の合計数（t）と、不活性な分子の合計数（u）を表わす）を用いたアルゴリズムは、容易にわかるように、変数N、y、zをt=N-y、u=N-zとして使用することと等価である。
【０２２４】
実施例22−相対寄与のマッピング
本発明により、相対寄与を図示することもできる。この図は化学構造をグラフとして表現したものであり、そこには、所定の生物特性に対するさまざまな原子、結合、断片、下部構造の相対寄与が、これまでに示した実施例で説明したようにして計算された点数で表示されている。この方法の好ましい一実施態様では、確率が使用される。この確率は、例えば式（XII）を用いて計算する。この式のP(A)は、所定の化学的決定基が生物活性のある構造の集合に含まれる確率を表わす。このP(A)は、すでに説明した変数x、y、z、Nのさまざまな組み合わせを利用した式を用いて計算される。
（XII）点数＝[1-P(A)] ・100％
【０２２５】
この場合、多数の相関性指標および／または点数化関数を利用してP(A)を評価できることが明らかである。相対寄与の図に関する2つの具体例についてさらに詳しく説明する。
【化１９】

上に示したのは、興味の対象である分子と、その分子の断片からなる一連の化学的決定基である。P(A)を決定するため、式（XII）と変形した相関性指標（I）を用いて化学的決定基を点数化した。図15は、同じ情報をグラフの形態にして示したものである。ここでは、それぞれの化学的決定基について、対応する点数がプロットされている。この場合には、以下の図に示すように同じ情報を確率輪郭マップの形態に表現できることも明らかであろう。
【化２０】

【０２２６】
要するに、化合物の集合を設計する上でこのような図は非常に有効である。というのも、研究者が、所定のアッセイで成功する可能性についての数学的評価をもとにして化合物を選択するのに役立つため、生物活性のある新規な化合物群を同定するのに分子の多様性という考え方に頼る必要性が少なくなるからである。このような図は医薬品化学にとっても興味深い。というのも、上の図に示したような表現は、薬理活性を失うリスクを最小にした状態で分子のどの部分を合理的に変えられるかをはっきりと示しているからである。逆に、このような図は、望ましくない効果を除去するのに毒性化合物のどの部分を変化させる必要があるかを毒物学者に警告している。
【０２２７】
上に示した相対寄与マッピングと図15に示した相対寄与マッピングを得るため、生物活性分子の断片に対応する化学的決定基を、変数x、y、z、Nを用いた点数化関数を利用して本発明に従って点数化した。この点数化関数は、活性分子群に含まれる確率P(A)を直接求めることのできる関数であった。式（XII）を用いて対応するP(A)の値を変換すると、それぞれの化学的決定基について、対応する化学構造が興味の対象である生物活性の基礎になっている可能性の相対確率が得られる。この確率は、さまざまな化学的決定基についての確率をグラフで表わした図15と同様にして表現することができる。化学的決定基第54番は、上に示した一連の化学的決定基の中の極大に対応している。別の方法として、確率は、上に示したような確率輪郭マップの形態にも表現できる。この確率輪郭マップは、興味の対象である化学構造のどの断片またはどの区画が生物活性に最も寄与するかを示している（化学的決定基第54番は、95％の輪郭線によって区切られた領域内に含まれる）。確率を表示する別の方法は図11に示したものである。
【０２２８】
実施例23−点数化関数の等価物
これまでの実施例で使用した点数化関数はすべて、所定の生物学的効果、および／または薬理効果、および／または毒性効果の基礎になっている可能性の大きな化学的決定基を同定するためのものである。相関性指標および／または点数化関数は、あるタイプの問題に対処する場合にだけ最適であることは当業者には明らかであるが、本発明の方法において使用すると、それぞれの式により、所定の生物学的効果の基礎になっている可能性の大きな最高ランクの化学的決定基を同定することができる。このように、これまでの実施例に現われた式は、独立下部構造分析という意味では機能的に互いに等価である。
【０２２９】
このことを明らかにするため、変数x、y、z、Nのさまざまな組み合わせを含む以下に示した8つの相関性指標と点数化関数を用い、ドーパミンD₂受容体の131種のアゴニストについて化学構造を同時に8回分析した。この研究は、すでに説明したようにして行なった。その際、特に、ドーパミンD₂受容体に対して効果のないことがわかっている101,207種の分子の化学構造を131種からなる最初のリストに追加し、点数化関数（XV）〜（XXIII）を用いて以下に示す19種の化学的決定基を点数化した。読者は、これら点数化関数が、これまでの多数の実施例で使用したのと同じ関数であること、および／またはそれと密接に関係した変化形を表わしていることが理解できよう。
【化２１】

【０２３０】
これらが、異なる8つの点数化関数を用いて点数化した化学的決定基である。上に示した19種の化学的決定基を点数化するとき、関数（XV）〜（XXII）と、ドーパミンD₂受容体のアゴニストの活性に関して注釈の付いた化学構造のリストを用いた。使用した関数は以下の通りである。
【数１４】

【０２３１】
図16A〜図16Hは、対応する相対寄与のグラフである。上の図に示した化学的決定基は、上に説明したようにして点数化し、対応する点数をプロットした。図16Aは、関数（XV）を用いて得られた点数を示している。図16Bは、関数（XVI）を用いて得られた点数であり、図16Cは、関数（XVII）を用いて得られた点数であり、図16Dは、関数（XVIIII）を用いて得られた点数であり、図16Eは、関数（XIX）を用いて得られた点数であり、図16Fは、関数（XX）を用いて得られた点数であり、図16Gは、関数（XXI）を用いて得られた点数であり、図16Hは、関数（XXII）を用いて得られた点数である。それぞれの点数化関数は、生物活性の基礎である可能性が最も大きい化学的決定基として、常に同じ化学的決定基（第73番）を選び出した。
【０２３２】
図16A〜図16Hに示した相対寄与のグラフからわかるように、8つの点数化関数のそれぞれは、化学的決定基第73番が極大に対応していることを正確に同定した。これは、この化学的決定基第73番が、テストした19種の化学的決定基のリストの中でドーパミンD₂受容体のアゴニストの活性の基礎となっている可能性が最も大きい化学的モチーフであることを意味している。興味深いことに、点数の低い化学的決定基のランク付けに関しては点数化関数ごとに状況が異なっていた。例えば化学的決定基第62番は、点数化関数（XV）、（XVI）、（XVII）を用いた計算において第3位にランクされたことで生物活性にとって重要であることが示唆されたのに対し、点数化関数（XXII）だと化学的決定基第63番が第3位にランクされ、点数化関数（XIX）と（XXI）だと化学的決定基第65番が第3位にランクされ、点数化関数（XVIII）と（XXII）だと化学的決定基第65番が第3位にランクされた。
【０２３３】
要するに、こうした微小な差は、本発明の方法がうまくいくかどうかにとってほとんど重要ではない。というのも、それぞれの場合において、ランクの低い化学的決定基は、実際にはランクのより高い化学的決定基第73番の断片になっているからである（上の図を参照のこと）。したがって、化学的決定基第73番とその断片をそのまま用いてハイスループット・スクリーニングのための化合物群を設計するだけでよい。そうすれば、化合物群に、ランクの低いそれぞれの化学的決定基を含む構造が常に含まれることになるからである。このような集合に組み込むことのできるタイプの化合物の具体例を以下に示す。
【化２２】

【０２３４】
これらサンプルの構造は、ドーパミンD₂受容体のアゴニスト同定用に設計した化合物の集合に組み込む際に選択できる化合物の具体例である。上に示したそれぞれの構造は、化学的決定基第73番、またはその一部を含んでいる。
【０２３５】
結論として、8つの異なる点数化関数を構成して使用することの裏にある数学的理由はそれぞれの場合で異なっているが、これらはすべて、生物活性の基礎になっている可能性が大きい化学的決定基をまさに1つだけ同定する。このように、既出の変数x、y、z、Nや、q、r、s、t、uのさまざまな組み合わせを含むアルゴリズムは、本発明の意味で機能的に等価である。
【０２３６】
実施例24−情報学に基づいた医薬発見ツール
これまでに示した実施例から、本発明を1つ以上の手続きに組み込めることが明らかであろう。例えば、ハイスループット・スクリーニングの効率を向上させるように設計したコンピュータ・プログラム、化合物の発見、ヒットからリード化合物へと進むための化学、化合物の改善、リード化合物の最適化などの手続きに組み込むことができる。このような手続きまたはプログラムは、医薬品のスクリーニング、化合物の選択、分子群の生成、化合物の合成を、人の監視による半自律的な方式で、あるいは完全に自動化された方式で行なうよう機械および／またはロボット・システムに対して指示を与える設計になっていることが好ましい。このような手続きには、本発明の好ましい実施態様を構成する以下のような例が含まれる。ただしこれがすべてではない。
・対応する実験結果の注釈が付いた化学構造を分析し、生物活性のある化学的決定基を本発明によって同定する方法。
・本発明によって同定した生物活性のある化学的決定基を用いて仮想的な化合物データベースまたはそれ以外のデータベースを検索し、所定の薬理特性、生化学特性、毒物特性、生物特性を示す化合物、生物学的製剤、試薬、反応生成物、中間体などを同定する方法。
・本発明によって同定した生物活性のある化学的決定基を、付随する実験データおよび／または点数とともに電子形態その他の形態でレジスタに記憶させ、それを定期的に更新する、あるいは定期的には更新しない方法。なおレジスタは、ハイスループット・スクリーニング、医薬品化学、リード化合物最適化において化合物、化合物群、骨格の選択を行なう際に決定を自動的に、あるいは非自動的に下すプロセスで使用するための構造情報の記憶庫として機能する。また上記の実験結果と点数は、所定の任意の薬理特性、生化学特性、毒物特性、生物特性と関係したものである。
・これまでに示した実施例のいずれかにおいて説明した本発明を利用して医薬標的の薬理学的モジュレータを同定する方法。医薬標的としては、例えば、受容体リガンド、キナーゼ阻害剤、イオン・チャネル・モジュレータ、プロテアーゼ阻害剤、ホスファターゼ阻害剤、ステロイド受容体リガンドなどが挙げられる。
・これまでに示した実施例のいずれかにおいて説明した本発明を直接利用して、あるいは化学構造の分析用に設計したコンピュータ・プログラムで使用して、化合物群の性能を向上させたり、化合物群の選択性を向上させたり、多数の薬理効果を有する化合物を設計したり、分子の潜在的な二次的薬理作用を予測したり、分子の潜在的な毒性作用を予測したり、受容体リガンドの生物活性部分を同定したり、潜在的なタンパク質−タンパク質相互作用を予測したり、オーファン・リガンド−受容体ペアを同定したり、医薬標的の内在性モジュレータを同定したりする方法。コンピュータ・プログラムでの使用は、機能的ゲノミクスとプロテオミクスの分野と特に関係がある。その場合、例えばヌクレオチド配列および／またはアミノ酸配列を選択し、その配列を、生化学スクリーニング・アッセイで同定して本発明の方法によって処理した分子の化学構造をもとにして調べること（例えばオーファン・リガンドの同定）ができる。
・本発明を直接利用するか、あるいは間違って陽性および／または陰性になった実験結果の同定用に設計したプログラムで利用する方法。
・例えば食品添加物、プラスチック、繊維などにおいて使用される化合物、あるいは食品添加物、プラスチック、繊維などとして使用される化合物のスクリーニングにおいて、本発明を直接利用するか、あるいは分子の効果のうち、人間、家畜、環境に対して潜在的に害をもたらす効果を予測するために設計したプログラムで利用する方法。
・本発明を直接利用するか、あるいは立体配置、立体配座、立体化学、類似性、多様性の分析用に設計したプログラムで利用する方法。
・本発明を直接利用するか、あるいは生物活性部分または化学構造の相対寄与マップおよび／またはグラフィック表示を生成するために設計したプログラムで利用する方法。
・医薬品、除草剤、殺虫剤の発見に使用する情報学のツール、コンピュータ・プログラム、エキスパート・システムが機能するよう、概略を上に説明した方法のうちのいずれかを単独で、あるいは連続的に組み合わせて、あるいは並列に組み合わせて用いる方法。
・点数という注釈付きで、あるいは注釈なしで化学的決定基が記憶されている更新可能なレジスタを使用していて、自動化されており、あるいは自動化されておらず、自律的な、あるいは自律的でない機械および／または器具の動作を指示するため、概略を上に説明した方法のうちのいずれかを単独で、あるいは連続的に組み合わせて、あるいは並列に組み合わせて用いる方法。なおこの方法は、薬理学および／または農業における発見の分野において、化学構造の合理的な生成、化合物の検索、実験プロトコルおよび／またはスクリーニング・データの合理的な生成、結果および／または化学構造の合理的な選択に使用される。
【０２３７】
本発明を組み込むことのできる他の手続きは、当業者が容易に思いつくであろう。
【図面の簡単な説明】
【０２３８】
【図１】図1は、本発明の好ましい実施態様におけるコンピュータ・システムのブロック・ダイヤグラムである。
【図２】図2は、本発明の好ましい一実施態様に従って独立下部構造分析を実行する際の主要プロセスのフローチャートである。
【図３】図3は、本発明の繰り返しプロセスを示す概略図である。
【図４】図4は、本発明の好ましい一実施態様に従って断片ライブラリを生成する方法のフローチャートである。
【図５】図5は、計算で求めた点数をもとにして断片を選択する方法を示すグラフである。
【図６】図6は、本発明の好ましい一実施態様に従って1つの断片についての点数を計算する方法のフローチャートである。
【図７】図7は、繰り返しを実行する際に断片ライブラリを分析する方法のフローチャートである。
【図８】図8は、一般的な下部構造を用いて新しい化合物を選択する方法のフローチャートである。
【図９】図9は、仮想的スクリーニングで使用する下部構造を生成する方法のフローチャートである。
【図１０】図10は、繰り返しを実行する際に、本発明の好ましい一実施態様に従ってアニーリング法を適用して断片ライブラリを分析する方法のフローチャートである。
【図１１】図11は、図10に示した方法で利用するアニーリング法を説明するための相対寄与マップの一例である。
【図１２】図12は、ある化合物が受容体を媒介としたイノシトール三リン酸の生成に及ぼす効果を示すグラフである。
【図１３】図13は、ある化合物がキナーゼに依存したタンパク質のリン酸化に及ぼす効果を示すグラフである。
【図１４】図14は、ある化合物がホスファターゼに依存したタンパク質の脱リン酸化に及ぼす効果を示すグラフである。
【図１５】図15は、化学的決定基とそれに対応する点数をプロットすることによって相対寄与に関する情報を示したグラフである。
【図１６−１】図16A〜図16Hは、相対寄与のグラフの別の例であり、点数化関数が互いに同等であることを示している。
【図１６−２】図16-1の続き。
【図１６−３】図16-2の続き。
【図１６−４】図16-3の続き。

【特許請求の範囲】
【請求項１】
独立下部構造分析を実行するためのコンピュータ・システムの操作方法であって、
分子構造情報と、生物特性および／または化学特性とによって検索可能な分子構造のデータベース（110、115）にアクセスするステップ（210、220、410）と；
このデータベース内で、所定の生物特性および／または化学特性を有する分子群を同定するステップ（220）と；
この分子群の中で分子の断片を決定するステップ（230、420）と；
それぞれの断片について、上記所定の生物特性および／または化学特性に対する個々の断片の寄与を表わす点数を計算するステップ（230、430、610〜650）と；
決定された断片と計算された点数を分析して（250）繰り返しプロセスを実行する（240、250）ことにより、まず最初に、上記の生物特性および／または化学特性への寄与が大きいことを示す点数を有する少なくとも1つの断片を選択し、次いでアクセスし、同定し、決定し、計算するという上記ステップを繰り返す方法。
【請求項２】
点数を計算する上記ステップが、
分子群の中で所定の断片を含む分子の数（x）を計算するステップ（610）を含む、請求項1に記載の方法。
【請求項３】
上記データベースの中で上記の生物特性および／または化学特性を持たない第2の分子群を同定するステップをさらに含み；
点数を計算する上記ステップが、
上記分子群と上記第2の分子群で所定の断片を含んでいる分子数（y）を計算するステップ（620）を含む、請求項1または2に記載の方法。
【請求項４】
点数を計算する上記ステップが、
上記分子群に含まれる分子数（z）を計算するステップ（630）を含む、請求項1〜3のいずれか1項に記載の方法。
【請求項５】
上記データベース内で上記の生物特性および／または化学特性を持たない第2の分子群を同定するステップをさらに含み；
点数を計算する上記ステップが、
上記分子群と上記第2の分子群に含まれる全分子数（N）を計算するステップ（640）を含む、請求項1〜4のいずれか1項に記載の方法。
【請求項６】
次のラウンドでは前のラウンドよりも分子量が大きな断片を選択して上記繰り返しプロセスを実行する、請求項1〜5のいずれか1項に記載の方法。
【請求項７】
計算された点数に基づいて断片を選択するステップ（710）と；
選択された断片の構造を分析するステップ（810）と；
この断片構造の中に一般化されたアイテムを配置するステップ（820）と；
一般化されたアイテムを一般化された表現で置き換えることによって一般的な下部構造を生成するするステップ（830）をさらに含む、請求項1〜6のいずれか1項に記載の方法。
【請求項８】
一般的な上記下部構造を用いて仮想的スクリーニングを実施するステップ（840）をさらに含む、請求項7に記載の方法。
【請求項９】
決定された断片と計算された点数を分析する上記ステップが、
計算された点数に基づいて第1の断片を選択するステップ（1010）と；
計算された点数に基づいて第2の断片を選択するステップ（1020）と；
アニーリング関数を適用することにより、この第1の断片と第2の断片を含む分子構造を生成するステップ（1030）とを含む、請求項1〜8のいずれか1項に記載の方法。
【請求項１０】
決定された断片と計算された点数を分析する上記ステップが、
計算された点数に基づいて少なくとも1つの断片を選択するステップ（710）と；
選択された断片を含む化合物を前の分子群から抽出するステップ（720）と；
選択された断片を含まない化合物を前の分子群から選択するか、あるいは前の分子群に含まれない化合物を選択するステップ（730）と；
抽出された上記化合物と選択された上記化合物を含む新しい分子群を形成するステップ（740）とを含む、請求項1〜9のいずれか1項に記載の方法。
【請求項１１】
決定された断片と計算された点数を含む断片ライブラリ（120）を生成するステップ（230）を含む、請求項1〜10のいずれか1項に記載の方法。
【請求項１２】
上記データベースが私有データベースである、請求項1〜11のいずれか1項に記載の方法。
【請求項１３】
上記データベースが公共データベースである、請求項1〜12のいずれか1項に記載の方法。
【請求項１４】
上記データベースが、アミノ酸配列および／または核酸配列のデータベースであり、上記の生物特性および／または化学特性が、興味の対象であるタンパク質に対する所定の効果である、請求項1〜13のいずれか1項に記載の方法。
【請求項１５】
上記の生物特性および／または化学特性が薬理学的特性であって医薬品の発見に利用される、請求項1〜14のいずれか1項に記載の方法。
【請求項１６】
決定された断片を少なくとも1つ含む化合物群を集めるステップ（260）をさらに含む、請求項1〜15のいずれか1項に記載の方法。
【請求項１７】
集められた上記化合物群について所定の生物特性および／または化学特性を検査するステップをさらに含む、請求項16に記載の方法。
【請求項１８】
請求項1〜17のいずれか1項に記載の方法を実行する構成にされたコンピュータ・プログラム製品。
【請求項１９】
請求項1〜17のいずれか1項に記載の方法を実行することにより生成された断片ライブラリ。
【請求項２０】
独立下部構造分析を実行するためのコンピュータ・システムであって、
分子構造情報と、生物特性および／または化学特性とによって検索可能な分子構造データベースにアクセスする手段（100、110、115）と；
所定の生物特性および／または化学特性を有する分子群をこのデータベース内で同定する手段（100、130）と；
この分子群内で分子の断片を決定する手段（100、130、135）と；
各断片について、上記所定の生物特性および／または化学特性に対する各断片の寄与を示す点数を計算する手段（100、130、140）と；
繰り返しが実行されたかどうかを明らかにし、実行された場合には、決定された断片と計算された点数を分析し、繰り返しプロセスを実行する手段（100、130）とを含む、コンピュータ・システム。
【請求項２１】
請求項1〜17のいずれか1項に記載の方法を実行する構成にされた、請求項20に記載のコンピュータ・システム。
【請求項２２】
請求項1〜17のいずれか1項に記載の方法を実行することによって決定された少なくとも1つの断片を含む分子を合成することによって得られる医薬化合物。

【図１】

【図２】

【図３】

【図４】

【図５】

【図６】

【図７】

【図８】

【図９】

【図１０】

【図１１】

【図１２】

【図１３】

【図１４】

【図１５】

【図１６−１】

【図１６−２】

【図１６−３】

【図１６−４】

【公開番号】特開２００７−１３７８８７（Ｐ２００７−１３７８８７Ａ）
【公開日】平成１９年６月７日（２００７．６．７）
【国際特許分類】

【出願番号】特願２００６−３２７４０５（Ｐ２００６−３２７４０５）
【出願日】平成１８年１２月４日（２００６．１２．４）
【分割の表示】特願２００２−５３６９１４（Ｐ２００２−５３６９１４）の分割
【原出願日】平成１３年１０月１６日（２００１．１０．１６）
【出願人】（５９９１７７３９６）アプライド　リサーチ　システムズ　エーアールエス　ホールディング　ナームロゼ　フェンノートシャップ (70)
【Ｆターム（参考）】

[ Back to top ]

独立下部構造分析を実行するためのコンピュータ・システムの操作方法

メニュー

スポンサーリンク

次の公報 »

« 前の公報

独立下部構造分析を実行するためのコンピュータ・システムの操作方法

メニュー

スポンサー リンク

次の公報 »

« 前の公報

スポンサーリンク