タンパク質凝集を予測し凝集阻害物質を設計する方法

本発明は、タンパク質の凝集を予測し、さらに凝集阻害物質を設計する方法を提供する。潜在的なタンパク質凝集阻害ペプチド配列を予測するそのような方法の１つは以下の工程を含む：a）標的タンパク質において凝集領域の少なくとも一部を形成するペプチド配列を同定する工程；b）前記ペプチド配列がβ-シートの一部を構成するか否かを試験する工程；c）工程b）で陽性結果が得られた場合、当該シートの隣接する鎖を抜き出す工程；d）前記隣接する鎖内の残基であって、前記ペプチド配列と相互作用する残基を同定する工程であって、前記残基が潜在的なタンパク質凝集阻害ペプチド配列を構成する、前記工程。本発明はまた、上記方法で同定された残基を用いて化合物を設計する方法、上記方法によって製造される化合物、及び上記方法を実行するコンピュータプログラムを提供する。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、タンパク質凝集を予測し、さらに凝集阻害物質を設計する方法に関する。本発明は特に、凝集に対抗してタンパク質を安定化させ、したがって潜在的にタンパク質の保存期間を延長し、タンパク質の免疫原性を減少させ、さらにin vitro翻訳系における収量を高めることを目的とする化合物の設計を促進する方法に関するが、これらに限定されない。
【背景技術】
【０００２】
細胞又は細胞内間隙への折りたたみ異常タンパク質の沈積が、多くの重大な医学的障害、とりわけアルツハイマー病、パーキンソン病及び2型糖尿病のような疾患で役割を果たすことが見出されている。このような症状の治療のために世界中の健康管理システムが被る出費は莫大であり、罹患者及びその家族の生活における影響もまた然りである。
平均寿命が延びるにつれ、症例数は恒常的に増加しそうである。この増長する問題に向けて、タンパク質の凝集物形成能を初期に妨げることによる新規な治療法が開発されつつある。
タンパク質の細胞内での典型的なライフサイクルは、リボソームでのポリペプチドの合成で始まり、さらに最初の折りたたまれていない状態から折りたたみ経路（1つ又は数個の折りたたみ中間体を含む可能性がある）を経由して、タンパク質の生物学的に活性な天然の状態へと続く。ほとんどのタンパク質について、この天然の状態は、しっかりと折りたたまれた構造と一致するが、ただしいくつかの例外が存在し、そのうちの1つはα-シヌクレインで、これは天然の状態では折りたたまれていない（VN Uversky, 2002, Natively unfolded proteins: A point where biology waits for physics, Protein Sci, 11:739-756）。タンパク質のライフサイクルは変性及び分解で終わる。
【０００３】
細胞は、タンパク質の折りたたみプロセスを促進する巧妙な品質管理メカニズムを保有する。これらのうちの第一はリボソーム自体である。第二に、タンパク質は熱ショックタンパク質及びシャペロンによって支援される。熱ショックタンパク質及びシャペロンは、触媒又は促進因子として作用し、タンパク質を正確な態様で折りたたみ、又は異常に折りたたまれたタンパク質を再度折りたたむ（Evans MS, Clarke TF IV, Clark PL (2005) Conformations of Co-Translational Folding Intermediates, Prot Pept Let 12(2):189-195）。
再折りたたみが失敗する場合は、異常折りたたみタンパク質はユビキチン-プロテアソーム系によってプロセッシングされる。第一の工程では、ユビキチンは不完全な構造と結合している。これらのタグはポリペプチド鎖に分解の目印を付け、この作業はプロテアソームによって遂行される。折りたたみ及び異常折りたたみプロセスのより詳細な記述は以下で見出されえる：Dobson CM (2003) Protein folding and misfolding, Nature 426:884-890；及びVendruscolo M, Zurdo J, MacPhee CE, Dobson CM (2003) Protein folding and misfolding: a padadigm of self-assembly and regulation in complex biological systems, Phil Trans R Soc Lond A 361:1205-1222）。
しかしながら、細胞の品質管理は多様な理由により失敗し、異常折りたたみタンパク質の蓄積が発生しえる。続いて、これらのタンパク質は凝集し稠密構造物を形成することができる。前記はアミロイド原線維と呼ばれ、β-シートの連続集合物から成るコア領域を有する（Dobson CM (2005) Prying into prions, Nature 435:747-749）。
【０００４】
生きている組織では、タンパク質の沈積（しばしばアミロイド凝集形として）はしばしば多様な疾患と密接に結びつき、それらの多くは年齢と関係がある。例えば、これらの疾患には、神経変性疾患（例えばパーキンソン病、アルツハイマー病及び海綿状脳障害）とともに全身性（例えば免疫グロブリン軽鎖又はトランスサイレチンアミロイドーシス）及び末梢性組織障害（例えば2型糖尿病）が含まれる。ヒトでは、30を超える種々の異常がタンパク質沈積と密接に関係していることが知られている。
特に発展途上国（寿命が持続的に上昇を続けている）では、絶え間なく増加しつづけるこれら疾患の罹患者数は、前例のないますます深刻化する問題を社会に押し付けている。
2000年には米国だけで約450万人がアルツハイマーに罹患し、症例数は2050年までに1600万人に増加しえると概算されている（Hebert LE, Scherr PA, Bienias JL, Bennett DA, Evans DA (2003) Alzheimer Disease in the U.S. Population: Prevalence Estimates Using the 2000 Census, Arch Neurol 60:1119-1122）。この神経変性疾患に罹患するリスクは、60歳を超えた人では10人に1人、85歳を超えた人では2人に1人と概算されている（Evans DA, Funkenstein HH, Albert MS, Scherr PA, Cook NR, Chown MJ, Hebert LE, Hennekens CH, Taylor JO (1989) Prevalence of Alzheimer's Disease in a Community Population of Older Persons. Higher than Previously Reported, Jama 262:2551-2556）。保険システムにおける影響は甚大で、幾人かの著者は、神経変性疾患は死因の第一となりえると予想している（Lozano AM, Kalia SK (2005) New Movements in Parkinsons's, Sci Am, 291(1):58-65）。
さらにまた、溶液中で凝集を形成する生物分子の性質は、常に薬剤設計における主要な問題の１つであった。治療用分子は可溶性であると同時に反応性を有する必要があり、さらに比較的高濃度で投与されるとき又長期間にわたって凝集を形成してはならない。多くの事例で、そのようなポリペプチドが十分に安定である条件を見つけることは、多くの時間及び費用を必要とし、これまでに利用可能な方法では時には不可能でさえあることが判明している。折りたたみプロセスを妨げて凝集の形成を遅らせる方法を見つけることは、したがって薬剤開発効率の改善を可能にする。
【発明の概要】
【０００５】
したがって、上記の問題に対する好ましい支援のためには、凝集プロセスを駆動させるもっとも重要な部位と競合的に結合し、前記部位を封鎖することができるように、溶液中で病理学的タンパク質又は治療用分子と相互作用する化合物を設計できることが所望される。この目標の達成に近いものの1つは、凝集プロセスを妨害するペプチド由来分子の設計することを含むであろう。
したがって、本発明の特徴は、最も広くは、タンパク質凝集阻害ペプチドを設計する方法を提供し、前記方法は、側鎖が標的タンパク質中の凝集しやすい領域と相互作用するペプチド配列を同定することを必要とする。
本発明の第一の特徴は、潜在的なタンパク質凝集阻害ペプチド配列を予測する方法を提供し、前記方法は以下の工程を含む：
a）標的タンパク質において凝集領域の少なくとも一部を形成するペプチド配列を同定する工程；
b）前記ペプチド配列がβ-シートの一部を構成するか否かを試験する工程；
c）工程b）で陽性結果が得られた場合、当該シートの隣接する鎖を抜き出す工程；
d）前記隣接する鎖内の残基であって、側鎖が前記ペプチド配列と相互作用する残基を同定する工程（これらの残基は潜在的なタンパク質凝集阻害ペプチド配列を構成する）。
【０００６】
好ましくは、上記試験する工程は、標的タンパク質に対し複数の異種タンパク質について実施される。したがって、標的タンパク質の凝集領域がβ-シートの一部を構成しない場合でも、適切なペプチド配列は確かにβ-シートを構成する他のタンパク質で見出される類似又は同一配列から同定することができる。
この試験は、タンパク質構造のデータベースを用いることによって実施することができ、好ましくは、前記ペプチド配列が、当該データベースに存在する既知のタンパク質のいずれかでβ-シートの一部を構成するか否かが試験される。本発明の実施態様では、RCSB（Research Collaboratory for Syructural Bioinformatics）のタンパク質データバンク（PDB）のデータが用いられる（前記は多数の実験的構造及び理論モデルを含む：Berman HM, Westbrook J, Feng Z, Gilliland G, Bhat TN, Weissig H, Shindyalov IN, Bourne PE (2000) The Protein Data Bank, Nuc Acids Res 28:235-242）。2005年6月27日にはPDBに31639の構造が存在していた。しかしながら、他の構造データベース又はデータバンクを用いてもよい。
凝集阻害ペプチドを予測する第一の工程は、標的タンパク質内の1つ以上の凝集領域、及びこの領域の少なくとも一部を形成するペプチド配列を同定する工程である。
【０００７】
この領域を同定する好ましい方法は、アミロイド凝集プロファイルを使用することである。ポリペプチド鎖内の凝集ホットスポットを予測するこの理論的方法は以下に記載されている：DuBay KF, Pawar AP, Chiti F, Zurdo J, Dobson CM, Vendruscolo M (2004) Prediction of the Absolute Aggregation Rates of Amyloidogenic Polypeptide Chains, J Mol Biol 341:1317-1326；及びPawar AP, DuBat KF, Zurdo J, Chiti F, Vendruscolo M, Dobscon CM (2005) Prediction of "aggregation-prone" and "aggregation-susceptible" regions in proteins associated with neurodegenerative diseases, J Mol Biol 350:379-392。本方法は、アミノ酸の多数の本質的な特性を基準にして、任意のタンパク質のアミロイド凝集傾向を算出するために用いることができるアルゴリズムを提供する。
標的タンパク質についていったんアミロイド凝集プロファイルが入手できたら、凝集領域は、前記プロファイル内の凝集傾向が予め定めた量を超えるタンパク質部分を考察することによって同定できる（例えば1）。
また別には或いは前記に加えて、凝集領域は実験的測定によって、例えばペプチド若しくはタンパク質又はそのフラグメントの残基の各々に系統的変異を導入し、さらにそのようなペプチド若しくはタンパク質又はそのフラグメントのフラグメントを合成し、さらにin vitroアッセイでそれらの凝集傾向を分析することによって同定することができる。
【０００８】
好ましくは、試験工程は以下の下位工程を含む：標的タンパク質の凝集領域の少なくとも一部を形成するペプチド配列と関連する関連ペプチド配列を含む、タンパク質構造データベースに含まれるタンパク質群を同定する下位工程、及び、前記関連ペプチド配列がβ-シートの一部を構成するタンパク質を当該群内で同定する下位工程。
ヒット（すなわち、関連ペプチド配列がβ-シートの一部を構成する同定タンパク質）の予想される数を高めるために、関連ペプチド配列は、好ましくは注目するペプチド配列及び前記ペプチド配列のフラグメントを含む。
また別には或いは前記に加えて、ヒットの予想される数を高めるために、関連ペプチド配列は、1つ以上のアミノ酸の保存的置換を含む配列を注目するペプチド配列とともに含むことができる。
この工程の状況では、保存的置換は、置換されるアミノ酸の凝集特性が保存される置換である。特に、保存的置換は、pH7.0で互いに凝集特性が0.2以内であるアミノ酸を基準にして選択することができる。また別には或いは前記に加えて、保存的置換は類似する特性（例えば塩基性、酸性、疎水性、極性、芳香族性）を基準にして選択することができる。
より好ましくは、関連ペプチド配列は、順方向及び逆方向の両方向で上記ペプチド配列の1つ以上を含む。
【０００９】
本特徴のある実施態様では、データベースに含まれるタンパク質群を同定する下位工程は、問題のタンパク質についてPDBファイルの“SHEET”行に含まれる残基と関連ペプチド配列を比較することを含む。
また別には或いは前記に加えて、データベースに含まれるタンパク質群を同定する下位工程は、互いに水素結合を形成する関連ペプチド配列内の残基を同定することを含む。
互いに水素結合を形成する残基を同定しえる方法は、当該距離が3.2オングストローム未満であるならば、より好ましくは当該距離が3.075オングストローム未満であるならば水素結合が形成されると仮定して、少なくとも3残基離れている各残基対間のユークリッド距離を算出することである。ある実施態様では、これらのユークリッド距離は問題のタンパク質についてPDBファイルから“ATOM”エントリーを用いて算出される。
好ましくは、前記方法は互いに水素結合を形成する同定残基対及び形成水素結合を表示するさらに別の工程を含む。
タンパク質群を同定する上記方法の一方の結果の有効性をチェックするために、両方法から得られた結果を用いて、もう一方の方法から同定された残基をクロスチェックすることができる。そのようなクロスチェックは、また別には或いは前記に加えて、タンパク質群を同定する他の複数の方法を用いて実施することができる。
【００１０】
前記方法は、好ましくは、工程d）で同定された残基を表示するさらに別の工程を含み、さらにこれらの残基を同定したタンパク質についての情報を表示する工程もまた含むことができる。この表示はβ-シート内の同定残基の三次元配置の形式を採用することができる。
好ましくは、前記方法は、標的タンパク質の凝集領域の部分を構成するペプチド配列との相互作用に直接的に参画しない、潜在的なタンパク質凝集阻害ペプチド配列の隣接する鎖の骨格及び側鎖を改変して、前記標的タンパク質のペプチド配列との相互作用を最大にし、潜在的凝集阻害配列の潜在的凝集阻害特性を高める工程をさらに含む。
いったん、1つ以上のペプチド配列又は“鋳型”が同定されたら、問題の凝集領域との相互作用に直接的に関与しない鋳型領域に多様性を導入するペプチドライブラリーを設計し合成することができる。続いて、このライブラリーを専門の生化学的凝集アッセイ及び細胞傷害アッセイを用いてスクリーニングして、多様な化合物の存在下でタンパク質の凝集速度及び毒性における変化を精査することができよう。
このライブラリーは、好ましくは、候補アミノ酸配列に特性（例えば安定性及び可溶性）を改善する改変を付加することによって作製される。
【００１１】
本明細書に記載の方法は、例えば以下の工程を含むことができる：e）ペプチドライブラリーを合成する工程（前記ペプチドライブラリーのメンバーは工程d）で同定された残基を含む）、及びf）前記ライブラリーのメンバーの標的タンパク質に対する結合親和性を決定する工程。
コントロールと比較して高い親和性で標的タンパク質と結合する1つ以上のペプチドをライブラリーで同定することができる。そのようなペプチドはタンパク質凝集阻害ペプチド候補物質でありえる。
標的タンパク質と高親和性で結合することが判明したペプチドを単離し、精製し及び／又は合成することができる。
上記のように予測又は同定されたペプチド配列を細胞プロセスとの干渉（すなわち中毒）についてスクリーニングすることができる。例えば、その方法は以下の工程を含むことができる：上記工程d）で同定された残基が、タンパク質データバンク（又は任意の他のタンパク質データベース）に存在する1つ以上の非標的タンパク質、好ましくは極めて重要な細胞プロセス（例えば代謝経路、イオン恒常性）を仲介しえる非標的タンパク質、構造タンパク質、ストレスへの応答、遺伝子発現調節、DNA修復などに必要なタンパク質と相互作用するか否かを試験する工程。
【００１２】
前記試験工程は、前記標的タンパク質に対し異種であるタンパク質について、好ましくはタンパク質構造データベースを用いて実施することができる。試験は、例えば、テストペプチド配列と関連する関連ペプチド配列を含む、データベース内のタンパク質群を同定することによって；及び前記関連ペプチド配列が上記工程d）で同定した残基と相互作用するようなタンパク質を前記群内で同定することによって実施することができる。
極めて重要な細胞プロセスを仲介するタンパク質と相互作用しないタンパク質凝集阻害ペプチド配列候補を同定することができる。
上記のように同定したペプチド配列の有効性はタンパク質異常折りたたみ疾患のモデルで決定することができる。
タンパク質異常折りたたみ疾患のモデルは当分野で周知である。適切なモデルには、凝集しやすいタンパク質を過剰発現する細胞、及びトランスジェニック動物モデル（例えばマウス又はキイロショウジョウバエモデル、前記は凝集しやすいタンパク質を過剰発現し、さらに他のチャレンジ（例えば酸化ストレスなど）に暴露されているか又はされていない）が含まれる。
例えば以下を参照されたい：
June E, Mouradian MM, Human alpha-synuclein over-expression increases intracellular reactive oxygen species levels and susceptibility to dopamine, Neurosci Lett 2002, 320:146-50
Lev N, Melamed E, Offen D, Proteasomal inhibition hypersensitizes differentiated neuroblastoma cells o oxidative damage, Neurosci Lett, 2006, 399:27-32
McGowan E, Erilsen J, Hutton M, A decade of modeling Alzheimer's disease in transgenic mice, Trends Genet, 2006, 22:281-9
Whitworth AJ, Wes PD, Pallanck LJ, Drosophila models pioneer a new approach to drug discovery for Parkinson's disease, Drug Discov Today, 2006 Feb, 11(3-4):119-26
【００１３】
凝集しやすいタンパク質には以下のタンパク質、前駆体又はそのフラグメントが含まれる：α-シヌクレイン（野生型及びパーキンソン病に付随する任意の変異体）、ハンチングチン（および増幅ポリグルタミン又はポリアラニンリピートを有する他のタンパク質）、アミロイドベータペプチド（Aβ42）、プリオンタンパク質、小島アミロイドポリペプチド（hIAPP）又はアミリン、スーパーオキシドジスムターゼ（Superoxyde Dismutase）、タウ、アルファ-1-アンチトリプシン及び他のセルピン、リゾチーム、ヴィトロネクチン、クリスタリン、フィブリノーゲンアルファ鎖、アポリポタンパク質AI、シスタチンC、ゲルソリン、ラクトフェリン、ケラトエピセリン、カルシトニン、心房性ナトリウム排泄増加因子、プロラクチン、ケラチン、メディン（又は完全長ラクトアドヘリン）、免疫グロブリン軽鎖、トランスサイレチン（TTR）、アポ血清アミロイドAタンパク質（SAA）、ベータ2-ミクログロブリン、免疫グロブリン重鎖、又は任意のタンパク質異常折りたたみ疾患に付随する任意の他のタンパク質。
上記のように同定されたペプチド配列の以下の1つ以上を遂行する能力を決定することができる：
i）凝集に対してタンパク質を安定化させる；
ii）保存時のタンパク質の活性低下速度を減速させる；
iii）タンパク質の凝集仲介免疫原性を低下させる；
iv）in vitro翻訳系におけるタンパク質収量を増加させる；
v）治療薬として使用される処方物の溶液中での安定性を高める；
vi）1つ以上の細胞プロセスを阻害する；
vii）タンパク質のオリゴマー化又はマルチマー化を防止する。
【００１４】
本発明のさらに別の特徴は、上記第一の特徴の工程d）で同定された残基を用いて、タンパク質異常折りたたみ疾患を治療するための凝集阻害物質を設計する方法；前記同定された残基を用い、処方物、ビヒクル、及び他の溶液中で凝集に対してタンパク質（例えば生物医薬、抗体、酵素など）を安定化させる化合物を設計する方法；前記同定残基を用い、そのようなタンパク質の保存期間を延長するための化合物を設計する方法；前記同定残基を用い、凝集によるタンパク質の免疫原性を低下させる化合物を設計する方法、及び前記同定残基を用い、in vitro翻訳系におけるタンパク質の収量を増加させる化合物を設計する方法を提供する。
本発明の別の特徴はコンピュータプログラムを提供し、前記プログラムはコンピュータで実行したとき上記の特徴のいずれかの方法を遂行する。
本発明の別の特徴は、前記特徴のコンピュータプログラムを収納するコンピュータデータ担体を提供する。
本発明のさらに別の特徴は、上記方法の特徴のいずれかの方法を実施するために設計されたコンピュータを提供する。好ましくは、このコンピュータは、予測の入手に使用される、既知タンパク質に関する情報が収められたデータベースにアクセスするために設計された汎用コンピュータである。そのようなデータベースはローカル端末、例えばハードディスクドライブ又はメモリーに保存することができるが、好ましくは遠隔装置に保存され、通信リンク（例えばネットワークまたはインターネット）を通じてアクセスされる。
【図面の簡単な説明】
【００１５】
本発明の実施形態を以下の添付図面を参考にこれから説明する：
【図１】Aβ42及びα-シヌクレインのpH7におけるアミロイド凝集プロファイルを示す；
【図２】γ-クリスタリンDの変異体のpH7におけるアミロイド凝集プロファイルを示す；
【図３】mutCRYD34-58の残基1から8についてのPeptideSearchプログラムの出力を示す；
【図４】ペプチド検索プロセスの作業工程図を示す；
【図５】PDBから入手したpdb_seqres.txt及びss.txtファイルの抜粋を示す；
【図６】β-シート内の隣接する3つの鎖における水素結合の予測を示す；
【図７】残基間の水素結合を予測するプログラムから得られた出力例を示す；
【図８】ペプチド検索におけるヒットの結果の要旨を示す；
【図９】mutCRYD34-58、Aβ42及びα-シヌクレインの凝集傾向プロファイルを、PDB内で短いペプチドマッチングが見出された部位と併せて示す。
【発明を実施するための形態】
【００１６】
本発明の実施形態を下記で述べる。本実施形態の方法論は、γ-クリスタリンDの変異体（mutCRYD）で実証されるであろう。比較のために、さらに別の2つタンパク質、α-シヌクレイン（パーキンソン病に密接に関係する）及びAβ42（アルツハイマー病に付随する）もまた考察される。
mutCRDYはヒトの目のレンズ細胞で豊富である。異常折りたたみが生じると、mutCRDYは視界のぼやけ又は失明をもたらす白内障として出現する凝集物を形成しえる（Heon E, Priston M, Schorderet DF, Billingsley GD, Girard PO, Lubsen N, Munier FL (1999) The γ-Crystallins and Human Cataracts: A Puzzle Made Clearer, Am J Hum Genet 65:1261-1267；及びDahm R (2004) Dying to see, Sci Am 291(4):52-59）。γ-クリスタリンDと変異体とでは3つの残基が相違し（R58H、R36S及びR14C）、これらは凝集を高めることが判明した（Pande A, Pande J, Asherie N, Lomakin A, Ogun O, King J, Benedek GB (2001) Crystal cataracts: Human genetic cataract caused by protein crystallization, PNAS, 98(11):6116-6120）。
α-シヌクレインは、レーヴィ小体中の主要成分として見出される140残基タンパク質である（レーヴィ小体は、神経変性を引き起こす可能性があるパーキンソン病患者の脳で見出される稠密沈着物である：Spillantini MG, Scmidt ML, Lee VMY, Trojanowski JQ, Jakes R, Goedert M (1997) α-Synuclein in Lewy bodies, Nature 388:839-840）。
Aβ42は42残基の小さな疎水性ペプチドであり、アルツハイマー病におけるシナプス機能の妨害（神経病態のもっとも一般的な形態）で直接的な役割を果たす可能性がある（Selkoe DJ (2002) Alzheimer's disease is a synaptic failure, Science 298:789-790）。
稠密なβ-シート様構造を形成する傾向（すなわち凝集傾向）は1つのタンパク質内で変動し、アミノ酸組成及び配列に左右される。
本実施形態の方法が目的とするものは、標的タンパク質の凝集しやすい領域を封鎖することによって凝集物形成の速度及び量を低下させる候補ペプチド配列を同定することである。
【００１７】
凝集領域の同定
2つのタンパク質、α-シヌクレイン及びAβ42の部分に存在する、凝集に関するいわゆる“感受性領域”は以下の研究者らによって予見されていた：Pawar AP, DuBay KF, Zurdo J, Chiti F, Vendruscolo M, Dobson CM (2005) Prediction of "aggregation-prone" and "aggregation-susceptible" regions in proteins associated with neurodegenerative diseases, J Mol Biol 350:379-392。
より一般的には、上記論文は、タンパク質の凝集傾向プロファイルの計算を可能にし、さらに広範囲な実験的測定とほぼ一致する結果を提供することを示したアルゴリズムを提唱した。ある任意のペプチド配列について、前記アルゴリズムは全ての単一残基における傾向、又は数個のアミノ酸ウィンドウにおいて平滑化した傾向の計算を可能にする。表1は、各アミノ酸について別々にpH7.0における凝集傾向を示すリストである。
表1：天然に存在する各20アミノ酸のそれぞれ別個のpH7.0における凝集傾向

【００１８】
図1は、このアルゴリズムにしたがって計算した（さらに上記論文に提示されている）α-シヌクレイン及びAβ42の凝集傾向プロファイルを示す。図の左にはpH7におけるAβ42の凝集傾向プロファイルが示されている。変異していない野生型のAβ42配列の凝集プロファイルは中間の線として、配列内の各アミノ酸における可能な任意の変異について試験した後で得られた最大及び最小傾向値と一緒にプロットされている。Z^prof_agg＝１の線は、凝集促進領域の特定を容易にするために示されている。実験的な方法により得られた同領域は陰影領域として示されている。
同様に、この図の右にはpH7におけるα-シヌクレインのアミロイド凝集傾向プロファイルが示されている。ここでも図には凝集促進領域の特定を容易にするためZ^prof_agg＝１の線が含まれている。この図では、原線維中で構造化されえていると考えられる大きなタンパク質領域が淡い陰影で示され、高度にアミロイド原性NAC領域は濃い陰影で示され、さらに69−79領域（NAC領域内の特にアミロイド原性セグメントであることが判明している）は細切線で示されている。
スコアが閾値（例えば図1のZ^prof_agg＝１）と交差するタンパク質部分は最大の凝集傾向を有すると考えられ、in vivoでの凝集物及び原線維形成のコア領域であると推定される。阻害物質として作用する可能性がある任意の相互作用パートナーの検出のために、図1から予測されるコア凝集領域を標的配列としてこの実施形態で用いる。
本実施形態の方法論はmutCRYDにより示されるであろう。
図2は、7残基について平均した、mutCRYDの凝集傾向プロファイルを示している。図1の凝集傾向プロファイルのように、凝集感受性と考えられる領域と他のタンパク質部分との識別を容易にするために、1.0の凝集傾向値で棒線が引かれている。
更なる検索のために、残基34から58が選択された。この領域は、凝集ホットスポットを予測する2つのピークを有し、変異のうち2つを含む。完全な分析のためには１より大きい凝集特性をもつ全領域が考察されるべきであろうが、選択した短いフラグメントは使用方法のデモンストレーションに十分である。24残基のクエリー配列はSARVDSGCWMLYEQPNYSGLQYFLであり、mutCRYD34-58と称されるであろう。
【００１９】
検索−概覧
１つの配列について単一ファイルの通し検索が標準的であり、ほとんどのテキスト編集プログラム又はコマンドラインツールを用いて実行することができるが、短い配列については数百又は数千のヒットが容易に存在しえるであろう。それらの各々を手動で考察し、二次構造情報を探し、続いて更なる情報を求めてPDBウェブサイトをチェックし、3次元ツールを用いて構造をビジュアル化し、さらに残基間相互作用を探索して、水素結合を介して緊密に連携するペプチドを抜き出すのは、各タンパク質について数週間又は数ヶ月を要しえよう。
したがって、前記プロセスを取り扱うために独自仕様のソフトウエアが開発された。このソフトウエアは多数の小さなツールとして開発され、これら小さなツールは続いて段階的に単一の包括的プログラム（ペプチドサーチ（PeptideSearch）と称される）に取り込まれた。
プログラム言語PERLをPeptideSearchの記述のために選択した。なぜならば、使用される全データが純粋なテキストファイルとして入手可能であったうえ、PERLはこれらファイル全体の詳細な分析、並びにその中に含まれる情報の抽出及び加工のために強力なルーチンを提供するからである。PERLはまた無料で利用できるソフトウエアであり、これらの理由からバイオインフォマティクス関係者にはよく知られている。
図4は、このソフトウエアの作業工程図及び本実施形態の方法論を示し、以降の詳細な方法の説明の概覧を提供する。
PeptideSearchは、その機能の拡張のために多数の外部プログラムの呼び出しを必要とする。これらの呼び出しもまた図4に示されている。
このプログラムを使用する場合、ユーザー側入力は標的配列及びいくつかのパラメーターであり、プログラムは、最終的にペプチドの三次元ビジュアル化及びそれら相互作用パートナーを含む、候補ペプチドに関する簡潔な概要を生成する。したがって、任意のタンパク質について可能な阻害物質を同定するために要求される時間は、数週間という可能性から数時間に短縮された。
PeptideSearchは、各ヒットの記録を維持するために‘result.html’と称されるHTMLファイルを生成する。このプログラム及び外部ツールの両方によって作成されるファイル及び他の全ファイルは新しいサブディレクトリーに保存される。全プログラムの実行結果が後日の使用のためにディスク上でいつでも利用できるように、このディレクトリーの名称は現在の日時から導かれる。検索を実施している間、コマンドプロンプト又はコンソールに対し、PeptideSearchはまたヒットに関する情報を追加のステータスメッセージとともにプリントする。プログラムがその実行を終了したならば、‘result.html’は発見した全ヒットについての概覧を含み、候補ペプチドの選別が容易になる。mutCRYD34-58の残基1から8についての検索に続くプログラム出力が図3に提示されている。
【００２０】
検索−詳細な説明
本実施形態の場合、検索は、RCSB（Research Collaboratory for Structural Bioinformatics）のタンパク質データバンク（Protein Data Bank）(PDB)中のエントリーを基本とした。なぜならば、この無料でアクセスできるオンラインソースは大量の実験的構造及び理論モデルを含むからである。したがって、PDBのペプチド配列の1つの内部にクエリー配列の全部又は部分を発見することによって、二次構造及び相互作用パートナーの同定を可能にする関連構造へのアクセスが可能になる。
検索の第一段階は、PDBのタンパク質エントリーの全てにおいて標的配列について検索することである。これは、PDBファイルをローカルにミラーリングし、それらの各々を残基配列について個々にパーシングすることによって達成できたかもしれない。しかしながら、このアプローチは、時間とスペースの両方の関係で非効率的であろう（2005年の6月27日現在、PDBには31639の構造が存在し、その多くがいくつかの鎖をもつマルチマーとして存在していた）。
別のアプローチ（この実施形態のために採用された）は、全配列情報を含む単一のファイルを一度に入手し、続いてその全体を検索してマッチングを検出することである。そのようなファイルは、ftp://ftp.rcsb.org/pub/pdb/derived_dataでRCSBのPDB ftpサーバーから入手できる。
このファイル（pdb＿seqres.txt）は、FASTAフォーマットによる全PDB配列のリストである。同様に、ss.txt（FASTAフォーマットによるPDBの全二次構造を含むファイル）も同じアドレスで見つけることができる。本実施形態で用いたこのファイルのヴァージョンは、2005年6月27日の日付である。
二次構造ファイルは、二次構造マッチングを配列で実施し、さらに、β-シート構造にヒットが含まれるか否かを検出するための第一かつ迅速なソースを提示する。
図5は、2つのファイルの短い抜粋、それぞれseq_res.txt及びss.txtの最初の10ラインを示す。下記の表2は、ss.txtで使用される略語の意味を示す。
表2

【００２１】
配列及び構造ファイルのクリーニング
上記で言及した2つのファイルは、全PDBエントリーからのデータを用いてPDBによって自動的に誘導された。PDBファイルの二次構造情報は、様々な多数のプログラムによって決定された。
しかしながら、2つのファイルは長さが同じではない。図5の抽出はこれらの理由の1つを示している。すなわち、配列ファイルのFASTAヘッダー行はより長く、より詳細な情報を含んでいる。
データの由来を考えると、各配列について1つの構造エントリーが存在し、逆もまた真なりであることは予想されよう。さらにまた、一見するとファイルの行数は同一であって2つのファイルの内容を合致させるために非常に便利かもしれないと思われる。
しかしながら、これらの仮定はいずれも実際に当てはまらない。すなわち行数は必ずしも一致しない。ファイル全体についてPERLスクリプトを走らせて全FASTAヘッダー行を抽出したところ、pdb_seqres.txtについては74560エントリー、ss.txtについては69903エントリーを返してきた。入力としてこのファイルを用いる前に解決しなければならないその他の多くの問題が存在する。例えば、2つのファイル内及びファイル間でIDの使用は一致していたかった。前記配列ファイルは例えば1tsv_のようなIDを用いて異なる鎖を1th1_、1th1_1、1th1_2として、又は1pr2_A、1pr2_Bとして識別するが、一方、ss.txtは、それに代わって1TSV:、1THL:、1THL:_:1、1PR2:A、1PR2:Bを用いる。さらにまた、二次構造ファイル中に対応するエントリーをもたない多くのIDが配列ファイルに存在し、逆もまた真なりである。さらに、1J3W、10G8、及び1VGSのようなエントリーがss.txtには含まれているが、pdb-seqres.txtには含まれていない。それらは、タンパク質データバンクではID 2CVZ、2BUH及び2CV4で置き換えられているが、これらはpdb_seqres.txt中でのみ説明されている。
固有のエントリーの全てを両ファイルから取り除くには多数のPERLスクリプトを要した。得られたファイルはしたがって68383の一致エントリーを含んでいた。
配列のいくつかの長さが一致しないという点で潜在的な問題がなお残っている。PeptideSearchプログラムは、実行中にそのような不一致を指摘するように調整された。
【００２２】
配列に対するマッチングクエリー
注目する実験的構造は、クエリーストリング由来のアミノ酸配列が存在する構造である。これは、mutCRYD34-58について、フォワードストリング（SARVDSGCWMLYEQPNYSGLQYFL）の正確なマッチングとともに逆配列（LFYQLGSYNPQEYLMWCGSDVRAS）についても同様に検索する必要があることを意味している。長いペプチドについてはPDBで正確な配列マッチングを見つける確率は、短いペプチドの場合よりも明らかに極めて低い。実際、完全なタンパク質についてマッチングを検索するときは、ただ1つのマッチングしか見つけられないことは極めてありそうなことである（すなわち当該タンパク質そのもの）。
タンパク質の感受性領域に絞り込むときでさえ、PDBで正確なヒットをもたらすには明らかに長すぎるアミノ酸ストレッチをもつヒットを検索したいと考えるかもしれない。γ-クリスタリンDの変異体の構造はPDBには含まれていないので、完全な24残基配列についての結果は存在しない。
ヒットの収量を高めるために、さらに別の2つの方法を実行した。
第一に、標的タンパク質配列をサブストリングに分割し、相互作用のパートナーをこれらサブストリングの各々について検索した。これによって、配列の部分と結合するペプチドの同定が可能になる。これらのペプチドを後で別々に（例えば他のペプチドと組み合わせて）試験するか、又はそのようなペプチドをいくつか一緒に結合させることによって操作してより長いペプチドを作製することができる。
PeptideSearchプログラムでは、ユーザーは、検索配列の最少の長さｎ及び最大の長さｍを設定することができる。試行した結果、5から8残基の範囲のクエリー配列の長さが十分な数のヒットをもたらし、一方、なお有用な十分に長い相互作用パートナーが見つけられることが判明した。しかしながら、別の長さのサブストリングもまた用いることができる。
与えられた範囲の長さを有する第一の配列の連続サブストリングの全てについて完全な検索を自動的に実行するように、前記プログラムを調整する。したがって、長さｌの完全なクエリー配列について検索される、クエリー配列総数ｑは以下のとおりである：
ｑ＝{（ｌ−ｎ＋１）・（ｌ−ｎ＋２）−（ｌ−ｍ）・（ｌ−ｍ＋１）}／２
第二に、このプログラムは、正規表現の使用を許容する。このことは、検索配列に多様性を導入することを可能にする。したがって、PeptideSearchは、アミノ酸配列ファイル全体を検索するとき、考慮されるべき保存的置換を規定することを許容する。
例えば、表1にしたがって、Gln（Q）及びAsn（N）は類似の凝集傾向を有し、したがって有用なヒット数を増やすためのあるオプションは、両方を検索で考慮することである。検索ストリング、例えばQANTの正規表現は、したがって[QN]A[QN]Tであろう。残基の凝集特性に基づく他の置換も同様な態様で用いることができる。
この2つの方法を一緒にし、それによって、最少の長さにした可能なサブストリングの各々を、上記に記載の保存的置換を考慮する正規表現に変換することができる。
【００２３】
二次構造要素の発見
pdb_seqres.txt及びss.txtの両方に由来するデータをプログラムの開始時点で一度に読み出し、大きな配列に保存する。次に、両方の配列のエントリーを一緒に処理する。上述したように、アミノ酸配列の長さ及び構造が必ずしも一致しないので行数を目印として用いることはできない。その代わりに、FASTAヘッダー行は、検索が両ファイルに存在するエントリーを考慮していること、両ファイルの情報が同期していることを確認するための指標として機能する。
エントリーが数行にわたって分割されている場合、それらの間の行間を除去することにより連結する。これによって、各エントリーについて2つの文字列変数が得られる：1つは完全なアミノ酸配列用、他方は対応する二次構造用である。この時点で、2つの文字列の長さが同じでない場合、与えられた情報は信頼できるとは考えられない。この事例では、プログラムは警告を表示し、ユーザーに不一致を気付かせ、ヒットを手動で精査することを推奨する。
PERLは、完全なマッチ又は適合する正規表現を探すことによって、クエリー配列の出現について配列文字列を検索するために簡単に使用できるルーチンを提供する。何らかのヒットが存在する場合、PeptideSearchは配列文字列からそれらを抜き出し、それらを二次構造文字列の対応する領域とアラインメントを実施する。これによって、マッチングした残基のうちどれぐらいが拡張β-シート形成物中に存在するかの第一の視覚的チェックを可能にする。
構造の近傍も同様に重要であるので、プログラムはまた、マッチングの左側及び右側の両方の多数の残基情報及び構造情報を出力するように調整される。このウィンドウサイズはプログラムのオプションとして設定することができる。
理想的には、この情報を単純に用いて、二次構造ファイルがβ-シートの存在を指摘したそれらエントリーの全てを選択し、続いてそれらをさらに精査することができよう。しかしながら、使用したこのファイルによれば、多くの偽陽性とともに多くの偽陰性ももたらしえよう。その主要な理由は、ss.txtにおける予測はしばしば不正確であるということである。これは、PDBファイル中の実際の構造とのアラインメントを比較したときに見出されている。
したがって、ss.txtの情報とは無関係に、配列中の全てのヒットを考察するほうがよいことが判明した。これによって、PDBへのアクセスが必要な更なる処理を要するヒットの数が増加するが、また重要な候補ペプチドを逃さないことも担保する。
【００２４】
PDBファイル情報抽出
いったん、クエリー配列がエントリーの1つで検出されたら、更なる情報を入手しなければならず、実際のPDBファイルを処理する必要がある。PDB IDはFASTAヘッダー行から抜き出されている。ローカルPDBディレクトリーはPeptideSearchで規定される。
このIDと関係があるPDBファイルがローカルディレクトリーで入手可能である場合、圧縮されていようといまいと、このローカルコピーが用いられる。そうでなければ、ペプチドサーチはそのルーチンの1つを用いて、ケンブリッジ結晶学データセンターのRCSBタンパク質データバンクftpサーバー（ftp://pdb.ccdc.cam.ac.uk/rcsb/data/structures/divided/pdb/）のミラーに自動的にアクセスし、PDBファイルの圧縮コピーをダウンロードする。続いてプログラムWinRARへのシステムコールによりこの.Z-アーカイブが展開される。
【００２５】
PDBファイルの処理
PDBファイルを開く前に、プログラムは、先行するヒットについて同じPDB IDが用いられていたか否かをチェックする。これは、同じアミノ酸配列内でいくつかのヒットが存在するか、又はファイル中の構造がマルチマーであり、各鎖で類似ヒットが存在する場合であろう。IDが同じ場合には、データはなおプログラムのデータアレー内に含まれていて再使用が可能であり、相当な時間を節約できる。そうでなければ、PDBファイルのローカルコピーを開き、データをメモリーに読み出す。
各ファイルには重要な２つの部分が存在する。第一は、クエリー配列とβ-シートとのオーバーラップを同定するために用いることができる行である。これらは、β-シートの位置を示す“SHEET”-タグで始まる
第二は、分子中の各粒子について座標を提供する“ATOM”エントリーに関する。この情報は水素結合を予測することを可能にする。なぜならば、実際にどの残基が相互作用するかを知ることによって重要な情報が提供され、研究者らは阻害ペプチドの設計についてより大きな自由が与えられる。例えば、その側鎖が相互作用に関与しない残基は、より良好な生化学的特性をペプチドに提供する他の残基で置き換えることが可能である。
β-シート内の各鎖について、1つの“SHEET”行が存在する。これは、鎖内の最初と最後の残基のインデックスを含む。この鎖がシート内で最初のものでない場合、この行はまたこの鎖及びその前の鎖が登録されている2つの残基、すなわち水素結合によって連結されることが見出された一対の残基インデックスを含む。“SHEET”及び“ATOM”エントリーについての完全な情報は、http://www.rcsb.org/pdb/docs/format/pdbguide2.2/guide2.2_frame.htmlで見つけることができる。
これらの行並びにアミノ酸配列中のヒットの出発点及び終末点から抽出される情報は、オーバーラップについての試験を提供する。すなわち、シートの開始インデックスがヒットの終末点のインデックスよりも大きくなく、シートの終末インデックスがヒットの開始インデックスよりも小さくない場合はオーバーラップが存在する。この場合にはオーバーラップする残基の数が計算される。
理想的にはオーバーラップ残基の数は小さすぎてはいけない。なぜならば、それが潜在的阻害ペプチドの長さを規定するからである。ほんの数残基から成る阻害物質は非常に有効ではないかもしれず、さらに好ましい特性を有する安定なペプチドを設計するのは困難であろう。このプログラムは、ユーザーが閾値を規定してこの閾値よりも短いオーバーラップを持つ全てのヒットを‘result.html’への出力から排除することを可能にする。
次に、クエリー配列及び隣接鎖（1つ又は2つ、シート内の第一の鎖の位置に左右される）とオーバーラップするβ-鎖は鎖の向き（平行又は逆平行）及び登録を考慮したアラインメントで表示される。
例えば、ペプチド配列が‘ADDYYTATGHWYAT’であり、3及び7並びに9及び13で登録された逆平行β-シート形成において、鎖がそれぞれ残基1から4、6から10、及び12から14へと走っている場合、アラインメントは以下の結果となる：
ADDY
HGTAT
YAT
‘result.html’では、このアラインメントにおけるクエリー配列の残基は赤で示されよう。検索が、例えば‘ATGHW’（前記は上記ペプチドでインデックス7から11で見出されよう）の出現を探索している場合、残基‘HGTA’がアラインメントで強調されよう。
アラインメントは、クエリー配列とβ-シートとの間で大きなオーバーラップをもつものについてヒットの迅速なスクリーニングを可能にする。アラインメントは、どれぐらいの残基が及びどの残基がβ-シートを形成するか、さらに結果的には、それらの相互作用パートナーが短い阻害ペプチドに取り込まれることができたら、どれぐらいの残基が及びどの残基が封鎖されえるかを示す。
上記の検索方法論は候補ペプチドの同定への1つの道筋を提供するが、利用可能な現時点のデータに関して絶対的確実性を保障するものではない。特に、“SHEET”行で見出される残基のインデックスは“ATOM”行のインデックスを参照するが、同じファイルの“SEQRES”レコードは参照しない。タンパク質データバンクは、“ATOM”レコードの参照で正確さが試験されたことを保証している。しかしながら、‘pdb_seqres.txt’中のデーターは‘SEQRES’レコードに由来するが、それらのインデックスはしばしば同じではない。例えば、‘SEQRES’エントリーはMETから開始し、一方、最初の‘ATOM’エントリーはSERであるか、又は配列は同じであるが最初の‘ATOM’エントリーは残基インデックス21から開始し1から開始しないかもしれない。
このことは、アラインメントを示す上記の手法は相対的なβ-シート鎖の位置を正確に再現するが、残基の識別子はアミノ酸配列の誤った部分から採用される可能性があることを意味している。このことはまた、β-シートとのオーバーラップの同定が最初から不正確であった可能性を意味している。すなわち、クエリー配列は実際には前記構造の別個の位置に存在している可能性がある。
【００２６】
peptideAlign. class
このヒットの概要を後で見たときにそのような事象が検出されえることを担保するために、さらに別のアラインメントの方法を‘ATOM’エントリーを用いて開発した。これは、候補ペプチドを誘導するか、又は上記に記載の‘SHEET’検索から得られる結果のクロスチェックのためのまた別の方法を可能にする。
このアラインメントの方法はまた、残基間の水素結合を検出及び表示すること、アラインメントの情報量を増大させることを含む。
以下のアルゴリズムを‘ATOM’データの検索のために考案した。すなわち、少なくとも3残基離れ、かつβ-シートの注目部分の内部に存在する全ての原子対について、それらの間のユークリッド距離を計算する（標準式、ｄ＝（Δx²＋Δy²＋Δz²）の平方根を用いる、式中ｄはユークリッド距離であり、Δx、Δy及びΔzはそれぞれの座標における相違である）。
算出された距離が3.075オングストローム未満であるならば、この残基対のインデックスは水素結合保存配列に送られる。カットオフの長さは文献から選択され、前記は、骨格原子と側鎖との間の大半の水素結合を検出するために十分に大きく、一方、偽陽性数を低く維持するために十分に小さい。
予測を完了した後、鎖及び結合情報は‘bonds.txt’と称されるファイルに書き込まれる。このファイルを別のアプリケーション‘peptideAlign.class’（β-シートのグラフィックアラインメントを描くために作製されたJava（登録商標）系ツールである）と情報を共有するための中間データ保存として用いる。PERLは大量のテキストを処理するために強力なルーチンを有するが、Java（登録商標）はより簡便に使用できるグラフィック関数を提供する。したがって、‘peptideSearch.pl’にシステムコールを使用させてPeptideAlignとリンクすることによって両プログラム言語の特性が１つに結合された。PeptideAlignはアラインメントのスクリーンショットを作成し、続いてPERLプログラムはこれを‘result.html’中のこれまでのヒットの概覧に加える。
グラフィクスの使用は残基間の水素結合の表示（単純に線を描くことによって実施できる）を容易にする。PeptideAlignは、直接的には逆平行β-シート形成を説明しないが、グラフィックによる出力では、鎖の向きが逆にならねばならない場合は、この事例のように水素結合が互いに交差するのがはっきりと表示される。例えば、図6の水素結合を示す青い線は、中央の鎖の向きを逆向きにする必要があることを示している。さらに別のアルゴリズムを用いて正確に鎖の向きを定め、さらに結合の全長を最短にするために鎖をシフトさせる。
PeptideAlignはペプチド及び結合情報を予想される出力画像ファイル用名称とともに‘bonds.txt’から読み出す。画像ファイルの名称はhitX.pngの形式である（Xは連続するヒットの数を示す）。このプログラムはファイル中の情報をグラフィック表示に変換し、制御をPeptideSearchに戻す。出力例は図7に示されている。すなわち、このファイルはスクリーンショットがセーブされると思われるファイルの経路及び名称、ファイル中の原子及び結合の数と、それに続く全原子の残基ID及び結合によって連結される原子についての情報を含む。右側のグラフィック表示はどの残基が互いに連結されるかを示す。
【００２７】
ミニマリストPDBファイル
‘ATOM’検索によって生じるアラインメントはPDBのキュレーションのお蔭で正確である。これがPeptideSearchによって得られたものと一致するならば、‘SEQRES’レコードも矛盾がない。そうでない場合は、ユーザーはオーバーラップについてグラフィックによる概覧を視覚的にチェックする必要があるだろう。何も得られない場合は、クエリー配列の部分又は全てを含む別個のβ-シートが存在するか否かを知るために、PDBファイルの手動チェックが要求される。
現時点では、‘ATOM’記録から新たにアミノ酸配列を作製すること、及びクエリーストリングの出現についてこれを検索することは可能ではないことに留意されたい。これは、しばしばこの記録から残基が欠落しているためである。例えば、pdb1p9w.entでは、残基108の次は残基121である。このギャップは、多数の方法で、例えば実験データが不十分なこと、低いNMR又はX-線解像能、又は高度に可撓性の側鎖（原子の位置の正確な決定を不可能にする不明瞭なシグナルを生じる）によって説明することができる。また別の説明は、データを提供する研究が単にタンパク質の特定の部分、例えば活性部位にしか関心を示していないことがあり、したがって残りの構造に関する予測が全く提供されないということである。しかしながら、より完全なデータが利用可能な場合、そのような検索方法は、上記で考察された‘SHEET’検索にとっては単体で操作可能な適切な選択肢であろう。
β-シートでヒットを発見したら、どの残基が相互作用するかを観察し、候補ペプチドを設計するための枠組みを構築することが可能である。例えば、クエリー配列中の残基と相互作用しない残基を他のアミノ酸と置き換え、広範囲のペプチドを設計し試験することが可能になろう。
例えば、図6の短いアラインメントではSARVはVTYと相互作用する。水素結合はAとV及びVとYの間で予測される。しかしながら、Tはクエリー配列とは全く相互作用しないようであり、したがってペプチドVXYを候補ペプチドの作製のための枠組みとして用い、Xを種々のアミノ酸で置き換えることができよう。現実的には、そのような枠組みは有効であるにはおそらく短すぎるであろう。したがって、好ましくは5残基以上の長さをもつペプチドが検索される。
成功ヒットの各々について、PeptideSearchは、β-シートに含まれる全ての原子の座標を含む新しい.pdbファイルを作成する。これを実施するために、PeptideSearchはβ-鎖を含む完全な構造物の当該部分をクエリー配列フラグメント及びその相互パートナーとともに抜き出す。
ファイルは通常の3Dヴューワー（例えばRasmol又はvmd）のいずれでも開くことができ、予測された水素結合及び側鎖の空間配向の効率的な立証を可能にする。
【００２８】
Peptide3D.class
新しい.pdbファイル中の構造のプレビューができるように、‘results.html’中の記録にスクリーンショットが含められる。そうするために、分子をレンダリングし、それらを空間内で有益な配向に配置し、さらにスクリーンショットを撮影することを可能にする（いずれもユーザーの介入を要しない）3Dヴューアーが要求される。
Results.html
PeptideSearchがpdb＿seqres.txtに存在する全てのエントリーを通して全ての可能なサブストリング及び変異の処理を終了したならば、PeptideSearchはシステムコールによりブラウザーウィンドウを開き、概覧で見出した全てのヒットを提示する。この概覧は、各ヒットと関連するPDB IDのためのPDBサマリーページとのリンク及びアプレットとして提供されるPeptide3Dとのリンクを提供し、800ｘ600ピクセルフォーマットで構造の閲覧を可能にする。
【００２９】
結果
入力としてmutCRYD34-58を用いてこのソフトウエアを実行し、最少及び最大サブストリングの長さを5に設定し、変異を許容せず、さらにβ-シートとのオーバーラップが4より小さい全てのヒットを排除することによって153の正確なマッチングがpdb_seqres.txtで得られ、そのうちの47がβ-シート内に存在していた。これらの結果のうち8つのみが3残基よりも長く、後者は‘result.txt’に含まれていた。実際には、このセットは2つの別個のヒットを与えただけである。なぜならば、それらはマルチマーの異なる鎖に由来するので、最初の2つ及び最後の6つのマッチングは実際には同一であるからである。
これらのヒットの第一のものは配列SARVD（mutCRYD34-58残基1から5）に関連し、前記は仮説的グリシン切断系転写リプレッサー（PDB ID 1U８S）中に存在する。これは、結果が図3に提示されているヒットである。4残基オーバーラップが図6に示されている。
第二のヒットは、エンド-1,4-ベータ-キシラーゼII中の配列PNYSG（mutCRYD34-58残基15から20）について見出された。HTMLファイルから得られるこのヒットについての結果の要旨は図8に示されている。
図9は、mutCRYD34-58の凝集傾向プロファイル中の2つのヒットを示す。2つのタンパク質α-シヌクレイン及びAβ42の凝集ホットスポットに近いか又は前記の直ぐ側の正確なマッチの位置はまた、図9のそれぞれのプロファイルで示されている。α-シヌクレインについては、サブストリングの長さは6から7の範囲に設定され、Aβ42については5に設定されている。
mutCRYDについては、第一のヒットは凝集阻害物質の候補物質としてあまり有効ではないかもしれない。なぜならばこのヒットは凝集の感受性領域内に存在しないからである。しかしながら、第二のヒットは、この部位における凝集形成の開始からペプチドを遮断する潜在能力を有する。
他の2つのタンパク質については、示されたヒットに対応する相互作用パートナーの各々が凝集阻害物質として作用する潜在能力を有する。α-シヌクレインについてのヒット数は、サブストリングの長さが5に設定されるときに大きく増加する。
α-シヌクレインの分析結果は本出願者によるまた別の特許出願の主題である。
上記に記載のソフトウエアを用いて、α-シヌクレインの61−66（EQVTN）及び71−76（VTGVT）と相互作用する一連のペプチドが設計された。
この分析によって、残基61−66（EQVTN）の間のα-シヌクレインの領域と相互作用する一連のD-アミノ酸から成るペプチドが同定された。適切な1つのペプチドは、D-アミノ酸配列QYSVLI（下記表3に記載されているZP-0915）を含むか、又は前記配列から成る。他の適切なペプチドは、D-アミノ酸配列QYSVLI（1、2又は3アミノ酸置換を有する）を含むか、又は前記から成りえる。例えば、ペプチドは、qykvli、qysvpi、qyspli、qypvli、rysvli、qysvli、qytvli、pysvli、又はqysvlvから成る群から選択されるD-アミノ酸配列から成りえる。
前記ペプチドは、1、2又は3つの追加のN末端残基を含むことができる。
例えば、ペプチドは、ekysvli及びdrysvliから成る群から選択される配列を含むか、前記配列から成りえる。
前記分析によってまた、残基71−76（VTGVT）の間のα-シヌクレインの領域と相互作用する一連のD-アミノ酸から成るペプチドが同定された。例えば、ペプチドはhhviva（ZP-0158）のD-アミノ酸配列は配列から成りえるか、又は1、2又は3アミノ酸置換を有するD-アミノ酸配列hhvivaを含むか、又は前記配列から成りえる。好ましくは、N-末端ヒスチジン残基は置換されない。
例えば、ペプチドは、hhvvva、hhvlva、hhvkva、hhveva、hpviva、hhvivp、hhvivv、hhvivt、hhvivy、hhvivw、hhtivv、hhtivk、hhtvva、hhtlva、hhtlvv、hhtevy、及びhhttvyから成る群から選択される配列を含むか、又は前記配列から成りえる。
領域61−65については、ペプチドAc-gysvli-NH2（ZP-0195）が相互作用及び凝集防止のために設計された。与えられた任意の位置で1つ以上のアミノ酸が別のアミノ酸で置換された前記配列の変型もまた試験され、さらにN-末端での変型、例えば余分なアミノ酸の付加及びアセチル化が実施された（ZP-0195からZP-0230）。
領域71−75については、ペプチドAc-hhviva-NH2（ZP-0158）が相互作用及び凝集防止のために設計された。与えられた任意の位置で1つ以上のアミノ酸が別のアミノ酸で置換されたこの配列の変型もまた試験された。試験した全てのペプチドがN-末端でアセチル化され、さらに配列開始部の2ヒスチジンが全ての設計で維持された（ZP-0158からZP-0194）。
全てのペプチドが、50μMのASYN及び100μMの阻害物質を用い、50mMトリス及び150mMのNaCl及び20μMチオフラビンTによる凝集アッセイを実施することによって、TBS中でのASYN凝集の阻害について試験された。反応体積は200μLであった。各反応は、96ウェルのポリプロピレンプレート中で、ASYNのみ及び緩衝液のみのコントロールとともにセットされた。反応物を37℃にて48時間振盪しながらインキュベートし、チオフラビンTの蛍光を読み取ることによって凝集をモニターした。
動力学トレースはZyentiafitソフトウエアを用いてフィッティングした。このソフトウエアは、データをシグモイド関数f(x)＝k+A/(1+exp(−b(t−t0))）にフィッティングし、そこから凝集の潜伏時間、凝集速度及びThTの蛍光における全変化を算出することができる。
ペプチドをそれらの有効性にしたがって等級付けした。下記の表3は更なる実験のために選択した配列を示している。この選択は、潜伏時間の増加が20％を超えるペプチド及び／又はThT蛍光若しくは凝集速度の低下が20％を超えるペプチドを基準にした。
表3：ASYNのin vitro凝集の防止に有効性を示す、ASYNの領域61−66及び71−76と相互作用するように設計されたペプチド配列

【００３０】
結果から化合物を設計する
上記に記載した方法又はソフトウェアツールによって同定したヒットを鋳型として用いて、凝集阻害物質又は安定化剤を設計することができる。分子振動又は他の適切な計算方法を用いて、これら鋳型を基にした化合物ライブラリーを標的配列に対するそれらの親和性について試験することができる。
コンピュータによる計算方法は、鋳型を基にした多様な阻害物質に対して、固有の力場及びエネルギー最少化ルーチンを利用して阻害物質と標的凝集ポリペプチドとの間の相互作用を最大にすることができる（以下を参照されたい：Das B, Meirovitch H, Navon IM, Performance of hybrid methods for large-scale unconstrained optimization as applied to models of proteins, J Comput. Chem. 2003, 24:1222-31；及びde Bakker PI, DePristo MA, Burke DF, Blundell TL, Ab initio construction of polypeptide fragments: Accuracy of loop decoy discrimination by an all-atom statistical potential and the AMBER force field with the Generalized Born salvation model, Proteins, 2003, 51(1):21-40）。
選択した化合物ライブラリーを凝集アッセイでin vitroで試験し、標的ポリペプチドの凝集を阻害しえる先導化合物を同定することができる。
安定化剤／凝集阻害剤が他のプロテアーゼに対して耐性を必要とするときには、レトロ-エナンチオ誘導体（逆C-N配列及びD-アミノ酸）を用いることができる。
同定された安定化剤／凝集阻害剤は他のタンパク質／ペプチドと融合させることができる。安定化剤／凝集阻害剤と融合されたタンパク質／ペプチドは、体の特定の領域、特定の器官、特定の細胞タイプなどへの標的誘導のために、脳血液関門通過促進のために、血中半減期の延長のために、及び／又は別のタンパク質又はレセプターとの相互作用のために機能しえる。

【特許請求の範囲】
【請求項１】
以下の工程を含む、潜在的なタンパク質凝集阻害ペプチド配列を予測する方法：
a）標的タンパク質において凝集領域の少なくとも一部を形成するペプチド配列を同定する工程；
b）前記ペプチド配列がβ-シートの一部を構成するか否かを試験する工程；
c）工程b）で陽性結果が得られた場合、当該シートの隣接する鎖を抜き出す工程；
d）前記隣接する鎖内の残基であって、側鎖が前記ペプチド配列と相互作用する残基を同定する工程であって、前記残基が潜在的なタンパク質凝集阻害ペプチド配列を構成する、前記工程。
【請求項２】
試験工程が、標的タンパク質に対して異種である複数のタンパク質について実施される、請求項1記載の方法。
【請求項３】
試験工程が、タンパク質構造のデータベースを用いて実施される、請求項2記載の方法。
【請求項４】
試験工程が、以下の下位工程を含む請求項3記載の方法：
データベースに含まれる、ペプチド配列と関連する関連ペプチド配列を含むタンパク質群を同定する下位工程、及び、
前記関連ペプチド配列がβ-シートの一部を構成するタンパク質を前記群内で同定する工程。
【請求項５】
関連ペプチド配列が、順方向及び逆方向の両方向の前記ペプチド配列を含む、請求項4記載の方法。
【請求項６】
関連ペプチド配列が、ペプチド配列及び前記ペプチド配列のフラグメントを含む、請求項4又は請求項5記載の方法。
【請求項７】
関連ペプチド配列が、1つ以上のアミノ酸の保存的置換をペプチド配列内に含む配列を含む、請求項4から6のいずれかの項記載の方法。
【請求項８】
保存的置換が、pH7.0で互いに0.2以内の凝集傾向を有するアミノ酸を基準に選択される、請求項7記載の方法。
【請求項９】
同定する下位工程が、問題のタンパク質に関するPDBファイル中の“SHEET”ラインに含まれる残基と関連ペプチド配列を比較することを含む、請求項4から8のいずれかの項記載の方法。
【請求項１０】
同定する下位工程が、関連ペプチド配列内の互いに水素結合を形成する残基を同定することを含む、請求項4から8のいずれか１項記載の方法。
【請求項１１】
互いに水素結合を形成する残基を同定するために、少なくとも3残基離れている各残基対間のユークリッド距離を算出し、当該距離が3.075オングストローム未満であるならば水素結合が形成されると仮定する、請求項10記載の方法。
【請求項１２】
ユークリッド距離が、タンパク質についてのPDBファイルから“ATOM”エントリーを用いて算出される、請求項11記載の方法。
【請求項１３】
同定された水素結合形成残基対及びそれら残基対間の水素結合を表示する工程をさらに含む、請求項11又は請求項12記載の方法。
【請求項１４】
得られた結果を請求項11から13のいずれか１項記載の方法を実施することによって得られた結果と比較して、同定された残基をクロスチェックする、請求項9又は請求項10記載の方法。
【請求項１５】
工程d）で同定された残基が、側鎖が水素結合を介して前記ペプチド配列と相互作用する残基である、請求項1から14のいずれかの項記載の方法。
【請求項１６】
同定する工程が凝集傾向プロファイルを用いる、請求項1から15のいずれかの項記載の方法。
【請求項１７】
同定工程が、凝集傾向プロファイルで1より大きい凝集傾向を有するペプチド残基を選択する、請求項16記載の方法。
【請求項１８】
同定する工程が実験的に実施される、請求項1から15のいずれかの項記載の方法。
【請求項１９】
工程d）で同定された残基を表示する工程をさらに含む、請求項1から18のいずれかの項記載の方法。
【請求項２０】
表示する工程が、β-シートで同定された残基の三次元配置を表示することを含む、請求項19記載の方法。
【請求項２１】
工程d）で同定された残基が1つ以上の他のタンパク質と相互作用するか否かを試験する工程をさらに含む、請求項1から20のいずれかの項記載の方法。
【請求項２２】
試験する工程が、標的タンパク質に対して異種の複数のタンパク質で実施される、請求項21記載の方法。
【請求項２３】
試験する工程が、タンパク質構造のデータベースを用いて実施される、請求項22記載の方法。
【請求項２４】
タンパク質構造が極めて重要な細胞プロセスを仲介する構造である、請求項23記載の方法。
【請求項２５】
試験する工程が、以下の下位工程を含む、請求項23又は請求項24記載の方法：
データベースに含まれる、ペプチド配列と関連する関連ペプチド配列を含むタンパク質群を同定する下位工程、及び、
前記関連ペプチド配列が前記同定残基と相互作用するタンパク質を前記群内で同定する工程。
【請求項２６】
工程a）で同定された凝集領域の部分がヘリックス、ループ、ベータ-ターン又はベータ-バルジの一部である、請求項1から25のいずれか１項記載の方法。
【請求項２７】
工程d）で同定された残基を含むタンパク質凝集阻害ペプチドを製造することを含む、請求項1から26のいずれか１項記載の方法。
【請求項２８】
さらに以下の工程を含む、請求項1から27のいずれかの項記載の方法。
e）ペプチドライブラリーを合成する工程であって、前記ペプチドライブラリーのメンバーが工程d）で同定された残基を含む、前記工程、及び
f）前記ライブラリーのメンバーの標的タンパク質に対する親和性を決定する工程。
【請求項２９】
以下の工程を含む、タンパク質凝集阻害ペプチドを製造する方法：
a）標的タンパク質において凝集領域の少なくとも一部を形成するペプチド配列を同定する工程；
b）前記ペプチド配列がβ-シートの一部を構成するか否かを試験する工程；
c）工程b）で陽性結果が得られた場合、当該シートの隣接する鎖を抜き出す工程；
d）前記隣接する鎖内の残基であって、側鎖が前記ペプチド配列と相互作用する残基を同定する工程であって、前記残基が潜在的なタンパク質凝集阻害ペプチド配列を構成する、前記工程；
e）ペプチドライブラリーを合成する工程であって、前記ペプチドライブラリーのメンバーが工程d）で同定された残基を含む、前記工程、及び
f）前記ライブラリーのメンバーの標的タンパク質に対する親和性を決定する工程。
【請求項３０】
コントロールと比較して標的タンパク質に対して高い親和性を示すペプチドを、タンパク質凝集阻害ペプチドとして前記ライブラリーから同定する工程を含む、請求項28又は請求項29記載の方法。
【請求項３１】
同定されたペプチドを前記ライブラリーから単離する工程を含む、請求項30記載の方法。
【請求項３２】
ライブラリーから同定されたペプチドを合成する工程を含む、請求項30記載の方法。
【請求項３３】
タンパク質異常折りたたみ疾患のモデルでペプチド又はペプチドライブラリーの有効性を決定する工程を含む、請求項27、請求項31又は請求項32記載の方法。
【請求項３４】
モデルが凝集しやすいタンパク質を過剰発現する細胞を含む、請求項33記載の方法。
【請求項３５】
凝集しやすいタンパク質が、α-シヌクレイン（野生型又はパーキンソン病に付随する任意の変異体）、ハンチングチン（および増幅ポリグルタミン又はポリアラニンリピートを有する他のタンパク質）、アミロイドベータペプチド（Aβ42）、プリオンタンパク質、小島アミロイドポリペプチド（hIAPP）、スーパーオキシドジスムターゼ、タウ、アルファ-1-アンチトリプシン及び他のセルピン、リゾチーム、ヴィトロネクチン、クリスタリン、フィブリノーゲンアルファ鎖、アポリポタンパク質AI、シスタチンC、ゲルソリン、ラクトフェリン、ケラトエピセリン、カルシトニン、心房性ナトリウム排泄増加因子、プロラクチン、ケラチン、メディン（又は完全長ラクトアドヘリン）、免疫グロブリン軽鎖、トランスサイレチン（TTR）、アポ血清アミロイドAタンパク質（SAA）、ベータ2-ミクログロブリン、免疫グロブリン重鎖、および、任意のタンパク質異常折りたたみ疾患と関連する任意の他のタンパク質から選択される、請求項34記載の方法。
【請求項３６】
以下の1つ以上を遂行する、ペプチドの能力を決定する工程を含む、請求項27、請求項31又は請求項32記載の方法：
i）凝集に対してタンパク質を安定化させる；
ii）保存時のタンパク質の活性低下速度を減速させる；
iii）タンパク質の凝集仲介免疫原性を低下させる；
iv）in vitro翻訳系におけるタンパク質収量を増加させる；
v）治療薬として使用することを目的とする処方物の溶液中の安定性を高める；
vi）1つ以上の細胞プロセスを阻害する；
vii）タンパク質のオリゴマー化又はマルチマー化を防止する。
【請求項３７】
請求項1から22のいずれか１項記載の方法によってタンパク質凝集阻害ペプチドを予測する工程、及び前記予測の工程d）で同定された残基を用いて凝集阻害物質を設計する工程を含む、タンパク質異常折りたたみ疾患の治療を目的とする凝集阻害物質を設計する方法。
【請求項３８】
請求項1から22のいずれか１項記載の方法によってタンパク質凝集阻害ペプチドを予測する工程、及び、前記予測の工程d）で同定された残基を用いて凝集に対してタンパク質を安定化させる化合物を設計する工程、を含む、凝集に対してタンパク質を安定化させる化合物を設計する方法。
【請求項３９】
請求項1から22のいずれか１項記載の方法によってタンパク質凝集阻害ペプチドを予測する工程、及び、前記予測の工程d）で同定された残基を用いてタンパク質の保存期間を延長する化合物を設計する工程を含む、タンパク質の保存期間を延長する化合物を設計する方法。
【請求項４０】
請求項1から22のいずれか１項記載の方法によってタンパク質凝集阻害ペプチドを予測する工程、及び前記予測の工程d）で同定された残基を用いてタンパク質の凝集仲介免疫原性を低下させる化合物を設計する工程を含む、タンパク質の凝集仲介免疫原性を低下させる化合物を設計する方法。
【請求項４１】
請求項1から22のいずれか１項記載の方法によってタンパク質凝集阻害ペプチドを予測する工程、及び、前記予測の工程d）で同定された残基を用いてin vitro翻訳系におけるタンパク質の収量を増加させる化合物を設計する工程を含む、in vitro翻訳系におけるタンパク質の収量を増加させる化合物を設計する方法。
【請求項４２】
請求項1から22のいずれか１項記載の方法によってタンパク質凝集阻害ペプチドを予測する工程、及び、前記予測の工程d）で同定された残基を用いて溶液中における安定性が高められた化合物を設計する工程を含む、治療薬として使用することを目的とする処方物の溶液中の安定性を高める化合物を設計する方法。
【請求項４３】
請求項1から22のいずれか１項記載の方法によってタンパク質凝集阻害ペプチドを予測する工程、及び前記予測の工程d）で同定された残基を、細胞プロセスを仲介するタンパク質配列の収集物に対してスクリーニングする工程を含む、細胞プロセスに対する化合物の影響を決定する方法。
【請求項４４】
以下の工程を含む、タンパク質のオリゴマー化又はマルチマー化を防止するために用いられる化合物を設計する方法であって、そのようなオリゴマー化又はマルチマー化が凝集しやすい領域によって仲介される、前記方法：請求項1から22のいずれか１項記載の方法によってタンパク質凝集阻害ペプチドを予測する工程、及び、前記予測の工程d）で同定された残基を用いて、前記凝集しやすい領域と相互作用することによってオリゴマー化又はマルチマー化を阻害する化合物を設計する工程。
【請求項４５】
以下の工程を含む、標的ペプチド又はポリペプチドの活性を阻害するために用いられる化合物を設計する方法：
a）標的タンパク質の活性領域の少なくとも一部を形成するペプチド配列を同定する工程；
b）前記ペプチド配列がβ-シートの一部を構成するか否かを試験する工程；
c）工程b）で陽性結果が得られた場合、当該シートの隣接する鎖を抜き出す工程；
d）前記隣接する鎖内の残基であって、側鎖が前記ペプチド配列と相互作用する残基を同定する工程であって、それら残基が潜在的な阻害性ペプチド配列を構成する、前記工程；及び
e）工程d）で同定された残基を用いて、標的タンパク質の活性を阻害する化合物を設計する工程。
【請求項４６】
請求項37から45のいずれか１項記載の方法にしたがって設計された、L-アミノ酸から成る化合物。
【請求項４７】
請求項37から45のいずれか１項記載の方法にしたがって設計された、D-アミノ酸から成る化合物。
【請求項４８】
請求項37から45のいずれか１項記載の方法にしたがって設計された、L-アミノ酸及びD-アミノ酸の混合物から成る化合物。
【請求項４９】
コンピュータで動作させたとき、請求項1から45のいずれか１項記載の方法を実行するコンピュータプログラム。
【請求項５０】
請求項49に記載のコンピュータプログラムを含むコンピュータデータ保持担体。
【請求項５１】
請求項1から45のいずれか１項記載の方法を実行するために設計されたコンピュータ。
【請求項５２】
コンピュータが、予測を入手するときに使用される既知タンパク質に関する情報を含む外部データベースにアクセスできるように設計されている、請求項51に記載のコンピュータ。

【図１】

【図２】

【図３ａ）】

【図３ｂ）】

【図４】

【図５】

【図６】

【図７】

【図８】

【図９】

【公表番号】特表２００９−５４５７５６（Ｐ２００９−５４５７５６Ａ）
【公表日】平成２１年１２月２４日（２００９．１２．２４）
【国際特許分類】

【出願番号】特願２００９−５２３３３８（Ｐ２００９−５２３３３８）
【出願日】平成１９年７月２４日（２００７．７．２４）
【国際出願番号】ＰＣＴ／ＧＢ２００７／００２７８９
【国際公開番号】ＷＯ２００８／０１５３８４
【国際公開日】平成２０年２月７日（２００８．２．７）
【出願人】（５０９０３５１３０）ロンザ　バイオロジックス　ピーエルシー (1)
【Ｆターム（参考）】

[ Back to top ]

タンパク質凝集を予測し凝集阻害物質を設計する方法

メニュー

スポンサーリンク

次の公報 »

« 前の公報

タンパク質凝集を予測し凝集阻害物質を設計する方法

メニュー

スポンサー リンク

次の公報 »

« 前の公報

スポンサーリンク