機能性ペプチドを表すルールの抽出法、機能性ペプチドの設計法及び調製法、ポリペプチド又はポリペプチド含有組成物の評価法、並びに機能性ペプチド
【課題】機能性ペプチドを効率的に見出すことを可能にする手段を提供する。また、機能性の高いペプチドを提供。
【解決手段】以下のステップ、(1)アミノ酸残基数が同一で且つ配列が互いに異なる複数のペプチド配列からなるペプチドライブラリーを用意するステップ、(2)N末端又はC末端からの位置毎に構成アミノ酸の物理化学的性質を数値化することによって、前記ペプチドライブラリーに含まれる各ペプチド配列を数値データに変換するステップ、(3)前記数値データを入力変数として階層的クラスタ分析し、各ペプチド配列を、N末端又はC末端からの位置毎に前記物理的性質の数値範囲で規定される複数のクラスタに分類するステップ、(4)前記複数のクラスタの中から、クラスタ毎、所定数のペプチド配列を選抜するステップ、を経て選抜したペプチド配列からなるペプチドを試料として機能性アッセイを行い、ペプチドを設計する。
【解決手段】以下のステップ、(1)アミノ酸残基数が同一で且つ配列が互いに異なる複数のペプチド配列からなるペプチドライブラリーを用意するステップ、(2)N末端又はC末端からの位置毎に構成アミノ酸の物理化学的性質を数値化することによって、前記ペプチドライブラリーに含まれる各ペプチド配列を数値データに変換するステップ、(3)前記数値データを入力変数として階層的クラスタ分析し、各ペプチド配列を、N末端又はC末端からの位置毎に前記物理的性質の数値範囲で規定される複数のクラスタに分類するステップ、(4)前記複数のクラスタの中から、クラスタ毎、所定数のペプチド配列を選抜するステップ、を経て選抜したペプチド配列からなるペプチドを試料として機能性アッセイを行い、ペプチドを設計する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、機能性ペプチドの設計手段、及び設計された機能性ペプチドの利用法に関する。詳しくは、機能性ペプチドの設計に有用なルールを抽出する方法、抽出されたルールを利用して機能性ペプチドを設計又は調製する方法、抽出されたルール又は設計された機能性ペプチドの配列情報を利用してペプチド又はペプチド含有組成物を評価する方法、及び機能性ペプチドが提供される。
【背景技術】
【0002】
近年、生活習慣病が世界の先進国では深刻に蔓延しており、高コレステロール血症、高トリグリセライド血症、又は動脈硬化症の予防・改善のための医薬又は食品の提供が切望されている。我が国における死因の2位は心疾患、3位は脳血管疾患であり、これらはいずれも循環器系疾患の動脈硬化性疾患である。循環器系疾患を罹患する患者数の増加を背景とし、高コレステロール血症を抑える治療薬は現在、大きな市場を形成している。
【0003】
循環器系疾患の発症は生活環境に非常に大きく影響されるため、予防医療(即ち、日常的に摂取する食品成分などによって血中コレステロール値の低減を図ること)の重要性が強く認識されつつある。血中コレステロールを低減する、食品成分中のタンパク質としては大豆タンパク質、乳製品に含まれるホエータンパク質、卵白中タンパク質などが知られている(非特許文献1、2)。また、タンパク質と同様に血中コレステロール値の低減効果を示すペプチドも数多く報告されている(特許文献1〜9)。これら既知の血中コレステロール低減ペプチドの多くは、血中もしくは経口投与により血中コレステロールを低減することが確認されているが、結果として効果が確認されているだけであり、その作用機序の詳細は明らかでないものが多い。
【0004】
一方、血中コレステロールをより安全に低減させる一つの機構として胆汁酸結合ペプチドによるもの、即ち、(1)腸管内における胆汁酸の再吸収を胆汁酸結合ペプチドが阻害し、その結果、血中コレステロールが低減するというメカニズムと、(2)腸管内の胆汁酸混合ミセル中へのコレステロールの溶解性を胆汁酸結合ペプチドが低下させ、その結果、血中コレステロールが低減するというメカニズムが知られている(非特許文献3)。
【0005】
ところで、従来の研究手法では、(1)様々な食品タンパク質を無作為(ランダム)に酵素で分解した消化物の中から胆汁酸に結合する画分を見出し、(2)その血中コレステロール低減効果を観察する、という方法が採られている。これまでの報告の中で特許文献10は、胆汁酸結合性を利用した血中コレステロール低減効果を報告している。また、これまでの研究手法では、非常に限られたペプチド源(研究者が注目しているタンパク質の分解産物など)からしか探索されていないことから、同定に成功した有効な配列(胆汁酸に結合するペプチド配列)の情報は非常に少ない。
【特許文献1】特開2007−126369号公報
【特許文献2】特開2007−137816号公報
【特許文献3】特開2002−80495号公報
【特許文献4】特開2002−80393号公報
【特許文献5】特開2001−114800号公報
【特許文献6】特開平10−175997号公報
【特許文献7】特開平9−157290号公報
【特許文献8】特開平7−278010号公報
【特許文献9】特表2005−516043号公報
【特許文献10】特開2004−99447号公報
【非特許文献1】Proc. Nutr. Soc., 41, 19, (1982)
【非特許文献2】Agric. Biol. Chem., 55, 813 (1991)
【非特許文献3】J. Nutr., 129, 1725 (1999)
【発明の概要】
【発明が解決しようとする課題】
【0006】
同定された胆汁酸結合ペプチドの種類が少なく、胆汁酸結合に重要な配列の特徴などに関する情報が乏しいことから、新規な胆汁酸結合ペプチドを効率的に見出すことができないのが現状である。同様の理由から、既知の胆汁酸結合ペプチドよりも有効性の高いペプチドを設計することも困難である。また、各胆汁酸結合ペプチドを相対的に評価することが困難であり、より有効な胆汁酸ペプチドの設計において、既知の胆汁酸結合ペプチドの配列情報を有効に利用できていない状況にある。さらには、天然由来のペプチド断片の情報しかない場合、非天然型ペプチドの中から有効性の高いものを見出すことは極めて難しい。
【0007】
一方、既知の胆汁酸結合ペプチドが少ない以上、各種ポリペプチド(動物由来タンパク質や植物由来タンパク質など)を検索対象としても、胆汁酸結合ペプチドを含有するポリペプチドを見出せる可能性は低い。胆汁酸結合ペプチドの含有量が多いポリペプチドともなれば、それを見出せる可能性はないに等しい。
【0008】
ところで、ある程度の数の胆汁酸結合ペプチドが同定されていれば、それらを包括的に捉え、その含有量をポリペプチド間で比較し、各ポリペプチドの胆汁酸結合能を評価できる。つまり、ポリペプチド全体としての胆汁酸結合能を評価できるようになる。このような評価手法を利用すれば、胆汁酸結合能の高いポリペプチドを効率的に検索、同定することが可能である。しかしながら実際は、同定された胆汁酸結合ペプチドが非常に限られているため当該評価手法は利用できず、有効なポリペプチドを効率的に検索、同定することができない。
【0009】
以上の各課題は胆汁酸結合ペプチドに固有のものではなく、機能性ペプチド全般に当てはまる。つまり、天然であるか非天然であるかを問わず、機能性ペプチド(特に、有効性の高いペプチド)を効率的に見出すことを可能にする手段の提供が望まれていた。また、機能性ペプチドの含有量の多いポリペプチドや食品を見出す手段の提供も望まれていた。更には、機能性の高いペプチド(高機能ペプチド)の提供も望まれていた。
【課題を解決するための手段】
【0010】
上記課題を解決すべく本発明者らは、図1に示す通り、大別して4種の手法、即ち(A)既知の機能性ペプチド(種ペプチド)の改変を利用して機能性ペプチド配列を検索・設計する方法、(B)既知のタンパク質を断片化して得られるペプチド断片の中から機能性ペプチドを特定する方法、(C)ファジーニューラルネットワーク(FNN)解析を利用して機能性ペプチドを検索・設計する方法、及び(D)階層的クラスタリング法を利用して機能性ペプチドを検索・設計する方法により、新規な機能性ペプチドを網羅的に探索・設計するという独自の戦略を立てた。
【0011】
(A)の方法では、既知のペプチド(種ペプチド)の1残基置換による改変アミノ酸配列の作成(A-1)、各改変アミノ酸配列と標的を用いた機能性アッセイ(A-2)、アッセイの結果に基づくルールの抽出(各位置について好ましいアミノ酸を特定)(A-3)、ルールに従うペプチドの検索・設計(A-4)、を順に行い機能性ペプチドを見出す。
【0012】
(B)の方法では、特定のタンパク質(種タンパク質)の断片化(B-1)、及び断片ペプチドと標的を用いた機能性アッセイ(B-2)、アッセイの結果に基づく機能性ペプチド配列の特定(B-3)、を順に行い機能性ペプチドを見出す。
【0013】
(C)の方法では、ペプチドライブラリーからの複数のペプチド配列の選抜(C-1)、選抜したペプチド配列と標的とを用いた機能性アッセイ(C-2)、アッセイの結果と各配列の物理的特徴を基にしたFNN解析(C-3)、FNNルールの抽出(C-4)、(C-2)〜(C-4)の繰り返し(必要に応じて)(C-5)、及びFNNルール又は構築された予測モデルを利用したペプチド配列の検索・設計(C-6)、を順に行い機能性ペプチドを見出す。当該方法の場合、機能性アッセイの結果として、機能性の高いペプチド配列が見出される可能性がある。
【0014】
(D)の方法では、物理的指標の組合せに基づく、ペプチド配列の複数のクラスタへの分類(階層的クラスタ分析)(D-1)、各クラスタから選抜した配列と標的とを用いた機能性アッセイ(D-2)、アッセイの結果に基づく、クラスタの順位付け(D-3)、上位クラスタからのルール(物理的指標の組合せ)の抽出(D-4)、ルールに従うペプチドの探索・設計(D-5)、を順に行い機能性ペプチドを見出す。当該方法の場合、上位クラスタに含まれるペプチド配列を機能性の高いペプチド配列として抽出することが可能である。
【0015】
各手法で見出されたペプチド配列は必要に応じて更に選抜される。ここでの選抜として、合成効率、合成コスト、特性(溶解度、熱安定性、pH安定性、立体構造等)等による選抜、細胞や動物等を利用したアッセイによる選抜、又はこれら両方の選抜を行うことができる。また、(A)〜(D)の方法を併用することによる選抜も可能である。
【0016】
以上の(A)〜(D)の手法の有効性を、胆汁酸結合ペプチドをモデルとして検証した(図2)。その際、機能性アッセイとして、コンビナトリアルケミストリーの一手法であるペプチドアレイを利用し、大量のペプチド配列のアッセイを可能とした。ペプチドアレイを利用した、このように大規模な胆汁酸結合ペプチドの探索は過去に報告がない。
【0017】
検証の結果、いずれの手法によっても、複数の胆汁酸結合ペプチドを見出すことができた。即ち、(A)〜(D)の方法によれば多数の機能性ペプチドを同定できることが確認された。また、検証による副産物として、天然由来・非天然由来を問わず、多数の胆汁酸結合ペプチドの配列情報(配列番号1〜223並びにIIK,GTV,WIY,YYW,WRW,PWR,WFW,WYM,IWW,YWM,FWY,LWY,WYD,WMY,WYF,MWF,YFY,WWT,WWI,YYF,FMF,YMW,PFF,AWY,WMM,NWY,PWM,FWV,WYV,YFM,YGW,PVW,WRI,QWF,WHF,MWM,PIY,LFF,YSW,WNF,WSL,YLF,YYI,WYT,MYY,IWM,WHM,WLA,YQY,IQW,WLN,WMQ,WAM,AWM,TWY,WSM,VWI,MFL,NWM,WVQ,FGL,FNY,PIR,PWN,MWL,YGL,NWI,AWI,VFI,YSF,MIF,FVM,TWM,WQI,MYM,TWI,PMG,IGY,IML,VLF,YIV,YAM,PYN,VAY,PCK,SWL,PCW,PML,PLM,VYM,VMY,PFE,YSM,ISF,QWV,WVC,CWY,MTF,PLQ,ILM,YQV,PCC,YMI,WKC,PMH,WKW,WYE,WFK,WRR,WKW,RKF,WKS,VWW,VWW,PLK,YWL,KLK,FLR,YWL,NFK,LWY,HWF,LRI,WGW,WFL,FYF,RHW,PLK,KLK,LRI,KIW,QWR,IWN,RRK,KVR,NQY,WNP,LRY,FMY,WMH,WIK,YFI,IRA,NTH,WNP,YFI,WGV,HKL,WRG,YYT,QPW,LYL,TRA,RKA,WHA,LYL,AFL,FII,RPL,FVI,YSH,LYS,IFW,KIP,FII,WQE,FCP,NHI,WAG,VRQ,GPR,LYS,NRE,FLT,YVP,LYM,IIP,WRC,NTK,QFH,FQW,NTK,YVP,LYN,FGF,LKS,GYL,FIE,KGS,VFA,RFN,LYH,QFH,RVI,VAY,LKS,QYF,WMN,DRG,VYP,YGT,IQW,KIA,QKV,HMK,WQL,RFN,MHP,VRD,KVA,ITR,NQG,YMY,RDG,WMK,YII,NKI,PMR,HML,VAY,KHM,YGT,HAH,TRP,KIA,IWT,FMA,CWP,ICY,HMK,KMS,MIP,FSV,PSH,KVA,KNL,VKT,MHP,KHM,PFI,TRP,RDG,QGR,WMS,YIV,KAC,LQH,MIP,MFS,PSH,VKT,NGI,PVS,NPL,LSP,TKQ,QII,QGR,MFS,VKA,LQH,PPQ,QHL,LSP,VKA,QII,LMS,PHQ,RFA,MCP,NGC,QHL,YCI,MQF,SNF,YMA,LQY,LPQ,VLL,YMA,AIK,WMT,EYH,VLL,SML,GLC,END,WGS,RAD,GWV,RAD,HHS,EAF,MGI,IVN,SEW,QHA,THM,CLY,NMC,TLL及びLMW)がもたらされた。これらペプチドの中には、既知の胆汁酸結合ペプチドよりも高い結合能を示すものも数多く含まれていた。この事実は、上記手法の有効性を裏付ける。一方、胆汁酸結合ペプチドとして同定されたものの中には、非天然型ペプチドも数多く含まれていた。この事実は、未知ペプチドの設計法として上記手法が有効であることを示す。
【0018】
一方、後述の実施例に示す通り、(C)の手法によって、胆汁酸結合ペプチド(6アミノ酸残基)の構造的ルールが見出された。同様に、(D)の手法によって、胆汁酸結合ペプチド(3アミノ酸残基)の構造的ルールが見出された。これらの構造的ルールは胆汁酸結合ペプチドの設計ないし同定に有用である。
【0019】
同定された胆汁酸結合ペプチド数種について、より生体に近いアッセイ系で胆汁酸結合能を評価した。その結果、既知の胆汁酸結合ペプチドよりも高い結合能を示すペプチドが見出された。コレステロール溶解阻害能についても評価した結果、いくつかのペプチドは非常に高いコレステロール溶解阻害能を示した。つまり、有望なコレステロール低減ペプチドの同定に成功したことが明らかとなった。
【0020】
ここで、多数の機能性ペプチドを同定できれば、各機能性ペプチドの相対評価が可能となる。また、機能性ペプチドを含むポリペプチド(タンパク質)の同定も容易となる。一方、多数の機能性ペプチドの配列情報があれば、それを利用してポリペプチドを評価(スコア化)することができる。具体的には、同定した機能性ペプチドを包括的に捉え、各機能性ペプチドの含有量をポリペプチド間で比較すれば、当該機能に関する各ポリペプチドの有効性を点数(スコア)として示すことが可能となる。このような評価法を利用すれば、ポリペプチド又はポリペプチド含有組成物(例えばポリペプチド含有食品)を機能性という新たな観点から特定したり、分類したりすることができる。或いは、特定の機能性に関してより有効なポリペプチド又はポリペプチド含有組成物の創出が可能となる。
【0021】
ここで、(C)及び(D)の手法は、膨大な数の候補の中から効率的に有効なペプチドを選抜できる点、様々な長さのペプチドを設計可能である点、既知の機能性ペプチドの配列に依存しない全く新しいペプチドを見出すことが可能である点等、数多くの利点を有し、機能性ペプチドの設計法として特に有効であるといえる。
【0022】
ところで、(A)〜(D)の方法では、見出されるペプチドの長さに制約がある((C)及び(D)の手法では様々な長さのペプチドを設計可能であるものの、以下の制約がある)。即ち、各手法によって見出されるペプチドの長さは、(A)の手法においては種ペプチドの長さに依存し、(B)の手法においては断片化の条件に依存し、(C)及び(D)の手法においてはペプチドライブラリーに含まれるペプチドの長さに依存する。この問題を克服するため、見出されたペプチド配列を連結することによって、より長いペプチドを設計するという手法を創出した。この手法では、(A)〜(D)の方法によって設計されたペプチドの中から、共通する配列部分をもつものを抽出し、連結する(図3)。
【0023】
本発明は以上の検討の末に完成されたものであり、次の通りである。
[1]以下のステップ(1)〜(7)を含む、機能性ペプチドを表すルールの抽出法、
(1)アミノ酸残基数が同一で且つ配列が互いに異なる複数のペプチド配列からなるペプチドライブラリーを用意するステップ、
(2)N末端又はC末端からの位置毎に構成アミノ酸の物理化学的性質を数値化することによって、前記ペプチドライブラリーに含まれる各ペプチド配列を数値データに変換するステップ、
(3)前記数値データを入力変数として階層的クラスタ分析し、各ペプチド配列を、N末端又はC末端からの位置毎に前記物理的性質の数値範囲で規定される複数のクラスタに分類するステップ、
(4)前記複数のクラスタの中から、クラスタ毎、所定数のペプチド配列を選抜するステップ、
(5)選抜したペプチド配列からなるペプチドを試料として機能性アッセイを行い、各ペプチド配列の機能性データを取得するステップ、
(6)機能性データに基づき、機能性の順位を前記複数のクラスタに付与するステップ、
(7)上位の順位が付与されたクラスタを規定する、前記物理化学的性質の数値範囲又は該数値範囲を満足するアミノ酸の種類を、高機能ペプチドの特徴を表すルールとして抽出するステップ。
[2]前記機能性が高親和性である、[1]に記載の抽出法。
[3]前記機能性が、胆汁酸に対する高親和性である、[1]に記載の抽出法。
[4]ステップ(1)における前記アミノ酸残基数が3〜6である、[1]〜[3]のいずれか一項に記載の抽出法。
[5]ステップ(2)における前記物理的性質が等電点、正規化ファンデルワールス体積、βタンパク質のためのアルファへリックスの指標、βタンパク質のためのベータ鎖の指標、タンパク質安定化のための側鎖の貢献度、原子間ポテンシャルに関する知識を基にした安定化尺度、疎水性指標、正規化されたターン頻度、ベータ鎖領域における自由エネルギー、アルファ−へリックス領域における自由エネルギー、極性、側鎖の相互作用、及びアミノ酸の分配度からなる群より選択される2種以上の性質である、[1]〜[4]のいずれか一項に記載の抽出法。
[6]ステップ(2)における前記物理的性質が、等電点、正規化ファンデルワールス体積、βタンパク質のためのアルファへリックスの指標、βタンパク質のためのベータ鎖の指標、タンパク質安定化のための側鎖の貢献度、原子間ポテンシャルに関する知識を基にした安定化尺度、疎水性指標、正規化されたターン頻度、ベータ鎖領域における自由エネルギー、アルファ−へリックス領域における自由エネルギー、極性、側鎖の相互作用、及びアミノ酸の分配度からなる、13種の性質である、[1]〜[4]のいずれか一項に記載の抽出法。
[7]ステップ(3)で生成されるクラスタの数が10〜100である、[1]〜[6]のいずれか一項に記載の抽出法。
[8]ステップ(4)における前記所定数が3〜30である、[1]〜[7]のいずれか一項に記載の抽出法。
[9]ステップ(5)における前記機能性アッセイが、前記試料である複数のペプチドが配列毎に区画化されて基板に固定されたなるペプチドチップを用いて行われる、[1]〜[8]のいずれか一項に記載の抽出法。
[10]ステップ(6)に続いて、以下のステップ(6−1)〜(6−4)を1回又は2回以上実施した後、ステップ(7)を実施する、[1]〜[9]のいずれか一項に記載の抽出法、
(6−1)上位の順位が付与された複数のクラスタを特定するステップ、
(6−2)特定された複数のクラスタより、クラスタ毎、所定数のペプチド配列を選抜するステップ、
(6−3)選抜したペプチド配列からなるペプチドを試料として機能性アッセイを行い、各ペプチド配列の機能性データを取得するステップ、
(6−4)機能性データに基づき、機能性の順位を前記複数のクラスタに付与するステップ。
[11]ステップ(7)において、上位n位(但し、nは2〜5の整数)までのクラスタからそれぞれルールを抽出する、[1]〜[10]のいずれか一項に記載の抽出法。
[12]ステップ(7)において、最上位の順位が付与されたクラスタのみからルールを抽出する、[1]〜[10]のいずれか一項に記載の抽出法。
[13]以下のステップ(1)〜(7)を含む、機能性ペプチドを表すルールの抽出法、
(1)アミノ酸残基数が同一で且つ配列が互いに異なる複数のペプチド配列からなるペプチドライブラリーを用意するステップ、
(2)前記ペプチドライブラリーから複数のペプチド配列を選抜するステップ、
(3)選抜したペプチド配列からなるペプチドを試料として機能性アッセイを行い、各ペプチド配列の機能性データを取得するステップ、
(4)機能性データに基づき、機能性アッセイに供したペプチド配列の中から、複数の高機能配列及び複数の低機能配列を選抜するステップ、
(5)N末端又はC末端からの位置毎に構成アミノ酸の物理化学的性質を数値化することによって、選抜した高機能配列及び低機能配列を数値データに変換するステップ、
(6)前記数値データを入力変数として、学習モデルを用いた解析を行うステップ、
(7)解析結果より、配列上の1以上の位置について前記物理的性質の条件又は該条件を満足するアミノ酸の種類を示すルールであって、高機能ペプチド配列の特徴を表す1又は2以上のルールを抽出するステップ。
[14]ステップ(7)の後、以下のステップ(8)を行う、[13]に記載の抽出法、
(8)ステップ(1)で用意したペプチドライブラリーの内、以前の選抜の際に選抜されなかったペプチド配列の集合の中から、抽出した前記ルールに適合する複数のペプチド配列を選抜した後、ステップ(3)〜(7)を行うステップ。
[15]学習モデルを用いた前記解析がファジィニューラルネットワーク解析であり、
ステップ(6)においてファジィニューラルネットワーク解析の結果として予測モデルが構築され、ステップ(7)では該予測モデルより前記ルールが抽出される、[13]に記載の抽出法。
[16][1]〜[15]のいずれか一項に記載の抽出法によって得られたルールに従ってペプチドを設計するステップを含む、機能性ペプチドの設計法。
[17]複数の候補ペプチド配列の中から、[1]〜[15]のいずれか一項に記載の抽出法によって得られたルールに適合するペプチド配列を選抜するステップを含む、機能性ペプチドの設計法。
[18][1]〜[12]のいずれか一項に記載の抽出法によって得られた、上位の順位が付与されたクラスタに含まれる1又は2以上のペプチド配列を高機能ペプチド配列として選択するステップを含む、機能性ペプチドの設計法。
[19]以下のステップ(1)〜(3)を含む、機能性ペプチドの設計法、
(1)複数の候補ペプチドを用意するステップ、
(2)N末端又はC末端からの位置毎に構成アミノ酸の物理化学的性質を数値化することによって、前記複数の候補ペプチド配列をそれぞれ数値データに変換するステップ、
(3)[15]に記載の抽出法においてルールの抽出の際に構築された予測モデルを用い、前記数値データを入力変数としてファジィニューラルネットワーク解析を行うステップであって、該ファジィニューラルネットワーク解析において、(i)ルールに適合するペプチド配列の選抜、(ii)選抜されたペプチド配列の予測値の評価、及び(iii)予測値の高いペプチド配列の選抜、が順に行われるステップ。
[20](iii)の処理の後、選抜されたペプチド配列の信頼度の評価が行われる、[19]に記載の設計法。
[21]以下のステップ(1)〜(3)を含む、機能性ペプチドの設計法、
(1)以下の(a)〜(d)からなる群より選択される集合を用意するステップ、
(a)[1]〜[12]のいずれか一項に記載の抽出法によって得られた、上位の順位が付与されたクラスタに含まれるペプチド配列の集合、
(b)[1]〜[12]のいずれか一項に記載の抽出法によって得られたルールに適合するペプチド配列の集合、
(c)[13]〜[15]のいずれか一項に記載の抽出法によって得られたルールに適合するペプチド配列の集合、
(d)(a)〜(c)からなる群より選択される2以上の集合を結合した集合、
(2)用意した集合の中から、共通する部分配列を認める第1ペプチド配列及び第2ペプチドを選抜するステップであって、第2ペプチド配列の方が、該部分配列よりもC末端側のアミノ酸の数が多いステップ、
(3)前記第1ペプチド配列から前記部分配列よりもC末端側のアミノ酸を除去して得られる第1部分配列と、前記第2ペプチド配列から前記部分配列及び前記部分配列よりもN末端側のアミノ酸を除去して得られる第2部分配列とを、該第1部分配列がN末端側に配置されるように連結するステップ。
[22]前記第1ペプチド配列では前記部分配列がC末端アミノ酸を含み、前記第2ペプチド配列では前記部分配列がN末端アミノ酸を含む、[21]に記載の設計法。
[23]下記条件1〜3の少なくとも1つを満足する、[21]又は[22]に記載の設計法、
条件1:それに含まれるペプチド配列のアミノ酸残基数が異なる複数のペプチドライブラリーを用意し、各ペプチドライブラリーを用いて[1]〜[12]のいずれか一項に記載の抽出法を行うことにし、各回について得られた、上位の順位が付与されたクラスタに含まれるペプチド配列の集合を全て連結し、前記集合(a)とする、
条件2:それに含まれるペプチド配列のアミノ酸残基数が異なる複数のペプチドライブラリーを用意し、各ペプチドライブリーを用いて[1]〜[12]のいずれか一項に記載の抽出法を行ってルールを得た後、抽出されたルール毎、適合するペプチドの集合を作製し、最後に全集合を連結して前記集合(b)とする、
条件3:それに含まれるペプチド配列のアミノ酸残基数が異なる複数のペプチドライブラリーを用意し、各ペプチドライブリーを用いて[13]〜[15]のいずれか一項に記載の抽出法を行ってルールを得た後、抽出されたルール毎、適合するペプチドの集合を作製し、最後に全集合を連結して前記集合(c)とする。
[24]ステップ(1)において前記集合(a)を用意することにし、
ステップ(2)では、第1ペプチド配列と対をなす第2ペプチド配列の候補が二つ以上存在する場合には、より上位の順位が付与されたクラスタに属するペプチド配列を優先して第2ペプチド配列に用い、第2ペプチド配列と対をなす第1ペプチド配列の候補が二つ以上存在する場合には、より上位の順位が付与されたクラスタに属するペプチド配列を優先して第1ペプチド配列に用いる、[21]〜[23]のいずれか一項に記載の設計法。
[25]ステップ(1)において前記集合(b)を用意することにし、
ステップ(2)では、第1ペプチド配列と対をなす第2ペプチド配列の候補が二つ以上存在する場合には、より上位の順位が付与されたクラスタのルールに適合するペプチド配列の方を優先して第2ペプチド配列に用い、第2ペプチド配列と対をなす第1ペプチド配列の候補が二つ以上存在する場合には、より上位の順位が付与されたクラスタのルールに適合するペプチド配列の方を優先して第1ペプチド配列に用いる、[21]〜[23]のいずれか一項に記載の設計法。
[26][16]〜[25]のいずれか一項に記載の設計法で設計されたペプチドを調製するステップを含む、機能性ペプチドの調製法。
[27]以下のステップ(1)〜(6)を含む、ポリペプチド又はポリペプチド含有組成物の評価法、
(1)ポリペプチドの配列を用意するステップ、
(2)[1]〜[15]のいずれか一項に記載の抽出法によって抽出された1又は2以上のルールに対してそれぞれスコアを関連付けるステップ、
(3)前記ルールとの照合が可能な一定の長さに前記ポリペプチドの配列を断片化するステップ、
(4)各断片配列を前記ルールと照合し、適合性を判定するステップ、
(5)ルールに適合すると判定された断片配列に対して、該ルールに関連付けられたスコアを付与するステップ、
(6)付与された全てのスコアを積算して総スコアを算出するステップであって、該総スコアが前記ポリペプチドの機能性を表す指標となるステップ。
[28]以下の(A)〜(C)のいずれかの特徴を備える、[27]に記載の評価法、
(A)ステップ(3)で生じた断片配列の中から、プロテアーゼ切断部位を内在する断片配列を除いた後にステップ(4)を行う、
(B)ステップ(6)において、プロテアーゼ切断部位を内在する断片配列以外の断片配列に付与されたスコアのみを積算する、
(C)ステップ(6)において、付与された全スコアを積算した後、ステップ(3)で生じた断片配列の中から、プロテアーゼ切断部位を内在する断片配列に付与されたスコアを除算する。
[29]以下のステップ(1)〜(6)を含む、ポリペプチド又はポリペプチド含有組成物の評価法、
(1)ポリペプチドの配列を用意するステップ、
(2)[1]〜[12]のいずれか一項に記載の抽出法によって得られた、上位の順位が付与されたクラスタに含まれる各ペプチド配列に対して、同一のクラスタに含まれるペプチド配列は各々相同性の高いスコアとなり且つクラスタの順位に対応したスコアとなるように、スコアを関連付けるステップ、
(3)スコアを関連付けた各ペプチド配列をそれぞれ前記ポリペプチドの配列と照合し、配列が一致する領域の数を調べるステップ、
(4)ステップ(3)で判明した前記領域の数と、ステップ(2)で関連付けたスコアとを乗ずることによってペプチド配列毎にスコアを算出した後、全てのスコアを積算して総スコアを算出するステップであって、該総スコアが前記ポリペプチドの機能性を表す指標となるステップ。
[30]以下のステップ(1)〜(5)を含む、ポリペプチド又はポリペプチド含有組成物の評価法、
(1)ポリペプチドの配列を用意するステップ、
(2)[13]〜[15]のいずれか一項に記載の抽出法においてルールを抽出する際に用いた学習モデルで解析可能な一定の長さに前記ポリペプチドの配列を断片化するステップ、
(3)N末端又はC末端からの位置毎に構成アミノ酸の物理化学的性質を数値化することによって、各断片配列を数値データに変換するステップ、
(4)前記学習モデルを用い、前記数値データを入力変数として、学習モデルによる解析を行い、各断片配列の予測機能度を算出するステップ、
(5)算出された予測機能度を積算するステップであって、得られた総予測機能度が前記ポリペプチドの機能性を表す指標となるステップ。
[31]配列番号1〜223のいずれかのアミノ酸配列、又は以下の群、即ちIIK,GTV,WIY,YYW,WRW,PWR,WFW,WYM,IWW,YWM,FWY,LWY,WYD,WMY,WYF,MWF,YFY,WWT,WWI,YYF,FMF,YMW,PFF,AWY,WMM,NWY,PWM,FWV,WYV,YFM,YGW,PVW,WRI,QWF,WHF,MWM,PIY,LFF,YSW,WNF,WSL,YLF,YYI,WYT,MYY,IWM,WHM,WLA,YQY,IQW,WLN,WMQ,WAM,AWM,TWY,WSM,VWI,MFL,NWM,WVQ,FGL,FNY,PIR,PWN,MWL,YGL,NWI,AWI,VFI,YSF,MIF,FVM,TWM,WQI,MYM,TWI,PMG,IGY,IML,VLF,YIV,YAM,PYN,VAY,PCK,SWL,PCW,PML,PLM,VYM,VMY,PFE,YSM,ISF,QWV,WVC,CWY,MTF,PLQ,ILM,YQV,PCC,YMI,WKC,PMH,WKW,WYE,WFK,WRR,WKW,RKF,WKS,VWW,VWW,PLK,YWL,KLK,FLR,YWL,NFK,LWY,HWF,LRI,WGW,WFL,FYF,RHW,PLK,KLK,LRI,KIW,QWR,IWN,RRK,KVR,NQY,WNP,LRY,FMY,WMH,WIK,YFI,IRA,NTH,WNP,YFI,WGV,HKL,WRG,YYT,QPW,LYL,TRA,RKA,WHA,LYL,AFL,FII,RPL,FVI,YSH,LYS,IFW,KIP,FII,WQE,FCP,NHI,WAG,VRQ,GPR,LYS,NRE,FLT,YVP,LYM,IIP,WRC,NTK,QFH,FQW,NTK,YVP,LYN,FGF,LKS,GYL,FIE,KGS,VFA,RFN,LYH,QFH,RVI,VAY,LKS,QYF,WMN,DRG,VYP,YGT,IQW,KIA,QKV,HMK,WQL,RFN,MHP,VRD,KVA,ITR,NQG,YMY,RDG,WMK,YII,NKI,PMR,HML,VAY,KHM,YGT,HAH,TRP,KIA,IWT,FMA,CWP,ICY,HMK,KMS,MIP,FSV,PSH,KVA,KNL,VKT,MHP,KHM,PFI,TRP,RDG,QGR,WMS,YIV,KAC,LQH,MIP,MFS,PSH,VKT,NGI,PVS,NPL,LSP,TKQ,QII,QGR,MFS,VKA,LQH,PPQ,QHL,LSP,VKA,QII,LMS,PHQ,RFA,MCP,NGC,QHL,YCI,MQF,SNF,YMA,LQY,LPQ,VLL,YMA,AIK,WMT,EYH,VLL,SML,GLC,END,WGS,RAD,GWV,RAD,HHS,EAF,MGI,IVN,SEW,QHA,THM,CLY,NMC,TLL及びLMWから選択されるアミノ酸配列からなる、胆汁酸結合ペプチド。
【図面の簡単な説明】
【0024】
【図1】機能性ペプチドを網羅的に探索・設計するための戦略を示す図。
【図2】機能性ペプチドを網羅的に探索・設計するための戦略(具体例)を示す図。
【図3】新規ペプチドの設計法を示す図。
【図4】階層的クラスタ分析を利用したルールの抽出法を示すフローチャート。
【図5】アミノ酸に関する13種の性質の数値化の例を示す図。
【図6】ファジィニューラルネットワーク(FNN)解析を利用したルールの抽出法を示すフローチャート。
【図7】ANNの構造を示す図。
【図8】FNNの構造を示す図。
【図9】シグモイド関数を示す図。
【図10】small(S)とbig(B)の2つのルールの分割を用いたときのFNNの構造を示す図。
【図11】ファジールールの一例を示す図。
【図12】ペプチド配列の設計法の一例を示すフローチャート。
【図13】予測モデルを利用したペプチド配列の設計法を示すフローチャート。
【図14】ペプチド配列の連結を利用したペプチド配列の設計法を示すフローチャート。
【図15】ペプチド配列の連結を利用したペプチド配列の設計法(詳細)を示すフローチャート。
【図16】ポリペプチド等の評価法を示すフローチャート。
【図17】ポリペプチド等の評価法における断片化のステップを示す図。(A)では、N末端(又はC末端)から3アミノ酸毎に区切り、トリペプチド配列の集合を得る。(B)では、N末端(又はC末端)の3アミノ酸を最初の断片とし、N末端(又はC末端)から1アミノ酸又は2アミノ酸だけC末端側にずらした位置からの3アミノ酸を次の断片とする。
【図18】上位クラスタに含まれるペプチド配列を用いた評価法を示すフローチャート。
【図19】予測モデルを用いた評価法を示すフローチャート。
【図20】胆汁酸結合能の評価を示すフローチャート。
【図21】胆汁酸結合能とアミノ酸配列の関係を表すルール。a.T検定により、好ましいアミノ酸を選出した。b.好ましくないアミノ酸として、親和性を低下させる下位3位のアミノ酸を示した。
【図22】胆汁酸結合アッセイの結果を示す表。3サンプルの平均蛍光強度(バックグラウンドの蛍光強度を差し引いた値)を示した。
【図23】大豆タンパク質(βコングリシニン)由来のペプチド酸配列を用いた胆汁酸結合アッセイの結果を示す表。
【図24】FNN解析によって選抜されたペプチド配列を用いた胆汁酸結合アッセイの結果を示す表。種ペプチド(VAWWMY)を基準(1)として3スポットの全てが0.8以上の場合にポジティブ配列とした。また、3スポットの全てがバックグラウンドと同等の場合にネガティブ配列とした。左の欄にはFNN解析によるペプチド配列の選抜方法を示した。
【図25】(a)FNN解析により抽出された配列ルール表。(b)配列ルール表より抽出されたポジティブルール。左の欄にはFNN解析によるペプチド配列の選抜方法を示した。
【図26】FNN解析によって選抜されたペプチド配列を用いた胆汁酸結合アッセイ(2回目)の結果を示す表。種ペプチド(VAWWMY)を基準(1)として3スポットの全てが0.8以上の場合にポジティブ配列とした(P値(対ブランク)<0.05)。また、3スポットの全てが0.2以下の場合にネガティブ配列とした。左の欄にはFNN解析によるペプチド配列の選抜方法を示した。
【図27】FNN解析により抽出されたルール。左の欄にはFNN解析によるペプチド配列の選抜方法を示した。
【図28】FNN解析によって選抜されたペプチド配列を用いた胆汁酸結合アッセイ(3回目)の結果を示す表。左の欄にはFNN解析によるペプチド配列の選抜方法を示した。
【図29】階層的クラスタ分析による分類結果を示す表。
【図30】階層的クラスタ分析により形成された上位5個のクラスタ。
【図31】上位クラスタ及び下位クラスタからの選抜したペプチド配列を用いたアッセイの結果。
【図32】選抜された胆汁酸結合ペプチドの胆汁酸結合能を示す表。
【図33】選抜されたペプチド配列の胆汁酸結合能を比較したグラフ。
【図34】胆汁酸結合アッセイで最大の蛍光強度を示したペプチド配列の胆汁酸結合能を示すグラフ。
【図35】選抜された胆汁酸結合ペプチドの胆汁酸ミセル形成阻害能を比較したグラフ。
【図36】選抜された胆汁酸結合ペプチドの胆汁酸ミセル破壊能を比較したグラフ。
【図37】P-1(PWWWMY:配列番号2)とP-3(VIWWFK:配列番号5)の胆汁酸ミセル破壊能を比較したグラフ。■:P-1、○:P-3、▲:コレスチラミン。
【図38】選抜された胆汁酸結合ペプチドの生体コレステロール吸収阻害能を比較した表。P値をT検定で求めた。
【発明を実施するための形態】
【0025】
<機能性ペプチドを表すルールの抽出法>
本発明の第一の局面は機能性ペプチドを表すルールの抽出法に関する。抽出したルールを用いれば、効率的に機能性ペプチドを設計ないし同定することができる。つまり、ルールは機能性ペプチドの設計ないし同定に有用である。
【0026】
「機能性ペプチドを表すルール」とは、特定の機能を有するペプチドに共通する規則を表したものである。ルールの形式は、それを抽出する際に用いる手法によって異なる。ルールの詳細は後述する。「機能性ペプチド」とは、生物学的、医学的、薬学的、栄養学的、又は食品学的に有用な機能を有するペプチドをいう。「機能」の例として、特定の物質に対する親和性を挙げることができる。より具体的な例として、胆汁酸に対する親和性(結合性)を挙げることができる。「ペプチド」とは二つ以上のアミノ酸がペプチド結合によって連なった分子である。ペプチドのアミノ酸残基数は特に限定されない。即ち、慣例に従い、「ペプチド」は、オリゴペプチド及びポリペプチド(タンパク質を含む)を包括する用語として使用される。また、本明細書では慣例の標記法に従い左端がアミノ末端、右端がカルボキシ末端となるようにペプチドを表記する。
【0027】
1.階層的クラスタ分析を利用したルールの抽出法
本発明の一態様では以下のステップ(1)〜(7)を行う(図4を参照)。
(1)アミノ酸残基数が同一で且つ配列が互いに異なる複数のペプチド配列からなるペプチドライブラリーを用意するステップ、
(2)N末端又はC末端からの位置毎に構成アミノ酸の物理的性質を数値化することによって、前記ペプチドライブラリーに含まれる各ペプチド配列を数値データに変換するステップ、
(3)前記数値データを入力変数として階層的クラスタ分析し、各ペプチド配列を、N末端又はC末端からの位置毎に前記物理的性質の数値範囲で規定される複数のクラスタに分類するステップ、
(4)前記複数のクラスタの中から、クラスタ毎、所定数のペプチド配列を選抜するステップ、
(5)選抜したペプチド配列からなるペプチドを試料として機能性アッセイを行い、各ペプチド配列の機能性データを取得するステップ、
(6)機能性データに基づき、機能性の順位を前記複数のクラスタに付与するステップ、
(7)上位の順位が付与されたクラスタを規定する、前記物理的性質の数値範囲又は該数値範囲を満足するアミノ酸の種類を、高機能ペプチドの特徴を表すルールとして抽出するステップ
【0028】
本発明の抽出法ではまずペプチドライブラリーを用意する(ステップ(1))。「ペプチドライブラリー」とは、複数のペプチド配列の集合である。本発明で使用するペプチドライブラリーは、アミノ酸残基数が同一で且つ配列が互いに異なる複数のペプチド配列から構成される。ここでのアミノ酸残基数は特に限定されないが、例えば2〜10、好ましくは3〜8、更に好ましくは3〜6である。アミノ酸残基数が少なすぎると、ペプチドライブラリーを構成するアミノ酸配列(以下、ペプチドライブラリーを構成する各アミノ酸配列のことを「メンバー」とも呼ぶ)の数が少なくなり、「効率的に多数のアミノ酸配列を分類する」という、本発明の特徴の一つが十分に活かされない。また、候補ペプチド配列の種類が少なくなることから、新規な機能性ペプチドを同定できる可能性が低くなる。一方、アミノ酸残基数が多すぎると、無作為の(偏りのない)ペプチドライブラリーを作製した場合のメンバー数が膨大となり、階層的クラスタ分析に多大な処理能力、処理時間が必要となる。
【0029】
ペプチドライブラリー中のメンバー数は特に限定されないが、信頼性の高いルールの抽出のためにはメンバー数を多くするよい。但し、メンバー数の増大に応じて、後述の階層的クラスタ分析が複雑化することを考慮し、メンバー数を1000〜100000、好ましくは2000〜500000とする。信頼性の高いルールを抽出するためにはペプチド配列の偏りをなくすことが有効であり、即ち無作為に選択されたメンバーの集合(ランダム・ペプチドライブラリー)を使用するとよい。各メンバーを構成するアミノ酸は、典型的には、生体内でタンパク質を構成するアミノ酸、即ち、アラニン、アルギニン、アスパラギン、アスパラギン酸、システイン、グルタミン酸、グルタミン、グリシン、ヒスチジン、イソロイシン、ロイシン、リシン、メチオニン、フェニルアラニン、プロリン、セリン、トレオニン、トリプトファン、チロシン、バリン等である。但し、ペプチドを構成可能なアミノ酸であれば、これら以外のアミノ酸であってもよい。
【0030】
次に、ペプチドライブラリーに含まれる各メンバーを階層的クラスタ分析で分析可能な数値データに変換する(ステップ(2))。具体的には、各メンバーについて、N末端又はC末端からの位置毎に構成アミノ酸の物理的化学性質を数値化し、物理的性質を表す数値の集合を各メンバーに付与する。
ここでの「物理的性質」とは、サイズ(大きさ)、疎水度、電荷、等電点など、アミノ酸の分類に利用される性質をいう。好ましくは、等電点、正規化ファンデルワールス体積、βタンパク質のためのアルファへリックスの指標、βタンパク質のためのベータ鎖の指標、タンパク質安定化のための側鎖の貢献度、原子間ポテンシャルに関する知識を基にした安定化尺度、疎水性指標、正規化されたターン頻度、ベータ鎖領域における自由エネルギー、アルファ−へリックス領域における自由エネルギー、極性、側鎖の相互作用、アミノ酸の分配度等電点、正規化ファンデルワールス体積、βタンパク質のためのアルファへリックスの指標、βタンパク質のためのベータ鎖の指標、タンパク質安定化のための側鎖の貢献度、原子間ポテンシャルに関する知識を基にした安定化尺度、疎水性指標、正規化されたターン頻度、ベータ鎖領域における自由エネルギー、アルファ−へリックス領域における自由エネルギー、極性、側鎖の相互作用、及びアミノ酸の分配度からなる群より選択される2種以上の性質を併用する。更に好ましくは、これら13種の全てを併用する。この態様では各メンバーが、それを構成するアミノ酸の位置毎に13種の数値を持つ数値データとなる。例えばメンバーのアミノ酸残基数が3であれば39個(3×13)の数値の集合(セット)からなる数値データとなる。尚、これら13種の性質はGenome Net JapanのDB(http://www.genome.ad.jp/dbget/aaindex.html)が提供する544指標の指標をクラスタ分類した際、もっとも互いに相関の低いクラスタ代表であるため、これらの総合は544指標での判断に相当するものと考えられる。
【0031】
上記13種の性質の数値化の例を図5に示す。図5の表では、既報の方法に従って各アミノ酸の13指標が数値化されている。ここでの13指標は等電点(Isoelectric point; Zimmerman,et,al., J.Theor.Biol., Vol.21,No.2,170-201(1968))、正規化ファンデルワールス体積(Normalized van der Waals volume; Fauchere,et,al., Int.J.Pept.Protein,Res., Vol.32,No.4,269-278,(1988))、βタンパク質のためのアルファへリックスの指標(Alpha-helix indices for beta-proteins; Geisow-Roberts, Int.J.Biol.Macromol.,Vol.2,No.6,387-389,(1980))、βタンパク質のためのベータ鎖の指標(Beta-strand indices for beta-proteins; Geisow-Roberts,Int.J.Biol.Macromol.,Vol.2,No.6,387-389,(1980))、タンパク質安定化のための側鎖の貢献度(Side-chain contribution to protein stability(kJ/mol); Takano-Yutani, Protein,Eng.,2001,Aug;14(8):525-8)、原子間ポテンシャルに関する知識を基にした安定化尺度(The stability scale from the knowledge-based atom-atom potential; Zhou-Zhou, Proteins.,2004,Feb,1;54(2):315-22)、疎水性指標(Hydropathy index; Kyte-Doolittle,J.Mol.Biol.,Vol.157,No.1,105-132,(1982))、正規化されたターン頻度(Normalized frequency of turn; Crawford,et,al.,Proc,Natl,Acad,Sci,U,S,A.,1973,Feb;70(2):538-42.)、ベータ鎖領域における自由エネルギー(Free energy in beta-strand region; Munoz-Serrano, Struct.Funct.Genet.,Vol.20,No.4,301-311,(1994))、アルファ-へリックス領域における自由エネルギー(Free energy in alpha-helical region; Munoz-Serrano, Struct.Funct.Genet.,Vol.20,No.4,301-311,(1994))、極性(Polarity; Zimmerman,et,al., J.Theor.Biol. Vol.21,No.2,170-201,(1968))、側鎖の相互作用(Side chain interaction parameter; Krigbaum-Komoriya, Biochim.Biophys.Acta, Vol.576,No.1,204-228,(1978))、アミノ酸の分配度(Amino acid distribution; Jukes,et,al., Science.,1975,Jun,4;189(4196):50-1)である。
【0032】
続いて、ステップ(2)で生成した数値データを入力変数として階層的クラスタ分析を行い、各メンバーを、N末端又はC末端からの位置毎に物理的性質の数値範囲で規定される複数のクラスタに分類する(ステップ(3))。「階層的クラスタ分析」はクラスタ分析の一つであり、階層的クラスタリングとも呼ばれる。クラスタ分析(クラスタリング)とは、対象間の距離を定義し、距離の近さによって対象を分類する統計手法である。クラスタ分析は、階層的クラスタリングと非階層的クラスタリングに大別される。階層的クラスタリングでは、最短距離法、最長距離法、群平均法、ウォード法などの手法を利用して対象を分類し、階層構造(デンドログラム)を得る。この階層構造では階層の深度に応じてクラスタ数が変動する。即ち、上層から下層に向かってクラスタ数が増大し、クラスタ数は最下層で最大となる。本発明では、好ましくは、クラスタ数が10〜100となる階層を選択する。最適クラスタ数の決定法は、Dunn’s index (J.C.Dunn, Cybernetics, vol. 3, pp. 32-57, 1973)などでも提唱されているため、これを用いることも可能である。本手法では最適階層数は実験規模に反映されるため、現実的な実験規模としての10〜100を選択した。尚、階層的クラスタ分析についてはEisen et al. (1998) PNAS 95:14863が参考になる。
【0033】
次に、ステップ(3)で形成された複数のクラスタの中から、クラスタ毎、所定数のペプチド配列を選抜する(ステップ(4))。即ち、各クラスタから代表を無作為に選抜する。代表の数(即ち所定数)は特に限定されず、好ましくは3〜30、更に好ましくは5〜100である。代表の数が多い方が信頼性の高いデータが得られる。一方で代表の数が多くなれば、以下の機能性アッセイに要する時間、操作などが増大する。
【0034】
続いて、選抜したペプチド配列からなるペプチドを試料として機能性アッセイを行い各ペプチド配列の機能性データを取得する(ステップ(5))。このステップではまず、選抜した各ペプチド配列について、対応するペプチド(当該ペプチド配列を有するペプチド)を公知のペプチド合成法(例えば固相合成法、液相合成法)等を利用して用意する。次に、用意したペプチドを試料として機能性アッセイを行う。「機能性アッセイ」とは、試料ペプチドの機能性を評価可能な試験ないし検定をいう。「機能性の評価」は、機能性の有無の評価と、機能性の程度の評価を含む。「機能性アッセイ」の一例は親和性アッセイである。親和性アッセイとは、標的に対する試料ペプチドの親和性を検出・評価する試験をいい、通常、試料ペプチドと標的との接触操作及びそれに続く洗浄操作を伴う。洗浄操作は非特異的吸着を除去する目的で行う。標的として、特定の生理機能を有する物質(例えば各種受容体、各種リガンド、各種サイトカイン、抗原タンパク質、抗体、酵素、ヒートショックプロテイン、脂質(胆汁酸)、糖構造物、高分子、無機イオン、無機鉱物)、細胞などを用いることができる。ここでの細胞としては哺乳動物(ヒト、サル、ウシ、ウマ、ウサギ、マウス、ラット、モルモット、ハムスター等)の各種細胞、例えば心筋細胞、平滑筋細胞、脂肪細胞、線維芽細胞、骨細胞、軟骨細胞、破骨細胞、実質細胞、表皮角化細胞(ケラチノサイト)、上皮細胞(皮膚表皮細胞、角膜上皮細胞、結膜上皮細胞、口腔粘膜上皮、毛包上皮細胞、口腔粘膜上皮細胞、気道粘膜上皮細胞、腸管粘膜上皮細胞など)、内皮細胞(角膜内皮細胞、血管内皮細胞など)、神経細胞、グリア細胞、脾細胞、膵臓β細胞、メサンギウム細胞、ランゲルハンス細胞、肝細胞、又はこれらの前駆細胞、或いは間葉系幹細胞(MSC)、胚性幹細胞(ES細胞)、胚性生殖細胞(EG細胞)、又は成体幹細胞などを使用することができる。また、正常細胞の他、癌細胞など何らかの異常を来した細胞、或いはHeLa細胞、CHO細胞、Vero細胞、HEK293細胞、HepG2細胞、COS−7細胞、NIH3T3細胞、Sf9細胞などの株化された細胞等を使用することもできる。金属、半導体、無機材料、合成高分子等を材料とする微粒子や基材(基板等)を標的としてもよい。
【0035】
好ましくは、複数の試料ペプチドの機能性を同時に評価可能な機能性アッセイを利用する。これによって操作時間を短縮できる。複数の試料ペプチドを固定化したペプチドチップを利用すればこのような機能性アッセイが可能である。ペプチドチップでは通常、多数のペプチドがペプチド配列毎に区画化されて基板に固定される。このようなペプチドチップを用いれば操作時間の大幅な短縮化を達成可能である。機能性アッセイに供する全ての試料ペプチドが固定化されたペプチドチップを用いることが好ましい。但し、機能性アッセイに供するペプチドが二つ以上のペプチドチップに分かれて固定化されていてもよい。 ペプチドチップを用いることのもう一つの利点は、多数の試料ペプチドについて完全に同一の条件下での比較・評価が行えることである。従って、ペプチドチップを用いれば信頼性の一層高いデータが得られる。
【0036】
次に、ステップ(5)で得られた機能性データに基づき、機能性の順位をクラスタに付与する(ステップ(6))。即ち、機能性アッセイの結果、各クラスタから選抜したペプチド配列に関して得られた機能性データを利用してクラスタに順位付けを行う。例えば、同一のクラスタに属するペプチド配列に関して得られた数値データの総和又は平均をクラスタ間で比較し、機能性の順位を決定することができる。その他、その配列の消化酵素での切断の有無、合成の容易さ、合成のコスト、精製の容易さなどを加味することで、さらに候補の順位を決定することもできる。
ここでの順位付けは、後続のステップ(7)において「上位の順位が付与されたクラスタ」の特定を可能にするために行われる。ステップ(7)において「上位の順位が付与されたクラスタ」が特定できればよいことから、上位の順位のみを付与し、下位の順位についてはその付与を省略することにしてもよい。但し、典型的には全てのクラスタに順位を付与する。
【0037】
上位何位までを「上位の順位」とするかは、基準となる活性を持つ配列を考慮し、これよりも活性が高いものを選択することが望ましい。しかし、その後の有機合成・精製のステップを加味し、合成の容易さ、合成のコスト、精製の容易さなどを考慮して候補を広げて選抜することが望ましい。1位〜n位までを上位とすれば、例えばnは1〜20、好ましくは1〜10、更に好ましくは2〜5である。尚、nが1の場合は上位1位(最上位)のみが、上位の順位に該当することになる。
【0038】
以上のようにしてクラスタに順位を付与した後、上位の順位が付与されたクラスタを規定する物理化学的性質の数値範囲又は該数値範囲を満足するアミノ酸の種類を、高機能ペプチドの特徴を表すルールとして抽出するステップ高機能ペプチドの特徴を表すルールとして抽出する(ステップ(7))。このステップでは始めに、上位の順位が付与されたクラスタを特定する。そして、特定されたクラスタ毎にそれを規定する物理的性質の数値範囲又は該数値範囲を満足するアミノ酸を「高機能ペプチドの特徴を表すルール」として抽出する。その結果、ペプチド配列における位置毎、物理的性質の数値範囲を示すルール(以下、「数値範囲ルール」と呼ぶ)又はペプチド配列における位置毎、該当する1又は2以上のアミノ酸を示すルール(以下、「アミノ酸ルール」と呼ぶ)が得られる。尚、「物理的性質の数値範囲を満足するアミノ酸」は、これに限られるものではないが、通常はタンパク質を構成する20種のアミノ酸の中から選択される。
【0039】
以上の通り本発明では、高機能ペプチドの特徴を表すルールとして、物理的性質の数値範囲の組(セット)からなるルール(数値範囲ルール)、又は該当するアミノ酸の組(セット)からなるルール(アミノ酸ルール)が抽出される。クラスタが複数の物理的性質の数値範囲で規定されていた場合、ペプチド配列のアミノ酸残基数に物理的性質の数を乗じた数の数値範囲からなる数値範囲ルールが抽出される。例えば、ペプチド配列のアミノ酸残基数が3であり、クラスタが13種の物理的性質(等電点、正規化ファンデルワールス体積、βタンパク質のためのアルファへリックスの指標、βタンパク質のためのベータ鎖の指標、タンパク質安定化のための側鎖の貢献度、原子間ポテンシャルに関する知識を基にした安定化尺度、疎水性指標、正規化されたターン頻度、ベータ鎖領域における自由エネルギー、アルファ−へリックス領域における自由エネルギー、極性、側鎖の相互作用、アミノ酸の分配度)の数値範囲で規定されていれば、39(3×13)個の数値範囲からなるルールが得られる。
【0040】
抽出されるルールの数は、上位の順位が付与されたとして特定したクラスタの数に依存する。例えば上位5位までを「上位の順位」とした場合、1位〜5位の各クラスタからそれぞれルールを抽出する。このようにして5個のルール(機能性の高い順に、1位のクラスタから抽出したルール、2位のクラスタから抽出したルール、3位のクラスタから抽出したルール、4位のクラスタから抽出したルール、5位のクラスタから抽出したルール)が得られる。他の例として、上位1位だけを「上位の順位」とした場合には、1位(最高位)のクラスタから抽出したルールのみが得られることになる。
【0041】
本発明の一態様では、ステップ(6)に続いて、以下のステップ(6−1)〜(6−4)を1回又は2回以上実施した後、ステップ(7)を実施する。
(6−1)上位の順位が付与された複数のクラスタを特定するステップ、
(6−2)特定された複数のクラスタより、クラスタ毎、所定数のペプチド配列を選抜するステップ、
(6−3)選抜したペプチド配列からなるペプチドを試料として機能性アッセイを行い、各ペプチド配列の機能性データを取得するステップ、
(6−4)機能性データに基づき、機能性の順位を前記複数のクラスタに付与するステップ。
【0042】
この態様では、ステップ(6)によって上位の順位が付与されたクラスタからルールを抽出するのではなく、上位の順位が付与されたクラスタを用いて再び機能性アッセイとその結果に基づくクラスタの順位付けを行う。これによって、ルールの抽出対象となるクラスタを最適化する。ステップ(6−1)は、ステップ(7)におけるクラスタの特定方法に準じて行えばよい。但し、ステップ(6−1)における「上位の順位」とステップ(7)における「上位の順位」は同一でなくてもよい。即ち、ステップ(6−1)において上位m位(mは整数)までのクラスタを特定することにし、ステップ(7)では上位n位(nはmよりも小さな整数)までのクラスタからルールを抽出する。ここでのmは、例えば1〜20、好ましくは1〜10、更に好ましくは2〜5の整数であり、nはmよりも小さい整数である。具体例を示せば、ステップ(6−1)では上位5位のクラスタを特定し(m=5)、ステップ(7)では上位3位のクラスタからルールを抽出する(n=3)。
【0043】
ステップ(6−2)はステップ(4)に、ステップ(6−3)はステップ(5)に、ステップ(6−4)はステップ(6)にそれぞれ準じて行えばよい。また、ステップ(6−1)〜(6−4)の繰り返し数は特に限定されない。例えば、これら一連のステップを1回〜5回行うことにする。
【0044】
2.学習モデルを利用したルールの抽出法
この態様では学習モデルを利用し、機能性ペプチドを表すルールを抽出する。この態様の抽出法は下記ステップ(1)〜(7)を含む(図6を参照)。
(1)アミノ酸残基数が同一で且つ配列が互いに異なる複数のペプチド配列からなるペプチドライブラリーを用意するステップ、
(2)前記ペプチドライブラリーから複数のペプチド配列を選抜するステップ、
(3)選抜したペプチド配列からなるペプチドを試料として機能性アッセイを行い、各ペプチド配列の機能性データを取得するステップ、
(4)機能性データに基づき、機能性アッセイに供したペプチド配列の中から、複数の高機能配列及び複数の低機能配列を選抜するステップ、
(5)N末端又はC末端からの位置毎に構成アミノ酸の物理的性質を数値化することによって、選抜した高機能配列及び低機能配列を数値データに変換するステップ、
(6)前記数値データを入力変数として、学習モデルを用いた解析を行うステップ、
(7)解析結果より、配列上の1以上の位置について前記物理的性質の条件又は該条件を満足するアミノ酸の種類を示すルールであって、高機能ペプチド配列の特徴を表す1又は2以上のルールを抽出するステップ。
【0045】
ステップ(1)は、上記態様(階層的クラスタ分析を利用した抽出法)のステップ(1)と同一であるのでその説明を省略する。ステップ(1)に続いて、ペプチドライブラリーから複数のペプチド配列を選抜する(ステップ(2))。選抜するペプチド配列の数は特に限定されない。但し、使用するペプチドライブラリーの大きさを考慮し、サンプリング数として適当な数にすることが好ましい。ここでの「適当な数」は、ペプチドライブラリーのメンバー数の例えば1/500000〜1/500、好ましくは1/100000〜1/1000、更に好ましくは1/50000〜1/10000である。尚、選抜するペプチド配列の数が多い方が信頼性の高いデータが得られる。一方、選抜するペプチド配列の数が多くなれば、以下の機能性アッセイに要する時間、操作などが増大する。
【0046】
次に、選抜したペプチド配列からなるペプチドを試料として機能性アッセイを行い、各ペプチド配列の機能性データを取得する(ステップ(3))。当該ステップは上記態様(階層的クラスタ分析を利用した抽出法)のステップ(5)と同一であるのでその説明を省略する。
【0047】
続いて、機能性データに基づき、機能性アッセイに供したペプチド配列の中から複数の高機能配列及び複数の低機能配列を選抜する(ステップ(4))。このステップでは機能性アッセイで得られた、各ペプチド配列の機能性データに基づき、機能性が高いことを示したペプチド配列(便宜上、「高機能ペプチド配列」と呼ぶ)と、機能性が低いことを示したペプチド配列(便宜上、「低機能ペプチド配列」と呼ぶ)を選抜する。このように、高機能ペプチド配列だけでなく、それに対照的な配列である低機能ペプチド配列も選抜する。選抜するペプチド配列の数ないし割合は特に限定されない。例えば、使用した試料ペプチドを機能性の高い順に並べたときの上位1%〜20%、好ましくは上位1%〜10%を高機能ペプチド配列として選抜し、下位1%〜20%、好ましくは下位1%〜10%を低機能ペプチド配列として選抜する。高機能ペプチド配列の数と低機能ペプチド配列の数は同一でなくてもよいが、これを同一にすれば以降の学習モデルによる解析の精度及び信頼度が高められる。
【0048】
ステップ(4)に続いて、N末端又はC末端からの位置毎に構成アミノ酸の物理化学的性質を数値化することによって、選抜した高機能配列及び低機能配列を数値データに変換する(ステップ(5))。このステップは、選抜した各ペプチド配列をFNNで解析可能な形態に変換するものである。このステップによって、選抜した各ペプチド配列は、位置毎に特定の性質に関する数値が関連付けられたデータとなる。
【0049】
上記態様(階層的クラスタ分析を利用した抽出法)の場合と同様、ここでの「物理的性質」とはサイズ(大きさ)、疎水度、電荷、等電点など、アミノ酸の分類に利用される性質のことである。また、上記態様の場合と同様、好ましくは、等電点、正規化ファンデルワールス体積、βタンパク質のためのアルファへリックスの指標、βタンパク質のためのベータ鎖の指標、タンパク質安定化のための側鎖の貢献度、原子間ポテンシャルに関する知識を基にした安定化尺度、疎水性指標、正規化されたターン頻度、ベータ鎖領域における自由エネルギー、アルファ−へリックス領域における自由エネルギー、極性、側鎖の相互作用、及びアミノ酸の分配度からなる群より選択される2種以上の性質を併用し、更に好ましくは、これら13種の全てを併用する。ここで特に言及しない事項については、上記態様(階層的クラスタ分析を利用した抽出法)のステップ(2)における、対応する説明が援用される。
【0050】
次に、ステップ(5)で得られた数値データを入力変数として、学習モデルを用いた解析を行う(ステップ(6))。ルール(規則)を抽出できる限り、ここでの解析法の種類は特に限定されない。解析法の例として、決定木による解析、ファジィニューラルネットワーク解析を挙げることができる。中でもファジィニューラルネットワーク解析が好ましい。ファジーニューラルネットワーク解析を採用した場合、予測モデルが構築される。ここで「ファジィニューラルネットワーク」とは、人工ニューラルネットワーク(Artificial Neural Network; ANN)とファジィ推論を組み合わせた方法をいい、ファジイ推論の欠点であるメンバーシップ関数の決定を人間に頼るという部分を回避すべく、ANNをファジィ推論に組み込み、その自動決定を行う方法である。学習機械のひとつであるANN(図7)は、生体の脳における神経回路網を数学的にモデル化したものであり、以下の特徴を持つ。ANNにおける学習は、目的の出力値(教師値)をもつ学習用のデータ(入力値; X)を用いて、バックプロパゲーション法(Back propagation; BP法)により教師値と出力値(Y)の誤差が小さくなるように、図7における○と○をつなぐ回路における結合荷重を変え、その出力値が教師値に近づくようにモデルを構築する過程であり、このBP法を用いれば、ANNは学習により自動的に知識を獲得することができる。そして、最終的に学習に用いていないデータを入力することにより、そのモデルの汎用性を評価することができる。従来、メンバーシップ関数の決定は、人間の感覚に頼っていたが、上で述べたようなANNをファジイ推論に組み込むことで自動的なメンバーシップ関数の同定が可能になる。これがFNNである。ANNと同様に、BP法を用いることによりネットワークに与えられた入出力関係を、結合荷重を変化させることで自動的に同定しモデル化することができる。FNNは、学習後のモデルを解析することでファジィ推論のように人間に理解しやすい言語的なルールとして知識を獲得できるという特徴をもっている。つまり、FNNは、その構造、特徴から、アミノ酸の性質を表した数値のような変数の組み合わせにおける最適なファジィ推論の組み合わせを自動決定し、ペプチドの親和性に関する推定とそのルールの生成を同時に行うことができる。
【0051】
FNNの構造は入力層、シグモイド関数に含まれるパラメータWc、Wgを決定するメンバーシップ関数部分(前件部)、Wfを決定し、入力と出力の関係をルールとして取り出すことが可能なファジィルール部分(後件部)、出力層の4層から成り立っている(図8)。FNNのモデル構造を決定する結合荷重にはWc、Wg、Wfがある。結合荷重Wcは、メンバーシップ関数に用いられるシグモイド関数の中心位置、Wgは中心位置での傾きを決定する(図9)。結合荷重Wfは各ファジイ領域の推定結果に対する寄与を表しており、Wfよりファジィルールを導くことができる。
【0052】
FNN解析におけるファジィルールの作成には結合荷重のひとつであるWf値が用いられる。Wf値が正の値で大きいと、そのユニットは「機能性が高い」と判定されることに対する寄与が大きく、そのルールに当てはまったアミノ酸を有するペプチドは「機能性が高い」と判断される。Wf値が負の値で小さいと、そのユニットは「機能性が低い」と判定されることに対する寄与が大きく、そのルールに当てはまったアミノ酸を有するペプチドは「機能性が低い」と判断される。
【0053】
図10に2つの入力で、small(S)とbig(B)の2つのルールの分割を用いたときのFNNの構造を示した。ファジールール部分であるSS(1入力目がsmall、2入力目がsmall)、SB、BS、BBに入る値は、その4つのノードにおける値の和が1になるように規格化される。そして、それぞれの値にWf(SS)、Wf(SB)、Wf(BS)、Wf(BB)をかけ、それらの和が出力値yになる。2つの入力、small(S)とbig(B)の2分割のときの、ファジールールの例を図11に示す。
【0054】
学習モデルを用いた解析の結果より、配列上の1以上の位置について前記物理的性質の条件又は該条件を満足するアミノ酸の種類を示すルールであって、高機能ペプチド配列の特徴を表す1又は2以上のルールを抽出する(ステップ(7))。FNN解析を利用した場合には、構築された予測モデルよりルールを抽出することになる。
【0055】
抽出されるルールは一つとは限らず、場合によっては複数のルールを抽出できる。尚、ペプチド配列上の全ての位置について物理的性質の条件又は該条件を満足するアミノ酸が示されとは限らない。換言すれば、抽出されるルールでは、最低一つの位置について、採用した物理的性質の条件又は該条件を満足するアミノ酸が示されている。
【0056】
ここで、本発明の一態様においては、ステップ(7)の後、以下のステップ(8)を行う。
(8)ステップ(1)で用意したペプチドライブラリーの内、以前の選抜の際に選抜されなかったペプチド配列の集合の中から、抽出した前記ルールに適合する複数のペプチド配列を選抜した後、ステップ(3)〜(7)を行うステップ。
【0057】
このステップ(8)ではまず、抽出したルールを用いて複数のペプチド配列を選抜する。このとき、ステップ(1)で用意したペプチドライブラリー全体から無作為に複数のペプチド配列を抽出するのではなく、当該ペプチドライブラリーの内、以前の選抜の際に選抜されなかったペプチド配列の集合の中から、抽出したルールに適合する複数のペプチド配列を抽出する。例えば、メンバー数が600000のペプチドライブラリーを用意し、ステップ(2)で2000個のペプチド配列を選択したのであれば、当該2000個のペプチド配列を除外した残りの598000個のペプチド配列を、抽出したルールに照合し、ルールに適合するペプチド配列を選抜する。尚、「ルールに適合する」とは、「ルールを満足する」と同義であって、ルールが規定する物理的性質の条件の全てを満たしている状態をいう。
選抜するペプチド配列の数は特に限定されないが、ステップ(2)と同様に、好ましくはサンプリング数として適当な数とする。従って、ここで選択するペプチド配列の数は、最初に用意したペプチドライブラリーから以前の選抜の際に選抜されたペプチド配列を除外した集合のメンバー数の例えば1/500000〜1/500、好ましくは1/100000〜1/1000、更に好ましくは1/50000〜1/10000である。
【0058】
ステップ(8)を行うことによりルールの最適化が進む。即ち、より信頼度の高いルールを抽出できる。ルールの更なる最適化を図るため、ステップ(8)を繰り返すとよい。繰り返し数は特に限定されない。例えば、ステップ(8)を1〜5回繰り返す。
【0059】
3.ルールの最適化
階層的クラスタ分析を利用したルールの抽出法で得たルールと、学習モデルによる解析を利用したルールの抽出法で得たルールを比較し、共通部分を新たなルールとして抽出することもできる。このようにすればルールの最適化が進み、その結果、信頼度の高いルールを生成することができる。他の手法(例えば、図1に示したAの手法)で得たルールも併用してルールの最適化を行うことにしてもよい。
【0060】
<機能性ペプチドの設計法>
本発明の第2の局面は機能性ペプチドの設計法に関する。本発明の設計法によれば、機能性ペプチドとして有望なペプチドを表す配列情報が得られる。本発明の設計法は、膨大な数の候補の中から効率的に有効なペプチドを選抜できる点、様々な長さのペプチドを設計可能である点、既知の機能性ペプチドの配列に依存しない全く新しいペプチドを見出すことが可能である点等、数多くの利点を有する。
【0061】
本明細書において「機能性ペプチドを設計すること」と「機能性ペプチドとして有望なペプチドを表す配列情報を得ること」は同義である。以下、本発明の設計法について、1.ルールを利用した設計法、2.ルールの抽出の際に形成されたクラスタを利用した設計法、3.ルールを抽出する際に構築された予測モデルを利用した設計法、及び4.ペプチド配列の連結を利用した設計法に分けて説明する。また、5.では、機能性の一層高いペプチド配列を設計する方法に言及する。これらの設計法は、5.におけるアッセイを除いて、コンピュータ上で実施することができる。
【0062】
1.ルールを利用した設計法
本発明の一態様では、第1の局面の発明によって抽出されたルールに従ってペプチド配列を設計する。前述の通り、階層的クラスタ分析を利用した抽出法によれば、数値範囲ルール(ペプチド配列における位置毎、物理的性質の数値範囲を示すルール)又はアミノ酸ルール(ペプチド配列における位置毎、該当する1又は2以上のアミノ酸を示すルール)が抽出される。前者のルールに従ってペプチド配列を設計するのであれば、位置毎、そこに示された物理的性質の数値範囲の全部を満たすアミノ酸を選択すればよい。他方、後者のルールに従ってペプチド配列を設計する場合は、位置毎、該当するアミノ酸として示されたアミノ酸の中からいずれかのアミノ酸を選択すればよい。該当するアミノ酸が1つの場合は当該アミノ酸を選択する。以上の通り、ルールに従ってアミノ酸を選択することにより、機能性ペプチドとして有望な配列情報が得られる。
【0063】
学習モデルによる解析を利用した抽出法によって抽出されたルールの場合も同様に、ルールに従って各位置のアミノ酸を選択し、ルールに適合するペプチド(機能性ペプチドとして有望なペプチド)の配列情報を得る。但し、当該ルールの場合は、ペプチド配列を構成する全ての位置ついて選択の基準(条件)が示されるとは限らない。選択の基準が示されない位置については任意のアミノ酸を選択すればよい。
【0064】
本発明の他の態様では、上記態様のようにルールに基づくアミノ酸の選択によってペプチド配列を構築するのではなく、複数のペプチド配列の中からルールに適合するものを選択する。即ち、複数の候補ペプチド配列を用意した後、これらの候補ペプチド配列をルールに照合し、そしてルールに適合するペプチド配列を選択する。このようにして、機能性ペプチドとして有望なペプチド配列を候補ペプチド配列の中から特定する。尚、階層的クラスタ分析を利用した抽出法によって得られた数値範囲ルール、又は学習モデルによる解析を利用した抽出法によって得られた、物理的性質の条件を示すルールを利用する場合は候補ペプチド配列を直接ルールに照合することができないことから、照合可能な数値データに各候補ペプチド配列を変換した上で照合する。即ち、(1)複数の候補ペプチド配列を用意するステップ、(2)N末端又はC末端からの位置毎に構成アミノ酸の物理的性質を数値化することによって前記複数の候補ペプチド配列をそれぞれ数値データに変換するステップ、(3)各数値データをルールに照合するステップ、及び(4)ルールに適合する候補ペプチド配列を選抜するステップが行われることになる(図12を参照)。
【0065】
2.ルールを抽出する際に形成されたクラスタを利用した設計法
階層的クラスタ分析を利用した抽出法を実施すると、機能性の高い順に順位が付与された複数のクラスタが形成される。上位の順位が付与されたクラスタに含まれるペプチド配列は機能性が高いことになる。そこで本発明の一態様では、階層的クラスタ分析を利用した抽出法によって得られた、上位の順位が付与されたクラスタに含まれる1又は2以上のペプチド配列を高機能ペプチド配列として選択する。例えば、1位(最高位)のクラスタに10個のペプチド配列が含まれていた場合、1〜10個のペプチド配列を、高機能ペプチドを表す配列として選択することができる。1位(最上位)のクラスタのみからペプチド配列を選択するのではなく、上位の順位が付与された複数のクラスタ(例えば上位3位までのクラスタ)からペプチド配列を選択することにしてもよい。
【0066】
3.ルールを抽出する際に構築された予測モデルを利用した設計法
FNN解析を利用した抽出法を実施すると予測モデル(FNNモデルとも呼ばれる)が構築される。本発明の一態様では当該予測モデルを利用して高機能ペプチドを設計する。具体的には、(1)複数の候補ペプチドを用意するステップ、(2)N末端又はC末端からの位置毎に構成アミノ酸の物理的性質を数値化することによって、複数の候補ペプチド配列をそれぞれ数値データに変換するステップ、(3)FNN解析を利用した抽出法をおいてルールの抽出の際に構築された予測モデルを用い、前記数値データを入力変数としてFNN解析を行うステップであって、該FNN解析において、(i)ルールに適合するペプチド配列の選抜、(ii)選抜されたペプチド配列の予測値の評価、及び(iii)予測値の高いペプチド配列の選抜が順に行われるステップ、を行い、高機能ペプチドとして有望なペプチドを表す配列情報を得る(図13を参照)。
【0067】
この態様に特徴的なステップ(3)では、FNNを利用した一連の情報処理が行われる。まず、ルールを利用した判断・評価(上記(i)に相当する)が行われる。この処理の結果、ルールに適合するものとして比較的多数のペプチド配列が選抜される。次に、選択されたペプチド配列に対して予測値の判断・評価(上記(ii)及び(iii)に相当する)が行われる。この処理ではペプチド配列の数値データを予測モデル、即ち近似曲線に代入することによって機能性を予測し、予測値の高いペプチド配列を選抜する。
【0068】
予測値の判断・評価に加えて、信頼度の判断・評価を行うことにし、最終的に得られる配列情報の信頼度(確からしさ)を向上させることが好ましい。信頼度の評価・判断では、「入力値の近傍に学習データがある場合には、近似曲線として信頼できる(又は信頼度が高い)範囲での予測であり、入力値の近傍に学習データが無い場合には、近似曲線として信頼できない(又は信頼度が低い)範囲での予測である」という基準に基づく評価・判断が行われることになる。
【0069】
4.ペプチド配列の連結を利用した設計法
本発明は更に、ペプチド配列の連結を利用した設計法を提供する。当該設計法によれば、より長いペプチドを設計することができる。以下、図14及び15を参照しながら説明する。
【0070】
この設計法では最初にペプチド配列の集合を用意する(ステップ(1))。ペプチド配列の集合として以下の(a)〜(d)のいずれかを用いる。
(a)階層的クラスタ分析を利用した抽出法によって得られた、上位の順位が付与されたクラスタに含まれるペプチド配列の集合、
(b)階層的クラスタ分析を利用した抽出法によって得られたルールに適合するペプチド配列の集合、
(c)学習モデルによる解析(例えばFNN解析)を利用した抽出法によって得られたルールに適合するペプチドの集合、
(d)(a)〜(c)からなる群より選択される2以上の集合を結合した集合。
【0071】
集合(a)として次の集合を用いてもよい。即ち、メンバーのアミノ酸残基数が異なる複数のペプチドライブラリーを用意し、各ペプチドライブラリーを用いてクラスタ分析を利用した抽出法を行うことにし、各回について得られた、上位の順位が付与されたクラスタに含まれるペプチド配列の集合を全て連結して得られる集合である。
【0072】
一方、集合(b)として次の集合を用いてもよい。即ち、メンバーのアミノ酸残基数が異なる複数のペプチドライブラリーを用意し、各ペプチドライブリーを用いてクラスタ分析を利用した抽出法を行ってルールを得た後、抽出されたルール毎、適合するペプチド配列の集合を作製し、最後に全集合を連結して得られる集合である。
【0073】
また、集合(c)として次の集合を用いてもよい。即ち、メンバーのアミノ酸残基数が異なる複数のペプチドライブラリーを用意し、各ペプチドライブリーを用いて学習モデルによる解析(例えばFNN解析)を利用した抽出法を行ってルールを得た後、抽出されたルール毎、適合するペプチド配列の集合を作製し、最後に全集合を連結して得られる集合である。
集合(d)を用いる場合においてもペプチド配列の長さを統一する必要はない。
【0074】
次に、用意した集合の中から、共通する部分配列(以下、「共通部分配列」と呼ぶ)を認める第1ペプチド配列及び第2ペプチド配列を選抜する(ステップ(2))。但し、共通部分配列よりもC末端側のアミノ酸の数は、第1ペプチド配列よりも第2ペプチド配列の方が多いものとする。共通部分配列の長さは、アミノ酸残基数が2以上である限り特に限定されない(図15の(A))。
【0075】
続いて、共通部分配列よりもC末端側のアミノ酸を第1ペプチド配列から除去して得られる第1部分配列と、共通部分配列及び共通部分配列よりもN末端側のアミノ酸を第2ペプチド配列から除去して得られる第2部分配列とを、第1部分配列がN末端側に配置されるように連結する(ステップ(3))。これによって、第1ペプチド配列及び第2ペプチド配列よりも長いペプチド配列が得られる(図15の(A))。
【0076】
ここで、第1ペプチド配列では共通部分配列がC末端アミノ酸を含み、第2ペプチド配列では共通部分配列がN末端アミノ酸を含むことが好ましい(図15の(B)を参照)。つまり、第1ペプチド配列のC末端側の部分配列と第2ペプチド配列のN末端側の部分配列が共通することが好ましい。上記のように連結した際、より長いペプチド配列が得られるからである。
【0077】
一態様では、ステップ(1)において集合(a)を用意することにし、ステップ(2)では、第1ペプチド配列と対をなす第2ペプチド配列の候補が二つ以上存在する場合には、より上位の順位が付与されたクラスタに属するペプチド配列を優先して第2ペプチド配列に用い、第2ペプチド配列と対をなす第1ペプチド配列の候補が二つ以上存在する場合には、より上位の順位が付与されたクラスタに属するペプチド配列を優先して第1ペプチド配列に用いる。
【0078】
他の一態様では、ステップ(1)において集合(b)を用意することにし、ステップ(2)では、第1ペプチド配列と対をなす第2ペプチド配列の候補が二つ以上存在する場合には、より上位の順位が付与されたクラスタのルールに適合するペプチド配列の方を優先して第2ペプチド配列に用い、第2ペプチド配列と対をなす第1ペプチド配列の候補が二つ以上存在する場合には、より上位の順位が付与されたクラスタのルールに適合するペプチド配列の方を優先して第1ペプチド配列に用いる。
【0079】
以上の二つの態様のように、より上位のクラスタから候補を選択することは、一層機能性が高いペプチド配列の設計を可能にする。
【0080】
より長いペプチド配列を設計するためには、ステップ(3)で得られたペプチド配列を第1ペプチド配列又は第2ペプチド配列として、ステップ(2)と同様の操作を行えばよい。例えば、ステップ(3)で得られたペプチド配列を第1ペプチド配列とする場合には、第2ペプチド配列に該当する配列、即ち第1ペプチド配列と一部で共通する配列(但し、共通部分配列よりもC末端側のアミノ酸の数は、第1ペプチド配列よりも第2ペプチド配列の方が多い)を、用意したペプチド配列の集合の中から選抜した後、ステップ(2)と同様のステップを行う。必要に応じて、当該操作を繰り返す。
【0081】
5.機能性ペプチドの最適化
本発明の一態様では、一層好ましい機能性ペプチドを設計するため、以下の(1)〜(3)のいずれかの手段を採用し、機能性ペプチドの絞り込み(最適化)を行う。
(1)1.〜4.の設計法の併用
(2)合成効率、合成コスト、精製効率、特性((溶解度、熱安定性、pH安定性、立体構造)等の観点による選抜
(3)細胞や動物等を利用したアッセイによる選抜
【0082】
以上の各手段は互いに排他的なものではなく、二つ以上を併用することも可能である。他の手段に加えて(3)の手段を採用する場合には、効率や費用などの点から、(3)の手段による選抜は最後に行うとよい。1.〜4.の設計法の二つ以上を並行して行うことにし、各方法で設計されたポリペプチド配列の中から、(2)及び/又は(3)の手段を利用して、一層好ましい機能性ペプチドを選抜することにしてもよい。
【0083】
<機能性ペプチドの調製法>
上記の設計法によって設計したペプチドを実際に調製すれば機能性ペプチドが得られる。このように本発明は、上記の設計法で設計されたペプチドを調製するステップを含む、機能性ペプチドの調製法も提供する。ペプチドの調製には、公知のペプチド合成法(例えば固相合成法、液相合成法)が利用できる。尚、自動ペプチド合成機を利用すれば容易かつ迅速なペプチド合成が可能である。
【0084】
遺伝子工学的手法を利用してペプチドを調製することにしてもよい。即ち、設計したペプチド配列をコードする核酸を適当な宿主細胞に導入し、形質転換体内で発現されたペプチドを回収することにより、目的のペプチドを得ることにしてもよい。回収したペプチドは必要に応じて精製される。回収したペプチドを適当な置換反応に供し、所望のペプチド修飾体に変換することもできる。
【0085】
<ポリペプチド又はポリペプチド含有組成物の評価法>
本発明の抽出法などを利用すると、特定の機能性を発揮し得るペプチドとして多数のペプチドを同定可能である。即ち、多数の機能性ペプチドの配列情報を得ることができる。多数の機能性ペプチドの配列情報があれば、それを利用してポリペプチドを評価(スコア化)することができる。具体的には、同定した機能性ペプチドを包括的に捉え、各機能性ペプチドの含有量をポリペプチド間で比較すれば、当該機能に関する各ポリペプチドの有効性を点数(スコア)として示すことが可能となる。そこで本発明は、更なる局面として、ポリペプチド又はポリペプチド含有組成物の評価法(スコア化法)を提供する。本発明の評価法を利用すれば、ポリペプチド又はポリペプチド含有組成物を機能性という新たな観点から特定したり、分類したりすることができる。また、機能性の高いポリペプチド又はポリペプチド含有組成物の同定や創出も可能となる。
【0086】
本発明における「評価」とは、ポリペプチド又はそれを含有する組成物の「特定の機能に関する有効性」を調べることをいう。本発明の評価法を実施すると、典型的には、評価対象の機能性が点数(スコア)で表される。そこで、ここでの「評価」のことを「スコア化」とも呼ぶことがある。「ポリペプチド含有組成物」とは、成分の一つとしてポリペプチドを含む組成物である。例えば穀類や豆類等を原料とする食品(栄養補助食品や飲料なども含む)や食品添加物などが「ポリペプチド含有組成物」に該当する。
【0087】
1.ルールとの照合による評価
本発明の評価法では以下のステップ(1)〜(6)を行う(図16を参照)。
(1)ポリペプチドの配列を用意するステップ、
(2)本発明の抽出法によって抽出された1又は2以上のルールに対してそれぞれスコアを関連付けるステップ、
(3)前記ルールとの照合が可能な一定の長さに前記ポリペプチドの配列を断片化するステップ、
(4)各断片配列を前記ルールと照合し、適合性を判定するステップ、
(5)ルールに適合すると判定された断片配列に対して、該ルールに関連付けられたスコアを付与するステップ、
(6)付与された全てのスコアを積算して総スコアを算出するステップであって、該総スコアが前記ポリペプチドの機能性を表す指標となるステップ。
【0088】
まず、ポリペプチドの配列を用意する(ステップ(1))。ポリペプチドは、評価対象であるポリペプチド自体、又は評価対象である組成物が含有するポリペプチドである。ここでのポリペプチドの例を挙げると、大豆タンパク質のβコングルシニンや、小麦タンパク質のグルテン、乳タンパク質のカゼイン、卵白タンパク質のオボアルブミンである。
評価対象が組成物であり且つ複数のポリペプチドを含有する場合には、各ポリペプチドをここでのポリペプチドとして本発明の評価法を実施し、得られた各結果を総合して当該組成物の機能性を評価することもできる。
【0089】
続くステップ(2)では、本発明の抽出法、即ち階層的クラスタ分析を利用した抽出法又は学習モデルによる解析(例えばFNN解析)を利用した抽出法によって抽出されたルール(前者を「クラスタ機能性ルール」、後者を「学習モデル機能性ルール」と呼ぶ)にスコア(点数)を関連づける。用いるルールが一つであれば、当該ルールに任意のスコア(例えば、1、10、20など)を関連付ければよい。用いるルールが複数の場合は、それぞれのルールが示す機能性の程度を考慮して各ルールにスコアを関連づける。例えば、階層的クラスタ分析を利用した抽出法によって上位5位のクラスタからそれぞれルールを抽出した場合であって、これら5個のルールを用いるのであれば、1位のクラスタから抽出したルールに100、2位のクラスタから抽出したルールに50、3位のクラスタから抽出したルールに20、4位のクラスタから抽出したルールに10、5位のクラスタから抽出したルールに5、のように、クラスタの順位とスコアが対応するようにスコアを関連付ける。クラスタ機能性ルールと学習モデル機能性ルールを併用してもよい。尚、どのような勾配でスコアを関連付けるべきかは多変量解析で決定するとよい。
【0090】
一方、ルールとの照合が可能な一定の長さにポリペプチド配列を断片化する(ステップ(3))。例えば、アミノ酸残基数が3のペプチドに関するルールを用いるのであれば、ポリペプチド配列を断片化し、アミノ酸残基数が3のペプチド配列(即ちトリペプチド)の集合にする。以下、断片化の具体的な方法について、3アミノ酸の長さ(即ちトリペプチド配列)に断片化する場合を例として説明する。断片化の方法は二つに大別される。第一の方法(図17の(A))では、N末端(又はC末端)から3アミノ酸毎に区切り、トリペプチド配列の集合を得る。第二の方法(図17の(B))では、N末端(又はC末端)の3アミノ酸を最初の断片とし、N末端(又はC末端)から1アミノ酸又は2アミノ酸だけC末端側にずらした位置からの3アミノ酸を次の断片とする。以下同様に繰り返す。このようにしてトリペプチド配列の集合を得る。
【0091】
続いて、ステップ(3)で得た各断片配列をルールと照合し、適合性を判定する(ステップ(4))。複数のルールを用いた場合は、各断片配列を全てのルールに照合し、各ルールに対する適合性を判定する。尚、「適合性を判定する」とは、断片配列がルールを満足するか否かを判定することを意味する。
【0092】
次に、ルールに適合すると判定された断片配列に対して、該ルールに関連付けられたスコアを付与する(ステップ(5))。例えば、スコア10の第1ルールとスコア1の第2ルールを用いた場合、第1ルールに適合することが判明した断片配列に対しては第1ルールに関連付けられたスコア10を付与し、第2ルールに適合することが判明した断片配列に対しては第2ルールに関連付けられたスコア1を付与する。
【0093】
続いて、付与された全てのスコアを積算して総スコアを算出する(ステップ(6))。例えば、スコア10が付与された断片が10個、スコア1が付与された断片が10個存在していた場合、(10×10)+(1×10)=110が総スコアとなる。本発明では、このようにして算出した総スコアを、ポリペプチドの機能性を表す指標とする。即ち、総スコアの大きさによってポリペプチドの機能性を判断する。具体的には例えば、総スコアが大きければ機能性が高いと判断し、総スコアが小さければ機能性が低いと判断する。あるポリペプチドの総スコアを予め算出しておき、当該総スコアを基準としてポリペプチドの総スコアを評価することにしてもよい。
【0094】
好ましい一態様では、評価の妥当性ないし正確性を高めるため、ポリペプチド配列中に存在するプロテアーゼ切断部位を考慮した補正を行う。具体的には、以下の(A)〜(C)のいずれかの方法により補正する。
(A)ステップ(3)で生じた断片配列の中から、プロテアーゼ切断部位を内在する断片配列を除いた後にステップ(4)を行う。
(B)ステップ(6)において、プロテアーゼ切断部位を内在する断片配列以外の断片配列に付与されたスコアのみを積算する。
(C)ステップ(6)において、付与された全スコアを積算した後、ステップ(3)で生じた断片配列の中から、プロテアーゼ切断部位を内在する断片配列に付与されたスコアを除算する。
【0095】
(A)はスコア化の前に補正する方法、(B)はスコア化の段階で補正する方法、(C)はスコアの積算後に補正する方法である。(A)の場合、プロテーゼ切断部位を内在するがために生じない断片配列をスコア化の対象から除外する。(B)の場合、実際に生ずる断片配列に付与されたスコアのみを積算する。(C)の場合、スコアを積算した後に、プロテーゼ切断部位を内在するがために生じない断片配列に付与されたスコアを差し引く。いずれの方法を採用しても、実際に生ずる断片配列に付与されたスコアのみを積算した総スコアが得られることになり、評価の妥当性ないし正確性が向上する。尚、ここでの用語「プロテアーゼ」は広義のプロテーゼを意味し、エキソペプチダーゼ、エンドペプチダーゼ、プロテイナーゼなど、ポリペプチド鎖に作用してペプチド結合を加水分解する各種酵素を包含する。但し、本発明においては、全てのプロテーゼについてその切断部位を考慮する必要はなく、ポリペプチドの用途に応じて必要と考えられるプロテアーゼの切断部位のみを考慮すればよい。例えばヒト生体への投与ないし摂取が予定されているポリペプチド(医薬や栄養補助食品の成分としてのポリペプチド、食品中に含まれるタンパク質など)を評価する場合、ヒト生体内で作用し得るプロテアーゼ(ポリペプチドの代謝経路に存在するプロテアーゼ)についてのみ、その切断部位を考慮すればよい。ヒト生体内で作用し得るプロテアーゼの例としてペプシン、トリプシン、キモトリプシンが挙げられる。「ヒト生体内で作用し得るプロテアーゼ」は、ヒト生体に内在するプロテアーゼに限られない。食品等の摂取によりヒト体内に取り込まれるプロテアーゼ(外来性のプロテアーゼ)も「ヒト生体内で作用し得るプロテアーゼ」に該当する。
【0096】
2.上位クラスタに含まれるペプチド配列を用いた評価
この態様では、階層的クラスタ分析を利用した抽出法を行った際に得られるクラスタを利用してポリペプチド又はポリペプチド含有組成物を評価する。この態様の評価法は以下のステップ(1)〜(4)を含む(図18を参照)。尚、特に言及しない事項については、上記態様(1.ルールとの照合による評価)の対応する説明を援用する。
(1)ポリペプチドの配列を用意するステップ、
(2)階層的クラスタ分析を利用した抽出法によって得られた、上位の順位が付与されたクラスタに含まれる各ペプチド配列に対して、同一のクラスタに含まれるペプチド配列は各々相同性の高いスコアとなり且つクラスタの順位に対応したスコアとなるように、スコアを関連付けるステップ、
(3)スコアを関連付けた各ペプチド配列をそれぞれ前記ポリペプチドの配列と照合し、配列が一致する領域の数を調べるステップ、
(4)ステップ(3)で判明した前記領域の数と、ステップ(2)で関連付けたスコアとを乗ずることによってペプチド配列毎にスコアに算出した後、全てのスコアを積算して総スコアを算出するステップであって、該総スコアが前記ポリペプチドの機能性を表す指標となるステップ。
【0097】
まず、ペプチド配列を用意する(ステップ(1))。このステップは上記態様(1.ルールとの照合による評価)の場合と同一であるためその説明を省略する。
【0098】
次に、階層的クラスタ分析を利用した抽出法によって得られた、上位の順位が付与されたクラスタに含まれる各ペプチド配列に対してスコアを関連付ける(ステップ(2))。このとき、同一のクラスタに含まれるペプチド配列は各々相同性の高いスコアとする。可溶性度、合成容易度、価格などを考慮して各ペプチドのスコアを決定するとよい。一例では、同一のクラスタに含まれるペプチド配列は全て同一のスコアとする。一方、クラスタの順位に対応したスコアとなるようにする。即ち、順位の高いクラスタに含まれるペプチド配列の方が、順位が低いクラスタに含まれるペプチド配列よりも高いスコアとなるようにする。例えば、上位5位までのクラスタを用いるのであれば、1位のクラスタに含まれるペプチド配列に100、2位のクラスタに含まれるペプチド配列に50、3位のクラスタに含まれるペプチド配列に20、4位のクラスタに含まれるペプチド配列に10、5位のクラスタに含まれるペプチド配列に5、のように、クラスタの順位とスコアの高低が対応するようにスコアを関連付ける。尚、どのような勾配でスコアを関連付けるべきかは多変量解析で決定するとよい。
【0099】
続いて、スコアを関連付けた各ペプチド配列をそれぞれポリペプチド配列と照合し、配列が一致する領域(一致領域)の数を調べる(ステップ(3))。そして、一致領域の数と、各ペプチド配列に関連付けたスコアとを乗ずることによってペプチド配列毎にスコアを算出した後、全てのスコアを積算して総スコアを算出する(ステップ(4))。このようにして算出した総スコアがポリペプチドの機能性を表す指標となる。
【0100】
総スコアの算出方法(ステップ(4))の具体例を示す。1位のクラスタ(スコア100)が第1ペプチド配列と第2ペプチド配列からなり、ポリペプチド配列中に第1ペプチド配列と一致する領域が1箇所、第2ペプチド配列と位置する領域が2箇所含まれており、2位のクラスタ(スコア50)が第3ペプチド配列及び第4ペプチド配列からなり、ポリペプチド配列中に第3ペプチド配列と一致する領域が1箇所、第4ペプチド配列と位置する領域が0箇所含まれていた場合、次のように総スコアを算出する。
(1×100)+(2×100)+(1×50)+(0×50)=350
【0101】
上記態様(1.ルールとの照合による評価)と同様、この態様の評価法においても、評価の妥当性ないし正確性を高めるため、ポリペプチド配列中に存在するプロテアーゼ切断部位を考慮した補正を行うことが好ましい。補正は、照合(ステップ(3))又は総スコアの算出(ステップ(4))の際に行えばよい。
【0102】
3.学習モデルを用いた評価法
更なる一態様では、学習モデルによる解析(例えばFNN解析)を利用した抽出法を行った際の学習モデル(FNN解析の場合は、構築された予測モデル)を利用してポリペプチド又はポリペプチド含有組成物を評価する。この態様の評価法は以下のステップ(1)〜(5)を含む(図19を参照)。尚、特に言及しない事項については、上記態様(1.ルールとの照合による評価)の対応する説明を援用する。
(1)ポリペプチドの配列を用意するステップ、
(2)学習モデルによる解析を利用した抽出法においてルールを抽出する際に用いた学習モデルで解析可能な一定の長さに前記ポリペプチドの配列を断片化するステップ、
(3)N末端又はC末端からの位置毎に構成アミノ酸の物理化学的性質を数値化することによって、各断片配列を数値データに変換するステップ、
(4)前記学習モデルを用い、前記数値データを入力変数として、学習モデルによる解析を行い、各断片配列の予測機能度を算出するステップ、
(5)算出された予測機能度を積算するステップであって、得られた総予測機能度が前記ポリペプチドの機能性を表す指標となるステップ。
【0103】
まず、ペプチド配列を用意する(ステップ(1))。このステップは上記態様(1.ルールとの照合による評価)の場合と同一であるためその説明を省略する。
【0104】
次に、学習モデルによる解析を利用した抽出法においてルールを抽出する際に用いた学習モデル(FNN解析の場合は、構築された予測モデル)で解析可能な一定の長さにポリペプチド配列を断片化する(ステップ(2))。即ち、ルールの抽出に利用したペプチド配列(ペプチドライブラリーのメンバー)のアミノ酸残基数に一致するように断片化する。断片化の方法等は、上記態様(1.ルールとの照合による評価)の場合と同様である。
【0105】
続いて、N末端又はC末端からの位置毎に構成アミノ酸の物理化学的性質を数値化することによって、各断片配列を数値データに変換する(ステップ(3))。このステップは、学習モデルによる解析を利用した抽出法におけるステップ(5)に準ずる。
【0106】
次に、学習モデル(FNN解析の場合は、構築された予測モデル)を用い、数値データを入力変数として学習モデルによる解析を行い、各断片配列の予測機能度を算出する(ステップ(4))。即ち、各断片配列を学習モデルによる解析に供し、予測機能度を算出させる。その後、算出された予測機能度を積算する(ステップ(5))。この態様では、このようにして算出した総予測機能度を、ポリペプチドの機能性を表す指標とする。即ち、総予測機能度の大きさによってポリペプチドの機能性を判断する。
【0107】
4.胆汁酸結合能の評価
後述の実施例に示す通り、本発明者らは複数の胆汁酸結合ペプチドの同定に成功した。そこで、本発明は更なる態様として胆汁酸結合能に関する評価法を提供する(図20を参照)。
(1)ポリペプチドの配列を用意するステップ、
(2)同定に成功した胆汁酸結合ペプチドの配列(配列番号1〜223のいずれかのアミノ酸配列、並びにWIY,YYW,WRW,PWR,WFW,WYM,IWW,YWM,FWY,LWY,WYD,WMY,WYF,MWF,YFY,WWT,WWI,YYF,FMF,YMW,PFF,AWY,WMM,NWY,PWM,FWV,WYV,YFM,YGW,PVW,WRI,QWF,WHF,MWM,PIY,LFF,YSW,WNF,WSL,YLF,YYI,WYT,MYY,IWM,WHM,WLA,YQY,IQW,WLN,WMQ,WAM,AWM,TWY,WSM,VWI,MFL,NWM,WVQ,FGL,FNY,PIR,PWN,MWL,YGL,NWI,AWI,VFI,YSF,MIF,FVM,TWM,WQI,MYM,TWI,PMG,IGY,IML,VLF,YIV,YAM,PYN,VAY,PCK,SWL,PCW,PML,PLM,VYM,VMY,PFE,YSM,ISF,QWV,WVC,CWY,MTF,PLQ,ILM,YQV,PCC,YMI,WKC,PMH,WKW,WYE,WFK,WRR,WKW,RKF,WKS,VWW,VWW,PLK,YWL,KLK,FLR,YWL,NFK,LWY,HWF,LRI,WGW,WFL,FYF,RHW,PLK,KLK,LRI,KIW,QWR,IWN,RRK,KVR,NQY,WNP,LRY,FMY,WMH,WIK,YFI,IRA,NTH,WNP,YFI,WGV,HKL,WRG,YYT,QPW,LYL,TRA,RKA,WHA,LYL,AFL,FII,RPL,FVI,YSH,LYS,IFW,KIP,FII,WQE,FCP,NHI,WAG,VRQ,GPR,LYS,NRE,FLT,YVP,LYM,IIP,WRC,NTK,QFH,FQW,NTK,YVP,LYN,FGF,LKS,GYL,FIE,KGS,VFA,RFN,LYH,QFH,RVI,VAY,LKS,QYF,WMN,DRG,VYP,YGT,IQW,KIA,QKV,HMK,WQL,RFN,MHP,VRD,KVA,ITR,NQG,YMY,RDG,WMK,YII,NKI,PMR,HML,VAY,KHM,YGT,HAH,TRP,KIA,IWT,FMA,CWP,ICY,HMK,KMS,MIP,FSV,PSH,KVA,KNL,VKT,MHP,KHM,PFI,TRP,RDG,QGR,WMS,YIV,KAC,LQH,MIP,MFS,PSH,VKT,NGI,PVS,NPL,LSP,TKQ,QII,QGR,MFS,VKA,LQH,PPQ,QHL,LSP,VKA,QII,LMS,PHQ,RFA,MCP,NGC,QHL,YCI,MQF,SNF,YMA,LQY,LPQ,VLL,YMA,AIK,WMT,EYH,VLL,SML,GLC,END,WGS,RAD,GWV,RAD,HHS,EAF,MGI,IVN,SEW,QHA,THM,CLY,NMC,TLL及びLMW)の中から選択される2以上のペプチド配列に対してスコアを関連付けるステップ、
(3)スコアを関連付けた各ペプチド配列をそれぞれ前記ポリペプチドの配列と照合し、配列が一致する領域の数を調べるステップ、
(4)ステップ(3)で判明した前記領域の数と、ステップ(2)で関連付けたスコアとを乗ずることによってペプチド配列毎にスコアを算出した後、全てのスコアを積算して総スコアを算出するステップであって、該総スコアが前記ポリペプチドの胆汁酸結合能を表す指標となるステップ。
【0108】
ステップ(1)、(3)及び(4)は、上記態様(2.上位クラスタに含まれるペプチド配列を用いた評価)と同様であるためその説明を省略する。ステップ(2)では、同定に成功した胆汁酸結合ペプチド配列(配列番号1〜223のいずれかのアミノ酸配列、並びにWIY,YYW,WRW,PWR,WFW,WYM,IWW,YWM,FWY,LWY,WYD,WMY,WYF,MWF,YFY,WWT,WWI,YYF,FMF,YMW,PFF,AWY,WMM,NWY,PWM,FWV,WYV,YFM,YGW,PVW,WRI,QWF,WHF,MWM,PIY,LFF,YSW,WNF,WSL,YLF,YYI,WYT,MYY,IWM,WHM,WLA,YQY,IQW,WLN,WMQ,WAM,AWM,TWY,WSM,VWI,MFL,NWM,WVQ,FGL,FNY,PIR,PWN,MWL,YGL,NWI,AWI,VFI,YSF,MIF,FVM,TWM,WQI,MYM,TWI,PMG,IGY,IML,VLF,YIV,YAM,PYN,VAY,PCK,SWL,PCW,PML,PLM,VYM,VMY,PFE,YSM,ISF,QWV,WVC,CWY,MTF,PLQ,ILM,YQV,PCC,YMI,WKC,PMH,WKW,WYE,WFK,WRR,WKW,RKF,WKS,VWW,VWW,PLK,YWL,KLK,FLR,YWL,NFK,LWY,HWF,LRI,WGW,WFL,FYF,RHW,PLK,KLK,LRI,KIW,QWR,IWN,RRK,KVR,NQY,WNP,LRY,FMY,WMH,WIK,YFI,IRA,NTH,WNP,YFI,WGV,HKL,WRG,YYT,QPW,LYL,TRA,RKA,WHA,LYL,AFL,FII,RPL,FVI,YSH,LYS,IFW,KIP,FII,WQE,FCP,NHI,WAG,VRQ,GPR,LYS,NRE,FLT,YVP,LYM,IIP,WRC,NTK,QFH,FQW,NTK,YVP,LYN,FGF,LKS,GYL,FIE,KGS,VFA,RFN,LYH,QFH,RVI,VAY,LKS,QYF,WMN,DRG,VYP,YGT,IQW,KIA,QKV,HMK,WQL,RFN,MHP,VRD,KVA,ITR,NQG,YMY,RDG,WMK,YII,NKI,PMR,HML,VAY,KHM,YGT,HAH,TRP,KIA,IWT,FMA,CWP,ICY,HMK,KMS,MIP,FSV,PSH,KVA,KNL,VKT,MHP,KHM,PFI,TRP,RDG,QGR,WMS,YIV,KAC,LQH,MIP,MFS,PSH,VKT,NGI,PVS,NPL,LSP,TKQ,QII,QGR,MFS,VKA,LQH,PPQ,QHL,LSP,VKA,QII,LMS,PHQ,RFA,MCP,NGC,QHL,YCI,MQF,SNF,YMA,LQY,LPQ,VLL,YMA,AIK,WMT,EYH,VLL,SML,GLC,END,WGS,RAD,GWV,RAD,HHS,EAF,MGI,IVN,SEW,QHA,THM,CLY,NMC,TLL及びLMW)の中から、スコア化に利用する配列を選択する。スコア化には2以上のペプチド配列を利用する。好ましくは3以上、更に好ましくは4以上のペプチド配列を利用する。各ペプチド配列の胆汁酸結合能に応じて、各ペプチド配列にスコアを関連付ければよい。各ペプチド配列の胆汁酸結合能は結合アッセイによって評価することができる。
【0109】
<胆汁酸結合ペプチド>
後述の実施例に示すように、本発明者らは胆汁酸結合ペプチドを同定することに成功した。この成果に基づき本発明の更なる局面は、配列番号1〜223のいずれかのアミノ酸配列、又は以下の群、即ちIIK,GTV,WIY,YYW,WRW,PWR,WFW,WYM,IWW,YWM,FWY,LWY,WYD,WMY,WYF,MWF,YFY,WWT,WWI,YYF,FMF,YMW,PFF,AWY,WMM,NWY,PWM,FWV,WYV,YFM,YGW,PVW,WRI,QWF,WHF,MWM,PIY,LFF,YSW,WNF,WSL,YLF,YYI,WYT,MYY,IWM,WHM,WLA,YQY,IQW,WLN,WMQ,WAM,AWM,TWY,WSM,VWI,MFL,NWM,WVQ,FGL,FNY,PIR,PWN,MWL,YGL,NWI,AWI,VFI,YSF,MIF,FVM,TWM,WQI,MYM,TWI,PMG,IGY,IML,VLF,YIV,YAM,PYN,VAY,PCK,SWL,PCW,PML,PLM,VYM,VMY,PFE,YSM,ISF,QWV,WVC,CWY,MTF,PLQ,ILM,YQV,PCC,YMI,WKC,PMH,WKW,WYE,WFK,WRR,WKW,RKF,WKS,VWW,VWW,PLK,YWL,KLK,FLR,YWL,NFK,LWY,HWF,LRI,WGW,WFL,FYF,RHW,PLK,KLK,LRI,KIW,QWR,IWN,RRK,KVR,NQY,WNP,LRY,FMY,WMH,WIK,YFI,IRA,NTH,WNP,YFI,WGV,HKL,WRG,YYT,QPW,LYL,TRA,RKA,WHA,LYL,AFL,FII,RPL,FVI,YSH,LYS,IFW,KIP,FII,WQE,FCP,NHI,WAG,VRQ,GPR,LYS,NRE,FLT,YVP,LYM,IIP,WRC,NTK,QFH,FQW,NTK,YVP,LYN,FGF,LKS,GYL,FIE,KGS,VFA,RFN,LYH,QFH,RVI,VAY,LKS,QYF,WMN,DRG,VYP,YGT,IQW,KIA,QKV,HMK,WQL,RFN,MHP,VRD,KVA,ITR,NQG,YMY,RDG,WMK,YII,NKI,PMR,HML,VAY,KHM,YGT,HAH,TRP,KIA,IWT,FMA,CWP,ICY,HMK,KMS,MIP,FSV,PSH,KVA,KNL,VKT,MHP,KHM,PFI,TRP,RDG,QGR,WMS,YIV,KAC,LQH,MIP,MFS,PSH,VKT,NGI,PVS,NPL,LSP,TKQ,QII,QGR,MFS,VKA,LQH,PPQ,QHL,LSP,VKA,QII,LMS,PHQ,RFA,MCP,NGC,QHL,YCI,MQF,SNF,YMA,LQY,LPQ,VLL,YMA,AIK,WMT,EYH,VLL,SML,GLC,END,WGS,RAD,GWV,RAD,HHS,EAF,MGI,IVN,SEW,QHA,THM,CLY,NMC,TLL及びLMWから選択されるアミノ酸配列からなる胆汁酸結合ペプチドを提供する。尚、配列番号1〜29の配列は、既知の胆汁酸結合ペプチド(種ペプチド)を基にして同定されたアミノ酸配列である。また、配列番号30〜42の配列、並びにIIK及びGTVは、βコングリシニン(種タンパク質)を断片化して得られるペプチドの中から同定されたアミノ酸配列である。一方、配列番号43〜126の配列は、FNN解析を利用したルールの抽出の過程において同定されたアミノ酸配列である。配列番号127〜223の配列、並びにWIY,YYW,WRW,PWR,WFW,WYM,IWW,YWM,FWY,LWY,WYD,WMY,WYF,MWF,YFY,WWT,WWI,YYF,FMF,YMW,PFF,AWY,WMM,NWY,PWM,FWV,WYV,YFM,YGW,PVW,WRI,QWF,WHF,MWM,PIY,LFF,YSW,WNF,WSL,YLF,YYI,WYT,MYY,IWM,WHM,WLA,YQY,IQW,WLN,WMQ,WAM,AWM,TWY,WSM,VWI,MFL,NWM,WVQ,FGL,FNY,PIR,PWN,MWL,YGL,NWI,AWI,VFI,YSF,MIF,FVM,TWM,WQI,MYM,TWI,PMG,IGY,IML,VLF,YIV,YAM,PYN,VAY,PCK,SWL,PCW,PML,PLM,VYM,VMY,PFE,YSM,ISF,QWV,WVC,CWY,MTF,PLQ,ILM,YQV,PCC,YMI,WKC,PMH,WKW,WYE,WFK,WRR,WKW,RKF,WKS,VWW,VWW,PLK,YWL,KLK,FLR,YWL,NFK,LWY,HWF,LRI,WGW,WFL,FYF,RHW,PLK,KLK,LRI,KIW,QWR,IWN,RRK,KVR,NQY,WNP,LRY,FMY,WMH,WIK,YFI,IRA,NTH,WNP,YFI,WGV,HKL,WRG,YYT,QPW,LYL,TRA,RKA,WHA,LYL,AFL,FII,RPL,FVI,YSH,LYS,IFW,KIP,FII,WQE,FCP,NHI,WAG,VRQ,GPR,LYS,NRE,FLT,YVP,LYM,IIP,WRC,NTK,QFH,FQW,NTK,YVP,LYN,FGF,LKS,GYL,FIE,KGS,VFA,RFN,LYH,QFH,RVI,VAY,LKS,QYF,WMN,DRG,VYP,YGT,IQW,KIA,QKV,HMK,WQL,RFN,MHP,VRD,KVA,ITR,NQG,YMY,RDG,WMK,YII,NKI,PMR,HML,VAY,KHM,YGT,HAH,TRP,KIA,IWT,FMA,CWP,ICY,HMK,KMS,MIP,FSV,PSH,KVA,KNL,VKT,MHP,KHM,PFI,TRP,RDG,QGR,WMS,YIV,KAC,LQH,MIP,MFS,PSH,VKT,NGI,PVS,NPL,LSP,TKQ,QII,QGR,MFS,VKA,LQH,PPQ,QHL,LSP,VKA,QII,LMS,PHQ,RFA,MCP,NGC,QHL,YCI,MQF,SNF,YMA,LQY,LPQ,VLL,YMA,AIK,WMT,EYH,VLL,SML,GLC,END,WGS,RAD,GWV,RAD,HHS,EAF,MGI,IVN,SEW,QHA,THM,CLY,NMC,TLL及びLMWは、階層的クラスタリング分析を利用した方法によって同定されたアミノ酸配列である。
【0110】
配列番号2、4、5又は6の配列からなるペプチドは、アレイ上から切り離された可溶化の状態でも、非常に高い胆汁酸結合能を示し、特に配列番号2と5は胆汁酸ミセル形成阻害能、胆汁酸ミセル破壊能、と共に動物への投与実験において非常に高いコレステロール吸収阻害効果を示した(実施例の欄を参照)。この効果は従来のコレステロール吸収阻害薬と同等以上のコレステロール吸収阻害効果であった。従って、当該ペプチドは、コレステロール低減ペプチドとして有望であり、ペプチドアレイを用いたスクリーニング手法は有効であると考えられる。尚、配列番号2の配列からなるペプチドは他のペプチドと比べて「親水性であり水によく溶けるにもかかわらず」強いコレステロール吸収阻害能を示した。この点から、当該ペプチドは実用性が特に高いといえる。
【実施例】
【0111】
図2に示す4種の手法を用い、新規胆汁酸結合ペプチドを探索した。
1.既知胆汁酸結合ペプチド(種ペプチド)由来の新規胆汁酸結合ペプチドの設計・同定
(1)候補ペプチドの設計
既知の胆汁酸結合ペプチド配列(VAWWMY(配列番号224)。以下、「種ペプチド」と呼ぶ)を基に候補ペプチド配列を設計した。具体的には、種ペプチド1残基置換による改変を行い、候補ペプチド配列114種を得た。
【0112】
(2)胆汁酸結合アッセイ
Fmoc固定合成法を利用した常法により、候補ペプチド配列114種を網羅するペプチドチップを作製した。このペプチドチップを用いて以下の通り胆汁酸結合アッセイを行った。
【0113】
(3)ルールの抽出
アッセイの結果を評価することで、胆汁酸結合能とアミノ酸配列の関係を表すルール(図21)を抽出した。このルールでは、(i)N末端から1番目のアミノ酸として好ましいものはIとPであること、(ii)N末端から2番目のアミノ酸として好ましいものはD、G、H、I、K、M、P、R、W及びYであること、(iii)N末端から3番目のアミノ酸として好ましいものは特にないこと、(iv)N末端から4番目のアミノ酸として好ましいものはKとYであること、(v)5番目のアミノ酸として好ましい者はR、F及びIであること、(vi)N末端から6番目のアミノ酸として好ましいものはKであることが示されている。
【0114】
(4)ルールに従ったペプチドの作製及びスクリーニング
上記ルールに適合するアミノ酸と、大元のVAWWMY(配列番号224)に存在するアミノ酸のすべての組合せ792種(3×11×1×3×4×2)を作製し、これらのペプチド配列の胆汁酸結合能を胆汁酸結合アッセイ((2)と同様のアッセイ)で調べた。陽性対照として種ペプチドを、陰性対照としてペプチドを合成していないアレイ基板の値を用いた。
【0115】
アッセイの結果を図22に示す。蛍光強度が上位にランクされた29個のペプチド配列(配列場号1〜29)を胆汁酸結合ペプチドの有望な候補とした。また、ランクが特に上位の4個のペプチド配列(配列番号2、4、5、6)を、胆汁酸結合ペプチドの有望な候補として選抜し、以降の実験として可溶化状態での(1)胆汁酸ミセル形成阻害能、(2)胆汁酸ミセル破壊能、(3)動物を用いた生体コレステロール吸収阻害実験に用いた(後述の5.の欄)。
【0116】
2.大豆タンパク質(βコングリシニン)由来の新規胆汁酸結合ペプチドの設計・同定
(1)候補ペプチド配列の作製
種ペプチドを内在するβコングリシニンのアミノ酸配列(全配列)を断片化し、候補ペプチド配列274種を作製した。
【0117】
(2)胆汁酸結合アッセイ及びペプチド配列の選抜
Fmoc固定合成法を利用した常法により、候補ペプチド配列274種を網羅するペプチドチップを作製した。このペプチドチップを用いて胆汁酸結合アッセイ(1.の(2)と同様のアッセイ)を行った。アッセイの結果を図23に示す。蛍光強度が1位〜15位のペプチド配列(配列番号30〜42、並びにIIK及びGTV)を、胆汁酸結合ペプチドの有望な候補として選抜した。
【0118】
3.FNN解析を利用した胆汁酸結合ペプチドの設計・同定
(1)ペプチドライブラリーからの選抜
6アミノ酸残基のペプチド配列からなるランダムペプチドライブラリー(64,000,000配列)を作製した。当該ペプチドライブラリーから無作為に2,2000配列を選抜し、以降のアッセイに用いた。
【0119】
(2)胆汁酸結合アッセイ
Fmoc固定合成法を利用した常法により、選抜した2,200配列を網羅するペプチドチップ(各配列について3つのスポットが形成されている)を作製した。このペプチドチップを用いて胆汁酸結合アッセイ(1.の(2)と同様のアッセイ)を行った。アッセイの結果を図24に示す。図24では、高い蛍光強度を示したポジティブ配列(上位40位)と、低い蛍光強度を示したネガティブ配列(代表として40種)を示した。上位19位についてはその配列を配列番号43〜61に示す。尚、種ペプチド(VAWWMY:配列番号224)の蛍光強度を基準(1)としたときに3スポット全てについて蛍光強度が0.8以上の配列をポジティブ配列とし、3スポット全てについて蛍光強度がバックグラウンドと同等の配列をネガティブ配列とした。
【0120】
(3)FNN解析及びルールの抽出
ポジティブ配列60種(上位60位)のデータと、ネガティブ配列60種のデータを用い、FNN解析を行った。各配列は全て、各アミノ酸の位置を13指標(等電点、正規化ファンデルワールス体積、βタンパク質のためのアルファへリックスの指標、βタンパク質のためのベータ鎖の指標、タンパク質安定化のための側鎖の貢献度、原子間ポテンシャルに関する知識を基にした安定化尺度、疎水性指標、正規化されたターン頻度、ベータ鎖領域における自由エネルギー、アルファ−へリックス領域における自由エネルギー、極性、側鎖の相互作用、アミノ酸の分配度)で数値化し、情報処理解析を行った。
【0121】
FNN解析によって作成された配列ルール表を図25(a)に示す。赤色に示されたセルが配列ルールとして有望なルールである。ルールからは、P3(N末端からの位置が3番目)の正規化ファンデルワールス体積が大きい、もしくは、P4(N末端からの位置が4番目)のタンパク質安定化のための側鎖の貢献度が大きいときには、P3(N末端からの位置が3番目)の正規化ファンデルワールス体積が小さい、という配列ルールが得られた。配列ルール表の各セル内の一組の数値は、当該セルに関連付けられた特徴を満たす胆汁酸結合ペプチド配列(ポジティブデータ)の数(左側)及び胆汁酸非結合ペプチド配列(ネガティブデータ)の数(右側)である。
【0122】
配列ルール表より、胆汁酸結合能が高いことを示すルール(1回目のポジティブルール)(図25(b))が抽出される。ルールからは、P3(N末端からの位置が3番目)の正規化ファンデルワールス体積が大きい、もしくは、P4(N末端からの位置が4番目)のタンパク質安定化のための側鎖の貢献度が大きいときには、P3(N末端からの位置が3番目)の正規化ファンデルワールス体積が小さい、という配列ルールが得られた。1回目のポジティブルールに適合するものとして9個のペプチド(配列番号62〜70)が選抜された。尚、FNN解析ではアミノ酸の位置毎、各パラメータに関する閾値が設定されることから、見た目上同一の条件であっても選抜されるアミノ酸が相違することがある。
【0123】
(4)ルールに基づく候補ペプチド配列の選抜
ルールの絞り込み(最適化)を行うために、(1)で用意したランダムペプチドライブラリーの中から上記ルールに適合するペプチド配列1000種を選抜した。その際、1回目の選抜の際に選抜した配列(2,200配列)が重複して選抜されることがないようにした。
【0124】
(5)胆汁酸結合アッセイ(2回目)
選抜したペプチド配列1000種を網羅するペプチドチップを作製し、再度、胆汁酸結合アッセイを行った。アッセイの結果を図26に示す。図26では、高い蛍光強度を示したポジティブ配列(上位68位)と、低い蛍光強度を示したネガティブ配列(127種)を示した。尚、種ペプチド(VAWWMY:配列番号224)の蛍光強度を基準(1)としたときに3スポット全てについて蛍光強度が0.8以上で且つp値が0.05より小さい配列をポジティブ配列とし、3スポット全てについて蛍光強度が0.2以下の配列をネガティブ配列とした。
【0125】
(6)FNN解析及びルールの抽出(2回目)
ポジティブ配列28種(上位28位)のデータと、ネガティブ配列28種のデータを用い、2回目のFNN解析を行った。FNN解析の結果、3個のルール(ルール1〜3)が抽出された(図27)。尚、胆汁酸結合ペプチド配列が最も多く属するのはルール1であった。ルール1に適合するものとして56個のペプチド(配列番号71〜126)が選抜された。
<ルール1>
P2はタンパク質安定化のための側鎖の貢献度が大きい:該当するアミノ酸はW、F、I、Y、L、V、P
P3は正規化ファンデルワールス体積が大きい :該当するアミノ酸はW、Y、R、F
P4はタンパク質安定化のための側鎖の貢献度が大きい:該当するアミノ酸はW、F、I、Y、L、V、P
【0126】
<ルール2>
P1はタンパク質安定化のための側鎖の貢献度が大きく、等電点が高い:該当するアミノ酸はW、I、Y、L、V、P
P3は正規化ファンデルワールス体積が大きい:該当するアミノ酸はW、Y、R、F
P4はタンパク質安定化のための側鎖の貢献度が小さく、等電点が高い:該当するアミノ酸はH、M、K、A、R、T、N、S、Q、G
【0127】
<ルール3>
P1はタンパク質安定化のための側鎖の貢献度が大きい:該当するアミノ酸はW、F、I、Y、L、V、P、H、M、K、A
P2はタンパク質安定化のための側鎖の貢献度が大きい:該当するアミノ酸はW、F、I、Y、L、V、P、H、M、K、A
P3はタンパク質安定化のための側鎖の貢献度が小さく、等電点が高い:該当するアミノ酸はK、H、I、L、V、P、A、G
P3はタンパク質安定化のための側鎖の貢献度が大きい:該当するアミノ酸はW、F、I、Y、L、V、P
【0128】
(7)ルールに基づく候補ペプチド配列の選抜
ルールの更なる絞り込み(最適化)を行うために、(1)で用意したランダムペプチドライブラリーの中から上記ルール1に適合するペプチド配列1000種を選抜した。その際、以前の選抜の際に選抜した配列(2,200配列及び1,000配列)が重複して選抜されることがないようにした。
(8)胆汁酸結合アッセイ(3回目)
選抜したペプチド配列1000種を網羅するペプチドチップを作製し、再度、胆汁酸結合アッセイを行った。アッセイの結果を図28に示す。図28では、種ペプチド(VAWWMY:配列番号224)の蛍光強度を基準(1)としたときに3スポット全てについて蛍光強度が0.8以上で且つp値が0.05より小さいポジティブ配列の全てを示した。この結果から分かるように、種ペプチドよりも強い胆汁酸結合能を示すペプチドが得られる率が向上した。
(9)FNN解析及びルールの抽出(3回目)
ポジティブ配列50種(上位50位)のデータと、ネガティブ配列50種(下位50種)のデータを用い、3回目のFNN解析を行った。FNN解析によって最終ルールを抽出した。
【0129】
以上の通り、胆汁酸結合ペプチドを表す、最良のルールを見出すことに成功した。当該ルールを用いれば、胆汁酸結合ペプチドとして有望な新規ペプチドを効率的に設計することができる。一方、ルールの抽出の過程において、種ペプチドよりも高い胆汁酸結合能を示すペプチド配列が多数、見出された。その中には非天然型ペプチドも数多く含まれていた。
【0130】
4.階層的クラスタリング法を利用した胆汁酸結合ペプチドの設計・同定
(1)ペプチドライブラリーからの選抜
3アミノ酸残基のペプチド配列からなるランダムペプチドライブラリーを作製した。当該ペプチドライブラリーから無作為に8,000配列を選抜した。
【0131】
(2)階層的クラスタ分析による分類
アミノ酸の物理的性質に関する544指標を13のグループに分類した。次に、各グループの代表を選抜した。選抜した13指標(等電点、正規化ファンデルワールス体積、βタンパク質のためのアルファへリックスの指標、βタンパク質のためのベータ鎖の指標、タンパク質安定化のための側鎖の貢献度、原子間ポテンシャルに関する知識を基にした安定化尺度、疎水性指標、正規化されたターン頻度、ベータ鎖領域における自由エネルギー、アルファ-へリックス領域における自由エネルギー、極性、側鎖の相互作用、アミノ酸の分配度)を用い、選抜した8,000配列を階層的クラスタ分析でクラスタリングした。尚、20種のアミノ酸について各指標の値を図5に示す。
【0132】
図29に示す通り、8,000配列は47クラスタに分類された。各クラスタから6配列ずつ選抜し、胆汁酸結合アッセイに供した。胆汁酸結合アッセイの方法は3.の場合と同様である。
【0133】
クラスタ毎、選抜した6配列の蛍光強度の平均値を求めた。平均値をクラスタ間で比較し、平均値の高いものから順に順位を付与した。上位5位までのクラスタ(クラスタ3(1位)、クラスタ43(2位)、クラスタ2(3位)、クラスタ25(4位)、クラスタ29(5位))を図30に示す。理解し易いように、各クラスタをブロック状に表示している。縦の一列が一つのペプチド配列(各列の下に配列が表示される)に対応する。各クラスタには、アミノ酸の位置毎、13指標の値が関連付けられている(図30の右欄を参照)。つまり、各クラスタは3×13個の数値範囲からなるルールで規定されている。
【0134】
(3)上位クラスタ及び下位クラスタからの選抜及びアッセイ
次に、上位5個のクラスタ及び下位5個のクラスタから25配列ずつ選抜し、胆汁酸結合アッセイに供した。(2)と同様に蛍光強度の平均値を比較したところ、順位が上位になればなるほど高い値を示した。各クラスタから選抜する配列の数を25から6に変更したときも同じ傾向を示した。一方、上位5個のクラスタを規定するルールに適合する配列と、下位5個のクラスタを規定するルールに適合する配列を25配列ずつアッセイした結果をまとめると図31に示す通り、上位クラスタ5個に属する配列は胆汁酸への結合強度がランダムなスクリーニングで選ばれるものよりも高く、下位クラスタ5個に属する配列は胆汁酸への結合強度がランダムなスクリーニングで選ばれるものよりも圧倒的に低かった。さらに、上位5クラスタの中からは、既知の6残基の胆汁酸結合ペプチド(VAWWMY:配列番号224)よりも高い結合を示す3残基のペプチドが6個も発見されており、スクリーニングの効率が大幅に向上したことがわかった。
【0135】
上位のクラスタを規定するルールに適合する配列を選ぶと、高い確率で胆汁酸結合能が高いことがわかる。換言すれば、上位のクラスタを規定するルールを利用すれば、胆汁酸結合能が高いペプチド配列を効率的に得ることができる。また、特筆すべきことに、3残基であるにもかかわらず、6残基のコントロールペプチド(VAWWMY:配列番号224)よりも強い胆汁酸結合能を示すペプチドが得られた。
【0136】
上位5個のクラスタに属するペプチド配列として、WIY,YYW,WRW,PWR,WFW,WYM,IWW,YWM,FWY,LWY,WYD,WMY,WYF,MWF,YFY,WWT,WWI,YYF,FMF,YMW,PFF,AWY,WMM,NWY,PWM,FWV,WYV,YFM,YGW,PVW,WRI,QWF,WHF,MWM,PIY,LFF,YSW,WNF,WSL,YLF,YYI,WYT,MYY,IWM,WHM,WLA,YQY,IQW,WLN,WMQ,WAM,AWM,TWY,WSM,VWI,MFL,NWM,WVQ,FGL,FNY,PIR,PWN,MWL,YGL,NWI,AWI,VFI,YSF,MIF,FVM,TWM,WQI,MYM,TWI,PMG,IGY,IML,VLF,YIV,YAM,PYN,VAY,PCK,SWL,PCW,PML,PLM,VYM,VMY,PFE,YSM,ISF,QWV,WVC,CWY,MTF,PLQ,ILM,YQV,PCC,YMI,WKC,PMHを同定した。また、ランダムなスクリーニングの結果、胆汁酸への結合強度が高いものとして以下の配列を同定した。WKW,WYE,WFK,WRR,WKW,RKF,WKS,VWW,VWW,PLK,YWL,KLK,FLR,YWL,NFK,LWY,HWF,LRI,WGW,WFL,FYF,RHW,PLK,KLK,LRI,KIW,QWR,IWN,RRK,KVR,NQY,WNP,LRY,FMY,WMH,WIK,YFI,IRA,NTH,WNP,YFI,WGV,HKL,WRG,YYT,QPW,LYL,TRA,RKA,WHA,LYL,AFL,FII,RPL,FVI,YSH,LYS,IFW,KIP,FII,WQE,FCP,NHI,WAG,VRQ,GPR,LYS,NRE,FLT,YVP,LYM,IIP,WRC,NTK,QFH,FQW,NTK,YVP,LYN,FGF,LKS,GYL,FIE,KGS,VFA,RFN,LYH,QFH,RVI,VAY,LKS,QYF,WMN,DRG,VYP,YGT,IQW,KIA,QKV,HMK,WQL,RFN,MHP,VRD,KVA,ITR,NQG,YMY,RDG,WMK,YII,NKI,PMR,HML,VAY,KHM,YGT,HAH,TRP,KIA,IWT,FMA,CWP,ICY,HMK,KMS,MIP,FSV,PSH,KVA,KNL,VKT,MHP,KHM,PFI,TRP,RDG,QGR,WMS,YIV,KAC,LQH,MIP,MFS,PSH,VKT,NGI,PVS,NPL,LSP,TKQ,QII,QGR,MFS,VKA,LQH,PPQ,QHL,LSP,VKA,QII,LMS,PHQ,RFA,MCP,NGC,QHL,YCI,MQF,SNF,YMA,LQY,LPQ,VLL,YMA,AIK,WMT,EYH,VLL,SML,GLC,END,WGS,RAD,GWV,RAD,HHS,EAF,MGI,IVN,SEW,QHA,THM,CLY,NMC,TLL及びLMW。
【0137】
更に、無作為に抽出した配列(4merの429配列、5merの436配列、及び6merの465配列を階層的クラスタ分析し、胆汁酸への結合強度が非常に高いペプチドとして配列番号127〜223の配列を同定した。
【0138】
5.選抜された胆汁酸結合ペプチドの評価
(1)胆汁酸結合能
1.において選抜した4個のペプチド配列(配列番号2、4、5、6)の胆汁酸に対する結合性(親和性)を図32に示す。胆汁酸結合アッセイで得られた蛍光強度の平均値(15スポットの平均)を、種ペプチド(VAWWMY:配列番号224)の蛍光強度で標準化することによって各ペプチド配列の結合性を求めた。表中のGRAVYは疎水度の総平均を表す。GRAVYの値が高いほど、疎水度が高い。Kyteらの手法(Kyte, J. and Doolittle, R. 1982. J. Mol. Biol. 157: 105-132.)に従いスコアを求めた。
【0139】
これら4個のペプチド配列、種ペプチド配列(VAWWMY:配列番号224)、カゼイン・トリプシン分解物及びコレスチラミンの14C胆汁酸への結合能を比較した。各試料を14C胆汁酸と2時間インキュベートした後、15000rpmで15分遠心した。上清の放射能を液体シンチレーションカウンターで計測した。計測値からコントロール(14C胆汁酸のみをインキュベートしたもの)の計測値を差し引き、比較した。P-3(VIWWFK)が最大の結合能を示した(図33)。
【0140】
一方、3.における胆汁酸結合アッセイで最大の蛍光強度を示したペプチド配列(MPWYWR:配列番号63)の胆汁酸結合能を同様に調べた結果、種ペプチドを凌ぐ結合能を示した(図34)。即ち、胆汁酸結合能に関して種ペプチドと同等以上のペプチドの同定に成功したことが確認された。
【0141】
(2)胆汁酸ミセル形成阻害能
上記4個のペプチド配列(配列番号2、4、5、6)、種ペプチド配列(VAWWMY:配列番号224)、カゼイン・トリプシン分解物及びコレスチラミン種ペプチドの胆汁酸ミセル形成阻害能を比較した。胆汁酸、14Cコレステロール及び試料を混合し、24時間インキュベートした後、ミセルを形成させるべく超音波処理した。超遠心処理(55000rpm、1時間)に供し、上清中の遊離14Cコレステロール量を計測した。試料を添加しない場合の計測値を100%とし、各試料の計測値を比較した。P-1(PWWWMY:配列番号2)及びP-3(VIWWFK:配列番号5)が高い胆汁酸ミセル形成阻害能を示した(図35)。
【0142】
(3)胆汁酸ミセル破壊能
上記4個のペプチド配列(配列番号2、4、5、6)、種ペプチド配列(VAWWMY:配列番号224)、カゼイン・トリプシン分解物及びコレスチラミン種ペプチドの胆汁酸ミセル破壊能を比較した。胆汁酸と14Cコレステロールを混合して24時間インキュベートした後、超音波処理してミセルを形成させた。続いて試料を添加し、1時間インキュベートした。超遠心処理(55000rpm、1時間)の後、上清中の遊離14Cコレステロール量を計測した。P-1(PWWWMY:配列番号2)及びP-3(VIWWFK:配列番号5)はミセルを完全に破壊した(図36)。添加濃度をミセル破壊能との関係を調べた結果、P-3(○)よりもP-1(■)の方が高いミセル破壊能を示した(図37)。
【0143】
(3)生体コレステロール吸収阻害能
上記4個のペプチド配列(配列番号2、4、5、6)、種ペプチド配列(VAWWMY:配列番号224)、カゼイン・トリプシン分解物及びコレスチラミン種ペプチドのコレステロール吸収阻害能を比較した。3Hコレステロール、モノオレイン酸及び胆汁酸を混合して超音波処理した後、24時間インキュベートした。これに試料(ラット1匹あたり30mg)を添加した後、胃内挿管法にてラット(Wister、オス、9週齢、n=9)に投与した。当該処置の1時間後に血清、肝臓及び腸管を採取し、3Hコレステロール量を計測した。体重100gあたりの平均吸収率(平均±標準誤差)を比較した(図38)。P-1(PWWWMY:配列番号2)及びP-3(VIWWFK:配列番号5)がコレステロール吸収阻害能を発揮することがわかる。
【産業上の利用可能性】
【0144】
本発明によれば、機能性ペプチドを表すルールが得られる。当該ルールは新規機能性ペプチドの効率的な設計、同定に有用である。本発明の手法は汎用性が高く、様々な機能性ペプチドの探索に利用できる。
本発明の評価法によれば、特定の機能に関して、ポリペプチド又はポリペプチド含有組成物を点数によって評価することができる。このような点数化(スコア化)は、ポリペプチド等の客観的な評価、機能性の高いポリペプチド等の特定や創出、ポリペプチド等の分類などに利用できる。
【0145】
この発明は、上記発明の実施の形態及び実施例の説明に何ら限定されるものではない。特許請求の範囲の記載を逸脱せず、当業者が容易に想到できる範囲で種々の変形態様もこの発明に含まれる。
本明細書の中で明示した論文、公開特許公報、及び特許公報などの内容は、その全ての内容を援用によって引用することとする。
【配列表フリーテキスト】
【0146】
配列番号1〜29:人工配列の説明:VAWWMYの置換とランダム化に由来する配列
配列番号30〜42:人工配列の説明:βコングリシニンに由来する配列
配列番号43〜61:人工配列の説明:ランダムスクリーニングで得られた配列
配列番号62〜70:人工配列の説明:1回目のFNN解析によって抽出された第1ルールに由来する配列
配列番号71〜126:人工配列の説明:2回目のFNN解析によって抽出された第1ルールに由来する配列
配列番号127〜223:人工配列の説明:階層的クラスタ分析に基づくスコア化によって得られた配列
配列番号224:人工配列の説明:種ペプチド
【技術分野】
【0001】
本発明は、機能性ペプチドの設計手段、及び設計された機能性ペプチドの利用法に関する。詳しくは、機能性ペプチドの設計に有用なルールを抽出する方法、抽出されたルールを利用して機能性ペプチドを設計又は調製する方法、抽出されたルール又は設計された機能性ペプチドの配列情報を利用してペプチド又はペプチド含有組成物を評価する方法、及び機能性ペプチドが提供される。
【背景技術】
【0002】
近年、生活習慣病が世界の先進国では深刻に蔓延しており、高コレステロール血症、高トリグリセライド血症、又は動脈硬化症の予防・改善のための医薬又は食品の提供が切望されている。我が国における死因の2位は心疾患、3位は脳血管疾患であり、これらはいずれも循環器系疾患の動脈硬化性疾患である。循環器系疾患を罹患する患者数の増加を背景とし、高コレステロール血症を抑える治療薬は現在、大きな市場を形成している。
【0003】
循環器系疾患の発症は生活環境に非常に大きく影響されるため、予防医療(即ち、日常的に摂取する食品成分などによって血中コレステロール値の低減を図ること)の重要性が強く認識されつつある。血中コレステロールを低減する、食品成分中のタンパク質としては大豆タンパク質、乳製品に含まれるホエータンパク質、卵白中タンパク質などが知られている(非特許文献1、2)。また、タンパク質と同様に血中コレステロール値の低減効果を示すペプチドも数多く報告されている(特許文献1〜9)。これら既知の血中コレステロール低減ペプチドの多くは、血中もしくは経口投与により血中コレステロールを低減することが確認されているが、結果として効果が確認されているだけであり、その作用機序の詳細は明らかでないものが多い。
【0004】
一方、血中コレステロールをより安全に低減させる一つの機構として胆汁酸結合ペプチドによるもの、即ち、(1)腸管内における胆汁酸の再吸収を胆汁酸結合ペプチドが阻害し、その結果、血中コレステロールが低減するというメカニズムと、(2)腸管内の胆汁酸混合ミセル中へのコレステロールの溶解性を胆汁酸結合ペプチドが低下させ、その結果、血中コレステロールが低減するというメカニズムが知られている(非特許文献3)。
【0005】
ところで、従来の研究手法では、(1)様々な食品タンパク質を無作為(ランダム)に酵素で分解した消化物の中から胆汁酸に結合する画分を見出し、(2)その血中コレステロール低減効果を観察する、という方法が採られている。これまでの報告の中で特許文献10は、胆汁酸結合性を利用した血中コレステロール低減効果を報告している。また、これまでの研究手法では、非常に限られたペプチド源(研究者が注目しているタンパク質の分解産物など)からしか探索されていないことから、同定に成功した有効な配列(胆汁酸に結合するペプチド配列)の情報は非常に少ない。
【特許文献1】特開2007−126369号公報
【特許文献2】特開2007−137816号公報
【特許文献3】特開2002−80495号公報
【特許文献4】特開2002−80393号公報
【特許文献5】特開2001−114800号公報
【特許文献6】特開平10−175997号公報
【特許文献7】特開平9−157290号公報
【特許文献8】特開平7−278010号公報
【特許文献9】特表2005−516043号公報
【特許文献10】特開2004−99447号公報
【非特許文献1】Proc. Nutr. Soc., 41, 19, (1982)
【非特許文献2】Agric. Biol. Chem., 55, 813 (1991)
【非特許文献3】J. Nutr., 129, 1725 (1999)
【発明の概要】
【発明が解決しようとする課題】
【0006】
同定された胆汁酸結合ペプチドの種類が少なく、胆汁酸結合に重要な配列の特徴などに関する情報が乏しいことから、新規な胆汁酸結合ペプチドを効率的に見出すことができないのが現状である。同様の理由から、既知の胆汁酸結合ペプチドよりも有効性の高いペプチドを設計することも困難である。また、各胆汁酸結合ペプチドを相対的に評価することが困難であり、より有効な胆汁酸ペプチドの設計において、既知の胆汁酸結合ペプチドの配列情報を有効に利用できていない状況にある。さらには、天然由来のペプチド断片の情報しかない場合、非天然型ペプチドの中から有効性の高いものを見出すことは極めて難しい。
【0007】
一方、既知の胆汁酸結合ペプチドが少ない以上、各種ポリペプチド(動物由来タンパク質や植物由来タンパク質など)を検索対象としても、胆汁酸結合ペプチドを含有するポリペプチドを見出せる可能性は低い。胆汁酸結合ペプチドの含有量が多いポリペプチドともなれば、それを見出せる可能性はないに等しい。
【0008】
ところで、ある程度の数の胆汁酸結合ペプチドが同定されていれば、それらを包括的に捉え、その含有量をポリペプチド間で比較し、各ポリペプチドの胆汁酸結合能を評価できる。つまり、ポリペプチド全体としての胆汁酸結合能を評価できるようになる。このような評価手法を利用すれば、胆汁酸結合能の高いポリペプチドを効率的に検索、同定することが可能である。しかしながら実際は、同定された胆汁酸結合ペプチドが非常に限られているため当該評価手法は利用できず、有効なポリペプチドを効率的に検索、同定することができない。
【0009】
以上の各課題は胆汁酸結合ペプチドに固有のものではなく、機能性ペプチド全般に当てはまる。つまり、天然であるか非天然であるかを問わず、機能性ペプチド(特に、有効性の高いペプチド)を効率的に見出すことを可能にする手段の提供が望まれていた。また、機能性ペプチドの含有量の多いポリペプチドや食品を見出す手段の提供も望まれていた。更には、機能性の高いペプチド(高機能ペプチド)の提供も望まれていた。
【課題を解決するための手段】
【0010】
上記課題を解決すべく本発明者らは、図1に示す通り、大別して4種の手法、即ち(A)既知の機能性ペプチド(種ペプチド)の改変を利用して機能性ペプチド配列を検索・設計する方法、(B)既知のタンパク質を断片化して得られるペプチド断片の中から機能性ペプチドを特定する方法、(C)ファジーニューラルネットワーク(FNN)解析を利用して機能性ペプチドを検索・設計する方法、及び(D)階層的クラスタリング法を利用して機能性ペプチドを検索・設計する方法により、新規な機能性ペプチドを網羅的に探索・設計するという独自の戦略を立てた。
【0011】
(A)の方法では、既知のペプチド(種ペプチド)の1残基置換による改変アミノ酸配列の作成(A-1)、各改変アミノ酸配列と標的を用いた機能性アッセイ(A-2)、アッセイの結果に基づくルールの抽出(各位置について好ましいアミノ酸を特定)(A-3)、ルールに従うペプチドの検索・設計(A-4)、を順に行い機能性ペプチドを見出す。
【0012】
(B)の方法では、特定のタンパク質(種タンパク質)の断片化(B-1)、及び断片ペプチドと標的を用いた機能性アッセイ(B-2)、アッセイの結果に基づく機能性ペプチド配列の特定(B-3)、を順に行い機能性ペプチドを見出す。
【0013】
(C)の方法では、ペプチドライブラリーからの複数のペプチド配列の選抜(C-1)、選抜したペプチド配列と標的とを用いた機能性アッセイ(C-2)、アッセイの結果と各配列の物理的特徴を基にしたFNN解析(C-3)、FNNルールの抽出(C-4)、(C-2)〜(C-4)の繰り返し(必要に応じて)(C-5)、及びFNNルール又は構築された予測モデルを利用したペプチド配列の検索・設計(C-6)、を順に行い機能性ペプチドを見出す。当該方法の場合、機能性アッセイの結果として、機能性の高いペプチド配列が見出される可能性がある。
【0014】
(D)の方法では、物理的指標の組合せに基づく、ペプチド配列の複数のクラスタへの分類(階層的クラスタ分析)(D-1)、各クラスタから選抜した配列と標的とを用いた機能性アッセイ(D-2)、アッセイの結果に基づく、クラスタの順位付け(D-3)、上位クラスタからのルール(物理的指標の組合せ)の抽出(D-4)、ルールに従うペプチドの探索・設計(D-5)、を順に行い機能性ペプチドを見出す。当該方法の場合、上位クラスタに含まれるペプチド配列を機能性の高いペプチド配列として抽出することが可能である。
【0015】
各手法で見出されたペプチド配列は必要に応じて更に選抜される。ここでの選抜として、合成効率、合成コスト、特性(溶解度、熱安定性、pH安定性、立体構造等)等による選抜、細胞や動物等を利用したアッセイによる選抜、又はこれら両方の選抜を行うことができる。また、(A)〜(D)の方法を併用することによる選抜も可能である。
【0016】
以上の(A)〜(D)の手法の有効性を、胆汁酸結合ペプチドをモデルとして検証した(図2)。その際、機能性アッセイとして、コンビナトリアルケミストリーの一手法であるペプチドアレイを利用し、大量のペプチド配列のアッセイを可能とした。ペプチドアレイを利用した、このように大規模な胆汁酸結合ペプチドの探索は過去に報告がない。
【0017】
検証の結果、いずれの手法によっても、複数の胆汁酸結合ペプチドを見出すことができた。即ち、(A)〜(D)の方法によれば多数の機能性ペプチドを同定できることが確認された。また、検証による副産物として、天然由来・非天然由来を問わず、多数の胆汁酸結合ペプチドの配列情報(配列番号1〜223並びにIIK,GTV,WIY,YYW,WRW,PWR,WFW,WYM,IWW,YWM,FWY,LWY,WYD,WMY,WYF,MWF,YFY,WWT,WWI,YYF,FMF,YMW,PFF,AWY,WMM,NWY,PWM,FWV,WYV,YFM,YGW,PVW,WRI,QWF,WHF,MWM,PIY,LFF,YSW,WNF,WSL,YLF,YYI,WYT,MYY,IWM,WHM,WLA,YQY,IQW,WLN,WMQ,WAM,AWM,TWY,WSM,VWI,MFL,NWM,WVQ,FGL,FNY,PIR,PWN,MWL,YGL,NWI,AWI,VFI,YSF,MIF,FVM,TWM,WQI,MYM,TWI,PMG,IGY,IML,VLF,YIV,YAM,PYN,VAY,PCK,SWL,PCW,PML,PLM,VYM,VMY,PFE,YSM,ISF,QWV,WVC,CWY,MTF,PLQ,ILM,YQV,PCC,YMI,WKC,PMH,WKW,WYE,WFK,WRR,WKW,RKF,WKS,VWW,VWW,PLK,YWL,KLK,FLR,YWL,NFK,LWY,HWF,LRI,WGW,WFL,FYF,RHW,PLK,KLK,LRI,KIW,QWR,IWN,RRK,KVR,NQY,WNP,LRY,FMY,WMH,WIK,YFI,IRA,NTH,WNP,YFI,WGV,HKL,WRG,YYT,QPW,LYL,TRA,RKA,WHA,LYL,AFL,FII,RPL,FVI,YSH,LYS,IFW,KIP,FII,WQE,FCP,NHI,WAG,VRQ,GPR,LYS,NRE,FLT,YVP,LYM,IIP,WRC,NTK,QFH,FQW,NTK,YVP,LYN,FGF,LKS,GYL,FIE,KGS,VFA,RFN,LYH,QFH,RVI,VAY,LKS,QYF,WMN,DRG,VYP,YGT,IQW,KIA,QKV,HMK,WQL,RFN,MHP,VRD,KVA,ITR,NQG,YMY,RDG,WMK,YII,NKI,PMR,HML,VAY,KHM,YGT,HAH,TRP,KIA,IWT,FMA,CWP,ICY,HMK,KMS,MIP,FSV,PSH,KVA,KNL,VKT,MHP,KHM,PFI,TRP,RDG,QGR,WMS,YIV,KAC,LQH,MIP,MFS,PSH,VKT,NGI,PVS,NPL,LSP,TKQ,QII,QGR,MFS,VKA,LQH,PPQ,QHL,LSP,VKA,QII,LMS,PHQ,RFA,MCP,NGC,QHL,YCI,MQF,SNF,YMA,LQY,LPQ,VLL,YMA,AIK,WMT,EYH,VLL,SML,GLC,END,WGS,RAD,GWV,RAD,HHS,EAF,MGI,IVN,SEW,QHA,THM,CLY,NMC,TLL及びLMW)がもたらされた。これらペプチドの中には、既知の胆汁酸結合ペプチドよりも高い結合能を示すものも数多く含まれていた。この事実は、上記手法の有効性を裏付ける。一方、胆汁酸結合ペプチドとして同定されたものの中には、非天然型ペプチドも数多く含まれていた。この事実は、未知ペプチドの設計法として上記手法が有効であることを示す。
【0018】
一方、後述の実施例に示す通り、(C)の手法によって、胆汁酸結合ペプチド(6アミノ酸残基)の構造的ルールが見出された。同様に、(D)の手法によって、胆汁酸結合ペプチド(3アミノ酸残基)の構造的ルールが見出された。これらの構造的ルールは胆汁酸結合ペプチドの設計ないし同定に有用である。
【0019】
同定された胆汁酸結合ペプチド数種について、より生体に近いアッセイ系で胆汁酸結合能を評価した。その結果、既知の胆汁酸結合ペプチドよりも高い結合能を示すペプチドが見出された。コレステロール溶解阻害能についても評価した結果、いくつかのペプチドは非常に高いコレステロール溶解阻害能を示した。つまり、有望なコレステロール低減ペプチドの同定に成功したことが明らかとなった。
【0020】
ここで、多数の機能性ペプチドを同定できれば、各機能性ペプチドの相対評価が可能となる。また、機能性ペプチドを含むポリペプチド(タンパク質)の同定も容易となる。一方、多数の機能性ペプチドの配列情報があれば、それを利用してポリペプチドを評価(スコア化)することができる。具体的には、同定した機能性ペプチドを包括的に捉え、各機能性ペプチドの含有量をポリペプチド間で比較すれば、当該機能に関する各ポリペプチドの有効性を点数(スコア)として示すことが可能となる。このような評価法を利用すれば、ポリペプチド又はポリペプチド含有組成物(例えばポリペプチド含有食品)を機能性という新たな観点から特定したり、分類したりすることができる。或いは、特定の機能性に関してより有効なポリペプチド又はポリペプチド含有組成物の創出が可能となる。
【0021】
ここで、(C)及び(D)の手法は、膨大な数の候補の中から効率的に有効なペプチドを選抜できる点、様々な長さのペプチドを設計可能である点、既知の機能性ペプチドの配列に依存しない全く新しいペプチドを見出すことが可能である点等、数多くの利点を有し、機能性ペプチドの設計法として特に有効であるといえる。
【0022】
ところで、(A)〜(D)の方法では、見出されるペプチドの長さに制約がある((C)及び(D)の手法では様々な長さのペプチドを設計可能であるものの、以下の制約がある)。即ち、各手法によって見出されるペプチドの長さは、(A)の手法においては種ペプチドの長さに依存し、(B)の手法においては断片化の条件に依存し、(C)及び(D)の手法においてはペプチドライブラリーに含まれるペプチドの長さに依存する。この問題を克服するため、見出されたペプチド配列を連結することによって、より長いペプチドを設計するという手法を創出した。この手法では、(A)〜(D)の方法によって設計されたペプチドの中から、共通する配列部分をもつものを抽出し、連結する(図3)。
【0023】
本発明は以上の検討の末に完成されたものであり、次の通りである。
[1]以下のステップ(1)〜(7)を含む、機能性ペプチドを表すルールの抽出法、
(1)アミノ酸残基数が同一で且つ配列が互いに異なる複数のペプチド配列からなるペプチドライブラリーを用意するステップ、
(2)N末端又はC末端からの位置毎に構成アミノ酸の物理化学的性質を数値化することによって、前記ペプチドライブラリーに含まれる各ペプチド配列を数値データに変換するステップ、
(3)前記数値データを入力変数として階層的クラスタ分析し、各ペプチド配列を、N末端又はC末端からの位置毎に前記物理的性質の数値範囲で規定される複数のクラスタに分類するステップ、
(4)前記複数のクラスタの中から、クラスタ毎、所定数のペプチド配列を選抜するステップ、
(5)選抜したペプチド配列からなるペプチドを試料として機能性アッセイを行い、各ペプチド配列の機能性データを取得するステップ、
(6)機能性データに基づき、機能性の順位を前記複数のクラスタに付与するステップ、
(7)上位の順位が付与されたクラスタを規定する、前記物理化学的性質の数値範囲又は該数値範囲を満足するアミノ酸の種類を、高機能ペプチドの特徴を表すルールとして抽出するステップ。
[2]前記機能性が高親和性である、[1]に記載の抽出法。
[3]前記機能性が、胆汁酸に対する高親和性である、[1]に記載の抽出法。
[4]ステップ(1)における前記アミノ酸残基数が3〜6である、[1]〜[3]のいずれか一項に記載の抽出法。
[5]ステップ(2)における前記物理的性質が等電点、正規化ファンデルワールス体積、βタンパク質のためのアルファへリックスの指標、βタンパク質のためのベータ鎖の指標、タンパク質安定化のための側鎖の貢献度、原子間ポテンシャルに関する知識を基にした安定化尺度、疎水性指標、正規化されたターン頻度、ベータ鎖領域における自由エネルギー、アルファ−へリックス領域における自由エネルギー、極性、側鎖の相互作用、及びアミノ酸の分配度からなる群より選択される2種以上の性質である、[1]〜[4]のいずれか一項に記載の抽出法。
[6]ステップ(2)における前記物理的性質が、等電点、正規化ファンデルワールス体積、βタンパク質のためのアルファへリックスの指標、βタンパク質のためのベータ鎖の指標、タンパク質安定化のための側鎖の貢献度、原子間ポテンシャルに関する知識を基にした安定化尺度、疎水性指標、正規化されたターン頻度、ベータ鎖領域における自由エネルギー、アルファ−へリックス領域における自由エネルギー、極性、側鎖の相互作用、及びアミノ酸の分配度からなる、13種の性質である、[1]〜[4]のいずれか一項に記載の抽出法。
[7]ステップ(3)で生成されるクラスタの数が10〜100である、[1]〜[6]のいずれか一項に記載の抽出法。
[8]ステップ(4)における前記所定数が3〜30である、[1]〜[7]のいずれか一項に記載の抽出法。
[9]ステップ(5)における前記機能性アッセイが、前記試料である複数のペプチドが配列毎に区画化されて基板に固定されたなるペプチドチップを用いて行われる、[1]〜[8]のいずれか一項に記載の抽出法。
[10]ステップ(6)に続いて、以下のステップ(6−1)〜(6−4)を1回又は2回以上実施した後、ステップ(7)を実施する、[1]〜[9]のいずれか一項に記載の抽出法、
(6−1)上位の順位が付与された複数のクラスタを特定するステップ、
(6−2)特定された複数のクラスタより、クラスタ毎、所定数のペプチド配列を選抜するステップ、
(6−3)選抜したペプチド配列からなるペプチドを試料として機能性アッセイを行い、各ペプチド配列の機能性データを取得するステップ、
(6−4)機能性データに基づき、機能性の順位を前記複数のクラスタに付与するステップ。
[11]ステップ(7)において、上位n位(但し、nは2〜5の整数)までのクラスタからそれぞれルールを抽出する、[1]〜[10]のいずれか一項に記載の抽出法。
[12]ステップ(7)において、最上位の順位が付与されたクラスタのみからルールを抽出する、[1]〜[10]のいずれか一項に記載の抽出法。
[13]以下のステップ(1)〜(7)を含む、機能性ペプチドを表すルールの抽出法、
(1)アミノ酸残基数が同一で且つ配列が互いに異なる複数のペプチド配列からなるペプチドライブラリーを用意するステップ、
(2)前記ペプチドライブラリーから複数のペプチド配列を選抜するステップ、
(3)選抜したペプチド配列からなるペプチドを試料として機能性アッセイを行い、各ペプチド配列の機能性データを取得するステップ、
(4)機能性データに基づき、機能性アッセイに供したペプチド配列の中から、複数の高機能配列及び複数の低機能配列を選抜するステップ、
(5)N末端又はC末端からの位置毎に構成アミノ酸の物理化学的性質を数値化することによって、選抜した高機能配列及び低機能配列を数値データに変換するステップ、
(6)前記数値データを入力変数として、学習モデルを用いた解析を行うステップ、
(7)解析結果より、配列上の1以上の位置について前記物理的性質の条件又は該条件を満足するアミノ酸の種類を示すルールであって、高機能ペプチド配列の特徴を表す1又は2以上のルールを抽出するステップ。
[14]ステップ(7)の後、以下のステップ(8)を行う、[13]に記載の抽出法、
(8)ステップ(1)で用意したペプチドライブラリーの内、以前の選抜の際に選抜されなかったペプチド配列の集合の中から、抽出した前記ルールに適合する複数のペプチド配列を選抜した後、ステップ(3)〜(7)を行うステップ。
[15]学習モデルを用いた前記解析がファジィニューラルネットワーク解析であり、
ステップ(6)においてファジィニューラルネットワーク解析の結果として予測モデルが構築され、ステップ(7)では該予測モデルより前記ルールが抽出される、[13]に記載の抽出法。
[16][1]〜[15]のいずれか一項に記載の抽出法によって得られたルールに従ってペプチドを設計するステップを含む、機能性ペプチドの設計法。
[17]複数の候補ペプチド配列の中から、[1]〜[15]のいずれか一項に記載の抽出法によって得られたルールに適合するペプチド配列を選抜するステップを含む、機能性ペプチドの設計法。
[18][1]〜[12]のいずれか一項に記載の抽出法によって得られた、上位の順位が付与されたクラスタに含まれる1又は2以上のペプチド配列を高機能ペプチド配列として選択するステップを含む、機能性ペプチドの設計法。
[19]以下のステップ(1)〜(3)を含む、機能性ペプチドの設計法、
(1)複数の候補ペプチドを用意するステップ、
(2)N末端又はC末端からの位置毎に構成アミノ酸の物理化学的性質を数値化することによって、前記複数の候補ペプチド配列をそれぞれ数値データに変換するステップ、
(3)[15]に記載の抽出法においてルールの抽出の際に構築された予測モデルを用い、前記数値データを入力変数としてファジィニューラルネットワーク解析を行うステップであって、該ファジィニューラルネットワーク解析において、(i)ルールに適合するペプチド配列の選抜、(ii)選抜されたペプチド配列の予測値の評価、及び(iii)予測値の高いペプチド配列の選抜、が順に行われるステップ。
[20](iii)の処理の後、選抜されたペプチド配列の信頼度の評価が行われる、[19]に記載の設計法。
[21]以下のステップ(1)〜(3)を含む、機能性ペプチドの設計法、
(1)以下の(a)〜(d)からなる群より選択される集合を用意するステップ、
(a)[1]〜[12]のいずれか一項に記載の抽出法によって得られた、上位の順位が付与されたクラスタに含まれるペプチド配列の集合、
(b)[1]〜[12]のいずれか一項に記載の抽出法によって得られたルールに適合するペプチド配列の集合、
(c)[13]〜[15]のいずれか一項に記載の抽出法によって得られたルールに適合するペプチド配列の集合、
(d)(a)〜(c)からなる群より選択される2以上の集合を結合した集合、
(2)用意した集合の中から、共通する部分配列を認める第1ペプチド配列及び第2ペプチドを選抜するステップであって、第2ペプチド配列の方が、該部分配列よりもC末端側のアミノ酸の数が多いステップ、
(3)前記第1ペプチド配列から前記部分配列よりもC末端側のアミノ酸を除去して得られる第1部分配列と、前記第2ペプチド配列から前記部分配列及び前記部分配列よりもN末端側のアミノ酸を除去して得られる第2部分配列とを、該第1部分配列がN末端側に配置されるように連結するステップ。
[22]前記第1ペプチド配列では前記部分配列がC末端アミノ酸を含み、前記第2ペプチド配列では前記部分配列がN末端アミノ酸を含む、[21]に記載の設計法。
[23]下記条件1〜3の少なくとも1つを満足する、[21]又は[22]に記載の設計法、
条件1:それに含まれるペプチド配列のアミノ酸残基数が異なる複数のペプチドライブラリーを用意し、各ペプチドライブラリーを用いて[1]〜[12]のいずれか一項に記載の抽出法を行うことにし、各回について得られた、上位の順位が付与されたクラスタに含まれるペプチド配列の集合を全て連結し、前記集合(a)とする、
条件2:それに含まれるペプチド配列のアミノ酸残基数が異なる複数のペプチドライブラリーを用意し、各ペプチドライブリーを用いて[1]〜[12]のいずれか一項に記載の抽出法を行ってルールを得た後、抽出されたルール毎、適合するペプチドの集合を作製し、最後に全集合を連結して前記集合(b)とする、
条件3:それに含まれるペプチド配列のアミノ酸残基数が異なる複数のペプチドライブラリーを用意し、各ペプチドライブリーを用いて[13]〜[15]のいずれか一項に記載の抽出法を行ってルールを得た後、抽出されたルール毎、適合するペプチドの集合を作製し、最後に全集合を連結して前記集合(c)とする。
[24]ステップ(1)において前記集合(a)を用意することにし、
ステップ(2)では、第1ペプチド配列と対をなす第2ペプチド配列の候補が二つ以上存在する場合には、より上位の順位が付与されたクラスタに属するペプチド配列を優先して第2ペプチド配列に用い、第2ペプチド配列と対をなす第1ペプチド配列の候補が二つ以上存在する場合には、より上位の順位が付与されたクラスタに属するペプチド配列を優先して第1ペプチド配列に用いる、[21]〜[23]のいずれか一項に記載の設計法。
[25]ステップ(1)において前記集合(b)を用意することにし、
ステップ(2)では、第1ペプチド配列と対をなす第2ペプチド配列の候補が二つ以上存在する場合には、より上位の順位が付与されたクラスタのルールに適合するペプチド配列の方を優先して第2ペプチド配列に用い、第2ペプチド配列と対をなす第1ペプチド配列の候補が二つ以上存在する場合には、より上位の順位が付与されたクラスタのルールに適合するペプチド配列の方を優先して第1ペプチド配列に用いる、[21]〜[23]のいずれか一項に記載の設計法。
[26][16]〜[25]のいずれか一項に記載の設計法で設計されたペプチドを調製するステップを含む、機能性ペプチドの調製法。
[27]以下のステップ(1)〜(6)を含む、ポリペプチド又はポリペプチド含有組成物の評価法、
(1)ポリペプチドの配列を用意するステップ、
(2)[1]〜[15]のいずれか一項に記載の抽出法によって抽出された1又は2以上のルールに対してそれぞれスコアを関連付けるステップ、
(3)前記ルールとの照合が可能な一定の長さに前記ポリペプチドの配列を断片化するステップ、
(4)各断片配列を前記ルールと照合し、適合性を判定するステップ、
(5)ルールに適合すると判定された断片配列に対して、該ルールに関連付けられたスコアを付与するステップ、
(6)付与された全てのスコアを積算して総スコアを算出するステップであって、該総スコアが前記ポリペプチドの機能性を表す指標となるステップ。
[28]以下の(A)〜(C)のいずれかの特徴を備える、[27]に記載の評価法、
(A)ステップ(3)で生じた断片配列の中から、プロテアーゼ切断部位を内在する断片配列を除いた後にステップ(4)を行う、
(B)ステップ(6)において、プロテアーゼ切断部位を内在する断片配列以外の断片配列に付与されたスコアのみを積算する、
(C)ステップ(6)において、付与された全スコアを積算した後、ステップ(3)で生じた断片配列の中から、プロテアーゼ切断部位を内在する断片配列に付与されたスコアを除算する。
[29]以下のステップ(1)〜(6)を含む、ポリペプチド又はポリペプチド含有組成物の評価法、
(1)ポリペプチドの配列を用意するステップ、
(2)[1]〜[12]のいずれか一項に記載の抽出法によって得られた、上位の順位が付与されたクラスタに含まれる各ペプチド配列に対して、同一のクラスタに含まれるペプチド配列は各々相同性の高いスコアとなり且つクラスタの順位に対応したスコアとなるように、スコアを関連付けるステップ、
(3)スコアを関連付けた各ペプチド配列をそれぞれ前記ポリペプチドの配列と照合し、配列が一致する領域の数を調べるステップ、
(4)ステップ(3)で判明した前記領域の数と、ステップ(2)で関連付けたスコアとを乗ずることによってペプチド配列毎にスコアを算出した後、全てのスコアを積算して総スコアを算出するステップであって、該総スコアが前記ポリペプチドの機能性を表す指標となるステップ。
[30]以下のステップ(1)〜(5)を含む、ポリペプチド又はポリペプチド含有組成物の評価法、
(1)ポリペプチドの配列を用意するステップ、
(2)[13]〜[15]のいずれか一項に記載の抽出法においてルールを抽出する際に用いた学習モデルで解析可能な一定の長さに前記ポリペプチドの配列を断片化するステップ、
(3)N末端又はC末端からの位置毎に構成アミノ酸の物理化学的性質を数値化することによって、各断片配列を数値データに変換するステップ、
(4)前記学習モデルを用い、前記数値データを入力変数として、学習モデルによる解析を行い、各断片配列の予測機能度を算出するステップ、
(5)算出された予測機能度を積算するステップであって、得られた総予測機能度が前記ポリペプチドの機能性を表す指標となるステップ。
[31]配列番号1〜223のいずれかのアミノ酸配列、又は以下の群、即ちIIK,GTV,WIY,YYW,WRW,PWR,WFW,WYM,IWW,YWM,FWY,LWY,WYD,WMY,WYF,MWF,YFY,WWT,WWI,YYF,FMF,YMW,PFF,AWY,WMM,NWY,PWM,FWV,WYV,YFM,YGW,PVW,WRI,QWF,WHF,MWM,PIY,LFF,YSW,WNF,WSL,YLF,YYI,WYT,MYY,IWM,WHM,WLA,YQY,IQW,WLN,WMQ,WAM,AWM,TWY,WSM,VWI,MFL,NWM,WVQ,FGL,FNY,PIR,PWN,MWL,YGL,NWI,AWI,VFI,YSF,MIF,FVM,TWM,WQI,MYM,TWI,PMG,IGY,IML,VLF,YIV,YAM,PYN,VAY,PCK,SWL,PCW,PML,PLM,VYM,VMY,PFE,YSM,ISF,QWV,WVC,CWY,MTF,PLQ,ILM,YQV,PCC,YMI,WKC,PMH,WKW,WYE,WFK,WRR,WKW,RKF,WKS,VWW,VWW,PLK,YWL,KLK,FLR,YWL,NFK,LWY,HWF,LRI,WGW,WFL,FYF,RHW,PLK,KLK,LRI,KIW,QWR,IWN,RRK,KVR,NQY,WNP,LRY,FMY,WMH,WIK,YFI,IRA,NTH,WNP,YFI,WGV,HKL,WRG,YYT,QPW,LYL,TRA,RKA,WHA,LYL,AFL,FII,RPL,FVI,YSH,LYS,IFW,KIP,FII,WQE,FCP,NHI,WAG,VRQ,GPR,LYS,NRE,FLT,YVP,LYM,IIP,WRC,NTK,QFH,FQW,NTK,YVP,LYN,FGF,LKS,GYL,FIE,KGS,VFA,RFN,LYH,QFH,RVI,VAY,LKS,QYF,WMN,DRG,VYP,YGT,IQW,KIA,QKV,HMK,WQL,RFN,MHP,VRD,KVA,ITR,NQG,YMY,RDG,WMK,YII,NKI,PMR,HML,VAY,KHM,YGT,HAH,TRP,KIA,IWT,FMA,CWP,ICY,HMK,KMS,MIP,FSV,PSH,KVA,KNL,VKT,MHP,KHM,PFI,TRP,RDG,QGR,WMS,YIV,KAC,LQH,MIP,MFS,PSH,VKT,NGI,PVS,NPL,LSP,TKQ,QII,QGR,MFS,VKA,LQH,PPQ,QHL,LSP,VKA,QII,LMS,PHQ,RFA,MCP,NGC,QHL,YCI,MQF,SNF,YMA,LQY,LPQ,VLL,YMA,AIK,WMT,EYH,VLL,SML,GLC,END,WGS,RAD,GWV,RAD,HHS,EAF,MGI,IVN,SEW,QHA,THM,CLY,NMC,TLL及びLMWから選択されるアミノ酸配列からなる、胆汁酸結合ペプチド。
【図面の簡単な説明】
【0024】
【図1】機能性ペプチドを網羅的に探索・設計するための戦略を示す図。
【図2】機能性ペプチドを網羅的に探索・設計するための戦略(具体例)を示す図。
【図3】新規ペプチドの設計法を示す図。
【図4】階層的クラスタ分析を利用したルールの抽出法を示すフローチャート。
【図5】アミノ酸に関する13種の性質の数値化の例を示す図。
【図6】ファジィニューラルネットワーク(FNN)解析を利用したルールの抽出法を示すフローチャート。
【図7】ANNの構造を示す図。
【図8】FNNの構造を示す図。
【図9】シグモイド関数を示す図。
【図10】small(S)とbig(B)の2つのルールの分割を用いたときのFNNの構造を示す図。
【図11】ファジールールの一例を示す図。
【図12】ペプチド配列の設計法の一例を示すフローチャート。
【図13】予測モデルを利用したペプチド配列の設計法を示すフローチャート。
【図14】ペプチド配列の連結を利用したペプチド配列の設計法を示すフローチャート。
【図15】ペプチド配列の連結を利用したペプチド配列の設計法(詳細)を示すフローチャート。
【図16】ポリペプチド等の評価法を示すフローチャート。
【図17】ポリペプチド等の評価法における断片化のステップを示す図。(A)では、N末端(又はC末端)から3アミノ酸毎に区切り、トリペプチド配列の集合を得る。(B)では、N末端(又はC末端)の3アミノ酸を最初の断片とし、N末端(又はC末端)から1アミノ酸又は2アミノ酸だけC末端側にずらした位置からの3アミノ酸を次の断片とする。
【図18】上位クラスタに含まれるペプチド配列を用いた評価法を示すフローチャート。
【図19】予測モデルを用いた評価法を示すフローチャート。
【図20】胆汁酸結合能の評価を示すフローチャート。
【図21】胆汁酸結合能とアミノ酸配列の関係を表すルール。a.T検定により、好ましいアミノ酸を選出した。b.好ましくないアミノ酸として、親和性を低下させる下位3位のアミノ酸を示した。
【図22】胆汁酸結合アッセイの結果を示す表。3サンプルの平均蛍光強度(バックグラウンドの蛍光強度を差し引いた値)を示した。
【図23】大豆タンパク質(βコングリシニン)由来のペプチド酸配列を用いた胆汁酸結合アッセイの結果を示す表。
【図24】FNN解析によって選抜されたペプチド配列を用いた胆汁酸結合アッセイの結果を示す表。種ペプチド(VAWWMY)を基準(1)として3スポットの全てが0.8以上の場合にポジティブ配列とした。また、3スポットの全てがバックグラウンドと同等の場合にネガティブ配列とした。左の欄にはFNN解析によるペプチド配列の選抜方法を示した。
【図25】(a)FNN解析により抽出された配列ルール表。(b)配列ルール表より抽出されたポジティブルール。左の欄にはFNN解析によるペプチド配列の選抜方法を示した。
【図26】FNN解析によって選抜されたペプチド配列を用いた胆汁酸結合アッセイ(2回目)の結果を示す表。種ペプチド(VAWWMY)を基準(1)として3スポットの全てが0.8以上の場合にポジティブ配列とした(P値(対ブランク)<0.05)。また、3スポットの全てが0.2以下の場合にネガティブ配列とした。左の欄にはFNN解析によるペプチド配列の選抜方法を示した。
【図27】FNN解析により抽出されたルール。左の欄にはFNN解析によるペプチド配列の選抜方法を示した。
【図28】FNN解析によって選抜されたペプチド配列を用いた胆汁酸結合アッセイ(3回目)の結果を示す表。左の欄にはFNN解析によるペプチド配列の選抜方法を示した。
【図29】階層的クラスタ分析による分類結果を示す表。
【図30】階層的クラスタ分析により形成された上位5個のクラスタ。
【図31】上位クラスタ及び下位クラスタからの選抜したペプチド配列を用いたアッセイの結果。
【図32】選抜された胆汁酸結合ペプチドの胆汁酸結合能を示す表。
【図33】選抜されたペプチド配列の胆汁酸結合能を比較したグラフ。
【図34】胆汁酸結合アッセイで最大の蛍光強度を示したペプチド配列の胆汁酸結合能を示すグラフ。
【図35】選抜された胆汁酸結合ペプチドの胆汁酸ミセル形成阻害能を比較したグラフ。
【図36】選抜された胆汁酸結合ペプチドの胆汁酸ミセル破壊能を比較したグラフ。
【図37】P-1(PWWWMY:配列番号2)とP-3(VIWWFK:配列番号5)の胆汁酸ミセル破壊能を比較したグラフ。■:P-1、○:P-3、▲:コレスチラミン。
【図38】選抜された胆汁酸結合ペプチドの生体コレステロール吸収阻害能を比較した表。P値をT検定で求めた。
【発明を実施するための形態】
【0025】
<機能性ペプチドを表すルールの抽出法>
本発明の第一の局面は機能性ペプチドを表すルールの抽出法に関する。抽出したルールを用いれば、効率的に機能性ペプチドを設計ないし同定することができる。つまり、ルールは機能性ペプチドの設計ないし同定に有用である。
【0026】
「機能性ペプチドを表すルール」とは、特定の機能を有するペプチドに共通する規則を表したものである。ルールの形式は、それを抽出する際に用いる手法によって異なる。ルールの詳細は後述する。「機能性ペプチド」とは、生物学的、医学的、薬学的、栄養学的、又は食品学的に有用な機能を有するペプチドをいう。「機能」の例として、特定の物質に対する親和性を挙げることができる。より具体的な例として、胆汁酸に対する親和性(結合性)を挙げることができる。「ペプチド」とは二つ以上のアミノ酸がペプチド結合によって連なった分子である。ペプチドのアミノ酸残基数は特に限定されない。即ち、慣例に従い、「ペプチド」は、オリゴペプチド及びポリペプチド(タンパク質を含む)を包括する用語として使用される。また、本明細書では慣例の標記法に従い左端がアミノ末端、右端がカルボキシ末端となるようにペプチドを表記する。
【0027】
1.階層的クラスタ分析を利用したルールの抽出法
本発明の一態様では以下のステップ(1)〜(7)を行う(図4を参照)。
(1)アミノ酸残基数が同一で且つ配列が互いに異なる複数のペプチド配列からなるペプチドライブラリーを用意するステップ、
(2)N末端又はC末端からの位置毎に構成アミノ酸の物理的性質を数値化することによって、前記ペプチドライブラリーに含まれる各ペプチド配列を数値データに変換するステップ、
(3)前記数値データを入力変数として階層的クラスタ分析し、各ペプチド配列を、N末端又はC末端からの位置毎に前記物理的性質の数値範囲で規定される複数のクラスタに分類するステップ、
(4)前記複数のクラスタの中から、クラスタ毎、所定数のペプチド配列を選抜するステップ、
(5)選抜したペプチド配列からなるペプチドを試料として機能性アッセイを行い、各ペプチド配列の機能性データを取得するステップ、
(6)機能性データに基づき、機能性の順位を前記複数のクラスタに付与するステップ、
(7)上位の順位が付与されたクラスタを規定する、前記物理的性質の数値範囲又は該数値範囲を満足するアミノ酸の種類を、高機能ペプチドの特徴を表すルールとして抽出するステップ
【0028】
本発明の抽出法ではまずペプチドライブラリーを用意する(ステップ(1))。「ペプチドライブラリー」とは、複数のペプチド配列の集合である。本発明で使用するペプチドライブラリーは、アミノ酸残基数が同一で且つ配列が互いに異なる複数のペプチド配列から構成される。ここでのアミノ酸残基数は特に限定されないが、例えば2〜10、好ましくは3〜8、更に好ましくは3〜6である。アミノ酸残基数が少なすぎると、ペプチドライブラリーを構成するアミノ酸配列(以下、ペプチドライブラリーを構成する各アミノ酸配列のことを「メンバー」とも呼ぶ)の数が少なくなり、「効率的に多数のアミノ酸配列を分類する」という、本発明の特徴の一つが十分に活かされない。また、候補ペプチド配列の種類が少なくなることから、新規な機能性ペプチドを同定できる可能性が低くなる。一方、アミノ酸残基数が多すぎると、無作為の(偏りのない)ペプチドライブラリーを作製した場合のメンバー数が膨大となり、階層的クラスタ分析に多大な処理能力、処理時間が必要となる。
【0029】
ペプチドライブラリー中のメンバー数は特に限定されないが、信頼性の高いルールの抽出のためにはメンバー数を多くするよい。但し、メンバー数の増大に応じて、後述の階層的クラスタ分析が複雑化することを考慮し、メンバー数を1000〜100000、好ましくは2000〜500000とする。信頼性の高いルールを抽出するためにはペプチド配列の偏りをなくすことが有効であり、即ち無作為に選択されたメンバーの集合(ランダム・ペプチドライブラリー)を使用するとよい。各メンバーを構成するアミノ酸は、典型的には、生体内でタンパク質を構成するアミノ酸、即ち、アラニン、アルギニン、アスパラギン、アスパラギン酸、システイン、グルタミン酸、グルタミン、グリシン、ヒスチジン、イソロイシン、ロイシン、リシン、メチオニン、フェニルアラニン、プロリン、セリン、トレオニン、トリプトファン、チロシン、バリン等である。但し、ペプチドを構成可能なアミノ酸であれば、これら以外のアミノ酸であってもよい。
【0030】
次に、ペプチドライブラリーに含まれる各メンバーを階層的クラスタ分析で分析可能な数値データに変換する(ステップ(2))。具体的には、各メンバーについて、N末端又はC末端からの位置毎に構成アミノ酸の物理的化学性質を数値化し、物理的性質を表す数値の集合を各メンバーに付与する。
ここでの「物理的性質」とは、サイズ(大きさ)、疎水度、電荷、等電点など、アミノ酸の分類に利用される性質をいう。好ましくは、等電点、正規化ファンデルワールス体積、βタンパク質のためのアルファへリックスの指標、βタンパク質のためのベータ鎖の指標、タンパク質安定化のための側鎖の貢献度、原子間ポテンシャルに関する知識を基にした安定化尺度、疎水性指標、正規化されたターン頻度、ベータ鎖領域における自由エネルギー、アルファ−へリックス領域における自由エネルギー、極性、側鎖の相互作用、アミノ酸の分配度等電点、正規化ファンデルワールス体積、βタンパク質のためのアルファへリックスの指標、βタンパク質のためのベータ鎖の指標、タンパク質安定化のための側鎖の貢献度、原子間ポテンシャルに関する知識を基にした安定化尺度、疎水性指標、正規化されたターン頻度、ベータ鎖領域における自由エネルギー、アルファ−へリックス領域における自由エネルギー、極性、側鎖の相互作用、及びアミノ酸の分配度からなる群より選択される2種以上の性質を併用する。更に好ましくは、これら13種の全てを併用する。この態様では各メンバーが、それを構成するアミノ酸の位置毎に13種の数値を持つ数値データとなる。例えばメンバーのアミノ酸残基数が3であれば39個(3×13)の数値の集合(セット)からなる数値データとなる。尚、これら13種の性質はGenome Net JapanのDB(http://www.genome.ad.jp/dbget/aaindex.html)が提供する544指標の指標をクラスタ分類した際、もっとも互いに相関の低いクラスタ代表であるため、これらの総合は544指標での判断に相当するものと考えられる。
【0031】
上記13種の性質の数値化の例を図5に示す。図5の表では、既報の方法に従って各アミノ酸の13指標が数値化されている。ここでの13指標は等電点(Isoelectric point; Zimmerman,et,al., J.Theor.Biol., Vol.21,No.2,170-201(1968))、正規化ファンデルワールス体積(Normalized van der Waals volume; Fauchere,et,al., Int.J.Pept.Protein,Res., Vol.32,No.4,269-278,(1988))、βタンパク質のためのアルファへリックスの指標(Alpha-helix indices for beta-proteins; Geisow-Roberts, Int.J.Biol.Macromol.,Vol.2,No.6,387-389,(1980))、βタンパク質のためのベータ鎖の指標(Beta-strand indices for beta-proteins; Geisow-Roberts,Int.J.Biol.Macromol.,Vol.2,No.6,387-389,(1980))、タンパク質安定化のための側鎖の貢献度(Side-chain contribution to protein stability(kJ/mol); Takano-Yutani, Protein,Eng.,2001,Aug;14(8):525-8)、原子間ポテンシャルに関する知識を基にした安定化尺度(The stability scale from the knowledge-based atom-atom potential; Zhou-Zhou, Proteins.,2004,Feb,1;54(2):315-22)、疎水性指標(Hydropathy index; Kyte-Doolittle,J.Mol.Biol.,Vol.157,No.1,105-132,(1982))、正規化されたターン頻度(Normalized frequency of turn; Crawford,et,al.,Proc,Natl,Acad,Sci,U,S,A.,1973,Feb;70(2):538-42.)、ベータ鎖領域における自由エネルギー(Free energy in beta-strand region; Munoz-Serrano, Struct.Funct.Genet.,Vol.20,No.4,301-311,(1994))、アルファ-へリックス領域における自由エネルギー(Free energy in alpha-helical region; Munoz-Serrano, Struct.Funct.Genet.,Vol.20,No.4,301-311,(1994))、極性(Polarity; Zimmerman,et,al., J.Theor.Biol. Vol.21,No.2,170-201,(1968))、側鎖の相互作用(Side chain interaction parameter; Krigbaum-Komoriya, Biochim.Biophys.Acta, Vol.576,No.1,204-228,(1978))、アミノ酸の分配度(Amino acid distribution; Jukes,et,al., Science.,1975,Jun,4;189(4196):50-1)である。
【0032】
続いて、ステップ(2)で生成した数値データを入力変数として階層的クラスタ分析を行い、各メンバーを、N末端又はC末端からの位置毎に物理的性質の数値範囲で規定される複数のクラスタに分類する(ステップ(3))。「階層的クラスタ分析」はクラスタ分析の一つであり、階層的クラスタリングとも呼ばれる。クラスタ分析(クラスタリング)とは、対象間の距離を定義し、距離の近さによって対象を分類する統計手法である。クラスタ分析は、階層的クラスタリングと非階層的クラスタリングに大別される。階層的クラスタリングでは、最短距離法、最長距離法、群平均法、ウォード法などの手法を利用して対象を分類し、階層構造(デンドログラム)を得る。この階層構造では階層の深度に応じてクラスタ数が変動する。即ち、上層から下層に向かってクラスタ数が増大し、クラスタ数は最下層で最大となる。本発明では、好ましくは、クラスタ数が10〜100となる階層を選択する。最適クラスタ数の決定法は、Dunn’s index (J.C.Dunn, Cybernetics, vol. 3, pp. 32-57, 1973)などでも提唱されているため、これを用いることも可能である。本手法では最適階層数は実験規模に反映されるため、現実的な実験規模としての10〜100を選択した。尚、階層的クラスタ分析についてはEisen et al. (1998) PNAS 95:14863が参考になる。
【0033】
次に、ステップ(3)で形成された複数のクラスタの中から、クラスタ毎、所定数のペプチド配列を選抜する(ステップ(4))。即ち、各クラスタから代表を無作為に選抜する。代表の数(即ち所定数)は特に限定されず、好ましくは3〜30、更に好ましくは5〜100である。代表の数が多い方が信頼性の高いデータが得られる。一方で代表の数が多くなれば、以下の機能性アッセイに要する時間、操作などが増大する。
【0034】
続いて、選抜したペプチド配列からなるペプチドを試料として機能性アッセイを行い各ペプチド配列の機能性データを取得する(ステップ(5))。このステップではまず、選抜した各ペプチド配列について、対応するペプチド(当該ペプチド配列を有するペプチド)を公知のペプチド合成法(例えば固相合成法、液相合成法)等を利用して用意する。次に、用意したペプチドを試料として機能性アッセイを行う。「機能性アッセイ」とは、試料ペプチドの機能性を評価可能な試験ないし検定をいう。「機能性の評価」は、機能性の有無の評価と、機能性の程度の評価を含む。「機能性アッセイ」の一例は親和性アッセイである。親和性アッセイとは、標的に対する試料ペプチドの親和性を検出・評価する試験をいい、通常、試料ペプチドと標的との接触操作及びそれに続く洗浄操作を伴う。洗浄操作は非特異的吸着を除去する目的で行う。標的として、特定の生理機能を有する物質(例えば各種受容体、各種リガンド、各種サイトカイン、抗原タンパク質、抗体、酵素、ヒートショックプロテイン、脂質(胆汁酸)、糖構造物、高分子、無機イオン、無機鉱物)、細胞などを用いることができる。ここでの細胞としては哺乳動物(ヒト、サル、ウシ、ウマ、ウサギ、マウス、ラット、モルモット、ハムスター等)の各種細胞、例えば心筋細胞、平滑筋細胞、脂肪細胞、線維芽細胞、骨細胞、軟骨細胞、破骨細胞、実質細胞、表皮角化細胞(ケラチノサイト)、上皮細胞(皮膚表皮細胞、角膜上皮細胞、結膜上皮細胞、口腔粘膜上皮、毛包上皮細胞、口腔粘膜上皮細胞、気道粘膜上皮細胞、腸管粘膜上皮細胞など)、内皮細胞(角膜内皮細胞、血管内皮細胞など)、神経細胞、グリア細胞、脾細胞、膵臓β細胞、メサンギウム細胞、ランゲルハンス細胞、肝細胞、又はこれらの前駆細胞、或いは間葉系幹細胞(MSC)、胚性幹細胞(ES細胞)、胚性生殖細胞(EG細胞)、又は成体幹細胞などを使用することができる。また、正常細胞の他、癌細胞など何らかの異常を来した細胞、或いはHeLa細胞、CHO細胞、Vero細胞、HEK293細胞、HepG2細胞、COS−7細胞、NIH3T3細胞、Sf9細胞などの株化された細胞等を使用することもできる。金属、半導体、無機材料、合成高分子等を材料とする微粒子や基材(基板等)を標的としてもよい。
【0035】
好ましくは、複数の試料ペプチドの機能性を同時に評価可能な機能性アッセイを利用する。これによって操作時間を短縮できる。複数の試料ペプチドを固定化したペプチドチップを利用すればこのような機能性アッセイが可能である。ペプチドチップでは通常、多数のペプチドがペプチド配列毎に区画化されて基板に固定される。このようなペプチドチップを用いれば操作時間の大幅な短縮化を達成可能である。機能性アッセイに供する全ての試料ペプチドが固定化されたペプチドチップを用いることが好ましい。但し、機能性アッセイに供するペプチドが二つ以上のペプチドチップに分かれて固定化されていてもよい。 ペプチドチップを用いることのもう一つの利点は、多数の試料ペプチドについて完全に同一の条件下での比較・評価が行えることである。従って、ペプチドチップを用いれば信頼性の一層高いデータが得られる。
【0036】
次に、ステップ(5)で得られた機能性データに基づき、機能性の順位をクラスタに付与する(ステップ(6))。即ち、機能性アッセイの結果、各クラスタから選抜したペプチド配列に関して得られた機能性データを利用してクラスタに順位付けを行う。例えば、同一のクラスタに属するペプチド配列に関して得られた数値データの総和又は平均をクラスタ間で比較し、機能性の順位を決定することができる。その他、その配列の消化酵素での切断の有無、合成の容易さ、合成のコスト、精製の容易さなどを加味することで、さらに候補の順位を決定することもできる。
ここでの順位付けは、後続のステップ(7)において「上位の順位が付与されたクラスタ」の特定を可能にするために行われる。ステップ(7)において「上位の順位が付与されたクラスタ」が特定できればよいことから、上位の順位のみを付与し、下位の順位についてはその付与を省略することにしてもよい。但し、典型的には全てのクラスタに順位を付与する。
【0037】
上位何位までを「上位の順位」とするかは、基準となる活性を持つ配列を考慮し、これよりも活性が高いものを選択することが望ましい。しかし、その後の有機合成・精製のステップを加味し、合成の容易さ、合成のコスト、精製の容易さなどを考慮して候補を広げて選抜することが望ましい。1位〜n位までを上位とすれば、例えばnは1〜20、好ましくは1〜10、更に好ましくは2〜5である。尚、nが1の場合は上位1位(最上位)のみが、上位の順位に該当することになる。
【0038】
以上のようにしてクラスタに順位を付与した後、上位の順位が付与されたクラスタを規定する物理化学的性質の数値範囲又は該数値範囲を満足するアミノ酸の種類を、高機能ペプチドの特徴を表すルールとして抽出するステップ高機能ペプチドの特徴を表すルールとして抽出する(ステップ(7))。このステップでは始めに、上位の順位が付与されたクラスタを特定する。そして、特定されたクラスタ毎にそれを規定する物理的性質の数値範囲又は該数値範囲を満足するアミノ酸を「高機能ペプチドの特徴を表すルール」として抽出する。その結果、ペプチド配列における位置毎、物理的性質の数値範囲を示すルール(以下、「数値範囲ルール」と呼ぶ)又はペプチド配列における位置毎、該当する1又は2以上のアミノ酸を示すルール(以下、「アミノ酸ルール」と呼ぶ)が得られる。尚、「物理的性質の数値範囲を満足するアミノ酸」は、これに限られるものではないが、通常はタンパク質を構成する20種のアミノ酸の中から選択される。
【0039】
以上の通り本発明では、高機能ペプチドの特徴を表すルールとして、物理的性質の数値範囲の組(セット)からなるルール(数値範囲ルール)、又は該当するアミノ酸の組(セット)からなるルール(アミノ酸ルール)が抽出される。クラスタが複数の物理的性質の数値範囲で規定されていた場合、ペプチド配列のアミノ酸残基数に物理的性質の数を乗じた数の数値範囲からなる数値範囲ルールが抽出される。例えば、ペプチド配列のアミノ酸残基数が3であり、クラスタが13種の物理的性質(等電点、正規化ファンデルワールス体積、βタンパク質のためのアルファへリックスの指標、βタンパク質のためのベータ鎖の指標、タンパク質安定化のための側鎖の貢献度、原子間ポテンシャルに関する知識を基にした安定化尺度、疎水性指標、正規化されたターン頻度、ベータ鎖領域における自由エネルギー、アルファ−へリックス領域における自由エネルギー、極性、側鎖の相互作用、アミノ酸の分配度)の数値範囲で規定されていれば、39(3×13)個の数値範囲からなるルールが得られる。
【0040】
抽出されるルールの数は、上位の順位が付与されたとして特定したクラスタの数に依存する。例えば上位5位までを「上位の順位」とした場合、1位〜5位の各クラスタからそれぞれルールを抽出する。このようにして5個のルール(機能性の高い順に、1位のクラスタから抽出したルール、2位のクラスタから抽出したルール、3位のクラスタから抽出したルール、4位のクラスタから抽出したルール、5位のクラスタから抽出したルール)が得られる。他の例として、上位1位だけを「上位の順位」とした場合には、1位(最高位)のクラスタから抽出したルールのみが得られることになる。
【0041】
本発明の一態様では、ステップ(6)に続いて、以下のステップ(6−1)〜(6−4)を1回又は2回以上実施した後、ステップ(7)を実施する。
(6−1)上位の順位が付与された複数のクラスタを特定するステップ、
(6−2)特定された複数のクラスタより、クラスタ毎、所定数のペプチド配列を選抜するステップ、
(6−3)選抜したペプチド配列からなるペプチドを試料として機能性アッセイを行い、各ペプチド配列の機能性データを取得するステップ、
(6−4)機能性データに基づき、機能性の順位を前記複数のクラスタに付与するステップ。
【0042】
この態様では、ステップ(6)によって上位の順位が付与されたクラスタからルールを抽出するのではなく、上位の順位が付与されたクラスタを用いて再び機能性アッセイとその結果に基づくクラスタの順位付けを行う。これによって、ルールの抽出対象となるクラスタを最適化する。ステップ(6−1)は、ステップ(7)におけるクラスタの特定方法に準じて行えばよい。但し、ステップ(6−1)における「上位の順位」とステップ(7)における「上位の順位」は同一でなくてもよい。即ち、ステップ(6−1)において上位m位(mは整数)までのクラスタを特定することにし、ステップ(7)では上位n位(nはmよりも小さな整数)までのクラスタからルールを抽出する。ここでのmは、例えば1〜20、好ましくは1〜10、更に好ましくは2〜5の整数であり、nはmよりも小さい整数である。具体例を示せば、ステップ(6−1)では上位5位のクラスタを特定し(m=5)、ステップ(7)では上位3位のクラスタからルールを抽出する(n=3)。
【0043】
ステップ(6−2)はステップ(4)に、ステップ(6−3)はステップ(5)に、ステップ(6−4)はステップ(6)にそれぞれ準じて行えばよい。また、ステップ(6−1)〜(6−4)の繰り返し数は特に限定されない。例えば、これら一連のステップを1回〜5回行うことにする。
【0044】
2.学習モデルを利用したルールの抽出法
この態様では学習モデルを利用し、機能性ペプチドを表すルールを抽出する。この態様の抽出法は下記ステップ(1)〜(7)を含む(図6を参照)。
(1)アミノ酸残基数が同一で且つ配列が互いに異なる複数のペプチド配列からなるペプチドライブラリーを用意するステップ、
(2)前記ペプチドライブラリーから複数のペプチド配列を選抜するステップ、
(3)選抜したペプチド配列からなるペプチドを試料として機能性アッセイを行い、各ペプチド配列の機能性データを取得するステップ、
(4)機能性データに基づき、機能性アッセイに供したペプチド配列の中から、複数の高機能配列及び複数の低機能配列を選抜するステップ、
(5)N末端又はC末端からの位置毎に構成アミノ酸の物理的性質を数値化することによって、選抜した高機能配列及び低機能配列を数値データに変換するステップ、
(6)前記数値データを入力変数として、学習モデルを用いた解析を行うステップ、
(7)解析結果より、配列上の1以上の位置について前記物理的性質の条件又は該条件を満足するアミノ酸の種類を示すルールであって、高機能ペプチド配列の特徴を表す1又は2以上のルールを抽出するステップ。
【0045】
ステップ(1)は、上記態様(階層的クラスタ分析を利用した抽出法)のステップ(1)と同一であるのでその説明を省略する。ステップ(1)に続いて、ペプチドライブラリーから複数のペプチド配列を選抜する(ステップ(2))。選抜するペプチド配列の数は特に限定されない。但し、使用するペプチドライブラリーの大きさを考慮し、サンプリング数として適当な数にすることが好ましい。ここでの「適当な数」は、ペプチドライブラリーのメンバー数の例えば1/500000〜1/500、好ましくは1/100000〜1/1000、更に好ましくは1/50000〜1/10000である。尚、選抜するペプチド配列の数が多い方が信頼性の高いデータが得られる。一方、選抜するペプチド配列の数が多くなれば、以下の機能性アッセイに要する時間、操作などが増大する。
【0046】
次に、選抜したペプチド配列からなるペプチドを試料として機能性アッセイを行い、各ペプチド配列の機能性データを取得する(ステップ(3))。当該ステップは上記態様(階層的クラスタ分析を利用した抽出法)のステップ(5)と同一であるのでその説明を省略する。
【0047】
続いて、機能性データに基づき、機能性アッセイに供したペプチド配列の中から複数の高機能配列及び複数の低機能配列を選抜する(ステップ(4))。このステップでは機能性アッセイで得られた、各ペプチド配列の機能性データに基づき、機能性が高いことを示したペプチド配列(便宜上、「高機能ペプチド配列」と呼ぶ)と、機能性が低いことを示したペプチド配列(便宜上、「低機能ペプチド配列」と呼ぶ)を選抜する。このように、高機能ペプチド配列だけでなく、それに対照的な配列である低機能ペプチド配列も選抜する。選抜するペプチド配列の数ないし割合は特に限定されない。例えば、使用した試料ペプチドを機能性の高い順に並べたときの上位1%〜20%、好ましくは上位1%〜10%を高機能ペプチド配列として選抜し、下位1%〜20%、好ましくは下位1%〜10%を低機能ペプチド配列として選抜する。高機能ペプチド配列の数と低機能ペプチド配列の数は同一でなくてもよいが、これを同一にすれば以降の学習モデルによる解析の精度及び信頼度が高められる。
【0048】
ステップ(4)に続いて、N末端又はC末端からの位置毎に構成アミノ酸の物理化学的性質を数値化することによって、選抜した高機能配列及び低機能配列を数値データに変換する(ステップ(5))。このステップは、選抜した各ペプチド配列をFNNで解析可能な形態に変換するものである。このステップによって、選抜した各ペプチド配列は、位置毎に特定の性質に関する数値が関連付けられたデータとなる。
【0049】
上記態様(階層的クラスタ分析を利用した抽出法)の場合と同様、ここでの「物理的性質」とはサイズ(大きさ)、疎水度、電荷、等電点など、アミノ酸の分類に利用される性質のことである。また、上記態様の場合と同様、好ましくは、等電点、正規化ファンデルワールス体積、βタンパク質のためのアルファへリックスの指標、βタンパク質のためのベータ鎖の指標、タンパク質安定化のための側鎖の貢献度、原子間ポテンシャルに関する知識を基にした安定化尺度、疎水性指標、正規化されたターン頻度、ベータ鎖領域における自由エネルギー、アルファ−へリックス領域における自由エネルギー、極性、側鎖の相互作用、及びアミノ酸の分配度からなる群より選択される2種以上の性質を併用し、更に好ましくは、これら13種の全てを併用する。ここで特に言及しない事項については、上記態様(階層的クラスタ分析を利用した抽出法)のステップ(2)における、対応する説明が援用される。
【0050】
次に、ステップ(5)で得られた数値データを入力変数として、学習モデルを用いた解析を行う(ステップ(6))。ルール(規則)を抽出できる限り、ここでの解析法の種類は特に限定されない。解析法の例として、決定木による解析、ファジィニューラルネットワーク解析を挙げることができる。中でもファジィニューラルネットワーク解析が好ましい。ファジーニューラルネットワーク解析を採用した場合、予測モデルが構築される。ここで「ファジィニューラルネットワーク」とは、人工ニューラルネットワーク(Artificial Neural Network; ANN)とファジィ推論を組み合わせた方法をいい、ファジイ推論の欠点であるメンバーシップ関数の決定を人間に頼るという部分を回避すべく、ANNをファジィ推論に組み込み、その自動決定を行う方法である。学習機械のひとつであるANN(図7)は、生体の脳における神経回路網を数学的にモデル化したものであり、以下の特徴を持つ。ANNにおける学習は、目的の出力値(教師値)をもつ学習用のデータ(入力値; X)を用いて、バックプロパゲーション法(Back propagation; BP法)により教師値と出力値(Y)の誤差が小さくなるように、図7における○と○をつなぐ回路における結合荷重を変え、その出力値が教師値に近づくようにモデルを構築する過程であり、このBP法を用いれば、ANNは学習により自動的に知識を獲得することができる。そして、最終的に学習に用いていないデータを入力することにより、そのモデルの汎用性を評価することができる。従来、メンバーシップ関数の決定は、人間の感覚に頼っていたが、上で述べたようなANNをファジイ推論に組み込むことで自動的なメンバーシップ関数の同定が可能になる。これがFNNである。ANNと同様に、BP法を用いることによりネットワークに与えられた入出力関係を、結合荷重を変化させることで自動的に同定しモデル化することができる。FNNは、学習後のモデルを解析することでファジィ推論のように人間に理解しやすい言語的なルールとして知識を獲得できるという特徴をもっている。つまり、FNNは、その構造、特徴から、アミノ酸の性質を表した数値のような変数の組み合わせにおける最適なファジィ推論の組み合わせを自動決定し、ペプチドの親和性に関する推定とそのルールの生成を同時に行うことができる。
【0051】
FNNの構造は入力層、シグモイド関数に含まれるパラメータWc、Wgを決定するメンバーシップ関数部分(前件部)、Wfを決定し、入力と出力の関係をルールとして取り出すことが可能なファジィルール部分(後件部)、出力層の4層から成り立っている(図8)。FNNのモデル構造を決定する結合荷重にはWc、Wg、Wfがある。結合荷重Wcは、メンバーシップ関数に用いられるシグモイド関数の中心位置、Wgは中心位置での傾きを決定する(図9)。結合荷重Wfは各ファジイ領域の推定結果に対する寄与を表しており、Wfよりファジィルールを導くことができる。
【0052】
FNN解析におけるファジィルールの作成には結合荷重のひとつであるWf値が用いられる。Wf値が正の値で大きいと、そのユニットは「機能性が高い」と判定されることに対する寄与が大きく、そのルールに当てはまったアミノ酸を有するペプチドは「機能性が高い」と判断される。Wf値が負の値で小さいと、そのユニットは「機能性が低い」と判定されることに対する寄与が大きく、そのルールに当てはまったアミノ酸を有するペプチドは「機能性が低い」と判断される。
【0053】
図10に2つの入力で、small(S)とbig(B)の2つのルールの分割を用いたときのFNNの構造を示した。ファジールール部分であるSS(1入力目がsmall、2入力目がsmall)、SB、BS、BBに入る値は、その4つのノードにおける値の和が1になるように規格化される。そして、それぞれの値にWf(SS)、Wf(SB)、Wf(BS)、Wf(BB)をかけ、それらの和が出力値yになる。2つの入力、small(S)とbig(B)の2分割のときの、ファジールールの例を図11に示す。
【0054】
学習モデルを用いた解析の結果より、配列上の1以上の位置について前記物理的性質の条件又は該条件を満足するアミノ酸の種類を示すルールであって、高機能ペプチド配列の特徴を表す1又は2以上のルールを抽出する(ステップ(7))。FNN解析を利用した場合には、構築された予測モデルよりルールを抽出することになる。
【0055】
抽出されるルールは一つとは限らず、場合によっては複数のルールを抽出できる。尚、ペプチド配列上の全ての位置について物理的性質の条件又は該条件を満足するアミノ酸が示されとは限らない。換言すれば、抽出されるルールでは、最低一つの位置について、採用した物理的性質の条件又は該条件を満足するアミノ酸が示されている。
【0056】
ここで、本発明の一態様においては、ステップ(7)の後、以下のステップ(8)を行う。
(8)ステップ(1)で用意したペプチドライブラリーの内、以前の選抜の際に選抜されなかったペプチド配列の集合の中から、抽出した前記ルールに適合する複数のペプチド配列を選抜した後、ステップ(3)〜(7)を行うステップ。
【0057】
このステップ(8)ではまず、抽出したルールを用いて複数のペプチド配列を選抜する。このとき、ステップ(1)で用意したペプチドライブラリー全体から無作為に複数のペプチド配列を抽出するのではなく、当該ペプチドライブラリーの内、以前の選抜の際に選抜されなかったペプチド配列の集合の中から、抽出したルールに適合する複数のペプチド配列を抽出する。例えば、メンバー数が600000のペプチドライブラリーを用意し、ステップ(2)で2000個のペプチド配列を選択したのであれば、当該2000個のペプチド配列を除外した残りの598000個のペプチド配列を、抽出したルールに照合し、ルールに適合するペプチド配列を選抜する。尚、「ルールに適合する」とは、「ルールを満足する」と同義であって、ルールが規定する物理的性質の条件の全てを満たしている状態をいう。
選抜するペプチド配列の数は特に限定されないが、ステップ(2)と同様に、好ましくはサンプリング数として適当な数とする。従って、ここで選択するペプチド配列の数は、最初に用意したペプチドライブラリーから以前の選抜の際に選抜されたペプチド配列を除外した集合のメンバー数の例えば1/500000〜1/500、好ましくは1/100000〜1/1000、更に好ましくは1/50000〜1/10000である。
【0058】
ステップ(8)を行うことによりルールの最適化が進む。即ち、より信頼度の高いルールを抽出できる。ルールの更なる最適化を図るため、ステップ(8)を繰り返すとよい。繰り返し数は特に限定されない。例えば、ステップ(8)を1〜5回繰り返す。
【0059】
3.ルールの最適化
階層的クラスタ分析を利用したルールの抽出法で得たルールと、学習モデルによる解析を利用したルールの抽出法で得たルールを比較し、共通部分を新たなルールとして抽出することもできる。このようにすればルールの最適化が進み、その結果、信頼度の高いルールを生成することができる。他の手法(例えば、図1に示したAの手法)で得たルールも併用してルールの最適化を行うことにしてもよい。
【0060】
<機能性ペプチドの設計法>
本発明の第2の局面は機能性ペプチドの設計法に関する。本発明の設計法によれば、機能性ペプチドとして有望なペプチドを表す配列情報が得られる。本発明の設計法は、膨大な数の候補の中から効率的に有効なペプチドを選抜できる点、様々な長さのペプチドを設計可能である点、既知の機能性ペプチドの配列に依存しない全く新しいペプチドを見出すことが可能である点等、数多くの利点を有する。
【0061】
本明細書において「機能性ペプチドを設計すること」と「機能性ペプチドとして有望なペプチドを表す配列情報を得ること」は同義である。以下、本発明の設計法について、1.ルールを利用した設計法、2.ルールの抽出の際に形成されたクラスタを利用した設計法、3.ルールを抽出する際に構築された予測モデルを利用した設計法、及び4.ペプチド配列の連結を利用した設計法に分けて説明する。また、5.では、機能性の一層高いペプチド配列を設計する方法に言及する。これらの設計法は、5.におけるアッセイを除いて、コンピュータ上で実施することができる。
【0062】
1.ルールを利用した設計法
本発明の一態様では、第1の局面の発明によって抽出されたルールに従ってペプチド配列を設計する。前述の通り、階層的クラスタ分析を利用した抽出法によれば、数値範囲ルール(ペプチド配列における位置毎、物理的性質の数値範囲を示すルール)又はアミノ酸ルール(ペプチド配列における位置毎、該当する1又は2以上のアミノ酸を示すルール)が抽出される。前者のルールに従ってペプチド配列を設計するのであれば、位置毎、そこに示された物理的性質の数値範囲の全部を満たすアミノ酸を選択すればよい。他方、後者のルールに従ってペプチド配列を設計する場合は、位置毎、該当するアミノ酸として示されたアミノ酸の中からいずれかのアミノ酸を選択すればよい。該当するアミノ酸が1つの場合は当該アミノ酸を選択する。以上の通り、ルールに従ってアミノ酸を選択することにより、機能性ペプチドとして有望な配列情報が得られる。
【0063】
学習モデルによる解析を利用した抽出法によって抽出されたルールの場合も同様に、ルールに従って各位置のアミノ酸を選択し、ルールに適合するペプチド(機能性ペプチドとして有望なペプチド)の配列情報を得る。但し、当該ルールの場合は、ペプチド配列を構成する全ての位置ついて選択の基準(条件)が示されるとは限らない。選択の基準が示されない位置については任意のアミノ酸を選択すればよい。
【0064】
本発明の他の態様では、上記態様のようにルールに基づくアミノ酸の選択によってペプチド配列を構築するのではなく、複数のペプチド配列の中からルールに適合するものを選択する。即ち、複数の候補ペプチド配列を用意した後、これらの候補ペプチド配列をルールに照合し、そしてルールに適合するペプチド配列を選択する。このようにして、機能性ペプチドとして有望なペプチド配列を候補ペプチド配列の中から特定する。尚、階層的クラスタ分析を利用した抽出法によって得られた数値範囲ルール、又は学習モデルによる解析を利用した抽出法によって得られた、物理的性質の条件を示すルールを利用する場合は候補ペプチド配列を直接ルールに照合することができないことから、照合可能な数値データに各候補ペプチド配列を変換した上で照合する。即ち、(1)複数の候補ペプチド配列を用意するステップ、(2)N末端又はC末端からの位置毎に構成アミノ酸の物理的性質を数値化することによって前記複数の候補ペプチド配列をそれぞれ数値データに変換するステップ、(3)各数値データをルールに照合するステップ、及び(4)ルールに適合する候補ペプチド配列を選抜するステップが行われることになる(図12を参照)。
【0065】
2.ルールを抽出する際に形成されたクラスタを利用した設計法
階層的クラスタ分析を利用した抽出法を実施すると、機能性の高い順に順位が付与された複数のクラスタが形成される。上位の順位が付与されたクラスタに含まれるペプチド配列は機能性が高いことになる。そこで本発明の一態様では、階層的クラスタ分析を利用した抽出法によって得られた、上位の順位が付与されたクラスタに含まれる1又は2以上のペプチド配列を高機能ペプチド配列として選択する。例えば、1位(最高位)のクラスタに10個のペプチド配列が含まれていた場合、1〜10個のペプチド配列を、高機能ペプチドを表す配列として選択することができる。1位(最上位)のクラスタのみからペプチド配列を選択するのではなく、上位の順位が付与された複数のクラスタ(例えば上位3位までのクラスタ)からペプチド配列を選択することにしてもよい。
【0066】
3.ルールを抽出する際に構築された予測モデルを利用した設計法
FNN解析を利用した抽出法を実施すると予測モデル(FNNモデルとも呼ばれる)が構築される。本発明の一態様では当該予測モデルを利用して高機能ペプチドを設計する。具体的には、(1)複数の候補ペプチドを用意するステップ、(2)N末端又はC末端からの位置毎に構成アミノ酸の物理的性質を数値化することによって、複数の候補ペプチド配列をそれぞれ数値データに変換するステップ、(3)FNN解析を利用した抽出法をおいてルールの抽出の際に構築された予測モデルを用い、前記数値データを入力変数としてFNN解析を行うステップであって、該FNN解析において、(i)ルールに適合するペプチド配列の選抜、(ii)選抜されたペプチド配列の予測値の評価、及び(iii)予測値の高いペプチド配列の選抜が順に行われるステップ、を行い、高機能ペプチドとして有望なペプチドを表す配列情報を得る(図13を参照)。
【0067】
この態様に特徴的なステップ(3)では、FNNを利用した一連の情報処理が行われる。まず、ルールを利用した判断・評価(上記(i)に相当する)が行われる。この処理の結果、ルールに適合するものとして比較的多数のペプチド配列が選抜される。次に、選択されたペプチド配列に対して予測値の判断・評価(上記(ii)及び(iii)に相当する)が行われる。この処理ではペプチド配列の数値データを予測モデル、即ち近似曲線に代入することによって機能性を予測し、予測値の高いペプチド配列を選抜する。
【0068】
予測値の判断・評価に加えて、信頼度の判断・評価を行うことにし、最終的に得られる配列情報の信頼度(確からしさ)を向上させることが好ましい。信頼度の評価・判断では、「入力値の近傍に学習データがある場合には、近似曲線として信頼できる(又は信頼度が高い)範囲での予測であり、入力値の近傍に学習データが無い場合には、近似曲線として信頼できない(又は信頼度が低い)範囲での予測である」という基準に基づく評価・判断が行われることになる。
【0069】
4.ペプチド配列の連結を利用した設計法
本発明は更に、ペプチド配列の連結を利用した設計法を提供する。当該設計法によれば、より長いペプチドを設計することができる。以下、図14及び15を参照しながら説明する。
【0070】
この設計法では最初にペプチド配列の集合を用意する(ステップ(1))。ペプチド配列の集合として以下の(a)〜(d)のいずれかを用いる。
(a)階層的クラスタ分析を利用した抽出法によって得られた、上位の順位が付与されたクラスタに含まれるペプチド配列の集合、
(b)階層的クラスタ分析を利用した抽出法によって得られたルールに適合するペプチド配列の集合、
(c)学習モデルによる解析(例えばFNN解析)を利用した抽出法によって得られたルールに適合するペプチドの集合、
(d)(a)〜(c)からなる群より選択される2以上の集合を結合した集合。
【0071】
集合(a)として次の集合を用いてもよい。即ち、メンバーのアミノ酸残基数が異なる複数のペプチドライブラリーを用意し、各ペプチドライブラリーを用いてクラスタ分析を利用した抽出法を行うことにし、各回について得られた、上位の順位が付与されたクラスタに含まれるペプチド配列の集合を全て連結して得られる集合である。
【0072】
一方、集合(b)として次の集合を用いてもよい。即ち、メンバーのアミノ酸残基数が異なる複数のペプチドライブラリーを用意し、各ペプチドライブリーを用いてクラスタ分析を利用した抽出法を行ってルールを得た後、抽出されたルール毎、適合するペプチド配列の集合を作製し、最後に全集合を連結して得られる集合である。
【0073】
また、集合(c)として次の集合を用いてもよい。即ち、メンバーのアミノ酸残基数が異なる複数のペプチドライブラリーを用意し、各ペプチドライブリーを用いて学習モデルによる解析(例えばFNN解析)を利用した抽出法を行ってルールを得た後、抽出されたルール毎、適合するペプチド配列の集合を作製し、最後に全集合を連結して得られる集合である。
集合(d)を用いる場合においてもペプチド配列の長さを統一する必要はない。
【0074】
次に、用意した集合の中から、共通する部分配列(以下、「共通部分配列」と呼ぶ)を認める第1ペプチド配列及び第2ペプチド配列を選抜する(ステップ(2))。但し、共通部分配列よりもC末端側のアミノ酸の数は、第1ペプチド配列よりも第2ペプチド配列の方が多いものとする。共通部分配列の長さは、アミノ酸残基数が2以上である限り特に限定されない(図15の(A))。
【0075】
続いて、共通部分配列よりもC末端側のアミノ酸を第1ペプチド配列から除去して得られる第1部分配列と、共通部分配列及び共通部分配列よりもN末端側のアミノ酸を第2ペプチド配列から除去して得られる第2部分配列とを、第1部分配列がN末端側に配置されるように連結する(ステップ(3))。これによって、第1ペプチド配列及び第2ペプチド配列よりも長いペプチド配列が得られる(図15の(A))。
【0076】
ここで、第1ペプチド配列では共通部分配列がC末端アミノ酸を含み、第2ペプチド配列では共通部分配列がN末端アミノ酸を含むことが好ましい(図15の(B)を参照)。つまり、第1ペプチド配列のC末端側の部分配列と第2ペプチド配列のN末端側の部分配列が共通することが好ましい。上記のように連結した際、より長いペプチド配列が得られるからである。
【0077】
一態様では、ステップ(1)において集合(a)を用意することにし、ステップ(2)では、第1ペプチド配列と対をなす第2ペプチド配列の候補が二つ以上存在する場合には、より上位の順位が付与されたクラスタに属するペプチド配列を優先して第2ペプチド配列に用い、第2ペプチド配列と対をなす第1ペプチド配列の候補が二つ以上存在する場合には、より上位の順位が付与されたクラスタに属するペプチド配列を優先して第1ペプチド配列に用いる。
【0078】
他の一態様では、ステップ(1)において集合(b)を用意することにし、ステップ(2)では、第1ペプチド配列と対をなす第2ペプチド配列の候補が二つ以上存在する場合には、より上位の順位が付与されたクラスタのルールに適合するペプチド配列の方を優先して第2ペプチド配列に用い、第2ペプチド配列と対をなす第1ペプチド配列の候補が二つ以上存在する場合には、より上位の順位が付与されたクラスタのルールに適合するペプチド配列の方を優先して第1ペプチド配列に用いる。
【0079】
以上の二つの態様のように、より上位のクラスタから候補を選択することは、一層機能性が高いペプチド配列の設計を可能にする。
【0080】
より長いペプチド配列を設計するためには、ステップ(3)で得られたペプチド配列を第1ペプチド配列又は第2ペプチド配列として、ステップ(2)と同様の操作を行えばよい。例えば、ステップ(3)で得られたペプチド配列を第1ペプチド配列とする場合には、第2ペプチド配列に該当する配列、即ち第1ペプチド配列と一部で共通する配列(但し、共通部分配列よりもC末端側のアミノ酸の数は、第1ペプチド配列よりも第2ペプチド配列の方が多い)を、用意したペプチド配列の集合の中から選抜した後、ステップ(2)と同様のステップを行う。必要に応じて、当該操作を繰り返す。
【0081】
5.機能性ペプチドの最適化
本発明の一態様では、一層好ましい機能性ペプチドを設計するため、以下の(1)〜(3)のいずれかの手段を採用し、機能性ペプチドの絞り込み(最適化)を行う。
(1)1.〜4.の設計法の併用
(2)合成効率、合成コスト、精製効率、特性((溶解度、熱安定性、pH安定性、立体構造)等の観点による選抜
(3)細胞や動物等を利用したアッセイによる選抜
【0082】
以上の各手段は互いに排他的なものではなく、二つ以上を併用することも可能である。他の手段に加えて(3)の手段を採用する場合には、効率や費用などの点から、(3)の手段による選抜は最後に行うとよい。1.〜4.の設計法の二つ以上を並行して行うことにし、各方法で設計されたポリペプチド配列の中から、(2)及び/又は(3)の手段を利用して、一層好ましい機能性ペプチドを選抜することにしてもよい。
【0083】
<機能性ペプチドの調製法>
上記の設計法によって設計したペプチドを実際に調製すれば機能性ペプチドが得られる。このように本発明は、上記の設計法で設計されたペプチドを調製するステップを含む、機能性ペプチドの調製法も提供する。ペプチドの調製には、公知のペプチド合成法(例えば固相合成法、液相合成法)が利用できる。尚、自動ペプチド合成機を利用すれば容易かつ迅速なペプチド合成が可能である。
【0084】
遺伝子工学的手法を利用してペプチドを調製することにしてもよい。即ち、設計したペプチド配列をコードする核酸を適当な宿主細胞に導入し、形質転換体内で発現されたペプチドを回収することにより、目的のペプチドを得ることにしてもよい。回収したペプチドは必要に応じて精製される。回収したペプチドを適当な置換反応に供し、所望のペプチド修飾体に変換することもできる。
【0085】
<ポリペプチド又はポリペプチド含有組成物の評価法>
本発明の抽出法などを利用すると、特定の機能性を発揮し得るペプチドとして多数のペプチドを同定可能である。即ち、多数の機能性ペプチドの配列情報を得ることができる。多数の機能性ペプチドの配列情報があれば、それを利用してポリペプチドを評価(スコア化)することができる。具体的には、同定した機能性ペプチドを包括的に捉え、各機能性ペプチドの含有量をポリペプチド間で比較すれば、当該機能に関する各ポリペプチドの有効性を点数(スコア)として示すことが可能となる。そこで本発明は、更なる局面として、ポリペプチド又はポリペプチド含有組成物の評価法(スコア化法)を提供する。本発明の評価法を利用すれば、ポリペプチド又はポリペプチド含有組成物を機能性という新たな観点から特定したり、分類したりすることができる。また、機能性の高いポリペプチド又はポリペプチド含有組成物の同定や創出も可能となる。
【0086】
本発明における「評価」とは、ポリペプチド又はそれを含有する組成物の「特定の機能に関する有効性」を調べることをいう。本発明の評価法を実施すると、典型的には、評価対象の機能性が点数(スコア)で表される。そこで、ここでの「評価」のことを「スコア化」とも呼ぶことがある。「ポリペプチド含有組成物」とは、成分の一つとしてポリペプチドを含む組成物である。例えば穀類や豆類等を原料とする食品(栄養補助食品や飲料なども含む)や食品添加物などが「ポリペプチド含有組成物」に該当する。
【0087】
1.ルールとの照合による評価
本発明の評価法では以下のステップ(1)〜(6)を行う(図16を参照)。
(1)ポリペプチドの配列を用意するステップ、
(2)本発明の抽出法によって抽出された1又は2以上のルールに対してそれぞれスコアを関連付けるステップ、
(3)前記ルールとの照合が可能な一定の長さに前記ポリペプチドの配列を断片化するステップ、
(4)各断片配列を前記ルールと照合し、適合性を判定するステップ、
(5)ルールに適合すると判定された断片配列に対して、該ルールに関連付けられたスコアを付与するステップ、
(6)付与された全てのスコアを積算して総スコアを算出するステップであって、該総スコアが前記ポリペプチドの機能性を表す指標となるステップ。
【0088】
まず、ポリペプチドの配列を用意する(ステップ(1))。ポリペプチドは、評価対象であるポリペプチド自体、又は評価対象である組成物が含有するポリペプチドである。ここでのポリペプチドの例を挙げると、大豆タンパク質のβコングルシニンや、小麦タンパク質のグルテン、乳タンパク質のカゼイン、卵白タンパク質のオボアルブミンである。
評価対象が組成物であり且つ複数のポリペプチドを含有する場合には、各ポリペプチドをここでのポリペプチドとして本発明の評価法を実施し、得られた各結果を総合して当該組成物の機能性を評価することもできる。
【0089】
続くステップ(2)では、本発明の抽出法、即ち階層的クラスタ分析を利用した抽出法又は学習モデルによる解析(例えばFNN解析)を利用した抽出法によって抽出されたルール(前者を「クラスタ機能性ルール」、後者を「学習モデル機能性ルール」と呼ぶ)にスコア(点数)を関連づける。用いるルールが一つであれば、当該ルールに任意のスコア(例えば、1、10、20など)を関連付ければよい。用いるルールが複数の場合は、それぞれのルールが示す機能性の程度を考慮して各ルールにスコアを関連づける。例えば、階層的クラスタ分析を利用した抽出法によって上位5位のクラスタからそれぞれルールを抽出した場合であって、これら5個のルールを用いるのであれば、1位のクラスタから抽出したルールに100、2位のクラスタから抽出したルールに50、3位のクラスタから抽出したルールに20、4位のクラスタから抽出したルールに10、5位のクラスタから抽出したルールに5、のように、クラスタの順位とスコアが対応するようにスコアを関連付ける。クラスタ機能性ルールと学習モデル機能性ルールを併用してもよい。尚、どのような勾配でスコアを関連付けるべきかは多変量解析で決定するとよい。
【0090】
一方、ルールとの照合が可能な一定の長さにポリペプチド配列を断片化する(ステップ(3))。例えば、アミノ酸残基数が3のペプチドに関するルールを用いるのであれば、ポリペプチド配列を断片化し、アミノ酸残基数が3のペプチド配列(即ちトリペプチド)の集合にする。以下、断片化の具体的な方法について、3アミノ酸の長さ(即ちトリペプチド配列)に断片化する場合を例として説明する。断片化の方法は二つに大別される。第一の方法(図17の(A))では、N末端(又はC末端)から3アミノ酸毎に区切り、トリペプチド配列の集合を得る。第二の方法(図17の(B))では、N末端(又はC末端)の3アミノ酸を最初の断片とし、N末端(又はC末端)から1アミノ酸又は2アミノ酸だけC末端側にずらした位置からの3アミノ酸を次の断片とする。以下同様に繰り返す。このようにしてトリペプチド配列の集合を得る。
【0091】
続いて、ステップ(3)で得た各断片配列をルールと照合し、適合性を判定する(ステップ(4))。複数のルールを用いた場合は、各断片配列を全てのルールに照合し、各ルールに対する適合性を判定する。尚、「適合性を判定する」とは、断片配列がルールを満足するか否かを判定することを意味する。
【0092】
次に、ルールに適合すると判定された断片配列に対して、該ルールに関連付けられたスコアを付与する(ステップ(5))。例えば、スコア10の第1ルールとスコア1の第2ルールを用いた場合、第1ルールに適合することが判明した断片配列に対しては第1ルールに関連付けられたスコア10を付与し、第2ルールに適合することが判明した断片配列に対しては第2ルールに関連付けられたスコア1を付与する。
【0093】
続いて、付与された全てのスコアを積算して総スコアを算出する(ステップ(6))。例えば、スコア10が付与された断片が10個、スコア1が付与された断片が10個存在していた場合、(10×10)+(1×10)=110が総スコアとなる。本発明では、このようにして算出した総スコアを、ポリペプチドの機能性を表す指標とする。即ち、総スコアの大きさによってポリペプチドの機能性を判断する。具体的には例えば、総スコアが大きければ機能性が高いと判断し、総スコアが小さければ機能性が低いと判断する。あるポリペプチドの総スコアを予め算出しておき、当該総スコアを基準としてポリペプチドの総スコアを評価することにしてもよい。
【0094】
好ましい一態様では、評価の妥当性ないし正確性を高めるため、ポリペプチド配列中に存在するプロテアーゼ切断部位を考慮した補正を行う。具体的には、以下の(A)〜(C)のいずれかの方法により補正する。
(A)ステップ(3)で生じた断片配列の中から、プロテアーゼ切断部位を内在する断片配列を除いた後にステップ(4)を行う。
(B)ステップ(6)において、プロテアーゼ切断部位を内在する断片配列以外の断片配列に付与されたスコアのみを積算する。
(C)ステップ(6)において、付与された全スコアを積算した後、ステップ(3)で生じた断片配列の中から、プロテアーゼ切断部位を内在する断片配列に付与されたスコアを除算する。
【0095】
(A)はスコア化の前に補正する方法、(B)はスコア化の段階で補正する方法、(C)はスコアの積算後に補正する方法である。(A)の場合、プロテーゼ切断部位を内在するがために生じない断片配列をスコア化の対象から除外する。(B)の場合、実際に生ずる断片配列に付与されたスコアのみを積算する。(C)の場合、スコアを積算した後に、プロテーゼ切断部位を内在するがために生じない断片配列に付与されたスコアを差し引く。いずれの方法を採用しても、実際に生ずる断片配列に付与されたスコアのみを積算した総スコアが得られることになり、評価の妥当性ないし正確性が向上する。尚、ここでの用語「プロテアーゼ」は広義のプロテーゼを意味し、エキソペプチダーゼ、エンドペプチダーゼ、プロテイナーゼなど、ポリペプチド鎖に作用してペプチド結合を加水分解する各種酵素を包含する。但し、本発明においては、全てのプロテーゼについてその切断部位を考慮する必要はなく、ポリペプチドの用途に応じて必要と考えられるプロテアーゼの切断部位のみを考慮すればよい。例えばヒト生体への投与ないし摂取が予定されているポリペプチド(医薬や栄養補助食品の成分としてのポリペプチド、食品中に含まれるタンパク質など)を評価する場合、ヒト生体内で作用し得るプロテアーゼ(ポリペプチドの代謝経路に存在するプロテアーゼ)についてのみ、その切断部位を考慮すればよい。ヒト生体内で作用し得るプロテアーゼの例としてペプシン、トリプシン、キモトリプシンが挙げられる。「ヒト生体内で作用し得るプロテアーゼ」は、ヒト生体に内在するプロテアーゼに限られない。食品等の摂取によりヒト体内に取り込まれるプロテアーゼ(外来性のプロテアーゼ)も「ヒト生体内で作用し得るプロテアーゼ」に該当する。
【0096】
2.上位クラスタに含まれるペプチド配列を用いた評価
この態様では、階層的クラスタ分析を利用した抽出法を行った際に得られるクラスタを利用してポリペプチド又はポリペプチド含有組成物を評価する。この態様の評価法は以下のステップ(1)〜(4)を含む(図18を参照)。尚、特に言及しない事項については、上記態様(1.ルールとの照合による評価)の対応する説明を援用する。
(1)ポリペプチドの配列を用意するステップ、
(2)階層的クラスタ分析を利用した抽出法によって得られた、上位の順位が付与されたクラスタに含まれる各ペプチド配列に対して、同一のクラスタに含まれるペプチド配列は各々相同性の高いスコアとなり且つクラスタの順位に対応したスコアとなるように、スコアを関連付けるステップ、
(3)スコアを関連付けた各ペプチド配列をそれぞれ前記ポリペプチドの配列と照合し、配列が一致する領域の数を調べるステップ、
(4)ステップ(3)で判明した前記領域の数と、ステップ(2)で関連付けたスコアとを乗ずることによってペプチド配列毎にスコアに算出した後、全てのスコアを積算して総スコアを算出するステップであって、該総スコアが前記ポリペプチドの機能性を表す指標となるステップ。
【0097】
まず、ペプチド配列を用意する(ステップ(1))。このステップは上記態様(1.ルールとの照合による評価)の場合と同一であるためその説明を省略する。
【0098】
次に、階層的クラスタ分析を利用した抽出法によって得られた、上位の順位が付与されたクラスタに含まれる各ペプチド配列に対してスコアを関連付ける(ステップ(2))。このとき、同一のクラスタに含まれるペプチド配列は各々相同性の高いスコアとする。可溶性度、合成容易度、価格などを考慮して各ペプチドのスコアを決定するとよい。一例では、同一のクラスタに含まれるペプチド配列は全て同一のスコアとする。一方、クラスタの順位に対応したスコアとなるようにする。即ち、順位の高いクラスタに含まれるペプチド配列の方が、順位が低いクラスタに含まれるペプチド配列よりも高いスコアとなるようにする。例えば、上位5位までのクラスタを用いるのであれば、1位のクラスタに含まれるペプチド配列に100、2位のクラスタに含まれるペプチド配列に50、3位のクラスタに含まれるペプチド配列に20、4位のクラスタに含まれるペプチド配列に10、5位のクラスタに含まれるペプチド配列に5、のように、クラスタの順位とスコアの高低が対応するようにスコアを関連付ける。尚、どのような勾配でスコアを関連付けるべきかは多変量解析で決定するとよい。
【0099】
続いて、スコアを関連付けた各ペプチド配列をそれぞれポリペプチド配列と照合し、配列が一致する領域(一致領域)の数を調べる(ステップ(3))。そして、一致領域の数と、各ペプチド配列に関連付けたスコアとを乗ずることによってペプチド配列毎にスコアを算出した後、全てのスコアを積算して総スコアを算出する(ステップ(4))。このようにして算出した総スコアがポリペプチドの機能性を表す指標となる。
【0100】
総スコアの算出方法(ステップ(4))の具体例を示す。1位のクラスタ(スコア100)が第1ペプチド配列と第2ペプチド配列からなり、ポリペプチド配列中に第1ペプチド配列と一致する領域が1箇所、第2ペプチド配列と位置する領域が2箇所含まれており、2位のクラスタ(スコア50)が第3ペプチド配列及び第4ペプチド配列からなり、ポリペプチド配列中に第3ペプチド配列と一致する領域が1箇所、第4ペプチド配列と位置する領域が0箇所含まれていた場合、次のように総スコアを算出する。
(1×100)+(2×100)+(1×50)+(0×50)=350
【0101】
上記態様(1.ルールとの照合による評価)と同様、この態様の評価法においても、評価の妥当性ないし正確性を高めるため、ポリペプチド配列中に存在するプロテアーゼ切断部位を考慮した補正を行うことが好ましい。補正は、照合(ステップ(3))又は総スコアの算出(ステップ(4))の際に行えばよい。
【0102】
3.学習モデルを用いた評価法
更なる一態様では、学習モデルによる解析(例えばFNN解析)を利用した抽出法を行った際の学習モデル(FNN解析の場合は、構築された予測モデル)を利用してポリペプチド又はポリペプチド含有組成物を評価する。この態様の評価法は以下のステップ(1)〜(5)を含む(図19を参照)。尚、特に言及しない事項については、上記態様(1.ルールとの照合による評価)の対応する説明を援用する。
(1)ポリペプチドの配列を用意するステップ、
(2)学習モデルによる解析を利用した抽出法においてルールを抽出する際に用いた学習モデルで解析可能な一定の長さに前記ポリペプチドの配列を断片化するステップ、
(3)N末端又はC末端からの位置毎に構成アミノ酸の物理化学的性質を数値化することによって、各断片配列を数値データに変換するステップ、
(4)前記学習モデルを用い、前記数値データを入力変数として、学習モデルによる解析を行い、各断片配列の予測機能度を算出するステップ、
(5)算出された予測機能度を積算するステップであって、得られた総予測機能度が前記ポリペプチドの機能性を表す指標となるステップ。
【0103】
まず、ペプチド配列を用意する(ステップ(1))。このステップは上記態様(1.ルールとの照合による評価)の場合と同一であるためその説明を省略する。
【0104】
次に、学習モデルによる解析を利用した抽出法においてルールを抽出する際に用いた学習モデル(FNN解析の場合は、構築された予測モデル)で解析可能な一定の長さにポリペプチド配列を断片化する(ステップ(2))。即ち、ルールの抽出に利用したペプチド配列(ペプチドライブラリーのメンバー)のアミノ酸残基数に一致するように断片化する。断片化の方法等は、上記態様(1.ルールとの照合による評価)の場合と同様である。
【0105】
続いて、N末端又はC末端からの位置毎に構成アミノ酸の物理化学的性質を数値化することによって、各断片配列を数値データに変換する(ステップ(3))。このステップは、学習モデルによる解析を利用した抽出法におけるステップ(5)に準ずる。
【0106】
次に、学習モデル(FNN解析の場合は、構築された予測モデル)を用い、数値データを入力変数として学習モデルによる解析を行い、各断片配列の予測機能度を算出する(ステップ(4))。即ち、各断片配列を学習モデルによる解析に供し、予測機能度を算出させる。その後、算出された予測機能度を積算する(ステップ(5))。この態様では、このようにして算出した総予測機能度を、ポリペプチドの機能性を表す指標とする。即ち、総予測機能度の大きさによってポリペプチドの機能性を判断する。
【0107】
4.胆汁酸結合能の評価
後述の実施例に示す通り、本発明者らは複数の胆汁酸結合ペプチドの同定に成功した。そこで、本発明は更なる態様として胆汁酸結合能に関する評価法を提供する(図20を参照)。
(1)ポリペプチドの配列を用意するステップ、
(2)同定に成功した胆汁酸結合ペプチドの配列(配列番号1〜223のいずれかのアミノ酸配列、並びにWIY,YYW,WRW,PWR,WFW,WYM,IWW,YWM,FWY,LWY,WYD,WMY,WYF,MWF,YFY,WWT,WWI,YYF,FMF,YMW,PFF,AWY,WMM,NWY,PWM,FWV,WYV,YFM,YGW,PVW,WRI,QWF,WHF,MWM,PIY,LFF,YSW,WNF,WSL,YLF,YYI,WYT,MYY,IWM,WHM,WLA,YQY,IQW,WLN,WMQ,WAM,AWM,TWY,WSM,VWI,MFL,NWM,WVQ,FGL,FNY,PIR,PWN,MWL,YGL,NWI,AWI,VFI,YSF,MIF,FVM,TWM,WQI,MYM,TWI,PMG,IGY,IML,VLF,YIV,YAM,PYN,VAY,PCK,SWL,PCW,PML,PLM,VYM,VMY,PFE,YSM,ISF,QWV,WVC,CWY,MTF,PLQ,ILM,YQV,PCC,YMI,WKC,PMH,WKW,WYE,WFK,WRR,WKW,RKF,WKS,VWW,VWW,PLK,YWL,KLK,FLR,YWL,NFK,LWY,HWF,LRI,WGW,WFL,FYF,RHW,PLK,KLK,LRI,KIW,QWR,IWN,RRK,KVR,NQY,WNP,LRY,FMY,WMH,WIK,YFI,IRA,NTH,WNP,YFI,WGV,HKL,WRG,YYT,QPW,LYL,TRA,RKA,WHA,LYL,AFL,FII,RPL,FVI,YSH,LYS,IFW,KIP,FII,WQE,FCP,NHI,WAG,VRQ,GPR,LYS,NRE,FLT,YVP,LYM,IIP,WRC,NTK,QFH,FQW,NTK,YVP,LYN,FGF,LKS,GYL,FIE,KGS,VFA,RFN,LYH,QFH,RVI,VAY,LKS,QYF,WMN,DRG,VYP,YGT,IQW,KIA,QKV,HMK,WQL,RFN,MHP,VRD,KVA,ITR,NQG,YMY,RDG,WMK,YII,NKI,PMR,HML,VAY,KHM,YGT,HAH,TRP,KIA,IWT,FMA,CWP,ICY,HMK,KMS,MIP,FSV,PSH,KVA,KNL,VKT,MHP,KHM,PFI,TRP,RDG,QGR,WMS,YIV,KAC,LQH,MIP,MFS,PSH,VKT,NGI,PVS,NPL,LSP,TKQ,QII,QGR,MFS,VKA,LQH,PPQ,QHL,LSP,VKA,QII,LMS,PHQ,RFA,MCP,NGC,QHL,YCI,MQF,SNF,YMA,LQY,LPQ,VLL,YMA,AIK,WMT,EYH,VLL,SML,GLC,END,WGS,RAD,GWV,RAD,HHS,EAF,MGI,IVN,SEW,QHA,THM,CLY,NMC,TLL及びLMW)の中から選択される2以上のペプチド配列に対してスコアを関連付けるステップ、
(3)スコアを関連付けた各ペプチド配列をそれぞれ前記ポリペプチドの配列と照合し、配列が一致する領域の数を調べるステップ、
(4)ステップ(3)で判明した前記領域の数と、ステップ(2)で関連付けたスコアとを乗ずることによってペプチド配列毎にスコアを算出した後、全てのスコアを積算して総スコアを算出するステップであって、該総スコアが前記ポリペプチドの胆汁酸結合能を表す指標となるステップ。
【0108】
ステップ(1)、(3)及び(4)は、上記態様(2.上位クラスタに含まれるペプチド配列を用いた評価)と同様であるためその説明を省略する。ステップ(2)では、同定に成功した胆汁酸結合ペプチド配列(配列番号1〜223のいずれかのアミノ酸配列、並びにWIY,YYW,WRW,PWR,WFW,WYM,IWW,YWM,FWY,LWY,WYD,WMY,WYF,MWF,YFY,WWT,WWI,YYF,FMF,YMW,PFF,AWY,WMM,NWY,PWM,FWV,WYV,YFM,YGW,PVW,WRI,QWF,WHF,MWM,PIY,LFF,YSW,WNF,WSL,YLF,YYI,WYT,MYY,IWM,WHM,WLA,YQY,IQW,WLN,WMQ,WAM,AWM,TWY,WSM,VWI,MFL,NWM,WVQ,FGL,FNY,PIR,PWN,MWL,YGL,NWI,AWI,VFI,YSF,MIF,FVM,TWM,WQI,MYM,TWI,PMG,IGY,IML,VLF,YIV,YAM,PYN,VAY,PCK,SWL,PCW,PML,PLM,VYM,VMY,PFE,YSM,ISF,QWV,WVC,CWY,MTF,PLQ,ILM,YQV,PCC,YMI,WKC,PMH,WKW,WYE,WFK,WRR,WKW,RKF,WKS,VWW,VWW,PLK,YWL,KLK,FLR,YWL,NFK,LWY,HWF,LRI,WGW,WFL,FYF,RHW,PLK,KLK,LRI,KIW,QWR,IWN,RRK,KVR,NQY,WNP,LRY,FMY,WMH,WIK,YFI,IRA,NTH,WNP,YFI,WGV,HKL,WRG,YYT,QPW,LYL,TRA,RKA,WHA,LYL,AFL,FII,RPL,FVI,YSH,LYS,IFW,KIP,FII,WQE,FCP,NHI,WAG,VRQ,GPR,LYS,NRE,FLT,YVP,LYM,IIP,WRC,NTK,QFH,FQW,NTK,YVP,LYN,FGF,LKS,GYL,FIE,KGS,VFA,RFN,LYH,QFH,RVI,VAY,LKS,QYF,WMN,DRG,VYP,YGT,IQW,KIA,QKV,HMK,WQL,RFN,MHP,VRD,KVA,ITR,NQG,YMY,RDG,WMK,YII,NKI,PMR,HML,VAY,KHM,YGT,HAH,TRP,KIA,IWT,FMA,CWP,ICY,HMK,KMS,MIP,FSV,PSH,KVA,KNL,VKT,MHP,KHM,PFI,TRP,RDG,QGR,WMS,YIV,KAC,LQH,MIP,MFS,PSH,VKT,NGI,PVS,NPL,LSP,TKQ,QII,QGR,MFS,VKA,LQH,PPQ,QHL,LSP,VKA,QII,LMS,PHQ,RFA,MCP,NGC,QHL,YCI,MQF,SNF,YMA,LQY,LPQ,VLL,YMA,AIK,WMT,EYH,VLL,SML,GLC,END,WGS,RAD,GWV,RAD,HHS,EAF,MGI,IVN,SEW,QHA,THM,CLY,NMC,TLL及びLMW)の中から、スコア化に利用する配列を選択する。スコア化には2以上のペプチド配列を利用する。好ましくは3以上、更に好ましくは4以上のペプチド配列を利用する。各ペプチド配列の胆汁酸結合能に応じて、各ペプチド配列にスコアを関連付ければよい。各ペプチド配列の胆汁酸結合能は結合アッセイによって評価することができる。
【0109】
<胆汁酸結合ペプチド>
後述の実施例に示すように、本発明者らは胆汁酸結合ペプチドを同定することに成功した。この成果に基づき本発明の更なる局面は、配列番号1〜223のいずれかのアミノ酸配列、又は以下の群、即ちIIK,GTV,WIY,YYW,WRW,PWR,WFW,WYM,IWW,YWM,FWY,LWY,WYD,WMY,WYF,MWF,YFY,WWT,WWI,YYF,FMF,YMW,PFF,AWY,WMM,NWY,PWM,FWV,WYV,YFM,YGW,PVW,WRI,QWF,WHF,MWM,PIY,LFF,YSW,WNF,WSL,YLF,YYI,WYT,MYY,IWM,WHM,WLA,YQY,IQW,WLN,WMQ,WAM,AWM,TWY,WSM,VWI,MFL,NWM,WVQ,FGL,FNY,PIR,PWN,MWL,YGL,NWI,AWI,VFI,YSF,MIF,FVM,TWM,WQI,MYM,TWI,PMG,IGY,IML,VLF,YIV,YAM,PYN,VAY,PCK,SWL,PCW,PML,PLM,VYM,VMY,PFE,YSM,ISF,QWV,WVC,CWY,MTF,PLQ,ILM,YQV,PCC,YMI,WKC,PMH,WKW,WYE,WFK,WRR,WKW,RKF,WKS,VWW,VWW,PLK,YWL,KLK,FLR,YWL,NFK,LWY,HWF,LRI,WGW,WFL,FYF,RHW,PLK,KLK,LRI,KIW,QWR,IWN,RRK,KVR,NQY,WNP,LRY,FMY,WMH,WIK,YFI,IRA,NTH,WNP,YFI,WGV,HKL,WRG,YYT,QPW,LYL,TRA,RKA,WHA,LYL,AFL,FII,RPL,FVI,YSH,LYS,IFW,KIP,FII,WQE,FCP,NHI,WAG,VRQ,GPR,LYS,NRE,FLT,YVP,LYM,IIP,WRC,NTK,QFH,FQW,NTK,YVP,LYN,FGF,LKS,GYL,FIE,KGS,VFA,RFN,LYH,QFH,RVI,VAY,LKS,QYF,WMN,DRG,VYP,YGT,IQW,KIA,QKV,HMK,WQL,RFN,MHP,VRD,KVA,ITR,NQG,YMY,RDG,WMK,YII,NKI,PMR,HML,VAY,KHM,YGT,HAH,TRP,KIA,IWT,FMA,CWP,ICY,HMK,KMS,MIP,FSV,PSH,KVA,KNL,VKT,MHP,KHM,PFI,TRP,RDG,QGR,WMS,YIV,KAC,LQH,MIP,MFS,PSH,VKT,NGI,PVS,NPL,LSP,TKQ,QII,QGR,MFS,VKA,LQH,PPQ,QHL,LSP,VKA,QII,LMS,PHQ,RFA,MCP,NGC,QHL,YCI,MQF,SNF,YMA,LQY,LPQ,VLL,YMA,AIK,WMT,EYH,VLL,SML,GLC,END,WGS,RAD,GWV,RAD,HHS,EAF,MGI,IVN,SEW,QHA,THM,CLY,NMC,TLL及びLMWから選択されるアミノ酸配列からなる胆汁酸結合ペプチドを提供する。尚、配列番号1〜29の配列は、既知の胆汁酸結合ペプチド(種ペプチド)を基にして同定されたアミノ酸配列である。また、配列番号30〜42の配列、並びにIIK及びGTVは、βコングリシニン(種タンパク質)を断片化して得られるペプチドの中から同定されたアミノ酸配列である。一方、配列番号43〜126の配列は、FNN解析を利用したルールの抽出の過程において同定されたアミノ酸配列である。配列番号127〜223の配列、並びにWIY,YYW,WRW,PWR,WFW,WYM,IWW,YWM,FWY,LWY,WYD,WMY,WYF,MWF,YFY,WWT,WWI,YYF,FMF,YMW,PFF,AWY,WMM,NWY,PWM,FWV,WYV,YFM,YGW,PVW,WRI,QWF,WHF,MWM,PIY,LFF,YSW,WNF,WSL,YLF,YYI,WYT,MYY,IWM,WHM,WLA,YQY,IQW,WLN,WMQ,WAM,AWM,TWY,WSM,VWI,MFL,NWM,WVQ,FGL,FNY,PIR,PWN,MWL,YGL,NWI,AWI,VFI,YSF,MIF,FVM,TWM,WQI,MYM,TWI,PMG,IGY,IML,VLF,YIV,YAM,PYN,VAY,PCK,SWL,PCW,PML,PLM,VYM,VMY,PFE,YSM,ISF,QWV,WVC,CWY,MTF,PLQ,ILM,YQV,PCC,YMI,WKC,PMH,WKW,WYE,WFK,WRR,WKW,RKF,WKS,VWW,VWW,PLK,YWL,KLK,FLR,YWL,NFK,LWY,HWF,LRI,WGW,WFL,FYF,RHW,PLK,KLK,LRI,KIW,QWR,IWN,RRK,KVR,NQY,WNP,LRY,FMY,WMH,WIK,YFI,IRA,NTH,WNP,YFI,WGV,HKL,WRG,YYT,QPW,LYL,TRA,RKA,WHA,LYL,AFL,FII,RPL,FVI,YSH,LYS,IFW,KIP,FII,WQE,FCP,NHI,WAG,VRQ,GPR,LYS,NRE,FLT,YVP,LYM,IIP,WRC,NTK,QFH,FQW,NTK,YVP,LYN,FGF,LKS,GYL,FIE,KGS,VFA,RFN,LYH,QFH,RVI,VAY,LKS,QYF,WMN,DRG,VYP,YGT,IQW,KIA,QKV,HMK,WQL,RFN,MHP,VRD,KVA,ITR,NQG,YMY,RDG,WMK,YII,NKI,PMR,HML,VAY,KHM,YGT,HAH,TRP,KIA,IWT,FMA,CWP,ICY,HMK,KMS,MIP,FSV,PSH,KVA,KNL,VKT,MHP,KHM,PFI,TRP,RDG,QGR,WMS,YIV,KAC,LQH,MIP,MFS,PSH,VKT,NGI,PVS,NPL,LSP,TKQ,QII,QGR,MFS,VKA,LQH,PPQ,QHL,LSP,VKA,QII,LMS,PHQ,RFA,MCP,NGC,QHL,YCI,MQF,SNF,YMA,LQY,LPQ,VLL,YMA,AIK,WMT,EYH,VLL,SML,GLC,END,WGS,RAD,GWV,RAD,HHS,EAF,MGI,IVN,SEW,QHA,THM,CLY,NMC,TLL及びLMWは、階層的クラスタリング分析を利用した方法によって同定されたアミノ酸配列である。
【0110】
配列番号2、4、5又は6の配列からなるペプチドは、アレイ上から切り離された可溶化の状態でも、非常に高い胆汁酸結合能を示し、特に配列番号2と5は胆汁酸ミセル形成阻害能、胆汁酸ミセル破壊能、と共に動物への投与実験において非常に高いコレステロール吸収阻害効果を示した(実施例の欄を参照)。この効果は従来のコレステロール吸収阻害薬と同等以上のコレステロール吸収阻害効果であった。従って、当該ペプチドは、コレステロール低減ペプチドとして有望であり、ペプチドアレイを用いたスクリーニング手法は有効であると考えられる。尚、配列番号2の配列からなるペプチドは他のペプチドと比べて「親水性であり水によく溶けるにもかかわらず」強いコレステロール吸収阻害能を示した。この点から、当該ペプチドは実用性が特に高いといえる。
【実施例】
【0111】
図2に示す4種の手法を用い、新規胆汁酸結合ペプチドを探索した。
1.既知胆汁酸結合ペプチド(種ペプチド)由来の新規胆汁酸結合ペプチドの設計・同定
(1)候補ペプチドの設計
既知の胆汁酸結合ペプチド配列(VAWWMY(配列番号224)。以下、「種ペプチド」と呼ぶ)を基に候補ペプチド配列を設計した。具体的には、種ペプチド1残基置換による改変を行い、候補ペプチド配列114種を得た。
【0112】
(2)胆汁酸結合アッセイ
Fmoc固定合成法を利用した常法により、候補ペプチド配列114種を網羅するペプチドチップを作製した。このペプチドチップを用いて以下の通り胆汁酸結合アッセイを行った。
【0113】
(3)ルールの抽出
アッセイの結果を評価することで、胆汁酸結合能とアミノ酸配列の関係を表すルール(図21)を抽出した。このルールでは、(i)N末端から1番目のアミノ酸として好ましいものはIとPであること、(ii)N末端から2番目のアミノ酸として好ましいものはD、G、H、I、K、M、P、R、W及びYであること、(iii)N末端から3番目のアミノ酸として好ましいものは特にないこと、(iv)N末端から4番目のアミノ酸として好ましいものはKとYであること、(v)5番目のアミノ酸として好ましい者はR、F及びIであること、(vi)N末端から6番目のアミノ酸として好ましいものはKであることが示されている。
【0114】
(4)ルールに従ったペプチドの作製及びスクリーニング
上記ルールに適合するアミノ酸と、大元のVAWWMY(配列番号224)に存在するアミノ酸のすべての組合せ792種(3×11×1×3×4×2)を作製し、これらのペプチド配列の胆汁酸結合能を胆汁酸結合アッセイ((2)と同様のアッセイ)で調べた。陽性対照として種ペプチドを、陰性対照としてペプチドを合成していないアレイ基板の値を用いた。
【0115】
アッセイの結果を図22に示す。蛍光強度が上位にランクされた29個のペプチド配列(配列場号1〜29)を胆汁酸結合ペプチドの有望な候補とした。また、ランクが特に上位の4個のペプチド配列(配列番号2、4、5、6)を、胆汁酸結合ペプチドの有望な候補として選抜し、以降の実験として可溶化状態での(1)胆汁酸ミセル形成阻害能、(2)胆汁酸ミセル破壊能、(3)動物を用いた生体コレステロール吸収阻害実験に用いた(後述の5.の欄)。
【0116】
2.大豆タンパク質(βコングリシニン)由来の新規胆汁酸結合ペプチドの設計・同定
(1)候補ペプチド配列の作製
種ペプチドを内在するβコングリシニンのアミノ酸配列(全配列)を断片化し、候補ペプチド配列274種を作製した。
【0117】
(2)胆汁酸結合アッセイ及びペプチド配列の選抜
Fmoc固定合成法を利用した常法により、候補ペプチド配列274種を網羅するペプチドチップを作製した。このペプチドチップを用いて胆汁酸結合アッセイ(1.の(2)と同様のアッセイ)を行った。アッセイの結果を図23に示す。蛍光強度が1位〜15位のペプチド配列(配列番号30〜42、並びにIIK及びGTV)を、胆汁酸結合ペプチドの有望な候補として選抜した。
【0118】
3.FNN解析を利用した胆汁酸結合ペプチドの設計・同定
(1)ペプチドライブラリーからの選抜
6アミノ酸残基のペプチド配列からなるランダムペプチドライブラリー(64,000,000配列)を作製した。当該ペプチドライブラリーから無作為に2,2000配列を選抜し、以降のアッセイに用いた。
【0119】
(2)胆汁酸結合アッセイ
Fmoc固定合成法を利用した常法により、選抜した2,200配列を網羅するペプチドチップ(各配列について3つのスポットが形成されている)を作製した。このペプチドチップを用いて胆汁酸結合アッセイ(1.の(2)と同様のアッセイ)を行った。アッセイの結果を図24に示す。図24では、高い蛍光強度を示したポジティブ配列(上位40位)と、低い蛍光強度を示したネガティブ配列(代表として40種)を示した。上位19位についてはその配列を配列番号43〜61に示す。尚、種ペプチド(VAWWMY:配列番号224)の蛍光強度を基準(1)としたときに3スポット全てについて蛍光強度が0.8以上の配列をポジティブ配列とし、3スポット全てについて蛍光強度がバックグラウンドと同等の配列をネガティブ配列とした。
【0120】
(3)FNN解析及びルールの抽出
ポジティブ配列60種(上位60位)のデータと、ネガティブ配列60種のデータを用い、FNN解析を行った。各配列は全て、各アミノ酸の位置を13指標(等電点、正規化ファンデルワールス体積、βタンパク質のためのアルファへリックスの指標、βタンパク質のためのベータ鎖の指標、タンパク質安定化のための側鎖の貢献度、原子間ポテンシャルに関する知識を基にした安定化尺度、疎水性指標、正規化されたターン頻度、ベータ鎖領域における自由エネルギー、アルファ−へリックス領域における自由エネルギー、極性、側鎖の相互作用、アミノ酸の分配度)で数値化し、情報処理解析を行った。
【0121】
FNN解析によって作成された配列ルール表を図25(a)に示す。赤色に示されたセルが配列ルールとして有望なルールである。ルールからは、P3(N末端からの位置が3番目)の正規化ファンデルワールス体積が大きい、もしくは、P4(N末端からの位置が4番目)のタンパク質安定化のための側鎖の貢献度が大きいときには、P3(N末端からの位置が3番目)の正規化ファンデルワールス体積が小さい、という配列ルールが得られた。配列ルール表の各セル内の一組の数値は、当該セルに関連付けられた特徴を満たす胆汁酸結合ペプチド配列(ポジティブデータ)の数(左側)及び胆汁酸非結合ペプチド配列(ネガティブデータ)の数(右側)である。
【0122】
配列ルール表より、胆汁酸結合能が高いことを示すルール(1回目のポジティブルール)(図25(b))が抽出される。ルールからは、P3(N末端からの位置が3番目)の正規化ファンデルワールス体積が大きい、もしくは、P4(N末端からの位置が4番目)のタンパク質安定化のための側鎖の貢献度が大きいときには、P3(N末端からの位置が3番目)の正規化ファンデルワールス体積が小さい、という配列ルールが得られた。1回目のポジティブルールに適合するものとして9個のペプチド(配列番号62〜70)が選抜された。尚、FNN解析ではアミノ酸の位置毎、各パラメータに関する閾値が設定されることから、見た目上同一の条件であっても選抜されるアミノ酸が相違することがある。
【0123】
(4)ルールに基づく候補ペプチド配列の選抜
ルールの絞り込み(最適化)を行うために、(1)で用意したランダムペプチドライブラリーの中から上記ルールに適合するペプチド配列1000種を選抜した。その際、1回目の選抜の際に選抜した配列(2,200配列)が重複して選抜されることがないようにした。
【0124】
(5)胆汁酸結合アッセイ(2回目)
選抜したペプチド配列1000種を網羅するペプチドチップを作製し、再度、胆汁酸結合アッセイを行った。アッセイの結果を図26に示す。図26では、高い蛍光強度を示したポジティブ配列(上位68位)と、低い蛍光強度を示したネガティブ配列(127種)を示した。尚、種ペプチド(VAWWMY:配列番号224)の蛍光強度を基準(1)としたときに3スポット全てについて蛍光強度が0.8以上で且つp値が0.05より小さい配列をポジティブ配列とし、3スポット全てについて蛍光強度が0.2以下の配列をネガティブ配列とした。
【0125】
(6)FNN解析及びルールの抽出(2回目)
ポジティブ配列28種(上位28位)のデータと、ネガティブ配列28種のデータを用い、2回目のFNN解析を行った。FNN解析の結果、3個のルール(ルール1〜3)が抽出された(図27)。尚、胆汁酸結合ペプチド配列が最も多く属するのはルール1であった。ルール1に適合するものとして56個のペプチド(配列番号71〜126)が選抜された。
<ルール1>
P2はタンパク質安定化のための側鎖の貢献度が大きい:該当するアミノ酸はW、F、I、Y、L、V、P
P3は正規化ファンデルワールス体積が大きい :該当するアミノ酸はW、Y、R、F
P4はタンパク質安定化のための側鎖の貢献度が大きい:該当するアミノ酸はW、F、I、Y、L、V、P
【0126】
<ルール2>
P1はタンパク質安定化のための側鎖の貢献度が大きく、等電点が高い:該当するアミノ酸はW、I、Y、L、V、P
P3は正規化ファンデルワールス体積が大きい:該当するアミノ酸はW、Y、R、F
P4はタンパク質安定化のための側鎖の貢献度が小さく、等電点が高い:該当するアミノ酸はH、M、K、A、R、T、N、S、Q、G
【0127】
<ルール3>
P1はタンパク質安定化のための側鎖の貢献度が大きい:該当するアミノ酸はW、F、I、Y、L、V、P、H、M、K、A
P2はタンパク質安定化のための側鎖の貢献度が大きい:該当するアミノ酸はW、F、I、Y、L、V、P、H、M、K、A
P3はタンパク質安定化のための側鎖の貢献度が小さく、等電点が高い:該当するアミノ酸はK、H、I、L、V、P、A、G
P3はタンパク質安定化のための側鎖の貢献度が大きい:該当するアミノ酸はW、F、I、Y、L、V、P
【0128】
(7)ルールに基づく候補ペプチド配列の選抜
ルールの更なる絞り込み(最適化)を行うために、(1)で用意したランダムペプチドライブラリーの中から上記ルール1に適合するペプチド配列1000種を選抜した。その際、以前の選抜の際に選抜した配列(2,200配列及び1,000配列)が重複して選抜されることがないようにした。
(8)胆汁酸結合アッセイ(3回目)
選抜したペプチド配列1000種を網羅するペプチドチップを作製し、再度、胆汁酸結合アッセイを行った。アッセイの結果を図28に示す。図28では、種ペプチド(VAWWMY:配列番号224)の蛍光強度を基準(1)としたときに3スポット全てについて蛍光強度が0.8以上で且つp値が0.05より小さいポジティブ配列の全てを示した。この結果から分かるように、種ペプチドよりも強い胆汁酸結合能を示すペプチドが得られる率が向上した。
(9)FNN解析及びルールの抽出(3回目)
ポジティブ配列50種(上位50位)のデータと、ネガティブ配列50種(下位50種)のデータを用い、3回目のFNN解析を行った。FNN解析によって最終ルールを抽出した。
【0129】
以上の通り、胆汁酸結合ペプチドを表す、最良のルールを見出すことに成功した。当該ルールを用いれば、胆汁酸結合ペプチドとして有望な新規ペプチドを効率的に設計することができる。一方、ルールの抽出の過程において、種ペプチドよりも高い胆汁酸結合能を示すペプチド配列が多数、見出された。その中には非天然型ペプチドも数多く含まれていた。
【0130】
4.階層的クラスタリング法を利用した胆汁酸結合ペプチドの設計・同定
(1)ペプチドライブラリーからの選抜
3アミノ酸残基のペプチド配列からなるランダムペプチドライブラリーを作製した。当該ペプチドライブラリーから無作為に8,000配列を選抜した。
【0131】
(2)階層的クラスタ分析による分類
アミノ酸の物理的性質に関する544指標を13のグループに分類した。次に、各グループの代表を選抜した。選抜した13指標(等電点、正規化ファンデルワールス体積、βタンパク質のためのアルファへリックスの指標、βタンパク質のためのベータ鎖の指標、タンパク質安定化のための側鎖の貢献度、原子間ポテンシャルに関する知識を基にした安定化尺度、疎水性指標、正規化されたターン頻度、ベータ鎖領域における自由エネルギー、アルファ-へリックス領域における自由エネルギー、極性、側鎖の相互作用、アミノ酸の分配度)を用い、選抜した8,000配列を階層的クラスタ分析でクラスタリングした。尚、20種のアミノ酸について各指標の値を図5に示す。
【0132】
図29に示す通り、8,000配列は47クラスタに分類された。各クラスタから6配列ずつ選抜し、胆汁酸結合アッセイに供した。胆汁酸結合アッセイの方法は3.の場合と同様である。
【0133】
クラスタ毎、選抜した6配列の蛍光強度の平均値を求めた。平均値をクラスタ間で比較し、平均値の高いものから順に順位を付与した。上位5位までのクラスタ(クラスタ3(1位)、クラスタ43(2位)、クラスタ2(3位)、クラスタ25(4位)、クラスタ29(5位))を図30に示す。理解し易いように、各クラスタをブロック状に表示している。縦の一列が一つのペプチド配列(各列の下に配列が表示される)に対応する。各クラスタには、アミノ酸の位置毎、13指標の値が関連付けられている(図30の右欄を参照)。つまり、各クラスタは3×13個の数値範囲からなるルールで規定されている。
【0134】
(3)上位クラスタ及び下位クラスタからの選抜及びアッセイ
次に、上位5個のクラスタ及び下位5個のクラスタから25配列ずつ選抜し、胆汁酸結合アッセイに供した。(2)と同様に蛍光強度の平均値を比較したところ、順位が上位になればなるほど高い値を示した。各クラスタから選抜する配列の数を25から6に変更したときも同じ傾向を示した。一方、上位5個のクラスタを規定するルールに適合する配列と、下位5個のクラスタを規定するルールに適合する配列を25配列ずつアッセイした結果をまとめると図31に示す通り、上位クラスタ5個に属する配列は胆汁酸への結合強度がランダムなスクリーニングで選ばれるものよりも高く、下位クラスタ5個に属する配列は胆汁酸への結合強度がランダムなスクリーニングで選ばれるものよりも圧倒的に低かった。さらに、上位5クラスタの中からは、既知の6残基の胆汁酸結合ペプチド(VAWWMY:配列番号224)よりも高い結合を示す3残基のペプチドが6個も発見されており、スクリーニングの効率が大幅に向上したことがわかった。
【0135】
上位のクラスタを規定するルールに適合する配列を選ぶと、高い確率で胆汁酸結合能が高いことがわかる。換言すれば、上位のクラスタを規定するルールを利用すれば、胆汁酸結合能が高いペプチド配列を効率的に得ることができる。また、特筆すべきことに、3残基であるにもかかわらず、6残基のコントロールペプチド(VAWWMY:配列番号224)よりも強い胆汁酸結合能を示すペプチドが得られた。
【0136】
上位5個のクラスタに属するペプチド配列として、WIY,YYW,WRW,PWR,WFW,WYM,IWW,YWM,FWY,LWY,WYD,WMY,WYF,MWF,YFY,WWT,WWI,YYF,FMF,YMW,PFF,AWY,WMM,NWY,PWM,FWV,WYV,YFM,YGW,PVW,WRI,QWF,WHF,MWM,PIY,LFF,YSW,WNF,WSL,YLF,YYI,WYT,MYY,IWM,WHM,WLA,YQY,IQW,WLN,WMQ,WAM,AWM,TWY,WSM,VWI,MFL,NWM,WVQ,FGL,FNY,PIR,PWN,MWL,YGL,NWI,AWI,VFI,YSF,MIF,FVM,TWM,WQI,MYM,TWI,PMG,IGY,IML,VLF,YIV,YAM,PYN,VAY,PCK,SWL,PCW,PML,PLM,VYM,VMY,PFE,YSM,ISF,QWV,WVC,CWY,MTF,PLQ,ILM,YQV,PCC,YMI,WKC,PMHを同定した。また、ランダムなスクリーニングの結果、胆汁酸への結合強度が高いものとして以下の配列を同定した。WKW,WYE,WFK,WRR,WKW,RKF,WKS,VWW,VWW,PLK,YWL,KLK,FLR,YWL,NFK,LWY,HWF,LRI,WGW,WFL,FYF,RHW,PLK,KLK,LRI,KIW,QWR,IWN,RRK,KVR,NQY,WNP,LRY,FMY,WMH,WIK,YFI,IRA,NTH,WNP,YFI,WGV,HKL,WRG,YYT,QPW,LYL,TRA,RKA,WHA,LYL,AFL,FII,RPL,FVI,YSH,LYS,IFW,KIP,FII,WQE,FCP,NHI,WAG,VRQ,GPR,LYS,NRE,FLT,YVP,LYM,IIP,WRC,NTK,QFH,FQW,NTK,YVP,LYN,FGF,LKS,GYL,FIE,KGS,VFA,RFN,LYH,QFH,RVI,VAY,LKS,QYF,WMN,DRG,VYP,YGT,IQW,KIA,QKV,HMK,WQL,RFN,MHP,VRD,KVA,ITR,NQG,YMY,RDG,WMK,YII,NKI,PMR,HML,VAY,KHM,YGT,HAH,TRP,KIA,IWT,FMA,CWP,ICY,HMK,KMS,MIP,FSV,PSH,KVA,KNL,VKT,MHP,KHM,PFI,TRP,RDG,QGR,WMS,YIV,KAC,LQH,MIP,MFS,PSH,VKT,NGI,PVS,NPL,LSP,TKQ,QII,QGR,MFS,VKA,LQH,PPQ,QHL,LSP,VKA,QII,LMS,PHQ,RFA,MCP,NGC,QHL,YCI,MQF,SNF,YMA,LQY,LPQ,VLL,YMA,AIK,WMT,EYH,VLL,SML,GLC,END,WGS,RAD,GWV,RAD,HHS,EAF,MGI,IVN,SEW,QHA,THM,CLY,NMC,TLL及びLMW。
【0137】
更に、無作為に抽出した配列(4merの429配列、5merの436配列、及び6merの465配列を階層的クラスタ分析し、胆汁酸への結合強度が非常に高いペプチドとして配列番号127〜223の配列を同定した。
【0138】
5.選抜された胆汁酸結合ペプチドの評価
(1)胆汁酸結合能
1.において選抜した4個のペプチド配列(配列番号2、4、5、6)の胆汁酸に対する結合性(親和性)を図32に示す。胆汁酸結合アッセイで得られた蛍光強度の平均値(15スポットの平均)を、種ペプチド(VAWWMY:配列番号224)の蛍光強度で標準化することによって各ペプチド配列の結合性を求めた。表中のGRAVYは疎水度の総平均を表す。GRAVYの値が高いほど、疎水度が高い。Kyteらの手法(Kyte, J. and Doolittle, R. 1982. J. Mol. Biol. 157: 105-132.)に従いスコアを求めた。
【0139】
これら4個のペプチド配列、種ペプチド配列(VAWWMY:配列番号224)、カゼイン・トリプシン分解物及びコレスチラミンの14C胆汁酸への結合能を比較した。各試料を14C胆汁酸と2時間インキュベートした後、15000rpmで15分遠心した。上清の放射能を液体シンチレーションカウンターで計測した。計測値からコントロール(14C胆汁酸のみをインキュベートしたもの)の計測値を差し引き、比較した。P-3(VIWWFK)が最大の結合能を示した(図33)。
【0140】
一方、3.における胆汁酸結合アッセイで最大の蛍光強度を示したペプチド配列(MPWYWR:配列番号63)の胆汁酸結合能を同様に調べた結果、種ペプチドを凌ぐ結合能を示した(図34)。即ち、胆汁酸結合能に関して種ペプチドと同等以上のペプチドの同定に成功したことが確認された。
【0141】
(2)胆汁酸ミセル形成阻害能
上記4個のペプチド配列(配列番号2、4、5、6)、種ペプチド配列(VAWWMY:配列番号224)、カゼイン・トリプシン分解物及びコレスチラミン種ペプチドの胆汁酸ミセル形成阻害能を比較した。胆汁酸、14Cコレステロール及び試料を混合し、24時間インキュベートした後、ミセルを形成させるべく超音波処理した。超遠心処理(55000rpm、1時間)に供し、上清中の遊離14Cコレステロール量を計測した。試料を添加しない場合の計測値を100%とし、各試料の計測値を比較した。P-1(PWWWMY:配列番号2)及びP-3(VIWWFK:配列番号5)が高い胆汁酸ミセル形成阻害能を示した(図35)。
【0142】
(3)胆汁酸ミセル破壊能
上記4個のペプチド配列(配列番号2、4、5、6)、種ペプチド配列(VAWWMY:配列番号224)、カゼイン・トリプシン分解物及びコレスチラミン種ペプチドの胆汁酸ミセル破壊能を比較した。胆汁酸と14Cコレステロールを混合して24時間インキュベートした後、超音波処理してミセルを形成させた。続いて試料を添加し、1時間インキュベートした。超遠心処理(55000rpm、1時間)の後、上清中の遊離14Cコレステロール量を計測した。P-1(PWWWMY:配列番号2)及びP-3(VIWWFK:配列番号5)はミセルを完全に破壊した(図36)。添加濃度をミセル破壊能との関係を調べた結果、P-3(○)よりもP-1(■)の方が高いミセル破壊能を示した(図37)。
【0143】
(3)生体コレステロール吸収阻害能
上記4個のペプチド配列(配列番号2、4、5、6)、種ペプチド配列(VAWWMY:配列番号224)、カゼイン・トリプシン分解物及びコレスチラミン種ペプチドのコレステロール吸収阻害能を比較した。3Hコレステロール、モノオレイン酸及び胆汁酸を混合して超音波処理した後、24時間インキュベートした。これに試料(ラット1匹あたり30mg)を添加した後、胃内挿管法にてラット(Wister、オス、9週齢、n=9)に投与した。当該処置の1時間後に血清、肝臓及び腸管を採取し、3Hコレステロール量を計測した。体重100gあたりの平均吸収率(平均±標準誤差)を比較した(図38)。P-1(PWWWMY:配列番号2)及びP-3(VIWWFK:配列番号5)がコレステロール吸収阻害能を発揮することがわかる。
【産業上の利用可能性】
【0144】
本発明によれば、機能性ペプチドを表すルールが得られる。当該ルールは新規機能性ペプチドの効率的な設計、同定に有用である。本発明の手法は汎用性が高く、様々な機能性ペプチドの探索に利用できる。
本発明の評価法によれば、特定の機能に関して、ポリペプチド又はポリペプチド含有組成物を点数によって評価することができる。このような点数化(スコア化)は、ポリペプチド等の客観的な評価、機能性の高いポリペプチド等の特定や創出、ポリペプチド等の分類などに利用できる。
【0145】
この発明は、上記発明の実施の形態及び実施例の説明に何ら限定されるものではない。特許請求の範囲の記載を逸脱せず、当業者が容易に想到できる範囲で種々の変形態様もこの発明に含まれる。
本明細書の中で明示した論文、公開特許公報、及び特許公報などの内容は、その全ての内容を援用によって引用することとする。
【配列表フリーテキスト】
【0146】
配列番号1〜29:人工配列の説明:VAWWMYの置換とランダム化に由来する配列
配列番号30〜42:人工配列の説明:βコングリシニンに由来する配列
配列番号43〜61:人工配列の説明:ランダムスクリーニングで得られた配列
配列番号62〜70:人工配列の説明:1回目のFNN解析によって抽出された第1ルールに由来する配列
配列番号71〜126:人工配列の説明:2回目のFNN解析によって抽出された第1ルールに由来する配列
配列番号127〜223:人工配列の説明:階層的クラスタ分析に基づくスコア化によって得られた配列
配列番号224:人工配列の説明:種ペプチド
【特許請求の範囲】
【請求項1】
以下のステップ(1)〜(7)を含む、機能性ペプチドを表すルールの抽出法、
(1)アミノ酸残基数が同一で且つ配列が互いに異なる複数のペプチド配列からなるペプチドライブラリーを用意するステップ、
(2)N末端又はC末端からの位置毎に構成アミノ酸の物理化学的性質を数値化することによって、前記ペプチドライブラリーに含まれる各ペプチド配列を数値データに変換するステップ、
(3)前記数値データを入力変数として階層的クラスタ分析し、各ペプチド配列を、N末端又はC末端からの位置毎に前記物理的性質の数値範囲で規定される複数のクラスタに分類するステップ、
(4)前記複数のクラスタの中から、クラスタ毎、所定数のペプチド配列を選抜するステップ、
(5)選抜したペプチド配列からなるペプチドを試料として機能性アッセイを行い、各ペプチド配列の機能性データを取得するステップ、
(6)機能性データに基づき、機能性の順位を前記複数のクラスタに付与するステップ、
(7)上位の順位が付与されたクラスタを規定する、前記物理化学的性質の数値範囲又は該数値範囲を満足するアミノ酸の種類を、高機能ペプチドの特徴を表すルールとして抽出するステップ。
【請求項2】
前記機能性が高親和性である、請求項1に記載の抽出法。
【請求項3】
前記機能性が、胆汁酸に対する高親和性である、請求項1に記載の抽出法。
【請求項4】
ステップ(1)における前記アミノ酸残基数が3〜6である、請求項1〜3のいずれか一項に記載の抽出法。
【請求項5】
ステップ(2)における前記物理的性質が等電点、正規化ファンデルワールス体積、βタンパク質のためのアルファへリックスの指標、βタンパク質のためのベータ鎖の指標、タンパク質安定化のための側鎖の貢献度、原子間ポテンシャルに関する知識を基にした安定化尺度、疎水性指標、正規化されたターン頻度、ベータ鎖領域における自由エネルギー、アルファ−へリックス領域における自由エネルギー、極性、側鎖の相互作用、及びアミノ酸の分配度からなる群より選択される2種以上の性質である、請求項1〜4のいずれか一項に記載の抽出法。
【請求項6】
ステップ(2)における前記物理的性質が、等電点、正規化ファンデルワールス体積、βタンパク質のためのアルファへリックスの指標、βタンパク質のためのベータ鎖の指標、タンパク質安定化のための側鎖の貢献度、原子間ポテンシャルに関する知識を基にした安定化尺度、疎水性指標、正規化されたターン頻度、ベータ鎖領域における自由エネルギー、アルファ−へリックス領域における自由エネルギー、極性、側鎖の相互作用、及びアミノ酸の分配度からなる、13種の性質である、請求項1〜4のいずれか一項に記載の抽出法。
【請求項7】
ステップ(3)で生成されるクラスタの数が10〜100である、請求項1〜6のいずれか一項に記載の抽出法。
【請求項8】
ステップ(4)における前記所定数が3〜30である、請求項1〜7のいずれか一項に記載の抽出法。
【請求項9】
ステップ(5)における前記機能性アッセイが、前記試料である複数のペプチドが配列毎に区画化されて基板に固定されたなるペプチドチップを用いて行われる、請求項1〜8のいずれか一項に記載の抽出法。
【請求項10】
ステップ(6)に続いて、以下のステップ(6−1)〜(6−4)を1回又は2回以上実施した後、ステップ(7)を実施する、請求項1〜9のいずれか一項に記載の抽出法、
(6−1)上位の順位が付与された複数のクラスタを特定するステップ、
(6−2)特定された複数のクラスタより、クラスタ毎、所定数のペプチド配列を選抜するステップ、
(6−3)選抜したペプチド配列からなるペプチドを試料として機能性アッセイを行い、各ペプチド配列の機能性データを取得するステップ、
(6−4)機能性データに基づき、機能性の順位を前記複数のクラスタに付与するステップ。
【請求項11】
ステップ(7)において、上位n位(但し、nは2〜5の整数)までのクラスタからそれぞれルールを抽出する、請求項1〜10のいずれか一項に記載の抽出法。
【請求項12】
ステップ(7)において、最上位の順位が付与されたクラスタのみからルールを抽出する、請求項1〜10のいずれか一項に記載の抽出法。
【請求項13】
以下のステップ(1)〜(7)を含む、機能性ペプチドを表すルールの抽出法、
(1)アミノ酸残基数が同一で且つ配列が互いに異なる複数のペプチド配列からなるペプチドライブラリーを用意するステップ、
(2)前記ペプチドライブラリーから複数のペプチド配列を選抜するステップ、
(3)選抜したペプチド配列からなるペプチドを試料として機能性アッセイを行い、各ペプチド配列の機能性データを取得するステップ、
(4)機能性データに基づき、機能性アッセイに供したペプチド配列の中から、複数の高機能配列及び複数の低機能配列を選抜するステップ、
(5)N末端又はC末端からの位置毎に構成アミノ酸の物理化学的性質を数値化することによって、選抜した高機能配列及び低機能配列を数値データに変換するステップ、
(6)前記数値データを入力変数として、学習モデルを用いた解析を行うステップ、
(7)解析結果より、配列上の1以上の位置について前記物理的性質の条件又は該条件を満足するアミノ酸の種類を示すルールであって、高機能ペプチド配列の特徴を表す1又は2以上のルールを抽出するステップ。
【請求項14】
ステップ(7)の後、以下のステップ(8)を行う、請求項13に記載の抽出法、
(8)ステップ(1)で用意したペプチドライブラリーの内、以前の選抜の際に選抜されなかったペプチド配列の集合の中から、抽出した前記ルールに適合する複数のペプチド配列を選抜した後、ステップ(3)〜(7)を行うステップ。
【請求項15】
学習モデルを用いた前記解析がファジィニューラルネットワーク解析であり、
ステップ(6)においてファジィニューラルネットワーク解析の結果として予測モデルが構築され、ステップ(7)では該予測モデルより前記ルールが抽出される、請求項13に記載の抽出法。
【請求項16】
請求項1〜15のいずれか一項に記載の抽出法によって得られたルールに従ってペプチドを設計するステップを含む、機能性ペプチドの設計法。
【請求項17】
複数の候補ペプチド配列の中から、請求項1〜15のいずれか一項に記載の抽出法によって得られたルールに適合するペプチド配列を選抜するステップを含む、機能性ペプチドの設計法。
【請求項18】
請求項1〜12のいずれか一項に記載の抽出法によって得られた、上位の順位が付与されたクラスタに含まれる1又は2以上のペプチド配列を高機能ペプチド配列として選択するステップを含む、機能性ペプチドの設計法。
【請求項19】
以下のステップ(1)〜(3)を含む、機能性ペプチドの設計法、
(1)複数の候補ペプチドを用意するステップ、
(2)N末端又はC末端からの位置毎に構成アミノ酸の物理化学的性質を数値化することによって、前記複数の候補ペプチド配列をそれぞれ数値データに変換するステップ、
(3)請求項15に記載の抽出法においてルールの抽出の際に構築された予測モデルを用い、前記数値データを入力変数としてファジィニューラルネットワーク解析を行うステップであって、該ファジィニューラルネットワーク解析において、(i)ルールに適合するペプチド配列の選抜、(ii)選抜されたペプチド配列の予測値の評価、及び(iii)予測値の高いペプチド配列の選抜、が順に行われるステップ。
【請求項20】
(iii)の処理の後、選抜されたペプチド配列の信頼度の評価が行われる、請求項19に記載の設計法。
【請求項21】
以下のステップ(1)〜(3)を含む、機能性ペプチドの設計法、
(1)以下の(a)〜(d)からなる群より選択される集合を用意するステップ、
(a)請求項1〜12のいずれか一項に記載の抽出法によって得られた、上位の順位が付与されたクラスタに含まれるペプチド配列の集合、
(b)請求項1〜12のいずれか一項に記載の抽出法によって得られたルールに適合するペプチド配列の集合、
(c)請求項13〜15のいずれか一項に記載の抽出法によって得られたルールに適合するペプチド配列の集合、
(d)(a)〜(c)からなる群より選択される2以上の集合を結合した集合、
(2)用意した集合の中から、共通する部分配列を認める第1ペプチド配列及び第2ペプチドを選抜するステップであって、第2ペプチド配列の方が、該部分配列よりもC末端側のアミノ酸の数が多いステップ、
(3)前記第1ペプチド配列から前記部分配列よりもC末端側のアミノ酸を除去して得られる第1部分配列と、前記第2ペプチド配列から前記部分配列及び前記部分配列よりもN末端側のアミノ酸を除去して得られる第2部分配列とを、該第1部分配列がN末端側に配置されるように連結するステップ。
【請求項22】
前記第1ペプチド配列では前記部分配列がC末端アミノ酸を含み、前記第2ペプチド配列では前記部分配列がN末端アミノ酸を含む、請求項21に記載の設計法。
【請求項23】
下記条件1〜3の少なくとも1つを満足する、請求項21又は22に記載の設計法、
条件1:それに含まれるペプチド配列のアミノ酸残基数が異なる複数のペプチドライブラリーを用意し、各ペプチドライブラリーを用いて請求項1〜12のいずれか一項に記載の抽出法を行うことにし、各回について得られた、上位の順位が付与されたクラスタに含まれるペプチド配列の集合を全て連結し、前記集合(a)とする、
条件2:それに含まれるペプチド配列のアミノ酸残基数が異なる複数のペプチドライブラリーを用意し、各ペプチドライブリーを用いて請求項1〜12のいずれか一項に記載の抽出法を行ってルールを得た後、抽出されたルール毎、適合するペプチドの集合を作製し、最後に全集合を連結して前記集合(b)とする、
条件3:それに含まれるペプチド配列のアミノ酸残基数が異なる複数のペプチドライブラリーを用意し、各ペプチドライブリーを用いて請求項13〜15のいずれか一項に記載の抽出法を行ってルールを得た後、抽出されたルール毎、適合するペプチドの集合を作製し、最後に全集合を連結して前記集合(c)とする。
【請求項24】
ステップ(1)において前記集合(a)を用意することにし、
ステップ(2)では、第1ペプチド配列と対をなす第2ペプチド配列の候補が二つ以上存在する場合には、より上位の順位が付与されたクラスタに属するペプチド配列を優先して第2ペプチド配列に用い、第2ペプチド配列と対をなす第1ペプチド配列の候補が二つ以上存在する場合には、より上位の順位が付与されたクラスタに属するペプチド配列を優先して第1ペプチド配列に用いる、請求項21〜23のいずれか一項に記載の設計法。
【請求項25】
ステップ(1)において前記集合(b)を用意することにし、
ステップ(2)では、第1ペプチド配列と対をなす第2ペプチド配列の候補が二つ以上存在する場合には、より上位の順位が付与されたクラスタのルールに適合するペプチド配列の方を優先して第2ペプチド配列に用い、第2ペプチド配列と対をなす第1ペプチド配列の候補が二つ以上存在する場合には、より上位の順位が付与されたクラスタのルールに適合するペプチド配列の方を優先して第1ペプチド配列に用いる、請求項21〜23いずれか一項に記載の設計法。
【請求項26】
請求項16〜25のいずれか一項に記載の設計法で設計されたペプチドを調製するステップを含む、機能性ペプチドの調製法。
【請求項27】
以下のステップ(1)〜(6)を含む、ポリペプチド又はポリペプチド含有組成物の評価法、
(1)ポリペプチドの配列を用意するステップ、
(2)請求項1〜15のいずれか一項に記載の抽出法によって抽出された1又は2以上のルールに対してそれぞれスコアを関連付けるステップ、
(3)前記ルールとの照合が可能な一定の長さに前記ポリペプチドの配列を断片化するステップ、
(4)各断片配列を前記ルールと照合し、適合性を判定するステップ、
(5)ルールに適合すると判定された断片配列に対して、該ルールに関連付けられたスコアを付与するステップ、
(6)付与された全てのスコアを積算して総スコアを算出するステップであって、該総スコアが前記ポリペプチドの機能性を表す指標となるステップ。
【請求項28】
以下の(A)〜(C)のいずれかの特徴を備える、請求項27に記載の評価法、
(A)ステップ(3)で生じた断片配列の中から、プロテアーゼ切断部位を内在する断片配列を除いた後にステップ(4)を行う、
(B)ステップ(6)において、プロテアーゼ切断部位を内在する断片配列以外の断片配列に付与されたスコアのみを積算する、
(C)ステップ(6)において、付与された全スコアを積算した後、ステップ(3)で生じた断片配列の中から、プロテアーゼ切断部位を内在する断片配列に付与されたスコアを除算する。
【請求項29】
以下のステップ(1)〜(6)を含む、ポリペプチド又はポリペプチド含有組成物の評価法、
(1)ポリペプチドの配列を用意するステップ、
(2)請求項1〜12のいずれか一項に記載の抽出法によって得られた、上位の順位が付与されたクラスタに含まれる各ペプチド配列に対して、同一のクラスタに含まれるペプチド配列は各々相同性の高いスコアとなり且つクラスタの順位に対応したスコアとなるように、スコアを関連付けるステップ、
(3)スコアを関連付けた各ペプチド配列をそれぞれ前記ポリペプチドの配列と照合し、配列が一致する領域の数を調べるステップ、
(4)ステップ(3)で判明した前記領域の数と、ステップ(2)で関連付けたスコアとを乗ずることによってペプチド配列毎にスコアを算出した後、全てのスコアを積算して総スコアを算出するステップであって、該総スコアが前記ポリペプチドの機能性を表す指標となるステップ。
【請求項30】
以下のステップ(1)〜(5)を含む、ポリペプチド又はポリペプチド含有組成物の評価法、
(1)ポリペプチドの配列を用意するステップ、
(2)請求項13〜15のいずれか一項に記載の抽出法においてルールを抽出する際に用いた学習モデルで解析可能な一定の長さに前記ポリペプチドの配列を断片化するステップ、
(3)N末端又はC末端からの位置毎に構成アミノ酸の物理化学的性質を数値化することによって、各断片配列を数値データに変換するステップ、
(4)前記学習モデルを用い、前記数値データを入力変数として、学習モデルによる解析を行い、各断片配列の予測機能度を算出するステップ、
(5)算出された予測機能度を積算するステップであって、得られた総予測機能度が前記ポリペプチドの機能性を表す指標となるステップ。
【請求項31】
配列番号1〜223のいずれかのアミノ酸配列、又は以下の群、即ちIIK,GTV,WIY,YYW,WRW,PWR,WFW,WYM,IWW,YWM,FWY,LWY,WYD,WMY,WYF,MWF,YFY,WWT,WWI,YYF,FMF,YMW,PFF,AWY,WMM,NWY,PWM,FWV,WYV,YFM,YGW,PVW,WRI,QWF,WHF,MWM,PIY,LFF,YSW,WNF,WSL,YLF,YYI,WYT,MYY,IWM,WHM,WLA,YQY,IQW,WLN,WMQ,WAM,AWM,TWY,WSM,VWI,MFL,NWM,WVQ,FGL,FNY,PIR,PWN,MWL,YGL,NWI,AWI,VFI,YSF,MIF,FVM,TWM,WQI,MYM,TWI,PMG,IGY,IML,VLF,YIV,YAM,PYN,VAY,PCK,SWL,PCW,PML,PLM,VYM,VMY,PFE,YSM,ISF,QWV,WVC,CWY,MTF,PLQ,ILM,YQV,PCC,YMI,WKC,PMH,WKW,WYE,WFK,WRR,WKW,RKF,WKS,VWW,VWW,PLK,YWL,KLK,FLR,YWL,NFK,LWY,HWF,LRI,WGW,WFL,FYF,RHW,PLK,KLK,LRI,KIW,QWR,IWN,RRK,KVR,NQY,WNP,LRY,FMY,WMH,WIK,YFI,IRA,NTH,WNP,YFI,WGV,HKL,WRG,YYT,QPW,LYL,TRA,RKA,WHA,LYL,AFL,FII,RPL,FVI,YSH,LYS,IFW,KIP,FII,WQE,FCP,NHI,WAG,VRQ,GPR,LYS,NRE,FLT,YVP,LYM,IIP,WRC,NTK,QFH,FQW,NTK,YVP,LYN,FGF,LKS,GYL,FIE,KGS,VFA,RFN,LYH,QFH,RVI,VAY,LKS,QYF,WMN,DRG,VYP,YGT,IQW,KIA,QKV,HMK,WQL,RFN,MHP,VRD,KVA,ITR,NQG,YMY,RDG,WMK,YII,NKI,PMR,HML,VAY,KHM,YGT,HAH,TRP,KIA,IWT,FMA,CWP,ICY,HMK,KMS,MIP,FSV,PSH,KVA,KNL,VKT,MHP,KHM,PFI,TRP,RDG,QGR,WMS,YIV,KAC,LQH,MIP,MFS,PSH,VKT,NGI,PVS,NPL,LSP,TKQ,QII,QGR,MFS,VKA,LQH,PPQ,QHL,LSP,VKA,QII,LMS,PHQ,RFA,MCP,NGC,QHL,YCI,MQF,SNF,YMA,LQY,LPQ,VLL,YMA,AIK,WMT,EYH,VLL,SML,GLC,END,WGS,RAD,GWV,RAD,HHS,EAF,MGI,IVN,SEW,QHA,THM,CLY,NMC,TLL及びLMWから選択されるアミノ酸配列からなる、胆汁酸結合ペプチド。
【請求項1】
以下のステップ(1)〜(7)を含む、機能性ペプチドを表すルールの抽出法、
(1)アミノ酸残基数が同一で且つ配列が互いに異なる複数のペプチド配列からなるペプチドライブラリーを用意するステップ、
(2)N末端又はC末端からの位置毎に構成アミノ酸の物理化学的性質を数値化することによって、前記ペプチドライブラリーに含まれる各ペプチド配列を数値データに変換するステップ、
(3)前記数値データを入力変数として階層的クラスタ分析し、各ペプチド配列を、N末端又はC末端からの位置毎に前記物理的性質の数値範囲で規定される複数のクラスタに分類するステップ、
(4)前記複数のクラスタの中から、クラスタ毎、所定数のペプチド配列を選抜するステップ、
(5)選抜したペプチド配列からなるペプチドを試料として機能性アッセイを行い、各ペプチド配列の機能性データを取得するステップ、
(6)機能性データに基づき、機能性の順位を前記複数のクラスタに付与するステップ、
(7)上位の順位が付与されたクラスタを規定する、前記物理化学的性質の数値範囲又は該数値範囲を満足するアミノ酸の種類を、高機能ペプチドの特徴を表すルールとして抽出するステップ。
【請求項2】
前記機能性が高親和性である、請求項1に記載の抽出法。
【請求項3】
前記機能性が、胆汁酸に対する高親和性である、請求項1に記載の抽出法。
【請求項4】
ステップ(1)における前記アミノ酸残基数が3〜6である、請求項1〜3のいずれか一項に記載の抽出法。
【請求項5】
ステップ(2)における前記物理的性質が等電点、正規化ファンデルワールス体積、βタンパク質のためのアルファへリックスの指標、βタンパク質のためのベータ鎖の指標、タンパク質安定化のための側鎖の貢献度、原子間ポテンシャルに関する知識を基にした安定化尺度、疎水性指標、正規化されたターン頻度、ベータ鎖領域における自由エネルギー、アルファ−へリックス領域における自由エネルギー、極性、側鎖の相互作用、及びアミノ酸の分配度からなる群より選択される2種以上の性質である、請求項1〜4のいずれか一項に記載の抽出法。
【請求項6】
ステップ(2)における前記物理的性質が、等電点、正規化ファンデルワールス体積、βタンパク質のためのアルファへリックスの指標、βタンパク質のためのベータ鎖の指標、タンパク質安定化のための側鎖の貢献度、原子間ポテンシャルに関する知識を基にした安定化尺度、疎水性指標、正規化されたターン頻度、ベータ鎖領域における自由エネルギー、アルファ−へリックス領域における自由エネルギー、極性、側鎖の相互作用、及びアミノ酸の分配度からなる、13種の性質である、請求項1〜4のいずれか一項に記載の抽出法。
【請求項7】
ステップ(3)で生成されるクラスタの数が10〜100である、請求項1〜6のいずれか一項に記載の抽出法。
【請求項8】
ステップ(4)における前記所定数が3〜30である、請求項1〜7のいずれか一項に記載の抽出法。
【請求項9】
ステップ(5)における前記機能性アッセイが、前記試料である複数のペプチドが配列毎に区画化されて基板に固定されたなるペプチドチップを用いて行われる、請求項1〜8のいずれか一項に記載の抽出法。
【請求項10】
ステップ(6)に続いて、以下のステップ(6−1)〜(6−4)を1回又は2回以上実施した後、ステップ(7)を実施する、請求項1〜9のいずれか一項に記載の抽出法、
(6−1)上位の順位が付与された複数のクラスタを特定するステップ、
(6−2)特定された複数のクラスタより、クラスタ毎、所定数のペプチド配列を選抜するステップ、
(6−3)選抜したペプチド配列からなるペプチドを試料として機能性アッセイを行い、各ペプチド配列の機能性データを取得するステップ、
(6−4)機能性データに基づき、機能性の順位を前記複数のクラスタに付与するステップ。
【請求項11】
ステップ(7)において、上位n位(但し、nは2〜5の整数)までのクラスタからそれぞれルールを抽出する、請求項1〜10のいずれか一項に記載の抽出法。
【請求項12】
ステップ(7)において、最上位の順位が付与されたクラスタのみからルールを抽出する、請求項1〜10のいずれか一項に記載の抽出法。
【請求項13】
以下のステップ(1)〜(7)を含む、機能性ペプチドを表すルールの抽出法、
(1)アミノ酸残基数が同一で且つ配列が互いに異なる複数のペプチド配列からなるペプチドライブラリーを用意するステップ、
(2)前記ペプチドライブラリーから複数のペプチド配列を選抜するステップ、
(3)選抜したペプチド配列からなるペプチドを試料として機能性アッセイを行い、各ペプチド配列の機能性データを取得するステップ、
(4)機能性データに基づき、機能性アッセイに供したペプチド配列の中から、複数の高機能配列及び複数の低機能配列を選抜するステップ、
(5)N末端又はC末端からの位置毎に構成アミノ酸の物理化学的性質を数値化することによって、選抜した高機能配列及び低機能配列を数値データに変換するステップ、
(6)前記数値データを入力変数として、学習モデルを用いた解析を行うステップ、
(7)解析結果より、配列上の1以上の位置について前記物理的性質の条件又は該条件を満足するアミノ酸の種類を示すルールであって、高機能ペプチド配列の特徴を表す1又は2以上のルールを抽出するステップ。
【請求項14】
ステップ(7)の後、以下のステップ(8)を行う、請求項13に記載の抽出法、
(8)ステップ(1)で用意したペプチドライブラリーの内、以前の選抜の際に選抜されなかったペプチド配列の集合の中から、抽出した前記ルールに適合する複数のペプチド配列を選抜した後、ステップ(3)〜(7)を行うステップ。
【請求項15】
学習モデルを用いた前記解析がファジィニューラルネットワーク解析であり、
ステップ(6)においてファジィニューラルネットワーク解析の結果として予測モデルが構築され、ステップ(7)では該予測モデルより前記ルールが抽出される、請求項13に記載の抽出法。
【請求項16】
請求項1〜15のいずれか一項に記載の抽出法によって得られたルールに従ってペプチドを設計するステップを含む、機能性ペプチドの設計法。
【請求項17】
複数の候補ペプチド配列の中から、請求項1〜15のいずれか一項に記載の抽出法によって得られたルールに適合するペプチド配列を選抜するステップを含む、機能性ペプチドの設計法。
【請求項18】
請求項1〜12のいずれか一項に記載の抽出法によって得られた、上位の順位が付与されたクラスタに含まれる1又は2以上のペプチド配列を高機能ペプチド配列として選択するステップを含む、機能性ペプチドの設計法。
【請求項19】
以下のステップ(1)〜(3)を含む、機能性ペプチドの設計法、
(1)複数の候補ペプチドを用意するステップ、
(2)N末端又はC末端からの位置毎に構成アミノ酸の物理化学的性質を数値化することによって、前記複数の候補ペプチド配列をそれぞれ数値データに変換するステップ、
(3)請求項15に記載の抽出法においてルールの抽出の際に構築された予測モデルを用い、前記数値データを入力変数としてファジィニューラルネットワーク解析を行うステップであって、該ファジィニューラルネットワーク解析において、(i)ルールに適合するペプチド配列の選抜、(ii)選抜されたペプチド配列の予測値の評価、及び(iii)予測値の高いペプチド配列の選抜、が順に行われるステップ。
【請求項20】
(iii)の処理の後、選抜されたペプチド配列の信頼度の評価が行われる、請求項19に記載の設計法。
【請求項21】
以下のステップ(1)〜(3)を含む、機能性ペプチドの設計法、
(1)以下の(a)〜(d)からなる群より選択される集合を用意するステップ、
(a)請求項1〜12のいずれか一項に記載の抽出法によって得られた、上位の順位が付与されたクラスタに含まれるペプチド配列の集合、
(b)請求項1〜12のいずれか一項に記載の抽出法によって得られたルールに適合するペプチド配列の集合、
(c)請求項13〜15のいずれか一項に記載の抽出法によって得られたルールに適合するペプチド配列の集合、
(d)(a)〜(c)からなる群より選択される2以上の集合を結合した集合、
(2)用意した集合の中から、共通する部分配列を認める第1ペプチド配列及び第2ペプチドを選抜するステップであって、第2ペプチド配列の方が、該部分配列よりもC末端側のアミノ酸の数が多いステップ、
(3)前記第1ペプチド配列から前記部分配列よりもC末端側のアミノ酸を除去して得られる第1部分配列と、前記第2ペプチド配列から前記部分配列及び前記部分配列よりもN末端側のアミノ酸を除去して得られる第2部分配列とを、該第1部分配列がN末端側に配置されるように連結するステップ。
【請求項22】
前記第1ペプチド配列では前記部分配列がC末端アミノ酸を含み、前記第2ペプチド配列では前記部分配列がN末端アミノ酸を含む、請求項21に記載の設計法。
【請求項23】
下記条件1〜3の少なくとも1つを満足する、請求項21又は22に記載の設計法、
条件1:それに含まれるペプチド配列のアミノ酸残基数が異なる複数のペプチドライブラリーを用意し、各ペプチドライブラリーを用いて請求項1〜12のいずれか一項に記載の抽出法を行うことにし、各回について得られた、上位の順位が付与されたクラスタに含まれるペプチド配列の集合を全て連結し、前記集合(a)とする、
条件2:それに含まれるペプチド配列のアミノ酸残基数が異なる複数のペプチドライブラリーを用意し、各ペプチドライブリーを用いて請求項1〜12のいずれか一項に記載の抽出法を行ってルールを得た後、抽出されたルール毎、適合するペプチドの集合を作製し、最後に全集合を連結して前記集合(b)とする、
条件3:それに含まれるペプチド配列のアミノ酸残基数が異なる複数のペプチドライブラリーを用意し、各ペプチドライブリーを用いて請求項13〜15のいずれか一項に記載の抽出法を行ってルールを得た後、抽出されたルール毎、適合するペプチドの集合を作製し、最後に全集合を連結して前記集合(c)とする。
【請求項24】
ステップ(1)において前記集合(a)を用意することにし、
ステップ(2)では、第1ペプチド配列と対をなす第2ペプチド配列の候補が二つ以上存在する場合には、より上位の順位が付与されたクラスタに属するペプチド配列を優先して第2ペプチド配列に用い、第2ペプチド配列と対をなす第1ペプチド配列の候補が二つ以上存在する場合には、より上位の順位が付与されたクラスタに属するペプチド配列を優先して第1ペプチド配列に用いる、請求項21〜23のいずれか一項に記載の設計法。
【請求項25】
ステップ(1)において前記集合(b)を用意することにし、
ステップ(2)では、第1ペプチド配列と対をなす第2ペプチド配列の候補が二つ以上存在する場合には、より上位の順位が付与されたクラスタのルールに適合するペプチド配列の方を優先して第2ペプチド配列に用い、第2ペプチド配列と対をなす第1ペプチド配列の候補が二つ以上存在する場合には、より上位の順位が付与されたクラスタのルールに適合するペプチド配列の方を優先して第1ペプチド配列に用いる、請求項21〜23いずれか一項に記載の設計法。
【請求項26】
請求項16〜25のいずれか一項に記載の設計法で設計されたペプチドを調製するステップを含む、機能性ペプチドの調製法。
【請求項27】
以下のステップ(1)〜(6)を含む、ポリペプチド又はポリペプチド含有組成物の評価法、
(1)ポリペプチドの配列を用意するステップ、
(2)請求項1〜15のいずれか一項に記載の抽出法によって抽出された1又は2以上のルールに対してそれぞれスコアを関連付けるステップ、
(3)前記ルールとの照合が可能な一定の長さに前記ポリペプチドの配列を断片化するステップ、
(4)各断片配列を前記ルールと照合し、適合性を判定するステップ、
(5)ルールに適合すると判定された断片配列に対して、該ルールに関連付けられたスコアを付与するステップ、
(6)付与された全てのスコアを積算して総スコアを算出するステップであって、該総スコアが前記ポリペプチドの機能性を表す指標となるステップ。
【請求項28】
以下の(A)〜(C)のいずれかの特徴を備える、請求項27に記載の評価法、
(A)ステップ(3)で生じた断片配列の中から、プロテアーゼ切断部位を内在する断片配列を除いた後にステップ(4)を行う、
(B)ステップ(6)において、プロテアーゼ切断部位を内在する断片配列以外の断片配列に付与されたスコアのみを積算する、
(C)ステップ(6)において、付与された全スコアを積算した後、ステップ(3)で生じた断片配列の中から、プロテアーゼ切断部位を内在する断片配列に付与されたスコアを除算する。
【請求項29】
以下のステップ(1)〜(6)を含む、ポリペプチド又はポリペプチド含有組成物の評価法、
(1)ポリペプチドの配列を用意するステップ、
(2)請求項1〜12のいずれか一項に記載の抽出法によって得られた、上位の順位が付与されたクラスタに含まれる各ペプチド配列に対して、同一のクラスタに含まれるペプチド配列は各々相同性の高いスコアとなり且つクラスタの順位に対応したスコアとなるように、スコアを関連付けるステップ、
(3)スコアを関連付けた各ペプチド配列をそれぞれ前記ポリペプチドの配列と照合し、配列が一致する領域の数を調べるステップ、
(4)ステップ(3)で判明した前記領域の数と、ステップ(2)で関連付けたスコアとを乗ずることによってペプチド配列毎にスコアを算出した後、全てのスコアを積算して総スコアを算出するステップであって、該総スコアが前記ポリペプチドの機能性を表す指標となるステップ。
【請求項30】
以下のステップ(1)〜(5)を含む、ポリペプチド又はポリペプチド含有組成物の評価法、
(1)ポリペプチドの配列を用意するステップ、
(2)請求項13〜15のいずれか一項に記載の抽出法においてルールを抽出する際に用いた学習モデルで解析可能な一定の長さに前記ポリペプチドの配列を断片化するステップ、
(3)N末端又はC末端からの位置毎に構成アミノ酸の物理化学的性質を数値化することによって、各断片配列を数値データに変換するステップ、
(4)前記学習モデルを用い、前記数値データを入力変数として、学習モデルによる解析を行い、各断片配列の予測機能度を算出するステップ、
(5)算出された予測機能度を積算するステップであって、得られた総予測機能度が前記ポリペプチドの機能性を表す指標となるステップ。
【請求項31】
配列番号1〜223のいずれかのアミノ酸配列、又は以下の群、即ちIIK,GTV,WIY,YYW,WRW,PWR,WFW,WYM,IWW,YWM,FWY,LWY,WYD,WMY,WYF,MWF,YFY,WWT,WWI,YYF,FMF,YMW,PFF,AWY,WMM,NWY,PWM,FWV,WYV,YFM,YGW,PVW,WRI,QWF,WHF,MWM,PIY,LFF,YSW,WNF,WSL,YLF,YYI,WYT,MYY,IWM,WHM,WLA,YQY,IQW,WLN,WMQ,WAM,AWM,TWY,WSM,VWI,MFL,NWM,WVQ,FGL,FNY,PIR,PWN,MWL,YGL,NWI,AWI,VFI,YSF,MIF,FVM,TWM,WQI,MYM,TWI,PMG,IGY,IML,VLF,YIV,YAM,PYN,VAY,PCK,SWL,PCW,PML,PLM,VYM,VMY,PFE,YSM,ISF,QWV,WVC,CWY,MTF,PLQ,ILM,YQV,PCC,YMI,WKC,PMH,WKW,WYE,WFK,WRR,WKW,RKF,WKS,VWW,VWW,PLK,YWL,KLK,FLR,YWL,NFK,LWY,HWF,LRI,WGW,WFL,FYF,RHW,PLK,KLK,LRI,KIW,QWR,IWN,RRK,KVR,NQY,WNP,LRY,FMY,WMH,WIK,YFI,IRA,NTH,WNP,YFI,WGV,HKL,WRG,YYT,QPW,LYL,TRA,RKA,WHA,LYL,AFL,FII,RPL,FVI,YSH,LYS,IFW,KIP,FII,WQE,FCP,NHI,WAG,VRQ,GPR,LYS,NRE,FLT,YVP,LYM,IIP,WRC,NTK,QFH,FQW,NTK,YVP,LYN,FGF,LKS,GYL,FIE,KGS,VFA,RFN,LYH,QFH,RVI,VAY,LKS,QYF,WMN,DRG,VYP,YGT,IQW,KIA,QKV,HMK,WQL,RFN,MHP,VRD,KVA,ITR,NQG,YMY,RDG,WMK,YII,NKI,PMR,HML,VAY,KHM,YGT,HAH,TRP,KIA,IWT,FMA,CWP,ICY,HMK,KMS,MIP,FSV,PSH,KVA,KNL,VKT,MHP,KHM,PFI,TRP,RDG,QGR,WMS,YIV,KAC,LQH,MIP,MFS,PSH,VKT,NGI,PVS,NPL,LSP,TKQ,QII,QGR,MFS,VKA,LQH,PPQ,QHL,LSP,VKA,QII,LMS,PHQ,RFA,MCP,NGC,QHL,YCI,MQF,SNF,YMA,LQY,LPQ,VLL,YMA,AIK,WMT,EYH,VLL,SML,GLC,END,WGS,RAD,GWV,RAD,HHS,EAF,MGI,IVN,SEW,QHA,THM,CLY,NMC,TLL及びLMWから選択されるアミノ酸配列からなる、胆汁酸結合ペプチド。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【図20】
【図21】
【図22】
【図24】
【図25】
【図26】
【図27】
【図28】
【図29】
【図31】
【図32】
【図33】
【図34】
【図35】
【図36】
【図37】
【図38】
【図23】
【図30】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図12】
【図13】
【図14】
【図15】
【図16】
【図17】
【図18】
【図19】
【図20】
【図21】
【図22】
【図24】
【図25】
【図26】
【図27】
【図28】
【図29】
【図31】
【図32】
【図33】
【図34】
【図35】
【図36】
【図37】
【図38】
【図23】
【図30】
【公開番号】特開2010−222300(P2010−222300A)
【公開日】平成22年10月7日(2010.10.7)
【国際特許分類】
【出願番号】特願2009−71498(P2009−71498)
【出願日】平成21年3月24日(2009.3.24)
【出願人】(504139662)国立大学法人名古屋大学 (996)
【Fターム(参考)】
【公開日】平成22年10月7日(2010.10.7)
【国際特許分類】
【出願日】平成21年3月24日(2009.3.24)
【出願人】(504139662)国立大学法人名古屋大学 (996)
【Fターム(参考)】
[ Back to top ]