機能性ペプチドを表すルールの抽出法、機能性ペプチドの設計法及び調製法、ポリペプチド又はポリペプチド含有組成物の評価法、並びに機能性ペプチド

【課題】機能性ペプチドを効率的に見出すことを可能にする手段を提供する。また、機能性の高いペプチドを提供。
【解決手段】以下のステップ、（１）アミノ酸残基数が同一で且つ配列が互いに異なる複数のペプチド配列からなるペプチドライブラリーを用意するステップ、（２）Ｎ末端又はＣ末端からの位置毎に構成アミノ酸の物理化学的性質を数値化することによって、前記ペプチドライブラリーに含まれる各ペプチド配列を数値データに変換するステップ、（３）前記数値データを入力変数として階層的クラスタ分析し、各ペプチド配列を、Ｎ末端又はＣ末端からの位置毎に前記物理的性質の数値範囲で規定される複数のクラスタに分類するステップ、（４）前記複数のクラスタの中から、クラスタ毎、所定数のペプチド配列を選抜するステップ、を経て選抜したペプチド配列からなるペプチドを試料として機能性アッセイを行い、ペプチドを設計する。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、機能性ペプチドの設計手段、及び設計された機能性ペプチドの利用法に関する。詳しくは、機能性ペプチドの設計に有用なルールを抽出する方法、抽出されたルールを利用して機能性ペプチドを設計又は調製する方法、抽出されたルール又は設計された機能性ペプチドの配列情報を利用してペプチド又はペプチド含有組成物を評価する方法、及び機能性ペプチドが提供される。
【背景技術】
【０００２】
近年、生活習慣病が世界の先進国では深刻に蔓延しており、高コレステロール血症、高トリグリセライド血症、又は動脈硬化症の予防・改善のための医薬又は食品の提供が切望されている。我が国における死因の２位は心疾患、３位は脳血管疾患であり、これらはいずれも循環器系疾患の動脈硬化性疾患である。循環器系疾患を罹患する患者数の増加を背景とし、高コレステロール血症を抑える治療薬は現在、大きな市場を形成している。
【０００３】
循環器系疾患の発症は生活環境に非常に大きく影響されるため、予防医療（即ち、日常的に摂取する食品成分などによって血中コレステロール値の低減を図ること）の重要性が強く認識されつつある。血中コレステロールを低減する、食品成分中のタンパク質としては大豆タンパク質、乳製品に含まれるホエータンパク質、卵白中タンパク質などが知られている(非特許文献１、２)。また、タンパク質と同様に血中コレステロール値の低減効果を示すペプチドも数多く報告されている(特許文献１〜９)。これら既知の血中コレステロール低減ペプチドの多くは、血中もしくは経口投与により血中コレステロールを低減することが確認されているが、結果として効果が確認されているだけであり、その作用機序の詳細は明らかでないものが多い。
【０００４】
一方、血中コレステロールをより安全に低減させる一つの機構として胆汁酸結合ペプチドによるもの、即ち、（１）腸管内における胆汁酸の再吸収を胆汁酸結合ペプチドが阻害し、その結果、血中コレステロールが低減するというメカニズムと、（２）腸管内の胆汁酸混合ミセル中へのコレステロールの溶解性を胆汁酸結合ペプチドが低下させ、その結果、血中コレステロールが低減するというメカニズムが知られている（非特許文献３）。
【０００５】
ところで、従来の研究手法では、（１）様々な食品タンパク質を無作為（ランダム）に酵素で分解した消化物の中から胆汁酸に結合する画分を見出し、（２）その血中コレステロール低減効果を観察する、という方法が採られている。これまでの報告の中で特許文献１０は、胆汁酸結合性を利用した血中コレステロール低減効果を報告している。また、これまでの研究手法では、非常に限られたペプチド源（研究者が注目しているタンパク質の分解産物など）からしか探索されていないことから、同定に成功した有効な配列（胆汁酸に結合するペプチド配列）の情報は非常に少ない。
【特許文献１】特開２００７−１２６３６９号公報
【特許文献２】特開２００７−１３７８１６号公報
【特許文献３】特開２００２−８０４９５号公報
【特許文献４】特開２００２−８０３９３号公報
【特許文献５】特開２００１−１１４８００号公報
【特許文献６】特開平１０−１７５９９７号公報
【特許文献７】特開平９−１５７２９０号公報
【特許文献８】特開平７−２７８０１０号公報
【特許文献９】特表２００５−５１６０４３号公報
【特許文献１０】特開２００４−９９４４７号公報
【非特許文献１】Proc. Nutr. Soc., 41, 19, (1982)
【非特許文献２】Agric. Biol. Chem., 55, 813 (1991)
【非特許文献３】J. Nutr., 129, 1725 (1999)
【発明の概要】
【発明が解決しようとする課題】
【０００６】
同定された胆汁酸結合ペプチドの種類が少なく、胆汁酸結合に重要な配列の特徴などに関する情報が乏しいことから、新規な胆汁酸結合ペプチドを効率的に見出すことができないのが現状である。同様の理由から、既知の胆汁酸結合ペプチドよりも有効性の高いペプチドを設計することも困難である。また、各胆汁酸結合ペプチドを相対的に評価することが困難であり、より有効な胆汁酸ペプチドの設計において、既知の胆汁酸結合ペプチドの配列情報を有効に利用できていない状況にある。さらには、天然由来のペプチド断片の情報しかない場合、非天然型ペプチドの中から有効性の高いものを見出すことは極めて難しい。
【０００７】
一方、既知の胆汁酸結合ペプチドが少ない以上、各種ポリペプチド（動物由来タンパク質や植物由来タンパク質など）を検索対象としても、胆汁酸結合ペプチドを含有するポリペプチドを見出せる可能性は低い。胆汁酸結合ペプチドの含有量が多いポリペプチドともなれば、それを見出せる可能性はないに等しい。
【０００８】
ところで、ある程度の数の胆汁酸結合ペプチドが同定されていれば、それらを包括的に捉え、その含有量をポリペプチド間で比較し、各ポリペプチドの胆汁酸結合能を評価できる。つまり、ポリペプチド全体としての胆汁酸結合能を評価できるようになる。このような評価手法を利用すれば、胆汁酸結合能の高いポリペプチドを効率的に検索、同定することが可能である。しかしながら実際は、同定された胆汁酸結合ペプチドが非常に限られているため当該評価手法は利用できず、有効なポリペプチドを効率的に検索、同定することができない。
【０００９】
以上の各課題は胆汁酸結合ペプチドに固有のものではなく、機能性ペプチド全般に当てはまる。つまり、天然であるか非天然であるかを問わず、機能性ペプチド（特に、有効性の高いペプチド）を効率的に見出すことを可能にする手段の提供が望まれていた。また、機能性ペプチドの含有量の多いポリペプチドや食品を見出す手段の提供も望まれていた。更には、機能性の高いペプチド（高機能ペプチド）の提供も望まれていた。
【課題を解決するための手段】
【００１０】
上記課題を解決すべく本発明者らは、図１に示す通り、大別して４種の手法、即ち（Ａ）既知の機能性ペプチド（種ペプチド）の改変を利用して機能性ペプチド配列を検索・設計する方法、（Ｂ）既知のタンパク質を断片化して得られるペプチド断片の中から機能性ペプチドを特定する方法、（Ｃ）ファジーニューラルネットワーク（FNN）解析を利用して機能性ペプチドを検索・設計する方法、及び（Ｄ）階層的クラスタリング法を利用して機能性ペプチドを検索・設計する方法により、新規な機能性ペプチドを網羅的に探索・設計するという独自の戦略を立てた。
【００１１】
（Ａ）の方法では、既知のペプチド（種ペプチド）の１残基置換による改変アミノ酸配列の作成(A-1)、各改変アミノ酸配列と標的を用いた機能性アッセイ(A-2)、アッセイの結果に基づくルールの抽出（各位置について好ましいアミノ酸を特定）(A-3)、ルールに従うペプチドの検索・設計(A-4)、を順に行い機能性ペプチドを見出す。
【００１２】
（Ｂ）の方法では、特定のタンパク質（種タンパク質）の断片化(B-1)、及び断片ペプチドと標的を用いた機能性アッセイ(B-2)、アッセイの結果に基づく機能性ペプチド配列の特定(B-3)、を順に行い機能性ペプチドを見出す。
【００１３】
（Ｃ）の方法では、ペプチドライブラリーからの複数のペプチド配列の選抜(C-1)、選抜したペプチド配列と標的とを用いた機能性アッセイ(C-2)、アッセイの結果と各配列の物理的特徴を基にしたFNN解析(C-3)、FNNルールの抽出(C-4)、（C-2)〜(C-4)の繰り返し（必要に応じて）(C-5)、及びFNNルール又は構築された予測モデルを利用したペプチド配列の検索・設計(C-6)、を順に行い機能性ペプチドを見出す。当該方法の場合、機能性アッセイの結果として、機能性の高いペプチド配列が見出される可能性がある。
【００１４】
（Ｄ）の方法では、物理的指標の組合せに基づく、ペプチド配列の複数のクラスタへの分類（階層的クラスタ分析）(D-1)、各クラスタから選抜した配列と標的とを用いた機能性アッセイ(D-2)、アッセイの結果に基づく、クラスタの順位付け(D-3)、上位クラスタからのルール（物理的指標の組合せ）の抽出(D-4)、ルールに従うペプチドの探索・設計(D-5)、を順に行い機能性ペプチドを見出す。当該方法の場合、上位クラスタに含まれるペプチド配列を機能性の高いペプチド配列として抽出することが可能である。
【００１５】
各手法で見出されたペプチド配列は必要に応じて更に選抜される。ここでの選抜として、合成効率、合成コスト、特性（溶解度、熱安定性、pH安定性、立体構造等）等による選抜、細胞や動物等を利用したアッセイによる選抜、又はこれら両方の選抜を行うことができる。また、（Ａ）〜（Ｄ）の方法を併用することによる選抜も可能である。
【００１６】
以上の（Ａ）〜（Ｄ）の手法の有効性を、胆汁酸結合ペプチドをモデルとして検証した（図２）。その際、機能性アッセイとして、コンビナトリアルケミストリーの一手法であるペプチドアレイを利用し、大量のペプチド配列のアッセイを可能とした。ペプチドアレイを利用した、このように大規模な胆汁酸結合ペプチドの探索は過去に報告がない。
【００１７】
検証の結果、いずれの手法によっても、複数の胆汁酸結合ペプチドを見出すことができた。即ち、（Ａ）〜（Ｄ）の方法によれば多数の機能性ペプチドを同定できることが確認された。また、検証による副産物として、天然由来・非天然由来を問わず、多数の胆汁酸結合ペプチドの配列情報（配列番号１〜２２３並びにIIK,GTV,WIY,YYW,WRW,PWR,WFW,WYM,IWW,YWM,FWY,LWY,WYD,WMY,WYF,MWF,YFY,WWT,WWI,YYF,FMF,YMW,PFF,AWY,WMM,NWY,PWM,FWV,WYV,YFM,YGW,PVW,WRI,QWF,WHF,MWM,PIY,LFF,YSW,WNF,WSL,YLF,YYI,WYT,MYY,IWM,WHM,WLA,YQY,IQW,WLN,WMQ,WAM,AWM,TWY,WSM,VWI,MFL,NWM,WVQ,FGL,FNY,PIR,PWN,MWL,YGL,NWI,AWI,VFI,YSF,MIF,FVM,TWM,WQI,MYM,TWI,PMG,IGY,IML,VLF,YIV,YAM,PYN,VAY,PCK,SWL,PCW,PML,PLM,VYM,VMY,PFE,YSM,ISF,QWV,WVC,CWY,MTF,PLQ,ILM,YQV,PCC,YMI,WKC,PMH,WKW,WYE,WFK,WRR,WKW,RKF,WKS,VWW,VWW,PLK,YWL,KLK,FLR,YWL,NFK,LWY,HWF,LRI,WGW,WFL,FYF,RHW,PLK,KLK,LRI,KIW,QWR,IWN,RRK,KVR,NQY,WNP,LRY,FMY,WMH,WIK,YFI,IRA,NTH,WNP,YFI,WGV,HKL,WRG,YYT,QPW,LYL,TRA,RKA,WHA,LYL,AFL,FII,RPL,FVI,YSH,LYS,IFW,KIP,FII,WQE,FCP,NHI,WAG,VRQ,GPR,LYS,NRE,FLT,YVP,LYM,IIP,WRC,NTK,QFH,FQW,NTK,YVP,LYN,FGF,LKS,GYL,FIE,KGS,VFA,RFN,LYH,QFH,RVI,VAY,LKS,QYF,WMN,DRG,VYP,YGT,IQW,KIA,QKV,HMK,WQL,RFN,MHP,VRD,KVA,ITR,NQG,YMY,RDG,WMK,YII,NKI,PMR,HML,VAY,KHM,YGT,HAH,TRP,KIA,IWT,FMA,CWP,ICY,HMK,KMS,MIP,FSV,PSH,KVA,KNL,VKT,MHP,KHM,PFI,TRP,RDG,QGR,WMS,YIV,KAC,LQH,MIP,MFS,PSH,VKT,NGI,PVS,NPL,LSP,TKQ,QII,QGR,MFS,VKA,LQH,PPQ,QHL,LSP,VKA,QII,LMS,PHQ,RFA,MCP,NGC,QHL,YCI,MQF,SNF,YMA,LQY,LPQ,VLL,YMA,AIK,WMT,EYH,VLL,SML,GLC,END,WGS,RAD,GWV,RAD,HHS,EAF,MGI,IVN,SEW,QHA,THM,CLY,NMC,TLL及びLMW）がもたらされた。これらペプチドの中には、既知の胆汁酸結合ペプチドよりも高い結合能を示すものも数多く含まれていた。この事実は、上記手法の有効性を裏付ける。一方、胆汁酸結合ペプチドとして同定されたものの中には、非天然型ペプチドも数多く含まれていた。この事実は、未知ペプチドの設計法として上記手法が有効であることを示す。
【００１８】
一方、後述の実施例に示す通り、（Ｃ）の手法によって、胆汁酸結合ペプチド（６アミノ酸残基）の構造的ルールが見出された。同様に、（Ｄ）の手法によって、胆汁酸結合ペプチド（３アミノ酸残基）の構造的ルールが見出された。これらの構造的ルールは胆汁酸結合ペプチドの設計ないし同定に有用である。
【００１９】
同定された胆汁酸結合ペプチド数種について、より生体に近いアッセイ系で胆汁酸結合能を評価した。その結果、既知の胆汁酸結合ペプチドよりも高い結合能を示すペプチドが見出された。コレステロール溶解阻害能についても評価した結果、いくつかのペプチドは非常に高いコレステロール溶解阻害能を示した。つまり、有望なコレステロール低減ペプチドの同定に成功したことが明らかとなった。
【００２０】
ここで、多数の機能性ペプチドを同定できれば、各機能性ペプチドの相対評価が可能となる。また、機能性ペプチドを含むポリペプチド（タンパク質）の同定も容易となる。一方、多数の機能性ペプチドの配列情報があれば、それを利用してポリペプチドを評価（スコア化）することができる。具体的には、同定した機能性ペプチドを包括的に捉え、各機能性ペプチドの含有量をポリペプチド間で比較すれば、当該機能に関する各ポリペプチドの有効性を点数（スコア）として示すことが可能となる。このような評価法を利用すれば、ポリペプチド又はポリペプチド含有組成物（例えばポリペプチド含有食品）を機能性という新たな観点から特定したり、分類したりすることができる。或いは、特定の機能性に関してより有効なポリペプチド又はポリペプチド含有組成物の創出が可能となる。
【００２１】
ここで、（Ｃ）及び（Ｄ）の手法は、膨大な数の候補の中から効率的に有効なペプチドを選抜できる点、様々な長さのペプチドを設計可能である点、既知の機能性ペプチドの配列に依存しない全く新しいペプチドを見出すことが可能である点等、数多くの利点を有し、機能性ペプチドの設計法として特に有効であるといえる。
【００２２】
ところで、（Ａ）〜（Ｄ）の方法では、見出されるペプチドの長さに制約がある（（Ｃ）及び（Ｄ）の手法では様々な長さのペプチドを設計可能であるものの、以下の制約がある）。即ち、各手法によって見出されるペプチドの長さは、（Ａ）の手法においては種ペプチドの長さに依存し、（Ｂ）の手法においては断片化の条件に依存し、（Ｃ）及び（Ｄ）の手法においてはペプチドライブラリーに含まれるペプチドの長さに依存する。この問題を克服するため、見出されたペプチド配列を連結することによって、より長いペプチドを設計するという手法を創出した。この手法では、（Ａ）〜（Ｄ）の方法によって設計されたペプチドの中から、共通する配列部分をもつものを抽出し、連結する（図３）。
【００２３】
本発明は以上の検討の末に完成されたものであり、次の通りである。
［１］以下のステップ（１）〜（７）を含む、機能性ペプチドを表すルールの抽出法、
（１）アミノ酸残基数が同一で且つ配列が互いに異なる複数のペプチド配列からなるペプチドライブラリーを用意するステップ、
（２）Ｎ末端又はＣ末端からの位置毎に構成アミノ酸の物理化学的性質を数値化することによって、前記ペプチドライブラリーに含まれる各ペプチド配列を数値データに変換するステップ、
（３）前記数値データを入力変数として階層的クラスタ分析し、各ペプチド配列を、Ｎ末端又はＣ末端からの位置毎に前記物理的性質の数値範囲で規定される複数のクラスタに分類するステップ、
（４）前記複数のクラスタの中から、クラスタ毎、所定数のペプチド配列を選抜するステップ、
（５）選抜したペプチド配列からなるペプチドを試料として機能性アッセイを行い、各ペプチド配列の機能性データを取得するステップ、
（６）機能性データに基づき、機能性の順位を前記複数のクラスタに付与するステップ、
（７）上位の順位が付与されたクラスタを規定する、前記物理化学的性質の数値範囲又は該数値範囲を満足するアミノ酸の種類を、高機能ペプチドの特徴を表すルールとして抽出するステップ。
［２］前記機能性が高親和性である、［１］に記載の抽出法。
［３］前記機能性が、胆汁酸に対する高親和性である、［１］に記載の抽出法。
［４］ステップ（１）における前記アミノ酸残基数が３〜６である、［１］〜［３］のいずれか一項に記載の抽出法。
［５］ステップ（２）における前記物理的性質が等電点、正規化ファンデルワールス体積、βタンパク質のためのアルファへリックスの指標、βタンパク質のためのベータ鎖の指標、タンパク質安定化のための側鎖の貢献度、原子間ポテンシャルに関する知識を基にした安定化尺度、疎水性指標、正規化されたターン頻度、ベータ鎖領域における自由エネルギー、アルファ−へリックス領域における自由エネルギー、極性、側鎖の相互作用、及びアミノ酸の分配度からなる群より選択される２種以上の性質である、［１］〜［４］のいずれか一項に記載の抽出法。
［６］ステップ（２）における前記物理的性質が、等電点、正規化ファンデルワールス体積、βタンパク質のためのアルファへリックスの指標、βタンパク質のためのベータ鎖の指標、タンパク質安定化のための側鎖の貢献度、原子間ポテンシャルに関する知識を基にした安定化尺度、疎水性指標、正規化されたターン頻度、ベータ鎖領域における自由エネルギー、アルファ−へリックス領域における自由エネルギー、極性、側鎖の相互作用、及びアミノ酸の分配度からなる、１３種の性質である、［１］〜［４］のいずれか一項に記載の抽出法。
［７］ステップ（３）で生成されるクラスタの数が１０〜１００である、［１］〜［６］のいずれか一項に記載の抽出法。
［８］ステップ（４）における前記所定数が３〜３０である、［１］〜［７］のいずれか一項に記載の抽出法。
［９］ステップ（５）における前記機能性アッセイが、前記試料である複数のペプチドが配列毎に区画化されて基板に固定されたなるペプチドチップを用いて行われる、［１］〜［８］のいずれか一項に記載の抽出法。
［１０］ステップ（６）に続いて、以下のステップ（６−１）〜（６−４）を１回又は２回以上実施した後、ステップ（７）を実施する、［１］〜［９］のいずれか一項に記載の抽出法、
（６−１）上位の順位が付与された複数のクラスタを特定するステップ、
（６−２）特定された複数のクラスタより、クラスタ毎、所定数のペプチド配列を選抜するステップ、
（６−３）選抜したペプチド配列からなるペプチドを試料として機能性アッセイを行い、各ペプチド配列の機能性データを取得するステップ、
（６−４）機能性データに基づき、機能性の順位を前記複数のクラスタに付与するステップ。
［１１］ステップ（７）において、上位ｎ位（但し、ｎは２〜５の整数）までのクラスタからそれぞれルールを抽出する、［１］〜［１０］のいずれか一項に記載の抽出法。
［１２］ステップ（７）において、最上位の順位が付与されたクラスタのみからルールを抽出する、［１］〜［１０］のいずれか一項に記載の抽出法。
［１３］以下のステップ（１）〜（７）を含む、機能性ペプチドを表すルールの抽出法、
（１）アミノ酸残基数が同一で且つ配列が互いに異なる複数のペプチド配列からなるペプチドライブラリーを用意するステップ、
（２）前記ペプチドライブラリーから複数のペプチド配列を選抜するステップ、
（３）選抜したペプチド配列からなるペプチドを試料として機能性アッセイを行い、各ペプチド配列の機能性データを取得するステップ、
（４）機能性データに基づき、機能性アッセイに供したペプチド配列の中から、複数の高機能配列及び複数の低機能配列を選抜するステップ、
（５）Ｎ末端又はＣ末端からの位置毎に構成アミノ酸の物理化学的性質を数値化することによって、選抜した高機能配列及び低機能配列を数値データに変換するステップ、
（６）前記数値データを入力変数として、学習モデルを用いた解析を行うステップ、
（７）解析結果より、配列上の１以上の位置について前記物理的性質の条件又は該条件を満足するアミノ酸の種類を示すルールであって、高機能ペプチド配列の特徴を表す１又は２以上のルールを抽出するステップ。
［１４］ステップ（７）の後、以下のステップ（８）を行う、［１３］に記載の抽出法、
（８）ステップ（１）で用意したペプチドライブラリーの内、以前の選抜の際に選抜されなかったペプチド配列の集合の中から、抽出した前記ルールに適合する複数のペプチド配列を選抜した後、ステップ（３）〜（７）を行うステップ。
［１５］学習モデルを用いた前記解析がファジィニューラルネットワーク解析であり、
ステップ（６）においてファジィニューラルネットワーク解析の結果として予測モデルが構築され、ステップ（７）では該予測モデルより前記ルールが抽出される、［１３］に記載の抽出法。
［１６］［１］〜［１５］のいずれか一項に記載の抽出法によって得られたルールに従ってペプチドを設計するステップを含む、機能性ペプチドの設計法。
［１７］複数の候補ペプチド配列の中から、［１］〜［１５］のいずれか一項に記載の抽出法によって得られたルールに適合するペプチド配列を選抜するステップを含む、機能性ペプチドの設計法。
［１８］［１］〜［１２］のいずれか一項に記載の抽出法によって得られた、上位の順位が付与されたクラスタに含まれる１又は２以上のペプチド配列を高機能ペプチド配列として選択するステップを含む、機能性ペプチドの設計法。
［１９］以下のステップ（１）〜（３）を含む、機能性ペプチドの設計法、
（１）複数の候補ペプチドを用意するステップ、
（２）Ｎ末端又はＣ末端からの位置毎に構成アミノ酸の物理化学的性質を数値化することによって、前記複数の候補ペプチド配列をそれぞれ数値データに変換するステップ、
（３）［１５］に記載の抽出法においてルールの抽出の際に構築された予測モデルを用い、前記数値データを入力変数としてファジィニューラルネットワーク解析を行うステップであって、該ファジィニューラルネットワーク解析において、（ｉ）ルールに適合するペプチド配列の選抜、（ｉｉ）選抜されたペプチド配列の予測値の評価、及び（ｉｉｉ）予測値の高いペプチド配列の選抜、が順に行われるステップ。
［２０］（ｉｉｉ）の処理の後、選抜されたペプチド配列の信頼度の評価が行われる、［１９］に記載の設計法。
［２１］以下のステップ（１）〜（３）を含む、機能性ペプチドの設計法、
（１）以下の（ａ）〜（ｄ）からなる群より選択される集合を用意するステップ、
（ａ）［１］〜［１２］のいずれか一項に記載の抽出法によって得られた、上位の順位が付与されたクラスタに含まれるペプチド配列の集合、
（ｂ）［１］〜［１２］のいずれか一項に記載の抽出法によって得られたルールに適合するペプチド配列の集合、
（ｃ）［１３］〜［１５］のいずれか一項に記載の抽出法によって得られたルールに適合するペプチド配列の集合、
（ｄ）（ａ）〜（ｃ）からなる群より選択される２以上の集合を結合した集合、
（２）用意した集合の中から、共通する部分配列を認める第１ペプチド配列及び第２ペプチドを選抜するステップであって、第２ペプチド配列の方が、該部分配列よりもＣ末端側のアミノ酸の数が多いステップ、
（３）前記第１ペプチド配列から前記部分配列よりもＣ末端側のアミノ酸を除去して得られる第１部分配列と、前記第２ペプチド配列から前記部分配列及び前記部分配列よりもＮ末端側のアミノ酸を除去して得られる第２部分配列とを、該第１部分配列がＮ末端側に配置されるように連結するステップ。
［２２］前記第１ペプチド配列では前記部分配列がＣ末端アミノ酸を含み、前記第２ペプチド配列では前記部分配列がＮ末端アミノ酸を含む、［２１］に記載の設計法。
［２３］下記条件１〜３の少なくとも１つを満足する、［２１］又は［２２］に記載の設計法、
条件１：それに含まれるペプチド配列のアミノ酸残基数が異なる複数のペプチドライブラリーを用意し、各ペプチドライブラリーを用いて［１］〜［１２］のいずれか一項に記載の抽出法を行うことにし、各回について得られた、上位の順位が付与されたクラスタに含まれるペプチド配列の集合を全て連結し、前記集合（ａ）とする、
条件２：それに含まれるペプチド配列のアミノ酸残基数が異なる複数のペプチドライブラリーを用意し、各ペプチドライブリーを用いて［１］〜［１２］のいずれか一項に記載の抽出法を行ってルールを得た後、抽出されたルール毎、適合するペプチドの集合を作製し、最後に全集合を連結して前記集合（ｂ）とする、
条件３：それに含まれるペプチド配列のアミノ酸残基数が異なる複数のペプチドライブラリーを用意し、各ペプチドライブリーを用いて［１３］〜［１５］のいずれか一項に記載の抽出法を行ってルールを得た後、抽出されたルール毎、適合するペプチドの集合を作製し、最後に全集合を連結して前記集合（ｃ）とする。
［２４］ステップ（１）において前記集合（ａ）を用意することにし、
ステップ（２）では、第１ペプチド配列と対をなす第２ペプチド配列の候補が二つ以上存在する場合には、より上位の順位が付与されたクラスタに属するペプチド配列を優先して第２ペプチド配列に用い、第２ペプチド配列と対をなす第１ペプチド配列の候補が二つ以上存在する場合には、より上位の順位が付与されたクラスタに属するペプチド配列を優先して第１ペプチド配列に用いる、［２１］〜［２３］のいずれか一項に記載の設計法。
［２５］ステップ（１）において前記集合（ｂ）を用意することにし、
ステップ（２）では、第１ペプチド配列と対をなす第２ペプチド配列の候補が二つ以上存在する場合には、より上位の順位が付与されたクラスタのルールに適合するペプチド配列の方を優先して第２ペプチド配列に用い、第２ペプチド配列と対をなす第１ペプチド配列の候補が二つ以上存在する場合には、より上位の順位が付与されたクラスタのルールに適合するペプチド配列の方を優先して第１ペプチド配列に用いる、［２１］〜［２３］のいずれか一項に記載の設計法。
［２６］［１６］〜［２５］のいずれか一項に記載の設計法で設計されたペプチドを調製するステップを含む、機能性ペプチドの調製法。
［２７］以下のステップ（１）〜（６）を含む、ポリペプチド又はポリペプチド含有組成物の評価法、
（１）ポリペプチドの配列を用意するステップ、
（２）［１］〜［１５］のいずれか一項に記載の抽出法によって抽出された１又は２以上のルールに対してそれぞれスコアを関連付けるステップ、
（３）前記ルールとの照合が可能な一定の長さに前記ポリペプチドの配列を断片化するステップ、
（４）各断片配列を前記ルールと照合し、適合性を判定するステップ、
（５）ルールに適合すると判定された断片配列に対して、該ルールに関連付けられたスコアを付与するステップ、
（６）付与された全てのスコアを積算して総スコアを算出するステップであって、該総スコアが前記ポリペプチドの機能性を表す指標となるステップ。
［２８］以下の（Ａ）〜（Ｃ）のいずれかの特徴を備える、［２７］に記載の評価法、
（Ａ）ステップ（３）で生じた断片配列の中から、プロテアーゼ切断部位を内在する断片配列を除いた後にステップ（４）を行う、
（Ｂ）ステップ（６）において、プロテアーゼ切断部位を内在する断片配列以外の断片配列に付与されたスコアのみを積算する、
（Ｃ）ステップ（６）において、付与された全スコアを積算した後、ステップ（３）で生じた断片配列の中から、プロテアーゼ切断部位を内在する断片配列に付与されたスコアを除算する。
［２９］以下のステップ（１）〜（６）を含む、ポリペプチド又はポリペプチド含有組成物の評価法、
（１）ポリペプチドの配列を用意するステップ、
（２）［１］〜［１２］のいずれか一項に記載の抽出法によって得られた、上位の順位が付与されたクラスタに含まれる各ペプチド配列に対して、同一のクラスタに含まれるペプチド配列は各々相同性の高いスコアとなり且つクラスタの順位に対応したスコアとなるように、スコアを関連付けるステップ、
（３）スコアを関連付けた各ペプチド配列をそれぞれ前記ポリペプチドの配列と照合し、配列が一致する領域の数を調べるステップ、
（４）ステップ（３）で判明した前記領域の数と、ステップ（２）で関連付けたスコアとを乗ずることによってペプチド配列毎にスコアを算出した後、全てのスコアを積算して総スコアを算出するステップであって、該総スコアが前記ポリペプチドの機能性を表す指標となるステップ。
［３０］以下のステップ（１）〜（５）を含む、ポリペプチド又はポリペプチド含有組成物の評価法、
（１）ポリペプチドの配列を用意するステップ、
（２）［１３］〜［１５］のいずれか一項に記載の抽出法においてルールを抽出する際に用いた学習モデルで解析可能な一定の長さに前記ポリペプチドの配列を断片化するステップ、
（３）Ｎ末端又はＣ末端からの位置毎に構成アミノ酸の物理化学的性質を数値化することによって、各断片配列を数値データに変換するステップ、
（４）前記学習モデルを用い、前記数値データを入力変数として、学習モデルによる解析を行い、各断片配列の予測機能度を算出するステップ、
（５）算出された予測機能度を積算するステップであって、得られた総予測機能度が前記ポリペプチドの機能性を表す指標となるステップ。
［３１］配列番号１〜２２３のいずれかのアミノ酸配列、又は以下の群、即ちIIK,GTV,WIY,YYW,WRW,PWR,WFW,WYM,IWW,YWM,FWY,LWY,WYD,WMY,WYF,MWF,YFY,WWT,WWI,YYF,FMF,YMW,PFF,AWY,WMM,NWY,PWM,FWV,WYV,YFM,YGW,PVW,WRI,QWF,WHF,MWM,PIY,LFF,YSW,WNF,WSL,YLF,YYI,WYT,MYY,IWM,WHM,WLA,YQY,IQW,WLN,WMQ,WAM,AWM,TWY,WSM,VWI,MFL,NWM,WVQ,FGL,FNY,PIR,PWN,MWL,YGL,NWI,AWI,VFI,YSF,MIF,FVM,TWM,WQI,MYM,TWI,PMG,IGY,IML,VLF,YIV,YAM,PYN,VAY,PCK,SWL,PCW,PML,PLM,VYM,VMY,PFE,YSM,ISF,QWV,WVC,CWY,MTF,PLQ,ILM,YQV,PCC,YMI,WKC,PMH,WKW,WYE,WFK,WRR,WKW,RKF,WKS,VWW,VWW,PLK,YWL,KLK,FLR,YWL,NFK,LWY,HWF,LRI,WGW,WFL,FYF,RHW,PLK,KLK,LRI,KIW,QWR,IWN,RRK,KVR,NQY,WNP,LRY,FMY,WMH,WIK,YFI,IRA,NTH,WNP,YFI,WGV,HKL,WRG,YYT,QPW,LYL,TRA,RKA,WHA,LYL,AFL,FII,RPL,FVI,YSH,LYS,IFW,KIP,FII,WQE,FCP,NHI,WAG,VRQ,GPR,LYS,NRE,FLT,YVP,LYM,IIP,WRC,NTK,QFH,FQW,NTK,YVP,LYN,FGF,LKS,GYL,FIE,KGS,VFA,RFN,LYH,QFH,RVI,VAY,LKS,QYF,WMN,DRG,VYP,YGT,IQW,KIA,QKV,HMK,WQL,RFN,MHP,VRD,KVA,ITR,NQG,YMY,RDG,WMK,YII,NKI,PMR,HML,VAY,KHM,YGT,HAH,TRP,KIA,IWT,FMA,CWP,ICY,HMK,KMS,MIP,FSV,PSH,KVA,KNL,VKT,MHP,KHM,PFI,TRP,RDG,QGR,WMS,YIV,KAC,LQH,MIP,MFS,PSH,VKT,NGI,PVS,NPL,LSP,TKQ,QII,QGR,MFS,VKA,LQH,PPQ,QHL,LSP,VKA,QII,LMS,PHQ,RFA,MCP,NGC,QHL,YCI,MQF,SNF,YMA,LQY,LPQ,VLL,YMA,AIK,WMT,EYH,VLL,SML,GLC,END,WGS,RAD,GWV,RAD,HHS,EAF,MGI,IVN,SEW,QHA,THM,CLY,NMC,TLL及びLMWから選択されるアミノ酸配列からなる、胆汁酸結合ペプチド。
【図面の簡単な説明】
【００２４】
【図１】機能性ペプチドを網羅的に探索・設計するための戦略を示す図。
【図２】機能性ペプチドを網羅的に探索・設計するための戦略（具体例）を示す図。
【図３】新規ペプチドの設計法を示す図。
【図４】階層的クラスタ分析を利用したルールの抽出法を示すフローチャート。
【図５】アミノ酸に関する１３種の性質の数値化の例を示す図。
【図６】ファジィニューラルネットワーク（FNN）解析を利用したルールの抽出法を示すフローチャート。
【図７】ANNの構造を示す図。
【図８】FNNの構造を示す図。
【図９】シグモイド関数を示す図。
【図１０】small(S)とbig(B)の2つのルールの分割を用いたときのFNNの構造を示す図。
【図１１】ファジールールの一例を示す図。
【図１２】ペプチド配列の設計法の一例を示すフローチャート。
【図１３】予測モデルを利用したペプチド配列の設計法を示すフローチャート。
【図１４】ペプチド配列の連結を利用したペプチド配列の設計法を示すフローチャート。
【図１５】ペプチド配列の連結を利用したペプチド配列の設計法（詳細）を示すフローチャート。
【図１６】ポリペプチド等の評価法を示すフローチャート。
【図１７】ポリペプチド等の評価法における断片化のステップを示す図。（Ａ）では、Ｎ末端（又はＣ末端）から３アミノ酸毎に区切り、トリペプチド配列の集合を得る。（Ｂ）では、Ｎ末端（又はＣ末端）の３アミノ酸を最初の断片とし、Ｎ末端（又はＣ末端）から１アミノ酸又は２アミノ酸だけＣ末端側にずらした位置からの３アミノ酸を次の断片とする。
【図１８】上位クラスタに含まれるペプチド配列を用いた評価法を示すフローチャート。
【図１９】予測モデルを用いた評価法を示すフローチャート。
【図２０】胆汁酸結合能の評価を示すフローチャート。
【図２１】胆汁酸結合能とアミノ酸配列の関係を表すルール。ａ．T検定により、好ましいアミノ酸を選出した。ｂ．好ましくないアミノ酸として、親和性を低下させる下位３位のアミノ酸を示した。
【図２２】胆汁酸結合アッセイの結果を示す表。３サンプルの平均蛍光強度（バックグラウンドの蛍光強度を差し引いた値）を示した。
【図２３】大豆タンパク質（βコングリシニン）由来のペプチド酸配列を用いた胆汁酸結合アッセイの結果を示す表。
【図２４】FNN解析によって選抜されたペプチド配列を用いた胆汁酸結合アッセイの結果を示す表。種ペプチド（VAWWMY）を基準(1)として3スポットの全てが0.8以上の場合にポジティブ配列とした。また、3スポットの全てがバックグラウンドと同等の場合にネガティブ配列とした。左の欄にはFNN解析によるペプチド配列の選抜方法を示した。
【図２５】（ａ）FNN解析により抽出された配列ルール表。（ｂ）配列ルール表より抽出されたポジティブルール。左の欄にはFNN解析によるペプチド配列の選抜方法を示した。
【図２６】FNN解析によって選抜されたペプチド配列を用いた胆汁酸結合アッセイ（２回目）の結果を示す表。種ペプチド（VAWWMY）を基準(1)として3スポットの全てが0.8以上の場合にポジティブ配列とした（P値（対ブランク）<0.05）。また、3スポットの全てが0.2以下の場合にネガティブ配列とした。左の欄にはFNN解析によるペプチド配列の選抜方法を示した。
【図２７】FNN解析により抽出されたルール。左の欄にはFNN解析によるペプチド配列の選抜方法を示した。
【図２８】FNN解析によって選抜されたペプチド配列を用いた胆汁酸結合アッセイ（３回目）の結果を示す表。左の欄にはFNN解析によるペプチド配列の選抜方法を示した。
【図２９】階層的クラスタ分析による分類結果を示す表。
【図３０】階層的クラスタ分析により形成された上位５個のクラスタ。
【図３１】上位クラスタ及び下位クラスタからの選抜したペプチド配列を用いたアッセイの結果。
【図３２】選抜された胆汁酸結合ペプチドの胆汁酸結合能を示す表。
【図３３】選抜されたペプチド配列の胆汁酸結合能を比較したグラフ。
【図３４】胆汁酸結合アッセイで最大の蛍光強度を示したペプチド配列の胆汁酸結合能を示すグラフ。
【図３５】選抜された胆汁酸結合ペプチドの胆汁酸ミセル形成阻害能を比較したグラフ。
【図３６】選抜された胆汁酸結合ペプチドの胆汁酸ミセル破壊能を比較したグラフ。
【図３７】P-1（PWWWMY：配列番号２）とP-3（VIWWFK：配列番号５）の胆汁酸ミセル破壊能を比較したグラフ。■：P-1、○：P-3、▲：コレスチラミン。
【図３８】選抜された胆汁酸結合ペプチドの生体コレステロール吸収阻害能を比較した表。P値をT検定で求めた。
【発明を実施するための形態】
【００２５】
＜機能性ペプチドを表すルールの抽出法＞
本発明の第一の局面は機能性ペプチドを表すルールの抽出法に関する。抽出したルールを用いれば、効率的に機能性ペプチドを設計ないし同定することができる。つまり、ルールは機能性ペプチドの設計ないし同定に有用である。
【００２６】
「機能性ペプチドを表すルール」とは、特定の機能を有するペプチドに共通する規則を表したものである。ルールの形式は、それを抽出する際に用いる手法によって異なる。ルールの詳細は後述する。「機能性ペプチド」とは、生物学的、医学的、薬学的、栄養学的、又は食品学的に有用な機能を有するペプチドをいう。「機能」の例として、特定の物質に対する親和性を挙げることができる。より具体的な例として、胆汁酸に対する親和性（結合性）を挙げることができる。「ペプチド」とは二つ以上のアミノ酸がペプチド結合によって連なった分子である。ペプチドのアミノ酸残基数は特に限定されない。即ち、慣例に従い、「ペプチド」は、オリゴペプチド及びポリペプチド（タンパク質を含む）を包括する用語として使用される。また、本明細書では慣例の標記法に従い左端がアミノ末端、右端がカルボキシ末端となるようにペプチドを表記する。
【００２７】
１．階層的クラスタ分析を利用したルールの抽出法
本発明の一態様では以下のステップ（１）〜（７）を行う（図４を参照）。
（１）アミノ酸残基数が同一で且つ配列が互いに異なる複数のペプチド配列からなるペプチドライブラリーを用意するステップ、
（２）Ｎ末端又はＣ末端からの位置毎に構成アミノ酸の物理的性質を数値化することによって、前記ペプチドライブラリーに含まれる各ペプチド配列を数値データに変換するステップ、
（３）前記数値データを入力変数として階層的クラスタ分析し、各ペプチド配列を、Ｎ末端又はＣ末端からの位置毎に前記物理的性質の数値範囲で規定される複数のクラスタに分類するステップ、
（４）前記複数のクラスタの中から、クラスタ毎、所定数のペプチド配列を選抜するステップ、
（５）選抜したペプチド配列からなるペプチドを試料として機能性アッセイを行い、各ペプチド配列の機能性データを取得するステップ、
（６）機能性データに基づき、機能性の順位を前記複数のクラスタに付与するステップ、
（７）上位の順位が付与されたクラスタを規定する、前記物理的性質の数値範囲又は該数値範囲を満足するアミノ酸の種類を、高機能ペプチドの特徴を表すルールとして抽出するステップ
【００２８】
本発明の抽出法ではまずペプチドライブラリーを用意する（ステップ（１））。「ペプチドライブラリー」とは、複数のペプチド配列の集合である。本発明で使用するペプチドライブラリーは、アミノ酸残基数が同一で且つ配列が互いに異なる複数のペプチド配列から構成される。ここでのアミノ酸残基数は特に限定されないが、例えば２〜１０、好ましくは３〜８、更に好ましくは３〜６である。アミノ酸残基数が少なすぎると、ペプチドライブラリーを構成するアミノ酸配列（以下、ペプチドライブラリーを構成する各アミノ酸配列のことを「メンバー」とも呼ぶ）の数が少なくなり、「効率的に多数のアミノ酸配列を分類する」という、本発明の特徴の一つが十分に活かされない。また、候補ペプチド配列の種類が少なくなることから、新規な機能性ペプチドを同定できる可能性が低くなる。一方、アミノ酸残基数が多すぎると、無作為の（偏りのない）ペプチドライブラリーを作製した場合のメンバー数が膨大となり、階層的クラスタ分析に多大な処理能力、処理時間が必要となる。
【００２９】
ペプチドライブラリー中のメンバー数は特に限定されないが、信頼性の高いルールの抽出のためにはメンバー数を多くするよい。但し、メンバー数の増大に応じて、後述の階層的クラスタ分析が複雑化することを考慮し、メンバー数を１０００〜１０００００、好ましくは２０００〜５０００００とする。信頼性の高いルールを抽出するためにはペプチド配列の偏りをなくすことが有効であり、即ち無作為に選択されたメンバーの集合（ランダム・ペプチドライブラリー）を使用するとよい。各メンバーを構成するアミノ酸は、典型的には、生体内でタンパク質を構成するアミノ酸、即ち、アラニン、アルギニン、アスパラギン、アスパラギン酸、システイン、グルタミン酸、グルタミン、グリシン、ヒスチジン、イソロイシン、ロイシン、リシン、メチオニン、フェニルアラニン、プロリン、セリン、トレオニン、トリプトファン、チロシン、バリン等である。但し、ペプチドを構成可能なアミノ酸であれば、これら以外のアミノ酸であってもよい。
【００３０】
次に、ペプチドライブラリーに含まれる各メンバーを階層的クラスタ分析で分析可能な数値データに変換する（ステップ（２））。具体的には、各メンバーについて、Ｎ末端又はＣ末端からの位置毎に構成アミノ酸の物理的化学性質を数値化し、物理的性質を表す数値の集合を各メンバーに付与する。
ここでの「物理的性質」とは、サイズ（大きさ）、疎水度、電荷、等電点など、アミノ酸の分類に利用される性質をいう。好ましくは、等電点、正規化ファンデルワールス体積、βタンパク質のためのアルファへリックスの指標、βタンパク質のためのベータ鎖の指標、タンパク質安定化のための側鎖の貢献度、原子間ポテンシャルに関する知識を基にした安定化尺度、疎水性指標、正規化されたターン頻度、ベータ鎖領域における自由エネルギー、アルファ−へリックス領域における自由エネルギー、極性、側鎖の相互作用、アミノ酸の分配度等電点、正規化ファンデルワールス体積、βタンパク質のためのアルファへリックスの指標、βタンパク質のためのベータ鎖の指標、タンパク質安定化のための側鎖の貢献度、原子間ポテンシャルに関する知識を基にした安定化尺度、疎水性指標、正規化されたターン頻度、ベータ鎖領域における自由エネルギー、アルファ−へリックス領域における自由エネルギー、極性、側鎖の相互作用、及びアミノ酸の分配度からなる群より選択される２種以上の性質を併用する。更に好ましくは、これら１３種の全てを併用する。この態様では各メンバーが、それを構成するアミノ酸の位置毎に１３種の数値を持つ数値データとなる。例えばメンバーのアミノ酸残基数が３であれば３９個（３×１３）の数値の集合（セット）からなる数値データとなる。尚、これら１３種の性質はGenome Net JapanのＤＢ（http://www.genome.ad.jp/dbget/aaindex.html）が提供する544指標の指標をクラスタ分類した際、もっとも互いに相関の低いクラスタ代表であるため、これらの総合は544指標での判断に相当するものと考えられる。
【００３１】
上記１３種の性質の数値化の例を図５に示す。図５の表では、既報の方法に従って各アミノ酸の１３指標が数値化されている。ここでの１３指標は等電点（Isoelectric point; Zimmerman,et,al., J.Theor.Biol., Vol.21,No.2,170-201(1968))、正規化ファンデルワールス体積（Normalized van der Waals volume; Fauchere,et,al., Int.J.Pept.Protein,Res., Vol.32,No.4,269-278,(1988))、βタンパク質のためのアルファへリックスの指標（Alpha-helix indices for beta-proteins; Geisow-Roberts, Int.J.Biol.Macromol.,Vol.2,No.6,387-389,(1980))、βタンパク質のためのベータ鎖の指標（Beta-strand indices for beta-proteins; Geisow-Roberts,Int.J.Biol.Macromol.,Vol.2,No.6,387-389,(1980))、タンパク質安定化のための側鎖の貢献度（Side-chain contribution to protein stability(kJ/mol); Takano-Yutani, Protein,Eng.,2001,Aug;14(8):525-8)、原子間ポテンシャルに関する知識を基にした安定化尺度（The stability scale from the knowledge-based atom-atom potential; Zhou-Zhou, Proteins.,2004,Feb,1;54(2):315-22)、疎水性指標（Hydropathy index; Kyte-Doolittle,J.Mol.Biol.,Vol.157,No.1,105-132,(1982))、正規化されたターン頻度（Normalized frequency of turn; Crawford,et,al.,Proc,Natl,Acad,Sci,U,S,A.,1973,Feb;70(2):538-42.)、ベータ鎖領域における自由エネルギー（Free energy in beta-strand region; Munoz-Serrano, Struct.Funct.Genet.,Vol.20,No.4,301-311,(1994))、アルファ-へリックス領域における自由エネルギー（Free energy in alpha-helical region; Munoz-Serrano, Struct.Funct.Genet.,Vol.20,No.4,301-311,(1994))、極性（Polarity; Zimmerman,et,al., J.Theor.Biol. Vol.21,No.2,170-201,(1968))、側鎖の相互作用（Side chain interaction parameter; Krigbaum-Komoriya, Biochim.Biophys.Acta, Vol.576,No.1,204-228,(1978))、アミノ酸の分配度（Amino acid distribution; Jukes,et,al., Science.,1975,Jun,4;189(4196):50-1)である。
【００３２】
続いて、ステップ（２）で生成した数値データを入力変数として階層的クラスタ分析を行い、各メンバーを、Ｎ末端又はＣ末端からの位置毎に物理的性質の数値範囲で規定される複数のクラスタに分類する（ステップ（３））。「階層的クラスタ分析」はクラスタ分析の一つであり、階層的クラスタリングとも呼ばれる。クラスタ分析（クラスタリング）とは、対象間の距離を定義し、距離の近さによって対象を分類する統計手法である。クラスタ分析は、階層的クラスタリングと非階層的クラスタリングに大別される。階層的クラスタリングでは、最短距離法、最長距離法、群平均法、ウォード法などの手法を利用して対象を分類し、階層構造（デンドログラム）を得る。この階層構造では階層の深度に応じてクラスタ数が変動する。即ち、上層から下層に向かってクラスタ数が増大し、クラスタ数は最下層で最大となる。本発明では、好ましくは、クラスタ数が１０〜１００となる階層を選択する。最適クラスタ数の決定法は、Dunn’s index (J.C.Dunn, Cybernetics, vol. 3, pp. 32-57, 1973)などでも提唱されているため、これを用いることも可能である。本手法では最適階層数は実験規模に反映されるため、現実的な実験規模としての１０〜１００を選択した。尚、階層的クラスタ分析についてはEisen et al. (1998) PNAS 95:14863が参考になる。
【００３３】
次に、ステップ（３）で形成された複数のクラスタの中から、クラスタ毎、所定数のペプチド配列を選抜する（ステップ（４））。即ち、各クラスタから代表を無作為に選抜する。代表の数（即ち所定数）は特に限定されず、好ましくは３〜３０、更に好ましくは５〜１００である。代表の数が多い方が信頼性の高いデータが得られる。一方で代表の数が多くなれば、以下の機能性アッセイに要する時間、操作などが増大する。
【００３４】
続いて、選抜したペプチド配列からなるペプチドを試料として機能性アッセイを行い各ペプチド配列の機能性データを取得する（ステップ（５））。このステップではまず、選抜した各ペプチド配列について、対応するペプチド（当該ペプチド配列を有するペプチド）を公知のペプチド合成法（例えば固相合成法、液相合成法）等を利用して用意する。次に、用意したペプチドを試料として機能性アッセイを行う。「機能性アッセイ」とは、試料ペプチドの機能性を評価可能な試験ないし検定をいう。「機能性の評価」は、機能性の有無の評価と、機能性の程度の評価を含む。「機能性アッセイ」の一例は親和性アッセイである。親和性アッセイとは、標的に対する試料ペプチドの親和性を検出・評価する試験をいい、通常、試料ペプチドと標的との接触操作及びそれに続く洗浄操作を伴う。洗浄操作は非特異的吸着を除去する目的で行う。標的として、特定の生理機能を有する物質（例えば各種受容体、各種リガンド、各種サイトカイン、抗原タンパク質、抗体、酵素、ヒートショックプロテイン、脂質（胆汁酸）、糖構造物、高分子、無機イオン、無機鉱物）、細胞などを用いることができる。ここでの細胞としては哺乳動物（ヒト、サル、ウシ、ウマ、ウサギ、マウス、ラット、モルモット、ハムスター等）の各種細胞、例えば心筋細胞、平滑筋細胞、脂肪細胞、線維芽細胞、骨細胞、軟骨細胞、破骨細胞、実質細胞、表皮角化細胞（ケラチノサイト）、上皮細胞（皮膚表皮細胞、角膜上皮細胞、結膜上皮細胞、口腔粘膜上皮、毛包上皮細胞、口腔粘膜上皮細胞、気道粘膜上皮細胞、腸管粘膜上皮細胞など）、内皮細胞（角膜内皮細胞、血管内皮細胞など）、神経細胞、グリア細胞、脾細胞、膵臓β細胞、メサンギウム細胞、ランゲルハンス細胞、肝細胞、又はこれらの前駆細胞、或いは間葉系幹細胞（ＭＳＣ）、胚性幹細胞（ＥＳ細胞）、胚性生殖細胞（ＥＧ細胞）、又は成体幹細胞などを使用することができる。また、正常細胞の他、癌細胞など何らかの異常を来した細胞、或いはＨｅＬａ細胞、ＣＨＯ細胞、Ｖｅｒｏ細胞、ＨＥＫ２９３細胞、ＨｅｐＧ２細胞、ＣＯＳ−７細胞、ＮＩＨ３Ｔ３細胞、Ｓｆ９細胞などの株化された細胞等を使用することもできる。金属、半導体、無機材料、合成高分子等を材料とする微粒子や基材（基板等）を標的としてもよい。
【００３５】
好ましくは、複数の試料ペプチドの機能性を同時に評価可能な機能性アッセイを利用する。これによって操作時間を短縮できる。複数の試料ペプチドを固定化したペプチドチップを利用すればこのような機能性アッセイが可能である。ペプチドチップでは通常、多数のペプチドがペプチド配列毎に区画化されて基板に固定される。このようなペプチドチップを用いれば操作時間の大幅な短縮化を達成可能である。機能性アッセイに供する全ての試料ペプチドが固定化されたペプチドチップを用いることが好ましい。但し、機能性アッセイに供するペプチドが二つ以上のペプチドチップに分かれて固定化されていてもよい。ペプチドチップを用いることのもう一つの利点は、多数の試料ペプチドについて完全に同一の条件下での比較・評価が行えることである。従って、ペプチドチップを用いれば信頼性の一層高いデータが得られる。
【００３６】
次に、ステップ（５）で得られた機能性データに基づき、機能性の順位をクラスタに付与する（ステップ（６））。即ち、機能性アッセイの結果、各クラスタから選抜したペプチド配列に関して得られた機能性データを利用してクラスタに順位付けを行う。例えば、同一のクラスタに属するペプチド配列に関して得られた数値データの総和又は平均をクラスタ間で比較し、機能性の順位を決定することができる。その他、その配列の消化酵素での切断の有無、合成の容易さ、合成のコスト、精製の容易さなどを加味することで、さらに候補の順位を決定することもできる。
ここでの順位付けは、後続のステップ（７）において「上位の順位が付与されたクラスタ」の特定を可能にするために行われる。ステップ（７）において「上位の順位が付与されたクラスタ」が特定できればよいことから、上位の順位のみを付与し、下位の順位についてはその付与を省略することにしてもよい。但し、典型的には全てのクラスタに順位を付与する。
【００３７】
上位何位までを「上位の順位」とするかは、基準となる活性を持つ配列を考慮し、これよりも活性が高いものを選択することが望ましい。しかし、その後の有機合成・精製のステップを加味し、合成の容易さ、合成のコスト、精製の容易さなどを考慮して候補を広げて選抜することが望ましい。１位〜ｎ位までを上位とすれば、例えばｎは１〜２０、好ましくは１〜１０、更に好ましくは２〜５である。尚、ｎが１の場合は上位１位（最上位）のみが、上位の順位に該当することになる。
【００３８】
以上のようにしてクラスタに順位を付与した後、上位の順位が付与されたクラスタを規定する物理化学的性質の数値範囲又は該数値範囲を満足するアミノ酸の種類を、高機能ペプチドの特徴を表すルールとして抽出するステップ高機能ペプチドの特徴を表すルールとして抽出する（ステップ（７））。このステップでは始めに、上位の順位が付与されたクラスタを特定する。そして、特定されたクラスタ毎にそれを規定する物理的性質の数値範囲又は該数値範囲を満足するアミノ酸を「高機能ペプチドの特徴を表すルール」として抽出する。その結果、ペプチド配列における位置毎、物理的性質の数値範囲を示すルール（以下、「数値範囲ルール」と呼ぶ）又はペプチド配列における位置毎、該当する１又は２以上のアミノ酸を示すルール（以下、「アミノ酸ルール」と呼ぶ）が得られる。尚、「物理的性質の数値範囲を満足するアミノ酸」は、これに限られるものではないが、通常はタンパク質を構成する２０種のアミノ酸の中から選択される。
【００３９】
以上の通り本発明では、高機能ペプチドの特徴を表すルールとして、物理的性質の数値範囲の組（セット）からなるルール（数値範囲ルール）、又は該当するアミノ酸の組（セット）からなるルール（アミノ酸ルール）が抽出される。クラスタが複数の物理的性質の数値範囲で規定されていた場合、ペプチド配列のアミノ酸残基数に物理的性質の数を乗じた数の数値範囲からなる数値範囲ルールが抽出される。例えば、ペプチド配列のアミノ酸残基数が３であり、クラスタが１３種の物理的性質（等電点、正規化ファンデルワールス体積、βタンパク質のためのアルファへリックスの指標、βタンパク質のためのベータ鎖の指標、タンパク質安定化のための側鎖の貢献度、原子間ポテンシャルに関する知識を基にした安定化尺度、疎水性指標、正規化されたターン頻度、ベータ鎖領域における自由エネルギー、アルファ−へリックス領域における自由エネルギー、極性、側鎖の相互作用、アミノ酸の分配度）の数値範囲で規定されていれば、３９（３×１３）個の数値範囲からなるルールが得られる。
【００４０】
抽出されるルールの数は、上位の順位が付与されたとして特定したクラスタの数に依存する。例えば上位５位までを「上位の順位」とした場合、１位〜５位の各クラスタからそれぞれルールを抽出する。このようにして５個のルール（機能性の高い順に、１位のクラスタから抽出したルール、２位のクラスタから抽出したルール、３位のクラスタから抽出したルール、４位のクラスタから抽出したルール、５位のクラスタから抽出したルール）が得られる。他の例として、上位１位だけを「上位の順位」とした場合には、１位（最高位）のクラスタから抽出したルールのみが得られることになる。
【００４１】
本発明の一態様では、ステップ（６）に続いて、以下のステップ（６−１）〜（６−４）を１回又は２回以上実施した後、ステップ（７）を実施する。
（６−１）上位の順位が付与された複数のクラスタを特定するステップ、
（６−２）特定された複数のクラスタより、クラスタ毎、所定数のペプチド配列を選抜するステップ、
（６−３）選抜したペプチド配列からなるペプチドを試料として機能性アッセイを行い、各ペプチド配列の機能性データを取得するステップ、
（６−４）機能性データに基づき、機能性の順位を前記複数のクラスタに付与するステップ。
【００４２】
この態様では、ステップ（６）によって上位の順位が付与されたクラスタからルールを抽出するのではなく、上位の順位が付与されたクラスタを用いて再び機能性アッセイとその結果に基づくクラスタの順位付けを行う。これによって、ルールの抽出対象となるクラスタを最適化する。ステップ（６−１）は、ステップ（７）におけるクラスタの特定方法に準じて行えばよい。但し、ステップ（６−１）における「上位の順位」とステップ（７）における「上位の順位」は同一でなくてもよい。即ち、ステップ（６−１）において上位ｍ位（ｍは整数）までのクラスタを特定することにし、ステップ（７）では上位ｎ位（ｎはｍよりも小さな整数）までのクラスタからルールを抽出する。ここでのｍは、例えば１〜２０、好ましくは１〜１０、更に好ましくは２〜５の整数であり、ｎはｍよりも小さい整数である。具体例を示せば、ステップ（６−１）では上位５位のクラスタを特定し（ｍ＝５）、ステップ（７）では上位３位のクラスタからルールを抽出する（ｎ＝３）。
【００４３】
ステップ（６−２）はステップ（４）に、ステップ（６−３）はステップ（５）に、ステップ（６−４）はステップ（６）にそれぞれ準じて行えばよい。また、ステップ（６−１）〜（６−４）の繰り返し数は特に限定されない。例えば、これら一連のステップを１回〜５回行うことにする。
【００４４】
２．学習モデルを利用したルールの抽出法
この態様では学習モデルを利用し、機能性ペプチドを表すルールを抽出する。この態様の抽出法は下記ステップ（１）〜（７）を含む（図６を参照）。
（１）アミノ酸残基数が同一で且つ配列が互いに異なる複数のペプチド配列からなるペプチドライブラリーを用意するステップ、
（２）前記ペプチドライブラリーから複数のペプチド配列を選抜するステップ、
（３）選抜したペプチド配列からなるペプチドを試料として機能性アッセイを行い、各ペプチド配列の機能性データを取得するステップ、
（４）機能性データに基づき、機能性アッセイに供したペプチド配列の中から、複数の高機能配列及び複数の低機能配列を選抜するステップ、
（５）Ｎ末端又はＣ末端からの位置毎に構成アミノ酸の物理的性質を数値化することによって、選抜した高機能配列及び低機能配列を数値データに変換するステップ、
（６）前記数値データを入力変数として、学習モデルを用いた解析を行うステップ、
（７）解析結果より、配列上の１以上の位置について前記物理的性質の条件又は該条件を満足するアミノ酸の種類を示すルールであって、高機能ペプチド配列の特徴を表す１又は２以上のルールを抽出するステップ。
【００４５】
ステップ（１）は、上記態様（階層的クラスタ分析を利用した抽出法）のステップ（１）と同一であるのでその説明を省略する。ステップ（１）に続いて、ペプチドライブラリーから複数のペプチド配列を選抜する（ステップ（２））。選抜するペプチド配列の数は特に限定されない。但し、使用するペプチドライブラリーの大きさを考慮し、サンプリング数として適当な数にすることが好ましい。ここでの「適当な数」は、ペプチドライブラリーのメンバー数の例えば１／５０００００〜１／５００、好ましくは１／１０００００〜１／１０００、更に好ましくは１／５００００〜１／１００００である。尚、選抜するペプチド配列の数が多い方が信頼性の高いデータが得られる。一方、選抜するペプチド配列の数が多くなれば、以下の機能性アッセイに要する時間、操作などが増大する。
【００４６】
次に、選抜したペプチド配列からなるペプチドを試料として機能性アッセイを行い、各ペプチド配列の機能性データを取得する（ステップ（３））。当該ステップは上記態様（階層的クラスタ分析を利用した抽出法）のステップ（５）と同一であるのでその説明を省略する。
【００４７】
続いて、機能性データに基づき、機能性アッセイに供したペプチド配列の中から複数の高機能配列及び複数の低機能配列を選抜する（ステップ（４））。このステップでは機能性アッセイで得られた、各ペプチド配列の機能性データに基づき、機能性が高いことを示したペプチド配列（便宜上、「高機能ペプチド配列」と呼ぶ）と、機能性が低いことを示したペプチド配列（便宜上、「低機能ペプチド配列」と呼ぶ）を選抜する。このように、高機能ペプチド配列だけでなく、それに対照的な配列である低機能ペプチド配列も選抜する。選抜するペプチド配列の数ないし割合は特に限定されない。例えば、使用した試料ペプチドを機能性の高い順に並べたときの上位１％〜２０％、好ましくは上位１％〜１０％を高機能ペプチド配列として選抜し、下位１％〜２０％、好ましくは下位１％〜１０％を低機能ペプチド配列として選抜する。高機能ペプチド配列の数と低機能ペプチド配列の数は同一でなくてもよいが、これを同一にすれば以降の学習モデルによる解析の精度及び信頼度が高められる。
【００４８】
ステップ（４）に続いて、Ｎ末端又はＣ末端からの位置毎に構成アミノ酸の物理化学的性質を数値化することによって、選抜した高機能配列及び低機能配列を数値データに変換する（ステップ（５））。このステップは、選抜した各ペプチド配列をFNNで解析可能な形態に変換するものである。このステップによって、選抜した各ペプチド配列は、位置毎に特定の性質に関する数値が関連付けられたデータとなる。
【００４９】
上記態様（階層的クラスタ分析を利用した抽出法）の場合と同様、ここでの「物理的性質」とはサイズ（大きさ）、疎水度、電荷、等電点など、アミノ酸の分類に利用される性質のことである。また、上記態様の場合と同様、好ましくは、等電点、正規化ファンデルワールス体積、βタンパク質のためのアルファへリックスの指標、βタンパク質のためのベータ鎖の指標、タンパク質安定化のための側鎖の貢献度、原子間ポテンシャルに関する知識を基にした安定化尺度、疎水性指標、正規化されたターン頻度、ベータ鎖領域における自由エネルギー、アルファ−へリックス領域における自由エネルギー、極性、側鎖の相互作用、及びアミノ酸の分配度からなる群より選択される２種以上の性質を併用し、更に好ましくは、これら１３種の全てを併用する。ここで特に言及しない事項については、上記態様（階層的クラスタ分析を利用した抽出法）のステップ（２）における、対応する説明が援用される。
【００５０】
次に、ステップ（５）で得られた数値データを入力変数として、学習モデルを用いた解析を行う（ステップ（６））。ルール（規則）を抽出できる限り、ここでの解析法の種類は特に限定されない。解析法の例として、決定木による解析、ファジィニューラルネットワーク解析を挙げることができる。中でもファジィニューラルネットワーク解析が好ましい。ファジーニューラルネットワーク解析を採用した場合、予測モデルが構築される。ここで「ファジィニューラルネットワーク」とは、人工ニューラルネットワーク(Artificial Neural Network; ANN)とファジィ推論を組み合わせた方法をいい、ファジイ推論の欠点であるメンバーシップ関数の決定を人間に頼るという部分を回避すべく、ANNをファジィ推論に組み込み、その自動決定を行う方法である。学習機械のひとつであるANN（図７）は、生体の脳における神経回路網を数学的にモデル化したものであり、以下の特徴を持つ。ANNにおける学習は、目的の出力値(教師値）をもつ学習用のデータ（入力値; X）を用いて、バックプロパゲーション法(Back propagation; BP法)により教師値と出力値(Y)の誤差が小さくなるように、図７における○と○をつなぐ回路における結合荷重を変え、その出力値が教師値に近づくようにモデルを構築する過程であり、このBP法を用いれば、ANNは学習により自動的に知識を獲得することができる。そして、最終的に学習に用いていないデータを入力することにより、そのモデルの汎用性を評価することができる。従来、メンバーシップ関数の決定は、人間の感覚に頼っていたが、上で述べたようなANNをファジイ推論に組み込むことで自動的なメンバーシップ関数の同定が可能になる。これがFNNである。ANNと同様に、BP法を用いることによりネットワークに与えられた入出力関係を、結合荷重を変化させることで自動的に同定しモデル化することができる。FNNは、学習後のモデルを解析することでファジィ推論のように人間に理解しやすい言語的なルールとして知識を獲得できるという特徴をもっている。つまり、FNNは、その構造、特徴から、アミノ酸の性質を表した数値のような変数の組み合わせにおける最適なファジィ推論の組み合わせを自動決定し、ペプチドの親和性に関する推定とそのルールの生成を同時に行うことができる。
【００５１】
FNNの構造は入力層、シグモイド関数に含まれるパラメータWc、Wgを決定するメンバーシップ関数部分(前件部)、Wfを決定し、入力と出力の関係をルールとして取り出すことが可能なファジィルール部分(後件部)、出力層の4層から成り立っている(図８)。FNNのモデル構造を決定する結合荷重にはWc、Wg、Wfがある。結合荷重Wcは、メンバーシップ関数に用いられるシグモイド関数の中心位置、Wgは中心位置での傾きを決定する(図９)。結合荷重Wfは各ファジイ領域の推定結果に対する寄与を表しており、Wfよりファジィルールを導くことができる。
【００５２】
FNN解析におけるファジィルールの作成には結合荷重のひとつであるWf値が用いられる。Wf値が正の値で大きいと、そのユニットは「機能性が高い」と判定されることに対する寄与が大きく、そのルールに当てはまったアミノ酸を有するペプチドは「機能性が高い」と判断される。Wf値が負の値で小さいと、そのユニットは「機能性が低い」と判定されることに対する寄与が大きく、そのルールに当てはまったアミノ酸を有するペプチドは「機能性が低い」と判断される。
【００５３】
図１０に2つの入力で、small(S)とbig(B)の2つのルールの分割を用いたときのFNNの構造を示した。ファジールール部分であるSS(1入力目がsmall、2入力目がsmall)、SB、BS、BBに入る値は、その4つのノードにおける値の和が1になるように規格化される。そして、それぞれの値にWf(SS)、Wf(SB)、Wf(BS)、Wf(BB)をかけ、それらの和が出力値yになる。2つの入力、small(S)とbig(B)の2分割のときの、ファジールールの例を図１１に示す。
【００５４】
学習モデルを用いた解析の結果より、配列上の１以上の位置について前記物理的性質の条件又は該条件を満足するアミノ酸の種類を示すルールであって、高機能ペプチド配列の特徴を表す１又は２以上のルールを抽出する（ステップ（７））。FNN解析を利用した場合には、構築された予測モデルよりルールを抽出することになる。
【００５５】
抽出されるルールは一つとは限らず、場合によっては複数のルールを抽出できる。尚、ペプチド配列上の全ての位置について物理的性質の条件又は該条件を満足するアミノ酸が示されとは限らない。換言すれば、抽出されるルールでは、最低一つの位置について、採用した物理的性質の条件又は該条件を満足するアミノ酸が示されている。
【００５６】
ここで、本発明の一態様においては、ステップ（７）の後、以下のステップ（８）を行う。
（８）ステップ（１）で用意したペプチドライブラリーの内、以前の選抜の際に選抜されなかったペプチド配列の集合の中から、抽出した前記ルールに適合する複数のペプチド配列を選抜した後、ステップ（３）〜（７）を行うステップ。
【００５７】
このステップ（８）ではまず、抽出したルールを用いて複数のペプチド配列を選抜する。このとき、ステップ（１）で用意したペプチドライブラリー全体から無作為に複数のペプチド配列を抽出するのではなく、当該ペプチドライブラリーの内、以前の選抜の際に選抜されなかったペプチド配列の集合の中から、抽出したルールに適合する複数のペプチド配列を抽出する。例えば、メンバー数が６０００００のペプチドライブラリーを用意し、ステップ（２）で２０００個のペプチド配列を選択したのであれば、当該２０００個のペプチド配列を除外した残りの５９８０００個のペプチド配列を、抽出したルールに照合し、ルールに適合するペプチド配列を選抜する。尚、「ルールに適合する」とは、「ルールを満足する」と同義であって、ルールが規定する物理的性質の条件の全てを満たしている状態をいう。
選抜するペプチド配列の数は特に限定されないが、ステップ（２）と同様に、好ましくはサンプリング数として適当な数とする。従って、ここで選択するペプチド配列の数は、最初に用意したペプチドライブラリーから以前の選抜の際に選抜されたペプチド配列を除外した集合のメンバー数の例えば１／５０００００〜１／５００、好ましくは１／１０００００〜１／１０００、更に好ましくは１／５００００〜１／１００００である。
【００５８】
ステップ（８）を行うことによりルールの最適化が進む。即ち、より信頼度の高いルールを抽出できる。ルールの更なる最適化を図るため、ステップ（８）を繰り返すとよい。繰り返し数は特に限定されない。例えば、ステップ（８）を１〜５回繰り返す。
【００５９】
３．ルールの最適化
階層的クラスタ分析を利用したルールの抽出法で得たルールと、学習モデルによる解析を利用したルールの抽出法で得たルールを比較し、共通部分を新たなルールとして抽出することもできる。このようにすればルールの最適化が進み、その結果、信頼度の高いルールを生成することができる。他の手法（例えば、図１に示したＡの手法）で得たルールも併用してルールの最適化を行うことにしてもよい。
【００６０】
＜機能性ペプチドの設計法＞
本発明の第２の局面は機能性ペプチドの設計法に関する。本発明の設計法によれば、機能性ペプチドとして有望なペプチドを表す配列情報が得られる。本発明の設計法は、膨大な数の候補の中から効率的に有効なペプチドを選抜できる点、様々な長さのペプチドを設計可能である点、既知の機能性ペプチドの配列に依存しない全く新しいペプチドを見出すことが可能である点等、数多くの利点を有する。
【００６１】
本明細書において「機能性ペプチドを設計すること」と「機能性ペプチドとして有望なペプチドを表す配列情報を得ること」は同義である。以下、本発明の設計法について、１．ルールを利用した設計法、２．ルールの抽出の際に形成されたクラスタを利用した設計法、３．ルールを抽出する際に構築された予測モデルを利用した設計法、及び４．ペプチド配列の連結を利用した設計法に分けて説明する。また、５．では、機能性の一層高いペプチド配列を設計する方法に言及する。これらの設計法は、５．におけるアッセイを除いて、コンピュータ上で実施することができる。
【００６２】
１．ルールを利用した設計法
本発明の一態様では、第１の局面の発明によって抽出されたルールに従ってペプチド配列を設計する。前述の通り、階層的クラスタ分析を利用した抽出法によれば、数値範囲ルール（ペプチド配列における位置毎、物理的性質の数値範囲を示すルール）又はアミノ酸ルール（ペプチド配列における位置毎、該当する１又は２以上のアミノ酸を示すルール）が抽出される。前者のルールに従ってペプチド配列を設計するのであれば、位置毎、そこに示された物理的性質の数値範囲の全部を満たすアミノ酸を選択すればよい。他方、後者のルールに従ってペプチド配列を設計する場合は、位置毎、該当するアミノ酸として示されたアミノ酸の中からいずれかのアミノ酸を選択すればよい。該当するアミノ酸が１つの場合は当該アミノ酸を選択する。以上の通り、ルールに従ってアミノ酸を選択することにより、機能性ペプチドとして有望な配列情報が得られる。
【００６３】
学習モデルによる解析を利用した抽出法によって抽出されたルールの場合も同様に、ルールに従って各位置のアミノ酸を選択し、ルールに適合するペプチド（機能性ペプチドとして有望なペプチド）の配列情報を得る。但し、当該ルールの場合は、ペプチド配列を構成する全ての位置ついて選択の基準（条件）が示されるとは限らない。選択の基準が示されない位置については任意のアミノ酸を選択すればよい。
【００６４】
本発明の他の態様では、上記態様のようにルールに基づくアミノ酸の選択によってペプチド配列を構築するのではなく、複数のペプチド配列の中からルールに適合するものを選択する。即ち、複数の候補ペプチド配列を用意した後、これらの候補ペプチド配列をルールに照合し、そしてルールに適合するペプチド配列を選択する。このようにして、機能性ペプチドとして有望なペプチド配列を候補ペプチド配列の中から特定する。尚、階層的クラスタ分析を利用した抽出法によって得られた数値範囲ルール、又は学習モデルによる解析を利用した抽出法によって得られた、物理的性質の条件を示すルールを利用する場合は候補ペプチド配列を直接ルールに照合することができないことから、照合可能な数値データに各候補ペプチド配列を変換した上で照合する。即ち、（１）複数の候補ペプチド配列を用意するステップ、（２）Ｎ末端又はＣ末端からの位置毎に構成アミノ酸の物理的性質を数値化することによって前記複数の候補ペプチド配列をそれぞれ数値データに変換するステップ、（３）各数値データをルールに照合するステップ、及び（４）ルールに適合する候補ペプチド配列を選抜するステップが行われることになる（図１２を参照）。
【００６５】
２．ルールを抽出する際に形成されたクラスタを利用した設計法
階層的クラスタ分析を利用した抽出法を実施すると、機能性の高い順に順位が付与された複数のクラスタが形成される。上位の順位が付与されたクラスタに含まれるペプチド配列は機能性が高いことになる。そこで本発明の一態様では、階層的クラスタ分析を利用した抽出法によって得られた、上位の順位が付与されたクラスタに含まれる１又は２以上のペプチド配列を高機能ペプチド配列として選択する。例えば、１位（最高位）のクラスタに１０個のペプチド配列が含まれていた場合、１〜１０個のペプチド配列を、高機能ペプチドを表す配列として選択することができる。１位（最上位）のクラスタのみからペプチド配列を選択するのではなく、上位の順位が付与された複数のクラスタ（例えば上位３位までのクラスタ）からペプチド配列を選択することにしてもよい。
【００６６】
３．ルールを抽出する際に構築された予測モデルを利用した設計法
FNN解析を利用した抽出法を実施すると予測モデル（FNNモデルとも呼ばれる）が構築される。本発明の一態様では当該予測モデルを利用して高機能ペプチドを設計する。具体的には、（１）複数の候補ペプチドを用意するステップ、（２）Ｎ末端又はＣ末端からの位置毎に構成アミノ酸の物理的性質を数値化することによって、複数の候補ペプチド配列をそれぞれ数値データに変換するステップ、（３）FNN解析を利用した抽出法をおいてルールの抽出の際に構築された予測モデルを用い、前記数値データを入力変数としてFNN解析を行うステップであって、該FNN解析において、（ｉ）ルールに適合するペプチド配列の選抜、（ｉｉ）選抜されたペプチド配列の予測値の評価、及び（ｉｉｉ）予測値の高いペプチド配列の選抜が順に行われるステップ、を行い、高機能ペプチドとして有望なペプチドを表す配列情報を得る（図１３を参照）。
【００６７】
この態様に特徴的なステップ（３）では、FNNを利用した一連の情報処理が行われる。まず、ルールを利用した判断・評価（上記（ｉ）に相当する）が行われる。この処理の結果、ルールに適合するものとして比較的多数のペプチド配列が選抜される。次に、選択されたペプチド配列に対して予測値の判断・評価（上記（ｉｉ）及び（ｉｉｉ）に相当する）が行われる。この処理ではペプチド配列の数値データを予測モデル、即ち近似曲線に代入することによって機能性を予測し、予測値の高いペプチド配列を選抜する。
【００６８】
予測値の判断・評価に加えて、信頼度の判断・評価を行うことにし、最終的に得られる配列情報の信頼度（確からしさ）を向上させることが好ましい。信頼度の評価・判断では、「入力値の近傍に学習データがある場合には、近似曲線として信頼できる（又は信頼度が高い）範囲での予測であり、入力値の近傍に学習データが無い場合には、近似曲線として信頼できない（又は信頼度が低い）範囲での予測である」という基準に基づく評価・判断が行われることになる。
【００６９】
４．ペプチド配列の連結を利用した設計法
本発明は更に、ペプチド配列の連結を利用した設計法を提供する。当該設計法によれば、より長いペプチドを設計することができる。以下、図１４及び１５を参照しながら説明する。
【００７０】
この設計法では最初にペプチド配列の集合を用意する（ステップ（１））。ペプチド配列の集合として以下の（ａ）〜（ｄ）のいずれかを用いる。
（ａ）階層的クラスタ分析を利用した抽出法によって得られた、上位の順位が付与されたクラスタに含まれるペプチド配列の集合、
（ｂ）階層的クラスタ分析を利用した抽出法によって得られたルールに適合するペプチド配列の集合、
（ｃ）学習モデルによる解析（例えばFNN解析）を利用した抽出法によって得られたルールに適合するペプチドの集合、
（ｄ）（ａ）〜（ｃ）からなる群より選択される２以上の集合を結合した集合。
【００７１】
集合（ａ）として次の集合を用いてもよい。即ち、メンバーのアミノ酸残基数が異なる複数のペプチドライブラリーを用意し、各ペプチドライブラリーを用いてクラスタ分析を利用した抽出法を行うことにし、各回について得られた、上位の順位が付与されたクラスタに含まれるペプチド配列の集合を全て連結して得られる集合である。
【００７２】
一方、集合（ｂ）として次の集合を用いてもよい。即ち、メンバーのアミノ酸残基数が異なる複数のペプチドライブラリーを用意し、各ペプチドライブリーを用いてクラスタ分析を利用した抽出法を行ってルールを得た後、抽出されたルール毎、適合するペプチド配列の集合を作製し、最後に全集合を連結して得られる集合である。
【００７３】
また、集合（ｃ）として次の集合を用いてもよい。即ち、メンバーのアミノ酸残基数が異なる複数のペプチドライブラリーを用意し、各ペプチドライブリーを用いて学習モデルによる解析（例えばFNN解析）を利用した抽出法を行ってルールを得た後、抽出されたルール毎、適合するペプチド配列の集合を作製し、最後に全集合を連結して得られる集合である。
集合（ｄ）を用いる場合においてもペプチド配列の長さを統一する必要はない。
【００７４】
次に、用意した集合の中から、共通する部分配列（以下、「共通部分配列」と呼ぶ）を認める第１ペプチド配列及び第２ペプチド配列を選抜する（ステップ（２））。但し、共通部分配列よりもＣ末端側のアミノ酸の数は、第１ペプチド配列よりも第２ペプチド配列の方が多いものとする。共通部分配列の長さは、アミノ酸残基数が２以上である限り特に限定されない（図１５の（Ａ））。
【００７５】
続いて、共通部分配列よりもＣ末端側のアミノ酸を第１ペプチド配列から除去して得られる第１部分配列と、共通部分配列及び共通部分配列よりもＮ末端側のアミノ酸を第２ペプチド配列から除去して得られる第２部分配列とを、第１部分配列がＮ末端側に配置されるように連結する（ステップ（３））。これによって、第１ペプチド配列及び第２ペプチド配列よりも長いペプチド配列が得られる（図１５の（Ａ））。
【００７６】
ここで、第１ペプチド配列では共通部分配列がＣ末端アミノ酸を含み、第２ペプチド配列では共通部分配列がＮ末端アミノ酸を含むことが好ましい（図１５の（Ｂ）を参照）。つまり、第１ペプチド配列のＣ末端側の部分配列と第２ペプチド配列のＮ末端側の部分配列が共通することが好ましい。上記のように連結した際、より長いペプチド配列が得られるからである。
【００７７】
一態様では、ステップ（１）において集合（ａ）を用意することにし、ステップ（２）では、第１ペプチド配列と対をなす第２ペプチド配列の候補が二つ以上存在する場合には、より上位の順位が付与されたクラスタに属するペプチド配列を優先して第２ペプチド配列に用い、第２ペプチド配列と対をなす第１ペプチド配列の候補が二つ以上存在する場合には、より上位の順位が付与されたクラスタに属するペプチド配列を優先して第１ペプチド配列に用いる。
【００７８】
他の一態様では、ステップ（１）において集合（ｂ）を用意することにし、ステップ（２）では、第１ペプチド配列と対をなす第２ペプチド配列の候補が二つ以上存在する場合には、より上位の順位が付与されたクラスタのルールに適合するペプチド配列の方を優先して第２ペプチド配列に用い、第２ペプチド配列と対をなす第１ペプチド配列の候補が二つ以上存在する場合には、より上位の順位が付与されたクラスタのルールに適合するペプチド配列の方を優先して第１ペプチド配列に用いる。
【００７９】
以上の二つの態様のように、より上位のクラスタから候補を選択することは、一層機能性が高いペプチド配列の設計を可能にする。
【００８０】
より長いペプチド配列を設計するためには、ステップ（３）で得られたペプチド配列を第１ペプチド配列又は第２ペプチド配列として、ステップ（２）と同様の操作を行えばよい。例えば、ステップ（３）で得られたペプチド配列を第１ペプチド配列とする場合には、第２ペプチド配列に該当する配列、即ち第１ペプチド配列と一部で共通する配列（但し、共通部分配列よりもＣ末端側のアミノ酸の数は、第１ペプチド配列よりも第２ペプチド配列の方が多い）を、用意したペプチド配列の集合の中から選抜した後、ステップ（２）と同様のステップを行う。必要に応じて、当該操作を繰り返す。
【００８１】
５．機能性ペプチドの最適化
本発明の一態様では、一層好ましい機能性ペプチドを設計するため、以下の（１）〜（３）のいずれかの手段を採用し、機能性ペプチドの絞り込み（最適化）を行う。
（１）１．〜４．の設計法の併用
（２）合成効率、合成コスト、精製効率、特性（（溶解度、熱安定性、pH安定性、立体構造）等の観点による選抜
（３）細胞や動物等を利用したアッセイによる選抜
【００８２】
以上の各手段は互いに排他的なものではなく、二つ以上を併用することも可能である。他の手段に加えて（３）の手段を採用する場合には、効率や費用などの点から、（３）の手段による選抜は最後に行うとよい。１．〜４．の設計法の二つ以上を並行して行うことにし、各方法で設計されたポリペプチド配列の中から、（２）及び／又は（３）の手段を利用して、一層好ましい機能性ペプチドを選抜することにしてもよい。
【００８３】
＜機能性ペプチドの調製法＞
上記の設計法によって設計したペプチドを実際に調製すれば機能性ペプチドが得られる。このように本発明は、上記の設計法で設計されたペプチドを調製するステップを含む、機能性ペプチドの調製法も提供する。ペプチドの調製には、公知のペプチド合成法（例えば固相合成法、液相合成法）が利用できる。尚、自動ペプチド合成機を利用すれば容易かつ迅速なペプチド合成が可能である。
【００８４】
遺伝子工学的手法を利用してペプチドを調製することにしてもよい。即ち、設計したペプチド配列をコードする核酸を適当な宿主細胞に導入し、形質転換体内で発現されたペプチドを回収することにより、目的のペプチドを得ることにしてもよい。回収したペプチドは必要に応じて精製される。回収したペプチドを適当な置換反応に供し、所望のペプチド修飾体に変換することもできる。
【００８５】
＜ポリペプチド又はポリペプチド含有組成物の評価法＞
本発明の抽出法などを利用すると、特定の機能性を発揮し得るペプチドとして多数のペプチドを同定可能である。即ち、多数の機能性ペプチドの配列情報を得ることができる。多数の機能性ペプチドの配列情報があれば、それを利用してポリペプチドを評価（スコア化）することができる。具体的には、同定した機能性ペプチドを包括的に捉え、各機能性ペプチドの含有量をポリペプチド間で比較すれば、当該機能に関する各ポリペプチドの有効性を点数（スコア）として示すことが可能となる。そこで本発明は、更なる局面として、ポリペプチド又はポリペプチド含有組成物の評価法（スコア化法）を提供する。本発明の評価法を利用すれば、ポリペプチド又はポリペプチド含有組成物を機能性という新たな観点から特定したり、分類したりすることができる。また、機能性の高いポリペプチド又はポリペプチド含有組成物の同定や創出も可能となる。
【００８６】
本発明における「評価」とは、ポリペプチド又はそれを含有する組成物の「特定の機能に関する有効性」を調べることをいう。本発明の評価法を実施すると、典型的には、評価対象の機能性が点数（スコア）で表される。そこで、ここでの「評価」のことを「スコア化」とも呼ぶことがある。「ポリペプチド含有組成物」とは、成分の一つとしてポリペプチドを含む組成物である。例えば穀類や豆類等を原料とする食品（栄養補助食品や飲料なども含む）や食品添加物などが「ポリペプチド含有組成物」に該当する。
【００８７】
１．ルールとの照合による評価
本発明の評価法では以下のステップ（１）〜（６）を行う（図１６を参照）。
（１）ポリペプチドの配列を用意するステップ、
（２）本発明の抽出法によって抽出された１又は２以上のルールに対してそれぞれスコアを関連付けるステップ、
（３）前記ルールとの照合が可能な一定の長さに前記ポリペプチドの配列を断片化するステップ、
（４）各断片配列を前記ルールと照合し、適合性を判定するステップ、
（５）ルールに適合すると判定された断片配列に対して、該ルールに関連付けられたスコアを付与するステップ、
（６）付与された全てのスコアを積算して総スコアを算出するステップであって、該総スコアが前記ポリペプチドの機能性を表す指標となるステップ。
【００８８】
まず、ポリペプチドの配列を用意する（ステップ（１））。ポリペプチドは、評価対象であるポリペプチド自体、又は評価対象である組成物が含有するポリペプチドである。ここでのポリペプチドの例を挙げると、大豆タンパク質のβコングルシニンや、小麦タンパク質のグルテン、乳タンパク質のカゼイン、卵白タンパク質のオボアルブミンである。
評価対象が組成物であり且つ複数のポリペプチドを含有する場合には、各ポリペプチドをここでのポリペプチドとして本発明の評価法を実施し、得られた各結果を総合して当該組成物の機能性を評価することもできる。
【００８９】
続くステップ（２）では、本発明の抽出法、即ち階層的クラスタ分析を利用した抽出法又は学習モデルによる解析（例えばFNN解析）を利用した抽出法によって抽出されたルール（前者を「クラスタ機能性ルール」、後者を「学習モデル機能性ルール」と呼ぶ）にスコア（点数）を関連づける。用いるルールが一つであれば、当該ルールに任意のスコア（例えば、１、１０、２０など）を関連付ければよい。用いるルールが複数の場合は、それぞれのルールが示す機能性の程度を考慮して各ルールにスコアを関連づける。例えば、階層的クラスタ分析を利用した抽出法によって上位５位のクラスタからそれぞれルールを抽出した場合であって、これら５個のルールを用いるのであれば、１位のクラスタから抽出したルールに１００、２位のクラスタから抽出したルールに５０、３位のクラスタから抽出したルールに２０、４位のクラスタから抽出したルールに１０、５位のクラスタから抽出したルールに５、のように、クラスタの順位とスコアが対応するようにスコアを関連付ける。クラスタ機能性ルールと学習モデル機能性ルールを併用してもよい。尚、どのような勾配でスコアを関連付けるべきかは多変量解析で決定するとよい。
【００９０】
一方、ルールとの照合が可能な一定の長さにポリペプチド配列を断片化する（ステップ（３））。例えば、アミノ酸残基数が３のペプチドに関するルールを用いるのであれば、ポリペプチド配列を断片化し、アミノ酸残基数が３のペプチド配列（即ちトリペプチド）の集合にする。以下、断片化の具体的な方法について、３アミノ酸の長さ（即ちトリペプチド配列）に断片化する場合を例として説明する。断片化の方法は二つに大別される。第一の方法（図１７の（Ａ））では、Ｎ末端（又はＣ末端）から３アミノ酸毎に区切り、トリペプチド配列の集合を得る。第二の方法（図１７の（Ｂ））では、Ｎ末端（又はＣ末端）の３アミノ酸を最初の断片とし、Ｎ末端（又はＣ末端）から１アミノ酸又は２アミノ酸だけＣ末端側にずらした位置からの３アミノ酸を次の断片とする。以下同様に繰り返す。このようにしてトリペプチド配列の集合を得る。
【００９１】
続いて、ステップ（３）で得た各断片配列をルールと照合し、適合性を判定する（ステップ（４））。複数のルールを用いた場合は、各断片配列を全てのルールに照合し、各ルールに対する適合性を判定する。尚、「適合性を判定する」とは、断片配列がルールを満足するか否かを判定することを意味する。
【００９２】
次に、ルールに適合すると判定された断片配列に対して、該ルールに関連付けられたスコアを付与する（ステップ（５））。例えば、スコア１０の第１ルールとスコア１の第２ルールを用いた場合、第１ルールに適合することが判明した断片配列に対しては第１ルールに関連付けられたスコア１０を付与し、第２ルールに適合することが判明した断片配列に対しては第２ルールに関連付けられたスコア１を付与する。
【００９３】
続いて、付与された全てのスコアを積算して総スコアを算出する（ステップ（６））。例えば、スコア１０が付与された断片が１０個、スコア１が付与された断片が１０個存在していた場合、（１０×１０）＋（１×１０）＝１１０が総スコアとなる。本発明では、このようにして算出した総スコアを、ポリペプチドの機能性を表す指標とする。即ち、総スコアの大きさによってポリペプチドの機能性を判断する。具体的には例えば、総スコアが大きければ機能性が高いと判断し、総スコアが小さければ機能性が低いと判断する。あるポリペプチドの総スコアを予め算出しておき、当該総スコアを基準としてポリペプチドの総スコアを評価することにしてもよい。
【００９４】
好ましい一態様では、評価の妥当性ないし正確性を高めるため、ポリペプチド配列中に存在するプロテアーゼ切断部位を考慮した補正を行う。具体的には、以下の（Ａ）〜（Ｃ）のいずれかの方法により補正する。
（Ａ）ステップ（３）で生じた断片配列の中から、プロテアーゼ切断部位を内在する断片配列を除いた後にステップ（４）を行う。
（Ｂ）ステップ（６）において、プロテアーゼ切断部位を内在する断片配列以外の断片配列に付与されたスコアのみを積算する。
（Ｃ）ステップ（６）において、付与された全スコアを積算した後、ステップ（３）で生じた断片配列の中から、プロテアーゼ切断部位を内在する断片配列に付与されたスコアを除算する。
【００９５】
（Ａ）はスコア化の前に補正する方法、（Ｂ）はスコア化の段階で補正する方法、（Ｃ）はスコアの積算後に補正する方法である。（Ａ）の場合、プロテーゼ切断部位を内在するがために生じない断片配列をスコア化の対象から除外する。（Ｂ）の場合、実際に生ずる断片配列に付与されたスコアのみを積算する。（Ｃ）の場合、スコアを積算した後に、プロテーゼ切断部位を内在するがために生じない断片配列に付与されたスコアを差し引く。いずれの方法を採用しても、実際に生ずる断片配列に付与されたスコアのみを積算した総スコアが得られることになり、評価の妥当性ないし正確性が向上する。尚、ここでの用語「プロテアーゼ」は広義のプロテーゼを意味し、エキソペプチダーゼ、エンドペプチダーゼ、プロテイナーゼなど、ポリペプチド鎖に作用してペプチド結合を加水分解する各種酵素を包含する。但し、本発明においては、全てのプロテーゼについてその切断部位を考慮する必要はなく、ポリペプチドの用途に応じて必要と考えられるプロテアーゼの切断部位のみを考慮すればよい。例えばヒト生体への投与ないし摂取が予定されているポリペプチド（医薬や栄養補助食品の成分としてのポリペプチド、食品中に含まれるタンパク質など）を評価する場合、ヒト生体内で作用し得るプロテアーゼ（ポリペプチドの代謝経路に存在するプロテアーゼ）についてのみ、その切断部位を考慮すればよい。ヒト生体内で作用し得るプロテアーゼの例としてペプシン、トリプシン、キモトリプシンが挙げられる。「ヒト生体内で作用し得るプロテアーゼ」は、ヒト生体に内在するプロテアーゼに限られない。食品等の摂取によりヒト体内に取り込まれるプロテアーゼ（外来性のプロテアーゼ）も「ヒト生体内で作用し得るプロテアーゼ」に該当する。
【００９６】
２．上位クラスタに含まれるペプチド配列を用いた評価
この態様では、階層的クラスタ分析を利用した抽出法を行った際に得られるクラスタを利用してポリペプチド又はポリペプチド含有組成物を評価する。この態様の評価法は以下のステップ（１）〜（４）を含む（図１８を参照）。尚、特に言及しない事項については、上記態様（１．ルールとの照合による評価）の対応する説明を援用する。
（１）ポリペプチドの配列を用意するステップ、
（２）階層的クラスタ分析を利用した抽出法によって得られた、上位の順位が付与されたクラスタに含まれる各ペプチド配列に対して、同一のクラスタに含まれるペプチド配列は各々相同性の高いスコアとなり且つクラスタの順位に対応したスコアとなるように、スコアを関連付けるステップ、
（３）スコアを関連付けた各ペプチド配列をそれぞれ前記ポリペプチドの配列と照合し、配列が一致する領域の数を調べるステップ、
（４）ステップ（３）で判明した前記領域の数と、ステップ（２）で関連付けたスコアとを乗ずることによってペプチド配列毎にスコアに算出した後、全てのスコアを積算して総スコアを算出するステップであって、該総スコアが前記ポリペプチドの機能性を表す指標となるステップ。
【００９７】
まず、ペプチド配列を用意する（ステップ（１））。このステップは上記態様（１．ルールとの照合による評価）の場合と同一であるためその説明を省略する。
【００９８】
次に、階層的クラスタ分析を利用した抽出法によって得られた、上位の順位が付与されたクラスタに含まれる各ペプチド配列に対してスコアを関連付ける（ステップ（２））。このとき、同一のクラスタに含まれるペプチド配列は各々相同性の高いスコアとする。可溶性度、合成容易度、価格などを考慮して各ペプチドのスコアを決定するとよい。一例では、同一のクラスタに含まれるペプチド配列は全て同一のスコアとする。一方、クラスタの順位に対応したスコアとなるようにする。即ち、順位の高いクラスタに含まれるペプチド配列の方が、順位が低いクラスタに含まれるペプチド配列よりも高いスコアとなるようにする。例えば、上位５位までのクラスタを用いるのであれば、１位のクラスタに含まれるペプチド配列に１００、２位のクラスタに含まれるペプチド配列に５０、３位のクラスタに含まれるペプチド配列に２０、４位のクラスタに含まれるペプチド配列に１０、５位のクラスタに含まれるペプチド配列に５、のように、クラスタの順位とスコアの高低が対応するようにスコアを関連付ける。尚、どのような勾配でスコアを関連付けるべきかは多変量解析で決定するとよい。
【００９９】
続いて、スコアを関連付けた各ペプチド配列をそれぞれポリペプチド配列と照合し、配列が一致する領域（一致領域）の数を調べる（ステップ（３））。そして、一致領域の数と、各ペプチド配列に関連付けたスコアとを乗ずることによってペプチド配列毎にスコアを算出した後、全てのスコアを積算して総スコアを算出する（ステップ（４））。このようにして算出した総スコアがポリペプチドの機能性を表す指標となる。
【０１００】
総スコアの算出方法（ステップ（４））の具体例を示す。１位のクラスタ（スコア１００）が第１ペプチド配列と第２ペプチド配列からなり、ポリペプチド配列中に第１ペプチド配列と一致する領域が１箇所、第２ペプチド配列と位置する領域が２箇所含まれており、２位のクラスタ（スコア５０）が第３ペプチド配列及び第４ペプチド配列からなり、ポリペプチド配列中に第３ペプチド配列と一致する領域が１箇所、第４ペプチド配列と位置する領域が０箇所含まれていた場合、次のように総スコアを算出する。
（１×１００）＋（２×１００）＋（１×５０）＋（０×５０）＝３５０
【０１０１】
上記態様（１．ルールとの照合による評価）と同様、この態様の評価法においても、評価の妥当性ないし正確性を高めるため、ポリペプチド配列中に存在するプロテアーゼ切断部位を考慮した補正を行うことが好ましい。補正は、照合（ステップ（３））又は総スコアの算出（ステップ（４））の際に行えばよい。
【０１０２】
３．学習モデルを用いた評価法
更なる一態様では、学習モデルによる解析（例えばFNN解析）を利用した抽出法を行った際の学習モデル（FNN解析の場合は、構築された予測モデル）を利用してポリペプチド又はポリペプチド含有組成物を評価する。この態様の評価法は以下のステップ（１）〜（５）を含む（図１９を参照）。尚、特に言及しない事項については、上記態様（１．ルールとの照合による評価）の対応する説明を援用する。
（１）ポリペプチドの配列を用意するステップ、
（２）学習モデルによる解析を利用した抽出法においてルールを抽出する際に用いた学習モデルで解析可能な一定の長さに前記ポリペプチドの配列を断片化するステップ、
（３）Ｎ末端又はＣ末端からの位置毎に構成アミノ酸の物理化学的性質を数値化することによって、各断片配列を数値データに変換するステップ、
（４）前記学習モデルを用い、前記数値データを入力変数として、学習モデルによる解析を行い、各断片配列の予測機能度を算出するステップ、
（５）算出された予測機能度を積算するステップであって、得られた総予測機能度が前記ポリペプチドの機能性を表す指標となるステップ。
【０１０３】
まず、ペプチド配列を用意する（ステップ（１））。このステップは上記態様（１．ルールとの照合による評価）の場合と同一であるためその説明を省略する。
【０１０４】
次に、学習モデルによる解析を利用した抽出法においてルールを抽出する際に用いた学習モデル（FNN解析の場合は、構築された予測モデル）で解析可能な一定の長さにポリペプチド配列を断片化する（ステップ（２））。即ち、ルールの抽出に利用したペプチド配列（ペプチドライブラリーのメンバー）のアミノ酸残基数に一致するように断片化する。断片化の方法等は、上記態様（１．ルールとの照合による評価）の場合と同様である。
【０１０５】
続いて、Ｎ末端又はＣ末端からの位置毎に構成アミノ酸の物理化学的性質を数値化することによって、各断片配列を数値データに変換する（ステップ（３））。このステップは、学習モデルによる解析を利用した抽出法におけるステップ（５）に準ずる。
【０１０６】
次に、学習モデル（FNN解析の場合は、構築された予測モデル）を用い、数値データを入力変数として学習モデルによる解析を行い、各断片配列の予測機能度を算出する（ステップ（４））。即ち、各断片配列を学習モデルによる解析に供し、予測機能度を算出させる。その後、算出された予測機能度を積算する（ステップ（５））。この態様では、このようにして算出した総予測機能度を、ポリペプチドの機能性を表す指標とする。即ち、総予測機能度の大きさによってポリペプチドの機能性を判断する。
【０１０７】
４．胆汁酸結合能の評価
後述の実施例に示す通り、本発明者らは複数の胆汁酸結合ペプチドの同定に成功した。そこで、本発明は更なる態様として胆汁酸結合能に関する評価法を提供する（図２０を参照）。
（１）ポリペプチドの配列を用意するステップ、
（２）同定に成功した胆汁酸結合ペプチドの配列（配列番号１〜２２３のいずれかのアミノ酸配列、並びにWIY,YYW,WRW,PWR,WFW,WYM,IWW,YWM,FWY,LWY,WYD,WMY,WYF,MWF,YFY,WWT,WWI,YYF,FMF,YMW,PFF,AWY,WMM,NWY,PWM,FWV,WYV,YFM,YGW,PVW,WRI,QWF,WHF,MWM,PIY,LFF,YSW,WNF,WSL,YLF,YYI,WYT,MYY,IWM,WHM,WLA,YQY,IQW,WLN,WMQ,WAM,AWM,TWY,WSM,VWI,MFL,NWM,WVQ,FGL,FNY,PIR,PWN,MWL,YGL,NWI,AWI,VFI,YSF,MIF,FVM,TWM,WQI,MYM,TWI,PMG,IGY,IML,VLF,YIV,YAM,PYN,VAY,PCK,SWL,PCW,PML,PLM,VYM,VMY,PFE,YSM,ISF,QWV,WVC,CWY,MTF,PLQ,ILM,YQV,PCC,YMI,WKC,PMH,WKW,WYE,WFK,WRR,WKW,RKF,WKS,VWW,VWW,PLK,YWL,KLK,FLR,YWL,NFK,LWY,HWF,LRI,WGW,WFL,FYF,RHW,PLK,KLK,LRI,KIW,QWR,IWN,RRK,KVR,NQY,WNP,LRY,FMY,WMH,WIK,YFI,IRA,NTH,WNP,YFI,WGV,HKL,WRG,YYT,QPW,LYL,TRA,RKA,WHA,LYL,AFL,FII,RPL,FVI,YSH,LYS,IFW,KIP,FII,WQE,FCP,NHI,WAG,VRQ,GPR,LYS,NRE,FLT,YVP,LYM,IIP,WRC,NTK,QFH,FQW,NTK,YVP,LYN,FGF,LKS,GYL,FIE,KGS,VFA,RFN,LYH,QFH,RVI,VAY,LKS,QYF,WMN,DRG,VYP,YGT,IQW,KIA,QKV,HMK,WQL,RFN,MHP,VRD,KVA,ITR,NQG,YMY,RDG,WMK,YII,NKI,PMR,HML,VAY,KHM,YGT,HAH,TRP,KIA,IWT,FMA,CWP,ICY,HMK,KMS,MIP,FSV,PSH,KVA,KNL,VKT,MHP,KHM,PFI,TRP,RDG,QGR,WMS,YIV,KAC,LQH,MIP,MFS,PSH,VKT,NGI,PVS,NPL,LSP,TKQ,QII,QGR,MFS,VKA,LQH,PPQ,QHL,LSP,VKA,QII,LMS,PHQ,RFA,MCP,NGC,QHL,YCI,MQF,SNF,YMA,LQY,LPQ,VLL,YMA,AIK,WMT,EYH,VLL,SML,GLC,END,WGS,RAD,GWV,RAD,HHS,EAF,MGI,IVN,SEW,QHA,THM,CLY,NMC,TLL及びLMW）の中から選択される２以上のペプチド配列に対してスコアを関連付けるステップ、
（３）スコアを関連付けた各ペプチド配列をそれぞれ前記ポリペプチドの配列と照合し、配列が一致する領域の数を調べるステップ、
（４）ステップ（３）で判明した前記領域の数と、ステップ（２）で関連付けたスコアとを乗ずることによってペプチド配列毎にスコアを算出した後、全てのスコアを積算して総スコアを算出するステップであって、該総スコアが前記ポリペプチドの胆汁酸結合能を表す指標となるステップ。
【０１０８】
ステップ（１）、（３）及び（４）は、上記態様（２．上位クラスタに含まれるペプチド配列を用いた評価）と同様であるためその説明を省略する。ステップ（２）では、同定に成功した胆汁酸結合ペプチド配列（配列番号１〜２２３のいずれかのアミノ酸配列、並びにWIY,YYW,WRW,PWR,WFW,WYM,IWW,YWM,FWY,LWY,WYD,WMY,WYF,MWF,YFY,WWT,WWI,YYF,FMF,YMW,PFF,AWY,WMM,NWY,PWM,FWV,WYV,YFM,YGW,PVW,WRI,QWF,WHF,MWM,PIY,LFF,YSW,WNF,WSL,YLF,YYI,WYT,MYY,IWM,WHM,WLA,YQY,IQW,WLN,WMQ,WAM,AWM,TWY,WSM,VWI,MFL,NWM,WVQ,FGL,FNY,PIR,PWN,MWL,YGL,NWI,AWI,VFI,YSF,MIF,FVM,TWM,WQI,MYM,TWI,PMG,IGY,IML,VLF,YIV,YAM,PYN,VAY,PCK,SWL,PCW,PML,PLM,VYM,VMY,PFE,YSM,ISF,QWV,WVC,CWY,MTF,PLQ,ILM,YQV,PCC,YMI,WKC,PMH,WKW,WYE,WFK,WRR,WKW,RKF,WKS,VWW,VWW,PLK,YWL,KLK,FLR,YWL,NFK,LWY,HWF,LRI,WGW,WFL,FYF,RHW,PLK,KLK,LRI,KIW,QWR,IWN,RRK,KVR,NQY,WNP,LRY,FMY,WMH,WIK,YFI,IRA,NTH,WNP,YFI,WGV,HKL,WRG,YYT,QPW,LYL,TRA,RKA,WHA,LYL,AFL,FII,RPL,FVI,YSH,LYS,IFW,KIP,FII,WQE,FCP,NHI,WAG,VRQ,GPR,LYS,NRE,FLT,YVP,LYM,IIP,WRC,NTK,QFH,FQW,NTK,YVP,LYN,FGF,LKS,GYL,FIE,KGS,VFA,RFN,LYH,QFH,RVI,VAY,LKS,QYF,WMN,DRG,VYP,YGT,IQW,KIA,QKV,HMK,WQL,RFN,MHP,VRD,KVA,ITR,NQG,YMY,RDG,WMK,YII,NKI,PMR,HML,VAY,KHM,YGT,HAH,TRP,KIA,IWT,FMA,CWP,ICY,HMK,KMS,MIP,FSV,PSH,KVA,KNL,VKT,MHP,KHM,PFI,TRP,RDG,QGR,WMS,YIV,KAC,LQH,MIP,MFS,PSH,VKT,NGI,PVS,NPL,LSP,TKQ,QII,QGR,MFS,VKA,LQH,PPQ,QHL,LSP,VKA,QII,LMS,PHQ,RFA,MCP,NGC,QHL,YCI,MQF,SNF,YMA,LQY,LPQ,VLL,YMA,AIK,WMT,EYH,VLL,SML,GLC,END,WGS,RAD,GWV,RAD,HHS,EAF,MGI,IVN,SEW,QHA,THM,CLY,NMC,TLL及びLMW）の中から、スコア化に利用する配列を選択する。スコア化には２以上のペプチド配列を利用する。好ましくは３以上、更に好ましくは４以上のペプチド配列を利用する。各ペプチド配列の胆汁酸結合能に応じて、各ペプチド配列にスコアを関連付ければよい。各ペプチド配列の胆汁酸結合能は結合アッセイによって評価することができる。
【０１０９】
＜胆汁酸結合ペプチド＞
後述の実施例に示すように、本発明者らは胆汁酸結合ペプチドを同定することに成功した。この成果に基づき本発明の更なる局面は、配列番号１〜２２３のいずれかのアミノ酸配列、又は以下の群、即ちIIK,GTV,WIY,YYW,WRW,PWR,WFW,WYM,IWW,YWM,FWY,LWY,WYD,WMY,WYF,MWF,YFY,WWT,WWI,YYF,FMF,YMW,PFF,AWY,WMM,NWY,PWM,FWV,WYV,YFM,YGW,PVW,WRI,QWF,WHF,MWM,PIY,LFF,YSW,WNF,WSL,YLF,YYI,WYT,MYY,IWM,WHM,WLA,YQY,IQW,WLN,WMQ,WAM,AWM,TWY,WSM,VWI,MFL,NWM,WVQ,FGL,FNY,PIR,PWN,MWL,YGL,NWI,AWI,VFI,YSF,MIF,FVM,TWM,WQI,MYM,TWI,PMG,IGY,IML,VLF,YIV,YAM,PYN,VAY,PCK,SWL,PCW,PML,PLM,VYM,VMY,PFE,YSM,ISF,QWV,WVC,CWY,MTF,PLQ,ILM,YQV,PCC,YMI,WKC,PMH,WKW,WYE,WFK,WRR,WKW,RKF,WKS,VWW,VWW,PLK,YWL,KLK,FLR,YWL,NFK,LWY,HWF,LRI,WGW,WFL,FYF,RHW,PLK,KLK,LRI,KIW,QWR,IWN,RRK,KVR,NQY,WNP,LRY,FMY,WMH,WIK,YFI,IRA,NTH,WNP,YFI,WGV,HKL,WRG,YYT,QPW,LYL,TRA,RKA,WHA,LYL,AFL,FII,RPL,FVI,YSH,LYS,IFW,KIP,FII,WQE,FCP,NHI,WAG,VRQ,GPR,LYS,NRE,FLT,YVP,LYM,IIP,WRC,NTK,QFH,FQW,NTK,YVP,LYN,FGF,LKS,GYL,FIE,KGS,VFA,RFN,LYH,QFH,RVI,VAY,LKS,QYF,WMN,DRG,VYP,YGT,IQW,KIA,QKV,HMK,WQL,RFN,MHP,VRD,KVA,ITR,NQG,YMY,RDG,WMK,YII,NKI,PMR,HML,VAY,KHM,YGT,HAH,TRP,KIA,IWT,FMA,CWP,ICY,HMK,KMS,MIP,FSV,PSH,KVA,KNL,VKT,MHP,KHM,PFI,TRP,RDG,QGR,WMS,YIV,KAC,LQH,MIP,MFS,PSH,VKT,NGI,PVS,NPL,LSP,TKQ,QII,QGR,MFS,VKA,LQH,PPQ,QHL,LSP,VKA,QII,LMS,PHQ,RFA,MCP,NGC,QHL,YCI,MQF,SNF,YMA,LQY,LPQ,VLL,YMA,AIK,WMT,EYH,VLL,SML,GLC,END,WGS,RAD,GWV,RAD,HHS,EAF,MGI,IVN,SEW,QHA,THM,CLY,NMC,TLL及びLMWから選択されるアミノ酸配列からなる胆汁酸結合ペプチドを提供する。尚、配列番号１〜２９の配列は、既知の胆汁酸結合ペプチド（種ペプチド）を基にして同定されたアミノ酸配列である。また、配列番号３０〜４２の配列、並びにIIK及びGTVは、βコングリシニン（種タンパク質）を断片化して得られるペプチドの中から同定されたアミノ酸配列である。一方、配列番号４３〜１２６の配列は、FNN解析を利用したルールの抽出の過程において同定されたアミノ酸配列である。配列番号１２７〜２２３の配列、並びにWIY,YYW,WRW,PWR,WFW,WYM,IWW,YWM,FWY,LWY,WYD,WMY,WYF,MWF,YFY,WWT,WWI,YYF,FMF,YMW,PFF,AWY,WMM,NWY,PWM,FWV,WYV,YFM,YGW,PVW,WRI,QWF,WHF,MWM,PIY,LFF,YSW,WNF,WSL,YLF,YYI,WYT,MYY,IWM,WHM,WLA,YQY,IQW,WLN,WMQ,WAM,AWM,TWY,WSM,VWI,MFL,NWM,WVQ,FGL,FNY,PIR,PWN,MWL,YGL,NWI,AWI,VFI,YSF,MIF,FVM,TWM,WQI,MYM,TWI,PMG,IGY,IML,VLF,YIV,YAM,PYN,VAY,PCK,SWL,PCW,PML,PLM,VYM,VMY,PFE,YSM,ISF,QWV,WVC,CWY,MTF,PLQ,ILM,YQV,PCC,YMI,WKC,PMH,WKW,WYE,WFK,WRR,WKW,RKF,WKS,VWW,VWW,PLK,YWL,KLK,FLR,YWL,NFK,LWY,HWF,LRI,WGW,WFL,FYF,RHW,PLK,KLK,LRI,KIW,QWR,IWN,RRK,KVR,NQY,WNP,LRY,FMY,WMH,WIK,YFI,IRA,NTH,WNP,YFI,WGV,HKL,WRG,YYT,QPW,LYL,TRA,RKA,WHA,LYL,AFL,FII,RPL,FVI,YSH,LYS,IFW,KIP,FII,WQE,FCP,NHI,WAG,VRQ,GPR,LYS,NRE,FLT,YVP,LYM,IIP,WRC,NTK,QFH,FQW,NTK,YVP,LYN,FGF,LKS,GYL,FIE,KGS,VFA,RFN,LYH,QFH,RVI,VAY,LKS,QYF,WMN,DRG,VYP,YGT,IQW,KIA,QKV,HMK,WQL,RFN,MHP,VRD,KVA,ITR,NQG,YMY,RDG,WMK,YII,NKI,PMR,HML,VAY,KHM,YGT,HAH,TRP,KIA,IWT,FMA,CWP,ICY,HMK,KMS,MIP,FSV,PSH,KVA,KNL,VKT,MHP,KHM,PFI,TRP,RDG,QGR,WMS,YIV,KAC,LQH,MIP,MFS,PSH,VKT,NGI,PVS,NPL,LSP,TKQ,QII,QGR,MFS,VKA,LQH,PPQ,QHL,LSP,VKA,QII,LMS,PHQ,RFA,MCP,NGC,QHL,YCI,MQF,SNF,YMA,LQY,LPQ,VLL,YMA,AIK,WMT,EYH,VLL,SML,GLC,END,WGS,RAD,GWV,RAD,HHS,EAF,MGI,IVN,SEW,QHA,THM,CLY,NMC,TLL及びLMWは、階層的クラスタリング分析を利用した方法によって同定されたアミノ酸配列である。
【０１１０】
配列番号２、４、５又は６の配列からなるペプチドは、アレイ上から切り離された可溶化の状態でも、非常に高い胆汁酸結合能を示し、特に配列番号２と５は胆汁酸ミセル形成阻害能、胆汁酸ミセル破壊能、と共に動物への投与実験において非常に高いコレステロール吸収阻害効果を示した（実施例の欄を参照）。この効果は従来のコレステロール吸収阻害薬と同等以上のコレステロール吸収阻害効果であった。従って、当該ペプチドは、コレステロール低減ペプチドとして有望であり、ペプチドアレイを用いたスクリーニング手法は有効であると考えられる。尚、配列番号２の配列からなるペプチドは他のペプチドと比べて「親水性であり水によく溶けるにもかかわらず」強いコレステロール吸収阻害能を示した。この点から、当該ペプチドは実用性が特に高いといえる。
【実施例】
【０１１１】
図２に示す４種の手法を用い、新規胆汁酸結合ペプチドを探索した。
１．既知胆汁酸結合ペプチド（種ペプチド）由来の新規胆汁酸結合ペプチドの設計・同定
（１）候補ペプチドの設計
既知の胆汁酸結合ペプチド配列（VAWWMY（配列番号２２４）。以下、「種ペプチド」と呼ぶ）を基に候補ペプチド配列を設計した。具体的には、種ペプチド１残基置換による改変を行い、候補ペプチド配列１１４種を得た。
【０１１２】
（２）胆汁酸結合アッセイ
Fmoc固定合成法を利用した常法により、候補ペプチド配列１１４種を網羅するペプチドチップを作製した。このペプチドチップを用いて以下の通り胆汁酸結合アッセイを行った。
【０１１３】
（３）ルールの抽出
アッセイの結果を評価することで、胆汁酸結合能とアミノ酸配列の関係を表すルール（図２１）を抽出した。このルールでは、(i)Ｎ末端から１番目のアミノ酸として好ましいものはＩとＰであること、(ii)Ｎ末端から２番目のアミノ酸として好ましいものはＤ、Ｇ、Ｈ、Ｉ、Ｋ、Ｍ、Ｐ、Ｒ、Ｗ及びＹであること、(iii)Ｎ末端から３番目のアミノ酸として好ましいものは特にないこと、(iv)Ｎ末端から４番目のアミノ酸として好ましいものはＫとＹであること、(v)５番目のアミノ酸として好ましい者はＲ、Ｆ及びＩであること、(vi)Ｎ末端から６番目のアミノ酸として好ましいものはＫであることが示されている。
【０１１４】
（４）ルールに従ったペプチドの作製及びスクリーニング
上記ルールに適合するアミノ酸と、大元のVAWWMY（配列番号２２４）に存在するアミノ酸のすべての組合せ792種（３×11×1×3×4×2）を作製し、これらのペプチド配列の胆汁酸結合能を胆汁酸結合アッセイ（（２）と同様のアッセイ）で調べた。陽性対照として種ペプチドを、陰性対照としてペプチドを合成していないアレイ基板の値を用いた。
【０１１５】
アッセイの結果を図２２に示す。蛍光強度が上位にランクされた２９個のペプチド配列（配列場号１〜２９）を胆汁酸結合ペプチドの有望な候補とした。また、ランクが特に上位の４個のペプチド配列（配列番号２、４、５、６）を、胆汁酸結合ペプチドの有望な候補として選抜し、以降の実験として可溶化状態での(1)胆汁酸ミセル形成阻害能、(2)胆汁酸ミセル破壊能、(3)動物を用いた生体コレステロール吸収阻害実験に用いた（後述の５．の欄）。
【０１１６】
２．大豆タンパク質（βコングリシニン）由来の新規胆汁酸結合ペプチドの設計・同定
（１）候補ペプチド配列の作製
種ペプチドを内在するβコングリシニンのアミノ酸配列（全配列）を断片化し、候補ペプチド配列２７４種を作製した。
【０１１７】
（２）胆汁酸結合アッセイ及びペプチド配列の選抜
Fmoc固定合成法を利用した常法により、候補ペプチド配列２７４種を網羅するペプチドチップを作製した。このペプチドチップを用いて胆汁酸結合アッセイ（１．の（２）と同様のアッセイ）を行った。アッセイの結果を図２３に示す。蛍光強度が１位〜１５位のペプチド配列（配列番号３０〜４２、並びにIIK及びGTV）を、胆汁酸結合ペプチドの有望な候補として選抜した。
【０１１８】
３．FNN解析を利用した胆汁酸結合ペプチドの設計・同定
（１）ペプチドライブラリーからの選抜
６アミノ酸残基のペプチド配列からなるランダムペプチドライブラリー（64,000,000配列）を作製した。当該ペプチドライブラリーから無作為に2,2000配列を選抜し、以降のアッセイに用いた。
【０１１９】
（２）胆汁酸結合アッセイ
Fmoc固定合成法を利用した常法により、選抜した2,200配列を網羅するペプチドチップ（各配列について３つのスポットが形成されている）を作製した。このペプチドチップを用いて胆汁酸結合アッセイ（１．の（２）と同様のアッセイ）を行った。アッセイの結果を図２４に示す。図２４では、高い蛍光強度を示したポジティブ配列（上位４０位）と、低い蛍光強度を示したネガティブ配列（代表として４０種）を示した。上位１９位についてはその配列を配列番号４３〜６１に示す。尚、種ペプチド（VAWWMY：配列番号２２４）の蛍光強度を基準（１）としたときに３スポット全てについて蛍光強度が０．８以上の配列をポジティブ配列とし、３スポット全てについて蛍光強度がバックグラウンドと同等の配列をネガティブ配列とした。
【０１２０】
（３）FNN解析及びルールの抽出
ポジティブ配列６０種（上位６０位）のデータと、ネガティブ配列６０種のデータを用い、FNN解析を行った。各配列は全て、各アミノ酸の位置を１３指標（等電点、正規化ファンデルワールス体積、βタンパク質のためのアルファへリックスの指標、βタンパク質のためのベータ鎖の指標、タンパク質安定化のための側鎖の貢献度、原子間ポテンシャルに関する知識を基にした安定化尺度、疎水性指標、正規化されたターン頻度、ベータ鎖領域における自由エネルギー、アルファ−へリックス領域における自由エネルギー、極性、側鎖の相互作用、アミノ酸の分配度）で数値化し、情報処理解析を行った。
【０１２１】
FNN解析によって作成された配列ルール表を図２５（ａ）に示す。赤色に示されたセルが配列ルールとして有望なルールである。ルールからは、Ｐ３（Ｎ末端からの位置が３番目）の正規化ファンデルワールス体積が大きい、もしくは、Ｐ４（Ｎ末端からの位置が４番目）のタンパク質安定化のための側鎖の貢献度が大きいときには、Ｐ３（Ｎ末端からの位置が３番目）の正規化ファンデルワールス体積が小さい、という配列ルールが得られた。配列ルール表の各セル内の一組の数値は、当該セルに関連付けられた特徴を満たす胆汁酸結合ペプチド配列（ポジティブデータ）の数（左側）及び胆汁酸非結合ペプチド配列（ネガティブデータ）の数（右側）である。
【０１２２】
配列ルール表より、胆汁酸結合能が高いことを示すルール（１回目のポジティブルール）（図２５（ｂ））が抽出される。ルールからは、Ｐ３（Ｎ末端からの位置が３番目）の正規化ファンデルワールス体積が大きい、もしくは、Ｐ４（Ｎ末端からの位置が４番目）のタンパク質安定化のための側鎖の貢献度が大きいときには、Ｐ３（Ｎ末端からの位置が３番目）の正規化ファンデルワールス体積が小さい、という配列ルールが得られた。１回目のポジティブルールに適合するものとして９個のペプチド（配列番号６２〜７０）が選抜された。尚、FNN解析ではアミノ酸の位置毎、各パラメータに関する閾値が設定されることから、見た目上同一の条件であっても選抜されるアミノ酸が相違することがある。
【０１２３】
（４）ルールに基づく候補ペプチド配列の選抜
ルールの絞り込み（最適化）を行うために、（１）で用意したランダムペプチドライブラリーの中から上記ルールに適合するペプチド配列１０００種を選抜した。その際、１回目の選抜の際に選抜した配列（2,200配列）が重複して選抜されることがないようにした。
【０１２４】
（５）胆汁酸結合アッセイ（２回目）
選抜したペプチド配列１０００種を網羅するペプチドチップを作製し、再度、胆汁酸結合アッセイを行った。アッセイの結果を図２６に示す。図２６では、高い蛍光強度を示したポジティブ配列（上位６８位）と、低い蛍光強度を示したネガティブ配列（１２７種）を示した。尚、種ペプチド（VAWWMY：配列番号２２４）の蛍光強度を基準（１）としたときに３スポット全てについて蛍光強度が０．８以上で且つp値が0.05より小さい配列をポジティブ配列とし、３スポット全てについて蛍光強度が0.2以下の配列をネガティブ配列とした。
【０１２５】
（６）FNN解析及びルールの抽出（２回目）
ポジティブ配列２８種（上位２８位）のデータと、ネガティブ配列２８種のデータを用い、２回目のFNN解析を行った。FNN解析の結果、３個のルール（ルール１〜３）が抽出された（図２７）。尚、胆汁酸結合ペプチド配列が最も多く属するのはルール１であった。ルール１に適合するものとして５６個のペプチド（配列番号７１〜１２６）が選抜された。
＜ルール１＞
Ｐ２はタンパク質安定化のための側鎖の貢献度が大きい：該当するアミノ酸はW、F、I、Y、L、V、P
Ｐ３は正規化ファンデルワールス体積が大きい：該当するアミノ酸はW、Y、R、F
Ｐ４はタンパク質安定化のための側鎖の貢献度が大きい：該当するアミノ酸はW、F、I、Y、L、V、P
【０１２６】
＜ルール２＞
Ｐ１はタンパク質安定化のための側鎖の貢献度が大きく、等電点が高い：該当するアミノ酸はW、I、Y、L、V、P
Ｐ３は正規化ファンデルワールス体積が大きい：該当するアミノ酸はW、Y、R、F
Ｐ４はタンパク質安定化のための側鎖の貢献度が小さく、等電点が高い：該当するアミノ酸はH、M、K、A、R、T、N、S、Q、G
【０１２７】
＜ルール３＞
Ｐ１はタンパク質安定化のための側鎖の貢献度が大きい：該当するアミノ酸はW、F、I、Y、L、V、P、H、M、K、A
Ｐ２はタンパク質安定化のための側鎖の貢献度が大きい：該当するアミノ酸はW、F、I、Y、L、V、P、H、M、K、A
Ｐ３はタンパク質安定化のための側鎖の貢献度が小さく、等電点が高い：該当するアミノ酸はK、H、I、L、V、P、A、G
Ｐ３はタンパク質安定化のための側鎖の貢献度が大きい：該当するアミノ酸はW、F、I、Y、L、V、P
【０１２８】
（７）ルールに基づく候補ペプチド配列の選抜
ルールの更なる絞り込み（最適化）を行うために、（１）で用意したランダムペプチドライブラリーの中から上記ルール１に適合するペプチド配列1000種を選抜した。その際、以前の選抜の際に選抜した配列（2,200配列及び1,000配列）が重複して選抜されることがないようにした。
（８）胆汁酸結合アッセイ（３回目）
選抜したペプチド配列1000種を網羅するペプチドチップを作製し、再度、胆汁酸結合アッセイを行った。アッセイの結果を図２８に示す。図２８では、種ペプチド（VAWWMY：配列番号２２４）の蛍光強度を基準（１）としたときに３スポット全てについて蛍光強度が0.8以上で且つp値が0.05より小さいポジティブ配列の全てを示した。この結果から分かるように、種ペプチドよりも強い胆汁酸結合能を示すペプチドが得られる率が向上した。
（９）FNN解析及びルールの抽出（３回目）
ポジティブ配列50種（上位50位）のデータと、ネガティブ配列50種(下位50種)のデータを用い、３回目のFNN解析を行った。FNN解析によって最終ルールを抽出した。
【０１２９】
以上の通り、胆汁酸結合ペプチドを表す、最良のルールを見出すことに成功した。当該ルールを用いれば、胆汁酸結合ペプチドとして有望な新規ペプチドを効率的に設計することができる。一方、ルールの抽出の過程において、種ペプチドよりも高い胆汁酸結合能を示すペプチド配列が多数、見出された。その中には非天然型ペプチドも数多く含まれていた。
【０１３０】
４．階層的クラスタリング法を利用した胆汁酸結合ペプチドの設計・同定
（１）ペプチドライブラリーからの選抜
３アミノ酸残基のペプチド配列からなるランダムペプチドライブラリーを作製した。当該ペプチドライブラリーから無作為に8,000配列を選抜した。
【０１３１】
（２）階層的クラスタ分析による分類
アミノ酸の物理的性質に関する５４４指標を１３のグループに分類した。次に、各グループの代表を選抜した。選抜した１３指標（等電点、正規化ファンデルワールス体積、βタンパク質のためのアルファへリックスの指標、βタンパク質のためのベータ鎖の指標、タンパク質安定化のための側鎖の貢献度、原子間ポテンシャルに関する知識を基にした安定化尺度、疎水性指標、正規化されたターン頻度、ベータ鎖領域における自由エネルギー、アルファ-へリックス領域における自由エネルギー、極性、側鎖の相互作用、アミノ酸の分配度）を用い、選抜した8,000配列を階層的クラスタ分析でクラスタリングした。尚、２０種のアミノ酸について各指標の値を図５に示す。
【０１３２】
図２９に示す通り、8,000配列は47クラスタに分類された。各クラスタから６配列ずつ選抜し、胆汁酸結合アッセイに供した。胆汁酸結合アッセイの方法は３．の場合と同様である。
【０１３３】
クラスタ毎、選抜した６配列の蛍光強度の平均値を求めた。平均値をクラスタ間で比較し、平均値の高いものから順に順位を付与した。上位５位までのクラスタ（クラスタ３（１位）、クラスタ４３（２位）、クラスタ２（３位）、クラスタ２５（４位）、クラスタ２９（５位））を図３０に示す。理解し易いように、各クラスタをブロック状に表示している。縦の一列が一つのペプチド配列（各列の下に配列が表示される）に対応する。各クラスタには、アミノ酸の位置毎、１３指標の値が関連付けられている（図３０の右欄を参照）。つまり、各クラスタは３×１３個の数値範囲からなるルールで規定されている。
【０１３４】
（３）上位クラスタ及び下位クラスタからの選抜及びアッセイ
次に、上位５個のクラスタ及び下位５個のクラスタから２５配列ずつ選抜し、胆汁酸結合アッセイに供した。（２）と同様に蛍光強度の平均値を比較したところ、順位が上位になればなるほど高い値を示した。各クラスタから選抜する配列の数を２５から６に変更したときも同じ傾向を示した。一方、上位５個のクラスタを規定するルールに適合する配列と、下位５個のクラスタを規定するルールに適合する配列を25配列ずつアッセイした結果をまとめると図３１に示す通り、上位クラスタ5個に属する配列は胆汁酸への結合強度がランダムなスクリーニングで選ばれるものよりも高く、下位クラスタ5個に属する配列は胆汁酸への結合強度がランダムなスクリーニングで選ばれるものよりも圧倒的に低かった。さらに、上位5クラスタの中からは、既知の6残基の胆汁酸結合ペプチド（VAWWMY：配列番号２２４）よりも高い結合を示す3残基のペプチドが6個も発見されており、スクリーニングの効率が大幅に向上したことがわかった。
【０１３５】
上位のクラスタを規定するルールに適合する配列を選ぶと、高い確率で胆汁酸結合能が高いことがわかる。換言すれば、上位のクラスタを規定するルールを利用すれば、胆汁酸結合能が高いペプチド配列を効率的に得ることができる。また、特筆すべきことに、３残基であるにもかかわらず、６残基のコントロールペプチド（VAWWMY：配列番号２２４）よりも強い胆汁酸結合能を示すペプチドが得られた。
【０１３６】
上位５個のクラスタに属するペプチド配列として、WIY,YYW,WRW,PWR,WFW,WYM,IWW,YWM,FWY,LWY,WYD,WMY,WYF,MWF,YFY,WWT,WWI,YYF,FMF,YMW,PFF,AWY,WMM,NWY,PWM,FWV,WYV,YFM,YGW,PVW,WRI,QWF,WHF,MWM,PIY,LFF,YSW,WNF,WSL,YLF,YYI,WYT,MYY,IWM,WHM,WLA,YQY,IQW,WLN,WMQ,WAM,AWM,TWY,WSM,VWI,MFL,NWM,WVQ,FGL,FNY,PIR,PWN,MWL,YGL,NWI,AWI,VFI,YSF,MIF,FVM,TWM,WQI,MYM,TWI,PMG,IGY,IML,VLF,YIV,YAM,PYN,VAY,PCK,SWL,PCW,PML,PLM,VYM,VMY,PFE,YSM,ISF,QWV,WVC,CWY,MTF,PLQ,ILM,YQV,PCC,YMI,WKC,PMHを同定した。また、ランダムなスクリーニングの結果、胆汁酸への結合強度が高いものとして以下の配列を同定した。WKW,WYE,WFK,WRR,WKW,RKF,WKS,VWW,VWW,PLK,YWL,KLK,FLR,YWL,NFK,LWY,HWF,LRI,WGW,WFL,FYF,RHW,PLK,KLK,LRI,KIW,QWR,IWN,RRK,KVR,NQY,WNP,LRY,FMY,WMH,WIK,YFI,IRA,NTH,WNP,YFI,WGV,HKL,WRG,YYT,QPW,LYL,TRA,RKA,WHA,LYL,AFL,FII,RPL,FVI,YSH,LYS,IFW,KIP,FII,WQE,FCP,NHI,WAG,VRQ,GPR,LYS,NRE,FLT,YVP,LYM,IIP,WRC,NTK,QFH,FQW,NTK,YVP,LYN,FGF,LKS,GYL,FIE,KGS,VFA,RFN,LYH,QFH,RVI,VAY,LKS,QYF,WMN,DRG,VYP,YGT,IQW,KIA,QKV,HMK,WQL,RFN,MHP,VRD,KVA,ITR,NQG,YMY,RDG,WMK,YII,NKI,PMR,HML,VAY,KHM,YGT,HAH,TRP,KIA,IWT,FMA,CWP,ICY,HMK,KMS,MIP,FSV,PSH,KVA,KNL,VKT,MHP,KHM,PFI,TRP,RDG,QGR,WMS,YIV,KAC,LQH,MIP,MFS,PSH,VKT,NGI,PVS,NPL,LSP,TKQ,QII,QGR,MFS,VKA,LQH,PPQ,QHL,LSP,VKA,QII,LMS,PHQ,RFA,MCP,NGC,QHL,YCI,MQF,SNF,YMA,LQY,LPQ,VLL,YMA,AIK,WMT,EYH,VLL,SML,GLC,END,WGS,RAD,GWV,RAD,HHS,EAF,MGI,IVN,SEW,QHA,THM,CLY,NMC,TLL及びLMW。
【０１３７】
更に、無作為に抽出した配列（4merの429配列、5merの436配列、及び6merの465配列を階層的クラスタ分析し、胆汁酸への結合強度が非常に高いペプチドとして配列番号１２７〜２２３の配列を同定した。
【０１３８】
５．選抜された胆汁酸結合ペプチドの評価
（１）胆汁酸結合能
１．において選抜した4個のペプチド配列（配列番号２、４、５、６）の胆汁酸に対する結合性（親和性）を図３２に示す。胆汁酸結合アッセイで得られた蛍光強度の平均値（15スポットの平均）を、種ペプチド（VAWWMY：配列番号２２４）の蛍光強度で標準化することによって各ペプチド配列の結合性を求めた。表中のGRAVYは疎水度の総平均を表す。GRAVYの値が高いほど、疎水度が高い。Kyteらの手法（Kyte, J. and Doolittle, R. 1982. J. Mol. Biol. 157: 105-132.)に従いスコアを求めた。
【０１３９】
これら4個のペプチド配列、種ペプチド配列（VAWWMY：配列番号２２４）、カゼイン・トリプシン分解物及びコレスチラミンの¹⁴C胆汁酸への結合能を比較した。各試料を¹⁴C胆汁酸と2時間インキュベートした後、15000rpmで15分遠心した。上清の放射能を液体シンチレーションカウンターで計測した。計測値からコントロール（¹⁴C胆汁酸のみをインキュベートしたもの）の計測値を差し引き、比較した。P-3（VIWWFK）が最大の結合能を示した（図３３）。
【０１４０】
一方、３．における胆汁酸結合アッセイで最大の蛍光強度を示したペプチド配列（MPWYWR：配列番号６３）の胆汁酸結合能を同様に調べた結果、種ペプチドを凌ぐ結合能を示した（図３４）。即ち、胆汁酸結合能に関して種ペプチドと同等以上のペプチドの同定に成功したことが確認された。
【０１４１】
（２）胆汁酸ミセル形成阻害能
上記4個のペプチド配列（配列番号２、４、５、６）、種ペプチド配列（VAWWMY：配列番号２２４）、カゼイン・トリプシン分解物及びコレスチラミン種ペプチドの胆汁酸ミセル形成阻害能を比較した。胆汁酸、¹⁴Cコレステロール及び試料を混合し、24時間インキュベートした後、ミセルを形成させるべく超音波処理した。超遠心処理（55000rpm、1時間）に供し、上清中の遊離¹⁴Cコレステロール量を計測した。試料を添加しない場合の計測値を100%とし、各試料の計測値を比較した。P-1（PWWWMY：配列番号２）及びP-3（VIWWFK：配列番号５）が高い胆汁酸ミセル形成阻害能を示した（図３５）。
【０１４２】
（３）胆汁酸ミセル破壊能
上記4個のペプチド配列（配列番号２、４、５、６）、種ペプチド配列（VAWWMY：配列番号２２４）、カゼイン・トリプシン分解物及びコレスチラミン種ペプチドの胆汁酸ミセル破壊能を比較した。胆汁酸と¹⁴Cコレステロールを混合して24時間インキュベートした後、超音波処理してミセルを形成させた。続いて試料を添加し、1時間インキュベートした。超遠心処理（55000rpm、1時間）の後、上清中の遊離¹⁴Cコレステロール量を計測した。P-1（PWWWMY：配列番号２）及びP-3（VIWWFK：配列番号５）はミセルを完全に破壊した（図３６）。添加濃度をミセル破壊能との関係を調べた結果、P-3（○）よりもP-1（■）の方が高いミセル破壊能を示した（図３７）。
【０１４３】
（３）生体コレステロール吸収阻害能
上記4個のペプチド配列（配列番号２、４、５、６）、種ペプチド配列（VAWWMY：配列番号２２４）、カゼイン・トリプシン分解物及びコレスチラミン種ペプチドのコレステロール吸収阻害能を比較した。³Hコレステロール、モノオレイン酸及び胆汁酸を混合して超音波処理した後、24時間インキュベートした。これに試料（ラット1匹あたり30mg）を添加した後、胃内挿管法にてラット（Wister、オス、9週齢、n=9）に投与した。当該処置の1時間後に血清、肝臓及び腸管を採取し、³Hコレステロール量を計測した。体重100gあたりの平均吸収率（平均±標準誤差）を比較した（図３８）。P-1（PWWWMY：配列番号２）及びP-3（VIWWFK：配列番号５）がコレステロール吸収阻害能を発揮することがわかる。
【産業上の利用可能性】
【０１４４】
本発明によれば、機能性ペプチドを表すルールが得られる。当該ルールは新規機能性ペプチドの効率的な設計、同定に有用である。本発明の手法は汎用性が高く、様々な機能性ペプチドの探索に利用できる。
本発明の評価法によれば、特定の機能に関して、ポリペプチド又はポリペプチド含有組成物を点数によって評価することができる。このような点数化（スコア化）は、ポリペプチド等の客観的な評価、機能性の高いポリペプチド等の特定や創出、ポリペプチド等の分類などに利用できる。
【０１４５】
この発明は、上記発明の実施の形態及び実施例の説明に何ら限定されるものではない。特許請求の範囲の記載を逸脱せず、当業者が容易に想到できる範囲で種々の変形態様もこの発明に含まれる。
本明細書の中で明示した論文、公開特許公報、及び特許公報などの内容は、その全ての内容を援用によって引用することとする。
【配列表フリーテキスト】
【０１４６】
配列番号１〜２９：人工配列の説明：VAWWMYの置換とランダム化に由来する配列
配列番号３０〜４２：人工配列の説明：βコングリシニンに由来する配列
配列番号４３〜６１：人工配列の説明：ランダムスクリーニングで得られた配列
配列番号６２〜７０：人工配列の説明：１回目のFNN解析によって抽出された第１ルールに由来する配列
配列番号７１〜１２６：人工配列の説明：２回目のFNN解析によって抽出された第１ルールに由来する配列
配列番号１２７〜２２３：人工配列の説明：階層的クラスタ分析に基づくスコア化によって得られた配列
配列番号２２４：人工配列の説明：種ペプチド

【特許請求の範囲】
【請求項１】
以下のステップ（１）〜（７）を含む、機能性ペプチドを表すルールの抽出法、
（１）アミノ酸残基数が同一で且つ配列が互いに異なる複数のペプチド配列からなるペプチドライブラリーを用意するステップ、
（２）Ｎ末端又はＣ末端からの位置毎に構成アミノ酸の物理化学的性質を数値化することによって、前記ペプチドライブラリーに含まれる各ペプチド配列を数値データに変換するステップ、
（３）前記数値データを入力変数として階層的クラスタ分析し、各ペプチド配列を、Ｎ末端又はＣ末端からの位置毎に前記物理的性質の数値範囲で規定される複数のクラスタに分類するステップ、
（４）前記複数のクラスタの中から、クラスタ毎、所定数のペプチド配列を選抜するステップ、
（５）選抜したペプチド配列からなるペプチドを試料として機能性アッセイを行い、各ペプチド配列の機能性データを取得するステップ、
（６）機能性データに基づき、機能性の順位を前記複数のクラスタに付与するステップ、
（７）上位の順位が付与されたクラスタを規定する、前記物理化学的性質の数値範囲又は該数値範囲を満足するアミノ酸の種類を、高機能ペプチドの特徴を表すルールとして抽出するステップ。
【請求項２】
前記機能性が高親和性である、請求項１に記載の抽出法。
【請求項３】
前記機能性が、胆汁酸に対する高親和性である、請求項１に記載の抽出法。
【請求項４】
ステップ（１）における前記アミノ酸残基数が３〜６である、請求項１〜３のいずれか一項に記載の抽出法。
【請求項５】
ステップ（２）における前記物理的性質が等電点、正規化ファンデルワールス体積、βタンパク質のためのアルファへリックスの指標、βタンパク質のためのベータ鎖の指標、タンパク質安定化のための側鎖の貢献度、原子間ポテンシャルに関する知識を基にした安定化尺度、疎水性指標、正規化されたターン頻度、ベータ鎖領域における自由エネルギー、アルファ−へリックス領域における自由エネルギー、極性、側鎖の相互作用、及びアミノ酸の分配度からなる群より選択される２種以上の性質である、請求項１〜４のいずれか一項に記載の抽出法。
【請求項６】
ステップ（２）における前記物理的性質が、等電点、正規化ファンデルワールス体積、βタンパク質のためのアルファへリックスの指標、βタンパク質のためのベータ鎖の指標、タンパク質安定化のための側鎖の貢献度、原子間ポテンシャルに関する知識を基にした安定化尺度、疎水性指標、正規化されたターン頻度、ベータ鎖領域における自由エネルギー、アルファ−へリックス領域における自由エネルギー、極性、側鎖の相互作用、及びアミノ酸の分配度からなる、１３種の性質である、請求項１〜４のいずれか一項に記載の抽出法。
【請求項７】
ステップ（３）で生成されるクラスタの数が１０〜１００である、請求項１〜６のいずれか一項に記載の抽出法。
【請求項８】
ステップ（４）における前記所定数が３〜３０である、請求項１〜７のいずれか一項に記載の抽出法。
【請求項９】
ステップ（５）における前記機能性アッセイが、前記試料である複数のペプチドが配列毎に区画化されて基板に固定されたなるペプチドチップを用いて行われる、請求項１〜８のいずれか一項に記載の抽出法。
【請求項１０】
ステップ（６）に続いて、以下のステップ（６−１）〜（６−４）を１回又は２回以上実施した後、ステップ（７）を実施する、請求項１〜９のいずれか一項に記載の抽出法、
（６−１）上位の順位が付与された複数のクラスタを特定するステップ、
（６−２）特定された複数のクラスタより、クラスタ毎、所定数のペプチド配列を選抜するステップ、
（６−３）選抜したペプチド配列からなるペプチドを試料として機能性アッセイを行い、各ペプチド配列の機能性データを取得するステップ、
（６−４）機能性データに基づき、機能性の順位を前記複数のクラスタに付与するステップ。
【請求項１１】
ステップ（７）において、上位ｎ位（但し、ｎは２〜５の整数）までのクラスタからそれぞれルールを抽出する、請求項１〜１０のいずれか一項に記載の抽出法。
【請求項１２】
ステップ（７）において、最上位の順位が付与されたクラスタのみからルールを抽出する、請求項１〜１０のいずれか一項に記載の抽出法。
【請求項１３】
以下のステップ（１）〜（７）を含む、機能性ペプチドを表すルールの抽出法、
（１）アミノ酸残基数が同一で且つ配列が互いに異なる複数のペプチド配列からなるペプチドライブラリーを用意するステップ、
（２）前記ペプチドライブラリーから複数のペプチド配列を選抜するステップ、
（３）選抜したペプチド配列からなるペプチドを試料として機能性アッセイを行い、各ペプチド配列の機能性データを取得するステップ、
（４）機能性データに基づき、機能性アッセイに供したペプチド配列の中から、複数の高機能配列及び複数の低機能配列を選抜するステップ、
（５）Ｎ末端又はＣ末端からの位置毎に構成アミノ酸の物理化学的性質を数値化することによって、選抜した高機能配列及び低機能配列を数値データに変換するステップ、
（６）前記数値データを入力変数として、学習モデルを用いた解析を行うステップ、
（７）解析結果より、配列上の１以上の位置について前記物理的性質の条件又は該条件を満足するアミノ酸の種類を示すルールであって、高機能ペプチド配列の特徴を表す１又は２以上のルールを抽出するステップ。
【請求項１４】
ステップ（７）の後、以下のステップ（８）を行う、請求項１３に記載の抽出法、
（８）ステップ（１）で用意したペプチドライブラリーの内、以前の選抜の際に選抜されなかったペプチド配列の集合の中から、抽出した前記ルールに適合する複数のペプチド配列を選抜した後、ステップ（３）〜（７）を行うステップ。
【請求項１５】
学習モデルを用いた前記解析がファジィニューラルネットワーク解析であり、
ステップ（６）においてファジィニューラルネットワーク解析の結果として予測モデルが構築され、ステップ（７）では該予測モデルより前記ルールが抽出される、請求項１３に記載の抽出法。
【請求項１６】
請求項１〜１５のいずれか一項に記載の抽出法によって得られたルールに従ってペプチドを設計するステップを含む、機能性ペプチドの設計法。
【請求項１７】
複数の候補ペプチド配列の中から、請求項１〜１５のいずれか一項に記載の抽出法によって得られたルールに適合するペプチド配列を選抜するステップを含む、機能性ペプチドの設計法。
【請求項１８】
請求項１〜１２のいずれか一項に記載の抽出法によって得られた、上位の順位が付与されたクラスタに含まれる１又は２以上のペプチド配列を高機能ペプチド配列として選択するステップを含む、機能性ペプチドの設計法。
【請求項１９】
以下のステップ（１）〜（３）を含む、機能性ペプチドの設計法、
（１）複数の候補ペプチドを用意するステップ、
（２）Ｎ末端又はＣ末端からの位置毎に構成アミノ酸の物理化学的性質を数値化することによって、前記複数の候補ペプチド配列をそれぞれ数値データに変換するステップ、
（３）請求項１５に記載の抽出法においてルールの抽出の際に構築された予測モデルを用い、前記数値データを入力変数としてファジィニューラルネットワーク解析を行うステップであって、該ファジィニューラルネットワーク解析において、（ｉ）ルールに適合するペプチド配列の選抜、（ｉｉ）選抜されたペプチド配列の予測値の評価、及び（ｉｉｉ）予測値の高いペプチド配列の選抜、が順に行われるステップ。
【請求項２０】
（ｉｉｉ）の処理の後、選抜されたペプチド配列の信頼度の評価が行われる、請求項１９に記載の設計法。
【請求項２１】
以下のステップ（１）〜（３）を含む、機能性ペプチドの設計法、
（１）以下の（ａ）〜（ｄ）からなる群より選択される集合を用意するステップ、
（ａ）請求項１〜１２のいずれか一項に記載の抽出法によって得られた、上位の順位が付与されたクラスタに含まれるペプチド配列の集合、
（ｂ）請求項１〜１２のいずれか一項に記載の抽出法によって得られたルールに適合するペプチド配列の集合、
（ｃ）請求項１３〜１５のいずれか一項に記載の抽出法によって得られたルールに適合するペプチド配列の集合、
（ｄ）（ａ）〜（ｃ）からなる群より選択される２以上の集合を結合した集合、
（２）用意した集合の中から、共通する部分配列を認める第１ペプチド配列及び第２ペプチドを選抜するステップであって、第２ペプチド配列の方が、該部分配列よりもＣ末端側のアミノ酸の数が多いステップ、
（３）前記第１ペプチド配列から前記部分配列よりもＣ末端側のアミノ酸を除去して得られる第１部分配列と、前記第２ペプチド配列から前記部分配列及び前記部分配列よりもＮ末端側のアミノ酸を除去して得られる第２部分配列とを、該第１部分配列がＮ末端側に配置されるように連結するステップ。
【請求項２２】
前記第１ペプチド配列では前記部分配列がＣ末端アミノ酸を含み、前記第２ペプチド配列では前記部分配列がＮ末端アミノ酸を含む、請求項２１に記載の設計法。
【請求項２３】
下記条件１〜３の少なくとも１つを満足する、請求項２１又は２２に記載の設計法、
条件１：それに含まれるペプチド配列のアミノ酸残基数が異なる複数のペプチドライブラリーを用意し、各ペプチドライブラリーを用いて請求項１〜１２のいずれか一項に記載の抽出法を行うことにし、各回について得られた、上位の順位が付与されたクラスタに含まれるペプチド配列の集合を全て連結し、前記集合（ａ）とする、
条件２：それに含まれるペプチド配列のアミノ酸残基数が異なる複数のペプチドライブラリーを用意し、各ペプチドライブリーを用いて請求項１〜１２のいずれか一項に記載の抽出法を行ってルールを得た後、抽出されたルール毎、適合するペプチドの集合を作製し、最後に全集合を連結して前記集合（ｂ）とする、
条件３：それに含まれるペプチド配列のアミノ酸残基数が異なる複数のペプチドライブラリーを用意し、各ペプチドライブリーを用いて請求項１３〜１５のいずれか一項に記載の抽出法を行ってルールを得た後、抽出されたルール毎、適合するペプチドの集合を作製し、最後に全集合を連結して前記集合（ｃ）とする。
【請求項２４】
ステップ（１）において前記集合（ａ）を用意することにし、
ステップ（２）では、第１ペプチド配列と対をなす第２ペプチド配列の候補が二つ以上存在する場合には、より上位の順位が付与されたクラスタに属するペプチド配列を優先して第２ペプチド配列に用い、第２ペプチド配列と対をなす第１ペプチド配列の候補が二つ以上存在する場合には、より上位の順位が付与されたクラスタに属するペプチド配列を優先して第１ペプチド配列に用いる、請求項２１〜２３のいずれか一項に記載の設計法。
【請求項２５】
ステップ（１）において前記集合（ｂ）を用意することにし、
ステップ（２）では、第１ペプチド配列と対をなす第２ペプチド配列の候補が二つ以上存在する場合には、より上位の順位が付与されたクラスタのルールに適合するペプチド配列の方を優先して第２ペプチド配列に用い、第２ペプチド配列と対をなす第１ペプチド配列の候補が二つ以上存在する場合には、より上位の順位が付与されたクラスタのルールに適合するペプチド配列の方を優先して第１ペプチド配列に用いる、請求項２１〜２３いずれか一項に記載の設計法。
【請求項２６】
請求項１６〜２５のいずれか一項に記載の設計法で設計されたペプチドを調製するステップを含む、機能性ペプチドの調製法。
【請求項２７】
以下のステップ（１）〜（６）を含む、ポリペプチド又はポリペプチド含有組成物の評価法、
（１）ポリペプチドの配列を用意するステップ、
（２）請求項１〜１５のいずれか一項に記載の抽出法によって抽出された１又は２以上のルールに対してそれぞれスコアを関連付けるステップ、
（３）前記ルールとの照合が可能な一定の長さに前記ポリペプチドの配列を断片化するステップ、
（４）各断片配列を前記ルールと照合し、適合性を判定するステップ、
（５）ルールに適合すると判定された断片配列に対して、該ルールに関連付けられたスコアを付与するステップ、
（６）付与された全てのスコアを積算して総スコアを算出するステップであって、該総スコアが前記ポリペプチドの機能性を表す指標となるステップ。
【請求項２８】
以下の（Ａ）〜（Ｃ）のいずれかの特徴を備える、請求項２７に記載の評価法、
（Ａ）ステップ（３）で生じた断片配列の中から、プロテアーゼ切断部位を内在する断片配列を除いた後にステップ（４）を行う、
（Ｂ）ステップ（６）において、プロテアーゼ切断部位を内在する断片配列以外の断片配列に付与されたスコアのみを積算する、
（Ｃ）ステップ（６）において、付与された全スコアを積算した後、ステップ（３）で生じた断片配列の中から、プロテアーゼ切断部位を内在する断片配列に付与されたスコアを除算する。
【請求項２９】
以下のステップ（１）〜（６）を含む、ポリペプチド又はポリペプチド含有組成物の評価法、
（１）ポリペプチドの配列を用意するステップ、
（２）請求項１〜１２のいずれか一項に記載の抽出法によって得られた、上位の順位が付与されたクラスタに含まれる各ペプチド配列に対して、同一のクラスタに含まれるペプチド配列は各々相同性の高いスコアとなり且つクラスタの順位に対応したスコアとなるように、スコアを関連付けるステップ、
（３）スコアを関連付けた各ペプチド配列をそれぞれ前記ポリペプチドの配列と照合し、配列が一致する領域の数を調べるステップ、
（４）ステップ（３）で判明した前記領域の数と、ステップ（２）で関連付けたスコアとを乗ずることによってペプチド配列毎にスコアを算出した後、全てのスコアを積算して総スコアを算出するステップであって、該総スコアが前記ポリペプチドの機能性を表す指標となるステップ。
【請求項３０】
以下のステップ（１）〜（５）を含む、ポリペプチド又はポリペプチド含有組成物の評価法、
（１）ポリペプチドの配列を用意するステップ、
（２）請求項１３〜１５のいずれか一項に記載の抽出法においてルールを抽出する際に用いた学習モデルで解析可能な一定の長さに前記ポリペプチドの配列を断片化するステップ、
（３）Ｎ末端又はＣ末端からの位置毎に構成アミノ酸の物理化学的性質を数値化することによって、各断片配列を数値データに変換するステップ、
（４）前記学習モデルを用い、前記数値データを入力変数として、学習モデルによる解析を行い、各断片配列の予測機能度を算出するステップ、
（５）算出された予測機能度を積算するステップであって、得られた総予測機能度が前記ポリペプチドの機能性を表す指標となるステップ。
【請求項３１】
配列番号１〜２２３のいずれかのアミノ酸配列、又は以下の群、即ちIIK,GTV,WIY,YYW,WRW,PWR,WFW,WYM,IWW,YWM,FWY,LWY,WYD,WMY,WYF,MWF,YFY,WWT,WWI,YYF,FMF,YMW,PFF,AWY,WMM,NWY,PWM,FWV,WYV,YFM,YGW,PVW,WRI,QWF,WHF,MWM,PIY,LFF,YSW,WNF,WSL,YLF,YYI,WYT,MYY,IWM,WHM,WLA,YQY,IQW,WLN,WMQ,WAM,AWM,TWY,WSM,VWI,MFL,NWM,WVQ,FGL,FNY,PIR,PWN,MWL,YGL,NWI,AWI,VFI,YSF,MIF,FVM,TWM,WQI,MYM,TWI,PMG,IGY,IML,VLF,YIV,YAM,PYN,VAY,PCK,SWL,PCW,PML,PLM,VYM,VMY,PFE,YSM,ISF,QWV,WVC,CWY,MTF,PLQ,ILM,YQV,PCC,YMI,WKC,PMH,WKW,WYE,WFK,WRR,WKW,RKF,WKS,VWW,VWW,PLK,YWL,KLK,FLR,YWL,NFK,LWY,HWF,LRI,WGW,WFL,FYF,RHW,PLK,KLK,LRI,KIW,QWR,IWN,RRK,KVR,NQY,WNP,LRY,FMY,WMH,WIK,YFI,IRA,NTH,WNP,YFI,WGV,HKL,WRG,YYT,QPW,LYL,TRA,RKA,WHA,LYL,AFL,FII,RPL,FVI,YSH,LYS,IFW,KIP,FII,WQE,FCP,NHI,WAG,VRQ,GPR,LYS,NRE,FLT,YVP,LYM,IIP,WRC,NTK,QFH,FQW,NTK,YVP,LYN,FGF,LKS,GYL,FIE,KGS,VFA,RFN,LYH,QFH,RVI,VAY,LKS,QYF,WMN,DRG,VYP,YGT,IQW,KIA,QKV,HMK,WQL,RFN,MHP,VRD,KVA,ITR,NQG,YMY,RDG,WMK,YII,NKI,PMR,HML,VAY,KHM,YGT,HAH,TRP,KIA,IWT,FMA,CWP,ICY,HMK,KMS,MIP,FSV,PSH,KVA,KNL,VKT,MHP,KHM,PFI,TRP,RDG,QGR,WMS,YIV,KAC,LQH,MIP,MFS,PSH,VKT,NGI,PVS,NPL,LSP,TKQ,QII,QGR,MFS,VKA,LQH,PPQ,QHL,LSP,VKA,QII,LMS,PHQ,RFA,MCP,NGC,QHL,YCI,MQF,SNF,YMA,LQY,LPQ,VLL,YMA,AIK,WMT,EYH,VLL,SML,GLC,END,WGS,RAD,GWV,RAD,HHS,EAF,MGI,IVN,SEW,QHA,THM,CLY,NMC,TLL及びLMWから選択されるアミノ酸配列からなる、胆汁酸結合ペプチド。

【図１】