設計されたアルマジロリピートタンパク質

本発明は、アルマジロリピートタンパク質に基づく標的特異的な設計された結合タンパク質の収集物、及びそれらを生成する方法に関する。設計されたアルマジロリピートタンパク質は、単一のアルマジロリピート単位のコンセンサス配列に基づく。これらのリピートタンパク質は、ペプチド認識のための足場として使用できる。そのような足場は、原則として小さな認識可能単位ごとに同じである結合様式（例、アミノ酸又はジペプチド）を提供し、伸長したコンホメーションのペプチドの正確なモジュラー認識を可能にする。方法によって、これらの簡単な単位を認識する一連のモジュールを生成し、そのような構成要素を合わせて、追加の選択を実施することなく、任意の所望のペプチド標的のための結合部位を作製することが可能になる。

【発明の詳細な説明】
【技術分野】
【０００１】
本発明は、アルマジロリピートタンパク質に基づく標的特異的な結合分子の生成のための新規方法及びそのようにして得られた設計されたアルマジロリピートタンパク質に関する。
【背景技術】
【０００２】
タンパク質−タンパク質相互作用が、生物学及び関連分野（研究すべき医薬から診断用薬まで）において重要な役割を果たす。標的タンパク質を認識できる特異的分子が、抗体ライブラリー又は代わりの結合分子に適用される確立された選択技術（例、ファージディスプレイ、リボゾームディスプレイ、ｍＲＮＡディスプレイ、ＤＮＡディスプレイ）により得ることができる。高い特異性及び選択性がこれらの戦略により達成されるが、しかし、分子の結合様式は予測することがしばしば困難である。単一のエピトープを異なる方法で標的にでき、そのため結合に関与する残基及び利用される相互作用の予測はしばしば達成可能ではなく、これらのバインダーの合理的アプローチ及び選択プロセスを「ケースバイケース」の方法論に追いやる。各々の新たな結合分子は、選択手順により個別に作らなければならず、それは毎回異なる立体構造の標的タンパク質に結合し、その交差反応性は各ケースで個別にテストしなければならない。ずっと簡単なケースが、標的が一次配列に沿ったアミノ酸の連続ストレッチ（直線状エピトープ）を提供する場合に提供される。直線状エピトープの認識は、天然タンパク質で、ペプチドの一般的な認識についてのモデルとして検討できる。存在する二次構造がほとんどなく、伸長した立体構造で結合する可能性のため、ペプチドの全ての側鎖が、正確で再現可能な方法で、結合分子によるアミノ酸レベルでの認識のために潜在的に利用可能である。
【０００３】
天然ペプチド結合タンパク質（小さなアダプタードメイン（例、ＳＨ２、ＳＨ３、ＰＤＺ、ＷＷ）を含む）、ＭＨＣＩ及びＭＨＣＩＩタンパク質、ならびにいくつかのリピートタンパク質ファミリー（例、ＴＰＲ、アルマジロ、ＷＤ４０）の内、アルマジロリピートタンパク質は、それらを、モジュラーペプチド結合タンパク質を生成するための足場を構築するために適するようにする特徴を持つ。アルマジロリピートタンパク質に基づくそのような足場の生成では、また、リピートタンパク質のコンセンサス設計及びＷＯ０２／２０５６５に記載するリピートタンパク質ライブラリーの生成のために開発された方法を活用しうる。アルマジロリピートタンパク質は、転写調節（βカテニン）から細胞付着（プラコフィリン）、腫瘍抑制活性（大腸腺腫症ＡＰＣ）、及び核−細胞質輸送（インポーチンα）まで、広範な機能に関与する豊富な真核生物タンパク質である（Coates, J.C., Trends Cell Biol 13: 463-71, 2003）。これらのタンパク質は、キイロショウジョウバエ（Ｄｒｏｓｏｐｈｉｌａｍｅｌａｎｏｇａｓｔｅｒ）セグメントポラリティー遺伝子Ａｒｍａｄｉｌｌｏの産物中で最初に発見された約４２アミノ酸のタンデムリピート単位により特徴づけられる。アルマジロリピートタンパク質はタンパク質−タンパク質相互作用に関与し、アルマジロリピート単位により形成されるドメインは、通常、認識プロセスに関与する。アルマジロリピートドメインは、限定的タンパク質分解により元々定義され、右回り超らせん構造を形成する（βカテニン（Huber A. H. and Nelson W. J., Cell 90: 871-82, 1997）及びインポーチンα（Conti E. et al., Cell 94: 193-204, 1998）の結晶構造により最初に示された通りである）（図１）。リピート単位ごとに３つのαヘリックス（Ｈ１、Ｈ２、Ｈ３と名付けられる）により構成され（図２）、いくつかのリピート単位が積み重なってコンパクトドメインを形成する。特殊化されたリピート単位が、これらのアルマジロリピートドメインのＮ及びＣ末端に存在し、恐らくは、本来なら露出されている疎水性コアを保護している（図１）。
【０００４】
アルマジロリピートタンパク質とそれらの標的タンパク質との複合体の結晶構造によって、標的の大半が、Ｈ３ヘリックスにより形成される表面に沿った溝内の伸長したコンホメーションで結合することが明らかになる（図１及び２）。アスパラギン残基は、Ｈ３のＣ末端部分でのほぼリピート単位毎に保存され、標的の主鎖と接触し、標的側鎖への追加の相互作用が隣接残基により提供される。単一のリピート単位が、一般的に、２つの標的アミノ酸残基との相互作用に関与する。構造的に特徴づけられた他のリピートタンパク質ファミリー（例、ＴＰＲ，D'Andrea L.D. and Regan D., Trends Biochem Sci 28: 655-62, 2003；アンキリンリピート，Mosavi L. K. et al., Protein Sci 13: 1435-48, 2004；ロイシンリッチリピート，Kob B. and Kajava A. V., Curr Opin Struct Biol 11: 725-32, 2001）の場合と同様に、相互作用は、一般的に、抗体の場合のようなフレキシブルなループ中に存在する残基の代わりに、二次構造エレメントの表面上の残基（図２）により提供される。リピートタンパク質を、結合分子を生成するための足場として使用するための一般的な原理が記載されており（Forrer et al., FEBS Lett. 539(1-3): 2-6, 2003）、設計されたアンキリンリピートタンパク質の場合において、高親和性バインダーを、そのような設計したアンキリンリピートタンパク質ライブラリーから上手く選択した（Binz et al., Nat Biotechnol. 22(5): 575-82, 2004）。
【０００５】
アルマジロリピートタンパク質、βカテニン及びインポーチンαなどは、異なる型のペプチドに結合することができ、特定の保存された側鎖又はペプチドの遊離ＮもしくはＣ末端との相互作用を必要とせず、ペプチド骨格の一定の結合方法に依存する（図３）。残基ごとにペプチドを認識する可能性は、リピートタンパク質の内因的モジュラー性と合わせて、アルマジロリピートタンパク質を、ペプチド結合のための包括的足場の設計のための有望な候補にする。また、１０〜２０nMという低い顕著なＫ_Ｄが、標的ペプチドの結合についてインポーチンα（Catimel B. et al., J Biol Chem 276: 34189-98, 2001）で報告されており、設計されたアルマジロリピートタンパク質との高いペプチド結合親和性を達成する可能性を示している。
【０００６】
このように、本発明の基礎をなす技術的問題は、アルマジロリピートタンパク質に基づく標的特異的なペプチド結合タンパク質の効率的な生成のための新規アプローチを同定することである。この技術的問題への解決法は、特許請求の範囲において特徴付けられる実施態様を提供することにより達成される。
【発明の概要】
【０００７】
本発明は、アルマジロリピートタンパク質に基づく標的特異的な設計された結合タンパク質、及びそれらを生成するための方法に関する。設計されたアルマジロリピートタンパク質は、単一のアルマジロリピート単位のコンセンサス配列に基づく。特に、本発明は、アルマジロリピート単位のコンセンサス配列に由来する少なくとも２つの連続リピートモジュールを含む少なくとも１つのリピートドメインを含むアルマジロリピートタンパク質の収集物に関し、ここで該アルマジロリピートタンパク質の少なくとも１つは標的分子に結合することができる。そのような収集物中の設計されたアルマジロリピートタンパク質は、少なくとも１つのアミノ酸位置で互いに異なる。好ましくは、そのような収集物中の設計されたアルマジロリピートタンパク質は、標的相互作用位置に対応する少なくとも１つのアミノ酸位置において互いに異なる。より好ましくは、標的分子は標的（ポリ）ペプチドである。さらにより好ましくは、標的分子は標的（ポリ）ペプチドであり、ここでアルマジロリピートタンパク質により結合した（ポリ）ペプチドの部分は伸長したコンホメーションにある。
【０００８】
より具体的には、本発明は、アルマジロリピート配列モチーフ
【表１】

を伴うリピートモジュールを含むアルマジロリピートタンパク質の収集物に関し、ここで「ｘ」は任意のアミノ酸を表示し、「±」は任意のアミノ酸又は欠失を表示し（「±」は位置のナンバリング中でカウントされない）、「ａ」は無極性側鎖を伴うアミノ酸を表示し、「ｐ」は極性側鎖を伴う残基を表示する。そのような設計されたアルマジロリピートタンパク質の例を以下に記載する。
【０００９】
好ましい収集物中で、各リピートモジュールはアミノ酸配列を有し、ここでアミノ酸残基の少なくとも７０％が、
（ｉ）少なくとも２つのアルマジロリピート単位の対応する位置で見出されるアミノ酸残基から推定されるコンセンサスアミノ酸残基；又は
（ｉｉ）１つのアルマジロリピート単位中の対応する位置で見出されるアミノ酸残基
のいずれかに対応する。
【００１０】
好ましくは、そのようなアルマジロリピート単位は天然のアルマジロリピート単位である。
【００１１】
本発明の収集物中で、特定のアミノ酸に割り当てるように示されていない位置は無作為化されており、即ち、異なるアミノ酸により占められてよい。特に好ましいのは、アルマジロリピートタンパク質ファミリーの天然メンバー中の対応するアミノ酸位置に存在するアミノ酸に対応するそのような無作為化された位置のアミノ酸である。
【００１２】
好ましくは、本発明の設計されたアルマジロリピートタンパク質は、さらに、（内部）リピートモジュールのいずれかとは異なるアミノ酸配列を有するＮ及び／又はＣ末端キャッピングモジュールを含む。特に、そのようなＮ及びＣ末端キャッピングモジュールはアミノ酸配列を有し、ここで少なくとも５０％、好ましくは少なくとも６０％、さらにより好ましくは少なくとも７０％のアミノ酸残基が、
（ｉ）少なくとも２つの天然のリピート単位又はキャッピング単位の対応する位置で見出されるアミノ酸残基から推定されるコンセンサスアミノ酸残基；又は
（ｉｉ）１つの天然のリピート単位又はキャッピング単位中の対応する位置で見出されるアミノ酸残基
のいずれかに対応する。
【００１３】
本発明は、さらに、アルマジロリピート配列モチーフを伴うリピートモジュールを含む言及した設計されたリピートタンパク質をコードする核酸分子の収集物、アルマジロリピートタンパク質のそのような収集物を得る方法、標的分子に結合するこれらの収集物からの単一の設計されたアルマジロリピートタンパク質、及びこれらの設計されたアルマジロリピートタンパク質をコードする核酸分子に関する。
【図面の簡単な説明】
【００１４】
【図１】アルマジロリピートタンパク質の構造。リボン表示のインポーチンα（ＰＤＢＩＤ１ＥＥ５）及びβカテニン（ＰＤＢＩＤ１Ｉ７Ｗ）。Ｎ末端及びＣ末端キャッピングリピートは、濃い灰色で描写し、それぞれＮ及びＣにより示す。標的ペプチドは黒色であり、棒表示で示す。
【図２】アルマジロリピート単位。リボン表示のアルマジロリピート単位（リピート６、１ＥＥ５）の二次構造エレメント：αヘリックスＨ１、Ｈ２、及びＨ３を示す。標的ペプチドへの結合に関与する位置の残基（標的相互作用残基）を、暗灰色の棒として描写する。これらの標的相互作用残基は、Ｈ１中の位置４、Ｈ３中の位置２６、２９、３０、３３、３６、３７、４０、及び次のリピートのＨ３とＨ１の間のループ中の位置４１に見出される。
【図３】アルマジロリピートタンパク質の結合様式。アルマジロリピートタンパク質の標的ペプチドとの相互作用の概略図。標的ペプチド（黒色で示す）は、逆平行で、タンパク質のペプチド骨格に関して結合する。Ｎ及びＣはペプチドのＮ及びＣ末端をそれぞれ示し、アミノ酸側鎖をリピートの端に向かって指す棒として示す。ｒｅｐ１、ｒｅｐ２、及びｒｅｐ３は３つの連続アルマジロリピートを示す。結合に関与するアルマジロリピートの残基は、単一のリピート配列内の特定の位置（ｒｅｐ２中の番号を付けた丸により示す）を占める。位置３７の残基はペプチド主鎖の結合に関与し、濃い灰色で描写する；他の位置はペプチド側鎖の認識に関与する。
【図４】設計されたアルマジロリピートタンパク質遺伝子のための組み立て戦略の模式図。内部モジュールＣ、Ｎ末端キャップＮｙ、及びＣ末端キャップＣａからのＹＣ_２Ａの構築を例として示す。オリゴヌクレオチド（それらの名称により示す）を、ＰＣＲにより内部又は末端キャッピングモジュールに組み立てる。単一モジュールは、ベクター中の挿入のためのＢａｍＨＩ及びＫｐｎＩならびにモジュールの連結のためのＩＩＳ型制限酵素ＢｓａＩ及びＢｐｉＩのための制限酵素部位を含む。ａ：アセンブリーＰＣＲ、ｂ：ＢａｍＨＩ及びＫｐｎＩで消化、ｃ：連結、ｄ：ＢｓａＩで消化、ｅ：ＢｐｉＩで消化、ｆ：増幅及び追加の消化／連結サイクル。
【図５】プラスミドｐＱＥ３０−ＹＣ_４Ａ。ＹＣ_４Ａタンパク質をコードする遺伝子を含むベクターｐＱＥ３０の模式図。全ての設計されたアルマジロリピートタンパク質を、同じベクター中に、同じ制限酵素部位（即ち、ＢａｍＨＩ及びＫｐｎＩ）を使用してクローニングした。
【図６】Ｃ型モジュールの疎水性コアにおける突然変異の位置。単一のアルマジロリピート中のヘリックスをＨ１、Ｈ２、Ｈ３で標識する；突然変異の疎水性コアの位置を球及び対応するアミノ酸位置番号で示す。
【図７】疎水性コア突然変異体の実験的評価：分子ふるいクロマトグラフィー（ＳＥＣ）での溶出容積及びＡＮＳ結合時での蛍光放出。番号は、表１０に示される突然変異を指す。突然変異タンパク質の各々は、４つの同一の内部リピートならびにキャッピングリピートとしてのＮｙ及びＣａを含む。０はＹＣ_４Ａタンパク質を示す。全てのタンパク質は約２７kDaの分子量を有する。Ａｌａ→Ｔｈｒ突然変異は、リピート３中の位置１５のｍｕｔ６、リピート４中の位置３１のｍｕｔ９、リピート１中の位置１２のｍｕｔ１０、及びリピート１中の位置１５のｍｕｔ１７により運ばれる。Ｍｕｔ８は、リピート４中の位置４２に突然変異Ｇｌｙ→Ｖａｌを有する。ｍｕｔ１（カッコ内）は、その二量体の状態のため、ＹＣ_４Ａ及び他の突然変異体の前に溶出される。全ての他の突然変異体は、多角度光散乱（ＭＡＬＳ）により単量体であることが示された。２８０nmでの吸光度により測定したＳＥＣ溶出容積から、及び、蛍光強度により測定したＡＮＳ（１−アニリノ−ナフタレン−８−スルホン酸）結合からのピーク値を、テストした各タンパク質についてプロットする。測定値における誤差を、６つのタンパク質及び２つの異なる調製物のサブセットで推定しており、ＳＥＣについて平均標準偏差０．０１ml及びＡＮＳ蛍光強度について平均パーセント誤差４％をもたらす。ＳＥＣのための参照として、溶出容積（炭酸脱水酵素（ＣＡ，ＭＷ＝２９kDa）１．７３ml及びウシ血清アルブミン（ＢＳＡ，ＭＷ＝６６kDa）１．５５ml）についてのピーク値を示す。
【図８】選択した設計されたアルマジロリピートタンパク質の特異的な標的結合。選択したクローンと標的ペプチド（ｎｌｓ、配列ＫＫＫＲＫＶを有する）、陰性対照ペプチド（ｃｒｏ、配列ＰＲＴＳＳＦを有する）、及びNeutrAvidinとの相互作用を、粗抽出物ＥＬＩＳＡにより示す。ビオチン化ペプチドをNeutrAvidin上に固定化した。番号は、ｎｌｓ標的ペプチドに対するリボソームディスプレイにおいて選択された単一クローンを指す。Ａ＝吸光度及びＮ＝NeutrAvidin暗灰色バーはｎｌｓペプチドへの結合を示し、線を伴う白色バーはｃｒｏペプチドへの結合を示し、影付きバーはNeutrAvidinへの結合（バックグラウンド結合）を示す。
【図９】特定モジュールの選択模式図は、既に選択した設計されたアルマジロリピートタンパク質に由来する隣接リピートモジュールを使用した、小さなペプチド標的（例、小さなアミノ酸ストレッチ）に特異的なリピートモジュールの選択のための手順を示す。事前に選択したリピートモジュールは、リピートモジュールライブラリーに隣接し、標的ペプチドへの追加接触を提供し、選択を、標的（ポリ）ペプチド分子の内部部分（例えば、ジペプチド）だけに制限する。Ａ：公知の特異性を伴うリピートモジュールに対応するＤＮＡ配列を回収する。１、２、及び３は内部特異的リピートモジュールであり、Ｎ及びＣはＮ及びＣ末端キャッピングリピートである。ｕは、リピートモジュールＤＮＡの組み立て中に、タンパク質配列に影響を与えることなく導入された唯一の制限酵素部位である。Ｂ：ＤＮＡフラグメントを、リピートモジュールライブラリー（Ｌ）と一緒に、設計されたアルマジロリピートタンパク質をコードする配列中で組み立てる；結果として得られる配列を選択のために使用する。Ｃ：新たな特異性を伴う設計されたアルマジロリピートタンパク質を選択時に同定する。工程Ａにおいて導入された唯一の制限酵素部位を利用し、選択されたリピートモジュール（４）のＤＮＡ配列を回収し、新たに選択されたリピートモジュールの結合特異性を使用した、設計されたアルマジロリピートタンパク質の生成のために使用する。
【図１０】直線状ペプチドの認識のための事前に選択されたモジュールの組み合わせ設計されたアルマジロリピートタンパク質によって、短いアミノ酸配列を特異的に認識する単一のリピートモジュールの選択が可能になる。選択されたペプチドに特異的なリピートモジュールを次に組み合わせて、追加選択を実施することなく、より長いペプチドを認識できる新たな設計されたアルマジロリピートタンパク質を形成する。ａ：ライブラリー、ｂ：選択、ｃ：選択されたバインダー、ｄ：モジュールの組み合わせ、ｅ：組み合わせたバインダー、ｆ：ペプチド標的配列。
【００１５】
本発明の詳細な説明
設計されたアルマジロリピートタンパク質に関連するリピートタンパク質についての以下の定義は、特許出願ＷＯ０２／２０５６５中のものに基づく。特許出願ＷＯ０２／２０５６５は、リピートタンパク質の特性、技術、及び適用の一般的説明をさらに含む。
【００１６】
本発明に関連し、「収集物」という用語は、少なくとも２つの異なる実体又はメンバーを含む集団を指す。好ましくは、そのような収集物は、少なくとも１０^５、より好ましくは１０^７を上回る、最も好ましくは１０^９を上回る異なるメンバーを含む。「収集物」は、「ライブラリー」又は「大多数（ｐｌｕｒａｌｉｔｙ）」と呼んでもよい。
【００１７】
「収集物」は、例えば、タンパク質、（ポリ）ペプチド、又は核酸の集団でありうる。それは、無作為化された核酸分子の確率的混合物又は無作為化された核酸分子によりコードされるタンパク質の混合物でありうるが、しかし、一連の空間的に分離された核酸分子又はタンパク質でもありうる。この二重の意味は、発現ライブラリーの調製及びスクリーニングを扱う分子生物学において使用される「収集物」の標準的意味に対応する。
【００１８】
異なるメンバーのタンパク質又は（ポリ）ペプチドの収集物は、少なくとも１つのアミノ酸位置で異なる。好ましくは、メンバーは、標的相互作用位置に対応する少なくとも１つのアミノ酸位置で異なる。異なるメンバーの核酸の収集物は、少なくとも１つの塩基位置で異なる。好ましくは、メンバーは、標的相互作用位置に対応する少なくとも１つの塩基位置で異なる。
【００１９】
「リピートタンパク質」という用語は、１つ又は複数のリピートドメインを含む（ポリ）ペプチド／タンパク質を指す。好ましくは、リピートタンパク質の各々は、４つまでのリピートドメインを含む。さらに好ましくは、リピートタンパク質の各々は、２つまでのリピートドメインを含む。最も好ましくは、リピートタンパク質の各々は、１つのリピートドメインを含む。さらに、リピートタンパク質は、追加の非リピートタンパク質ドメイン、（ポリ）ペプチドタグ、及び／又は（ポリ）ペプチドリンカー配列を含みうる。「アルマジロリピートタンパク質」は、約４２のアミノ酸の配列モチーフのタンデムな不完全アルマジロリピートを持ち、それは３つのアルファヘリックスからなる。タンデムなアルマジロリピートは一緒に折り畳まれ、互いに広範囲に相互作用し、右巻き超らせんのらせんを形成し、それはタンパク質−タンパク質相互作用のための表面を作製する。アルマジロリピートタンパク質の多くのサブファミリー、例えば、ベータ−カテニン、プラコグロビン、又はインポーチンアルファのサブファミリーが存在する。アルマジロリピートタンパク質及びそれらのサブファミリーは、当業者に周知である（Coates, loc. cit., Andrade et al., loc. cit.）。
【００２０】
「設計されたリピートタンパク質」という用語は、限定はされないが、本発明において説明する手順を含む、本発明の手順の結果として得られる「リピートタンパク質」を指す。「設計されたリピートタンパク質」は合成であり、天然から単離されず、又は、天然で見出されない。それらは、対応して設計された核酸の発現により得られる人工タンパク質である。「設計された核酸」は同様に合成（人工）であり、天然から単離されず、又は、天然で見出されない。好ましくは、発現は真核生物又は細菌の細胞中で、又は、無細胞インビトロ発現系の使用により行われる。
【００２１】
「（ポリ）ペプチドタグ」という用語は、（ポリ）ペプチド／タンパク質に付着したアミノ酸配列を指し、ここでアミノ酸配列は（ポリ）ペプチド／タンパク質の精製、検出、又は標的化に有用であり、又は、ここでアミノ酸配列は（ポリ）ペプチド／タンパク質の物理化学的挙動を改善し、又は、ここでアミノ酸配列はエフェクター機能を持つ。リピートタンパク質の個々の（ポリ）ペプチドタグ、成分、及び／又はドメインを、互いに直接的に又は（ポリ）ペプチドリンカーを介して結合することができる。
【００２２】
「（ポリ）ペプチドリンカー」という用語は、例えば、２つのタンパク質ドメイン、（ポリ）ペプチドタグとタンパク質ドメイン、又は、２つの配列タグを連結できるアミノ酸配列を指す。そのような追加ドメイン、タグ、及びリンカーは当業者に公知である。例のリストを特許出願ＷＯ０２／２０５６５の説明において提供する。
【００２３】
本発明に関連して、「（ポリ）ペプチド」という用語は、ペプチド結合を介して連結された複数、即ち、２つ又はそれ以上のアミノ酸の１つ又は複数の鎖からなる分子に関する。
【００２４】
「タンパク質」という用語は（ポリ）ペプチドを指し、ここで（ポリ）ペプチドの少なくとも部分は、その（ポリ）ペプチド鎖の内部及び／又は間の二次、三次、又は四次構造を形成することにより定義された三次元配置を有する、又は、得ることができる。タンパク質が２つ又はそれ以上の（ポリ）ペプチドを有する場合、個々の（ポリ）ペプチド鎖は非共有結合的又は共有結合的に、例えば、２つの（ポリ）ペプチド間のジスルフィド結合により連結されうる。タンパク質の部分は、二次又は三次構造を形成することにより定義された三次元配置を個々に有する、又は、得ることができ、「タンパク質ドメイン」と呼ばれる。そのようなタンパク質ドメインは当業者に周知である。
【００２５】
「リピートドメイン」という用語は、構造単位として２つ又はそれ以上の連続リピート単位（モジュール）を含むタンパク質ドメインを指し、ここで構造単位は同じ折り畳みを有し、そして堅固に積み重なり、例えば、結合疎水性コアを有する超らせん構造を作製する。
【００２６】
「構造単位」という用語は、（ポリ）ペプチドの局所的に順序付けられた部分を指し、（ポリ）ペプチド鎖に沿って互いに近い二次構造の２つ又はそれ以上のセグメントの間の三次元相互作用により形成される。そのような構造単位は構造モチーフを含む。「構造モチーフ」という用語は、少なくとも１つの構造単位中に存在する二次構造エレメントの三次元配置を指す。例えば、アルマジロタンパク質中に繰り返して存在する構造モチーフは、三角形のおおよそ３辺を形成する３つのαヘリックスからなる（図２）。構造モチーフは当業者に周知である。構造単位単独では定義された三次元配置を得ることはできない；しかし、リピートドメイン中でのリピートモジュールとしてのそれらの連続配置は、隣接単位の相互安定化を導き、超らせん構造をもたらす。
【００２７】
「リピート単位」という用語は、１つ又は複数の天然タンパク質の配列モチーフを含むアミノ酸配列を指し、ここで「リピート単位」は複数のコピーで見出され、タンパク質の折り畳みを決定する全てのモチーフに共通する定義された折り畳みトポロジーを示す。そのようなリピート単位は、フレームワーク残基及び相互作用残基を含む。そのようなリピート単位の例は、アルマジロリピート単位は別として、ロイシンリッチリピート単位、アンキリンリピート単位、テトラトリコペプチドリピート単位、ＨＥＡＴリピート単位、及びロイシンリッチ変異体リピート単位を含む。２つ又はそれ以上のそのようなリピート単位を含む天然タンパク質は、「天然リピートタンパク質」と呼ばれる。リピートタンパク質の個々のリピート単位のアミノ酸配列は、互いに比較された場合、有意な数の突然変異、置換、付加、及び／又は欠失を有しうるが、リピート単位の一般的なパターン、又はモチーフを依然として実質的に保持する。
【００２８】
「フレームワーク残基」という用語は、リピート単位のアミノ酸残基、又はリピートモジュールの対応するアミノ酸残基に関し、折り畳みトポロジーに寄与し、即ち、リピート単位（又はモジュール）の折り畳みに寄与する、又は、隣接単位（又はモジュール）との相互作用に寄与する。そのような寄与は、リピート単位（モジュール）中の他の残基との相互作用、あるいはαヘリックス又はβシート、又は直線状ポリペプチドもしくはループを形成するアミノ酸ストレッチで見出されるポリペプチド骨格の立体構造への影響でありうる。
【００２９】
「標的相互作用残基」という用語は、リピート単位のアミノ酸残基、又はリピートモジュールの対応するアミノ酸残基を指し、標的物質との相互作用に寄与する。そのような寄与は、標的物質との直接的な相互作用、又は他の直接的に相互作用する残基への影響（例、リピート単位（モジュール）の（ポリ）ペプチドの立体構造を安定化し、標的と直接的に相互作用する残基の相互作用を可能にする又は増強することによる）でありうる。そのようなフレームワーク残基及び標的相互作用残基は、上に言及する物理化学的方法により得られる構造データの分析により、又は、構造生物学及び／又は生物情報学の実践者に周知である公知の及び関連する構造情報との比較により同定してよい。
【００３０】
好ましくは、リピート配列モチーフの推定に使用するリピート単位は相同なリピート単位であり、ここでリピート単位は同じ構造モチーフを含み、ここでリピート単位のフレームワーク残基の７０％超が相同である。好ましくは、リピート単位のフレームワーク残基の８０％超が相同である。より好ましくは、リピート単位のフレームワーク残基の９０％超が相同である。ポリペプチドの間の相同性のパーセントを決定するためのコンピュータプログラム（Ｆａｓｔａ、Ｂｌａｓｔ、又はＧａｐなど）は、当業者に公知である。
【００３１】
「リピート配列モチーフ」という用語はアミノ酸配列を指し、１つ又は複数のリピート単位から推定される。そのようなリピート配列モチーフは、フレームワーク残基位置及び標的相互作用残基位置を含む。フレームワーク残基位置は、リピート単位のフレームワーク残基の位置に対応する。同様に、標的相互作用残基位置は、リピート単位の標的相互作用残基の位置に対応する。リピート配列モチーフは、固定化された位置及び無作為化された位置を含む。「固定化された位置」という用語は、リピート配列モチーフ中のアミノ酸位置を指し、ここで位置は特定のアミノ酸に設定される。ほとんどの場合、そのような固定化された位置は、フレームワーク残基の位置に対応する。「無作為化された位置」という用語は、リピート配列モチーフ中のアミノ酸位置を指し、ここで２つ又はそれ以上のアミノ酸がアミノ酸位置で可能であり、例えば、ここで通常の２０の天然アミノ酸のいずれかが可能であり、又はここで２０の天然アミノ酸の大半が可能であり、例えば、システイン以外のアミノ酸、又はグリシン以外のアミノ酸、システイン及びプロリンであり、以下に詳細に説明される通りである。ほとんどの場合、そのような無作為化された位置は、標的相互作用残基の位置に対応する。しかし、フレームワーク残基の一部の位置も無作為化してよい。アミノ酸配列モチーフは、当業者に周知である。
【００３２】
「折り畳みトポロジー」という用語は、リピート単位の三次構造を指す。折り畳みトポロジーは、αヘリックス又はβシートの少なくとも一部を形成するアミノ酸のストレッチ、又は直線状ポリペプチド又はループを形成するアミノ酸ストレッチ、又はαヘリックス、βシート、及び／又は直線状ポリペプチド／ループの任意の組み合わせにより決定される。
【００３３】
「連続」という用語は配置を指し、ここで以下に記載するリピート単位又はリピートモジュールがタンデムに配置される。設計されたリピートタンパク質中に、少なくとも２つ、通常は約２〜６、特に少なくとも約６、高頻度には２０又はそれ以上のリピート単位が存在する。大半の場合において、リピート単位は、高度の配列同一性（対応する位置での同じアミノ酸残基）又は配列類似性（アミノ酸残基は異なるが、しかし、類似の物理化学的特性を有する）を示し、アミノ酸残基の一部は天然タンパク質で見出される異なるリピート単位で強く保存されている重要残基でありうる。しかし、アミノ酸の挿入及び／又は欠失、及び／又は置換による天然タンパク質で見出される異なるリピート単位の間での高度な配列変動性は、共通の折り畳みトポロジーが維持される限り可能である。
【００３４】
物理化学的手段（Ｘ線結晶学、ＮＭＲ、又はＣＤ分光測定など）によりリピートタンパク質の折り畳みトポロジーを直接的に決定するための方法が、当業者に周知である。リピート単位又はリピート配列モチーフを同定及び決定するため、又は、そのようなリピート単位又はモチーフを含む関連タンパク質のファミリーを同定するための方法、例えば、ホモロジー検索（ＢＬＡＳＴなど）は、生物情報学の分野において十分に確立されており、当業者に周知である。初期リピート配列モチーフを改良する工程は、反復プロセスを含みうる。
【００３５】
「リピートモジュール」という用語は、本発明の設計されたリピートタンパク質の繰り返しアミノ酸配列を指し、天然のアルマジロリピートタンパク質のリピート単位（図２）に由来する。リピートドメイン中に含まれる各リピートモジュールは、天然のアルマジロリピートタンパク質のファミリー又はサブファミリーの１つ又は複数のリピート単位に由来する。
【００３６】
「天然リピートタンパク質のファミリー」という用語は、天然リピートタンパク質のグループを指し、ここでグループのメンバーは類似のリピート単位を含む。「サブファミリー」という用語は、天然リピートタンパク質のファミリーのサブグループを指す。
【００３７】
「リピートモジュール」は、対応するリピートモジュールの全てのコピー中に存在するアミノ酸残基を伴う位置（「固定化された位置」）及び異なる又は「無作為化された」アミノ酸残基を伴う位置（「無作為化された位置」）を含みうる。
【００３８】
「少なくとも１つの位置で異なる」という用語は、設計されたリピートタンパク質の収集物を指し、少なくとも１つの位置を有し、ここで１つを超えるアミノ酸が収集物の異なるリピートタンパク質で見出されうる。好ましくは、そのような位置は無作為化される。好ましくは、無作為化された位置は、追加で、１つの設計されたリピートドメイン内のリピートモジュール間で変動する。好ましくは、そのような位置は十分に無作為化されうる、即ち、完全な一連の天然タンパク新生アミノ酸残基により占められる。より好ましくは、そのような位置は部分的に無作為化されうる、即ち、完全な一連の天然アミノ酸残基のサブセットにより占められる。アミノ酸残基のサブセットは、共通の物理化学的特性を伴う一連のアミノ酸残基、例えば一連の疎水性、親水性、酸性、塩基性、芳香族、又は脂肪族アミノ酸、特定の非所望のアミノ酸残基を除く全てを含むサブセット、例えばシステイン又はプロリンを含まないセット、又は天然リピートタンパク質中の対応する位置で見出される全てのアミノ酸残基を含むサブセットでありうる。無作為化は、標的相互作用残基の一部、好ましくは全てに適用してよい。「無作為化された」リピートタンパク質を作るための方法、例えば、リピートタンパク質をコードする核酸配列のオリゴヌクレオチド特異的突然変異誘発（ｏｌｉｇｏｎｕｃｌｅｏｔｉｄｅ−ｄｉｒｅｃｔｅｄｍｕｔａｇｅｎｅｓｉｓ）（例、モノヌクレオチド又はトリヌクレオチドの混合物の使用）の使用、又は核酸配列の合成中でのエラープローンＰＣＲ（ｅｒｒｏｒ−ｐｒｏｎｅＰＣＲ）の使用は当業者に周知である。位置のさらに好ましい少なくとも１つは、標的相互作用位置に対応する。
【００３９】
「標的分子」という用語は、核酸分子、（ポリ）ペプチドもしくはタンパク質、炭水化物、又は任意の他の天然分子（そのような個々の分子の任意の一部、又は２つもしくはそれ以上のそのような分子の複合体を含む）などの個々の分子を指す。標的は、全細胞又は組織のサンプルでよく、又は、それは任意の非天然分子もしくは成分でよい。好ましくは、標的分子は、化学修飾（例えば、天然もしくは非天然のリン酸化、アセチル化、又はメチル化による修飾）を含む天然もしくは非天然（ポリ）ペプチド又は（ポリ）ペプチドである。
【００４０】
「コンセンサス配列」という用語はアミノ酸配列を指し、ここでコンセンサス配列は複数のリピート単位の構造的及び／又は配列アラインメントにより得られる。２つ又はそれ以上の構造的及び／又は配列アラインメントリピート単位を使用し、そしてアラインメントでのギャップを可能にすることで、各位置で最も高頻度なアミノ酸残基を決定することが可能である。コンセンサス配列は、各位置で最も高頻度に表わされるアミノ酸を含む配列である。２つ又はそれ以上のアミノ酸が平均を上回り単一の位置で表わされる事象では、コンセンサス配列はそれらのアミノ酸のサブセットを含みうる。２つ又はそれ以上のリピート単位は、単一のリピートタンパク質に含まれるリピート単位から、又は、２つもしくはそれ以上の異なるリピートタンパク質から取ってよい。
【００４１】
コンセンサス配列及びそれらを決定するための方法は、当業者に周知である。
【００４２】
「コンセンサスアミノ酸残基」は、コンセンサス配列中の特定の位置で見出されるアミノ酸である。２つ又はそれ以上、例、３、４、又は５つのアミノ酸残基が、２つ又はそれ以上のリピート単位において類似の確率で見出される場合、コンセンサスアミノ酸は、最も高頻度で見出されるアミノ酸の１つ、又は、２つもしくはそれ以上のアミノ酸残基の組み合わせでありうる。
【００４３】
「アルマジロリピート単位のコンセンサス配列に由来するリピートモジュール」という用語は、以下
（ｉ）以下の工程を含むプロセス：
（ａ）アルマジロリピート単位のコンセンサス配列の決定；
（ｂ）初期アルマジロリピート配列モチーフの決定であって、ここで配列モチーフのフレームワーク残基が（ａ）のコンセンサス配列の最も保存されたコンセンサスアミノ酸に設定され、配列モチーフの標的相互作用残基の位置が（ｂ）のコンセンサス配列のそれほど保存されていない位置に対応する；
（ｃ）リピート単位のコンピュータ設計、配列分析、及び／又は構造分析による（ｂ）のリピート配列モチーフの改良；及び
（ｄ）（ｃ）のリピート配列モチーフに従ったリピートモジュールの構築；又は
（ｉｉ）（ｉ）のプロセスを含むプロセスであって、コンピュータ設計及び／又はランダム突然変異誘発もしくはランダムキメラ形成による進化によるリピートモジュールのさらなる改良が続く
により入手可能なリピートモジュールを指す。
【００４４】
しかし、「アルマジロリピート単位のコンセンサス配列に由来するリピートモジュール」という用語は、記載のプロセスにより得られるリピートモジュールに制限されない。本発明の記載において提供する情報に基づき、さらなるリピートモジュールを、記載する特別なプロセスを繰り返すことなく、デノボで設計することが現在可能であり、そして「アルマジロリピート単位のコンセンサス配列に由来するリピートモジュール」という用語は、本明細書で提供する情報を使用してデノボで設計されたそのようなモジュールも含み、そしてデノボで設計されたモジュールは、次に合成され、さらにコンピュータ設計及び／又はランダム突然変異誘発及び／又はランダムキメラ形成による設計されたリピートモジュールの進化によりさらに改良されることが理解される。
【００４５】
「伸長したコンホメーションのポリペプチド」という用語は、二次構造エレメントを有さないコンホメーションにあるアミノ酸の連続ストレッチを意味する。好ましくは、アミノ酸のストレッチのペプチド結合でのファイ及びプサイ角度は１２０°を上回る。さらにより好ましくは、角度は１４０°、１６０°、又は１７０°を上回る。
【００４６】
好ましい実施態様は、アルマジロリピート配列モチーフ
【表２】

を伴うリピートモジュールを含むアルマジロリピートタンパク質の収集物であって、ここで「ｘ」は任意のアミノ酸を示し、「±」は任意のアミノ酸又は欠失を示し（「±」は位置の通常のナンバリングにおいてカウントされないが、しかし、カッコ中の位置番号に含まれる）、「ａ」は非極性側鎖を伴うアミノ酸、特に残基Ａ、Ｆ、Ｇ、Ｉ、Ｌ、Ｍ、Ｐ、Ｔ、Ｖ、Ｗ、及びＹのいずれかを示し、そして「ｐ」は極性側鎖を伴う残基、特に残基Ａ、Ｃ、Ｄ、Ｅ、Ｇ、Ｈ、Ｋ、Ｎ、Ｐ、Ｑ、Ｒ、Ｓ、Ｔ、及びＹを示す。
【００４７】
さらなる好ましい実施態様はアルマジロリピートタンパク質の収集物であって、リピートタンパク質はアルマジロリピート配列モチーフ
【表３】

を伴うリピートモジュールを含み、ここで「ｘ」は任意のアミノ酸を示し、「ａ」は非極性側鎖を伴うアミノ酸を示し、そして「ｐ」は極性側鎖を伴う残基を示す。
【００４８】
さらなる好ましい実施態様はアルマジロリピートタンパク質の収集物であって、ここでリピートドメインのリピートモジュールの全てがアルマジロリピートタンパク質の特定のサブファミリーのリピート単位のコンセンサス配列に由来する。好ましくは、アルマジロリピートタンパク質のサブファミリーは、ベータ−カテニン、プラコグロビン、又はインポーチンアルファのサブファミリーのいずれかである。
【００４９】
さらなる好ましい実施態様において、リピートモジュールの各々がアミノ酸配列を有し、ここで少なくとも７０％のアミノ酸残基が以下
（ｉ）少なくとも２つのリピート単位の対応する位置で見出されるアミノ酸残基から推定されるコンセンサスアミノ酸残基；又は
（ｉｉ）１つのリピート単位中の対応する位置で見出されるアミノ酸残基。好ましくは、そのようなリピート単位は天然アルマジロリピート単位である
のいずれかに対応する。
【００５０】
特に好ましくは収集物であって、ここでリピートモジュールの各々が配列モチーフ
【表４】

を含み、ここで「ｘ」は任意のアミノ酸を示し、「ａ」は残基Ａ、Ｆ、Ｇ、Ｉ、Ｌ、Ｍ、Ｐ、Ｔ、Ｖ、Ｗ、及びＹのいずれかを示し、そして「ｐ」は残基Ａ、Ｃ、Ｄ、Ｅ、Ｇ、Ｈ、Ｋ、Ｎ、Ｐ、Ｑ、Ｒ、Ｓ、Ｔ、及びＹのいずれかを示す。
【００５１】
さらにより好ましくは収集物であって、ここでリピートモジュールの各々が配列モチーフ
【表５】

を含み、ここで「１」及び「２」は任意のアミノ酸残基を表わす。このリピート配列モチーフはＩ型と呼ばれる。完全コンセンサス配列Ｉ型を配列番号１及び表３に示す。以下の実施例２では、どのようにコンセンサス配列がインポーチンαサブファミリーのアルマジロリピートタンパク質からの１３３のリピート配列に由来したか（故にＩ型）、次にインポーチンα結晶構造の分析に基づいて適用された修飾、これに起因する構造的意味、フレームワーク残基及び標的相互作用残基の推定位置、及びＩ型モジュールの使用目的を詳細に説明する。好ましくは、「１」はＥ、Ｈ、Ｉ、Ｋ、Ｑ、Ｒ、及びＴからなる群より選択されるアミノ酸残基を表わし、そして「２」はＡ、Ｄ、Ｅ、Ｆ、Ｈ、Ｉ、Ｋ、Ｌ、Ｍ、Ｎ、Ｑ、Ｒ、Ｓ、Ｔ、Ｖ、Ｗ、及びＹからなる群より選択されるアミノ酸残基を表わす。
【００５２】
また、特に好ましくは収集物であって、ここでリピートモジュールの各々が配列モチーフ
【表６】

を含み、ここで「ｘ」は任意のアミノ酸を示し、「ａ」は残基Ａ、Ｆ、Ｇ、Ｉ、Ｌ、Ｍ、Ｐ、Ｔ、Ｖ、Ｗ、及びＹのいずれかを示し、そして「ｐ」は残基Ａ、Ｃ、Ｄ、Ｅ、Ｇ、Ｈ、Ｋ、Ｎ、Ｐ、Ｑ、Ｒ、Ｓ、Ｔ、及びＹのいずれかを示す。
【００５３】
さらにより好ましくは収集物であって、ここでリピートモジュールの各々が配列モチーフ
【表７】

を含み、ここで「１」及び「２」が任意のアミノ酸残基を表わす。このリピート配列モチーフはＴ型と呼ばれる。完全コンセンサス配列Ｔ型を配列番号２及び表３に示す。以下の実施例３では、どのようにコンセンサス配列がβカテニン／プラコグロビンサブファミリーのアルマジロリピートタンパク質からの１１０のリピート配列に由来したか（Ｔ型）、次にβカテニン結晶構造の分析に基づいて適用された修飾、これに起因する構造的意味、フレームワーク残基及び標的相互作用残基の推定位置、及びＴ型モジュールの使用目的を詳細に説明する。好ましくは、「１」はＥ、Ｈ、Ｉ、Ｋ、Ｑ、Ｒ、及びＴからなる群より選択されるアミノ酸残基を表わし、そして「２」はＡ、Ｄ、Ｅ、Ｆ、Ｈ、Ｉ、Ｋ、Ｌ、Ｍ、Ｎ、Ｑ、Ｒ、Ｓ、Ｔ、Ｖ、Ｗ、及びＹからなる群より選択されるアミノ酸残基を表わす。
【００５４】
また、特に好ましくは収集物であって、ここでリピートモジュールの各々が配列モチーフ
【表８】

を含み、ここで「ｘ」は任意のアミノ酸を示し、「ａ」は残基Ａ、Ｆ、Ｇ、Ｉ、Ｌ、Ｍ、Ｐ、Ｔ、Ｖ、Ｗ、及びＹのいずれかを示し、そして「ｐ」は残基Ａ、Ｃ、Ｄ、Ｅ、Ｇ、Ｈ、Ｋ、Ｎ、Ｐ、Ｑ、Ｒ、Ｓ、Ｔ、及びＹのいずれかを示す。
【００５５】
さらにより好ましくは収集物であって、ここでリピートモジュールの各々が配列モチーフ
【表９】

を含み、ここで「１」及び「２」が任意のアミノ酸残基を表わす。このリピート配列モチーフはＣ型と呼ばれる。完全コンセンサス配列Ｃ型を配列番号３及び表３に示す。以下の実施例１では、どのようにコンセンサス配列がインポーチンα及びβカテニン／プラコグロビンサブファミリーのアルマジロリピートタンパク質からの２４３のリピート配列に由来したか（Ｃ型）、次にインポーチンα及びβカテニンの利用可能な結晶構造の分析及び標的ペプチドとの複合体の分析に基づいて適用された修飾、これに起因する構造的意味、フレームワーク残基及び標的相互作用残基の推定位置、及びＣ型モジュールの使用目的を詳細に説明する。好ましくは、「１」はＥ、Ｈ、Ｉ、Ｋ、Ｑ、Ｒ、及びＴからなる群より選択されるアミノ酸残基を表わし、そして「２」はＡ、Ｄ、Ｅ、Ｆ、Ｈ、Ｉ、Ｋ、Ｌ、Ｍ、Ｎ、Ｑ、Ｒ、Ｓ、Ｔ、Ｖ、Ｗ、及びＹからなる群より選択されるアミノ酸残基を表わす。
【００５６】
また、特に好ましくは収集物であって、ここでリピートモジュールの各々が配列モチーフ
【表１０】

を含み、ここで「ｘ」は任意のアミノ酸を示し、「ｓ」は残基Ａ、Ｉ、Ｌ、Ｖ、及びＧからなる群より選択されるアミノ酸残基を表わし、そして「ｈ」は残基Ａ、Ｉ、Ｌ、及びＶからなる群より選択されるアミノ酸残基を表わす。
【００５７】
さらにより好ましくは収集物であって、ここでリピートモジュールの各々が配列モチーフ
【表１１】

を含み、ここで「１」及び「２」が任意のアミノ酸残基を表わす。このリピート配列モチーフはＭ型と呼ばれる。完全コンセンサス配列Ｍ型を配列番号４及び表３に示す。以下の実施例４では、Ｃ型モジュールが、改善された疎水性コアを伴うＭ型モジュールを作製する意図で、「回転異性体サンプリング」アプローチを使用したコンピュータ方法によりさらに開発されたことを詳細に説明する。好ましくは、「１」はＥ、Ｈ、Ｉ、Ｋ、Ｑ、Ｒ、及びＴからなる群より選択されるアミノ酸残基を表わし、そして「２」はＡ、Ｄ、Ｅ、Ｆ、Ｈ、Ｉ、Ｋ、Ｌ、Ｍ、Ｎ、Ｑ、Ｒ、Ｓ、Ｔ、Ｖ、Ｗ、及びＹからなる群より選択されるアミノ酸残基を表わす。
【００５８】
さらにより好ましくは、位置２６及び２９のアミノ酸はＫ又はＱのいずれかである。最も好ましくは、位置２９のアミノ酸はＱである。
【００５９】
本発明の収集物のさらなる好ましい実施態様では、上に記載するリピートモジュール中の１つ又は複数のアミノ酸残基を、アルマジロリピート単位中の対応する位置で見出されるアミノ酸残基により交換する。好ましくは、３０％までのアミノ酸残基を交換し、より好ましくは、２０％まで、さらにより好ましくは、１０％までのアミノ酸残基を交換する。より好ましくは、そのようなアルマジロリピート単位は天然アルマジロリピート単位である。さらに別の特定の実施態様では、３０％までのアミノ酸残基、より好ましくは、２０％まで、さらにより好ましくは、１０％までのアミノ酸残基を、アルマジロリピート単位の対応する位置で見出されないアミノ酸と交換する。
【００６０】
「リピートモジュールの型」という用語は、モジュールの長さ、その「固定化された位置」ならびにその「無作為化された位置」の数及び組成により決定されるモジュールの特徴を指す。「異なる型のモジュール」は、１つ又は複数の特徴において異なりうる。異なる「型」は、同じ構造モチーフを含むリピート単位に由来するが、しかし、型はフレームワーク位置において異なる。型は以下：
（ａ）既存のモジュール又は型からのランダム突然変異誘発又はランダムキメラ形成；
（ｂ）サブファミリーを含む、配列アラインメントのための異なる配列セットの選択；
（ｃ）合理的な設計による既存のモジュール又は型の修飾；及び／又は
（ｄ）コンピュータ方法による既存のモジュール又は型の修飾
により生成できる。
【００６１】
特に好ましいのは、４つの型のリピートモジュール（上に定義するＩ型、Ｔ型、Ｃ型、及びＭ型と名付ける）のいずれか１つからなるリピートドメインを含むアルマジロリピートタンパク質の収集物である。さらに好ましくは収集物であって、ここでリピートドメイン中に含まれるリピートモジュールのアミノ酸配列が、無作為化された残基を除く言及した型の各々について同一である。
【００６２】
本発明の収集物のさらに好ましい実施態様において、リピートドメインの各々は、リピートモジュールの任意の１つとは異なるアミノ酸配列を有するＮ及び／又はＣ末端キャッピングモジュールをさらに含む。好ましくは、Ｎ末端キャッピングモジュールには非ライブラリーリピートモジュールが続き、及び／又は、Ｃ末端キャッピングモジュールには非ライブラリーリピートモジュールが先行する。
【００６３】
「非ライブラリーリピートモジュール」という用語は、ライブラリーリピートモジュールではないリピートモジュールを指す。非ライブラリーリピートモジュールは固定化された位置だけを含む。好ましくは、非ライブラリーリピートモジュールは、リピートドメインの熱力学的安定性を増加させる。
【００６４】
「ライブラリーリピートモジュール」という用語は、リピートモジュールライブラリーから得られる、又は、選択される単一のリピートモジュールを指す。「リピートモジュールライブラリー」という用語は、本発明に従って産生されるリピートモジュールのライブラリーを指す。
【００６５】
「キャッピングモジュール」という用語は、リピートドメインのＮ又はＣ末端リピートモジュールに融合したポリペプチドを指し、ここでキャッピングモジュールはリピートモジュールと強固な三次相互作用を形成し、それにより連続リピートモジュールと接触しない側で溶媒からリピートモジュールの疎水性コアを遮蔽するキャップを提供する。Ｎ及び／又はＣ末端キャッピングモジュールは、キャッピング単位（図１）又はリピート単位に隣接する天然リピートタンパク質中で見出される他のドメインでありうる、又は、それに由来しうる。「キャッピング単位」という用語は天然の折り畳まれた（ポリ）ペプチドを指し、ここで（ポリ）ペプチドはリピート単位のＮ又はＣ末端に融合した特定の構造単位を定義し、そしてここで（ポリ）ペプチドはリピート単位と強固な三次相互作用を形成し、それにより一方の側のリピート単位の疎水性コアを溶媒から遮蔽するキャップを提供する。そのようなキャッピング単位はリピート配列モチーフと配列類似性を有しうる。以下の実施例１では、どのようにキャッピング配列がアルマジロリピートタンパク質の天然キャッピングリピートに由来し、そして、本発明の設計されたリピートタンパク質の使用目的に適応されうるかを、結晶構造及び標的タンパク質結合複合体からの情報を考慮に入れて詳細に説明する。別のアプローチではＣ型モジュールを開始点として使用し、露出した疎水性残基を、天然配列及び結晶構造に由来するモデルに基づく親水性残基と置換する。
【００６６】
好ましくは、Ｎ及び／又はＣ末端キャッピングモジュールの各々はアミノ酸配列を有し、ここで少なくとも５０％、好ましくは少なくとも６０％、さらにより好ましくは少なくとも７０％のアミノ酸残基が、以下
（ｉ）少なくとも２つのリピート単位又はキャッピング単位の対応する位置で見出されるアミノ酸残基から推定されるコンセンサスアミノ酸残基；又は
（ｉｉ）１つのリピート単位又はキャッピング単位中の対応する位置で見出されるアミノ酸残基。より好ましくは、そのようなリピート単位又はキャッピング単位は天然リピート単位又はキャッピング単位である
のいずれかと対応する。
【００６７】
好ましい実施態様において、Ｎ末端キャッピングモジュールは配列モチーフ
【表１２】

を含む。このリピートＮ末端キャッピングモジュール配列モチーフをＮｙと呼ぶ（配列番号５）。Ｎ末端キャッピングモジュールＮｙは、Ｓ．ｃｅｒｅｖｉｓｉａｅのインポーチンαのＮ末端キャッピング単位に由来し（ＵｎｉＰｒｏｔｅｎｔｒｙＩＭＡ１＿ＹＥＡＳＴ、残基８８−１１９）、隣接リピートモジュールへの結合のための最後の２つの残基の修飾を伴う。
【００６８】
Ｎ末端キャッピングモジュールのための第２の好ましい実施態様は、配列モチーフ
【表１３】

を含む。このリピートＮ末端キャッピングモジュール配列モチーフをＮａと呼ぶ（配列番号６）。Ｎ末端キャッピングモジュールＮａは、本発明のＣ型リピートモジュールに由来し、Ｃ型リピートモジュールがアルマジロリピートドメインのＮ末端に置かれた場合、本来なら溶媒に露出される疎水性残基の交換による。詳細な説明を実施例１に提供する。
【００６９】
Ｃ末端キャッピングモジュールのための好ましい実施態様は、配列モチーフ
【表１４】

を含む。このリピートＣ末端キャッピングモジュール配列モチーフをＣａと呼ぶ（配列番号７）。Ｃ末端キャッピングモジュールＣａは、本発明のＣ型リピートモジュールに由来し、Ｃ型リピートモジュールがリピートドメインのＣ末端に置かれた場合、本来なら溶媒に露出される疎水性残基の交換による。詳細な説明を実施例１に提供する。
【００７０】
Ｃ末端キャッピングモジュールのための第２の好ましい実施態様は、配列モチーフ
【表１５】

を含む。このリピートＣ末端キャッピングモジュール配列モチーフをＣｙと呼ぶ（配列番号８）。Ｃ末端キャッピングモジュールＣｙは、Ｓ．ｃｅｒｅｖｉｓｉａｅのインポーチンαのＣ末端キャッピング単位に由来し（ＵｎｉＰｒｏｔｅｎｔｒｙＩＭＡ１＿ＹＥＡＳＴ、残基４６８−５１０）、隣接リピートモジュールへの結合のための最初の残基の修飾を伴う。
【００７１】
Ｃ末端キャッピングモジュールのための第３の好ましい実施態様は、配列モチーフ
【表１６】

を含む。このリピートＣ末端キャッピングモジュール配列モチーフをＣｍと呼ぶ（配列番号９）。Ｃ末端キャッピングモジュールＣｍは、Ｃ末端キャッピングモジュールＣｙに由来し、システインのアラニンによる交換及び最初の３つのアミノ酸の除去による。
【００７２】
本発明の収集物のさらなる好ましい実施態様では、上に記載するリピートモジュール中の１つ又は複数のアミノ酸残基を、アルマジロリピート単位中の対応する位置で見出されるアミノ酸残基により交換する。好ましくは、３０％までのアミノ酸残基を交換し、より好ましくは、２０％まで、さらにより好ましくは、１０％までのアミノ酸残基を交換する。最も好ましくは、そのようなリピート単位又はキャッピング単位は、天然のアルマジロリピート単位又はキャッピング単位である。さらに別の特定の実施態様では、３０％までのアミノ酸残基、より好ましくは、２０％まで、さらにより好ましくは、１０％までのアミノ酸残基を、アルマジロリピート単位又はキャッピング単位の対応する位置で見出されないアミノ酸と交換する。
【００７３】
本発明は、さらに、本発明において記載する設計されたリピートタンパク質、リピートタンパク質の対応するリピートドメインもしくはリピートドメインの部分、又は対応する単一リピートモジュール及びキャッピングモジュールの収集物をコードする核酸分子の収集物に関する。特に、上に記載する設計されたリピートタンパク質の収集物をコードする核酸分子の収集物を考察する。
【００７４】
「核酸分子」という用語はポリヌクレオチド分子を指し、一本鎖又は二本鎖のいずれかのリボ核酸（ＲＮＡ）又はデオキシリボ核酸（ＤＮＡ）分子である。核酸分子は、単離形態で、又は、組換え核酸分子もしくはベクター中に含まれて存在しうる。
【００７５】
上に記載するアルマジロリピートタンパク質の収集物をコードする核酸分子の収集物を、当技術分野の標準的方法により、ペプチド配列をＤＮＡ配列に逆翻訳し、そして発現のための目的の宿主細胞でのコドン使用を最適化する、例えば、大腸菌での発現を最適化することにより得てよい。ＤＮＡ配列の段階で、上に記載するリピートモジュール及びキャッピングモジュールを、容易に組み合わせ、再配列し、又は、さらに操作して、所望のリピートタンパク質をコードするＤＮＡ配列を与えてよい。手順の例示を、以下の実施例１に見出すことができる。
【００７６】
さらなる実施態様では、本発明は、設計されたアルマジロリピートタンパク質又は本発明において記載するアルマジロリピートタンパク質の収集物の対応するリピートドメインに関する。特に、上に記載するアルマジロリピートタンパク質の収集物の設計されたアルマジロリピートタンパク質を考察する。
【００７７】
好ましくは、そのような設計されたアルマジロリピートタンパク質又はリピートドメインは、事前に決定された特性を有する。
【００７８】
本発明に関連して、「事前に決定された特性」という用語は、リピートタンパク質の収集物からのリピートタンパク質の１つが有するはずであり、そして収集物のスクリーニング及び／又は選択のための基礎を形成する特性を指す。そのような特性は、標的への結合、標的のブロッキング、標的媒介性反応の活性化、酵素活性、及びさらなる特性などの特性を含み、当業者に公知である。所望の特性の型に依存して、当業者は、スクリーニング及び／又は選択を実施するためのフォーマット及び必要な工程を特定できる。好ましくは、事前に決定された特性は標的への結合である。
【００７９】
より好ましくは、そのような設計されたアルマジロリピートタンパク質又はリピートドメインは、標的分子に結合することができ、設計されたリピートタンパク質が所定のリガンドへの検出可能な親和性を有することを意味する。
【００８０】
さらに好ましくは、そのような設計されたアルマジロリピートタンパク質又はリピートドメインは、非天然アルマジロリピートタンパク質又は非天然リピートドメインである。
【００８１】
「非天然」という用語は、合成又は天然からではないことを意味し、より具体的には、この用語はヒトの手製を意味する。「非天然リピートタンパク質」又は「非天然リピートドメイン」という用語は、リピートタンパク質又はリピートドメインが合成であり、天然からではないことを意味する。「非天然リピートタンパク質」又は「非天然リピートドメイン」はそれぞれ人工のタンパク質又はドメインであり、対応する設計された核酸の発現により得られる。好ましくは、発現は真核細胞又は細菌細胞中で、又は、無細胞インビトロ発現系の使用により行われる。さらに、用語は、リピートタンパク質又はリピートドメインの配列が、配列データベース中、例えば、ＧｅｎＢａｎｋ、Ｅｍｂｌ−Ｂａｎｋ、又はＳｗｉｓｓｐｒｏｔ中の非人工配列エントリーとして存在しないことを意味する。これらのデータベース及び他の類似の配列データベースは当業者に周知である。
【００８２】
さらに、上で言及した設計されたアルマジロリピートタンパク質又は対応するリピートドメインの１つ又は複数及び場合により薬学的に許容可能な担体及び／又は希釈剤を含む薬学的組成物を考察する。薬学的に許容可能な担体及び／又は希釈剤は当業者に公知である。さらに、上で言及した設計されたアルマジロリピートタンパク質又は対応するリピートドメインの１つ又は複数を含む診断用組成物を考察する。
【００８３】
さらなる実施態様では、本発明は、特定の設計されたアルマジロリピートタンパク質をコードする核酸分子に関する。
【００８４】
さらなる実施態様では、本発明は、標的分子に結合することができる本発明の設計されたアルマジロリピートタンパク質を得るための方法に関し、以下の工程
（ａ）本発明の設計されたアルマジロリピートタンパク質の収集物をコードする核酸分子の収集物の提供；
（ｂ）設計されたアルマジロリピートタンパク質の収集物を提供するための工程（ａ）の収集物の発現；及び
（ｃ）設計されたアルマジロリピートタンパク質の収集物のスクリーニング及び／又は標的分子に結合することができる少なくとも１つの設計されたアルマジロリピートタンパク質を得るための設計されたアルマジロリピートタンパク質の収集物からの選択
を含む。
【００８５】
以下の実施例５及び６には、本発明の設計されたアルマジロリピートタンパク質の収集物をコードする核酸のライブラリー（収集物）をどのようにして得ることができるか、及び、それらをスクリーニング及び選択のためにどのように使用してよいかを記載する。
【００８６】
本発明の設計されたアルマジロリピートタンパク質の収集物を、使用するスクリーニング及び／又は選択系に従ったいくつかの方法により発現させてよく、そして方法、例えばバクテリオファージ（ＷＯ９０／０２８０９）又は細菌細胞（ＷＯ９３／１０２１４）の表面上でのディスプレイ、リボソームディスプレイ（ＷＯ９８／４８００８）、プラスミド上でのディスプレイ（ＷＯ９３／０８２７８）などの使用を含んでよく、又は、共有結合したＲＮＡ−リピートタンパク質ハイブリッドコンストラクト（ＷＯ００／３２８２３）、もしくはタンパク質相補アッセイ（ＷＯ９８／３４１１２０）などによる細胞内発現及び選択／スクリーニングによる。全てのこれらの方法では、本発明の設計されたアルマジロリピートタンパク質を、核酸分子の対応する収集物の発現及び設計されたアルマジロリピートタンパク質の続くスクリーニング、それに続く、設計されたアルマジロリピートタンパク質に関連する遺伝情報を介した標的分子への結合能を有する１つ又は複数の設計されたアルマジロリピートタンパク質の同定により提供する。
【００８７】
好ましい実施態様では、標的分子は、天然もしくは非天然の（ポリ）ペプチド又は化学修飾を含む、例えば、天然もしくは非天然のリン酸化、アセチル化、もしくはメチル化により修飾された（ポリ）ペプチドである。
【００８８】
さらなる好ましい実施態様では、本発明は、標的（ポリ）ペプチドに結合することができる本発明の設計されたアルマジロリピートタンパク質を得るための方法に関する。設計されたアルマジロリピートタンパク質は、原則として標的（ポリ）ペプチドの小部分ごとに同じである一般的な結合様式を提供し、伸長したコンホメーションのペプチドのモジュラー認識を可能にする。方法によって、標的（ポリ）ペプチドの部分を認識する一連のモジュールを生成し、追加選択を実施することなくそのようなモジュールを組み合わせることが可能になる。方法は以下の工程
（ａ）標的（ポリ）ペプチドの結合部分に関与する単一のリピートモジュールに対応する核酸配列の推定又は入手；
（ｂ）本発明の設計されたアルマジロリピートタンパク質をコードし、工程（ａ）に由来する核酸配列を含む核酸分子の構築；
（ｃ）工程（ｂ）に由来する核酸分子からの設計されたアルマジロリピートタンパク質の発現；及び
（ｄ）設計されたアルマジロリピートタンパク質のスクリーニング及び／又は標的（ポリ）ペプチドに結合することができる少なくとも１つの設計されたアルマジロリピートタンパク質を得るための設計されたアルマジロリピートタンパク質からの選択
を含む。
【００８９】
「標的（ポリ）ペプチドの部分」という用語は、限定はされないが、標的（ポリ）ペプチドアミノ酸配列に属するジペプチド、トリペプチド、又はテトラペプチドなどのアミノ酸配列を指す。好ましくは、標的（ポリ）ペプチドのこれらの部分は近接する。「近接する」という用語は、（ポリ）ペプチドの一次配列中の他のアミノ酸により分離されていないアミノ酸配列を指す。
【００９０】
最も好ましくは、標的（ポリ）ペプチド又は標的（ポリ）ペプチドの部分は、二次構造エレメントの形成に関与しない。
【００９１】
この方法をどのように行うことができるのかについての詳細な説明を、実施例７ならびに図９及び１０に提供する。リピートモジュール、キャッピングリピートモジュール、及びリピートドメインの生成及び組み合わせに関する技術的な詳細が、特許出願ＷＯ０２／２０５６５及び本発明の実施例に記載されており、及び／又は、当業者に公知である。
【００９２】
特に、本発明は、選択を実施することなくその伸長した立体構造において標的（ポリ）ペプチドに結合することができるアルマジロリピートドメインを得るための方法に関する。この方法では、標的（ポリ）ペプチド、例えば、特定のジペプチド、トリペプチド、又はテトラペプチドなどのアミノ酸の小ストレッチ（天然アミノ酸から、又は天然及び非天然又は改変された天然アミノ酸の混合物から形成される）への高い結合傾向を有する選択により得ることができるという事実を利用する。修飾アミノ酸は、例えば、リン酸化、アセチル化、又はメチル化されたアミノ酸である。発明の方法に従い、リピートドメインを、近接配置中の標的ポリペプチドに含まれるアミノ酸の小さな直線状ストレッチなど、標的（ポリ）ペプチドの特定の部分に高い結合傾向を有する事前に決定されたリピートモジュールから組み立てる。
【００９３】
アミノ酸の小さな直線状ストレッチについて定義された結合特異性を有する特定のリピートモジュールを得るための方法は、以下の工程
（ａ）複数の内部リピートモジュールを含む設計されたアルマジロリピートタンパク質の推定又は入手；
（ｂ）設計されたアルマジロリピートタンパク質の内部リピートモジュールをリピートモジュールライブラリーにより交換することによる設計されたアルマジロリピートタンパク質ライブラリーの生成；
（ｃ）アミノ酸の小さな直線状ストレッチを含む標的ポリペプチドへの結合能に従ったアルマジロリピートタンパク質ライブラリーからの設計されたアルマジロリピートタンパク質の選択；
（ｄ）アミノ酸のストレッチに特異性を有する工程（ｃ）からの選択された設計されたアルマジロリピートタンパク質からの選択されたリピートモジュールの単離
を含む。
【００９４】
「複数の内部リピートモジュール」中で使用される「複数の」は、３つ又はそれ以上、特に３、４、又は５を意味する。好ましくは、工程（ａ）の設計されたアルマジロリピートタンパク質は、３つの内部リピートモジュールを含む。さらにより好ましくは、工程（ａ）の設計されたアルマジロリピートタンパク質は３つの内部リピートモジュールを含み、ここで中央内部リピートモジュールを工程（ｂ）のリピートモジュールライブラリーにより交換する。
【００９５】
リピートモジュールライブラリーは、当技術分野において公知の標準的方法により入手する。好ましくは、リピートモジュールは、以下に記載するＩ、Ｔ、Ｃ、又はＭ配列モチーフを含むモジュールであって、ここで位置「１」及び「２」は十分に無作為化されており、即ち、任意のアミノ酸を表わし、又はここで「１」は、Ｅ、Ｈ、Ｉ、Ｋ、Ｑ、Ｒ、及びＴからなる群より選択されるアミノ酸残基を表わし、「２」は、Ａ、Ｄ、Ｅ、Ｆ、Ｈ、Ｉ、Ｋ、Ｌ、Ｍ、Ｎ、Ｑ、Ｒ、Ｓ、Ｔ、Ｖ、Ｗ、及びＹからなる群より選択されるアミノ酸残基を表わす。
【００９６】
本発明は、実施例に記載される特定の実施態様に制限されない。他の供給源を、以下に記載する概要に従って使用及び加工してよい。例えば、データベース「ＰｕｂＭｅｄ」を利用してよく、インターネットで利用可能である。特に、アルマジロリピート単位について開示されたコンセンサス配列に関する情報は、Riggleman B. et al., Genes Dev 3: 96-113, 1989；Peifer M. et al., Cell 76: 789-91, 1994；Andrade M. A. et al., J Mol Biol 309: 1-18, 2001；及びSMART(Schultz J. et al., Proc Natl Acad Sci 、ＵＳＡ 95: 5857-64, 1998；Letunic I. et al., Nucleic Acid Res 34: D257-60, 2006；http://smart.embl-heidelberg.de）で見出すことができる。発表された配列のまとめ及び本発明により導入される差異を表１に提示する。
【００９７】
【表１７】

【００９８】
実施例
材料
化学薬品はFluka（スイス）から購入した。オリゴヌクレオチドはMicrosynth（スイス）からであった。オリゴヌクレオチドのリスト及びそれらの命名を表２に見出すことができる。Vent DNAポリメラーゼ、制限酵素、及びバッファーはNew England Biolabs（ＵＳＡ）又はFermentas（リトアニア）からであった。クローニング及び産生株は大腸菌ＸＬ１−ｂｌｕｅ（Stratagene、ＵＳＡ）であった。
【００９９】
【表１８】

【０１００】
分子生物学
特記なき場合、方法は、記載されるプロトコールに従って実施する（Sambrook J., Fritsch E. F. and Maniatis T., Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory 1989, New York）。
【０１０１】
命名法
リピート単位及びモジュール内の位置を定義するために使用する命名法は、ＳＭＡＲＴファミリーアラインメント（http://smart.embl-heidelberg.de）に基づき、Andrade, M. A. et al., J Mol Biol 309: 1-18, 2001により提示されたナンバリングと一致し、３つの位置だけ移動している。このように、彼らの研究での開始位置−２は、本開示の位置１に対応する。位置１、１２、２５はＨ１、Ｈ２、Ｈ３の推定開始位置である。リピートタンパク質は、それらが含むモジュールに従って名付けられている：名称は、この順番で、Ｎ末端モジュールの型（人工のＡ又はＮａ、酵母由来のＹ又はＮｙ）、使用するモジュールの数を伴う内部モジュールの型（Ｉ、Ｔ、又はＣ型）、Ｃ末端モジュールの型（人工のＡ又はＣａ、酵母由来のＹ又はＣｙ）を示す：例、ＹＩ_４Ａは酵母由来Ｎ末端モジュール（Ｎｙ）、４つのＩ型の内部モジュール、及び人工Ｃ末端モジュール（Ｃａ）を含む。
【０１０２】
シークエンシング及び質量決定
全てのＤＮＡ配列をシークエンシングにより確認し、全ての記載されたタンパク質の算出された分子量を質量分析により確認した。
【０１０３】
タンパク質の特性
実施例に記載するモジュール配列を表３に列挙する。実施例に記載する特定の位置は、表３で採用するナンバリングを指す。タンパク質の実験的に決定された生物物理学的特性のまとめを表４に提示する。
【０１０４】
【表１９】

【０１０５】
【表２０】

【０１０６】
実施例１
実施例では、インポーチンα及びβカテニン／プラコグロビンサブファミリーの配列の組み合わせに基づく設計されたアルマジロリピートタンパク質を生成するために適用するコンセンサス設計戦略を報告する。設計手順は、自己適合性モジュールの生成に基づいた。コンセンサス配列（Ｃ型）は、ＳＷＩＳＳＰｒｏｔデータベース（http://www.expasy.ch）からの単一のアルマジロリピート単位の複数のアラインメントに由来した。２つの異なるバージョンの熱キャッピングモジュールを生成し、溶媒露出から疎水性コアを保護した。全てのモジュールのペプチド配列をＤＮＡ配列に逆翻訳し、大腸菌での発現のためにコドン使用を最適化する。オリゴヌクレオチドを設計し、内部モジュール及びキャッピングモジュールのアセンブリーＰＣＲを可能にする。結果として得られるＰＣＲ産物はＩＩ型制限酵素の認識部位を含み、Binz H. K. et al., J Mol Biol 332: 489-503, 2003により紹介された戦略を使用して結合された。設計されたリピートタンパク質をコードするＤＮＡ分子を適した発現ベクター中に挿入した。タンパク質を発現させ、精製し、そして分子ふるいクロマトグラフィー、ＡＮＳ結合、円二色性分光法、及び変性実験により特性付けした。
【０１０７】
Ｃ型内部モジュールのコンセンサス設計
初期配列プロファイルが、開始点としてＳＭＡＲＴ（２００４年１月からのデータ）からのファミリーアラインメントを使用して生成されている。Ｓｗｉｓｓ−Ｐｒｏｔデータベース中の注釈を欠く全ての配列を除去し、配列相同性による間接的証拠を除き、タンパク質データが利用可能ではない仮説のタンパク質又は配列である。３１９の配列の最終セットは、４０の残基のプロファイルを導き、Ｈ１からＨ３までのリピート配列を対象とするが、しかし、Ｈ３と次のリピート単位の間のループを除く。この配列プロファイルは、Ｓｗｉｓｓ−Ｐｒｏｔデータベースに対するさらなる研究のために使用されてきた。このようにして見出されたリピート単位は、アルマジロリピートタンパク質の異なるサブファミリーに該当するタンパク質に属し、Andrade M. A. et al.（上記）により示される。
【０１０８】
βカテニン／プラコグロビン及びインポーチンαサブファミリーはペプチドバインダーであり、利用可能な結晶構造を有することが公知であるため、これらの２つのサブファミリーのメンバーを選択し、コンセンサス配列を生成した。選択したセット中でのインポーチンα配列のわずかな過剰提示（２４３上の１３３）は、データベース中に存在するより多数のインポーチンαタンパク質の結果である。標準化を、組み合わせたコンセンサス配列の算出中に適用した。自動アラインメントは、ｃｌｕｓｔａｌＷ（Thompson J. D. et al., Nucleic Acid Res 22: 4673-80, 1994）で得られ、隣接リピート単位を結合するループも含めて手作業で改良された。コンセンサス配列を、起こりうる立体衝突（ｓｔｅｒｉｃｃｌａｓｈ）を低下させるための結晶構造からの情報を考慮に入れて、さらに改善した。クローニング戦略のための必要条件もこの段階で考察し、モジュールＣ型を導く（表３及び５）。
【０１０９】
【表２１】

【０１１０】
推定ヘリックスＨ１、Ｈ２、Ｈ３は、それぞれ残基１−１０、１２−２１、２５−４０を包含する。位置７、１６、１７、１９、２０、３１、３４、３５、３８は全ての配列中で十分に保存されており、アルマジロタンパク質の疎水性コアの部分である。Ｇｌｎ５は同じリピート単位のＡｓｐ９と水素結合を潜在的に形成し、Ｈ１を安定化できる（構造１ＥＥ５で観察される、Conti E. and Kuriyan J., Structure Fold Des 8: 329-38, 2000）。Ｇｌｙ１１は、Ｈ１とＨ２の間でのポリペプチド鎖の折り曲げにおけるその重要な役割が保存されており、この位置で必要とされるプラスのφ角度と適合する。Ｐｒｏ１４はアルマジロリピートの異常な保存特性であり、全アラインメント中で５０％の頻度で存在する。それは、Ｈ２の開始位置、水素結合中に骨格窒素を含むことが依然として必要ではない位置に位置づけられる；二次構造を破壊する代わりに、それはαヘリックスで典型的なφ／ψ角度を採用する。Ａｓｎ３７は全てのコンセンサス配列中で十分に保存されており、標的ペプチドの骨格への結合におけるその重要な役割に起因する。Ｔｒｐ３３も、結合、具体的にはインポーチンαタンパク質の場合での標的側鎖の認識に関与する。このように、それはインポーチンサブファミリーで高頻度に出現し、したがって、それは全コンセンサス配列中にも存在する。
【０１１１】
ペプチドの結合に潜在的に関与する位置（４、２６、２９、３０、３３、３６、３７、４０、４１）は、複合体の構造解析（ＰＤＢＩＤｓ１ＢＫ５、１ＢＫ６、１ＥＥ４、１ＥＥ５、１ＥＪＬ、１ＥＪＹ、１Ｇ３Ｊ、１ＩＱ１、１ＪＰＰ、１ＬＵＪ、２ＢＣＴ、３ＢＣＴ、１Ｉ７Ｗ、１Ｉ７Ｘ、１ＪＰＷ、１ＩＡＬ、１ＪＤＨ、１Ｍ１Ｅ、１ＰＪＭ、１ＰＪＮ、１Ｑ１Ｓ、１Ｑ１Ｔ、１ＱＺ７、１ＵＮ０、１ＴＨ１）及び突然変異実験からのデータ（von Kries J. P. et al., Nat Struct Biol 7: 800-7, 2000；Leung S. W. et al., J Biol Chem 278: 41947-53, 2003；Hoffmans R. and Basler K., Development 131: 4393-400, 2004）に基づいて定義されている。標的ペプチドへの結合の他、位置４は疎水性コア形成にも寄与し、このように潜在的ライブラリー中のこの位置で可能となる残基の型は、この追加の必要条件を考慮に入れた場合、恐らくは制限されうる。
【０１１２】
ループＨ２−Ｈ３とＨ３の間の連結部での位置２４及び２５は、全てのコンセンサス配列において酸性残基についての明確な優先度を示す。しかし、負電荷を帯びた残基対は、観察された配列中では決して起こらず、それは全タンパク質に沿って電荷反発又は負電荷を帯びたベルトの形成を導きうる。負電荷についての好ましい位置は明白ではなく（Ｃ型でのＡｓｐ２４３６％、Ｇｌｕ２５２７％）、代わりのアミノ酸は全て非常に低い頻度（＜１０％）を有する。交換のために選択された残基を次に選び、Ｈ３安定性を改善した：Ｇｌｕ２５はそのより高いヘリックス傾向のために保持され、Ａｓｎ２４を導入し、より高頻度な残基Ａｓｐとの構造的類似性を保持し、Ｎキャップ残基としてのその傾向を活用する。Ｇｌｙを、位置４２に、クローニング目的で導入している。短いＨ３Ｈ１ループ（一般的に１〜３残基）のため、非常にしばしばループの１つの位置がＧｌｙにより占められることが顕著である。位置４１が結合に関与することがあり、ひいては適用のために突然変異に供する可能性があることを考慮に入れると、ループ内に一定のグリシンを保持し、必要とされる可動性を維持することが重要である。
【０１１３】
キャッピングモジュールの設計
特殊化されたリピート単位は、天然タンパク質中のアルマジロドメインのＮ及びＣ末端部分を形成する。キャッピングリピート単位は恐らくは疎水性コアの保護に関与する。なぜなら、それらは内部リピート単位側に疎水性表面を、溶媒に親水性表面を呈するからである。キャッピングリピート単位は、設計されたＬＲＲ（Stumpp M. T. et al., J Mol Biol 332: 471-87, 2003）及びアンキリンリピートタンパク質（Binz H. K. et al., J Mol Biol 332: 489-503, 2003）において考察されており、追加らせんがＴＰＲタンパク質の設計（Main E. R. et al., Structure (Camb) 11: 497-508, 2003）中に含まれている。
【０１１４】
アルマジロドメインの境界が限定加水分解により推定されているが、しかし、また、末端リピート単位と内部リピート単位との弱い類似性のため、明確には定義されない。また、全ての残基が、インポーチンα及びβカテニンの結晶構造中で目に見えるわけではない。目に見える残基だけがアルマジロドメインに寄与し、追加部分は非構造的であり、厳密にドメインに属さない可能性が高い。Ｎ末端キャッピングリピート単位は、Ｈ２、位置１２から開始すると定義されている。対照的に、Ｃ末端キャッピングリピート単位は構造中で完全に目に見え、Ｈ１〜Ｈ３を含む、位置１〜位置４１までで定義されている（表３）。
【０１１５】
キャッピングモジュールは、２つの異なるアプローチを使用することにより設計されている。第１の場合では、天然キャッピングリピート単位は、設計された内部リピートモジュールに適用された。キャッピングリピート単位と設計された内部リピートモジュールの間の適合性を確実にするための構造情報は、このアプローチのための基本的な必須条件である。酵母サッカロマイセス・セレビシエ（Ｓａｃｃｈａｒｏｍｙｃｅｓｃｅｒｅｖｉｓｉａｅ）からのインポーチンαは、一般的なキャッピングリピート単位ドナーとしての最善の候補であることが判明した：全ての設計されたリピートモジュールが、酵母インポーチンαキャッピングリピート単位の内部表面と相互作用できる平面を呈し、分子モデルで観察された通りである。Ｎ末端キャッピングリピート単位は、酵母インポーチンαのＧｌｕ８８からＨｉｓ１１９までの残基に及ぶ。しかし、２つの残基Ｇｌｕ１１８−Ｈｉｓ１１９をＡｓｐ−Ｇｌｙに交換し、末端ループを設計されたリピートモジュールに適応させた：グリシンをモジュールの組み立てに使用し、アスパラギン酸は天然タンパク質中で高頻度に見出される負電荷を保持し、ターン領域中のヘリックス傾向を低下させる。
【０１１６】
Ｃ末端キャッピングリピート単位は、酵母インポーチンαにおいてＡｓｎ４７１からＧｌｙ５１０に及ぶ。しかし、最後の内部リピート単位とＣ末端リピート単位を結合するループは、他の天然インポーチンと比較して、追加残基を含む。このＣ末端キャッピングリピート単位の改変バージョンを、次に、３つの残基（Ａｓｐ−Ａｓｎ−Ｉｌｅ）をＨ１の前に導入することにより生成している。Ａｓｎ及びＩｌｅはこれらの位置に天然に存在する；Ａｓｐが、負電荷を帯びたループを保持するために含まれており、いくつかの天然配列中で観察される通りであり、ヘリックス傾向を低下させる。Ｎ末端及びＣ末端キャッピングモジュールに由来する酵母インポーチンαをそれぞれＮｙ及びＣｙと名付ける。第２バージョンのＣ末端キャッピングモジュールを、Ｃｍと名付け、３つの最初の残基を伴わず、位置１９でＡｌａをＣｙｓで交換して設計した。Ｎｙ、Ｃｙ、及びＣｍの配列を表３に示す。
【０１１７】
第２のアプローチでは、２つの完全に人工のキャッピングモジュールを設計し、Ｃ型モジュールから開始し、露出された疎水性残基を親水性残基と置換し、天然配列及び結晶構造に由来するモデルに基づく。Ｎ末端キャッピングリピート単位は、位置１２から４２に移行し、Ｈ２及びＨ３を含む。位置７、１２、１９、２７、３４は、Ｃ型モジュールにおいて疎水性残基により占められ、構造に基づく親水性残基及びＮ末端キャッピング配列のアラインメントから得られる共通の残基により交換されなければならない。Ｓｅｒ１２は、Ｈ２のＮ末端ヘリックスキャップを提供する。Ａｓｎ１４は、より共通のプロリンを置換し、比較的短い側鎖を伴う極性残基を提供する。Ｇｌｕ１５は、ヘリックス中でＳｅｒ１２と相互作用でき、それを追加的に安定化できる。Ｌｙｓ１８は、Ｇｌｕ１５と塩橋を形成でき、ヘリックスを安定化し、そして、一般的に、長い極性残基がこの位置で必要とされる。Ｇｌｎ１９は、隣接内部リピートモジュールとの相互作用のための疎水性部分ならびに溶媒露出のための極性成分を提供する。Ａｓｎ２１はこの位置で共通しており、それはヘリックスＣキャッピング残基としての良好な傾向を有する。Ａｓｐ２３及びＡｓｐ２４は、いくつかのＮ末端キャッピングリピート単位中で荷電結合として保存されている。Ｇｌｎ２５は、十分に保存されており、極性で、高いヘリックス傾向を伴う。Ｇｌｎ２７は、隣接内部リピートモジュールとの相互作用のための疎水性部分ならびに溶媒露出のための極性成分を提供する。Ｇｌｎ３３は、キャッピングリピート単位の中で、十分に保存されており、結合に関与するＴｒｐを置換する。Ｌｙｓ３４は、他の極性残基の中で、Ｎ末端キャッピングリピート単位中で中程度の頻度で存在する。Ａｒｇ３６は、高頻度の発生を有し、Ｉ型及びＣ型モジュール中に存在するＴｒｐ３３と相互作用できると思われる。Ｇｌｎ３７は、この位置での残基に典型的な長い側鎖を有し、そして、より共通するリジンの代わりに、Ａｒｇ３６との組み合わせで正電荷を帯びたスポットの形成を回避する。Ａｓｐ４１は、この位置にしばしば存在する負電荷を維持し、らせんを切断する。Ｇｌｙ４２を、可動性を加え、さらなるモジュール組み立てのために導入した。
【０１１８】
Ｃ末端キャッピングリピート単位は全て３つのらせんを含む。位置８、１３、１７、２０、２８、３２、３５、３８、３９は、Ｃ型モジュール中で疎水性残基により占められ、構造に基づく親水性残基及びＣ末端キャッピング配列のアラインメントから得られる共通の残基により交換されなければならなかった。Ｌｙｓ４は、側鎖の長い脂肪族部分を伴う疎水性コアに潜在的に寄与でき、溶媒と正電荷を帯びたアミノ基を接触させる。Ｌｙｓ８は、保存されたグルタミン酸がこの位置で使用された場合に形成されうる負電荷のクラスターの形成を回避するために存在し、良好なヘリックス傾向及び長い側鎖を保持する。Ｇｌｕ９は高度に保存された残基である。Ａｌａ１２は、疎水性コアと潜在的に相互作用できる。Ｇｌｕ１４は、共通の極性残基であり、プロリンの置換基として良好なヘリックス傾向を伴う。Ｌｙｓ１５も、共通の極性残基であり、比較的良好なヘリックス傾向を伴う。Ｌｅｕ１３は、前者の疎水性コア位置を占めるが、しかし、それはその高いヘリックス傾向及びＰｈｅ３９と相互作用するその能力が保持されていた。Ｇｌｕ１７は内部リピート単位中のコア位置に対応する；疎水性残基を、高いヘリックス傾向を伴うこの高頻度に起こる親水性アミノ酸と置換した。Ｇｌｎ２０は、内部リピート単位中に存在する保存されたロイシンを置換するために使用されるより高頻度な極性残基である。位置２１〜２３は明確に定義されておらず、カテニン／プラコグロビンサブファミリーにおける強い保存（機能的な理由のためでありうる）及びインポーチンにおける高い程度の変動性を示す。インポーチンサブファミリーからの最も保存された残基が次に選ばれ、これらの位置を占めた。Ｇｌｎ２８は、疎水性相互作用及び極性側鎖を提供でき、そして、インポーチンサブファミリーにおける保存されたチロシン、及びカテニン／プラコグロビンサブファミリーにおけるアラニンと比較してより良好な選択肢を表わす。Ｇｌｎ３２は、良好なヘリックス傾向及び極性側鎖を提供する。この位置での高頻度な芳香族残基の存在は、結晶構造から判断して、構造的な理由を有するとは思われない。Ｇｌｕ３３は、この位置でしばしば見出される荷電残基の１つであり、それは良好なヘリックス傾向を有する。Ｇｌｕ３６はインポーチンにおいて高頻度を有し、この位置は酸性残基により占められ、カテニン／プラコグロビンサブファミリーにおいてフェニルアラニン及びチロシンが存在する。芳香族残基は、恐らくは、機能的な役割を有するが、しかし、荷電残基は、露出された位置のため、より良好な選択肢を構成する。Ｌｙｓ３７を選び、内部リピート単位中の保存されたアスパラギンを交換した。Ｇｌｎ３８を選び、内部リピート単位及びキャッピングリピート単位の両方においてこの位置に常に存在する疎水性残基を交換し、溶媒と接触した極性成分を提供する。Ｐｈｅ３９は、いくつかのキャッピングリピート単位中で保存されている。利用可能な構造から、それは、インポーチンの疎水性コアの密封のため、及び、Ｌｅｕ１３との相互作用を介したＣ末端キャッピングリピート単位のコンパクト性のために重要と思われる。Ｈｉｓ４１をキャッピング残基として加え、Ｈ３を安定化している。設計されたＮ末端及びＣ末端キャッピングモジュールをそれぞれＮａ及びＣａと名付け、表３に示す。
【０１１９】
設計されたアルマジロリピートタンパク質をコードするＤＮＡの合成
全てのモジュールのペプチド配列をＤＮＡ配列に逆翻訳し、大腸菌での発現のためにコドン使用を最適化した。各モジュールを、重複オリゴヌクレオチドから開始して合成した。全ての単一モジュールを、ＤＮＡレベルで、アセンブリーＰＣＲによりオリゴヌクレオチドから組み立てた（図４）。Ｃ型モジュールの配列を、示した制限酵素部位と共に以下に示す；ＢｓａＩ及びＢｐｉＩでの消化後のオーバーハングに下線を引いている。他の内部モジュールは、アミノ酸配列中の差異に対応する位置で異なる。Ｎｙ及びＣａキャッピングモジュールのＤＮＡ配列も、それぞれＮ末端及びＣ末端キャッピングモジュールの例として示す；他のキャッピングモジュールは、アミノ酸配列中の差異に対応する位置で異なる。
【０１２０】
【表２２】

【０１２１】
Ｃ型モジュールについて、オリゴヌクレオチドの対（１−２、３−４、５−６）を最初に組み立て、次に、２μlの産物を、オリゴヌクレオチド１及び６の存在下で、第２アセンブリー反応のための鋳型として合わせた。全てのオリゴヌクレオチドを最終濃度１μMで使用した。アニーリング温度は、第１反応では４７℃、第２では５０℃であった。３０回のＰＣＲサイクルを、３０秒の伸長時間で実施した。同じ手順を、他の内部モジュール及びキャッピングモジュールに適用した。ＢａｍＨＩ及びＫｐｎＩ制限酵素部位を、モジュールのプラスミドｐＱＥ３０（Qiagen、ドイツ）中への直接挿入のために使用した。単一モジュールを、次に、ベクターから、外部プライマーｐＱＥｆｏｒ及びｐＱＥｒｅｖ（Qiagen、ドイツ）を使用してＰＣＲ増幅した。モジュールを、ＩＩ型制限酵素を使用して、Binz et al.（上記）により報告された戦略に従って、段階的に組み立てた。隣接モジュールをＩＩ型酵素ＢｐｉＩ及びＢｓａＩで消化し、直接的に一緒に結合した（図４）。全タンパク質をコードする遺伝子を、内部モジュール及びキャッピングモジュールの段階的連結により組み立てた。ＢａｍＨＩ及びＫｐｎＩ制限酵素部位を、全遺伝子のｐＱＥ３０ベクター中への挿入のために使用し、プラスミドを配列決定した。ベクターは、親和性精製のためのＮ末端ＭＲＧＳＨｉｓ_６タグを提供する（図５）。同じ型の２つ、４つ、又は８つの内部モジュールを含むタンパク質をコードするＤＮＡ分子及びキャッピング分子の異なる組み合わせを生成した。ベクター中の挿入後のＹＣ_２Ａ配列を、例として以下に示す。＊は、コード配列の終わりの停止コドンを示す。
【０１２２】
【表２３】

【０１２３】
タンパク質の発現及び精製
キャッピングリピートモジュール及び内部リピートモジュールの組み合わせに起因するタンパク質を、可溶性タンパク質発現への影響を評価する目的で、組み立てた。このように、ＮキャッピングモジュールとしてのＮａ又はＮｙを、Ｃ型内部モジュール及びＣａ又はＣｙのＣ末端モジュールと合わせた。２つ又は４つの内部リピートモジュールを含むタンパク質を研究した。
【０１２４】
大腸菌ＸＬ１−Ｂｌｕｅ細胞を各プラスミドで形質転換し、１％（w/v）グルコース及び５０μg/mlアンピシリンを含むＬＢ培地中で、３７℃で激しく撹拌しながら増殖した。発現を、培養がＯＤ_６００＝０．６に達した際にＩＰＴＧ（最終濃度０．５mM）により誘導した。３時間の発現後、細胞を遠心分離により収集した。タンパク質精製を４℃で実施した。細胞を５０mM Ｔｒｉｓ−ＨＣｌ、５００mM ＮａＣｌ（ｐＨ８．０）中で再浮遊し、French pressure cell（SLM Instruments、ＵＳＡ）中で、圧力１’２００PSIで溶解した。溶解混合物を超音波処理（Branson、ＵＳＡ）によりさらにホモジナイズした。不溶性物質を２０，０００ｘgで３０分間の遠心分離により沈殿にした。上清を、Ｎｉ−ＮＴＡ物質（Qiagen）を伴い、５０mM Ｔｒｉｓ−ＨＣｌ、５００mM ＮａＣｌ、１０％（v/v）グリセロール、２０mMイミダゾール（ｐＨ８．０）を含む緩衝液で平衡化した固定化金属イオン親和性クロマトグラフィー（ＩＭＡＣ）により精製した。カラムを平衡化緩衝液で十分に洗浄し、次に、タンパク質を、２５０mMイミダゾールを除き平衡化緩衝液と同一である溶出緩衝液で溶出した。インポーチンα５では、発現を２５℃で６時間行い、細胞沈殿物を、５０mM Ｔｒｉｓ−ＨＣｌ、５００mM ＮａＣｌ、１０％グリセロール、５mM βメルカプトエタノール、１０mMイミダゾール（ｐＨ８．０）を含む溶解緩衝液中に再浮遊した。ＩＭＡＣ精製を、上に示した通りに、５mM βメルカプトエタノールを加えた同じ緩衝液を使用して実施した。サンプルを、次に、泳動緩衝液（５０mM Ｔｒｉｓ−ＨＣｌ、ｐＨ８．０）で平衡化した、ＰＯＲＯＳＨＱ陰イオン交換カラムに適用した５０mM Ｔｒｉｓ−ＨＣｌ、２mM ＤＴＴ中で、Biocad 700 E perfusion chromatography workstation（Applied Biosystems、ドイツ）を使用して一晩透析した。カラムを次に５０mM Ｔｒｉｓ−ＨＣｌ及び２０mM ＮａＣｌ（ｐＨ８．０）で洗浄し、サンプルを２０mMから１ＭＮａＣｌまでの勾配で溶出した。タンパク質のサイズ及び純度を、Coomasie PhastGel Blue R-350（GE Healthcare、スイス）で染色した１５％ＳＤＳ−ＰＡＧＥゲルにより評価した。全ての試験されたタンパク質の予測質量を質量分析により確認した。タンパク質濃度を、２８０nmでの吸光度により、www.expasy.orgで利用可能なツールで算出された分子量及び消衰係数を使用し、及びビシンコニン酸（ＢＣＡ）アッセイ（Pierce）により測定した。
【０１２５】
最高レベルの可溶性タンパク質発現が、内部モジュールをＮｙ及びＣａと合わせた際に得られた。Ｎａはほぼ検出不可能な発現を導き、Ｃｙの存在は、細胞溶解後、不溶性分画中のタンパク質量の実質的な増加をもたらす。Ｃｍ（３つの最初の残基を伴わず、アラニンでＣｙｓ１９を交換した改変酵母Ｃ末端キャッピングリピート）を伴うコンストラクトの発現によって、Ｃｙと比較し、可溶性タンパク質のレベルは改善されなかった。末端キャッピングモジュールの観察された効果は、内部リピートモジュールの数に非依存的であった。しかし、内部モジュールの数の増加は、可溶性タンパク質の量及びタンパク質の絶対量の増加を導く。タンパク質を、固定化金属イオン親和性クロマトグラフィー（ＩＭＡＣ）により、単一工程で精製し、１リットルの細菌培養から１００mgを超える純粋タンパク質を提供する。沈殿又は分解の徴候は、ＩＭＡＣ溶解緩衝液中で、４℃で１ヶ月まで保存されたタンパク質溶液中で検出されなかった。
【０１２６】
分子ふるいクロマトグラフィー（ＳＥＣ）及び多角度光散乱（ＭＡＬＳ）
分析的ＳＥＣを、Superdex 200 10/30 GLカラム（流速０．５ml/分）（GE Healthcare、スイス）を使用したＡＫＴＡエクスプローラークロマトグラフィーシステムで行った。リン酸緩衝液ｐＨ７．４（５０mMリン酸、１５０mM ＮａＣｌ）及び２つのＴｒｉｓベース緩衝液（２０mM Ｔｒｉｓ−ＨＣｌ、５０mM ＮａＣｌ、ｐＨ８．０又は５０mM Ｔｒｉｓ−ＨＣｌ、５００mM ＮａＣｌ、ｐＨ８．０）を使用した。βカテニンのアルマジロドメインは、１５０mM又は５００mMの塩濃度でだけ可溶性であった。インポーチンα５のアルマジロドメインをリン酸緩衝液ｐＨ７．４（５０mMリン酸、５００mM ＮａＣｌ、５mM ＤＴＴ）中で分析した。ＭＡＬＳ測定を、ＡＫＴＡシステムに連結したminiDAWN光散乱検出器及びＯｐｔｉｌａｂ屈折計（Wyatt Technologies、ＵＳＡ）で実施した。分子量の推定値をＡＳＴＲＡ４．７３．０４ソフトウェアパッケージ（Wyatt Technologies、ＵＳＡ）を使用して算出した。設計されたタンパク質は、天然アルマジロドメインとは対照的に、分子ふるいクロマトグラフィー（ＳＥＣ）で高い見掛け上の分子量を示す（表４）。Ｃ型タンパク質は、テストした最高濃度（４mg/ml）まで、ＭＡＬＳで単量体として常に検出される。ＹＣ_２Ａは唯一の例外を表わす：濃度に非依存的に、ＭＡＬＳで算出された質量値は常に単量体と二量体の間の中間である。
【０１２７】
円二色性（ＣＤ）スペクトル
ＣＤ測定を、Jasco J-810分光偏光計（Jasco、日本）で、０．５mM円柱状サーモキュベットを使用して実施した。ＣＤスペクトルを１９０〜２５０nmで記録し、データピッチは１nm、スキャンスピードは２０nm/分、反応時間は４秒、バンド幅は１nmであった。各スペクトルを３回記録し、平均した。測定は２０℃で実施した。ＣＤシグナルを緩衝液の減算により補正し、平均残基楕円率（ＭＲＥ）に変換した。測定を２０mM Ｔｒｉｓ−ＨＣｌ、５０mM ＮａＣｌ（ｐＨ８．０）中で実施した；βカテニン又はインポーチンα５のアルマジロドメインのＣＤスペクトルを５０mM Ｔｒｉｓ−ＨＣｌ、５００mM ＮａＣｌ、ｐＨ８．０中で測定し、起こりうる凝集問題を回避した。ＣＤスペクトルをCDpro（Sreerama N. and Woody R. W., Methods Enzymol 383:318-51, 2004）を使用して分析した：ＣＤＳＳＴＲアルゴリズムを分析のために選び、参照タンパク質をＳＤＰ４８に設定した（Ｉｂａｓｉｓ＝７）。ＣＤスペクトルはαヘリックス二次構造の存在を示す。ヘリックス含量は、一般的に、内部モジュールの数の増加に伴い増加する。平均残基楕円率（ＭＲＥ）及びヘリックス含量の値を表４に示す。
【０１２８】
熱変性
熱変性曲線を、２２２nmでのＣＤシグナルを温度ランプ２０〜９５℃で測定することにより得た（データピッチ１nm；加熱速度１℃／分；反応時間４秒；バンド幅１nm）。データを上に記載の通りに処理した。ＭＲＥ値の漸減がＣ型タンパク質で観察されたが、しかし、明確な協同転移はなかった。熱アンフォールディングはほぼ完全に可逆的であった。各タンパク質での転移の中点を表４に示す。
【０１２９】
ＡＮＳ結合
１−アニリノ−ナフタレン−８−スルホン酸（ＡＮＳ）蛍光を、PTI QM-2000-7蛍光光度計（Photon Technology International、ＵＳＡ）を使用して測定した。測定は、２０℃で、２０mM Ｔｒｉｓ−ＨＣｌ、５０mM ＮａＣｌ、１００μM ＡＮＳ、ｐＨ８．０中で、最終濃度１０μMの精製タンパク質を使用して実施した。βカテニンのアルマジロドメインへのＡＮＳ結合を、５０mM Ｔｒｉｓ−ＨＣｌ、５００mM ＮａＣｌ、１００μM ＡＮＳ、ｐＨ８．０中で測定し、起こりうる凝集問題を回避した。４００〜６５０nm（１nm/秒）からの発光スペクトルを、励起波長３５０nmで記録した。各サンプルについて、３つのスペクトルを記録し、平均した。Ｃ型タンパク質はＡＮＳ（疎水性環境に感受性である蛍光色素）に強く結合し、接近可能な疎水性コアの存在を示唆する。ＡＮＳ蛍光強度の最高値を表４に示す。
【０１３０】
実施例２
実施例では、インポーチンαサブファミリーの配列に基づく、設計されたアルマジロリピートタンパク質を生成するために適用したコンセンサス設計戦略を報告する。設計手順は、自己適合性モジュールの生成に基づいた。コンセンサス配列（Ｉ型）は、ＳＷＩＳＳＰｒｏｔデータベース（http://www.expasy.ch）からの単一アルマジロリピート単位の複数のアラインメントに由来し、実施例１に記載するキャッピングモジュールと合わせた。タンパク質を発現させ、精製し、そして分子ふるいクロマトグラフィー、ＡＮＳ結合、円二色性分光法、及び変性実験により特性付けした。
【０１３１】
Ｉ型内部モジュールのコンセンサス設計
実施例１に記載するコンセンサス配列の生成において含まれる２４３の配列から、インポーチンαサブファミリーからの１３３のリピート配列を使用してコンセンサス配列を得た（表６）。この制限されたコンセンサスによって、異なるサブファミリー間での起こりうる不適合性が回避される。自動アラインメントは、ｃｌｕｓｔａｌＷで得られ、隣接リピート単位を結合するループも含めて手作業で改良された。コンセンサス配列を、起こりうる立体衝突を低下させるための結晶構造からの情報を考慮に入れて、さらに改善した。クローニング戦略のための必要条件もこの段階で考察し、モジュールＩ型を導く（表３及び６）。
【０１３２】
【表２４】

【０１３３】
推定ヘリックスＨ１、Ｈ２、Ｈ３は、それぞれ残基１−１０、１２−２１、２５−４０を包含する。位置７、１６、１７、１９、２０、３１、３４、３５、３８は全ての配列中で十分に保存されており、アルマジロタンパク質の疎水性コアの部分である。Ｇｌｎ５は同じリピート単位のＡｓｐ９と水素結合を潜在的に形成し、Ｈ１を安定化できる（構造１ＥＥ５で観察される）。Ｇｌｙ１１は、Ｈ１とＨ２の間でのポリペプチド鎖の折り曲げにおけるその重要な役割が保存されており、この位置で必要とされるプラスのφ角度と適合する。Ｐｒｏ１４はアルマジロリピート単位の異常な保存特性であり、インポーチンリピート単位アラインメント中で６２％の頻度で存在する。それは、Ｈ２の開始位置、水素結合中に骨格窒素を含むことが依然として必要ではない位置に位置づけられる；二次構造を破壊する代わりに、それはαヘリックスで典型的なφ／ψ角度を採用する。Ａｓｎ３７は十分に保存された残基であり、標的ペプチドの骨格への結合におけるその重要な役割に起因し、Ｔｒｐ３３も、結合、具体的には標的側鎖の認識に関与する。ペプチドの結合に潜在的に関与する位置（４、２６、２９、３０、３３、３６、３７、４０、４１）を実施例１に従って定義する。さらなる改変を、実施例１の通りに、元のコンセンサス配列に導入した（表６）。Ｐｒｏ２（３０％）をおおよそ等しく保存されたＧｌｕ（２６％）と置換した。なぜなら、そのような位置のＰｒｏは、インポーチンα結晶構造により示される通り、恐らくはＨ１を破壊しうるからである。Ｐｒｏ１５（１９％）は、位置１４にＰｒｏを持たない配列に由来した。二重Ｐｒｏ１４−Ｐｒｏ１５は、観察された配列中では決して起こらず、それはＨ２を極めて不安定化する可能性が高い。この位置は、通常、Ｐｒｏ１４との組み合わせで、小さな疎水性残基により占められる。Ａｒｇは比較的共通の選択肢を表わすが（１６％）、しかし、それはほぼもっぱら天然インポーチンの第２リピート単位中で起こる。Ｖａｌは、従って、わずかに高い発生頻度のため（１３％）、置換基として選ばれた。ループＨ２−Ｈ３とＨ３の間の連結部での位置２４及び２５は、全てのコンセンサス配列において酸性残基についての明確な優先度を示す。しかし、負電荷を帯びた残基対は、観察された配列中では決して起こらず、それは全タンパク質に沿って電荷反発又は負電荷を帯びたベルトの形成を導きうる。最も保存されていた残基Ａｓｐ２４（４９％）は保存された。局所的な負電荷を低下させるために、Ａｓｎ（１１％）を選び、位置２５でＧｌｕ（１９％）と交換した。なぜならそれは２番目に高頻度な極性残基であるからである。Ｇｌｙを、位置４２に、クローニング目的で導入している。短いＨ３Ｈ１ループ（一般的に１〜３残基）のため、非常にしばしばループの１つの位置がＧｌｙにより占められることが顕著である。位置４１が結合に関与することがあり、ひいては適用のために突然変異に供する可能性があることを考慮に入れると、ループ内に一定のグリシンを保持し、必要とされる可動性を維持することが重要である。
【０１３４】
設計されたアルマジロリピートタンパク質をコードするＤＮＡの合成
Ｉ型モジュールのペプチド配列をＤＮＡに逆翻訳し、大腸菌での発現のためにコドン使用を最適化した。Ｉ型モジュールに対応するＤＮＡ分子を重複オリゴヌクレオチドから開始して合成した（表２）。アセンブリーＰＣＲ、連結（モジュールの間及び実施例１に記載するキャッピングモジュールと）、及びクローニングを実施例１に従って実施し、１つのＮｙＮ末端キャッピングモジュール、２、４、又は８の内部Ｉ型モジュール、及び１つのＣａＣ末端キャッピングモジュールを含むアルマジロリピートタンパク質をコードする遺伝子を得た。
【０１３５】
生物物理学的な特徴付け
タンパク質の発現及び精製、ならびに分子ふるいクロマトグラフィー（ＳＥＣ）、多角度光散乱（ＭＡＬＳ）、円二色性（ＣＤ）、熱及びグアニジウム誘発性変性、ならびにＡＮＳ結合を実施例１に従って実施した。発現及び精製収量は、実施例１に記載するタンパク質と同程度であった。
【０１３６】
設計されたＩ型タンパク質は、分子ふるいクロマトグラフィー（ＳＥＣ）において、天然アルマジロドメインとは対照的に、高い見掛け上の分子量を示す（表４）。多角度光散乱（ＭＡＬＳ）は、それらが恐らくは溶液中で二量体と単量体の混合物として存在することを示す。主ピークは二量体形態に対応し、この値は表４に報告されている。高濃度（２〜４mg/ml）で、Ｉ型タンパク質はオリゴマーの混合物として存在し、さらに高い見掛け上の分子量を伴う。ＣＤスペクトルは、全てのタンパク質でのαヘリックス二次構造含有物の存在を示し、インポーチンα（αＡｒｍ）及びβカテニン（βＡｒｍ）の天然アルマジロドメイン中のように２２２nmでの楕円率を伴う。ヘリックス含量は、一般的に、内部モジュールの数の増加に伴い増加する。Ｉ型タンパク質は熱変性において協同転移を示し、転移の中点（Ｔｍ）はモジュールの数と共に増加する（例、ＹＩ_４Ａでの約７０℃からＹＩ_８Ａでの８０℃超まで）。設計されたタンパク質は、９５℃で有意なパーセントの二次構造を保持し、熱アンフォールディングはほぼ完全に可逆的である。平均残基楕円率（ＭＲＥ）、ヘリックス含量、及び熱変性における転移の中点の値を表４に示す。ＡＮＳ結合実験では、Ｉ型タンパク質が、天然アルマジロリピートタンパク質と同じ範囲でＡＮＳ結合を示し、染料に接近できない小型の疎水性コアの存在を示す。ＡＮＳ蛍光強度の最高値を表４に示す。
【０１３７】
実施例３
実施例では、βカテニンサブファミリーの配列に基づく、設計されたアルマジロリピートタンパク質を生成するために適用したコンセンサス設計戦略を報告する。設計手順は、自己適合性モジュールの生成に基づいた。コンセンサス配列（Ｔ型）は、ＳＷＩＳＳＰｒｏｔデータベース（http://www.expasy.ch）からの単一アルマジロリピート単位の複数のアラインメントに由来し、実施例１に記載するキャッピングモジュールと合わせた。タンパク質を発現させ、精製し、そして分子ふるいクロマトグラフィー、ＡＮＳ結合、円二色性分光法、及び変性実験により特性付けした。
【０１３８】
Ｔ型内部モジュールのコンセンサス設計
実施例１に記載するコンセンサス配列の生成において含まれる２４３の配列から、βカテニンサブファミリーからの１１０のリピート配列を使用してコンセンサス配列を得た。この制限されたコンセンサスによって、異なるサブファミリー間での起こりうる不適合性が回避される。
【０１３９】
自動アラインメントは、ｃｌｕｓｔａｌＷで得られ、隣接リピート単位を結合するループも含めて手作業で改良された（表７）。コンセンサス配列を、起こりうる立体衝突を低下させるための結晶構造からの情報を考慮に入れて、さらに改善した。クローニング戦略のための必要条件もこの段階で考察し、モジュールＴ型を導く（表３及び７）。
【０１４０】
【表２５】

【０１４１】
推定ヘリックスＨ１、Ｈ２、Ｈ３は、それぞれ残基１−１０、１２−２１、２５−４０を包含する。位置７、１６、１７、１９、２０、３１、３４、３５、３８は全ての配列中で十分に保存されており、アルマジロタンパク質の疎水性コアの部分である。Ｇｌｙ１１は、Ｈ１とＨ２の間でのポリペプチド鎖の折り曲げにおけるその重要な役割が保存されており、この位置で必要とされるプラスのφ角度と適合する。Ｐｒｏ１４はアルマジロリピート単位の異常な保存特性であり、カテニン／プラコグロビンリピート単位アラインメント中で３５％の頻度で存在する。それは、Ｈ２の開始位置、水素結合中に骨格窒素を含むことが依然として必要ではない位置に位置づけられる；二次構造を破壊する代わりに、それはαヘリックスで典型的なφ／ψ角度を採用する。Ａｓｎ３７は全てのコンセンサス配列中で十分に保存されており、標的ペプチドの骨格への結合におけるその重要な役割に起因する。ペプチドの結合に潜在的に関与する位置（４、２６、２９、３０、３３、３６、３７、４０、４１）を実施例１に従って定義する。さらなる改変を元のコンセンサス配列に導入し（表７）、タンパク質の産生のための必要条件（例、システインの欠如）を満たし、純粋な配列ベースのアラインメントから生じた可能性のある構造的欠陥（例、衝突の存在）を回避した。Ｃｙｓ３０（１８％）及びＣｙｓ４１（２１％）を２番目に最も共通のアミノ酸（それぞれＡｌａ１２％及びＨｉｓ１７％）により交換し、可能なさらなる適用を限定しうる望ましくないジスルフィド結合の形成を回避した。位置９は、非極性又は極性（Ｌｅｕ、Ｇｌｕ、Ｇｌｎ）のいずれかの長い脂肪族側鎖に優先度を示す；しかし、この残基は溶媒に露出され、Ｌｅｕ９（２１％）は２番目に最も共通のアミノ酸Ｇｌｕ（１９％）により置換された。Ｇｌｎは位置１８の最も高頻度なアミノ酸（２７％）である。しかし、Ａｒｇ及びＬｙｓの両方がほぼ同じ頻度（それぞれ２５％及び２０％）で表わされ、正荷電を帯びた残基への優先度を示す。Ａｒｇを、次に、この位置でそのより高い頻度のために選んでいる。ループＨ２−Ｈ３とＨ３の間の連結部での位置２４及び２５は、全てのコンセンサス配列において酸性残基についての明確な優先度を示す。しかし、負電荷を帯びた残基対は、観察された配列中では決して起こらず、それは全タンパク質に沿って電荷反発又は負電荷を帯びたベルトの形成を導きうる。最も保存されていた残基Ｇｌｕ２５（４３％）は保持された。Ａｓｐ２４（２０％）をＡｓｎ（１０％）により置換したが、ほぼ同じ頻度を伴う候補プール中の元の残基（Ａｒｇ、Ａｓｎ、Ｍｅｔ、Ｓｅｒ、Ｔｙｒ、Ｖａｌ）との類似性により決定された選択肢である。Ｇｌｙを、位置４２に、クローニング目的で導入している。短いＨ３−Ｈ１ループ（一般的に１〜３残基）のため、非常にしばしばループの１つの位置がＧｌｙにより占められることが顕著である。位置４１が結合に関与することがあり、ひいては適用のために突然変異に供する可能性があることを考慮に入れると、ループ内に一定のグリシンを保持し、必要とされる可動性を維持することが重要である。
【０１４２】
設計されたアルマジロリピートタンパク質をコードするＤＮＡの合成
Ｔ型モジュールのペプチド配列をＤＮＡに逆翻訳し、大腸菌での発現のためにコドン使用を最適化した。Ｔ型モジュールに対応するＤＮＡ分子を重複オリゴヌクレオチドから開始して合成した（表２）。アセンブリーＰＣＲ、連結（モジュールの間及び実施例１に記載するキャッピングモジュールと）、及びクローニングを実施例１に従って実施し、１つのＮｙＮ末端キャッピングモジュール、２、４、又は８の内部Ｔ型モジュール、及び１つのＣａＣ末端キャッピングモジュールを含むアルマジロリピートタンパク質をコードする遺伝子を得た。
【０１４３】
生物物理学的な特徴付け
タンパク質の発現及び精製、ならびに分子ふるいクロマトグラフィー（ＳＥＣ）、多角度光散乱（ＭＡＬＳ）、円二色性（ＣＤ）、熱及びグアニジウム誘発性変性、ならびにＡＮＳ結合を実施例１に従って実施した。設計されたタンパク質は、ＳＥＣにおいて、天然アルマジロドメインとは対照的に、高い見掛け上の分子量を示す（表４）。ＭＡＬＳは、Ｔ型タンパク質が恐らくは溶液中で二量体と単量体の混合物として存在することを示す。主なピークは二量体形態に対応し、この値は表４に報告されている。高濃度（２〜４mg/ml）で、Ｔ型タンパク質はオリゴマーの混合物として存在し、さらに高い見掛け上の分子量を伴う。ＣＤスペクトルは、ヘリックス含量と内部モジュールの数の間に有意な相関関係を示さない。平均残基楕円率（ＭＲＥ）及びヘリックス含量の値を表４に示す。熱変性において、Ｔ型タンパク質は協同転移を示し、転移の中点（Ｔｍ）はモジュールの数と共に増加する。熱アンフォールディングはＹＴ_２Ａ及びＹＴ_４Ａについて完全には可逆的ではなく、ＹＴ_８Ａは不可逆的に変性される。平均残基楕円率（ＭＲＥ）、ヘリックス含量、及び転移の中点（Ｔｍ）の値を表４に示す。ＡＮＳ結合実験では、Ｔ型タンパク質が、天然アルマジロリピートタンパク質と同じ範囲でＡＮＳ結合を示す。ＡＮＳ蛍光強度の最高値を表４に示す。
【０１４４】
実施例４
改善された疎水性コアを伴う設計されたアルマジロリピートタンパク質の収集物を記載する。新型の内部モジュールを含むタンパク質は、コンピュータ「回転異性体サンプリング」アプローチを使用し、実施例１のＣ型モジュールに由来した。Ｃ型モジュールから、疎水性コア形成に寄与する１６の位置のうち７つを、脂肪族から脂肪族突然変異の標的として選択した。天然アルマジロドメインの結晶構造から開始し、モデル構造を生成し、内部リピート単位ごとのコア位置を、Ｃ型モジュール中に存在する残基及び許容された突然変異により置換した。各構造において、タンパク質のリピートモジュールごとに同じ突然変異を保有する。回転異性体サンプリングアプローチ、続くエネルギー最小化は、最終順位の突然変異体を得るために使用する一連の構造及び対応するエネルギー値をもたらした。１８の最上位の突然変異体を次にＤＮＡレベルで生成し、内部モジュールにおいて、Ｃ型モジュールに基づき、選択された残基を導入した。タンパク質を発現させ、元のＣ型モジュールを含む対応するタンパク質と比較した。可溶性タンパク質の高レベル発現が突然変異体について達成され、全てがそれらの生物物理学的特徴において、元のＣ型モジュールと比較した場合に、改善を示し、ほぼ全ての場合において、溶液中で単量体形態を保持する。二次構造及び安定した球状タンパク質の存在を、円二色性分光法、ＡＮＳ結合、ＮＭＲ、及び変性実験により確認した。
【０１４５】
疎水性コア突然変異体における回転異性体サンプリング
実施例１（表３）に記載するＣ型モジュールを、それらを含むタンパク質のコンパクト性及び天然様挙動を、元のＣ型モジュールを含むタンパク質と比較し、増加できる新型モジュールの生成のための開始点として選んだ。疎水性コアの充てん問題は、Ｃ型タンパク質のモルテングロビュール様挙動についての可能な説明である。疎水性コア位置中の突然変異によって、次に、タンパク質の充てんを改善できる。疎水性コア形成に寄与する１６の位置（図６及び表８）を、溶媒が接近可能な表面が全残基表面の５％未満であることにより定義した（１．４Å半径を伴うプローブにより決定される通りである）。最終選択は、構造の目視検査後に行った。突然変異の数は、各位置での共通の脂肪族アミノ酸に制限され、配列アラインメントに基づき、最も保存された位置を一定に保つ。単一リピートモジュールの疎水性コアを形成する１６中７つの位置だけが、これらの位置でのそれらの頻度に依存して、変動し、２つ又は３つの異なる残基型を受け入れることが可能になっていた（表８）。
【０１４６】
【表２６】

【０１４７】
各リピートモジュールにおける突然変異の可能な組み合わせの数は４３２である。サンプリングを改善するために、３つのＸ線構造を開始モデルとして選んだ：８つの内部リピート単位及び２つの末端リピート単位から各々なるＳ．ｃｅｒｅｖｉｓｉａｅ（ＰＤＢＩＤ１ＥＥ４）及びマウス（ＰＤＢＩＤ１Ｑ１Ｔ）からのインポーチンα、ならびに、１０の内部リピート単位及び２つの末端リピート単位からなるマウスβカテニン（ＰＤＢＩＤ２ＢＣＴ）。
【０１４８】
３つの構造の元のキャッピングリピート単位を、モデルにおいてＮｙ及びＣａキャッピングモジュール（表３）で置換した。各突然変異は、各リピート単位のコア位置で側鎖を欠失させ、そして、それらを無作為な回転異性体の立体構造を伴う新たな側鎖で置換することによりモデル化した；結果として得られる構造を最小化し、衝突を除いた。最終結果は、許容された突然変異の４３２の組み合わせの各々について３モデルの群（３つの初期構造から）であった。各モデルにおける全てのリピートモジュールを、同じ突然変異パターンを有するように設計した。一連の加熱−急冷サイクル、続くエネルギー最小化は、最終順位の突然変異体を生成するために使用された一連の構造及び対応するエネルギー値をもたらした（表９）。元のＣ型モジュールよりも低い疎水性コア容積（Chothia C., Nature 275: 304-8, 1975により報告された値で算出）を伴う突然変異体は、最終順位に含まれず、コアの充てん不足に起因して生じうる偽陽性の数を低下させた。
【０１４９】
【表２７】

【０１５０】
コンピュータアプローチでは、ＣＨＡＲＭＭ力場（Brooks B. R. et al., Journal of Computational Chemistry 4: 187-217, 1983）ならびに分子動力学によるエネルギー最小化及び加熱のサイクルを使用し、埋込み側鎖の好ましい配置をサンプリングし、所定の突然変異体の疎水性コア中での残基の充てん効率を推定する。距離依存的な誘電関数を伴う拡張した原子近似（ｐａｒａｍ１９）を、短い分子動力学の実行によるエネルギー最小化及び加熱の両方のために使用した。コア残基原子と直接的に接触しない全ての骨格原子及び側鎖原子（即ち、初期コンホメーションで、各リピート単位の１６のコア残基の任意の原子から５Å超離れたもの）は、定数１．０kcal・mol^-1・Å^-2を伴う調和ポテンシャルで制約された。この方法では、コア残基の側鎖回転結合だけが十分に可動性である。調和ポテンシャルを伴うシステムをさらに最小化した。加熱−急冷プロトコールを、４３２の突然変異体の各々及び３つのタンパク質構造の各々について１００回反復した。第１工程は１０psであり、４００Kに加熱し、非結合エネルギー項（即ち、ファンデルワールス及び静電気）を無視した。第２工程は、全てのエネルギー項を含む最小化であった。加熱段階の目的は、可動性の側鎖回転異性体をシャッフルし、それらがエネルギー障壁を飛び越えることを可能にすることであったが、最小化を使用し、加熱工程後にポテンシャルエネルギーにおいて最も近い最小値に達した。最小化の終わりに、配位を保存し、合計１００の立体構造を各突然変異体について生成した。これらの立体構造を、上記の制約なしに最終的に最小化し、そして、ポテンシャルエネルギーを順位について評価した。
【０１５１】
ＣＨＡＲＭＭポテンシャルエネルギーは：
【数１】

であり、
式中、Ｅ_{ｂｏｎｄｉｎｇ}は結合、角度、不適切な二面ポテンシャル項の合計であり、Ｅ_ｖｄｗはファンデルワールス全相互作用エネルギーであり、そしてＥ_ｅｌｅｃはクーロンエネルギーである。Ｅ_ｅｌｅｃ項を順位について無視した。なぜなら、それは、拡張された原子表示において脂肪族から脂肪族突然変異に非感受性だからである。さらに、この制約のため、骨格極性基の制限された可動性が、有意なシグナルなしにノイズとなるクーロンエネルギーをもたらす。従って、低下したポテンシャルエネルギーを順位に使用した。各開始構造について、突然変異体ｍの立体構造ｉについてのエネルギー値は
【数２】

である。各配座異性体が異なるポテンシャルエネルギーを有するため、中央値、１パーセンタイル、及び最小値を、配座異性体のエネルギーシリーズから抽出し、各突然変異体を特徴付け、その値を使用して３つの独立順位を作った。この手順の終わりに、３つの初期構造の各々について、３つの順位数字（中央値、１パーセンタイル、及び最小順位に対応する）を各突然変異体に割り当て、これらの９つの順位数字を合計した。結果として得られる数字を使用して、全突然変異体順位を得た。複数の構造及び異なる採点基準（即ち、中央値、１パーセンタイル、及び最小値）の組み合わせを使用し、近似方法で、限定されたサンプリングを考慮に入れた。この方法では、高い順位位置が、多くの立体構造にわたり、３つの異なる骨格において突然変異の一貫した性能を必要とし、ポテンシャルエネルギーを検討するための３つの異なる方法を使用した。突然変異体の各開始モデルに必要なＣＰＵ時間は、２８００ＭＨｚＯｐｔｅｒｏｎデュアルコアの単一プロセッサーで、インポーチン構造当たり約５時間、カテニン構造について７時間であった。全算出時間（約８０００時間）を１５０のＣＰＵに分割した。
【０１５２】
設計されたアルマジロリピートタンパク質をコードするＤＮＡの合成
（３０）の最上位の単一リピートモジュール突然変異体配列の内、１８を実験的検証のために選択した。低いコア容積を伴う最善の順位の突然変異体配列も選択し、順位付けプロセス中にコア容積フィルターの初期選択肢を検証した。突然変異体リピートモジュールのタンパク質特性に及ぼす影響を、４つの同一の内部モジュール及び実施例１に記載するキャッピングモジュールＮｙ及びＣａを含むタンパク質のフォーマット中で評価した。タンパク質をｍｕｔ１からｍｕｔ１８と名付けた；ｍｕｔ１９は低いコア容積を伴う配列を含む（表９）。Ｃ型モジュールを含む参照タンパク質を、上に示す通り、ＹＣ_４Ａと呼ぶ。オリゴヌクレオチドからの単一モジュールの組み立て及び段階的連結を、実施例１に記載する通りに実施した。各モジュールで使用するオリゴヌクレオチドの組み合わせを表１０に示す。
【０１５３】
【表２８】

【０１５４】
タンパク質の発現及び精製
「回転異性体サンプリング」方法により選択したモジュールを含むタンパク質を、実施例１に記載の通りに、発現及び精製した。疎水性コア突然変異体の発現レベルは、元のＣ型モジュールを含むタンパク質とほぼ同じであった。タンパク質を、固定化金属イオン親和性クロマトグラフィー（ＩＭＡＣ）により、単一工程で精製し、１リットルの細菌培養から約１００mgの純粋タンパク質を産生した。
【０１５５】
選択された疎水性コア突然変異体の特徴付け
実験的比較を、実施例１に記載の通りに、円二色性（ＣＤ）、分子ふるいクロマトグラフィー（ＳＥＣ）、及びＡＮＳ（１−アニリノ−ナフタレン−８−スルホン酸）の結合により行った。分析的な分子ふるいクロマトグラフィーを、Superdex 200 PC 3.2/30カラム（流速７０μl/分）を使用したEttan LCシステム又はSuperdex 200 10/30 GLカラム（流速０．５ml/分）（GE Healthcare、スイス）を使用したＡＫＴＡエクスプローラークロマトグラフィーシステムのいずれかで行った。
【０１５６】
全ての突然変異体が、類似のＣＤスペクトルをＹＣ_４Ａと共有しているが、しかし、２２２nmでの平均残基楕円率の全般的増加により特徴付けられ、より高いパーセントのαヘリックス二次構造を示す。突然変異体の増加した溶出容積は、減少したＡＮＳ結合と十分に相関し、タンパク質のより高いコンパクト性を示す（図７）。ｍｕｔ１はその二量体形態に起因する外れ値だけを表わし、全ての他の突然変異体は、多角度光散乱（ＭＡＬＳ）により示される通り、単量体である。コア突然変異体の一部は、追加の突然変異を保有し、それらは遺伝子合成中に導入された（図７の記載に示す）。これらの突然変異の大半が、ループ中又はヘリックスの表面に位置し、そのため疎水性コアの安定性に及ぼす影響はわずかだけ又は無い可能性が高い；さらに、それらは４つの内、単一のモジュールだけに存在し、タンパク質特性に対するそれらの全体的寄与を低下させる。突然変異体ｍｕｔ２、ｍｕｔ３、ｍｕｔ４、ｍｕｔ７、ｍｕｔ１１、ｍｕｔ１２、及びｍｕｔ１３は、ＳＥＣにより判断された通り、低いＡＮＳ結合及びコンパクト性の最善の組み合わせを示し、熱変性によるさらなる特徴付けのために選択した。突然変異体ｍｕｔ７は、ＹＣ_４Ａ及び他の突然変異体と比較し、熱アンフォールディング中に有意に増加した共同性を示す。ｍｕｔ７に対応する内部モジュールは、Ｍ型と名付けられ、初期コンセンサスと比較して３つの点突然変異を含む（表３）。突然変異体ｍｕｔ７は、ＹＭ_４Ａと改名され、ＹＣ_４Ａと同様に、いくつかの塩及びタンパク質の濃度で安定化な単量体である；しかし、二量体形成が、ｐＨ７で、高いタンパク質濃度（５mg/ml）により観察された。沈殿又は分解の徴候は、ＩＭＡＣ溶出緩衝液中で、４℃で１ヶ月まで保存されたタンパク質溶液中で検出されなかった。ＹＭ_４Ａの生物物理学的特徴を表４に示す。
【０１５７】
ＮＭＲ
ＮＭＲ試験のためのタンパク質を、唯一の窒素源として^１５Ｎ標識した塩化アンモニウムを伴う最小培地中で増殖させた、プラスミドｐＲＥＰ４を含む大腸菌株Ｍ１５（Qiagen）を使用して産生した。培地に、微量金属、１５０μMチアミン、及び３０μg/mlカナマイシンを添加した。発現ならびにＩＭＡＣ及びゲルろ過による精製を、実施例１に記載の通りに実施した。ＮＭＲ測定のために使用した緩衝液は、２０mM重水素化Ｔｒｉｓ−ＨＣｌ、３０mM ＮａＣｌを含み、ｐＨは６、７、８、９、１０、又は１１であった。ＹＣ_４Ａ及びＹＭ_４Ａを、ＮＭＲ測定のために０．６mMに濃縮した。プロトン、窒素の相関マップは、コヒーレンス選択及び直交検出のためのパルス磁場勾配を利用し、Rance and Palmer Palmer A. G. et al., J. Mag. Reson. 93: 151-70, 1991；Kay L. E. et al., J Am Chem Soc 114: 10663-5, 1992の感度増強エレメントを取り込んだ［^１５Ｎ，^１Ｈ］−ＨＳＱＣ実験に由来した。^１５Ｎ｛^１Ｈ｝−ＮＯＥデータを、プロトン検出バージョンの^１５Ｎ｛^１Ｈ｝定常状態異核Ｏｖｅｒｈａｕｓｅｒ効果を使用して測定した。全ての実験を、３１０Kでの三重共鳴クリオプローブを備えたBruker AV-700 MHzスペクトロメータで記録した。スペクトルを処理し、スペクトロメーターソフトウェアTOPSPIN 1.3で分析し、４．６３ppmプロトン振動数での水共鳴と比較して較正し、そこから^１５Ｎスケールを間接的に算出した。
【０１５８】
ＹＣ_４Ａのアミドプロトン振動数は、一般的に、ランダムコイル範囲（７．５〜８．５ppm）に限定されるが、ＹＭ_４Ａの多くの交差ピークはこの範囲外に位置する。さらに、ＹＣ_４Ａのシグナルからの線幅は、ＹＭ_４Ａのそれからよりもわずかに大きい。立体構造的な交換プロセスならびに限定的なシグナル分散に起因する線幅増加は、タンパク質のモルテングロビュール状態の特徴的な特性である。^１５Ｎ，^１Ｈ相関マップを割り当てる試みはなされてこなかったが、^１５Ｎ−｛^１Ｈ｝−ＮＯＥデータを記録し、内部骨格動力学を特徴付け、ＹＭ_４Ａの硬性増加を探った。ＹＭ_４Ａの全てのアミド成分を０．６より大きい^１５Ｎ−｛^１Ｈ｝−ＮＯＥｓにより特徴付け、十分に折り畳まれたセグメントを示したが、ＹＣ_４Ａについて、全ての値が０．３より小さく、とりわけ、多くが陰性ＮＯＥｓを伴い、大きいな可動性を示す。ＮＭＲ測定によって、次に、ＹＣ_４Ａのモルテングロビュール特徴及びＹＭ_４Ａの天然様特性が確認される。
【０１５９】
実施例５
実施例は、無作為化された残基を伴う設計されたアルマジロリピートタンパク質の収集物を指し（ライブラリーと呼ぶ）、標的ペプチドへのバインダーの選択を可能にする。アルマジロリピートタンパク質ライブラリーを、Ｎｙ及びＣａキャッピングモジュール（実施例１に記載）及び無作為化された位置を伴う３つの内部Ｍ型モジュール（実施例４に記載）を使用して生成する。
【０１６０】
設計されたアルマジロリピートタンパク質をコードするＤＮＡの合成
ライブラリーは、Ｎ末端キャッピングモジュールとしてのＮｙ、無作為化された位置を伴う３つの内部Ｍ型モジュール、及びＣ末端キャッピングモジュールとしてのＣａを含むタンパク質を含むタンパク質を含め、タンパク質レベルで設計された。残基Ｅ、Ｈ、Ｋ、Ｉ、Ｑ、Ｒ、Ｔを、Ｍ型モジュールの位置４に許容した。制限は位置４の立体的制約に起因したが、それは疎水性コアの形成にも関与する。全ての残基（Ｃ、Ｇ、及びＰを除く）が、位置３０、３３、３６、４０、４１で許容された。システインを除外し、ジスルフィド架橋の形成又はタンパク質二量体化を回避した。グリシン及びプロリンを、４１を除く全ての位置がαヘリックスに局在するとの事実に起因する、それらのヘリックス破壊傾向のため除外した。タンパク質配列を、コードＤＮＡ配列に逆翻訳した。しかし、Ｍ型ＤＮＡ配列中の位置４１は無作為化された位置であり、対応するコドンはモジュールの組み合わせ中にＩＩ型制限酵素のための切断部位として使用できない（実施例１及び図４）。ＤＮＡ配列を次に６塩基対だけ移動させ、切断部位としての固定化位置のコドンの使用を可能にした。同じ戦略をＮｙ及びＣａＤＮＡ配列に適用し、正確なリーディングフレームを保ち、所望のタンパク質配列を得た。ライブラリー生成のために使用したＤＮＡ配列（ＮｙＬｉｂ、Ｌ、ＣａＬｉｂ）を以下に示す。
【０１６１】
【表２９】

【０１６２】
モジュールに対応するＤＮＡ分子を、重複オリゴヌクレオチドから開始して合成した（表２に示す）。
【０１６３】
オリゴヌクレオチドｌｉｂ１Ｆ１、ｌｉｂ１Ｆ２、及びｌｉｂ１Ｆ３は、内部リピートモジュールライブラリー（Ｌ型モジュールと呼ぶ）の組み立てのために使用した６つのオリゴヌクレオチドの最初に対応する。位置４では、ｌｉｂ１Ｆ１が残基Ｉ及びＴを、ｌｉｂ１Ｆ２がＥ、Ｋ、及びＱを、ｌｉｂ１Ｆ３がＨ及びＲをコードする。これらの３つのオリゴヌクレオチドをモル比３：２：２で混合し、オリゴヌクレオチド混合物ｌｉｂ１Ｆを得て、７つの異なるコドンを等量含む、組み立て中の第１のオリゴヌクレオチドとして使用した。オリゴヌクレオチドｌｉｂ５Ｆは、無作為化された位置に対応するコドンにトリヌクレオチドホスホラミダイト（Virnekas B. et al., Nucleic Acids Res 22: 5600-7, 1994）を取り込む。トリヌクレオチドホスホラミダイトはGlen Research（ＵＳＡ）により提供され、ｌｉｂ５ＦはMetabion（ドイツ）により合成された。アセンブリーＰＣＲ、連結（モジュールの間及びキャッピングモジュールと）、及びクローニングを実施例１に従って実施した。Ｎｙ１Ｆ、Ｎｙ２Ｒ、Ｎｙ３Ｒ、及びＮｙ４ｌｉｂＲｂｉｓを、Ｎ末端キャッピングモジュールの合成のために使用した。Ｃａ１ｌｉｂＦ、Ｃａ２ｌｉｂＲ、Ｃａ３Ｆ、Ｃａ４Ｒ、Ｃａ５Ｆ、及びＣａ６Ｒを、Ｃ末端キャッピングモジュールの合成のために使用した。ｌｉｂ１Ｆ（３：２：２ｌｉｂ１Ｆ１：ｌｉｂ１Ｆ２：ｌｉｂ１Ｆ３）、ｌｉｂ２Ｒ、ｌｉｂ３Ｆ、ｌｉｂ４Ｒ、ｌｉｂ４Ｒ、ｌｉｂ５Ｆ、及びｌｉｂ６Ｒを、内部リピートモジュールライブラリーの合成のために使用した。ｌｉｂＦｏｒ及びｌｉｂ６Ｒを、定方向での連結後にモジュールの増幅のために使用した。
【０１６４】
選択されていないライブラリーメンバーの発現
ライブラリーの単一クローンの発現を５ml培養中で実施し、細胞を実施例１に記載の通りに超音波処理により溶解した。欠失又は切断を伴わない全ての選択されていないライブラリーメンバーは可溶性であり、発現収量は、先の実施例に記載する設計されたアルマジロリピートタンパク質と同程度である。
【０１６５】
実施例６
この実施例では、設計されたアルマジロリピートタンパク質ライブラリーからの特定の結合分子の選択を提示する。ＳＶ４０核局在化配列（ＮＬＳペプチド、ペプチド配列ＫＫＫＲＫＶ、配列番号９８）に対するバインダーを、リボソームディスプレイ（Hanes, J. and Pluckthun, A., PNAS 94: 4937-42, 1997）を使用して選択した。初期ライブラリーを実施例５に記載の通りに組み立て、Ｎ末端からＣ末端までのタンパク質レベルで、１つのＮｙモジュール、１つのＭモジュール、無作為化された位置を伴う３つのＭモジュール、１つのＭモジュール及び１つのＣａモジュールを含む。Ｎ末端キャッピングモジュールＮｙの直後のＭモジュール及びＣ末端キャッピングモジュールの直前のＭモジュールは、ライブラリーメンバーの追加安定性及び低下した凝集傾向を提供する。特定の（ＮＬＳペプチド）及び非特定の（NeutrAvidin及びｃｒｏペプチド）標的に対する選択されたクローンの結合を、粗抽出物ＥＬＩＳＡにより評価し、ＮＬＳペプチド結合アルマジロリピートタンパク質が上手く選択されたことを示す（図８）。
【０１６６】
リボソームディスプレイによるＮＬＳペプチド特異的アルマジロリピートタンパク質の選択
ＮＬＳペプチド特異的なアルマジロリピートタンパク質の選択は、リボソームディスプレイ（Hanes and Pluckthun, loc. cit.）により、上に記載した設計されたアルマジロリピートタンパク質の初期ライブラリー及び確立されたプロトコール（Zahnd, C., Amstutz, P. and Pluckthun, A, Nat Methods 4: 269-79, 2007）を使用し、いくつかの小さな改変を伴って実施した：（ｉ）翻訳を１０分間の代わりに１５分間行った、（ｉｉ）Herculase II Fusionポリメラーゼ（Stratagene）をＲＴ−ＰＣＲ及びＰＣＲの工程に使用した、及び（ｉｉｉ）プラスミドｐＲＤＶｈｉｓＣＡＧをｐＲＤＶ（ＧｅｎＢａｎｋ受入番号ＡＹ３２７１３６）の代わりに使用した。プラスミドｐＲＤＶｈｉｓＣＡＧはｐＲＤＶと同一であり、例外としてｐＲＤＶのｆｌａｇタグ
【表３０】

がＭＲＧＳタグ
【表３１】

により交換されている。対応するＮ末端メチオニン残基のコドンを太字で示す。さらに、プラスチック結合NeutrAvidin（Pierce）を使用して固定化したビオチン化ＮＬＳペプチド（JPT、ベルリン、ドイツ）を選択のための標的として使用し、ライブラリーのプレパニング（Zhand et al., loc. cit.）をNeutrAvidinで実施した。選択されたクローンを、それらの細胞質発現のために、ｐＱＥ３０（Qiagen）に基づく細菌発現ベクター中にサブクローン化した。
【０１６７】
選択されたクローンは、粗抽出物ＥＬＩＳＡにより示される通り、ＮＬＳペプチドに特異的に結合する。
選択されたクローン（上で言及した発現ベクター中にクローン化し、次に、大腸菌ＸＬ１−Ｂｌｕｅ（Strategene）中に形質転換した）を、３７℃で、９６ウェル深底ウェルプレートの各々の中で、１mlの増殖培地（１％グルコース及び１００μg/mlアンピシリンを含む２ＹＴ）を含む単一ウェル中で一晩増殖させた。５０μg/mlアンピシリンを含む１mlの新鮮２ＹＴに、新たな９６深底ウェルプレートにおいて、１００μlの一晩培養物を接種した。３７℃で２時間のインキュベーション後、発現をＩＰＴＧ（１mM最終濃度）で誘導し、３時間持続させた。細胞を収集し、１００μl Ｂ−ＰＥＲＩＩ（Pierce）中に再浮遊させ、室温で撹拌しながら１５分間インキュベートした。次に、９００μl ＰＢＳ−ＴＢ（８ｍＭＮａ_２ＨＰＯ_４、１．５mM ＫＨ_２ＰＯ_４、１３７mM ＮａＣｌ、３mM ＫＣｌ、０．２％ＢＳＡ、０．１％Ｔｗｅｅｎ２０、ｐＨ７．４）を加え、細胞細片を遠心分離により除去した。１００μlの各々の溶解クローンを、ＮＬＳペプチドもしくは無関係ｃｒｏペプチド（ＰＲＴＳＳＦ、配列番号１０１）のいずれか（それらのビオチン成分を介して固定化）又はNeutrAvidin単独を含む、NeutrAvidinコーティングしたMaxiSorpプレートのウェルに適用し、１時間室温でインキュベートした。ＰＢＳ−Ｔ（８mM Ｎａ_２ＨＰＯ_４、１．５mM ＫＨ_２ＰＯ_４、１３７mM ＮａＣｌ、３mM ＫＣｌ、０．１％Ｔｗｅｅｎ２０、ｐＨ７．４）での十分な洗浄後、プレートを、モノクローナル抗ＲＧＳ（Ｈｉｓ）４抗体（３４６５０、Qiagen）を一次抗体として、アルカリフォスファターゼと抱合したポリクローナルヤギ抗マウス抗体（Ａ３５６２、Sigma）を二次試薬として使用した標準的ＥＬＩＳＡ手順を使用して開発した。結合を、次に、２ナトリウム４−ニトロフェニルリン酸（４ＮＰＰ、Fluka）をアルカリフォスファターゼの基質として使用することにより検出した。発色を４０５nmで測定した（図８）。
【０１６８】
実施例７
この実施例は、事前に選択されたモジュールからの特定の単一モジュールの選択及び新たな特定の設計されたアルマジロリピートタンパク質の生成のための方法を提示する。方法は、定義された標的に対して既に選択された、設計されたアルマジロリピートタンパク質に基づき、それについて、単一モジュールと認識されるペプチド（例えば、ジペプチド）の部分の間の対応が公知である。特定のジペプチドを認識するリピートモジュールを、選択されていないリピートモジュールライブラリーＬの隣接モジュールとして使用する。モジュールのこの組み合わせを使用して生成した、設計されたアルマジロリピートタンパク質の収集物を、次に、標的ジペプチド（それについて、リピートモジュールライブラリーを選択しなければならない）と隣接する、既に選択されたリピートモジュールにより認識されるジペプチドを含む標的ペプチドへの結合について選択する。中央の選択されたリピートモジュールを、選択されたリピートタンパク質を発現するクローンから回収し、さらなる使用のために単一の特定リピートモジュールとして保存できる。選択されたリピートモジュールを、次に、事前に定義した特異性を伴う新たなリピートタンパク質において合わせることができる。
【０１６９】
単一モジュールの選択のための設計されたアルマジロリピート
タンパク質例として、キャッピングリピートモジュールとしてのＮｙ及びＣａならびに３つの内部Ｍ型モジュールを含む設計されたアルマジロリピートタンパク質の収集物が、ヘキサペプチドの結合のために必要とされ、各内部リピートモジュールがジペプチドを認識することが想定される。
【０１７０】
ジペプチドの特異的結合に関与するモジュールの配列は、先に選択された、設計されたアルマジロリピートタンパク質に由来しうる。特異性は、結合定数の定性的及び定量的な決定方法（標的ペプチド及び突然変異バージョンの標的ペプチドとの組み合わせ）を使用して評価できる。これらの配列を使用し、第１及び第３の内部モジュール（プレＬ及びポストＬと名付ける）を合成し、ここで追加の唯一の制限酵素部位を、タンパク質配列に影響を及ぼすことなく、ＤＮＡレベルで導入する。完全タンパク質をコードするＤＮＡ配列を、実施例１に従って、ＮｙＬ、プレＬ、Ｌ型モジュール、ポストＬ、及びＣａＬを使用して組み立てる。ＮｙＬ、Ｌ型モジュール、及びＣａＬを実施例５に記載する。ＤＮＡ配列を、次に、選んだ選択システムに適切なベクター中に挿入できる。選択後、より高い親和性を伴うクローンを単離でき、プラスミドは、精製された設計されたアルマジロリピートタンパク質及び導入された制限酵素部位を認識する制限酵素での消化後に回収されたリピートモジュールライブラリーからの内部の選択されたリピートモジュールを含む。モジュールの喪失部分を提供するプライマーを使用したＰＣＲ増幅によって、ライブラリーフォーマット中の選択されたリピートモジュールのＤＮＡ配列が生成される。
【０１７１】
選択されたモジュールを、次に、追加の選択工程なしに、新たなバインダーの生成のために保存又は使用できる。方法の一般的模式図を図９に示す。モジュールＤＮＡの回収のための代替物として、配列をシークエンシングにより得て、モジュールを先の実施例に記載するオリゴヌクレオチドから再構築する。
【０１７２】
事前に選択したモジュールからの設計されたアルマジロリピートタンパク質
ライブラリーフォーマット中の選択されたリピートモジュールを、実施例１に記載の通りに、キャッピングリピートモジュールとしてＮｙＬｉｂ及びＣａＬｉｂ（実施例５に記載）を使用して組み立てることができる。選択されたモジュールにより提供される特異的結合のため、新たなタンパク質は、標的として、単一モジュールの標的ジペプチドの組み合わせとして生じるペプチド配列を認識できなければならない（図１０）。

【特許請求の範囲】
【請求項１】
アルマジロリピートタンパク質の収集物であって、各アルマジロリピートタンパク質が、アルマジロリピート単位のコンセンサス配列に由来する少なくとも２つの連続リピートモジュールを含む少なくとも１つのリピートドメインを含み、該アルマジロリピートタンパク質の少なくとも１つが、標的ポリペプチドに結合することができ、該アルマジロリピートタンパク質により結合された該標的ポリペプチドの部分が、伸長したコンホメーションにある収集物。
【請求項２】
リピートドメインの該リピートモジュールの全てが、ベータ−カテニン、プラコグロビン、又はインポーチンアルファリピート単位のいずれかのコンセンサス配列に由来する、請求項１記載の収集物。
【請求項３】
請求項１又は２記載の収集物であって、該リピートモジュールの各々が、アミノ酸配列を有し、アミノ酸残基の少なくとも７０％が、
（ｉ）少なくとも２つのアルマジロリピート単位の対応する位置で見出されるアミノ酸残基から推定されるコンセンサスアミノ酸残基；又は
（ｉｉ）１つのアルマジロリピート単位中の対応する位置で見出されるアミノ酸残基
のいずれかに対応する収集物。
【請求項４】
アルマジロリピートタンパク質が、アルマジロリピート配列モチーフ
【表３２】

を伴うリピートモジュールを含み、「ｘ」は任意のアミノ酸を示し、「ａ」は残基Ａ、Ｆ、Ｇ、Ｉ、Ｌ、Ｍ、Ｐ、Ｔ、Ｖ、Ｗ及びＹのいずれかを示し、「ｐ」は残基Ａ、Ｃ、Ｄ、Ｅ、Ｇ、Ｈ、Ｋ、Ｎ、Ｐ、Ｑ、Ｒ、Ｓ、Ｔ及びＹのいずれかを示す、請求項１記載の収集物。
【請求項５】
アルマジロリピートタンパク質が、アルマジロリピート配列モチーフ
【表３３】

を伴うリピートモジュールを含み、「１」及び「２」は任意のアミノ酸残基を表わす、請求項４記載の収集物。
【請求項６】
該アルマジロリピートタンパク質が、アルマジロリピート配列モチーフ
【表３４】

を伴うリピートモジュールを含み、「ｘ」は任意のアミノ酸を示し、「ａ」は残基Ａ、Ｆ、Ｇ、Ｉ、Ｌ、Ｍ、Ｐ、Ｔ、Ｖ、Ｗ及びＹのいずれかを示し、「ｐ」は残基Ａ、Ｃ、Ｄ、Ｅ、Ｇ、Ｈ、Ｋ、Ｎ、Ｐ、Ｑ、Ｒ、Ｓ、Ｔ及びＹのいずれかを示す、請求項１記載の収集物。
【請求項７】
該アルマジロリピートタンパク質が、アルマジロリピート配列モチーフ
【表３５】

を伴うリピートモジュールを含み、「１」及び「２」は任意のアミノ酸残基を表わす、請求項６記載の収集物。
【請求項８】
該アルマジロリピートタンパク質が、アルマジロリピート配列モチーフ
【表３６】

を伴うリピートモジュールを含み、「ｘ」は任意のアミノ酸を示し、「ａ」は残基Ａ、Ｆ、Ｇ、Ｉ、Ｌ、Ｍ、Ｐ、Ｔ、Ｖ、Ｗ及びＹのいずれかを示し、「ｐ」は残基Ａ、Ｃ、Ｄ、Ｅ、Ｇ、Ｈ、Ｋ、Ｎ、Ｐ、Ｑ、Ｒ、Ｓ、Ｔ及びＹのいずれかを示す、請求項１記載の収集物。
【請求項９】
該アルマジロリピートタンパク質が、アルマジロリピート配列モチーフ
【表３７】

を伴うリピートモジュールを含み、「１」及び「２」は任意のアミノ酸残基を表わす、請求項８記載の収集物。
【請求項１０】
該アルマジロリピートタンパク質が、アルマジロリピート配列モチーフ
【表３８】

を伴うリピートモジュールを含み、「ｘ」は任意のアミノ酸を示し、「ｓ」は残基Ａ、Ｉ、Ｌ、Ｖ及びＧからなる群より選択されるアミノ酸残基を表わし、「ｈ」は残基Ａ、Ｉ、Ｌ及びＶからなる群より選択されるアミノ酸残基を表わす、請求項１記載の収集物。
【請求項１１】
該アルマジロリピートタンパク質が、アルマジロリピート配列モチーフ
【表３９】

を伴うリピートモジュールを含み、「１」及び「２」は任意のアミノ酸残基を表わす、請求項１０記載の収集物。
【請求項１２】
コンセンサス配列中の３０％までのアミノ酸残基を、対応するリピート単位中の対応する位置で見出されるアミノ酸残基により交換する、請求項１〜１１のいずれか一項記載の収集物。
【請求項１３】
該リピートドメインが、Ｎ末端キャッピングモジュールそれに続く非ライブラリーリピートモジュール、及び／又はＣ末端キャッピングモジュールそれに先行する非ライブラリーリピートモジュールをさらに含み、該キャッピングモジュールが該リピートモジュールの任意の１つとは異なるアミノ酸配列を有する、請求項１〜１２のいずれか一項記載の収集物。
【請求項１４】
請求項１３記載の収集物であって、該Ｎ及び／又はＣ末端キャッピングモジュールの各々が、アミノ酸配列を有し、アミノ酸残基の少なくとも５０％が、
（ｉ）少なくとも２つのリピート単位又はキャッピング単位の対応する位置で見出されるアミノ酸残基から推定されるコンセンサスアミノ酸残基；又は
（ｉｉ）リピート単位又はキャッピング単位中の対応する位置で見出されるアミノ酸残基のいずれかに対応する収集物。
【請求項１５】
Ｎ末端キャッピングモジュールが、配列モチーフ
【表４０】

を含む、請求項１３記載の収集物。
【請求項１６】
Ｃ末端キャッピングモジュールが、配列モチーフ
【表４１】

を含む、請求項１３記載の収集物。
【請求項１７】
該アルマジロリピートタンパク質の該アルマジロリピートドメインもしくは該リピートドメインの部分、又は該アルマジロリピートタンパク質の単一リピートモジュールの、請求項１〜１６記載のアルマジロリピートタンパク質の収集物をコードする核酸分子の収集物。
【請求項１８】
アルマジロリピートタンパク質が設計されたアルマジロリピートタンパク質であり、標的分子に結合することができる、請求項１〜１６のいずれか一項記載の収集物からのアルマジロリピートタンパク質。
【請求項１９】
アルマジロリピートタンパク質が事前に決定された特性を有する、請求項１〜１６のいずれか一項記載の収集物からのアルマジロリピートタンパク質。
【請求項２０】
請求項１８又は１９記載のアルマジロリピートタンパク質をコードする核酸。
【請求項２１】
選択を実施することなく標的ポリペプチドに結合することができるアルマジロリピートドメインを得るための方法であって、標的ポリペプチドが伸長したコンホメーションにあり、該リピートドメインが、該標的ポリペプチド中に含まれるアミノ酸の小さな直線状ストレッチについて定義された結合特異性を有する事前に決定されたリピートモジュールから組み立てられる方法。
【請求項２２】
アミノ酸の小さな直線状ストレッチについて定義された結合特異性を有するアルマジロリピートモジュールを得るための方法であって、以下の工程
（ａ）複数の内部リピートモジュールを含むアルマジロリピートタンパク質の推定又は入手；
（ｂ）該アルマジロリピートタンパク質の内部リピートモジュールをリピートモジュールライブラリーにより交換することによるアルマジロリピートタンパク質ライブラリーの生成；
（ｃ）アミノ酸の小さな直線状ストレッチを含む標的（ポリ）ペプチドへの結合能に従った該リピートタンパク質ライブラリーからのアルマジロリピートタンパク質の選択；
（ｄ）アミノ酸の該ストレッチに特異性を有する工程（ｃ）からの選択された該アルマジロリピートタンパク質からの選択されたリピートモジュールの単離
を含む、方法。
【請求項２３】
標的（ポリ）ペプチドに結合することができるアルマジロリピートタンパク質を得るための方法であって、以下の工程
（ａ）標的（ポリ）ペプチドの結合部分に関与する単一のアルマジロリピートモジュールに対応する核酸配列の推定又は入手；
（ｂ）請求項１〜１６記載のアルマジロリピートタンパク質をコードし、工程（ａ）に由来する核酸配列を含む核酸分子の構築；及び
（ｃ）工程（ｂ）に由来する核酸分子からのアルマジロリピートタンパク質の発現；及び
（ｄ）該標的（ポリ）ペプチドに結合することができる少なくとも１つのアルマジロリピートタンパク質を得るための該アルマジロリピートタンパク質のスクリーニング及び／又は該アルマジロリピートタンパク質からの選択
を含む、方法。

【図１】

【図２】

【図３】

【図４】

【図５】

【図６】

【図７】

【図８】

【図９Ａ】

【図９Ｂ】

【図９Ｃ】

【図１０】

【公表番号】特表２０１０−５３９９１５（Ｐ２０１０−５３９９１５Ａ）
【公表日】平成２２年１２月２４日（２０１０．１２．２４）
【国際特許分類】

化学；冶金 (1,075,549)
- 生化学；ビール；酒精；ぶどう酒；酢；微生物学；酵素学；突然変異... (115,607)
  - 微生物または酵素；その組成物 (68,222)
    - 突然変異または遺伝子工学；遺伝子工学に関するＤＮＡまたはＲＮＡ... (28,831)
      - 組換えＤＮＡ技術 (27,772)
- 有機化学 (230,229)
  - ペプチド (29,849)
    - ２１個以上のアミノ酸を含有するペプチド；ガストリン；ソマトスタ... (11,573)
      - 動物から；ヒトから (7,664)

【出願番号】特願２０１０−５２６２６８（Ｐ２０１０−５２６２６８）
【出願日】平成２０年９月２３日（２００８．９．２３）
【国際出願番号】ＰＣＴ／ＥＰ２００８／０６２６７１
【国際公開番号】ＷＯ２００９／０４０３３８
【国際公開日】平成２１年４月２日（２００９．４．２）
【出願人】（５０７３２４６８１）ユニバーシティ・オブ・チューリッヒ (7)
【氏名又は名称原語表記】ＵＮＩＶＥＲＳＩＴＹ　ＯＦ　ＺＵＲＩＣＨ
【Ｆターム（参考）】

[ Back to top ]

設計されたアルマジロリピートタンパク質

メニュー

スポンサーリンク

次の公報 »

« 前の公報

設計されたアルマジロリピートタンパク質

メニュー

スポンサー リンク

次の公報 »

« 前の公報

スポンサーリンク