説明

設計されたアルマジロリピートタンパク質

本発明は、アルマジロリピートタンパク質に基づく標的特異的な設計された結合タンパク質の収集物、及びそれらを生成する方法に関する。設計されたアルマジロリピートタンパク質は、単一のアルマジロリピート単位のコンセンサス配列に基づく。これらのリピートタンパク質は、ペプチド認識のための足場として使用できる。そのような足場は、原則として小さな認識可能単位ごとに同じである結合様式(例、アミノ酸又はジペプチド)を提供し、伸長したコンホメーションのペプチドの正確なモジュラー認識を可能にする。方法によって、これらの簡単な単位を認識する一連のモジュールを生成し、そのような構成要素を合わせて、追加の選択を実施することなく、任意の所望のペプチド標的のための結合部位を作製することが可能になる。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、アルマジロリピートタンパク質に基づく標的特異的な結合分子の生成のための新規方法及びそのようにして得られた設計されたアルマジロリピートタンパク質に関する。
【背景技術】
【0002】
タンパク質−タンパク質相互作用が、生物学及び関連分野(研究すべき医薬から診断用薬まで)において重要な役割を果たす。標的タンパク質を認識できる特異的分子が、抗体ライブラリー又は代わりの結合分子に適用される確立された選択技術(例、ファージディスプレイ、リボゾームディスプレイ、mRNAディスプレイ、DNAディスプレイ)により得ることができる。高い特異性及び選択性がこれらの戦略により達成されるが、しかし、分子の結合様式は予測することがしばしば困難である。単一のエピトープを異なる方法で標的にでき、そのため結合に関与する残基及び利用される相互作用の予測はしばしば達成可能ではなく、これらのバインダーの合理的アプローチ及び選択プロセスを「ケースバイケース」の方法論に追いやる。各々の新たな結合分子は、選択手順により個別に作らなければならず、それは毎回異なる立体構造の標的タンパク質に結合し、その交差反応性は各ケースで個別にテストしなければならない。ずっと簡単なケースが、標的が一次配列に沿ったアミノ酸の連続ストレッチ(直線状エピトープ)を提供する場合に提供される。直線状エピトープの認識は、天然タンパク質で、ペプチドの一般的な認識についてのモデルとして検討できる。存在する二次構造がほとんどなく、伸長した立体構造で結合する可能性のため、ペプチドの全ての側鎖が、正確で再現可能な方法で、結合分子によるアミノ酸レベルでの認識のために潜在的に利用可能である。
【0003】
天然ペプチド結合タンパク質(小さなアダプタードメイン(例、SH2、SH3、PDZ、WW)を含む)、MHCI及びMHCIIタンパク質、ならびにいくつかのリピートタンパク質ファミリー(例、TPR、アルマジロ、WD40)の内、アルマジロリピートタンパク質は、それらを、モジュラーペプチド結合タンパク質を生成するための足場を構築するために適するようにする特徴を持つ。アルマジロリピートタンパク質に基づくそのような足場の生成では、また、リピートタンパク質のコンセンサス設計及びWO 02/20565に記載するリピートタンパク質ライブラリーの生成のために開発された方法を活用しうる。アルマジロリピートタンパク質は、転写調節(βカテニン)から細胞付着(プラコフィリン)、腫瘍抑制活性(大腸腺腫症APC)、及び核−細胞質輸送(インポーチンα)まで、広範な機能に関与する豊富な真核生物タンパク質である(Coates, J.C., Trends Cell Biol 13: 463-71, 2003)。これらのタンパク質は、キイロショウジョウバエ(Drosophila melanogaster)セグメントポラリティー遺伝子Armadilloの産物中で最初に発見された約42アミノ酸のタンデムリピート単位により特徴づけられる。アルマジロリピートタンパク質はタンパク質−タンパク質相互作用に関与し、アルマジロリピート単位により形成されるドメインは、通常、認識プロセスに関与する。アルマジロリピートドメインは、限定的タンパク質分解により元々定義され、右回り超らせん構造を形成する(βカテニン(Huber A. H. and Nelson W. J., Cell 90: 871-82, 1997)及びインポーチンα(Conti E. et al., Cell 94: 193-204, 1998)の結晶構造により最初に示された通りである)(図1)。リピート単位ごとに3つのαヘリックス(H1、H2、H3と名付けられる)により構成され(図2)、いくつかのリピート単位が積み重なってコンパクトドメインを形成する。特殊化されたリピート単位が、これらのアルマジロリピートドメインのN及びC末端に存在し、恐らくは、本来なら露出されている疎水性コアを保護している(図1)。
【0004】
アルマジロリピートタンパク質とそれらの標的タンパク質との複合体の結晶構造によって、標的の大半が、H3ヘリックスにより形成される表面に沿った溝内の伸長したコンホメーションで結合することが明らかになる(図1及び2)。アスパラギン残基は、H3のC末端部分でのほぼリピート単位毎に保存され、標的の主鎖と接触し、標的側鎖への追加の相互作用が隣接残基により提供される。単一のリピート単位が、一般的に、2つの標的アミノ酸残基との相互作用に関与する。構造的に特徴づけられた他のリピートタンパク質ファミリー(例、TPR,D'Andrea L.D. and Regan D., Trends Biochem Sci 28: 655-62, 2003;アンキリンリピート,Mosavi L. K. et al., Protein Sci 13: 1435-48, 2004;ロイシンリッチリピート,Kob B. and Kajava A. V., Curr Opin Struct Biol 11: 725-32, 2001)の場合と同様に、相互作用は、一般的に、抗体の場合のようなフレキシブルなループ中に存在する残基の代わりに、二次構造エレメントの表面上の残基(図2)により提供される。リピートタンパク質を、結合分子を生成するための足場として使用するための一般的な原理が記載されており(Forrer et al., FEBS Lett. 539(1-3): 2-6, 2003)、設計されたアンキリンリピートタンパク質の場合において、高親和性バインダーを、そのような設計したアンキリンリピートタンパク質ライブラリーから上手く選択した(Binz et al., Nat Biotechnol. 22(5): 575-82, 2004)。
【0005】
アルマジロリピートタンパク質、βカテニン及びインポーチンαなどは、異なる型のペプチドに結合することができ、特定の保存された側鎖又はペプチドの遊離NもしくはC末端との相互作用を必要とせず、ペプチド骨格の一定の結合方法に依存する(図3)。残基ごとにペプチドを認識する可能性は、リピートタンパク質の内因的モジュラー性と合わせて、アルマジロリピートタンパク質を、ペプチド結合のための包括的足場の設計のための有望な候補にする。また、10〜20nMという低い顕著なKが、標的ペプチドの結合についてインポーチンα(Catimel B. et al., J Biol Chem 276: 34189-98, 2001)で報告されており、設計されたアルマジロリピートタンパク質との高いペプチド結合親和性を達成する可能性を示している。
【0006】
このように、本発明の基礎をなす技術的問題は、アルマジロリピートタンパク質に基づく標的特異的なペプチド結合タンパク質の効率的な生成のための新規アプローチを同定することである。この技術的問題への解決法は、特許請求の範囲において特徴付けられる実施態様を提供することにより達成される。
【発明の概要】
【0007】
本発明は、アルマジロリピートタンパク質に基づく標的特異的な設計された結合タンパク質、及びそれらを生成するための方法に関する。設計されたアルマジロリピートタンパク質は、単一のアルマジロリピート単位のコンセンサス配列に基づく。特に、本発明は、アルマジロリピート単位のコンセンサス配列に由来する少なくとも2つの連続リピートモジュールを含む少なくとも1つのリピートドメインを含むアルマジロリピートタンパク質の収集物に関し、ここで該アルマジロリピートタンパク質の少なくとも1つは標的分子に結合することができる。そのような収集物中の設計されたアルマジロリピートタンパク質は、少なくとも1つのアミノ酸位置で互いに異なる。好ましくは、そのような収集物中の設計されたアルマジロリピートタンパク質は、標的相互作用位置に対応する少なくとも1つのアミノ酸位置において互いに異なる。より好ましくは、標的分子は標的(ポリ)ペプチドである。さらにより好ましくは、標的分子は標的(ポリ)ペプチドであり、ここでアルマジロリピートタンパク質により結合した(ポリ)ペプチドの部分は伸長したコンホメーションにある。
【0008】
より具体的には、本発明は、アルマジロリピート配列モチーフ
【表1】


を伴うリピートモジュールを含むアルマジロリピートタンパク質の収集物に関し、ここで「x」は任意のアミノ酸を表示し、「±」は任意のアミノ酸又は欠失を表示し(「±」は位置のナンバリング中でカウントされない)、「a」は無極性側鎖を伴うアミノ酸を表示し、「p」は極性側鎖を伴う残基を表示する。そのような設計されたアルマジロリピートタンパク質の例を以下に記載する。
【0009】
好ましい収集物中で、各リピートモジュールはアミノ酸配列を有し、ここでアミノ酸残基の少なくとも70%が、
(i)少なくとも2つのアルマジロリピート単位の対応する位置で見出されるアミノ酸残基から推定されるコンセンサスアミノ酸残基;又は
(ii)1つのアルマジロリピート単位中の対応する位置で見出されるアミノ酸残基
のいずれかに対応する。
【0010】
好ましくは、そのようなアルマジロリピート単位は天然のアルマジロリピート単位である。
【0011】
本発明の収集物中で、特定のアミノ酸に割り当てるように示されていない位置は無作為化されており、即ち、異なるアミノ酸により占められてよい。特に好ましいのは、アルマジロリピートタンパク質ファミリーの天然メンバー中の対応するアミノ酸位置に存在するアミノ酸に対応するそのような無作為化された位置のアミノ酸である。
【0012】
好ましくは、本発明の設計されたアルマジロリピートタンパク質は、さらに、(内部)リピートモジュールのいずれかとは異なるアミノ酸配列を有するN及び/又はC末端キャッピングモジュールを含む。特に、そのようなN及びC末端キャッピングモジュールはアミノ酸配列を有し、ここで少なくとも50%、好ましくは少なくとも60%、さらにより好ましくは少なくとも70%のアミノ酸残基が、
(i)少なくとも2つの天然のリピート単位又はキャッピング単位の対応する位置で見出されるアミノ酸残基から推定されるコンセンサスアミノ酸残基;又は
(ii)1つの天然のリピート単位又はキャッピング単位中の対応する位置で見出されるアミノ酸残基
のいずれかに対応する。
【0013】
本発明は、さらに、アルマジロリピート配列モチーフを伴うリピートモジュールを含む言及した設計されたリピートタンパク質をコードする核酸分子の収集物、アルマジロリピートタンパク質のそのような収集物を得る方法、標的分子に結合するこれらの収集物からの単一の設計されたアルマジロリピートタンパク質、及びこれらの設計されたアルマジロリピートタンパク質をコードする核酸分子に関する。
【図面の簡単な説明】
【0014】
【図1】アルマジロリピートタンパク質の構造。リボン表示のインポーチンα(PDB ID 1EE5)及びβカテニン(PDB ID 1I7W)。N末端及びC末端キャッピングリピートは、濃い灰色で描写し、それぞれN及びCにより示す。標的ペプチドは黒色であり、棒表示で示す。
【図2】アルマジロリピート単位。リボン表示のアルマジロリピート単位(リピート6、1EE5)の二次構造エレメント:αヘリックスH1、H2、及びH3を示す。標的ペプチドへの結合に関与する位置の残基(標的相互作用残基)を、暗灰色の棒として描写する。これらの標的相互作用残基は、H1中の位置4、H3中の位置26、29、30、33、36、37、40、及び次のリピートのH3とH1の間のループ中の位置41に見出される。
【図3】アルマジロリピートタンパク質の結合様式。アルマジロリピートタンパク質の標的ペプチドとの相互作用の概略図。標的ペプチド(黒色で示す)は、逆平行で、タンパク質のペプチド骨格に関して結合する。N及びCはペプチドのN及びC末端をそれぞれ示し、アミノ酸側鎖をリピートの端に向かって指す棒として示す。rep1、rep2、及びrep3は3つの連続アルマジロリピートを示す。結合に関与するアルマジロリピートの残基は、単一のリピート配列内の特定の位置(rep2中の番号を付けた丸により示す)を占める。位置37の残基はペプチド主鎖の結合に関与し、濃い灰色で描写する;他の位置はペプチド側鎖の認識に関与する。
【図4】設計されたアルマジロリピートタンパク質遺伝子のための組み立て戦略の模式図。内部モジュールC、N末端キャップNy、及びC末端キャップCaからのYCAの構築を例として示す。オリゴヌクレオチド(それらの名称により示す)を、PCRにより内部又は末端キャッピングモジュールに組み立てる。単一モジュールは、ベクター中の挿入のためのBamHI及びKpnIならびにモジュールの連結のためのIIS型制限酵素BsaI及びBpiIのための制限酵素部位を含む。a:アセンブリーPCR、b:BamHI及びKpnIで消化、c:連結、d:BsaIで消化、e:BpiIで消化、f:増幅及び追加の消化/連結サイクル。
【図5】プラスミドpQE30−YCA。YCAタンパク質をコードする遺伝子を含むベクターpQE30の模式図。全ての設計されたアルマジロリピートタンパク質を、同じベクター中に、同じ制限酵素部位(即ち、BamHI及びKpnI)を使用してクローニングした。
【図6】C型モジュールの疎水性コアにおける突然変異の位置。単一のアルマジロリピート中のヘリックスをH1、H2、H3で標識する;突然変異の疎水性コアの位置を球及び対応するアミノ酸位置番号で示す。
【図7】疎水性コア突然変異体の実験的評価:分子ふるいクロマトグラフィー(SEC)での溶出容積及びANS結合時での蛍光放出。番号は、表10に示される突然変異を指す。突然変異タンパク質の各々は、4つの同一の内部リピートならびにキャッピングリピートとしてのNy及びCaを含む。0はYCAタンパク質を示す。全てのタンパク質は約27kDaの分子量を有する。Ala→Thr突然変異は、リピート3中の位置15のmut6、リピート4中の位置31のmut9、リピート1中の位置12のmut10、及びリピート1中の位置15のmut17により運ばれる。Mut8は、リピート4中の位置42に突然変異Gly→Valを有する。mut1(カッコ内)は、その二量体の状態のため、YCA及び他の突然変異体の前に溶出される。全ての他の突然変異体は、多角度光散乱(MALS)により単量体であることが示された。280nmでの吸光度により測定したSEC溶出容積から、及び、蛍光強度により測定したANS(1−アニリノ−ナフタレン−8−スルホン酸)結合からのピーク値を、テストした各タンパク質についてプロットする。測定値における誤差を、6つのタンパク質及び2つの異なる調製物のサブセットで推定しており、SECについて平均標準偏差0.01ml及びANS蛍光強度について平均パーセント誤差4%をもたらす。SECのための参照として、溶出容積(炭酸脱水酵素(CA,MW=29kDa)1.73ml及びウシ血清アルブミン(BSA,MW=66kDa)1.55ml)についてのピーク値を示す。
【図8】選択した設計されたアルマジロリピートタンパク質の特異的な標的結合。選択したクローンと標的ペプチド(nls、配列KKKRKVを有する)、陰性対照ペプチド(cro、配列PRTSSFを有する)、及びNeutrAvidinとの相互作用を、粗抽出物ELISAにより示す。ビオチン化ペプチドをNeutrAvidin上に固定化した。番号は、nls標的ペプチドに対するリボソームディスプレイにおいて選択された単一クローンを指す。A=吸光度及びN=NeutrAvidin暗灰色バーはnlsペプチドへの結合を示し、線を伴う白色バーはcroペプチドへの結合を示し、影付きバーはNeutrAvidinへの結合(バックグラウンド結合)を示す。
【図9】特定モジュールの選択模式図は、既に選択した設計されたアルマジロリピートタンパク質に由来する隣接リピートモジュールを使用した、小さなペプチド標的(例、小さなアミノ酸ストレッチ)に特異的なリピートモジュールの選択のための手順を示す。事前に選択したリピートモジュールは、リピートモジュールライブラリーに隣接し、標的ペプチドへの追加接触を提供し、選択を、標的(ポリ)ペプチド分子の内部部分(例えば、ジペプチド)だけに制限する。A:公知の特異性を伴うリピートモジュールに対応するDNA配列を回収する。1、2、及び3は内部特異的リピートモジュールであり、N及びCはN及びC末端キャッピングリピートである。uは、リピートモジュールDNAの組み立て中に、タンパク質配列に影響を与えることなく導入された唯一の制限酵素部位である。B:DNAフラグメントを、リピートモジュールライブラリー(L)と一緒に、設計されたアルマジロリピートタンパク質をコードする配列中で組み立てる;結果として得られる配列を選択のために使用する。C:新たな特異性を伴う設計されたアルマジロリピートタンパク質を選択時に同定する。工程Aにおいて導入された唯一の制限酵素部位を利用し、選択されたリピートモジュール(4)のDNA配列を回収し、新たに選択されたリピートモジュールの結合特異性を使用した、設計されたアルマジロリピートタンパク質の生成のために使用する。
【図10】直線状ペプチドの認識のための事前に選択されたモジュールの組み合わせ設計されたアルマジロリピートタンパク質によって、短いアミノ酸配列を特異的に認識する単一のリピートモジュールの選択が可能になる。選択されたペプチドに特異的なリピートモジュールを次に組み合わせて、追加選択を実施することなく、より長いペプチドを認識できる新たな設計されたアルマジロリピートタンパク質を形成する。a:ライブラリー、b:選択、c:選択されたバインダー、d:モジュールの組み合わせ、e:組み合わせたバインダー、f:ペプチド標的配列。
【0015】
本発明の詳細な説明
設計されたアルマジロリピートタンパク質に関連するリピートタンパク質についての以下の定義は、特許出願WO 02/20565中のものに基づく。特許出願WO 02/20565は、リピートタンパク質の特性、技術、及び適用の一般的説明をさらに含む。
【0016】
本発明に関連し、「収集物」という用語は、少なくとも2つの異なる実体又はメンバーを含む集団を指す。好ましくは、そのような収集物は、少なくとも10、より好ましくは10を上回る、最も好ましくは10を上回る異なるメンバーを含む。「収集物」は、「ライブラリー」又は「大多数(plurality)」と呼んでもよい。
【0017】
「収集物」は、例えば、タンパク質、(ポリ)ペプチド、又は核酸の集団でありうる。それは、無作為化された核酸分子の確率的混合物又は無作為化された核酸分子によりコードされるタンパク質の混合物でありうるが、しかし、一連の空間的に分離された核酸分子又はタンパク質でもありうる。この二重の意味は、発現ライブラリーの調製及びスクリーニングを扱う分子生物学において使用される「収集物」の標準的意味に対応する。
【0018】
異なるメンバーのタンパク質又は(ポリ)ペプチドの収集物は、少なくとも1つのアミノ酸位置で異なる。好ましくは、メンバーは、標的相互作用位置に対応する少なくとも1つのアミノ酸位置で異なる。異なるメンバーの核酸の収集物は、少なくとも1つの塩基位置で異なる。好ましくは、メンバーは、標的相互作用位置に対応する少なくとも1つの塩基位置で異なる。
【0019】
「リピートタンパク質」という用語は、1つ又は複数のリピートドメインを含む(ポリ)ペプチド/タンパク質を指す。好ましくは、リピートタンパク質の各々は、4つまでのリピートドメインを含む。さらに好ましくは、リピートタンパク質の各々は、2つまでのリピートドメインを含む。最も好ましくは、リピートタンパク質の各々は、1つのリピートドメインを含む。さらに、リピートタンパク質は、追加の非リピートタンパク質ドメイン、(ポリ)ペプチドタグ、及び/又は(ポリ)ペプチドリンカー配列を含みうる。「アルマジロリピートタンパク質」は、約42のアミノ酸の配列モチーフのタンデムな不完全アルマジロリピートを持ち、それは3つのアルファヘリックスからなる。タンデムなアルマジロリピートは一緒に折り畳まれ、互いに広範囲に相互作用し、右巻き超らせんのらせんを形成し、それはタンパク質−タンパク質相互作用のための表面を作製する。アルマジロリピートタンパク質の多くのサブファミリー、例えば、ベータ−カテニン、プラコグロビン、又はインポーチンアルファのサブファミリーが存在する。アルマジロリピートタンパク質及びそれらのサブファミリーは、当業者に周知である(Coates, loc. cit., Andrade et al., loc. cit.)。
【0020】
「設計されたリピートタンパク質」という用語は、限定はされないが、本発明において説明する手順を含む、本発明の手順の結果として得られる「リピートタンパク質」を指す。「設計されたリピートタンパク質」は合成であり、天然から単離されず、又は、天然で見出されない。それらは、対応して設計された核酸の発現により得られる人工タンパク質である。「設計された核酸」は同様に合成(人工)であり、天然から単離されず、又は、天然で見出されない。好ましくは、発現は真核生物又は細菌の細胞中で、又は、無細胞インビトロ発現系の使用により行われる。
【0021】
「(ポリ)ペプチドタグ」という用語は、(ポリ)ペプチド/タンパク質に付着したアミノ酸配列を指し、ここでアミノ酸配列は(ポリ)ペプチド/タンパク質の精製、検出、又は標的化に有用であり、又は、ここでアミノ酸配列は(ポリ)ペプチド/タンパク質の物理化学的挙動を改善し、又は、ここでアミノ酸配列はエフェクター機能を持つ。リピートタンパク質の個々の(ポリ)ペプチドタグ、成分、及び/又はドメインを、互いに直接的に又は(ポリ)ペプチドリンカーを介して結合することができる。
【0022】
「(ポリ)ペプチドリンカー」という用語は、例えば、2つのタンパク質ドメイン、(ポリ)ペプチドタグとタンパク質ドメイン、又は、2つの配列タグを連結できるアミノ酸配列を指す。そのような追加ドメイン、タグ、及びリンカーは当業者に公知である。例のリストを特許出願WO 02/20565の説明において提供する。
【0023】
本発明に関連して、「(ポリ)ペプチド」という用語は、ペプチド結合を介して連結された複数、即ち、2つ又はそれ以上のアミノ酸の1つ又は複数の鎖からなる分子に関する。
【0024】
「タンパク質」という用語は(ポリ)ペプチドを指し、ここで(ポリ)ペプチドの少なくとも部分は、その(ポリ)ペプチド鎖の内部及び/又は間の二次、三次、又は四次構造を形成することにより定義された三次元配置を有する、又は、得ることができる。タンパク質が2つ又はそれ以上の(ポリ)ペプチドを有する場合、個々の(ポリ)ペプチド鎖は非共有結合的又は共有結合的に、例えば、2つの(ポリ)ペプチド間のジスルフィド結合により連結されうる。タンパク質の部分は、二次又は三次構造を形成することにより定義された三次元配置を個々に有する、又は、得ることができ、「タンパク質ドメイン」と呼ばれる。そのようなタンパク質ドメインは当業者に周知である。
【0025】
「リピートドメイン」という用語は、構造単位として2つ又はそれ以上の連続リピート単位(モジュール)を含むタンパク質ドメインを指し、ここで構造単位は同じ折り畳みを有し、そして堅固に積み重なり、例えば、結合疎水性コアを有する超らせん構造を作製する。
【0026】
「構造単位」という用語は、(ポリ)ペプチドの局所的に順序付けられた部分を指し、(ポリ)ペプチド鎖に沿って互いに近い二次構造の2つ又はそれ以上のセグメントの間の三次元相互作用により形成される。そのような構造単位は構造モチーフを含む。「構造モチーフ」という用語は、少なくとも1つの構造単位中に存在する二次構造エレメントの三次元配置を指す。例えば、アルマジロタンパク質中に繰り返して存在する構造モチーフは、三角形のおおよそ3辺を形成する3つのαヘリックスからなる(図2)。構造モチーフは当業者に周知である。構造単位単独では定義された三次元配置を得ることはできない;しかし、リピートドメイン中でのリピートモジュールとしてのそれらの連続配置は、隣接単位の相互安定化を導き、超らせん構造をもたらす。
【0027】
「リピート単位」という用語は、1つ又は複数の天然タンパク質の配列モチーフを含むアミノ酸配列を指し、ここで「リピート単位」は複数のコピーで見出され、タンパク質の折り畳みを決定する全てのモチーフに共通する定義された折り畳みトポロジーを示す。そのようなリピート単位は、フレームワーク残基及び相互作用残基を含む。そのようなリピート単位の例は、アルマジロリピート単位は別として、ロイシンリッチリピート単位、アンキリンリピート単位、テトラトリコペプチドリピート単位、HEATリピート単位、及びロイシンリッチ変異体リピート単位を含む。2つ又はそれ以上のそのようなリピート単位を含む天然タンパク質は、「天然リピートタンパク質」と呼ばれる。リピートタンパク質の個々のリピート単位のアミノ酸配列は、互いに比較された場合、有意な数の突然変異、置換、付加、及び/又は欠失を有しうるが、リピート単位の一般的なパターン、又はモチーフを依然として実質的に保持する。
【0028】
「フレームワーク残基」という用語は、リピート単位のアミノ酸残基、又はリピートモジュールの対応するアミノ酸残基に関し、折り畳みトポロジーに寄与し、即ち、リピート単位(又はモジュール)の折り畳みに寄与する、又は、隣接単位(又はモジュール)との相互作用に寄与する。そのような寄与は、リピート単位(モジュール)中の他の残基との相互作用、あるいはαヘリックス又はβシート、又は直線状ポリペプチドもしくはループを形成するアミノ酸ストレッチで見出されるポリペプチド骨格の立体構造への影響でありうる。
【0029】
「標的相互作用残基」という用語は、リピート単位のアミノ酸残基、又はリピートモジュールの対応するアミノ酸残基を指し、標的物質との相互作用に寄与する。そのような寄与は、標的物質との直接的な相互作用、又は他の直接的に相互作用する残基への影響(例、リピート単位(モジュール)の(ポリ)ペプチドの立体構造を安定化し、標的と直接的に相互作用する残基の相互作用を可能にする又は増強することによる)でありうる。そのようなフレームワーク残基及び標的相互作用残基は、上に言及する物理化学的方法により得られる構造データの分析により、又は、構造生物学及び/又は生物情報学の実践者に周知である公知の及び関連する構造情報との比較により同定してよい。
【0030】
好ましくは、リピート配列モチーフの推定に使用するリピート単位は相同なリピート単位であり、ここでリピート単位は同じ構造モチーフを含み、ここでリピート単位のフレームワーク残基の70%超が相同である。好ましくは、リピート単位のフレームワーク残基の80%超が相同である。より好ましくは、リピート単位のフレームワーク残基の90%超が相同である。ポリペプチドの間の相同性のパーセントを決定するためのコンピュータプログラム(Fasta、Blast、又はGapなど)は、当業者に公知である。
【0031】
「リピート配列モチーフ」という用語はアミノ酸配列を指し、1つ又は複数のリピート単位から推定される。そのようなリピート配列モチーフは、フレームワーク残基位置及び標的相互作用残基位置を含む。フレームワーク残基位置は、リピート単位のフレームワーク残基の位置に対応する。同様に、標的相互作用残基位置は、リピート単位の標的相互作用残基の位置に対応する。リピート配列モチーフは、固定化された位置及び無作為化された位置を含む。「固定化された位置」という用語は、リピート配列モチーフ中のアミノ酸位置を指し、ここで位置は特定のアミノ酸に設定される。ほとんどの場合、そのような固定化された位置は、フレームワーク残基の位置に対応する。「無作為化された位置」という用語は、リピート配列モチーフ中のアミノ酸位置を指し、ここで2つ又はそれ以上のアミノ酸がアミノ酸位置で可能であり、例えば、ここで通常の20の天然アミノ酸のいずれかが可能であり、又はここで20の天然アミノ酸の大半が可能であり、例えば、システイン以外のアミノ酸、又はグリシン以外のアミノ酸、システイン及びプロリンであり、以下に詳細に説明される通りである。ほとんどの場合、そのような無作為化された位置は、標的相互作用残基の位置に対応する。しかし、フレームワーク残基の一部の位置も無作為化してよい。アミノ酸配列モチーフは、当業者に周知である。
【0032】
「折り畳みトポロジー」という用語は、リピート単位の三次構造を指す。折り畳みトポロジーは、αヘリックス又はβシートの少なくとも一部を形成するアミノ酸のストレッチ、又は直線状ポリペプチド又はループを形成するアミノ酸ストレッチ、又はαヘリックス、βシート、及び/又は直線状ポリペプチド/ループの任意の組み合わせにより決定される。
【0033】
「連続」という用語は配置を指し、ここで以下に記載するリピート単位又はリピートモジュールがタンデムに配置される。設計されたリピートタンパク質中に、少なくとも2つ、通常は約2〜6、特に少なくとも約6、高頻度には20又はそれ以上のリピート単位が存在する。大半の場合において、リピート単位は、高度の配列同一性(対応する位置での同じアミノ酸残基)又は配列類似性(アミノ酸残基は異なるが、しかし、類似の物理化学的特性を有する)を示し、アミノ酸残基の一部は天然タンパク質で見出される異なるリピート単位で強く保存されている重要残基でありうる。しかし、アミノ酸の挿入及び/又は欠失、及び/又は置換による天然タンパク質で見出される異なるリピート単位の間での高度な配列変動性は、共通の折り畳みトポロジーが維持される限り可能である。
【0034】
物理化学的手段(X線結晶学、NMR、又はCD分光測定など)によりリピートタンパク質の折り畳みトポロジーを直接的に決定するための方法が、当業者に周知である。リピート単位又はリピート配列モチーフを同定及び決定するため、又は、そのようなリピート単位又はモチーフを含む関連タンパク質のファミリーを同定するための方法、例えば、ホモロジー検索(BLASTなど)は、生物情報学の分野において十分に確立されており、当業者に周知である。初期リピート配列モチーフを改良する工程は、反復プロセスを含みうる。
【0035】
「リピートモジュール」という用語は、本発明の設計されたリピートタンパク質の繰り返しアミノ酸配列を指し、天然のアルマジロリピートタンパク質のリピート単位(図2)に由来する。リピートドメイン中に含まれる各リピートモジュールは、天然のアルマジロリピートタンパク質のファミリー又はサブファミリーの1つ又は複数のリピート単位に由来する。
【0036】
「天然リピートタンパク質のファミリー」という用語は、天然リピートタンパク質のグループを指し、ここでグループのメンバーは類似のリピート単位を含む。「サブファミリー」という用語は、天然リピートタンパク質のファミリーのサブグループを指す。
【0037】
「リピートモジュール」は、対応するリピートモジュールの全てのコピー中に存在するアミノ酸残基を伴う位置(「固定化された位置」)及び異なる又は「無作為化された」アミノ酸残基を伴う位置(「無作為化された位置」)を含みうる。
【0038】
「少なくとも1つの位置で異なる」という用語は、設計されたリピートタンパク質の収集物を指し、少なくとも1つの位置を有し、ここで1つを超えるアミノ酸が収集物の異なるリピートタンパク質で見出されうる。好ましくは、そのような位置は無作為化される。好ましくは、無作為化された位置は、追加で、1つの設計されたリピートドメイン内のリピートモジュール間で変動する。好ましくは、そのような位置は十分に無作為化されうる、即ち、完全な一連の天然タンパク新生アミノ酸残基により占められる。より好ましくは、そのような位置は部分的に無作為化されうる、即ち、完全な一連の天然アミノ酸残基のサブセットにより占められる。アミノ酸残基のサブセットは、共通の物理化学的特性を伴う一連のアミノ酸残基、例えば一連の疎水性、親水性、酸性、塩基性、芳香族、又は脂肪族アミノ酸、特定の非所望のアミノ酸残基を除く全てを含むサブセット、例えばシステイン又はプロリンを含まないセット、又は天然リピートタンパク質中の対応する位置で見出される全てのアミノ酸残基を含むサブセットでありうる。無作為化は、標的相互作用残基の一部、好ましくは全てに適用してよい。「無作為化された」リピートタンパク質を作るための方法、例えば、リピートタンパク質をコードする核酸配列のオリゴヌクレオチド特異的突然変異誘発(oligonucleotide−directed mutagenesis)(例、モノヌクレオチド又はトリヌクレオチドの混合物の使用)の使用、又は核酸配列の合成中でのエラープローンPCR(error−prone PCR)の使用は当業者に周知である。位置のさらに好ましい少なくとも1つは、標的相互作用位置に対応する。
【0039】
「標的分子」という用語は、核酸分子、(ポリ)ペプチドもしくはタンパク質、炭水化物、又は任意の他の天然分子(そのような個々の分子の任意の一部、又は2つもしくはそれ以上のそのような分子の複合体を含む)などの個々の分子を指す。標的は、全細胞又は組織のサンプルでよく、又は、それは任意の非天然分子もしくは成分でよい。好ましくは、標的分子は、化学修飾(例えば、天然もしくは非天然のリン酸化、アセチル化、又はメチル化による修飾)を含む天然もしくは非天然(ポリ)ペプチド又は(ポリ)ペプチドである。
【0040】
「コンセンサス配列」という用語はアミノ酸配列を指し、ここでコンセンサス配列は複数のリピート単位の構造的及び/又は配列アラインメントにより得られる。2つ又はそれ以上の構造的及び/又は配列アラインメントリピート単位を使用し、そしてアラインメントでのギャップを可能にすることで、各位置で最も高頻度なアミノ酸残基を決定することが可能である。コンセンサス配列は、各位置で最も高頻度に表わされるアミノ酸を含む配列である。2つ又はそれ以上のアミノ酸が平均を上回り単一の位置で表わされる事象では、コンセンサス配列はそれらのアミノ酸のサブセットを含みうる。2つ又はそれ以上のリピート単位は、単一のリピートタンパク質に含まれるリピート単位から、又は、2つもしくはそれ以上の異なるリピートタンパク質から取ってよい。
【0041】
コンセンサス配列及びそれらを決定するための方法は、当業者に周知である。
【0042】
「コンセンサスアミノ酸残基」は、コンセンサス配列中の特定の位置で見出されるアミノ酸である。2つ又はそれ以上、例、3、4、又は5つのアミノ酸残基が、2つ又はそれ以上のリピート単位において類似の確率で見出される場合、コンセンサスアミノ酸は、最も高頻度で見出されるアミノ酸の1つ、又は、2つもしくはそれ以上のアミノ酸残基の組み合わせでありうる。
【0043】
「アルマジロリピート単位のコンセンサス配列に由来するリピートモジュール」という用語は、以下
(i)以下の工程を含むプロセス:
(a)アルマジロリピート単位のコンセンサス配列の決定;
(b)初期アルマジロリピート配列モチーフの決定であって、ここで配列モチーフのフレームワーク残基が(a)のコンセンサス配列の最も保存されたコンセンサスアミノ酸に設定され、配列モチーフの標的相互作用残基の位置が(b)のコンセンサス配列のそれほど保存されていない位置に対応する;
(c)リピート単位のコンピュータ設計、配列分析、及び/又は構造分析による(b)のリピート配列モチーフの改良;及び
(d)(c)のリピート配列モチーフに従ったリピートモジュールの構築;又は
(ii)(i)のプロセスを含むプロセスであって、コンピュータ設計及び/又はランダム突然変異誘発もしくはランダムキメラ形成による進化によるリピートモジュールのさらなる改良が続く
により入手可能なリピートモジュールを指す。
【0044】
しかし、「アルマジロリピート単位のコンセンサス配列に由来するリピートモジュール」という用語は、記載のプロセスにより得られるリピートモジュールに制限されない。本発明の記載において提供する情報に基づき、さらなるリピートモジュールを、記載する特別なプロセスを繰り返すことなく、デノボで設計することが現在可能であり、そして「アルマジロリピート単位のコンセンサス配列に由来するリピートモジュール」という用語は、本明細書で提供する情報を使用してデノボで設計されたそのようなモジュールも含み、そしてデノボで設計されたモジュールは、次に合成され、さらにコンピュータ設計及び/又はランダム突然変異誘発及び/又はランダムキメラ形成による設計されたリピートモジュールの進化によりさらに改良されることが理解される。
【0045】
「伸長したコンホメーションのポリペプチド」という用語は、二次構造エレメントを有さないコンホメーションにあるアミノ酸の連続ストレッチを意味する。好ましくは、アミノ酸のストレッチのペプチド結合でのファイ及びプサイ角度は120°を上回る。さらにより好ましくは、角度は140°、160°、又は170°を上回る。
【0046】
好ましい実施態様は、アルマジロリピート配列モチーフ
【表2】


を伴うリピートモジュールを含むアルマジロリピートタンパク質の収集物であって、ここで「x」は任意のアミノ酸を示し、「±」は任意のアミノ酸又は欠失を示し(「±」は位置の通常のナンバリングにおいてカウントされないが、しかし、カッコ中の位置番号に含まれる)、「a」は非極性側鎖を伴うアミノ酸、特に残基A、F、G、I、L、M、P、T、V、W、及びYのいずれかを示し、そして「p」は極性側鎖を伴う残基、特に残基A、C、D、E、G、H、K、N、P、Q、R、S、T、及びYを示す。
【0047】
さらなる好ましい実施態様はアルマジロリピートタンパク質の収集物であって、リピートタンパク質はアルマジロリピート配列モチーフ
【表3】


を伴うリピートモジュールを含み、ここで「x」は任意のアミノ酸を示し、「a」は非極性側鎖を伴うアミノ酸を示し、そして「p」は極性側鎖を伴う残基を示す。
【0048】
さらなる好ましい実施態様はアルマジロリピートタンパク質の収集物であって、ここでリピートドメインのリピートモジュールの全てがアルマジロリピートタンパク質の特定のサブファミリーのリピート単位のコンセンサス配列に由来する。好ましくは、アルマジロリピートタンパク質のサブファミリーは、ベータ−カテニン、プラコグロビン、又はインポーチンアルファのサブファミリーのいずれかである。
【0049】
さらなる好ましい実施態様において、リピートモジュールの各々がアミノ酸配列を有し、ここで少なくとも70%のアミノ酸残基が以下
(i)少なくとも2つのリピート単位の対応する位置で見出されるアミノ酸残基から推定されるコンセンサスアミノ酸残基;又は
(ii)1つのリピート単位中の対応する位置で見出されるアミノ酸残基。好ましくは、そのようなリピート単位は天然アルマジロリピート単位である
のいずれかに対応する。
【0050】
特に好ましくは収集物であって、ここでリピートモジュールの各々が配列モチーフ
【表4】


を含み、ここで「x」は任意のアミノ酸を示し、「a」は残基A、F、G、I、L、M、P、T、V、W、及びYのいずれかを示し、そして「p」は残基A、C、D、E、G、H、K、N、P、Q、R、S、T、及びYのいずれかを示す。
【0051】
さらにより好ましくは収集物であって、ここでリピートモジュールの各々が配列モチーフ
【表5】


を含み、ここで「1」及び「2」は任意のアミノ酸残基を表わす。このリピート配列モチーフはI型と呼ばれる。完全コンセンサス配列I型を配列番号1及び表3に示す。以下の実施例2では、どのようにコンセンサス配列がインポーチンαサブファミリーのアルマジロリピートタンパク質からの133のリピート配列に由来したか(故にI型)、次にインポーチンα結晶構造の分析に基づいて適用された修飾、これに起因する構造的意味、フレームワーク残基及び標的相互作用残基の推定位置、及びI型モジュールの使用目的を詳細に説明する。好ましくは、「1」はE、H、I、K、Q、R、及びTからなる群より選択されるアミノ酸残基を表わし、そして「2」はA、D、E、F、H、I、K、L、M、N、Q、R、S、T、V、W、及びYからなる群より選択されるアミノ酸残基を表わす。
【0052】
また、特に好ましくは収集物であって、ここでリピートモジュールの各々が配列モチーフ
【表6】


を含み、ここで「x」は任意のアミノ酸を示し、「a」は残基A、F、G、I、L、M、P、T、V、W、及びYのいずれかを示し、そして「p」は残基A、C、D、E、G、H、K、N、P、Q、R、S、T、及びYのいずれかを示す。
【0053】
さらにより好ましくは収集物であって、ここでリピートモジュールの各々が配列モチーフ
【表7】


を含み、ここで「1」及び「2」が任意のアミノ酸残基を表わす。このリピート配列モチーフはT型と呼ばれる。完全コンセンサス配列T型を配列番号2及び表3に示す。以下の実施例3では、どのようにコンセンサス配列がβカテニン/プラコグロビンサブファミリーのアルマジロリピートタンパク質からの110のリピート配列に由来したか(T型)、次にβカテニン結晶構造の分析に基づいて適用された修飾、これに起因する構造的意味、フレームワーク残基及び標的相互作用残基の推定位置、及びT型モジュールの使用目的を詳細に説明する。好ましくは、「1」はE、H、I、K、Q、R、及びTからなる群より選択されるアミノ酸残基を表わし、そして「2」はA、D、E、F、H、I、K、L、M、N、Q、R、S、T、V、W、及びYからなる群より選択されるアミノ酸残基を表わす。
【0054】
また、特に好ましくは収集物であって、ここでリピートモジュールの各々が配列モチーフ
【表8】


を含み、ここで「x」は任意のアミノ酸を示し、「a」は残基A、F、G、I、L、M、P、T、V、W、及びYのいずれかを示し、そして「p」は残基A、C、D、E、G、H、K、N、P、Q、R、S、T、及びYのいずれかを示す。
【0055】
さらにより好ましくは収集物であって、ここでリピートモジュールの各々が配列モチーフ
【表9】


を含み、ここで「1」及び「2」が任意のアミノ酸残基を表わす。このリピート配列モチーフはC型と呼ばれる。完全コンセンサス配列C型を配列番号3及び表3に示す。以下の実施例1では、どのようにコンセンサス配列がインポーチンα及びβカテニン/プラコグロビンサブファミリーのアルマジロリピートタンパク質からの243のリピート配列に由来したか(C型)、次にインポーチンα及びβカテニンの利用可能な結晶構造の分析及び標的ペプチドとの複合体の分析に基づいて適用された修飾、これに起因する構造的意味、フレームワーク残基及び標的相互作用残基の推定位置、及びC型モジュールの使用目的を詳細に説明する。好ましくは、「1」はE、H、I、K、Q、R、及びTからなる群より選択されるアミノ酸残基を表わし、そして「2」はA、D、E、F、H、I、K、L、M、N、Q、R、S、T、V、W、及びYからなる群より選択されるアミノ酸残基を表わす。
【0056】
また、特に好ましくは収集物であって、ここでリピートモジュールの各々が配列モチーフ
【表10】


を含み、ここで「x」は任意のアミノ酸を示し、「s」は残基A、I、L、V、及びGからなる群より選択されるアミノ酸残基を表わし、そして「h」は残基A、I、L、及びVからなる群より選択されるアミノ酸残基を表わす。
【0057】
さらにより好ましくは収集物であって、ここでリピートモジュールの各々が配列モチーフ
【表11】


を含み、ここで「1」及び「2」が任意のアミノ酸残基を表わす。このリピート配列モチーフはM型と呼ばれる。完全コンセンサス配列M型を配列番号4及び表3に示す。以下の実施例4では、C型モジュールが、改善された疎水性コアを伴うM型モジュールを作製する意図で、「回転異性体サンプリング」アプローチを使用したコンピュータ方法によりさらに開発されたことを詳細に説明する。好ましくは、「1」はE、H、I、K、Q、R、及びTからなる群より選択されるアミノ酸残基を表わし、そして「2」はA、D、E、F、H、I、K、L、M、N、Q、R、S、T、V、W、及びYからなる群より選択されるアミノ酸残基を表わす。
【0058】
さらにより好ましくは、位置26及び29のアミノ酸はK又はQのいずれかである。最も好ましくは、位置29のアミノ酸はQである。
【0059】
本発明の収集物のさらなる好ましい実施態様では、上に記載するリピートモジュール中の1つ又は複数のアミノ酸残基を、アルマジロリピート単位中の対応する位置で見出されるアミノ酸残基により交換する。好ましくは、30%までのアミノ酸残基を交換し、より好ましくは、20%まで、さらにより好ましくは、10%までのアミノ酸残基を交換する。より好ましくは、そのようなアルマジロリピート単位は天然アルマジロリピート単位である。さらに別の特定の実施態様では、30%までのアミノ酸残基、より好ましくは、20%まで、さらにより好ましくは、10%までのアミノ酸残基を、アルマジロリピート単位の対応する位置で見出されないアミノ酸と交換する。
【0060】
「リピートモジュールの型」という用語は、モジュールの長さ、その「固定化された位置」ならびにその「無作為化された位置」の数及び組成により決定されるモジュールの特徴を指す。「異なる型のモジュール」は、1つ又は複数の特徴において異なりうる。異なる「型」は、同じ構造モチーフを含むリピート単位に由来するが、しかし、型はフレームワーク位置において異なる。型は以下:
(a)既存のモジュール又は型からのランダム突然変異誘発又はランダムキメラ形成;
(b)サブファミリーを含む、配列アラインメントのための異なる配列セットの選択;
(c)合理的な設計による既存のモジュール又は型の修飾;及び/又は
(d)コンピュータ方法による既存のモジュール又は型の修飾
により生成できる。
【0061】
特に好ましいのは、4つの型のリピートモジュール(上に定義するI型、T型、C型、及びM型と名付ける)のいずれか1つからなるリピートドメインを含むアルマジロリピートタンパク質の収集物である。さらに好ましくは収集物であって、ここでリピートドメイン中に含まれるリピートモジュールのアミノ酸配列が、無作為化された残基を除く言及した型の各々について同一である。
【0062】
本発明の収集物のさらに好ましい実施態様において、リピートドメインの各々は、リピートモジュールの任意の1つとは異なるアミノ酸配列を有するN及び/又はC末端キャッピングモジュールをさらに含む。好ましくは、N末端キャッピングモジュールには非ライブラリーリピートモジュールが続き、及び/又は、C末端キャッピングモジュールには非ライブラリーリピートモジュールが先行する。
【0063】
「非ライブラリーリピートモジュール」という用語は、ライブラリーリピートモジュールではないリピートモジュールを指す。非ライブラリーリピートモジュールは固定化された位置だけを含む。好ましくは、非ライブラリーリピートモジュールは、リピートドメインの熱力学的安定性を増加させる。
【0064】
「ライブラリーリピートモジュール」という用語は、リピートモジュールライブラリーから得られる、又は、選択される単一のリピートモジュールを指す。「リピートモジュールライブラリー」という用語は、本発明に従って産生されるリピートモジュールのライブラリーを指す。
【0065】
「キャッピングモジュール」という用語は、リピートドメインのN又はC末端リピートモジュールに融合したポリペプチドを指し、ここでキャッピングモジュールはリピートモジュールと強固な三次相互作用を形成し、それにより連続リピートモジュールと接触しない側で溶媒からリピートモジュールの疎水性コアを遮蔽するキャップを提供する。N及び/又はC末端キャッピングモジュールは、キャッピング単位(図1)又はリピート単位に隣接する天然リピートタンパク質中で見出される他のドメインでありうる、又は、それに由来しうる。「キャッピング単位」という用語は天然の折り畳まれた(ポリ)ペプチドを指し、ここで(ポリ)ペプチドはリピート単位のN又はC末端に融合した特定の構造単位を定義し、そしてここで(ポリ)ペプチドはリピート単位と強固な三次相互作用を形成し、それにより一方の側のリピート単位の疎水性コアを溶媒から遮蔽するキャップを提供する。そのようなキャッピング単位はリピート配列モチーフと配列類似性を有しうる。以下の実施例1では、どのようにキャッピング配列がアルマジロリピートタンパク質の天然キャッピングリピートに由来し、そして、本発明の設計されたリピートタンパク質の使用目的に適応されうるかを、結晶構造及び標的タンパク質結合複合体からの情報を考慮に入れて詳細に説明する。別のアプローチではC型モジュールを開始点として使用し、露出した疎水性残基を、天然配列及び結晶構造に由来するモデルに基づく親水性残基と置換する。
【0066】
好ましくは、N及び/又はC末端キャッピングモジュールの各々はアミノ酸配列を有し、ここで少なくとも50%、好ましくは少なくとも60%、さらにより好ましくは少なくとも70%のアミノ酸残基が、以下
(i)少なくとも2つのリピート単位又はキャッピング単位の対応する位置で見出されるアミノ酸残基から推定されるコンセンサスアミノ酸残基;又は
(ii)1つのリピート単位又はキャッピング単位中の対応する位置で見出されるアミノ酸残基。より好ましくは、そのようなリピート単位又はキャッピング単位は天然リピート単位又はキャッピング単位である
のいずれかと対応する。
【0067】
好ましい実施態様において、N末端キャッピングモジュールは配列モチーフ
【表12】


を含む。このリピートN末端キャッピングモジュール配列モチーフをNyと呼ぶ(配列番号5)。N末端キャッピングモジュールNyは、S. cerevisiaeのインポーチンαのN末端キャッピング単位に由来し(UniProt entry IMA1_YEAST、残基88−119)、隣接リピートモジュールへの結合のための最後の2つの残基の修飾を伴う。
【0068】
N末端キャッピングモジュールのための第2の好ましい実施態様は、配列モチーフ
【表13】


を含む。このリピートN末端キャッピングモジュール配列モチーフをNaと呼ぶ(配列番号6)。N末端キャッピングモジュールNaは、本発明のC型リピートモジュールに由来し、C型リピートモジュールがアルマジロリピートドメインのN末端に置かれた場合、本来なら溶媒に露出される疎水性残基の交換による。詳細な説明を実施例1に提供する。
【0069】
C末端キャッピングモジュールのための好ましい実施態様は、配列モチーフ
【表14】


を含む。このリピートC末端キャッピングモジュール配列モチーフをCaと呼ぶ(配列番号7)。C末端キャッピングモジュールCaは、本発明のC型リピートモジュールに由来し、C型リピートモジュールがリピートドメインのC末端に置かれた場合、本来なら溶媒に露出される疎水性残基の交換による。詳細な説明を実施例1に提供する。
【0070】
C末端キャッピングモジュールのための第2の好ましい実施態様は、配列モチーフ
【表15】


を含む。このリピートC末端キャッピングモジュール配列モチーフをCyと呼ぶ(配列番号8)。C末端キャッピングモジュールCyは、S. cerevisiaeのインポーチンαのC末端キャッピング単位に由来し(UniProt entry IMA1_YEAST、残基468−510)、隣接リピートモジュールへの結合のための最初の残基の修飾を伴う。
【0071】
C末端キャッピングモジュールのための第3の好ましい実施態様は、配列モチーフ
【表16】


を含む。このリピートC末端キャッピングモジュール配列モチーフをCmと呼ぶ(配列番号9)。C末端キャッピングモジュールCmは、C末端キャッピングモジュールCyに由来し、システインのアラニンによる交換及び最初の3つのアミノ酸の除去による。
【0072】
本発明の収集物のさらなる好ましい実施態様では、上に記載するリピートモジュール中の1つ又は複数のアミノ酸残基を、アルマジロリピート単位中の対応する位置で見出されるアミノ酸残基により交換する。好ましくは、30%までのアミノ酸残基を交換し、より好ましくは、20%まで、さらにより好ましくは、10%までのアミノ酸残基を交換する。最も好ましくは、そのようなリピート単位又はキャッピング単位は、天然のアルマジロリピート単位又はキャッピング単位である。さらに別の特定の実施態様では、30%までのアミノ酸残基、より好ましくは、20%まで、さらにより好ましくは、10%までのアミノ酸残基を、アルマジロリピート単位又はキャッピング単位の対応する位置で見出されないアミノ酸と交換する。
【0073】
本発明は、さらに、本発明において記載する設計されたリピートタンパク質、リピートタンパク質の対応するリピートドメインもしくはリピートドメインの部分、又は対応する単一リピートモジュール及びキャッピングモジュールの収集物をコードする核酸分子の収集物に関する。特に、上に記載する設計されたリピートタンパク質の収集物をコードする核酸分子の収集物を考察する。
【0074】
「核酸分子」という用語はポリヌクレオチド分子を指し、一本鎖又は二本鎖のいずれかのリボ核酸(RNA)又はデオキシリボ核酸(DNA)分子である。核酸分子は、単離形態で、又は、組換え核酸分子もしくはベクター中に含まれて存在しうる。
【0075】
上に記載するアルマジロリピートタンパク質の収集物をコードする核酸分子の収集物を、当技術分野の標準的方法により、ペプチド配列をDNA配列に逆翻訳し、そして発現のための目的の宿主細胞でのコドン使用を最適化する、例えば、大腸菌での発現を最適化することにより得てよい。DNA配列の段階で、上に記載するリピートモジュール及びキャッピングモジュールを、容易に組み合わせ、再配列し、又は、さらに操作して、所望のリピートタンパク質をコードするDNA配列を与えてよい。手順の例示を、以下の実施例1に見出すことができる。
【0076】
さらなる実施態様では、本発明は、設計されたアルマジロリピートタンパク質又は本発明において記載するアルマジロリピートタンパク質の収集物の対応するリピートドメインに関する。特に、上に記載するアルマジロリピートタンパク質の収集物の設計されたアルマジロリピートタンパク質を考察する。
【0077】
好ましくは、そのような設計されたアルマジロリピートタンパク質又はリピートドメインは、事前に決定された特性を有する。
【0078】
本発明に関連して、「事前に決定された特性」という用語は、リピートタンパク質の収集物からのリピートタンパク質の1つが有するはずであり、そして収集物のスクリーニング及び/又は選択のための基礎を形成する特性を指す。そのような特性は、標的への結合、標的のブロッキング、標的媒介性反応の活性化、酵素活性、及びさらなる特性などの特性を含み、当業者に公知である。所望の特性の型に依存して、当業者は、スクリーニング及び/又は選択を実施するためのフォーマット及び必要な工程を特定できる。好ましくは、事前に決定された特性は標的への結合である。
【0079】
より好ましくは、そのような設計されたアルマジロリピートタンパク質又はリピートドメインは、標的分子に結合することができ、設計されたリピートタンパク質が所定のリガンドへの検出可能な親和性を有することを意味する。
【0080】
さらに好ましくは、そのような設計されたアルマジロリピートタンパク質又はリピートドメインは、非天然アルマジロリピートタンパク質又は非天然リピートドメインである。
【0081】
「非天然」という用語は、合成又は天然からではないことを意味し、より具体的には、この用語はヒトの手製を意味する。「非天然リピートタンパク質」又は「非天然リピートドメイン」という用語は、リピートタンパク質又はリピートドメインが合成であり、天然からではないことを意味する。「非天然リピートタンパク質」又は「非天然リピートドメイン」はそれぞれ人工のタンパク質又はドメインであり、対応する設計された核酸の発現により得られる。好ましくは、発現は真核細胞又は細菌細胞中で、又は、無細胞インビトロ発現系の使用により行われる。さらに、用語は、リピートタンパク質又はリピートドメインの配列が、配列データベース中、例えば、GenBank、Embl−Bank、又はSwissprot中の非人工配列エントリーとして存在しないことを意味する。これらのデータベース及び他の類似の配列データベースは当業者に周知である。
【0082】
さらに、上で言及した設計されたアルマジロリピートタンパク質又は対応するリピートドメインの1つ又は複数及び場合により薬学的に許容可能な担体及び/又は希釈剤を含む薬学的組成物を考察する。薬学的に許容可能な担体及び/又は希釈剤は当業者に公知である。さらに、上で言及した設計されたアルマジロリピートタンパク質又は対応するリピートドメインの1つ又は複数を含む診断用組成物を考察する。
【0083】
さらなる実施態様では、本発明は、特定の設計されたアルマジロリピートタンパク質をコードする核酸分子に関する。
【0084】
さらなる実施態様では、本発明は、標的分子に結合することができる本発明の設計されたアルマジロリピートタンパク質を得るための方法に関し、以下の工程
(a)本発明の設計されたアルマジロリピートタンパク質の収集物をコードする核酸分子の収集物の提供;
(b)設計されたアルマジロリピートタンパク質の収集物を提供するための工程(a)の収集物の発現;及び
(c)設計されたアルマジロリピートタンパク質の収集物のスクリーニング及び/又は標的分子に結合することができる少なくとも1つの設計されたアルマジロリピートタンパク質を得るための設計されたアルマジロリピートタンパク質の収集物からの選択
を含む。
【0085】
以下の実施例5及び6には、本発明の設計されたアルマジロリピートタンパク質の収集物をコードする核酸のライブラリー(収集物)をどのようにして得ることができるか、及び、それらをスクリーニング及び選択のためにどのように使用してよいかを記載する。
【0086】
本発明の設計されたアルマジロリピートタンパク質の収集物を、使用するスクリーニング及び/又は選択系に従ったいくつかの方法により発現させてよく、そして方法、例えばバクテリオファージ(WO 90/02809)又は細菌細胞(WO 93/10214)の表面上でのディスプレイ、リボソームディスプレイ(WO 98/48008)、プラスミド上でのディスプレイ(WO 93/08278)などの使用を含んでよく、又は、共有結合したRNA−リピートタンパク質ハイブリッドコンストラクト(WO 00/32823)、もしくはタンパク質相補アッセイ(WO 98/341120)などによる細胞内発現及び選択/スクリーニングによる。全てのこれらの方法では、本発明の設計されたアルマジロリピートタンパク質を、核酸分子の対応する収集物の発現及び設計されたアルマジロリピートタンパク質の続くスクリーニング、それに続く、設計されたアルマジロリピートタンパク質に関連する遺伝情報を介した標的分子への結合能を有する1つ又は複数の設計されたアルマジロリピートタンパク質の同定により提供する。
【0087】
好ましい実施態様では、標的分子は、天然もしくは非天然の(ポリ)ペプチド又は化学修飾を含む、例えば、天然もしくは非天然のリン酸化、アセチル化、もしくはメチル化により修飾された(ポリ)ペプチドである。
【0088】
さらなる好ましい実施態様では、本発明は、標的(ポリ)ペプチドに結合することができる本発明の設計されたアルマジロリピートタンパク質を得るための方法に関する。設計されたアルマジロリピートタンパク質は、原則として標的(ポリ)ペプチドの小部分ごとに同じである一般的な結合様式を提供し、伸長したコンホメーションのペプチドのモジュラー認識を可能にする。方法によって、標的(ポリ)ペプチドの部分を認識する一連のモジュールを生成し、追加選択を実施することなくそのようなモジュールを組み合わせることが可能になる。方法は以下の工程
(a)標的(ポリ)ペプチドの結合部分に関与する単一のリピートモジュールに対応する核酸配列の推定又は入手;
(b)本発明の設計されたアルマジロリピートタンパク質をコードし、工程(a)に由来する核酸配列を含む核酸分子の構築;
(c)工程(b)に由来する核酸分子からの設計されたアルマジロリピートタンパク質の発現;及び
(d)設計されたアルマジロリピートタンパク質のスクリーニング及び/又は標的(ポリ)ペプチドに結合することができる少なくとも1つの設計されたアルマジロリピートタンパク質を得るための設計されたアルマジロリピートタンパク質からの選択
を含む。
【0089】
「標的(ポリ)ペプチドの部分」という用語は、限定はされないが、標的(ポリ)ペプチドアミノ酸配列に属するジペプチド、トリペプチド、又はテトラペプチドなどのアミノ酸配列を指す。好ましくは、標的(ポリ)ペプチドのこれらの部分は近接する。「近接する」という用語は、(ポリ)ペプチドの一次配列中の他のアミノ酸により分離されていないアミノ酸配列を指す。
【0090】
最も好ましくは、標的(ポリ)ペプチド又は標的(ポリ)ペプチドの部分は、二次構造エレメントの形成に関与しない。
【0091】
この方法をどのように行うことができるのかについての詳細な説明を、実施例7ならびに図9及び10に提供する。リピートモジュール、キャッピングリピートモジュール、及びリピートドメインの生成及び組み合わせに関する技術的な詳細が、特許出願WO 02/20565及び本発明の実施例に記載されており、及び/又は、当業者に公知である。
【0092】
特に、本発明は、選択を実施することなくその伸長した立体構造において標的(ポリ)ペプチドに結合することができるアルマジロリピートドメインを得るための方法に関する。この方法では、標的(ポリ)ペプチド、例えば、特定のジペプチド、トリペプチド、又はテトラペプチドなどのアミノ酸の小ストレッチ(天然アミノ酸から、又は天然及び非天然又は改変された天然アミノ酸の混合物から形成される)への高い結合傾向を有する選択により得ることができるという事実を利用する。修飾アミノ酸は、例えば、リン酸化、アセチル化、又はメチル化されたアミノ酸である。発明の方法に従い、リピートドメインを、近接配置中の標的ポリペプチドに含まれるアミノ酸の小さな直線状ストレッチなど、標的(ポリ)ペプチドの特定の部分に高い結合傾向を有する事前に決定されたリピートモジュールから組み立てる。
【0093】
アミノ酸の小さな直線状ストレッチについて定義された結合特異性を有する特定のリピートモジュールを得るための方法は、以下の工程
(a)複数の内部リピートモジュールを含む設計されたアルマジロリピートタンパク質の推定又は入手;
(b)設計されたアルマジロリピートタンパク質の内部リピートモジュールをリピートモジュールライブラリーにより交換することによる設計されたアルマジロリピートタンパク質ライブラリーの生成;
(c)アミノ酸の小さな直線状ストレッチを含む標的ポリペプチドへの結合能に従ったアルマジロリピートタンパク質ライブラリーからの設計されたアルマジロリピートタンパク質の選択;
(d)アミノ酸のストレッチに特異性を有する工程(c)からの選択された設計されたアルマジロリピートタンパク質からの選択されたリピートモジュールの単離
を含む。
【0094】
「複数の内部リピートモジュール」中で使用される「複数の」は、3つ又はそれ以上、特に3、4、又は5を意味する。好ましくは、工程(a)の設計されたアルマジロリピートタンパク質は、3つの内部リピートモジュールを含む。さらにより好ましくは、工程(a)の設計されたアルマジロリピートタンパク質は3つの内部リピートモジュールを含み、ここで中央内部リピートモジュールを工程(b)のリピートモジュールライブラリーにより交換する。
【0095】
リピートモジュールライブラリーは、当技術分野において公知の標準的方法により入手する。好ましくは、リピートモジュールは、以下に記載するI、T、C、又はM配列モチーフを含むモジュールであって、ここで位置「1」及び「2」は十分に無作為化されており、即ち、任意のアミノ酸を表わし、又はここで「1」は、E、H、I、K、Q、R、及びTからなる群より選択されるアミノ酸残基を表わし、「2」は、A、D、E、F、H、I、K、L、M、N、Q、R、S、T、V、W、及びYからなる群より選択されるアミノ酸残基を表わす。
【0096】
本発明は、実施例に記載される特定の実施態様に制限されない。他の供給源を、以下に記載する概要に従って使用及び加工してよい。例えば、データベース「PubMed」を利用してよく、インターネットで利用可能である。特に、アルマジロリピート単位について開示されたコンセンサス配列に関する情報は、Riggleman B. et al., Genes Dev 3: 96-113, 1989;Peifer M. et al., Cell 76: 789-91, 1994;Andrade M. A. et al., J Mol Biol 309: 1-18, 2001;及びSMART(Schultz J. et al., Proc Natl Acad Sci 、USA 95: 5857-64, 1998;Letunic I. et al., Nucleic Acid Res 34: D257-60, 2006;http://smart.embl-heidelberg.de)で見出すことができる。発表された配列のまとめ及び本発明により導入される差異を表1に提示する。
【0097】
【表17】

【0098】
実施例
材料
化学薬品はFluka(スイス)から購入した。オリゴヌクレオチドはMicrosynth(スイス)からであった。オリゴヌクレオチドのリスト及びそれらの命名を表2に見出すことができる。Vent DNAポリメラーゼ、制限酵素、及びバッファーはNew England Biolabs(USA)又はFermentas(リトアニア)からであった。クローニング及び産生株は大腸菌XL1−blue(Stratagene、USA)であった。
【0099】
【表18】







【0100】
分子生物学
特記なき場合、方法は、記載されるプロトコールに従って実施する(Sambrook J., Fritsch E. F. and Maniatis T., Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory 1989, New York)。
【0101】
命名法
リピート単位及びモジュール内の位置を定義するために使用する命名法は、SMARTファミリーアラインメント(http://smart.embl-heidelberg.de)に基づき、Andrade, M. A. et al., J Mol Biol 309: 1-18, 2001により提示されたナンバリングと一致し、3つの位置だけ移動している。このように、彼らの研究での開始位置−2は、本開示の位置1に対応する。位置1、12、25はH1、H2、H3の推定開始位置である。リピートタンパク質は、それらが含むモジュールに従って名付けられている:名称は、この順番で、N末端モジュールの型(人工のA又はNa、酵母由来のY又はNy)、使用するモジュールの数を伴う内部モジュールの型(I、T、又はC型)、C末端モジュールの型(人工のA又はCa、酵母由来のY又はCy)を示す:例、YIAは酵母由来N末端モジュール(Ny)、4つのI型の内部モジュール、及び人工C末端モジュール(Ca)を含む。
【0102】
シークエンシング及び質量決定
全てのDNA配列をシークエンシングにより確認し、全ての記載されたタンパク質の算出された分子量を質量分析により確認した。
【0103】
タンパク質の特性
実施例に記載するモジュール配列を表3に列挙する。実施例に記載する特定の位置は、表3で採用するナンバリングを指す。タンパク質の実験的に決定された生物物理学的特性のまとめを表4に提示する。
【0104】
【表19】

【0105】
【表20】

【0106】
実施例1
実施例では、インポーチンα及びβカテニン/プラコグロビンサブファミリーの配列の組み合わせに基づく設計されたアルマジロリピートタンパク質を生成するために適用するコンセンサス設計戦略を報告する。設計手順は、自己適合性モジュールの生成に基づいた。コンセンサス配列(C型)は、SWISSProtデータベース(http://www.expasy.ch)からの単一のアルマジロリピート単位の複数のアラインメントに由来した。2つの異なるバージョンの熱キャッピングモジュールを生成し、溶媒露出から疎水性コアを保護した。全てのモジュールのペプチド配列をDNA配列に逆翻訳し、大腸菌での発現のためにコドン使用を最適化する。オリゴヌクレオチドを設計し、内部モジュール及びキャッピングモジュールのアセンブリーPCRを可能にする。結果として得られるPCR産物はII型制限酵素の認識部位を含み、Binz H. K. et al., J Mol Biol 332: 489-503, 2003により紹介された戦略を使用して結合された。設計されたリピートタンパク質をコードするDNA分子を適した発現ベクター中に挿入した。タンパク質を発現させ、精製し、そして分子ふるいクロマトグラフィー、ANS結合、円二色性分光法、及び変性実験により特性付けした。
【0107】
C型内部モジュールのコンセンサス設計
初期配列プロファイルが、開始点としてSMART(2004年1月からのデータ)からのファミリーアラインメントを使用して生成されている。Swiss−Protデータベース中の注釈を欠く全ての配列を除去し、配列相同性による間接的証拠を除き、タンパク質データが利用可能ではない仮説のタンパク質又は配列である。319の配列の最終セットは、40の残基のプロファイルを導き、H1からH3までのリピート配列を対象とするが、しかし、H3と次のリピート単位の間のループを除く。この配列プロファイルは、Swiss−Protデータベースに対するさらなる研究のために使用されてきた。このようにして見出されたリピート単位は、アルマジロリピートタンパク質の異なるサブファミリーに該当するタンパク質に属し、Andrade M. A. et al.(上記)により示される。
【0108】
βカテニン/プラコグロビン及びインポーチンαサブファミリーはペプチドバインダーであり、利用可能な結晶構造を有することが公知であるため、これらの2つのサブファミリーのメンバーを選択し、コンセンサス配列を生成した。選択したセット中でのインポーチンα配列のわずかな過剰提示(243上の133)は、データベース中に存在するより多数のインポーチンαタンパク質の結果である。標準化を、組み合わせたコンセンサス配列の算出中に適用した。自動アラインメントは、clustalW(Thompson J. D. et al., Nucleic Acid Res 22: 4673-80, 1994)で得られ、隣接リピート単位を結合するループも含めて手作業で改良された。コンセンサス配列を、起こりうる立体衝突(steric clash)を低下させるための結晶構造からの情報を考慮に入れて、さらに改善した。クローニング戦略のための必要条件もこの段階で考察し、モジュールC型を導く(表3及び5)。
【0109】
【表21】

【0110】
推定ヘリックスH1、H2、H3は、それぞれ残基1−10、12−21、25−40を包含する。位置7、16、17、19、20、31、34、35、38は全ての配列中で十分に保存されており、アルマジロタンパク質の疎水性コアの部分である。Gln5は同じリピート単位のAsp9と水素結合を潜在的に形成し、H1を安定化できる(構造1EE5で観察される、Conti E. and Kuriyan J., Structure Fold Des 8: 329-38, 2000)。Gly11は、H1とH2の間でのポリペプチド鎖の折り曲げにおけるその重要な役割が保存されており、この位置で必要とされるプラスのφ角度と適合する。Pro14はアルマジロリピートの異常な保存特性であり、全アラインメント中で50%の頻度で存在する。それは、H2の開始位置、水素結合中に骨格窒素を含むことが依然として必要ではない位置に位置づけられる;二次構造を破壊する代わりに、それはαヘリックスで典型的なφ/ψ角度を採用する。Asn37は全てのコンセンサス配列中で十分に保存されており、標的ペプチドの骨格への結合におけるその重要な役割に起因する。Trp33も、結合、具体的にはインポーチンαタンパク質の場合での標的側鎖の認識に関与する。このように、それはインポーチンサブファミリーで高頻度に出現し、したがって、それは全コンセンサス配列中にも存在する。
【0111】
ペプチドの結合に潜在的に関与する位置(4、26、29、30、33、36、37、40、41)は、複合体の構造解析(PDB IDs 1BK5、1BK6、1EE4、1EE5、1EJL、1EJY、1G3J、1IQ1、1JPP、1LUJ、2BCT、3BCT、1I7W、1I7X、1JPW、1IAL、1JDH、1M1E、1PJM、1PJN、1Q1S、1Q1T、1QZ7、1UN0、1TH1)及び突然変異実験からのデータ(von Kries J. P. et al., Nat Struct Biol 7: 800-7, 2000;Leung S. W. et al., J Biol Chem 278: 41947-53, 2003;Hoffmans R. and Basler K., Development 131: 4393-400, 2004)に基づいて定義されている。標的ペプチドへの結合の他、位置4は疎水性コア形成にも寄与し、このように潜在的ライブラリー中のこの位置で可能となる残基の型は、この追加の必要条件を考慮に入れた場合、恐らくは制限されうる。
【0112】
ループH2−H3とH3の間の連結部での位置24及び25は、全てのコンセンサス配列において酸性残基についての明確な優先度を示す。しかし、負電荷を帯びた残基対は、観察された配列中では決して起こらず、それは全タンパク質に沿って電荷反発又は負電荷を帯びたベルトの形成を導きうる。負電荷についての好ましい位置は明白ではなく(C型でのAsp24 36%、Glu25 27%)、代わりのアミノ酸は全て非常に低い頻度(<10%)を有する。交換のために選択された残基を次に選び、H3安定性を改善した:Glu25はそのより高いヘリックス傾向のために保持され、Asn24を導入し、より高頻度な残基Aspとの構造的類似性を保持し、Nキャップ残基としてのその傾向を活用する。Glyを、位置42に、クローニング目的で導入している。短いH3 H1ループ(一般的に1〜3残基)のため、非常にしばしばループの1つの位置がGlyにより占められることが顕著である。位置41が結合に関与することがあり、ひいては適用のために突然変異に供する可能性があることを考慮に入れると、ループ内に一定のグリシンを保持し、必要とされる可動性を維持することが重要である。
【0113】
キャッピングモジュールの設計
特殊化されたリピート単位は、天然タンパク質中のアルマジロドメインのN及びC末端部分を形成する。キャッピングリピート単位は恐らくは疎水性コアの保護に関与する。なぜなら、それらは内部リピート単位側に疎水性表面を、溶媒に親水性表面を呈するからである。キャッピングリピート単位は、設計されたLRR(Stumpp M. T. et al., J Mol Biol 332: 471-87, 2003)及びアンキリンリピートタンパク質(Binz H. K. et al., J Mol Biol 332: 489-503, 2003)において考察されており、追加らせんがTPRタンパク質の設計(Main E. R. et al., Structure (Camb) 11: 497-508, 2003)中に含まれている。
【0114】
アルマジロドメインの境界が限定加水分解により推定されているが、しかし、また、末端リピート単位と内部リピート単位との弱い類似性のため、明確には定義されない。また、全ての残基が、インポーチンα及びβカテニンの結晶構造中で目に見えるわけではない。目に見える残基だけがアルマジロドメインに寄与し、追加部分は非構造的であり、厳密にドメインに属さない可能性が高い。N末端キャッピングリピート単位は、H2、位置12から開始すると定義されている。対照的に、C末端キャッピングリピート単位は構造中で完全に目に見え、H1〜H3を含む、位置1〜位置41までで定義されている(表3)。
【0115】
キャッピングモジュールは、2つの異なるアプローチを使用することにより設計されている。第1の場合では、天然キャッピングリピート単位は、設計された内部リピートモジュールに適用された。キャッピングリピート単位と設計された内部リピートモジュールの間の適合性を確実にするための構造情報は、このアプローチのための基本的な必須条件である。酵母サッカロマイセス・セレビシエ(Saccharomyces cerevisiae)からのインポーチンαは、一般的なキャッピングリピート単位ドナーとしての最善の候補であることが判明した:全ての設計されたリピートモジュールが、酵母インポーチンαキャッピングリピート単位の内部表面と相互作用できる平面を呈し、分子モデルで観察された通りである。N末端キャッピングリピート単位は、酵母インポーチンαのGlu88からHis119までの残基に及ぶ。しかし、2つの残基Glu118−His119をAsp−Glyに交換し、末端ループを設計されたリピートモジュールに適応させた:グリシンをモジュールの組み立てに使用し、アスパラギン酸は天然タンパク質中で高頻度に見出される負電荷を保持し、ターン領域中のヘリックス傾向を低下させる。
【0116】
C末端キャッピングリピート単位は、酵母インポーチンαにおいてAsn471からGly510に及ぶ。しかし、最後の内部リピート単位とC末端リピート単位を結合するループは、他の天然インポーチンと比較して、追加残基を含む。このC末端キャッピングリピート単位の改変バージョンを、次に、3つの残基(Asp−Asn−Ile)をH1の前に導入することにより生成している。Asn及びIleはこれらの位置に天然に存在する;Aspが、負電荷を帯びたループを保持するために含まれており、いくつかの天然配列中で観察される通りであり、ヘリックス傾向を低下させる。N末端及びC末端キャッピングモジュールに由来する酵母インポーチンαをそれぞれNy及びCyと名付ける。第2バージョンのC末端キャッピングモジュールを、Cmと名付け、3つの最初の残基を伴わず、位置19でAlaをCysで交換して設計した。Ny、Cy、及びCmの配列を表3に示す。
【0117】
第2のアプローチでは、2つの完全に人工のキャッピングモジュールを設計し、C型モジュールから開始し、露出された疎水性残基を親水性残基と置換し、天然配列及び結晶構造に由来するモデルに基づく。N末端キャッピングリピート単位は、位置12から42に移行し、H2及びH3を含む。位置7、12、19、27、34は、C型モジュールにおいて疎水性残基により占められ、構造に基づく親水性残基及びN末端キャッピング配列のアラインメントから得られる共通の残基により交換されなければならない。Ser12は、H2のN末端ヘリックスキャップを提供する。Asn14は、より共通のプロリンを置換し、比較的短い側鎖を伴う極性残基を提供する。Glu15は、ヘリックス中でSer12と相互作用でき、それを追加的に安定化できる。Lys18は、Glu15と塩橋を形成でき、ヘリックスを安定化し、そして、一般的に、長い極性残基がこの位置で必要とされる。Gln19は、隣接内部リピートモジュールとの相互作用のための疎水性部分ならびに溶媒露出のための極性成分を提供する。Asn21はこの位置で共通しており、それはヘリックスCキャッピング残基としての良好な傾向を有する。Asp23及びAsp24は、いくつかのN末端キャッピングリピート単位中で荷電結合として保存されている。Gln25は、十分に保存されており、極性で、高いヘリックス傾向を伴う。Gln27は、隣接内部リピートモジュールとの相互作用のための疎水性部分ならびに溶媒露出のための極性成分を提供する。Gln33は、キャッピングリピート単位の中で、十分に保存されており、結合に関与するTrpを置換する。Lys34は、他の極性残基の中で、N末端キャッピングリピート単位中で中程度の頻度で存在する。Arg36は、高頻度の発生を有し、I型及びC型モジュール中に存在するTrp33と相互作用できると思われる。Gln37は、この位置での残基に典型的な長い側鎖を有し、そして、より共通するリジンの代わりに、Arg36との組み合わせで正電荷を帯びたスポットの形成を回避する。Asp41は、この位置にしばしば存在する負電荷を維持し、らせんを切断する。Gly42を、可動性を加え、さらなるモジュール組み立てのために導入した。
【0118】
C末端キャッピングリピート単位は全て3つのらせんを含む。位置8、13、17、20、28、32、35、38、39は、C型モジュール中で疎水性残基により占められ、構造に基づく親水性残基及びC末端キャッピング配列のアラインメントから得られる共通の残基により交換されなければならなかった。Lys4は、側鎖の長い脂肪族部分を伴う疎水性コアに潜在的に寄与でき、溶媒と正電荷を帯びたアミノ基を接触させる。Lys8は、保存されたグルタミン酸がこの位置で使用された場合に形成されうる負電荷のクラスターの形成を回避するために存在し、良好なヘリックス傾向及び長い側鎖を保持する。Glu9は高度に保存された残基である。Ala12は、疎水性コアと潜在的に相互作用できる。Glu14は、共通の極性残基であり、プロリンの置換基として良好なヘリックス傾向を伴う。Lys15も、共通の極性残基であり、比較的良好なヘリックス傾向を伴う。Leu13は、前者の疎水性コア位置を占めるが、しかし、それはその高いヘリックス傾向及びPhe39と相互作用するその能力が保持されていた。Glu17は内部リピート単位中のコア位置に対応する;疎水性残基を、高いヘリックス傾向を伴うこの高頻度に起こる親水性アミノ酸と置換した。Gln20は、内部リピート単位中に存在する保存されたロイシンを置換するために使用されるより高頻度な極性残基である。位置21〜23は明確に定義されておらず、カテニン/プラコグロビンサブファミリーにおける強い保存(機能的な理由のためでありうる)及びインポーチンにおける高い程度の変動性を示す。インポーチンサブファミリーからの最も保存された残基が次に選ばれ、これらの位置を占めた。Gln28は、疎水性相互作用及び極性側鎖を提供でき、そして、インポーチンサブファミリーにおける保存されたチロシン、及びカテニン/プラコグロビンサブファミリーにおけるアラニンと比較してより良好な選択肢を表わす。Gln32は、良好なヘリックス傾向及び極性側鎖を提供する。この位置での高頻度な芳香族残基の存在は、結晶構造から判断して、構造的な理由を有するとは思われない。Glu33は、この位置でしばしば見出される荷電残基の1つであり、それは良好なヘリックス傾向を有する。Glu36はインポーチンにおいて高頻度を有し、この位置は酸性残基により占められ、カテニン/プラコグロビンサブファミリーにおいてフェニルアラニン及びチロシンが存在する。芳香族残基は、恐らくは、機能的な役割を有するが、しかし、荷電残基は、露出された位置のため、より良好な選択肢を構成する。Lys37を選び、内部リピート単位中の保存されたアスパラギンを交換した。Gln38を選び、内部リピート単位及びキャッピングリピート単位の両方においてこの位置に常に存在する疎水性残基を交換し、溶媒と接触した極性成分を提供する。Phe39は、いくつかのキャッピングリピート単位中で保存されている。利用可能な構造から、それは、インポーチンの疎水性コアの密封のため、及び、Leu13との相互作用を介したC末端キャッピングリピート単位のコンパクト性のために重要と思われる。His41をキャッピング残基として加え、H3を安定化している。設計されたN末端及びC末端キャッピングモジュールをそれぞれNa及びCaと名付け、表3に示す。
【0119】
設計されたアルマジロリピートタンパク質をコードするDNAの合成
全てのモジュールのペプチド配列をDNA配列に逆翻訳し、大腸菌での発現のためにコドン使用を最適化した。各モジュールを、重複オリゴヌクレオチドから開始して合成した。全ての単一モジュールを、DNAレベルで、アセンブリーPCRによりオリゴヌクレオチドから組み立てた(図4)。C型モジュールの配列を、示した制限酵素部位と共に以下に示す;BsaI及びBpiIでの消化後のオーバーハングに下線を引いている。他の内部モジュールは、アミノ酸配列中の差異に対応する位置で異なる。Ny及びCaキャッピングモジュールのDNA配列も、それぞれN末端及びC末端キャッピングモジュールの例として示す;他のキャッピングモジュールは、アミノ酸配列中の差異に対応する位置で異なる。
【0120】
【表22】



【0121】
C型モジュールについて、オリゴヌクレオチドの対(1−2、3−4、5−6)を最初に組み立て、次に、2μlの産物を、オリゴヌクレオチド1及び6の存在下で、第2アセンブリー反応のための鋳型として合わせた。全てのオリゴヌクレオチドを最終濃度1μMで使用した。アニーリング温度は、第1反応では47℃、第2では50℃であった。30回のPCRサイクルを、30秒の伸長時間で実施した。同じ手順を、他の内部モジュール及びキャッピングモジュールに適用した。BamHI及びKpnI制限酵素部位を、モジュールのプラスミドpQE30(Qiagen、ドイツ)中への直接挿入のために使用した。単一モジュールを、次に、ベクターから、外部プライマーpQEfor及びpQErev(Qiagen、ドイツ)を使用してPCR増幅した。モジュールを、II型制限酵素を使用して、Binz et al.(上記)により報告された戦略に従って、段階的に組み立てた。隣接モジュールをII型酵素BpiI及びBsaIで消化し、直接的に一緒に結合した(図4)。全タンパク質をコードする遺伝子を、内部モジュール及びキャッピングモジュールの段階的連結により組み立てた。BamHI及びKpnI制限酵素部位を、全遺伝子のpQE30ベクター中への挿入のために使用し、プラスミドを配列決定した。ベクターは、親和性精製のためのN末端MRGSHisタグを提供する(図5)。同じ型の2つ、4つ、又は8つの内部モジュールを含むタンパク質をコードするDNA分子及びキャッピング分子の異なる組み合わせを生成した。ベクター中の挿入後のYCA配列を、例として以下に示す。*は、コード配列の終わりの停止コドンを示す。
【0122】
【表23】

【0123】
タンパク質の発現及び精製
キャッピングリピートモジュール及び内部リピートモジュールの組み合わせに起因するタンパク質を、可溶性タンパク質発現への影響を評価する目的で、組み立てた。このように、NキャッピングモジュールとしてのNa又はNyを、C型内部モジュール及びCa又はCyのC末端モジュールと合わせた。2つ又は4つの内部リピートモジュールを含むタンパク質を研究した。
【0124】
大腸菌XL1−Blue細胞を各プラスミドで形質転換し、1%(w/v)グルコース及び50μg/mlアンピシリンを含むLB培地中で、37℃で激しく撹拌しながら増殖した。発現を、培養がOD600=0.6に達した際にIPTG(最終濃度0.5mM)により誘導した。3時間の発現後、細胞を遠心分離により収集した。タンパク質精製を4℃で実施した。細胞を50mM Tris−HCl、500mM NaCl(pH8.0)中で再浮遊し、French pressure cell(SLM Instruments、USA)中で、圧力1’200PSIで溶解した。溶解混合物を超音波処理(Branson、USA)によりさらにホモジナイズした。不溶性物質を20,000xgで30分間の遠心分離により沈殿にした。上清を、Ni−NTA物質(Qiagen)を伴い、50mM Tris−HCl、500mM NaCl、10%(v/v)グリセロール、20mMイミダゾール(pH8.0)を含む緩衝液で平衡化した固定化金属イオン親和性クロマトグラフィー(IMAC)により精製した。カラムを平衡化緩衝液で十分に洗浄し、次に、タンパク質を、250mMイミダゾールを除き平衡化緩衝液と同一である溶出緩衝液で溶出した。インポーチンα5では、発現を25℃で6時間行い、細胞沈殿物を、50mM Tris−HCl、500mM NaCl、10%グリセロール、5mM βメルカプトエタノール、10mMイミダゾール(pH8.0)を含む溶解緩衝液中に再浮遊した。IMAC精製を、上に示した通りに、5mM βメルカプトエタノールを加えた同じ緩衝液を使用して実施した。サンプルを、次に、泳動緩衝液(50mM Tris−HCl、pH8.0)で平衡化した、POROS HQ陰イオン交換カラムに適用した50mM Tris−HCl、2mM DTT中で、Biocad 700 E perfusion chromatography workstation(Applied Biosystems、ドイツ)を使用して一晩透析した。カラムを次に50mM Tris−HCl及び20mM NaCl(pH8.0)で洗浄し、サンプルを20mMから1 M NaClまでの勾配で溶出した。タンパク質のサイズ及び純度を、Coomasie PhastGel Blue R-350(GE Healthcare、スイス)で染色した15% SDS−PAGEゲルにより評価した。全ての試験されたタンパク質の予測質量を質量分析により確認した。タンパク質濃度を、280nmでの吸光度により、www.expasy.orgで利用可能なツールで算出された分子量及び消衰係数を使用し、及びビシンコニン酸(BCA)アッセイ(Pierce)により測定した。
【0125】
最高レベルの可溶性タンパク質発現が、内部モジュールをNy及びCaと合わせた際に得られた。Naはほぼ検出不可能な発現を導き、Cyの存在は、細胞溶解後、不溶性分画中のタンパク質量の実質的な増加をもたらす。Cm(3つの最初の残基を伴わず、アラニンでCys19を交換した改変酵母C末端キャッピングリピート)を伴うコンストラクトの発現によって、Cyと比較し、可溶性タンパク質のレベルは改善されなかった。末端キャッピングモジュールの観察された効果は、内部リピートモジュールの数に非依存的であった。しかし、内部モジュールの数の増加は、可溶性タンパク質の量及びタンパク質の絶対量の増加を導く。タンパク質を、固定化金属イオン親和性クロマトグラフィー(IMAC)により、単一工程で精製し、1リットルの細菌培養から100mgを超える純粋タンパク質を提供する。沈殿又は分解の徴候は、IMAC溶解緩衝液中で、4℃で1ヶ月まで保存されたタンパク質溶液中で検出されなかった。
【0126】
分子ふるいクロマトグラフィー(SEC)及び多角度光散乱(MALS)
分析的SECを、Superdex 200 10/30 GLカラム(流速0.5ml/分)(GE Healthcare、スイス)を使用したAKTAエクスプローラークロマトグラフィーシステムで行った。リン酸緩衝液pH7.4(50mMリン酸、150mM NaCl)及び2つのTrisベース緩衝液(20mM Tris−HCl、50mM NaCl、pH8.0又は50mM Tris−HCl、500mM NaCl、pH8.0)を使用した。βカテニンのアルマジロドメインは、150mM又は500mMの塩濃度でだけ可溶性であった。インポーチンα5のアルマジロドメインをリン酸緩衝液pH7.4(50mMリン酸、500mM NaCl、5mM DTT)中で分析した。MALS測定を、AKTAシステムに連結したminiDAWN光散乱検出器及びOptilab屈折計(Wyatt Technologies、USA)で実施した。分子量の推定値をASTRA 4.73.04ソフトウェアパッケージ(Wyatt Technologies、USA)を使用して算出した。設計されたタンパク質は、天然アルマジロドメインとは対照的に、分子ふるいクロマトグラフィー(SEC)で高い見掛け上の分子量を示す(表4)。C型タンパク質は、テストした最高濃度(4mg/ml)まで、MALSで単量体として常に検出される。YCAは唯一の例外を表わす:濃度に非依存的に、MALSで算出された質量値は常に単量体と二量体の間の中間である。
【0127】
円二色性(CD)スペクトル
CD測定を、Jasco J-810分光偏光計(Jasco、日本)で、0.5mM円柱状サーモキュベットを使用して実施した。CDスペクトルを190〜250nmで記録し、データピッチは1nm、スキャンスピードは20nm/分、反応時間は4秒、バンド幅は1nmであった。各スペクトルを3回記録し、平均した。測定は20℃で実施した。CDシグナルを緩衝液の減算により補正し、平均残基楕円率(MRE)に変換した。測定を20mM Tris−HCl、50mM NaCl(pH8.0)中で実施した;βカテニン又はインポーチンα5のアルマジロドメインのCDスペクトルを50mM Tris−HCl、500mM NaCl、pH8.0中で測定し、起こりうる凝集問題を回避した。CDスペクトルをCDpro(Sreerama N. and Woody R. W., Methods Enzymol 383:318-51, 2004)を使用して分析した:CDSSTRアルゴリズムを分析のために選び、参照タンパク質をSDP48に設定した(Ibasis=7)。CDスペクトルはαヘリックス二次構造の存在を示す。ヘリックス含量は、一般的に、内部モジュールの数の増加に伴い増加する。平均残基楕円率(MRE)及びヘリックス含量の値を表4に示す。
【0128】
熱変性
熱変性曲線を、222nmでのCDシグナルを温度ランプ20〜95℃で測定することにより得た(データピッチ1nm;加熱速度1℃/分;反応時間4秒;バンド幅1nm)。データを上に記載の通りに処理した。MRE値の漸減がC型タンパク質で観察されたが、しかし、明確な協同転移はなかった。熱アンフォールディングはほぼ完全に可逆的であった。各タンパク質での転移の中点を表4に示す。
【0129】
ANS結合
1−アニリノ−ナフタレン−8−スルホン酸(ANS)蛍光を、PTI QM-2000-7蛍光光度計(Photon Technology International、USA)を使用して測定した。測定は、20℃で、20mM Tris−HCl、50mM NaCl、100μM ANS、pH8.0中で、最終濃度10μMの精製タンパク質を使用して実施した。βカテニンのアルマジロドメインへのANS結合を、50mM Tris−HCl、500mM NaCl、100μM ANS、pH8.0中で測定し、起こりうる凝集問題を回避した。400〜650nm(1nm/秒)からの発光スペクトルを、励起波長350nmで記録した。各サンプルについて、3つのスペクトルを記録し、平均した。C型タンパク質はANS(疎水性環境に感受性である蛍光色素)に強く結合し、接近可能な疎水性コアの存在を示唆する。ANS蛍光強度の最高値を表4に示す。
【0130】
実施例2
実施例では、インポーチンαサブファミリーの配列に基づく、設計されたアルマジロリピートタンパク質を生成するために適用したコンセンサス設計戦略を報告する。設計手順は、自己適合性モジュールの生成に基づいた。コンセンサス配列(I型)は、SWISSProtデータベース(http://www.expasy.ch)からの単一アルマジロリピート単位の複数のアラインメントに由来し、実施例1に記載するキャッピングモジュールと合わせた。タンパク質を発現させ、精製し、そして分子ふるいクロマトグラフィー、ANS結合、円二色性分光法、及び変性実験により特性付けした。
【0131】
I型内部モジュールのコンセンサス設計
実施例1に記載するコンセンサス配列の生成において含まれる243の配列から、インポーチンαサブファミリーからの133のリピート配列を使用してコンセンサス配列を得た(表6)。この制限されたコンセンサスによって、異なるサブファミリー間での起こりうる不適合性が回避される。自動アラインメントは、clustalWで得られ、隣接リピート単位を結合するループも含めて手作業で改良された。コンセンサス配列を、起こりうる立体衝突を低下させるための結晶構造からの情報を考慮に入れて、さらに改善した。クローニング戦略のための必要条件もこの段階で考察し、モジュールI型を導く(表3及び6)。
【0132】
【表24】

【0133】
推定ヘリックスH1、H2、H3は、それぞれ残基1−10、12−21、25−40を包含する。位置7、16、17、19、20、31、34、35、38は全ての配列中で十分に保存されており、アルマジロタンパク質の疎水性コアの部分である。Gln5は同じリピート単位のAsp9と水素結合を潜在的に形成し、H1を安定化できる(構造1EE5で観察される)。Gly11は、H1とH2の間でのポリペプチド鎖の折り曲げにおけるその重要な役割が保存されており、この位置で必要とされるプラスのφ角度と適合する。Pro14はアルマジロリピート単位の異常な保存特性であり、インポーチンリピート単位アラインメント中で62%の頻度で存在する。それは、H2の開始位置、水素結合中に骨格窒素を含むことが依然として必要ではない位置に位置づけられる;二次構造を破壊する代わりに、それはαヘリックスで典型的なφ/ψ角度を採用する。Asn37は十分に保存された残基であり、標的ペプチドの骨格への結合におけるその重要な役割に起因し、Trp33も、結合、具体的には標的側鎖の認識に関与する。ペプチドの結合に潜在的に関与する位置(4、26、29、30、33、36、37、40、41)を実施例1に従って定義する。さらなる改変を、実施例1の通りに、元のコンセンサス配列に導入した(表6)。Pro2(30%)をおおよそ等しく保存されたGlu(26%)と置換した。なぜなら、そのような位置のProは、インポーチンα結晶構造により示される通り、恐らくはH1を破壊しうるからである。Pro15(19%)は、位置14にProを持たない配列に由来した。二重Pro14−Pro15は、観察された配列中では決して起こらず、それはH2を極めて不安定化する可能性が高い。この位置は、通常、Pro14との組み合わせで、小さな疎水性残基により占められる。Argは比較的共通の選択肢を表わすが(16%)、しかし、それはほぼもっぱら天然インポーチンの第2リピート単位中で起こる。Valは、従って、わずかに高い発生頻度のため(13%)、置換基として選ばれた。ループH2−H3とH3の間の連結部での位置24及び25は、全てのコンセンサス配列において酸性残基についての明確な優先度を示す。しかし、負電荷を帯びた残基対は、観察された配列中では決して起こらず、それは全タンパク質に沿って電荷反発又は負電荷を帯びたベルトの形成を導きうる。最も保存されていた残基Asp24(49%)は保存された。局所的な負電荷を低下させるために、Asn(11%)を選び、位置25でGlu(19%)と交換した。なぜならそれは2番目に高頻度な極性残基であるからである。Glyを、位置42に、クローニング目的で導入している。短いH3 H1ループ(一般的に1〜3残基)のため、非常にしばしばループの1つの位置がGlyにより占められることが顕著である。位置41が結合に関与することがあり、ひいては適用のために突然変異に供する可能性があることを考慮に入れると、ループ内に一定のグリシンを保持し、必要とされる可動性を維持することが重要である。
【0134】
設計されたアルマジロリピートタンパク質をコードするDNAの合成
I型モジュールのペプチド配列をDNAに逆翻訳し、大腸菌での発現のためにコドン使用を最適化した。I型モジュールに対応するDNA分子を重複オリゴヌクレオチドから開始して合成した(表2)。アセンブリーPCR、連結(モジュールの間及び実施例1に記載するキャッピングモジュールと)、及びクローニングを実施例1に従って実施し、1つのNy N末端キャッピングモジュール、2、4、又は8の内部I型モジュール、及び1つのCa C末端キャッピングモジュールを含むアルマジロリピートタンパク質をコードする遺伝子を得た。
【0135】
生物物理学的な特徴付け
タンパク質の発現及び精製、ならびに分子ふるいクロマトグラフィー(SEC)、多角度光散乱(MALS)、円二色性(CD)、熱及びグアニジウム誘発性変性、ならびにANS結合を実施例1に従って実施した。発現及び精製収量は、実施例1に記載するタンパク質と同程度であった。
【0136】
設計されたI型タンパク質は、分子ふるいクロマトグラフィー(SEC)において、天然アルマジロドメインとは対照的に、高い見掛け上の分子量を示す(表4)。多角度光散乱(MALS)は、それらが恐らくは溶液中で二量体と単量体の混合物として存在することを示す。主ピークは二量体形態に対応し、この値は表4に報告されている。高濃度(2〜4mg/ml)で、I型タンパク質はオリゴマーの混合物として存在し、さらに高い見掛け上の分子量を伴う。CDスペクトルは、全てのタンパク質でのαヘリックス二次構造含有物の存在を示し、インポーチンα(αArm)及びβカテニン(βArm)の天然アルマジロドメイン中のように222nmでの楕円率を伴う。ヘリックス含量は、一般的に、内部モジュールの数の増加に伴い増加する。I型タンパク質は熱変性において協同転移を示し、転移の中点(Tm)はモジュールの数と共に増加する(例、YIAでの約70℃からYIAでの80℃超まで)。設計されたタンパク質は、95℃で有意なパーセントの二次構造を保持し、熱アンフォールディングはほぼ完全に可逆的である。平均残基楕円率(MRE)、ヘリックス含量、及び熱変性における転移の中点の値を表4に示す。ANS結合実験では、I型タンパク質が、天然アルマジロリピートタンパク質と同じ範囲でANS結合を示し、染料に接近できない小型の疎水性コアの存在を示す。ANS蛍光強度の最高値を表4に示す。
【0137】
実施例3
実施例では、βカテニンサブファミリーの配列に基づく、設計されたアルマジロリピートタンパク質を生成するために適用したコンセンサス設計戦略を報告する。設計手順は、自己適合性モジュールの生成に基づいた。コンセンサス配列(T型)は、SWISSProtデータベース(http://www.expasy.ch)からの単一アルマジロリピート単位の複数のアラインメントに由来し、実施例1に記載するキャッピングモジュールと合わせた。タンパク質を発現させ、精製し、そして分子ふるいクロマトグラフィー、ANS結合、円二色性分光法、及び変性実験により特性付けした。
【0138】
T型内部モジュールのコンセンサス設計
実施例1に記載するコンセンサス配列の生成において含まれる243の配列から、βカテニンサブファミリーからの110のリピート配列を使用してコンセンサス配列を得た。この制限されたコンセンサスによって、異なるサブファミリー間での起こりうる不適合性が回避される。
【0139】
自動アラインメントは、clustalWで得られ、隣接リピート単位を結合するループも含めて手作業で改良された(表7)。コンセンサス配列を、起こりうる立体衝突を低下させるための結晶構造からの情報を考慮に入れて、さらに改善した。クローニング戦略のための必要条件もこの段階で考察し、モジュールT型を導く(表3及び7)。
【0140】
【表25】

【0141】
推定ヘリックスH1、H2、H3は、それぞれ残基1−10、12−21、25−40を包含する。位置7、16、17、19、20、31、34、35、38は全ての配列中で十分に保存されており、アルマジロタンパク質の疎水性コアの部分である。Gly11は、H1とH2の間でのポリペプチド鎖の折り曲げにおけるその重要な役割が保存されており、この位置で必要とされるプラスのφ角度と適合する。Pro14はアルマジロリピート単位の異常な保存特性であり、カテニン/プラコグロビンリピート単位アラインメント中で35%の頻度で存在する。それは、H2の開始位置、水素結合中に骨格窒素を含むことが依然として必要ではない位置に位置づけられる;二次構造を破壊する代わりに、それはαヘリックスで典型的なφ/ψ角度を採用する。Asn37は全てのコンセンサス配列中で十分に保存されており、標的ペプチドの骨格への結合におけるその重要な役割に起因する。ペプチドの結合に潜在的に関与する位置(4、26、29、30、33、36、37、40、41)を実施例1に従って定義する。さらなる改変を元のコンセンサス配列に導入し(表7)、タンパク質の産生のための必要条件(例、システインの欠如)を満たし、純粋な配列ベースのアラインメントから生じた可能性のある構造的欠陥(例、衝突の存在)を回避した。Cys30(18%)及びCys41(21%)を2番目に最も共通のアミノ酸(それぞれAla 12%及びHis 17%)により交換し、可能なさらなる適用を限定しうる望ましくないジスルフィド結合の形成を回避した。位置9は、非極性又は極性(Leu、Glu、Gln)のいずれかの長い脂肪族側鎖に優先度を示す;しかし、この残基は溶媒に露出され、Leu9(21%)は2番目に最も共通のアミノ酸Glu(19%)により置換された。Glnは位置18の最も高頻度なアミノ酸(27%)である。しかし、Arg及びLysの両方がほぼ同じ頻度(それぞれ25%及び20%)で表わされ、正荷電を帯びた残基への優先度を示す。Argを、次に、この位置でそのより高い頻度のために選んでいる。ループH2−H3とH3の間の連結部での位置24及び25は、全てのコンセンサス配列において酸性残基についての明確な優先度を示す。しかし、負電荷を帯びた残基対は、観察された配列中では決して起こらず、それは全タンパク質に沿って電荷反発又は負電荷を帯びたベルトの形成を導きうる。最も保存されていた残基Glu25(43%)は保持された。Asp24(20%)をAsn(10%)により置換したが、ほぼ同じ頻度を伴う候補プール中の元の残基(Arg、Asn、Met、Ser、Tyr、Val)との類似性により決定された選択肢である。Glyを、位置42に、クローニング目的で導入している。短いH3−H1ループ(一般的に1〜3残基)のため、非常にしばしばループの1つの位置がGlyにより占められることが顕著である。位置41が結合に関与することがあり、ひいては適用のために突然変異に供する可能性があることを考慮に入れると、ループ内に一定のグリシンを保持し、必要とされる可動性を維持することが重要である。
【0142】
設計されたアルマジロリピートタンパク質をコードするDNAの合成
T型モジュールのペプチド配列をDNAに逆翻訳し、大腸菌での発現のためにコドン使用を最適化した。T型モジュールに対応するDNA分子を重複オリゴヌクレオチドから開始して合成した(表2)。アセンブリーPCR、連結(モジュールの間及び実施例1に記載するキャッピングモジュールと)、及びクローニングを実施例1に従って実施し、1つのNy N末端キャッピングモジュール、2、4、又は8の内部T型モジュール、及び1つのCa C末端キャッピングモジュールを含むアルマジロリピートタンパク質をコードする遺伝子を得た。
【0143】
生物物理学的な特徴付け
タンパク質の発現及び精製、ならびに分子ふるいクロマトグラフィー(SEC)、多角度光散乱(MALS)、円二色性(CD)、熱及びグアニジウム誘発性変性、ならびにANS結合を実施例1に従って実施した。設計されたタンパク質は、SECにおいて、天然アルマジロドメインとは対照的に、高い見掛け上の分子量を示す(表4)。MALSは、T型タンパク質が恐らくは溶液中で二量体と単量体の混合物として存在することを示す。主なピークは二量体形態に対応し、この値は表4に報告されている。高濃度(2〜4mg/ml)で、T型タンパク質はオリゴマーの混合物として存在し、さらに高い見掛け上の分子量を伴う。CDスペクトルは、ヘリックス含量と内部モジュールの数の間に有意な相関関係を示さない。平均残基楕円率(MRE)及びヘリックス含量の値を表4に示す。熱変性において、T型タンパク質は協同転移を示し、転移の中点(Tm)はモジュールの数と共に増加する。熱アンフォールディングはYTA及びYTAについて完全には可逆的ではなく、YTAは不可逆的に変性される。平均残基楕円率(MRE)、ヘリックス含量、及び転移の中点(Tm)の値を表4に示す。ANS結合実験では、T型タンパク質が、天然アルマジロリピートタンパク質と同じ範囲でANS結合を示す。ANS蛍光強度の最高値を表4に示す。
【0144】
実施例4
改善された疎水性コアを伴う設計されたアルマジロリピートタンパク質の収集物を記載する。新型の内部モジュールを含むタンパク質は、コンピュータ「回転異性体サンプリング」アプローチを使用し、実施例1のC型モジュールに由来した。C型モジュールから、疎水性コア形成に寄与する16の位置のうち7つを、脂肪族から脂肪族突然変異の標的として選択した。天然アルマジロドメインの結晶構造から開始し、モデル構造を生成し、内部リピート単位ごとのコア位置を、C型モジュール中に存在する残基及び許容された突然変異により置換した。各構造において、タンパク質のリピートモジュールごとに同じ突然変異を保有する。回転異性体サンプリングアプローチ、続くエネルギー最小化は、最終順位の突然変異体を得るために使用する一連の構造及び対応するエネルギー値をもたらした。18の最上位の突然変異体を次にDNAレベルで生成し、内部モジュールにおいて、C型モジュールに基づき、選択された残基を導入した。タンパク質を発現させ、元のC型モジュールを含む対応するタンパク質と比較した。可溶性タンパク質の高レベル発現が突然変異体について達成され、全てがそれらの生物物理学的特徴において、元のC型モジュールと比較した場合に、改善を示し、ほぼ全ての場合において、溶液中で単量体形態を保持する。二次構造及び安定した球状タンパク質の存在を、円二色性分光法、ANS結合、NMR、及び変性実験により確認した。
【0145】
疎水性コア突然変異体における回転異性体サンプリング
実施例1(表3)に記載するC型モジュールを、それらを含むタンパク質のコンパクト性及び天然様挙動を、元のC型モジュールを含むタンパク質と比較し、増加できる新型モジュールの生成のための開始点として選んだ。疎水性コアの充てん問題は、C型タンパク質のモルテングロビュール様挙動についての可能な説明である。疎水性コア位置中の突然変異によって、次に、タンパク質の充てんを改善できる。疎水性コア形成に寄与する16の位置(図6及び表8)を、溶媒が接近可能な表面が全残基表面の5%未満であることにより定義した(1.4Å半径を伴うプローブにより決定される通りである)。最終選択は、構造の目視検査後に行った。突然変異の数は、各位置での共通の脂肪族アミノ酸に制限され、配列アラインメントに基づき、最も保存された位置を一定に保つ。単一リピートモジュールの疎水性コアを形成する16中7つの位置だけが、これらの位置でのそれらの頻度に依存して、変動し、2つ又は3つの異なる残基型を受け入れることが可能になっていた(表8)。
【0146】
【表26】

【0147】
各リピートモジュールにおける突然変異の可能な組み合わせの数は432である。サンプリングを改善するために、3つのX線構造を開始モデルとして選んだ:8つの内部リピート単位及び2つの末端リピート単位から各々なるS. cerevisiae(PDB ID 1EE4)及びマウス(PDB ID 1Q1T)からのインポーチンα、ならびに、10の内部リピート単位及び2つの末端リピート単位からなるマウスβカテニン(PDB ID 2BCT)。
【0148】
3つの構造の元のキャッピングリピート単位を、モデルにおいてNy及びCaキャッピングモジュール(表3)で置換した。各突然変異は、各リピート単位のコア位置で側鎖を欠失させ、そして、それらを無作為な回転異性体の立体構造を伴う新たな側鎖で置換することによりモデル化した;結果として得られる構造を最小化し、衝突を除いた。最終結果は、許容された突然変異の432の組み合わせの各々について3モデルの群(3つの初期構造から)であった。各モデルにおける全てのリピートモジュールを、同じ突然変異パターンを有するように設計した。一連の加熱−急冷サイクル、続くエネルギー最小化は、最終順位の突然変異体を生成するために使用された一連の構造及び対応するエネルギー値をもたらした(表9)。元のC型モジュールよりも低い疎水性コア容積(Chothia C., Nature 275: 304-8, 1975により報告された値で算出)を伴う突然変異体は、最終順位に含まれず、コアの充てん不足に起因して生じうる偽陽性の数を低下させた。
【0149】
【表27】

【0150】
コンピュータアプローチでは、CHARMM力場(Brooks B. R. et al., Journal of Computational Chemistry 4: 187-217, 1983)ならびに分子動力学によるエネルギー最小化及び加熱のサイクルを使用し、埋込み側鎖の好ましい配置をサンプリングし、所定の突然変異体の疎水性コア中での残基の充てん効率を推定する。距離依存的な誘電関数を伴う拡張した原子近似(param19)を、短い分子動力学の実行によるエネルギー最小化及び加熱の両方のために使用した。コア残基原子と直接的に接触しない全ての骨格原子及び側鎖原子(即ち、初期コンホメーションで、各リピート単位の16のコア残基の任意の原子から5Å超離れたもの)は、定数1.0kcal・mol-1・Å-2を伴う調和ポテンシャルで制約された。この方法では、コア残基の側鎖回転結合だけが十分に可動性である。調和ポテンシャルを伴うシステムをさらに最小化した。加熱−急冷プロトコールを、432の突然変異体の各々及び3つのタンパク質構造の各々について100回反復した。第1工程は10psであり、400Kに加熱し、非結合エネルギー項(即ち、ファンデルワールス及び静電気)を無視した。第2工程は、全てのエネルギー項を含む最小化であった。加熱段階の目的は、可動性の側鎖回転異性体をシャッフルし、それらがエネルギー障壁を飛び越えることを可能にすることであったが、最小化を使用し、加熱工程後にポテンシャルエネルギーにおいて最も近い最小値に達した。最小化の終わりに、配位を保存し、合計100の立体構造を各突然変異体について生成した。これらの立体構造を、上記の制約なしに最終的に最小化し、そして、ポテンシャルエネルギーを順位について評価した。
【0151】
CHARMMポテンシャルエネルギーは:
【数1】


であり、
式中、Ebondingは結合、角度、不適切な二面ポテンシャル項の合計であり、Evdwはファンデルワールス全相互作用エネルギーであり、そしてEelecはクーロンエネルギーである。Eelec項を順位について無視した。なぜなら、それは、拡張された原子表示において脂肪族から脂肪族突然変異に非感受性だからである。さらに、この制約のため、骨格極性基の制限された可動性が、有意なシグナルなしにノイズとなるクーロンエネルギーをもたらす。従って、低下したポテンシャルエネルギーを順位に使用した。各開始構造について、突然変異体mの立体構造iについてのエネルギー値は
【数2】


である。各配座異性体が異なるポテンシャルエネルギーを有するため、中央値、1パーセンタイル、及び最小値を、配座異性体のエネルギーシリーズから抽出し、各突然変異体を特徴付け、その値を使用して3つの独立順位を作った。この手順の終わりに、3つの初期構造の各々について、3つの順位数字(中央値、1パーセンタイル、及び最小順位に対応する)を各突然変異体に割り当て、これらの9つの順位数字を合計した。結果として得られる数字を使用して、全突然変異体順位を得た。複数の構造及び異なる採点基準(即ち、中央値、1パーセンタイル、及び最小値)の組み合わせを使用し、近似方法で、限定されたサンプリングを考慮に入れた。この方法では、高い順位位置が、多くの立体構造にわたり、3つの異なる骨格において突然変異の一貫した性能を必要とし、ポテンシャルエネルギーを検討するための3つの異なる方法を使用した。突然変異体の各開始モデルに必要なCPU時間は、2800MHz Opteronデュアルコアの単一プロセッサーで、インポーチン構造当たり約5時間、カテニン構造について7時間であった。全算出時間(約8000時間)を150のCPUに分割した。
【0152】
設計されたアルマジロリピートタンパク質をコードするDNAの合成
(30)の最上位の単一リピートモジュール突然変異体配列の内、18を実験的検証のために選択した。低いコア容積を伴う最善の順位の突然変異体配列も選択し、順位付けプロセス中にコア容積フィルターの初期選択肢を検証した。突然変異体リピートモジュールのタンパク質特性に及ぼす影響を、4つの同一の内部モジュール及び実施例1に記載するキャッピングモジュールNy及びCaを含むタンパク質のフォーマット中で評価した。タンパク質をmut1からmut18と名付けた;mut19は低いコア容積を伴う配列を含む(表9)。C型モジュールを含む参照タンパク質を、上に示す通り、YCAと呼ぶ。オリゴヌクレオチドからの単一モジュールの組み立て及び段階的連結を、実施例1に記載する通りに実施した。各モジュールで使用するオリゴヌクレオチドの組み合わせを表10に示す。
【0153】
【表28】

【0154】
タンパク質の発現及び精製
「回転異性体サンプリング」方法により選択したモジュールを含むタンパク質を、実施例1に記載の通りに、発現及び精製した。疎水性コア突然変異体の発現レベルは、元のC型モジュールを含むタンパク質とほぼ同じであった。タンパク質を、固定化金属イオン親和性クロマトグラフィー(IMAC)により、単一工程で精製し、1リットルの細菌培養から約100mgの純粋タンパク質を産生した。
【0155】
選択された疎水性コア突然変異体の特徴付け
実験的比較を、実施例1に記載の通りに、円二色性(CD)、分子ふるいクロマトグラフィー(SEC)、及びANS(1−アニリノ−ナフタレン−8−スルホン酸)の結合により行った。分析的な分子ふるいクロマトグラフィーを、Superdex 200 PC 3.2/30カラム(流速70μl/分)を使用したEttan LCシステム又はSuperdex 200 10/30 GLカラム(流速0.5ml/分)(GE Healthcare、スイス)を使用したAKTAエクスプローラークロマトグラフィーシステムのいずれかで行った。
【0156】
全ての突然変異体が、類似のCDスペクトルをYCAと共有しているが、しかし、222nmでの平均残基楕円率の全般的増加により特徴付けられ、より高いパーセントのαヘリックス二次構造を示す。突然変異体の増加した溶出容積は、減少したANS結合と十分に相関し、タンパク質のより高いコンパクト性を示す(図7)。mut1はその二量体形態に起因する外れ値だけを表わし、全ての他の突然変異体は、多角度光散乱(MALS)により示される通り、単量体である。コア突然変異体の一部は、追加の突然変異を保有し、それらは遺伝子合成中に導入された(図7の記載に示す)。これらの突然変異の大半が、ループ中又はヘリックスの表面に位置し、そのため疎水性コアの安定性に及ぼす影響はわずかだけ又は無い可能性が高い;さらに、それらは4つの内、単一のモジュールだけに存在し、タンパク質特性に対するそれらの全体的寄与を低下させる。突然変異体mut2、mut3、mut4、mut7、mut11、mut12、及びmut13は、SECにより判断された通り、低いANS結合及びコンパクト性の最善の組み合わせを示し、熱変性によるさらなる特徴付けのために選択した。突然変異体mut7は、YCA及び他の突然変異体と比較し、熱アンフォールディング中に有意に増加した共同性を示す。mut7に対応する内部モジュールは、M型と名付けられ、初期コンセンサスと比較して3つの点突然変異を含む(表3)。突然変異体mut7は、YMAと改名され、YCAと同様に、いくつかの塩及びタンパク質の濃度で安定化な単量体である;しかし、二量体形成が、pH7で、高いタンパク質濃度(5mg/ml)により観察された。沈殿又は分解の徴候は、IMAC溶出緩衝液中で、4℃で1ヶ月まで保存されたタンパク質溶液中で検出されなかった。YMAの生物物理学的特徴を表4に示す。
【0157】
NMR
NMR試験のためのタンパク質を、唯一の窒素源として15N標識した塩化アンモニウムを伴う最小培地中で増殖させた、プラスミドpREP4を含む大腸菌株M15(Qiagen)を使用して産生した。培地に、微量金属、150μMチアミン、及び30μg/mlカナマイシンを添加した。発現ならびにIMAC及びゲルろ過による精製を、実施例1に記載の通りに実施した。NMR測定のために使用した緩衝液は、20mM重水素化Tris−HCl、30mM NaClを含み、pHは6、7、8、9、10、又は11であった。YCA及びYMAを、NMR測定のために0.6mMに濃縮した。プロトン、窒素の相関マップは、コヒーレンス選択及び直交検出のためのパルス磁場勾配を利用し、Rance and Palmer Palmer A. G. et al., J. Mag. Reson. 93: 151-70, 1991;Kay L. E. et al., J Am Chem Soc 114: 10663-5, 1992の感度増強エレメントを取り込んだ[15N,H]−HSQC実験に由来した。15N{H}−NOEデータを、プロトン検出バージョンの15N{H}定常状態異核Overhauser効果を使用して測定した。全ての実験を、310Kでの三重共鳴クリオプローブを備えたBruker AV-700 MHzスペクトロメータで記録した。スペクトルを処理し、スペクトロメーターソフトウェアTOPSPIN 1.3で分析し、4.63ppmプロトン振動数での水共鳴と比較して較正し、そこから15Nスケールを間接的に算出した。
【0158】
YCAのアミドプロトン振動数は、一般的に、ランダムコイル範囲(7.5〜8.5ppm)に限定されるが、YMAの多くの交差ピークはこの範囲外に位置する。さらに、YCAのシグナルからの線幅は、YMAのそれからよりもわずかに大きい。立体構造的な交換プロセスならびに限定的なシグナル分散に起因する線幅増加は、タンパク質のモルテングロビュール状態の特徴的な特性である。15N,H相関マップを割り当てる試みはなされてこなかったが、15N−{H}−NOEデータを記録し、内部骨格動力学を特徴付け、YMAの硬性増加を探った。YMAの全てのアミド成分を0.6より大きい15N−{H}−NOEsにより特徴付け、十分に折り畳まれたセグメントを示したが、YCAについて、全ての値が0.3より小さく、とりわけ、多くが陰性NOEsを伴い、大きいな可動性を示す。NMR測定によって、次に、YCAのモルテングロビュール特徴及びYMAの天然様特性が確認される。
【0159】
実施例5
実施例は、無作為化された残基を伴う設計されたアルマジロリピートタンパク質の収集物を指し(ライブラリーと呼ぶ)、標的ペプチドへのバインダーの選択を可能にする。アルマジロリピートタンパク質ライブラリーを、Ny及びCaキャッピングモジュール(実施例1に記載)及び無作為化された位置を伴う3つの内部M型モジュール(実施例4に記載)を使用して生成する。
【0160】
設計されたアルマジロリピートタンパク質をコードするDNAの合成
ライブラリーは、N末端キャッピングモジュールとしてのNy、無作為化された位置を伴う3つの内部M型モジュール、及びC末端キャッピングモジュールとしてのCaを含むタンパク質を含むタンパク質を含め、タンパク質レベルで設計された。残基E、H、K、I、Q、R、Tを、M型モジュールの位置4に許容した。制限は位置4の立体的制約に起因したが、それは疎水性コアの形成にも関与する。全ての残基(C、G、及びPを除く)が、位置30、33、36、40、41で許容された。システインを除外し、ジスルフィド架橋の形成又はタンパク質二量体化を回避した。グリシン及びプロリンを、41を除く全ての位置がαヘリックスに局在するとの事実に起因する、それらのヘリックス破壊傾向のため除外した。タンパク質配列を、コードDNA配列に逆翻訳した。しかし、M型DNA配列中の位置41は無作為化された位置であり、対応するコドンはモジュールの組み合わせ中にII型制限酵素のための切断部位として使用できない(実施例1及び図4)。DNA配列を次に6塩基対だけ移動させ、切断部位としての固定化位置のコドンの使用を可能にした。同じ戦略をNy及びCa DNA配列に適用し、正確なリーディングフレームを保ち、所望のタンパク質配列を得た。ライブラリー生成のために使用したDNA配列(NyLib、L、CaLib)を以下に示す。
【0161】
【表29】



【0162】
モジュールに対応するDNA分子を、重複オリゴヌクレオチドから開始して合成した(表2に示す)。
【0163】
オリゴヌクレオチドlib1F1、lib1F2、及びlib1F3は、内部リピートモジュールライブラリー(L型モジュールと呼ぶ)の組み立てのために使用した6つのオリゴヌクレオチドの最初に対応する。位置4では、lib1F1が残基I及びTを、lib1F2がE、K、及びQを、lib1F3がH及びRをコードする。これらの3つのオリゴヌクレオチドをモル比3:2:2で混合し、オリゴヌクレオチド混合物lib1Fを得て、7つの異なるコドンを等量含む、組み立て中の第1のオリゴヌクレオチドとして使用した。オリゴヌクレオチドlib5Fは、無作為化された位置に対応するコドンにトリヌクレオチドホスホラミダイト(Virnekas B. et al., Nucleic Acids Res 22: 5600-7, 1994)を取り込む。トリヌクレオチドホスホラミダイトはGlen Research(USA)により提供され、lib5FはMetabion(ドイツ)により合成された。アセンブリーPCR、連結(モジュールの間及びキャッピングモジュールと)、及びクローニングを実施例1に従って実施した。Ny1F、Ny2R、Ny3R、及びNy4libRbisを、N末端キャッピングモジュールの合成のために使用した。Ca1libF、Ca2libR、Ca3F、Ca4R、Ca5F、及びCa6Rを、C末端キャッピングモジュールの合成のために使用した。lib1F(3:2:2 lib1F1:lib1F2:lib1F3)、lib2R、lib3F、lib4R、lib4R、lib5F、及びlib6Rを、内部リピートモジュールライブラリーの合成のために使用した。libFor及びlib6Rを、定方向での連結後にモジュールの増幅のために使用した。
【0164】
選択されていないライブラリーメンバーの発現
ライブラリーの単一クローンの発現を5ml培養中で実施し、細胞を実施例1に記載の通りに超音波処理により溶解した。欠失又は切断を伴わない全ての選択されていないライブラリーメンバーは可溶性であり、発現収量は、先の実施例に記載する設計されたアルマジロリピートタンパク質と同程度である。
【0165】
実施例6
この実施例では、設計されたアルマジロリピートタンパク質ライブラリーからの特定の結合分子の選択を提示する。SV40核局在化配列(NLSペプチド、ペプチド配列KKKRKV、配列番号98)に対するバインダーを、リボソームディスプレイ(Hanes, J. and Pluckthun, A., PNAS 94: 4937-42, 1997)を使用して選択した。初期ライブラリーを実施例5に記載の通りに組み立て、N末端からC末端までのタンパク質レベルで、1つのNyモジュール、1つのMモジュール、無作為化された位置を伴う3つのMモジュール、1つのMモジュール及び1つのCaモジュールを含む。N末端キャッピングモジュールNyの直後のMモジュール及びC末端キャッピングモジュールの直前のMモジュールは、ライブラリーメンバーの追加安定性及び低下した凝集傾向を提供する。特定の(NLSペプチド)及び非特定の(NeutrAvidin及びcroペプチド)標的に対する選択されたクローンの結合を、粗抽出物ELISAにより評価し、NLSペプチド結合アルマジロリピートタンパク質が上手く選択されたことを示す(図8)。
【0166】
リボソームディスプレイによるNLSペプチド特異的アルマジロリピートタンパク質の選択
NLSペプチド特異的なアルマジロリピートタンパク質の選択は、リボソームディスプレイ(Hanes and Pluckthun, loc. cit.)により、上に記載した設計されたアルマジロリピートタンパク質の初期ライブラリー及び確立されたプロトコール(Zahnd, C., Amstutz, P. and Pluckthun, A, Nat Methods 4: 269-79, 2007)を使用し、いくつかの小さな改変を伴って実施した:(i)翻訳を10分間の代わりに15分間行った、(ii)Herculase II Fusionポリメラーゼ(Stratagene)をRT−PCR及びPCRの工程に使用した、及び(iii)プラスミドpRDVhisCAGをpRDV(GenBank受入番号AY327136)の代わりに使用した。プラスミドpRDVhisCAGはpRDVと同一であり、例外としてpRDVのflagタグ
【表30】


がMRGSタグ
【表31】


により交換されている。対応するN末端メチオニン残基のコドンを太字で示す。さらに、プラスチック結合NeutrAvidin(Pierce)を使用して固定化したビオチン化NLSペプチド(JPT、ベルリン、ドイツ)を選択のための標的として使用し、ライブラリーのプレパニング(Zhand et al., loc. cit.)をNeutrAvidinで実施した。選択されたクローンを、それらの細胞質発現のために、pQE30(Qiagen)に基づく細菌発現ベクター中にサブクローン化した。
【0167】
選択されたクローンは、粗抽出物ELISAにより示される通り、NLSペプチドに特異的に結合する。
選択されたクローン(上で言及した発現ベクター中にクローン化し、次に、大腸菌XL1−Blue(Strategene)中に形質転換した)を、37℃で、96ウェル深底ウェルプレートの各々の中で、1mlの増殖培地(1%グルコース及び100μg/mlアンピシリンを含む2YT)を含む単一ウェル中で一晩増殖させた。50μg/mlアンピシリンを含む1mlの新鮮2YTに、新たな96深底ウェルプレートにおいて、100μlの一晩培養物を接種した。37℃で2時間のインキュベーション後、発現をIPTG(1mM最終濃度)で誘導し、3時間持続させた。細胞を収集し、100μl B−PERII(Pierce)中に再浮遊させ、室温で撹拌しながら15分間インキュベートした。次に、900μl PBS−TB(8mM NaHPO、1.5mM KHPO、137mM NaCl、3mM KCl、0.2% BSA、0.1% Tween 20、pH7.4)を加え、細胞細片を遠心分離により除去した。100μlの各々の溶解クローンを、NLSペプチドもしくは無関係croペプチド(PRTSSF、配列番号101)のいずれか(それらのビオチン成分を介して固定化)又はNeutrAvidin単独を含む、NeutrAvidinコーティングしたMaxiSorpプレートのウェルに適用し、1時間室温でインキュベートした。PBS−T(8mM NaHPO、1.5mM KHPO、137mM NaCl、3mM KCl、0.1% Tween 20、pH7.4)での十分な洗浄後、プレートを、モノクローナル抗RGS(His)4抗体(34650、Qiagen)を一次抗体として、アルカリフォスファターゼと抱合したポリクローナルヤギ抗マウス抗体(A3562、Sigma)を二次試薬として使用した標準的ELISA手順を使用して開発した。結合を、次に、2ナトリウム4−ニトロフェニルリン酸(4NPP、Fluka)をアルカリフォスファターゼの基質として使用することにより検出した。発色を405nmで測定した(図8)。
【0168】
実施例7
この実施例は、事前に選択されたモジュールからの特定の単一モジュールの選択及び新たな特定の設計されたアルマジロリピートタンパク質の生成のための方法を提示する。方法は、定義された標的に対して既に選択された、設計されたアルマジロリピートタンパク質に基づき、それについて、単一モジュールと認識されるペプチド(例えば、ジペプチド)の部分の間の対応が公知である。特定のジペプチドを認識するリピートモジュールを、選択されていないリピートモジュールライブラリーLの隣接モジュールとして使用する。モジュールのこの組み合わせを使用して生成した、設計されたアルマジロリピートタンパク質の収集物を、次に、標的ジペプチド(それについて、リピートモジュールライブラリーを選択しなければならない)と隣接する、既に選択されたリピートモジュールにより認識されるジペプチドを含む標的ペプチドへの結合について選択する。中央の選択されたリピートモジュールを、選択されたリピートタンパク質を発現するクローンから回収し、さらなる使用のために単一の特定リピートモジュールとして保存できる。選択されたリピートモジュールを、次に、事前に定義した特異性を伴う新たなリピートタンパク質において合わせることができる。
【0169】
単一モジュールの選択のための設計されたアルマジロリピート
タンパク質例として、キャッピングリピートモジュールとしてのNy及びCaならびに3つの内部M型モジュールを含む設計されたアルマジロリピートタンパク質の収集物が、ヘキサペプチドの結合のために必要とされ、各内部リピートモジュールがジペプチドを認識することが想定される。
【0170】
ジペプチドの特異的結合に関与するモジュールの配列は、先に選択された、設計されたアルマジロリピートタンパク質に由来しうる。特異性は、結合定数の定性的及び定量的な決定方法(標的ペプチド及び突然変異バージョンの標的ペプチドとの組み合わせ)を使用して評価できる。これらの配列を使用し、第1及び第3の内部モジュール(プレL及びポストLと名付ける)を合成し、ここで追加の唯一の制限酵素部位を、タンパク質配列に影響を及ぼすことなく、DNAレベルで導入する。完全タンパク質をコードするDNA配列を、実施例1に従って、NyL、プレL、L型モジュール、ポストL、及びCaLを使用して組み立てる。NyL、L型モジュール、及びCaLを実施例5に記載する。DNA配列を、次に、選んだ選択システムに適切なベクター中に挿入できる。選択後、より高い親和性を伴うクローンを単離でき、プラスミドは、精製された設計されたアルマジロリピートタンパク質及び導入された制限酵素部位を認識する制限酵素での消化後に回収されたリピートモジュールライブラリーからの内部の選択されたリピートモジュールを含む。モジュールの喪失部分を提供するプライマーを使用したPCR増幅によって、ライブラリーフォーマット中の選択されたリピートモジュールのDNA配列が生成される。
【0171】
選択されたモジュールを、次に、追加の選択工程なしに、新たなバインダーの生成のために保存又は使用できる。方法の一般的模式図を図9に示す。モジュールDNAの回収のための代替物として、配列をシークエンシングにより得て、モジュールを先の実施例に記載するオリゴヌクレオチドから再構築する。
【0172】
事前に選択したモジュールからの設計されたアルマジロリピートタンパク質
ライブラリーフォーマット中の選択されたリピートモジュールを、実施例1に記載の通りに、キャッピングリピートモジュールとしてNyLib及びCaLib(実施例5に記載)を使用して組み立てることができる。選択されたモジュールにより提供される特異的結合のため、新たなタンパク質は、標的として、単一モジュールの標的ジペプチドの組み合わせとして生じるペプチド配列を認識できなければならない(図10)。

【特許請求の範囲】
【請求項1】
アルマジロリピートタンパク質の収集物であって、各アルマジロリピートタンパク質が、アルマジロリピート単位のコンセンサス配列に由来する少なくとも2つの連続リピートモジュールを含む少なくとも1つのリピートドメインを含み、該アルマジロリピートタンパク質の少なくとも1つが、標的ポリペプチドに結合することができ、該アルマジロリピートタンパク質により結合された該標的ポリペプチドの部分が、伸長したコンホメーションにある収集物。
【請求項2】
リピートドメインの該リピートモジュールの全てが、ベータ−カテニン、プラコグロビン、又はインポーチンアルファリピート単位のいずれかのコンセンサス配列に由来する、請求項1記載の収集物。
【請求項3】
請求項1又は2記載の収集物であって、該リピートモジュールの各々が、アミノ酸配列を有し、アミノ酸残基の少なくとも70%が、
(i)少なくとも2つのアルマジロリピート単位の対応する位置で見出されるアミノ酸残基から推定されるコンセンサスアミノ酸残基;又は
(ii)1つのアルマジロリピート単位中の対応する位置で見出されるアミノ酸残基
のいずれかに対応する収集物。
【請求項4】
アルマジロリピートタンパク質が、アルマジロリピート配列モチーフ
【表32】


を伴うリピートモジュールを含み、「x」は任意のアミノ酸を示し、「a」は残基A、F、G、I、L、M、P、T、V、W及びYのいずれかを示し、「p」は残基A、C、D、E、G、H、K、N、P、Q、R、S、T及びYのいずれかを示す、請求項1記載の収集物。
【請求項5】
アルマジロリピートタンパク質が、アルマジロリピート配列モチーフ
【表33】


を伴うリピートモジュールを含み、「1」及び「2」は任意のアミノ酸残基を表わす、請求項4記載の収集物。
【請求項6】
該アルマジロリピートタンパク質が、アルマジロリピート配列モチーフ
【表34】


を伴うリピートモジュールを含み、「x」は任意のアミノ酸を示し、「a」は残基A、F、G、I、L、M、P、T、V、W及びYのいずれかを示し、「p」は残基A、C、D、E、G、H、K、N、P、Q、R、S、T及びYのいずれかを示す、請求項1記載の収集物。
【請求項7】
該アルマジロリピートタンパク質が、アルマジロリピート配列モチーフ
【表35】


を伴うリピートモジュールを含み、「1」及び「2」は任意のアミノ酸残基を表わす、請求項6記載の収集物。
【請求項8】
該アルマジロリピートタンパク質が、アルマジロリピート配列モチーフ
【表36】


を伴うリピートモジュールを含み、「x」は任意のアミノ酸を示し、「a」は残基A、F、G、I、L、M、P、T、V、W及びYのいずれかを示し、「p」は残基A、C、D、E、G、H、K、N、P、Q、R、S、T及びYのいずれかを示す、請求項1記載の収集物。
【請求項9】
該アルマジロリピートタンパク質が、アルマジロリピート配列モチーフ
【表37】


を伴うリピートモジュールを含み、「1」及び「2」は任意のアミノ酸残基を表わす、請求項8記載の収集物。
【請求項10】
該アルマジロリピートタンパク質が、アルマジロリピート配列モチーフ
【表38】


を伴うリピートモジュールを含み、「x」は任意のアミノ酸を示し、「s」は残基A、I、L、V及びGからなる群より選択されるアミノ酸残基を表わし、「h」は残基A、I、L及びVからなる群より選択されるアミノ酸残基を表わす、請求項1記載の収集物。
【請求項11】
該アルマジロリピートタンパク質が、アルマジロリピート配列モチーフ
【表39】


を伴うリピートモジュールを含み、「1」及び「2」は任意のアミノ酸残基を表わす、請求項10記載の収集物。
【請求項12】
コンセンサス配列中の30%までのアミノ酸残基を、対応するリピート単位中の対応する位置で見出されるアミノ酸残基により交換する、請求項1〜11のいずれか一項記載の収集物。
【請求項13】
該リピートドメインが、N末端キャッピングモジュールそれに続く非ライブラリーリピートモジュール、及び/又はC末端キャッピングモジュールそれに先行する非ライブラリーリピートモジュールをさらに含み、該キャッピングモジュールが該リピートモジュールの任意の1つとは異なるアミノ酸配列を有する、請求項1〜12のいずれか一項記載の収集物。
【請求項14】
請求項13記載の収集物であって、該N及び/又はC末端キャッピングモジュールの各々が、アミノ酸配列を有し、アミノ酸残基の少なくとも50%が、
(i)少なくとも2つのリピート単位又はキャッピング単位の対応する位置で見出されるアミノ酸残基から推定されるコンセンサスアミノ酸残基;又は
(ii)リピート単位又はキャッピング単位中の対応する位置で見出されるアミノ酸残基のいずれかに対応する収集物。
【請求項15】
N末端キャッピングモジュールが、配列モチーフ
【表40】


を含む、請求項13記載の収集物。
【請求項16】
C末端キャッピングモジュールが、配列モチーフ
【表41】


を含む、請求項13記載の収集物。
【請求項17】
該アルマジロリピートタンパク質の該アルマジロリピートドメインもしくは該リピートドメインの部分、又は該アルマジロリピートタンパク質の単一リピートモジュールの、請求項1〜16記載のアルマジロリピートタンパク質の収集物をコードする核酸分子の収集物。
【請求項18】
アルマジロリピートタンパク質が設計されたアルマジロリピートタンパク質であり、標的分子に結合することができる、請求項1〜16のいずれか一項記載の収集物からのアルマジロリピートタンパク質。
【請求項19】
アルマジロリピートタンパク質が事前に決定された特性を有する、請求項1〜16のいずれか一項記載の収集物からのアルマジロリピートタンパク質。
【請求項20】
請求項18又は19記載のアルマジロリピートタンパク質をコードする核酸。
【請求項21】
選択を実施することなく標的ポリペプチドに結合することができるアルマジロリピートドメインを得るための方法であって、標的ポリペプチドが伸長したコンホメーションにあり、該リピートドメインが、該標的ポリペプチド中に含まれるアミノ酸の小さな直線状ストレッチについて定義された結合特異性を有する事前に決定されたリピートモジュールから組み立てられる方法。
【請求項22】
アミノ酸の小さな直線状ストレッチについて定義された結合特異性を有するアルマジロリピートモジュールを得るための方法であって、以下の工程
(a)複数の内部リピートモジュールを含むアルマジロリピートタンパク質の推定又は入手;
(b)該アルマジロリピートタンパク質の内部リピートモジュールをリピートモジュールライブラリーにより交換することによるアルマジロリピートタンパク質ライブラリーの生成;
(c)アミノ酸の小さな直線状ストレッチを含む標的(ポリ)ペプチドへの結合能に従った該リピートタンパク質ライブラリーからのアルマジロリピートタンパク質の選択;
(d)アミノ酸の該ストレッチに特異性を有する工程(c)からの選択された該アルマジロリピートタンパク質からの選択されたリピートモジュールの単離
を含む、方法。
【請求項23】
標的(ポリ)ペプチドに結合することができるアルマジロリピートタンパク質を得るための方法であって、以下の工程
(a)標的(ポリ)ペプチドの結合部分に関与する単一のアルマジロリピートモジュールに対応する核酸配列の推定又は入手;
(b)請求項1〜16記載のアルマジロリピートタンパク質をコードし、工程(a)に由来する核酸配列を含む核酸分子の構築;及び
(c)工程(b)に由来する核酸分子からのアルマジロリピートタンパク質の発現;及び
(d)該標的(ポリ)ペプチドに結合することができる少なくとも1つのアルマジロリピートタンパク質を得るための該アルマジロリピートタンパク質のスクリーニング及び/又は該アルマジロリピートタンパク質からの選択
を含む、方法。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9A】
image rotate

【図9B】
image rotate

【図9C】
image rotate

【図10】
image rotate


【公表番号】特表2010−539915(P2010−539915A)
【公表日】平成22年12月24日(2010.12.24)
【国際特許分類】
【出願番号】特願2010−526268(P2010−526268)
【出願日】平成20年9月23日(2008.9.23)
【国際出願番号】PCT/EP2008/062671
【国際公開番号】WO2009/040338
【国際公開日】平成21年4月2日(2009.4.2)
【出願人】(507324681)ユニバーシティ・オブ・チューリッヒ (7)
【氏名又は名称原語表記】UNIVERSITY OF ZURICH
【Fターム(参考)】