説明

普遍的な分子認識のための、植物のキメラ結合ポリペプチド

本発明は、植物の足場ポリペプチド配列に基づくキメラ結合ポリペプチドをコードする核酸ライブラリーを提供する。該ライブラリーを生成する方法についても記載している。


【発明の詳細な説明】
【背景技術】
【0001】
背景
標的に対するタンパク質の結合特異性および結合親和性は、主に一つまたは複数の結合領域内におけるタンパク質のアミノ酸配列によって決まる。したがって、関連領域のアミノ酸配列を変えることで、タンパク質の結合特性が再構成される。
【0002】
実際は、タンパク質結合の組み合わせの変更は、免疫システムがもたらす免疫グロブリンの巨大な配列によって最もよく例示される。各免疫グロブリンには、超可変領域(すなわち、タンパク質結合ドメイン)として公知の短い、実質的に固有のアミノ酸配列の一セット、および定常領域として公知のより長い、不変配列の別の一セットが含まれる。免疫グロブリン集団における超可変領域間の大きな配列多様性にもかかわらず、定常領域はタンパク質の三次構造を安定化させるβシートを形成する。各セットの超可変領域によって結合特異性および結合親和性が付与される。2本の重鎖免疫グロブリンと2本の軽鎖免疫グロブリンが大きなタンパク質複合体(すなわち、抗体)へと集合することによって、多様な結合活性を有する組み合わせの数がさらに増える。
【0003】
抗体の結合多様性は、多くの生物医学的および工業的な用途において大いに活用されている。例えば、人工的に多様化させた超可変領域を持つ免疫グロブリンを発現するライブラリーが構築されている。標的分子(例、受容体または受容体リガンド)に対する高親和性抗体を同定する際に、免疫グロブリン発現ライブラリーは非常に有用である。次に、同定した免疫グロブリンをコードする核酸を単離して、宿主細胞または生物において発現させることができる。
【0004】
しかし、一般的な免疫グロブリンおよび抗体の有用性にもかかわらず、遺伝子導入植物におけるそれらの発現には問題が起りうる。免疫グロブリンは植物の細胞質において適当に折り畳まれない可能性があり、これは免疫グロブリンが複数のジスルフィド結合の形成を必要とするからである。さらに、免疫グロブリンのサイズが大きいため、一部の植物の害虫での免疫グロブリンの効果的な取り込みが妨げられる。このため、免疫グロブリンは、タンパク質性の殺虫剤や殺虫剤の標的分子としては有用ではない場合が多い。最後に、食用植物における免疫グロブリン(例、いわゆる「植物抗体」)などの哺乳動物のタンパク質を発現させることにより、需要者承認の潜在的な問題を引き起こすため、商品化の障害となる。このために、遺伝子導入植物における多くのインプットおよびアウトプット特性のための植物抗体の使用が事実上妨げられうる。
【0005】
免疫グロブリンに関する上記欠点は、他のクラスの構造的に耐性なタンパク質、好ましくは植物由来タンパク質から多様な結合タンパク質ライブラリーを生成することで回避できる。これらのライブラリーをスクリーニングして、対象の標的に対する所望の特異性および親和性で結合する個々のタンパク質を同定できる。その後、同定した結合タンパク質を遺伝子導入植物において効率的に発現させることができる。
【発明の開示】
【0006】
概要
植物のキメラ結合ポリペプチドをコードする多様な核酸ライブラリー、およびその生成方法が、本明細書に記載されている。概念的には、キメラ結合ポリペプチドは、構造的に強固なタンパク質をコードする不変配列のフレームワーク内における高度に変化に富む結合ドメインを特徴とする点で、免疫グロブリンと類似している。しかし、本明細書に記載しているキメラ結合ポリペプチドは、植物のタンパク質配列に由来するため、植物における免疫グロブリン発現に関連する問題の多くを回避できるという重要な利点を有する。コードされた植物のキメラ結合タンパク質のアミノ酸配列は、変化する部分配列を含む足場ポリペプチド配列に由来する。変化した部分配列は、植物のキメラ結合ポリペプチドの推定結合ドメインに一致しており、コードされた植物のキメラ結合タンパク質のライブラリーにおいて異種性が高い。対照的に、コードされたキメラ結合タンパク質の変化した部分配列以外の配列は、親足場ポリペプチド配列と本質的に同じであり、コードされた植物のキメラ結合タンパク質ライブラリーの全てにおいて同種性が高い。このようなライブラリーは、遺伝子導入植物での発現において高い選択性および親和性で結合するタンパク質を選択するための普遍的分子認識プラットホームとして役立つ。
【0007】
したがって、本明細書に記載される一局面は、少なくとも10個(例えば、少なくとも1,000、105、または106)の異なるキメラ結合ポリペプチドをコードする核酸分子ライブラリーである。各ポリペプチドのアミノ酸配列にはC1-X1-C2-X2-C3-X3-C4が含まれ、ここで、C1〜C4は、選択される紫色酸性ホスファターゼに最高30個(例えば、20、10、または5個)の単一アミノ酸の置換、欠失、挿入、または付加を含めてよい紫色酸性ホスファターゼから選択される骨格部分配列(すなわち、SEQ ID NO:それぞれ1〜30、31〜60、61〜90、および91〜120)である。C1〜C4部分配列は、ライブラリーがコードするポリペプチドの多くで同種である。C1〜C4骨格部分配列とは対照的に、X1〜X3部分配列は2〜20個のアミノ酸からなる独立した可変部分配列であり、これらの部分配列はライブラリーのポリペプチドの多くで異種である。例えば、キメラポリペプチドライブラリーは、SEQ ID NO:124〜126の23〜39、51〜49、および79〜84に該当するアミノ酸位置に1〜10個の単一アミノ酸の置換、欠失、挿入、または付加を含む、SEQ ID NO:124〜126の任意の一つのアミノ酸配列を持つことができる。
【0008】
本明細書に記載の別の局面は、前記ライブラリーを生成する方法である。該方法には、上記で定義したC1-X1-C2-X2-C3-X3-C4を含む植物足場ポリペプチド配列をコードする親核酸を提供する工程が含まれる。該方法には、親のX1、X2、またはX3部分配列に最高10個の単一アミノ酸の置換、欠失、挿入、または付加を導入する条件下での親核酸(例えば、少なくとも一つのX1〜X3部分配列がSEQ ID NO:121〜123から選択される)の複製がさらに含まれ、それにより、X1、X2、またはX3をコードするランダムに変化した部分配列の異種集団を生成する。次に、集団の変化部分配列を、X1、X2、またはX3をコードする核酸に対応する位置の親核酸集団に置換させる。インビトロ(例えば、精製された変異誘発性ポリメラーゼまたはヌクレオチド類似体を使用)またはインビボ(例えば、大腸菌(E. coli)の変異原性株内)での複製により、親の核酸部分配列にアミノ酸の置換、欠失、挿入、または付加を導入できる。前記ライブラリーを生物学的な複製システム(例えば、大腸菌またはバクテリオファージ)に導入して、増幅させることができる。
【0009】
本明細書に記載の関連する局面は、上記核酸ライブラリーの別の生成方法である。該方法には、上記で定義したC1-X1-C2-X2-C3-X3-C4を含むアミノ酸配列を選択する工程が含まれる。該方法には、さらに、オーバーラップ相補配列を有するオリゴヌクレオチドの第1および第2のセットを提供する工程が含まれる。第1セットのオリゴヌクレオチドは、C1〜C4部分配列および多数の異種のX1〜X3部分配列をコードする。第2セットのオリゴヌクレオチドは、C1〜C4部分配列および多数の異種のX1〜X3部分配列をコードするヌクレオチド配列と相補的である。2つのセットのオリゴヌクレオチドを合わせて第1混合物を作り、オーバーラップ相補配列のハイブリダイゼーションを可能にする条件下でインキュベートする。次に、結果として得られたハイブリダイズした配列を伸長して、上記ライブラリーを含む第2混合物を作る。
【0010】
本発明のさらに別の局面は、キメラ結合ポリペプチドをコードする核酸ライブラリーであり、このそれぞれがSEQ ID NO:127〜129 のいずれかと少なくとも70%(つまり、70%〜100%の任意のパーセンテージ)同一のアミノ酸配列を含む。コードされた各ポリペプチドのアミノ酸配列は、SEQ ID NO:127〜129のアミノ酸配列とは14、15、33、35〜36、38、47〜48、66、68〜69、71、80、81、99、101〜102、および104の位置で異なり、アミノ酸の差異は、複数のコードされたポリペプチド全体で異種である。上で列記した位置以外のコードされた各ポリペプチドのアミノ酸配列は、複数のコードされたキメラポリペプチド全体において同種である。
【0011】
本明細書に記載された、関連する局面は、前記ライブラリーを生成する方法である。該方法には、SEQ ID NO:127〜129のいずれかに対応するアミノ酸配列を選択する工程が含まれ、選択された配列は少なくとも上記の位置でSEQ ID NO:127〜129とは異なる。該方法には、さらに、オーバーラップ相補配列を有する第1および第2のセットのオリゴヌクレオチドを提供する工程が含まれる。第1セットのオリゴヌクレオチドは選択されたアミノ酸配列の部分配列をコードしており、該部分配列が上記位置において異種である。第2セットのオリゴヌクレオチドは、選択されたアミノ酸配列の部分配列をコードするヌクレオチド配列と相補的であり、該部分配列が上記位置において異種である。2つのセットのオリゴヌクレオチドを合わせて第1混合物を作り、オーバーラップ相補配列のハイブリダイゼーションを可能にする条件下でインキュベートする。次に、結果として得られたハイブリダイズした配列を伸長して、上記ライブラリーを含む第2混合物を作る。
【0012】
本発明の様々な実施方法には以下の一つまたは複数を含めることができる。例えば、ライブラリーの各核酸にはベクター配列を含めてよい。上記ライブラリーの一つから単離された任意の核酸およびそれがコードする純粋な形態のキメラ結合ポリペプチドも特徴とする。
【0013】
一実施方法では、ライブラリーの一つがコードするキメラ結合ポリペプチドを発現する細胞集団(または細胞集団から選択された個々の細胞)を提供する。別の実施方法では、核酸ライブラリーの一つがコードする精製されたキメラ結合ポリペプチドのライブラリーを特徴とする。さらに別の実施方法では、核酸ライブラリーの一つがコードするキメラ結合ポリペプチドをディスプレイする繊維状ファージの集団を提供する。
【0014】
オリゴヌクレオチドの集合による上記核酸ライブラリーを生成する方法の様々な実施方法において、以下の一つまたは複数を含めることができる。例えば、該方法には、核酸ライブラリーを含む第2混合物の生成後、核酸集団の変性サイクル、そしてそれに続くハイブリダイゼーションおよび伸長の段階をさらに含むことができる。任意で、このサイクルを反復することができる(例えば、最高100回)。ライブラリー中の全ての核酸のそれぞれの5'および3'末端配列にハイブリダイズするフォワードプライマーおよびリバースプライマーを含む、ポリメラーゼ連鎖反応によって核酸ライブラリーを増幅できる。一実施方法では、可変配列の位置がコードするアミノ酸は、アラニン、アルギニン、アスパラギン、アスパラギン酸、グルタミン、グルタミン酸、グリシン、ヒスチジン、イソロイシン、ロイシン、リジン、メチオニン、フェニルアラニン、プロリン、セリン、トレオニン、トリプトファン、チロシン、システイン、およびバリン(20個の天然アミノ酸)のサブセット(例えば、4、6、8、10、12、14、または16個のみ)から選択される。他の場合、20個中19個を使用する(システインを除く)。他の場合、全20個を使用する。別の実施方法では、アミノ酸のサブセットには、少なくとも一つの脂肪族アミノ酸、一つの酸性アミノ酸、一つの中性アミノ酸、および一つの芳香族アミノ酸(例えば、アラニン、アスパラギン酸、セリン、およびチロシン)が含まれる。
【0015】
少なくとも10個の異なるポリペプチドをコードする核酸ライブラリーが本明細書に記載されており、各ポリペプチドのアミノ酸配列はC1-X1-C2-X2-C3-X3-C4を含み、
(i) 部分配列C1がSEQ ID NO:1〜30から選択され、部分配列C2がSEQ ID NO:31〜60から選択され、部分配列C3がSEQ ID NO:61〜90から選択され、部分配列C4がSEQ ID NO:91〜120から選択され、かつC1〜C4のそれぞれが、選択された部分配列に最高10個の単一アミノ酸の置換、欠失、挿入、または付加を含み;
(ii) C1〜C4が複数のコードされたポリペプチドにおいて同種であり;
(iii) X1〜X3のそれぞれが、2〜20個のアミノ酸からなる独立した可変部分配列であり;かつ
X1〜X3のそれぞれが、複数のコードされたポリペプチドにおいて異種である。
【0016】
少なくとも10個の異なるポリペプチドをコードする核酸ライブラリーについても本明細書に記載されており、各ポリペプチドのアミノ酸配列はC1-X1-C2-X2-C3-X3-C4を含み、
(i) 部分配列C1が図2または図4から選択され、部分配列C2が図2または図4から選択され、部分配列C3が図2または図4から選択され、部分配列C4が図2または図4から選択され、かつC1〜C4のそれぞれが、選択された部分配列に最高10個の単一アミノ酸の置換、欠失、挿入、または付加を含み;(ii) C1〜C4が複数のコードされたポリペプチドにおいて同種であり;(iii) X1〜X3のそれぞれが、2〜20個のアミノ酸からなる独立した可変部分配列であり;かつ、X1〜X3のそれぞれが、複数のコードされたポリペプチドにおいて異種である。
【0017】
少なくとも10個の異なるポリペプチドをコードする核酸ライブラリーについても本明細書に記載されており、各ポリペプチドのアミノ酸配列はC1-X1-C2-X2-C3-X3-C4を含み、
(i) 部分配列C1が図3または図5から選択され、部分配列C2が図3または図5から選択され、部分配列C3が図3または図5から選択され、部分配列C4が図3XXから選択され、かつC1〜C4のそれぞれが、選択された部分配列に最高30個の単一アミノ酸の置換、欠失、挿入、または付加を含み;(ii) C1〜C4が複数のコードされたポリペプチドにおいて同種であり;(iii) X1〜X3のそれぞれが、2〜20個のアミノ酸からなる独立した可変部分配列であり;かつ、X1〜X3のそれぞれが、複数のコードされたポリペプチドにおいて異種である。
【0018】
様々な態様では:少なくとも1,000個の異なるポリペプチドがコードされ;少なくとも100,000個の異なるポリペプチドがコードされ;少なくとも1,000,000個の異なるポリペプチドがコードされ;C1〜C4のそれぞれが、選択された部分配列に最高20個の単一アミノ酸の置換、欠失、挿入、または付加を独立して含み;C1〜C4のそれぞれが、選択された部分配列に最高10個の単一アミノ酸の置換、欠失、挿入、または付加を独立して含み;C1〜C4のそれぞれが、選択された部分配列に最高5個の単一アミノ酸の置換、欠失、挿入、または付加を独立して含み;C1〜C4のいずれも、選択された部分配列に単一アミノ酸の置換、欠失、挿入、または付加を含まず;X1〜X3のアミノ酸が植物内で遺伝的にコードされた20個未満のアミノ酸から選択され;X1〜X3のアミノ酸が植物内で遺伝的にコードされた全20個のアミノ酸から選択され;遺伝的にコードされた20個未満のアミノ酸が少なくとも一つの脂肪族アミノ酸、少なくとも一つの酸性アミノ酸、少なくとも一つの中性アミノ酸、および少なくとも一つの芳香族アミノ酸を含み;遺伝的にコードされた20個未満のアミノ酸がアラニン、アスパラギン酸、セリン、およびチロシンを含む。
【0019】
一部の場合、各ポリペプチドのアミノ酸配列は、以下から選択される:
(a) C1=SEQ ID NO:1、C2=SEQ ID NO:31、C3=SEQ ID NO:61、およびC4=SEQ ID NO:91である、C1-X1-C2-X2-C3-X3-C4を含むポリペプチド;
(b) C1=SEQ ID NO:2、C2=SEQ ID NO:32、C3=SEQ ID NO:62、およびC4=SEQ ID NO:92である、C1-X1-C2-X2-C3-X3-C4を含むポリペプチド;ならびに
(c) C1=SEQ ID NO:3、C2=SEQ ID NO:33、C3=SEQ ID NO:63、およびC4=SEQ ID NO:93である、C1-X1-C2-X2-C3-X3-C4を含むポリペプチド。
【0020】
一部の場合、コードされた各ポリペプチドは、C1=SEQ ID NO:X1、C2=SEQ ID NO:X2、C3=SEQ ID NO:X3、およびC4=SEQ ID NO:X4である、C1-X1-C2-X2-C3-X3-C4を含み;SEQ ID NO:130で表される。
【0021】
一部の場合、コードされた各ポリペプチドは、C1=SEQ ID NO:X1、C2=SEQ ID NO:X2、C3=SEQ ID NO:X3、およびC4=SEQ ID NO:X4である、C1-X1-C2-X2-C3-X3-C4を含み;SEQ ID NO:130で表される。
【0022】
一部の態様では、各核酸がベクター配列を含む。
【0023】
ライブラリーから選択される単離核酸、および核酸を発現する単離細胞、およびライブラリーがコードする精製ポリペプチドの精製ライブラリー;ならびにライブラリーがコードするポリペプチドをディスプレイする繊維状ファージの集団についても記載されている。
【0024】
以下の工程を含む、ライブラリーを生成する方法が本明細書に記載されている:(i) アミノ酸配列:C1-X1-C2-X2-C3-X3-C4を含む親ポリペプチドをコードする親核酸を提供する工程であって、部分配列C1がSEQ ID NO:1〜30から選択され、部分配列C2がSEQ ID NO:31〜60から選択され、部分配列C3がSEQ ID NO:61〜90から選択され、部分配列C4がSEQ ID NO:91〜120から選択され、C1〜C4のそれぞれが、選択された部分配列に最高10個の単一アミノ酸の置換、欠失、挿入、または付加を含み;かつX1〜X3のそれぞれが、2〜20個のアミノ酸からなる独立した部分配列である、工程;(ii) X1、X2、またはX3部分配列に最高10個の単一アミノ酸の置換、欠失、挿入、または付加を導入する条件下での親核酸を複製し、それにより、X1'、X2'、またはX3'をコードするランダムに変化した部分配列集団を生成する工程;および(iii) ランダムに変化した部分配列X1'、X2'、またはX3'の集団を、X1、X2、またはX3をコードする集団に対応する位置で親核酸集団へ置換する工程。
【0025】
様々な例において、X1〜X3部分配列の少なくとも一つがSEQ ID NO:121〜123から選択され;C1〜C4のそれぞれが、選択された部分配列に最高20個の単一アミノ酸の置換、欠失、挿入、または付加を独立して含み;C1〜C4のそれぞれが、選択された部分配列に最高10個の単一アミノ酸の置換、欠失、挿入、または付加を独立して含み;C1〜C4のそれぞれが、選択された部分配列に最高5個の単一アミノ酸の置換、欠失、挿入、または付加を独立して含み;C1〜C4のいずれも、選択された部分配列にアミノ酸の置換、欠失、挿入、または付加を含まず;複製によって、X1、X2、またはX3のそれぞれに最高5個のアミノ酸置換が導入されることでランダムに変化した部分配列の異種集団が生成され;方法は、生物学的複製システムへのライブラリーの導入および該生物学的複製システムの増殖によるライブラリーを増幅する工程をさらに含み;生物学的複製システムが複数の大腸菌細胞であり;生物学的複製システムが複数のバクテリオファージであり;複製がインビトロで起こり;複製が精製された変異原性ポリメラーゼによって実施され;複製がヌクレオチド類似体の存在下で実施され;複製がインビボで起こり;インビボでの複製が変異原性種の大腸菌内で起こる。
【0026】
以下の工程を含む、請求項1記載のライブラリーを生成する方法についても記載されている:(i) コードされるアミノ酸配列:C1-X1-C2-X2-C3-X3-C4を含むアミノ酸配列を選択する工程であって、 (a) 部分配列C1がSEQ ID NO:1〜30から選択され、部分配列C2がSEQ ID NO:31〜60から選択され、部分配列C3がSEQ ID NO:61〜90から選択され、かつ部分配列C4がSEQ ID NO:91〜120から選択され、(b) C1〜C4のそれぞれが、選択された部分配列に最高10個の単一アミノ酸の置換、欠失、挿入、または付加を含み、(c) X1、X2、およびX3のそれぞれが、アミノ酸長2〜20個のアミノ酸配列からなる、工程;(ii) 第1および第2の複数のオリゴヌクレオチドを提供する工程であって、(a) 第1の複数のオリゴヌクレオチドが、C1〜C4部分配列および多数の異種のX1〜X3変異部分配列X1'〜X3'をコードし、(b) 第2の複数のオリゴヌクレオチドが、C1〜C4部分配列をコードするヌクレオチド配列と相補的であり、かつ多数の異種のX1'X3'部分配列をコードするヌクレオチド配列と相補的であり、および(c) 第1および第2の複数のオリゴヌクレオチドが、互いに相補的なオーバーラップ配列を有する、工程;(iii) オリゴヌクレオチド集団を合わせて第1混合物の形成する工程;(iv) オーバーラップ相補配列のハイブリダイゼーションに効果的な条件下で混合物をインキュベートして、複数のハイブリダイズした相補配列を形成する工程;ならびに(v) 複数のハイブリダイズした相補配列を伸長して、ライブラリーを含む第2混合物を形成する工程。
【0027】
様々な例において、C1〜C4のそれぞれが、選択された部分配列に最高20個の単一アミノ酸の置換、欠失、挿入、または付加を独立して含み;C1〜C4のそれぞれが、選択された部分配列に最高10個の単一アミノ酸の置換、欠失、挿入、または付加を独立して含み;C1〜C4のそれぞれが、選択された部分配列に0から最高5個の単一アミノ酸の置換、欠失、挿入、または付加を独立して含み;方法は、段階のサイクルを実施する工程をさらに含み、該段階のサイクルが、第2混合物の温度を、二本鎖DNAを変性するために効果的な温度まで上げることによるライブラリーの変性を含み、(iv)および(v)の工程がこれに続き;方法は、最高100回の段階のサイクルを反復する工程を含み;方法は、本質的にライブラリー、フォワードプライマー、およびリバースプライマーからなるポリメラーゼ連鎖反応によりライブラリーを増幅する工程をさらに含み、該フォワードプライマーおよびリバースプライマーがライブラリーの全ての核酸の5'および3'末端配列にそれぞれハイブリダイズすることができ;X1、X2、またはX3部分配列の各位置においてコードされるアミノ酸が、アラニン、アルギニン、アスパラギン、アスパラギン酸、システイン、グルタミン、グルタミン酸、グリシン、ヒスチジン、イソロイシン、ロイシン、リジン、メチオニン、フェニルアラニン、プロリン、セリン、トレオニン、トリプトファン、チロシン、およびバリンのサブセットから選択され;本明細書で、各単一アミノ酸の置換について選択されるアミノ酸が、少なくとも一つの脂肪族アミノ酸、少なくとも一つの酸性アミノ酸、少なくとも一つの中性アミノ酸、および少なくとも一つの芳香族アミノ酸からなるアミノ酸群から選択され;ならびにアミノ酸群が、アラニン、アスパラギン酸、セリン、およびチロシンからなる。
【0028】
以下の工程を含む、ライブラリーを生成する方法もまた本明細書に記載されている:(i) アミノ酸配列:C1-X1-C2-X2-C3-X3-C4を含む親ポリペプチドをコードする親核酸を提供する工程であって、部分配列C1が図2〜図4から選択され、部分配列C2が図2〜図4から選択され、部分配列C3が図2〜図4から選択され、部分配列C4が図2〜図4から選択され、C1〜C4のそれぞれが、選択された部分配列に最高10個の単一アミノ酸の置換、欠失、挿入、または付加を含み;かつX1〜X3のそれぞれが、2〜20個のアミノ酸からなる独立した部分配列である、工程;(ii) X1、X2、またはX3部分配列に最高10個の単一アミノ酸の置換、欠失、挿入、または付加を導入する条件下で親核酸を複製し、それにより、X1'、X2'、またはX3'をコードするランダムに変化した部分配列集団を生成する工程;および(iii) ランダムに変化した部分配列X1'、X2'、またはX3'の集団を、X1、X2、またはX3をコードする集団に対応する位置で親核酸集団へ置換する工程。
【0029】
様々な態様では、X1〜X3部分配列の少なくとも一つがSEQ ID NO:121〜123から選択され;C1〜C4のそれぞれが、選択された部分配列に最高20個の単一アミノ酸の置換、欠失、挿入、または付加を独立して含み;C1〜C4のそれぞれが、選択された部分配列に最高10個の単一アミノ酸の置換、欠失、挿入、または付加を独立して含み;C1〜C4のそれぞれが、選択された部分配列に最高5個の単一アミノ酸の置換、欠失、挿入、または付加を独立して含み;C1〜C4のいずれも、選択された部分配列にアミノ酸の置換、欠失、挿入、または付加を含まず;複製によって、X1、X2、またはX3のそれぞれに最高5個のアミノ酸置換が導入されることでランダムに変化した部分配列の異種集団が生成され;方法は、生物学的複製システムへのライブラリーの導入および該生物学的複製システムの増殖によりライブラリーを増幅する工程をさらに含み;生物学的複製システムが、複数の大腸菌細胞であり;生物学的複製システムが、複数のバクテリオファージであり;複製がインビトロで起こり;複製が精製された変異原性ポリメラーゼによって実施され;複製がヌクレオチド類似体の存在下で実施され;複製がインビボで起こり;インビボでの複製が変異原性種の大腸菌内で起こる。
【0030】
以下の工程を含む、ライブラリーを生成する方法についても記載されている:(i) コードされるアミノ酸配列C1-X1-C2-X2 C3 X3-C4を含むアミノ酸配列を選択する工程であって、(a) 部分配列C1が図2〜図4から選択され、部分配列C2が図2〜図4から選択され、部分配列C3が図2〜図4から選択され、部分配列C4が図2〜図4から選択され、(b) C1〜C4のそれぞれが、選択された部分配列に最高10個の単一アミノ酸の置換、欠失、挿入、または付加を含み、(c) X1、X2、およびX3のそれぞれが、アミノ酸長2〜20個のアミノ酸配列からなる、工程;(ii) 第1および第2の複数のオリゴヌクレオチドを提供する工程であって、(a) 第1の複数のオリゴヌクレオチドが、C1〜C4部分配列および多数の異種のX1〜X3変異部分配列X1'〜X3'をコードし、(b) 第2の複数のオリゴヌクレオチドが、C1〜C4部分配列をコードするヌクレオチド配列と相補的でありかつ多数の異種のX1'〜X3'部分配列をコードするヌクレオチド配列と相補的であり、(c) 第1および第2の複数のオリゴヌクレオチドが、互いに相補的なオーバーラップ配列を有する、工程;(iii) オリゴヌクレオチド集団を合わせて第1混合物を形成する工程;(iv) オーバーラップ相補配列のハイブリダイズに効果的な条件下で混合物をインキュベートして複数のハイブリダイズした相補配列を形成する工程;ならびに(v) 複数のハイブリダイズした相補配列を伸長して、ライブラリーを含む第2混合物を生成する工程。
【0031】
様々な場合において、C1〜C4のそれぞれが、選択された部分配列に最高20個の単一アミノ酸の置換、欠失、挿入、または付加を独立して含み;C1〜C4のそれぞれが、選択された部分配列に最高10個の単一アミノ酸の置換、欠失、挿入、または付加を独立して含み;C1〜C4のそれぞれが、選択された部分配列に0から最高5個の単一アミノ酸の置換、欠失、挿入、または付加を独立して含み;方法は、段階のサイクルを実施する工程をさらに含み、該段階のサイクルが、第2混合物の温度を、二本鎖DNAを変性するために効果的な温度まで上げることによるライブラリーの変性を含み、(iv)および(v)の工程がこれに続き;方法は、最高100回の段階のサイクルを反復する工程をさらに含み;方法は、本質的にライブラリー、フォワードプライマー、およびリバースプライマーからなるポリメラーゼ連鎖反応によりライブラリーを増幅する工程をさらに含み、該フォワードプライマーおよびリバースプライマーがライブラリーの全ての核酸の5'および3'末端配列にそれぞれハイブリダイズすることができ;X1、X2、またはX3部分配列の各位置においてコードされるアミノ酸が、アラニン、アルギニン、アスパラギン、アスパラギン酸、システイン、グルタミン、グルタミン酸、グリシン、ヒスチジン、イソロイシン、ロイシン、リジン、メチオニン、フェニルアラニン、プロリン、セリン、トレオニン、トリプトファン、チロシン、およびバリンのサブセットから選択され;各単一アミノ酸の置換について選択されるアミノ酸が、少なくとも一つの脂肪族アミノ酸、少なくとも一つの酸性アミノ酸、少なくとも一つの中性アミノ酸、および少なくとも一つの芳香族アミノ酸からなるアミノ酸群から選択され;ならびにアミノ酸群が、アラニン、アスパラギン酸、セリン、およびチロシンからなる。
【0032】
以下の工程を含む、ライブラリーを生成する方法についても開示されている:(i) アミノ酸配列:C1-X1-C2-X2-C3-X3-C4を含む親ポリペプチドをコードする親核酸の提供する工程であって、部分配列C1が図3または図5から選択され、部分配列C2が図3または図5から選択され、部分配列C3が図3または図5から選択され、部分配列C4が図3または図5から選択され、C1〜C4のそれぞれが、選択された部分配列に最高10個の単一アミノ酸の置換、欠失、挿入、または付加を含み;X1〜X3のそれぞれが、2〜20個のアミノ酸からなる独立した部分配列である、工程;(ii) X1、X2、またはX3部分配列に最高10個の単一アミノ酸の置換、欠失、挿入、または付加を導入する条件下で親核酸を複製し、それにより、X1'、X2'、またはX3'をコードするランダムに変化した部分配列集団を生成する工程;および(iii) ランダムに変化した部分配列X1'、X2'、またはX3'の集団を、X1、X2、またはX3をコードする集団に対応する位置で親核酸集団へ置換する工程。
【0033】
様々な例において、X1〜X3部分配列の少なくとも一つがSEQ ID NO:121〜123から選択され;C1〜C4のそれぞれが、選択された部分配列に最高20個の単一アミノ酸の置換、欠失、挿入、または付加を独立して含み;C1〜C4のそれぞれが、選択された部分配列に最高10個の単一アミノ酸の置換、欠失、挿入、または付加を独立して含み;C1〜C4のそれぞれが、選択された部分配列に最高5個の単一アミノ酸の置換、欠失、挿入、または付加を独立して含み;C1〜C4のそれぞれが、選択された部分配列にアミノ酸の置換、欠失、挿入、または付加を含み;C1〜C4のいずれも、選択された部分配列にアミノ酸の置換、欠失、挿入、または付加を含まず;複製によって、X1、X2、またはX3のそれぞれに最高5個のアミノ酸置換が導入されることでランダムに変化した部分配列の異種集団が生成され;方法は、生物学的複製システムへのライブラリーの導入および該生物学的複製システムの増殖によるライブラリーを増幅する工程をさらに含み;生物学的複製システムが複数の大腸菌細胞であり;生物学的複製システムが複数のバクテリオファージであり;複製がインビトロで起こり;複製が精製された変異原性ポリメラーゼによって実施され;複製がヌクレオチド類似体の存在下で実施され;複製がインビボで起こり;インビボでの複製が変異原性種の大腸菌内で起こる。
【0034】
以下の工程を含む、ライブラリーを生成する方法についても記載されている:(i) コードされるアミノ酸配列C1-X1-C2-X2-C3-X3-C4を含むアミノ酸配列を選択する工程であって、(a) 部分配列C1が図3〜図5から選択され、部分配列C2が図3〜図5から選択され、部分配列C3が図3〜図5から選択され、部分配列C4が図3〜図5から選択され、(b) C1〜C4のそれぞれが、選択された部分配列に最高10個の単一アミノ酸の置換、欠失、挿入、または付加を含み、(c) X1、X2、およびX3のそれぞれが、アミノ酸長2〜20個のアミノ酸配列配列からなる、工程;(ii) 第1および第2の複数のオリゴヌクレオチドを提供する工程であって、(a) 第1の複数のオリゴヌクレオチドが、C1〜C4部分配列および多数の異種のX1〜X3変異部分配列X1'〜X3'をコードし、(b) 第2の複数のオリゴヌクレオチドが、C1〜C4部分配列をコードするヌクレオチド配列と相補的でありかつ多数の異種のX1'〜X3'部分配列をコードするヌクレオチド配列と相補的であり、および(c) 第1および第2の複数のオリゴヌクレオチドが、互いに相補的なオーバーラップ配列を有する、工程;(iii) オリゴヌクレオチド集団を合わせて第1混合物を形成する工程;(iv) オーバーラップ相補配列のハイブリダイズに効果的な条件下で混合物をインキュベートして、複数のハイブリダイズした相補配列を形成する工程;ならびに(v) 複数のハイブリダイズした相補配列を伸長して、ライブラリーを含む第2混合物を生成する工程。
【0035】
様々な態様では:C1〜C4のそれぞれが、選択された部分配列に最高20個の単一アミノ酸の置換、欠失、挿入、または付加を独立して含み;C1〜C4のそれぞれが、選択された部分配列に最高10個の単一アミノ酸の置換、欠失、挿入、または付加を独立して含み;C1〜C4のそれぞれが、選択された部分配列に0から最高5個の単一アミノ酸の置換、欠失、挿入、または付加を独立して含み;方法は、段階のサイクルを実施する工程をさらに含み、該段階のサイクルが、第2混合物の温度を、二本鎖DNAを変性するために効果的な温度まで上げることによるライブラリーの変性を含み、(iv)および(v)の工程がこれに続き;方法は、最高100回の段階のサイクルを反復する工程をさらに含み;方法は、本質的にライブラリー、フォワードプライマー、およびリバースプライマーからなるポリメラーゼ連鎖反応によりライブラリーを増幅する工程をさらに含み、該フォワードプライマーおよびリバースプライマーがライブラリーの全ての核酸の5'および3'末端配列にそれぞれハイブリダイズすることができ;X1、X2、またはX3部分配列の各位置においてコードされるアミノ酸が、アラニン、アルギニン、アスパラギン、アスパラギン酸、システイン、グルタミン、グルタミン酸、グリシン、ヒスチジン、イソロイシン、ロイシン、リジン、メチオニン、フェニルアラニン、プロリン、セリン、トレオニン、トリプトファン、チロシン、およびバリンのサブセットから選択され;各単一アミノ酸の置換について選択されるアミノ酸が、少なくとも一つの脂肪族アミノ酸、少なくとも一つの酸性アミノ酸、少なくとも一つの中性アミノ酸、および少なくとも一つの芳香族アミノ酸からなるアミノ酸群から選択され;ならびにアミノ酸群が、アラニン、アスパラギン酸、セリン、およびチロシンからなる。
【0036】
少なくとも10個の異なるポリペプチドをコードする核酸ライブラリーについても記載されており:(i) コードされた各ポリペプチドのアミノ酸配列が、SEQ ID NO:127〜129のいずれかと少なくとも70%の同一性を有するアミノ酸配列を含み;(ii) コードされた各ポリペプチドのアミノ酸配列が、14、15、33、35〜36、38、47〜48、66、68〜69、71、80、81、99、101〜102、および104の位置で、SEQ ID NO:127〜129とは異なるアミノ酸を含み、かつアミノ酸の差異が複数のコードされたポリペプチド全体において異種であり;かつ(iii) SEQ ID NO:127〜129の14、15、33、35〜36、38、47〜48、66、68〜69、71、80、81、99、101〜102、および104の位置に対応する残基以外のコードされた各ポリペプチドのアミノ酸配列が、複数のコードされたポリペプチド全体において同種である。
【0037】
様々な態様において、ポリペプチドのアミノ酸配列は、SEQ ID NO:127〜129のいずれかと少なくとも75%の同一性を有する;ポリペプチドのアミノ酸配列は、SEQ ID NO:127〜129のいずれかと少なくとも80%の同一性を有し;およびポリペプチドのアミノ酸配列は、SEQ ID NO:127〜129のいずれかと少なくとも85%の同一性を有し;各核酸がベクター配列を含む。ライブラリーから選択される、ポリペプチドをコードする単離核酸についても開示されている:核酸がコードする精製ポリペプチド;ライブラリーがコードするポリペプチドを発現する細胞の集団;細胞の集団から選択された細胞;ライブラリーがコードするポリペプチドの精製ライブラリー;ライブラリーがコードするポリペプチドのライブラリーをディスプレイする繊維状ファージの集団。
【0038】
以下の工程を含む、ライブラリーを生成する方法も開示されている:(i) コードされるSEQ ID NO:127〜129のいずれか一つに対応するアミノ酸配列を選択する工程であって、選択された配列が、可変位置14、15、33、35〜36、38、47〜48、66、68〜69、71、80、81、99、101〜102、および104の少なくとも一つにおいてSEQ ID NO:127〜129の配列とは異なる、工程;(ii) 第1および第2の複数のオリゴヌクレオチドを化学的に提供する工程であって、(a) 第1の複数のオリゴヌクレオチドが、選択されたアミノ酸配列のアミノ酸部分配列をコードし、該部分配列が、コードされた可変位置で異種であり;(b) 第2の複数のオリゴヌクレオチドが、選択されたアミノ酸配列の部分配列をコードするヌクレオチド配列と相補的であり、部分配列が、コードされた可変位置で異種であり;ならびに(c) 第1および第2の複数のオリゴヌクレオチドが、互いに相補的なオーバーラップ配列を含む、工程;(iii) オリゴヌクレオチド集団を合わせて第1混合物を形成する工程;(iv) オーバーラップ相補配列のハイブリダイズに効果的な条件下で混合物をインキュベートして、複数のハイブリダイズした相補配列を形成する工程;ならびに(v) 複数のハイブリダイズした相補配列を伸長して、ライブラリーを含む第2混合物を生成する工程。
【0039】
様々な例において、方法は、段階のサイクルが、第2混合物の温度を二本鎖DNAを変性するために効果的な温度まで上げることによるライブラリーの変性を実施する工程をさらに含み、(iv)および(v)の工程がこれに続き;方法は、最高100回の段階のサイクルを反復する工程をさらに含み;方法は、本質的にライブラリー、フォワードプライマー、およびリバースプライマーからなるポリメラーゼ連鎖反応によりライブラリーを増幅する工程をさらに含み、該フォワードプライマーおよびリバースプライマーがライブラリーの全ての核酸の5'および3'末端配列にそれぞれハイブリダイズすることができ;可変位置についてコードされるアミノ酸が、アラニン、アルギニン、アスパラギン、アスパラギン酸、システイン、グルタミン、グルタミン酸、グリシン、ヒスチジン、イソロイシン、ロイシン、リジン、メチオニン、フェニルアラニン、プロリン、セリン、トレオニン、トリプトファン、チロシン、およびバリンのサブセットから選択され;可変位置について選択されるアミノ酸が、脂肪族アミノ酸、酸性アミノ酸、中性アミノ酸、および芳香族アミノ酸からなる群から選択され;アミノ酸群が、アラニン、アスパラギン酸、セリン、およびチロシンからなる。
【0040】
本発明の1つまたは複数の態様の詳細について、以下で詳述している。本発明の他の特徴、目的および利点は、明細書および図面ならびに特許請求の範囲から明らかになると考えられる。
【0041】
詳細な説明
植物のキメラ結合ポリペプチドをコードする核酸(例えば、cDNAライブラリー)の多様なライブラリー、およびその生成方法を以下に記載している。コードされた植物のキメラ結合タンパク質ライブラリーのアミノ酸配列は、変化される部分配列を含む足場ポリペプチド配列に由来している。変化させた部分配列は植物のキメラ結合タンパク質の推定結合ドメインに対応しており、かつ植物のキメラ結合タンパク質のライブラリーにおいて異種性が高い。対照的に、変化させた部分配列以外のコードされたキメラ結合タンパク質の配列は、親足場ポリペプチド配列と本質的に同じであり、かつコードされた植物のキメラ結合タンパク質のライブラリー全体において同種性が高い。このように、植物のキメラ結合タンパク質のライブラリーは、遺伝子導入植物での発現において特定の結合タンパク質の選択のための普遍的分子認識ライブラリーのプラットホームとしての役割を果たすことができる。植物のキメラ結合タンパク質のライブラリーは、トランスフェクト細胞によって発現させることができ(すなわち、発現ライブラリーとして)、対象の分子標的との相互作用を試験することができる。例えば、発現ライブラリーをスクリーニングすることで、線虫を含む植物の害虫が発現するポリペプチドと高い特異性および親和性で結合するポリペプチドを同定できる。最終的に、所望の標的結合特性を有する個々のキメラ結合タンパク質を遺伝子導入植物において発現させることができる。
【0042】
I. 植物の足場ポリペプチド配列
植物の足場ポリペプチド配列は、1つまたは複数の領域内の極端な配列変化に対して構造的に認容性のある植物タンパク質に基づくアミノ酸配列である。足場ポリペプチド配列内において変化させる領域は、免疫グロブリンの超可変領域と概念的に類似しており、キメラ結合ポリペプチドにおいて推定結合ドメインを形成する。このように、多様な植物のキメラ結合ポリペプチドをコードする核酸配列の大ライブラリーは、以下で詳述される通り、足場ポリペプチド配列内の特定配列の多様化によって生産できる。
【0043】
植物の足場ポリペプチド配列は、以下の多くの特性を有するように選択される:例えば、(i) 植物原料の配列に由来する;(ii) 構造的に多様な配列の導入を許容するタンパク質をコードする;(iii) 植物において発現された場合にポリペプチドの折り畳みを阻害しないジスルフィド結合のみを含む;(iv) 多様な植物組織において高発現する;(v) 異なる細胞内部位(例えば、細胞質、ミトコンドリア、色素体)を標的にできる、または細胞から分泌できる。これらの特性に基づいて、植物の足場ポリペプチド配列によって、非常に多様な結合活性を有するキメラ結合ポリペプチドの大ライブラリーの生成が可能になる。キメラ結合ポリペプチドのライブラリーを、標的分子への結合についてスクリーニングできる。続いて、所望の結合活性を有するキメラ結合タンパク質を植物において発現させて、インプット特徴(例えば、害虫または病原体に対する耐性、乾燥耐性)やアウトプット特徴(例えば、修飾脂質組成物、ファイトレメディエーション用の重金属結合、医薬的用途)を付与する。このような結合タンパク質は様々な親和性ベースの用途、例えば、サンドウィッチELISAを使用した抗原の診断検出;抗原の組織化学的検出;タンパク質バイオチップの生成;および抗原の親和性精製においても、使用できる。
【0044】
三次構造が既知の植物タンパク質またはタンパク質ドメインの配列に基づく足場ポリペプチド配列を選択することは有用である(例えば、Nygren et al.(2004) 「Binding Proteins from Alternative Scaffolds」 J. of Immun. Methods 290:3-28参照)。しかし、実験的に決定された可能な足場ポリペプチド配列の構造データがなくとも、候補アミノ酸配列のコンピュータ構造解析から有用な推測が収集できる。アミノ酸配列からの構造予測に有用なプログラムとしては、例えば、ホームページ(ics.uci.edu/〜baldig/scratch/index)で公開されているプログラムのパッケージソフト「SCRATCH Protein Predictor」が挙げられる。配列変化の導入によって、足場ポリペプチド配列の既知の、または予測された二次構造が不安定化しないことが重要である。したがって、足場ポリペプチド配列の既知の、または予測された二次構造は、推定結合ドメインを形成するために、足場ポリペプチド配列内において変化させることのできるアミノ酸部分配列の選択に関する情報を与える。特定の足場ポリペプチドの構造的適切性は、例えば、当技術分野において周知のファージディスプレイ発現解析方法によって、容易に試験できる。例えば、安定したタンパク質への折り畳み能について、0、1、2、3またはそれ以上のジスルフィド結合を含む足場ポリペプチド配列を試験することができる。適切に折り畳めないタンパク質は、ファージコート内に取り込まれないために、ディスプレイされない。このように、発現後の安定なタンパク質への折り畳み能のため、必要以上の労力を伴わずに、多くの候補足場ポリペプチド配列の迅速スクリーニングが可能である。
【0045】
植物の足場ポリペプチド配列は、紫色酸性ホスファターゼ(PAP)のアクセサリードメインに基づくことができる。インゲンマメのファセロラス・ブルガリス(Phaseolus vulgaris)のPAPアクセサリードメインの結晶構造が決定されている(Strater et al.(1995), Science 268(5216): 1489-1492)。タンパク質内の3つの露出ループは、免疫グロブリンで認められる超可変領域に似ている。タンパク質の強固な逆並行βシートフレームワークによってループが束ねられる。各ループを形成する部分配列は、PAP由来のキメラ結合タンパク質の推定結合ドメインを形成する。最高10個(例えば、最高3、4、6、8個)のアミノ酸を置換、欠失、挿入、または付加させることでこれらの部分配列を多様化させる。推定結合ドメインを形成するループは、ポケットや割れ目を含む結合標的分子に特に適している。
【0046】
PAPベースの足場ポリペプチド配列は、以下の一般的な形状をとる:
C1-X1-C2-X2-C3-X3-C4
ここで、C1、C2、C3、およびC4は、いくつかの導入された変化を含めてよいが、しかし高度に多様化させていない「骨格」部分配列に対応する。他方、X1、X2、X3は、各PAPベースのキメラ結合タンパク質の推定結合ドメインを形成する高度に変化させた部分配列に対応する。表1には、30個のPAPのアミノ酸配列に由来する、適当なC1〜C4骨格部分配列が示されている。
【0047】
C1、C2、C3、C4は、表1のSEQ ID NO:1〜30、31〜60、61〜90、および91〜120にそれぞれ対応する。
【0048】
X1、X2、およびX3は、例えば、SEQ ID NO:121〜123など表2に示された、対応するPAP配列の天然の変異体をベースにすることができる。表2には、30個の天然PAP配列内のX1、X2、X3にそれぞれ対応する部分配列内の、各アミノ酸位置での領域の変化を示している。または、親可変部分配列であるX1〜X3は、アミノ酸長2〜20個の任意の配列でありえる。
【0049】
いくつかの実施方法では、足場ポリペプチド配列のC1、C2、C3、およびC4は、表1に記載の多数のPAPベースの足場ポリペプチド配列から任意の組み合わせで選択できる。例えば、C1 (SEQ ID NO:5)、C2 (SEQ ID NO:12)、C3 (SEQ ID NO:7)、C4 (SEQ ID NO:19);C1 (SEQ ID NO:5)、C2 (SEQ ID NO:12)、C3 (SEQ ID NO:5)、C4 (SEQ ID NO:12);C4 (SEQ ID NO:22);C1 (SEQ ID NO:17)、C2 (SEQ ID NO:17)、C3 (SEQ ID NO:19)、C4 (SEQ ID NO:1)など。
【0050】
(表1) PAPのアクセサリードメインに基づくSPS


【0051】
(表2) X1、X2、X3(SEQ ID NO:121〜123)に対応するPAP部分配列内の天然の残基の変化

【0052】
足場ポリペプチド配列の上記の部分配列を多様化した後、コードされた植物のキメラ結合ポリペプチドのライブラリー内における多様化X1'、X2'、またはX3'部分配列は異種性が高く、表1に記載のSEQ ID NO:121〜123に関して最高10個(例えば、最高8、6、4、3個)のアミノ酸の置換、欠失、挿入、または付加をそれぞれ含むことができる(例えば、図1参照)。例えば、SEQ ID NO:121〜123に関して、X1、X2、またはX3領域に対応するアミノ酸配列の長さを変更しない、短くする、または長くすることができる。
【0053】
推定結合ドメイン以外の領域は、「骨格」領域(C1、C2、C3、およびC4)と呼ぶ。X1、X2、およびX3のアミノ酸配列とは異なり、骨格領域のアミノ酸配列は、コードされたキメラ結合タンパク質のライブラリー内において一般に実質的に多様化させることはないが、しかしライブラリー内のこれらの領域内でのいくつかの配列変化は許容できる。植物の足場ポリペプチド配列の骨格領域は、SEQ ID NO:1〜120のいずれかと少なくとも70%(80、85、90、95、98、または100%)同一でありえる。または、骨格領域は、最高30個(28、26、24、22、20、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、または1個)の単一アミノ酸の置換、欠失、挿入、または付加を含めることができる。例えば、C1、C2、C3、およびC4は、0、1、2、3、4、もしくは5またはそれ以上の単一アミノ酸の変化をそれぞれ含むことができる。アミノ酸置換を骨格領域内に導入する場合、保存的置換の作製が好ましい。保存的置換は、アミノ酸を、同様の化学特性を有するアミノ酸により置換することである(例えば、セリンなどの極性アミノ酸を、トレオニンなどの別の極性アミノ酸により置換すること)。
【0054】
一態様では、植物の足場ポリペプチド配列は、以下に示すSEQ ID NO:124〜126の一つである。X1、X2、およびX3に対応する配列は太字および下線で示す。

【0055】
一態様では、植物の足場ポリペプチド配列は、アンキリン様リピートを有する植物タンパク質のアミノ酸配列に基づいている。アンキリン様リピートは約33個のアミノ酸からなる小さなターン-ヘリックス-ヘリックス(THH)リピートである。足場ポリペプチド配列内のTHHリピート数は、2〜20まで変動しうる。THHリピート内の推定結合部位は、典型的には隣接していないが、しかしそれらが形成するタンパク質の同じ側に集まっている。
【0056】
植物の、THHリピート含有足場ポリペプチド配列は、以下に記載のSEQ ID NO:127〜129のいずれかをベースとするアミノ酸配列を持つことができる。高レベルなアミノ酸配列変化が、太字/下線で示した残基に導入されている。植物の、THHリピート含有足場ポリペプチド配列は、SEQ ID NO:127〜129の残基12〜13、33、35〜36、38、46〜47、66、68〜69、71、79〜80、99、101〜102、104、および112〜113(残基は太字/下線で示す)に対応するアミノ酸の位置に、最高3個のアミノ酸の置換または欠失を含めることができる。

【0057】
足場ポリペプチド配列の配列は、SEQ ID NO:127〜129の前記アミノ酸位置(太字)以外の配列と少なくとも70%(すなわち、80、85、90、95、98、または100%)の同一性を有することができる。または、SEQ ID NO:127〜129の前記アミノ酸位置(太字)以外の足場ポリペプチド配列の配列は、最高30個(すなわち、28、26、24、22、20、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、または1個)の単一アミノ酸の置換、欠失、挿入、または付加を含めてよい。いくつかの場合、追加のリピート単位を含むことが望ましい。SEQ ID NO:127〜129は、アミノ末端キャップ、2つの内部リピート、およびカルボキシ末端キャップを有する。1〜6個の内部リピートを有することが望まれうる。アミノ末端キャップ配列は、aa1〜33である。第1の内部リピートは、34〜66であり、第2の内部リピートは67〜99である。カルボキシ末端キャップ配列はaa100〜123である。第1または第2の内部リピート、もしくは両方が独立して1、2、3、4、5、または6回反復することができる。
【0058】
推定結合領域は、足場ポリペプチド配列によって形成される強固な二次構造から突出するアミノ酸側鎖によって形成される。これらのタンパク質は、典型的には、より大きくより平らな結合表面を形成でき、深い割れ目やポケットのない標的に結合する際に特に有用である。
【0059】
別の適当な足場は、オリザシスタチンを基本としており(J Biol Chem 262:16793 (1987); Biochemistry 39:14753 (2000))、イネのシステインプロテイナーゼ阻害剤として同定されたシスタチン/パパインファミリー(Pfam Identifier PF00031)のメンバーである。オリザシスタチンの配列を以下に示している。X1、X2、X3、およびX4のそれぞれが可変領域であり、かつC1、C2、C3、およびC4が骨格領域である、アミノ酸配列C1-X1-C2-X2-C3-X3-C4を有する足場は、オリザシスタチンに基づいて創製できる。

【0060】
図2は、オリザシスタチンと比較した多数の植物タンパク質の配列を示している。適当なC1〜C4領域の例を示している。図4は、オリザシスタチンと比較した少数の植物タンパク質の配列を示している。適当なC1〜C4領域の例を示している。一般に、X1は、2〜20個のランダムなアミノ酸(例えば、3個のアミノ酸)の配列でありえる。X2は、2〜20個のランダムなアミノ酸(例えば、4個のアミノ酸)の配列でありえる。X3は、2〜20個のランダムなアミノ酸(例えば、4個のアミノ酸)の配列でありえる。
【0061】
さらに別の適当なものは、イネのC2タンパク質を基本としており(Biochemistry 42:11625 (2003))、植物の防御シグナルシステムに関与すると考えられるC2ドメインファミリー(Pfam Identifier PF00168)のメンバーである。イネC2の配列を以下に示している。X1、X2、X3、およびX4のそれぞれが可変領域であり、かつC1、C2、C3、およびC4が骨格領域である、アミノ酸配列C1-X1-C2-X2-C3-X3-C4を有する足場は、イネのC2タンパク質に基づいて創製できる。

【0062】
図3は、イネC2と並ぶ多数の植物タンパク質の配列を示している。適当なC1〜C4領域の例を示している。図5は、オリザシスタチンと並ぶ少数の植物タンパク質の配列を示している。適当なC1〜C4領域の例を示している。一般に、X1は、2〜20個のランダムなアミノ酸(例えば、11個のアミノ酸)の配列でありえる。X2は、2〜20個のランダムなアミノ酸(例えば、11個のアミノ酸)の配列でありえる。X3は、2〜20個のランダムなアミノ酸(例えば、12個のアミノ酸)の配列でありえる。
【0063】
以下のセクションでは、植物の足場ポリペプチド配列に基づくキメラ結合タンパク質をコードする核酸ライブラリーを生成する方法を開示している。
【0064】
II.植物の足場ポリペプチド配列に基づく核酸ライブラリーの生成
植物の足場ポリペプチド配列をコードする核酸配列の変異体の大ライブラリーを、1つまたは複数の植物の足場ポリペプチド配列に基づいて創製する。核酸のライブラリーは、少なくとも5つ(例えば、1,000、105、106、107、109、1012、1015またはそれ以上)の異なるキメラ結合タンパク質配列をコードする。本明細書に記載する方法によって生成したライブラリーの全てのメンバーが固有のアミノ酸配列をコードするわけではないことが認識されている。それにもかかわらず、ライブラリーにディスプレイされる、コードされたキメラ結合タンパク質の少なくとも10%(例えば、25%、30%、40%、50%、60%、70%、75%、または90%)が固有であることが望ましい。
【0065】
植物の足場ポリペプチド配列を多様化する前に、配列変化パラメーターの所与のセットによって生成される、予測配列多様性をコンピュータで推定することが有用でありえる。配列多様性の推定方法は、例えば、Volles et al.(2005), 33(11): 3667-3677に記載されている。例えば、PCRによって生成した核酸ライブラリーにおいて予測される異なる配列の数は、増幅に使用する変異原性ポリメラーゼの変異頻度に基づいて推定することができる。ランダム化タンパク質をコードするライブラリーにおける配列多様性の推定に有用なアルゴリズムは、例えば、ホームページ(例えば、guinevere.otago.ac.nz/mlrgd/STATS/index)において見ることもできる。
【0066】
植物のキメラ結合タンパク質をコードする核酸ライブラリーは、多くの公知の方法論によって生成できる。上記の通り、足場ポリペプチド配列の高度可変位置でのアミノ酸の置換、欠失、挿入、または付加によって、植物の足場ポリペプチド配列内に配列多様性を導入する。植物において遺伝的にコードされた20個のアミノ酸のセットには若干冗長な化学的かつ構造的特性があるため、この構造的多様性を含むアミノ酸のサブグループ(例えば、4種のアミノ酸のサブセット)を代用できる。例えば、置換または挿入に使用するアミノ酸は、酸性アミノ酸、中性アミノ酸、脂肪族アミノ酸、および芳香族アミノ酸を含むように選択できる(表3参照)。例えば、置換に使用するアミノ酸は、アスパラギン酸、セリン、アラニン、およびチロシンに限定されえる。アミノ酸置換の冗長性を制限することで、キメラ結合タンパク質のライブラリーの全体的な構造的および結合の多様性が増しうる。
【0067】
(表3) 植物において遺伝的にコードされたアミノ酸の化学的特性

【0068】
核酸ライブラリーは、オリゴヌクレオチドのセットとオーバーラップ相補配列と集合してインビトロで生成できる。最初に、足場ポリペプチド配列を、集合したオリゴヌクレオチドのセットによってコードするべく選択する。所与の足場ポリペプチド配列の可変領域においてコードされる配列には、上記の通り、生成されるキメラ結合ポリペプチドのライブラリーに従い、置換、挿入、欠失、または付加を含む多数の異種配列を含む。コードされる足場ポリペプチド配列には、それぞれSEQ ID NO:1〜30、31〜60、61〜90、および91〜120のいずれか一つに対応するC1〜C4部分配列を含めることができる。
【0069】
オリゴヌクレオチドの1セットは、多様性が導入される植物の足場ポリペプチド配列の領域(例えば、X1、X2、およびX3)をコードする。対照的に、変化がほとんどまたは全く導入されない足場ポリペプチド配列の領域(例えば、PAP足場ポリペプチド配列の骨格ドメイン)は、上記足場ポリペプチド配列のいずれか一つと少なくとも70%以上(すなわち、75%、80%、85%、90%、95%、または100%)の同一性を有するアミノ酸配列をコードするオリゴヌクレオチドのセットがコードする。この方法については、例えば、米国特許第6,521,453号に詳述されており、参照により本明細書に組み入れられる。
【0070】
核酸ライブラリーの生成に使用する配列変化オリゴヌクレオチドは、典型的には、Beaucage and Caruthers (1981), Tetrahedron Letts., 22(20): 1859-1862によって記載されているように、例えばNeedham-VanDevanter et al. (1984) Nucleic Acids Res., 12:6159-6168に記載の自動シンセサイザーを用いて、固相ホスホラミダイトトリエステル方法にしたがって化学合成する。オリゴヌクレオチド自動合成用の様々な装置が市販されている。上記したマルチヌクレオチド合成法(例えば、トリヌクレオチド合成)も有用である。
【0071】
Sigma-Genosys (sigma-genosys.com/oligo.asp)、The Midland Certified Reagent Company (mcrc@oligos.com)、The Great American Gene Company (genco.com), ExpressGen Inc. (expressgen.com)、Operon Technologies Inc. (Alameda, Calif.)などの多くの様々な供給源から核酸をオーダーメイドできる。
【0072】
オリゴヌクレオチドには、特定の細胞種(例えば、植物細胞、哺乳動物細胞、酵母細胞、または細菌細胞)における発現向けに最適化されたコドンが使用できる。コドン使用頻度表は、ホームページ(kazusa.or.jp/codon)において公開されている。植物のキメラ結合タンパク質の結合を評価する細胞内または細胞表面での発現を最適化させるために、および商業目的の遺伝子導入生物(例えば、遺伝子導入植物)におけるキメラ結合タンパク質の発現を最適化するために、コドンバイアスを利用することができる。一般に、使用頻度10%未満のコドンは使用しない。合成前に、問題となりえる配列、例えばサブクローニングに有用な制限酵素部位、潜在的な植物のスプライスアクセプターまたはドナー部位(例えば、cbs.dtu.dk/services/FeatureExtract/参照)、潜在的なmRNA不安定化配列(例えば、「ATTTA」)、および同じヌクレオチドが4つより多く出現する配列について、オリゴヌクレオチド配列をチェックする。問題となりえる配列は適宜変える。
【0073】
選択された足場ポリペプチド配列の推定結合領域内(例えば、PAP足場ポリペプチド配列のX1、X2、およびX3領域内)のアミノ酸変化をコードするオリゴヌクレオチド集団を合成する。
【0074】
好ましくは、足場ポリペプチド配列に配列多様性を導入する領域に対応する、選択された長さのオリゴヌクレオチド(例えば、約10、12、15、20、30、40、50、60、70、80、90、もしくは100個またはそれ以上のヌクレオチド)の全てが、上記の多様なアミノ酸のセットの可能な全アミノ酸変化をコードする。これには、配列変化N個当たりN個のオリゴヌクレオチドが含まれ、ここで、Nは遺伝子座での異なる配列の数である。変異アミノ酸をコードする配列を除いて、N個のオリゴヌクレオチドの配列は同一である。配列を変化させたオリゴヌクレオチドの生成において、単一の合成反応または試薬セットを使用して各ヌクレオチドの共通部分を作製する、並行合成またはプール合成戦略の活用が有利でありえる。これは、例えば、周知の固相核酸合成技術、または、例えば、アレイベース・オリゴヌクレオチド合成法(例えば、Fodor et al. (1991) Science, 251: 767-777; Fodor (1997) 「Genes, Chips and the Human Genome」 FASEB Journal. 11:121-121; Fodor (1997) 「Massively Parallel Genomics」 Science. 277:393-395; Chee et al. (1996) 「Accessing Genetic Information with High-Density DNA Arrays」 Science 274:610-614参照)を利用して実施できる。
【0075】
典型的な合成戦略においては、オリゴヌクレオチドには、変化領域の片側に少なくとも約10塩基の配列同一性を持たせて、適度に効率的な組換えを保証する。しかし、同一塩基を持つ隣接領域では同一塩基を少なくすることができ(例えば、4、5、6、7、8、または9)、かつ、無論、より大きな同一領域を持つことができる(例えば、11、12、13、14、15、16、17、18、19、20、25、30、50またはそれ以上)。
【0076】
一緒に集合するオリゴヌクレオチドをインキュベートして、オーバーラップ相補配列を含むオリゴヌクレオチドの間でのハイブリダイゼーションを可能にする。ハイブリダイズする各セットのオーバーラップ・オリゴヌクレオチドは、これによって小さなギャップが介在する連続的な核酸を形成する。例えば、本明細書に記載のように、および当業者に公知のように、種々のポリメラーゼを介した再集合法のいずれかを利用して、これらの小さなギャップを埋めることで、全長配列を生成できる。植物の足場ポリペプチド配列の推定結合領域および残基をコードするオリゴヌクレオチドに、最も大きな配列多様性を導入する。しかし、特定の配列変化をコードするオリゴヌクレオチドは、任意の選択された濃度で組換え混合物中に「スパイク(spike)」できるため、推定結合ドメイン以外の領域において、所望の修飾が、コードされた植物のキメラ結合タンパク質中に選択的に取り込まれる。
【0077】
例えば、オリゴヌクレオチド伸長中に、ハイブリダイズしたオリゴヌクレオチドを核酸ポリメラーゼ(例えば、Taq、Klenow等)、dNTP (すなわち、dATP、dCTP、dGTP、およびdTTP)の存在下でインキュベートする。配列同一性の領域が広い場合、Taqまたは他の高温ポリメラーゼを、約室温(すなわち、約25℃)から例えば約65℃の間のハイブリダイゼーション温度で使用できる。同一性の領域が狭い場合、Klenow、Taqまたはポリメラーゼを室温未満のハイブリダイゼーション温度で使用できる。オリゴヌクレオチドのハイブリダイゼーション前、同時、または後で、ポリメラーゼを集合反応に加えることができる。その後、結果として得られる伸長させた二本鎖核酸配列を変性し、ハイブリダイズし、再伸長する。このサイクルは所望の任意の回数繰り返すことができる。サイクルは、例えば、約2〜約100回繰り返すことができる。
【0078】
任意で、複数のサイクルの組み合わせの核酸の集合の後、例えば、標準的なポリメラーゼ連鎖反応(PCR)によって結果として得られる産物を増幅できる。上記集合反応の容量の一部を、核酸の末端ならびにdNTPおよび適当なポリメラーゼ(例えば、pfuポリメラーゼ)に普遍的にハイブリダイズする固有のフォワードおよびリバースプライマーとインキュベートする。次に、約10〜40サイクルのPCR反応を実行する。
【0079】
オリゴヌクレオチド取り込みの程度を判定するために、類似の核酸を識別する任意のアプローチを利用できる。例えば、核酸をクローニングおよびシークエンシングして、または増幅させて(インビトロ、または、例えば、標準的なクローニングまたは発現ベクター内へのクローニング)、特定のオリゴヌクレオチド配列変異体を認識する制限酵素によって切断できる。
【0080】
集合反応またはPCR反応において使用する大半の5'および3'プライマーの5'末端内に頻度の低い制限酵素部位(例えば、Not I)を含めると有用である。これらのプライマーに制限酵素部位を含ませることで、制限酵素による消化およびこれに続くライゲーションによってベクター内への核酸のサブクローニングを容易にできる。または、集合反応またはPCR産物をまた、標準的な方法(例えば、「TA」クローニング)を利用して、制限酵素により消化することなくサブクローニングできる。
【0081】
植物の足場ポリペプチド配列内に多様性を導入するための他の方法も利用できる。例えば、足場ポリペプチド配列は、核酸鋳型(例えば、プラスミドコンストラクト)においてコードされえる。または、大豆などの適当な植物種由来のPCR産物、mRNA、またはゲノムDNAはまた、植物の足場ポリペプチド配列をコードする鋳型としての役割も果たす。多様化させる1つまたは複数の足場ポリペプチド配列の部分配列(例えば、PAP足場ポリペプチド配列のX2領域)を、多くのエラープローン(error-prone)PCR法のいずれかによって足場ポリペプチド配列の核酸鋳型からの増幅中または増幅後に多様化できる。エラープローンPCR法は、以下のように分けることができる:(a) ヌクレオチド濃度を不均衡にすることで、および/または、塩化マンガンなどの化合物を添加することで、ポリメラーゼの忠実度を低下させる方法(例えば、Lin-Goerke et al.(1997) Biotechniques, 23, 409-412参照)、(b) ヌクレオチド類似体を使用する方法(例えば、米国特許第6,153,745号参照)、(c)「変異原性」ポリメラーゼを利用する方法(例えば、Cline, J. and Hogrefe,H.H. (2000) Strategies (Stratagene Newsletter), 13, 157-161参照)、(d) 併用方法(例えば、Xu, H., Petersen, E.I., Petersen, S.B. and el-Gewely, M.R. (1999) Biotechniques, 27, 1102-1108参照)。他のPCRベースの変異誘発方法としては、例えば、Osuna J, Yanez J, Soberon X, およびGaytan P. (2004), Nucleic Acids Res. 2004, 32(17): e136ならびにWong TS, Tee KL, Hauer B, およびSchwaneberg, Nucleic Acids Res. 2004 Feb 10; 32(3): e26)に記載の方法、ならびに当技術分野において公知の他の方法が挙げられる。
【0082】
配列変異体集団の生成後、これらをサブクローニングによって選択された植物の足場ポリペプチド配列の核酸(例えば、足場ポリペプチド配列を含むプラスミド)の適当な領域内に置換することができ、これによって多様化配列ライブラリーのベクターとして効果的に機能する。
【0083】
特定の植物の足場ポリペプチド配列領域に突然変異を起こさせるための別のアプローチは、変異原性大腸菌株の使用である。(例えば、Wu et al.(1999), Plant Mol. Biol., 39(2):381-386参照) 突然変異を起こさせる標的配列を含む核酸ベクターを、変異誘発遺伝子株内に導入して、次にこれを増殖させる。変異誘発物である大腸菌株におけるエラープローンDNAによって、導入した標的配列内に突然変異が導入される。次に変異標的配列集団を回収して、選択された植物の足場ポリペプチド配列をコードする核酸の適当な位置にサブクローニングして、植物のキメラ結合タンパク質をコードする核酸の多様化ライブラリーを生成する。
【0084】
III. 植物のキメラ結合タンパク質の発現およびスクリーニング
植物の足場ポリペプチド配列に基づきかつ植物のキメラ結合ポリペプチドをコードする核酸ライブラリーは、発現ベクター内にサブクローニングさせて、生物学的複製システムに導入して、発現ライブラリーを生成する。発現ライブラリーを増殖させ、スクリーニングして、対象の標的分子(TM)に結合する植物のキメラ結合タンパク質(例えば、線虫、昆虫、真菌、ウイルス、または植物のタンパク質)を同定できる。
【0085】
植物のキメラ結合タンパク質のスクリーニングを実施する生物学的複製システムは、標的への結合について選択した後、適当な環境において増殖できる。または、選択された植物のキメラ結合タンパク質をコードする核酸を、インビトロ増幅によって単離できる。生物学的複製システムの少なくとも一部の成長中、個体数の増加は好ましくは時間に対してほぼ指数関数的である。所望の結合特性を示すライブラリーメンバーの頻度は非常に低く(例えば、106またはそれ以下に)なりえる。
【0086】
生物学的複製システムは、細菌DNAウイルス、植物細菌細胞、細菌胞子でありえる。真核細胞(例えば、酵母細胞)もまた、生物学的複製システムとして使用できる。
【0087】
特に有用な態様では、キメラ結合タンパク質-ファージ被膜タンパク質融合体をファージミドコンストラクトにコードさせる。ファージミドコンストラクトは宿主細菌内に形質転換させて、これを続いて野生型被膜タンパク質を発現するヘルパーファージに感染させる。結果として得られる子孫ファージは、融合タンパク質と野生型被膜タンパク質の両方を含むタンパク被膜を持つ。この方法には、キメラ結合タンパク質被膜融合タンパク質のみを持つファージの生存力と比較して、ファージの生存力が高くなるという利点がある。例えば、EZnet(商標) Phage Display cDNA Library Construction Kit and Screening Kit (Maxim Biotech, Inc., San Francisco, CA)などの、ファージミドベースのディスプレイライブラリー構築物およびスクリーニング用のキットが市販されている。
【0088】
それでもなお、以下の場合、任意の生きた細胞株やウイルス株が有用となりえる: (1) 株を適当な設備によって遺伝的に改変させて、植物のキメラ結合タンパク質をコードできる場合、(2) 株を培養中において維持および増殖できる場合、(3) 株を操作して、標的物質と相互作用できる潜在的な結合タンパク質ドメインをディスプレイできる場合、ならびに(4)回収可能な形状で発現させた植物のキメラ結合タンパク質をコードする遺伝情報を保持しつつ、株が選択されることができる場合。好ましくは、生物学的複製システムは親和性ベースの選択後に生存可能である。
【0089】
生物学的複製システムが細菌細胞またはペリプラズム内で集合されるファージである場合、植物のキメラ結合タンパク質のディスプレイ用発現ベクターは、追加の2成分を融合させたキメラ結合タンパク質自体をコードする。第1成分は、初期の発現産物を細胞(パッケージがファージである宿主細胞)の内膜に導く分泌シグナルである。この分泌シグナルは、シグナルペプチダーゼによって切断されて、プロセシングを受けて成熟した植物のキメラ結合タンパク質を産生する。第2成分は外表面輸送シグナルであり、これは生物学的複製システムにプロセシングを受けたタンパク質を集合させてその外表面内へと導く。この外表面輸送シグナルは、生物学的複製システムに固有の表面タンパク質に由来する(例えば、M13ファージ被膜タンパク質gIII)。
【0090】
例えば、発現ベクターは、シグナル配列(例えば、細菌のphoAもしくはbla遺伝子のシグナル配列、またはM13ファージ遺伝子IIIのシグナル配列)および繊維状ファージの被膜タンパク質(例えば、M13遺伝子IIIまたは遺伝子VIIIのタンパク質)をコードするDNA (例えば、M13)に操作可能に連結させた、植物のキメラ結合タンパク質をコードするDNAを含む。発現産物は、宿主細胞の内膜(脂質二重層)に輸送されて、そこでシグナルペプチドが切断されて、プロセシングを受けたハイブリッドタンパク質が残る。このハイブリッドタンパク質の被膜タンパク質様成分のC末端は、脂質二重層内にトラップされるため、それでハイブリッドタンパク質はペリプラズム間隙内には逃げない。新生ファージ粒子の一本鎖DNAがペリプラズム間隙内に移行するため、脂質二重層から野生型被膜タンパク質およびハイブリッドタンパク質の両方が集められる。ハイブリッドタンパク質はこのように繊維状ファージの表面鞘内にパッケージングされて、その外表面に露出したキメラ結合タンパク質が残る。このように、宿主細菌細胞ではなく、繊維状ファージが、この態様における生物学的複製システムである。分泌シグナルが植物のキメラ結合タンパク質のディスプレイに必要な場合、「分泌許容」細菌株を繊維状ファージの生物学的複製システムの成長に使用できる。
【0091】
生物学的複製システムが細菌胞子、またはファージの被膜が細胞内で集合されるファージである場合、内膜分泌シグナルを使用する必要はない。これらの場合、ディスプレイ方法は、外表面輸送シグナル、典型的には、胞子またはファージ被膜タンパク質の派生物に過ぎない。
【0092】
一般的な繊維状ファージは、植物のキメラ結合タンパク質のディスプレイ用の生物学的複製システムとして魅力的であり、特にM13は、下記において特に魅力的である:(1) ビリオンの三次構造が公知であり;(2) 被膜タンパク質のプロセシングが十分に理解されており;(3) ゲノムを増幅可能であり;(4) ゲノムが小さく;(5) ゲノムの配列が公知であり;(6) ビリオンは剪断、熱、低温、尿素、塩化グアニジン、低pH、高塩濃度に対して物理的に耐性であり;(7) ファージはシークエンシングが特に容易なシークエンシングベクターであり;(8) 抗生物質耐性遺伝子がゲノム内にクローニングされており;(9) 培養や保存が容易で、感染細胞のために珍しいまたは高価な培地を要さず;(10) 放出量が多く、各感染細胞は感染後に100〜1,000個の M13の子孫を産生し;ならびに(11) 標準的な方法によって回収および濃縮が簡単である。
【0093】
例えば、生物学的複製システムがM13である場合、遺伝子IIIまたは遺伝子VIIIのタンパク質を外表面の標的シグナルとして利用できる。または、遺伝子VI、VII、およびIXのタンパク質も利用できる。
【0094】
コードされた植物のキメラ結合タンパク質は、そのカルボキシ末端またはアミノ末端において表面標的シグナル(例えば、M13遺伝子IIIの被膜タンパク質)に融合できる。植物のキメラ結合タンパク質と標的シグナルとの融合境界にはまた、該キメラ結合タンパク質と融合させた標的シグナルとの望ましくない相互作用を避けるための短いリンカー配列(例えば、最高20個までのアミノ酸長)を含めてよい。いくつかの態様では、リンカー配列内に特異的タンパク質分解性切断部位を含めることが有利である。加えて、融合タンパク質のアミノ末端やカルボキシ端末には短いエピトープタグ(例えば、ヘマグルチニンタグ)を含めることができる。タンパク質分解性切断部位または短いエピトープタグを含むことは、ライブラリー発現細胞集団からキメラ結合タンパク質のライブラリーを精製する際に特に有用である。エピトープタグ付きキメラ結合タンパク質は、リンカー配列のタンパク質分解性切断、これに続く抗体またはエピトープタグを認識する他の結合薬剤を使用する親和性クロマトグラフィーによって、便利に精製できる。
【0095】
ファージディスプレイライブラリーのスクリーニング方法は多数存在する(例えば、Willats (2002), Plant Mol. Biol, 50:837-854参照)。一般に実施される通り、対象の標的分子を支持体に吸着させて、次に植物のキメラ結合タンパク質をディスプレイするファージ溶液に暴露させる。標的分子は支持体(例えば、チューブ、プレート、カラム、または磁気ビーズ)に受動的吸着によって固定できる。一般に、例えば、ウシ血清アルブミン、ミルク、またはゼラチンによって事前に吸着支持体をブロッキングして、スクリーニング中のファージの非特異的結合を減らす。または、標的分子をビオチン化させることで、溶液中においてキメラ結合タンパク質を有するファージと標的分子とを相互作用させることができる。次に、固形基質(例えば、ビーズまたはカラム)に結合したアビジンまたはストレプトアビジンを使用して、標的に結合するファージを選択できる。
【0096】
ファージを標的分子と相互作用させた後、相互作用しないファージを洗浄により除去する。次に、例えば、pHの増減、還元剤の適用、または界面活性剤の使用を含む処置のいずれか一つによって、特異的に結合した残留ファージを溶出させる。一態様では、植物のキメラ結合タンパク質配列とファージ被膜タンパク質配列の間に特定のタンパク質分解性切断部位を導入する。このように、適当なプロテアーゼを添加することだけでファージを溶出できる。
【0097】
次に、溶出したファージを宿主細胞への感染によって増殖させて、続いて、前記方法によって再度スクリーニングして偽陽性結合ファージの個数を減らすことができる。ファージスクリーニングの各ラウンド中に、成長が最適以下であるファージクローンの喪失を最小限にするため、液体培地のみよりも固形培地でのファージの成長を含むように注意する必要がある。
【0098】
リボゾームディスプレイを利用して、植物のキメラ結合タンパク質を発現させて、インビトロでのみ結合をスクリーニングすることもできる。もっぱらインビトロでのアプローチによってのみ、植物のキメラ結合タンパク質をコードする核酸ライブラリーを生物学的複製システムに導入するための要件を回避できる。リボソームタンパク質ディスプレイによる、ポリペプチドのインビトロでのスクリーニング方法については、例えば米国特許第6,589,741号に詳述されている。上述のセクションに記載した核酸に、インビトロ転写を可能するファージプロモーター配列(例えば、T7プロモーター)、コードされた植物のキメラ結合タンパク質の翻訳開始部位の上流のリボソーム結合配列、および転写終了配列(例えば、ファージT3由来)を付加することで改変させる。次に改変させた核酸ライブラリーをインビトロで転写させて、植物のキメラ結合タンパク質をコードする対応するmRNA集団を生成する。次に、ポリソーム形成を可能にする条件下で、インビトロ翻訳システムにおける、正しい読み枠で終止コドンを欠くmRNA分子集団の翻訳によって、植物のキメラ結合タンパク質をインビトロで発現させる。次に、植物のキメラ結合タンパク質と標的分子との相互作用を可能にする条件下で、このようにして形成させたポリソームを標的分子と接触させる。次に、標的分子と相互作用するキメラ結合タンパク質をディスプレイするポリソームを、これらの(ポリ)ペプチドをディスプレイしていない相互作用しないポリソームから分離させ;続いて相互作用するポリソームに関連するmRNAを(例えば、PCRにより)増幅させて、配列を決定する。
【0099】
遺伝子スクリーニングにおいて、植物のキメラ結合タンパク質と標的タンパク質との相互作用も検出できる。スクリーンでは、ツーハイブリッドアッセイやスリーハイブリッドアッセイを利用した結合アッセイにおいて、標的タンパク質は「ベイト(bait)タンパク質」として機能し、植物の各キメラ結合タンパク質は「プレイ(prey)」として機能する(例えば、米国特許第5,283,317号; Zervos et al. (1993) Cell 72:223-232; Madura et al.(1993) J. Biol.Chem.268: 12046-12054; Bartel et al. (1993) Biotechniques 14:920-924; Iwabuchi et al.(1993) Oncogene 8:1693-1696; Hubsman et al.(2001) Nuc. Acids Res. Feb 15;, 29(4):E18;およびBrent 国際公開公報第94/10300号参照)。
【0100】
標的ポリペプチドをベイトタンパク質として使用して、ツーハイブリッドアッセイを実施できる。つまり、標的ポリペプチドをLexA DNA結合ドメインに融合させて、ベイトとして使用する。プレイは、N端末核局在化シグナル、LexA活性化ドメイン、およびエピトープタグ(Colas et al. 1996 Nature 380:548; and Gyuris et al. Cell 1993 75:791)との融合タンパク質として、TrxAの活性部位のループ内にクローニングされる植物のキメラ結合タンパク質ライブラリーである。ベイト遺伝子およびプレイ遺伝子で酵母細胞を形質転換させる。標的融合タンパク質と植物のキメラ結合タンパク質の融合タンパク質との結合時、LexA活性化ドメインは、LexA DNA結合ドメインの近傍に運ばれて、適切に位置づけられたLexA結合領域を持つリポーター遺伝子または選択マーカー遺伝子の発現が上昇する。適当なリポーター遺伝子としては、蛍光タンパク質(例えば、EGFP)、酵素(例えば、ルシフェラーゼ、β-ガラクトシダーゼ、アルカリホスファターゼ等)が挙げられる。適当な選択可能のマーカー遺伝子としては、例えば、酵母LEU2遺伝子が挙げられる。
【0101】
1つまたは複数の標的結合キメラ結合タンパク質の同定後、キメラ結合タンパク質をコードする単離核酸に、本明細書に記載の方法によって突然変異を起こさせて、変異キメラ結合タンパク質を発現する小さな発現ライブラリーを生成できる。キメラ結合タンパク質-変異体発現ライブラリーをスクリーニングして、改善された標的結合特性(例えば、親和性または特異性の向上)を有するキメラ結合タンパク質変異体を同定できる。
【0102】
以下の具体例は単なる例示と解釈すべきであり、残りの開示をいかなる方法においても限定するものでは決してない。さらなる詳述がなくとも、本明細書の記載に基づいて当業者は本発明を最大限にまで活用できると考えられる。本明細書で引用した全ての出版物は、参照により全体として本明細書に組み入れられる。
【実施例】
【0103】
実施例1 植物の足場ポリペプチド配列の設計および発現
数種のタンパク質ドメインファミリーの足場としての潜在的な用途について解析した。緑藻植物門(Viridiplantae)にアウトプットを制限して、PFAMドメイン(pfam.wustl.edu; Bateman et al. (2004)参照)を検索して、緑色植物にのみ存在するドメインに限定した。4つのタンパク質ドメインファミリーを選択して、植物の普遍的分子認識ライブラリーを生成した:紫色酸性ホスファターゼ(PAP)のアクセサリードメイン、植物シスタチン、植物C2ドメイン、およびアンキリンリピートタンパク質中に認められるターン-ヘリックス-ヘリックス(THH)モチーフ。
【0104】
SEQ ID NO:34〜36の配列を有する3つの紫色酸性ホスファターゼ足場を設計した。インゲン豆PAP由来のアクセサリードメインのアミノ酸配列は、NCBI BLASTデータベースの問い合せ配列として使用した。アウトプットを緑藻植物門で認められるタンパク質に限定した場合、62個の固有の配列が同定された。これらの配列のアラインメントから、アラインメントの各位置で最も頻繁に認められるアミノ酸を選択することで、植物のPAP共通配列(SEQ ID NO:34)を生成した。インゲン豆の構造が判明しているため、インゲン豆(Phaseolus vulgaris)のPAPを親足場(SEQ ID NO:35)として選んだ。大豆(Glycine max)のPAP(SEQ ID NO:36)も選択したが、それはこの種が遺伝子導入産物の生成における一般的な作物種を代表しているからである。
【0105】
植物のアンキリン様リピートを含む足場ポリペプチド配列のセットも設計した。アンキリン様リピートは約33個のアミノ酸からなる小型ターン-へリックス-へリックス(THH)モチーフである。モチーフは全ての生物由来のタンパク質の共通エレメントであり、タンパク質内の2〜20個リピートのタンデムアレイにおいて認められることが多い。
【0106】
3つのTHH足場を生成した。これらのタンパク質は、GA結合タンパク質(GABP-β)と構造的に似ている。このタンパク質は、3つのTHH内部リピートを有する、THH様アミノおよびカルボキシ端末キャップからなる。このタンパク質において、キャップは、内部リピートにおいて認められる疎液性残基を保護することによって、タンパク質を安定させるのに役立つと考えられる。
【0107】
PFAMにおいて見出された312個の緑藻植物門アンキリンリピートタンパク質を一列に並べて、植物特異的なTHH足場を設計する際に役立つようにした。各位置で最も頻繁に出現するアミノ酸を選択することで、植物のTHH共通配列を生成した。この配列を植物の内部リピート共通配列と名付けた。この配列を使用してBLASTアラインメントによりNCBIデータベースを検索して、植物で見出される最も近い天然のTHH配列を見つけ出した。コムギ(Triticum aestivum)由来の配列を見い出した。コムギに基づいて設計したリピートは、コムギ配列に出現する1個のシステインがバリンに置換されている。2セットのNおよびC端末キャップを生成した。1セットはGABP-β由来の配列からなり、第2セットは植物THH共通配列に由来し、GABP-βの構造と類似するように最適化した。特に、N端末キャップは拡大したα-ヘリカル構造を有し、一方、C端末キャップは、典型的なTHHリピートと比較して、切断されたヘリックスを有する。
【0108】
3つのTHH足場を設計し、一つは植物の共通N/Cキャップおよび2つの植物内部THH共通リピート(SEQ ID NO:37)からなる。別の一つは植物の共通NおよびCキャップならびに2つの小麦内部リピート(SEQ ID NO:38)からなり、第3は2つの小麦内部リピート(SEQ ID NO:39)を伴うアンキリン様NおよびCキャップからなる。
【0109】
植物、細菌において、およびファージ表面での発現テスト用に、植物の足場ポリペプチド配列をコードする遺伝子を設計した。植物での発現のために、公開されているダイズコドン使用頻度表を使用してコドンを選択した(kazusa.or.jp/codon, codon usage tabulated from the international DNA sequence databases: status for the year 2000.Nakamura,Y, Gojobori, T and Ikemura, T (2000) Nucl. Acids Res.28:292)。最終的なコドン頻度がダイズでの天然の頻度をほぼ反映するように、手入力でコドンを選択した。ほとんど使用されないコドン(頻度<10%)は使用しなかった。クローニングに必要な制限酵素切断部位、植物の潜在的なスプライシングアクセプターまたはドナー部位(cbs.dtu.dk/services/NetPgene/のウエブサイトを参照)の除去、潜在的なmRNA不安定化配列(ATTTA)、および同じヌクレオチドが4より多く出現する伸長部位などの、問題となりえる点について最終配列を確認した。任意の問題となりえる配列は、コドン使用頻度を改変することで遺伝子内において変更した。THH配列は各タンパク質内に4つの類似のリピート配列を持つため、リピート内におけるヌクレオチドの類似性を低減させる対策を講じた;これらの方法によってリピートの同一性は平均10〜15%低減された。
【0110】
合成遺伝子集合を利用して、7つのコンストラクトを生産した(THH足場ポリペプチド配列に基づく3つ、PAP足場ポリペプチド配列に基づく2つ、植物シスタチンに基づく一つ、および植物のC2ドメインタンパク質に基づく一つ)。3つのTHH足場ポリペプチド配列を、そのカルボキシ末端に遺伝子III被膜タンパク質(gIII)との融合配列としてファージミドベクター内に置いた(Phage 3.2, Maxim Biotech, Inc., South San Francisco, CA)。足場遺伝子とコードされたgIIIのアミノ末端との間に、6-Hisタグを遺伝子の5'末端およびc-Mycタグに含ませた。次にファージミドコンストラクトを、ファージ粒子内にパッケージングさせて、ファージでのTHH足場の発現および表面ディスプレイを検証した。抗Hisまたは抗Mycのいずれかを使用したファージELISAによって、THH足場タンパク質がファージELISAにおいてファージの表面上に発現していることが示されており、3つ全てのTHH足場ポリペプチド配列コンストラクトが折り畳まれて、ファージ表面上に上手く発現していることを示唆している。次に、選択された足場ポリペプチド配列を使用して発現ベクターを生成し、免疫ブロット法によって遺伝子導入植物におけるそれらの発現を評価した。
【0111】
植物の発現ベクターを含むTHHで形質転換させたアグロバクテリウムLB4404をタバコ葉に注入した。2日後、アグロバクテリウムを注入した葉の切片を回収して、ドライアイス上で凍結させ、乳棒で粉砕して微粉にした。0.2% Tween-20を含むPBSを1:1 (重量:容積)で微粉に加えて、さらに粉砕した。不溶性物質を遠心分離によって除去して、残りの上澄みの10μlを4〜12%アクリルアミドSDS Pageゲル(NuPage, Invitrogen)に添加した。タンパク質をPVDFメンブレンにトランスファーさせた。ラット抗HA抗体(Roche)および抗ラットHRP二抗体(Chemicon)を使用して、タンパク質を検出した。Amerham Lumigen試薬を使用してHRPを検出した。
【0112】
3つ全てのTHH足場の発現が認められ、3つの足場の相対的な発現レベルはTA-THH>CC-THH > .TC-THHであった。
【0113】
他の態様
本明細書で開示する特徴の全てを任意の組み合わせで併用できる。本明細書で開示する各特徴を別の特徴と取り替えることができ、同じ、同等、または類似の役割を果たす。このように、別に特記のない場合、開示する各特徴は、同等または類似の特徴の包括的な例に過ぎない。
【0114】
上記の通り、当業者は、本発明の精神および範囲から逸脱することなく、本発明の本質的な特徴を容易に確認でき、発明に様々な改変や修飾を施して、様々な用途や条件に本発明を適応させることができる。このように、他の態様も特許請求の範囲内にある。
【図面の簡単な説明】
【0115】
【図1】コードされたポリペプチド足場配列内の部分配列を多様化させることによるキメラ結合ポリペプチドをコードする核酸ライブラリーの生成を描写する略図。
【図2】足場として使用可能な領域を持つ多くのタンパク質の配列のアライメント。これらのタンパク質はオリザシスタチンと相同である。C1、C2、C3、C4を囲んでおり、標識している。
【図3】足場として使用可能な領域を持つ多くのタンパク質の配列のアライメント。これらのタンパク質はC2と相同である。C1、C2、C3、C4を囲んでおり、標識している。
【図4】足場として使用可能な領域を持つ多くのタンパク質の配列のアライメント。これらのタンパク質はオリザシスタチンと相同である。C1、C2、C3、C4を囲んでおり、標識している。
【図5】足場として使用可能な領域を持つ多くのタンパク質の配列のアライメント。これらのタンパク質はC2と相同である。C1、C2、C3、C4を囲んでおり、標識している。

【特許請求の範囲】
【請求項1】
少なくとも10個の異なるポリペプチドをコードする核酸ライブラリーであって、
各ポリペプチドのアミノ酸配列がC1-X1-C2-X2-C3-X3-C4を含み、
(i) 部分配列C1がSEQ ID NO:1〜30から選択され、部分配列C2がSEQ ID NO:31〜60から選択され、部分配列C3がSEQ ID NO:61〜90から選択され、部分配列C4がSEQ ID NO:91〜120から選択され、かつC1〜C4のそれぞれが、選択された部分配列に最高10個の単一アミノ酸の置換、欠失、挿入、または付加を含み;
(ii) C1〜C4が複数のコードされたポリペプチドにおいて同種であり;
(iii) X1〜X3のそれぞれが、2〜20個のアミノ酸からなる独立した可変部分配列であり;かつ、
(iv) X1〜X3のそれぞれが、複数のコードされたポリペプチドにおいて異種である、
核酸ライブラリー。
【請求項2】
少なくとも10個の異なるポリペプチドをコードする核酸ライブラリーであって、
各ポリペプチドのアミノ酸配列がC1-X1-C2-X2-C3-X3-C4を含み、
(i) 部分配列C1が図2または図4から選択され、部分配列C2が図2または図4から選択され、部分配列C3が図2または図4から選択され、部分配列C4が図2または図4から選択され、かつC1〜C4のそれぞれが、選択された部分配列に最高10個の単一アミノ酸の置換、欠失、挿入、または付加を含み;
(ii) C1〜C4が複数のコードされたポリペプチドにおいて同種であり;
(iii) X1〜X3のそれぞれが、2〜20個のアミノ酸からなる独立した可変部分配列であり;かつ、
(iv) X1〜X3のそれぞれが、複数のコードされたポリペプチドにおいて異種である、
核酸ライブラリー。
【請求項3】
少なくとも10個の異なるポリペプチドをコードする核酸ライブラリーであって、
各ポリペプチドのアミノ酸配列がC1-X1-C2-X2-C3-X3-C4を含み、
(i) 部分配列C1が図3または図5から選択され、部分配列C2が図3または図5から選択され、部分配列C3が図3または図5から選択され、部分配列C4が図3XXから選択され、かつC1〜C4のそれぞれが、選択された部分配列に最高30個の単一アミノ酸の置換、欠失、挿入、または付加を含み;
(ii) C1〜C4が複数のコードされたポリペプチドにおいて同種であり;
(iii) X1〜X3のそれぞれが、2〜20個のアミノ酸からなる独立した可変部分配列であり;かつ、
(iv) X1〜X3のそれぞれが、複数のコードされたポリペプチドにおいて異種である、
核酸ライブラリー。
【請求項4】
少なくとも1,000個の異なるポリペプチドをコードしている、請求項1〜3のいずれか一項記載のライブラリー。
【請求項5】
少なくとも100,000個の異なるポリペプチドをコードしている、請求項1〜3のいずれか一項記載のライブラリー。
【請求項6】
少なくとも1,000,000個の異なるポリペプチドをコードしている、請求項1〜3のいずれか一項記載のライブラリー。
【請求項7】
C1〜C4のそれぞれが、選択された部分配列に最高20個の単一アミノ酸の置換、欠失、挿入、または付加を独立して含む、請求項1〜3のいずれか一項記載のライブラリー。
【請求項8】
C1〜C4のそれぞれが、選択された部分配列に最高10個の単一アミノ酸の置換、欠失、挿入、または付加を独立して含む、請求項7に記載のライブラリー。
【請求項9】
C1〜C4のそれぞれが、選択された部分配列に最高5個の単一アミノ酸の置換、欠失、挿入、または付加を独立して含む、請求項8に記載のライブラリー。
【請求項10】
C1〜C4のいずれも、選択された部分配列にアミノ酸の置換、欠失、挿入、または付加を含まない、請求項9に記載のライブラリー。
【請求項11】
X1〜X3のアミノ酸が、植物において遺伝的にコードされた20個未満のアミノ酸から選択される、請求項1〜3のいずれか一項記載のライブラリー。
【請求項12】
遺伝的にコードされた20個未満のアミノ酸が、少なくとも一つの脂肪族アミノ酸、少なくとも一つの酸性アミノ酸、少なくとも一つの中性アミノ酸、および少なくとも一つの芳香族アミノ酸を含む、請求項11記載のライブラリー。
【請求項13】
遺伝的にコードされた20個未満のアミノ酸が、アラニン、アスパラギン酸、セリン、およびチロシンを含む、請求項12記載のライブラリー。
【請求項14】
(a) C1=SEQ ID NO:1、C2=SEQ ID NO:31、C3=SEQ ID NO:61、およびC4=SEQ ID NO:91である、C1-X1-C2-X2-C3-X3-C4を含むポリペプチド;
(b) C1=SEQ ID NO:2、C2=SEQ ID NO:32、C3=SEQ ID NO:62、およびC4=SEQ ID NO:92である、C1-X1-C2-X2-C3-X3-C4を含むポリペプチド;ならびに
(c) C1=SEQ ID NO:3、C2=SEQ ID NO:33、C3=SEQ ID NO:63、およびC4=SEQ ID NO:93である、C1-X1-C2-X2-C3-X3-C4を含むポリペプチド
から選択される各ポリペプチドのアミノ酸配列を含む、請求項1記載のライブラリー。
【請求項15】
コードされた各ポリペプチドが、C1=SEQ ID NO:X1、C2=SEQ ID NO:X2、C3=SEQ ID NO:X3、およびC4=SEQ ID NO:X4であるC1-X1-C2-X2-C3-X3-C4を含み、SEQ ID NO:130と表記される、請求項2記載のライブラリー。
【請求項16】
コードされた各ポリペプチドが、C1=SEQ ID NO:X1、C2=SEQ ID NO:X2、C3=SEQ ID NO:X3、およびC4=SEQ ID NO:X4であるC1-X1-C2-X2-C3-X3-C4を含み、SEQ ID NO:130と表記される、請求項3記載のライブラリー。
【請求項17】
核酸のそれぞれがベクター配列を含む、請求項1〜3のいずれか一項記載のライブラリー。
【請求項18】
請求項1〜3のいずれか一項記載のライブラリーから選択される単離核酸。
【請求項19】
請求項14〜16のいずれか一項記載のライブラリーから選択される単離核酸。
【請求項20】
請求項19の単離核酸を発現する細胞。
【請求項21】
請求項17のライブラリーから選択される単離核酸。
【請求項22】
請求項18の単離核酸がコードする精製ポリペプチド。
【請求項23】
請求項1〜3のいずれか一項記載のライブラリーがコードするポリペプチドを発現する細胞集団。
【請求項24】
請求項23記載の細胞集団から選択される細胞。
【請求項25】
請求項1〜3のいずれか一項記載のライブラリーがコードする精製ポリペプチドのライブラリー。
【請求項26】
請求項1〜3のいずれか一項記載のライブラリーがコードするポリペプチドをディスプレイする繊維状ファージの集団。
【請求項27】
以下の工程を含む、請求項1記載のライブラリーを生成する方法:
(i) アミノ酸配列:C1-X1-C2-X2-C3-X3-C4を含む親ポリペプチドをコードする親核酸を提供する工程であって、部分配列C1がSEQ ID NO:1〜30から選択され、部分配列C2がSEQ ID NO:31〜60から選択され、部分配列C3がSEQ ID NO:61〜90から選択され、部分配列C4がSEQ ID NO:91〜120から選択され、C1〜C4のそれぞれが、選択された部分配列に最高10個の単一アミノ酸の置換、欠失、挿入、または付加を含み、かつX1〜X3のそれぞれが、2〜20個のアミノ酸からなる独立した可変部分配列である、工程;
(ii) X1、X2、またはX3部分配列に最高10個の単一アミノ酸の置換、欠失、挿入、または付加を導入する条件下で親核酸を複製し、それにより、X1'、X2'、またはX3'をコードするランダムに変化した部分配列集団を生成する工程;および
(iii) X1、X2、またはX3をコードする集団に対応する位置で、ランダムに変化した部分配列X1'、X2'、またはX3'の集団を親核酸集団へ置換する工程。
【請求項28】
X1〜X3部分配列の少なくとも一つがSEQ ID NO:121〜123から選択される、請求項27記載の方法。
【請求項29】
C1〜C4のそれぞれが、選択された部分配列に最高20個の単一アミノ酸の置換、欠失、挿入、または付加を独立して含む、請求項27記載の方法。
【請求項30】
C1〜C4のそれぞれが、選択された部分配列に最高10個の単一アミノ酸の置換、欠失、挿入、または付加を独立して含む、請求項29記載の方法。
【請求項31】
C1〜C4のそれぞれが、選択された部分配列に最高5個の単一アミノ酸の置換、欠失、挿入、または付加を独立して含む、請求項30記載の方法。
【請求項32】
C1〜C4のいずれも、選択された部分配列にアミノ酸の置換、欠失、挿入、または付加を含まない、請求項31記載の方法。
【請求項33】
複製によって、X1、X2、またはX3のそれぞれに最高5個のアミノ酸置換が導入されることでランダムに変化した部分配列の異種集団が生成される、請求項27記載の方法。
【請求項34】
生物学的複製システムへのライブラリーの導入および該生物学的複製システムの増殖によるライブラリーの増幅をさらに含む、請求項27記載の方法。
【請求項35】
生物学的複製システムが複数の大腸菌(E. coli)細胞である、請求項34記載の方法。
【請求項36】
生物学的複製システムが複数のバクテリオファージである、請求項34記載の方法。
【請求項37】
複製がインビトロで起こる、請求項27記載の方法。
【請求項38】
複製が、精製された変異原性ポリメラーゼによって行なわれる、請求項37記載の方法。
【請求項39】
複製がヌクレオチド類似体の存在下で行なわれる、請求項37記載の方法。
【請求項40】
複製がインビボで起こる、請求項27記載の方法。
【請求項41】
インビボでの複製が変異原性種の大腸菌内で起こる、請求項40記載の方法。
【請求項42】
以下の工程を含む、請求項1記載のライブラリーを生成する方法:
(i)コードされるアミノ酸配列:C1-X1-C2-X2-C3-X3-C4を含むアミノ酸配列を選択する工程であって、
(a) 部分配列C1がSEQ ID NO:1〜30から選択され、部分配列C2がSEQ ID NO:31〜60から選択され、部分配列C3がSEQ ID NO:61〜90から選択され、かつ部分配列C4がSEQ ID NO:91〜120から選択され、
(b) C1〜C4のそれぞれが、選択された部分配列に最高10個の単一アミノ酸の置換、欠失、挿入、または付加を含み、
(c) X1、X2、およびX3のそれぞれが、アミノ酸長2〜20個のアミノ酸配列からなる、工程;
(ii) 第1の複数のオリゴヌクレオチドおよび第2の複数のオリゴヌクレオチドを提供する工程であって、
(a) 第1の複数のオリゴヌクレオチドが、C1〜C4部分配列および多数の異種のX1〜X3変異部分配列X1'〜X3'をコードし、
(b) 第2の複数のオリゴヌクレオチドが、C1〜C4部分配列をコードするヌクレオチド配列および多数の異種のX1'〜X3'部分配列をコードするヌクレオチド配列と相補的であり、かつ
(c) 第1および第2の複数のオリゴヌクレオチドが互いに相補的なオーバーラップ配列を有する、工程;
(iii) オリゴヌクレオチド集団を合わせて第1混合物を形成する工程;
(iv) オーバーラップ相補配列のハイブリダイゼーションに効果的な条件下で該混合物をインキュベートして、複数のハイブリダイズした相補配列を形成する工程;ならびに
(v) 複数のハイブリダイズした相補配列を伸長して、ライブラリーを含む第2混合物を形成する工程。
【請求項43】
C1〜C4のそれぞれが、選択された部分配列に最高20個の単一アミノ酸の置換、欠失、挿入、または付加を独立して含む、請求項42記載の方法。
【請求項44】
C1〜C4のそれぞれが、選択された部分配列に最高10個の単一アミノ酸の置換、欠失、挿入、または付加を独立して含む、請求項43記載の方法。
【請求項45】
C1〜C4のそれぞれが、選択された部分配列に0から最高5個の単一アミノ酸の置換、欠失、挿入、または付加を独立して含む、請求項44記載の方法。
【請求項46】
第2混合物の温度を二本鎖DNAの変性に効果的な温度まで上げることによりライブラリーを変性する段階を含む段階のサイクルを実施する工程をさらに含み、(iv)および(v)の工程がこれに続く、請求項42記載の方法。
【請求項47】
最高100回の段階のサイクルの反復を含む、請求項46記載の方法。
【請求項48】
フォワードプライマーおよびリバースプライマーがライブラリーの全ての核酸の5'および3'末端配列にそれぞれハイブリダイズすることができる、本質的にライブラリー、フォワードプライマー、およびリバースプライマーからなるポリメラーゼ連鎖反応によりライブラリーを増幅する工程をさらに含む、請求項42記載の方法。
【請求項49】
X1、X2、またはX3部分配列の各位置においてコードされるアミノ酸が、アラニン、アルギニン、アスパラギン、アスパラギン酸、システイン、グルタミン、グルタミン酸、グリシン、ヒスチジン、イソロイシン、ロイシン、リジン、メチオニン、フェニルアラニン、プロリン、セリン、トレオニン、トリプトファン、チロシン、およびバリンのサブセットから選択される、請求項42記載の方法。
【請求項50】
各単一アミノ酸の置換について選択されたアミノ酸が、少なくとも一つの脂肪族アミノ酸、少なくとも一つの酸性アミノ酸、少なくとも一つの中性アミノ酸、および少なくとも一つの芳香族アミノ酸からなるアミノ酸群から選択される、請求項49記載の方法。
【請求項51】
アミノ酸群が、アラニン、アスパラギン酸、セリン、およびチロシンからなる、請求項50記載の方法。
【請求項52】
以下の工程を含む、請求項2記載のライブラリーを生成する方法:
(i) アミノ酸配列:C1-X1-C2-X2-C3-X3-C4を含む親ポリペプチドをコードする親核酸を提供する工程であって、部分配列C1が図2または図4から選択され、部分配列C2が図2または図4から選択され、部分配列C3が図2または図4から選択され、部分配列C4が図2または図4から選択され、C1〜C4のそれぞれが、選択された部分配列に最高10個の単一アミノ酸の置換、欠失、挿入、または付加を含み、かつX1〜X3のそれぞれが、2〜20個のアミノ酸からなる独立した部分配列である、工程;
(ii) X1、X2、またはX3部分配列に最高10個の単一アミノ酸の置換、欠失、挿入、または付加を導入する条件下で親核酸を複製し、それにより、X1'、X2'、またはX3'をコードするランダムに変化した部分配列集団を生成する工程;および
(iii) ランダムに変化した部分配列X1'、X2'、またはX3'の集団を、X1、X2、またはX3をコードする集団に対応する位置で親核酸集団へ置換する工程。
【請求項53】
X1〜X3部分配列の少なくとも一つがSEQ ID NO:121〜123から選択される、請求項52記載の方法。
【請求項54】
C1〜C4のそれぞれが、選択された部分配列に最高20個の単一アミノ酸の置換、欠失、挿入、または付加を独立して含む、請求項52記載の方法。
【請求項55】
C1〜C4のそれぞれが、選択された部分配列に最高10個の単一アミノ酸の置換、欠失、挿入、または付加を独立して含む、請求項54記載の方法。
【請求項56】
C1〜C4のそれぞれが、選択された部分配列に最高5個の単一アミノ酸の置換、欠失、挿入、または付加を独立して含む、請求項55記載の方法。
【請求項57】
C1〜C4のいずれも、選択された部分配列にアミノ酸の置換、欠失、挿入、または付加を含まない、請求項56記載の方法。
【請求項58】
複製によって、X1、X2、またはX3のそれぞれに最高5個のアミノ酸置換が導入されることでランダムに変化した部分配列の異種集団が生成される、請求項52記載の方法。
【請求項59】
生物学的複製システムへのライブラリーの導入および該生物学的複製システムの増殖によるライブラリーの増幅をさらに含む、請求項52記載の方法。
【請求項60】
生物学的複製システムが複数の大腸菌細胞である、請求項59記載の方法。
【請求項61】
生物学的複製システムが複数のバクテリオファージである、請求項59記載の方法。
【請求項62】
複製がインビトロで起こる、請求項52記載の方法。
【請求項63】
複製が、精製された変異原性ポリメラーゼによって行なわれる、請求項62記載の方法。
【請求項64】
複製がヌクレオチド類似体の存在下で行なわれる、請求項62記載の方法。
【請求項65】
複製がインビボで起こる、請求項52記載の方法。
【請求項66】
インビボでの複製が変異原性種の大腸菌内で起こる、請求項65記載の方法。
【請求項67】
以下の工程を含む、請求項2記載のライブラリーを生成する方法:
(i) コードされるC1-X1-C2-X2-C3-X3-C4を含むアミノ酸配列を選択する工程であって、
(a) 部分配列C1が図2または図4から選択され、部分配列C2が図2または図4から選択され、部分配列C3が図2または図4から選択され、かつ部分配列C4が図2または図4から選択され、
(b) C1〜C4のそれぞれが、選択された部分配列に最高10個の単一アミノ酸の置換、欠失、挿入、または付加を含み、
(c) X1、X2、およびX3のそれぞれが、アミノ酸長2〜20個のアミノ酸配列からなる、工程;
(ii) 第1の複数のオリゴヌクレオチドおよび第2の複数のオリゴヌクレオチドを提供する工程であって、
(a) 第1の複数のオリゴヌクレオチドが、C1〜C4部分配列および多数の異種のX1〜X3変異部分配列X1'〜X3'をコードし、
(b) 第2の複数のオリゴヌクレオチドがC1〜C4部分配列をコードするヌクレオチド配列および多数の異種のX1'〜X3'部分配列をコードするヌクレオチド配列と相補的であり、かつ
(c) 第1および第2の複数のオリゴヌクレオチドが互いに相補的なオーバーラップ配列を有する、工程;
(iii) オリゴヌクレオチド集団を合わせて第1混合物を形成する工程;
(iv) オーバーラップ相補配列のハイブリダイゼーションに効果的な条件下で該混合物をインキュベートして、複数のハイブリダイズした相補配列を形成する工程;ならびに
(v) 複数のハイブリダイズした相補配列を伸長して、ライブラリーを含む第2混合物を形成する工程。
【請求項68】
C1〜C4のそれぞれが、選択された部分配列に最高20個の単一アミノ酸の置換、欠失、挿入、または付加を独立して含む、請求項67記載の方法。
【請求項69】
C1〜C4のそれぞれが、選択された部分配列に最高10個の単一アミノ酸の置換、欠失、挿入、または付加を独立して含む、請求項68記載の方法。
【請求項70】
C1〜C4のそれぞれが、選択された部分配列に0から最高5個の単一アミノ酸の置換、欠失、挿入、または付加を独立して含む、請求項69記載の方法。
【請求項71】
第2混合物の温度を二本鎖DNAの変性に効果的な温度まで上げることによりライブラリーを変性する段階を含む段階のサイクルを実施する工程をさらに含み、(iv)および(v)の工程がこれに続く、請求項67記載の方法。
【請求項72】
最高100回の段階のサイクルの反復を含む、請求項71記載の方法。
【請求項73】
フォワードプライマーおよびリバースプライマーがライブラリーの全ての核酸の5'および3'末端配列にそれぞれハイブリダイズすることができる、本質的にライブラリー、フォワードプライマー、およびリバースプライマーからなるポリメラーゼ連鎖反応によりライブラリーを増幅する工程をさらに含む、請求項67記載の方法。
【請求項74】
X1、X2、またはX3部分配列の各位置においてコードされるアミノ酸が、アラニン、アルギニン、アスパラギン、アスパラギン酸、システイン、グルタミン、グルタミン酸、グリシン、ヒスチジン、イソロイシン、ロイシン、リジン、メチオニン、フェニルアラニン、プロリン、セリン、トレオニン、トリプトファン、チロシン、およびバリンのサブセットから選択される、請求項67記載の方法。
【請求項75】
各単一アミノ酸の置換について選択されたアミノ酸が、少なくとも一つの脂肪族アミノ酸、少なくとも一つの酸性アミノ酸、少なくとも一つの中性アミノ酸、および少なくとも一つの芳香族アミノ酸からなるアミノ酸群から選択される、請求項74記載の方法。
【請求項76】
アミノ酸群が、アラニン、アスパラギン酸、セリン、およびチロシンからなる、請求項75記載の方法。
【請求項77】
以下の工程を含む、請求項3記載のライブラリーを生成する方法:
(i) アミノ酸配列:C1-X1-C2-X2-C3-X3-C4を含む親ポリペプチドをコードする親核酸を提供する工程であって、部分配列C1が図3または図5から選択され、部分配列C2が図3または図5から選択され、部分配列C3が図3または図5から選択され、部分配列C4が図3または図5から選択され、C1〜C4のそれぞれが、選択された部分配列に最高10個の単一アミノ酸の置換、欠失、挿入、または付加を含み、かつX1〜X3のそれぞれが、2〜20個のアミノ酸からなる独立した部分配列である、工程;
(ii) X1、X2、またはX3部分配列に最高10個の単一アミノ酸の置換、欠失、挿入、または付加を導入する条件下で親核酸を複製し、それにより、X1'、X2'、またはX3'をコードするランダムに変化した部分配列集団を生成する工程;および
(iii) ランダムに変化した部分配列X1'、X2'、またはX3'の集団を、X1、X2、またはX3をコードする集団に対応する位置で親核酸集団へ置換する工程。
【請求項78】
X1〜X3部分配列の少なくとも一つがSEQ ID NO:121〜123から選択される、請求項77記載の方法。
【請求項79】
C1〜C4のそれぞれが、選択された部分配列に最高20個の単一アミノ酸の置換、欠失、挿入、または付加を独立して含む、請求項27記載の方法。
【請求項80】
C1〜C4のそれぞれが、選択された部分配列に最高10個の単一アミノ酸の置換、欠失、挿入、または付加を独立して含む、請求項79記載の方法。
【請求項81】
C1〜C4のそれぞれが、選択された部分配列に最高5個の単一アミノ酸の置換、欠失、挿入、または付加を独立して含む、請求項80記載の方法。
【請求項82】
C1〜C4のいずれも、選択された部分配列にアミノ酸の置換、欠失、挿入、または付加を含まない、請求項81記載の方法。
【請求項83】
複製によって、X1、X2、またはX3のそれぞれに最高5個のアミノ酸置換が導入されることでランダムに変化した部分配列の異種集団が生成される、請求項77記載の方法。
【請求項84】
生物学的複製システムへのライブラリーの導入および該生物学的複製システムの増殖によるライブラリーの増幅をさらに含む、請求項77記載の方法。
【請求項85】
生物学的複製システムが複数の大腸菌細胞である、請求項84記載の方法。
【請求項86】
生物学的複製システムが複数のバクテリオファージである、請求項84記載の方法。
【請求項87】
複製がインビトロで起こる、請求項77記載の方法。
【請求項88】
複製が、精製された変異原性ポリメラーゼによって行なわれる、請求項87記載の方法。
【請求項89】
複製がヌクレオチド類似体の存在下で行なわれる、請求項87記載の方法。
【請求項90】
複製がインビボで起こる、請求項77記載の方法。
【請求項91】
インビボでの複製が変異原性種の大腸菌内で起こる、請求項90記載の方法。
【請求項92】
以下の工程を含む、請求項3記載のライブラリーを生成する方法:
(i) コードされるC1-X1-C2-X2-C3-X3-C4を含むアミノ酸配列を選択する工程であって、
(a) 部分配列C1が図3または図5から選択され、部分配列C2が図3または図5から選択され、部分配列C3が図3または図5から選択され、かつ部分配列C4が図3または図5から選択され、
(b) C1〜C4のそれぞれが、選択された部分配列に最高10個の単一アミノ酸の置換、欠失、挿入、または付加を含み、
(c) X1、X2、およびX3のそれぞれが、アミノ酸長2〜20個のアミノ酸配列からなる、工程;
(ii) 第1の複数のオリゴヌクレオチドおよび第2の複数のオリゴヌクレオチドを提供する工程であって:
(a) 第1の複数のオリゴヌクレオチドが、C1〜C4部分配列および多数の異種のX1〜X3変異部分配列X1'〜X3'をコードし;
(b) 第2の複数のオリゴヌクレオチドが、C1〜C4部分配列をコードするヌクレオチド配列および多数の異種のX1'〜X3'部分配列をコードするヌクレオチド配列と相補的であり;かつ
(c) 第1および第2の複数のオリゴヌクレオチドが、互いに相補的なオーバーラップ配列を有する、工程;
(iii) オリゴヌクレオチド集団を合わせて第1混合物を形成する工程;
(iv) オーバーラップ相補配列のハイブリダイゼーションに効果的な条件下で該混合物をインキュベートして、複数のハイブリダイズした相補配列を形成する工程;ならびに
(v) 複数のハイブリダイズした相補配列を伸長して、ライブラリーを含む第2混合物を形成する工程。
【請求項93】
C1〜C4のそれぞれが、選択された部分配列に最高20個の単一アミノ酸の置換、欠失、挿入、または付加を独立して含む、請求項92記載の方法。
【請求項94】
C1〜C4のそれぞれが、選択された部分配列に最高10個の単一アミノ酸の置換、欠失、挿入、または付加を独立して含む、請求項93記載の方法。
【請求項95】
C1〜C4のそれぞれが、選択された部分配列に0から最高5個の単一アミノ酸の置換、欠失、挿入、または付加を独立して含む、請求項94記載の方法。
【請求項96】
第2混合物の温度を二本鎖DNAの変性に効果的な温度まで上げることによりライブラリーを変性する段階を含む段階のサイクルを実施する工程をさらに含み、(iv)および(v)の工程がこれに続く、請求項92記載の方法。
【請求項97】
最高100回のサイクルの反復を含む、請求項96記載の方法。
【請求項98】
フォワードプライマーおよびリバースプライマーが、ライブラリーの全ての核酸の5'および3'末端配列にそれぞれハイブリダイズすることができる、本質的にライブラリー、フォワードプライマー、およびリバースプライマーからなるポリメラーゼ連鎖反応によりライブラリーを増幅する工程をさらに含む、請求項92記載の方法。
【請求項99】
X1、X2、またはX3部分配列の各位置においてコードされるアミノ酸が、アラニン、アルギニン、アスパラギン、アスパラギン酸、システイン、グルタミン、グルタミン酸、グリシン、ヒスチジン、イソロイシン、ロイシン、リジン、メチオニン、フェニルアラニン、プロリン、セリン、トレオニン、トリプトファン、チロシン、およびバリンのサブセットから選択される、請求項92記載の方法。
【請求項100】
各単一アミノ酸の置換について選択されたアミノ酸が、少なくとも一つの脂肪族アミノ酸、少なくとも一つの酸性アミノ酸、少なくとも一つの中性アミノ酸、および少なくとも一つの芳香族アミノ酸からなるアミノ酸群から選択される、請求項99記載の方法。
【請求項101】
アミノ酸群が、アラニン、アスパラギン酸、セリン、およびチロシンからなる、請求項100記載の方法。
【請求項102】
少なくとも10個の異なるポリペプチドをコードする核酸ライブラリーであって、
(i) コードされた各ポリペプチドのアミノ酸配列が、SEQ ID NO:127〜129のいずれかと少なくとも70%の同一性を有するアミノ酸配列を含み;
(ii) コードされた各ポリペプチドのアミノ酸配列が、14、15、33、35〜36、38、47〜48、66、68〜69、71、80、81、99、101〜102、および104の位置で、SEQ ID NO:127〜129とは異なるアミノ酸を含み、かつアミノ酸の差異が複数のコードされたポリペプチド全体において異種であり;かつ
(iii) SEQ ID NO:127〜129の14、15、33、35〜36、38、47〜48、66、68〜69、71、80、81、99、101〜102、および104の位置に対応する残基以外のコードされた各ポリペプチドのアミノ酸配列が、複数のコードされたポリペプチド全体において同種である、
ライブラリー。
【請求項103】
ポリペプチドのアミノ酸配列が、SEQ ID NO:127〜129のいずれかと少なくとも75%の同一性を有する、請求項102記載のライブラリー。
【請求項104】
ポリペプチドのアミノ酸配列が、SEQ ID NO:127〜129のいずれかと少なくとも80%の同一性を有する、請求項102記載のライブラリー。
【請求項105】
ポリペプチドのアミノ酸配列が、SEQ ID NO:127〜129のいずれかと少なくとも85%の同一性を有する、請求項102記載のライブラリー。
【請求項106】
各核酸がベクター配列を含む、請求項102記載のライブラリー。
【請求項107】
請求項102〜106のいずれか一項記載のライブラリーから選択される、ポリペプチドをコードする単離核酸。
【請求項108】
請求項107記載の核酸がコードする精製ポリペプチド。
【請求項109】
請求項102記載のライブラリーがコードするポリペプチドを発現する細胞集団。
【請求項110】
請求項109記載の細胞集団から選択される細胞。
【請求項111】
請求項102記載のライブラリーがコードする精製ポリペプチドライブラリー。
【請求項112】
請求項102記載のライブラリーがコードするポリペプチドのライブラリーをディスプレイする繊維状ファージの集団。
【請求項113】
以下の工程を含む、請求項102記載のライブラリーを生成する方法:
(i) コードされるSEQ ID NO:127〜129のいずれか一つに対応するアミノ酸配列を選択する工程であって、選択された配列が、可変位置14、15、33、35〜36、38、47〜48、66、68〜69、71、80、81、99、101〜102、および104の少なくとも一つにおいてSEQ ID NO:127〜129の配列とは異なる、工程;
(ii) 第1および第2の複数のオリゴヌクレオチドを化学的に提供する工程であって、
(a) 第1の複数のオリゴヌクレオチドが、選択されたアミノ酸配列のアミノ酸部分配列をコードし、該部分配列が、コードされた可変位置で異種であり、
(b) 第2の複数のオリゴヌクレオチドが、選択されたアミノ酸配列の部分配列をコードするヌクレオチド配列と相補的であり、該部分配列が、コードされた可変位置で異種であり、かつ
(c) 第1および第2の複数のオリゴヌクレオチドが、互いに相補的なオーバーラップ配列を含む、工程;
(iii) オリゴヌクレオチド集団を合わせて第1混合物を形成する工程;
(iv) オーバーラップ相補配列のハイブリダイズに効果的な条件下で該混合物をインキュベートして、複数のハイブリダイズした相補配列を形成する工程;ならびに
(v) 複数のハイブリダイズした相補配列を伸長して、ライブラリーを含む第2混合物を生成する工程。
【請求項114】
第2混合物の温度を二本鎖DNAの変性に効果的な温度まで上げることによりライブラリーを変性する段階のサイクルを実施する工程をさらに含み、(iv)および(v)の工程がこれに続く、請求項113記載の方法。
【請求項115】
最高100回のサイクルの反復を含む、請求項114記載の方法。
【請求項116】
フォワードプライマーおよびリバースプライマーがライブラリーの全ての核酸の5'および3'末端配列にそれぞれハイブリダイズすることができる、本質的にライブラリー、フォワードプライマー、およびリバースプライマーからなるポリメラーゼ連鎖反応によりライブラリーを増幅する工程をさらに含む、請求項115記載の方法。
【請求項117】
可変位置においてコードされるアミノ酸が、アラニン、アルギニン、アスパラギン、アスパラギン酸、システイン、グルタミン、グルタミン酸、グリシン、ヒスチジン、イソロイシン、ロイシン、リジン、メチオニン、フェニルアラニン、プロリン、セリン、トレオニン、トリプトファン、チロシン、およびバリンのサブセットから選択される、請求項113記載の方法。
【請求項118】
可変位置について選択されたアミノ酸が、脂肪族アミノ酸、酸性アミノ酸、中性アミノ酸、および芳香族アミノ酸からなる群より選択される、請求項117記載の方法。
【請求項119】
アミノ酸群が、アラニン、アスパラギン酸、セリン、およびチロシンからなる、請求項118記載の方法。

【図1】
image rotate

【図2−1】
image rotate

【図2−2】
image rotate

【図2−3】
image rotate

【図2−4】
image rotate

【図2−5】
image rotate

【図2−6】
image rotate

【図3−1】
image rotate

【図3−2】
image rotate

【図3−3】
image rotate

【図3−4】
image rotate

【図3−5】
image rotate

【図3−6】
image rotate

【図3−7】
image rotate

【図3−8】
image rotate

【図3−9】
image rotate

【図3−10】
image rotate

【図3−11】
image rotate

【図3−12】
image rotate

【図3−13】
image rotate

【図3−14】
image rotate

【図3−15】
image rotate

【図3−16】
image rotate

【図3−17】
image rotate

【図3−18】
image rotate

【図3−19】
image rotate

【図3−20】
image rotate

【図3−21】
image rotate

【図3−22】
image rotate

【図3−23】
image rotate

【図3−24】
image rotate

【図3−25】
image rotate

【図3−26】
image rotate

【図3−27】
image rotate

【図4】
image rotate

【図5】
image rotate


【公表番号】特表2009−526525(P2009−526525A)
【公表日】平成21年7月23日(2009.7.23)
【国際特許分類】
【出願番号】特願2008−554438(P2008−554438)
【出願日】平成19年2月13日(2007.2.13)
【国際出願番号】PCT/US2007/003937
【国際公開番号】WO2007/095300
【国際公開日】平成19年8月23日(2007.8.23)
【出願人】(508245208)ダイバージェンス インコーポレーティッド (1)
【Fターム(参考)】