説明

GNNのためのジンクフィンガー結合ドメイン

【課題】標的ヌクレオチドに対する結合特異性を有するジンクフィンガーヌクレオチド結合ポリペプチドを提供すること。
【解決手段】1つまたは複数のGNNトリプレットを含む標的ヌクレオチドに対する結合特異性を有するジンクフィンガーヌクレオチド結合ポリペプチドが提供される。そのようなポリペプチドを含む組成物、並びにヌクレオチド機能を調節するためのそのようなポリペプチドおよび組成物の使用もまた提供される。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、標的ヌクレオチドとジンクフィンガー蛋白質の結合である。より具体的には、本発明は、5'−(GNN)−3'なる式の標的ヌクレオチドと特異的に結合するジンクフィンガーのαヘリックスドメイン内のアミノ酸残基配列に関する。
【背景技術】
【0002】
従来技術
遺伝子発現を支配する主要メカニズムは、配列特異的態様でDNAと結合する蛋白質スイッチを必要とするという考え方は1967年に確立された(M. Ptashne, Nature(London) 214:323-4(1967))。構造的に多様な種類のDNA結合蛋白質が報告されてきた。多数の構造的多様性にもかかわらず、Cys2−His2ジンクフィンガーモチーフは真核細胞でもっとも頻繁に利用される核酸結合モチーフである。この観察はヒトの場合と同様に酵母でも同様である。Cys2−His2ジンクフィンガーモチーフ(これは最初DNAおよびRNA結合転写因子TFIIIAで特定された(J. Miller, A.D. McLachlan & A. Klug, Embo J. 4:1609-14(1985))は、それを土台にして配列特異的蛋白質を構築することができる理想的な構造的足場である。1つのジンクフィンガードメインは、疎水性相互作用とただ1つの亜鉛イオンのキレート化によって安定化されたただ1つのββα折りたたみをもつ約30のアミノ酸から成る(J. Miller, A.D. McLachlan & A. Klug, Embo J. 4:1609-14(1985);M.S. Lee, G.P. Gippert, K.V. Soman, D.A. Case & P.E. Wright, Science 245:635-7(1989))。
【0003】
DNAの主溝にこのドメインのαヘリックスを提示することによって、配列特異的な塩基の接触が可能になる。各ジンクフィンガードメインは、典型的には3つのDNA塩基対を認識するが(N.P. Pavletich & C.O. Pabo, Science(Washington, D.C., 1883-)252:809-17(1991); M. Elrod-Erickson, M.A. Rould, L. Nekludova & C.O. Pabo, Structure(London) 4:1171-1180(1996); M. Elrod-Erickson, T.E. Benson & C.O. Pabo, Structure(London) 6:451-464(1998); C.A. Kim & J.M. Berg, Nature Structual Biology 3:940-945(1996))、ヘリックス提示の変動によってより広範な部位の認識が可能になる(N.P. Pavletich & C.O. Pabo, Science(Washington, D.C., 1883-) 261:1701-7(1993); H.B. Houbaviy, A. Usheva, T. Shenk & S.K. Burley, Proc. Natl. Acad. Sci. USA, 93:13577-82(1996) ;L. Fairall, J.W.R. Schwabe, L. Chapman, J.T. Finch & D. Rhodes, Nature(London) 366:483-7(1993); D.S. Wuttke, M.P. Foster, D.A. Case, J.M. Gottesfeld & P.E. Wright, J. Mol. Biol. 273:183-206))。より長いDNA配列またはアドレスとの蛋白質−DNA接触の拡張のためには蛋白質ドメインの二量体形成が必要とされるほとんどの転写因子とは対照的に、ジンクフィンガードメインの単純な共有結合による縦並びの繰り返しは、このモチーフによるより長い非対称性DNA配列の認識を可能にする。
【0004】
最近になって、我々は、6つのジンクフィンガードメインをもち、18塩基対の連続DNA配列に結合するポリダクチルジンクフィンガーを報告した(Q. Liu, D.J. Segal, J.B. Ghiara & C.F. Barbas III, PNAS 94:5525-5530(1997)。高度に特異的な遺伝子スイッチとしてポリダクチル蛋白質を用いるための要件であるDNAの18塩基対の認識は、既知の全てのゲノム内の固有のDNAアドレスを書き表すために十分である。実際、これらポリダクチル蛋白質を用いて、遺伝子活性化および遺伝子抑圧の両方がモデル系で示された(Q. Liu, D.J. Segal, J.B. Ghiara & C.F. Barbas III, PNAS 94:5525-5530(1997))。
【0005】
ジンクフィンガードメインの各々が3塩基対配列と結合するので、完全な認識アルファベットは64ドメインの性状決定を必要とする。これらドメインの構築のガイドとなる現存の情報は3つのタイプの研究から得られた:構造決定(N.P. Pavletich & C.O. Pabo, Science(Washington, D.C., 1883-)252:809-17(1991); M. Elrod-Erickson, M.A. Rould, L. Nekludova & C.O. Pabo, Structure(London) 4:1171-1180(1996); M. Elrod-Erickson, T.E. Benson & C.O. Pabo, Structure(London), 6:451-464(1998); C.A. Kim & J.M. Berg, Nature Structual Biology 3:940-945(1996); N.P. Pavletich & C.O. Pabo, Science(Washington D.C., 1883-) 261:1701-7(1993); H.B. Houbaviy, A. Usheva, T. Shenk & S.K. Burley, Proc. Natl. Acad. Sci. USA, 93:13577-82(1996); L. Fairall, J.W.R. Schwabe, L. Chapman, J.T. Finch & D. Rhodes, Nature(London) 366:483-7, 11(1993); D.S. Wuttke, M.P. Foster, D.A. Case, J.M. Gottesfeld & P.E. Wright, J. Mol. Biol. 273:183-206(1997); R.T. Nolte, R.M. Conlin, S.C. Harrison & R.S. Brown, Proc. Natl. Acad. Sci. USA, 95:2938-2943(1998); V.A. Narayan, R.W. Kriwacki & J.P. Caradonna, J. Biol. Chem. 272:7801-7809(1997));位置特異的突然変異(M. Isalan, Y. Choo & A. Klug, Proc. Natl. Acad. Sci. USA, 94:5617-5621(1997); J. Nardelli, T.J. Gibson, C. Vesque & P. Charnay, Nture 349:175-178(1991); J. Nardelli, T. Gibson & P. Charnay, Nucleic Acids Res. 20:4137-44(1922); W.E. Taylor, H.K. Suruki, A.H.T. Lin, P. Naraghi-Arani, R.Y. Igarashi, M. Younessian, P. Katkus N.V. Vo, Biochemistry 34:3222-3230(1995); J.R. Desjarlais & J.M. Berg, Proteins:Struct, Func, Genet. 12:101-4(1992); J. R. Desjarlais & J.M. Berg, Proc. Natl. Acad. Sci. USA, 89:7345-9(1992));およびファージディスプレー選別(Y. Choo & A. Klug, Proc. Natl. Acad. Sci. USA, 91:11163-7(1994); H.A. Greisman & C.O. Pabo, Science(Washington D.C.) 275:657-661.23(1997); E.J. Rebar & C.O. Pabo, Science(Washington D.C., 1883-) 263:671-3; A.C. Jamieson, S.-H. Kim & J.A. Wells, Biochemistry 33:5689-5695(1994); A.C. Jamieson, H. Wang & S.-H. Kim, PNAS 93:12834-12839(1996); M. Isalan, A. Klug & Y. Choo, Biochemistry 37:12026-33(1998); H. Wu, W.-P. Yang, & C.F. Barbas III, PNAS 92:344-348(1995))。すべての研究が我々のジンクフィンガー/DNA認識の理解に役立ったが、各々それぞれの限界があった。
【0006】
構造研究によって多様な蛋白質/DNA相互反応スペクトルが特定されたが、別の相互反応がより適しているか否かについては明らかではない。さらにまた、配列特異的認識を可能にする相互作用が観察されるが、一方、別のどのような配列が結合から除外されるかについての情報はほとんど提供されていない。これらの疑問は現在知られている蛋白質の突然変異によって部分的に強調されてきたが、そのデータは性状が決定できる変異体の数のために制限がある。任意抽出ライブラリーのファージディスプレーおよび選別は数に関するある種の制限を克服したが、選別に必要な特異性と親和性の両方を担保できる適切な選別圧力が困難であるという条件付きである。我々自身の研究(H. Wu, W.-P. Yang & C.F. Barbas III, PNAS 92:344-348(1995))を含むいくつかの研究室の実験では、この認識アルファベットのいくつかをデザインまたは選別することが可能なことを示した(Y. Choo & A. Klug, Proc. Natl. Acad. Sci. USA, 91:11163-7(1994); H.A. Greisman & C.O. Pabo, Science(Washington, D.C.) 275:657-661(1994);E.J. Rebar & C.O. Pabo, Science(Washington D.C., 1883-) 263:671-3(1994); A.C. Jamieson, S.-H. Kim & J.A. Wells, Biochemistry 33:5689-5695.25(1994); A.C. Jamieson, H. Wang & S.-H.Kim, PNAS 93:12834-12839(1996); M. Isalan, A. Klug & Y. Choo, Biochemistry 37:12026-33(1998))。しかしながら、その標的DNAに対するこれらドメインの特異性および親和性は、これらの初期の実験では厳格で系統的な態様ではほとんど研究されなかった。
【0007】
ヤコブとモノドがリプレッサーの化学的特性について問題を提起し、細胞内で個々の蛋白質の合成が惹起または抑制される機構を提唱して以来、特別な実験による遺伝子発現の制御は興味をそそるものであった(F. Jacob & J. Monod, J. Mol. Biol. 3:318-356(1961))。ゲノムは、主に配列特異的態様でDNAに結合する転写因子として知られている蛋白質の作用によって転写段階で調節されるということは現在周知である。これらの蛋白質因子は、しばしば複雑な組み合わせ様式で作用し、遺伝子発現について一時的、空間的制御および環境的反応制御を可能にする(M. Ptashne, Nature Medicine 3:1069-1072(1997))。しばしば転写因子は、蛋白質をゲノム内の特定の部位に配置させるDNA結合部位および付属エフェクタードメイン(当該部位およびその近くでの転写を惹起(活性化)または抑圧するために作用する)の両者を介して作用する(I.G. Cowell, Trends Biochem. Sci. 19:38-42(1994))。エフェクタードメイン、例えば活性化ドメインVP16(I. Sadowski, J. Ma, S. Triezenberg & M. Ptashne, Nature 335:563-564(1988))および抑圧ドメインKRAB(J.F. Margolin, J.R. Friedman, W. Meyer, K.-H., H. Vissing, H.-J. Thiesen & F.J. Rauscher III, Proc. Natl. Acad. Sci. USA, 91:4509-4513(1994))は典型的にはモジュール式で、それらが他のDNA結合蛋白質と融合したときそれらの活性を維持する。ゲノム内の特定の部位に転写因子を誘導することによって遺伝子は容易に制御できるかもしれないが、一方、与えられたいずれの配列とも結合できるように適合させたDNA結合蛋白質をデザインすることはきわめて困難なチャレンジであった。
【0008】
本発明は、核酸に結合するジンクフィンガー蛋白質のCys2−His2クラスに固有の構造的特性の認識を基にしている。Cys2−His2ジンクフィンガードメインは、長さが約30アミノ酸の単純なββα折りたたみから成る。この折りたたみの構造的安定性は、疎水性相互作用と保存Cys2−His2残基によるただ1つの亜鉛イオンのキレーションによって達成される(M.S. Lee, G.P. Gippert, K.V. Soman, D.A. Case & P.E. Wright, Science 245:635-637(1989))。
核酸の認識は、典型的にはDNA配列の3塩基対と結合する、このドメインのαヘリックスから発生する特異的アミノ酸側鎖の接触により達成される(N.P. Pavletich & C.O. Pabo, Science 252:809-17(1991); M. Elrod-Erickson, M.A. Rould, L. Nekludova & C.O. Pabo, Structure 4:1171-1180(1996))。他の核酸認識モチーフと異なり、マルチジンクフィンガードメインの単純な共有結合による連結は広い範囲の非対称性DNA配列の認識を可能にする。天然のジンクフィンガー蛋白質の研究によって、3つのジンクフィンガードメインは連続した9塩基対のDNA配列と結合できることが明らかにされた(N.P. Pavletich & C.O. Pabo, Science 252:809-17(1991); A.H. Swirnoff & J. Milbrandt, Mol. Cell. Biol. 15:2257-87(1995))。9塩基対の配列の認識では大腸菌(E. coli)の小さなゲノムでさえもその中の固有の部位を特定するためには不十分であるが、一方、6つのジンクフィンガードメインを含むポリダクチル蛋白質は18塩基対認識を特定できる(Q. Liu, D.J. Segal, J.B. Ghiara & C.F. Barbas III, Proc. Natl. Acad. Sci. USA, 94:5525-5530(1997))。遺伝子制御のための普遍的な系の開発に関して、18塩基対アドレスは、全ての既知ゲノム内のただ1つの部位を特定するために十分である。しかしながら、このタイプのポリダクチル蛋白質の性質は知られていないが、遺伝子の活性化および抑圧におけるヒトの生細胞内でのそれらの有効性が最近になって示された(Q. Liu, D.J. Segal, J.B. Ghiara & C.F. Barbas III, Proc. Natl. Acad. Sci. USA, 94:5525-5530(1997))。
【発明の概要】
【課題を解決するための手段】
【0009】
発明が解決しようとする課題
本発明の特徴の1つでは、配列番号:1−110のいずれかのアミノ酸残基配列を含む、単離および精製したジンクフィンガーヌクレオチド結合ポリペプチドが提供される。関連する特徴では、本発明はさらに2つから約12のそのようなジンクフィンガーヌクレオチド結合ポリペプチドを含む組成物を提供する。本組成物は好ましくは2つから約6つのポリペプチドを含む。好ましい実施態様では、ジンクフィンガーヌクレオチド結合ポリペプチドは、好ましくは配列番号:111の配列を有するアミノ酸残基によって機能的に連結されている。本発明の組成物は、5'−(GNN)n−3'なる配列を含むヌクレオチド標的と特異的に結合する。ここで各NはA、C、GまたはTであるが、ただし全てのNがCであることはないということを条件とし、nは好ましくは2から6である。ポリペプチドまたは組成物は、さらに1つまたは2つ以上の転写調節因子、例えば転写アクチベーターまたは転写サプレッサーもしくはリプレッサーに機能的に連結されていてもよい。本発明はまた、本発明のポリペプチドまたは組成物をコードする単離および精製ポリヌクレオチド並びにそのようなポリヌクレオチドを含む発現ベクターを提供する。
【0010】
また別の特徴では、本発明は、5'−(GNN)n−3'なる配列を含むヌクレオチド配列の機能を調節する方法を提供する。ここでnは1から6の整数で、本方法は、1つまたは2つ以上の転写調節因子に機能的に連結させた、有効な量の本発明の組成物に前記ヌクレオチド配列を暴露することを含む。5'−(GNN)n−3'なる配列は、前記ヌクレオチドの転写領域もしくはプロモーター領域または発現された配列タグ内に見出される。
【0011】
本発明は、遺伝子スイッチの迅速な製造のための普遍的手法の平易さおよび有効性を明示してみせる。64種のジンクフィンガーアルファベットの5'−GNN−3'サブセット配列を認識する規定ジンクフィンガードメイン類を用いて、新規な9塩基対、または初めて18塩基対配列を特異的に認識するポリダクチル蛋白質を構築し性状を決定した。強力な転写因子が生成され、遺伝子活性化および遺伝子抑圧の両制御が可能なことが示された。遺伝子活性化は、単純疱疹ウイルスVP16活性化ドメイン(I. Sadowski, J. Ma, S. Triezenberg & M. Ptashne, Nature 335:563-564(1988))およびその最小活性化ドメインの組換え四量体リピートを用いて達成された。遺伝子抑圧または無発現(silencing)は、ヒト由来の3つのエフェクタードメイン、クリュッペル付随ボックス(Kruppel associated box, KRAB)(J.F. Margolin, J.R. Friedman, W. Meyer, K.-H., H. Vissing, H.-J. Thiesen & F.J. Rauscher III, Proc. Natl. Acad. Sci. USA, 91:4509-4513(1994))、ERFリプレッサードメイン(ERD)(D.N. Sgouras, M.A. Athanasiou, G.J. Beal,Jr., R.J. Fisher, D.G. Blair & G.J. Mavrothalassitis, EMBO J. 14:4781-4793(1995))、およびmSIN3相互反応ドメイン(SID)(D.E. Ayer, C.D. Laherty, Q.A. Lawrence, A.P. Armstrong & R.N. Eisenman, Mol. Cell. Biol. 16:5772-5781(1996))を用いて達成された。ヒト上皮細胞でルシフェラーゼレポーター遺伝子を用いて、プロト癌遺伝子erbB−2/HER−2のプロモーターを標的とするようにデザインされた人工的転写調節因子は、特異的態様で遺伝子発現を低下または活性化できることが示された。遺伝子転写物内に標的を誘導することによって初めて遺伝子活性化または遺伝子抑圧が達成され、発現された配列タグ(expressed sequence tag, EST)から得られる情報は遺伝子スイッチの構築に十分であろうということが示唆された。本明細書に開示した新規な方法および材料は、遺伝子治療、遺伝子導入生物、ゲノム機能学並びに他の細胞生物学および分子生物学分野で多様な応用が期待される。
【図面の簡単な説明】
【0012】
【図1】図1(6枚のパネルで示されている)は、本発明のジンクフィンガーヌクレオチド結合ポリペプチドの領域の結合特異性を示す。
【発明を実施するための形態】
【0013】
課題を解決するための手段
I.本発明
本発明は、ジンクフィンガーヌクレオチド結合ポリペプチド、1つまたは2つ以上の前記ポリペプチドを含む組成物、並びに遺伝子発現調節を目的とする前記ポリペプチドおよび組成物の使用を提供する。
II.化合物
本発明の化合物は、GNNヌクレオチド配列と結合し、当該ヌクレオチド配列の機能を調節する単離されたジンクフィンガーヌクレオチド結合ポリペプチドである。本ポリペプチドは遺伝子の転写を強化または抑圧することができ、さらにDNAまたはRNAと結合することができる。ジンクフィンガーヌクレオチド結合ポリペプチドは、野性型ジンクフィンガー蛋白質の誘導形または遺伝子組換えによって製造されたポリペプチドである。ポリペプチドは、例えば第二の蛋白質のジンクフィンガードメインと連結された蛋白質のジンクフィンガードメインを含むハイブリッドでもよい。このドメインは野性型でも変異型でもよい。ポリペプチドには野性型ジンクフィンガー蛋白質の切端形が含まれる。前記ポリペプチドが得られるジンクフィンガー蛋白質の例にはTFIIIAおよびzif268が含まれる。
【0014】
本発明のジンクフィンガーヌクレオチド結合ポリペプチドは、そのポリペプチドのαヘリックスドメイン内の固有のヘプタマー(7アミノ酸残基の連続した配列)で、この七量体配列は標的ヌクレオチドとの結合特異性を決定する。この七量体配列はαヘリックスドメイン内のいずれの場所に位置してもよいが、ただし残基に当技術分野で通常のとおりに番号を付与したとき、好ましくはヘプタマーは−1位から6位に広がっている。本発明のポリペプチドは、β−シートおよびジンクフィンガー蛋白質の部分として機能することが当技術分野で知られているフレームワーク配列を含むことができる。多数のジンクフィンガーヌクレオチド結合ポリペプチドを作製し、GNNトリプレットを含む標的ヌクレオチドに対する結合特異性について検査した。これらの実験の結果は図1に要約されている。
図1では、各ペプチドに対するGNNトリプレット結合特異性は右側の欄に示されている。もっとも強い特異性は第一番目にさらに太字で示されている。図1では配列番号は括弧内に示されている。各々特定のGNN(例えばGAA、これは図1の右側の欄に示されている)標的について、当該トリプレットに対する特異性の高いものから順に配列が並べられている。
【0015】
図1に示すように、このデータでは、主要DNA接触ポジション(−1、3および6)の3つの全てが驚くほど保存されているのが与えられた標的の実質的に全てについて観察された。これら残基の多くは以前にもはるかに不完全なライブラリーによる選別の後でこれらの場所で観察されたが、ここで認められた保存の程度は以前の実験よりも劇的な改良を示している(Y. Choo & A. Klug, Proc. Natl. Acad. Sci. USA, 91:11163-7(1994); H.A. Greisman & C.O. Pabo, Science(Washington, D.C.) 275:657-661(1997); E.J. Rebar & C.O. Pabo, Science(Washington D.C., 1883-) 263:671-3(1994); A.C. Jamieson, S.-H. Kim & J.A. Wells, Biochemistry 33:5689-5695(1994); A.C. Jamieson, H. Wang & S.-H. Kim, PNAS 93:12834-12839(1996); H. Wu, W.-P. Yang & C.F. Barbas III, PNAS 92:344-348(1995))。本発明は、ジンクフィンガードメインの3つのヘリックスポジション(−1、3および6)はドメインのDNA結合特異性を詳細に示すために十分であるという従来の教示が正しくないことを示している。
【0016】
典型的には、ファージ選別はこれらのポジションのほんの1つまたは2つにおいてコンセンサス選別を示した。もっともおおきな配列変動は、ポジション1および5の残基で生じ(これらのポジションはZif268/DNA構造では塩基接触を生じない)、認識に顕著には寄与しないと考えられた(N.P. Pavletich & C.O. Pabo, Science(Washington, D.C., 1883-) 252:809-17(1991); M. Elrod-Erickson, M.A. Rould, L. Nekludova & C.O. Pabo, Structure(London) 4:1171-1180(1996))。ポジション1および5の変動はまた、他のポジションにおける保存はDNAとの相互作用によるもので、他の理由によるただ1つのクローンの単なる偶然の増幅のためではないことを暗示している。ポジション2の残基同一性保存もまた観察された。ポジション−2の保存はいくぶん人為的で、NNKライブラリーはセリンとして固定されたこの残基を有していた。この残基はZif268構造でDNA骨格と接触する。両ライブラリーがポジション4に不変のロイシンを含んでいた(ロイシンは、このドメインの折りたたみを安定化させる疎水性コア中の必須の残基である)。
【0017】
見事なアミノ酸保存が、異なる標的内の同じヌクレオチドの認識について観察された。例えば、GAG、GAA、GATまたはGACコンテクストのいずれであれ、ポジション3のAsn(Asn3)は中央のポジションのアデニンを認識するために実質的に常に選ばれた。Gln−1およびArg−1は、コンテクストにかかわらず3'ポジションでそれぞれアデニンまたはグアニンを認識するために常に選ばれた。GlnまたはAsnによるアミド側鎖を基にしたアデニンの認識は、3'または5'グアニンとのグアニン接触に対するArgグアニジニウム側鎖の場合のように構造研究で詳しく記述されている(M. Elrod-Erickson, T.E. Benson & C.O. Pabo, Structure(London) 6:451-464(1998); C.A. Kim & J.M. Berg, Nature Structual Biology 3:940-945(1996); L. Fairall, J.W.R. Schwabe, L. Chapman, J.T. Finch & D. Rhodes, Nature(London) 366:483-7(1993))。しかしながら、より頻繁に2つまたは3つのアミノ酸がヌクレオチド認識のために選ばれた。His3またはLys3(およびより低い頻度でGly3)が中央のグアニンの認識のために選ばれた。Ser3およびAla3は中央のチミンを認識するために選ばれた。Thr3、Asp3およびGlu3は、中央のシトシンを認識するために選ばれた。AspおよびGluはまた3'シトシンを認識するためにポジション−1で選ばれ、一方、Thr−1およびSer−1は3'チミンを認識するために選ばれた。
【0018】
選別されたZif268変種は細菌性発現ベクターでサブクローニングされ、蛋白質を過剰発現させた(フィンガー−2蛋白質、以下ではそれら蛋白質が選別されるサブサイトによって呼ばれる)。ファージ融合物よりも可溶性蛋白質を研究することが重要である。なぜならば、これら2つはそれらの結合特性が顕著に異なることが知られているからである(A. Crameri, S. Cwirla & W.P. Stemmer, Nat. Med. 2:100-102(1996))。16の5'−GNN−3'フィンガー−2サブサイトの各々を認識するそれら蛋白質の能力をマルチ標的ELISAアッセイを用いて検査した。このアッセイは特異性について極めてきびしいテストを提供した。なぜならば、常に6つの"非特異的"部位が存在し、これは"特異的"部位とは9ヌクレオチドの標的のうちの1つのヌクレオチドだけが"特異的"部位と異なっていたからである。ファージ選別フィンガー−2蛋白質の多くが完璧な特異性を示し、一方、他のものは様々な程度の交差反応性を示した。いくつかのポリペプチドはそれらが選別されたもの以外のサブサイトとより良好に結合した。
【0019】
認識ヘリックスを位置特異的変異を用いて改造することによって結合特異性を改良する試みを実施した。我々の選別および構造情報のデータが変異体デザインのガイドであった。今日まで徹底的な実験を実施して、100を越える変異蛋白質の性状を決定し認識の規則についての我々の理解を拡張しようと試みた。ヘリックスのポジション1および5はDNA認識に直接の役割を果たすとは期待されていないが、特異性についての最善の改良は常にこれらのポジションの改変を必要とした。これらの残基は燐酸骨格を接触させることが観察された(燐酸骨格は配列非特異的態様の親和性に寄与する)。非特異的接触の除去は、複合体の全体的な安定性に対する特異的接触の重要性を増加させ、それによって特異性を強化する。例えば、標的トリプレットGAC、GAAおよびGAGに対するポリペプチドの特異性は、ポジション1および5の非典型的な荷電を有する残基をより小型の荷電をもたない残基で置換することによって簡単に改造された。
【0020】
別の種類の改造は結合残基および非結合残基の両方の変化を含んでいた。GGGおよびフィンガー−2サブサイトGAGに対する交差反応性はHis3LysおよびThr5Valなる改造によって消失した。His3は中央のグアニン認識の選別中に常に選択されたが、Lys3はAおよびGのより明瞭な区別を提供したということは注目に値する。これは、この蛋白質の選別条件が、特異性のパラメーターよりも親和性のようなパラメーターによる選別に適していることを示唆している。Zif268構造では、His3は中央のグアニンのN7に水素結合を与える(N.P. Pavletich & C.O. Pabo, Science(Washington, D.C., 1883-) 252:809-17(1991); M. Elrod-Erickson, M.A. Rould, L.Nekludova & C.O. Pabo, Structure(London), 4:1171-1180(1996))。この結合はアデニンのN7とも形成することができ、実際Zif268はこのポジションではGとAを区別しない(A.H. Swirnoff & J. Milbrandt, Mol. Cell. Biol. 15:2275-87(1995))。His3は、GGA、GGCおよびGGTを標的とするポリペプチドでは、たとえLys3がGGCおよびGGTの選別中に選択されたとしても中央のグアニンのみを指定することが判明した。同様に、GTGを標的とするポリペプチドのマルチ交差反応性は、Lys1SerおよびSer3Gluなる改造によって減弱され、親和性が1/5になった。Glu3は、Zif268の結合部位選択実験ではシトシンに対して非常に特異性を有することが示された(A.H. Swirnoff & J. Milbrandt, Mol. Cell. Biol. 15:2275-87(1995))。構造的実験では、Glu3と中央のチミンとの相互反応は認められず、我々の実験でも他の研究でも中央のチミンを認識するためにGlu3は選択されることはなかった(Y. Choo & A. Klug, Proc. Natl. Acad. Sci. USA, 91:11163-7(1994);H.A. Greisman & C.O. Pabo, Science(Washington, D.C.) 275:657-661(1997); E.J. Rebar & C.O. Pabo, Science(Washington D.C., 1883-) 263:671-3(1994); A.C. Jamieson, S.-H. Kim & J.A. Wells, Biochemistry 33:5689-5695(1994); A.C. Jamieson, H. Wang & S.-H. Kim, PNAS 93:12834-12839(1996); M. Isalan, A. Klug & Y. Choo, Biochemistry 37:12026-33(1998); H. Wu, W.-P. Yang & C.F. Barbas III, PNAS 92:344-348(1995))。それにもかかわらず、Ser3Gluなる改造はシトシンよりも中央のチミンの認識に有利であった。これらの例は、特異性の基礎となる構造的要素を理解するためにはこれまでの構造と選択に関するデータに頼ることの限界を示している。さらにまた、ポジション1および5を含む改造による改良はこれまでの"認識コード"によっては予想されなかったことも強調されるべきで、前記認識コードは典型的にはポジション−1、2、3および6だけを考慮している。(J.R. Desjarlais & J.M. Berg, Proc. Natl. Acad. Sci. USA, 89:7345-9(1992); M. Suzuki, M. Gerstein & N. Yagi, Nucleic Acids Res. 22:3397-405(1994); Y. Choo & A. Klug, Proc. Natl. Acad. Sci. USA, 91:11168-72(1994); Y. Choo & A. Klug, Curr. Opin. Struc. Biol. 7:117-125(1997))。選別と位置特異的変異の組み合わせによってのみ、ジンクフィンガー/DNA認識の複雑さについての完全な理解が始まるであろう。
【0021】
選別と変異誘発データを組み合わせることによって、多くのヌクレオチドの特異的認識は単一のアミノ酸ではなくモチーフを用いて極めて良好に達成できるであろうということが明らかになった。例えば、3'グアニンのもっとも強力な指定は、Arg−1、Ser1およびAsp2の組み合わせ(RSDモチーフ)を用いて達成された。5'グアニンを指定するためにVal5およびArg6を用いることによって、サブサイトGGG、GAG、GTGおよびGCGの認識が通常のヘリックス構造(SRSD−X−LVR)を用いて達成できた。前記通常のヘリックス構造はポジション3の残基のみに相違が存在する(GGGのためにはLys3、GAGのためにはAsn3、GTGのためにはGlu3、およびGCGのためにはAsp3)。同様に、3'チミンは最後のクローンでThr−1、Ser1およびGly2(TSGモチーフ)を用いて指定された。さらに、3'シトシンはAsp−1、Pro1およびGly2(DPGモチーフ)を用いて指定できたが、ただしサブサイトがGCCの場合は、Pro1はこのサブサイトによって受け入れられることはなかった。3'アデニンは2つのクローン(QSSモチーフ)ではGln−1、Ser1およびSer2を用いて指定された。モチーフのポジション1および2の残基を3'塩基の各々について調べたところ、本明細書に開示したように与えられた3'塩基に対して最適の特異性を提供することが判明した。
【0022】
マルチ標的ELISAアッセイによれば、全ての蛋白質は5'位にグアニンを好むようであった。なぜならば、全ての蛋白質がArg6を含み、さらにこの残基は、このポジションでグアニンと接触することが構造的実験から判明しているからである(N.P. Pavletich & C.O. Pabo, Science(Washington, D.C.. 1883-) 252:809-17(1991); M. Elrod-Erickson, M.A. Rould, L. Nekludova & C.O. Pabo, Structure(London) 4:1171-1180(1996); M. Elrod-Erickson, T.E. Benson & C.O. Pabo, Structure(London) 6:451-464(1998); C.A. Kim & J.M. Berg, Nature Structural Biology 3:940-945(1996); N.P. Pavletich & C.O. Pabo, Science(Washington, D.C., 1883-) 261:1701-7(1993); H.B. Houbaviy, A. Usheva, T. Shenk & S.K. Burley, Proc. Natl. Acad. Sci. USA, 93:13577-82(1996); L. Fairall, J.W.R. Schwabe, L. Chapman, J.T. Finch & D. Rhodes, Nature(London) 366:483-7(1993); D.S. Wuttke, M.P. Foster, D.A. Case, J.M. Gottesfeld & P.E. Wright, J. Mol. Biol. 273:183-206(1997); R.T. Nolte, R.M. Conlin, S.C. Harrison & R.S. Brown, Proc. Natl. Acad. Sci. USA, 95:2938-2943(1998))。この相互作用は、5'結合部位シグナチャーアッセイを用いて本明細書では明らかにした((Y. Choo & A. Klug, Proc. Natl. Acad. Sci. USA, 91:11168-72(1994) ;図2、白棒)。各蛋白質は16のオリゴヌクレオチド標的プールに用いられた。前記プールでは、フィンガー−2サブサイトの5'ヌクレオチドがG、A、TまたはCとして固定され、中央および3'ヌクレオチドは任意抽出されていた。全ての蛋白質はGNNプールを好み、本質的に交差反応性はなかった。
【0023】
マルチ標的ELISAアッセイの結果は精製蛋白質の親和性実験によって確認された。ELISAアッセイで交差反応性が最小限であった事例では、ただ1つのヌクレオチドミスマッチは、典型的には親和性の100倍以上の損失をもたらした。この程度の特異性はそれでもジンクフィンガー蛋白質を用いて示されねばならなかった。一般に、中央および3'位にGまたはAをもつサブサイトと結合するように選択またはデザインされた蛋白質は最高の親和性を有し、続いて中央または3'位にただ1つのGまたはAをもつものが続き、さらにTまたCのみを含むものがこれに続く。前者の群は、典型的にはZif268よりも高い親和性で(10nM)それらの標的と結合し、後者はいくぶん低い親和性で結合し、ほとんど全ての蛋白質は親のC7蛋白質の親和性よりも低い親和性を有していた。
結合親和性と結合特異性の間には相関性が存在せず、特異性は特異的な蛋白質−DNA接触から生じるだけでなく、正しいヌクレオチド以外は全て排除する相互作用によっても生じることを示唆している。
【0024】
Asp2は、標的サブサイトがGNGである全ての蛋白質で常にArg1と一緒に選択された。これには2つの理由があることが今や理解される。Zif268の構造的実験から(N.P. Pavletich & C.O. Pabo, Science(Washington, D.C., 1883-) 252:809-17(1991); M. Elrod-Erickson, M.A. Rould L. Nekludova & C.O. Pabo Structure(London) 4:1171-1180(1996))、フィンガー2のAsp2はArg−1と1対の支持水素結合を形成し、これはいくつかの水仲介接触と同様にArg−1/3'グアニン相互反応を安定化させることが知られている。しかしながら、Asp2のカルボキシレートはまた、フィンガー−1サブサイトの5'グアニンと塩基対を形成しているシトシンのN4からの水素結合も受容している。この位置のTと塩基対を形成しているアデニンはシトシンで認められる接触と同様な接触を生じることができる。この相互反応は特に重要である。なぜならば、それによってフィンガー2の認識サブサイトは3ヌクレオチド(GNG)から4ヌクレオチド(GNG(G/T))に拡大されるからである(M. Isalan, Y. Choo & A. Klug, Proc. Natl. Acad. Sci. USA, 94:5617-5621(1997); A.C. Jamieson, H. Wang & S.-H. Kim, PNAS 93:12834-12839(1996); M. Isalan, A. Klug & Y. Choo, Biochemistry 37:12026-33(1998))。この現象は"標的部位オーバーラップ"と称され、3つの重要な結果をもたらす。第一に、我々のフィンガー−1サブサイトは5'グアニンを含んでいたので、Asp2は、フィンガー−2サブサイトがGNGの場合、我々のライブラリーによる選別にとって有利であった。第二に、それは、この実験で用いられるライブラリーのGNNまたはTNNフィンガー−2サブサイトによる選別に対する有用性を制限するかもしれない。
なぜならば、これらのライブラリーのフィンガー3はAsp2を含み、これはフィンガー−2サブサイトの5'ヌクレオチドをGまたはTに特定させるかもしれないからである。Zif268およびC7(これらはフィンガー2にThr6をもつ)では、フィンガー3のAsp2は5'位でGまたはT認識を強制する((T/G)GG)。この相互作用はまた、なぜこれまでのファージディスプレー実験(これらは全てZif268系ライブラリーを用いた)は主にGNN認識に限定された選別を見出したのかを説明することができる(Y. Choo & A. Klug, Proc. Natl. Acad. Sci. USA, 91:11163-7(1994); E.J. Rebar & C.O. Pabo, Science(Washington, D.C., 1883-) 263:671-3(1994); A.C. Jamieson, S.-H. Kim & J.A. Wells, Biochemistry 33:5689-5695(1994); A.C. Jamieson, H. Wang & S.-H. Kim, PNAS 93:12834-12839(1996); M. Isalan, A. Klug & Y. Choo, Biochemistry 37:12026-33(1998); H. Wu, W.-P. Yang & C.F. Barbas III, PNAS 92:344-348(1995))。
【0025】
最後に、標的部位オーバーラップは、これらジンクフィンガーのモジュール式結合ブロックとしての使用を潜在的に制限する。構造的データから、標的部位オーバーラップが極めて広範囲であるいくつかのジンクフィンガー(例えばGLIおよびYY1の場合のもの)およびZif268と類似していてほんの中等度のオーバーラップを示すその他のものが存在することが知られている。我々の最後の蛋白質セットでは、Asp2は、GGG、GAG、GTGおよびGCGと結合するポリペプチドで見出される。ポジション2で見出される他の残基のオーバーラップの潜在能力はほとんど知られていないが、しかしながら構造的実験では、このポジションで見出される他の多くの残基がそのようなクロスサブサイト接触に参画する可能性が示されている。Asp2を含むフィンガーはモジュール性を制限する可能性がある。なぜならば、それらは、各GNGサブサイトにTまたはGが続くことを要求するからである。
【0026】
下記の表1は、GNN標的トリプレットの16の具体例に対してもっとも強い選択性を示す配列(配列番号:1−16)を要約する。
【0027】
【表1】

【0028】
このデータは、全ての可能なGNNトリプレット配列は、ジンクフィンガードメインによって完璧な特異性で認識されることを示している。最適化されたジンクフィンガードメインは、親和性を100倍以上消失させてただ1つの塩基の違いを識別することができる。必須の接触ポジション−1、3および6で最適化された蛋白質で見出されるアミノ酸の多くが単純な認識コードと一致するものであるが、一方、最適な特異的認識は、これらの残基が提示されているコンテクストに感受性を有することが見出された。ポジション1、2および5の残基は特異的認識に必須であることが見出された。さらに、ポジション1の残基の単純な同一性よりむしろポジション−1、1および2の配列モチーフが高度に特異的な3'塩基の認識に要求されることをこのデータは初めて示した。おそらくこれらの残基は、特異的塩基の認識および他の塩基の排除という両方に関してヘリックスの相互反応のために適切な立体化学的背景を提供し、高度に特異的な相互作用という究極の結果を提供する。これらドメインの広範囲の有用性は、それらが、DNAおよび他のジンクフィンガードメインとの両相互作用においてモジュール形式である場合に認められるであろう。これは、標的部位オーバーラップによって強制される蓋然性の高い制限内で作業することによって(すなわち5'−(GNN)n−3'型が標的とされるはずである)達成できるであろう。開示したドメインの容易な組換えは、ポリダクチル蛋白質の生成のためにファージディスプレーライブラリーの開発を必要としない、規定の特異性をもつポリダクチル蛋白質の製造を可能にする。これらのポリダクチル蛋白質は、生細胞中でヒトのerbB−2プロモーターによって駆動される転写の活性化および抑圧のために用いられた。本明細書に開示したこの種類のジンクフィンガードメインは、5'−(GNN)n−3'のDNA配列類と結合する166または1700万の新規な蛋白質の構築のためにはおそらく十分である。
【0029】
ジンクフィンガーヌクレオチド結合ポリペプチド誘導体は、切端または伸長によって野性型ジンクフィンガー蛋白質から、または位置特異的変異によって野性型誘導ポリペプチドの変種として、またはそれら方法の組み合わせによっ誘導または製造できる。"切端"という用語は、天然のジンクフィンガー結合蛋白質で見出されるジンクフィンガーの完全な数より少ないジンクフィンガーを含むか、または所望しない配列を欠失させたジンクフィンガーヌクレオチド結合ポリペプチドを指す。例えば、ジンクフィンガーヌクレオチド結合蛋白質TFIIIA(これは天然には9つのジンクフィンガーを含む)の切端形は、わずかに1つから3つのジンクフィンガーをもつポリペプチドであってもよい。伸長とは、さらに別のジンクフィンガーモジュールが付加されたジンクフィンガーポリペプチドを指す。例えば、TFIIIAは3つのジンクフィンガードメインを付加することによって12のフィンガーに伸長できる。さらに、切端形のジンクフィンガーヌクレオチド結合ポリペプチドは2つ以上の野性型ポリペプチド由来のジンクフィンガーモジュールを含むことができる(したがって"ハイブリッド"ジンクフィンガーヌクレオチド結合ポリペプチドを生じる)。
【0030】
"変異させた"という用語は、前記蛋白質をコードするDNAのランダム変異または位置特異的変異を達成する既知のいずれかの方法を実施して得られたジンクフィンガー由来ヌクレオチド結合ポリペプチドを指す。例えば、TFIIIAでは、突然変異は1つまたは2つ以上のコンセンサス配列の繰り返し中で非保存的残基を置換するために実施できる。切端ジンクフィンガーヌクレオチド結合蛋白質もまた変異させることができる。
ジンクフィンガーヌクレオチド結合モチーフを含むヌクレオチド配列の機能を抑制するために、本発明にしたがって切端、伸長および/または変異させることができる既知のジンクフィンガーヌクレオチド結合ポリペプチドの例には、TFIIIAおよびzif268が含まれる。他のジンクフィンガーヌクレオチド結合蛋白質も当業者の知るところであろう。
【0031】
本発明のポリペプチドは、当技術分野で知られている種々の標準的技術を用いて製造できる(例えば以下を参照されたい:米国特許出願08/676318号(1995年1月18日出願)、この文献は参照により本明細書に含まれる)。
ジンクフィンガー蛋白質のファージディスプレーライブラリーは配列特異的蛋白質の増加に適した条件下で作製および選別した。多数の配列を認識するジンクフィンガードメインは、ファージ選別データおよび構造的情報の両方により誘導される位置特異的突然変異による精錬を必要とした。
【0032】
ネズミのCys2−His2ジンクフィンガー蛋白質Zif268をファージディスプレーライブラリーの構築に用いた(H. Wu, W.-P. Yang & C.F. Barbas III, PNAS 92:344-348(1995))。Zif268は、ジンクフィンガー蛋白質のうちで構造的にもっとも性状が調べられている(N.P. Pavletich & C.O. Pabo, Science(Washington, D.C., 1883-) 252:809-17(1991); M. Elrod-Erickson, M.A. Rould, L. Nekludova & C.O. Pabo, Structure(London) 4:1171-1180(1996); A.H. Swirnoff & J. Milbrandt, Mol. Cell. Biol. 15:2275-87(1995))。この蛋白質の3つのジンクフィンガードメインの各々におけるDNA認識は、DNAの一本鎖上の主に3つのヌクレオチドと接触するαヘリックスのN−末端残基によって仲介される。この3フィンガー蛋白質に対するオペレーター結合部位は5'−GCGTGGGCG−3'である(フィンガー−2サブサイトには下線を施した)。Zif268および他の関連するジンクフィンガーDNA複合体に関する構造研究によって、αヘリックス上の主に3つのポジション、−1、3および6の残基が特異的な塩基接触に必要とされることが示された(M. Elrod-Erickson, T.E. Benson & C.O. Pabo, Structure(London) 6:451-464(1998); C.A. Kim & J.M. Berg, Nature Structural Biology 3:940-945(1996); N.P. Pavletich & C.O. Pabo, Science(Washington, D.C., 1883-) 261:1701-7(1993); H.B. Houbaviy, A. Usheva, T. Shenk & S.K. Burley, Proc. Natl. Acad. Sci. USA, 93:13577-82(1996); L. Fairall, J.W.R. Schwabe, L. Champman, J.T. Finch & D. Rhodes, Nature(London) 366:483-7(1993); D.S. Wuttke, M.P. Foster, D.A. Case, J.M. Gottesfeld & P.E. Wright, J. Mol. Biol. 273:183-206(1997); R.T. Nolte, R.M. Conlin, S.C. Harrison & R.S. Brown, Proc. Natl. Acad. Sci. USA, 95:2938-2943(1998); V.A. Narayan, R.W. Kriwacki & J.P. Caradonna, J. Biol. Chem. 272:7801-7809(1977))。典型的には、αヘリックスのポジション−1の残基が当該フィンガーのサブサイトの3'塩基と接触し、一方、ポジション3および6はそれぞれ中央の塩基および5'塩基と接触する。
【0033】
配列内の5'−GNN−3'サブセットを認識するジンクフィンガードメイン類を選別するために、2つの高度に異なるジンクフィンガーライブラリーをファージディスプレーベクターpComb3Hで構築した(C.F. Barbas III, A.S. Kang, R.A. Lerner & S.J. Benkovic, Proc. Natl. Acad. Sci. USA, 88:7978-7982(1991); C. Rader & C.F. Barbas III, Curr. Opin. Biotechnol. 8:503-508(1997))。両ライブラリーとも、C7(Zif268の変種)のフィンガー2のαヘリックス内の残基が任意抽出されていた(H. Wu, W.-P.Yang & C.F. Barbas III, PNAS 92:344-348(1995))。ライブラリー1はNKKドーピング法を用いてポジション−1、1、2、3、5、6の任意抽出によって構築され、一方、ライブラリー2は、ポジション−2、−1、1、2、3、5、6の任意抽出によるVNSドーピング法を用いて構築された。
【0034】
NKKドーピング法は、32コドン内で全てのアミノ酸の組み合わせを可能にし、一方、VNSはその24コドンセットからTyr、Phe、Cysおよび全ての終止コドンを排除する。これらのライブラリーは、それぞれ4.4×109および3.5×109の構成メンバーから成り、各々は5'−GCGNNNGCG−3'タイプの配列を認識することができる。NKKライブラリーのサイズはそれが99%の信頼度で調査可能であることを担保したが、一方、VNSライブラリーは高度に多様性をもつがいくぶん不完全であった。これらのライブラリーは、しかしながら以前に報告されたジンクフィンガーライブラリーよりも極めて大きい(Y. Choo & A. Klug, Proc. Natl. Acad. Sci. USA, 91:11163-7(1994); H.A. Greisman & C.O. Pabo, Science(Washington, D.C.) 275:657-661(1997); E.J. Rebar & C.O. Pabo, Science(Washington, D.C., 1883-) 263:671-3(1994); A.C. Jamieson, S.-H. Kim & J.A. Wells, Biochemistry 33:5689-5695(1994); A.C. Jamieson H. Wang & S.-H. Kim, PNAS 93:12834-12839(1996); M. Isalan, A. Klug & Y. Choo, Biochemistry 37:12026-33(1998))。16の5'−GCGGNNGCG−3'ビオチン付加ヘアピンDNA標的の各々とともにジンクフィンガーディスプレーファージで、溶液結合プロトコルを用いて7ラウンドの選別を実施した。
【0035】
厳格度(ストリンジェンシー)は、競合DNAの添加により各ラウンドで増加させた。せん断ニシン精子DNAを非特異的にDNAと結合するファージを選別するために加えた。配列特異性のために厳格な選択圧力は、特異的競合物質として5'−GCGNNNGCG3'タイプのDNAを提供することによって得られた。5'−GCGGNNGCG−3'タイプの過剰DNAを添加することによって、ビオチン付加標的と比較したとき一塩基変化または二塩基変化をもつDNAとの結合に対していっそう厳格な選別を提供した。ストレプトアビジン被覆ビーズを用い、ただ1つのビオチン付加DNA標的配列と結合したファージを回収した。
いくつかの事例では、この選別方法を繰り返した。このデータは、これらのドメインは機能的にモジュール式で、互いに組み換えてナノモル以下の親和性で18塩基対配列と結合できるポリダクチル蛋白質を生成することができる。本明細書で開示するジンクフィンガードメイン類は、5'−(GNN)6−3'のDNA配列類と結合する1700万の新規な蛋白質を構築するために十分である。
【0036】
本発明は、ジンクフィンガーヌクレオチド結合ポリペプチドをコードするヌクレオチド配列を含む。本発明のジンクフィンガーヌクレオチド結合ポリペプチド(天然のポリペプチド、切端および伸長ポリペプチドを含む)をコードするDNA配列はいくつかの方法によって得ることができる。例えば、DNAは当技術分野で周知のハイブリダイゼーション工程を用いて単離できる。これらには以下が含まれる(ただしこれらに限定されない):(1)共有ヌクレオチド配列を検出するためにゲノムライブラリーまたはcDNAライブラリーとプローブをハイブリダイズさせる;(2)共通の構造特性を検出するために発現ライブラリーを抗体でスクリーニングする;(3)ポリメラーゼ連鎖反応(PCR)によって合成する。本発明のRNA配列は当技術分野で知られている方法によって得ることができる(例えば以下を参照されたい:Current Protocols in Molecular Biology Ausubel, et al. Eds., 1989)。
【0037】
本発明のジンクフィンガーヌクレオチド結合ポリペプチドをコードする特異的DNA配列の生成は以下によって得ることができる:(1)ゲノムDNAから二本鎖DNA配列を単離する;(2)問題のポリペプチドのために必要なコドンを提供するためにDNA配列を化学的に製造する;および(3)真核細胞ドナー細胞から単離したmRNAの逆転写によって二本鎖DNA配列をインビトロで合成する。後者の場合、mRNAの二本鎖DNA相補物(一般にcDNAと称される)は最後に形成される。組換え工程で使用する特異的DNA配列を生成するこれら3つの方法のうち、ゲノムDNAの単離がもっとも稀である。これは、哺乳類のポリペプチドを微生物で発現させたい場合にイントロンの存在のために特に言えることである。
【0038】
所望のポリペプチド生成物の完全なアミノ酸残基配列が知られているとき、DNA配列の合成は、ジンクフィンガー由来DNA結合ポリペプチドを得るためにしばしば選択される方法である。所望のポリペプチドの完全なアミノ酸残基配列が分からない場合、DNA配列の直接合成は不可能で、選択できる方法はcDNA配列の作製である。問題のcDNA配列を単離する標準的な方法のうち、とりわけプラスミド含有cDNAライブラリーの生成が挙げられる。前記ライブラリーは、高レベルの遺伝子発現を示すドナー細胞中に豊富なmRNAを逆転写して得られる。ポリメラーゼ連鎖反応と組み合わせて用いる場合は、稀少な発現生成物でさえもクローニングすることができる。ポリペプチドのアミノ酸配列の大部分が判明している場合には、標的cDNAにおそらく存在すると思われる配列の複製である標識一本鎖もしくは二本鎖DNAまたはRNAを生成し、DNA/DNAハイブリダイゼーション工程に用いてもよい。この工程は、変性させて一本鎖形にしたcDNAのクローン化コピーによって実施される(Jay et al., Nucleic Acid Research 11:2325(1983))。
【0039】
本発明の別の特徴では、治療的に有効な量のジンクフィンガーヌクレオチド結合ポリペプチドまたはジンクフィンガーヌクレオチド結合ポリペプチドをコードするヌクレオチド配列の治療的に有効な量を医薬的に許容できる担体とともに含む医薬組成物が提供される。
本明細書で用いられるように、"医薬的に許容できる""生理学的に耐えうる"という用語は、それらが組成物、担体、希釈剤および試薬を指す場合は、それら物質が、望ましくない生理学的影響(例えば吐き気、眠気、胸焼けなど)を前記組成物の投与を禁止しなければならない程度まで発生させることなく人に投与できることを意味し、さらに相互に使用される。
その中に溶解または分散させた活性成分を含む医薬組成物の調製は当技術分野でよく理解されている。典型的には、そのような組成物は、液体溶液または懸濁液、水性または非水性の滅菌された注射可能物として調製されるが、溶液または分散液に適した固形物も使用前に液体として調製することができる。調製物はまた乳化させてもよい。
【0040】
活性成分は、医薬的に許容でき、活性成分に適合する賦形剤とともに、さらに本明細書で述べる治療方法で使用するために適した量で混合できる。適切な賦形剤は、例えば水、食塩水、デキストロース、グリセロール、エタノールなどおよびそれらの組み合わせである。さらに、所望の場合は、組成物は微量の補助物質、例えば湿潤剤または乳化剤を、pH調節剤および活性成分に有効性を高める物などと同様に含むことができる。
本発明の治療用医薬組成物は、その中に前記成分の医薬的に許容できる塩を含むことができる。医薬的に許容できる塩には(ポリペプチドの遊離アミノ基で形成される)酸付加塩が含まれる。酸付加塩は、無機酸(例えば塩酸またはリン酸)または有機酸(例えば酢酸、酒石酸、マンデル酸など)で生成される。遊離カルボキシル基で形成される塩もまた、無機塩基(例えば水酸化ナトリウム、カリウム、アンモニウム、カルシウムまたは鉄)および有機塩基(例えばイソプロピルアミン、トリメチルアミン、2−エチルアミノエタノール、ヒスチジン、プロカインなど)から誘導できる。
【0041】
生理学的に耐えうる担体は当技術分野で周知である。液体担体の例は滅菌水溶液で、これは、活性成分および水の他には物質を含まないか、または生理的pH値の緩衝液(例えばリン酸ナトリウム)、生理学的食塩水またはその両方(例えば燐酸緩衝食塩水)を含む。さらにまた、水性担体は1種以上の緩衝塩とともに塩類(例えば塩化ナトリウムおよびカリウム)、デキストロース、プロピレングリコール、ポリエチレングリコールおよび他の溶質を含むことができる。液体組成物はまた、水とともに、または水以外の液相を含むことができる。そのような付加できる液相の例はグリセリン、植物油(例えば綿実油)、有機エステル(例えばエチルオリエート)および油水乳化物である。
【0042】
III.組成物
本発明の別の特徴では、5'−(GNN)n−3'と規定されるヌクレオチド標的モチーフと特異的に結合できるように、機能的に連結された複数のジンクフィンガーヌクレオチド結合ポリペプチドが提供される(式中nは1より大きい整数である)。好ましくはnは2から約6の整数である。
ジンクフィンガーヌクレオチド結合ポリペプチドを連結する手段は以下の実施例の他に米国特許出願08/676318号(1995年1月18日出願)に記載されている。個々のポリペプチドは好ましくはオリゴペプチドリンカーで連結される。そのようなリンカーは、好ましくは天然に存在するジンクフィンガー蛋白質に見出されるリンカーに類似する。本発明で使用される好ましいリンカーはアミノ酸残基配列TGEKP(配列番号:111)である。
【0043】
そのような組成物を製造する効率および遺伝子制御でのそれらの使用を調べるために、ヒトerbB−2遺伝子をモデルとして選択した。この遺伝子の5'非翻訳領域の18塩基対配列を特に認識するポリダクチル蛋白質を、KRAB、ERDまたはSIDリプレッサードメインと融合させて転写リプレッサーに変換した。転写アクチベーターは、単純疱疹ウイルスVP16活性化ドメイン、またはVP16の最小活性化ドメインの4量体リピート(VP64と称する)と融合させて作製した。遺伝子の抑圧および活性化の両方が、遺伝子の転写領域内のただ1つの部位を標的とするようにデザインされた蛋白質によって惹起されることが、データによって初めて示された。
【0044】
ヒトのerbB−2遺伝子が、ジンクフィンガー系転写スイッチの作製のためのモデル標的として選ばれた。ErbBレセプター類に属するものはヒトの悪性腫瘍の成長に重要な役割を果たす。特にerbB−2は、多数の部位(乳房、卵巣、肺、胃および唾液腺を含む)に生じるヒトの腺癌に高い割合で見られる遺伝子増幅および/または転写の脱調節の結果として過剰発現される(N.E. Hynes & D.F. Stern, Biochim. Biophys. Acta 1198:165-184(1994))。ErbB−2の発現増加は、その本来のチロシンキナーゼの構成的活性化をもたらし、培養細胞を形質転換させることを示した。多数の臨床的研究によって、ErbB−2発現レベルの高い腫瘍をもつ患者は予後が悪いことが示された(N.E. Hynes & D.F. Stern, Biochim. Biophys. Acta 1198:165-184(1994))。ヒトの癌における関与の他に、erbB−2は、哺乳類の成長体および胚の発生時の両方で重要な役割をもつ(N.E. Hynes & D.F. Stern, Biochim. Biophys. Acta 1198:165-184(1994; N. Altiok, J.-L. Bessereau & J.-P. Changeux, EMBO J. 14:4258-4266(1995); K.-F. Lee, H. Simon, H. Chen, B. Bates, M.-C. Hung & C. Hauser, Nature 378:394-398(1995))。
【0045】
erbB−2プロモーターは、したがって人工的転写調節因子の開発のための興味深い試験例の代表である。このプロモーターは詳細に性状が調べられ、比較的複雑でTATA依存性転写開始部位およびTATA非依存性転写開始部位の両方を含むことが示された(S. Ishii, F. Imamoto, Y. Yamanashi, K. Toyoshima & T. Yamamoto, Proc. Natl. Acad. Sci. USA, 84:4374-4378(1987))。初期の実験は、ポリダクチル蛋白質が転写を特異的に活性化または抑圧する転写調節因子として機能することを示したが、一方、これらの蛋白質は、人工プロモーターの上流で蛋白質結合部位の6つの縦並びリピートと結合した(Q. Liu, D.J. Segal, J.B. Ghiara & C.F. Barbas III, Proc. Natl. Acad. Sci. USA, 94:5525-5530(1997))。さらにまた、この実験ではその結合特異性が改造されていないポリダクチル蛋白質が利用された。ここでは、我々は、天然のerbB−2プロモーターの単一部位に結合させるために、予め規定した構築ブロックから組み立てたポリダクチル蛋白質の有効性を調べた。16の5'−GNN−3'DNAトリプレットの各々と結合するジンクフィンガードメイン類の作製と性状決定は上記で述べた。この種類の認識ドメインの生成に我々が焦点を当てた理由の1つは、ほとんどの生物のプロモーター領域ではその塩基の内容は比較的GCに富むからである。したがって、5'−(GNN)x−3'部位を認識する蛋白質が特定のジンクフィンガードメインのこのセットから容易に組み立てられるならば、多くの遺伝子が迅速かつ特異的に調節のための標的となりえるであろう。6つのジンクフィンガードメインを含み、さらに18塩基対のDNAを認識する蛋白質は、全ての既知のゲノム内のただ1つのアドレスを特定するために十分であるはずである。
erbB−2プロモーターの試験では2つの5'−(GNN)6−3'部位および1つの5'−(GNN)9−3'部位を明らかにした。これらの部位のうちの1つ(ここではe2cと特定された)はerbB−2遺伝子の5'非翻訳領域内に収まり、遺伝子特異的転写スイッチの作製のための標的部位として選択した。GenBankデータベースのBLAST配列類似性検索によって、この配列はerbB−2に固有であることが確認された。e2c標的配列の位置(2つの主要な転写開始部位の下流でその近傍にある)は、転写開始または伸長のどちらかの抑制による抑圧の試験を可能にした。e2c標的部位の興味深い特性は、ヒト、ラットおよびマウスerbB−2遺伝子間で保存されている短い配列ストレッチ内で見出されるということである(M.R.-A. White & M.-C. Hung, Oncogene 7:677-683(1992))。この部位を標的とすることによって、ヒトの疾患に適用する前に動物モデルでこの手法を調べることが可能になるであろう。
【0046】
所望のDNA結合特異性をもつポリダクチル蛋白質を作製するために、本実験は予め規定したジンクフィンガードメインの組み立てに焦点を絞った(これは、他の文献で提唱された連続的選別手法と対照的である(H.A. Greisman & C.O. Pabo, Science 275:657-661(1997))。そのような手法は、要求される各々の蛋白質のために6つのジンクフィンガーライブラリーの連続的作製と選別を必要とし、そのためにこの実験アプローチをほとんどの研究室で利用できないものにし、さらに誰にとっても甚だしく時間を食うアプローチにした。さらに、この手法ではまた別の結合配列に対する特異的な負の選別を適用することは困難であるので、最近になって報告されたように比較的特異性のない蛋白質が生じる可能性がある(J.-S. Kim & C.O. Pabo, J. Biol. Chem. 272:29795-29800(1997))。
【0047】
9塩基対DNAを認識する3フィンガー蛋白質を作製するための2つの異なる手法の普遍的有用性を調べた。各々の手法はジンクフィンガードメインのモジュール式特性を基にしており、5'−GNN−3'のトリプレットを認識するジンクフィンガードメイン類を利用する。第一の手法では、5'−(GNN)6−3'erbB−2標的部位e2cのハーフサイト(HS)1および2を、PCRアッセンブリー法を用いて予め規定したフィンガー2(F2)ドメイン変種と一緒に融合させて作製した。このアプローチの普遍性を調べるために、5'−(GNN)3−3'タイプを認識する3つのまた別の3フィンガー蛋白質を同じアプローチを用いて調製した。精製したジンクフィンガー蛋白質を、マルトース結合蛋白質(MBP)との融合物として調製した。ELISA分析によって、一連のものとして順次結合させたF2蛋白質は協調的に作用し、所望の9塩基対のDNA標的配列を特異的に認識できることが明らかになった。表示の5つの蛋白質の各々が、標的と非標的5'−(GNN)3−3'配列を識別できた。
【0048】
その標的に対する前記蛋白質の各々の親和性を電気泳動移動性シフトアッセイによって測定した。これらの実験は、ジンクフィンガーペプチドは、Zif268および他の天然の転写因子に匹敵する親和性(3から70nMの範囲のKd値)を有することを示した。
ここでZif268のそのオペレーターに対するKd値は10nMであることが見出された。説明できない理由で、1グループが天然のZif268蛋白質のKd値を6nMから10pMの範囲(600倍の変動)であると報告したことは特記する必要がある(N.P. Pavletich & C.O. Pabo, Science 252:809-17(1991); H.A. Greisman & C.O. Pabo, Science 275:657-661(1997))。ほとんどの実験ではZif268−DNA相互反応のKd値は
3から10nMと報告された(Y. Choo & A. Klug, Proc. Natl. Acad. Sci. USA, 91:11163-11167(1994); T.B. Hamilton, F. Borel & P.J. Romaniuk, Biochemistry 37:2051-2
058(1998))。したがって、ここで報告した結果を別の場所で報告された結果と比較するために、相対Kds、(変異体Kd)/(Zif268Kd)を比較するべきである(前式では両方の値が同じ報告に由来する)。本データは、ファージディスプレーを用いて調製された新規な3フィンガー蛋白質についての他の研究(この場合Zif268より10から200倍低い親和性が報告されている(H.A. Greisman & C.O. Pabo, Science 275:657-661; Y. Choo, I. Sanchez-Garcia & A. Klug, Nature 372:642-5(1994))と適切に比較できる。
【0049】
F2ドメイン変種の連続的結合に対する別の選択肢として、第二の手法では、2つのe2c5'−(GNN)3−3'ハーフサイトに特異的に3フィンガー蛋白質を"ヘリックス移植"によって製造した。ジンクフィンガードメインのフレームワーク残基(認識ヘリックスの提示を支持する残基)は、蛋白質間で変動する。
我々は、フレームワーク残基は親和性と特異性において重要な役割をもつであろうと期待した。ヘリックス移植のために、DNA認識ヘリックスのアミノ酸ポジションの−2から6をZif268に移植するか(N.P. Pavletich & C.O. Pabo, Science 252:809-17)、またはSp1Cフレームワークに移植した(J.R. Desjarlais & J.M. Berg, Proc. Natl. Acad. Sci. USA, 90:2256-60(1993))。Sp1C蛋白質は、キレート剤に対して安定性が強化されていることが示されたデザインされたコンセンサス蛋白質である。これらの蛋白質は迅速なPCRによる遺伝子アッセンブリー手法によって調製されたDNA鋳型から発現された。各々の事例で、MBP融合蛋白質のELISA分析は、F2フレームワーク構築物を用いて観察されたDNA結合特異性および親和性は保持されていることを示した。
【0050】
上記で考察したように、9塩基対のDNA配列の認識は複雑なゲノム内の固有の部位を特定するためには十分ではない。対照的に、連続した18塩基対DNA配列を認識する6フィンガー蛋白質はヒトのゲノム内のただ1つの部位を特定でき、したがって遺伝子特異的転写スイッチの作製のための重要な前提条件を満たす。3フィンガー構築物から、erbB−2標的配列e2cと結合する6フィンガー蛋白質を単純な制限酵素消化並びにF2、Zif268およびSp1Cフレームワークの鋳型DNAとともにクローニングすることによって作製した。精製MBP融合蛋白質のELISA分析は、6フィンガー蛋白質の各々が特異的な標的配列を認識することができ、非標的5'−(GNN)6−3'部位またはZif268標的部位の縦並びリピートに対する酵素反応性はほとんどないことを示した。
【0051】
e2cDNA標的部位に対する各蛋白質の親和性はゲルシフト分析によって決定した。F2フレームワークから構築されたE2C(F2)6フィンガー蛋白質で中等度のKd値(25nM)が観察された。この値はその構成成分である3フィンガー蛋白質よりもわずかに2から3倍良好である。6フィンガー蛋白質に関する我々の以前の実験では、それらの3フィンガー構成成分と比較したとき6フィンガー蛋白質のDNAリガンドに対して約70倍強い親和性が観察された(Q. Liu, D.J. Segal, J.B. Ghiara & C.F. Barbas III, Proc. Natl. Acad. Sci. USA, 94:5525-5530(1997))。E2C(F2)ペプチドの親和性で実質的な増加が見られないということは、F2ドメインの連続的結合は最適ではないことを示唆している。
【0052】
6フィンガー蛋白質のF2ドメインの周期性はこの伸長配列のDNAの周期性と適合しておらず、この蛋白質の結合エネルギーの相当部分がDNAを解くために費やされている可能性がある(Y. Shi & J.M. Berg, Biochemistry 35:3845-8(1996))。F2ドメイン蛋白質とは対照的に、E2C(Zif)およびE2C(Sp1)6フィンガー蛋白質は、それらの本来の3フィンガー蛋白質構成成分と比較したとき40から70倍の親和性増加を示した(Kd値はそれぞれ1.6nMおよび0.5nM)。際立ったことには、どちらのハーフサイトの変異も親和性のほぼ100倍の低下をもたらしたので、これら蛋白質の両3フィンガー成分が結合に必要とされるということであった。既知の転写因子の多くはナノモルの親和性でそれらの特異的DNAリガンドと結合し、このことは、遺伝子発現の制御は普通の寿命をもつ蛋白質/DNA複合体によって支配されていることを示唆している。したがって、親和性の増加したジンクフィンガー蛋白質が要求される必要はなく、特に非特異的結合も増加するという場合には不利であろう。
【0053】
一般に、ジンクフィンガードメインは性質としてモジュール式で、各フィンガーは3塩基対のサブサイトを認識する(N.P. Pavletich & C.O. Pabo, Science 252:809-17(1991))。このことは、ジンクフィンガードメインを所望のいずれの配列にも組み換えて、5'−(GNN)x−3'なる構造をもつ伸長された配列を認識するポリダクチル蛋白質を得ることができる我々の能力によって支持される。しかしながら、少なくともいくつかの事例では、ジンクフィンガードメインは個々の3塩基対部位ではなくオーバーラップした4塩基対を特定するらしいということは特記されるべきである。Zif268では、ヘリックスポジション−1、3および6で見出されるものの他にさらに残基がDNA接触に含まれる(M. Elrod-Erickson, M.A. Rould, L. Nekludova & C.O. Pabo, Structure 4:1171-1180(1996))。特に、F2のヘリックスポジション2のアスパルテートは認識にいくつかの役割を果たし、多様な接触をもたらす。アスパルテート側鎖のカルボキシレートはポジション−1のアルギニンと水素結合し、その標的部位の3'グアニンとの相互作用を安定化させる。このアスパルテートはまた、グアニンの相補性シトシンとの水仲介接触に参画する。さらに、このカルボキシレートは、フィンガー1の結合部位の5'グアニン塩基の対抗する鎖上のシトシン塩基のN4と直接接触する。標的部位のオーバーラップのための化学的基礎となるのはこの相互作用である。実際、Zif268F2ライブラリーが4種の5'−GCGGNGGCG−3'配列に対して選択されたとき、ポジション−1のアルギニンおよびポジション2のアスパルテートの両方が得られ、天然のZif268の残基と同様であった。e2c標的配列(5'−GGGGCCGGAGCCGCAGTG−3')(配列番号:112)はその後にGではなくAが続くので、潜在的な標的部位オーバーラップ問題は、e2c特異的6フィンガー蛋白質のフィンガー1で予想された。しかしながら、ZifフレームワークおよびSp1Cフレームワーク6フィンガー蛋白質の両方で、ポジション2にアスパルテートを含むGTG特異的フィンガー1は、5'−GTGA−3'および5'−GTGG−3'の配列を等しく良好に認識するようである。これは、標的部位e2c−aおよびe2c−gに対するそれらの類似する親和性によって示される。
【0054】
上記で説明したように本発明のポリヌクレオチドまたは組成物は、1つまたは2つ以上の転写調節因子と機能的に連結されていてもよい。調節因子、例えば転写アクチベーターまたは転写サプレッサーまたはリプレッサーは当技術分野で周知である。そのような因子にポリペプチドを機能的に連結する手段もまた当技術分野で周知である。遺伝子発現を調節するために典型的で好ましいそのような因子およびそれらの使用は下記で詳細に考察する。
【0055】
II.使用
実施態様の1つでは、本発明の方法は、ジンクフィンガーヌクレオチド結合モチーフを含むヌクレオチド配列の機能を調節(抑制または抑圧)する工程を含み、これは、ジンクフィンガーヌクレオチド結合モチーフを前記モチーフと結合するジンクフィンガーヌクレオチド結合ポリペプチドの有効量と接触させることを含む。ヌクレオチド配列がプロモーターである場合は、本方法は、ジンクフィンガーヌクレオチド結合モチーフを含むプロモーターの転写トランスアクチベーションの抑制を含む。"抑制"という用語は、プロモーターに機能的に連結された構造遺伝子の転写の活性化レベルの抑圧を意味する(前記プロモーターは例えばジンクフィンガーヌクレオチド結合モチーフを含む)。さらに、ジンクフィンガーヌクレオチド結合ポリペプチド誘導体は、構造遺伝子内またはRNA配列内のモチーフと結合してもよい。
【0056】
"有効量"という用語は、先に活性化されたプロモーターの脱活性化をもたらす量、またはジンクフィンガーヌクレオチド結合モチーフを含むプロモーターの不活化をもたらす量、または構造遺伝子の転写またはRNAの翻訳を遮断する量を含む。必要とされるジンクフィンガー由来ヌクレオチド結合ポリペプチドの量は、現在存在する蛋白質/プロモーター複合体中で天然のジンクフィンガーヌクレオチド結合蛋白質にとって代わるために必要な量、または天然のジンクフィンガーヌクレオチド結合蛋白質と競合してプロモーター自体と複合体を形成するために必要な量である。同様に、構造遺伝子またはRNAを遮断するために必要な量は、それぞれ、RNAポリメラーゼと結合してこれを遺伝子の読み取りから遮断する量、または翻訳を抑制する量である。好ましくは本方法は細胞内で実施される。プロモーターまたは構造遺伝子を機能的に不活化させることによって転写または翻訳は抑圧される。ジンクフィンガーヌクレオチド結合蛋白質モチーフを含む細胞性ヌクレオチド配列と結合または"接触"させるために有効量の抑制蛋白質の輸送は、本明細書に記載した機構の1つによって達成できる。これらは、例えばレトロウイルスベクターまたはリポソームによるもの、または当技術分野で周知の他の方法である。
【0057】
"調節"という用語は、機能の抑圧、強化または誘発を指す。例えば、本発明のジンクフィンガーヌクレオチド結合ポリペプチドは、プロモーター内のモチーフと結合し、それによってプロモーターヌクレオチド配列と機能的に連結された遺伝子の転写を強化または抑圧することによってプロモーター配列を調節することができる。また別には、調節は遺伝子の転写の抑制を含むことができる。この場合、ジンクフィンガーヌクレオチド結合ポリペプチドは構造遺伝子と結合し、DNA依存RNAポリメラーゼを遺伝子読み取りから遮断し、したがって遺伝子の転写を抑制する。構造遺伝子は、例えば正常な細胞遺伝子またはオンコジーンである。また別には、調節は転写物の翻訳の抑制を含むことができる。
【0058】
遺伝子のプロモーター領域は、典型的には構造遺伝子に対して5'側に存在する調節エレメントを含む。遺伝子が活性化される場合は、転写因子として知られる蛋白質がこの遺伝子のプロモーター領域に結合する。このアッセンブリーは、酵素がDNAからRNAへと第二の遺伝子セグメントを転写することを可能にすることによって"スイッチが入る"ことと類似する。ほとんどの場合、生じたRNA分子は特異的蛋白質の合成のための鋳型として機能し、時にはRNAそれ自体が最終生成物である。
プロモーター領域は正常な細胞性プロモーターでも、または例えばオンコプロモーターでもよい。オンコプロモーターは一般にウイルス由来プロモーターである。例えば、レトロウイルスのロングターミナルリピート(LTR)は、本発明のジンクフィンガー結合ポリペプチド変種の標的となることができるプロモーターである。レンチウイルス群の構成メンバー由来のプロモーターは、本発明のジンクフィンガー結合ポリペプチドによる転写調節のための標的とすることができるウイルスプロモーター領域の例である(レンチウイルス群は、ヒトのT細胞リンパ栄養性ウイルス(HTLV)1型および2型、またはヒト免疫不全ウイルス(HLV)1型または2型のような病原体を含む)。
【0059】
ジンクフィンガー蛋白質を遺伝子特異的転写調節因子として使用するという概念を調べるために、E2C(Sp1)6フィンガー蛋白質を多数のエフェクタードメインと融合させた。転写リプレッサーは、3つのヒト由来リプレッサードメインをジンクフィンガー蛋白質に結合させて作製した。第一のリプレッサー蛋白質はERFリプレッサードメイン(ERD)(ets2リプレッサー因子(ERF)のアミノ酸473から530と規定される)を用いて調製した(D.N. Sgouras, M.A. Athanasiou, G.J. Beal, Jr., R.J. Fisher, D.G. Blair & G.J. Mavrothalassitis, EMBO J. 14:4781-4793(1995))。このドメインは、ets類の転写因子の活性に対するERFの拮抗作用を仲介する。合成リプレッサーは、このドメインをジンクフィンガー蛋白質のC−末端に融合させて構築した。
【0060】
第二のリプレッサー蛋白質は、クリュッペル付随ボックス(Kruppel-associated box, KRAB)ドメインを用いて調製した(J.F. Margolin, J.R. Friedman, W.K.-H., Meyer, H. Vissing, H.-J.Thiesen & F.J. Rauscher III, Proc. Natl. Acad. Sci. USA, 91:4509-4513(1994))。このリプレッサードメインは、ジンクフィンガー蛋白質のN−末端に一般的に見出され、おそらく距離と方向性に依存しない態様で(G. Pengue & L. Lania, Proc. Natl. Acad. Sci. USA, 93:1015-1020(1996))、RINGフィンガー蛋白質KAP−1と相互作用することによってTATA依存転写に対するその抑圧活性を示す(J.R. Friedman, W.J. Fredericks, D.E. Jensen, D.W. Speicher, X.-P. Huang, E.G. Neilson & F.J. Rauscher III, Genes & Dev. 10:2067-2078(1996))。我々は、ジンクフィンガー蛋白質KOX1のアミノ酸1から97の間に見出されるKRABドメインを利用した(J.F. Margolin, J.R. Friedman, W.K.-H. Meyer, H. Vissing, H.-J.Thiesen & F.J. Rauscher III, Proc. Natl. Acad. Sci. USA, 91:4509-4513(1994) )。この事例では、6フィンガー蛋白質とのN−末端融合を実施した。
【0061】
最後に抑圧のためのヒストン脱アセチル化の有用性を調べるために、MadmSIN3相互反応ドメイン(SID)のアミノ酸1から36をジンクフィンガー蛋白質のN−末端に融合させた(D.E. Ayer, C.D. Laherty, Q.A. Lawrence, A.P. Armstrong & R.N. Eisenman, Mol. Cell. Biol. 16:5772-5781(1996))。この小ドメインは転写因子MadのN−末端に見出され、mSIN3(これは順次コリプレッサーN−CoRと相互反応する)およびヒストンデアセチラーゼmRPD1と相互作用することによってその転写抑圧の仲介に必要である(T. Heinzel, R.M. Lavinsky, T.-M. Mullen, M. Ssderstrsm, C.D. Laherty, J. Torchia, W.-M. Yang, G. Brard, S.D. Ngo & al., e. Nature 387:43-46(1997))。遺伝子特異的活性化を調べるために、転写アクチベーターを、単純疱疹ウイルスのVP16蛋白質のアミノ酸413から489にジンクフィンガー蛋白質を融合させるか(I. Sadowski, J. Ma, S. Triezenberg & M. Ptashne, Nature 335:563-564(1988))、またはVP16の最小活性化ドメイン(DALDDFDLDML(配列番号:113))の人工四量体リピート(VP64と称する)を融合させて作製した(K. Seipel, O. Georgiev & W. Schaffner, EMBO J. 11:4961-4968(1992))。
【0062】
ルシフェラーゼレポーター遺伝子と結合したerbB−2プロモーターのフラグメントを含むレポーター構築物を作製し、我々のデザインした転写調節因子の特異的活性を調べた。ターゲットレポータープラスミドはATG開始コドンに対してヌクレオチド−758から−1を含み、一方、コントロールレポータープラスミドはヌクレオチド−1571から−24を含み、したがって−24位から−7位に包含されているE2C結合部位の1つのヌクレオチドを除いて全てを欠いていた。両方のプロモーターフラグメントは、HeLa細胞に一過性にトランスフェクトされたとき類似の活性を示し、以前の報告と一致した(L.G. Hudson, A.P. Ertl & G.N. Gill, J. Biol. Chem. 265:4389-4393(1990))。ジンクフィンガーリプレッサードメイン融合構築物のerbB−2プロモーター活性に対する影響を検査するために、ジンクフィンガー発現ベクターおよびルシフェラーゼレポーター構築物の各々をHeLa細胞に一過性に同時にトランスフェクトした(図5A)。
【0063】
各構築物で顕著な抑圧が観察された。ERDおよびSID融合蛋白質はそれぞれ約50%および80%の抑圧をもたらした。もっとも強力なリプレッサーはKRAB融合蛋白質であった。この蛋白質はerbB−2プロモーター活性を完全に抑圧した。観察された残留活性は、プロモーターのないpGL3レポーターのバックグラウンドレベルであった。対照的に、いずれの蛋白質もE2C標的部位を欠くコントロールのerbB−2レポーター構築物は顕著には抑圧せず、抑圧は、実際にその標的部位へのE2C(Sp1)蛋白質の特異的結合によって仲介されることを示した。エフェクタードメインを全く欠いているジンクフィンガー蛋白質の発現は弱い抑圧(約30%)をもたらし、SIDおよびKRAB構築物で観察される抑圧のほとんどは、DNA結合のみによるというよりはそれらのエフェクタードメインによって引き起こされることを示している。この観察は、抑圧メカニズムは、伸長の抑制というよりはむしろ転写開始の能動的抑制であることを強く示している。RNAポリメラーゼIIによる転写開始がいったん開始したら、ジンクフィンガー蛋白質はポリメラーゼの作用によってDNAから容易に追い出されるようである。
【0064】
転写の活性化を仲介するための遺伝子特異的ポリダクチル蛋白質の有用性を、同じ2つのレポーター構築物を用いて調べた。VP16融合蛋白質は転写を約5倍刺激することが判明したが、一方、VP64融合蛋白質は27倍の活性化をもたらした。ただ1つのVP16を主体とする転写アクチベーターによって惹起されるプロモーター活性のこの劇的な刺激は、ジンクフィンガー蛋白質は遺伝子の転写領域に結合するという事実から見れば例外的である。このことはまた、ジンクフィンガー蛋白質のRNAポリメラーゼIIの通り道との単なる結合(たとえナノモル以下の親和性をもつものとの結合であっても)は、遺伝子発現に負の作用を必ずしも与えるとは限らないことを示している。
【0065】
本明細書に提示したデータは、新規な9および18塩基対DNA標的部位と結合することができるジンクフィンガー蛋白質は、5'−GNN−3'部位を認識する予め規定したドメインを用いて容易に調製できることを示している。この情報は、各々が18塩基対のDNA配列と結合できる166または1700万の新規な6フィンガー蛋白質を調製するために十分である。新規なジンクフィンガー蛋白質を構築するこの迅速な方法は、他の研究者によって提唱されたジンクフィンガードメインの連続的生成および選別(H.A. Greisman & C.O. Pabo, Science 275:657-661(1997))に較べて利点を有し、さらに、上記に特定したような標的オーバーラップの問題についての可能性を5'−GNN−3'部位を標的とする蛋白質では回避できるであろうということを示唆する構造的情報を利用するものである。複雑でよく研究されたerbB−2プロモーターおよびヒトの生細胞を用いたとき、得られたデータは、適切なエフェクタードメインを提供されたときこれらの蛋白質は発現を喚起または活性化され、さらにこれらの実験でバックグラウンドのレベルまで等級を有する抑圧レベルをもたらすことができることを示した。
【0066】
これらの実験は、KRABドメインはERDまたはSIDドメインよりも転写リプレッサーとして極めて強力で、このプロモーターのTATA非依存性およびTATA依存性転写開始の両方を抑制できることを示唆している。これらのリプレッサードメインは以前には直接比較されたことはなかった。エフェクタードメインに結合したポリダクチル蛋白質を構築するために、予め規定したジンクフィンガードメインを用いる本手法は、転写複合体に含まれる蛋白質と競合または干渉することによって転写を抑制するだけのこれまでの手法よりも顕著な利点を有する(J.-S. Kim & C.O. Pabo, J. Biol. Chem. 272:29795-29800(1997); J.-S. Kim, J. Kim, K.L. Cepek, P.A. Sharp & C.O. Pabo, Proc. Natl. Acad. Sci. USA, 94:3616-3620(1997))。ある距離を越えて作用する能力をもつエフェクタードメインの利用は、性状が不明の遺伝子およびプロモーターの調節のためにこれら遺伝子スイッチを利用することを可能にするであろう。これらの転写調節因子は我々の高効率のPCRアッセンブリー手法を用いて調製できるので、それらの実用的有用性についてコメントすることは適切であると我々は考える。
【0067】
このようにして作製された新規なDNA結合蛋白質は、DNAを主体とした診断で潜在的な有用性をもつであろう。遺伝子機能の研究の場合には、遺伝子転写の活性化および抑圧の両方におけるその能力によって(必要な場合にはレベルの等級を指定できる)、遺伝子機能の割り振りを補助することができる。これらの蛋白質はトランスで作用することによってその制御を発揮するので、機能的遺伝子ノックアウトまたは活性化をヘテロ接合体の遺伝子導入動物で発生させることができるかもしれない。これは、動物の完全体で遺伝子ノックアウトを発生させるために必要な時間を劇的に減少させ、さらにノックアウト技術を応用できる生物の範囲を拡大させるであろう。これらの蛋白質はまた、ウイルスの遺伝子生成物の産生を抑制し、または疾患との戦いに必要な遺伝子を活性化するために、遺伝子治療に用いることができるであろう。目ざましいことには、これらの蛋白質の調製の容易さは、上記の提案の研究者集団による試験を促進するであろう。
以下の実施例は本発明の好ましい実施態様を詳述するもので、その内容または請求の範囲をどのような態様においても限定するものではない。
【0068】
実施例
実施例1:ファージディスプレーによる選別
PCRオーバーラップ伸長によるジンクフィンガーライブラリーの構築は本質的には以前に報告されたとおりであった(Y. Shi & J.M. Berg, Biochemistry 35:3845-8(1996))。ファージの増殖および沈澱は以前に記載されたとおりであったが(G. Pengue & L. Lania, Proc. Natl. Acad. Sci. USA, 93:1015-1020(1996);J.R. Friedman, W.J. Fredericks, D.E. Jensen, D.W. Speicher, X.-P. Huang, E.G. Neilson & F.J. Rauscher, Genes & Dev. 10:2067-2078(1996))、ただしER2537細胞(New England Biolabs)を用いてファージを増殖させ、90μMのZnCl2 を増殖培地に添加した。沈澱させたファージを亜鉛緩衝液A(ZBA;10mMトリス、pH7.5/90mMのKCl、1mMのMgCl2、90μMのZnCl2 )/1%BSA/5mMのDTT中に再懸濁させた。
結合反応物(500μl:ZBA/5mMのDTT/1%ブロット(BioRad)/競合オリゴヌクレオチド/4μgのせん断ニシン精子DNA(Sigma)/100μlのろ過ファージ(約1013コロニー形成単位))を、72nMのビオチン付加ヘアピン標的オリゴヌクレオチドを添加する前に室温で30分保温した。保温は定常的に穏やかに攪拌しながら3.5時間継続させた。ストレプトアビジン被覆磁性ビーズ(50μl;Dynal)を2回500μlのZBA/1%BSAで洗浄し、続いて500μlのZBA/5%ブロット/抗体表示(無関係)ファージ(約1012コロニー形成単位)で約4時間室温で封鎖した。結合時間の終わりに、封鎖溶液を結合反応物と置き換え、さらに室温で1時間保温した。500μlのZBA/5mMのDTT/2%トゥイーン20を用いて1時間かけて10回、続いてトゥイーン20を含まないもので1回前記ビーズを洗浄した。結合ファージを10μg/μlのトリプシンで30分溶出させた。
【0069】
ヘアピン標的オリゴヌクレオチドは以下の配列を有していた:5'−ビオチン−GGACGCN'N'N'CGCGGGTTTTCCCGCGNNNGCGTCC−3'(配列番号:114)、式中NNNは3ヌクレオチドフィンガー2−標的配列でN'N'N'はその相補物である。ビオチンが付加されていない同じオリゴヌクレオチド(この場合、その標的配列はTGG(TGGの相補物))は毎回の選別で7.2nM含まれ、夾雑する親ファージを選択除去した。以下の非ビオチン付加オリゴヌクレオチドの2つのプールもまた競合物質として用いた:1方は全ての可能な64の3ヌクレオチド標的配列(NNNの相補物)を含み、他方は目下の選別標的(GNNの相補物)を除く全てのGNN標的配列を含む。これらのプールは典型的には以下のように用いた:1回目、NNN相補物またはGNNの相補物無し;2回目、7.2nMのGNNの相補物;3回目、10.8nMのGNN相補物;4回目、1.8μMのNNN相補物、25nMのGNN相補物;5回目、2.7μMのNNN相補物、90nMのGNN相補物;6回目、2.7μMのNNN相補物、250nMのGNN相補物;7回目、3.6μMのNNN相補物、250nMのGNN相補物。
【0070】
実施例2:マルチ標的特異性アッセイ
ジンクフィンガーコード配列を含むpComb3H

ファージミドRFDNAのフラグメントを改造pMAL−c2(New England Biolabs)細菌発現ベクターでサブクローニングし、XL1−ブルー(Stratagene)を形質転換した。
過剰発現したマルトース結合蛋白質−ジンクフィンガー融合蛋白質を含む凍結/融解抽出物をIPTG誘発培養から蛋白質融合精製系(New England Biolabs)を用いて調製した。
96穴(ウェル)のELISAプレートで0.2μgのストレプトアビジン(Pierce)を各ウェルに37℃で1時間適用し、続いて水で2回洗浄した。ビオチン付加標的オリゴヌクレオチド(0.025μg)を同様に適用した。ZBA/3%BSAを封鎖に用いたが、ウェルは保温のあと洗浄しなかった。その後の全ての保温は室温で実施した。2倍段階希釈した8つの抽出物を1×結合緩衝液(ZBA/1&BSA/5MmのDTT/0.12μg/μlのせん断ニシン精子DNA)中に適用した。サンプルを1時間保温し、続いて水で10回洗浄した。ZBA/1%BSA中のマウスの抗マルトース結合蛋白質mAb(Sigma)をウェルに30分適用し、続いて水で10回洗浄した。アルカリホスファターゼと共役させたヤギ抗マウスIgGmAb(Sigma)をウェルに30分適用し、続いて水で10回洗浄した。アルカリホスファターゼ基質(Sigma)を適用し、OD405をSOFTmax2.35(Molecular Devices)で定量した。
【0071】
実施例3:ゲル移動度シフトアッセイ
蛋白質融合および精製系(New England Biolabs)を用い融合蛋白質を>90%の均質性に精製したが、ただしカラム緩衝液としてZBA/5mMのDTTを用いた。蛋白質の精製および濃度は、BSA標準物との比較によりクマシーブルー染色15%SDS−PAGEで決定した。標的オリゴヌクレオチドはその5'または3'末端を〔32P〕で標識し、ゲルで精製した。11の3倍段階希釈蛋白質を20μlの結合反応物(1×結合緩衝液/10%グリセロール/約1pM標的オリゴヌクレオチド)中で3時間室温で保温し、続いて0.5×TBE緩衝液中の5%ポリアクリルアミドゲルで解析した。乾燥ゲルの定量は、ホスファイメージャー(PhosphorImager)およびイメージクォント(ImageQuant)ソフトウェア(Molecular Dynamics)を用いて実施し、KDはスキャッチャード分析によって決定した。
【0072】
実施例4:所望のDNA結合特異性をもつポリダクチル蛋白質の作製
ここで報告する実験はフィンガー2(F2)変種pmGAC、pmGAG、pmGCA、pGCC、pmGGA、pmGGC、pmGGGおよびpGTG(付属のマニュスクリプトで規定)を用いる(L.G. Hudson, A.P. Ertl & G.N. Gill, J. Biol. Chem. 265:4389-4393(1990))。3フィンガー蛋白質をコードするDNAを作製するために、F2コード領域は、選別F2変種またはデザインしたF2変種からPCR増幅させ、PCRオーバーラップ伸長によって組み立てた。また別には、Zif268またはSp1Cフレームワークをもつ3フィンガー蛋白質をコードするDNAをそれぞれ8または6オーバーラップオリゴヌクレオチドから合成した。Sp1Cフレームワーク構築物(本明細書に記載した全てのレポーターアッセイで使用)は以下のようにして作製された。E2CHS1(Sp1)の場合には、各々0.4ピコモルのオリゴヌクレオチドSPE2−3(5'−GCGAGCAAGGTCGCGGCAGTCACTAAAAGATTTGCCGCACTCTGGGCATTTATACGGTTTTTCACC−3')(配列番号:115)およびSPE2−4(5'−GTGACTGCCGCGACCTTGCTCGCCATCAACGCACTCATACTGGCGAGAAGCCATACAAATGTCCAGAATGTGGC−3')(配列番号:116)を、各々40ピコモルのオリゴヌクレオチドSPE2−2(5'−GGTAAGTCCTTCTCTCAGAGCTCTCACCTGGTGCGCCACCAGCGTACCCACACGGGTGAAAAACCGTATAAATGCCCAGAG−3')(配列番号:117)およびSPE2−5(5'−ACGCACCAGCTTGTCAGAGCGGCTGAAAGACTTGCCACATTCTGGACATTTGTATGGC−3')(配列番号:118)と標準PCR混合物中で混合し、25サイクルを実施した(94℃で30秒、60℃で30秒、72℃で30秒)。続いてこの予備アッセンブリー反応の部分標本を各々40ピコモルの以下のプライマーにより同じサイクル条件で増幅させた:SPE2−1(5'−GAGGAGGAGGAGGTGGCCCAGGCGGCCCTCGAGCCCGGGGAGAAGCCCTATGCTTGTCCGGAATGTGGTAAGTCCTTCTCTCAGAGC−3')(配列番号:119)およびSPE2−6(5'−GAGGAGGAGGAGCTGGCCGGCCTGGCCACTAGTTTTTTTACCGGTGTGAGTACGTTGGTGACGCACCAGCTTGTCAGAGCG−3')(配列番号:120)。E2C−HS2(Sp1)DNAは、同様なオリゴヌクレオチドセット(ただし認識ヘリックスコード領域は異なる)を用い同じ方法で作製した。組み立てた3フィンガーコード領域の全てを制限エンドヌクレアーゼSfi1で消化し、pMal−CSS(細菌発現ベクターpMal−C2の誘導物)(New England Biolabs)でクローニングした。各々異なるフレームワークをもつ6フィンガー蛋白質をコードするDNAは、3フィンガーコード領域のフランキング配列に含まれるXma1およびBsrF1を用いpMal−CSS中で組み立てた。ジンクフィンガー蛋白質の各々は大腸菌株XL1−ブルーで発現させ、結合特性は、付属マニュスクリプト(L.G. Hudson, A.P. Ertl & G.N. Gill, J. Biol. Chem. 265:4389-4393(1990))に記載したようにELISAおよびゲルシフトアッセイによって調べた。
【0073】
実施例5:ジンクフィンガー−エフェクタードメイン融合蛋白質の構築
ジンクフィンガーエフェクタードメイン融合蛋白質の構築のために、ersリプレッサー因子(ERF)リプレッサードメイン(ERD)(D.N. Sgouras, M.A. Athanasiou, G.J. Beal, Jr., R.J. Fisher, D.G. Blair & G.J. Mavrothalassitis, EMBO J. 14:4781-4793(1995))のアミノ酸473から530をコードするDNA、KOX1のKRABドメイン(J.F. Margolin, J.R. Friedman, W.K.-H. Meyer, H. Vissing, H.-J. Thiesen & F.J. Rauscher III, Proc. Natl. Acad. Sci. USA, 914509-4513(1994))のアミノ酸1から97をコードするDNA、またはMadmSIN3相互反応ドメイン(SID)(D.E. Ayer, C.D. Laherty, Q.A. Lawrence, A.P. Armstrong & R.N. Eisenman, Mol. Cell. Biol. 16:5772-5781(1996))のアミノ酸1から36をコードするDNAをオーバーラップオリゴヌクレオチドからTaqDNAポリメラーゼを用いて組み立てた。VP16転写活性化ドメイン(I. Sadowski, J. Ma, S. Triezenberg & M. Ptashne, Nature 335:563-564(1988))のアミノ酸413から489のためのコード領域はpcDNA3/C7−C7−VP16(10)からPCR増幅させた。VP64DNA(VP16の最小活性化ドメインの4量体リピートをコードし、アミノ酸437から447を含む)は2つの相補性オリゴヌクレオチド対から作製した。得られたフラグメントをジンクフィンガーコード領域と標準的クローニング手法によって融合させ、各々得られた構築物が内部SV40核局在シグナルをC−末端HA10ペプチドタグを含むようにした。
【0074】
実施例6:ルシフェラーゼレポータープラスミドの構築
ATG開始コドンに対して、ヌクレオチド−758から−1を含むerbB−2プロモーターフラグメントを、タックエクスパンド(TaqExpand)DNAポリメラーゼミックス(Boehringer Mannheim)を用いてヒトの骨髄ゲノムDNAから増幅し、pGL3ベーシック(Promega)のホタルのルシフェラーゼ遺伝子の上流でクローニングした。ヒトのerbB−2プロモーターフラグメント(ヌクレオチド−1571から−24を包含する)をpSVOALΔ5'/erbB−2(N−N)(L.G. Hudson, A.P. Ertl & G.N. Gill, J. Biol. Chem. 265:4389-4393(1990))からHind3消化によって切り出し、pGL3ベーシック(Promega)のホタルルシフェラーゼ遺伝子の上流でサブクローニングした。
【0075】
実施例7:ルシフェラーゼアッセイ
全てのトランスフェクションのために、HeLa細胞を40−60%の細胞集合度(コンフルエンシー)で用いた。典型的には、400ngのレポータープラスミド(pGL3−プロモーター構築物またはネガティブコントロールとしてpGL3ベーシック)、50ngのエフェクタープラスミド(pcDNA3、またはネガティブコントロールとしてエンプティーpcDNA3中のジンクフィンガー構築物)、および200ngの内部標準プラスミド(phrAct−βGal)を、リポフェクタミン試薬(Gibco BRL)を用い6ウェルディッシュの1ウェル中の細胞にトランスフェクトした。細胞抽出物はトランスフェクション後48時間で調製した。ルシフェラーゼ活性はルシフェラーゼ試薬(Promega)で、βGal活性はガラクト−ライト(Galacto-Light, Tropix)でマイクロルーマット(MicroLumat)LB96Pルミノメーター(EG&G Berthold)で測定した。ルシフェラーゼ活性はβGal活性を基準に標準化した。
【0076】
実施例8:HeLa細胞でのerbB−2遺伝子の調節
erbB−2遺伝子は強制的調節のための標的とした。この遺伝子はしばしばヒトの癌(特に乳癌および卵巣癌)で過剰発現され、ErbB−2遺伝子の上昇は予後の悪さと相関している(N.E. Hynes & D.F. Stern, Biochim. Biophys. Acta 1198:165(1994))。天然のerbB−2遺伝子を調節するために、合成リプレッサー蛋白質(E2C−KRABと称する)およびトランスアクチベーター蛋白質(E2C−VP64と称する)を利用した(R.P. Beerli, D.J. Segal, B. Creier, C.F. Barbas, III, Proc. Natl. Acad. Sci. USA, 95:14628(1998))。
両蛋白質は同じデザインのジンクフィンガー蛋白質E2Cを含み、これはプロトオンコジーンerbB−2の5'−非翻訳領域内の18塩基対のDNA配列、5'−GGGGCCGGAGCCGCAGTG−3'(配列番号:121)を認識する。このDNA結合蛋白質は、6つの予め規定したモジュール形式ジンクフィンガードメインから構築された(D.J. Segal, R.P. Beerli, C.F. Barbas, III, Proc. Natl. Acad. Sci. USA, 96:14628(1999))。リプレッサー蛋白質はKox−1KRABドメインを含み(J.F. Margolin et al., Proc. Natl. Acad. Sci. USA, 91:4509(1994))、一方、トランスアクチベーターVP64は、単純疱疹ウイルス蛋白質VP16に由来する最小活性化ドメインの4量体リピートを含む(K. Seipel, O. Georgiev, W. Schaffner, EMBO J. 11:4691(1992))。
【0077】
ヒト子宮頸癌細胞株HeLaの派生株、HeLa/tet−offを用いた(M. Gossen & H. Bujard, Proc. Natl. Acad. Sci. USA, 89:5547(1992))。HeLa細胞は上皮起源であるので、ErbB−2を発現し、erbB−2遺伝子を標的とする実験に非常に適している。HeLa/tet−off細胞は、テトラサイクリンを制御するトランスアクチベーターを産生し、増殖培養液からテトラサイクリンまたはその誘導体ドキシサイクリン(Dox)を除去することによって、テトラサイクリンレスポンスエレメント(TRE)の制御下で、問題の遺伝子の導入を可能にする。我々はこの系を用いて我々の転写因子を化学的制御の下で挿入した。したがって、pRevTRE/E2C−SKDおよびpRevTRE/E2C−VP64プラスミドを構築し(E2C(Sp1)−KRABおよびE2C(Sp1)−VP64コード領域は、pcDNA3系発現プラスミドからPCR増幅させ(R.R. Beerli, D.J. Segal, B. Creier, C.F. Barbas, III, Proc. Natl. Acad. Sci. USA, 95:14628(1998))、さらにBamH1およびCla1制限部位を用いpRevTRE(Clontech)でサブクローニングし、BamH1およびNot1制限部位を用いてpMX−IRES−GFPでサブクローニングし(X. Liu et al., Proc. Natl. Acad. Sci. USA, 94:10669(1997))、PCR増幅の忠実性は配列決定によって確認した)、HeLa/tet−off細胞にトランスフェクトし、20の安定クローンを各々単離し、Dox依存標的遺伝子調節について分析した(pRevTRE/E2C−KRABおよびpRevTRE/E2C−VP64構築物はHeLa/tet−off細胞株(M. Gossen & H. Bujard, Proc. Natl. Acad. Sci. USA, 89:5547(1992))にリポフェクタミンプラス(Lipofectamine Plus)試薬(Gibco BRL)を用いてトランスフェクトし、2μg/mlのDoxの存在下でヒグロマイシン含有培養液中で2週間選別した後、安定なクローンを単離し、ErbB−2発現のDox依存調節について分析した。ウェスタンブロット、免疫沈澱、ノザンブロット、およびフローサイトメーターによる分析を本質的に記載(D. Graus-Porta, R.R. Beerli. N.E. Hynes, Mol. Cell. Biol. 15:1182(1995))にしたがって実施した)。
【0078】
erbB−2プロモーター活性の読み出しとして、ErbB−2蛋白質レベルをウェスタンブロットによって先ず最初に分析した。これらクローンのかなりの割合で、Doxを4日間除去したときErbB−2発現の調節、すなわちE2C−KRABクローンでErbB−2の下降調節、E2C−VP64で上昇調節が示された。ErbB−2蛋白質レベルはそれらの特異的mRNAのレベルの変化に相関し、ErbB−2発現の調節は転写の抑圧または活性化の結果であることを示している。E2C−VP64クローンで発現される新たなErbB−2蛋白質は天然の発現蛋白質と識別不能で生物学的な活性を有していた。なぜならば上皮性増殖因子(EGF)は容易にチロシン燐酸化を誘発した。Doxの非存在下でのE2C−KRABクローン#27のErbB−2レベルは、そのEGF誘発チロシン燐酸化のように検出レベル以下であった。したがって、ErbB−2発現もまたフローサイトメトリーで分析したところ、E2C−KRABクローン#27で検出可能なErbB−2発現は示されず、E2C−VP64クローン#18におけるErbB−2の劇的な上昇調節(5.6倍)とは極めて対照的であった。したがって、erbB−2遺伝子調節の程度は完全抑圧(E2C−KRABクローン#27)からほぼ6倍の活性化(E2C−VP64クローン#18)の範囲であった。ErbB−1蛋白質の発現に対する顕著な影響は認められず、このことはErbB−2発現の調節は一般的な転写の下降調節または上昇調節の結果ではないことを示している。6ジンクフィンガードメインを用い18塩基対のDNA配列を標的とするこれらの転写因子とは対照的に、E2C標的配列の9塩基対ハーフサイトのどちらかに結合する3ジンクフィンガードメインで調製された転写活性化因子は、erbB−2ルシフェラーゼレポーターの転写を活性化することができなかった。これらの結果は、6ジンクフィンガードメインの特異性および親和性の増加は遺伝子調節に対する優性的作用を提供することを要求する可能性を示唆している。
【0079】
実施例9:E2C−KRABおよびE2C−VP64蛋白質のコード領域のレトロウイルスベクターpMX−IRES−GEFへの導入
いくつかの他の細胞株でE2C−KRABおよびE2C−VP64蛋白質を発現させるために、それらのコード領域をレトロウイルスベクターpMX−IRES−GFPに導入した。E2C(Sp1)−KRABおよびE2C(Sp1)−VP64コード領域をpcDNA3系発現プラスミドからPCR増幅させ(R.R. Beerli, D.J. Segal, B. Creier, C.F. Barbas, III, Proc. Natl. Acad. Sci. USA, 95:14628(1998))、BamH1およびCla1制限部位を用いpRevTRE(Clontech)にサブクローニングし、BamH1およびNot1制限部位を用いてpMX−IRES−GFPでサブクローニングした(X. Liu et al., Proc. Natl. Acad. Sci. USA, 94:10669(1997))。PCR増幅の忠実性は配列決定によって確認した。このベクターはジンクフィンガー蛋白質の翻訳のためのただ1つの二シストロン性メッセージ、および内部リボソームエントリー部位(IRES)から緑色蛍光蛋白質(GFP)を発現する。両コード領域は同じmRNAを共有するので、それらの発現は物理的に互いに連関しており、GFP発現はジンクフィンガー発現のインジケーターである。これらのプラスミドから調製したウイルスを続いてヒトの癌細胞株A431に感染させた(pMX−IRES−GEF/E2C−KRABおよびpMX−IRES−GFP/E2C−VP64プラスミドを一過性にアンホトロピックパッケージング細胞株Phoenix−Amphoにリポフェクタミンプラス(Gibco BRL)を用いてトランスフェトし、2日後に培養上清を8μg/mlのポリブレンの存在下で標的細胞の感染に用いた。
感染後3日して、細胞を分析のために採集した)。感染後3日で、Erb−2発現をフローサイトメトリーで測定した。
【0080】
意義深いことには、E2C−KRABウイルス処理細胞の約59%が本質的にErbB−2陰性で、一方、約27%のE2C−VP64ウイルス処理細胞で、ErvB−2レベルが増加した。GFP蛍光に対してErbB−2の蛍光を図表に表すと2つの細胞集団が存在することが明らかとなった:1つはGFPが陰性で正常なErbB−2レベルをもち、もう一方はGFP陽性でErbB−2レベルが変化している。遺伝子への誘導の特異性は、関連ErbB−1およびErbB−3蛋白質の発現レベルを測定することによって調べた。これらの蛋白質レベルの顕著な変化は検出されず、ErbB−2遺伝子への誘導は特異的で、遺伝子発現の一般的変化の非特異的な結果またはエフェクタードメインの過剰発現ではないことを示唆している。erbB−3の評価可能な調節が認められないということは特に注目に値する。なぜならば、その5'−UTRは18塩基対配列、5'−GGaGCCGGAGCCGgAGTc−3'(配列番号:122)を含み、E2Cのデザインした標的配列とはわずか3つのミスマッチが存在するだけである(15塩基対同一、小文字が相違を示す)(M.H. Kraus, W. Issing, T. Miki, N.C. Popescu, S.A. Aaronson, Proc. Natl. Acad. Sci. USA, 86:9193(1989))。
【0081】
実施例10:非ヒト霊長類細胞におけるerbB−2遺伝子の調節
erbB−2の5'−UTR内のジンクフィンガー標的配列は、多くの種で保存されている28塩基対配列ストレッチ内に存在する。非ヒト霊長類細胞のerbB−2遺伝子発現の調節を調べるために、COS−7線維芽細胞に二シストロン性E2C−KRABレトロウイルスを感染させ、フローサイトメトリーで分析した。ヒト細胞の場合のように、GFPマーカーによって示されるリプレッサー蛋白質の発現は、ErbB−2蛋白質の低下とよく相関した。同様に、ネズミ細胞における遺伝子への誘導は、E2C−KRABおよびE2C−VP64をコードするレトロウイルスでNIH/3T3細胞を感染させることによって調べた。
続いてErbB−2発現レベルをフローサイトメトリーではなくウェスタンブロッティングによってモニターした(mAbのネズミErbB−2細胞外ドメインとの反応性の欠如のために)。ここでもまた、感染細胞で修正したとき、E2C−KRABでは完璧な転写ノックアウトが観察された。しかしながら、ヒトの細胞株とは異なり、E2C−VP64誘発ErbB−2上昇調節はNIH/3T3細胞ではより穏やかで、感染効率について修正したとき約1.8倍であった。この矛盾についての蓋然性の高い説明はヒトとマウスプロモーターの構造の相違である。ヒトと異なり、マウスerbB−2プロモーターはTATAボックスを含まない(M.R. White & M.C. Hung, Oncogene 7:677(1992))。VP16による転写活性化は、少なくとも部分的にはTFIID(マルチ蛋白質複合体で、またTATA結合蛋白質を含む)との相互作用によって仲介される(C.J. Ingles, M. Shales, W.D. Cress, S.J. Triezenberg, J. Greenblatt, Nature 351:588(1991))。したがって、おそらくE2C−VP64蛋白質は、TATAボックスの非存在下ではより低い有効性で転写が活性化されるのであろう。これらのデータは、DNA結合部位は、配列および標的細胞内の相対的ポジションについて保存されるであろうが、一方、エフェクタードメインはコンテクスト効果のために最大の効率について最適化される必要があるかもしれない。それでもやはり、それらの能力が異なるにもかかわらず、本明細書で述べた人工的転写因子は、異なる種に由来する細胞でerbB−2遺伝子転写の調節を強制することができ、多様な生物での遺伝子機能の研究のための手法を提供する。
【0082】
実施例11:ErbB−2過剰発現腫瘍細胞におけるG1蓄積の特異的誘発
ErbB−2の過剰発現は、その固有のチロシンキナーゼ活性の構成的活性化をもたらし(P.P. Di Fiore et al., Science 237:178(1987))、レセプターを過剰発現している腫瘍細胞でのErbB−2の下降調節は増殖抑制をもたらす(R.M. Hudziak et al., Mol. Cell. Biol. 9:1165(1989); J. Deshane et al., Gene Ther. 1:332(1994); J.M. Daly et al., Cancer Res. 57:3804(1997))。増殖抑制メカニズムは、細胞サイクルのG1からS期への進行が妨げられるということのようである(R.M. Neve, H. Sutterluty, N. Pullen, H.A. Lane, J.M. Daly, W. Krek, N. E. Hynes, Submitted for publication)。したがって、我々は、我々のデザインした転写リプレッサーのerbB−2過剰発現腫瘍細胞での過剰発現はG1ブロックをもたらすか否かを調べた。したがって、SKBR3乳癌細胞をE2C−KRABレトロウイルスで感染させ、フローサイトメトリーでErbB−2発現レベルに対する細胞サイクルの分布を分析した(22)。2つの細胞集団を観察した:約40%の細胞は感染しないで正常なErbB−2レベルを有し、一方、感染細胞(約60%)は、3日後に約7倍低いレセプターレベルを示した。正常なレセプターレベルを有する細胞と比較して、ErbB−2発現レベルの低下した大部分の細胞は細胞サイクルのG1期であった。SKBR3細胞で観察されたG1蓄積はErbB−2過剰発現腫瘍細胞について特異的であることを確認するために、T47D乳癌細胞株を用いて実施した(この細胞はErbB−2レベルの上昇を示さない(図4B))。実際、T47D細胞にE2C−KRABレトロウイルスを感染させ、フローサイトメトリー分析に付したとき、ErbB−2レベルが正常および低下している細胞集団はそれぞれ区別できないDNA含有量を示すことが判明した。したがって、我々がデザインしたリプレッサー蛋白質は、ErbB−2過剰発現腫瘍細胞のG1蓄積を特異的に誘発することができる。細胞サイクルの進行を抑制する能力(したがってErb−2過剰発現腫瘍細胞の増殖を抑制する能力)は、癌の遺伝子治療のためにデザインされた転写因子の能力を示唆している。
【0083】
SEQUENCE LISTING
<110> Novartis AG
The Scripps Research Institute

<120> Zinc finger binding domains for GNN

<130> 30746/A

<140> JP P2000-577190
<141> 1999-10-14

<150> 09/173,941
<151> 1998-10-16

<160> 122

<170> PatentIn Ver. 2.1

<210> 1
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 1
Gln Ser Ser Asn Leu Val Arg
1 5



<210> 2
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 2
Asp Pro Gly Asn Leu Val Arg
1 5



<210> 3
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 3
Arg Ser Asp Asn Leu Val Arg
1 5



<210> 4
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 4
Thr Ser Gly Asn Leu Val Arg
1 5



<210> 5
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 5
Gln Ser Gly Asp Leu Arg Arg
1 5



<210> 6
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 6
Asp Cys Arg Asp Leu Ala Arg
1 5



<210> 7
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 7
Arg Ser Asp Asp Leu Val Lys
1 5



<210> 8
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 8
Thr Ser Gly Glu Leu Val Arg
1 5



<210> 9
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 9
Gln Arg Ala His Leu Glu Arg
1 5



<210> 10
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 10
Asp Pro Gly His Leu Val Arg
1 5



<210> 11
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 11
Arg Ser Asp Lys Leu Val Arg
1 5



<210> 12
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 12
Thr Ser Gly His Leu Val Arg
1 5



<210> 13
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 13
Gln Ser Ser Ser Leu Val Arg
1 5



<210> 14
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 14
Asp Pro Gly Ala Leu Val Arg
1 5



<210> 15
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 15
Arg Ser Asp Glu Leu Val Arg
1 5



<210> 16
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 16
Thr Ser Gly Ser Leu Val Arg
1 5



<210> 17
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 17
Gln Arg Ser Asn Leu Val Arg
1 5



<210> 18
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 18
Gln Ser Gly Asn Leu Val Arg
1 5



<210> 19
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 19
Gln Pro Gly Asn Leu Val Arg
1 5



<210> 20
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 20
Asp Pro Gly Asn Leu Lys Arg
1 5



<210> 21
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 21
Arg Ser Asp Asn Leu Arg Arg
1 5



<210> 22
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 22
Lys Ser Ala Asn Leu Val Arg
1 5



<210> 23
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 23
Arg Ser Asp Asn Leu Val Lys
1 5



<210> 24
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 24
Lys Ser Ala Gln Leu Val Arg
1 5



<210> 25
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 25
Gln Ser Ser Thr Leu Val Arg
1 5



<210> 26
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 26
Gln Ser Gly Thr Leu Arg Arg
1 5



<210> 27
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 27
Gln Pro Gly Asp Leu Val Arg
1 5



<210> 28
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 28
Gln Gly Pro Asp Leu Val Arg
1 5



<210> 29
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 29
Gln Ala Gly Thr Leu Met Arg
1 5



<210> 30
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 30
Gln Pro Gly Thr Leu Val Arg
1 5



<210> 31
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 31
Gln Gly Pro Glu Leu Val Arg
1 5



<210> 32
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 32
Gly Cys Arg Glu Leu Ser Arg
1 5



<210> 33
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 33
Asp Pro Ser Thr Leu Lys Arg
1 5



<210> 34
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 34
Asp Pro Ser Asp Leu Lys Arg
1 5



<210> 35
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 35
Asp Ser Gly Asp Leu Val Arg
1 5



<210> 36
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 36
Asp Ser Gly Glu Leu Val Arg
1 5



<210> 37
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 37
Asp Ser Gly Glu Leu Lys Arg
1 5



<210> 38
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 38
Arg Leu Asp Thr Leu Gly Arg
1 5



<210> 39
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 39
Arg Pro Gly Asp Leu Val Arg
1 5



<210> 40
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 40
Arg Ser Asp Thr Leu Val Arg
1 5



<210> 41
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 41
Lys Ser Ala Asp Leu Lys Arg
1 5



<210> 42
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 42
Arg Ser Asp Asp Leu Val Arg
1 5



<210> 43
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 43
Arg Ser Asp Thr Leu Val Lys
1 5



<210> 44
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 44
Lys Ser Ala Glu Leu Lys Arg
1 5



<210> 45
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 45
Lys Ser Ala Glu Leu Val Arg
1 5



<210> 46
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 46
Arg Gly Pro Glu Leu Val Arg
1 5



<210> 47
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 47
Lys Pro Gly Glu Leu Val Arg
1 5



<210> 48
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 48
Ser Ser Gln Thr Leu Thr Arg
1 5



<210> 49
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 49
Thr Pro Gly Glu Leu Val Arg
1 5



<210> 50
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 50
Thr Ser Gly Asp Leu Val Arg
1 5



<210> 51
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 51
Ser Ser Gln Thr Leu Val Arg
1 5



<210> 52
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 52
Thr Ser Gln Thr Leu Thr Arg
1 5



<210> 53
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 53
Thr Ser Gly Glu Leu Lys Arg
1 5



<210> 54
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 54
Gln Ser Ser Asp Leu Val Arg
1 5



<210> 55
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 55
Ser Ser Gly Thr Leu Val Arg
1 5



<210> 56
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 56
Thr Pro Gly Thr Leu Val Arg
1 5



<210> 57
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 57
Thr Ser Gln Asp Leu Lys Arg
1 5



<210> 58
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 58
Thr Ser Gly Thr Leu Val Arg
1 5



<210> 59
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 59
Gln Ser Ser His Leu Val Arg
1 5



<210> 60
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 60
Gln Ser Gly His Leu Val Arg
1 5



<210> 61
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 61
Gln Pro Gly His Leu Val Arg
1 5



<210> 62
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 62
Glu Arg Ser Lys Leu Ala Arg
1 5



<210> 63
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 63
Asp Pro Gly His Leu Ala Arg
1 5



<210> 64
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 64
Gln Arg Ala Lys Leu Glu Arg
1 5



<210> 65
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 65
Gln Ser Ser Lys Leu Val Arg
1 5



<210> 66
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 66
Asp Arg Ser Lys Leu Ala Arg
1 5



<210> 67
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 67
Asp Pro Gly Lys Leu Ala Arg
1 5



<210> 68
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 68
Arg Ser Asp Lys Leu Thr Arg
1 5



<210> 69
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 69
Arg Ser Asp His Leu Thr Arg
1 5



<210> 70
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 70
Lys Ser Ala Lys Leu Glu Arg
1 5



<210> 71
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 71
Thr Ala Asp His Leu Ser Arg
1 5



<210> 72
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 72
Thr Ala Asp Lys Leu Ser Arg
1 5



<210> 73
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 73
Thr Pro Gly His Leu Val Arg
1 5



<210> 74
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 74
Thr Ser Ser His Leu Val Arg
1 5



<210> 75
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 75
Thr Ser Gly Lys Leu Val Arg
1 5



<210> 76
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 76
Gln Pro Gly Glu Leu Val Arg
1 5



<210> 77
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 77
Gln Ser Gly Glu Leu Val Arg
1 5



<210> 78
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 78
Gln Ser Gly Glu Leu Arg Arg
1 5



<210> 79
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 79
Asp Pro Gly Ser Leu Val Arg
1 5



<210> 80
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 80
Arg Lys Asp Ser Leu Val Arg
1 5



<210> 81
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 81
Arg Ser Asp Val Leu Val Arg
1 5



<210> 82
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 82
Arg His Asp Ser Leu Leu Arg
1 5



<210> 83
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 83
Arg Ser Asp Ala Leu Val Arg
1 5



<210> 84
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 84
Arg Ser Ser Ser Leu Val Arg
1 5



<210> 85
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 85
Arg Ser Ser Ser His Val Arg
1 5



<210> 86
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 86
Arg Ser Asp Glu Leu Val Lys
1 5



<210> 87
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 87
Arg Ser Asp Ala Leu Val Lys
1 5



<210> 88
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 88
Arg Ser Asp Val Leu Val Lys
1 5



<210> 89
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 89
Arg Ser Ser Ala Leu Val Arg
1 5



<210> 90
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 90
Arg Lys Asp Ser Leu Val Lys
1 5



<210> 91
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 91
Arg Ser Ala Ser Leu Val Arg
1 5



<210> 92
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 92
Arg Ser Asp Ser Leu Val Arg
1 5



<210> 93
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 93
Arg Ile His Ser Leu Val Arg
1 5



<210> 94
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 94
Arg Pro Gly Ser Leu Val Arg
1 5



<210> 95
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 95
Arg Gly Pro Ser Leu Val Arg
1 5



<210> 96
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 96
Arg Pro Gly Ala Leu Val Arg
1 5



<210> 97
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 97
Lys Ser Ala Ser Leu Val Arg
1 5



<210> 98
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 98
Lys Ser Ala Ala Leu Val Arg
1 5



<210> 99
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 99
Lys Ser Ala Val Leu Val Arg
1 5



<210> 100
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 100
Thr Ser Gly Ser Leu Thr Arg
1 5



<210> 101
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 101
Thr Ser Gln Ser Leu Val Arg
1 5



<210> 102
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 102
Thr Ser Ser Ser Leu Val Arg
1 5



<210> 103
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 103
Thr Pro Gly Ser Leu Val Arg
1 5



<210> 104
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 104
Thr Ser Gly Ala Leu Val Arg
1 5



<210> 105
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 105
Thr Pro Gly Ala Leu Val Arg
1 5



<210> 106
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 106
Thr Gly Gly Ser Leu Val Arg
1 5



<210> 107
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 107
Thr Ser Gly Glu Leu Val Arg
1 5



<210> 108
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 108
Thr Ser Gly Glu Leu Thr Arg
1 5



<210> 109
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 109
Thr Ser Ser Ala Leu Val Lys
1 5



<210> 110
<211> 7
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:nucleotide
binding polypeptides

<400> 110
Thr Ser Ser Ala Leu Val Arg
1 5



<210> 111
<211> 5
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:peptide linker

<400> 111
Thr Gly Glu Lys Pro
1 5



<210> 112
<211> 18
<212> DNA
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:e2c target
sequence

<400> 112
ggggccggag ccgcagtg 18


<210> 113
<211> 11
<212> PRT
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:VP16's minimal
activation domain

<400> 113
Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu
1 5 10



<210> 114
<211> 34
<212> DNA
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence: Hairpin target
oligonucleotide

<400> 114
ggacgcnnnc gcgggttttc ccgcgnnngc gtcc 34


<210> 115
<211> 66
<212> DNA
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:
Oligonucleotide SPE2-3

<400> 115
gcgagcaagg tcgcggcagt cactaaaaga tttgccgcac tctgggcatt tatacggttt 60
ttcacc 66


<210> 116
<211> 74
<212> DNA
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:
Oligonucleotide SPE2-4

<400> 116
gtgactgccg cgaccttgct cgccatcaac gcactcatac tggcgagaag ccatacaaat 60
gtccagaatg tggc 74


<210> 117
<211> 81
<212> DNA
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:
Oligonucleotide SPE2-2

<400> 117
ggtaagtcct tctctcagag ctctcacctg gtgcgccacc agcgtaccca cacgggtgaa 60
aaaccgtata aatgcccaga g 81


<210> 118
<211> 58
<212> DNA
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:
Oligonucleotide SPE2-5

<400> 118
acgcaccagc ttgtcagagc ggctgaaaga cttgccacat tctggacatt tgtatggc 58


<210> 119
<211> 87
<212> DNA
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:
Oligonucleotide SPE2-1

<400> 119
gaggaggagg aggtggccca ggcggccctc gagcccgggg agaagcccta tgcttgtccg 60
gaatgtggta agtccttctc tcagagc 87


<210> 120
<211> 81
<212> DNA
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:
Oligonucleotide SPE2-6

<400> 120
gaggaggagg agctggccgg cctggccact agttttttta ccggtgtgag tacgttggtg 60
acgcaccagc ttgtcagagc g 81


<210> 121
<211> 18
<212> DNA
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:part of erbB-2
5'UTR

<400> 121
ggggccggag ccgcagtg 18


<210> 122
<211> 18
<212> DNA
<213> Artificial Sequence

<220>
<223> Description of Artificial Sequence:part of erbB-3
5'UTR

<400> 122
ggagccggag ccggagtc 18
【図1−1】

【図1−2】

【図1−3】

【図1−4】

【図1−5】

【図1−6】


【特許請求の範囲】
【請求項1】
以下の配列:
i) RS/L/K/HS/DD/N/S/T/E/A/V/K/H(X1X2X3)((X1X2X3)はLGR、LLR、LVK、LRR又はLSRである)、
ii) RSDX5LTR(X5はK又はHである)、又は
iii) RS/KDX4LVR(X4はN/S/T/E/A/V/K/H/Dである)
を有するヌクレオチド結合領域を含む、非天然ジンクフィンガーヌクレオチド結合ポリペプチドであって、
該ヌクレオチド結合領域が、5'-GNG-3'(NはA、T、C又はGである)の形態のヌクレオチド配列に特異的に結合する、非天然ジンクフィンガーヌクレオチド結合ポリペプチド。
【請求項2】
前記配列が、(1) RSDTLVR (配列番号: 40); (2) RSDDLVR (配列番号: 42); (3) RKDSLVR (配列番号: 80); (4) RSDVLVR (配列番号: 81); (5) RSDALVR (配列番号: 83); (6) RSDNLVR (配列番号: 3); (7) RSDDLVK (配列番号: 7); (8) RSDSLVR (配列番号:92) (9) RSDNLRR (配列番号: 21); (10) RSDNLVK (配列番号: 23); (11) RSDTLVK (配列番号: 43); (12) RSDELVK (配列番号: 86); (13) RSDALVK (配列番号: 87); (14) RSDVLVK (配列番号: 88); (15) RKDSLVK (配列番号: 90); (16) RSDKLTR (配列番号: 68); (17) RSDHLTR (配列番号: 69); (18) RSDKLVR (配列番号: 11); (19) RLDTLGR (配列番号: 38); (20) RHDSLLR (配列番号: 82) 及び (21) RSDELVR (配列番号: 15)からなる群より選ばれる、請求項1に記載のジンクフィンガーヌクレオチド結合ポリペプチド。
【請求項3】
前記配列が最初の3つの部位にRSDを含む、請求項1に記載のジンクフィンガーヌクレオチド結合ポリペプチド。
【請求項4】
前記配列が最後の3つの部位にLVRを含む、請求項1に記載のジンクフィンガーヌクレオチド結合ポリペプチド。
【請求項5】
さらに1つまたは2つ以上の転写調節因子と機能的に連結された請求項1のポリペプチド。
【請求項6】
請求項1のポリペプチドをコードする単離および精製されたポリヌクレオチド。
【請求項7】
請求項6のポリヌクレオチドを含む発現ベクター。
【請求項8】
請求項1のポリペプチドを2つから12含む組成物であって、該ポリペプチドは同一又は異なっている、組成物。
【請求項9】
2つから6つの請求項1に記載のポリペプチドを含む請求項8の組成物。
【請求項10】
前記ポリペプチドが機能的に連結された請求項8または9の組成物。
【請求項11】
前記ポリペプチドが配列番号111の配列をもつリンカーによって連結された請求項8から10のいずれかに記載の組成物。
【請求項12】
前記ポリペプチドの各々が異なるヌクレオチド配列と結合する請求項8から11のいずれかに記載の組成物。
【請求項13】
前記ポリペプチドが、さらに1つまたは2つ以上の転写調節因子と機能的に連結された、請求項8から12のいずれかに記載の組成物。

【公開番号】特開2010−143936(P2010−143936A)
【公開日】平成22年7月1日(2010.7.1)
【国際特許分類】
【出願番号】特願2010−15925(P2010−15925)
【出願日】平成22年1月27日(2010.1.27)
【分割の表示】特願2000−577190(P2000−577190)の分割
【原出願日】平成11年10月14日(1999.10.14)
【出願人】(593052785)ザ スクリップス リサーチ インスティテュート (91)
【Fターム(参考)】