ジンクフィンガードメイン及びその同定方法
【課題】任意の与えられた標的部位を認識するジンクフィンガードメインを提供する。
【解決手段】ジンクフィンガードメインをコードするアミノ酸配列、XaーX−Cys−X2-5ーCysーX3−Xa−X−CysーXーSer−AsnーXbーXーArg−HisーX3-5ーHis(ここでXaは、フェニルアラニンまたはチロシンであり、Xbは、疎水性残基である)を含む精製されたポリペプチド、および該ポリペプチドをコードする配列を含む核酸を提供する。
【解決手段】ジンクフィンガードメインをコードするアミノ酸配列、XaーX−Cys−X2-5ーCysーX3−Xa−X−CysーXーSer−AsnーXbーXーArg−HisーX3-5ーHis(ここでXaは、フェニルアラニンまたはチロシンであり、Xbは、疎水性残基である)を含む精製されたポリペプチド、および該ポリペプチドをコードする配列を含む核酸を提供する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、転写因子のようなDNA−結合タンパク質に関する。
【背景技術】
【0002】
大部分の遺伝子は、通常プロモーターまたはエンハンサー領域内にある、特定のDNA部位に結合するポリペプチド転写因子により転写レベルが調節される。これらのタンパク質は、プロモーター部位でRNAポリメラーゼにより転写開始を活性化または抑制し、それにより標的遺伝子の発現を調節する。活性化因子であれ抑制因子であれ、多くの転写因子は、構造的にモジュールである。そのようなモジュールは、構造的に別個のドメインとして組み合わせ可能であり、DNA結合、二量体化または転写機構(transcriptional machinary)との相互作用のような特異的な機能を有する。活性化ドメインまたは抑制ドメインのような効果ドメインは、非相同のDNA結合ドメインに転移されても、その機能を維持する〔Brent and Ptashne、(1985)Cell 43:729-36; Dawson et al.,(1995)Mol. Cell Biol. 15:6923-31〕。ジンクフィンガードメイン(zinc finger domain)、ホメオドメイン(homeodomain)、及びヘリックス−ターン−ヘリックス(helix-turn-helix)ドメインを含む多くのDNA結合ドメインの3次構造がNMR及びX線結晶構造解析データから決定されている。
【0003】
〔要約〕
本発明は、キメラ転写因子を同定し、製造するための、迅速で大規模な細胞的方法を提供する。そのような転写因子は、例えば、生物医学及び生物工学的応用において内生遺伝子の発現を変化させるために使用され得る。転写因子は、生体内、すなわち、無傷の生細胞内で検査される。また、本発明は、本発明の方法を、例えばゲノム配列のスクリーニングに適用することにより発見され得る新規核酸結合ドメインをも含む。
【0004】
本発明は、DNA上の標的部位を認識するペプチドドメインを同定する方法に関する。このような同定方法は本願において「ドメイン選別法」または「生体内スクリーニング法」ということもある。前記方法は(1)リポーター構築物(reporter construct)を含有する細胞及び(2)複数のハイブリッド核酸を提供することを含む。リポーター構築物は、プロモーターに作動可能に連結されたリポーター遺伝子を有し、プロモーターは、招集部位(recruitment site)及び標的部位(target site)を有する。リポーター遺伝子は、転写因子がプロモーターの招集部位及び標的部位を全て認識する場合(すなわち、基準を越える程度の結合時)には所定のレベルを超過して発現するが、転写因子がプロモーターの招集部位のみを認識する場合にはその限りでない。複数のハイブリッド核酸のそれぞれは、(i)転写活性化ドメイン、(ii)招集部位を認識するDNA結合ドメイン、及び(iii)試験ジンクフィンガードメインのような要素を含む非天然のタンパク質をコードする。試験ジンクフィンガードメインのアミノ酸配列は、複数のハイブリッド核酸のメンバー中で互いに異なる。前記選択方法は次を更に含む:複数のハイブリッド核酸中の一つ以上が一つ以上の細胞に入るようにする条件下で、複数の核酸を細胞と接触させること;細胞内でハイブリッド核酸が発現できるようにする条件で細胞を維持すること;細胞が、標的部位を認識する試験ジンクフィンガードメインをコードするハイブリッド核酸を含むことの指示として、所定レベル以上にリポーター遺伝子を発現する細胞を同定すること。
【0005】
DNA結合ドメイン、すなわち、招集部位を認識し、複数のハイブリッド構成員の中で変化しないないドメインは、例えば、一つ、二つ、三つ、またはそれ以上のジンクフィンガードメインを含むことができる。前記方法に利用される細胞は原核生物細胞または真核生物細胞であっても良い。真核生物細胞の例には、サッカロマイセス・セレビシエ(Saccharomyces cerevisiae)、シゾサッカロミセス ポンベ(Schizosaccharomyces pombe)、または、ピッチア パステウリス(Pichia pasteuris)のような酵母細胞;Sf9細胞のような昆虫細胞;及び繊維芽細胞またはリンパ球のような哺乳動物細胞を挙げることができる。
【0006】
ここで、「所定レベル(given level)」は、転写因子が招集部位は認識するが、標的部位は認識しない場合に観察される発現量である。ある場合には、「所定レベル」は0であっても良い(少なくとも使用される検定法の検出限度内で)。
【0007】
前記方法は、例えば、ゲノムDNA、mRNA混合物、またはcDNA混合物のような核酸から試験ジンクフィンガードメインをコードする核酸源(source nucleic acid)を増幅し、増幅された断片を生産する付加的な工程を含むことができる。核酸源はオリゴヌクレオチドプライマーを使用して増幅することができる。オリゴヌクレオチドプライマーは、ドメインの保存された境界をコードする核酸にアニールされる縮重オリゴヌクレオチド(例えば、相異する核酸配列を有する特定オリゴヌクレオチドのプール、またはイノシンのような非天然の塩基を有する特定オリゴヌクレオチド)のセット中の一つであり得る。また代替的に、前記プライマーは特定オリゴヌクレオチドであっても良い。増幅された断片は、前記方法に使用された複数のハイブリッド核酸に含まれるハイブリッド核酸を生産するために利用される。
【0008】
前記方法は、次の工程を更に含むことができる:(i)配列データベース中の候補ジンクフィンガードメインのアミノ酸配列を同定すること;(ii)候補ジンクフィンガードメインのアミノ酸配列をコードする候補核酸を提供すること;及び(iii)候補核酸を利用し、前述の方法に使用された複数のハイブリッド核酸に含まれるハイブリッド核酸を製作すること。前記データベースは、公知及び(または)予測されるタンパク質のような複数のアミノ酸配列に関する記録のみならず、cDNA、ESTs、ゲノムDNA、または予測されるイントロンを除去するためにコンピュータ処理されたゲノムDNAのような複数の核酸配列に対する記録を含むことができる。
【0009】
所望であれば、前記方法は第2標的部位(例えば、第1試験ジンクフィンガードメインにより認識される配列と異なる配列)を認識する第2試験ジンクフィンガードメインを同定するために反復することができる。続いて、同定された第1及び第2試験ジンクフィンガードメインの両方をコードする核酸を製作することができる。生成されるハイブリッドタンパク質は、第1試験ジンクフィンガードメインの標的部位及び第2ジンクフィンガードメインの標的部位の両方を含む標的部位を特異的に認識できるはずである。
【0010】
本発明はまた、試験ジンクフィンガードメインがプロモーター内の標的部位を認識するか否かを決定する方法に関する。本願では、この方法を「部位選別法」とも称する。前記方法はリポーター構築物及びハイブリッド核酸を提供する工程を含む。リポーター遺伝子は、招集部位及び標的部位を含むプロモーターに作動可能に連結され、転写因子がプロモーターの招集部位及び標的部位の両方を認識する場合、所定レベルを超過するレベルにリポーター遺伝子を発現させるが、転写因子がプロモーターの招集部位のみを認識する場合にはその限りでない。ハイブリッド核酸は、(i)転写活性化ドメイン、(ii)招集部位を認識するDNA結合ドメイン、及び(iii)試験ジンクフィンガードメインの要素を有する非天然生成タンパク質をコードする。前記方法は次のような工程を更に含む:リポーター構築物が細胞内に入るようにする条件下でリポーター構築物を細胞と接触させる工程;前記工程以前、以後、または前記工程と同時に、ハイブリッド核酸が細胞内に入るようにする条件下でハイブリッド核酸を細胞と接触させる工程;前記細胞をハイブリッド核酸が細胞内で発現できるようにする条件下で維持する工程;及び細胞内リポーター遺伝子の発現を検出する工程。リポーター遺伝子の発現が所定レベルより高いということは試験ジンクフィンガードメインが標的部位を認識するという指標である。
【0011】
前記リポーター構築物及びハイブリッド核酸は、別のプラスミドにそれぞれ含まれてもよい。二つのプラスミドは細胞に同時にまたは連続的に導入することができる。一つのプラスミドまたは2つのプラスミドの両方は、選別可能マーカーを含むことができる。また、リポーター構築物とハイブリッド核酸は、同一のプラスミド中に含まれてもよく、この場合には、リポーター構築物とハイブリッド核酸を細胞に導入するために単一回の接触工程のみが必要である。また他の実施態様では、リポーター構築物及びハイブリッド核酸中の一つまたは両者が、細胞のゲノムに安全に挿入される。前記方法の場合、本願に記述された任意の生体内方法において、転写活性化ドメインは転写抑制ドメインで代替することができ、この場合には、リポーター遺伝子の発現レベルが所定レベル未満に減少する細胞を同定するようになる。
【0012】
本発明の更なる他の方法は、2つの細胞の融合により、試験ジンクフィンガードメインの結合優先性の迅速な決定を容易にする。この方法は、リポーター遺伝子を含有する第1細胞を提供する工程;ハイブリッド核酸を含有する第2細胞を提供する工程;第1細胞及び第2細胞を融合させて融合細胞を形成する工程;融合細胞を融合細胞内でハイブリッド核酸の発現を可能にする条件下で維持する工程;及び融合細胞内リポーター遺伝子の発現を検出する工程を含み、ここで、リポーター遺伝子の発現レベルが所定レベルより高いということは試験ジンクフィンガードメインが標的部位を認識することを表す指標である。例えば、第1細胞及び第2細胞は組織培養細胞または真菌細胞であり得る。本方法の例示的な一実施態様では、酵母(S. cerevisiae)細胞が利用される。第1細胞は第1交配型(例えば、MATa)を有し、第2細胞は第1交配型と異なる交配型(例えば、MATα)を有する。2つの細胞を相互に接触させれば、酵母交配(yeast mating)により第1細胞及び第2細胞の両方のゲノムを含有する核を有する単一細胞(例えば、MATa/α)が作られる。本方法では、全て同一な第1交配型であり、それぞれの第1細胞が相異する標的部位を有するリポーター構築物を有する、複数の第1細胞を提供することを含んでもよい。全て同一な第2交配型であり、それぞれが相異する試験ジンクフィンガードメインを有する複数の第2細胞も提供される。全ての可能な対交配(pair-wise mating)のような複数の対交配でマトリックスを作る。この方法は、複数の結合部位(例えば、可能な標的部位の全ての完全なセット)に対する複数の試験ジンクフィンガードメインの結合優先性を決定するのに利用される。
【0013】
本発明はまた、試験ジンクフィンガードメインの結合優先性を検査する方法を提供する。本方法は、(1)本質的に全ての細胞がハイブリッド核酸を含有する細胞を提供する工程及び(2)複数のリポーター構築物を提供する工程を含む。複数のリポーター構築物のそれぞれは招集部位及び標的部位を含むプロモーターに作動可能に結合されたリポーター遺伝子を有する。リポーター遺伝子は転写因子がプロモーターの招集部位及び標的部位の両方を認識する場合には所定レベルを超過して発現されるが、転写因子が単にプロモーターの招集部位のみに結合する場合はその限りでない。複数のリポーター構築物の成員において、第2の標的部位は多様に変化する。ハイブリッド核酸は、以下の要素、すなわち、(i)転写活性化ドメイン、(ii)招集部位を認識するDNA結合ドメイン、及び(iii)試験ジンクフィンガードメイン、を有するハイブリッドタンパク質をコードする。本方法は、次の工程:複数のリポーター構築物中の少なくとも一つが、少なくとも一つの細胞に入るようにする条件下で、複数のリポーター構築物を細胞と接触させる工程;細胞内の核酸発現が可能な条件で細胞を維持する工程;細胞内にリポーター構築物を含有し、所定レベル以上にリポーター構築物を発現させる細胞(リポーター構築物が所定レベル以上に発現されるということは、細胞内のリポーター構築物がジンクフィンガードメインにより認識される標的部位を有するということを表す)を同定する工程、を更に含む。
【0014】
試験ジンクフィンガードメインが1つより多い標的部位に対して結合優先性を有する場合は、それぞれ異なる標的部位を有する複数の細胞を前記方法により同定することができる。前記方法は、最高レベルのリポーター遺伝子発現を示す細胞を同定することを更に含むことができる。別法として、リポーター遺伝子発現の臨界レベル(例えば、リポーター遺伝子発現が2、4、8、20、50、100、1000倍またはそれ以上増加するレベル)を決定し、臨界レベルを超えてリポーター遺伝子を発現させる全ての細胞を選択することもある。
【0015】
標的結合部位は、例えば、2〜6ヌクレオチド長であり得る。複数のリポーター構築物は標的結合部位の2、3、または4またはそれ以上の位置にA、T、G及びCヌクレオチドの全ての可能な組合を含むことができる。
【0016】
また他の側面において、本発明は複数のジンクフィンガードメインを同定する方法であることをその特徴とする。この方法は、第1試験ジンクフィンガードメインを同定するためにドメイン選別法を遂行し、また第1試験ジンクフィンガードメインの標的部位とは異なる標的部位を認識する第2試験ジンクフィンガードメインを同定するためにドメイン選別法を再遂行することを含む。更に他の特徴は、キメラジンクフィンガータンパク質をコードする核酸を生成する方法であり、この方法は第1及び第2試験ジンクフィンガードメインを同定するためにドメイン選別法を2回遂行し、第1及び第2試験ジンクフィンガードメインを含むポリペプチドをコードする核酸を構築することを含む。その核酸は、二つの下位部位(subsite)からなる部位を特異的に認識する二つのドメインを含むハイブリッドタンパク質をコードすることができる。下位部位は、それぞれ第1試験ジンクフィンガードメインの標的部位及び第2試験ジンクフィンガードメインの標的部位である。
【0017】
また他の側面において、本発明は、ジンクフィンガードメインにより認識されるDNA配列を同定する方法に関する。本方法は、第1試験ジンクフィンガードメインに対する第1結合優先配列を同定するための部位選別法の遂行、及び第2試験ジンクフィンガードメインに対する第2結合優先配列を同定するための部位選別法の再遂行を含む。同定された第1及び第2試験ジンクフィンガードメインを全てコードする核酸を構築することができる。その核酸は、第1試験ジンクフィンガードメインの標的部位及び第2試験ジンクフィンガードメインの標的部位を含む部位を特異的に認識する2つのドメインを含むハイブリッドタンパク質をコードすることができる。
【0018】
本発明はまた、DNA上の標的部位を認識するペプチドドメインを同定する方法を提供する。この方法は、(1)リポーター構築物を含有する細胞及び(2)複数のハイブリッド核酸を提供することを含む。リポーター構築物は、プロモーターに作動可能に連結されたリポーター遺伝子を有し、プロモーターは、招集部位及び標的部位を有する。リポーター遺伝子は、転写因子がプロモーターの招集部位及び標的部位を全て認識する場合(すなわち、基準を越える程度の結合時)には所定レベル未満で発現されるが、転写因子がプロモーターの招集部位のみを認識する場合にはその限りでない。複数のハイブリッド核酸のそれぞれは、以下の要素、(i)転写抑制ドメイン、(ii)招集部位を認識するDNA結合ドメイン、及び(iii)試験ジンクフィンガードメイン、と一緒に非天然のタンパク質をコードする。試験ジンクフィンガードメインのアミノ酸配列は、複数のハイブリッド核酸の成員中で変化がある。その方法は、次の工程:複数の核酸中の少なくとも一つが、少なくとも一つの細胞に入るようにする条件下で、複数の核酸を細胞と接触させる工程;細胞内でハイブリッド核酸が発現できるようにする条件で細胞を維持する工程;細胞が標的部位を認識する試験ジンクフィンガードメインをコードするハイブリッド核酸を含む指標として、リポーター遺伝子を所定レベル未満に発現させる細胞を同定する工程。本方法の追加実施態様も転写活性化ドメインを利用する方法と類似している。同様に、本願に記述された他のいかなる選別法も、転写活性化ドメインの代りに転写抑制ドメインを用いて遂行することができる。
【0019】
また他の側面において、本発明の特徴は、特定の精製されたポリペプチド及び単離された核酸である。本発明の精製されたポリペプチドは、下記のアミノ酸配列を有するポリペプチドを含む:
【0020】
Xa−X−Cys−X2-5−Cys−X3−Xa−X−Cys−X−Ser−Asn−Xb−X−Arg−His−X3-5−His(配列番号68)、
Xa−X−Cys−X2-5−Cys−X3−Xa−X−His−X−Ser−Asn−Xb−X−Lys−His−X3-5−His(配列番号69)
Xa−X−Cys−X2-5−Cys−X3−Xa−X−Ser−X−Ser−Asn−Xb−X−Arg−His−X3-5−His(配列番号70)、
Xa−X−Cys−X2-5−Cys−X3−Xa−X−Gln−X−Ser−Thr−Xb−X−Val−His−X3-5−His(配列番号71)、
Xa−X−Cys−X2-5−Cys−X3−Xa−X−Val−X−Ser−Xc−Xb−X−Arg−His−X3-5−His(配列番号72)、
Xa−X−Cys−X2-5−Cys−X3−Xa−X−Gln−X−Ser−His−Xb−X−Arg−His−X3-5−His(配列番号73、
Xa−X−Cys−X2-5−Cys−X3−Xa−X−Gln−X−Ser−Asn−Xb−X−Val−His−X3-5−His(配列番号74)、
Xa−X−Cys−X2-5−Cys−X3−Xa−X−Gln−X−Ser−Xc−Xb−X−Arg−His−X3-5−His(配列番号75)、
Xa−X−Cys−X2-5−Cys−X3−Xa−X−Gln−X−Ala−His−Xb−X−Arg−His−X3-5−His(配列番号150)、
Xa−X−Cys−X2-5−Cys−X3−Xa−X−Gln−X−Phe−Asn−Xb−X−Arg−His−X3-5−His(配列番号151)、
Xa−X−Cys−X2-5−Cys−X3−Xa−X−Gln−X−Ser−His−Xb−X−Thr−His−X3-5−His(配列番号152)、
Xa−X−Cys−X2-5−Cys−X3−Xa−X−Gln−X−Ser−His−Xb−X−Val−His−X3-5−His(配列番号153)、
Xa−X−Cys−X2-5−Cys−X3−Xa−X−Gln−X−Ser−Asn−Xb−X−Ile−His−X3-5−His(配列番号154)、
Xa−X−Cys−X2-5−Cys−X3−Xa−X−Gln−X−Ser−Asn−Xb−X−Arg−His−X3-5−His(配列番号155)、
Xa−X−Cys−X2-5−Cys−X3−Xa−X−Gln−X−Thr−His−Xb−X−Gln−His−X3-5−His(配列番号156)、
Cys−X2-5−Cys−X3−Xa−X−Gln−X−Thr−His−Xb−X−Arg−His−X3-5−His(配列番号157)、
Xa−X−Cys−X2-5−Cys−X3−Xa−X−Arg−X−Asp−Lys−Xb−X−Ile−His−X3-5−His(配列番号158)、
Xa−X−Cys−X2-5−Cys−X3−Xa−X−Arg−X−Ser−Asn−Xb−X−Arg−His−X3-5−His(配列番号159)、
Xa−X−Cys−X2-5−Cys−X3−Xa−X−Gln−X−Gly−Asn−Xb−X−Arg−His−X3-5−His(配列番号161)、
Xa−X−Cys−X2-5−Cys−X3−Xa−X−Arg−X−Asp−Glu−Xb−X−Arg−His−X3-5−His(配列番号162)、
Xa−X−Cys−X2-5−Cys−X3−Xa−X−Arg−X−Asp−His−Xb−X−Arg−His−X3-5−His(配列番号163)、
Xa−X−Cys−X2-5−Cys−X3−Xa−X−Arg−X−Asp−His−Xb−X−Thr−His−X3-5−His(配列番号164)、
Xa−X−Cys−X2-5−Cys−X3−Xa−X−Arg−X−Asp−Lys−Xb−X−Arg−His−X3-5−His(配列番号165)、
Xa−X−Cys−X2-5−Cys−X3−Xa−X−Arg−X−Ser−His−Xb−X−Arg−His−X3-5−His(配列番号166)、
Xa−X−Cys−X2-5−Cys−X3−Xa−X−Arg−X−Thr−Asn−Xb−X−Arg−His−X3-5−His(配列番号167)、
(ここで、Xaはフェニルアラニンまたはチロシンであり、Xbは疎水性残基であり、Xcはセリンまたはスレオニンである。)本発明の核酸は上記のポリペプチドをコードする核酸を含む。
【0021】
また、本発明の精製されたポリペプチドは、配列番号23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、103、105、107、111、113、115、117、119、121、123、125、127、129、131、133、135、137、141、143、145、147、149、または151と50%、60%、70%、80%、90%、93%、95%、96%、98%、99%、または100%同一なアミノ酸配列を有することができる。前記ポリペプチドはポリペプチドの核酸接触残基に相応するアミノ酸位置において、配列番号23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、103、105、107、111、113、115、117、119、121、123、125、127、129、131、133、135、137、141、143、145、147、149、または151と同一であり得る。または、前記ポリペプチドは、ポリペプチドの核酸接触残基に相当する残基中の少なくとも一つ以上の残基が、配列番号23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、103、105、107、111、113、115、117、119、121、123、125、127、129、131、133、135、137、141、143、145、147、149、または151と異なることができる。精製されたポリペプチドはまた、非相同のDNA結合ドメイン、核局在化シグナル、小分子結合ドメイン(例、ステロイド結合ドメイン)、エピトープタグまたは精製のための配列(精製ハンドル)、触媒ドメイン(例、核酸改質ドメイン、核酸切断ドメイン、またはDNA修復触媒的ドメイン)及び/または転写機能的ドメイン(例、活性化ドメイン、抑制ドメインなど)中の一つ以上を含むことができる。本発明はまた、前記ポリペプチドをコードする単離された核酸配列、及び配列番号22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、102、104、106、110、112、114、116、118、120、122、124、126、128、130、132、134、136、140、142、144、146、148または150、またはこれらの相補体からなるプローブ配列の単一鎖のプローブに厳しい条件下でハイブリダイズする単離された核酸配列を含む。本発明は、非相同の核酸結合ドメインに融合された本発明のポリペプチドを細胞内で発現させる方法を、更に含む。この方法は、前記融合タンパク質をコードする核酸を細胞に導入することを含む。このような本発明の核酸は、誘導可能プロモーター(例、ステロイドホルモン調節性プロモーター、小分子調節性プロモーター、またはテトラシクリンTet-On及びTet-Offシステムのような操作された誘導性システム)のような非相同の核酸配列により作動可能に調節され得る。
【0022】
「塩基接触位置」という用語は、配列番号21のアミノ酸、アルギニン73、アスパラギン酸75、グルタミン酸76、及びアルギニン79に構造的に対応するジンクフィンガードメインの4つのアミノ酸の位置をいう。これらの位置はまた−1、2、3、及び6位と称されることもある。問合せ配列において、塩基接触位置に相応する位置を同定するためには、問合せ配列のシステイン及びヒスチジン残基がZif268のフィンガー3のシステイン及びヒスチジン残基と並ぶように問合せ配列を問題のジンクフィンガードメインと整列させる。ヨーロッパ生物情報研究所(European Bioinformatics Institute)のClustalW WWWサービス (http://www2.ebi.ac.uk/clustalw;Thompson et al(1994))Nucleic Acids Res. 22:4673-4680)は、配列整列の一つの簡単な方法を提供する。
【0023】
「非相同の(heterologous)」という用語は、人為的に構成に導入されたポリペプチドであり、その構成に天然のには存在しないポリペプチドをいう。内生のものとの区別においては、非相同のポリペプチドは、いかなる天然に生じるポリペプチド中の側面に位置しない少なくとも1つの側面に位置するポリペプチド配列を有していてもよい。「ハイブリッド」という用語は、(i)少なくとも2つの天然に存在する異なった配列;(ii)少なくとも一つの人工配列(すなわち、天然に存在しない配列)及び一つの天然に存在する配列;または(iii)少なくとも二つの人工配列中のいずれか一つから由来するアミノ酸配列を含有するポリペプチドを指す。人工配列の例には、天然のに存在する配列の突然変異及び新たに設計された配列がある。
【0024】
本願で使用された「厳しい条件下でハイブリダイズする」という用語は、45℃で6×塩化ナトリウム/クエン酸ナトリウム(6×SSC)中でハイブリダイズさせ、次いで、65℃で0.2×SSC、0.1%SDSで2回洗浄する条件を指す。
【0025】
「結合優先性(binding preference)」という用語は、ポリペプチドが、他の結合部位に比べて一つの核酸結合部位を選別的に選択する識別力を指す。例えば、核酸結合部位に比較してポリペプチドが量的に制限されている場合、本願に記述された生体内または生体外の検査法で選好されない部位より選好される部位に更に多量のポリペプチドが結合するはずである。
【0026】
本願で使用される「認識(する)」という用語は、一つの核酸結合部位と第2の競合部位とを識別するポリペプチドの能力を指し、したがって、例えば、本願に記述された検査では第2の部位の過剰存在下において、ポリペプチドが、第1の結合部位に結合したままで残るようになる。このポリペプチドは、単独で第1の結合部位に対して十分な親和性を有しなくてもよいが、本発明のハイブリッドポリペプチドとして、隣接する招集部位に結合する他の核酸結合ドメインと融合された場合には、検査され得る。
【0027】
本願において用いられる「縮重オリゴヌクレオチド」とは、(a)相異するオリゴヌクレオチドの集団、及び(b)一つ以上の配列にアニーリングできる単一種のオリゴヌクレオチド(例えば、イノシンのような非自然的ヌクレオチドを有するオリゴヌクレオチド)の両方を意味する。
【0028】
本発明は、多様な利点を提供する。特定配列を認識するDNA結合ドメインを選別できる能力は、DNAの特定部位に結合する新規ポリペプチドの設計を可能にする。したがって、本発明は選択された標的の発現を調節することができる(例えば、病源体が必要とする遺伝子を抑制することができ、癌増殖が必要とする遺伝子を抑制することができ、または発現が良くできない遺伝子または突然変異タンパク質をコードする遺伝子を活性化または過剰発現することができる)新規ポリペプチドの必要に応じた生産を容易にする。
【0029】
ジンクフィンガードメインの使用は特に有利である。第一に、ジンクフィンガーモチーフは、非常に多様なDNA配列を認識する。第二に、自然発生的ジンクフィンガータンパク質の構造は、単位モジュール性である。例えば、「Egr−1」とも呼ばれるZif268ジンクフィンガータンパク質は三つのジンクフィンガードメインが直列で構成されている。図1は、DNAと複合体をなした三つのフィンガーからなるZif268ジンクフィンガータンパク質のX線決定構造である〔Pavletich and Pabo, (1991)Science 252:809-817〕。各フィンガーはDNA認識部位の3−4塩基対と独立に接触する。したがって、それぞれのフィンガーと接触した下位部位(subsite)は、独立的な分子的認識と見なされ得る。同一なポリペプチド鎖において複数のジンクフィンガー単位モジュールが協同効果を発揮することにより高親和度結合が達成される。
【0030】
生体内選別工程の使用は、細胞内環境でDNAの特定部位に結合するポリペプチドの直接的同定を可能にする。細胞、特に真核細胞において、認識に関連した因子らは、試験官内の選別シナリオ中に存在する因子らとは大いに異なる。例えば、真核細胞核において、ポリペプチドは特定核酸結合部位に対して無数に多くの異なる核タンパク質と競争しなければならない。ヌクレオソーム(nucleosome)またはその他のクロマチンタンパク質が結合部位を占めたり閉鎖したり、またはこの結合部位に競争的に作用できる。たとえ結合されていないとしても、細胞内の核酸構造は、折りたたみ、スーパーコイリング、捩れ、及び解捩に付される。反面、ポリペプチド自体は、その他の因子の中で、プロテアーゼ及びシャペロンに、露出されている。その上、ポリペプチドは、全体遺伝子の結合可能な部位と直面するようになり、そのようにして選別工程で選別されるためには所望の部位への高い特異性がなければならない。生体内の選別とは対照的に、生体外の選別は最高の特異性を有する結合物よりも、最高の親和性を有する結合物を選択することができる。
【0031】
発現されたポリペプチドキメラの結合能力を示すためにリポーター遺伝子を使用することは効果的で簡単であるのみならず、タンパク質−核酸接触面のエネルギー学、結合接触面に影響を与える周辺残基及びヌクレオチドのような数多くの周辺因子を計算に入れた複雑な相互作用コードを開発する必要がないため有利である〔Segal et al. (1999) Proc. Natl. Acad. Sci. USA 96:2758-2763〕。
【0032】
本発明は、それ自体でヒトゲノム、または他のいかなるゲノムに存在する全てのジンクフィンガードメインを有用にする。この、ジンクフィンガードメインの構造的フォルディングが占有する配列空間の多様なサンプリングは、自然選択の永年に本来備わった更なる利点を有することができる。その上、宿主種からのドメインを利用することにより、本願に記述された方法による遺伝子治療適用のために設計されたDNA結合タンパク質は宿主免疫応答によって非自己と取扱われる可能性が減少する。
【0033】
一つ以上の本発明の詳細な実施態様を添付図面及び下記説明により提示する。本発明の他の特徴、目的、及び利点は、この説明及び図面、及び請求項から明白になるであろう。
【0034】
詳細な説明
本発明は、試験ジンクフィンガードメインの核酸結合優先性を決定するための新たなスクリーニング法に関する。この方法は、多様なDNA結合ドメイン、これらドメインの多様な源泉及び数多くのライブラリー設計、数多くのリポーター遺伝子、及び数多くの選別及びスクリーニングシステムに適用することができる。このスクリーニング方法は高効率の基盤として遂行できる。このスクリーニング方法から得た情報は人工核酸結合タンパク質を設計する方法に直ちに利用され得る。この設計方法は、試験ジンクフィンガードメインの結合優先性を利用してキメラ核酸結合タンパク質のモジュラー組立に導く。設計されたタンパク質は、前記スクリーニング方法で更に最適化されたり、または変形され得る。
【0035】
DNA結合ドメイン
本発明は、相異する結合特異性を有する核酸結合ドメインの集合体を利用する。高い親和性及び高い特異性で、核酸に結合する多様なタンパク質構造が知られている。これらの構造は、核酸の機能を特異的に制御するために、無数の異なるタンパク質において繰り返し用いられる(二重螺旋DNAを認識する構造的モチーフ検討のために、例えば文献〔Pabo and Sauer (1992) Annu. Rev. Biochem. 61:1053-95; Patikoglou and Burley (1997) Annu. Rev. Biophys. Biomol. Struct. 26: 289-325;及びNelson (1995) Curr Opin Genet Dev. 5:180-9〕参照)。核酸結合ドメインに対する幾つかの非制限的な例は次の通りである。
【0036】
ジンクフィンガー。ジンクフィンガーは、約30個のアミノ酸残基からなる小さいポリペプチドドメインであり、その中には、システインまたはヒスチジンである4個のアミノ酸が、亜鉛イオンと配位結合をすることができるように、適切に間隔を置いて配置されている(図1参照;検討のために例えば文献〔Klug and Rhodes (1987) Trends Biochem. Sci. 12: 464-469 (1987); Evans and Hollenberg (1988) Cell 52: 1-3; Payre and Vincent (1988) FEBS Lett. 234: 245-250; Miller et al. (1985) EMBO J. 4:1609-1614; Berg (1988) Proc. Natl. Acad. Sci. U.S.A. 85:99-102;及びRosenfeld and Margalit (1993) J. Biomol. Struct. Dyn. 11: 557-570〕参照)。したがって、ジンクフィンガードメインは、亜鉛イオンと配位結合をする残基の種類により、例えば、Cys2−His2類、Cys2−Cys2類、Cys2−CysHis類などに分類できる。Cys2−His2ジンクフィンガーで亜鉛と配位結合する残基は典型的に Xa−X−C−X2-5−C−X3−Xa−X5−Ψ−X2−H−X3-5−H(ここで、ψ(プサイ)は疎水性残基である)のように配置されており〔Wolfe et al., (1999) Annu. Rev. Biophys. Biomol. Struct. 3:183-212〕(配列番号76)、ここで「X」は任意のアミノ酸を表し、Xaはフェニルアラニンまたはチロシンであり、下付き添字はアミノ酸の個数を指し、二つの下付き添字は介入するアミノ酸の典型的な範囲を指す。逆平行(anti-parallel)βシートが短いか、非理想的であるか、又は存在しなくてもよいが、典型的に、介入するアミノ酸は折りたたまれ、αヘリックスに対して充填される逆平行βシートを形成する。この折りたたみは、亜鉛と配位結合する側鎖が、亜鉛イオンと配位結合するのに適合した四面体構造中にあるように配置される。塩基接触残基はフィンガーのN−末端にあり、かつ、先行するループ領域にある(図2)。ジンクフィンガーDNA−結合タンパク質は、通常、三つ以上のジンクフィンガードメインの直列配置で構成される。
【0037】
ジンクフィンガードメイン(「ZFD」)は、最もありふれた真核生物DNA−結合モチーフ中の一つであり、酵母から高等植物及びヒトに至る多様な種で発見される。ヒトゲノムのみにも少なくとも数千種のジンクフィンガードメインが存在することと推測される。ジンクフィンガードメインは、ジンクフィンガータンパク質から単離することができる。ジンクフィンガータンパク質の非制限的な例には、CF2−II、クルペル(Kruppel)、WT1、バソヌクリン(basonuclin)、BCL−6/LAZ−3、赤芽球クルペル−様転写因子、転写因子Sp1、Sp2、Sp3及びSp4、転写抑制剤YY1、EGR1/Krox24、EGR2/Krox20、EGR3/Pilot、EGR4/AT133、Evi−1、GLI1、GLI2、GLI3、HIV−EP1/ZNF40、HIV−EP2、KR1、ZfX、ZfY及びZNF7などがある。
【0038】
下記電算的方法は、配列決定されたゲノム中の、または核酸データベース中の、全てのジンクフィンガードメインを同定するために用いられ得る。任意のジンクフィンガードメインを利用することができる。また、人工ジンクフィンガードメインが、例えば、電算的方法により設計された〔例えば、Dahiyat and Mayo(1997) Science 278:82-7〕。Dahiyat and Mayoのジンクフィンガーは、ジンクフィンガーの折りたたみは採択するが、その核に亜鉛イオンを含有しない。したがって、これは亜鉛イオンと配位結合するという機能的能力というよりは、そのポリペプチド骨格の、天然ジンクフィンガーの折りたたみとの構造的な類似性によるジンクフィンガーである。
【0039】
ホメオドメイン。ホメオドメインは、DNAの小さい溝(minor groove)と接触するN−末端腕及び続いて大きい溝(major groove)と接触する3個のαヘリックスで構成される単純な真核生物ドメインである〔例えば、Laughon、(1991) Biochemistry 30:11357-67参考〕。第三のαヘリックスは大きい溝中に位置し、決定的なDNA−接触側鎖を含有する。ホメオドメインは第三のαヘリックスに引導するターンに存在する高度に保存された特徴的なモチーフを有する。このモチーフはドメインの疎水性コア内に存在する不変トリプトファンを含む。このモチーフはプロサイト(Prosite)データベース(http://www.expasy.ch/参考)にPDOC00027として公知となっている(〔L/I/V/M/F/Y/G〕−〔A/S/L/V/R〕−X(2)−〔L/I/V/M/S/T/A/C/N〕−X−〔L/I/V/M〕−X(4)−〔L/I/V〕−〔R/K/N/Q/E/S/T/A/I/Y〕−〔L/I/V/F/S/T/N/K/H〕−W−〔F/Y/V/C〕−X−〔N/D/Q/T/A/H〕−X(5)−〔R/K/N/A/I/M/W〕;配列番号77)。ホメオドメインは、細胞同一性を決定し、有機体の発生過程で位置的な情報を提供する転写因子でしばしば発見される。そのような古典的なホメオドメインは、ゲノム中にクラスターで発見することができ、クラスター中のホメオドメインの順番は、ボディー軸(body axis)に沿ったホメオドメインの発現パターンに大体相当している。ホメオドメインは、例えば、Hox−1のようなホメオドメインとのアラインメントにより、またはホメオドメインプロファイルまたはホメオドメイン隠れマルコフモデル(hidden Markov Model;HMM;下記参照)、例えば、PfarmデータベースのPF00046またはSMARTデータベースの「HOX」との整列により(http://smart.embl-heidelberg.de/)、または前記のプロサイトモチーフPDOC00027により同定可能である。
【0040】
ヘリックス−ターン−ヘリックスタンパク質。このDNA結合モチーフは、多くの原核生物転写因子中でしばしば発見される。例えば、LacI族、AraC族など、多くの亜族がある。名称において二つのヘリックスはDNAの大きい溝に対して位置し、第二のαヘリックスをDNAの大きい溝内に配置する第一のαヘリックス及びこのようにDNAの大きい溝に位置する第二のαヘリックスである。これらドメインはHMM、例えば、SMARTデータベースから得られるHTH_ARAC、HTH_ARSR、HTH_ASNC、HTH_CRP、HTH_DEOR、HTH_DTXR、HTH_GNTR、HTH_ICLR、HTH_LACI、HTH_LUXR、HTH_MARR、HTH_MERR及びHTH_XREプロファイルとのアラインメントにより同定される(http://smart.embl-heidelberg.de/)。
【0041】
ヘリックス−ループ−ヘリックスタンパク質。このDNA結合ドメインは、例えば、MyoD、fos、jun、E11及びミオゼニンのようなホモ−及びヘテロ−二量体転写因子間に共通的に発見される。このドメインは、二量体及びその間のループからなり、各単量体は二つのαヘリックスにかけて結合する。このドメインは、例えば、SMARTデータベース(http://smart.embl-heidelberg.de/)で利用可能な「HLH」プロファイルのようなHMMとのアラインメントにより同定できる。たとえヘリックス−ループ−ヘリックスタンパク質は、典型的に二量体性であるが、ポリペプチドリンカーを二つのサブユニット間に設計して単一オープンリーディングフレーム(open reading frame)が二つのサブユニット及びリンカーをコードさせることにより単量体性バージョンを構築することができる。
【0042】
DNA−結合ドメインの同定
多様な方法を使用して構造ドメインを同定することができる。
電算的方法(Computational Method)。本明細書に記述された方法により単離されたDNA結合ドメインのアミノ酸配列を公知配列のデータベース、例えば、タンパク質配列の注釈をつけたデータベースまたは核酸結合ドメインに対する記入を含む注釈をつけたデータベースと比較できる。また他の実施面では、非特性化された配列、例えば、注釈を付けていないゲノム配列、ESTまたは全長cDNA配列;特性化された配列、例えば、SwissProtまたはPDB;及びドメイン、例えば、Pfarm、ProDom(http://www.tooulouse.inra.fr/)、及びSMART(Simple Modular Architecture Research Tool, http://smart.embl-heidelberg.de/)のデータベースが核酸結合ドメイン配列の源泉を提供できる。問合せアミノ酸配列と比較するために核酸配列データベースを全ての6個の読み枠(reading frame)に翻訳することができる。候補核酸結合ドメインをコードするという標識をされた核酸配列は、適当な核酸源、例えば、ゲノムDNAまたは細胞RNAから増幅できる。そのような核酸配列は、発現ベクタにクローニングできる。コンピュータに基づいたドメイン同定の前記手順は、オリゴヌクレオチド合成器及びロボットシステムと連係させて高い効率でドメインをコードする核酸を生産することができる。候補ドメインをコードするクローン化された核酸は、宿主発現ベクタに貯蔵し、制限酵素媒介サブクローニングまたは部位−特異的組換え酵素媒介サブクローニング(米国特許第5,888,732号参照)によりZif268フィンガー1及び2と共に発現ベクタ、例えば、翻訳融合ベクタ内に導入させることができる。高い作業処理量のため、相異する候補核酸結合ドメインをコードする核酸を含有する複数のマイクロタイタープレートを生成するため、高効率の基盤(platform)を用いることができる。
【0043】
出発配列またはプロファイルからドメインを同定する細詳な方法は、当業界に周知である。例えば、プロサイト(〔Hofmann et al.,(1999) Nucleic Acids Res. 27:215-219〕参照)、FASTA、BLAST(〔Altschul et al.,(1990) J.Mol.Biol. 215:403-10〕参照)などが参照できる。簡単なストリング検索を遂行して問合せ配列または問合せプロファイルに対する同一性を有するアミノ酸配列を見出すことができ、例えば、Perl(http://bio.perl.org/)を使用してテキストファイルをスキャニングすることができる。このように同定された配列は、初期入力配列に対して約30%、40%、50%、60%、70%、80%、90%またはそれ以上の同一性を表すことができる。
【0044】
問合せドメインと類似したドメインを公共データベース、例えば、文献〔Altschul et al.,(1990)J.Mol.Biol. 215:403-10〕のXBLASTプログラム(バージョン2.0)を使用して同定することができる。例えば、スコア=50、単語長=3のXBLAST変数を使用してBLASTタンパク質検索を遂行することができる。文献〔Altschul et al.,(1997) Nucleic Acids Res.25(17): 3389-3402〕に記述されているように、問合せ配列または検索された配列に間隔を導入することができる。XBLAST及びGapped BLASTプログラムに対するディフォルト変数はhttp://www.ncbi.nlm.nih.govサイトで求めることができる。
【0045】
プロサイトプロファイルPS00028及びPS50157を使用してジンクフィンガードメインを同定することができる。SWISSPROT公表の80,000個のタンパク質配列において、これらプロファイルはそれぞれ3189及び2316個のジンクフィンガードメインを見出した。多様な相異する技法を使用して関連したタンパク質の多重配列アラインメントからプロファイルが構築できる。グリブスコフ(Gribskov)及びその同僚ら〔Gribskov et al.,(1990)Meth.Enzymol.183:146-159〕は記号比較表を利用し、残基頻度分布が提供された多重配列アラインメントを各位置に対する重さに転換した。例えば、プロサイトデータベース及び文献〔Luethy et al.,(1994) Protein Sci.3:139-1465〕の作業が参照できる。
【0046】
関心のあるDNA結合ドメインを代表する隠れマルコフモデル(Hidden Markov Models;HMM's)は、例えば、パーム(Pfarm)データベース、リリース2.1のようなそのようなモデルのデータベースから生成され又は得ることができる。追加的なドメインを見出すために、例えば、前記ディフォルト変数を使用してHMMでデータベースを検索することができる(例えば、ディフォルト変数のためにhttp://www.sanger.ac.uk/Software/Pfam/HMM_search参照)。または、使用者は前記変数を最適化させることができる。境界スコアを選択して配列データベースを濾過することにより、境界以上のスコアを有する配列が候補ドメインとして表示されるようにすることができる。Pfarmデータベースの説明は、文献〔Sonhammer et al.,(1997) Proteins 28(3):405-420〕で見出すことができ、HMMに関する詳細な説明は、例えば、文献〔Gribskov et al.,(1990) Meth.Enzymol.183:146-159; Gribskovetal., (1987) Proc.Natl.Acad.Sci.USA 84:4355-4358; Krogh et al.,(1994) J.Mol.Biol.235:1501-1531;及びStultz et al.,(1993) Protein Sci.2:305-314〕で見出すことができる。
【0047】
HMMのSMARTデータベース(Simple Modular Architecture Research Tool, http://smart.embl-heidelberg.de/;文献〔Schultz et al.,(1998) Proc. Natl. Acad. Sci.USA 95:5857;及びSchultz et al.,(2000) Nucl.Acids Res 28:231〕)は、HMMer2検索プログラム(文献〔Durbin et al.,(1998) Biological sequence analysis: probabilistic models of proteins and nucleic acids. Cambridge University Press.〕;http://hmmer.wustl.edu/)のヒドン・マルコフモデルでプロファイルすることにより同定されたジンクフィンガードメインのカタログ(ZnF_C2H2;ZnF_C2C2;ZnF_C2HC;ZnF_C3H1;ZnF_C4;ZnF_CHCC;ZnF_GATA;及びZnF_NFX)を提供する。
【0048】
ハイブリダイゼーションに基づいた方法。多様な形態のDNA結合ドメインをコードする核酸集合体を分析してアミノ末端及びカルボキシ末端の保存された境界配列をコードする配列プロファイルを得ることができる。そのような保存された境界配列をコードする核酸配列に混成化できる縮重オリゴヌクレオチドが設計できる。また、そのような縮重オリゴヌクレオチドの有効性はそれらの組成と公知となったゲノム配列上の可能なアニーリング部位の頻度を比較することにより評価され得る。複数反復された設計により縮重オリゴヌクレオチドを最適化することができる。例えば、公知のCys2−His2ジンクフィンガーを比較することにより、天然配列中の隣接フィンガー間のリンカー地域の共通配列が明らかになった(文献〔Agata et al.,(1998) Gene 213:55-64〕参照)。そのような縮重オリゴヌクレオチドは、複数のDNA結合ドメインを増幅させるのに使用される。増幅されたドメインを試験ジンクフィンガードメインとしてハイブリッド核酸に挿入し、後続的に、本明細書に記述された方法により標的部位への結合を分析する。
【0049】
ライブラリー設計
この方法は、DNA結合ドメインをコードする核酸の集合体(例えば、プラスミド、ファージミドまたはフアージライブラリーの形態)において機能的核酸結合特性のスクリーニングを可能にする。前記集合体は、多様な群のDNA結合ドメインがコードでき、更には相異する構造的折りたたみを有するドメインもコードできる。一例として、前記集合体はジンクフィンガードメインのような単一の構造的折りたたみのドメインをコードする。下記方法が、ジンクフィンガードメインに関して記述されたが、当業者であれば、これを他の類型の核酸結合ドメインに応用できるはずである。
【0050】
ドメイン突然変異。さらに一例において、前記核酸集合体は、縮重パターンライブラリーから組立てられる構造ドメインをコードする核酸で構成される。例えば、ジンクフィンガーの場合、公知ジンクフィンガーのアラインメントを、各位置における最も適合したアミノ酸を同定するために用いることができる。別法として、構造的研究及び突然変異誘発(mutagenesis)実験を、各位置のアミノ酸の望ましい特性を決定するために用いることができる。任意の核酸結合ドメインを、突然変異を導入するための構造的基盤として用いることができる。特に、核酸と結合する部位に非常に近接した位置またはそのような位置に隣接した位置を突然変異誘発のための標的にすることができる。パターン化された縮重ライブラリーを使用することにより、突然変異した試験ジンクフィンガードメインを、突然変異位置における可能なアミノ酸の小集団に限定することができる。各位置に前記プロファイルをコードするために縮重コドンセットを使用することができる。例えば、疎水性残基のみを、脂肪族残基のみをまたは親水性残基のみをコードするコドンセットが利用可能である。折りたたまれたポリペプチドをコードする全長クローンについて、前記ライブラリーを選別することができる。文献〔Cho et al.,(2000) J.Mol.Biol. 297(2):309-19〕では、縮重オリゴヌクレオチドを使用してそのような縮重ライブラリーを製造する方法を提供し、また全長ポリペプチドをコードするライブラリー核酸を選別する方法を提供する。このような核酸は本明細書に記載された選別法のために、便利な制限酵素切断部位または転位酵素(transposase)または組換え酵素(recombinase)認識部位を使用して発現プラスミドに容易に挿入することができる。
【0051】
適当なコドン及び所定の位置における各ヌクレオチドの相対比率の選択は、遺伝子コードを表す表を簡単に調査したり、または電算的アルゴリズムにより決定できる。例えば、前記チョー(Cho)らの文献には、要望される縮重タンパク質配列を受け付け、その配列をコードする望ましいオリゴヌクレオチド設計を出力する電算プログラムが記載されている。
【0052】
天然の種類のドメインの単離。ドメインライブラリーをヒトのような真核生物のゲノムDNAまたはcDNAから構築することができる。このために複数の方法が可能である。例えば、前記したように、利用可能なアミノ酸配列のコンピューター検索によりドメインが同定できる。各ドメインをコードする核酸を単離し、例えば、プロモーター、活性化ドメイン及び選別マーカーを含有するベクターのような、細胞内での発現に適当なベクターに挿入することができる。また他の例において、保存されたモチーフにハイブリダイズする縮重オリゴヌクレオチドを、例えば、PCRによりこのモチーフを含有する複数の関連ドメインを増幅するために用いることができる。例えば、クルペル様Cys2His2ジンクフィンガーを、文献〔Agata et al.,(1998) Gene 213:55-64〕の方法により増幅することができる。この方法はまた、例えば、Thr−Gly−(Glu/Gln)−(Lys/Arg)−Pro−(Tyr/Phe)(配列番号78)のようなパターンを有する配列である、ジンクフィンガードメインの自然発生的リンカーペプチド配列を保持する。さらに、この方法は関心のあるドメインに限定された集合体のスクリーニングであるゆえに、選択されていないゲノムライブラリーまたはcDNA配列のライブラリーのスクリーニングとは異なり、ライブラリーの複雑性が非常に減少され、大規模ライブラリーを完全にスクリーニングすることの様的な困難のために望ましい配列を逃す可能性を減少させる。
【0053】
ヒトゲノムは、多様なジンクフィンガードメインを含有し、このうちの多くは特徴づけされず、かつ同定されていない。ジンクフィンガードメインを有するタンパク質をコードする数千個の遺伝子があると推定される〔Pellegrino and Berg,(1991) Proc.Natl.Acad.Sci. USA 88:671-675〕。これらヒトジンクフィンガードメインは、新規のDNA−結合タンパク質が構築され得る多様なドメインの広範囲な集合体である。各ジンクフィンガードメインが独特の3−乃至4−bp配列を認識する場合、全ての可能な3−乃至4−bp配列に結合するのに必要なドメインの総数は単に64乃至256(43乃至44)個である。ヒトゲノムの天然レパートリーが、全ての可能な認識部位に及ぶために、充分な数の独特のジンクフィンガードメインを含有している可能性がある。これらジンクフィンガードメインは人工キメラDNA結合タンパク質を構築するための価値あるソースである。自然発生のジンクフィンガードメインは、ヒトゲノムに由来する人工的突然変異とは異なり、自然選択圧下で進化したものであり、したがって、特定のDNA配列への結合及び生体内機能のために自然的に最適化されたものであり得る。
【0054】
ヒトジンクフィンガードメインは、例えば、遺伝子治療の応用において、人体に導入された場合に免疫応答を誘導する可能性が遥かに少ない。
【0055】
特定DNA結合特性を有するジンクフィンガードメインの生体内選別
所望のDNA認識特性を有するジンクフィンガードメインを次のような生体内スクリーニングシステムを使用して同定することができる。問題の複合結合部位をリポーター遺伝子の上流に挿入し、複合結合部位に転写活性化ドメインを誘引・招集することにより、リポーター遺伝子の転写が所定レベル以上に増加するようにした。固定されたDNA結合ドメインに融合された試験ジンクフィンガードメイン及び転写活性化ドメインで構成されたハイブリッドタンパク質をコードする発現プラスミドを構築した。
【0056】
複合結合部位は、少なくとも二つの要素、すなわち、招集部位及び標的部位からなる。このシステムで固定されたDNA結合ドメインが招集部位を認識するように設計される。しかし、招集部位に対する固定されたDNA結合ドメインの結合親和度は、生体内で単独にはリポーター遺伝子を転写活性化させるのに不充分な程度である。これは、対照群の実験により確認することができる。
【0057】
例えば、細胞内で発現された場合、固定されたDNA結合ドメインは(試験ジンクフィンガードメインの不在、または非機能的であると知られたり、または公知となったDNA接触残基がアラニンのような代替アミノ酸で置換された試験ジンクフィンガードメインの存在下では)リポーター遺伝子の転写を通常のレベル以上に活性化させられてはならない。他の手段により(例えば、リポーターに対する競争的抑制剤の使用により)システムの敏感度を増加させることができるため、若干の漏出または低いレベルの活性化は許容される。固定されたDNA結合ドメインは、招集部位に安定的に結合しないことと予想される。例えば、固定されたDNA結合ドメインは約0.1nM、1nM、1μM、10μM、100μMまたはそれ以上の解離定数(Kd)で招集部位に結合することができる。標的部位に対するDNA結合ドメインのKdは、試験ジンクフィンガードメインの不在下でまたは第2標的部位に対する特異性を有する試験ジンクフィンガードメインの不在下で、電気泳動移動検定(electrophoretic mobility shift assay;EMSA)により試験管内で測定可能である。
【0058】
したがって、ハイブリッドタンパク質が細胞内複合結合部位に安定的に結合し、これによりリポーター遺伝子を活性化させるためには、例えば、複合結合部位の多様な部位等の標的部位を認識する機能的(functional)試験ジンクフィンガードメインの付着が必要である。標的部位に対する試験ジンクフィンガードメインの結合優先度により所定レベルに比べて増加したリポーター遺伝子発現をもたらす。例えば、観察された発現レベルを所定レベルで割って得られるリポーター遺伝子発現の増加倍数は約2、4、8、20、50、100、1000倍またはそれ以上であり得る。試験ジンクフィンガードメインが標的部位を認識する場合、DNA結合ドメイン及び試験ジンクフィンガードメインを含む転写因子のKdは、例えば、標的部位に対する特異性を有する試験ジンクフィンガードメインを欠如した転写因子に比べて増加する。例えば、特異性を有する標的部位と複合体を成した転写因子の解離定数(Kd)は約50nM、10nM、1nM、0.1nM、0.01nMまたはそれ未満であり得る。Kdは試験管内EMSAにより決定され得る。
【0059】
試験ジンクフィンガードメインが固定DNA結合ドメインの生体内結合親和性を増大させる能力を測定することにより、敏感で正確にDNA結合特異性が検査できるこのような発見は、ヒトゲノムから新規ジンクフィンガードメインの迅速な単離及び特性化を可能にする。
【0060】
固定されたDNA結合ドメインは、すなわち、例えば、複数のドメインを有するか、またはオリゴマーである自然発生的DNA−結合タンパク質等の自然発生のDNA−結合タンパク質から単離された単位的ドメインを含む。例えば、Zif268のフィンガー1及び2のような二つの公知のジンクフィンガーの両方を、固定されたDNA結合ドメインとして使用することができる。当業者であれば、数多くの核酸結合ドメイン(例えば、ホメオドメイン、ヘリックス−ターン−ヘリックスドメインまたはヘリックス−ループ−ヘリックスドメインのような本明細書に記載されたドメインファミリー、または当業界で特性が知られた核酸結合ドメイン)からシステムに好適な固定DNA結合ドメインを同定することができるはずである。固定されたDNA結合ドメインにより認識される招集部位の適切な選択が更に要求される。招集部位は、固定されたDNA結合ドメインが得られた自然発生のDNA結合タンパク質に対する天然の結合部位内の下位部位(subsite)であり得る。必要に応じて、固定ドメインまたは招集部位に突然変異を導入してシステムの敏感性を増加させることができる。
【0061】
生体内のスクリーニングシステムに適合した細胞には真核細胞及び原核細胞全てが含まれる。例示的な真核細胞には、例えば、サッカロマイセス・セレビジエ(Saccharomyces cerevisiae)、サッカロマイセス・ポムベ(Saccharomyces pombe)及びピッチア・パストリス(Pichia pastoris)細胞のような酵母細胞などがある。
【0062】
前記スクリーニングシステムを使用してジンクフィンガードメインを選択するために、サッカロマイセス・セレビジエを使用する酵母ワン−ハイブリッドシステムを変形させた。まず、HIS3リポーター遺伝子をコードするリポータープラスミドを調製した。予め決定された4−bp標的DNA配列を、切断された結合配列に連結させてDNA−結合ドメインについての複合結合配列を提供し、それぞれの複合結合配列を別個のプラスミド上のリポーター遺伝子に作動可能に連結させた。
【0063】
ハイブリッド核酸配列は、切断されたDNA結合ドメイン及びジンクフィンガードメインを含むDNA結合ドメインに連結された転写活性化ドメインをコードする。
【0064】
本願で使用された結合部位は、隣接した(連続的な)部位が頻繁に使用されるが、必ずしも隣接する必要はない。隣接していない部位を認識するタンパク質を調製するためには、核酸結合ドメイン間に伸縮性があるか、及び/又は、伸張性があるリンカーを使用し得る。
【0065】
本発明の一態様によれば、Zif268のフィンガー1及びフィンガー2で構成され、フィンガー3が欠如されたポリペプチドを固定されたDNA結合ドメインとして使用することができる(Zif268の3個のジンクフィンガー中、フィンガー1はN−末端、フィンガー2は中間、フィンガー3はC−末端に位置するジンクフィンガードメインを指す)。また、結合部位が特徴づけられた如何なる2個のジンクフィンガードメインでも固定されたDNA結合ドメインとして使用することができる。
【0066】
他の有用な固定されたDNA結合ドメインは他のジンクフィンガータンパク質、例えば、Sp1、CF2−II、YY1、クルペル(Kruppel)、WT1、Egr2、またはPOU−ドメインタンパク質、例えば、Oct1、Oct2、及びPit1から由来し得る。しかし、これらは例として提供されたものであり、本発明はこれらに限定されない。
【0067】
本発明の一具体的な実施例によれば、最適のZif268認識配列(5′−GCG TGG GCG−3′)の5′末端から4−bpを欠損させて生成された5′−GGGCG−3′塩基配列が招集部位として使用され得る。3乃至4bpのいかなる標的配列でも、これら招集部位に連結されて複合結合配列が生成できる。
【0068】
活性化ドメイン。本発明で使用することができる転写活性化ドメインは、酵母のGal4活性化ドメイン及びヘルペスシンプルレックスウイルスのVP16ドメインを含むが、これに限定されない。バクテリアにおいて活性化ドメインの機能は、野生型RNAポリメラーゼαサブユニットC−末端ドメインまたは突然変異体αサブユニットC−末端ドメインを招集できる融合ドメイン(例えば、タンパク質相互作用ドメインに融合されたC−末端ドメイン)により摸倣できる。
【0069】
抑制ドメイン。所望であれば、活性化ドメインの代りに抑制ドメインがDNA結合ドメインに融合され得る。真核細胞抑制ドメインの例には、オレンジ(ORANGE)、グローチョー(groucho)、及びWRPW〔Dawson et al (1995) Mol.Cell Biol. 15:6923-31〕が含まれる。抑制ドメインを使用する時は、毒性リポーター遺伝子及び(または)非選択性マーカーを使用して減少した発現を示す個体をスクリーニングすることができる。
【0070】
リポーター遺伝子。リポーター遺伝子は、例えば、薬物耐性を付与する遺伝子、または栄養要求性マーカーのような選択性マーカーであり得る。薬物耐性遺伝子の例には、サッカロマイセス・セレビシエ(S. cerevisiae)シクロヘキサミド耐性遺伝子(CYH)、サッカロマイセス・セレビシエカナバニン耐性遺伝子(CAN1)、及びハイグロマイシン耐性遺伝子などがある。サッカロマイセス・セレビシエ栄養要求性マーカーには、URA3、HIS3、LEU2、ADE2及びTRP1遺伝子などがある。栄養要求性マーカーがリポーター遺伝子である時は、栄養要求性遺伝子の機能的コピーが欠けているため、特定代謝物質が生産できる能力が欠如された細胞が使用される。代謝物質が欠如した培地で細胞を維持することにより、標的部位に結合する試験ジンクフィンガードメインをコードする構築物の選択が可能である。例えば、HIS3遺伝子はhis3−酵母菌株と共に選択性マーカーとして使用され得る。ハイブリッド転写因子をコードする構築物の導入後に、細胞をヒスチジン欠乏培地上で成長させる。哺乳類細胞の選択可能マーカーには、例えば、チミジンキナーゼ、ネオマイシン耐性、及びHPRTが当業者によく知られている。
【0071】
別法として、リポーター遺伝子がコードするタンパク質の存在を容易に確認し、及び/又は定量化することができる。そのようなリポーター遺伝子の例には、lacZ、クロラムフェニコールアセチルトランスフェラーゼ(CAT)、ルシファラーゼ、緑色蛍光タンパク質(GFP)、β−グルクロニダーゼ(GUS)、青色蛍光タンパク質(BFP)及び例えば、変更されたり向上した蛍光特性を有するGFP誘導体〔Clontech Laboratories,Inc., CA〕などがある。lacZを発現する細胞のコロニーは比色基質X−galを含むプレートでコロニーを成長させることにより検出することができる。GFP発現は、励起の上、蛍光放出を測定して検出することができる。個々のGFP発現細胞は蛍光活性化細胞分類機(FACS)を使用して同定され、分離され得る。
【0072】
このシステムは、2種類のリポーター遺伝子(例えば、選択可能リポーター遺伝子及び選択不可能リポーター遺伝子)を利用して構築され得る。選択可能マーカーは、適当な成長条件下で所望のドメインを有する細胞のみが成長するようにするので、所望のドメインの迅速な同定を容易にする。選択不可能リポーターは、例えば、偽陽性を区別するための確認手段、及び結合程度を定量化する手段を提供する。前記二つのリポーターは、ゲノムの互いに異なる位置に挿入されることができ、ゲノムに直列に挿入されることができ、同一の染色体外の要素(例えば、プラスミド)に含まれたり、または互いに異なる染色体外要素に含まれることができる。
【0073】
図5は、所望のジンクフィンガードメインを選別するために使用された変形したワン−ハイブリッドシステムの原理を示す。ハイブリッド転写因子のDNA結合部位は(a)Zif268のフィンガー1及びフィンガー2からなる切断されたDNA結合部位と(b)ジンクフィンガードメインAまたはBで構成される。リポーター遺伝子のプロモーター領域に位置した結合部位の塩基配列は、4bpの標的配列(ヌクレオチド1−4,5′−XXXX−3′)及び切断された結合配列(ヌクレオチド5−9,5′−GGGCG−3′)からなる複合結合配列(5′−XXXXGGGCG−3′)である。
【0074】
ハイブリッド転写因子内の試験ジンクフィンガードメイン(図5のA)が標的配列を認識するならば、ハイブリッド転写因子は複合結合配列に安定に結合できる。このような安定した結合はハイブリッド転写因子の活性化ドメインの作用(図5のAD)を通じてリポーター遺伝子の発現をもたらす。その結果、HIS3がリポーター遺伝子として使用された時、形質転換酵母はヒスチジンが欠如された培地で成長する。または、lacZがリポーター遺伝子として使用された時には、形質転換酵母はlacZタンパク質の基質であるX−galを含む培地で青色コロニーとして育つ。しかし、ハイブリッド転写因子のジンクフィンガードメイン(図5のB)が標的配列を認識するのに失敗すれば、リポーター遺伝子の発現は誘導されない。その結果、形質転換酵母はヒスチジンを欠如した培地で成長できないか(HIS3がリポーター遺伝子として使用された時)、またはX−galを含む培地で白色コロニーとして成長するようになる(lacZがリポーター遺伝子として使用された時)。
【0075】
この改変されたワン−ハイブリッドシステムを利用する選別法は、この過程を通じて選別されたジンクフィンガードメインが細胞内環境で機能的であると立証されたため、有利である。したがって、このドメインは恐らく折りたたまれ、核に入ることができ、細胞内プロテアーゼ及び損傷が与えられる他の可能な細胞内物質に対して耐えられると推測される。その上、本願で開示された改変されたワン−ハイブリッドシステムは、所望のジンクフィンガードメインの簡単で迅速な単離を可能にする。本願の改変されたワン−ハイブリッドシステムでは、所望のジンクフィンガードメインを単離するために単1回の酵母形質転換のみを必要とする。
【0076】
本願で記述された選別法は、例えば、植物または動物(例えば、哺乳類、例えば、ヒト)種のゲノム等のゲノムからジンクフィンガードメインを同定するのに使用することができる。また、本方法は、例えば、無作為突然変異法により調製された突然変異ジンクフィンガードメインのライブラリーからジンクフィンガードメインを同定するのに使用することができる。また、前記2つの方法は一緒に使用され得る。例えば、特定3−bpまたは4−bpDNA配列に対するジンクフィンガードメインがヒトゲノムから単離されなかった場合に、無作為または部位指示的突然変異誘導により調製されたジンクフィンガードメインのライブラリーを前記ドメインについてスクリーニングすることができる。
【0077】
酵母における改変されたワン−ハイブリッドシステムが与えられた標的配列を認識し、結合するジンクフィンガードメインを選別するために望ましい方法であるが、当業者ならば酵母ワン−ハイブリッド選別法以外に他のシステムが使用され得ることが明らかなはずである。例えば、真核生物体のゲノムから由来した自然的に発見されるジンクフィンガードメインのライブラリーをスクリーニングするのにファージディスプレイ選別法が使用されることもある。
【0078】
本発明は、多様な培養細胞にワン−ハイブリッド法を使用することを含む。例えば、標的配列に作動可能に連結されたリポーター遺伝子を培養中の原核細胞または動物または植物細胞に導入でき、そして、培養細胞をジンクフィンガードメインのライブラリーをコードするプラスミド、ファージ、またはウイルスで形質移入することができる。その後、リポーター遺伝子が活性化された単離された細胞から、標的配列を認識する所望のジンクフィンガードメインを得ることができる。
【0079】
下記に示された実施例は、前記方法が関心のある結合部位を認識するジンクフィンガードメインが同定できることを証明する。フィンガー3に位置した多様なジンクフィンガードメインを有するハイブリッド転写因子のライブラリーを調製した。前記ライブラリーから選別された新規なジンクフィンガードメイン(例えば、HSNK、QSTV、及びVSTRジンクフィンガー;後述する)中、いずれのものも相当する親フィンガータンパク質ではC−末端に天然には位置しなかった。これは、ジンクフィンガードメインは単位的(モジュール性)ということと、ジンクフィンガードメインを適切に混合し、配列して新規なDNA結合ドメインが構成できるということを明確に証明する。
【0080】
本発明の方法により選別されたジンクフィンガードメインは、適切な再配列及び組換えにより新規なDNA結合タンパク質を作るための組立単位として使用され得る。例えば、HIV−1の共受容体であるヒトCCR5のプロモーター領域を認識する新規なDNA結合タンパク質を次のように構築することができる。ヒトCCR5のプロモーター領域は、5′−AGG GTG GAG T−3′(配列番号4)(図6)の10−bp配列を含む。本願で開示された改変されたワン−ハイブリッドシステムを使用し、特異的にそれぞれ5′−AGGG−3′、5′−GTGG−3′、及び5′−GAGT−3′の4−bp標的配列中の一つを認識する3個のジンクフィンガードメインが単離できる。これら標的配列はCCR5標的配列中、オーバーラップする4−bp断片である。これら3個のジンクフィンガードメインを適切なリンカーで連結し、調節ドメイン(例えば、VP16ドメイン及びGAL4)または抑制ドメイン(例えば、KRAB)に付着させ、CCR5プロモーターに特異的に結合する新規の転写因子が生成できる。これらジンクフィンガータンパク質はHIV−1増殖の防止を助けるために遺伝子治療に使用されることができる。
【0081】
高効率スクリーニング
下記方法は、複数の可能性のあるDNA結合部位や、更には全ての可能なDNA結合部位に対する集合体内の各ドメインの相対的生体内結合親和性の迅速な測定を可能にする。核酸結合ドメインをコードする核酸の大規模集合体を製造した。各核酸結合ドメインはハイブリッド核酸構築物で試験ジンクフィンガードメインとしてコードされ、一つの交配型の酵母菌株で発現される。これにより、全ての可能なまたは所望のドメインを発現する第1セットの酵母菌株が製造される。リポーター構築物内に前記ドメインの推定標的部位についてのリポーター構築物を含有する酵母菌株の第2セットを反対の交配型で製造する。それぞれ異なる試験ジンクフィンガードメインと異なる標的部位リポーター構築物を有する、融合された細胞のマトリックスを生成するために、本方法は、複数のまたは全ての可能性のある対交配の遂行を要求する。それぞれの融合された細胞について、リポーター遺伝子の発現が測定される。これにより本方法は迅速で難しくなく試験されるドメインらの結合優先性を決定する。
【0082】
例えば、与えられたプロファイルに一致する推定ドメインをゲノムデータベースを調査することにより、ドメインの集合体が同定された。前記集合体は、例えば、10〜20個のドメイン、または全ての同定されたドメイン、可能には、数千個またはそれ以上を含む。データベースで同定された、ドメインをコードする核酸は、合成オリゴヌクレオチドを使用して増幅する。前記合成オリゴヌクレオチドを設計する手作業のまたは自動化された方法は、本技術分野で通常のことである。追加的なドメインをコードする核酸は縮重プライマーで増幅され得る。前記集合体のドメインをコードする核酸を前記記述された酵母発現プラスミドにクローニングして、このドメインとZif268の初めの二つのフィンガー及び転写活性ドメインとの融合タンパク質が生成できる。複数のドメインをコードする核酸をクローニングするために増幅及びクローニング工程をマイクロタイタープレート形式で行う。
【0083】
または、酵母発現ベクタに前記ドメインをコードする複数の増幅された核酸を速かに挿入するために組換えクローニング方法を使用することができる。この方法は、米国特許第5,888,732及び「ゲートウェイ」マニュアル(Life Technologies-Invitrogen、CA、USA)に記述されており、増幅プライマー端に位置−特異的組換え酵素(recombinase)のための必要に応じた部位を含めることを必要とする。発現ベクターは、ドメインをコードする増幅された核酸が挿入される位置に追加的な部位を含む。これらの部位は終結コドンが欠如されるように設計された。増幅産物、発現ベクター、及び部位特異的な組換え酵素の添加は、組換え反応による増幅された配列のベクターへの挿入をもたらす。例えば、首尾のよい挿入で毒性遺伝子が置換される等の追加的な特徴は、この方法を効率の高いものとし、高効率の生体内スクリーニングに好適なものとする。
【0084】
制限酵素媒介の及び/又は組換えのクローニングは、それぞれの確認されたドメインをコードする核酸を発現ベクターに挿入するのに使用され得る。このベクターはバクテリア中で増殖でき、索引されたマイクロタイタープレートで凍結できるため、それぞれのウェルが互いに異なる、唯一無二なDNA結合ドメイン中の一つをコードする一つの核酸を有している一つの細胞を含めることができる。
【0085】
それぞれのドメインについて単離されたプラスミドDNAを得て、一つの酵母細胞、例えば、サッカロマイセス・セレビシエMATa細胞に形質転換させる。発現ベクタが選択可能マーカーを有しているため、形質転換された細胞はマーカーが選別できる栄養条件の最小培地で育つことができる。前記細胞を後日の使用のために、例えば、マイクロタイタープレートで凍結貯蔵することができる。
【0086】
酵母菌株の第2セットを、例えば、サッカロマイセス・セレビシエMATα細胞に構築する。この酵母菌株セットは多様な相異するリポーターベクターを含む。その後、唯一なDNA結合ドメインを有する発現ベクタを含有するそれぞれの酵母菌株を前記リポーター遺伝子セットのそれぞれの酵母菌株と交配させる。これら2菌株は互いに反対の交配型であり、互いに異なる栄養要求性を有するように遺伝子操作されたため、二倍体が容易に選別できる。このような二倍体はリポーター及び発現ベクターの両方を有する。この細胞はまた、リポーター及び発現プラスミドの両方共が選別できる栄養条件下で維持される。ユエツら(2000, Nature 403:623-7)は、このような酵母交配のマトリックスを作製し、全ての酵母タンパク質の完壁なツー−ハイブリッド地図を記述している。
【0087】
リポーター遺伝子発現は、高容量の形式(例えば、マイクロタイタープレート)でも感知できる。例えば、GFPをリポーターとして使用する時、交配された細胞のマトリックスを含むプレートを蛍光についてスキャンできる。
【0088】
新規なDNA結合タンパク質の単位体の組立
適切なジンクフィンガードメインを混合し、配合して目的の9−bpまたはそれ以上のDNA配列を認識する新たなDNA結合タンパク質を合理的に構築することができる。ジンクフィンガードメインの単位体的構造は、新たなDNA結合タンパク質を構築するためのそれらの再配列を容易にする。図1に示されているように、天然に生成されるZif268タンパク質におけるジンクフィンガードメインはDNA二重螺旋に沿って一列で位置する。それぞれのドメインは相異する3−4bpDNAセグメントを独立に認識する。
【0089】
ジンクフィンガードメインのデータベース。前述のワン−ハイブリッド選別システムは可能な3−4塩基対結合部位のそれぞれに対し、一つ以上のジンクフィンガードメインを同定するのに使用され得る。その結果は、マトリックスまたはデータベース(例えば、相関的なデータベース)として貯蔵され得る。データベースはそれぞれの部位に結合するジンクフィンガードメインの相対的な親和性についての指示事項を含んでいてもよい。
【0090】
また、前記ジンクフィンガードメインらの標的配列特異性を立証するために、これらを複数の相異する融合タンパク質に融合された状況で検査できる。さらに、少量のドメインのみが利用可能な特定の結合部位は、追加的な選別スクリーニングの標的となり得る。このような選別のためのライブラリーは、類似しているが明確に区別される結合部位に結合するジンクフィンガードメインに突然変異を誘導して調製できる。可能性のあるドメインを最大に活用するために、標的結合部位に対してドメインを交叉させることができるため、それぞれの可能な結合部位に対するジンクフィンガードメインの完全なマトリックスは必須なものではない。このような交叉は、最も有用な3−4塩基対結合部位における結合部位を分析し、更にまたジンクフィンガードメイン間のリンカーの長さを変化させることにより達成できる。設計されたポリペプチドが部位選択性及び高い親和度を全て有するようにするためには、所望の部位に対し、高い特異性を有するジンクフィンガードメインの両側を、更に高い親和度を有するが、特異性が劣る他のドメインと接するように連結させることができる。本願で記述された生体内スクリーニング方法は、人工的に組立てられたジンクフィンガータンパク質及びこれらの誘導体の生体内機能、親和性、及び特異性を試験するのに利用できる。同様に、本方法は、例えば、多様なリンカー組成のライブラリー、ジンクフィンガードメイン単位体のライブラリー、ジンクフィンガードメイン組成のライブラリーなどのライブラリーを製造すること等により、組立されたタンパク質を最適化するのに使用され得る。
【0091】
標的部位の分解。標的9−bpまたはそれ以上のDNA配列は、3−4bpのセグメントに分解される。それぞれの分解された3−4bpセグメントを認識するジンクフィンガードメインを同定する(例えば、前記にて言及のデータベースから)。例えば、20bp乃至500bp配列の、より長い標的配列も、その配列内で9bp、12bp、及び15bp下位配列を同定することができるため、標的配列として適している。特に、データベースによく現れている部位に分解できる下位配列は、最初の設計標的として機能できる。
【0092】
組立された単位体の製造。隣接した3−4bp下位部位または近傍の下位部位を認識する複数のジンクフィンガードメインを含むようにポリペプチドを設計する。設計されたポリペプチド配列をコードする核酸配列は、合成することができる。合成遺伝子を構築することは、この技術分野では日常的なことである。そのような方法には、必要に応じて合成されたオリゴヌクレオチド、PCR媒介されたクローニング、及びメガプライマーPCRからの遺伝子構築などがある。例えば、ライブラリーを形成するため、複数の核酸配列を合成することができる。その認識特異性が前記位置に適合する異なったジンクフィンガードメインをコードするように任意の与えられた位置で変化するドメインをコード核酸ライブラリーを設計できる。各位置でジンクフィンガードメインの同一性を変化させるために、セクシュアル(Sexual)PCR及び「DNAシャッフリングTM」(Maxygen, Inc., CA)が使用され得る。
【0093】
ペプチドリンカー。DNA結合ドメインは、多様なリンカーにより連結され得る。リンカーの有用性と設計はこの技術分野でよく知られている。特に有用なリンカーは核酸によりコードされるペプチドリンカーである。したがって、第一のDNA結合ドメイン、ペプチドリンカー、及び第二のDNA結合ドメインをコードする合成遺伝子を構築することができる。このような設計は大規模の人工の複数−ドメインDNA結合タンパク質を構築するために反復できる。PCT WO 99/45132及びキム及びパボ(1998, Proc. Natl. Acad. Sci. USA 95:2812-7)は、ジンクフィンガードメインらを連結するのに好適なペプチドリンカーの設計を記述している。
【0094】
ランダムコイル、α−ヘリックス、又はβ−プリーツの3次構造を形成する追加的なペプチドリンカーが使用できる。好ましい柔軟性のあるリンカーを形成するポリペプチドは、この技術分野でよく知られている〔例えば、Robinson and Sauer(1998) Proc. Natl. Acad. Sci. USA. 95:5929-34参照〕。柔軟性のあるリンカーは、典型的にグリシンを含むが、これはグリシンアミノ酸が側鎖が欠如されていて回転自由度のある唯一なアミノ酸であるためである。親水性を増加させるために、セリンまたはトレオニンをリンカーに挿入することができる。併せて、結合親和性を増加させるためにDNAのリン酸骨格と相互作用可能なアミノ酸が使用され得る。前記アミノ酸の賢明な使用により、親和性を上げることと配列特異性が減少することの間のバランスを取ることができる。仮りに、リンカーとして、厳格な伸張性が望ましいのであれば、文献〔Pantoliano et al.(1991) Biochem. 30:10117-10125〕に記述された螺旋リンカーのようなα−ヘリックスリンカーを使用することができる。また、リンカーはコンピュータモデリングにより設計できる(米国特許第4,946,778参照)。分子モデリングのためのソフトウェアを購入して使用することができる〔例えば、Molecular Simulations, Inc., San Diego, CAから〕。このようなリンカーは、標準的な突然変異誘導技術及びタンパク質工学の技術分野で用いられる生物理学的テストを利用し、本願に記述された機能的分析を使用し、任意に最適化、すなわち、例えば、抗原性を減少させるか、及び/又は安定性を増加させることができる。
【0095】
ジンクフィンガードメインを活用した実施のために、ジンクフィンガー間で天然に生成されるタンパク質を、フィンガーを互いに連結するのに使用することができる。前記天然に生成されるリンカーとして典型的なものは、Thr−Gly−(Glu−Gln)−(Lys−Arg)−Pro−(Tyr−Phe)(配列番号78)である(agata et al. 前記参照)。
【0096】
二量体化ドメイン。DNA結合ドメインを連結する他の方法は、二量体化ドメイン、特に異種二量体化ドメイン〔Pomerantz et al.(1998) Biochemistry 37:965-970参照〕を使用することである。この実施態様では、DNA結合ドメインが別個のポリペプチド鎖中に存在する。例えば、第一のポリペプチドは、DNA結合ドメインA、リンカー及びドメインBをコードする反面、第二のポリペプチドは、ドメインC、リンカー及びドメインDをコードする。当業者は、特性が明らかになった多くの二量体化ドメインから一つの二量体化ドメインを選択することができる。同種二量体が望ましくないとすれば、異種二量体化を好むドメインを使用することができる。特に適用可能な二量体化ドメインは、コイル化されたコイルモチーフ(例えば、二量体平行または逆平行コイル化されたコイル)である。優先的に異種二量体を形成するコイル化されたコイルをまた利用することができる〔Lumb and Kim、(1995) Biochemistry 34:8642-8648〕。二量体化ドメインの他の種類であって二量体化が小分子により、または信号伝達経路を通じて誘発されるものがある。例えば、FK506の二量化形態は、二つのFK506結合タンパク質(FKBP)ドメインを二量体化するのに使用され得る。このような二量体化ドメインは追加的な調節工程を提供するために利用され得る。
【0097】
機能性検査(Functional Assays)及び使用
生化学的検査に加えて、核酸結合ドメインまたは本願で記述された方法(例えば、単位体組立)により設計されたタンパク質の機能を生体内で検査できる。例えば、標的部位(例えば、細胞増殖に必要な遺伝子のプロモーター部位)に結合するドメインが選択され得る。単位体組立により、(1)標的プロモーター部位にまたがる下位部位にそれぞれ結合するように選択されたドメイン及び(2)DNA抑制ドメイン(例えば、WRPWドメイン)を含むタンパク質が設計できる。
【0098】
設計されたタンパク質をコードする核酸配列は、例えば、Kang及びKimの文献〔2000, J. Biol. Chem. 275:8742〕により記述された誘導性発現ベクターなどの発現ベクターにクローニングできる。このような構造体を組織培養細胞または胚性幹細胞に形質感染させることにより、対象モデルとしてのトランスジェニック組織が生成できる。このようなトランスジェニック動物モデルでタンパク質の発現を誘導し、組織培養細胞の細胞増殖を調査したり、または発生学的変化及び(または)腫瘍成長を調査して、設計されたタンパク質の効率が決定できる。併せて、標的にした遺伝子の発現レベルは、例えば、RT−PCRまたはノーザンブロットのようなmRNAを検出する一般的な方法により検査できる。更に完壁な測定のためには設計されたタンパク質を発現する細胞と発現しない細胞からmRNAを精製する。このようなmRNAの二つのプールを利用して、大規模な遺伝子集合物(例えば、関心のある条件(例えば、癌)に関係した遺伝子の集合物または生物体のゲノムで同定された遺伝子の集合物)に対するプローブを含有するマイクロアレイを探知する。このような検査は、設計されたタンパク質の特異性を決定するのに特に有用である。万が一、設計されたタンパク質が高い親和度を有するものの、低い特異性を有すれば、予想される標的遺伝子以外に遺伝子の発現にも影響を与えて多面的で望ましくない効果を持たらすことがある。このような効果は転写物の全体的な分析により明らかになる。
【0099】
加えて、設計されたタンパク質は、内生の遺伝子を調節するために、対象細胞又は対象組織中で産生することができる。設計されたタンパク質は、内生の遺伝子の領域に結合させるため、及び転写活性化又は抑制機能を与えるために、上記のように改変される。Kang及びKim(上記)に記載されているように、プロモーターの誘導物質の濃度を調整することにより、内生の遺伝子の発現を、濃度依存的方法で調節することができる。
【0100】
結合部位優先性検査
各ドメインの結合部位優先性は、EMSA、DNaseフットプリント法(footprinting)、表面プラスモン共鳴法、またはカラム結合のような生化学的検査により確認することができる。結合に必要な基質には、標的部位を含む合成オリゴヌクレオチドを使用することができる。このような検査は、非特定DNAを競合物として、または特定DNA配列を競争体として含むことができる。特定競争体DNAには、一つ、二つ、または三つの核酸突然変異を有する認識部位が使用され得る。したがって、生化学的検査により所定部位に対するドメインの親和度のみならず、他の部位に対する所定部位の相対的親和性も測定できる。レバー及びパボ〔Rebar and Pabo, 1994, Science 263:671-673〕は、EMSAからジンクフィンガードメインに対する絶対Kd常数を得る方法を記述している。
【0101】
本発明は、下記実際的な実施例を通じて更に具体的に記述されるはずである。しかし、これら実施例は本発明の範囲を制限しようとする意図から提供されたものでないことに留意すべきである。
【0102】
実施例1:ハイブリッド転写因子発現のためのプラスミドの製造
ジンクフィンガー転写因子を発現する発現プラスミドを、pPC86〔Chevray & Nathans(1991) Proc. Natl. Acad. Sci. USA 89, 5789-5793〕を改変して調製した。以下に記述されるDNA操作は文献〔Current Protocols in Molecular Biology, Ausubel et al. (1998), John Wiley & Sons, Inc.〕に提示された一般的な方法により遂行した。pPC86内のSalIとEcoRI認識場所間にZif268ジンクフィンガータンパク質をコードするDNA断片を挿入してpPCFM−Zifを作った。このクローニング工程の結果は、酵母Gal4転写活性化ドメインにZif268ジンクフィンガータンパク質が連結された翻訳融合タンパク質をもたらす。pPCFM−Zifを酵母菌細胞に形質転換させれば、Gal4活性化ドメインとZif268ジンクフィンガーを含むハイブリッド転写因子が発現される。pPCFM−Zif内にクローニングされたZif268ジンクフィンガータンパク質をコードするDNA配列を図9に表した。
【0103】
ジンクフィンガードメインのライブラリーを構築するためのベクターとして、pPCFMS−Zifプラスミドを利用した。pPCFMS−Zifは、pPCFM−Zifのフィンガー3コーディング部位前に終止コドンとPstI認識配列を含むオリゴヌクレオチドカセットの挿入により構築される。前記オリゴヌクレオチドカセットは、二つの合成オリゴヌクレオチド、すなわち、5′−TGCCTGCAGCATTTGTGGGAGGAAGTTTG−3′(配列番号79)及び5′−ATGCTGCAGGCTTAAGGCTTCTCGCCGGTG−3′(配列番号80)をアニーリングして形成される。終止コドンの挿入は、Zif268のフィンガー3をコードするプラスミドライブラリーの生成を防止する。
【0104】
下記「実施例2」に記載のとおり、プラスミドはジンクフィンガードメインライブラリーの作成のためのべクターとして用いた。
【0105】
加えて、個別のジンクフィンガードメインをコードするDNA配列のギャップ修復クローニングを、ハドソンら(1997、Genome Research 7:1169-1173)記載に細部の改変を施して行った。
【0106】
個別のジンクフィンガードメインをクローン化するため、オーバーラップした2つのオリゴヌクレオチドを合成した。それぞれのオリゴヌクレオチドは、第2ラウンドのPCR(再PCR)のための21ヌクレオチド長の共通の尾部を5′末端に含み、当該個別のジンクフィンガードメインをコードする核酸にアニーリングする特異的配列を含む。順向き及び逆向きのプライマーは、それぞれ、5′−ACCCACACTGGCCAGAAACCCN48-51−3′(配列番号108)及び、5′−GATCTGAATTCATTCACCGGTN42-45−3′(配列番号109)(ここで、N48-51及びN42-45は、ジンクフィンガードメインをコードする核酸にアニーリングさせるための必要に応じた配列に相当する)である。二本鎖DNAは、テンプレートの核酸を、2つのオリゴヌクレオチドの等モルの混合物と一緒に増幅することによって調製した。PCR条件は、94℃3分での第1サイクルに続き、94℃1分、50℃1分及び72℃30秒での5サイクルからなる。
【0107】
その後、それぞれのジンクフィンガードメインをコードする二本鎖DNAを、第2ラウンドPCRにおいてテンプレートとして用いた。再PCRプライマーは2つの領域を有し、1つの領域は、酵母ベクターpPCFM−Zifと同一であり、第二の領域は、上記21ヌクレオチド長の共通の尾部配列と同じである。順向きプライマーの配列は、
5′−TGTCGAATCTGCATGCGTAACTTCAGTCGTAGTGACCACCTTACCACCCACATCCGGACCCACACTGGCCAGAAACCC−3′(配列番号138)
及び逆向きプライマーの配列は、
5′−GGTGGCGGCCGTTACTTACTTAGAGCTCGACGTCTTACTTACTTAGCGGCCGCACTAGTAGATCTGAATTCATTCACCGGT−3′(配列番号139)
である。反応混合液は、25ul中に、それぞれのプライマーを2.5pmol、Mg2+を1.5mM、Taqポリメラーゼ2unit及びPfuポリメラーゼ0.01unitを含む。反応は、94℃3分、その後94℃1分、65℃1分及び72℃30秒で20サイクルを回して行った。ギャップ修復クローニングは、再PCR産物の混合物及び、MscI及びEcoRIで消化した直線化したpPCFM−Zifベクターを酵母YW1細胞に形質移入することによって行った。酵母ベクターpPCFM−Zifと同一の領域は、細胞中のベクターでの相同的組換えを可能にする。
【0108】
実施例2:ジンクフィンガードメインライブラリーの製造
天然に存在するジンクフィンガードメインのプラスミドライブラリーをヒトのゲノムからジンクフィンガードメインをクローニングすることにより製造した。縮重プライマー及びPCRを利用してヒトのゲノムDNA(Promega Corporation;米国ウィスコンシン州マジソン)からジンクフィンガードメインをコードするDNA断片を増幅した。ヒトジンクフィンガードメインをクローニングするために使用された縮重DNAプライマーのDNA配列は次の通りである。
【0109】
5′−GCGTCCGGACNCAYACNGGNSARA−3′(配列番号81)及び
【0110】
5′−CGGAATTCANNBRWANGGYYTYTC−3′(配列番号82)
【0111】
(ここで、RはG及びAを表し、BはG、C及びTを表し、SはG及びCを表し、WはA及びTを表し、YはC及びTを表し、NはA、C、G及びTを表す)。
【0112】
前記塩基配列は、多くの天然に生成されるジンクフィンガータンパク質のジンクフィンガードメイン間の接合点で発見されるアミノ酸配列His−Thr−Gly−Glu/Gln−Lys/Arg−Pro−Tyr/Phe(配列番号 83)をコードする核酸配列にアニーリングする〔Agata et al.(1998) Gene 213:55-64〕。
【0113】
PCRのバッファ組成は、KCl 50mM、MgCl2 3mM、Tris(pH8.3)10mMである。TaqDNAポリメラーゼを添加した後、94℃で30秒、42℃で60秒、72℃で30秒を35回反復した後、72℃で10分間の最終温置をした。
【0114】
前記PCR産物を次の通りpPCFMS−Zifにクローニングした。PCR産物を電気泳動して120bpに相当するDNA断片を単離した。BspEIとEcoRIで消化した後、これをpPCFMS−Zifに連結した。結果的に、このプラスミドライブラリーがコードするハイブリッド転写因子のDNA−結合ドメインはZif268のフィンガー1及びフィンガー2とヒトゲノムから由来したジンクフィンガードメインで構成される。全106個の大腸菌形質転換体からプラスミドライブラリーを調製した。前記ライブラリー製造方法によれば、ジンクフィンガードメイン間で発見される天然に存在するリンカー配列が維持される。
【0115】
実施例3:ジンクフィンガードメインライブラリーの製造
無作為突然変異生成により突然変異ジンクフィンガードメインのライブラリーを調製した。Zif268のフィンガー3をポリペプチド骨格(framework)として使用した。無作為突然変異は、配列番号21(Zif268のフィンガー3)の73位(アルギニン)、75位(アスパラギン酸)、76位(グルタミン酸)、77位(アルギニン)、78位(ライシン)及び79位(アルギニン)にそれぞれ該当する、αヘリックスに沿って−1、2、3、4、5、6位のアミノ酸に無作為突然変異を導入した。
【0116】
これらアミノ酸をコードする核酸配列位置のそれぞれに無作為化コドン、すなわち、5′−(G/A/C)(G/A/C/T)(G/C)−3′のコドンを導入した。この無作為化コドンは20個のアミノ酸のうち、トリプトファン、チロシン、システイン、フェニルアラニンを除いた16個のアミノ酸中の一つをコードする。前記無作為化コドンは、可能な終止コドン三種を除外させる。突然変異が挿入された位置を除いた残りの部分はZif268ジンクフィンガータンパク質のフィンガー3と同一である。前記無作為化コドンは、下記二つのオリゴヌクレオチド
5′−GGGCCCGGGGAGAAGCCTTACGCATGTCCAGTCGAATCTTGTGATAGAAGATTC−3′(配列番号84)
5′−CTCCCCGCGGTTCGCCGGTGTGGATTCTGATATGSNBSNBAAGSNBSNBSNBSNB
【0117】
TGAGAATCTTCTATCACAAG−3′(配列番号85)(ここで、BはG、T及びCを表し、SはG及びCを表し、NはA、G、C及びTを表す。)から製造されたオリゴヌクレオチドカセットとして導入される。
【0118】
前記二つのオリゴヌクレオチドをアニーリングした後、常温で30分間クレノウポリメラーゼを使用して二重鎖にした後、AvaIとSacIIで処理し、これをSgrAI、PstI、SacIIで処理したpPCFMS−Zif(実施例1参照)に挿入した。総109個の形質転換された菌株からプラスミドを分離し、ジンクフィンガー転写因子を指定するプラスミドのライブラリーを製造した。
【0119】
実施例4:リポータープラスミドの製造
酵母HIS3遺伝子を含むリポータープラスミドを、pRS315His(Wang & Reed(1993), Nature 364, 121-126)を改変して調製した。前記リポータープラスミドはまた、このプラスミドを有する形質転換体の選別のための目的でLEU2マーカーをその天然のプロモーター下に含む。まず、pRS315His内のSalI認識配列を除去するためにpRS315HisをSalIとBamHIで処理した後得られた小さい断片と、同じプラスミドをBamHIとXhoIで処理した後得られた大きい断片を結合させてpRS315HisΔSalを作った。その後、オリゴヌクレオチドデュプレックスをBamHIとXmaI間のpRS315HisΔSalに挿入してHIS3遺伝子のプロモーター部位にSalI認識配列を導入した。互いにアニーリングされて挿入されるデュプレックスを形成する二つのオリゴヌクレオチド配列は
5′−CTAGACCCGGGAATTCGTCGACG−3′(配列番号86)
5′−GATCCGTCGACGAATTCCCGGGT−3′(配列番号87)
である。その結果生成されたプラスミドをpRS315HisMCSと命名した。
【0120】
pRS315HisMCSに所望の複合配列を挿入して多様なリポータープラスミドを作った。前記複合配列は複合配列の4コピーを含む直列配列(tandem array)として挿入される。前記標的配列はHIV−1のLTRで発見される10−bpDNA配列
5′−GACATC GAG C−3′(配列番号1)HIV−1LTR(−124/−115)
5′−GCA GCT GCT T−3′(配列番号2)HIV−1LTR(−23/−14)
5′−GCT GGG GAC T−3′(配列番号3)HIV−1LTR(−95/−86)
及びヒト遺伝子CCR5のプロモーターに存在する10bp配列(図6参照)
5′−AGG GTG GAG T−3′(配列番号4)ヒトCCR5(−70/−79)
5′−GCT GAG ACAT−3′(配列番号5)ヒトCCR5(+7/+16)
から由来したものである。
【0121】
これらそれぞれの10−bpDNA配列のうち、4−bp標的部位成分を分析することにより、この部位を認識するジンクフィンガードメインを同定した。モジュール性組合せ方法を利用し、このようなジンクフィンガードメインをカップリングすることにより、生体内で前記部位が認識できるDNA結合タンパク質を調製することができる。
【0122】
図6において、下線部分は4−bpの標的塩基配列の例を表す。これらそれぞれの4−bp標的配列はZif268のフィンガー1及び2により認識される塩基配列である5′−GGGCG−3′の5−bp招集配列に連結される。このように生成された9−bp配列は複合結合配列を構成する。それぞれの複合結合配列は5′−XXXXGGGCG−3′の形式を有するが、ここで、XXXXは4−bp標的配列であり、隣接した5′−GGGCG−3′は招集配列である。
【0123】
図7は、pRS315HisMCS内のリポーター遺伝子に作動可能に連結された、複合結合部位の直列配列が挿入された塩基配列を示す。それぞれの直列配列は複合結合部位の塩基配列の4コピーが配置されている。それぞれの結合部位に対し、二つのオリゴヌクレオチドを合成してアニーリングした後、pRS315HisMCSのSalIとXmaI場所に連結してリポータープラスミドを作った。
【0124】
実施例5:具体的リポータープラスミドの製造
3塩基対の微小部位に対し、それぞれ一対のリポーター(すなわち、一つはlacZ、他の一つはHIS3)を含むリポータープラスミドのセットを次のように構築した。リポータープラスミドは所望の標的配列をpRS315HisMCS及びpLacZiに挿入して製造した。それぞれの3塩基対の標的部位に対して二つのオリゴヌクレオチドを合成し、互いにアニーリングさせた後、これをpRS315HisMCS及びpLacZiのSalI及びXmaI部位間に挿入した。前記オリゴヌクレオチドのDNA配列は次の通りである:5′−CCGGT NNNTGGGCGTACNNNTGGGCG TCA NNNTGGGCG−3′(配列番号88)及び5′−TCGACGCCCANNN TGA CGCCCANNNGTACGCCCANNN A3′(配列番号89)。全64対のオリゴヌクレオチドを合成し、前記二つのリポータープラスミド内に挿入した。
【0125】
実施例6:所望のDNA−結合特異性を有するジンクフィンガードメインの選択
与えられた標的塩基配列に特異的に結合するジンクフィンガードメインを選択するために、酵母をリポータープラスミドとハイブリッド転写因子を発現するジンクフィンガーライブラリープラスミドで形質転換させた。以下記述される酵母の形質転換方法と生体内スクリーニング方法は文献〔Current Protocols in Molecular Biology、Ausubel et al.(1998), John Wiley & Sons, Inc., 米国ニュージャジー州イングルウッド〕に提示された一般的な方法により行われた。酵母菌株には、yWAM2(MATα Δgal4 Δgal80URA3::GAL1−lacZ lys2801 his3−Δ200 trp1−Δ63 leu2 ade2−101CYH2)を使用した。
【0126】
一例として、まずリポーター遺伝子に作動可能に連結された塩基配列5′−GAGCGGGCG−3′(4bpの標的配列に下線を付す)の複合結合部位を含むリポータープラスミドで酵母を形質転換させた。その後、無作為突然変異法で製造された突然変異ジンクフィンガードメインのプラスミドライブラリーを前記形質転換された酵母に導入した。約106個程度のコロニーをロイシン及びトリプトファンが全て欠如された培地で得た。リポータープラスミド及びジンクフィンガードメイン発現プラスミドはマーカー(marker)としてそれぞれLEU2遺伝子とTRP1遺伝子を有していて、2種類のプラスミドで全て形質転換された酵母はロイシンとトリプトファンが欠如された培地で育つことができる。
【0127】
1つの実施態様において、ヒトゲノムから由来するジンクフィンガードメインのライブラリーをリポータープラスミドを含有する細胞に形質転換した。このような形質転換は、5種類の相異する宿主細胞菌株に対して行われ、それぞれの株は、リポーター遺伝子に作動可能に連結された相異する5種類の標的配列中の一つを含有する。ロイシン及びトリプトファンが全て欠如された培地で各形質転換から約105個程度のコロニーを得た。
【0128】
形質転換体をロイシン及びトリプトファンが欠如された合成培地を含有するペットリディッシュ上で成長させた。インキュベーション後、プレートに10%グリセロール溶液を加えた後、細胞をかき集めてグリセロール溶液中に凍結保管した。単一のアリコートをロイシン、トリプトファン、及びヒスチジンが欠乏した培地に撒いた。ジンクフィンガー転写因子の作用なしにも微細な量のHIS3が発現できるため、これによる細胞成長を抑制するために一部の成長培地にはHIS3の抑制剤である3−アミノトリアゾール(AT)をそれぞれ0、0.03mM、0.1mM、0.3mM添加した。ATは、His3の競合阻害剤であり、HIS3選択系の感度を滴定する。ATは、His3の基礎的な活性を抑制した。そのような基礎的な活性は、レポータープラスミド上のHIS3遺伝子の少量の発現から生じ得る。培地上に展開した約107個の酵母細胞うち、ATを欠く選択培地では数百個のコロニーが育った。ATの濃度の増加につれて、コロニーの数字が減った。0.3mMのATを含む選択培地では、10のオーダーでコロニーが育った。ATを欠いた培地と0.3mMのATを含む培地からそれぞれ数個ずつのコロニーを無作為に選定してこれらを培養した。プラスミドを酵母から分離し、大腸菌菌株KC8(pyrF leuB600 trpC hisB463)を形質転換した。これからジンクフィンガー転写因子をコードするプラスミドを分離して選択されたジンクフィンガードメインのDNA塩基配列を決定した。
【0129】
各選択されたジンクフィンガードメインのアミノ酸配列を、前記決定されたDNA塩基配列から演繹的に誘導した。各ジンクフィンガードメインは、塩基−接触部位における4つのアミノ酸残基、すなわち、αヘリックスに沿って−1、2、3、6位のアミノ酸残基の名を取って命名した。結果を表1に表した。同定されたジンクフィンガードメインは塩基−接触部位で発見される4個のアミノ酸によって命名された。塩基配列を分析した結果、同じジンクフィンガードメインが反復的に得られる場合があることが分かる。表1において括弧内の数字は、同一のジンクフィンガードメインがどれだけ多く得られたかを表す。例えば、4塩基接触部位にCSNRを有する二つのジンクフィンガーが、GAGC核酸部位に結合することが同定された(カラム3の「GAGC/ヒトゲノム」参照)。
【0130】
【表1】
【0131】
選択されたヒトジンクフィンガードメインをコードする全長DNA配列と、これを翻訳して得られたアミノ酸配列を図11に表した。ヒトゲノムにおいてジンクフィンガードメインをコードするDNAセグメントを増幅させるために使用した縮重PCRプライマーに相補的な配列を下線で表示した。対立因子の相異又は増幅における改変の導入のため、この部分の塩基配列は報告されたヒトゲノム配列の元来塩基配列と異なり得る。
【0132】
本発明によるスクリーニングで同定されたほとんどのヒトジンクフィンガードメインは、新規なポリペプチドであるか、又は不明のオープンリーディングフレームに相当した。例えば、HSNK(GenBank accession numberAF155100で報告された配列に含まれる)、QSTV(GenBank accession numberAL110217)、VSTR(GenBank accession numberAF025772で報告された配列に含まれる)として設計されたジンクフィンガードメインは、その機能がまだ知られていないタンパク質中に発見された。ここに記載された結果は、これらのジンクフィンガードメインが、配列特異的DNA結合ドメインとして機能することができるということを示すだけでなく、キメラタンパク質の中で好ましい、それらの好適な結合部位を立証するものである。
【0133】
また、本願発明では、ヒトゲノムから得た前記ジンクフィンガードメインが組立式で作用して新規なDNA−結合タンパク質を構築するための構成ブロックとして使用され得ることを明らかにした。本願発明のヒトジンクフィンガードメインは、これをZif268のフィンガー1及びフィンガー2に次いでC末端に配置した時、生体内でこれらが特定な標的配列を認識する能力に基づいて選択された。したがって、同定されたジンクフィンガードメインは人工的な文脈で特定配列が認識でき、合成転写因子を設計するためのモジュール性構成ブロックとして適している。
【0134】
実施例7:酵母の対交配(pairwise mating)
3塩基対の標的部位に結合するジンクフィンガードメインの同定を容易にするために、酵母細胞の反復的な形質転換を避け、一回の形質転換で64個のリポーター構築物のそれぞれに対して結合する陽性結合形質転換体を探すために、酵母の交配を利用した。YW1(MATα交配型)及びYPH499(MATa交配型)の2種の酵母菌株を使用した。YW1はyWAM2から由来したもので、5−フルオロオロチックアクシド(FOA)耐性であるクローンを選択することにより、yWAM2のura3−誘導体を生成した。
【0135】
ジンクフィンガードメインのプラスミドライブラリーを酵母形質転換によりYW1に導入した。約106個の形質転換されたコロニーから10%グリセロール溶液でプレートをかき集めて細胞を収集し、小分画で冷凍させた。64個のリポータープラスミドの各対(pLacZiまたはpRS315Hisから由来)を酵母菌株YPH499に共同形質感染させた。それぞれのリポータープラスミド対を含有する形質転換体を回収して冷凍させた。
【0136】
冷凍させた細胞を溶かした後、これら酵母細胞を最小培地で中間−ログ成長期まで成長させた。次いで、この2つの細胞類型を混合し、YPDで5時間交配されるようにした。X−gal及びAT(1mM)を含有し、トリプトファン、ロイシン、ウラシル及びヒスチジンが欠如した最小培地で二倍体細胞を選択した。数日後、選択用プレートで成長した青色コロニーを単離し、これからジンクフィンガードメインをコードするプラスミドを単離し、選択されたジンクフィンガードメインのDNA配列を決定した。
【0137】
青色コロニーから単離された核酸をYW1細胞に個別的に再形質転換させた。それぞれの単離された核酸に対し、再形質転換されたYW1細胞を64 LacZリポータープラスミドをそれぞれ含有するYPH499細胞と96ウェルプレートで交配させ、X−galを含有してトリプトファン及びウラシルが欠けた最小培地上にばら撒いた。64個の標的配列に対するジンクフィンガードメインのDNA結合の親和度及び特異性は青色相の強度により決定された。Zif268ジンクフィンガードメインとの対照群実験結果、ジンクフィンガードメインと結合部位間の陽性相互作用は、濃い青乃至薄い青のコロニーを作り(ここで、青色の強度は結合親和性に比例する)、陰性相互作用は白色コロニーを作った。
【0138】
実施例8:同定されたジンクフィンガードメインと相互作用コードの比較
選択されたジンクフィンガードメインのアミノ酸配列から塩基と相互作用をすることと予想されるアミノ酸残基と、ジンクフィンガー−DNA相互作用コード表(図3)から予測したアミノ酸残基との同一性及び類似性を比較した。大部分のジンクフィンガードメインは、期待されたパターン、すなわちコードから予測したものとよく合致する決定的な部位のアミノ酸残基を示した。
【0139】
例えば、無作為突然変異を通じて製造されたライブラリーから選択されたジンクフィンガードメイン内の共通的アミノ酸残基は、−1位ではR(アルギニン)(14個中、7個)またはK(ライシン)(14個中、2個)、3位ではN(アスパラギン)(14個中、6個)及び6位ではR(14個中、9個)であった(表1参照)。これらのジンクフィンガードメインは、GAGCプラスミドで選択された。(リポーター遺伝子に作動可能に連結された複合結合配列5′−GAGCGGGCG−3’を有するリポータープラスミドをGAGCプラスミドと呼ぶことにする。以下類似に、リポーター遺伝子に作動可能に連結された複合結合配列5′−XXXXGGGCG−3’を含むリポータープラスミドをXXXXプラスミドと呼ぶ)。決定的な塩基−接触部位のこれらのアミノ酸残基は、コードから予想されたものと正確に合致する。〔ヒトゲノム内の大部分のジンクフィンガードメインらは、2位にS(セリン)を有しており、セリンは4個の塩基中、いずれのものとも水素結合が形成できる。したがって、2位における影響は以下で考慮しないこととする。また、一般的に、2位の残基は塩基認識において、単に補助的な役割しか果たさないことも知られている(Pavletich及びPabo(1991) Science 252, 809-817)。
【0140】
ヒトのゲノムから由来したジンクフィンガードメイン中のアミノ酸残基も、コードから予想されるものと非常によく一致した。例えば、GAGCプラスミドを使用して得たジンクフィンガードメイン内−1、3、6位の共通アミノ酸残基らは、それぞれR、N、Rである(表1カラム3参照)。これらのアミノ酸は、コードから予想できるアミノ酸と正確に一致した。GCTTプラスミドを使用して得たジンクフィンガードメイン中の−1、3、6位のアミノ酸残基は、それぞれV、T、Rであった(表1カラム4)。このうち、T及びR残基は、コードから予想したものと一致する。3bpの塩基配列において3′末端に位置するTと相互作用をすることと期待されるコードの−1位から予想されたのアミノ酸は、L、T、又はNである。GCTTプラスミドで選択されたVSTRジンクフィンガードメインは、この位置にL(ロイシン)と類似した疎水性アミノ酸であるV(バリン)を含んでいた。
【0141】
全体的に、選択されたジンクフィンガードメイン内のアミノ酸残基は、三つの位置中、少なくとも二つの位置ではコードから予想されるアミノ酸と一致した。表1において、コードから予想されるジンクフィンガードメイン中のアミノ酸を下線で表示した。これらの結果は、ここに開示された生体内選択システムが予想通り機能していることを強力に示唆している。
【0142】
実施例9:再形質転換(retransformation)及び相互形質転換(cross-transformation)
上記のジンクフィンガータンパク質らが誤って得られた陽性結果である可能性を排除し、また前記ジンクフィンガータンパク質らの配列特異性を調査するために、単離されたプラスミドを利用し、酵母の再形質転換(retransformation)及び相互形質転換(cross-transformation)を遂行した。
【0143】
まず、リポータープラスミドとジンクフィンガードメインをコードするハイブリッド転写因子プラスミドを一対にして酵母を同時−形質転換した。酵母形質転換体をロイシン及びトリプトファンが欠如された最小培地に接種して36時間培養した。成長培地中の細胞約1,000個をロイシン、トリプトファン、ヒスチジンが欠如された固体培地(図10で−ヒスチジンと表記)とロイシン、トリプトファンが欠如された固体培地(図10で+ヒスチジンと表記)上にばら撒いた後、50時間30℃で培養した。その結果を図10に示した。
【0144】
ハイブリット転写因子のジンクフィンガー部分が、複合結合配列と結合し、ハイブリット転写因子がHIS3レポーター遺伝子を活性化させる場合は、ヒスチジンを欠く培地中でコロニーが成長することができると予測される。ジンクフィンガー部分がこの複合結合配列に結合できないならば、コロニーは、ヒスチジンが欠如された培地では育長することができない。
【0145】
図10に示したように、単離されたジンクフィンガードメインは、相当する標的配列に結合する能力を有し、Zif268とは明らかに異なる配列特異性を示した。Zif268は、GCGTプラスミドとの場合に、他の5つのプラスミドとの場合よりも高い活性を示し、GAGTプラスミドとの場合には比較的高い活性を示した。他の結合部位を含むレポーターを有し、Zif268タンパク質を発現する株によっては、コロニーは形成されなかった。
【0146】
無作為突然変異ライブラリーから単離されたジンクフィンガードメインKTNRは、GAGCリポータープラスミドで元来選択されたものである。予想通り、GAGCプラスミドのみでコロニーが形成された。ヒトゲノム由来のライブラリーから得られたジンクフィンガードメインも期待した通りの特異性を示した。例えば、GACTプラスミドで選択されたHSNKジンクフィンガードメインは、酵母細胞に形質転換した場合、GACTプラスミドの場合のみで細胞成長を可能とした。GCTTプラスミドで選択されたVSTRは、予想した通りGCTTプラスミドで最大の活性を示した。GAGTプラスミドで選択されたRDERは、Zif268のフィンガー3と同一の4つの塩基−接触部位に同一のアミノ酸残基配列を有する。予想通り、このジンクフィンガードメインは、Zif268のフィンガー3と類似の配列特異性を示した。GAGCとGAGTプラスミドで選択されたSSNRは、GAGCプラスミドとはヒスチジン欠乏培地で細胞成長を可能としたが、GAGTプラスミドとは細胞成長を可能としなかった。ACATプラスミドで得られたQSTVは、この検定で試験されたいかなるプラスミドとも細胞成長を可能としなかった。しかし、後述の如く、試験管内実験ではこのジンクフィンガードメインはACAT配列と強く結合することができた。
【0147】
実施例10:ゲルシフト分析(gel shift assay)
改変ワンハイブリッドシステムを用いて選択されたジンクフィンガードメインを含むジンクフィンガータンパク質を、E.coli内で発現させ、精製し、ゲルシフト分析で用いた。ハイブリッドプラスミド中のジンクフィンガータンパク質をコードするDNAセグメントを、SalI及びNotIで消化して得、pGEX−4T2(Pharmacia Biotech)のSalI及びNotI部位の間に挿入した。ジンクフィンガードメインをE.coliBL21株中で、GST(グルタチオン−S−トランスフェラーゼ)に連結された融合タンパク質として発現させた。発現されたタンパク質をグルタチオンに対する親和性(glutathione affinity)クロマトグラフィー(Pharmacia Biotech, Piscataway, NJ)を利用して精製した後、GSTとジンクフィンガータンパク質の連結部位を切断するトロンビンで消化した。精製されたジンクフィンガータンパク質は、Zif268のフィンガー1及びフィンガー2、およびC末端に選択されたジンクフィンガードメインを含有する。
【0148】
下記配列のプローブDNAを合成し、アニーリングさせ、T4ポリヌクレオチドキナーゼで32P標識し、ゲル移動分析に使用した。
GCGT; 5′−CCGGGTCGC GCGTGGGCG GTACCG−3′ (配列番号90)
3′−CAGCG CGCACCCGC CATGGCAGCT−5′ (配列番号91)
GAGC; 5′−CCGGGTCGC GAGCGGGCG GTACCG−3′ (配列番号92)
3′−CAGCG CTCGCCCGC CATGGCAGCT−5′ (配列番号93)
GCTT; 5′−CCGGGTCGT GCTTGGGCG GTACCG−3′ (配列番号94)
3′−CAGCA CGAACCCGC CATGGCAGCT−5′ (配列番号95)
GACT; 5′−CCGGGTCGG GACTGGGCG GTACCG−3′ (配列番号96)
3′−CAGCC CTGACCCGC CATGGCAGCT−5′ (配列番号97)
GAGT; 5′−CCGGGTCGG GAGTGGGCG GTACCG−3′ (配列番号98)
3′−CAGCC CTCACCCGC CATGGCAGCT−5′ (配列番号99)
ACAT; 5′−CCGGGTCGG ACATGGGCG GTACCG−3′ (配列番号100)
3′−CAGCC TGTACCCGC CATGGCAGCT−5′ (配列番号101)
【0149】
多様な量のジンクフィンガータンパク質を、20mM Tris(pH7.7)、120mM NaCl、5mM MgCl2、20μM ZnSO4、10%グリセロール、0.1% Nonidet P−40、5mM DTT、及び0.10mg/ml BSA(牛血清アルブミン)中で標識されたプローブDNAと室温で1時間培養させた後、この反応混合物をゲル電気泳動させた。放射能シグナルをホスホイメージャー(Phosphor Imager TM)解析(Molecular Dynamics)、文献〔Rebar and Pabo(1994) Science 263:671-673〕に記載されたことにより解離定数を計算した。その結果を表2に示す。2回以上の別途の実験によりすべての常数を決定し、平均からの標準誤差を表示した。表2にはヒスチジン欠乏培地における酵素形質転換体の細胞成長(図10)も表した。
【0150】
【表2】
【0151】
ヒスチジン欠乏培地において、細胞成長を可能にするジンクフィンガータンパク質らは相当するプローブDNAと強く結合した。例えば、対照群として使用したZif268タンパク質の場合、これは、GCGT及びGAGTリポータープラスミドと共に再形質転換させる場合に細胞成長を可能にしたが、これらリポータープラスミドに相応するDNAプローブを利用して試験管内で測定した解離定数はそれぞれ24pM、170pMであった。対照的に、Zif268タンパク質は、他のリポータープラスミドとは細胞成長を可能にせず、相応するDNAプローブで測定した解離定数も1nMよりも高かった。
【0152】
新規ジンクフィンガードメインを含むジンクフィンガータンパク質も類似した結果を示した。例えば、KTNRタンパク質はGAGCプローブDNAに対して170pMの解離定数での高い親和性を示すが、GCGT又はGACTプローブDNAに対しては、それぞれ5.5nM又は30nMの解離定数を表した。このタンパク質は、GAGCプラスミドとのみ、細胞成長を可能にした。HSNKタンパク質は、GACTプローブDNAと強く結合することができるが(Kd=0.32nM)、GCGT又はGAGTプローブDNAとは結合しない。すなわち、QSTVは、GCTT又はGCGTプローブDNAと結合するよりも、それぞれ13倍又は4.3倍強くACATプローブDNAと結合する。
【0153】
一般的に、例えば3つのジンクフィンガードメインを有するもののように、1nM未満の解離定数でDNA配列に結合するジンクフィンガータンパク質である場合、酵母の成長を可能にするが、ジンクフィンガータンパク質が、1nMより高い解離定数でDNA配列に結合する場合、細胞成長を可能にしない。1nMより大きく5nM未満の解離定数でDNA配列に結合するジンクフィンガータンパク質も、例えば、4個のジンクフィンガードメインを有するキメラジンクフィンガータンパク質の文脈において、有用であり得る。
【0154】
実施例11:TG−ZFD−001「CSNR1」
TG−ZFD−001「CSNR1」は、ヒトゲノム配列から生体内(in vivo)スクリーニングにより同定された。そのアミノ酸配列は、YKCKQCGKAFGCPSNLRRHGRTH(配列番号23)である。それは下記ヒト核酸配列
【0155】
5′−TATAAATGTAAGCAATGTGGGAAAGCTTTTGGATGTCCCTCAAACCTTCGAAGGCATGGAAGGACTCAC−3′(配列番号22)
によりコードされる。
【0156】
TG−ZFD−001「CSNR1」は、Zif268のフィンガー1及び2との融合ポリペプチドとして、3−bp標的配列GAA、GAC、及びGAGを特異的に認識する。生体内スクリーニング結果とEMSAによれば、TG−ZFD−001「CSNR」の結合部位配列に対する選好度は、GAA>GAC>GAG>GCGである。EMSAにおいて、TG−ZFD−001「CSNR」とZif268のフィンガー1、フィンガー2、及びGST精製ハンドルとの融合は、GACを含む部位に対しては0.17nM、GAGを含む部位に対しては0.46nM、そしてGCGを含む部位に対しては2.7nMの解離定数(Kd)を示す。
【0157】
TG−ZFD−001「CSNR1」は、例えば、GAA、GACまたはGAG配列を含むDNA部位を認識するために、複数のジンクフィンガードメインを含むキメラDNA結合タンパク質を作るための単位として利用され得る。
【0158】
実施例12:TG−ZFD−002「HSNK」
TG−ZFD−002「HSNK」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、YKCKECGKAFNHSSNFNKHHRIH(配列番号25)である。それは、次のヒト核酸配列によりコードされる。
5′−TATAAGTGTAAGGAGTGTGGGAAAGCCTTCAACCACAGCTCCAACTTCAATAAACACCACAGAATCCAC−3′(配列番号24)。
【0159】
TG−ZFD−002「HSNK」は、Zif268のフィンガー1及び2との融合ポリペプチドとして、3−bp標的配列GACを特異的に認識する。生体内スクリーニング結果とEMSAによれば、TG−ZFD−002「HSNK」の結合部位配列に対する選好度は、GAC>GAG>GCGである。EMSAにおいて、Zif268のフィンガー1、フィンガー2、及びGST精製ハンドルとTG−ZFD−002「HNSK」融合は、GACを含む位置に対しては0.32nM、GAGを含む位置に対しては3.5nM、そしてGCGを含む位置に対しては42nMの解離定数(Kd)を有する。
【0160】
TG−ZFD−002「HSNK」は、例えば、GAC配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として使用され得る。
【0161】
実施例13:TG−ZFD−003「SSNR」
TG−ZFD−003「SSNR」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、YECKECGKAFSSGSNFTRHQRIH(配列番号27)である。それは、次のヒト核酸配列によりコードされる。
5′−TATGAATGTAAGGAATGTGGGAAAGCCTTTAGTAGTGGTTCAAACTTCACTCGACATCAGAGAATTCAC−3′(配列番号26)。
【0162】
Zif268のフィンガー1及び2との融合ポリペプチドとして、TG−ZFD−003「SSNR」は3−bp標的配列GAGに対する認識特異性を表す。生体内スクリーニング結果とEMSAによれば、TG−ZFD−003「SSNR」の結合部位配列に対する選好度は、GAG>GAC>GCGである。EMSAにおいて、Zif268のフィンガー1、フィンガー2、及びGST精製ハンドルとTG−ZFD−003「SSNR」との融合は、GAGを含む位置に対しては0.45nM、GACを含む位置に対しては0.61nM、そしてGCGを含む位置に対しては3.8nMの解離定数Kdを示す。
【0163】
TG−ZFD−003「SSNR」は、例えば、GAGまたはGAC配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0164】
実施例14:TG−ZFD−004「RDER1」
TG−ZFD−004「RDER」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、YVCDVEGCTWKFARSDELNRHKKRH(配列番号29)である。それは、次のヒト核酸配列によりコードされる。
5′−TATGTATGCGATGTAGAGGGATGTACGTGGAAATTTGCCCGCTCAGATGAGCTCAACAGACACAAGAAAAGGCAC−3′(配列番号28)。
【0165】
Zif268のフィンガー1及び2と融合ポリペプチドとして、TG−ZFD−004「RDER」は3−bp標的配列GCGに対する認識特異性を表す。生体内スクリーニング結果とEMSAによれば、TG−ZFD−004「RDER」の結合部位配列に対する選好度は、GCG>GTG、GAG>GACである。EMSAにおいて、Zif268のフィンガー1、フィンガー2、及びGST精製ハンドルとTG−ZFD−004「RDER」との融合は、GCGを含む位置に対しては0.027nM、GAGを含む位置に対しては0.18nM、そしてGACを含む位置に対しては28nMの解離定数Kdを有する。
【0166】
TG−ZFD−004「RDER」は、例えば、GCG、GTGまたはGAG配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0167】
実施例15:TG−ZFD−005「QSTV」
TG−ZFD−005「QSTV」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、YECNECGKAFAQNSTLRVHQRIH(配列番号31)である。それは、次のヒト核酸配列によりコードされる。
5′−TATGAGTGTAATGAATGCGGGAAAGCTTTTGCCCAAAATTCAACTCTCAGAGTACACCAGAGAATTCAC−3′(配列番号30)。
【0168】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−005「QSTV」は、3−bp標的配列ACAに対する認識特異性を表す。生体内スクリーニング結果とEMSAによれば、TG−ZFD−005「QSTV」の結合部位配列に対する選好度はACA>GCG>GCTである。EMSAにおいて、Zif268のフィンガー1、フィンガー2、及びGST精製ハンドルとTG−ZFD−005「QSTV」との融合は、ACAを含む位置に対しては2.3nM、GCGを含む位置に対しては9.8nM、そしてGCTを含む位置に対しては29nMの解離定数Kdを有する。
【0169】
TG−ZFD−005「QSTV」は、例えば、ACA配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0170】
実施例16:TG−ZFD−006「VSTR」
TG−ZFD−006「VSTR」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、YECNYCGKTFSVSSTLIRHQRIH(配列番号33)である。それは、次のヒト核酸配列によりコードされる。
5′−TATGAGTGTAATTACTGTGGAAAAACCTTTAGTGTGAGCTCAACCCTTATTAGACATCAGAGAATCCAC−3′(配列番号32)。
【0171】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−006「VSTR」は、3−bp標的配列GCTに対する認識特異性を表す。生体内スクリーニング結果とEMSAによれば、TG−ZFD−006「VSTR」の結合部位配列に対する選好度はGCT>GCG>GAGである。EMSAにおいて、Zif268のフィンガー1、フィンガー2、及びGST精製ハンドルとTG−ZFD−006「VSTR」との融合は、GCTを含む位置に対しては0.53nM、GCGを含む位置に対しては0.76nM、そしてGAGを含む位置に対しては1.4nMの解離定数Kdを有する。
【0172】
TG−ZFD−006「VSTR」は、例えば、GCTまたはGCG配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0173】
実施例17:TG−ZFD−007「CSNR2」
TG−ZFD−007「CSNR2」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、YQCNICGKCFSCNSNLHRHQRTH(配列番号35)である。それは、次のヒト核酸配列によりコードされる。
5′−TATCAGTGCAACATTTGCGGAAAATGTTTCTCCTGCAACTCCAACCTCCACAGGCACCAGAGAACGCAC−3′(配列番号34)。
【0174】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−007「CSNR2」は3−bp標的配列GAA、GAC、GAGに対する認識特異性を表す。生体内スクリーニング結果によれば、TG−ZFD−007「CSNR2」の結合部位配列に対する選好度はGAA>GAC>GAGである。
【0175】
TG−ZFD−007「CSNR2」は、例えば、GAA、GACまたはGAG配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0176】
実施例18:TG−ZFD−008「QSHR1」
TG−ZFD−008「QSHR1」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、YACHLCGKAFTQSSHLRRHEKTH(配列番号37)である。それは、次のヒト核酸配列によりコードされる。
5′−TATGCATGTCATCTATGTGGAAAAGCCTTCACTCAGAGTTCTCACCTTAGAAGACATGAGAAAACTCAC−3′(配列番号36)。
【0177】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−008「QSHR1」は3−bp標的配列GGA、GAA、AGAに対する認識特異性を表す。生体内スクリーニング結果によれば、TG−ZFD−008「QSHR1」の結合部位配列に対する選好度は、GGA>GAA>AGAである。
【0178】
TG−ZFD−008「QSHR1」は、例えば、GGA、GAAまたはAGA配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0179】
実施例19:TG−ZFD−009「QSHR2」
TG−ZFD−009「QSHR2」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、YKCGQCGKFYSQVSHLTRHQKIH(配列番号39)である。それは、次のヒト核酸配列によりコードされる。
5′−TATAAATGCGGCCAGTGTGGGAAGTTCTACTCGCAGGTCTCCCACCTCACCCGCCACCAGAAAATCCAC−3′(配列番号38)。
【0180】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−009「QSHR2」は3−bp標的配列GGAに対する認識特異性を表す。
【0181】
TG−ZFD−009「QSHR2」は、例えば、GGA配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0182】
実施例20:TG−ZFD−010「QSHR3」
TG−ZFD−010「QSHR3」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、YACHLCGKAFTQCSHLRRHEKTH(配列番号41)である。それは、次のヒト核酸配列によりコードされる。
5′−TATGCATGTCATCTATGTGGAAAAGCCTTCACTCAGTGTTCTCACCTTAGAAGACATGAGAAAACTCAC−3′(配列番号40)。
【0183】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−010「QSHR3」は3−bp標的配列GGA、GAAに対する認識特異性を表す。生体内スクリーニング結果によれば、TG−ZFD−010「QSHR3」の結合部位配列に対する選好度はGGA>GAAである。
【0184】
TG−ZFD−010「QSHR3」は、例えば、GGAまたはGAA配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0185】
実施例21:TG−ZFD−011「QSHR4」
TG−ZFD−011「QSHR4」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、YACHLCAKAFIQCSHLRRHEKTH(配列番号43)である。それは、次のヒト核酸配列によりコードされる。
5′−TATGCATGTCATCTATGTGCAAAAGCCTTCATTCAGTGTTCTCACCTTAGAAGACATGAGAAAACTCAC−3′(配列番号42)。
【0186】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−011「QSHR4」は、3−bp標的配列GGA、GAAに対する認識特異性を表す。生体内スクリーニング結果によれば、TG−ZFD−011「QSHR4」の結合部位配列に対する選好度はGGA>GAAである。
【0187】
TG−ZFD−011「QSHR4」は、例えば、GGAまたはGAA配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0188】
実施例22:TG−ZFD−012「QSHR5」
TG−ZFD−012「QSHR5」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、YVCRECGRGFRQHSHLVRHKRTH(配列番号45)である。それは、次のヒト核酸配列によりコードされる。
5′−TATGTTTGCAGGGAATGTGGGCGTGGCTTTCGCCAGCATTCACACCTGGTCAGACACAAGAGGACACAT−3′(配列番号44)。
【0189】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−012「QSHR5」は、3−bp標的配列GGA、AGA、GAA、及びCGAに対する認識特異性を表す。生体内スクリーニング結果によれば、TG−ZFD−012「QSHR5」の結合部位配列に対する選好度はGGA>AGA>GAA>CGAである。
【0190】
TG−ZFD−012「QSHR5」は、例えば、GGA、AGA、GAAまたはCGA配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0191】
実施例23:TG−ZFD−013「QSNR1」
TG−ZFD−013「QSNR1」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、FECKDCGKAFIQKSNLIRHQRTH(配列番号47)である。それは、次のヒト核酸配列によりコードされる。
5′−TTTGAGTGTAAAGATTGCGGGAAAGCTTTCATTCAGAAGTCAAACCTCATCAGACACCAGAGAACTCAC−3′(配列番号46)。
【0192】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−013「QSNR1」は3−bp標的配列GAAに対する認識特異性を表す。
【0193】
TG−ZFD−013「QSNR1」は、例えば、GAA配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0194】
実施例24:TG−ZFD−014「QSNR2」
TG−ZFD−014「QSNR2」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、YVCRECRRGFSQKSNLIRHQRTH(配列番号49)である。それは、次のヒト核酸配列によりコードされる。
5′−TATGTCTGCAGGGAGTGTAGGCGAGGTTTTAGCCAGAAGTCAAATCTCATCAGACACCAGAGGACGCAC−3′(配列番号48)。
【0195】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−014「QSNR2」は3−bp標的配列GAAに対する認識特異性を表す。
【0196】
TG−ZFD−014「QSNR2」は、例えば、GAA配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0197】
実施例25:TG−ZFD−015「QSNV1」
TG−ZFD−015「QSNV1」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、YECNTCRKTFSQKSNLIVHQRTH(配列番号51)である。それは、次のヒト核酸配列によりコードされる。
5′−TATGAATGTAACACATGCAGGAAAACCTTCTCTCAAAAGTCAAATCTCATTGTACATCAGAGAACACAC−3′(配列番号50)。
【0198】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−015「QSNV1」は3−bp標的配列AAA、CAAに対する認識特異性を表す。生体内スクリーニング結果によれば、TG−ZFD−015「QSNV1」の結合部位配列に対する選好度はAAA>CAAである。
【0199】
TG−ZFD−015「QSNV1」は、例えば、AAAまたはCAA配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0200】
実施例26:TG−ZFD−016「QSNV2」
TG−ZFD−016「QSNV2」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、YVCSKCGKAFTQSSNLTVHQKIH(配列番号53)である。それは、次のヒト核酸配列によりコードされる。
5′−TATGTTTGCTCAAAATGTGGGAAAGCCTTCACTCAGAGTTCAAATCTGACTGTACATCAAAAAATCCAC−3′(配列番号52)。
【0201】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−016「QSNV2」は3−bp標的配列AAA、CAAに対する認識特異性を表す。生体内スクリーニング結果によれば、TG−ZFD−016「QSNV2」の結合部位配列に対する選好度はAAA>CAAである。
【0202】
TG−ZFD−016「QSNV2」は、例えば、AAAまたはCAA配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0203】
実施例27:TG−ZFD−017「QSNV3」
TG−ZFD−017「QSNV3」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、YKCDECGKNFTQSSNLIVHKRIH(配列番号55)である。それは、次のヒト核酸配列によりコードされる。
5′−TACAAATGTGACGAATGTGGAAAAAACTTTACCCAGTCCTCCAACCTTATTGTACATAAGAGAATTCAT−3′(配列番号54)。
【0204】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−017「QSNV3」は3−bp標的配列AAAに対する認識特異性を表す。
【0205】
TG−ZFD−017「QSNV3」は、例えば、AAA配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0206】
実施例28:TG−ZFD−018「QSNV4」
TG−ZFD−018「QSNV4」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、YECDVCGKTFTQKSNLGVHQRTH(配列番号57)である。それは、次のヒト核酸配列によりコードされる。
5′−TATGAATGTGATGTGTGTGGAAAAACCTTCACGCAAAAGTCAAACCTTGGTGTACATCAGAGAACTCAT−3′(配列番号56)。
【0207】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−018「QSNV4」は3−bp標的配列AAAに対する認識特異性を表す。
【0208】
TG−ZFD−018「QSNV4」は、例えば、AAA配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0209】
実施例29:TG−ZFD−019「QSSR1」
TG−ZFD−019「QSSR1」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、YKCPDCGKSFSQSSSLIRHQRTH(配列番号59)である。それは、次のヒト核酸配列によりコードされる。
5′−TATAAGTGCCCTGATTGTGGGAAGAGTTTTAGTCAGAGTTCCAGCCTCATTCGCCACCAGCGGACACAC−3′(配列番号58)。
【0210】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−019「QSSR1」は3−bp標的配列GTA、GCAに対する認識特異性を表す。生体内スクリーニング結果によれば、TG−ZFD−019「QSSR1」の結合部位配列に対する選好度はGTA>GCAである。
【0211】
TG−ZFD−019「QSSR1」は、例えば、GTAまたはGCA配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0212】
実施例30:TG−ZFD−020「QSSR2」
TG−ZFD−020「QSSR2」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、YECQDCGRAFNQNSSLGRHKRTH(配列番号61)である。それは、次のヒト核酸配列によりコードされる。
5′−TATGAGTGTCAGGACTGTGGGAGGGCCTTCAACCAGAACTCCTCCCTGGGGCGGCACAAGAGGACACAC−3′(配列番号60)。
【0213】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−020「QSSR2」は3−bp標的配列GTAに対する認識特異性を表す。
【0214】
TG−ZFD−020「QSSR2」は、例えば、GTA配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0215】
実施例31:TG−ZFD−021「QSTR」
TG−ZFD−021「QSTR」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、YKCEECGKAFNQSSTLTRHKIVH(配列番号63)である。それは、次のヒト核酸配列によりコードされる。
5′−TACAAATGTGAAGAATGTGGCAAAGCTTTTAACCAGTCCTCAACCCTTACTAGACATAAGATAGTTCAT−3′(配列番号62)。
【0216】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−021「QSTR」は3−bp標的配列GTA、GCAに対する認識特異性を表す。生体内スクリーニング結果によれば、TG−ZFD−021「QSTR」の結合部位配列に対する選好度はGTA>GCAである。
【0217】
TG−ZFD−021「QSTR」は、例えば、GTAまたはGCA配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0218】
実施例32:TG−ZFD−022「RSHR」
TG−ZFD−022「RSHR」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、YKCMECGKAFNRRSHLTRHQRIH(配列番号65)である。それは、次のヒト核酸配列によりコードされる。
5′−TATAAGTGCATGGAGTGTGGGAAGGCTTTTAACCGCAGGTCACACCTCACACGGCACCAGCGGATTCAC−3′(配列番号64)。
【0219】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−022「RSHR」は3−bp標的配列GGGに対する認識特異性を表す。
【0220】
TG−ZFD−022「RSHR」は、例えば、GGG配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0221】
実施例33:TG−ZFD−023「VSSR」
TG−ZFD−023「VSSR」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、YTCKQCGKAFSVSSSLRRHETTH(配列番号67)である。それは、次のヒト核酸配列によりコードされる。
5′−TATACATGTAAACAGTGTGGGAAAGCCTTCAGTGTTTCCAGTTCCCTTCGAAGACATGAAACCACTCAC−3′(配列番号66)。
【0222】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−023「VSSR」は3−bp標的配列GTT、GCG、GTAに対する認識特異性を表す。生体内スクリーニング結果によれば、TG−ZFD−023「VSSR」の結合部位配列に対する選好度はGTT>GTG>GTAである。
【0223】
TG−ZFD−023「VSSR」は、例えば、GTT、GCGまたはGTA配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0224】
実施例34:TG−ZFD−024「QAHR」
TG−ZFD−024「QAHR」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、YKCKECGQAFRQRAHLIRHHKLH(配列番号103)である。それは、次のヒト核酸配列によりコードされる。
5′−TATAAGTGTAAGGAATGTGGGCAGGCCTTTAGACAGCGTGCACATCTTATTCGACATCACAAACTTCAC−3′(配列番号102)。
【0225】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−024「QAHR」は3−bp標的配列GGAに対する認識特異性を表す。
【0226】
TG−ZFD−024「QAHR」は、例えば、GGA配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0227】
実施例35:TG−ZFD−025「QFNR」
TG−ZFD−025「QFNR」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、YKCHQCGKAFIQSFNLRRHERTH(配列番号105)である。それは、次のヒト核酸配列によりコードされる。
5′−TATAAGTGTCATCAATGTGTGGGAAAGCCTTTATTCAATCCTTTAACCTTCGAAGACATGAGAGAACTCAC−3′(配列番号104)。
【0228】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−025「QFNR」は3−bp標的配列GACに対する認識特異性を表す。
【0229】
TG−ZFD−025「QFNR」は、例えば、GAC配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0230】
実施例36:TG−ZFD−026「QGNR」
TG−ZFD−026「QGNR」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、FQCNQCGASFTQKGNLLRHIKLH(配列番号107)である。それは、次のヒト核酸配列によりコードされる。
5′−TTCCAGTGTAATCAGTGTGGGGCATCTTTTACTCAGAAAGGTAACCTCCTCCGCCACATTAAACTGCAC−3′(配列番号106)。
【0231】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−026「QGNR」は3−bp標的配列GAAに対する認識特異性を表す。
【0232】
TG−ZFD−026「QGNR」は、例えば、GAA配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0233】
実施例37:TG−ZFD−028「QSHT」
TG−ZFD−028「QSHT」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、YKCEECGKAFRQSSHLTTHKIIH(配列番号111)である。それは、次のヒト核酸配列によりコードされる。
5′−TACAAATGTGAAGAATGTGGCAAAGCCTTTAGGCAGTCCTCACACCTTACTACACATAAGATAATTCAT−3′(配列番号110)。
【0234】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−028「QSHT」は3−bp標的配列AGA、CGA、TGA、GGAに対する認識特異性を表す。生体内スクリーニング結果によれば、TG−ZFD−028「QSHT」の結合部位配列に対する選好度は(AGA、CGA)>TGA>GGAである。
【0235】
TG−ZFD−028「QSHT」は、例えば、AGA、CGA、TGAまたはGGA配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0236】
実施例38:TG−ZFD−029「QSHV」
TG−ZFD−029「QSHV」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、YECDHCGKSFSQSSHLNVHKRTH(配列番号113)である。それは、次のヒト核酸配列によりコードされる。
5′−TATGAGTGTGATCACTGTGGAAAATCCTTTAGCCAGAGCTCTCATCTGAATGTGCACAAAAGAACTCAC−3′(配列番号112)。
【0237】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−029「QSHV」は3−bp標的配列CGA、AGA、及びTGAに対する認識特異性を表す。生体内スクリーニング結果によれば、TG−ZFD−029「QSHV」の結合部位配列に対する選好度はCGA>AGA>TGAである。
【0238】
TG−ZFD−029「QSHV」は、例えば、CGA、AGA、TGA配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0239】
実施例39:TG−ZFD−030「QSNI」
TG−ZFD−030「QSNI」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、YMCSECGRGFSQKSNLIIHQRTH(配列番号115)である。それは、次のヒト核酸配列によりコードされる。
5′−TACATGTGCAGTGAGTGTGGGCGAGGCTTCAGCCAGAAGTCAAACCTCATCATACACCAGAGGACACAC−3′(配列番号114)。
【0240】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−030「QSNI」は3−bp標的配列AAA、CAAに対する認識特異性を表す。
【0241】
TG−ZFD−030「QSNI」は、例えば、AAAまたはCAA配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0242】
実施例40:TG−ZFD−031「QSNR3」
TG−ZFD−031「QSNR3」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、YECEKCGKAFNQSSNLTRHKKSH(配列番号117)である。それは、次のヒト核酸配列によりコードされる。
5′−TATGAATGTGAAAAATGTGGCAAAGCTTTTAACCAGTCCTCAAATCTTACTAGACATAAGAAAAGTCAT−3′(配列番号116)。
【0243】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−031「QSNR3」は3−bp標的配列GAAに対する認識特異性を表す。
【0244】
TG−ZFD−031「QSNR3」は、例えば、GAA配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0245】
実施例41:TG−ZFD−032「QSSR3」
TG−ZFD−032「QSSR3」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、YECNECGKFFSQSSSLIRHRRSH(配列番号119)である。それは、次のヒト核酸配列によりコードされる。
5′−TATGAGTGCAATGAATGTGGGAAGTTTTTTAGCCAGAGCTCCAGCCTCATTAGACATAGGAGAAGTCAC−3′(配列番号118)。
【0246】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−032「QSSR3」は3−bp標的配列GTA、GCAに対する認識特異性を表す。生体内スクリーニング結果によれば、TG−ZFD−032「QSSR3」の結合部位配列に対する選好度はGTA>GCAである。
【0247】
TG−ZFD−032「QSSR3」は、例えば、GTAまたはGCA配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0248】
実施例42:TG−ZFD−033「QTHQ」
TG−ZFD−033「QTHQ」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、YECHDCGKSFRQSTHLTQHRRIH(配列番号121)である。それは、次のヒト核酸配列によりコードされる。
5′−TATGAGTGTCACGATTGCGGAAAGTCCTTTAGGCAGAGCACCCACCTCACTCAGCACCGGAGGATCCAC−3′(配列番号120)。
【0249】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−033「QTHQ」は3−bp標的配列AGA、TGA、CGAに対する認識特異性を表す。生体内スクリーニング結果によれば、TG−ZFD−033「QTHQ」の結合部位配列に対する選好度はAGA>(TGA、CGA)である。
【0250】
TG−ZFD−033「QTHQ」は、例えば、AGA、TGA、CGA配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0251】
実施例43:TG−ZFD−034「QTHR1」
TG−ZFD−034「QTHR1」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、YECHDCGKSFRQSTHLTRHRRIH(配列番号123)である。それは、次のヒト核酸配列によりコードされる。
5′−TATGAGTGTCACGATTGCGGAAAGTCCTTTAGGCAGAGCACCCACCTCACTCGGCACCGGAGGATCCAC−3′(配列番号122)。
【0252】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−034「QTHR1」は3−bp標的配列GGA、GAA、AGAに対する認識特異性を表す。生体内スクリーニング結果によれば、TG−ZFD−034「QTHR1」の結合部位配列に対する選好度はGGA>(GAA、AGA)である。
【0253】
TG−ZFD−034「QTHR1」は、例えば、GGA、GAA、AGA配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0254】
実施例44:TG−ZFD−035「QTHR2」
TG−ZFD−035「QTHR2」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、HKCLECGKCFSQNTHLTRHQRT(配列番号125)である。それは、次のヒト核酸配列によりコードされる。
5′−CACAAGTGCCTTGAATGTGGGAAATGCTTCAGTCAGAACACCCATCTGACTCGCCACCAACGCACCCAC−3′(配列番号124)。
【0255】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−035「QTHR2」は3−bp標的配列GGAに対する認識特異性を表す。
【0256】
TG−ZFD−035「QTHR2」は、例えば、GGA配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0257】
実施例45:TG−ZFD−036「RDER2」
TG−ZFD−036「RDER2」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、YHCDWDGCGWKFARSDELTRHYRKH(配列番号127)である。それは、次のヒト核酸配列によりコードされる。
5′−TACCACTGTGACTGGGACGGCTGTGGATGGAAATTCGCCCGCTCAGATGAACTGACCAGGCACTACCGTAAACAC−3′(配列番号126)。
【0258】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−036「RDER2」は3−bp標的配列GCG、GTGに対する認識特異性を表す。生体内スクリーニング結果によれば、TG−ZFD−036「RDER2」の結合部位配列に対する選好度はGCG>GTGである。
【0259】
TG−ZFD−036「RDER2」は、例えば、GCG、GTG配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0260】
実施例46:TG−ZFD−037「RDER3」
TG−ZFD−037「RDER3」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、YRCSWEGCEWRFARSDELTRHFRKH(配列番号129)である。それは、次のヒト核酸配列によりコードされる。
5′−TACAGATGCTCATGGGAAGGGTGTGAGTGGCGTTTTGCAAGAAGTGATGAGTTAACCAGGCACTTCCGAAAGCAC−3′(配列番号128)。
【0261】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−037「RDER3」は3−bp標的配列GCG、GTGに対する認識特異性を表す。
【0262】
TG−ZFD−037「RDER3」は、例えば、GCG、GTG配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0263】
実施例47:TG−ZFD−038「RDER4」
TG−ZFD−038「RDER4」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、FSCSWKGCERRFARSDELSRHRRTH(配列番号131)である。それは、次のヒト核酸配列によりコードされる。
5′−TTCAGCTGTAGCTGGAAAGGTTGTGAAAGGAGGTTTGCCCGTTCTGATGAACTGTCCAGACACAGGCGAACCCAC−3′(配列番号130)。
【0264】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−038「RDER4」は3−bp標的配列GCG、GTGに対する認識特異性を表す。
【0265】
TG−ZFD−038「RDER4」は、例えば、GCG、GTG配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0266】
実施例48:TG−ZFD−039「RDER5」
TG−ZFD−039「RDER5」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、FACSWQDCNKKFARSDELARHYRTH(配列番号133)である。それは、次のヒト核酸配列によりコードされる。
5′−TTCGCCTGCAGCTGGCAGGACTGCAACAAGAAGTTCGCGCGCTCCGACGAGCTGGCGCGGCACTACCGCACACAC−3′(配列番号132)。
【0267】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−039「RDER5」は3−bp標的配列GCGに対する認識特異性を表す。
【0268】
TG−ZFD−039「RDER5」は、例えば、GCG配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0269】
実施例49:TG−ZFD−040「RDER6」
TG−ZFD−040「RDER6」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、YHCNWDGCGWKFARSDELTRHYRKH(配列番号135)である。それは、次のヒト核酸配列によりコードされる。
5′−TACCACTGCAACTGGGACGGCTGCGGCTGGAAGTTTGCGCGCTCAGACGAGCTCACGCGCCACTACCGAAAGCAC−3′(配列番号134)。
【0270】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−040「RDER6」は3−bp標的配列GCG、GTGに対する認識特異性を表す。生体内スクリーニング結果によれば、TG−ZFD−040「RDER6」の結合部位配列に対する選好度はGCG>GTGである。
【0271】
TG−ZFD−040「RDER6」は、例えば、GCG、GTG配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0272】
実施例50:TG−ZFD−041「RDHR1」
TG−ZFD−041「RDHR1」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、FLCQYCAQRFGRKDHLTRHMKKSH(配列番号137)である。それは、次のヒト核酸配列によりコードされる。
5′−TTCCTCTGTCAGTATTGTGCACAGAGATTTGGGCGAAAGGATCACCTGACTCGACATATGAAGAAGAGTCAC−3′(配列番号136)。
【0273】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−041「RDHR1」は3−bp標的配列GAG、GGGに対する認識特異性を表す。
【0274】
TG−ZFD−041「RDHR1」は、例えば、GAG、GGG配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0275】
実施例51:TG−ZFD−043「RDHT」
TG−ZFD−043「RDHT」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、FQCKTCQRKFSRSDHLKTHTRTH(配列番号141)である。それは、次のヒト核酸配列によりコードされる。
5′−TTCCAGTGTAAAACTTGTCAGCGAAAGTTCTCCCGGTCCGACCACCTGAAGACCCACACCAGGACTCAT−3′(配列番号140)。
【0276】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−043「RDHT」は3−bp標的配列TGG、AGG、CGGに対する認識特異性を表す。
【0277】
TG−ZFD−043「RDHT」は、例えば、TGG、AGG、CGG、GGG配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0278】
実施例52:TG−ZFD−044「RDKI」
TG−ZFD−044「RDKI」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、FACEVCGVRFTRNDKLKIHMRKH(配列番号143)である。それは、次のヒト核酸配列によりコードされる。
5′−TTTGCCTGCGAGGTCTGCGGTGTTCGATTCACCAGGAACGACAAGCTGAAGATCCACATGCGGAAGCAC−3′(配列番号142)。
【0279】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−044「RDKI」は3−bp標的配列GGGに対する認識特異性を表す。
【0280】
TG−ZFD−044「RDKI」は、例えば、GGG配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0281】
実施例53:TG−ZFD−045「RDKR」
TG−ZFD−045「RDKR」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、YVCDVEGCTWKFARSDKLNRHKKRH(配列番号145)である。それは、次のヒト核酸配列によりコードされる。
5′−TATGTATGCGATGTAGAGGGATGTACGTGGAAATTTGCCCGCTCAGATAAGCTCAACAGACACAAGAAAAGGCAC−3′(配列番号144)。
【0282】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−045「RDKR」は3−bp標的配列GGG、AGGに対する認識特異性を表す。生体内スクリーニング結果によれば、TG−ZFD−045「RDKR」の結合部位配列に対する選好度はGGG>AGGである。
【0283】
TG−ZFD−045「RDKR」は、例えば、GGG、AGG配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0284】
実施例54:TG−ZFD−046「RSNR」
TG−ZFD−046「RSNR」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、YICRKCGRGFSRKSNLIRHQRTH(配列番号147)である。それは、次のヒト核酸配列によりコードされる。
5′−TATATTTGCAGAAAGTGTGGACGGGGCTTTAGTCGGAAGTCCAACCTTATCAGACATCAGAGGACACAC−3′(配列番号146)。
【0285】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−046「RSNR」は3−bp標的配列GAG、GTGに対する認識特異性を表す。生体内スクリーニング結果によれば、TG−ZFD−046「RSNR」の結合部位配列に対する選好度はGAG>GTGである。
【0286】
TG−ZFD−046「RSNR」は、例えば、GAG、GTG配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0287】
実施例55:TG−ZFD−047「RTNR」
TG−ZFD−047「RTNR」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、YLCSECDKCFSRSTNLIRHRRTH(配列番号149)である。それは、次のヒト核酸配列によりコードされる。
5′−TATCTATGTAGTGAGTGTGACAAATGCTTCAGTAGAAGTACAAACCTCATAAGGCATCGAAGAACTCAC−3′(配列番号148)。
【0288】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−047「RTNR」は3−bp標的配列GAGに対する認識特異性を表す。
【0289】
TG−ZFD−047「RTNR」は、例えば、GAG配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0290】
本発明に関する多くの実施態様を記述した。それにも拘わらず、本発明の精神と範囲を逸脱しない多くの多様な変形が可能であることを理解するはずである。したがって他の実施態様も後述する請求項の範囲に含まれる。
【図面の簡単な説明】
【0291】
【図1】三つのジンクフィンガードメインで構成され、DNA配列5′−GCG TGG GCG T−3′と結合しているZif268ジンクフィンガータンパク質の3次元構造を表す図面である。黒色円は亜鉛イオンの位置を表す。
【図2】Zif268のアミノ酸残基とDNA塩基間の水素結合相互作用を表す。αヘリックスに沿った−1、2、3及び6位のアミノ酸残基らは、特定位置の塩基と相互作用する。太線は理想的な水素結合を表し、点線は潜在的な水素結合を表す。
【図3】ジンクフィンガードメインのαヘリックスに沿った−1、2、3及び6位のアミノ酸残基とDNA塩基間の相互作用を要約した認識コード(recognition code)表を表す。
【図4】アミノ酸残基及びこれらの相当する3塩基トリプレットの位置を表す図面である。太線は観察される主要相互作用を表し、点線は補助相互作用を表す。
【図5】本明細書に開示された生体内(in vivo)選別システムの原理を説明する図面である。多様なジンクフィンガー突然変異のうち、ジンクフィンガードメインAは標的配列(XXXXで表示)を認識し、HIS3リポーター遺伝子の転写を活性化する。結果的に、酵母コロニーはヒスチジンが欠乏した培地で育つ。これと対照的に、ジンクフィンガードメインBは標的配列を認識せず、したがって、リポーター遺伝子は抑圧されるようになる。その結果、ヒスチジンが欠乏した培地でコロニーが育たない。ADは転写活性化ドメインを表す。
【図6】HIVの末端反復配列(LTR)で及びHIV−1の共受容体(coreceptor)をコードするヒト遺伝子であるCCR5のプロモーター部位で発見される10−bp配列の目録である(それぞれ配列番号1−5)。下線部分は本発明の選別で使用された4−bp標的配列を表す。
【図7】リポーター遺伝子に連結された結合部位の塩基配列を表す(それぞれ配列番号s:6−17)。それぞれの結合部位は4つの複合結合配列の直列配置で構成されている。それぞれの複合結合配列はZif268のフィンガー1及びフィンガー2により認識される切断された結合配列5′−GG GCG−3’を4−bp標的配列に連結させて構築された。
【図8】ハイブリッドプラスミドのライブラリー構築に使用可能なプラスミドであるpPCFMS−Zif(配列番号18及び19)の図面である。
【図9】pPCFMS−Zifに挿入されたZif268ジンクフィンガータンパク質をコードする遺伝子に対する塩基配列及び相応する翻訳されたアミノ酸配列を表す(それぞれ配列番号20及び21)。制限酵素により認識される部位に下線を引いた。
【図10】生体内選別システムにより選択されたジンクフィンガータンパク質を使用して再形質転換(retransformation)及び交差形質転換(cross-transformation)から得た酵母細胞を有する培養プレートの写真である。
【図11】ヒトゲノム由来のジンクフィンガーライブラリーから生体内システムにより選択されたジンクフィンガードメインの特定DNA配列及びこのDNA配列によりコードされるアミノ酸配列の目録である(配列番号22−33)。ヒトゲノムからジンクフィンガードメインをコードするDNAセグメントを増幅させるのに使用される縮重(degenerate)PCRプライマーに相応するDNA配列に下線を引いた。4個の潜在的な塩基−接触位置を表示し、アミノ酸残基を太く表した。亜鉛イオンと配位結合することと予想される二つのCys残基及び二つのHis残基をイタリック体で表した。
【技術分野】
【0001】
本発明は、転写因子のようなDNA−結合タンパク質に関する。
【背景技術】
【0002】
大部分の遺伝子は、通常プロモーターまたはエンハンサー領域内にある、特定のDNA部位に結合するポリペプチド転写因子により転写レベルが調節される。これらのタンパク質は、プロモーター部位でRNAポリメラーゼにより転写開始を活性化または抑制し、それにより標的遺伝子の発現を調節する。活性化因子であれ抑制因子であれ、多くの転写因子は、構造的にモジュールである。そのようなモジュールは、構造的に別個のドメインとして組み合わせ可能であり、DNA結合、二量体化または転写機構(transcriptional machinary)との相互作用のような特異的な機能を有する。活性化ドメインまたは抑制ドメインのような効果ドメインは、非相同のDNA結合ドメインに転移されても、その機能を維持する〔Brent and Ptashne、(1985)Cell 43:729-36; Dawson et al.,(1995)Mol. Cell Biol. 15:6923-31〕。ジンクフィンガードメイン(zinc finger domain)、ホメオドメイン(homeodomain)、及びヘリックス−ターン−ヘリックス(helix-turn-helix)ドメインを含む多くのDNA結合ドメインの3次構造がNMR及びX線結晶構造解析データから決定されている。
【0003】
〔要約〕
本発明は、キメラ転写因子を同定し、製造するための、迅速で大規模な細胞的方法を提供する。そのような転写因子は、例えば、生物医学及び生物工学的応用において内生遺伝子の発現を変化させるために使用され得る。転写因子は、生体内、すなわち、無傷の生細胞内で検査される。また、本発明は、本発明の方法を、例えばゲノム配列のスクリーニングに適用することにより発見され得る新規核酸結合ドメインをも含む。
【0004】
本発明は、DNA上の標的部位を認識するペプチドドメインを同定する方法に関する。このような同定方法は本願において「ドメイン選別法」または「生体内スクリーニング法」ということもある。前記方法は(1)リポーター構築物(reporter construct)を含有する細胞及び(2)複数のハイブリッド核酸を提供することを含む。リポーター構築物は、プロモーターに作動可能に連結されたリポーター遺伝子を有し、プロモーターは、招集部位(recruitment site)及び標的部位(target site)を有する。リポーター遺伝子は、転写因子がプロモーターの招集部位及び標的部位を全て認識する場合(すなわち、基準を越える程度の結合時)には所定のレベルを超過して発現するが、転写因子がプロモーターの招集部位のみを認識する場合にはその限りでない。複数のハイブリッド核酸のそれぞれは、(i)転写活性化ドメイン、(ii)招集部位を認識するDNA結合ドメイン、及び(iii)試験ジンクフィンガードメインのような要素を含む非天然のタンパク質をコードする。試験ジンクフィンガードメインのアミノ酸配列は、複数のハイブリッド核酸のメンバー中で互いに異なる。前記選択方法は次を更に含む:複数のハイブリッド核酸中の一つ以上が一つ以上の細胞に入るようにする条件下で、複数の核酸を細胞と接触させること;細胞内でハイブリッド核酸が発現できるようにする条件で細胞を維持すること;細胞が、標的部位を認識する試験ジンクフィンガードメインをコードするハイブリッド核酸を含むことの指示として、所定レベル以上にリポーター遺伝子を発現する細胞を同定すること。
【0005】
DNA結合ドメイン、すなわち、招集部位を認識し、複数のハイブリッド構成員の中で変化しないないドメインは、例えば、一つ、二つ、三つ、またはそれ以上のジンクフィンガードメインを含むことができる。前記方法に利用される細胞は原核生物細胞または真核生物細胞であっても良い。真核生物細胞の例には、サッカロマイセス・セレビシエ(Saccharomyces cerevisiae)、シゾサッカロミセス ポンベ(Schizosaccharomyces pombe)、または、ピッチア パステウリス(Pichia pasteuris)のような酵母細胞;Sf9細胞のような昆虫細胞;及び繊維芽細胞またはリンパ球のような哺乳動物細胞を挙げることができる。
【0006】
ここで、「所定レベル(given level)」は、転写因子が招集部位は認識するが、標的部位は認識しない場合に観察される発現量である。ある場合には、「所定レベル」は0であっても良い(少なくとも使用される検定法の検出限度内で)。
【0007】
前記方法は、例えば、ゲノムDNA、mRNA混合物、またはcDNA混合物のような核酸から試験ジンクフィンガードメインをコードする核酸源(source nucleic acid)を増幅し、増幅された断片を生産する付加的な工程を含むことができる。核酸源はオリゴヌクレオチドプライマーを使用して増幅することができる。オリゴヌクレオチドプライマーは、ドメインの保存された境界をコードする核酸にアニールされる縮重オリゴヌクレオチド(例えば、相異する核酸配列を有する特定オリゴヌクレオチドのプール、またはイノシンのような非天然の塩基を有する特定オリゴヌクレオチド)のセット中の一つであり得る。また代替的に、前記プライマーは特定オリゴヌクレオチドであっても良い。増幅された断片は、前記方法に使用された複数のハイブリッド核酸に含まれるハイブリッド核酸を生産するために利用される。
【0008】
前記方法は、次の工程を更に含むことができる:(i)配列データベース中の候補ジンクフィンガードメインのアミノ酸配列を同定すること;(ii)候補ジンクフィンガードメインのアミノ酸配列をコードする候補核酸を提供すること;及び(iii)候補核酸を利用し、前述の方法に使用された複数のハイブリッド核酸に含まれるハイブリッド核酸を製作すること。前記データベースは、公知及び(または)予測されるタンパク質のような複数のアミノ酸配列に関する記録のみならず、cDNA、ESTs、ゲノムDNA、または予測されるイントロンを除去するためにコンピュータ処理されたゲノムDNAのような複数の核酸配列に対する記録を含むことができる。
【0009】
所望であれば、前記方法は第2標的部位(例えば、第1試験ジンクフィンガードメインにより認識される配列と異なる配列)を認識する第2試験ジンクフィンガードメインを同定するために反復することができる。続いて、同定された第1及び第2試験ジンクフィンガードメインの両方をコードする核酸を製作することができる。生成されるハイブリッドタンパク質は、第1試験ジンクフィンガードメインの標的部位及び第2ジンクフィンガードメインの標的部位の両方を含む標的部位を特異的に認識できるはずである。
【0010】
本発明はまた、試験ジンクフィンガードメインがプロモーター内の標的部位を認識するか否かを決定する方法に関する。本願では、この方法を「部位選別法」とも称する。前記方法はリポーター構築物及びハイブリッド核酸を提供する工程を含む。リポーター遺伝子は、招集部位及び標的部位を含むプロモーターに作動可能に連結され、転写因子がプロモーターの招集部位及び標的部位の両方を認識する場合、所定レベルを超過するレベルにリポーター遺伝子を発現させるが、転写因子がプロモーターの招集部位のみを認識する場合にはその限りでない。ハイブリッド核酸は、(i)転写活性化ドメイン、(ii)招集部位を認識するDNA結合ドメイン、及び(iii)試験ジンクフィンガードメインの要素を有する非天然生成タンパク質をコードする。前記方法は次のような工程を更に含む:リポーター構築物が細胞内に入るようにする条件下でリポーター構築物を細胞と接触させる工程;前記工程以前、以後、または前記工程と同時に、ハイブリッド核酸が細胞内に入るようにする条件下でハイブリッド核酸を細胞と接触させる工程;前記細胞をハイブリッド核酸が細胞内で発現できるようにする条件下で維持する工程;及び細胞内リポーター遺伝子の発現を検出する工程。リポーター遺伝子の発現が所定レベルより高いということは試験ジンクフィンガードメインが標的部位を認識するという指標である。
【0011】
前記リポーター構築物及びハイブリッド核酸は、別のプラスミドにそれぞれ含まれてもよい。二つのプラスミドは細胞に同時にまたは連続的に導入することができる。一つのプラスミドまたは2つのプラスミドの両方は、選別可能マーカーを含むことができる。また、リポーター構築物とハイブリッド核酸は、同一のプラスミド中に含まれてもよく、この場合には、リポーター構築物とハイブリッド核酸を細胞に導入するために単一回の接触工程のみが必要である。また他の実施態様では、リポーター構築物及びハイブリッド核酸中の一つまたは両者が、細胞のゲノムに安全に挿入される。前記方法の場合、本願に記述された任意の生体内方法において、転写活性化ドメインは転写抑制ドメインで代替することができ、この場合には、リポーター遺伝子の発現レベルが所定レベル未満に減少する細胞を同定するようになる。
【0012】
本発明の更なる他の方法は、2つの細胞の融合により、試験ジンクフィンガードメインの結合優先性の迅速な決定を容易にする。この方法は、リポーター遺伝子を含有する第1細胞を提供する工程;ハイブリッド核酸を含有する第2細胞を提供する工程;第1細胞及び第2細胞を融合させて融合細胞を形成する工程;融合細胞を融合細胞内でハイブリッド核酸の発現を可能にする条件下で維持する工程;及び融合細胞内リポーター遺伝子の発現を検出する工程を含み、ここで、リポーター遺伝子の発現レベルが所定レベルより高いということは試験ジンクフィンガードメインが標的部位を認識することを表す指標である。例えば、第1細胞及び第2細胞は組織培養細胞または真菌細胞であり得る。本方法の例示的な一実施態様では、酵母(S. cerevisiae)細胞が利用される。第1細胞は第1交配型(例えば、MATa)を有し、第2細胞は第1交配型と異なる交配型(例えば、MATα)を有する。2つの細胞を相互に接触させれば、酵母交配(yeast mating)により第1細胞及び第2細胞の両方のゲノムを含有する核を有する単一細胞(例えば、MATa/α)が作られる。本方法では、全て同一な第1交配型であり、それぞれの第1細胞が相異する標的部位を有するリポーター構築物を有する、複数の第1細胞を提供することを含んでもよい。全て同一な第2交配型であり、それぞれが相異する試験ジンクフィンガードメインを有する複数の第2細胞も提供される。全ての可能な対交配(pair-wise mating)のような複数の対交配でマトリックスを作る。この方法は、複数の結合部位(例えば、可能な標的部位の全ての完全なセット)に対する複数の試験ジンクフィンガードメインの結合優先性を決定するのに利用される。
【0013】
本発明はまた、試験ジンクフィンガードメインの結合優先性を検査する方法を提供する。本方法は、(1)本質的に全ての細胞がハイブリッド核酸を含有する細胞を提供する工程及び(2)複数のリポーター構築物を提供する工程を含む。複数のリポーター構築物のそれぞれは招集部位及び標的部位を含むプロモーターに作動可能に結合されたリポーター遺伝子を有する。リポーター遺伝子は転写因子がプロモーターの招集部位及び標的部位の両方を認識する場合には所定レベルを超過して発現されるが、転写因子が単にプロモーターの招集部位のみに結合する場合はその限りでない。複数のリポーター構築物の成員において、第2の標的部位は多様に変化する。ハイブリッド核酸は、以下の要素、すなわち、(i)転写活性化ドメイン、(ii)招集部位を認識するDNA結合ドメイン、及び(iii)試験ジンクフィンガードメイン、を有するハイブリッドタンパク質をコードする。本方法は、次の工程:複数のリポーター構築物中の少なくとも一つが、少なくとも一つの細胞に入るようにする条件下で、複数のリポーター構築物を細胞と接触させる工程;細胞内の核酸発現が可能な条件で細胞を維持する工程;細胞内にリポーター構築物を含有し、所定レベル以上にリポーター構築物を発現させる細胞(リポーター構築物が所定レベル以上に発現されるということは、細胞内のリポーター構築物がジンクフィンガードメインにより認識される標的部位を有するということを表す)を同定する工程、を更に含む。
【0014】
試験ジンクフィンガードメインが1つより多い標的部位に対して結合優先性を有する場合は、それぞれ異なる標的部位を有する複数の細胞を前記方法により同定することができる。前記方法は、最高レベルのリポーター遺伝子発現を示す細胞を同定することを更に含むことができる。別法として、リポーター遺伝子発現の臨界レベル(例えば、リポーター遺伝子発現が2、4、8、20、50、100、1000倍またはそれ以上増加するレベル)を決定し、臨界レベルを超えてリポーター遺伝子を発現させる全ての細胞を選択することもある。
【0015】
標的結合部位は、例えば、2〜6ヌクレオチド長であり得る。複数のリポーター構築物は標的結合部位の2、3、または4またはそれ以上の位置にA、T、G及びCヌクレオチドの全ての可能な組合を含むことができる。
【0016】
また他の側面において、本発明は複数のジンクフィンガードメインを同定する方法であることをその特徴とする。この方法は、第1試験ジンクフィンガードメインを同定するためにドメイン選別法を遂行し、また第1試験ジンクフィンガードメインの標的部位とは異なる標的部位を認識する第2試験ジンクフィンガードメインを同定するためにドメイン選別法を再遂行することを含む。更に他の特徴は、キメラジンクフィンガータンパク質をコードする核酸を生成する方法であり、この方法は第1及び第2試験ジンクフィンガードメインを同定するためにドメイン選別法を2回遂行し、第1及び第2試験ジンクフィンガードメインを含むポリペプチドをコードする核酸を構築することを含む。その核酸は、二つの下位部位(subsite)からなる部位を特異的に認識する二つのドメインを含むハイブリッドタンパク質をコードすることができる。下位部位は、それぞれ第1試験ジンクフィンガードメインの標的部位及び第2試験ジンクフィンガードメインの標的部位である。
【0017】
また他の側面において、本発明は、ジンクフィンガードメインにより認識されるDNA配列を同定する方法に関する。本方法は、第1試験ジンクフィンガードメインに対する第1結合優先配列を同定するための部位選別法の遂行、及び第2試験ジンクフィンガードメインに対する第2結合優先配列を同定するための部位選別法の再遂行を含む。同定された第1及び第2試験ジンクフィンガードメインを全てコードする核酸を構築することができる。その核酸は、第1試験ジンクフィンガードメインの標的部位及び第2試験ジンクフィンガードメインの標的部位を含む部位を特異的に認識する2つのドメインを含むハイブリッドタンパク質をコードすることができる。
【0018】
本発明はまた、DNA上の標的部位を認識するペプチドドメインを同定する方法を提供する。この方法は、(1)リポーター構築物を含有する細胞及び(2)複数のハイブリッド核酸を提供することを含む。リポーター構築物は、プロモーターに作動可能に連結されたリポーター遺伝子を有し、プロモーターは、招集部位及び標的部位を有する。リポーター遺伝子は、転写因子がプロモーターの招集部位及び標的部位を全て認識する場合(すなわち、基準を越える程度の結合時)には所定レベル未満で発現されるが、転写因子がプロモーターの招集部位のみを認識する場合にはその限りでない。複数のハイブリッド核酸のそれぞれは、以下の要素、(i)転写抑制ドメイン、(ii)招集部位を認識するDNA結合ドメイン、及び(iii)試験ジンクフィンガードメイン、と一緒に非天然のタンパク質をコードする。試験ジンクフィンガードメインのアミノ酸配列は、複数のハイブリッド核酸の成員中で変化がある。その方法は、次の工程:複数の核酸中の少なくとも一つが、少なくとも一つの細胞に入るようにする条件下で、複数の核酸を細胞と接触させる工程;細胞内でハイブリッド核酸が発現できるようにする条件で細胞を維持する工程;細胞が標的部位を認識する試験ジンクフィンガードメインをコードするハイブリッド核酸を含む指標として、リポーター遺伝子を所定レベル未満に発現させる細胞を同定する工程。本方法の追加実施態様も転写活性化ドメインを利用する方法と類似している。同様に、本願に記述された他のいかなる選別法も、転写活性化ドメインの代りに転写抑制ドメインを用いて遂行することができる。
【0019】
また他の側面において、本発明の特徴は、特定の精製されたポリペプチド及び単離された核酸である。本発明の精製されたポリペプチドは、下記のアミノ酸配列を有するポリペプチドを含む:
【0020】
Xa−X−Cys−X2-5−Cys−X3−Xa−X−Cys−X−Ser−Asn−Xb−X−Arg−His−X3-5−His(配列番号68)、
Xa−X−Cys−X2-5−Cys−X3−Xa−X−His−X−Ser−Asn−Xb−X−Lys−His−X3-5−His(配列番号69)
Xa−X−Cys−X2-5−Cys−X3−Xa−X−Ser−X−Ser−Asn−Xb−X−Arg−His−X3-5−His(配列番号70)、
Xa−X−Cys−X2-5−Cys−X3−Xa−X−Gln−X−Ser−Thr−Xb−X−Val−His−X3-5−His(配列番号71)、
Xa−X−Cys−X2-5−Cys−X3−Xa−X−Val−X−Ser−Xc−Xb−X−Arg−His−X3-5−His(配列番号72)、
Xa−X−Cys−X2-5−Cys−X3−Xa−X−Gln−X−Ser−His−Xb−X−Arg−His−X3-5−His(配列番号73、
Xa−X−Cys−X2-5−Cys−X3−Xa−X−Gln−X−Ser−Asn−Xb−X−Val−His−X3-5−His(配列番号74)、
Xa−X−Cys−X2-5−Cys−X3−Xa−X−Gln−X−Ser−Xc−Xb−X−Arg−His−X3-5−His(配列番号75)、
Xa−X−Cys−X2-5−Cys−X3−Xa−X−Gln−X−Ala−His−Xb−X−Arg−His−X3-5−His(配列番号150)、
Xa−X−Cys−X2-5−Cys−X3−Xa−X−Gln−X−Phe−Asn−Xb−X−Arg−His−X3-5−His(配列番号151)、
Xa−X−Cys−X2-5−Cys−X3−Xa−X−Gln−X−Ser−His−Xb−X−Thr−His−X3-5−His(配列番号152)、
Xa−X−Cys−X2-5−Cys−X3−Xa−X−Gln−X−Ser−His−Xb−X−Val−His−X3-5−His(配列番号153)、
Xa−X−Cys−X2-5−Cys−X3−Xa−X−Gln−X−Ser−Asn−Xb−X−Ile−His−X3-5−His(配列番号154)、
Xa−X−Cys−X2-5−Cys−X3−Xa−X−Gln−X−Ser−Asn−Xb−X−Arg−His−X3-5−His(配列番号155)、
Xa−X−Cys−X2-5−Cys−X3−Xa−X−Gln−X−Thr−His−Xb−X−Gln−His−X3-5−His(配列番号156)、
Cys−X2-5−Cys−X3−Xa−X−Gln−X−Thr−His−Xb−X−Arg−His−X3-5−His(配列番号157)、
Xa−X−Cys−X2-5−Cys−X3−Xa−X−Arg−X−Asp−Lys−Xb−X−Ile−His−X3-5−His(配列番号158)、
Xa−X−Cys−X2-5−Cys−X3−Xa−X−Arg−X−Ser−Asn−Xb−X−Arg−His−X3-5−His(配列番号159)、
Xa−X−Cys−X2-5−Cys−X3−Xa−X−Gln−X−Gly−Asn−Xb−X−Arg−His−X3-5−His(配列番号161)、
Xa−X−Cys−X2-5−Cys−X3−Xa−X−Arg−X−Asp−Glu−Xb−X−Arg−His−X3-5−His(配列番号162)、
Xa−X−Cys−X2-5−Cys−X3−Xa−X−Arg−X−Asp−His−Xb−X−Arg−His−X3-5−His(配列番号163)、
Xa−X−Cys−X2-5−Cys−X3−Xa−X−Arg−X−Asp−His−Xb−X−Thr−His−X3-5−His(配列番号164)、
Xa−X−Cys−X2-5−Cys−X3−Xa−X−Arg−X−Asp−Lys−Xb−X−Arg−His−X3-5−His(配列番号165)、
Xa−X−Cys−X2-5−Cys−X3−Xa−X−Arg−X−Ser−His−Xb−X−Arg−His−X3-5−His(配列番号166)、
Xa−X−Cys−X2-5−Cys−X3−Xa−X−Arg−X−Thr−Asn−Xb−X−Arg−His−X3-5−His(配列番号167)、
(ここで、Xaはフェニルアラニンまたはチロシンであり、Xbは疎水性残基であり、Xcはセリンまたはスレオニンである。)本発明の核酸は上記のポリペプチドをコードする核酸を含む。
【0021】
また、本発明の精製されたポリペプチドは、配列番号23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、103、105、107、111、113、115、117、119、121、123、125、127、129、131、133、135、137、141、143、145、147、149、または151と50%、60%、70%、80%、90%、93%、95%、96%、98%、99%、または100%同一なアミノ酸配列を有することができる。前記ポリペプチドはポリペプチドの核酸接触残基に相応するアミノ酸位置において、配列番号23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、103、105、107、111、113、115、117、119、121、123、125、127、129、131、133、135、137、141、143、145、147、149、または151と同一であり得る。または、前記ポリペプチドは、ポリペプチドの核酸接触残基に相当する残基中の少なくとも一つ以上の残基が、配列番号23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、103、105、107、111、113、115、117、119、121、123、125、127、129、131、133、135、137、141、143、145、147、149、または151と異なることができる。精製されたポリペプチドはまた、非相同のDNA結合ドメイン、核局在化シグナル、小分子結合ドメイン(例、ステロイド結合ドメイン)、エピトープタグまたは精製のための配列(精製ハンドル)、触媒ドメイン(例、核酸改質ドメイン、核酸切断ドメイン、またはDNA修復触媒的ドメイン)及び/または転写機能的ドメイン(例、活性化ドメイン、抑制ドメインなど)中の一つ以上を含むことができる。本発明はまた、前記ポリペプチドをコードする単離された核酸配列、及び配列番号22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、102、104、106、110、112、114、116、118、120、122、124、126、128、130、132、134、136、140、142、144、146、148または150、またはこれらの相補体からなるプローブ配列の単一鎖のプローブに厳しい条件下でハイブリダイズする単離された核酸配列を含む。本発明は、非相同の核酸結合ドメインに融合された本発明のポリペプチドを細胞内で発現させる方法を、更に含む。この方法は、前記融合タンパク質をコードする核酸を細胞に導入することを含む。このような本発明の核酸は、誘導可能プロモーター(例、ステロイドホルモン調節性プロモーター、小分子調節性プロモーター、またはテトラシクリンTet-On及びTet-Offシステムのような操作された誘導性システム)のような非相同の核酸配列により作動可能に調節され得る。
【0022】
「塩基接触位置」という用語は、配列番号21のアミノ酸、アルギニン73、アスパラギン酸75、グルタミン酸76、及びアルギニン79に構造的に対応するジンクフィンガードメインの4つのアミノ酸の位置をいう。これらの位置はまた−1、2、3、及び6位と称されることもある。問合せ配列において、塩基接触位置に相応する位置を同定するためには、問合せ配列のシステイン及びヒスチジン残基がZif268のフィンガー3のシステイン及びヒスチジン残基と並ぶように問合せ配列を問題のジンクフィンガードメインと整列させる。ヨーロッパ生物情報研究所(European Bioinformatics Institute)のClustalW WWWサービス (http://www2.ebi.ac.uk/clustalw;Thompson et al(1994))Nucleic Acids Res. 22:4673-4680)は、配列整列の一つの簡単な方法を提供する。
【0023】
「非相同の(heterologous)」という用語は、人為的に構成に導入されたポリペプチドであり、その構成に天然のには存在しないポリペプチドをいう。内生のものとの区別においては、非相同のポリペプチドは、いかなる天然に生じるポリペプチド中の側面に位置しない少なくとも1つの側面に位置するポリペプチド配列を有していてもよい。「ハイブリッド」という用語は、(i)少なくとも2つの天然に存在する異なった配列;(ii)少なくとも一つの人工配列(すなわち、天然に存在しない配列)及び一つの天然に存在する配列;または(iii)少なくとも二つの人工配列中のいずれか一つから由来するアミノ酸配列を含有するポリペプチドを指す。人工配列の例には、天然のに存在する配列の突然変異及び新たに設計された配列がある。
【0024】
本願で使用された「厳しい条件下でハイブリダイズする」という用語は、45℃で6×塩化ナトリウム/クエン酸ナトリウム(6×SSC)中でハイブリダイズさせ、次いで、65℃で0.2×SSC、0.1%SDSで2回洗浄する条件を指す。
【0025】
「結合優先性(binding preference)」という用語は、ポリペプチドが、他の結合部位に比べて一つの核酸結合部位を選別的に選択する識別力を指す。例えば、核酸結合部位に比較してポリペプチドが量的に制限されている場合、本願に記述された生体内または生体外の検査法で選好されない部位より選好される部位に更に多量のポリペプチドが結合するはずである。
【0026】
本願で使用される「認識(する)」という用語は、一つの核酸結合部位と第2の競合部位とを識別するポリペプチドの能力を指し、したがって、例えば、本願に記述された検査では第2の部位の過剰存在下において、ポリペプチドが、第1の結合部位に結合したままで残るようになる。このポリペプチドは、単独で第1の結合部位に対して十分な親和性を有しなくてもよいが、本発明のハイブリッドポリペプチドとして、隣接する招集部位に結合する他の核酸結合ドメインと融合された場合には、検査され得る。
【0027】
本願において用いられる「縮重オリゴヌクレオチド」とは、(a)相異するオリゴヌクレオチドの集団、及び(b)一つ以上の配列にアニーリングできる単一種のオリゴヌクレオチド(例えば、イノシンのような非自然的ヌクレオチドを有するオリゴヌクレオチド)の両方を意味する。
【0028】
本発明は、多様な利点を提供する。特定配列を認識するDNA結合ドメインを選別できる能力は、DNAの特定部位に結合する新規ポリペプチドの設計を可能にする。したがって、本発明は選択された標的の発現を調節することができる(例えば、病源体が必要とする遺伝子を抑制することができ、癌増殖が必要とする遺伝子を抑制することができ、または発現が良くできない遺伝子または突然変異タンパク質をコードする遺伝子を活性化または過剰発現することができる)新規ポリペプチドの必要に応じた生産を容易にする。
【0029】
ジンクフィンガードメインの使用は特に有利である。第一に、ジンクフィンガーモチーフは、非常に多様なDNA配列を認識する。第二に、自然発生的ジンクフィンガータンパク質の構造は、単位モジュール性である。例えば、「Egr−1」とも呼ばれるZif268ジンクフィンガータンパク質は三つのジンクフィンガードメインが直列で構成されている。図1は、DNAと複合体をなした三つのフィンガーからなるZif268ジンクフィンガータンパク質のX線決定構造である〔Pavletich and Pabo, (1991)Science 252:809-817〕。各フィンガーはDNA認識部位の3−4塩基対と独立に接触する。したがって、それぞれのフィンガーと接触した下位部位(subsite)は、独立的な分子的認識と見なされ得る。同一なポリペプチド鎖において複数のジンクフィンガー単位モジュールが協同効果を発揮することにより高親和度結合が達成される。
【0030】
生体内選別工程の使用は、細胞内環境でDNAの特定部位に結合するポリペプチドの直接的同定を可能にする。細胞、特に真核細胞において、認識に関連した因子らは、試験官内の選別シナリオ中に存在する因子らとは大いに異なる。例えば、真核細胞核において、ポリペプチドは特定核酸結合部位に対して無数に多くの異なる核タンパク質と競争しなければならない。ヌクレオソーム(nucleosome)またはその他のクロマチンタンパク質が結合部位を占めたり閉鎖したり、またはこの結合部位に競争的に作用できる。たとえ結合されていないとしても、細胞内の核酸構造は、折りたたみ、スーパーコイリング、捩れ、及び解捩に付される。反面、ポリペプチド自体は、その他の因子の中で、プロテアーゼ及びシャペロンに、露出されている。その上、ポリペプチドは、全体遺伝子の結合可能な部位と直面するようになり、そのようにして選別工程で選別されるためには所望の部位への高い特異性がなければならない。生体内の選別とは対照的に、生体外の選別は最高の特異性を有する結合物よりも、最高の親和性を有する結合物を選択することができる。
【0031】
発現されたポリペプチドキメラの結合能力を示すためにリポーター遺伝子を使用することは効果的で簡単であるのみならず、タンパク質−核酸接触面のエネルギー学、結合接触面に影響を与える周辺残基及びヌクレオチドのような数多くの周辺因子を計算に入れた複雑な相互作用コードを開発する必要がないため有利である〔Segal et al. (1999) Proc. Natl. Acad. Sci. USA 96:2758-2763〕。
【0032】
本発明は、それ自体でヒトゲノム、または他のいかなるゲノムに存在する全てのジンクフィンガードメインを有用にする。この、ジンクフィンガードメインの構造的フォルディングが占有する配列空間の多様なサンプリングは、自然選択の永年に本来備わった更なる利点を有することができる。その上、宿主種からのドメインを利用することにより、本願に記述された方法による遺伝子治療適用のために設計されたDNA結合タンパク質は宿主免疫応答によって非自己と取扱われる可能性が減少する。
【0033】
一つ以上の本発明の詳細な実施態様を添付図面及び下記説明により提示する。本発明の他の特徴、目的、及び利点は、この説明及び図面、及び請求項から明白になるであろう。
【0034】
詳細な説明
本発明は、試験ジンクフィンガードメインの核酸結合優先性を決定するための新たなスクリーニング法に関する。この方法は、多様なDNA結合ドメイン、これらドメインの多様な源泉及び数多くのライブラリー設計、数多くのリポーター遺伝子、及び数多くの選別及びスクリーニングシステムに適用することができる。このスクリーニング方法は高効率の基盤として遂行できる。このスクリーニング方法から得た情報は人工核酸結合タンパク質を設計する方法に直ちに利用され得る。この設計方法は、試験ジンクフィンガードメインの結合優先性を利用してキメラ核酸結合タンパク質のモジュラー組立に導く。設計されたタンパク質は、前記スクリーニング方法で更に最適化されたり、または変形され得る。
【0035】
DNA結合ドメイン
本発明は、相異する結合特異性を有する核酸結合ドメインの集合体を利用する。高い親和性及び高い特異性で、核酸に結合する多様なタンパク質構造が知られている。これらの構造は、核酸の機能を特異的に制御するために、無数の異なるタンパク質において繰り返し用いられる(二重螺旋DNAを認識する構造的モチーフ検討のために、例えば文献〔Pabo and Sauer (1992) Annu. Rev. Biochem. 61:1053-95; Patikoglou and Burley (1997) Annu. Rev. Biophys. Biomol. Struct. 26: 289-325;及びNelson (1995) Curr Opin Genet Dev. 5:180-9〕参照)。核酸結合ドメインに対する幾つかの非制限的な例は次の通りである。
【0036】
ジンクフィンガー。ジンクフィンガーは、約30個のアミノ酸残基からなる小さいポリペプチドドメインであり、その中には、システインまたはヒスチジンである4個のアミノ酸が、亜鉛イオンと配位結合をすることができるように、適切に間隔を置いて配置されている(図1参照;検討のために例えば文献〔Klug and Rhodes (1987) Trends Biochem. Sci. 12: 464-469 (1987); Evans and Hollenberg (1988) Cell 52: 1-3; Payre and Vincent (1988) FEBS Lett. 234: 245-250; Miller et al. (1985) EMBO J. 4:1609-1614; Berg (1988) Proc. Natl. Acad. Sci. U.S.A. 85:99-102;及びRosenfeld and Margalit (1993) J. Biomol. Struct. Dyn. 11: 557-570〕参照)。したがって、ジンクフィンガードメインは、亜鉛イオンと配位結合をする残基の種類により、例えば、Cys2−His2類、Cys2−Cys2類、Cys2−CysHis類などに分類できる。Cys2−His2ジンクフィンガーで亜鉛と配位結合する残基は典型的に Xa−X−C−X2-5−C−X3−Xa−X5−Ψ−X2−H−X3-5−H(ここで、ψ(プサイ)は疎水性残基である)のように配置されており〔Wolfe et al., (1999) Annu. Rev. Biophys. Biomol. Struct. 3:183-212〕(配列番号76)、ここで「X」は任意のアミノ酸を表し、Xaはフェニルアラニンまたはチロシンであり、下付き添字はアミノ酸の個数を指し、二つの下付き添字は介入するアミノ酸の典型的な範囲を指す。逆平行(anti-parallel)βシートが短いか、非理想的であるか、又は存在しなくてもよいが、典型的に、介入するアミノ酸は折りたたまれ、αヘリックスに対して充填される逆平行βシートを形成する。この折りたたみは、亜鉛と配位結合する側鎖が、亜鉛イオンと配位結合するのに適合した四面体構造中にあるように配置される。塩基接触残基はフィンガーのN−末端にあり、かつ、先行するループ領域にある(図2)。ジンクフィンガーDNA−結合タンパク質は、通常、三つ以上のジンクフィンガードメインの直列配置で構成される。
【0037】
ジンクフィンガードメイン(「ZFD」)は、最もありふれた真核生物DNA−結合モチーフ中の一つであり、酵母から高等植物及びヒトに至る多様な種で発見される。ヒトゲノムのみにも少なくとも数千種のジンクフィンガードメインが存在することと推測される。ジンクフィンガードメインは、ジンクフィンガータンパク質から単離することができる。ジンクフィンガータンパク質の非制限的な例には、CF2−II、クルペル(Kruppel)、WT1、バソヌクリン(basonuclin)、BCL−6/LAZ−3、赤芽球クルペル−様転写因子、転写因子Sp1、Sp2、Sp3及びSp4、転写抑制剤YY1、EGR1/Krox24、EGR2/Krox20、EGR3/Pilot、EGR4/AT133、Evi−1、GLI1、GLI2、GLI3、HIV−EP1/ZNF40、HIV−EP2、KR1、ZfX、ZfY及びZNF7などがある。
【0038】
下記電算的方法は、配列決定されたゲノム中の、または核酸データベース中の、全てのジンクフィンガードメインを同定するために用いられ得る。任意のジンクフィンガードメインを利用することができる。また、人工ジンクフィンガードメインが、例えば、電算的方法により設計された〔例えば、Dahiyat and Mayo(1997) Science 278:82-7〕。Dahiyat and Mayoのジンクフィンガーは、ジンクフィンガーの折りたたみは採択するが、その核に亜鉛イオンを含有しない。したがって、これは亜鉛イオンと配位結合するという機能的能力というよりは、そのポリペプチド骨格の、天然ジンクフィンガーの折りたたみとの構造的な類似性によるジンクフィンガーである。
【0039】
ホメオドメイン。ホメオドメインは、DNAの小さい溝(minor groove)と接触するN−末端腕及び続いて大きい溝(major groove)と接触する3個のαヘリックスで構成される単純な真核生物ドメインである〔例えば、Laughon、(1991) Biochemistry 30:11357-67参考〕。第三のαヘリックスは大きい溝中に位置し、決定的なDNA−接触側鎖を含有する。ホメオドメインは第三のαヘリックスに引導するターンに存在する高度に保存された特徴的なモチーフを有する。このモチーフはドメインの疎水性コア内に存在する不変トリプトファンを含む。このモチーフはプロサイト(Prosite)データベース(http://www.expasy.ch/参考)にPDOC00027として公知となっている(〔L/I/V/M/F/Y/G〕−〔A/S/L/V/R〕−X(2)−〔L/I/V/M/S/T/A/C/N〕−X−〔L/I/V/M〕−X(4)−〔L/I/V〕−〔R/K/N/Q/E/S/T/A/I/Y〕−〔L/I/V/F/S/T/N/K/H〕−W−〔F/Y/V/C〕−X−〔N/D/Q/T/A/H〕−X(5)−〔R/K/N/A/I/M/W〕;配列番号77)。ホメオドメインは、細胞同一性を決定し、有機体の発生過程で位置的な情報を提供する転写因子でしばしば発見される。そのような古典的なホメオドメインは、ゲノム中にクラスターで発見することができ、クラスター中のホメオドメインの順番は、ボディー軸(body axis)に沿ったホメオドメインの発現パターンに大体相当している。ホメオドメインは、例えば、Hox−1のようなホメオドメインとのアラインメントにより、またはホメオドメインプロファイルまたはホメオドメイン隠れマルコフモデル(hidden Markov Model;HMM;下記参照)、例えば、PfarmデータベースのPF00046またはSMARTデータベースの「HOX」との整列により(http://smart.embl-heidelberg.de/)、または前記のプロサイトモチーフPDOC00027により同定可能である。
【0040】
ヘリックス−ターン−ヘリックスタンパク質。このDNA結合モチーフは、多くの原核生物転写因子中でしばしば発見される。例えば、LacI族、AraC族など、多くの亜族がある。名称において二つのヘリックスはDNAの大きい溝に対して位置し、第二のαヘリックスをDNAの大きい溝内に配置する第一のαヘリックス及びこのようにDNAの大きい溝に位置する第二のαヘリックスである。これらドメインはHMM、例えば、SMARTデータベースから得られるHTH_ARAC、HTH_ARSR、HTH_ASNC、HTH_CRP、HTH_DEOR、HTH_DTXR、HTH_GNTR、HTH_ICLR、HTH_LACI、HTH_LUXR、HTH_MARR、HTH_MERR及びHTH_XREプロファイルとのアラインメントにより同定される(http://smart.embl-heidelberg.de/)。
【0041】
ヘリックス−ループ−ヘリックスタンパク質。このDNA結合ドメインは、例えば、MyoD、fos、jun、E11及びミオゼニンのようなホモ−及びヘテロ−二量体転写因子間に共通的に発見される。このドメインは、二量体及びその間のループからなり、各単量体は二つのαヘリックスにかけて結合する。このドメインは、例えば、SMARTデータベース(http://smart.embl-heidelberg.de/)で利用可能な「HLH」プロファイルのようなHMMとのアラインメントにより同定できる。たとえヘリックス−ループ−ヘリックスタンパク質は、典型的に二量体性であるが、ポリペプチドリンカーを二つのサブユニット間に設計して単一オープンリーディングフレーム(open reading frame)が二つのサブユニット及びリンカーをコードさせることにより単量体性バージョンを構築することができる。
【0042】
DNA−結合ドメインの同定
多様な方法を使用して構造ドメインを同定することができる。
電算的方法(Computational Method)。本明細書に記述された方法により単離されたDNA結合ドメインのアミノ酸配列を公知配列のデータベース、例えば、タンパク質配列の注釈をつけたデータベースまたは核酸結合ドメインに対する記入を含む注釈をつけたデータベースと比較できる。また他の実施面では、非特性化された配列、例えば、注釈を付けていないゲノム配列、ESTまたは全長cDNA配列;特性化された配列、例えば、SwissProtまたはPDB;及びドメイン、例えば、Pfarm、ProDom(http://www.tooulouse.inra.fr/)、及びSMART(Simple Modular Architecture Research Tool, http://smart.embl-heidelberg.de/)のデータベースが核酸結合ドメイン配列の源泉を提供できる。問合せアミノ酸配列と比較するために核酸配列データベースを全ての6個の読み枠(reading frame)に翻訳することができる。候補核酸結合ドメインをコードするという標識をされた核酸配列は、適当な核酸源、例えば、ゲノムDNAまたは細胞RNAから増幅できる。そのような核酸配列は、発現ベクタにクローニングできる。コンピュータに基づいたドメイン同定の前記手順は、オリゴヌクレオチド合成器及びロボットシステムと連係させて高い効率でドメインをコードする核酸を生産することができる。候補ドメインをコードするクローン化された核酸は、宿主発現ベクタに貯蔵し、制限酵素媒介サブクローニングまたは部位−特異的組換え酵素媒介サブクローニング(米国特許第5,888,732号参照)によりZif268フィンガー1及び2と共に発現ベクタ、例えば、翻訳融合ベクタ内に導入させることができる。高い作業処理量のため、相異する候補核酸結合ドメインをコードする核酸を含有する複数のマイクロタイタープレートを生成するため、高効率の基盤(platform)を用いることができる。
【0043】
出発配列またはプロファイルからドメインを同定する細詳な方法は、当業界に周知である。例えば、プロサイト(〔Hofmann et al.,(1999) Nucleic Acids Res. 27:215-219〕参照)、FASTA、BLAST(〔Altschul et al.,(1990) J.Mol.Biol. 215:403-10〕参照)などが参照できる。簡単なストリング検索を遂行して問合せ配列または問合せプロファイルに対する同一性を有するアミノ酸配列を見出すことができ、例えば、Perl(http://bio.perl.org/)を使用してテキストファイルをスキャニングすることができる。このように同定された配列は、初期入力配列に対して約30%、40%、50%、60%、70%、80%、90%またはそれ以上の同一性を表すことができる。
【0044】
問合せドメインと類似したドメインを公共データベース、例えば、文献〔Altschul et al.,(1990)J.Mol.Biol. 215:403-10〕のXBLASTプログラム(バージョン2.0)を使用して同定することができる。例えば、スコア=50、単語長=3のXBLAST変数を使用してBLASTタンパク質検索を遂行することができる。文献〔Altschul et al.,(1997) Nucleic Acids Res.25(17): 3389-3402〕に記述されているように、問合せ配列または検索された配列に間隔を導入することができる。XBLAST及びGapped BLASTプログラムに対するディフォルト変数はhttp://www.ncbi.nlm.nih.govサイトで求めることができる。
【0045】
プロサイトプロファイルPS00028及びPS50157を使用してジンクフィンガードメインを同定することができる。SWISSPROT公表の80,000個のタンパク質配列において、これらプロファイルはそれぞれ3189及び2316個のジンクフィンガードメインを見出した。多様な相異する技法を使用して関連したタンパク質の多重配列アラインメントからプロファイルが構築できる。グリブスコフ(Gribskov)及びその同僚ら〔Gribskov et al.,(1990)Meth.Enzymol.183:146-159〕は記号比較表を利用し、残基頻度分布が提供された多重配列アラインメントを各位置に対する重さに転換した。例えば、プロサイトデータベース及び文献〔Luethy et al.,(1994) Protein Sci.3:139-1465〕の作業が参照できる。
【0046】
関心のあるDNA結合ドメインを代表する隠れマルコフモデル(Hidden Markov Models;HMM's)は、例えば、パーム(Pfarm)データベース、リリース2.1のようなそのようなモデルのデータベースから生成され又は得ることができる。追加的なドメインを見出すために、例えば、前記ディフォルト変数を使用してHMMでデータベースを検索することができる(例えば、ディフォルト変数のためにhttp://www.sanger.ac.uk/Software/Pfam/HMM_search参照)。または、使用者は前記変数を最適化させることができる。境界スコアを選択して配列データベースを濾過することにより、境界以上のスコアを有する配列が候補ドメインとして表示されるようにすることができる。Pfarmデータベースの説明は、文献〔Sonhammer et al.,(1997) Proteins 28(3):405-420〕で見出すことができ、HMMに関する詳細な説明は、例えば、文献〔Gribskov et al.,(1990) Meth.Enzymol.183:146-159; Gribskovetal., (1987) Proc.Natl.Acad.Sci.USA 84:4355-4358; Krogh et al.,(1994) J.Mol.Biol.235:1501-1531;及びStultz et al.,(1993) Protein Sci.2:305-314〕で見出すことができる。
【0047】
HMMのSMARTデータベース(Simple Modular Architecture Research Tool, http://smart.embl-heidelberg.de/;文献〔Schultz et al.,(1998) Proc. Natl. Acad. Sci.USA 95:5857;及びSchultz et al.,(2000) Nucl.Acids Res 28:231〕)は、HMMer2検索プログラム(文献〔Durbin et al.,(1998) Biological sequence analysis: probabilistic models of proteins and nucleic acids. Cambridge University Press.〕;http://hmmer.wustl.edu/)のヒドン・マルコフモデルでプロファイルすることにより同定されたジンクフィンガードメインのカタログ(ZnF_C2H2;ZnF_C2C2;ZnF_C2HC;ZnF_C3H1;ZnF_C4;ZnF_CHCC;ZnF_GATA;及びZnF_NFX)を提供する。
【0048】
ハイブリダイゼーションに基づいた方法。多様な形態のDNA結合ドメインをコードする核酸集合体を分析してアミノ末端及びカルボキシ末端の保存された境界配列をコードする配列プロファイルを得ることができる。そのような保存された境界配列をコードする核酸配列に混成化できる縮重オリゴヌクレオチドが設計できる。また、そのような縮重オリゴヌクレオチドの有効性はそれらの組成と公知となったゲノム配列上の可能なアニーリング部位の頻度を比較することにより評価され得る。複数反復された設計により縮重オリゴヌクレオチドを最適化することができる。例えば、公知のCys2−His2ジンクフィンガーを比較することにより、天然配列中の隣接フィンガー間のリンカー地域の共通配列が明らかになった(文献〔Agata et al.,(1998) Gene 213:55-64〕参照)。そのような縮重オリゴヌクレオチドは、複数のDNA結合ドメインを増幅させるのに使用される。増幅されたドメインを試験ジンクフィンガードメインとしてハイブリッド核酸に挿入し、後続的に、本明細書に記述された方法により標的部位への結合を分析する。
【0049】
ライブラリー設計
この方法は、DNA結合ドメインをコードする核酸の集合体(例えば、プラスミド、ファージミドまたはフアージライブラリーの形態)において機能的核酸結合特性のスクリーニングを可能にする。前記集合体は、多様な群のDNA結合ドメインがコードでき、更には相異する構造的折りたたみを有するドメインもコードできる。一例として、前記集合体はジンクフィンガードメインのような単一の構造的折りたたみのドメインをコードする。下記方法が、ジンクフィンガードメインに関して記述されたが、当業者であれば、これを他の類型の核酸結合ドメインに応用できるはずである。
【0050】
ドメイン突然変異。さらに一例において、前記核酸集合体は、縮重パターンライブラリーから組立てられる構造ドメインをコードする核酸で構成される。例えば、ジンクフィンガーの場合、公知ジンクフィンガーのアラインメントを、各位置における最も適合したアミノ酸を同定するために用いることができる。別法として、構造的研究及び突然変異誘発(mutagenesis)実験を、各位置のアミノ酸の望ましい特性を決定するために用いることができる。任意の核酸結合ドメインを、突然変異を導入するための構造的基盤として用いることができる。特に、核酸と結合する部位に非常に近接した位置またはそのような位置に隣接した位置を突然変異誘発のための標的にすることができる。パターン化された縮重ライブラリーを使用することにより、突然変異した試験ジンクフィンガードメインを、突然変異位置における可能なアミノ酸の小集団に限定することができる。各位置に前記プロファイルをコードするために縮重コドンセットを使用することができる。例えば、疎水性残基のみを、脂肪族残基のみをまたは親水性残基のみをコードするコドンセットが利用可能である。折りたたまれたポリペプチドをコードする全長クローンについて、前記ライブラリーを選別することができる。文献〔Cho et al.,(2000) J.Mol.Biol. 297(2):309-19〕では、縮重オリゴヌクレオチドを使用してそのような縮重ライブラリーを製造する方法を提供し、また全長ポリペプチドをコードするライブラリー核酸を選別する方法を提供する。このような核酸は本明細書に記載された選別法のために、便利な制限酵素切断部位または転位酵素(transposase)または組換え酵素(recombinase)認識部位を使用して発現プラスミドに容易に挿入することができる。
【0051】
適当なコドン及び所定の位置における各ヌクレオチドの相対比率の選択は、遺伝子コードを表す表を簡単に調査したり、または電算的アルゴリズムにより決定できる。例えば、前記チョー(Cho)らの文献には、要望される縮重タンパク質配列を受け付け、その配列をコードする望ましいオリゴヌクレオチド設計を出力する電算プログラムが記載されている。
【0052】
天然の種類のドメインの単離。ドメインライブラリーをヒトのような真核生物のゲノムDNAまたはcDNAから構築することができる。このために複数の方法が可能である。例えば、前記したように、利用可能なアミノ酸配列のコンピューター検索によりドメインが同定できる。各ドメインをコードする核酸を単離し、例えば、プロモーター、活性化ドメイン及び選別マーカーを含有するベクターのような、細胞内での発現に適当なベクターに挿入することができる。また他の例において、保存されたモチーフにハイブリダイズする縮重オリゴヌクレオチドを、例えば、PCRによりこのモチーフを含有する複数の関連ドメインを増幅するために用いることができる。例えば、クルペル様Cys2His2ジンクフィンガーを、文献〔Agata et al.,(1998) Gene 213:55-64〕の方法により増幅することができる。この方法はまた、例えば、Thr−Gly−(Glu/Gln)−(Lys/Arg)−Pro−(Tyr/Phe)(配列番号78)のようなパターンを有する配列である、ジンクフィンガードメインの自然発生的リンカーペプチド配列を保持する。さらに、この方法は関心のあるドメインに限定された集合体のスクリーニングであるゆえに、選択されていないゲノムライブラリーまたはcDNA配列のライブラリーのスクリーニングとは異なり、ライブラリーの複雑性が非常に減少され、大規模ライブラリーを完全にスクリーニングすることの様的な困難のために望ましい配列を逃す可能性を減少させる。
【0053】
ヒトゲノムは、多様なジンクフィンガードメインを含有し、このうちの多くは特徴づけされず、かつ同定されていない。ジンクフィンガードメインを有するタンパク質をコードする数千個の遺伝子があると推定される〔Pellegrino and Berg,(1991) Proc.Natl.Acad.Sci. USA 88:671-675〕。これらヒトジンクフィンガードメインは、新規のDNA−結合タンパク質が構築され得る多様なドメインの広範囲な集合体である。各ジンクフィンガードメインが独特の3−乃至4−bp配列を認識する場合、全ての可能な3−乃至4−bp配列に結合するのに必要なドメインの総数は単に64乃至256(43乃至44)個である。ヒトゲノムの天然レパートリーが、全ての可能な認識部位に及ぶために、充分な数の独特のジンクフィンガードメインを含有している可能性がある。これらジンクフィンガードメインは人工キメラDNA結合タンパク質を構築するための価値あるソースである。自然発生のジンクフィンガードメインは、ヒトゲノムに由来する人工的突然変異とは異なり、自然選択圧下で進化したものであり、したがって、特定のDNA配列への結合及び生体内機能のために自然的に最適化されたものであり得る。
【0054】
ヒトジンクフィンガードメインは、例えば、遺伝子治療の応用において、人体に導入された場合に免疫応答を誘導する可能性が遥かに少ない。
【0055】
特定DNA結合特性を有するジンクフィンガードメインの生体内選別
所望のDNA認識特性を有するジンクフィンガードメインを次のような生体内スクリーニングシステムを使用して同定することができる。問題の複合結合部位をリポーター遺伝子の上流に挿入し、複合結合部位に転写活性化ドメインを誘引・招集することにより、リポーター遺伝子の転写が所定レベル以上に増加するようにした。固定されたDNA結合ドメインに融合された試験ジンクフィンガードメイン及び転写活性化ドメインで構成されたハイブリッドタンパク質をコードする発現プラスミドを構築した。
【0056】
複合結合部位は、少なくとも二つの要素、すなわち、招集部位及び標的部位からなる。このシステムで固定されたDNA結合ドメインが招集部位を認識するように設計される。しかし、招集部位に対する固定されたDNA結合ドメインの結合親和度は、生体内で単独にはリポーター遺伝子を転写活性化させるのに不充分な程度である。これは、対照群の実験により確認することができる。
【0057】
例えば、細胞内で発現された場合、固定されたDNA結合ドメインは(試験ジンクフィンガードメインの不在、または非機能的であると知られたり、または公知となったDNA接触残基がアラニンのような代替アミノ酸で置換された試験ジンクフィンガードメインの存在下では)リポーター遺伝子の転写を通常のレベル以上に活性化させられてはならない。他の手段により(例えば、リポーターに対する競争的抑制剤の使用により)システムの敏感度を増加させることができるため、若干の漏出または低いレベルの活性化は許容される。固定されたDNA結合ドメインは、招集部位に安定的に結合しないことと予想される。例えば、固定されたDNA結合ドメインは約0.1nM、1nM、1μM、10μM、100μMまたはそれ以上の解離定数(Kd)で招集部位に結合することができる。標的部位に対するDNA結合ドメインのKdは、試験ジンクフィンガードメインの不在下でまたは第2標的部位に対する特異性を有する試験ジンクフィンガードメインの不在下で、電気泳動移動検定(electrophoretic mobility shift assay;EMSA)により試験管内で測定可能である。
【0058】
したがって、ハイブリッドタンパク質が細胞内複合結合部位に安定的に結合し、これによりリポーター遺伝子を活性化させるためには、例えば、複合結合部位の多様な部位等の標的部位を認識する機能的(functional)試験ジンクフィンガードメインの付着が必要である。標的部位に対する試験ジンクフィンガードメインの結合優先度により所定レベルに比べて増加したリポーター遺伝子発現をもたらす。例えば、観察された発現レベルを所定レベルで割って得られるリポーター遺伝子発現の増加倍数は約2、4、8、20、50、100、1000倍またはそれ以上であり得る。試験ジンクフィンガードメインが標的部位を認識する場合、DNA結合ドメイン及び試験ジンクフィンガードメインを含む転写因子のKdは、例えば、標的部位に対する特異性を有する試験ジンクフィンガードメインを欠如した転写因子に比べて増加する。例えば、特異性を有する標的部位と複合体を成した転写因子の解離定数(Kd)は約50nM、10nM、1nM、0.1nM、0.01nMまたはそれ未満であり得る。Kdは試験管内EMSAにより決定され得る。
【0059】
試験ジンクフィンガードメインが固定DNA結合ドメインの生体内結合親和性を増大させる能力を測定することにより、敏感で正確にDNA結合特異性が検査できるこのような発見は、ヒトゲノムから新規ジンクフィンガードメインの迅速な単離及び特性化を可能にする。
【0060】
固定されたDNA結合ドメインは、すなわち、例えば、複数のドメインを有するか、またはオリゴマーである自然発生的DNA−結合タンパク質等の自然発生のDNA−結合タンパク質から単離された単位的ドメインを含む。例えば、Zif268のフィンガー1及び2のような二つの公知のジンクフィンガーの両方を、固定されたDNA結合ドメインとして使用することができる。当業者であれば、数多くの核酸結合ドメイン(例えば、ホメオドメイン、ヘリックス−ターン−ヘリックスドメインまたはヘリックス−ループ−ヘリックスドメインのような本明細書に記載されたドメインファミリー、または当業界で特性が知られた核酸結合ドメイン)からシステムに好適な固定DNA結合ドメインを同定することができるはずである。固定されたDNA結合ドメインにより認識される招集部位の適切な選択が更に要求される。招集部位は、固定されたDNA結合ドメインが得られた自然発生のDNA結合タンパク質に対する天然の結合部位内の下位部位(subsite)であり得る。必要に応じて、固定ドメインまたは招集部位に突然変異を導入してシステムの敏感性を増加させることができる。
【0061】
生体内のスクリーニングシステムに適合した細胞には真核細胞及び原核細胞全てが含まれる。例示的な真核細胞には、例えば、サッカロマイセス・セレビジエ(Saccharomyces cerevisiae)、サッカロマイセス・ポムベ(Saccharomyces pombe)及びピッチア・パストリス(Pichia pastoris)細胞のような酵母細胞などがある。
【0062】
前記スクリーニングシステムを使用してジンクフィンガードメインを選択するために、サッカロマイセス・セレビジエを使用する酵母ワン−ハイブリッドシステムを変形させた。まず、HIS3リポーター遺伝子をコードするリポータープラスミドを調製した。予め決定された4−bp標的DNA配列を、切断された結合配列に連結させてDNA−結合ドメインについての複合結合配列を提供し、それぞれの複合結合配列を別個のプラスミド上のリポーター遺伝子に作動可能に連結させた。
【0063】
ハイブリッド核酸配列は、切断されたDNA結合ドメイン及びジンクフィンガードメインを含むDNA結合ドメインに連結された転写活性化ドメインをコードする。
【0064】
本願で使用された結合部位は、隣接した(連続的な)部位が頻繁に使用されるが、必ずしも隣接する必要はない。隣接していない部位を認識するタンパク質を調製するためには、核酸結合ドメイン間に伸縮性があるか、及び/又は、伸張性があるリンカーを使用し得る。
【0065】
本発明の一態様によれば、Zif268のフィンガー1及びフィンガー2で構成され、フィンガー3が欠如されたポリペプチドを固定されたDNA結合ドメインとして使用することができる(Zif268の3個のジンクフィンガー中、フィンガー1はN−末端、フィンガー2は中間、フィンガー3はC−末端に位置するジンクフィンガードメインを指す)。また、結合部位が特徴づけられた如何なる2個のジンクフィンガードメインでも固定されたDNA結合ドメインとして使用することができる。
【0066】
他の有用な固定されたDNA結合ドメインは他のジンクフィンガータンパク質、例えば、Sp1、CF2−II、YY1、クルペル(Kruppel)、WT1、Egr2、またはPOU−ドメインタンパク質、例えば、Oct1、Oct2、及びPit1から由来し得る。しかし、これらは例として提供されたものであり、本発明はこれらに限定されない。
【0067】
本発明の一具体的な実施例によれば、最適のZif268認識配列(5′−GCG TGG GCG−3′)の5′末端から4−bpを欠損させて生成された5′−GGGCG−3′塩基配列が招集部位として使用され得る。3乃至4bpのいかなる標的配列でも、これら招集部位に連結されて複合結合配列が生成できる。
【0068】
活性化ドメイン。本発明で使用することができる転写活性化ドメインは、酵母のGal4活性化ドメイン及びヘルペスシンプルレックスウイルスのVP16ドメインを含むが、これに限定されない。バクテリアにおいて活性化ドメインの機能は、野生型RNAポリメラーゼαサブユニットC−末端ドメインまたは突然変異体αサブユニットC−末端ドメインを招集できる融合ドメイン(例えば、タンパク質相互作用ドメインに融合されたC−末端ドメイン)により摸倣できる。
【0069】
抑制ドメイン。所望であれば、活性化ドメインの代りに抑制ドメインがDNA結合ドメインに融合され得る。真核細胞抑制ドメインの例には、オレンジ(ORANGE)、グローチョー(groucho)、及びWRPW〔Dawson et al (1995) Mol.Cell Biol. 15:6923-31〕が含まれる。抑制ドメインを使用する時は、毒性リポーター遺伝子及び(または)非選択性マーカーを使用して減少した発現を示す個体をスクリーニングすることができる。
【0070】
リポーター遺伝子。リポーター遺伝子は、例えば、薬物耐性を付与する遺伝子、または栄養要求性マーカーのような選択性マーカーであり得る。薬物耐性遺伝子の例には、サッカロマイセス・セレビシエ(S. cerevisiae)シクロヘキサミド耐性遺伝子(CYH)、サッカロマイセス・セレビシエカナバニン耐性遺伝子(CAN1)、及びハイグロマイシン耐性遺伝子などがある。サッカロマイセス・セレビシエ栄養要求性マーカーには、URA3、HIS3、LEU2、ADE2及びTRP1遺伝子などがある。栄養要求性マーカーがリポーター遺伝子である時は、栄養要求性遺伝子の機能的コピーが欠けているため、特定代謝物質が生産できる能力が欠如された細胞が使用される。代謝物質が欠如した培地で細胞を維持することにより、標的部位に結合する試験ジンクフィンガードメインをコードする構築物の選択が可能である。例えば、HIS3遺伝子はhis3−酵母菌株と共に選択性マーカーとして使用され得る。ハイブリッド転写因子をコードする構築物の導入後に、細胞をヒスチジン欠乏培地上で成長させる。哺乳類細胞の選択可能マーカーには、例えば、チミジンキナーゼ、ネオマイシン耐性、及びHPRTが当業者によく知られている。
【0071】
別法として、リポーター遺伝子がコードするタンパク質の存在を容易に確認し、及び/又は定量化することができる。そのようなリポーター遺伝子の例には、lacZ、クロラムフェニコールアセチルトランスフェラーゼ(CAT)、ルシファラーゼ、緑色蛍光タンパク質(GFP)、β−グルクロニダーゼ(GUS)、青色蛍光タンパク質(BFP)及び例えば、変更されたり向上した蛍光特性を有するGFP誘導体〔Clontech Laboratories,Inc., CA〕などがある。lacZを発現する細胞のコロニーは比色基質X−galを含むプレートでコロニーを成長させることにより検出することができる。GFP発現は、励起の上、蛍光放出を測定して検出することができる。個々のGFP発現細胞は蛍光活性化細胞分類機(FACS)を使用して同定され、分離され得る。
【0072】
このシステムは、2種類のリポーター遺伝子(例えば、選択可能リポーター遺伝子及び選択不可能リポーター遺伝子)を利用して構築され得る。選択可能マーカーは、適当な成長条件下で所望のドメインを有する細胞のみが成長するようにするので、所望のドメインの迅速な同定を容易にする。選択不可能リポーターは、例えば、偽陽性を区別するための確認手段、及び結合程度を定量化する手段を提供する。前記二つのリポーターは、ゲノムの互いに異なる位置に挿入されることができ、ゲノムに直列に挿入されることができ、同一の染色体外の要素(例えば、プラスミド)に含まれたり、または互いに異なる染色体外要素に含まれることができる。
【0073】
図5は、所望のジンクフィンガードメインを選別するために使用された変形したワン−ハイブリッドシステムの原理を示す。ハイブリッド転写因子のDNA結合部位は(a)Zif268のフィンガー1及びフィンガー2からなる切断されたDNA結合部位と(b)ジンクフィンガードメインAまたはBで構成される。リポーター遺伝子のプロモーター領域に位置した結合部位の塩基配列は、4bpの標的配列(ヌクレオチド1−4,5′−XXXX−3′)及び切断された結合配列(ヌクレオチド5−9,5′−GGGCG−3′)からなる複合結合配列(5′−XXXXGGGCG−3′)である。
【0074】
ハイブリッド転写因子内の試験ジンクフィンガードメイン(図5のA)が標的配列を認識するならば、ハイブリッド転写因子は複合結合配列に安定に結合できる。このような安定した結合はハイブリッド転写因子の活性化ドメインの作用(図5のAD)を通じてリポーター遺伝子の発現をもたらす。その結果、HIS3がリポーター遺伝子として使用された時、形質転換酵母はヒスチジンが欠如された培地で成長する。または、lacZがリポーター遺伝子として使用された時には、形質転換酵母はlacZタンパク質の基質であるX−galを含む培地で青色コロニーとして育つ。しかし、ハイブリッド転写因子のジンクフィンガードメイン(図5のB)が標的配列を認識するのに失敗すれば、リポーター遺伝子の発現は誘導されない。その結果、形質転換酵母はヒスチジンを欠如した培地で成長できないか(HIS3がリポーター遺伝子として使用された時)、またはX−galを含む培地で白色コロニーとして成長するようになる(lacZがリポーター遺伝子として使用された時)。
【0075】
この改変されたワン−ハイブリッドシステムを利用する選別法は、この過程を通じて選別されたジンクフィンガードメインが細胞内環境で機能的であると立証されたため、有利である。したがって、このドメインは恐らく折りたたまれ、核に入ることができ、細胞内プロテアーゼ及び損傷が与えられる他の可能な細胞内物質に対して耐えられると推測される。その上、本願で開示された改変されたワン−ハイブリッドシステムは、所望のジンクフィンガードメインの簡単で迅速な単離を可能にする。本願の改変されたワン−ハイブリッドシステムでは、所望のジンクフィンガードメインを単離するために単1回の酵母形質転換のみを必要とする。
【0076】
本願で記述された選別法は、例えば、植物または動物(例えば、哺乳類、例えば、ヒト)種のゲノム等のゲノムからジンクフィンガードメインを同定するのに使用することができる。また、本方法は、例えば、無作為突然変異法により調製された突然変異ジンクフィンガードメインのライブラリーからジンクフィンガードメインを同定するのに使用することができる。また、前記2つの方法は一緒に使用され得る。例えば、特定3−bpまたは4−bpDNA配列に対するジンクフィンガードメインがヒトゲノムから単離されなかった場合に、無作為または部位指示的突然変異誘導により調製されたジンクフィンガードメインのライブラリーを前記ドメインについてスクリーニングすることができる。
【0077】
酵母における改変されたワン−ハイブリッドシステムが与えられた標的配列を認識し、結合するジンクフィンガードメインを選別するために望ましい方法であるが、当業者ならば酵母ワン−ハイブリッド選別法以外に他のシステムが使用され得ることが明らかなはずである。例えば、真核生物体のゲノムから由来した自然的に発見されるジンクフィンガードメインのライブラリーをスクリーニングするのにファージディスプレイ選別法が使用されることもある。
【0078】
本発明は、多様な培養細胞にワン−ハイブリッド法を使用することを含む。例えば、標的配列に作動可能に連結されたリポーター遺伝子を培養中の原核細胞または動物または植物細胞に導入でき、そして、培養細胞をジンクフィンガードメインのライブラリーをコードするプラスミド、ファージ、またはウイルスで形質移入することができる。その後、リポーター遺伝子が活性化された単離された細胞から、標的配列を認識する所望のジンクフィンガードメインを得ることができる。
【0079】
下記に示された実施例は、前記方法が関心のある結合部位を認識するジンクフィンガードメインが同定できることを証明する。フィンガー3に位置した多様なジンクフィンガードメインを有するハイブリッド転写因子のライブラリーを調製した。前記ライブラリーから選別された新規なジンクフィンガードメイン(例えば、HSNK、QSTV、及びVSTRジンクフィンガー;後述する)中、いずれのものも相当する親フィンガータンパク質ではC−末端に天然には位置しなかった。これは、ジンクフィンガードメインは単位的(モジュール性)ということと、ジンクフィンガードメインを適切に混合し、配列して新規なDNA結合ドメインが構成できるということを明確に証明する。
【0080】
本発明の方法により選別されたジンクフィンガードメインは、適切な再配列及び組換えにより新規なDNA結合タンパク質を作るための組立単位として使用され得る。例えば、HIV−1の共受容体であるヒトCCR5のプロモーター領域を認識する新規なDNA結合タンパク質を次のように構築することができる。ヒトCCR5のプロモーター領域は、5′−AGG GTG GAG T−3′(配列番号4)(図6)の10−bp配列を含む。本願で開示された改変されたワン−ハイブリッドシステムを使用し、特異的にそれぞれ5′−AGGG−3′、5′−GTGG−3′、及び5′−GAGT−3′の4−bp標的配列中の一つを認識する3個のジンクフィンガードメインが単離できる。これら標的配列はCCR5標的配列中、オーバーラップする4−bp断片である。これら3個のジンクフィンガードメインを適切なリンカーで連結し、調節ドメイン(例えば、VP16ドメイン及びGAL4)または抑制ドメイン(例えば、KRAB)に付着させ、CCR5プロモーターに特異的に結合する新規の転写因子が生成できる。これらジンクフィンガータンパク質はHIV−1増殖の防止を助けるために遺伝子治療に使用されることができる。
【0081】
高効率スクリーニング
下記方法は、複数の可能性のあるDNA結合部位や、更には全ての可能なDNA結合部位に対する集合体内の各ドメインの相対的生体内結合親和性の迅速な測定を可能にする。核酸結合ドメインをコードする核酸の大規模集合体を製造した。各核酸結合ドメインはハイブリッド核酸構築物で試験ジンクフィンガードメインとしてコードされ、一つの交配型の酵母菌株で発現される。これにより、全ての可能なまたは所望のドメインを発現する第1セットの酵母菌株が製造される。リポーター構築物内に前記ドメインの推定標的部位についてのリポーター構築物を含有する酵母菌株の第2セットを反対の交配型で製造する。それぞれ異なる試験ジンクフィンガードメインと異なる標的部位リポーター構築物を有する、融合された細胞のマトリックスを生成するために、本方法は、複数のまたは全ての可能性のある対交配の遂行を要求する。それぞれの融合された細胞について、リポーター遺伝子の発現が測定される。これにより本方法は迅速で難しくなく試験されるドメインらの結合優先性を決定する。
【0082】
例えば、与えられたプロファイルに一致する推定ドメインをゲノムデータベースを調査することにより、ドメインの集合体が同定された。前記集合体は、例えば、10〜20個のドメイン、または全ての同定されたドメイン、可能には、数千個またはそれ以上を含む。データベースで同定された、ドメインをコードする核酸は、合成オリゴヌクレオチドを使用して増幅する。前記合成オリゴヌクレオチドを設計する手作業のまたは自動化された方法は、本技術分野で通常のことである。追加的なドメインをコードする核酸は縮重プライマーで増幅され得る。前記集合体のドメインをコードする核酸を前記記述された酵母発現プラスミドにクローニングして、このドメインとZif268の初めの二つのフィンガー及び転写活性ドメインとの融合タンパク質が生成できる。複数のドメインをコードする核酸をクローニングするために増幅及びクローニング工程をマイクロタイタープレート形式で行う。
【0083】
または、酵母発現ベクタに前記ドメインをコードする複数の増幅された核酸を速かに挿入するために組換えクローニング方法を使用することができる。この方法は、米国特許第5,888,732及び「ゲートウェイ」マニュアル(Life Technologies-Invitrogen、CA、USA)に記述されており、増幅プライマー端に位置−特異的組換え酵素(recombinase)のための必要に応じた部位を含めることを必要とする。発現ベクターは、ドメインをコードする増幅された核酸が挿入される位置に追加的な部位を含む。これらの部位は終結コドンが欠如されるように設計された。増幅産物、発現ベクター、及び部位特異的な組換え酵素の添加は、組換え反応による増幅された配列のベクターへの挿入をもたらす。例えば、首尾のよい挿入で毒性遺伝子が置換される等の追加的な特徴は、この方法を効率の高いものとし、高効率の生体内スクリーニングに好適なものとする。
【0084】
制限酵素媒介の及び/又は組換えのクローニングは、それぞれの確認されたドメインをコードする核酸を発現ベクターに挿入するのに使用され得る。このベクターはバクテリア中で増殖でき、索引されたマイクロタイタープレートで凍結できるため、それぞれのウェルが互いに異なる、唯一無二なDNA結合ドメイン中の一つをコードする一つの核酸を有している一つの細胞を含めることができる。
【0085】
それぞれのドメインについて単離されたプラスミドDNAを得て、一つの酵母細胞、例えば、サッカロマイセス・セレビシエMATa細胞に形質転換させる。発現ベクタが選択可能マーカーを有しているため、形質転換された細胞はマーカーが選別できる栄養条件の最小培地で育つことができる。前記細胞を後日の使用のために、例えば、マイクロタイタープレートで凍結貯蔵することができる。
【0086】
酵母菌株の第2セットを、例えば、サッカロマイセス・セレビシエMATα細胞に構築する。この酵母菌株セットは多様な相異するリポーターベクターを含む。その後、唯一なDNA結合ドメインを有する発現ベクタを含有するそれぞれの酵母菌株を前記リポーター遺伝子セットのそれぞれの酵母菌株と交配させる。これら2菌株は互いに反対の交配型であり、互いに異なる栄養要求性を有するように遺伝子操作されたため、二倍体が容易に選別できる。このような二倍体はリポーター及び発現ベクターの両方を有する。この細胞はまた、リポーター及び発現プラスミドの両方共が選別できる栄養条件下で維持される。ユエツら(2000, Nature 403:623-7)は、このような酵母交配のマトリックスを作製し、全ての酵母タンパク質の完壁なツー−ハイブリッド地図を記述している。
【0087】
リポーター遺伝子発現は、高容量の形式(例えば、マイクロタイタープレート)でも感知できる。例えば、GFPをリポーターとして使用する時、交配された細胞のマトリックスを含むプレートを蛍光についてスキャンできる。
【0088】
新規なDNA結合タンパク質の単位体の組立
適切なジンクフィンガードメインを混合し、配合して目的の9−bpまたはそれ以上のDNA配列を認識する新たなDNA結合タンパク質を合理的に構築することができる。ジンクフィンガードメインの単位体的構造は、新たなDNA結合タンパク質を構築するためのそれらの再配列を容易にする。図1に示されているように、天然に生成されるZif268タンパク質におけるジンクフィンガードメインはDNA二重螺旋に沿って一列で位置する。それぞれのドメインは相異する3−4bpDNAセグメントを独立に認識する。
【0089】
ジンクフィンガードメインのデータベース。前述のワン−ハイブリッド選別システムは可能な3−4塩基対結合部位のそれぞれに対し、一つ以上のジンクフィンガードメインを同定するのに使用され得る。その結果は、マトリックスまたはデータベース(例えば、相関的なデータベース)として貯蔵され得る。データベースはそれぞれの部位に結合するジンクフィンガードメインの相対的な親和性についての指示事項を含んでいてもよい。
【0090】
また、前記ジンクフィンガードメインらの標的配列特異性を立証するために、これらを複数の相異する融合タンパク質に融合された状況で検査できる。さらに、少量のドメインのみが利用可能な特定の結合部位は、追加的な選別スクリーニングの標的となり得る。このような選別のためのライブラリーは、類似しているが明確に区別される結合部位に結合するジンクフィンガードメインに突然変異を誘導して調製できる。可能性のあるドメインを最大に活用するために、標的結合部位に対してドメインを交叉させることができるため、それぞれの可能な結合部位に対するジンクフィンガードメインの完全なマトリックスは必須なものではない。このような交叉は、最も有用な3−4塩基対結合部位における結合部位を分析し、更にまたジンクフィンガードメイン間のリンカーの長さを変化させることにより達成できる。設計されたポリペプチドが部位選択性及び高い親和度を全て有するようにするためには、所望の部位に対し、高い特異性を有するジンクフィンガードメインの両側を、更に高い親和度を有するが、特異性が劣る他のドメインと接するように連結させることができる。本願で記述された生体内スクリーニング方法は、人工的に組立てられたジンクフィンガータンパク質及びこれらの誘導体の生体内機能、親和性、及び特異性を試験するのに利用できる。同様に、本方法は、例えば、多様なリンカー組成のライブラリー、ジンクフィンガードメイン単位体のライブラリー、ジンクフィンガードメイン組成のライブラリーなどのライブラリーを製造すること等により、組立されたタンパク質を最適化するのに使用され得る。
【0091】
標的部位の分解。標的9−bpまたはそれ以上のDNA配列は、3−4bpのセグメントに分解される。それぞれの分解された3−4bpセグメントを認識するジンクフィンガードメインを同定する(例えば、前記にて言及のデータベースから)。例えば、20bp乃至500bp配列の、より長い標的配列も、その配列内で9bp、12bp、及び15bp下位配列を同定することができるため、標的配列として適している。特に、データベースによく現れている部位に分解できる下位配列は、最初の設計標的として機能できる。
【0092】
組立された単位体の製造。隣接した3−4bp下位部位または近傍の下位部位を認識する複数のジンクフィンガードメインを含むようにポリペプチドを設計する。設計されたポリペプチド配列をコードする核酸配列は、合成することができる。合成遺伝子を構築することは、この技術分野では日常的なことである。そのような方法には、必要に応じて合成されたオリゴヌクレオチド、PCR媒介されたクローニング、及びメガプライマーPCRからの遺伝子構築などがある。例えば、ライブラリーを形成するため、複数の核酸配列を合成することができる。その認識特異性が前記位置に適合する異なったジンクフィンガードメインをコードするように任意の与えられた位置で変化するドメインをコード核酸ライブラリーを設計できる。各位置でジンクフィンガードメインの同一性を変化させるために、セクシュアル(Sexual)PCR及び「DNAシャッフリングTM」(Maxygen, Inc., CA)が使用され得る。
【0093】
ペプチドリンカー。DNA結合ドメインは、多様なリンカーにより連結され得る。リンカーの有用性と設計はこの技術分野でよく知られている。特に有用なリンカーは核酸によりコードされるペプチドリンカーである。したがって、第一のDNA結合ドメイン、ペプチドリンカー、及び第二のDNA結合ドメインをコードする合成遺伝子を構築することができる。このような設計は大規模の人工の複数−ドメインDNA結合タンパク質を構築するために反復できる。PCT WO 99/45132及びキム及びパボ(1998, Proc. Natl. Acad. Sci. USA 95:2812-7)は、ジンクフィンガードメインらを連結するのに好適なペプチドリンカーの設計を記述している。
【0094】
ランダムコイル、α−ヘリックス、又はβ−プリーツの3次構造を形成する追加的なペプチドリンカーが使用できる。好ましい柔軟性のあるリンカーを形成するポリペプチドは、この技術分野でよく知られている〔例えば、Robinson and Sauer(1998) Proc. Natl. Acad. Sci. USA. 95:5929-34参照〕。柔軟性のあるリンカーは、典型的にグリシンを含むが、これはグリシンアミノ酸が側鎖が欠如されていて回転自由度のある唯一なアミノ酸であるためである。親水性を増加させるために、セリンまたはトレオニンをリンカーに挿入することができる。併せて、結合親和性を増加させるためにDNAのリン酸骨格と相互作用可能なアミノ酸が使用され得る。前記アミノ酸の賢明な使用により、親和性を上げることと配列特異性が減少することの間のバランスを取ることができる。仮りに、リンカーとして、厳格な伸張性が望ましいのであれば、文献〔Pantoliano et al.(1991) Biochem. 30:10117-10125〕に記述された螺旋リンカーのようなα−ヘリックスリンカーを使用することができる。また、リンカーはコンピュータモデリングにより設計できる(米国特許第4,946,778参照)。分子モデリングのためのソフトウェアを購入して使用することができる〔例えば、Molecular Simulations, Inc., San Diego, CAから〕。このようなリンカーは、標準的な突然変異誘導技術及びタンパク質工学の技術分野で用いられる生物理学的テストを利用し、本願に記述された機能的分析を使用し、任意に最適化、すなわち、例えば、抗原性を減少させるか、及び/又は安定性を増加させることができる。
【0095】
ジンクフィンガードメインを活用した実施のために、ジンクフィンガー間で天然に生成されるタンパク質を、フィンガーを互いに連結するのに使用することができる。前記天然に生成されるリンカーとして典型的なものは、Thr−Gly−(Glu−Gln)−(Lys−Arg)−Pro−(Tyr−Phe)(配列番号78)である(agata et al. 前記参照)。
【0096】
二量体化ドメイン。DNA結合ドメインを連結する他の方法は、二量体化ドメイン、特に異種二量体化ドメイン〔Pomerantz et al.(1998) Biochemistry 37:965-970参照〕を使用することである。この実施態様では、DNA結合ドメインが別個のポリペプチド鎖中に存在する。例えば、第一のポリペプチドは、DNA結合ドメインA、リンカー及びドメインBをコードする反面、第二のポリペプチドは、ドメインC、リンカー及びドメインDをコードする。当業者は、特性が明らかになった多くの二量体化ドメインから一つの二量体化ドメインを選択することができる。同種二量体が望ましくないとすれば、異種二量体化を好むドメインを使用することができる。特に適用可能な二量体化ドメインは、コイル化されたコイルモチーフ(例えば、二量体平行または逆平行コイル化されたコイル)である。優先的に異種二量体を形成するコイル化されたコイルをまた利用することができる〔Lumb and Kim、(1995) Biochemistry 34:8642-8648〕。二量体化ドメインの他の種類であって二量体化が小分子により、または信号伝達経路を通じて誘発されるものがある。例えば、FK506の二量化形態は、二つのFK506結合タンパク質(FKBP)ドメインを二量体化するのに使用され得る。このような二量体化ドメインは追加的な調節工程を提供するために利用され得る。
【0097】
機能性検査(Functional Assays)及び使用
生化学的検査に加えて、核酸結合ドメインまたは本願で記述された方法(例えば、単位体組立)により設計されたタンパク質の機能を生体内で検査できる。例えば、標的部位(例えば、細胞増殖に必要な遺伝子のプロモーター部位)に結合するドメインが選択され得る。単位体組立により、(1)標的プロモーター部位にまたがる下位部位にそれぞれ結合するように選択されたドメイン及び(2)DNA抑制ドメイン(例えば、WRPWドメイン)を含むタンパク質が設計できる。
【0098】
設計されたタンパク質をコードする核酸配列は、例えば、Kang及びKimの文献〔2000, J. Biol. Chem. 275:8742〕により記述された誘導性発現ベクターなどの発現ベクターにクローニングできる。このような構造体を組織培養細胞または胚性幹細胞に形質感染させることにより、対象モデルとしてのトランスジェニック組織が生成できる。このようなトランスジェニック動物モデルでタンパク質の発現を誘導し、組織培養細胞の細胞増殖を調査したり、または発生学的変化及び(または)腫瘍成長を調査して、設計されたタンパク質の効率が決定できる。併せて、標的にした遺伝子の発現レベルは、例えば、RT−PCRまたはノーザンブロットのようなmRNAを検出する一般的な方法により検査できる。更に完壁な測定のためには設計されたタンパク質を発現する細胞と発現しない細胞からmRNAを精製する。このようなmRNAの二つのプールを利用して、大規模な遺伝子集合物(例えば、関心のある条件(例えば、癌)に関係した遺伝子の集合物または生物体のゲノムで同定された遺伝子の集合物)に対するプローブを含有するマイクロアレイを探知する。このような検査は、設計されたタンパク質の特異性を決定するのに特に有用である。万が一、設計されたタンパク質が高い親和度を有するものの、低い特異性を有すれば、予想される標的遺伝子以外に遺伝子の発現にも影響を与えて多面的で望ましくない効果を持たらすことがある。このような効果は転写物の全体的な分析により明らかになる。
【0099】
加えて、設計されたタンパク質は、内生の遺伝子を調節するために、対象細胞又は対象組織中で産生することができる。設計されたタンパク質は、内生の遺伝子の領域に結合させるため、及び転写活性化又は抑制機能を与えるために、上記のように改変される。Kang及びKim(上記)に記載されているように、プロモーターの誘導物質の濃度を調整することにより、内生の遺伝子の発現を、濃度依存的方法で調節することができる。
【0100】
結合部位優先性検査
各ドメインの結合部位優先性は、EMSA、DNaseフットプリント法(footprinting)、表面プラスモン共鳴法、またはカラム結合のような生化学的検査により確認することができる。結合に必要な基質には、標的部位を含む合成オリゴヌクレオチドを使用することができる。このような検査は、非特定DNAを競合物として、または特定DNA配列を競争体として含むことができる。特定競争体DNAには、一つ、二つ、または三つの核酸突然変異を有する認識部位が使用され得る。したがって、生化学的検査により所定部位に対するドメインの親和度のみならず、他の部位に対する所定部位の相対的親和性も測定できる。レバー及びパボ〔Rebar and Pabo, 1994, Science 263:671-673〕は、EMSAからジンクフィンガードメインに対する絶対Kd常数を得る方法を記述している。
【0101】
本発明は、下記実際的な実施例を通じて更に具体的に記述されるはずである。しかし、これら実施例は本発明の範囲を制限しようとする意図から提供されたものでないことに留意すべきである。
【0102】
実施例1:ハイブリッド転写因子発現のためのプラスミドの製造
ジンクフィンガー転写因子を発現する発現プラスミドを、pPC86〔Chevray & Nathans(1991) Proc. Natl. Acad. Sci. USA 89, 5789-5793〕を改変して調製した。以下に記述されるDNA操作は文献〔Current Protocols in Molecular Biology, Ausubel et al. (1998), John Wiley & Sons, Inc.〕に提示された一般的な方法により遂行した。pPC86内のSalIとEcoRI認識場所間にZif268ジンクフィンガータンパク質をコードするDNA断片を挿入してpPCFM−Zifを作った。このクローニング工程の結果は、酵母Gal4転写活性化ドメインにZif268ジンクフィンガータンパク質が連結された翻訳融合タンパク質をもたらす。pPCFM−Zifを酵母菌細胞に形質転換させれば、Gal4活性化ドメインとZif268ジンクフィンガーを含むハイブリッド転写因子が発現される。pPCFM−Zif内にクローニングされたZif268ジンクフィンガータンパク質をコードするDNA配列を図9に表した。
【0103】
ジンクフィンガードメインのライブラリーを構築するためのベクターとして、pPCFMS−Zifプラスミドを利用した。pPCFMS−Zifは、pPCFM−Zifのフィンガー3コーディング部位前に終止コドンとPstI認識配列を含むオリゴヌクレオチドカセットの挿入により構築される。前記オリゴヌクレオチドカセットは、二つの合成オリゴヌクレオチド、すなわち、5′−TGCCTGCAGCATTTGTGGGAGGAAGTTTG−3′(配列番号79)及び5′−ATGCTGCAGGCTTAAGGCTTCTCGCCGGTG−3′(配列番号80)をアニーリングして形成される。終止コドンの挿入は、Zif268のフィンガー3をコードするプラスミドライブラリーの生成を防止する。
【0104】
下記「実施例2」に記載のとおり、プラスミドはジンクフィンガードメインライブラリーの作成のためのべクターとして用いた。
【0105】
加えて、個別のジンクフィンガードメインをコードするDNA配列のギャップ修復クローニングを、ハドソンら(1997、Genome Research 7:1169-1173)記載に細部の改変を施して行った。
【0106】
個別のジンクフィンガードメインをクローン化するため、オーバーラップした2つのオリゴヌクレオチドを合成した。それぞれのオリゴヌクレオチドは、第2ラウンドのPCR(再PCR)のための21ヌクレオチド長の共通の尾部を5′末端に含み、当該個別のジンクフィンガードメインをコードする核酸にアニーリングする特異的配列を含む。順向き及び逆向きのプライマーは、それぞれ、5′−ACCCACACTGGCCAGAAACCCN48-51−3′(配列番号108)及び、5′−GATCTGAATTCATTCACCGGTN42-45−3′(配列番号109)(ここで、N48-51及びN42-45は、ジンクフィンガードメインをコードする核酸にアニーリングさせるための必要に応じた配列に相当する)である。二本鎖DNAは、テンプレートの核酸を、2つのオリゴヌクレオチドの等モルの混合物と一緒に増幅することによって調製した。PCR条件は、94℃3分での第1サイクルに続き、94℃1分、50℃1分及び72℃30秒での5サイクルからなる。
【0107】
その後、それぞれのジンクフィンガードメインをコードする二本鎖DNAを、第2ラウンドPCRにおいてテンプレートとして用いた。再PCRプライマーは2つの領域を有し、1つの領域は、酵母ベクターpPCFM−Zifと同一であり、第二の領域は、上記21ヌクレオチド長の共通の尾部配列と同じである。順向きプライマーの配列は、
5′−TGTCGAATCTGCATGCGTAACTTCAGTCGTAGTGACCACCTTACCACCCACATCCGGACCCACACTGGCCAGAAACCC−3′(配列番号138)
及び逆向きプライマーの配列は、
5′−GGTGGCGGCCGTTACTTACTTAGAGCTCGACGTCTTACTTACTTAGCGGCCGCACTAGTAGATCTGAATTCATTCACCGGT−3′(配列番号139)
である。反応混合液は、25ul中に、それぞれのプライマーを2.5pmol、Mg2+を1.5mM、Taqポリメラーゼ2unit及びPfuポリメラーゼ0.01unitを含む。反応は、94℃3分、その後94℃1分、65℃1分及び72℃30秒で20サイクルを回して行った。ギャップ修復クローニングは、再PCR産物の混合物及び、MscI及びEcoRIで消化した直線化したpPCFM−Zifベクターを酵母YW1細胞に形質移入することによって行った。酵母ベクターpPCFM−Zifと同一の領域は、細胞中のベクターでの相同的組換えを可能にする。
【0108】
実施例2:ジンクフィンガードメインライブラリーの製造
天然に存在するジンクフィンガードメインのプラスミドライブラリーをヒトのゲノムからジンクフィンガードメインをクローニングすることにより製造した。縮重プライマー及びPCRを利用してヒトのゲノムDNA(Promega Corporation;米国ウィスコンシン州マジソン)からジンクフィンガードメインをコードするDNA断片を増幅した。ヒトジンクフィンガードメインをクローニングするために使用された縮重DNAプライマーのDNA配列は次の通りである。
【0109】
5′−GCGTCCGGACNCAYACNGGNSARA−3′(配列番号81)及び
【0110】
5′−CGGAATTCANNBRWANGGYYTYTC−3′(配列番号82)
【0111】
(ここで、RはG及びAを表し、BはG、C及びTを表し、SはG及びCを表し、WはA及びTを表し、YはC及びTを表し、NはA、C、G及びTを表す)。
【0112】
前記塩基配列は、多くの天然に生成されるジンクフィンガータンパク質のジンクフィンガードメイン間の接合点で発見されるアミノ酸配列His−Thr−Gly−Glu/Gln−Lys/Arg−Pro−Tyr/Phe(配列番号 83)をコードする核酸配列にアニーリングする〔Agata et al.(1998) Gene 213:55-64〕。
【0113】
PCRのバッファ組成は、KCl 50mM、MgCl2 3mM、Tris(pH8.3)10mMである。TaqDNAポリメラーゼを添加した後、94℃で30秒、42℃で60秒、72℃で30秒を35回反復した後、72℃で10分間の最終温置をした。
【0114】
前記PCR産物を次の通りpPCFMS−Zifにクローニングした。PCR産物を電気泳動して120bpに相当するDNA断片を単離した。BspEIとEcoRIで消化した後、これをpPCFMS−Zifに連結した。結果的に、このプラスミドライブラリーがコードするハイブリッド転写因子のDNA−結合ドメインはZif268のフィンガー1及びフィンガー2とヒトゲノムから由来したジンクフィンガードメインで構成される。全106個の大腸菌形質転換体からプラスミドライブラリーを調製した。前記ライブラリー製造方法によれば、ジンクフィンガードメイン間で発見される天然に存在するリンカー配列が維持される。
【0115】
実施例3:ジンクフィンガードメインライブラリーの製造
無作為突然変異生成により突然変異ジンクフィンガードメインのライブラリーを調製した。Zif268のフィンガー3をポリペプチド骨格(framework)として使用した。無作為突然変異は、配列番号21(Zif268のフィンガー3)の73位(アルギニン)、75位(アスパラギン酸)、76位(グルタミン酸)、77位(アルギニン)、78位(ライシン)及び79位(アルギニン)にそれぞれ該当する、αヘリックスに沿って−1、2、3、4、5、6位のアミノ酸に無作為突然変異を導入した。
【0116】
これらアミノ酸をコードする核酸配列位置のそれぞれに無作為化コドン、すなわち、5′−(G/A/C)(G/A/C/T)(G/C)−3′のコドンを導入した。この無作為化コドンは20個のアミノ酸のうち、トリプトファン、チロシン、システイン、フェニルアラニンを除いた16個のアミノ酸中の一つをコードする。前記無作為化コドンは、可能な終止コドン三種を除外させる。突然変異が挿入された位置を除いた残りの部分はZif268ジンクフィンガータンパク質のフィンガー3と同一である。前記無作為化コドンは、下記二つのオリゴヌクレオチド
5′−GGGCCCGGGGAGAAGCCTTACGCATGTCCAGTCGAATCTTGTGATAGAAGATTC−3′(配列番号84)
5′−CTCCCCGCGGTTCGCCGGTGTGGATTCTGATATGSNBSNBAAGSNBSNBSNBSNB
【0117】
TGAGAATCTTCTATCACAAG−3′(配列番号85)(ここで、BはG、T及びCを表し、SはG及びCを表し、NはA、G、C及びTを表す。)から製造されたオリゴヌクレオチドカセットとして導入される。
【0118】
前記二つのオリゴヌクレオチドをアニーリングした後、常温で30分間クレノウポリメラーゼを使用して二重鎖にした後、AvaIとSacIIで処理し、これをSgrAI、PstI、SacIIで処理したpPCFMS−Zif(実施例1参照)に挿入した。総109個の形質転換された菌株からプラスミドを分離し、ジンクフィンガー転写因子を指定するプラスミドのライブラリーを製造した。
【0119】
実施例4:リポータープラスミドの製造
酵母HIS3遺伝子を含むリポータープラスミドを、pRS315His(Wang & Reed(1993), Nature 364, 121-126)を改変して調製した。前記リポータープラスミドはまた、このプラスミドを有する形質転換体の選別のための目的でLEU2マーカーをその天然のプロモーター下に含む。まず、pRS315His内のSalI認識配列を除去するためにpRS315HisをSalIとBamHIで処理した後得られた小さい断片と、同じプラスミドをBamHIとXhoIで処理した後得られた大きい断片を結合させてpRS315HisΔSalを作った。その後、オリゴヌクレオチドデュプレックスをBamHIとXmaI間のpRS315HisΔSalに挿入してHIS3遺伝子のプロモーター部位にSalI認識配列を導入した。互いにアニーリングされて挿入されるデュプレックスを形成する二つのオリゴヌクレオチド配列は
5′−CTAGACCCGGGAATTCGTCGACG−3′(配列番号86)
5′−GATCCGTCGACGAATTCCCGGGT−3′(配列番号87)
である。その結果生成されたプラスミドをpRS315HisMCSと命名した。
【0120】
pRS315HisMCSに所望の複合配列を挿入して多様なリポータープラスミドを作った。前記複合配列は複合配列の4コピーを含む直列配列(tandem array)として挿入される。前記標的配列はHIV−1のLTRで発見される10−bpDNA配列
5′−GACATC GAG C−3′(配列番号1)HIV−1LTR(−124/−115)
5′−GCA GCT GCT T−3′(配列番号2)HIV−1LTR(−23/−14)
5′−GCT GGG GAC T−3′(配列番号3)HIV−1LTR(−95/−86)
及びヒト遺伝子CCR5のプロモーターに存在する10bp配列(図6参照)
5′−AGG GTG GAG T−3′(配列番号4)ヒトCCR5(−70/−79)
5′−GCT GAG ACAT−3′(配列番号5)ヒトCCR5(+7/+16)
から由来したものである。
【0121】
これらそれぞれの10−bpDNA配列のうち、4−bp標的部位成分を分析することにより、この部位を認識するジンクフィンガードメインを同定した。モジュール性組合せ方法を利用し、このようなジンクフィンガードメインをカップリングすることにより、生体内で前記部位が認識できるDNA結合タンパク質を調製することができる。
【0122】
図6において、下線部分は4−bpの標的塩基配列の例を表す。これらそれぞれの4−bp標的配列はZif268のフィンガー1及び2により認識される塩基配列である5′−GGGCG−3′の5−bp招集配列に連結される。このように生成された9−bp配列は複合結合配列を構成する。それぞれの複合結合配列は5′−XXXXGGGCG−3′の形式を有するが、ここで、XXXXは4−bp標的配列であり、隣接した5′−GGGCG−3′は招集配列である。
【0123】
図7は、pRS315HisMCS内のリポーター遺伝子に作動可能に連結された、複合結合部位の直列配列が挿入された塩基配列を示す。それぞれの直列配列は複合結合部位の塩基配列の4コピーが配置されている。それぞれの結合部位に対し、二つのオリゴヌクレオチドを合成してアニーリングした後、pRS315HisMCSのSalIとXmaI場所に連結してリポータープラスミドを作った。
【0124】
実施例5:具体的リポータープラスミドの製造
3塩基対の微小部位に対し、それぞれ一対のリポーター(すなわち、一つはlacZ、他の一つはHIS3)を含むリポータープラスミドのセットを次のように構築した。リポータープラスミドは所望の標的配列をpRS315HisMCS及びpLacZiに挿入して製造した。それぞれの3塩基対の標的部位に対して二つのオリゴヌクレオチドを合成し、互いにアニーリングさせた後、これをpRS315HisMCS及びpLacZiのSalI及びXmaI部位間に挿入した。前記オリゴヌクレオチドのDNA配列は次の通りである:5′−CCGGT NNNTGGGCGTACNNNTGGGCG TCA NNNTGGGCG−3′(配列番号88)及び5′−TCGACGCCCANNN TGA CGCCCANNNGTACGCCCANNN A3′(配列番号89)。全64対のオリゴヌクレオチドを合成し、前記二つのリポータープラスミド内に挿入した。
【0125】
実施例6:所望のDNA−結合特異性を有するジンクフィンガードメインの選択
与えられた標的塩基配列に特異的に結合するジンクフィンガードメインを選択するために、酵母をリポータープラスミドとハイブリッド転写因子を発現するジンクフィンガーライブラリープラスミドで形質転換させた。以下記述される酵母の形質転換方法と生体内スクリーニング方法は文献〔Current Protocols in Molecular Biology、Ausubel et al.(1998), John Wiley & Sons, Inc., 米国ニュージャジー州イングルウッド〕に提示された一般的な方法により行われた。酵母菌株には、yWAM2(MATα Δgal4 Δgal80URA3::GAL1−lacZ lys2801 his3−Δ200 trp1−Δ63 leu2 ade2−101CYH2)を使用した。
【0126】
一例として、まずリポーター遺伝子に作動可能に連結された塩基配列5′−GAGCGGGCG−3′(4bpの標的配列に下線を付す)の複合結合部位を含むリポータープラスミドで酵母を形質転換させた。その後、無作為突然変異法で製造された突然変異ジンクフィンガードメインのプラスミドライブラリーを前記形質転換された酵母に導入した。約106個程度のコロニーをロイシン及びトリプトファンが全て欠如された培地で得た。リポータープラスミド及びジンクフィンガードメイン発現プラスミドはマーカー(marker)としてそれぞれLEU2遺伝子とTRP1遺伝子を有していて、2種類のプラスミドで全て形質転換された酵母はロイシンとトリプトファンが欠如された培地で育つことができる。
【0127】
1つの実施態様において、ヒトゲノムから由来するジンクフィンガードメインのライブラリーをリポータープラスミドを含有する細胞に形質転換した。このような形質転換は、5種類の相異する宿主細胞菌株に対して行われ、それぞれの株は、リポーター遺伝子に作動可能に連結された相異する5種類の標的配列中の一つを含有する。ロイシン及びトリプトファンが全て欠如された培地で各形質転換から約105個程度のコロニーを得た。
【0128】
形質転換体をロイシン及びトリプトファンが欠如された合成培地を含有するペットリディッシュ上で成長させた。インキュベーション後、プレートに10%グリセロール溶液を加えた後、細胞をかき集めてグリセロール溶液中に凍結保管した。単一のアリコートをロイシン、トリプトファン、及びヒスチジンが欠乏した培地に撒いた。ジンクフィンガー転写因子の作用なしにも微細な量のHIS3が発現できるため、これによる細胞成長を抑制するために一部の成長培地にはHIS3の抑制剤である3−アミノトリアゾール(AT)をそれぞれ0、0.03mM、0.1mM、0.3mM添加した。ATは、His3の競合阻害剤であり、HIS3選択系の感度を滴定する。ATは、His3の基礎的な活性を抑制した。そのような基礎的な活性は、レポータープラスミド上のHIS3遺伝子の少量の発現から生じ得る。培地上に展開した約107個の酵母細胞うち、ATを欠く選択培地では数百個のコロニーが育った。ATの濃度の増加につれて、コロニーの数字が減った。0.3mMのATを含む選択培地では、10のオーダーでコロニーが育った。ATを欠いた培地と0.3mMのATを含む培地からそれぞれ数個ずつのコロニーを無作為に選定してこれらを培養した。プラスミドを酵母から分離し、大腸菌菌株KC8(pyrF leuB600 trpC hisB463)を形質転換した。これからジンクフィンガー転写因子をコードするプラスミドを分離して選択されたジンクフィンガードメインのDNA塩基配列を決定した。
【0129】
各選択されたジンクフィンガードメインのアミノ酸配列を、前記決定されたDNA塩基配列から演繹的に誘導した。各ジンクフィンガードメインは、塩基−接触部位における4つのアミノ酸残基、すなわち、αヘリックスに沿って−1、2、3、6位のアミノ酸残基の名を取って命名した。結果を表1に表した。同定されたジンクフィンガードメインは塩基−接触部位で発見される4個のアミノ酸によって命名された。塩基配列を分析した結果、同じジンクフィンガードメインが反復的に得られる場合があることが分かる。表1において括弧内の数字は、同一のジンクフィンガードメインがどれだけ多く得られたかを表す。例えば、4塩基接触部位にCSNRを有する二つのジンクフィンガーが、GAGC核酸部位に結合することが同定された(カラム3の「GAGC/ヒトゲノム」参照)。
【0130】
【表1】
【0131】
選択されたヒトジンクフィンガードメインをコードする全長DNA配列と、これを翻訳して得られたアミノ酸配列を図11に表した。ヒトゲノムにおいてジンクフィンガードメインをコードするDNAセグメントを増幅させるために使用した縮重PCRプライマーに相補的な配列を下線で表示した。対立因子の相異又は増幅における改変の導入のため、この部分の塩基配列は報告されたヒトゲノム配列の元来塩基配列と異なり得る。
【0132】
本発明によるスクリーニングで同定されたほとんどのヒトジンクフィンガードメインは、新規なポリペプチドであるか、又は不明のオープンリーディングフレームに相当した。例えば、HSNK(GenBank accession numberAF155100で報告された配列に含まれる)、QSTV(GenBank accession numberAL110217)、VSTR(GenBank accession numberAF025772で報告された配列に含まれる)として設計されたジンクフィンガードメインは、その機能がまだ知られていないタンパク質中に発見された。ここに記載された結果は、これらのジンクフィンガードメインが、配列特異的DNA結合ドメインとして機能することができるということを示すだけでなく、キメラタンパク質の中で好ましい、それらの好適な結合部位を立証するものである。
【0133】
また、本願発明では、ヒトゲノムから得た前記ジンクフィンガードメインが組立式で作用して新規なDNA−結合タンパク質を構築するための構成ブロックとして使用され得ることを明らかにした。本願発明のヒトジンクフィンガードメインは、これをZif268のフィンガー1及びフィンガー2に次いでC末端に配置した時、生体内でこれらが特定な標的配列を認識する能力に基づいて選択された。したがって、同定されたジンクフィンガードメインは人工的な文脈で特定配列が認識でき、合成転写因子を設計するためのモジュール性構成ブロックとして適している。
【0134】
実施例7:酵母の対交配(pairwise mating)
3塩基対の標的部位に結合するジンクフィンガードメインの同定を容易にするために、酵母細胞の反復的な形質転換を避け、一回の形質転換で64個のリポーター構築物のそれぞれに対して結合する陽性結合形質転換体を探すために、酵母の交配を利用した。YW1(MATα交配型)及びYPH499(MATa交配型)の2種の酵母菌株を使用した。YW1はyWAM2から由来したもので、5−フルオロオロチックアクシド(FOA)耐性であるクローンを選択することにより、yWAM2のura3−誘導体を生成した。
【0135】
ジンクフィンガードメインのプラスミドライブラリーを酵母形質転換によりYW1に導入した。約106個の形質転換されたコロニーから10%グリセロール溶液でプレートをかき集めて細胞を収集し、小分画で冷凍させた。64個のリポータープラスミドの各対(pLacZiまたはpRS315Hisから由来)を酵母菌株YPH499に共同形質感染させた。それぞれのリポータープラスミド対を含有する形質転換体を回収して冷凍させた。
【0136】
冷凍させた細胞を溶かした後、これら酵母細胞を最小培地で中間−ログ成長期まで成長させた。次いで、この2つの細胞類型を混合し、YPDで5時間交配されるようにした。X−gal及びAT(1mM)を含有し、トリプトファン、ロイシン、ウラシル及びヒスチジンが欠如した最小培地で二倍体細胞を選択した。数日後、選択用プレートで成長した青色コロニーを単離し、これからジンクフィンガードメインをコードするプラスミドを単離し、選択されたジンクフィンガードメインのDNA配列を決定した。
【0137】
青色コロニーから単離された核酸をYW1細胞に個別的に再形質転換させた。それぞれの単離された核酸に対し、再形質転換されたYW1細胞を64 LacZリポータープラスミドをそれぞれ含有するYPH499細胞と96ウェルプレートで交配させ、X−galを含有してトリプトファン及びウラシルが欠けた最小培地上にばら撒いた。64個の標的配列に対するジンクフィンガードメインのDNA結合の親和度及び特異性は青色相の強度により決定された。Zif268ジンクフィンガードメインとの対照群実験結果、ジンクフィンガードメインと結合部位間の陽性相互作用は、濃い青乃至薄い青のコロニーを作り(ここで、青色の強度は結合親和性に比例する)、陰性相互作用は白色コロニーを作った。
【0138】
実施例8:同定されたジンクフィンガードメインと相互作用コードの比較
選択されたジンクフィンガードメインのアミノ酸配列から塩基と相互作用をすることと予想されるアミノ酸残基と、ジンクフィンガー−DNA相互作用コード表(図3)から予測したアミノ酸残基との同一性及び類似性を比較した。大部分のジンクフィンガードメインは、期待されたパターン、すなわちコードから予測したものとよく合致する決定的な部位のアミノ酸残基を示した。
【0139】
例えば、無作為突然変異を通じて製造されたライブラリーから選択されたジンクフィンガードメイン内の共通的アミノ酸残基は、−1位ではR(アルギニン)(14個中、7個)またはK(ライシン)(14個中、2個)、3位ではN(アスパラギン)(14個中、6個)及び6位ではR(14個中、9個)であった(表1参照)。これらのジンクフィンガードメインは、GAGCプラスミドで選択された。(リポーター遺伝子に作動可能に連結された複合結合配列5′−GAGCGGGCG−3’を有するリポータープラスミドをGAGCプラスミドと呼ぶことにする。以下類似に、リポーター遺伝子に作動可能に連結された複合結合配列5′−XXXXGGGCG−3’を含むリポータープラスミドをXXXXプラスミドと呼ぶ)。決定的な塩基−接触部位のこれらのアミノ酸残基は、コードから予想されたものと正確に合致する。〔ヒトゲノム内の大部分のジンクフィンガードメインらは、2位にS(セリン)を有しており、セリンは4個の塩基中、いずれのものとも水素結合が形成できる。したがって、2位における影響は以下で考慮しないこととする。また、一般的に、2位の残基は塩基認識において、単に補助的な役割しか果たさないことも知られている(Pavletich及びPabo(1991) Science 252, 809-817)。
【0140】
ヒトのゲノムから由来したジンクフィンガードメイン中のアミノ酸残基も、コードから予想されるものと非常によく一致した。例えば、GAGCプラスミドを使用して得たジンクフィンガードメイン内−1、3、6位の共通アミノ酸残基らは、それぞれR、N、Rである(表1カラム3参照)。これらのアミノ酸は、コードから予想できるアミノ酸と正確に一致した。GCTTプラスミドを使用して得たジンクフィンガードメイン中の−1、3、6位のアミノ酸残基は、それぞれV、T、Rであった(表1カラム4)。このうち、T及びR残基は、コードから予想したものと一致する。3bpの塩基配列において3′末端に位置するTと相互作用をすることと期待されるコードの−1位から予想されたのアミノ酸は、L、T、又はNである。GCTTプラスミドで選択されたVSTRジンクフィンガードメインは、この位置にL(ロイシン)と類似した疎水性アミノ酸であるV(バリン)を含んでいた。
【0141】
全体的に、選択されたジンクフィンガードメイン内のアミノ酸残基は、三つの位置中、少なくとも二つの位置ではコードから予想されるアミノ酸と一致した。表1において、コードから予想されるジンクフィンガードメイン中のアミノ酸を下線で表示した。これらの結果は、ここに開示された生体内選択システムが予想通り機能していることを強力に示唆している。
【0142】
実施例9:再形質転換(retransformation)及び相互形質転換(cross-transformation)
上記のジンクフィンガータンパク質らが誤って得られた陽性結果である可能性を排除し、また前記ジンクフィンガータンパク質らの配列特異性を調査するために、単離されたプラスミドを利用し、酵母の再形質転換(retransformation)及び相互形質転換(cross-transformation)を遂行した。
【0143】
まず、リポータープラスミドとジンクフィンガードメインをコードするハイブリッド転写因子プラスミドを一対にして酵母を同時−形質転換した。酵母形質転換体をロイシン及びトリプトファンが欠如された最小培地に接種して36時間培養した。成長培地中の細胞約1,000個をロイシン、トリプトファン、ヒスチジンが欠如された固体培地(図10で−ヒスチジンと表記)とロイシン、トリプトファンが欠如された固体培地(図10で+ヒスチジンと表記)上にばら撒いた後、50時間30℃で培養した。その結果を図10に示した。
【0144】
ハイブリット転写因子のジンクフィンガー部分が、複合結合配列と結合し、ハイブリット転写因子がHIS3レポーター遺伝子を活性化させる場合は、ヒスチジンを欠く培地中でコロニーが成長することができると予測される。ジンクフィンガー部分がこの複合結合配列に結合できないならば、コロニーは、ヒスチジンが欠如された培地では育長することができない。
【0145】
図10に示したように、単離されたジンクフィンガードメインは、相当する標的配列に結合する能力を有し、Zif268とは明らかに異なる配列特異性を示した。Zif268は、GCGTプラスミドとの場合に、他の5つのプラスミドとの場合よりも高い活性を示し、GAGTプラスミドとの場合には比較的高い活性を示した。他の結合部位を含むレポーターを有し、Zif268タンパク質を発現する株によっては、コロニーは形成されなかった。
【0146】
無作為突然変異ライブラリーから単離されたジンクフィンガードメインKTNRは、GAGCリポータープラスミドで元来選択されたものである。予想通り、GAGCプラスミドのみでコロニーが形成された。ヒトゲノム由来のライブラリーから得られたジンクフィンガードメインも期待した通りの特異性を示した。例えば、GACTプラスミドで選択されたHSNKジンクフィンガードメインは、酵母細胞に形質転換した場合、GACTプラスミドの場合のみで細胞成長を可能とした。GCTTプラスミドで選択されたVSTRは、予想した通りGCTTプラスミドで最大の活性を示した。GAGTプラスミドで選択されたRDERは、Zif268のフィンガー3と同一の4つの塩基−接触部位に同一のアミノ酸残基配列を有する。予想通り、このジンクフィンガードメインは、Zif268のフィンガー3と類似の配列特異性を示した。GAGCとGAGTプラスミドで選択されたSSNRは、GAGCプラスミドとはヒスチジン欠乏培地で細胞成長を可能としたが、GAGTプラスミドとは細胞成長を可能としなかった。ACATプラスミドで得られたQSTVは、この検定で試験されたいかなるプラスミドとも細胞成長を可能としなかった。しかし、後述の如く、試験管内実験ではこのジンクフィンガードメインはACAT配列と強く結合することができた。
【0147】
実施例10:ゲルシフト分析(gel shift assay)
改変ワンハイブリッドシステムを用いて選択されたジンクフィンガードメインを含むジンクフィンガータンパク質を、E.coli内で発現させ、精製し、ゲルシフト分析で用いた。ハイブリッドプラスミド中のジンクフィンガータンパク質をコードするDNAセグメントを、SalI及びNotIで消化して得、pGEX−4T2(Pharmacia Biotech)のSalI及びNotI部位の間に挿入した。ジンクフィンガードメインをE.coliBL21株中で、GST(グルタチオン−S−トランスフェラーゼ)に連結された融合タンパク質として発現させた。発現されたタンパク質をグルタチオンに対する親和性(glutathione affinity)クロマトグラフィー(Pharmacia Biotech, Piscataway, NJ)を利用して精製した後、GSTとジンクフィンガータンパク質の連結部位を切断するトロンビンで消化した。精製されたジンクフィンガータンパク質は、Zif268のフィンガー1及びフィンガー2、およびC末端に選択されたジンクフィンガードメインを含有する。
【0148】
下記配列のプローブDNAを合成し、アニーリングさせ、T4ポリヌクレオチドキナーゼで32P標識し、ゲル移動分析に使用した。
GCGT; 5′−CCGGGTCGC GCGTGGGCG GTACCG−3′ (配列番号90)
3′−CAGCG CGCACCCGC CATGGCAGCT−5′ (配列番号91)
GAGC; 5′−CCGGGTCGC GAGCGGGCG GTACCG−3′ (配列番号92)
3′−CAGCG CTCGCCCGC CATGGCAGCT−5′ (配列番号93)
GCTT; 5′−CCGGGTCGT GCTTGGGCG GTACCG−3′ (配列番号94)
3′−CAGCA CGAACCCGC CATGGCAGCT−5′ (配列番号95)
GACT; 5′−CCGGGTCGG GACTGGGCG GTACCG−3′ (配列番号96)
3′−CAGCC CTGACCCGC CATGGCAGCT−5′ (配列番号97)
GAGT; 5′−CCGGGTCGG GAGTGGGCG GTACCG−3′ (配列番号98)
3′−CAGCC CTCACCCGC CATGGCAGCT−5′ (配列番号99)
ACAT; 5′−CCGGGTCGG ACATGGGCG GTACCG−3′ (配列番号100)
3′−CAGCC TGTACCCGC CATGGCAGCT−5′ (配列番号101)
【0149】
多様な量のジンクフィンガータンパク質を、20mM Tris(pH7.7)、120mM NaCl、5mM MgCl2、20μM ZnSO4、10%グリセロール、0.1% Nonidet P−40、5mM DTT、及び0.10mg/ml BSA(牛血清アルブミン)中で標識されたプローブDNAと室温で1時間培養させた後、この反応混合物をゲル電気泳動させた。放射能シグナルをホスホイメージャー(Phosphor Imager TM)解析(Molecular Dynamics)、文献〔Rebar and Pabo(1994) Science 263:671-673〕に記載されたことにより解離定数を計算した。その結果を表2に示す。2回以上の別途の実験によりすべての常数を決定し、平均からの標準誤差を表示した。表2にはヒスチジン欠乏培地における酵素形質転換体の細胞成長(図10)も表した。
【0150】
【表2】
【0151】
ヒスチジン欠乏培地において、細胞成長を可能にするジンクフィンガータンパク質らは相当するプローブDNAと強く結合した。例えば、対照群として使用したZif268タンパク質の場合、これは、GCGT及びGAGTリポータープラスミドと共に再形質転換させる場合に細胞成長を可能にしたが、これらリポータープラスミドに相応するDNAプローブを利用して試験管内で測定した解離定数はそれぞれ24pM、170pMであった。対照的に、Zif268タンパク質は、他のリポータープラスミドとは細胞成長を可能にせず、相応するDNAプローブで測定した解離定数も1nMよりも高かった。
【0152】
新規ジンクフィンガードメインを含むジンクフィンガータンパク質も類似した結果を示した。例えば、KTNRタンパク質はGAGCプローブDNAに対して170pMの解離定数での高い親和性を示すが、GCGT又はGACTプローブDNAに対しては、それぞれ5.5nM又は30nMの解離定数を表した。このタンパク質は、GAGCプラスミドとのみ、細胞成長を可能にした。HSNKタンパク質は、GACTプローブDNAと強く結合することができるが(Kd=0.32nM)、GCGT又はGAGTプローブDNAとは結合しない。すなわち、QSTVは、GCTT又はGCGTプローブDNAと結合するよりも、それぞれ13倍又は4.3倍強くACATプローブDNAと結合する。
【0153】
一般的に、例えば3つのジンクフィンガードメインを有するもののように、1nM未満の解離定数でDNA配列に結合するジンクフィンガータンパク質である場合、酵母の成長を可能にするが、ジンクフィンガータンパク質が、1nMより高い解離定数でDNA配列に結合する場合、細胞成長を可能にしない。1nMより大きく5nM未満の解離定数でDNA配列に結合するジンクフィンガータンパク質も、例えば、4個のジンクフィンガードメインを有するキメラジンクフィンガータンパク質の文脈において、有用であり得る。
【0154】
実施例11:TG−ZFD−001「CSNR1」
TG−ZFD−001「CSNR1」は、ヒトゲノム配列から生体内(in vivo)スクリーニングにより同定された。そのアミノ酸配列は、YKCKQCGKAFGCPSNLRRHGRTH(配列番号23)である。それは下記ヒト核酸配列
【0155】
5′−TATAAATGTAAGCAATGTGGGAAAGCTTTTGGATGTCCCTCAAACCTTCGAAGGCATGGAAGGACTCAC−3′(配列番号22)
によりコードされる。
【0156】
TG−ZFD−001「CSNR1」は、Zif268のフィンガー1及び2との融合ポリペプチドとして、3−bp標的配列GAA、GAC、及びGAGを特異的に認識する。生体内スクリーニング結果とEMSAによれば、TG−ZFD−001「CSNR」の結合部位配列に対する選好度は、GAA>GAC>GAG>GCGである。EMSAにおいて、TG−ZFD−001「CSNR」とZif268のフィンガー1、フィンガー2、及びGST精製ハンドルとの融合は、GACを含む部位に対しては0.17nM、GAGを含む部位に対しては0.46nM、そしてGCGを含む部位に対しては2.7nMの解離定数(Kd)を示す。
【0157】
TG−ZFD−001「CSNR1」は、例えば、GAA、GACまたはGAG配列を含むDNA部位を認識するために、複数のジンクフィンガードメインを含むキメラDNA結合タンパク質を作るための単位として利用され得る。
【0158】
実施例12:TG−ZFD−002「HSNK」
TG−ZFD−002「HSNK」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、YKCKECGKAFNHSSNFNKHHRIH(配列番号25)である。それは、次のヒト核酸配列によりコードされる。
5′−TATAAGTGTAAGGAGTGTGGGAAAGCCTTCAACCACAGCTCCAACTTCAATAAACACCACAGAATCCAC−3′(配列番号24)。
【0159】
TG−ZFD−002「HSNK」は、Zif268のフィンガー1及び2との融合ポリペプチドとして、3−bp標的配列GACを特異的に認識する。生体内スクリーニング結果とEMSAによれば、TG−ZFD−002「HSNK」の結合部位配列に対する選好度は、GAC>GAG>GCGである。EMSAにおいて、Zif268のフィンガー1、フィンガー2、及びGST精製ハンドルとTG−ZFD−002「HNSK」融合は、GACを含む位置に対しては0.32nM、GAGを含む位置に対しては3.5nM、そしてGCGを含む位置に対しては42nMの解離定数(Kd)を有する。
【0160】
TG−ZFD−002「HSNK」は、例えば、GAC配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として使用され得る。
【0161】
実施例13:TG−ZFD−003「SSNR」
TG−ZFD−003「SSNR」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、YECKECGKAFSSGSNFTRHQRIH(配列番号27)である。それは、次のヒト核酸配列によりコードされる。
5′−TATGAATGTAAGGAATGTGGGAAAGCCTTTAGTAGTGGTTCAAACTTCACTCGACATCAGAGAATTCAC−3′(配列番号26)。
【0162】
Zif268のフィンガー1及び2との融合ポリペプチドとして、TG−ZFD−003「SSNR」は3−bp標的配列GAGに対する認識特異性を表す。生体内スクリーニング結果とEMSAによれば、TG−ZFD−003「SSNR」の結合部位配列に対する選好度は、GAG>GAC>GCGである。EMSAにおいて、Zif268のフィンガー1、フィンガー2、及びGST精製ハンドルとTG−ZFD−003「SSNR」との融合は、GAGを含む位置に対しては0.45nM、GACを含む位置に対しては0.61nM、そしてGCGを含む位置に対しては3.8nMの解離定数Kdを示す。
【0163】
TG−ZFD−003「SSNR」は、例えば、GAGまたはGAC配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0164】
実施例14:TG−ZFD−004「RDER1」
TG−ZFD−004「RDER」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、YVCDVEGCTWKFARSDELNRHKKRH(配列番号29)である。それは、次のヒト核酸配列によりコードされる。
5′−TATGTATGCGATGTAGAGGGATGTACGTGGAAATTTGCCCGCTCAGATGAGCTCAACAGACACAAGAAAAGGCAC−3′(配列番号28)。
【0165】
Zif268のフィンガー1及び2と融合ポリペプチドとして、TG−ZFD−004「RDER」は3−bp標的配列GCGに対する認識特異性を表す。生体内スクリーニング結果とEMSAによれば、TG−ZFD−004「RDER」の結合部位配列に対する選好度は、GCG>GTG、GAG>GACである。EMSAにおいて、Zif268のフィンガー1、フィンガー2、及びGST精製ハンドルとTG−ZFD−004「RDER」との融合は、GCGを含む位置に対しては0.027nM、GAGを含む位置に対しては0.18nM、そしてGACを含む位置に対しては28nMの解離定数Kdを有する。
【0166】
TG−ZFD−004「RDER」は、例えば、GCG、GTGまたはGAG配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0167】
実施例15:TG−ZFD−005「QSTV」
TG−ZFD−005「QSTV」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、YECNECGKAFAQNSTLRVHQRIH(配列番号31)である。それは、次のヒト核酸配列によりコードされる。
5′−TATGAGTGTAATGAATGCGGGAAAGCTTTTGCCCAAAATTCAACTCTCAGAGTACACCAGAGAATTCAC−3′(配列番号30)。
【0168】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−005「QSTV」は、3−bp標的配列ACAに対する認識特異性を表す。生体内スクリーニング結果とEMSAによれば、TG−ZFD−005「QSTV」の結合部位配列に対する選好度はACA>GCG>GCTである。EMSAにおいて、Zif268のフィンガー1、フィンガー2、及びGST精製ハンドルとTG−ZFD−005「QSTV」との融合は、ACAを含む位置に対しては2.3nM、GCGを含む位置に対しては9.8nM、そしてGCTを含む位置に対しては29nMの解離定数Kdを有する。
【0169】
TG−ZFD−005「QSTV」は、例えば、ACA配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0170】
実施例16:TG−ZFD−006「VSTR」
TG−ZFD−006「VSTR」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、YECNYCGKTFSVSSTLIRHQRIH(配列番号33)である。それは、次のヒト核酸配列によりコードされる。
5′−TATGAGTGTAATTACTGTGGAAAAACCTTTAGTGTGAGCTCAACCCTTATTAGACATCAGAGAATCCAC−3′(配列番号32)。
【0171】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−006「VSTR」は、3−bp標的配列GCTに対する認識特異性を表す。生体内スクリーニング結果とEMSAによれば、TG−ZFD−006「VSTR」の結合部位配列に対する選好度はGCT>GCG>GAGである。EMSAにおいて、Zif268のフィンガー1、フィンガー2、及びGST精製ハンドルとTG−ZFD−006「VSTR」との融合は、GCTを含む位置に対しては0.53nM、GCGを含む位置に対しては0.76nM、そしてGAGを含む位置に対しては1.4nMの解離定数Kdを有する。
【0172】
TG−ZFD−006「VSTR」は、例えば、GCTまたはGCG配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0173】
実施例17:TG−ZFD−007「CSNR2」
TG−ZFD−007「CSNR2」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、YQCNICGKCFSCNSNLHRHQRTH(配列番号35)である。それは、次のヒト核酸配列によりコードされる。
5′−TATCAGTGCAACATTTGCGGAAAATGTTTCTCCTGCAACTCCAACCTCCACAGGCACCAGAGAACGCAC−3′(配列番号34)。
【0174】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−007「CSNR2」は3−bp標的配列GAA、GAC、GAGに対する認識特異性を表す。生体内スクリーニング結果によれば、TG−ZFD−007「CSNR2」の結合部位配列に対する選好度はGAA>GAC>GAGである。
【0175】
TG−ZFD−007「CSNR2」は、例えば、GAA、GACまたはGAG配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0176】
実施例18:TG−ZFD−008「QSHR1」
TG−ZFD−008「QSHR1」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、YACHLCGKAFTQSSHLRRHEKTH(配列番号37)である。それは、次のヒト核酸配列によりコードされる。
5′−TATGCATGTCATCTATGTGGAAAAGCCTTCACTCAGAGTTCTCACCTTAGAAGACATGAGAAAACTCAC−3′(配列番号36)。
【0177】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−008「QSHR1」は3−bp標的配列GGA、GAA、AGAに対する認識特異性を表す。生体内スクリーニング結果によれば、TG−ZFD−008「QSHR1」の結合部位配列に対する選好度は、GGA>GAA>AGAである。
【0178】
TG−ZFD−008「QSHR1」は、例えば、GGA、GAAまたはAGA配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0179】
実施例19:TG−ZFD−009「QSHR2」
TG−ZFD−009「QSHR2」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、YKCGQCGKFYSQVSHLTRHQKIH(配列番号39)である。それは、次のヒト核酸配列によりコードされる。
5′−TATAAATGCGGCCAGTGTGGGAAGTTCTACTCGCAGGTCTCCCACCTCACCCGCCACCAGAAAATCCAC−3′(配列番号38)。
【0180】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−009「QSHR2」は3−bp標的配列GGAに対する認識特異性を表す。
【0181】
TG−ZFD−009「QSHR2」は、例えば、GGA配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0182】
実施例20:TG−ZFD−010「QSHR3」
TG−ZFD−010「QSHR3」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、YACHLCGKAFTQCSHLRRHEKTH(配列番号41)である。それは、次のヒト核酸配列によりコードされる。
5′−TATGCATGTCATCTATGTGGAAAAGCCTTCACTCAGTGTTCTCACCTTAGAAGACATGAGAAAACTCAC−3′(配列番号40)。
【0183】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−010「QSHR3」は3−bp標的配列GGA、GAAに対する認識特異性を表す。生体内スクリーニング結果によれば、TG−ZFD−010「QSHR3」の結合部位配列に対する選好度はGGA>GAAである。
【0184】
TG−ZFD−010「QSHR3」は、例えば、GGAまたはGAA配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0185】
実施例21:TG−ZFD−011「QSHR4」
TG−ZFD−011「QSHR4」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、YACHLCAKAFIQCSHLRRHEKTH(配列番号43)である。それは、次のヒト核酸配列によりコードされる。
5′−TATGCATGTCATCTATGTGCAAAAGCCTTCATTCAGTGTTCTCACCTTAGAAGACATGAGAAAACTCAC−3′(配列番号42)。
【0186】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−011「QSHR4」は、3−bp標的配列GGA、GAAに対する認識特異性を表す。生体内スクリーニング結果によれば、TG−ZFD−011「QSHR4」の結合部位配列に対する選好度はGGA>GAAである。
【0187】
TG−ZFD−011「QSHR4」は、例えば、GGAまたはGAA配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0188】
実施例22:TG−ZFD−012「QSHR5」
TG−ZFD−012「QSHR5」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、YVCRECGRGFRQHSHLVRHKRTH(配列番号45)である。それは、次のヒト核酸配列によりコードされる。
5′−TATGTTTGCAGGGAATGTGGGCGTGGCTTTCGCCAGCATTCACACCTGGTCAGACACAAGAGGACACAT−3′(配列番号44)。
【0189】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−012「QSHR5」は、3−bp標的配列GGA、AGA、GAA、及びCGAに対する認識特異性を表す。生体内スクリーニング結果によれば、TG−ZFD−012「QSHR5」の結合部位配列に対する選好度はGGA>AGA>GAA>CGAである。
【0190】
TG−ZFD−012「QSHR5」は、例えば、GGA、AGA、GAAまたはCGA配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0191】
実施例23:TG−ZFD−013「QSNR1」
TG−ZFD−013「QSNR1」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、FECKDCGKAFIQKSNLIRHQRTH(配列番号47)である。それは、次のヒト核酸配列によりコードされる。
5′−TTTGAGTGTAAAGATTGCGGGAAAGCTTTCATTCAGAAGTCAAACCTCATCAGACACCAGAGAACTCAC−3′(配列番号46)。
【0192】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−013「QSNR1」は3−bp標的配列GAAに対する認識特異性を表す。
【0193】
TG−ZFD−013「QSNR1」は、例えば、GAA配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0194】
実施例24:TG−ZFD−014「QSNR2」
TG−ZFD−014「QSNR2」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、YVCRECRRGFSQKSNLIRHQRTH(配列番号49)である。それは、次のヒト核酸配列によりコードされる。
5′−TATGTCTGCAGGGAGTGTAGGCGAGGTTTTAGCCAGAAGTCAAATCTCATCAGACACCAGAGGACGCAC−3′(配列番号48)。
【0195】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−014「QSNR2」は3−bp標的配列GAAに対する認識特異性を表す。
【0196】
TG−ZFD−014「QSNR2」は、例えば、GAA配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0197】
実施例25:TG−ZFD−015「QSNV1」
TG−ZFD−015「QSNV1」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、YECNTCRKTFSQKSNLIVHQRTH(配列番号51)である。それは、次のヒト核酸配列によりコードされる。
5′−TATGAATGTAACACATGCAGGAAAACCTTCTCTCAAAAGTCAAATCTCATTGTACATCAGAGAACACAC−3′(配列番号50)。
【0198】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−015「QSNV1」は3−bp標的配列AAA、CAAに対する認識特異性を表す。生体内スクリーニング結果によれば、TG−ZFD−015「QSNV1」の結合部位配列に対する選好度はAAA>CAAである。
【0199】
TG−ZFD−015「QSNV1」は、例えば、AAAまたはCAA配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0200】
実施例26:TG−ZFD−016「QSNV2」
TG−ZFD−016「QSNV2」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、YVCSKCGKAFTQSSNLTVHQKIH(配列番号53)である。それは、次のヒト核酸配列によりコードされる。
5′−TATGTTTGCTCAAAATGTGGGAAAGCCTTCACTCAGAGTTCAAATCTGACTGTACATCAAAAAATCCAC−3′(配列番号52)。
【0201】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−016「QSNV2」は3−bp標的配列AAA、CAAに対する認識特異性を表す。生体内スクリーニング結果によれば、TG−ZFD−016「QSNV2」の結合部位配列に対する選好度はAAA>CAAである。
【0202】
TG−ZFD−016「QSNV2」は、例えば、AAAまたはCAA配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0203】
実施例27:TG−ZFD−017「QSNV3」
TG−ZFD−017「QSNV3」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、YKCDECGKNFTQSSNLIVHKRIH(配列番号55)である。それは、次のヒト核酸配列によりコードされる。
5′−TACAAATGTGACGAATGTGGAAAAAACTTTACCCAGTCCTCCAACCTTATTGTACATAAGAGAATTCAT−3′(配列番号54)。
【0204】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−017「QSNV3」は3−bp標的配列AAAに対する認識特異性を表す。
【0205】
TG−ZFD−017「QSNV3」は、例えば、AAA配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0206】
実施例28:TG−ZFD−018「QSNV4」
TG−ZFD−018「QSNV4」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、YECDVCGKTFTQKSNLGVHQRTH(配列番号57)である。それは、次のヒト核酸配列によりコードされる。
5′−TATGAATGTGATGTGTGTGGAAAAACCTTCACGCAAAAGTCAAACCTTGGTGTACATCAGAGAACTCAT−3′(配列番号56)。
【0207】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−018「QSNV4」は3−bp標的配列AAAに対する認識特異性を表す。
【0208】
TG−ZFD−018「QSNV4」は、例えば、AAA配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0209】
実施例29:TG−ZFD−019「QSSR1」
TG−ZFD−019「QSSR1」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、YKCPDCGKSFSQSSSLIRHQRTH(配列番号59)である。それは、次のヒト核酸配列によりコードされる。
5′−TATAAGTGCCCTGATTGTGGGAAGAGTTTTAGTCAGAGTTCCAGCCTCATTCGCCACCAGCGGACACAC−3′(配列番号58)。
【0210】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−019「QSSR1」は3−bp標的配列GTA、GCAに対する認識特異性を表す。生体内スクリーニング結果によれば、TG−ZFD−019「QSSR1」の結合部位配列に対する選好度はGTA>GCAである。
【0211】
TG−ZFD−019「QSSR1」は、例えば、GTAまたはGCA配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0212】
実施例30:TG−ZFD−020「QSSR2」
TG−ZFD−020「QSSR2」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、YECQDCGRAFNQNSSLGRHKRTH(配列番号61)である。それは、次のヒト核酸配列によりコードされる。
5′−TATGAGTGTCAGGACTGTGGGAGGGCCTTCAACCAGAACTCCTCCCTGGGGCGGCACAAGAGGACACAC−3′(配列番号60)。
【0213】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−020「QSSR2」は3−bp標的配列GTAに対する認識特異性を表す。
【0214】
TG−ZFD−020「QSSR2」は、例えば、GTA配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0215】
実施例31:TG−ZFD−021「QSTR」
TG−ZFD−021「QSTR」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、YKCEECGKAFNQSSTLTRHKIVH(配列番号63)である。それは、次のヒト核酸配列によりコードされる。
5′−TACAAATGTGAAGAATGTGGCAAAGCTTTTAACCAGTCCTCAACCCTTACTAGACATAAGATAGTTCAT−3′(配列番号62)。
【0216】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−021「QSTR」は3−bp標的配列GTA、GCAに対する認識特異性を表す。生体内スクリーニング結果によれば、TG−ZFD−021「QSTR」の結合部位配列に対する選好度はGTA>GCAである。
【0217】
TG−ZFD−021「QSTR」は、例えば、GTAまたはGCA配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0218】
実施例32:TG−ZFD−022「RSHR」
TG−ZFD−022「RSHR」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、YKCMECGKAFNRRSHLTRHQRIH(配列番号65)である。それは、次のヒト核酸配列によりコードされる。
5′−TATAAGTGCATGGAGTGTGGGAAGGCTTTTAACCGCAGGTCACACCTCACACGGCACCAGCGGATTCAC−3′(配列番号64)。
【0219】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−022「RSHR」は3−bp標的配列GGGに対する認識特異性を表す。
【0220】
TG−ZFD−022「RSHR」は、例えば、GGG配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0221】
実施例33:TG−ZFD−023「VSSR」
TG−ZFD−023「VSSR」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、YTCKQCGKAFSVSSSLRRHETTH(配列番号67)である。それは、次のヒト核酸配列によりコードされる。
5′−TATACATGTAAACAGTGTGGGAAAGCCTTCAGTGTTTCCAGTTCCCTTCGAAGACATGAAACCACTCAC−3′(配列番号66)。
【0222】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−023「VSSR」は3−bp標的配列GTT、GCG、GTAに対する認識特異性を表す。生体内スクリーニング結果によれば、TG−ZFD−023「VSSR」の結合部位配列に対する選好度はGTT>GTG>GTAである。
【0223】
TG−ZFD−023「VSSR」は、例えば、GTT、GCGまたはGTA配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0224】
実施例34:TG−ZFD−024「QAHR」
TG−ZFD−024「QAHR」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、YKCKECGQAFRQRAHLIRHHKLH(配列番号103)である。それは、次のヒト核酸配列によりコードされる。
5′−TATAAGTGTAAGGAATGTGGGCAGGCCTTTAGACAGCGTGCACATCTTATTCGACATCACAAACTTCAC−3′(配列番号102)。
【0225】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−024「QAHR」は3−bp標的配列GGAに対する認識特異性を表す。
【0226】
TG−ZFD−024「QAHR」は、例えば、GGA配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0227】
実施例35:TG−ZFD−025「QFNR」
TG−ZFD−025「QFNR」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、YKCHQCGKAFIQSFNLRRHERTH(配列番号105)である。それは、次のヒト核酸配列によりコードされる。
5′−TATAAGTGTCATCAATGTGTGGGAAAGCCTTTATTCAATCCTTTAACCTTCGAAGACATGAGAGAACTCAC−3′(配列番号104)。
【0228】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−025「QFNR」は3−bp標的配列GACに対する認識特異性を表す。
【0229】
TG−ZFD−025「QFNR」は、例えば、GAC配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0230】
実施例36:TG−ZFD−026「QGNR」
TG−ZFD−026「QGNR」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、FQCNQCGASFTQKGNLLRHIKLH(配列番号107)である。それは、次のヒト核酸配列によりコードされる。
5′−TTCCAGTGTAATCAGTGTGGGGCATCTTTTACTCAGAAAGGTAACCTCCTCCGCCACATTAAACTGCAC−3′(配列番号106)。
【0231】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−026「QGNR」は3−bp標的配列GAAに対する認識特異性を表す。
【0232】
TG−ZFD−026「QGNR」は、例えば、GAA配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0233】
実施例37:TG−ZFD−028「QSHT」
TG−ZFD−028「QSHT」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、YKCEECGKAFRQSSHLTTHKIIH(配列番号111)である。それは、次のヒト核酸配列によりコードされる。
5′−TACAAATGTGAAGAATGTGGCAAAGCCTTTAGGCAGTCCTCACACCTTACTACACATAAGATAATTCAT−3′(配列番号110)。
【0234】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−028「QSHT」は3−bp標的配列AGA、CGA、TGA、GGAに対する認識特異性を表す。生体内スクリーニング結果によれば、TG−ZFD−028「QSHT」の結合部位配列に対する選好度は(AGA、CGA)>TGA>GGAである。
【0235】
TG−ZFD−028「QSHT」は、例えば、AGA、CGA、TGAまたはGGA配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0236】
実施例38:TG−ZFD−029「QSHV」
TG−ZFD−029「QSHV」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、YECDHCGKSFSQSSHLNVHKRTH(配列番号113)である。それは、次のヒト核酸配列によりコードされる。
5′−TATGAGTGTGATCACTGTGGAAAATCCTTTAGCCAGAGCTCTCATCTGAATGTGCACAAAAGAACTCAC−3′(配列番号112)。
【0237】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−029「QSHV」は3−bp標的配列CGA、AGA、及びTGAに対する認識特異性を表す。生体内スクリーニング結果によれば、TG−ZFD−029「QSHV」の結合部位配列に対する選好度はCGA>AGA>TGAである。
【0238】
TG−ZFD−029「QSHV」は、例えば、CGA、AGA、TGA配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0239】
実施例39:TG−ZFD−030「QSNI」
TG−ZFD−030「QSNI」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、YMCSECGRGFSQKSNLIIHQRTH(配列番号115)である。それは、次のヒト核酸配列によりコードされる。
5′−TACATGTGCAGTGAGTGTGGGCGAGGCTTCAGCCAGAAGTCAAACCTCATCATACACCAGAGGACACAC−3′(配列番号114)。
【0240】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−030「QSNI」は3−bp標的配列AAA、CAAに対する認識特異性を表す。
【0241】
TG−ZFD−030「QSNI」は、例えば、AAAまたはCAA配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0242】
実施例40:TG−ZFD−031「QSNR3」
TG−ZFD−031「QSNR3」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、YECEKCGKAFNQSSNLTRHKKSH(配列番号117)である。それは、次のヒト核酸配列によりコードされる。
5′−TATGAATGTGAAAAATGTGGCAAAGCTTTTAACCAGTCCTCAAATCTTACTAGACATAAGAAAAGTCAT−3′(配列番号116)。
【0243】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−031「QSNR3」は3−bp標的配列GAAに対する認識特異性を表す。
【0244】
TG−ZFD−031「QSNR3」は、例えば、GAA配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0245】
実施例41:TG−ZFD−032「QSSR3」
TG−ZFD−032「QSSR3」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、YECNECGKFFSQSSSLIRHRRSH(配列番号119)である。それは、次のヒト核酸配列によりコードされる。
5′−TATGAGTGCAATGAATGTGGGAAGTTTTTTAGCCAGAGCTCCAGCCTCATTAGACATAGGAGAAGTCAC−3′(配列番号118)。
【0246】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−032「QSSR3」は3−bp標的配列GTA、GCAに対する認識特異性を表す。生体内スクリーニング結果によれば、TG−ZFD−032「QSSR3」の結合部位配列に対する選好度はGTA>GCAである。
【0247】
TG−ZFD−032「QSSR3」は、例えば、GTAまたはGCA配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0248】
実施例42:TG−ZFD−033「QTHQ」
TG−ZFD−033「QTHQ」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、YECHDCGKSFRQSTHLTQHRRIH(配列番号121)である。それは、次のヒト核酸配列によりコードされる。
5′−TATGAGTGTCACGATTGCGGAAAGTCCTTTAGGCAGAGCACCCACCTCACTCAGCACCGGAGGATCCAC−3′(配列番号120)。
【0249】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−033「QTHQ」は3−bp標的配列AGA、TGA、CGAに対する認識特異性を表す。生体内スクリーニング結果によれば、TG−ZFD−033「QTHQ」の結合部位配列に対する選好度はAGA>(TGA、CGA)である。
【0250】
TG−ZFD−033「QTHQ」は、例えば、AGA、TGA、CGA配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0251】
実施例43:TG−ZFD−034「QTHR1」
TG−ZFD−034「QTHR1」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、YECHDCGKSFRQSTHLTRHRRIH(配列番号123)である。それは、次のヒト核酸配列によりコードされる。
5′−TATGAGTGTCACGATTGCGGAAAGTCCTTTAGGCAGAGCACCCACCTCACTCGGCACCGGAGGATCCAC−3′(配列番号122)。
【0252】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−034「QTHR1」は3−bp標的配列GGA、GAA、AGAに対する認識特異性を表す。生体内スクリーニング結果によれば、TG−ZFD−034「QTHR1」の結合部位配列に対する選好度はGGA>(GAA、AGA)である。
【0253】
TG−ZFD−034「QTHR1」は、例えば、GGA、GAA、AGA配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0254】
実施例44:TG−ZFD−035「QTHR2」
TG−ZFD−035「QTHR2」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、HKCLECGKCFSQNTHLTRHQRT(配列番号125)である。それは、次のヒト核酸配列によりコードされる。
5′−CACAAGTGCCTTGAATGTGGGAAATGCTTCAGTCAGAACACCCATCTGACTCGCCACCAACGCACCCAC−3′(配列番号124)。
【0255】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−035「QTHR2」は3−bp標的配列GGAに対する認識特異性を表す。
【0256】
TG−ZFD−035「QTHR2」は、例えば、GGA配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0257】
実施例45:TG−ZFD−036「RDER2」
TG−ZFD−036「RDER2」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、YHCDWDGCGWKFARSDELTRHYRKH(配列番号127)である。それは、次のヒト核酸配列によりコードされる。
5′−TACCACTGTGACTGGGACGGCTGTGGATGGAAATTCGCCCGCTCAGATGAACTGACCAGGCACTACCGTAAACAC−3′(配列番号126)。
【0258】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−036「RDER2」は3−bp標的配列GCG、GTGに対する認識特異性を表す。生体内スクリーニング結果によれば、TG−ZFD−036「RDER2」の結合部位配列に対する選好度はGCG>GTGである。
【0259】
TG−ZFD−036「RDER2」は、例えば、GCG、GTG配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0260】
実施例46:TG−ZFD−037「RDER3」
TG−ZFD−037「RDER3」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、YRCSWEGCEWRFARSDELTRHFRKH(配列番号129)である。それは、次のヒト核酸配列によりコードされる。
5′−TACAGATGCTCATGGGAAGGGTGTGAGTGGCGTTTTGCAAGAAGTGATGAGTTAACCAGGCACTTCCGAAAGCAC−3′(配列番号128)。
【0261】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−037「RDER3」は3−bp標的配列GCG、GTGに対する認識特異性を表す。
【0262】
TG−ZFD−037「RDER3」は、例えば、GCG、GTG配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0263】
実施例47:TG−ZFD−038「RDER4」
TG−ZFD−038「RDER4」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、FSCSWKGCERRFARSDELSRHRRTH(配列番号131)である。それは、次のヒト核酸配列によりコードされる。
5′−TTCAGCTGTAGCTGGAAAGGTTGTGAAAGGAGGTTTGCCCGTTCTGATGAACTGTCCAGACACAGGCGAACCCAC−3′(配列番号130)。
【0264】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−038「RDER4」は3−bp標的配列GCG、GTGに対する認識特異性を表す。
【0265】
TG−ZFD−038「RDER4」は、例えば、GCG、GTG配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0266】
実施例48:TG−ZFD−039「RDER5」
TG−ZFD−039「RDER5」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、FACSWQDCNKKFARSDELARHYRTH(配列番号133)である。それは、次のヒト核酸配列によりコードされる。
5′−TTCGCCTGCAGCTGGCAGGACTGCAACAAGAAGTTCGCGCGCTCCGACGAGCTGGCGCGGCACTACCGCACACAC−3′(配列番号132)。
【0267】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−039「RDER5」は3−bp標的配列GCGに対する認識特異性を表す。
【0268】
TG−ZFD−039「RDER5」は、例えば、GCG配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0269】
実施例49:TG−ZFD−040「RDER6」
TG−ZFD−040「RDER6」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、YHCNWDGCGWKFARSDELTRHYRKH(配列番号135)である。それは、次のヒト核酸配列によりコードされる。
5′−TACCACTGCAACTGGGACGGCTGCGGCTGGAAGTTTGCGCGCTCAGACGAGCTCACGCGCCACTACCGAAAGCAC−3′(配列番号134)。
【0270】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−040「RDER6」は3−bp標的配列GCG、GTGに対する認識特異性を表す。生体内スクリーニング結果によれば、TG−ZFD−040「RDER6」の結合部位配列に対する選好度はGCG>GTGである。
【0271】
TG−ZFD−040「RDER6」は、例えば、GCG、GTG配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0272】
実施例50:TG−ZFD−041「RDHR1」
TG−ZFD−041「RDHR1」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、FLCQYCAQRFGRKDHLTRHMKKSH(配列番号137)である。それは、次のヒト核酸配列によりコードされる。
5′−TTCCTCTGTCAGTATTGTGCACAGAGATTTGGGCGAAAGGATCACCTGACTCGACATATGAAGAAGAGTCAC−3′(配列番号136)。
【0273】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−041「RDHR1」は3−bp標的配列GAG、GGGに対する認識特異性を表す。
【0274】
TG−ZFD−041「RDHR1」は、例えば、GAG、GGG配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0275】
実施例51:TG−ZFD−043「RDHT」
TG−ZFD−043「RDHT」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、FQCKTCQRKFSRSDHLKTHTRTH(配列番号141)である。それは、次のヒト核酸配列によりコードされる。
5′−TTCCAGTGTAAAACTTGTCAGCGAAAGTTCTCCCGGTCCGACCACCTGAAGACCCACACCAGGACTCAT−3′(配列番号140)。
【0276】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−043「RDHT」は3−bp標的配列TGG、AGG、CGGに対する認識特異性を表す。
【0277】
TG−ZFD−043「RDHT」は、例えば、TGG、AGG、CGG、GGG配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0278】
実施例52:TG−ZFD−044「RDKI」
TG−ZFD−044「RDKI」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、FACEVCGVRFTRNDKLKIHMRKH(配列番号143)である。それは、次のヒト核酸配列によりコードされる。
5′−TTTGCCTGCGAGGTCTGCGGTGTTCGATTCACCAGGAACGACAAGCTGAAGATCCACATGCGGAAGCAC−3′(配列番号142)。
【0279】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−044「RDKI」は3−bp標的配列GGGに対する認識特異性を表す。
【0280】
TG−ZFD−044「RDKI」は、例えば、GGG配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0281】
実施例53:TG−ZFD−045「RDKR」
TG−ZFD−045「RDKR」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、YVCDVEGCTWKFARSDKLNRHKKRH(配列番号145)である。それは、次のヒト核酸配列によりコードされる。
5′−TATGTATGCGATGTAGAGGGATGTACGTGGAAATTTGCCCGCTCAGATAAGCTCAACAGACACAAGAAAAGGCAC−3′(配列番号144)。
【0282】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−045「RDKR」は3−bp標的配列GGG、AGGに対する認識特異性を表す。生体内スクリーニング結果によれば、TG−ZFD−045「RDKR」の結合部位配列に対する選好度はGGG>AGGである。
【0283】
TG−ZFD−045「RDKR」は、例えば、GGG、AGG配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0284】
実施例54:TG−ZFD−046「RSNR」
TG−ZFD−046「RSNR」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、YICRKCGRGFSRKSNLIRHQRTH(配列番号147)である。それは、次のヒト核酸配列によりコードされる。
5′−TATATTTGCAGAAAGTGTGGACGGGGCTTTAGTCGGAAGTCCAACCTTATCAGACATCAGAGGACACAC−3′(配列番号146)。
【0285】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−046「RSNR」は3−bp標的配列GAG、GTGに対する認識特異性を表す。生体内スクリーニング結果によれば、TG−ZFD−046「RSNR」の結合部位配列に対する選好度はGAG>GTGである。
【0286】
TG−ZFD−046「RSNR」は、例えば、GAG、GTG配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0287】
実施例55:TG−ZFD−047「RTNR」
TG−ZFD−047「RTNR」は、ヒトゲノム配列から生体内スクリーニングにより同定された。そのアミノ酸配列は、YLCSECDKCFSRSTNLIRHRRTH(配列番号149)である。それは、次のヒト核酸配列によりコードされる。
5′−TATCTATGTAGTGAGTGTGACAAATGCTTCAGTAGAAGTACAAACCTCATAAGGCATCGAAGAACTCAC−3′(配列番号148)。
【0288】
Zif268のフィンガー1及びフィンガー2との融合ポリペプチドとして、TG−ZFD−047「RTNR」は3−bp標的配列GAGに対する認識特異性を表す。
【0289】
TG−ZFD−047「RTNR」は、例えば、GAG配列を含むDNA部位を認識するために、複数のジンクフィンガードメインからなるキメラDNA結合タンパク質を作るための単位として利用され得る。
【0290】
本発明に関する多くの実施態様を記述した。それにも拘わらず、本発明の精神と範囲を逸脱しない多くの多様な変形が可能であることを理解するはずである。したがって他の実施態様も後述する請求項の範囲に含まれる。
【図面の簡単な説明】
【0291】
【図1】三つのジンクフィンガードメインで構成され、DNA配列5′−GCG TGG GCG T−3′と結合しているZif268ジンクフィンガータンパク質の3次元構造を表す図面である。黒色円は亜鉛イオンの位置を表す。
【図2】Zif268のアミノ酸残基とDNA塩基間の水素結合相互作用を表す。αヘリックスに沿った−1、2、3及び6位のアミノ酸残基らは、特定位置の塩基と相互作用する。太線は理想的な水素結合を表し、点線は潜在的な水素結合を表す。
【図3】ジンクフィンガードメインのαヘリックスに沿った−1、2、3及び6位のアミノ酸残基とDNA塩基間の相互作用を要約した認識コード(recognition code)表を表す。
【図4】アミノ酸残基及びこれらの相当する3塩基トリプレットの位置を表す図面である。太線は観察される主要相互作用を表し、点線は補助相互作用を表す。
【図5】本明細書に開示された生体内(in vivo)選別システムの原理を説明する図面である。多様なジンクフィンガー突然変異のうち、ジンクフィンガードメインAは標的配列(XXXXで表示)を認識し、HIS3リポーター遺伝子の転写を活性化する。結果的に、酵母コロニーはヒスチジンが欠乏した培地で育つ。これと対照的に、ジンクフィンガードメインBは標的配列を認識せず、したがって、リポーター遺伝子は抑圧されるようになる。その結果、ヒスチジンが欠乏した培地でコロニーが育たない。ADは転写活性化ドメインを表す。
【図6】HIVの末端反復配列(LTR)で及びHIV−1の共受容体(coreceptor)をコードするヒト遺伝子であるCCR5のプロモーター部位で発見される10−bp配列の目録である(それぞれ配列番号1−5)。下線部分は本発明の選別で使用された4−bp標的配列を表す。
【図7】リポーター遺伝子に連結された結合部位の塩基配列を表す(それぞれ配列番号s:6−17)。それぞれの結合部位は4つの複合結合配列の直列配置で構成されている。それぞれの複合結合配列はZif268のフィンガー1及びフィンガー2により認識される切断された結合配列5′−GG GCG−3’を4−bp標的配列に連結させて構築された。
【図8】ハイブリッドプラスミドのライブラリー構築に使用可能なプラスミドであるpPCFMS−Zif(配列番号18及び19)の図面である。
【図9】pPCFMS−Zifに挿入されたZif268ジンクフィンガータンパク質をコードする遺伝子に対する塩基配列及び相応する翻訳されたアミノ酸配列を表す(それぞれ配列番号20及び21)。制限酵素により認識される部位に下線を引いた。
【図10】生体内選別システムにより選択されたジンクフィンガータンパク質を使用して再形質転換(retransformation)及び交差形質転換(cross-transformation)から得た酵母細胞を有する培養プレートの写真である。
【図11】ヒトゲノム由来のジンクフィンガーライブラリーから生体内システムにより選択されたジンクフィンガードメインの特定DNA配列及びこのDNA配列によりコードされるアミノ酸配列の目録である(配列番号22−33)。ヒトゲノムからジンクフィンガードメインをコードするDNAセグメントを増幅させるのに使用される縮重(degenerate)PCRプライマーに相応するDNA配列に下線を引いた。4個の潜在的な塩基−接触位置を表示し、アミノ酸残基を太く表した。亜鉛イオンと配位結合することと予想される二つのCys残基及び二つのHis残基をイタリック体で表した。
【特許請求の範囲】
【請求項1】
アミノ酸配列、Xa−X−Cys−X2-5−Cys−X3−Xa−X−Cys−X−Ser−Asn−Xb−X−Arg−His−X3-5−His(配列番号68)(ここで、Xaは、フェニルアラニンまたはチロシンであり、Xbは、疎水性残基である)を含む精製されたポリペプチド。
【請求項2】
請求項1に記載されたポリペプチドをコードする配列を含む核酸。
【請求項3】
アミノ酸配列、Xa−X−Cys−X2-5−Cys−X3−Xa−X−His−X−Ser−Asn−Xb−X−Lys−His−X3-5−His(配列番号69)(ここで、Xaは、フェニルアラニンまたはチロシンであり、Xbは、疎水性残基である)を含む精製されたポリペプチド。
【請求項4】
請求項3に記載されたポリペプチドをコードする配列を含む核酸。
【請求項5】
アミノ酸配列、Xa−X−Cys−X2-5−Cys−X3−Xa−X−Ser−X−Ser−Asn−Xb−X−Arg−His−X3-5−His(配列番号70)(ここで、Xaは、フェニルアラニンまたはチロシンであり、Xbは、疎水性残基である)を含む精製されたポリペプチド。
【請求項6】
請求項5に記載されたポリペプチドをコードする配列を含む核酸。
【請求項7】
アミノ酸配列、Xa−X−Cys−X2-5−Cys−X3−Xa−X−Gln−X−Ser−Thr−Xb−X−Val−His−X3-5−His(配列番号71)(ここで、Xaは、フェニルアラニンまたはチロシンであり、Xbは、疎水性残基である)を含む精製されたポリペプチド。
【請求項8】
請求項7に記載されたポリペプチドをコードする配列を含有する核酸。
【請求項9】
アミノ酸配列、Xa−X−Cys−X2-5−Cys−X3−Xa−X−Val−X−Ser−Xc−Xb−X−Arg−His−X3-5−His(配列番号72)(ここで、Xaは、フェニルアラニンまたはチロシンであり、Xbは、疎水性残基であり、Xcは、セリンまたはスレオニンである)を含む精製されたポリペプチド。
【請求項10】
請求項9に記載されたポリペプチドをコードする配列を含む核酸。
【請求項11】
アミノ酸配列、Xa−X−Cys−X2-5−Cys−X3−Xa−X−Gln−X−Ser−His−Xb−X−Arg−His−X3-5−His(配列番号73)(ここで、Xaは、フェニルアラニンまたはチロシンであり、Xbは、疎水性残基である)を含む精製されたポリペプチド。
【請求項12】
請求項11に記載されたポリペプチドをコードする配列を含む核酸。
【請求項13】
アミノ酸配列、Xa−X−Cys−X2-5−Cys−X3−Xa−X−Gln−X−Ser−Asn−Xb−X−Val−His−X3-5−His(配列番号74)(ここで、Xaは、フェニルアラニンまたはチロシンであり、Xbは、疎水性残基である)を含む精製されたポリペプチド。
【請求項14】
請求項13に記載されたポリペプチドをコードする配列を含む核酸。
【請求項15】
アミノ酸配列、Xa−X−Cys−X2-5−Cys−X3−Xa−X−Gln−X−Ser−Xc−Xb−X−Arg−His−X3-5−His(配列番号75)(ここで、Xaは、フェニルアラニンまたはチロシンであり、Xbは、疎水性残基である)を含む精製されたポリペプチド。
【請求項16】
請求項15に記載されたポリペプチドをコードする配列を含む核酸。
【請求項17】
配列番号65で示されるアミノ酸配列と60%相同性なアミノ酸配列を含む、精製されたポリペプチド。
【請求項18】
請求項17に記載されたポリペプチドをコードする配列を含む核酸。
【請求項19】
配列番号29、127、129、131、133及び135からなる群より選択されたアミノ酸配列と60%相同なアミノ酸配列を含む精製されたポリペプチド。
【請求項20】
請求項19に記載されたポリペプチドをコードする配列を含む核酸。
【請求項21】
アミノ酸配列、Xa−X−Cys−X2-5−Cys−X3−Xa−X−Gln−X−Ala−His−Xb−X−Arg−His−X3-5−His(配列番号150)(ここで、Xaは、フェニルアラニンまたはチロシンであり、Xbは、疎水性残基である)を含む精製されたポリペプチド。
【請求項22】
請求項21に記載されたポリペプチドをコードする配列を含む核酸。
【請求項23】
アミノ酸配列、Xa−X−Cys−X2-5−Cys−X3−Xa−X−Gln−X−Phe−Asn−Xb−X−Arg−His−X3-5−His(配列番号151)(ここで、Xaは、フェニルアラニンまたはチロシンであり、Xbは、疎水性残基である)を含む精製されたポリペプチド。
【請求項24】
請求項23に記載されたポリペプチドをコードする配列を含む核酸。
【請求項25】
アミノ酸配列、Xa−X−Cys−X2-5−Cys−X3−Xa−X−Gln−X−Ser−His−Xb−X−Thr−His−X3-5−His(配列番号152)(ここで、Xaは、フェニルアラニンまたはチロシンであり、Xbは、疎水性残基である)を含む精製されたポリペプチド。
【請求項26】
請求項25に記載されたポリペプチドをコードする配列を含む核酸。
【請求項27】
アミノ酸配列、Xa−X−Cys−X2-5−Cys−X3−Xa−X−Gln−X−Ser−His−Xb−X−Val−His−X3-5−His(配列番号153)(ここで、Xaは、フェニルアラニンまたはチロシンであり、Xbは、疎水性残基である)を含む精製されたポリペプチド。
【請求項28】
請求項27に記載されたポリペプチドをコードする配列を含む核酸。
【請求項29】
アミノ酸配列、Xa−X−Cys−X2-5−Cys−X3−Xa−X−Gln−X−Ser−Asn−Xb−X−Ile−His−X3-5−His(配列番号154)(ここで、Xaは、フェニルアラニンまたはチロシンであり、Xbは、疎水性残基である)を含む精製されたポリペプチド。
【請求項30】
請求項29に記載されたポリペプチドをコードする配列を含む核酸。
【請求項31】
アミノ酸配列、Xa−X−Cys−X2-5−Cys−X3−Xa−X−Gln−X−Ser−Asn−Xb−X−Arg−His−X3-5−His(配列番号155)(ここで、Xaは、フェニルアラニンまたはチロシンであり、Xbは、疎水性残基である)を含む精製されたポリペプチド。
【請求項32】
請求項31に記載されたポリペプチドをコードする配列を含む核酸。
【請求項33】
アミノ酸配列、Xa−X−Cys−X2-5−Cys−X3−Xa−X−Gln−X−Thr−His−Xb−X−Gln−His−X3-5−His(配列番号156)(ここで、Xaは、フェニルアラニンまたはチロシンであり、Xbは、疎水性残基である)を含む精製されたポリペプチド。
【請求項34】
請求項33に記載されたポリペプチドをコードする配列を含む核酸。
【請求項35】
アミノ酸配列、Cys−X2-5−Cys−X3−Xa−X−Gln−X−Thr−His−Xb−X−Arg−His−X3-5−His(配列番号157)(ここで、Xaは、フェニルアラニンまたはチロシンであり、Xbは、疎水性残基である)を含む精製されたポリペプチド。
【請求項36】
請求項35に記載されたポリペプチドをコードする配列を含む核酸。
【請求項37】
アミノ酸配列、Xa−X−Cys−X2-5−Cys−X3−Xa−X−Arg−X−Asp−Lys−Xb−X−Ile−His−X3-5−His(配列番号158)(ここで、Xaは、フェニルアラニンまたはチロシンであり、Xbは、疎水性残基である)を含む精製されたポリペプチド。
【請求項38】
請求項37に記載されたポリペプチドをコードする配列を含む核酸。
【請求項39】
アミノ酸配列、Xa−X−Cys−X2-5−Cys−X3−Xa−X−Arg−X−Ser−Asn−Xb−X−Arg−His−X3-5−His(配列番号159)(ここで、Xaは、フェニルアラニンまたはチロシンであり、Xbは、疎水性残基である)を含む精製されたポリペプチド。
【請求項40】
請求項39に記載されたポリペプチドをコードする配列を含む核酸。
【請求項41】
配列番号137で示されるアミノ酸配列と60%以上の相同性を有するアミノ酸配列を含有する精製されたポリペプチド。
【請求項42】
請求項41に記載されたポリペプチドをコードする配列を含有する核酸。
【請求項43】
配列番号145で示されるアミノ酸配列と60%以上の相同性を有するアミノ酸配列を含有する精製されたポリペプチド。
【請求項44】
請求項43に記載されたポリペプチドをコードする配列を含有する核酸。
【請求項45】
配列番号149で示されるアミノ酸配列と60%以上の相同性を有するアミノ酸配列を含有する精製されたポリペプチド。
【請求項46】
請求項45に記載されたポリペプチドをコードする配列を含有する核酸。
【請求項47】
配列番号141で示されるアミノ酸配列と60%以上の相同性を有するアミノ酸配列を含有する精製されたポリペプチド。
【請求項48】
請求項47に記載されたポリペプチドをコードする配列を含有する核酸。
【請求項1】
アミノ酸配列、Xa−X−Cys−X2-5−Cys−X3−Xa−X−Cys−X−Ser−Asn−Xb−X−Arg−His−X3-5−His(配列番号68)(ここで、Xaは、フェニルアラニンまたはチロシンであり、Xbは、疎水性残基である)を含む精製されたポリペプチド。
【請求項2】
請求項1に記載されたポリペプチドをコードする配列を含む核酸。
【請求項3】
アミノ酸配列、Xa−X−Cys−X2-5−Cys−X3−Xa−X−His−X−Ser−Asn−Xb−X−Lys−His−X3-5−His(配列番号69)(ここで、Xaは、フェニルアラニンまたはチロシンであり、Xbは、疎水性残基である)を含む精製されたポリペプチド。
【請求項4】
請求項3に記載されたポリペプチドをコードする配列を含む核酸。
【請求項5】
アミノ酸配列、Xa−X−Cys−X2-5−Cys−X3−Xa−X−Ser−X−Ser−Asn−Xb−X−Arg−His−X3-5−His(配列番号70)(ここで、Xaは、フェニルアラニンまたはチロシンであり、Xbは、疎水性残基である)を含む精製されたポリペプチド。
【請求項6】
請求項5に記載されたポリペプチドをコードする配列を含む核酸。
【請求項7】
アミノ酸配列、Xa−X−Cys−X2-5−Cys−X3−Xa−X−Gln−X−Ser−Thr−Xb−X−Val−His−X3-5−His(配列番号71)(ここで、Xaは、フェニルアラニンまたはチロシンであり、Xbは、疎水性残基である)を含む精製されたポリペプチド。
【請求項8】
請求項7に記載されたポリペプチドをコードする配列を含有する核酸。
【請求項9】
アミノ酸配列、Xa−X−Cys−X2-5−Cys−X3−Xa−X−Val−X−Ser−Xc−Xb−X−Arg−His−X3-5−His(配列番号72)(ここで、Xaは、フェニルアラニンまたはチロシンであり、Xbは、疎水性残基であり、Xcは、セリンまたはスレオニンである)を含む精製されたポリペプチド。
【請求項10】
請求項9に記載されたポリペプチドをコードする配列を含む核酸。
【請求項11】
アミノ酸配列、Xa−X−Cys−X2-5−Cys−X3−Xa−X−Gln−X−Ser−His−Xb−X−Arg−His−X3-5−His(配列番号73)(ここで、Xaは、フェニルアラニンまたはチロシンであり、Xbは、疎水性残基である)を含む精製されたポリペプチド。
【請求項12】
請求項11に記載されたポリペプチドをコードする配列を含む核酸。
【請求項13】
アミノ酸配列、Xa−X−Cys−X2-5−Cys−X3−Xa−X−Gln−X−Ser−Asn−Xb−X−Val−His−X3-5−His(配列番号74)(ここで、Xaは、フェニルアラニンまたはチロシンであり、Xbは、疎水性残基である)を含む精製されたポリペプチド。
【請求項14】
請求項13に記載されたポリペプチドをコードする配列を含む核酸。
【請求項15】
アミノ酸配列、Xa−X−Cys−X2-5−Cys−X3−Xa−X−Gln−X−Ser−Xc−Xb−X−Arg−His−X3-5−His(配列番号75)(ここで、Xaは、フェニルアラニンまたはチロシンであり、Xbは、疎水性残基である)を含む精製されたポリペプチド。
【請求項16】
請求項15に記載されたポリペプチドをコードする配列を含む核酸。
【請求項17】
配列番号65で示されるアミノ酸配列と60%相同性なアミノ酸配列を含む、精製されたポリペプチド。
【請求項18】
請求項17に記載されたポリペプチドをコードする配列を含む核酸。
【請求項19】
配列番号29、127、129、131、133及び135からなる群より選択されたアミノ酸配列と60%相同なアミノ酸配列を含む精製されたポリペプチド。
【請求項20】
請求項19に記載されたポリペプチドをコードする配列を含む核酸。
【請求項21】
アミノ酸配列、Xa−X−Cys−X2-5−Cys−X3−Xa−X−Gln−X−Ala−His−Xb−X−Arg−His−X3-5−His(配列番号150)(ここで、Xaは、フェニルアラニンまたはチロシンであり、Xbは、疎水性残基である)を含む精製されたポリペプチド。
【請求項22】
請求項21に記載されたポリペプチドをコードする配列を含む核酸。
【請求項23】
アミノ酸配列、Xa−X−Cys−X2-5−Cys−X3−Xa−X−Gln−X−Phe−Asn−Xb−X−Arg−His−X3-5−His(配列番号151)(ここで、Xaは、フェニルアラニンまたはチロシンであり、Xbは、疎水性残基である)を含む精製されたポリペプチド。
【請求項24】
請求項23に記載されたポリペプチドをコードする配列を含む核酸。
【請求項25】
アミノ酸配列、Xa−X−Cys−X2-5−Cys−X3−Xa−X−Gln−X−Ser−His−Xb−X−Thr−His−X3-5−His(配列番号152)(ここで、Xaは、フェニルアラニンまたはチロシンであり、Xbは、疎水性残基である)を含む精製されたポリペプチド。
【請求項26】
請求項25に記載されたポリペプチドをコードする配列を含む核酸。
【請求項27】
アミノ酸配列、Xa−X−Cys−X2-5−Cys−X3−Xa−X−Gln−X−Ser−His−Xb−X−Val−His−X3-5−His(配列番号153)(ここで、Xaは、フェニルアラニンまたはチロシンであり、Xbは、疎水性残基である)を含む精製されたポリペプチド。
【請求項28】
請求項27に記載されたポリペプチドをコードする配列を含む核酸。
【請求項29】
アミノ酸配列、Xa−X−Cys−X2-5−Cys−X3−Xa−X−Gln−X−Ser−Asn−Xb−X−Ile−His−X3-5−His(配列番号154)(ここで、Xaは、フェニルアラニンまたはチロシンであり、Xbは、疎水性残基である)を含む精製されたポリペプチド。
【請求項30】
請求項29に記載されたポリペプチドをコードする配列を含む核酸。
【請求項31】
アミノ酸配列、Xa−X−Cys−X2-5−Cys−X3−Xa−X−Gln−X−Ser−Asn−Xb−X−Arg−His−X3-5−His(配列番号155)(ここで、Xaは、フェニルアラニンまたはチロシンであり、Xbは、疎水性残基である)を含む精製されたポリペプチド。
【請求項32】
請求項31に記載されたポリペプチドをコードする配列を含む核酸。
【請求項33】
アミノ酸配列、Xa−X−Cys−X2-5−Cys−X3−Xa−X−Gln−X−Thr−His−Xb−X−Gln−His−X3-5−His(配列番号156)(ここで、Xaは、フェニルアラニンまたはチロシンであり、Xbは、疎水性残基である)を含む精製されたポリペプチド。
【請求項34】
請求項33に記載されたポリペプチドをコードする配列を含む核酸。
【請求項35】
アミノ酸配列、Cys−X2-5−Cys−X3−Xa−X−Gln−X−Thr−His−Xb−X−Arg−His−X3-5−His(配列番号157)(ここで、Xaは、フェニルアラニンまたはチロシンであり、Xbは、疎水性残基である)を含む精製されたポリペプチド。
【請求項36】
請求項35に記載されたポリペプチドをコードする配列を含む核酸。
【請求項37】
アミノ酸配列、Xa−X−Cys−X2-5−Cys−X3−Xa−X−Arg−X−Asp−Lys−Xb−X−Ile−His−X3-5−His(配列番号158)(ここで、Xaは、フェニルアラニンまたはチロシンであり、Xbは、疎水性残基である)を含む精製されたポリペプチド。
【請求項38】
請求項37に記載されたポリペプチドをコードする配列を含む核酸。
【請求項39】
アミノ酸配列、Xa−X−Cys−X2-5−Cys−X3−Xa−X−Arg−X−Ser−Asn−Xb−X−Arg−His−X3-5−His(配列番号159)(ここで、Xaは、フェニルアラニンまたはチロシンであり、Xbは、疎水性残基である)を含む精製されたポリペプチド。
【請求項40】
請求項39に記載されたポリペプチドをコードする配列を含む核酸。
【請求項41】
配列番号137で示されるアミノ酸配列と60%以上の相同性を有するアミノ酸配列を含有する精製されたポリペプチド。
【請求項42】
請求項41に記載されたポリペプチドをコードする配列を含有する核酸。
【請求項43】
配列番号145で示されるアミノ酸配列と60%以上の相同性を有するアミノ酸配列を含有する精製されたポリペプチド。
【請求項44】
請求項43に記載されたポリペプチドをコードする配列を含有する核酸。
【請求項45】
配列番号149で示されるアミノ酸配列と60%以上の相同性を有するアミノ酸配列を含有する精製されたポリペプチド。
【請求項46】
請求項45に記載されたポリペプチドをコードする配列を含有する核酸。
【請求項47】
配列番号141で示されるアミノ酸配列と60%以上の相同性を有するアミノ酸配列を含有する精製されたポリペプチド。
【請求項48】
請求項47に記載されたポリペプチドをコードする配列を含有する核酸。
【図1】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【図2】
【図3】
【図4】
【図5】
【図6】
【図7】
【図8】
【図9】
【図10】
【図11】
【公開番号】特開2006−149395(P2006−149395A)
【公開日】平成18年6月15日(2006.6.15)
【国際特許分類】
【出願番号】特願2006−628(P2006−628)
【出願日】平成18年1月5日(2006.1.5)
【分割の表示】特願2001−560342(P2001−560342)の分割
【原出願日】平成13年2月17日(2001.2.17)
【出願人】(502300495)トルゼン.インコーポレーテッド (1)
【氏名又は名称原語表記】TOOLGEN,INC.
【Fターム(参考)】
【公開日】平成18年6月15日(2006.6.15)
【国際特許分類】
【出願日】平成18年1月5日(2006.1.5)
【分割の表示】特願2001−560342(P2001−560342)の分割
【原出願日】平成13年2月17日(2001.2.17)
【出願人】(502300495)トルゼン.インコーポレーテッド (1)
【氏名又は名称原語表記】TOOLGEN,INC.
【Fターム(参考)】
[ Back to top ]