説明

新規DNA結合ドメインおよびそれを含む新規DNA切断酵素

【課題】どのような塩基配列でも自由に標的遺伝子とすることでき、かつ正確な結合特異性を有する人工DNA結合ドメインを提供すること。
【解決手段】標的配列を特異的に認識して結合するDNA結合タンパク質であって、N末端から順番に以下のドメインを含んでなるDNA結合タンパク質を提供する:
(1)250〜312アミノ酸長であるドメイン;
(2−1)TALEの標的配列認識ドメインまたはTALEの変異型標的配列認識ドメイン;
(2−2)TALEの標的配列認識最終ドメインまたはTALEの変異型標的配列認識最終ドメイン;
(3)7から8塩基対からなる標的配列に相当する長さを有するドメイン;および、
(4)ジンクフィンガードメインまたは変異型ジンクフィンガードメイン。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、標的とするDNA配列中の任意の塩基配列を認識し、その認識部分に結合することができる新規DNA結合ドメイン、およびかかる新規DNA結合ドメインをDNA切断酵素のヌクレアーゼドメインに融合させてなる、任意の塩基配列を標的配列とする新規DNA切断酵素に関する。
【背景技術】
【0002】
DNA中の所望の塩基配列を認識し、結合するDNA結合ドメインとしては、3あるいは4塩基のDNAに結合するジンクフィンガーを、例えば3〜6個連結させたDNA結合ドメイン(非特許文献1)や、1塩基ごとに認識することのできるモジュール部分の組合せ配列からなるTALE(非特許文献2)などが知られている。
【0003】
このように所望の塩基配列を認識するDNA結合ドメインを、DNA切断酵素のDNA切断ドメインと融合させることにより、DNA中の所望の配列を認識してDNAを所望の位置で切断することが可能となる。また、所望の塩基配列を認識するDNA結合ドメインを、例えば、転写活性化因子と融合させることにより、DNA中の所望の配列領域からの転写を活性化することも期待できる。さらに、所望の塩基配列を認識して結合するDNA結合ドメインは、例えば、標識やレポーター酵素と融合させることによりゲノム中の標的配列の存在を検出するタンパク質プローブ(検査試薬)として利用することも期待できる。
【0004】
近年様々な生物種において標的遺伝子を欠損(ノックアウト)又は改変させる技術として、人工のDNA切断酵素を利用した“ゲノム編集”が注目されている。遺伝子ノックアウトとは、標的とする染色体上の遺伝子に挿入や欠失を加えることにより遺伝子の機能を破壊することをいい、マウスでは、ES細胞を用いて相同組換えによる遺伝子破壊を行い、この細胞を含んだキメラ胚からノックアウトマウスが作製されている。
【0005】
人工のDNA切断酵素としては、例えば、非特許文献1に記載の人工酵素ジンクフィンガーヌクレアーゼ(ZFN)が挙げられ、これは、3あるいは4塩基のDNAを特異的に認識して結合するジンクフィンガーを3個から6個連結させてなる3または4塩基配列単位で塩基配列を認識する部分に、細菌のDNA切断酵素(FokI)の切断ドメインを1つ連結させたキメラタンパク質である。なお、ジンク(亜鉛)フィンガーとは、DNAに結合するタンパク質ドメインであって、亜鉛イオンと結合することで構造が安定化するものである。多くの転写調節因子がこのドメインを持ち、特異的なDNA配列に結合して遺伝子の発現調節を行っている。
【0006】
ジンクフィンガーヌクレアーゼ (ZFN)を図1に模式的に示す。ZFNは、DNAに結合するジンク(Zn)フィンガーを3個から6個と制限酵素FokIのDNA切断ドメインを融合させた酵素であり、標的である近接するDNA配列に結合し、二量体を形成して2本鎖DNAを切断する。図1に示すように、3個のジンクフィンガーをもつ2つのZFNを用いることによって、理論上約700億塩基に一カ所の切断を誘導することができる。
【0007】
このように、2つのZFNが近接する標的配列に結合するとDNA切断ドメインが2量体となり2本鎖DNAを切断する。切断されたDNAは、相同組換えあるいは非相同末端連結により修復されるが、この時に目的の遺伝子を改変することが可能となる。標的配列の選択が可能であることから次世代のノックアウト技術として注目され、ショウジョウバエ、ゼブラフィッシュ、マウスなどの動物やシロイヌナズナなどの植物、ES細胞、iPS細胞などの哺乳類培養細胞において成功例が報告されている(非特許文献1)。
【0008】
なお、相同組換え修復(HR)および非相同末端連結修復(NHEJ)は、細胞内で起きる2本鎖DNA切断を修復する機構である。相同組換え修復は、相同染色体を利用した方法で正確にもとの染色体へ修復するが、非相同末端連結修復では、修復時に欠失や挿入が起こり遺伝子機能の欠損が起こる(図3)。
【0009】
しかしながら、このZFNを用いる方法は、ZFNが特定企業の受託合成によって作製され、作製に費用がかかることなどから(1セット約300万円)、広く利用されるに至っていない。また、別のグループ(Zinc fingerコンソーシアム)は、標的の3塩基配列に対応したジンクフィンガーの組合せによって人工酵素を作製しているが(Modular assembly)、この方法には機能的ZFNの選別効率の問題があると示唆されている。
【0010】
さらにn個のジンクフィンガーからなるジンクフィンガードメインは、(GNN)nという配列を認識する傾向があるため、標的遺伝子配列の自由度が小さいという問題がある。
【0011】
一方、最近、1塩基ごとに認識することのできるモジュール部分の組合せ配列からなるタンパク質TALEに、FokIを結合させたもの(TALEN)が開発され、ZFNに代わる人工酵素として注目されている(非特許文献2)。
【0012】
TALENを図2に模式的に示す。TALENとは、植物病原細菌Xanthomonasが持つ転写因子のDNA結合ドメインと制限酵素FokIのDNA切断ドメインを融合させた酵素であり、近接するDNA配列に結合し、二量体を形成して2本鎖DNAを切断する。34アミノ酸からなるモジュールの繰り返し構造によって標的DNAへの結合を選ぶことができる。
【0013】
植物に感染する細菌から発見されたTALEのDNA結合ドメインは、34アミノ酸で1つの塩基を認識することから、TALEのDNA結合リピートにDNA切断酵素の切断ドメインを1つ連結させたキメラタンパク質TALENは、ZFNと同様に標的遺伝子への変異導入が可能であることが示されている。また、TALENはZFNと比較して標的遺伝子(塩基配列)の自由度が大幅に増大している。
【0014】
しかしながら、TALEの完全な立体構造が明らかにされていないため、TALENのDNAの切断部位を固定することが現状ではできていない。そのため、TALENはZFNと比較して、切断箇所が不正確で一定しておらず、類似の配列を切断する可能性があるという問題があり、正確に、標的塩基配列箇所を、FokIにより切断することができないという問題があった。
【先行技術文献】
【非特許文献】
【0015】
【非特許文献1】Urnov, F.D. et al., Genome editing with engineered zinc finger nucleases. Nature Review Genetics. 11(9): 636-646 (2010)
【非特許文献2】Miller, J.C. et al., A TALE nuclease architecture for efficient genome editing. Nature Biotechnology, 29(2): 143-148 (2011)
【発明の概要】
【発明が解決しようとする課題】
【0016】
このように、ジンクフィンガーは、(GNN)nを認識する傾向があるため、すべての標的遺伝子にZFNを設計することが困難であった。また、ZFNは作製方法が煩雑で作製方法技術習得に多大な労力と経費が必要とされ、広く使われるに至っていない。一方、TALENは標的配列を任意で作製することが可能であることから、ZFNに代わる強力な人工酵素と期待されているが、TALEのN末端とC末端のサイズや構造がDNA結合特異性に大きく関わり、この部分のサイズの設定や構造の安定化が実用化の鍵と考えられている。
【0017】
上記問題に鑑み、どのような塩基配列でも自由に標的遺伝子とすることでき、かつ正確な結合特異性を有する人工DNA結合ドメインが求められていた。さらに、どのような塩基配列でも自由に標的遺伝子とすることでき、かつ正確に標的塩基配列の箇所を切断できる人工DNA切断酵素が望まれている。さらに、本発明は、どのような塩基配列でも自由に標的とすることができる、DNA結合タンパク質、それを含む標的配列特異的転写活性化因子、標的配列特異的DNA認識試薬を提供することを目的とする。
【課題を解決するための手段】
【0018】
本発明者らはこのたび、1つのジンクフィンガーに植物病原細菌Xanthomonas由来のTranscription activator-like effector(TALE)を連結させた新しいタイプのDNA結合ドメインを作製した。さらにこの新規DNA結合ドメインに制限酵素FokIのヌクレアーゼドメインを融合したTALE Zinc-finger Fusion Nuclease(TZFN)を開発し、高効率での遺伝子破壊法を確立するに至った。
【0019】
本発明により、ジンクフィンガードメインのN末端側に、適切な空間を空けてTALEの標的認識ドメインを融合させて得られた新たなDNA結合タンパク質は、標的とするDNA配列中の任意の塩基配列を認識し、その認識部分に結合することができることが見いだされた。また、本発明のDNA結合タンパク質を、DNA切断酵素のヌクレアーゼドメインに融合させることにより得られる本発明のDNA切断酵素は、任意の塩基配列を標的配列とすることが可能であることが見いだされた。
【0020】
具体的には、本発明者らは、1つのジンクフィガードメインのN末端側に様々な長さのスペースを介してTALEのDNA結合ドメインを融合させ、かつ、当該ジンクフィンガードメインのC末端側にDNA切断酵素FokIのヌクレアーゼドメインを融合させて得られる各種のタンパク質を構築し、それらの標的配列切断活性を測定した。それにより、本発明者らは、TALEのDNA結合ドメインとジンクフィンガードメインの間のスペースが、7または8bpの標的配列の長さに相当する場合に、効率よく標的DNA配列を認識し、結合することを見いだした。
【0021】
即ち、本発明は以下を提供する。
(A):標的配列を特異的に認識して結合するDNA結合タンパク質であって、N末端から順番に以下のドメインを含んでなるDNA結合タンパク質、ここで、標的配列は二本鎖DNAであり、その塩基配列が5’末端側から順に、以下のドメイン(2−1)および(2−2)によって認識されるn+1塩基対からなるTALE認識配列を含み、かつ、該TALE認識配列から7または8塩基対のスペースを空けて、以下のドメイン(4)によって認識される3塩基対からなるジンクフィンガー認識配列を含むものである:
(1)250〜312アミノ酸長であるドメイン;
(2−1)アミノ酸配列:LTPDQVVAIASXGGKQALETVQRLLPVLCQDHG(配列番号2)からなる1塩基認識繰り返しドメインをn個タンデムに含んでなるTALEの標的配列認識ドメイン、または、配列番号2で示されるアミノ酸配列のX以外の位置において1または数個のアミノ酸の欠失、置換および/または付加を含むアミノ酸配列を有し、かつ、前記DNA結合タンパク質全体としての標的配列特異的DNA結合活性を破壊しないTALEの変異型標的配列認識ドメイン、
配列番号2のアミノ酸配列において、
が、NIの場合、その1塩基認識繰り返しドメインは塩基Aを認識し、
が、HDの場合、その1塩基認識繰り返しドメインは塩基Cを認識し、
が、NNまたはNKの場合、その1塩基認識繰り返しドメインは塩基Gを認識し、そして、
が、NGの場合、その1塩基認識繰り返しドメインは塩基Tを認識し、
nは7〜30の整数である;
(2−2)アミノ酸配列:LTPDQVVAIASXGGKQALE(配列番号3)からなる1個の1塩基認識最終繰り返しドメインからなるTALEの標的配列認識最終ドメイン、または、配列番号3で示されるアミノ酸配列のX以外の位置において1または数個のアミノ酸の欠失、置換および/または付加を含むアミノ酸配列を有し、かつ、前記DNA結合タンパク質全体としての標的配列特異的DNA結合活性を破壊しないTALEの変異型標的配列認識最終ドメイン、
配列番号3のアミノ酸配列において、
が、NIの場合、その1塩基認識繰り返しドメインは塩基Aを認識し、
が、HDの場合、その1塩基認識繰り返しドメインは塩基Cを認識し、
が、NNまたはNKの場合、その1塩基認識繰り返しドメインは塩基Gを認識し、そして、
が、NGの場合、その1塩基認識繰り返しドメインは塩基Tを認識する;
(3)7から8塩基対からなる標的配列に相当する長さを有するドメイン;および、
(4)配列番号5から20のいずれかに示されるアミノ酸配列を有する1個のジンクフィンガードメイン、または、配列番号5から20のいずれかに示されるアミノ酸配列において1または数個のアミノ酸の欠失、置換および/または付加を含むアミノ酸配列を有し、かつ、前記DNA結合タンパク質全体としての標的配列特異的DNA結合活性を破壊しない変異型ジンクフィンガードメイン、
ここで、
配列番号5からなるジンクフィンガードメインは、塩基配列GAAを認識し、
配列番号6からなるジンクフィンガードメインは、塩基配列GACを認識し、
配列番号7からなるジンクフィンガードメインは、塩基配列GAGを認識し、
配列番号8からなるジンクフィンガードメインは、塩基配列GATを認識し、
配列番号9からなるジンクフィンガードメインは、塩基配列GCAを認識し、
配列番号10からなるジンクフィンガードメインは、塩基配列GCCを認識し、
配列番号11からなるジンクフィンガードメインは、塩基配列GCGを認識し、
配列番号12からなるジンクフィンガードメインは、塩基配列GCTを認識し、
配列番号13からなるジンクフィンガードメインは、塩基配列GGAを認識し、
配列番号14からなるジンクフィンガードメインは、塩基配列GGCを認識し、
配列番号15からなるジンクフィンガードメインは、塩基配列GGGを認識し、
配列番号16からなるジンクフィンガードメインは、塩基配列GGTを認識し、
配列番号17からなるジンクフィンガードメインは、塩基配列GTAを認識し、
配列番号18からなるジンクフィンガードメインは、塩基配列GTCを認識し、
配列番号19からなるジンクフィンガードメインは、塩基配列GTGを認識し、
配列番号20からなるジンクフィンガードメインは、塩基配列GTTを認識する。
【0022】
(B):ドメイン(3)が、配列番号4で示されるアミノ酸配列を有するタンパク質TALEのC末端ドメイン、または、配列番号4で示されるアミノ酸配列において1または数個のアミノ酸の欠失、置換および/または付加を含むアミノ酸配列を有し、かつ、前記DNA結合タンパク質全体としての標的配列特異的DNA結合活性を破壊しないタンパク質TALEの変異型C末端ドメインである、(A)に記載のDNA結合タンパク質。
【0023】
(C):ドメイン(1)が、配列番号1で示されるアミノ酸配列を有するタンパク質TALEのN末端ドメイン、または、配列番号1で示されるアミノ酸配列において1または数個のアミノ酸の欠失、置換および/または付加を含むアミノ酸配列を有し、かつ、前記DNA結合タンパク質全体としての標的配列特異的DNA結合活性を破壊しないタンパク質TALEの変異型N末端ドメインである、(A)または(B)に記載のDNA結合タンパク質。
【0024】
(D):(A)〜(C)いずれかに記載のDNA結合タンパク質のC末端側にDNA切断酵素のヌクレアーゼドメインが融合してなる標的配列特異的DNA切断酵素。
【0025】
(E):DNA切断酵素のヌクレアーゼドメインが、配列番号21で示されるアミノ酸配列を有するDNA切断酵素FokIのヌクレアーゼドメインであるか、または、配列番号21で示されるアミノ酸配列において1または数個のアミノ酸の欠失、置換および/または付加を含むアミノ酸配列を有し、かつ、DNA切断酵素FokIのヌクレアーゼ活性を保持しているDNA切断酵素FokIの変異型ヌクレアーゼドメインである、(D)に記載の標的配列特異的DNA切断酵素。
【0026】
(F):(A)〜(C)いずれかに記載のDNA結合タンパク質のC末端側と(E)に記載のDNA切断酵素FokIのヌクレアーゼドメインまたはDNA切断酵素FokIの変異型ヌクレアーゼドメインの間に配列番号22で示すリンカーを含む(E)に記載の標的配列特異的DNA切断酵素。
【0027】
(G):(A)〜(C)いずれかに記載のDNA結合タンパク質のC末端側にDNA転写活性化ドメインが融合してなる標的配列特異的転写活性化因子。
【0028】
(H):DNA転写活性化ドメインが、GAL4およびVP16からなる群から選択される、(G)に記載の標的配列特異的転写活性化因子。
【0029】
(I):(A)〜(C)いずれかに記載のDNA結合タンパク質に標識タンパク質が融合してなる標的配列特異的DNA認識試薬。
【0030】
(J):標識タンパク質が、蛍光タンパク質および酵素からなる群から選択される、(I)に記載の標的配列特異的DNA認識試薬。
【0031】
(K):(A)〜(C)いずれかに記載のDNA結合タンパク質または(D)〜(F)いずれかに記載の標的配列特異的DNA切断酵素または(G)または(H)に記載の標的配列特異的転写活性化因子または(I)または(J)に記載の標的配列特異的DNA認識試薬をコードする核酸分子。
【0032】
(L):(K)に記載の核酸分子を含むベクター。
【0033】
(M):(D)〜(F)いずれかに記載の標的配列特異的DNA切断酵素を用いて標的二本鎖DNAを切断する工程、および
切断された二本鎖DNAに相同組換え修復または非相同末端連結修復を作用させる工程、
を含む、標的遺伝子を欠損又は改変させる方法。
【0034】
(N):非相同末端連結修復を作用させることにより標的遺伝子を欠失させる(M)に記載の方法。
【0035】
(O):(M)または(N)に記載の方法により標的遺伝子を欠損又は改変させて得られた遺伝子欠損または改変生物あるいは細胞。
【0036】
(P):ノックアウト生物または細胞である(O)に記載の生物あるいは細胞。
【0037】
(Q):マウス、ラット、ゼブラフィッシュ生物または哺乳類培養細胞である(O)または(P)に記載の生物あるいは細胞。
【発明の効果】
【0038】
本発明のDNA結合タンパク質は、あらゆる所望の標的DNA配列を認識し、結合することができる。また、本発明のDNA結合タンパク質をDNA切断酵素のヌクレアーゼドメインに融合させることにより得られる本発明のDNA切断酵素は、あらゆる所望の標的DNA配列を認識し、結合し、正確な部位でDNAを切断することができる。
【0039】
特に、本発明のDNA結合タンパク質をDNA切断酵素のヌクレアーゼドメインと融合させて得られる本発明のDNA切断酵素を用いることにより、ほとんどすべての遺伝子を標的遺伝子として切断することが可能になる。これにより、本発明のDNA切断酵素を用いて、目的とする遺伝子がノックアウトされた、ノックアウト生物又は改変生物を得ることができる。
【0040】
また、本発明のDNA切断酵素は、既存のZFNと比較して簡便かつ安価に設計することができる。また、本発明のDNA切断酵素は、ZFNに固有の配列における制限がないため、ZFNの低い標的遺伝子配列の自由度という問題を解決することができる。さらに、本発明のDNA切断酵素は、既存のTALENと比較して正確な位置で標的DNAを切断することができる。
【0041】
具体的には、本発明のDNA切断酵素は、図8に示すように、本発明の2つのDNA結合切断酵素中のジンクフィンガー認識標的配列の間の6bpの配列部位でDNAを切断し、その結果、4bpの突出末端を有するDNA切断箇所が生じる。
【0042】
このように、本発明のDNA切断酵素は、TALENのもつ標的配列の自由性とZFNのもつ切断部位の特異性の両方を併せ持つものである。また、本発明のDNA結合タンパク質は、DNA転写活性化ドメインや標識タンパク質と融合させることにより、あらゆる所望の標的DNA配列を認識する標的配列特異的転写活性化因子や標的配列特異的DNA認識試薬として利用することができる。
【図面の簡単な説明】
【0043】
【図1】ジンクフィンガーヌクレアーゼ (ZFN)の模式図。
【図2】TALENの模式図。
【図3】相同組換え修復(HR)および非相同末端連結修復(NHEJ)の模式図。
【図4】実施例で作製したTZFNの模式図。
【図5】実施例の概要。
【図6】SSAアッセイの概要。
【図7】TZFNの活性測定の結果を示すグラフ。
【図8】TZFNの設計を示す模式図。
【図9】TZFNの構造の概要。
【発明を実施するための形態】
【0044】
以下、本発明を詳細に説明する。
【0045】
本発明のDNA結合タンパク質(A)〜(C)について
本発明は、態様(A)において、以下を提供する:
(A):標的配列を特異的に認識して結合するDNA結合タンパク質であって、N末端から順番に以下のドメインを含んでなるDNA結合タンパク質、ここで、標的配列は二本鎖DNAであり、その塩基配列が5’末端側から順に、以下のドメイン(2−1)および(2−2)によって認識されるn+1塩基対からなるTALE認識配列を含み、かつ、該TALE認識配列から7または8塩基対のスペースを空けて、以下のドメイン(4)によって認識される3塩基対からなるジンクフィンガー認識配列を含むものである:
(1)250〜312アミノ酸長であるドメイン;
(2−1)アミノ酸配列:LTPDQVVAIASXGGKQALETVQRLLPVLCQDHG(配列番号2)からなる1塩基認識繰り返しドメインをn個タンデムに含んでなるTALEの標的配列認識ドメイン、または、配列番号2で示されるアミノ酸配列のX以外の位置において1または数個のアミノ酸の欠失、置換および/または付加を含むアミノ酸配列を有し、かつ、前記DNA結合タンパク質全体としての標的配列特異的DNA結合活性を破壊しないTALEの変異型標的配列認識ドメイン、
配列番号2のアミノ酸配列において、
が、NIの場合、その1塩基認識繰り返しドメインは塩基Aを認識し、
が、HDの場合、その1塩基認識繰り返しドメインは塩基Cを認識し、
が、NNまたはNKの場合、その1塩基認識繰り返しドメインは塩基Gを認識し、そして、
が、NGの場合、その1塩基認識繰り返しドメインは塩基Tを認識し、
nは7〜30の整数である;
(2−2)アミノ酸配列:LTPDQVVAIASXGGKQALE(配列番号3)からなる1個の1塩基認識最終繰り返しドメインからなるTALEの標的配列認識最終ドメイン、または、配列番号3で示されるアミノ酸配列のX以外の位置において1または数個のアミノ酸の欠失、置換および/または付加を含むアミノ酸配列を有し、かつ、前記DNA結合タンパク質全体としての標的配列特異的DNA結合活性を破壊しないTALEの変異型標的配列認識最終ドメイン、
配列番号3のアミノ酸配列において、
が、NIの場合、その1塩基認識繰り返しドメインは塩基Aを認識し、
が、HDの場合、その1塩基認識繰り返しドメインは塩基Cを認識し、
が、NNまたはNKの場合、その1塩基認識繰り返しドメインは塩基Gを認識し、そして、
が、NGの場合、その1塩基認識繰り返しドメインは塩基Tを認識する;
(3)7から8塩基対からなる標的配列に相当する長さを有するドメイン;および、
(4)配列番号5から20のいずれかに示されるアミノ酸配列を有する1個のジンクフィンガードメイン、または、配列番号5から20のいずれかに示されるアミノ酸配列において1または数個のアミノ酸の欠失、置換および/または付加を含むアミノ酸配列を有し、かつ、前記DNA結合タンパク質全体としての標的配列特異的DNA結合活性を破壊しない変異型ジンクフィンガードメイン、
ここで、
配列番号5からなるジンクフィンガードメインは、塩基配列GAAを認識し、
配列番号6からなるジンクフィンガードメインは、塩基配列GACを認識し、
配列番号7からなるジンクフィンガードメインは、塩基配列GAGを認識し、
配列番号8からなるジンクフィンガードメインは、塩基配列GATを認識し、
配列番号9からなるジンクフィンガードメインは、塩基配列GCAを認識し、
配列番号10からなるジンクフィンガードメインは、塩基配列GCCを認識し、
配列番号11からなるジンクフィンガードメインは、塩基配列GCGを認識し、
配列番号12からなるジンクフィンガードメインは、塩基配列GCTを認識し、
配列番号13からなるジンクフィンガードメインは、塩基配列GGAを認識し、
配列番号14からなるジンクフィンガードメインは、塩基配列GGCを認識し、
配列番号15からなるジンクフィンガードメインは、塩基配列GGGを認識し、
配列番号16からなるジンクフィンガードメインは、塩基配列GGTを認識し、
配列番号17からなるジンクフィンガードメインは、塩基配列GTAを認識し、
配列番号18からなるジンクフィンガードメインは、塩基配列GTCを認識し、
配列番号19からなるジンクフィンガードメインは、塩基配列GTGを認識し、
配列番号20からなるジンクフィンガードメインは、塩基配列GTTを認識する。
【0046】
好ましくは、態様(A)のDNA結合タンパク質において、ドメイン(3)は、配列番号4で示されるアミノ酸配列を有するタンパク質TALEのC末端ドメイン、または、配列番号4で示されるアミノ酸配列において1または数個のアミノ酸の欠失、置換および/または付加を含むアミノ酸配列を有し、かつ、前記DNA結合タンパク質全体としての標的配列特異的DNA結合活性を破壊しないタンパク質TALEの変異型C末端ドメインである(態様(B))。
【0047】
さらに好ましくは、態様(A)または(B)のDNA結合タンパク質において、ドメイン(1)は、配列番号1で示されるアミノ酸配列を有するタンパク質TALEのN末端ドメイン、または、配列番号1で示されるアミノ酸配列において1または数個のアミノ酸の欠失、置換および/または付加を含むアミノ酸配列を有し、かつ、前記DNA結合タンパク質全体としての標的配列特異的DNA結合活性を破壊しないタンパク質TALEの変異型N末端ドメインである(態様(C))。
【0048】
本発明において「変異型」のドメインとは、実施例に記載の各配列から構成されるDNA結合タンパク質の各ドメインと比較して、「DNA結合タンパク質全体としての標的配列特異的DNA結合活性を破壊しない」ように、即ち、本発明のDNA結合タンパク質の機能が失われない程度にアミノ酸変異(欠失、置換、付加)が起こっているタンパク質である。このような変異には、自然界において生じる変異の他に、人為的な変異も含まれる。人為的な変異を生じさせる手段としては、部位特異的突然変異誘発法(Nucleic Acids Res. 10, 6487-6500, 1982)が挙げられるがこれに限定されるわけではない。変異(欠失、置換、付加)したアミノ酸の数は、上記のDNA結合タンパク質の機能が失われない限りその個数は制限されないが、好ましくは10アミノ酸以内であり、さらに好ましくは5アミノ酸以内、特に好ましくは、4、3、2または1アミノ酸である。
【0049】
「変異型」のドメインは、「DNA結合タンパク質全体としての標的配列特異的DNA結合活性を破壊しない」ように、即ち、本発明のDNA結合タンパク質の機能が失われない程度に、実施例に記載の各配列から構成されるDNA結合タンパク質の各ドメインに対する配列同一性を有するドメインである。配列同一性は、80%以上が好ましく、85%以上がさらに好ましく、90%以上がより好ましく、特に好ましくは、95、96、97、98または99%以上である。
【0050】
本発明において、アミノ酸配列の「配列同一性」とは、2つのポリペプチド間の配列の類似の程度を意味し、比較対象のアミノ酸配列の領域にわたって最適な状態(配列の一致が最大となる状態)にアラインメントされた2つの配列を比較することにより決定される。配列同一性の数値(%)は両方の(アミノ酸)配列に存在する同一のアミノ酸を決定して、適合部位の数を決定し、次いでこの適合部位の数を比較対象の配列領域内のアミノ酸の総数で割り、得られた数値に100をかけることにより算出される。最適なアラインメントおよび配列同一性を得るためのアルゴリズムとしては当業者が通常利用可能な種々のアルゴリズム(例えば、BLASTアルゴリズム、FASTAアルゴリズムなど)が挙げられる。アミノ酸配列の配列同一性は、例えばBLASTP、FASTAなどの配列解析ソフトウェアを用いて決定される。
【0051】
本発明のタンパク質の機能を有すること、即ち、「DNA結合タンパク質全体としての標的配列特異的DNA結合活性を破壊しない」ことは、例えば、実施例に記載のように、機能を確認すべきDNA結合タンパク質のC末端にFokIのヌクレアーゼドメインを付加すること等により、C末端に切断酵素を融合したタンパク質を発現するコンストラクトを構築し、該コンストラクトから目的の融合酵素を発現させ、実施例に記載のSSAアッセイを用いて、標的部位においてDNAの切断が起こったか否かを検出することによって確認できる。
【0052】
以下、本発明のDNA結合タンパク質を構成するドメイン(1)、(2−1)、(2−2)、(3)および(4)について詳細に説明する。
【0053】
本発明のDNA結合タンパク質は、N末端から順に以下のドメイン(1)、(2−1)、(2−2)、(3)および(4)から構成される。
【0054】
ドメイン(1)
ドメイン(1)の大きさは、250〜312アミノ酸長からなるドメインであり、好ましくは、280〜312アミノ酸長、より好ましくは、290〜312アミノ酸長、さらに好ましくは、300〜312アミノ酸長、特に好ましくは、312アミノ酸長である。
【0055】
ドメイン(1)のアミノ酸配列は特に限定されないが、DNA結合タンパク質全体としての標的配列特異的DNA結合活性を破壊しない配列である。例えば、ドメイン(1)のアミノ酸配列は、限定されないが、配列番号1で示されるアミノ酸配列を有するタンパク質TALEのN末端ドメイン、または、配列番号1で示されるアミノ酸配列において1または数個のアミノ酸の欠失、置換および/または付加を含むアミノ酸配列を有し、かつ、前記DNA結合タンパク質全体としての標的配列特異的DNA結合活性を破壊しないタンパク質TALEの変異型N末端ドメインである。変異型N末端ドメインの配列番号1に対する配列同一性は、80%以上が好ましく、85%以上がさらに好ましく、90%以上がより好ましく、特に好ましくは、95、96、97、98または99%以上である。
【0056】
例えば、配列番号1のアミノ酸配列をコードする核酸は、実施例に記載のように、プラスミド、pTAL3あるいはpTAL4、から得られる。また、市販のキット、Golden Gate TALEN and TAL Effector Kit、から得ることもできる。あるいは、DNA合成機などを用いて人工的に合成して得ることができる。
【0057】
ドメイン(2−1)および(2−2)
ドメイン(1)のC末端側に存在する、ドメイン(2−1)および(2−2)は、TALEの標的配列認識ドメインまたはその変異型ドメインである。この部分を所望の標的配列となるように設計することによって、所望の配列を認識する本発明のタンパク質が得られる。
【0058】
具体的には、ドメイン(2−1)は、アミノ酸配列:LTPDQVVAIASXGGKQALETVQRLLPVLCQDHG(配列番号2)からなる1塩基認識繰り返しドメインをn個タンデムに含んでなるTALEの標的配列認識ドメイン、または、配列番号2で示されるアミノ酸配列のX以外の位置において1または数個のアミノ酸の欠失、置換および/または付加を含むアミノ酸配列を有し、かつ、前記DNA結合タンパク質全体としての標的配列特異的DNA結合活性を破壊しないTALEの変異型標的配列認識ドメインであり、ここで、
配列番号2のアミノ酸配列において、
が、NIの場合、その1塩基認識繰り返しドメインは塩基Aを認識し、
が、HDの場合、その1塩基認識繰り返しドメインは塩基Cを認識し、
が、NNまたはNKの場合、その1塩基認識繰り返しドメインは塩基Gを認識し、そして、
が、NGの場合、その1塩基認識繰り返しドメインは塩基Tを認識し、
nは7〜30の整数である。
【0059】
上記のドメイン(2−1)におけるnは、7〜30の整数であるが、好ましくは、nは10〜30の整数であり、さらに好ましくは15〜30の整数である。
【0060】
ドメイン(2−2)は、具体的には、アミノ酸配列:LTPDQVVAIASXGGKQALE(配列番号3)からなる1個の1塩基認識最終繰り返しドメインからなるTALEの標的配列認識最終ドメイン、または、配列番号3で示されるアミノ酸配列のX以外の位置において1または数個のアミノ酸の欠失、置換および/または付加を含むアミノ酸配列を有し、かつ、前記DNA結合タンパク質全体としての標的配列特異的DNA結合活性を破壊しないTALEの変異型標的配列認識最終ドメインであり、ここで、
配列番号3のアミノ酸配列において、
が、NIの場合、その1塩基認識繰り返しドメインは塩基Aを認識し、
が、HDの場合、その1塩基認識繰り返しドメインは塩基Cを認識し、
が、NNまたはNKの場合、その1塩基認識繰り返しドメインは塩基Gを認識し、そして、
が、NGの場合、その1塩基認識繰り返しドメインは塩基Tを認識する。
【0061】
例えば、配列番号2および3のアミノ酸配列をコードする核酸は、実施例に記載のように、市販のキット、Golden Gate TALEN and TAL Effector Kit、から得ることができる。あるいは、DNA合成機などを用いて人工的に合成して得ることができる。
【0062】
ドメイン(3)
ドメイン(2−1)および(2−2)のC末端側に存在する、ドメイン(3)は、7から8塩基対からなる標的配列に相当する長さを有するドメインである。ドメイン(3)の大きさは、好ましくは、150〜235アミノ酸長、より好ましくは、170〜235アミノ酸長、さらに好ましくは、190〜235アミノ酸長、特に好ましくは、200〜235アミノ酸長である。このドメインの大きさは、標的配列への正確な結合に重要である。
【0063】
ドメイン(3)のアミノ酸配列は特に限定されないが、DNA結合タンパク質全体としての標的配列特異的DNA結合活性を破壊しない配列である。例えば、ドメイン(3)のアミノ酸配列は、限定されないが、配列番号4で示されるアミノ酸配列を有するタンパク質TALEのC末端ドメイン、または、配列番号4で示されるアミノ酸配列において1または数個のアミノ酸の欠失、置換および/または付加を含むアミノ酸配列を有し、かつ、前記DNA結合タンパク質全体としての標的配列特異的DNA結合活性を破壊しないタンパク質TALEの変異型C末端ドメインである。変異型C末端ドメインの配列番号4に対する配列同一性は、80%以上が好ましく、85%以上がさらに好ましく、90%以上がより好ましく、特に好ましくは、95、96、97、98または99%以上である。
【0064】
例えば、配列番号4のアミノ酸配列をコードする核酸は、実施例に記載のように、プラスミド、pTAL3あるいpTAL4、から得られる。また、市販のキット、Golden Gate TALEN and TAL Effector Kit、から得ることもできる。あるいは、DNA合成機などを用いて人工的に合成して得ることができる。
【0065】
ドメイン(4)
ドメイン(3)のC末端側に存在する、ドメイン(4)は、ジンクフィンガードメインまたはその変異型ドメインである。ドメイン(2−1)および(2−2)に加えてこの部分を所望の標的配列となるように設計することによって、所望の配列を認識する本発明のタンパク質が得られる。なお、ドメイン(2−1)および(2−2)、即ち、TALEの認識ドメインが認識するDNA配列と、ジンクフィンガードメインが認識するDNA配列との間には、7または8塩基対の任意のDNA配列が含まれる(図8参照)。
【0066】
ドメイン(4)は、具体的には、配列番号5から20のいずれかに示されるアミノ酸配列を有する1個のジンクフィンガードメイン、または、配列番号5から20のいずれかに示されるアミノ酸配列において1または数個のアミノ酸の欠失、置換および/または付加を含むアミノ酸配列を有し、かつ、前記DNA結合タンパク質全体としての標的配列特異的DNA結合活性を破壊しない変異型ジンクフィンガードメインであり、ここで、
配列番号5からなるジンクフィンガードメインは、塩基配列GAAを認識し、
配列番号6からなるジンクフィンガードメインは、塩基配列GACを認識し、
配列番号7からなるジンクフィンガードメインは、塩基配列GAGを認識し、
配列番号8からなるジンクフィンガードメインは、塩基配列GATを認識し、
配列番号9からなるジンクフィンガードメインは、塩基配列GCAを認識し、
配列番号10からなるジンクフィンガードメインは、塩基配列GCCを認識し、
配列番号11からなるジンクフィンガードメインは、塩基配列GCGを認識し、
配列番号12からなるジンクフィンガードメインは、塩基配列GCTを認識し、
配列番号13からなるジンクフィンガードメインは、塩基配列GGAを認識し、
配列番号14からなるジンクフィンガードメインは、塩基配列GGCを認識し、
配列番号15からなるジンクフィンガードメインは、塩基配列GGGを認識し、
配列番号16からなるジンクフィンガードメインは、塩基配列GGTを認識し、
配列番号17からなるジンクフィンガードメインは、塩基配列GTAを認識し、
配列番号18からなるジンクフィンガードメインは、塩基配列GTCを認識し、
配列番号19からなるジンクフィンガードメインは、塩基配列GTGを認識し、
配列番号20からなるジンクフィンガードメインは、塩基配列GTTを認識する。
【0067】
例えば、配列番号5〜20のアミノ酸配列をコードする核酸は、実施例に記載のように、プラスミド、pC3XB、から得ることができる。また、市販のキット、Zinc Finger Corsortium Vector Kit、から得ることもできる。あるいは、DNA合成機などを用いて人工的に合成して得ることができる。
【0068】
本発明のDNA切断酵素(D)〜(F)について
本発明は、態様(D)において、以下を提供する:
態様(A)〜(C)のいずれかに記載のDNA結合タンパク質のC末端側にDNA切断酵素のヌクレアーゼドメインが融合してなる標的配列特異的DNA切断酵素。
【0069】
ヌクレアーゼドメインは、DNA切断活性を有する限り、特に限定されないが、好ましくは、態様(D)の標的配列特異的DNA切断酵素において、DNA切断酵素のヌクレアーゼドメインは、配列番号21で示されるアミノ酸配列を有するDNA切断酵素FokIのヌクレアーゼドメインであるか、または、配列番号21で示されるアミノ酸配列において1または数個のアミノ酸の欠失、置換および/または付加を含むアミノ酸配列を有し、かつ、DNA切断酵素FokIのヌクレアーゼ活性を保持しているDNA切断酵素FokIの変異型ヌクレアーゼドメインである(態様(E))。
【0070】
DNA切断酵素FokIの変異型ヌクレアーゼドメインのアミノ酸配列の配列番号21に対する配列同一性は、80%以上が好ましく、85%以上がさらに好ましく、90%以上がより好ましく、特に好ましくは、95、96、97、98または99%以上である。
【0071】
変異型ヌクレアーゼドメインが、DNA切断酵素FokIのヌクレアーゼ活性を保持しているかどうかは、標的配列DNAの試験管内での切断活性を測定することにより確認することができる。
【0072】
また好ましくは、態様(A)〜(C)いずれかに記載のDNA結合タンパク質のC末端側と(E)に記載のDNA切断酵素FokIのヌクレアーゼドメインまたはDNA切断酵素FokIの変異型ヌクレアーゼドメインの間には、3〜6アミノ酸長、好ましくは4〜6アミノ酸長、より好ましくは5〜6アミノ酸長のリンカーを配置するとよい。
【0073】
特に好ましくは、態様(E)の標的配列特異的DNA切断酵素において、態様(A)〜(C)いずれかに記載のDNA結合タンパク質のC末端側と(E)に記載のDNA切断酵素FokIのヌクレアーゼドメインまたはDNA切断酵素FokIの変異型ヌクレアーゼドメインの間に配列番号22で示すリンカーを含む(態様(F))。
【0074】
配列番号21で示されるアミノ酸配列を有するDNA切断酵素FokIのヌクレアーゼドメインは、例えば、プラスミド、pTAL3あるいはpTAL4、から得ることができる。また、配列番号22で示されるリンカーは、DNA合成機などを用いて人工的に合成することができる。あるいは、FokIのヌクレアーゼドメインは、DNA合成機などを用いて人工的に合成して得ることもできる。
【0075】
態様(A)〜(C)に記載のDNA結合タンパク質のC末端側にDNA切断酵素のヌクレアーゼドメインを融合させる方法は、当業者に周知である。例えば、In-Fusion反応(Clontech)での連結により融合させることができる。
【0076】
本発明の態様(D)〜(F)のDNA切断酵素が所望の活性を有するか否かは、例えば、実施例に記載のSSAアッセイによって確認することができる。
【0077】
本発明の態様(D)〜(F)のDNA切断酵素は、所望の標的配列を適切な位置にて正確に切断することができる。当業者に知られているように、また、図3に例示するように、切断された二本鎖DNAは、相同組換えあるいは非相同末端連結により修復を受け、この際に、目的の遺伝子を改変あるいはノックアウトすることができる。目的の遺伝子が改変あるいはノックアウトされたかどうかは、例えば、標的配列の塩基配列の配列決定により確認することができる。
【0078】
また、本発明の(E)または(F)の態様において、ヌクレアーゼドメインとしてFokIヌクレアーゼドメインを用いる場合、図1や図8に記載のように、このドメインは標的DNA配列への結合を介して二量体を形成することにより、二本鎖DNAを切断する。本発明において、FokIを含むDNA切断酵素は、ホモダイマーとして用いてもよいし、ヘテロダイマーとして用いてもよい。
【0079】
FokIヌクレアーゼドメインをホモダイマーとする場合は、(A)〜(C)の態様に記載のDNA結合タンパク質を1種類用意すればよい。一方、FokIヌクレアーゼドメインをヘテロダイマーとする場合、(A)〜(C)の態様に記載のDNA結合タンパク質を2種類用意する。2種のDNA結合タンパク質において、認識配列(即ち、ドメイン(2−1)、(2−2)および(4)の設計)を互いに異なるものとすることにより、回文配列以外の所望の配列を認識し、切断することが可能となる。
【0080】
また、ヌクレアーゼドメインとしてFokIヌクレアーゼドメインを用いる場合、図8に記載するように、標的配列の構造は、TALE結合配列→7あるいは8bpの任意の配列→ジンクフィンガー結合配列→6bpの切断部位→ジンクフィンガー結合配列→7あるいは8bpの任意の配列→TALE結合配列となる。またこの場合、切断部位では、4塩基突出末端が生じる。
【0081】
本発明の標的配列特異的転写活性化因子(G)および(H)について
本発明は、態様(G)において、以下を提供する:
態様(A)〜(C)のいずれかに記載のDNA結合タンパク質のC末端側にDNA転写活性化ドメインが融合してなる標的配列特異的転写活性化因子。
【0082】
好ましくは、態様(G)の標的配列特異的転写活性化因子において、DNA転写活性化ドメインは、GAL4およびVP16からなる群から選択される(態様(H))。GAL4およびVP16をコードする核酸分子は、例えば、pActPL-Gal4ADおよびpActPL-VP16ADから入手することができる。
【0083】
また、本発明の態様(G)および(H)において、態様(A)〜(C)のいずれかに記載のDNA結合タンパク質とDNA転写活性化ドメインとの融合方法は、当業者に周知の方法を用いて行うことができる。
【0084】
本発明の態様(G)および(H)による標的配列特異的転写活性化因子が所望の活性を有するか否かは、例えば、標的配列の下流にレポーター遺伝子を連結し、レポーター遺伝子の発現を検出することによって確認することができる。
【0085】
本発明の標的配列特異的DNA認識試薬(I)および(J)について
本発明は、態様(I)において、以下を提供する:
態様(A)〜(C)のいずれかに記載のDNA結合タンパク質に標識タンパク質が融合してなる標的配列特異的DNA認識試薬。
【0086】
好ましくは、態様(I)の標的配列特異的DNA認識試薬において、標識タンパク質は、蛍光タンパク質および酵素からなる群から選択される(態様(J))。
【0087】
蛍光タンパク質としては、特に限定されないが、緑色蛍光タンパク質(GFP)
等が挙げられ、酵素としては特に限定されないが、βラクタマーゼ等が挙げられる。これらは、当業者に周知の入手方法によって得ることができる。
【0088】
また、本発明の態様(I)および(J)において、態様(A)〜(C)のいずれかに記載のDNA結合タンパク質と標識タンパク質との融合方法は、当業者に周知の方法を用いて行うことができる。
【0089】
本発明の核酸分子(K)について
本発明は、態様(K)において、以下を提供する:
態様(A)〜(C)のいずれかに記載のDNA結合タンパク質または態様(D)〜(F)のいずれかに記載の標的配列特異的DNA切断酵素または態様(G)または(H)に記載の標的配列特異的転写活性化因子または態様(I)または(J)に記載の標的配列特異的DNA認識試薬をコードする核酸分子。
【0090】
また、本発明の核酸分子は、態様(A)〜(C)のいずれかに記載のDNA結合タンパク質または態様(D)〜(F)のいずれかに記載の標的配列特異的DNA切断酵素または態様(G)または(H)に記載の標的配列特異的転写活性化因子または態様(I)または(J)に記載の標的配列特異的DNA認識試薬をコードする核酸分子に加えて、これら核酸分子の塩基配列からなるDNAと相補的な塩基配列からなるDNAとストリンジェントな条件下でハイブリダイズし、かつ、それぞれ、DNA結合タンパク質、標的配列特異的DNA切断酵素、標的配列特異的転写活性化因子または標的配列特異的DNA認識試薬の機能を保持するタンパク質をコードする核酸分子も含む。
【0091】
ここで、ストリンジェントな条件とは、特異的なハイブリダイゼーションのみが起こり、非特異的なハイブリダイゼーションが起きないような条件をいう。このような条件は、通常、0.2xSSC、0.1%SDS、65℃程度である。ハイブリダイゼーションにより得られるDNAは元の塩基配列からなるDNAと80%以上の高い配列同一性を有することが望ましく、より好ましくは85%以上、さらに好ましくは90%以上、特に好ましくは、95、96、97、98または99%以上の配列同一性を有する。ここでいう「配列同一性」については本発明のタンパク質の項に記載したものにおいて、「アミノ酸配列」を「塩基配列」に置き換えたものをいう。
【0092】
本発明の核酸分子によってコードされるタンパク質の、DNA結合タンパク質、標的配列特異的DNA切断酵素、標的配列特異的転写活性化因子または標的配列特異的DNA認識試薬としての機能の確認方法は、本発明のタンパク質の項に記載したとおりである。
【0093】
本発明の核酸分子は、例えば、実施例に記載のように、プラスミド、pcDNA3.1、Ptal、pc3XB、および市販のキット、Golden Gate TALEN and TAL Effector Kit、を組み合わせることによって得ることができる。あるいはDNA合成機などを用いて人工的に合成してもよい。配列の決定は常套方法により配列決定機を用いて行うことが出来る。
【0094】
本発明のベクター(L)について
本発明は、態様(L)において、以下を提供する:
態様(K)に記載の核酸分子を含むベクター。
【0095】
本発明のベクターは、態様(K)の核酸分子を含む組換えベクターであり、ここで態様(K)の核酸分子がコードするタンパク質については上記した通りである。
【0096】
態様(K)の核酸分子が組み込まれるベクターとしては、特に限定されないが、例えば、発現ベクターが挙げられる。好ましくは、ベクターは発現ベクターであり、導入される宿主に適合した複製開始起点、選択可能なマーカー、プロモーター等の発現制御配列、ターミネーターを含むのが好ましい。プラスミドベクターとしては、例えば大腸菌で発現させる場合は、pETが挙げられ、哺乳類培養細胞で発現させる場合は、pcDNAが挙げられる。ファージベクターとしてはLambda gt10などが挙げられる。特に好ましくは、ベクターはプラスミドベクターである。
【0097】
選択可能なマーカーとしては、アンピシリン耐性遺伝子、ストレプトマイシン耐性遺伝子などの抗生物質耐性遺伝子が挙げられる。
【0098】
本発明のベクターは、発現制御配列を含むものが好ましい。発現制御配列とは、DNA配列に適切に連結した場合、宿主細胞において、そのDNA配列を発現させることが出来る配列を意味する。発現制御配列には少なくともプロモーターが含まれる。プロモーターは構成的プロモーターであっても誘導可能なプロモーターであってもよい。さらに該ベクターには転写終結シグナル、即ちターミネーター領域が好ましくは含まれる。
【0099】
組換えベクターの宿主細胞への導入方法としては、従来公知の方法を用いることが出来、例えば、塩化カルシウム法、コンピテント法、3親接合(triparental mating)法、エレクトロポレーション法などが挙げられる。
【0100】
組換えタンパク質を発現させる方法は遺伝子工学の常法に基づいて行うことが出来る。ベクターの情報や外来遺伝子の導入、発現方法は多くの実験書に記載されている(例えば、Sambrook, J.et al, Molecular Cloning A Laboratory Manual 3rd Edition, CSHL Press, 2001)。
【0101】
用いる宿主は特に限定されず、大腸菌などが挙げられる。宿主は、好ましくは大腸菌K株またはB株であり、さらに好ましくは大腸菌B株である。
【0102】
形質転換体である宿主細胞の培養形態は、宿主の栄養生理学的性質を考慮して培養条件を適宜選択すればよく、通常液体培養で行われる。培地の炭素源としては、グルコース、グリセロールなどが挙げられ、窒素源としては硫酸アンモニウム、カザミノ酸などが挙げられる。その他、塩類、特定のアミノ酸、特定のビタミンなどを所望により使用できる。
【0103】
培養温度は宿主細胞が成育し、目的タンパク質を発現する範囲で適宜変更できる。目的タンパク質の発現は、該タンパク質の性質を利用して確認すればよい。
【0104】
本発明はまた、本発明のベクターが導入されてなる細胞、かかる細胞を含む、組織、器官、生物体を含む。
【0105】
本発明の標的遺伝子を欠損又は改変させる方法(M)および(N)について
本発明は、態様(M)において、以下を提供する:
態様(D)〜(F)いずれかに記載の標的配列特異的DNA切断酵素を用いて標的二本鎖DNAを切断する工程、および
切断された二本鎖DNAに相同組換え修復または非相同末端連結修復を作用させる工程、
を含む、標的遺伝子を欠損又は改変させる方法。
【0106】
好ましくは、態様(M)の方法において、非相同末端連結修復を作用させることにより標的遺伝子を欠失させる(態様(N))。
【0107】
相同組換え修復および非相同末端連結修復を作用させる方法は、当業者に周知である。例えば、相同組換え修復は、ドナーベクターの存在下でのZFNによるDNA2本鎖切断で相同領域の置換を誘導することにより行うことができ、非相同末端連結修復は、ドナーベクターの非存在下でのZFNなどの人工酵素によるDNA2本鎖切断による誘導により行うことができる。
【0108】
標的遺伝子が欠失または改変されたかどうかは、例えば、標的配列の塩基配列決定により確認することができる。
【0109】
本発明の遺伝子欠損または改変生物あるいは細胞(O)〜(Q)について
本発明は、態様(O)において、以下を提供する:
態様(M)または(N)に記載の方法により標的遺伝子を欠損又は改変させて得られた遺伝子欠損または改変生物あるいは細胞。
【0110】
好ましくは、態様(O)の遺伝子欠損または改変生物あるいは細胞は、ノックアウト生物または細胞である(態様(P))。
【0111】
特に好ましくは、態様(O)または(P)に記載の生物あるいは細胞は、マウス、ラット、ゼブラフィッシュ生物または哺乳類培養細胞である(態様(Q))。
【0112】
標的遺伝子が欠損又は改変しているかどうかは、上記態様(M)または(N)において記載した方法により確認することができる。
【0113】
以下、本発明を実施例によりさらに詳細に説明する。
【実施例】
【0114】
TZFNによる標的配列の切断活性の検討
TALEとZFの2種類のDNA結合ドメインが認識する塩基配列間のスペーシングの長さを検討するため、3〜9bpのスペーシングを有する複数のTZFN発現ベクター(図4参照)を構築し、ヒト培養細胞(HEK293T細胞)を用いたSSAアッセイにより切断活性の測定を行った。即ち、TZFN発現ベクターをヒト培養細胞HEK293Tに導入し、標的配列の切断活性を、レポーター遺伝子を用いて評価した。
【0115】
具体的には、TALEのC末端の配列(C末端構造の大きさ)を固定した上で、C末構造の大きさに対応したスペースが何塩基分かを検討した(図5)。即ち、その他の配列はすべて固定した上で、TALEのDNA結合ドメインのみを1モジュール(=1塩基分)ずつ削っていき、TALEの結合配列とZFの結合配列の間に何bpのスペースがある時が最適であるかを調べた(図4)。なお、本明細書において「アレイ」または「TALEアレイ」とは、TALEのDNA結合ドメインのモジュールの並びをいう。
【0116】
切断活性の評価については、「Targeted mutagenesis in the sea urchin embryo using zinc-finger nucleases (Ochiai et. al., Genes to Cells, 2010 15, 875-885)」Figure 3(図6参照)に記載のSSAアッセイを用いた。簡単に説明すると、SSAアッセイでは、終止コドンと標的配列の挿入によって分断されたルシフェラーゼ遺伝子の2つの不活性断片をコードする核酸を含むSSAレポーターベクターを用いることにより、標的が切断されると、オーバーラップを利用して修復が起こり、ルシフェラーゼ遺伝子が回復するため、標的配列の切断活性をルシフェラーゼ活性として評価することができる。
【0117】
実験方法
プラスミド構築
TZFN発現ベクターの作製
TALEの標的認識配列のN末端側およびC末端側ならびにFokIのヌクレアーゼドメインのアミノ酸配列(配列番号1、4および21)をコードすることが知られているpTAL4プラスミド(Cermak T, Doyle EL, Christian M, Wang L, Zhang Y, Schmidt C, Baller JA, Somia NV, Bogdanove AJ, Voytas DF. (2011) Efficient design and assembly of custom TALEN and other TAL effector-based constructs for DNA targeting. Nucleic Acids Res. 39(12). e82)をSacI処理し、T4 DNA polymeraseで末端を平滑化した後BglII処理し、切り出される断片をBamHI/PmeI処理したpcDNA3.1ベクター(Invitrogen)に挿入した(pcDNA-TAL)。
【0118】
次に、pcDNA-TALを鋳型として、以下のプライマーを用いてInverse PCRを行った(Forward:5’-ACGGGTGCTGCGGCAAGAGCTCTAGTGAAATCTGAATTGGAAGAGAAG-3’(配列番号23), Reverse:5’-GGATCTAGATATCGGATCCGGG-3’ (配列番号24))。また、Zinc Finger Consortium Vector Kit v1.0(Addgene)に含まれる、標的配列GAAを認識するジンクフィンガーのアミノ酸配列(配列番号5)をコードすることが知られているpc3XB-ZF63を鋳型として、以下のプライマーを用いてPCRを行った(Forward:5’-CCGATATCTAGATCCGGGGAGAAGCCTTACAAATG-3’ (配列番号25), Reverse: 5’-TGCCGCAGCACCCGTATGTGTTCTCTGGTGTCTCACG-3’ (配列番号26))。これら2種類のPCR産物を精製後混合し、In-Fusion反応(Clontech)を行うことで、TALEの標的認識配列のN末端側およびC末端側、標的配列GAAを認識するジンクフィンガーならびにFokIのヌクレアーゼドメインのアミノ酸配列をコードするpcDNA-TZF63ベクターを得た。
【0119】
更にpcDNA-TZF63ベクターへ、任意のTALEアレイの作成に用いることが知られているGolden Gate TALEN and TAL Effector Kit(Addgene)を用いてTALEアレイを挿入し、7種類のTZFN発現ベクター(pcDNA-TZF63-12〜18; 図4)を得た。各発現ベクターのTALEアレイを以下の表1に記す。これらの発現ベクターは、特許請求の範囲に記載のnがそれぞれ11〜17のものに相当する。
【0120】
表1. 各TZFN発現ベクターに含まれるTALEアレイ
【表1】

【0121】
Single-strand annealing(SSA)レポーターベクターの作製
SSAアッセイのために、標的配列を含む以下の合成オリゴヌクレオチドをアニーリングし、SSAアッセイに用いられることが知られているBsaI処理したpGL4-SSAベクター(Ochiai H, Fujita K, Suzuki K, Nishikawa M, Shibata T, Sakamoto N, Yamamoto T. (2010) Targeted mutagenesis in the sea urchin embryo using zinc-finger nucleases. Genes Cells. 15(8). 875-85)に挿入し(Sense: 5’-GTCGGATGGTGCGCTCCTGGACGTAGCCTTCCTCGAGGAAGGCTACGTCCAGGAGCGCACCAGGT-3’ (配列番号34), Antisense: 5’-CGGTACCTGGTGCGCTCCTGGACGTAGCCTTCCTCGAGGAAGGCTACGTCCAGGAGCGCACCATC-3’ (配列番号35))、SSAレポーターベクターを作製した。
【0122】
細胞培養・トランスフェクション・ルシフェラーゼアッセイ
Ochiai et al.(前掲)の手法に基づき、TZFN発現ベクター(pcDNA-TZF63-12〜18)とSSAレポーターベクター、ウミシイタケルシフェラーゼをコードすることが知られているpRL-CMVベクター(Promega)をHEK293T細胞に導入し、24時間培養後にルシフェラーゼアッセイを行った。
【0123】
細胞培養
HEK293T細胞を、10% FBS(fetal bovine serum)(Biological Industries)、1% non-essential amino acid (GIBCO)、1% ストレプトマイシン/ペニシリンを含むDMEM (Dulbecco's Modified Eagle's Medium)(Wako) で、37℃、5% CO2の条件で静置培養した。
【0124】
トランスフェクション
96 wellプレート中で、無血清Opti-MEM(Invitrogen)25 μlとDNA溶液2μl(TZFN発現ベクター200ng, SSAレポーターベクター100ng, pRL-CMV 20ngを含む)を混合した。更に各ウェルへOpti-MEM 25 μlとLipofectamine LTX (Invitrogen)0.7 μlを混合した溶液を加え、室温で30分間インキュベートした。その後15% FBSを含むDMEMに懸濁したHEK293T細胞を50,000細胞ずつ各ウェルへ加え、37℃、5% CO2で24時間培養した。
【0125】
ルシフェラーゼアッセイ
ルシフェラーゼアッセイは、Dual-Glo luciferase assay system (Promega)を用いて、キットの取扱説明書の通りに行った。発光強度はTriStar LB 941 plate reader (Berthold)を用いて測定した。
【0126】
実験結果
上記実験の結果、塩基のスペーシングが3bp, 4bp, 5bp, 6bp, 9bpのときの発光強度はほぼ一定であり、7bp(TZF63-14)及び8bp(TZF63-13)のときに発光強度の増加が見られた(図7)。これはTZF63-14及びTZF63-13タンパク質がSSAレポーターベクターを効率的に切断したことを意味し、このことからTALE/ZFの両DNA結合ドメイン間の塩基のスペーシングは、7bpもしくは8bpが適当であることが示された。このことから、TALE認識配列のC末端側のドメインは7〜8塩基分を覆うような大きさに相当することが予測される。
【0127】
よって、効率的に標的配列を切断するTZFNを作製するためには、図8に示す規定に基づいた設計を行うことが好ましいと考えられる。
【0128】
また本実施例では、左右のTZFN認識配列に挟まれる切断部位を6bpに限定して評価した(図8)。この規定は、ZFドメインとFokIヌクレアーゼドメインの間のリンカーとしてTGAAARの6アミノ酸を用いることで、切断部位を6bpに限定できるという報告(Shimizu Y, Bhakta MS, Segal DJ. (2009) Restricted spacer tolerance of a zinc finger nuclease with a six amino acid linker. Bioorg Med Chem Lett. 19(14). 3970-2)に基づいている。一方でTALENでは切断部位を厳密に決定できないことが知られている(Christian M, Cermak T, Doyle EL, Schmidt C, Zhang F, Hummel A, Bogdanove AJ, Voytas DF. (2010) Targeting DNA double-strand breaks with TAL effector nucleases. Genetics. 186(2). 757-61)。言い換えると、本実施例では、切断部位を事実上6bpの範囲に限定できたため、TALENの「切断部位が不安定」という問題を克服できたといえる。
【0129】
以上の事から、本発明により、TALENのもつ標的配列の自由性とZFNのもつ切断部位の特異性の両方の利点を併せ持つ人工酵素TZFNが作出できることが示された(図9)。
【産業上の利用可能性】
【0130】
本発明のDNA結合タンパク質は、DNA切断酵素のDNA切断ドメインと融合させることにより、DNA中の所望の配列を認識してDNAを所望の位置で切断することができるため、バイオテクノロジー分野の試験・研究のみならず、医薬品業界においても利用できる。
【0131】
さらに、本発明のDNA結合タンパク質は、転写活性化因子と融合させることにより、DNA中の所望の配列領域からの転写を活性化することができる。また、本発明のDNA結合タンパク質は、標識やレポーター酵素と融合させることにより、ゲノム中の標的配列の存在を検出するタンパク質プローブまたは検査試薬として利用することができる。
【0132】
このように、本発明のDNA結合タンパク質は、DNA中の所望の配列を認識してDNAの所望の配列に結合することができるため、バイオテクノロジー分野の試験・研究のみならず、広く、医薬品業界および工業生産において利用できる。

【特許請求の範囲】
【請求項1】
標的配列を特異的に認識して結合するDNA結合タンパク質であって、N末端から順番に以下のドメインを含んでなるDNA結合タンパク質、ここで、標的配列は二本鎖DNAであり、その塩基配列が5’末端側から順に、以下のドメイン(2−1)および(2−2)によって認識されるn+1塩基対からなるTALE認識配列を含み、かつ、該TALE認識配列から7または8塩基対のスペースを空けて、以下のドメイン(4)によって認識される3塩基対からなるジンクフィンガー認識配列を含むものである:
(1)250〜312アミノ酸長であるドメイン;
(2−1)アミノ酸配列:LTPDQVVAIASXGGKQALETVQRLLPVLCQDHG(配列番号2)からなる1塩基認識繰り返しドメインをn個タンデムに含んでなるTALEの標的配列認識ドメイン、または、配列番号2で示されるアミノ酸配列のX以外の位置において1または数個のアミノ酸の欠失、置換および/または付加を含むアミノ酸配列を有し、かつ、前記DNA結合タンパク質全体としての標的配列特異的DNA結合活性を破壊しないTALEの変異型標的配列認識ドメイン、
配列番号2のアミノ酸配列において、
が、NIの場合、その1塩基認識繰り返しドメインは塩基Aを認識し、
が、HDの場合、その1塩基認識繰り返しドメインは塩基Cを認識し、
が、NNまたはNKの場合、その1塩基認識繰り返しドメインは塩基Gを認識し、そして、
が、NGの場合、その1塩基認識繰り返しドメインは塩基Tを認識し、
nは7〜30の整数である;
(2−2)アミノ酸配列:LTPDQVVAIASXGGKQALE(配列番号3)からなる1個の1塩基認識最終繰り返しドメインからなるTALEの標的配列認識最終ドメイン、または、配列番号3で示されるアミノ酸配列のX以外の位置において1または数個のアミノ酸の欠失、置換および/または付加を含むアミノ酸配列を有し、かつ、前記DNA結合タンパク質全体としての標的配列特異的DNA結合活性を破壊しないTALEの変異型標的配列認識最終ドメイン、
配列番号3のアミノ酸配列において、
が、NIの場合、その1塩基認識繰り返しドメインは塩基Aを認識し、
が、HDの場合、その1塩基認識繰り返しドメインは塩基Cを認識し、
が、NNまたはNKの場合、その1塩基認識繰り返しドメインは塩基Gを認識し、そして、
が、NGの場合、その1塩基認識繰り返しドメインは塩基Tを認識する;
(3)7から8塩基対からなる標的配列に相当する長さを有するドメイン;および、
(4)配列番号5から20のいずれかに示されるアミノ酸配列を有する1個のジンクフィンガードメイン、または、配列番号5から20のいずれかに示されるアミノ酸配列において1または数個のアミノ酸の欠失、置換および/または付加を含むアミノ酸配列を有し、かつ、前記DNA結合タンパク質全体としての標的配列特異的DNA結合活性を破壊しない変異型ジンクフィンガードメイン、
ここで、
配列番号5からなるジンクフィンガードメインは、塩基配列GAAを認識し、
配列番号6からなるジンクフィンガードメインは、塩基配列GACを認識し、
配列番号7からなるジンクフィンガードメインは、塩基配列GAGを認識し、
配列番号8からなるジンクフィンガードメインは、塩基配列GATを認識し、
配列番号9からなるジンクフィンガードメインは、塩基配列GCAを認識し、
配列番号10からなるジンクフィンガードメインは、塩基配列GCCを認識し、
配列番号11からなるジンクフィンガードメインは、塩基配列GCGを認識し、
配列番号12からなるジンクフィンガードメインは、塩基配列GCTを認識し、
配列番号13からなるジンクフィンガードメインは、塩基配列GGAを認識し、
配列番号14からなるジンクフィンガードメインは、塩基配列GGCを認識し、
配列番号15からなるジンクフィンガードメインは、塩基配列GGGを認識し、
配列番号16からなるジンクフィンガードメインは、塩基配列GGTを認識し、
配列番号17からなるジンクフィンガードメインは、塩基配列GTAを認識し、
配列番号18からなるジンクフィンガードメインは、塩基配列GTCを認識し、
配列番号19からなるジンクフィンガードメインは、塩基配列GTGを認識し、
配列番号20からなるジンクフィンガードメインは、塩基配列GTTを認識する。
【請求項2】
ドメイン(3)が、配列番号4で示されるアミノ酸配列を有するタンパク質TALEのC末端ドメイン、または、配列番号4で示されるアミノ酸配列において1または数個のアミノ酸の欠失、置換および/または付加を含むアミノ酸配列を有し、かつ、前記DNA結合タンパク質全体としての標的配列特異的DNA結合活性を破壊しないタンパク質TALEの変異型C末端ドメインである、請求項1に記載のDNA結合タンパク質。
【請求項3】
ドメイン(1)が、配列番号1で示されるアミノ酸配列を有するタンパク質TALEのN末端ドメイン、または、配列番号1で示されるアミノ酸配列において1または数個のアミノ酸の欠失、置換および/または付加を含むアミノ酸配列を有し、かつ、前記DNA結合タンパク質全体としての標的配列特異的DNA結合活性を破壊しないタンパク質TALEの変異型N末端ドメインである、請求項1または2に記載のDNA結合タンパク質。
【請求項4】
請求項1〜3いずれかに記載のDNA結合タンパク質のC末端側にDNA切断酵素のヌクレアーゼドメインが融合してなる標的配列特異的DNA切断酵素。
【請求項5】
DNA切断酵素のヌクレアーゼドメインが、配列番号21で示されるアミノ酸配列を有するDNA切断酵素FokIのヌクレアーゼドメインであるか、または、配列番号21で示されるアミノ酸配列において1または数個のアミノ酸の欠失、置換および/または付加を含むアミノ酸配列を有し、かつ、DNA切断酵素FokIのヌクレアーゼ活性を保持しているDNA切断酵素FokIの変異型ヌクレアーゼドメインである、請求項4に記載の標的配列特異的DNA切断酵素。
【請求項6】
請求項1〜3いずれかに記載のDNA結合タンパク質のC末端側と請求項5に記載のDNA切断酵素FokIのヌクレアーゼドメインまたはDNA切断酵素FokIの変異型ヌクレアーゼドメインの間に配列番号22で示すリンカーを含む請求項5に記載の標的配列特異的DNA切断酵素。
【請求項7】
請求項1〜3いずれかに記載のDNA結合タンパク質のC末端側にDNA転写活性化ドメインが融合してなる標的配列特異的転写活性化因子。
【請求項8】
DNA転写活性化ドメインが、GAL4およびVP16からなる群から選択される、請求項7に記載の標的配列特異的転写活性化因子。
【請求項9】
請求項1〜3いずれかに記載のDNA結合タンパク質に標識タンパク質が融合してなる標的配列特異的DNA認識試薬。
【請求項10】
標識タンパク質が、蛍光タンパク質および酵素からなる群から選択される、請求項9に記載の標的配列特異的DNA認識試薬。
【請求項11】
請求項1〜3いずれかに記載のDNA結合タンパク質または請求項4〜6いずれかに記載の標的配列特異的DNA切断酵素または請求項7または8に記載の標的配列特異的転写活性化因子または請求項9または10に記載の標的配列特異的DNA認識試薬をコードする核酸分子。
【請求項12】
請求項11に記載の核酸分子を含むベクター。
【請求項13】
請求項4〜6いずれかに記載の標的配列特異的DNA切断酵素を用いて標的二本鎖DNAを切断する工程、および
切断された二本鎖DNAに相同組換え修復または非相同末端連結修復を作用させる工程、
を含む、標的遺伝子を欠損又は改変させる方法。
【請求項14】
非相同末端連結修復を作用させることにより標的遺伝子を欠失させる請求項13に記載の方法。
【請求項15】
請求項13または14に記載の方法により標的遺伝子を欠損又は改変させて得られた遺伝子欠損または改変生物あるいは細胞。
【請求項16】
ノックアウト生物または細胞である請求項15に記載の生物あるいは細胞。
【請求項17】
マウス、ラット、ゼブラフィッシュ生物または哺乳類培養細胞である請求項15または16に記載の生物あるいは細胞。

【図1】
image rotate

【図2】
image rotate

【図3】
image rotate

【図4】
image rotate

【図5】
image rotate

【図6】
image rotate

【図7】
image rotate

【図8】
image rotate

【図9】
image rotate


【公開番号】特開2013−94148(P2013−94148A)
【公開日】平成25年5月20日(2013.5.20)
【国際特許分類】
【出願番号】特願2011−242250(P2011−242250)
【出願日】平成23年11月4日(2011.11.4)
【出願人】(504136568)国立大学法人広島大学 (924)
【Fターム(参考)】